import com.baidubce.http.ApiExplorerClient; import com.baidubce.http.AppSigner; import com.baidubce.http.HttpMethodName; import com.baidubce.model.ApiExplorerRequest; import com.baidubce.model.ApiExplorerResponse; // 文档转换GET Java示例代码 public class RequestDemo { public static void main(String[] args) { String path = "http://pdf2doc.api.bdymkt.com/v1/convert"; ApiExplorerRequest request = new ApiExplorerRequest(HttpMethodName.GET, path); request.setCredentials("您的 access key", "您的 secret key"); request.addHeaderParameter("Content-Type", "application/json;charset=UTF-8"); request.addQueryParameter("url", ""); request.addQueryParameter("type", ""); request.addQueryParameter("ocr", ""); request.addQueryParameter("language", ""); request.addQueryParameter("outfilename", ""); request.addQueryParameter("callbackurl", ""); request.addQueryParameter("excelonesheet", ""); request.addQueryParameter("password", ""); request.addQueryParameter("pageindexes", ""); request.addQueryParameter("wordnoimage", ""); ApiExplorerClient client = new ApiExplorerClient(new AppSigner()); try { ApiExplorerResponse response = client.sendRequest(request); // 返回结果格式为Json字符串 System.out.println(response.getResult()); } catch (Exception e) { e.printStackTrace(); } } }
点击复制代码
{
"code": 10000,
"msg": "",
"result": {
"token": "3345822c6df2dbbdd1db84daf0383d38"
}
}
{
"code": 40001,
"msg": "ParmNotRight"
}
感谢广大用户的支持,有任何建议请直接联系我们021-39891710
试用页面,支持手机和电脑端:
按次收费,和文档页数无关,比如1页的文档和1000页的文档,都算1次
可以定制开发一些功能,我司具备20余年文档相关开发经验,可帮助定制开发各类涉及word,pdf等格式的需求,欢迎联系我们18918305723
在线文档:
https://chat.ishuowen.com/chat/fd020d706bf5a68382636b1fca16a0b18-s
另外我们还提供了下列转换API商品:
1. 文档转PDF:如word文档等转为PDF,多张图可以做OCR转为PDF(文字可搜索拷贝)
https://apis.baidu.com/store/detail/26ccebe8-1964-4cba-bd46-42a7d8ee53fc
2. 文档转图片:包括每页一图,长图,动图
https://apis.baidu.com/store/detail/7986313e-3efe-4ee1-9a6f-fd019f1afab9
3. 文档转HTML:单个HTML文件,电脑手机都可浏览,翻页平滑,缩放自如
https://apis.baidu.com/store/detail/09923d66-13ce-4b53-b38d-e5daaac09c2c
4. PDF转文档:如PDF文件转为word文件,扫描类PDF(图片)可以做OCR变为word文件等
https://apis.baidu.com/store/detail/6bc5b22a-3684-415c-928a-7bce33d70e2f
5. 图片转文档:对图片做OCR,转为word文件等
https://apis.baidu.com/store/detail/9a579740-d0a2-43fb-921a-10f9364a9a5c
极速!500页的图片PDF做OCR转为Word,不超过5分钟,且不漏页,每页都做OCR转换,速度甚至超过本地工具
支持两种模式:
1. 扫描的PDF保留图片,不做OCR
2. 对扫描的PDF的图片做OCR处理,转为Word或PPT文档后,可直接编辑图片中的文字,OCR支持多语言
支持转换为多种文件格式,具体如下:
微软Office文档:doc, docx, pptx, xlsx
文本文件: rtf, txt
简单使用方式:
先调用任意转换接口进行转换(最快捷的是文档转换GET),调用成功获得token。可以用token轮询“查询query接口”获得结果,也可以设置callbackurl等转换完成主动通知。由于转换需要时间,文件越大页数越多,转换越久,故需要等待转换结束后获得结果,详细见文档说明。
查询转换进度接口:
https://api.duhuitech.com/q?token=xxx
详细信息见使用指南文档。
根据ocr参数传入的不同,可以开启或关闭OCR处理。对于扫描类型的PDF(每页是图片),如果开启OCR,对于图片会做OCR处理,转为Word或PPT文档后,可直接编辑原图片中的文字。如果不清楚是否是图片PDF,则总是开启OCR即可。如果不需要对图片OCR,则关闭OCR。
· 支持文件大小最高1000M。
· 转换完成后,请于2小时内下载文件,文件不保存,过期自动删除。
任何需要把PDF转为其他格式的情况皆可使用