如何从PDF图片中提取文字

如标题 急求

要实现pdf的提取就必须要用到百度网盘,功能强大,使用方法简单。是一款必备的软件。

 ç¬¬ä¸€æ­¥ï¼Œæ‰“开百度网盘主界面选择文档。 

第二步,在文档页面选择全部工具。

 ç¬¬ä¸‰æ­¥ï¼Œåœ¨å…¨éƒ¨å·¥å…·é‡Œæ‰¾åˆ°ï¼Œé€‰æ‹©pdf提取。

 ç¬¬å››æ­¥ï¼Œé€‰æ‹©ç½‘盘中的的文件。pdf文件开始提取。

第五步,等待提取完成。

注意事项

百度网盘一次可以提取20张pdf的文件,现在还是免费使用的,除了提取pdf还能把pdf转换成各种你需要的文档,ppt,word,Excel都不在话下。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2020-08-06

怎样提取PDF图片

第2个回答  推荐于2017-12-15
用OCR就可以了.
比如Office 2003中也提供了文字识别服务,结合那个Image writer可以很方便将PDF转成WORD。

Office2003实现PDF文件转Word文档

经过尝试,发现可以利用 Office 2003 中的 Microsoft Office Document Imaging 组件来实现PDF转WORD文档,也就是说利用WORD来完成该任务。方法如下:

Adobe Reader 打开想转换的PDF文件 ,接下来 选择 “文件→打印”菜单,在打开的“打印”窗口中将 “打印机”栏中的名称设置为 “Microsoft Office Document Image Writer”,确认后将该PDF文 件输出为 MDI格式的虚拟打印文件 。

注: 如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。

然后, 运行 “Microsoft Office Document Imaging”,并利用它来 打开 刚才保存的MDI文件,选择“工具→ 将文本发送到Word ”菜单,在弹出的窗口中选中“ 在输出时保持图片版式不变 ”,确认后系统会提示“必须在执行此操作前重新运行 OCR 。这可能需要一些时间”,不管它, 确认 即可。

注: 对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。

以上仅在 word2003 中可用,其他版本没有Microsoft Office Document Image Writer本回答被网友采纳
第3个回答  2019-05-07
只能提取PDF页面,提取PDF文字是编辑的
迅捷PDF编辑器打开PDF文件,在文件下面可以打开的
在选择文档下面的提取页面,可以提取偶数页的
提取之后可以编辑,这个自己去弄
第4个回答  2013-12-10
试试看下面的软件:

pdf2word
PDF转Word。很简单,傻瓜式操作。
我上传到我的网络硬盘了,你可以下载一下试试看。
地址是:http://www.91files.com/?XIL4CMOX1FGXFWAFBU62

Some PDF Image Extract
http://www.xdowns.com/soft/31/113/2008/Soft_47306.html
提取 PDF 文件内图片 - Some PDF Image Extract,可以汇入单档/多文件/整个数据夹的 PDF,一次将图片抽取出来,照顺序编号汇出,支持多种图片格式:TIF、JPEG、BMP、GIF、PNG、TGA、PBM、PPM、PCX,支持中文档名,但不支持 Unicode

PDF Extract TIFF
下载地址:http://www.newhua.com/soft/32561.htm
一个简单的资源提取工具。你可以用它从 PDF 文件中提取图像并且保存为 TIFF 格式,然后用Word, Adobe Photoshop之类的程序进行再次编辑。Extract Images From PDF 软件内建 LZW、CCITT FAX、DCT 等图形压缩处理格式,可以有效降低 TIF 图档的文件大小,同时依然维持应有的图片品质。使用 Extract Images From PDF 软件进行转换的时候,并不需要 PDF 文档的官方文档浏览器即可独立操作。
相似回答