求【pdf】转【文字】 软件

来源:百度知道 编辑:UC知道 时间:2024/06/16 09:45:44
PDF文档里 图片中的文字 转换成 TXT文本格式

(不是把PDF转成图片 而是把PDF里面被扫描成图片的文字内容转成 纯文字格式)
注意!!!
可能是我没有说清楚
1 我不要把PDF中的图片 抽出来弄成的WORD文件
2 我要 把PDF中的 文字抽离 出来的软件

我要提取 图片式PDF电子书中的文字
而不是 文档式 电子书

1.如果图片是英文字符用Adobe Acroabt OCR识别
2.如果图片是含有中文字符可以使用ABBYY FineReader Professional v9.0.0.822,这个软件是全球排行第一的OCR软件,但是目前没有找到破解,仅能转50页,我试用过,效果相当好。
3.若是你自己扫描的,可以做成tiff的图档,用microsoft office document imaging的OCR功能。
方法:工具->使用OCR识别文本

我用Foxit Reader
里边有个转txt功能,不过格式不像看PDF那样舒服,还得做个修改

如果是图片格式,无法从PDF转换成文字,因为图片在PDF中会默认为一个整体,如果不是图片格式,单纯的文字,可以将PDF另存转换为文本文件或者word文件,就可以进行编辑。

Adobe Acroabt OCR识别

如果原pdf文件系文本内容当然可以有工具去转换,比如E-PDF To Word Converter。我给你做了截图,你看一下:http://photo1.bababian.com/upload6/20071227/A9547C25C45584C720D959AB4066CD3B_500.jpg

此工具可以从霏凡下载:http://www.crsky.com/soft/7162.html

但如果pdf的性质是图片格式的,那就得用ocr识别,推荐使用清华文通,我觉得不错的一个OCR。

PDF文档里图片中的文字转换成文本格式?
我不久前碰到PDF文件这个问题
1)对文字可以直接识别的(以文本形式保存的PDF文件):最