怎样把扫描的PDF文件转换为文本文档

来源:百度知道 编辑:UC知道 时间:2024/06/08 07:58:20
我有个PDF文件,用文件里面的另存为文本文档,保存的是0KB,我想可能这个文件是扫描后做成PDF文件的,哪个高手教我怎么转化为文本文档。

如果真的是扫描出来做成pdf的话,没法转成txt,或者说很难
因为文本包含的信息比图片多

文本包含编码和矢量信息,而图片只包含点阵的显示信息
打个比方来说,如果说文本是一个美女,图片只是美女的一张照片

当然想拿图片还原成美女是不可能的
但是要拿图片还原成文本还有一个办法,就是用专门的软件扫描文本,然后把它识别成文本,有些类似于手写输入的原理

但是这种软件往往要求图片解析度很高,而且有一定误码率
我用过几款类似的软件,效果不是很理想,而且往往对中文的支持比较差

只能用OCR识别,但是效果比较差,文中会出现很多乱码。

从网上下载个PDF转TXT格式的软件转换下就好了