用扫描仪扫描的试卷,格式为bmp 如何把里面的文字提取出来,以便在word中编辑?谢谢

来源:百度知道 编辑:UC知道 时间:2024/05/30 06:21:30

www.crfans.com下载一个汉字识别系统吧,在网站上搜索“OCR”就OK了。

汉字识别OCR("光学字符识别"的英文编写)是为了使汉字信息高速输入计算机,以解决低速的信息输入与高速信息处理之间的矛盾,从而提高整个计算机系统的效率。这种根据汉字人工编码录入汉字文本的方法,从根本上改变了人们对计算机汉字人工编码录入的概念。使人们从繁重的键盘录入汉字的劳动中解脱出来。只要用扫描仪将整页文本图像输入到计算机,就能通过OCR软件自动产生汉字文本文件,这与人手工键入的汉字效果是一样的,但速度比手工快几十倍。所以OCR产品的推广意义是深远的。

提高OCR识别率

购买了扫描仪,你一定会发现,附赠的软件中有中英文OCR识别软件,当然一般都是基础版。很多人认为此类OCR的识别率不是很高,甚至怀疑只有那些正版的数千元的OCR软件其识别率才很高。其实,你只要注意使用技巧,此类OCR的识别率完全可达实用化水平。

1、处理原稿扫描图像,使之清晰可“辨”。在其它因素都满足的前提下,对一般的印刷稿、打印稿(包括清晰的针打稿)等质量较好的文稿进行识别,其识别率一般可达到98%以上。而对报纸、复印件等不太清晰的文稿进行识别,无论哪种OCR都难以达到较高的识别率。对那些原稿不太清晰的,要注意识别前对图像加以处理,除去其上的污迹。并注意将偏斜的版面“改斜归正”,通常OCR软件均有此功能,且一般都设有自动纠偏和手动纠偏。

2、分辨率应选择适宜。一般选择300dpi较合适,分辨率选小了会使识别率降低,选得太大了并不能有效提高识别率,还会大幅度加长文件长度,浪费处理时间。有的扫描软件设备上有一项“OCR扫描”,干脆将分辨率锁定为300dpi,这是很有道理的。

3、调整好亮度值和对比度值。这条非常关键,对识别率的影响很大。亮度值的调整是在识别前,先看看扫描得到的图像中文字质量如何,如果文字线条凹凸不平,甚至有断线,说明亮度值太大了,应减小亮度值;当文字线条很黑很粗,甚至挤成了黑疙瘩,分不清

用扫描仪扫描的试卷,格式为bmp 如何把里面的文字提取出来,以便在word中编辑?谢谢 请问下用扫描仪扫描的文档格式可不可以转化为word格式的文档? 如何把扫描仪扫描下来的东西转化为文本格式 怎样将知识产权局的 用扫描仪扫描的专利文件转变成文档格式? 我用扫描仪扫描的照片(WORD格式),如何处理才能上传到网络上? 扫描仪的扫描方式! 高考批改试卷扫描仪能扫描这种墨迹吗? 用扫描仪扫描出来的文件太大JPG格式的2MB....,怎么样容量才能够变小些 用扫描仪扫描后的bmp格式图文文件转换到word中怎么还是图片格式,就是完全还是原来扫描出来图片的样子。 用扫描仪扫描的文本文件用什么软件可以编辑?