将清华紫光A686型号扫描到的图片格式转化为Word格式进行文字处理

来源:百度知道 编辑:UC知道 时间:2024/04/30 02:59:13

OCR是字符识别软件的简称,它是英文Opticalcharacterrecognition的缩写,原意是光学字符识别。它的功能是通过扫描仪等光学输入设备读取印刷品上的文字图像信息,利用模式识别的算法,分析文字的形态特征从而判别不同的汉字。中文OCR一般只适合于识别印刷体汉字。使用扫描仪加OCR可以部分地代替键盘输入汉字的功能,是省力快捷的文字输入方法。
目前,比较流行的OCR软件很多,英文OCR主要有OmniPage,中文OCR主要清华紫光OCR、清华文通OCR、汉王OCR、尚书六号OCR、丹青OCR、蒙恬OCR等。尽管汉字字量大、字形复杂,但OCR技术已经走向成熟。许多OCR软件不仅能识别黑白印刷体汉字,还能识别灰度和彩色印刷体汉字,识别速度很快,识别正确率达到了99%以上;可识别宋体、黑体、楷体等多种字体和简、繁体;可对多种字体、不同字号的混排进行识别;有些OCR软件还能识别图像、表格。与此同时,对于手写体汉字识别的研究也取得了很大进展,正确识别率已达到了70%以上。