用清华紫光OCR,如何识别带名头的表格文件。

来源:百度知道 编辑:UC知道 时间:2024/05/27 08:14:36
用清华紫光OCR,如何识别带有名头的表格文件。我怎么就是识别不出来,识别后都是乱七八招的文字。

首先请确保把格式选成了表格,不然肯定是乱七八糟的。
其次,表头和下面可分开识别,即选两个区域。
第三,表头如果做了特殊字体,即非宋、楷、仿宋、隶等几个常用字体,清华的识别是很糟的,这种情况下,不如不要表头,自己手工输入比让它识别要快。(其实所有的识别软件对非宋体的识别率都一般。相对来说尚书还好一些)
第四,其实对表格的识别和支持做得最好的OCR软件是丹青。

与是不是带表头没有什么关系。表格文件支持好象都不太理想。适当加大分辨率要好些。