vc问题 比较txt文档的内容(内容为中英文混合)

来源:百度知道 编辑:UC知道 时间:2024/06/24 23:49:03
怎么把两个txt的文档里的文章逐字比较,得出正确率。
两个文档一个是正确的作为标准,另一个是用汉字识别软件识别的,有一些错误。
例:
正确的:
本文首先介绍了目前民航票据处理的现状,需要识别的工作以及遇到的困难。
有错的:
本文首先介绍加目前民航栗据处理的现状,需要识别的工作以及遇到的因难。
求程序代码

我可以告诉你大概的方法,用CFILE 类 分别将两个文件打开,每次读取同样大小的字节,建议采用十六进制方法比较,可以一个字节一比较,比较简单,但是速度比较慢,也可以多字节比较,以你的例子做演示
本文首先介绍了目B1BECEC4CAD7CFC8BDE9C9DCC1CBC4BF
本文首先介绍加目
B1BECEC4CAD7CFC8BDE9C9DCBCD3C4BF
明白了吧

同意楼上的何处淬吴钩 同志
这道题虽然是“逐字比较”,但实际上在处理字符的时候是不能用逐字比较的,搜索的话就好很多,但是还是有弊端,因为你的关键字不是唯一的,首先是相同原文的关键字,然后是不同原文的相同识别字,这两点都会大大干扰搜索的准确率。

个人也暂时没想出好方法~貌似两者结合也没什么意义,等楼下的朋友指点吧~~

恐怕没1楼说的那么简单。因为识别有可能造成多或少一个字符,那这样后面的比较就没意义了。可以考虑这样。
用搜索子串的办法,搜索到的比率就是正确率。

我知道一个软件可以是实现这个功能
UltraCompare UltraEdit的一个工具。