C++中提取汉字并统计

来源:百度知道 编辑:UC知道 时间:2024/06/20 16:42:45
从若干短信中提取其中的汉字并进行汉字出现次数的统计,在线等答案啊。谢谢了
我用的是VC6.0 ,统计的办法呢 ,汉字是<0这个是什么编码方式?

汉字是由2个字节来表示的,而且2个字节的值都大于127.你可以在检索字符串的过程中不断判断当前字符是否大于127,是的话,则将其与后面一字节提取出来,就是一个汉字

不对,楼上的不对,也有-32的,汉字的ASC码值是大于255或小于0的,当然汉字是两个字节的,这个是常识

关注中

你先搞清楚短信里的汉字是以什么方式编码的,是GB2312还是UNICODE还是UTF-8然后你才能决定你以什么方式来决定这个(几个)字节代表的是一个汉字,然后统计就很简单了。

UNICODE: 中日韩统一表意汉字 0x4E00 - 0x9FFF

tanyuguo的方法仅限于GB2312编码方式。