用fstream类从一个文档(abc.txt)中读入数据,如何判断哪些数据是汉字?

来源:百度知道 编辑:UC知道 时间:2024/05/29 09:09:11
#include<fstream>
#include<iostream>
#include<string>
#include<vector>
using namespace std;
void main()
{ string str;
vector<string> vec;
ifstream infile;
infile.open("abc.txt");
while(infile>>str)
{
/*分别读出文件中的数据,判断哪些数据是汉字,并将汉字保存起来*/???;
vec.push_back(str);
}
infile.close();

}
能否把判汉字的具体过程写一下?
我把文档中的数据取出来,然后两个char的取?再判第一个字节是否满足汉字条件?
在VC下进行编程的。

首先建议你类型声明为wchar宽字符,这样判断Unicode码就可以了。

如果你声明为char,可以验证第一个char为负数,负数时表示GBK编码形式。

PS:你首先要知道你的文本编码格式,才能判断出来。第二种只适用于GBK编码。

一般Win下的都是Unicode编码。

如果汉字是GBK编码,可以通过ASCII码判断,一个汉字占两个char类型位置,并且第一个char位置的ASCII码是负数。

把内容读取到一个字符数组中,再判断数组元素的正负就可以啦!