文字编码 txt 难

来源:百度知道 编辑:UC知道 时间:2024/06/15 14:13:15
操作系统打开一个txt文件时如何判断他是ansi,unicode,utf8的编码。文件的编码信息存在文件的什么位置。
如果自己想编写一个程序读取文件的编码信息 改怎么办
那怎么才能得到这前两个字节,或者看到这前两个字节呢

在txt文件中不同编码的文本,是根据文本的前两个字节来定义其编码格式的。定义如下:
ANSI: 无格式定义;
Unicode: 前两个字节为FFFE;
Unicode big endian: 前两字节为FEFF;
UTF-8: 前两字节为EFBB;

所以在程序中提取前两个字节判断就可以了。