中国的汉字如何编码?

来源:百度知道 编辑:UC知道 时间:2024/05/20 15:55:01

所谓编码,是以固定的顺序排列字符,并以此做为记录、存贮、传递、交换的统一
内部特征,这个字符排列顺序被称为“编码”。

字库的编码是字库组织的依据,也是文字处理的基础。不同国家和地区有不同的编
码标准,和中文字库有关的常见编码有:单字节编码、GB2312-80、GB12345-90、GBK、U
nicode编码、ISO10646 / Unicode字符集、GB18030-2000、BIG5编码,下面简要介绍一
下:

单字节编码

MS Windows:Windows Latin 1(ANSI)

MS-DOS:MS-DOS Latin US

Macintosh:Macintosh Roman
GB2312-80

全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信
息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯
一中文编码。P-Windows3.2和苹果OS就是以GB2312为基本汉字编码, Windows 95/98则
以GBK为基本汉字编码、但兼容支持GB2312。

双字节编码

范围:A1A1~FEFE

A1-A9:符号区,包含682个符号

B0-F7:汉字区,包含6763个汉字

GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排
序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了
很大作用。

GB12345-90

1990年制定了繁体字的编码标准GB12345-90《信息交换用汉字编码字符集 第一辅助
集》,目的在于规范必须使用繁体字的各种场合,以及古籍整理等。该标准共收录6866
个汉字(比GB2312多103个字,其它厂商的字库大多不包括这些字),纯繁体的字大概有
2200余个。<