区位码\国标码\内码,三者的联系与区别是???

来源:百度知道 编辑:UC知道 时间:2024/05/05 09:23:23

简单点理解,区位码也就是国标码。
所谓“国标码”,是指国家标准汉字编码。一般是指国家标准局1981年发布的《信息交换用汉字编码字符集(基本集)》,简称GB-2312。在这个集中,收进汉字6763个,其中一级汉字3755个,二级汉字3008个。一级汉字为常用字,按拼音顺序排列,二级汉字为次常用字,按部首排列。
GB-2312中,把没字分为94个区,每个区94个位。每个收进的汉字有一个因定的区位。例如“啊”字,位于16区,01位,这个区号和位号就构成了它的区位码“1601”。这就是我上面说的,区位码就是国标码。
但区位码和国标码还是有一点差别,那就是在GB-2312中预留了一些空位,可以进行补充、扩展,经扩展的区位码就从数量、范围上超过了GB-2312了。
上面是就大陆而言的,台湾、香港、和其他汉语国家,也是用区位码,但他们的区位号与大陆用的就不一定相同了。这是区位与国标的又一区别。
内码是保存在计算机中或文件中的汉字编码。它是十六进制的(当然在机器中是二进制了)。要计算机中,汉字不能直接用区位码来表示。例如“65”,在ASCII中,它表示“A”,在GB-2312中表示第65区。如果在计算机中用一个“65”用来表示65区的话,就不知是“A”,还是“65区”了。所以在计算机“内部”,就要用“内码”了。内码的基础还是区位码。一般用一个汉字的区位码加上十六进制的“A0A0”或“2020”就是该字的内码了。
因为ASCII的基本集只有128个,编号为0-127;而十六进投影的“A0”,换算为十进制,就是“160”了,这样就不会和ASCII的基本集相冲突了。
就谈这一点儿,够吗?