谁能说说记txt文件的四种编码有什么不同?

来源:百度知道 编辑:UC知道 时间:2024/06/11 13:36:09

复制太长你未必会选我。。。简单点复制吧~ 应该一目了然吧?

  只是字符的不同制式编码表达方法罢了。非专业从业没必要深究。

  简单说 Unicode big endian 是 Unicode 编码格式
  UTF8 是 Unicode 的传送格式。
  UTF8 是把 Unicode 文件再次编码,再次编码后的东西叫UTF8,用于网络传送。

  ANSI
  美国国家标准协会。由公司、政府和其他成员组成的自愿组织。它们协商与标准有关的活动,审议美国国家标准,并努力提高美国在国际标准化组织中的地位。此外,ANSI使有关通信和网络方面的国际标准和美国标准得到发展。ANSI是IEC和ISO的成员之一。
  American National Standards Institute(ANSI——美国国家标准局)

  ————————————————————

  Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。随着计算机工作能力的增强,Unicode也在面世以来的十多年里得到普及。
  Unicode 是基于通用字符集(Universal Character Set)的标准来发展,并且同时也以书本的形式(The Unicode Standard,目前第五版由Addison-Wesley Professional出版,ISBN-10: 0321480910)对外发表。

  ——————————————————————

  UTF8 UTF8并不算是一种电脑编码,而是一种储存和传送的格式,如前所述,每个Unicode/UCS字符都以 2或4个bytes来储存,看看以下的比较:
  以"I am Chinese"为例
  用ANSI储存:12 Bytes
  用Unicode/UCS2储存:24 Bytes + 2 Bytes(header)