乱码是如何产生的?该怎么解决呢?

来源:百度知道 编辑:UC知道 时间:2024/05/13 05:53:10
浏览网页的时候,经常会看到文章中间出现一大段乱码,妨碍了阅读,这种情况是怎么产生的呢?如何解决阿?
非常感谢:)

乱码是怎么产生的呢?如果你打开一封乱码邮件时,你就会有可能看到如下两行:

Content-Transfer-Encoding: base64 (或qutoed Printable或8bit)

Content-Type: text/plain; charset=“us-ascii”

其中第一句说明此邮件传输时所用的编码,是base64还是qutoed Printable或是8bit,第二句Content-Type说明邮件的内容类型是纯文本还是图片或是超文本文档,charset说明信中文字所用的字符集。

有us-ascii,ISO-8859-1,GB2312等。为什麽邮件传输时需要编码呢?因为最早的E-mail是UNIX系统中出现的,当时的E-mail只能传送ASCII码(美国国家标准信息交换码)格式的文字信息,ASCII码是7位代码,非ASCII码格式的文件在传送过程中就需要先编成7位的ASCII代码, 然后才能通过 E-mail进行传送;如果不经过编码,则在传送过程中会因为ASCII码7位的限制而被分解,分解之后只会让收信方看到一堆杂乱的ASCII字符。经过编码后的文件,在传送过程中可顺利传送,不会有“被截掉一位”的危险。但是收信方必须具有相应的解码程序,将这份经过编码的东西还原,才能看到发信人要传送的信息内容 。而我们的中文是8位代码编码的文字,并不是标准的ASCII码格式,由于在国内中文是通行的文字,所以大部分的国内邮件服务器都已能够处理GB内码的文件,因而不需要做这种编码/解码的操作,但如果要送中文邮件到国外或使用国外的邮件服务器传送邮件,就需要经过这种转换才能传送,因为国外的邮件服务器是无法辨认中文内码的。中文码在经过一些不支持中文内码的传递主机时,依然会被截掉一位,造成文件乱码无法读取。而经过编码的中文邮件,收信人收到后将文件解码还原,也需要有中文系统才能看所写的中文信息。

电子邮件中常用的有三种编码标准

一、UU编码(Unix-to-Unix encoding)
uuencode和uudecode原来是unix系统中使用的编码和解码程序,基于Windows的类似程序有wi