linux中文乱码

来源:百度知道 编辑:UC知道 时间:2024/09/26 10:46:04
通过url读取指定页面的信息,得到自己想要的部分保存入库,程序已经完成。在我本机没问题,得到的中文正常显示,但是在linux上却是乱码...实在很郁闷。望高手帮忙。我用的是utf-8,因为我抓取信息网站的编码是utf-8。
因为抓取只是项目中的一部分,目前项目统一编码utf-8而且在linux上运行正常,这么修改我怕会影响程序里其他地方

这个问题我以前遇到过咯~~

LINUX内核编码不要轻易改动,这样可能会影响其它很多东西!
你可以在编JAVA程序时使用Stream对象,而尽量不去用Reader对象来操作网络上的文件.
Stream读取文件到Buffer以后,直接应用Buffer重建指定编码的字符串即可.

字符集 windows创建的默认是GBK字符集,你需要把你linux的字符集改为GBK或者把编辑器的字符集改为GBK

#cd /etc/sysconfig
#vi i18n
改成下面这样,zh_cn.gb18030是中文的。。也可以设置LANG=zh_CN.GB18030(注意大小写)
LANG="zh_CN.GB18030"
LANGUAGE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"
SUPPORTED="zh_CN.GB18030:zh_CN:zh"
SYSFONT="lat0-sun16"
SYSFONTACM="8859-15"