java 另类乱码(极少见 没见过的 不要说不可能)

来源:百度知道 编辑:UC知道 时间:2024/06/06 00:32:54
遇上一种情况 程序的作用是抓取特定页面的信息
在ECLIPSE 运行是正常的 可是当打成可执行的JAR 包的时候 在特定的字符的时候就会出现乱码
例如 全角的句号 全角的左半边的双引号 和某些特定的中文汉字
注意 :
问题的关键是 为什么特定的汉字和标点符号是乱码 其他的完全没问题
已经证明 程序中没有对这些字符或汉字及标点符号做过滤
估计和ECLIPSE或者JDK版本有问题 但是为什么不打成jar包 直接用ECLIPSE 运行却完全没问题.

只要给点有建议性的 合理的 解决方案就可以
补充下 不是所有的句号和双引号是乱码 完全随机的乱码 ...下面副图片
谁还遇见过这种情况 ? 可以联系下
我的JDK是 jre1.5.1_12 eclipse 是3.4.2 代码是用UTF-8 写的 抓取的页面编码也是UTF-8
话说 解决其他问题产生的乱码 我自认为 还是没有问题的
把eclipse启动语言设置成cn试下
我安装的直接是英文版本的eclipse 项目编码默认为UTF-8 问题的关键是为什么 在一段文字内 有的是乱码有的不是乱码

jdk本身在utf8的情况有错误。详情参阅:
http://blogs.sun.com/CoreJavaTechTips/entry/the_overhaul_of_java_utf
sun里面的中国人:)
先升级一下jdk,检查看看,
就目前而言,完全可以使用jdk7,source和target已经进行调整,现在已经全兼容ide的这方面的设置。

把eclipse启动语言设置成cn试下

Preferences General > Workspace 修改Text file encoding
为UTF-8

中文的windows的默认编码好像是GBK,你把Eclipse的编码改成GBK试试,不过这样会牺牲Java的跨平台性,Linux等系统上的中文编码默认好像是UTF-8。