去除文本中标点符号的java程序

来源:百度知道 编辑:UC知道 时间:2024/05/28 02:46:37
去除中文文本中的所有标点符号,包括中文标点。,“”……等等,还有英文标点,."":;'\等等。。。还有英文字母。反正就是最后只剩光秃秃的中文文字。谢谢啦。
input.txt输入,output.txt输出。
麻烦大侠们了,帮忙编一下这个程序~~~

class Test {

public static void main(String[] args) {
InputStreamReader dis = new InputStreamReader(System.in);
BufferedReader reader = new BufferedReader(dis);
String str = "";
try {
str = reader.readLine();
} catch (IOException ex) {
Logger.getLogger(Test.class.getName()).log(Level.SEVERE, null, ex);
}
char[] chs = str.toCharArray();
ArrayList<Character> list = new ArrayList<Character>();
for (int i = 0; i < chs.length; i++) {
if (Character.getType(chs[i]) == 5) {
list.add(chs[i]);
}
}
char[] newchs = new char[list.size()];
for (int i = 0; i < newchs.length; i++) {
newchs[i] = list.get(i);
}
System.out.println(new String(newchs));
}
}
测试