汉语句子拆分算法 java实现 高手请指教

来源:百度知道 编辑:UC知道 时间:2024/06/22 03:39:16
用java ,如何合理的拆分一个汉语句子,比如”今天,天气比较好”拆分为”今天””天气””比较””好”,使句子能够恰到好处的被拆分开,能拆分成词语就拆分成词语,不能的就拆分成单个汉字;用 java实现其过程

这个分词是一个很大很难的东西,中科院做了五年才做出ICTCLAS,如果你自己写的话估计可以晕了,建议你用现成的分词工具,用java调用,比较好的有上面的ICTCLAS,如果你是做搜索引擎,那么用lucene支持的一些分词工具会很不错

/*实现单个拆开*/
package dd;
public class Dd {

public static void main(String[] args) {
String kissi="今天,天气比较好";
//将字符串拆成一个char[]数组
//至于tochararray(),请查帮助文档
char[] kiss=kissi.toCharArray();
for(int i=0;i<kiss.length;i++){
System.out.println(kiss[i]);
}

}

}

说到这个"合理"...
你得有个字典,还有规则..