用C来实现这个问题

来源:百度知道 编辑:UC知道 时间:2024/05/26 03:59:46
需要统计垃圾短信中的常用字,还统计常用字出现的概率。有些问题不是很明白:
1.短信最好先过滤然后再统计,过滤掉其中的标点符号,英文字母等非汉字的数据。
2.如果我想把信息都存在一个数组里,然后以每两字节的方式来搜索一个汉字,这样可以不,应该怎么做?
3.怎么让这个程序一下就处理所有的信息,不用一条一条的输入.
4.最好能吧常用字中的口头语,如“你好,我,他,的地德等”之类的字除去。
最好能给出相关的代码或程序:

1,在接受到短信的时候就把标点符号,英文字母等非汉字的数据过滤掉,
2,以字节的方式来搜索汉字好象有点慢,你受到的短信如果是以汉字编码接收的最好不要在转换编码,这会增加程序的运算.
3,既然过滤掉其中的标点符号,英文字母等非汉字的数据那你试试把它全不连接起来做为一个string .
4,用3的方法做个循环不就行了.