一个觉得非常复杂的文本问题,困扰我很久啦……

来源:百度知道 编辑:UC知道 时间:2024/06/21 15:37:48
假设有这样壹段好几万行的文本:

莱卡的手机发垃圾看见了附件卡拉多少积分了看见了看时间 离开的将师傅了看见阿斯科利的解放路口就积分卡了解爱上对方就
爱的是看见发啦就

姓名: supermax1128
编号: 468

儿啊福建卡多少积分离开单间房内大食客风口浪尖雷声大
拉屎打开附件啦就 都是福建路口就
姓名: dededog1688
编号: 132
爱人方式打开附件科技开发啦几率大方了快
爱的世界开发可立即离开
姓名: paulsmith0204
编号: 1173

说电视就大方快开工了看见发的
空间按当时看附件龙卡及 fdas

姓名: paulsmi
编号: 1173

但是看了附件啊卡将地上j
速度快放假刻录机啊杀毒

姓名: paulsmi
编号: 1173

法都是福建卡
暗示大家看法就……

这些文本都是繁体字,姓名:xxx 和 编号:xxx 两行之间没有隔行,姓名上面隔壹行,编号下面也隔壹行,姓名:xxx前面空壹格。
我要把 姓名:xxx 和 编号:xxx 这两行做为壹行提取出来,其他的文字不要。

结果要求是这样的:
姓名: paulsmi 编号: 1173
姓名: paulsmith0204 编号: 1173
姓名: supermax1128 编号: 468
有办法做到吗?

用UltraEdit可轻易做到。

先用替换功能将“^p编号:”替换成“编号:”,将两行变一行。
再用文件排序功能排序,所有以“姓名:”开始的行会排在一起。
将前面的行和后面的行全部删掉。

大功告成。

可以用VBA来完成