如何查找word文件内那些字符串重复了。

来源:百度知道 编辑:UC知道 时间:2024/06/10 20:54:51
有一个上百万字的word文件,其中重复的话与段落很多,要自动找出来那些话重复了,并删除掉,起码能找出来也行啊!
word或者excel能不能自动把相同的内容删除掉?
如果能,是不是需要限制文字长度?要不然相同的字也要被删除掉?就是把相同的段落或者几句话删除掉?最起码也是一句长把?
qulong_001 讲的 利用excel中高级筛选功能,可以整段的剔除,但是找出段里的一句就不行了,
而且这次word文件特殊,里面包含图片与公式,在excel里是不与单元格锁定的,所以此方法无法实现需求。不过,看来今天又遇到高手了。

现在正在 测试 千羽之城 的MS Word Remove Duplicates In Documents v7.0,程序已经运行十几 二十分钟了,cpu还是100%,不见完成!并报了一次问题,“不能完全怎么怎么”!
注:原文件6.22M 包含图片与公式

Ctrl + F ,使用其中的“替换”功能,其中的“查找”功能只能一次查找47个汉字,“替换”会更多一些,word或excel都适用。但这个功能只能将一段内容复制其中,查是否有段落与之重复,却不能查找出整篇文章中是否有两个或多个重复的段落。
所以楼主若是怀疑某段重复的话用这个办法好用,若是想凭word自己查找出相互重复的段落就不可能了,没有也不可能实现这样的功能。
但在excel中却可以利用高级筛选功能能来删除完全重复的单元格,相对也麻烦点,可以去搜一下这方面的教程来看一下。

建议你下载:守柔Word文本筛——文档重复段落和相似段落分析工具
如果找不到,我可以传给你。

方法如下:

1、打开WORD

2、按ctrl+F键,进行查找,

3、输入需要查找内容,比如输入:张三,

4、点击阅读突出显示,这样所有名的张三的重复项就会有颜色凸现出来。

用MS Word Remove Duplic