有没有针对pdf word excel文件的全文搜索引擎,公司要购买.

来源:百度知道 编辑:UC知道 时间:2024/06/11 01:52:55
我公司有将近10w片的文章需要建索引.现在市面上有没有现成搜索引擎可以做到对PDF WORD EXCEL等文件的全文检索软件呀.
所有文章都是文件格式,没有放到数据库里面.要买一个引擎,来对其进行检索.

不用卖搜索引擎,百度硬盘搜索就能实现对常见格式的文件的索引。还可在其下载网页中找到不同的文件的分析插件,扩充搜索。
下载:http://disk.baidu.com/
插件:http://disk.baidu.com/plug-ins/index.php

google提供了这个功能:
方法:如我要Word格式的《生物说课稿》,在google里输入下列语句即可搜到(不能少一个空格也不能多一个空格):

生物说课 filetype:doc
---------------------------------
如果需要PDF格式的《生物说课稿》,同样你在google里输入下列语句即可搜到(不能少一个空格也不能多一个空格):

生物说课 filetype:pdf
--------------------------------
这个法子有自身缺陷,那就是你利用起来很多非你们公司的不相关的也搜到了

那么需要打开右边的“高级搜索“,把范围从选为“搜索特定网页”(也就是你们公司的网页)

这样就可以用了。
不过具体搜索准确度多少我没尝试过...

用SQL SERVER2005,微软网站上可以自由下载的那种版本就可以了。