收索引擎如何实现的?

来源:百度知道 编辑:UC知道 时间:2024/06/07 05:03:28
麻烦提供收索引擎的实现方面的资料
越详细越好

apache 的lucene是一个开源的非常优秀的搜索引擎。提供了java 和.net的支持。上面有很多的资料,都是官方的,而且网上也有很多这方面的资料了。
不过大多是英文的,没办法啦,学好英文吧。
网址:http://lucene.apache.org/

估计又会降低我的命中率了。算了,如果真是适合人。也算有点贡献

把你的email给我吧。帮你找点。
搜索引擎实现需要很多东西的。
包括数据库,网络,语义/语法解析,模式匹配等等等等。

如果抛去数据库部分,简单说则首先是接受查询内容,然后进行关键词解析,其中就包括语义解析,语法分析,同义词匹配等等步骤(这个需要的东西比较多,编译啊,人工智能啊等等),再后就是利用spider在web站点中进行爬行和捶打(关于这方面可以看看网络编程知识和智能代理的知识),通过关键词集合和关系进行匹配,返回结果...............

当我们都在投入WEB标准的行列时,我们时常听到这样的声音:“太慢了,制作这样的一张页面我需要花费比以前多数倍的时间。”采用标准是不是真的会让你的制作变得很慢呢?我的回答是“不一定,这完全取决于你从什么样角度去看,并且没有找到快速操作的方式方法。”首先我们要确定的是:新的制作方式是把我们从“所见即所得”软件制作中拉到“代码编辑者”行列。我们现在需要对每一个XHTML标签都要有所了解,对他们的特性都要有所认识!而以前我们只需要躲在软件的后面。

我们现在站在路口,是我们选择的时候了!向标准?还是向传统?对于事物的取舍需要分析事物的可发展性,与先进性。标准是主张代码标准而清晰,主张样式于数据的分离。从这一点上来分析:代码的清晰与标准化,是为了方便网站内的信息共享,也就是说代码清晰而标准的网站更加容易被收索引擎搜索得到,并且可以移植到其它显示设备中。而数据与样式的分离则表明网页制作的分工变得越来越清晰。美工只要专注与美学方面就可以了!制作人员只需要了解如何实现美工的作品,而程序员只要把代码与数据输出。光是这两点我们已经可