百度知道等数据库依赖型网站的站内搜索原理

来源:百度知道 编辑:UC知道 时间:2024/06/07 22:04:25
百度知道、阿里巴巴等大型的信息类网站(包括电子商务和大型贴吧等)。它们的核心都是运行于后台的数据库系统,前台展现有动态技术生成静态页面。
单纯的数据库SQL语言显然无法满足这些商业网站的大信息量的搜索需求。SQL语言对于搜索到的结果有很强的制约,且不能支持长句搜索时需要的的动态匹配。
另外一种静态网站的站内搜索方式为嵌入其他诸如Yahoo!、Google、Baidu等大牌搜索引擎的站内搜索结果,其效果也不甚理想,无法满足数据库依赖型网站的站内搜索需求。因为这种嵌入式搜索的结果是建立在所嵌入的搜索引擎对你的网站的收录情况,而搜索引擎的蜘蛛抓取程序为根据链接在网络上提取网页,明显不适合数据库依赖型的动态网站,因为这种网站的最终显示页面是实时且为孤岛型(无法有其他页面链接)的。
那么请问,百度知道等大型商业网站的站内搜索是一种什么样的原理和方式呢,怎么样才能达到对数据库良好的智能的搜索呢?如何才能使自己的网站站内搜索水平能达到百度知道的站内搜索水平?
以上的一些观点仅仅是小弟的一些不成熟的猜测,因为对搜索引擎的原理也知之有限,望哪位大哥能答疑解惑。不甚感激!!!

百度的商业机密...

你这个问题我也不太清楚。。
但是我有一个朋友。他在上海的某家培训中心正在培训(一万多)。
他学的J2EE 他马上就培训结束了。。
他的毕业设计就是设计 ----翻版的百度
具体的也没细问。。只知道是J2SE做的。至于后台是什么就不知道了。。

数据库也就那么几种:ACCESS,SQLServer,MYSQL,OREACL。
可能就后面两个中的一个。。。。

关键是服务器。。。大型的服务器要7位数以上的价钱才可以买的到。。
快速的搜索是靠硬件支持的~~!!!
大体就是这样。说错了别丢砖头就好~!

我也很想知道答案,可是要是在网络中公布了,那百度不就要倒闭了吗????

百度知道等数据库依赖型网站的站内搜索原理~???

如果知道了原理程序,那么就不会再有人去翻版了啊~!
出现的全是“百度”。