请问网站采集是怎么回事?【急,有加分】

来源:百度知道 编辑:UC知道 时间:2024/05/25 03:42:58
能详细的说说采集的具体过程和注意事项吗?
采集管理 采集节点管理 临时内容管理 导入采集规则 监控采集模式 采集未下载内容
这些能给详细的介绍一下吗?
如何使用采集?如何实现采集?
py_511 你也关注下吧,帮忙给问问。让他们到这来回答就成了

看来你也是个建站新手,我也正想问这个问题,应该是采集别的网站上的内容到自己的网站上来。
你用的是哪个管理系统啊?里面一般都有教程的啊,我只是还没有时间管理网站,昨天才上传源码的,我用的是这个;www.boy16888.com.cn

一般大型网站建站的时候,固定的内容 如新闻、下载等 都是使用固定模板、自动生成静态页面的方式。这样就使得在源码中表格等设置都是一致的。

网站采集就是利用这样的一个原理,搜索页面中与采集设置相同的部分,然后搜集网站内容进入数据库。

比如:
某站的新闻在源码中是这样的
<table class="news"><tr><td>新闻内容</td></tr></table>
很容易可以看出,上面就是一个表格,然后包含新闻内容,设置采集方式的时候,就可以 从遇到页面的<table class="news">这个标记开始,到下一个</table>标记结束。运行采集后,就会将该站所有的新闻全部采集下来了。

当然,上面只是简单的一个采集的举例而已,实际应用中会比这复杂的多。

使用网站采集的好处是可以减少网站制作人员的录入时间。弊端是使得网站没有个性,千篇一律。