论坛社区等网站的新闻都是从何处或者如何搜集的

来源:百度知道 编辑:UC知道 时间:2024/05/26 11:10:00
比如猫扑,天涯等论坛或者社区,里面都有许许多多分类很明确的新闻资讯,这些资讯都是如何获得的,是他们原创的还是工作人员从互联网上一点点搜集的,或者是别的途径?

论坛新闻首从来源无论是像猫扑天涯这些大论坛社区还是小型个人网站,来源无非就二个,一是原创一是转载.

原创的就不多说了,就是自己网站的编辑自己写的有版权的影响力非常小的"新闻"。

转载的这个说起来就多了,但在中国互联网上有资质发新闻的其实只是一些传媒,比如说新华网,人民日报和各类报刊杂志等等。一般的网站即使是新浪搜狐也是没有权利发新闻的,一般也只是转载而已,而且一般也会标出新闻的出处和地方,他们网站的大部分编辑也会把转载的文章修改发布。当然如果有新闻出版执照的话也是可以发新闻的,这个具体可能还得去新闻出版法了,偶不是专业法律人士估计还是咨询专业法务人士。

如果你想知道是说新闻从技术上说是怎么搜集的,现在有一种程序叫网页小偷,就是可以把各大网站上的各种内容,不仅仅是新闻给抓取下来然后经过自己论坛的程序转换直接写到自己网站的数据库中,这个操作是实时的自动的,非常省力的,估计现在绝大数网站都是这么干的。当然这种行为不道德和有一些网站会进行反扒行动。。。。
这些内容抓取程序功能强大,基本上互联网上的内容都是你抄我我抄你,少不了这种程序的功劳。不过宽泛的说GOOGLE和BAIDU才是最大的内容抓取大王,只不过他们是把内容转到实际的链接而以,但是内容其实已经是在他们宏大的数据库中了。

支持一楼和二楼的说法,猫扑,天涯等等的大网站大论坛,都是与新华社等等通讯社签约拿新闻的,要付费的,最多有自己的新闻工作者写一些评论什么的。而小网站,尤其是那些虽然大但是没上市的企业旗下网站、社区大都是转载的。

除了他说明是原创的,不然都是转新华网的拉。你可以看下他的介绍。自动摘抄比较少了,都是编辑选的,不然就成了新华网的镜像网站了。

新华网以新华社为依托,是中国最权威的网上中外文新闻发布平台。

大多采集的

采集程序采集的~

引用:是工作人员从互联网上一点点搜集的

新闻搜集用的是采集
采集的意思就是
指定某一个页面的东西 按照一定的规则自动下载发布到自己的网上

但是像猫扑,天涯这样的,只会发布热点的