蜘蛛如何辨别原创内容

来源:百度知道 编辑:UC知道 时间:2024/06/07 08:36:17
蜘蛛如何辨别原创内容?高手帮忙分析一下

蜘蛛如何辨别原创内容

好多站长都在问原创是如何被搜索引擎识别的?IT在线在这里介绍一下对搜索引擎识别判断原创内容的一些浅显看法。

在谈论之前,我们首先应该明确三个基本概念:原创与伪原创以及转载

先说转载:顾名思义就是原原本本的从网络媒体上照抄照搬过来的文章。

原创:很好理解,就是第一次在网络上发表的文章内容。

伪原创:就是对网络上收集到的一些原创内容进行N次修改,转而进行发表的文章。比如修改文章的标题,增加文章摘要,转载不完整的文章内容等等。

搜索引擎对于原创的识别判断是如何进行的呢?

一般来讲,有以下几个方面的因素决定:

1、快照生成的日期。

2、蜘蛛抓取的日期。

3、网站页面外链的多少。

4、文章内容雷同相似的程度。

举例:如果一篇标题为《蜘蛛如何辨别原创内容》的文章在今天早上8:00首次发表在一个BBS、BLOG或者网站上。会有什么样的结果呢?

蜘蛛来到这个BBS、BLOG或者网站,发现了这个页面,分析页面上《蜘蛛如何辨别原创内容》的的文章内容,放入搜索引擎数据库,并经识别判断被认定为首次发现,那么《蜘蛛如何辨别原创内容》的这篇文章肯定就是原创了!

当然,在蜘蛛爬过来识别文章时,收录与判断的过程中间有几个细节问题,需要大家参考:

1、认定为原创文章的必要条件

假如这个网站没有被收录,这篇文章会认为是原创吗? 当然不会!因为它根本不可能出现在搜索引擎的数据库里!

那么,如何让它被认定成为原创内容呢?

第一个条件,网站必须有被搜索引擎收录。假如这个网站被收录了,但是不经常更新呢? 很简单,如果不经常更新,发表的文章到被蜘蛛搜索到并收录的时候也会认为是原创的。

2、转载与采集后原创的认定

如果这篇文章被转载了呢