搜索引擎如何对待转载和原创?

再好听的歌手,我如果总是听TA的歌曲,一定会有听烦的一天。同理,搜索引擎,比如Google,通常很喜欢新鲜的内容,也就是网站提供原创的内容。只有更多丰富的原创内容,才能为搜索者提供更多的内容。这也就是那些搜索引擎优化专家们的所说的:内容为王(Content is king)。

如果你转载别人的文章呢?Google会不会索引?并在搜索的时候对转载文章给出好的排名?大型门户网站转载肯定不存在问题,即使转载小型网站(比如博客)的原创内容,搜索引擎一般也会优先显示门户网站上的转载,毕竟小型网站和门户网站不是一个重量级的事情。

那么小型网站之间的转载呢?我前几天转载施乐遥博主关于英国教育的几篇博文,现在Google中搜索这几篇文章:微观英国私立和公立教育,Google已经把原作者的文章和我的转载都显示出来,并且智能地把原作者的文章放在第一位,这种处理方法非常人性化。看来Google对待转载与原创的答案是:根据网站的质量在搜索结果中予以处理。

google-seo

如果搜索“微观英国私立和公立教育 小学篇”等标题,Google甚至将我的转载排在第一位,先于原作者!原因可能是原作者的二级域名在Google算法中排名没有土木坛子高。

google-seo-reposted

Google也许觉得,我转载这几篇文章让文章的价值得到了二次放大——WordPress.com上面的博文在国内无法显示,在这样的情况下,给转载者提供较好的排名是值得的,这与那些不加选择地转载甚至建立垃圾网站有明显区别。这也验证了我所说的:信息传递到正确的受众体,也是极好的

这里所说的例子是针对Google,尚不清楚国内的百度如何处理原创和转载之间的关系,我用百度的次数太少了。

搜索引擎如何对待转载和原创?》上有27条评论

  1. kamen

    我好奇的在百度搜索“微观英国私立和公立教育”,看到结果后再次坚定了我不用百度的信念。

    回复
    1. 土木坛子 文章作者

      时间,登录状态,IP地址,都会影响Google的搜索结果,我这里是在匿名状态,用Google美国搜索出来的结果,非个性化的Google搜索结果。

      回复
        1. 土木坛子 文章作者

          具体肯定得问Google的搜索工程师,它的算法有两百多个因子呢。
          但我想,一个最简单的原则是谁先被Google索引,就算谁的吧,就像专利一样,谁先申请算谁的。因为网页本身的时间戳是不准的——网站管理员可以随意更改。

          回复
          1. 依云

            被索引的时间没什么影响的哦。我博客曾经有段时间因为免费 dnspod 出问题导致 Google 抓取失败,结果我搜我最新一篇文章,排名第一的是一个专门转载的小站。后来我博客恢复访问了,我再搜索,结果我博客的文章排名第一了,而那个站的转载甚至都看不到了。

          2. 土木坛子 文章作者

            你的DNS没有问题,也难以保护Google能在你发布文章的时候,第一时间收录你的——除非你手工提交给Google网站管理员后台。因此,不难排除人家转载你的文章后,Google就收录了,所以就显示了,后来,你的恢复后,可能Google觉得你的权重比转载的高,又把你的文章显示在第一了。我估计是这样。

          3. 依云

            应该说大部分情况下 Google 收录我博客文章的速度会比那个转载站要快的。不过不管它先收录谁的,权重还是挺重要的。

      1. 土木坛子 文章作者

        这有什么不能的呢?事实上,RSS就是开放的啊,你想放在哪里都是可以的。我自己的写的东西都全面开放了,何况这些本身就是转载的信息~

        回复
        1. 马光

          不是观察力太仔细,而是非常明显的差别。
          可能是你用惯了这样的字体,所以不知不觉就接受并认为这是正常的,但是对于别人来讲,这个绝对是另类……

          回复

锦程进行回复 取消回复

电子邮件地址不会被公开。 必填项已用*标注