百度重新放出土木坛子的搜索结果

自从我的网站域名被有关部门认证后,在“与时俱进”的百度搜索里就再也无法搜到土木坛子的域名,但我的服务器后台日志显示百度的蜘蛛经常光顾,甚至我在robots.txt里禁止它都没有用。

最近有网友告诉我说百度能搜索“土木坛子”了,我刚开始不相信,以为是间接搜索结果。于是我去百度试了一下: site:tumutanzi.com,发现是真的,百度重新放出对土木坛子的检索结果,收录结果保持着最新。直接搜索“土木坛子”也能将土木坛子的首页列为第一个结果。

baidu-tumutanzi

但是令我感到奇怪的是,百度将我的网址链接都变成了HTTP, 而不是我设置的强制性HTTPS,估计百度是简单粗暴地将HTTPS都转成了HTTP(百度目前还不支持索引HTTPS SSL加密网页——不太可能是技术问题),所以在国内即使能搜索到土木坛子博客的结果,点击搜索结果也无法访问土木坛子——聪明的网友可能会使用百度快照查看一下,也因此如此,百度显示土木坛子的连通率是0%。

看到百度搜索对我这样的认证域名出现了变化,我猜测是GFW墙的政策或者技术方面出现了一些新的变化:百度可能觉得放出收录结果也无妨,反正也访问不了。

我不希望百度放出这样的检索结果,对搜索者很不友好。可是我没有办法,就任由百度去吧。随着“网络主权”政策的日益扩大,网络审查封锁会越来越严厉,技术手段也越来越高,不能正常访问墙外网站将越来越“正常”,能访问才不太“正常”。

PS. Google真好玩,搜索“坛子”,居然是这样(Update: 其实也就是Google居然把“坛子”这个普通名词当作土木坛子了)。

百度重新放出土木坛子的搜索结果》上有64条评论

  1. 锦程

    有点奇怪,我是一直屏蔽百度的,之前可能是用了百度分享的原因,给了我一个首页。现在不用了,首页也没了。

    回复
      1. 落梵

        原来是这样你才说好玩,我还以为谷歌又出什么新玩意。从我的角度来看就是系统分词的原因,首先“坛子”的解释是:一般指用陶土做胚子烧成的用来腌制菜品或盛放物品的器物。从你博客名称上看,可以分为“土、木、坛子”这三个词,坛子跟土、陶、瓷这些词有关,跟你的博客全沾上边,再加上这个词没有人去“SEO”,而且别人给你的外链词也是离不开“坛子”,所以……好吧,我胡扯、、

        回复
          1. YoungFree

            这是搜索引擎“被调教”的结果。搜索引擎对搜索词排序时(展现结果页面),首先会进行分词,如落梵 分析的那样 ;在谷歌那,土木坛子,这个词已经是很明确的与你的网站形成了一种“绑定”关系。当用户在谷歌搜索 坛子 这个词的时候,会检索谷歌索引中所有包含 坛子 这个词的页面,然后依据各页面间的联系,确定与 坛子这个词关系最密切的页面,同时根据历史搜索结果中用户点击最多的页面,以及其它因素,综合判定各含有 坛子 这个关键词的页面在搜索结果中的展示位置。你的土木坛子 在谷歌记录中,其被访问的次数肯定是远大于 百度百科词条。你的网站排在第一位,也就不奇怪了。

  2. 忘想

    这几年来搜索资料的精确方面来说,发现百度确实比GOOGLE差多了,特别是技术方面的资料。所以百度,真心不青眯。

    回复
  3. 尚磊的博客

    你的结果出现在Google搜索“坛子”靠前的位置,也有可能是个性化搜索的设置。

    我在Google搜索坛子,你的网站排第一位,下面注文中显示我最近访问了两次。

    回复
    1. 土木坛子 文章作者

      其实也就是Google居然把“坛子”这个普通名词当作土木坛子了。

      而且排在百度的百科前面,你说我这“坛子”的表现还可以吧?

      回复
  4. 第三人称

    近期确实gfw又有动作,google ip又被屏蔽了一些,只能再换。百度逗,谷歌也逗了。坛子这个关键词,搜索的都是冲你来的。你还真有闲心。

    回复
    1. 尚磊的博客

      说的有道理,谁会搜索坛子这个人尽皆知的器物,搜索坛子一般就是想找土木坛子。

      百度知道上有一个问题,土木坛子是一个怎样的网站?被采纳的那个【答案】太不靠谱。

      有兴趣可关注。

      回复
    2. 土木坛子 文章作者

      我倒不觉得会有许多人搜索“坛子”来搜索我的博客,不过是我的整个网站权重比百度的词条权重大,所以就显示在前面了。

      回复
    1. 土木坛子 文章作者

      那是因为你点击后,我的.htaccess文件里面设置了强制性的跳转,你如果在墙内就跳转不了的。
      百度不遵守robots协议。其实Google也会扫描,但不会放出收录结果——如果你robots协议禁止它的话。

      回复
    1. 土木坛子 文章作者

      曾经一度禁止的,后来发现没有用,还是来光临。我于是只保留了禁止: DNSPod-reporting (其实这个也好像没有用)。robots.txt协议就是一个君子协议。

      回复
  5. typcn
    [email protected]:~# cat /etc/config/blocklist
    *baidu*
    *zhihu*
    *qzone*
    *qihoo*
    *360*
    [email protected]:~#

    为了避免自己在这些网站上浪费时间
    我给自己做了一面“墙”,屏蔽了一些网站

    百度必须是第一个,搜索出来的结果扯淡,贴吧一群不知道怎么说的人在扯淡,百度知道回答扯淡,百度百科词条扯淡。

    回复
    1. 土木坛子 文章作者

      你厉害。我要是有VPS,可能也这么干了,我对搜索引擎只重视Google,只在乎它,其它的我基本上不管它。
      这里我其实是想猜测背后墙的变化。

      回复
      1. typcn

        这是在我的路由器上屏蔽的,只要连上我的网络,就访问不了这些网站了。
        蜘蛛懒得管,因为屏蔽了也没用。
        我之前屏蔽了 360 但是它照收录不误,快照还一直更。

        回复
  6. 大致

    百度就是臭流氓。一直就完全不遵守爬虫的规则,尤其现在国内一家独大,更是翻云覆雨。(soso也是一丘之貉)
    收录什么的对现在的我完全是浮云。

    回复
  7. 尚磊

    我今天在百度搜索,发现搜索“土木坛子”的结果已经是https的可访问链接了。首页已经改正,不知道其他结果页面如何?

    我又搜索了一下内文页面,结果引导去了非https页面,是你制作的镜像页面。

    回复

大致进行回复 取消回复

电子邮件地址不会被公开。 必填项已用*标注