分类
信息技术

互联网充满了垃圾内容

有朋友问我,为什么要在博客留言栏里填写用户名和邮箱。其实这主要是为了防止互联网上的机器人产生垃圾评论。

在过去四年多的时间里,土木坛子这个网站共产生了30,029条有效评论,与此相应,垃圾过滤插件Akismet为土木坛子成功阻挡了118,686条垃圾评论(准确性为99.41%)。垃圾留言是正常留言的近4倍。

发这些垃圾评论基本上都是一些机器人的成果,估计也是为了SEO留下外链增加目标网站的搜索引擎表现。

通过这个小例子,我觉得互联网上的确充满了垃圾内容。另一个明显的例子是,网络上到处充满了内容采集机器人,直接复制正规网站的内容,甚至采集后东拼西凑,堆砌关键词来获取搜索引擎流量,进而产生广告价值。但这些垃圾内容对人们一点用处都没有。

另外一个现象是网络充满了不少成人内容,这可能缘于人们对成人内容的需求。我记得去年曾关注过好莱坞女星事件,没想到那篇博文一直到现在,每天还有人通过搜索引擎找到它。即使放眼整个网络,早就有报道称,成人流量占全球网络流量的三分之一。

垃圾内容是由于人们对利益的快速追求,成人内容则是人类最基本人性需求。这两点在虚拟的网络上发挥是淋漓尽致。

幸运的是,在这个充满垃圾和成人内容的互联网上,有Google这样优秀的搜索引擎,它能过滤掉大量的垃圾和成人内容,才不至于让互联网沦落到没有用的地步。

“互联网充满了垃圾内容”上的52条回复

这两条推理似乎逻辑性不强:

第一条,Akismet 为你挡掉了很多垃圾评论,这些评论实际上并没有被发出来,以 Akismet 的普及程度来看,世界上一大半博客都是干净的。垃圾链接发不出,SEO 上不去,垃圾站很快就会死了,何以见得网络上垃圾多了?

第二条,我的博客过去一个月里有超过一半的流量来自搜索引擎,目标多数是我之前写的工具类文章,照你这么一推理,App Store 也占了一大半的网站流量呢。

认真是我喜欢的,也是应该鼓励的。
我只是说这篇博文我是随便写的,就网站出现了很多垃圾评论和一些成人内容关键词有感而发~

“幸运的是,在这个充满垃圾和色情的互联网上,有Google这样优秀的搜索引擎”,其实是因为有了Google才会有bot发垃圾评论,外链工厂,和自动采集。如果真的像以前Yahoo那样搞人工index,至少堆砌关键字和垃圾外链效果就不大了。

正是这样。我之前上海盗湾都是有目的的。那天风闻海盗湾复活,就一时兴起点了下它的最新资源。翻了整整7页才出现第一个非pron的资源……

我一年都难得上1024,已经对这个不太感兴趣了,看了新闻,好像是是被GFW攻击了,并且很可能是负责人被控制了的感觉。

必须要求填,这一点上我也是很坚持,另了个原因是我想尽可能的知道是谁在跟我说话和讨论,哪怕那有时候也只是莫名其妙的几个字符。

你是在问如何找到黄色网站吧?
直接到Alexa.com网站去看,全球最著名的成人网站都在那里呢,它们的排名一般都挺高的。
毕竟成人网站在大多数欧美国家是合法的,给成人看也是很正常的一件事。
反而是一些国内站长建的那些黄色网站,太垃圾,满屏广告,并且还可能有病毒。

不能这样说,现实中都充满了垃圾和色情内容。
我们写博客的,坚持原创,减少垃圾制造既可。
我不用Akismet对垃圾评论进行过滤,而是使用WordPress Ajax 评论提交加人工审核,这样的好处可以看这里和这里。
https://www.jinbo123.com/5609.html
https://www.jinbo123.com/4201.html

基本上可以说没有机器留的垃圾评论了,而那些人工垃圾,不好意思,还需要我的人工审核这一关。

因为互联网到目前来说还是一个相对匿名的世界,既然匿名的世界那么就会把很多“匿名者”黑暗的一面展现出来。

Akismet容易产生大量的垃圾,增加数据库体积,我现在是Ajx评论,另外在function.php中添加过滤规则,效果一点不比这个插件弱,另外在设置中添加关键词,基本没有垃圾评论

怎么说呢,确实互联网是个不清净的地方;谷歌是个好孩子,但我时常发现排名靠前的就是百度的相关页面,比如在谷歌搜索土木摊子,给出的首页结果全是“百度搜索土木摊子”、“百度知道搜索坛子”。技术一方面成就了垃圾的传播,一方面又试图减少垃圾。

恩,最好用的搜索引擎。我只是举了个不恰当的栗子。我怀疑百度有作弊,故意从谷歌的某些关键词引流

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注