有朋友问我,为什么要在博客留言栏里填写用户名和邮箱。其实这主要是为了防止互联网上的机器人产生垃圾评论。
在过去四年多的时间里,土木坛子这个网站共产生了30,029条有效评论,与此相应,垃圾过滤插件Akismet为土木坛子成功阻挡了118,686条垃圾评论(准确性为99.41%)。垃圾留言是正常留言的近4倍。
发这些垃圾评论基本上都是一些机器人的成果,估计也是为了SEO留下外链增加目标网站的搜索引擎表现。
通过这个小例子,我觉得互联网上的确充满了垃圾内容。另一个明显的例子是,网络上到处充满了内容采集机器人,直接复制正规网站的内容,甚至采集后东拼西凑,堆砌关键词来获取搜索引擎流量,进而产生广告价值。但这些垃圾内容对人们一点用处都没有。
另外一个现象是网络充满了不少成人内容,这可能缘于人们对成人内容的需求。我记得去年曾关注过好莱坞女星事件,没想到那篇博文一直到现在,每天还有人通过搜索引擎找到它。即使放眼整个网络,早就有报道称,成人流量占全球网络流量的三分之一。
垃圾内容是由于人们对利益的快速追求,成人内容则是人类最基本人性需求。这两点在虚拟的网络上发挥是淋漓尽致。
幸运的是,在这个充满垃圾和成人内容的互联网上,有Google这样优秀的搜索引擎,它能过滤掉大量的垃圾和成人内容,才不至于让互联网沦落到没有用的地步。
“互联网充满了垃圾内容”上的52条回复
这两条推理似乎逻辑性不强:
第一条,Akismet 为你挡掉了很多垃圾评论,这些评论实际上并没有被发出来,以 Akismet 的普及程度来看,世界上一大半博客都是干净的。垃圾链接发不出,SEO 上不去,垃圾站很快就会死了,何以见得网络上垃圾多了?
第二条,我的博客过去一个月里有超过一半的流量来自搜索引擎,目标多数是我之前写的工具类文章,照你这么一推理,App Store 也占了一大半的网站流量呢。
我不过是随便发发牢骚~你们把我的博文当作论文一样来审核了~谢谢了哈。
不得不从潜水状态冒个泡。。。说一句:”总是有这样爱较真的人……”
继续潜水……
认真是我喜欢的,也是应该鼓励的。
我只是说这篇博文我是随便写的,就网站出现了很多垃圾评论和一些成人内容关键词有感而发~
“幸运的是,在这个充满垃圾和色情的互联网上,有Google这样优秀的搜索引擎”,其实是因为有了Google才会有bot发垃圾评论,外链工厂,和自动采集。如果真的像以前Yahoo那样搞人工index,至少堆砌关键字和垃圾外链效果就不大了。
你说的也有道理,好在现在的Google算法识别垃圾内容的效果不错了。
正是这样。我之前上海盗湾都是有目的的。那天风闻海盗湾复活,就一时兴起点了下它的最新资源。翻了整整7页才出现第一个非pron的资源……
真的假的,这么厉害。Alexa排名前100名的也有不少是成人网站。
采集神马的最让人讨厌了……
我总怀疑,采集变成垃圾站真能赚到钱?
早期的互联网经济 说白了就是色情经济啊 不然互联网可能也不会发展那么快
是的,有这个报道,说先进的互联网技术都是被色情网站弄出来的,最原始的趋动力啊。
只有3w条垃圾评论也不算多
哥,你看错了,是3万条正常留言,12万左右的垃圾评论。
好吧,我看错了。12w垃圾评论比较正常。
主要还是有采集软件在扫,扫到了就工具自己贴了,无解的。
刚看了看feedly的订阅,据说 1024 被攻击了,可能永久关闭了……
我一年都难得上1024,已经对这个不太感兴趣了,看了新闻,好像是是被GFW攻击了,并且很可能是负责人被控制了的感觉。
色情流量中98%的都是真实流量,由真实用户产生
赞同!
这个就没有研究了。
色情解放了多少人们的心灵,减少了多少性犯罪!人性的压抑导致社会的暴力。
我同意这个看法,成人网站有不小的积极作用。
必须要求填,这一点上我也是很坚持,另了个原因是我想尽可能的知道是谁在跟我说话和讨论,哪怕那有时候也只是莫名其妙的几个字符。
其实我觉得很容易伪装,比如我知道勺子的邮箱和网址,就可以伪装成勺子。而这些信息都是公开的。
这种事情也只有你才会干的吧~~
事实证明,会无聊到干这事的人极少。
一般都不会这么做,太无聊了
感谢推介插件, 装上试试, 最近几天SPAM好多。
另外求个友链, 已经单向加楼主。
为啥当我真想找点颜色看看时咋就找不到呢?
你是在问如何找到黄色网站吧?
直接到Alexa.com网站去看,全球最著名的成人网站都在那里呢,它们的排名一般都挺高的。
毕竟成人网站在大多数欧美国家是合法的,给成人看也是很正常的一件事。
反而是一些国内站长建的那些黄色网站,太垃圾,满屏广告,并且还可能有病毒。
的确,色情网站推动了视频及带宽的发展~
不能这样说,现实中都充满了垃圾和色情内容。
我们写博客的,坚持原创,减少垃圾制造既可。
我不用Akismet对垃圾评论进行过滤,而是使用WordPress Ajax 评论提交加人工审核,这样的好处可以看这里和这里。
https://www.jinbo123.com/5609.html
https://www.jinbo123.com/4201.html
基本上可以说没有机器留的垃圾评论了,而那些人工垃圾,不好意思,还需要我的人工审核这一关。
我也试过用Ajax,太麻烦了,所以就一直用着Akismet了,我甚至还为它付过费用的。
因为互联网到目前来说还是一个相对匿名的世界,既然匿名的世界那么就会把很多“匿名者”黑暗的一面展现出来。
其实现在的互联网已经有很多不是匿名的东西了,几乎是透明的。
不幸运的是我们用不了谷歌。
用VPN吧,这才是真正的互联网访问必备工具。
垃圾內容真令人討厭。
如果沒有驗證碼或者其他插件阻截,我相信網站會被攻陷。
国内看不到,国内看不到。
国内看不到不代表你看不到。
Akismet容易产生大量的垃圾,增加数据库体积,我现在是Ajx评论,另外在function.php中添加过滤规则,效果一点不比这个插件弱,另外在设置中添加关键词,基本没有垃圾评论
Akismet容易产生大量的垃圾很容易就清除,直接把数据库里相关项删除完事。
我认识一个采集站的站长 , 他说他的网站日IP就在20K以上 .
这要是挂上广告就太可怕了 .
不敢相信,真有这么高?是真实访问量?
怎么说呢,确实互联网是个不清净的地方;谷歌是个好孩子,但我时常发现排名靠前的就是百度的相关页面,比如在谷歌搜索土木摊子,给出的首页结果全是“百度搜索土木摊子”、“百度知道搜索坛子”。技术一方面成就了垃圾的传播,一方面又试图减少垃圾。
土木坛子->土木摊子 🙂
抱歉抱歉,是我疏忽打错字。
哈哈,没事,事实上现在Google你就是搜索土木摊子也一样会出现我的结果。
恩,最好用的搜索引擎。我只是举了个不恰当的栗子。我怀疑百度有作弊,故意从谷歌的某些关键词引流
百度这种没有节操的互联网公司,真有作弊也正常。
站点小到暂时还没有机器人来扫。感觉学东西也一样,得学搜索引擎学会筛选有用信息。
未必如此,机器扫描你的主机,你不一定察觉的。