垃圾评论来自哪里

自从建了这个blog,先是观察到几乎每天都有来自俄罗斯的浏览量,豆瓣友邻打趣说是被黑产盯上了。也许地区有些扫描IP的程序不断尝试发现新建的站点,毕竟这个站点几乎没人知道。但也不太担心网站被攻击,DDoS我相信腾讯云会防范,退一万步讲,敢在前大流氓脑袋上动土,不会有很好的下场。

继而有莫名其妙的评论。垃圾评论我是见过的,之前架设过论坛,几周不管后就充斥着各种灰色广告,吓的我马上关了站点。

另外有一种神奇的广告术,因为使用自己注册的邮箱群发垃圾广告,很容易被识别,继而屏蔽。识别的技术日新月异,比如基于文本的方法,中文与英文不同,不存在天然的单词,因此分词做的不好,所以让机器理解语言也困难,近年来这样的情况有所改善,中文也逐渐能被机器断句。识别垃圾信息很大一部分就靠文本分析——至少让我来设计系统我会这么做——其他肯定还会考虑原来的IP、使用的设备等等,但文本一定是首要的。

而屏蔽是有代价的,邮件系统没有拦下垃圾邮件问题不大,虽然很烦人,但是问题不大,但是错误拦下了重要邮件就会造成大麻烦,比如读研期间我就没有收到住宿信息的邮件,教务处不知道用了什么神奇的技术让大多数邮箱系统认为它是垃圾邮件。这就是错误拦截的后果,错放1000问题不大,错杀1个的代价可以非常大。

所以邮箱一定是有豁免列表的,一些大厂一定是有豁免权的。所以黑产可以用要骚扰的邮箱在苹果的网站上注册账户,用户名那一长串就是广告,比如我要是这么干就会写“不在工作日8点前以及周末进行房屋装修是做人的基本底线”,于是邮箱的主人会收到一封email,抬头写着“亲爱的‘不在工作日8点前以及周末进行房屋装修是做人的基本底线’,你已经注册了xxxx,请点击下列链接进行验证”。

我的博客的不知名评论也不是这种,是一些非广告的文本,英文拼写偶尔有错误,但大多数是赞美之词——虽然赞美得不到点上,写评论的人一定看不懂我的博客,因为没人任何原文的引用,也没有讨论博文的内容。英文读起来也十分客气,充满距离感。

这是令人生疑的,发评论的肯定不是美国人,因为英文太蹩脚了;也不是中国人,各国的蹩脚英文各有特色,中国的不是这样的。思前想后,不排除是外星人的可能。

Leave a Reply

Your email address will not be published. Required fields are marked *