最近多了些奇怪的留言,最新鮮的有 這篇 在回覆 05 年的 Blog 事回顧一文。他這樣寫:
BLOG已經大眾化,民間化。我們每天落班必做的事。
抱住不同的心態,在這虛幻的空間裡暢遊。記錄落每天發生在身邊的點點滴滴事情,等10年過後回味也是件好事
這些留言有這些特點:
- 內容字眼好像相關,但其實文不對題。例如上文,除了「阿媽係女人」的道理外,還有甚麼 10 年啊?
- 留言者的名字怪怪,例如上例的自稱「recycle bag」
- 留言者的網址指向某些商業網站,上例就指向環保袋網站 (我已移除了連結)
很顯然這是 SPAM 留言。然而,我更有興趣的問題是,這些留言是如何產生的?內容可以如此「疑似真人」?究竟是人寫還是機器寫的?
我實在很難想像這是真人到各個 blog 特地對文留言,這樣太沒效率太花成本,所以我想還是機器來的。其方法可能是:先掃描文本找關鍵字,然後再用 blog search 之類找其他相關文章,再抄下這些文章的留言來當成新留言。又或再進一步,用關鍵字眼,建立「範例答案」資料庫,配合使用。
如果真的是這樣子的話,這些 SPAM robot 又真的進步不少了… 希望不是這樣吧?
現在我的做法是先移除連結再看,如果再多其他同類留言,則會刪除。暫時數量不多,只是有些煩,而且我始終不想加 CAPTCHA。況且,如果是真人肉 SPAM,加 CAPTCHA 也沒有效啦…
我近幾個星期大大話話收過二三十個。都是有對應內文的人肉SPAM,留的URL卻指上商業網址。而且往往時短時間內以不同名稍留好幾個留言,但都是用一個DOMAIN NAME留的。
我證實是SPAM後,一律刪除了。
要是撇掉廣告銜接, 此種機器留言用在新浪之類, 倒不失為強力偉哥一劑, BSP或許可以留意一下。想到這段歌詞:
only make believe i love you
only make believe that you love me
others find peace of mind in pretending
couldn't you?
couldn't i?
couldn't we?
講到這, 講一下忍不住想講的題外話, 之前見到你的留言: 「嚇?你點踢我?你唔駛看舖?」, 錯看為: 「嚇?你點錫我?你唔駛看舖?」, 致使我對著電腦發出了一聲: 「哇!!..」
以我所知, 近來真係多o左好多公司做哩d野
大陸有人肉spammer嘛
只要千幾條links就做到幾好排名, 在Yahoo!
所以無辦法啦
應該是人肉 spammer 沒錯
小弟也有收到過兩三個
我近日都中招了﹐ 我的解決辦法是﹕留言不刪﹐不過連結就刪掉~
好在我现在也没有遇到人肉spam,可能我的blog少访问量吧
i am meaninglessly bored
spam you!
by the way this article is mind boggling
is it possible for a spam bot to gain a life of its own?
p.s.
1. 署名 spam bot
2. 擺明 spam 你!
3. 撇開 1 & 2 餘下兩行與其它路過留言幾無異
你如何界定?
請擇一以作答
A. 要是你認為這不是 Spam 請保留之
B. 要是你認為這是 Spam 請刪除之