文章

疑似人肉 SPAM

最近多了些奇怪的留言,最新鮮的有 這篇 在回覆 05 年的 Blog 事回顧一文。他這樣寫:

BLOG已經大眾化,民間化。我們每天落班必做的事。
抱住不同的心態,在這虛幻的空間裡暢遊。記錄落每天發生在身邊的點點滴滴事情,等10年過後回味也是件好事

這些留言有這些特點:

  • 內容字眼好像相關,但其實文不對題。例如上文,除了「阿媽係女人」的道理外,還有甚麼 10 年啊?
  • 留言者的名字怪怪,例如上例的自稱「recycle bag」
  • 留言者的網址指向某些商業網站,上例就指向環保袋網站 (我已移除了連結)

很顯然這是 SPAM 留言。然而,我更有興趣的問題是,這些留言是如何產生的?內容可以如此「疑似真人」?究竟是人寫還是機器寫的?

我實在很難想像這是真人到各個 blog 特地對文留言,這樣太沒效率太花成本,所以我想還是機器來的。其方法可能是:先掃描文本找關鍵字,然後再用 blog search 之類找其他相關文章,再抄下這些文章的留言來當成新留言。又或再進一步,用關鍵字眼,建立「範例答案」資料庫,配合使用。

如果真的是這樣子的話,這些 SPAM robot 又真的進步不少了… 希望不是這樣吧?

現在我的做法是先移除連結再看,如果再多其他同類留言,則會刪除。暫時數量不多,只是有些煩,而且我始終不想加 CAPTCHA。況且,如果是真人肉 SPAM,加 CAPTCHA 也沒有效啦…

回應

  1. 我近幾個星期大大話話收過二三十個。都是有對應內文的人肉SPAM,留的URL卻指上商業網址。而且往往時短時間內以不同名稍留好幾個留言,但都是用一個DOMAIN NAME留的。

    我證實是SPAM後,一律刪除了。

  2. 要是撇掉廣告銜接, 此種機器留言用在新浪之類, 倒不失為強力偉哥一劑, BSP或許可以留意一下。想到這段歌詞:

    only make believe i love you
    only make believe that you love me
    others find peace of mind in pretending
    couldn't you?
    couldn't i?
    couldn't we?

    講到這, 講一下忍不住想講的題外話, 之前見到你的留言: 「嚇?你點踢我?你唔駛看舖?」, 錯看為: 「嚇?你點錫我?你唔駛看舖?」, 致使我對著電腦發出了一聲: 「哇!!..」

  3. 以我所知, 近來真係多o左好多公司做哩d野
    大陸有人肉spammer嘛
    只要千幾條links就做到幾好排名, 在Yahoo!
    所以無辦法啦

  4. i am meaninglessly bored
    spam you!
    by the way this article is mind boggling
    is it possible for a spam bot to gain a life of its own?

    p.s.

    1. 署名 spam bot
    2. 擺明 spam 你!
    3. 撇開 1 & 2 餘下兩行與其它路過留言幾無異

    你如何界定?
    請擇一以作答

    A. 要是你認為這不是 Spam 請保留之
    B. 要是你認為這是 Spam 請刪除之

*