疑似人肉 SPAM

Friday, May 16, 2008

最近多了些奇怪的留言,最新鮮的有 這篇 在回覆 05 年的 Blog 事回顧一文。他這樣寫:

BLOG已經大眾化,民間化。我們每天落班必做的事。
抱住不同的心態,在這虛幻的空間裡暢遊。記錄落每天發生在身邊的點點滴滴事情,等10年過後回味也是件好事

這些留言有這些特點:

  • 內容字眼好像相關,但其實文不對題。例如上文,除了「阿媽係女人」的道理外,還有甚麼 10 年啊?
  • 留言者的名字怪怪,例如上例的自稱「recycle bag」
  • 留言者的網址指向某些商業網站,上例就指向環保袋網站 (我已移除了連結)

很顯然這是 SPAM 留言。然而,我更有興趣的問題是,這些留言是如何產生的?內容可以如此「疑似真人」?究竟是人寫還是機器寫的?

我實在很難想像這是真人到各個 blog 特地對文留言,這樣太沒效率太花成本,所以我想還是機器來的。其方法可能是:先掃描文本找關鍵字,然後再用 blog search 之類找其他相關文章,再抄下這些文章的留言來當成新留言。又或再進一步,用關鍵字眼,建立「範例答案」資料庫,配合使用。

如果真的是這樣子的話,這些 SPAM robot 又真的進步不少了… 希望不是這樣吧?

現在我的做法是先移除連結再看,如果再多其他同類留言,則會刪除。暫時數量不多,只是有些煩,而且我始終不想加 CAPTCHA。況且,如果是真人肉 SPAM,加 CAPTCHA 也沒有效啦…

再談 Twitter

Friday, February 22, 2008

大約在一年前,我寫了一篇 Twitter火熱之謎 ,在文末如是說:

雖然嘗試開了個 Twitter 戶口 ,有時會寫一些心情紀錄,但我認為自己在此上並不會很「活躍」就是了

這句話早就要被推翻了。

事實證明,這一年來,我的 Twitter 使用量不少,可以參考這個 Tweetstats

TweetStats

開始我認為自己不會常用,主要是因為覺得自己不會主動地走入這個網站,登入然後更新,太多步驟了。之所以常用,我認為原因有二:其一是 blog 友們都在用,正如 Facebook 效應一樣。可是,我自己本身雖有 Facebook 戶口,卻甚少登入,為甚麼反而會常常使用 Twitter?因為原因二:工具相助,我大部份的 Tweets 都是在 Twitterfox 發的,因為實在方便,尤其對長開 Firefox 的我來說。

人們除了用 Micro-blog 來形容 Twitter 外,也會說這是 Life-Streaming,一點一滴將生活的經歷,通過短小文字發佈給大家。事實亦證明,這種分享方法,也是有其市場的。更不用說 Twitter 本身具備社交性質,有 飯局 功能,大家可以天南地北,消息也流通得快,最重要的還有那種 「雞犬相聞」的共時感 ,大家都在嘛。

由完全私人的 IM,到半公開的 Twitter,以至全公開的 Blog,我們的發表工具更細分化、專門化。通過通流格式如 RSS 我們可以將各個服務混合 Mashup,公開 API 加上群眾智慧,讓這些應用更多姿多彩。

Twitter 有否影響到在下的 Blogging 活動呢?有。有時是將想說的話,在 Twitter 發洩了,便無「火」再寫 (有人形容為「打飛機」),有時寫作靈感會來自 Twitter 裏大家的對話討論,也有時會將想寫的意念記錄在 Twitter 裏。

越是貼身的工具,用戶越不能忍受當掉沒得用,更何況是 Life-streaming?Twitter 的其中一個痛點是效能問題,往往在高流量的時候死機,例如上一次的 MacWorld。曾幾何時,Twitter 好友說不如跳糟到 Google 背後支持的 Jaiku ,可惜我到現在還未得到 private beta 的登入,看來 Google 只是作戰略性收購了?而 Twitter 的開發人員也在努力解決效能,最近也總算穩定了不少。

也可能花太多時間處理效能問題,所以 Twitter 一年以來幾乎沒有甚麼重大功能更新。當其他對手推出可以儲存圖片、影片、檔案的類似服務時,Twitter 功能始終差不多。然而,我卻很難說得清,現在的 Twitter 在功能是否已經夠用。

Wordpress 升級 2.3 記錄

Wednesday, December 19, 2007

WordPress 升級了做 2.3,安裝容易,但 upgrade plugins 搞一大輪。特此記錄自己做過甚麼,日後有跡可尋也:

有關 Tags:

  • 因為 category 已名存實亡,所以有些 tag 變了跟 category 同字的中文,本來人家的 tag 是全英的…
  • 棄用 UTW 後,template 改用 wordpress 原裝 template tag
  • 為了出有色標籤雲,所以試用了 Simple Tags ,用在 sidebar 和 tag cloud 版面上。額外好處是可以自動在 feed 加入 tag 和 related posts 等資訊。
  • 但單篇顯示 Related Tags 的功能還未找到

有關 Textile:

其實在新版本的 PHP5 上使用舊的 Textile library 會有奇怪問題,例如 list 裏的最後一個 item 不會自己 close tag。我自己本身用的是 Textile Wrapper ,所以只要更換 core 的 textile library 本身就可以了。

現在唯一還有作 Textile 更新的,是 Textpattern 內部使用的 Textile library,所以就試用 Textpatten4.0 裏的 classTextile.php ,不過還是有點問題:做連結時如使用 reference 方法,其值如果是 0 (e.g. "yahoo":0) 的話,就會讀不到。我嘗試更新到 development trunk 的 classTextile.php 還是一樣。

經過一番 debug,發現問題源於 PHP 裏 ‘0’ 是 false 的,所以將這個

	function shelveURL($text)
	{
		if (!$text) return '';
		$ref = md5($text);
		$this->urlshelf[$ref] = $text;
		return 'urlref:'.$ref;
	}

換成

	function shelveURL($text)
	{
		if ($text=='') return '';
		$ref = md5($text);
		$this->urlshelf[$ref] = $text;
		return 'urlref:'.$ref;
	}

就可以了 (已改的檔案: classTextile.php ),已經在 Textpattern forum 作了 通知 ,但這算不算是 bug 我就不知了 。

Blogs in Plain English 中文字幕版

Saturday, December 1, 2007

這次 Common Craft 解釋 甚麼是 Blog 。以下是我翻的中文字幕:

在這個「blog勢」開始走弱的時候,才介紹甚麼是 blog 會不會遲了點呢?我覺得不會,而影片很能講出重點:Blogs 就是提供很多小眾消息以供交流的地方,不會被主流限制,果然 Everything is miscellaneous?

翻譯上「news」這個字不知怎麼譯才好,比較硬生生地譯成「新聞消息」,但我們寫 blog 很少會說自己在寫「新聞消息」吧?至於 blog 我選擇譯成「部落格」,沒有特別原因,只是選一個來用而已。

另外第 48 句:blogs have been adopted in a very big way. 我譯成:部落格都被應用得很廣很大。滿怪的….

大家也可以參與翻譯,上 dotSub 申請登入,選 traditional chinese 就可以編輯了。

blog day 2007

Friday, August 31, 2007

Happy blog day !今年推介這五個:

  • 善用佳軟 – 除了介紹免費軟件外,還有不少的使用心得。
  • 講‧鏟‧片 – 對於港片絕對是愛之深、責之切。
  • 科幻國協在臺辦事處 – 林翰昌是科奇幻撰稿人,最近他的 blog 搬到 blogspot 了,記住 bookmark。
  • 英文由F學起 – 絕對令我獲益良多,對讀音和英文文化有更深入的認識。
  • 自成一格部落黃國 – 好勤力的觀眾!對每齣看過的電影都有很詳細的介紹的感想,還有介紹新片的消息。

由於之前的網誌推介,所以都認識了不少新的 blog,以上有一些就曾經在推介中出現過。

有人說,今年好像很多活躍的寫手都退下來了,但事實上我覺得更多更多人寫 blog 了,越來越廣泛,這是好事。不過,也越來越不夠時間去看去找,在加增加 rss 時總是思前想後,所以也要靠大家多多連結推介了!

Technorati: