電腦生命天演論

Thursday, June 3, 2010

說到機器智慧一事,有一班人努力研究,如何讓現有的機器表現出有智慧?他們設想的機器,會像人一樣,擁有獨立的身頭腦,可以與人交流,活脫就是另一「種族」的人類,但卻又擁有機器高速運算、邏輯準確、執行無誤的優點。而另一班人,則想我們的大腦由個別神經元組成,每個運算能力不高,但將他們組合起來形成網絡之後,便會產生智慧。而 《電腦生命天演論》 談的就是這個觀點。

不過本書並不算很理論,反而像歷史書,將這種分散式的機器發展史娓娓道來。說到利維坦、依拉士摩(達爾文祖父)、萊布尼茲、圖靈、馮鈕曼等等,以及其他在歷史上不出名的學者,原來都已經預見了機器發展,應為分散、平行、網絡化。作者認為,現在的電腦因馮鈕曼架構之盛行,反而忽略研究這些面向。

可是這種「電腦」又是如何運作呢?在這一點上卻是玄之又玄,大概因為太過複雜,未能參透。正如神經元不識大腦意識,我們也只能見樹不見林。

本書並不新,成書之時大概網絡沒有現在這樣發達,但卻可以聞到一點語意網 (Semantic Web) 的氣味。隨著網絡和機器智能的提升,整體網絡將越發聰明,可以為使用者提供很多相關的資訊、建議、配對等等。

然而,這整體網絡是有意識的嗎?會思考嗎?是有智慧的嗎?於我們來說有何意義?我們該如何待之?本書也沒有答案,作者只是提供線索,預視未來人機共生網絡的發展,似乎是無可避免的。又或者,我們其實早已身在廬山中。

相關連結: 《電腦生命天演論》記疏

Like

Thursday, April 29, 2010

like

日前讀報,說賑災節說「分享」其實不敬,因為「享」的是歡樂,可災難不是甚麼值得歡樂的事,應用「分担/分憂」等字眼。

這明顯是個曲型英譯中問題,皆因 Share 是中性的,英文可寫 Share the joy、Share the burden 等。但當 Share 變成中文,則通通變成「分享」了。 (問:有何正確中文翻譯?)

似曾相識,現在我們在網上,也只可以 Like 和 Dislike,一按即通,沒有解釋餘地。那管你其實是關注、關心、分享、分憂、好奇、喜愛、討厭、期待… 一眾網主也寬心了,因為只有讚好呢!

相關閱讀: 陳雲讀馬林諾夫

網絡的故事

Wednesday, April 28, 2010

故事是這樣的:最初,網絡是一片混沌的文件海,各自連結各自組織。

人們說:來一點秩序吧!所以就有了搜尋引擎:分類的、排名的,各有特色。後來,Google 發明了 Pagerank,可在茫茫網海裏輕易找到有用和相關的資料,就此一統文件海,人人愛用。在這裏,是以文件為本。Google 在這其上賣廣告,快速地壯大起來。

另一方面,Facebook 看中了人們的社交需要,創生了另一個不以文件為本,而是以人為本的網絡,自成一角的私人網絡。我們將人際網絡交予 Facebook,跟朋友取得更緊密的聯繫。人們在 Facebook 上約人、分享相薄、建立粉絲頁、玩遊戲,也會將文件海的連結傳過來分享。Facebook 也在這個平台賣廣告,也日益壯大起來。

然後 Twitter 來了,她站在公開與私人之間,只做一件最簡單的事:發出 140 個字限的訊息。人們從文件海貼連結發訊分享消息。人們每發訊,就是一個小型的廣播,不過只廣播給追隨者,然後追隨者再廣播給追隨者,如此類推。在此,訊息短小精悍,容易消化,傳播極快速。意外地,在 Twitter 裏,訊息雖海量,但卻不時有重要訊息出現,也與世界一起實時變化。原因大概是 Twitter 夠簡單,人們只專心收訊發訊,不用噓寒問暖玩遊戲,以分享為本。Twitter 明白這些實時訊息很重要,也就加入搜尋技術,也開始嘗試在上面賣廣告了。

Google 看見 Twitter、Facebook,原來以人為單位的網絡更有用,心想為服務加入社交元素,所以搞了 Buzz。可是原來這些年來,人們已習慣分開社交網與現實人際網,所以電郵聯絡網絡,並不等於那個社交網,所以很多人對 Buzz 的設定很不滿,覺得他們在曝露私隱。

Facebook 看見 Twitter 的成功,也想 Facebook 總不能只顧在內家家酒,要擴展去公共領域,所以她們對用戶說「私穩不再是社交之常」,她們以個人化之名,使公眾更易取得用戶資料。她們簡化版面成為一道資訊河流,想令人們更專心地交流資訊。她們想吸納公共文件海的資訊,所鼓勵網站加入更多機器可讀的描述、加入「讚」的按鈕,令任何網絡文件成為一件 social object。這亦間接推動了語意網的建成。

Twitter 也有野心,但相對保守。她們在多年後的今天推出官方的用戶端。她們更新了 API,使人們更容易在網站加入 Twitter 功能。她們容許通過註解儲存超過 140 字的訊息,不過她們也許並未忘記其她們是如何走來,所以並沒有限制註解的格式,任由第三方開發以此發展,正如 retweet、hashtag 等功能。

雖然我很樂於現狀使用 Google、Twitter、Facebook 作不同的事,但故事還是會發展下去。她們會繼續互相合作、互相競爭,互相學習,至死方休。只有廣告商,仍是無處不在。

Google 真心膠?

Wednesday, March 24, 2010

本來也不太相信。

你總得認為,Google 這麼大的一間公司,這麼多人,這麼多個腦袋,總不會那麼傻那麼天真放棄中國市場吧?總有些陰謀甚麼的?是談判籌碼吧?

結果經過多個月斷斷續續的談判消息、國家介入,今天 g.cn 的交通正式導向 google.com.hk,亦即是說國內的搜尋服務算是正式完結。原來,他們是玩真的,是「真心膠」(若指退出中國就是「膠」的話)。

更令我相信他們是真心膠,是因為早前的 Buzz 事件。Google 興高采烈向大家宣佈,我們有個新玩意叫 Buzz,是類似 Twitter、Facebook 的 social network 玩意,明天就會在大家的 Gmail 上見到了!結果 Buzz 一推出,因為太聰明地使用大家的聯絡人資料,而引至嚴重的私隱問題。

這一事件的特別之處,在於其推行得相當快速。沒有經過 Gmail labs、沒有公開給小部份公眾,就這樣出台了。據說主要原因,是因為 Google 的 CEO 也有用 Buzz,覺得很好用,所以就很快地推出了。在這裏,你可見 Google 內部其實非常「行政主導」。

我們通常可以用一個人格來代表一個群體,而 Google 壓根兒就是一個工程師的人格:對於技術非常熱愛,深信科技能改善人類生活,深信不作惡,深信網絡的開放、自由、流通就是一切。工程師不喜歡複雜的政治、鬥爭,不愛受壓的環境下工作。而有時也會很一廂情願地為用戶作決定,而缺乏對人的關懷,因為科技至上。

而正因為 Google 如此「行政主導」,這人格更是顯明,所以你便看得見那些 Do no evil 的口號,將大部份服務免費,將大部份產品 Open source,以天價收購其他公司等等這些常人視為蝕本的生意。一切皆因那強烈的工程師人格。

這樣好嗎?未必。始終瘋狂科學家的科幻故事,我們看得太多了。

喂,你這麼就以為 Google 是真心膠?太天真了吧?當中肯定甚麼葫蘆賣甚麼藥!不好意思,因為在下本身,多少也有點工程師人格。

談 Retweet

Thursday, November 12, 2009

Twitter 裏其中讓消息流傳得最快的,是一項叫 Retweet (RT) 的發文格式 (華文網友稱此做「回推」或「銳推」,也譯得精妙),這個格式並非由官方發明,而是由用家們自行衍生出來。通常就是看到其他人的 Tweet,覺得很值得將這個 Tweet 回傳下去,就會用「RT @user: xxxxx」的格式發一個 Tweet。很多的 Twitter Client 也支持這種格式,所以只消幾個按鈕就可以 RT 了。

RT 成為 Twitter 的重要資訊,在茫茫 Tweet 流中更顯重要。它讓重要的訊息能自我增幅,在網絡遊走散佈,傳播力強,只消幾個 RT 訊息能傳到很多人那裏。通過分析 RT,亦能看到有甚麼訊息最流行,最多人談論 ,哪些人是意見領袖等等。配合 Twitter 的實時架構,我們竟然真能一竀網絡正在發生甚麼事,而不至於在資訊洪流中無奈地淹沒。RT 也使 Twitter 有別於其他如 Plurk、Facebook 的社交網絡。

Twitter 的 140 字短小精桿的特質,有利小單位訊息靈活遊走,但也成為 RT 的硬傷。同一段訊息幾經 RT 後,其首段會變成一串「 RT @user1: RT @user2: RT @user3… 」,若從資訊結構分析,這些都是原來訊息的元數據 (metadata),記述了 RT 足跡。問題是這些元數據佔了字數,令原來訊息不夠位置放。用家往往在 RT 時發覺超過了字數限制,就得修輯訊息,可能是修改 RT 串,也可能將原 Tweet 修短,兩者也帶來訊息流失。再者,因為 RT 的運作是基於最簡單的 copy and paste,所以也不能保證原 Tweet 沒有被人修改。而即使被人修改了,也難以追踪。另外也有其他如 RT 洗版、濫用等問題。

官方 Twitter 也察覺到 RT 的重要性,會正式支持 RT 功能。他們明白現行「人手 RT」(他們稱為organic retweet) 方法會令數據紛亂,所以官方 RT 會:

  • 確保原 Tweet 不會被修改
  • 將 RT 足跡這些元數據分開來儲存,並隱藏起來
  • 確保同一條 RT 不會在用戶 timeline 上重複出現
  • 讓用戶可關閉某人的 RT

這樣子,被 RT 的訊息就有了一個明確的身份,而不是成千成百的變種。資料被結構化後,確保了 RT 的原汁原味之餘,也留有明確的足跡,更易追踪。在這裏,可以更準確抽出有趣的統計資料,如最多人 RT 的訊息、被 RT 最多的人等等。另外,官方 RT 也避免了重複和垃圾的問題。

雖然如此,這官方 RT 卻不支持「留言」。用戶在人手 RT 時,有時會加上自己小小的意見再發出去。而官方 RT 因為沒有修改這回事,所以也不能新加留言。在此官方發言說,即使新 RT 出台,用戶仍可使用人手 RT 方法來傳遞訊息。這意味著未來在 Twitter 裏,我們會看到新舊兩隻格式的 RT 互相混搭 (如用官方 RT 接續一條人手 RT)。第三方開發固然可以由官方 RT 提取更準確的資料,但也似乎不能放棄字串分析舊有人手 RT 資料。而其他 Twitter 用戶端又會如何實作這個新 RT 功能?讓新舊格式並存?用戶會不會搞亂?會多人使用新 RT 功能嗎?

這個新 RT 方案,可算是 Twitter 誕生以來最大的改動,也可見 Twitter 的野心,一心想將 RT 機制完美化,使得來的資料更有用。試想 RT 其實就是類似一人一票的訊息推薦,換做 Google 的話效果近似於 Pagerank。為了「完美」,Twitter 也不惜要改變用戶習慣,使他們 timeline 出現陌生人,也沒有得留言。在新舊格式同樣通行的情況下,新 RT 會帶來新境象,還是破壞了 Twitter 的精簡「傳統」,產生混亂?

相關資料: Why Retweet works the way it does