文章

開卷筆記 – 數位麵包屑裡的各種好主意

social_physics

數位麵包屑指的是我們使用數位工具所留下的「痕跡」,現在人們視這些數據如珍寶,成為了大數據。本書的英文書名是 Social Physics,社會物理學,依靠收集大數據為基礎,分析我們的社交模式。作者是 MIT 實驗室主任,主要研究意念流 (idea flow) 與我們社會的關係。

快思慢想與意念流

對於人的群體規律,很早就有人提出過,不過近年大數據下才有更長足的發展,電腦效能夠強大去分析海量資料。而近年的心理學的發展,也能較準確地將人類行為模型化。書裏理論主要使用「快思慢想」模型。在古典經濟學人是理性動物,依此模型得出的資本主義社會固然有令我們進步,但也令我們陷入困境。人人自利的假設,缺乏社群元素,在這個越來越連結的世界,便更顯得落後。作者提出以「意念流」作為社會創新與進步的參考指標,在書中好些例子也確見單單改善意念流(而不用真的了解細節)是有效益的。

意念要流暢,並不是連結越多越好的。連結太少自然沒有交流,但連結太多會有回音室效應,聽來聽去都是近似的意見,沒有探索到新意念,遑論創新。依據「快思慢想」的模型,作者的意念流理論裏有兩種形態:慢想式的探索和快思式的參與。在探索時,我們看到新的事物,並以開放態度對待之,思量當中利弊,這其中的意念傳播是快的。但若意念要落實到群體上,則需要社群同儕互相影響,通過社會性學習,即由觀察他人或體驗而學習新的行為、策略,將新意念變成社會規範,潛移默化為我們的習慣,也就是快思系統作用之處。

這裏一個很重要的概念,是基於快思慢想的研究,我們日常生活大部份都由快思管轄,而快思的特點就是比較直觀直覺、快速、並發、自動,這是使得其能夠模型化原因。Dan Ariely 一書的名字《Predictably Irrational》正好點出這特點,可預測可模型化,這是社會物理學之所以可能之原因。相對來說,慢想與我們的信念和價值有關,是難以模型化的。

改善社群

能夠量度的東西才能夠管理,如何取得這些社交訊號呢?作者研究裏使用一種社會計量識別牌,可掛在脖子,內含位置感測、加速計(記肢體動作)、距離感測、麥克風(記講話時間但不錄音),可測量群體的探索和參與數據,也可測量個人的能量水準、外向程度、同理心、節奏等等。另外一個手機應用,則除了記時地人等數據外,還可以記錄諸如通訊、瀏覽記錄等等。

在取得這些數據後將之視覺化亦是重要一步,這樣管理層就能容易看到公司內的意念流動情況,進而改善。書中有一例子就是經過測量後見某些部們跟其他交流不足,而單單只是改動工作位置,使不常見面的有機會見面,就有了效益。在此改善意念流並非一定是大搞交流會,而是從日常細節入手,看工作空間、動線等等,因為意念流通通常發生在非正式場所。

在尋找意念之處,傳統會用金錢誘因作競爭,在了解意念流後,就可以引入社群誘因。例如作者團隊參加一個尋找氣球的比賽,除了奬勵發現者,也奬勵引薦人,使得他們極快找到氣球。另一用是社會壓力,例如若鄰居能達到某節能標準,則奬勵該居民,這能有效地在社居內推行節能。

數據權

大數據必然會有私隱問題,在此作者提出「資料新政」,人人都對自己的資料有佔有權、控制使用權和處分權。這些權利使得我們可以全權控制個人資料在政府和企業間的運用,而當發現有問題時可以完全清除資料。這不能單單只立法,還要配合相對的技術,例如使用信任網絡分享資料,第三方要在我們首肯下才可存取信任網絡。

要做出這樣的操作,資料必需具可追蹤性,有人會覺得會失去網絡的匿名性。不過轉過來看,即使你完全匿名地操作,大數據分析仍然可以找出相似的模式而辨認某連串操作可能是同一人所為,倒不如就此認領自己的資料權,令自己對資料可收可放。

當然電腦操作是眼不見的,我們如何可以有信心這些政策有確切落實?正如 Lawrence Lessig 名言「Code is law」,程式依法執行這些繁瑣的資料操作至為緊要。這方面我們似乎對程式品質、資料用途等等要有更確切驗證。

這個人數據權可以再引伸下去,之前讀 Jaron Lanier 《Who owns the future?》便提出我們分享的這些資料更是理應收費。君不見網站併購天文數字,真的因為數十名價值員工?非也,他們買的是我們的資料,再用大數據分析得利。資料收費能將這嚴重不對稱的收入重新分配回人們身上。某公司因為你的數據而鑽研出新的算法,便應該分一點錢給你。在此需要兩個運作條件:其一是上述的資料可追蹤性,其二是電腦化的微型交易。

模型的成長

從數據中找到模型、應用模型,能幫助我們建設美好社會,這種操作已開始像阿西莫夫的心理史學,然而心理史學有一定假設,這假設若然在某些情況下不成立,我們便得有所取捨,修正模型,甚至找更好的模型。科技發展在如此速度下,模型的時效性會變得怎樣?一個模型又如何可以自我更新和成長?

作者研究的模型因為基於快思系統,所以理應是相對穩定的。面對網絡不停改變我們生活的時間和空間,我們似乎更需要數據去反覆修正模型。

    Mentions

  • 💬 開卷筆記 - 認識媒體:人的延伸

*