08 脫皮日
Monday, April 7, 2008
今年的 CSS Naked Day 轉到四月九日,原因如下:
- 應在星期二、三或四這些高流量的日子
- 應在四月第一個星期
- 不應在愚人節
- 公佈之前應有五天時間
想參加的到官方網站報名,站上也有相關的 PHP script。
今年的 CSS Naked Day 轉到四月九日,原因如下:
想參加的到官方網站報名,站上也有相關的 PHP script。
〈一〉
跟朋友早前討論過一下在香港推廣 Web Standards 的困難,其一就是出來的成果並不會特別令老闆眼前一亮。你用 table 排版,滿是 presentational tags 的 HTML 所做出來的網頁,並不會因為用了 CSS 和語意「齊整」的 HTML 特別變得好看,看上去可能都是一模一樣。如果老闆只看到結果都是差不多,那為何要改用呢?
使用更好方法和架構,就像練好內功一樣,深藏不露。江湖郎中或許可以一招半式耍得似模似樣,但一到比真的就完全不行。比較醒的老闆,會看得出「成果」不是看表面這麼簡單,網頁的速度、所耗的流量、瀏覽器的支持度、介面的統一性、代碼的管理與維持、改變的影響等等,通通都應該納入考量。
內功練得好,自然能應對更多情況。
〈二〉
Web 2.0 這個字響起後,大家都在看 Web 3.0 ,想法多多,其中有人認為我們將需要更全面的語意網 (Semantic Web)。語意網之建立,在於我們能否將更多「意義」,化為機器可了解和運用的描述,將之利用分析。此為「形容資料的資料」,即後設資料。
然而,這些「意義」由那裏來?大都要靠人作輸入。或許我們可以叫機器嘗試在普通的文件作統計分析,抽出「意義」,但若 AI 未聰明到可以理解,所做的只是有限。
為網絡輸入「意義」,也好像在練功,不過除了為自己,也為了大家。問題是,當用家不能看到甚麼即時的好處,也不會特別神心地輸入。
〈三〉
網絡是資訊泛濫之地,在這裏流通的各種資訊,已大大超越我們所能處理的,因此我們不停地嘗試解決這個問題。其一方法就是加入「意義」,然後讓機器處理。
追源溯流,資訊由何而來?都是由人類而來?機器可不可能產生資訊?
機器產生資訊,可以是工廠式的,但背後以乎一定由人類操縱,資訊來源似乎也必與人類有關。例如,機器讀取股市價格,弄成圖表給大家參考,但股市則是人類活動,而設計圖表的也是人類。但若果要由機器自覺地產生資訊,又關係到 AI 的發展,夠不夠「聰明」。
這個問題,還可以進一步追溯到人類由何而來。早前到朋友寫到關於 智慧設計論 的文章,介紹其中論點,就是認為自然定理不能創造資訊 (Information)。當然,這已超越我所能討論的範圍了。
相關文章: Semantic Web: Where Are The Meaning-Enabled Authoring Tools?
在 Happy Designer 看到原來 @Media 07 會在 香港 搞!日期是 31/5 和 6/1 兩天。一眾 Web Standards 猛人 Dave Shea 、 Molly Holzschlag 、Jeremy Keith 等等都會是主講嘉賓!
在香港這個 Web Standards 荒蕪之地,竟然會舉辦如此盛事,實在令我很意外。莫非是政府宣傳「亞洲國際都會」的形象夠力? (想起上年也是在香港搞 維基年會 的) Zonble 提醒了我,原來人家都這樣說了:
Andy Budd, Molly Holzschlag, Jeremy Keith, and Dave Shea will help to raise the awareness and teach the application of best practices in modern web design in an area of the world that is slightly behind the likes of North America and Europe
就是因為夠「落後」才被人家選上的。其主講內容暫時還未有定好,但已經有好些題目,看上去真的很有「教育」意味呢 (也可能是我主觀了) ,如:
再看一下入場費用如何:Conference only HK$5,000。我自己並沒有參加這類 Conference 的經驗,但對我來說實太貴了… 所以,官方的宣傳用圖片,這個最合我心情了:
相關連結: @Media07
剛剛看畢了 《會思考的機器》 一書,這是一本講人工智能 AI 實際發展的舊書,但最近再版,作者也添架了章節討論比較近期的 AI 趨勢。雖然書本的作者並非 AI 界的人,但她自己走訪不同的人,搜集不同的資料,從不同的角度去看 AI 那剛剛起步的歷史,當中包括對於智慧的理解、實際應用、合成心智的道德等等。
在我們開始發展 AI 時,也是對於人類智慧的一個探險旅程。什麼是理解?什麼是智慧?有什麼條件?等等許多問題,都是有待發掘和研究。如果我們沒有清楚明白「智能」所指的是什麼東西,在發展上可能有如瞎子摸象。有人說近年 AI 發展到了一個瓶頸位置,沒有什麼大突破,可能因為這個摸索期比預期的長的關係。
一個會思考的機器,並不是單單懂得運算和邏輯,當中還涉及大量的背景知識。以前,這許多知識都要靠人自己去輸入到機器裏去,用很專門的格式和方法存取資料。但現在網絡發達,機器人可以靠網絡取得資訊並加以運用,而這關係到 語意網 的發展。
現在的互聯網仍是以人為本的,成千上萬的網頁,文字、圖片、影象等等人類明白的方法呈現和記錄。但對於機器來說,要解讀分析這些文字、圖片、影象,以現有的 AI 技術來說,仍然很困難。所以,我們不能直接向搜尋器問問題,而是要靠用搜尋字眼作模糊的搜索相關資訊,因為機器並非「明白」網頁的內容,而是靠一些統計和評分,與搜尋字眼作計算,然後排列結果。
舊時的網頁,充斥著各種各樣用來描述外表的 Tag,如 font, b, br 等等,為的只是在瀏覽器上給人好看,但實際上對機器毫無意義,而且還會帶來解讀障礙。W3C 推的網頁標準,就是想將內容和表達分開來,以具有語意的 markup 來包著內容,以 CSS 控制外觀。
再進一步,「人類格式」的資料,必需加上足夠的敍述和形容,才可以令機器也可讀,所以有語意網的概念。語意網在我們的內容以上,再加上一層意義的敍述,讓機器也明白內容裏各種資料的架構和關係,從而可以處理這些資料。語意網使用 XML、RDF、OWL 等等為架構,為資料加上機器可讀的輔助。而且這種格式,不只是限制在網頁的應用之上,機器之間也可以使用這些格式來交換和理解資訊。
不過,語意網的發展仍在非常起始的階段,就網頁而言,單單是要由舊時的一個大 HTML 跳到 XHTML + CSS 已經十分困難,RDF、OWL 仍然有待支援,所以在「語意化」的路途上,又有很多不同的變化走了出來。近年冒起了的 Microformats 微格 ,使用 XHTML 為格式,又可以嵌入到現有的網頁上,實現人可讀,機器又可讀的目的。機器可以在網頁裏的微格抓到資料,明白當中意義。正因為微格小巧而精妙,又可溶入現有的網頁,所以漸漸受人關注,被稱為是 Lowercase Semantic Web。
不論如何,語意網在人工智慧的層面來說,是一個很重要的工具。AI 不必設計複雜到完全像人腦一樣,也可以明白資料的架構、意義,並作出處理。使用共同認可的資料格式,機器與機器之間也可以彼此了解,各種系統可以合作,來做更多事情了。
相關連結:
P.S. 事實上,我或許該看英文版的,因為對於很多翻譯的名詞看不太慣,在討論一些比較複雜的理論時看得有點吃力 (雖然看這本書其實不需要有背景知識) 。有時間的話,會再看一次。