讀一篇舊文,發覺文中連結皆已無效,連結之處是 yahoo news 和 windows live space blog。Yahoo news 應該有定期清文,而 windows live space 則本身已關門大吉。
舊日還說 blogosphere 的時候,愛談三寶:永久連結 (permalink)、RSS 和 pingback。永久連結代表文章獨立地址,是 single source of truth。不過科技迅速萬變,「永久」只是一個理想,BSP 關站 (近例 xanga)、domain 改變、改 blog 軟件等等,皆令連結變得不永久。
例如本 blog 由 MovableType 轉到 WordPress,便有連結改變的問題。幸好 MovableType 產生的是靜態 html,當轉到 WordPress 時文章連結不同了,我便將那些 html 檔抄一份以保持舊連結仍可用 (例如這本 blog 第一個 post),我再稍稍改動 CSS 去掉舊 blog theme,這樣子新舊文章連結共存,舊文連結還算「永久」。
自架平台好處是可自理內容,但其實還有其他因素會影響內容存取。例如有一段時間,我都是用 textile 寫文的,plugin 將 textile 格式換成 html 顯示成網頁。基於支援問題一直想轉 markdown,但轉文章格式又是一番功夫。單單一個技術上的小選擇,已影響原始資料的格式、存取、要考慮未來的支援等等,這都可能會有礙「永久」。
其他與文章相關的東西也難永久,除了文章上的外部連結,還有文章在各社交網的回應、文章的統計等等。我們常說在網上凡走過的必留下痕跡,事實是這些痕跡會淡去,越久越難追蹤。當文章外部連結失效,失掉了寫作時的上下文成了孤島,文章談的是甚麼?回應甚麼?寫作動機?要靠考古和文學分析了?
Wayback Machine 會定期爬網存檔。我想像可以有一個 RSS 服務,接收一條 feed,然後爬文章上的連結,另存成檔 (html 或索性截圖),輸出另一條 feed 將上面的連結替代成存檔位置。不過我想這服務應該很少人會用。
互聯網發展快,事物亦老得快。你記得 gmail、facebook 初時的樣子嗎?若不截圖,那樣子就沒有了,即使 Wayback Machine 也無用,因為要登入。現實中物件慢慢磨損,網絡上卻是快速磨損,我們快速地生產、消化、然後忘記。
可這其實這又麼關係呢?我們這些老派才會想如何 backup 和 restore 自己的 blog 文,有人形容寫 blog 是「筆耕」,blog 是「園地」,意味著需要苦心經營。現在的人都是在社交網絡寫東西上載照片,寫得隨意,也不用苦心。我思疑 facebook 關門的一天,也沒有誰要急著將舊 status backup 甚麼的,就讓一切隨風,很瀟洒是吧。
有點像這個 http://www.webcitation.org/ ?
嗯. 但 webcitation 也要靠大家捐款了.
類似的例如 pinboard 有付費 archive 服務.
但不論如何, 文章裏的 url 斷掉後, 如何更新到 citation/archive 服務也是問題 (手動當然可以, 但有其他方案嗎)
現在FACBOOK咁值錢,股價咁高
很難想像FB會有關門的一天