備份與還原

Friday, March 10, 2006

點算過後,所有 Blog Entries 都完好無缺,不過格式不一,包括:

  • 由開始至 2005年 11 月尾,MovableType 格式和靜態 HTML
  • 由 2005 年 11 月中 到現在, Bloglines 存檔 和 RmailGmail 戶口的備份

之前在測試新版面的時候,有將整個 Blog 下載回來,包括由開始到 2005 年 11 月尾的檔案。大家都知道 MovableType 用的是 page-building 的方法,也就是每一次有新文章的時候,就會產生/更新相關的靜態 HTML 檔,所以 Backup 起上來只要將文章一次過 download 下來就可以了。自己也另外有再以 MovableType 格式 export 出來。

而在 Bloglines 裏找 (選 feed 再 display all items),可找到由 2005 年 11 月中直到現在的文章,大約一百多篇。

在十一月中開始,有開始使用 Rmail 將文章 RSS to Email 地寄到 Gmail,所以也有百多篇存檔。不過 RMail 只會在 Feed 有新文章時寄過來,而如果文章本身更新的話,則不會再寄一份,所以在 Gmail 裏存的都是「初稿」。

而留言方面,也可以從 bloglines 裏取得,但由於其標示日期是發文日期而非留言日期,所以不清楚可以拿回到那一日的留言,不過從內容看應該不多,所以有些網友留言應該已失去了。

想在 RSS feed 拿備份,有一個重點,就是 RSS 必需輸出全文。有關是否輸出全文,之前 Keso 也討論過不少,剛剛 天佑也有提過 ,我想現在有多一個原因為何要輸出全文了。

在這個臨時的 mysinablog 裏,我發覺雖然在 feedburner 裏可以看到全文,但 Rmail 寄來的還只是文章的摘要,那 Backup 起來也沒意思。所以,現在正試用另一個叫 Squeet 的 Rss to Email 服務來做自動備份。

之前那篇「Server 死 Hardisk」裏, Dennis (是不是心藍兄?) 提到:

很多人只為了 backup 而 backup
卻忘了 backup 的原來目的 : 還原!!

很不錯,有很多時以為做了備份一了百了,但如果還原不了,備份也沒有意思。而根據我手頭上有的備份,我可以:

  • MovableType 格式的可以全整還原,因為很多 Blog software 都提供 MovableType 的格式匯入
  • Bloglines 的備份都在一大版的 HTML 裏,如果 Markup schematics 夠簡單的話,應該可以寫個小程式轉到 MovableType 的格式裏頭去,再以此還原。
  • 留言除了人手入外,應該沒有方法了

這幾天會再看看 hosting 公司方便進展如何,一如之前所說,已經有「無得救」的最壞打算了。如果需要重新建立的話,我會順手更新到 WordPress 裏去。

網絡備份

Tuesday, August 9, 2005

net

刻錄事 那裏看到他的 Gmail 最近出現了問題,完全不能存取。他說經此一役後,他要反省對 Gmail 的迷信,要幫自己的重要信件,備份到本機裏。

事實上,要算上來,要備份的又何止是 Gmail ?在這個網絡時代,我們的生活與互聯網關係已非常之密切了。我們的 Blog 、Bookmark 、電郵、圖片等等,全都是放在網上的。而這樣的確為我們帶來了便利,在任何的電腦,只要有一個瀏覽器,我就可以看我常看的 RSS 、查電郵、到討論區、逛 Bookmark 、寫 Blog 等等。除著 Web 2.0 的來臨,瀏覽器的角色已經由單單的「瀏覽」功能,轉化成為一個對互聯網可讀可寫的工具了。

不過,正當我們快樂地使用各家的網絡服務時,也必須要留意到服務商當機的問題。早前 Bloglines 的水喉匠常常走出來,要補這補那,單單是那一段段的 down-time 已令到不少人若有所失了。而那虛驚一場的 Feeds 完全失掉 ,更加令人意識到備份的重要性,免得自己辛辛苦苦所建構的 Blog Roll 清單,一下子消失得無影無踪。

雖然這樣說,但當你在網上搜尋有關「GMail Backup」的字眼時,出來的大都是說,用 Gmail 來為你的資料做一個「網絡備份」,這是基於相信 Google 財洪勢大,有信心其伺服器不會當掉,所以放在 Gmail 的檔理應相當之安全。不過,備份的本意,就是要「複製多一份」以儲存,所以在 Gmail 裏的電郵只得一份,只要 Gmail 一當,大家的資料就失去了。

說備份的基本,你必須可以匯入/匯出你的所有資料,例如 Bloglines 裏你可以將你所有訂閱的 Blog Roll 匯出成為一個 OPML 檔。這樣匯出來,不單單可以做備份,而且為資料帶來了便攜性。如果有另一個支持同樣格式的 RSS Reader ,你大可以帶同你的所有資料轉台 (實際上大部份的 RSS Reader 也支持匯入) 。

各種服務的備份方法不太相同, Bloglines 一類 RSS Readers 可用 OPML 來備份, Gmail 的話你可以用 POP 來留一個 Local copy , del.icio.usFlickr 則沒有直接方法去做備份,要靠第三方工具來做,使備份工作更有難度。

除了備份方法有困難,人的惰性才是最大的難題。在桌面裏的資料,我們或許可以用 Schedule 為個別的資料夾做定時的自動備份,但對於網絡程式,因為備份方法不一,所以也沒有辦法可以定時定候自動備份。如果不是自己自動自覺,就會忘記了。

我想如果這些服務都有個選項,可以定時備份我的資料到一個指定的地方,就已經相當不錯了。

我相信對於網絡服務來說,為用家提供方便有效的備份方法,是很重要的,雖然說服務商本身可能也有定期地備份用者資料,但對於用家來說,始終所有資料都已經不在自己的本機電腦內。不過就現在看來,我們還是要用各種不同的方法,才能成功地備份自己長年累月所儲下來的資料。

備份軟件

Sunday, April 17, 2005

昨天, bloglines 突然之間失靈,萬千 Blog 民進不得其門,與平時的水喉匠修理不同,這次是完全壞了,登入不到。原來 bloglines Database壞 了,幸好資料完好,重啟就沒事了。

經此一役,大家都很擔心自己 Subscribe 開的 Blogroll 一下子沒有了,所以都備份好 OPML,再分散投資到 NewsgatortoPim 等等,以免一舖清袋。

我想起了在 Blog 上, blogger.comMoveableType 都是用產生 Archive Page 的方法,比較保險,即使資料庫沒有了,舊有的文章依然會存在。不過,例如近期比較熱門的 WordPress 就是用 Database driven ,即時拼砌頁面,Publish時速度比較快,改模版也不用整個網站 Rebuild 。不過,如果資料庫壞掉,也沒有辦法。

其實,最主要的,還是大家有做備份的習慣。尤其現在什麼東西都放到網上,好處可以不用理用什麼電腦,只以瀏覽器做介面,就可以取得自己的東西。壞處當然就是壞掉了就沒有了。

不過,又有多少人會定期乖乖備份?

在商業考慮上,可以有 RAID 硬碟做 Mirror ,也可以有 Replication Server 這些東東,而且盡量也不會依靠在外的服務,來處理工作。不過對於個人用戶來說,就似不適宜用這些備份方案,太貴了。

我在想,未來應該有這麼一個簡單的備份軟體,可以幫你上網,查找你常用的服務來備份就好了,又或者服務本身已提供備份基制,定時 Email 一份 Copy 過來也不錯。不過,在這之前,就請大家努力了。