從 Wayback Machine 打包、收藏網站

Wayback Machine

Internet Archive(網際網路典藏庫)提供的 Wayback Machine(網站時光機)是非常珍貴的網站保存中心,每隔一段時間就會爬全球網站、進行收錄備份。如果你想收藏一些古董或老網站供離線瀏覽,可以用 wayback_machine_downloader 下載備份到自己電腦裡。

環境要求:Ruby,套件安裝與管理:gem

> gem install wayback_machine_downloader

先到 Wayback Machine 網站檢索是否想收藏的網站有被保存下來,並確認其網址是否正確。然後回到終端機:

> wayback_machine_downloader http://site.url.to.backup/

若出現錯誤訊息 400: BAD REQUEST

可能是程式碼太舊有程式庫相容問題,請看這篇討論串。ShiftaDeband 另建分支解決問題了,可以到 https://github.com/ShiftaDeband/wayback-machine-downloader 直接下載整包 Zip,檔名是 wayback-machine-downloader-feature-httpGet.zip。解壓縮後,用終端機指令執行:

> cd wayback-machine-downloader-feature-httpGet/bin

> ruby wayback_machine_downloader http://site.url.to.backup/

因為不是透過 gem 安裝,所以用 ruby 執行。

留言