批次備份BBS看板中的文章,並轉成HTML網頁!(KUSO PTT BBS Board Crawler)

前幾天才介紹過「將BBS郵件轉成HTML網頁檔,備份在自己電腦中」這篇文章,可以幫我們將PTT上的私人郵件備份成HTML網頁檔,想不到隔幾天後,該程式的開發者Kenwu終於又把很久之前就寫好的BBS文章擷取程式給放出來了,有了這個「BBS Board Crawler」程式之後,我們就可以將BBS看板中的文章一次備份到電腦的硬碟中,,

讓自己曾經發表在BBS上的心血與跟其他版友的美好回憶,都可以好好的保存下來。

這軟體算是屬於私人備份用途,該作者以GPL V2釋出,並叮嚀大家不要把它改成類似之前爭議很大的「YouSee柚子」的那種全文搜尋引擎,可能是希望在還沒有完整配套方案出來之前盡量不要貿然行事造成原本BBS的生態造成太大的衝擊。 (對了,「YouSee柚子」BBS搜尋引擎又復活了!)

軟體名稱:KUSO PTT BBS Board Crawler
軟體版本beta 2
官方網站:http://blog.roodo.com/kenwu/
直接下載:下載1  下載2
未修正bug:
          1. 已經盡量不要掉文了, 爬文方式與PCMan下載整篇文章作法不太相同, 但多少會
          2. 不要輸入錯誤的看板名稱, 目前防呆沒有做的非常完善!!
          3. guest 無法正常登入使用, 將於下一個版本修正!!

使用方法:
使用方法其實很簡單,不過抓文過程中必須輸入你的PTT帳號、密碼,如果不放心的話,可以另外申請一個爬文專用帳號來玩玩,不要就直接把你的帳號密碼給打上去了。另外,BBS版的名稱記得得輸入正確的英文,打錯的話會抓不到文章唷。

一、用「BBS Board Crawler」程式擷取BBS文章

第1步  目前該程式僅開放擷取PTT與PTT2兩個BBS站的文章,先用PCMan或其他程式開啟你要擷取文章的看板,然後將看板右上角的版名複製下來如「SuperStarAve」。接著在版面上先找好要從哪一篇文章擷取到哪一篇文章。

01-17-10  

 

第2步   接著在「crawler.exe」檔案上按兩下,開始執行BBS文章擷取功能。接著請依照你要擷取的BBS站,選擇1或2。

01-19-45  

 

第3步  分別在帳號、密碼處輸入你的BBS帳號與密碼,如果不放心可以另外申請個測試用帳戶試試看輸入完畢後按下鍵盤上的〔Enter〕按鍵。接著請輸入剛剛複製下來的BBS看板名稱,如「SuperStarAve」,再按下〔Enter〕。

01-20-52  

 

第4步  接著請分別輸入擷取範圍的文章編號,輸入完成後再按下〔Enter〕。

01-21-10  

 

第5步  如圖,PTT BBS Board Crawler程式便會自動抓取你所指定的範圍中的全部文章,等出現「擷取完畢」的畫面後,表示已經順利完成文章擷取工作。

01-23-47  

 

二、擷取完成的BBS文章畫面

第1步  完成上面的文章擷取工作後,我們可以看到桌面上多出一個名為「ptt.cc」的資料夾,請開啟該資料夾,我們可以看到裡面有一堆「.html」的檔案這些都是BBS的文章,每一個「.html」檔案就是一篇文章。

找到「index.htm」檔案,並用IE瀏覽器開啟,這就是全部文章的索引畫面。

01-28-20  

 

第2步  開啟「index.htm」檔案後,我們可以在每篇文章的篇名上按一下滑鼠左鍵,開啟該文章的內文。

01-29-52  

 

第3步  如圖,原本的BBS版上有啥內容,現在就可以看到啥內容。

01-30-29  

 

第4步  連下面的推文也都有唷!雖然還是有些小小瑕疵,不過已經是太好用囉!對於想要批次備份BBS文章的人來說簡直是天上掉下來的禮物呀!

01-30-32

最後更新:11-03, 2013 下午 5:12

kjbrian

Author: 不來恩

briiancom@gmail.com

相關資訊

訪客留言:

5 Replies to “批次備份BBS看板中的文章,並轉成HTML網頁!(KUSO PTT BBS Board Crawler)”

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *