前幾天才介紹過「將BBS郵件轉成HTML網頁檔,備份在自己電腦中」這篇文章,可以幫我們將PTT上的私人郵件備份成HTML網頁檔,想不到隔幾天後,該程式的開發者Kenwu終於又把很久之前就寫好的BBS文章擷取程式給放出來了,有了這個「BBS Board Crawler」程式之後,我們就可以將BBS看板中的文章一次備份到電腦的硬碟中,,
這軟體算是屬於私人備份用途,該作者以GPL V2釋出,並叮嚀大家不要把它改成類似之前爭議很大的「YouSee柚子」的那種全文搜尋引擎,可能是希望在還沒有完整配套方案出來之前,盡量不要貿然行事造成原本BBS的生態造成太大的衝擊。 (對了,「YouSee柚子」BBS搜尋引擎又復活了!)
軟體名稱:KUSO PTT BBS Board Crawler
軟體版本:beta 2
官方網站:http://blog.roodo.com/kenwu/
直接下載:下載1 下載2
未修正bug:
1. 已經盡量不要掉文了, 爬文方式與PCMan下載整篇文章作法不太相同, 但多少會
2. 不要輸入錯誤的看板名稱, 目前防呆沒有做的非常完善!!
3. guest 無法正常登入使用, 將於下一個版本修正!!
使用方法:
使用方法其實很簡單,不過抓文過程中必須輸入你的PTT帳號、密碼,如果不放心的話,可以另外申請一個爬文專用帳號來玩玩,不要就直接把你的帳號密碼給打上去了。另外,BBS版的名稱記得得輸入正確的英文,打錯的話會抓不到文章唷。
一、用「BBS Board Crawler」程式擷取BBS文章
第1步 目前該程式僅開放擷取PTT與PTT2兩個BBS站的文章,先用PCMan或其他程式開啟你要擷取文章的看板,然後將看板右上角的版名複製下來,如「SuperStarAve」。接著在版面上先找好要從哪一篇文章擷取到哪一篇文章。
第2步 接著在「crawler.exe」檔案上按兩下,開始執行BBS文章擷取功能。接著請依照你要擷取的BBS站,選擇1或2。
第3步 分別在帳號、密碼處輸入你的BBS帳號與密碼,如果不放心可以另外申請個測試用帳戶試試看。輸入完畢後按下鍵盤上的〔Enter〕按鍵。接著請輸入剛剛複製下來的BBS看板名稱,如「SuperStarAve」,再按下〔Enter〕。
第4步 接著請分別輸入擷取範圍的文章編號,輸入完成後再按下〔Enter〕。
第5步 如圖,PTT BBS Board Crawler程式便會自動抓取你所指定的範圍中的全部文章,等出現「擷取完畢」的畫面後,表示已經順利完成文章擷取工作。
二、擷取完成的BBS文章畫面
第1步 完成上面的文章擷取工作後,我們可以看到桌面上多出一個名為「ptt.cc」的資料夾,請開啟該資料夾,我們可以看到裡面有一堆「.html」的檔案,這些都是BBS的文章,每一個「.html」檔案就是一篇文章。
找到「index.htm」檔案,並用IE瀏覽器開啟,這就是全部文章的索引畫面。
第2步 開啟「index.htm」檔案後,我們可以在每篇文章的篇名上按一下滑鼠左鍵,開啟該文章的內文。
第3步 如圖,原本的BBS版上有啥內容,現在就可以看到啥內容。
第4步 連下面的推文也都有唷!雖然還是有些小小瑕疵,不過已經是太好用囉!對於想要批次備份BBS文章的人來說,簡直是天上掉下來的禮物呀!
,