「OCR」的原文為「Optical Character Recognition」,中文稱作「文字辨識」,一般我們會將紙本的文件掃描成圖檔,再透過OCR文字辨識軟體將照片或圖片中的文字擷取出來,變成一般TXT純文字檔。
以下介紹的這個Free OCR網站,提供了一個很簡單、方便的文字辨識服務,讓我們直接上傳PDF、JPG、GIF、TIFF或PNG、BMP...等格式的圖檔,,
- 網站名稱:Free OCR
- 網站網址:http://www.free-ocr.com/
- 檔案格式:支援2MB以下的PDF文件與JPG、GIF、TIFF、PNG...與BMP等格式圖檔。
- 語言支援:英文、德文、法文、義大利文荷文、西班牙文(不支援中文)
- 使用限制:盡量是背景單純的圖片較有利於辨識,目前尚不支援版面辨識、轉換功能,若是PDF文件的話,目前只能一頁一頁來處理,或改用其他功能較強大的軟體。
使用方法:
第1步 開啟Free OCR網站,直接按一下〔瀏覽〕按鈕,選取你要辨識的圖片檔或PDF文件(目前只能辨識PDF的第一頁),在「Language」點選正確的語言之後,再按下〔Send file〕按鈕上傳圖檔。
第2步 上傳好圖檔,經過小小一段時間的處理之後,我們可以在「Text recognition result」方框中看到從圖檔裡辨識、擷取出來的文字,雖然版面或辨識結果可能無法盡如人意,不過至少可以省下不少打字的時間。
這網站其實不錯用,只是不支援中文辨識對我們來說就比較用不上囉,但還是個相當方便的工具。
,延伸閱讀: