Google Docs 推出 OCR 文字辨識功能，可自動擷取、轉換 PDF、圖片中的文字！

最近「Google文件」推出了一個新的功能，只要我們在上傳PDF文件檔或圖片時，若勾選「將 PDF 檔案或圖片檔案中的文字轉換為Google 文件」功能的話，在上傳之後，會自動將PDF或圖片中可以辨識的文字擷取出來，並記錄在Google文件中讓我們進一步做編輯。

初步測試，以軟體編製的PDF文件中的文字可以正常抓得到，而且還可支援中文文字辨識，正確率還不錯。不過部分圖片中的文字就無法順利擷取，可能得再多試試看不同樣本。儘管如此，還是相當方便！如果有需要將PDF轉成一般文件來繼續編輯的話，可以上傳到Google Docs網站來試試看。

網站名稱：Google 文件（Google Docs）

網站網址：http://docs.google.com

第1步 開啟並登入Google Docs網站，按一下左上角的「上傳」按鈕。

第2步 先按「請選取要上載的檔案」選取你要上傳的PDF文件檔，然後勾選「將 PDF 檔案或圖片檔案中的文字轉換為Google 文件」這個項目，再按一下「開始上載」，將PDF文件檔上傳到Google Docs網站去。

第3步 上傳完成後，按一下檔案名稱，開啟文件內容。

第4步 如圖，原本儲存在PDF文件中的文字內容已經被擷取出來，並儲存在Google Docs文件中讓我們編輯了。

文字上方還會以圖示的方式附上原本的PDF文件內容，讓我們比對看看有沒錯漏。基本上文字方面的辨識能力還算可以，不過轉換後的排版與版面配置、表格的部份就沒法強求了。

延伸閱讀：

Google Docs 線上簡報檔、PDF文件檢視器

啟用暗藏在Google Chrome中的「PDF閱讀器」外掛

Google小撇步：只找你要的PDF電子書、PowerPoint…等專業文件！

24 Replies to “Google Docs 推出 OCR 文字辨識功能，可自動擷取、轉換 PDF、圖片中的文字！”

dqwdqwd

系統只能轉換25M以下的檔案

版大暨各位大大
我上傳3MB檔案，Google就說檔案太大。也很有可能是要辨識吧!
上傳幾次(縮小檔案規模)，無論是.jpg或是.pdf都無法辨識。
可惜了

…還可支援中文文字辨識…

其實只是把PDF裏面的可選取文字抽取出來的，並沒有使用OCR功能。

Google裏的OCR辨識，其實只可辨識英文!!

重灌狂人