重灌狂人

Google Docs 推出 OCR 文字辨識功能,可自動擷取、轉換 PDF、圖片中的文字!

最近「Google文件」推出了一個新的功能,只要我們在上傳PDF文件檔或圖片時,若勾選「 將 PDF 檔案或圖片檔案中的文字轉換為Google 文件」功能的話,在上傳之後,會自動將PDF或圖片中可以辨識的文字擷取出來,並記錄在Google文件中讓我們進一步做編輯。

初步測試,以軟體編製的PDF文件中的文字可以正常抓得到,,

而且還可支援中文文字辨識,正確率還不錯。不過部分圖片中的文字就無法順利擷取,可能得再多試試看不同樣本。儘管如此,還是相當方便!如果有需要將PDF轉成一般文件來繼續編輯的話,可以上傳到Google Docs網站來試試看。

  • 網站名稱:Google 文件(Google Docs)
  • 網站網址:http://docs.google.com
  • 使用方法:

    第1步  開啟並登入Google Docs網站,按一下左上角的「上傳」按鈕。

    01 

     

    第2步  先按「請選取要上載的檔案」選取你要上傳的PDF文件檔,然後勾選「將 PDF 檔案或圖片檔案中的文字轉換為Google 文件」這個項目,再按一下「開始上載」,將PDF文件檔上傳到Google Docs網站去。

    02 

     

    第3步  上傳完成後,按一下檔案名稱,開啟文件內容。

    03 

     

    第4步  如圖,原本儲存在PDF文件中的文字內容已經被擷取出來,並儲存在Google Docs文件中讓我們編輯了。

    文字上方還會以圖示的方式附上原本的PDF文件內容,讓我們比對看看有沒錯漏。 基本上文字方面的辨識能力還算可以,不過轉換後的排版與版面配置、表格的部份就沒法強求了。

    04 

    延伸閱讀:

    1. Google Docs 線上簡報檔、PDF文件檢視器
    2. 啟用暗藏在Google Chrome中的「PDF閱讀器」外掛
    3. Google小撇步:只找你要的PDF電子書、PowerPoint…等專業文件!
    Exit mobile version