Google Docs 推出 OCR 文字辨識功能,可自動擷取、轉換 PDF、圖片中的文字!

最近「Google文件」推出了一個新的功能,只要我們在上傳PDF文件檔或圖片時,若勾選「 將 PDF 檔案或圖片檔案中的文字轉換為Google 文件」功能的話,在上傳之後,會自動將PDF或圖片中可以辨識的文字擷取出來,並記錄在Google文件中讓我們進一步做編輯。

初步測試,以軟體編製的PDF文件中的文字可以正常抓得到,,

而且還可支援中文文字辨識,正確率還不錯。不過部分圖片中的文字就無法順利擷取,可能得再多試試看不同樣本。儘管如此,還是相當方便!如果有需要將PDF轉成一般文件來繼續編輯的話,可以上傳到Google Docs網站來試試看。

  • 網站名稱:Google 文件(Google Docs)
  • 網站網址:http://docs.google.com
  • 使用方法:

    第1步  開啟並登入Google Docs網站,按一下左上角的「上傳」按鈕。

    01 

     

    第2步  先按「請選取要上載的檔案」選取你要上傳的PDF文件檔,然後勾選「將 PDF 檔案或圖片檔案中的文字轉換為Google 文件」這個項目,再按一下「開始上載」,將PDF文件檔上傳到Google Docs網站去。

    02 

     

    第3步  上傳完成後,按一下檔案名稱,開啟文件內容。

    03 

     

    第4步  如圖,原本儲存在PDF文件中的文字內容已經被擷取出來,並儲存在Google Docs文件中讓我們編輯了。

    文字上方還會以圖示的方式附上原本的PDF文件內容,讓我們比對看看有沒錯漏。 基本上文字方面的辨識能力還算可以,不過轉換後的排版與版面配置、表格的部份就沒法強求了。

    04 

    延伸閱讀:

    1. Google Docs 線上簡報檔、PDF文件檢視器
    2. 啟用暗藏在Google Chrome中的「PDF閱讀器」外掛
    3. Google小撇步:只找你要的PDF電子書、PowerPoint…等專業文件!

    最後更新:07-30, 2013 上午 10:32

    TAG:

    Author: 不來恩

    briiancom@gmail.com

    相關資訊

    訪客留言:

    24 Replies to “Google Docs 推出 OCR 文字辨識功能,可自動擷取、轉換 PDF、圖片中的文字!”

    1. 版大暨各位大大
      我上傳3MB檔案,Google就說檔案太大。 也很有可能是要辨識吧!
      上傳幾次(縮小檔案規模),無論是.jpg或是.pdf都無法辨識。
      可惜了

    2. …還可支援中文文字辨識…

      其實只是把PDF裏面的可選取文字抽取出來的,並沒有使用OCR功能。

      Google裏的OCR辨識,其實只可辨識英文!!

    發佈回覆給「匿名訪客」的留言 取消回覆

    發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *