Google Docs 推出 OCR 文字辨識功能,可自動擷取、轉換 PDF、圖片中的文字!

作者:

最近「Google文件」推出了一個新的功能,只要我們在上傳PDF文件檔或圖片時,若勾選「 將 PDF 檔案或圖片檔案中的文字轉換為Google 文件」功能的話,在上傳之後,會自動將PDF或圖片中可以辨識的文字擷取出來,並記錄在Google文件中讓我們進一步做編輯。

初步測試,以軟體編製的PDF文件中的文字可以正常抓得到,而且還可支援中文文字辨識,正確率還不錯。不過部分圖片中的文字就無法順利擷取,可能得再多試試看不同樣本。儘管如此,還是相當方便!如果有需要將PDF轉成一般文件來繼續編輯的話,可以上傳到Google Docs網站來試試看。


  • 網站名稱:Google 文件(Google Docs)
  • 網站網址:http://docs.google.com
  • 使用方法:

    第1步  開啟並登入Google Docs網站,按一下左上角的「上傳」按鈕。

    01 

     

    第2步  先按「請選取要上載的檔案」選取你要上傳的PDF文件檔,然後勾選「將 PDF 檔案或圖片檔案中的文字轉換為Google 文件」這個項目,再按一下「開始上載」,將PDF文件檔上傳到Google Docs網站去。

    02 

     

    第3步  上傳完成後,按一下檔案名稱,開啟文件內容。

    03 

     

    第4步  如圖,原本儲存在PDF文件中的文字內容已經被擷取出來,並儲存在Google Docs文件中讓我們編輯了。

    文字上方還會以圖示的方式附上原本的PDF文件內容,讓我們比對看看有沒錯漏。 基本上文字方面的辨識能力還算可以,不過轉換後的排版與版面配置、表格的部份就沒法強求了。

    04 

    延伸閱讀:

    1. Google Docs 線上簡報檔、PDF文件檢視器
    2. 啟用暗藏在Google Chrome中的「PDF閱讀器」外掛
    3. Google小撇步:只找你要的PDF電子書、PowerPoint…等專業文件!


    无觅相关文章插件,快速提升流量

    非經授權,請勿全文轉載,本文網址:
    → 免費訂閱最新文章:  (如何訂閱?)
    作者: | 發佈日期: | Tags:
    注意事項:本站所介紹之軟體、設定或網站服務,經實際安裝測試並通過防毒軟體掃毒。但因為不同電腦環境與軟體設定可能都各有差異,建議您僅在非工作用的電腦安裝、測試,避免因為不可預知的錯誤、當機或軟硬體衝突,影響您的工作或電腦運作。另外,在進行任何重要的操作與設定之前,記得先行備份電腦中的重要資料,避免因為未依指示的不當操作或其他疏失造成資料毀損。當您依照本文所提供之訊息執行各種操作,表示您已閱讀此注意事項並同意自行承擔可能之風險與責任。

     

    歡迎留下你的想法或意見...

    1. 過客 說道:

      系統只能轉換25M以下的檔案

    2. 路過 說道:

      版大暨各位大大
      我上傳3MB檔案,Google就說檔案太大。 也很有可能是要辨識吧!
      上傳幾次(縮小檔案規模),無論是.jpg或是.pdf都無法辨識。
      可惜了

    3. !! 說道:

      …還可支援中文文字辨識…

      其實只是把PDF裏面的可選取文字抽取出來的,並沒有使用OCR功能。

      Google裏的OCR辨識,其實只可辨識英文!!

    4. w 說道:

      只要pdf裏的中文能解得出來,應該是由於檔案裏面的文字資料被抽取出來,不是OCR…只要試試用中文的圖檔(tiff/jpg/png)就知道。

      跟據google的blog,OCR功能現在只支援拉丁語系。

    5. Leila 說道:

      想問問版大有沒有用過〝Google Mapplet API〞
      http://code.google.com/intl/zh-TW/apis/maps/documentation/mapplets/index.html
      我研究了好幾天…但還是不太了解,希望能幫忙解答^^
      我最主要是想建立景點,變成小工具,可供大家觀看!!

    6. va 說道:

      沒有中文介面阿…圖片都不能辨識…..殘念0.0

    7. 訪客 說道:

      怎樣轉都轉不出來 = =

      是不適掃描文件檔有甚麼要點 ??

      另外 可否告知一下hp 送的那個軟體叫甚麼名子
      一直以來我都是使用一個叫 jocr 的軟體 (免費辨識率不錯 操作麻煩了一點 )

    8. 英文好到自己會怕 說道:

      我用掃瞄後的pdf檔上傳,一直無法辨識成功,幾個小時了還是"上傳中"???

    發表迴響

    你的電子郵件位址並不會被公開。

    你可以使用這些 HTML 標籤與屬性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>