Google Docs 推出 OCR 文字辨識功能，可自動擷取、轉換 PDF、圖片中的文字！

最近「Google文件」推出了一個新的功能，只要我們在上傳PDF文件檔或圖片時，若勾選「將 PDF 檔案或圖片檔案中的文字轉換為Google 文件」功能的話，在上傳之後，會自動將PDF或圖片中可以辨識的文字擷取出來，並記錄在Google文件中讓我們進一步做編輯。

初步測試，以軟體編製的PDF文件中的文字可以正常抓得到，而且還可支援中文文字辨識，正確率還不錯。不過部分圖片中的文字就無法順利擷取，可能得再多試試看不同樣本。儘管如此，還是相當方便！如果有需要將PDF轉成一般文件來繼續編輯的話，可以上傳到Google Docs網站來試試看。

網站名稱：Google 文件（Google Docs）

網站網址：http://docs.google.com

使用方法：

第1步 開啟並登入Google Docs網站，按一下左上角的「上傳」按鈕。

第2步 先按「請選取要上載的檔案」選取你要上傳的PDF文件檔，然後勾選「將 PDF 檔案或圖片檔案中的文字轉換為Google 文件」這個項目，再按一下「開始上載」，將PDF文件檔上傳到Google Docs網站去。

第3步 上傳完成後，按一下檔案名稱，開啟文件內容。

第4步 如圖，原本儲存在PDF文件中的文字內容已經被擷取出來，並儲存在Google Docs文件中讓我們編輯了。

文字上方還會以圖示的方式附上原本的PDF文件內容，讓我們比對看看有沒錯漏。基本上文字方面的辨識能力還算可以，不過轉換後的排版與版面配置、表格的部份就沒法強求了。

延伸閱讀：

Google Docs 線上簡報檔、PDF文件檢視器

啟用暗藏在Google Chrome中的「PDF閱讀器」外掛

Google小撇步：只找你要的PDF電子書、PowerPoint…等專業文件！

Author: 不來恩

briiancom@gmail.com View all posts by 不來恩

訪客留言：

24 Replies to “Google Docs 推出 OCR 文字辨識功能，可自動擷取、轉換 PDF、圖片中的文字！”

w表示:

07-06, 2010上午 2:30.05

只要pdf裏的中文能解得出來，應該是由於檔案裏面的文字資料被抽取出來，不是OCR…只要試試用中文的圖檔(tiff/jpg/png)就知道。

跟據google的blog，OCR功能現在只支援拉丁語系。

回覆
Leila表示:

07-01, 2010下午 6:09.03

想問問版大有沒有用過〝Google Mapplet API〞
http://code.google.com/intl/zh-TW/apis/maps/documentation/mapplets/index.html
我研究了好幾天…但還是不太了解，希望能幫忙解答^^
我最主要是想建立景點，變成小工具，可供大家觀看！！

回覆
va表示:

06-30, 2010上午 11:12.47

沒有中文介面阿…圖片都不能辨識…..殘念0.0

回覆
匿名訪客表示:

06-24, 2010下午 12:19.13

怎樣轉都轉不出來 = =

是不適掃描文件檔有甚麼要點 ??

另外可否告知一下hp 送的那個軟體叫甚麼名子
一直以來我都是使用一個叫 jocr 的軟體 (免費辨識率不錯操作麻煩了一點 )

回覆
英文好到自己會怕表示:

06-24, 2010上午 10:13.40

我用掃瞄後的pdf檔上傳,一直無法辨識成功,幾個小時了還是”上傳中”???

回覆
test表示:

06-24, 2010上午 8:48.05

剛測試好像只能翻10頁

回覆
匿名訪客表示:

06-23, 2010下午 6:53.32

似乎是不錯的功能…至少讓我們透過網路就可以做轉換使用…不是人人都有hp的

回覆
NA表示:

06-23, 2010下午 4:19.45

不知道為什麼總是遭伺服器拒絕

回覆
echoli表示:

06-23, 2010下午 1:41.27

試了一整天圖片就是辨識不出字來XD
可能需要google說明一下辨識的方式吧

回覆
xdd表示:

06-23, 2010上午 10:17.03

GOOGLE太強了

回覆
路過表示:

06-23, 2010上午 9:00.16

想知道一般使用者
如果是比較私人、內部的文件
敢用google docs的比例有多高
雖然我算g大神的愛用者
不過當他在台灣拍街景時會順便掃wifi基地台的資訊
讓我對這間公司不太放心

雖然我買了android系統的手機
gmail上也早就有我的通訊錄
但是讓g社能夠同時擁有mail -> 手機門號 -> 甚至本名+生日
實在讓我蠻恐懼的
所以我的Android機是用空的gmail帳號
然後完全關掉同步功能

回覆
vinny表示:

06-23, 2010上午 12:19.45

it’s not OCR in my opinion at all. TEXT IN PFD IS TEXT already. Google never mention OCR, right?

回覆
1. leafwind表示:
  
  06-28, 2010下午 5:32.25
  
  Google do mention it. It’s OCR.
  http://docs.google.com/support/bin/answer.py?answer=176692
  
  回覆
  1. Matt表示:
    
    07-11, 2010下午 4:26.05
    
    It should be “Google DOES mention it.”.
xarthur表示:

06-22, 2010下午 9:48.56

不來恩大，
請問要是已經上傳在doc裡面的pdf檔案也可以再轉文字檔嗎?
我找了好久找不到這個選項在哪…

回覆
匿名訪客表示:

06-22, 2010下午 8:57.31

所謂的辨識率還不錯是指？
我總覺得GOOGLE的辨識率會跟ACROBAT自己的辨識率差不多
而且中文的辨識會遠低於英文…

PS目前”個人用過”辨識最高的是HP掃描器附贈的軟體XD

回覆
webber表示:

06-22, 2010下午 5:10.43

請教briian兄，為何你的Giigle Docs介面是中文？
請問有設定的地方嗎？

回覆
1. 不來恩表示:
  
  06-23, 2010上午 11:18.39
  
  一直都是中文啊，google docs本來就有推出中文介面呀…
  
  回覆
2. 奚隹表示:
  
  06-26, 2010下午 1:27.27
  
  http://docs.google.com/?hl=zh_tw
  
  回覆
3. 北方表示:
  
  06-29, 2010下午 6:14.31
  
  在設定選項下拉後，選擇帳戶設定，然後出現DOCS的設定，就可一選擇中文語系了
  
  回覆

重灌狂人

Google Docs 推出 OCR 文字辨識功能，可自動擷取、轉換 PDF、圖片中的文字！

使用方法：

Author: 不來恩

訪客留言：

24 Replies to “Google Docs 推出 OCR 文字辨識功能，可自動擷取、轉換 PDF、圖片中的文字！”

發佈留言取消回覆

使用方法：

Author: 不來恩

訪客留言：

24 Replies to “Google Docs 推出 OCR 文字辨識功能，可自動擷取、轉換 PDF、圖片中的文字！”

發佈留言 取消回覆

發佈留言取消回覆