Google Audio Indexing 連「聲音」都能直接搜尋! (人講的話)

最近Google實驗室推出了一個很有趣的服務Google Audio Indexing,簡稱為「GAudi」,他可以讓我們直接用文字的方式搜尋哪些人說了哪些話,藉由語音辨識系統將影片中的演講或對話轉成文字記錄下來,然後再把他放到網路上讓大家來搜尋。這是繼前幾天Google開始掃描、收錄舊報紙供大家搜尋之後的另外一個創舉,Google的野心還真不小呀!

由於這個「Audio Indexing」屬於Google Labs實驗室裡面的小規模測試項目,適逢美國總統大選打得火熱,目前只提供跟美國政治、選舉相關的影片索引資訊,也就是說只能搜尋少部份美國政治人物與歐巴馬(Obama)、麥坎(McCain)等人的相關影片,當然目前也只能搜尋影片中有「」到的英文,打中文字進去是搜尋不到東西的。

 

下圖是針對Obama先生搜尋「I love You」這個關鍵字的結果,找到了8筆資料。影片中的播放進度列會有個黃色的點,那就是我們所搜尋的關鍵字的所在位置。如果他重複講了很多次「I love You」的話,就會有很多很多個黃色點。

GoogleAudioIndexing-01

 

另外我用同樣的關鍵字搜尋McCain,從Google所提供的有限的資料中可以看得出,這位先生似乎很少把愛掛在嘴邊喔?

GoogleAudioIndexing-02

 

如果搜尋結果中有重複提到很多次同一個關鍵字,他會把他標出來並把前後文寫在影片下方,我們可以分別點選、播放該段影片,相當方便。

GoogleAudioIndexing-03

 

整體來說,這是個很有趣的實驗,滿希望能更擴大的去做,能想像這世界的聲音資料庫是多麼的龐大?包括還沒發明電視、網路之前的留聲機、廣播、錄音機...等等,如果這樣的計畫能夠很準確、很全面的擴大到各種語言去,那對未來人類的影響可能很有得期待了。

 

延伸閱讀:

相關資訊
訪客留言

8 則回應

  1. 其實我一直有個困擾,就是我知道某一段旋律,但是不知道它的名稱,也就沒辦法去找到此旋律的音源(檔案或CD),不知道Google能不能做到這種搜尋…