最近Google實驗室推出了一個很有趣的服務Google Audio Indexing,簡稱為「GAudi」,他可以讓我們直接用文字的方式搜尋哪些人說了哪些話,藉由語音辨識系統將影片中的演講或對話轉成文字記錄下來,然後再把他放到網路上讓大家來搜尋。這是繼前幾天Google開始掃描、收錄舊報紙供大家搜尋之後的另外一個創舉,Google的野心還真不小呀!
由於這個「Audio Indexing」屬於Google Labs實驗室裡面的小規模測試項目,適逢美國總統大選打得火熱,,
- 網站名稱:Google Audio Indexing
- 網站網址:http://labs.google.com/gaudi
下圖是針對Obama先生搜尋「I love You」這個關鍵字的結果,找到了8筆資料。影片中的播放進度列會有個黃色的點,那就是我們所搜尋的關鍵字的所在位置。如果他重複講了很多次「I love You」的話,就會有很多很多個黃色點。
另外我用同樣的關鍵字搜尋McCain,從Google所提供的有限的資料中可以看得出,這位先生似乎很少把愛掛在嘴邊喔?
如果搜尋結果中有重複提到很多次同一個關鍵字,他會把他標出來並把前後文寫在影片下方,我們可以分別點選、播放該段影片,相當方便。
整體來說,這是個很有趣的實驗,滿希望能更擴大的去做,能想像這世界的聲音資料庫是多麼的龐大?包括還沒發明電視、網路之前的留聲機、廣播、錄音機...等等,如果這樣的計畫能夠很準確、很全面的擴大到各種語言去,那對未來人類的影響可能很有得期待了。
,延伸閱讀: