很久以前就聽說 Google 在研究語音辨識技術,以便讓網友可以用文字搜尋影音檔片段;這兩天這個服務終於出現在 Google Labs 中,叫做 Google Audio Indexing。
手賤馬上玩了一下,介面還滿簡單的。輸入關鍵字後,Google Audio Indexing 會在頁面左邊列出目前影音資料庫中所有含有關鍵字的影音列表,點選其中一個,右側就會秀出影片,下面也列出提到關鍵字的時間和語句,按一下就可以直接播放提到關鍵字的段落。
可能因為目前正在進行米國總統大選之故,可搜尋的影音片段,幾乎都是米國政治人物演說錄影;另外也常遇到根本沒有講到該關鍵字,卻被誤判而列入搜尋結果的例子。只能說語音辨識技術確實難度很高,即使是 Google,現階段也只能做到這樣,不過已經很厲害了。
隨便想了一下這個技術的用途,以現在這個時間點來說,似乎只能讓新聞媒體用來扒糞,證明某某人何時曾經說了什麼,現在卻抵賴不承認,或是某年某月說了什麼下面這樣的屁話之類的。
http://tw.youtube.com/watch?v=pAc_gc3HdRk
這段是用「Taiwan」搜到的歐巴馬在賓州演講的實況,轉到3分14秒處,你會聽到歐巴馬說:數百人失業是因為他們的公司要把工廠整個搬到台灣來,接著就是觀眾的噓聲;講到「Taiwan」時歐巴馬還頓了一下。像這種屁話就可以用 Google Audio Indexing 一口氣全都揪出來 XDDD。
至於未來的發展,大概也有幾點可以預期:
1. 歌詞辨識:現在只能辨識演說,下一步我想是電影或影集;如果哪天連唱歌都可以辨識,就可以馬上搜到歌詞。網頁旁邊當然就有機會賣唱片、賣影片,廣告當然也少不了啦。畢竟 Google 的本質是家廣告公司。
2. 外國語言辨識+自動翻譯:Google Audio Indexing 的說明文件中並沒有提到是否會提供英語之外的辨識服務,不過既然是 Google,當然不可能只做英語區的生意。如果哪一天各國語言的辨識都沒問題了,再結合翻譯引擎,這個力量就不容小覷了。也許某天在看第四台的英語電影時,遇到非英語的劇情(例如米製戰爭片中德軍小兵在聊天),就可以把內容正確翻出,不會出現「外語」這種偷懶到令人生氣的字幕了。
還有什麼新應用?你也可以想一下,在迴響區和大家分享喔!
很棒的服務,謝謝tenz的介紹!
最好是有搬來台灣啦~~~
我在猜歐巴馬那時搞不好分不清楚台灣和泰國,但工廠實際上是去了中國…
Google總是讓人驚喜。
數百人??台灣的影響力還真小,真讓人感到難過…
其實,他們真正要噓的是那家工廠,不要搞錯了呀!!
是說要就讓他們米國舉國公司工廠全搬來台灣,全國都失業是吧?真是好氣魄!
希望馬先生也有這種氣魄,就不會一天到晚挨罵了。