聽聲辨語-Google新服務:Audio Indexing





Gaudi - taiwan (by tenz1225)

很久以前就聽說 Google 在研究語音辨識技術,以便讓網友可以用文字搜尋影音檔片段;這兩天這個服務終於出現在 Google Labs 中,叫做 Google Audio Indexing

手賤馬上玩了一下,介面還滿簡單的。輸入關鍵字後,Google Audio Indexing 會在頁面左邊列出目前影音資料庫中所有含有關鍵字的影音列表,點選其中一個,右側就會秀出影片,下面也列出提到關鍵字的時間和語句,按一下就可以直接播放提到關鍵字的段落。

可能因為目前正在進行米國總統大選之故,可搜尋的影音片段,幾乎都是米國政治人物演說錄影;另外也常遇到根本沒有講到該關鍵字,卻被誤判而列入搜尋結果的例子。只能說語音辨識技術確實難度很高,即使是 Google,現階段也只能做到這樣,不過已經很厲害了。

隨便想了一下這個技術的用途,以現在這個時間點來說,似乎只能讓新聞媒體用來扒糞,證明某某人何時曾經說了什麼,現在卻抵賴不承認,或是某年某月說了什麼下面這樣的屁話之類的。

http://tw.youtube.com/watch?v=pAc_gc3HdRk
這段是用「Taiwan」搜到的歐巴馬在賓州演講的實況,轉到3分14秒處,你會聽到歐巴馬說:數百人失業是因為他們的公司要把工廠整個搬到台灣來,接著就是觀眾的噓聲;講到「Taiwan」時歐巴馬還頓了一下。像這種屁話就可以用 Google Audio Indexing 一口氣全都揪出來 XDDD。

至於未來的發展,大概也有幾點可以預期:

1. 歌詞辨識:現在只能辨識演說,下一步我想是電影或影集;如果哪天連唱歌都可以辨識,就可以馬上搜到歌詞。網頁旁邊當然就有機會賣唱片、賣影片,廣告當然也少不了啦。畢竟 Google 的本質是家廣告公司。

2. 外國語言辨識+自動翻譯:Google Audio Indexing 的說明文件中並沒有提到是否會提供英語之外的辨識服務,不過既然是 Google,當然不可能只做英語區的生意。如果哪一天各國語言的辨識都沒問題了,再結合翻譯引擎,這個力量就不容小覷了。也許某天在看第四台的英語電影時,遇到非英語的劇情(例如米製戰爭片中德軍小兵在聊天),就可以把內容正確翻出,不會出現「外語」這種偷懶到令人生氣的字幕了。

還有什麼新應用?你也可以想一下,在迴響區和大家分享喔!



馬上按讚,加入「西瓜的滋味」粉絲團!




Facebook討論板

則FB討論

This entry was posted in internet, 媒體思辨, 工作雜記, 試用報告 and tagged , , , . Bookmark the permalink.