Jan's Tech Blog

where technologies are annotated

Google Mobile Day – 語音搜尋技術

Vic Gundotra Introducing Voice Search for Mandarin Language

在這次Google Mobile Day發表的語音搜尋雖然早期已經在英語世界推出,但在要把它帶來華語世界也是不容易。而語音搜尋的第一站就是中國大陸。要使用語音搜尋,必須使用Smartphone,例如Google陣營的Android、不少Blogger都擁有的iPhone,又或者是Symbian S60平台,因為用戶需要下載一個App到自己手機。雖然Android是Google陣營的,但在中國推出這服務也沒有優先權,因為Android手機尚未正式登陸中國市場。而且iPhone也只在大陸剛推出,所以為了迎合這市場,也只好先推出S60的Application。至於Windows Mobile,Sorry,暫時未在考慮之列。

安裝了這個語音搜尋的App之後,你就可以對著手機說出要搜尋的關鍵字或句子,然後你就可以在Google的Search Result網頁看到結果。

聽起來很簡單吧?但其實當你對著電話說出要搜的東西時,這個App便會將你的說話變成數碼檔案,繼而壓縮方便傳送到Google的伺服器。在Server Side那邊,Google會進行Voice Recognition,以及分析,剔除噪音,把語音檔案轉成搜尋字串,再送到搜尋器讓它提供搜尋結果。

Google Voice Search App

當中噪音或雜音就是一個大問題。要在這方面做得好,除了要有好的分析軟件外,原來根據Google工程研究所所表簡立峰表示,他們取了三大手機陣營的Microphone之通話樣本作研究。而每次分析大家的說話時,伺服器都會先辨認該段說話是出於那一廠家的Microphone。

Google工程研究所所表簡立峰

另一個重要因素就是數據傳輸。沒錯,當手機的語音搜尋App傳送我們的聲音檔去Google伺服器之前,已經進行壓縮,但要整個過程做得流暢也需要好的連線速度,以及手機要有相當的運算能力,方便壓縮檔案。

問及搜尋那些字串是最難的,簡立峰稱數字就是其中一個例子,因為數字拼出來的字串有很多種變化。而事實上,測試的過程中,有數字的詞句的確是比較不太準確。另外,中英夾雜的字串也是不易進行語音搜尋的。

既然是手機上的搜尋功能,這功能就可加入位置元素。例如你說電影,它知道你在北京,就會顯示北京的電影資料。

Location Awareness Feature of Google Voice Search

未來Google讓會提供SDK給其他人利用這種語音技術開發更各種的Applications。相信其他軟件公司都會相繼開發他們自己版本的語音搜尋,而Google公開SDK可能是最有效的方法保持在這方面的優勢。

相關文章:
Google Mobile Day I – Keynote

Leave a Reply

Your email address will not be published. Required fields are marked *