【東京直擊】Google翻譯揭秘 更似人話 仲學埋Singlish等方言
Google翻譯是一個十分有用的工具,有用到連大部份Google服務都「行人止步」的中國,也「破例」准許內地網民使用。最近於東京舉辦的Google媒體開放日中,Google便展現了在人工智能﹙AI﹚和機器學習(Machine Learning)技術的幫助下,Google 翻譯如何再進化,除了更似「人話」,未來不但圖像可即時翻譯,甚至可以結合耳機,作即時傳譯!
根據 Google 早前的統計,全世界每天進行超過 10 億次的翻譯,每月有超過10 億的活躍使用者,Google亦加快開拓翻譯的版圖,哪怕是英文,機器未來也要弄清「新加坡英語」(Singlish﹚等方言!
Google Brain和Google深度學習及人工智慧研究團隊的領導者Jeff Dean表示,去年以來,Google開始將神經網路用於翻譯中,現在已有有97個語言使用了神經機器翻譯系統﹙Neural Machine Translation﹚技術,令翻譯結果更流暢,準確性也大大提高。
即時圖像和語音翻譯
這也令Google翻譯的使用場景更多,第一個是即時相機翻譯(Word Lens),現在使用者只要拿著手機鏡頭對準部份文字,便可即時翻譯為英文,目前已可支援38種跟英文互譯的語言組合,去旅行時用來翻譯標誌或菜單十分好用。
此外,Google的Pixel Buds耳機可以即時將附近的人說的話翻譯成你選擇的語言,Jeff Dean稱,它令一般人都可以在陌生語言環境中自在漫遊,陌生的語言只需幾秒鐘便能通過耳機翻譯成你的母語。有了它,要去異地旅行或讀書工作,要融入當地環境,相信也會容易得多。
解決「網絡語言不平衡」
除了擴大翻譯的準確度和使用方便度外,Google另一目標是將翻譯支援的語言種類不斷擴大。Google語言研究計畫總經理Linne Ha表示,全球其實有6,000種語言,網路上卻有超過50%都是英文網頁,這樣的不平衡會造成知識資源向某些語言傾斜,但卻令部份地區更難取得知識。
透過更好更快的Google翻譯,不但以弱勢語言設立的網頁可接觸到更多受眾,也可以令更多人願意以弱勢語言設立網頁,解決網絡語言不平衡的問題。Google正透過Google的AI深度學習技術,在持續改善翻譯質量的同時,不斷添加Goolge翻譯支援的新語言,今年能夠辨識的語言便新增了20種。
製作各語言的「平均腔調」
為了讓Google翻譯可幫助到更多的人,Google也發起Unison計畫,為資源較少的語言建立文字轉語音系統,每個語言收集眾多志願者的人聲,每位講45分鐘,大約2,000個常用語,並從中選出10位「人聲」,透過系統處理創造出一個平均的腔調,來製作出該國正式的翻譯語音。
Linne Ha表示,該人聲要既平均,反映出當地人的腔調,又不可完全似一個「真人」,否則在日常使用上易令人困惑。目前Google已經建立孟加拉語、尼泊爾語、高棉語、僧伽羅語、爪哇語等的文字轉語音系統。Linne Ha稱,未來Google翻譯另一目標是方言,因為同是英語,不同方言之間也有不少區別,例如英式英語跟新加坡英語在腔調和用字上也有不同,料Google未來很快便會支援到新加坡英語。