生活 網路 軟體

藉機器學習精進翻譯 Google:同步口譯為終極發展

上週宣布更新諸多功能的Google翻譯服務,在Google I/O 2016正式展開之前針對此次更新內容做說明,同時也強調其中借助機器學習資源讓翻譯品質更為流暢。但就現行發展情況來看,Google翻譯軟體工程師Otavio Good表示雖然暫時還沒有辦法實現即時精準的同步口譯,仍會持續透過大量數據比對學習方式,讓系統在更具體理解語意之下讓翻譯品質提昇。

, 藉機器學習精進翻譯 Google:同步口譯為終極發展, mashdigi-科技、新品、趣聞、趨勢

近期Google讓旗下人工智慧系統閱讀超過2865部愛情小說,並且以全新類神經網絡模型分析超過1萬2000本電子書籍,藉此訓練人工智慧系統對語言更具體理解,同時能以更具情感方式詮釋所理解內容,並且讓語言表達結構更為完整,而非僅只是隻字片句,甚至出現語意不通順情況。

而配合這樣的訓練之餘,是否能連帶讓Google翻譯品質進一步做提昇,Google翻譯軟體工程師Otavio Good表示在比對資料持續增加情況下,確實有助於翻譯結果呈現品質精進,但以目前Google翻譯所能呈現效果其實依然有限,主因在於包含中文在內的亞洲語系結構與英語系語言明顯不同,加上目前Google翻譯運作設計均以英語為基礎進行轉換,將中文與歐系語言互譯依然會產生語意不通的情況。

根據Google方面說法,目前最主要還是受限比對資料仍不足情況,加上線上翻譯社群等資源輔助調整效果也有限之下,中文等語系翻譯仍有不少瓶頸,但在單字、片語內容翻譯部分已經有顯著成長。

以目前Google翻譯發展終極目標來看,自然也希望能實現即時精準的同步口譯,藉此讓不同語言使用者能近乎自然地彼此交談,只是就現行發展情況可能還需要等待相當長久時間才有可能實現。

至於目前藉由TensorFlow模型進行機器學習情況下,Google翻譯是在所有語言採用單一學習模型累積經驗,或是在每種語言透過各自學習模型進行訓練,最終才以彼此串接形式互通,Google表示此部份暫時還無法透露,預期將會在後續做揭曉。但以學習框架效益來看,透過每種語言以各自學習模型訓練的設計模式,似乎才能讓Google翻譯達成最佳的語言互譯效果。

上週公布更新的Google翻譯,分別推出一鍵翻譯 (Tap to Translate)、即時鏡頭翻譯 (Word Lens)加入中文翻譯,以及iOS系統正式加入離線翻譯,同時進一步讓離線語言套件佔用更小儲存空間。

從現在Google翻譯發展情況來看,目前每月約有超過5億人使用,其中90%比例來自美國以外地區,並且有高達95%使用流量源自美國以外地區,每秒約翻譯超過數百萬字的翻譯,主因在於全球僅20%人口使用英文交談,同時約過半比例網頁均以英文呈現,因此透過Google翻譯需求也相對越來越高。至於上週剛推出的一鍵翻譯功能,目前已經加入103種語言,但僅先支援Android作業系統。

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響