生活

Google藉類神經網絡優化翻譯品質 擴大人工智慧技術應用

針對人工智慧技術的投資,除了持續應用在自動駕駛與無人車技術發展之外,其實也已經陸續應用在Google Assistant、Gmail、Google翻譯、Google相簿或Google Search等服務內,而從過去持續藉由資料比對模式打造的人工智慧技術,到後續導入類神經網絡運算模式的人工智慧技術,Google其實已經在人工智慧技術領域投入大量發展資源,甚至早在收購DeepMind團隊打造AlphaGo人工智慧系統之前便有相當久的發展歷程。

而對於目前有越來越多人使用的Google翻譯服務,Google翻譯產品經理Julie Cattiau稍早說明如何藉由類神經網絡演算技術分析複雜的語言模型架構,藉此將特定語句中的完整語意轉換成另一種語言。

, Google藉類神經網絡優化翻譯品質 擴大人工智慧技術應用, mashdigi-科技、新品、趣聞、趨勢

在先前說明中,Google便說明計畫藉由機器學習為基礎的人工智慧技術強化Google翻譯運作品質,同時也能讓翻譯效率具體提昇,並且將使同步翻譯成為終極發展目標。而在後續發展裡,Google進一步將類神經網絡學習模式導入Google翻譯,透過大量語句結構分析、比對學習,讓不同語言字句翻譯結果更為通順、正確。

而就Google說明,目前導入類神經網絡學習技術的翻譯系統運作模式,主要會將原始語言轉換成系統考理解的中間介質語言,進而轉換成目標翻譯語言,無需像傳統翻譯模式先將原始語言轉換成第一種或第二種共通語言 (例如將中文轉換成英語,再從英語轉換成海地語),透過減少二次以上翻譯流程造成原始語意流失現象,同時也能藉此減少語言翻譯學習資料佔用空間,並且配合機器學習分析理解翻譯語句關連,進而了解整段語句所要表達含意,讓過往逐字翻譯產生的奇怪語句情況有所改善,達成更貼近自然語句的直譯效果。

與目前翻譯品質比較,由於機器學習依然需要大量資料進行比對,因此相比人力翻譯同時具備直覺、想像可讓翻譯品質有更好的自然語意呈現,但比起傳統比對翻譯模式卻能有更明顯成長。不過,現階段Google翻譯依然無法完整對應不同語言混用的翻譯結果呈現,目前保守作法可能會依據語句結構判斷是否維持其中一種語言 (例如在中文翻譯中保留特定英語詞彙),而Google未來將會持續藉由其他方式讓此類語言使用模式有更好翻譯結果。

對於常見的繁體中文、簡體中文翻譯比對,Julie Cattiau表示目前依然是以單一語言學習模型進行訓練,畢竟相比全球多數人使用的英語,中文已經成為第二大規模使用語言,但若將學習模型拆分成繁中、簡中兩種資料庫,勢必會讓整體學習效率受影響,因此現階段作法將以單一學習模型搭配不同語言版本詞彙,進而對應不同中文版本翻譯使用需求。不過,此部份主要還是建立在繁體中文、簡體中文有極為相似的語句結構,因此透過簡單詞彙轉換即可相通。

Google表示,持續推動Google翻譯使用品質是為了讓全球資訊交流更無障礙且流暢,目前每天使用次數約達10億次以上、每月累積超過10億人以上使用人數,同時約92%使用者來自美國境外地區,其中台灣地區透過Android平台裝置使用Google翻譯約成長兩倍,而iOS平台裝置使用年成長率也達60%以上,成為Google翻譯使用成長最快地區。

※相關連結》

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響