Google藉類神經網絡優化翻譯品質擴大人工智慧技術應用

針對人工智慧技術的投資，除了持續應用在自動駕駛與無人車技術發展之外，其實也已經陸續應用在Google Assistant、Gmail、Google翻譯、Google相簿或Google Search等服務內，而從過去持續藉由資料比對模式打造的人工智慧技術，到後續導入類神經網絡運算模式的人工智慧技術，Google其實已經在人工智慧技術領域投入大量發展資源，甚至早在收購DeepMind團隊打造AlphaGo人工智慧系統之前便有相當久的發展歷程。

而對於目前有越來越多人使用的Google翻譯服務，Google翻譯產品經理Julie Cattiau稍早說明如何藉由類神經網絡演算技術分析複雜的語言模型架構，藉此將特定語句中的完整語意轉換成另一種語言。

在先前說明中，Google便說明計畫藉由機器學習為基礎的人工智慧技術強化Google翻譯運作品質，同時也能讓翻譯效率具體提昇，並且將使同步翻譯成為終極發展目標。而在後續發展裡，Google進一步將類神經網絡學習模式導入Google翻譯，透過大量語句結構分析、比對學習，讓不同語言字句翻譯結果更為通順、正確。

而就Google說明，目前導入類神經網絡學習技術的翻譯系統運作模式，主要會將原始語言轉換成系統考理解的中間介質語言，進而轉換成目標翻譯語言，無需像傳統翻譯模式先將原始語言轉換成第一種或第二種共通語言 (例如將中文轉換成英語，再從英語轉換成海地語)，透過減少二次以上翻譯流程造成原始語意流失現象，同時也能藉此減少語言翻譯學習資料佔用空間，並且配合機器學習分析理解翻譯語句關連，進而了解整段語句所要表達含意，讓過往逐字翻譯產生的奇怪語句情況有所改善，達成更貼近自然語句的直譯效果。

與目前翻譯品質比較，由於機器學習依然需要大量資料進行比對，因此相比人力翻譯同時具備直覺、想像可讓翻譯品質有更好的自然語意呈現，但比起傳統比對翻譯模式卻能有更明顯成長。不過，現階段Google翻譯依然無法完整對應不同語言混用的翻譯結果呈現，目前保守作法可能會依據語句結構判斷是否維持其中一種語言 (例如在中文翻譯中保留特定英語詞彙)，而Google未來將會持續藉由其他方式讓此類語言使用模式有更好翻譯結果。

對於常見的繁體中文、簡體中文翻譯比對，Julie Cattiau表示目前依然是以單一語言學習模型進行訓練，畢竟相比全球多數人使用的英語，中文已經成為第二大規模使用語言，但若將學習模型拆分成繁中、簡中兩種資料庫，勢必會讓整體學習效率受影響，因此現階段作法將以單一學習模型搭配不同語言版本詞彙，進而對應不同中文版本翻譯使用需求。不過，此部份主要還是建立在繁體中文、簡體中文有極為相似的語句結構，因此透過簡單詞彙轉換即可相通。

Google表示，持續推動Google翻譯使用品質是為了讓全球資訊交流更無障礙且流暢，目前每天使用次數約達10億次以上、每月累積超過10億人以上使用人數，同時約92%使用者來自美國境外地區，其中台灣地區透過Android平台裝置使用Google翻譯約成長兩倍，而iOS平台裝置使用年成長率也達60%以上，成為Google翻譯使用成長最快地區。

※相關連結》

分享此文：

相關內容

分享此文：

分享此文：

分享此文：

發表迴響取消回覆