市場動態 生活 網路 軟體

Meta推出能識別翻譯近100種語言聲音,並且能以36種不同語言聲音輸出的SeamlessM4T多模模型
將更有利於不同語言使用者進行溝通

Meta宣布推出名為SeamlessM4T的人工智慧模型,將能對應近100種語言識別,以及包含文字轉文字、聲音轉文字的翻譯功能,另外也能將近100種語言聲音轉換成包含英語在內36種不同語言聲音輸出,或是輸出成包含英語在內35種語言文字。

Meta, Meta推出能識別翻譯近100種語言聲音,並且能以36種不同語言聲音輸出的SeamlessM4T多模模型<br><span style='color:#848482;font-size:16px;'>將更有利於不同語言使用者進行溝通</span>, mashdigi-科技、新品、趣聞、趨勢

SeamlessM4T約透過27萬小時長度相應的語音與文本內容進行訓練,同時相比其他語言翻譯工具僅涵蓋全球部分語言內容,因此在對應不同文化背景的語言互譯時,往往會有明顯錯誤,或是語焉不詳情形,甚至讓整個翻譯效率低落,Meta表示SeamlessM4T結合多種語言翻譯模型,將能實現多種語言以更有效率且正確形式互譯。

而推出SeamlessM4T,Meta執行長Mark Zuckberg認為將更有利於不同語言使用者進行溝通,尤其在元宇宙等虛擬世界進行互動時,直接的語言溝通依然是重要互動媒介。同時,Meta更將使SeamlessM4T模型以非商業用途形式對外提供使用。

除了Meta,包含Google、微軟、亞馬遜在內業者也持續更新其翻譯工具,而OpenAI等業者更同樣藉由人工智慧技術強化自然語言理解翻譯功能,藉此讓使用者能透過自然語言方式與人工智慧互動。

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響