• 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
2025 / 11 / 11 19:09 星期二
  • Login
mashdigi-科技、新品、趣聞、趨勢
  • 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
No Result
View All Result
  • 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
No Result
View All Result
mashdigi-科技、新品、趣聞、趨勢
No Result
View All Result
首頁 市場動態

Meta開源Omnilingual ASR語音基座模型,支援超過1600種語言、導入70億規模參數語音編碼器
推「自帶語言」功能、僅需少量樣本即可擴展新語言,同步開源350種語言資料集

撰文: 楊又肇 (Mash Yang)
2025-11-11
in 市場動態, 生活, 網路, 軟體
A A
0
分享至 Facebook分享至 Twitter分享至 LINE

Meta AI FAIR團隊稍早發表其在自動語音辨識 (ASR) 領域的最新重大成果:「Omnilingual ASR」。這是一套號稱能為超過1600種語言提供自動語音辨識能力的模型套件,其規模與品質均達業界新高。

Meta強調,此舉將透過一個通用的轉錄系統,解決ASR技術與資源過度集中在少數高資源語言的問題,讓高品質的語音轉文字技術能惠及代表性不足的語言社群,打破數位鴻溝。

導入70億規模參數wav2vec 2.0,同步開源模型與資料集

配合此次發表,Meta同步開源了一系列相關的關鍵資產 (均在Apache 2.0許可下發布),包含:

• Omnilingual ASR模型家族: 提供多種尺寸,從專為低功耗裝置設計的3億組參數的輕量級版本,到提供頂級精度的70億組參數模型。

• Omnilingual wav2vec 2.0 基礎模型: 一個擴展至70億組參數的大規模多語言語音表徵模型 (Speech Representation Model),可作為ASR之外其他語音任務的基座。

• Omnilingual ASR Corpus (語料庫): 一個大型資料集 (CC-BY 許可),包含了350種服務欠缺 (under-served) 語言的轉錄語音。

LLM-ASR架構達成最先進模型,78%語言錯誤率低於10%

為解決ASR擴展的技術瓶頸,Omnilingual ASR引入了兩種架構。首先,團隊將其wav2vec 2.0語音編碼器 (encoder) 首次擴展至70億組參數,從大量未轉錄的語音中生成豐富的多語言語義表徵。

接著,團隊建構了兩種解碼器 (decoder) 變體:一種是傳統的CTC (連接時序分類Connectionist Temporal Classification);另一種則是利用了 Transformer解碼器,稱為「LLM-ASR」。

根據Meta公布研究論文,採用LLM-ASR方法的70億組參數系統,在超過1600種語言上達到了最先進模型效能 (SOTA,State-of-the-Art),其中78%的語言其字符錯誤率 (CER) 低於10%。

導入「自帶語言」(Bring Your Own Language) 概念

此次Omnilingual ASR最大的突破之一,在於改變了新增語言的傳統範式 (paradigm),引入了「自帶語言」 (Bring Your Own Language)的概念。這得益於其受LLM啟發的系統,導入了強大的「上下文學習能力」 (in-context learning)。

實務上,這意味著使用一種目前不被支援語言的用戶,僅需提供少數幾個成對的音訊-文本樣本 (audio-text samples),AI 就能透過這些上下文範例,獲得可用的轉錄品質,而無需進行大規模的模型微調 (fine-tuning)、專業知識或高階運算資源。此舉被視為能讓「社群驅動」 (community-driven) 的語言擴展成為可能。

攜手在地夥伴,收集350種低資源語言

為覆蓋那些幾乎沒有數位足跡的語言,團隊除了整合公開資料集,也與在地組織合作 (例如Mozilla基金會的Common Voice、Lanfrica/NaijaVoices等),直接與當地社群協作,招募並補償母語者提供語音紀錄。

這部分委託收集的語料庫作為Omnilingual ASR Corpus發布,是目前針對超低資源 (ultra-low-resource) 自然語音ASR所組建的最大資料集之一。

目前,相關的模型、資料集、轉錄工具Demo與語言探索Demo,都已透過GitHub、Hugging Face與Meta AI網站等管道對外釋出。

您可能感興趣的內容 (GeoFlow Pro 推薦)

  • 絕不拋下任何語言,Meta打造可翻譯200種不同語言的NLLB-200 AI模型
  • 可能針對伺服器市場打造首款自製處理器之餘,Arm更傳從授權客戶端挖角設計人才
  • Meta宣布推出第二款MTIA系列客製化加速器晶片,對應內容排序與廣告推薦的底層運算加速
  • 更多非營利組織、勞工組織要求加州總檢察長阻止OpenAI成為一家以營利為導向的公司
  • 提升更高識別度、聚焦社交科技,Facebook確定更名為「Meta」

分享此文章到您的社群

FacebookTwitter
Tags: LLMMetaMeta AIOmnilingual ASR
ShareTweetShare
楊又肇 (Mash Yang)

楊又肇 (Mash Yang)

mashdigi.com網站創辦人兼主筆,同時也是科技新聞業學習者。

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

翻譯 (Translate)

  • 熱門
  • 留言
  • 最新
同時支援6GHz以下頻段與毫米波 Sony揭曉開發中旗艦手機Xperia PRO

同時支援6GHz以下頻段與毫米波 Sony揭曉開發中旗艦手機Xperia PRO

2020-02-24
訪談/Sony定調全新旗艦手機的Xperia 5,究竟是否歸類「Compact」定位?

訪談/Sony定調全新旗艦手機的Xperia 5,究竟是否歸類「Compact」定位?

2019-09-07
Raspberry Pi基金會宣布推出Raspberry Pi 5開發板,顯示供應鏈問題已經獲得改善

Raspberry Pi基金會宣布推出Raspberry Pi 5開發板,顯示供應鏈問題已經獲得改善

2023-09-28
Google從明年5月起將讓非AMP格式網頁也能優先納入行動搜尋結果

Google從明年5月起將讓非AMP格式網頁也能優先納入行動搜尋結果

2
Ubuntu母公司確認計畫上市募股 但仍未有具體時程表

Ubuntu母公司確認計畫上市募股 但仍未有具體時程表

1

索尼互動娛樂證實PlayStation 5僅向下相容絕大多數的PlayStation 4平台遊戲

0
Zoom調查:台灣85%「AI原生世代」日常活用AI,高於亞太平均

Zoom調查:台灣85%「AI原生世代」日常活用AI,高於亞太平均

2025-11-11
Facebook新功能:透過Meta AI分析尚未上傳的照片,引發隱私疑慮

Meta開源Omnilingual ASR語音基座模型,支援超過1600種語言、導入70億規模參數語音編碼器
推「自帶語言」功能、僅需少量樣本即可擴展新語言,同步開源350種語言資料集

2025-11-11
傳三星Galaxy S26最終尺寸微調、機身略為增厚,或許是為了換上更大電池容量?

傳三星Galaxy S26最終尺寸微調、機身略為增厚,或許是為了換上更大電池容量?

2025-11-11
mashdigi-科技、新品、趣聞、趨勢

Copyright © 2017 mashdigi.com

  • 關於 mashdigi.com
  • 投放廣告
  • 聯繫 mashdigi.com

追蹤我們

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • 關於 mashdigi.com
  • 投放廣告
  • 聯繫 mashdigi.com

Copyright © 2017 mashdigi.com