市場動態 生活 網路 觀察

Mozilla的同聲計畫已經累積7226小時語音資料,總計對應54種語言

Mozilla從2017年7月開始推動的開源語音辨識引擎專案同聲計畫 (Common Voice),目前在最新語音資料庫內收錄長達7226小時的語音內容,其中更包含增加14種小眾語言,使得收錄語言數量增加至54種。

, Mozilla的同聲計畫已經累積7226小時語音資料,總計對應54種語言, mashdigi-科技、新品、趣聞、趨勢

就同聲計畫本身立場來看,希望透過收錄大量語言聲音資料,藉此讓語音識別為主的技術有更大開放性與包容性,讓全球更多小眾語言也能像主流語言一樣被重視,並且使小眾語言主要使用者也能透過熟悉交談方式使用新技術。

另一方面,同聲計畫收錄語音內容也能應用在各類語音識別應用技術訓練,例如Mozilla旗下語音轉文字引擎DeepSpeech,便是藉由同聲計畫收錄語音內容進行訓練,同時也能識別不同年齡層、性別,以及各地區口音所呈現語言內容。

目前在收錄長達7226小時的語音內容的資料庫中,總計累積550萬個語音內容片段,平均長度為4.7秒,其中總計長達5591小時長度內容已經透過Mozilla社群確認為有效資料。而在同聲計畫中貢獻最多的語音資料,分別為英文、德文、法文、義大利文與西班牙文,但實際上也包含中文在內亞洲語言,同時也包含不少小眾語言。

除了同聲計畫募集聲音內容,Mozilla現在更提供針對特定情況使用的單字聲音內容,其中蒐集包含數字發音,或是喚醒等用途的特定關鍵字發音內容,總收錄內容長度達120小時,分別由1萬1000人在一個月內以18種語言建立。

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響