以澳洲琴鳥為稱的Lyrebird網站 僅需1分鐘長度樣本即可模仿特定人聲語調

以澳洲琴鳥為稱的Lyrebird網站,主打藉由擷取1分鐘長度聲音樣本即可快速生成完整聲音資料。

根據Lyrebird網站展示內容,分別藉由現任美國總統川普,以及前任總統歐巴馬聲音詮釋其人工智慧學習模擬技術,強調使用者僅需提供1分鐘長度內、足以表現聲音特色檔案內容,即可透過機器學習方式模擬完整聲音資訊。

之所以以Lyrebird (琴鳥)作為網站名稱,其實就是呼應琴鳥會模仿周遭聲音行為特色,藉此詮釋本身服務技術。

目前Lyrebird網站服務僅需註冊即可免費使用,同時提供1分鐘左右聲音檔案,即可創造個人聲音資訊,並且讓開發者能以此技術打造更真實的聲音互動服務,例如自動化服務中的擬人互動,或是遊戲中NPC角色聲音呈現等應用,讓使用者不必再接觸傳統機器合成聲音內容,透過更貼近自然的人聲互動方式使用各類服務。

而在錄製過程中,系統將會要求使用者必須依照條列內容唸出30個句子,並且逐一錄製聲音,即可將所有資訊彙整成完整聲音資訊,同時使用者隨時可透過登入個人帳號將錄製聲音移除。

類似技術,其實目前包含蘋果、Google、微軟等科技廠商都已經投入研發,比方Google Assistant已經藉由錄製真人聲音,並且藉由機器學習方式呈現更自然聲音,而蘋果Siri數位助理服務也有類似改變,希望能讓使用者有更貼近自然的互動感受。

不過,Lyrebird網站藉由免費提供使用服務,主要目的應該也包含蒐集全球各地區的聲音資訊,或許將藉此讓系統學習各地區語言詮釋方式,其中包含分析語調、口音等發音差異,進而可創造更真實表現的數位語音呈現效果。

發表迴響