Google將透過人工智慧輔助的編解碼技術Lyra開源，開放更多人使用

今年2月提出以人工智慧輔助編解碼，讓低速網路環境也能傳遞清晰通話內容的Lyra技術，稍早由Google宣布將以開源形式提供使用，並且將原始編碼內容放上Github公開。

依照Google先前說明，Lyra技術會在每隔40毫秒時間擷取一次語音特徵，或是特定聲音內容，其餘部分則會在還原時藉由人工智慧技術方式補正，意味數位語音資料在實際通話過程的所需傳輸比例將可大幅減少，在3Kbps位元率運作下約可降低60%以上網路頻寬佔用比例。同時，處理延遲時間僅為90毫秒，因此可在使用者能接受範圍內。

藉由機器學習模式，透過超過數千小時的語音內容學習訓練後，即可將高度壓縮後的數位語音封包完整還原，如此一來就能藉由低位元壓縮比例讓數位語音封包可在低速連結的網路環境快速傳遞，並且讓還原後的數位語音內容維持清晰，避免產生機器人聲情況。

雖然目前5G等網路技術持續成長，網路傳輸頻寬也持續增加，但隨著越來越多生活應用內容都與網路息息相關，同時使用者也越來越依賴網路聯繫互動，諸如Lyra般能以更低位元率傳輸清晰內容的編解碼技術就更顯得重要。

以Netflix、YouTube等網路串流影音服務為例，在去年新型冠狀病毒疫情爆發後，由於越來越多人在家觀看串流影音內容，使得Netflix、YouTube不得不因應突來增加的使用流量，藉由限制最高串流解析度的作法避免伺服器超出負荷，若能配合使用壓縮比例更高的技術，即可在相同頻寬下提供更高數據傳輸效果，同時也能減輕伺服器運作負擔。

分享此文：

相關內容

分享此文：

分享此文：

分享此文：

發表迴響取消回覆