亞馬遜計畫以人工智慧讓Alexa數位助理服務發音互動更加自然

在Google、蘋果先後將旗下數位助理服務換上擬真人聲發音，亞馬遜也準備將旗下數位助理服務Alexa換上更親切的真人發聲模式，並且藉由人工智慧學習真人口語播報內容，讓庶務助理服務互動感受更為自然。

根據亞馬遜公布消息，未來Alexa將可藉由本身開發NTTS (neural text-to-speech，神經文字轉換口語)技術，藉由機器學習方式讓電腦合成聲音表現更加自然，讓數位助理互動聲音可以變得更具情感表現，而非只是用單純合成發聲表意。

而學習來源則是日常生活中常見新聞頻道播報內容，讓Alexa背後的電腦系統持續學習之後，藉此以更加自然聲音與使用者回應互動，同時預期未來將會加入更多人聲模式提供使用，讓使用者能依照個人喜好挑選合適回應語音聲調。

透過以下內容，可以比對傳統電腦合成方式，以及透過神經運算方式產生電腦語音與藉由真實播報內容學習產生電腦語音的差異：

類似設計，Google在去年便已DeepMind旗下人工智慧技術學習真人口語發音模式，並且在今年讓Google Assistant能以不同人聲音調與使用者互動，同時也能降低機器端與人互動產生的距離感。

目前Alexa已經能與超過2萬種連網裝置互動，其中涵蓋品牌數量已經超過3500種，同時更可透過超過5萬種技能讓使用者能透過Alexa操作各類服務，而在今年初所公布數據，當時Alexa僅支援4000種裝置、涵蓋1200種品牌，顯示Alexa在今年內的成長幅度快速提昇。

不過，目前包含Google開始藉由Actions增加Google Assistant的應用功能，而蘋果也同樣透過Siri Shorcuts增加數位助理服務連接應用項目，讓各自的數位助理服務可以透過這些連接快速啟用不同應用服務，而非僅能使用預設提供功能。

相關內容