生活 網路 觀察

NVIDIA協助精進企業線上會議品質,讓企業更容易佈署應用人工智慧技術

在近期研究中,NVIDIA說明如何藉由人工智慧技術協助精進企業線上會議品質,以及如何讓預先訓練好的人工智慧模型更快移轉到實際應用場景,並且針對不同需求客製化。

-

針對線上視訊會議應用需求,其實NVIDIA已經作了許多研究,包含藉由人工智慧學習訓練方式,讓畫面中未對著鏡頭說話的人像可以修正注視方向,或是讓與會者以虛擬人像形式呈現,甚至可以讓視訊串流品質最佳化,而在此次宣布更新的NVIDIA Maxine開發工具中,將可透過Vid2Vid Cameo學習模型,讓開發者能更快將NVIDIA技術應用在旗下服務內。

依照NVIDIA說明,Vid2Vid Cameo學習模型是透過旗下DGX系統訓練而成,並且藉由對抗生成網路學習視訊會議中20種主要臉龐特徵,藉此修正使用者在會議中低頭、看兩旁,而未專注於鏡頭方向的情況,藉此讓整個人在會議中看起來更有參與感。

在先前技術中,NVIDIA其實也提出讓與會者背景更自然模糊處理,或是置換為其他背景,甚至透過人工智慧技術實現聲音降噪效果,讓使用者在遊戲遊玩過程,或是參與線上會議時能有更好溝通互動體驗。

另外,此次同步揭曉的NVIDIA移轉學習模型工具 (Transfer Learning Toolkit,TLT),則可讓企業更快將預先完成訓練的學習模型應用在各個場景,並且依照真實場景差異進行微調,藉此將各類人工智慧技術套用在實際應用需求,其中包含動作識別、臉譜辨認等。

以目前主要應用來看,人工智慧技術還是以物件辨識、分類、找出差異等情況居多,而動作識別與臉譜辨識通常則會應用在身分驗證,或是安全管理為主。不過,在部分實際應用情況下還是需要進行微調,避免人工智慧發生識別錯誤情況,例如預先訓練學習模型可能無法高度正確分辨車站環境內的人流,因此在實際佈署應用之前需要額外作調整、校正,或是針對物件識別作調整,藉此判斷哪些物品有生產瑕疵,必須作廢回收。

透過NVIDIA移轉學習模型工具設計,不僅可讓企業更快導入人工智慧技術應用,同時也能針對不同使用需求即時作調整,讓人工智慧技術可以更快落實在各類應用範疇。

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響