NVIDIA協助精進企業線上會議品質，讓企業更容易佈署應用人工智慧技術

在近期研究中，NVIDIA說明如何藉由人工智慧技術協助精進企業線上會議品質，以及如何讓預先訓練好的人工智慧模型更快移轉到實際應用場景，並且針對不同需求客製化。

針對線上視訊會議應用需求，其實NVIDIA已經作了許多研究，包含藉由人工智慧學習訓練方式，讓畫面中未對著鏡頭說話的人像可以修正注視方向，或是讓與會者以虛擬人像形式呈現，甚至可以讓視訊串流品質最佳化，而在此次宣布更新的NVIDIA Maxine開發工具中，將可透過Vid2Vid Cameo學習模型，讓開發者能更快將NVIDIA技術應用在旗下服務內。

依照NVIDIA說明，Vid2Vid Cameo學習模型是透過旗下DGX系統訓練而成，並且藉由對抗生成網路學習視訊會議中20種主要臉龐特徵，藉此修正使用者在會議中低頭、看兩旁，而未專注於鏡頭方向的情況，藉此讓整個人在會議中看起來更有參與感。

在先前技術中，NVIDIA其實也提出讓與會者背景更自然模糊處理，或是置換為其他背景，甚至透過人工智慧技術實現聲音降噪效果，讓使用者在遊戲遊玩過程，或是參與線上會議時能有更好溝通互動體驗。

另外，此次同步揭曉的NVIDIA移轉學習模型工具 (Transfer Learning Toolkit,TLT)，則可讓企業更快將預先完成訓練的學習模型應用在各個場景，並且依照真實場景差異進行微調，藉此將各類人工智慧技術套用在實際應用需求，其中包含動作識別、臉譜辨認等。

以目前主要應用來看，人工智慧技術還是以物件辨識、分類、找出差異等情況居多，而動作識別與臉譜辨識通常則會應用在身分驗證，或是安全管理為主。不過，在部分實際應用情況下還是需要進行微調，避免人工智慧發生識別錯誤情況，例如預先訓練學習模型可能無法高度正確分辨車站環境內的人流，因此在實際佈署應用之前需要額外作調整、校正，或是針對物件識別作調整，藉此判斷哪些物品有生產瑕疵，必須作廢回收。

透過NVIDIA移轉學習模型工具設計，不僅可讓企業更快導入人工智慧技術應用，同時也能針對不同使用需求即時作調整，讓人工智慧技術可以更快落實在各類應用範疇。

分享此文：

相關內容

分享此文：

分享此文：

分享此文：

發表迴響取消回覆