App 展覽 市場動態 網路 軟體 頭條話題

讓「絆愛」更活靈活現,LINE以HyperClova技術打造可即時互動的語音對話系統

在持續精進旗下人工智慧Clova技術之下,LINE在稍早舉辦的LINE Developer Day 2021活動中,宣布以今年6月推出對應GPT-3規模等級的HyperClova為基礎,打造可自然互動的語音對話系統。

-
▲運用HyperClova技術打造可即時互動的語音對話系統

在此次打造的語音對話系統中,LINE更以虛擬YouTuber「絆愛」 (キズナアイ)作為示範,藉此呈現透過即時語音輸入,讓系統理解之後做出即時回應,甚至可以搭配生動的肢體動作表現加強互動性,未來甚至可以依照需求調整音調、口吻,以及互動外貌,作為更真實的數位助理服務、客服系統,或是更多人機互動介面應用,另外也能透過不同外貌增加使用者互動感。

-
▲透過虛擬YouTuber「絆愛」作為示範

依照LINE說明,此項基於HyperClova (註)的語音對話系統,將會透過語音識別方式,將使用者說話內容轉換為文字,進而透過HyperClova進行內容分析、理解之後,構思合適回應內容,並且轉換為數位語音內容播放,藉此與使用者產生「互動」。

-
▲互動流程一樣透過語音識別方式將說話內容轉換為文字,讓系統分析理解之後,將所作回應內容以文字轉換成語音方式播放,藉此讓使用者知曉

目前此項語音對話系統是以日文作為主要支援語言,但未來也會持續加入更多語言,並且支援影像識別理解,因此預期未來也會串接更多應用模式。而從運作結構來看,此項語音對話系統亦可透過模組化方式串接不同數據資料庫,甚至可以對應公開數據內容,藉此擴充互動能力。

-
▲藉由模組化,讓語音對話系統可以持續「升級」

另外,除了應用在語音對話系統,LINE也強調可將HyperClova用於文字識別理解,並且重新詮釋內容,其中包含能將複雜的產品說明文字以精簡摘要方式呈現,甚至可以依照需求調整精簡程度,藉此說明HyperClova在文字理解能力表現。

-
▲藉由文字內容理解分析能力,藉此對應文字內容重組詮釋功能

而在能夠深入理解文字內容,並且將內容重新詮釋,更代表可以透過HyperClova整合更多需要運用文字理解的應用服務,甚至可以搭配影像、影片理解發揮更大應用功能。

註:HyperClova是由LINE母公司NAVER打造,最初是以韓文內容理解為主,並且對應2040億組參數,相比OpeAI建構的GPT-3自然語言模型對應參數達1750億組更多,意味能在語言理解上有更精細識別能力,但其中可能也與不同語言模型建構設計差異有關,尤其HyperClova初期更是僅聚焦在韓文內容,在語言文法結構不同情況下,自然也會反應不同參數規模,例如即使GPT-3語言模型已經可以對應流暢的英文語意理解,但對於中文等語意理解仍有待加強。

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響