展覽 市場動態 生活 網路 軟體

Google Assistant希望在聽覺、視覺實現人與機器的多方溝通

今年在MWC 2017期間與Google Assistant產品負責人Gummi Hafsteinsson訪談時,除了提及將使此項數位助理服務進駐到更多裝置,並且提供相同使用體驗,後續更加入可識別不同使用者聲音等功能,在此次Google I/O 2017更宣布藉由Google Lens服務讓使用者能以視覺化形式與Google Assistant進行更多溝通。

, Google Assistant希望在聽覺、視覺實現人與機器的多方溝通, mashdigi-科技、新品、趣聞、趨勢

Gummi Hafsteinsson表示,由於真實情境的「溝通」不僅只是聲音,還包含其他形式。因此這次宣布推出的Google Lens服務便是相當好的例子,透過可視化影像讓Google Assistant能與使用者產生更直覺的互動,例如透過投放至電視的圖表即可了解未來一週的天氣預報,或是將查詢餐廳位置直接傳遞至手機螢幕上顯示,進而透過Google Maps服務進行導航,或讓使用者撥打電話訂位。

而隨著提供Actions on Assistant客製化功能,讓開發者能藉由此項功能增加更多Google Assistant服務應用功能,或是將本身打造服務、硬體設備與Google Asisstamt串接,讓使用者能更方便地透過聲音、影像達成與各類裝置的「溝通」。

即便在不同裝置仍有些為差異,但Google仍強調讓所有的使用體驗更為一致,例如iOS版Google Assistant雖然無法像Android平台能從系統底層喚醒,但配合按下麥克風按鈕,一樣能實現Android平台版本可自動承接上下句關連,進而達成可持續問答的使用效果,而不像多數數位助理完成回答一個問題之後便結束單次運作。

同時透過更多裝置與人持續產生溝通互動,藉著背後的深度學習機制將讓系統更能了解各類使用需求,將能讓相關運作反應越來越貼近使用者預期結果。

, Google Assistant希望在聽覺、視覺實現人與機器的多方溝通, mashdigi-科技、新品、趣聞、趨勢

▲ Google Assistant產品負責人Gummi Hafsteinsson

不過,如同目前Google Assistant仍無法同時分析兩種語言混合使用情況 (例如穿插中英詞彙、語句),目前也無法同時滿足同時進行兩項要求以上事項,也就是無法要求搭載Google Assistant的調酒機器人在說個笑話之餘,同時完成調酒工作。雖然對於人腦理解而言,同時進行兩個動作並不花什麼功夫,但對於系統而言卻是相當複雜的演算,因此這也是Google目前努力方向。

由於要學習一個語言,並且理解相關詞句所代表含意相當困難,因此目前Google Assistant依然必須透過持續學習才能熟悉一種語言。而雖然此次尚未宣布加入支援中文,僅說明對應法語、日語等語音互動模式,Google Assistant將如何理解尚未學習語言背後對應文化所產生差異,最主要便是仰賴研發團隊來自全球各地,同時Google也有相當豐富的全球員工可作為參考,因此在大致上的互動邏輯判斷並不會產生明顯不同,透過持續學習之下更能讓判斷結果更為正確。

越來越多數位助理服務推行將有助機器「理解」人類

至於針對目前亞馬遜、微軟、蘋果、三星等廠商均先後投入自有數位助理服務發展,Gummi Hafsteinsson認為越來越多廠商同樣加入此類服務發展之下,將更有助於讓機器更了解人類需求,進而產生全新的人機互動模式。

對於如何挑選目前各家廠商所推行的數位助理服務,Gummi Hafsteinsson的看法認為主要還是依照個人需求而定,畢竟在不同場合、使用模式之下,不同數位助理服務背後基於深度學習所產生反應互動,以及相關連結應用仍有不同,但可以預期的是所有廠商所推動的數位助理服務,無論是在Android、iOS或其他平台使用,都能提供相同或接近的使用體驗。

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響