Google Assistant希望在聽覺、視覺實現人與機器的多方溝通

今年在MWC 2017期間與Google Assistant產品負責人Gummi Hafsteinsson訪談時，除了提及將使此項數位助理服務進駐到更多裝置，並且提供相同使用體驗，後續更加入可識別不同使用者聲音等功能，在此次Google I/O 2017更宣布藉由Google Lens服務讓使用者能以視覺化形式與Google Assistant進行更多溝通。

Gummi Hafsteinsson表示，由於真實情境的「溝通」不僅只是聲音，還包含其他形式。因此這次宣布推出的Google Lens服務便是相當好的例子，透過可視化影像讓Google Assistant能與使用者產生更直覺的互動，例如透過投放至電視的圖表即可了解未來一週的天氣預報，或是將查詢餐廳位置直接傳遞至手機螢幕上顯示，進而透過Google Maps服務進行導航，或讓使用者撥打電話訂位。

而隨著提供Actions on Assistant客製化功能，讓開發者能藉由此項功能增加更多Google Assistant服務應用功能，或是將本身打造服務、硬體設備與Google Asisstamt串接，讓使用者能更方便地透過聲音、影像達成與各類裝置的「溝通」。

即便在不同裝置仍有些為差異，但Google仍強調讓所有的使用體驗更為一致，例如iOS版Google Assistant雖然無法像Android平台能從系統底層喚醒，但配合按下麥克風按鈕，一樣能實現Android平台版本可自動承接上下句關連，進而達成可持續問答的使用效果，而不像多數數位助理完成回答一個問題之後便結束單次運作。

同時透過更多裝置與人持續產生溝通互動，藉著背後的深度學習機制將讓系統更能了解各類使用需求，將能讓相關運作反應越來越貼近使用者預期結果。

, Google Assistant希望在聽覺、視覺實現人與機器的多方溝通, mashdigi－科技、新品、趣聞、趨勢 — ▲ Google Assistant產品負責人Gummi Hafsteinsson

不過，如同目前Google Assistant仍無法同時分析兩種語言混合使用情況 (例如穿插中英詞彙、語句)，目前也無法同時滿足同時進行兩項要求以上事項，也就是無法要求搭載Google Assistant的調酒機器人在說個笑話之餘，同時完成調酒工作。雖然對於人腦理解而言，同時進行兩個動作並不花什麼功夫，但對於系統而言卻是相當複雜的演算，因此這也是Google目前努力方向。

由於要學習一個語言，並且理解相關詞句所代表含意相當困難，因此目前Google Assistant依然必須透過持續學習才能熟悉一種語言。而雖然此次尚未宣布加入支援中文，僅說明對應法語、日語等語音互動模式，Google Assistant將如何理解尚未學習語言背後對應文化所產生差異，最主要便是仰賴研發團隊來自全球各地，同時Google也有相當豐富的全球員工可作為參考，因此在大致上的互動邏輯判斷並不會產生明顯不同，透過持續學習之下更能讓判斷結果更為正確。

越來越多數位助理服務推行將有助機器「理解」人類

至於針對目前亞馬遜、微軟、蘋果、三星等廠商均先後投入自有數位助理服務發展，Gummi Hafsteinsson認為越來越多廠商同樣加入此類服務發展之下，將更有助於讓機器更了解人類需求，進而產生全新的人機互動模式。

對於如何挑選目前各家廠商所推行的數位助理服務，Gummi Hafsteinsson的看法認為主要還是依照個人需求而定，畢竟在不同場合、使用模式之下，不同數位助理服務背後基於深度學習所產生反應互動，以及相關連結應用仍有不同，但可以預期的是所有廠商所推動的數位助理服務，無論是在Android、iOS或其他平台使用，都能提供相同或接近的使用體驗。

分享此文：

相關內容

分享此文：

分享此文：

分享此文：

發表迴響取消回覆