Facebook讓人工智慧能以少許資料「舉一反三」學習

Facebook在很早之前就已經藉由人工智慧試圖解決垃圾訊息、假帳號、或是各類不適當內容,不過如果是使用現有人工智慧技術的話,勢必要有足夠數據資料提供訓練,否則系統通常僅能針對既有學習結果判斷內容是否適合出現在Facebook頁面。因此在未來的人工智慧技術發展,Facebook計畫讓人工智慧能從有限數據資料進行自我學習,並且能像人腦一樣「舉一反三」。

從目前絕大多數人工智慧訓練模式,多半是以大量數據資料進行機器學習,過程中也必須將數據資料逐一進行標記,讓系統能知曉學習內容代表項目,例如學習判斷什麼是貓、什麼是天空,或是什麼叫做紅色等。

雖然目前針對單一用途打造的人工智慧已經可以在更短時間內完成訓練,同時也能有更快運算反應表現,但像是Facebook服務平台必須同時因應諸多圖文、影音內容,並且涵蓋以各類語言表達內容進行判斷,背後所採用的人工智慧系統相對也更加複雜。

而因為學習數量通常龐大,同時附帶要標記的內容也相對複雜,加上有些要讓系統進行機器學習的項目仍須透過人力手動標記,因此整體上要讓系統完成一輪學習所需花費時間可能因此被拉長。即便目前機器學習已經可以透過硬體持續升級獲得更快運算效能,但面臨持續增長的數據資料與學習項目情況下,往往依然讓人工智慧技術成長速度緩慢。

因此,Facebook除了進一步調整人工智慧運算框架,藉由金字塔結構區隔影像內容識別判斷順序,讓系統能依照不同需求提昇內容判斷效率,或是透過同義詞將不同語言詞彙匯集在相同子集,藉此讓不同語言互譯效率提昇,同時也能進一步讓系統仿照人腦能以想像、推理等方式補齊數據資料可能缺少部分,進而實現讓系統能以有限數據資料進行學習,並且從中推擬更多學習成果。

在這樣的情況下,Facebook表示原本需要花費12000小時才能完成訓練的人工智慧系統,僅需花費80小時即可完成訓練,同時執行效率更可提昇150倍,錯誤率更僅在9%以下,而在消除仇恨言論內容效率更可提高10倍。

藉由這樣的調整,Facebook即可針對動態內容、廣告進行效率更佳的過濾篩選,避免不適當內容擴散,或是讓廣告投放更為精準。另外,藉由讓人工智慧運算效率、精準度提昇,Facebook更能以此讓Spark AR動態貼圖效果更佳真實,或是讓線上翻譯結果更為準確,甚至可讓虛擬實境中的虛擬人像表情、肢體動作更加自然,並且能實現更貼近真實的遠距離互動。

發表迴響

%d 位部落客按了讚: