DeepMind打造會自主學習新規則的人工智慧MuZero - mashdigi

Alphabet旗下人工智慧技術公司DeepMind，宣布推出名為MuZero的人工智慧系統，標榜在完全不了解規則情況下，即可快速熟悉圍棋、西洋棋、將棋，或是57款Atari電子遊戲遊玩規則，並且取得更好遊玩表現。

依照DeepMind說明，MuZero的技術背後，代表可藉由人工智慧技術也覺日常生活中複雜規則，或是事前無法確知規則的難題。

相比現有DQN、R2D2或Agent57人工智慧技術，MuZero能以更快效率找出既有規則，並且快速解決問題。而MuZero的技術更代表能讓人工智慧有規劃思考能力，並且利用現有條件統整規則，即便面臨全新運算場景也能快速找出問題解決方式。

過去研究人員分別透過預先搜尋 (lookahead search)，以及基於現有運算模型規劃能力，讓人工智慧能針對未知規則情況進行運算，但由於既有運算方式仍仰賴前期規則訓練，因此必須花費更多時間才能順利找出全新運算環境對應規則，因此並不適合用於解決未知條件的運算需求，同時也難以解決條件相對複雜的運算情境。

因此DeepMind在MuZero技術採用不同作法，而是讓人工智慧可依照當前蒐集資訊進行分析學習，藉此縮短在變動條件環境運算所需時間，其中包含當前決策價值、最佳運算決策，以及前一個決策執行成果，藉此進行反覆學習，進而從中學習最佳規則執行決策能力。

在這樣的運算模型執行下，將可讓MuZero人工智慧技術在圍棋、西洋棋、將棋，或是57款Atari電子遊戲更快發揮執行效果，甚至在棋藝能力比擬AlphaZero，並且在Atari電子遊戲執行成果更勝現有人工智慧技術。

同時，若允許MuZero以更長時間進行「思考」，其在棋藝表現會有更顯著下子正確率，並且呈現更精湛的進攻方式，甚至可在電子遊戲內容有更高學習效率。

未來DeepMind團隊預計利用MuZero技術解決更多人工智慧前期學習與分析未知解法問題，預期未來也能讓更多機器人、自駕車等經常處於未知判斷條件的運算需求，能在更短時間內找到合適執行方式。

分享此文：

相關內容

分享此文：

分享此文：

分享此文：

發表迴響取消回覆