AlphaGo Zero以100:0戰績完胜前代 令世人震驚

【新唐人北京時間2017年10月20日訊】倫敦時間10月18日的下午6點(亞太19日凌晨),DeepMind團隊公布了AlphaGo的最新升級版本AlphaGo Zero,指即將在最新一期的《自然》雜誌上,對這個目前為止最強版的人工智慧使用的相應技術做出詳解。

據DeepMind團隊所言,AlphaGo Zero具備了真正的「自我學習」的能力,它經過3天的訓練後,就以100:0的戰績完勝了前代的AlphaGo。

據公開的資訊,DeepMind團隊研發的前代人工智慧AlphaGo自從「出山」以來,一路過關斬將,從未敗給人類,僅韓國棋手李世石曾與其戰平過一局,其餘所有的「人機大戰」都是AlphaGo獲勝。

今年5月,在烏鎮舉辦的圍棋峰會上,世界圍棋排名第一的柯潔以0:3敗北後,DeepMind團隊即宣布AlphaGo退役,不再與人類下棋。

如今AlphaGo升級版的AlphaGo Zero竟然只用了1台機器和4個TPU就輕輕鬆鬆以100:0完勝前代AlphaGo,這個事實令所有關注人工智慧發展的人感到震驚。


DeepMind團隊宣布,最強版的人工智能AlphaGo Zero經過3天的训练,就以100:0的战绩完胜前代AlphaGo。(視頻截圖)

據DeepMind的介紹,AlphaGo Zero相較此前的版本在以下方面有新的提升:

1.AlphaGo Zero通過與自己不斷挑戰來進行提升,不依賴人類數據。

2.AlphaGo Zero只使用圍棋棋盤上的黑子和白子作為輸入,而上一版本的AlphaGo的輸入包含了少量人工設計的特徵。

3.AlphaGo Zero 不使用「走子演算」,它依賴於高質量的神經網路來評估落子位置。其它圍棋程序使用的快速、隨機遊戲,用來預測哪一方將從當前的棋局中獲勝。

4.在訓練過程中,AlphaGo Zero每下一步需要思考的時間是0.4秒。相比之前的版本,僅使用了單一的神經網路。

DeepMind聯合創始人兼CEO哈薩比斯稱:「AlphaGo Zero是我們項目中最強大的版本,它展示了我們在更少的計算能力,而且完全不使用人類數據的情況下可以取得如此大的進展。」

(記者欣然報導/責任編輯:古韻)


DeepMind團隊宣布,最強版的人工智能AlphaGo Zero經過3天的训练,就以100:0的战绩完胜前代AlphaGo。(視頻截圖)

相關文章
評論