人類滾開！AlphaGo Zero太可怕，「自學3天」就以100:0把舊版Alpha Go幹掉！

去年時，DeepMind公司創造的AlphaGo擊敗南韓棋王李世乭；今年5月，AlphaGo Master又以3：0的絕對優勢戰勝圍棋世界冠軍柯潔。幾次勝利下來，人工智慧的發展讓全世界的人都震撼了。我們本以為這就是AlphaGo的巔峰，沒想到Google旗下的AI實驗室又有了新動作，他們帶來了更強大的AlphaGo Zero，曾經打敗人類旗手的版本在它面前簡直不堪一擊。

之前的圍棋大師AlphaGo學習時，需要依靠人類事前輸入大量資料，幫忙訓練技能。但AlphaGo Zero依靠自學就能做到。人類只要輸入基本的圍棋規則，它就能自行下棋，記錄每次的勝負決策、不斷學習。因為沒有人類的經驗和成規束縛，它的成長速度反而更快，弈棋策略更加厲害。

▼DeepMind公司在《自然》科學期刊上發表了一篇名為「不需要人類知識就稱霸圍棋」（Mastering the game of Go without human knowledge）的學術論文，展示了AlphaGo Zero在全球最困難的棋藝競技中，不靠任何人類知識，自我學習成為高手的過程。

▼它只花3天時間，就贏了曾經打敗李世乭的AlphaGo版本，成績還是碾壓式的100：0。學習21天後，它又贏了曾經打敗柯潔的AlphaGo Master版本。短短40天，它就完成了2900萬次的對戰學習。與過去最強的AlphaGo對弈，它的勝率高達90%，成為了至今最優秀的版本，也是當之無愧的「世界最強圍棋選手」。

AlphaGo Zero使用的是「強化學習」方法。它將神經網路和演算法結合，持續自我對弈，練習幾百萬、幾千萬場，每次的更新都能增強、調整系統，用以預測下一步落子的方向和遊戲輸贏走勢。人類積累千年的圍棋智慧，它用幾天時間就全部掌握，還青出於藍而勝於藍。

人工智慧太強大了，讓人忍不住有危機感啊。

本文經過授權請勿轉載，看更多文章請到 bomb01.com

喜歡這篇文章嗎？立刻分享出去讓更多人知道～

分享到臉書分享到Google+ 分享到微信

人類滾開！AlphaGo Zero太可怕，「自學3天」就以100:0把舊版Alpha Go幹掉！

舉報文章 - 人類滾開！AlphaGo Zero太可怕，「自學3天」就以100:0把舊版Alpha Go幹掉！