ALphaGo Zero王者诞生,平地一声雷惊醒无数人




  • 距离上次人工智能对弈围棋赛手快一年了吧,大家似乎并没有减少对人工智能的热爱,相反更加钟爱。特别那场阿尔法狗大战李世石,现在还会拿出来讨论一番。甚至也有人对阿尔法狗的推出表示遗憾,称再也看不到那样的精彩比赛了,毕竟它宣布退出且对外宣布阿尔法狗不止在围棋界发挥,还有更大的用途。
  • 没想到几月以后等大家淡忘此事后却宣布  AlphaGo Zero 最强版本诞生,让人措手不及。上周 DeepMind AlphaGo 人工智能围棋团队的一篇新论文,题目是“Mastering the Game of Go without Human Knowledge”。这篇论文不仅被顶级学术期刊 Nature 发表,而且立刻被媒体反复报导,引起社会热议。
  • 这篇论文让人关注的点有四点:
  • 第一、只告诉机器围棋规则,但是不告诉它定式等等人类总结的围棋战术,也不让它读人类棋手比赛的棋谱,让机器完全自学成才。
  • 第二、机器完全靠自己摸索,自主总结出了定式等等围棋战术,而且还发现了人类上千年来没有发现的定式。从零开始,机器自学了不到 40 天,就超越了前一版 AlphaGo(AlphaGo Master),而 AlphaGo Master 几个月前,曾以 60 : 0 的战绩,战胜了当今几乎所有人类围棋高手。
  • ALphaGo算法
    ALphaGo算法
  • 第三、 AlphaGo Zero 的算法,比 AlphaGo Master 简练很多。那么什么是AlphaGo Zero 的算法呢?它其实很简单并不复杂。理解清楚 Monte Carlo Tree Search、深度学习启发函数和置信上限,这三个概念就行了。
  • 平时改好围棋的朋友都知道,围棋棋面总共有 19 * 19 = 361 个落子位置。假如电脑有足够的计算能力,理论上来说,我们可以穷举黑白双方所有可能的落子位置,找到最优落子策略。但是,如果穷举黑白双方所有可能的落子位置,各种组合的总数,大约是 250^150 数量级。这个数太大了,以至于用当今世界最强大云计算系统,算几十年也算不完。有没有不穷举所有组合,就能找到最优或者次优落子策略的算法呢?有,Monte Carlo Tree Search 就是这样一种算法。
  • 这次 AlphaGo Zero强者诞生,是否对棋手们造成很大的危险,具体情况还不知。如果真的要再次宣战的话,围棋赛手们应该也会用于挑战的吧,毕竟能够跟阿尔法狗对弈,那绝对是技术了得呀!

发表评论

电子邮件地址不会被公开。 必填项已用*标注