阿尔法狗是怎么看透人类棋局的,阿尔法狗的真相是什么?

  • 大家都知道,阿尔法狗已经称霸围棋圈,也可以说已经达到被人类顶尖赛棋手仰视的高度,目前阿尔法狗表示很孤单,没有选手愿意与他们对弈。那么阿尔法狗为什么能打败世界冠军呢?它是用什么信念来支撑的,我们今天来揭秘。
  • 中国科学院院士、全国信息技术标准化委员会大数据标准工作组组长、知名战略科学家梅宏,在《中国经济大讲堂》节目中这样讲到:
  • 每一个棋,不管是中国象棋、国际象棋甚至我们的五子棋都有一个规则,而且有一个输赢的标准。所以有这个东西我们实际上是可以建立规则,马走日象走田一样。我们形成了一个搜索空间,我们过去的做法都是用计算机去完成的空间的搜索,找出最可能赢的这么一个套路。
  • 阿尔法狗算法
    阿尔法狗算法
  • 换一个思路大家想想,围棋高手下棋,很多时候是棋感,对当时棋势的把握,棋局的把握。很多高手直觉一来,他就知道下一个棋该到那儿,这就是棋感。这件事情捅破以后,计算机怎么做?相当于把围棋盘黑白子变为一个图片,那么这件事情恰恰是计算机最擅长的,做图像的匹配和识别。
  • 首先,它是用的数据,这个数据就是人类不可能去想象出来。阿尔法狗棋谱用到的数据,三万多幅人类专业棋手对决的棋谱,三千万盘自我对弈的棋局。它用人类的棋谱,打谱学习,然后自己又和自己下棋,最新版的阿尔法狗Zero,用了490万盘,自己和自己对弈。大家想想人类的棋手每年下多少?大概一千盘了不起,脑袋能记多少?再牛的人也记不了多少。
  • 可以相像,阿尔法狗要笑傲围棋圈很久了,人类的脑子再强大也不可能记住这么多的阿尔法狗原理,也不可能去围绕阿尔法狗的算法做出向相应的策略。还好,阿尔法狗的创始人谷歌官方强调说,阿尔法狗的领域不止用在围棋上面,围棋赛只是他们小试牛刀,将把阿尔法狗用到其它更多的途径上。

阿尔法狗活跃度极高?但是请正确看待人工智能

  • 2016年,当世界很多顶尖高手沉醉于自己的技术时,阿尔法狗悄然崛起,甚至以两句完胜顶尖韩国围棋赛手李世石,赛后大家对本次比赛还没有引起足够的兴趣,只是当成茶余饭后的话题讨论一下而已。
  • 2017年5月AlphaGo 柯洁对弈,完败柯洁后大家才逐渐认识到阿尔法狗的强大性。后来阿尔法狗宣布隐退几月后,2017年研发团队公布,最强版阿尔法狗代号AlphaGo Zero诞生。再进化后的阿尔法狗,独门秘籍是“自学成才”。更可怕的是,它的自学成才速度,3 天就能100:0 碾压曾击败李世石的旧狗Lee版。倘若学习到40天,这家伙就可以击败所有版本的AlphaGo。
  • 对于这种变态级机器人的存在,世界围棋冠军柯洁回应道:“一个纯净、纯粹自我学习的AlphaGo是最强的……对于AlphaGo的自我进步来讲,人类太多余了。”为此世界很多以霍金为代表的知名人士也站出来警告。霍金说,“在我的一生中,我见证了社会深刻的变化。其中最深刻的,同时也是对人类影响与日俱增的变化,是人工智能的崛起。”人工智能的崛起,要么是人类历史上最好的事,要么是人类文明的终结。
  • ALphaGo
    ALphaGo
  • 2017年3月,霍金在接受英国《泰晤士报》采访时再次发出警告,“人工智能进一步发展便可能会通过核战争或生物战争摧毁人类。人类需要利用逻辑和理性去控制未来可能出现的威胁”。霍金认为,人类很有可能会造出超级人工智能,这些人工智能程序能够全面超越人类,并有可能完全取代人类成为一种新的生命物种。
  • 无非就是加强新一代人工智能开发应用,呼吁更多的企业利用以阿尔法狗为代表的人工智能,推动人工智能的发展等….看得出来这次国民政府蛮重视人工智能核心技术发展的,不管技术如何变化,只要不损害人民的利益一切都是可以的。至于阿尔法狗未来与人类的关系怎样,我们只有静静等待,让时间来告诉大家谜底。

阿尔法狗到底有什么目的,它的动机单纯吗?

  • 人工智能的强大让全世界人民感到担忧和恐慌,甚至全球一些知名人物也站出来警告人工智能开发商,称其发展太快给人类的生活带来里压力。近日阿尔法狗的创始人哈萨比斯面对舆论压力站出来辟谣说:”公众对人工智能的警示掩盖了人工智能带来的帮助。
  • 距离人脑水平的人工智能仍然相当遥远,可能还需要几十年。谷歌并不只是想做一个棋类程序,而是想做一个通用的智能计算系统。”如果解决了围棋问题,谷歌希望能把这套人工智能算法用于灾害预测、风险控制、医疗健康和机器人等复杂领域。也就是说谷歌的目的还是为了更好的服务人类,没有任何恶意。希望能够像他说的这样,是朝着对人类有利的方面进行研究与开发。
  • 柯洁对战阿尔法狗
    柯洁对战阿尔法狗
  • 面对有人质疑“阿尔法狗为什么能打败世界冠军”的问题,他同时也解释说“传统的人工智能方法是将所有可能的走法构建成一棵搜索树 ,但这种方法对围棋并不适用。其中一个神经网络“决策网络”(policy network)负责选择下一步走法,另一个神经网络“值网络”(“value network)则预测比赛胜利方。阿尔法狗的原理是:谷歌方面用人类围棋高手的三千万步围棋走法训练神经网络,与此同时,AlphaGo也自行研究新战略,在它的神经网络之间运行了数千局围棋,利用反复试验调整连接点,这个流程也称为巩固学习,通过广泛使用Google云平台,完成了大量研究工作。
  • AlphaGo在与人的对弈中用了“两个大脑”来解决问题:“决策网络”和“值网络”。通俗来说就是,一个大脑用来决策当前应该如何落子,另一个大脑来预测比赛最终的胜利方。看完,小编也忍不住呆住了,这是什么节奏,用两个大脑来对付一个脑子的人类,你们不赢那才叫奇怪呢?
  • 值得一提的是,李世石也是第一次与机器对战,所以他无法像和人类对战那样,先研究对方的棋谱和下棋风格。李世石所能做的就是和自己对弈。谷歌AlphaGo也是通过这种方式锻炼自己,真正做到了“人工智能”。

ALphaGo Zero王者诞生,平地一声雷惊醒无数人

  • 距离上次人工智能对弈围棋赛手快一年了吧,大家似乎并没有减少对人工智能的热爱,相反更加钟爱。特别那场阿尔法狗大战李世石,现在还会拿出来讨论一番。甚至也有人对阿尔法狗的推出表示遗憾,称再也看不到那样的精彩比赛了,毕竟它宣布退出且对外宣布阿尔法狗不止在围棋界发挥,还有更大的用途。
  • 没想到几月以后等大家淡忘此事后却宣布  AlphaGo Zero 最强版本诞生,让人措手不及。上周 DeepMind AlphaGo 人工智能围棋团队的一篇新论文,题目是“Mastering the Game of Go without Human Knowledge”。这篇论文不仅被顶级学术期刊 Nature 发表,而且立刻被媒体反复报导,引起社会热议。
  • 这篇论文让人关注的点有四点:
  • 第一、只告诉机器围棋规则,但是不告诉它定式等等人类总结的围棋战术,也不让它读人类棋手比赛的棋谱,让机器完全自学成才。
  • 第二、机器完全靠自己摸索,自主总结出了定式等等围棋战术,而且还发现了人类上千年来没有发现的定式。从零开始,机器自学了不到 40 天,就超越了前一版 AlphaGo(AlphaGo Master),而 AlphaGo Master 几个月前,曾以 60 : 0 的战绩,战胜了当今几乎所有人类围棋高手。
  • ALphaGo算法
    ALphaGo算法
  • 第三、 AlphaGo Zero 的算法,比 AlphaGo Master 简练很多。那么什么是AlphaGo Zero 的算法呢?它其实很简单并不复杂。理解清楚 Monte Carlo Tree Search、深度学习启发函数和置信上限,这三个概念就行了。
  • 平时改好围棋的朋友都知道,围棋棋面总共有 19 * 19 = 361 个落子位置。假如电脑有足够的计算能力,理论上来说,我们可以穷举黑白双方所有可能的落子位置,找到最优落子策略。但是,如果穷举黑白双方所有可能的落子位置,各种组合的总数,大约是 250^150 数量级。这个数太大了,以至于用当今世界最强大云计算系统,算几十年也算不完。有没有不穷举所有组合,就能找到最优或者次优落子策略的算法呢?有,Monte Carlo Tree Search 就是这样一种算法。
  • 这次 AlphaGo Zero强者诞生,是否对棋手们造成很大的危险,具体情况还不知。如果真的要再次宣战的话,围棋赛手们应该也会用于挑战的吧,毕竟能够跟阿尔法狗对弈,那绝对是技术了得呀!

围棋之神阿尔法狗的寂寞—下棋无人能战“我”

  • 阿尔法狗,作为新一届的围棋之神一直一来都是备受着大众的关注,而听说阿尔法狗最近也有了“自己的烦恼”,它觉得已经没人能战胜它的棋艺了,确实如此,说实话自己世界棋手李世石和柯洁的落败,就已经肯定了阿尔法狗的智慧。
  • 如今,AlphaGo教学工具上线,更多的人可以通过它来学习下围棋。从挑战人类,到无人能及,再到回馈人类, AlphaGo的使命已经完成。那么它是如何走到这一步,对人类围棋历史又做出了什么样的贡献?
  • 2015年年末,欧洲围棋冠军、职业围棋二段樊麾在接到DeepMind的邀请,希望他能到伦敦与计算机程序下棋时,他想得非常简单,也很有自信。在5盘的对弈中,樊麾很快败下阵来,而且输得让他不忍看赛后媒体对他的评价。不过,很快地,作为第一个真正感受到AlphaGo实力的人,樊麾加入了DeepMind团队,一起为提升它的技能努力。
  • 柯洁对战阿尔法狗
    柯洁对战阿尔法狗
  • 2016年1月份,《自然》杂志发表了DeepMind关于AlphaGo的第一篇论文,重点阐述了如何通过神经网络和蒙特卡洛树搜索让计算机程序掌握下围棋的方法。这篇文章引起的波澜不小,但更多人愿意讨论的是,当时DeepMind宣布,将在3月份,挑战围棋职业九段、韩国棋手李世石。关于这场比赛,包括中国围棋界在内,很多人对李世石抱有更多的信心。  即便在李世石输掉前2局比赛后,当今世界围棋第一人柯洁仍对人类信心十足,他在自己的微博上写到:“就算阿尔法狗战胜了李世石,但它赢不了我”。最终的比分定格在4:1,如果不是第四盘,李世石下出 “神来一手”,抓住AlphaGo的漏洞,比分可能会更悬殊。
  • 挑落职业棋手,AlphaGo引来了全球的关注。DeepMind称,全球有2000万观众通过电视直播观看了它与李世石的比赛。直播后,关于人工智能、神经网络、深度学习的讨论热闹非凡,人工智能浪潮也由此展开。正是因为输掉了李世石一盘棋,AlphaGo获得了韩国棋院颁发的“职业九段”证书,世界排名上甚至一度超越柯洁排在第一位。
  • 在去年17年的时候阿尔法狗更是“猖狂的”在直播中直接以60:0的战绩横扫了中日韩一些十分厉害的棋手,更是为它自己打下了围棋届的“天下”,而阿尔法狗未来的发展也是被大家一直津津乐道的,毕竟大家还是很期待看到更聪明的阿尔法狗。

围棋胜利的意义究竟在哪里?还不如像阿尔法狗学习呢

  • 人总是有好胜心,包括像是下围棋,有的时候会想一个问题,围棋的胜利能代表什么?这只是一个比赛结果吗还是说能在比赛中学习到什么,其实和阿尔法狗的比赛中我们能学习到很多东西,并不是说输给阿尔法狗觉得丢人然后就结束了,柯洁说过阿尔法狗是“围棋上帝”派来指引我们的。
  • “围棋有很多不确定的因素,机器的局限性是很多的,在下棋过程中也会出现漏洞,因此之前观看阿尔法狗跟樊麾的比赛,让我以为计算机达不到围棋选手的最高水平。结果大家都知道,我输了。”惨败让李世石改变了他对阿尔法狗的看法。在输给阿尔法狗后,柯洁豪取22场连胜,拿下全运会围棋比赛冠军。但再次升级的阿法尔狗,已经不需要柯洁的棋谱了。
  • 根据《自然》杂志的最新介绍,Alpha Zero的设计理念和系统配置和Lee/Master完全不同。此前,Lee/Master都是用上千盘人类业余和专业棋手的棋谱进行训练,而升级后的阿尔法狗不依托于人类的先验成果,不靠“吃棋谱”进步,完全靠自我对弈学习下棋。
  • 阿尔法元之所以能当自己的老师,是用了一种叫强化学习的新模式。系统从一个对围棋一无所知的神经网络开始,将该神经网络和一个强力搜索算法结合,自我对弈。在对弈过程中,神经网络不断调整、升级,预测每一步落子和最终的胜率。
  • 阿尔法狗的图片
  • 仅仅经过3天的训练,这套系统已经可以击败AlphaGoLee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。40天训练后,AlphaGo Zero总计运行了大约2900万次自我对弈,使得AlphaGoZero得以击败AlphaGoMaster,比分为89比11。
  • 在系统配置方面,AlphaGoZero也比前几代系统更加节能,AlphaGoLee需要使用几台机器和48个谷歌TPU机器学习加速芯片,AlphaGoZero只需要使用一台配有4个TPU的机器即可。阿尔法狗赢了李世石后,哈萨比斯说,“阿尔法狗从来都不是我们的唯一,甚至不是我们最重要的研发,我们希望将此应用于更大的真实世界的问题。”升级过后融入了Deep Mind最新技术的新阿尔法狗,目标已经不再只是打败人类棋手,而是将目光转向了实际应用方面。
  • 正如柯洁所说的阿尔法狗是“围棋上帝”派来指引我们的,所以很多时候我们需要转变一个想法去考虑就是人类与阿尔法狗围棋比赛的初始点和结果它们所能给我们带来的影响,人类应该一直“跑着”去不断的追寻一些真理才是。

棋迷的呐喊:阿尔法狗赢得并不光彩,有本事让两台机器比赛!

  • 在之前关于阿尔法狗与世界棋手的比赛中,阿尔法狗可谓是“横扫”围棋届,柯洁和李世石等一些大将都败在阿尔法狗的手中,一些棋迷看不下去了,纷纷呐喊说谷歌有本事让两台机器比赛,这个究竟是怎么一回事呢?
  • 5月25日,中国围棋峰会人机大战,柯洁持白力战阿尔法狗,中途柯洁一度以为就要轻松战胜AlphaGo赢下一局,连谷歌“AlphaGo之父”哈萨比斯都在Twitter上表示:“这是一场神奇而又复杂的比赛。柯洁已经将AlphaGo逼到了极限。”可惜柯洁后续心情太过激动紧张,导致下棋失误。目前比分2:0。
  • 如无意外柯洁极有可能以3:0完败阿尔法狗。如果说去年李世石抓住了阿尔法狗的弱点险胜一局,那么这次阿尔法狗2.0版本几乎找不到弱点!去年的阿尔法狗主要用了三种算法,即”蒙特卡洛树搜索”加“”监督学习”加”增强学习“”。其中蒙特卡洛树搜索是一种升级版的暴力计算;监督学习,其实是通过记录3000万部人类棋谱,对六段以上职业棋手走棋规律进行效仿,这也是阿尔法狗获得突破性进展的最为关键算法;而增强学习作为辅助,是两台阿尔法狗从自我对战中学习如何下棋。
  • 阿尔法狗
    阿尔法狗
  • 每当获取棋局信息的时候,阿尔法狗会根据策略探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最幼考察的位置将成为 阿尔法狗 的最终选择。简单来说,阿尔法狗下棋依靠的是概率,而概率的得出则依靠前期学习。而这次与柯洁对战的阿尔法狗相较于去年,已经判若两“机”。
  • 最初的阿尔法狗依靠监督,而新阿尔法狗则强化了增强学习最初的阿尔法狗主要依靠监督学习,即学习对象几乎全部来自人类棋手,而新版的阿尔法狗则强化了增强学习,主要对机器自我对弈产生的棋局进行学习。难怪柯洁会觉得,去年阿尔法狗的下法还很接近人类,但今年自己对战时,阿尔法狗已变得更加不合乎“常理”,下了很多人类棋手不可能下的棋子。也就是说,即便柯洁像李世石那样下非常规的招数,阿尔法狗也能轻松应对。
  • 其实人的一些思考方式和机器的逻辑是截然不同的,用思考方式对战逻辑,只要运算速度足够,逻辑是一半以上的概率都占优势的,若是之后让两台阿尔法狗对战,AI与AI的对战,到时候就能够看清楚逻辑与逻辑的对战,这样我想大众也不会觉得阿尔法狗赢得并不出彩了!

阿尔法狗的知识宝库能够为人类之后的生活带来什么影响?

  • 大家应该已经都有发现,目前在市场上已经有了很多人工智能的一些生活用品,比如像自动机器人,自动清扫器等等,这些都是人工智能给大家带来的便利,那么像是之前备受瞩目的阿尔法狗,它能够为大众带来什么呢?
  • “围棋人工智能的出现,重启了人类究竟对围棋这项游戏了解多少这个问题。”美国围棋协会的Andy Okun和Andrew Jackson在《自然》杂志上曾这样评价阿尔法狗给围棋界带来的改变。显然,阿尔法狗带来的进步肯定也是围棋棋手日后学习的宝库。要知道,阿尔法元是独立学习训练的,但它使用的招数却超越了许多人类棋手的下棋顺序和招法。也就说,人工智能丰富了我们下围棋的选择。或许它在下棋过程中有些下法是人类无法理解的,甚至认为是错误的,但在机器的理解看来确实万分正确的。从这些经验中,人类棋手看到了与以往不同的围棋世界。
  • 阿尔法狗算法
    阿尔法狗算法
  • 包括柯洁、古力等多位职业围棋九段棋手已经多次在自己的个人微博账号上表示了阿尔法狗对他们带来的启发。尤其是在阿尔法狗教学工具上线后,柯洁第一时间转发评论到:“重新学围棋”。世界围棋冠军、职业九段棋手常昊认为:“教学工具不一定是标准答案,更多的是给予了我们无限的思考空间。”曾为乌镇人机大战选手之一、职业九段棋手周睿羊则表示:“定式什么的还是不要随便学了,看到工具一些高级下法之后感觉到又可以起飞了。”
  • “之前,人类与人工智能对话总是显得非常遥远,甚至像科学小说。但现在对于围棋选手来说,对话已经发生了,就在这里。” Andy Okun和Andrew Jackson说。
  • 但改变围棋并不是阿尔法狗的最终目的,DeepMind创始人戴密斯·哈萨比斯(Demis Hassabis)曾在多个场合提到过,自己成立公司主要是想用人工智能技术改变我们的生活。
  • 如果到最后,能够将这些优秀的技术应用到实际生活中,那么我想给大众带来的便利以及帮助肯定是极大的,毕竟将阿尔法狗的技术加入到医疗服务中本身就是一个挑战,而这个挑战会带来怎样的影响以及效果,这些都是受大众的期待与关注的。

阿尔法狗的退赛:和大众分享自己胜利的独家秘诀

  • 之前出来了一个比较爆炸的新闻那就是围棋界的黑马阿尔法狗要退役了,一部分棋迷表示自己十分的舍不得阿尔法狗,之后觉得没机会再看阿尔法狗下棋了,而阿尔法狗之父则决定在阿尔法狗之后退赛后会将一些知识宝典分享给大众。
  • 在之前最后一局比赛结束后的发布会上阿尔法狗之父、DeepMind创始人戴密斯·哈萨比斯(Demis Hassabis)说:“本周的比赛聚集了围棋起源地最优秀的棋手参与,是阿尔法狗作为一个竞赛系统能够对弈的最高级别对手。因此,本次中国乌镇围棋峰会是阿尔法狗参加的最后对弈比赛。”
  • 随后,阿尔法狗团队负责人Dave Sliver(大卫·席尔瓦)说这就是阿尔法狗最后3场比赛,之后它和人类将会以其他形式互动,回馈人类。哈萨比斯解释了为何做出这样的决定,他说:“周二(5月23日)来的比赛超出了我们的期望,我们见证了天才柯洁把阿尔法狗推向了极限,比赛也异常精彩。此次的配对赛和团体赛也为我们开创了新的天地,这种类型的比赛与合作都是史上第一次。阿尔法狗和我们的团队都学到了很多。这种比赛展现了AI的最高水平,让人类挖掘了AI作为工具的潜力,从而帮助人类拓展新的知识领域、发现真相。”
  • 阿尔法狗
    阿尔法狗
  • 不过,哈萨比斯宣布,人类棋手与阿尔法狗的故事并不会就此结束。阿尔法狗的启蒙老师、欧洲围棋冠军樊麾随后表示:“阿尔法狗团队将与柯洁合作,对此次的棋局进行分析,根据阿尔法狗内部的数据,与柯洁研究此次的对局,展现比赛的过程并做成视频,与全世界的围棋爱好者共同分享。阿尔法狗团队还为全球围棋爱好者准备了一份礼物。阿尔法狗在于李世石比赛后,进行了成千上万的自我对战。这些自我对战是阿尔法狗最宝贵的财富,我们近期会公布50盘阿尔法狗自我对战的棋局。这些自我对战都是以慢棋的形式体现出来。”
  • 目前的话有关于阿尔法狗的论文和纪录片都已经在网上可以看到,很多一些关注围棋的朋友也都是开始看了,而阿尔法狗之父此举也可谓是打破了一些朋友对于阿尔法狗的偏见,而之后的一些人工智能的发展也是更受大家的关注了。

人类智慧+阿尔法狗的智慧两者结合能够带来什么影响?

  • 都说1+1能够带来双重效果,那么如果将人类智慧+阿尔法狗的智慧结合在一起,又会带来怎样的结果呢?或者是说人工智能产物阿尔法狗又会有多聪明或者是说两者能够带来什么影响呢?今天在这篇文章里我们一起探讨一下。
  • 此前,被网上观棋者昵称为阿尔法狗的谷歌机器棋手阿尔法狗,对战曾为世界围棋冠军的韩国棋手李世石九段,最终以四比一大胜。这是继1997年 IBM 的“深蓝”(Deep Blue)机器棋手击败俄国国际象棋特级大师卡斯帕罗夫以来,人工智能对人类智能的又一次大挑战。围棋的变化要比国际象棋远为复杂,人们曾经认为机器掌握围棋近乎不可能,更不要说战胜人类。却料不到2016年3月里,机器的胜利有如惊蛰后的春雷,突然炸响。
  • AlphaGo算法
    AlphaGo算法
  • 阿尔法狗所用的“深度学习”方法,其基础是模式识别。此前在实用中第一次大放光彩,是2012年多伦多大学学生在药业巨头举办的筛选分子结构大奖赛中笑拔头筹——这些学生其实并不懂药物结构。同样,阿尔法狗团队也不需要精通围棋。但语言毕竟不是分子结构图或围棋谱,机器如何发现“桂华流瓦”和“月光照在屋顶上”是同样意思?即使设计者精通中文,这也是个棘手问题。在图灵测试中,如果机器从网络海量信息里找到的出现次数最多的回答,总是些大路货,那么裁判确实在与“人”对话,但不是在与某个特定的人对话。
  • 人工智能真正提出的,其实是人何以为人的本质问题。更具体地讲,在这样一个填空题里——“人类是能够…..的唯一物种”——你填什么?很不幸的是,这一百年来,我们人类填进去的各种答案,一个又一个被科学的进展抹掉了。
  • 所以的话人类其实不能太过于自大而阿尔法狗也应当在人类能够接受的程度上一起成长,目前的话还是有很大 一部分人都担心人工智能的智慧会取代人类的智慧,所以的话要让大众取消这个想法,因为最终目的是为了达成双重效果,达成双赢,所以还是需要两者一起合作的。