AlphaGo再升級 无师自通的人工智能何去何从

不依靠人类的任何知识、数据、示例或特征,完全从基本理论开始学习的阿尔法狗最新版本阿尔法元再次震惊世界:自学三天,以100:0的成绩完胜此前击败李世石的阿尔法狗(alphago)版本﹔自学40天,以89:11的绝对优势击败阿尔法狗(alphago)Master(大师)版。这给人们提供了一种新思路,完全抛弃人类以往的经验和数据,让机器从零开始,自己学习。

尽管这并非是理论突破,但这一新思路必将对人工智能发展产生重大影响。当机器能够“无师自通”,人工智能会走向何方?

“从无到有”的时间比想象中快得多

对从事人工智能研究的人来说,近年来人工智能发展的速度超乎想象。去年3月,阿尔法狗4:1战胜李世石,让人们意识到这可能是人类在围棋上战胜机器的最后一战,以至于今年5月,阿尔法狗(大师)与当下围棋第一人柯洁比赛前,几乎没有人看好人类能赢。结果不出所料。

与旧版阿尔法狗不同,阿尔法元是完全基于自己学习的机器,它根据人类给定的规则,充分发挥计算机的计算能力和存储能力,短期之内就达到了令人震惊的效果。

上海交通大学计算机系特聘教授马利庄提醒,如果把学习了3000万张人类棋谱的旧版阿尔法狗看成是人类3000年围棋智慧的结晶,那么“阿尔法元”仅用三天就将它碾过了。 “这充分说明机器通过自我学习,可以非常快速地完成从低水平到高水平的转变。”马利庄甚至断言,在目标明确且规则比较透明的领域,机器肯定会超越人类。

人类的优势在于理解、概括整体的能力

抛弃人类经验的机器学得更快,是不是人类经验限制了机器发展?针对这种说法,上海交通大学生物医学工程学院教授、Med-X研究院副院长殷卫海表示,阿尔法狗和阿尔法元的创造者和拥有者都是人,同时人类也决定着阿尔法狗和阿尔法元是否参加比赛或者退役,所以阿尔法元的出现不仅不是人类无能的表现,更预示着人类的创造能力达到了一个新高度。

在思维方式上,人与机器有着巨大差异。马利庄说:“人类强于概念、总结和推理,机器强于记忆、计算。举例来说,人眼能在1/300秒内就识别一张图上两个人物之间的关系,而谷歌公司为了让机器识别猫,用上了1.6万个芯片,花了三天时间。”即使人工智能下棋赢了人类,我们仍觉得对面坐着的那个不是真正的智能。阿尔法元的“无师自通”技术并不适用于所有领域,要像人类那样处理复杂事务和模糊场景,仍需人类经验。科学家正在努力消弭人与机器的界限,比如让人机能够自由无碍地交流、让机器人能够帮忙照顾老人和孩子等,这就需要人工智能在语音识别、图像识别、自然语音理解、无人驾驶等方面取得突破。而目前这方面人工智能还有很长的路要走。

对人工智能发展要有长远预期

“阿尔法狗(alphago)最新版本阿尔法元既是人类技术上的一次胜利,也提醒人们要预防人工智能失控的可能,毕竟它可以脱离人类的经验发展出自己的行为模式。”上海交通大学科学史系主任江晓原说。

马利庄表示,毫无疑问阿尔法狗(alphago)最新版本阿尔法元给出的算法会很快投入到人工智能领域的各个方面。要注意的是,一旦出现人机对抗,就是单枪匹马与汪洋大海的抗争———机器想要更强大,加装一块中央处理器或图形处理器非常容易,它们之间的信息是光速传播的,而人与人之间的沟通需大量时间,一个人说的话也不一定完全被对方理解。

殷卫海说,一个可以预见的现实是,如果没有法律法规的限制,再过30-50年,智能机器人的数量将超出想象。我们应该让智能机器人不受限制地增长吗?我们能与智能机器人和平共处吗?人们应该把这些问题从科幻层面带到现实场景中来,把人工智能放到未来50-100年时间尺度上进行思考。

亚洲人物:要打败「阿尔法狗」的柯洁

「太厉害了,他绝对是世界第一!」日本首位包揽围棋七大赛冠军头衔的27岁棋手井山裕太这样赞叹道。让他如此佩服的,是年仅19岁的中国棋手柯洁。

2016年12月,柯洁在韩国举行的国际围棋大赛上取胜,获得了约180万元奖金以及个人第4个世界冠军头衔他曾在微网志上写道:「我的传奇,在我的呼吸停止之前,永不停止」,柯洁很自信,也很沉稳。

柯杰
1997年年,柯洁出生于浙江省一个山中小城里的双职工家庭0.7岁时,他开始跟着酷爱围棋的父亲出入附近的棋馆,很快就迷上了围棋。柯洁经常跑到围棋老师郑一兵家里下棋,不赢就不回家。1年以后,就连周围的大人都无法和他抗衡。

「很遗憾我已经没有什么可以教给你了,你去北京学习吧」,柯洁听从了老师的话,8岁那年独自一人离开了故乡。他在围棋馆投宿,一心一意埋头研究围棋,11岁时已经成为中国仅有的400名专业棋手之一,同时也是史上最年轻的专业棋手。母亲周柳萍知道他是真的热爱围棋,辞去工作到北京照顾他。

母子两人在居住的老旧狭窄地下室里开始了追梦之旅。面对屡战屡败的儿子,母亲曾多次劝他干脆回老家算了,但柯洁却没有放弃苦。学围棋10年后,18岁的柯洁终于首次夺得了世界冠军。

2016年,柯洁获得的奖金已经超过600万元,在北京买了房,把父亲接来。他带着金手镯,喜欢手机游戏,爱吃天妇罗和炸鸡块。明明是时尚的年轻小伙,对于围棋却异常执着,经常在梦里也看到棋盘,睡眠很浅。

这样的柯洁让母亲周柳萍非常骄傲。她表示在自己出生的7,80年代中国还很贫穷,人生几乎无从选择,所以会尽量支持儿子选择自己的生存方式。

90年代以后的经济高速增长使得父母们的愿望有了实现的可能。独生子女政策下成长起来的年轻人大多被娇惯且自我意识强烈。且不说文化大革命,甚至就连1989年的天安门事件也不知道的25岁以下年轻人共有5亿,接近中国总人口的40%。

这些年轻人曾经被讽刺为「小皇帝」,他们随心所欲地投入到自己喜欢的事情中,亚洲因严格的国家统制而被诟病的缺少创造性在他们身上得到了解放。微网志上很多人都称赞柯洁虽然狂妄,但不得不承认他有这个实力。

自我学习,不断进化的人工智慧(AI)的出现告诉人们,创造性将不再是人类的特权。与国际象棋,象棋相比,围棋更加复杂,之前不少人认为人类处于优势地位。但2016年韩国顶尖棋手却败给了人工智慧围棋软体「阿尔法狗(AlphaGo)」震惊世界。

当时,柯洁曾放话称:「就算阿法狗战胜了李世石,但它赢不了我」在世界棋手网路排名中柯洁排名第1,排名第2的阿尔法狗实力日益增加柯。洁表示一定会努力赢过它,早熟的天才棋手也罕见地变得谨慎起来。

赢围棋不足为奇中国网民挑战“阿尔法狗”比赛麻将

美国谷歌研发的“阿尔法狗”(AlphaGo)电脑程式,15日在首尔终于以四比一的战果,击败世界级棋王李世石,完成了5场赛事。不过,中国的网民认为,为人类把守最后一关对抗电脑人工智能的,是有中国“国粹”之称的麻将,有网民甚至向“阿尔法狗”下战书比赛麻将。

世界围棋职业棋手排名的GoRatings网站,只能计算曾经吃败仗的棋手的积分,而由于阿尔法狗之前全胜欧洲棋王,未获评分,但在这次的第四场赛事输给李世石,因此首次获得评分为世界第四,比李世石还高一级。对此阿尔法狗研发者之一的哈德塞尔非常雀跃,在Facebook上表示“多亏李世石,AlphaGo能进入世界排名了”,更向世界第一中国的柯洁下战书:“柯洁,来比一比如何”

根据澎湃网报道,李世石在连输两场之后,柯洁非常不服,声称谷歌如想证明它的软件世界第一,必须“先过我这一关。”但对此,有中国“棋圣”之称的聂卫平不甚看好根据新浪体育报道,聂卫平在评点这次人机大战时,坦言对他进行了震撼的教育,对电脑的实力赞不绝口,聂说:“人类不是电脑的对手,我也不看好柯洁“。

或许柯洁可能不敌阿尔法狗,但中国的网民却拿出国粹向阿尔法狗挑战。网民李伯清以调侃的语调声称,只要3个四川大妈,就可以在麻将桌上把阿尔法狗打败“要是阿尔法狗来打四川麻将,绝对裤儿都要输脱!”

有人认为,围棋的变化多端,纵横19条线,黑白子攻防布局有着天文数字般的不同步法,但麻将只有144张,变化有限。不过也有人强调,麻将有30多种玩法,围棋只有一种规则,而且麻将更像人生,福祸相依,还时不时的得靠朋友帮衬,而这点是机器所不会理解的。

另外有网民认为,阿尔法狗如想征服人类,麻将是个起点,而且还断言机器将不敌人类,因为一个阿尔法狗挑战三个人类,一点胜算也没有有网民说:“两个阿尔法狗挑战两个人类,我告诉你们,不要以为势均力敌,老子一个眼神就知道朋友要什么牌“。至于出动3个阿尔法狗,网民又认为机器成本太贵了,划不来。

想得尽管很美,但中搜网络创始人,北京围棋业余赛冠军陈沛告诉澎湃新闻:“要是麻将,人类会输得更惨麻将一共就那么多张,很容易算出来的。”

看来,人机似乎真的要比拼一下,方能平息这场纷争了。

阿尔法狗究竟是朋友还是敌人,那要看人类如何使用

  • 不知是不是美国科幻片看多了,一想到阿尔法狗的强大就忍不住担心我们人类的未来是不是也会向电视上描述的那样,被邪恶的机器人代替。后来看新闻,发现不止小编这样想,世界上还有好多的人也担心,就连霍金、比尔盖茨也不例外。就连特斯拉创始人马斯克甚至投资了1000万美元,用于研究如何让机器智能处于控制之下。这种观点的盛行与媒体和技术的改变有关,其实它更多是一种猜测,甚至和臆想。
  • 以最近横扫围棋界的阿尔法狗为例,阿尔法狗是人工智能,它在下围棋这方面水平超越了人类,这并不奇怪,因为围棋的规则非常简单,阿尔法狗能通过深度学习掌握人类没有掌握的棋谱,自我成长为围棋高手,但这不会导致人类灭绝。我们人类下围棋的水平不如阿尔法狗,是正常的现象——正如我们跑步的速度没有汽车快,难道我们人类会因此而自杀吗?
  • 再反观Alphgao柯洁这盘棋,柯洁之所以输得一败涂地的原因其实也有一部分跟自己的轻敌有关,明知Alphgao算法无懈可击仍然会轻视。
  • 另外我也想说明的阿尔法狗引起全球人类恐慌的的原因最主要的还是,担心他们把人工智能与黑暗程序绑成一块,进而形成对人类有杀伤力的武器。如果按照前文所述机器人的运作背后有清晰的数学逻辑与算法,只要我们能掌握其算法,我们就可以控制它。如果它真的来侵害我们人类,只要切断它的程序就可以。不过一切终无常,有生就有死,不要阿尔法狗还没被真正开发成黑暗武器时地球已经被我们滥用环境而破坏殆尽了。值得深思!

阿尔法狗最强版本来了,柯洁是否迎难而上呢?

  • 16年一位狂吞人类棋谱的帅哥阿尔法狗疯狂打败了人类顶尖赛手李世石,从此以后笑傲江湖无人敢问津。这或许是可以被载入史册的一天。当人类狂呼“阿尔法狗为什么能打败世界冠军?”阿尔法狗只冷冷的笑了一下,在彻底血洗所有围棋界顶尖棋手之后,孤独求败的谷歌AlphaGo,再也不屑于和人类对垒了,现在,人家玩起了左右互搏。这还不打紧,听说人家又孵化出了更强版本AlphaGo Zero,这下人类该颤抖了吧。
  • 话说,2017年10月18日,谷歌人工智能团队DeepMind团队在期刊《Nature》上发表论文,宣布了具有里程碑式意义的消息:新版AlphaGo可以彻底摆脱人类的知识了。文章称,AlphaGo Zero就像人类初学者一样,只是了解比赛的规则和比赛的最终目标来自我学习。
  • AlphaGo Zero只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自娱自乐,自己参悟,100-0打败哥哥阿尔法狗。一款冷冰冰的机器,拥有了像人一样的自学和思考能力,回过头了,还能秒杀人类。再联想到今年的另一则消息。Facebook人工智能研究实验室的两个AI聊天机器人互相对话时,竟逐渐发出人类无法理解的独特语言。人工智能有个说法:在奇点以后,人工智能可以制造出更高智能的人工产品,然后发展的斜率将一下子陡峭起来。新版AlphaGo的出现,给了人类一个绝大的震颤:没想到,奇点来得如此之快!
  • 柯洁大战阿尔法狗
    柯洁大战阿尔法狗
  • 曾经,在柯洁输给阿尔法狗的那个初夏之夜,世界在慌乱中恢复矜持,以为不过是一场虚惊。然而,在今天这个初冬的日子,人类再也无法掩饰一个真相:终结者,终于要来了!阿法元进化速度可以用“恐怖”来形容。AlphaGo Zero的最大亮点,在于无需任何人类指导,通过全新的强化学习方式自己成为自己的老师,在围棋这一最具挑战性的领域达到超过人类的精通程度。AlphaGo Zero不仅发现了人类数千年来已有的许多围棋策略,还设计了人类玩家以前未知的的策略。
  • 称之为人类尊严的“最后防线”的柯洁是这样说的:对于Alphago的自我进步来讲,人类实在太多余了,我再也不与人工智能对弈了。阿尔法狗已经把人类其实打败成这样,现在又孵化出AlphaGo Zero,阿尔法狗你这是要逆天的节奏吗?不是说围棋赛只是一个开端,目的是在其它对人类有用的领域上,难不成这消息不靠谱?

阿尔法狗使用“中国流”布局,直拿比分

  • 前段时间阿尔法狗被大家在网上传得轰轰烈烈,甚至还说阿尔法狗再持续发展下去会对人类产生恐慌。阿尔法狗真的像世人传得那么厉害吗?或许只是一种造势。再次回看阿尔法狗大战李世石的比赛,从现场的专家解说来看,双方开局和前面进行的第二盘类似,AlphaGo(阿尔法狗)再次以“中国流”布局。吸取了三连败的经验,李世石在盘中的落子显得异常保守,不断退让,机器迅速占得上风。
  • 与前三盘一样,AlphaGo 还是不断走出人类眼中的“昏招”,李世石不敢轻易处之,再次陷入了深思之中。多次陷入长时间考虑的状态,导致李世石耗时太多,在比赛进行到2个半小时后,李世石仅剩下17分钟,比AlphGo剩余时间足足少了1个小时。
  • 从结果来看,多次深思还是起到了很大作用,在距离读秒只剩下六分钟左右时,李世石在腹地走出一步天来之笔,李世石白78挖,成为本场比赛的转折点。紧接着步步进攻,二者再次进入焦灼状态。AlphaGo 不断“失误”。通过这盘棋,李世石似乎发现了AlphaGo的弱点,一种很大的可能性是,AlphaGo的决策网络里面有可能没有算出过李世石的第78手数据,让局面变的复杂起来,所以导致了后来的判断崩溃引发“Bug”,那就是说阿尔法狗算法还存在一定的差异性。按照香港科技大学计算机科学硕士陈经先生对前面三盘对局的分析AlphaGo相对人类而言,优势和潜缺陷都是共存的:
  • 它布局好,中盘战斗控制力强,都是大局观好的表现。它中后盘收束差不多都是封闭局面了,基本是穷举了,算目非常精确,几百万次模拟下来什么都算清了。想要收官中捞点目回去不是问题,它胜了就行;但是想收官逆转是不可能的,影响了胜率它立刻就穷举把你堵回去。
  • 但是封闭式局面的小手段中,AlphaGo可能存在不精确亏目的可能性,不知道怎么推理。在开放式接触战中,如果战斗会搞到很远去,它也可能手数太多算不清,露出破绽。但不会是崩溃性的破绽,要崩溃了它就肯定能知道这里亏了,不崩吃点暗亏它就可能糊涂着。目前来看,就是这么两个小毛病。
  • 一台近乎完美的机器存在着缺陷,但仅仅是在细微之处存在差异,修补几月后再次对弈完胜顶尖棋手柯洁。自认为比别的物种都聪明的人类能否做到想阿尔法狗这样,知道自己的错误处敢主动站出来改正吗?

阿尔法狗你这是来虐狗的吗?居然100:2战胜了

近日阿尔法狗又成为坊间争论的焦点,阿尔法狗在人间销声匿迹6个月后又重出江湖带来了最强版本Alpha Go Zero 。后来还有各位名人纷纷站出来警示,不要上了阿尔法狗的当,同时也提出以阿尔法狗为代表的人工智能发展节奏不要太快。为什么 Alpha Go Zero 这么厉害呢,我们看官方的发言怎么说。

Alpha Go Zero与阿尔法狗两个程序对弈的结果是100:02、完败的阿尔法狗是从人类棋局学习对弈,而完胜的 Alpha Go Zero只学习围棋的基本规则。看起来,人类的智慧经验反而成了束缚阿尔法狗的累赘,不需要人类经验的 AlphaGo Zero,远远超出了人类学习的水平。

不禁让很多人发问,人工智能已经超越了人类的智力?当年阿尔法狗第一次在人类最复杂的对弈游戏—围棋领域战胜人类的时候,我们还可以安慰自己“这是人类集体智慧战胜个体的过程。”毕竟阿尔法狗学习了大量人类棋手的经验。而 Alpha Go Zero完全不同,仅通过自己跟自己下棋,用了3天时间完成了500万局自我对弈学习,便轻松打败了阿尔法狗

alphago教学工具
alphago教学工具

谷歌Deep Mind团队总结道:AlphaGo Zero相比与Alpha Go 的更强大之处在于:“它再也不会受到人类经验的限制,而是可以不断向世界上最强的围棋手——也就是它自己学习到非既定的能力。”要知道,阿尔法狗学习了人类棋局经验之后自己对弈了3000万局,训练了几个月。貌似,人类经验成了这场对决的绊脚石!其实,不然!无论阿尔法狗,还是 AlphaGo Zero,打败人类的并非智能,而是计算能力。围棋的复杂性,在于变化的复杂性、可能性。简单的规则,有限时间内你能计算多少种可能,决定了你是否会选择最优的落子点。

阿尔法狗的落败,其实正是提醒了我们,人工智能目前仍然是计算能力的范畴,而非创造力。只不过,在阿尔法狗的世界里,计算的复杂性要高于 AlphaGo Zero。请看下面的对比: 阿尔法狗算法的规则其实有两条:一是围棋基本规则,二是人类棋局固化的“规则”。

阿尔法元计算的规则只有一条:围棋的基本规则。这才是这场胜负的本质原因所在!所以,人工智能,不过是超强的计算能力,以及这种计算能力保留下的众多范式罢了。所以我们也不要太担心,人工智能再强大也是通过人类设定的程序来进行,只要不被恶意操作应该不会影响人类的运作。突然很想看看,当阿尔法狗成为我们的好伙伴以后这世界会怎样?

阿尔法狗是怎么看透人类棋局的,阿尔法狗的真相是什么?

  • 大家都知道,阿尔法狗已经称霸围棋圈,也可以说已经达到被人类顶尖赛棋手仰视的高度,目前阿尔法狗表示很孤单,没有选手愿意与他们对弈。那么阿尔法狗为什么能打败世界冠军呢?它是用什么信念来支撑的,我们今天来揭秘。
  • 中国科学院院士、全国信息技术标准化委员会大数据标准工作组组长、知名战略科学家梅宏,在《中国经济大讲堂》节目中这样讲到:
  • 每一个棋,不管是中国象棋、国际象棋甚至我们的五子棋都有一个规则,而且有一个输赢的标准。所以有这个东西我们实际上是可以建立规则,马走日象走田一样。我们形成了一个搜索空间,我们过去的做法都是用计算机去完成的空间的搜索,找出最可能赢的这么一个套路。
  • 阿尔法狗算法
    阿尔法狗算法
  • 换一个思路大家想想,围棋高手下棋,很多时候是棋感,对当时棋势的把握,棋局的把握。很多高手直觉一来,他就知道下一个棋该到那儿,这就是棋感。这件事情捅破以后,计算机怎么做?相当于把围棋盘黑白子变为一个图片,那么这件事情恰恰是计算机最擅长的,做图像的匹配和识别。
  • 首先,它是用的数据,这个数据就是人类不可能去想象出来。阿尔法狗棋谱用到的数据,三万多幅人类专业棋手对决的棋谱,三千万盘自我对弈的棋局。它用人类的棋谱,打谱学习,然后自己又和自己下棋,最新版的阿尔法狗Zero,用了490万盘,自己和自己对弈。大家想想人类的棋手每年下多少?大概一千盘了不起,脑袋能记多少?再牛的人也记不了多少。
  • 可以相像,阿尔法狗要笑傲围棋圈很久了,人类的脑子再强大也不可能记住这么多的阿尔法狗原理,也不可能去围绕阿尔法狗的算法做出向相应的策略。还好,阿尔法狗的创始人谷歌官方强调说,阿尔法狗的领域不止用在围棋上面,围棋赛只是他们小试牛刀,将把阿尔法狗用到其它更多的途径上。

阿尔法狗活跃度极高?但是请正确看待人工智能

  • 2016年,当世界很多顶尖高手沉醉于自己的技术时,阿尔法狗悄然崛起,甚至以两句完胜顶尖韩国围棋赛手李世石,赛后大家对本次比赛还没有引起足够的兴趣,只是当成茶余饭后的话题讨论一下而已。
  • 2017年5月AlphaGo 柯洁对弈,完败柯洁后大家才逐渐认识到阿尔法狗的强大性。后来阿尔法狗宣布隐退几月后,2017年研发团队公布,最强版阿尔法狗代号AlphaGo Zero诞生。再进化后的阿尔法狗,独门秘籍是“自学成才”。更可怕的是,它的自学成才速度,3 天就能100:0 碾压曾击败李世石的旧狗Lee版。倘若学习到40天,这家伙就可以击败所有版本的AlphaGo。
  • 对于这种变态级机器人的存在,世界围棋冠军柯洁回应道:“一个纯净、纯粹自我学习的AlphaGo是最强的……对于AlphaGo的自我进步来讲,人类太多余了。”为此世界很多以霍金为代表的知名人士也站出来警告。霍金说,“在我的一生中,我见证了社会深刻的变化。其中最深刻的,同时也是对人类影响与日俱增的变化,是人工智能的崛起。”人工智能的崛起,要么是人类历史上最好的事,要么是人类文明的终结。
  • ALphaGo
    ALphaGo
  • 2017年3月,霍金在接受英国《泰晤士报》采访时再次发出警告,“人工智能进一步发展便可能会通过核战争或生物战争摧毁人类。人类需要利用逻辑和理性去控制未来可能出现的威胁”。霍金认为,人类很有可能会造出超级人工智能,这些人工智能程序能够全面超越人类,并有可能完全取代人类成为一种新的生命物种。
  • 无非就是加强新一代人工智能开发应用,呼吁更多的企业利用以阿尔法狗为代表的人工智能,推动人工智能的发展等….看得出来这次国民政府蛮重视人工智能核心技术发展的,不管技术如何变化,只要不损害人民的利益一切都是可以的。至于阿尔法狗未来与人类的关系怎样,我们只有静静等待,让时间来告诉大家谜底。

阿尔法狗到底有什么目的,它的动机单纯吗?

  • 人工智能的强大让全世界人民感到担忧和恐慌,甚至全球一些知名人物也站出来警告人工智能开发商,称其发展太快给人类的生活带来里压力。近日阿尔法狗的创始人哈萨比斯面对舆论压力站出来辟谣说:”公众对人工智能的警示掩盖了人工智能带来的帮助。
  • 距离人脑水平的人工智能仍然相当遥远,可能还需要几十年。谷歌并不只是想做一个棋类程序,而是想做一个通用的智能计算系统。”如果解决了围棋问题,谷歌希望能把这套人工智能算法用于灾害预测、风险控制、医疗健康和机器人等复杂领域。也就是说谷歌的目的还是为了更好的服务人类,没有任何恶意。希望能够像他说的这样,是朝着对人类有利的方面进行研究与开发。
  • 柯洁对战阿尔法狗
    柯洁对战阿尔法狗
  • 面对有人质疑“阿尔法狗为什么能打败世界冠军”的问题,他同时也解释说“传统的人工智能方法是将所有可能的走法构建成一棵搜索树 ,但这种方法对围棋并不适用。其中一个神经网络“决策网络”(policy network)负责选择下一步走法,另一个神经网络“值网络”(“value network)则预测比赛胜利方。阿尔法狗的原理是:谷歌方面用人类围棋高手的三千万步围棋走法训练神经网络,与此同时,AlphaGo也自行研究新战略,在它的神经网络之间运行了数千局围棋,利用反复试验调整连接点,这个流程也称为巩固学习,通过广泛使用Google云平台,完成了大量研究工作。
  • AlphaGo在与人的对弈中用了“两个大脑”来解决问题:“决策网络”和“值网络”。通俗来说就是,一个大脑用来决策当前应该如何落子,另一个大脑来预测比赛最终的胜利方。看完,小编也忍不住呆住了,这是什么节奏,用两个大脑来对付一个脑子的人类,你们不赢那才叫奇怪呢?
  • 值得一提的是,李世石也是第一次与机器对战,所以他无法像和人类对战那样,先研究对方的棋谱和下棋风格。李世石所能做的就是和自己对弈。谷歌AlphaGo也是通过这种方式锻炼自己,真正做到了“人工智能”。