深度特稿 人工智能让柯洁见到了“围棋上帝”

栏目:热点资讯  时间:2020-02-19
手机版

  特邀作者/吕良忠(新浪6D)

  编辑/宋建华

  △在AlphaGo平均30秒一步的节奏下,柯洁首局以1/4子落败

  AlphaGo又来了。5月23日,出现在乌镇围棋峰会的AlphaGo已是一名老手。在去年3月份对韩国棋手李世石的较量中,它让人类惊讶到了要自我颠覆。这次,它武装了新的牙齿,在高于原版10倍计算能力的基础上,靠深度学习的方式成长起来,挑战围棋的极限。上午10:30开始的比赛,没有持续更长的时间。下午3点10分,AlphaGo最终战胜柯洁,比后者少用时近1小时20分钟。赛前,柯洁表示,此战将抱着“必胜的信念和必死的决心。”“其实并不是人类与人工智能的一次对战,而是科学家和围棋选手在一次共同探索。”谷歌大中华区总裁石博盟这样表示。

  “我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这最后一次……”——柯洁

  上午10点30分,比赛正式开始。穿了一身黑色西装的柯洁,第3手棋将棋子下在了左上角的三3上。这是被日本超一流棋手武宫正树称为“低到似乎就要从棋盘上掉下去了”的位置。

  第7手,柯洁再次选择点入右下星位的三3,有备而来的中国少年在首局选择了“以彼之道,还施彼身”。

  现代棋手下三3开局的已经很少,只有在对方以星位为依托两翼张开难以挂角的时候才会选择点入三3。但阿尔法围棋多次在盘面很宽广的情况点入三3,让人类棋手重新思考围棋。

  柯洁对面,AlphaGo隐身在显示器后面,发散着微光。

  一年之后,人们已经很少能够看到柯洁身上的那种桀骜不驯。2016年3月,当李世石和AlphaGo激战未果败局已定时,他曾在微博上公开约战:“就算阿法狗战胜了李世石,但它赢不了我。”

  彼时,何止柯洁,几乎所有的围棋职业选手都不相信,机器能够在这项史上最复杂的游戏中战胜人类。

  但李世石的败局,让所有人都惊讶地张开了嘴巴。

  今年年初,AlphaGo再出江湖,化身Master,在弈城和野狐上取得60局线上快棋的连胜,未尝败绩,一大批世界冠军倒在Master刀下,包括柯洁四战全墨。

  中国围棋队总教练俞斌在一年后也改变了自己的看法,他承认去年三月人机对战前,大家都认为是阿尔法围棋一胜难求。可今天,大家反过来觉得是柯洁一胜难求了,可以说,整体上阿尔法围棋已经超越了人类棋手。

  赛前预测,中国围棋世界冠军古力表示,柯洁获胜1局的几率为10%。而李开复更为干脆,给出了0%。

  发布会上,早就尝到过对手强大的柯洁只是说:“我将尽全力争胜,一决胜负,抱有必胜的信念和必死的决心,不轻易言败。”

  △柯洁第一手下在了右上角的小目

  “可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言...它的热情也只不过是运转速度过快导致CPU发热罢了。” ——柯洁

  为了放松心态,柯洁在比赛前两天就早早来到乌镇,和父母游玩。

  赛前90分钟,柯洁先见到了AlphaGo之父哈萨比斯。这是两人第一次见面,“我还没有见过他。”哈萨比斯笑着说。

  这项由中国围棋协会、谷歌、浙江省体育局共同举办的特别赛事,胜者将获得150万美元的奖励,败者也将获得30万美元的参赛费。

  3月19日央视的《朗读者》节目中,柯洁九段朗读了《哈利波特与死亡圣器》最后一个节选,内容是哈利波特与伏地魔第一次也是最后一次正面对决,柯洁表示这段文章要“献给未来的对手”。

  直播画面上,柯洁面色充血。第23手拆边后,他暂短离座去倒了一杯水。第24手,AlphaGo张扬的把引征补在了O9,而人类棋手在这种地方一般会选择把黑一子干净地提掉,因为味道好,利用少。

  在研究了AlphaGo的全部与人类棋手的对局后,棋盘前的柯洁挠头笑了。

  柯洁了解对手,并不仅仅在棋盘上。

  与IBM 在上世纪打败国际象棋大师卡斯帕罗夫的深蓝不同, AlphaGo背后是一套神经网络系统,由谷歌 2014 年收购的英国人工智能公司 DeepMind 开发。它不是一台超级计算机,而是一个由许多个数据中心作为节点相连,每个节点内有着多台超级计算机的神经网络系统。就像人脑,是由 50-100 亿个神经元所组。

  AlphaGo的系统还借鉴了一种名为深度强化学习的技巧。强化学习的灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。

  此外,AlphaGo 也借鉴了蒙特卡洛树搜索算法,在判断当前局面的效用函数和决定下一步的策略函数上有着非常好的表现。

  △哈萨比斯(左)、柯洁(中)、施密特在比赛前见面合影

  “新版AlphaGo告别了仅靠输入数据来进行计算的套路”,在高于原版10倍计算能力的基础上,它一直都在靠完全的自我学习和自我对弈来积累经验。换句话说, AlphaGo已经是自己的导师,而和柯洁比赛的AlphaGo版本并非“自学版,AlphaGo仍旧需要学习人下棋的经验。”——哈萨比斯

  在比赛进行到半小时后,双方的时间慢慢拉开。到上午封盘为止,柯洁的思考时间大概是AlphaGo的三倍。

  比赛的裁判长、中国围棋协会主席王汝南表示,就封盘前来看,他不认为AlphaGo有优势。

  清华AI团队则表示,棋局进行至66手柯洁胜率42.97,白棋接近让二子优势。至86手柯洁胜率大幅上升至45.10,落后9.5目。

  中国围棋队总教练俞斌此前在接受采访时表示,通过认真研究去年李世石人机大战的五盘棋和这次“大师”的60胜局,中国围棋队对AlphaGo有了更深的了解。AlphaGo现在唯一的弱点,就是在对李世石第四盘中所表现出来的“无中生有”的失误,我们把这种失误称为“开放性计算的误算”。这种误算,阿尔法围棋在对李世石第五局的角上计算也出现过。

  但被俞斌忽略的是,这次来到柯洁家乡浙江的AlphaGo,也是只“新狗”。

  身为业余5段的国内知名数据库专家梁敬彬透露,新版AlphaGo是根据围棋的基本规则,通过数以亿万记盘的对弈,自我总结完善,达到了这样的水平。而完成这个自我训练的时间,不过短短几个月。

  如果不了解AlphaGo 背后的神经网络系统,你很容易以为它就是那个击败李世石的同一AlphaGo。

  AlphaGo采用了一种新的学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络,将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络对自我对弈进行预测,以-1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。

  “最后,新版的AlphaGo产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。”梁敬彬这样写道。

  △AlphaGo背后的神经网络系统

  “其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了...我相信未来是属于人工智能的。”——柯洁

  和梦百合杯决赛对阵李世石时一样,柯洁对局时习惯揪头发。老前辈华以刚八段说,柯洁平时发型比较爆炸,今天倒显得很顺溜。

  下午两点,在新浪演播室录节目的聂卫平判断柯洁劣势。黑棋追上了一些,但棋盘也在逐步变小。

  至150手,黑棋已难逆转。在距离比赛结束还有139手棋的时候,研究室里的众多世界冠军已经判定柯洁小败成定局。

  可怕的是,众高手并没有发现柯洁有明显的失误。

  一代宗师吴清源说过:“围棋的目标应该是中和。只有发挥出棋盘上所有棋子的效率那一手才是最佳的一手。每一手必须是考虑全盘整体的平衡去下——这就是六合之棋。”

  AlphaGo的一些下法,在人类看来是亏损的,但随着棋局的发展,这些下法可能变得不那么坏,甚至可以成为用意深远的好棋。人工智能正是立足于发挥盘上已有棋子的效能去思考以后的着法,在对全盘整体的认知和掌控已足以让人类反过来向它学习。

  在今年清明节假期,马化腾、马云和李彦宏同时出现在中国(深圳)IT 领袖峰会,探讨人工智能的话题。期间,马云对AlphaGo式的人工智能提出了尖锐的质疑: “大家把 AlphaGo 说得天花乱坠,很恐怖的样子。我个人觉得,So TM What?”

  同在台上的马化腾事实上反驳了马云的质疑,他表示AlphaGo的出现极大扩展了人类的认知范围和对人工智能的理解。研究这一过程本身会给人类带来大量的经验和理论。

  事实上,腾讯旗下的人工智能棋手“绝艺”作为后起之秀,在网络上也11次击败了柯洁。

  谷歌大中华区总裁石博盟在解释为什么AlphaGo与人类棋手对弈如此重要时表示,今天的结果是人工智能科学家和世界各国的围棋顶尖选手共同探索的结果。在这个过程中,其实并不是人类在与人工智能对战,而是科学家和围棋选手在共同探索。

  “AlphaGo的每一次升级,都意味着人工智能科学家对‘如何在有限信息下做出更优选择’这一问题有了更深刻的认识,这正是让人工智能理解人类、产生思维的关键。”石博盟如是说。

  人工智能从发轫只不过60年,以历史的眼光来看不过一瞬。它就像美国诗人e. e.卡明斯诗中的初生马驹,既懵懂无知,却又在感知一切。“折叠的世界”在它面前一点点展开,有无数的领域等着它去学习、发掘。

  一切才刚刚开始。

  △柯洁在赛后发布会上说,AlphaGo上次还很接近人,这次越来越接近“围棋上帝”了

上一篇:湖北新增新冠肺炎病例14840例 含临床诊断病例13332例 累计治愈出院344
下一篇:【一线抗疫群英谱】返乡大学生主动请战投身防控一线