12月11日晚间,谷歌DeepMind在自己官网上线了AlphaGo的教学工具AlphaGo Teach,旨在帮助公众用新的、启发性的方式下围棋。DeepMind团队樊麾也在自己的微博上了宣布这一重要消息。
✔ AlphaGo的启蒙老师、欧洲围棋冠军樊麾在微博上透露,AlphaGo教学工具共有两万多个变化,三十七万多步棋组成。
✔ AlphaGo可以分析并建议围棋开局的诸多下法,同时给出每步棋的胜率分析。希望AlphaGo对围棋的独特理解可以给棋手们一些启发。
这意味着,曾经击败世界顶级围棋选手李世石和柯洁,现已金盆洗手的AlphaGo将再现江湖,开始教人类下围棋。
这也兑现了当初DeepMind在乌镇人机大战结束时的承诺:
与全世界围棋爱好者共同分享AlphaGo的数据
据樊麾介绍,此次公布的教学工具使用的版本是AlphaGo Master,支持英语、简体中文、繁体中文、日文和韩文阅读。
在这张棋盘上,浅蓝色虚线圆圈代表AlphaGo的下法,蓝紫色圆圈为人类棋手的下法,圈内数字代表AlphaGo对于每一步棋的黑棋胜率预测。
随后,当今世界围棋第一人柯洁转发此条微博,并戏称自己要“重新学围棋”。当然,除了柯洁外,多位国内世界围棋冠军也对AlphaGo教学工具上线表达了自己的看法。
世界围棋冠军、职业九段棋手常昊认为:
“教学工具不一定是标准答案,更多的是给予了我们无限的思考空间。”
曾为乌镇人机大战选手之一、职业九段棋手周睿羊则表示:
“定式什么的还是不要随便学了,看到工具一些高级下法之后感觉到又可以起飞了。”
自学成才的AlphaZero
碾压历代所有版本
AlphaGo从出生开始
就以肉眼可见的速度成长
① 2014年,DeepMind开发了第一版AlphaGo。
② 两年后,AlphaGo Lee击败了世界冠军李世石。
③ 今年5月乌镇大会,中国棋手、世界冠军柯洁9段以0:3不敌AlphaGo Master。
值得注意的是,AlphaGo Master也是本次教学工具使用的版本。
// 赛后,DeepMind联合创始人兼 CEO Demis Hassabis宣布:AlphaGo将永久退出竞技舞台,不再进行比赛。
不过,谷歌DeepMind并没有停止探索围棋,半年后,DeepMind使用名为“强化学习”的 AI 技术,造出了AlphaZero。
“强化学习”这一AI 技术只使用了基本规则,没有人的经验,从零开始训练。
AlphaGo Zero通过不断地进行自我对弈
3天后以100:0的成绩超越AlphaGo Lee
21天后达到AlphaGo Master的水平
40天内超过了所有之前的版本
更让人诧异的是,刚征服围棋不久,AlphaZero又传出完爆其他棋类游戏的消息。
? 相同条件下,AlphaZero经过 4 个小时的训练,打败了此前最强国际象棋 AI Stockfish;
? 2 个小时后,打败了最强将棋AI Elmo。
如果说AlphaGo Master的棋是以人类棋谱为起点,走的每一步都更有“人味”,更容易为人所理解,那么AlphaZero的棋则是完全没有“人味”的,从一张白纸开始依靠“纯净”地自我学习而成的。当然,Zero的棋太高,暂非人类棋手能理解的范畴。
这令曾经和AlphaGo交过手的人类棋手柯洁不禁感慨道:
一个纯净、纯粹自我学习的AlphaGo是最强的。对于AlphaGo的自我进步来讲。人类太多余了。
当然,并非所有东西AlphaZero都能掌控,比如目前AI面临的最大挑战:类似《星际争霸》这类复杂的即时战略游戏。
AlphaGo超越人类的自我学习
是机遇还是威胁?
除了围棋,AlphaGo的研发团队已经开始把精力投入到其它重大挑战中,期望研发出更为高级的通用算法,以帮助科学家们解决最复杂的问题,包括找到新的疾病治疗方法、显著降低能源消耗、发明革命性的新材料等。
DeepMind创始人Demis Hassabis表示,AlphaGo并不仅仅是为了理解围棋而设计的,它会成为一个从复杂数据中进行搜索提炼的机器。比如(✔)药物的发现,(✔)蛋白质折叠,(✔)量子化学,(✔)粒子物理以及(✔)材料设计等等。
Hassabis暗示下一代的AlphaGo Zero将被用来作为室温超导体。
这是一种能够让电流通过而不损失能量的物质,将极大地提高能耗效率。目前的超导体只能够在超低温下工作,这种室温超导体很可能就是存在的。
此外,在谈到AlphaGo时,许多包括柯洁在内的围棋选手对人工智能是一种接受和拥抱的态度。
? 他们将人工智能看作是一种能够帮助他们揭示围棋的奥妙、突破思维局限的途径,
? 同时他们也将此作为个人知识的补充和视野扩展的方式。
由此可见,人工智能拥有探索新知识的潜能,这点也将让全人类受益。DeepMind强调,AlphaGo与人类的关系绝不是对立的,反而是能够启发人类把这些新发现应用到其他新领域,以解决当前我们正面临的一些最重要最迫切的科学挑战。
不过当前的人工智能似乎还是显得略显稚嫩。与众多棋盘类的游戏一样,围棋的规则是有限的,因此计算机相对容易理解。但当其运用到其他领域时,AlphaGo的局限性就会展现出来。
// Hassabis表示:
AlphaGo是一个不错的开端,他们正试图构建通用的算法,让世界变得更美好。
DeepMind是人工智能领域探索的先行者之一。AlphaZero完全无需人为干预,只需要一定时间的自我训练学习,就能超越人类世界冠军。
不得不说这是算法和计算资源的胜利,更是人类的顶尖研究成果。相信DeepMind期望的能解决各种问题的通用 AI,迟早有一天将会实现。