当前位置:首页 > 数码 > 正文

黄士杰博士(黄海奇博士)

5月乌镇的人机大战上,世界围棋之一人柯洁赛后这样评价坐在他对面的对手:“黄博士来下棋,可能让我感觉更像和AI对弈。我也特别佩服黄博士。看直播的时候可以看到,我很活跃,总是喜欢运动,而黄医生总是一动不动,不上厕所,不喝水,不吃饭...所以和黄博士下棋的时候,我觉得黄博士就是AlphaGo。”

柯洁(前左)和黄士杰(前右)在乌镇的围棋峰会上。有一个细节值得一提。从现场镜头看,当时柯洁旁边的桌子上有两盘水果和零食,此外还有一个水杯。在黄士杰身边的桌子上,只有一个白色的水杯。三款游戏都是这么装修的。

这里柯洁提到的黄博士就是AlphaGo的“人臂”黄士杰。他是DeepMind的高级研究员,也是AlphaGo团队的主要成员之一。北京时间12月11日晚,DeepMind在自家官网推出AlphaGo教学工具,旨在以一种全新的、鼓舞人心的方式帮助大众下围棋。至此,AlphaGo也兑现了在乌镇人机大战中许下的承诺:将AlphaGo的数据分享给全世界的围棋爱好者。

随着教学工具的推出,黄士杰也之一时间在自己的脸书账号上分享了自己的感受:AlphaGo教学工具已经发布,这也是我的AlphaGo研究之旅的一个精彩结束。本人已转入DeepMind的其他项目,将继续在深度学习和强化学习的AI研究上进行探索和改进。

黄士杰在他的脸书账户上的留言

从2012年11月加入DeepMind,到AlphaGo项目的初步建立,再到先后战胜魏凡、李世石,再到进化为Master,战胜柯洁;今年10月进化为AlphaGo Zero,最后发展为“通吃”三种棋。黄士杰一直是AlphaGo的核心参与者。

回顾黄士杰在DeepMind的五年,可能会告诉我们更多关于AlphaGo背后的故事。

艾捷拉,我们要开始一个围棋项目。

2001年,黄士杰考入 *** 省师范大学,开始了他的研究生学习。他的硕士论文题目是《电脑围棋劫的策略》。到了2004年,已经毕业一年,在学校做了一年研究助理的黄士杰,考上了台大信息工程学院的博士。到了2011年6月,黄士杰博士论文答辩前夕,他被邀请到加拿大阿尔伯塔大学做博士后,从事计算机围棋程序的研究工作。当时他的博士论文题目是“计算机围棋中蒙特卡罗树搜索的一种新的启发式算法”。

在整个时间线上,需要补充的是,2010年,戴密斯·哈萨比斯和大卫·希尔瓦在伦敦创立了DeepMind。2011年,当黄士杰去加拿大做博士后研究时,大卫·希尔瓦在一年前离开了阿尔伯塔大学。

直到2012年,戴密斯·哈萨比斯、大卫·希尔瓦和黄士杰才在伦敦相遇。那时候AlphaGo项目可能连个想法都没有。直到2014年1月,谷歌宣布以4亿英镑收购DeepMind,事情才有了质的突破。

据黄士杰回忆,有一天,希尔瓦找到他说:“艾捷拉,我们要开始一个围棋项目。起初只有你和我”。队里只有三个人:哈萨比斯、席尔瓦和黄士杰。哈比是整个公司的老板,而席尔瓦是黄士杰的经理。从三个人的位置来看,黄士杰可能有最多的工作要做。

黄士杰的坠落时刻

做AlphaGo战队的围棋教练。

除了被DeepMind团队看好,黄士杰对围棋的热爱也是团队感兴趣的因素之一。黄士杰从小就喜欢围棋。当他还是 *** 师范大学的学生时,他创立了学校的围棋俱乐部。他是一名业余六段围棋手。除了下围棋,他对电脑象棋程序比赛也很感兴趣。他曾经开发过一个叫AjaGo的围棋程序。2010年,黄士杰开发的围棋程序Erica击败日本著名“棋手”Zen,获得冠军。黄士杰当时的博士论文也与围棋程序有关,题目是“蒙特卡罗树搜索法的一种新的启发式算法应用于计算机围棋”。

随着AlphaGo团队的不断壮大,越来越多的计算机和深度学习领域的人才加入进来,团队也不再是只有三个人组成。但是,有一个问题。刚入队的工程师,之前可能不知道围棋的规则,这就需要有人为他们普及知识。因此,黄士杰为新同事组织了一个培训班,普及围棋的基本规则。

随着新生力量的加入,AlphaGo项目突飞猛进。2016年1月27日,《自然》杂志以封面纸的形式介绍了DeepMind团队开发的AlphaGo,以及其战胜欧洲冠军范辉的消息。事实上,从那时起,黄士杰就成了AlphaGo的人类手臂。在和范辉比赛之前,他也跟范辉说过AlphaGo很厉害,但是当时范辉不听,大意了。也许不仅仅是范辉的粗心。即使《自然》已经宣布了AlphaGo的成功,但在那个时候,没有人能够相信人工智能程序能够打败人类职业棋手。直到同年3月以4:1击败韩国棋手李世石,才真正赢得了世人的敬仰。

黄士杰

他是AlphaGo,但他和AlphaGo不一样。

2016年3月9日至15日,AlphaGo与李世石在韩国进行了五轮大战。最终,AlphaGo以4:1获胜。当时,坐在李世石对面的黄士杰代替了AlphaGo。这一次,他真正步入了人们的视野,出现在了电视转播前。

按照当时的游戏规则,每场比赛最长可能需要近6个小时。根据电视直播记录,在与李世石的比赛中,黄士杰只喝了一次水,他甚至没有去过一次洗手间。

“黄士杰是这个人机游戏中最难参与的人。他担心我会受到影响。比赛期间,他一直面无表情,甚至连厕所都没去过一次。”这是赛后李世石给出的评价,和柯洁的评价一模一样。

黄士杰在比赛中的表现令人惊叹,从此,他有了AlphaGo人类手臂的称号。作为AlphaGo的棋手,想下好棋并不容易。击败李世石后,AlphaGo以大师之名在野狐围棋平台上以60:0的比分横扫中日韩顶尖棋手。下完最后一盘棋,师父现身了:我是AlphaGo的黄士杰。

尽管取得了令人骄傲的成就,但黄士杰曾在脸书上透露,在“大师赛”中以60比0战胜人类棋手的过程中,他犯了两个错误。这是机器执行过程中的人为错误。但在一些围棋网站的棋谱分析中,这两招被认为是别出心裁,具有“非人类”的全局观。

今年5月,人机大战移师中国乌镇,黄士杰还坐在柯洁对面。有一个细节值得一提。从现场镜头看,当时柯洁旁边的桌子上有两盘水果和零食,此外还有一个水杯。在黄士杰身边的桌子上,只有一个白色的水杯。三款游戏都是这么装修的。

与柯洁在比赛中的情绪波动相比,黄士杰一直面无表情,有点像一台冰冷的机器。即使有记者想上去采访,也被“他们不让我采访”拒绝。

与柯洁的战争结束后,5月28日,黄士杰罕见地在朋友圈发表声明:“天下没有不散的宴席,我该转行做别的项目了”。或许从那以后,黄士杰就一直在准备和AlphaGo说再见。

有时候,结束意味着新旅程的开始。黄士杰在脸书上说,这是他在伦敦的第五年。他感谢家人的陪伴,但更多的时候,他开始憧憬未来的路,希望自己的前路一步步走下去。

0