115

柯洁这次输给了人类,却赢了AI

 6 years ago
source link: https://www.huxiu.com/article/222608.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

柯洁这次输给了人类,却赢了AI

柯洁输了,柯洁又赢了。

排名第一的柯洁九段大意失荆州,在11月16日的第22届LG杯世界棋王赛半决赛上,意外输给日本七冠王井山裕太九段,再度无缘LG杯决赛。

不知道是不是受到了今年5月份在乌镇输给AlphaGo的“魔力”,今年以来,柯洁已经无缘春兰杯、三星杯、LG杯三大赛的冠军。

但这似乎并没有影响到柯洁的心情。

11月18日凌晨零点刚过,柯洁发了一条微博,称他终结了一个昵称叫“符合预期”的围棋AI的41连胜,“一度觉得没法继续了的棋,很艰苦赢了下来。”

柯洁认为“符合预期”的实力在去年战胜李世石的AlphaGo之上,显然是想说,我赢得没有水分。他还发出了一个世纪之问:“若是当初第一个与AlphaGo对弈的人是我?结果到底会是如何?今夜未成眠……”

显然,在柯洁眼里,战胜围棋AI“符合预期”是要比赢得LG杯冠军更值得庆祝的事,毕竟自从AlphaGo去年3月份赢了李世石后,人类就没有在这项古老的技艺上取胜过。

2017年1月初,披着Master马甲的AlphaGo一路过五关斩六将,干掉朴廷桓、元晟溱、柯洁、聂卫平等一众世界顶尖围棋高手,豪取59连胜后,在电脑上幽幽地飘出一句话:“我是AlphaGo的黄博士。”全世界都陷入了哀嚎。随后Master又毫无悬念地赢了古力,以60胜0负收场。

然后就是今年5月23日在乌镇举行的世纪之战,世界排名第一的柯洁对战AlphaGo。第一盘在耗时4小时25分后,柯洁以四分之一子败给了AlphaGo。

聂卫平表示这还是“AlphaGo一再退让的结果”,柯洁说:“我很早就知道自己要输1/4子,AlphaGo每步棋都是匀速,在最后单官阶段也是如此,所以我就有时间点目,看清自己输1/4子,所以只好苦笑。感觉AlphaGo和去年判若两人,当时觉得他的棋很接近人,现在感觉越来越像围棋上帝。”

5月25日,第二盘,柯洁执白再次输给了AlphaGo,盘面上大龙横死,只是这次输得快多了。

5月27日,柯洁在第三盘还是输了,他哭了。在认输之后,他起身走到宣传板后没有摄像机镜头的区域独自流泪,哭得像个孩子。

后来,AlphaGo获得了九段称号,但随后从世界排名中停留了一段时间后“被消失”了。

就在我们都以为AlphaGo就此收手时,10月19日,DeepMind团队在 Nature 上发表了题为 Mastering the game of Go without human knowledge 的重磅论文,称新一代的AlphaGo Zero,完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(Reinforcement learning)和参悟,以100:0的成绩战胜了AlphaGo。

作为AlphaGo的主要设计者之一,也是AlphaGo的“人肉臂”,Deepmind资深研究员的黄士杰日前在台湾中研院举办的“2017年人工智慧年会”上谈到了AlphaGo的几次比赛,谈到AlphaGo Zero时,他说:“什么是AlphaGo Zero?我们拿掉所有人类对围棋的知识,只喂AlphaGo Zero围棋规则,让它自己学习下棋。”

“AlphaGo的成功就是深度学习与强化学习的胜利,因为两者结合在一起,建构判断形式的价值网络(Value Network),后来也成为AlphaGo Zero的主要理论。”黄世杰说,“AlphaGo Zero是从乱下开始,找出围棋的下法,它只用了三天,走过了人类研究围棋的千年历程。”

据悉,只经过了40天的训练,AlphaGo Zero就超越了Master。

在人类已经绝无可能赢下围棋AI的时候,柯洁在前一天输掉LG杯、输给同类后,他反而赢了围棋AI“符合预期”,并终结了后者的41连胜,可以说非常戏剧性。

大概此时人们都在好奇这位“符合预期”是谁家的AI吧?


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK