本篇文章1916字,读完约5分钟
今天,每个人都兴奋地传播着一个信息:谷歌人工智能在围棋中击败了欧洲冠军。令人兴奋的原因是人工智能在围棋中击败了专业的人类玩家,围棋被定义为最难征服的。人类和人工智能之间的最后一道防护墙正在一点一点地坍塌。
谷歌使用的人工智能软件是alphago,它是由deepmind开发的,deep mind是一家人工智能公司,去年被谷歌收购。两个神经网络起着关键作用,一个称为策略网络,负责选择下一步,另一个称为价值网络,负责预测棋盘上不同分布所导致的不同结果。
阿尔法戈队击败了欧洲围棋冠军范辉(法国国家围棋队主教练),阿尔法戈队以5比0获胜。但阿尔法戈真正的挑战是两个月后与韩国围棋大师李世石对弈。范辉是欧洲围棋冠军,但实际上他只是处于第二水平。大师和顶级大师之间有很大的差距。我不知道阿尔法戈和李世石之间隔了多少范辉。在此之前,围棋软件禅宗和疯狂石头都打败了九个围棋大师,但前提是对方放弃他们的孩子。
魏凡和阿尔法戈之间的国际象棋比赛,黑方是魏凡,白方是阿尔法戈
去有多难?19×19的棋盘上有361个点。从机器学习的角度来看,围棋的计算最大值为3361次方,近似体积为10170,而观察到的宇宙中的原子数量仅为1080。相比之下,每一步棋只有35个可能的棋步,最多只有2155种情况。
如此大的计算量无疑是对人工智能的巨大挑战,但事实上,人工智能和人类一样,通过不断的模仿击败了对手。一位围棋爱好者告诉雷锋。人工智能实际上是一个模仿大师。通过记住过去游戏中大量高手的棋谱并不断练习,新的戏法就可以被开发出来。
“围棋在2500年里积累了大量的棋谱。除了对开局公式的研究之外,许多在实战中玩象棋有参考意义的高手都会关注棋谱。电脑可以记住3000万步棋(谷歌首先训练了它们),但人类却记不住。大多数情况下,他们依靠纯粹的大脑当场计算。正如专业棋手知道如何分解现有的棋谱一样,在分解过程中也研究了新的变化,因为有时候棋谱象征着某一个绝招是最佳的,因为它是当时最有实力的人,但后代永远可以超越,谷歌的特点是它可以计算棋艺训练中的新变化(走法),否则它最多只能和人类打成平手。”
除了记忆大量的棋谱,人工智能还需要一个大师来提高自己。早年,禅宗是日本的一流选手,九段棋手武宫正树是陪练。2012年3月,在武宫正树放弃第五个和第四个儿子的前提下,禅连续赢了两局。禅宗很好地模仿了武宫正树“宇宙流”下棋的特点。因此,如果阿尔法戈想要打败李世石,最快的方法就是找一个和他水平相当的高手做对练,最好是熟悉李世石下棋特点的人。因为,剩下的时间不多了。
李世石
对于人类来说,由于他们的天赋和后天的努力程度,每个人的晋升速度都会不同。有些人可以在20岁的时候成为世界冠军,而另一些人毕竟不能进入大师名单。然而,在许多人眼里,围棋不是一蹴而就的。例如,“疯狂叔叔”的“六天斋戒法”声称成年人可以在六天内将围棋水平从零提高到业余水平,但他的回应来自围棋界的各种嘲笑。
六天已经从零开始提高到业余水平,如果把它放在人工智能上,这是可能的。然而,如果你想从二年级开始挑战九年级,就不太可能赢。围棋作为一种起源于中国的游戏,在亚洲更受欢迎,而在欧洲和美国的受欢迎程度仍然很低,这就是为什么一个两阶段的玩家会成为欧洲冠军。在这种情况下,阿尔法戈很难遇到顶级玩家,所以击败顶级玩家太难了。
然而,围棋的复杂性和难度使其成为人工智能想要克服的最困难的问题。一个多月前,深度思维首席执行官戴密斯·哈萨比斯在一次视频采访中透露,他们的秘密团队可能会破解go。哈萨比斯谈到这种可能性时非常激动,因为在他看来这是一个巨大的挑战。“它不需要像国际围棋那样的蛮力。它实际上是美丽的、规则的和可追踪的,而这些通常不擅长于计算机,所以它是非常惊人的。”
除了谷歌,facebook也在测试人工智能来征服Go。就在《自然》报道alphago击败范辉的前一天,facebook还更新了一篇关于arxiv的新论文,通过将卷积神经网络与蒙特卡洛树搜索相结合来解决go问题。facebook人工智能实验室的负责人Yann lecun在论文中说,go是一项非常困难的任务,它是一个很好的案例,可以验证各种学习技能的组合,包括模式识别、解决问题和规划,它也是一个可以用来测试新想法的工具,包括机器学习、推理和规划的组合。因此,击败围棋大师不仅是一个游戏,也是人工智能的一个突破。人工智能对人类的影响将是无限可能的。
从国际象棋的经验来看,在人工智能于1997年首次击败人类之后,直到2006年,人工智能在这里都没有对手。人工智能想在围棋中彻底打败人类,所以不要继续练习。至少这一次,获胜的可能性很小。
标题:要想战胜韩国九段棋手 谷歌AI需要的是一个九段的陪练
地址:http://www.j4f2.com/ydbxw/7592.html