本篇文章2290字,读完约6分钟
出版社:作者是凌海滨,凉风站首席科学家。
最近,国际顶级科学杂志《自然?[1]关于计算机击败职业围棋手的报道引起了人们对人工智能的广泛关注,这是历史上计算机首次在公平竞争的条件下击败职业围棋手。即将到来的阿尔法戈和李世石九段之间的比赛更让人想起深蓝和卡斯特洛夫之间的比赛。
那么,既然已经有了电脑打败象棋冠军的先例,为什么它在围棋领域会引起如此多的关注呢?根本原因是,从计算的角度来看,围棋比国际象棋难上一两个数量级。棋盘的位置只有围棋的六分之一左右,这就决定了围棋的计算复杂度(简单地说,不同可能的棋类游戏的总数)远远超过了象棋,而且根据目前人类实践中的数字来看,它几乎是一个无穷大的数。不太明白的朋友可以参考这个传说,如果一张纸可以对折64次,那么它就可以从地球到达月球。
换句话说,在国际象棋中彻底搜索或尝试所有可能的变化是完全不可能的。由于这个原因,尽管计算机已经在国际象棋领域击败了人类,但人们总是认为计算机在围棋中击败人类需要时间。包括学术界和围棋界在内的大多数专业人士都不认为计算机能如此迅速地与专业棋手竞争。
从目前的趋势来看,无论阿尔法戈能否击败李世石,电脑击败顶级国际围棋选手只是时间问题。这场举世闻名的比赛的成败更具象征意义。
阿尔法戈可以与职业玩家匹敌或击败职业玩家,这一事实是人工智能乃至整个技术发展的一个极其重要的标志和启示。由此带来的技术突破和信心将进一步推动人工智能,尤其是机器学习在许多领域的应用。事实上,除了deepmind的alphago,其他研究小组在计算机围棋方面也取得了很大进展,比如卡内基梅隆大学最近的工作?[2]20 .
令所有人惊讶的是,让阿尔法go这次大放异彩的核心技术是近年来蓬勃发展的深度学习技术。自从韩丁在2006年再次点燃深层神经网络的热潮以来,在过去的十年里,深层学习已经席卷了几乎所有与人工智能相关的领域,并在语音和视觉领域的许多问题上频频取得突破。许多学者和工业R&D人员已经从最初的谨慎怀疑转变为积极跟进,这促进了深层次学习在理论和实践上的快速发展。就梁凤台在增强现实方面的经验而言,虽然深度学习在实践中需要克服一些实时性的挑战,但我们的梁凤台已经成功地将深度学习技术应用于一些实际应用中(如大规模图像识别和人脸分析),并期望在不久的将来取得更好的效果和推广。
以下是我个人对这场比赛的理解。首先,我声明,虽然我们在科学研究和应用中使用深度学习技术(现在很难去想它),但我自己对深度学习的研究是有限的,所以下面的观点只是主观的个人观点。总的来说,在这次人机比赛中,我认为阿尔法戈的胜率不高,感觉在30%以下。让我在下面几个方面解释一下我的理由。
1.之前被阿尔法戈击败的欧锦赛冠军范辉是职业二段棋手,与世界九段棋王李世石相比差距很大。
李世石自己认为“我和阿尔法戈还差两个孩子”?[4]这也符合围棋阶段之间的基本差距?[5]20 .这一观点已经被国际象棋界的许多顶尖选手所认可。参见?[6]20 .当然,由于机器学习强大的学习能力,阿尔法戈很可能在本次比赛之前的时间里迅速提高国际象棋的实力,理论上也有可能提高到顶尖选手的能力。然而,这种改善并不容易实现。请参考以下解释。
第二,毕竟,深度学习仍然需要学习,学习需要样本和训练。
虽然阿尔加戈可以很容易地获得大量的历史棋谱信息,但像李世石这样的顶尖棋手的棋谱信息仍然有限。更重要的是,关于电脑玩家和顶级职业玩家之间游戏的信息非常少。之前阿尔法戈和翼城戈大师之间的零星比赛和即将到来的比赛之间的差距仍然太大,这不足以弥补这个训练样本中的缺陷。
第三,从玩家的角度来看,顶级职业玩家可能更敏感,有更强的方式来处理机器玩家的游戏方式和漏洞。
例如,许多大师指出了一个显而易见的错误在阿尔法戈-范辉的国际象棋比赛?[6](嗯,我只是不太懂11级的业余水平),我相信像李这样的高手是不会放过这样的漏洞的。当然,有时人们会变得不稳定和困惑,但这种情况发生的概率非常低。
第四,阿尔法戈有可能在第一或第二场比赛中快速学习和调整。但是,我个人觉得即使这样,也不容易达到打败李世石的水平,而且他们之间的差距还是有点大,这样样本越多就越可靠。深蓝和卡斯特洛夫之间的第一场比赛是什么?[7]第7页.
综上所述,这项基于深度学习的技术让计算机打败了职业棋手,尽管它比大多数人预期的要早,这并不是完全出乎意料的。作为人工智能领域的实践者,我们应该受到更多的鼓励,并期望从相应的技术概括中学习来引导我们前进,这样我们才能在具体的应用领域不断进取。
参考文献:
1.“googleaiagorithmastersancientgameogo,深度学习软件defeatshumanprofessionalforfirst time。”elizabethgibney,nature,2016
2.“better computergoplayerwithneuralnetworkor and long term prediction,”yuandongtianandyanzhu,international conferenceonlearningrepresentations(iclr),2016 .
3." reducing dimensionalityofdata with neural networks . "hinton,g.e.andsalakhutdinov,r.r .,science,2006 .
4.维基百科:“deepblueversusgarrykasparov”
标题:亮风台首席科学家:无论AlphaGo能否取胜 AI 战胜围棋大师也是早晚的事
地址:http://www.j4f2.com/ydbxw/5785.html