本篇文章1089字,读完约3分钟

编者按:这篇文章的作者是克林特·芬利。

另一个科技巨头已经与世界分享了它的人工智能成就。2月24日,雅虎发布了caffeonspark人工智能引擎的源代码,学术研究人员和大公司的员工都可以使用或修改它。

或许近年来,很少有人理解雅虎在科技方面的实力。它孕育了开源项目Hadoop,一个被facebook、twitter和许多其他公司广泛使用的数据分析平台。Hadoop对于人工智能有着特殊的价值。数据和算法对于训练人工智能系统同样重要,雅虎有一个最有趣的数据库——Flickr。

像许多新的开源人工智能项目一样,caffeonspark基于深度学习。深度学习是人工智能的一个分支,对于帮助机器识别人类语音、图像和视频内容特别有用。例如,雅虎用它来衡量不同图片的内容,以优化flickr的搜索结果。雅虎不依赖上传图片的人输入的描述和关键词,而是教计算机识别图片的某些特征,比如特定的颜色,甚至动物和物体。

别笑 雅虎也有人工智能的秘密武器

最近几个月,谷歌开放了其深度学习框架tensorflow,微软开放了其类似框架cntk,Facebook开放了其人工智能硬件设计,中国搜索引擎巨头百度开放了其深度学习培训软件代码。

这些开源有自己的重点。雅虎希望在现有系统上运行深度学习过程,而不是将数据从一个地方转移到另一个地方。雅虎建筑副总裁Andy feng解释说,训练一个深度学习系统来识别图片需要大量的数据。例如,如果你把大量的猫的照片交给算法,机器最终将“学习”猫的共同特征,从而能够区分包含猫的照片和没有猫的照片。

Flickr有数十亿张照片,还有很多照片类别可以训练人工智能。但该团队不想将flickr主服务器的所有图片复制到运行深度学习软件的新服务器集群中。因此,他们发明了在现有基础设施中运行深度学习软件的方法。

从其名称可以看出,Caffeonspark结合了两种现有技术:caffe,一种流行的深度学习框架,以及spark,一种新兴的数据分析系统。雅虎创造了一种在星火集群上运行caffee的方法。它可以单独在spark或hadoop上运行。冯表示,除了简化人工智能开发人员使用类似工具的操作和避免移动数据之外,caffeonspark还使在多台服务器上分发深度学习过程变得相对容易,而这是谷歌的tensorflow无法做到的。

别笑 雅虎也有人工智能的秘密武器

冯表示,在团队发布了一篇关于软件的长篇文章后,很多公司要求雅虎开放源码的caffeonspark。似乎许多组织不想在服务器集群上移动数据。

本文由《连线》编辑,如有转载,请注明出处

“读完这篇文章还不够吗?如果你也开始创业,希望你的项目被报道,请点击这里告诉我们!”

标题:别笑 雅虎也有人工智能的秘密武器

地址:http://www.j4f2.com/ydbxw/8788.html