本篇文章1653字,读完约4分钟
如果随机给你一张照片,有经验的旅行者很难分辨照片是在哪里拍的。如果这张照片是一个著名的标志性建筑,如埃菲尔铁塔、埃及金字塔或尼亚加拉瀑布,你一眼就能猜出照片是在哪里拍的。如果没有任何线索可以解释照片中的地点和位置,或者照片是在室内拍摄的,或者照片是一只宠物或食物,那么就很难猜测照片是在哪里拍摄的。
然而,人类仍然可以尽力完成这项任务。他们可以借助照片中的各种信息来猜测照片的位置,例如照片中可能的语言、植被类型、建筑风格、服装风格、车辆向左或向右行驶等。这些是人们积累的经验。如果允许机器完成同样的猜测照片位置的任务,许多人可能会发现机器比人类更难完成这项任务。
然而,来自谷歌的计算机视觉专家tobias weyand、james philbin和ilya kostrikov等工程师已经开发并训练了一种深度学习机器,它可以通过分析照片上的像素来确定照片的拍摄位置。在识别照片拍摄地点方面,这台新机器的性能已经超过了人类。更不可思议的是,它还可以在没有地理材料线索的情况下识别宠物和食物照片的拍摄地点。
这台机器究竟是怎么做到的?事实上,这种方法并不难,至少在机器学习领域是如此。Weyand和他的团队成员将世界分成一个网格,这个网格由26000多个不同大小的正方形组成,每个正方形的大小取决于在这个地方拍摄的照片数量,每个正方形代表一个特定的地理区域。因此,在有很多照片的大城市,广场的密度和大小都比偏远地区的大。谷歌的团队忽略了海洋和极地地区,因为很少有人在那里拍照。接下来,谷歌的开发团队利用从互联网上不同地方收集的照片建立了一个数据库,然后利用地理位置数据将不同的照片分类到相应的方格中。整个数据集非常大,包含1.26亿张照片和相应的拍摄地理位置数据。
韦扬和他的团队用9100万张照片建立了一个强大的神经网络,他们可以知道照片是在哪里拍摄的。他们的想法是这样的:当你把一张照片输入这个神经网络后,你可以立即知道照片是在哪里拍的,或者最有可能拍摄地点的列表。
然后他们将使用数据库中剩余的3400万张照片来验证这个神经网络的功能。他们将这些照片与这个核心网络中的照片进行比较,得到识别结果。他们给这个神经网络星球命名。
为了进一步测试行星识别的准确性,谷歌的R&D团队从flickr上挑选了230万张带有地理标记的照片,看看行星能否准确识别这些照片的拍摄地点。韦扬说,这颗行星可以确定3.6%的街道级精度照片的位置;在城市级准确率方面,识别率提高到10.1%;就全国精度而言,识别准确率为28.4%;就洲级准确率而言,识别准确率为48%。
这种认可的结果似乎并不理想,但事实上,它已经非常了不起了,而且行星的表现已经比手工工作略好。为了说明这一点,weyand和他的团队将行星的识别结果与10名消息灵通的旅行者的判断结果进行了比较。由行星判断的拍摄地点与实际拍摄地点的平均差异在1131.7公里以内,而由10位消息灵通的旅行者判断的结果与实际地点的平均差异在2320.75公里以内。
“总体来说,行星在50轮人机比较中赢了28轮,平均误差为1131.7公里;平均人为误差为2320.75公里。在这场人机竞赛的表面上,星球在识别照片拍摄地点方面已经超过了普通人。”weyand团队这样说。
为什么行星在识别照片拍摄地点方面表现如此出色?韦扬说:“我们认为地球比人类更有优势,因为它看到的地方比任何普通人参观过的地方都多。”此外,它还可以识别不同地方的细微差别,甚至是那些最喜欢旅行的人。到过许多地方的旅行者很难看出这些细微差别。”
此外,weyand的团队还使用行星来定位没有任何地理线索的照片,如室内拍摄的照片或一些物体的照片,如猫和狗。当这些照片是在同一地点拍摄的相册的一部分时,该机器可以通过识别相册中其他照片的位置来识别这些照片的拍摄地点。
本文参考了大量的信息来源:技术评论。如有转载,请注明出处
“读完这篇文章还不够吗?如果你也开始创业,希望你的项目被报道,请点击这里告诉我们!”
标题:Google 智能照片识别系统 PlaNet 能识别任何照片的拍摄地点
地址:http://www.j4f2.com/ydbxw/8660.html