斯坦福大学的三位计算机科学家开发了一个深度学习模型,可以通过观察谷歌街景图像来确定大致的拍摄位置。这个模型在一个流行的地理猜测游戏 GeoGuessr 中表现出色,甚至超过了顶级玩家。尽管这个模型不能精确确定街景照片的位置,但它能够可靠地确定国家,并在很大程度上猜测出离正确位置不超过15英里的范围内。
据说该软件运行良好,足以击败流行的在线位置猜测游戏 GeoGuessr 中的顶尖玩家,成为在全球约五千万玩家中排名前百分之0.01的 AI 模型。这一成果显示出图像地理定位不仅仅是一门艺术,更是一门科学,并且具有重要的隐私影响。
研究人员认为,这种技术不仅适用于街景图像,还可以用于几乎任何室外图像。然而,室内图像仍然难以定位。研究人员表示,他们的模型之所以成功,主要是因为它以 OpenAI 的 CLIP 为基础模型,而 CLIP 模型已经训练过大量的图像,具备了更好的细节处理能力。
此外,他们还设计了一种损失函数来改进位置预测的准确性。总之,这个模型在地理定位方面取得了令人瞩目的成果,对于地理猜测游戏和开源情报研究具有重要的应用价值。
相关标签: AI 超越人类 在街景图像中定位精确度更高
评论列表 (条)