让AI像人一样穿越城市?看谷歌是怎么做的

phonix
2018-04-08 15:21:49
我有话要说

你是否还记得,儿童时代是如何学会认路的?比如说去朋友家里,或者是去学校上学?可能你并没有地图作参考,但是只需要记住街道外观,就可以沿着道路和转弯到达,这个过程你可能会迷路,但最终可以通过路标走到正确位置。那么你有没有想过,AI能否也像人类或动物那样,不通过地图就学会导航呢?

让AI像人一样穿越城市?看谷歌是怎么做的

谷歌最新研究显示,AI可以在不访问环境地图情况下,在外观多样化的环境中进行导航。在这项研究中,技术人员使用了来自谷歌街景的第一人称视角照片,将AI变成了真正的城市人——它可以利用视觉信息,来学习如何在多个城市中进行导航(需强调的是,研究是关于广义导航而非驾驶的;并未使用交通信息,也没有尝试制作车辆模型)。

AI不借助地图和GPS也能导航

据DeepMind科学家Piotr Mirowski表示,“解决导航任务时需要回答两个问题,你在哪儿?以及如何到想去的地方?这可以是没有智能手机的孩子在某地区行走,小鸟学习飞回巢穴,或是机器人等等情形。因此该研究要从现实生活获取灵感。”

a2.jpg

与传统方法(依赖于显式映射和探索)不同,谷歌尝试了学习人类过去常使用的那种方法进行导航(没有地图、GPS定位或其它辅助手段,只使用视觉观察),通过记住周边环境,以及试错来完成导航记忆的构建。谷歌创建了一个神经网络代理(agent),能输入从环境中观察到的图像,并预测在该环境中它该采取的下一步行动,研究中主要通过深度学习来进行端到端训练,并利用了城市规模的真实世界数据,包括复杂的十字路口、人行道、隧道,以及横跨伦敦、巴黎和纽约的各种拓扑结构等。

可转移到新城市的模块化神经网络架构

该人工代理的神经网络由三部分构成:能够处理图像并提取视觉特征的卷积网络、特定于地区的循环神经网络,蕴含着记忆环境以及学习“这里”(当前位置)和“那里”(目标位置)表征的任务、以及制定代理行动导航规则的,不因地区改变的循环网络。

让AI像人一样穿越城市?看谷歌是怎么做的

其中,特定于地区的模块被设计成可互换的,而且该模块对代理(agent)导航的城市来说是独一无二的,但视觉模块和策略模块可以不因地区改变。举例来讲,上图a为城市导航架构示例,b为多城市导航架构(每个城市都有其特定区域路径)示例,c则为代理(agent)调整到新城市时的训练和迁移过程。

简单来说,就像人类一样,当代理(agent)访问新城市时,它必须学习一套新的路标,但不需要重新学习视觉表征或行为(比如沿着道路向前,十字路转弯等)。因此通过多城市架构,可以现在一系列城市中进行训练,然后冻结策略网络和视觉卷积网络,只保留用于新城市的新特定区域路径。总的来说,这种方法能让代理(agent)学会新知识,而且不会忘记已学过知识,就像人类到了新城市(地区)要通过记住各类建筑和环境方便出行,却又不会忘记以前曾待过的城市(或区域)那样。

写在最后

谷歌团队认为,“研究导航是研究和发展AI的基础,尝试在人工代理(agent)中复制导航也能帮助科学家了解其生物学基础。” 虽然该技术在现实的应用目前尚未就绪,但未来或可用于自动驾驶(无人机或其它智能设备)在没有可靠地图数据区域的导航。