如果送货机器人可以找到客户家门的位置,那么将机器人用作“最后一英里”的运输工具可能成为现实。目前,标准的机器人导航方法包括提前绘制区域,然后使用算法将机器人引导至特定目标或地图上的GPS坐标。不过尽管此方法对于探索特定环境可能有意义,但在“最后一英里”交付的情况下可能会显得不够灵活。
麻省理工学院的工程师已经开发出一种机器人导航方法,该方法利用其环境中的线索来规划到达目的地的路线,这可以用一般的语义术语来描述。
如今,麻省理工学院的工程师已经开发出一种新的导航方法,不需要预先绘制区域。取而代之的是,该导航方法使机器人能够利用周围环境的特征,生成视觉上的“语义线索特征”,然后自动规划到达目的地的路线,这种导航方法可以使用算法中的一般语义术语(例如“前门”或“车库”)来描述,而不是用地图上的坐标来描述。例如,要求机器人将包裹运送到某人的门前,需要机器人先识别人行道、车道的“特征”,然后再识别前门的“特征”,生成“语义线索”。该技术可以大大减少机器人在确定目标之前花费在探索某个坐标属性上的时间,而且它不依赖于特定住宅的地图。
麻省理工学院(MIT)机械工程系的研究生迈克尔·埃弗里特(Michael Everett)在大学网站上发表的一篇文章中说:“通过这种技术,我们不需要为每座建筑物绘制地图,我们可以将机器人放到任何车道的尽头,让它找到一扇门。”
当前,已经有一些科学家们正在利用自然语义语言来训练机器人系统识别对象和位置的最新趋势,通过利用现有算法从视觉数据中提取特征以生成同一场景的新地图(表示为语义线索),例如,一扇门在视觉上将被视为一扇门,而不仅仅是固体的矩形障碍物。
在此情况下,MIT研究人员使用一种算法来创建环境地图,机器人在周围移动时,利用每个对象的语义标签和深度图像来寻找目的地,该算法称为语义SLAM(即时定位与地图构建)。
不过,虽然当前其他语义算法已经使机器人能够识别映射在他们环境中的对象,但是他们没有让机器人在瞬间做出决定。而且浏览一个新的环境,最有效的路径是采取特定的语义目的地。因此,MIT研究人员开发了一种新的“待用成本估算器”,该算法将通过预先存在的SLAM算法创建的语义图转换为第二张图,表示任何给定位置接近目标的可能性。
埃弗里特说:“我们受到图像到图像转换的启发,产生了类似的想法:你拍摄一张看起来像世界地图的图像,然后将其转换为另一张看起来像世界地图的图像,然后根据地图上不同点的接近程度对其进行着色来达到最终目标。”此“成本计算”地图以灰色着色,以表示较暗的区域为远离目标的位置;较亮的区域为接近目标的区域。
研究人员首先在搜索引擎的地图上进行了算法训练。在“bing”地图的卫星图像上对该算法进行了训练,该系统将语义图转换为可使用的成本图,并按照最轻的区域映射出最有效的路径,直至达到最终目标。在训练期间,研究小组还对每个图像都应用了遮罩,以模仿机器人的摄像机经过一个院子时可能具有的局部视图。“我们方法的部分技巧是为系统提供许多局部图像,因此,机器人真的必须弄清楚所有这些东西是如何相互关联的,这样机器人才能真的找到目的地。” 埃弗里特解释道。
随后,研究人员将这种导航方法进行了实地训练,研究人员在训练数据集之外的一所全新房屋的图像模拟中测试了他们的方法,首先使用预先存在的SLAM算法生成语义图,然后使用其新的成本估算器生成第二张地图和通往目标的路径。这种不计成本的技术发现前门的速度远远快于传统导航算法,后者没有考虑上下文或语义。埃弗里特说,训练结果说明了即使在陌生的、未映射的环境中,机器人也可以使用上下文有效地定位目标。
埃弗里特还补充说:“即使机器人将包裹运送到从未去过的环境中,也可能会有与所见过的其他地方相同的线索,因此,世界的布局可能有所不同,但是可能存在一些共同点。”