Facebook提出利用3D导航使命来训练自主机器人
雷锋网动静,据外媒Venturebeat报导,Facebook、乔治亚理工学院和俄勒冈州立大学的研究人员在本周颁发的一篇预印本论文中,描述了人工智能的一项新使命——通过听天然语言的指令,在3D情况中导航(例如,“走下大厅,在木桌旁左转”)。他们说,那能够为遵照天然语言指令的机器人助手奠基根底。
研究人员的使命,被称之为在持续情况中的视觉和语言导航(VLN-CE),是在Facebook的模仿器Habitat中停止的,该模仿器能够训练机器人助手在模仿实在情况的情况中操做。曲径为0.2米、1.5米高的助手被放置在来自Matterport3D数据集的内部,该数据集是通过10800多个全景图和响应的3D网格捕捉的90个情况的集合。
机器人助手必需在一条途径上做四个动做(向前挪动0.25米,左转或右转15度,或停在目的位置)中的一个,并学会制止被困在障碍物上,好比椅子和桌子上。
研究小组将那些情况提炼成4475条由4到6个节点构成的轨迹,那些轨迹对应于在各个位置拍摄的360度全景图像,显示了导航才能。
他们用那个训练两小我工智能模子:一个sequence-to-sequence模子,该模子由采纳视觉察看和指令暗示的战略构成,并利用它们预测一个动做;另一个是两个收集穿插形式留意模子,该模子跟踪察看成果,并按照指令和特征做出决策。
研究人员暗示,在尝试中,表示更好的机器人能够遵照“向左拐,进入走廊”之类的指令,虽然那些指令要求机器人在发现视觉路标之前动弹未知的次数。事实上,机器人在看不见的情况,大约三分之一的场景中导航到目的位置,均匀采纳了88次动作。
那些机器人偶然也会失败,按照合著者的说法,那些失败凡是是因为机器人在视觉上丧失了指令中提到的对象。
“至关重要的是,VLN-CE为(研究)社区供给了一个测试平台,在那里能够停止研究高级和初级控造界面的那类集成尝试,”合著者写道。
Facebook投入了大量资本来处理自主机器人导航的问题。
雷锋网领会到,本年6月,在公布了一项训练六足机器人走路的方案后,Facebook初次推出了PyRobot,一种用于PyTorch机器进修框架的机器人框架。2018年,Facebook推出了开源人工智能,能够通过360度图像在纽约市街道上导航。比来,Facebook的一个团队颁发了一篇论文,描述了一个通过旁观视频进修若何在办公室里走动的系统。雷锋网
我来回答