新方法帮助机器人导航使用语言基输入而不是昂贵的视觉数据
时间:2024-06-18 11:09 来源: 盖世汽车 阅读量:5095
盖世汽车讯 有一天,人们可能希望自己的家用机器人把一大堆脏衣服搬到楼下,并把它们放进地下室最左边角落的洗衣机。机器人需要将指令与它的视觉观察结合起来,以确定它应该采取什么步骤来完成这项任务。
对于人工智能本体来说,这说起来容易做起来难。当前方法通常使用多个人工创建的机器学习模型来处理各部分任务,基于大量的人力和专业知识而构建。这些方法通过视觉表征(visual representation)来直接做出导航决策,需要大量的视觉数据来进行训练,而这些数据通常很难获得。
据外媒报道,为了克服这些挑战,麻省理工学院和MIT-IBM Watson AI实验室的研究人员设计了一种导航方法,将视觉表征转换为语言片段,然后将其输入大语言模型中,该模型可以实现多步导航任务中的所有部分。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
热点精选
- 公募上半年调研榜出炉科创领域受青睐2024-06-18 10:31:02
- 205km续航版12.99万起东风风神L7上2024-06-18 09:18:12
- 官宣实锤!吉利银河E5搭载领克同款车机系统,2024-06-18 07:40:15
- 上海交运起豪沃尔沃EX30正式上市,引领都市2024-06-18 05:58:39
- 享道出行CEO倪立诚:Robotaxi助推出2024-06-18 05:41:36
- 零跑C10硬刚深蓝S7,都是高性价比之选,谁2024-06-18 04:24:11
- 能“坦克掉头”?方程豹豹3官方谍照,或搭312024-06-18 03:50:41
- “聪明车”驶上“智慧路”,大湾区如何打造智能2024-06-18 02:37:45
- 比亚迪皮卡SHARK墨西哥全球首发,都有哪些2024-06-18 00:12:47
- 极氪009光辉版开启交付周鸿祎作为首批车主参2024-06-17 22:51:03