如虎添翼，谷歌探索AI+机器人未来：836平方米复杂场景下指令成功率高达90%-新科技-资讯-头部财经

如虎添翼，谷歌探索AI+机器人未来：836平方米复杂场景下指令成功率高达90%

资讯 » 新科技 2024-07-13

7 月 13 日消息，科技媒体 The Verge 昨日报道，谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人，让其能够完成更复杂的任务，且能在复杂的环境下自由穿梭。

DeepMind 团队已经发表了最新的研究论文，利用 Gemini 1.5 Pro 的上下文窗口（达到 200 万个词元），让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。

IT之家注：上下文窗口（context window）是指语言模型在进行预测或生成文本时，所考虑的前一个词元（token）或文本片段的大小范围。

其工作原理是拍摄指定区域（如家庭或办公空间）的视频导览，研究人员使用 Gemini 1.5 Pro 让机器人“观看”视频以了解环境；然后，机器人可以根据观察到的情况，通过语言和 / 或图像输出来执行命令。

例如用户向机器人展示一部手机，并询问“在哪里可以充电？”，机器人会引导用户找到室内的电源插座。

DeepMind 称，在一个 9000 平方英尺（IT之家备注：约 836.13 平方米）的操作区内，机器人在升级 Gemini 之后，测试发出 50 多条用户指令，成功率高达 90%。

研究人员还发现 "初步证据" 表明，Gemini 1.5 Pro 能让机器人计划如何完成导航以外的指令。

例如，当一位桌上摆放着许多可乐罐的用户询问机器人是否有他们最喜欢的饮料时，Gemini “知道机器人应该导航到冰箱，检查是否有可乐，然后返回用户处报告结果”。DeepMind 表示计划进一步研究这些结果。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

鸿蒙智行“神助攻”，“充电”成蔚来扭亏为盈的新希望？

2024-07-1314阅读
荣耀CEO赵明：揭秘Magic V3背后的创新与差异化策略

2024-07-1314阅读
七彩虹展出iGame RTX AI PC体验区：本地AI算力远超普通PC

2024-07-1314阅读
打破南北壁垒，顺丰在内蒙古草原布了一个局

2024-07-1314阅读
万兴科技旗下亿图脑图获华为“智慧办公最佳产品合作伙伴”奖

2024-07-1314阅读
引领行业变革，雅迪四大实用科技全球首发

2024-07-1314阅读
《蛋仔派对》携手哈啰，打造安全绿色出行新典范

2024-07-1314阅读
ROG召开2024新品发布会，ProArt全家桶高能亮相

2024-07-1314阅读
波音：已与美国 FAA 就 777-9 型飞机进行认证飞行测试

2024-07-1314阅读
英特尔酷睿 Ultra 200K 系列 QS 进程加速：仍计划 10 月下旬发售

2024-07-1314阅读