7 月 13 日
谷歌通过 Gemini AI 训练机器人,提升其导航和任务完成能力。DeepMind 的研究团队利用 Gemini 1.5 Pro 的长上下文窗口技术,实现了与 RT-2 机器人更自然的自然语言交互。机器人通过观看视频学习环境布局,并能根据观察执行命令,如引导用户找到充电插座。在 9000 多平方英尺的区域内,Gemini 驱动的机器人对 50 多条用户指令的成功率达到 90%。研究还显示,Gemini 1.5 Pro 能帮助机器人规划执行非导航指令,如寻找指定饮料。尽管存在处理指令时间延迟的问题,DeepMind 仍计划深入研究这些成果。
专业版功能
体验专业版特色功能,拓展更丰富、更全面的相关内容。