谷歌将Gemini 1.5 Pro安装到机器人上 实现记忆导航能力



Google DeepMind 他们把一个叫Gemini1.5Pro的系统装到了机器人身上。这可不是普通的升级,这玩意儿让机器人有了记忆导航的超能力。

想象一下,这个机器人在将近9000平方英尺的地盘上,能执行57种不同的任务,而且成功率达到了90%。这不是简单的任务,比如找到画画的地方,机器人不仅听懂了,还带你找到了一块大白板。这操作,简直比真人还靠谱。

这个系统的厉害之处在于,它能够处理多模态的长上下文窗口,这意味着机器人不仅能记住关键位置,还能理解人类的指令、视频导览,甚至用常识来推理。就像那个Google员工的例子,机器人不仅听懂了“画画的地方”,还知道要找个有大白板的地方。

而且,这些机器人在之前的项目中已经熟悉了办公室环境,它们通过“多模态指令导航演示”了解了空间布局。DeepMind的团队还用了一种分层视觉-语言-动作(VLA)技术,让机器人能够理解书面、绘图命令和手势指令。

这个系统的核心,是它能够让机器人在复杂的空间中自由行动,而且不需要人类时时刻刻的指导。它们能够记住环境,理解指令,然后用自己的方式来完成任务。这种能力,让机器人在实际应用中变得更加灵活和有用。

总之,Google DeepMind的这项技术,不仅仅是让机器人变得更聪明,更是让它们能够在真实世界中更好地服务于人类。这就像是给机器人打开了一扇新的大门,让它们能够走进我们的生活,成为我们工作和探索世界的伙伴。未来的机器人,或许就不再是冷冰冰的机器,而是我们生活中的智能伙伴。

如果想详细了解,可以点开视频下方的链接。
谢谢观看本视频。要是喜欢,请订阅、点赞。谢谢

英文原文:https://www.theverge.com/2024/7/11/24196402/google-deepmind-gemini-1-5-pro-robot-navigation

油管:https://youtu.be/KTOy-22r4WQ

留言