谷歌DeepMind新AI模型:机器人无需训练,现实任务也能轻松执行!
近日,谷歌DeepMind推出两款新型AI模型,旨在帮助机器人完成更多现实世界中的任务。这两款模型分别是Gemini Robotics和Gemini Robotics-ER,它们在通用性、互动性和灵活性三大核心领域取得了显著进展,使机器人能够更好地与人类和环境互动,执行更精确的物理操作。
首先,我们来看看Gemini Robotics。这款视觉语言行动模型基于谷歌最新版本的AI旗舰模型——Gemini 2.0。它依托Gemini的多模态世界理解能力,通过加入物理行动的新模态,将其应用到现实世界中。Gemini Robotics不仅能够应对新的情境,在与人类及环境的互动上表现更好,而且能够执行更精确的物理操作,比如折纸或打开瓶盖。这一进步标志着机器人技术的一大飞跃,使机器人能够更好地融入我们的日常生活。
接下来是Gemini Robotics-ER模型,这是一种先进的视觉语言模型,能够“理解复杂且动态的世界”。当你在装便当盒时,桌上的物品摆放位置和如何操作是你必须考虑的内容。Gemini Robotics-ER正是为此类推理任务而设计。通过与现有的低级控制系统对接,机器人专家可以开启由Gemini Robotics-ER驱动的新功能,这无疑将为机器人行业开辟新的可能性。
值得一提的是,谷歌DeepMind不仅致力于打造能够理解物理世界并在其中行动的智能,还积极推动AI领域的安全研究。他们正在开发一种“分层安全策略”,以应对在特定情况下某个动作是否安全的推理任务。这种策略将为机器人提供更强大的安全保障,使其在现实世界中更加可靠和高效。
去年,谷歌DeepMind推出了“机器人宪法”,这是一套受艾萨克·阿西莫夫启发的机器人行为规范。如今,他们与Apptronik合作,共同致力于“打造下一代人形机器人”。这表明谷歌DeepMind坚定地致力于开发出更智能、更安全的机器人,以应用于多个领域和多种表现形式。
此外,谷歌还向包括Agile Robots、Agility Robotics、波士顿动力和Enchanted Tools在内的“受信任的测试者”开放了Gemini Robotics-ER模型。这一开放式合作策略将加速机器人技术的普及和应用,促进整个行业的发展。
总的来说,谷歌DeepMind的新AI模型标志着机器人技术的一大突破。这些模型使机器人能够更好地与人类和环境互动,执行更精确的物理操作,并且具有分层安全策略以确保在现实世界中的可靠性。通过与业界合作伙伴的开放式合作,谷歌DeepMind有望推动机器人技术进入一个新的时代,为我们的生活带来更多便利和价值。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )