概括一下，谷歌拍了拍Figure说，“起来卷”

发表评论

A+

所属分类：科技

摘要

6月28日消息，在谷歌的最新播客中，机器人在Gemini人工智能技术的加持下，未经教授就完成了一次“扣篮”动作，展现出迅速适应新场景的能力。

但实际上，

6月28日消息，在谷歌的最新播客中，机器人在Gemini人工智能技术的加持下，未经教授就完成了一次“扣篮”动作，展现出迅速适应新场景的能力。

两天前的洛杉矶，运行着Gemini Robotics On-Device 模型的机器人还在RSS2025（机器人软件与系统大会）上完成了全球首个互动式现场展示。硅谷AI观察人士Ted Xiao表示，“它仿佛是对未来的神奇一瞥——只需与各位的机器人对话，它就会做出适当的回应，并尝试执行一些合理的执行。新的物体、新的命令、新的技能。”

谷歌Gemini Robotics On-Device 模型发布于6月24日，AI 被引入了机器人，在整个过程中不需要持续的互联网连接，机器人实现了脱机工作。

IC外汇资讯：

谷歌在X上表示，这是自己首个“视觉-语言-动作”模型，旨在能够帮助机器人更快、更高效地适应新任务和新环境。如果小编稍加回忆，今年2月底，Figure发布的“历史上最重大的人工智能更新”——H EX外汇平台 elix也是一款用于通用人形机器人控制的“视觉-语言-动作”(VLA) 模型。

必须指出的是，

不同的是，由于谷歌家的这款模型独立于数据网络运行，它对延迟敏感的应用程序很有帮助，并确保了间歇性或零连接环境中的稳健性。

IC外汇消息：

事实上，早在今年3月，谷歌就推出了第一代VLA（视觉语言动作）模型Gemini Robotics，将Gemini 2.0的多模态推理和现实世界理解带入物理世界。

容易被误解的是，

而作为双臂机器人的基础模型的新选手Gemini Robotics On-Device ，除了最大限度减少计算资源需求之外，主要化解3个状况：灵巧执行、新任务的微调和适应、基于本地运行的低延迟飞快推理。

官方演示视频中，这一对灵巧手不仅能够拿起一支笔，还能够相互配合拔掉笔盖。

IC外汇消息：

在接下来的测试中，这一对灵巧手完成了“放置蓝色的砖块”、“拉开中间的抽屉”和“归位‘梨’模型”的任务，显示出强大的视觉、语义和行为泛化能力，并且仅仅依赖自然语言指令——“Can you close the middle drawer”？

与其相反的是，

演示之外，基础跑分数据上，Gemini Robotics On-Device也有不俗的表现。

尽管如此，

首先是泛化能力，谷歌直接拉出了“当家花旦”——旗舰 Gemini Robotics 模型和 Previous Best On-Device模型进行比拼。结果上，Gemini Robotics On-Device虽然略低于旗舰产品的表现，但也超出之前最好的离线模型一大截。

概括一下，谷歌拍了拍Figure说，“起来卷”

不可忽视的是，

而在分布式任务和多变的多流程指令方面，Gemini Robotics On-Device 模型的表现也优于其他设备端替代方案。

早在2月Figure的相关资料中就曾提到，“与受控的工业环境不同，家里堆满了无数的物品——精致的玻璃器皿、皱巴巴的衣服、散落的玩具——每件物品都有不可预测的形状、大小、颜色和纹理。为了让机器人在家庭中发挥作用，它们需要能够按需产生智能的新行为，尤其是对它们从未见过的物体。”机器人技术上的一大难题在于，举一反一便捷，举一反三并不容易。

站在用户角度来说，

如何处理在训练样本中从未见过的任务，直接反映了机器人对新任务的适应能力。Figure家的He AVA外汇开户 lix 给出的解法是运用一组神经网络权重来学习所有行为，建立了两个能够通信的“系统 1、系统 2”来分别完成“想”和“干”，而无需任何针对特定任务的微调。

而Gemini Robotics On-Device 给开发者呈现了微调的选取，通过50 到 100 次演示即可飞快适应新任务。微调任务的跑分如下：

简要回顾一下，

在喂了Gemini Robotics On-Device 100个以内的示例之后，它展现出了如上图所示的适应能力。

值得注意的是，

谷歌还公布了这一性能的演示，并将其进一步调整到了双臂Franka FR3 机器人和Apptronik 的Apollo 人形机器人中。

IC外汇认为：

在双臂 Franka 上，该模型执行通用指令，能够处理以前未见过的物体和场景、完成折叠衣服等灵巧的任务，包括需要精确度和灵巧性的工业皮带组装任务。

不妨想一想，

在阿波罗人形机器人上同样如此，通用模型能够遵循自然语言指令，以通用的模式操控不同的物体，包括之前从未见过的物体。

尤其值得一提的是，

对此，有网友认为，谷歌的脱机AI机器人存在改变游戏规则的可能性。

当然，也有网友并不买账。提问这和特斯拉机器人的设计有什么不同，又和ylecun在Meta所做的工作有什么不一样。

据相关资料显示，

在机器人/具身智能这个赛道，各家大模型正在“八仙过海”，技术向度展现出了多样性和丰富性，但最终指向了同一个命题——如何让AI在三维物理世界建立真正的因果认知。

尤其值得一提的是，

或许正如谷歌在技术白皮书中所写：“机器人不应是人类的模仿者，而应成为物理世界的解读者”。

发表评论取消回复