Atlas觉醒:大行为模型引领AI工业革命 | AI资讯

type
status
date
slug
summary
tags
category
icon
password
网址

引言

曾几何时,波士顿动力的Atlas机器人以其惊人的跑酷、后空翻和舞蹈动作,成为全球科技圈的“网红”。然而,当炫技的光环褪去,真正的考验在于能否将这些尖端技术转化为实际生产力。就在最近,一段Atlas在模拟工厂环境中“打工”的视频再次引爆网络,但这一次,它展示的不再是预设的特技,而是一种前所未有的学习与适应能力。这背后,是一种名为「大行为模型」 (Large Behavior Models, LBM) 的颠覆性技术。本文将深入解读这一重大突破,探讨它如何让机器人零代码上新技能,以及这是否预示着一场由 人工智能 驱动的工业革命已经到来。

从“网红特技”到“工业尖兵”:Atlas的进化之路

过去的Atlas更像一个运动健将,其动作虽然流畅,但大多是工程师精心编程和优化的结果,旨在完成特定、可预测的任务。而最新的进展展示了一个截然不同的Atlas——一个能够理解、适应并与动态环境交互的“蓝领工人”。
在最新的演示中,Atlas的任务是将汽车零件从一个箱子转移到另一个。看似简单的任务,却充满了现实世界中常见的“意外”:
  • 应对干扰:当人类用曲棍球杆反复合上它刚刚打开的箱盖时,Atlas没有陷入程序错误,而是冷静地、一次又一次地重新打开盖子。
  • 动态追踪:当人类悄悄将目标箱子挪开时,Atlas没有“捡空气”,而是感知到位置变化,主动将箱子搬回原位再继续操作。
  • 实时感知:在确认箱盖已打开后,如果人类再次将其合上,Atlas能够通过视觉实时判断状态变化,并采取正确的开盖动作,而不是盲目执行下一步。
这些行为表明,Atlas的动作不再是僵化的脚本,而是基于实时感知和决策的动态响应。这标志着它从一个“表演者”正式向一个具备初级通用能力的“工作者”转变,而这一切的核心驱动力,正是大模型技术在机器人领域的延伸。

核心揭秘:「大行为模型」(LBM)如何工作?

LBM的出现,让机器人真正发挥出“人形”设计的优势,能够协调全身姿态、操控多样物体,并从容应对突发状况。其构建过程借鉴了当前LLM (大语言模型) 的成功经验,但应用在物理世界,其核心逻辑可以概括为“观察-学习-执行”的闭环。
  1. 高质量数据投喂:一切始于数据。研究人员通过VR遥操作设备,让操作员“附身”于Atlas,在真实和仿真环境中完成各种任务。操作员的每一个动作、每一次决策都被记录下来,形成包含图像、机器人本体感知和行为指令的庞大、高质量的具身行为数据集。
  1. 强大的学习大脑:这些数据被用来训练一个拥有4.5亿参数的扩散Transformer模型。这个大模型就像一个超级大脑,能够学习到从“视觉输入(看到了什么)”和“语言指令(要做什么)”到“具体动作(应该怎么动)”之间的复杂映射关系。它能一次性预测未来1.6秒的连续动作,并以30Hz的频率进行控制。
  1. 演示即学习,零代码更新:LBM最革命性的一点在于,为机器人添加新技能或优化旧行为,不再需要复杂的算法编程。工程师只需向机器人演示如何完成新任务,或如何从失败中恢复,然后将这些新的演示数据加入训练集,重新训练模型即可。整个过程无需修改底层代码,实现了真正的“零代码上新”。

不只是搬箱子:LBM的泛化与适应能力

LBM的威力远不止于处理固定的工厂任务,它展现出了惊人的泛化和适应能力,这是通往AGI (通用人工智能) 的关键一步。
  • 跨任务泛化:在测试中,同一个语言条件化策略模型,不仅能完成零件分拣,还能执行更复杂的任务,例如:折叠Spot机器狗的腿部零件、拉开抽屉放置面板、甚至操控重达10公斤的汽车轮胎和折叠柔软的桌布。这些任务涉及刚体、柔性物体和复杂的操作序列,用传统方法编程极其困难,但LBM通过学习演示,轻松掌握。
  • 动态速度调整:LBM模型在推理时可以动态调整执行速度。通过调整对未来动作的时间规划,可以在不影响任务成功率的前提下,将机器人的操作速度提升至人类演示时的1.5到2倍,展现出超越人类操作员的潜力。
  • 跨平台通用:该模型不仅适用于拥有50个自由度的完整Atlas机器人,也同样适用于其上半身的测试平台(Atlas MTS)。软硬件的高度统一和大模型的通用性,使得数据和策略可以在不同形态的机器人之间共享,极大地提升了研发效率。

AI工业革命的号角:我们离未来还有多远?

Atlas的这次“觉醒”意义非凡。它证明了大模型不仅能在数字世界处理语言和图像,同样能在物理世界赋予机器强大的通用行为能力。这为机器人的应用开辟了无限可能,从制造业、物流仓储到家庭服务,一个由更智能、更通用的机器人所支持的新时代正悄然拉开序幕。
当然,我们离电影中那种能完全自主思考和工作的机器人还有很长的路要走。但LBM的出现,无疑是机器人发展史上的一个里程碑事件,它为我们提供了一条通往未来的清晰路径。正如ChatGPTClaudeLLM改变了我们与信息的交互方式,LBM也将深刻变革我们与物理世界的交互方式。
这一突破无疑是近期最重要的AI新闻之一。它让我们窥见了AI变现在工业领域的巨大潜力。想要持续追踪AGI、大模型以及更多人工智能前沿动态,欢迎访问AI门户网站 https://www.aigc.bar 获取最新AI日报和深度解读。未来的AI资讯,将越来越多地发生在真实世界中。
Loading...

没有找到文章