具身智能迎DeepSeek时刻:Spirit v1.5登顶全球榜单深度解读 - AI资讯
type
status
date
slug
summary
tags
category
icon
password
网址

在人工智能飞速发展的今天,大模型(LLM)领域的竞争已趋白热化,而具身智能(Embodied AI)正在成为通往通用人工智能(AGI)的下一块关键拼图。近日,国产具身智能领域迎来了一个标志性的“DeepSeek时刻”——千寻智能正式开源了其自研的VLA(Vision-Language-Action)基础模型 Spirit v1.5。
令人瞩目的是,就在开源前夕,该模型在全球最具权威性的具身智能评测平台 RoboChallenge 上,以综合评分第一的成绩登顶,不仅击败了由OpenAI等巨头支持的美国竞品,更成为榜单上唯一一个任务成功率突破50%的模型。这一里程碑式的事件,不仅展示了国产AI在物理世界交互能力上的突破,也为全球具身智能的研究提供了新的范式。更多关于前沿AI技术的深度报道,请关注 AINEWS。
榜单霸主易位:Spirit v1.5 综合能力全面超车
RoboChallenge 并非普通的软件跑分平台,它是由Dexmal、Hugging Face、智源研究院等多家知名机构联合发起的真机实测基准。其核心在于通过30项贴近真实生活的任务,考验机器人在陌生环境中的泛化能力。
在此之前,榜单长期被美国机器人创企 Physical Intelligence 发布的 Pi0.5 模型占据。Pi0.5 曾以执行复杂家务的能力惊艳业界。然而,Spirit v1.5 的出现打破了这一格局:
* 综合得分:66.09分,位列第一。
* 成功率:50.33%,是全球唯一成功率超过50%的模型。
这一成绩并非依靠某一单项“特技”,而是实现了综合能力的全面超车。这意味着国产具身智能玩家已经正式冲进了全球第一梯队的核心圈,在感知、决策与执行的闭环能力上达到了世界级水准。
实战见真章:从“机械执行”到“智能感知”
数据是冰冷的,但机器人的实际表现却能直观反映技术的代差。在RoboChallenge的实操对比中,Spirit v1.5 展现出了极强的环境适应性(Robustness)和泛化能力,与 Pi0.5 形成了鲜明对比。
1. 贴胶带任务:精细操作的胜利
在极需手眼配合的贴胶带任务中,Spirit v1.5 展现了惊人的精准度。机器人迅速定位胶带,双臂协同成功撕下并贴在纸箱上。相比之下,Pi0.5 虽然尝试多次,却始终未能完成撕胶带这一看似简单实则复杂的动作。
2. 复杂环境下的物体搜寻
当目标物体(绿色物品)被压在其他杂物(黄色物品)之下时,两个模型的处理逻辑截然不同。Pi0.5 采用了机械的“清空再拾取”策略,效率低下;而 Spirit v1.5 能够像人类一样,在堆叠的物品中主动搜寻并直接锁定目标,并未受到颜色干扰,展现了更高级的认知与规划能力。
3. 插花与搬运:对物理世界的深刻理解
在插花任务中,Spirit v1.5 能够通过调整关节角度,确保花朵竖直插入瓶中;而竞品则因无法识别瓶口姿态,错误地将花横放在瓶口。同样,在搬运任务中,Spirit v1.5 能够感知抓取状态,确保物体入箱,避免了竞品那种“空气抓取”的机械式错误。
这些案例表明,Spirit v1.5 不仅是在“模仿”动作,更是在“理解”物理场景。
破解泛化难题:拥抱“混乱”的数据训练新范式
Spirit v1.5 能够取得如此卓越的泛化能力,核心在于千寻智能团队对训练数据策略的根本性革新。
传统机器人训练往往依赖于“干净”、严苛预处理的数据,这虽然降低了训练难度,但也让机器人变成了温室里的花朵,一旦环境变化便束手无策。千寻智能反其道而行之,采取了 “高多样性、弱控制” 的开放式数据采集范式。
- 拥抱不可预测性:采集员在执行任务(如清理台面)时,过程完全随机,不设定固定的子任务顺序。这种“混乱”的数据包含了海量的物体交互、轨迹变化和环境转换。
- 学习物理常识:通过接触大量非结构化数据,机器人不再是死记硬背某个动作序列,而是习得了通用的物理常识和技能组合(如拾取、放置、打开容器等)。
- 效率倍增:实验数据显示,使用这种多样化数据预训练的模型,在适应新任务时,所需的迭代次数比基线模型减少了40%。
这种从现实世界的丰富内在多样性中自主学习的能力,正是通往具身通用大脑(General Purpose Embodied Brain)的必经之路。
开源即登顶:构建开放的具身智能生态
与许多闭源发展的AI巨头不同,千寻智能选择了拥抱开源社区。为了证明榜单成绩的真实有效性,团队同步开源了 Spirit v1.5 的基模权重、推理代码以及使用样例。
这一举措具有深远的行业意义:
1. 技术验证:全球开发者可以复现并验证其性能,增强了国产模型的国际公信力。
2. 降低门槛:开源降低了具身智能的研究门槛,吸引更多顶尖人才参与技术迭代。
3. 加速落地:开放的生态将加速机器人本体的产品化进程,推动具身智能从实验室走向千家万户。
结语
从CES上国产人形机器人的惊艳亮相,到 Spirit v1.5 在权威榜单上的登顶,中国具身智能产业正处于技术爆发的前夜。千寻智能的成功不仅仅是一次排名的超越,更是对“认知-动作一体化”架构和新型数据范式的成功验证。
随着技术的不断成熟,我们有理由相信,具备更强泛化能力和通用性的机器人将很快融入我们的日常生活。对于关注 AI 变现、AGI 发展以及大模型前沿动态的读者,请持续锁定 AINEWS,我们将为您带来更多深度的行业解读。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)