小鹏汽车CVPR突破:Scaling Law驱动自动驾驶“智能涌现”,AI未来已来
type
status
date
slug
summary
tags
category
icon
password
网址
引言
在备受瞩目的CVPR 2025(计算机视觉与模式识别会议)自动驾驶分论坛上,来自中国的小鹏汽车带来了颠覆性的技术成果:首次在自动驾驶赛道完整验证了Scaling Law(规模法则)的强大威力。通过让AI模型“消化”高达6亿秒的真实驾驶视频数据,小鹏汽车成功激发了自动驾驶系统的“智能涌现”,向世界展示了其AI司机的卓越能力。这是否意味着自动驾驶的“ChatGPT时刻”已悄然临近?本文将深入解读小鹏汽车在CVPR上的核心技术分享,探讨其如何通过创新的AI大模型路径,引领自动驾驶迈向新的发展阶段。更多前沿AI资讯,欢迎访问AI门户网站AIGC.Bar。
Scaling Law:自动驾驶的“算力换智能”新范式
Scaling Law,作为大模型时代的核心规律,指的是随着模型参数规模、训练数据量和计算资源的持续投入,模型的性能会相应地、可预测地提升。小鹏汽车此次的重大突破,正是在于将这一法则成功应用于复杂的自动驾驶领域。
通过累计超过2000万条、每条时长30秒的视频片段(总计约6亿秒)进行训练,小鹏的研发团队清晰地观察到,其自动驾驶VLA(Vision-Language-Action)模型的能力随数据和参数规模的增长而显著增强。这种“智能涌现”并非空谈,而是体现在一系列令人印象深刻的实际驾驶表现中:
- 丝滑决策:在前方大货车突然切出、紧接着又发现内侧临停车辆的复杂场景中,系统能从容减速、平稳绕行,毫无“急刹避险”的顿挫感。
- 精准预判:面对施工区域,系统能提前变道,并在转向过程中敏锐应对突然汇入的大货车,决策果断。
- 极端场景应对:在雨天窄路弯道,即使道路一侧被违停车占据,途中又遇临时上下客的网约车和逆行电动车,系统依然能精准绕行,确保安全与效率。
- 认知突破:甚至对于福州某路口车道线穿过两棵大树间的“魔鬼”场景,系统也能准确识别并顺利通过,展现出超越常规量产系统的理解能力。
这些场景的成功处理,标志着小鹏的AI司机已初步具备了对复杂交通环境的深度理解和链式思考(Chain of Thought, CoT)能力,而这正是Scaling Law带来的直观成果。
揭秘小鹏“世界基座模型”:不止于端到端的AI大脑
小鹏汽车认为,传统的端到端自动驾驶模型,虽然在一定程度上实现了AI化,但其本质更像是“小脑”,对输入信息进行条件反射式的被动响应,且过程难以捉摸。为了突破这一局限,小鹏汽车构建了一套全新的技术架构,其核心是云端“世界基座模型”。
该模型具有以下关键特征:
- 超大规模VLA架构:这是一个参数量高达720亿的视觉-语言-行为(Vision-Language-Action)大模型,以大语言模型为骨干网络。VLA架构能够统一处理视觉图像、自然语言指令,并直接生成动作控制,实现了从环境感知到决策执行的闭环。
- 知识蒸馏(Knowledge Distillation):考虑到车端算力的限制,小鹏汽车采用知识蒸馏技术,将云端超大模型学习到的复杂知识和“智能”高效迁移到尺寸更小的车端模型上。实践证明,这种方式远优于直接训练小模型,能更好地克服“模态坍塌”(即面对相似场景多种正确解法时,小模型易产生混淆)的难题。
- 强化学习(Reinforcement Learning, RL):在预训练和监督精调之后,小鹏引入自研的强化学习奖励模型,从安全、效率、合规三个核心维度激发基座模型的潜能,使其驾驶策略更接近甚至超越优秀人类司机。
- 持续在线学习(Online Learning, OL):部署在车端的模型会持续收集新的驾驶数据和用户反馈,这些宝贵的数据将反哺云端基座模型的迭代训练,形成一个“常训常新”的进化闭环。
- 未来世界模型(World Model):小鹏还在开发用于强化训练的“世界模型”,它并非传统意义上的仿真建模,而是一个能实时建模、模拟真实环境反馈,并能让场景内所有智能体(交通参与者)进行博弈的动态系统,为模型提供源源不断的高价值训练数据。
这套组合拳,使得小鹏的AI系统不再仅仅是数据的“复读机”,而是具备了初步认知和推理能力的“思考者”。
从“模仿”到“思考”:链式思考(CoT)驱动的智能驾驶
小鹏汽车世界基座模型负责人刘先明指出,许多复杂场景的成功处理,都归功于模型展现出的链式思考(CoT)能力。这意味着AI模型在驾驶过程中能够进行实时的、多步骤的推理,理解行为的前因后果,从而做出更合理、更安全的决策。
例如,在识别福州“树中路”的场景时,模型并非简单匹配视觉特征,而是在理解道路结构、交通规则以及潜在风险的基础上,推理出正确的通行路径。这种能力的涌现,有效回应了以往L4级别自动驾驶对L2级别方案“只会模仿、无法超越人类上限”的质疑。小鹏通过构建具备完整认知能力的AI“大脑”,从根本上提升了系统的上限,并通过强化学习确保了系统的下限。
这种从“被动反应”到“主动思考”的转变,不仅带来了更丝滑、更拟人的驾驶体验,更重要的是,它显著增强了自动驾驶系统在面对未知或极端(corner case)场景时的鲁棒性和可靠性,是迈向更高阶自动驾驶的关键一步。
软硬一体化战略:小鹏的AI“无人区”探索
小鹏汽车深知,先进的AI算法需要强大的硬件支撑和完善的生态系统。为此,小鹏进行了深度的软硬一体化战略布局:
- 算力为基:在云端,小鹏已储备了超过10 EFLOPS的超级计算集群,并保持高效运行;在车端,其最新SUVG7搭载了3颗自研图灵AI芯片,单车算力超过2200TOPS,为大模型的本地化部署提供了坚实基础。
- 舱驾一体的AI智能体:小鹏将视觉语言模型(VLM)定位为车辆理解世界的“大脑”,它不仅能指导智能驾驶(VLA作为“运动型大脑”),还能统一智能座舱,成为人与汽车交互的新入口,真正实现“AI定义汽车”。
- 前瞻性布局:何小鹏透露,小鹏的技术体系已具备在汽车、机器人和飞行汽车等不同形态产品上通用的潜力,这源于其对具身智能和世界模型的前瞻性认知与持续投入。
小鹏汽车在CVPR WAD上的分享,不仅展示了其在自动驾驶技术上的领先性,更体现了其作为一家科技公司,带着工业界实际问题和创新解法反哺学术界的决心。正如其所言,“一流的自动驾驶公司,首先是一流的AI公司”。小鹏汽车正以其独特的AI大模型路径,勇敢地迈入自动驾驶的“AI无人区”。
结论
小鹏汽车在CVPR 2025上所展示的Scaling Law在自动驾驶领域的成功验证,无疑为整个行业注入了强心剂。它清晰地表明,通过更大规模的模型、更海量的数据以及更先进的训练方法,自动驾驶系统能够实现真正的“智能涌现”,从简单的模式匹配进化到具备初步认知和推理能力的AI司机。
小鹏汽车的探索,不仅是对现有L2级辅助驾驶技术瓶颈的有力突破,更是对未来AGI(通用人工智能)在出行领域应用的一次大胆畅想。随着AI大模型技术的不断成熟和算力成本的进一步优化,我们有理由相信,一个更安全、更高效、更智能的自动驾驶时代正加速到来。想了解更多关于AI、LLM、人工智能的最新动态和深度分析,敬请关注AIGC.Bar,您的专属AI新闻与资讯门户。
Loading...