VAST融资近2亿,揭秘颠覆性“世界模型”Project Eden

type
status
date
slug
summary
tags
category
icon
password
网址
notion image

VAST融资近2亿,重塑AI世界模型版图

近日,通用人工智能公司VAST(Virtual Assistant for Spatial Technologies)抛出重磅消息:不仅成功完成近2亿美元的新一轮融资,更重要的是,它正式对外披露了其在“世界模型”领域的革命性技术路线——Project Eden。这一里程碑式的事件,不仅为VAST注入了强劲的发展动力,也为整个AI行业,特别是3D内容生成和虚拟世界构建领域,打开了全新的想象空间。
新一轮融资由渶策资本和国寿长三角科创基金领投,汇聚了包括深圳市人工智能终端产业基金(与全球头部终端厂商荣耀深度绑定)、上海半导体产投等产业资本,以及深创投、元生资本等一线财务资本。众多知名投资方的超额追投,充分证明了市场对VAST技术实力和未来潜力的认可。这笔资金将极大地加速VAST在世界模型研发上的进程,并推动其落地应用。

剖析VAST的“世界模型”哲学:Project Eden的独特性

在AI飞速发展的今天,“世界模型”已成为兵家必争之地。然而,当前行业内存在多种技术路线,各有侧重,也各有局限。VAST提出的Project Eden,正是基于对现有路径的深刻洞察,以及对通用世界模型核心命题的全新解答。

现有世界模型路线的挑战

  • 单体视频模型(如Google DeepMind的Genie): 这种模型将空间、世界、交互和视角压缩进像素历史。其优点在于能够生成连贯的视频,但一旦镜头移开,模型就“遗忘”了该区域的状态,缺乏独立的、跨越视角的“状态”概念,难以支持多玩家实时交互。
  • 静态3D场景生成(如李飞飞创立的World Labs的Marble): Marble模型强调空间结构和几何一致性,能从单张图片生成持久的3D世界,空间感知能力突出。然而,它剥离了时间维度和物理运行逻辑,目前主要停留在静态场景重建,缺乏动态变化和状态推演能力。
  • 潜空间状态推演(如Yann LeCun力推的JEPA): JEPA主张在潜空间维护内部状态进行推演,这与VAST的底层哲学有一定相似之处。但JEPA目前更多停留在学术理论层面,距离大规模商业化应用尚有距离。

Project Eden的核心创新:状态与渲染的原生解耦

VAST认为,一个合格的通用世界模型必须同时解决两大核心命题:定义世界当下的客观状态(State)驱动世界持续自主演化(Transition)。Project Eden正是围绕这两大命题,提出了一个极具创造性的技术架构:将底层状态推演视觉呈现进行原生解耦。
这一架构分为三层:
  1. 结构化状态层(底层): 这一层维护着一个跨时间持续存在的全局世界状态,它独立于任何相机视角。无论镜头如何移动,世界的底层逻辑都在持续运转。它以紧凑的隐式表征记录场景几何、物体属性和全局事件逻辑,确保了计算效率。
  1. 条件接口层(中间层): 负责将底层3D状态转化为特定视角下的语义和几何约束。所有视角的渲染都源自同一个底层世界,从而保证了物理上的一致性,避免了模型“猜测”画面的情况。
  1. 生成式渲染层(上层): 在获得状态约束后,专注于补全纹理、光照、材质和局部动态细节。由于不需要盲目猜测画面结构,其算力可以完全集中于渲染本身,效率和质量都得以提升。
这种解耦的优势在于,当玩家执行某个动作(如按下灭火器)时,状态模型只需负责推理“接下来会发生什么”,而渲染模型则专注于呈现“看起来是怎样的”。这种“专精”模式极大地降低了模型的负担,使其能够更准确、更高效地工作。

数据策略:L1与L2的双轨驱动

支撑Project Eden强大能力的,是其独特的数据策略:
  • L1:海量互联网视频自标注: 依托Tripo积累的3D基础模型能力,VAST能够反向解构互联网2D视频,提取深度、相机位姿与几何轨迹,将普通视频转化为同时包含底层推演态和视觉渲染态的双态数据。互联网视频的巨大体量为模型提供了泛化底座。
  • L2:引擎合成数据: 游戏引擎天然是双态数据的绝佳来源。VAST通过让Agent在引擎环境中7×24小时不间断探索,自动录制带有精准3D状态标注的训练配对数据,帮助模型学习严密的物理演变和控制逻辑,确保数据的精确性。

Project Eden的三大核心能力与落地场景

状态与渲染的解耦,使得Project Eden跨越了传统单体视频模型的局限,带来了三大颠覆性能力:

1. 原生的环境持久化

对象即使暂时离开相机视锥,在底层状态中依然持续运转。当用户转回视角时,模型查询的是确定存在的客观状态,而非依赖历史帧重构,从而实现了长程记忆和场景一致性。

2. 场景自由复用与模块化

与传统“一镜到底”的世界模型不同,Project Eden允许用户反复介入一个正在运转的底层世界状态。用户对场景的修改会被真实留存,后续进入者看到的是一致的结果。同一个底层世界状态可以支持模块化搭建和反复介入,极大地提高了效率和复用性。

3. 原生多玩家交互

状态与渲染解耦后,单一底层世界可以同时支持大量真人用户与AI智能体并发在线交互。与单体视频模型算力随人数指数爆炸不同,Project Eden的底层状态由所有智能体共享并同步推演,系统只需根据各自坐标渲染画面,算力成本呈线性增长,真正实现了多人在线世界的架构可行性。
这些能力为VAST打开了广阔的落地空间:
* 面向消费创作者:AI原生沙盒平台 支持用户通过自然语言或简易动作,一键创作可多人共享的互动数字世界,内容持续累积,无需重复生成。 * 面向科研:具身智能的高质量仿真基座 提供具备稳定物理逻辑、时序一致、可长期持久化的生成式世界,为集群式智能体训练和多智能体协同研究提供强大支持。
VAST的愿景是让每个人都能亲手创造、自由探索无数个可交互的世界。Project Eden的名字,也寓意着打破禁锢,让好奇心和创造力在无数个“花园”中恣意生长。

VAST:从“造万物”到“造世界”的坚实根基

VAST在AI 3D领域的长期积累,为其进军世界模型领域奠定了坚实基础。其旗下Tripo系列产品已成为全球使用最广泛的通用3D生成大模型之一,在3D生成精度、速度和贴图质量等方面屡创行业标杆。
VAST在开源生态上同样表现卓越,累计开源项目超30个,覆盖了从基础表征到生成管线的完整技术栈,为行业发展做出了重要贡献。其创始人团队,如97年出生的CEO宋亚宸、资深AI专家CTO梁鼎,以及首席科学家曹炎培等,都拥有深厚的技术背景和成功的项目经验。
VAST深知通往真正“活”起来的世界模型之路仍有挑战,例如更高复杂度的物理演化和状态的自主维护。但凭借其独特的技术路线和强大的团队实力,VAST已经迈出了自己的方向,为AI构建虚拟世界设下了新的标杆。
AI的未来,正从理解世界走向创造世界。VAST的Project Eden,无疑是这场伟大征程中的一个重要节点,值得我们持续关注。
--- *AI资讯,AI新闻,AI门户,AGI,LLM,大模型,提示词,openai,chatGPT,人工智能,claude,AI日报,Prompt,AI变现,VAST,世界模型,Project Eden,3D生成,虚拟世界*
Loading...

没有找到文章