VAST融资近2亿，揭秘颠覆性“世界模型”Project Eden

type

status

date

slug

summary

VAST融资近2亿，重塑AI世界模型版图

近日，通用人工智能公司VAST（Virtual Assistant for Spatial Technologies）抛出重磅消息：不仅成功完成近2亿美元的新一轮融资，更重要的是，它正式对外披露了其在“世界模型”领域的革命性技术路线——Project Eden。这一里程碑式的事件，不仅为VAST注入了强劲的发展动力，也为整个AI行业，特别是3D内容生成和虚拟世界构建领域，打开了全新的想象空间。

新一轮融资由渶策资本和国寿长三角科创基金领投，汇聚了包括深圳市人工智能终端产业基金（与全球头部终端厂商荣耀深度绑定）、上海半导体产投等产业资本，以及深创投、元生资本等一线财务资本。众多知名投资方的超额追投，充分证明了市场对VAST技术实力和未来潜力的认可。这笔资金将极大地加速VAST在世界模型研发上的进程，并推动其落地应用。

剖析VAST的“世界模型”哲学：Project Eden的独特性

在AI飞速发展的今天，“世界模型”已成为兵家必争之地。然而，当前行业内存在多种技术路线，各有侧重，也各有局限。VAST提出的Project Eden，正是基于对现有路径的深刻洞察，以及对通用世界模型核心命题的全新解答。

现有世界模型路线的挑战

单体视频模型（如Google DeepMind的Genie）： 这种模型将空间、世界、交互和视角压缩进像素历史。其优点在于能够生成连贯的视频，但一旦镜头移开，模型就“遗忘”了该区域的状态，缺乏独立的、跨越视角的“状态”概念，难以支持多玩家实时交互。

静态3D场景生成（如李飞飞创立的World Labs的Marble）： Marble模型强调空间结构和几何一致性，能从单张图片生成持久的3D世界，空间感知能力突出。然而，它剥离了时间维度和物理运行逻辑，目前主要停留在静态场景重建，缺乏动态变化和状态推演能力。

潜空间状态推演（如Yann LeCun力推的JEPA）： JEPA主张在潜空间维护内部状态进行推演，这与VAST的底层哲学有一定相似之处。但JEPA目前更多停留在学术理论层面，距离大规模商业化应用尚有距离。

Project Eden的核心创新：状态与渲染的原生解耦

VAST认为，一个合格的通用世界模型必须同时解决两大核心命题：定义世界当下的客观状态（State）和驱动世界持续自主演化（Transition）。Project Eden正是围绕这两大命题，提出了一个极具创造性的技术架构：将底层状态推演与视觉呈现进行原生解耦。

这一架构分为三层：

结构化状态层（底层）： 这一层维护着一个跨时间持续存在的全局世界状态，它独立于任何相机视角。无论镜头如何移动，世界的底层逻辑都在持续运转。它以紧凑的隐式表征记录场景几何、物体属性和全局事件逻辑，确保了计算效率。

条件接口层（中间层）： 负责将底层3D状态转化为特定视角下的语义和几何约束。所有视角的渲染都源自同一个底层世界，从而保证了物理上的一致性，避免了模型“猜测”画面的情况。

生成式渲染层（上层）： 在获得状态约束后，专注于补全纹理、光照、材质和局部动态细节。由于不需要盲目猜测画面结构，其算力可以完全集中于渲染本身，效率和质量都得以提升。

这种解耦的优势在于，当玩家执行某个动作（如按下灭火器）时，状态模型只需负责推理“接下来会发生什么”，而渲染模型则专注于呈现“看起来是怎样的”。这种“专精”模式极大地降低了模型的负担，使其能够更准确、更高效地工作。

数据策略：L1与L2的双轨驱动

支撑Project Eden强大能力的，是其独特的数据策略：

L1：海量互联网视频自标注： 依托Tripo积累的3D基础模型能力，VAST能够反向解构互联网2D视频，提取深度、相机位姿与几何轨迹，将普通视频转化为同时包含底层推演态和视觉渲染态的双态数据。互联网视频的巨大体量为模型提供了泛化底座。

L2：引擎合成数据： 游戏引擎天然是双态数据的绝佳来源。VAST通过让Agent在引擎环境中7×24小时不间断探索，自动录制带有精准3D状态标注的训练配对数据，帮助模型学习严密的物理演变和控制逻辑，确保数据的精确性。

Project Eden的三大核心能力与落地场景

状态与渲染的解耦，使得Project Eden跨越了传统单体视频模型的局限，带来了三大颠覆性能力：

1. 原生的环境持久化

对象即使暂时离开相机视锥，在底层状态中依然持续运转。当用户转回视角时，模型查询的是确定存在的客观状态，而非依赖历史帧重构，从而实现了长程记忆和场景一致性。

2. 场景自由复用与模块化

与传统“一镜到底”的世界模型不同，Project Eden允许用户反复介入一个正在运转的底层世界状态。用户对场景的修改会被真实留存，后续进入者看到的是一致的结果。同一个底层世界状态可以支持模块化搭建和反复介入，极大地提高了效率和复用性。

3. 原生多玩家交互

状态与渲染解耦后，单一底层世界可以同时支持大量真人用户与AI智能体并发在线交互。与单体视频模型算力随人数指数爆炸不同，Project Eden的底层状态由所有智能体共享并同步推演，系统只需根据各自坐标渲染画面，算力成本呈线性增长，真正实现了多人在线世界的架构可行性。

这些能力为VAST打开了广阔的落地空间：

* 面向消费创作者：AI原生沙盒平台 支持用户通过自然语言或简易动作，一键创作可多人共享的互动数字世界，内容持续累积，无需重复生成。 * 面向科研：具身智能的高质量仿真基座 提供具备稳定物理逻辑、时序一致、可长期持久化的生成式世界，为集群式智能体训练和多智能体协同研究提供强大支持。

VAST的愿景是让每个人都能亲手创造、自由探索无数个可交互的世界。Project Eden的名字，也寓意着打破禁锢，让好奇心和创造力在无数个“花园”中恣意生长。

VAST：从“造万物”到“造世界”的坚实根基

VAST在AI 3D领域的长期积累，为其进军世界模型领域奠定了坚实基础。其旗下Tripo系列产品已成为全球使用最广泛的通用3D生成大模型之一，在3D生成精度、速度和贴图质量等方面屡创行业标杆。

VAST在开源生态上同样表现卓越，累计开源项目超30个，覆盖了从基础表征到生成管线的完整技术栈，为行业发展做出了重要贡献。其创始人团队，如97年出生的CEO宋亚宸、资深AI专家CTO梁鼎，以及首席科学家曹炎培等，都拥有深厚的技术背景和成功的项目经验。

VAST深知通往真正“活”起来的世界模型之路仍有挑战，例如更高复杂度的物理演化和状态的自主维护。但凭借其独特的技术路线和强大的团队实力，VAST已经迈出了自己的方向，为AI构建虚拟世界设下了新的标杆。

AI的未来，正从理解世界走向创造世界。VAST的Project Eden，无疑是这场伟大征程中的一个重要节点，值得我们持续关注。

--- *AI资讯,AI新闻,AI门户,AGI，LLM，大模型，提示词,openai,chatGPT,人工智能,claude,AI日报,Prompt,AI变现,VAST,世界模型,Project Eden,3D生成,虚拟世界*