AI颠覆游戏!首个开源多人平行宇宙诞生,PC低成本畅玩 | AI资讯
type
status
date
slug
summary
tags
category
icon
password
网址
引言:AI叩响多人游戏新纪元
人工智能(AI)的浪潮正以前所未有的速度席卷全球,从艺术创作到科学研究,AI的应用边界不断拓展。如今,这股变革力量再次震撼了互动娱乐领域。来自以色列的Enigma Labs团队石破天惊,推出了全球首个AI生成的多人游戏模型——Multiverse,并将其全面开源!这意味着,我们距离在个人电脑上低成本实时生成一个可供多人互动的“平行宇宙”又近了一步。这不仅仅是一款游戏或一个引擎,更是一个模拟多智能体在共享世界中交互的“大脑”,为我们揭示了AGI(通用人工智能)和LLM(大语言模型)在复杂模拟场景中的巨大潜力。更多前沿AI资讯,欢迎访问AI门户网站 aigc.bar。
AI多人游戏的革命:告别“独角戏”与“视角错乱”
传统的AI世界模型,如DeepMind的Dreamer系列,已经在单人游戏中展现出惊人的学习和预测能力,能够通过“想象”来完成任务。然而,真实世界往往是多主体互动的复杂系统。在多人游戏中,如何确保所有玩家体验到的是同一事件的不同视角,遵循相同的物理规律,避免出现“你撞车了他却穿模”的尴尬局面,一直是AI面临的巨大挑战。
Multiverse的出现,正是为了攻克这一核心难题。它不再局限于单个智能体的感知和行动,而是从第一性原理出发,将“世界模型”的概念扩展到多个玩家。其核心目标是让多个AI在同一个虚拟世界中“看到同一件事”,并做出符合共享物理规则的合理反应。这标志着AI在理解和构建复杂动态多人环境方面取得了革命性突破。
Multiverse架构深度揭秘:双视角融合与同步生成
为了实现真正的多人互动体验,Multiverse在保留传统世界模型核心组件(如动作嵌入模块、去噪网络、上采样器)的基础上,对整体架构进行了颠覆性的调整和重新设计:
- 联合动作嵌入:模型不再是接收单个玩家的动作,而是同时处理两个玩家的操作,并输出一个代表他们共同意图的嵌入向量。
- 双视角同步生成:去噪网络基于历史帧和两个玩家的联合动作嵌入,能够同时为两个玩家生成下一帧画面。这意味着两个AI的“所见”是作为一个整体被预测和渲染的。
- 视角融合的巧思:如何将两个玩家的独立视角有效地输入给模型?Multiverse摒弃了传统分屏游戏式的垂直堆叠(这会导致模型在早期层无法充分融合信息),而是创新地选择了沿着通道轴堆叠帧。这种方式将两组画面视为一个具有双倍颜色通道的图像,使得AI在网络的每一层都能同时处理两个玩家的视角数据,极大地提升了生成帧间的一致性和世界的“共享感”。
这种架构设计,充分体现了当前大模型在处理多模态信息和复杂关联性方面的强大能力。
挑战与创新:驾驭时空上下文与长程预测
在赛车这类动态游戏中,AI不仅需要理解玩家的即时操作(如转向、刹车),还需要感知车辆的运动学特性(如速度、加速度)以及与其他车辆的相对运动。
- 上下文扩展的智慧:研究发现,捕捉车辆自身的运动学大约需要8帧(30fps)的上下文。但要捕捉车辆间的相对运动(如超车),则需要更长的时间跨度,大约是前者的三倍。直接扩展上下文长度会显著增加计算负担,影响实时性。Multiverse巧妙地采用了稀疏采样策略:保留最近的几帧,并从更早的帧中进行间隔采样,从而在不大幅增加计算量的前提下,获取长达0.66秒前的有效信息,足以捕捉车辆的相对运动和道路动态。
- 课程学习赋能长程预测:多人互动往往发生在较长的时间尺度上。为了让模型学会预测未来长达15秒的场景,Multiverse引入了课程学习机制。在训练初期,模型先学习预测较短时间(如0.25秒)的未来,掌握基础的物理和几何特征;随着模型能力的提升,逐渐增加预测时长,训练其理解更高级的玩家行为和互动逻辑。这种循序渐进的训练方式,有效解决了长程预测带来的显存和训练效率挑战。
这些创新不仅提升了AI的“驾驶技术”,更增强了多人游戏体验的真实感和沉浸感。
《GT赛车4》的重生:数据驱动的AI平行宇宙
Enigma Labs选择在经典的赛车游戏《Gran Turismo 4》(GT赛车4)上训练和测试Multiverse。这款游戏拥有丰富的车型和赛道,但其原生并不支持团队所期望的1v1全屏对战模式。
- 逆向工程与游戏改造:为了获取理想的训练数据,团队对《GT赛车4》进行了逆向工程和修改,使其能够在特定赛道上以1v1模式运行。
- 创新的数据采集:由于需要双玩家的第三人称视角数据,团队利用了游戏内的回放系统,将每场比赛从两个玩家的角度各录制一遍,再进行同步合并。更令人称道的是,他们通过计算机视觉技术,从游戏画面的HUD元素(如油门、刹车指示器)中逐帧提取并解码出玩家的控制输入。这意味着无需直接记录按键,就能从视频中重建完整的操作序列,极大地简化了数据集的构建,甚至可以利用游戏内置AI的比赛来自动生成数据。
这种数据驱动的方法,为AI模型的训练提供了高质量、大规模的素材,是Multiverse成功的关键因素之一。
结论:AI开启游戏与模拟新范式,未来已来
Multiverse的全面开源,无疑是AI领域和游戏行业的一大步。它不仅展示了以相对低廉的成本(不到1500美元的训练费用)在单台PC上实现复杂AI多人实时模拟的可能性,更为重要的是,它为我们提供了一个可复制、可扩展的框架,去探索AI在构建共享虚拟世界、模拟多智能体交互方面的无限潜力。
从游戏娱乐到更严肃的科研模拟(如交通流、城市规划、机器人协作),Multiverse所代表的技术方向预示着一个由AI驱动的、更加动态和智能的数字未来。随着AGI和LLM等技术的不断发展,我们可以期待更多类似Multiverse的创新涌现,它们将不断刷新我们对“平行宇宙”的认知。
想要获取更多关于AI、大模型、AGI的前沿资讯和深度解读,敬请关注AI门户网站 aigc.bar,这里有最新的AI新闻、AI日报和丰富的Prompt技巧,助你把握人工智能时代的脉搏,探索AI变现的无限可能。
Loading...