Runway Gen 4.5震撼发布：57%用户难辨真假，AI视频生成新纪元

type

status

date

slug

summary

57%的人类“败给”了AI：真假难辨的视觉奇点

Runway此次发布的Gen 4.5模型，最大的亮点在于其令人难以置信的逼真度。为了验证模型的效果，Runway官方进行了一项极具挑战性的实验：将Gen 4.5生成的视频与真实拍摄的视频混合，保持相同的分辨率和时长，让1000名参与者在10秒内进行辨别。

结果令人震惊：只有不到一半（约42.9%）的人能够成功识别出哪些是AI生成的。这意味着，在大多数普通观众眼中，Gen 4.5生成的视频已经具备了以假乱真的能力。无论是机械义体与人脸的赛博朋克融合，还是湿漉逼真的头发细节，亦或是超自然的景深处理，AI正在重新定义“真实”的边界。对于关注AI变现和内容创作的从业者来说，这无疑是一个巨大的机遇与挑战。

叙事与镜头控制的全面进化

除了单纯的画质提升，Gen 4.5在视频生成的“可控性”和“叙事能力”上迈出了关键一步。以往的视频模型往往面临画面崩坏、人物变形或镜头逻辑混乱的问题，而Gen 4.5在以下几个方面展现了强大的实力：

精准的镜头语言：模型能够像专业摄影师一样，在短短几秒内完成近景、中景、远景的丝滑切换。即使镜头剧烈晃动，人物的面部特征依然保持高度稳定。

长故事表达能力：Gen 4.5支持更长的时序内容结构，这意味着创作者不再局限于生成几秒钟的动图，而是可以尝试制作具有完整情节的短片。

角色一致性：这是AI视频生成的一大痛点。Gen 4.5通过图像参考和内部一致性优化，确保了主角在不同镜头、不同动作下“不换脸”。例如演示中骑在飞行章鱼上的小女孩，即便环境剧烈变化，面部细节依然稳如泰山。

物理一致性与“好莱坞级”质感

在人工智能视频生成的竞争中，理解物理世界的规律是各大厂商角逐的焦点。Gen 4.5展现出了对光影、透视和重力更深刻的理解。

在官方演示中，一只巨型毛绒大猩猩在纽约街头徘徊的视频令人印象深刻。不仅镜头比例和透视逻辑无懈可击，主体与城市背景的光影融合也处理得相当完美。这种对物理一致性的增强，使得AI生成的视频不再是“一眼假”的贴图动画，而是具备了真实的体积感和空间感。这种能力的提升，让AGI（通用人工智能）在视觉理解层面的落地又近了一步。

视频模型行业的新趋势：从“能看”到“可用”

纵观从去年底至今的LLM和视频模型发展历程，我们可以清晰地看到几个共同的演进趋势，Runway Gen 4.5正是这一趋势的典型代表：

物理真实性大幅增强：模型不再只是堆砌像素，而是开始模拟光影逻辑和动作规律。

声画同步成为标配：虽然本文重点在于画面，但行业趋势显示，包括马斯克的Grok在内，越来越多的模型开始支持原生音频生成和精准的唇形同步。

局部控制精细化：创作者可以只修改视频的某一部分而无需重新生成全片，这大大降低了创作成本。

生成时长与方式的多元化：从图生视频到音频生视频，创作路径变得更加灵活，竖屏原生视频也逐渐占据主流。

结语

Runway Gen 4.5的发布，不仅是一次技术版本的迭代，更是人工智能在视觉创造力领域的一次“秀肌肉”。当57%的人已经分不清真假时，我们或许正在见证一个新的内容创作时代的黎明。

对于创作者而言，工具的门槛正在降低，而想象力的天花板正在被无限拔高。未来，或许真的需要“用AI来鉴别AI”了。想要获取更多关于ChatGPT、Claude以及最新AI日报资讯，请持续关注 AINEWS，我们将为您带来第一手的AI资讯和提示词（Prompt）技巧，助您在AI浪潮中抢占先机。