阿里Qwen-Image-Layered发布:AI生图自带图层,PS遭降维打击?
type
status
date
slug
summary
tags
category
icon
password
网址

在当前的人工智能生成内容(AIGC)领域,用户最常遇到的痛点莫过于“抽卡”式的体验。当你满怀期待地用各种大模型生成出一张构图完美的图片时,往往会发现背景里多了一根突兀的电线杆,或者是海报上的文字拼写错误。此时,如果你尝试使用传统的局部重绘(Inpainting)功能进行修复,往往会牵一发而动全身,修复了瑕疵却破坏了原本完美的背景光影。
这种“不可控”的体验,让许多设计师在尝鲜AI后,依然不得不回归Photoshop(PS)的怀抱。然而,阿里千问团队近期开源的 Qwen-Image-Layered 模型,似乎正在试图从底层逻辑上颠覆这一现状。通过引入“分层生图”的概念,AI不再只是生成一堆扁平的像素,而是像人类设计师一样,学会了使用图层。
从“扁平像素”到“智能分层”的进化
传统的扩散模型在生成图像时,是将所有元素“焊死”在同一张画布上的。对于模型而言,主体、背景、文字都是同一层像素的集合。这意味着,当你想要修改画面中的某一部分时,模型必须重新“猜测”被遮挡或修改区域的像素应该长什么样,这不可避免地会导致画面的崩坏或扭曲。
Qwen-Image-Layered 的核心突破在于,它在生成图像的同时,能够在内部实现图层的拆解。它生成的不再是一张JPG,而是一组带有透明通道(RGBA)的图层集合。AI终于“看懂”了什么是前景的主体,什么是漂浮的文字,什么是作为底色的背景。
这种技术逻辑的转变,让许多以前让AI抓狂的操作变得轻而易举。因为有了独立的RGBA通道,AI在处理图像时天然具备了物理隔离的属性。
零漂移编辑:AI修图的终极形态?
基于分层生成的逻辑,Qwen-Image-Layered 带来了所谓的“零漂移编辑”体验,这对于追求精准控制的专业设计领域来说,无疑是一个巨大的诱惑。
- 精准换色与材质替换:如果你想给画面第一层的人物换件衣服颜色,模型只需要处理该图层的像素,底层的背景和顶层的文字层完全不受影响,根本不会发生传统AI重绘中常见的“光影偏移”。
- 元素自由移动与缩放:由于物体是独立的图层,你可以在AI生成的画布里自由拖拽物体、放大缩小,甚至删除某个元素。在传统的扩散模型里,移动物体必然会在原位置留下空洞或扭曲的伪影,但在 Qwen-Image-Layered 中,模型知道每一层后面“盖着”什么,因此能实现无缝衔接。
- 文本与UI的精准修改:对于海报设计或UI界面生成,模型可以精准地定位到文字层进行修改,比如将一段英文无损替换为中文,而不会破坏背景的纹理。
31GB显存:通往未来的昂贵门槛
尽管功能听起来像是设计师的福音,但阿里的这个“黑科技”目前并非人人都能触手可及。根据技术报告和社区反馈,要在本地流畅运行 Qwen-Image-Layered,硬件门槛极高。
目前在16位浮点精度下,该模型需要消耗高达 31GB 的显存。这意味着,绝大多数消费级显卡(如RTX 4090)都难以在本地满血部署,除非你拥有昂贵的专业计算卡。这一硬件门槛,暂时将绝大多数普通用户和独立设计师挡在了门外。
此外,该模型目前更像是一个针对特定场景(如UI设计、海报制作)的“专家”。对于边缘清晰、语义明确的平面设计,它的分层效果惊人;但面对光影关系极其复杂、虚实结合的艺术摄影或绘画,其拆图精度和融合度仍有待提升。目前的逻辑更接近于“拆图重绘”,即在追求极致精准时,用户依然需要面对AI生成的不确定性。
PS的护城河还能守多久?
Qwen-Image-Layered 的出现,引发了一个行业深思:AI厂商拼命往PS的地盘里钻,究竟是想取代专业软件,还是仅仅在为现有的生图流程打补丁?
对于设计师而言,真正的需求不仅仅是生成一张好看的图,而是需要“可编辑的素材”。不可编辑的图片在商业交付中往往等同于废纸。Qwen-Image-Layered 能够完成换色、移动、分层输出,这标志着AI资讯领域关注的焦点正从“生成质量”向“可控性”转移。
虽然目前30多GB的显存门槛让其难以普及,但随着模型开源,社区的优化力量不可小觑。未来大概率会出现经过量化、蒸馏的轻量化版本。一旦显存门槛降至12GB或16GB的主流水平,Photoshop苦心经营多年的“图层”护城河,恐怕真的会开始松动。
届时,设计师的工作流可能真的会变成:动动嘴发布Prompt,让AI生成分好层的源文件,然后在图层面板里进行简单的微调。这种只给结果、极大简化过程的创作方式,是会解放创造力,还是制造更多的工业流水线产品,值得我们持续关注。
想要了解更多关于大模型、OpenAI动态以及前沿AI新闻,请持续关注 AIGC.BAR,我们为您提供最新鲜的AI资讯和深度解读,助您在人工智能时代保持领先。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)