阿里 Qwen-Image-Edit-2509 模型更新发布,支持多图编辑、单图一致性提升
9 月 29 日消息,阿里通义千问今日宣布更新 Qwen-Image-Edit 的迭代版本 —— Qwen-Image-Edit-2509,现已在 HuggingFace 和魔搭社区开源,用户也可以通过 Qwen Chat 选择“图像编辑”功能免费体验最新模型。
相较于 8 月版本,Qwen-Image-Edit-2509 新增了如下特性:
多图编辑支持:对于多图输入,Qwen-Image-Edit-2509 基于 Qwen-Image-Edit 结构,通过拼接方式进一步训练,从而进行了支持。提供“人物 人物”,“人物 商品”,“人物 场景”等多种玩法。
单图一致性增强:对于单图输入,Qwen-Image-Edit-2509 显著提高了一致性,主要体现在以下方面:
人物编辑一致性增强:增强人脸 ID 保持,支持各种形象照片、姿势变换;
商品编辑一致性增强:增强商品 ID 保持,支持商品海报编辑;
文字编辑一致性增强:除了支持文字内容修改外,还支持多种文字的字体、色彩、材质编辑;
原生支持 ControlNet:包括深度图、边缘图、关键点图等。
Qwen-Image-Edit-2509 的首要更新是支持了多图输入。附官方示例如下:
我们先看一个“人物 人物”的例子:
我们再看一个“人物 场景”的例子:
下面是一个“人物 物体”的例子:
实际上,多图输入也支持 ControlNet 常用的关键点图,比如改变人物姿势:
类似的,下面几个例子展示了 3 张图片的效果:
Qwen-Image-Edit-2509 的另一个重要更新是提升了一致性。
第一,在人物一致性上,Qwen-Image-Edit-2509 比 Qwen-Image-Edit 有了显著提升,下面展示了各种形象照片生成的例子:
再比如,更改人物的姿势,也可以很好的保持角一致:
基于这一点,加上 Qwen-Image 本身特色的文字生成能力,我们发现 Qwen-Image-Edit-2509 很擅长制作表情包:
人物的一致性也体现在老照片修复上,下面是两个例子:
当然,除了真实人物,生成卡通玩偶、文创也是可以的:
第二,Qwen-Image-Edit-2509 专门增强了商品的一致性。我们发现,模型可以通过白底商品图很自然的制作商品海报:
或者是简单的 logo:
第三,Qwen-Image-Edit-2509 专门增强了文字一致性,并且支持了包括字体类型编辑、字体颜色编辑和字体材质编辑。
此外,定点文字编辑的能力获得了大幅增强:
值得一提的是,文字的编辑常常也可以和图像的编辑交融在一起,比如下面这个海报编辑的例子:
Qwen-Image-Edit-2509 的最后一个更新是原生支持了 ControlNet 的常用的图像条件,比如关键点控制、草图等。
Qwen-Image-Edit-2509 开源地址:
https://modelscope.cn/models/Qwen/Qwen-Image-Edit-2509
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。