业内最强一致性模型来了，Vidu Q1参考生以7主体一致性成专业生产力引擎

人阅读 2025-07-09 17:47:05业界资讯

从卢米埃尔兄弟用35mm摄影机拍摄世界第一部影片《火车进站》到《星球大战》的数字革命，视频内容史的每次跃迁都在拓展叙事边界。

2025年7月，AI视频模型Vidu Q1重磅推出参考生功能，颠覆传统内容生产流程，从想象到视频素材生成只需一步。

这不仅仅是一次产品功能的升级，更是全新内容生产方式重构。

Vidu Q1 参考生将重新定义叙事。

重新定义叙事，从想象到视频生成只需一步

传统内容范式正在被颠覆，这场革命的核心是Vidu Q1参考生功能的推出。

以前传统视频制作流程为：脚本——角色设定——分镜——摄影——后期特效——剪辑——成片；

AI图生视频主要的步骤为从脚本——文生图/P图/融图——图片生成——图生视频——剪辑——成片；

现在，“参考图、Vidu Q1 参考生准备，Action "几分钟后，视频素材就生成了，从参考图——视频生成——剪辑——成片，省去了分镜制作和拍摄、特效的过程，完全颠覆了传统的视频生产方式，重新定义了基于AI 原生的内容叙事。

零分镜生成

对于创作者来说，若想获得理想视频画面，图生视频更多依赖于分镜，分镜越多，制作得越精致，产出的视频的质量也就越高。但分镜制作本身需要非常多的专业技能，比如文生图需要掌握很多提示词技巧，而P图或者将生成的图和角色融合到一起，同样需要很强的图片编辑的专业技能，光是这些就已经将很多人挡在门外了。

此外，通常一个场景需要十几个分镜，包括远景、近景、特写等，制作一部短片可能分镜就得上百张，每一个分镜都得重新P图或者生成新的图片，即使是专业创作者也会在这个环节耗费非常多的时间，影响视频制作效率。

Vidu Q1参考生直接跳过中间复杂度较高的分镜制作环节，仅需上传人物、道具、场景等参考图，Vidu Q1 基于参考生功能对于人物、场景、道具等元素的深层理解和各元素之间的互动关系，即可直接将多个参考元素融合为一段视频素材，真正实现零分镜生成。

相较于文生视频的不可控和图生视频对分镜的重度依赖，参考生兼具可控性与灵活性的双重优势。不过更为重要的创新在于，文生视频与图生视频仍是基于传统视频制作方式，而Vidu Q1 参考生不只是对于原有传统制作效率的显著提升，更是打破了固有的传统内容创作方式，打造了AI 原生工作流，从参考图元素到视频素材生成，中间仅需一步，创作门槛大幅降低。

比如要生成一个牛仔决斗的视频，仅需输入2个牛仔人物，2个场景，2把手枪的参考图，利用Vidu Q1 参考生即可生成西部大片。

素材即剧组

不仅如此，Vidu Q1参考生功能的推出，也给予创作者更多灵活性。上传的人物、道具、场景等素材分别是你强大的演员库、道具库和场景库，他们作为永不疲惫的“数字演员”，组成了你庞大且任意调配的[虚拟剧组]。

你可以利用Vidu Q1 参考生功能随时调用其中的任意素材，可以是多个人物同一场景，或者同一场景，不同人物或道具，或者不同场景，同一人物等，你将有无数种排列组合，排列组合不同，生成的视频内容也不同。这无疑提高了素材的可复用性，只需变换单个或者多个元素，保持其他主体不变，即可实现镜头叙事的自然转换与情节发展。

延续性价比优势，Vidu Q1 参考生价格不到传统版权素材成本的三十分之一

在生数科技Vidu实际合作的客户案例中，不少行业客户表示希望利用AI 降低至少50%的制作成本。此次Vidu Q1 参考生一条5秒1080p视频价格最低不到9毛钱，仅为1080P传统通用类版权素材的不到1/30，相较于动辄上千元定制类版权素材更是极具性价比。如果你想要生成一集48分钟的电视剧素材，仅需1000元就够了。这意味着创作平权时代的到来。

超高一致性，最多支持7个主体输入

作为参考生的全球首个提出者，Vidu 在参考生领域持续迭代。我们洞察到视频生成的一致性是一切商业化场景使用的前提，唯有高度的一致性，才能让AI视频生成走向大规模商业化应用。相比于有趣的互动玩法，客户更在乎AI 视频生成的一致性效果。

对于IP方来说，保持主角的一致性是基本原则，熊大熊二的每个脸部细微特征，孙悟空或者三毛头上的几根毛发都必须保持严格一致。对于电商客户来说，如果生成的视频无法100%与商品一致，即使AI能带来成本的大幅降低，对于他们来说也是无法实际应用。

Vidu Q1参考生此次在主体一致性上有了大幅提升，更加适用于对主体一致性要求较高的电商、广告、短片等专业类场景。

如果你是品牌商家，可以使用Vidu Q1参考生功能，变换不同的商品素材，让安妮.海瑟薇为你的商品代言，从粉色的特斯拉到口红、包包，甚至是一杯蜜雪冰城奶茶，安妮.海瑟薇动作熟练自然，充分展现了每个商品的不同角度，且在此过程中商品始终保持一致，而这个视频仅花费了9.9元。

此外我们也注意到，目前市面上AI生成视频的突出问题在于，一旦同一画面涉及到多主体，一致性就难以保持，出现“移形换影”的情形，大幅度的动作交互更是容易丢失细节，或者不符合物理运动规律。很多时候创作者为了降低工作量和随机性，会避免让多角色同框，试图通过切换镜头来实现多角色的互动，但这并没有实质性解决多角色叙事的问题。

而Vidu Q1参考生就是为多主体一致性而生。目前Vidu Q1 可最多支持七个主体同时输入并始终保持一致，这意味着你可以真正像导演一样指定你想要的多个角色、道具、场景，让视频生成的内容更为精准。

以前让《西游记》师徒四人同框互动且不穿帮，对于大部分AI 视频工具是件极具挑战的事情，而现在则可以直接通过Vidu Q1参考生实现，并始终保持每个角色的一致性。

比如让来自不同朝代、国家、地域的三个聪明人诸葛亮、丘吉尔和拿破仑出现在同一个会议室交流。只需输入三个人物图片素材和相应提示词，即可生成一段三人对话的视频。画面中诸葛亮和丘吉尔似乎在商量着什么大事，坐在中间的拿破仑则坐着边认真聆听边思考着什么。