就在刚刚,Vidu Q2 终于放出了它真正的王炸功能「参考生」!
我们暂且不说新功能,就说 Vidu Q2 这个模型,本身文戏人物微表情和情绪就很到位,而且武戏也非常能打。现在,Vidu 把它的看家本领「参考生」功能,正式升级搭载到了这个演技炸裂的新模型上。
说起参考生,Vidu 才是真正的开创者,早在去年9月,它在全球首次提出了这个概念。这次升级,就等于给一个天赋异禀的顶级演员,配上了经验老道的金牌导演。它的核心,就是来解决 AI 视频最头疼,也最关键的一致性问题。为什么我敢说它是王炸?因为它能同时理解多达 7 个不同类型的参考图,而目前的 Sora 2,只支持1个。

它意味着,你对画面的控制力,达到了前所未有的程度。 内容可控、语义可懂、多主体保持一致。接下来,我们就把这个参考生功能,掰开揉碎了聊。
杀手锏
我们先用人话解释一下,参考生到底是个啥。早期的 AI 视频,就像开盲盒。你输入一段文字,AI给你生成什么,全凭运气。但参考生功能,彻底解决了这个问题,你可以直接扔给 AI 参考图。
比如,一个特定长相的演员,一个你们公司设计的 IP 形象,或者一款刚上市的新品。AI 会精准识别这张图里的核心元素,并让它在视频里动起来。而且,最新版的 Vidu Q2,生成的视频时长已经可以达到8秒,主体的连贯性和画质效果表现非常好。

我们来看一个具体的案例,你就懂了。假设,我们想给一个新上市的咖啡品牌,做一条广告片。传统方式,得组建团队、找演员、租场地、拍摄、剪辑,一套下来,没个十天半月搞不定。现在用 Vidu Q2 参考生怎么做?
第一步,我们上传一张女主角的照片。第二步,上传一张咖啡产品的特写图。第三步,再上传一张巴黎街头咖啡馆的场景图。

然后,输入一句话指令。Vidu 有个独创玩法,直接@图片或者将提示词框中的「图1」、「图2」、「图3」标签拖到词组对应的区域即可精准控制。
提示词:在巴黎街头的露天咖啡座,和煦的阳光透过遮阳棚洒在她身上。她优雅地拿起手中的纸质咖啡杯,轻轻品尝了一口,随后抬起头,脸上露出一个满足而温暖的微笑,眼中闪烁着喜悦的光芒,慢动作,电影感。
Vidu Q2 会把这三个你指定的元素,完美融合在一个视频里。
女主角就是你选的那个演员,产品就是你的那款咖啡,场景就是你想要的巴黎风情。 人物、产品、场景,三者都牢牢锁定,精准可控。整个过程,可能只需要几十秒。(据悉,Vidu Q2 在内容一致性进一步提升的同时,其推理生成的速度对比上个版本 的 Vidu Q1 参考生提升3倍,价格也更加优惠。)这就是参考生功能的威力,它让视频创作的门槛,从专业级,一下子降到了人人可玩的程度。
这背后,是AI对画面语义的深度理解。
它知道哪个是人,哪个是物,哪个是背景。 并且能让这些元素在动态的视频里,始终保持高水准的一致性和稳定性。对于电商、广告、动画这些行业从业者而言,简直太爽了。内容生产的效率,将迎来一次史诗级的提升。
我们先拿电商举个例子,这个感受最直接。假设我们要推广一款降噪耳机。我们只需要上传两张图:一张品牌代言人的高清半身照,和一张耳机的产品精修图。

我们甚至不需要准备场景图。 直接用提示词告诉 Vidu 这段视频呈现的是什么效果。
提示词:电影级镜头,他站在一间极简主义的顶层公寓里,背景是巨大的落地窗和窗外璀璨的城市夜景。他缓缓地、流畅地将耳机戴在头上,随着耳机的落下,他原本平静的表情变得更加宁静和专注,仿佛瞬间进入了自己的世界。高级广告质感。

瞬间,Vidu 就为我们生成了一段质感堪比电影的广告片。 代言人形象完美还原,产品无缝融入。但这还只是开始。除了故事片,电商还需要纯粹、高级的产品渲染视频。Vidu Q2 参考生同样能轻松搞定,而且方式更简单。这一次,我们只上传一张图:就是那张耳机的产品精修图。然后用提示词,让 AI 生成产品渲染图。
提示词:耳机静置在一个由半透明磨砂玻璃和金属线条构建的几何空间中央。镜头围绕耳机进行一次优雅的弧线运动,同时耳机自身在轴心上进行小幅度的倾斜和旋转。周围有微弱的蓝色能量光粒子在空气中漂浮,营造出一种产品发布的神秘和高级氛围。

Vidu 几乎是凭空将一张 2D 的平面产品图,变成了一段拥有流畅动态、高级光影的3D渲染视频。这意味着什么?
想象一下,在过去,完成我们刚刚做的这两段视频,至少需要一个导演团队、摄影师、灯光师、场景搭建、再加上一个专业的三维动画师,前后花费数周时间。而现在,只需要一个运营人员,拿着代言人和产品的两张图,一个下午就能全部搞定。不只是效率提升了10%或20%,这是对整个电商内容生产流程的彻底颠覆。
聊完电商,我们再看看它对内容创作,尤其是短剧国漫行业的赋能。国漫修仙题材,一直是大热门,但制作门槛非常高。 一个角色御剑飞行的几秒钟镜头,背后可能是动画师数十个小时的辛勤工作。现在,情况完全不同了。 创作者只需要把自己的角色设计稿、仙气缭绕的场景原画,作为参考图输入给 Vidu Q2 参考生。

然后输入指令,我们还可以将「AI 配音」功能打开(目前ViduQ2已支持音视频同出功能,可自由选择生成人声/音效)。
提示词:镜头聚焦于男主角手中古剑的剑尖,它正缓慢地插入祭坛中心。随着剑尖没入,祭坛四周的石柱开始崩裂,空中的乌云中传来低沉的雷鸣。他身上的白色长袍无风自动,周围形成一个由无数能量符文组成的金色旋涡,不断向他汇聚,充满远古力量苏醒的史诗感。

Vidu Q2 不仅能生成一段极具东方美学神韵的动画短片,它还会自动匹配上低沉的雷鸣和能量的嗡鸣声,一个有声有色的电影级片段瞬间完成。如果说宏大场面是国漫的骨架,那细腻的人物互动就是国漫的灵魂。这一点,Vidu Q2 同样能驾驭,而且方式更简单。这一次,我们只上传男主角和女主角两张角色图,不提供任何场景。 我们用提示词描述一个互动场景。
提示词:男主角和女主角站在一片开阔的星空下,背景是璀璨的银河和点点繁星。师姐微微抬头,凝视星空,眼中充满向往。男主角则站在她身侧,深邃的目光望向远方,似乎在思考着星辰轨迹的奥秘。两人之间虽然没有言语,但眼神和姿态透露出一种精神上的共鸣和对仙道的探索。

Vidu 凭空生成了意境宏大的璀璨星空,还精准还原了两个角色的形象。单人特效、多人互动,角色的形象、服装,场景的画风,都能保持高度的一致性。这等于直接打通了从原画设定到动画成片的关键环节。
对于无数拥有好故事,但缺乏资金和技术团队的独立创作者来说,这扇门,终于被打开了。一个全民创作优质国漫的时代,真的不远了。
视频延长
参考生功能让视频内容精准可控,而 Vidu 的另一个新功能「视频延长」,解决了视频叙事连贯性的问题。AI 视频的一大痛点,就是时长太短。几秒钟的片段,很难讲好一个完整的故事。而 Vidu 也很好地解决了这个问题,它搭载的视频延长模式,让故事可以被完整地讲述出来。

我们可以通过两个场景,来直观感受它的强大之处。比如在一个动漫片段里,输入的指令是:两个小孩将手中的杯子放下,起身向屋外走去。

在生成的续写片段里,两个小孩的形象、服饰、包括周围的环境,都保持了惊人的一致性。 从放下杯子,到转身,再到迈步,整个动作自然连贯,没有任何的突兀感。这证明 Vidu 延长功能对人物主体和动作的理解非常到位。而在另一个更复杂的动画场景里,挑战升级了。 原始视频是一段8秒的动画:男子在欢呼声中将棒球扔出去。然后,让 AI 进行延长,指令里特别加了一句:镜头跟随棒球。最终,原来生成的8秒视频,在「延长功能」选项中选择延长6秒后,视频被完美地延长到了14秒。
这段视频厉害的地方有两点:① 它精准还原了棒球飞行的物理轨迹,那个弧线非常真实。第二,也是更关键的,AI 竟然真的理解了「镜头跟随」这种影视语言。

这也说明 Vidu 延长功能不只生成画面,AI 还像一位专业的摄影师理解如何拍摄画面,这一点就非常夸张了...更夸张的是,它的延长功能,还给了你导演级别的剪辑权。它允许你把一段生成的视频,看作一条可以随意剪开的时间线。你可以从中间截取最精彩的几秒,从这里,让 AI 给你一个新的故事分支。

而且,这个功能还针对不同用户群体,设定阶梯式的视频时长上限:
① 免费用户最长可延长至30秒。
② 标准版用户上限为1分钟。
③ 专业版用户可延长至3分钟。
④ 而为深度创作者设计的旗舰版用户,则最高可享有5分钟的延长权限。
但真正的王牌,其实是这套组合拳:「参考生」+「视频延长」功能,前者保证主体像不像,后者决定视频够不够完整。未来,我们完全可以期待,通过不断地延长和组合,用 AI 生成一部拥有完整情节的动画片,甚至一部微电影。人人都是导演的可能性,被无限放大了...
全新升级的 Vidu App
聊完了技术,我们再来看看产品。这也是 Vidu 这次升级,最让我惊喜的地方。最近很多人都在聊 Sora 2 的App,说它是 AI 版的抖音。而拥有丰富国产元素的Vidu或许更值得期待。打开最新版Vidu AI App,你会立刻进入一个沉浸式的视频 Feed 流。对,就是我们最熟悉的那种上下刷的模式。

这个设计,彻底打通了内容生产、互动和内容分发三个环节。你在这里,可以边刷别人的作品寻找灵感,边进行自己的创作,然后一键发布,无缝衔接。看到好的作品,可以直接把它作为参考,进行二次创作,玩转与不同角色、场景的合拍,整个社区的创意就像滚雪球一样,越滚越大。创作、社交、分发,被完美地融合在了一起。

在规划上, Vidu 想得更深一层。它从一开始,瞄准的就是一个完整的 AI 原生内容生态。在这里,每个人既是创作者,也是消费者,更是传播者。
这种 AI 原生、生态先行的思路,才是它真正可怕的护城河。毫无疑问,Vidu Q2 的这次亮相,给整个 AI 视频行业,都带来了巨大的震撼。精准的「参考生」,强大的延长功能,以及一个完整的App生态,很清晰地指出了AI视频的下一个进化方向:真正好用、人人可用的生产力工具。
现在,这个能力已经向所有人开放。升级后的参考生功能,已经正式登陆 Vidu Q2 模型,网页端和全新升级的 App 均可使用,无需等待,即刻体验。地址在这:www.vidu.cn
还可以去各大应用平台下载Vidu AI APP,体验全新的AI内容社交方式。

Vidu提供的,不仅仅是领先的技术,更是让创意自由流动、碰撞、再生的全新内容生态。
将创造的权力,真正交还到大家手里。如果让你来当导演,你最想创作一个什么样的故事?
本文相关的视频内容,可以在 @优设AIGC 公众号观看:https://mp.weixin.qq.com/s/DzDbqQB6kujG1yt_6vRstg




发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们