告别抽卡!Vidu Q2多图参考生视频功能重磅上线

昨天,Vidu Q2 的多图参考生视频上线了。

测了几个小时以后,先说结论,确实是多图参考生视频的王。

更多AI视频测评:

也是一种,做 AI 视频工作流的,新范式。

我花了一个下午的时间做了一个小短片,完全用的多图参考生视频,没有用传统的生图-图生视频的工作流,基本上没 roll 多少次,就实现了这样的效果。

当视频在手机上无法加载,可前往PC查看。

很酷,很有意思。

说实话,自从 Veo3、可灵 2.5、Sora2 以后,我自己,越来越不喜欢用图生视频了。

最开始的时候,23 年,我那个预告片总共肝了 693 张图片,185 个镜头,最终选出来 60 个镜头。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

那个时候,其实是没办法的办法,先生图,再用图生视频的方式,对于流程还是挺蛋疼的,需要你强行来回跳转不同的产品。

而且图片本身,很多时候是个静帧,会影响很多动态的发挥,如果不是为了一致性,很多时候,我真的喜欢用文生视频去做。

后来,去年 11 月,Vidu 第一次上线了多图参考生视频,可以用几张图,就能保持人物、物品、场景一致性,开启了多参党的时代。

那个时候,我也写过 Vidu。

体验完 Vidu 划时代的新功能,我觉得可以正式抛弃 3D 渲染了。

比如当时,随手拍了我非常喜欢的 Dimoo,之前的熊猫款的三视图。然后扔到 Vidu 里。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

然后不到 1 分钟,一段 Dimoo 在森林里的视频就做完了。

不过这个效果,其实已经是 Vidu 去年基模还是 1.5 的时候的效果了,对甚至连 Q 这个开头前缀都没有。

而现在,在经历了 Vidu 1.5、Vidu 2.0、Vidu Q1 之后,新的 Vidu Q2,确实给多图参考,带来了一些以前达到不了的效果。

而图生视频这个工作流,就好像曾经的 SD 一样,可能确实会越来越被我,封印在历史的尘埃里了。

今天,我是一个光荣的多参党。

我觉得这次的 Q2 和多参升级,可以体现在 3 个方面:

大幅进化的一致性,更强的表演能力,以及更棒的多风格表现力。

一个一个来说。

一、一致性

参考生视频的,我们很多时候最看重的,就是一致性,

三个月前,Vidu Q1 的多参生图其实已经很强了,但是遇到超多主体的情况还是会歇菜。

而这次,Q2 更新以后,就牛逼了很多。

比如,让文艺复兴的新三杰和旧三杰同框出现。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

这是 Q2 的效果,镜头依次出现六个画家,每个人的特征都基本保留,实现了这个挑战。

而如果你返回去,看 Q1 的话,会发现还是会失败的。

比如会出现人物不全,或者人物突然从地里钻出来的情况。

用多图参考生视频也特别简单,就是把你的图片都传上去之后,直接按@键,@任何人和任何物品,超级简单,比 Sora2 的那个@还要丝滑,因为 Sora2 只能@人物,但是没法@物品或者场景。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

这是 6 个人的,再来看一下主体+物品的 case。

比如让范德彪穿着草裙在沙滩上晒太阳。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

然后就得到了一个晒到七成熟的德彪。

再让川普先从冰箱里拿出来一罐百事可乐,再拿出来一瓶可口可乐。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

生成出来的结果,川普、百事可乐和可口可乐,都保持了原状。

特别是百事上的字,也保持的非常好。

还有一个,我觉得很有趣的 case,也是一个之前没玩过的玩法,就是你可以通过多主体,让主人公实现变身。

提示词是这样的:

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

最惊喜的是,镜子里和镜子外的变化非常同步,这个是真的是有点东西的。

还有一个玩法,就是人物不变,场景变化。

提示词也非常简单:

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

在一致性上,表现的非常完美。

二、情绪表演

表演这一块,也是 Q2 的重头戏。

拿我喜欢的演员基里安墨菲来举例,我从他演过的英剧《浴血黑帮》里找了几张图,做了一个叫 Tommy 的主体。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

这个主体其实也是多图的的升级功能。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

就是比如一个角色,我们为了它更稳定,就可能要传三张不同角度的图上去,而传统的做法,就是写男人靠在 XX 地方,让 AI 视频自己去脑补,哦这三张图片是这个男人啊。后续的复用上,也不好管理。

现在,你可以用主体的方式,命名,然后,直接@它就完事了,还能保存成主体库,后续随便用,很方便。

这些小细节,Vidu 做的确实是蛮好的。

我们在看看上面那个 Prompt 和主体跑出来的效果。

瞬间,得到了这个非常细腻的表演。

基里安的眼睛是真的有戏啊,把脆弱感展现的淋漓尽致。

相比之下 Q1 的演技就完全没开窍,就是眼睛转了几下,你也看不出到底要表达什么情绪。

末了嘴里还变出一根烟。。。

你也不知道它到底在干啥。

再来看一有趣的 case。

就是你只是给它一个规定情境,没有很详细的提示词,Vidu Q2 也能完成一段很优质的表演。

比如下面这个。

提示词真的非常简单,就是一个情境,用的主体是德尼罗老爷子。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

出来的效果,就很有故事感,除了白发人送黑发人的悲伤和无奈,年长者努力控制情绪的克制,还能看出丝丝的不甘和恨意,似乎想给孩子复仇,很好品。

而如果说,Vidu Q2 的真人表演已经很不错了,那么二次元领域的表演更是 Vidu 的拿手好戏。

毕竟,动漫,很多时候,都是 Vidu 的代名词之一。

先来一个经典的日剧跑段落。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

出来的效果真的很有那味儿,可以直接配一首《你的名字》了。

让我想起那年夕阳下的奔跑,那是我逝去的青春。。。

除了这种大开大合的表演情绪,做小表情也很有活人感。

比如下面这个情侣吵架的 case。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

表情和动作都很自然,真的有点像某一部番的片段了。

在测试情绪的过程中,我还发现,Vidu 非常懂动漫中常见的情绪表现手法。

比如下面这个 case,它会通过眉眼边上的线条抽动、瞳孔骤然缩小、眼白布满红血丝,来展现一个人极致恐惧的情绪。

但说实话,大部分情况下我都不会给这么细的提示词。

我在这一段,只规定了三个点,男人极度惊恐的表情,半明半暗的光影,和推镜头的运动。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

而 Q2 能凭借自身的技法积累,在我的提示词框架里面完善细节,最后得到一个,有表现力的效果。

我只能说,他们动漫的效果,是真的强啊。

再比如下面的这个 case。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

提示词非常简单,但 Vidu 就能做的很对味儿。

仔细一看,秘诀原来是,Vidu 把女孩眼睛里面的高光给去掉了。。。

有高光,看起来就比较清澈,没有高光,就很阴。

真的非常细节。。。

三、多风格表现力

刚才那一趴大家也看到了,Vidu Q2 做出来的动漫视频效果很出挑。

所以这一趴,我做了更多不同动画风格的 case,让大家感受一下,Vidu 的动画风格表现力。

真的,Vidu 无愧于 AI 视频动漫之王的称号。

后面这些,我就不放截图了,但是和生成方法和前面还是一样的。都是贴上参考图,或者贴上主体,然后写提示词,生成视频。

先从最日常的泡面番风格开始。

热血战斗番,亦正亦邪的反派既视感,一时间幻视了不少角色。

还有追求音乐梦想的美少女,在空荡的礼堂里独自练习。

超典型 360 度环绕运镜。

或者更加风格化一点,比如下面这些。

不要忘了,这些都是用 Vidu Q2 的多参考生视频生出来的。

所以,不仅有超棒的角色一致性,还有特别棒的风格一致性。

还有一个更酷的,就是我测下来发现,Q2 真的很适合生成一些中二动漫场面,因为它的运镜和特效,给的真的太足了。

比如下面这个男人舞剑的 case。

镜头拉近拉远再拉近,还有挥剑形成的狂风,效果直接拉满了。

再比如这个打斗。

刀光剑影,飞檐走壁,人物和镜头的运动都很丰富,也只抽了两次卡。

写在最后

Vidu Q2 这次的参考生视频,确实要比之前的质量好太多了。

超多主体同框一致性的稳定,以及 Q2 基模所带来的效果提升。

再加上参考生视频能带来更牛逼的运镜和自然的表演。

确实,是多参党的胜利,也是新的工作流范式,进化的前夜。

最后,再来说说大家最关心的价格问题。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

以标准版月度会员为例,59 元 800 积分,20 积分就能生成一条 8s 视频,折合下来 1.475 元/条,约 0.184 元/s。

几乎就是现在最便宜的 AI 视频模型之一了。

整体来说,这次 Vidu Q2 的多参还是让我很惊喜的。

而且他们也上了 APP,跟 Sora2 那样的交互,也能玩合拍,不过是用多参做的,也挺有意思的,感兴趣的可以去玩玩。

告别抽卡!Vidu Q2多图参考生视频功能重磅上线

我也还是很相信,多图参考生视频,是未来的共识。

Vidu,未来可期。

收藏 10
点赞 29

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。