2 月初 Sora 发布的文生视频 demo 炸裂,让更多人关注到AI视频生成这个领域。不过 OpenAI 公司的人事动荡频繁,其产品上线时间尚不确定。从年中可灵低调发布获国内外众多网友好评后,最近国内视频大模型也开始卷啦,9 月份相继更新的有可灵、Vidu、海螺、通义万相和字节的豆包,我们今天测评一下国内知名视频模型的图生视频功能。
话不多说开测吧,测评平台:可灵、海螺、vidu、通义万相、即梦。图片均在 Midjourney 里生成,视频生成时间 9.29。提示词是通义的增强提示词功能写的,个人感觉加的冗长的氛围词用处不大。想看结果,可拉到文末。
官网链接:
- 可灵:https://klingai.kuaishou.com/
- 海螺:https://hailuoai.com/video
- Vidu:https://www.vidu.studio/
- 通义万相:https://tongyi.aliyun.com/wanxiang/videoCreation
- 即梦:https://jimeng.jianying.com/
「两只世界上最小的老虎正在人的掌心里挠头、打闹、互相玩耍,表情非常可爱。」
说明:输入中文提示词,被通义系统提示无法提交,不太清楚犯规的点,可能是老虎打闹?不过换成英文后就可以提交。为了准确性所有平台都是用的英文提示词:Two of the world's smallest tigers scratching their heads in people's palms, fighting, playing with each other, very cute expressions
语义理解 90
语义理解 95 很生动活泼
语义理解 92 眼睛有点问题
语义理解 90 画面有点雾蒙蒙
语义理解 80,画面没怎么动,眼睛有点问题
「超现实的场景中,一个萌趣横生的太空小娃正悠然自得地在月球表面弹吉他,为这片宇宙增添了几分梦幻与诗意。」
语义理解 70 手没怎么动
语义理解 96
语义理解 96 鼻梁有点问题
语义理解 88 饱和度问题太影响画面质感了
语义理解 94
「奇幻城市废墟超现实场景,一只黑豹机器人站立起来,变身为人类,在残破的城市行走,充满了神秘与杀气」
理解力评判标准:1 站立、2 变身人类、3 行走 4 充满杀气
语义理解 70
语义理解 95,可惜图片有被裁切
语义理解 30
语义理解 65
即梦调整过几次提示词,还是生成不出来,只好放弃了
「人的掌心里小兔子拿着草莓在吃,生动活泼的场面,显得兔子十分可爱机灵。」
这句提示提比较简单,每个平台都能画出来,看来写提示词的时候应该注意,用简洁的语言表达,不要加冗长的废话。
「一位工程师和猪在对话,他温柔地抚摸着小猪的头部,眼神中流露出深深的怜爱和喜悦,仿佛在看待自己的孩子一般。这种亲密无间的交流,展现出人与动物之间的温情脉脉,整个场景充满了和谐与欢乐。」
Midjourney 生成出来的这个小怪物,我也不知道怎么形容,于是取了鼻子的型,称其为猪,不过这个称呼影响并不大,除了通义画了一只猪耳朵出来。
语义理解 85
语义理解 96
语义理解 96
语义理解 94
语义理解 90
「无垠的蓝天与悠闲的白云,气球漫天飞舞,一群骑手驾驭骏马驰骋过绿茵茵的草原,增添了动态与欢乐的气息,构成一幅生动的户外活动画卷。营造出一片自由自在的氛围」
评判标准:1 气球飞舞、2 骑马
这一组除了海螺效果好点,应该是提示词写得有问题,优化一下,应该还是可以得到想要的效果。
语义理解 85
语义理解 92
语义理解 90
语义理解 92
语义理解 85,气球飘动幅度不大,驰骋草原的动作没有体现
- 语义理解不相上下,即梦稍次
- 画面色彩通义灰蒙蒙的,太影响画面拉
国庆前夕,除了海螺 Minimax 视频模型,其他几个视频平台都评测过了。当时,可灵的表现非常出色,位居榜首。然而,就在两天前,海螺推出了图生视频功能,赶紧抽空测评了一下,结果让我感到有些惊讶。海螺在 8 月 31 日首次发布了视频功能,最初只有文生视频功能。至今不到一个半月的时间,海螺已经宣布即将开始收费,这表明他们对自家产品充满信心。虽然我的看法可能不那么重要,但我确实看好这个海螺 Minimax。
当然了这只是国内的情况,数一数二可能还得是 Runway 和 Luma/dream-machine,期待国货走向世界之巅~
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。
发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
用户体验设计核心问答
已累计诞生 628 位幸运星
发表评论 已发布6条
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓