超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

一、全文速览图

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

谷歌上线新模型 Gemini Omni,官方宣发 demo:

当视频在手机上无法加载,可前往PC查看。

当视频在手机上无法加载,可前往PC查看。

网友测评视频

当视频在手机上无法加载,可前往PC查看。

@JSFILMZ0412

当视频在手机上无法加载,可前往PC查看。

@techhalla

当视频在手机上无法加载,可前往PC查看。

@heygentlewhale

谷歌在 5 月 20 日的 I/O 开发者大会上正式发布全新视频模型 Gemini Omni,毫无疑问是本届大会最受瞩目的亮点。

支持图片、视频、声音、角色多模态输入,生成视频画质惊艳,细节逼真程度令人印象深刻。首发版本 Gemini Omni Flash 现已正式上线。我第一时间做了实测。

它到底怎么用?实际效果怎么样?和现在很强的 Seedance 2 比,到底谁更能打?一起来看这篇测评。

二、怎么用?

现在体验 Gemini Omni,大致有两个入口:

Flow(专业创作工具):labs.google/fx/zh/tools/flow

1. 生成视频

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

多模态输入,支持图片、视频、语音和角色

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

尺寸、数量、模型、时长的选择

2. 创建角色:

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

点击第二张 banner,创建角色进入。

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

新角色这里点+号,添加角色。

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

使用时候在角色里选择就可以。

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

这里有角色提示词灵感,不知道怎么写,可以随机点一个试一下,提示词自动填入后,自行选择香蕉 Pro 或者 2,点提交。

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

人物角色生成好后,可以设定音色,音色有系统设定的,也可以自己描述

Gemini:gemini.google.com

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

值得一提的是,Gemini App 还有一个 Avatar 功能,受地区限制,国内大部分用户在使用 Gemini App 的时候,这个功能可能会被隐藏,所以很多人根本看不到,也没法正常体验。这个功能本身不算稀奇。

超多案例实测!谷歌全新AI视频模型Gemini Omni到底有多强?

产品逻辑跟国内豆包、即梦一样的,先录制一段视频根据提示念文字,就有了自己的分身,效果也没有明显差别。两者效果相当,甚至在一些场景里,Seedance 的效果还会更稳。

三、专业场景实测:物理与生物名词解析动画

基础的“天气变化”“背景替换”这类效果。太简单了,不用想也知道它能做得不错。我想试试 ta 能不能理解复杂专业场景?比如物理运动、生物过程、医学名词、连续动作等。

1. 物理类

牛顿摆:运动轨迹准确,物理还原度高 ✅

球体之间的碰撞、摆动节奏、能量传递关系,都还比较符合逻辑。

高空落体(玻璃弹珠、鸡蛋、装水气球):整体表现良好,物理细节基本合理 ✅

大部分效果都还可以,尤其是玻璃弹珠、鸡蛋、装水气球这类材质差异比较明显的物体,表现相对准确。但乒乓球明显翻车。它落到玻璃面上的时候,接触面往里凹了,这个不太合理。乒乓球应该是轻质弹性球体,和玻璃面碰撞时的反馈不应该是这种表现。这说明 Gemini Omni 对物理的理解还不是完全可靠。

小人连续动作打斗:流畅度和连贯性比较出色 ✅

动作衔接、镜头节奏、人物互动比较自然。

2. 生物 / 医学类

  1. 人类妊娠过程:画面清晰,专业术语对应的动态演示准确 ✅
  2. 心动周期:节律感强,生物逻辑无明显错误 ✅

这部分效果比较稳定。它对流程、结构、节奏的理解比较清晰。
如果是用来做医学科普、生物教学、知识解释类动画,个人觉得 Gemini Omni 的潜力非常大。

3. 视觉设计类

文字特效:效果接近专业设计软件的输出水准 ✅

很多视频模型中文文字是个问题,要么乱码,要么变形,可识别度不高。但 Gemini Omni 的文字效果明显成熟很多。它生成出来的文字更像真的在设计软件里排出来的,字体保持一致,但是!!参考图片里包含文字的,不写提示词约束时,效果出来还是很糊。

风格转绘:轻松驾驭,效果自然 ✅

风格转绘就更不用说了。不管是把画面转成某种插画风、粘土风、像素风、剪纸风、乐高风格等,还是让角色保持一致性去做动作变化,它都可以做到从从容容、游刃有余。

换衣服等基础任务:上传的视频里含有单独的人物素材,人物动态或者场景是完全没有问题,甚至还能在以前的画面基础上优化,让画面质感变得更好,不过人物一致性还达不到 100%

实测视频:

当视频在手机上无法加载,可前往PC查看。

四、Gemini Omni vs Seedance 2 谁更强?

和目前视频生成领域的强劲对手 Seedance 2 正面比较下来,我的感受大概是这样:

1. 动作 / 打斗 / 人物运动场景

这块 Seedance 2 依然遥遥领先,差距比较明显。

尤其是人物跑动、打斗、复杂镜头调度、多人互动这些高难度内容,Seedance 2 的稳定性明显更强。整个运动过程更连贯,抽卡率也更低。

2. 物理 / 生物 / 专业概念动画解析

这类内容我反而更看好 Gemini Omni。

比如物理原理、生物医学、专业名词解释、结构拆解类动画,Omni 的画面更干净,构图也更高级。它不一定追求很炸的运动效果,但在“把复杂概念讲清楚”这件事上,表现确实更舒服。

3. 宣传片 / 公益短片类视频

比如“吸烟有害健康”这类公益短片,我个人会更喜欢 Omni 的叙事逻辑。

它的表达会稍微收一点,不那么外放,画面和情绪推进也更克制。Seedance 2 的叙事风格更直白、更强刺激,简单粗暴一点:一个健康的人,下一秒就变成快要“嘎了”的 js 脸,主打一个“就问你怕不怕”。

这不是说谁绝对更好,而是考虑客户老板的意见、品牌调性等多方综合因素。有些项目就是要强冲击、强警示,那 Seedance 2 可能更合适;但如果想要更高级、更克制、更像品牌片的表达,我个人会更倾向 Gemini Omni。

Seedance 2 依然是动态连贯性、人物动作、打斗等场景里的标杆。

但如果项目本身不追求人物大幅运动,而是更重视专业概念的准确表达、画面质感、构图审美和出片效率,那我可能会选择 Gemini Omni。它在 Flow 里出片太快了,基本秒出。

对实际工作来说,快就是很大的生产力。不是所有视频都需要炸,有些视频更需要干净、准确、质感好、能快速交付。

五、官方介绍

网址:https://www.youtube.com/watch?v=uW4B6ziQqvY

完整视频内容点击链接查看: http://xhslink.com/o/9B4uR2CdDJ

现阶段很多人都认为,AI 视频生成里 Seedance 2 依然是行业天花板之一。尤其是人物运动、打斗场景、复杂镜头调度这类内容,它的稳定性确实已经把"抽卡率"大幅压了下来。这一点不是吹,基本也是圈内共识。

这次实测下来,Omni 在科普视频、物理原理动画、生物医学可视化、人像质感、公益宣传片等场景表现更为突出。这类内容不需要特别"炸"的动作,更考验模型对信息的理解能力,以及将信息转化为动态画面的视觉表现力和准确性。就这一点而言,我个人会更倾向 Gemini Omni,画面更干净,整体质感也略胜一筹,特别适合做偏知识表达、品牌感、公益感、专业感的视频内容。

当然,Omni 并非完美答案。人物运动依然不够稳定,物理细节偶尔失真;Avatar 数字分身在逻辑上与豆包即梦、早期 Sora 相差不大;这个功能国内用户也无法完整体验。另外补充一点:我对比所用的是豆包里的 Seedance 2,不同入口和版本的效果可能存在差异,仅供参考。

Seedance 2 目前依然是最稳的 AI 视频生成工具之一,但 Gemini Omni 让我们看到了另一条路线,它不是单纯把视频做得更"炸",而是把复杂信息理解得更准、画面表达得更干净。这让 AI 视频生成的边界,因此又往前推了一点。

收藏 2
点赞 32

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。