超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

2026/06/03 推荐： AI设计师Lena阅读 1.4w 评论有奖阅读本文需 10 分钟

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

一、全文速览图

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

谷歌上线新模型 Gemini Omni，官方宣发 demo：

当视频在手机上无法加载，可前往PC查看。

网友测评视频：

当视频在手机上无法加载，可前往PC查看。

@JSFILMZ0412

当视频在手机上无法加载，可前往PC查看。

@techhalla

当视频在手机上无法加载，可前往PC查看。

@heygentlewhale

谷歌在 5 月 20 日的 I/O 开发者大会上正式发布全新视频模型 Gemini Omni，毫无疑问是本届大会最受瞩目的亮点。

支持图片、视频、声音、角色多模态输入，生成视频画质惊艳，细节逼真程度令人印象深刻。首发版本 Gemini Omni Flash 现已正式上线。我第一时间做了实测。

它到底怎么用？实际效果怎么样？和现在很强的 Seedance 2 比，到底谁更能打？一起来看这篇测评。

超全面！帮大家快速总结Google I/O 2026开发者大会

一、全文速览图刚刚，Google开完了他们的产品发布会。

阅读文章 >

二、怎么用？

现在体验 Gemini Omni，大致有两个入口：

Flow（专业创作工具）：labs.google/fx/zh/tools/flow

1. 生成视频

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

多模态输入，支持图片、视频、语音和角色

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

尺寸、数量、模型、时长的选择

2. 创建角色：

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

点击第二张 banner，创建角色进入。

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

新角色这里点+号，添加角色。

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

使用时候在角色里选择就可以。

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

这里有角色提示词灵感，不知道怎么写，可以随机点一个试一下，提示词自动填入后，自行选择香蕉 Pro 或者 2，点提交。

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

人物角色生成好后，可以设定音色，音色有系统设定的，也可以自己描述

Gemini：gemini.google.com

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

值得一提的是，Gemini App 还有一个 Avatar 功能，受地区限制，国内大部分用户在使用 Gemini App 的时候，这个功能可能会被隐藏，所以很多人根本看不到，也没法正常体验。这个功能本身不算稀奇。

超多案例实测！谷歌全新AI视频模型Gemini Omni到底有多强？

产品逻辑跟国内豆包、即梦一样的，先录制一段视频根据提示念文字，就有了自己的分身，效果也没有明显差别。两者效果相当，甚至在一些场景里，Seedance 的效果还会更稳。

三、专业场景实测：物理与生物名词解析动画

基础的“天气变化”“背景替换”这类效果。太简单了，不用想也知道它能做得不错。我想试试 ta 能不能理解复杂专业场景？比如物理运动、生物过程、医学名词、连续动作等。

1. 物理类

牛顿摆：运动轨迹准确，物理还原度高 ✅

球体之间的碰撞、摆动节奏、能量传递关系，都还比较符合逻辑。

高空落体（玻璃弹珠、鸡蛋、装水气球）：整体表现良好，物理细节基本合理 ✅

大部分效果都还可以，尤其是玻璃弹珠、鸡蛋、装水气球这类材质差异比较明显的物体，表现相对准确。但乒乓球明显翻车。它落到玻璃面上的时候，接触面往里凹了，这个不太合理。乒乓球应该是轻质弹性球体，和玻璃面碰撞时的反馈不应该是这种表现。这说明 Gemini Omni 对物理的理解还不是完全可靠。

小人连续动作打斗：流畅度和连贯性比较出色 ✅

动作衔接、镜头节奏、人物互动比较自然。

2. 生物 / 医学类

人类妊娠过程：画面清晰，专业术语对应的动态演示准确 ✅
心动周期：节律感强，生物逻辑无明显错误 ✅

这部分效果比较稳定。它对流程、结构、节奏的理解比较清晰。
如果是用来做医学科普、生物教学、知识解释类动画，个人觉得 Gemini Omni 的潜力非常大。

3. 视觉设计类

文字特效：效果接近专业设计软件的输出水准 ✅

很多视频模型中文文字是个问题，要么乱码，要么变形，可识别度不高。但 Gemini Omni 的文字效果明显成熟很多。它生成出来的文字更像真的在设计软件里排出来的，字体保持一致，但是！！参考图片里包含文字的，不写提示词约束时，效果出来还是很糊。

风格转绘：轻松驾驭，效果自然 ✅

风格转绘就更不用说了。不管是把画面转成某种插画风、粘土风、像素风、剪纸风、乐高风格等，还是让角色保持一致性去做动作变化，它都可以做到从从容容、游刃有余。

换衣服等基础任务：上传的视频里含有单独的人物素材，人物动态或者场景是完全没有问题，甚至还能在以前的画面基础上优化，让画面质感变得更好，不过人物一致性还达不到 100%

实测视频：

当视频在手机上无法加载，可前往PC查看。

四、Gemini Omni vs Seedance 2 谁更强？

当视频在手机上无法加载，可前往PC查看。

和目前视频生成领域的强劲对手 Seedance 2 正面比较下来，我的感受大概是这样：

1. 动作 / 打斗 / 人物运动场景

这块 Seedance 2 依然遥遥领先，差距比较明显。

尤其是人物跑动、打斗、复杂镜头调度、多人互动这些高难度内容，Seedance 2 的稳定性明显更强。整个运动过程更连贯，抽卡率也更低。

2. 物理 / 生物 / 专业概念动画解析

这类内容我反而更看好 Gemini Omni。

比如物理原理、生物医学、专业名词解释、结构拆解类动画，Omni 的画面更干净，构图也更高级。它不一定追求很炸的运动效果，但在“把复杂概念讲清楚”这件事上，表现确实更舒服。

3. 宣传片 / 公益短片类视频

比如“吸烟有害健康”这类公益短片，我个人会更喜欢 Omni 的叙事逻辑。

它的表达会稍微收一点，不那么外放，画面和情绪推进也更克制。Seedance 2 的叙事风格更直白、更强刺激，简单粗暴一点：一个健康的人，下一秒就变成快要“嘎了”的 js 脸，主打一个“就问你怕不怕”。

这不是说谁绝对更好，而是考虑客户老板的意见、品牌调性等多方综合因素。有些项目就是要强冲击、强警示，那 Seedance 2 可能更合适；但如果想要更高级、更克制、更像品牌片的表达，我个人会更倾向 Gemini Omni。

Seedance 2 依然是动态连贯性、人物动作、打斗等场景里的标杆。

但如果项目本身不追求人物大幅运动，而是更重视专业概念的准确表达、画面质感、构图审美和出片效率，那我可能会选择 Gemini Omni。它在 Flow 里出片太快了，基本秒出。

对实际工作来说，快就是很大的生产力。不是所有视频都需要炸，有些视频更需要干净、准确、质感好、能快速交付。

五、官方介绍

网址：https://www.youtube.com/watch?v=uW4B6ziQqvY

完整视频：

当视频在手机上无法加载，可前往PC查看。

现阶段很多人都认为，AI 视频生成里 Seedance 2 依然是行业天花板之一。尤其是人物运动、打斗场景、复杂镜头调度这类内容，它的稳定性确实已经把"抽卡率"大幅压了下来。这一点不是吹，基本也是圈内共识。

这次实测下来，Omni 在科普视频、物理原理动画、生物医学可视化、人像质感、公益宣传片等场景表现更为突出。这类内容不需要特别"炸"的动作，更考验模型对信息的理解能力，以及将信息转化为动态画面的视觉表现力和准确性。就这一点而言，我个人会更倾向 Gemini Omni，画面更干净，整体质感也略胜一筹，特别适合做偏知识表达、品牌感、公益感、专业感的视频内容。

当然，Omni 并非完美答案。人物运动依然不够稳定，物理细节偶尔失真；Avatar 数字分身在逻辑上与豆包即梦、早期 Sora 相差不大；这个功能国内用户也无法完整体验。另外补充一点：我对比所用的是豆包里的 Seedance 2，不同入口和版本的效果可能存在差异，仅供参考。

Seedance 2 目前依然是最稳的 AI 视频生成工具之一，但 Gemini Omni 让我们看到了另一条路线，它不是单纯把视频做得更"炸"，而是把复杂信息理解得更准、画面表达得更干净。这让 AI 视频生成的边界，因此又往前推了一点。