
前几天 Nano Banana Pro 玩疯了吧,有没有想过什么时候视频模型也能有类似的能力。
现在,他来了。可灵发布了 O1,一个大一统的视频、图像生成和编辑工具,支持在一个界面和流程中完成你需要的全部视频图片编辑和生成工作。
更多测评:
总结一下这次更新内容:
- 统一多模态视频大模型,把参考生视频、文生视频、首尾帧、内容增删与风格重绘等任务融合,一站式完成从生成到修改。
- 支持图片、视频、主体与文字的多模态输入,直接用自然语言进行精细编辑,无需遮罩或关键帧。
- 通过多视角主体与参考素材,保持角色、道具、场景的特征稳定与镜头间一致性,确保连贯画面。
- 自由组合参考与指令,覆盖运镜、动作、镜头延展等复杂玩法。
- 可生成约 3–10 秒的自由叙事镜头,灵活控制节奏与镜头长度。
老规矩,先来看一个藏师傅关于这次相对重要的视频编辑能力和多图参考能力的演示视频:
然后我会对这次新增的一些能力进行测试,同时大概教大家一下这个模式应该如何使用。
进到可灵页面,你就会注意到左侧新增了一个非常显眼的图标,用了这个后面那几个界面你基本就用不着了。

进来以后就会发现下方的提示词输入框位置集成了非常多的选项,下方用来切换视频和图片生成的基础操作,比如时间比例等,上方的几个胶囊按钮主要用来控制输入内容的类型。
比如图片主体参考这里他就会出现、视频、图片、主体三个输入项,当然你可以删除图片或者主体,只用文本操作。
然后首尾帧这个输入项就会变成首帧和尾帧,这个我们就熟悉了,不过提示词也需要对首尾帧进行标注。

我们先来看一下最基本的通过文本进行视频编辑,你只需要上传需要编辑的视频,然后在提示词输入框输入提示词的时候在指代素材那里@ 对应的素材就行。

然后你就看到你的视频已经被修改了,比如这里我说的是穿上黑色风衣和戴上墨镜,可以看到服饰的质感还是非常不错的,跟周围环境融合得也很好,窗台的阳光照在衣服上的高光也有。
可以看到嘴型和运动都可以迁移,所以你可以将 O1 当做数字人模型使用。
文本的修改搞完之后就是,图片参考了,如果你不知道想要修改的环境或者角色具体怎么描述的话,当然可以上传图片让他参考,支持单图也支持多图。
在提示词书写的时候需要注意,你是需要直接修改背景还是需要一个过渡,这两个是不同的。
另外尽量详细描写背景的图片运动方式或者一些前景会让整个画面显得更加真实,比如我这里让他在角色前面增加了藤蔓。

可以看到为了配合这种遗迹环境的结果,他还帮我把面部和身体的亮度变暗了,后面的角色也在运动都没啥问题。
关于图像参考这里有个技巧,你可以第一次通过一张图片对视频进行修改后,再次将修改后的图片让他修改,这样可以最大程度确保对于视频编辑的控制力度。
第一次修改抽卡直到有符合你要求的内容之后再进行第二次修改。

比如我上面这里,显示让他在我桌面上增加了最近比较火的疯狂动物城的朱迪,然后在用刚才生成的视频让他向视频中增加可灵 O1 的文字。
然后你可能一直好奇上面素材部分的主体是什么东西,这是这次 O1 新增的一个元素,简单来说就可以理解为你创建的角色,常用角色创建后可以直接选择,不需要频繁上传了。

点击添加主体的图标之后右侧就会出现主体的选择弹窗,官方内置了很多常见的主体类似可以让你选择。

你也可以点击左侧“我的主体”去创建主体,创建的时候我们就理解为什么都是图片主体要单独列出来了。因为它可以上传多个不同角度的图片,更大程度的提高角色、道具、场景在视频生成中的一致性。

而且你还可以将多个主体叠加,如果你是要创作专业内容的话,我建议还是多创建角色和场景的主体,一致性表现确实比单张图片要更好。
比如我这里选择了将我自己改为林黛玉这个主体,同时还加上了天使之翼这个道具,这两个完全不搭嘎,再加上我的室内环境同时包含了前景和背景,非常复杂了可以说。
但是视频的融合度非常好,翅膀也会跟这个我的身体运动,光照的部分也没啥大问题,真实感很高。

主体这玩意对于电商来说绝对是非常大的利好,再也不用担心视频一运镜商品就跟原来的不像了,现在上传四张图片创建一个主体,随便怎么转都行。

可以看到我这里用我自己用的鼠标创建了一个主体,让他进行一个非常大的环绕运镜。
产品展示的非常稳定,甚至鼠标上的划痕和使用痕迹都没啥变化,这个一致性保持的太强了。
提到了单纯的主体生成视频了,顺便提一下,可灵 O1 在生成视频的时候支持自由选择 10 秒内的单条视频生成时长了,而且会按时长扣除灵感值。
这个对于做视频 Agent 产品以及一些轻度展示场景绝对是重大利好,相当省钱。

当然,O1 也可以直接转变视频的风格,我试了一下毛毡风格、动漫风格、8-bit 像素风格都没啥问题,你直接跟他说将 XXX 视频转换为 XXX 视频风格就行。
以前那些做起来成本很高非常复杂的风格转换特效,现在非常简单的一句提示词就可以了。
O 1 依然是支持首尾帧生成视频的,你可以点击输入框上方“首尾帧”来获取素材上传 UI,而且视频编辑加上首尾帧能做出非常离谱的特效效果。
比如我上面演示视频的最后一段就是先通过图像参考的视频编辑将手里的鼠标换成了代码组成的龙,然后再将视频最后一帧和代码龙的图片做了首尾帧视频生成,搞定了一个非常大场景的转换。

可以看到过渡非常自然,如果好好发掘一下的话估计可以搞定不少非常炫酷的特效类型。
说完了视频我们来看一下 O1 图片。
输入框左下角切换为图片就可以使用,支持上传多张图片以及加入对应的主体,和对图片进行编辑。
先来一个多图参考,搞一下最近很火的跟朱迪合影,这个其实相对复杂点,涉及到场景一致性、而且人物和动画角色风格不太一样。
抽了两次卡,没想到搞的还不错,场景人物和朱迪都保持的不错,而且兔子的原图表情还比较夸张,他也修正了。
@图片1 的角色和 @图片2 的角色在 @图片3 的场景亲昵的合影

当然图片也支持跟主体混合进行修改,同样可以增强一致性,我这里将我自己换上了民国服饰主体,场景换到了办公室这个主体,也还行。

好了这就是今天测评加 O1 简单教学的所有内容了。
视频领域,正在复刻图片领域的发展路径,更好的推理能力&世界知识,更强大的编辑能力,可灵视频 O1 模型刚问世,效果已经相当可以了。
回想一下今年三四月的图像编辑模型质量,再看最近短短半年的发展成果,只要起步了进展就会很快了。
如果你觉得今天的内容对你有帮助的话,可以帮我点个赞或者收藏,也可以将这个内容推荐给你觉得需要的朋友们。
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。




发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
DeepSeek实用操作手册
已累计诞生 769 位幸运星
发表评论
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓