Sora2公布提示词指南!直接抄作业能玩一整天!

最近你要问我什么最火,我可能会毫不犹豫地告诉你:Sora 2。

这玩意以一种不讲武德的姿态,短短7天狂飙62.7万下载量,把前辈GPT都拍在了沙滩上,直接登顶了App Store的榜首。

Sora2公布提示词指南!直接抄作业能玩一整天!

连奥特曼都亲自下场盖章,说这是创意领域的GPT 3.5时刻。

不过假期的时间那么宝贵,肯定有很多朋友还没详细了解Sora 2有多强。

Sora2公布提示词指南!直接抄作业能玩一整天!

官方也终于出了一版超详细的Sora 2提示词指南,一出现就传疯了。

今天我就带大家回顾这些天可能错过的重要信息,再总结提炼一下这份抄作业指南,用大白话分享给你。

更多AI视频模型:

一、懂物理了!

还记得 Sora 1刚出来那会儿吗?大家更多是图个新鲜,哇,AI也能做视频了!

酷是挺酷的,但后来回看,那股子AI味实在是太冲了。

但Sora 2,我必须说,它完全是另一个次元的产物。

看到奥特曼和网友们晒出的那些视频时,我惊了。

Sora2公布提示词指南!直接抄作业能玩一整天!

人物自然的重心转移,衣料迎风摆动的褶皱,甚至连光线的反射,都真实得不像话。

Sora2公布提示词指南!直接抄作业能玩一整天!

物理规律没有穿帮,声音和画面原生同步,多镜头的叙事也没了之前生硬的割裂感

Sora2公布提示词指南!直接抄作业能玩一整天!

我感觉我不是在看AI生成的东西,像在看一部经过专业摄影指导精心编排过的短片。

Sora2公布提示词指南!直接抄作业能玩一整天!

OpenAI在声明里,给Sora 2的定位是“最先进的视频和音频生成模型”。

Sora2公布提示词指南!直接抄作业能玩一整天!

我觉得他们这次算是谦虚了。

网友们也用Sora 2 App上的奥特曼形象做了各种玩梗视频。

Sora2公布提示词指南!直接抄作业能玩一整天!

Sora2公布提示词指南!直接抄作业能玩一整天!

Sora2公布提示词指南!直接抄作业能玩一整天!

Sora2公布提示词指南!直接抄作业能玩一整天!

搞得现在大家看到奥特曼真人上播客都有点不习惯了...

还可以生成视频让奥特曼夸夸自己,比如这样:

甚至还有人直接拼接生成了整部短剧。

在我看来,Sora 2最牛的突破,就是对物理世界的精确模拟,似乎真的开始逐渐理解这个真实的世界。

二、提示词秘籍

好了,终于到了核心环节。怎么才能让 Sora 2 听懂你的话,生成想要的神级视频?

答案全在他们这份提示词指南里,我给大家提炼其中适合新手的部分,保证让你少走弯路,直接上手,体验一把当AI导演的快乐!

Sora2公布提示词指南!直接抄作业能玩一整天!

写提示词这事儿,文档里给了个特别形象的比喻:就当是在跟一位从未见过你故事板的电影摄影师沟通。

把细节说得越清楚,Sora 2拍出来的就越接近你想要的。

但反过来,如果故意留些空白,这位摄影师就会即兴发挥,可能会带来意想不到的惊喜。

想精准复刻脑中画面,那就把提示词写得详细再详细。

想来点创意碰撞,那就写得简单点,给模型留出创作空间。

1. 先定好框架:写在提示词之外的硬规矩

有些基础设定,光在提示词里喊是没用的,比如“把视频弄长一点!”。

这些必须在API参数里明确设置好,它们构成了视频的“容器”。

  1. 模型 (model):sora-2 或 sora-2-pro
  2. 尺寸 (size):比如 1280x720 (横屏), 720x1280 (竖屏)。Pro版支持的分辨率更高。分辨率越高,细节和动态一致性越好。
  3. 时长 (seconds):目前支持4、8、12秒。这里有个小技巧:生成两个4秒的短片再剪辑到一起,效果通常比直接生成一个8秒的长镜头要稳定得多。

把这些框架定好,剩下的内容,就全靠提示词来填充了。

2. 提示词的骨架。

对于新手或者想要快速出片的朋友,一个简洁的提示词就足够了。

比如文档中的这个例子:
In a 90s documentary-style interview, an old Swedish man sits in a study and says, "I still remember when I was young."

(在一次90年代纪录片风格的采访中,一位瑞典老人坐在书房里说道:“我还记得我年轻的时候。”)

这个提示词写得非常聪明:

90s documentary 直接定下了视频的整体风格(影调、镜头感、灯光)。
an old Swedish man sits in a study 描述了主体和场景,但留下了大量细节(长相、年龄、书房样式)让Sora去自由发挥。

and says, "..." 清晰地给出了对话内容。

用这种方法,能稳定地得到符合要求的视频。

虽然可能不完全是想象中的样子(比如没说天气、穿着、机位),但Sora会用它的审美帮我们补全。

如果想追求电影级别的质感,或者需要在多个镜头间保持风格统一,那就可以试试下面这种导演式的写法。就像在给摄影组或特效团队开会,用的是行业术语。

这里直接上一个天花板级别的例子,大家感受一下:

  1. 格式与画面风格:时长4秒;180度快门;模拟65毫米胶片对比度;细腻颗粒感…
  2. 镜头与滤镜:32毫米/50毫米球面定焦;1/4黑柔滤镜…
  3. 调色/色调:高光是干净的晨光带琥珀色;中间调均衡,阴影带青色…
  4. 灯光与氛围:左侧低角度自然光(早上7:30);轨道旁有银色反光板补光…
  5. 地点与构图:黎明时分的通勤站台;前景是黄色安全线和咖啡杯…
  6. 声音 (Sound):仅画内音,微弱的铁轨摩擦声、刹车嘶嘶声、远处模糊的广播…
    (由于原文过长,这里仅展示结构,具体细节大家可以参考指南文档)

这种写法把每一个环节都拆解了,从光圈快门到滤镜型号,再到补光方式和声音的响度。

Sora拿到这样的剧本,想拍砸都难。

虽然我们普通玩家不一定需要这么复杂,但这个思路非常值得借鉴,把需求拆解得越细,Sora就越懂你。

一个好的提示词,应该像画分镜脚本一样清晰。

3. 想让画面更出彩?记住这几个黄金法则。

不管是简单还是复杂的提示词,还有几个点是共通的,掌握了它们,你的视频质感就能再上一个台阶。

风格先行:先用一句话定下基调。是“1970年代的电影感”,还是“史诗级IMAX航拍”,或是“16毫米黑白纪录片”?先把这个框架搭好,Sora才能在正确的轨道上填充细节。

  1. 描述要具体:别说“一条美丽的街道”,要说“湿漉漉的沥青路面、斑马线、霓虹灯的倒影”。别说“快速移动”,要说“慢跑三步,然后在路边停下”。指向具体、可见事物的词语,总能带来更清晰的结果。
  2. 用镜头语言思考:广角、低角度能强调空间感;眼平高度的特写则聚焦于情感。浅景深能突出主体,深景深则让前后景都清晰。这些都是可以直接写进提示词里的指令。
  3. 光线就是情绪:柔和、温暖的窗光营造温馨,单一、锐利的硬光则带来戏剧张力。与其说“明亮的房间”,不如说“柔和的窗光为主光源,辅以温暖的台灯补光,走廊透出冷色的轮廓光”。
  4. 动作要带节奏:“演员走过房间”太空泛了,Sora不知道该怎么走。但如果说“演员向窗户迈出四步,停顿了一下,在最后一秒拉上了窗帘”,这个动作就变得精确、可执行了。

如果想了解更多,可以直接去看文档原文:cookbook.openai.com/examples/sora/sora2_prompting_guide

Sora 2的出现,真的让我感觉一个全民视频创作的时代就要来了。

大家一起玩才更有意思,记得来分享你的杰作哦!

收藏 9
点赞 42

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。