AI图多人站位总翻车？这套工作流让你抽卡成功率飙到90%！

一、全文速览图

AI图多人站位总翻车？这套工作流让你抽卡成功率飙到90%！

从"AI是瞎子"到"AI是导演"，我只做了这三件事。

Figma和AE哪个适合做动效？保姆级的深度分析来了！

在 Figma 的学习社群中，有很多新人会问做动效是用 Figma 还是用 AE 好？

阅读文章 >

二、先讲个"血泪故事"：当我让AI画"10个人打群架"时，它给了我什么

如果你也做过AI短剧、AI漫画或者任何需要"多人同框"的内容，你一定懂我在说什么。

去年，某个我至今不愿回忆的凌晨三点，我对着屏幕陷入了沉思。

那天我的需求很简单：画一张"9v1群殴"的场面。主角背对镜头，对面站着Boss、跪着女主、躺着三个被打趴的小弟，后排还有几个打手和一个巨型石头人。

听起来很常规对吧？武侠片、玄幻剧里这种构图不要太多。

于是我打开某款主流AI绘图工具，输入提示词：

"A warrior in white robe stands with his back to the camera, surrounded by 9 enemies, one woman kneeling, three men lying on the ground, a giant stone monster in the back..."

然后，我得到了什么？

AI图多人站位总翻车？这套工作流让你抽卡成功率飙到90%！

我得到了6个人。其中两个长在了石头人的肩膀上，女主的膝盖穿模进了地面，最离谱的是——那个背对镜头的"主角"，居然在画面里出现了两次，一次背对、一次侧脸，活像个精神分裂患者。

那一刻，我悟了。

AI不是不想画好，它是真的"看不见"空间。

就像你让一个从没学过透视的小学生去画《最后的晚餐》，他能画出一桌人在吃饭就不错了，你还指望他精准控制每个人坐哪、脸朝哪、手放哪？

这就是AI生图领域一个长期被忽视、但做内容的人天天在踩的坑——多人空间构图的可控性。

有人说："那我用文生视频啊，即梦、可灵不都能生成视频吗？"

朋友，我试过。把这张图丢进去做动态化，结果女主在 kneeling 和 standing 之间量子态切换，石头人走着走着变成了两个石头人，然后融合成了一个更大的石头人。那画面，克苏鲁看了都直呼内行。

纯纯浪费积分。

所以，这篇教程要解决的核心问题就是：如何用最低的成本、最少的抽卡次数，让AI精准理解并执行复杂的多人空间站位？

答案是：别用语言描述空间，用"灵魂画手"画出来。

三、核心方法论："灵魂画手"三步工作流

我管这套方法叫"灵魂画手+空间锚定"工作流。名字有点中二，但逻辑极其朴素：

人类负责"空间设计"，AI负责"视觉渲染"，各自干各自擅长的事。

具体拆成三步：画草图 → 写锚定词 → 精修迭代。

下面我用一个真实案例，手把手带你走一遍。

第一步：画草图——用PPT当"分镜纸"，5分钟搞定空间布局

很多人一听"画草图"就退缩："我不会画画啊！"

停。我要你画的不是《蒙娜丽莎》，是火柴人站位图。就像导演在片场拿粉笔在地上画站位一样，粗糙、示意、但精准。

工具选择：PPT就行。

对，就是你做年终总结那个PowerPoint。打开它，插入 → 形状 → 线条，用自由曲线随便画几个"人形 blob"，然后标上编号。

比如我要的"9v1"场面，我的草图长这样：

AI图多人站位总翻车？这套工作流让你抽卡成功率飙到90%！

1号：画面正中央偏下，背对镜头，主角，拿长枪。

2号：1号正前方偏右，正对镜头，Boss，体型壮硕。

3号：1号前方偏左，和2号并排，正对镜头，女性，跪姿。

4、5、6号：站在2号后方，打手，正对镜头。

7、8、9号：被打倒，趴在地上，分布在画面左下、左侧、右下。

10号：巨型石头人，站在后排，体型巨大。

画完之后，截图。这张图就是你的"空间宪法"，后续所有提示词都要围着它转。

关键原则：编号即身份，位置即关系。

你不需要画得像，你只需要让AI知道："3号在1号的左前方，而且是跪着的"。这比你说一百句"女主跪在主角左前方"都管用。

第二步：写锚定词——把草图翻译成AI能听懂的"空间语言"

有了草图，下一步是写提示词。但这里的写法有讲究。

不要直接描述画面内容，要先"锚定空间关系"。

什么叫锚定？就是先告诉AI："我给了你一张站位图，你按这个图来排人。"

我的标准提示词结构是这样的：

第一层：场景锚定"将以下人物站位融入[场景描述]中，人物位置严格参照附件站位图。"

第二层：角色锚定"1号：[角色描述]，位于[站位图位置]，[朝向/动作]。2号：[角色描述]，位于[站位图位置]，[朝向/动作]。..."

第三层：关系锚定"[X号]是[Y号]的[关系]，站在[Y号]的[方位]，形成[构图效果]。"

第四层：氛围锚定"整体画面表现[情绪/氛围]，光影[描述]，风格[描述]。"

举个实战例子：

"将站位图融入废弃体育场场景中。1号为背对镜头的白袍武将，手持长枪，位于画面中下部中央，是画面视觉中心。2号为敌方首领，体格壮硕、表情凶狠，位于1号前方偏右，正对镜头。3号为女性角色，位于1号前方偏左、靠近1号与2号之间，正对镜头，跪姿，状态狼狈。4号、5号、6号为2号打手，全部正对镜头，站在2号后方形成后排包围，4号在后方偏左，5号在后方偏右上，6号在后方右侧。10号为体型极其巨大的石头人，正对镜头，站在2号后方，明显属于2号阵营，比普通人高很多，充满压迫感。7号、8号、9号已被打倒，随机趴在地上，失去战斗力：7号倒在画面右下区域，8号倒在画面左侧中部，9号倒在画面左下区域。整体表现1号被9人围攻的压迫局势，人物站位清晰，层次分明，敌我关系明确，战斗氛围紧张危险。"

附负面提示词（Negative Prompt）：

"不要把1号画成正面，不要让2号背对镜头，不要让3号站立，不要让7号8号9号站起来，不要遗漏10号，不要把10号画得太小，不要打乱2号、4号、5号、6号、10号的前后关系，不要人物遮挡严重，不要站位混乱，不要错误人数。"

AI图多人站位总翻车？这套工作流让你抽卡成功率飙到90%！

为什么这样写有效？

因为AI处理自然语言时，对绝对位置词（如"偏左"、"偏右"、"后方"）的理解，远不如对相对位置关系（如"站在2号后面"）的理解来得稳定。你给它一张图+一套编号系统，相当于给了它一个空间坐标系，它就不再是"凭感觉画"，而是"按坐标填色"。

第三步：精修迭代——用"局部替换指令"做微调，而不是重画

第一次出图，大概率不会100%完美。但好消息是：你不需要重抽，你可以"指挥"AI改。

比如我第一次生成的图，石头人10号站在了2号的正后方，但我想要它在后排的最左侧，和画面左边那个打手换个位置。

这时候，不要重新写一段完整提示词。直接给局部替换指令：

"石头人在后排的画面左边，和画面左边（女子身后）站着的人换个位置。"

AI基于前一张图的上下文，能精准执行这个微调。这就是迭代式精修——像导演在现场调演员站位一样，指哪打哪。

对比传统工作流：

AI图多人站位总翻车？这套工作流让你抽卡成功率飙到90%！

我这套案例，最后只抽了一次卡就拿到了可用成图。这就是工作流的力量。

四、进阶技巧：让AI帮你写提示词，但你得会"审稿"

如果你觉得写锚定词太麻烦，还有一个偷懒但有效的方法：让AI帮你写。

把你的草图和简单需求丢给ChatGPT（或其他大模型），让它生成详细提示词。

比如我输入：

"帮我给出站位详细的提示词，情景是：9个人打1号，1号背对镜头，2-6号以及10号面对镜头。地上7、8、9号被打倒随机趴在地上，3号是女的，跪在地上，2号是大佬恶狠狠盯着1号，4、5、6是2号的打手站在2号后面；10号是个子很大的巨型石头人也站在2号后面。"

AI会生成一段相当完整的提示词。

AI图多人站位总翻车？这套工作流让你抽卡成功率飙到90%！

但是！这里有个致命陷阱：你必须人工审核站位关系。

AI写提示词时，偶尔会"脑补"错误。比如它可能把3号写成"站在1号与2号之间"，但你的草图里3号是偏左而非正中间；它可能把10号写成"站在2号正后方"，但你要的是"后排左侧"。

所以，AI是写手，你是编辑。它负责生成，你负责校对。

我的习惯是：让AI生成后，我对着草图逐句检查，把错误的地方手动修正，再拿去生图。这样既能享受AI的效率，又能保证空间的准确性。

五、实战案例拆解：从"灵魂画手"到"电影级群像"

为了让你更直观理解，我把完整案例再拆解一遍。

1. 需求背景

制作一张AI短剧的概念图：主角孤身闯入敌营，面对Boss、被俘女主、一众打手和一个巨型魔像。

2. 草图阶段

用绘画工具画出10个人形轮廓，标号1-10，确定：

前后层次（谁在前、谁在后）
左右分布（谁在左、谁在右）
动作状态（站、跪、躺）

3. 提示词阶段

采用"场景图+角色图+站位图"三图输入：

场景图：废弃体育场的参考图
角色图：主角、女主的参考图
站位图：PPT画的编号草图

提示词核心结构：

"将站位图融入图一场景中，图四拿长枪的是1号，其中跪着的是图三的女的。9人围攻1号的群像战斗场景，正面群像全景，略微俯视镜头，镜头位于1号身后..."

4. 生成与迭代

第一次生成：整体构图正确，但石头人位置偏右。微调指令："石头人在后排的画面左边，和画面左边（女子身后）站着的人换个位置。"

第二次生成：完美符合草图布局。

成图效果

AI图多人站位总翻车？这套工作流让你抽卡成功率飙到90%！

10个人物全部到位，无遗漏、无重复
空间层次清晰：前景主角 → 中景Boss+女主 → 后排打手+石头人
动作状态准确：跪的跪着，躺的躺着，站的站着
敌我关系明确：主角背对（孤立），敌方正对（压迫）

六、底层逻辑：为什么"灵魂画手"比"文字大师"更管用？

理解了方法，我们再来聊聊为什么这套方法有效。

1. AI的"空间盲症"

当前主流文生图模型（包括GPT-Image-2、Midjourney、SDXL等）的核心机制是扩散模型。它们通过海量图片学习"文本-像素"的关联，但空间推理不是它们的强项。

当你说"左边站着一个男人，右边站着一个女人"，AI理解的是"这张图里有男有女"，而不是"男人的x坐标<<女人的x坐标"。

但当你给它一张标了号的草图，它就能通过视觉编码直接读取位置信息，相当于你帮它完成了"空间理解"这一步。

2. 语言的歧义性 vs 图像的确定性

"站在他后面"这句话，可以指"正后方"、"左后方"、"右后方"甚至"斜后方"。但草图上的一个 blob 位置，是唯一确定的。

图像是不模糊的语言。

3. 编号系统的"认知减负"

10个人的场景，如果都用名字或描述来指代（"主角"、"Boss"、"女主"、"打手A"、"打手B"...），AI很容易混淆。但用1-10的编号，相当于给每个人发了身份证，AI的"注意力"可以精准分配。

七、常见问题Q&A

Q1：我不会画画，草图画得太丑怎么办？

丑没关系， blob 能看懂就行。AI不需要艺术价值，它需要空间信息。你画得越抽象，AI越不容易被"像不像"干扰，反而更专注位置。

Q2：一定要用PPT吗？PS行不行？

任何能画线条+标文字的工具都行。PPT的优势是零门槛、打开快、截图方便。专业选手用Figma、Photoshop、甚至手绘拍照都可以。

Q3：人物数量有没有上限？

实测10人以内成功率很高。超过15人，AI开始"吞人"（遗漏角色）。如果必须大场面，建议拆成"远景群像+近景特写"两张图，后期合成。

Q4：这个方法适用于视频生成吗？

目前文生视频工具（如可灵、即梦、Seedance）的"首帧控制"功能可以接入。先生成精准首帧，再让视频工具做动态化，穿帮率会大幅降低。但纯文生视频的多人控制，目前仍是行业难题。

Q5：GPT-Image-2和其他模型比，优势在哪？

就多人站位这个场景而言，GPT-Image-2对复杂指令的遵循度明显更高，尤其是"编号+位置+动作"的多重约束。SDXL需要配合ControlNet，Midjourney需要大量抽卡，而GPT-Image-2在"理解意图"层面更接近可用状态。

八、写在最后：AI是工具，但工具需要"说明书"

做AI内容这一年多，我有一个很深的体会：

很多人抱怨AI"不听话"，其实不是AI不行，是沟通方式错了。

就像你不可能用"随便画个好看的"去指挥一个美术团队，你也不能用模糊的语言去指挥AI。草图、编号、锚定词——这些不是"技巧"，而是与AI协作的基础协议。

做AI短剧、AI漫画的朋友应该深有体会：一张多人构图如果抽卡50次，项目进度直接爆炸。但如果你花5分钟画张草图，写一段锚定词，可能3次就出图。

时间省下来了，头发保住了，甲方的微信也不用拉黑了。

最后，说点心里话。

总有人问我："AI发展这么快，你们这些做AI内容的是不是很快就要被淘汰了？"

我的答案是：淘汰的不是用AI的人，是不会用AI的人。

AI再强，也需要有人告诉它"女主应该跪在哪"。这个"告诉"的过程，就是人的价值。

我们或许只是"工具人"，但好的工具人，能让工具发挥出200%的效能。这本身就是一种不可替代的能力。

如果你也觉得这篇教程有用，欢迎转发给你那个还在"纯文字抽卡50次"的朋友。

毕竟，能救一个发际线，是一个。

设计师阿哲

文章 28 人气 134.3w

优秀设计师

+关注作者

复制本文链接文章为作者独立观点不代表优设网立场，未经允许不得转载。

继续阅读本文相关话题

AIGC

学AI

AI导航

菜单 优设网uisdc.com 优设网 - 学AI设计上优设

您还未登录

登录后即可体验更多功能

AI图多人站位总翻车？这套工作流让你抽卡成功率飙到90%！

2026/05/27 推荐： 设计师阿哲阅读 8.6k 评论有奖 阅读本文需 15 分钟

一、全文速览图

Figma和AE哪个适合做动效？保姆级的深度分析来了！

二、先讲个"血泪故事"：当我让AI画"10个人打群架"时，它给了我什么

三、核心方法论："灵魂画手"三步工作流

第一步：画草图——用PPT当"分镜纸"，5分钟搞定空间布局

第二步：写锚定词——把草图翻译成AI能听懂的"空间语言"

第三步：精修迭代——用"局部替换指令"做微调，而不是重画

四、进阶技巧：让AI帮你写提示词，但你得会"审稿"

五、实战案例拆解：从"灵魂画手"到"电影级群像"

1. 需求背景

2. 草图阶段

3. 提示词阶段

4. 生成与迭代

六、底层逻辑：为什么"灵魂画手"比"文字大师"更管用？

1. AI的"空间盲症"

2. 语言的歧义性 vs 图像的确定性

3. 编号系统的"认知减负"

七、常见问题Q&A

八、写在最后：AI是工具，但工具需要"说明书"

设计师阿哲

文章 28 人气 134.3w

继续阅读本文相关话题

134.3w人气 28文章

本文3套知识9图

4步做出世界杯动画！AI大透视镜头太燃了

GPT Image 2不会写词！9个实用公式帮你快速上手

AIGC电商设计实战！5步把白底图做成高级海报

文章目录

文章目录

你即将学会 AIGC 的知识

为什么同样的错误AI能犯一百遍？教你把每次纠偏都存下来！

8.4k 人阅读

上一篇

你即将学会 Agent 的知识

资讯/神器/素材全都有！2026年5月设计素材周刊第三波

2.6w 人阅读

下一篇

发评论！每天赢奖品

点击 登录 后，在评论区留言，系统会随机派送奖品

2012年成立至今，是国内备受欢迎的设计师平台，提供奖品赞助 联系我们

用户体验增长

已累计诞生 794 位幸运星

发表评论

↓ 下方为您推荐了一些精彩有趣的文章热评 ↓

菜心¹

夏花生

菜心¹

彩云Sky

土拨鼠

优设推荐官精选热门话题

设计规范

文章 297

网页设计

文章 1038

优秀网页设计

文章 588

Stable Diffusion

文章 415

评论

收藏

分享

AI趋势

入站必看

设计入门

进阶提升

热门资源

最新AI工具

300+实用AI工具全收录

GPT Images2

AI生图王者归来

OpenClaw

快来一起养龙虾

AI智能绘画

让AI助你一臂之力

Blender

菜单优设网 - 学AI设计上优设

2026/05/27 推荐：设计师阿哲阅读 8.6k 评论有奖阅读本文需 15 分钟

点击登录后，在评论区留言，系统会随机派送奖品

2012年成立至今，是国内备受欢迎的设计师平台，提供奖品赞助联系我们