换个姿势就变脸？这个万能模板教你锁死AI角色一致性

一、全文速览图

从一张图到一座城！GPT Image 2 生成3D场景的超野路子指南

一、全文速览图作者按：本文写给那些想造世界但不想学Blender、想搞3D但不想碰代码、想炫技但预算为零的赛博建筑师们。

"我花了3小时生成的角色，换个角度就不认识了。"

这句话，大概是每个用AI做角色设计的创作者都经历过的至暗时刻。

在AI绘画领域摸爬滚打一年多，我踩过无数坑，也总结出一套行之有效的解决方案。今天这篇文章，我会把角色说明书（Character Sheet）的完整制作方法论彻底拆解，加入大量实操细节、错误示范，以及我亲自验证过的技巧。全文约5000字，建议先收藏，再慢慢消化。

二、为什么你需要角色说明书？先搞清楚这个底层逻辑

1. 角色一致性：AI绘画的"阿喀琉斯之踵"

如果你用过Midjourney、Stable Diffusion、GPT Image 2或者国内的可灵、即梦等工具，一定遇到过这个场景：

第一张图生成的角色美若天仙，第二张换个姿势直接变成"陌生人"；
正面看是冷峻御姐，侧面看成了邻家小妹；
同一组提示词，每次生成的角色都不一样……

问题的核心在于：AI没有"记忆"。

传统绘画中，角色设计师会画三视图、表情稿、姿态稿，形成一套完整的设定资料，确保无论谁画这个角色，都不会走样。但AI生成是概率性的——每次都在"重新创作"，而不是"基于已有角色延伸"。

2. 角色说明书 = 角色的"身份证+使用手册"

角色说明书本质上就是给AI（或你自己）建立一套可复用的角色数据库：

换个姿势就变脸？这个万能模板教你锁死AI角色一致性

一句话总结：角色说明书让你的角色从"一次性消费品"变成"可长期运营的品牌资产"。

三、角色说明书的标准结构：11个模块拆解

一套完整的角色说明书包含11个核心模块。我会逐个拆解，并告诉你每个模块的实操要点和常见错误。

【模块1】顶部信息区：角色的"名片"

这是整张设定板的"抬头"，需要包含：

角色名字（可AI自动生成，也可自定义）
角色身份（职业/角色定位）
年龄
性格关键词（3-5个，如：孤傲、侠义、隐忍、洒脱）
核心主题（一句话概括角色灵魂，如："一柄青锋剑，半壶浊酒，江湖路远，不问归期"）

实操技巧：性格关键词不是随便写的。它们会直接影响AI生成时的表情、姿态和氛围。比如"孤傲"会让角色眼神更疏离，"洒脱"会让姿态更随性。

❌错误示范："性格：善良、勇敢、聪明、美丽、大方"这五个词放谁身上都行，没有辨识度。AI生成的角色会趋向"平均脸"，缺乏记忆点。

✅正确示范："性格：外冷内热、剑痴、嗜酒如命、嘴硬心软、厌世疏离"这组词有矛盾感（外冷内热、嘴硬心软）、有具体指向（剑痴、嗜酒如命），AI更容易捕捉到独特的气质。

【模块2】配色系统：6-8个色块

配色系统是纯色块展示，不加文字标签。

为什么？因为文字会干扰视觉判断，而且不同设计师对颜色的命名不同（"青黛色"到底是哪种青？）。

实操技巧：

主色占60%（服装主色调）
辅色占30%（配饰、细节色）
点缀色占10%（高光、特殊元素）

❌错误示范：配色选了12个色块，且色阶过于接近。色块太多 = 没有重点。AI在生成时会被过多的颜色信息干扰，导致画面杂乱。

✅正确示范：6个色块：玄青（主色）、月白（辅色）、暗金（辅色）、赭石（点缀）、肤色、发色。

进阶技巧：把色块按实际使用比例排列，主色块面积最大，点缀色块最小，这样一眼就能看出色彩权重。

【模块3】主身份展示（最大区域）：角色的"全身照"

这是整张设定板面积最大的区域，也是整个角色的"锚点"。必须包含：

正面 / 3/4侧面 / 侧面 / 背面
标准站姿（双脚并拢或自然站立，双臂自然下垂）
身高比例线（刻度标注）
无道具（纯角色展示，避免干扰）

换个姿势就变脸？这个万能模板教你锁死AI角色一致性

⚠️重点：这是"锁定角色"的关键

为什么主展示区域要最大？因为AI在理解画面时，视觉权重与面积成正比。你把角色全身照放在最大区域，相当于告诉AI："这是本尊，其他都是变体。"

实操技巧：生成主展示图时，建议用最稳定的提示词结构：

[角色描述] + [标准站姿] + [正面/侧面/背面] + [纯色背景] + [无道具] + [高质量渲染]

❌错误示范：主展示区域放了一个动态 pose（比如挥剑战斗动作），没有背面图。动态 pose 会导致服装褶皱、肢体比例变形，无法作为"标准参照"。背面图的缺失则会让AI在生成背影时"自由发挥"，大概率会出错。

✅正确示范：四视图严格按 T-pose 或自然站姿排列，比例线从脚底到头顶标注168cm，每个角度之间保持一致的打光。

【模块4】轮廓剪影：正面+侧面

剪影是角色辨识度的终极测试。一个好的角色，只看剪影就能认出来。这就是为什么迪士尼角色设计极其重视剪影——米老鼠、唐老鸭，哪怕变成黑影，你也认得。

换个姿势就变脸？这个万能模板教你锁死AI角色一致性

实操技巧：生成剪影时，背景用纯色，角色填充为纯黑。检查以下要点：

轮廓是否有独特记忆点？（比如特别的发型、斗笠轮廓、体型）
正面和侧面轮廓是否一致？（防止"正面瘦、侧面胖"的崩坏）
是否有不必要的细节突出？（剪影应该简洁有力）

❌错误示范：剪影轮廓和普通路人没有区别，没有标志性元素。这意味着你的角色设计缺乏辨识度，观众看10遍也记不住。

✅正确示范：女游侠的剪影中，高马尾的飘逸弧度、窄袖劲装的利落线条、腰间软剑的弯曲轮廓形成独特的"修长+利落"组合，一眼可识别。

【模块5】表情系统：8张标准表情

8个表情分别是：

平静
好奇
紧张
惊讶
害怕
悲伤
坚定
放松

实操技巧：生成表情时，固定以下变量，只改变表情描述：角度（建议统一用正面或3/4侧面）、打光（保持一致的光源方向）、背景（纯色）、服装（同一套）

❌错误示范：8个表情用了8种不同的角度和打光。这样生成的表情虽然"看起来丰富"，但无法作为一致性参考。当你想用这些表情作为垫图生成新图时，角度和光影的差异会导致融合失败。

✅正确示范：全部用正面、同一光源（左前方45度）、同一背景，只改变面部肌肉描述：

平静：面部肌肉放松，眼神平视，高马尾自然垂落
好奇：眉毛微抬，眼睛睁大，嘴角微张
紧张：咬肌紧绷，眉头微皱，眼神聚焦 ...

换个姿势就变脸？这个万能模板教你锁死AI角色一致性

进阶技巧：给每个表情写具体的面部肌肉描述，而不是笼统的"开心""难过"。AI对肌肉描述的理解比情绪词汇更准确。

【模块6】微表情：5张细节表情

聚焦在局部：眼部紧张、微笑、嘴部用力、微恐惧、呼吸控制。

❌错误示范：微表情和表情系统用同样的构图，没有特写。细节会被忽略。

✅正确示范：胸部以上特写，背景虚化，强调面部立体感和肌肉变化（如"嘴角上扬2mm""鼻翼微张"）。

【模块7】头部结构：多角度头部

包含：3/4侧面、侧面、仰视、俯视。

❌错误示范：只生成正面和侧面，忽略仰视和俯视。后续生成大概率会翻车。

✅正确示范：四个角度统一光源，标注发际线、眉骨、鼻梁、下巴的相对位置，确保结构一致。

【模块8】姿态变化：3种身体语言

包含：放松、紧张、自信。核心是肢体语言，注意肩膀、脊柱、腿部的变化。

❌错误示范：三个姿态只是表情不同，身体姿势完全一样。

✅正确示范：放松（单手搭剑柄，重心在右腿），紧张（双手握剑，重心前倾），自信（双臂抱胸，肩膀打开）。

【模块9】特写镜头：1张强情绪表达

胸部以上，强情绪，高细节。展示角色的"上限"。

✅正确示范：强侧光，面部有明暗对比，眼神直视镜头，嘴角有细微抽动，展示皮肤纹理和青衣布料质感。

换个姿势就变脸？这个万能模板教你锁死AI角色一致性

【模块10】服装细节：4张分解图

包含：发型、材质、配饰、鞋。最影响质感的模块。

✅正确示范：发型（头顶特写展示高马尾光泽）、材质（青衣布料微距展示棉麻纹理）、配饰（腰间软剑特写）、鞋（布靴底纹特写）。

【模块11】手部动作：5种手势

包含：放松、紧张、指向、抓握、面部动作（如扶额、托腮等）。

❌错误示范：手部动作没有标注具体手指姿态，"放松"太笼统。

✅正确示范：指向：食指伸直，其余四指握拳，拇指压在食指侧面。

四、一致性要求：5条铁律

铁律1：所有画面角色完全一致（脸/发型/比例/服装）

同一套提示词的核心描述部分，在所有模块中必须一字不差。比如："黑色高马尾，额前两缕碎发，发丝微卷，左侧编有一条细辫"——这句话要原封不动出现。

铁律2：不允许风格漂移

解决方案：在提示词开头固定风格锚点，如"写实3D渲染，东方武侠风格，CG级细节"，并且永远不要删除这句话。

铁律3：主展示区域必须最大

这是视觉权重问题。如果表情系统比全身展示还大，AI会误以为"表情"是核心特征。

铁律4：CG级细节 / 材质真实 / 影视级光影

这三条是质量底线。设定板本身就是"母版"，母版模糊，复制品只会更模糊。

铁律5：画面比例4:3横版，背景纯白/米白，极简UI

4:3横版容纳足够信息；纯白背景减少干扰；极简UI显得专业。

❌ 常见错误：加花纹背景、渐变背景、水印，会干扰AI理解。

五、完整提示词模板：直接可用

以下是经过我反复验证的完整提示词，可以直接复制到Midjourney、GPT Image 2、可灵等工具中使用。

换个姿势就变脸？这个万能模板教你锁死AI角色一致性

请基于指定参考形象，输出一套高精度人物设定档案（Character Design Portfolio），全程锁定该形象身份，禁止衍生新人物，所有分镜必须严格遵循同一人物底层结构。  【形象基础参数】 艺术风格：写实三维 / 风格化三维 / 二次元 / 半写实 / 品牌IP（任选其一） 人物设定：[输入你的形象描述，或直接上传参考图] 性别：[男 / 女 / 无性别] 年龄：[具体数值] 体态：[纤细 / 标准 / 健硕 / 夸张比例] 气质标签：[高级感 / 先锋 / 街头 / 未来感 / 情绪张力 等]  【版式规范】 - 画布比例：4:3 横向 - 底色：纯白 / 暖白 / 极简无纹理 - 界面：克制排版，零品牌标识，零水印 - 文字：英文标注，清晰无衬线体  【档案必含板块】  1. 身份卡    - 代号（可AI拟定）    - 职业/身份    - 年龄    - 性格标签（3-5组）    - 核心slogan（一句定调）  2. 色谱系统    - 6-8枚色标（纯视觉，无文字注释）  3. 主形象展示区（版面占比最大）    - 全角度：正 / 3/4侧 / 侧 / 背    - 标准立姿（自然站立，双臂垂放）    - 身高标尺（刻度线）    - 零道具干扰  4. 轮廓提取    - 正面黑影    - 侧面黑影  5. 情绪矩阵（8格）    - 淡然 / 探究 / 紧绷 / 错愕 / 惊惧 / 沉郁 / 果决 / 松弛  6. 微情绪特写（5格）    - 眼睑紧绷 / 浅笑 / 下颌发力 / 细恐 / 屏息  7. 头颈结构    - 3/4侧 / 正侧 / 仰角 / 俯角  8. 体态语汇    - 松弛 / 戒备 / 笃定  9. 情绪近景（1格）    - 胸像以上    - 高浓度情绪输出  10. 服饰拆解（4格）     - 发式 / 面料 / 配件 / 足履  11. 手势语汇     - 松弛 / 紧绷 / 指示 / 握持 / 触面  【一致性铁律】 - 全档案人物绝对统一（面容 / 发式 / 比例 / 着装） - 零风格漂移 - 主展示区版面权重最高  【输出品质基准】 - 电影级精度 - 材质可信（肤质 / 织物 / 金属） - 戏剧化布光