


"我花了3小时生成的角色,换个角度就不认识了。"
这句话,大概是每个用AI做角色设计的创作者都经历过的至暗时刻。
在AI绘画领域摸爬滚打一年多,我踩过无数坑,也总结出一套行之有效的解决方案。今天这篇文章,我会把角色说明书(Character Sheet)的完整制作方法论彻底拆解,加入大量实操细节、错误示范,以及我亲自验证过的技巧。全文约5000字,建议先收藏,再慢慢消化。
1. 角色一致性:AI绘画的"阿喀琉斯之踵"
如果你用过Midjourney、Stable Diffusion、GPT Image 2或者国内的可灵、即梦等工具,一定遇到过这个场景:
- 第一张图生成的角色美若天仙,第二张换个姿势直接变成"陌生人";
- 正面看是冷峻御姐,侧面看成了邻家小妹;
- 同一组提示词,每次生成的角色都不一样……
问题的核心在于:AI没有"记忆"。
传统绘画中,角色设计师会画三视图、表情稿、姿态稿,形成一套完整的设定资料,确保无论谁画这个角色,都不会走样。但AI生成是概率性的——每次都在"重新创作",而不是"基于已有角色延伸"。
2. 角色说明书 = 角色的"身份证+使用手册"
角色说明书本质上就是给AI(或你自己)建立一套可复用的角色数据库:

一句话总结:角色说明书让你的角色从"一次性消费品"变成"可长期运营的品牌资产"。
一套完整的角色说明书包含11个核心模块。我会逐个拆解,并告诉你每个模块的实操要点和常见错误。
【模块1】顶部信息区:角色的"名片"
这是整张设定板的"抬头",需要包含:
- 角色名字(可AI自动生成,也可自定义)
- 角色身份(职业/角色定位)
- 年龄
- 性格关键词(3-5个,如:孤傲、侠义、隐忍、洒脱)
- 核心主题(一句话概括角色灵魂,如:"一柄青锋剑,半壶浊酒,江湖路远,不问归期")
实操技巧:性格关键词不是随便写的。它们会直接影响AI生成时的表情、姿态和氛围。比如"孤傲"会让角色眼神更疏离,"洒脱"会让姿态更随性。
❌错误示范:"性格:善良、勇敢、聪明、美丽、大方"这五个词放谁身上都行,没有辨识度。AI生成的角色会趋向"平均脸",缺乏记忆点。
✅正确示范:"性格:外冷内热、剑痴、嗜酒如命、嘴硬心软、厌世疏离"这组词有矛盾感(外冷内热、嘴硬心软)、有具体指向(剑痴、嗜酒如命),AI更容易捕捉到独特的气质。
【模块2】配色系统:6-8个色块
配色系统是纯色块展示,不加文字标签。
为什么?因为文字会干扰视觉判断,而且不同设计师对颜色的命名不同("青黛色"到底是哪种青?)。
实操技巧:
- 主色占60%(服装主色调)
- 辅色占30%(配饰、细节色)
- 点缀色占10%(高光、特殊元素)
❌错误示范:配色选了12个色块,且色阶过于接近。色块太多 = 没有重点。AI在生成时会被过多的颜色信息干扰,导致画面杂乱。
✅正确示范:6个色块:玄青(主色)、月白(辅色)、暗金(辅色)、赭石(点缀)、肤色、发色。
进阶技巧:把色块按实际使用比例排列,主色块面积最大,点缀色块最小,这样一眼就能看出色彩权重。
【模块3】主身份展示(最大区域):角色的"全身照"
这是整张设定板面积最大的区域,也是整个角色的"锚点"。必须包含:
- 正面 / 3/4侧面 / 侧面 / 背面
- 标准站姿(双脚并拢或自然站立,双臂自然下垂)
- 身高比例线(刻度标注)
- 无道具(纯角色展示,避免干扰)

⚠️重点:这是"锁定角色"的关键
为什么主展示区域要最大?因为AI在理解画面时,视觉权重与面积成正比。你把角色全身照放在最大区域,相当于告诉AI:"这是本尊,其他都是变体。"
实操技巧:生成主展示图时,建议用最稳定的提示词结构:
[角色描述] + [标准站姿] + [正面/侧面/背面] + [纯色背景] + [无道具] + [高质量渲染]
❌错误示范:主展示区域放了一个动态 pose(比如挥剑战斗动作),没有背面图。动态 pose 会导致服装褶皱、肢体比例变形,无法作为"标准参照"。背面图的缺失则会让AI在生成背影时"自由发挥",大概率会出错。
✅正确示范:四视图严格按 T-pose 或自然站姿排列,比例线从脚底到头顶标注168cm,每个角度之间保持一致的打光。
【模块4】轮廓剪影:正面+侧面
剪影是角色辨识度的终极测试。一个好的角色,只看剪影就能认出来。这就是为什么迪士尼角色设计极其重视剪影——米老鼠、唐老鸭,哪怕变成黑影,你也认得。

实操技巧:生成剪影时,背景用纯色,角色填充为纯黑。检查以下要点:
- 轮廓是否有独特记忆点?(比如特别的发型、斗笠轮廓、体型)
- 正面和侧面轮廓是否一致?(防止"正面瘦、侧面胖"的崩坏)
- 是否有不必要的细节突出?(剪影应该简洁有力)
❌错误示范:剪影轮廓和普通路人没有区别,没有标志性元素。这意味着你的角色设计缺乏辨识度,观众看10遍也记不住。
✅正确示范:女游侠的剪影中,高马尾的飘逸弧度、窄袖劲装的利落线条、腰间软剑的弯曲轮廓形成独特的"修长+利落"组合,一眼可识别。
【模块5】表情系统:8张标准表情
8个表情分别是:
- 平静
- 好奇
- 紧张
- 惊讶
- 害怕
- 悲伤
- 坚定
- 放松
实操技巧:生成表情时,固定以下变量,只改变表情描述:角度(建议统一用正面或3/4侧面)、打光(保持一致的光源方向)、背景(纯色)、服装(同一套)
❌错误示范:8个表情用了8种不同的角度和打光。这样生成的表情虽然"看起来丰富",但无法作为一致性参考。当你想用这些表情作为垫图生成新图时,角度和光影的差异会导致融合失败。
✅正确示范:全部用正面、同一光源(左前方45度)、同一背景,只改变面部肌肉描述:
- 平静:面部肌肉放松,眼神平视,高马尾自然垂落
- 好奇:眉毛微抬,眼睛睁大,嘴角微张
- 紧张:咬肌紧绷,眉头微皱,眼神聚焦 ...

进阶技巧:给每个表情写具体的面部肌肉描述,而不是笼统的"开心""难过"。AI对肌肉描述的理解比情绪词汇更准确。
【模块6】微表情:5张细节表情
聚焦在局部:眼部紧张、微笑、嘴部用力、微恐惧、呼吸控制。
❌错误示范:微表情和表情系统用同样的构图,没有特写。细节会被忽略。
✅正确示范:胸部以上特写,背景虚化,强调面部立体感和肌肉变化(如"嘴角上扬2mm""鼻翼微张")。
【模块7】头部结构:多角度头部
包含:3/4侧面、侧面、仰视、俯视。
❌错误示范:只生成正面和侧面,忽略仰视和俯视。后续生成大概率会翻车。
✅正确示范:四个角度统一光源,标注发际线、眉骨、鼻梁、下巴的相对位置,确保结构一致。
【模块8】姿态变化:3种身体语言
包含:放松、紧张、自信。核心是肢体语言,注意肩膀、脊柱、腿部的变化。
❌错误示范:三个姿态只是表情不同,身体姿势完全一样。
✅正确示范:放松(单手搭剑柄,重心在右腿),紧张(双手握剑,重心前倾),自信(双臂抱胸,肩膀打开)。
【模块9】特写镜头:1张强情绪表达
胸部以上,强情绪,高细节。展示角色的"上限"。
✅正确示范:强侧光,面部有明暗对比,眼神直视镜头,嘴角有细微抽动,展示皮肤纹理和青衣布料质感。

【模块10】服装细节:4张分解图
包含:发型、材质、配饰、鞋。最影响质感的模块。
✅正确示范:发型(头顶特写展示高马尾光泽)、材质(青衣布料微距展示棉麻纹理)、配饰(腰间软剑特写)、鞋(布靴底纹特写)。
【模块11】手部动作:5种手势
包含:放松、紧张、指向、抓握、面部动作(如扶额、托腮等)。
❌错误示范:手部动作没有标注具体手指姿态,"放松"太笼统。
✅正确示范:指向:食指伸直,其余四指握拳,拇指压在食指侧面。
铁律1:所有画面角色完全一致(脸/发型/比例/服装)
同一套提示词的核心描述部分,在所有模块中必须一字不差。比如:"黑色高马尾,额前两缕碎发,发丝微卷,左侧编有一条细辫"——这句话要原封不动出现。
铁律2:不允许风格漂移
解决方案:在提示词开头固定风格锚点,如"写实3D渲染,东方武侠风格,CG级细节",并且永远不要删除这句话。
铁律3:主展示区域必须最大
这是视觉权重问题。如果表情系统比全身展示还大,AI会误以为"表情"是核心特征。
铁律4:CG级细节 / 材质真实 / 影视级光影
这三条是质量底线。设定板本身就是"母版",母版模糊,复制品只会更模糊。
铁律5:画面比例4:3横版,背景纯白/米白,极简UI
4:3横版容纳足够信息;纯白背景减少干扰;极简UI显得专业。
❌ 常见错误:加花纹背景、渐变背景、水印,会干扰AI理解。
以下是经过我反复验证的完整提示词,可以直接复制到Midjourney、GPT Image 2、可灵等工具中使用。

请基于指定参考形象,输出一套高精度人物设定档案(Character Design Portfolio),全程锁定该形象身份,禁止衍生新人物,所有分镜必须严格遵循同一人物底层结构。 【形象基础参数】 艺术风格:写实三维 / 风格化三维 / 二次元 / 半写实 / 品牌IP(任选其一) 人物设定:[输入你的形象描述,或直接上传参考图] 性别:[男 / 女 / 无性别] 年龄:[具体数值] 体态:[纤细 / 标准 / 健硕 / 夸张比例] 气质标签:[高级感 / 先锋 / 街头 / 未来感 / 情绪张力 等] 【版式规范】 - 画布比例:4:3 横向 - 底色:纯白 / 暖白 / 极简无纹理 - 界面:克制排版,零品牌标识,零水印 - 文字:英文标注,清晰无衬线体 【档案必含板块】 1. 身份卡 - 代号(可AI拟定) - 职业/身份 - 年龄 - 性格标签(3-5组) - 核心slogan(一句定调) 2. 色谱系统 - 6-8枚色标(纯视觉,无文字注释) 3. 主形象展示区(版面占比最大) - 全角度:正 / 3/4侧 / 侧 / 背 - 标准立姿(自然站立,双臂垂放) - 身高标尺(刻度线) - 零道具干扰 4. 轮廓提取 - 正面黑影 - 侧面黑影 5. 情绪矩阵(8格) - 淡然 / 探究 / 紧绷 / 错愕 / 惊惧 / 沉郁 / 果决 / 松弛 6. 微情绪特写(5格) - 眼睑紧绷 / 浅笑 / 下颌发力 / 细恐 / 屏息 7. 头颈结构 - 3/4侧 / 正侧 / 仰角 / 俯角 8. 体态语汇 - 松弛 / 戒备 / 笃定 9. 情绪近景(1格) - 胸像以上 - 高浓度情绪输出 10. 服饰拆解(4格) - 发式 / 面料 / 配件 / 足履 11. 手势语汇 - 松弛 / 紧绷 / 指示 / 握持 / 触面 【一致性铁律】 - 全档案人物绝对统一(面容 / 发式 / 比例 / 着装) - 零风格漂移 - 主展示区版面权重最高 【输出品质基准】 - 电影级精度 - 材质可信(肤质 / 织物 / 金属) - 戏剧化布光
1. 关于"锁定角色ID"
目前的AI工具,还没有100%完美的角色锁定方案。角色说明书的作用是"大幅提高一致性",而不是"绝对保证一致性"。建议:设定板 + 种子值(Seed)+ 参考图垫图三者结合,才能最大程度锁定角色。
2. 关于"风格关键词"的选择
很多新手喜欢在风格关键词里堆叠一堆词。AI不是人,它没有"审美综合"能力。你给它的词越多,它越混乱。最多选3个互不冲突的风格关键词,先测试稳定搭配,再固定下来。
3. 关于"错误示范"的价值
AI创作是一个概率游戏,知道"什么不对"比知道"什么对"更重要,你规避的错误越多,成功的概率就越高。
4. 关于这套方法的适用边界
✅最适合:系列角色设计(游戏、动画、IP运营)、需要多角度表情展示、团队协作标准化文档。
❌不适合:一次性角色生成、极度风格化的艺术探索、追求"每次都不一样"的实验创作。
角色说明书本质上是一种"工业化思维"在AI创作中的应用。过去只有大型工作室才做的详细设定,现在普通人几小时就能做出来。技术门槛的降低,意味着竞争维度的升级——未来比拼的不是"会不会用AI",而是"有没有系统化的创作方法论"。
这套模板最大的价值不是"提示词本身",而是它建立了一套可复用、可迭代、可协作的标准。你可以在此基础上,根据自己的项目需求调整模块、增减内容,形成自己的"角色设计SOP"。
AI生成的是"图",角色说明书生成的是"资产"。
做图的人赚的是单次稿费,做资产的人赚的是长期复利。
希望这篇文章对你有启发。如果你用这套方法做出了自己的角色说明书,欢迎在评论区晒图交流。
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。








发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
UI设计精品必修课
已累计诞生 791 位幸运星
发表评论 为下方 5 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓