# 角色设计 Prompt 流程:从概念到三视图
角色设计是 AI 绘图最具商业价值的应用方向之一,从游戏立绘、动画前期到周边手办、漫画创作,都依赖一套稳定可复用的角色形象。但很多创作者会发现:写一句 prompt 出一张惊艳图很容易,要让同一个角色保持一致的脸、服装、比例,并能输出可用于建模的三视图,就是另一个难度。
本文给出一套从零到三视图可落地的工作流,覆盖 Midjourney、Stable Diffusion、Flux 三类主流工具,并附具体 prompt 模板与参数。
一、先做概念锚定,再写 Prompt
绝大多数失败的角色设计,问题不在 prompt 写得不够花哨,而在概念阶段就模糊。直接打开模型开始写 "a beautiful girl with silver hair" 这种 prompt,模型只会给你一个泛化的二次元美少女。
正式动笔前请把以下 6 个槽位填满:
- 角色身份:职业、世界观角色定位(机械师、剑士、占卜师)
- 年龄段与体型:少年、青年、壮年;纤细、肌肉、丰腴
- 性格关键词:冷静、傲慢、慵懒、阳光,决定表情和姿态默认值
- 标志性元素:必须出现的 1 到 2 个独有视觉符号,如左眼疤痕、机械义肢、狐狸面具
- 配色方案:主色 + 辅色 + 点缀色,建议直接给 HEX 或具体描述
- 风格定位:写实、赛璐璐、厚涂、3D 卡通、像素
- --cw 100
把人脸权重拉到最高,避免三个视图三张脸 - 用 T-pose
或A-pose强制双手摊开,方便建模师量取比例 - orthographic projection
关键词能压住透视,让模型给出近似正交投影 - plain white background
配合model sheet输出干净的背景,省去后期抠图
把这 6 项写成一段中文设定卡,再翻译成 prompt 关键词,比凭感觉堆词稳定得多。
二、风格关键词体系:用堆叠代替空泛形容词
通用形容词("beautiful"、"masterpiece"、"high quality")在新一代模型里几乎不再发挥作用,反而占用 token 权重。建议用三层结构搭建风格描述。
第一层 媒介与渲染方式:anime illustration、semi-realistic painting、3D octane render、cel shading、flat vector
第二层 流派与参考语境:90s shonen anime style、Studio Ghibli aesthetic、Genshin Impact character art、Arcane Netflix style
第三层 工艺细节:clean lineart、soft shadow、rim light、subsurface scattering、screentone texture
举例:要做一个国风修仙少年,三层堆叠就是 anime illustration, ink wash aesthetic, clean lineart with soft shading, inspired by Honkai Star Rail character design。比一句 Chinese style anime boy, masterpiece 信息量大得多。
三、单图角色立绘:先把"一张脸"固定下来
三视图的前提是先有一个稳定的"主形象"。建议用以下模板生成第一张全身立绘。
Midjourney v6 / v7 模板:
`` full body character concept art of [角色身份], [年龄+体型], [发型+发色], [瞳色], wearing [服装描述], holding [道具], [标志性元素], [性格姿态], [第一层风格], [第二层参考], [第三层工艺], plain neutral background, front view, standing pose, character sheet --ar 2:3 --style raw --s 250
`
Stable Diffusion / Flux 模板(需要拆成正负 prompt):
` 正向:1girl, solo, full body, standing, front view, silver long hair, blue eyes, mechanical arm, navy military coat, red scarf, confident expression, anime illustration, clean lineart, soft cinematic lighting, simple background 负向:multiple views, extra limbs, bad anatomy, blurry, watermark, text, low quality, deformed hands
`
关键参数:分辨率优先 832x1216 或 896x1152 这类竖图比例;CFG 建议 4 到 6(Flux)或 6 到 8(SDXL);采样器 DPM++ 2M Karras 或 Euler a;步数 28 到 35。
实操上一次别只跑一张,建议同 prompt 连出 8 张,从中挑一张作为"主图"。这一步选错,后面三视图全错。
四、用主图反推一致性:embedding、LoRA 与 reference image
主图选定后,要让角色脸不漂移,有三条路。
第一条 参考图 + 图生图:Midjourney 用 --cref 主图URL --cw 80 控制角色一致性,cw 越高越锁脸但姿势越僵;Flux 可以用 Redux 或 PuLID 节点;SD 用 IPAdapter FaceID 或 InstantID。
第二条 训练专属 LoRA:当角色需要长期使用(项目周期超过两周或多个场景),值得花一小时训一个 LoRA。准备 15 到 25 张同一主图的多角度生成结果,加上少量手绘修正图,在 Kohya 或 OneTrainer 训 1500 到 2500 步即可。
第三条 提示词锁定法:把主图的关键视觉点(发型、瞳色、服装版型、配饰)固化成一段 8 到 12 个关键词的"角色 ID",每次生成原样粘贴到 prompt 开头。这是没有 GPU 也能用的兜底方案。
五、生成三视图:明确"视图"语义并控制构图
三视图(front view、side view、back view)是建模师拿到的最低要求。直接写 "three views" 大概率得到三张姿势相似但脸型不一致的图。建议这样组织 prompt。
Midjourney 三视图 prompt:
` character turnaround sheet of [角色 ID], front view, side view, back view, three views in one image, T-pose, neutral expression, plain white background, orthographic projection, model sheet, design document layout, [风格三层堆叠] --ar 16:9 --style raw --cref [主图URL] --cw 100
`
要点:
Stable Diffusion 走 ControlNet 路线更稳:先用 OpenPose 准备一张三人 T-pose 骨架图,把骨架作为 ControlNet 输入,prompt 用 (three views:1.3), front view and side view and back view, same character, character turnaround,再叠 IPAdapter 把主图喂进去。这种组合产出可用率能从 10% 拉到 60% 以上。
六、扩展资产:表情、动作与服装变体
完成三视图后,角色资产包通常还需要三类扩展。
表情表(expression sheet):prompt 用 expression sheet, 9 expressions in grid, smiling, angry, crying, surprised, embarrassed, calm, smug, sleepy, screaming, same character,配合主图 reference。
动作表(pose sheet):用 OpenPose 准备 4 到 6 个动作骨架,prompt 加 dynamic pose sheet, action poses, full body。
服装变体(outfit variations):prompt 加 same character in different outfits, casual outfit, formal outfit, combat outfit, swimsuit,用 reference image 锁脸。
七、常见问题与对策
脸型漂移:reference 权重不够,把 --cw 提到 90 以上;或换 LoRA 方案。
服装细节丢失:prompt 太长导致权重稀释,把服装关键词放到前 20 个 token,并用 (red scarf:1.2) 这类权重语法在 SD 里强调。
三视图变成三个不同的人:模型理解能力不够,换 Flux dev 或 Midjourney v7;或拆成三张图分别生成,再拼版。
背景不干净:prompt 加 simple white background, isolated, no background,负向 prompt 加 complex background, scenery`。
手部崩坏:SD 系列开启 ADetailer 的 hand 模型;或把手藏到口袋、披风后面,这是行业通用的偷懒方案。
八、结语
角色设计 prompt 不是一次性的灵感游戏,而是一条流水线:先在脑子里把角色定义清楚,再用三层风格堆叠定调,主图选定后用 reference 或 LoRA 锁定一致性,最后用 T-pose、orthographic、ControlNet 把三视图压稳。
把这套流程跑通一次,下次接到新角色需求,从概念到三视图的产出周期可以压到半天以内,这才是 AI 工具真正能给设计师和内容团队带来的杠杆。