角色设计 Prompt 流程：从概念到三视图

# 角色设计 Prompt 流程：从概念到三视图

角色设计是 AI 绘图最具商业价值的应用方向之一，从游戏立绘、动画前期到周边手办、漫画创作，都依赖一套稳定可复用的角色形象。但很多创作者会发现：写一句 prompt 出一张惊艳图很容易，要让同一个角色保持一致的脸、服装、比例，并能输出可用于建模的三视图，就是另一个难度。

本文给出一套从零到三视图可落地的工作流，覆盖 Midjourney、Stable Diffusion、Flux 三类主流工具，并附具体 prompt 模板与参数。

一、先做概念锚定，再写 Prompt

绝大多数失败的角色设计，问题不在 prompt 写得不够花哨，而在概念阶段就模糊。直接打开模型开始写 "a beautiful girl with silver hair" 这种 prompt，模型只会给你一个泛化的二次元美少女。

正式动笔前请把以下 6 个槽位填满：

角色身份：职业、世界观角色定位（机械师、剑士、占卜师）
年龄段与体型：少年、青年、壮年；纤细、肌肉、丰腴
性格关键词：冷静、傲慢、慵懒、阳光，决定表情和姿态默认值
标志性元素：必须出现的 1 到 2 个独有视觉符号，如左眼疤痕、机械义肢、狐狸面具
配色方案：主色 + 辅色 + 点缀色，建议直接给 HEX 或具体描述
风格定位：写实、赛璐璐、厚涂、3D 卡通、像素

把这 6 项写成一段中文设定卡，再翻译成 prompt 关键词，比凭感觉堆词稳定得多。

二、风格关键词体系：用堆叠代替空泛形容词

通用形容词（"beautiful"、"masterpiece"、"high quality"）在新一代模型里几乎不再发挥作用，反而占用 token 权重。建议用三层结构搭建风格描述。

第一层媒介与渲染方式：anime illustration、semi-realistic painting、3D octane render、cel shading、flat vector

第二层流派与参考语境：90s shonen anime style、Studio Ghibli aesthetic、Genshin Impact character art、Arcane Netflix style

第三层工艺细节：clean lineart、soft shadow、rim light、subsurface scattering、screentone texture

举例：要做一个国风修仙少年，三层堆叠就是 anime illustration, ink wash aesthetic, clean lineart with soft shading, inspired by Honkai Star Rail character design。比一句 Chinese style anime boy, masterpiece 信息量大得多。

三、单图角色立绘：先把"一张脸"固定下来

三视图的前提是先有一个稳定的"主形象"。建议用以下模板生成第一张全身立绘。

Midjourney v6 / v7 模板：

full body character concept art of [角色身份], [年龄+体型],


[发型+发色], [瞳色], wearing [服装描述], holding [道具], 
[标志性元素], [性格姿态], 
[第一层风格], [第二层参考], [第三层工艺], 
plain neutral background, front view, standing pose, 
character sheet --ar 2:3 --style raw --s 250

Stable Diffusion / Flux 模板（需要拆成正负 prompt）：

正向：1girl, solo, full body, standing, front view,


silver long hair, blue eyes, mechanical arm, navy military coat, 
red scarf, confident expression, anime illustration, 
clean lineart, soft cinematic lighting, simple background
负向：multiple views, extra limbs, bad anatomy, 
blurry, watermark, text, low quality, deformed hands

关键参数：分辨率优先 832x1216 或 896x1152 这类竖图比例；CFG 建议 4 到 6（Flux）或 6 到 8（SDXL）；采样器 DPM++ 2M Karras 或 Euler a；步数 28 到 35。

实操上一次别只跑一张，建议同 prompt 连出 8 张，从中挑一张作为"主图"。这一步选错，后面三视图全错。

`四、用主图反推一致性：embedding、LoRA 与 reference image`

主图选定后，要让角色脸不漂移，有三条路。

第一条参考图 + 图生图：Midjourney 用 --cref 主图URL --cw 80 控制角色一致性，cw 越高越锁脸但姿势越僵；Flux 可以用 Redux 或 PuLID 节点；SD 用 IPAdapter FaceID 或 InstantID。

第二条训练专属 LoRA：当角色需要长期使用（项目周期超过两周或多个场景），值得花一小时训一个 LoRA。准备 15 到 25 张同一主图的多角度生成结果，加上少量手绘修正图，在 Kohya 或 OneTrainer 训 1500 到 2500 步即可。

第三条提示词锁定法：把主图的关键视觉点（发型、瞳色、服装版型、配饰）固化成一段 8 到 12 个关键词的"角色 ID"，每次生成原样粘贴到 prompt 开头。这是没有 GPU 也能用的兜底方案。

`五、生成三视图：明确"视图"语义并控制构图`

三视图（front view、side view、back view）是建模师拿到的最低要求。直接写 "three views" 大概率得到三张姿势相似但脸型不一致的图。建议这样组织 prompt。

Midjourney 三视图 prompt：

character turnaround sheet of [角色 ID],


front view, side view, back view, three views in one image, 
T-pose, neutral expression, plain white background, 
orthographic projection, model sheet, design document layout, 
[风格三层堆叠] --ar 16:9 --style raw --cref [主图URL] --cw 100

要点：

--cw 100 把人脸权重拉到最高，避免三个视图三张脸

用 T-pose 或 A-pose 强制双手摊开，方便建模师量取比例

orthographic projection 关键词能压住透视，让模型给出近似正交投影

plain white background 配合 model sheet 输出干净的背景，省去后期抠图

Stable Diffusion 走 ControlNet 路线更稳：先用 OpenPose 准备一张三人 T-pose 骨架图，把骨架作为 ControlNet 输入，prompt 用 (three views:1.3), front view and side view and back view, same character, character turnaround，再叠 IPAdapter 把主图喂进去。这种组合产出可用率能从 10% 拉到 60% 以上。

`六、扩展资产：表情、动作与服装变体`

完成三视图后，角色资产包通常还需要三类扩展。

表情表（expression sheet）：prompt 用 expression sheet, 9 expressions in grid, smiling, angry, crying, surprised, embarrassed, calm, smug, sleepy, screaming, same character，配合主图 reference。

动作表（pose sheet）：用 OpenPose 准备 4 到 6 个动作骨架，prompt 加 dynamic pose sheet, action poses, full body。

服装变体（outfit variations）：prompt 加 same character in different outfits, casual outfit, formal outfit, combat outfit, swimsuit，用 reference image 锁脸。

`七、常见问题与对策`

脸型漂移：reference 权重不够，把 --cw 提到 90 以上；或换 LoRA 方案。

服装细节丢失：prompt 太长导致权重稀释，把服装关键词放到前 20 个 token，并用 (red scarf:1.2) 这类权重语法在 SD 里强调。

三视图变成三个不同的人：模型理解能力不够，换 Flux dev 或 Midjourney v7；或拆成三张图分别生成，再拼版。

背景不干净：prompt 加 simple white background, isolated, no background，负向 prompt 加 complex background, scenery`。

手部崩坏：SD 系列开启 ADetailer 的 hand 模型；或把手藏到口袋、披风后面，这是行业通用的偷懒方案。

八、结语

角色设计 prompt 不是一次性的灵感游戏，而是一条流水线：先在脑子里把角色定义清楚，再用三层风格堆叠定调，主图选定后用 reference 或 LoRA 锁定一致性，最后用 T-pose、orthographic、ControlNet 把三视图压稳。

把这套流程跑通一次，下次接到新角色需求，从概念到三视图的产出周期可以压到半天以内，这才是 AI 工具真正能给设计师和内容团队带来的杠杆。

角色设计 Prompt 流程：从概念到三视图

系统讲解从概念锚定到三视图输出的角色设计 Prompt 全流程，含 Midjourney 与 SD 实操模板和参数。

一、先做概念锚定，再写 Prompt

二、风格关键词体系：用堆叠代替空泛形容词

三、单图角色立绘：先把"一张脸"固定下来

四、用主图反推一致性：embedding、LoRA 与 reference image

五、生成三视图：明确"视图"语义并控制构图

六、扩展资产：表情、动作与服装变体

七、常见问题与对策

八、结语

`四、用主图反推一致性：embedding、LoRA 与 reference image`

`五、生成三视图：明确"视图"语义并控制构图`

`六、扩展资产：表情、动作与服装变体`

`七、常见问题与对策`