为什么 prompt 写得好坏差距这么大
很多人第一次用 AI 生成图像或视频时,输入"一只可爱的猫",结果出图勉强可用,但永远到不了想要的效果。原因不是模型不够强,而是 prompt 没有把模型需要的关键信息告诉它。
模型本身具备很强的画面表达能力,但它只能在你给定的描述空间里采样。描述空间太大,结果就漂浮不定;描述空间太窄又限制创意。写好 prompt 的本质,就是把你脑子里"那个画面"用模型能理解的方式定位出来。
Prompt 的五个基本要素
一个完整可用的 prompt 通常包含以下五块内容:
1. 主体(Subject)
画面里最核心的那个东西。可以是人、物、场景或抽象概念。要写清楚是什么、什么状态、什么动作。例如"一只橘色的虎斑猫"比"一只猫"更明确,"一只橘色虎斑猫蜷缩在飘窗上打盹"又比前者更具画面感。
2. 环境(Setting)
主体所处的空间。室内还是室外、什么时间、什么季节、什么气氛。环境描述会强烈影响整体光线和色调。"清晨的厨房窗台"和"黄昏的飘窗"虽然都是飘窗,色温和情绪差很多。
3. 风格(Style)
你希望画面呈现的视觉语言。是写实摄影、油画、动画、3D 渲染、还是日系插画?风格关键词决定了模型采样的整个分布。常见有效关键词包括"cinematic photography"、"studio ghibli style"、"oil painting"、"3D render"、"watercolor"等。
4. 细节(Details)
让画面变得有质感的具体描述。包括材质、光线、色彩、镜头、景深等。"柔和的窗光"、"浅景深"、"35mm 镜头"、"金色时刻"这类词都是细节。这一层是把"差不多"变成"很到位"的关键。
5. 参数(Parameters)
画幅比例、清晰度、负面词等控制项。多数平台用 --ar 16:9 控制比例,或在专门字段填写。
从模糊到精准的三步迭代法
新手最常见的错误是一上来就追求完美 prompt。其实更有效的方法是分三步迭代:
第一步:粗描述
用最自然的中文写一句话,把你想要的核心内容写出来。不必管语法和顺序。例如:"想要一张厨房早餐桌上的吐司,阳光照进来,温暖感觉"。
第二步:补结构
按上面五要素重新排列一遍。把粗描述拆成主体、环境、风格、细节、参数。例如:
- 主体:一片金棕色的烤吐司,配着一小块黄油
- 环境:北欧风格的早餐桌,靠窗
- 风格:自然光摄影,杂志大片质感
- 细节:清晨柔和的窗光,浅景深,蒸汽缓缓升起
- 参数:3:4 竖图
- 用国内模型出图:直接写中文,能用四字成语和文学化描述更佳
- 用海外旗舰模型:核心主体和风格用英文,氛围词中英都行
- 涉及专有名词(电影、画家、相机型号):保留英文原名
第三步:调权重
看第一版结果,找出哪里偏离了预期。如果光线太硬就在光线描述前加权重,如果背景太杂就明确指定背景元素。多数平台支持括号或权重符号,例如 (soft morning light:1.3)。
中文 prompt 与英文 prompt 的取舍
国内模型如 Seedream、CogView、即梦等对中文支持非常好,写中文 prompt 反而能减少翻译损失。海外模型如 Midjourney、Imagen 历史上对英文优化更深,但 Gemini Imagen 4 之后中文能力也明显提升。
实战建议:
新手常踩的五个坑
坑1:把所有想法堆进一句话
prompt 不是越长越好。模型对每个词的注意力有限,超过 60-80 个词后效果会下降。把无关的修饰词删掉,保留最具表现力的 5-10 个关键词。
坑2:用形容词堆砌而不是具体描述
"漂亮的"、"美丽的"、"梦幻的"这类词信息密度极低。换成"金色时刻"、"逆光"、"丁达尔效应"这种具体词,画面会立刻变得有方向。
坑3:风格冲突
同时写"赛博朋克"和"水彩画"会让模型困惑。每个 prompt 选一个主导风格,其他元素围绕这个风格服务。
坑4:忽略画幅
社交媒体竖屏、电商横屏、海报方形——构图差别巨大。出图前先确定用途,选对画幅再调内容。
坑5:一次想出最终版
真实创作流程是:生成 4 张 → 选最接近的 → 微调 prompt → 再出 4 张。多数好作品需要 3-5 轮迭代。
一个完整可复用的 prompt 模板
`` [主体特征],[动作/状态],[环境/位置],[时间/光线],[风格关键词],[镜头/构图],[关键细节]
``
例:
一只橘色虎斑猫,蜷缩在飘窗上打盹,北欧风格客厅,清晨柔和窗光,自然光摄影风格,35mm 镜头浅景深,毛发细节清晰,蒸汽从旁边的咖啡杯升起
把这个模板存成常用片段,每次替换变量即可快速产出可用 prompt。
进阶练习
挑一张你喜欢的图片或视频,用上面五要素反推它的 prompt。这个练习能快速建立你对"画面 ↔ 文字"映射的直觉。坚持做 20-30 张反推,你写 prompt 的能力会有质的飞跃。