G
提示词写作
11 分钟阅读更新于 2026-05-23

Prompt 迭代工作流:从初稿到稳定输出

把"凭感觉调"改造成系统流程:单变量法、A/B 对比、批次记录,让 prompt 从碰运气变成可复制工程。
工作流
迭代方法
A/B 测试

凭感觉调 prompt 的代价

很多创作者的真实工作流是这样的:写一个 prompt,出 4 张,不满意,改两个词,再出 4 张,还是不满意,再改三个词……一个下午过去了,做了 60-80 张图,最后选出来的那张其实和第二轮的某张差不多。

问题不是出图次数,而是没有方法论。每轮改动多个变量,无法判断到底是哪个改动起了作用。结果就是经验积累不下来,下次遇到类似需求又要从零开始。

工程化的 prompt 迭代,目标是 3-5 轮内收敛到稳定可用的版本,并且把过程沉淀成可复用的资产。

第一性原理:单变量法

写 prompt 和做实验一样,每次只改一个变量。

具体做法:

1. 写一个完整的初版 prompt,记为 v1

2. 出 4 张图,挑出最接近预期的那张

3. 找出最不满意的那一点(光线、构图、风格、细节)

4. 只改动这一个维度,其他完全不变,记为 v2

5. 再出 4 张,对比 v1 和 v2 的同种子位置图

6. 重复

这个流程的关键是"同种子对比"。多数平台支持指定 seed 参数,确保两次生成在同一起点。这样你能精准看到每次改动的影响。

五轮收敛的典型路径

第一轮:定主体和环境

最初 prompt 只写主体、环境、参数。先解决"画对了内容"。

例:a young woman holding an umbrella, walking on a Tokyo street, --ar 4:5

第二轮:加风格

出图能看到主体和场景对,但风格泛泛。加风格关键词:

例:...cinematic photography, shot on Kodak Portra 400, --ar 4:5

第三轮:调光线

风格对了,但光线平淡。加光线描述:

例:...rainy evening with neon signage reflections, golden hour rim light...

第四轮:调镜头与景深

光线到位,但空间感不够。指定焦段和景深:

例:...50mm f/1.4, shallow depth of field, slight motion blur...

第五轮:补质感与调色

整体到位,但少一点情绪。补胶片感和色调:

例:...subtle film grain, color graded with teal shadows and warm highlights...

每轮只改一类元素,复杂度可控,效果可量化。

批次记录的最简模板

建一张表格,每生成一次记录一行:

| 版本 | seed | 改动点 | 评分 | 文件名 | 备注 |

|------|------|--------|------|--------|------|

| v1 | 12345 | 初稿 | 6 | 001.png | 主体对,背景太杂 |

| v2 | 12345 | 加 minimalist background | 7 | 002.png | 背景干净了 |

| v3 | 12345 | 加 golden hour lighting | 8 | 003.png | 光线有了层次 |

| v4 | 12345 | 加 50mm shallow DoF | 9 | 004.png | 接近预期 |

这种记录方式有三个好处:

1. 出问题时能快速定位是哪一步走偏

2. 想复用某个组合时可以直接回到对应版本

3. 经验沉淀成可查的资产,而不是脑子里的模糊印象

A/B 对比的两种姿势

同种子对比

固定 seed,改一个变量,对比同位置图。这种方式最适合判断单个改动的影响。

跨种子对比

固定 prompt,换 4-8 个不同 seed,看出图分布。这种方式判断 prompt 的稳定性。一个好的 prompt,不同 seed 出来的图风格一致、质量稳定;一个差的 prompt 不同 seed 差异巨大,全靠运气。

我的标准是:跨 4 个种子的图都能用,prompt 才算稳定。

何时该停止迭代

这是新手最难判断的点。三个停止信号:

信号 1:连续两轮没有显著改善

v3 比 v2 好一档,v4 和 v3 差不多,v5 也没明显差别,就该停了。

信号 2:进入边际收益区

前三轮每轮提升 2 分(10 分制),第四轮只提升 0.5 分,第五轮停滞,说明已经接近这个 prompt 路径的天花板。要么接受当前结果,要么换一个完全不同的 prompt 思路。

信号 3:开始反复横跳

v5 比 v4 好一点点,但 v4 比 v6 好。这种来回波动说明改动已经在噪声里了,进一步迭代纯粹是浪费时间。

三种典型的迭代陷阱

陷阱 1:先求完美再批量

"我先调出一个完美的 prompt 再批量生产"——这种思路 90% 会卡死。完美是相对的,不同 seed 的最佳输出永远有差异。更可行的是:调到 80 分稳定版 → 批量出 20-30 张 → 再从中精选。

陷阱 2:过度迭代单个画面

死磕一张图很容易钻牛角尖。如果 v6 之后还没满意,把这张暂时放下,去做下一张,过 1-2 天再回来。换个心情常常就解决了。

陷阱 3:忽略生成成本

每轮 4 张图,5 轮就是 20 张。如果用的是付费 API,单张图成本 0.05 美元,单个画面就是 1 美元成本。重要项目可以这么投入,但批量需求要算清成本。

团队协作场景的 prompt 版本管理

如果你不是一个人在调,而是团队协作(设计师、运营、文案),建议引入 prompt 仓库:

  • 每个 prompt 一个文件,命名规范如 portrait-coffee-shop-v3.md
  • 文件里写:用途、目标平台、最终 prompt、负面词、参数、示例图
  • 用 Git 或飞书文档做版本管理
  • 重大改动写 changelog

这种方式让 prompt 变成可复用的资产,新人接手能快速上手,老 prompt 也不会丢。

一个完整的迭代实战

需求:电商详情页主图,一只白色陶瓷马克杯,温暖咖啡馆氛围。

v1:a white ceramic mug filled with coffee, in a coffee shop, --ar 1:1

出图能用但平淡。

v2:加风格:...professional product photography, magazine quality...

质感提升,但还是普通商品图。

v3:加光线:...soft window light from the left, warm tones...

有了情绪。

v4:加构图:...rule of thirds, mug in lower left, blurred coffee shop bokeh in background...

构图变得专业。

v5:加细节:...latte art tulip pattern, slight steam rising, water droplets on the mug, marble countertop...

细节让画面活了。

v6:调色:...cinematic color grading with teal shadows and warm highlights, subtle film grain...

最终质感到位。

最终 prompt:

A white ceramic mug filled with coffee with a tulip latte art, on a marble countertop, slight steam rising and water droplets on the mug, in a Scandinavian coffee shop, soft window light from the left, professional product photography, magazine quality, rule of thirds composition with mug in lower left, blurred coffee shop bokeh in background, cinematic color grading with teal shadows and warm highlights, subtle film grain --ar 1:1

整个过程 6 轮,约 24 张图,定稿一张主图、备用 3 张。把每轮的 prompt 和最优出图存档,下次做类似商品图直接调用 v6 这个模板,改主体即可。

写在最后

prompt 写作不是艺术,是工程。把每一次生成都当成一次实验,把每一个稳定版本都沉淀成模板,半年后你的 prompt 能力会和起跑时完全不在一个量级上。