← → 翻页 · ESC 索引
Prompt Agent · 设计原则
2026.04
AI Image Generation · Design Principles

参考图约束

与 Prompt Agent 设计原则

不要让模型根据概念标签自由发挥,
要让它围绕参考图中的真实产品实例。

AI 生图·电商广告·结构化约束
AI 生图参考图约束与 Prompt Agent 设计原则
— 2026 —
第一幕 · 核心问题
Act I · 02 / 14
Act I

核心问题

为什么普通 Prompt 写法,在电商广告图上总是翻车?

第一幕 · 从失败开始
— · —
The Principle · 核心原则
03 / 14
One Rule · 一句话原则
"锚定参考图,
不是概念标签。"

不要让模型根据概念标签自由发挥,
要让它围绕参考图中的真实产品实例。

— 设计原则 #1·Reference-First
Page 03 · 核心原则
— · —
语言陷阱 · Language Trap
04 / 14
Before / After · 语言范式

两种语言

Danger · 导演语言

概念导向 · 自由发挥

  • "高级感的办公室"
  • "自然光洒在桌面上"
  • "一把充满科技感的椅子"
  • "北欧风极简空间"
Safe · 摄影语言

结构锚定 · 参考图绑定

  • "头枕与椅背分离,间距约 3cm"
  • "左侧扶手末端旋钮可见"
  • "腰托外置,贴合椅背弧度"
  • "网面座垫边缘圆弧过渡"
Page 04 · 导演语言 vs 摄影语言
Language Paradigm
Identity · 产品身份
05 / 14
The Real Challenge

产品身份

电商广告图的真正难点不是"好不好看",而是产品还是不是那个产品。

AI 模型能轻松生成一把"好看的椅子"——但如果头枕角度变了、腰托消失了、扶手旋钮不见了,那就不再是你要卖的那把椅子。

"视觉识别锚点 = 产品身份的最小表达。
丢失任何一个,图就不能用。"
— 产品保真原则
Identity Anchors
5 类锚点
头枕分离 · 腰托外置 · 扶手形状 · 旋钮位置 · 网面纹理
Failure Mode
80%
未约束锚点时的产品偏移率
Page 05 · 产品身份锚点
— · —
第二幕 · 约束体系
Act II · 06 / 14
Act II

约束体系

从参考图到 Prompt,如何构建结构化约束。

第二幕 · 约束的方法论
— · —
分析模块 · Analysis
Act II · 07 / 14
Product Analysis · 五维输出

分析模块

产品分析模块应该输出的 5 个结构化字段。

Output Fields · 输出字段
01
产品身份
品类 + 品牌 + 型号的一句话定义
02
视觉锚点
识别产品的最小视觉特征集合
03
空间关系
部件之间的相对位置与结构
04
不可变细节
LOGO / 比例 / 材质等绝对约束
05
易错点
AI 常犯的变形 / 遗漏清单
Page 07 · 分析模块输出
Five Dimensions
Reference · 参考图优先
08 / 14
Reference First · 参考图绑定

图是主证据

参考图不是"辅助素材"——它是约束系统的主证据。文字 Prompt 只是参考图的解释器。

正确配合方式:先绑定参考图,再用文字描述"你在图里看到了什么"。
而不是反过来——先写一段抽象描述,再随便找张图凑上去。

"参考图 = 主证据
文字 Prompt = 参考图的解释器
脱离参考图的约束 = 幻觉来源"
— Reference Binding Statement
View Gap · 视角风险

单张参考图的限制

一张参考图只能提供一个视角的信息。当目标图需要不同视角时,就会产生 View Gap——看不到的部分只能靠推断。

Low Risk
同视角微调
Medium Risk
小角度偏转
High Risk
跨视角重建
Page 08 · 参考图是主证据
— · —
约束分类 · Constraints
09 / 14
Grounded vs Inferred · 约束来源

两类约束

Grounded · 看见的

参考图可见约束

  • 直接来自参考图的视觉证据
  • 部件位置、颜色、材质、纹理
  • 结构关系(分离 / 连接 / 对称)
  • 置信度高,可放心使用
Inferred · 推断的

模型补全约束

  • 参考图看不到的背面 / 底面
  • 基于常识或品类知识推断
  • 必须标注"推断"并降低置信度
  • 视角变化时最易出错
"把推断的当看见的写进 Prompt = 在幻觉上叠幻觉。必须区分来源并标注置信度。"
— Constraint Classification Rule
Page 09 · 约束分类
Grounded vs Inferred
Default Strategy · 金句
10 / 14
The Safest Bet · 最稳策略
"先问:
能不能不改
产品主视角?"

如果能保持参考图同视角,绝大多数产品保真问题自动消失。
只在必须换角度时,才启动可推理性评估。

— Default Strategy·先同视角,再评估
Page 10 · 默认策略
— · —
第三幕 · Agent 设计
Act III · 11 / 14
Act III

Agent 设计

Prompt 生成 Agent 的 6 大核心能力模块。

第三幕 · 系统设计
— · —
Agent Modules · 能力设计
Act III · 12 / 14
Core Modules · 核心能力

六大模块

Prompt 生成 Agent 的核心能力设计。

Module 01
01
部件解析器
拆解产品视觉结构为可约束的部件树
Module 02
02
广告意图解析器
识别 Brief 中的广告场景意图
Module 03
03
导演语言清洗器
将模糊表达转为可执行的摄影指令
Module 04
04
视角风险评估器
评估目标视角与参考图的 View Gap
Module 05
05
Prompt 组装器
将结构化约束拼装为最终 Prompt
Module 06
06
生成后质检器
Checklist 验收 + 偏移报告输出
Page 12 · 六大模块
Agent Architecture
Principles · 内化原则
13 / 14
Skill Principles · 系统原则

七条原则

Internalized Principles · 建议作为 Skill 内化
01
参考图优先
所有约束必须先从参考图提取
02
锚点不可省
视觉识别锚点是底线约束
03
区分来源
可见 vs 推断必须标注置信度
04
视角风险评估
换角度前先评估可推理性
05
摄影语言替换
清洗导演语言,输出可执行指令
06
结构化验收
Checklist 驱动的生成后 QA
07
保真分级
A/B/C 级目标对应不同约束强度
Page 13 · 七条原则
Skill Internalization
收束 · Closing
14 / 14
The Takeaway

绑定参考图,
控制视角风险,
做结构化验收。

这三件事做到,电商广告图的产品保真问题
就从"碰运气"变成"可工程化"。

AI 生图参考图约束与 Prompt Agent 设计原则
— · —