用 Gemini 3.1 Flash 批量出营销图:一套能复用的两段式流程(含 PoloAPI)
1)先把“四个规范”定死:不然越跑越乱
批量生图最怕“每张都像新项目”。我一般先把下面四件事写成一页规范(团队共享,后面所有生成都照着来):
-
尺寸矩阵:把所有渠道需要的尺寸列成表,避免临时加尺寸导致风格断层。常见组合:1200×628、1080×1080、1920×1080、750×1334。
-
风格前缀:只定一套风格(色调、背景、光线、构图比例),写成固定前缀,每次生成都带上。
-
文案先定稿:同一活动只换变量(商品名/价格/利益点),不换句式;不要让模型临场发挥。
-
品牌元素边界:Logo、最终字体与排版建议交给设计工具统一处理;让 AI 主要负责“画面氛围 + 构图”更稳。
2)两段式:Flash 负责快,终稿负责稳
把“出图”拆成两步,你会明显更省返工:
-
预览段(Flash):2-3 秒级出预览,先看构图、主体占比、背景干净不干净,方向对不对。
-
定稿段(终稿链路):确认方向后再走高清/更稳的定稿流程(当你对皮肤纹理、布料褶皱、复杂场景元素更敏感时,别硬让 Flash 扛到底)。
你会发现两段式的本质不是“换模型”,而是把目标拆开:预览追求反馈速度,定稿追求稳定与可交付。
3)Prompt 工程化:用“前缀 + 变量”,别每次从零写
想让一批图风格统一,关键是把风格写成前缀,把尺寸/商品/文案当变量;模板越稳定,批量出来越一致。
下面是我常用的写法(你只需要改变量就能复用):
style_prefix = """
暖色调产品摄影风格,背景为渐变橙色(#FF6B35 到 #FFA366),
光线从右上方照入,画面干净简洁。
"""
def make_prompt(w, h, product_name, promo_text, cta_text="立即选购"):
return f"""
{style_prefix}
生成一张 {w}x{h} 像素的电商促销图。
画面中央是 {product_name},主体占画面约 60%。
图片上方写“{promo_text}”,底部放圆角按钮,按钮文字“{cta_text}”。
不要添加其他文字、Logo 或装饰元素。
"""
实操建议:
-
同一组变量一次出 3 张:先挑最干净的一张,再微调;比“死磕一张”更快。
-
把“不要什么”写清楚:比如“不要多余文字/不要 Logo/不要额外装饰”,能减少批量里的随机噪音。
-
把可控点放到变量里:价格、利益点、按钮文案这些变化最频繁,做变量能把维护成本压到最低。
4)批量跑得稳:并发、重试、记录(这三件事别省)
我踩过的坑基本都在“跑得快但跑不稳”。上线前至少把下面三件事做成默认配置:
4.1 并发:从小到大,先稳再快
-
先从 5 并发起步,稳定后再加;并发太猛更容易遇到超时或限流。
4.2 重试:指数退避,最多 3 次
-
指数退避(例如 1s、2s、4s),最多重试 3 次。
-
超过次数就记录失败,别卡住全队列。
4.3 记录:把每张图的“来路”记全
后面复盘、复用、二次生成,都靠“记录”。最少把这些字段落地到 JSON/表格里:
-
prompt、尺寸、变量(商品名/文案/按钮文案)
-
时间戳、输出路径、状态(待审/通过/淘汰/失败原因)
5)人工筛选标准:先看“能不能发”,再看“好不好看”
批量生成省的是“制作时间”,不是“审核责任”。我用这四条做第一轮硬筛(不合格直接淘汰):
-
文字是否正确、清晰(有错别字直接淘汰)
-
主体是否干净(边缘溢出、怪影、奇怪结构直接淘汰)
-
构图是否适配渠道(留白够不够、按钮区是否拥挤)
-
风格是否一致(色调跑偏就淘汰,别指望后期救回统一感)
第二轮再挑“更好看”的(光影、质感、细节)。
6)微调与精修:编辑模式改结构,排版交给设计工具
需要微调的通常是三类:
-
字号与位置:让按钮和促销信息更醒目。
-
主体偏移:居中/靠左,留白更合理。
-
背景干净度:去掉多余的小物件和纹理。
最后落版时建议:
-
文案做成可编辑文字层(字体、行距、对齐统一)
-
Logo 从素材库统一贴(别让模型“猜”品牌资产)
7)把“多模型接入”做成一条线:我为什么用 PoloAPI(可选)
当你把“两段式”做成产品能力,或者团队里有人用 Gemini、有人用其他模型,最耗时间的往往不是写 prompt,而是对接和运维。
我更倾向用 PoloAPI 这类聚合平台把入口收敛(你可以把它理解为:统一 Key + 统一接口,便于切模型与做统计):
-
一个 Key + 统一接口:不用每家厂商各对接一套,切模型更省事。
-
99.9% 可用性(SLA):活动高峰期更适合跑批。
-
用量与费用可追溯:可按模型/项目/时间统计消耗,预算更好管。
-
权限审计、日志溯源:更容易进企业系统;也支持私有云/混合云这类交付选项。
-
7×24 技术支持:真遇到并发与超时问题有人跟进。
做法通常也很直接:按文档把 API Key 和 Base URL 换成聚合平台的配置,先把“批量生成链路”跑通,再去优化模型选择与并发策略。
8)一页“可复用落地清单”(建议你直接复制到项目里)
-
规范
-
尺寸矩阵已确认(渠道/尺寸/安全边距)
-
风格前缀已固化(色调/背景/光线/构图)
-
文案变量表已定稿(商品名/利益点/按钮文案)
-
品牌资产边界已明确(Logo/字体/最终排版由设计工具处理)
-
-
生成
-
Flash 预览段:每组变量出 3 张候选
-
定稿段:确认方向后再走终稿链路
-
-
工程
-
并发从 5 起步,稳定后再加
-
指数退避重试 ≤ 3 次,失败不中断队列
-
全量记录(prompt/变量/尺寸/时间戳/状态/路径)
-
-
审核
-
文字正确清晰
-
主体干净无伪影
-
构图适配渠道留白
-
风格一致不跑偏
-
-
落版
-
文案用可编辑文字层重做
-
Logo 从素材库统一贴
-
9)常见问题
Q1:为什么我批量出来的图“风格不统一”?
最常见原因是风格没有固化成前缀、文案句式每次都在变。先把“前缀 + 变量”模板稳定下来,再谈提升细节。
Q2:为什么会随机超时/失败?
并发过高、服务端负载波动都可能导致超时。先把并发降到 5、加上指数退避重试,并且保证失败不会卡死队列。
Q3:AI 生成的 Logo/字体能不能直接用?
不建议。为了品牌一致性与可控性,Logo 与最终文字层尽量交给设计工具统一处理。
10)结尾:先把链路跑稳,再谈“更好看”
如果你现在的痛点是“图能出但不统一”,优先把前缀模板和筛选标准写死;如果痛点是“活动期跑不动”,先把并发、重试、记录做成稳定链路。
你更想先优化哪一段:预览速度、终稿质量,还是批量稳定性?
更多推荐


所有评论(0)