遨虾生图 Agent 电商套图 PE 优化
遨虾生图 Agent 是主打电商场景的 AI 生图工具(类似 Lovart)。我主导了第一版产品设计,后续作为核心设计师介入 PE 优化工作,把电商图质量标准系统化地编进了 Agent 的「大脑」。
#1
产品背景 & 电商套图
遨虾生图 Agent 是主打电商场景的 AI 生图工具(类似 Lovart)。我主导了第一版产品设计,后续不再接手产品设计,转而作为核心设计师参与 PE 优化工作。
1-1
1-2
电商套图:是 XXXX
产品能力:用户上传一张商品图 → 输入一句话(如「帮我生成亚马逊电商套图」)→ Agent 自动生成整套电商图。
#2
为什么需要设计师介入套图生产的 PE?
产品 0-1 阶段,整个 PE 优化链路只有工程师和评测同学参与,设计师完全缺席,导致生图效果差:
2-1
主要存在以下问题:
生图标准缺失
电商图片场景多,效果泛化,缺乏定义与特色
Prompt 质量低
扩写环节无设计参与,审美水平低
生图效果差
指令遵循差,评测分数低(满分 3 分,当前平均 X 分)
核心洞察:工程师知道模型能生什么,但不知道什么是「好的电商图」。设计师知道电商图的质量标准、审美标准。当前阶段首要任务是先把基础质量拉上来。
#3
定义优化目标
与产品经理和其他设计师一起定义,将跨境「电商生图」这件事系统化拆解:覆盖的平台、图片类型、商品类目,逐层穷尽,作为 Prompt 调优的边界。每个设计师负责不同的类目,我主要负责 3C 电子、快消品和小家电类目。
最终产物 5×8×10 = 400 个 prompt,本次选择亚马逊平台沉淀 80 个 prompt;三位设计师分别负责其中的三个类目。
3-1
#4
优化步骤
底层生图模型是 NanoBanana,以 Google 官方提示词指南为基准,结合电商场景定义 Prompt 槽位结构:
4-1
4-2
将目的(我是 UX 设计师,我现在的任务是优化 Prompt,我会按图片类型 × 类目写 Prompt,接下来你要做的是,我给你类型和类目以及参考的图片风格,你帮我写 Prompt)、谷歌的提示词文档、所有提示词槽位先给 Gemini,让 Gemini 输出第一版的 Prompt。
4-3
在 1688 找一张原图,将原图和 ChatGPT 输出的 Prompt 输入到研发搭建好的工作流平台中,使用 NanoBanana Pro 进行跑图,查看效果;通过图生图输出的效果,修改 Prompt 内容,反复调试直至效果最佳。紫色标注为设计师注入的主观审美与 Prompt 修改内容。
4-4
一个图片类型 × 1 个类目的最佳 Prompt 沉淀后,即可让 AI 拓展其他品类的 Prompt,重复这个操作。3 个设计师一起,最终沉淀出一份 类目 × 平台 × 图片类型 的 Prompt 文档,作为模型的 RAG 知识库。
4-5
最终,我完成了三个类目的套图提示词撰写,工作流平台跑出的效果图如下:
#5
结果与复盘
GSB
基于上一版 baseline 对比,G(提升)/ S(持平)/ B(变差)
Prompt Engineering 优化
Prompt Engineering 优化
文档注入 RAG
文档注入 rag 中
以下提供三个不同的case,查看优化后的效果:
Query1:参考图一,生成图片上的擦手巾的使用场景套图,使用外国模特,符合亚马逊要求,用于美国站点,图为正方形1200:1200,2k
Query2:这套玩具有21个小鱼和4个钓鱼竿,生成适用于美区亚马逊带使用场景、产品介绍的套图
Query3:制作一套完整的亚马逊电商套图,涵盖产品主图、详情图及场景应用图等。套图应突出产品特点和卖点,视觉风格统一,符合美国市场审美。
在调优过程中,也沉淀了一些 Prompt 写法规律:
功能解析图(3C / 家电类目):AI 容易生成图中没有的接口并连线,也容易画成爆炸图。应对方式是把能使用的功能摆放在一起,引导用户联想,而不是让 AI 自行推断结构。
模特图:产品与模特的相对大小难以控制,需要在 Prompt 中显式指定产品相对于人物的比例关系。
文案:优先使用图片上已有的文案,不能让 AI 自行编撰;若无文案,则写通用文案兜底。
比较遗憾的是,由于工程和技术层面的原因,电商套图 Agent 链路目前已下线,后续不再维护。但这次 PE 优化积累了设计师主导 Prompt 工程的宝贵经验,也形成了可复用的 RAG 知识库。