遨虾生图 Agent 电商套图 PE 优化

项目概述

遨虾生图 Agent 是主打电商场景的 AI 生图工具(类似 Lovart)。我主导了第一版产品设计,后续作为核心设计师介入 PE 优化工作,把电商图质量标准系统化地编进了 Agent 的「大脑」。

周期 2025.6 起
类型 Prompt Engineering 优化
我的角色 Prompt 结构定义 & 方法论协作制定

#1

产品背景 & 电商套图

遨虾生图 Agent 是主打电商场景的 AI 生图工具(类似 Lovart)。我主导了第一版产品设计,后续不再接手产品设计,转而作为核心设计师参与 PE 优化工作。

产品背景配图 1-1 1-1
产品背景配图 1-2 1-2

电商套图:是 XXXX

产品能力:用户上传一张商品图 → 输入一句话(如「帮我生成亚马逊电商套图」)→ Agent 自动生成整套电商图。

#2

为什么需要设计师介入套图生产的 PE?

产品 0-1 阶段,整个 PE 优化链路只有工程师和评测同学参与,设计师完全缺席,导致生图效果差:

设计师缺席的 PE 链路 2-1 2-1

主要存在以下问题:

问题 01

生图标准缺失

电商图片场景多,效果泛化,缺乏定义与特色

问题 02

Prompt 质量低

扩写环节无设计参与,审美水平低

问题 03

生图效果差

指令遵循差,评测分数低(满分 3 分,当前平均 X 分)

核心洞察:工程师知道模型能生什么,但不知道什么是「好的电商图」。设计师知道电商图的质量标准、审美标准。当前阶段首要任务是先把基础质量拉上来。

#3

定义优化目标

3.1 / 拆解优化范围

与产品经理和其他设计师一起定义,将跨境「电商生图」这件事系统化拆解:覆盖的平台、图片类型、商品类目,逐层穷尽,作为 Prompt 调优的边界。每个设计师负责不同的类目,我主要负责 3C 电子、快消品和小家电类目。

跨境电商平台

5

Prompt 调优需覆盖中国跨境卖家卖货的下游平台

Amazon Shein TikTok Shop TEMU Shopee

图片类型

8

这些电商平台的商品详情页,大致都能归类为以下 8 种图片类型

白底图 主视觉海报 核心卖点图 场景应用图 功能解析图 规格参数图 产品细节图 模特展示图

一级类目

10

这些电商平台的商品类目,均可映射到 10 个 1688 平台的商品一级类目

美妆个护 小家电 家居建材 汽车用品 运动户外 3C 数码配件 母婴玩具 办公文具 快消品 工业品 / 工具

最终产物 5×8×10 = 400 个 prompt,本次选择亚马逊平台沉淀 80 个 prompt;三位设计师分别负责其中的三个类目。

3.2 / 定义优化目标
优化目标拆解 3-1 3-1

#4

优化步骤

4.1 / Prompt 结构定义

底层生图模型是 NanoBanana,以 Google 官方提示词指南为基准,结合电商场景定义 Prompt 槽位结构:

Prompt 槽位结构 4-1 4-1
4.2 / 找目标 baseline 图
目标 baseline 图 4-2 4-2
4.3 / 提示词反推

将目的(我是 UX 设计师,我现在的任务是优化 Prompt,我会按图片类型 × 类目写 Prompt,接下来你要做的是,我给你类型和类目以及参考的图片风格,你帮我写 Prompt)、谷歌的提示词文档、所有提示词槽位先给 Gemini,让 Gemini 输出第一版的 Prompt。

Gemini 反推提示词 4-3 4-3
4.4 / 提示词调优

在 1688 找一张原图,将原图和 ChatGPT 输出的 Prompt 输入到研发搭建好的工作流平台中,使用 NanoBanana Pro 进行跑图,查看效果;通过图生图输出的效果,修改 Prompt 内容,反复调试直至效果最佳。紫色标注为设计师注入的主观审美与 Prompt 修改内容。

提示词调优工作流 4-4 4-4
4.5 / Prompt 积累

一个图片类型 × 1 个类目的最佳 Prompt 沉淀后,即可让 AI 拓展其他品类的 Prompt,重复这个操作。3 个设计师一起,最终沉淀出一份 类目 × 平台 × 图片类型 的 Prompt 文档,作为模型的 RAG 知识库。

Prompt 知识库积累 4-5 4-5
4.6 / 提示词写入效果

最终,我完成了三个类目的套图提示词撰写,工作流平台跑出的效果图如下:

提示词写入效果 4-6-a 提示词写入效果 4-6-b 提示词写入效果 4-6-c
1 / 3

#5

结果与复盘

5.1 / 优化效果
GSB 评测

GSB

基于上一版 baseline 对比,G(提升)/ S(持平)/ B(变差)

评测分数提升

Prompt Engineering 优化

Prompt Engineering 优化

知识库产物

文档注入 RAG

文档注入 rag 中

以下提供三个不同的case,查看优化后的效果:

Query1:参考图一,生成图片上的擦手巾的使用场景套图,使用外国模特,符合亚马逊要求,用于美国站点,图为正方形1200:1200,2k

优化前 5-1
优化后 5-2

Query2:这套玩具有21个小鱼和4个钓鱼竿,生成适用于美区亚马逊带使用场景、产品介绍的套图

优化前 5-3
优化后 5-4

Query3:制作一套完整的亚马逊电商套图,涵盖产品主图、详情图及场景应用图等。套图应突出产品特点和卖点,视觉风格统一,符合美国市场审美。

优化前 5-5
优化后 5-6
5.2 / 经验沉淀

在调优过程中,也沉淀了一些 Prompt 写法规律:

功能解析图(3C / 家电类目):AI 容易生成图中没有的接口并连线,也容易画成爆炸图。应对方式是把能使用的功能摆放在一起,引导用户联想,而不是让 AI 自行推断结构。

模特图:产品与模特的相对大小难以控制,需要在 Prompt 中显式指定产品相对于人物的比例关系。

文案:优先使用图片上已有的文案,不能让 AI 自行编撰;若无文案,则写通用文案兜底。

比较遗憾的是,由于工程和技术层面的原因,电商套图 Agent 链路目前已下线,后续不再维护。但这次 PE 优化积累了设计师主导 Prompt 工程的宝贵经验,也形成了可复用的 RAG 知识库。