GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

一、全文速览图

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

我去,马斯克刚刚转发了我昨天发布产品的推文

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

当然……我得告诉你,这显然是假的。

这张图是我刚刚用Lovart里的GPT-Images-2一次性生成的,没改。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

这是LM Arena最新榜单。GPT-Image-2在文字渲染、UI还原、世界知识几个维度都已经甩开Nano Banana Pro。多夸张呢?它和Nano Banana Pro的差距,基本等于Nano Banana Pro和DALL-E的差距。

这一天大家应该也已经看麻了。X和公众号上刷屏的GPT-Image-2生成图,各种拟真截图、手写字条、漫画分镜、地图信息图,每一张都在挑战你对AI生图能力的认知。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

但我想聊的不是这件事。

我想聊的是:出图越来越猛越来越像真的,但这只是「有趣」,虽然有趣也很重要啊,但怎么真正在生产力里用起来,才是关键的问题。

一张Musk假推文当然好玩,但它能帮我做什么?我今天要给Hermes Agent出一版英文封面、给女娲.skill做一张GitHub社区宣发图、帮朋友的咖啡馆出一张新品KV、给huashu-design做7国本地化物料,这些真实的活,Image 2直接生成一张好看的图不够用,我需要的是:改字不崩版、拆图层精修、点哪改哪、批量出多语言、存成可复用流程、导出给设计师。

这是一个真实工作流的问题。

然后我发现一件挺惊喜的事:我前几天花了4000块年薪请的那个「一人公司品牌部」Lovart自己已经在第一时间把GPT-Image-2接入进来了,而且把Image 2和Lovart那套独家编辑能力组合起来玩出了新东西。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

打开Lovart首页,输入框下面的模型tab第一个就是GPT Image 2,紫色高亮置顶。

昨天发huashu-design的时候,有件事我没展开讲:那个skill里的「5步品牌资产协议」(agent出图前先扒一遍用户的品牌资产),灵感是同时从Claude Design和Lovart偷师的。这两家方向完全不同,但在真正动手出图前都要做同一件事:先尽力获取用户已有的品牌资产。 没有品牌上下文生图,出来的东西永远是generic的。这是65分作品和90分作品的分水岭。

所以昨晚Image 2接入Lovart之后,我拿自己手上几个开源项目和朋友的需求,在Lovart里跑了5个完整项目。

把结果放出来。

二、Case 1 · 给2.8k star的英文仓库出一套多语言封面

先说Hermes Agent。这是我开源的一个agent项目,GitHub已经2824 star了,对应的橙皮书《Hermes Agent从入门到精通》17章76页,中英文PDF免费下载。仓库主要语言是英文,issue列表里能看到不少日、韩、德开发者的ID。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

插一句,我到现在已经写了8本橙皮书。你要是在微信读书上搜一下会发现,这8本的封面风格其实没完全统一,配色、字体、主视觉都各有偏差。封面设计这件事我一直挺苦恼。

这次想趁Hermes Agent接入Image 2,先把橙皮书系列的品牌资产完整固定下来,再顺带出一套多语言封面。

第一步:上传一张原版封面,让Lovart自动识别品牌资产。

我在Lovart里建Brand Kit这一步,体验意外地顺。本来以为要一个个手动上传logo、填色值、选字体、写设计指南,结果我只做了一件事:把橙皮书原版封面拖进去。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

Lovart自己从这一张图里扒出了所有东西:Logo(橙皮书系列的Robot Wizard机器人角色)、颜色(Brand Primary赤陶橙 + Cream Background米白)、字体(标题英文+中文样本各一)、设计指南("Let AI remember your way of working"这句美学定位也自动提取出来了)。

从零到"品牌资产完整定义",大概2分钟。

第二步:出英文版封面。

Brand Kit挂上之后,我在对话框里输入的prompt比预想的短得多:

出一个Hermes Agent橙皮书的英文封面。书名「Hermes Agent: From Zero to Pro」,副标题「The Open-Source Companion Book for Hermes 3 Agent Framework」。

没指定配色、字体、插画风格、版式,任何一个视觉细节都没说。全部让Brand Kit供给。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

30秒,封面出来了。我看完第一反应是:这张封面已经好过我之前做的任意一版。

Robot Wizard角色保持原样、赤陶橙配色到位、feature bullet的排版结构清晰、底部那四个「Practical Examples / Hands-on Projects / Best Practices / Production Ready」小卡片甚至是它自己补出来的。品牌视觉风格完全维持住了,没有漂、没有崩。

第三步:用Text Edit修掉一个小瑕疵。

盯着看久了我发现一个细节没对:封面左下角还留了一行小字「让AI记住你的工作方式」。这是我Brand Kit里设计指南那一栏的原文,被Image 2当成了要放进封面的内容。英文版显然不需要这行中文。

这种小瑕疵要么重新生成碰运气、要么扔PS里手动P掉。这次我用了Text Edit。

点封面→右键→Text Edit。Lovart把封面上所有文字自动提取成右侧可编辑字段:Title、Subtitle、三条Feature、四个底部卡片标签,还有那行中文slogan。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

我直接把slogan字段内容清空,点生成。30秒,新封面出来。除了那行中文消失,其他所有细节原样保留:角色插画、配色、每行字的位置字号、底部四个卡片的排版,全部稳定。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

顺带发现一件事:你也可以把这行字段改成别的任意文字。

三、Case 2 · 给女娲.skill做一张有出版社品位的GitHub Social Preview

女娲.skill这个项目我之前聊过几次,GitHub star已经13k+了。仓库README我专门做过5语言版本(英日韩西+中),但Twitter、LinkedIn上被分享的时候还是GitHub默认那张灰扑扑的开源卡片。

很多人不知道:GitHub的Social Preview是可以自定义的,就是那张1280×640的卡片。我一直想给女娲换一张看起来像某个出版社项目、而不是又一个AI slop仓库的图。

第一步:丢一个GitHub链接就够了。

这一步又出现了和Case 1类似的"不用喂太多"的体验。Lovart支持联网搜索,所以我没上传任何素材,对话框里就写了两行:

https://github.com/alchaincyf/nuwa-skill给这个仓库做一张GitHub Social Preview,1280×640。调性像老派开源项目或学术出版物,中性色调,不要AI感。

Lovart自己跑去扒了仓库的README、star数、核心功能、项目命名含义,然后出了一版初稿。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

调性对路:中性色调、手绘线条、主视觉是一个隐喻「造人」的东方符号,这是它自己从"女娲"这个名字里推出来的。

还有一个小彩蛋:我回去检查了图片尺寸,居然真就是1280×640,一个像素不差。 以前让AI出特定尺寸,多半给个"接近"的尺寸,还得自己去crop。Image 2的指令遵循稳定到有点离谱。

第二步:HD放大到8K,把细节看清。

AI生成图的一个常见痛点是分辨率。看着挺好,真要印刷、或者放大到大屏幕上,就糊了。Lovart有个挺神的功能叫「HD放大」,最高能升到8K(10240×5120)。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

我点了下,Lovart 给了两个档:4K(5120×2560)和 8K(10240×5120)。选 8K,30 秒左右,放大后的图出来了。所有细节完全没变,只是清晰度高了:小字的笔画、插图的线条粗细、配色的渐变层级,全都原样保留。

这还挺有东西的,不知道底层配的是什么模型的能力。但对我这种可能要把图拿去做印刷物料或者放到大屏幕演讲的人来说,这一步基本是必走的。

第三步:把这张图的字体提取成我自己的专属字体。

放大之后我才看清一件事:这张图标题用的字体我还挺喜欢,有一点衬线的克制感,又带着开源项目那种unassuming的气质。

以前出图出到一半发现喜欢某个字体,你最多截图保存一下,下次想用只能用文字描述让AI「模仿一个类似的」。Lovart这次不一样。

我把这张Social Preview拖进Font Generator作为参考图,描述写的是:「保留这张图里标题字的特征:衬线克制、字宽中性、笔画粗细均匀。」

3分钟,一套完整字体生成完,存进My Fonts,我给它起名「女娲字体」。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

打开「我的字体」面板,女娲字体已经和上一篇文章里我给喜茶造的「喜茶字体」躺在一起了。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

一张图的即兴产物变成了一个可复用的品牌资产。 Lovart的My Fonts里我已经攒了两款字体。如果按这个速度,一年之后我可能会有一整套属于自己的字体库。

四、Case 3 · 给huashu-design做一套让海外用户真看懂的海报

昨天发huashu-design之后,X底下有日本人、韩国人、几个欧洲国家的开发者留言期待。我当时挺意外的,因为推文和视频都是中文。

huashu-design的X官宣推文浏览破50万了,仓库star在24小时内冲到3.4k。既然海外开发者在期待,总得有一版真能让他们看懂的物料。

第一步:用那套50万浏览的PPT做Brand Kit的起点。

回过头看,huashu-design这条推文让人印象最深的不是文字,是视频里那套平铺铺开的、设计感出色的PPT,就是那组证明了「这个skill能做出80分以上设计」的核心物料。

既然这组PPT本身就是huashu-design视觉感染力的证明,那它就是最好的品牌资产种子。

我把视频里那套PPT截图打包上传Lovart,让它自己扒。Lovart识别出三个主色:Brand Primary Red(赤陶橙红)、Brand Primary Black(终端黑)、Brand Off-White(米白底)。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

顺带看到左侧「我的品牌套件」列表里,除了刚建的huashu design,还躺着Case 1的「橙皮书封面」和上一篇文章造的「HEYTEA」。每接一个项目就往Lovart里攒一套品牌资产,这个持续积累的状态我挺舒服。

第二步:字体用自然语言描述造一款。

识别结果里字体栏是空的。这也合理。PPT截图里的文字尺寸太小、笔画特征不明显,Lovart很难从这么小的字里反向扒出字体样本(和Case 2的"大字+清晰"正好相反)。

这时候Font Generator的另一条输入路径就派上用场:用自然语言描述。

我写的风格描述是:「极简、技术感、带一点东方克制。几何无衬线体,字宽偏窄,笔画粗细均匀,字腔大,中英文风格统一。」

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

3分钟,字体出来,命名「Huashu Tech」,挂进huashu-design Brand Kit的字体栏。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

这两步下来,Font Generator的两种输入方式一组对照刚好呈现:参考图反向提取(Case 2,用于字大清晰的生成图)+ 自然语言描述(Case 3,用于字太小没法提取的场景)。你可以根据手头素材条件自己选路径。

(小限制提一下:Font Generator目前只生成西文字体。这对huashu-design这种技术品牌不算问题,但要造全中文品牌标题字得另外想办法。)

第三步:一次性出7国海报。

这次没按常规路径走「先出英文、再Text Edit切多语言」,而是直接让Image 2一次吐7张。真实写出来的prompt是这样:

为我的开源仓库:https://github.com/alchaincyf/huashu-design生成7张不同国家和地区语言的宣发海报,庆祝它24小时内突破3.4k stars。

English — Anthropic blog风的极简科技感
日本語 — 和风留白+细线条+一点书法笔触的气质
한국어 — K-design风格的极简几何、大量负空间
简体中文 — 水墨留白+现代版式+淡赭石点缀
Deutsch — Bauhaus几何、工业理性、硬朗网格
हिन्दी (Hindi) — 曼陀罗几何装饰图案、暖橙黄点缀
العربية (Arabic) — 几何花纹装饰边、整体布局从右往左镜像

这条prompt有意思的一点是:我没写品牌色、没写字体、没写"禁赛博朋克"、没写"文字层级要清晰"。@了Brand Kit之后,所有这些视觉约束自动供给。prompt回归到最本质的东西:我要什么内容+什么调性。

大概90秒,7张海报同时出在画布上。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

展开看每一张:日文版有淡墨色分隔线和留白节奏、德文版严格的网格分栏、阿拉伯文版整个布局真的从右往左翻转、印地文版装饰用了曼陀罗几何感、韩文版主视觉的负空间比英文版还大一截。

更难的是另一件事:7张海报分别吃进了对应地区的视觉文化气质,但赤陶橙+黑+米白的huashu-design品牌特征在每张里都稳稳维持住了。 文化多样和品牌一致这两件事同时被做到,不是简单"换字",也不是为了"突出文化特色"把调性搞乱。

能做到这件事的前提有两个:Image 2对多语言的"polyglot"级支持+多图一致性能力、Lovart能在一个prompt里让7个独立版本共享同一个Brand Kit的主色和字体。

五、Case 4 · 给一家还没开的咖啡馆做一整套品牌物料

插一个我一直在想但没动手的事:我想开一家咖啡馆,就叫「花生咖啡馆」。菜单、选址、店型脑子里都过了,但品牌视觉一直拖着,门头、灯箱、菜单板、外带杯、T恤这些要一件件做,磨一周也出不来。这次在Lovart里给它练一遍。

第一步:一次性出一套核心品牌物料。

我大致描述了下调性(朴素温暖、手工感、米黄+深棕、日式独立咖啡馆感),让Lovart一次生成Logo、名片、菜单板、外带杯、餐垫纸、围裙+T恤六件套。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

2分钟,花生符号贯穿所有物料,配色完全统一。这套图看起来像真的独立咖啡馆拿给你看的品牌手册,而不是"AI糊出来的demo"。

第二步:再批量出6款签名饮品海报。

同一个调性,让Lovart再出6款饮品的海报(花生拿铁/焦糖花生美式/花生酱摩卡/花生奶盖茶/花生冰沙/花生燕麦牛奶),3:4尺寸,适合小红书/朋友圈。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

6款饮品的杯型、光线、背景、字体排版出奇一致,每张还同时带中文名+英文名+一小段描述三层文字没崩。像是同一个摄影师一天内拍的一套菜单。

第三步:把这套虚构的视觉扔到小红书验证真实需求。

走到这里我手上已经有了一家完全不存在的咖啡馆的完整视觉。那我完全可以先把这套东西发几张到小红书,让真实用户给我投票。

  1. 某款饮品有点赞、收藏、"在哪里"的评论 → 市场真要,就真把它做出来
  2. 某款没反响 → 市场不要,当我省了一笔开店的成本

以前这种"用虚构视觉测真实需求"的玩法,只有做过设计或有团队的人能玩得起。现在一个独立创作者也能自己跑一遍。

第四步:把视觉里最值钱的元素单独留存下来。

花生拿铁那张海报里有几样东西我觉得特别适合变成长期素材:深棕色陶瓷杯、桌面木纹、背景的植物墙、牛皮纸海报版式。以后做其他物料直接调用,不用重新生成碰运气。

选中海报→Edit Elements。Lovart把整张图自动拆成独立图层(咖啡杯、桌面、背景、文字、海报版式),每层单独可导出。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

这算是专业级的制作。以前AI出图最大的痛点是"整张图或者全不要",Edit Elements把每个视觉元素变成独立资产,一张AI生成图直接就是一个素材库

从"脑子里一个咖啡馆的念头"到"一整套可以发小红书测市场的品牌视觉+产品海报+A/B素材+可复用元素库",不到40分钟。

最后顺手把整条「咖啡馆开店前MVP验证」封装成一个Lovart Skill,起名「开店前先劝退一下」。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

以后有朋友跟我说想开什么店,我直接把这个skill甩给他。如果小红书测下来市场没反应,就当Lovart提前帮他省了几十万到几百万的开店成本。我这劝退战斗力怕是要堪比勇哥了(抖音上专门劝退餐饮新手的那个up主)。

顺带一个挺扎心的真事:我在文章和视频里提过好多次"花生咖啡馆"这个想法,到现在为止,没有任何一条粉丝评论说想让我真把它开出来,或者想来当第一批客人。

我特么真懂了。原来粉丝早就帮我验证过了,我还折腾Lovart是多余的。

六、Case 5 · 顺手再验证一下"独立开发者三件套之二"

花生咖啡馆那套跑完我意犹未尽,又顺手用Lovart做了另一件事。

独立开发者圈里有个"三件套"的调侃:每个入坑的独立开发者都会做的三款App:todo、记账、天气。最近我有个念头想试试:把todo那种"追踪任务"的逻辑和记账那种"每天都要记"的节奏糅合起来,做一个叫「花叔todo」的App,定位是"专注计时 + 记账 + 每天的数据仪表盘"。

有用吗?不知道。但既然Lovart的MVP验证流程已经被证明好使,再跑一遍不亏。

第一步:一次性抽一整套App Brand Kit。

我一开始以为这步和前面的case一样要分两步:先建Brand Kit、再用它生成App原型。但Lovart这次的流程比我想得激进。

发了一段描述:

帮我做一个iOS App的Brand Kit。App叫「花叔todo」,定位是专注计时+记账的生产力伙伴。调性:Notion/Things 3风格的极简生产力感。主色:柔和的蓝绿色(Tiffany感但更冷静),辅色深灰+纯白。字体:SF Pro Rounded气质的无衬线。整体要有"干净的个人数据仪表盘"感。

然后Lovart直接给了我一张完整的Brand Kit合集:颜色系统、Typography字号层级、UI组件(按钮/输入框/进度条/饼图/图标),外加一组现成的iPhone App原型屏幕,全部一次生成。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

Brand Kit在这里不是一个"设定工具",是一次"抽卡"。

这里我想停一下多说两句,这可能是整篇文章里我最想强调的东西。

做出好的设计有个前提:你得有一套符合自己品牌特性和审美的视觉标准。但这套标准对没什么设计思维的人特别难打造。像我,我通常要看到了才知道这是不是我想要的。让我凭空描述一套完整视觉规范?我写不出来。

Brand Kit这种"一次抽一整套"的方式反而绕开了这个难题:你可以多抽几次,每次看到不同的可能性,抽到自己满意的,就把它保存成标准

这张"标准"之后会是你后面所有设计工作的起点。无论是用Lovart做品牌物料、用Claude Design做产品UI、用huashu-design做PPT和动画、甚至做小红书图,你都有一个稳定的视觉起点,不用每次从零描述。

对没有设计思维的独立创作者来说,Brand Kit是"从我不知道想要什么、到我有一套属于自己的视觉标准"之间的最短路径。

第二步:基于Brand Kit出一组App Store宣发图。

Brand Kit满意之后,我让Lovart再出5张App Store式横版宣发图:每张一条slogan+App截图+iPhone frame。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

出来6张(Lovart多给了一张),每张slogan都不一样但调性完全统一:「极简,但不简单」「时间都去哪了?」「清晰掌控每一天」「你的个人效率仪表盘」「随时随地,无缝衔接」。这些slogan都是Lovart根据App定位自己写的,没一条我提过。 最后那张还补了iCloud/iPhone/iPad/Mac的设备生态图。

如果我真要把花叔todo做出来,这套可以直接上App Store,不用再重出一版。

第三步:一键导出PSD。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

选中资产→下载菜单→「导出 PSD」。整套花叔todo的视觉资产(Brand Kit、App原型、宣发图)从想法到PSD分层文件,整条链跑通不到20分钟。换过去,光协调设计师排期就得一周。

第四步:把整套流程打包成Skill。

我在对话里说了一句「请帮我总结此对话并生成一个设计Skill」。Lovart自己归纳整条流程,生成了一个skill,命名「iOS App Brand Kit Design with App Store Marketing Assets」,描述写得挺准:"为极简生产力方向的App设计完整的Brand Kit + UI组件 + App Store宣发横版图"。

GPT Images 2+Lovart 效率有多高?5个案例教你成立一人品牌部!

和Case 4的「开店前先劝退一下」躺在一起:一个验证实体店、一个验证独立App。以后有人跟我说"要不要做个App"或者"要不要开家店",我直接把对应skill甩给他。

我会真的做花叔todo吗?我看完就兴致不大了。但Lovart让我几分钟就知道这个idea长出来能不能看。以后再有"要不要做个App"的冲动,先跑一遍这个skill,自己看了觉得视觉没感觉,就别浪费token真去vibe coding了。

七、关于Claude Design和Lovart

这几天常被问到的一个问题:Claude Design都上线了,Lovart还值得用吗。

其实压根不是一个东西。Claude Design擅长精准还原UI规范、给工程师交付级的产品原型;Lovart擅长从品牌视觉到MVP demo的完整视觉生产链。Case 5那个App原型是用来跑小红书测市场的,不是真的交付给工程师的,属于Lovart的阵地。真要把App做成产品,Claude Design和Lovart要配合着跑。

我自己这几天做下来也是这个感受。huashu-design是给不愿意打开图形界面的人;Claude Design是给做产品UI需要精准还原的人;Lovart是给要真正出视觉交付物的人。三件事并行不悖,看你那天在做什么。
最后说一个感受。

Image 2让「生成」这件事卷到头了。「生成之后怎么用」,才是下一个战场。

Lovart这次把Image 2的输出变成Text Edit能改的字、Font Generator能提取的字体、Touch Edit能点的区域、Mockup能贴的场景、Edit Elements能拆的图层、Skill能复用的工作流、PSD能交给专业开发的分层文件。每一步都在让生成图真正可以进入交付流程。

收藏 11
点赞 32

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。