

前几天 GPT-Image-2 泄露了,试了一下发现非常厉害,但当时只要试一下就不给我生成了。
刚好今天终于发布了,发布以后我搞了不少的玩法。
它有一个非常牛逼的特点:不需要复杂提示词,随手几个字就能出非常好的效果。
我们在 vibe coding 或者日常在互联网的工作中,经常需要生成运营图片。
比如产品更新公告、活动公告等,以前可能需要写一长串复杂的提示词。
但现在你只需要告诉它"苹果风格"、"3D"、"简洁卡片化"这种你能想到的词就可以了。
比如下面两个案例:
苹果风格宣传图: 我跟它说需要一张"产品苹果风格的中文宣传图",然后把介绍网页发给它。它生成的图片排版非常精美,而且文字完全没问题。 提示词:用 gpt-image-2 为这个产品生成苹果风格的中文卡片宣传图:https://github.com/op7418/CodePilot

OpenAI 风格宣传图: 我让它基于 OpenAI 的风格生成宣传图,并给了它一个 OpenAI 的更新公告。结果生成的风格确实延续了 OpenAI 以往那种渐变配色、简洁的设计感。 提示词:根据这篇文章生成一个产品更新的介绍海报,风格需要符合 OpenAI 以往的设计风格,内容需要简洁,整体呈现苹果风、卡片化、高级感:

以前这种图至少得占设计师半天,现在从工作流里直接消失了。
然后就是非常需要世界知识的"知识类卡片",这部分它也做得非常好。
排版非常丰富、内容也多样,而且不需要多说任何提示词。
比如第一个案例,我只是让他用可爱的风格画一张大语言模型的训练过程介绍。 提示词:用可爱的风格画一张大语言模型的训练过程科普图

第二个案例是这种类似于杂志和科普的内容,你经常在公众号里看见这种图片排版。
这种复杂排版用来介绍一些知识和科普信息。
提示词:用高级杂志感风格画一张茶叶种类和制作过程的科普图。

然后我发现它也能生成超级长的长图。
比如说,这里让它生成北京秋季的游览攻略图片,它就给了一张很长的图片。
提示词:生成北京秋季的游览攻略图片
可以看到它把秋天的特色景点、行程,以及美食、交通出行指南和一些其他的提醒都画上了。
就是你能想到的、你想不到的都在上面,而且排版非常精细优美。

你不用告诉它该画什么,它知道一张科普图该有哪些内容。
然后就想让他试一下游戏这种非常复杂的类型。
图片 UI 也有,可能还有 CG 角色以及一些小字。这种非常复杂的情况,测试结果非常好。
这里先是简单的测试。 让他(提示词)参考《无畏契约》(Valorant)的游戏风格,生成一个以三国为主题、神话风格的 FPS 游戏选人界面 UI 图片。 可以看到模仿得非常像,就是界面的布局和交互采用了《无畏契约》(Valorant)的选人方式,但是整个氛围、风格、背景以及角色都变成了三国的这种感觉。

然后我就在想,再简单的提示词它能不能 get 到。比如说,我直接跟它说
提示词 :生成一个"黑神话武松"的游戏截图。
可以看到它真的能 get 到,包括 UI 设计、整个界面以及画面风格,都是《黑神话》的游戏风格。

在生成游戏界面之后,心动游戏的黄老板演示了一个非常好玩的东西。
他转发了我的推特,演示了生成的一个 ARPG 游戏截图:画面是 3D 的,但是带有对话的选择框 UI。
这不就是直接能玩游戏的吗?我们这种 ARPG 游戏,不就是立绘加上选择吗?

你让他给你生成一个带立绘、带选择的界面,直接告诉他选哪个,他就能给你画出下一张图。这不就是在 GPT 里面玩游戏吗?太爽了,没想到真行,我试了一下。


之后还换了一些别的游戏类型。比如说,最近我在玩三消游戏。
所以就让它生成了一个古代探宝风格的三消游戏 UI 截图。
可以看到这个的文字渲染和 UI 细节就非常的精细和丰富,它甚至连消除以后的特效都给你做出来了。
整个项目不只是 UI,连交互设计和整个界面该有哪些玩法都有了,非常完整。

说到交互,前几天非常火的一个测试 MBTI 以这种恶搞的方式火出圈了。
然后我就在想,咱们这个是不是能整点更高级的?
于是我就让它基于《战锤 40K》的世界观为我生成了一套测试题。
然后在结束之后,基于我回答的答案给我生成一个我在《战锤 40K》里的角色卡片和对应的性格分析。

结果他给的这个角色分析卡可太对味儿了!
基于我的回答,它给我分配的是一个审判官(异端审判官)。
而且还虚构了身份档案、人物特征、专长能力,甚至还有角色小传。

一张图加几句对话,其实就是一个可玩的游戏 demo,游戏原型的门槛又塌了一层。
前面不是说它能生成长图吗?我就在想能不能让它解释论文。
我们 AI 圈经常就是看论文,于是就把最近的 Seedance 2.0 的模型卡片(System Card)论文发给了它,没想到真可以!
提示词:帮我用高级、有杂志感的排版风格,详细且图形化地介绍这篇论文的内容,生成一张长图图片来让我理解它。要求使用中文。

这是个极端挑战:我直接从小红书随便找了一张汽车的图片。
提示词:为这个汽车生成符合其气质和风格的官网 UI 设计稿。
原图是一张小米 SU7 的图片,图上没有任何文字,只有一个侧面的汽车。

但是它居然脑补出了这是小米的车,虽然把它猜成了 SU7(也很厉害了,因为它就后背那点不一样,而且配色都是一样的)。
它为这张图生成了一个汽车官网,你们看一下吧,我觉得这个质量太离谱了。
他不知道学了多少。这张关于这辆车的图片,所有的细节都是对的:
内饰、剖面图、轮毂、大灯、尾翼、甚至价格🤣。

然后我又试了一下其他类型的网页,比如说我们常见的那种 B 端官网。
我直接跟他说:为 B 端广告投放平台生成一个官网的 UI 设计稿。
只能说他这个知识和搜索能力是非常的厉害。
他甚至知道这类型的网站上应该有哪些卖点,以及 UI 上应该展示哪些信息。太会了,这玩意儿真是完美设计。

它不只是会画,它还知道这行里每个角色该说什么话。
GPT-Image-2 模型甚至能给你随手拍的任何商品生成非常高级的商品海报。
而且你不需要说更多的提示词和内容,你只需要说一句:
提示词:帮我为这个产品生成宣传图片,宣传图片要符合这个产品的气质和风格
这是我随手拍的我的键盘,光线非常差,键盘上也比较脏。
但是它把这些都处理好了,而且还加上了跟这个键盘真的相关的卖点,整个设计风格非常像那么回事。

然后我又拿来了一盒朋友送的蓝莓,还是用的上面那个提示词,一个字都没有变。
但是它这次生成的风格完全匹配了农产品这个路数。
商品一致性可以说是非常高了,连蓝莓的位置都是对的。
但是蓝莓变得更大更饱满了。我只能说 GPT 你还是太会了。

一张商品图该用什么风格、该放什么卖点,这种判断以前是设计师最值钱的部分。
然后是 UI 设计。既然它的网页设计那么厉害,其实 UI 设计也不会差。
我先是找了一张参考图。 提示词:基于参考图的风格,生成一个健康 App 的 UI 设计稿。 他的还原度非常高,而且参考图其实跟这个主题没啥关系,只有一两个组件。


然后我又给了他一张 VI 设计的参考图
又给了他我用 vibe coding 开发的开源软件 CodePilot 的 GitHub 页面。
让他基于这个图片的风格和特色,为我的项目设计一套 VI。主要的项目信息在这里:
它在读取了我的项目信息以后,没有简单地照抄参考图,而是把这些元素都提取出来,跟我本身的产品能力进行了扩展。

可以看到这套 VI 非常全面,该有的都有了:
色彩与字体、UI 图与简单的介绍、图标贴纸与 Logo 变体、品牌主张与能力映射、宣传海报与官网示例。
比参考图原来的内容详细多了。
原本参考图里的那些设计元素也都被保留了下来。

给它一个参考,它能在这个参考上再往前走一大截。
玩到这里,我越来越觉得这代模型真正变强的地方,是它"知道该画什么"。
以前设计师值钱的地方有两层:能画出来、知道该画成什么样。
第一层这两年早塌了,这次连第二层也开始松动。
你随手说一句"苹果风的宣传图"、"B 端广告平台的官网"、"黑神话风的游戏截图",它就懂你在说什么。
因为这个行业这些年所有的视觉语言、排版规律、品牌调性,它都吃下去了。
对大部分非设计岗的人来说,这是好消息。
以前卡在"先得找个设计师"那一步的事,现在自己就能往下走。
对我们这行来说,日常那些重复性的商业设计会被收走,剩下还值钱的是原创审美和品牌高度——本来那也只是金字塔尖那一小撮人的事。
再想远一点,Image V2 出设计稿,GPT-5.5 Pro 还原成代码,CodeX 串成工作流。
从想法到可交付的东西,OpenAI 在把这条生产线直接打包。
如果你觉得对你有帮助可以帮我点个赞,也可以转发给你需要的朋友。
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。




发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
AI+Photoshop智能图像处理
已累计诞生 790 位幸运星
发表评论 为下方 11 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓