用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

一、全文速览图

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

用 GPT Image2 做完一个真实 UI 项目后,我发现 AI 最难的不是出图,而是如何成为可控、稳定、能被设计师调度的工具。

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

大家好,我是风筝 KK。

24 年初,我曾经和大家分享过AI 如何融入敏捷开发,为设计提效。

那时候,我关注更多的是“效率”。

因为在真实工作里,团队采用敏捷开发,两周一个迭代,留给设计师做需求分析和方案设计的时间,往往只有三四天。

时间一紧,设计师最先牺牲掉的,往往不是交付,而是思考。

所以那时候,我开始把 AI 放进设计工作流里,用它帮我做需求拆解、资料整理、文案补充、方案初稿。

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

目的很简单:

先把重复的、结构化的工作提效,再把时间留给真正需要判断的地方。

但最近这半个月,我在项目里密集使用 GPT Image2 做 UI 方案发散后,又有了一个新的感受。

AI 对设计的影响,已经不只是“帮我们快一点”了。

它开始进入更前面的设计环节,比如前期的需求分析、针对性的竞品分析、需求评审、方案探索、方案验证、设计执行等。

过去这些内容,设计师通常需要自己找参考、反复做方案尝试。

现在 GPT Image2 几句话就能先生成一批方向。

一开始,我也觉得挺惊艳,我仅说了一段话,Image2 就给我生成了这样的效果。

提示词:给我生成体重监测 APP 的全套界面,APP 界面里面有粉色的卡通猫作为装饰,【设计风格 ios26 的玻璃风格】【手绘风格】,按钮宠物特点元素,比例 9:16.

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

不仅如此,给它一个草图,它能生成页面,给它一张参考图,它能迁移风格,给它一个模糊描述,它能给出几种视觉方向。

但真正放到项目里用了一段时间后,我发现一个问题:

GPT Image2 会出图,不代表它真的会做 UI。

很多图第一眼完整、好看,但放回真实项目里,会发现它更像概念图,不像真实 App;光效很丰富,但信息层级不清楚;页面看起来完整,却可能自动加了业务里没有的模块。

所以这篇文章,我不想单纯分享“GPT Image2 怎么出图”。

我更想聊聊:

当 AI 已经很会生成画面之后,UI 设计真正难的,变成了什么?

二、真正难的是什么?

真正难的不是让 AI 生成一张图。

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

而是拿到产品需求后,如何快速并准确地梳理页面目标。

需求梳理清楚后,如何探索正确的设计方向。

方向大概确定后,如何快速校准视觉风格。

视觉风格确定后,图标、卡片、运营位、插画又怎么统一。

简单来说,就是如何把 AI 放进整个 UI/UX 工作流中,而不是只把它当成一个生图工具。

我希望它最终能帮设计师达到这几个目标:

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

提升方案发散效率,降低视觉试错成本,降低沟通成本,帮助设计师更快判断。

但前提是:

AI 的输出要足够稳定。

如果 AI 生成的内容本身不稳定,我们直接去搭自动化流程,其实意义不大。

因为自动化不是目的。

自动化最后要产出有质量、可判断、可继续推进的内容。

如果只是把不稳定的结果更快地产出来,那不是提效,反而会增加返工。

所以这半个月我最大的变化是:

先让 GPT Image2 在单点能力上稳定下来,再考虑把它串进完整的设计工作流。

三、为什么会跑偏?

这半个月用下来,我遇到的问题主要集中在四类。

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

1. 输入模糊,容易跑偏

比如:如果你要做一个高端金融行业服务升级的启动页。

不要只说:

“金融一点、尊贵一点、有服务感。”

这些词设计师自己能理解,但 AI 不一定知道在当前项目里应该怎么落地。

我会把它拆成更具体的设计语言,比如:

页面尺寸为 iPhone 截图比例,保留状态栏,750×1624。
页面要像高端金融会员 H5 邀请函开场,不要像海报。
背景可以用深色高级底,但不要恐怖、压抑。
光效用柔和香槟金,少量贵族紫弥散光。
整体要温暖、向上、有生命力、有欢迎仪式感。
文字居中,标题精致但不要过大。
留白充足,页面要有真实 App 截图感。
同时明确禁止项:不要大金字、厚重阴影、恐怖黑暗、保险柜压迫感,也不要丧葬、宗教、末日氛围。
你看,这就不是简单在写提示词了。
这是把设计师脑子里的判断,翻译成 AI 能执行的规则。

2. AI 太会发挥

GPT Image2 很容易生成丰富的光效、装饰、3D 元素。

如果只是做概念图,这些可能挺好看。

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

但放到真实 App 页面里,很多时候更需要轻量、清晰、可落地。

比如一个人脸识别页面,AI 可能会生成很炫的背景、很立体的卡片、很丰富的图标。

但用户真正关心的可能只是:

为什么要做人脸识别,我的资料安不安全,识别时遇到异常怎么提示等。

如果这些信息没有被清楚表达,再漂亮的画面也只是视觉效果。

所以我现在会提醒自己:

AI 很擅长“表现”,但 UI 设计更需要“克制”。

页面不是越满越好,光效不是越多越高级,插画不是越大越有记忆点。

真实 UI 首先要让用户看懂,让操作明确,让信息能被承载。

3. 多轮修改容易变形

这是我踩坑最多的地方。很多时候,我只是想改一个小地方。

比如:

背景光效弱一点。

按钮不要太厚。

主视觉小一点。

图标不要太卡通。

卡片阴影轻一点。

但 Image2 的修改不太像 Figma 里的精修,它经常会在改一个地方时,顺手把整张图都重新生成。

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

结果就是:

按钮变好了,背景变了。

背景变好了,卡片变了。

主视觉变好了,页面结构又乱了。

所以如果一直整图反复修改,很容易越改越失控。

后来我更倾向于拆模块调整。

背景单独生成,按钮单独调整,图标单独试风格,主视觉单独优化,卡片样式单独对比。

每次只让 AI 解决一个问题,反而更稳定。

4. 好看不等于落地

AI 图经常第一眼挺好看,但真实项目里,最后还要回到 Figma 里重构。

你要看:

字号能不能统一。

间距能不能还原。

按钮比例是否合理。

卡片组件能不能复用。

图标风格是否统一。

前端实现成本高不高。

内容是否符合业务规则。

所以 GPT Image2 生成的图,更多是方向参考,它不能直接替代最终设计稿,如果设计师没有做二次判断和重构,很容易把“方向图”误当成“交付稿”。

所以 GPT Image2 提高的是发散速度,但设计师必须提高收敛能力,否则 AI 只会生成更多选择噪音。

四、我的工作流

经过这半个月的深度使用,我现在会把它收敛成四个动作:

先分析,再参考,先发散,再收敛。

1. 先分析:别急着出图

1)前期分析阶段

在前期分析阶段,我会把我了解到的产品需求、业务背景、用户场景,以及我自己主观上的判断,先全部喂给 GPT。

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

这一步不是为了让 AI 直接给页面方案,而是先让它帮我做需求分析。

比如我会让它判断:

这个项目到底要解决什么问题?

业务目标是什么?

用户目标是什么?

页面的第一性原理是什么?

最核心的用户任务是什么?

最该优先解决的 20% 问题是什么?

如果引入 AI,AI 应该放在哪个环节?

如果产品还在讨论阶段,我也会让它先帮我做产品定位。

这一步的价值是,先把模糊的信息结构化。

很多时候,需求文档里写的是功能,但设计师真正要判断的是:

为什么做,给谁用,解决什么问题,这个页面到底要推动用户完成什么。

如果这一步不清楚,后面出图越快,越容易跑偏。

所以我现在会先让 GPT 帮我把问题拆开,再进入视觉方案。

具体如何进行产品定位,可以查看我之前和大家分享的《以智能客服管理平台为例,手把手教你如何用 AI 定义设计问题》文章后面有详细的提示词,大家可以直接使用。

2)需求评审

需求评审阶段,我也会让 GPT 先帮我过一遍。

因为很多需求在评审时,看起来是一个页面问题,但背后其实可能是业务规则、权限、数据、状态、异常没想清楚。

所以当你把需求背景、任务角色、产品目标、老板的想法等喂给 AI 后,我会让 AI 帮我提前检查几个问题:

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

然后 AI 会帮你提前判断:

这个需求是不是清楚?

规则是不是完整?

有没有缺状态?

有没有隐藏风险?

这个页面是否真的需要做?

有没有更轻的实现方式?

AI 可以帮我先扫一遍,让我在评审时更快抓到问题。

2. 再参考:不要让 AI 凭空发挥

进入方案前,我一般还会让 AI 帮我做一轮竞品分析。

但这里的竞品分析,不是让 AI 直接替我下结论。

因为目前 AI 还是会有幻觉,尤其是具体竞品和细节上,不适合完全依赖它。

我现在更常用的方式是,让它帮我寻找竞品方向,并根据我们的业务目标,整理出一张分析表。

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

然后我再根据这张表,逐一去体验真实产品。

我会重点看几个维度:

竞品怎么组织信息。核心入口放在哪里;主操作怎么设计;不同状态怎么展示;异常情况怎么收口;哪些设计可以借鉴;哪些不适合照搬。

如果是 AI 相关产品,我还会额外看:

AI 入口是主入口还是辅助入口;输入引导是否清楚;结果呈现是否结构化;任务是否真的闭环;低置信度、失败、权限不足时有没有兜底。

这一步的目标不是做一份很厚的竞品报告,而是帮我回答一句话:

这个方向,行业里通常怎么做?我们应该借鉴什么,又应该避开什么?

这里也包括参考图:

当我们关键词不够清晰时,什么形容词都不如几张对的参考图来得快。

就像自己做图一样,先找风格参考,再找结构参考。

你可以告诉 GPT Image2:

参考图 1 的视觉风格,参考图 2 的页面结构。

这样它生成的方向通常会比凭空想象更稳定。

3. 做发散:让 AI 先跑多个方向

前面几个阶段做完之后,再进入 GPT Image2 的方案发散。

这个阶段,我现在主要会用四种方式。

1)模糊需求出多方案。

当需求还不够清晰时,我不会只让它出一张图,而是会让它出 3 个方向。

比如做一个金融 App 首页,可以先尝试:

用GPT Image 2做完一个真实UI项目后,我发现AI最难的不是出图

黑金轻透版。

白金轻奢感。

创意空间版。

这样做的好处是,团队可以先基于画面讨论:到底要更像工具、更像服务,还是更像活动运营。

它的价值不是让 AI 帮你决定方向,而是让你更快看到有哪些可能性。

2)参考风格定调性。

当视觉风格还没收敛时,我会让 GPT Image2 参考某类 App 的设计语言,快速校准方向。

比如你想参考滴滴的风格,就不要只说“参考滴滴”。

你可以拆得更具体:

参考它的浅色背景、卡片层级、按钮比例、图标克制感、运营位轻量感。

这样 AI 学到的是设计语言,而不是表面颜色。

3)基于垫图改风格

当已有初稿但风格不合适时,可以用 GPT Image2 做快速调整。

比如:

太卡通,就降低 Q 版感。

太重,就减少投影和复杂背景。

太 3D,就改成轻量扁平。

不够像 App,就降低装饰,突出信息承载。

运营感太强,就弱化氛围,强化内容层级。

这个方式主要用于快速判断:

当前方向是否值得继续深化。

如果 AI 改完之后,方向明显变好,就可以回到 Figma 里继续精修。

如果改了几轮还是不对,说明可能不是风格问题,而是结构或定位本身需要重新判断。

4)草图转视觉方案

当只有手绘草图或粗略想法时,也可以用 GPT Image2 快速生成视觉草案。

比如你在做金融首页时,AI 生成的结构总是不符合预期,这时候可以先手绘一个大体结构:顶部导航、中间主卡片、下面功能入口、底部主按钮。

然后再告诉 AI:根据这个结构,参考支付宝基金类页面的设计风格输出效果图。

这样做的价值是,让模糊想法先变成可以讨论的画面。

它不需要完美。

它的作用是帮助团队快速判断:结构是否成立,信息层级是否合理,风格是否值得继续深化。

4. 再收敛:回到判断和落地

1)让 AI 帮我分析每个方案优缺点

当设计方案已经有了 2-3 个方向后,我会让 AI 再帮我做一轮视觉诊断。这一步不是让 AI 决定哪个方案最好,而是让它帮我把问题拆出来。

比如两个方案都挺好看,一个更有氛围,但信息被弱化;一个更克制,但视觉记忆点不够。

这时候 AI 可以先帮我从信息层级、页面结构、视觉风格、卡片样式、图标统一性、按钮比例、光影氛围、落地成本几个维度分析差异。

最后再由我判断哪个更适合当前目标,所以视觉诊断这一步,AI 不是评委,它更像一个帮我拆问题的助理。

2)Figma MCP 还不稳定

到了设计执行阶段,我也尝试过让 GPT 通过 Figma MCP 直接把方案落到 Figma。

但目前我的体验是:还不够稳定。

如果只是让它 1:1 还原效果图,页面结构、组件比例、细节还原都不太理想。

所以目前在我的 UI 工作流里,我更习惯这样用:GPT Image2 负责生成方向图,设计师负责判断和收敛,Figma 负责最终重构和交付。即梦这类工具可以辅助生成局部素材,比如图标、插画、背景元素。

这样反而更省钱,也更稳定。

目前对我来说,一个 GPT Plus 基本就能覆盖前期大部分方案发散和视觉探索。

AI 不是直接替我完成整套设计稿,而是帮我减少无效试稿。

3)评估阶段

至于设计评估阶段,目前我还没有完全把 AI 加进去。

比如测试用例、交互验收、页面状态检查,我很多时候还是手写更快。

原因很简单:

这个阶段需要非常明确的规则,而 AI 有时候太发散,不够收敛。

如果前面的交互规则我已经整理清楚,手写测试点和验收点反而更直接。

当然,后续这里也可以继续探索。

比如让 AI 根据交互文档帮忙检查:

是否缺少空状态、错误状态、权限状态、操作反馈,是否有文案不一致,是否有前后流程不闭环。

但目前对我来说,它还不是最高优先级。

五、真正的价值

这段时间用下来,我觉得 GPT Image2 对 UI 设计最明显的价值,不是替代设计师,而是帮助设计师更快进入判断。

1. 发散更快

过去在时间紧的情况下,可能只能做 1-2 个方向。

引入 GPT Image2 后,可以更快看到多个可能性,再由设计师进行筛选和收敛。

它的价值不是更快出最终稿,而是更快完成前期方向探索。

2. 试错更低

一些风格轻重、图形比例、构图关系,不需要一开始就在 Figma 里完整绘制。

可以先通过 AI 快速试插画轻重、背景复杂度、颜色氛围、图标风格、卡片形式、运营感强弱。

这样可以减少无效试稿。

3. 沟通更快

很多设计描述本身比较抽象。

比如:金融一点\轻量一点\不要太卡通\更有服务感\不要太抢主视觉。

以前大家只能靠语言想象。

现在先用 GPT Image2 生成方向图后,团队可以基于画面讨论。

不是讨论“你理解的高级”和“我理解的高级”。

而是直接讨论:这张图哪里对,哪里过了,哪里可以保留,哪里需要收掉。

4. 判断更快

AI 生成多个方向后,设计师可以更快对比:

哪个更符合业务目标,哪个更适合页面位置,哪个更符合品牌调性,哪个信息层级更清楚,哪个更容易前端落地。

所以 GPT Image2 并不是替代设计判断,它是帮助设计师更快进入判断。

六、后续探索

最后说一下我接下来想继续探索的方向。

我现在对 AI 进入设计工作流的期待,其实很简单。

1. 我希望 AI 能把重复、费力气的事情先接过去。

比如资料整理、需求拆解、竞品框架、状态枚举、方案初稿、视觉方向发散。这些工作不是没有价值,但它们很耗精力。如果 AI 能先做一轮,设计师就能把更多时间留给真正需要判断的地方。

2. 我希望慢慢打造一套自动化的设计工作流。

但我现在也意识到,自动化不能一上来就追求完整。前提是每个环节都要相对稳定。

比如:需求分析能不能稳定输出;竞品分析能不能稳定提炼;方案发散能不能稳定不跑偏;视觉诊断能不能稳定拆问题;设计文档能不能稳定补状态。

只有这些环节稳定了,自动化才有意义。否则,只是把不稳定的结果更快地产出来。这不是提效,反而会增加返工。

所以我现在对 AI+UI/UX 工作流的理解是:

先让 AI 在单点能力上稳定,再把它串成流程。

GPT Image2 最难的不是出图,而是如何在真实 UI 项目里,变成一个可控、稳定、能被设计师调度的工具。

AI 不是让设计师少思考,而是逼着设计师把自己的判断说清楚。

你越能定义问题、拆清边界、判断方向,AI 才越能成为工具,而不是开盲盒。

收藏 6
点赞 21

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。