

这两天,我认真测了下刷屏的 Google Stitch。
伴随着各种演示视频,网上再次充斥着“UI 设计师要彻底失业”的论调。
为了看清它在真实设计链路里到底能跑多远,我做了三组连环测试。
测完之后,我的核心结论其实很简单:
Google Stitch 是目前顶级的“方案发散工具”,但它目前还接不了严谨的落地设计。
为了验证这一判断,我用 3.0 Flash 模型做了三组“套娃式”连环对比:

首页统一选择3.0Flash 模型

三组测评方向
测完后我发现,Stitch 的表现规律非常明显:越自由,它越强;越有约束,它越容易变笨
先说 A 组。
这一组也是目前网上最容易刷到、最容易让人“哇塞”的部分:输入一段 prompt,页面几秒出图,酷炫的设计稿秒出。
C 端和 B端的提示词展示(注意:每一次的测试为了减少可能存在的影响因素,都是新开一个项目重新输入提示词的)

A 组针对 C端的纯文本生图

A 组针对B端的纯文本生图
我分别拿了一个 C端首页和一个 B端工作台首页测试,结果都不差:
C 端首页的整体氛围、模块关系、视觉节奏都挺顺, B 端虽然还有排版瑕疵,但第一眼也已经有“成熟后台”的感觉了

A 组针对 C端的测评结果

A 组针对 B端的测评结果
把两个结果放一块展示下,为什么这一步 Stitch 表现最好?

A 组完整的测评结果
因为纯文本阶段,本质上是在做一件事:
从 0 到 1 找方向。
这个阶段没有原型约束,它可以自由组织页面结构、模块关系、视觉节奏和氛围感。
所以它特别擅长做这些事:

如果你的目标是:先看几个方向、先找感觉、先把页面氛围跑出来,那 Stitch 确实很好用。
一句话总结 A 组:Stitch 在“方案发散”这一步,确实很强。
第二步,我把 A 组生成的页面抽成低保真原型,再喂回去让它按原型生成。
这一组是最关键的,因为它更接近真实工作场景。 真实设计里,很多时候并不是“完全从零开始”,而是基于现有的原型或者业务框架,有字段和模块的约束等等。
设计师的核心任务就是在约束下把页面真正设计好,而 Stitch 在这一步,问题就开始明显了。

B组针对 C端的关键词

B组针对 B端的关键词
C 端页面的问题
C 端页面还能做出来,但已经没那么聪明了。
先不谈页面的效果如何,最简单的就是看功能是否完全按原型的来。对比发现,C 端页面在根据原型画图的过程中,局部细节会自己乱发挥
最明显的感受,页面留白变大了,首屏屏效明显过低, 某些模块虽然“在”,但没有被真正设计好 。
也就是说,它不是完全不会做,
而是:能把原型“做出来”,但还做不到把原型真正“设计好”。

B组针对C端的生图结果
B 端页面的问题
B 端这里问题更明显。
它已经能把页面推到一个“70 分方向稿”的程度,但如果你认真看,会发现,模块之间的布局依旧有很大的优化空间,警告信息区占比不合理,很多地方仍然停留在“把结构摆出来”这一层。
这种结果在实际项目里是不能直接交付的,后面还得靠设计师自己去收整个版面信息布局。

B组针对B端的生图结果
这一步让我最确认的一件事就是:一旦进入“有结构约束”的阶段,Stitch 的能力会明显下降。
它不再像一个会主动思考的设计师,更像一个开始机械执行的工具。
而且还有一个现实问题是:
我这次喂给它的原型,已经算是很规整、很干净的版本了。真正项目里的原型,通常更乱、更碎、信息密度也更高。真把那种原型直接丢进去,效果只会更拉。
看下B 组原型生图的具体效果对比:

B组低保真生图效果对比
所以 B 组真正说明的问题是:它能把原型“做出来”,但还做不到把原型真正“设计好”。
第三步,我又拿 A 组里已经生成出来的高保真页面,让它继续做 redesign。

C组针对 C端的redesign关键词

C组针对 B端的redesign关键词
这一组的结果比 B 组顺眼很多,完成度也明显更高。
无论是 C 端还是 B 端,都能看出 Stitch 在高保真参考下更容易保住页面的整体气质、视觉统一性和完整度。

C组 针对C端的生图结果

C组 针对B端的生图结果
这说明一件事:当你给 Stitch一个已经比较成熟的视觉锚点时,它会做得更像样。
但问题也很明显:它更像是在做视觉重绘 / 风格迁移,而不是真正的深度 redesign,理解需求结构、判断主次关系等。也就是说,它会更“像”,但不一定更“懂”。
所以 C 组并不能说明它已经具备成熟的 redesign 能力,只能说明:在高保真参考足够完整的情况下,它能把结果做得更体面。
如果把这三组测试放在一起看,Stitch 的能力边界就非常明显了:
A 组:纯文本生成
最适合做方案发散,最容易出亮点。
B 组:低保真原型约束
一旦进入结构约束,它就开始从“设计”退化成“执行”。
C 组:高保真参考 redesign
完成度会提升,但更像延续风格,而不是真正重构结构。
也就是说,Stitch 最擅长的,不是“接管设计”,而是在没有太多约束的时候,快速把方向跑出来。

这也是为什么它现在会让很多人产生错觉:“它是不是已经可以替代设计师了?”
其实不是,更准确的说法应该是:
它已经能极大强化设计流程中的“发散阶段”,但在“收敛阶段”还远远不够稳定。
前面几组测试让我越来越确认:Stitch 不太擅长从原型出发,稳定地做出成熟页面。
但当我把任务换成另一种,不是让它“根据原型做设计”,而是让它“尽量复刻已有设计稿”,它的表现反而明显变强了。
比如我拿一张成熟的 B 端商家后台首页去测,发现它在这些方面的还原度都不低,左边是参考,右边是复刻的页面。
可以看到基本都复刻出来了,而且这个页面可以复制到 figma 里直接编辑。

页面复刻案例
这件事特别有意思。因为它说明:Stitch 未必擅长“理解原型”,但它很擅长“模仿结果”。
换句话说,它现在更像一个很强的页面生成 / 页面复刻工具,而不是一个已经成熟的原型到设计稿工具。
不过这一点我不准备在这篇展开,因为它其实值得后续单独写一篇。
我测完之后,最大的感受不是“设计师安全了”,也不是“设计师完了”。
而是终于看清了:AI 会先重构设计流程里的哪一段。
目前来看,答案很清楚:Stitch显著增强的,是发散阶段。比如方案探索、概念稿生成、方向稿输出等等。
Stitch暂时接不住的,是收敛阶段,比如复杂结构判断 、主次关系取舍 、真正可交付的设计稿精修。
所以 Stitch 对 UI 的冲击当然是真的,但它先冲击的,不一定是“设计师”这个角色本身,而是设计流程里那些更偏生成、发散、方向探索、风格迁移的部分。
而真正难被替代的,还是那部分:理解问题、组织结构、做取舍、最后收口。

如果你最近也被各种“UI 要被替代了”的内容搞得有点焦虑,我想说的是:先别急着自己吓自己。
Stitch 现在最强的,还不是“替你完成设计工作”, 而是替你更快生成创意页面、发散方案。
至于真正难的那部分,这一天也许会到来,但在它真正到来之前,设计师还有一段不长不短的过渡期。
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。




发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
用户体验设计核心问答
已累计诞生 785 位幸运星
发表评论 为下方 3 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓