

本来 Nano Banana 生图已经很强了...直到最近 Arena 上,一个代号叫 duct-tape 的神秘模型悄悄冒头。没有官宣,没有发布会,名字听着甚至有点像内部随手起的测试代号,但社区很快就把它和 OpenAI 下一代原生图像模型联系到了一起:GPT-Image-2。
这个模型够炸裂,原因也很简单:过去一眼 AI 生图,现在那些最容易穿帮的地方,被迅速补平了。
我放几组网友测试图感受一下:

怎么样?GPT-image-2的图以假乱真的程度,我是已经分不清了。
先说结论:OpenAI 已经在 GPT 里偷偷灰度测试了,效果与Arena上测试匿名模型一致!

最早线索,回顾早前 Arena 上也出现过几组匿名模型:maskingtape-alpha、gaffertape-alpha、packingtape-alpha,这两天又演变成 duct-tape-1/2/3,这种命名本身就很像内部灰度测试,后来有网友爆料是GPT-image-2,社交平台迅速出现一批批实测案例,瞬间网友情绪点燃了!
第二个线索,OpenAI 已经在 GPT 偷偷灰度测试了(需会员),实测下来不管是模型风格、文字能力、真实感和世界知识,都明显越过了旧一代 DALL·E 的表现,也和大家熟悉的那批独立生图模型拉开了距离。
第三个线索,「duct-tape (胶带)」这个代号听上去像玩似的,但放回能力表现里看又很写实。顾名思义,把以前 AI 生图里最容易崩的地方:文字、界面、手写、复杂细节等,现在像被胶带一块块重新粘牢。
几条线索叠起来,大家已经默认这就是 OpenAI 下一代图像模型 GPT-Image-2 。
如果你现在就想碰碰运气,最靠谱的入口还是 Arena 的图像盲测,免费。
方式一:在 Arena 随机匹配(靠运气)
- 打开 https://arena.ai/
- 进入 Battle Mode 模式
- 直接输入提示词生成,多发几次,系统会匿名分配模型,有一定概率碰上 duct-tape
还有一个“邪修”打法:上传 2 张空白图再发提示词,据说命中率会明显提高。这个说法没有官方确认,但已经有不少人在拿它当土办法反复试。(我实测3次,2次命中!)

方式二:在 GPT 图像生成中随机触发
X 上已经有不少用户反馈,在 GPT 的 Images 功能里生成复杂图像时,系统会随机切到新版模型,输出质量会明显高于 GPT Image 1。
这条路同样需要运气,完全系统灰度测试,你能做的,只是把题目尽量往复杂任务上靠,然后多试几次。

这部分只把 GPT-Image-2 自己拉进 8 组最接近真实需求的题目里看,部分来自网友实测结果。测评覆盖电商素材、平台截图、复杂 UI、长文字海报、多人复杂场景、手写笔记、游戏界面等。题型越往后走,一个感受越明显:GPT-Image-2 这次最可怕的,不是审美突然暴涨,而是它开始越来越像一台能进入真实工作流的图像引擎。
第一组:直播/平台截图
这组专门测平台感,看模型能不能把“直播间正在发生”的气氛搞起来。测完后,我高度怀疑它把整个抖音吃了;平台感、直播感还原度很高。

Prompt:Screenshot of YouTube. It is an OpenAI livestream where they introduce their first humanoid robot

Prompt:生成一个抖音直播的截图 里面是一个戴着青色鸭舌帽的短发美女在直播,鸭舌帽上写着AIXZD,头发右侧有一撮青色头发,美女手里拿着牌子,上面写着:谢谢Sunkim的大火箭! Prompt:生成一个抖音直播的截图 里面是一个美女在直播
第二组:海报
这一组我们拿出海报、报纸、课本、菜谱做测试, GPT-Image-2 这类题的压制感很强,文字和版式更容易长在一张图里。




第三组:UI界面
这组继续往结构理解上压。多模块页面、按钮层级、导航区和信息卡片并存时,很多模型都会局部看着不错,整页一看就散。GPT-Image-2 这类题最值得看的,是它整体更成立,局部也没那么容易提前崩掉。

Prompt:Screenshot of a music generator feature inside GPT

Prompt:A website that sells pink glittering fairy milk and deep blue cosmic milk. dark mode. glassmorphism. minimalist and clean

Prompt:Screenshot of GPT in 2028
第四组:写实现场感
这组主要看真实世界细节。门店灯牌、玻璃反光、地面材质、环境光和远处的小信息都很容易让模型露馅。GPT-Image-2 在这些地方更顺,整张图的空间关系和材质逻辑更完整。

Prompt:Sam Altman, Donald Trump, and Elon Musk working behind the counter of a busy movie theater

Prompt:A Microsoft event where Satya Nadella points at a slideshow that indicates Microsoft Edge is the number one browser to download Google Chrome

部分清明上河图的写实复原
第五组:游戏界面
GPT-Image-2 在这类题里更像已经开始理解游戏界面的信息组织方式,尤其是 HUD 层级、按钮分区和视觉重心更容易同时成立。

Prompt:A Hitman level where you are in the OpenAI HQ and your mission is to steal GPT-6 without getting caught

Prompt:A Hitman level where you are in the OpenAI HQ and your mission is to steal GPT-6 without getting caught

第六组:手写笔记 / 白板记录
这组看的是过去最容易翻车的老题型。因为手写内容本身就要求文字形态、纸面结构和书写痕迹一起成立,一旦不顺就会立刻穿帮。GPT-Image-2 在这里的进步很直观。



第七组:电商产品图
这组先看最接近商单交付的任务。重点不在“漂不漂亮”,而在“像不像能直接拿去卖货”。GPT-Image-2 在这类题里最明显的变化,是产品边缘、反光、文案区和画面重心开始同时变稳,整张图更像一份可直接进入投放流程的素材。


Prompt:这是我的商品「AIXZD鸭舌帽」,做一个淘宝详情页的长图,突出商品特色、卖点、商品规格信息。
以上全部是本次实测案例,部分来自网友作品(如未标注,请认领,谢谢!)
当我测完和看完网友的案例后,我感觉 GPT-Image-2 已经开始把很多高难任务做得更像“可交付的结果”。如果这个方向继续成立,那么 AI 生图接下来的竞争重点,拼的就不只是审美,而是生产力。
过去几年,AI 生图的进步主要看谁“更会画”。GPT-Image-2 这次更像往前迈了一步:它开始学会怎么把图做得更像现实世界里真的存在过。
不过麻烦的点也在这里...
虽然现在AI还会存在一些瑕疵需要人类修复,但是当文字、界面、手写、材质、反射这些最容易露馅的细节被一项项补齐,AI 图像领域就会发生质变。
以后被拿来比较的,不只是审美,还有交付能力——能不能直接拿去做海报、封面、商品图、UI 原型,甚至顶掉一部分原本必须靠真人、摄影或设计团队兜底的工作。
从这个角度看,duct-tape 这次冒头,确实让很多普通人虎躯一震。意味着:
AI 生图,正式进入下一个「生产力」阶段。
看完这篇文章,你第一反应会是兴奋,还是心里有点发毛?
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。




发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
AI+Photoshop智能图像处理
已累计诞生 789 位幸运星
发表评论
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓