
等了很久、很久、很久。
也期待了很久、很久、很久的Gemini 3 Pro,终于在昨天晚上,正式上线了。
往期回顾:

之前回回都有新消息,回回都是误传。
尤其是大模型竞技场的情况,之前就有传言说那俩叫 lithiumflow 和 orionmist 的模型可能是Gemini 3 pro,网上铺天盖地的全是看起来特酷炫的SVG图,声称这是Gemini 3 pro的水平。

然后,从9月到10月再到现在,11月都过一半了,这俩模型也没啥人提了。
后来网上又出现了一个Gemini3候选选手,叫riftrunner。
又被很多网友称为Gemini 3。
那一颗心,就是躁动不安。
讲真的,我已经在无数的地方,吹过曾经的Gemini 2.5 Pro了。
这就是之前,最有人味、文笔最棒、创意最好的大模型。
虽然在人味上最近被GPT 5.1-Thinking有一点点超越,但是我还很喜欢。
但现在,在相隔了238天之后,Gemini 3 Pro,终于来了。
而在实测之后,可以说,这就是2025年,最牛逼的模型。
即使我对他已经抱有了极高的预期,我依然还是觉得,Google还是太强了。
目前,在所有主要Arena排行榜中,几乎全部排名第一。

绮灿王道。
现在,Gemini 3 Pro你在AI Studio里就能用到。
网址:https://aistudio.google.com/

Google Gemini网页版也已经上线。
说实话,Gemini 3 pro的跑分上,这次属实是有点强的离谱了。
直接给我看懵了。

几乎所有的指标,都是断层领先,除了软件工程能力上,比GPT-5.1和CLaude Sonnet 4.5差一点,其他的,全都是断档的存在。
真的,这张表里的数据,我看第一眼的时候,我以为我熬夜熬多了眼睛熬花了。
第一行,Humanity’s Last Exam,这一年非常著名的评测集。
就是那种把各种学科里最变态、最抽象的题,合并在一块,号称人类最后的考试。
在这张卷子上,Gemini 2.5 Pro只有21.6%,Claude Sonnet 4.5是13.7%,GPT-5.1是26.5%。
Gemini 3 Pro,37.5%,开了工具使用之后,直接干到了45.8%。
离谱。
但这个还不是最离谱的。
下面那个MathArena Apex,这个可以理解为超难奥赛压轴题专场。
GPT-5.1,我们心目中的在逻辑上已经很牛逼的模型了,在这个考试里,只拿了1分。
Claude Sonnet 4.5,1.6分,Gemini 2.5 Pro,0.5分。
而而Gemini 3 Pro,拿了23.4分。
我当时真的以为我眼睛花了。
尼玛,结果真的是这个数。
这就像是一个小学生还在掰手指头算加减法,旁边的大学生Gemini3已经开始用微积分徒手搓火箭了。。。
ScreenSpot-Pro,一个专门用来折磨多模态模型的 GUI Grounding(界面定位)评测集,而且是偏专业场景+高分辨率大屏那种地狱难度。
GPT-5.1:3.5%,Claude Sonnet 4.5:36.2%,Gemini 3 Pro:72.7%。
Gemini 3 Pro在做电脑操作这个角色上,是毁灭级的强,它几乎能精准地识别屏幕上的每一个按钮、每一个图标、每一行字。
以后那种让AI帮你操作电脑干活的Agent,说实话,Gemini 3 Pro就是唯一的真神。
但这些,我觉得,都没有办法体现Gemini 3 Pro的牛逼,因为它这次最秀的。
是前端代码能力。
屌,直接是屌炸天了。
先给大家,看一些简单的小场景。
比如,这个Prompt:
设计并创建一个非常有创意、精致且细节丰富的体素艺术场景:一只胖乎乎的奶龙坐在一座美丽的花园中央,旁边是小池塘、石灯笼和弯曲的小路,周围长满树木,其中包括几棵盛开的樱花树。让整个场景足够震撼、层次丰富,在不同高度和区域布置各种小细节,比如长椅、小桥、石子路、草丛、花坛等,并使用色彩丰富的体素来表现。可以使用任何库来完成这个效果,但要确保我能把所有内容粘贴到一个单独的 HTML 文件中,并直接在 Chrome 中打开。JavaScript 库的引入方式请使用 importmap 和 ES 模块(ESM)导入。
Gemini 3 Pro代码写的究极快,十几秒就写完了。

我们直接,来预览一下这个项目。
虽然它这个奶龙,好像做的一点也不奶龙,但是这个交互,是真的有点过于丝滑了。

我又随手,开发了一个台球游戏网球。

结果出来以后,当时我就看懵逼了。
不是,你这个真的是双人对局啊?你这个物理引擎,玩真的啊???
我就真的只说了一句话啊,连roll的过程都没有,你这个完成度,我觉得稍微有点过分了吧。。。
前端猛炸了。
再来看点,更实际一点的,前端开发案例。
比如,直接开发一个,网页音乐播放器,Prompt:
做一个模拟黑胶唱片的极致写实的音乐播放器,把音频频谱和节奏可视化成炫酷的图形,功能区在底部,可以调节音量。

一个还比较好看的网页音乐播放器就做出来了,我去Suno上随手生成了一首歌曲,传了上去。
享受,所有的功能都是对的,还有一个非常小的细节,就是当我点击播放的时候,唱臂就会移到圆盘上的位置,显示开始播放。
这个细节,很用心了。
比如,再做一个像素画板,支持绘制、撤销、导出 GIF,并能“回放”作画过程动画。
一次成功。
这些都不是我调了十几轮,来回磨的结果。
就是非常简单粗暴的一句话,Gemini 3 Pro直接给我整个做完了。
而且,得益于原生多模态,所以,图转代码的复刻能力,真的极强。
比如我想把一个网页的截图,复刻一下。
我就可以直接传一张图上去,然后,写上我希望的样式。
然后,你静静的等着就好,二十几秒过去,一个前端网页,就开发完了。

你会看到,区别最大的是字体,原图的字体是类似于DIN的有版权字体,而Gemini 3 Pro,是用了无版权字体替代,所以看着不太一样,还有部分的细节也有点问题。
但是,整体的布局、样式,都已经可圈可点了。
坦率的将,我自己曾经也在厂子里合作过不少前端,很多前端开发,能在第一次设计走查时,给你写成这个样子。
我一般就直接跪在地上磕头了。。。
还有另一个复刻的案例,比如群友AI产品银海的,脑洞是真的牛逼。
他说,这个他困扰多年的问题,终于可以解了,直接找到一个普通的图扔进去,复刻成一个可以编辑的前端,就能直接能重排。
而让我觉得最离谱的一个case,其实就是我随口的一句Prompt:
设计并创建一个类似 Windows 操作系统的 Web OS,具备完整功能:从文本编辑器、带 Python 的终端、代码编辑器、可玩的游戏,到文件管理器、画图工具、视频编辑器,以及所有重要的 Windows 系统预装软件。可以使用任意库来实现,但务必确保我能把所有代码粘贴进单个 HTML 文件里,并直接在 Chrome 中打开运行。让整体效果有趣、细节丰富,呈现出超出常人预期的细节,在一个代码块中尽情发挥创意与美感。
对,你没看错,是直接,造一个类似window的web os,生造一个系统。

这次的代码,写了很久很久。
写了将近2分钟。
当我点开运行的那一刻,我人又傻了。
兄弟,这不对吧???

我最开始,以为,这些功能,是装饰,是不可用的,毕竟以前vibe coding玩多了,看到这样玩意,你大概率也知道,这些功能,是跑不了的。
但是结果。。。
我发现,这里面大部分功能,都是实现了的,复杂的vs code这种确实很难搞,但我还是觉得,卧槽了。。。
这一次Gemini 3 Pro的能力是惊到我了。
难怪这次,连奥特曼都久违的下场,为Google庆祝。

我们这一代人,可能刚刚站在了一个非常离谱的起点上。
从今天开始,会不会写前端这件事,可能真的没那么重要了。
会不会调框架这件事,也没那么重要了。
重要的,变成了:
你能不能把一个场景,描述得足够具体、足够细节、足够有人味,
能不能把那些本来只敢在脑子里想想的东西,翻译成一句一句明确的请求。
你以及,你是不是,有足够的品味。
当我们在这里一边吐槽、一边兴奋、一边跑demo的时候。
那个未来其实已经慢慢开始往你脚底下挪动了。
238天的等待,值了。
所有的不安和嘲笑,在这一刻,都成了最好的背景板。
Google,依然是那个Google。
绮灿王道。
让我们,开始创造吧。
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。




发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
AI辅助海报设计101例
已累计诞生 765 位幸运星
发表评论 为下方 1 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓