


这是一个在线红白机游戏厅。133 款经典游戏,直接在浏览器里就能玩。魂斗罗、超级马里奥、俄罗斯方块、塞尔达、双截龙......全都有。有封面、有分类、有搜索,打开就能玩,还带 CRT 老电视的扫描线效果。
这个网站从零到完成,花了 45 分钟。
不是我一个人做的——我开了3个AI队友,一起搞的。
昨天 Claude 发了新的旗舰模型 Opus 4.6,OpenAI 也几乎同时发了 GPT-5.3 Codex,两家只隔了 20 分钟。模型层面的对比我就不展开了——100万Token上下文、ARC AGI 2翻倍、自适应思考这些,估计你在各家评测号都看过了。

但我盯上的是 Opus 4.6 里一个叫 Agent Teams 的新功能。简单说就是,AI 不再是一个人给你干活了,它可以组队。
所以我特意做了个包含多个模块开发配合的实验。
在说我自己的实验之前,得先聊聊 Anthropic 官方给的案例。因为看完那个,我才动了心思。
他们工程团队发了一篇博客,标题是「Building a C compiler with a team of parallel Claudes」。

用 16 个 Claude 实例并行工作,花了大约两周,跑了差不多 2000 次 Claude Code 会话,烧了大约 2 万美元。
产出?一个 10 万行 Rust 代码的 C 编译器。
这个编译器能干什么?能编译 Linux 6.9 内核(x86、ARM、RISC-V 三个架构都支持)。能编译 QEMU、FFmpeg、SQLite、PostgreSQL、Redis。GCC 的 torture test 通过率 99%。
甚至能编译并运行 Doom。

说实话,看到这个案例的时候我愣了一下。
让我愣住的不是结果——10万行代码的编译器,厉害,但也就是「厉害」。让我愣住的是方法。16个AI各管一摊,通过文件锁同步代码,通过git协调版本,各自认领任务、完成、提交。
你品一下。
其实开多个 Claude Code 窗口去搞多个项目,或者同时设计一个项目的多个模块没啥奇怪的,我之前也整天这么干了。但在 Agent Teams 这个概念里,多个 Agent 之间会相互协调配合,分别去处理不同的任务,然后再组合和测试,这点让我觉得很有趣。
相当于人类不需要再成为 AI 写代码速度的瓶颈了,AI 已经能自己踩着自己往上飞了...
16 个 Agent、2 万美元、两周,这是大工程的玩法,我是没法为了测试去搞这么久,我没这耐心,两周后天知道又有什么模型出来了。
但我想知道的是,普通人拿这功能做个小东西,到底行不行?速度是不是真的能更快。
选什么项目呢?
我想到一个事。之前做小猫补光灯 App 的时候,为了藏一个开发者模式入口,我用了红白机游戏里经典的作弊码方式——在设置页面用特定顺序点开关来激活。当时还在即刻发了一条:「玩过红白机游戏的都不陌生,就是通过左左右右BABA之类的特殊按钮方式调出开发者模式。」
那不如就做个红白机游戏的网站吧。一个在线的 FC 游戏厅,能直接在浏览器里玩那些经典游戏。
要求也简单:至少 100 个能直接运行的游戏,有封面,有分类,界面要好看。
打开 Claude Code,先开启 Agent Teams 功能(目前是实验性功能,需要在 settings.json 里手动打开),然后我就说了一句话:
创建一个团队,3 个 teammate 并行完成以下任务,建一个红白机游戏的导航站,上面有丰富完整的红白机游戏功能,至少包含 100 个可直接运行的游戏。

Claude 想了一下,给我解释了为什么不建议用太多队友:
文件冲突——人太多容易互相覆盖代码。协调开销——队友越多,沟通成本越高。Token消耗——每个队友都是独立的Claude实例,10个就是10倍成本。
它建议 3 个。我觉得合理。
然后它自动创建了 3 个队友:
- emulator-dev:负责模拟器核心引擎——封装jsnes库,处理60fps画面渲染、Web Audio音频输出、键盘输入映射
- ui-dev:负责整个前端界面——HTML骨架、CSS样式、游戏卡片网格、搜索、分类筛选、播放器弹窗
- data-dev:负责游戏数据库——整理100+款游戏的元数据,包括中英文名、年份、分类、评分、ROM文件名

这三块互相不挨着。模拟器不用管有多少游戏,游戏数据不用管模拟器咋工作的,界面只管调接口就行。
然后三个队友就各干各的了。我在旁边看着。
emulator-dev:模拟器工程师
这个队友把 jsnes 这个 JavaScript NES 模拟器库包了一层 TypeScript。
核心做了几件事:
一个 NesEmulator 类,管游戏的生命周期——loadRom、start、pause、reset、stop。画面渲染用requestAnimationFrame跑60fps,把NES原生的256x240像素逐帧写到Canvas上。
音频用 Web Audio API 实现。采样率 44100Hz,用 ScriptProcessorNode 处理音频缓冲。虽然 ScriptProcessorNode 已经被标记为 deprecated 了,但它兼容性最好,这个选择挺务实的。
键盘输入做了防冲突处理。玩过网页游戏的都知道,方向键会让页面滚动,Enter 会触发按钮点击,Tab 会切焦点。它把这些按键全拦截了,还做了双人游戏的按键映射——玩家1用方向键+ZX,玩家2用WASD+GH。
ui-dev:前端设计师
这个队友做的界面我确实没想到会这么好看。
整体是暗黑主题加 NES 经典红色(#e60012),有一种复古街机的感觉。
几个让我印象深刻的细节:
CRT 电视开机动画——打开游戏的时候,画面会模拟老式电视机的开机过程,先是一条水平亮线,然后逐渐展开成完整画面。
扫描线效果,用 CSS 实现的,1px 宽的半透明黑色条纹反复叠加,看起来真的就像老电视。画面四周还有边缘晕映,微微变暗,模拟 CRT 显示器的那种感觉。

游戏卡片细节截图,展示悬停发光效果
游戏卡片做成了仿 NES 卡带的样式。顶部有一条红色边纹,悬停的时候会发光。封面是 4:3 的比例,没有封面的游戏会显示一个大字母缩写加分类标签作为占位。
搜索支持中英文模糊匹配。分类有 12 种——动作、冒险、RPG、益智、体育、射击、平台、格斗、赛车、策略、模拟、经典。
全屏模式也做了。ESC 退出。

data-dev:数据库管理员
这个队友整理了 133 款游戏的完整数据。每款游戏都有英文名、中文名、发行年份、分类、描述、玩家人数、ROM 文件名、评分。
游戏列表挺全的。超级马里奥三代、魂斗罗、俄罗斯方块、塞尔达传说、银河战士、勇者斗恶龙系列、洛克人系列、忍者龙剑传、双截龙、热血系列、三国志系列......
133 款,覆盖 12 个分类,每个分类至少 5 款。
同时还给 127 款游戏配了真实的盒装封面图,从 libretro 的 CDN 上拉的。只有 6 款没找到封面。
45 分钟。
Vite + TypeScript + jsnes,133 款可直接运行的 NES 游戏,127 张官方游戏封面,CRT 电视模拟效果,12 种分类筛选,中英文搜索,双人游戏支持,全屏模式,响应式布局。
总共 4700 多行代码,188MB 项目文件(主要是 ROM 和封面图片)。
已经推到了 GitHub:github.com/alchaincyf/nes-arcade

如果让我一个人从零做这个,不用 AI,天知道要多久了,我真写不了。
用单个 Claude Code 会话做,可能也要 2-3 小时——因为任务之间有先后,模拟器做完才能做界面集成,数据整理好才能测试。
Agent Teams 的好处就在这——三个队友同时干,谁也不用等谁。最后代码合到一起也没出什么问题,除了要求了几次在用户体验上再优化优化,实际部署的bug是一次没出现过。
用完这一次,有几个感受。
第一,3 个队友确实是这种规模项目的最佳数量。
Claude 自己也解释了为什么不用更多——文件冲突、协调开销、Token消耗都会随人数线性增长。3个队友各管一摊,互不干扰,是最高效的配置。Anthropic那个16人写编译器的项目,是因为编译器本身就是一个巨大的工程,需要那么多并行的工作面。
第二,分工的关键是「无依赖」。
模拟器引擎、前端界面、游戏数据——这三个方向天然就不挨着。如果我让一个做前端、一个做后端、一个做测试,后两个就得干等着。所以拆任务的时候得想清楚,让它们能同时跑起来。
第三,成本确实高。
Agent Teams 的 Token 消耗大约是普通会话的 7 倍。这个项目跑下来,Token 用量不少。对于日常的小修小补,还是单会话更划算。Agent Teams 适合的是「从零开始做一个完整项目」这种场景。
第四,AI 选择 jsnes 作为模拟器是个挺聪明的决定。
我没指定用什么技术栈,只说了「红白机游戏导航站」。emulator-dev 自己选了 jsnes——一个纯JavaScript的NES模拟器,API简洁,社区成熟,TypeScript类型声明可以自己补。如果换成更复杂的模拟器方案,45分钟大概率搞不定。实际体感非常丝滑,我还特意上网查了查相似的模拟器游戏网站,真没见过比我这加载速度快的。
其实这个玩法并不新。去年就有人手动开好几个 Claude Code 窗口,一个窗口一个任务,人肉版 Agent Teams。
Agent Teams 把这件事产品化了。你不用手动开窗口、手动分任务、手动合代码。一句「建一个团队,做这件事」就够了。
Anthropic 的一个产品负责人 Scott White 在发布会上说了句挺有意思的话:「We are now transitioning almost into vibe working.」
Vibe coding 大家都知道了——你对AI说「帮我写这个功能」。Vibe working更进一步,你对一个AI团队说「帮我把这个项目做了」。
今天这 45 分钟,我确实感受到了这个区别。
不过有一点,能不能用好这个功能,关键其实不在编程能力,在于你能不能把一个大活拆成几个互不干扰的小活。说白了是项目管理的能力。
话说回来,上上下下左右左右 BA,调出的不是 30 条命,是一个 AI 团队。
如果你想看看我这个网站究竟咋样的话,欢迎通过下面的链接体验
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。




发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
DeepSeek实用操作手册
已累计诞生 779 位幸运星
发表评论 为下方 1 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓