

前段时间,我被 Codex 气笑了。
事情是这样的,我让它从一堆 AI 新闻里帮我筛选题。
材料其实挺全的。
有当天新闻,有技术项目,有选题会记录,我还专门写了几条不要碰的方向。
“纯工具清单不要写。”
“只靠官方公告撑不住。”
“太工程化的题,普通读者点不进去。”
我当时还挺满意,觉得这次交代得已经很清楚了。
结果十几分钟后,它给我吐出来一张选题表。
标题、理由、来源、适合人群,全都有。表格做得特别规整。
规整到你甚至会产生一种错觉:这玩意好像真的干活了。
但我扫了两眼,人就有点沉默,因为那些刚刚被我否掉的方向,又回来了。

AI 浏览器插件合集,被包装成“普通人提升信息效率的 10 个神器”。
一个官方更新,被包装成“某某产品彻底改变工作流”。
最让我吐血的是,它不是没看到我的禁区。
它甚至还在自己的总结里非常乖巧地复述了一遍:不要做纯工具清单,不要做信息搬运,要有实操判断。
麻了。
它确实没偷懒,认真读了我的每个要求,然后精准踩中了每个坑。
就像一个加班到凌晨三点还在帮公司制造新问题的实习生。
以前遇到这种情况,我一般会觉得,是不是 Prompt 没写清楚。
那就再补两句规则,再让它重跑一遍。
这次我用仅剩不多的脑细胞思考了一下,为什么会这样?
记忆开了,总结的也挺好。
Skill 装了,规则也写了,整整齐齐,像个艺术品,每次看到都还有点小感动。
但真到干活的时候,agent 好像过来逛菜市场一样。
看完,点点头,嗯,不错。
然后出门继续踩坑。
所以问题来了:一个 Agent 明明有记忆、有 Skill、有规则,为什么还是不够懂你?
这里最容易误判。
Agent 一翻车,人的第一反应通常是继续加东西。
模型换强一点、Prompt 写长一点,搜索、浏览器、知识库、Skill,全给它接上。
像给一个瞎了的人塞了十张地图、三个指南针、两个导航。
然后发现他还是走进了同一个坑。
因为问题不在于它手上东西少。
而在于没人告诉它:
脚下那条不是近路,是让人返工的快捷通道。
很多 Agent 现在最缺的不是信息量,信息多到已经撑爆了上下文。
缺的是交接,就像很多项目不是死在没人干,而是不对齐信息,就热火朝天的把错的活干完了。
所以 AI 需要知道,这件事走到哪了,之前试过什么,哪些方向已经被否掉,哪些判断下一轮还要继续生效。
我又去拆了最近比较火的三个项目 openclaw、Hermes、OpenHuman。
我发现它们其实都在补同一个洞
让 Agent 不只是会干活,而是每次开工前都知道自己接的是哪一棒
1. OpenClaw:别每次像新来的
OpenClaw 大家都比较熟悉。
它没有把所有规则都塞进一个超长 Prompt。
它把开工前该知道的东西拆成了几个文件。

比如 AGENTS.md 写操作规则,USER.md 写用户信息,TOOLS.md 写本地工具怎么用,MEMORY.md 写长期记忆。
这些东西不是聊天里的临时补一句:“你记得按我之前说的做。”
而是放在 Agent 的 workspace 里,每次开工前都重新读。
它会先从这些文件里拿到一个基本现场。
这件事听起来不性感,但很关键。
之前很多 Agent 的问题不是没有工具。
是工具开了,规则也写了,但这些规则没有一个稳定的地方放。
你每次都在聊天框里临时补充,它每次都像临时听懂了。
OpenClaw 至少把这件事往前推了一步:
记忆也不再只是一坨混在一起的东西。这样 Agent 也不是靠缘分记住你了
2. Hermes:干完以后有没有长记性
Hermes 的重点又不一样。
它更关心 Agent 在一个长期运行环境里,怎么查回历史、怎么管理 session、怎么把经验沉淀下来。
这听起来有点工程,但换成人话,就是:这次干过的活,下次别再从零开始。
比如这次查资料踩过一个坑,下次能不能找回来?
这次跑通了一套流程,下次能不能复用?
这次修过一个错误,下次能不能少犯一次?
很多 Agent 现在的问题是,单次任务看起来很强。
但任务一结束,经验就像被风吹散了一样。
它像一个很勤奋的外包,每次都能干,但每次都要重新培训。
Hermes 这类东西提醒我的点是:
Agent 的能力,不能只是当场答得好不好。
还包括干完以后,有没有留下点什么。
3. OpenHuman:记住以后会不会记串
OpenHuman 是最近 github 比较火的一个 agent 项目
它可以接 Gmail、Slack、Notion、GitHub、Calendar 将近 200 个数据源。

它的主战场是个人上下文。
普通 AI 的记忆,像一个大口袋。
你说过什么,它往里塞;邮件里有什么,它也往里塞。塞得越多,看起来好像越懂你,实际上越容易出事。
因为不是所有信息都应该被一视同仁地记住
你上周随口吐槽一句“这个方向别写了”,可能只针对那篇文章。
它下次可能当成你的长期偏好。
你三个月前的做的规划,今天可能已经被新材料推翻了。
如果 Agent 只知道“记住”,不知道“这句话从哪来、属于哪里、现在还算不算数”,那记忆越多,反而越像一锅乱炖。

这就是 OpenHuman 的创新点叫记忆树,它不只关心记住什么
它还关心信息的来源、归属和时间。
这其实正好打中 Agent 记忆最容易翻车的地方。
这三个项目看下来,我越来越觉得:
工具多,顶多只是让 Agent 手上东西更多。
真正让它开始像个能长期一起干活的人,是另外一件事。
它需要知道自己现在是在做哪件事。
是替谁做。
做到哪了。
哪些话要继续听。
哪些坑别再踩第二遍。
所以问题来了。
既然 OpenClaw、Hermes、OpenHuman 都在补这个洞,那直接用它们不就行了?
我的答案是:
先别急。
因为现在比较完善的,还是 Codex、Claude Code、Cursor 这类 Code Agent。

它们能读文件,能改代码,能跑脚本,也能接各种工具,出错概率会小很多。
很多真实任务,最后还是要落到它们手里。
所以主力 Agent 不用换,要补的是旁边那层项目入口。
我自己其实也做了一套更完整的系统。专门管理项目、素材、进度、判断和技能。
但那套东西还是有点太重了。
所以我后来把里面最有用的一层,压成了一个轻量 Skill。
名字就叫:
“接棒”

它不负责让 Agent 变得更会写、更会搜、更会改代码。
它只负责一件更前置的事:
别让 Agent 一上来就动手。
先让它看现场。
每次开工前,它先做四件事。
第一,建现场。

不是开一个空文件夹,而是给项目生成一套固定工作区。
里面有项目现场、判断记录、完成标准、素材索引、待办、接班记录。
这样 Agent 下次进来,不是从聊天框里猜,而是有地方看“这个项目到底走到哪了”。
第二,收材料。
会议记录、网页、PDF、截图、聊天记录丢进来以后,它不只是总结。
它会先判断这份材料属于哪个项目,要不要保存原文,有没有敏感信息,和之前的材料是不是重复。
最后再更新素材索引。
第三,接班开工。

真正开始干活前,它会先读项目现场、判断记录、完成标准、素材索引、待办和接班记录。
然后告诉 Agent:
这次接的是哪个项目。现在做到哪一步、哪些判断要继承、哪些方向别再走、这次什么才算做完。
这一步解决的不是“会不会干”,而是“别一上来就干错”。
第四,收工回写。
任务做完以后,它不会让结果烂在聊天框里。
它会判断哪些东西应该写回项目现场:

进度变了没有、有没有新判断、有没有新否掉的方向、有没有新待办、有没有新产出等等。
但它也不会什么都乱写。
临时想法不能变长期规则,单项目经验不能随便升级成全局方法,敏感材料也不能直接对外复制。
所以它本质上不是一个“任务执行 Skill”。
它更像一个项目接班员。
开工前,把现场交清楚。
收工后,把该留下的东西留下来。
如果你想试,可以去这里下载:
https://github.com/zhu482/handoff-skill
它不是给所有任务用的。
如果你只是让 AI 起个标题、改一句话、翻译一段内容,那没必要。
直接问模型就行。
“接棒” 真正适合的是那些一轮做不完、而且中间会不断变形的任务。。
我自己用下来,最适合三类事。
第一类,是连续项目。
比如内容创作、产品方案、客户方案、选题研究等。
这类任务不会一轮做完,中间会不断填充新内容、改方向、加素材。
第二类,是材料一直在增加的任务。
比如会议记录、网页资料、PDF、截图、用户反馈。
它不只要总结,还要判断这些材料改变了什么进度、判断和待办。
第三类,是过程中会产生取舍的任务。
比如“这个方向不要写”“这个案例只能当弱证据”“这个方案看着快但会跑偏”。
这些话如果只留在聊天里,下次就很容易失效。
当然它也有很大的局限。
它更适合轻量连续任务。
比如创作、研究、方案、项目管理、材料归档。
不适合直接拿来管特别大的代码工程。
另外,Skill 调用本身也不一定稳定。
有时候你还是得明确提醒它,先读现场,它才会真的按流程走。
所以它不是一个“万能 Agent 管家”。
它更像一张开工清单,提醒 Agent 每次开始前先看现场,结束后别把该留下的东西丢在聊天框里。
但如果你只是想体验一下“Agent 不再从空白聊天框开始”的感觉,它已经够用了。
但这件事对我真正重要的地方,不是我又多了一个 Skill。
我后来越看越觉得,Agent 这波东西真正难的,不是执行。
执行这层,它早就在补了,甚至已经做的不错了。
真正难的,是意图保全。
管理里有个词,叫 shared mental model。
共享心智模型。
这个词听着很学术,其实说白了就是:
一起干同一件事的人,脑子里有没有同一张地图。

为什么同样一堆资料,换个人接手,事情立刻开始变形。
因为资料只能告诉你“发生了什么”,不会告诉你如何判断
如果这张地图没对齐,表面上是在接同一个任务。
实际上每个人接到的,都是自己脑补出来的那个版本。
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。








发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
UI设计精品必修课
已累计诞生 792 位幸运星
发表评论 为下方 1 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓