体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

全文速览图

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

前天晚上,我的微信账号,终于拿到了微信小微的内测资格。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

无论怎么说,微信这种十几亿日活国民级别的产品,全面拥抱AI,我觉得在整个互联网行业,都是一个巨大的信号,也是值得大家研究的案例。

在深度玩了一天以后,我想说,微信Agent在跟微信原生能力的打通上,有很多超出我预期的部分,但是在智能程度上,也有蛮多不及我预期的部分。

但是我依然愿意称,这是微信有史以来最大的更新。

还是先聊聊功能上。

当你获得小微的体验资格以后,它就会常驻在你的左上角了,替代了原来的星标区域。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

点开以后,其实就是一个大家每天都会见到的对话框。

默认进来是语音输入,点击一下才会变成文本输入框,然后支持上传照片、调起摄像头拍照、以及上传文件。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

在这个对话框里,你可以直接调用大模型来跟微信的很多原生能力进行交互。

小微背后的基座模型,应该是两个,一个是主模型WeLM,这是微信自己做的,另一部分偶尔会借助DeepSeek模型来进行回复。

WeLM目前没有太多的数据,只能通过官方年初发布的部分信息看出端倪。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

之前透露出了两个模型型号,一个是WeLM-V4-80B的MoE,激活参数量是3B,一个是第三代的,WeLM-V3-258B,激活22B的MoE。

坦率的讲,微信的算力压力还是巨大的,因为我觉得微信很难在这块进行收费和商业化,他们大概率自己也还没有想清楚,现在内测人数不多,他们还是能扛得住的,但是如果真的哪天全量了,那可是14亿的用户,这个数量级的用户的推理需求,我感觉国内哪家公司可能都抗不住。

这就是AI时代和互联网时代最大的不同,互联网时代用户的边际成本几乎为0,但是AI时代,那不好意思,每一个用户,那真的背后都是白花花的钱。

这也是我为啥看好端侧算力的原因,因为只有这样,才能让所有用户,享受到真正的AI普惠。

从我的测试直觉上,这次的WeLM有可能就是这个80B激活3B的小模型系列来进行服务的,所以从这个参数上来说,你就不能指望它能完成多么复杂的任务。

这个对话框中,目前支持蛮多的功能。

比如一个很多很多人都觉得没啥蛋用的功能,让Agent给人发消息、发红包、打电话之类的。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

我的小微回复的口吻稍微会有点特殊,不是正常回复,是因为我想看到小微背后的工具链具体是咋实现的,学习一下做法,所以强行让他扭了过来,让它每一步都要吐一些工具调用,这个其实是不正常的,大家跟小微对话的时候,它回复的还是正常的预期,就像第一张图一样。

小微有一个其实不是很Agent的点,就是几乎每一步都需要你确认,确认是否要拨打语音电话,确认是否要发消息,确认是否真的给这人转账。

这个我们也能理解,因为通讯录以及人与人之间的交互这个事,实在是太敏感了,不谈隐私问题,有无数的灰产这么多年一直跟微信斗智斗勇,你这个东西如果不进行确认,那基本就炸了,最开心的,就是那群灰产了。

这个思路,也几乎贯穿这小微这个Agent所有的设计中。

比如大家最最想要的方便你我他的,比如批量给人发送消息、定时给人发送消息等等,都不可以。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

整个微信通讯录其实被封装成了一个skill,我把skill文档给扒了下来,其实就可以看出来一些端倪了。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

比如这一连串的禁止事项。

## ❌ 绝对禁止的情况

对于涉及以下不支持能力的请求,请明确拒绝,并在回复中包含提示或引导用户的文案。回复时用第一人称:"我"不支持,而不是"系统"不支持。

### 同时给多联系人/群聊发送消息
系统不支持同时给**多个联系人/群聊目标**发送消息,也不支持并行调用多个工具(**绝对禁止在一轮当中调用多个工具**)。
- Query示例:「问问张三和李四啥时候有时间,一起吃饭」「帮我打个电话给张三和李四」「帮我在测试群1和测试群2里面发个消息问大家测试好了吗」

### 同时发送多类型消息
禁止在单次请求中同时触发多种消息类型的发送动作。以下情况一律视为违规,必须拒答,并在回复中提示本次只发送其中一种类型的消息(如文字),其他消息由用户手动发送。
- 涉及两种及以上消息载体(如文字、图片、文件、链接等)的组合发送
- 即使文案依附于图片,也算做多类型,需要拒绝
- Query示例:「把这张图片发给小明,说快递到了」「给小组群发个消息说今晚聚餐,并附上饭店截图和定位」

### 给用户自己发消息/转账
系统不支持同时给**用户自己发消息/转账/发红包**,也不支持并行调用多个工具(**绝对禁止在一轮当中调用多个工具**)。
- Query示例:「给我自己发一个消息说加油」「给我转20」

### 转发多条聊天记录
系统不支持将多条聊天记录合并转发或逐条转发给他人,需明确拒绝,并提示用户手动操作:在聊天中长按消息 → 点击「多选」→ 选择要转发的消息 → 点击底部「转发」→ 选择合并转发或逐条转发。
- Query示例:「把我和小张关于项目方案的聊天记录转发给经理」

### 转发笔记
系统暂不支持将笔记发送、转发给他人,需明确拒绝,并提示用户手动操作:打开该笔记 → 点击右上角「…」→ 选择「发送给朋友」。
- Query示例:「把会议记录那条笔记分享给小李」

### 发送语音消息
系统不支持帮用户发送语音消息,需明确拒绝,并提示用户换成发送文本消息。
**注意**:「发语音」≠「打语音通话」,请勿混淆。如果用户说发语音,需拒绝,而不是当成打电话的意图。
- Query示例:「给小王发一条语音,说我快到了」

### 发送表情包
系统不支持帮用户发送表情包,需明确拒绝,并提示用户手动打开聊天窗口,点击表情面板选择发送。
- Query示例:「给闺蜜发个比心的表情包」

### 读取聊天记录
本SKILL不支持读取用户聊天记录。例如:「找一下xx群的聊天记录」。

其实微信在通讯录和消息这块的处理,从这个skill我都能感受到,压力也挺大的。

所以开放的能力都非常谨慎,目前基于通讯录开放的能力中,就是给个人/群聊发消息,给个人发起视频通话,给个人发红包或者转账这几个场景比较好,但是同时,就跟很多人说的一样,不够便捷,反而鸡肋。

因为本质上用户的交互成本差不多。

比如我要给鲜虾包打电话。

Agent交互流程是:点击小微 - 输入“我要给鲜虾包打电话” - 等待 - 确认。

常规GUI流程是:点击搜索框 - 输入鲜虾包 - 点击头像 - 点击菜单 - 点击语音通话。

其实只是把点击成本转化为了输入成本,在便利性上,并没有方便特别多。

基于通讯录这块,比较期待微信后续对Agent能力的开放了,比如是不是可以批量或者定时发消息之类的,这些我觉得就能真正的体现出Agent的价值了。

当然,也不是说完全就没有用了,因为如果你只做这一件事,那确实是意义不是很大,但是如果是个稍微复杂一点点的长程任务,这就会方便非常多了。

比如说,我明天要找鲜虾包中午吃饭,那我可以直接给自己设置一个明天中午吃饭的日程提醒,同时也要把这个消息直接发给鲜虾包。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

这种就简单很多了。

Agent真正的价值,我还是觉得在未来的长程复杂任务上,能帮我们更便捷的省心省力。

在这个主入口中,还有一些其他的能力,比如打通了朋友圈,你可以问,今天最装逼的朋友是谁。。。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

不过其实朋友圈本质是先筛选,并且限制了最多只能拿到最近2天的时间,所以,你想总结过去所有的朋友圈之类的操作,其实就不是特别现实了。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

不过最后挑出来的朋友圈,右边那个小按钮,是可以直接点开浮起一个弹窗,支持跳转到朋友圈原文的,这个好评的。

除了朋友圈,也支持公众号和视频号的查询和搜索。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

也支持创建提醒,处理文件,创建笔记,这种就是常规操作了。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

不过我本来还挺期待,Agent可以跟我的微信收藏打通,但是这个权限并没有开放,小微只能操作他自己创建的笔记。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

还有个好玩的事,就是也跟微信支付打通了,可以进行一些好玩的查询操作,比如说,我可以授权以后,来查我今年发了多少红包出去。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

不过整体所有你跟小微的交互,都有一个比较核心的特点,我总结成了4个字:

只读不动。

微信目前已经在尽可能的给小微开权限了,但是还是人口基数过于庞大,你不能保证每一个人都是能熟练操作手机的,更别提是能熟练使用Agent了,如果操作权限也给了一部分,你很难说,会发生什么样的舆情。

所以像一些帮我删掉加了超过一年但从来没有说过话的好友、比如取消关注我3个月以上没有打开的公众号等等,全都无法操作。

因为这是微信,所以这个谨慎的态度,是可以理解的。

而在小程序操作上,目前支持很多小程序,这块我也直接列一个我扒拉出来的官方skill的边界吧。

## 触发条件
用户明确说"打开 / 用 / 通过 …(某小程序名)做 X"
本地生活类下单/预约:外卖、奶茶咖啡、扫码点餐、堂食排队、KTV、洗车、家政
出行类:打车(滴滴等)、共享单车、查公交地铁、查驾车路线/耗时、查火车票机票、订酒店
票务类:电影票、演唱会票、景点门票、展览门票、博物馆预约
查询类:快递物流查询、订单状态查询、附近商家/POI 检索、营业时间查询
充值缴费类:手机充话费、加油卡、水电燃气、ETC
模糊本地服务表述:"我想吃饭","附近有什么好玩的","帮我找个能 X 的小程序"
基于上一次小程序操作截图的追问/微调(如"换成大杯","看第二家","下一场")

## 不触发条件
纯知识/资讯问答 → 走通用问答
用户明确要求用 App、网页、桌面客户端完成(非小程序)→ 走对应渠道
调用非微信生态平台(如直接调淘宝API、抖音内部操作)→ 不属本 Skill
与微信账号/支付/隐私设置相关的系统级操作 → 走客服/系统设置
用户只是闲聊、打招呼、表达情绪 → 走通用对话

比如说,我说定个周六晚上的我家附近的电影票,因为我让他记住我家在哪了,所以他知道,然后他会列出目前他可以操作的小程序,然后使用第一个来为我们服务。

小程序支持的还真的蛮多的。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

一个电影就列出了5个,然后他选了第一个猫眼进行操作。

小微有一个很棒的点就是,他虽然没有办法帮你直接操作完小程序,但是他会一直操作到,他能操作的部分,然后把剩下的交给你,你接着Agent的步骤,做完后续的部分就行。

比如猫眼这个。

因为我没有指定电影院,我只说了家附近,所以他会先自己操作一会猫眼,最后给我停在玩具总动员5的影院选择界面,我点进去就是列表页,我选个影院就行了。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

小微在小程序的操作适配上,这一点我觉得做的还是非常棒的。

除了这个主入口之外,小微的各种小入口,依然还是无处不在。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

我能找到的,就有5个。。。

本质上都是一些快捷入口,不过比较特别的就是在群聊对话界面和个人对话界面,这两个的底部菜单栏唤出的小微,是带有了聊天记录的上下文的,这个是主入口里也做不到的。

而且微信居然会把聊天记录的权限在特定的入口里给小微开放出来,这个点,就已经完完全全的超出我的预期了,我以为这个纯粹的0.0.1的内测版本,是不会有聊天记录的,因为这个对于微信来说,就是纯粹的命根子。

比如我直接在两个群聊里面问。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

不过这个时效性,跟朋友圈是一样,只能拿到最近2天的数据,拿不到更久以前的。

私聊也是如此,只能拿到最近2天的聊天记录,这个微信卡的非常严格。

除了这些东西之外,你从主入口的小微点进去,右上角的更多里面,其实还藏了一些功能。

比如这个记忆,其实就是会记录下你的部分的信息,比如我就让它记下了我家和公司的地址。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

我就可以实现,直接说帮我打车去公司。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

然后还有一个比较离谱的东西,就是那个小工具。

点进去以后,你就发现,你是可以,直接用一句话,来创建你想要的小工具的。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

比如我就直接一句话,创建了一个体重变化的小工具,这个玩意,是纯粹给我自己用的。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

我其实觉得,这玩意有点杀死比赛的意味了。

因为,这个小工具,是完完全全复用的小程序的逻辑和架构。

体验完微信Agent以后,我觉得这就是微信有史以来最大的更新

现在虽然不能转发,但是做这个页面,明显就是未来为了分发而预留的口子。

过去一年时间,出现了无数的AI生成小程序小游戏的平台,大家都觉得,这感觉是个很棒的市场,因为有很多的创作者来这个平台上面做应用,然后就有可能,成为未来的新时代的APP Store。

软件这个形态未来还是不是主流咱们另说,咱就说一个点,做过互联网产品的人应该都知道一个概念,双边市场。

平台的价值来源于同时连接两端,供给侧和需求侧。

平台最难的事情,永远是同时把两端的用户聚起来,也就是经典的冷启动困境,没有消费者就没有创造者,没有创造者就没有消费者。

但是过去一年多时间,大家最大的困境都是,只有创造者,但是,消费者不来。

但微信没有这个问题,微信有14亿用户,他的起点,是无数产品这一生的终点。

在微信里生成一个小程序,它天然就在全中国最大的消费者池子里,分发路径、用户基数、支付体系、社交关系链,全是现成的。

你做的每一个小程序,从诞生那一刻起就自带分发能力,因为微信本身就是分发。

所以,当微信自己进军,用AI直接生成小工具的赛道,很多其他的AI生小程序的产品,我觉得就非常的难受了。

整个小微大概就是这样。

能体验的部分、他们的部分技术调度我也都给大家展示了。

整个第一版,虽然还是只读不动。

但其实权限开放的已经有一点超我预期了。

毕竟,平台的信任是一种不可再生资源,透支了就很难恢复。

对于微信来说,出一点点的事,那都是无比大的大事。

而今天,微信也在用着非常微信的方式,把自己十几年积累的上下文资产和分发网络,用一种极其微信的节奏,接入AI时代。

我是从2012年开始用微信的。

到今天为止,差不多用了14年。

回望过去我印象中所有的大更新,我觉得没有什么,比这次更大了。

这是新时代和旧时代的区别。也会在互联网和AI历史上,留下浓墨重彩的一笔。

收藏
点赞 28

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。