就在这两天,美团悄悄地开源了一个名叫龙猫(LongCat-Flash)的大模型。
可以说是眼下AI圈最重磅、也最低调的一个大新闻。
为什么?因为龙猫不仅性能追平了DeepSeek-V3.1,推理速度嘎嘎快,而且可能根本没用英伟达的GPU来训练!现在全球AI算力被英伟达牢牢攥在手里,这个消息要是真的,那可就不只是一个新模型发布这么简单了。这背后,是一条我们自己悄悄跑通的、不被卡脖子的通天大道。
龙猫
先别急着聊国产芯这么宏大的话题,先来看看这只龙猫本身到底有多能打。测试地址:longcat.chat
我研究了一下官方公布的数据和各路大神的评测,总结下来就是三个词:快、准、还便宜。
先说快,它的推理速度,官方数据是在H800的显卡上能跑到100 token/s。现在市面上主流的开源模型,速度普遍在20-50 token/s这个区间。也就是说,龙猫的反应速度可能是它们的两倍甚至更多!就好比跟AI聊天,以前是它想半天回一句,现在是刚说完,它嗖一下就把答案给你了,体验感直接拉满。
再说准,从各种基准测试跑分来看,龙猫的成绩相当能打。
尤其是在Agent工具调用的单项上,它的表现异常亮眼,甚至超过了之前很火的Kimi-K2,达到了目前开源模型的顶尖水平。可能大家对Agent工具调用有点陌生,我打个比方:这就好比你给AI一个复杂的指令,比如“帮我查一下最近去三亚的特价机票,整理成表格,再找出评分最高的三家海景酒店”,强大的智能体就能自己上网搜索、分析数据、整理信息,最后把结果完整地呈现给你。这项能力,正是大模型从聊天玩具走向生产力工具的关键。
最后是便宜,龙猫的推理成本做到了惊人的每百万token仅需0.7美元。看到这里你肯定会好奇,美团到底用了什么魔法,能让龙猫又快又好?官方技术文档中详细讲了龙猫的技术架构,有两个非常有意思的创新,堪称效率压榨的艺术。
第一个叫零计算专家(Zero-Computation Experts)。我们平时说话写文章,里面有大量的词其实很简单,比如“的、地、得”这些助词,还有各种标点符号。传统的AI模型处理这些简单符号,也要消耗算力,有点杀鸡用牛刀的意思。而龙猫就聪明多了。它内部的路由会先判断一下任务的难度,如果发现只是个标点符号或者常用词,就直接把它扔给零计算专家,几乎不花什么力气就处理完了。
简单的任务快速通过,复杂的任务精雕细琢,整体效率不就上去了吗?这也是为什么它的激活参数量不是固定的,而是在18.6B到31.3B之间动态变化的原因。
第二个叫快捷连接架构(ScMoE) 。传统AI模型在训练时,各个专家计算单元之间需要大量的数据交换,很多时间都在等数据,算力被白白浪费了。可以想象成一个大公司里有很多专家,但这些专家分布在不同楼层,每次开会(计算)前,都需要坐电梯(数据传输)到同一个会议室。ScMoE干了件绝妙的事情,它在等待数据传输的这点垃圾时间里,硬是把下一层的计算任务给塞了进去,让计算和通信并肩作战。
这就好比我们一边等水烧开,一边把菜给洗了,时间利用率瞬间翻倍。通过这种方式,训练和推理的效率自然也就跟着起飞了。
外卖巨头的求生欲
再聊回美团本身,很多人可能会觉得奇怪,一个送外卖、卖菜、搞团购的公司,为什么要这么拼命地去啃AI这块硬骨头?如果你关注财经新闻,可能知道美团最近的日子不太好过。为了和京东、淘宝在本地生活领域打价格战,外卖业务亏损严重,公司的利润大幅下滑。对于美团这样一个拥有庞大线下团队的公司来说,最大的一块成本就是人力。这是它绕不开的痛。
美团准备了两条路。一条是搞无人机、无人车送货,但这替代的范围毕竟有限。另一条,就是搞大模型。
美团CEO王兴很早就预言过,大模型能让“说话即可订餐、订酒店”成为现实。就是用技术为现有业务赋能,降低成本,提高效率。搞大模型也有两条路:一是直接用别家成熟的模型,比如DeepSeek做二次开发,二是自己从头开始,训练一个完全属于自己的模型。很显然,美团选了更难走,但也更有想象力的路。
好了,铺垫了这么多,终于要说到这次事件中最让人浮想联翩的部分了。最早是@01Founder爆出来的,说经过多方信源交叉确认,龙猫的训练并非在我们熟知的英伟达GPU上完成。美团在官方报告里也只是用了数万个加速卡这样模糊的表述,对于具体的硬件厂商名字,讳莫如深。虽然美团官方对此不作回应,但这背后传递的信号已经足够清晰和震撼了。
在当下的AI时代,英伟达的GPU几乎就是铁锹的代名词。你想淘金,就必须得有它的高端显卡。而我们都知道,由于众所周知的原因,想拿到这些高端铁锹是越来越难了。如果美团真的在国产加速卡上,训练出龙猫这样性能比肩世界一流水平的大模型,那意义就太重大了。
这不仅仅是美团一家的胜利,它证明了在AI这条最核心的赛道上,我们已经有能力建立一套自主可控的技术路径,可以不依赖、不仰视任何人。这就像在所有人都认为只有坐远洋巨轮才能横跨大洋的时候,我们自己造出了一艘同样快速、甚至更经济的飞机。其中的艰辛,恐怕只有亲身经历过的工程师才能体会。
如果这个传闻属实,那龙猫的意义,就远远超出了一个开源模型本身。是给整个中国的AI产业,打了一剂强心针。龙猫模型遵循MIT开源协议,这意味着可以完全免费地将它用于商业用途,没有任何后顾之忧。
美团这也是在用自己的技术积累,为整个中文AI生态添砖加瓦。AI,是能把效率拉到极致的武器。这一次,美团赌的不是一城一地的得失,而是下一个时代。
你觉得,它赌对了吗?
发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们