近日 DeepSeek R2 的最新参数引发了行业内外的广泛关注,以下是爆料的关键信息:
📌 参数规模:1.2万亿参数,780亿活跃参数,采用混合专家模型(MoE)架构。 📌 成本优势:与GPT-4相比,成本大幅降低,输入每百万次仅需0.07美元,输出每百万次仅需0.27美元,成本降低97.3%。 📌 训练数据:使用了5.2PB的训练数据,在C-Eval 2.0测试中达到了89.7%的准确率。 📌 视觉性能:在COCO(Common Objects in Context)图像识别测试中,准确率高达92.4%,视觉性能显著提升。 📌 硬件适配:在华为昇腾910B芯片上的利用率高达82%,显示出良好的硬件适配性。
此次泄露的信息显示,DeepSeek R2正逐步摆脱对美国供应链的依赖,这一转变可能对全球AI产业格局产生深远影响。有业内人士指出,部分爆料内容存在逻辑矛盾,甚至存在外网推文引用中文非正规渠道消息的情况。关于DeepSeek R2的发布时间及网传参数真实性,仍需谨慎看待。
如果DeepSeekR2真的发布了,对此你有什么期待?
用了这么多年的微信,你知道还有哪些功能你是没用用过的吗?今天分享5个实用的微信功能,看看你知道几个?
⏰ 提醒事项设置: 通过“我-收藏-右上角加号”创建提醒事项,并置顶在聊天中,方便随时查看和编辑待办任务。
📤 无损文件发送: 通过“加号-文件-手机相册”发送图片或视频,避免压缩,保留所有细节,确保文件质量。
🔢 井号键妙用: 使用井号键可以快速查询天气、汇率、日历、赛事比分等信息,方便快捷。
💾 内存空间清理: 在“我-设置-通用-存储空间”中清理缓存、管理大文件和删除无用聊天记录,释放手机内存。
🎭 表情管理: 长按喜欢的表情选择“查看专辑”,一次性找到该系列的所有表情包,一键添加,方便管理和使用。
Devin是首个AI程序员,它能够通过借用其创造者的账号与客户公司的CTO进行交流,并根据回复调整代码方案。
事情发生在办公软件Slack,截图中的akshat是AI基础设施创业公司Modal Labs的CTO Akshat Bubna。
Devin的开发商是Cognition,而Modal Labs是它的首批客户之一。在一次交流中,Devin询问了关于密钥生命周期的问题,特别是密钥更新后传播到正在运行的应用程序所需的时间。尽管Devin已经查阅了大量文档,但仍然没有找到关于密钥传播时间的明确信息。通过与Modal Labs的CTO交流,Devin了解到更新的密钥不会使已经运行的容器失效,但新启动的容器将会读取更新后的值。
Devin能够自主把任务拆解成一系列子步骤,并一步步执行,甚至在遇到障碍时能够查阅文档并修改后续计划。
大家觉得这波修复BUG属于什么水平,优秀的程序员也不过如此了吧?感兴趣的小伙伴可以看看详细的过程→ 原文链接
基于插件架构开发,集成思维导图、流程图、自由绘画等功能,还支持 Markdown 转思维导图,一个工具搞定所有绘图需求。
GitHub:github.com/plait-board/drawnix
主要功能:
- 支持思维导图、流程图、自由绘画等多种绘图模式 - Markdown 文本一键转换为思维导图结构 - Mermaid 语法直接转换为可视化流程图 - 无限画布支持缩放滚动,创作空间不受限制 - 自动保存功能,支持移动设备使用 - 导出 PNG 图片和专用格式,便于分享使用
直接通过访问其演示网站即可使用,也可以部署到自己服务器运行使用。
转自:微博@GitHubDaily