优设问答你的职场经验书

大白(●—●) 邀你回答

2025/05/30

DeepSeek发布R1-0528大模型,性能对标GPT-4o与Gemini 2.5 Pro,R2版本何时发布?

深度求索(DeepSeek)正式推出新一代开源大模型DeepSeek-R1-0528,该模型已在HuggingFace平台开源并更新技术文档。官方宣称,其数学推理、编程能力等核心指标已逼近GPT-4o、Gemini 2.5 Pro等国际领先模型。

关键性能突破 据模型卡信息显示,R1-0528在AIME等高难度数学测试中得分显著提升,逻辑推理能力实现突破性优化。同时,新增JSON结构化输出与函数调用功能,可直接对接自动化系统与前后端开发,大幅降低工程化部署门槛。在文本生成方面,新模型幻觉率降低约40%,议论文、小说等创作类任务的自然度接近人类水平。

轻量化部署方案 技术团队首次将R1-0528的"思维链"能力蒸馏至Qwen3-8B模型,使其推理性能超越原版Qwen3-8B,逼近参数规模大30倍的Qwen3-235B版本,为移动端、边缘计算等轻量化场景提供新选择。实测数据显示,该模型在Web前端开发任务中的代码生成效率提升26%。

开发者生态布局 目前该模型权重已在HuggingFace开放下载,官方同步释出适配文档与API接入指南。业内人士预测,未来两周内将有大量企业宣布接入该模型。

体验入口:chat.deepseek.com API文档:api-docs.deepseek.com/guides/reasoning_model 模型权重:huggingface.co/deepseek-ai/DeepSeek-R1-0528

点赞 24 回答 2
3/189

128位高手大咖在线答疑解惑

说清楚

完整的描述具体问题和细节

1

耐心等

回答问题需要认真思考,请耐心等待

2

巧咨询

还有疑问?及时追问获取更多答案

3
我要提问