深度求索(DeepSeek)正式推出新一代开源大模型DeepSeek-R1-0528,该模型已在HuggingFace平台开源并更新技术文档。官方宣称,其数学推理、编程能力等核心指标已逼近GPT-4o、Gemini 2.5 Pro等国际领先模型。
关键性能突破
据模型卡信息显示,R1-0528在AIME等高难度数学测试中得分显著提升,逻辑推理能力实现突破性优化。同时,新增JSON结构化输出与函数调用功能,可直接对接自动化系统与前后端开发,大幅降低工程化部署门槛。在文本生成方面,新模型幻觉率降低约40%,议论文、小说等创作类任务的自然度接近人类水平。
轻量化部署方案
技术团队首次将R1-0528的"思维链"能力蒸馏至Qwen3-8B模型,使其推理性能超越原版Qwen3-8B,逼近参数规模大30倍的Qwen3-235B版本,为移动端、边缘计算等轻量化场景提供新选择。实测数据显示,该模型在Web前端开发任务中的代码生成效率提升26%。
开发者生态布局
目前该模型权重已在HuggingFace开放下载,官方同步释出适配文档与API接入指南。业内人士预测,未来两周内将有大量企业宣布接入该模型。
体验入口:chat.deepseek.com
API文档:api-docs.deepseek.com/guides/reasoning_model
模型权重:huggingface.co/deepseek-ai/DeepSeek-R1-0528