摘要:内附手把手开发教程
2025年5月28日深夜,DeepSeek 官方在用户群中宣布完成“小版本试升级”,发布DeepSeek-R1-0528,昇思MindSpore开源社区开发者基于已支持的DeepSeek V3进行快速适配,1小时内完成开发,修改代码小于10行,实现镜像替换、推理任务拉起,经测试验证,模型精度与官方开源版本一致。
基于昇思版本适配的DeepSeek-R1-0528已上架开源社区代码仓及魔乐社区,面向开发者提供开箱即用的模型,便于开发者直接使用或二次开发。
本次快速适配应用了MindSpore Transformers大模型使能套件,该套件依托MindSpore AI框架提供的丰富的多维混合并行能力,亲和开源工具与通用数据格式,原生支持大模型蒸馏的端到端全流程开发,提供了高效、便捷的开发能力
同时,本次推理服务的拉起与部署应用了MindSpore-vLLM插件,支持基于vLLM框架部署MindSpore模型的推理服务。
本次发布的DeepSeek V3-0528主要升级以下能力:
1.推理与思维深度增强
思考长度翻倍:平均每题推理token从12K增至23K,解题步骤更详尽(如AIME数学题准确率从70%→87.5%)。
幻觉率降低45~50%:在摘要、改写等任务中输出更可靠。
2.编程能力突破
前端代码生成:可一次性生成超千行无Bug代码,支持复杂动态效果(如天气动画、数据可视化)。
多语言支持:在LiveCodeBench测试中Pass@1从63.5%→73.3%,媲美OpenAI o3高版本。
3.新增功能与体验优化
工具调用(Function Calling):支持外部API调用,Tau-Bench成绩达OpenAI o1-high水平。
创意写作提升:长文本结构更完整,更贴近人类风格。
API兼容性:接口不变,新增JSON输出支持。
手把手教程DeepSeek-R1-0528 vLLM-MindSpore 使用指南
●本项目中提供的DeepSeek-R1-0528模型权重已反量化为BF16,权重文件大小1.3T。
环境搭建
环境准备:四台Atlas 800I A2 (64G),并配置好组网,四台设备的卡与卡之间能够互相ping通。
四台设备分别启动容器,四台设备的hostname需要不同,但容器名称需要一致。
/data/deeepseek_r1_0528/用于存放权重及yaml配置文件。四台服务器都需要下载权重,而且存放路径需要一致,权重文件大小1.3T,需要预留足够磁盘空间。
下载权重及yaml配置文件
四台设备分别从魔乐社区下载权重及yaml配置文件。
四台设备分别修改yaml配置文件
启动
四台设备的容器中分别添加环境变量。enp189s0f0是ifconfig命令显示的网卡名称,根据需要调整。
主机及辅机设置
选择一台设备作为主节点,执行如下命令
其他三台设备作为辅节点,依次执行如下命令
在主节点容器中拉起服务,其他节点不需要。模型路径根据需要调整。
发起推理服务请求,若在主节点发起请求,新开一个终端,IP地址是0.0.0.0或者localhost
责任编辑:kj005
6月5日,南昌大学医学院护理学院院长刘谦一行,专程莅临南昌洪城爱尔眼科医院进行参观考察与交流座谈在刘南CEO的亲自引导和详细介绍下,刘谦院长一行实地走访了医院门...
在建筑、地坪机装修领域,地坪的质量和性能一直是影响建筑物美观、耐用性和维护成本的关键因素一、永不脱落的地坪:技术突破与创新(一)核心技术解析髹髹福国际第三地坪,...
在为新生儿选择第一罐奶粉时,父母们总是希望能够找到更安全、更适合宝宝的婴幼奶粉产品随着人们对婴幼儿营养需求的认识不断加深,澳优佳贝艾特悦白幼儿配方羊奶粉以其科学...
近日,备受瞩目的峨眉传奇传奇少年金腰带挑战赛和全国海选赛广东站在热烈的氛围中圆满落下帷幕。本次赛事由黄埔区武协与广州美泰搏击俱乐部联合主办比赛现场高手云集,来自...
2025年5月30日,长虹集团泽派汇川团队带着满满的爱与关怀,走进了仁怀市三合镇第二小学,为那里的孩子们送去了一批生活与学习物资三合镇第二小学的孩子们,大多来自...
6月5日,德牙口腔医院内温情涌动,作为南京市首家“双拥医院”,德牙联合口腔医院党支部带领医疗团队以“致敬退役老兵&middo...