DeepSeek发布V3.2-Exp模型,寒武纪同步适配优化

【鹿光网】DeepSeek正式发布全新实验性模型DeepSeek-V3.2-Exp,引入稀疏注意力机制以优化长文本处理效率,同时大幅降低API调用成本。同日,寒武纪宣布完成对该模型的适配并开源推理引擎。

据DeepSeek官方微信公众号周一(9月29日)消息,DeepSeek-V3.2-Exp模型正式发布。该模型作为向新一代架构过渡的实验性版本,在DeepSeek-V3.1-Terminus基础上引入了DeepSeek Sparse Attention机制,针对长文本的训练和推理效率进行了优化探索。DeepSeek表示,该模型已同步更新至其官方App、网页端及小程序,同时API价格下调超50%,以吸引开发者体验并反馈意见。

与此同时,寒武纪旗下微信公众号“寒武纪开发者”于同日宣布,已完成对DeepSeek-V3.2-Exp模型的适配,并开源了基于寒武纪平台的vLLM-MLU推理引擎源代码。寒武纪表示,公司通过Triton算子开发实现快速适配,并结合BangC融合算子及计算通信并行策略,显著提升了新模型的计算效率,达到业界领先水平。寒武纪强调,依托DeepSeek-V3.2-Exp的稀疏注意力机制与其软硬件优化技术,可大幅降低长序列场景下的训练和推理成本,为客户提供高性价比的解决方案。

此前,寒武纪已对DeepSeek系列模型进行深度优化,展现了其在大模型软硬件协同方面的技术积累。此次对V3.2-Exp的“day 0”适配,凸显了寒武纪在AI生态建设中的快速响应能力。业内人士分析,寒武纪与DeepSeek的同步适配动作,表明双方可能在模型发布前已展开技术沟通与研发协作。