DeepSeek发布V3.2-Exp模型，寒武纪同步适配优化

2025年09月30日 22:14

【鹿光网】DeepSeek正式发布全新实验性模型DeepSeek-V3.2-Exp，引入稀疏注意力机制以优化长文本处理效率，同时大幅降低API调用成本。同日，寒武纪宣布完成对该模型的适配并开源推理引擎。

据DeepSeek官方微信公众号周一（9月29日）消息，DeepSeek-V3.2-Exp模型正式发布。该模型作为向新一代架构过渡的实验性版本，在DeepSeek-V3.1-Terminus基础上引入了DeepSeek Sparse Attention机制，针对长文本的训练和推理效率进行了优化探索。DeepSeek表示，该模型已同步更新至其官方App、网页端及小程序，同时API价格下调超50%，以吸引开发者体验并反馈意见。

与此同时，寒武纪旗下微信公众号“寒武纪开发者”于同日宣布，已完成对DeepSeek-V3.2-Exp模型的适配，并开源了基于寒武纪平台的vLLM-MLU推理引擎源代码。寒武纪表示，公司通过Triton算子开发实现快速适配，并结合BangC融合算子及计算通信并行策略，显著提升了新模型的计算效率，达到业界领先水平。寒武纪强调，依托DeepSeek-V3.2-Exp的稀疏注意力机制与其软硬件优化技术，可大幅降低长序列场景下的训练和推理成本，为客户提供高性价比的解决方案。

此前，寒武纪已对DeepSeek系列模型进行深度优化，展现了其在大模型软硬件协同方面的技术积累。此次对V3.2-Exp的“day 0”适配，凸显了寒武纪在AI生态建设中的快速响应能力。业内人士分析，寒武纪与DeepSeek的同步适配动作，表明双方可能在模型发布前已展开技术沟通与研发协作。