DeepSeek发布V4大模型引发市场波动

2026年04月25日 22:03

【鹿光网】中国初创公司DeepSeek发布新一代大语言模型V4，引发资本市场波动及行业关注。尽管其性能接近美国领先模型且价格大幅降低，但围绕算力来源、技术路径及中美竞争的争议持续升温。

DeepSeek周五（4月24日）发布V4系列模型预览版，包括主打性能的V4-Pro和低成本版本V4-Flash。公司称，V4-Pro在编码和推理等能力上可比肩全球顶级闭源模型，在部分基准测试中接近OpenAI、Anthropic及谷歌的最新系统，但整体仍落后约3至6个月。

与此同时，中芯国际股价在香港交易中上涨约10%，因其为华为昇腾（Ascend）AI芯片的制造商，而DeepSeek表示其模型训练使用了相关处理器。与此同时，竞争对手MiniMax和Knowledge Atlas股价下跌超过9%。

DeepSeek V4-Pro输出价格约为每百万token 3.48美元，显著低于OpenAI和Anthropic分别约30美元和25美元的水平，也低于月之暗面旗下Kimi模型的定价。公司表示，随着华为新一代昇腾950芯片产能提升，价格仍有下调空间。

DeepSeek此前因低成本训练和开源策略引发全球关注，其V3模型被称以约560万美元成本完成训练，随后推出的R1推理模型被认为可对标OpenAI同类产品。这一模式推动中国企业加速开源布局，包括阿里巴巴的Qwen系列，并促使部分美国公司调整策略。

除阿里巴巴外，Moonshot AI、MiniMax及Knowledge Atlas等公司今年均发布高性能模型，市场竞争加剧。媒体报道称，DeepSeek正寻求从腾讯及阿里巴巴融资，估值或达200亿美元，部分原因在于争夺AI人才。

算力与芯片供应仍是关键变量。美国对先进芯片出口实施限制，使中国企业难以获得英伟达等公司最先进产品。DeepSeek与华为合作，使其模型运行于国产芯片之上，被视为降低对美国技术依赖的一步。

美国总统科技顾问迈克尔·克拉齐奥斯（Michael Kratsios）称，中国开发者存在大规模复制美国技术的行为。OpenAI和Anthropic亦指控部分中国公司通过“蒸馏”方式利用其模型输出进行训练。中国外交部则回应称相关指控“毫无根据”。

OpenAI近期发布新一代模型，Anthropic亦在测试更新系统。黄仁勋表示，算力受限可能促使部分研究人员开发更高效算法，但若中国模型优先适配国产芯片，将对美国形成不利局面。

前字节跳动工程师称中美AI差距或扩大