DeepSeek发布V4大模型引发市场波动

DeepSeek
DeepSeek

【鹿光网】中国初创公司DeepSeek发布新一代大语言模型V4,引发资本市场波动及行业关注。尽管其性能接近美国领先模型且价格大幅降低,但围绕算力来源、技术路径及中美竞争的争议持续升温。

DeepSeek周五(4月24日)发布V4系列模型预览版,包括主打性能的V4-Pro和低成本版本V4-Flash。公司称,V4-Pro在编码和推理等能力上可比肩全球顶级闭源模型,在部分基准测试中接近OpenAI、Anthropic及谷歌的最新系统,但整体仍落后约3至6个月。

与此同时,中芯国际股价在香港交易中上涨约10%,因其为华为昇腾(Ascend)AI芯片的制造商,而DeepSeek表示其模型训练使用了相关处理器。与此同时,竞争对手MiniMax和Knowledge Atlas股价下跌超过9%。

DeepSeek V4-Pro输出价格约为每百万token 3.48美元,显著低于OpenAI和Anthropic分别约30美元和25美元的水平,也低于月之暗面旗下Kimi模型的定价。公司表示,随着华为新一代昇腾950芯片产能提升,价格仍有下调空间。

DeepSeek此前因低成本训练和开源策略引发全球关注,其V3模型被称以约560万美元成本完成训练,随后推出的R1推理模型被认为可对标OpenAI同类产品。这一模式推动中国企业加速开源布局,包括阿里巴巴的Qwen系列,并促使部分美国公司调整策略。

除阿里巴巴外,Moonshot AI、MiniMax及Knowledge Atlas等公司今年均发布高性能模型,市场竞争加剧。媒体报道称,DeepSeek正寻求从腾讯及阿里巴巴融资,估值或达200亿美元,部分原因在于争夺AI人才。

算力与芯片供应仍是关键变量。美国对先进芯片出口实施限制,使中国企业难以获得英伟达等公司最先进产品。DeepSeek与华为合作,使其模型运行于国产芯片之上,被视为降低对美国技术依赖的一步。

美国总统科技顾问迈克尔·克拉齐奥斯(Michael Kratsios)称,中国开发者存在大规模复制美国技术的行为。OpenAI和Anthropic亦指控部分中国公司通过“蒸馏”方式利用其模型输出进行训练。中国外交部则回应称相关指控“毫无根据”。

OpenAI近期发布新一代模型,Anthropic亦在测试更新系统。黄仁勋表示,算力受限可能促使部分研究人员开发更高效算法,但若中国模型优先适配国产芯片,将对美国形成不利局面。