华为盘古大模型被指造假,员工匿名揭露“套壳”内幕
【鹿光网】周日(7月6日)凌晨,一自称华为诺亚方舟实验室盘古大模型团队员工在GitHub发布匿名长文,指控华为盘古大模型存在造假行为,多次“套壳”阿里千问、DeepSeek等竞品模型,并曝光内部繁重的管理流程和政治斗争导致人才流失。7月5日,华为曾发表声明否认抄袭指控。
文章详细披露了盘古大模型研发中的多项问题。作者称,135B V2模型涉嫌基于阿里Qwen 1.5 110B续训,通过加层、扩增FFN维度及融入盘古PI论文机制,凑齐135B参数,但参数分布与Qwen高度相似,连代码类名仍保留“Qwen”。Pangu Pro MoE 72B被指“套壳”Qwen 2.5 14B,为掩盖痕迹甚至故意训练脏数据。718B MoE模型则疑似基于DeepSeek-v3续训,任务加载目录直接使用“deepseekv3”命名。相比之下,135B V3是团队从头训练的千亿级模型,克服昇腾芯片算力限制和训练不稳定问题,效果可媲美2024年竞品,被视为团队自研的骄傲。
文章还指出,内部管理混乱加剧研发困境。诺亚实验室隶属“四野”组织,盘古项目属“四纵”,小模型实验室为“十六纵”。繁琐的流程管理,如版本管理、模型血缘追溯等,拖累研发进度,但小模型实验室似不受约束,频繁“套壳”并攫取成果。四纵团队的代码、数据常被直接索取,成果被小模型实验室轻而易举占有,引发内部不满。作者戏称小模型实验室为“点鼠标实验室”,指其“窃取荣耀”导致士气低迷,大量核心成员离职至DeepSeek、字节、腾讯等公司。一位离职同事曾直言:“在诺亚是我技术生涯的耻辱,每多留一天都是浪费生命。”
作者坦言,作为普通员工,畏惧与华为及内部高层对抗,担忧职业与家庭安全,但对“洗地”行为忍无可忍,选择匿名揭露真相。文中提到,135B V2“套壳”事件内部广为人知,甚至涉及终端、华为云等部门,但因高层默认而未追责。HonestAGI分析暴露“套壳”痕迹后,内部要求研讨公关对策,作者对此感到失望,决定离职并申请从技术报告署名中移除,称署名是“一生污点”。
文章最后呼吁华为吸取教训,优化盘古研发,减少政治斗争,留住人才。作者以“生命、人格和荣誉”担保内容真实,并表示因担忧被追责,将每日报平安以确保安全。目前,华为内部已启动排查,作者补充称小模型实验室常将“套壳”成果甩给四纵处理,进一步加剧不公。