阿里通义千问被指抄袭 盘古华为的回应

07-07 07:13

快科技 7 月 6 日前,一条发布于日前。 GitHub 研究引起了业界的关注。


研究人员认为,华为推出的盘古大模型(Pangu Pro MoE)通义千问与阿里巴巴发布 Qwen-2.5 14B 在注意力参数分布方面,模型具有相关性,超出正常范围。


针对网络上有声音质疑华为盘古模型的抄袭行为,华为盘古团队发布了《关于盘古模型开源代码相关讨论的声明》。


盘古官员说 Pro MoE 开源模型是基于升腾硬件平台开发、训练的基本大模型,而非基于其它厂商模型的增量训练。


在架构模式、技术特点等方面进行了关键创新。是世界上第一个面向盛腾硬件平台设计的同规格混合专家模型,创新性地提出了分组混合专家模型。(MoGE)结构,有效地解决了大规模分布式训练的负载平衡问题,提高了训练效率。


声明指出,盘古 Pro MoE 开源模型部分基本组件的代码实现借鉴了行业开源实践,部分开源代码涉及其它开源模型。


在开源代码文件中,我们严格遵守开源许可证的要求,明确标注开源代码的版权声明。


它不仅是开源社区的一种普遍做法,也符合业界倡导的开源合作精神。


在倡导宽容、公平、开放、团结、可持续的开源理念的同时,我们始终坚持开放创新,尊重第三方知识产权。


据了解,6 月 30 日本,华为盘古盘古正式开源 70 一亿参数密度模型,盘古 Pro MoE 720 一亿参数混合专家模型,基于升腾开放。 AI 模型推理技术的平台。


这是华为首次开源盘古大模型的核心能力。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com