阿里Qwen3能成为下一个DeepSeek吗?

05-08 11:03

四月二十九日凌晨,阿里巴巴旗下的通义千问团队正式发布并开源新一代模型Qwen3。这次发布的Qwen3系列包括两个参数规模为30B和235B的混合专家。(MoE)模型,以及6个参数从0.6B到32B的密集模型。


作为中国第一个混合推理模型家族,Qwen3能否成为下一个DeepSeek,一经推出就迅速引发了开源圈的热议。


华为计算官方发布后不久,称升腾MindSpeed和MindIE一直同步支持Qwen系列模型,这次Qwen3系列开源后,已经在MindSpeed和MindIE中得到了开箱即用,完成了Qwen3的0Day适配。在海光信息方面,它的DCU很快就完成了8个模型的无缝适配和优化。


“在发布的第二天,我们已经完成了Qwen3-30B-A3的本地化部署。B,使用单卡4090,现在对C端用户开放。COO王鹏告诉《IT时报》记者,共绩算率COO,现在Qwen3的部署成本很低,Qwen3-235B-A22B只需要4张H20,而且小模型的部署成本更低。。另外,计算能力集群公司的工作人员告诉记者,Qwen3在发布的第二天就收到了客户订单。


与DeepSeek相比,成本大大降低,幻觉问题仍然没有解决


Qwen3与之前的模型相比有了明显的改进。


Qwen3在架构上选择混合专家。(MoE)以Qwen3-235B-A22B旗舰模型为例,总参数高达235B,但激活只需22B,大大降低了运行时对计算能力的即时需求。


这种设计促使模型在面对不同复杂程度的任务后,能够灵活准备计算资源,快速响应简单的问题,深入思考复杂的问题,实现“快思维”与“慢思维”的融合,兼顾效率和准确性,为模型应用开辟了更广阔的空间,有望改变行业适应模型应用领域的传统思维。



预训练数据量的增加也是Qwen3的一大亮点。根据官方数据,其信息量是Qwen2.5的三倍。多轮强化学习的应用巧妙地将非思维模式融入到思维模式中,提高了模型的智能处理逻辑,进一步提高了模型在推理、指令遵循、工具调用和多语言能力方面的表现。


Qwen3参数仅为其1/3,与DeepSeek-R1相比,成本大幅下降。就部署而言,Qwen3满血版只需4张H20就可以部署,显存只占性能相近模型的三分之一。王鹏说:“这大大降低了中小企业和个人开发者使用高性能模型的成本门槛和部署时间。


但也有不少AI爱好者在实际测量后在社交平台上指出,Qwen3在长文本能力上的表现并不突出,有一定的幻觉率。然而,在生成复杂的代码和数学推理方面,思维模式的表现明显优于非思维模式。《IT时报》记者试图通过Qwen3网页版生成关于“去年五一假期旅游数据与景区特色相关联”的报告。Qwen3的“一般”模式没有给出准确的数据支持,出现了很高的幻觉率。然而,在“深度思考”模式下,幻觉率大大降低,数据更加准确。


使用AI“双子星”战略,阿里渴望在C端站稳脚跟。


当前AI跑道上,科技巨头们的每一步都备受关注。


最近有传言说,腾讯、阿里、字节跳动相继结束,巨资争夺GPU计算资源。虽然字节跳动已经出来辟谣,说相关信息不真实,但这个谣言本身就足以反映出科技厂商对AI战略布局的重视和渴望。


算率作为AI发展的基础,其重要性不言而喻。阿里此前公开表示,未来三年将在云和AI硬件基础设施建设上投入超过3800亿元。


目前,AI是阿里集团各业务领域的主要KPI。从阿里的整体AI战略布局来看,对AI的投入不断增加,试图加强通义千问和夸克之间的“双子星”格局。通义千问致力于支持云智能,而夸克则致力于打造端入口,共同推动阿里AI To C战略的落地。


与以往最大的不同之处在于,“夸克”和“通义”已经成为Qwen3的主要感受入口,所有用户都可以免费使用这种最新的开源模式。



一位阿里内部人士曾告诉《IT时报》记者:“通义App在C端没有发出声音,只能委以夸克的重任。


通义千问凭借在多模态处理和复杂任务推理方面的技术优势,为阿里的B端公司服务和开发者生态提供了有力支持。举例来说,飞猪旅行借助通义千问多模态模型,完成了客户方言语音规划行程的功能;Rokid 配备AR眼镜技术后,可实时翻译。通义千问在模型开源方面跑得很快,但其“通义”App在C端应用中并未施展“撒手锏”。


相反,夸克突出了重围,第三方数据显示,2025年3月,夸克的MAU(月活跃人数)达到1.48亿,在国内AI应用中排名第一。


从2024年底到2025年初,阿里通过一系列的组织结构调整和人才布局,推动AI To C战略将AI应用“通义”并入智能信息业务群,整合天猫精灵和夸克团队,聘请顶级AI科学家许主洪负责AI。 To C业务研发。


阿里AI战略仍然存在许多挑战。在保持技术优势的同时,通义千问如何进一步降低使用门槛,满足中小企业多样化的定制需求,成为亟待解决的难题。虽然其API(应用程序编程接口)的价格具有一定的竞争力,但一些中小企业在技术对接和模型二次开发方面仍然面临许多困难。夸克也面临挑战。随着用户数量的快速增长,感觉稀释问题逐渐凸显,流量增加时一些功能的响应速度变慢,这就要求夸克提高技术结构和服务器性能,保证用户体验的稳定性。


AI市场竞争激烈。腾讯的混合元模型依托微信庞大的用户基础和生态优势,在微信多个入口中为元宝争取亮相机会,为C端用户形成“茧房式包裹”。2024年11月,凭借抖音的拉流优势,字节跳动旗下的豆包飙升至5998万,几乎长期占据AI应用下载量榜前三。


虽然握着通义和夸克的“双子星”,一条腿走进开源圈,一条腿走向C端用户,但阿里AI战略的前路在巨头的包围下依然充满变数。


本文来自微信微信官方账号 “IT时报”(ID:vittimes),作者:毛宇,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com