营收千亿公司应对AI落地策略:亚马逊Bedrock多样化模型之路
一家营收千亿美元的公司,会怎样回应AI落地的策略问题呢?亚马逊Bedrock上线Qwen3和DeepSeek,通过推行多样化模型策略来应对行业波动。
2025年9月19日,亚马逊云科技宣布Qwen3和DeepSeek v3.1首次上线Amazon Bedrock并正式对外提供服务,这再次引发了全球生成式AI市场对Amazon Bedrock这一产品的关注。

DeepSeek v3.1部分测试成绩,图片来DeepSeek官方文档

Qwen3 - 235B系列测试成绩,图片来自通义千问微信公众号
Amazon Bedrock最早以“大模型货架”的形式出现在亚马逊云科技的客户面前,其核心理念是“Choice Matters”(选择大于一切),目标是为不同业务提供最契合的基础模型。自产品发布起,主流模型会迅速上架供客户选用,整体“供货”数量是市面竞品的两倍以上,达到二百余款。
“Choice Matters”理念的提出,源于对基础模型能力的判断:行业内不存在一个在所有场景中性能、性价比都最优的通用模型。回顾2025年基础模型厂商不断变化的竞争态势,以及不同模型针对不同地区服务政策的变化,让这一理念更具实际意义。从这一点来看,如果在模型选择上不够灵活多样,企业正在推行的AI软件策略可能会陷入被动。
基础模型的“行业波动”,仍在进行中
2023年,亚马逊云科技首次提出“Choice Matters”理念,但当时行业尚未达成共识。有两个技术推论模糊了当时的行业认知。
其一来自资本侧,普遍认为大模型训练成本极高,万卡集群是入场券,闭源模型占主导,开源模型数量有限,“百模大战”会收缩为几家巨头之间的竞争,选择本来就不多。
其二来自技术侧,认为从数据到架构,大语言模型的进化空间不大。在数据层面,高质量的数据有限,没有足够数据就无法制造新的“智能涌现”。在架构层面,Transformer仍是“唯一解”,短期内看不到更优替代方案。因此,大模型的“技术摸高”将在短期结束,模型厂商的研发重点会从基础模型性能提升转向服务垂直行业的解决方案。
这两个推论影响不小,行业某知名投资人和云计算公司是第一个推论的支持者,百川智能等几家知名公司则对第二个推论深信不疑,过早放弃了对基础模型的技术探索,也间接错过了AI Agent的红利。
实际上,技术摸高并非短期行为,大模型的技术发展曲线依旧陡峭,市场选择丰富。围绕单一模型构建的AI能力,很可能会被新的基础模型突破所折叠,这种情况在定制化的To B AI解决方案中很常见。
2025年1月以前,基于开源模型能力完成交付验收的定制化AI解决方案,因DeepSeek的发布变得不合时宜。后来交付的部分方案,在Qwen3、Kimi K2、DeepSeek v3.1陆续发布后,又被淘汰。半年刷新三次,充分说明了“单一模型解决方案”的巨大短板。
此外,2025年音视频模型的技术演进速度加快,AI短剧成了“蓝海市场”,未来市场规模可能达千亿级。对于大量新成立的工作室而言,如何构建和选择工具是核心问题。
毫无疑问,对于企服行业、AI短剧行业以及正在推动AI落地业务的公司来说,能够应对行业波动的、灵活、多元化的MaaS基础设施是必需的。而坚持投入两年后,Amazon Bedrock几乎成了唯一答案。
抛开惊人的模型数量和上新速度不谈,Amazon Bedrock甚至能为具体行业、具体场景提供差异化的模型选型建议。比如,媒体广告行业可选择Marengo、Pagsus、Stable Diffusion;金融行业可选择Palmyra x5;重推理场景可选择DeepSeek - v3.1;文本摘要可选择Mixtral。以Palmyra x5为例,其上下文窗口为100万Token,比一般推理模型高出一个数量级,更适应财务报告和法律合同分析。
考虑到2025年中企出海趋势达到高潮,“Choice Matters”策略的重要性进一步提升。毕竟在模型选型问题上,国内与海外是两套不同的模板和采购清单,但大概率能在Amazon Bedrock的货架上找到所需模型。这也是近年来亚马逊云科技营收快速增长的原因之一。2024年,亚马逊云科技全球营收突破千亿美元大关,“Choice Matters”策略的成功实施功不可没。
灵活,是模型选型的核心关键
Palmyra x5的出现,映射了大模型从单一走向多元化,从具备通识能力演变为具备专业能力的发展趋势。当Agentic AI借助MCP、A2A协议开始调用不同智能体、模型完成精细化分工时, “Choice Matters”策略注定成为未来Agent平台的内生逻辑。
所谓专业能力与精细化分工,本质源于不同模型的设计思路和训练数据不同。以Palmyra x5为例,要支持百万级Token上下文是有代价的。上下文长度增加可能导致计算复杂度、内存占用平方级增长,且单纯增加上下文,模型不一定能有效利用所有信息,会出现“中间迷失”现象。对于Palmyra x5而言,消解这一现象是技术团队的重点工作。
新上线的DeepSeek v3.1并非针对金融场景,而是更强调Agent能力和推理效率。从其过去半年多在行业的落地情况来看,维持满血版运行需要相当的算力成本,盲目增加上下文窗口没必要。
对训练数据的选择也决定了模型在不同场景下的表现。已知DeepSeek v3.1新增的840B Tokens,重点提升了代码和数学类的占比,以提升逻辑推理和数学能力。DeepSeek称其为“迈向Agentic AI时代的第一步”,保守猜测可能也新增了相当比例的Agentic数据。Agentic数据是为训练AI智能体专门准备的数据,包含行动轨迹、决策过程和环境交互信息,超越了传统纯文本对话数据。
Qwen 3重视代码、数学、Agentic数据,还特别强调多语言能力,其中文训练数据仅占比45%,支持119种语言。在成本方面,Qwen 3的部署成本大幅下降,4张H20即可部署满血版,显存占用仅为性能相近模型的三分之一。
综合来看,要保障AI成功落地业务,使AI在每个设计场景下都能达到最佳效果,需要灵活选型和调用。亚马逊云科技数据和AI GTM副总裁Rahul Pathak在博客中总结了考虑模型选择的三个关键点:不同的用例需要不同的工具,不应期望一种模型能以最佳方式解决每个业务问题;在模型之间进行实验和切换的能力不仅方便,而且是竞争优势,能针对特定用例快速测试和部署不同模型的组织优于锁定单一模型方法的组织;成本优化要将正确的模型与每项任务相匹配,防止过度设计和表现欠佳。
就“竞争优势”而言,Amazon Bedrock已将其沉淀为系统级能力。它为模型评估设置了自动评估和人工评估两条核心路径,自动评估适用于客观指标,人工评估针对主观判断,还可借用官方提供的人工评估团队。无论哪种方式,最终都会生成详细评估报告供决策参考。同时,它提供精选的公开数据集,涵盖多种任务,也允许企业上传自己业务场景下的特定数据集,提升了模型测试和选型能力。

如果说AI在替代部分传统工作,那么传统咨询公司在2023年的部分主营业务——模型介绍、推荐与评估——已被Amazon Bedrock完全替代。这符合现代企业发展规律:将人员能力沉淀为系统能力,最终反哺业务发展。如此来看,以Amazon Bedrock为典型的“Choice Matters”策略,正深刻影响着AI落地行业的整体进程。
本文来自微信公众号 “InfoQ”(ID:infoqchina),作者:王一鹏,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




