突破英伟达垄断：AI产业的另一条突围之路

05-28 06:45

本文来自微信公众号： 01Founder ，作者：一直在路上的Max

2006年冬天，黄仁勋做了一个被华尔街 deemed 极其荒唐的决策：要求英伟达全系列产品必须支持全新的CUDA技术。

为了这个在当时看不到任何盈利前景的项目，这家以显卡销售为核心业务的公司，年研发投入直接飙升至5亿美元，利润常年徘徊在盈亏线附近。

股东怒斥，媒体嘲讽，说这是对不存在的市场盲目砸钱，可黄仁勋始终没有停下脚步——他骨子里本就带着赌徒的偏执。

后续的发展所有人都耳熟能详：如今硅谷科技巨头抢英伟达显卡，几乎要挤破头。

马斯克一口气往得州机房塞了十万张英伟达显卡，转头就能以每月12.5亿美元的价格把算力租给Anthropic；扎克伯格甚至会在Meta财报里主动炫耀，公司已经囤了三十万张H100。

大模型行业如今奉信一条简单粗暴的“规模法则”：模型越大性能越好，能拿到的算力越多越有优势。

在这套规则下，英伟达拿走了AI 产业绝大多数利润：云厂商高价买下显卡，再把算力切割成小块，按Token向创业者和普通用户收费；每一次AI生成内容，本质上都是在消耗英伟达的算力，都是给硅谷的这座AI王座上供。越来越多从业者开始感叹：整个行业都被英伟达卡了脖子。

这样的垄断看似是死局，但已经有一批人站出来，想要打破现状。

PART.01

算力突围：啃下生态这块硬骨头

要反抗英伟达的垄断，第一枪必须打在最核心的算力芯片上。

前段时间华为发布的芯片论文刷遍全网，国产芯片领域也不断传出突破消息，资本市场反应热烈。但如果问问真正在大模型一线开发的工程师，大多会得到一个残酷的答案：黄仁勋脚下，还藏着一条深不见底的护城河——那就是CUDA生态。

英伟达用了整整15年时间，吸引全球数百万开发者在这个生态里开发、调试，终于打磨出了一套流畅成熟的开发环境，成为AI行业默认的基础设施。

平心而论，如今华为昇腾和其他国产芯片已经在硬件参数上追上了国际水平，但因为缺少成熟的软件生态，模型部署后经常出现运行中断、崩溃的问题，哪怕算力参数达标，实际体验也差强人意。很多手握资金的国内大厂，最终还是只能通过特殊渠道高价求购英伟达显卡。

但再硬的骨头，总得有人啃。在这场摆脱英伟达依赖的算力突围中，已经有少数中国企业选了最艰难的那条路。比如在硅谷都声名远扬的DeepSeek，为了让大模型稳定跑在华为等国产芯片上，直接抽调了核心工程团队，逐行重写底层算子。

这种在技术细节里死磕的代价，就是整个模型的发布进度被大幅推迟。这当然称得上是“孤勇者”的故事，但也暴露出一个现实问题：如果国产大模型只能靠顶尖工程师拼时间、拼体力，去填英伟达15年攒下的生态坑，我们要多久才能真正实现翻盘？或许，我们需要换一条赛道。

PART.02

换道端侧：把智能装进终端设备

硬件端的突破固然重要，但如果只盯着算力硬件，还不足以彻底打破英伟达的垄断。翻一翻科技巨头的财报就能发现一个荒诞的现状：无数产品经理和高管天天绞尽脑汁，想着怎么让用户多对话、多生成内容，怎么多卖API、多卖会员，大厂为了抢市场打起了近乎赔本的API价格战，可最后大部分利润，还是流进了英伟达和云厂商的口袋。说白了，整个AI行业都在给黄仁勋打工。

黄仁勋和云厂商构想的终极商业模式，就是把所有大模型都锁在云端数据中心，让用户永远为Token付费、为算力付费——只要模型还在云端运行，计费表就会一直转下去。哪怕API价格战打得再激烈，只要英伟达显卡还需要供电，AI服务的边际成本就永远不可能降到零。

要彻底终结这种垄断，必须换一个战场，换到英伟达显卡触及不到的地方：那就是端侧模型。

所谓端侧模型，就是直接在用户自己的设备上运行大模型，把AI智能直接放进你口袋里的手机、桌上的笔记本，甚至是手腕上的智能手表。

端侧模型能带来两个颠覆性的优势：

第一就是彻底降低成本。一旦模型在本地设备运行，云端按Token计费的模式就直接被淘汰了。用户不需要每次提问都算着成本控制内容长度，哪怕让AI读几十万字的研报、写一整夜的代码，边际成本都是零，没有中间商赚算力差价，更不需要给任何厂商交算力过路费。

第二是彻底解决隐私问题。AI巨头再也没办法通过云端收集用户数据，企业的机密报表、个人的私密内容，全都牢牢锁在用户自己的设备里，物理隔绝外人访问；哪怕你在没有信号的高铁隧道里，AI依然可以正常运行。

但这条路走起来格外艰难。过去两年，行业里曾经涌出一大批喊着要做端侧大模型、把AI装进手机的团队，可资本是极度现实的：摸爬滚打之后大家发现，做端侧大模型不仅要和硬件的性能极限死磕，而且利润空间极薄，更重要的是，它直接打碎了云端按API收租的完美商业模式，所以很快大部分团队就散去了，大家又转头挤回云端，继续卷千亿、万亿参数的云端大模型。潮水退去之后，端侧赛道变得格外冷清，全球范围内还在坚持做端侧大模型的团队寥寥无几。

目前来看，谷歌Gemma团队、微软Phi团队、阿里通义千问Qwen团队都在布局端侧模型。有意思的是，连卖显卡的英伟达，自家研究院都曾发论文公开表示“小语言模型才是未来方向”。但对这些巨头来说，端侧模型更像是完善产品布局的防御性布局，要让他们亲手砸碎自己躺着赚钱的云端收租盘，难度实在太大。

PART.03

换道超车：自己修出一条新路

前段时间华为的芯片论文让整个行业沸腾，很多人都觉得我们终于看到了掀翻英伟达帝国的曙光。但直到今天，黄仁勋依然穿着他标志性的黑皮衣，站在硅谷AI产业的顶端。

很多人都在问，中国大模型什么时候才能真正实现超越？答案或许从来都不是谁能买到更多显卡、谁能砸更多钱堆出参数更大的模型。真正的超越，从来都是发生在游戏规则被改写的时候。

大模型的上半场，本质上是靠工程师堆代码的手工作坊时代，是比拼买卡囤卡实力的“冷兵器时代”，大家比的是谁家底厚、能从黄仁勋手里拿到更多芯片。但到了下半场，游戏规则已经变了。

在这场摆脱英伟达垄断的突围战里，华为在最底层的芯片硬件上破冰，DeepSeek在算法层面挖潜国产算力，这些玩家没有盲从巨头们“越大越好”的逻辑，没有在旧规则里疯狂内卷，而是选择直接掀掉旧牌桌，开一条新赛道。

多年以后回头看，现在发生的这一切，很可能会成为AI产业静水流深的分水岭。现在硅谷依旧热闹，纳斯达克的指数依然在上涨，黄仁勋的饭局上还是坐满了求购芯片的科技大佬，那个穿皮衣的男人依然站在产业顶端受万人膜拜，巨头们还是在为云端算力杀得不可开交。但在他们看不到的地方，旧秩序的基石已经被悄悄撬动。

在那条拥挤、昂贵还随时可能被卡脖子的英伟达高速路旁边，一群想要突破垄断的创业者已经不再排队等待，他们转过身，开始自己铺一条全新的路。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

华为郑俊：国产大模型结合本土算力已达全球领先水平

国投证券王苏望：推动资本前置赋能，助力硬科技创新早期获取精准金融支持

青梅零食品牌溜溜梅成功通过港交所上市聆讯

“碳水脸”造词背后，不过是吃太饱催生的焦虑生意

辛芷蕾饰演黄柳霜，这个选角真的选对了吗？

项目推荐

AI云印侠

幸福绩效

企业数字化人才孵化系统