随着中国AI的快速发展,美国人开始怀疑现实。

2024-12-30

文 | 阑夕


这几天刷推很明显,英语技术社区对中国的感觉很明显。 AI 工业的进步速度处于半振动半懵逼的状态,主要有两个压力来源,一个是宇树(Unitree)轮足式机器狗 B2-W,另外一种是开源 MoE 模型 DeepSeek-V3。


宇树早年基本属于波士顿动力的后续。产品形式完全像猫和老虎。商业上也是低调平替的生态位置,吸引力不大,但从 B 从系列型号开始,宇树的机器狗就能在灵活性上与波士顿动力平起平坐。


B2-W 意外之处在于改变了技术线,取代了运动性更高但平衡性更强的动轮方案。 B2 仍然沿用四条腿的计划,然后在一年内完成了在户外环境中翻山越岭的练习。很多美国人在视频下说这一定是 CGI 这一幕,不知是真是假,还是心态爆炸。


波士顿也在机器狗身上短暂使用了动轮计划,或者说它测量的计划远远超过了宇树——公司的成立时间就在那里——但作为行业先驱,它甚至无法维持一家美国公司的实体。


现代汽车 2020 年以折扣价从软银手中购买波士顿动力,正值软银账户巨亏需要加血,而软银当时又是在 2017 年从 Google 在那儿买到的,Google 为什么要卖呢,因为觉得太烧钱了,亏不起。


这个原因太离谱了。美国的风险资本体系对亏损的容忍度是世界上最高的,没有一个。烧钱画饼对于前沿研究是很常见的——看看硅谷这两年。 AI 上面的投入产出率就明白了——但是波士顿动力为什么要把它作为一种不良资产出售呢?


美国科技行业普遍假装看不到房间里的大象:美国人,今天的美国人,从投资银行到公司,从 CEO 对于程序员,从纽约到湾区,对制造业的厌恶已成为本能。


A16Z 合伙人马克 · 安德森 2011 年于「华尔街 · 日报」我写了一篇广为流传的代表作。「软体吞噬世界」,大概意思是,边际成本极低的软件公司注定要接管所有繁荣的水生植物。与这种可以提供指数级增长的业务相比,其他行业是不够的。


这并非马克 · 安德森的陈述有问题。近十年来的现实走向确实证明了这种规模化盈利的收益是最高的,但美国人的路径依赖必然会导致整整一代人失去制造能力。


这里所说的制造能力的丧失并不意味着制造兴趣或热情的丧失。前段时间去了深圳一家逆向海淘公司。业务是把华强北的电子零件做成可检索的结构化目录,然后提供从采购到检验再到分包的全流程服务。最大的买家是美国的。 DIY 市场和大学生,他们之所以要千里迢迢等上几周,委托中国人去购物,这是因为在诺大的美国,根本找不到供应链。


然后那些学生只有在学习的时候才有机会真正尝试制造一些东西。当他们想在大公司工作领薪时,没有人愿意弄脏他们的手。


但是,软件毕竟离不开硬件运行。即使硬件制造的附加值不够,制造商在收集第一手物理数据的入口后,也只取决于能否建立一个好的工程师团队,反之亦然。如果制造订单长期外包,就会成为产业链的配套设施,无法回来。


因此,像多旋翼无人机和四足机器狗这样的新技术发芽的原型机,通常来自欧美,也就是所谓的试错资本。「从零到一」过程,但是现在「从一到十」在落地阶段,中国的追逐成果将开始密集呈现,进入「从十到百」大规模生产后,中国的供应链成本直接杀死了比赛。


当波士顿动力机器人首次在网上爆红时,Google X 负责人在内部备忘录中表示,他已经和媒体沟通过了,希望不要让视频和 Google 扯上太大的关系,是不是很蒙蔽,这么牛逼的事,你作为母公司不仅不高兴,还想躲起来,现在你知道这样的顾忌从何而来,只是觉得自己是软件巨头。 Google 卷起袖子做的工作太便宜了呗。


当然,美国也有像马斯克这样的建设者。(Builder),但你要知道,马斯克的故事之所以感人,是因为像他这样的人现在极其稀缺,长期不受主流科技行业的欢迎。他们完全依靠逆常识的成就——造车、造火箭、造隧道,这些都是硅谷不敢回避的事情——一步一步打脸出名。


假设宇树在硬件方面引起了一波对现实的怀疑, DeepSeek 然后在软件的原生地盘上,将大模型厂商硬控制。


在微软、Meta、Google 都在冲着 10 当万卡集群进行大模型训练时,DeepSeek 在 2000 个 GPU 上面,花不到 600 万美元和 2 在一个月内,对齐完成了。 GPT-4o 和 Claude 3.5 Sonnet 测试结果。


DeepSeek-V2 一年前火了一波,但是当时的叙事还是比较符合旧版本的预期:中国 AI 公司推出了低成本的开源模式。如果你想成为行业内的价格屠夫,中国人擅长做这种便宜耐用的物品。只要不和顶级商品比较,肯定能用。


但 V3 那就完全不同了,它降低了成本 10 倍数以上,同时质量却可以与之媲美。 t1 营地,关键还是开源,关于推文的评论区都是全部。「中国人是怎么做到的?」


然而,后来的大模型可以通过知识蒸馏来实现更具成本效益的训练。类似于你学习牛顿三定律的斜率下降,也有利于追赶者。肯定比牛顿自己琢磨定律的速度快-成本,但是很难用已知的训练方法来概括不可思议的效率提高。它必须在底层结构上创新,以区别于其他巨头。


另外一个角度更有趣,要是针对中国的 AI 芯片禁售政策的最终后果是,中国大型公司不得不在计算率有限的约束下完成更高效的解决方案。这种适得其反的情节太讽刺了。


DeepSeek 创始人梁文锋之前也说过,公司的贫困从来不是钱,而是高端芯片被禁止。


所以中国的大模型公司,比如字节、阿里这样的大公司,卡可以管够,把年收入的 1/10 取出来卷 AI,没有什么大问题,但是创业公司没有那么多弹药,唯一不能保持牌桌的方法就是玩命创新。


今年,李开复也一直在表达自己的观点,中国做 AI 优点从来不是在没有预算上限的情况下做突破性研究,而是在好、快、便宜、可靠之间找到最优解。


零一和 DeepSeek 用的都是 MoE(混合专家)方式相当于对事先准备好的优质数据进行具体训练。不能说跑分上没有水分,但市场不在乎原理。只要质量和价格足够高,就会有竞争力。


当然 DeepSeek 不同的是,它不太缺卡,2021年 年就囤了 1 万张英伟达 A100,那时候 ChatGPT 还没有影呢,和 Meta 为元宇宙囤卡却阴差阳错地赶上了。 AI 浪潮很像,DeepSeek 购买这么多卡片,就是做量化交易。⋯⋯


我对梁文锋的第一印象是,「西蒙斯传」有他写的序言。西蒙斯是文艺复兴科技公司的创始人。他利用算法模型成为自动化投资的先驱。梁文锋当时负责 600 量化私募亿元,写序属于顺理成章地向行业祖师致敬。


说明这个背景,我想说,梁文锋的几家公司,从量化交易到大模型开发,并不是一个从金融到科技的过程,而是两个应用领域之间数学技能的转化。投资的目的是预测市场,大模型的原理也是预测。 Token。


后来看了几次梁文锋的采访,对他印象很好,很清醒,很聪明,我贴了几段大家感受一下:


「暗涌」:大多数中国公司选择既要模型又要应用,为什么呢? DeepSeek 现在选择做研究探索?


梁文锋:因为我们认为现在最重要的是参与全球创新的浪潮。在过去的很多年里,中国公司已经习惯了别人的技术创新,我们把它们作为实现应用程序,但这不是理所当然的事情。在这波浪潮中,我们的初衷不是借机赚钱,而是走在技术的前沿,促进整个生态发展。


「暗涌」:因特网和移动因特网留给大多数人的惯性认识是,美国擅长技术创新,而中国更擅长应用。


梁文锋:我们认为,随着经济的发展,中国将逐渐成为推动者,而非一直搭便车。三十多年过去了 IT 我们几乎没有参与到真正的技术创新中来。我们习惯于摩尔定律从天而降,躺在家里 18 更好的硬件和软件将在几个月内出现。Scaling Law 同样被这样对待。但事实上,这是西方领先的技术社区一代又一代不知疲倦地创造出来的,只是因为我们之前没有参与这个过程,所以我们忽略了它的存在。


「暗涌」:但是这种选择在中国语境中太奢侈了。大模型是一个沉重的投资游戏。并不是所有的公司都有资本只研究创新,而不是先考虑商业化。


梁文锋:创新的成本肯定不低,过去拿来主义的惯性也和过去的国情有关。但是现在,你可以看到,无论是中国的经济规模,还是字节、腾讯等大工厂的利润,在世界范围内都不低。我们缺乏创新的绝对不是资本,而是缺乏信心,不知道如何组织高密度的人才来实现有效的创新。


「暗涌」:但是做大模型,单纯的领先水平也很难形成更大的优势,大家赌的那更多的东西是什么?


梁文锋:我们看到的是中国 AI 不可能永远处于跟随位置。中国是我们常说的 AI 和美国有一两年的差距,但是真的 gap 就是原创和模仿的区别。假如这一点没有改变,中国永远只能是跟随者,因此有些探索是无法逃避的。英伟达的领先地位,不仅仅是一家公司的努力,而是整个西方技术社区和产业共同努力的结果。她们可以看到下一代的技术趋势,手中有路线图。中国 AI 发展,同样需要这种生态。很多国产芯片无法发展,也是因为缺乏配套的技术社区,只有二手消息,所以中国必然要有人站在技术的前沿。


「暗涌」:很多大型企业都执著地去海外挖人,很多人认为这个领域之前 50 著名的顶尖人才也许都不在中国公司,每个人都来自哪里?


梁文锋:V2 那些没有从海外回来的模型,都是本地的。 50 顶尖人才也许不在中国,但也许我们可以自己创造这样的人。


「暗涌」:所以你对这件事也很乐观?


20世纪80年代,梁文锋在广东一个五线城市长大。父亲是一名小学教师,90年代,广东有很多赚钱的机会,当时有很多父母来我家,基本上是父母觉得读书没用。但是现在回头看,观念都变了。因为钱不好赚,连开出租车的机会都没有了。一代人的时间变了。之后,硬核创新将会越来越多。因为整个社会群体需要接受事实教育,所以现在可能还不容易理解。如果这一社会使硬核创新的人事业有成,集体思想就会发生变化。我们只需要一堆事实和一个过程。


⋯⋯


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com