黄仁勋谴责美国:把全球AI发展变成一场「围攻游戏」,只有促使对方变得更加优秀

05-23 11:04

2022 2008年,黄仁勋致力于让世界意识到 GPU 计算潜力。如今,随着这一目标的逐步实现,英伟达开始面临芯片控制政策、市场业务发展、技术和产业发展等一系列新问题。


4 几年前,英伟达在中国拥有 95% 市场份额。今日,只剩下了 50%,”不久前举行的“ Computex 2025 事实上,黄仁勋抱怨道,“中国技术(公司)占据了其他份额。如果没有英伟达,他们还会使用很多当地技术。。”


在结束 Computex 2025 个人主题演讲结束后,黄仁勋与海外科技博客 Stratechery 在对话中,这种立场再次被表达出来。他认为,把全世界 AI 发展成了一个围攻游戏,“只会让对方更加出众。”


任何人都认为禁止中国使用。 H20 芯片,可以断开中国的发展 AI 有能力的人,都是极其无知的。。”黄仁勋担心,美国的芯片扩散规则将使中国在非美国建立芯片扩散规则 AI 威胁英伟达的生态系统 CUDA 的地位。



本次采访围绕芯片扩散规则、英伟达和中国等一系列热点话题进行,AI GDP 增长,以及阿拉伯 AI、公司 AI 和游戏等。


在不影响原文疏忽的情况下,学术头条「英伟达和中国」、「AI GDP 增长」、「Dynamo 与全栈英伟达」三个部分内容都是精编的。如下:


"要赢,就不要靠拉别人下马"


黄仁勋探索了美国对中国的芯片限制政策。他提到,限制英伟达进入中国市场可能对美国本身不利,因为这可能会促进中国取代技术的发展。


假如我们不参与中国的竞争,让中国的生态系统自我发展,它就会形成一个丰富的生态系统。。在这个世界不断发展的时候 AI 技术方面,新的平台将会被开发出来,而且这些平台不会来自美国,因此它们的领先地位和技术将会在全球范围内传播。


作为美国科技巨头的负责人,黄仁勋并没有回避爱国主义。“当然,我们希望美国赢,每个公司都希望中国赢。”他立即补充道:"我认为,要想赢,不应该靠拉别人下马,而应该靠自己跑得更快。"对他来说,把整个世界放在一边 AI 发展成了一个围攻游戏,“只会让对方更加出众。”


“他不喜欢通过压制对方来获胜的零和逻辑,”这对我来说毫无价值。我们今天的地位取决于我们自己的努力,而不是外部支持。。”他指出,无论来自哪个国家,“中国都渴望成为一个强大的国家,这本身就是一件值得尊敬的事情,”他指出。


虽然有人认为美国对华出口的控制远没有“完全断开”,但黄仁勋直言:“你说这是‘做到一半’,但我认为‘不进入中国’实际上已经完成了。 90%。”


他指出,政策的变化给市场推广带来了残酷的代价。“我们已经写下了55 亿美金另外,我们还主动放弃了库存损失。150 亿美金销售额,以及大概30 亿美金的税收。”


更加令他担忧的是,英伟达在撤出中国市场后苦心建立起来。 AI 特别是生态系统 CUDA 平台面临系统性威胁,中国可能会建立替代品。“任何人认为禁止中国使用它。 H20 芯片,可以断开中国的发展 AI 有能力的人,都是极其无知的。


全球范围内的机器人将扩大 GDP


将英伟达定义为黄仁勋「基础设施公司」:“如果你像往常一样,密切关注我的主题演讲,你会发现现在正在发生的事情,我正在发生。 5 几年前就谈过了。尽管如此 5 多年前的叙述中,用词并不那么清晰准确,但发展方向始终如一。


正是这样,他自信地说:"我已经讨论过机器人了 3 几年后,我们将看到它真正落地。”


真正让他感到意义重大的是,他一直处于“信息技术”之中。(IT)“行业,将跨越传统 IT “我们过去的预算界限,” 60 年一直在 IT 在预算中运行,但随之而来 AI 随着制造预算的到来,我们将进入制造预算,甚至进入运营支出预算。从 1 亿美元级别 IT 市场,迈向 50 全球资本支出万亿美元(CapEx)和经营开支(OpEx) 市场


黄仁勋还表达了自己对“机器人取代人工”隐性焦虑的想法:


他说:“虽然这个职位会改变,有些工作可能会消失,但是同时也会创造很多新的工作。采用实体机器人 agent 机器人系统极有可能扩展全球 GDP。这是因为我们目前的劳动力仍然供不应求,每个人仍然可以找到工作。例如,由于劳动力不足,美国的失业率处于历史低位。餐馆很难招到足够的员工,许多工厂也很难招到足够的工人。


我觉得,假如每年都可以 10 雇佣一个机器人一万美元,每个人都会毫不犹豫地去做。原因是,这将提高他们带来更多收入的能力。因此,我认为,在未来 5 到 10 在过去的几年里,我们可能会看到 GDP 增长,以及一个全新的行业——这些「token 制造系统」,每个人都会逐渐理解他们。”


价值取决于产生高质量的价值。 token


在今年 GTC 在会议上,黄仁勋展示了他对未来计算结构的理解。他提出了一个基本问题:无论数据中心的总能量是有限的, 100 兆瓦还是 250 兆瓦,真正决定价值的是如何利用这些能源产生尽可能高的质量。 token



他说:“我会毫不犹豫地选择雇佣一个年薪。 10 一万美元的智能体。”因为企业雇佣一个人几十万美元,如果可以的话, 10 一万美元显著提高了这些人的效率,这是显而易见的(明智)选择。


黄仁勋认为,现在的 AI 覆盖帕累托分布的工厂需要处理。 token 需求曲线:创建一个系统可以同时满足不同的需求,并且可以在基础服务中免费生成。 token,生成高质量的任务,目标复杂,任务要求高。 token。


这个问题提出了一个结构问题:不能只针对某一种 token 做出最佳设计。他强调,如果结构过于碎片化,在不同部位之间来回移动工作负荷将变得困难;在高速公路上设计一个 token 当系统在速率方面表现出色时,其整体吞吐量一般会很低——“你可以依靠它 X 做一个轴(低延迟)点,或者贴在上面。 Y 轴(高吞吐)做一个点,但是很难覆盖整个帕累托曲线。


针对这一情况,英伟达推出了 Dynamo,面向推理的数据中心级系统。Dynamo 在测量工作量和处理器负荷的同时,将所有处理过程分解,并在数据中心智能地分散这些处理任务,这确实是一件非常复杂的事情。


对黄仁勋来说,大模型推理并非单一任务。,这是一种预填充物(pre-fill)与解码(decode)组成链式过程。预填充阶段需要从客户的对话历史和文档中提取信息,形成前后文本,这是一个极度依赖浮点计算的过程;解码阶段就像“思考”和“推理”,更依赖带宽,但对精度的要求没有那么高。


“Dynamo 本质上是一个 AI 工厂操作系统。”黄仁勋说,Dynamo 也就是在处理这些差异很大的需求时,智能分配的核心系统,使整个数据中心看起来很“很好” GPU"同样的调度资源,使 token 每次生成都都要尽可能高效。


完整的采访链接:


https://stratechery.com/2025/an-interview-with-nvidia-ceo-jensen-huang-about-chip-controls-ai-factories-and-enterprise-pragmatism/


本文来自微信微信官方账号“学术头条”(ID:SciTouTiao),作者:学术头条,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com