时隔9年黄仁勋再给马斯克送货,跳票大半年的AI个人超算登场
等了大半年,DGX Spark 到底有何魅力?

今天星舰第十一飞圆满结束,令人意外的是黄仁勋也现身现场。原来,黄仁勋亲自飞到德州的星际基地(Starbase),在冲天的星舰旁,将一台新“核弹”交到了马斯克手中。这就是大家从年初盼到现在的——NVIDIA DGX Spark 个人 AI 超级计算机。

这一幕让老科技迷们瞬间回忆起 2016 年。当时,马斯克还是 OpenAI 的联合创始人,尚未与奥特曼闹掰,黄仁勋亲自把全球第一台 DGX - 1 超级计算机送到他们初创公司的办公室。

黄仁勋当时开玩笑说:如果这是唯一一个出货的产品,那这个项目造价就高达 20 亿美元了。那台“20 亿美金的大家伙”开启了整个大模型时代。次年 Google 公布了新的神经网络训练架构 Transformer,Sutskever 抓住这次突破,引领 OpenAI 基于英伟达的超级计算机建造出第一个 GPT 模型。
9 年过去,马斯克成了全球首富常客,黄仁勋掌管着一度全球市值第一的公司。而此次英伟达交付的 DGX 不再是庞然大物,而是一台可放在桌边的“性能怪兽”,宣告着一个属于每个人的 AI 超算时代开启。

剧透一下,APPSO 的 DGX Spark 也在运输途中,后续会带来更多体验细节,敬请期待。
实际上,这台 DGX Spark 能交到马斯克手上着实不易。从今年 1 月在 CES 上以“Project Digits”之名惊艳亮相后,英伟达错过了原定的 5 月和夏季发布日期,一直未出货。这大半年的等待让不少人心里没底,一些开发者甚至觉得可能要彻底跳票了。
虽官方未作回应,但行业猜测都指向其核心——Grace Blackwell GB10 芯片。该芯片是“合体金刚”,Blackwell GPU 部分(与 5090 显卡同款架构)早已准备好,可与联发科(MediaTek)共同开发的 Grace CPU 部分生产进度滞后,拖了整个项目后腿。“万事俱备,只欠 CPU”的情况竟发生在了英伟达身上。
那么,在 M3 Ultra Mac Studio 等竞品凭借高内存带宽吸引眼球时,这台姗姗来迟、还比最初传闻贵 1000 美元的 DGX Spark 还值得等待吗?答案是:绝对值得!因为它的独特之处能直击痛点。
等了大半年,DGX Spark 到底好在哪?APPSO 为你回顾。

整台机器的核心是 Grace Blackwell GB10 超级芯片。它将一颗 20 核的 ARM 架构 Grace CPU 和一颗强大的 Blackwell GPU 封装在一起,能提供高达 1 Petaflop(千万亿次)的 AI 计算性能,让用户在桌面就能体验数据中心级别的强大动力。
DGX Spark 还有一杀手锏,即 CPU 和 GPU 通过 NVIDIA NVLink™ - C2C 技术无缝连接,共享一个 128 GB 的统一内存池。该连接技术带宽是传统第五代 PCIe 的 5 倍,确保数据在 CPU 和 GPU 间高速流转且几乎无延迟。
虽其内存带宽(273 GB/s)在纸面上不如 Mac Studio M3 Ultra(819 GB/s),但英伟达采用“大力出奇迹”策略。

在 AI 任务尤其是运行大模型时,能将整个模型一次性装进内存的大容量,战略价值远超单纯的带宽数字。这意味着用户可在桌上流畅运行 2000 亿参数的超大语言模型,无需复杂的模型切分,这种体验独一无二。
Blackwell GPU 配备第五代张量核心(Tensor Cores),支持 FP4/FP8 超低精度格式,性能相比上一代 FP8 提升 5 倍。这如同给 AI 计算开启“涡轮增压”模式,让推理速度大幅提升,能效比也十分出色。
若单台不够,DGX Spark 还内置 NVIDIA ConnectX® - 7 200 Gb/s 网络接口,可轻松将两台设备连接,组成拥有 256 GB 共享内存的微型集群。英伟达称,这样的组合足以处理 4000 亿参数的巨型模型,超出个人开发者想象。
除硬件外,别忘了英伟达强大的软件生态。DGX Spark 预装完整的 NVIDIA AI 软件栈,包括 CUDA 库、TensorRT 和各种 NVIDIA NIM™ 微服务,所有内容都集成在定制的 DGXOS(基于 Ubuntu)上并调校好。这让开发者无需花费时间处理兼容性问题,开箱即可投入使用,节省的时间成本难以估量。
这场在星舰基地的“世纪交接”只是开端。

从 10 月 15 日起,DGX Spark 将通过英伟达官网和全球合作伙伴正式发售,价格为 3999 美元。宏碁、华硕、戴尔、联想等 PC 巨头已第一时间跟进。
实际上,这个价格比最初承诺的 3000 美元贵了 1000 美元,与顶配的 Mac Studio M3 Ultra 相近,但它们定位不同:DGX Spark 预装 DGXOS(基于 Ubuntu),不能安装 Windows 或 macOS,是专为 AI 开发者和硬核玩家打造的“战斗机器”。
其魅力在于,花 4000 美元能获得在本地运行 2000 亿参数大模型的能力,以及整个 CUDA 生态的全力支持。对于需要在本地处理敏感数据、追求极致性能或掌控自己 AI 工作流的专业人士来说,这个价格很有竞争力。
对于这台优缺点鲜明的“偏科生”,你若想了解更多细节,欢迎在留言区告诉我们。
本文来自微信公众号“APPSO”,作者:发现明日产品的,36 氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com

