英伟达CPU野心尽显:巴掌大设备也能跑大模型,首秀便引关注
从个人工作站到AI工作站,市值刚破4万亿美元的英伟达仍在积极拓展业务版图。日前,黄仁勋到访中国,英伟达宣布恢复H20在中国市场的供货,还将推出全新且完全兼容的NVIDIA RTX PRO GPU,黄仁勋称该产品是“为智能工厂和物流打造数字孪生AI的理想选择”。
在稳固GPU市场领先地位的同时,英伟达正加速进军CPU市场。在前段时间的台北电脑展上,英伟达正式发布GB10超级芯片,以此作为进军CPU市场的先锋。此前雷科技曾详细分析过GB10在CPU市场的定位,没想到首款产品这么快就问世了。
最新消息显示,华硕将于7月22日举办发布会,正式推出搭载英伟达GB10的Ascent GX10,华硕称其为“掌上AI超算”。由此不难猜到,Ascent GX10是一款超迷你的AI工作站。

说实话,此前很难想象一台工作站级别的AI PC能做得只有巴掌大小。英伟达似乎正以一种大胆的方式,重塑整个AI PC市场。
巴掌大的工作站,性能是否足够?
从华硕公布的数据来看,Ascent GX10搭载了一颗NVIDIA GB10,算力约为1000 TOPS(FP4),配备128 GB LPDDR5X统一内存,256 - bit位宽,总带宽为273GB/s,标配1TB固态硬盘,官方最高可选配4TB。
从配置上看,其最大特点是高达128GB的内存,不过GB10的内存直接集成在芯片内部,不支持单独升级。英伟达配备如此大容量内存,是为了确保PC性能能满足AI模型的推理需求,后续或许会增加其他内存规格,如192GB版本,以适配更大参数规模的AI模型。

在不考虑其他因素的情况下,这款PC在FP4精度下最高可运行参数规模达200B的AI大模型(FP4精度),FP8精度下则为100B参数规模。虽然与一些大规模的AI模型相比有差距,但已足以部署一个或多个专业垂类AI模型。
由此可见,英伟达对这款产品的定位并非运行超大规模AI模型,而是作为企业的桌面AI解决方案。一些不便放在云端的数据和AI模型可直接在Ascent GX10上运行,避免数据在云端泄露的风险。
不过,这款PC售价高达2999美元(约合人民币21494元),给每人配备一台不太现实。实际上,AI PC工作站与传统PC的使用方式不同,可将其视为部署在身边的小型服务器,周围的PC可通过无线或有线网络连接到Ascent GX10,调用AI功能时将运算交给它。

以这种方式部署,理论上一台Ascent GX10可满足一个小组(10人以内)的轻度AI需求,或4 - 5人的常规AI需求,分摊成本后,其实并不算贵(尤其对欧美企业而言)。
对于AI研究、开发人员来说,Ascent GX10就像一个可随身携带的AI开发套组,性能比一般笔记本电脑强很多,无论接入随身屏幕还是酒店屏幕,都能随时进行AI开发和调试。
据英伟达透露,采用GB10的AI PC工作站均支持双机直连(通过ConnectX - 7),可使算力和统一内存直接翻倍,且性能损失在可接受范围内。这种情况下,将支持最高405B的AI模型运行,参数规模接近满血版DeepSeek的三分之二。
除了作为桌面AI工作站,Ascent GX10仅3L大小的机身使其也成为边缘计算设备的选择之一,可部署在关键边缘网络节点,充当AI推理的计算中枢。

从AI性能看,一台以GB10为核心的Ascent GX10与一张RTX 5070Ti差不多,但RTX 5070Ti性能过高、体积过大,配套硬件多,无法满足对设备体积要求严格的场景,且显存只有16GB,支持的AI模型数量远不及前者。
在迷你AI PC工作站这个领域,以Ascent GX10为代表的产品独具特色,在同等体积下,很难找到性能更强的AI PC。
AI工作站迷你化成新趋势
作为英伟达看重的首款Arm架构CPU,GB10吸引了众多品牌跟进。从小雷查询的信息来看,戴尔、惠普、联想计划在Q3季度发布基于GB10的迷你AI PC工作站,宏碁、技嘉、微星等品牌将在Q4季度跟进,相关产品的测试机已在台北电脑展上展出。
可见,PC市场的一、二线国际品牌基本都参与其中,英伟达的号召力不容小觑。不过,进一步搜索发现,这些品牌的首批产品均属于NVIDIA DGX Spark计划,大概率采用相同的主板设计,只是在外观等方面存在差异。

以华硕为例,其选择了极致小型化路线,3L的体积甚至可单掌托起,是目前已公布的迷你AI PC工作站中最小的,其他几款都在4L以上。尽管外观不同,但硬件规格和接口配置基本相同,小雷猜测售价也会相近。
为了形成竞争优势,一些品牌也打造了独特卖点。比如惠普的ZGX Nano AI Station主要面向媒体与教育市场,预计提供更多多媒体接口;联想则为企业及用户提供全栈解决方案,可帮助客户快速完成Lenovo ThinkStation PGX及周边配套设备(联想的GB10迷你AI PC)的部署。

对于处于AI风口的企业来说,Ascent GX10等迷你AI PC工作站提供了便捷、强大且具性价比的开发平台,这是其他类型PC工作站难以做到的。从某种程度上说,以Ascent GX10为代表的PC正式开启了“个人AI超算”时代。
此前,AI超算型PC体积大、价格高,用消费级显卡组装PC也存在同样问题,而且消费级显卡缺乏足够的开发生态支持,而GB10的出现改变了这一局面。
很多人觉得花两三万买一台迷你PC很贵,但这类产品对标此前售价3万 - 10万元的传统GPU工作站,而非普通个人电脑。对于企业来说,只要产品好用,两三万的生产工具投入成本不算高。
即便Ascent GX10等产品尚未正式开售,从英伟达官网及各品牌描述可知,它们走的是“企业线”,能获得英伟达及品牌供应商的企业生态支持(即使并非全部),具备消费级显卡所没有的优势,更适合AI开发和部署。

对于规模较大或有更高性能要求的企业,GB10的性能可能不够。不过英伟达早有应对之策,在戴尔的Dell Pro Max展示页面中,除了搭载GB10的迷你款,还有搭载GB300的桌面款。后者配置极为强大,拥有496GB LPDDR5内存和288GB HBM3e显存,FP4算力高达20000 TOPS,可支持最高10000B参数的AI模型。
过去,类似算力的AI工作站都是机柜级别,现在却能浓缩到桌面机箱大小的设备中,可见半导体技术发展之快。
雷科技认为,迷你化的AI工作站必将成为未来趋势之一。就像普通计算机从占据整个房间到可随身携带,随着AI需求增长,AI工作站也会朝着个人化、便捷化、一体化方向发展,以适应AI普及的需求。
不得不说,英伟达这一步棋很厉害,英特尔和AMD或许要重新规划自己的AI战略了。
本文来自微信公众号“雷科技”,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




