算力密度翻倍！江原D20加速卡重磅登场，重构AI推理新标杆

2025-11-16

电子发烧友网报道（文 / 莫婷婷）随着AI技术飞速发展，大模型参数规模突破千亿级别，AI推理需求呈爆发式增长。然而，在大模型加速落地过程中，高效、稳定且安全的推理能力成为制约产业发展的关键技术瓶颈。

在此背景下，江原科技推出采用自研AI芯片的AI加速卡江原D10，并于今年5月实现量产交付。在大算力AI芯片全流程国产化产业链取得首次突破后，11月11日，江原科技又发布新一代全国产AI加速卡——江原D20，这是中国AI芯片产业迈向自主可控的重要一步。

市场需求驱动下的国产替代加速：从D10到D20的跨越式发展

当前，全球AI技术正从“训练为王”转向“推理主导”，预计2024年推理业务占比为65%，2028年将达73%。国际市场调研机构IDC预测，生成式AI将成为IT增长的核心驱动力，到2028年，GenAI服务器占比将高达37.7%。

但在技术层面，全球半导体供应链面临严峻挑战。美国实施出口管制，英伟达等国际企业禁止向中国市场出售高端GPU产品，国内企业难以获取高性能算力。与此同时，国内AI应用落地需求不断升温，对本地化、安全可控的AI算力平台需求愈发迫切。

在此背景下，江原科技进入国产AI推理芯片赛道，依托本土完整产业链资源，实现芯片设计、制造到封装测试的全流程国产化，为客户提供高性价比、高可靠性的国产替代方案。

江原科技成立于2022年11月，在三年时间里，完成了产业链协同、研发规划与制造工艺的系统性布局，快速实现产品迭代。

2025年5月，江原D10加速卡正式量产交付，其核心搭载江原科技自研的AI芯片。7月，品高股份发布搭载D10加速卡的“品原AI一体机”，推动D10商业化落地。在此基础上，江原科技迅速迭代出D20加速卡。

江原科技CEO李瑛表示：“我们在产品发布前就做好整体规划，所有研发进程按既定路线稳步推进，确保了从D10到D20的快速迭代。”

江原科技联合创始人、CTO王永栋指出，当前行业有两大技术趋势：一是国内私有化部署需求迅猛增长，对数据安全隐私高度重视；二是随着百亿乃至千亿参数大模型成为主流，单卡难以承载部署需求，多卡分布式计算成为常规方案。

同时，存储性能超越算力，成为影响系统综合性能的关键因素。云端和边缘端关注点不同，云端更关注存储带宽以支撑高并发，边缘侧更侧重存储容量。因此，提升单机的算力密度与存储密度，既能降低整机成本，又能支持更大规模模型部署，显著提升性价比，这也是江原科技研发全新国产AI加速卡D20的核心动因。

D20加速卡：一卡双芯、320 TOPS，重构算力密度新标杆

江原D20加速卡采用“一卡双芯”架构，在单张PCIE插槽内集成两颗江原全国产AI芯片，通过先进的PCIe Bifurcation技术，共享一个16 - lane PCIe 5.0接口，实现双芯片直连通信，省去传统多卡系统中昂贵的PCIe Switch芯片，大幅降低成本与功耗。

“一卡双芯”架构有两大优势：一是算力密度翻倍，相比D10，D20的INT8算力提升至320 TOPS；二是存储密度升级，最大支持256GB LPDDR5显存，单台服务器最多可达4T，满足大模型推理对高容量显存的需求。

此外，在功耗控制方面，D20整卡功耗仅为145W，提供主动散热与被动散热两种模式，其多媒体处理能力也很出色，支持256路高清视频解码、20路高清编码。

王永栋表示，“一卡双芯”类产品较少主要受限于软件生态，单卡与多卡在软件层面、执行方式不同，很难做到单卡和多卡同时运行。但在大模型时代，分布式计算框架已成为行业标配。

如今，江原科技构建了完备的软件生态体系。从底层驱动、中间件编程模型，到高性能计算库、通信库，再到主流框架的无缝接入，有效解决了软件生态瓶颈。从GPU迁移到D10只需修改一行代码，从D10升级至D20无需任何改动，全栈软件无缝支持，极大降低了迁移门槛。

从服务器到液冷AI PC，全场景产品矩阵

基于D20加速卡，江原科技升级服务器产品，推出江原D20 4U16卡智算服务器，还推出全新产品桌面型AI PC，构建起覆盖云端、边缘侧和桌面端的完整算力生态。

江原D20 4U16卡智算服务器搭载16张D20加速卡，集成32颗全国产AI芯片，整机INT8算力达5POPS，LPDDR5显存高达4TB，支持PCIe 5.0 x16互联，具备强大的集群扩展能力。得益于D20的低功耗设计，为数据中心客户提供高性价比的算力解决方案。

D20桌面型AI PC系列采用全液冷静音设计，推理运行噪音≤ 30dB，仅为风冷的八分之一；推理运行温度控制在50 ℃以下，比风冷方案降低了35%。

在算力方面，与海外高端GPU产品在桌面端部署场景下的推理性能对比显示，在8B小模型上，双方性能基本持平；在14B和32B大模型中，江原AIPC展现出显著优势。

通过高密度算力和大容量LPDDR5显存的协同设计，江原D20实现了算力与显存的完美匹配，有效弥补了国产AI芯片与海外高端GPU产品工艺制程上的差距。

江原科技针对行业客户与个人用户推出三款液冷静音AI PC：D20s基础版，搭载1块D20，配备Intel i5 CPU与128GB显存；D20d升级版，双D20配置，搭配AMD 7960X CPU；D20q信创版，采用海光CPU + 四张D20，支持Qwen系列480B及DeepSeek - R1 - Distill系列671B满血版部署。

李瑛表示，江原科技的产品不仅支持纯国产信创环境，也面向医疗等对生态兼容性有特定需求的行业客户，公司正积极适配国内外主流操作系统和服务器平台，确保在多样化应用场景下广泛兼容与灵活部署。

江原科技已开放测试平台，累计100 + 客户进行业务测试，涵盖云服务、医疗、能源、传媒、高校、公安等20多个行业。

在D20加速卡发布会上，江原科技与中国电子技术标准化研究院、上海新相微电子、黑龙江振宁科技等战略伙伴签署合作协议。通过技术共研、生态共建、场景共创，江原科技加速推动国产AI从底层芯片到行业应用的深度融合与规模化落地。例如，与新相微合作，双方将联合研发核心硬件，提升视觉计算领域适配能力，共同开发加速卡与传感模组的一体化解决方案，聚焦智能安防、工业视觉等细分场景。

按照产品规划，江原科技的旗舰级芯片T800将在明年量产。从D10到D20，再到即将面世的T800，江原科技在短短三年内实现从产品研发到商业落地的跨越式转变。在此过程中，国产AI推理芯片企业结合中国市场需求特点，开发出有价值的差异化解决方案。

更多热点文章阅读

点击关注星标我们

将我们设为星标，不错过每一次更新！