算力密度翻倍!江原D20加速卡重磅登场,重构AI推理新标杆

2025-11-16

电子发烧友网报道(文 / 莫婷婷)随着AI技术飞速发展,大模型参数规模突破千亿级别,AI推理需求呈爆发式增长。然而,在大模型加速落地过程中,高效、稳定且安全的推理能力成为制约产业发展的关键技术瓶颈。


在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并于今年5月实现量产交付。在大算力AI芯片全流程国产化产业链取得首次突破后,11月11日,江原科技又发布新一代全国产AI加速卡——江原D20,这是中国AI芯片产业迈向自主可控的重要一步。


市场需求驱动下的国产替代加速:从D10到D20的跨越式发展


当前,全球AI技术正从“训练为王”转向“推理主导”,预计2024年推理业务占比为65%,2028年将达73%。国际市场调研机构IDC预测,生成式AI将成为IT增长的核心驱动力,到2028年,GenAI服务器占比将高达37.7%。


但在技术层面,全球半导体供应链面临严峻挑战。美国实施出口管制,英伟达等国际企业禁止向中国市场出售高端GPU产品,国内企业难以获取高性能算力。与此同时,国内AI应用落地需求不断升温,对本地化、安全可控的AI算力平台需求愈发迫切。


在此背景下,江原科技进入国产AI推理芯片赛道,依托本土完整产业链资源,实现芯片设计、制造到封装测试的全流程国产化,为客户提供高性价比、高可靠性的国产替代方案。


江原科技成立于2022年11月,在三年时间里,完成了产业链协同、研发规划与制造工艺的系统性布局,快速实现产品迭代。


2025年5月,江原D10加速卡正式量产交付,其核心搭载江原科技自研的AI芯片。7月,品高股份发布搭载D10加速卡的“品原AI一体机”,推动D10商业化落地。在此基础上,江原科技迅速迭代出D20加速卡。


江原科技CEO李瑛表示:“我们在产品发布前就做好整体规划,所有研发进程按既定路线稳步推进,确保了从D10到D20的快速迭代。”


江原科技联合创始人、CTO王永栋指出,当前行业有两大技术趋势:一是国内私有化部署需求迅猛增长,对数据安全隐私高度重视;二是随着百亿乃至千亿参数大模型成为主流,单卡难以承载部署需求,多卡分布式计算成为常规方案。


同时,存储性能超越算力,成为影响系统综合性能的关键因素。云端和边缘端关注点不同,云端更关注存储带宽以支撑高并发,边缘侧更侧重存储容量。因此,提升单机的算力密度与存储密度,既能降低整机成本,又能支持更大规模模型部署,显著提升性价比,这也是江原科技研发全新国产AI加速卡D20的核心动因。


D20加速卡:一卡双芯、320 TOPS,重构算力密度新标杆


江原D20加速卡采用“一卡双芯”架构,在单张PCIE插槽内集成两颗江原全国产AI芯片,通过先进的PCIe Bifurcation技术,共享一个16 - lane PCIe 5.0接口,实现双芯片直连通信,省去传统多卡系统中昂贵的PCIe Switch芯片,大幅降低成本与功耗。


“一卡双芯”架构有两大优势:一是算力密度翻倍,相比D10,D20的INT8算力提升至320 TOPS;二是存储密度升级,最大支持256GB LPDDR5显存,单台服务器最多可达4T,满足大模型推理对高容量显存的需求。


此外,在功耗控制方面,D20整卡功耗仅为145W,提供主动散热与被动散热两种模式,其多媒体处理能力也很出色,支持256路高清视频解码、20路高清编码。


王永栋表示,“一卡双芯”类产品较少主要受限于软件生态,单卡与多卡在软件层面、执行方式不同,很难做到单卡和多卡同时运行。但在大模型时代,分布式计算框架已成为行业标配。


如今,江原科技构建了完备的软件生态体系。从底层驱动、中间件编程模型,到高性能计算库、通信库,再到主流框架的无缝接入,有效解决了软件生态瓶颈。从GPU迁移到D10只需修改一行代码,从D10升级至D20无需任何改动,全栈软件无缝支持,极大降低了迁移门槛。


从服务器到液冷AI PC,全场景产品矩阵


基于D20加速卡,江原科技升级服务器产品,推出江原D20 4U16卡智算服务器,还推出全新产品桌面型AI PC,构建起覆盖云端、边缘侧和桌面端的完整算力生态。


江原D20 4U16卡智算服务器搭载16张D20加速卡,集成32颗全国产AI芯片,整机INT8算力达5POPS,LPDDR5显存高达4TB,支持PCIe 5.0 x16互联,具备强大的集群扩展能力。得益于D20的低功耗设计,为数据中心客户提供高性价比的算力解决方案。


D20桌面型AI PC系列采用全液冷静音设计,推理运行噪音≤ 30dB,仅为风冷的八分之一;推理运行温度控制在50 ℃以下,比风冷方案降低了35%。


在算力方面,与海外高端GPU产品在桌面端部署场景下的推理性能对比显示,在8B小模型上,双方性能基本持平;在14B和32B大模型中,江原AIPC展现出显著优势。


通过高密度算力和大容量LPDDR5显存的协同设计,江原D20实现了算力与显存的完美匹配,有效弥补了国产AI芯片与海外高端GPU产品工艺制程上的差距。


江原科技针对行业客户与个人用户推出三款液冷静音AI PC:D20s基础版,搭载1块D20,配备Intel i5 CPU与128GB显存;D20d升级版,双D20配置,搭配AMD 7960X CPU;D20q信创版,采用海光CPU + 四张D20,支持Qwen系列480B及DeepSeek - R1 - Distill系列671B满血版部署。


李瑛表示,江原科技的产品不仅支持纯国产信创环境,也面向医疗等对生态兼容性有特定需求的行业客户,公司正积极适配国内外主流操作系统和服务器平台,确保在多样化应用场景下广泛兼容与灵活部署。


江原科技已开放测试平台,累计100 + 客户进行业务测试,涵盖云服务、医疗、能源、传媒、高校、公安等20多个行业。


在D20加速卡发布会上,江原科技与中国电子技术标准化研究院、上海新相微电子、黑龙江振宁科技等战略伙伴签署合作协议。通过技术共研、生态共建、场景共创,江原科技加速推动国产AI从底层芯片到行业应用的深度融合与规模化落地。例如,与新相微合作,双方将联合研发核心硬件,提升视觉计算领域适配能力,共同开发加速卡与传感模组的一体化解决方案,聚焦智能安防、工业视觉等细分场景。


按照产品规划,江原科技的旗舰级芯片T800将在明年量产。从D10到D20,再到即将面世的T800,江原科技在短短三年内实现从产品研发到商业落地的跨越式转变。在此过程中,国产AI推理芯片企业结合中国市场需求特点,开发出有价值的差异化解决方案。


更多热点文章阅读


点击关注 星标我们


将我们设为星标,不错过每一次更新!


喜欢就奖励一个“在看”吧!


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com