百万Tokens只需0.1分钱,云天励飞披露未来三年芯片战略
创始人
2026-02-05 21:14:44
0

2月3日,云天励飞举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力AI推理芯片战略布局。云天励飞提出“训练追赶、推理超车”的战略方向,并发布了基于“PD分离”思路的芯片路线图:力争实现百万Tokens推理成本降低100倍以上的目标,推动AI从技术尝鲜走向普惠生产力。

云天励飞董事长兼CEO陈宁指出,训练芯片与推理芯片在算力需求上存在显著差异。训练芯片更侧重“绝对值”,对算力规模、带宽能力以及科学计算的复杂精度要求更高,且对成本相对不敏感;推理芯片的核心考量则在于成本、效率与市场经济学,关键在于每一个Token背后的边际成本与整体性价比。

陈宁表示,公司致力于持续降低百万Token的成本,目标是通过下一代芯片实现“百万Tokens一分钱”。未来三年,公司希望将成本进一步降至“百万Tokens 0.1分钱”,以加速大模型应用的规模化落地。

对于未来五年的中国芯片产业发展,陈宁提出“训练追赶、推理超车”的策略:在训练芯片领域,目标是持续追赶,尽量保持差距不被拉大;而在推理芯片领域,依托中国丰富的应用场景、强大的基础设施能力以及开源模型生态,有机会实现突破与超车。

针对大模型时代云推理场景的需求,云天励飞CTO李爱军在会上介绍了公司的技术解构与路线图。他表示,云天励飞将全力投入云推理场景的大算力芯片研发,基于对大模型推理计算特征的理解,按照“PD分离”的系统架构规划两类大算力芯片:

P芯片(Prefill):面向计算密集型需求设计,满足Prefill阶段的高算力要求;

D芯片(Decode):面向访存密集型需求设计,满足Decode阶段的高带宽需求。

李爱军介绍,公司在芯片微架构层面针对Attention及AFN等计算特点进行细粒度分析,并在底层实现针对性优化。在一个包含1024颗芯片的超节点内,P芯片与D芯片可实现有效组合,以满足大模型云推理的集群化部署需求。

未来三年,云天励飞规划了三代芯片产品:

今年(第一年):打造第一代超节点P芯片,面向百万级长上下文场景进行Prefill推理优化,算力水平对标Hopper架构;

明年(第二年):研发第一代超节点D芯片,聚焦Decode推理的低时延目标,算力水平对标Blackwell架构;

2028年(第三年):推出第二代超节点D芯片,面向毫秒级推理时延目标进一步优化,带动Prefill与Decode性能提升,算力层面有望看齐下一代Rubin芯片。

南方+记者 郜小平

相关内容

热门资讯

股市必读:顺络电子(00213... 截至2026年4月1日收盘,顺络电子(002138)报收于34.03元,上涨2.84%,换手率1.9...
股市必读:先锋电子(00276... 截至2026年4月1日收盘,先锋电子(002767)报收于20.98元,上涨2.19%,换手率1.6...
半导体设备股持续走高 汇成真空... 每经AI快讯,4月1日午后,半导体设备股持续走高,汇成真空20%涨停,此前柏诚股份涨停,波长光电、埃...
股票行情快报:利扬芯片(688... 证券之星消息,截至2026年4月1日收盘,利扬芯片(688135)报收于26.3元,上涨3.02%,...
美亚光电:色选机业务预计保持稳... 2025年,“色选机龙头”美亚光电(002690)重回增长轨道,录得营收24.07亿元,同比增长4....
斯达特电子取得口型板电磁加热装... 国家知识产权局信息显示,沈阳斯达特电子科技有限公司取得一项名为“口型板电磁加热装置”的专利,授权公告...
国光电子申请电池组装方法专利,... 国家知识产权局信息显示,广东国光电子有限公司申请一项名为“电池组装方法”的专利,公开号CN12176...
积成电子最新公告:拟在福州设立... 积成电子(002339.SZ)公告称,根据公司发展战略及业务发展需要,为进一步拓展公司业务领域、提升...
圣邦微电子再次递表港交所 观点网讯:4月1日,圣邦微电子(北京)股份有限公司向港交所提交上市申请书,拟在香港主板上市,联席保荐...
阳光电源2025年第四季度净利... 4月1日,阳光电源(300274)公布2025年年报,报告期内,公司实现营收891.84亿元,同比增...