当AI大模型训练周期从3个月压缩至1周;当国产GPU算力利用率从30%跃升至80%;当万亿参数模型数据交互时延进入微秒级。这些看似分散的技术突破背后,都指向同一个核心命题:在算力持续爆发的今天,存储如何成为驱动计算效能释放的关键变量?
近日,第二届CCF中国存储大会在武汉召开。曙光存储正式宣布:“超级隧道”技术将标配于曙光全线高端存储产品,且已具备更好应对PCIe 6.0标准的能力。这一布局,既是对当前AI、科学计算等场景高性能需求的精准回应,更提前为下一代国产芯片筑牢了存储底座,在PCIe总线标准迭代的关键节点,为国内存储产业开辟了新路径。
曙光存储副总裁 郭照斌
“超级隧道”全线标配:破解高端存储性能释放难题
在当前AI大模型训练、科学计算、低空经济等场景需求爆发的背景下,存储性能已从辅助支撑变为核心制约。传统存储系统即便搭载高性能硬件,也常因软件协议桎梏、数据传输损耗等问题,导致硬件潜力仅能发挥30%-40%。
曙光此次将“超级隧道”技术全线标配于高端存储产品,正是针对这一行业痛点的系统性突破。该技术基于无锁架构、极简交互及软硬件协同三大核心设计,通过五大关键技术重构存储性能逻辑:
一,采用国产C86架构的高速硬件底座,搭配存储专属硬件平台,解决内部访问时延与资源竞争问题;二,基于CPU NUMA、CCX架构进行微控划分,将硬件拆解为多个逻辑独立的数据通道,让每个IO请求直达目标;三,通过零中断技术消除被动调度干扰,确保业务请求响应时间可精确计算;四,零竞争设计避免多任务资源争抢,即便在AI训练与科学计算混合负载场景下,性能波动也能控制在5%以内;五,零拷贝机制省去数据在内存、CPU、网卡间的冗余传输,将数据落盘时延压缩至硬件物理极限。
从实际应用效果来看,搭载“超级隧道”的曙光集中式全闪存储产品已实现亿级IOPS性能与202微秒级时延,在AI加速场景中,推理时延降低80%。曙光分布式存储系统,通过“五级加速+三级协同”技术,可将GPU利用率从30%-40%提升至70%-80%,训练速度提升4倍,万亿参数模型训练周期压缩60%以上。
笔者认为,这种全线标配的策略,体现出曙光存储对行业需求的深刻判断。随着AI技术从训练向推理落地渗透,从科研机构到企业用户,对存储性能的需求已从局部高端转向全面可靠。将核心技术规模化应用于高端产品线,不仅能避免用户因技术碎片化导致的兼容难题,更能通过批量落地进一步优化成本,打破高性能必高成本的行业误区。
前瞻应对PCIe6.0:为国产芯片生态筑牢存储底座
如果说“超级隧道”的全线标配是对当前存储需求的回应,那么其“更好应对PCIe 6.0标准”的能力,则彰显出曙光存储的技术前瞻性。
作为新一代总线标准,PCIe 6.0具备128GB/s单通道带宽、PAM4编码抗干扰等优势,本应成为解决算力与存力失衡的关键,但传统存储系统却面临硬件升级、软件滞后的困境,依赖操作系统通用IO协议的传统架构,会导致数据传输过程中的软件损耗高达硬件理论性能的60%以上,即便搭载PCIe 6.0硬件,实际性能也难以突破瓶颈。
曙光“超级隧道”技术的核心创新,恰恰在于提前打破了这一桎梏。不同于行业内先做硬件适配、再补软件优化的被动模式,“超级隧道”从设计之初就以软硬件协同为核心逻辑:
在硬件层面,采用兼容PCIe 6.0电气特性的国产控制器,提前完成与新一代硬件的兼容性测试;在软件层面,通过自研协议栈直接对接硬件接口,跳过操作系统中间调度环节,将软件损耗降低至5%以下。
曙光存储副总裁郭照斌在大会上透露,未来用户只需通过固件升级,即可实现现有“超级隧道”存储系统从PCIe 5.0到6.0的性能跃迁,无需大规模改造架构,这意味着当前选择曙光高端存储的用户,能无缝衔接下一代硬件生态,避免技术迭代即设备淘汰的资源浪费。
从产业视角来看,这种对PCIe 6.0的前瞻应对,更对国产芯片生态具有战略意义。长期以来,国产GPU、AI芯片在性能追赶过程中,常因存储系统适配性不足难以发挥全部实力。而“超级隧道”技术通过定制化硬件接口与协议优化,可针对不同国产芯片的计算架构、数据交互模式进行深度适配,形成芯片与存储协同加速闭环。
这种协同不仅体现在性能适配,更延伸至生态共建。在CCF曙光存储分论坛上,武汉大学、华中科技大学、西湖大学的学者与大普微等企业代表共同探讨AI存储架构创新时,一致认为存储与芯片的协同研发将成为突破AI能力边界的关键。
存储产业的价值重构:从“被动承载”到“主动赋能”
曙光存储“超级隧道”技术的全线落地与PCIe 6.0应对能力,背后折射出的是整个存储产业的角色转变。在AI与高端计算深度融合的今天,存储已不再是“被动承载数据的容器”,而是“主动赋能算力释放、驱动产业创新的核心基础设施”。这种转变,正深刻影响着行业的发展逻辑。
从需求端来看,用户的核心诉求已从存得下转向存得快、用得高效、成本可控转变。以AI大模型训练为例,传统存储需要3个月完成的GPT-4级别模型训练,借助“超级隧道”技术可压缩至1周,这不仅降低了算力成本,更让科研机构、企业能以更快的迭代速度推进技术创新,这种效率提升带来的价值,远超存储硬件本身的成本。
从产业竞争来看,“超级隧道”技术的突破也打破了国外厂商在高端存储领域的长期垄断。此前国内高端存储市场长期被国外品牌占据,不仅成本高昂,且在与国产芯片的适配性、数据安全自主性等方面存在短板。
而曙光通过21年存储研发积累,已实现从硬件到软件的全栈自主可控,其“超级隧道”技术在性能、成本、生态适配性上的综合优势,正推动国内高端存储市场格局重构。
展望未来,随着PCIe 6.0时代的正式到来与国产芯片生态的成熟,“超级隧道”技术的价值将进一步释放。一方面,其低阻数据通道将为智算中心、国家科学装置等大型基础设施提供支撑,助力我国在AI for Science、量子计算等前沿领域的研究突破;另一方面,其软硬件协同理念也将推动存储产业从硬件比拼转向生态共建,形成存储-芯片-应用的良性循环。
在AI与算力革命的浪潮下,“超级隧道”技术所代表的“以存提算、以存代算、以存降本”理念,或将重新定义存储产业的价值,为我国数字经济的高质量发展注入更强的存力动能。