2026年4月底:超算系统灵晟完成全机测试引发关注
- 时间:
- 浏览:201
- 来源:南宁市武鸣区陆酷巴网络科技工作室
近日,国家超级计算深圳中心所研发的“灵晟”系统,完成了测试,其采用的是纯国产CPU技术路线,具备超2EFlops的峰值性能,在全球芯片技术竞争加剧这样的背景之下,为中国高端计算开辟出了一条引人瞩目的自主道路。
架构设计
作为构成“灵晟”系统的计算节点,其数量为20480个,每个节点都搭载着两颗国产LX2处理器,构成了该系统的硬件基础。其中的LX2处理器,基于ARMv9架构,在单颗处理器中集成了两个计算芯粒,总共拥有304个CPU核心。整个系统中的处理器总数高达40960颗,CPU核心数量超过245万个,从而形成了一个规模庞大的计算资源池。
对于 LX2 处理器而言,其采用了具备创新性的混合内存设计,每一颗处理器呢,都集成了容量为 32GB 的 HBM 高带宽内存,并且还同时支持外部 DDR5 内存扩展,这样的设计致使 CPU 能够直接于同一内存空间当中去处理大规模的科学数据,显著地减少了在传统异构架构里因数据搬运而产生的延迟以及带宽消耗。
核心技术
处理器的每一个核心,都对Arm的可伸缩向量扩展,也就是SVE,以及可伸缩矩阵扩展,也就是SME,予以支持,它能够对从FP64到INT8等多种精度的计算任务,进行高效处理,还能直接对AI训练与推理给予支持。芯片内部所设置的智能数据移动引擎,也就是SDMA,能够在不同的内存层级之间,自动地对数据实施调度,进而优化了AI工作负载的内存管理效率。
所采用的系统互联运用了自主进行研发的高速网络,该高速网络拥有100万个网络端口。存储系统是由428个节点组合而成的,其总容量达到了650PB,并且能提供高达10TB/s的带宽。全部这些核心组件达成了国产化,从硬件再到软件栈营造了完整的自主技术体系。
性能表现
数据由官方公布,“灵晟”系统持续双精度浮点性能超越2EFlops,演变成世界首台达成此指标的超级计算机,该系统被部署于92个计算柜,36个网络机柜以及67个存储柜内,借助全液冷散热技术,在达成高性能之际有效地把控了能耗。
在分子动力学模拟里,在计算流体力学中,在生命科学数据分析方面,以及在AI大模型训练等诸多实际应用当中,“灵晟”已经呈现出国际领先的计算能力,它的设计目标不是仅仅去追求峰值算力,而是着重于在复杂科学计算场景里的实际有效性能。
行业对比
把国际上流行的那种 “CPU + GPU” 异构超算拿来比较,纯 CPU 系统如果针对稠密矩阵运算讲绝对算力密度,还有能效,通常就没什么优势可得。就此举例来说,有不少大型 GPU 集群,其理论峰值性能能够达到数百 EFlops,而实际有效的算力在现在“灵晟”系统的水准方面,远远超过它呢!
然而,“灵晟”系统的价值存在于其技术路线所具备的独特性以及战略性之中,它有效地规避了异构编程所带来的复杂性,规避了CPU与GPU之间的数据搬运所产生的开销,还规避了对外部GPU加速器以及专属软件生态的依赖,这在当下特定的国际技术环境里有着特殊重要的意义。
应用场景
这个系统特别适宜那种把人工智能与大规模科学模拟深度结合起来的“AI for Science”范畴,它具备统一的大内存空间,这样就能够高效率地处理海量数据集,还能支持长上下文窗口以及检索增强生成等复杂的AI任务。
针对那些涉及不规则控制流的科学计算应用,以及分布式I/O密集型操作的科学计算应用,或者执行模式难以映射到GPU架构的科学计算应用,CPU - only架构展现出天然优势,它能够更顺畅地与现有高性能计算环境集成,去执行传统的科学仿真任务。
战略意义
“灵晟”系统成功被研制而出,是处于美国一直持续限制高端计算芯片,对中国进行出口的背景氛围之下,达成的一次关键性质的突破之举。它象征着中国于高端计算范畴之内,达成了从处理器开始,历经互联网络,直至存储系统的全栈自主且可控的状态,为国家战略计算方面的需求,供应了重要的具备“备份”性质的能力。
核心组成部分,被深圳市科技创新局定位为构建“通用算力 + 智能算力 + 超级算力”一体化体系的,是它。并非意在完全取代 GPU 集群的,是这个系统,它作为一条互补的技术路线,保障国家在极端情况下的计算自主权,并且探索融合计算的新范式。
前行于追逐算力巅峰之征途里,自主可控与其技术多种样态究竟何者为轻何者为重?您觉得那“灵晟”所代表的纯CPU路径能不能够成为往后超算发展的关键重要一极?欢迎于评论区域分享您的看法见解,并且点赞来给予国产科技突破以支持。
猜你喜欢