泡泡资讯网

灵晟超算登顶TOP500,不用一颗英伟达芯片,它到底靠什么跑出2EFlops?

灵晟超算登顶TOP500,不用一颗英伟达芯片,它到底靠什么跑出2EFlops?
它不是靠GPU堆出来的,也不是靠国外技术改的,就是一排排国产CPU硬干出来的。
2026年6月榜单一出,很多人盯着那行“2.198 EFLOPS”发愣——这数比美国El Capitan还高,但全靠CPU,没用GPU。
这事挺实在的。不是吹,是真干出来了。245万个CPU核心,全装在2万多个机柜里,每个节点插两颗LX2芯片,一颗304核,加起来刚好够跑地球模拟这种大活。实测跑63亿参数模型时,BF16实际算力到了1.543 EFLOPS,没虚标,是实验室里一锤一锤测出来的。

LX2芯片很关键。它用ARMv9架构,但自己加了SVE和矩阵扩展,还搞了个片上HBM+DDR5混搭内存,32GB HBM带宽飙到4TB/s,数据不用来回搬,CPU自己就能喂饱自己。更狠的是,它把矩阵加速单元直接塞进CPU里,不是插个协处理器,是真正在核心里算矩阵,AI任务和科学计算用同一套指令跑。
“灵渠”网络也挺猛。百万级端口,双平面胖树结构,单节点带宽1.6Tb/s,200万核心一起干活不卡壳。散热也下了功夫,全液冷+三维浮动正交设计,整套系统功耗42.2MW,看着比富岳高,但算下来每瓦算力是它的三倍多。

软件也不含糊。麒麟OS、自研编译器、国产AI框架全链路打通,PyTorch能直接跑,FP64/FP32/BF16/INT8全支持。以前说CPU不适合AI,现在实测打脸了——不是不能,是以前没这么干。
这条路不是被逼急了才走的。从京到富岳再到灵晟,ARM超算路线走了十五年,LX2是水到渠成。制裁是导火索,但底子是早打好的。神威·太湖之光突然退出榜单,不是没能力,是那时候还没到亮剑的时候。灵晟敢报实测数据,说明真不怕比。

全球超算现在有三股劲儿:美国靠英伟达GPU堆,欧洲跟着AMD走半自主,日本还在等ARM新芯片。中国这次没跟风,用纯CPU拿下2EFlops,等于立了个新标准——算力强不算完,还得自己说了算。
名字叫“灵晟”,LineShine,意思是灵性闪耀。它亮的不是光,是芯片设计图上一根根布线、代码里一行行调度逻辑、散热铜管里一滴滴冷却液。

它跑起来了。