灵晟超算登顶TOP500，不用一颗英伟达芯片，它到底靠什么跑出2EFlops？

灵晟超算登顶TOP500，不用一颗英伟达芯片，它到底靠什么跑出2EFlops？
它不是靠GPU堆出来的，也不是靠国外技术改的，就是一排排国产CPU硬干出来的。
2026年6月榜单一出，很多人盯着那行“2.198 EFLOPS”发愣——这数比美国El Capitan还高，但全靠CPU，没用GPU。
这事挺实在的。不是吹，是真干出来了。245万个CPU核心，全装在2万多个机柜里，每个节点插两颗LX2芯片，一颗304核，加起来刚好够跑地球模拟这种大活。实测跑63亿参数模型时，BF16实际算力到了1.543 EFLOPS，没虚标，是实验室里一锤一锤测出来的。

LX2芯片很关键。它用ARMv9架构，但自己加了SVE和矩阵扩展，还搞了个片上HBM+DDR5混搭内存，32GB HBM带宽飙到4TB/s，数据不用来回搬，CPU自己就能喂饱自己。更狠的是，它把矩阵加速单元直接塞进CPU里，不是插个协处理器，是真正在核心里算矩阵，AI任务和科学计算用同一套指令跑。
“灵渠”网络也挺猛。百万级端口，双平面胖树结构，单节点带宽1.6Tb/s，200万核心一起干活不卡壳。散热也下了功夫，全液冷+三维浮动正交设计，整套系统功耗42.2MW，看着比富岳高，但算下来每瓦算力是它的三倍多。

软件也不含糊。麒麟OS、自研编译器、国产AI框架全链路打通，PyTorch能直接跑，FP64/FP32/BF16/INT8全支持。以前说CPU不适合AI，现在实测打脸了——不是不能，是以前没这么干。
这条路不是被逼急了才走的。从京到富岳再到灵晟，ARM超算路线走了十五年，LX2是水到渠成。制裁是导火索，但底子是早打好的。神威·太湖之光突然退出榜单，不是没能力，是那时候还没到亮剑的时候。灵晟敢报实测数据，说明真不怕比。

全球超算现在有三股劲儿：美国靠英伟达GPU堆，欧洲跟着AMD走半自主，日本还在等ARM新芯片。中国这次没跟风，用纯CPU拿下2EFlops，等于立了个新标准——算力强不算完，还得自己说了算。
名字叫“灵晟”，LineShine，意思是灵性闪耀。它亮的不是光，是芯片设计图上一根根布线、代码里一行行调度逻辑、散热铜管里一滴滴冷却液。

它跑起来了。

泡泡资讯网

灵晟超算登顶TOP500，不用一颗英伟达芯片，它到底靠什么跑出2EFlops？

热门分类