AI越火,液冷越忙
曙光发布scaleX640超节点以来,让越来越多人开始关注液冷技术。
事实上,很多人不知道的是,曙光并不是AI热潮之后才布局液冷,而是从2011年就开始投入液冷研发,已经持续积累十余年。
随着AI训练进入万卡时代,液冷正在从幕后走向台前,而曙光恰好是国内最早一批把液冷做到规模化应用的企业之一。
过去讨论AI,大家关注的是芯片性能、模型参数和训练规模。但最近一年明显不一样了,越来越多人开始讨论电费、能耗和PUE。
原因很简单。
算力增长速度远远快于散热能力增长速度。当一台服务器、一组机柜甚至一个万卡集群持续高负载运行时,热量管理直接决定系统稳定性和算力利用率。
这也是为什么液冷突然成为行业热点。
从公开资料看,曙光已经形成冷板液冷、浸没液冷、相变浸没液冷等完整技术路线。2019年率先实现全球首个刀片式浸没相变液冷大规模商业部署,单机柜功率密度达到160kW;而在最新发布的scaleX640超节点上,又进一步采用浸没相变液冷和算存网电冷一体化设计,实现单柜640卡部署,PUE约1.04。
我觉得一个很有意思的变化是:
AI竞争进入下半场之后,比拼的已经不只是芯片,而是芯片、网络、供电、散热和软件协同能力。
液冷正在从“配套设施”变成“基础设施”。
而那些十年前就开始布局液冷的企业,正在迎来属于自己的时代红利。
曙光 液冷 AI 智算中心 超智融合
曙光 液冷 智算中心 超智融合 AI
