泡泡资讯网

虚假算力繁荣 低效 GPU 正在白白浪费电费 想知道谁在裸泳?查查他的CPU利

虚假算力繁荣 低效 GPU 正在白白浪费电费

想知道谁在裸泳?查查他的CPU利用率。

最近发布的中信证券研报里其实暗含了一个判断逻辑:很多大模型公司宣称日活百万,但算力成本高到穿帮。根本原因在于,如果CPU负载没上去,意味着分配给GPU的Batch Size很小,能效比极低。

说白了,GPU跑得爽不爽,全看CPU喂得快不快。没有足够的并发请求,再贵的H100也是在那里空转耗电。优秀的调度系统能让GPU利用率干到70%以上,差的则一直在20%晃悠——电费一样交,活儿只干了三分之一。

这堂“调度课”,不只是软件问题,更是硬件选型问题。选对了能动态调频的x86 CPU,电费能省下一大截。

拿海光来说,2025年官方口径明确提到CPU产品在能效比等核心指标上实现进一步突破。更扎实的佐证来自SPEC Cloud IaaS 2018权威测试——搭载海光C86的服务器跑出91.6%扩展性、27秒实例就绪,读写延迟低至4.073ms/2.183ms。这种云平台能效表现,本身就是能效比的有力印证。

所以以后看一家AI公司,别光听他报买了多少张卡,问问CPU利用率是多少。数据不会撒谎。