专栏观察

堆卡时代终结:AI算力基础设施迎来“系统重构”时刻

作者 | 曾响铃

文 | 响铃说

2026年,中国AI算力投资持续攀升。

但背后,有一个现实很扎心。在万卡集群里,近一半算力其实在等数据,不是在算。对此,超聚变CEO刘宏云在5月20日的探索者大会上算了一笔账——同样的硬件,经过调优后有效Token产出能差出40%到50%。

换句话说,你买的算力,可能一半在空转。

这不是某一家的问题。千亿参数大模型训练已成常态,万卡乃至十万卡集群的规模竞赛正在跑,行业却集体撞上了一堵看不见的“墙”——堆再多的卡,算力效率也没法线性增长。

时至今日,算力竞争的逻辑正在翻转。过去迷信“造出更强的芯片”,现在胜负手已然变成了“把更多芯片高效组织起来”。万卡至百万卡集群的建设,说到底是场从“堆砌算力”到“组织算力”的工程革命。

在这场大会上,超聚变中央研究院总裁范瑞琦发布了面向万卡至百万卡集群的新一代算力基础设施参考架构——宏机柜方案。站在整个行业困局来看,这不是一次常规产品迭代,而是整个行业“从堆卡到组系统”的一个关键切片。

为什么“堆卡”模式走到尽头?

砸了钱,效率却上不来。根本原因不在技术bug,而在传统算力架构的结构性缺陷。具体看,有四堵“看不见的墙”。

首先是通信墙。传统以太网(Scale-Out)是星型拓扑,节点间通信得经交换机转发。集群从千卡扩到万卡,参与同步的节点翻了十倍,通信冲突却呈指数级膨胀。在这种情况下,端到端延迟从微秒累积到了毫秒,万卡级分布式训练中网络通信耗时占比更是达到30%-50%。

但是,带宽从不是问题,拓扑结构才是。由此,必须引入Scale-Up架构,做芯片间百纳秒级的高速直连,通信开销才能压下来。

其次是散热墙与能耗墙。当AI芯片功耗突破1000W,单机柜功率密度奔着100kW去了。传统风冷在30kW/柜以上基本失效,液冷从“可选”变成“必选”。

但散热不是单点问题,它牵出一个更硬的骨头——供电。范瑞琦在发布中给了一组数据:672颗GPU同时运转,整机柜功耗130万瓦。如果沿用传统的48V/54V供电,电流会飙到2400安培,线缆粗到塞不进机柜。800V高压直流是唯一解。

在今年,“算电协同”首次写入政府工作报告,HVDC、SST等高压供电架构面临刚性升级。也就意味着,散热和供电不再是配角,而是系统能不能转起来的硬约束。

最后是工程墙。众所周知,传统IDC是为通用服务器托管设计的——标准机架、风冷散热、分散供电、现场组装。但是,AI训推要的是高密度、预集成、一体化的“算力工厂”。这就导致了现场组装、分散供应已经跟不上万卡集群的交付效率和稳定性要求。预集成、预验证的整机柜交付,成了工程化刚需。

这三堵墙指向同一个结论:算力基础设施的“单品思维”已经走到尽头。这不是换个更快的芯片、加个更强的散热风扇能解决的问题,而是需要从系统层面重新设计——从“堆更多卡”转向“把卡更好地组在一起”。

2026,走出了一条系统重构的“中国路径”

超节点的出现,正是对以上这一命题的回答。

那什么是超节点?

它的本质是一场算力系统的“集装箱革命”。

传统模式下,每台服务器独立部署、现场组装,就像海运时代的散货运输——效率低、成本高、标准化程度差。超节点则将数十至数百颗AI芯片、液冷系统、供电模组、高速互联在整机柜层面深度紧耦合,形成一个预集成、预验证的算力单元。

这就像集装箱标准化对海运业的改造——从散货船到集装箱船,装卸效率提升了数十倍。具体到算力领域,超节点将部署周期从“周级”压缩到“天级”,将通信瓶颈从毫秒级压回纳秒级,将供电和散热从“现场解决”变为“工厂预置”。

从这个角度看,超节点不是“更快的服务器”,而是一个新的算力组织单元。它解决的不是单点性能问题,而是大规模集群的系统效率问题。

超聚变此次发布的宏机柜方案,正是这一思路的工程化落地。具体的,单个机柜容纳672颗GPU,整机柜功耗130万瓦,采用800V高压直流供电和全液冷散热,支持448G至1T的光纤全互联。

但比这些参数更值得关注的,是背后的设计逻辑——所有组件围绕“系统效率最大化”,而非“单点性能最大化”来定义。

因此,如果把超节点仅仅理解为硬件集成,就错过了这场变革的另一半。

算力本身不是目的,Token才是。

超聚变CEO刘宏云在演讲中把定位说得很直白:做企业的“Token工厂”——把算力转化为可度量、可结算、可服务化的Token输出。他算过,同样的硬件经过调优后,有效Token产出可以相差40%-50%。

换句话说,算力到Token的转化效率,才是客户真正关心的价值指标。

这才是超聚变将其定位为“水平全栈解决方案提供者”的根本原因。新一代宏机柜方案作为底层基础设施,向上需要对接数据&AI平台和核心商业流程软件,形成“算力-数据-应用”的完整闭环。

对此,超聚变算力事业部总裁唐启明在大会上阐释了这一逻辑:“传统算力负载的尺子是Watt到FLOPS,那不是客户价值的终点。今天我们重构了一条新的价值链,面向智能体负载的新尺子——Token。Token Factory不是一台设备,而是企业在AI时代新的生产力平台。”

从这个视角看,超聚变此次发布的意义就清晰了——它不是在做一次硬件升级,而是在搭建从“底层算力”到“上层业务价值”的完整转化通道。在这里,硬件是载体,软件是引擎,系统集成能力才是护城河。

超节点,开启算力价值的下一场全面战争

2026年被行业视为国产超节点产业化放量的元年。很显然,超聚变选择在这个节点发布,正是要在技术路线未定、格局未分的窗口期抢占定义权。

具体来看,其底气来自两方面。一方面,超聚变标准液冷服务器连续三年国内份额第一,累计部署超10万节点,液冷AI开放联盟已形成产业影响力。另一方面,从芯片互联、供电方案到液冷散热、整机柜管理,超聚变已经覆盖“算、电、热、网、管”全栈——这种端到端的工程能力,决定了一家厂商能否真正交付可规模部署的超节点方案,而非停留在PPT层面。

到这里,系统重构的方向已经明确,超节点方案的技术可行性也已得到验证。但还有一个更根本的问题摆在面前——这条路,靠一家厂商能走通吗?

答案是否定的。算力基础设施的系统重构,本质上是一场产业链协同的工程革命,而非某家公司的单点突破。

超节点方案涉及芯片、网络、供电、散热、整机集成、软件平台等多个环节,任何一个环节的短板都会成为整个系统的瓶颈。更重要的是,这套方案要真正大规模落地,还需要获得下游客户的规模化采购验证,以及上游芯片厂商、中游ISV的生态支持。

这正是超聚变选择“水平全栈”定位的深层逻辑——不碰行业垂直业务,不试图通吃,而是做“能力底座”,让专业的人做专业的事。其“1+3+N”生态战略(1个硬件系统,3层能力:模型、AI Native调优、工具链,N个垂类ISV伙伴)回答的,就是这个问题。

简单来说,超聚变做的是“标准化的通用底座”,而上层的行业应用、垂类优化交给合作伙伴。

但这里存在一个结构性的张力。一方面,超节点方案为了追求极致性能,天然倾向于“封闭优化”——芯片、互联、供电、散热高度耦合,形成一个紧密集成的系统。另一方面,生态的繁荣需要“开放标准”——让不同厂商的芯片、不同ISV的应用能够低成本接入。

对此,范瑞琦在发布会中明确表态“架构开放,能力共享”,并感谢了博通、盛科、云河等多家网络交换芯片厂商的支持。但“开放”与“性能”之间的平衡,从来不是一句口号能解决的,它需要在实际工程中反复取舍。

更现实的压力来自价值链的重构。硬件厂商面临毛利率被芯片成本压缩的困境,必须从“卖盒子”转向“卖系统”。芯片厂商则面临“被集成”的风险——如果超节点成为标准,芯片会不会沦为看不到用户的标准化部件?头部云厂商则有自研冲动,试图“去中介化”,将算力基础设施的控制权收归己有。

那么,在这场博弈中,超节点方案要想真正成为主流,必须让产业链上的每个角色都找到“为什么我要跟你玩”的理由,而不是仅仅靠技术领先。

从目前的信息来看,超聚变在走一条“以开放换生态”的路。液冷AI开放联盟、宏机柜参考架构的开放设计、对多厂商芯片的支持,都是在降低生态伙伴的接入门槛。但这条路能否走通,最终要看一个朴素的商业逻辑——合作伙伴能否在这里赚到钱,能否比自己做或跟别人合作赚得更多。

写到最后

从堆卡到组系统,从拼参数到拼效率,算力基础设施的系统重构已经开场。但是,算力基础设施的终局,从不是造出更快的超节点,而是让千行百业的企业客户“像用电一样用算力”。

2026年超聚变的这场发布只是起手式。接下来的工程化落地、生态构建、商业验证,才是决定谁能留在牌桌上的硬仗。而这场硬仗的胜负,或许要等到三五年后,当第一批大规模部署的超节点集群交出真实的运营账单时,才能见分晓了。

*本文图片均来源于网络

 

×
正在为您生成精美海报...
堆卡时代终结:AI算力基础设施迎来“系统重构”时刻
2026算力基础设施的“超节点”元年:从堆卡到组系统,中国路径如何破局?...
希望看到您的想法,请您发表评论x