AI 機架功耗飆升,驅動數(shù)據(jù)中心電源與散熱方案全面迭代
在生成式 AI 的帶動下,數(shù)據(jù)中心的單加速卡功耗從幾年前的約 100W 快速上探至 >1000W;隨之而來的是機架級功率從傳統(tǒng)的 20–30kW,提升到 >100kW,并被多方機構與產(chǎn)業(yè)報告預測將向 數(shù)百千瓦/機架演進。這一躍遷使傳統(tǒng)的 12V 架構、風冷與房級 UPS 體系逐漸逼近物理與運營極限,電源分配、冷卻、備電與微電網(wǎng)正在迎來系統(tǒng)性重構。
機架功率的“新常態(tài)”
100kW 級機架正成為 AI 集群的現(xiàn)實門檻,網(wǎng)絡設備商的技術簡報亦給出“AI 驅動機架容量可達 100kW”的工程參考上限。更激進的前瞻方案已將單機架電力向 MW(兆瓦)級規(guī)劃,并圍繞 800V 直流母線展開聯(lián)合研發(fā)。
能源研究機構同時提醒,若 AI 增長曲線維持現(xiàn)狀,2030 年 AI 峰值功率或達 50GW 量級,對電網(wǎng)與選址提出全新約束。
架構升級一:從 12V 到 48V/高壓直流(HVDC)
板/柜內配電電壓提升成為第一選擇:用 48V 替代 12V 可把母線電流降至 1/4,顯著降低銅損與線纜截面需求,提升布線密度與可靠性。新一代 CRPS/OREV(OCP ORv3)電源與機架總線銅排(busbar),在 48V 體系下實現(xiàn)熱插拔與盲插對接,縮短維護停機時間。
更高電壓向上延伸:為緩解配電干線與列間配電損耗、支撐 >100kW/機架,運營商正評估 380–800V 直流電源干線進入機房,至機架側再降壓到 48V/12V。工業(yè)電氣企業(yè)已與加速器生態(tài)合作,以 800VDC 為 1MW 機架做預研。
架構升級二:電源電子從硅走向 GaN / SiC
在高電壓、高頻、高功率密度的目標下,GaN/SiC 功率器件逐步進入數(shù)據(jù)中心電源:
PFC 與一次側變換采用 SiC,可在高壓下保持更高效率與更低熱耗;
二次側/多相 DC-DC引入 GaN,有助于提升開關頻率、縮小磁件與濾波器,電源功率密度與動態(tài)響應顯著改善。
對于 48V→板級多軌的中間總線架構(IBA),高效率窄帶隙器件疊加軟開關與數(shù)字控制,可把關鍵轉換級的峰值效率推向 >97–98% 的區(qū)間(具體指標依廠商實現(xiàn)而異)。
架構升級三:從“房級 UPS”到“機架級直流備能”
傳統(tǒng)房級 UPS 在高功率密度/高動態(tài)負載場景下難以最佳化;為此,**機架內置直流鋰電備能(Rack-level DC UPS)**成為趨勢:
靠近負載,減少配電鏈路級數(shù)與能量往返損耗;
與服務器/加速器的電源管理總線聯(lián)動,可做細粒度峰谷協(xié)調與擾動抑制;
更易與 直流母線+可再生能源+儲能系統(tǒng)(BESS) 組成本地直流微電網(wǎng),提升可再生能源利用率并緩解上游電網(wǎng)沖擊。
這類方案也便于未來與**液冷 CDU(冷板/冷卻液分配單元)**的協(xié)同控制,實現(xiàn)“功熱聯(lián)動”的運行優(yōu)化。
冷卻范式:風冷極限與液冷分野
風冷增強:針對 30–60kW/機架,后門熱交換器(RDHx)、通道封閉與高效風道仍可作為過渡方案,但當單卡上千瓦、機架 >100kW 時,風冷在噪聲、能效與熱點治理上收益遞減。
液冷成為主線:
直連式液冷(DLC)/冷板:熱阻低、PUE 友好,已在 AI 訓練集群批量落地;
浸沒式液冷:對超高熱流密度器件更具潛力,運維模式需與供配電改造協(xié)同規(guī)劃。
冷卻選擇直接反向塑造電源形態(tài):液冷讓高密度電源模塊更易就近散熱,有利于 48V 高電流母線與板級多相變換器的布置。
機架形態(tài)與可維護性
電源擱板(Power Shelf)與并聯(lián)系列:在 48V 架構下常見 3U/6U 電源擱板并聯(lián)輸出至銅排,支持熱插拔、N+1/N+N 冗余、前后走線,并與 OCP ORv3 規(guī)范對齊以增強互換性。
可更換單元(FRU)與數(shù)字化維護:通過 PMBus/SMBus/以太網(wǎng)監(jiān)控,電源健康狀態(tài)、紋波、溫度與老化指標實現(xiàn)全生命周期可視化與預測性維護,與調度器/編排平臺配合做“功率感知”的作業(yè)調度。
選型參考與落地建議
先定熱,再定電:按目標 kW/機架 與 W/器件 做熱設計選型(風/液/浸沒),再回推母線電壓、擱板功率密度與 PDU/母線槽容量。
48V 為“必答題”,HVDC 為“加分項”:48V 是今天的現(xiàn)實工程解;若園區(qū)具備條件,評估 380–800VDC 進入列/架側,可顯著壓降損耗與銅材成本。
功率器件代次升級:對 >100kW/機架場景,把 SiC(一次側)+GaN(二次側) 作為優(yōu)先路線,關注效率、功率密度與熱設計的系統(tǒng)平衡。
就近備能與直流微電網(wǎng):機架級 DC UPS 與園區(qū)級儲能協(xié)同,結合 AI 任務的功率預測能力,形成削峰填谷與有序功率分配。
對標開放規(guī)范與互操作:優(yōu)先采購滿足 OCP ORv3 / CRPS 生態(tài)的電源與機柜部件,提高互換與維保效率。
電網(wǎng)與選址聯(lián)動:對 >100kW/機架、>10MW/機房的項目,選址應同時評估電網(wǎng)接入、冷源可獲得性與水/能雙 PUE 約束;必要時采用**園區(qū)級再電力化(On-site Generation)**與熱回收方案。












評論