Nvidia 800VDC數(shù)據(jù)中心方案匯總
合作伙伴包括:
芯片供應(yīng)商:ADI公司(ADI)、AOS、EPC、英飛凌、Innoscience、MPS、Navitas、onsemi、Power Integrations、瑞薩、立锜、羅門、意法半導(dǎo)體和德州儀器
電力系統(tǒng)組件供應(yīng)商:貿(mào)聯(lián)、臺達(dá)、偉創(chuàng)力、GE Vernova、Lead Wealth、光寶和 Megmeet
數(shù)據(jù)中心電源系統(tǒng)提供商:ABB、伊頓、GE Vernova、Heron Power、日立能源、三菱電機(jī)、施耐德電氣、西門子和 Vertiv
千兆瓦時(shí)代的 800V 直流 (VDC) 數(shù)據(jù)中心將支持 NVIDIA Kyber 機(jī)架架構(gòu)。
富士康提供了其 40 MW 臺灣數(shù)據(jù)中心高雄 1 號的詳細(xì)信息,該數(shù)據(jù)中心正在為 800Vdc 建造。CoreWeave、Lambda、Nebius、Oracle Cloud Infrastructure 和 Together AI 是其他為 800V 數(shù)據(jù)中心設(shè)計(jì)的行業(yè)先驅(qū)。
此外,維諦技術(shù)技術(shù) (Vertiv) 還推出了其節(jié)省空間、成本和能源效率的 800Vdc MGX 參考架構(gòu),這是一個(gè)完整的電源和冷卻基礎(chǔ)設(shè)施架構(gòu)。HPE 宣布支持 Nvidia Kyber 以及 Nvidia Spectrum-XGS 以太網(wǎng)縱向擴(kuò)展技術(shù),這是 Spectrum-X 以太網(wǎng)平臺的一部分。
從傳統(tǒng)的 415 或 480 VAC 三相系統(tǒng)遷移到 800Vdc 基礎(chǔ)設(shè)施,可提高可擴(kuò)展性、提高能源效率、減少材料使用并提高數(shù)據(jù)中心性能容量。電動汽車和太陽能行業(yè)已經(jīng)采用了 800Vdc 基礎(chǔ)設(shè)施,以獲得類似的好處。
由 Meta 創(chuàng)立的開放計(jì)算項(xiàng)目是一個(gè)由數(shù)百家計(jì)算和網(wǎng)絡(luò)提供商組成的行業(yè)聯(lián)盟,更專注于重新設(shè)計(jì)硬件技術(shù),以有效支持對計(jì)算基礎(chǔ)設(shè)施不斷增長的需求。
Vera Rubin NVL144 MGX 計(jì)算托盤采用節(jié)能、100% 液冷、模塊化設(shè)計(jì)。其中央印刷電路板中板取代了傳統(tǒng)的基于電纜的連接,以實(shí)現(xiàn)更快的組裝和可維護(hù)性,并具有用于 Nvidia ConnectX-9 800GB/s 網(wǎng)絡(luò)的模塊化擴(kuò)展托架和用于大規(guī)模上下文推理的 Nvidia Rubin CPX。
Nvidia Vera Rubin NVL144 在加速計(jì)算架構(gòu)和 AI 性能方面實(shí)現(xiàn)了重大飛躍。它是為高級推理引擎和人工智能代理的需求而構(gòu)建的。
其基本設(shè)計(jì)采用 MGX 機(jī)架架構(gòu),并將得到 50+ MGX 系統(tǒng)和組件合作伙伴的支持。Nvidia 計(jì)劃將升級后的機(jī)架以及計(jì)算托盤創(chuàng)新作為 OCP 聯(lián)盟的開放標(biāo)準(zhǔn)。
其計(jì)算托盤和機(jī)架標(biāo)準(zhǔn)使合作伙伴能夠以模塊化方式混合和匹配,并根據(jù)架構(gòu)更快地?cái)U(kuò)展。Vera Rubin NVL144 機(jī)架設(shè)計(jì)采用節(jié)能的 45°C 液體冷卻、用于更高性能的新型液冷母線和 20 倍的儲能以保持功率穩(wěn)定。
MGX 升級為計(jì)算托盤和機(jī)架架構(gòu),提高了 AI 工廠性能,同時(shí)簡化了組裝,從而能夠快速提升到千兆瓦級的 AI 基礎(chǔ)設(shè)施。
Nvidia 是跨多代硬件的 OCP 標(biāo)準(zhǔn)的主要貢獻(xiàn)者,包括 Nvidia GB200 NVL72 系統(tǒng)機(jī)電設(shè)計(jì)的關(guān)鍵部分。相同的 MGX 機(jī)架占用空間支持 GB300 NVL72,并將支持 Vera Rubin NVL144、Vera Rubin NVL144 CPX 和 Vera Rubin CPX,以實(shí)現(xiàn)更高的性能和快速部署。
OCP 生態(tài)系統(tǒng)也在為 Nvidia Kyber 做準(zhǔn)備,該創(chuàng)新在 800Vdc 供電、液體冷卻和機(jī)械設(shè)計(jì)方面進(jìn)行了創(chuàng)新。
這些創(chuàng)新將支持向機(jī)架服務(wù)器一代 Nvidia Kyber(Nvidia Oberon 的繼任者)的轉(zhuǎn)變,到 2027 年,該 Nvidia Kyber 將容納一個(gè)由 576 個(gè) Nvidia Rubin Ultra GPU 組成的高密度平臺。
應(yīng)對大功率配電挑戰(zhàn)的最有效方法是提高電壓。從傳統(tǒng)的 415 或 480 VAC 三相系統(tǒng)過渡到 800Vdc 架構(gòu)具有多種優(yōu)勢。
正在進(jìn)行的過渡使機(jī)架服務(wù)器合作伙伴能夠從 54Vdc 機(jī)架內(nèi)組件遷移到 800Vdc,以獲得更好的結(jié)果。由直流基礎(chǔ)設(shè)施提供商、電源系統(tǒng)和冷卻合作伙伴以及芯片制造商組成的生態(tài)系統(tǒng)——都遵循 MGX 機(jī)架服務(wù)器參考架構(gòu)的開放標(biāo)準(zhǔn)——參加了此次活動。
Nvidia Kyber 旨在提高機(jī)架 GPU 密度、擴(kuò)大網(wǎng)絡(luò)規(guī)模并最大限度地提高大規(guī)模 AI 基礎(chǔ)設(shè)施的性能。通過垂直旋轉(zhuǎn)計(jì)算刀片,就像書架上的書籍一樣,Kyber 每個(gè)機(jī)箱最多可容納 18 個(gè)計(jì)算刀片,而專用的 Nvidia NVLink 交換機(jī)刀片通過無電纜中板集成在背面,以實(shí)現(xiàn)無縫縱向擴(kuò)展網(wǎng)絡(luò)。
通過具有 800Vdc 的同一銅傳輸?shù)墓β试黾恿?150% 以上,無需 200 公斤銅母線為單個(gè)機(jī)架供電。
Kyber 將成為超大規(guī)模人工智能數(shù)據(jù)中心的基礎(chǔ)元素,在未來幾年為最先進(jìn)的生成式人工智能工作負(fù)載提供卓越的性能、效率和可靠性。Nvidia Kyber 機(jī)架為客戶提供了一種減少銅量的方法,從而節(jié)省了數(shù)百萬美元的成本。
除了硬件之外,Nvidia NVLink Fusion 的發(fā)展勢頭也越來越大,使公司能夠?qū)⑵浒攵ㄖ菩酒瑹o縫集成到高度優(yōu)化和廣泛部署的數(shù)據(jù)中心架構(gòu)中,從而降低復(fù)雜性并加快上市時(shí)間。
英特爾和三星代工正在加入 NVLink Fusion 生態(tài)系統(tǒng),其中包括定制芯片設(shè)計(jì)人員、CPU 和 IP 合作伙伴,以便 AI 工廠可以快速擴(kuò)展,以處理模型訓(xùn)練和代理 AI 推理的苛刻工作負(fù)載。
- 作為最近宣布的 Nvidia 和英特爾合作的一部分,英特爾將構(gòu)建 x86 CPU,這些 CPU 使用 NVLink Fusion 集成到 Nvidia 基礎(chǔ)設(shè)施平臺中。 
- 三星代工與英偉達(dá)合作,以滿足對定制 CPU 和定制 XPU 不斷增長的需求,為定制芯片提供從設(shè)計(jì)到制造的體驗(yàn)。 
800V 數(shù)據(jù)中心方案:Power Integrations
Power Integrations 是與 Nvidia 合作開發(fā) 800V 數(shù)據(jù)中心概念的功率半導(dǎo)體之一,其中 ~1MW 將通過 800Vdc 總線輸送到每個(gè)機(jī)架,預(yù)計(jì)在機(jī)架中進(jìn)行隔離和下變頻。

PI 的白皮書在圣何塞舉行的 OCP 全球峰會上發(fā)布,建議其 1,250V 和 1,700V GaN 晶體管作為下變頻第一階段的主要電源開關(guān)。
這些是 GaN 技術(shù)的高電壓,其中晶體管往往在標(biāo)稱 650V 時(shí)達(dá)到峰值。
為了達(dá)到更高的電壓,Power Integrations 使用共源共柵連接的晶體管對,其中低壓硅 MOSFET 切換共封裝的高壓耗盡模式(常導(dǎo))GaN hemt。MOSFET 直接安裝在 GaN 芯片上,以最大限度地減少連接寄生效應(yīng)。
“耗盡型氮化鎵器件被認(rèn)為是高度可靠的,因?yàn)樗鼈儾恍枰?p 型氮化鎵柵極層,”PI 說?!耙虼耍鼈儽苊饬碎撝惦妷浩坪拖嚓P(guān)的不穩(wěn)定性問題,確保了長期穩(wěn)定性。”
PI 建議使用隔離式 LLC 轉(zhuǎn)換器在單級中從 800V 直接轉(zhuǎn)換為 12.5V 總線,該轉(zhuǎn)換器包括一個(gè) 32:1 變壓器——實(shí)際上是 32:1+1,因?yàn)檩敵稣髌魇前氩ǎㄒ妶D)。
它認(rèn)為 1,250V GaN 功率晶體管而不是 Si MOSFET 是必不可少的,利用更高的最大工作頻率將轉(zhuǎn)換器縮小到足以實(shí)用。
在其設(shè)計(jì)示例中,它預(yù)測了一個(gè) 1MHz 零電壓開關(guān)轉(zhuǎn)換器,轉(zhuǎn)換死區(qū)時(shí)間為 <100ns,效率為 >98%。
對于機(jī)架內(nèi)的輔助電源,PI 正在提出其額定電壓為 1,700V 的基于 GaN 的IMX2353F“InnoMux2-EP”IC,它可以在一級中直接衍生多達(dá)三個(gè)電源軌——包括用于風(fēng)扇的 48V 和用于電子設(shè)備的 12V,據(jù)稱,從高達(dá) 1,000V 的輸入。
800V 數(shù)據(jù)中心:德州儀器 (TI)
德州儀器 (TI) 在圣何塞舉行的開放計(jì)算峰會上公布了其對英偉達(dá) 800Vdc 數(shù)據(jù)中心電源概念的提案。

在電源端,它描述了一個(gè) 30kW 800Vdc 開放式機(jī)架格式電壓源,尺寸為 800 x 160 x 32mm。
這將三相電源引入三電平飛電功率因數(shù)校正轉(zhuǎn)換器(右圖),該轉(zhuǎn)換器為兩個(gè)產(chǎn)生 ±400Vdc 或 800Vdc 的三相 Delta-Δ 隔離 LLC 轉(zhuǎn)換器生成直流總線。
飛電前端有效地將其開關(guān)頻率提高了一倍,以減小輸入電感器的尺寸。
在接收端,該公司討論了幾種在機(jī)架中將 800Vdc 轉(zhuǎn)換為 12.5V 的架構(gòu)。
其中一個(gè)類似于同一峰會上的 Power Integrations 概念(盡管細(xì)節(jié)較少):單個(gè) 64:1 中間總線轉(zhuǎn)換器一次性將 800V 降至 12.5V。
其擴(kuò)展是單級 128:1 轉(zhuǎn)換器,為處理器 PCB 產(chǎn)生 6.25V 電源軌,估計(jì) 800V 到內(nèi)核效率峰值為 89%(不包括 PCB 損耗)。
這種較低的電路板電壓允許端載穩(wěn)壓器以更高的頻率運(yùn)行,從而將該轉(zhuǎn)換器縮小到可以從電路板另一側(cè)從處理器下方傳輸電源的程度。
TI表示:“這種架構(gòu)的挑戰(zhàn)在于128:1轉(zhuǎn)換器的輸出電流非常大——在6.25V時(shí)將有2.4至3.2kA?!皩?6.25V 電路板損耗保持在 <1% 或 2% 將需要非常大的導(dǎo)體——例如母線。”

為了更貼近當(dāng)今的系統(tǒng),它還討論了一種兩級方案,其中隔離式 16:1 轉(zhuǎn)換器產(chǎn)生 50V,然后是非絕緣 4:1 轉(zhuǎn)換器提供 12.5V(或 8:1 為 6.25V)。
TI 表示,在 16:1 隔離階段之后,“電源架構(gòu)的其余部分將具有與 48Vdc 計(jì)算托盤相似的外觀和感覺——有幾種可能的變化”。
800V數(shù)據(jù)中心:EPC

基于 GaN hemt 的概念驗(yàn)證高 8 毫米,占地 <5,000 毫米2。
“氮化鎵是 800Vdc 生態(tài)系統(tǒng)的一項(xiàng)重要技術(shù),”EPC 首席執(zhí)行官 Alex Lidow 聲稱。

雖然 Power Integrations 建議為類似的電源提供單對 1,250V GaN 半橋,但 EPC 建議在輸入側(cè)使用八個(gè)串聯(lián)的半橋(見圖),它們之間共享 800V 作為 8x 100V。這樣,只需要 150V 設(shè)備。
由于這些是八個(gè)隔離式 LLC 轉(zhuǎn)換器的前端,因此它們的所有輸出都可以并聯(lián)以產(chǎn)生單個(gè)大電流 12.5V 輸出。
“LLC 模塊設(shè)計(jì)為在諧振頻率下運(yùn)行,其中效率最高,諧振槽的增益是單位的。通過將諧振電感器 [Lr] 設(shè)計(jì)為遠(yuǎn)小于磁化電感器 [Lm],轉(zhuǎn)換器的增益在工作頻率周圍和很寬的范圍內(nèi)保持與頻率無關(guān),“該公司表示?!斑@迫使并聯(lián)輸出向每個(gè)初級提供相等的電壓,包括組件容差,以在每個(gè)模塊 [輸入] 上保持均分電壓。由于所有輸入都是串聯(lián)的,因此通過每個(gè)輸入的電流是相同的,從而平衡了每個(gè)輸出上的電流。
這種拓?fù)涞囊粋€(gè)副作用是變壓器只需要 4:1+1 的匝數(shù)比,并且可以是平面的。

 加入技術(shù)交流群
加入技術(shù)交流群
 
					
				







評論