首款2nm SRAM,為AI數(shù)據(jù)中心帶來(lái)什么?
SRAM 已經(jīng)非常成熟,現(xiàn)在被認(rèn)為是一種商業(yè)「管道」類型的內(nèi)存,但 Marvell Technology 的最新定制 SRAM 正在展示這種現(xiàn)有內(nèi)存如何在 AI 數(shù)據(jù)中心發(fā)揮作用。
顯著降低功耗和芯片面積
Marvell 聲稱其定制 SRAM 是業(yè)界首款 2nm 定制 SRAM。它旨在提升加速基礎(chǔ)設(shè)施中內(nèi)存層的性能,提供高達(dá) 6Gbit 的高速內(nèi)存,從而提升定制 XPU(處理器、加速器、GPU)和設(shè)備的性能。此外,在相同密度下,它還能顯著降低內(nèi)存功耗和芯片面積。
該公司的 SRAM 比類似密度的標(biāo)準(zhǔn)片上 SRAM 功耗低 66%,運(yùn)行頻率高達(dá) 3.75GHz,這是 AI 集群和數(shù)據(jù)中心管理其能源足跡和有效冷卻組件的關(guān)鍵指標(biāo)。
Marvell 首席內(nèi)存架構(gòu)師 Darren Anand 表示:「Marvell 一直專注于優(yōu)化 SRAM,以適應(yīng) AI/機(jī)器學(xué)習(xí)應(yīng)用。這與我們目前的封裝和定制高帶寬內(nèi)存 (HBM) 工作具有顯著的協(xié)同效應(yīng),從而為 XPU 上的計(jì)算釋放了更多的芯片面積?!?/span>
「SRAM 有創(chuàng)新的機(jī)會(huì)」
Anand 表示:「Marvell 的 SRAM 不是不斷訪問(wèn) HBM,而是將部分工作負(fù)載保留在芯片上,并支持 AI 工作負(fù)載所需的高帶寬和寬 IO,從而有可能提高整體設(shè)備性能。」

在最先進(jìn)的節(jié)點(diǎn)上,SRAM 可以與邏輯芯片集成在同一塊芯片上。來(lái)源:Marvell Technology
他表示:「SRAM 是唯一在個(gè)位數(shù)工藝節(jié)點(diǎn)上可用的存儲(chǔ)器,因此也是唯一能夠支持近內(nèi)存計(jì)算架構(gòu)的高性能存儲(chǔ)器。在這些前沿節(jié)點(diǎn)上,DRAM 無(wú)法在同一塊硅片上使用。同樣,NAND 閃存、磁阻 RAM (MRAM)、電阻式 RAM (ReRAM) 和相變 RAM (PCM) 等新興存儲(chǔ)器也無(wú)法在這些前沿節(jié)點(diǎn)上使用?!?/span>
Anand 解釋說(shuō):「在尖端節(jié)點(diǎn)上,SRAM 可以與邏輯芯片集成在同一芯片上,從而支持可立即供 XPU 上的處理器和邏輯引擎使用的內(nèi)存層次結(jié)構(gòu)。」 在這方面,它不同于連接內(nèi)存和邏輯芯片的典型馮·諾依曼架構(gòu)。近內(nèi)存計(jì)算架構(gòu)將數(shù)據(jù)放置在更靠近需要的位置,從而降低了移動(dòng)數(shù)據(jù)所需的功耗并增加了帶寬。
他補(bǔ)充道:「典型的 XPU 至少有 30% 的硅片面積專用于 SRAM,有些設(shè)計(jì)甚至超過(guò)芯片面積的 50% 到 60%。我們正在嘗試優(yōu)化這一點(diǎn),因?yàn)檫@會(huì)對(duì)芯片的芯片尺寸和成本產(chǎn)生重大影響?!?/span>
「在業(yè)界,SRAM 正變得像一個(gè)基本的 IP『管道』,這意味著很多地方都需要它,但卻缺乏技術(shù)創(chuàng)新。實(shí)際上,在 SRAM 架構(gòu)中可以實(shí)現(xiàn)許多新技術(shù),以優(yōu)化功耗、帶寬和許多其他指標(biāo)。我們并不認(rèn)為 SRAM 僅僅是一個(gè)管道,而是一個(gè)創(chuàng)新的機(jī)會(huì),」Anand 說(shuō)道。
Anand 認(rèn)為,SRAM 面臨的最大挑戰(zhàn)是面積微縮。雖然邏輯單元和存儲(chǔ)器都經(jīng)歷了多代的微縮,但 SRAM 單元似乎開始遇到瓶頸,導(dǎo)致過(guò)去幾代先進(jìn)節(jié)點(diǎn)的微縮停滯不前。「邏輯單元繼續(xù)微縮,但存儲(chǔ)器位單元卻沒(méi)有,」Anand 指出。
Objective Analysis 首席分析師 Jim Handy 表示:「Marvell 的方法實(shí)現(xiàn)了節(jié)能降耗和速度提升,同時(shí)也承認(rèn)了 SRAM 芯片并非隨著工藝制程線性擴(kuò)展的事實(shí)。他們只是根據(jù)這些工藝制程尺寸對(duì) SRAM 進(jìn)行了輕微的調(diào)整。」
Handy 表示:「SRAM 廣泛用于高性能處理器芯片的緩存。如果芯片無(wú)需訪問(wèn)外部存儲(chǔ)器,其速度甚至可以更快。事實(shí)上,芯片上的所有核心每個(gè)周期都能執(zhí)行一條指令,速度非???。」
雖然 SRAM 和 DRAM 都是隨機(jī)存取存儲(chǔ)器的形式,但是它們的結(jié)構(gòu)上有所不同。DRAM 代表動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器。這種存儲(chǔ)器在結(jié)構(gòu)上與 SRAM 有所不同,因?yàn)樗褂秒娙萜鞫皇欠聪嗥骱途w管進(jìn)行存儲(chǔ)。因此,這種存儲(chǔ)器需要刷新并因此發(fā)生變化,因此被定義為「動(dòng)態(tài)」的。不像 SRAM,其存儲(chǔ)器存儲(chǔ)在芯片上,DRAM 存儲(chǔ)在與芯片外部的主板上,因此訪問(wèn)時(shí)間更長(zhǎng)。這導(dǎo)致 SRAM 是一種比 DRAM 更快的存儲(chǔ)器。
每種內(nèi)存在設(shè)備中存儲(chǔ)的位置也不同。DRAM 通常用作主要的存儲(chǔ)器,因此通常存儲(chǔ)在主板上,但是由于 SRAM 是 CPU 中常用的存儲(chǔ)器,因此最可能在處理器上找到。
最后,這兩種內(nèi)存在成本方面也有所不同。由于 SRAM 需要更多的功率來(lái)運(yùn)行,因此與 DRAM 相比,它也是一種更昂貴的內(nèi)存選擇。這是 SRAM 不總是主存儲(chǔ)系統(tǒng)的理想選擇的另一個(gè)原因。









評(píng)論