日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

        <style id="k3y6c"><u id="k3y6c"></u></style>
        <s id="k3y6c"></s>
        <mark id="k3y6c"></mark>
          
          

          <mark id="k3y6c"></mark>

          新聞中心

          EEPW首頁 > 網(wǎng)絡(luò)與存儲 > 設(shè)計應(yīng)用 > 什么是HPC內(nèi)存墻,如何跨越它?

          什么是HPC內(nèi)存墻,如何跨越它?

          作者: 時間:2025-05-27 來源:eeworld online 收藏

          高性能計算 (通常是指處理器速度和內(nèi)存帶寬之間不斷擴大的差距。當(dāng)處理器性能超過內(nèi)存訪問速度時,這會在整體系統(tǒng)性能中造成瓶頸,尤其是在人工智能 (AI) 等內(nèi)存密集型應(yīng)用程序中。

          本文引用地址:http://yuyingmama.com.cn/article/202505/470860.htm

          本文首先探討了的傳統(tǒng)定義,然后著眼于另一種觀點,該視圖將內(nèi)存容量與 AI 模型中參數(shù)數(shù)量的增長進行比較。無論從哪個定義來看,記憶墻已經(jīng)到來,這是一個嚴重的問題。它以一些翻越墻壁或至少降低墻壁高度的技術(shù)結(jié)束。

          當(dāng)然, 的定義正在不斷發(fā)展。幾年前被認為是 的東西不再符合最新的定義。根據(jù)處理器在峰值每秒浮點運算數(shù) (FLOP) 與內(nèi)存帶寬方面的性能比較,這個問題已經(jīng)存在了 25 年多(圖 1)。雖然內(nèi)存性能顯著提高,但訪問和傳輸數(shù)據(jù)的能力并沒有跟上數(shù)據(jù)處理者的能力。

          圖 1.HPC 是處理器性能和內(nèi)存帶寬之間的差距。(圖片:Astera Labs))

          由于內(nèi)存壁,處理器在等待內(nèi)存上花費的時間越來越多。這意味著無法使用昂貴的高性能處理器的某些功能。在涉及大型數(shù)據(jù)庫和復(fù)雜計算的 HPC 應(yīng)用程序中,這可能是一個嚴重的問題。

          AI 視角

          HPC 是 AI 的重要工具,尤其是用于訓(xùn)練 AI 模型。當(dāng) AI 在 2015 年左右出現(xiàn)時,典型模型中的參數(shù)數(shù)量相對較少。它不需要最高的 HPC 性能,因此其他應(yīng)用程序遇到的內(nèi)存墻不是問題。

          這種情況在 2019 年左右發(fā)生了變化,因為 AI 模型復(fù)雜性的快速增加超過了處理器性能的提高(圖 2)。在隨后的幾年里,AI 應(yīng)用的內(nèi)存墻高度持續(xù)增長,并可能成為 AI 性能進一步進步的限制因素。AI 的重要性日益增加,這增加了處理 HPC 內(nèi)存墻的緊迫性。

          圖 2.HPC 內(nèi)存墻也可以從 AI 模型日益復(fù)雜的角度來看待。(圖片:Ayar Labs))

          降低墻體高度

          如上圖 1 所示,多代圖形雙倍數(shù)據(jù)速率 (GDDR) 和高帶寬內(nèi)存 (HBM) 技術(shù)只是減緩了內(nèi)存墻的增長速度,但并沒有解決問題。

          還使用了幾種內(nèi)存管理方法,包括多級分層緩存,其中常用數(shù)據(jù)存儲在更靠近處理器的位置,以及預(yù)取指令,通過減少訪問主內(nèi)存的需求來提高性能。

          最大化內(nèi)存使用的優(yōu)化算法也有助于減輕內(nèi)存墻的影響。構(gòu)建數(shù)據(jù)以更有效地使用可以最大限度地減少緩存未命中并提高性能。 

          最近的發(fā)展不是原始內(nèi)存性能的改進,而是專注于新的計算和內(nèi)存架構(gòu)來擴展墻。

          新架構(gòu)方法的示例包括內(nèi)存計算 (CIM),也稱為內(nèi)存處理 (PIM) 和內(nèi)存計算 (IMC)。CIM 是一種基于硬件的架構(gòu),可直接在內(nèi)存存儲中執(zhí)行計算。這減少了對數(shù)據(jù)傳輸?shù)男枨蟛⒓涌炝擞嬎闼俣取?/p>

          IMC 是一種硬件和軟件方法。數(shù)據(jù)在 RAM 中處理以提高性能,并且可以利用多個內(nèi)核和并行處理。CIM 和 IMC 可以從本地內(nèi)存計算擴展 (CXL) 標準中受益。

          用 CXL 征服墻壁

          CXL 附加內(nèi)存通過實現(xiàn)高效的內(nèi)存共享和擴展多個處理器可用的內(nèi)存容量和帶寬來解決 HPC 內(nèi)存壁問題。它利用 PCIe 物理層提供低延遲和高帶寬通信,促進 CPU 和附加內(nèi)存之間的高效數(shù)據(jù)傳輸。

          CXL 確保內(nèi)存訪問是一致的,并且所有處理器都具有一致的內(nèi)存視圖,從而簡化了內(nèi)存管理。它為更高效的內(nèi)存使用提供了結(jié)構(gòu)和工具,幫助 HPC 系統(tǒng)克服了內(nèi)存墻挑戰(zhàn)。

          總結(jié)

          雖然 HPC 內(nèi)存墻通常是指提高處理器速度和滯后內(nèi)存帶寬之間不斷擴大的差距,但它也可以相對于 AI 模型日益復(fù)雜來定義。無論從哪個定義來看,它都在增長,并且是一個越來越嚴峻的挑戰(zhàn)。設(shè)計人員可以使用多種工具來擴展或降低 HPC 內(nèi)存墻的高度。




          關(guān)鍵詞: HPC 內(nèi)存墻

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉