日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

        <style id="k3y6c"><u id="k3y6c"></u></style>
        <s id="k3y6c"></s>
        <mark id="k3y6c"></mark>
          
          

          <mark id="k3y6c"></mark>

          新聞中心

          EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 超越傳統(tǒng)OOO:高性能RISC-V CPU基于時(shí)間、基于切片的方法

          超越傳統(tǒng)OOO:高性能RISC-V CPU基于時(shí)間、基于切片的方法

          作者: 時(shí)間:2025-09-05 來(lái)源: 收藏

          關(guān)鍵

          • 高性能 設(shè)計(jì)正在從傳統(tǒng)的無(wú)序 () 執(zhí)行架構(gòu)轉(zhuǎn)向新的基于時(shí)間的 微架構(gòu),以解決電源效率低下、復(fù)雜性和不靈活的問(wèn)題。

          • 和開(kāi)源建模框架的興起促進(jìn)了基于時(shí)間的調(diào)度的采用,克服了以前與專有工具鏈相關(guān)的障礙以及對(duì)社區(qū)驅(qū)動(dòng)支持的需求。

          • 基于時(shí)間的 為客戶帶來(lái)的好處包括卓越的每瓦性能、可擴(kuò)展性、簡(jiǎn)化的驗(yàn)證流程以及針對(duì)數(shù)據(jù)中心、移動(dòng)、汽車和定制加速器中特定領(lǐng)域應(yīng)用程序的增強(qiáng)定制。

          幾十年來(lái),高性能 設(shè)計(jì)一直由傳統(tǒng)的亂序 (OOO) 執(zhí)行架構(gòu)主導(dǎo)。英特爾、Arm 和 AMD 等巨頭已將這種方法完善為行業(yè)標(biāo)準(zhǔn)——通過(guò)日益復(fù)雜的調(diào)度程序、推測(cè)和運(yùn)行時(shí)邏輯來(lái)平衡性能和復(fù)雜性。然而,隨著工作負(fù)載在數(shù)據(jù)中心、移動(dòng)和汽車領(lǐng)域的多樣化,傳統(tǒng) OOO 架構(gòu)的弱點(diǎn)——功耗低下、復(fù)雜性和不靈活——變得越來(lái)越明顯。

          現(xiàn)在,一種新的范式正在出現(xiàn):基于時(shí)間的 OOO 微架構(gòu)。這種方法以研究和新專利為基礎(chǔ),提供了一種顛覆性的替代方案,可能會(huì)使 在與根深蒂固的現(xiàn)有企業(yè)相比中具有第一個(gè)可防御的高性能優(yōu)勢(shì)。在 時(shí)代,開(kāi)放性、可擴(kuò)展性和生態(tài)系統(tǒng)杠桿性是關(guān)鍵的差異化因素,基于時(shí)間的 OOO 提供了一條超越傳統(tǒng)現(xiàn)有企業(yè)的途徑。

          在 Hot Chips 2025 上,來(lái)自 Condor Computing 的 Ty Garibay 和 Shashank Nemawarkar 就該主題發(fā)表了演講。他們?cè)敿?xì)介紹了其處理器架構(gòu)(代號(hào):Cuzco),這是一種高性能、兼容 RVA23 的 RISC-V IP,具有基于時(shí)間的 OOO 執(zhí)行和的微架構(gòu)。Ty 是公司的總裁兼創(chuàng)始人,Shashank 是高級(jí)研究員兼建筑總監(jiān)。

          關(guān)鍵思想:時(shí)間是一流的資源

          傳統(tǒng)的 OOO 處理器依賴于動(dòng)態(tài)解析依賴關(guān)系和發(fā)出指令的每周期調(diào)度程序。這種方法雖然有效,但需要大型、耗電的硬件結(jié)構(gòu)(預(yù)留站、喚醒/選擇邏輯和動(dòng)態(tài)記分牌跟蹤),這些結(jié)構(gòu)在更寬的超標(biāo)量?jī)?nèi)核時(shí)擴(kuò)展性很差。

          基于時(shí)間的 OOO 執(zhí)行翻轉(zhuǎn)了這種模型。寄存器記分牌跟蹤指令的未來(lái)“寫(xiě)入時(shí)間”,以便下游指令自動(dòng)知道作數(shù)何時(shí)準(zhǔn)備就緒。時(shí)間資源矩陣 (TRM) 記錄執(zhí)行資源(如 ALU、總線、加載/存儲(chǔ)隊(duì)列)的繁忙間隔,這有助于提前預(yù)測(cè)資源可用性周期。這支持預(yù)測(cè)調(diào)度,其中發(fā)出指令時(shí)了解作數(shù)和資源的確切未來(lái)周期。

          Time Resource Matrix (TRM)

          在實(shí)踐中,這將指令調(diào)度轉(zhuǎn)換為類似于編譯器的靜態(tài)分析,但在硬件中執(zhí)行,并針對(duì)錯(cuò)誤預(yù)測(cè)、緩存未命中和動(dòng)態(tài)延遲進(jìn)行運(yùn)行時(shí)調(diào)整。這導(dǎo)致更少的柵極數(shù)、更低的動(dòng)態(tài)功率和更簡(jiǎn)單的邏輯,同時(shí)仍提供高 IPC 性能。

          Cuzco Time Based Microarchitecture

          Cuzco Software

          為什么是現(xiàn)在?縮小工具和生態(tài)系統(tǒng)差距

          基于時(shí)間的調(diào)度概念在學(xué)術(shù)研究中并不新鮮,但有幾個(gè)障礙阻礙了它在工業(yè)界的采用:

          從歷史上看,CPU 設(shè)計(jì)依賴于專有的封閉工具鏈和性能建??蚣?。實(shí)現(xiàn)完全不同的調(diào)度模型需要深入的編譯器和模擬器協(xié)同設(shè)計(jì)——如果沒(méi)有社區(qū)驅(qū)動(dòng)的支持,這幾乎是不可能的。RISC-V 的興起改變了等式。Sparta、Olympia、Spike 和 Dromajo 等開(kāi)源建??蚣転樘剿餍碌恼{(diào)度策略提供了可擴(kuò)展的平臺(tái)。Condor Computing 貢獻(xiàn)了新工具,例如 Fusion Spec Language (FSL),并積極為 Dromajo 和 Spike 增強(qiáng)做出了貢獻(xiàn),以實(shí)現(xiàn)精確建模和整個(gè)生態(tài)系統(tǒng)的采用。傳統(tǒng)的 OOO 曾經(jīng)受益于標(biāo)準(zhǔn)化和慣性,而高性能 RISC-V OOO 現(xiàn)在受益于開(kāi)源杠桿和社區(qū)貢獻(xiàn)?;跁r(shí)間的 OOO 依靠即插即用的比較和改進(jìn),而不是使用這些工具的傳統(tǒng) OOO 技術(shù)。

          Cuzco 的設(shè)計(jì):靈活、高效且可擴(kuò)展

          的微架構(gòu)通過(guò)將 CPU 分解為模塊化、可重復(fù)的“切片”來(lái)提供可擴(kuò)展性、效率和靈活性,每個(gè)切片都有自己的管道和資源。這種方法避免了單片超標(biāo)量設(shè)計(jì)的關(guān)鍵路徑瓶頸,從而實(shí)現(xiàn)了從低功耗物聯(lián)網(wǎng)到數(shù)據(jù)中心工作負(fù)載的可預(yù)測(cè)性能擴(kuò)展。客戶根據(jù)其面積/功耗/性能要求選擇兩個(gè)、三個(gè)或四個(gè)切片,從而實(shí)現(xiàn)靜態(tài)可配置性。它們還可以通過(guò)在運(yùn)行時(shí)對(duì)切片進(jìn)行電源門控來(lái)實(shí)現(xiàn)動(dòng)態(tài)可配置性,從而允許處理器針對(duì)低功耗工作負(fù)載進(jìn)行縮減。其結(jié)果是更高的每瓦性能、更快的上市時(shí)間以及更靈活的 IP 產(chǎn)品,客戶可以根據(jù)不同的用例進(jìn)行定制。

          Slice Based Microarchitecture

          客戶利益

          對(duì)于評(píng)估可許可 CPU IP 的客戶來(lái)說(shuō),基于時(shí)間的 OOO 的吸引力不僅在于架構(gòu)的優(yōu)雅,還在于切實(shí)的好處:

          • 每瓦性能:IPC 與傳統(tǒng) OOO 相當(dāng)或更優(yōu)越

          • 可擴(kuò)展性:每個(gè)集群支持多達(dá) 8 個(gè)內(nèi)核,具有私有 L2 和共享 L3 緩存,可提供數(shù)據(jù)中心級(jí)吞吐量,而無(wú)需過(guò)高的功率預(yù)算。

          • 可預(yù)測(cè)性:與傳統(tǒng)的 OOO 設(shè)計(jì)相比,簡(jiǎn)化的調(diào)度降低了驗(yàn)證復(fù)雜性和門數(shù),從而加快了上市時(shí)間。

          • 定制:原生 RISC-V ISA 可擴(kuò)展性與 TRM 驅(qū)動(dòng)的調(diào)度相結(jié)合,可以更快地部署特定領(lǐng)域的加速器,這對(duì)于 AI、網(wǎng)絡(luò)和汽車用例至關(guān)重要。

          總結(jié)

          Cuzco 基于時(shí)間的無(wú)序執(zhí)行代表了對(duì) CPU 設(shè)計(jì)的根本性重新思考。通過(guò)消除每個(gè)周期調(diào)度的低效率,它降低了復(fù)雜性,降低了功耗,并實(shí)現(xiàn)了更廣泛的可擴(kuò)展性,同時(shí)與 RISC-V ISA 和軟件生態(tài)系統(tǒng)完全兼容。

          它是一款兼容 RVA23 的處理器,可在可許可的 CPU IP 中提供每瓦和每 sq.mm 的最佳性能。這不是漸進(jìn)式的改進(jìn),而是一種結(jié)構(gòu)性轉(zhuǎn)變,可以定義 RISC-V 的高性能時(shí)代。

          Cuzco 的設(shè)計(jì)具有廣泛的適用性:

          • 數(shù)據(jù)中心:高吞吐量和較低的功耗預(yù)算意味著更低的 TCO。

          • 手機(jī)和手機(jī):具有競(jìng)爭(zhēng)力性能的能源效率。

          • 汽車:可預(yù)測(cè)性和確定性,對(duì)于安全工作負(fù)載至關(guān)重要。

          • 自定義加速器:通過(guò) RISC-V ISA 可擴(kuò)展性解鎖的特定領(lǐng)域優(yōu)化。


          關(guān)鍵詞: OOO RISC-V CPU 基于切片

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉