日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

        <style id="k3y6c"><u id="k3y6c"></u></style>
        <s id="k3y6c"></s>
        <mark id="k3y6c"></mark>
          
          

          <mark id="k3y6c"></mark>

          新聞中心

          EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > Krste Asanovic:RISC-V AI 從向量到矩陣的架構(gòu)選擇與挑戰(zhàn)

          Krste Asanovic:RISC-V AI 從向量到矩陣的架構(gòu)選擇與挑戰(zhàn)

          作者: 時(shí)間:2025-07-18 來(lái)源: 收藏

          7月18日,第五屆在上海進(jìn)入分論壇環(huán)節(jié)。作為未來(lái)電子產(chǎn)業(yè)最龐大的應(yīng)用范疇之一,人工智能是不可回避的話(huà)題。人工智能的飛速發(fā)展,正以年均超過(guò)100%的算力需求增長(zhǎng)驅(qū)動(dòng)底層架構(gòu)的革新,“開(kāi)放、靈活、可定制”的已成為構(gòu)建自主算力基石的戰(zhàn)略支點(diǎn)。 

          人工智能分論壇邀請(qǐng)各方企業(yè)探討架構(gòu)如何利用其開(kāi)源、開(kāi)放、可擴(kuò)展的特性,實(shí)現(xiàn)計(jì)算架構(gòu)的革新,以及RISC-V架構(gòu)在軟硬件的最新進(jìn)展和應(yīng)用落地情況。其中,SiFive聯(lián)合創(chuàng)始人、首席架構(gòu)師 現(xiàn)場(chǎng)分享了他對(duì)RISC-V AI指令擴(kuò)展的看法,他全面闡述了從的架構(gòu)選擇與挑戰(zhàn)。 

          在人工智能用例和人工智能模型中,共同的特點(diǎn)是需要對(duì)小型、專(zhuān)門(mén)的數(shù)據(jù)類(lèi)型進(jìn)行大量計(jì)算。因此,人工智能中使用的數(shù)據(jù)類(lèi)型往往很小,而且越來(lái)越小。但是現(xiàn)在從FP-32到FP16BF的進(jìn)程屬于在不斷擴(kuò)大。另外一個(gè)問(wèn)題是需要大量的內(nèi)存來(lái)保存所有參數(shù),這就是為什么要專(zhuān)注于減小每個(gè)單獨(dú)參數(shù)的大小,并找到巧妙的方法來(lái)管理縮放和避免量化問(wèn)題。現(xiàn)在,擁有如此大的內(nèi)存占用和需要進(jìn)行大量計(jì)算的組合意味著你需要大量的內(nèi)存帶寬來(lái)獲取所有這些參數(shù),并在層之間傳送。 

          圖片.png

          RISC-V在AI中支持的是通用計(jì)算模型,這意味著要支持標(biāo)量、和現(xiàn)在的功能。有趣的是有時(shí)人工智能是其他應(yīng)用程序的技術(shù)組成部分。因此你需要一個(gè)能夠處理通用計(jì)算和人工智能計(jì)算的處理器。開(kāi)發(fā)者經(jīng)常發(fā)現(xiàn)的是新型人工智能模型的發(fā)展非???,所以這些模型都可以在舊硬件上進(jìn)行得相當(dāng)好,得益于舊硬件具有通用的標(biāo)量功能,而新模型往往使用這些功能的不同組合。但是如果你的機(jī)器是通用的,并且可以支持所有這些,那么它可以很好地運(yùn)行新模型。另一件事是在同一代模型中不同的用例使用標(biāo)量、向量、矩陣功能的不同組合來(lái)處理該應(yīng)用程序所需的任何功能。因此風(fēng)險(xiǎn)波的一個(gè)重要部分是向量擴(kuò)展。RVV在幾年前批準(zhǔn),它是一個(gè)非常強(qiáng)大的矢量擴(kuò)展。矢量對(duì)人工智能非常重要。盡管人們對(duì)矩陣計(jì)算給予了很多關(guān)注,但人工智能中有許多關(guān)鍵步驟是矩陣引擎無(wú)法完成的。你需要使用向量來(lái)進(jìn)行計(jì)算,RVV旨在支持多種數(shù)據(jù)類(lèi)型。

          圖片.png

              RISC-V矩陣擴(kuò)展是RISC-V去年最熱門(mén)的話(huà)題。原因是矩陣將關(guān)鍵組件相乘,以加快人工智能應(yīng)用程序的發(fā)展。它被用于從小到大的各種RISC-V應(yīng)用中。RISC-V內(nèi)核有許多形狀和尺寸,因此在矩陣乘法空間中嘗試不同選項(xiàng)的活動(dòng)很多。好消息是與向量不同的矩陣乘法函數(shù)的數(shù)量要少得多。如果你在向量庫(kù)中察看,可能會(huì)有成千上萬(wàn)的函數(shù)進(jìn)行向量運(yùn)算,但在矩陣懲罰庫(kù)中,可能有十個(gè)或數(shù)百個(gè)函數(shù)。我試著把所有東西從左到右放在一張幻燈片上,您可以看到這些不同矩陣引擎的復(fù)雜性。為了提高性能,你真的需要添加一些特殊的矩陣引擎,這由接下來(lái)的兩個(gè)選項(xiàng)表示,其中紅色框是添加的。在矩陣中進(jìn)行加法運(yùn)算和累加器會(huì)相乘。

              矢量矩陣方法:添加新的大矩陣?yán)奂悠鳡顟B(tài)以保持C,C狀態(tài)可能被劃分為一個(gè)或多個(gè)圖塊。使用RVV向量為Matmul提供源操作數(shù)A和不。外產(chǎn)品樣式矩陣乘以C,可能對(duì)較窄的輸入類(lèi)型“fat”K>1的支持。支持C行/列移動(dòng)到向量寄存器或夾在、存儲(chǔ)到內(nèi)存,矩陣引擎可以提供非常高的吞吐量,C累加器狀態(tài)位于算術(shù)單元附近。

          圖片.png

              替代矩陣指令擴(kuò)展:

              批次點(diǎn)產(chǎn)品:無(wú)其他矩陣狀態(tài)。在較小的矢量長(zhǎng)度下進(jìn)行小而有效的擴(kuò)大,也可以滿(mǎn)足一些DSP需求,但不能在較大的矢量長(zhǎng)度上擴(kuò)展性能。

              向量中的矩陣:沒(méi)有額外的矩陣狀態(tài),對(duì)于較長(zhǎng)的矢量長(zhǎng)度、允許比點(diǎn)積更大的吞吐量。

              向量矩陣:將矩陣狀態(tài)添加到已經(jīng)具有RVV的處理器中,維護(hù)矢量ISA的內(nèi)存模型。

              分離矩陣:無(wú)約束矩陣和向量設(shè)計(jì),最大的設(shè)計(jì)空間和軟件工作,將需要最多的時(shí)間來(lái)融合。

              所有的行動(dòng),包括適量行動(dòng)都將極大地利用我們的努力來(lái)支持這一點(diǎn)。因此我認(rèn)為這將需要最長(zhǎng)的時(shí)間來(lái)收斂,但這是RISC-V目前為矩陣擴(kuò)系所遵循的四條軌道。第一個(gè)實(shí)際上是更像是一個(gè)向量擴(kuò)展,而一個(gè)主要的擴(kuò)展。所以你可以說(shuō)有一個(gè)快速向量擴(kuò)展的三個(gè)矩陣擴(kuò)展,這就是現(xiàn)在的解決方案。在RISC-V Intermational我們必須標(biāo)準(zhǔn)化,就標(biāo)準(zhǔn)達(dá)成一致。我們還比較確保軟件社區(qū)知道要瞄準(zhǔn)什么。


          評(píng)論


          相關(guān)推薦

          技術(shù)專(zhuān)區(qū)

          關(guān)閉