如何探索AI計(jì)算的未來(lái)?Arm 以智能終端專屬 Lumex CSS 平臺(tái)給出答案
近日,以“探索 AI 計(jì)算的未來(lái)”為題的Arm Unlocked 2025 系列活動(dòng)在上海正式啟幕,詮釋了Arm將AI計(jì)算作為未來(lái)技術(shù)開(kāi)發(fā)的重點(diǎn)戰(zhàn)略方向,并將集中面向AI計(jì)算需求提供全方面的系統(tǒng)解決方案。
從最早的處理器內(nèi)核IP,到后來(lái)的跨平臺(tái)的IP產(chǎn)品,再到后來(lái)的系統(tǒng)級(jí)方案以及平臺(tái)化解決方案,Arm面向客戶的服務(wù)已經(jīng)從單個(gè)IP向計(jì)算平臺(tái)化解決方案全面轉(zhuǎn)型,從而大幅降低客戶設(shè)計(jì)最先進(jìn)計(jì)算解決方案的門檻,推動(dòng)整個(gè)產(chǎn)業(yè)的發(fā)展。
“平臺(tái)優(yōu)先”戰(zhàn)略引領(lǐng) AI 時(shí)代計(jì)算變革
Arm 高級(jí)副總裁兼終端事業(yè)部總經(jīng)理 Chris Bergey 在峰會(huì)開(kāi)場(chǎng)報(bào)告中解析了 AI 發(fā)展趨勢(shì),并強(qiáng)調(diào)了 Arm “平臺(tái)優(yōu)先”的核心策略。他指出,AI 的快速普及與個(gè)性化發(fā)展,正從模型規(guī)模、應(yīng)用需求、智能體 / 端側(cè) AI、設(shè)計(jì)復(fù)雜度與成本、能效及創(chuàng)新速度六大維度重新定義計(jì)算,并重塑計(jì)算技術(shù)的研發(fā)、部署與規(guī)?;瘧?yīng)用模式。

同時(shí),AI 也正持續(xù)推動(dòng)全球產(chǎn)業(yè)形態(tài)迎來(lái)深度的變革:傳統(tǒng)數(shù)據(jù)中心正向“AI 數(shù)據(jù)中心”轉(zhuǎn)型,以優(yōu)化適配基礎(chǔ)模型訓(xùn)練與大規(guī)模推理;汽車從“軟件定義”邁向“AI 定義”,在感知、自動(dòng)化與個(gè)性化體驗(yàn)方面全面升級(jí);智能手機(jī)與 PC 升級(jí)為“AI 伴侶”或“AI 工作站”,融入用戶思考、工作與創(chuàng)作;物聯(lián)網(wǎng)成為“AI 賦能邊緣端”,為傳感器、攝像頭等設(shè)備賦智 —— 這些場(chǎng)景都對(duì)性能、延遲、功耗及靈活性有著極高的要求。
今年5月,Arm宣布對(duì) Arm 計(jì)算子系統(tǒng) (CSS)并采取新的產(chǎn)品命名體系,包括面向基礎(chǔ)設(shè)施市場(chǎng)的Arm Neoverse、面向汽車市場(chǎng)的 Arm Zena、面向移動(dòng)端市場(chǎng)的 Arm Lumex、面向 PC 市場(chǎng)的 Arm Niva,以及面向物聯(lián)網(wǎng)和邊緣 AI 的Arm Orbis。這些不僅僅是產(chǎn)品品牌名稱的改變,更是 Arm 提供的產(chǎn)品與服務(wù)以及交付方式的轉(zhuǎn)型。Arm 計(jì)算子系統(tǒng)通過(guò)縮短設(shè)計(jì)周期、降低開(kāi)發(fā)風(fēng)險(xiǎn),加快開(kāi)發(fā)進(jìn)程,助力用戶在瞬息萬(wàn)變的市場(chǎng)中加快創(chuàng)新步伐、與時(shí)俱進(jìn)。Arm交付 CSS 的方式靈活多樣,在某些市場(chǎng)提供高度集成的計(jì)算網(wǎng)格,而在其他市場(chǎng)則采用可靈活組合的子模塊。
為了助力合作伙伴在快速演進(jìn)的 AI 計(jì)算需求提前做好準(zhǔn)備,Arm 持續(xù)進(jìn)化產(chǎn)品體系:從 IP 到計(jì)算子系統(tǒng) (CSS),再到“AI 優(yōu)先”的計(jì)算平臺(tái)。這項(xiàng)著眼“平臺(tái)優(yōu)先”的產(chǎn)品戰(zhàn)略,整合了高性能 CPU/GPU 硬件、KleidiAI 軟件工具及集成庫(kù),構(gòu)建起“芯片 - 軟件 - 工具”的端到端平臺(tái)。憑借卓越的性能、能效和可擴(kuò)展性,該計(jì)算平臺(tái)能助力合作伙伴實(shí)現(xiàn)快速集成,降低研發(fā)復(fù)雜度與規(guī)?;L(fēng)險(xiǎn),滿足 AI 時(shí)代的多樣化需求。
在這次峰會(huì)上,Arm重磅推出了其面向智能終端 AI 的新 Arm Lumex CSS 平臺(tái),這是一套專為旗艦級(jí)智能手機(jī)及下一代個(gè)人電腦加速其人工智能 (AI) 體驗(yàn)的先進(jìn)計(jì)算平臺(tái)。Lumex CSS 平臺(tái)集成了搭載第二代可伸縮矩陣擴(kuò)展 (SME2) 技術(shù)的最高性能 Arm CPU、GPU 及系統(tǒng) IP,不僅能助力生態(tài)伙伴更快將 AI 設(shè)備推向市場(chǎng),還可支持桌面級(jí)移動(dòng)游戲、實(shí)時(shí)翻譯、智能助手及個(gè)性化應(yīng)用等多樣的豐富體驗(yàn)。
技術(shù)發(fā)展的日新月異對(duì)產(chǎn)品上市更新的速度提出苛刻要求,加速產(chǎn)品周期意味著芯片供應(yīng)商和 OEM 廠商必須在更緊迫的時(shí)間內(nèi)實(shí)現(xiàn)創(chuàng)新,幾乎沒(méi)有出錯(cuò)余地。在面積和散熱受限的移動(dòng)設(shè)備尺寸條件下,要實(shí)現(xiàn)為保持 AI 性能而采用的先進(jìn)封裝技術(shù),是一項(xiàng)極具挑戰(zhàn)的任務(wù)。與此同時(shí),向 3 納米等更小工藝節(jié)點(diǎn)的發(fā)展也帶來(lái)了復(fù)雜的設(shè)計(jì)難題。這正是 Arm 推出集成平臺(tái)的原因,通過(guò)將 Arm CPU 和 GPU IP,與物理實(shí)現(xiàn)和部署就緒的軟件棧相結(jié)合,從而加快產(chǎn)品上市進(jìn)程,并在最新的先進(jìn)工藝節(jié)點(diǎn)上實(shí)現(xiàn)業(yè)界領(lǐng)先的性能。而 Arm Lumex 就是Arm 新的專用CSS平臺(tái),旨在滿足旗艦移動(dòng)設(shè)備和 PC 上持續(xù)增長(zhǎng)的端側(cè) AI 體驗(yàn)需求。

Lumex 為模塊化且高度可配置的平臺(tái)提供最新的協(xié)同設(shè)計(jì)、協(xié)同優(yōu)化的 Arm 計(jì)算 IP 和先進(jìn)特性:
新的 Armv9.3 C1 CPU 集群:包含C1-Ultra、C1-Premium、C1-Pro和C1-Nano四個(gè)層級(jí)選擇,提供領(lǐng)先的每時(shí)鐘周期指令數(shù) (IPC) 性能,并內(nèi)建第二代 Arm 可伸縮矩陣擴(kuò)展 (SME2) 單元,在 CPU 集群上帶來(lái)響應(yīng)更迅速的加速 AI 體驗(yàn)。
新的 Arm Mali G1-Ultra:在實(shí)現(xiàn)更快的 AI 推理能力的同時(shí),通過(guò)新一代的光線追蹤功能,帶來(lái)桌面級(jí)別的視覺(jué)效果與更豐富的游戲體驗(yàn)。
新的系統(tǒng) IP 包含 Arm SI L1 系統(tǒng)互連與 Arm MMU L1 系統(tǒng)內(nèi)存管理單元:旨在消除系統(tǒng)性能瓶頸,以及降低推理密集型和計(jì)算密集型工作負(fù)載中的延遲。
3 納米就緒的 CPU 和 GPU 物理實(shí)現(xiàn):專為實(shí)現(xiàn)業(yè)界領(lǐng)先的功耗、性能與面積 (PPA) 而打造,并加速在芯片上實(shí)現(xiàn)旗艦級(jí)性能的進(jìn)程。
跨 CPU 和 GPU 技術(shù)加速實(shí)際場(chǎng)景的 AI 性能
在 CPU 方面,啟用 SME2 技術(shù)的 Armv9.3 C1 CPU 集群結(jié)合了 Arm KleidiAI 對(duì)主流框架和運(yùn)行時(shí)庫(kù)的原生支持,在包括典型機(jī)器學(xué)習(xí) (ML) 推理、語(yǔ)音及生成式 AI 等在內(nèi)的廣泛 AI 工作負(fù)載中,相較于上一代 CPU 集群,在相同條件下實(shí)現(xiàn)了顯著的速度提升。同時(shí)帶來(lái)了五倍的 AI 性能提升,以及三倍的能效優(yōu)化。這些基于 SME2 的改進(jìn)使得用戶能在其常用的消費(fèi)類電子設(shè)備上享受更流暢的 AI 交互體驗(yàn),并獲得更長(zhǎng)的續(xù)航時(shí)間。
此外,得益于微架構(gòu)優(yōu)化和核心間更緊密的集成,Arm C1 CPU 集群在性能與能效方面樹(shù)立了新標(biāo)桿,具體表現(xiàn)為:
· 在六項(xiàng)行業(yè)領(lǐng)先性能基準(zhǔn)測(cè)試中,相較于上一代 CPU 集群,在相同條件下的性能水平,平均提升 30%;
· 在主流應(yīng)用(包括游戲和視頻流媒體)中,相較于上一代 CPU 集群,在相同條件下平均速度提升了 15%;
· 在視頻播放、社交媒體和網(wǎng)頁(yè)瀏覽等日常移動(dòng)工作負(fù)載中,相較于上一代 CPU 集群,在相同條件下的功耗,平均降低 12%;
· 相較于上一代 Arm Cortex-X925 CPU,Arm C1-Ultra CPU 帶來(lái)兩位數(shù)的 IPC 性能提升。
Mali G1-Ultra 進(jìn)一步提升了 AI 性能與效率,相較于上一代 Arm Immortalis-G925 GPU,其在 AI 和 ML 網(wǎng)絡(luò)中的推理速度加快了 20%。
在游戲方面,得益于新的 Arm 光線追蹤單元 v2 (Ray Tracing Unit v2, RTUv2),Mali G1-Ultra 將光線追蹤性能提升了兩倍,為移動(dòng)設(shè)備帶來(lái)了高端桌面級(jí)視覺(jué)效果;在主流行業(yè)基準(zhǔn)測(cè)試與游戲應(yīng)用(包括《暗區(qū)突圍》、《堡壘之夜》、《原神》、《崩壞:星穹鐵道》等)中,Mali G1-Ultra 實(shí)現(xiàn)了 20% 的圖形性能增長(zhǎng)。
作為 Lumex CSS 平臺(tái)最亮眼的技術(shù)之一,SME2 不僅能顯著提升設(shè)備的響應(yīng)速度和運(yùn)行效率,還能釋放出傳統(tǒng) CPU 無(wú)法企及的 AI 驅(qū)動(dòng)功能。目前,SME2 已經(jīng)受到包括阿里巴巴、支付寶、三星 System LSI、騰訊及 vivo 在內(nèi)的業(yè)界領(lǐng)先生態(tài)伙伴的廣泛采用與認(rèn)可。
作為業(yè)界首家與 Arm 成立聯(lián)合實(shí)驗(yàn)室的終端品牌,vivo 也出席大會(huì)分享雙方在 AI 賦能的密切合作。vivo 高級(jí)副總裁、首席技術(shù)官施玉堅(jiān)表示:“目前,vivo 計(jì)算加速平臺(tái) VCAP,已全面支持 SME2 指令集,可對(duì)使用視覺(jué)、語(yǔ)音、文本 AI 算法進(jìn)行處理的多項(xiàng)高負(fù)載任務(wù),實(shí)現(xiàn)顯著的性能加速。以典型的端側(cè)任務(wù)為例,SME2 可幫助 vivo 在全局的離線翻譯等真實(shí)場(chǎng)景中,實(shí)現(xiàn)額外 20% 的性能提升,突破過(guò)往最優(yōu)方案上限。我們也在此預(yù)告,Arm 最新一代的高性能計(jì)算技術(shù)以及 SME2 等先進(jìn)特性,將引入 vivo 即將發(fā)布的全新旗艦產(chǎn)品,推動(dòng) AI 移動(dòng)體驗(yàn)更上一層樓?!?nbsp;
底層技術(shù)的迭代與更新重在用戶體驗(yàn)的提升,支付寶作為一款在中國(guó)最頻繁使用的超級(jí)應(yīng)用程序,也在會(huì)中分享他們探索端側(cè)模型推理性能的成果。支付寶終端技術(shù)負(fù)責(zé)人 翁欣旦表示:“在 Arm、支付寶與 vivo 的三方密切協(xié)作下,支付寶已在 vivo 新一代旗艦智能手機(jī)上完成了基于 Arm SME2 技術(shù)的大語(yǔ)言模型推理驗(yàn)證。結(jié)果顯示,在預(yù)填充 (prefill) 與解碼 (decode) 階段的性能分別超過(guò) 40% 和 25% 的提升。這一成果標(biāo)志著 CPU 后端能力的重大突破,也讓我們對(duì)迄今為止所取得的成果備受鼓舞。我們相信,隨著 xNN 的持續(xù)演進(jìn),以及與 SME2 的深度融合,支付寶有望在更多場(chǎng)景釋放 AI 潛能,構(gòu)建更智能、更安全、更個(gè)性化的服務(wù)生態(tài)?!?nbsp;
在 Arm 平臺(tái)攜手共創(chuàng)中國(guó) AI 創(chuàng)新之路
本次峰會(huì)的另一亮點(diǎn)是會(huì)中聚集產(chǎn)業(yè)上下游的 Arm 合作伙伴分別就不同領(lǐng)域的 AI 落地與 Arm 專家展開(kāi)對(duì)談,其中上午場(chǎng)的生態(tài)伙伴關(guān)鍵對(duì)話以“在 Arm 平臺(tái)攜手共創(chuàng)中國(guó) AI 創(chuàng)新之路”為題,由 Arm 中國(guó)區(qū)業(yè)務(wù)全球副總裁鄒挺與來(lái)自阿里云飛天實(shí)驗(yàn)室、安謀科技、網(wǎng)易伏羲實(shí)驗(yàn)室的與談嘉賓一道,共同探討了中國(guó) AI 市場(chǎng)的獨(dú)特發(fā)展特征、產(chǎn)業(yè)上下游的因應(yīng)之道,以及 AI 技術(shù)對(duì)服務(wù)、游戲等熱點(diǎn)行業(yè)下一發(fā)展階段的影響。
自移動(dòng)應(yīng)用興起以來(lái),中國(guó)市場(chǎng)在場(chǎng)景創(chuàng)新、商業(yè)化落地及用戶規(guī)模效應(yīng)方面表現(xiàn)突出,形成了獨(dú)特的發(fā)展模式。
安謀科技首席執(zhí)行官陳鋒表示,在 AI 應(yīng)用領(lǐng)域,中國(guó)不僅擁有不可比擬的市場(chǎng)規(guī)模,更具備廣泛的應(yīng)用場(chǎng)景與強(qiáng)勁的落地潛力。在 AI 技術(shù)創(chuàng)新方面,中國(guó)與全球同步,應(yīng)用廣度尤為突出。依托覆蓋傳統(tǒng)硬件與新興智能設(shè)備的完整產(chǎn)業(yè)鏈體系,中國(guó)為 AI 技術(shù)迅速落地提供了堅(jiān)實(shí)基礎(chǔ),包括智能手機(jī)、智能汽車、機(jī)器人、AI 基礎(chǔ)設(shè)施等眾多領(lǐng)域正全面接入 AI。隨著 AI 加速賦能千行百業(yè),芯片算力需求持續(xù)增長(zhǎng),驅(qū)動(dòng)芯片計(jì)算架構(gòu)從通用走向異構(gòu)。安謀科技將始終以客戶與市場(chǎng)為導(dǎo)向,借助 Arm 架構(gòu)在 AI 計(jì)算中的獨(dú)特優(yōu)勢(shì),結(jié)合自研技術(shù)創(chuàng)新與生態(tài)協(xié)作,積極助力中國(guó)智能計(jì)算生態(tài)建設(shè),賦能 AI 產(chǎn)業(yè)蓬勃發(fā)展。
談及大語(yǔ)言模型與 AI 創(chuàng)新應(yīng)用,阿里云飛天實(shí)驗(yàn)室研究員楊鑌博士認(rèn)為,雖然在全球范圍內(nèi),大模型在產(chǎn)業(yè)中的落地還處于持續(xù)探索的階段,但中國(guó)市場(chǎng)得益于龐大的用戶基礎(chǔ)、豐富的工程技術(shù)資源以及堅(jiān)實(shí)的行業(yè)政策支持,在場(chǎng)景創(chuàng)新方面,無(wú)論是在產(chǎn)業(yè)覆蓋的廣度或是速度上都具有顯著的引領(lǐng)性。阿里云進(jìn)行深入布局,不僅針對(duì)不同應(yīng)用場(chǎng)景開(kāi)源多個(gè)尺寸的通義千問(wèn)大語(yǔ)言模型,也在多模態(tài)大語(yǔ)言模型領(lǐng)域持續(xù)發(fā)力,并在面向端側(cè)設(shè)備方面取得了顯著突破與實(shí)質(zhì)性成果。
在大語(yǔ)言模型支撐的游戲領(lǐng)域,網(wǎng)易伏羲實(shí)驗(yàn)室 AI 算法部負(fù)責(zé)人呂唐杰博士分享,第三方數(shù)據(jù)顯示中國(guó)玩家對(duì) AI 技術(shù)的接受度較高,尤其在內(nèi)容創(chuàng)作與社交分享上意愿顯著。在此背景下,網(wǎng)易伏羲實(shí)驗(yàn)室深耕“游戲+AI”,整合大語(yǔ)言模型 (LLM)、語(yǔ)音交互、動(dòng)畫(huà)生成與強(qiáng)化學(xué)習(xí) (RL) 等前沿 AI 技術(shù),相繼推出《逆水寒》手游智能 NPC、UGC 劇組模式以及《永劫無(wú)間》手游語(yǔ)音 AI 隊(duì)友等多項(xiàng)行業(yè)首創(chuàng)功能。此外,伏羲實(shí)驗(yàn)室也積極與 Arm 等硬件伙伴合作優(yōu)化端側(cè) AI 計(jì)算效能,通過(guò)聯(lián)合研發(fā)構(gòu)建更適配的計(jì)算底座,為探索下一代 AI 游戲體驗(yàn)提供堅(jiān)實(shí)的技術(shù)支撐。
軟硬件的協(xié)作在實(shí)現(xiàn) AI 創(chuàng)新尤為重要,楊鑌博士表示:“感謝 Arm 在端側(cè)模型優(yōu)化方案、芯片廠商生態(tài)合作等方面的支持,未來(lái)希望攜手 Arm 為下游智能終端開(kāi)發(fā)者提供更完善的端到端開(kāi)發(fā)工具,共同推動(dòng)多模態(tài)能力產(chǎn)業(yè)落地。”










評(píng)論