臺(tái)積電如何推動(dòng)人工智能節(jié)能:邏輯和封裝的創(chuàng)新

臺(tái)積電高級(jí)研究員兼研發(fā)/設(shè)計(jì)與技術(shù)平臺(tái)副總裁陸志強(qiáng)博士在臺(tái)積電OIP生態(tài)系統(tǒng)論壇的主題演講中強(qiáng)調(diào)了人工智能擴(kuò)散推動(dòng)的電力需求指數(shù)級(jí)增長(zhǎng)。人工智能正在無(wú)處不在,從超大規(guī)模數(shù)據(jù)中心到邊緣設(shè)備,推動(dòng)日常生活中的新應(yīng)用。
不斷發(fā)展的模型,包括具身人工智能、思維鏈推理和代理系統(tǒng),需要更大的數(shù)據(jù)集、更復(fù)雜的計(jì)算和更長(zhǎng)的處理時(shí)間。這種激增導(dǎo)致人工智能加速器在五年內(nèi)每個(gè)封裝消耗的電力增加了 3 倍,部署規(guī)模在三年內(nèi)擴(kuò)大了 8 倍,這使得能源效率對(duì)于人工智能的可持續(xù)增長(zhǎng)至關(guān)重要。

臺(tái)積電的戰(zhàn)略側(cè)重于先進(jìn)的邏輯和 3D 封裝創(chuàng)新,以及生態(tài)系統(tǒng)合作,以應(yīng)對(duì)這一挑戰(zhàn)。從邏輯擴(kuò)展開始,臺(tái)積電的路線圖是穩(wěn)健的:N2 將于 2025 年下半年進(jìn)入量產(chǎn),N2P 計(jì)劃于明年投入,A16 將于 2026 年底提供背面供電,A14 進(jìn)展順利。
N3 和 N5 的增強(qiáng)功能繼續(xù)增加價(jià)值。從 N7 到 A14,等功率下的速度提高了 1.8 倍,而電源效率提高了 4.2 倍,每個(gè)節(jié)點(diǎn)的功耗比其前身降低了約 30%。A16 的背面電源針對(duì)具有密集網(wǎng)絡(luò)的 AI 和 HPC 芯片,與 N8P 相比,速度提升 10-15% 或節(jié)省 20-2% 的功耗。

N2 Nanoflex DTCO 優(yōu)化了雙高速和低功耗電池的設(shè)計(jì),實(shí)現(xiàn)了 15% 的速度提升或 25-30% 的功耗降低?;A(chǔ)知識(shí)產(chǎn)權(quán)創(chuàng)新進(jìn)一步提高效率。優(yōu)化的傳輸柵極觸發(fā)器以最小的速度 (2%) 和面積 (6%) 權(quán)衡將功率降低 10%,有時(shí)性能優(yōu)于狀態(tài)柵極變體。
具有渦輪/標(biāo)稱模式的雙軌 SRAM 可將效率提高 10%,Vmin 降低 150mV,并優(yōu)化了面積損失。內(nèi)存計(jì)算脫穎而出:臺(tái)積電基于數(shù)字CIM的深度學(xué)習(xí)加速器與傳統(tǒng)的4納米DLA相比,可提供4.5倍TOPS/W和7.8倍TOPS/mm2,可從22納米擴(kuò)展到3納米及以上。臺(tái)積電邀請(qǐng)合作伙伴以進(jìn)一步推進(jìn) CIM。
人工智能驅(qū)動(dòng)的設(shè)計(jì)工具放大了這些收益。新思科技的 DSO。AI 是 PPA 優(yōu)化強(qiáng)化學(xué)習(xí)的領(lǐng)導(dǎo)者,在 APR 流中將電源效率提高了 5%,在金屬堆棧中提高了 2%,總計(jì)提高了 7%。對(duì)于模擬設(shè)計(jì),與臺(tái)積電 API 的集成可實(shí)現(xiàn) 20% 的效率提升和更密集的布局。AI 助手通過(guò)自然語(yǔ)言查詢將分析速度提高 5-10 倍,以獲得配電洞察。
轉(zhuǎn)向 3D 封裝,臺(tái)積電的 3D Fabric 包括用于硅堆疊的 SoIC、用于移動(dòng)/HPC 小芯片的 InFO、用于邏輯-HBM 集成的 CoWoS 以及用于晶圓級(jí) AI 系統(tǒng)的 SoW。節(jié)能通信使 2.5D CoWoS 提高了 1.6 倍,微凸間距從 45μm 到 25μm. 3D SoIC 將效率提高了 6.7 倍,但集成面積更?。? 倍光罩對(duì) 9.5 倍)。符合 UCIE 標(biāo)準(zhǔn)的芯片到芯片 IP 可從 AlphaWave 和 Synopsys 等合作伙伴處獲得。

HBM 集成進(jìn)步:臺(tái)積電 N12 邏輯基芯片上的 HBM4 提供比 HBM3e DRAM 芯片高 1.5 倍的帶寬和效率。N3P 定制基極將電壓從 1.1V 降低到 0.75V。與可插拔器件相比,通過(guò)共封裝光學(xué)器件的硅光子學(xué)可提供 5-10 倍的效率、10-20 倍的低延遲和緊湊的形式。Synopsys/ANSYS 的 AI 優(yōu)化通過(guò)協(xié)同設(shè)計(jì)將這一點(diǎn)提高了 1.2 倍。

使用超高性能金屬-絕緣體-金屬加嵌入式深溝槽電容器的去耦電容創(chuàng)新可實(shí)現(xiàn) 1.5 倍的功率密度,而不會(huì)損失完整性,由 Synopsys/ANSYS 工具建模。EDA-AI 可自動(dòng)執(zhí)行 EDTC 插入(10 倍生產(chǎn)率)和基板布線(100 倍,具有最佳信號(hào)完整性)。

底線:摩爾定律還活著。邏輯擴(kuò)展提供了從 N7 到 A14 的 4.2 倍效率,CIM 增加了 4.5 倍的 IP/設(shè)計(jì)創(chuàng)新,貢獻(xiàn)了 7-20%。封裝從 2.5D 到 3D 的產(chǎn)量提高了 6.7 倍,光子學(xué)產(chǎn)量提高了 5-10 倍,HBM/去耦電容器的產(chǎn)量提高了 1.5-2 倍,人工智能將生產(chǎn)率提高了 10-100 倍。
臺(tái)積電授予合作伙伴在 A14/A16 基礎(chǔ)設(shè)施、多芯片解決方案、AI 設(shè)計(jì)、射頻遷移、IP、3D 結(jié)構(gòu)和云服務(wù)方面的貢獻(xiàn),榮獲 2025 年 OIP 獎(jiǎng)。這絕對(duì)與生態(tài)系統(tǒng)有關(guān)。

指數(shù)級(jí)的人工智能需求需要這樣的創(chuàng)新。臺(tái)積電的合作推動(dòng)了 5-10 倍的收益,促進(jìn)了高效、高效的人工智能生態(tài)系統(tǒng)。展望未來(lái),更深入的合作伙伴關(guān)系將為可持續(xù)的人工智能進(jìn)步帶來(lái)更多迭代。












評(píng)論