人工智能的下一步是什么:英偉達(dá)、蘋果、谷歌和斯坦福大學(xué)的研究人員設(shè)想了下一次飛躍
在OpenAI于2022年發(fā)布ChatGPT并進(jìn)入公眾意識(shí)之前,人工智能正在研究實(shí)驗(yàn)室中悄然發(fā)展,并在科學(xué)會(huì)議上進(jìn)行討論。由于企業(yè)界的大部分注意力目前都集中在人工智能代理和對(duì)重塑企業(yè)生產(chǎn)的巨大期望上,一群工程師和科學(xué)家一直在研究下一步。
灣區(qū)機(jī)器學(xué)習(xí)研討會(huì)(BayLearn)的演講者提供了對(duì)即將發(fā)生的事情的暗示,BayLearn是來(lái)自整個(gè)硅谷的高級(jí)科學(xué)家和工程師的年度聚會(huì)。今年的活動(dòng)由圣克拉拉大學(xué)工程學(xué)院于周四主辦,讓我們得以一睹隨著公司和研究實(shí)驗(yàn)室完善人工智能方法,人工智能領(lǐng)域的一些領(lǐng)先聲音如何設(shè)想該技術(shù)的未來(lái)影響。
“我們不僅僅是在構(gòu)建系統(tǒng),我們還在嘗試思考系統(tǒng)試圖解決的根本問(wèn)題,”英偉達(dá)公司應(yīng)用深度學(xué)習(xí)研究副總裁布萊恩·卡坦扎羅(如圖)在會(huì)議上的演講中說(shuō)。
Nvidia 的 Nemotron 推動(dòng)加速計(jì)算
英偉達(dá)解決系統(tǒng)問(wèn)題的方法的一個(gè)重要部分涉及 Nemotron,這家芯片制造商的開(kāi)源人工智能技術(shù)集合,旨在使人工智能開(kāi)發(fā)在每個(gè)階段都更加高效。其中包括多模態(tài)模型和數(shù)據(jù)集、訓(xùn)練前和訓(xùn)練后工具、精確算法和用于在 GPU 集群上擴(kuò)展 AI 的軟件。
Nemotron 是“神經(jīng)模塊”和變形金剛玩具系列中角色威震天的合成詞,是 Nvidia 加速計(jì)算愿景的核心。
“Nemotron 是 Nvidia 如何思考未來(lái)加速計(jì)算的一個(gè)真正基本部分,”Catanzaro 說(shuō)?!凹铀儆?jì)算實(shí)際上是關(guān)于專業(yè)化......以及做一些你用標(biāo)準(zhǔn)計(jì)算機(jī)做不到的事情。加速計(jì)算不僅僅是一個(gè)芯片。
英偉達(dá)還認(rèn)為,人工智能的未來(lái)進(jìn)步將受到開(kāi)源社區(qū)貢獻(xiàn)的推動(dòng)。Catanzaro 在演講結(jié)束后接受 SiliconANGLE 采訪時(shí)指出,Meta Platforms Inc. 以及中國(guó)的阿里巴巴集團(tuán)控股有限公司和 DeepSeek 都參與了 Nemotron。
“有很多偉大的貢獻(xiàn),”卡坦扎羅說(shuō)。“Nemotron 數(shù)據(jù)集正在被每個(gè)人使用?!?/p>
卡坦扎羅為人工智能的進(jìn)步做出了自己獨(dú)特的貢獻(xiàn)。正如斯蒂芬·威特 (Stephen Witt) 關(guān)于英偉達(dá)崛起的書(shū)《思考機(jī)器》中所記錄的那樣,創(chuàng)始人兼首席執(zhí)行官黃仁勛將公司轉(zhuǎn)向人工智能的決定可以追溯到他與卡坦扎羅的互動(dòng),卡坦扎羅認(rèn)為深度學(xué)習(xí)是人工智能未來(lái)的關(guān)鍵。
在與 SiliconANGLE 的對(duì)話中,Catanzaro 描述了他在現(xiàn)場(chǎng)可編程門陣列或 FPGA 方面的工作如何讓他對(duì) Nvidia 基于 GPU 的 CUDA 計(jì)算架構(gòu)的速度產(chǎn)生了贊賞。他對(duì)這項(xiàng)技術(shù)如何應(yīng)用于人工智能很感興趣,并于 2013 年與黃仁勛討論了該技術(shù)在機(jī)器學(xué)習(xí)中的應(yīng)用。
“我看了它,認(rèn)為 Nvidia 為 CUDA 帶來(lái)的編程有一些特別之處,”Catanzaro 說(shuō)。“當(dāng)時(shí),CUDA 并沒(méi)有那么專注于機(jī)器學(xué)習(xí)。它專注于高性能計(jì)算。那段旅程非常令人興奮......剩下的就是歷史了。
啟用交互式 AI
人工智能的發(fā)展和崛起歷史也得益于克里斯托弗·曼寧教授等計(jì)算機(jī)科學(xué)家的影響。作為自然語(yǔ)言處理或 NLP 領(lǐng)域的著名專家,曼寧提醒 BayLearn 與會(huì)者,20 多年前,大型語(yǔ)言模型甚至沒(méi)有受到許多科學(xué)家的關(guān)注,當(dāng)時(shí)在計(jì)算語(yǔ)言學(xué)協(xié)會(huì)會(huì)議上發(fā)表了 33 篇關(guān)于人工智能的論文。

斯坦福大學(xué)教授克里斯托弗·曼寧 (Christopher Manning) 在 BayLearn 會(huì)議上談到了他的 NLP 研究和人工智能。
“1993 年有多少篇法學(xué)碩士論文?”曼寧問(wèn)道。“沒(méi)有。如果沒(méi)有 20/20 的事后諸葛亮,沒(méi)有人談?wù)撜Z(yǔ)言模型真的很令人驚訝。我們顯然本可以而且應(yīng)該更早地推動(dòng)法學(xué)碩士。人們不相信法學(xué)碩士會(huì)有用。
然而,事實(shí)證明有用的是基于人工智能的應(yīng)用程序的自然語(yǔ)言功能。曼寧在斯坦福大學(xué)的研究為深度學(xué)習(xí)在自然語(yǔ)言處理中的應(yīng)用鋪平了道路,此后成為人工智能發(fā)展和在當(dāng)今廣泛應(yīng)用中的基礎(chǔ)。
曼寧是斯坦福大學(xué)以人為本的人工智能研究所的創(chuàng)始人兼副所長(zhǎng),他表示沮喪的是,目前專注于人工智能以追求立竿見(jiàn)影的結(jié)果,而忽視了該技術(shù)通過(guò)與周圍世界的互動(dòng)變得更好的潛力。
“法學(xué)碩士根本不以交互方式工作,”曼寧說(shuō)?!叭祟惪梢詫W(xué)習(xí)的數(shù)據(jù)比我們當(dāng)前的模型少幾個(gè)數(shù)量級(jí)。我們的人類學(xué)習(xí)比機(jī)器學(xué)習(xí)更好。
根據(jù)曼寧的說(shuō)法,解決方案是系統(tǒng)泛化,人工智能模型能夠超越當(dāng)前用數(shù)據(jù)堵塞它們的行業(yè)解決方案,進(jìn)入一個(gè)代理可以通過(guò)交互學(xué)習(xí)的世界。目標(biāo)是創(chuàng)建將已知元素組合成新穎含義的人工智能模型。曼寧表示,這將涉及構(gòu)建一個(gè)系統(tǒng),該系統(tǒng)將通過(guò)“瀏覽網(wǎng)站”來(lái)學(xué)習(xí),通過(guò)探索變得更好。
“在合理的程度上,暴力破解 [數(shù)據(jù)] 是有效的,但這不是人類的工作方式,”曼寧指出。“我們需要獲得更有效的模型,以實(shí)現(xiàn)系統(tǒng)的泛化?!?/p>
新的機(jī)器學(xué)習(xí)和機(jī)器人工具
對(duì)系統(tǒng)泛化的追求將需要構(gòu)建新的人工智能框架,以便在計(jì)算網(wǎng)絡(luò)上更高效地運(yùn)行。Apple Inc. 正在開(kāi)發(fā)這樣的解決方案,并增強(qiáng) MLX,用于 Apple 芯片的機(jī)器學(xué)習(xí)軟件。
開(kāi)源機(jī)器學(xué)習(xí)框架由 Apple 為 Mac 計(jì)算機(jī)開(kāi)發(fā)。MLX 發(fā)布近兩年,可以將高級(jí) Python 代碼轉(zhuǎn)換為優(yōu)化的機(jī)器代碼。有報(bào)道稱,蘋果還在與英偉達(dá)合作,為 MLX 添加 CUDA 后端支持,作為其降低構(gòu)建機(jī)器學(xué)習(xí)框架成本的努力的一部分。
“我們認(rèn)為這是一個(gè)構(gòu)建為硬件量身定制的機(jī)器學(xué)習(xí)軟件的機(jī)會(huì),”蘋果公司的研究科學(xué)家羅南·科洛伯特 (Ronan Collobert) 在 BayLearn 聚會(huì)上說(shuō)?!拔覀儽仨殢南到y(tǒng)的角度思考如何可靠地部署人工智能?!?/p>
對(duì)于普通消費(fèi)者來(lái)說(shuō),工程師對(duì)機(jī)器學(xué)習(xí)框架和編碼支持的熱情可能不會(huì)起到任何作用。然而,人工智能的進(jìn)步也在改變機(jī)器人世界,這種方式可能很快就會(huì)在我們周圍的世界中變得更加明顯。
谷歌有限責(zé)任公司的 DeepMind 研究部門一直致力于開(kāi)發(fā)旨在使機(jī)器人更加智能的模型。上個(gè)月,該公司發(fā)布了 Gemini Robotics 1.5 和 ER 1.5 模型,它們體現(xiàn)了幫助機(jī)器人真正思考的推理能力。
DeepMind 的方法以前是讓機(jī)器人具備執(zhí)行單一任務(wù)的能力,例如折疊一張紙?,F(xiàn)在,它們能夠使用更高級(jí)的功能,例如選擇適合預(yù)測(cè)天氣條件的衣服。
谷歌 DeepMind 研究副總裁 Ed Chi 表示,人工智能正在推動(dòng)通用機(jī)器人領(lǐng)域的進(jìn)步,機(jī)器可以根據(jù)簡(jiǎn)單的自然語(yǔ)言提示撿起物品并將其扔掉。它迫使工程師重新思考一個(gè)宏偉的世界愿景,在這個(gè)世界中,通用人工智能 (AGI) 使機(jī)器人能夠在無(wú)限范圍的人類任務(wù)中理解、學(xué)習(xí)和應(yīng)用知識(shí)。
“當(dāng)我沒(méi)有可以打掃房子的機(jī)器人時(shí),我厭倦了所有這些關(guān)于 AGI 的討論,”Chi 在一次會(huì)議小組會(huì)議上說(shuō)?!拔覀儸F(xiàn)在在機(jī)器人技術(shù)方面取得的巨大進(jìn)步是在通用機(jī)器人領(lǐng)域。這已經(jīng)足夠好了。
“足夠好”確實(shí)可能成為人工智能領(lǐng)域開(kāi)發(fā)者的口頭禪,因?yàn)檫M(jìn)步以光速發(fā)展,企業(yè)繼續(xù)要求立竿見(jiàn)影的效果。人工智能正在推動(dòng)社會(huì)和經(jīng)濟(jì)變革,其速度甚至讓最有經(jīng)驗(yàn)的從業(yè)者都感到震驚。然而,也有人相信,隨著人工智能能力的不斷提高,其影響將是巨大的。
“我們目前生活在一個(gè)絕對(duì)非同尋常的時(shí)代,”斯坦福大學(xué)的曼寧說(shuō)?!拔覀冋咴谝粭l不斷進(jìn)步的道路上。我們將在這項(xiàng)技術(shù)的發(fā)展過(guò)程中陷入瘋狂的旅程。











評(píng)論