國產(chǎn)開源版「ChatGPT插件系統(tǒng)」來了!豆瓣、搜索一應(yīng)俱全,清華、面壁智能等聯(lián)合發(fā)布
最近,一個被稱為「ChatGPT Plugins國產(chǎn)替代系統(tǒng)」的開源項(xiàng)目在GitHub上星標(biāo)猛增。
這個項(xiàng)目就是BMTools,面壁智能自研的大模型工具學(xué)習(xí)引擎。

項(xiàng)目地址:https://github.com/OpenBMB/BMTools
深耕前沿,快速嵌入大模型工具學(xué)習(xí)
那么,這種工具學(xué)習(xí)對大模型又有何作用?盡管大模型在很多方面取得了顯著的成果,但在特定領(lǐng)域的任務(wù)上,仍然存在一定的局限性。這些任務(wù)往往需要專業(yè)化的工具或領(lǐng)域知識才能有效解決。因此,就像智能手機(jī)需要下載App才有更好的使用體驗(yàn),大模型需要具備調(diào)用各種專業(yè)化工具的能力,這樣才能為現(xiàn)實(shí)世界任務(wù)提供更為全面的支持。大模型新范式工具學(xué)習(xí)(Tool Learning)應(yīng)運(yùn)而生。這一范式的核心在于將專業(yè)工具與基礎(chǔ)模型的優(yōu)勢相融合,以在問題解決方面達(dá)到更高的準(zhǔn)確性、效率和自主性。大模型與外部工具的有機(jī)結(jié)合成功彌補(bǔ)了此前能力的諸多短板,工具學(xué)習(xí)極大地釋放了大模型的潛力。
面壁為什么能在ChatGPT Plugins發(fā)布后僅十天就推出BMTools?面壁智能一直潛心研發(fā)大模型全流程高效計(jì)算工具,研發(fā)團(tuán)隊(duì)從2022年就開始持續(xù)開展工具學(xué)習(xí)新范式的研究,嘗試將現(xiàn)有語言模型與搜索引擎、知識庫等工具結(jié)合,取得了較好的實(shí)驗(yàn)效果。團(tuán)隊(duì)還在工具學(xué)習(xí)前沿研究領(lǐng)域進(jìn)行了卓有成效的探索。為滿足眾多開發(fā)者對OpenAI Plugins能力的熱切期盼,在前期積累的基礎(chǔ)上,團(tuán)隊(duì)快速將相關(guān)研究成果工具化,積累整理成工具包BMTools,將工具學(xué)習(xí)嵌入面壁智能大模型能力體系,正式加入OpenBMB大模型工具體系「全家桶」。工具學(xué)習(xí)也是面壁智能繼高效訓(xùn)練、微調(diào)、推理、壓縮套件后推出的又一大力作。
引領(lǐng)破壁,首發(fā)聯(lián)網(wǎng)支持中文問答模型
WebCPM論文鏈接:https://arxiv.org/abs/2305.06849WebCPM數(shù)據(jù)與代碼鏈接:https://github.com/thunlp/WebCPM可以說,自從ChatGPT爆火之后,國內(nèi)各家各派的大模型雨后春筍般涌現(xiàn),但大部分模型都沒有聯(lián)網(wǎng)。而沒有聯(lián)網(wǎng)的大模型無法獲取最新的信息,生成的內(nèi)容基于陳舊的數(shù)據(jù)集,存在一定的局限性。WebCPM的特點(diǎn)在于其信息檢索基于交互式網(wǎng)頁搜索,能夠像人類一樣與搜索引擎交互從而收集回答問題所需要的事實(shí)性知識并生成答案。換言之,大模型在聯(lián)網(wǎng)功能的加持下,回答問題的實(shí)時性和準(zhǔn)確性都得到了飛躍式增強(qiáng)。
WebCPM模型框架WebCPM對標(biāo)的是WebGPT , WebGPT也正是微軟近期推出的New Bing背后的新一代搜索技術(shù)。同WebGPT一樣,WebCPM克服了傳統(tǒng)的LFQA( Long-form Question Answering)長文本開放問答范式的缺陷:依賴于非交互式的檢索方法,即僅使用原始問題作為查詢語句來檢索信息。在WebCPM框架下,模型能夠像人類一樣通過與搜索引擎實(shí)時交互來進(jìn)行網(wǎng)頁搜索而篩選高質(zhì)量信息。不僅如此,遇到復(fù)雜問題,模型也像人類一般將其分解成多個子問題并依次提問。而且,通過識別和瀏覽相關(guān)信息,模型還會逐漸完善對原問題的理解,并不斷查詢新問題來搜索更多樣的信息。高屋建瓴,致力打造國產(chǎn)大模型系統(tǒng)

OpenBMB開源社區(qū)
為建設(shè)國內(nèi)大模型開源生態(tài)貢獻(xiàn)力量,發(fā)布了包括OpenPrompt、OpenDelta、BMInf、BMcook、BMTrain、BMTools等一系列大模型全流程開源工具包,并且在知乎、B站等平臺推出了大模型全民公開課。
清華大學(xué)計(jì)算機(jī)系自然語言處理與社會人文計(jì)算實(shí)驗(yàn)室(THUNLP)
作為在高校中一騎絕塵的研究力量,成立于上世紀(jì)70年代,是國內(nèi)開展NLP研究最早、深具影響力的科研單位,多名知名學(xué)者和科學(xué)家坐鎮(zhèn),在語言大模型領(lǐng)域的研究工作十分突出。
面壁智能
致力于大模型在人工智能典型場景與領(lǐng)域的應(yīng)用與落地,CPM大模型是面壁團(tuán)隊(duì)根據(jù)多年的大模型訓(xùn)練經(jīng)驗(yàn)自研的預(yù)訓(xùn)練語言大模型。公司目前已完成數(shù)千萬元天使輪融資,并多家知名機(jī)構(gòu)與公司達(dá)成戰(zhàn)略合作。
在努力打造國產(chǎn)大模型系統(tǒng)的征程中,面壁智能的愿景始終是讓大模型落地賦能更多產(chǎn)業(yè)、惠及更多的企業(yè)和個人。星火已燎原,我們期待大模型在更多領(lǐng)域釋放潛能,展現(xiàn)令人驚喜的應(yīng)用價值。來源:新智元
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。

