日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

        <style id="k3y6c"><u id="k3y6c"></u></style>
        <s id="k3y6c"></s>
        <mark id="k3y6c"></mark>
          
          

          <mark id="k3y6c"></mark>

          "); //-->

          博客專欄

          EEPW首頁 > 博客 > PromptBench:大型語言模型的對抗性基準測試

          PromptBench:大型語言模型的對抗性基準測試

          發(fā)布人:數(shù)據(jù)派THU 時間:2023-07-12 來源:工程師 發(fā)布文章
          PromptBench是微軟研究人員設(shè)計的一個用于測量大型語言模型(llm)對對抗性提示魯棒性的基準測試。這個的工具是理解LLM的重要一步,隨著這些模型在各種應(yīng)用中越來越普遍,這個主題也變得越來越重要。


          圖片


          研究及其方法論


          PromptBench采用多種對抗性文本攻擊,研究人員生成了4000多個對抗性提示,然后通過8個任務(wù)和13個數(shù)據(jù)集對其進行評估。這種全面的方法確保了潛在漏洞的廣泛覆蓋,并提供了對LLM性能的可靠評估。圖片


          研究結(jié)果及影響


          這項研究的結(jié)果表明,當代LLM很容易受到對抗性提示的影響。這個漏洞是一個需要解決的關(guān)鍵問題,以確保llm在實際應(yīng)用程序中的可靠性和健壯性。作為數(shù)據(jù)科學(xué)家,我們必須意識到這些漏洞,并努力開發(fā)能夠抵御此類對抗性攻擊的模型。
          論文還提供了快速減輕這些漏洞的建議。這些建議對于任何使用大模型的人來說都是非常寶貴的,并且可以指導(dǎo)開發(fā)更健壯的模型。

          開源代碼


          研究人員已經(jīng)公開了研究中使用的代碼、提示和方法。我們必須繼續(xù)調(diào)查,在它們研究的基礎(chǔ)上進行更深入的研究,共同努力推進模型的改進,已經(jīng)包括的模型如下:

          • google/flan-t5-large
          • databricks/dolly-v1–6b
          • llama-13b
          • vicuna-13
          • cerebras/Cerebras-GPT-13B
          • EleutherAI/gpt-neox-20b
          • google/flan-ul2
          • chatgpt


          論文和研究地址:https://arxiv.org/pdf/2306.04528.pdf
          https://github.com/microsoft/promptbench


          *博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



          關(guān)鍵詞: AI

          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉