日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

        <style id="k3y6c"><u id="k3y6c"></u></style>
        <s id="k3y6c"></s>
        <mark id="k3y6c"></mark>
          
          

          <mark id="k3y6c"></mark>

          新聞中心

          EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > Anthropic推出全新旗艦Claude Sonnet 4.5 模型,創(chuàng)下AI編碼記錄

          Anthropic推出全新旗艦Claude Sonnet 4.5 模型,創(chuàng)下AI編碼記錄

          作者: 時間:2025-09-30 來源: 收藏

          PBC 今天推出了其最新的大型語言 和用于構(gòu)建人工智能代理的工具包。

          該公司將 LLM 描述為世界上最好的編碼。此外,它還表示 Sonnet 4.5 在旨在評估神經(jīng)網(wǎng)絡(luò)工具使用能力的基準測試上創(chuàng)下了記錄。

          Sonnet 4.5 是一種混合推理,這意味著它有兩種模式。當用戶輸入相對簡單的查詢時,LLM 會使用有限的計算能力快速生成響應(yīng)。當收到更復(fù)雜的問題時,Sonnet 4.5 可以花費大量時間來回答答案。這種方法以更高的硬件使用率為代價提高了輸出質(zhì)量。

          使用名為 SWE-bench Verify 的基準測試評估了該模型的編程能力。Sonnet 4.5 以 82% 的得分創(chuàng)造了新的行業(yè)紀錄。接下來的兩個最高分也是 模型獲得的,而第四名是 GPT-5 Codex,它正確回答了 74.5% 的問題。

          Sonnet 4.5 還在名為 OSWorld 的第二個基準測試中創(chuàng)下了記錄。它用于衡量神經(jīng)網(wǎng)絡(luò)與數(shù)據(jù)庫等外部應(yīng)用程序的交互程度。Sonnet 4.5 取得了 61.4% 的創(chuàng)紀錄分數(shù),比四個月前發(fā)布的 Sonnet 4 模型 Anthropic 提高了近 20%。

          該公司聲稱,其最新的法學(xué)碩士在六多個其他基準測試中也優(yōu)于競爭對手。據(jù) Anthropic 稱,這些測試評估人工智能模型執(zhí)行解釋圖表和分析財務(wù)數(shù)據(jù)等任務(wù)的能力。

          Sonnet 4.5 可通過 Anthropic 的 Claude 聊天機器人服務(wù)、Claude Code 編程助手及其應(yīng)用程序編程接口獲得。后兩款產(chǎn)品今天隨著 LLM 的發(fā)布而收到了更新。

          開發(fā)人員通過在命令行界面中輸入指令來與 Claude Code 進行交互。作為今天更新的一部分,Anthropic 對該界面進行了多項可用性改進。此外,它還推出了一個擴展,將 Claude Code 嵌入到流行的 Visual Studio Code 編程工具中。該擴展目前處于測試階段。

          Claude Code 的另一個主要新增功能是一項功能,該功能在每次重大更改后自動保存用戶的代碼。如果工作流程中出現(xiàn)錯誤,開發(fā)人員可以將他們的代碼倒回到早期的可靠版本。

          這些升級與名為 Claude Agent SDK 的開發(fā)工具包一起推出。據(jù) Anthropic 稱,其工程師最初構(gòu)建該工具包是為了支持 Claude Code??蛻艨梢允褂盟鼇順?gòu)建 AI 代理。

          Claude Agent SDK 使代理能夠?qū)⒐ぷ魑薪o所謂的子代理,這些子代理可以并行執(zhí)行多個任務(wù),從而加快處理速度。此外,該工具包可以更輕松地構(gòu)建可以與外部系統(tǒng)交互的 AI 應(yīng)用程序。為了降低幻覺的風(fēng)險,使用 Claude Agent SDK 構(gòu)建的代理可以檢查其輸出是否存在準確性問題。

          該工具包可以與 Claude API 一起使用,它現(xiàn)在提供對 Sonnet 4.5 的訪問。LLM 還加入了其他幾個增強功能。

          據(jù) Anthropic 稱,開發(fā)人員現(xiàn)在可以讓其人工智能模型訪問“專用內(nèi)存目錄”,其中包含可以幫助他們回答提示的信息。當不再需要該信息時,可以使用新的上下文編輯工具將其從模型的上下文窗口中刪除。Anthropic 表示,這些增強功能將使 Claude API 能夠處理比以前更復(fù)雜的任務(wù)。



          關(guān)鍵詞: Anthropic Claude Sonnet 4.5 模型 AI編碼

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉