日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

<style id="k3y6c"><u id="k3y6c"></u></style>

<mark id="k3y6c"></mark>

<mark id="k3y6c"></mark>

<dfn id="jvhcg"></dfn><p id="jvhcg"><ruby id="jvhcg"></ruby></p>

<td id="jvhcg"></td>

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > Anthropic推出全新旗艦Claude Sonnet 4.5 模型，創(chuàng)下AI編碼記錄

Anthropic推出全新旗艦Claude Sonnet 4.5 模型，創(chuàng)下AI編碼記錄

作者：時間：2025-09-30 來源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

Anthropic PBC 今天推出了其最新的大型語言模型 Claude Sonnet 4.5 和用于構(gòu)建人工智能代理的工具包。

該公司將 LLM 描述為世界上最好的編碼模型。此外，它還表示 Sonnet 4.5 在旨在評估神經(jīng)網(wǎng)絡(luò)工具使用能力的基準測試上創(chuàng)下了記錄。

Sonnet 4.5 是一種混合推理模型，這意味著它有兩種模式。當用戶輸入相對簡單的查詢時，LLM 會使用有限的計算能力快速生成響應(yīng)。當收到更復(fù)雜的問題時，Sonnet 4.5 可以花費大量時間來回答答案。這種方法以更高的硬件使用率為代價提高了輸出質(zhì)量。

Anthropic 使用名為 SWE-bench Verify 的基準測試評估了該模型的編程能力。Sonnet 4.5 以 82% 的得分創(chuàng)造了新的行業(yè)紀錄。接下來的兩個最高分也是 Anthropic 模型獲得的，而第四名是 GPT-5 Codex，它正確回答了 74.5% 的問題。

Sonnet 4.5 還在名為 OSWorld 的第二個基準測試中創(chuàng)下了記錄。它用于衡量神經(jīng)網(wǎng)絡(luò)與數(shù)據(jù)庫等外部應(yīng)用程序的交互程度。Sonnet 4.5 取得了 61.4% 的創(chuàng)紀錄分數(shù)，比四個月前發(fā)布的 Sonnet 4 模型 Anthropic 提高了近 20%。

該公司聲稱，其最新的法學(xué)碩士在六多個其他基準測試中也優(yōu)于競爭對手。據(jù) Anthropic 稱，這些測試評估人工智能模型執(zhí)行解釋圖表和分析財務(wù)數(shù)據(jù)等任務(wù)的能力。

Sonnet 4.5 可通過 Anthropic 的 Claude 聊天機器人服務(wù)、Claude Code 編程助手及其應(yīng)用程序編程接口獲得。后兩款產(chǎn)品今天隨著 LLM 的發(fā)布而收到了更新。

開發(fā)人員通過在命令行界面中輸入指令來與 Claude Code 進行交互。作為今天更新的一部分，Anthropic 對該界面進行了多項可用性改進。此外，它還推出了一個擴展，將 Claude Code 嵌入到流行的 Visual Studio Code 編程工具中。該擴展目前處于測試階段。

Claude Code 的另一個主要新增功能是一項功能，該功能在每次重大更改后自動保存用戶的代碼。如果工作流程中出現(xiàn)錯誤，開發(fā)人員可以將他們的代碼倒回到早期的可靠版本。

這些升級與名為 Claude Agent SDK 的開發(fā)工具包一起推出。據(jù) Anthropic 稱，其工程師最初構(gòu)建該工具包是為了支持 Claude Code?？蛻艨梢允褂盟鼇順?gòu)建 AI 代理。

Claude Agent SDK 使代理能夠?qū)⒐ぷ魑薪o所謂的子代理，這些子代理可以并行執(zhí)行多個任務(wù)，從而加快處理速度。此外，該工具包可以更輕松地構(gòu)建可以與外部系統(tǒng)交互的 AI 應(yīng)用程序。為了降低幻覺的風(fēng)險，使用 Claude Agent SDK 構(gòu)建的代理可以檢查其輸出是否存在準確性問題。

該工具包可以與 Claude API 一起使用，它現(xiàn)在提供對 Sonnet 4.5 的訪問。LLM 還加入了其他幾個增強功能。

據(jù) Anthropic 稱，開發(fā)人員現(xiàn)在可以讓其人工智能模型訪問“專用內(nèi)存目錄”，其中包含可以幫助他們回答提示的信息。當不再需要該信息時，可以使用新的上下文編輯工具將其從模型的上下文窗口中刪除。Anthropic 表示，這些增強功能將使 Claude API 能夠處理比以前更復(fù)雜的任務(wù)。

關(guān)鍵詞： Anthropic Claude Sonnet 4.5 模型 AI編碼

評論

相關(guān)推薦

OpenVINO? 2025.1 正式發(fā)布！

嵌入式系統(tǒng) openvino AI 模型 | 2025-04-17

ARM發(fā)布全新快速虛擬原型模型，加快軟件開發(fā)

yongzhe | 2005-10-19

BodeCAD(Linear)

資源下載 BodeCAD 放大器仿真 Spice 模型 | 2007-02-09

Meta推出開源AI模型Llama 4

Meta 開源 AI 模型 Llama | 2025-04-08

PWM放大器模型和波形

設(shè)計方案放大器模型波形 | 2009-07-06

基于模型的設(shè)計迎接當今嵌入式系統(tǒng)設(shè)計面臨的不斷增加的挑戰(zhàn)

資源下載嵌入式系統(tǒng)設(shè)計模型 | 2007-09-15

谷歌 DeepMind 推出新 AI 模型，機器人未經(jīng)訓(xùn)練也能執(zhí)行現(xiàn)實任務(wù)

智能計算谷歌 DeepMind AI 模型機器人 | 2025-03-13

用英特爾? 酷睿? Ultra及OpenVINO? GenAI本地部署DeepSeek-R1

智能計算 DeepSeek 部署模型 | 2025-03-26

H.264的碼率控制策略

Naiqa | 2005-10-10

手電筒控制模型電動機電路

設(shè)計方案手電筒控制模型電動機 | 2009-07-06

地表最貴 AI 模型上線：OpenAI 推出 o1-pro API

智能計算地表最貴 AI 模型 OpenAI o1-pro API | 2025-03-20

管理科學(xué)-運籌學(xué)：戰(zhàn)略角度的審視.rar

資源下載管理科學(xué) 運籌學(xué) 戰(zhàn)略管理科學(xué) 模型序貫決策分析同步思考模擬未來決策者競爭 | 2009-03-18

Anthropic推出全新旗艦Claude Sonnet 4.5 模型，創(chuàng)下AI編碼記錄

智能計算 Anthropic Claude Sonnet 4.5 模型 AI編碼 | 2025-09-30

[轉(zhuǎn)帖]I-Logix: 模型驅(qū)動開發(fā)理應(yīng)有測試的一席之地

newcore | 2004-03-14

直面 OpenAI，Anthropic 正籌備“最快本月”推出語音交互功能

智能計算 OpenAI Anthropic 語音交互 | 2025-04-16

手電筒控制模型電動機電路

設(shè)計方案手電筒控制模型電動機 | 2009-07-06

實驗24洗衣機模型

資源下載洗衣機模型 | 2007-04-20

在英特爾? 酷睿? Ultra AI PC上用NPU部署YOLOv11與YOLOv12

智能計算計算機視覺模型 OpenVINO | 2025-03-26

Anthropic估值接近$170B，并可能獲得$5B融資

智能計算 Anthropic 大型語言模型 | 2025-07-30

功率變換器建模技術(shù)綜述+

資源下載模型等效電路傳輸線功率因素校正離散 | 2007-02-16

手電筒控制模型電動機電路

設(shè)計方案手電筒控制模型電動機 | 2009-07-06

IGBT的VCR(壓控電阻)等效電路模型

設(shè)計方案壓控電阻等效電路模型 | 2009-07-06

Anthropic完成大模型行業(yè)第二大規(guī)模融資

Anthropic 大模型融資 | 2025-09-04

ARM發(fā)布全新快速虛擬原型模型，加快軟件開發(fā)(zz)

twentyone | 2005-06-20

[原創(chuàng)]使用UML工具創(chuàng)建計數(shù)器的例子(2)模型仿真

newcore | 2004-03-16

焦點

推薦視頻

技術(shù)專區(qū)

<small id="ertd0"><menuitem id="ertd0"></menuitem></small>