Claude Opus 4.5

claude-opus-4.5

Claude Opus 4.5 属于 Claude Opus 4 一代的高能力模型,模型卡強調困难推理、程式碼和 Agentic Work。它虽然低于更新的 Opus 版本,但仍代表当代 Claude 的高端能力档位。描述时不应把它写成一般聊天模型,而应強調深度工作和可靠性。

最大上下文

200KToken

最大輸出

64KToken

發布日期

2025年11月24日

模態

Claude Opus 4.5 價格

輸入價格輸出價格快取讀取快取建立 5m
$5/M$25/M$0.5/M$6.25/M

Claude Opus 4.5 API

anthropicPOST /v1/messages

Claude Opus 4.5 基準測試

40.8

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

47.8

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

91.3

/100

Artificial Analysis 數學能力指數

Artificial Analysis 數學推理評分

指數分數

知識與推理

MMLU-Pro

高難度多任務知識評測

89.5%

GPQA

高階科學問題求解

86.6%

HLE

廣泛專家級考試集合

28.4%

程式碼與工程

LiveCodeBench

近期程式題評測

87.1%

SciCode

科學計算程式碼挑戰

49.5%

Terminal-Bench Hard

高難度終端任務執行

47.0%

數學能力

AIME 2025

數學競賽題

91.3%

指令遵循與 Agent 任務

IFBench

指令約束遵循

58.0%

AA-LCR

長上下文推理

74%

τ²-Bench

Agent 工作流程任務

89.5%

指標來源 Artificial Analysis

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

Claude Opus 4.5 常見問題

了解 Claude Opus 4.5 的定位、適合的使用情境、主要優勢、使用限制,以及在 TokenHub 中串接時要注意的事項。

Claude Opus 4.5 是什麼?在 Anthropic 的模型產品線中如何定位?+

Claude Opus 4.5 是 較早一代的 Opus 旗艦模型,適合高難度程式設計與專業分析。它屬於較舊一代,新正式環境導入前應與同系列較新模型比較。

Claude Opus 4.5 最適合哪些工作?+

它適合高難度軟體工程工作、專業文件與決策分析以及長時間多步驟流程。正式上線前應使用具代表性的輸入測試,並訂定可衡量的驗收標準。

團隊為什麼會選擇 Claude Opus 4.5,而不是更小或較舊的模型?+

它最實用的優勢包括出色的程式設計能力、嚴格遵循指示以及可靠執行多步驟代理流程。這些特點對專業文件與決策分析尤其有價值。

在依賴 Claude Opus 4.5 前應先驗證什麼?+

如果專案可受益於較新一代 Opus、較新模型能提供更清楚的移轉路徑與更長的支援週期,或重要決策流程無法安排人工覆核,可以考慮其他模型。產生的程式碼在合併或部署前應通過測試、安全檢查與人工審查。

Claude Opus 4.5 在 TokenHub 中有哪些實用串接建議?+

在 TokenHub 中,請選擇頁面顯示的 Claude Opus 4.5 精確模型識別碼,使用帳戶文件中指定的介面,並以 TokenHub 憑證完成驗證。只有在確認此舊版本仍可用且符合所需支援週期後,才固定 TokenHub 顯示的精確識別碼。