Claude Opus 4.5

claude-opus-4.5

Claude Opus 4.5 属于 Claude Opus 4 一代的高能力模型,模型卡强调困难推理、代码和 Agentic Work。它虽然低于更新的 Opus 版本,但仍代表当代 Claude 的高端能力档位。描述时不应把它写成普通聊天模型,而应强调深度工作和可靠性。

最大上下文

200KToken

最大输出

64KToken

发布日期

2025年11月24日

模态

Claude Opus 4.5 价格

输入价格输出价格缓存读取缓存创建 5m
$5/M$25/M$0.5/M$6.25/M

Claude Opus 4.5 API

anthropicPOST /v1/messages

Claude Opus 4.5 基准测试

40.8

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

47.8

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

91.3

/100

Artificial Analysis 数学能力指数

Artificial Analysis 数学推理评分

指数分数

知识与推理

MMLU-Pro

高难度多任务知识评测

89.5%

GPQA

高阶科学问题求解

86.6%

HLE

广泛专家级考试集合

28.4%

代码与工程

LiveCodeBench

近期编程题评测

87.1%

SciCode

科学计算代码挑战

49.5%

Terminal-Bench Hard

高难度终端任务执行

47.0%

数学能力

AIME 2025

数学竞赛题

91.3%

指令遵循与 Agent 任务

IFBench

指令约束遵循

58.0%

AA-LCR

长上下文推理

74%

τ²-Bench

Agent 工作流任务

89.5%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

关于 Claude Opus 4.5 的常见问题

了解 Claude Opus 4.5 的定位、适合处理的任务、主要优势、使用限制,以及在 TokenHub 中接入时需要注意的事项。

Claude Opus 4.5 是什么,在 Anthropic 的模型产品线中处于什么位置?+

Claude Opus 4.5 是 较早一代的 Opus 旗舰模型,面向高难度编程和专业分析。它属于较旧一代,新生产项目启动前应与同系列更新模型比较。

Claude Opus 4.5 最适合哪些任务?+

它适合高难度软件工程任务、专业文档与决策分析以及长时间多步骤流程。上线前应使用有代表性的输入进行测试,并制定可衡量的验收标准。

团队为什么会选择 Claude Opus 4.5,而不是更小或更旧的模型?+

它最实用的优势包括较强的编程能力、严格遵循指令以及可靠执行多步骤智能体流程。这些特点对专业文档与决策分析尤其有价值。

在依赖 Claude Opus 4.5 之前应该验证什么?+

如果项目可以受益于更新一代 Opus、更新模型能提供更清晰的迁移路径和更长的支持周期,或重要决策流程无法安排人工复核,可以考虑其他模型。生成代码在合并或部署前应经过测试、安全检查和人工审查。

Claude Opus 4.5 在 TokenHub 中有哪些实用接入建议?+

在 TokenHub 中,请选择页面显示的 Claude Opus 4.5 精确模型标识,使用账号文档中指定的接口,并通过 TokenHub 凭证完成认证。只有在确认这一旧版本仍可用且符合所需支持周期后,才固定 TokenHub 中显示的精确标识。