POST /v1/messagesClaude Opus 4.5
claude-opus-4.5Claude Opus 4.5 属于 Claude Opus 4 一代的高能力模型,模型卡强调困难推理、代码和 Agentic Work。它虽然低于更新的 Opus 版本,但仍代表当代 Claude 的高端能力档位。描述时不应把它写成普通聊天模型,而应强调深度工作和可靠性。
最大上下文
200KToken
最大输出
64KToken
发布日期
2025年11月24日
模态
Claude Opus 4.5 价格
| 输入价格 | 输出价格 | 缓存读取 | 缓存创建 5m |
|---|---|---|---|
| $5/M | $25/M | $0.5/M | $6.25/M |
Claude Opus 4.5 API
Claude Opus 4.5 基准测试
40.8
/100
Artificial Analysis 综合能力指数
Artificial Analysis 综合能力评分
指数分数
47.8
/100
Artificial Analysis 代码能力指数
Artificial Analysis 软件任务评分
指数分数
91.3
/100
Artificial Analysis 数学能力指数
Artificial Analysis 数学推理评分
指数分数
知识与推理
MMLU-Pro
高难度多任务知识评测
89.5%
GPQA
高阶科学问题求解
86.6%
HLE
广泛专家级考试集合
28.4%
代码与工程
LiveCodeBench
近期编程题评测
87.1%
SciCode
科学计算代码挑战
49.5%
Terminal-Bench Hard
高难度终端任务执行
47.0%
数学能力
AIME 2025
数学竞赛题
91.3%
指令遵循与 Agent 任务
IFBench
指令约束遵循
58.0%
AA-LCR
长上下文推理
74%
τ²-Bench
Agent 工作流任务
89.5%
指标来源 Artificial Analysis
关于 Claude Opus 4.5 的常见问题
了解 Claude Opus 4.5 的定位、适合处理的任务、主要优势、使用限制,以及在 TokenHub 中接入时需要注意的事项。
Claude Opus 4.5 是什么,在 Anthropic 的模型产品线中处于什么位置?+
Claude Opus 4.5 是 较早一代的 Opus 旗舰模型,面向高难度编程和专业分析。它属于较旧一代,新生产项目启动前应与同系列更新模型比较。
Claude Opus 4.5 最适合哪些任务?+
它适合高难度软件工程任务、专业文档与决策分析以及长时间多步骤流程。上线前应使用有代表性的输入进行测试,并制定可衡量的验收标准。
团队为什么会选择 Claude Opus 4.5,而不是更小或更旧的模型?+
它最实用的优势包括较强的编程能力、严格遵循指令以及可靠执行多步骤智能体流程。这些特点对专业文档与决策分析尤其有价值。
在依赖 Claude Opus 4.5 之前应该验证什么?+
如果项目可以受益于更新一代 Opus、更新模型能提供更清晰的迁移路径和更长的支持周期,或重要决策流程无法安排人工复核,可以考虑其他模型。生成代码在合并或部署前应经过测试、安全检查和人工审查。
Claude Opus 4.5 在 TokenHub 中有哪些实用接入建议?+
在 TokenHub 中,请选择页面显示的 Claude Opus 4.5 精确模型标识,使用账号文档中指定的接口,并通过 TokenHub 凭证完成认证。只有在确认这一旧版本仍可用且符合所需支持周期后,才固定 TokenHub 中显示的精确标识。
媒体与讨论
精选与此模型相关的公开视频和帖子。
X (Twitter)
Reddit
YouTube