POST /v1/chat/completionso3-mini
o3-minio3 Mini 是 OpenAI o 系列推理模型中的高性价比版本。发布资料重点强调科学、数学和代码等 STEM 任务,同时相对大型推理模型具有更低延迟和成本。它适合需要推理能力,但不能承受完整 o 系列模型时间或成本的场景。
最大上下文
200KToken
最大输出
100KToken
发布日期
2024年12月20日
模态
o3-mini 价格
| 输入价格 | 输出价格 | 缓存读取 |
|---|---|---|
| $1.1/M | $4.4/M | $0.55/M |
o3-mini API
o3-mini 基准测试
18.4
/100
Artificial Analysis 综合能力指数
Artificial Analysis 综合能力评分
指数分数
17.3
/100
Artificial Analysis 代码能力指数
Artificial Analysis 软件任务评分
指数分数
知识与推理
MMLU-Pro
高难度多任务知识评测
80.2%
GPQA
高阶科学问题求解
77.3%
HLE
广泛专家级考试集合
12.3%
代码与工程
LiveCodeBench
近期编程题评测
73.4%
SciCode
科学计算代码挑战
39.8%
Terminal-Bench Hard
高难度终端任务执行
6.1%
数学能力
MATH-500
高难度数学解题
98.5%
AIME
数学竞赛题
86%
指令遵循与 Agent 任务
IFBench
指令约束遵循
67.1%
AA-LCR
长上下文推理
39.3%
τ²-Bench
Agent 工作流任务
31.3%
指标来源 Artificial Analysis
o3 Mini 常见问题
o3 Mini 的能力、适用场景、限制和 TokenHub 使用指南。
团队该如何理解 o3 Mini?+
o3 Mini 是 OpenAI 面向高性价比的 STEM 和编程推理的模型。
o3 Mini 最适合做什么?+
适合数学推理、科学推理、代码推理,尤其适合重视响应速度和成本效率的场景。
o3 Mini 的主要优势是什么?+
核心优势是小型纯文本模型中的强大 STEM 和编程推理。
o3 Mini 总是最佳选择吗?+
它已弃用或被后续模型取代,不适合作为新集成的默认选择。 新集成优先用 GPT-5.4 Mini。
最稳妥的配置方式是什么?+
请确认是否可用;新集成应使用当前推荐模型。
媒体与讨论
精选与此模型相关的公开视频和帖子。
X (Twitter)
Reddit
YouTube