o3-mini

o3-mini

o3 Mini 是 OpenAI o 系列推理模型中的高性价比版本。发布资料重点强调科学、数学和代码等 STEM 任务,同时相对大型推理模型具有更低延迟和成本。它适合需要推理能力,但不能承受完整 o 系列模型时间或成本的场景。

最大上下文

200KToken

最大输出

100KToken

发布日期

2024年12月20日

模态

o3-mini 价格

输入价格输出价格缓存读取
$1.1/M$4.4/M$0.55/M

o3-mini API

POST /v1/chat/completions

o3-mini 基准测试

18.4

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

17.3

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

MMLU-Pro

高难度多任务知识评测

80.2%

GPQA

高阶科学问题求解

77.3%

HLE

广泛专家级考试集合

12.3%

代码与工程

LiveCodeBench

近期编程题评测

73.4%

SciCode

科学计算代码挑战

39.8%

Terminal-Bench Hard

高难度终端任务执行

6.1%

数学能力

MATH-500

高难度数学解题

98.5%

AIME

数学竞赛题

86%

指令遵循与 Agent 任务

IFBench

指令约束遵循

67.1%

AA-LCR

长上下文推理

39.3%

τ²-Bench

Agent 工作流任务

31.3%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

o3 Mini 常见问题

o3 Mini 的能力、适用场景、限制和 TokenHub 使用指南。

团队该如何理解 o3 Mini?+

o3 Mini 是 OpenAI 面向高性价比的 STEM 和编程推理的模型。

o3 Mini 最适合做什么?+

适合数学推理、科学推理、代码推理,尤其适合重视响应速度和成本效率的场景。

o3 Mini 的主要优势是什么?+

核心优势是小型纯文本模型中的强大 STEM 和编程推理。

o3 Mini 总是最佳选择吗?+

它已弃用或被后续模型取代,不适合作为新集成的默认选择。 新集成优先用 GPT-5.4 Mini。

最稳妥的配置方式是什么?+

请确认是否可用;新集成应使用当前推荐模型。