o3-mini

Name: o3-mini model details and pricing dataset
Creator: TokenHub

o3-mini

o3 Mini 是 OpenAI o 系列推理模型中的高性价比版本。发布资料重点强调科学、数学和代码等 STEM 任务，同时相对大型推理模型具有更低延迟和成本。它适合需要推理能力，但不能承受完整 o 系列模型时间或成本的场景。

最大上下文

200KToken

最大输出

100KToken

发布日期

2024年12月20日

模态

o3-mini 价格

输入价格	输出价格	缓存读取
$1.1/M	$4.4/M	$0.55/M

o3-mini API

POST /v1/chat/completions

o3-mini 基准测试

18.4

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

17.3

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

MMLU-Pro

高难度多任务知识评测

80.2%

GPQA

高阶科学问题求解

77.3%

HLE

广泛专家级考试集合

12.3%

代码与工程

LiveCodeBench

近期编程题评测

73.4%

SciCode

科学计算代码挑战

39.8%

Terminal-Bench Hard

高难度终端任务执行

6.1%

数学能力

MATH-500

高难度数学解题

98.5%

AIME

数学竞赛题

86%

指令遵循与 Agent 任务

IFBench

指令约束遵循

67.1%

AA-LCR

长上下文推理

39.3%

τ²-Bench

Agent 工作流任务

31.3%

指标来源 Artificial Analysis

o3 Mini 常见问题

o3 Mini 的能力、适用场景、限制和 TokenHub 使用指南。

团队该如何理解 o3 Mini？+

o3 Mini 是 OpenAI 面向高性价比的 STEM 和编程推理的模型。

o3 Mini 最适合做什么？+

适合数学推理、科学推理、代码推理，尤其适合重视响应速度和成本效率的场景。

o3 Mini 的主要优势是什么？+

核心优势是小型纯文本模型中的强大 STEM 和编程推理。

o3 Mini 总是最佳选择吗？+

它已弃用或被后续模型取代，不适合作为新集成的默认选择。新集成优先用 GPT-5.4 Mini。

最稳妥的配置方式是什么？+

请确认是否可用；新集成应使用当前推荐模型。

o3-mini

o3-mini 价格

o3-mini API

o3-mini 基准测试

相关模型

相关模型

媒体与讨论

X (Twitter)

Reddit

YouTube

o3 Mini 常见问题

相关模型