o4-mini

o4-mini

o4 Mini 是更小的推理模型,针对数学、代码和视觉任务中的速度与成本效率进行优化。OpenAI 发布资料强调它可以在推理过程中使用工具,因此能力不局限于纯文本回答。它适合被描述为面向生产负载的紧凑型推理与工具模型。

最大上下文

200KToken

最大输出

100KToken

发布日期

2025年4月16日

模态

o4-mini 价格

输入价格输出价格缓存读取
$0.15/M$0.6/M$0.075/M

o4-mini API

POST /v1/chat/completions

o4-mini 基准测试

o4-mini (high)

25.6

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

25.6

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

90.7

/100

Artificial Analysis 数学能力指数

Artificial Analysis 数学推理评分

指数分数

知识与推理

MMLU-Pro

高难度多任务知识评测

83.2%

GPQA

高阶科学问题求解

78.4%

HLE

广泛专家级考试集合

17.5%

代码与工程

LiveCodeBench

近期编程题评测

85.9%

SciCode

科学计算代码挑战

46.5%

Terminal-Bench Hard

高难度终端任务执行

15.2%

数学能力

MATH-500

高难度数学解题

98.9%

AIME

数学竞赛题

94%

AIME 2025

数学竞赛题

90.7%

指令遵循与 Agent 任务

IFBench

指令约束遵循

68.7%

AA-LCR

长上下文推理

55.0%

τ²-Bench

Agent 工作流任务

55.6%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

o4 Mini 常见问题

o4 Mini 的能力、适用场景、限制和 TokenHub 使用指南。

o4 Mini 主要解决什么问题?+

o4 Mini 是 OpenAI 面向快速、经济的数学、编程和视觉推理的模型。

什么时候适合选 o4 Mini?+

适合数学推理、复杂编程、视觉推理,尤其适合重视响应速度和成本效率的场景。

o4 Mini 擅长什么?+

核心优势是快速经济的推理,尤其擅长编程和视觉任务。

o4 Mini 牺牲了什么?+

它已弃用或被后续模型取代,不适合作为新集成的默认选择。 新集成优先用 GPT-5.4 Mini。

如何在 TokenHub 中调用 o4 Mini?+

请确认是否可用;新集成应使用当前推荐模型。