o4-mini

o4-mini

o4 Mini 是更小的推理模型,针对数学、程式碼和視覺任務中的速度与成本效率进行优化。OpenAI 發布資料強調它可以在推理过程中使用工具,因此能力不局限于纯文字回答。它適合被描述為面向生產负载的紧凑型推理与工具模型。

最大上下文

200KToken

最大輸出

100KToken

發布日期

2025年4月16日

模態

o4-mini 價格

輸入價格輸出價格快取讀取
$0.15/M$0.6/M$0.075/M

o4-mini API

POST /v1/chat/completions

o4-mini 基準測試

o4-mini (high)

25.6

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

25.6

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

90.7

/100

Artificial Analysis 數學能力指數

Artificial Analysis 數學推理評分

指數分數

知識與推理

MMLU-Pro

高難度多任務知識評測

83.2%

GPQA

高階科學問題求解

78.4%

HLE

廣泛專家級考試集合

17.5%

程式碼與工程

LiveCodeBench

近期程式題評測

85.9%

SciCode

科學計算程式碼挑戰

46.5%

Terminal-Bench Hard

高難度終端任務執行

15.2%

數學能力

MATH-500

高難度數學解題

98.9%

AIME

數學競賽題

94%

AIME 2025

數學競賽題

90.7%

指令遵循與 Agent 任務

IFBench

指令約束遵循

68.7%

AA-LCR

長上下文推理

55.0%

τ²-Bench

Agent 工作流程任務

55.6%

指標來源 Artificial Analysis

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

o4 Mini 常見問題

o4 Mini 的能力、適用情境、限制與 TokenHub 使用指南。

o4 Mini 主要解決什麼問題?+

o4 Mini 是 OpenAI 針對快速且具成本效益的數學、程式與視覺推理推出的模型。

什麼時候適合選 o4 Mini?+

適合數學推理、複雜程式開發、視覺推理,尤其適合重視回應速度與成本效益的情境。

o4 Mini 擅長什麼?+

核心優勢是快速且具成本效益的推理,尤其擅長程式與視覺任務。

o4 Mini 犧牲了什麼?+

它已停用或被後續模型取代,不適合作為新整合的預設選擇。 新整合優先用 GPT-5.4 Mini。

如何在 TokenHub 中呼叫 o4 Mini?+

請確認是否可用;新整合應使用目前建議模型。