o3-mini

o3-mini

o3 Mini 是 OpenAI o 系列推理模型中的高性價比版本。發布資料重點強調科学、数学和程式碼等 STEM 任務,同时相对大型推理模型具有更低延遲和成本。它適合需要推理能力,但不能承受完整 o 系列模型时间或成本的場景。

最大上下文

200KToken

最大輸出

100KToken

發布日期

2024年12月20日

模態

o3-mini 價格

輸入價格輸出價格快取讀取
$1.1/M$4.4/M$0.55/M

o3-mini API

POST /v1/chat/completions

o3-mini 基準測試

18.4

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

17.3

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

知識與推理

MMLU-Pro

高難度多任務知識評測

80.2%

GPQA

高階科學問題求解

77.3%

HLE

廣泛專家級考試集合

12.3%

程式碼與工程

LiveCodeBench

近期程式題評測

73.4%

SciCode

科學計算程式碼挑戰

39.8%

Terminal-Bench Hard

高難度終端任務執行

6.1%

數學能力

MATH-500

高難度數學解題

98.5%

AIME

數學競賽題

86%

指令遵循與 Agent 任務

IFBench

指令約束遵循

67.1%

AA-LCR

長上下文推理

39.3%

τ²-Bench

Agent 工作流程任務

31.3%

指標來源 Artificial Analysis

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

o3 Mini 常見問題

o3 Mini 的能力、適用情境、限制與 TokenHub 使用指南。

團隊該如何理解 o3 Mini?+

o3 Mini 是 OpenAI 針對具成本效益的 STEM 與程式推理推出的模型。

o3 Mini 最適合做什麼?+

適合數學推理、科學推理、程式碼推理,尤其適合重視回應速度與成本效益的情境。

o3 Mini 的主要優勢是什麼?+

核心優勢是小型純文字模型中的強大 STEM 與程式推理。

o3 Mini 總是最佳選擇嗎?+

它已停用或被後續模型取代,不適合作為新整合的預設選擇。 新整合優先用 GPT-5.4 Mini。

最穩妥的設定方式是什麼?+

請確認是否可用;新整合應使用目前建議模型。