o3-mini

o3-mini

o3 Mini は、参照元で強調されている特徴として cost-efficient o-series 推論 model を持ちます。主な価値は STEM タスク, 数学, 科学, コーディング and 低遅延 推論 にあります。そのため、汎用チャットモデルとしてではなく、このモデル固有の強みを中心に説明するのが自然です。

最大コンテキスト

200Kトークン

最大出力

100Kトークン

リリース日

2024年12月20日

モダリティ

o3-mini の料金

入力価格出力価格キャッシュ読み取り
$1.1/M$4.4/M$0.55/M

o3-mini API

POST /v1/chat/completions

o3-mini のベンチマーク

18.4

/100

Artificial Analysis Intelligence Index

Artificial Analysis broad capability aggregate

指数スコア

17.3

/100

Artificial Analysis Coding Index

Artificial Analysis software task aggregate

指数スコア

Knowledge & Reasoning

MMLU-Pro

Advanced multi-task knowledge

80.2%

GPQA

Advanced science problem solving

77.3%

HLE

Broad expert-level exam set

12.3%

Coding & Engineering

LiveCodeBench

Live coding problems

73.4%

SciCode

Scientific coding challenges

39.8%

Terminal-Bench Hard

Hard terminal task execution

6.1%

Math

MATH-500

Advanced math problem solving

98.5%

AIME

Competition math problems

86%

Instruction Following & Agent Tasks

IFBench

Prompt constraint adherence

67.1%

AA-LCR

Long-context reasoning

39.3%

τ²-Bench

Agent workflow tasks

31.3%

指標の出典 Artificial Analysis

メディアと議論

このモデルに関連する公開動画と投稿を選んでいます。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

o3 Mini よくある質問

o3 Mini の能力、用途、制約、TokenHub利用ガイド。

チームはo3 Miniをどう捉えるべきですか?+

o3 Mini は OpenAI の費用対効果の高いSTEM・コーディング推論向けモデルです。

o3 Mini の得意用途は?+

数学推論、科学推論、コード推論に向き、特に速度と費用対効果重視の場面に適します。

o3 Mini の主な強みは?+

主な強みは小型テキスト専用モデルでの強いSTEM・コード推論です。

o3 Mini は常に最適ですか?+

非推奨または後継済みで、新規統合の既定値には向きません。 新規統合では GPT-5.4 Mini を優先してください。

最も安全な設定方法は?+

提供状況を確認し、新規統合では現行推奨モデルを使ってください。