POST /v1beta/models/{model}:generateContentGPT-4o
gpt-4oGPT-4o は、参照元で強調されている特徴として マルチモーダル GPT-4o flagship, text/image input and broad general intelligence を持ちます。主な価値は 視覚言語アプリ, 自然な対話 and general assistant tasks にあります。そのため、汎用チャットモデルとしてではなく、このモデル固有の強みを中心に説明するのが自然です。
最大コンテキスト
128Kトークン
最大出力
16.4Kトークン
リリース日
2024年5月13日
モダリティ
GPT-4o の料金
| 入力価格 | 出力価格 | キャッシュ読み取り |
|---|---|---|
| $2.5/M | $10/M | $1.25/M |
GPT-4o API
GPT-4o のベンチマーク
9.6
/100
Artificial Analysis Intelligence Index
Artificial Analysis broad capability aggregate
指数スコア
16.6
/100
Artificial Analysis Coding Index
Artificial Analysis software task aggregate
指数スコア
Knowledge & Reasoning
GPQA
Advanced science problem solving
52.1%
HLE
Broad expert-level exam set
2.9%
Coding & Engineering
LiveCodeBench
Live coding problems
31.7%
SciCode
Scientific coding challenges
33.1%
Terminal-Bench Hard
Hard terminal task execution
8.3%
Math
MATH-500
Advanced math problem solving
79.5%
AIME
Competition math problems
11.7%
Instruction Following & Agent Tasks
IFBench
Prompt constraint adherence
36.0%
AA-LCR
Long-context reasoning
35%
τ²-Bench
Agent workflow tasks
28.9%
指標の出典 Artificial Analysis
GPT-4o に関するよくある質問
GPT-4o の位置づけ、適した用途、主な強み、注意点、TokenHub で安全に利用するための確認事項を紹介します。
GPT-4o はどの種類のモデルですか?+
GPT-4o は、汎用テキスト処理と画像理解に対応する OpenAI の旧世代 Omni モデルで、現在は従来型の API 選択肢です。ChatGPT では提供終了していますが、API では利用できる場合があります。TokenHub の最新表示を確認してください。
チームは GPT-4o を何に使うとよいですか?+
テキストと画像入力の分析、応答性の高い対話アシスタント、および汎用コンテンツ生成に適しています。本番導入前に代表的な入力でテストし、測定可能な合格基準を定めてください。
GPT-4o が明確な技術的優位性を持つのはどこですか?+
実用上の主な強みはテキストと画像を組み合わせた理解、幅広い汎用能力、および応答性の高い対話です。この組み合わせは、応答性の高い対話アシスタントで特に価値があります。
GPT-4o ではなく別のモデルを選ぶべきなのはどのような場合ですか?+
新規開発で提供元の現行推奨世代を使うべき場合、専用の推論モデルが必要な場合、または重要な判断に人手レビューを入れられない場合は、別のモデルも検討してください。事実、法務、財務、医療、運用に関わる重要な出力は、適切な専門知識を持つ人が確認してください。
GPT-4o を TokenHub と連携する前に何を確認すべきですか?+
TokenHub では、GPT-4o に表示される正確なモデル識別子を選び、アカウント資料に記載されたエンドポイントと TokenHub 認証情報を使用してください。プラットフォーム上の提供範囲は提供元の全機能と異なる場合があるため、TokenHub の最新資料でテキスト・画像入力の対応状況を確認してください。
メディアと議論
このモデルに関連する公開動画と投稿を選んでいます。
X (Twitter)
Reddit
YouTube