Grok 4.20

grok-4.20

Grok-4.20 は、参照元で強調されている特徴として high-speed xAI 推論 model, strong tool calling, low hallucination and very large コンテキスト を持ちます。主な価値は 長文分析, 深い調査 and 多段階 agents にあります。そのため、汎用チャットモデルとしてではなく、このモデル固有の強みを中心に説明するのが自然です。

最大コンテキスト

1Mトークン

最大出力

30Kトークン

リリース日

2026年3月9日

モダリティ

Grok 4.20 の料金

入力価格出力価格キャッシュ読み取り
$1.25/M$2.5/M$0.2/M

Grok 4.20 API

POST /v1/chat/completions

Grok 4.20 のベンチマーク

Grok 4.20 0309 (Reasoning)

36.5

/100

Artificial Analysis Intelligence Index

Artificial Analysis broad capability aggregate

指数スコア

42.2

/100

Artificial Analysis Coding Index

Artificial Analysis software task aggregate

指数スコア

Knowledge & Reasoning

GPQA

Advanced science problem solving

88.5%

HLE

Broad expert-level exam set

30%

Coding & Engineering

SciCode

Scientific coding challenges

44.7%

Terminal-Bench Hard

Hard terminal task execution

40.9%

Instruction Following & Agent Tasks

IFBench

Prompt constraint adherence

82.9%

AA-LCR

Long-context reasoning

59%

τ²-Bench

Agent workflow tasks

96.5%

指標の出典 Artificial Analysis

メディアと議論

このモデルに関連する公開動画と投稿を選んでいます。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

Grok 4.20 に関するよくある質問

Grok 4.20 の位置づけ、適した用途、主な強み、注意点、TokenHub で安全に利用するための確認事項を紹介します。

Grok 4.20 は提供元のモデル系列でどの位置にありますか?+

Grok 4.20 は、推論、長いコンテキスト、エージェント型ツール呼び出し向けの xAI 高性能 Grok 4.20 モデルです。ベータモデルのため、本番利用前に遅延、出力の一貫性、対応機能を検証してください。

Grok 4.20 に適した本番ユースケースは何ですか?+

多段階エージェント処理の安定した実行、長文書と大規模データの分析、および複雑な多段階推論に適しています。本番導入前に代表的な入力でテストし、測定可能な合格基準を定めてください。

Grok 4.20 は長文書と大規模データの分析で何が際立っていますか?+

実用上の主な強みはツールと関数呼び出しの有効活用、プロンプトへの厳密な追従、および調整可能な推論強度です。この組み合わせは、長文書と大規模データの分析で特に価値があります。

Grok 4.20 を使う際に考慮すべきトレードオフは何ですか?+

すでに十分安定した本番挙動が必要な場合、非推論版で十分な単純作業の場合、または重要な判断に人手レビューを入れられない場合は、別のモデルも検討してください。事実、法務、財務、医療、運用に関わる重要な出力は、適切な専門知識を持つ人が確認してください。

TokenHub で Grok 4.20 を安全に使い始めるにはどうすればよいですか?+

TokenHub では、Grok 4.20 に表示される正確なモデル識別子を選び、アカウント資料に記載されたエンドポイントと TokenHub 認証情報を使用してください。TokenHub のページで、正確な Grok 識別子、利用可能な推論制御、ツールアクセス、対応入力、現在のベータまたはリリース状態を確認してください。