Grok 4.20

grok-4.20

Grok-4.20 被第三方模型卡描述为高速 xAI 推理模型,具备较强 Agentic Tool Calling、严格提示遵循、低幻觉和超大上下文能力。它面向長文分析、深度研究和多步驟 Agent 工作流程。描述时应強調速度与長上下文推理结合,而不是只突出对话风格。

最大上下文

1MToken

最大輸出

30KToken

發布日期

2026年3月9日

模態

Grok 4.20 價格

輸入價格輸出價格快取讀取
$1.25/M$2.5/M$0.2/M

Grok 4.20 API

POST /v1/chat/completions

Grok 4.20 基準測試

Grok 4.20 0309 (Reasoning)

36.5

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

42.2

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

知識與推理

GPQA

高階科學問題求解

88.5%

HLE

廣泛專家級考試集合

30%

程式碼與工程

SciCode

科學計算程式碼挑戰

44.7%

Terminal-Bench Hard

高難度終端任務執行

40.9%

指令遵循與 Agent 任務

IFBench

指令約束遵循

82.9%

AA-LCR

長上下文推理

59%

τ²-Bench

Agent 工作流程任務

96.5%

指標來源 Artificial Analysis

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

Grok 4.20 常見問題

了解 Grok 4.20 的定位、適合的使用情境、主要優勢、使用限制,以及在 TokenHub 中串接時要注意的事項。

Grok 4.20 在供應商的模型系列中位於什麼位置?+

Grok 4.20 是 xAI 的高效能 Grok 4.20 模型,適合推理、長上下文與代理工具呼叫。它處於測試階段,正式上線前應驗證延遲、輸出一致性與支援功能。

哪些正式環境情境適合 Grok 4.20?+

它適合可靠執行多步驟代理流程、長文件與大型資料集分析以及複雜多步驟推理。正式上線前應使用具代表性的輸入測試,並訂定可衡量的驗收標準。

Grok 4.20 在長文件與大型資料集分析方面有何突出之處?+

它最實用的優勢包括有效使用工具與函式呼叫、嚴格遵循提示內容以及可調整的推理強度。這些特點對長文件與大型資料集分析尤其有價值。

使用 Grok 4.20 時需要注意哪些限制?+

如果應用需要已完全穩定的正式環境行為、工作足夠簡單,可使用非推理變體,或重要決策流程無法安排人工覆核,可以考慮其他模型。涉及事實、法律、財務、醫療或營運的重要結果,應由具備相關資格的人員覆核。

團隊該如何在 TokenHub 中穩妥地開始使用 Grok 4.20?+

在 TokenHub 中,請選擇頁面顯示的 Grok 4.20 精確模型識別碼,使用帳戶文件中指定的介面,並以 TokenHub 憑證完成驗證。請在 TokenHub 頁面確認精確的 Grok 識別碼、可用推理控制、工具權限、支援輸入與目前測試或發布狀態。