Grok 4.20 Multi-Agent

grok-4.20-multi-agent

Grok-4.20-multi-agent 被三方模型目录描述为面向协作式 Agent 工作流的 Grok 4.20 变体。它的核心不是单一线性助手,而是通过多个 Agent 并行或协作完成研究、工具调用和综合分析。它适合被定位为深度研究、多 Agent 编排和复杂任务拆解模型。

最大上下文

1MToken

最大输出

30KToken

发布日期

2026年3月9日

模态

Grok 4.20 Multi-Agent 价格

输入价格输出价格缓存读取
$1.25/M$2.5/M$0.2/M

Grok 4.20 Multi-Agent API

POST /v1/chat/completions

Grok 4.20 Multi-Agent 基准测试

Grok 4.20 0309 (Reasoning)

36.5

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

42.2

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

GPQA

高阶科学问题求解

88.5%

HLE

广泛专家级考试集合

30%

代码与工程

SciCode

科学计算代码挑战

44.7%

Terminal-Bench Hard

高难度终端任务执行

40.9%

指令遵循与 Agent 任务

IFBench

指令约束遵循

82.9%

AA-LCR

长上下文推理

59%

τ²-Bench

Agent 工作流任务

96.5%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

关于 Grok 4.20 Multi-Agent 的常见问题

了解 Grok 4.20 Multi-Agent 的定位、适合处理的任务、主要优势、使用限制,以及在 TokenHub 中接入时需要注意的事项。

Grok 4.20 Multi-Agent 是一款什么类型的模型?+

Grok 4.20 Multi-Agent 是 xAI 的多智能体研究测试模型,可并行协调多个智能体完成深度研究和综合分析。它处于测试阶段,上线前应验证延迟、输出一致性和受支持功能。

团队可以用 Grok 4.20 Multi-Agent 做什么?+

它适合深度研究与证据综合、适合多个智能体并行调查的研究以及跨多来源和多假设的综合分析。上线前应使用有代表性的输入进行测试,并制定可衡量的验收标准。

Grok 4.20 Multi-Agent 在哪些技术方面更有优势?+

它最实用的优势包括多个智能体并行协作、有效使用工具和函数调用以及较强的长上下文处理。这些特点对适合多个智能体并行调查的研究尤其有价值。

什么情况下应该选择其他模型,而不是 Grok 4.20 Multi-Agent?+

如果请求需要即时的单模型响应、额外并行智能体不值得增加的时间或用量,或重要决策流程无法安排人工复核,可以考虑其他模型。涉及事实、法律、财务、医疗或运营的重要结果,应由具备相关资质的人员复核。

通过 TokenHub 接入 Grok 4.20 Multi-Agent 前需要检查什么?+

在 TokenHub 中,请选择页面显示的 Grok 4.20 Multi-Agent 精确模型标识,使用账号文档中指定的接口,并通过 TokenHub 凭证完成认证。请确认 TokenHub 已开放多智能体模型和所需研究工具,并查看推理设置如何影响智能体数量、延迟和用量。