POST /v1/chat/completionsGrok 4.20 Multi-Agent
grok-4.20-multi-agentGrok-4.20-multi-agent 被三方模型目录描述为面向协作式 Agent 工作流的 Grok 4.20 变体。它的核心不是单一线性助手,而是通过多个 Agent 并行或协作完成研究、工具调用和综合分析。它适合被定位为深度研究、多 Agent 编排和复杂任务拆解模型。
最大上下文
1MToken
最大输出
30KToken
发布日期
2026年3月9日
模态
Grok 4.20 Multi-Agent 价格
| 输入价格 | 输出价格 | 缓存读取 |
|---|---|---|
| $1.25/M | $2.5/M | $0.2/M |
Grok 4.20 Multi-Agent API
Grok 4.20 Multi-Agent 基准测试
Grok 4.20 0309 (Reasoning)
36.5
/100
Artificial Analysis 综合能力指数
Artificial Analysis 综合能力评分
指数分数
42.2
/100
Artificial Analysis 代码能力指数
Artificial Analysis 软件任务评分
指数分数
知识与推理
GPQA
高阶科学问题求解
88.5%
HLE
广泛专家级考试集合
30%
代码与工程
SciCode
科学计算代码挑战
44.7%
Terminal-Bench Hard
高难度终端任务执行
40.9%
指令遵循与 Agent 任务
IFBench
指令约束遵循
82.9%
AA-LCR
长上下文推理
59%
τ²-Bench
Agent 工作流任务
96.5%
指标来源 Artificial Analysis
关于 Grok 4.20 Multi-Agent 的常见问题
了解 Grok 4.20 Multi-Agent 的定位、适合处理的任务、主要优势、使用限制,以及在 TokenHub 中接入时需要注意的事项。
Grok 4.20 Multi-Agent 是一款什么类型的模型?+
Grok 4.20 Multi-Agent 是 xAI 的多智能体研究测试模型,可并行协调多个智能体完成深度研究和综合分析。它处于测试阶段,上线前应验证延迟、输出一致性和受支持功能。
团队可以用 Grok 4.20 Multi-Agent 做什么?+
它适合深度研究与证据综合、适合多个智能体并行调查的研究以及跨多来源和多假设的综合分析。上线前应使用有代表性的输入进行测试,并制定可衡量的验收标准。
Grok 4.20 Multi-Agent 在哪些技术方面更有优势?+
它最实用的优势包括多个智能体并行协作、有效使用工具和函数调用以及较强的长上下文处理。这些特点对适合多个智能体并行调查的研究尤其有价值。
什么情况下应该选择其他模型,而不是 Grok 4.20 Multi-Agent?+
如果请求需要即时的单模型响应、额外并行智能体不值得增加的时间或用量,或重要决策流程无法安排人工复核,可以考虑其他模型。涉及事实、法律、财务、医疗或运营的重要结果,应由具备相关资质的人员复核。
通过 TokenHub 接入 Grok 4.20 Multi-Agent 前需要检查什么?+
在 TokenHub 中,请选择页面显示的 Grok 4.20 Multi-Agent 精确模型标识,使用账号文档中指定的接口,并通过 TokenHub 凭证完成认证。请确认 TokenHub 已开放多智能体模型和所需研究工具,并查看推理设置如何影响智能体数量、延迟和用量。
媒体与讨论
精选与此模型相关的公开视频和帖子。
X (Twitter)
Reddit
YouTube