GLM-5.1

glm-5.1

GLM-5.1 被描述为面向代码、长周期任务和 Agentic Engineering 的重要升级。相关资料强调它可以在更长时间跨度内规划、执行和改进任务,输出更完整的工程级结果。它更适合作为开发者与 Agent 模型来介绍,而不是普通问答模型。

最大上下文

200KToken

最大输出

131.1KToken

发布日期

2026年3月27日

模态

GLM-5.1 价格

Token 阶梯输入价格输出价格缓存读取缓存创建 5m缓存读取 5m
<=32K$0.8571/M$3.4286/M$0.1714/M$1.0714/M$0.0857/M
>32K$1.1429/M$4/M$0.2286/M$1.4286/M$0.1143/M

GLM-5.1 API

POST /v1/chat/completions

GLM-5.1 基准测试

40.2

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

43.4

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

GPQA

高阶科学问题求解

86.8%

HLE

广泛专家级考试集合

28.0%

代码与工程

SciCode

科学计算代码挑战

43.8%

Terminal-Bench Hard

高难度终端任务执行

43.2%

指令遵循与 Agent 任务

IFBench

指令约束遵循

76.3%

AA-LCR

长上下文推理

62.3%

τ²-Bench

Agent 工作流任务

97.7%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

GLM-5.1 常见问题

GLM-5.1 的能力、适用场景、限制和 TokenHub 使用指南。

团队该如何理解 GLM-5.1?+

GLM-5.1 是 Z.AI 面向持续自主工程和迭代交付的模型。

GLM-5.1 最适合做什么?+

适合迭代式工程交付、复杂编程、大量工具调用的自动化,尤其适合重视可靠的多步骤执行的场景。

GLM-5.1 的主要优势是什么?+

核心优势是持续自主的规划、执行、测试和优化。

GLM-5.1 总是最佳选择吗?+

它属于较早一代,可能缺少后续模型的新能力。 更看重需要最新能力时,可考虑 GLM-5.2。

最稳妥的配置方式是什么?+

使用 TokenHub 显示的精确标识符,并按账户文档确认当前功能。