GLM-4.5

glm-4.5

GLM-4.5 是 Z.ai 推出的面向 Agent 的 MoE 模型,官方资料描述为 355B 总参数、32B 激活参数。文档强调推理、代码、工具调用和浏览器类 Agent 能力,并支持思考与非思考模式。它可以作为 GLM-5 之前一代重要的 Agent 基座模型来介绍。

最大上下文

131.1KToken

最大输出

98.3KToken

发布日期

2025年7月28日

模态

GLM-4.5 价格

输入价格输出价格
$0.4286/M$2/M

GLM-4.5 API

POST /v1/chat/completions

GLM-4.5 基准测试

GLM-4.5 (Reasoning)

19.5

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

26.3

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

73.7

/100

Artificial Analysis 数学能力指数

Artificial Analysis 数学推理评分

指数分数

知识与推理

MMLU-Pro

高难度多任务知识评测

83.5%

GPQA

高阶科学问题求解

78.2%

HLE

广泛专家级考试集合

12.2%

代码与工程

LiveCodeBench

近期编程题评测

73.8%

SciCode

科学计算代码挑战

34.8%

Terminal-Bench Hard

高难度终端任务执行

22.0%

数学能力

MATH-500

高难度数学解题

97.9%

AIME

数学竞赛题

87.3%

AIME 2025

数学竞赛题

73.7%

指令遵循与 Agent 任务

IFBench

指令约束遵循

44.1%

AA-LCR

长上下文推理

48.3%

τ²-Bench

Agent 工作流任务

43.0%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

GLM-4.5 常见问题

GLM-4.5 的能力、适用场景、限制和 TokenHub 使用指南。

GLM-4.5 是什么模型?+

GLM-4.5 是 Z.AI 面向推理、编程和原生智能体流程的模型。

哪些任务适合 GLM-4.5?+

适合代码推理、智能体流程、大量工具调用的自动化,尤其适合重视深度推理的场景。

GLM-4.5 哪项能力最突出?+

核心优势是对推理、编程和原生智能体的统一优化。

团队何时不该选 GLM-4.5?+

它属于较早一代,可能缺少后续模型的新能力。 更看重需要最新能力时,可考虑 GLM-5。

调用 GLM-4.5 前要确认什么?+

请确认 TokenHub 是否仍可用;新项目优先选择当前后续模型。