GLM-4.5

glm-4.5

GLM-4.5 是 Z.ai 推出的面向 Agent 的 MoE 模型,官方資料描述为 355B 總參數、32B 啟用參數。文件強調推理、程式碼、工具調用和瀏覽器类 Agent 能力,并支援思考与非思考模式。它可以作为 GLM-5 之前一代重要的 Agent 基座模型来介绍。

最大上下文

131.1KToken

最大輸出

98.3KToken

發布日期

2025年7月28日

模態

GLM-4.5 價格

輸入價格輸出價格
$0.4286/M$2/M

GLM-4.5 API

POST /v1/chat/completions

GLM-4.5 基準測試

GLM-4.5 (Reasoning)

19.5

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

26.3

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

73.7

/100

Artificial Analysis 數學能力指數

Artificial Analysis 數學推理評分

指數分數

知識與推理

MMLU-Pro

高難度多任務知識評測

83.5%

GPQA

高階科學問題求解

78.2%

HLE

廣泛專家級考試集合

12.2%

程式碼與工程

LiveCodeBench

近期程式題評測

73.8%

SciCode

科學計算程式碼挑戰

34.8%

Terminal-Bench Hard

高難度終端任務執行

22.0%

數學能力

MATH-500

高難度數學解題

97.9%

AIME

數學競賽題

87.3%

AIME 2025

數學競賽題

73.7%

指令遵循與 Agent 任務

IFBench

指令約束遵循

44.1%

AA-LCR

長上下文推理

48.3%

τ²-Bench

Agent 工作流程任務

43.0%

指標來源 Artificial Analysis

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

GLM-4.5 常見問題

GLM-4.5 的能力、適用情境、限制與 TokenHub 使用指南。

GLM-4.5 是什麼模型?+

GLM-4.5 是 Z.AI 針對推理、程式開發與原生代理流程推出的模型。

哪些任務適合 GLM-4.5?+

適合程式碼推理、代理流程、大量工具呼叫的自動化,尤其適合重視深度推理的情境。

GLM-4.5 哪項能力最突出?+

核心優勢是整合推理、程式開發與原生代理的最佳化。

團隊何時不該選 GLM-4.5?+

它屬於較早世代,可能缺少後續模型的新能力。 更重視需要最新能力時,可考慮 GLM-5。

呼叫 GLM-4.5 前要確認什麼?+

請確認 TokenHub 是否仍可用;新專案優先選擇目前後續模型。