GPT-5.4

gpt-5.4

GPT-5.4 被 OpenAI 定位为兼具能力和效率的前沿模型,面向专业工作。官方资料强调代码、原生计算机使用、表格/文档/演示文稿工作流、事实性改进和大上下文能力。它适合被介绍为把推理能力和真实生产力任务连接起来的实用工作模型。

最大上下文

1.1MToken

最大输出

128KToken

发布日期

2026年3月5日

模态

GPT-5.4 价格

Token 阶梯输入价格输出价格缓存读取
<=272K$2.5/M$15/M$0.25/M
>272K$5/M$22.5/M$0.5/M

GPT-5.4 API

POST /v1/chat/completions

GPT-5.4 基准测试

51.4

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

57.2

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

GPQA

高阶科学问题求解

92%

HLE

广泛专家级考试集合

41.6%

代码与工程

SciCode

科学计算代码挑战

56.6%

Terminal-Bench Hard

高难度终端任务执行

57.6%

指令遵循与 Agent 任务

IFBench

指令约束遵循

73.9%

AA-LCR

长上下文推理

74%

τ²-Bench

Agent 工作流任务

87.1%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

GPT-5.4 常见问题

GPT-5.4 的能力、适用场景、限制和 TokenHub 使用指南。

GPT-5.4 是什么模型?+

GPT-5.4 是 OpenAI 面向兼顾成本的前沿编程和专业任务的模型。

哪些任务适合 GPT-5.4?+

适合复杂编程、专业文档和电子表格、大量工具调用的自动化,尤其适合重视专业输出质量的场景。

GPT-5.4 哪项能力最突出?+

核心优势是以低于 Pro 档的成本提供前沿专业能力。

团队何时不该选 GPT-5.4?+

它会使用更多计算,因此延迟和成本可能更高。 更看重吞吐量时,可考虑 GPT-5.4 Mini。

调用 GPT-5.4 前要确认什么?+

使用 TokenHub 显示的精确标识符,并按账户文档确认当前功能。