Gemini 2.5 Pro

gemini-2.5-pro

Gemini 2.5 Pro 是 Google Gemini 2.5 系列中面向复杂任务、深度推理和代码的高级模型。官方 Gemini 2.5 资料将这一代描述为会在回答前进行“思考”,并在困难任务上的表现和准确性有所提升。它适合需要深度推理和多模态理解的任务。

最大上下文

1MToken

最大输出

65.5KToken

发布日期

2025年6月17日

模态

Gemini 2.5 Pro 价格

输入价格输出价格缓存读取
$1.25/M$10/M$0.125/M

Gemini 2.5 Pro API

POST /v1/chat/completions

Gemini 2.5 Pro 基准测试

Gemini 2.5 Pro

27

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

32

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

87.7

/100

Artificial Analysis 数学能力指数

Artificial Analysis 数学推理评分

指数分数

知识与推理

MMLU-Pro

高难度多任务知识评测

86.2%

GPQA

高阶科学问题求解

84.4%

HLE

广泛专家级考试集合

21.1%

代码与工程

LiveCodeBench

近期编程题评测

80.1%

SciCode

科学计算代码挑战

42.8%

Terminal-Bench Hard

高难度终端任务执行

26.5%

数学能力

MATH-500

高难度数学解题

96.7%

AIME

数学竞赛题

88.7%

AIME 2025

数学竞赛题

87.7%

指令遵循与 Agent 任务

IFBench

指令约束遵循

48.7%

AA-LCR

长上下文推理

66%

τ²-Bench

Agent 工作流任务

54.1%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

关于 Gemini 2.5 Pro 的常见问题

了解 Gemini 2.5 Pro 的定位、适合处理的任务、主要优势、使用限制,以及在 TokenHub 中接入时需要注意的事项。

Gemini 2.5 Pro 是什么,在 Google 的模型产品线中处于什么位置?+

Gemini 2.5 Pro 是 Google 成熟的 Gemini 2.5 Pro 推理模型,适合代码、STEM、大型数据集和长文档。它仍是明确的模型版本,但新项目评估时通常也应比较同系列更新型号。

Gemini 2.5 Pro 最适合哪些任务?+

它适合复杂多步推理、数学、科学与工程问题以及长文档和大型数据集分析。上线前应使用有代表性的输入进行测试,并制定可衡量的验收标准。

团队为什么会选择 Gemini 2.5 Pro,而不是更小或更旧的模型?+

它最实用的优势包括对难题的较强推理能力、较强的长上下文处理以及支持多种多模态输入。这些特点对数学、科学与工程问题尤其有价值。

在依赖 Gemini 2.5 Pro 之前应该验证什么?+

如果项目可以采用更新一代 Gemini、极低延迟是首要要求,或重要决策流程无法安排人工复核,可以考虑其他模型。涉及事实、法律、财务、医疗或运营的重要结果,应由具备相关资质的人员复核。

Gemini 2.5 Pro 在 TokenHub 中有哪些实用接入建议?+

在 TokenHub 中,请选择页面显示的 Gemini 2.5 Pro 精确模型标识,使用账号文档中指定的接口,并通过 TokenHub 凭证完成认证。请确认 TokenHub 实际开放的输入类型、工具、信息依据选项和模型生命周期,不要默认与 Gemini API 完全一致。