Gemini 2.5 Flash

Name: Gemini 2.5 Flash model details and pricing dataset
Creator: TokenHub

gemini-2.5-flash

Gemini 2.5 Flash 是 Gemini 2.5 系列中平衡价格与性能的模型，将 thinking 能力与较低延迟和成本结合起来。Google 资料将它定位在 Pro 的深度能力和 Flash-Lite 的效率之间。它适合需要推理、多模态输入和实际吞吐量的生产任务。

最大上下文

1MToken

最大输出

65.5KToken

发布日期

2025年6月17日

模态

Gemini 2.5 Flash 价格

输入价格	输出价格	缓存读取
$0.3/M	$2.5/M	$0.03/M

Gemini 2.5 Flash API

POST /v1/chat/completions

Gemini 2.5 Flash 基准测试

14.1

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

17.8

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

60.3

/100

Artificial Analysis 数学能力指数

Artificial Analysis 数学推理评分

指数分数

知识与推理

MMLU-Pro

高难度多任务知识评测

80.9%

GPQA

高阶科学问题求解

68.3%

HLE

广泛专家级考试集合

5.1%

代码与工程

LiveCodeBench

近期编程题评测

49.5%

SciCode

科学计算代码挑战

29.1%

Terminal-Bench Hard

高难度终端任务执行

12.1%

数学能力

MATH-500

高难度数学解题

93.2%

AIME

数学竞赛题

50%

AIME 2025

数学竞赛题

60.3%

指令遵循与 Agent 任务

IFBench

指令约束遵循

39.0%

AA-LCR

长上下文推理

45.9%

τ²-Bench

Agent 工作流任务

14.9%

指标来源 Artificial Analysis

关于 Gemini 2.5 Flash 的常见问题

了解 Gemini 2.5 Flash 的定位、适合处理的任务、主要优势、使用限制，以及在 TokenHub 中接入时需要注意的事项。

开发者该如何理解 Gemini 2.5 Flash 的定位？+

Gemini 2.5 Flash 是 Google 的均衡型 Gemini 2.5 Flash，适合仍需一定推理能力的高并发、低延迟任务。它仍是明确的模型版本，但新项目评估时通常也应比较同系列更新型号。

在哪些场景下，Gemini 2.5 Flash 最能发挥实际价值？+

它适合高并发应用请求、可靠执行多步骤智能体流程以及文本与图像输入分析。上线前应使用有代表性的输入进行测试，并制定可衡量的验收标准。

Gemini 2.5 Flash 最实用的特点有哪些？+

它最实用的优势包括质量、速度与成本的良好平衡、较快的响应速度以及对难题的较强推理能力。这些特点对可靠执行多步骤智能体流程尤其有价值。

Gemini 2.5 Flash 有哪些实际限制？+

如果任务需要最强的 Pro 级推理、项目可以采用更新一代 Gemini，或重要决策流程无法安排人工复核，可以考虑其他模型。涉及事实、法律、财务、医疗或运营的重要结果，应由具备相关资质的人员复核。

如何在 TokenHub 中调用 Gemini 2.5 Flash？+

在 TokenHub 中，请选择页面显示的 Gemini 2.5 Flash 精确模型标识，使用账号文档中指定的接口，并通过 TokenHub 凭证完成认证。请确认 TokenHub 实际开放的输入类型、工具、信息依据选项和模型生命周期，不要默认与 Gemini API 完全一致。

Gemini 2.5 Flash

Gemini 2.5 Flash 价格

Gemini 2.5 Flash API

Gemini 2.5 Flash 基准测试

相关模型

相关模型

媒体与讨论

X (Twitter)

Reddit

YouTube

关于 Gemini 2.5 Flash 的常见问题

相关模型