POST /v1/chat/completionsGemini 2.5 Flash-Lite
gemini-2.5-flash-liteGemini 2.5 Flash-Lite 是 Google Gemini 2.5 系列中最快、最省成本的选项。官方文档强调低延迟、低成本、多模态支持、thinking budget,以及 grounding 和代码执行等工具集成。它适合分类、翻译、路由、抽取和大规模高频任务。
最大上下文
1MToken
最大输出
65.5KToken
发布日期
2025年6月17日
模态
Gemini 2.5 Flash-Lite 价格
| 输入价格 | 输出价格 | 缓存读取 |
|---|---|---|
| $0.1/M | $0.4/M | $0.01/M |
Gemini 2.5 Flash-Lite API
Gemini 2.5 Flash-Lite 基准测试
11.4
/100
Artificial Analysis 综合能力指数
Artificial Analysis 综合能力评分
指数分数
9.5
/100
Artificial Analysis 代码能力指数
Artificial Analysis 软件任务评分
指数分数
53.3
/100
Artificial Analysis 数学能力指数
Artificial Analysis 数学推理评分
指数分数
知识与推理
MMLU-Pro
高难度多任务知识评测
75.9%
GPQA
高阶科学问题求解
62.5%
HLE
广泛专家级考试集合
6.4%
代码与工程
LiveCodeBench
近期编程题评测
59.3%
SciCode
科学计算代码挑战
19.3%
Terminal-Bench Hard
高难度终端任务执行
4.5%
数学能力
MATH-500
高难度数学解题
96.9%
AIME
数学竞赛题
70.3%
AIME 2025
数学竞赛题
53.3%
指令遵循与 Agent 任务
IFBench
指令约束遵循
49.9%
AA-LCR
长上下文推理
51.3%
τ²-Bench
Agent 工作流任务
18.4%
指标来源 Artificial Analysis
关于 Gemini 2.5 Flash-Lite 的常见问题
了解 Gemini 2.5 Flash-Lite 的定位、适合处理的任务、主要优势、使用限制,以及在 TokenHub 中接入时需要注意的事项。
Gemini 2.5 Flash-Lite 是一款什么类型的模型?+
Gemini 2.5 Flash-Lite 是 Google 在 Gemini 2.5 系列中最经济的一款模型,适合简单、高频的多模态处理。它仍是明确的模型版本,但新项目评估时通常也应比较同系列更新型号。
团队可以用 Gemini 2.5 Flash-Lite 做什么?+
它适合大规模分类与路由、简单结构化数据提取以及大规模翻译。上线前应使用有代表性的输入进行测试,并制定可衡量的验收标准。
Gemini 2.5 Flash-Lite 在哪些技术方面更有优势?+
它最实用的优势包括较好的成本效率、较快的响应速度以及支持多种多模态输入。这些特点对简单结构化数据提取尤其有价值。
什么情况下应该选择其他模型,而不是 Gemini 2.5 Flash-Lite?+
如果任务包含高难度多步推理、项目可以采用更新一代 Gemini,或重要决策流程无法安排人工复核,可以考虑其他模型。涉及事实、法律、财务、医疗或运营的重要结果,应由具备相关资质的人员复核。
通过 TokenHub 接入 Gemini 2.5 Flash-Lite 前需要检查什么?+
在 TokenHub 中,请选择页面显示的 Gemini 2.5 Flash-Lite 精确模型标识,使用账号文档中指定的接口,并通过 TokenHub 凭证完成认证。请确认 TokenHub 实际开放的输入类型、工具、信息依据选项和模型生命周期,不要默认与 Gemini API 完全一致。
媒体与讨论
精选与此模型相关的公开视频和帖子。
X (Twitter)
Reddit
YouTube