POST /v1/chat/completionsGemini 3.1 Flash-Lite
gemini-3.1-flash-liteGemini 3.1 Flash Lite 是 Gemini 3.1 家族中更高效率的多模态模型。模型卡描述其低延迟、高吞吐,并支持文本、图片、视频、音频和 PDF,以及轻量 Agent 任务。它适合信息抽取、分类、路由和生产级多模态高频任务。
最大上下文
1MToken
最大输出
65.5KToken
发布日期
2026年5月7日
模态
Gemini 3.1 Flash-Lite 价格
| 输入价格 | 输出价格 | 缓存读取 | 缓存创建 5m |
|---|---|---|---|
| $0.25/M | $1.5/M | $0.025/M | $0.0833/M |
Gemini 3.1 Flash-Lite API
Gemini 3.1 Flash-Lite 基准测试
Gemini 3.1 Flash-Lite
25
/100
Artificial Analysis 综合能力指数
Artificial Analysis 综合能力评分
指数分数
30.1
/100
Artificial Analysis 代码能力指数
Artificial Analysis 软件任务评分
指数分数
知识与推理
GPQA
高阶科学问题求解
82.2%
HLE
广泛专家级考试集合
16.2%
代码与工程
SciCode
科学计算代码挑战
41.9%
Terminal-Bench Hard
高难度终端任务执行
24.2%
指令遵循与 Agent 任务
IFBench
指令约束遵循
77.2%
AA-LCR
长上下文推理
65.3%
τ²-Bench
Agent 工作流任务
31.3%
指标来源 Artificial Analysis
关于 Gemini 3.1 Flash-Lite 的常见问题
了解 Gemini 3.1 Flash-Lite 的定位、适合处理的任务、主要优势、使用限制,以及在 TokenHub 中接入时需要注意的事项。
Gemini 3.1 Flash-Lite 在提供商的模型家族中是什么定位?+
Gemini 3.1 Flash-Lite 是 Google 面向高频轻量多模态任务的 Gemini 3 系列低延迟、低成本模型。它是提供商文档中的当前公开模型,但不同平台的可用性可能不同。
哪些生产场景适合 Gemini 3.1 Flash-Lite?+
它适合大规模分类与路由、简单结构化数据提取以及大规模翻译。上线前应使用有代表性的输入进行测试,并制定可衡量的验收标准。
Gemini 3.1 Flash-Lite 在简单结构化数据提取方面有什么突出之处?+
它最实用的优势包括较快的响应速度、较好的成本效率以及支持多种多模态输入。这些特点对简单结构化数据提取尤其有价值。
使用 Gemini 3.1 Flash-Lite 时需要注意哪些限制?+
如果任务需要最强的 Pro 级推理、任务需要细腻的长篇生成或高难度推理,或重要决策流程无法安排人工复核,可以考虑其他模型。涉及事实、法律、财务、医疗或运营的重要结果,应由具备相关资质的人员复核。
团队该如何在 TokenHub 中稳妥地开始使用 Gemini 3.1 Flash-Lite?+
在 TokenHub 中,请选择页面显示的 Gemini 3.1 Flash-Lite 精确模型标识,使用账号文档中指定的接口,并通过 TokenHub 凭证完成认证。请确认 TokenHub 实际开放的输入类型、工具、信息依据选项和模型生命周期,不要默认与 Gemini API 完全一致。
媒体与讨论
精选与此模型相关的公开视频和帖子。
X (Twitter)
Reddit
YouTube