Gemini 3.1 Flash-Lite

gemini-3.1-flash-lite

Gemini 3.1 Flash Lite 是 Gemini 3.1 家族中更高效率的多模态模型。模型卡描述其低延迟、高吞吐,并支持文本、图片、视频、音频和 PDF,以及轻量 Agent 任务。它适合信息抽取、分类、路由和生产级多模态高频任务。

最大上下文

1MToken

最大输出

65.5KToken

发布日期

2026年5月7日

模态

Gemini 3.1 Flash-Lite 价格

输入价格输出价格缓存读取缓存创建 5m
$0.25/M$1.5/M$0.025/M$0.0833/M

Gemini 3.1 Flash-Lite API

openaiPOST /v1/chat/completions

Gemini 3.1 Flash-Lite 基准测试

Gemini 3.1 Flash-Lite

25

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

30.1

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

GPQA

高阶科学问题求解

82.2%

HLE

广泛专家级考试集合

16.2%

代码与工程

SciCode

科学计算代码挑战

41.9%

Terminal-Bench Hard

高难度终端任务执行

24.2%

指令遵循与 Agent 任务

IFBench

指令约束遵循

77.2%

AA-LCR

长上下文推理

65.3%

τ²-Bench

Agent 工作流任务

31.3%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

关于 Gemini 3.1 Flash-Lite 的常见问题

了解 Gemini 3.1 Flash-Lite 的定位、适合处理的任务、主要优势、使用限制,以及在 TokenHub 中接入时需要注意的事项。

Gemini 3.1 Flash-Lite 在提供商的模型家族中是什么定位?+

Gemini 3.1 Flash-Lite 是 Google 面向高频轻量多模态任务的 Gemini 3 系列低延迟、低成本模型。它是提供商文档中的当前公开模型,但不同平台的可用性可能不同。

哪些生产场景适合 Gemini 3.1 Flash-Lite?+

它适合大规模分类与路由、简单结构化数据提取以及大规模翻译。上线前应使用有代表性的输入进行测试,并制定可衡量的验收标准。

Gemini 3.1 Flash-Lite 在简单结构化数据提取方面有什么突出之处?+

它最实用的优势包括较快的响应速度、较好的成本效率以及支持多种多模态输入。这些特点对简单结构化数据提取尤其有价值。

使用 Gemini 3.1 Flash-Lite 时需要注意哪些限制?+

如果任务需要最强的 Pro 级推理、任务需要细腻的长篇生成或高难度推理,或重要决策流程无法安排人工复核,可以考虑其他模型。涉及事实、法律、财务、医疗或运营的重要结果,应由具备相关资质的人员复核。

团队该如何在 TokenHub 中稳妥地开始使用 Gemini 3.1 Flash-Lite?+

在 TokenHub 中,请选择页面显示的 Gemini 3.1 Flash-Lite 精确模型标识,使用账号文档中指定的接口,并通过 TokenHub 凭证完成认证。请确认 TokenHub 实际开放的输入类型、工具、信息依据选项和模型生命周期,不要默认与 Gemini API 完全一致。