Gemini 3.1 Flash-Lite

Name: Gemini 3.1 Flash-Lite model details and pricing dataset
Creator: TokenHub

gemini-3.1-flash-lite

Gemini 3.1 Flash Lite 是 Gemini 3.1 家族中更高效率的多模态模型。模型卡描述其低延迟、高吞吐，并支持文本、图片、视频、音频和 PDF，以及轻量 Agent 任务。它适合信息抽取、分类、路由和生产级多模态高频任务。

最大上下文

1MToken

最大输出

65.5KToken

发布日期

2026年5月7日

模态

Gemini 3.1 Flash-Lite 价格

输入价格	输出价格	缓存读取	缓存创建 5m
$0.25/M	$1.5/M	$0.025/M	$0.0833/M

Gemini 3.1 Flash-Lite API

openaiPOST /v1/chat/completions

Gemini 3.1 Flash-Lite 基准测试

Gemini 3.1 Flash-Lite

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

30.1

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

GPQA

高阶科学问题求解

82.2%

HLE

广泛专家级考试集合

16.2%

代码与工程

SciCode

科学计算代码挑战

41.9%

Terminal-Bench Hard

高难度终端任务执行

24.2%

指令遵循与 Agent 任务

IFBench

指令约束遵循

77.2%

AA-LCR

长上下文推理

65.3%

τ²-Bench

Agent 工作流任务

31.3%

指标来源 Artificial Analysis

关于 Gemini 3.1 Flash-Lite 的常见问题

了解 Gemini 3.1 Flash-Lite 的定位、适合处理的任务、主要优势、使用限制，以及在 TokenHub 中接入时需要注意的事项。

Gemini 3.1 Flash-Lite 在提供商的模型家族中是什么定位？+

Gemini 3.1 Flash-Lite 是 Google 面向高频轻量多模态任务的 Gemini 3 系列低延迟、低成本模型。它是提供商文档中的当前公开模型，但不同平台的可用性可能不同。

哪些生产场景适合 Gemini 3.1 Flash-Lite？+

它适合大规模分类与路由、简单结构化数据提取以及大规模翻译。上线前应使用有代表性的输入进行测试，并制定可衡量的验收标准。

Gemini 3.1 Flash-Lite 在简单结构化数据提取方面有什么突出之处？+

它最实用的优势包括较快的响应速度、较好的成本效率以及支持多种多模态输入。这些特点对简单结构化数据提取尤其有价值。

使用 Gemini 3.1 Flash-Lite 时需要注意哪些限制？+

如果任务需要最强的 Pro 级推理、任务需要细腻的长篇生成或高难度推理，或重要决策流程无法安排人工复核，可以考虑其他模型。涉及事实、法律、财务、医疗或运营的重要结果，应由具备相关资质的人员复核。

团队该如何在 TokenHub 中稳妥地开始使用 Gemini 3.1 Flash-Lite？+

在 TokenHub 中，请选择页面显示的 Gemini 3.1 Flash-Lite 精确模型标识，使用账号文档中指定的接口，并通过 TokenHub 凭证完成认证。请确认 TokenHub 实际开放的输入类型、工具、信息依据选项和模型生命周期，不要默认与 Gemini API 完全一致。

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite 价格

Gemini 3.1 Flash-Lite API

Gemini 3.1 Flash-Lite 基准测试

相关模型

相关模型

媒体与讨论

X (Twitter)

Reddit

YouTube

关于 Gemini 3.1 Flash-Lite 的常见问题

相关模型