Gemini 3.5 Flash

Name: Gemini 3.5 Flash model details and pricing dataset
Creator: TokenHub

gemini-3.5-flash

Gemini 3.5 Flash 被 Google 描述为面向真实 Agent 任务的快速、高性价比前沿模型。官方资料强调更强的代码、多步骤执行、多模态推理和长上下文能力，同时保持比大型旗舰模型更低的延迟和成本。它应被定位为高速 Agent 模型，而不是简单的低价聊天模型。

最大上下文

1MToken

最大输出

65.5KToken

发布日期

2026年5月19日

模态

Gemini 3.5 Flash 价格

输入价格	输出价格	缓存读取	缓存创建 5m
$1.5/M	$9/M	$0.15/M	$0.0833/M

Gemini 3.5 Flash API

POST /v1beta/models/{model}:generateContent

Gemini 3.5 Flash 基准测试

34.9

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

47.1

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

GPQA

高阶科学问题求解

82.8%

HLE

广泛专家级考试集合

23.1%

代码与工程

SciCode

科学计算代码挑战

48.8%

Terminal-Bench Hard

高难度终端任务执行

46.2%

指令遵循与 Agent 任务

IFBench

指令约束遵循

47.3%

AA-LCR

长上下文推理

53.3%

τ²-Bench

Agent 工作流任务

58.8%

指标来源 Artificial Analysis

关于 Gemini 3.5 Flash 的常见问题

了解 Gemini 3.5 Flash 的定位、适合处理的任务、主要优势、使用限制，以及在 TokenHub 中接入时需要注意的事项。

开发者该如何理解 Gemini 3.5 Flash 的定位？+

Gemini 3.5 Flash 是 Google 当前的 Flash 模型，适合快速扩展智能体和多模态任务。它是提供商文档中的当前公开模型，但不同平台的可用性可能不同。

在哪些场景下，Gemini 3.5 Flash 最能发挥实际价值？+

它适合高并发智能体循环与子智能体编排、高难度软件工程任务以及文本与图像输入分析。上线前应使用有代表性的输入进行测试，并制定可衡量的验收标准。

Gemini 3.5 Flash 最实用的特点有哪些？+

它最实用的优势包括质量、速度与成本的良好平衡、较快的响应速度以及可靠执行多步骤智能体流程。这些特点对高难度软件工程任务尤其有价值。

Gemini 3.5 Flash 有哪些实际限制？+

如果任务需要最强的 Pro 级推理、应用要求该文本模型直接输出生成图像，或重要决策流程无法安排人工复核，可以考虑其他模型。涉及事实、法律、财务、医疗或运营的重要结果，应由具备相关资质的人员复核。

如何在 TokenHub 中调用 Gemini 3.5 Flash？+

在 TokenHub 中，请选择页面显示的 Gemini 3.5 Flash 精确模型标识，使用账号文档中指定的接口，并通过 TokenHub 凭证完成认证。请确认 TokenHub 实际开放的输入类型、工具、信息依据选项和模型生命周期，不要默认与 Gemini API 完全一致。

Gemini 3.5 Flash

Gemini 3.5 Flash 价格

Gemini 3.5 Flash API

Gemini 3.5 Flash 基准测试

相关模型

相关模型

媒体与讨论

X (Twitter)

Reddit

YouTube

关于 Gemini 3.5 Flash 的常见问题

相关模型