Gemini 3.5 Flash

gemini-3.5-flash

Gemini 3.5 Flash 被 Google 描述为面向真实 Agent 任务的快速、高性价比前沿模型。官方资料强调更强的代码、多步骤执行、多模态推理和长上下文能力,同时保持比大型旗舰模型更低的延迟和成本。它应被定位为高速 Agent 模型,而不是简单的低价聊天模型。

最大上下文

1MToken

最大输出

65.5KToken

发布日期

2026年5月19日

模态

Gemini 3.5 Flash 价格

输入价格输出价格缓存读取缓存创建 5m
$1.5/M$9/M$0.15/M$0.0833/M

Gemini 3.5 Flash API

POST /v1beta/models/{model}:generateContent

Gemini 3.5 Flash 基准测试

34.9

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

47.1

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

GPQA

高阶科学问题求解

82.8%

HLE

广泛专家级考试集合

23.1%

代码与工程

SciCode

科学计算代码挑战

48.8%

Terminal-Bench Hard

高难度终端任务执行

46.2%

指令遵循与 Agent 任务

IFBench

指令约束遵循

47.3%

AA-LCR

长上下文推理

53.3%

τ²-Bench

Agent 工作流任务

58.8%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

关于 Gemini 3.5 Flash 的常见问题

了解 Gemini 3.5 Flash 的定位、适合处理的任务、主要优势、使用限制,以及在 TokenHub 中接入时需要注意的事项。

开发者该如何理解 Gemini 3.5 Flash 的定位?+

Gemini 3.5 Flash 是 Google 当前的 Flash 模型,适合快速扩展智能体和多模态任务。它是提供商文档中的当前公开模型,但不同平台的可用性可能不同。

在哪些场景下,Gemini 3.5 Flash 最能发挥实际价值?+

它适合高并发智能体循环与子智能体编排、高难度软件工程任务以及文本与图像输入分析。上线前应使用有代表性的输入进行测试,并制定可衡量的验收标准。

Gemini 3.5 Flash 最实用的特点有哪些?+

它最实用的优势包括质量、速度与成本的良好平衡、较快的响应速度以及可靠执行多步骤智能体流程。这些特点对高难度软件工程任务尤其有价值。

Gemini 3.5 Flash 有哪些实际限制?+

如果任务需要最强的 Pro 级推理、应用要求该文本模型直接输出生成图像,或重要决策流程无法安排人工复核,可以考虑其他模型。涉及事实、法律、财务、医疗或运营的重要结果,应由具备相关资质的人员复核。

如何在 TokenHub 中调用 Gemini 3.5 Flash?+

在 TokenHub 中,请选择页面显示的 Gemini 3.5 Flash 精确模型标识,使用账号文档中指定的接口,并通过 TokenHub 凭证完成认证。请确认 TokenHub 实际开放的输入类型、工具、信息依据选项和模型生命周期,不要默认与 Gemini API 完全一致。