Gemini 3.1 Flash-Lite

Name: Gemini 3.1 Flash-Lite model details and pricing dataset
Creator: TokenHub

gemini-3.1-flash-lite

Gemini 3.1 Flash Lite 是 Gemini 3.1 家族中更高效率的多模态模型。模型卡描述其低延遲、高吞吐，并支援文字、圖片、影片、音频和 PDF，以及輕量 Agent 任務。它適合信息擷取、分類、路由和生產级多模态高頻任務。

最大上下文

1MToken

最大輸出

65.5KToken

發布日期

2026年5月7日

模態

Gemini 3.1 Flash-Lite 價格

輸入價格	輸出價格	快取讀取	快取建立 5m
$0.25/M	$1.5/M	$0.025/M	$0.0833/M

Gemini 3.1 Flash-Lite API

openaiPOST /v1/chat/completions

Gemini 3.1 Flash-Lite 基準測試

Gemini 3.1 Flash-Lite

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

30.1

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

知識與推理

GPQA

高階科學問題求解

82.2%

HLE

廣泛專家級考試集合

16.2%

程式碼與工程

SciCode

科學計算程式碼挑戰

41.9%

Terminal-Bench Hard

高難度終端任務執行

24.2%

指令遵循與 Agent 任務

IFBench

指令約束遵循

77.2%

AA-LCR

長上下文推理

65.3%

τ²-Bench

Agent 工作流程任務

31.3%

指標來源 Artificial Analysis

Gemini 3.1 Flash-Lite 常見問題

了解 Gemini 3.1 Flash-Lite 的定位、適合的使用情境、主要優勢、使用限制，以及在 TokenHub 中串接時要注意的事項。

Gemini 3.1 Flash-Lite 在供應商的模型系列中位於什麼位置？+

Gemini 3.1 Flash-Lite 是 Google Gemini 3 系列中適合高頻輕量多模態工作的低延遲、低成本模型。它是供應商文件中的現行公開模型，但不同平台的可用情況可能不同。

哪些正式環境情境適合 Gemini 3.1 Flash-Lite？+

它適合大規模分類與路由、簡單的結構化資料擷取以及大量翻譯。正式上線前應使用具代表性的輸入測試，並訂定可衡量的驗收標準。

Gemini 3.1 Flash-Lite 在簡單的結構化資料擷取方面有何突出之處？+

它最實用的優勢包括較快的回應速度、良好的成本效益以及支援多種多模態輸入。這些特點對簡單的結構化資料擷取尤其有價值。

使用 Gemini 3.1 Flash-Lite 時需要注意哪些限制？+

如果工作需要最強的 Pro 級推理、工作需要細膩的長篇生成或高難度推理，或重要決策流程無法安排人工覆核，可以考慮其他模型。涉及事實、法律、財務、醫療或營運的重要結果，應由具備相關資格的人員覆核。

團隊該如何在 TokenHub 中穩妥地開始使用 Gemini 3.1 Flash-Lite？+

在 TokenHub 中，請選擇頁面顯示的 Gemini 3.1 Flash-Lite 精確模型識別碼，使用帳戶文件中指定的介面，並以 TokenHub 憑證完成驗證。請確認 TokenHub 實際開放的輸入類型、工具、資料依據選項與模型生命週期，不要預設與 Gemini API 完全相同。

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite 價格

Gemini 3.1 Flash-Lite API

Gemini 3.1 Flash-Lite 基準測試

相關模型

相關模型

媒體與討論

X (Twitter)

Reddit

YouTube

Gemini 3.1 Flash-Lite 常見問題

相關模型