Gemini 2.5 Flash-Lite

gemini-2.5-flash-lite

Gemini 2.5 Flash-Lite 是 Google Gemini 2.5 系列中最快、最省成本的选项。官方文件強調低延遲、低成本、多模态支援、thinking budget,以及 grounding 和程式碼执行等工具集成。它適合分類、翻譯、路由、擷取和大规模高頻任務。

最大上下文

1MToken

最大輸出

65.5KToken

發布日期

2025年6月17日

模態

Gemini 2.5 Flash-Lite 價格

輸入價格輸出價格快取讀取
$0.1/M$0.4/M$0.01/M

Gemini 2.5 Flash-Lite API

POST /v1beta/models/{model}:generateContent

Gemini 2.5 Flash-Lite 基準測試

11.4

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

9.5

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

53.3

/100

Artificial Analysis 數學能力指數

Artificial Analysis 數學推理評分

指數分數

知識與推理

MMLU-Pro

高難度多任務知識評測

75.9%

GPQA

高階科學問題求解

62.5%

HLE

廣泛專家級考試集合

6.4%

程式碼與工程

LiveCodeBench

近期程式題評測

59.3%

SciCode

科學計算程式碼挑戰

19.3%

Terminal-Bench Hard

高難度終端任務執行

4.5%

數學能力

MATH-500

高難度數學解題

96.9%

AIME

數學競賽題

70.3%

AIME 2025

數學競賽題

53.3%

指令遵循與 Agent 任務

IFBench

指令約束遵循

49.9%

AA-LCR

長上下文推理

51.3%

τ²-Bench

Agent 工作流程任務

18.4%

指標來源 Artificial Analysis

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

Gemini 2.5 Flash-Lite 常見問題

了解 Gemini 2.5 Flash-Lite 的定位、適合的使用情境、主要優勢、使用限制,以及在 TokenHub 中串接時要注意的事項。

Gemini 2.5 Flash-Lite 屬於哪一類模型?+

Gemini 2.5 Flash-Lite 是 Google Gemini 2.5 系列中最經濟的模型,適合簡單、高頻率的多模態處理。它仍是明確的模型版本,但新專案評估時通常也應比較同系列較新型號。

團隊可以用 Gemini 2.5 Flash-Lite 做什麼?+

它適合大規模分類與路由、簡單的結構化資料擷取以及大量翻譯。正式上線前應使用具代表性的輸入測試,並訂定可衡量的驗收標準。

Gemini 2.5 Flash-Lite 在哪些技術面向較有優勢?+

它最實用的優勢包括良好的成本效益、較快的回應速度以及支援多種多模態輸入。這些特點對簡單的結構化資料擷取尤其有價值。

什麼情況下應選擇其他模型,而不是 Gemini 2.5 Flash-Lite?+

如果工作包含高難度多步驟推理、專案可採用較新一代 Gemini,或重要決策流程無法安排人工覆核,可以考慮其他模型。涉及事實、法律、財務、醫療或營運的重要結果,應由具備相關資格的人員覆核。

透過 TokenHub 串接 Gemini 2.5 Flash-Lite 前需要檢查什麼?+

在 TokenHub 中,請選擇頁面顯示的 Gemini 2.5 Flash-Lite 精確模型識別碼,使用帳戶文件中指定的介面,並以 TokenHub 憑證完成驗證。請確認 TokenHub 實際開放的輸入類型、工具、資料依據選項與模型生命週期,不要預設與 Gemini API 完全相同。