POST /v1beta/models/{model}:generateContentGemini 2.5 Flash-Lite
gemini-2.5-flash-liteGemini 2.5 Flash-Lite 是 Google Gemini 2.5 系列中最快、最省成本的选项。官方文件強調低延遲、低成本、多模态支援、thinking budget,以及 grounding 和程式碼执行等工具集成。它適合分類、翻譯、路由、擷取和大规模高頻任務。
最大上下文
1MToken
最大輸出
65.5KToken
發布日期
2025年6月17日
模態
Gemini 2.5 Flash-Lite 價格
| 輸入價格 | 輸出價格 | 快取讀取 |
|---|---|---|
| $0.1/M | $0.4/M | $0.01/M |
Gemini 2.5 Flash-Lite API
Gemini 2.5 Flash-Lite 基準測試
11.4
/100
Artificial Analysis 綜合能力指數
Artificial Analysis 綜合能力評分
指數分數
9.5
/100
Artificial Analysis 程式碼能力指數
Artificial Analysis 軟體任務評分
指數分數
53.3
/100
Artificial Analysis 數學能力指數
Artificial Analysis 數學推理評分
指數分數
知識與推理
MMLU-Pro
高難度多任務知識評測
75.9%
GPQA
高階科學問題求解
62.5%
HLE
廣泛專家級考試集合
6.4%
程式碼與工程
LiveCodeBench
近期程式題評測
59.3%
SciCode
科學計算程式碼挑戰
19.3%
Terminal-Bench Hard
高難度終端任務執行
4.5%
數學能力
MATH-500
高難度數學解題
96.9%
AIME
數學競賽題
70.3%
AIME 2025
數學競賽題
53.3%
指令遵循與 Agent 任務
IFBench
指令約束遵循
49.9%
AA-LCR
長上下文推理
51.3%
τ²-Bench
Agent 工作流程任務
18.4%
指標來源 Artificial Analysis
Gemini 2.5 Flash-Lite 常見問題
了解 Gemini 2.5 Flash-Lite 的定位、適合的使用情境、主要優勢、使用限制,以及在 TokenHub 中串接時要注意的事項。
Gemini 2.5 Flash-Lite 屬於哪一類模型?+
Gemini 2.5 Flash-Lite 是 Google Gemini 2.5 系列中最經濟的模型,適合簡單、高頻率的多模態處理。它仍是明確的模型版本,但新專案評估時通常也應比較同系列較新型號。
團隊可以用 Gemini 2.5 Flash-Lite 做什麼?+
它適合大規模分類與路由、簡單的結構化資料擷取以及大量翻譯。正式上線前應使用具代表性的輸入測試,並訂定可衡量的驗收標準。
Gemini 2.5 Flash-Lite 在哪些技術面向較有優勢?+
它最實用的優勢包括良好的成本效益、較快的回應速度以及支援多種多模態輸入。這些特點對簡單的結構化資料擷取尤其有價值。
什麼情況下應選擇其他模型,而不是 Gemini 2.5 Flash-Lite?+
如果工作包含高難度多步驟推理、專案可採用較新一代 Gemini,或重要決策流程無法安排人工覆核,可以考慮其他模型。涉及事實、法律、財務、醫療或營運的重要結果,應由具備相關資格的人員覆核。
透過 TokenHub 串接 Gemini 2.5 Flash-Lite 前需要檢查什麼?+
在 TokenHub 中,請選擇頁面顯示的 Gemini 2.5 Flash-Lite 精確模型識別碼,使用帳戶文件中指定的介面,並以 TokenHub 憑證完成驗證。請確認 TokenHub 實際開放的輸入類型、工具、資料依據選項與模型生命週期,不要預設與 Gemini API 完全相同。
媒體與討論
精選與此模型相關的公開影片和貼文。
X (Twitter)
Reddit
YouTube