POST /v1/chat/completionsGemini 2.5 Flash-Lite
gemini-2.5-flash-liteGemini 2.5 Flash Lite được các nguồn nhấn mạnh ở các điểm: nhanhest/budget Gemini 2.5 option, thinking budgets and tool integrations. Giá trị chính của mô hình nằm ở phân loại, dịch, định tuyến, trích xuất and high-scale workloads. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.
Ngữ cảnh tối đa
1Mtoken
Đầu ra tối đa
65.5Ktoken
Ngày phát hành
17 thg 6, 2025
Phương thức
Giá Gemini 2.5 Flash-Lite
| Giá đầu vào | Giá đầu ra | Đọc cache |
|---|---|---|
| $0.1/M | $0.4/M | $0.01/M |
Gemini 2.5 Flash-Lite API
Benchmark của Gemini 2.5 Flash-Lite
11.4
/100
Artificial Analysis Intelligence Index
Artificial Analysis broad capability aggregate
Điểm chỉ số
9.5
/100
Artificial Analysis Coding Index
Artificial Analysis software task aggregate
Điểm chỉ số
53.3
/100
Artificial Analysis Math Index
Artificial Analysis math reasoning aggregate
Điểm chỉ số
Knowledge & Reasoning
MMLU-Pro
Advanced multi-task knowledge
75.9%
GPQA
Advanced science problem solving
62.5%
HLE
Broad expert-level exam set
6.4%
Coding & Engineering
LiveCodeBench
Live coding problems
59.3%
SciCode
Scientific coding challenges
19.3%
Terminal-Bench Hard
Hard terminal task execution
4.5%
Math
MATH-500
Advanced math problem solving
96.9%
AIME
Competition math problems
70.3%
AIME 2025
Competition math problems
53.3%
Instruction Following & Agent Tasks
IFBench
Prompt constraint adherence
49.9%
AA-LCR
Long-context reasoning
51.3%
τ²-Bench
Agent workflow tasks
18.4%
Nguồn chỉ số Artificial Analysis
Câu hỏi thường gặp về Gemini 2.5 Flash-Lite
Tìm hiểu Gemini 2.5 Flash-Lite là gì, phù hợp với tác vụ nào, có điểm mạnh gì, cần lưu ý hạn chế nào và cách tích hợp an toàn qua TokenHub.
Gemini 2.5 Flash-Lite thuộc loại mô hình nào?+
Gemini 2.5 Flash-Lite là mô hình Gemini 2.5 tiết kiệm nhất của Google cho xử lý đa phương thức đơn giản, tần suất cao. Đây vẫn là một thế hệ mô hình riêng, nhưng dự án mới nên so sánh với các bản mới hơn cùng họ.
Nhóm nên dùng Gemini 2.5 Flash-Lite cho việc gì?+
Các tình huống phù hợp gồm phân loại và định tuyến quy mô lớn, trích xuất dữ liệu có cấu trúc đơn giản và dịch thuật khối lượng lớn. Trước khi đưa vào sản xuất, hãy thử đầu vào đại diện và đặt tiêu chí chấp nhận có thể đo lường.
Gemini 2.5 Flash-Lite có lợi thế kỹ thuật rõ ràng ở đâu?+
Điểm mạnh chính gồm khả năng mở rộng tiết kiệm chi phí, thời gian phản hồi nhanh và hỗ trợ nhiều loại đầu vào đa phương thức. Sự kết hợp này đặc biệt hữu ích với trích xuất dữ liệu có cấu trúc đơn giản.
Khi nào nên chọn mô hình khác thay vì Gemini 2.5 Flash-Lite?+
Hãy cân nhắc mô hình khác khi tác vụ có suy luận khó nhiều bước, dự án có thể dùng thế hệ Gemini mới hơn hoặc quy trình không thể có bước con người rà soát quyết định quan trọng. Đầu ra quan trọng về sự thật, pháp lý, tài chính, y tế hoặc vận hành cần được người có chuyên môn rà soát.
Cần kiểm tra gì trước khi tích hợp Gemini 2.5 Flash-Lite với TokenHub?+
Trong TokenHub, hãy chọn đúng định danh mô hình hiển thị cho Gemini 2.5 Flash-Lite, dùng endpoint được ghi trong tài liệu tài khoản và xác thực bằng thông tin TokenHub. Hãy xác nhận loại đầu vào, công cụ, tùy chọn grounding và vòng đời mô hình thực tế trên TokenHub thay vì giả định hoàn toàn giống Gemini API.
TruyềN ThôNg Và ThảO LuậN
Tuyển chọn video và bài đăng công khai liên quan đến mô hình này.
X (Twitter)
Reddit
YouTube