POST /v1/chat/completionsGemini 3.1 Flash-Lite
gemini-3.1-flash-liteGemini 3.1 Flash Lite được các nguồn nhấn mạnh ở các điểm: high-efficiency đa phương thức model with text/image/video/audio/hỗ trợ PDF. Giá trị chính của mô hình nằm ở trích xuất, định tuyến, phân loại and lightweight đa phương thức agents. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.
Ngữ cảnh tối đa
1Mtoken
Đầu ra tối đa
65.5Ktoken
Ngày phát hành
7 thg 5, 2026
Phương thức
Giá Gemini 3.1 Flash-Lite
| Giá đầu vào | Giá đầu ra | Đọc cache | Tạo cache 5m |
|---|---|---|---|
| $0.25/M | $1.5/M | $0.025/M | $0.0833/M |
Gemini 3.1 Flash-Lite API
Benchmark của Gemini 3.1 Flash-Lite
Gemini 3.1 Flash-Lite
25
/100
Artificial Analysis Intelligence Index
Artificial Analysis broad capability aggregate
Điểm chỉ số
30.1
/100
Artificial Analysis Coding Index
Artificial Analysis software task aggregate
Điểm chỉ số
Knowledge & Reasoning
GPQA
Advanced science problem solving
82.2%
HLE
Broad expert-level exam set
16.2%
Coding & Engineering
SciCode
Scientific coding challenges
41.9%
Terminal-Bench Hard
Hard terminal task execution
24.2%
Instruction Following & Agent Tasks
IFBench
Prompt constraint adherence
77.2%
AA-LCR
Long-context reasoning
65.3%
τ²-Bench
Agent workflow tasks
31.3%
Nguồn chỉ số Artificial Analysis
Câu hỏi thường gặp về Gemini 3.1 Flash-Lite
Tìm hiểu Gemini 3.1 Flash-Lite là gì, phù hợp với tác vụ nào, có điểm mạnh gì, cần lưu ý hạn chế nào và cách tích hợp an toàn qua TokenHub.
Gemini 3.1 Flash-Lite được định vị ra sao trong họ mô hình của nhà cung cấp?+
Gemini 3.1 Flash-Lite là mô hình Gemini 3 của Google có độ trễ thấp và tiết kiệm cho tác vụ đa phương thức nhẹ, tần suất cao. Đây là mô hình công khai hiện hành của nhà cung cấp, nhưng khả dụng có thể khác theo nền tảng.
Kịch bản sản xuất nào phù hợp với Gemini 3.1 Flash-Lite?+
Các tình huống phù hợp gồm phân loại và định tuyến quy mô lớn, trích xuất dữ liệu có cấu trúc đơn giản và dịch thuật khối lượng lớn. Trước khi đưa vào sản xuất, hãy thử đầu vào đại diện và đặt tiêu chí chấp nhận có thể đo lường.
Điều gì khiến Gemini 3.1 Flash-Lite nổi bật với trích xuất dữ liệu có cấu trúc đơn giản?+
Điểm mạnh chính gồm thời gian phản hồi nhanh, khả năng mở rộng tiết kiệm chi phí và hỗ trợ nhiều loại đầu vào đa phương thức. Sự kết hợp này đặc biệt hữu ích với trích xuất dữ liệu có cấu trúc đơn giản.
Nhà phát triển cần cân nhắc những đánh đổi nào khi dùng Gemini 3.1 Flash-Lite?+
Hãy cân nhắc mô hình khác khi tác vụ cần suy luận mạnh nhất ở cấp Pro, tác vụ cần tạo nội dung dài tinh tế hoặc suy luận khó hoặc quy trình không thể có bước con người rà soát quyết định quan trọng. Đầu ra quan trọng về sự thật, pháp lý, tài chính, y tế hoặc vận hành cần được người có chuyên môn rà soát.
Nhóm có thể bắt đầu dùng Gemini 3.1 Flash-Lite trên TokenHub một cách an toàn như thế nào?+
Trong TokenHub, hãy chọn đúng định danh mô hình hiển thị cho Gemini 3.1 Flash-Lite, dùng endpoint được ghi trong tài liệu tài khoản và xác thực bằng thông tin TokenHub. Hãy xác nhận loại đầu vào, công cụ, tùy chọn grounding và vòng đời mô hình thực tế trên TokenHub thay vì giả định hoàn toàn giống Gemini API.
TruyềN ThôNg Và ThảO LuậN
Tuyển chọn video và bài đăng công khai liên quan đến mô hình này.
X (Twitter)
Reddit
YouTube