POST /v1/chat/completionsGemini 3.1 Flash-Lite
gemini-3.1-flash-liteGemini 3.1 Flash Lite reprend les éléments mis en avant par les sources : high-efficiency multimodal model with text/image/video/audio/prise en charge PDF. Sa valeur principale se situe dans extraction, routage, classification and léger multimodal agents. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.
Contexte total
1Mtokens
Sortie max.
65.5Ktokens
Date de sortie
7 mai 2026
Modalités
Prix de Gemini 3.1 Flash-Lite
| Prix entrée | Prix sortie | Lecture cache | Création cache 5m |
|---|---|---|---|
| $0.25/M | $1.5/M | $0.025/M | $0.0833/M |
Gemini 3.1 Flash-Lite API
Benchmark de Gemini 3.1 Flash-Lite
Gemini 3.1 Flash-Lite
25
/100
Artificial Analysis Intelligence Index
Artificial Analysis broad capability aggregate
Score d’indice
30.1
/100
Artificial Analysis Coding Index
Artificial Analysis software task aggregate
Score d’indice
Knowledge & Reasoning
GPQA
Advanced science problem solving
82.2%
HLE
Broad expert-level exam set
16.2%
Coding & Engineering
SciCode
Scientific coding challenges
41.9%
Terminal-Bench Hard
Hard terminal task execution
24.2%
Instruction Following & Agent Tasks
IFBench
Prompt constraint adherence
77.2%
AA-LCR
Long-context reasoning
65.3%
τ²-Bench
Agent workflow tasks
31.3%
Mesures provenant de Artificial Analysis
Questions fréquentes sur Gemini 3.1 Flash-Lite
Découvrez le positionnement de Gemini 3.1 Flash-Lite, ses meilleurs usages, ses points forts, ses limites pratiques et les précautions d’intégration avec TokenHub.
Où se situe Gemini 3.1 Flash-Lite dans la famille de modèles de son fournisseur ?+
Gemini 3.1 Flash-Lite est le modèle Gemini 3 de Google à faible latence et coût réduit pour les tâches multimodales légères et fréquentes. Il s’agit d’un modèle public actuel du fournisseur, avec une disponibilité qui peut varier selon la plateforme.
Quels scénarios de production conviennent à Gemini 3.1 Flash-Lite ?+
Usages recommandés : la classification et le routage à grande échelle, l’extraction simple de données structurées et la traduction à grande échelle. Avant la production, testez des entrées représentatives et définissez des critères d’acceptation mesurables.
Qu’est-ce qui distingue Gemini 3.1 Flash-Lite pour l’extraction simple de données structurées ?+
Principaux atouts : des temps de réponse rapides, une mise à l’échelle économique et la prise en charge de diverses entrées multimodales. Cet ensemble est particulièrement utile pour l’extraction simple de données structurées.
Quels compromis faut-il prendre en compte avec Gemini 3.1 Flash-Lite ?+
Envisagez un autre modèle si la tâche exige le raisonnement le plus puissant de la gamme Pro, la charge exige une génération longue et nuancée ou un raisonnement difficile ou le processus ne permet aucune validation humaine des décisions importantes. Faites valider par une personne qualifiée les résultats importants de nature factuelle, juridique, financière, médicale ou opérationnelle.
Comment une équipe peut-elle commencer à utiliser Gemini 3.1 Flash-Lite sur TokenHub en toute sécurité ?+
Dans TokenHub, sélectionnez l’identifiant exact affiché pour Gemini 3.1 Flash-Lite, utilisez l’endpoint documenté pour votre compte et vos identifiants TokenHub. Vérifiez les types d’entrée, outils, options d’ancrage et le cycle de vie réellement exposés par TokenHub, sans supposer une parité complète avec l’API Gemini.
MéDias Et Discussions
Sélection de vidéos et publications publiques liées à ce modèle.
X (Twitter)
Reddit
YouTube