Models

Explorez les tarifs, capacités, points de terminaison et fournisseurs des modèles d'IA depuis un catalogue de production unique.

OpenAI

GPT-5.5

gpt-5.5

GPT-5.5 reprend les éléments mis en avant par les sources : frontier OpenAI model, stronger programmation/recherche/analyse de données profile. Sa valeur principale se situe dans broad professional intelligence and structuré travail de connaissance. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1.1M

Sortie max.

128K

Date de sortie

23 avr. 2026

Entrée$5 / M tokens
Sortie$30 / M tokens
Lecture cache$0.5 / M tokens

DeepSeek

DeepSeek V4 Pro

deepseek-v4-pro

DeepSeek V4 Pro reprend les éléments mis en avant par les sources : MoE 1.6T total / 49B actifs, 1M-token contexte, hybrid long contextee attention. Sa valeur principale se situe dans avancé raisonnement, programmation, base de code complète analyse and longue durée flux de travail agents. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Sortie max.

384K

Date de sortie

24 avr. 2026

Entrée$1.8 / M tokens
Sortie$3.5 / M tokens
Lecture cache$0.015 / M tokens

DeepSeek

DeepSeek V4 Flash

deepseek-v4-flash

DeepSeek V4 Flash reprend les éléments mis en avant par les sources : MoE 284B total / 13B actifs, 1M-token contexte, inférence orientée débit. Sa valeur principale se situe dans grand volume appels de production, rapide long contextee traitement and sensible aux coûts automatisation. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Sortie max.

384K

Date de sortie

24 avr. 2026

Entrée$0.15 / M tokens
Sortie$0.3 / M tokens
Lecture cache$0.003 / M tokens

Alibaba

Qwen3.7 Plus

qwen3.7-plus

Qwen3.7 Plus reprend les éléments mis en avant par les sources : text+image input, vision-language upgrade, hybrid agent capability. Sa valeur principale se situe dans tâches GUI, navigation mobile, référence visuelle flux de travail and économique Qwen3.7 use. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Sortie max.

64K

Date de sortie

2 juin 2026

Entrée$0.2857 / M tokens
Sortie$1.1429 / M tokens
Lecture cache$0.0571 / M tokens

OpenAI

GPT-4.1

gpt-4.1

GPT-4.1 reprend les éléments mis en avant par les sources : improved programmation, instruction following and long contexte versus earlier GPT-4 generation. Sa valeur principale se situe dans outils développeurs, assistance de programmation and riches en instructions tasks. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Sortie max.

32.8K

Date de sortie

14 avr. 2025

Entrée$2 / M tokens
Sortie$8 / M tokens
Lecture cache$0.5 / M tokens

OpenAI

GPT-4.1 Mini

gpt-4.1-mini

GPT-4.1 Mini reprend les éléments mis en avant par les sources : rapideer/lower-cost GPT-4.1 variant. Sa valeur principale se situe dans grand volume developer features, génération structurée and extraction. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Sortie max.

32.8K

Date de sortie

14 avr. 2025

Entrée$0.4 / M tokens
Sortie$1.6 / M tokens
Lecture cache$0.1 / M tokens

OpenAI

GPT-4o

gpt-4o

GPT-4o reprend les éléments mis en avant par les sources : multimodal GPT-4o flagship, text/image input and broad general intelligence. Sa valeur principale se situe dans applications vision-langage, interaction naturelle and tâches d’assistant général. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

128K

Sortie max.

16.4K

Date de sortie

13 mai 2024

Entrée$2.5 / M tokens
Sortie$10 / M tokens
Lecture cache$1.25 / M tokens

OpenAI

GPT-4o Mini

gpt-4o-mini

GPT-4o Mini reprend les éléments mis en avant par les sources : small affordable GPT-4o model with text/image input and structuré output support. Sa valeur principale se situe dans léger multimodal production, fine-tuning, distillation and tâches ciblées. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

128K

Sortie max.

16.4K

Date de sortie

18 juil. 2024

Entrée$0.15 / M tokens
Sortie$0.6 / M tokens
Lecture cache$0.075 / M tokens

OpenAI

GPT-5.3 Chat

gpt-5.3-chat

GPT-5.3 Chat est le nom API de GPT-5.3 Instant, un snapshot de ChatGPT conçu pour rendre les conversations quotidiennes plus fluides, directes et utiles. OpenAI présente cette version comme une amélioration de la précision, de la contextualisation lors des recherches web et du flux conversationnel, avec moins de réserves inutiles et de formulations trop prudentes. La documentation API indique toutefois que ce modèle est déprécié au profit de modèles GPT plus récents.

Contexte total

128K

Sortie max.

16.4K

Date de sortie

3 mars 2026

Entrée$1.75 / M tokens
Sortie$14 / M tokens
Lecture cache$0.175 / M tokens

OpenAI

GPT-5.3 Codex

gpt-5.3-codex

GPT-5.3-Codex est le modèle de codage agentique d’OpenAI pour Codex et les environnements de développement similaires. Il combine des performances avancées en ingénierie logicielle avec un raisonnement plus large et des connaissances professionnelles, tout en prenant en charge différents niveaux d’effort de raisonnement. OpenAI le positionne au-delà de la simple écriture ou revue de code, vers l’usage d’ordinateur, les workflows terminal et les tâches d’ingénierie longues.

Contexte total

400K

Sortie max.

128K

Date de sortie

5 févr. 2026

Entrée$1.75 / M tokens
Sortie$14 / M tokens
Lecture cache$0.175 / M tokens

OpenAI

GPT-5.4

gpt-5.4

GPT-5.4 reprend les éléments mis en avant par les sources : frontier work model, native computer use, documents/tableurs/présentations, large contexte. Sa valeur principale se situe dans professional productivity, programmation, analyse factuelle and exécution de travail réel. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1.1M

Sortie max.

128K

Date de sortie

5 mars 2026

Entrée$2.5 / M tokens
Sortie$15 / M tokens
Lecture cache$0.25 / M tokens

OpenAI

GPT-5.4 Mini

gpt-5.4-mini

GPT-5.4 Mini reprend les éléments mis en avant par les sources : smaller/rapideer GPT-5.4 variant with utilisation d’outils and raisonnement multimodal. Sa valeur principale se situe dans faible latence production tasks, sous-agents and bien délimité programmation flux de travail. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

400K

Sortie max.

128K

Date de sortie

17 mars 2026

Entrée$0.75 / M tokens
Sortie$4.5 / M tokens
Lecture cache$0.075 / M tokens

OpenAI

GPT-5.4 Nano

gpt-5.4-nano

GPT-5.4 Nano reprend les éléments mis en avant par les sources : smallest/lowest-cost GPT-5.4 option. Sa valeur principale se situe dans classification, routage, extraction and prévisible grand volume generation. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

400K

Sortie max.

128K

Date de sortie

17 mars 2026

Entrée$0.2 / M tokens
Sortie$1.25 / M tokens
Lecture cache$0.02 / M tokens

OpenAI

GPT-5.4 Pro

gpt-5.4-pro

GPT-5.4 Pro reprend les éléments mis en avant par les sources : higher-precision GPT-5.4 tier. Sa valeur principale se situe dans demanding analyse, complex code and high-stakes résultats professionnels. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1.1M

Sortie max.

128K

Date de sortie

5 mars 2026

Entrée$30 / M tokens
Sortie$180 / M tokens

OpenAI

GPT-5.5 Pro

gpt-5.5-pro

GPT-5.5 Pro reprend les éléments mis en avant par les sources : higher-compute GPT-5.5 tier, precision-first raisonnement. Sa valeur principale se situe dans travail professionnel difficile, programmation, recherche, analyse de données and riches en documents tasks. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1.1M

Sortie max.

128K

Date de sortie

23 avr. 2026

Entrée$30 / M tokens
Sortie$180 / M tokens

Minimax

MiniMax M2.5

MiniMax-M2.5

MiniMax M2.5 reprend les éléments mis en avant par les sources : trained in complex digital environments, programmation/search/office workflow emphasis. Sa valeur principale se situe dans productivité réelle, Word/Excel/PowerPoint tasks and agentic utilisation d’outils. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

204.8K

Sortie max.

131.1K

Date de sortie

12 févr. 2026

Entrée$0.3 / M tokens
Sortie$1.2 / M tokens
Lecture cache$0.03 / M tokens

Minimax

MiniMax M2.7

MiniMax-M2.7

MiniMax M2.7 reprend les éléments mis en avant par les sources : multi-agent collaboration, live débogage, root-cause analyse and office-document generation. Sa valeur principale se situe dans engineering productivity, modélisation financière and riches en documents flux de travail. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

204.8K

Sortie max.

131.1K

Date de sortie

18 mars 2026

Entrée$0.3 / M tokens
Sortie$1.2 / M tokens
Lecture cache$0.06 / M tokens

Minimax

MiniMax M3

MiniMax-M3

MiniMax M3 reprend les éléments mis en avant par les sources : 1M-token contexte, MiniMax Sparse Attention, native multimodal foundation model. Sa valeur principale se situe dans longue durée agents, programmation, utilisation d’outils and collaboration à grand contextee. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

512K

Sortie max.

128K

Date de sortie

1 juin 2026

Entrée$0.6 / M tokens
Sortie$2.4 / M tokens
Lecture cache$0.12 / M tokens

Anthropic

Claude Fable 5

claude-fable-5

Claude Fable 5 reprend les éléments mis en avant par les sources : Mythos-level Claude model, long-running autonomy, memory and sub-agent work. Sa valeur principale se situe dans projets ambitieux, autonome travail de connaissance, programmation, vision and collaboration projet. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Sortie max.

128K

Date de sortie

9 juin 2026

Entrée$10 / M tokens
Sortie$50 / M tokens
Lecture cache$1 / M tokens

Anthropic

Claude Haiku 4.5

claude-haiku-4.5

Claude Haiku 4.5 reprend les éléments mis en avant par les sources : rapide and cost-efficient Claude model with strong programmation/computer-use results. Sa valeur principale se situe dans agents réactifs, production chat and high-frequency work tasks. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

200K

Sortie max.

64K

Date de sortie

15 oct. 2025

Entrée$1 / M tokens
Sortie$5 / M tokens
Lecture cache$0.1 / M tokens

Anthropic

Claude Opus 4.5

claude-opus-4.5

Claude Opus 4.5 reprend les éléments mis en avant par les sources : premium Opus 4 generation model with raisonnement, programmation and agentic work profile. Sa valeur principale se situe dans travail approfondi, exécution fiable and difficile knowledge tasks. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

200K

Sortie max.

64K

Date de sortie

24 nov. 2025

Entrée$5 / M tokens
Sortie$25 / M tokens
Lecture cache$0.5 / M tokens

Modèles populaires recommandés

Commencez par les modèles les plus visibles du catalogue en direct, puis ouvrez une page détail pour comparer contexte, endpoints et prix effectif.

OpenAI

GPT-5.5

GPT-5.5 reprend les éléments mis en avant par les sources : frontier OpenAI model, stronger programmation/recherche/analyse de données profile. Sa valeur principale se situe dans broad professional intelligence and structuré travail de connaissance. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1.1M

Prix entrée

$5 / M tokens

Voir le modèle

DeepSeek

DeepSeek V4 Pro

DeepSeek V4 Pro reprend les éléments mis en avant par les sources : MoE 1.6T total / 49B actifs, 1M-token contexte, hybrid long contextee attention. Sa valeur principale se situe dans avancé raisonnement, programmation, base de code complète analyse and longue durée flux de travail agents. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Prix entrée

$1.8 / M tokens

Voir le modèle

DeepSeek

DeepSeek V4 Flash

DeepSeek V4 Flash reprend les éléments mis en avant par les sources : MoE 284B total / 13B actifs, 1M-token contexte, inférence orientée débit. Sa valeur principale se situe dans grand volume appels de production, rapide long contextee traitement and sensible aux coûts automatisation. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Prix entrée

$0.15 / M tokens

Voir le modèle

Alibaba

Qwen3.7 Plus

Qwen3.7 Plus reprend les éléments mis en avant par les sources : text+image input, vision-language upgrade, hybrid agent capability. Sa valeur principale se situe dans tâches GUI, navigation mobile, référence visuelle flux de travail and économique Qwen3.7 use. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Prix entrée

$0.2857 / M tokens

Voir le modèle

OpenAI

GPT-4.1

GPT-4.1 reprend les éléments mis en avant par les sources : improved programmation, instruction following and long contexte versus earlier GPT-4 generation. Sa valeur principale se situe dans outils développeurs, assistance de programmation and riches en instructions tasks. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Prix entrée

$2 / M tokens

Voir le modèle

OpenAI

GPT-4.1 Mini

GPT-4.1 Mini reprend les éléments mis en avant par les sources : rapideer/lower-cost GPT-4.1 variant. Sa valeur principale se situe dans grand volume developer features, génération structurée and extraction. La description doit donc insister sur ces caractéristiques propres au modèle, plutôt que le présenter comme un chatbot générique.

Contexte total

1M

Prix entrée

$0.4 / M tokens

Voir le modèle

Comparaison de modèles

Comparaison rapide avec les modèles voisins sélectionnés du catalogue.

FAQ du catalogue de modèles

Un guide rapide pour choisir, comparer et utiliser les modèles du catalogue TokenHub.

Comment choisir un modèle dans cette liste ?

+

Partez de votre cas d’usage. Utilisez les filtres par fournisseur, tags, type d’endpoint et groupe de facturation, puis comparez la taille de contexte, la sortie maximale, les modalités et les prix d’entrée ou de sortie.

Que signifie le prix effectif ?

+

Le prix effectif applique le ratio du groupe de facturation actif aux données tarifaires du modèle. Il aide à estimer le coût réel d’entrée, de sortie ou par requête pour le groupe utilisé.

Ces modèles sont-ils utilisables via des endpoints API ?

+

Oui. Ouvrez la page détail d’un modèle pour voir les types d’endpoints pris en charge et les liens de documentation. La disponibilité peut varier selon le modèle, le fournisseur et la configuration de routage.

Pourquoi la fenêtre de contexte et la sortie maximale comptent-elles ?

+

La fenêtre de contexte définit la quantité de prompt et d’historique que le modèle peut lire. La sortie maximale définit la quantité générée en une réponse, ce qui compte pour les textes longs, le code et les documents.