Models

Изучайте цены, возможности, конечные точки и покрытие поставщиков ИИ-моделей в одном производственном каталоге.

OpenAI

GPT-5.5

gpt-5.5

GPT-5.5 в источниках выделяется следующими характеристиками: frontier OpenAI model, stronger программирование/исследования/анализ данных profile. Основная ценность модели связана с broad professional intelligence and структурированный работа со знаниями. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1.1M

Максимальный вывод

128K

Дата выпуска

23 апр. 2026 г.

Вход$5 / млн токенов

Выход$30 / млн токенов

Чтение кэша$0.5 / млн токенов

DeepSeek

DeepSeek V4 Pro

deepseek-v4-pro

DeepSeek V4 Pro в источниках выделяется следующими характеристиками: MoE 1.6T всего / 49B активных, 1M-token контекст, hybrid длинный контекст attention. Основная ценность модели связана с продвинутое рассуждение, программирование, вся кодовая база анализ and долгосрочные агентные рабочие процессы. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

Максимальный вывод

384K

Дата выпуска

24 апр. 2026 г.

Вход$1.8 / млн токенов

Выход$3.5 / млн токенов

Чтение кэша$0.015 / млн токенов

DeepSeek

DeepSeek V4 Flash

deepseek-v4-flash

DeepSeek V4 Flash в источниках выделяется следующими характеристиками: MoE 284B всего / 13B активных, 1M-token контекст, инференс, ориентированный на пропускную способность. Основная ценность модели связана с высокий объем производственные вызовы, быстрая длинный контекст обработка and чувствительные к стоимости автоматизация. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

Максимальный вывод

384K

Дата выпуска

24 апр. 2026 г.

Вход$0.15 / млн токенов

Выход$0.3 / млн токенов

Чтение кэша$0.003 / млн токенов

Alibaba

Qwen3.7 Plus

qwen3.7-plus

Qwen3.7 Plus в источниках выделяется следующими характеристиками: text+image input, vision-language upgrade, hybrid agent capability. Основная ценность модели связана с GUI-задачи, мобильная навигация, визуальные референсы рабочие процессы and экономичный Qwen3.7 use. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

Максимальный вывод

64K

Дата выпуска

2 июн. 2026 г.

Вход$0.2857 / млн токенов

Выход$1.1429 / млн токенов

Чтение кэша$0.0571 / млн токенов

OpenAI

GPT-4.1

gpt-4.1

GPT-4.1 в источниках выделяется следующими характеристиками: improved программирование, instruction following and long контекст versus earlier GPT-4 generation. Основная ценность модели связана с инструменты разработчика, помощь в программировании and instruction-heavy tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

Максимальный вывод

32.8K

Дата выпуска

14 апр. 2025 г.

Вход$2 / млн токенов

Выход$8 / млн токенов

Чтение кэша$0.5 / млн токенов

OpenAI

GPT-4.1 Mini

gpt-4.1-mini

GPT-4.1 Mini в источниках выделяется следующими характеристиками: быстраяer/lower-cost GPT-4.1 variant. Основная ценность модели связана с высокий объем developer features, структурированный generation and извлечение. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

Максимальный вывод

32.8K

Дата выпуска

14 апр. 2025 г.

Вход$0.4 / млн токенов

Выход$1.6 / млн токенов

Чтение кэша$0.1 / млн токенов

OpenAI

GPT-4o

gpt-4o

GPT-4o в источниках выделяется следующими характеристиками: мультимодальный GPT-4o flagship, text/image input and broad general intelligence. Основная ценность модели связана с vision-language applications, естественное взаимодействие and general assistant tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

128K

Максимальный вывод

16.4K

Дата выпуска

13 мая 2024 г.

Вход$2.5 / млн токенов

Выход$10 / млн токенов

Чтение кэша$1.25 / млн токенов

OpenAI

GPT-4o Mini

gpt-4o-mini

GPT-4o Mini в источниках выделяется следующими характеристиками: small affordable GPT-4o model with text/image input and структурированный output support. Основная ценность модели связана с lightweight мультимодальный production, дообучение, дистилляция and focused tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

128K

Максимальный вывод

16.4K

Дата выпуска

18 июл. 2024 г.

Вход$0.15 / млн токенов

Выход$0.6 / млн токенов

Чтение кэша$0.075 / млн токенов

OpenAI

GPT-5.3 Chat

gpt-5.3-chat

gpt-5.3-chat — API-название GPT-5.3 Instant, снимка модели ChatGPT для более плавных и полезных повседневных диалогов. OpenAI описывает обновление как улучшение точности ответов, контекстуализации веб-поиска и естественности общения, с меньшим количеством лишних оговорок и чрезмерно осторожных формулировок. В API-документации модель отмечена как устаревшая в пользу более новых GPT-моделей.

Максимальный контекст

128K

Максимальный вывод

16.4K

Дата выпуска

3 мар. 2026 г.

Вход$1.75 / млн токенов

Выход$14 / млн токенов

Чтение кэша$0.175 / млн токенов

OpenAI

GPT-5.3 Codex

gpt-5.3-codex

gpt-5.3-codex — агентная кодовая модель OpenAI для Codex и похожих сред разработки. Она объединяет передовые возможности software engineering с более широким рассуждением и профессиональными знаниями, поддерживает настраиваемый reasoning effort, контекст 400K и максимальный вывод 128K токенов. OpenAI позиционирует ее не только для написания и ревью кода, но и для работы с компьютером, терминалом и долгими инженерными задачами.

Максимальный контекст

400K

Максимальный вывод

128K

Дата выпуска

5 февр. 2026 г.

Вход$1.75 / млн токенов

Выход$14 / млн токенов

Чтение кэша$0.175 / млн токенов

OpenAI

GPT-5.4

gpt-5.4

GPT-5.4 в источниках выделяется следующими характеристиками: frontier work model, native computer use, документы/таблицы/презентации, large контекст. Основная ценность модели связана с professional productivity, программирование, фактологический анализ and real work execution. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1.1M

Максимальный вывод

128K

Дата выпуска

5 мар. 2026 г.

Вход$2.5 / млн токенов

Выход$15 / млн токенов

Чтение кэша$0.25 / млн токенов

OpenAI

GPT-5.4 Mini

gpt-5.4-mini

GPT-5.4 Mini в источниках выделяется следующими характеристиками: smaller/быстраяer GPT-5.4 variant with использование инструментов and мультимодальный рассуждение. Основная ценность модели связана с низкая задержка production tasks, субагенты and well-scoped программирование рабочие процессы. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

400K

Максимальный вывод

128K

Дата выпуска

17 мар. 2026 г.

Вход$0.75 / млн токенов

Выход$4.5 / млн токенов

Чтение кэша$0.075 / млн токенов

OpenAI

GPT-5.4 Nano

gpt-5.4-nano

GPT-5.4 Nano в источниках выделяется следующими характеристиками: smallest/lowest-cost GPT-5.4 option. Основная ценность модели связана с классификация, маршрутизация, извлечение and predictable высокий объем generation. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

400K

Максимальный вывод

128K

Дата выпуска

17 мар. 2026 г.

Вход$0.2 / млн токенов

Выход$1.25 / млн токенов

Чтение кэша$0.02 / млн токенов

OpenAI

GPT-5.4 Pro

gpt-5.4-pro

GPT-5.4 Pro в источниках выделяется следующими характеристиками: higher-precision GPT-5.4 tier. Основная ценность модели связана с demanding анализ, complex code and high-stakes professional outputs. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1.1M

Максимальный вывод

128K

Дата выпуска

5 мар. 2026 г.

Вход$30 / млн токенов

Выход$180 / млн токенов

OpenAI

GPT-5.5 Pro

gpt-5.5-pro

GPT-5.5 Pro в источниках выделяется следующими характеристиками: higher-compute GPT-5.5 tier, precision-first рассуждение. Основная ценность модели связана с difficult профессиональная работа, программирование, исследования, анализ данных and документоемкие tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1.1M

Максимальный вывод

128K

Дата выпуска

23 апр. 2026 г.

Вход$30 / млн токенов

Выход$180 / млн токенов

Minimax

MiniMax M2.5

MiniMax-M2.5

MiniMax M2.5 в источниках выделяется следующими характеристиками: trained in complex digital environments, программирование/search/office workflow emphasis. Основная ценность модели связана с real-world productivity, Word/Excel/PowerPoint tasks and agentic использование инструментов. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

204.8K

Максимальный вывод

131.1K

Дата выпуска

12 февр. 2026 г.

Вход$0.3 / млн токенов

Выход$1.2 / млн токенов

Чтение кэша$0.03 / млн токенов

Minimax

MiniMax M2.7

MiniMax-M2.7

MiniMax M2.7 в источниках выделяется следующими характеристиками: multi-agent сотрудничество, live отладка, root-cause анализ and office-document generation. Основная ценность модели связана с engineering productivity, финансовое моделирование and документоемкие рабочие процессы. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

204.8K

Максимальный вывод

131.1K

Дата выпуска

18 мар. 2026 г.

Вход$0.3 / млн токенов

Выход$1.2 / млн токенов

Чтение кэша$0.06 / млн токенов

Minimax

MiniMax M3

MiniMax-M3

MiniMax M3 в источниках выделяется следующими характеристиками: 1M-token контекст, MiniMax Sparse Attention, native мультимодальный foundation model. Основная ценность модели связана с долгосрочные agents, программирование, использование инструментов and large-контекст сотрудничество. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

512K

Максимальный вывод

128K

Дата выпуска

1 июн. 2026 г.

Вход$0.6 / млн токенов

Выход$2.4 / млн токенов

Чтение кэша$0.12 / млн токенов

Anthropic

Claude Fable 5

claude-fable-5

Claude Fable 5 в источниках выделяется следующими характеристиками: Mythos-level Claude model, long-running autonomy, memory and sub-agent work. Основная ценность модели связана с амбициозные проекты, автономный работа со знаниями, программирование, vision and project сотрудничество. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

Максимальный вывод

128K

Дата выпуска

9 июн. 2026 г.

Вход$10 / млн токенов

Выход$50 / млн токенов

Чтение кэша$1 / млн токенов

Anthropic

Claude Haiku 4.5

claude-haiku-4.5

Claude Haiku 4.5 в источниках выделяется следующими характеристиками: быстрая and cost-efficient Claude model with strong программирование/computer-use results. Основная ценность модели связана с быстрые агенты, production чат and high-frequency work tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

200K

Максимальный вывод

64K

Дата выпуска

15 окт. 2025 г.

Вход$1 / млн токенов

Выход$5 / млн токенов

Чтение кэша$0.1 / млн токенов

Anthropic

Claude Opus 4.5

claude-opus-4.5

Claude Opus 4.5 в источниках выделяется следующими характеристиками: premium Opus 4 generation model with рассуждение, программирование and agentic work profile. Основная ценность модели связана с глубокая работа, надежное выполнение and difficult knowledge tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

200K

Максимальный вывод

64K

Дата выпуска

24 нояб. 2025 г.

Вход$5 / млн токенов

Выход$25 / млн токенов

Чтение кэша$0.5 / млн токенов

Сравнение моделей

Быстрое сравнение с выбранными соседними моделями каталога.

GPT-5.5VSClaude Sonnet 4.6

GPT-5.5 vs Claude Sonnet 4.6: сравнение цен, лимитов контекста, выходных токенов, модальностей, бенчмарков и пригодности API для production.

Gemini 3.1 Pro PreviewVSClaude Opus 4.7

Gemini 3.1 Pro Preview vs Claude Opus 4.7: сравнение цен, лимитов контекста, выходных токенов, модальностей, бенчмарков и пригодности API для production.

DeepSeek V4 ProVSClaude Sonnet 4.6

DeepSeek V4 Pro vs Claude Sonnet 4.6: сравнение цен, лимитов контекста, выходных токенов, модальностей, бенчмарков и пригодности API для production.

GPT-5.5 ProVSClaude Opus 4.7

GPT-5.5 Pro vs Claude Opus 4.7: сравнение цен, лимитов контекста, выходных токенов, модальностей, бенчмарков и пригодности API для production.

GPT-5.5 ProVSGemini 3.1 Pro Preview

GPT-5.5 Pro vs Gemini 3.1 Pro Preview: сравнение цен, лимитов контекста, выходных токенов, модальностей, бенчмарков и пригодности API для production.

GPT-5.5 ProVSDeepSeek V4 Pro

GPT-5.5 Pro vs DeepSeek V4 Pro: сравнение цен, лимитов контекста, выходных токенов, модальностей, бенчмарков и пригодности API для production.

FAQ по каталогу моделей

Краткий гид по выбору, сравнению и использованию моделей из каталога TokenHub.

Как выбрать модель из списка?

Начните с вашей задачи. Используйте фильтры по провайдеру, тегам, типу эндпоинта и группе тарификации, затем сравните размер контекста, максимальный вывод, модальности и цены ввода или вывода.

Что означает эффективная цена?

Эффективная цена применяет коэффициент активной группы тарификации к данным цены модели. Это помогает оценить реальную стоимость ввода, вывода или запроса для выбранной группы.

Можно ли использовать эти модели через API?

Да. Откройте страницу модели, чтобы увидеть поддерживаемые типы эндпоинтов и ссылки на документацию. Доступность зависит от модели, провайдера и текущей конфигурации маршрутизации.

Почему важны окно контекста и максимальный вывод?

Окно контекста определяет, сколько промпта и истории диалога модель может прочитать. Максимальный вывод определяет объем одного ответа, что важно для длинных текстов, кода и документов.

Models

Популярные модели

Сравнение моделей

GPT-5.5VSClaude Sonnet 4.6

Gemini 3.1 Pro PreviewVSClaude Opus 4.7

DeepSeek V4 ProVSClaude Sonnet 4.6

GPT-5.5 ProVSClaude Opus 4.7

GPT-5.5 ProVSGemini 3.1 Pro Preview

GPT-5.5 ProVSDeepSeek V4 Pro

FAQ по каталогу моделей

Как выбрать модель из списка?

Что означает эффективная цена?

Можно ли использовать эти модели через API?

Почему важны окно контекста и максимальный вывод?