Models

Изучайте цены, возможности, конечные точки и покрытие поставщиков ИИ-моделей в одном производственном каталоге.

OpenAI

GPT-5.5

gpt-5.5

GPT-5.5 в источниках выделяется следующими характеристиками: frontier OpenAI model, stronger программирование/исследования/анализ данных profile. Основная ценность модели связана с broad professional intelligence and структурированный работа со знаниями. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1.1M

Максимальный вывод

128K

Дата выпуска

23 апр. 2026 г.

Вход$5 / млн токенов
Выход$30 / млн токенов
Чтение кэша$0.5 / млн токенов

DeepSeek

DeepSeek V4 Pro

deepseek-v4-pro

DeepSeek V4 Pro в источниках выделяется следующими характеристиками: MoE 1.6T всего / 49B активных, 1M-token контекст, hybrid длинный контекст attention. Основная ценность модели связана с продвинутое рассуждение, программирование, вся кодовая база анализ and долгосрочные агентные рабочие процессы. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Максимальный вывод

384K

Дата выпуска

24 апр. 2026 г.

Вход$1.8 / млн токенов
Выход$3.5 / млн токенов
Чтение кэша$0.015 / млн токенов

DeepSeek

DeepSeek V4 Flash

deepseek-v4-flash

DeepSeek V4 Flash в источниках выделяется следующими характеристиками: MoE 284B всего / 13B активных, 1M-token контекст, инференс, ориентированный на пропускную способность. Основная ценность модели связана с высокий объем производственные вызовы, быстрая длинный контекст обработка and чувствительные к стоимости автоматизация. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Максимальный вывод

384K

Дата выпуска

24 апр. 2026 г.

Вход$0.15 / млн токенов
Выход$0.3 / млн токенов
Чтение кэша$0.003 / млн токенов

Alibaba

Qwen3.7 Plus

qwen3.7-plus

Qwen3.7 Plus в источниках выделяется следующими характеристиками: text+image input, vision-language upgrade, hybrid agent capability. Основная ценность модели связана с GUI-задачи, мобильная навигация, визуальные референсы рабочие процессы and экономичный Qwen3.7 use. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Максимальный вывод

64K

Дата выпуска

2 июн. 2026 г.

Вход$0.2857 / млн токенов
Выход$1.1429 / млн токенов
Чтение кэша$0.0571 / млн токенов

OpenAI

GPT-4.1

gpt-4.1

GPT-4.1 в источниках выделяется следующими характеристиками: improved программирование, instruction following and long контекст versus earlier GPT-4 generation. Основная ценность модели связана с инструменты разработчика, помощь в программировании and instruction-heavy tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Максимальный вывод

32.8K

Дата выпуска

14 апр. 2025 г.

Вход$2 / млн токенов
Выход$8 / млн токенов
Чтение кэша$0.5 / млн токенов

OpenAI

GPT-4.1 Mini

gpt-4.1-mini

GPT-4.1 Mini в источниках выделяется следующими характеристиками: быстраяer/lower-cost GPT-4.1 variant. Основная ценность модели связана с высокий объем developer features, структурированный generation and извлечение. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Максимальный вывод

32.8K

Дата выпуска

14 апр. 2025 г.

Вход$0.4 / млн токенов
Выход$1.6 / млн токенов
Чтение кэша$0.1 / млн токенов

OpenAI

GPT-4o

gpt-4o

GPT-4o в источниках выделяется следующими характеристиками: мультимодальный GPT-4o flagship, text/image input and broad general intelligence. Основная ценность модели связана с vision-language applications, естественное взаимодействие and general assistant tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

128K

Максимальный вывод

16.4K

Дата выпуска

13 мая 2024 г.

Вход$2.5 / млн токенов
Выход$10 / млн токенов
Чтение кэша$1.25 / млн токенов

OpenAI

GPT-4o Mini

gpt-4o-mini

GPT-4o Mini в источниках выделяется следующими характеристиками: small affordable GPT-4o model with text/image input and структурированный output support. Основная ценность модели связана с lightweight мультимодальный production, дообучение, дистилляция and focused tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

128K

Максимальный вывод

16.4K

Дата выпуска

18 июл. 2024 г.

Вход$0.15 / млн токенов
Выход$0.6 / млн токенов
Чтение кэша$0.075 / млн токенов

OpenAI

GPT-5.3 Chat

gpt-5.3-chat

gpt-5.3-chat — API-название GPT-5.3 Instant, снимка модели ChatGPT для более плавных и полезных повседневных диалогов. OpenAI описывает обновление как улучшение точности ответов, контекстуализации веб-поиска и естественности общения, с меньшим количеством лишних оговорок и чрезмерно осторожных формулировок. В API-документации модель отмечена как устаревшая в пользу более новых GPT-моделей.

Максимальный контекст

128K

Максимальный вывод

16.4K

Дата выпуска

3 мар. 2026 г.

Вход$1.75 / млн токенов
Выход$14 / млн токенов
Чтение кэша$0.175 / млн токенов

OpenAI

GPT-5.3 Codex

gpt-5.3-codex

gpt-5.3-codex — агентная кодовая модель OpenAI для Codex и похожих сред разработки. Она объединяет передовые возможности software engineering с более широким рассуждением и профессиональными знаниями, поддерживает настраиваемый reasoning effort, контекст 400K и максимальный вывод 128K токенов. OpenAI позиционирует ее не только для написания и ревью кода, но и для работы с компьютером, терминалом и долгими инженерными задачами.

Максимальный контекст

400K

Максимальный вывод

128K

Дата выпуска

5 февр. 2026 г.

Вход$1.75 / млн токенов
Выход$14 / млн токенов
Чтение кэша$0.175 / млн токенов

OpenAI

GPT-5.4

gpt-5.4

GPT-5.4 в источниках выделяется следующими характеристиками: frontier work model, native computer use, документы/таблицы/презентации, large контекст. Основная ценность модели связана с professional productivity, программирование, фактологический анализ and real work execution. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1.1M

Максимальный вывод

128K

Дата выпуска

5 мар. 2026 г.

Вход$2.5 / млн токенов
Выход$15 / млн токенов
Чтение кэша$0.25 / млн токенов

OpenAI

GPT-5.4 Mini

gpt-5.4-mini

GPT-5.4 Mini в источниках выделяется следующими характеристиками: smaller/быстраяer GPT-5.4 variant with использование инструментов and мультимодальный рассуждение. Основная ценность модели связана с низкая задержка production tasks, субагенты and well-scoped программирование рабочие процессы. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

400K

Максимальный вывод

128K

Дата выпуска

17 мар. 2026 г.

Вход$0.75 / млн токенов
Выход$4.5 / млн токенов
Чтение кэша$0.075 / млн токенов

OpenAI

GPT-5.4 Nano

gpt-5.4-nano

GPT-5.4 Nano в источниках выделяется следующими характеристиками: smallest/lowest-cost GPT-5.4 option. Основная ценность модели связана с классификация, маршрутизация, извлечение and predictable высокий объем generation. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

400K

Максимальный вывод

128K

Дата выпуска

17 мар. 2026 г.

Вход$0.2 / млн токенов
Выход$1.25 / млн токенов
Чтение кэша$0.02 / млн токенов

OpenAI

GPT-5.4 Pro

gpt-5.4-pro

GPT-5.4 Pro в источниках выделяется следующими характеристиками: higher-precision GPT-5.4 tier. Основная ценность модели связана с demanding анализ, complex code and high-stakes professional outputs. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1.1M

Максимальный вывод

128K

Дата выпуска

5 мар. 2026 г.

Вход$30 / млн токенов
Выход$180 / млн токенов

OpenAI

GPT-5.5 Pro

gpt-5.5-pro

GPT-5.5 Pro в источниках выделяется следующими характеристиками: higher-compute GPT-5.5 tier, precision-first рассуждение. Основная ценность модели связана с difficult профессиональная работа, программирование, исследования, анализ данных and документоемкие tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1.1M

Максимальный вывод

128K

Дата выпуска

23 апр. 2026 г.

Вход$30 / млн токенов
Выход$180 / млн токенов

Minimax

MiniMax M2.5

MiniMax-M2.5

MiniMax M2.5 в источниках выделяется следующими характеристиками: trained in complex digital environments, программирование/search/office workflow emphasis. Основная ценность модели связана с real-world productivity, Word/Excel/PowerPoint tasks and agentic использование инструментов. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

204.8K

Максимальный вывод

131.1K

Дата выпуска

12 февр. 2026 г.

Вход$0.3 / млн токенов
Выход$1.2 / млн токенов
Чтение кэша$0.03 / млн токенов

Minimax

MiniMax M2.7

MiniMax-M2.7

MiniMax M2.7 в источниках выделяется следующими характеристиками: multi-agent сотрудничество, live отладка, root-cause анализ and office-document generation. Основная ценность модели связана с engineering productivity, финансовое моделирование and документоемкие рабочие процессы. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

204.8K

Максимальный вывод

131.1K

Дата выпуска

18 мар. 2026 г.

Вход$0.3 / млн токенов
Выход$1.2 / млн токенов
Чтение кэша$0.06 / млн токенов

Minimax

MiniMax M3

MiniMax-M3

MiniMax M3 в источниках выделяется следующими характеристиками: 1M-token контекст, MiniMax Sparse Attention, native мультимодальный foundation model. Основная ценность модели связана с долгосрочные agents, программирование, использование инструментов and large-контекст сотрудничество. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

512K

Максимальный вывод

128K

Дата выпуска

1 июн. 2026 г.

Вход$0.6 / млн токенов
Выход$2.4 / млн токенов
Чтение кэша$0.12 / млн токенов

Anthropic

Claude Fable 5

claude-fable-5

Claude Fable 5 в источниках выделяется следующими характеристиками: Mythos-level Claude model, long-running autonomy, memory and sub-agent work. Основная ценность модели связана с амбициозные проекты, автономный работа со знаниями, программирование, vision and project сотрудничество. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Максимальный вывод

128K

Дата выпуска

9 июн. 2026 г.

Вход$10 / млн токенов
Выход$50 / млн токенов
Чтение кэша$1 / млн токенов

Anthropic

Claude Haiku 4.5

claude-haiku-4.5

Claude Haiku 4.5 в источниках выделяется следующими характеристиками: быстрая and cost-efficient Claude model with strong программирование/computer-use results. Основная ценность модели связана с быстрые агенты, production чат and high-frequency work tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

200K

Максимальный вывод

64K

Дата выпуска

15 окт. 2025 г.

Вход$1 / млн токенов
Выход$5 / млн токенов
Чтение кэша$0.1 / млн токенов

Anthropic

Claude Opus 4.5

claude-opus-4.5

Claude Opus 4.5 в источниках выделяется следующими характеристиками: premium Opus 4 generation model with рассуждение, программирование and agentic work profile. Основная ценность модели связана с глубокая работа, надежное выполнение and difficult knowledge tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

200K

Максимальный вывод

64K

Дата выпуска

24 нояб. 2025 г.

Вход$5 / млн токенов
Выход$25 / млн токенов
Чтение кэша$0.5 / млн токенов

Популярные модели

Начните с заметных моделей из live-каталога, а затем откройте страницу модели, чтобы сравнить контекст, эндпоинты и эффективную цену.

OpenAI

GPT-5.5

GPT-5.5 в источниках выделяется следующими характеристиками: frontier OpenAI model, stronger программирование/исследования/анализ данных profile. Основная ценность модели связана с broad professional intelligence and структурированный работа со знаниями. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1.1M

Цена входа

$5 / млн токенов

Открыть модель

DeepSeek

DeepSeek V4 Pro

DeepSeek V4 Pro в источниках выделяется следующими характеристиками: MoE 1.6T всего / 49B активных, 1M-token контекст, hybrid длинный контекст attention. Основная ценность модели связана с продвинутое рассуждение, программирование, вся кодовая база анализ and долгосрочные агентные рабочие процессы. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Цена входа

$1.8 / млн токенов

Открыть модель

DeepSeek

DeepSeek V4 Flash

DeepSeek V4 Flash в источниках выделяется следующими характеристиками: MoE 284B всего / 13B активных, 1M-token контекст, инференс, ориентированный на пропускную способность. Основная ценность модели связана с высокий объем производственные вызовы, быстрая длинный контекст обработка and чувствительные к стоимости автоматизация. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Цена входа

$0.15 / млн токенов

Открыть модель

Alibaba

Qwen3.7 Plus

Qwen3.7 Plus в источниках выделяется следующими характеристиками: text+image input, vision-language upgrade, hybrid agent capability. Основная ценность модели связана с GUI-задачи, мобильная навигация, визуальные референсы рабочие процессы and экономичный Qwen3.7 use. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Цена входа

$0.2857 / млн токенов

Открыть модель

OpenAI

GPT-4.1

GPT-4.1 в источниках выделяется следующими характеристиками: improved программирование, instruction following and long контекст versus earlier GPT-4 generation. Основная ценность модели связана с инструменты разработчика, помощь в программировании and instruction-heavy tasks. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Цена входа

$2 / млн токенов

Открыть модель

OpenAI

GPT-4.1 Mini

GPT-4.1 Mini в источниках выделяется следующими характеристиками: быстраяer/lower-cost GPT-4.1 variant. Основная ценность модели связана с высокий объем developer features, структурированный generation and извлечение. Поэтому в описании стоит подчеркнуть именно эти отличия, а не подавать модель как обычный универсальный чат-бот.

Максимальный контекст

1M

Цена входа

$0.4 / млн токенов

Открыть модель

Сравнение моделей

Быстрое сравнение с выбранными соседними моделями каталога.

FAQ по каталогу моделей

Краткий гид по выбору, сравнению и использованию моделей из каталога TokenHub.

Как выбрать модель из списка?

+

Начните с вашей задачи. Используйте фильтры по провайдеру, тегам, типу эндпоинта и группе тарификации, затем сравните размер контекста, максимальный вывод, модальности и цены ввода или вывода.

Что означает эффективная цена?

+

Эффективная цена применяет коэффициент активной группы тарификации к данным цены модели. Это помогает оценить реальную стоимость ввода, вывода или запроса для выбранной группы.

Можно ли использовать эти модели через API?

+

Да. Откройте страницу модели, чтобы увидеть поддерживаемые типы эндпоинтов и ссылки на документацию. Доступность зависит от модели, провайдера и текущей конфигурации маршрутизации.

Почему важны окно контекста и максимальный вывод?

+

Окно контекста определяет, сколько промпта и истории диалога модель может прочитать. Максимальный вывод определяет объем одного ответа, что важно для длинных текстов, кода и документов.