Models

Khám phá giá, năng lực, endpoint và phạm vi nhà cung cấp của mô hình AI trong một catalog sản xuất.

OpenAI

GPT-5.5

gpt-5.5

GPT-5.5 được các nguồn nhấn mạnh ở các điểm: frontier OpenAI model, stronger lập trình/nghiên cứu/phân tích dữ liệu profile. Giá trị chính của mô hình nằm ở broad professional intelligence and có cấu trúc công việc tri thức. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

1.1M

Đầu ra tối đa

128K

Ngày phát hành

23 thg 4, 2026

Đầu vào$5 / triệu token

Đầu ra$30 / triệu token

Đọc cache$0.5 / triệu token

DeepSeek

DeepSeek V4 Pro

deepseek-v4-pro

DeepSeek V4 Pro được các nguồn nhấn mạnh ở các điểm: MoE 1.6T tổng / 49B kích hoạt, 1M-token ngữ cảnh, hybrid ngữ cảnh dài attention. Giá trị chính của mô hình nằm ở nâng cao suy luận, lập trình, toàn bộ codebase phân tích and dài hạn quy trình agent. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

Đầu ra tối đa

384K

Ngày phát hành

24 thg 4, 2026

Đầu vào$1.8 / triệu token

Đầu ra$3.5 / triệu token

Đọc cache$0.015 / triệu token

DeepSeek

DeepSeek V4 Flash

deepseek-v4-flash

DeepSeek V4 Flash được các nguồn nhấn mạnh ở các điểm: MoE 284B tổng / 13B kích hoạt, 1M-token ngữ cảnh, suy luận tối ưu thông lượng. Giá trị chính của mô hình nằm ở khối lượng lớn lệnh gọi production, nhanh ngữ cảnh dài xử lý and nhạy cảm chi phí tự động hóa. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

Đầu ra tối đa

384K

Ngày phát hành

24 thg 4, 2026

Đầu vào$0.15 / triệu token

Đầu ra$0.3 / triệu token

Đọc cache$0.003 / triệu token

Alibaba

Qwen3.7 Plus

qwen3.7-plus

Qwen3.7 Plus được các nguồn nhấn mạnh ở các điểm: text+image input, vision-language upgrade, hybrid agent capability. Giá trị chính của mô hình nằm ở tác vụ GUI, điều hướng di động, tham chiếu hình ảnh quy trình and hiệu quả chi phí Qwen3.7 use. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

Đầu ra tối đa

64K

Ngày phát hành

2 thg 6, 2026

Đầu vào$0.2857 / triệu token

Đầu ra$1.1429 / triệu token

Đọc cache$0.0571 / triệu token

OpenAI

GPT-4.1

gpt-4.1

GPT-4.1 được các nguồn nhấn mạnh ở các điểm: improved lập trình, instruction following and long ngữ cảnh versus earlier GPT-4 generation. Giá trị chính của mô hình nằm ở công cụ lập trình viên, hỗ trợ lập trình and instruction-heavy tasks. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

Đầu ra tối đa

32.8K

Ngày phát hành

14 thg 4, 2025

Đầu vào$2 / triệu token

Đầu ra$8 / triệu token

Đọc cache$0.5 / triệu token

OpenAI

GPT-4.1 Mini

gpt-4.1-mini

GPT-4.1 Mini được các nguồn nhấn mạnh ở các điểm: nhanher/lower-cost GPT-4.1 variant. Giá trị chính của mô hình nằm ở khối lượng lớn developer features, có cấu trúc generation and trích xuất. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

Đầu ra tối đa

32.8K

Ngày phát hành

14 thg 4, 2025

Đầu vào$0.4 / triệu token

Đầu ra$1.6 / triệu token

Đọc cache$0.1 / triệu token

OpenAI

GPT-4o

gpt-4o

GPT-4o được các nguồn nhấn mạnh ở các điểm: đa phương thức GPT-4o flagship, text/image input and broad general intelligence. Giá trị chính của mô hình nằm ở vision-language applications, tương tác tự nhiên and general assistant tasks. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

128K

Đầu ra tối đa

16.4K

Ngày phát hành

13 thg 5, 2024

Đầu vào$2.5 / triệu token

Đầu ra$10 / triệu token

Đọc cache$1.25 / triệu token

OpenAI

GPT-4o Mini

gpt-4o-mini

GPT-4o Mini được các nguồn nhấn mạnh ở các điểm: small affordable GPT-4o model with text/image input and có cấu trúc output support. Giá trị chính của mô hình nằm ở lightweight đa phương thức production, fine-tuning, distillation and focused tasks. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

128K

Đầu ra tối đa

16.4K

Ngày phát hành

18 thg 7, 2024

Đầu vào$0.15 / triệu token

Đầu ra$0.6 / triệu token

Đọc cache$0.075 / triệu token

OpenAI

GPT-5.3 Chat

gpt-5.3-chat

gpt-5.3-chat là tên API của GPT-5.3 Instant, snapshot ChatGPT được thiết kế để hội thoại hằng ngày mượt hơn, trực tiếp hơn và hữu ích hơn. OpenAI mô tả phiên bản này là cải thiện độ chính xác, ngữ cảnh khi tìm kiếm web và nhịp hội thoại, đồng thời giảm các cảnh báo, vòng vo và cách diễn đạt quá thận trọng không cần thiết. Tài liệu API đánh dấu mô hình này là deprecated.

Ngữ cảnh tối đa

128K

Đầu ra tối đa

16.4K

Ngày phát hành

3 thg 3, 2026

Đầu vào$1.75 / triệu token

Đầu ra$14 / triệu token

Đọc cache$0.175 / triệu token

OpenAI

GPT-5.3 Codex

gpt-5.3-codex

gpt-5.3-codex là mô hình agentic coding của OpenAI cho Codex và các môi trường phát triển tương tự. Mô hình kết hợp năng lực kỹ thuật phần mềm tiên tiến với suy luận rộng hơn và kiến thức chuyên môn, hỗ trợ reasoning effort có thể cấu hình, cửa sổ ngữ cảnh 400K và tối đa 128K token đầu ra. OpenAI định vị nó vượt ra ngoài viết/review code, hướng tới thao tác máy tính, terminal workflow và tác vụ kỹ thuật dài hạn.

Ngữ cảnh tối đa

400K

Đầu ra tối đa

128K

Ngày phát hành

5 thg 2, 2026

Đầu vào$1.75 / triệu token

Đầu ra$14 / triệu token

Đọc cache$0.175 / triệu token

OpenAI

GPT-5.4

gpt-5.4

GPT-5.4 được các nguồn nhấn mạnh ở các điểm: frontier work model, native computer use, tài liệu/bảng tính/thuyết trình, large ngữ cảnh. Giá trị chính của mô hình nằm ở professional productivity, lập trình, phân tích thực kiện and real work execution. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

1.1M

Đầu ra tối đa

128K

Ngày phát hành

5 thg 3, 2026

Đầu vào$2.5 / triệu token

Đầu ra$15 / triệu token

Đọc cache$0.25 / triệu token

OpenAI

GPT-5.4 Mini

gpt-5.4-mini

GPT-5.4 Mini được các nguồn nhấn mạnh ở các điểm: smaller/nhanher GPT-5.4 variant with dùng công cụ and đa phương thức suy luận. Giá trị chính của mô hình nằm ở độ trễ thấp production tasks, sub-agent and well-scoped lập trình quy trình. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

400K

Đầu ra tối đa

128K

Ngày phát hành

17 thg 3, 2026

Đầu vào$0.75 / triệu token

Đầu ra$4.5 / triệu token

Đọc cache$0.075 / triệu token

OpenAI

GPT-5.4 Nano

gpt-5.4-nano

GPT-5.4 Nano được các nguồn nhấn mạnh ở các điểm: smallest/lowest-cost GPT-5.4 option. Giá trị chính của mô hình nằm ở phân loại, định tuyến, trích xuất and predictable khối lượng lớn generation. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

400K

Đầu ra tối đa

128K

Ngày phát hành

17 thg 3, 2026

Đầu vào$0.2 / triệu token

Đầu ra$1.25 / triệu token

Đọc cache$0.02 / triệu token

OpenAI

GPT-5.4 Pro

gpt-5.4-pro

GPT-5.4 Pro được các nguồn nhấn mạnh ở các điểm: higher-precision GPT-5.4 tier. Giá trị chính của mô hình nằm ở demanding phân tích, complex code and high-stakes professional outputs. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

1.1M

Đầu ra tối đa

128K

Ngày phát hành

5 thg 3, 2026

Đầu vào$30 / triệu token

Đầu ra$180 / triệu token

OpenAI

GPT-5.5 Pro

gpt-5.5-pro

GPT-5.5 Pro được các nguồn nhấn mạnh ở các điểm: higher-compute GPT-5.5 tier, precision-first suy luận. Giá trị chính của mô hình nằm ở difficult công việc chuyên nghiệp, lập trình, nghiên cứu, phân tích dữ liệu and nhiều tài liệu tasks. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

1.1M

Đầu ra tối đa

128K

Ngày phát hành

23 thg 4, 2026

Đầu vào$30 / triệu token

Đầu ra$180 / triệu token

Minimax

MiniMax M2.5

MiniMax-M2.5

MiniMax M2.5 được các nguồn nhấn mạnh ở các điểm: trained in complex digital environments, lập trình/search/office workflow emphasis. Giá trị chính của mô hình nằm ở real-world productivity, Word/Excel/PowerPoint tasks and agentic dùng công cụ. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

204.8K

Đầu ra tối đa

131.1K

Ngày phát hành

12 thg 2, 2026

Đầu vào$0.3 / triệu token

Đầu ra$1.2 / triệu token

Đọc cache$0.03 / triệu token

Minimax

MiniMax M2.7

MiniMax-M2.7

MiniMax M2.7 được các nguồn nhấn mạnh ở các điểm: multi-agent cộng tác, live gỡ lỗi, root-cause phân tích and office-document generation. Giá trị chính của mô hình nằm ở engineering productivity, mô hình tài chính and nhiều tài liệu quy trình. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

204.8K

Đầu ra tối đa

131.1K

Ngày phát hành

18 thg 3, 2026

Đầu vào$0.3 / triệu token

Đầu ra$1.2 / triệu token

Đọc cache$0.06 / triệu token

Minimax

MiniMax M3

MiniMax-M3

MiniMax M3 được các nguồn nhấn mạnh ở các điểm: 1M-token ngữ cảnh, MiniMax Sparse Attention, native đa phương thức foundation model. Giá trị chính của mô hình nằm ở dài hạn agents, lập trình, dùng công cụ and large-ngữ cảnh cộng tác. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

512K

Đầu ra tối đa

128K

Ngày phát hành

1 thg 6, 2026

Đầu vào$0.6 / triệu token

Đầu ra$2.4 / triệu token

Đọc cache$0.12 / triệu token

Anthropic

Claude Fable 5

claude-fable-5

Claude Fable 5 được các nguồn nhấn mạnh ở các điểm: Mythos-level Claude model, long-running autonomy, memory and sub-agent work. Giá trị chính của mô hình nằm ở dự án lớn, tự chủ công việc tri thức, lập trình, vision and project cộng tác. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

Đầu ra tối đa

128K

Ngày phát hành

9 thg 6, 2026

Đầu vào$10 / triệu token

Đầu ra$50 / triệu token

Đọc cache$1 / triệu token

Anthropic

Claude Haiku 4.5

claude-haiku-4.5

Claude Haiku 4.5 được các nguồn nhấn mạnh ở các điểm: nhanh and cost-efficient Claude model with strong lập trình/computer-use results. Giá trị chính của mô hình nằm ở agent phản hồi nhanh, production hội thoại and high-frequency work tasks. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

200K

Đầu ra tối đa

64K

Ngày phát hành

15 thg 10, 2025

Đầu vào$1 / triệu token

Đầu ra$5 / triệu token

Đọc cache$0.1 / triệu token

Anthropic

Claude Opus 4.5

claude-opus-4.5

Claude Opus 4.5 được các nguồn nhấn mạnh ở các điểm: premium Opus 4 generation model with suy luận, lập trình and agentic work profile. Giá trị chính của mô hình nằm ở công việc chuyên sâu, thực thi đáng tin cậy and difficult knowledge tasks. Vì vậy phần mô tả nên tập trung vào điểm khác biệt riêng của mô hình thay vì viết như một chatbot phổ thông.

Ngữ cảnh tối đa

200K

Đầu ra tối đa

64K

Ngày phát hành

24 thg 11, 2025

Đầu vào$5 / triệu token

Đầu ra$25 / triệu token

Đọc cache$0.5 / triệu token

Gợi ý mô hình phổ biến

Bắt đầu với các mô hình nổi bật trong danh mục trực tiếp, rồi mở trang chi tiết để so sánh context, endpoint và giá hiệu dụng.

OpenAI

GPT-5.5

Ngữ cảnh tối đa

1.1M

Giá đầu vào

$5 / triệu token

Xem mô hình

DeepSeek

DeepSeek V4 Pro

Ngữ cảnh tối đa

Giá đầu vào

$1.8 / triệu token

Xem mô hình

DeepSeek

DeepSeek V4 Flash

Ngữ cảnh tối đa

Giá đầu vào

$0.15 / triệu token

Xem mô hình

Alibaba

Qwen3.7 Plus

Ngữ cảnh tối đa

Giá đầu vào

$0.2857 / triệu token

Xem mô hình

OpenAI

GPT-4.1

Ngữ cảnh tối đa

Giá đầu vào

$2 / triệu token

Xem mô hình

OpenAI

GPT-4.1 Mini

Ngữ cảnh tối đa

Giá đầu vào

$0.4 / triệu token

Xem mô hình

So sánh mô hình

So sánh nhanh với các mô hình lân cận được chọn trong danh mục.

GPT-5.5VSClaude Sonnet 4.6

GPT-5.5 vs Claude Sonnet 4.6 so sánh giá, giới hạn ngữ cảnh, token đầu ra, modality, benchmark và mức phù hợp API cho ứng dụng AI sản xuất.

Gemini 3.1 Pro PreviewVSClaude Opus 4.7

Gemini 3.1 Pro Preview vs Claude Opus 4.7 so sánh giá, giới hạn ngữ cảnh, token đầu ra, modality, benchmark và mức phù hợp API cho ứng dụng AI sản xuất.

DeepSeek V4 ProVSClaude Sonnet 4.6

DeepSeek V4 Pro vs Claude Sonnet 4.6 so sánh giá, giới hạn ngữ cảnh, token đầu ra, modality, benchmark và mức phù hợp API cho ứng dụng AI sản xuất.

GPT-5.5 ProVSClaude Opus 4.7

GPT-5.5 Pro vs Claude Opus 4.7 so sánh giá, giới hạn ngữ cảnh, token đầu ra, modality, benchmark và mức phù hợp API cho ứng dụng AI sản xuất.

GPT-5.5 ProVSGemini 3.1 Pro Preview

GPT-5.5 Pro vs Gemini 3.1 Pro Preview so sánh giá, giới hạn ngữ cảnh, token đầu ra, modality, benchmark và mức phù hợp API cho ứng dụng AI sản xuất.

GPT-5.5 ProVSDeepSeek V4 Pro

GPT-5.5 Pro vs DeepSeek V4 Pro so sánh giá, giới hạn ngữ cảnh, token đầu ra, modality, benchmark và mức phù hợp API cho ứng dụng AI sản xuất.

FAQ danh mục mô hình

Hướng dẫn nhanh để chọn, so sánh và sử dụng mô hình trong danh mục TokenHub.

Nên chọn mô hình trong danh sách này như thế nào?

Hãy bắt đầu từ workload của bạn. Dùng bộ lọc theo nhà cung cấp, tag, loại endpoint và nhóm tính phí, sau đó so sánh context, giới hạn output, modality và giá input hoặc output.

Giá hiệu dụng nghĩa là gì?

Giá hiệu dụng áp dụng tỷ lệ của nhóm tính phí hiện tại vào dữ liệu giá của mô hình. Nó giúp ước tính chi phí input, output hoặc mỗi request thực tế cho nhóm bạn đang dùng.

Có thể dùng các mô hình này qua API endpoint không?

Có. Mở trang chi tiết mô hình để xem loại endpoint được hỗ trợ và liên kết tài liệu. Khả dụng có thể khác nhau theo mô hình, nhà cung cấp và cấu hình routing hiện tại.

Vì sao context window và max output quan trọng?

Context window quyết định lượng prompt và lịch sử hội thoại mà mô hình có thể đọc. Max output quyết định lượng nội dung có thể tạo trong một phản hồi, quan trọng với viết dài, coding và tài liệu.