模型廣場

在一個生產級目錄中查看 AI 模型價格、能力、端點和供應商覆蓋。

OpenAI

GPT-5.5

gpt-5.5

GPT-5.5 被 OpenAI 描述为更智能的前沿模型，面向程式碼、研究、数据分析和專業知識工作。官方發布信息強調它在能力、速度和文件/结构化分析任務上的提升。它的描述应聚焦广泛的專業智能，而不是某一个单一细分場景。

最大上下文

1.1M

最大輸出

128K

發布日期

2026年4月23日

輸入$5 / 百萬 Token

輸出$30 / 百萬 Token

快取讀取$0.5 / 百萬 Token

DeepSeek

DeepSeek V4 Pro

deepseek-v4-pro

DeepSeek V4 Pro 被描述為大规模 MoE 模型，拥有 1.6T 總參數与 49B 啟用參數，并支援 1M token 上下文窗口，適合處理超長輸入。官方和第三方模型卡更強調它在高階推理、程式碼任務和長周期 Agent 工作流程中的能力，而不是一般聊天。相較於 V4 Flash，Pro 更偏向能力上限，適合大型程式碼库分析、複雜研究資料整合、多步驟自動化等需要深度推理的任務。

最大上下文

最大輸出

384K

發布日期

2026年4月24日

輸入$1.8 / 百萬 Token

輸出$3.5 / 百萬 Token

快取讀取$0.015 / 百萬 Token

DeepSeek

DeepSeek V4 Flash

deepseek-v4-flash

DeepSeek V4 Flash 保留了 V4 系列的 1M token 長上下文能力，但採用更輕量的 MoE 配置，常见模型卡描述为 284B 總參數、13B 啟用參數。它的重點不是最大推理深度，而是更快推理、更低調用成本和更適合生產環境的吞吐量。对于高頻請求、批次處理和長上下文但不一定需要最高推理强度的任務，Flash 会比 Pro 更合适。

最大上下文

最大輸出

384K

發布日期

2026年4月24日

輸入$0.15 / 百萬 Token

輸出$0.3 / 百萬 Token

快取讀取$0.003 / 百萬 Token

Alibaba

Qwen3.7 Plus

qwen3.7-plus

Qwen3.7 Plus 延续 Qwen3.7 面向 Agent 的设计方向，但更偏向性价比。第三方模型卡描述它支援文字和圖片輸入，并强化視覺语言能力，以及 GUI、移动端导航、視覺参考等混合 Agent 任務。它適合需要 Qwen3.7 新一代能力，但不一定需要 Max 档位成本的場景。

最大上下文

最大輸出

64K

發布日期

2026年6月2日

輸入$0.2857 / 百萬 Token

輸出$1.1429 / 百萬 Token

快取讀取$0.0571 / 百萬 Token

OpenAI

GPT-4.1

gpt-4.1

GPT-4.1 是 OpenAI 強調程式碼、指令遵循和長上下文能力提升的一代模型。官方發布信息将它描述为在许多编程和指令密集型任務上强于 GPT-4o 的開發者模型。它的描述应突出程式碼可靠性和長上下文理解。

最大上下文

最大輸出

32.8K

發布日期

2025年4月14日

輸入$2 / 百萬 Token

輸出$8 / 百萬 Token

快取讀取$0.5 / 百萬 Token

OpenAI

GPT-4.1 Mini

gpt-4.1-mini

GPT-4.1 Mini 将 GPT-4.1 系列的程式碼和指令遵循能力，以更快、更低成本的形式提供出来。它適合高頻開發者工具、结构化生成、信息擷取，以及不需要完整大模型能力的產品功能。它的核心差异是保留 4.1 一代任務纪律性的同时提升生產效率。

最大上下文

最大輸出

32.8K

發布日期

2025年4月14日

輸入$0.4 / 百萬 Token

輸出$1.6 / 百萬 Token

快取讀取$0.1 / 百萬 Token

OpenAI

GPT-4o

gpt-4o

GPT-4o 是 OpenAI GPT-4o 一代的多模态旗舰模型，支援文字和圖像輸入，并具备较强的通用智能。官方文件将它描述为適合广泛语言与視覺任務的高智能通用模型。在更看重多模态理解和自然交互，而不是最新推理栈的場景中，它仍然有价值。

最大上下文

128K

最大輸出

16.4K

發布日期

2024年5月13日

輸入$2.5 / 百萬 Token

輸出$10 / 百萬 Token

快取讀取$1.25 / 百萬 Token

OpenAI

GPT-4o Mini

gpt-4o-mini

GPT-4o Mini 是 GPT-4o 家族中的快速、低成本小模型。OpenAI 文件将其定位为面向聚焦任務的模型，支援文字和圖像輸入、结构化輸出、微调和蒸馏工作流程。它更適合被介绍为輕量级多模态生產模型，而不是 GPT-4o 的简单缩小版。

最大上下文

128K

最大輸出

16.4K

發布日期

2024年7月18日

輸入$0.15 / 百萬 Token

輸出$0.6 / 百萬 Token

快取讀取$0.075 / 百萬 Token

OpenAI

GPT-5.3 Chat

gpt-5.3-chat

gpt-5.3-chat 是 GPT-5.3 Instant 在 API 中的模型名稱，主要對應 ChatGPT 中用於日常對話的快照版本。OpenAI 對該版本的定位是讓一般對話更流暢、更直接、更有幫助，並提升答案準確性、聯網搜尋時的上下文組織能力，同時減少不必要的聲明、繞行表達與過度謹慎措辭。需要注意的是，官方 API 文件已將該模型標記為 deprecated，更推薦使用更新的 GPT 模型。

最大上下文

128K

最大輸出

16.4K

發布日期

2026年3月3日

輸入$1.75 / 百萬 Token

輸出$14 / 百萬 Token

快取讀取$0.175 / 百萬 Token

OpenAI

GPT-5.3 Codex

gpt-5.3-codex

gpt-5.3-codex 是 OpenAI 面向 Codex 與類似開發環境的 Agentic Coding 模型。它將前沿軟體工程能力與更廣泛的推理和專業知識能力結合起來，支援可配置的 reasoning effort，並在官方模型頁中列出 400K 上下文窗口與 128K 最大輸出。OpenAI 對它的定位不只是寫程式和審查程式，而是進一步支援電腦使用、終端任務、Web 應用迭代與長週期真實工程任務。

最大上下文

400K

最大輸出

128K

發布日期

2026年2月5日

輸入$1.75 / 百萬 Token

輸出$14 / 百萬 Token

快取讀取$0.175 / 百萬 Token

OpenAI

GPT-5.4

gpt-5.4

GPT-5.4 被 OpenAI 定位为兼具能力和效率的前沿模型，面向專業工作。官方資料強調程式碼、原生運算机使用、表格/文件/演示文稿工作流程、事實性改进和大上下文能力。它適合被介绍为把推理能力和真實生產力任務连接起来的实用工作模型。

最大上下文

1.1M

最大輸出

128K

發布日期

2026年3月5日

輸入$2.5 / 百萬 Token

輸出$15 / 百萬 Token

快取讀取$0.25 / 百萬 Token

OpenAI

GPT-5.4 Mini

gpt-5.4-mini

GPT-5.4 Mini 是 GPT-5.4 家族中更小、更快的版本。OpenAI 文件将 mini 模型定位为低延遲工作负载，同时保留程式碼、工具調用、多模态推理和较强指令遵循。它適合边界清晰的生產任務、子 Agent，以及需要大量快速調用的应用。

最大上下文

400K

最大輸出

128K

發布日期

2026年3月17日

輸入$0.75 / 百萬 Token

輸出$4.5 / 百萬 Token

快取讀取$0.075 / 百萬 Token

OpenAI

GPT-5.4 Nano

gpt-5.4-nano

GPT-5.4 Nano 是 GPT-5.4 中成本最低、体量最小的版本，適合大量简单任務。OpenAI 的模型說明将 nano 模型与低延遲和成本效率关联，而不是最大推理深度。它更適合分類、路由、擷取、輕量生成等可预测工作流程。

最大上下文

400K

最大輸出

128K

發布日期

2026年3月17日

輸入$0.2 / 百萬 Token

輸出$1.25 / 百萬 Token

快取讀取$0.02 / 百萬 Token

OpenAI

GPT-5.4 Pro

gpt-5.4-pro

GPT-5.4 Pro 是 GPT-5.4 中更強調精度和輸出品質的高阶版本，面向要求更高的專業任務。OpenAI 的模型說明将 Pro 与标准版区分在更强推理和更高準確性预期上。在模型列表中，它適合被描述為複雜分析、高难度程式碼和高要求知識工作的选择。

最大上下文

1.1M

最大輸出

128K

發布日期

2026年3月5日

輸入$30 / 百萬 Token

輸出$180 / 百萬 Token

OpenAI

GPT-5.5 Pro

gpt-5.5-pro

GPT-5.5 Pro 是 OpenAI GPT-5.5 一代中使用更多運算资源的高阶版本，適合答案品質比速度更重要的高难度專業任務。OpenAI 資料将 Pro 档描述为会“思考得更深”，在程式碼、研究、数据分析和文件密集型工作中追求更高精度。它应被定位为面向複雜推理和專業交付的模型，而不是日常聊天模型。

最大上下文

1.1M

最大輸出

128K

發布日期

2026年4月23日

輸入$30 / 百萬 Token

輸出$180 / 百萬 Token

Minimax

MiniMax M2.5

MiniMax-M2.5

MiniMax M2.5 被定位为面向真實生產力場景的模型，并在複雜数字環境中训练。官方資料強調它在程式碼、Agentic Tool Use、搜尋和辦公任務上的提升，把早期程式碼能力扩展到 Word、Excel、PowerPoint 等工作流程。它的重點不是单纯语言流畅度，而是在複雜实际流程中的执行能力。

最大上下文

204.8K

最大輸出

131.1K

發布日期

2026年2月12日

輸入$0.3 / 百萬 Token

輸出$1.2 / 百萬 Token

快取讀取$0.03 / 百萬 Token

Minimax

MiniMax M2.7

MiniMax-M2.7

MiniMax M2.7 被介绍为面向生產力和工程任務的模型，強調自主工作流程、多 Agent 協作、实时调试和文件交付。公开描述提到根因分析、财务建模，以及 Word/Excel/PowerPoint 类完整文件生成。它更適合被写成“应用型工作模型”，而不是一般聊天或写作模型。

最大上下文

204.8K

最大輸出

131.1K

發布日期

2026年3月18日

輸入$0.3 / 百萬 Token

輸出$1.2 / 百萬 Token

快取讀取$0.06 / 百萬 Token

Minimax

MiniMax M3

MiniMax-M3

MiniMax M3 被描述為前沿多模态基座模型，支援 1M token 上下文，面向長周期 Agent 工作、程式碼任務和工具調用。模型卡強調 MiniMax Sparse Attention，以及相較於上一代在超長上下文成本上的显著降低。它更適合作为面向生產環境的多模态 Agent 模型，用于大上下文、軟體任務和協作工作流程。

最大上下文

512K

最大輸出

128K

發布日期

2026年6月1日

輸入$0.6 / 百萬 Token

輸出$2.4 / 百萬 Token

快取讀取$0.12 / 百萬 Token

Anthropic

Claude Fable 5

claude-fable-5

Claude Fable 5 被介绍为 Mythos 级别的 Claude 模型，面向更有野心、持续时间更長的项目。相关页面強調自主知識工作、軟體工程、視覺、记忆，以及与子 Agent 协同長时间工作的能力。它的描述应更像“项目级協作者”，而不是短轮次助手。

最大上下文

最大輸出

128K

發布日期

2026年6月9日

輸入$10 / 百萬 Token

輸出$50 / 百萬 Token

快取讀取$1 / 百萬 Token

Anthropic

Claude Haiku 4.5

claude-haiku-4.5

Claude Haiku 4.5 是 Anthropic 更快、更具成本效率的模型，但在程式碼、運算机使用和 Agent 任務上表现很强。官方資料将部分能力与早期 Sonnet 级表现进行对比，同时強調速度和价格优势。它適合被描述為面向快速 Agent 应用的紧凑型生產模型。

最大上下文

200K

最大輸出

64K

發布日期

2025年10月15日

輸入$1 / 百萬 Token

輸出$5 / 百萬 Token

快取讀取$0.1 / 百萬 Token

Anthropic

Claude Opus 4.5

claude-opus-4.5

Claude Opus 4.5 属于 Claude Opus 4 一代的高能力模型，模型卡強調困难推理、程式碼和 Agentic Work。它虽然低于更新的 Opus 版本，但仍代表当代 Claude 的高端能力档位。描述时不应把它写成一般聊天模型，而应強調深度工作和可靠性。

最大上下文

200K

最大輸出

64K

發布日期

2025年11月24日

輸入$5 / 百萬 Token

輸出$25 / 百萬 Token

快取讀取$0.5 / 百萬 Token

模型比較

與選定的相鄰目錄模型快速比較。

GPT-5.5VSClaude Sonnet 4.6

GPT-5.5 vs Claude Sonnet 4.6 模型比較涵蓋價格、上下文限制、輸出 token、模態、基準表現和生產 API 適配。

Gemini 3.1 Pro PreviewVSClaude Opus 4.7

Gemini 3.1 Pro Preview vs Claude Opus 4.7 模型比較涵蓋價格、上下文限制、輸出 token、模態、基準表現和生產 API 適配。

DeepSeek V4 ProVSClaude Sonnet 4.6

DeepSeek V4 Pro vs Claude Sonnet 4.6 模型比較涵蓋價格、上下文限制、輸出 token、模態、基準表現和生產 API 適配。

GPT-5.5 ProVSClaude Opus 4.7

GPT-5.5 Pro vs Claude Opus 4.7 模型比較涵蓋價格、上下文限制、輸出 token、模態、基準表現和生產 API 適配。

GPT-5.5 ProVSGemini 3.1 Pro Preview

GPT-5.5 Pro vs Gemini 3.1 Pro Preview 模型比較涵蓋價格、上下文限制、輸出 token、模態、基準表現和生產 API 適配。

GPT-5.5 ProVSDeepSeek V4 Pro

GPT-5.5 Pro vs DeepSeek V4 Pro 模型比較涵蓋價格、上下文限制、輸出 token、模態、基準表現和生產 API 適配。

模型目錄常見問題

快速了解如何在 TokenHub 目錄中選擇、比較和使用模型。

應該如何從列表中選擇模型？

先看你的具體任務。可以按供應商、標籤、端點類型和計費分組篩選，再比較上下文長度、最大輸出、模態能力以及輸入或輸出價格。

實際價格是什麼意思？

實際價格會把目前計費分組倍率套用到模型價格資料上，幫助你估算所使用分組下真實的輸入、輸出或按次呼叫成本。

這些模型都可以透過 API 端點使用嗎？

可以進入模型詳情頁查看支援的端點類型和文件連結。可用性會因模型、供應商和目前路由配置而不同。

為什麼上下文窗口和最大輸出很重要？

上下文窗口決定模型能讀取多少提示詞和對話歷史；最大輸出決定單次回應能生成多少內容，對長文寫作、程式碼和文件任務尤其重要。

模型廣場

熱門模型推薦

模型比較

GPT-5.5VSClaude Sonnet 4.6

Gemini 3.1 Pro PreviewVSClaude Opus 4.7

DeepSeek V4 ProVSClaude Sonnet 4.6

GPT-5.5 ProVSClaude Opus 4.7

GPT-5.5 ProVSGemini 3.1 Pro Preview

GPT-5.5 ProVSDeepSeek V4 Pro

模型目錄常見問題

應該如何從列表中選擇模型？

實際價格是什麼意思？

這些模型都可以透過 API 端點使用嗎？

為什麼上下文窗口和最大輸出很重要？