一个 API Key 接入主流 AI 模型

通过兼容 OpenAI 的统一网关调用 GPT、Claude、Gemini、DeepSeek 等模型，计费、路由和模型发现都在一个工作台完成。

开始使用探索模型

在一个模型聚合平台浏览主流供应商

OpenAI

Gemini

Claude

DeepSeek

Bytedance

ElevenLabs

Minimax

Kling

Vidu

Grok

Wan

Runway

OpenAI

Gemini

Claude

DeepSeek

Bytedance

ElevenLabs

Minimax

Kling

Vidu

Grok

Wan

Runway

精选模型

从 TokenHub 模型中心精选近期值得关注的前沿模型。

查看全部模型

OpenAI

GPT-5.5

gpt-5.5

GPT-5.5 被 OpenAI 描述为更智能的前沿模型，面向代码、研究、数据分析和专业知识工作。官方发布信息强调它在能力、速度和文档/结构化分析任务上的提升。它的描述应聚焦广泛的专业智能，而不是某一个单一细分场景。

最大上下文

1.1M

最大输出

128K

发布日期

2026年4月23日

输入$5 / 百万 Token

输出$30 / 百万 Token

缓存读取$0.5 / 百万 Token

Google

Gemini 3.1 Pro Preview

gemini-3.1-pro-preview

Gemini 3.1 Pro Preview 被介绍为对 Gemini 3 Pro 的可靠性增强版本。Google 预览说明强调更好的思考能力、token 效率、grounding、事实性、软件工程、Agentic Tool Use 和多步骤执行。由于是 Preview，描述中应体现它是用于测试下一阶段 Pro 能力的高级但仍在演进的模型。

最大上下文

最大输出

65.5K

发布日期

2026年2月19日

输入$2 / 百万 Token

输出$12 / 百万 Token

缓存读取$0.2 / 百万 Token

Anthropic

Claude Opus 4.7 Fast

claude-opus-4.7-fast

Claude Opus 4.7 Fast 是 Opus 4.7 的快速模式版本。三方模型卡将它描述为保留 Opus 4.7 的高级推理和工程能力，同时以更高成本换取更快速度。它适合需要 Opus 级自主能力，但产品交互对延迟敏感的场景。

最大上下文

最大输出

128K

发布日期

2026年4月16日

输入$30 / 百万 Token

输出$150 / 百万 Token

缓存读取$3 / 百万 Token

用一个目录接入文本以外的能力

在 AI 模型中心评估聊天、视觉、图像、视频和语音模型，不必在多个供应商控制台之间来回切换。

图像

视觉与图像模型

在同一个 API 市场选择图像生成和视觉理解模型，和语言模型共用一套接入方式。

视频

视频生成任务

把创意视频和产品视频任务发送到网关托管端点，开发接口保持一致。

音频

语音与音频能力

用和 LLM 工作流相同的运营层接入语音合成、转写和音频理解模型。

从选模型到发出第一条请求

在 API 市场挑选模型、充值余额，再通过统一 API 接入应用。少写供应商分支，把时间留给产品本身。

进入工作台

创建工作台

为你的团队设置 TokenHub 工作台。

邮箱地址Google / 邮箱

充值统一余额

一份余额即可覆盖已支持的供应商、模型和环境。

$20$100$500

签发网关 Key

创建统一 API Key，让请求通过 TokenHub 自动路由。

API_KEY可开始集成

统一模型接入的运营层

当团队需要比较供应商、统一接入规范、快速上线 AI 功能时，统一 API 平台能减少重复集成和后续维护成本。

网关级路由

通过 LLM API 网关把流量送到合适的供应商路径，同时让文本、视觉和 Agent 场景保持一致的请求格式。

探索路由

选模型不用堆适配器

团队可以在同一目录里比较成本、能力和可用性，再决定把哪些模型接入生产流量。

比较模型

面向 B2B 团队的集成控制

面向 B2B 集成的统一 API 帮助产品团队统一 Key、环境、计费和供应商访问，加快客户交付。

阅读集成文档

integration.ts

import { OpenAI } from "openai";

const client = new OpenAI({
  baseURL: 'https://us-api.tokenhub.com/v1',
  apiKey: process.env.TOKENHUB_API_KEY,
});

const response = await client.chat.completions.create({
  model: 'llama-3-70b-instruct',
  messages: [{ role: 'user', content: 'Optimize this logic.' }],
});

输出生成耗时 2.3 秒

保留现有 SDK 灵活切换模型路径

TokenHub 提供由 LLM API 网关支撑的 OpenAI 兼容 API。切换模型家族时，通常只需要改配置，不必重写调用代码。

生成 API Key 比较价格

路由流量前先看清价格

模型进入生产环境前，先比较不同供应商的 Token 成本和生成成本。

查看全部模型

模型名称模态输入输出缓存读取上下文窗口发布日期

OpenAI

GPT-4.1gpt-4.1

$2$8$0.51M2025年4月14日

OpenAI

GPT-4.1 Minigpt-4.1-mini

$0.4$1.6$0.11M2025年4月14日

OpenAI

GPT-5.5gpt-5.5

$5$30$0.51.1M2026年4月23日

DeepSeek

DeepSeek V4 Flashdeepseek-v4-flash

$0.15$0.3$0.0031M2026年4月24日

DeepSeek

DeepSeek V4 Prodeepseek-v4-pro

$1.8$3.5$0.0151M2026年4月24日

Alibaba

Qwen3.7 Plusqwen3.7-plus

$0.2857$1.1429$0.05711M2026年6月2日

让团队少做模型运营杂活

“我们的评测框架继续保持 OpenAI 兼容，产品团队也能通过一个网关测试多个供应商。”

David Chen

Northstar AI 平台负责人

“API 市场让供应商比较真正落地。上线前，我们能先看清成本、端点和模型适配度。”

Sarah Jenkins

AI 基础设施工程师

“TokenHub 给了我们一套面向 B2B 集成的统一 API。客户指定不同模型供应商时，交付速度明显更快。”

Marcus Row

RelayWorks 创始人

标准化模型接入前团队常问的问题

TokenHub 和单一供应商 API 有什么不同

TokenHub 把 API 市场、路由网关和统一计费放在一起。团队可以跨供应商调用模型，不用为每家供应商单独维护一套集成。

现有 OpenAI SDK 代码还能继续使用吗

可以。TokenHub 提供 OpenAI 兼容 API。替换 base URL 和 API Key 后，就能继续使用熟悉的聊天补全请求方式。

TokenHub 如何帮助 B2B 产品团队

团队可以通过一个统一 API 标准化模型访问、按环境签发 Key，并支持客户指定的供应商选择。

费用在哪里管理

在工作台充值余额即可。用量按模型和请求类型计费，财务和工程团队都能在同一个 API 中枢查看模型支出。