POST /v1/chat/completionsDeepSeek R1
deepseek-r1DeepSeek R1 是 DeepSeek 的推理型模型,常被提到的特点是开放推理过程,以及在数学、逻辑和代码任务上的表现。它与 V3 一代共享大规模 MoE 的基础能力,但训练和产品定位更偏向深度推理,而不是普通对话。适合需要拆解、验证和逐步求解的复杂问题。
最大上下文
128KToken
最大输出
32.8KToken
发布日期
2025年1月20日
模态
DeepSeek R1 价格
| 输入价格 | 输出价格 | 缓存读取 |
|---|---|---|
| $0.5714/M | $2.2857/M | $0.2286/M |
DeepSeek R1 API
DeepSeek R1 基准测试
DeepSeek R1 (Jan '25)
12.6
/100
Artificial Analysis 综合能力指数
Artificial Analysis 综合能力评分
指数分数
15.9
/100
Artificial Analysis 代码能力指数
Artificial Analysis 软件任务评分
指数分数
68
/100
Artificial Analysis 数学能力指数
Artificial Analysis 数学推理评分
指数分数
知识与推理
MMLU-Pro
高难度多任务知识评测
84.4%
GPQA
高阶科学问题求解
70.8%
HLE
广泛专家级考试集合
9.3%
代码与工程
LiveCodeBench
近期编程题评测
61.7%
SciCode
科学计算代码挑战
35.7%
Terminal-Bench Hard
高难度终端任务执行
6.1%
数学能力
MATH-500
高难度数学解题
96.6%
AIME
数学竞赛题
68.3%
AIME 2025
数学竞赛题
68%
指令遵循与 Agent 任务
IFBench
指令约束遵循
39.0%
AA-LCR
长上下文推理
52.3%
τ²-Bench
Agent 工作流任务
11.4%
指标来源 Artificial Analysis
DeepSeek R1 常见问题
DeepSeek R1 的能力、适用场景、限制和 TokenHub 使用指南。
DeepSeek R1 为哪些任务而设计?+
DeepSeek R1 是 DeepSeek 面向开放权重的高强度推理任务的模型。
DeepSeek R1 什么时候最有用?+
适合数学推理、代码推理、科学推理,尤其适合重视深度推理的场景。
DeepSeek R1 有何不同?+
核心优势是面向推理的后训练和开放发布的权重。
使用 DeepSeek R1 时要注意什么?+
深度推理可能增加响应时间和 Token 消耗。 更看重需要最新能力时,可考虑 DeepSeek V4 Pro。
如何确认 DeepSeek R1 是否可用?+
使用 TokenHub 的精确标识符;托管行为可能与自托管不同。
媒体与讨论
精选与此模型相关的公开视频和帖子。
X (Twitter)
Reddit
YouTube