DeepSeek R1

Name: DeepSeek R1 model details and pricing dataset
Creator: TokenHub

deepseek-r1

DeepSeek R1 是 DeepSeek 的推理型模型，常被提到的特点是开放推理过程，以及在数学、逻辑和代码任务上的表现。它与 V3 一代共享大规模 MoE 的基础能力，但训练和产品定位更偏向深度推理，而不是普通对话。适合需要拆解、验证和逐步求解的复杂问题。

最大上下文

128KToken

最大输出

32.8KToken

发布日期

2025年1月20日

模态

DeepSeek R1 价格

输入价格	输出价格	缓存读取
$0.5714/M	$2.2857/M	$0.2286/M

DeepSeek R1 API

POST /v1/chat/completions

DeepSeek R1 基准测试

DeepSeek R1 (Jan '25)

12.6

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

15.9

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

/100

Artificial Analysis 数学能力指数

Artificial Analysis 数学推理评分

指数分数

知识与推理

MMLU-Pro

高难度多任务知识评测

84.4%

GPQA

高阶科学问题求解

70.8%

HLE

广泛专家级考试集合

9.3%

代码与工程

LiveCodeBench

近期编程题评测

61.7%

SciCode

科学计算代码挑战

35.7%

Terminal-Bench Hard

高难度终端任务执行

6.1%

数学能力

MATH-500

高难度数学解题

96.6%

AIME

数学竞赛题

68.3%

AIME 2025

数学竞赛题

68%

指令遵循与 Agent 任务

IFBench

指令约束遵循

39.0%

AA-LCR

长上下文推理

52.3%

τ²-Bench

Agent 工作流任务

11.4%

指标来源 Artificial Analysis

DeepSeek R1 常见问题

DeepSeek R1 的能力、适用场景、限制和 TokenHub 使用指南。

DeepSeek R1 为哪些任务而设计？+

DeepSeek R1 是 DeepSeek 面向开放权重的高强度推理任务的模型。

DeepSeek R1 什么时候最有用？+

适合数学推理、代码推理、科学推理，尤其适合重视深度推理的场景。

DeepSeek R1 有何不同？+

核心优势是面向推理的后训练和开放发布的权重。

使用 DeepSeek R1 时要注意什么？+

深度推理可能增加响应时间和 Token 消耗。更看重需要最新能力时，可考虑 DeepSeek V4 Pro。

如何确认 DeepSeek R1 是否可用？+

使用 TokenHub 的精确标识符；托管行为可能与自托管不同。

DeepSeek R1

DeepSeek R1 价格

DeepSeek R1 API

DeepSeek R1 基准测试

相关模型

相关模型

媒体与讨论

X (Twitter)

Reddit

YouTube

DeepSeek R1 常见问题

相关模型