DeepSeek R1

deepseek-r1

DeepSeek R1 是 DeepSeek 的推理型模型,常被提到的特点是开放推理过程,以及在数学、逻辑和代码任务上的表现。它与 V3 一代共享大规模 MoE 的基础能力,但训练和产品定位更偏向深度推理,而不是普通对话。适合需要拆解、验证和逐步求解的复杂问题。

最大上下文

128KToken

最大输出

32.8KToken

发布日期

2025年1月20日

模态

DeepSeek R1 价格

输入价格输出价格缓存读取
$0.5714/M$2.2857/M$0.2286/M

DeepSeek R1 API

POST /v1/chat/completions

DeepSeek R1 基准测试

DeepSeek R1 (Jan '25)

12.6

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

15.9

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

68

/100

Artificial Analysis 数学能力指数

Artificial Analysis 数学推理评分

指数分数

知识与推理

MMLU-Pro

高难度多任务知识评测

84.4%

GPQA

高阶科学问题求解

70.8%

HLE

广泛专家级考试集合

9.3%

代码与工程

LiveCodeBench

近期编程题评测

61.7%

SciCode

科学计算代码挑战

35.7%

Terminal-Bench Hard

高难度终端任务执行

6.1%

数学能力

MATH-500

高难度数学解题

96.6%

AIME

数学竞赛题

68.3%

AIME 2025

数学竞赛题

68%

指令遵循与 Agent 任务

IFBench

指令约束遵循

39.0%

AA-LCR

长上下文推理

52.3%

τ²-Bench

Agent 工作流任务

11.4%

指标来源 Artificial Analysis

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

DeepSeek R1 常见问题

DeepSeek R1 的能力、适用场景、限制和 TokenHub 使用指南。

DeepSeek R1 为哪些任务而设计?+

DeepSeek R1 是 DeepSeek 面向开放权重的高强度推理任务的模型。

DeepSeek R1 什么时候最有用?+

适合数学推理、代码推理、科学推理,尤其适合重视深度推理的场景。

DeepSeek R1 有何不同?+

核心优势是面向推理的后训练和开放发布的权重。

使用 DeepSeek R1 时要注意什么?+

深度推理可能增加响应时间和 Token 消耗。 更看重需要最新能力时,可考虑 DeepSeek V4 Pro。

如何确认 DeepSeek R1 是否可用?+

使用 TokenHub 的精确标识符;托管行为可能与自托管不同。