DeepSeek R1

deepseek-r1

DeepSeek R1 是 DeepSeek 的推理型模型,常被提到的特点是开放推理过程,以及在数学、逻辑和程式碼任務上的表现。它与 V3 一代共享大规模 MoE 的基础能力,但训练和產品定位更偏向向深度推理,而不是一般对话。適合需要拆解、验证和逐步求解的複雜问题。

最大上下文

128KToken

最大輸出

32.8KToken

發布日期

2025年1月20日

模態

DeepSeek R1 價格

輸入價格輸出價格快取讀取
$0.5714/M$2.2857/M$0.2286/M

DeepSeek R1 API

POST /v1/chat/completions

DeepSeek R1 基準測試

DeepSeek R1 (Jan '25)

12.6

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

15.9

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

68

/100

Artificial Analysis 數學能力指數

Artificial Analysis 數學推理評分

指數分數

知識與推理

MMLU-Pro

高難度多任務知識評測

84.4%

GPQA

高階科學問題求解

70.8%

HLE

廣泛專家級考試集合

9.3%

程式碼與工程

LiveCodeBench

近期程式題評測

61.7%

SciCode

科學計算程式碼挑戰

35.7%

Terminal-Bench Hard

高難度終端任務執行

6.1%

數學能力

MATH-500

高難度數學解題

96.6%

AIME

數學競賽題

68.3%

AIME 2025

數學競賽題

68%

指令遵循與 Agent 任務

IFBench

指令約束遵循

39.0%

AA-LCR

長上下文推理

52.3%

τ²-Bench

Agent 工作流程任務

11.4%

指標來源 Artificial Analysis

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

DeepSeek R1 常見問題

DeepSeek R1 的能力、適用情境、限制與 TokenHub 使用指南。

DeepSeek R1 為哪些任務而設計?+

DeepSeek R1 是 DeepSeek 針對開放權重的高強度推理任務推出的模型。

DeepSeek R1 什麼時候最有用?+

適合數學推理、程式碼推理、科學推理,尤其適合重視深度推理的情境。

DeepSeek R1 有何不同?+

核心優勢是以推理為核心的後訓練與開放釋出的權重。

使用 DeepSeek R1 時要注意什麼?+

深度推理可能增加回應時間與 Token 用量。 更重視需要最新能力時,可考慮 DeepSeek V4 Pro。

如何確認 DeepSeek R1 是否可用?+

使用 TokenHub 的精確識別碼;託管行為可能與自行託管不同。