DeepSeek R1

Name: DeepSeek R1 model details and pricing dataset
Creator: TokenHub

deepseek-r1

DeepSeek R1 是 DeepSeek 的推理型模型，常被提到的特点是开放推理过程，以及在数学、逻辑和程式碼任務上的表现。它与 V3 一代共享大规模 MoE 的基础能力，但训练和產品定位更偏向向深度推理，而不是一般对话。適合需要拆解、验证和逐步求解的複雜问题。

最大上下文

128KToken

最大輸出

32.8KToken

發布日期

2025年1月20日

模態

DeepSeek R1 價格

輸入價格	輸出價格	快取讀取
$0.5714/M	$2.2857/M	$0.2286/M

DeepSeek R1 API

POST /v1/chat/completions

DeepSeek R1 基準測試

DeepSeek R1 (Jan '25)

12.6

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

15.9

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

/100

Artificial Analysis 數學能力指數

Artificial Analysis 數學推理評分

指數分數

知識與推理

MMLU-Pro

高難度多任務知識評測

84.4%

GPQA

高階科學問題求解

70.8%

HLE

廣泛專家級考試集合

9.3%

程式碼與工程

LiveCodeBench

近期程式題評測

61.7%

SciCode

科學計算程式碼挑戰

35.7%

Terminal-Bench Hard

高難度終端任務執行

6.1%

數學能力

MATH-500

高難度數學解題

96.6%

AIME

數學競賽題

68.3%

AIME 2025

數學競賽題

68%

指令遵循與 Agent 任務

IFBench

指令約束遵循

39.0%

AA-LCR

長上下文推理

52.3%

τ²-Bench

Agent 工作流程任務

11.4%

指標來源 Artificial Analysis

DeepSeek R1 常見問題

DeepSeek R1 的能力、適用情境、限制與 TokenHub 使用指南。

DeepSeek R1 為哪些任務而設計？+

DeepSeek R1 是 DeepSeek 針對開放權重的高強度推理任務推出的模型。

DeepSeek R1 什麼時候最有用？+

適合數學推理、程式碼推理、科學推理，尤其適合重視深度推理的情境。

DeepSeek R1 有何不同？+

核心優勢是以推理為核心的後訓練與開放釋出的權重。

使用 DeepSeek R1 時要注意什麼？+

深度推理可能增加回應時間與 Token 用量。更重視需要最新能力時，可考慮 DeepSeek V4 Pro。

如何確認 DeepSeek R1 是否可用？+

使用 TokenHub 的精確識別碼；託管行為可能與自行託管不同。

DeepSeek R1

DeepSeek R1 價格

DeepSeek R1 API

DeepSeek R1 基準測試

相關模型

相關模型

媒體與討論

X (Twitter)

Reddit

YouTube

DeepSeek R1 常見問題

相關模型