DeepSeek V4 Pro

deepseek-v4-pro

DeepSeek V4 Pro 被描述为大规模 MoE 模型,拥有 1.6T 总参数与 49B 激活参数,并支持 1M token 上下文窗口,适合处理超长输入。官方和三方模型卡更强调它在高级推理、代码任务和长周期 Agent 工作流中的能力,而不是普通聊天。相比 V4 Flash,Pro 更偏能力上限,适合大型代码库分析、复杂研究资料综合、多步骤自动化等需要深度推理的任务。

最大上下文

1MToken

最大输出

384KToken

发布日期

2026年4月24日

模态

DeepSeek V4 Pro 价格

输入价格输出价格缓存读取
$1.8/M$3.5/M$0.015/M

DeepSeek V4 Pro API

openaiPOST /v1/chat/completions

DeepSeek V4 Pro 基准测试

40.8

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

43.2

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

GPQA

高阶科学问题求解

90.5%

HLE

广泛专家级考试集合

33.5%

代码与工程

SciCode

科学计算代码挑战

46.4%

Terminal-Bench Hard

高难度终端任务执行

41.7%

指令遵循与 Agent 任务

IFBench

指令约束遵循

71.3%

AA-LCR

长上下文推理

65%

τ²-Bench

Agent 工作流任务

94.2%

指标来源 Artificial Analysis

模型对比

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

DeepSeek V4 Pro 常见问题

DeepSeek V4 Pro 的能力、适用场景、限制和 TokenHub 使用指南。

DeepSeek V4 Pro 是什么模型?+

DeepSeek V4 Pro 是 DeepSeek 面向旗舰级推理、编程和智能体任务的模型。

哪些任务适合 DeepSeek V4 Pro?+

适合复杂编程、智能体流程、长上下文分析,尤其适合重视最高回答质量的场景。

DeepSeek V4 Pro 哪项能力最突出?+

核心优势是DeepSeek V4 系列中的高水平推理和智能体编程,并具备可切换的思考与非思考模式。

团队何时不该选 DeepSeek V4 Pro?+

它会使用更多计算,因此延迟和成本可能更高。 更看重响应速度和成本效率时,可考虑 DeepSeek V4 Flash。

调用 DeepSeek V4 Pro 前要确认什么?+

使用 TokenHub 显示的精确标识符,并按账户文档确认当前功能。