DeepSeek V4 Flash

deepseek-v4-flash

DeepSeek V4 Flash 保留了 V4 系列的 1M token 长上下文能力,但采用更轻量的 MoE 配置,常见模型卡描述为 284B 总参数、13B 激活参数。它的重点不是最大推理深度,而是更快推理、更低调用成本和更适合生产环境的吞吐量。对于高频请求、批量处理和长上下文但不一定需要最高推理强度的任务,Flash 会比 Pro 更合适。

最大上下文

1MToken

最大输出

384KToken

发布日期

2026年4月24日

模态

DeepSeek V4 Flash 价格

输入价格输出价格缓存读取
$0.15/M$0.3/M$0.003/M

DeepSeek V4 Flash API

openaiPOST /v1/chat/completions

DeepSeek V4 Flash 基准测试

40.3

/100

Artificial Analysis 综合能力指数

Artificial Analysis 综合能力评分

指数分数

38.7

/100

Artificial Analysis 代码能力指数

Artificial Analysis 软件任务评分

指数分数

知识与推理

GPQA

高阶科学问题求解

89.4%

HLE

广泛专家级考试集合

32.1%

代码与工程

SciCode

科学计算代码挑战

44.9%

Terminal-Bench Hard

高难度终端任务执行

35.6%

指令遵循与 Agent 任务

IFBench

指令约束遵循

79.2%

AA-LCR

长上下文推理

63%

τ²-Bench

Agent 工作流任务

95.0%

指标来源 Artificial Analysis

模型对比

DeepSeek V4 Flash 相关文章

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

DeepSeek V4 Flash 常见问题

DeepSeek V4 Flash 的能力、适用场景、限制和 TokenHub 使用指南。

DeepSeek V4 Flash 的定位是什么?+

DeepSeek V4 Flash 是 DeepSeek 面向快速、高效的推理和智能体任务的模型。

DeepSeek V4 Flash 在哪些场景最有价值?+

适合对响应速度敏感的应用、智能体流程、高并发请求,尤其适合重视响应速度和成本效率的场景。

DeepSeek V4 Flash 的实际优势是什么?+

核心优势是更小的规模和更快、更经济的推理,并具备可切换的思考与非思考模式。

DeepSeek V4 Flash 最关键的限制是什么?+

在最难的推理和工程任务上,它的能力上限较低。 更看重最高回答质量时,可考虑 DeepSeek V4 Pro。

如何稳妥接入 DeepSeek V4 Flash?+

使用 TokenHub 显示的精确标识符,并按账户文档确认当前功能。