POST /v1/chat/completionsDeepSeek V4 Flash
deepseek-v4-flashDeepSeek V4 Flash 保留了 V4 系列的 1M token 长上下文能力,但采用更轻量的 MoE 配置,常见模型卡描述为 284B 总参数、13B 激活参数。它的重点不是最大推理深度,而是更快推理、更低调用成本和更适合生产环境的吞吐量。对于高频请求、批量处理和长上下文但不一定需要最高推理强度的任务,Flash 会比 Pro 更合适。
最大上下文
1MToken
最大输出
384KToken
发布日期
2026年4月24日
模态
DeepSeek V4 Flash 价格
| 输入价格 | 输出价格 | 缓存读取 |
|---|---|---|
| $0.15/M | $0.3/M | $0.003/M |
DeepSeek V4 Flash API
DeepSeek V4 Flash 基准测试
40.3
/100
Artificial Analysis 综合能力指数
Artificial Analysis 综合能力评分
指数分数
38.7
/100
Artificial Analysis 代码能力指数
Artificial Analysis 软件任务评分
指数分数
知识与推理
GPQA
高阶科学问题求解
89.4%
HLE
广泛专家级考试集合
32.1%
代码与工程
SciCode
科学计算代码挑战
44.9%
Terminal-Bench Hard
高难度终端任务执行
35.6%
指令遵循与 Agent 任务
IFBench
指令约束遵循
79.2%
AA-LCR
长上下文推理
63%
τ²-Bench
Agent 工作流任务
95.0%
指标来源 Artificial Analysis
模型对比
DeepSeek V4 Flash 相关文章
DeepSeek V4 Flash 常见问题
DeepSeek V4 Flash 的能力、适用场景、限制和 TokenHub 使用指南。
DeepSeek V4 Flash 的定位是什么?+
DeepSeek V4 Flash 是 DeepSeek 面向快速、高效的推理和智能体任务的模型。
DeepSeek V4 Flash 在哪些场景最有价值?+
适合对响应速度敏感的应用、智能体流程、高并发请求,尤其适合重视响应速度和成本效率的场景。
DeepSeek V4 Flash 的实际优势是什么?+
核心优势是更小的规模和更快、更经济的推理,并具备可切换的思考与非思考模式。
DeepSeek V4 Flash 最关键的限制是什么?+
在最难的推理和工程任务上,它的能力上限较低。 更看重最高回答质量时,可考虑 DeepSeek V4 Pro。
如何稳妥接入 DeepSeek V4 Flash?+
使用 TokenHub 显示的精确标识符,并按账户文档确认当前功能。
媒体与讨论
精选与此模型相关的公开视频和帖子。
X (Twitter)
Reddit
YouTube