POST /v1/chat/completionsDeepSeek V4 Flash
deepseek-v4-flashDeepSeek V4 Flash 保留了 V4 系列的 1M token 長上下文能力,但採用更輕量的 MoE 配置,常见模型卡描述为 284B 總參數、13B 啟用參數。它的重點不是最大推理深度,而是更快推理、更低調用成本和更適合生產環境的吞吐量。对于高頻請求、批次處理和長上下文但不一定需要最高推理强度的任務,Flash 会比 Pro 更合适。
最大上下文
1MToken
最大輸出
384KToken
發布日期
2026年4月24日
模態
DeepSeek V4 Flash 價格
| 輸入價格 | 輸出價格 | 快取讀取 |
|---|---|---|
| $0.15/M | $0.3/M | $0.003/M |
DeepSeek V4 Flash API
DeepSeek V4 Flash 基準測試
40.3
/100
Artificial Analysis 綜合能力指數
Artificial Analysis 綜合能力評分
指數分數
38.7
/100
Artificial Analysis 程式碼能力指數
Artificial Analysis 軟體任務評分
指數分數
知識與推理
GPQA
高階科學問題求解
89.4%
HLE
廣泛專家級考試集合
32.1%
程式碼與工程
SciCode
科學計算程式碼挑戰
44.9%
Terminal-Bench Hard
高難度終端任務執行
35.6%
指令遵循與 Agent 任務
IFBench
指令約束遵循
79.2%
AA-LCR
長上下文推理
63%
τ²-Bench
Agent 工作流程任務
95.0%
指標來源 Artificial Analysis
模型比較
DeepSeek V4 Flash 相關文章
DeepSeek V4 Flash 常見問題
DeepSeek V4 Flash 的能力、適用情境、限制與 TokenHub 使用指南。
DeepSeek V4 Flash 的定位是什麼?+
DeepSeek V4 Flash 是 DeepSeek 針對快速且高效率的推理與代理任務推出的模型。
DeepSeek V4 Flash 在哪些情境最有價值?+
適合重視回應速度的應用、代理流程、大量呼叫,尤其適合重視回應速度與成本效益的情境。
DeepSeek V4 Flash 的實際優勢是什麼?+
核心優勢是較小的規模,以及更快速、更具成本效益的推理,並具備可切換的思考與非思考模式。
DeepSeek V4 Flash 最關鍵的限制是什麼?+
在最困難的推理與工程任務上,它的能力上限較低。 更重視最高回應品質時,可考慮 DeepSeek V4 Pro。
如何穩妥整合 DeepSeek V4 Flash?+
使用 TokenHub 顯示的精確識別碼,並依帳戶文件確認目前功能。
媒體與討論
精選與此模型相關的公開影片和貼文。
X (Twitter)
Reddit
YouTube