DeepSeek V4 Flash

deepseek-v4-flash

DeepSeek V4 Flash 保留了 V4 系列的 1M token 長上下文能力,但採用更輕量的 MoE 配置,常见模型卡描述为 284B 總參數、13B 啟用參數。它的重點不是最大推理深度,而是更快推理、更低調用成本和更適合生產環境的吞吐量。对于高頻請求、批次處理和長上下文但不一定需要最高推理强度的任務,Flash 会比 Pro 更合适。

最大上下文

1MToken

最大輸出

384KToken

發布日期

2026年4月24日

模態

DeepSeek V4 Flash 價格

輸入價格輸出價格快取讀取
$0.15/M$0.3/M$0.003/M

DeepSeek V4 Flash API

openaiPOST /v1/chat/completions

DeepSeek V4 Flash 基準測試

40.3

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

38.7

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

知識與推理

GPQA

高階科學問題求解

89.4%

HLE

廣泛專家級考試集合

32.1%

程式碼與工程

SciCode

科學計算程式碼挑戰

44.9%

Terminal-Bench Hard

高難度終端任務執行

35.6%

指令遵循與 Agent 任務

IFBench

指令約束遵循

79.2%

AA-LCR

長上下文推理

63%

τ²-Bench

Agent 工作流程任務

95.0%

指標來源 Artificial Analysis

模型比較

DeepSeek V4 Flash 相關文章

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

DeepSeek V4 Flash 常見問題

DeepSeek V4 Flash 的能力、適用情境、限制與 TokenHub 使用指南。

DeepSeek V4 Flash 的定位是什麼?+

DeepSeek V4 Flash 是 DeepSeek 針對快速且高效率的推理與代理任務推出的模型。

DeepSeek V4 Flash 在哪些情境最有價值?+

適合重視回應速度的應用、代理流程、大量呼叫,尤其適合重視回應速度與成本效益的情境。

DeepSeek V4 Flash 的實際優勢是什麼?+

核心優勢是較小的規模,以及更快速、更具成本效益的推理,並具備可切換的思考與非思考模式。

DeepSeek V4 Flash 最關鍵的限制是什麼?+

在最困難的推理與工程任務上,它的能力上限較低。 更重視最高回應品質時,可考慮 DeepSeek V4 Pro。

如何穩妥整合 DeepSeek V4 Flash?+

使用 TokenHub 顯示的精確識別碼,並依帳戶文件確認目前功能。