DeepSeek V3

deepseek-v3

DeepSeek V3 是 V3 系列的通用 MoE 基座模型,常见官方資料描述为 671B 總參數、37B 啟用參數。技术报告強調 MLA、DeepSeekMoE、高效训练,以及较强的通用语言和程式碼能力。在模型列表中,它更適合作为 DeepSeek 的通用对话与程式碼基线模型,而不是单纯的深度推理专用模型。

模態

DeepSeek V3 價格

輸入價格輸出價格快取讀取
$0.2857/M$1.1429/M$0.1143/M

DeepSeek V3 API

POST /v1/chat/completions

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

DeepSeek V3 常見問題

DeepSeek V3 的能力、適用情境、限制與 TokenHub 使用指南。

DeepSeek V3 在系列中扮演什麼角色?+

DeepSeek V3 是 DeepSeek 針對開放權重的通用文字、程式開發與推理任務推出的模型。

使用 DeepSeek V3 時先試什麼?+

適合一般對話、複雜程式開發、自行託管部署,尤其適合重視部署控制權的情境。

為什麼選擇 DeepSeek V3?+

核心優勢是開放權重與高效率的 MoE 架構。

選擇 DeepSeek V3 有什麼取捨?+

它屬於較早世代,可能缺少後續模型的新能力。 更重視需要最新能力時,可考慮 DeepSeek V4 Pro。

如何在 TokenHub 中開始使用?+

使用 TokenHub 的精確識別碼;託管行為可能與自行託管不同。