POST /v1/chat/completionsDeepSeek V3
deepseek-v3DeepSeek V3 是 V3 系列的通用 MoE 基座模型,常见官方资料描述为 671B 总参数、37B 激活参数。技术报告强调 MLA、DeepSeekMoE、高效训练,以及较强的通用语言和代码能力。在模型列表中,它更适合作为 DeepSeek 的通用对话与代码基线模型,而不是单纯的深度推理专用模型。
模态
DeepSeek V3 价格
| 输入价格 | 输出价格 | 缓存读取 |
|---|---|---|
| $0.2857/M | $1.1429/M | $0.1143/M |
DeepSeek V3 API
DeepSeek V3 常见问题
DeepSeek V3 的能力、适用场景、限制和 TokenHub 使用指南。
DeepSeek V3 在系列中是什么角色?+
DeepSeek V3 是 DeepSeek 面向开放权重的通用文本、编程和推理任务的模型。
使用 DeepSeek V3 时先试什么?+
适合通用对话、复杂编程、自托管部署,尤其适合重视部署控制权的场景。
为什么选择 DeepSeek V3?+
核心优势是开放权重和高效的 MoE 架构。
选择 DeepSeek V3 有什么取舍?+
它属于较早一代,可能缺少后续模型的新能力。 更看重需要最新能力时,可考虑 DeepSeek V4 Pro。
如何在 TokenHub 中开始使用?+
使用 TokenHub 的精确标识符;托管行为可能与自托管不同。
媒体与讨论
精选与此模型相关的公开视频和帖子。
X (Twitter)
Reddit
YouTube