DeepSeek V3

deepseek-v3

DeepSeek V3 是 V3 系列的通用 MoE 基座模型,常见官方资料描述为 671B 总参数、37B 激活参数。技术报告强调 MLA、DeepSeekMoE、高效训练,以及较强的通用语言和代码能力。在模型列表中,它更适合作为 DeepSeek 的通用对话与代码基线模型,而不是单纯的深度推理专用模型。

模态

DeepSeek V3 价格

输入价格输出价格缓存读取
$0.2857/M$1.1429/M$0.1143/M

DeepSeek V3 API

POST /v1/chat/completions

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

DeepSeek V3 常见问题

DeepSeek V3 的能力、适用场景、限制和 TokenHub 使用指南。

DeepSeek V3 在系列中是什么角色?+

DeepSeek V3 是 DeepSeek 面向开放权重的通用文本、编程和推理任务的模型。

使用 DeepSeek V3 时先试什么?+

适合通用对话、复杂编程、自托管部署,尤其适合重视部署控制权的场景。

为什么选择 DeepSeek V3?+

核心优势是开放权重和高效的 MoE 架构。

选择 DeepSeek V3 有什么取舍?+

它属于较早一代,可能缺少后续模型的新能力。 更看重需要最新能力时,可考虑 DeepSeek V4 Pro。

如何在 TokenHub 中开始使用?+

使用 TokenHub 的精确标识符;托管行为可能与自托管不同。