POST /v1/chat/completionsQwen3.6 Flash
qwen3.6-flashQwen3.6 Flash 是 Qwen3.6 系列中更强调速度的版本。相关来源提到它支持文本、图片和视频输入、Prompt Caching,以及 1M token 上下文窗口,这让它在快速模型里有较强的长上下文和多模态特征。它更适合高并发、多模态和长上下文任务中对速度与成本敏感的场景。
最大上下文
1MToken
最大输出
65.5KToken
发布日期
2026年4月27日
模态
Qwen3.6 Flash 价格
| Token 阶梯 | 输入价格 | 输出价格 | 缓存创建 5m | 缓存读取 5m |
|---|---|---|---|---|
| <=256K | $0.1714/M | $1.0286/M | $0.2143/M | $0.0171/M |
| >256K | $0.6857/M | $4.1143/M | $0.8571/M | $0.0686/M |
Qwen3.6 Flash API
Qwen 3.6 Flash 常见问题
Qwen 3.6 Flash 的能力、适用场景、限制和 TokenHub 使用指南。
Qwen 3.6 Flash 的定位是什么?+
Qwen 3.6 Flash 是 Alibaba Qwen 面向快速多模态理解和高并发任务的模型。
Qwen 3.6 Flash 在哪些场景最有价值?+
适合高并发请求、图像和视频理解、对响应速度敏感的应用,尤其适合重视吞吐量的场景。
Qwen 3.6 Flash 的实际优势是什么?+
核心优势是快速的多模态响应和完整的功能组合,并具备可在深度思考和直接回答之间切换的混合思考。
Qwen 3.6 Flash 最关键的限制是什么?+
它用部分峰值质量换取更好的速度或成本。 更看重最高回答质量时,可考虑 Qwen 3.7 Plus。
如何稳妥接入 Qwen 3.6 Flash?+
使用 TokenHub 显示的精确标识符,并按账户文档确认当前功能。
媒体与讨论
精选与此模型相关的公开视频和帖子。
X (Twitter)
Reddit