Qwen3.6 Flash

Name: Qwen3.6 Flash model details and pricing dataset
Creator: TokenHub

qwen3.6-flash

Qwen3.6 Flash 是 Qwen3.6 系列中更强调速度的版本。相关来源提到它支持文本、图片和视频输入、Prompt Caching，以及 1M token 上下文窗口，这让它在快速模型里有较强的长上下文和多模态特征。它更适合高并发、多模态和长上下文任务中对速度与成本敏感的场景。

最大上下文

1MToken

最大输出

65.5KToken

发布日期

2026年4月27日

模态

Qwen3.6 Flash 价格

Token 阶梯	输入价格	输出价格	缓存创建 5m	缓存读取 5m
<=256K	$0.1714/M	$1.0286/M	$0.2143/M	$0.0171/M
>256K	$0.6857/M	$4.1143/M	$0.8571/M	$0.0686/M

POST /v1/chat/completions

Qwen 3.6 Flash 的能力、适用场景、限制和 TokenHub 使用指南。

Qwen 3.6 Flash 的定位是什么？+

Qwen 3.6 Flash 是 Alibaba Qwen 面向快速多模态理解和高并发任务的模型。

Qwen 3.6 Flash 在哪些场景最有价值？+

适合高并发请求、图像和视频理解、对响应速度敏感的应用，尤其适合重视吞吐量的场景。

Qwen 3.6 Flash 的实际优势是什么？+

核心优势是快速的多模态响应和完整的功能组合，并具备可在深度思考和直接回答之间切换的混合思考。

Qwen 3.6 Flash 最关键的限制是什么？+

它用部分峰值质量换取更好的速度或成本。更看重最高回答质量时，可考虑 Qwen 3.7 Plus。

如何稳妥接入 Qwen 3.6 Flash？+

使用 TokenHub 显示的精确标识符，并按账户文档确认当前功能。