Qwen3.6 Flash

qwen3.6-flash

Qwen3.6 Flash 是 Qwen3.6 系列中更强调速度的版本。相关来源提到它支持文本、图片和视频输入、Prompt Caching,以及 1M token 上下文窗口,这让它在快速模型里有较强的长上下文和多模态特征。它更适合高并发、多模态和长上下文任务中对速度与成本敏感的场景。

最大上下文

1MToken

最大输出

65.5KToken

发布日期

2026年4月27日

模态

Qwen3.6 Flash 价格

Token 阶梯输入价格输出价格缓存创建 5m缓存读取 5m
<=256K$0.1714/M$1.0286/M$0.2143/M$0.0171/M
>256K$0.6857/M$4.1143/M$0.8571/M$0.0686/M

Qwen3.6 Flash API

POST /v1/chat/completions

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

Qwen 3.6 Flash 常见问题

Qwen 3.6 Flash 的能力、适用场景、限制和 TokenHub 使用指南。

Qwen 3.6 Flash 的定位是什么?+

Qwen 3.6 Flash 是 Alibaba Qwen 面向快速多模态理解和高并发任务的模型。

Qwen 3.6 Flash 在哪些场景最有价值?+

适合高并发请求、图像和视频理解、对响应速度敏感的应用,尤其适合重视吞吐量的场景。

Qwen 3.6 Flash 的实际优势是什么?+

核心优势是快速的多模态响应和完整的功能组合,并具备可在深度思考和直接回答之间切换的混合思考。

Qwen 3.6 Flash 最关键的限制是什么?+

它用部分峰值质量换取更好的速度或成本。 更看重最高回答质量时,可考虑 Qwen 3.7 Plus。

如何稳妥接入 Qwen 3.6 Flash?+

使用 TokenHub 显示的精确标识符,并按账户文档确认当前功能。