Qwen3.5 Flash

qwen3.5-flash

Qwen3.5 Flash 是 Qwen3.5 原生视觉语言系列中的高效版本。阿里云模型列表将 Flash 定位为面向简单任务的快速、低成本选项,同时继承了 3.5 一代的多模态方向。它适合信息抽取、请求路由、轻量内容生成和高频调用。

最大上下文

262.1KToken

最大输出

65.5KToken

发布日期

2026年2月23日

模态

Qwen3.5 Flash 价格

Token 阶梯输入价格输出价格缓存创建 5m缓存读取 5m
<=128K$0.0286/M$0.2857/M$0.0357/M$0.0029/M
128K-256K$0.1143/M$1.1429/M$0.1429/M$0.0114/M
>256K$0.1714/M$1.7143/M$0.2143/M$0.0171/M

Qwen3.5 Flash API

POST /v1/chat/completions

媒体与讨论

精选与此模型相关的公开视频和帖子。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

Qwen 3.5 Flash 常见问题

Qwen 3.5 Flash 的能力、适用场景、限制和 TokenHub 使用指南。

Qwen 3.5 Flash 在系列中是什么角色?+

Qwen 3.5 Flash 是 Alibaba Qwen 面向快速多模态理解和高并发任务的模型。

使用 Qwen 3.5 Flash 时先试什么?+

适合高并发请求、图像和视频理解、通用对话,尤其适合重视响应速度和成本效率的场景。

为什么选择 Qwen 3.5 Flash?+

核心优势是快速多模态运行,并接近 Plus 级综合表现,并具备可在深度思考和直接回答之间切换的混合思考。

选择 Qwen 3.5 Flash 有什么取舍?+

它属于较早一代,可能缺少后续模型的新能力。 更看重需要最新能力时,可考虑 Qwen 3.6 Flash。

如何在 TokenHub 中开始使用?+

使用 TokenHub 显示的精确标识符,并按账户文档确认当前功能。