Qwen3.5 Flash

Name: Qwen3.5 Flash model details and pricing dataset
Creator: TokenHub

qwen3.5-flash

Qwen3.5 Flash 是 Qwen3.5 原生视觉语言系列中的高效版本。阿里云模型列表将 Flash 定位为面向简单任务的快速、低成本选项，同时继承了 3.5 一代的多模态方向。它适合信息抽取、请求路由、轻量内容生成和高频调用。

最大上下文

262.1KToken

最大输出

65.5KToken

发布日期

2026年2月23日

模态

Qwen3.5 Flash 价格

Token 阶梯	输入价格	输出价格	缓存创建 5m	缓存读取 5m
<=128K	$0.0286/M	$0.2857/M	$0.0357/M	$0.0029/M
128K-256K	$0.1143/M	$1.1429/M	$0.1429/M	$0.0114/M
>256K	$0.1714/M	$1.7143/M	$0.2143/M	$0.0171/M

POST /v1/chat/completions

Qwen 3.5 Flash 的能力、适用场景、限制和 TokenHub 使用指南。

Qwen 3.5 Flash 在系列中是什么角色？+

Qwen 3.5 Flash 是 Alibaba Qwen 面向快速多模态理解和高并发任务的模型。

使用 Qwen 3.5 Flash 时先试什么？+

适合高并发请求、图像和视频理解、通用对话，尤其适合重视响应速度和成本效率的场景。

为什么选择 Qwen 3.5 Flash？+

核心优势是快速多模态运行，并接近 Plus 级综合表现，并具备可在深度思考和直接回答之间切换的混合思考。

选择 Qwen 3.5 Flash 有什么取舍？+

它属于较早一代，可能缺少后续模型的新能力。更看重需要最新能力时，可考虑 Qwen 3.6 Flash。

如何在 TokenHub 中开始使用？+

使用 TokenHub 显示的精确标识符，并按账户文档确认当前功能。