POST /v1/chat/completionsQwen3.5 Flash
qwen3.5-flashQwen3.5 Flash 是 Qwen3.5 原生视觉语言系列中的高效版本。阿里云模型列表将 Flash 定位为面向简单任务的快速、低成本选项,同时继承了 3.5 一代的多模态方向。它适合信息抽取、请求路由、轻量内容生成和高频调用。
最大上下文
262.1KToken
最大输出
65.5KToken
发布日期
2026年2月23日
模态
Qwen3.5 Flash 价格
| Token 阶梯 | 输入价格 | 输出价格 | 缓存创建 5m | 缓存读取 5m |
|---|---|---|---|---|
| <=128K | $0.0286/M | $0.2857/M | $0.0357/M | $0.0029/M |
| 128K-256K | $0.1143/M | $1.1429/M | $0.1429/M | $0.0114/M |
| >256K | $0.1714/M | $1.7143/M | $0.2143/M | $0.0171/M |
Qwen3.5 Flash API
Qwen 3.5 Flash 常见问题
Qwen 3.5 Flash 的能力、适用场景、限制和 TokenHub 使用指南。
Qwen 3.5 Flash 在系列中是什么角色?+
Qwen 3.5 Flash 是 Alibaba Qwen 面向快速多模态理解和高并发任务的模型。
使用 Qwen 3.5 Flash 时先试什么?+
适合高并发请求、图像和视频理解、通用对话,尤其适合重视响应速度和成本效率的场景。
为什么选择 Qwen 3.5 Flash?+
核心优势是快速多模态运行,并接近 Plus 级综合表现,并具备可在深度思考和直接回答之间切换的混合思考。
选择 Qwen 3.5 Flash 有什么取舍?+
它属于较早一代,可能缺少后续模型的新能力。 更看重需要最新能力时,可考虑 Qwen 3.6 Flash。
如何在 TokenHub 中开始使用?+
使用 TokenHub 显示的精确标识符,并按账户文档确认当前功能。
媒体与讨论
精选与此模型相关的公开视频和帖子。
X (Twitter)
Reddit
YouTube