返回模型库
AL
阿里云
qwen-plus-flash

Qwen-Plus / Qwen-Flash

Plus 性价比之选,Flash 极速轻量版,高并发、低延迟,RAG 应用

参数量未公开披露上下文窗口未公开披露知识截止日期未公开披露

功能介绍

Qwen-Plus 与 Qwen-Flash 为互补档位:Plus 侧重日常负载的性价比,Flash 为极速轻量版,面向高并发与低延迟,二者均适用于 RAG 应用。

团队可在同一通义生态内将时延敏感的高 QPS 流量导向 Flash,将知识密集型、质量均衡的任务导向 Plus。

二者共同表明:RAG 与高并发服务无需旗舰定价亦可获得强劲实用表现,进一步印证相对较低成本的模型同样能够达到高性能。

适用场景

内容写作翻译任务数据分析