千问Qwen3.5 Plus重磅发布:号称0.8元/百万Token,比Qwen3-plus贵了三倍多,性能登顶开源模型之巅

近日,阿里巴巴开源了全新一代大模型千问Qwen3.5-Plus,标志着其在人工智能领域取得了又一重大突破。这款新模型以其高效的性能和极具竞争力的价格,迅速成为全球最受关注的开源模型之一。

Qwen3.5性能跃升:参数量虽小,能力超群

Qwen3.5-Plus在设计上展现了“以小胜大”的理念。它拥有3970亿的总参数量,但激活参数仅为170亿。通过创新架构,该模型在性能上成功超越了拥有万亿参数的Qwen3-Max基座模型。这一突破不仅体现在性能上,更显著提升了部署效率,显存占用降低了60%,推理效率大幅提升,最大推理吞吐量可达19倍。

目前,Qwen3.5-Plus已在千问APP和PC端接入,开发者可以在魔搭社区、HuggingFace下载模型,并通过阿里云百炼获取API服务。尤其引人注目的是,其API定价极具吸引力,每百万Token仅需0.8元。

备注:特地去官网看了下,其实是输入Token0.8元百万Tokens,输出是离谱的4.8元百万Tokens,比Qwen3-plus贵了三倍多。

原生多模态:实现代际飞跃

与前几代主要基于纯文本预训练的模型不同,Qwen3.5实现了从纯文本到原生多模态的代际跃迁。它基于视觉和文本混合Token进行预训练,并增加了大量中英文、多语言、STEM和推理数据。这使得模型具备了更密集的世界知识和更强的逻辑推理能力。

  • 认知能力:在MMLU-Pro认知能力评测中得分87.8分,超越GPT-5.2。
  • 博士级难题:在GPQA测评中获得88.4分,高于Claude 4.5。
  • 指令遵循:在IFBench评测中以76.5分刷新纪录。
  • Agent能力:在BFCL-V4和Browsecomp等通用与搜索Agent评测中表现超越Gemini 3 Pro。

原生多模态训练也带来了视觉能力的飞跃。Qwen3.5在MathVison(多模态推理)、RealWorldQA(通用视觉问答)、CC_OCR(文本识别)、RefCOCO-avg(空间智能)和MLVU(视频理解)等权威评测中均取得最佳性能。

该模型在处理学科解题、任务规划和物理空间推理方面,相比专业模型Qwen3-VL表现更佳。特别是其支持长达2小时(约1M token上下文)的视频输入,能进行长视频内容分析与摘要生成。此外,Qwen3.5实现了视觉理解与代码能力的融合,能将手绘界面草图直接转换为前端代码,极大提升了视觉编程的生产力。

创新门控技术:极致效率的背后

Qwen3.5性能提升的核心在于对经典Transformer架构的重大创新。该模型融入了团队自研的门控技术,该技术曾获得全球AI顶会NeurIPS最佳论文奖项。结合线性注意力机制与稀疏混合专家(MoE)架构,实现了397B总参数仅激活17B的极致模型效率。

通过训练稳定优化和多Token预测等技术,Qwen3.5在保持与Qwen3-Max持平性能的同时,显著提升了推理效率:

  • 在32K上下文场景中,推理吞吐量提升8.6倍。
  • 在256K超长上下文情况下,推理吞吐量最大提升19倍。

这些效率的提升,得益于在阿里云AI基础设施上的高效训练。通过精巧的FP8、FP32精度应用策略,在训练稳定扩展到数十万亿Token时,激活内存减少约50%,训练速度提升10%,有效降低了训练成本。

Agent应用突破:支持扩展至百万级

基于强大的视觉能力,Qwen3.5在Agent应用方面也取得了新突破。该模型可以自主操作手机和电脑,高效完成日常任务,在移动端支持更多主流应用,在PC端可处理更复杂的跨应用多步骤操作。该团队构建的Agent异步强化学习框架,将端到端加速提升3到5倍,Agent支持规模扩展至百万级。

例如,千问AI购物Agent已实现大规模真实世界任务执行和商业化验证。Qwen3.5的增强能力将进一步拓展其在工作和生活中的应用潜力。

开源生态与未来展望

自2023年开源以来,阿里巴巴已发布超过400个千问模型,覆盖全尺寸和全模态。千问全球下载量已突破10亿次,是开发者最友好的开源大模型之一。Qwen3.5系列模型扩展支持201种语言,词表大小从150K扩展到250K,显著提升了小语种的编码效率。

面向未来,Qwen3.5系列不同尺寸和功能的模型将陆续开源,性能更强的旗舰模型Qwen3.5-Max也即将发布。该模型展现了中国AI技术在开源生态中的领先地位和创新能力。

文章评论

登录后才能发布评论哦
立即登录/注册
消息提醒
Hello, world! This is a toast message.