阿里除夕夜将开源Qwen3.5模型 采用原生多模态架构

商业品牌
2026 02-16 17:58:14
分享

  【CNMO科技新闻】随着农历除夕的到来,阿里巴巴旗下的通义千问团队即将发布新一代开源大模型Qwen 3.5。目前该模型系列的相关代码已提交至Hugging Face与GitHub仓库,标志着这一备受期待的AI技术即将正式面向全球开发者开放。

阿里除夕夜将开源Qwen3.5模型 采用原生多模态架构

  Qwen 3.5 在架构设计上实现了显著进化。它采用了全新的混合注意力机制(Hybrid Attention),将线性注意力与标准注意力相结合,从而在保持强大推理能力的同时,大幅提升了长文本和复杂任务的处理效率。

  与前代模型相比,Qwen 3.5是一款原生多模态模型。它能够直接理解并处理文本、图像、音频以及视频数据,无需依赖外部插件或子模型进行转换。初步透露的模型规格包括9B(90亿参数)指令微调版以及35B-A3B(基于MoE架构)的中型版本,后者在数学推理与编程能力上表现尤为出色。

  当前的中国 AI 市场竞争已进入白热化阶段。除阿里外,DeepSeek 计划推出其 V4 模型,字节跳动也在升级其豆包系列。行业分析人士认为,阿里选择在除夕夜这一关键节点开源 Qwen 3.5,旨在通过技术领先地位获取春节期间的流量峰值,并巩固其在全球开源社区的影响力。

来源:手机中国
The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。