每秒150token!小米MiMo-V2-Flash性能比肩DeepSeek

商业品牌
2025 12-17 03:59:37
分享

  【CNMO科技消息】12月16日,CNMO注意到,小米MiMo官方宣布:MiMo-V2-Flash的总参数为309B,活跃参数为15B。

每秒150token!小米MiMo-V2-Flash性能比肩DeepSeek

  在架构设计上,小米MiMo-V2-Flash采用了混合注意力机制。其混合模块设计包含8个混合块,其中每5个滑动窗口注意力(SWA)层对应1个全局注意力层。在上下文支持能力上,该模型原生支持32K的训练,并且能够扩展到256K的上下文支持。

  从性能表现来看,小米MiMo-V2-Flash在通用基准测试中,与DeepSeek-V3.2不相上下,同时延迟大幅降低。在SWE-Bench验证和多语言集中分别取得了73.4%和71.7%的成绩。尤为突出的是其速度优势,在Day-0时,输出速度高达每秒150个token,这一速度在同类模型中处于领先地位。

每秒150token!小米MiMo-V2-Flash性能比肩DeepSeek

  为了直观展示其性能,小米MiMo官方还公布了一系列对比图表。在与DeepSeek-V3.2、K2-Thinking、Claude Sonnet 4.5、GPT-5(High)、Gemini 3.0 Pro等模型的对比中,MiMo-V2-Flash在多个测试项目上都展现出了极具竞争力的表现,部分指标甚至领先于其他模型。

来源:手机中国
The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。