关于我们 免责声明 广告合作 网站地图 XML 联系我们

MiniMax发布开源混合架构推理模型M1

原创
百度AI 6天前 阅读数 7 #开发者论坛

近日,上海AI独角兽企业MiniMax发布了一款备受瞩目的开源混合架构推理模型——M1。作为全球首个开源的大规模混合架构推理模型,M1的发布标志着AI技术领域的一次重大突破。

1.png

M1模型采用了独特的混合注意力机制,结合了闪电注意力(Lightning Attention)与传统注意力机制,实现了计算效率的大幅提升。在处理百万级Token的长文本时,M1展现出了卓越的性能,其上下文窗口支持高达100万Token,输出也达到8万Token,与谷歌的Gemini 2.5 Pro持平,远超其他同类模型。

值得一提的是,M1模型在训练成本上也实现了显著降低。整个强化学习阶段仅使用了512块英伟达H800 GPU,耗时三周,成本仅为53.5万美元,远低于市场预期。这一成本优势使得M1模型在商业化应用上更具竞争力。

此外,M1模型的开源策略也彰显了MiniMax的技术自信和开放胸怀。通过开源,MiniMax希望与全球开发者共同探索AI技术的无限可能,推动AI技术的普及和应用。可以预见,随着M1模型的广泛应用,AI技术将在更多领域发挥重要作用,为人类社会带来更多便利和创新。


版权声明

本文仅代表作者观点,不代表AI资讯汇立场。
本文系作者授权AI资讯汇发表,未经许可,不得转载。

热门
标签列表