Minimax推出推理模型M1:补齐短板的关键一步
2025年6月18日消息,Minimax开启技术发布周,在模型和产品上进行了重要更新,推出456B参数大小的推理模型M1以及核心产品海螺AI。
M1是Minimax首款推理模型,常被拿来与DeepSeek - R1作比较,亮点在于长文本处理能力和成本表现。它支持最高100万token上下文输入,达DeepSeek R1的8倍,与谷歌Gemini 2.5 Pro相当,还支持最长8万Token的推理输出。其长文本处理能力的突破得益于Lightning Attention混合构架,该构架将全连接注意力拆分,减少计算量、提高处理速度。
成本方面,进行8万Token深度推理时,M1所需算力约为DeepSeek R1的30%;生成10万token时,推理算力约为25%。团队使用512块英伟达H800 GPU,耗时三周,花费53.5万美元完成强化学习阶段,这得益于CISPO算法,它能提升强化学习效率。
定价上,M1按文本大小分三个区间,虽总体定价较低,但随着文本输入输出增长,费用可能陡升。产品海螺AI加入全新Hailuo 02模型,视频可原生1080P,处理极端物理场景能力突出,在AI视频竞技场排行榜中位居第二。
对于Minimax此时完善推理模型能力版图,有投资人认为是核心团队起初未重视此训练方向,这是必须补的课;也有投资人觉得这能表明技术不掉队,建立用户心智,若模型效果和口碑好,还能运营开发者社区。MiniMax - M1在基准测试中表现不俗,在MRCR(4 - needle)上超越众多开闭源模型。目前在Github上,M1发布8小时获440星,截至目前有620星,其对开源社区的影响有待观察。