【财新网】MiniMax向模型市场交出新答卷。10月27日,MiniMax发布开源推理大模型M2,采用混合专家模型(Mixture-of-Experts, MoE)架构,总参数 2300亿,激活参数100亿,输出速度达100TPS(每秒输出token数)。据介绍,该模型专为Agent开发设计。
MiniMax技术文档显示,M2支持 20.48万个token的上下文窗口。这一数据较其6月推出的上一代模型M1大幅缩减,而彼时“长文本理解”正是其宣传的主要优势。M1为开源混合架构推理模型,总参数4560亿,支持100万token上下文输入、8万token的推理输出,据称为当时最大的上下文输入输出规模。


















京公网安备 11010502034662号 