MiniMax-M2.7 架构深度拆解

M2.7(229.9B/9.8B 激活)的核心不在规模而在自我进化范式。本期拆解五代演进脉络(Text-01 → M2.7)、62层 Full Attention + GQA + 256 MoE 的设计空间、单 token 6.1 TFLOPs / 48.8GB KV Cache 的计算分析,以及 attention 和 MoE gate 的算子级拆解。

June 9, 2026 · 13 min · 2660 words · Me