微软发布 MAI-Thinking-1 和 MAI-Code-1-Flash 两款小参数模型，强调合规数据训练

一句话看懂

微软发布两款小参数 LLM：MAI-Thinking-1（35B 推理模型）和 MAI-Code-1-Flash（5B 代码模型），均使用合规商业数据训练，未依赖网络爬取数据。

微软今天宣布推出两款新的文本 LLM：

MAI-Thinking-1：35B 参数的推理模型，定位为“思考型”模型，目前仅向“精选早期合作伙伴”提供。微软声称在盲测中，该模型“优于 Sonnet 4.6”。
MAI-Code-1-Flash：5B 参数的代码专用模型，专为 GitHub Copilot 和 VS Code 优化，旨在提供高性能和低成本。该模型将逐步向 VS Code 中的 GitHub Copilot 个人用户推出。

微软强调，两款模型均“从头开始使用企业级、清洁且商业许可的数据训练”，没有从第三方模型蒸馏。MAI-Code-1-Flash 同样“端到端由微软使用清洁且适当许可的数据构建”。

值得注意的是，这些模型的参数规模较小（35B 和 5B），在当前大模型成本高昂的背景下，微软选择小参数路线令人关注。作者 Simon Willison 表示，他经常在笔记本电脑上运行比 35B 更大的模型，因此 MAI-Thinking-1 的性能表现值得期待。

对于中文开发者，这两款模型有几点值得关注：

合规数据训练的意义：微软明确使用“清洁且商业许可的数据”，避免版权纠纷。这对国内开发者尤其重要——国内大模型训练常面临数据合规争议，微软的做法或为行业提供参考。不过，目前没有中文版本或针对中文的优化信息。
小参数模型的实用性：35B 和 5B 参数意味着可以在消费级硬件上运行（如本地部署），降低了对云端 API 的依赖。国内类似产品如 DeepSeek-Coder 也有小参数版本，但微软的模型直接集成到 VS Code 和 GitHub Copilot，对使用这些工具的开发者更便捷。
对国产代码助手的竞争：国内代码助手如 CodeGeeX、通义灵码等，可能面临微软 Copilot 的进一步挤压。MAI-Code-1-Flash 的低成本和专用优化，可能让 Copilot 在代码补全速度和准确性上更具优势。
监管与可用性：目前 MAI-Thinking-1 仅限早期合作伙伴，MAI-Code-1-Flash 逐步推出，国内用户可能需要等待或通过 Copilot 订阅使用。微软的合规数据策略可能有助于通过国内内容审核，但具体落地时间未知。

微软用小参数模型证明：合规数据训练和专用优化，也能在推理和代码领域达到顶尖水平。