告别Ai2：Open Language Model（Olmo）团队核心成员离职，反思开放研究路径

一句话看懂

Nathan Lambert离开艾伦人工智能研究所（Ai2），他曾主导Olmo系列模型和Tülu 3项目，强调开放研究对AI安全与普及的重要性。

详细发生了什么

Nathan Lambert，Ai2的Olmo模型团队核心成员，于近日正式离职。他在告别信中回顾了自己从UC Berkeley博士到HuggingFace，再到Ai2的职业轨迹。Lambert在Ai2期间主导了Olmo系列开源语言模型的开发，特别是Tülu 3项目，该项目首次在70B规模上成功应用DPO（直接偏好优化），并提出了可验证奖励强化学习（RLVR）概念。他还创建了RewardBench评估基准。Lambert强调，Ai2在学术与工业之间的独特定位使其能够以开放方式影响AI技术，确保技术安全地惠及更多人。他未来将继续致力于开放生态系统的协调与实用化。

中文圈视角

对中文AI社区而言，Lambert的离职传递了几个关键信号。首先，Olmo系列作为完全开源的大模型，其技术路线（如RLVR）对国内厂商（如DeepSeek、智谱）有直接参考价值——开源模型在特定场景下可以接近甚至超越闭源模型。其次，Ai2的“开放研究”模式与国内ModelScope等平台理念相似，但执行深度不同：Ai2不仅开放模型权重，还开放训练细节和评估方法。国内用户若想复现类似工作，可直接使用Olmo的代码和数据集，无需依赖闭源API。最后，Lambert提到的“独立声音”在AI地缘政治背景下尤为重要，中文社区需要更多类似Ai2的独立研究机构，避免过度依赖海外闭源模型。

几条值得记住的细节

Lambert在Ai2期间主导了Tülu 3项目，首次在70B规模上成功应用DPO，并提出了RLVR概念。
他创建的RewardBench成为奖励模型评估的基准之一。
Olmo 3原计划2025年6-7月发布，但因推理模型浪潮延迟，最终成功训练了更大规模的模型。
Lambert在Ai2期间发送的Slack消息量比公司任何其他成员多40%，被授予“The Cat Herder”称号。
他未来仍将留在西雅图，继续从事开放生态系统的协调工作。

一句话总结

Lambert的离职提醒我们：开放研究需要持续投入，而中文社区应抓住机会，借鉴Olmo等项目的经验，构建自主可控的开源生态。