AI 快讯 编译自 interconnects #行业分析#模型发布#开放研究

告别Ai2:Open Language Model(Olmo)团队核心成员离职,反思开放研究路径

Nathan Lambert宣布离开艾伦人工智能研究所(Ai2),回顾参与Olmo模型、Tülu 3等项目的经历,分享开放研究对AI安全与扩散的价值,并探讨学术与工业之间的独特定位。

编译发布 2026/06/02 原文发布 2026/06/02

一句话看懂

Nathan Lambert离开艾伦人工智能研究所(Ai2),他曾主导Olmo系列模型和Tülu 3项目,强调开放研究对AI安全与普及的重要性。

详细发生了什么

Nathan Lambert,Ai2的Olmo模型团队核心成员,于近日正式离职。他在告别信中回顾了自己从UC Berkeley博士到HuggingFace,再到Ai2的职业轨迹。Lambert在Ai2期间主导了Olmo系列开源语言模型的开发,特别是Tülu 3项目,该项目首次在70B规模上成功应用DPO(直接偏好优化),并提出了可验证奖励强化学习(RLVR)概念。他还创建了RewardBench评估基准。Lambert强调,Ai2在学术与工业之间的独特定位使其能够以开放方式影响AI技术,确保技术安全地惠及更多人。他未来将继续致力于开放生态系统的协调与实用化。

中文圈视角

对中文AI社区而言,Lambert的离职传递了几个关键信号。首先,Olmo系列作为完全开源的大模型,其技术路线(如RLVR)对国内厂商(如DeepSeek、智谱)有直接参考价值——开源模型在特定场景下可以接近甚至超越闭源模型。其次,Ai2的“开放研究”模式与国内ModelScope等平台理念相似,但执行深度不同:Ai2不仅开放模型权重,还开放训练细节和评估方法。国内用户若想复现类似工作,可直接使用Olmo的代码和数据集,无需依赖闭源API。最后,Lambert提到的“独立声音”在AI地缘政治背景下尤为重要,中文社区需要更多类似Ai2的独立研究机构,避免过度依赖海外闭源模型。

几条值得记住的细节

  • Lambert在Ai2期间主导了Tülu 3项目,首次在70B规模上成功应用DPO,并提出了RLVR概念。
  • 他创建的RewardBench成为奖励模型评估的基准之一。
  • Olmo 3原计划2025年6-7月发布,但因推理模型浪潮延迟,最终成功训练了更大规模的模型。
  • Lambert在Ai2期间发送的Slack消息量比公司任何其他成员多40%,被授予“The Cat Herder”称号。
  • 他未来仍将留在西雅图,继续从事开放生态系统的协调工作。

一句话总结

Lambert的离职提醒我们:开放研究需要持续投入,而中文社区应抓住机会,借鉴Olmo等项目的经验,构建自主可控的开源生态。

原文信息

原文标题
Farewell Ai2
原作者
Nathan Lambert
翻译模型
deepseek-chat

本文由 AI 跟我学 编译翻译自上述英文原文,并加入中文圈视角解读。如有版权问题请联系 [email protected], 我们将第一时间处理。