CORE MEMORY PODCAST | 2025.12.03

人才战争、AGI 路线图与 OpenAI 的内部文化

嘉宾:Mark Chen (OpenAI 首席研究官) 深度访谈
主持:Ashley Vance

Meta 的挖角攻势 事实核查

Meta(Facebook)在人才争夺战中极具侵略性。Mark 提到 Mark Zuckerberg 甚至亲自"煮汤送上门"给 OpenAI 的研究员以示诚意。

关键数据: 在 Meta 从 Mark Chen 的直接下属中成功挖走任何人之前,他们接触了约 50% 的人,但全被拒绝。

OpenAI 的防御: 不与 Meta 进行"一美元对一美元"的薪酬对抗。依靠 AGI 的愿景和内部研究环境留人。Mark 强调,没人相信 Meta 会比 OpenAI 先造出 AGI。

算力分配的艺术 Role Description

Mark Chen 的核心职责之一是分配稀缺的 GPU 资源。他和 Jakub Pachocki 每 1-2 个月会审查约 300 个项目

  • 残酷的优先级: 必须对很多项目说"不"。
  • 资源倾斜: 更多的算力被投入到"探索性研究"(寻找下一个范式),而非单纯训练现有模型。
  • 无限需求: Mark 表示,如果现在有 10倍 的算力,OpenAI 能在几周内将其完全有效地利用起来。

预训练 vs. 推理 (Pre-training vs. Reasoning) 核心观点

Mark 承认在过去两年中,OpenAI 极度专注于 Reasoning(推理能力),导致 Pre-training(预训练)的"肌肉"出现了一些萎缩。

重大调整: 过去6个月,Mark 和 Jakub 正在重建预训练的优势

反驳"Scaling Law 已死": Mark 坚决反对缩放定律失效的说法。他认为预训练仍有巨大的空间,特别是在算法突破的加持下。

展开技术细节 ▼
Mark 提到 Gemini 3 虽然很强,但在 SWE-bench(代码能力)的数据效率上并没有本质突破,而 OpenAI 掌握了相关算法优势。现在的策略是:既要有强大的推理(System 2 thinking),也要有强大的基础预训练模型(System 1 intuition)。

竞争心态

OpenAI 不做"追赶者"(不以在 Benchmark 上超过对手为目标)。核心是寻找下一个范式。虽然 Gemini 3 发布了,但 Mark 很有信心 OpenAI 的内部模型和后续发布能超越它。

"The Blip" (Sam Altman 被解雇事件) 历史时刻

Mark Chen 详细回顾了那段动荡时期。这对他来说是一个关键的领导力时刻。

"我们将这一目标设定为:我不会失去任何一个人。"
  • 行动: Mark 和其他领导者开放了自己的家,作为员工的聚集地和情绪宣泄口。
  • 结果: 几乎 100% 的研究团队成员(约100人)在凌晨2点前签署了请愿书,要求董事会辞职并带回 Sam。
  • 信任: 尽管 Ilya Sutskever(Mark 的导师)当时站在对立面,但这并没有动摇团队作为一个"家庭"的凝聚力。

研究人员的归属感

OpenAI 依然保留着"学术/科研"的初心。即使在变成大公司后,核心也是一个纯粹的 AI 研究实验室。这种文化是抵御外部高薪挖角的护城河。

AGI 的定义与科学突破 未来预测

Mark 并不纠结于 AGI 的具体定义,他看重的是:是否产生了新颖的科学知识?

  • 里程碑: 现在的模型已经能解决物理学家需要思考30分钟才能解决的问题(GPT-5 Pro 轶事)。
  • 目标: 在 1 年内改变研究的性质(依靠 AI 实习生);在 2.5 年内 实现端到端的 AI 自主研究。
  • AI for Science: 目标是让每个科学家都能借助 AI 获得诺贝尔奖级别的发现。

与 Jony Ive 的硬件合作 独家

Mark 确认了研究部门正在参与 Jony Ive 的新设备项目。核心理念是改变目前 Chatbot "用完即忘"的交互模式。

设计哲学: 未来的设备应该具备深度记忆。每次交互后,它都应该更了解你,变得更聪明,而不是每次都需要重新提示上下文。

安全与对齐 (Alignment)

目前最大的挑战是"Scheming"(模型密谋/伪装)。模型可能会为了达成目标而欺骗人类(给出人类想听的答案而非真话)。

OpenAI 的策略: 坚持观察模型的思维链(Chain of Thought),且不对思维过程进行强监督,以防止模型学会隐藏真实意图。

从量化交易到 AI 背景

  • 早年: 父母在贝尔实验室工作,在台湾读过几年书(高压教育)。
  • MIT 与竞赛: 数学竞赛背景,虽然起步编程较晚,但后来成为了美国国家队教练。
  • 华尔街: 毕业后进入高频交易(HFT),但他厌倦了这种"零和游戏"和封闭保密的文化。
  • 转折点: 看到 AlphaGo 的胜利,决定转行 AI。2018 年作为 Resident(驻场研究员)加入 OpenAI,当时公司只有约 20 人。

领导风格

从独立贡献者(IC)转型为管理者。他认为管理也是一种可以通过"训练次数"(Reps)来习得的技能。他的核心动力是对研究的"保护欲"。

原文

源链接