AGI与科学探索的极致边界

Google DeepMind CEO Demis Hassabis 深度访谈 (访谈者: YC CEO Garry Tan)
🧠

Demis Hassabis (戴密斯·哈萨比斯)

现任 Google DeepMind 负责人,主导 Gemini 等前沿模型。他被认为是世界上思考 AGI 路径最深远、跨界最成功的科学家之一,具有将电子游戏、神经科学与深度学习完美融合的罕见背景。

国际象棋神童 (Chess Prodigy) 17岁开发游戏名作《主题公园》(Theme Park) 认知神经科学博士 (专注记忆与想象力) 2010年创立 DeepMind ("Solve Intelligence") 强化学习宗师 (DQN, AlphaGo, AlphaStar) AlphaFold 破解50年生物学终极难题 诺贝尔化学奖得主

✨ 核心金句 (Key Takeaways)

“我们不能仅仅满足于AI下出‘第37手’(Move 37)。真正的AGI是:只要我给它极其简单的规则描述,它就能‘发明’围棋这项游戏。”
“如果今天你开启一段10年的深科技创业旅程,你必须把‘AGI会在旅途中途(约2030年)出现’这个巨大变量计算在内,并为那个世界建造基础设施。”
“人类大脑有优雅的情景记忆巩固机制(如REM睡眠回放)。我们现在把所有信息暴力塞进数百万Token上下文窗口的做法,本质上像是在用胶带(Duct tape)缝补。”
👇 鼠标点击/回车键 翻转知识卡片 (已提取100%访谈要点与极客细节)
🏗️

AGI 的终极架构

当前路线是死胡同,还是坦途?

🔄 点击翻转阅读底层逻辑

大模型范式与缺失拼图

  • 事实 当前范式(大规模预训练、RLHF、思维链 CoT)绝对会是最终 AGI 架构的核心部分,现有道路绝不是死胡同。
  • 预测 预测的时间线: AGI 大约在 2030年 左右实现。
  • 洞见 尚缺的1-2个重大突破: 持续学习 (Continual Learning)、长期推理、跨域一致性以及深层记忆提取。有 50/50 的概率现有技术可以直接Scale Up解决这些问题,或者需要全新的算法理论。
🧬

神经科学与AI记忆

百万上下文 vs 海马体机制

🔄 点击翻转阅读专长深度解析

跨界专长:认知机制应用

  • 专长揭秘 Demis在攻读神经科学PhD时专门研究了“海马体如何整合情景记忆”。早期 DeepMind 在 2013年 破解 Atari 的 DQN 模型,正是借鉴了大脑在 REM 睡眠中的经验回放 (Experience Replay)机制。
  • 事实 上下文窗口相当于人类的“工作记忆”(人类约能记住7位数字),AI现在能有几百万Token。
  • 洞见 强行把正确和错误的信息全塞进上下文是“胶带缝补式”的暴力手段。即使容量够大,检索特定决策相关信息的计算成本依然极高。若要处理连续数月的生活视频,百万Token(仅约20分钟视频)远远不够。
🎮

RL回归与Agent未来

为何强化学习被严重低估?

🔄 点击翻转阅读核心预测

从 AlphaGo 到通用智能体

  • 强化学习渊源 DeepMind 自创立起就致力于构建“主动解决问题的智能体”(从Atari、AlphaGo到星际争霸AlphaStar)。这是通往 AGI 的必经之路。
  • 事实 当前大模型中的“思考模式”和“思维链”,本质上是 AlphaGo 时代探索能力的回归。团队正在研究如何将 MCTS (蒙特卡洛树搜索) 与大模型深度结合。
  • 预测 尽管现在工程师能用AI达到1000倍产能,但完全自主的 Agent 仍处于实验期。试金石: 什么时候一个完全由 AI 主导的 3A 游戏能登顶 App Store?预计真正创造巨大价值的 Agent 系统将在 6到12个月内 爆发。
👁️

原生多模态的战略纵深

为什么 Gemini 从底层就是多模态?

🔄 点击翻转阅读硬件级规划

超越文本:理解直觉物理

  • 事实 Gemini 是唯一从底层原生构建多模态的模型。直接处理语音和视觉虽然起步更难,但后发优势巨大。
  • 前瞻布局 这种架构直接支撑了像 Genie(世界模型) 的研发,并且为 Waymo (自动驾驶)Gemini Robotics (机器人) 提供了压倒性的优势。
  • 洞见 未来的数字助手将伴随你的手机或 AR眼镜 走入真实世界。模型不仅需要认字,更需要掌握物理世界的“直觉物理学” (Intuitive physics) 和实时物理上下文。

小模型、开源与蒸馏

算力不仅关乎巨大,还关乎极小

🔄 点击翻转阅读商业考量

服务十亿级用户的效率极限

  • 事实 谷歌利用其首创的模型蒸馏技术 (Hinton与Oriol Vinyals的开创性工作),打造了Flash和Gemma。Gemma发布不到三周下载量突破4000万。
  • 商业逻辑 谷歌拥有十几个超十亿用户的产品(Search, YouTube, Maps),极低延迟与极低成本是硬指标。小模型拥有大模型95%的能力,但成本仅十分之一。
  • 战略考量 开源西方技术栈很重要。 端侧小模型(Nano级别)由于需要在设备上离线运行处理隐私数据(甚至控制家里的机器人),本身就容易被破解,因此谷歌干脆将其彻底开源。
🤔

推理的死胡同与顿悟

为什么大模型能拿金牌,却会算错加减?

🔄 点击翻转阅读模型诊断

锯齿状智能与“过度思考”

  • 现象 当前模型展现出“锯齿状智能” (Jagged intelligence)——既能解出 IMO (国际数学奥林匹克) 金牌题,也会犯极其基础的算术和常识错误。
  • 病理分析 Demis 在与 Gemini 下国际象棋时发现:模型有时会陷入思维死循环。它考虑了一步棋,发现是臭棋,但找不到更好的,竟然又绕回去走这步臭棋。这说明模型缺乏对思维链的自省与监控机制 (Introspection)
  • 预测 解决这种“过度思考”可能只需要一两个算法维度的微调突破,并非不可逾越的高墙。
🌟

验证真正AI创造力的终极测试

P=NP不是尽头,提出千禧年难题才是

🔄 点击翻转阅读图灵测试的升级版

跨越模式匹配的边界

  • 终极目标 现在的AI只是在做模式匹配或外推。真正的创造力是类比推理,是能够“在给出高级描述后,直接发明出围棋这个游戏”。
  • 难度跃迁 证明黎曼猜想或解决 P=NP 是极棒的。但更高一层的难度是:AI 能否自己提出全新的“千禧年难题”,并让全人类顶尖数学家认为它值得终生研究?
  • 爱因斯坦测试 一个终极实验:仅用 1901年及之前的科学数据训练模型,看它能否像爱因斯坦在1905年那样,独立推导出狭义相对论(超越已知边界的突破)。
🔬

AI for Science 的 Alpha 法则

什么领域适合用AlphaFold的方式引爆?

🔄 点击翻转阅读 Demis 的方法论

复刻 Alpha 级突破的三个条件

  • 核心公式 Demis 总结的突破公式:
    1. 问题具有海量的组合搜索空间(大于宇宙原子数,排除暴力破解可能)。
    2. 有极其明确的目标函数(如蛋白质的最小自由能,或赢得棋局)。
    3. 拥有充足的数据,或完美的模拟器来生成海量分布内的高质量合成数据。
  • 领域扩展 这种逻辑正在从结构生物学,向新材料发现、数学、气候建模以及基于 Isomorphic Labs 的全链路理性药物设计扩展。
🦠

十年登月计划:虚拟活体细胞

从蛋白质到整个生命的数字孪生

🔄 点击翻转阅读前沿科学瓶颈

生物计算的终极圣杯

  • 愿景时间表 DeepMind 正在构建能够进行数字摄动实验的全功能“虚拟细胞” (Virtual Cell),预计需要约 10年 时间。目前正从相对独立的“细胞核”模拟起步。
  • 当前卡脖子技术 缺乏高精度的动态数据。目前的电子显微镜能够实现纳米级静态成像,但为了将细胞建模转化为计算机视觉问题,我们需要能够对“活体动态细胞”进行纳米级无损成像的硬件设备,或者开发极其强大的动力系统学习模拟器。
💡

给深科技创始人的指南

面对AGI,你的护城河在哪里?

🔄 点击翻转阅读创业避坑指南

计算极限、工具化架构与深科技

  • 关于套壳 仅仅给基础大模型包一层 API 绝不能称为“AI for Science”。最坚固的护城河在于将 AI 与原子世界的深科技(医学、材料)跨学科结合,这需要巨大的真实世界实验成本,大模型升级无法轻易抹平。
  • AGI的架构预测 AGI 不会是一个塞满所有蛋白质权重知识的单一“超级巨脑”(会导致严重的知识干扰与遗忘)。相反,Gemini/Claude 将作为统帅,以工具调用的方式 (Tool-use) 使用 AlphaFold 这类极其专业的系统。 创业者应思考如何成为被AGI调用的基础设施工具。
  • 算力与推理悖论 受限于芯片制造的物理规律,推理成本几十年内永远不可能真正趋零(由于杰文斯悖论 Jevons Paradox,便宜的算力会被海量智能体和MCTS搜索瞬间吞噬掉),算力统筹依旧是核心竞争力。

原文

源链接