Demis Hassabis 深度访谈全景解析 - AGI、神经科学与深科技创业

🏗️

AGI 的终极架构

当前路线是死胡同，还是坦途？

🔄 点击翻转阅读底层逻辑

大模型范式与缺失拼图

事实当前范式（大规模预训练、RLHF、思维链 CoT）绝对会是最终 AGI 架构的核心部分，现有道路绝不是死胡同。
预测 预测的时间线： AGI 大约在 2030年 左右实现。
洞见 尚缺的1-2个重大突破： 持续学习 (Continual Learning)、长期推理、跨域一致性以及深层记忆提取。有 50/50 的概率现有技术可以直接Scale Up解决这些问题，或者需要全新的算法理论。

🧬

神经科学与AI记忆

百万上下文 vs 海马体机制

🔄 点击翻转阅读专长深度解析

跨界专长：认知机制应用

专长揭秘 Demis在攻读神经科学PhD时专门研究了“海马体如何整合情景记忆”。早期 DeepMind 在 2013年破解 Atari 的 DQN 模型，正是借鉴了大脑在 REM 睡眠中的经验回放 (Experience Replay)机制。
事实上下文窗口相当于人类的“工作记忆”（人类约能记住7位数字），AI现在能有几百万Token。
洞见强行把正确和错误的信息全塞进上下文是“胶带缝补式”的暴力手段。即使容量够大，检索特定决策相关信息的计算成本依然极高。若要处理连续数月的生活视频，百万Token（仅约20分钟视频）远远不够。

🎮

RL回归与Agent未来

为何强化学习被严重低估？

🔄 点击翻转阅读核心预测

从 AlphaGo 到通用智能体

强化学习渊源 DeepMind 自创立起就致力于构建“主动解决问题的智能体”（从Atari、AlphaGo到星际争霸AlphaStar）。这是通往 AGI 的必经之路。
事实当前大模型中的“思考模式”和“思维链”，本质上是 AlphaGo 时代探索能力的回归。团队正在研究如何将 MCTS (蒙特卡洛树搜索) 与大模型深度结合。
预测尽管现在工程师能用AI达到1000倍产能，但完全自主的 Agent 仍处于实验期。试金石： 什么时候一个完全由 AI 主导的 3A 游戏能登顶 App Store？预计真正创造巨大价值的 Agent 系统将在 6到12个月内 爆发。

👁️

原生多模态的战略纵深

为什么 Gemini 从底层就是多模态？

🔄 点击翻转阅读硬件级规划

超越文本：理解直觉物理

事实 Gemini 是唯一从底层原生构建多模态的模型。直接处理语音和视觉虽然起步更难，但后发优势巨大。
前瞻布局这种架构直接支撑了像 Genie（世界模型） 的研发，并且为 Waymo (自动驾驶) 和 Gemini Robotics (机器人) 提供了压倒性的优势。
洞见未来的数字助手将伴随你的手机或 AR眼镜走入真实世界。模型不仅需要认字，更需要掌握物理世界的“直觉物理学” (Intuitive physics) 和实时物理上下文。

⚡

小模型、开源与蒸馏

算力不仅关乎巨大，还关乎极小

🔄 点击翻转阅读商业考量

服务十亿级用户的效率极限

事实谷歌利用其首创的模型蒸馏技术 (Hinton与Oriol Vinyals的开创性工作)，打造了Flash和Gemma。Gemma发布不到三周下载量突破4000万。
商业逻辑谷歌拥有十几个超十亿用户的产品（Search, YouTube, Maps），极低延迟与极低成本是硬指标。小模型拥有大模型95%的能力，但成本仅十分之一。
战略考量 开源西方技术栈很重要。 端侧小模型（Nano级别）由于需要在设备上离线运行处理隐私数据（甚至控制家里的机器人），本身就容易被破解，因此谷歌干脆将其彻底开源。

🤔

推理的死胡同与顿悟

为什么大模型能拿金牌，却会算错加减？

🔄 点击翻转阅读模型诊断

锯齿状智能与“过度思考”

现象当前模型展现出“锯齿状智能” (Jagged intelligence)——既能解出 IMO (国际数学奥林匹克) 金牌题，也会犯极其基础的算术和常识错误。
病理分析 Demis 在与 Gemini 下国际象棋时发现：模型有时会陷入思维死循环。它考虑了一步棋，发现是臭棋，但找不到更好的，竟然又绕回去走这步臭棋。这说明模型缺乏对思维链的自省与监控机制 (Introspection)。
预测解决这种“过度思考”可能只需要一两个算法维度的微调突破，并非不可逾越的高墙。

🌟

验证真正AI创造力的终极测试

P=NP不是尽头，提出千禧年难题才是

🔄 点击翻转阅读图灵测试的升级版

跨越模式匹配的边界

终极目标现在的AI只是在做模式匹配或外推。真正的创造力是类比推理，是能够“在给出高级描述后，直接发明出围棋这个游戏”。
难度跃迁证明黎曼猜想或解决 P=NP 是极棒的。但更高一层的难度是：AI 能否自己提出全新的“千禧年难题”，并让全人类顶尖数学家认为它值得终生研究？
爱因斯坦测试一个终极实验：仅用 1901年及之前的科学数据训练模型，看它能否像爱因斯坦在1905年那样，独立推导出狭义相对论（超越已知边界的突破）。

🔬

AI for Science 的 Alpha 法则

什么领域适合用AlphaFold的方式引爆？

🔄 点击翻转阅读 Demis 的方法论

复刻 Alpha 级突破的三个条件

核心公式 Demis 总结的突破公式：
1. 问题具有海量的组合搜索空间（大于宇宙原子数，排除暴力破解可能）。
2. 有极其明确的目标函数（如蛋白质的最小自由能，或赢得棋局）。
3. 拥有充足的数据，或完美的模拟器来生成海量分布内的高质量合成数据。
领域扩展这种逻辑正在从结构生物学，向新材料发现、数学、气候建模以及基于 Isomorphic Labs 的全链路理性药物设计扩展。

🦠

十年登月计划：虚拟活体细胞

从蛋白质到整个生命的数字孪生

🔄 点击翻转阅读前沿科学瓶颈

生物计算的终极圣杯

愿景时间表 DeepMind 正在构建能够进行数字摄动实验的全功能“虚拟细胞” (Virtual Cell)，预计需要约 10年 时间。目前正从相对独立的“细胞核”模拟起步。
当前卡脖子技术缺乏高精度的动态数据。目前的电子显微镜能够实现纳米级静态成像，但为了将细胞建模转化为计算机视觉问题，我们需要能够对“活体动态细胞”进行纳米级无损成像的硬件设备，或者开发极其强大的动力系统学习模拟器。

💡

给深科技创始人的指南

面对AGI，你的护城河在哪里？

🔄 点击翻转阅读创业避坑指南

计算极限、工具化架构与深科技

关于套壳仅仅给基础大模型包一层 API 绝不能称为“AI for Science”。最坚固的护城河在于将 AI 与原子世界的深科技（医学、材料）跨学科结合，这需要巨大的真实世界实验成本，大模型升级无法轻易抹平。
AGI的架构预测 AGI 不会是一个塞满所有蛋白质权重知识的单一“超级巨脑”（会导致严重的知识干扰与遗忘）。相反，Gemini/Claude 将作为统帅，以工具调用的方式 (Tool-use) 使用 AlphaFold 这类极其专业的系统。 创业者应思考如何成为被AGI调用的基础设施工具。
算力与推理悖论受限于芯片制造的物理规律，推理成本几十年内永远不可能真正趋零（由于杰文斯悖论 Jevons Paradox，便宜的算力会被海量智能体和MCTS搜索瞬间吞噬掉），算力统筹依旧是核心竞争力。

AGI与科学探索的极致边界

Demis Hassabis (戴密斯·哈萨比斯)

✨ 核心金句 (Key Takeaways)