Genius Makers

深度学习编年史:从边缘科学到重塑世界的军备竞赛

第一部分:荒野求生 (1958 - 2012)

这一部分讲述了神经网络(Neural Networks)如何从被学术界嘲笑的“伪科学”,在 Geoff Hinton 等少数坚持者的努力下,通过数十年漫长的“AI寒冬”,最终凭借大数据和 GPU 算力迎来爆发。

PROLOGUE & CH.1
🔨
4400万的拍卖与
感知机的诅咒
点击查看详情
关键事件
  • 2012太浩湖拍卖: Hinton 及其学生(包括 Ilya Sutskever)拍卖无产品的空壳公司。百度出价凶猛,Google 最终以 4400 万美元胜出。DeepMind 因资金不足退出。
  • 1958 感知机诞生: Frank Rosenblatt 发明感知机,被《纽约时报》大肆炒作。
  • 1969 毁灭性打击: Minsky & Papert 出版《Perceptrons》,从数学上证明了单层网络的局限性,直接导致长达几十年的 AI 寒冬。
核心概念
连接主义 (Connectionism) 反向传播 (Backprop)
人物语录
"我不想让他们(百度)觉得我又老又朽,所以我把烫衣板架在床中间假装在做引体向上。" —— Geoff Hinton
CH.2 - CH.3
❄️
地下党与
卷积网络的孤独
点击查看详情
至暗时刻
  • Yann LeCun 的坚持: 在贝尔实验室开发了 LeNet(卷积神经网络),成功用于识别手写支票,但整个领域仍被 SVM 等统计方法主导。
  • Hinton 的流亡: 因不满美国军方资助和里根政府政策,Hinton 移居加拿大,多伦多大学成为深度学习的“诺亚方舟”。
  • 更名策略: 为了论文能被录用,他们不得不将“神经网络”改称为“深度学习”。
关键技术
CNN (卷积神经网络) AI Winter
CH.4 - CH.6
🚀
AlexNet 时刻与
GPU 的介入
点击查看详情
转折点
  • 语音识别突破: Hinton 的学生 George Dahl 在微软实习期间,证明深度学习在语音识别上碾压传统方法。
  • ImageNet 竞赛 (2012): Alex Krizhevsky 利用两个 Nvidia GPU 训练神经网络,错误率从 26% 降至 15%,震惊世界。
  • Google Brain: Andrew Ng 和 Jeff Dean 发现了著名的“猫脸识别”,证明无监督学习的可行性。
关键概念
GPU 加速 ImageNet

第二部分:谁拥有智能? (2013 - 2016)

这一部分聚焦于企业间的军备竞赛。Google、Facebook、Microsoft 和百度开始疯狂争抢这群稀有的科学家。同时,DeepMind 作为一个致力于 AGI 的异类,被 Google 收入囊中。

CH.7 - CH.8
⚔️
扎克伯格入局与
开源战争
点击查看详情
商业博弈
  • Facebook FAIR: 扎克伯格亲自招募 Yann LeCun。LeCun 坚持“不离开纽约”和“必须开源”。
  • 开源策略: Facebook 通过开源其 AI 代码(PyTorch的前身等),打破了 Google 的封闭优势,迫使 Google 后来开源了 TensorFlow。
  • 微软的失落: 尽管微软研究院很早就有相关研究,但因内部官僚主义(Ballmer时代)和对传统方法的迷恋,错失了先机。
战略
开源 (Open Source) 人才收购
CH.10
♟️
DeepMind 与
AlphaGo
点击查看详情
高光时刻
  • 收购: Google 以 6.5 亿美元收购 DeepMind。创始人 Hassabis 坚持要有“伦理委员会”(虽然并未真正生效)。
  • 李世石对决 (2016): AlphaGo 在首尔 4:1 击败人类冠军。
  • 第37手: 机器下出了人类几千年未曾设想的一步棋。这标志着 AI 展现出某种形式的“创造力”。
关键概念
强化学习 (RL) Sputnik时刻
CH.9 - CH.12
🌍
百度与
Google 的翻译革命
点击查看详情
技术落地
  • 机器翻译: Ilya Sutskever 推动的 Seq2Seq 模型让 Google 翻译在一夜之间质量飞跃。
  • 百度的角色: 百度是这一领域最早的觉醒者之一,聘请吴恩达(Andrew Ng),并在中国积极部署 AI 基础设施。
  • TPU 的诞生: 为了支撑庞大的算力需求,Google 秘密研发了自己的 AI 芯片 (TPU),摆脱了对 Nvidia 的完全依赖。
硬件
TPU 云服务竞争

第三部分:动荡与伦理 (2016 - 2019)

随着 AI 变得强大,副作用开始显现。偏见、假新闻、Deepfakes 以及军事化应用引发了科技公司内部员工的抗议和社会的恐慌。

CH.13
🎭
GANs 与
造假的艺术
点击查看详情
发明
Ian Goodfellow 在酒吧争论后灵光一闪,发明了生成对抗网络 (GANs)。两个神经网络互相博弈:一个造假,一个鉴别。
后果
  • Deepfakes: 技术迅速被用于制造假色情视频和政治虚假视频。
  • 信任危机: 这一技术终结了“眼见为实”的时代,引发了对 AI 破坏民主制度的担忧。
概念 GANs 虚假信息
CH.15
⚖️
偏见与
大猩猩事件
点击查看详情
丑闻
Google Photos 将非裔美国人标记为“大猩猩”。这暴露了数据集主要由白人男性构成的问题。
反击
Joy Buolamwini (MIT) 揭露了商业人脸识别软件在深色皮肤女性上的高错误率。Timnit Gebru 成立 "Black in AI",推动社区关注算法偏见。
核心议题 算法偏见 数据集多样性
CH.16
🛡️
Project Maven与
员工起义
点击查看详情
冲突
Google 秘密参与五角大楼的 Project Maven,利用 AI 分析无人机视频。
结果
数千名 Google 员工联名抗议,Fei-Fei Li 等高管陷入邮件丑闻。Google 最终被迫承诺不再续约,并发布了 AI 伦理准则(但也并未完全放弃国防合同)。
核心议题 武器化 AI 硅谷价值观

第四部分:人类被低估了 (2018 - 2020)

AGI(通用人工智能)是宗教还是科学?OpenAI 的崛起改变了格局。与此同时,怀疑论者指出 AI 依然缺乏常识。故事的最后,图灵奖颁给了“深度学习三巨头”。

CH.19 - CH.20
🤖
OpenAI 与
AGI 的宗教
点击查看详情
OpenAI 的演变
  • 成立初衷: Musk 和 Altman 成立 OpenAI 旨在作为 Google 的制衡力量,承诺非营利和开源。
  • 转变: 为了追求 AGI 需要巨大算力,转为“封顶利润”公司,接受微软 10 亿美元投资。Musk 愤而退出。
  • GPT与Dota: 展示了 AI 在游戏和语言模型(GPT)上的惊人能力。
概念 AGI (通用人工智能) Scaling Laws
CH.18
🤔
怀疑论者:
Gary Marcus
点击查看详情
不同的声音
Gary Marcus 是深度学习的主要批评者。他认为深度学习只是在大规模数据匹配,缺乏真正的推理、因果关系和常识。
LeCun vs Marcus
两者在 NYU 进行了著名辩论。LeCun 认为数据规模可以涌现智能,而 Marcus 坚持 AI 需要预设的“先天机制”。
CH.21
🏆
图灵奖与
胶囊网络
点击查看详情
加冕
2019年,Hinton, LeCun, Bengio 共同获得图灵奖。这是对他们数十年坚持边缘研究的最终认可。
新的开始
永远不满足的 Hinton 开始质疑自己发明的反向传播,并提出 Capsules (胶囊网络),试图解决计算机视觉中识别三维空间关系的缺陷。
语录
"历史将会重演,我想。" —— Hinton

原文

源链接