Geoffrey Hinton 教授探讨人工智能、语言模型及“理解”的真正含义。
| 对比维度 | 人类理解 (生物计算) | 机器理解 (数字计算) |
|---|---|---|
| 核心机制 | 基于神经元的模拟计算,利用生物硬件的独特物理属性。 | 基于晶体管的数字计算,需要将信号标准化为0和1。 |
| 理解模型 | 本质上相似:都是通过学习高维特征向量(“高维乐高”)来表征词语,并根据上下文动态调整,最终构建一个连贯的内部“结构”。 | |
| 知识存储 | 本质上相似:知识并非以命题或句子的形式存储,而是隐含在网络连接的权重中。记忆是建构性的,而非检索性的。 | |
| “犯错”模式 | 本质上相似:都会出现“虚构” (Confabulation)现象,即生成貌似合理但与事实不符的信息。这反映了两者都是基于已有知识进行创造性建构。 | |
| 知识共享 | 极其低效。通过语言(“蒸馏”)传递,带宽极低(约100比特/句)。 | 极其高效。通过共享权重/梯度,带宽极高(万亿比特级别)。 |
| 能耗 | 非常低。生物系统高度优化,能效极高。 | 非常高。数字计算需要巨大的电力来驱动晶体管。 |
| 可复制性 | 不可复制。每个大脑都是独一-无二的。 | 可完美复制。可以创造无数个拥有完全相同知识(权重)的副本。 |
| 知识积累 | 个体学习,代代相传,速度缓慢。 | 通过高效共享,所有副本的知识可以瞬间融合,实现指数级增长。 |
图例:
事实陈述: 引用公认的科学事实、历史事件或背景信息。
观点陈述: 演讲者的个人观点、理论模型、类比或推论。