—— 提炼自《贝叶斯认知模型:逆向工程心智》
心智并非被动地识别模式,而是在主动地构建和推断世界的生成模型 (Generative Models)。它不断地在问:“什么样的内在原因和过程,最能解释我所观察到的这些数据?”
人类能“从稀少中获得丰富”的秘诀在于强大的先验知识 (Priors) 或归纳偏置 (Inductive Biases)。这些先验知识为无限的可能性提供了结构和约束,使得从少量样本中进行可靠的泛化成为可能。
人类的许多“非理性”偏差,如启发式思维,并非逻辑缺陷,而是在有限的计算资源(时间、算力)下,为了做出足够好的决策而采取的最优近似策略 (Optimal Approximations)。这被称为资源理性 (Resource-Rationality)。
为了解释人类思维的无穷创造力和组合性,作者提出了概率性思想语言 (Probabilistic Language of Thought, PLoT)假说。在这个框架下,概念被视为可组合的、生成式的随机程序 (Stochastic Programs)。
功能:实现“学会学习”(Learning to learn)。
原理:知识被组织在不同的抽象层次。高层知识(如“物体类别通常由形状决定”)为底层学习(学习“杯子”这个具体类别)提供先验。模型能同时在所有层级上进行推断,用具体数据更新抽象知识,也用抽象知识指导具体学习。这解释了“抽象的祝福”(Blessing of Abstraction)现象。
功能:处理无限复杂的世界。
原理:允许模型复杂度(如类别数量、特征维度)随数据增长而自适应调整,而不是预先固定。核心机制如中餐馆过程 (CRP) 和 印度自助餐过程 (IBP) 为模型提供了“按需增长”的能力,完美契合终身学习的需求。
功能:进行因果推理和理解意图。
原理:使用贝叶斯网络来表示因果关系,并区分“观察”和“干预”。逆向规划 (Inverse Planning) 将他人的行为看作是其为了最大化自身效用而进行的规划过程的输出,通过反向推断来理解其潜在的目标和信念。
功能:统一所有知识表示的通用语言。
原理:将知识表示为能够生成数据的代码。这个框架具有图灵完备的表达能力,可以自然地表示递归、控制流和抽象。学习新知识被形式化为程序归纳——寻找最能解释数据的程序。这是PLoT假说的具体实现。
基于本书洞察,一个类人AGI不应是一个单一的、端到端的神经网络,而应是一个多层、模块化的建构系统。
系统启动时并非白板一块,而是预装载了一套抽象的、可组合的概率程序原语 (probabilistic program primitives)。这构成了AGI的“核心知识”。
这是AGI的“思考”中枢,其核心任务是在程序空间中进行贝叶斯推断。
这是AGI知识增长的地方。通过第二层的学习,新发现的有用程序(即新概念,如“排序”、“象棋规则”)会被加入到一个动态扩展的库中。
这一层监控并指导学习与推断核心的工作,体现了资源理性。
要用Python实现上述BCA蓝图,需要集成多个领域的库,形成一个协同工作的系统。
作用:定义生成模型,表示概率性知识,运行推断算法。
这是整个架构的“大脑”,核心知识库和习得概念库都将用PPL的语法来定义。
作用:构建和操作PLoT的符号结构,实现程序归纳。
作用:连接原始感官数据(如图像、声音)与符号核心,并用于摊销推断。
作用:为AGI提供一个可交互、可学习的“世界”。