本书的核心观点是,大脑并非一个被动处理外部信息的器官,而是一个主动的“预测引擎”。它不断地利用现有知识对即将到来的感官信号进行猜测,并通过“预测误差”来学习和调整,从而统一了感知、行动和学习。这是一个关于大脑、身体和世界如何协同工作,共同塑造我们预测心智 (Predictive Mind)一种认知科学范式,将心智或大脑的根本功能刻画为一个主动的、层级化的预测机器。在这种观点下,所有心智现象,从低阶知觉到高阶思维,都被理解为预测生成与误差修正的动态过程。的故事。
前言 & 导论
- 核心线索:理解心智的关键在于预测。大脑就像一个熟练的冲浪者,总是试图领先于感官刺激的浪潮。
- 统一框架:感知、行动、想象和理解都是由同一个基于预测的底层机制驱动的。
- 学习机制:学习与在线处理使用相同的资源。通过不断尝试预测自身的感官状态,大脑得以了解造成这些状态变化的世界。这是一种“自举的天堂” (bootstrap heaven)。
- 具身视角:这个预测引擎并非孤立在颅骨内,而是深深嵌入在一个拥有身体、并处于复杂物质和社会结构中的能动主体(agent)之中。
- 大脑是预测引擎:大脑不断地主动猜测感官阵列的结构和形态。传入的信号主要用作核对和纠正其自上而下的最佳猜测。
- 核心机制:预测加工 (Predictive Processing)一种认知科学和神经科学的广义理论框架,主张大脑并非被动接收感官信息,而是主动地、自上而下地生成关于世界(包括身体)的预测,并根据自下而上的预测误差(prediction error)来不断更新这些预测,从而推断感觉输入的隐藏原因。该框架试图统一解释知觉、行动、学习和认知。。失败的猜测会产生预测误差,该误差信号被用来更新猜测或驱动学习。
- 生成模型类比 (SLICE):想象一个程序,你不能直接画地质图,而是通过操控“沉积”、“侵蚀”等地质成因的旋钮来重现目标图像。成功做到这一点意味着你理解了地质学。同理,大脑通过一个生成模型 (Generative Model)大脑内部的、关于世界(包括身体)如何产生感官信号的因果结构和统计规律的概率模型。大脑利用这个模型来生成对感官输入的预测。模型的准确性通过预测误差最小化的过程不断得到优化。来“猜测”世界,从而实现感知。
- 行动的角色:我们不仅被动地预测感官流,更重要的是,我们通过行动来主动选择和塑造我们接收的感官输入。感知与行动 (Perception and Action)在主动推理框架下,这是最小化自由能或预测误差的两种互补方式。感知是通过更新内在预测(信念)来减少误差(即改变心智以适应世界);行动是通过改变感官采样来减少误差(即改变世界以适应心智)。是一个持续不断的循环。
- 本书结构:第一部分探讨预测的力量;第二部分将行动融入预测框架;第三部分讨论预测性大脑如何被身体、社会和技术环境所“支撑”。
第一部分:预测的力量 (THE POWER OF PREDICTION)
- 感知是预测:感知不是自下而上的特征累积,而是大脑基于预期,用自上而下的预测来“解释”感官信号。输入信号主要用于纠正错误的预测。
- 自举学习:大脑通过预测下一刻的感官状态来进行自我监督学习,世界本身提供了源源不断的训练信号。
- 分层结构:大脑的分层结构使其能够捕捉世界在不同时空尺度上的因果规律。高层级预测低层级的活动模式。
- 层级预测编码 (Hierarchical Predictive Coding)描述预测加工在神经层面如何实现的具体架构。在该架构中,大脑皮层被组织成一个层级结构,高层级向低层级发送预测信号,而低层级仅将未被高层级预测解释的残余信号——即预测误差——向前传递。这种编码策略在信息处理上极为高效。:这是一种高效的神经编码策略。自上而下的通路传递预测,而自下而上的通路只传递未被预测的部分,即预测误差。这极大地节省了神经带宽。
- 证据:大量神经科学现象支持PP模型,如非经典感受野效应(如末端停止)、重复抑制、以及对双眼竞争等知觉现象的解释。
- 双重架构:PP系统并非只有抑制。它包含两种功能单元:编码预测的“表征单元”和计算误差的“误差单元”。消除误差可以使表征得到锐化和选择性增强。
- 大脑模型被颠覆:传统上认为大脑是被动接收输入的器官,而PP模型认为大脑是主动的、持续产生预测的器官。感官输入只是对这一内在活动的扰动。
- 核心问题:大脑如何在自上而下的预期和自下而上的感官证据之间取得平衡?
- 核心机制:通过对预测误差进行精度加权 (Precision Weighting)指对预测误差信号的可靠性或置信度的估计。大脑会根据情境(如环境的确定性)为不同的预测误差分配不同的精度权重。高精度的误差信号会对信念更新产生更大的影响。这一机制被认为是注意(attention)的神经计算基础。。精度是对信号可靠性的估计(与方差成反比)。
- 注意力即精度:注意力就是调节预测误差“音量”(增益)的过程。我们会对那些被认为更可靠、更具任务相关性的感官信号(即高精度的预测误差)赋予更高的权重。
- 统一抑制与增强:精度加权机制解释了大脑如何同时实现对预期内信号的抑制和对注意力所向信号的增强。
- 行动的角色:行动(如眼动)是一种主动的感官采样方式,其目的是为了获取高精度的预测误差,从而验证或修正我们对世界的假设。这形成了一个“感知-注意-行动”的自证循环。
- 病理学解释:精神分裂症等精神障碍可能与精度加权机制的失调有关。当无关紧要的预测误差被赋予过高的精度时,系统会为了解释这些“异常信号”而产生妄想和幻觉。
- 感知与想象的统一:能够通过生成模型进行感知的系统,也天然具备了“离线”运行该模型的能力,从而产生心理意象、想象和梦境。
- 证据:fMRI“读脑”研究表明,在高级视觉皮层中,真实感知和心理想象所激活的精细神经模式高度重叠。
- 梦境:梦境可以被理解为生成模型在与外部感官输入“隔离”的情况下运行的结果。此时,感官预测误差的精度极低,使得内部动态可以自由展开。这种状态可能有助于对模型进行“修剪”,优化其复杂性以提高泛化能力。
- 记忆:记忆,尤其是情景记忆,也是一种基于预测的重构过程。我们利用高级概念(如情境)来预测和“填充”低级细节。
- 心理时间旅行:回忆过去和想象未来的能力,依赖于同一个能够灵活重组过去事件细节以构建新场景的“建构系统”。这正是生成模型的能力体现。
- 认知套餐:感知、理解、想象、记忆和梦境都是同一个底层预测机制的不同表现形式,构成了一个紧密相连的“认知套餐”。
第二部分:具身化预测 (EMBODYING PREDICTION)
- 行动的预测理论:行动并非对感官输入的“反应”,而是通过预测行动的感官后果来实现的。
- 主动推理 (Active Inference)源于自由能原理的过程理论,解释了生物体如何通过行动和感知来最小化自由能/预测误差。它统一了行动(通过改变世界使之符合预测)和知觉(通过改变内在预测使之符合世界),认为两者都服务于最小化预测误差这同一个目标。:大脑通过两种方式进行预测误差最小化 (Prediction Error Minimization)预测加工框架的核心计算目标。指大脑不断减少其“自上而下”的预测与“自下而上”的实际感官输入之间的差异(即预测误差)的过程。该机制被认为是驱动学习、知觉修正和行动选择的根本动力。:1)更新预测以适应世界(感知);2)采取行动改变世界以符合预测。
- 运动控制的新模型:传统的运动控制理论需要一个“逆向模型”来将期望结果转化为运动指令。主动推理理论认为,大脑通过预测期望动作的本体感觉 (Proprioception)关于身体各部分相对位置和所用力量的内部感觉,例如关节角度和肌肉张力。后果来直接引发动作。身体通过经典反射弧运动,以“实现”这些本体感觉预测,从而消除预测误差。
- 简化的控制:该模型无需独立的逆向模型、传出神经冲动副本或成本函数。运动指令被本体感觉预测所取代,而成本和价值则被内隐地编码在关于期望轨迹的先验信念中。
- 统一的引擎:感知和行动是同一枚硬币的两面。运动皮层和视觉皮层的区别仅在于它们预测的感官类型不同(前者预测本体感觉,后者预测视网膜输入),而底层的计算策略是相同的。
- 精度塑造连接:精度加权不仅调节注意力和感官平衡,还是动态重构大脑中有效连接 (Effective Connectivity)一个神经系统对另一个神经系统施加的因果影响。它与固定的“结构连接”不同,会根据任务和情境快速变化。的主要机制。
- 瞬时组装的子系统:通过改变精度分布,大脑可以“软组装”出临时的、任务特定的神经回路(TALoNS),实现极大的处理灵活性,这是一种“涌现的软模块化”。
- 理解他人行动:镜像神经元系统可以通过PP框架来解释。我们利用自己用于产生行动的生成模型,来预测和理解他人的行为意图。
- 区分自我与他人:关键在于精度的调节。在观察他人时,我们会有选择地降低自身本体感觉预测误差的精度,这样我们就不会模仿对方的动作。而在自己行动时,本体感觉预测误差的精度则非常高,从而驱动身体运动。
- 心理模拟:同样通过降低本体感觉误差的精度,我们可以“离线”运行生成模型,进行关于未来行动的心理模拟,以支持规划和推理,而不会实际产生动作。
- 驳斥“受控幻觉”论:PP理论并不意味着我们与真实世界隔绝。相反,它解释了我们如何透过充满噪声和歧义的感官数据,把握到世界真实的、与行动相关的结构。
- 世界是为行动而解析的:大脑的目标不是构建一幅精确的、与行动无关的世界图景,而是为了引导有效的行动。我们感知到的世界充满了可供性 (Affordance)源自生态心理学的概念,指环境为特定行动者提供的行动可能性(例如,椅子“提供”了“坐”的可能性)。在预测加工模型中,对可供性的知觉被认为是指导行动选择的关键。。
- 可供性竞争假说:大脑会并行地计算多种可能的行动方案,这些方案相互竞争,直到一个胜出。PP模型通过其概率性和行动导向的特性,自然地实现了这一点。
- 感知的非重构性:许多任务(如接飞球)并不需要大脑完全重构外部世界,而是可以通过巧妙的感知-行动循环,利用环境中的简单信息来解决。PP大脑会学习并选择这类计算成本低的“捷径”策略。
- 错觉是“最优感知”:许多视错觉并非大脑计算失误,而是在充满不确定性的世界中,根据以往的统计经验做出的“最佳猜测”。这些错觉是在特定(通常是生态上罕见的)情境下的最优解。
- 核心:将PP框架应用于主观体验、情绪和精神病理学,其关键在于内感受推理 (Interoceptive Inference)——即对我们自身身体内部状态的预测。
- 精神分裂症再探:该病症的多种症状(如平滑追踪眼动异常、能给自己挠痒、控制妄想)都可以由一个统一的缺陷解释:未能有效衰减自我产生行动所带来的感官信号,这在模型中表现为对高层级先验信念的精度赋权过低,或对低层级感官误差的精度赋权过高。
- 功能性障碍与安慰剂效应:功能性运动/感觉障碍(心因性疾病)可被理解为对身体状态的先验预测被赋予了过高的精度,使其成为“自我实现的预言”。安慰剂效应则体现了这一机制的积极一面。
- 自闭症:可能与精神分裂症呈现相反的精度失衡模式:对高层级先验的赋权过低,而对低层级感官预测误差的赋权过高。这导致世界显得极为嘈杂、充满无法忽略的细节,从而引发感官超载和刻板行为。
- 意识、情绪 (Emotion)在预测加工模型中,情绪通常被理解为对内感受信号(interoceptive signals)的预测和调控。例如,焦虑可能被建模为对身体唤醒状态的预测精度过高,导致对轻微的身体变化过度反应。与自我:我们的“临在感”、身体拥有感乃至情绪体验,都源于大脑对来自身体内外的多模态信号(尤其是内感受信号)进行统一预测推断的过程。情绪并非简单的对身体反应的感知,而是对这些反应的成因进行的情境化、预测性推断。
第三部分:为预测搭建脚手架 (SCAFFOLDING PREDICTION)
- PP与具身认知 (Embodied Cognition)一种认知科学观点,强调认知过程深深植根于身体的形态、感觉运动能力及其与环境的动态交互中。行动导向的预测加工模型(action-oriented PP)与具身认知观点高度契合。合流:PP模型并非与强调快速、廉价、世界嵌入式解决方案的具身认知理论相悖。相反,它提供了一个统一框架,解释了大脑如何选择这些策略。
- 元优化:大脑在最小化预测误差的同时,也在最小化模型的复杂性。它在“准确性”和“计算成本”之间寻求平衡,倾向于选择“足够好”的、计算上廉价的策略。
- 策略选择:“模型依赖”和“无模型”的决策方式并非两个独立的系统,而是一个连续谱的两端。大脑通过调节精度,根据情境灵活地组合和切换不同的策略。
- 扩展的预测心智:大脑选择策略的范围并不仅限于内部资源。利用外部工具(如笔记本、手机)来解决问题,也是一种被选择用来最小化预测误差的“行动”。预测误差是粘合大脑、身体和世界的“粘合剂”。
- 逃离黑暗房间:为什么我们不寻求最可预测(即最无聊)的状态?
- 演化先验:我们的生理结构本身就蕴含了对生存至关重要的“先验信念”(如需要食物和水),这些信念覆盖了对简单感官信号的预测。
- 对新奇的偏好:大脑本身可能具有探索和寻求“中等程度”新奇事物的内在倾向(“金发姑娘效应”),这有助于持续优化其生成模型,以适应一个不断变化的世界。
- 人类的独特性:人类认知之所以独特,关键在于我们的预测性大脑与我们所创造的、可累积的文化 (Culture)文化被视为一组共享的先验信念和生成模型,通过文化濡化过程被个体习得。这些共享的预测塑造了个体的知觉、行动和社会互动模式,从而解释了认知的文化特异性。和社会技术环境之间的复杂互动。
- 设计者环境:我们通过教育、工具、符号和制度等方式,构建了“设计者环境”。这些环境为大脑提供了独特的、结构化的感官输入流,从而训练出其他动物所不具备的、能够处理高度抽象概念的生成模型。
- 语言作为精度调节工具:语言不仅用于交流,更是一种强大的认知工具。它为我们提供了一种廉价、灵活的方式来人为地、有针对性地操控我们自己或他人的精度分配,从而引导注意力和重塑认知景观。
- 与他人共同预测:社会互动,尤其是对话,是一个持续的、相互预测的过程。社会规范、个人叙事等文化产物,都是为了降低人际互动中的不确定性,使彼此的行为更加可预测。
- 我们“制定”我们的世界:通过个体行动(采样)和集体行动(生态位构建),我们主动地塑造了我们大脑所要预测的世界。因此,认知和世界是相互定义的、共同演化的。这与被称为“生成主义 (Enactivism)一种激进的具身认知观点,认为认知并非对外部世界的内在表征,而是通过有机体与环境之间的动态耦合“生成”(enact)的。预测加工理论为这种“生成”过程提供了可能的机制性解释,但两者在“表征”(representation)问题上存在张力。”的核心思想高度一致。
- 总结:大脑是一个具身化的预测机器,一个行动导向的“参与引擎”。它通过一个统一的、基于预测误差最小化的原则,将感知、行动、想象、情绪和理性紧密地编织在一起。
- 与具身心智的完美契合:PP理论不仅与具身认知和情境认知理论兼容,而且为其提供了坚实的神经计算基础,解释了大脑如何灵活地利用身体和世界来降低认知负荷。
- 未来的挑战:该理论仍处于初级阶段,面临诸多挑战,包括:探索大脑所使用的具体近似计算方法、比较不同的可能架构、将其扩展到更高级的认知领域(如长期规划和语言推理),以及进一步澄清动机、价值和欲望在预测框架中的确切角色。