《并行分布式处理:认知微结构探索》是认知科学和神经网络领域的开创性著作,标志着连接主义在认知科学中的复兴。本书由加州大学圣迭戈分校认知科学研究所的研究团队撰写,为现代深度学习和人工神经网络奠定了理论基础。第二卷专注于心理学过程和生物学机制的PDP模型,展示了这些模型如何解释人类认知的各个方面。
本卷各章节继续探索我们在第一卷中开始的并行分布式处理研究。第四部分展示了心理学过程的PDP模型,第五部分探索了大脑中并行分布式处理的生物学机制,第六部分提供了对整本书的简要回顾性讨论以及我们对未来方向的思考。
本书各部分相互关联,但通常可以按任意顺序阅读,实际上大多数章节都可以在不参考本书其他部分的情况下理解。然而,读者可能会发现在深入研究第四部分和第五部分章节涵盖的具体主题之前,阅读第一部分的一些章节是有用的。
本部分的章节旨在展示并行分布式处理如何改变我们对认知机制的思考方式。每一章都描述了某个心理过程的模型,展示了该模型如何捕捉该过程的一些基本方面,并提供了思考该过程某些方面的其他、更早期方法的替代方案。
作者:D.E. Rumelhart, P. Smolensky, J.L. McClelland, G.E. Hinton
本章解释了并行分布式处理如何让我们深入图式的表面,到达一个描述层次,使我们能够看到如何保持图式的理想特征,同时使它们更加灵活、对上下文更敏感、更具适应性。
在我们当前的观点中,答案很简单。图式不是"事物"。没有表征对象是图式。相反,图式在需要的时候从大量更简单元素的相互作用中涌现出来,这些元素都协调工作。图式不是显式实体,而是隐含在我们的知识中,并由试图解释它们的环境创造出来。
将并行分布式处理网络概念化为约束网络通常是有用的,其中每个单元表示某种假设(例如,某个语义特征、视觉特征或声学特征存在于输入中),每个连接表示假设之间的约束。
适应度函数:
G(t) = ΣΣ wijai(t)aj(t) + Σ inputi(t)ai(t)
考虑我们对不同类型房间的知识。我们都清楚地知道典型的厨房、浴室、客厅、卧室或办公室是什么样子的。我们知道客厅有沙发和安乐椅,但通常没有烤箱或浴缸;办公室有桌子和打字机,但通常没有床。另一方面,厨房、客厅和办公室都很可能有电话、地毯等。
该系统使用40个房间描述符构建了一个约束网络。当给系统提供"烤箱"这个线索时,它会激活与厨房图式最紧密相关的单元,最终生成默认厨房的完整描述:天花板、墙壁、窗户、小、电话、时钟、咖啡杯、窗帘、炉子、水槽、冰箱、烤面包机、橱柜、咖啡壶和烤箱。
作者:J.L. McClelland, J.L. Elman
TRACE模型是一个三层交互激活网络,包括特征层、音位层和词汇层。每一层内的单元通过抑制性连接相互连接,层间通过兴奋性(自下而上和自上而下)连接相连。
该模型的关键创新是时间维度的处理:每个处理层在时间上复制多次,形成一个动态的工作记忆结构,称为"轨迹"(Trace)。
作者:J.L. McClelland
该模型基于连接信息分布的思想——大致来说,就是使用存储在处理系统一部分的信息来设置或编程同一系统另一部分的连接。基于这一思想的两个相关仿真模型应用于阅读的多个方面,这些方面无法通过第一章描述的词汇识别交互激活模型来处理。
作者:J.L. McClelland, D.E. Rumelhart
该章节考虑了记忆模型的一个现存困境——是在记忆中存储摘要表征还是存储特定经验的枚举。该章节指出,使用分布式表征,您可以两者兼得。在模型中,事件的(长期)记忆轨迹是该事件导致的连接变化或增量。
功能上等同的摘要表征(例如,原型)从特定事件记忆轨迹的叠加中自然涌现。近期或经常重复事件的轨迹可以与摘要表征共存。
作者:D.E. Rumelhart, J.L. McClelland
该章节展示了分布式表征如何提供传统观点的替代方案,即语言知识以明确(尽管不可访问)规则的形式表征。该章节考虑了语言习得文献中规则学习的典型案例——儿童习得英语作为第一语言时过去时的习得。
这个案例经常被引用为规则习得的典型例子,因为儿童在某个阶段会"规则化"不规则动词,经常说"goed"等。我们在本章描述的模型展示了习得过程的这一点和许多其他方面,并且它使用非常简单的学习机制做到了这一点。
规律行为从连接强度变化的叠加中涌现。过去时形成规则的表征隐含在最终的连接强度中,并且在没有依赖于明确但不可访问规则的表述和测试的任何设备的帮助下习得。
作者:J.L. McClelland, A.H. Kawamoto
该章节描述了一个分布式模型,将并行分布式处理的优势带到简单句子的处理中,并展示了PDP网络如何配置以产生能够捕捉简单句子基础格结构的表征。
该模型展示了许多优秀的属性:它可以基于词序信息将句子的论元分配给适当的格角色;基于句子中不同词汇施加的相互选择约束;以及基于词序和相互约束共同工作。
作者:F.H.C. Crick, C. Asanuma
本章从神经解剖学和神经生理学的角度探讨大脑皮层的结构和功能,为理解PDP模型的生物学基础提供了重要背景。
作者:T.J. Sejnowski
本章讨论了大脑皮层如何进行计算的关键开放性问题,探索了神经网络模型与真实大脑功能之间的联系。
作者:P. Smolensky
本章提供了PDP模型在神经实现层面和概念理解层面的双重解释,架起了计算模型与生物实现之间的桥梁。
作者:D. Zipser
本章探讨了大脑如何处理空间信息,特别是位置识别和目标定位的神经机制,提出了生物学上合理的PDP模型。
作者:P.W. Munro
本章研究了影响大脑学习和适应能力的各种因素,特别关注关键期现象和状态依赖的学习机制。
作者:J.L. McClelland, D.E. Rumelhart
本章从分布式记忆的角度分析失忆症等记忆障碍,展示了PDP模型如何解释各种记忆损伤模式。
作者:D.A. Norman
本章回顾了PDP方法对认知科学的深远影响,讨论了这一范式的优势、局限性以及未来的发展方向。
书末展望了并行分布式处理领域的发展前景,包括理论发展、技术进步和应用扩展等方面的可能性。
不同于传统的局部表征,PDP模型采用分布式表征,其中概念或特征在多个单元上分布表示。这种表示方式具有更强的容错性、泛化能力和处理能力。
PDP系统通过约束满足过程进行信息处理,系统在各种约束之间寻找最优解,这种机制能够处理不完整、矛盾或噪声信息。
复杂的认知现象从简单单元的相互作用中涌现,而不是预先编程的规则。这种涌现性是PDP模型的核心特征。
包括反向传播算法在内的各种学习算法,使网络能够通过经验自动调整连接权重,实现适应性学习。
《并行分布式处理》的出版标志着认知科学的一个重要转折点,从符号处理范式向连接主义范式的转变。这种转变不仅改变了我们对心理过程的理解,也为人工智能的发展开辟了新道路。
这本书不仅提供了具体的计算模型,更重要的是提出了一个全新的认知科学研究框架。正如作者所说,这些模型并非最终答案,而是通向更深层理解认知微结构的"踏脚石"。
书中描述了一个完整的井字棋游戏系统,包含两个相互连接的松弛网络:一个用于决定下一步棋,另一个作为"对手模型"预测对手的反应。这个系统能够进行"心理模拟",在内部完整地模拟一局井字棋游戏。
该模型包含67个单元:9个响应单元(对应9个可能的移动),18个棋盘单元(9个代表己方棋子,9个代表对手棋子),以及40个隐藏单元用于检测棋盘模式和激活各种响应选择。
使用一个16单元的约束网络来模拟Necker立方体的两种可能解释。每个单元代表关于立方体顶点的假设,网络通过约束满足过程在两种解释之间切换,展示了视觉感知中的双稳态现象。
使用40个房间描述符构建的网络,能够根据部分信息识别和补全房间类型(厨房、客厅、卧室、办公室、浴室)。该系统展示了图式理论在PDP框架中的实现,以及默认值填充和上下文敏感性等关键特性。