预测加工理论(Predictive Processing,PP,即近年在认知科学领域出现的预测编码理论Predictive Coding)的基本观点:大脑可以看作一个“概率预测的机器”(probabilistic prediction machine),持续地将“自上而下”的先验预测结果与“自下而上”的实际知觉输入进行匹配,推断出当下知觉的原因并据此采取行动,以降低先验预测结果与实际状态之间的误差。理论的核心在于大脑对知觉来源的主动预测和神经建构,即依靠感官的输入大脑如何建构关于外部世界的知觉。PP理论用大脑神经元的联结以及联结过程中所涉及的数学模型来刻画认知活动,能提供一个“关于知觉、认知和行动的深度统合的理论”(理论支持者的观点),为心灵活动提供一种“大一统”理论的可能性。
这种自上而下的感知理论的雏形可以追溯到19世纪普鲁士物理学家亥姆霍兹(H. Helmholtz)提出的“无意识推理”思想。伊曼努尔·康德曾经认为,大脑是通过内在的心智概念来理解复杂的感官世界的。威廉·詹姆斯:“观念变成了真的,是事件使它为真的。它的真实性实际上是一个事件,一个过程:也就是它证实自身的过程,它的证实活动。它的有效性就是使之生效的活动过程”。1860年代,亥姆霍兹提出的“间接知觉”理论把知觉看成是一种无意识的推理活动,认为知觉会根据似然原则进行推理,将所接收的杂多的知觉刺激信息知觉为最有可能形成该刺激图案的客体。也就是说知觉系统会利用所接收到的关于环境的信息来推理实际上的可能客体。
PP理论内核的形成受益于贝叶斯推理(Bayesian inference)以及神经科学和脑科学的最新研究成果。近十年来,该理论正在试图发展成为解释知觉、行动、注意力的大一统认知研究范式,其代表人物包括:神经科学家弗利斯顿(K. Friston)、弗里斯(C. Frith)以及哲学家克拉克(A. Clark)、侯宜(J. Hohwy)等。PP理论的基本概念有分层生成模型,预测误差最小化,自由能最小化,感知推理,积极推理,贝叶斯推理,近似贝叶斯推理,马尔科夫毯等。
大脑对知觉的神经建构包含了“自上而下”与“自下而上”两种不同的预测加工形式:
这两种预测加工方式同时发生作用,并由此形成了一个复杂的“层级预测”模型。
一旦输入的感官证据与大脑自上而下的先验预测结果不一致时,预测误差(prediction errors)就产生了。为了消除预测误差或使之最小化,生命必须采取行动以改变整个状况的某个方面,或者修正自身已有的模型,从而消除预测误差,重建与环境的顺利互动。这时较低层级的神经环路就会自下而上地将误差提示传入较高层级的神经环路,以修正和更新原来的预测结果并最终形成最佳的预测结果。从这个意义上说,知觉内容并非取决于外部世界的感官刺激,而是大脑通过不同层级的神经环路间彼此刺激而生成的关于外部世界预测的结果。弗里斯:“我的知觉不是世界本身,而是我大脑中的世界模型。”
《新机器智能》On Intelligence 霍金斯
第5章 记忆-预测模型,全新的智能理论
第6章 记忆-预测模型是如何工作的
在PP理论中,模型的一个基本功能就是生成预测,因此模型也称为“生成模型”(generative model)。已建立的模型(或者知识)只具有假设和暂行的(hypothetical and tentative)地位,它不是一个独立、自足的终点,而是生命采取行动策略的基础。
克拉克进一步强调,预测误差的基本功能与其说是帮助生命更新其关于世界状况的知识,不如说是引导生命与现实世界实现流畅的互动,因此,不能将预测加工单纯地理解为“将证据(感知输入)、先验知识(产生预测的生成模型)以及对不确定性的评估(通过调整预测误差的精度权值)结合起来,产生一个关于世界状况的多尺度最佳猜测”。PP与实用主义认识论的一致性在于,它不是一个狭义的认知理论,而是一个关于认知与行动如何结合最终服务于生命的理论。大脑积极生成层级预测的同时,还通过“积极推理”(如引发身体的行动)获取最新的知觉信息,以协助大脑对引起知觉的远端起因进行调控和解释。由此,知觉作为调节预测结果的参数,以及行动作为改变预测对象的手段,在预测加工的解释框架中获得了统一。安迪·克拉克《预测算法:具身智能如何应对不确定性》
《Philosophy and Predictive Processing》Thomas Metzinger & Wanja Wiese (Eds.),2017 by MIND Group
1 Vanilla PP for Philosophers: A Primer on Predictive Processing ,Wanja Wiese & Thomas Metzinger