1.2.2.14.8 预测加工理论

1.2.2.14.8 预测加工理论

预测加工理论(Predictive Processing,PP,即近年在认知科学领域出现的预测编码理论Predictive Coding)的基本观点:大脑可以看作一个“概率预测的机器”(probabilistic prediction machine),持续地将“自上而下”的先验预测结果与“自下而上”的实际知觉输入进行匹配,推断出当下知觉的原因并据此采取行动,以降低先验预测结果与实际状态之间的误差。理论的核心在于大脑对知觉来源的主动预测和神经建构,即依靠感官的输入大脑如何建构关于外部世界的知觉。PP理论用大脑神经元的联结以及联结过程中所涉及的数学模型来刻画认知活动,能提供一个“关于知觉、认知和行动的深度统合的理论”(理论支持者的观点),为心灵活动提供一种“大一统”理论的可能性。

这种自上而下的感知理论的雏形可以追溯到19世纪普鲁士物理学家亥姆霍兹(H. Helmholtz)提出的“无意识推理”思想。伊曼努尔·康德曾经认为,大脑是通过内在的心智概念来理解复杂的感官世界的。威廉·詹姆斯:“观念变成了真的,是事件使它为真的。它的真实性实际上是一个事件,一个过程:也就是它证实自身的过程,它的证实活动。它的有效性就是使之生效的活动过程”。1860年代,亥姆霍兹提出的“间接知觉”理论把知觉看成是一种无意识的推理活动,认为知觉会根据似然原则进行推理,将所接收的杂多的知觉刺激信息知觉为最有可能形成该刺激图案的客体。也就是说知觉系统会利用所接收到的关于环境的信息来推理实际上的可能客体。

PP理论内核的形成受益于贝叶斯推理(Bayesian inference)以及神经科学和脑科学的最新研究成果。近十年来,该理论正在试图发展成为解释知觉、行动、注意力的大一统认知研究范式,其代表人物包括:神经科学家弗利斯顿(K. Friston)、弗里斯(C. Frith)以及哲学家克拉克(A. Clark)、侯宜(J. Hohwy)等。PP理论的基本概念有分层生成模型,预测误差最小化,自由能最小化,感知推理,积极推理,贝叶斯推理,近似贝叶斯推理,马尔科夫毯等。

大脑对知觉的神经建构包含了“自上而下”与“自下而上”两种不同的预测加工形式:

  • “自上而下”的预测:大脑利用已有的知觉结构,形成一个独立于认知经验内容的先验预测;
  • “自下而上”的预测:大脑基于当下的知觉输入而进行的预测。

这两种预测加工方式同时发生作用,并由此形成了一个复杂的“层级预测”模型。

一旦输入的感官证据与大脑自上而下的先验预测结果不一致时,预测误差(prediction errors)就产生了。为了消除预测误差或使之最小化,生命必须采取行动以改变整个状况的某个方面,或者修正自身已有的模型,从而消除预测误差,重建与环境的顺利互动。这时较低层级的神经环路就会自下而上地将误差提示传入较高层级的神经环路,以修正和更新原来的预测结果并最终形成最佳的预测结果。从这个意义上说,知觉内容并非取决于外部世界的感官刺激,而是大脑通过不同层级的神经环路间彼此刺激而生成的关于外部世界预测的结果。弗里斯:“我的知觉不是世界本身,而是我大脑中的世界模型。”

《新机器智能》On Intelligence 霍金斯

第5章 记忆-预测模型,全新的智能理论

第6章 记忆-预测模型是如何工作的

在PP理论中,模型的一个基本功能就是生成预测,因此模型也称为“生成模型”(generative model)。已建立的模型(或者知识)只具有假设和暂行的(hypothetical and tentative)地位,它不是一个独立、自足的终点,而是生命采取行动策略的基础。

克拉克进一步强调,预测误差的基本功能与其说是帮助生命更新其关于世界状况的知识,不如说是引导生命与现实世界实现流畅的互动,因此,不能将预测加工单纯地理解为“将证据(感知输入)、先验知识(产生预测的生成模型)以及对不确定性的评估(通过调整预测误差的精度权值)结合起来,产生一个关于世界状况的多尺度最佳猜测”。PP与实用主义认识论的一致性在于,它不是一个狭义的认知理论,而是一个关于认知与行动如何结合最终服务于生命的理论。大脑积极生成层级预测的同时,还通过“积极推理”(如引发身体的行动)获取最新的知觉信息,以协助大脑对引起知觉的远端起因进行调控和解释。由此,知觉作为调节预测结果的参数,以及行动作为改变预测对象的手段,在预测加工的解释框架中获得了统一。安迪·克拉克《预测算法:具身智能如何应对不确定性》

《Philosophy and Predictive Processing》Thomas Metzinger & Wanja Wiese (Eds.),2017 by MIND Group

1 Vanilla PP for Philosophers: A Primer on Predictive Processing ,Wanja Wiese & Thomas Metzinger

1.2.2.14 贝叶斯大脑(Bayesian Brain)

1.2.2.14.1 第一个证明大脑皮层特定区域能够实现动态贝叶斯推断的实验

论文:大脑皮层中动态贝叶斯推理的神经基质(Neural substrate of dynamic Bayesian inference in the cerebral cortex)

Akihiro Funamizu, Bernd Kuhn & Kenji Doya

https://www.nature.com/articles/nn.4390

日本冲绳科学技术大学院大学(OIST)神经计算系和视觉神经成像系合作的一个项目里,Akihiro Funamizu博士、Bernd Kuhn教授和Kenji Doya教授分析了小鼠在感官输入受到障碍时接近目标物的大脑活动,第一次有实验证据证明大脑皮层的特定区域能够实现根据动作信息实现动态贝叶斯推断。研究结果于2016年9月19日发表于《自然-神经科学》(Nature Neuroscience)网站。

动态贝叶斯推理让系统能够在感知到的信息十分有限的情况下对周围环境状态进行推理。实验发现后顶叶(PPC)和相邻的后内侧皮质(PM)实现了动态贝叶斯推理的基本特征:使用一个内在的状态转换模型对不可见的状态进行预测,并使用新的感官证据更新这一预测。研究结果表明,哪怕感官输入受阻,顶叶皮层也能根据小鼠自身的运动预测目标距离,并且在感官输入可得时,预测能力也能提升,正如动态贝叶斯推断一般,大脑能依据过去的感官输入和动作推断当前的情况。Doya教授说:“这可能就是心理模拟的基本形式。”心理模拟是行动计划、决策、思考和言语的基础过程。

1.2.2.14.2 《贝叶斯的博弈:数学、思维与人工智能》黄黎原

第 19 章 贝叶斯大脑

我们的大脑是一个了不起的计算器,能对贝叶斯公式进行各种各样的近似计算。…那些通常处于无意识中的已有认知过程及其实际应用似乎惊人地吻合贝叶斯主义的计算。

第 20 章 一切都是虚构

大脑之外的世界是否存在?

从 1983 年开始,深度学习的奠基者之一、心理学家和计算机科学家杰弗里·欣顿(Geoffrey Hinton)就与合作者一同指出,大脑的行为就像一台依靠感官得到的观察结果进行预测的机器。1988 年,埃德温·杰恩斯(Edwin T. Jaynes)提出,大脑完成这一任务的方法依赖于贝叶斯公式(《Maximum-Entropy and Bayesian Methods in Science and Engineering》”2. How Does the Brain Do Plausible Reasoning”)。在 20 世纪 90 年代,欣顿和弗里斯顿(Karl Friston)由此发展了一个模型,其中大脑与外部世界被一个马尔可夫毯(Markov blanket)分隔,但大脑仍然能够重建有关整个外部世界的模型,它利用的正是由弗里斯顿在 2013 年推广到生命领域的变分贝叶斯推断(Friston提出的自由能原理)。

弗里斯顿、欣顿和杰恩斯的假说,就是我们的大脑能够仅仅从感官数据出发,重建整个关于外部世界的模型。这个关于人类思维如何运作的假说最惊人的地方,就是大脑构建关于外部世界的模型仅仅是为了解释来自感官的感受。

1.2.2.14.3 自由能原理(Free Energy Principle,FEP)

FEP通过一个马尔可夫毯建模,试图最小化他们的世界模型和他们的感觉和相关知觉之间的差异,并通过不断修正系统的世界模型来减少这种差异。因此FEP是基于贝叶斯的观点,即大脑是一个“推理机”。

集智百科 https://wiki.swarma.org/index.php/自由能原理

1.2.2.14.4 《Open Mind》 “35 The Cybernetic Bayesian Brain” Anil K. Seth

https://open-mind.net/papers/the-cybernetic-bayesian-brain

在认知科学中,有一项理论逐渐流行,即认为大脑基本上可以看做是一种预测机——prediction machines,这项理论被称为贝叶斯大脑(Bayesian brain),预处理(predictive processing,PP)和预测心理(predictive mind)理论。

PP理论认为,知觉是大脑推理得到的感觉的输入,即是实际的感官信号和不断更新的预测模型基础之上的预期信号之间的差异的结果。可以说,PP理论提供了解释知觉,认知,和行动之间的基本理论原则和结构的最完整的一个框架。

为了支持适应性反应,大脑必须发现外部“隐藏”的产生感觉信号信息的原因。它不能直接访问这些原因,只能在信息流中找到感觉信号本身。因此,为了做到这一点,大脑产生了许多预测感官输入的模型,并且通过预测误差来更新模型以减少误差。对于皮质区,传统的观点描述感知很大程度上是自下而上的过程。而PP则相反,提出感知的内容是决定于自上而下的预测信号,而且预测信号由多层次与分级组织的处理感官信号的模型所生产。而这些模型也是处于不断的更新与完善之中的。这就意味着大脑可以归纳出愈发精确的关于外部隐藏信息的生成模型。

PP理论可以看做是自由能原理的一种特殊情况。这样假设的一大好处是为PP理论带来了丰富的数学框架,使PP可以运用于实践。而且形式上取决于既的定原则的贝叶斯推理和模型规范。生物(神经)机制通过贝叶斯近似计算来实现显示的预测推理,在这一点上,自由能原理可以拥有最大的解释力。

PP理论和自由能理论与控制论的渊源。一些对控制论的总结范式提供了一个独特的PP理论认知与生物适应性关联的视角。可以概括为,认识的目的(包括感知和行动)是维持必要的变量和组织内部的平衡(超稳定性)。这意味着要有一个足够复杂的响应控制机制的存在(即抑制力)来响应各种扰动(必要多样性定律)。此外,这种结构必须通过实例模型的系统被控制(良好的调节定理),系统包括人体和环境(以及它们之间的相互作用)。就像Ashby所称的“整个的大脑的功能可以概括为:纠错”。由此我们可以说,感觉是一种对组织稳态的一个更基本的命令的成果,而不是在一些过程中的内部世界模型的构建阶段。

“大脑是一个贝叶斯网络,我们的思维就是贝叶斯网络金字塔的顶端”这个大胆的观点被越来越广泛地受到神经科学家、物理学家和心理学家的认同。从初级脑区到高级脑区,大脑在进行贝叶斯计算。通过理论与数学框架的联系,科学家们可以找出大脑进行贝叶斯计算的基本单位“范式回路”。

1.2.2.14.6 “Are our brains Bayesian?”Robert Bain

https://rss.onlinelibrary.wiley.com/doi/full/10.1111/j.1740-9713.2016.00935.x

审视控制感知和运动的无意识过程以及管理我们如何思考和评估证据的高级认知过程:

剑桥大学神经科学研究中心的Daniel Wolpert教授认为,我们拥有的贝叶斯大脑对我们所做的每一个动作的结果进行可靠快速的预测。在贝叶斯公式下,“信念”是我们的大脑已经知道的关于世界的本质,而“证据(经验)”是我们的感官关于现在正在发生什么的输入。当我们经历生活时,我们的大脑收集不同运动任务的统计数据,并将这些以贝叶斯方式与其他数据相结合。Erno等人发表在“ 科学”杂志上的一项研究,一岁大的婴儿“期望与贝叶斯观察者模型一致”,反映了“理性概率期望”。

其他研究人员已经在更高层次的认知中发现了贝叶斯主义的迹象。加利福尼亚大学伯克利分校的Tom Griffiths和麻省理工学院的Josh Tenenbaum在2006年的一项研究中要求人们预测人们将活多久,电影会赚多少钱,以及政客们上任的时间。他们获得的唯一数据是到目前为止的运行总数:当前年龄,到目前为止的资金,以及迄今为止在办公室服务的年数。研究人员发现,人们的预测与贝叶斯计算得出的预测非常接近。这表明大脑不仅掌握了贝叶斯定理,而且还基于对人类生命跨度,票房收入和政治任期的不同分布模式的理解,对这些现实生活现象进行了精细调整。

1.2.2.14.7 贝叶斯大脑假说 “The Bayesian Brain Hypothesis:How our brain evolved to look into the future” Manuel Brenner

The Bayesian Brain Hypothesis

贝叶斯推理(Bayesian Inference)发生在多个认知层面,从动作控制到注意力和工作记忆。每一个认知任务都会根据贝叶斯推理得出自己的预测、自己的内部模型以及独一无二的时间表。大脑并不仅仅是一个消极接受外界信息并对其做出回应的检测器。事实上,大脑采用自上而下的模式(指高阶概念首先对接受低阶感觉数据的方法进行塑造),对世界是什么样的,以及世界将会是什么样的作出假设,从而不断更新其对世界的印象。

1)稳态(homeostasis)

稳态指维持生命系统内部的物理和化学过程,使得生命系统保持完整,防止消散,是一种能够与自然界的无序倾向相抵抗的自组织原则。安东尼奥 · 达马西奥定义了内稳态:生命系统并不是静态的,生命有自主性,为了将意外最小化,并在充满不确定性的未来中存活下去,它们不断优化以更好地适应未来。

2)预测未来

人类千方百计地想要预测并改变未来。为了减少未来的不确定性,我们(以及我们的大脑)基于当前对世界的认识,尽可能地对未来作出预测,并思考应该怎样指导自己的行为,使得结果更加有利于生存。

3)世界的内部模型

如果想要对世界的行为,特别是未来的行为建模,大脑需要有一个“世界是什么”的内部模型,来了解“世界可能成为什么”。大脑需要能够在接受世界状态的最新信息后,更新世界的内部模型。采用统计最优的方法,基于最新信息更新内部模型的概率分布,这就是贝叶斯推理。我们通常可以在行为实验中,或关联各个感官输入时,观察到大脑的这种推理。比如1992年Britten等人的目视动作分析(https://www.ncbi.nlm.nih.gov/pubmed/1464765)表明,猴子大脑会基于对刺激作出的神经反应或发射率,尝试解码目视动作一致性,其解码速率会向贝叶斯最佳解码速率靠近。

4)贝叶斯大脑假说

大脑试着利用世界生成模型来推断其感觉的成因。为了成功地对外界建模,大脑必须能够在一定程度上对外界发生的事情进行模拟。Karl Friston认为:如果大脑想要推断感觉的成因,它必须先对生成感觉输入的世界的(隐性)状态之间的关系/联结建模。之后,神经元联结便会对生成感觉信息的联结进行编码(建模)。贝叶斯大脑存被赋予了外部世界的内部表征,这两者被马尔可夫毯(Markov blanket)隔开。

贝叶斯大脑假说的第一个重点:大脑中的世界内部模型认为,大脑模型中的进程在物理世界中进行。为了成功地预测未来,大脑需要在其硬件上模拟世界。这些过程必须遵循与外部世界相似的随意性,而在观察外部世界的大脑中,一个自身的世界会变得活跃起来。第二个重点与贝叶斯推断相关:即在某种程度上,大脑是最优的,因为人类需要预测自然何时会受到影响。在分类知觉的内容或在不确定的情况下作决定时,贝叶斯大脑的工作水平近似于贝叶斯最优水平。这也就意味着,大脑在推断世界的未来(隐性)状态时,会尽可能多地考虑所有可获得的信息和所有概率约束。

科学家们仍然在激昂地争论这一理论的有效性,以及大脑实际上是如何在功能水平上应用贝叶斯推理的重大问题。

1.2.2.13 意识过程的进化机制

1.2.2.13.1 快过程(初级意识/C0意识)

《比天空更宽广》第5章 意识的机制

图7 折返式连接导致初级意识。两大关键信号类型——来自“自我”的,包括价值系统以及大脑和身体还有感觉器官的调节部位,以及来自“非自我”的,来自外部世界,通过全局映射转换的信号。与价值有关的信号和来自外部世界的范畴信号相关联并导致记忆,从而使得概念分类成为可能。“价值范畴”以及由折返式通路(加重线)连接到当前来自外部世界的感知分类信号。折返式连接是重要的进化环节,导致了初级意识的出现。一旦扩展至多个模块(视觉、触觉,等等),初级意识便构成一个“场景”,由对物体和事件的响应组成,其中一些并不必然具有因果关联。尽管如此,具有初级意识的动物还是能通过之前负载有价值的经验记忆对物体和事件进行区分和关联。这种能力增加了其生存适应能力。…是记忆和持续的感知之间的动态互动导致了意识。

折返式连接(正/负反馈闭环)导致意识过程的形成:感觉器官不断的感知 -> 反应/反射/反馈 -> 情绪 -> 感受 -> 意识

A 感觉器官 -> B 脑干、丘脑等模块(感觉神经) -> C C0意识模块/相关对象的模型的神经元网络(与预测模型一致) -> 脑干、丘脑等模块(运动神经) -> 感觉器官/行动器官(肌肉、骨骼)。同时存在大量的 B -> A、C -> A 的折返式连接。

大脑中存在大量的折返式连接:大脑的3个主要的神经生理结构(图3)。首先是丘脑皮质系统,通过丰富的往返连接将本地和远程的神经元群紧密连接到一起。其次是基底核抑制回路的多突触环状结构。再就是不同价值系统的扩散性上行投射。《比天空更宽广》第5章 意识的机制

图3 大脑中3类神经生理系统的基本结构。上图展现了丘脑皮质系统的大致拓扑,在皮质和丘脑之间以及不同皮质之间的往返连接组成的稠密网络。中图显示了连接皮质与基底核等下皮质结构的多突触环路。这些环从基底核延伸到丘脑,然后又延伸到皮质,再又从目标皮质返回到基底核。这些环路一般来说都不是往返式的。下图显示的是价值系统的扩散投射,图中从蓝斑(locus coeruleus)发出的“毛发网”状轴突散布到整个大脑。一旦蓝斑被激发,这些轴突就会释放出神经调节素去甲肾上腺素(noradrenaline)

折返式连接:缠结的层次结构,自我闭合的生产网络。闭合生产网络具有创造和构建、自我维持和自我修复的优良特性。

埃舍尔《画手》

感官知觉、记忆、经验、想像和理性都是被一个共同的纽带联结在一起的,它们仅仅是同一种基本活动的不同阶段和不同表现形式而已。” 《人论》恩斯特·卡西尔 第一章 人类自我认识的危机

“知觉不是通过积累获得的数据实现的,而是通过将预测与传入的感官数据相匹配实现的。” 《隐藏的自我》大卫·伊格曼(David Eagleman) 02 我们感知的世界都是由大脑构建的

“大脑由竞争的子系统组成:一个系统是自动化的、启发式的;另一个系统是有意识的、分析性的。

理性处理一件事,情感处理另一件事,且它们都认为自己处理问题的方法是正确的。

我们的行为是短期欲望和长期欲望斗争的结果。” 05 我们的行为是大脑不同系统竞争的结果

1.2.2.13.2 慢过程(高级意识/C1意识)

《比天空更宽广》第9章 高级意识和表征

图12 高级意识的进化。具有语义能力的灵长类动物出现了新的折返式环路,并且随着人类进化过程中语言的涌现,这种折返式环路也大量增长。新的记忆形式的产生,语义能力的拓展,再加上具有语法的真正的语言,最终导致了概念的爆发式增长。高级意识因而得以出现,自我、过去和未来的概念也与初级意识连接起来。对意识的意识也成为可能(与图7中的初级意识比较)

在一个较长(大于300ms)过程中,大量低级意识(C0意识、潜意识,处理短时程的神经元复馈回路/折返单元),在全脑空间通过价值网络(C2意识),辅之以躯体标记,竞合形成或涌现出解释/判断/决策等高级意识过程(C1 意识),同时通过解释器队列形成记忆模型并固化。

感觉器官 -> 脑干、丘脑等模块 -> C0意识模块/相关对象的模型的神经元网络(与预测模型不一致) -> 躯体标记(身体约束):竞争(300ms)全脑神经工作空间(GNW) -> C1意识模块 + C2意识模块(价值网络)形成解释/预测/决策/判断 ->

| -> C0意识模块/脑干、丘脑等模块 -> 感觉器官/行动器官(肌肉、骨骼)

-> |

| -> 解释器 -> 记忆储存/更新模型/形成新的预测

虚构(预测)对于人的必要性。闭环反馈回路:记忆 -> 虚构(提前预测)-> 加工过程 -> 验证/修正

1.2.2.13.3 高级意识可以进行模拟学习过程

C1意识模块 ->

| -> C0意识模块/脑干等模块 -> (?)感觉器官/行动器官(肌肉、骨骼)

-> |

| -> 解释器 -> 记忆储存/更新模型/形成新的预测

大脑的C1意识部分训练神经机器的其他部分(C0意识),建立目标并分配资源。C1意识是长期的计划者,系统的其余部分则学习如何去实现它们。在大脑的逻辑中,如果没有合适的工具,就自己做一个 —— 重新设计自己的神经回路,原本只能靠C1意识笨拙、低效(慢、耗能高)地完成的艰巨任务能够快速而高效地完成。

模拟学习:不通过大量的行动器官的实际训练,只用 C1意识调用C0意识模块模拟过程并形成优化后的固化的神经回路。

1.2.3 意识定义综述

1.2.3.1 意识理论(ToC)综述文章
1.2.3.2 一些基础假设/已知事实

1.2.3.2.1 变化的系统

1、内部身体系统

2、外部环境系统

3、内外部系统持续随时间变化

4、系统变化满足数学、物理的基本规律

1.2.3.2.2 进化

1、意识是进化过程中逐步出现的。(《人类存在的意义》14 自由意志 爱德华 · 威尔逊)

达尔文的一个关键思想藏在他的群体思想的观念中:群体中各种各样的个体为了生存相互竞争,从而通过选择涌现出功能性结构和完整的生物组织。我认为无论是考虑大脑的进化,还是思考其发育和功能,这个思想都很关键。”《比天空更宽广》第4章 神经达尔文主义——全脑理论 埃德尔曼

2、大脑的生长发育过程也是进化发展的过程, 有一个出生、学习、成长、衰亡的神经元群不断内部进化的个体生长过程。人脑发育过程

1.2.3.2.3 神经元、脑、身体、环境

神经元加工活动是意识的基础:“思想、观念和感知都是神经元的活动;我们所知道的一切都储存在神经元之间的连接中。”《千脑智能》

身体和脑形成一个完整的有机体,通过化学和神经途径充分相互作用。脑活动的主要目的是通过协调身体本身的内部运作,以及协调整个机体与环境的物理和社会方面之间的相互作用,来协助调节有机体的生命过程。脑活动主要是为了健康地生存;为这样一个主要目标而装备的脑,可以从事任何次要的事情。《寻找斯宾诺莎》第5章 身体、脑与心智

在决定“我们是谁”的游戏中,大脑不是唯一的参与者。… 基因对行为的影响只能在与环境的相互作用下完成,单纯的生物特性或环境条件都决定不了最终的结果。… 既不能选择自己的先天特性,也不能选择后天的成长环境,更不用说它们之间纠缠不清的复杂作用了。这就是人们拥有不同的世界观、不同的个性和不同的决策能力的原因。这些不是由你来选择的,而是你一开始就被发到的“牌”。《隐藏的自我》大卫·伊格曼(David Eagleman)07 大脑不是决定自我的唯一参与者

1.2.3.2.4 模块化、层级化结构

1.2.3.2.4.1 模块化结构,可重复的闭环反馈回路

存在大量的完成初级/低级意识功能的“潜意识”(或C0意识)模块。

  • 模块化结构:《意识本能》第4章 模块化的脑。
  • 大量的初级意识:可视化的硬件(四肢、器官、血肉、体液等),感觉(身体感受)、感知(对外部事物的感知能力,包括视、听、味、嗅、触)、认知(记忆、思考、想象等)、情感(情绪感受)。

初级意识机制的涌现:《比天空更宽广》05 意识的机制 P92。

  • 躯体是初级意识的基础、来源、组成部分、进化起点。

模块由可重复的闭环反馈回路组成:

1、可重复:

  • “意识的所有组成部分(嗅觉、痛觉、视觉、自我意识等等)共有一个或若干个机制”————克里克和科赫对意识提出了两个假设;
  • 芒卡斯尔:新皮质的每一部分都是基于同一原则工作的:所有我们认为与智能有关的东西,表面上看起来是不同的,实际上都是同一个基本的皮质算法的表现。

2、闭环反馈回路(皮质柱?):

  • “记忆/感知”——“提前预测”——“加工过程”——“验证/行动”。
  • 自下而上、自上而下的双向反馈回路(先形成预测,然后通过自下而上的输入不断修正,指导行为符合预测)《人类的荣耀》P804-P812
  • 提取模型、比较预测、形成更新的模型、存储模型(学习回路、预测回路)《千脑智能》
  • 对象——联想到的相关对象网络——底层意识/身体部件约束 + 深度学习后的神经网络策略——高级意识

《比天空更宽广》第3章 大脑组成 埃德尔曼:

人们可能会倾向于认为大脑功能的关键是模块性。…模块性思想是基于对大脑部位切除后的影响的过于简单的解读,…并不能就此得出这些区域是特定行为的唯一源头。必要并不等于充分。另一个极端,整体论观点也是不可取的——必须同时考虑到大脑活动的整合性和区域性。如果考虑大脑功能分隔的区域以复杂却又整体的方式连接成一个复杂系统,区域论者和整体论者之间长期的争论就会平息。这种整合是意识涌现的关键。

穿越边界 《脑机穿越:脑机接口改变人类未来》米格尔·尼科莱利斯

神经元时空连续体假设:皮层区域间并不存在绝对的或固定的空间界限,这些界限决定或限制了大皮层的功能性活动。相反,我们应该把大脑皮层设想为一个强大但有限的神经元时空连续体。在这个连续体中,被“征用”的神经元时空部分基于一系列的限制,被分别配置给一些功能和行为。这些限制包括物种的进化史、基因及早期发展所决定的大脑布局、大脑内在的动态状态、其他身体局限、任务背景、大脑可以使用的能量总数以及神经元放电的最大速度。

从根本上说,我们不应该把大脑看成是分离的、高度专门化且各自为政的皮层区域,或是根据严格的等级拼凑在一起的嵌合体。虽然最初设定了大脑皮层的布局,但在需要的时候,神经元集群依然能被“征用”。那些个体发育的专门化,就像有特色的独奏,存在于雄浑有力的多通道交响乐以及动态的皮层互动之上。动态的皮层互动决定了相对性大脑在其独特存在中的工作方式。

大自然为什么在我们的成长早期投入这么多精力来构建这些高度分离的感觉通路(更不用说非常有条理的皮层地形图了),但它后来又为什么决定放弃这些成果,采用相对性大脑的假设?皮层的放电活动似乎不只局限于或不在意传统细胞结构学所说的边界。相反,它们会越过边界,就好像那些边界只是某些人大脑幻想出来的东西。

1.2.3.2.4.2 层级化结构

《意识本能》第5章 层级化的脑

为了兼具稳健性和功能性,有组织的技术系统和生物系统都选择层级化结构为关键设计策略。

1、涌现(整体大于部分之和):

集智百科的定义: https://wiki.swarma.org/index.php/涌现

意识的出现:多层次非线性系统各层次的自组织自发性涌现的必然性。

涌现出的意识本身大于意识产生过程的总和(涌现:整体大于局部之和);同时整体的一个属性可以对应多个局部的组成方式(非还原论)。

  • 所有意识状态都是由更低级的大脑加工过程产生的,所以意识是一种涌现的现象,是一种物理属性——源自整个身体的输入之和。”《人类的荣耀》P788
  • 意识的出现是一种相变,就像水的沸腾。当条件改变时,系统自然会获得新的性质。” 《大图景:论生命的起源、意义和宇宙本身》第42章 光子有意识吗
  • 《当自我来敲门:构建意识大脑》:植物-动物-哺乳动物-人(大脑、意识/自我)提升内稳态的阀值适应范围
  • 非还原性物理主义:否认底层层级的理论和概念足以解释被实现的上层层级的现象(Putnam 1975,Boyd 1980 )

《意识本能》第10章 意识是一种本能

  • 即便你已经对你大脑的当前状态或者说初始状态了如指掌,你也无法预测自己未来的心智状态会如何以自上而下的方式影响你的自下而上的加工。” 斯佩里
  • 结构与功能是两个互补的属性:一个无法解释另一个。如果你不知道一个神经元的功能是什么,你再怎么观察它的结构也无法参透这一点。反之亦然。如果你知道一个神经元的功能是什么,你也猜不到它会长成什么样。没有先验知识,我们无法从神经元的结构推测其功能,也无法从其功能推测出结构。它们是两个独立的、无法简化的层级,拥有不同的工作协议。
  • 在所有的局部元素之外,不需要另外一种元素/属性,来形成整体的某些涌现出的特殊属性。

2、相变

集智百科的定义: https://wiki.swarma.org/index.php/相变

《大图景:论生命的起源、意义和宇宙本身》肖恩 · 卡罗尔

第40章 困难问题

意识的出现就是最引人入胜的相变,它开启了物质自我组织和行动的全新途径。原子不仅能自我组织为复杂又能自我维持的形式,而且这些形式获得了自我觉知的能力,还能思考自身在宇宙中的地位。托马斯·内格尔(Thomas Nagel):“意识的存在似乎意味着……自然的秩序远远没有物理和化学能解释一切的情况下那么索然无味。”

跟“生命”相似,意识更多的是一类相关的特质和现象的集合,而非统一的构想。我们能意识到自身,意识到自身与外界不同。我们可以审视各种可能的未来。我们能体验到感觉。我们可以抽象而符号化地思考。我们能感受到情绪。我们可以重拾记忆,讲述故事,有时候还说谎。这些方方面面的运转方式同时组成了意识,其中一些比别的更容易用纯粹的物理术语来解释。

第42章 光子有意识吗?

意识的出现是一种相变,就像水的沸腾。当条件改变时,系统自然会获得新的性质

意识似乎本质上就是某种集体产生的现象,某种谈论特殊复杂系统的方式,这些系统能够通过内在的状态表现它们自己以及世界的情况。

《复杂性思考:复杂性科学和计算模型》

7.4 相变

在临界值附近行为的迅速变化被称为相变,就像水在冰点从液体变成固体的方式。

当系统处于或接近临界点时,各种各样的系统都会显示出一组共同的行为和特征。这些行为统称为临界现象。

9.8 涌现

涌现性是系统的一种特性,它是由系统各组成部分之间的交互作用而产生的,而不是由它们的特性产生的。

即使我们知道所有的规则,也很难预测系统的行为,它可能是涌现的决定性特征。

对于包含多个组件的物理系统,通常不存在能够产生解析解(解析解通常提供一个恒定时间的预测算法)的模型。(经典模型往往是基于定律的,以方程的形式表述,并通过数学推导求解。属于复杂性范畴的模型通常基于规则,以计算指令的形式描述,通过模拟而非分析求解。)

涌现性从根本上是不可预测的,对于复杂的系统,我们不应该期望以计算捷径的形式找到自然规律。

当我们看到一个明显的涌现性时,我们不应该假设永远不会有一个还原论的解释,但我们也不应该假设一定会有一个。

10.6 涌现和自由意志

自由意志是做出选择的能力,但如果我们的身体和大脑受到确定论物理定律的支配,我们的选择就完全被决定了。哲学家和科学家已经为这一明显的冲突提出了许多可能的解决办法,例如:

– William James提出了一个两阶段模型,其中可能的行动由随机过程生成,然后由确定性过程选择。在这种情况下,我们的行为基本上是不可预测的,因为生成它们的过程包含一个随机元素。

– David Hume提出,我们对做出选择的感知是一种幻觉;在这种情况下,我们的行为是确定的,因为产生它们的系统是确定的。

涌现性为复杂系统提出了一种选择:在选择和决策层面上的自由意志与在神经元层面(或更低层次)上的决定论相容,即一个人可以有自由意志,即使神经元没有。

3、层级间(自上而下、自下而上)可以相互影响、固化(特别是:高层级可以在低层级上形成新的固化模块)。

1.2.3.2.4.3 冗余化结构与简并性

冗余化结构:在发育过程中,大脑会产生海量的多余神经元及过量连接以确保稳健性。等到发育期结束,在合适的环境刺激下通过“修剪”(pruning)的方法摆脱多余的神经元及连接。

简并性(Degeneracy):不同子集合包含的回路并不完全一样;但是激活任何一个子集合,都能够复现某个特定的输出。

《比天空更宽广》埃德尔曼

简并性是指某个系统中结构不同的组分能够执行相同的功能或产生相同的输出。…简并性对于解决复杂神经系统的几项主要问题特别重要。例如捆绑问题。不同的神经元或神经元群又有可能形成结构不同的回路,但仍然有同样的输出。通过折返式连接得到的同步性和一致性使得多种结构可以给出相似的输出。随着这样的简并操作相继发生,分散的神经元群被连接到一起,也就不再像计算机那样需要一个上级程序。…

正是由于神经回路具备这种简并性,当外界条件发生变化和有了新经验的时候,特定的记忆就可以发生变化。因此,在一个简并选择性系统中的记忆是一种重建而不是严格复制。决定记忆分类的并不是预先设定好的某些代码,而是先前的网络群体结构、价值系统的状态,以及在特定时刻所执行的身体动作。这种记忆方式虽然牺牲了精确性,却为联想和创造性创造了条件

1.2.3.2.5 意识是过程

  • 威廉 · 詹姆斯 :“正如大脑的变化是持续性的,所有意识也如同渐隐画面一样相互交融。也许它们就是一条绵延的意识,一条完整的溪流。
  • 意识是过程而不是实体”、“意识作为过程有一系列重要特性,可以称之为詹姆士特性(Jamesian properties)”《比天空更宽广》埃德尔曼 第2章 意识——记忆的当下;《意识的宇宙》埃德尔曼
  • 1.2.2.13 意识过程的进化机制

1.2.3.2.6 模型与持续学习

1.2.3.2.6.1 模型

《千脑智能》:意识存储的基本方式是模型。

1.2.2.14.8 预测加工理论

1.2.3.2.6.2 学习

赫尔伯特·西蒙(Herbert A. Simon)曾对“学习”给出以下定义:“如果一个系统能够通过执行某个过程改进它的性能,这就是学习。

《千脑智能》:新皮质持续地学习、生成、更新了一个世界模型,并基于该模型不断预测接下来会发生什么。

单细胞也能学习吗? 迈克尔 · 莱文(Michael Levin):“这些来自众多生物系统的例子都指向一种基本的能力:依据过往的经验来调整未来的行为。https://www.the-scientist.com/features/can-single-cells-learn-68694

水母没有大脑都在学习 https://www.sciencenews.org/article/brainless-jellyfish-eyes-nerves-learn

1.2.2.14. 贝叶斯大脑:模型、学习和预测

1.2.2.12 C0 C1 C2意识

1.2.2.12.1 概念的提出

“意识”来源于特定类型的信息加工计算,从生理上看,这些计算是由大脑的硬件所实现的。“意识”在大脑中合并成两种不同类型的信息加工进行计算:为总体传播选择信息,从而使其灵活地用于计算和报告(C1,第一感觉上的意识),以及有关自我监控的计算,会导致一种主观上的确定感或错误(C2,第二感觉上的意识)。目前的计算机主要实施的计算,仍然反映的是人脑的无意识加工过程(C0)。C0 C1 C2意识在层级上可以认为是由低到高的。

1.2.2.12.1.1 C0意识

无意识加工 unconscious computation,是指基本的认知功能,如视觉、听觉、语言功能等。一般认为C0层次的功能和意识无关,C0就是某种功能组件/模块,大部分智能都是无意识的,可以被替换但不影响“意识”的存在。潜意识过程可以达到更深的皮质层次。例如,阈下启动(subliminal primes)可以影响任务选择或运动反应抑制中所涉及的认知控制前额机制。决策的神经机制则包括累积感觉证据,以影响各种选择的概率,直到达到阈值。这种概率性知识的积累, 即使在潜意识刺激下也会持续发生。贝叶斯推理和证据累积,是人工智能的基础计算,也是人类基本的无意识机制。

1.2.2.12.1.2 C1 意识

全局可用性 global availability,是指认知系统与特定的思想对象之间的关系,即大脑中已有的信息(整合信息,决定行动,并一路跟随到最后)。C1 意识具有很高的稳定性和全局性——能触发所有相关的大脑回路。那种连贯一致的、经过深思熟虑的计划、支持长期的制胜策略,就需要C1架构。C1意识是存在于人类婴儿和动物中的一种基本属性。

意识与注意力间的关系:威廉 · 詹姆斯曾将注意力形容为“一种以清晰而生动的形式从心灵上占有似乎同时可能存在的几个对象或一连串的思想或思路”。这一定义已很接近于C1的含义:是对进入总体工作空间的单一信息的选择。然而,在最后的步骤,也就是有意识的进入和前注意选择阶段之间有一个明确的区别,即在这个阶段可以无意识地进行操作。

C1 意识能够实现的能力包括:

  • 统一的自我认知(感情、长程记忆);
  • 信息的联想与整合能力;
  • 决策推理能力;
  • 关系管理能力

1.2.2.12.1.3 C2 意识

自我监控 Self-monitoring,认知系统中的一种自我指涉关系(a self-referential relationship),这种关系能够监控自己的加工, 并获得有关自身的信息。人类对自身已经了解了很多,包括诸如身体各器官的布局和位置,他们是否能知道或感知某事,抑或他们是否只是犯了一个错误等各种各样的信息。这种意识通常是与所说的内省introspection相对应,也就是心理学家所说的“元认知”(“meta-cognition”)–即对自己的知识和才能进行内在表征的能力: 对认知的认知或对认识的认识(cognition about cognition or knowing about knowing)。这些自我监控式的算法让我们能够知道自己知道什么不知道什么,会影响记忆和好奇心,能让你在做选择的时候感到自信不足或者信心满满。

C1意识反映了其具有访问外部信息的能力,而第二感觉意义上的意识(C2)则以具有条件反射性地自我表现能力为特征。自我监控是一种基本能力,它在婴儿期就已经存在。面对一个一切仍有待学习和了解的世界,C2机制允许他们积极地定向他们所知和所不知的领域–即一个我们称之为“好奇”的机制。

C1 C2两者对意识来说都必不可少,但两者之间却能够相互独立存在。C1 意识让相关的信息进入我们的精神工作空间(同时抛弃其它“可能的”想法或解决方案),而 C2 意识有助于意识思维能否带来有益反应的长期回射。C1和C2构成了有意识计算的正交维度(orthogonal dimensions)。在经验和概念上,这两者可能也会分开,因为,在没有C2的情况下,还可以有C1,例如,在可报告加工时并没有伴随着准确的元认知;而没有C1的C2, 则是指,在自我监控操作展开时,却没有被有意识地报告。复杂的信息加工可以通过无头脑的自动机来实现(图灵),如人脸识别、语音识别、语句解析和意义提取等,都可以在人类大脑中无意识地发生,既不具有总体可用性,也不具备自我监控。在某种程度上,大脑似乎是将专门的处理器或“模块”并列起来操作。

《比天空更宽广》第3章 大脑组成 埃德尔曼

在大脑活动中还有一组结构对于学习和意识的维持很重要。它们是上行系统,我称之为价值系统,因为它们的活动与对于生存必要的奖惩和响应有关。它们各自有不同的神经递质,以一种扩散的模式从各自的核向神经系统发出轴突。通过扩散性投射,这些价值系统就像喷洒的水龙头一样将神经递质同时释放到一大片神经元。对神经元响应的调节影响到对生存很必要的学习、记忆和身体控制响应。

总体上,大脑有3个主要的神经生理结构。首先是丘脑皮质系统,通过丰富的往返连接将本地和远程的神经元群紧密连接到一起。其次是基底核抑制回路的多突触环状结构。再就是不同价值系统的扩散性上行投射。

1.2.2.12.2 与AI深度学习的类比

《深度学习与围棋》第13章 AlphaGo:全部集结

DeepMind的AlphaGo使用了3个神经网络:

1、快策略网络:这个动作预测网络的目的并不是成为最准确的动作预测器,而是在保证足够好的预测准确率的同时能够非常迅速地做出动作预测。在树搜索中要做到基本可用的程度,推演时必须能够迅速创建大量的网络。

2、强策略网络:这个动作预测网络的优化目标是准确率,而不是速度。它是一个13层卷积网络,其架构比快策略网络的要深很多,而且动作预测的效果比快策略网络好。训练好这个网络之后,就可以把它作为起始点来进行自我对弈,并采用强化学习技术进行改良。这个过程能够让强策略网络变得更加强大。

3、价值网络:是一个16层卷积网络,前12层与强策略网络完全一致。强策略网络进行的自我对弈产生了一个新的数据集,可以用来训练一个价值网络。采用这些棋局的输出来学习一个价值函数。

C0 C1意识可以类比于AlphaGo的策略网络,用于动作预测。快策略网络类比为C0意识,强策略网络类比为C1意识。C2意识可以类比于价值网络。

AlphaGo用下面这4个步骤来构建一棵状态树:

1、选择:选择能够让行动价值与访问计数之和最大化的动作遍历搜索树。

2、扩展:在扩展一个新节点时,计算强策略网络的预测值,将它们存入每个子节点的先验概率中。

3、评估:树搜索的评估结果是以下两个部分的加权和:

1)将棋局输入价值网络中,并直接返回一个获胜率的估计。

2)从这个棋局开始用快策略网络完成一局推演,并观察哪一方获胜。

4、更新:所有模拟结束后,更新模拟遍历过的所有节点的行动价值和访问计数。

选择——扩展——评估——更新的过程也与人脑的学习、预测过程相近似:提取模型(观察/感知/记忆)——比较预测/提前预测——形成更新的模型/加工过程——存储模型/验证、行动(《千脑智能》)。

1.2.2.12.3 人工神经网络中认知能力的多层次发展

第一层(C0)为“感觉运动层”(sensorimotor level),处理局部感觉处理和视觉信息分类。

第二层(C1)为“认知层”(cognitive level),调动多个皮层区域,它们之间的整合需要长距离的轴突连接。

第三层(C2)为“意识层”(conscious level),以GNW理论为基础,能够使用类似于认知层的架构来执行跟踪条件反射任务。

1.2.2.11 全脑神经工作空间

全脑神经工作空间(Global Neuronal Workspace,GNW)

GNW理论是美国心理学家伯纳德 · J · 巴尔斯(Bernard J. Baars)和神经科学家斯坦尼斯拉斯 · 迪昂(Stanislas Dehaene)与让-皮埃尔·尚热(Jean-Pierre Changeux)提出的意识模型。

GNW理论是基于这样一些实验观察,当人对某事物有意识时,大脑中多个不同的区域均会调用该信息。相反,假如人无意识地做一些事,这些信息只会被特定的感官和运动系统调用。例如,当你打字速度很快时,你的手指会无意识地按下不同的键。假如有人问你是怎么做到的,你很难回答,因为你几乎没有意识到这些信息,它们只存在于从你的眼睛到手指的大脑回路中。由于记录感官信息的“黑板”空间有限,在任意时刻,我们只能意识到很少量信息。

Baars(1988)分析了有意识与无意识处理的区别:

1、计算能力:意识处理是低效的、易受干扰、易出错,无意识处理是高效的

2、处理过程的可能性:意识处理包含大量可能性,无意识处理范围是有限的、专属的

3、关联能力与语境敏感性:意识处理较强,无意识处理是相对独立的

4、串行性:意识处理是串行的、连贯的,无意识处理是并行的,可以相互矛盾

GNW理论认为,意识源自一类特殊的信息处理过程,大脑记录的感官信息会被多个认知系统使用,如语言、形成或提取记忆、执行动作等。在数据被传播至整个大脑的多个认知系统时,意识开始逐步产生。GNW理论将意识描述为大脑中的处理/输出模块对一种重要的有限资源的竞争,占有这种资源意味着能够在大脑全局上“广播”信息以供广泛的访问和使用。如果信息以这种方式占有全局工作空间,则其至少在可访问的意义上是有意识的。同时,这些内容通过与工作空间及其所关联的其他内容形成反馈而进一步得到增强。全局工作区的容量大小则对应于典型的认知模型中的注意力或工作记忆容量。

Dehaene(2000)指出,只有当相应内容进入到涉及主要感觉区域及与注意相关的额叶、顶叶区域的全局神经网络时,才触发访问和现象意识。Dehaene称,有意识的感知仅产生于全局网络的发放,而无论主要感觉区域的活动多么强烈,都不足以产生意识。当被这个神经网络广播后,感官信息就能被全脑的各个系统访问,进入人的“意识”,即能被主体意识到。

意识与一个全局的“广播系统”相关联,这个系统在整个大脑中广播信息。大脑中专属的智能处理器会按照惯常的方式自动处理信息,这个时候不会形成意识。当人面对新的或者是与习惯性刺激不同的事物时,各种专属智能处理器会通过合作或竞争的方式,在全局工作空间中对新事物进行分析以获得最佳结果,而意识正是在这个过程中得以产生。

哺乳动物甚至包括许多鸟类和鱼类,都进化出了同样的意识工作空间的迹象;动物在一定程度上拥有自我认识。

《脑与意识》斯坦尼斯拉斯 · 迪昂

4 发现主观意识的客观标识

标志1:虽然阈下刺激可以被传送到大脑皮质深处,但是当超越意识的阈限时,这些脑活动会大大增强。随后,大脑活动就会扩散到其他许多脑区,导致顶叶和前额叶回路突然激活。

标志2:从脑电图上可以发现,意识通达以一种叫作P3的晚期慢波的形式出现。这个事件电位在刺激出现后的1/3秒后才发生,也就是说,意识滞后于外部的世界。

通过插入大脑深处的电极来追踪脑活动,我们可以观察到另外两个标志:

标志3:一个在后期突然出现的高频振荡。

标志4:远距离脑区之间信息交换的同步化。

所有这些事件都为意识加工提供了可靠的标识。

5 意识理论的构建和计算机模拟 意识是全脑信息的共享

全脑工作空间理论认为,我们的意识是全脑信息的共享。大脑包含了多个局部处理器,每个处理器都擅长一种运算。“全脑工作空间”这个具体的交流系统允许这些处理器灵活地分享信息。在任意时刻,工作空间选择处理器中的一部分,根据它们各自编码的信息建立一个连续表征,将其保持在脑中任意一段时间,并将这些信息传递给任何其他处理器。只要有一段信息到达了这个工作空间,就会被我们所意识到。

5 意识理论的构建和计算机模拟 全脑神经工作空间

工作空间理论提出,意识状态由稳定激活的神经元所编码,整个编码过程持续十分之几秒。这些神经元是工作空间中被激活的神经元的子集,分布在脑的多个脑区,为同一个心理表征的不同方面进行编码。

在意识通达中,多亏了工作空间神经元的长轴突,所有这些神经元才可以以大规模平行的方式相互交换信息,以获得一个统一的、同步的解释。

意识内容由沉默神经元和激活神经元共同决定。

《意识本能》第6章 受到损伤却有意识的脑 皮层增强意识

尽管我们大部分的脑系统和其他物种相同,但是人脑的独特之处在于,人类能够使用复杂的“思维语言”来联合这些脑区。在所有的灵长类动物中,意识最初是作为交流工具进化而来的。而唯独在人类身上,这种交流能力被第二次进化加强,产生了“思维语言”,使得我们能够思考复杂的想法并与他人进行分享。

 

《意识的宇宙》埃德尔曼

竞争队列权限:不同的低级意识竞争高级意识空间。

模块的运作相对独立,比起整齐有序的队列,模块间的关系更接近某种竞争,而竞争的结果就构成了我们意识体验的内容:某一时刻某个加工占据了你的意识高峰,其他一些加工则被挤了出去。根据这一观点,皮层下模块和皮层模块都能产生某种形式的意识体验,而且并不一定需要“底层”或“高层”意识系统的干预。数量众多的意识模块让你的意识体验变得五花八门。

《比天空更宽广》第4章 神经达尔文主义——全脑理论 埃德尔曼

高级动物的大脑自动建构出对于全新环境的响应模式。

神经元群选择理论(theory of neuronal group selection),或TNGS。3条主要原理:发育选择、经验选择、折返式映射。

这种动态过程产生的后果就是广泛分布的神经元群活动的普遍同步。这将它们功能分隔的活动结合起来,从而能产生一致的输出。

1.2.2.10 罗比(Robby)

进化的罗比,易拉罐清扫机器人

《复杂》梅拉妮·米切尔(Melanie Mitchell)第9章 遗传算法(Genetic Algorithms)

《大图景:论生命的起源、意义和宇宙本身》The Big Picture: On the Origins of Life, Meaning, and the Universe Itself 肖恩 · 卡罗尔(Sean Carroll)第34章 贯穿景观的搜索

遗传算法很好地阐明了演化作为策略发明者的一些有趣特点。其中一个例子是计算机科学家梅拉妮 · 米切尔(Melanie Mitchell)提出的名为罗比(Robby)的虚拟机器人。罗比生活在一个十乘十的二维网格中,它的任务是尽快打扫网格中四处散落的空罐。

1、罗比只能看到它自己所处方格以及相邻的东南西北四个方向的方格上有没有空罐,看不到斜对角及更远的方格。

2、罗比不能保留任何记忆,只能决策面对当前情况下一步做什么。

3、可以做的动作:往东/南/西/北移动、随机移动、不动、收集罐子。

“基准策略”:如果罗比站在一个有空罐的方格上,那么捡起它。否则,看看相邻的四个方格上有没有空罐。如果有一个空罐的话,就沿着相应的方向移动。如果没有的话,就沿着随机方向移动。如果有多于一个空罐的话,就向预先给定的方向移动。基准策略证明了自身可以相当好地完成工作;在大量的测试中,它往往能取得全部分数的69 %。

通过遗传算法人为地让策略进行演化:一开始从数个随机策略出发,让它们运行一段时间,挑选出其中做得最好的。然后将每个生存者复制几份,通过随机更改每个策略在几个特定状态上的规定动作来使每个复制品“产生突变”;可以通过将不同策略分成几份,然后与其他策略粘贴在一起来模拟有性生殖。演化能找到比设计更好的解答。仅仅在250代之后,遗传算法做得就跟基准策略一样好了,而在1000代之后,它几乎能得到全部分数的97 %。

优化后的策略的一些巧妙改进点:如果罗比站在包含空罐的方格上,而东面和西面的方格都包含空罐,基准策略很自然会让罗比捡起空罐,接下来会向东面或者西面移动,这样就会失去对另一个方向空罐的记忆。遗传算法尽管仅仅由随机变化和选择组成,却“理解了这一点”,得到了更好的策略。当罗比处于一行3个空罐的中间时,它不会捡起身处方格上的空罐;它会向东或者向西移动,直到到达这堆空罐的边沿,只有这时它才开始捡起空罐。然后它自然地返回空罐堆中,收集起路上的空罐。

遗传算法专家罗恩(Jason Lohn):“进化算法是探索设计死角的伟大工具。……我们经常发现进化出来的设计完全无法理解。”

从罗比到更复杂的AI策略(如能够战胜世界冠军的AlphaGO使用的复杂战术),都是在机器上实现的算法自动运行的自然结果。每一个神经元、皮质柱、气泡、草稿都可以看作一个更复杂的“罗比”。人类意识是更高层面上的大量算法的自然涌现的结果,通过大脑解释器按照时间顺序解释为“意识”并存储到记忆中。

《大图景:论生命的起源、意义和宇宙本身》第35章 目的涌现而来

在自然主义中,人类和机器人之间的差异并没有那么大。我们都只是一大堆结构复杂的物质,以某种规律运动,在一个拥有时间箭头的环境中遵循着冷冰冰的物理法则。需求、目的和渴望都是在这个过程中自然产生的事物种类

1.2.2.9 多重草稿模型与认知能力的四个层级

1.2.2.9.1 多重草稿模型(Multiple Drafts Model,MDM)

《意识的解释》Consciousness Explained 丹尼尔 · 丹尼特(Daniel Dennett)1991

多重草稿模型:在任一给定时刻,大脑中都会出现多种内容,意识活动是由很多并行的信息处理流程构成的,是多重草稿相互竞争之后的结果。有意识或无意识并不总是确定的事实,或者至少会涉及到更复杂的解释性判断。

大脑中出现的其中一部分内容成为意识体验的原因不是它们发生于特殊的空间或功能位置(即所谓的“笛卡尔剧院”),也不是因为它们以特殊的方式或格式呈现,而是与Dennett所谓的“大脑名望”(cerebral celebrity)有关,即给定内容在多大程度上能影响整个大脑中其他内容的未来发展,尤其是在这种影响能多大程度上在人的报告和行为中体现出来的。MDM的关键主张之一是,对一个人的不同的测量方式(如被问到不同的问题或处于不同的情境中)将引导出关于这个人的意识状态的不同回答。

MDM根据内容之间的关系来解释意识,否认了感受性(qualia)的存在,也不接受作为内在观察者的自我概念,无论这个观察者处于笛卡尔剧院中还是什么别的地方。MDM将自我视为通过系统中内容的交互播放而构建出的一致的叙事者。这些内容在感知的层面被相对统一地绑定在一起,被融合成仿佛是一个自我的持续不断的经历(加扎尼加的解释器)。相关联的内容并非因为它们都由一个自我观察从而是统一的;正因这些内容是连贯的,所以它们才被视为一个唯一的自我(或至少是一个虚拟的唯一的自我)的体验。构成一系列叙述的内容至少隐含地是一个虚拟自我的进行中的内容,正是这些内容最有可能在此人试图报告自己的意识状态时得到表达。

1、谁撰写的草稿?大脑并不存在一个中心枢纽。各种各样的知觉能在大脑中完成,靠的就是对感觉输入并行、多轨道的诠释和细化过程。进入神经系统的信息处在连续的“编辑修改状态”中。在编辑过程中,各种各样的内容增添、结合、校正与重写都可能以不同的顺序发生。我们实际经验到的,不是感官的刺激,而是感官信息经过加工和编辑后的结果。这些草稿没有终极编辑者。

2、是否同时存在多份草稿?很多份,只是有的草稿处于激活状态,有的草稿处于沉默状态。

3、多重草稿是如何转化为意识的?不同的“草稿”相互竞争,获胜的“草稿”被看见,其他草稿则消失。大脑内部没有剧场,也没有呈现,只是在进行信息加工。哪一些草稿会胜出,取决于哪一些草稿会成为“探究”的内容对象,而“探究”活动本身是一种解释活动。如果我们将胜出的草稿视为“被意识到的手稿”的话,那么就意味着意识的确是被解释出来的。

4、多重草稿并不存在一个特定的时间点转化为意识。

1.2.2.9.2 认知能力的四个层级

《丹尼尔 · 丹尼特讲心智》Kinds of Minds: Toward an Understanding of Consciousness (又译为《心灵种种:对意识的探索》)1997 

1、最底层是达尔文式造物的心智。这些生物经过实地检验,只有最佳设计得以幸存。通过比较随意的基因重组与突变过程,各种候选生物被盲目地创造出来。它们受本能的驱动,没有有意识的体验。能够繁殖并将特征传递给后代,并且可以通过突变选择机制进行学习,但它们的灵活性(可塑性)极为有限。

2、第二层 斯金纳式造物的心智。达尔文式造物的子集,某些达尔文式造物的生物体有了表型可塑性(phenotypic plasticity):不是一出生就完全设计好的,它们的设计元素可以由实地检验过程中发生的事情加以调整。这些个体面对环境就可以生成各种行为,逐个尝试这些行为,直到发现好用的那个。它们通过试错的方式从经验中进行学习,因此具有一定的有意识体验。

有一种简单的学习类型:ABC网络,进化模式为联想主义(associationism)—行为主义(behaviorism)—联结主义(connectionism),能实现很多性命攸关的功能,包括模式识别、判别、泛化与运动的动态控制。通过长期而稳定的训练或环境塑造,绝大多数动物能够在各种恰当的方向上修改或重新设计自己的行为。ABC网络高效、简洁、性能稳定、容错且较容易随时重新设计。这些网络生动地体现了斯金纳的观点:自然选择的、遗传给子代的修剪与整形(即你与生俱来的“接线”)与个体之后发生的修剪与整形(即由经历或训练而得到的“重新接线”)没什么区别。

3、第三层 波普尔式造物的心智。斯金纳式造物的子集。只要之前没有哪个错误让你丧命,那么斯金纳的条件反射就是个好东西。而更好的系统是在所有可能的行为或行动中进行预选,以便不必在“现实生活”里冒险尝试,就剔除那些真正愚蠢的做法。哲学家卡尔 · 波普尔(Karl Popper)曾精妙地提出了这样一个观点,他称这种设计提升“让我们的那些假设替我们去死”。在头脑中对一些事情提前进行测试:对真实世界予以抽象,并在头脑中进行测试与预演。包括哺乳动物、鸟类以及其他一些脊椎动物,它们具有高度复杂的表征和记忆能力,不仅能从经验中学习,而且可以在想象中基于表征制定行动方案,提前做出计划。波普尔式造物实现有用过滤的方法之一是,将行为选项送到身体的法庭,利用那积累在身体组织里的智慧来判决,不管这些智慧是如何过时或者缺乏远见(达马西奥的躯体标记)。

4、第四层 格列高利式造物的心智。波普尔式造物的子集。格里高利:在各种卓越的工具中,语言是心智的工具。语言以及其他心智工具给了格里高利式造物一个内部环境,让它们能够构造出越来越精妙的行为产生器与行为检验器。能够进行对错判断(依赖个人或社会的价值判断),有恰当的自主性(autonomy),有能力在众多的选项中择取其一并付诸行动。通过使用语言和发明人工制品,它们创造了一个新的体验世界。语言、反思、社会性、更强大的符号记忆能力使格列高利式造物拥有一个理性的“灵魂”。

1.2.2.8 气泡与本能

1.2.2.8.1 气泡

1、“复合单子论”(也称为“多元物活论”)假设:“每个脑细胞都有独立的意识,其他细胞对此一无所知,大脑细胞所拥有的意识对彼此而言是一种完全陌生的状态,对一个意识来讲,其他意识都是一种外部的存在。”《心理学原理》威廉·詹姆斯 复合单子理论的困境

2、新皮质、皮质柱(霍金斯《千脑智能》、芒卡斯尔《大脑功能的组织原则:单元模块和分布式系统》An Organizing Principle for Cerebral Function: The Unit Module and theDistributed System):新皮质由相同的元素组成的,是通过对同一事物(一个基本回路)进行多次复制而实现的。新皮质的基本单位,即智能的单位,是“皮质柱”。在整个新皮质中,皮质柱和迷你皮质柱具有相同的功能:执行一套基本算法,负责感知和智能的各个方面。

3、气泡( 加扎尼加《意识本能》 第9章 汩汩溪流与个人意识 ):

意识尽管看上去就像一场完整的、经过完美剪辑的电影,但它其实是一幕幕短剧,像沸腾的开水中的气泡一般此起彼伏地浮向前台,彼此之间被出场的时间联系在一起。……

意识不是某种特定网络的产物,使得我们的心智事件变得可被察觉。每一个心智事件都是由脑模块管理的,后者拥有让我们意识到处理结果的能力。……

意识不是某种特定网络的产物,使得我们的心智事件变得可被察觉。每一个心智事件都是由脑模块管理的,后者拥有让我们意识到处理结果的能力。……

在气泡的比喻里,气泡指的是一个层级化结构中的模块或模块组的回路加工终产物,它们能够持续不断地应对并处理来自环境的挑战。这些加工过程既包括大脑皮层活动也包括皮层下活动。……

当一个气泡后面紧跟着另一个气泡,我们就会对记忆中事件的感受产生错觉。……

在进化过程中,模块和层级不断增加,以解决一个又一个扰动因素,我们的意识体验内容也随之不断变化、丰富。每一个层级都有自己关于加工与向下一层级传递产物即它的加工气泡的规则。从一个层级到下一个层级,模块内部的加工看似是串行的,但其实有很多模块在平行运作,每一个模块都在向外吐气泡,最终被意识所觉察。

丹麦免疫学家尼尔斯·杰尼(Niels Jerne)于1967年提出了一个理论:免疫系统的规律可能在脑中也成立。他认为,我们所认为的“学习”,其实是脑中既有的回路通过环境选择发挥作用的过程。学习不过是脑在花时间整理自己那数量庞大的回路,以便寻找一个最适合处理当前问题的方案。

第10章 意识是一种本能

意识存在于全脑。切除大量大脑皮层并不会消除意识,只能改变其内容。意识不像其他认知功能那样分属某个特定脑区,包括言语的产生与视觉加工,意识是所有这些能力的一个关键元素。意识有多个独立来源正是脑的设计原则。

1.2.2.8.2 本能

《意识本能》第10章 意识是一种本能

本能是逐渐进化而来的,使得我们能够更好地适应环境。将意识归为本能的做法相当于,我们认为,这个被我们珍视的人类特质并不是我们这个物种硬件所持的天赋神技。我们如果容许意识是一种本能,就相当于将意识连同它的历史、丰富性、多样性以及连续性纳入泛泛生物界。

威廉·詹姆斯《本能是什么?》(What is an Instinct)

“本能通常被定义为一种行为能力,能产生某种结果,但没有对结果的预期以及对行为表现的预先学习……(本能)是结构的功能相关物。或许可以说,每一个器官的存在都对应着一种能够应用其功能的原始天赋。……一个复杂的本能性行为可能有一连串的觉醒冲动参与。……所有本能的每一个冲动和每一个步骤都有其充分的独立性,并且能在当下时刻成为唯一的真理和义务。……刺激运动冲动的特定反射弧,无论该反射弧是与生俱来,还是在一段时间后自发成熟,抑或是一种习得的能力,它都必须和其他反射弧竞争,有时能成功,有时会失败。生理学观点则要求本能具备偶尔的无规律性,如果动物具有大量不同的本能,且同样的刺激有很大的可能会进入多个本能。这种无规律性正是高等动物本能所展现的丰富性。”

本能是逐渐进化而来的,使得我们能够更好地适应环境。

本能能够利用结构行使功能。使用结构的行为需要某种“天赋”,似乎是平白无故出现的。自然选择与经验构成了一个圆环,共同产生了我们所说的本能。

本能的结构属性是一个层级结构中的模块。每一种本能都能独立参与某种简单行为,但它们也能合作。单个的本能能够以有序的方式排列,形成更复杂的行为,使之看上去像是某种高级的本能。当本能序列排山倒海而来,就形成了我们所说的意识。很多气泡跟随事件的箭头汇聚在一起,产生了我们所说的意识体验。哪个气泡在哪个时间出现,这个动态过程无疑受到经验和学习的影响。但是,经验、学习和意识必须是同态的,在同一个系统内运作。一旦以这种方式思考意识现象,我们就能看穿意识体验的本质:大自然母亲的把戏。

将意识看作高度进化的本能(或是一整个本能序列),能够让我们知道去哪里寻找意识在这个冰冷无机的世界中的起源。意识是一种本能,是有机生命的一部分(是躯体的副产品/随躯体赠送的)。我们不用通过学习就知道如何产生与利用意识。

1.2.2.8.3 《意识本能》中“鸿沟”等概念

《意识本能》中多个章节提到了“互补原理”、“鸿沟”、“认知断面”等概念,用丹尼尔 · 丹尼特在《自由的进化》第4章 听听自由意志论的解释 中“我们应将急需的空缺置于何处?”的几段话来解释/回复一下:

罗杰 · 彭罗斯试图利用量子物理学来对抗可怕的人工智能算法,丘奇兰德恰如其分地对这一做法进行了抨击,他这样写道:

若想找到一个丰富的非算法过程的领域,不一定要把目光投向量子领域那么遥远的地方。在硬件神经网络中发生的过程通常是非算法的,它们构成了我们头脑中的大部分计算活动。直截了当地说,它们就是非算法的,因为它们并不取决于一系列根据一组存储的符号操作规则指令连续遍历的离散物理状态。(Paul Churchland, 1995, pp. 247—248)

注意这里插入的词语“硬件”。如果没有它,丘奇兰德所说的就是错的。事实上,他讨论的所有结果都不是由“硬件神经网络”产生的,而是由标准计算机上模拟的虚拟神经网络产生的。因此,在较低的层面上,其中展示的每一项都确实“取决于一系列根据一组存储的符号操作规则指令连续遍历的离散物理状态”。当然,在这个层面上无法解释它们的力量,但这是算法层面。这些程序所做的事情都不会超出图灵可计算性的限制。我们必须进入神经网络建模层面来解释这些模拟网络所拥有的非凡力量,但在这两种情况下,微观层面上发生的都是一个决定论性质的、数字的和算法的过程。从可计算性限制的角度来看,丘奇兰德讨论的那些对其有利的模型都是以计算机程序——算法的形式——实现的。因此,除非他想否认自己喜欢的例子,否则他必须承认,算法过程还是可以展现出他认为对解释心智至关重要的力量的。但是,他声称,硬件神经网络是非算法的,即便这是真的,也无法解释它们所展现出的力量——因为其算法近似物拥有全部所需的力量。

我们在第2章中讨论的简单“生命”世界中的行动者以及在第3章中讨论的计算机国际象棋程序都是数字的,也是决定论性质的,因此,虽然计算机模拟的非线性神经网络拥有额外的力量,但那同样是数字的和决定论性质的。丘奇兰德指出的额外因素——用硬件取代虚拟计算机软件——并没有增加神经网络的力量。哪怕它确实能加强神经网络的力量,也还没有人提出能让我们认同这种想法的理由。

1.2.2.7 解释器

《人类的荣耀》迈克尔 · 加扎尼加 Michael S. Gazzaniga

08 藏在大脑中的“小人儿” P668

1、关于意识的未解之谜

当前对意识水平分类的共识通常包括无意识、意识、自我觉知以及元自我觉知(你知道自己有自我觉知)。安东尼奥·达马西奥把意识分成两个部分:核心意识和延展意识。

核心意识是指在“开关”打开的时候,生物体是清醒的,并能够觉知一个瞬间(现在)以及一个地点(这里)。这是一种警觉状态,与未来或过去无关,这种意识既不是对自我的觉知,也不是人类所独有的。

核心意识是搭建更复杂水平意识——延展意识——的基础。延展意识指的是我们通常所说的意识。延展意识由许多层面组成,例如一个意识层面是觉知自己周围的环境,另一个层面则是觉知到它们并知道它们跟昨天不一样、明天可能又不一样,而且还知道会对自己带来什么影响、并且在乎这个结果。这些层面的意识与“内容”,也就是意识体验的组成部分有关。最高层的意识是知道自己在觉知自己周围的环境,这就涉及“自传体自我”(autobiographical self)的概念。

 

2、意识的守门员:注意

我们想知道的是,是否有一个系统的途径令信息加工得以进入意识,如果有,它是什么,怎么工作。

在执行意识任务时,从扣带回到其他脑区的连接会被激活,这些脑区支持着5个神经网络,包括记忆、知觉、运动、评估以及注意。只有特定信息才能进入意识。研究表明,要使一个刺激到达意识,它需要被呈现一定量的时间,还需要一定程度的清晰度。这个刺激需要与观察者的注意状态有交互作用。这种交互作用可以经由两种方式发生,也就是自上而下的加工(可能是丘脑皮层神经元回路活动的结果)或自下而上的加工(来自非意识活动的感觉信号强度非常高,从而使得自上而下的系统转向它们,如火警警报)。注意和意识是两只不同的动物:即使注意被分配给了某物,也可能还不足以让刺激到达意识层面。

 

3、活在解释器编织的世界

左脑的解释器会将所有的加工过程都说通。它会把所有的输入都拿过来,整合成为一个说得通的故事,即使这个故事可能是完全错误的。右脑的判断是基于简单频率信息的(频率派?),而左脑则依赖于建立精细的假设(贝叶斯?)。在一个完整的大脑中,大脑可以根据实际情况选择这两种认知风格中的任意一种来使用。

既然大脑是由这么多模块所组成的,为什么却感到自己是一体的呢?左脑的解释器可能就是我们的答案。解释器受到驱动,在无论什么情况下都会产生解释和假设。裂脑病人的左脑在解释右脑做出的行为时不会有任何迟疑。在神经系统完好的个体中,解释器在伪造交感神经系统被唤起的理由时也不会迟疑。所以,左脑的解释器可能可以在所有人中都产生让我们觉得自己是一个完整统一的个体的感觉。

 

4、我只要做我自己就好了

解释器还有其他职责。这个系统最初用于解释轰炸我们大脑的众多信息——解释我们对环境中遇到的东西的认知和情绪反应,询问两件事之间的关联,建立假设,从混乱中找出秩序。此外,这个系统还建立了一个关于我们的行为、情绪、想法以及梦想的即时旁白。解释器是胶水,让我们的故事保持一致,创造出一种完整理性的自我感觉。将解释器嵌入大脑其他功能会产生许多副产品。一个最初用于追问两件事之间的关联、追问无限多的事情,并对遇到的问题给出回答的装置,也会不由自主地创造出自我概念。这个装置当然会问一个大问题:“谁在解决这些问题呢?嗯……我们就叫它‘我’吧”——然后自我概念就形成了。——所以我的自我感觉是个副产品:正是左脑解释器所想出的理论、叙述、自我表象,它从不同输入端(包括“神经工作空间”和知识结构)收集信息,将这些混乱的输入黏合到一起,组成了自我,写出了这份自传。

Geoffrey Hinton:“说真话其实只是编造了正确的故事,因为一切都在你的权衡之中。”

https://mp.weixin.qq.com/s/GIIrdp9lG7yUHBWGigzOcw 当AI教父开始恐惧他的造物