《元语言、思想语法及大语言模型语法的哲学评论》
https://mp.weixin.qq.com/s/fi98Cqg16zRj4WiLFcVggw
在人类所有系统中,自然语言是唯一天然(或“先验地”)具有自反能力的系统,并且足够丰富而能够表达一切对象。
1、作为“思想语法”的语言游戏模型
维特根斯坦的语言游戏分析模型:语言实践构成了游戏,就需要遵循规则,不能任意行为,否则游戏崩溃;但另一面,实践是活跃灵活的,有着创造性或演化性,因此,许多用法或多或少都偏离了原先的规则,而偏离规则的行为并不是违规的,相反,往往能够重新塑造规则(相当于“走的人多了就成了路”的效果)。语言实践总会形成“遵循规则的悖论”:如果任意某个行为都能编出理由来解释为在遵循某种规则,那么就无所谓遵循规则。语言实践同时具有遵循规则和发明规则的二重性,这非常准确地反映了人类文明在所有方面的一个基本情况。
理解首先需要可确认的意义,如果规则总是处于悖论状态,又如何能够确认意义?
2、LLM发明了自己的语法和语义
LLM使用了另一种“语言”(必须加引号),虽与人类语言有着映射(mapping)关系,却是给人工智能自己读的另一种语言,实际上是一个标识系统(a system of tokens)。LLM必须为标识系统赋予意义使之形成“世界性”而成为一个标识(token)世界,即必须能够以标识去定义一个世界。
要建构一个“世界”,就需要建立一种语言。LLM没有生活也没有经验,也就没有自己的语义,不可能建立一种全新语言,但LLM规定了另一种语法和语义关系,即标识之间的链接关系及其链接的理由,相当于定义了另一种语言游戏(游戏性质由规则决定),重要的是,同时意味着发展了另一种思维方式。
LLM的语法就是“相关性”,即在大数据条件下,并且在概率方法(贝叶斯方法)的运作下,标识之间可以产生哪些最优链接,具体地说,就是对最优的下一个标识进行预测。预测下一步就是预测未来,而预测未来正是思想的首要本质——所有思想都是在预测未来,没有去预测未来的意识活动仅仅是经验,不是思想。人工智能尚无“具身经验”,世界里的万物对于它既无意义也无价值,因此,LLM不可能真的破译人类语言的意义。LLM的极简主义思想语法似乎只有两条规则:(1)相关性,标识之间在概率上最优的相关链接就等于正确链接(尽管概率上正确不等于事实正确);(2)演化性,在不间断的“强化学习”(RL)中遵循贝叶斯改进,不断校准和精炼标识之间的相关性,提高链接效率。
LLM的标识系统与人类语言的语素之间存在着一一对应的映射关系,这个优势同时也是局限,即能够在时间顺序中基本正确地输出语言,但不能输出关于事物和世界的理解。如果人工智能要输出对事物甚至世界的整体性理解,映射关系就不够了,至少需要将映射升级为“态射”(morphism)。比如由非常复杂的标识组合来输出3D的事物关系和整体化理解,即能够化时间为空间,按李飞飞的概念,能够实现“空间智能”。
3、名词思维不足以形成充分的思想语法
真实世界是动态的,并不是一个字典式的名词世界。如果为了以最小量语言去传达最大量信息,以名词为本的语言就是合理的;但如果不考虑实用而为了思想的准确性,那么以名词为本的语言就有根本的局限性。从语言的演化来看,人类选择名词为本的语言并没有错,因为在数万年时间里,语言是为了生活,不是为了思想。不过人类初民早就注意到世界的动态性,但只是形成一些“逝者如斯夫”之类的感悟,一直到现代发现了函数,才开始有了理解动态的方法和语言,但也仅限于表达量化关系的动态。世界存在的动态仍然使人眩晕,我们仍然困在名词世界里。
除了易经系统,其他的思想语法或元语言都属于名词思维,都基于一些共同的形而上学承诺:(1)名词概念(不包括专名)蕴含了关于事物的知识边界,名词的理想是形成有着封闭边界的定义,如果不能形成定义,则至少存在着一组解释足以形成名词的内在含义(相当于内涵);(2)名词的所指都是确定而稳定的个体事物以及个体事物之间的关系;(3)所有关系都是一组名词的函数。名词思维的局限性在于没有能力解释和表达任何有着决定性意义的动态,包括演化、突变、涌现、创造和革命。名词思维的局限性与传统科学的局限性重叠,一个典型标志是,不能解释生命性的存在状态,凡是有生命的事情都不能在名词思维里被充分解释。易经系统只是一种基于直观的象征系统,与真实动态有着很大差距,而且,其系统对状态和动态的解释缺乏约束力和一致性,因此无法控制解释的有效性,不足以成为一种充分的思想语法。
现有的大语言模型是一个名词思维的标识系统,只有通过具身方法(维科定理:谁做的谁知道)建立世界模型,才能逐步发展到动词思维系统,跨越哥德尔形式系统的局限性。