首页 > 文章中心 > 正文

人工智能逻辑学

人工智能逻辑学

常识推理中的某些弗协调、非单调和容错性因素

AI研究的一个目标就是用机器智能模拟人的智能,它选择各种能反映人的智能特征的问题进行实践,希望能做出各种具有智能特征的软件系统。AI研究基于计算途径,因此要建立具有可操作性的符号模型。一般而言,AI关于智能系统的符号模型可描述为:由一个知识载体(称为知识库KB)和一组加载在KB上的足以产生智能行为的过程(称为问题求解器PS)构成。经过20世纪70年代包括专家系统的发展,AI研究者逐步取得共识,认识到知识在智能系统中力量,即一般的智能系统事实上是一种基于知识的系统,而知识包括专门性知识和常识性知识,前者亦可看做是某一领域内专家的常识。于是,常识问题就成为AI研究的一个核心问题,它包括两个方面:常识表示和常识推理,即如何在人工智能中清晰地表示人类的常识,并运用这些常识去进行符合人类行为的推理。显然,如此建立的常识知识库可能包含矛盾,是不协调的,但这种矛盾或不协调应不至于影响到进行合理的推理行为;常识推理还是一种非单调推理,即人们基于不完全的信息推出某些结论,当人们得到更完全的信息后,可以改变甚至收回原来的结论;常识推理也是一种可能出错的不精确的推理模式,是在容许有错误知识的情况下进行的推理,简称容错推理。而经典逻辑拒斥任何矛盾,容许从矛盾推出一切命题;并且它是单调的,即承认如下的推理模式:如果p?r,则pùq?r;或者说,任一理论的定理属于该理论之任一扩张的定理集。因此,在处理常识表示和常识推理时,经典逻辑应该受到限制和修正,并发展出某些非经典的逻辑,如次协调逻辑、非单调逻辑、容错推理等。有人指出,常识推理的逻辑是次协调逻辑和非单调逻辑的某种结合物,而后者又可看做是对容错推理的简单且基本的情形的一种形式化。[②]“次协调逻辑”(ParaconsistentLogic)是由普里斯特、达·科斯塔等人在对悖论的研究中发展出来的,其基本想法是:当在一个理论中发现难以克服的矛盾或悖论时,与其徒劳地想尽各种办法去排除或防范它们,不如干脆让它们留在理论体系内,但把它们“圈禁”起来,不让它们任意扩散,以免使我们所创立或研究的理论成为“不足道”的。于是,在次协调逻辑中,能够容纳有意义、有价值的“真矛盾”,但这些矛盾并不能使系统推出一切,导致自毁。因此,这一新逻辑具有一种次于经典逻辑但又远远高于完全不协调系统的协调性。次协调逻辑家们认为,如果在一理论T中,一语句A及其否定?A都是定理,则T是不协调的;否则,称T是协调的。如果T所使用的逻辑含有从互相否定的两公式可推出一切公式的规则或推理,则不协调的T也是不足道的(trivial)。因此,通常以经典逻辑为基础的理论,如果它是不协调的,那它一定也是不足道的。这一现象表明,经典逻辑虽可用于研究协调的理论,但不适用于研究不协调但又足道的理论。达·科斯塔在20世纪60年代构造了一系列次协调逻辑系统Cn(1≤n≤w),以用作不协调而又足道的理论的逻辑工具。对次协调逻辑系统Cn的特征性描述包括下述命题:(i)矛盾律?(Aù?A)不普遍有效;(ii)从两个相互否定的公式A和?A推不出任意公式;即是说,矛盾不会在系统中任意扩散,矛盾不等于灾难。(iii)应当容纳与(i)和(ii)相容的大多数经典逻辑的推理模式和规则。这里,(i)和(ii)表明了对矛盾的一种相对宽容的态度,(iii)则表明次协调逻辑对于经典逻辑仍有一定的继承性。

在任一次协调逻辑系统Cn(1≤n≤w)中,下述经典逻辑的定理或推理模式都不成立:

?(Aù?A)

Aù?A→B

A→(?A→B)

(A??A)→B

(A??A)→?B

A→??A

(?Aù(AúB))→B

(A→B)→(?B→?A)

若以C0为经典逻辑,则系列C0,C1,C2,…Cn,…Cw使得对任正整数i有Ci弱于Ci-1,Cw是这系列中最弱的演算。已经为Cn设计出了合适的语义学,并已经证明Cn相对于此种语义是可靠的和完全的,并且次协调命题逻辑系统Cn还是可判定的。现在,已经有人把次协调逻辑扩展到模态逻辑、时态逻辑、道义逻辑、多值逻辑、集合论等领域的研究中,发展了这些领域内的次协调理论。显然,次协调逻辑将会得到更进一步的发展。[③]

非单调逻辑是关于非单调推理的逻辑,它的研究开始于20世纪80年代。1980年,D·麦克多莫特和J·多伊尔初步尝试着系统发展一种关于非单调推理的逻辑。他们在经典谓词演算中引入一个算子M,表示某种“一致性”断言,并将其看做是模态概念,通过一定程序把模态逻辑系统T、S4和S5翻译成非单调逻辑。B·摩尔的论文《非单调逻辑的语义思考》(1983)据认为在非单调逻辑方面作出了令人注目的贡献。他在“缺省推理”和“自动认知推理”之间做了区分,并把前者看作是在没有任何相反信息和缺少证据的条件下进行推理的过程,这种推理的特征是试探性的:根据新信息,它们很可能会被撤消。自动认知推理则不是这种类型,它是与人们自身的信念或知识相关的推理,可用它模拟一个理想的具有信念的有理性的人的推理。对于在计算机和人工智能中获得成功的应用而言,非单调逻辑尚需进一步发展。

[摘要]本文认为,计算机科学和人工智能将是21世纪逻辑学发展的主要动力源泉,并且在很大程度上将决定21世纪逻辑学的面貌。至少在21世纪早期,逻辑学将重点关注下列论题:(1)如何在逻辑中处理常识推理的弗协调、非单调和容错性因素?(2)如何使机器人具有人的创造性智能,如从经验证据中建立用于指导以后行动的可错的归纳判断?(3)如何进行知识表示和知识推理,特别是基于已有的知识库以及各认知主体相互之间的知识而进行的推理?(4)如何结合各种语境因素进行自然语言理解和推理,使智能机器人能够用人的自然语言与人进行成功的交际?等等。

[关键词]人工智能,常识推理,归纳逻辑,广义内涵逻辑,认知逻辑,自然语言逻辑

人类智能的本质特征和最高表现是创造。在人类创造的过程中,具有必然性的演绎推理固然起重要作用,但更为重要的是具有某种不确定性的归纳、类比推理以及模糊推理等。因此,计算机要成功地模拟人的智能,真正体现出人的智能品质,就必须对各种具有不确定性的推理模式进行研究。

首先是对归纳推理和归纳逻辑的研究。这里所说的“归纳推理”是广义的,指一切扩展性推理,它们的结论所断定的超出了其前提所断定的范围,因而前提的真无法保证结论的真,整个推理因此缺乏必然性。具体说来,这种意义的“归纳”包括下述内容:简单枚举法;排除归纳法,指这样一些操作:预先通过观察或实验列出被研究现象的可能的原因,然后有选择地安排某些事例或实验,根据某些标准排除不相干假设,最后得到比较可靠的结论;统计概括:从关于有穷数目样本的构成的知识到关于未知总体分布构成的结论的推理;类比论证和假说演绎法,等等。尽管休谟提出著名的“归纳问题”,对归纳推理的合理性和归纳逻辑的可能性提出了深刻的质疑,但我认为,(1)归纳是在茫茫宇宙中生存的人类必须采取也只能采取的认知策略,对于人类来说具有实践的必然性。(2)人类有理由从经验的重复中建立某种确实性和规律性,其依据就是确信宇宙中存在某种类似于自然齐一律和客观因果律之类的东西。这一确信是合理的,而用纯逻辑的理由去怀疑一个关于世界的事实性断言则是不合理的,除非这个断言是逻辑矛盾。(3)人类有可能建立起局部合理的归纳逻辑和归纳方法论。并且,归纳逻辑的这种可能性正在计算机科学和人工智能的研究推动下慢慢地演变成现实。恩格斯早就指出,“社会一旦有技术上的需要,则这种需要比十所大学更能把科学推向前进。”[④]有人通过指责现有的归纳逻辑不成熟,得出“归纳逻辑不可能”的结论,他们的推理本身与归纳推理一样,不具有演绎的必然性。(4)人类实践的成功在一定程度上证明了相应的经验知识的真理性,也就在一定程度上证明了归纳逻辑和归纳方法论的力量。毋庸否认,归纳逻辑目前还很不成熟。有的学者指出,为了在机器的智能模拟中克服对归纳模拟的困难而有所突破,应该将归纳逻辑等有关的基础理论研究与机器学习、不确定推理和神经网络学习模型与归纳学习中已有的成果结合起来。只有这样,才能在已有的归纳学习成果上,在机器归纳和机器发现上取得新的突破和进展。[⑤]这是一个极有价值且极富挑战性的课题,无疑在21世纪将得到重视并取得进展。

再谈模糊逻辑。现实世界中充满了模糊现象,这些现象反映到人的思维中形成了模糊概念和模糊命题,如“矮个子”、“美人”、“甲地在乙地附近”、“他很年轻”等。研究模糊概念、模糊命题和模糊推理的逻辑理论叫做“模糊逻辑”。对它的研究始于20世纪20年代,其代表性人物是L·A·查德和P·N·马林诺斯。模糊逻辑为精确逻辑(二值逻辑)解决不了的问题提供了解决的可能,它目前在医疗诊断、故障检测、气象预报、自动控制以及人工智能研究中获得重要应用。显然,它在21世纪将继续得到更大的发展。

3.广义内涵逻辑

经典逻辑只是对命题联结词、个体词、谓词、量词和等词进行了研究,但在自然语言中,除了这些语言成分之外,显然还存在许多其他的语言成分,如各种各样的副词,包括模态词“必然”、“可能”和“不可能”、时态词“过去”、“现在”和“未来”、道义词“应该”、“允许”、“禁止”等等,以及各种认知动词,如“思考”、“希望”、“相信”、“判断”、“猜测”、“考虑”、“怀疑”,这些认知动词在逻辑和哲学文献中被叫做“命题态度词”。对这些副词以及命题态度词的逻辑研究可以归类为“广义内涵逻辑”。

大多数副词以及几乎所有命题态度词都是内涵性的,造成内涵语境,后者与外延语境构成对照。外延语境又叫透明语境,是经典逻辑的组合性原则、等值置换规则、同一性替换规则在其中适用的语境;内涵语境又称晦暗语境,是上述规则在其中不适用的语境。相应于外延语境和内涵语境的区别,一切语言表达式(包括自然语言的名词、动词、形容词直至语句)都可以区分为外延性的和内涵性的,前者是提供外延语境的表达式,后者是提供内涵性语境的表达式。例如,杀死、见到、拥抱、吻、砍、踢、打、与…下棋等都是外延性表达式,而知道、相信、认识、必然、可能、允许、禁止、过去、现在、未来等都是内涵性表达式。

在内涵语境中会出现一些复杂的情况。首先,对于个体词项来说,关键性的东西是我们不仅必须考虑它们在现实世界中的外延,而且要考虑它们在其他可能世界中的外延。例如,由于“必然”是内涵性表达式,它提供内涵语境,因而下述推理是非有效的:

晨星必然是晨星,

晨星就是暮星,

所以,晨星必然是暮星。

这是因为:这个推理只考虑到“晨星”和“暮星”在现实世界中的外延,并没有考虑到它们在每一个可能世界中的外延,我们完全可以设想一个可能世界,在其中“晨星”的外延不同于“暮星”的外延。因此,我们就不能利用同一性替换规则,由该推理的前提得出它的结论:“晨星必然是暮星”。其次,在内涵语境中,语言表达式不再以通常是它们的外延的东西作为外延,而以通常是它们的内涵的东西作为外延。以“达尔文相信人是从猿猴进化而来的”这个语句为例。这里,达尔文所相信的是“人是从猿猴进化而来的”所表达的思想,而不是它所指称的真值,于是在这种情况下,“人是从猿猴进化而来的”所表达的思想(命题)就构成它的外延。再次,在内涵语境中,虽然适用于外延的函项性原则不再成立,但并不是非要抛弃不可,可以把它改述为新的形式:一复合表达式的外延是它出现于外延语境中的部分表达式的外延加上出现于内涵语境中的部分表达式的内涵的函项。这个新的组合性或函项性原则在内涵逻辑中成立。

一般而言,一个好的内涵逻辑至少应满足两个条件:(i)它必须能够处理外延逻辑所能处理的问题;(ii)它还必须能够处理外延逻辑所不能处理的难题。这就是说,它既不能与外延逻辑相矛盾,又要克服外延逻辑的局限。这样的内涵逻辑目前正在发展中,并且已有初步轮廓。从术语上说,内涵逻辑除需要真、假、语句真值的同一和不同、集合或类、谓词的同范围或不同范围等外延逻辑的术语之外,还需要同义、内涵的同一和差异、命题、属性或概念这样一些术语。广而言之,可以把内涵逻辑看作是关于象“必然”、“可能”、“知道”、“相信”,“允许”、“禁止”等提供内涵语境的语句算子的一般逻辑。在这种广义之下,模态逻辑、时态逻辑、道义逻辑、认知逻辑、问题逻辑等都是内涵逻辑。不过,还有一种狭义的内涵逻辑,它可以粗略定义如下:一个内涵逻辑是一个形式语言,其中包括(1)谓词逻辑的算子、量词和变元,这里的谓词逻辑不必局限于一阶谓词逻辑,也可以是高阶谓词逻辑;(2)合式的λ—表达式,例如(λx)A,这里A是任一类型的表达式,x是任一类型的变元,(λx)A本身是一函项,它把变元x在其中取值的那种类型的对象映射到A所属的那种类型上;(3)其他需要的模态的或内涵的算子,例如€,ù、ú。而一个内涵逻辑的解释,则由下列要素组成:(1)一个可能世界的非空集W;(2)一个可能个体的非空集D;(3)一个赋值,它给系统内的表达式指派它们在每w∈W中的外延。对于任一的解释Q和任一的世界w∈W,判定内涵逻辑系统中的任一表达式X相对于解释Q在w∈W中的外延总是可能的。这样的内涵逻辑系统有丘奇的LSD系统,R·蒙塔古的IL系统,以及E·N·扎尔塔的FIL系统等。[⑥]在各种内涵逻辑中,认识论逻辑(epistemiclogic)具有重要意义。它有广义和狭义之分。广义的认识论逻辑研究与感知(perception)、知道、相信、断定、理解、怀疑、问题和回答等相关的逻辑问题,包括问题逻辑、知道逻辑、相信逻辑、断定逻辑等;狭义的认识论逻辑仅指知道和相信的逻辑,简称“认知逻辑”。冯·赖特在1951年提出了对“认知模态”的逻辑分析,这对建立认知逻辑具有极大的启发作用。J·麦金西首先给出了一个关于“知道”的模态逻辑。A·帕普于1957年建立了一个基于6条规则的相信逻辑系统。J·亨迪卡于60年代出版的《知识和信念》一书是认知逻辑史上的重要著作,其中提出了一些认知逻辑的系统,并为其建立了基于“模型集”的语义学,后者是可能世界语义学的先导之一。当今的认知逻辑纷繁复杂,既不成熟也面临许多难题。由于认知逻辑涉及认识论、心理学、语言学、计算机科学和人工智能等诸多领域,并且认知逻辑的应用技术,又称关于知识的推理技术,正在成为计算机科学和人工智能的重要分支之一,因此认知逻辑在20世纪中后期成为国际逻辑学界的一个热门研究方向。这一状况在21世纪将得到继续并进一步强化,在这方面有可能出现突破性的重要结果。

4.对自然语言的逻辑研究

对自然语言的逻辑研究有来自几个不同领域的推动力。首先是计算机和人工智能的研究,人机对话和通讯、计算机的自然语言理解、知识表示和知识推理等课题,都需要对自然语言进行精细的逻辑分析,并且这种分析不能仅停留在句法层面,而且要深入到语义层面。其次是哲学特别是语言哲学,在20世纪哲学家们对语言表达式的意义问题倾注了异乎寻常的精力,发展了各种各样的意义理论,如观念论、指称论、使用论、言语行为理论、真值条件论等等,以致有人说,关注意义成了20世纪哲学家的职业病。再次是语言学自身发展的需要,例如在研究自然语言的意义问题时,不能仅仅停留在脱离语境的抽象研究上面,而要结合使用语言的特定环境去研究,这导致了语义学、语用学、新修辞学等等发展。各个方面发展的成果可以总称为“自然语言逻辑”,它力图综合后期维特根斯坦提倡的使用论,J·L·奥斯汀、J·L·塞尔等人发展的言语行为理论,以及P·格赖斯所创立的会话含义学说等成果,透过自然语言的指谓性和交际性去研究自然语言中的推理。

自然语言具有表达和交际两种职能,其中交际职能是自然语言最重要的职能,是它的生命力之所在。而言语交际总是在一定的语言环境(简称语境)中进行的,语境有广义和狭义之分。狭义的语境仅指一个语词、一个句子出现的上下文。广义的语境除了上下文之外,还包括该语词或语句出现的整个社会历史条件,如该语词或语句出现的时间、地点、条件、讲话的人(作者)、听话的人(读者)以及交际双方所共同具有的背景知识,这里的背景知识包括交际双方共同的信念和心理习惯,以及共同的知识和假定等等。这些语境因素对于自然语言的表达式(语词、语句)的意义有着极其重要的影响,这具体表现在:(i)语境具有消除自然语言语词的多义性、歧义性和模糊性的能力,具有严格规定语言表达式意义的能力。(ii)自然语言的句子常常包含指示代词、人称代词、时间副词等,要弄清楚这些句子的意义和内容,就要弄清楚这句话是谁说的、对谁说的、什么时候说的、什么地点说的、针对什么说的,等等,这只有在一定的语境中才能进行。依赖语境的其他类型的语句还有:包含着象“有些”和“每一个”这类量化表达式的句子的意义取决于依语境而定的论域,包含着象“大的”、“冷的”这类形容词的句子的意义取决于依语境而定的相比较的对象类;模态语句和条件语句的意义取决于因语境而变化的语义决定因素,如此等等。(iii)语言表达式的意义在语境中会出现一些重要的变化,以至偏离它通常所具有的意义(抽象意义),而产生一种新的意义即语用涵义。有人认为,一个语言表达式在它的具体语境中的意义,才是它的完全的真正的意义,一旦脱离开语境,它就只具有抽象的意义。语言的抽象意义和它的具体意义的关系,正象解剖了的死人肢体与活人肢体的关系一样。逻辑应该去研究、理解、把握自然语言的具体意义,当然不是去研究某一个(或一组)特定的语句在某个特定语境中唯一无二的意义,而是专门研究确定自然语言具体意义的普遍原则。[⑦]

美国语言学家保罗·格赖斯把语言表达式在一定的交际语境中产生的一种不同于字面意义的特殊涵义,叫做“语用涵义”、“会话涵义”或“隐涵”(implicature),并于1975年提出了一组“交际合作原则”,包括一个总则和四组准则。总则的内容是:在你参与会话时,你要依据你所参与的谈话交流的公认目的或方向,使你的会话贡献符合这种需要。仿照康德把范畴区分为量、质、关系和方式四类,格赖斯提出了如下四组准则:

(1)数量准则:在交际过程中给出的信息量要适中。

a.给出所要求的信息量;

b.给出的信息量不要多于所要求的信息量。

(2)质量准则:力求讲真话。

a.不说你认为假的东西,。

b.不说你缺少适当证据的东西。

(3)关联准则:说话要与已定的交际目的相关联。

(4)方式准则:说话要意思明确,表达清晰。

a.避免晦涩生僻的表达方式;

b.避免有歧义的表达方式;

c.说话要简洁;

d.说话要有顺序性。[⑧]

后来对这些原则提出了不少修正和补充,例如有人还提出了交际过程中所要遵守的“礼貌原则”。只要把交际双方遵守交际合作原则之类的语用规则作为基本前提,这些原则就可以用来确定和把握自然语言的具体意义(语用涵义)。实际上,一个语句p的语用涵义,就是听话人在具体语境中根据语用规则由p得到的那个或那些语句。更具体地说,从说话人S说的话语p推出语用涵义q的一般过程是:

(i)S说了p;

(ii)没有理由认为S不遵守准则,或至少S会遵守总的合作原则;

(iii)S说了p而又要遵守准则或总的合作原则,S必定想表达q;

(iv)S必然知道,谈话双方都清楚:如果S是合作的,必须假设q;

(v)S无法阻止听话人H考虑q;

(vi)因此,S意图让H考虑q,并在说p时意味着q。

试举二例:

(1)a站在熄火的汽车旁,b向a走来。a说:“我没有汽油了。”b说:“前面拐角处有一个修车铺。”这里a与b谈话的目的是:a想得到汽油。根据关系准则,b说这句话是与a想得到汽油相关的,由此可知:b说这句话时隐涵着:“前面的修车铺还在营业并且卖汽油。”

(2)某教授写信推荐他的学生任某项哲学方面的工作,信中写到:“亲爱的先生:我的学生c的英语很好,并且准时上我的课。”根据量的准则,应该提供所需要的信息量;作为教授,他对自己的学生的情况显然十分熟悉,也可以提供所需要的信息量,但他有意违反量的准则,在信中只用一句话来介绍学生的情况,任用人一旦接到这封信,自然明白:教授认为c不宜从事这项哲学工作。

并且,语用涵义还具有如下5个特点:(i)可取消性:在给原话语附加上某些话语之后,它原有的语用涵义可被取消。在例(1)中,若b在说“前面拐角处有一个修车铺”之后又补上一句:“不过它这时已经关门了”,则原有的语用涵义“你可从那里得到汽油”就被取消了。(ii)不可分离性:如果某话语在特定的语境中产生了语用涵义,则无论采用什么样的同义结构,该含义始终存在,因为它所依附的是话语的内容,而不是话语的形式。(iii)可推导性,前面已说明这一点。(iv)非规约性:语用涵义不能单独从话语本身推出来,除要考虑交际合作原则之类的语用规则之外,也需要假定通常的逻辑推理规则,并需要把上文语句、交际双方所共有的背景知识作为附加前提考虑在内。(v)不确定性:同一句话语在不同的语境中可以产生不同的语用涵义。显然,确定某个话语的语用涵义是一个极其复杂的过程,需要综合和分析、归纳和演绎的统一应用,因此具有一定的或然性。研究如何迅速有效地把握自然语言表达式在具体语境中的语用涵义,这正是自然语言逻辑所要完成的任务之一,它将在21世纪取得进展。