多模态范畴逻辑研究
2014-05-18
一、
多模态范畴逻辑的背景介绍自上个世纪70年代以来,逻辑和语言的交叉研究获得长足发展。该领域的基础是范畴语法:作为开端的蒙太格语法,其思想来源于范畴语法;而蒙太格语法以后的类型-逻辑语义学及语法逻辑均是范畴语法序列的延伸。近20来年关于自然语言的范畴语法分析已在计算机信息处理领域内获得了应用。同时,对范畴语法进行逻辑系统的抽象,并构造可能世界的框架语义解释,就形成了所谓多模态范畴逻辑。可以说,范畴语法是多模态范畴逻辑产生的背景。范畴语法是一种使用运算和推演的手段描述语言的形式化工具。运算的概念与数学相关,所以范畴语法是一种数理语言学。推演的技术涉及逻辑,所以范畴语法自然也属于逻辑。强调运算的思想是计算机程序设计的要求,所以范畴语法的分析方式对计算机的自然语言信息处理具有直接的应用价值。概言之,范畴语法的基本原则是:语言认知就是数学计算,语法分析就是逻辑演绎。荷兰逻辑学家和计算语言学家莫特盖特(M. Moortgat)用三个等式概括出范畴语法的核心思想:认知=计算;语法=逻辑;分析=演绎。范畴语法尤其关注自然语言。所谓自然语言就是各个民族在长期共同的社会生活中历史形成的语言,汉语、英语、俄语、日语和德语都属于自然语言。这些民族语言的表层结构不同于机械的人工语言,但作为形式科学的产物,运算和推演的概念又如何跟自然语言联系在一起?这需要从自然语言本身的特征说起。在小学阶段,语文课就有组词造句的练习,这说明自然语言具备用单词连成词组,再由词组连成短语以及句子的功能。如由“北京”和“上海”连成“北京上海”;由“张三”和“散步”连成“张三散步”。自然语言是一个由较小语言成分形成较大语言成分的符号体系,这就是自然语言的毗连性(concatenation)。通过毗连自然语言符号串可以逐步增长扩张,这也是人们常说的自然语言的生成性(generation)或能产性。自然语言的生成性表现为逐层逐级的毗连过程,如英语句:theparkinthe parkwalksin the parkJohnwalks in the parkJohn walks in the park自然语言的毗连生成体现出由小到大的增长性,因此可以用德国逻辑学家弗雷格(G. Frege)的语句函项思想来分析其形成过程。具体说就是:把某一语言成分当作是函项,把相邻的成分当作函项的主目,把两个成分的毗连当作函项运算获得的结果。这便是范畴语法从深层角度把握自然语言形成规律的基本方法。要把自然语言的毗连生成转换成函项运算,就需要对自然语言的表达式进行范畴指派。我们给有些表达式指派作为运算函子的范畴(A/B或A\B),给另一些表达式指派作为运算主目的范畴(A或B),然后就通过范畴之间的运算来展示自然语言的毗连生成。从逻辑角度看,范畴语法把自然语言的毗连生成当作是一种逻辑推演。把作为函项的范畴和作为主目的范畴看作推演的前提,把作为函项运算值的范畴看作推演的结论,把据之为推的规则看作是从前提到结论的依据。就上例而言,在给专名John、不及物动词walks、介词in、冠词the和通名park分别指派了各自的范畴以后,我们就把上例英语句的毗连生成替换成从前提范畴到结论范畴的一系列推演:
thepark
innp/(np\s)np\s
walks(np\s)\(np\s)/npnp
Johnnp\s(np\s)\(np\s)
npnp\s
s范畴语法对自然语言的分析方式很快在计算机领域里获得应用。范畴语法贯穿了数学运算和逻辑推演的思想,本质上就是一种逻辑程序语言,可以说范畴语法是在逻辑程序框架内表述的理论。范畴语法所需要的公理和推演规则,按照莫特盖特的做法,采用作为逻辑程序语言的霍恩子句形式(Horn clause form)表述出来(Moortgat,1988, pp133—134)。通过莫特盖特的工作,把范畴语法判定句子是否合语法归结为逻辑程序的求解问题。近年来范畴语法的研究成果日益受到自然语言的计算机处理领域的关注。莫特盖特的学生Moot进而在其博士论文中设计了被称之为Grail的范畴语法定理证明器。这是一种基于证明网技术的Prolog程序软件,是范畴语法分析自然语言的计算机实现。在计算机上下载这个软件后,可以设计任何自然语言片段的范畴语法系统:输入词条构成词库,输入结构公设等特定的技术手段。然后据此判定任意给定的句子是否合语法。同时,Grail还在视窗界面上展示判定的搜索过程,详细的介绍参见(Moot, 2001)。二、多模态范畴逻辑的构成范畴语法对自然语言的逻辑分析在计算机领域获得实现,这样推动了自然语言的信息处理工作。另一方面,逻辑学家或数学家从逻辑理论角度深入研究范畴语法。对范畴运算推演规律进行抽象形成范畴语法的逻辑系统,不仅把函子范畴中的斜线算子“/”和“\”以及毗连算子“·”当作广义的逻辑联结词,把范畴推演的规则当作是系统中的定理,还进一步考虑建立范畴逻辑的语义理论。范畴逻辑系统于是获得可能世界的框架语义解释,据此函子范畴中的斜线算子和范畴的毗连均被看作是二元模态算子,并且在系统中添加一元模态算子“◇”和“ð¯”用于自然语言结构性质的刻画。范畴推演的来源——自然语言的生成毗连就成为范畴逻辑的可能世界语义框架的载体。范畴语法最终发展成现代模态逻辑的一个应用分支——多模态范畴逻辑。在多模态范畴逻辑看来,一部语法的构成具有两大机制:逻辑的推演和结构的推演。逻辑的推演是指依据有关函子范畴的定理的推演,如下列推演的第一步和第二步:lovesMaryJohn(np\s)/npnp据向右函子范畴的定理:A/B·B ® A npnp\s据向左函子范畴的定理:A·A\B ® Bs而结构的推演指依据跟毗连算子有关的结构公设的推演,如下列推演的第2步:hatesJohnMary(np\s)/npnpnp据函子范畴的提升定理s/(np\s)ß据结构公设:A·(B·C)®(A·B)·Cs/(np\s)(np\s)/np据向右函子范畴的传递定理s/npnp据向右函子范畴的定理s所以说,逻辑推演大都依据和斜线算子有关的定理;而结构推演则多半凭借仅仅涉及毗连算子的结构公设。于是在多模态范畴逻辑那里,我们就有以下推演机制:主要针对斜线算子的、仅仅针对毗连算子的以及涉及斜线或毗连的机制。(1)涉及斜线或毗连——同一公理和传递规则:A ® BB ® CA ® AA ® C(2)主要针对斜线算子——4条冗余规则:A·B ® CA·B ® CA·B ® CA ® C/BB ® A\CA ® C/BB ® A\CA·B ® CA·B ® C(3)仅仅跟毗连算子有关——结构公设:(ass)A·(B·C) « (A·B)·C(comm)A·B « B·A基于(1)和(2)对(3)的两条公设进行取舍,就形成了多模态范畴逻辑公理表述的4个基本系统:NL = (1) + (2);L = (1) + (2) + (ass);NLP = (1) + (2) + (com);LP = (1) + (2) + (3)。NL又叫做非结合的Lambek演算;L叫做结合的Lambek演算;NLP称作非结合的交换Lambek演算;LP称之为结合交换的Lambek演算。其次,多模态范畴逻辑还采取便于解决判定问题的Gentzen后承表述(Moortgat, 1997, pp105—106, p136)。从证明论角度看,多模态范畴逻辑的公理表述存在不足,即无法给定理证明提供能行的判定程序。问题出在传递规则的使用上,从A ® B和B ® C推出A ® C意味:凭借B的帮助获得A ® C,但从中却看不到B的踪迹。因为存在无穷多个可能的B,对此不可能进行穷尽搜索。概言之,传递规则的使用使得在多模态范畴逻辑中不可能进行定理证明的搜索判定。而Gentzen后承表述与其公理表述是等价的,推出的定理集是相等的。在Gentzen表述中,与传递规则对应的Cut规则是可消去的,因此多模态范畴逻辑的Gentzen表述能够解决定理证明的有穷搜索问题,即所谓判定问题。此外,多模态范畴逻辑还具有与Gentzen后承表述等价的自然演绎系统。在莫特盖特看来,某种意义讲自然演绎比Gentzen后承表述更能体现证明和推演的精神(Moortgat, 1997, p110),其推演能力最终与公理表述等价。公理表述虽适于元逻辑性质的讨论,如完全性的证明,但自然演绎却使人能够更清楚直观地感受从自然语言词条来源到范畴推演的过程,有利于对自然语言语句进行范畴分析的演示。从模态逻辑的视角看,展示范畴推演规律的函子范畴和范畴的毗连都是模态公式,范畴毗连的结构性质甚至还通过一元模态算子表现出来。在多模态范畴逻辑系统中,“/”、“\”和“·”等联结词均被看作是二元模态算子,同时可引进一元模态算子“◇”和“¯”用以刻画语言的结构性质,有关的推演规则为:◇A ® BA ®¯BA ®¯B◇A ® B既然系统中的公式涉及模态算子,系统的语义理论自然就跟可能世界关系语义学分不开。系统的框架语义学表现为:三元和二元的混合框架áW, R3, R2ñ。这里W被当作是自然语言来源(符号、句法和语义的信息)的集合。R3表示语言毗连生成的情况,“R3xyz”的直观涵义为:x是y和z的毗连。R2与语言的结构性质有关,“R2xy”的涵义为:x是y的满足某结构性质的变种。框架语义基础上的赋值函项v定义为:对原子公式p而言:v(p) Í Wv(A·B) = {x | $y$z[R3xyz & y∈v(A) & z∈v(B)]}v(A/B) = {y | "x"z[R3xyz & z∈v(B) Þ x∈v(A)]}v(A\B) = {z | "x"y[R3xyz & y∈v(A) Þ x∈v(B)]}v(◇A) = {x | $y (Rxy & y Îv(A))}v(¯A) = { x | "y (Ryx ® y Îv(A))}在多模态范畴逻辑的框架语义学那里,结构公设总要对框架中的R3或R2产生影响。按照对应论(correspondence theory)的要求,对每一结构公设而言,必须给R3或R2定义某个性质(类似模态逻辑中R的自返或传递性质),即对R3或R2进行某种限制。如对应(ass)和(comm),有关R3的限制分别为:
$t.Rtxy & Rutz Û ,$v.Rvyz & RuxvRxyz Û Rxzy
基于上述框架语义及其赋值,我们可以定义典范模型,证明所谓真值引理,最后获得多模态范畴逻辑系统的可靠性和完全性证明(Došen, 1992, Moortgat, 1997)。
应该指出,多模态范畴逻辑中除了具有涉及单纯毗连算子的结构公设,还可能有涉及混合毗连算子以及通过一元模态算子显示出的结构公设。这样就使得多模态范畴逻辑由于结构公设的不同而产生了多种多样的系统。
三、多模态范畴逻辑的汉语研究汉语句子具有比较灵活的语序,其主语、宾语和谓语动词可以出现在不同的位置上,而不影响基本的语义。从范畴语法角度看,需要建立针对汉语灵活语序的范畴推演机制。为此,本文提出关于范畴分析的自然语言来源的位置移动的结构公设,形成特定的范畴逻辑系统,即一种多模态系统(multimodal system),并给该系统框架语义解释的可通达关系确立相应的限制条件,然后进行系统的元逻辑讨论——可靠性和完全性的证明。
语言学研究早就注意到汉语句子语序的灵活性。在汉语不少句子那里,主语、宾语和谓语可以出现在不同的位置上(吴平2005年第53页,蒋严、潘海华1998年第200页),如:正常句:(1a)刘强爱看言情片(2a)张三买了á西游记ñ话题句:(1b)言情片刘强爱看(2b)á西游记ñ张三买了焦点句:(1c)刘强言情片爱看(2c)张三á西游记ñ买了以上两组句子在重音或焦点的处理上有所不同,但有一点是共同的,即这些句子在汉语那里都是说得通的,并且具有相同的基本语义。人们感到困惑的是:“根据类型论的规定,每个词项都被赋予相应的句法范畴和语义类型。动词的句法范畴规定了相关的名词论元出现的左右位置。这样,作为大前提的动词就会朝某个方向去搜寻论元并与之合并。然而,有些论元由于种种原因,有时并不出现在规定的方位,却出现在相反的方向。这样,动词就寻觅不到所需的论元。而另一方面,正因为动词无法与相关论元合并,整个句子便出现了一个额外的、不能用的论元。组合机制因此陷于停顿,句子便无以生成。”(蒋严、潘海华1998年第199页)。逻辑研究者应该说明这些不同语序的汉语句之所以能够成立的原因。其深层的内在原因是它们具有大致相同的语义,并且从不同的句法形式能够推出相同的语义。本文试图从多模态范畴逻辑的角度给出这样的说明。在范畴语法看来,句法上合语法的句子能够通过范畴推演获得句子范畴s。比如:在给(1a)中各词条指派一定范畴的前提下根据范畴推演定理就能够获得范畴s。采用自然演绎推演如下:刘强爱看言情片np(np\s)/npnp据有关规则(爱看,言情片)⊢(np\s)据有关规则(刘强,(爱看,言情片))⊢s这表明(1a)是合语法的语句。但同样的范畴指派,显然不能分别从(1b)和(1c)那样的排列语序推得范畴s,从而无法判定它们是合语法的句子。如(1d)的情况为:
言情片刘强爱看npnp(np\s)/np?(刘强,爱看)⊢??(言情片,(刘强,爱看))⊢?然而,汉语的灵活语序机制则允许(1b)和(1c)具有与(1a)相同的基本语义,在这里要求都能够推出s。多模态范畴逻辑要反映这种机制,在给有关词条指派固定范畴的前提下,必须揭示汉语特有的关于毗连的结构性质。这种结构性质使得(1a)—(1c)能够推出相同的语义,即(1b)—(1c)的范畴推演都获得s,从而表明它们都是合语法的句子。汉语的灵活语序表现为语词符号的位置移动,在多模态范畴逻辑看来,这是一种结构性质。基于此,我们确立关于位置移动的结构公设来概括这些性质。比如:P1若(A, ( B,◇C ))⊢D则(◇C, ( A, B ))⊢DP2若(◇C, ( A, B ))⊢D则(A, (◇C, B))⊢DP1后件的前提是(1a)的结构抽象,P1前件的前提是对(1b)的抽象。回到具体,“言情片”变成了“◇言情片”。这里,一元模态算子究竟起什么作用?在汉语那里,从(1a)到(1b),再到(1c),我们看到宾语“言情片”位置的移动。移动的后果是给它指派的范畴np无法跟毗邻的范畴进行运算,相当于用一元模态算子“ð¯”锁住了np,使之无所作为。所以在汉语的范畴语法词库中可以定义:
言情片⊢ð¯np刘强⊢np爱看⊢(np\s)/np¼¼在正常语序句(1a)这里,“言情片”对应的范畴是可以同动词对应的函子范畴进行运算的。必须用规则“如果A⊢ð¯B则◇A⊢B”把锁打开而获得“◇言情片⊢np”,这样范畴推演才得以展开。开锁的钥匙是约束“言情片”的一元模态算子“◇”,这个钥匙承载了结构性质P1和P2的信息,表明其管辖的表达式“言情片”满足P1和P2所显示的位置移动,表明这些移动使我们照样能够获得移动前所得到的范畴推演结果。换言之,这一系列操作意味:“言情片”作为表现汉语灵活语序的特殊表达式,先给它指派上锁的范畴“ð¯np”,使之无法运算;在正常语序句情况下,作为宾语的“言情片”对应的范畴则可以进行运算,是可以解禁的,开锁模态算子“◇”约束“言情片”意味对“言情片”的范畴“ð¯np”进行解禁而获得“np”。同时意味“◇”约束的表达式可以满足P1和P2揭示的结构性质,表明汉语的焦点句、话题句和正常句一样具有相同的范畴推演结果,最终具有相同的基本语义,这就是我们对汉语灵活语序内在机制的说明。
本文处理汉语灵活语序的多模态范畴逻辑的自然演绎表述有下列规则:
[Ax,< ,/span>]A⊢A
[/I]( G, B)⊢A[/E]G⊢A/BD⊢B
G⊢A/B(G, D)⊢A
[\I]( B, G)⊢A[\E] G⊢BD⊢B\A
G⊢B\A(G, D)⊢A
[·I]G⊢AD⊢B[·E]D⊢A · BG[(A, B)]⊢C
(G, D)⊢A · BG[D]⊢C
[ð¯E]G⊢ð¯A[ð¯I]áGñ⊢A
áGñ⊢AG⊢ð¯A
[◇I]G⊢A[◇E]D⊢◇AG[áAñ]⊢B
áGñ⊢◇AG[áDñ]⊢B这里结构规则可以针对范畴推演的来源,即自然语言位置移动的情况:
[P1]G[(△1,(△2,á△3ñ))]⊢A[P2]G[(á△3ñ,(△1,△2))]⊢AG[(á△3ñ,(△1,△2))]⊢AG[(△1,(á△3ñ,△2))]⊢A我们以(1a) — (1c)的范畴推演分析为例演示如下:
刘强爱看言情片np(np\s)/npð¯np[ð¯E]á言情片ñ⊢np[/E](爱看,á言情片ñ)⊢np\s[\E](刘强,(爱看,á言情片ñ))⊢s(1a)的范畴分析[P1](á言情片ñ,(刘强,爱看))⊢s(1b)的范畴分析[P2](刘强,(á言情片ñ,爱看))⊢s(1c)的范畴分析
通过我们确立的范畴推演机制,我们从(1a)、(1b)和(1c)分别推出范畴s,表明它们都是合语法的句子。如果把这个机制延伸到类型-逻辑语义学的范围,给这里的s配上l-词项,就能见出三个句子具有相同的逻辑语义表现。为了便于讨论上述多模态范畴逻辑的元逻辑问题,我们需要从自然演绎方式回到相应的公理表述上来,令CL为这样的多模态范畴系统。
CL的合式公式定义为:
F∷=A½F/F½F·F½F\F½◇F½ð¯F
CL的公理和推演规则为:A ® A(同一公理)
A ® B, B ® C⊢A ® C(传递规则)
A · B ® C⊢⊣A ® C/B(冗余规则1和2)
A · B ® C⊢⊣B ® A\C(冗余规则3和4)
A ® ð¯B⊢◇A ® B(开锁规则)
◇A ® B⊢A ® ð¯B(上锁规则) CL的结构公设为:
P1◇C·( A·B ) ® A·( B·◇C )P2A·(◇C·B) ®◇C·( A·B )CL的框架语义模型为:áW, R3, R2, vñ。有关W, R2, R3和v按照通常的理解,参见上文的说明,这里从略。
CL框架语义具有对应P1和对应P2的框架性质,分别为:
(*)$uv[R2uz & R3vxy & R3wuv] Þ $st[R2sz&R3tys& R3wxt]
(**)$st[R2sz&R3tys&R3wxt] Þ $uv[R2uz & R3vxy & R3wuv]
元逻辑讨论的主要内容是系统的模型可靠性和完全性:定理3.1:CL⊢A ® B当且仅当对每个满足(*)和(**)的CL框架áW, R3, R2ñ的每个赋值v而言,v(A) Í v(B)。从左到右的可靠性证明需要施归纳于A®B推演的长度:长度为1时证明公理公设的有效性,假定长度为n时断言成立,要证长度为n + 1时断言成立,即证明推理规则保持有效性(参见Došen, 1992)。从右到左的完全性证明需要使用通常的典范模型方法。典范模型MK定义为:定义3.2MK= á,WK, R3K, R2K vKñ
(a)WK是F中公式的集合
(b)R3K(ABC)当且仅当CL⊢A ® B · C
(c)R2K(AB)当且仅当CL⊢A ®◇B
(d)A∈vK(p)即MK, A⊨p当且仅当CL⊢A ® p
由于CL的框架语义具有性质(*)和(**),要表明定义3.2给出的MK是一个CL框架上的模型,就必须证明:引理3.3MK满足(*)和(**)。证明:设(*)的前提$uv[[R2uz & R3vxy & R3wuv]成立;枚举:R2DC:据定义3.2(c)得:⊢D ®◇C据I公理和单调规则:⊢D · (A · B) ®◇C · (A · B)(1)R3EAB:据定义3.2(b)得:⊢E ® A · B据I公理和单调规则:⊢D · E ® D · (A · B)(2)R3GDE:据定义3.2(b)得:⊢G ® D · E(3)据(3)(2)(1)用传递规则得:⊢G ®◇C · (A · B)(4)由于P1:⊢◇C · ( A · B ) ® A · ( B ·◇C )(5) (4)(5)传递得:⊢G ® A · ( B ·◇C )据定义3.2(b)得:R3GA(B ·◇C))(6)另一方面,假设(*)的结论不成立,即得:"st[R2sz&R3tys ® ~R3wxt]]枚举:R2◇CC & R3(B ·◇C)(B ·◇C) ® ~R3GA(B ·◇C)(7)据I公理:◇C ®◇C和定义3.2(c)得:R2◇CC(8)据I公理:(B·◇C) ®(B·◇C)和定义3.2(b)得:R3(B·◇C)(B·◇C)(9)据(8)和(9)与(7)分离得:~R3GA(B·◇C)与(6)矛盾,于是(*)结论成立,故MK满足(*)。MK满足(**)的证明是类似的。
关于MK的所谓真值引理为:
引理3.4对任CL-公式j而言,MK, A⊨j当且仅当CL⊢A ® j。
证明过程参见Došen教授1992年的论文。
最后的完全性证明:如果CL⊬A ® B,据引理3.3和3.4,则存在CL-框架的模型MK满足:MK,A⊭B,则有A∉vK(B);由CL⊢A ® A据定义3.2(d)有:A∈vK(A),因此vK(A)⊈vK(B)。
参考文献
[1] Došen,K.(1992) : A brief survey of frames for the Lambek calculus, Z.Math.Logik Grundlag.Math.38.[2] Moortgat, M.(1988) : Categorial Investgations. Foris Publication. [3] Moortgat, M.(1997) : Categorical type logic. In Handbook of Logic and Language, J. van Benthem and A. ter Meulen, eds. The MIT Press,Cambridge, MA., pp93 — 177.[4] Moortgat, M.(2002): Categorial Grammar and Formal Semantics. Article #231, Encyclopedia of Cognitive Science, Nature Publishing Group, Macmillan Publisher Ltd.[5] Moot, R.(2001) :Proof Nets for Linguistic Analysis, PhD thesis,UtrechtUniversity.[6]蒋严潘海华(1998) :《形式语义学引论》,中国社会科学出版社,北京。[7]吴平(2005) :《逻辑语义分析》,待出。
(原载《哲学研究》,2006年第9期。录入编辑:神秘岛), style="LETTER-SPACING: 0.2pt; mso-bidi-font-size: 10.5pt"> B ® C
A ® C/BB ® A\CA ® C/BB ® A\CA·B ® CA·B ® C(3)仅仅跟毗连算子有关——结构公设:(ass)A·(B·C) « (A·B)·C(comm)A·B « B·A基于(1)和(2)对(3)的两条公设进行取舍,就形成了多模态范畴逻辑公理表述的4个基本系统:NL = (1) + (2);L = (1) + (2) + (ass);NLP = (1) + (2) + (com);LP = (1) + (2) + (3)。NL又叫做非结合的Lambek演算;L叫做结合的Lambek演算;NLP称作非结合的交换Lambek演算;LP称之为结合交换的Lambek演算。其次,多模态范畴逻辑还采取便于解决判定问题的Gentzen后承表述(Moortgat, 1997, pp105—106, p136)。从证明论角度看,多模态范畴逻辑的公理表述存在不足,即无法给定理证明提供能行的判定程序。问题出在传递规则的使用上,从A ® B和B ® C推出A ® C意味:凭借B的帮助获得A ® C,但从中却看不到B的踪迹。因为存在无穷多个可能的B,对此不可能进行穷尽搜索。概言之,传递规则的使用使得在多模态范畴逻辑中不可能进行定理证明的搜索判定。而Gentzen后承表述与其公理表述是等价的,推出的定理集是相等的。在Gentzen表述中,与传递规则对应的Cut规则是可消去的,因此多模态范畴逻辑的Gentzen表述能够解决定理证明的有穷搜索问题,即所谓判定问题。此外,多模态范畴逻辑还具有与Gentzen后承表述等价的自然演绎系统。在莫特盖特看来,某种意义讲自然演绎比Gentzen后承表述更能体现证明和推演的精神(Moortgat, 1997, p110),其推演能力最终与公理表述等价。公理表述虽适于元逻辑性质的讨论,如完全性的证明,但自然演绎却使人能够更清楚直观地感受从自然语言词条来源到范畴推演的过程,有利于对自然语言语句进行范畴分析的演示。从模态逻辑的视角看,展示范畴推演规律的函子范畴和范畴的毗连都是模态公式,范畴毗连的结构性质甚至还通过一元模态算子表现出来。在多模态范畴逻辑系统中,“/”、“\”和“·”等联结词均被看作是二元模态算子,同时可引进一元模态算子“◇”和“¯”用以刻画语言的结构性质,有关的推演规则为:◇A ® BA ®¯BA ®¯B◇A ® B既然系统中的公式涉及模态算子,系统的语义理论自然就跟可能世界关系语义学分不开。系统的框架语义学表现为:三元和二元的混合框架áW, R3, R2ñ。这里W被当作是自然语言来源(符号、句法和语义的信息)的集合。R3表示语言毗连生成的情况,“R3xyz”的直观涵义为:x是y和z的毗连。R2与语言的结构性质有关,“R2xy”的涵义为:x是y的满足某结构性质的变种。框架语义基础上的赋值函项v定义为:对原子公式p而言:v(p) Í Wv(A·B) = {x | $y$z[R3xyz & y∈v(A) & z∈v(B)]}v(A/B) = {y | "x"z[R3xyz & z∈v(B) Þ x∈v(A)]}v(A\B) = {z | "x"y[R3xyz & y∈v(A) Þ x∈v(B)]}v(◇A) = {x | $y (Rxy & y Îv(A))}v(¯A) = { x | "y (Ryx ® y Îv(A))}在多模态范畴逻辑的框架语义学那里,结构公设总要对框架中的R3或R2产生影响。按照对应论(correspondence theory)的要求,对每一结构公设而言,必须给R3或R2定义某个性质(类似模态逻辑中R的自返或传递性质),即对R3或R2进行某种限制。如对应(ass)和(comm),有关R3的限制分别为:
$t.Rtxy & Rutz Û $v.Rvyz & RuxvRxyz Û Rxzy
基于上述框架语义及其赋值,我们可以定义典范模型,证明所谓真值引理,最后获得多模态范畴逻辑系统的可靠性和完全性证明(Došen, 1992, Moortgat, 1997)。
应该指出,多模态范畴逻辑中除了具有涉及单纯毗连算子的结构公设,还可能有涉及混合毗连算子以及通过一元模态算子显示出的结构公设。这样就使得多模态范畴逻辑由于结构公设的不同而产生了多种多样的系统。
三、多模态范畴逻辑的汉语研究汉语句子具有比较灵活的语序,其主语、宾语和谓语动词可以出现在不同的位置上,而不影响基本的语义。从范畴语法角度看,需要建立针对汉语灵活语序的范畴推演机制。为此,本文提出关于范畴分析的自然语言来源的位置移动的结构公设,形成特定的范畴逻辑系统,即一种多模态系统(multimodal system),并给该系统框架语义解释的可通达关系确立相应的限制条件,然后进行系统的元逻辑讨论——可靠性和完全性的证明。
语言学研究早就注意到汉语句子语序的灵活性。在汉语不少句子那里,主语、宾语和谓语可以出现在不同的位置上(吴平2005年第53页,蒋严、潘海华1998年第200页),如:正常句:(1a)刘强爱看言情片(2a)张三买了á西游记ñ话题句:(1b)言情片刘强爱看(2b)á西游记ñ张三买了焦点句:(1c)刘强言情片爱看(2c)张三á西游记ñ买了以上两组句子在重音或焦点的处理上有所不同,但有一点是共同的,即这些句子在汉语那里都是说得通的,并且具有相同的基本语义。人们感到困惑的是:“根据类型论的规定,每个词项都被赋予相应的句法范畴和语义类型。动词的句法范畴规定了相关的名词论元出现的左右位置。这样,作为大前提的动词就会朝某个方向去搜寻论元并与之合并。然而,有些论元由于种种原因,有时并不出现在规定的方位,却出现在相反的方向。这样,动词就寻觅不到所需的论元。而另一方面,正因为动词无法与相关论元合并,整个句子便出现了一个额外的、不能用的论元。组合机制因此陷于停顿,句子便无以生成。”(蒋严、潘海华1998年第199页)。逻辑研究者应该说明这些不同语序的汉语句之所以能够成立的原因。其深层的内在原因是它们具有大致相同的语义,并且从不同的句法形式能够推出相同的语义。本文试图从多模态范畴逻辑的角度给出这样的说明。在范畴语法看来,句法上合语法的句子能够通过范畴推演获得句子范畴s。比如:在给(1a)中各词条指派一定范畴的前提下根据范畴推演定理就能够获得范畴s。采用自然演绎推演如下:刘强爱看言情片np(np\s)/npnp据有关规则(爱看,言情片)⊢(np\s)据有关规则(刘强,(爱看,言情片))⊢s这表明(1a)是合语法的语句。但同样的范畴指派,显然不能分别从(1b)和(1c)那样的排列语序推得范畴s,从而无法判定它们是合语法的句子。如(1d)的情况为:
言情片刘强爱看npnp(np\s)/np?(刘强,爱看)⊢??(言情片,(刘强,爱看))⊢?然而,汉语的灵活语序机制则允许(1b)和(1c)具有与(1a)相同的基本语义,在这里要求都能够推出s。多模态范畴逻辑要反映这种机制,在给有关词条指派固定范畴的前提下,必须揭示汉语特有的关于毗连的结构性质。这种结构性质使得(1a)—(1c)能够推出相同的语义,即(1b)—(1c)的范畴推演都获得s,从而表明它们都是合语法的句子。汉语的灵活语序表现为语词符号的位置移动,在多模态范畴逻辑看来,这是一种结构性质。基于此,我们确立关于位置移动的结构公设来概括这些性质。比如:P1若(A, ( B,◇C ))⊢D则(◇C, ( A, B ))⊢DP2若(◇C, ( A, B ))⊢D则(A, (◇C, B))⊢DP1后件的前提是(1a)的结构抽象,P1前件的前提是对(1b)的抽象。回到具体,“言情片”变成了“◇言情片”。这里,一元模态算子究竟起什么作用?在汉语那里,从(1a)到(1b),再到(1c),我们看到宾语“言情片”位置的移动。移动的后果是给它指派的范畴np无法跟毗邻的范畴进行运算,相当于用一元模态算子“ð¯”锁住了np,使之无所作为。所以在汉语的范畴语法词库中可以定义:
言情片⊢ð¯np刘强⊢np爱看⊢(np\s)/np¼¼在正常语序句(1a)这里,“言情片”对应的范畴是可以同动词对应的函子范畴进行运算的。必须用规则“如果A⊢ð¯B则◇A⊢B”把锁打开而获得“◇言情片⊢np”,这样范畴推演才得以展开。开锁的钥匙是约束“言情片”的一元模态算子“◇”,这个钥匙承载了结构性质P1和P2的信息,表明其管辖的表达式“言情片”满足P1和P2所显示的位置移动,表明这些移动使我们照样能够获得移动前所得到的范畴推演结果。换言之,这一系列操作意味:“言情片”作为表现汉语灵活语序的特殊表达式,先给它指派上锁的范畴“ð¯np”,使之无法运算;在正常语序句情况下,作为宾语的“言情片”对应的范畴则可以进行运算,是可以解禁的,开锁模态算子“◇”约束“言情片”意味对“言情片”的范畴“ð¯np”进行解禁而获得“np”。同时意味“◇”约束的表达式可以满足P1和P2揭示的结构性质,表明汉语的焦点句、话题句和正常句一样具有相同的范畴推演结果,最终具有相同的基本语义,这就是我们对汉语灵活语序内在机制的说明。
本文处理汉语灵活语序的多模态范畴逻辑的自然演绎表述有下列规则:
[Ax]A⊢A
[/I]( G, B)⊢A[/E]G⊢A/BD⊢B
G⊢A/B(G, D)⊢A
[\I]( B, G)⊢A[\E] G⊢BD⊢B\A
G⊢B\A(G, D)⊢A
[·I]G⊢AD⊢B[·E]D⊢A · BG[(A, B)]⊢C
(G, D)⊢A · BG[D]⊢C
[ð¯E]G⊢ð¯A[ð¯I]áGñ⊢A
áGñ⊢AG⊢ð¯A
[◇I]G⊢A[◇E]D⊢◇AG[áAñ]⊢B
áGñ⊢◇AG[áDñ]⊢B这里结构规则可以针对范畴推演的来源,即自然语言位置移动的情况:
[P1]G[(△1,(△2,á△3ñ))]⊢A[P2]G[(á△3ñ,(△1,△2))]⊢AG[(á△3ñ,(△1,△2))]⊢AG[(△1,(á△3ñ,△2))]⊢A我们以(1a) — (1c)的范畴推演分析为例演示如下:
刘强爱看言情片np(np\s)/npð¯np[ð¯E]á言情片ñ⊢np&,nbsp;[/E](爱看,á言情片ñ)⊢np\s[\E](刘强,(爱看,á言情片ñ))⊢s(1a)的范畴分析[P1](á言情片ñ,(刘强,爱看))⊢s(1b)的范畴分析[P2](刘强,(á言情片ñ,爱看))⊢s(1c)的范畴分析
通过我们确立的范畴推演机制,我们从(1a)、(1b)和(1c)分别推出范畴s,表明它们都是合语法的句子。如果把这个机制延伸到类型-逻辑语义学的范围,给这里的s配上l-词项,就能见出三个句子具有相同的逻辑语义表现。为了便于讨论上述多模态范畴逻辑的元逻辑问题,我们需要从自然演绎方式回到相应的公理表述上来,令CL为这样的多模态范畴系统。
CL的合式公式定义为:
F∷=A½F/F½F·F½F\F½◇F½ð¯F
CL的公理和推演规则为:A ® A(同一公理)
A ® B, B ® C⊢A ® C(传递规则)
A · B ® C⊢⊣A ® C/B(冗余规则1和2)
A · B ® C⊢⊣B ® A\C(冗余规则3和4)
A ® ð¯B⊢◇A ® B(开锁规则)
◇A ® B⊢A ® ð¯B(上锁规则) CL的结构公设为:
P1◇C·( A·B ) ® A·( B·◇C )P2A·(◇C·B) < ,span style="mso-char-type: symbol; mso-symb,ol-font-family: Sy,mbol">®,,◇C·( A·B )CL的框架语义模型为:áW, R3, R2, vñ。有关W, R2, R3和v按照通常的理解,参见上文的说明,这里从略。
CL框架语义具有对应P1和对应P2的框架性质,分别为:
(*)$uv[R2uz & R3vxy & R3wuv] Þ $st[R2sz&R3tys& R3wxt]
(**)$st[R2sz&R3tys&R3wxt] Þ $uv[R2uz & R3vxy & R3wuv]
元逻辑讨论的主要内容是系统的模型可靠性和完全性:定理3.1:CL⊢A ® B当且仅当对每个满足(*)和(**)的CL框架áW, R3, R2ñ的每个赋值v而言,v(A) Í v(B)。从左到右的可靠性证明需要施归纳于A®B推演的长度:长度为1时证明公理公设的有效性,假定长度为n时断言成立,要证长度为n + 1时断言成立,即证明推理规则保持有效性(参见Došen, 1992)。从右到左的完全性证明需要使用通常的典范模型方法。典范模型MK定义为:定义3.2MK= áWK, R3K, R2K vKñ
(a)WK是F中公式的集合
(b)R3K(ABC)当且仅当CL⊢A ® B · C
(c)R2K(AB)当且仅当CL⊢A ®◇B
(d)A∈vK(p)即MK, A⊨p当且仅当CL⊢A ® p
由于CL的框架语义具有性质(*)和(**),要表明定义3.2给出的MK是一个CL框架上的模型,就必须证明:引理3.3MK满足(*)和(**)。证明:设(*)的前提$uv[[R2uz & R3vxy & R3wuv]成立;枚举:R2DC:据定义3.2(c)得:⊢D ®◇C据I公理和单调规则:⊢D · (A · B) ®◇C · (A · B)(1)R3EAB:据定义3.2(b)得:⊢E ® A · B据I公理和单调规则:⊢D · E ® D · (A · B)(2)R3GDE:据定义3.2(b)得:⊢G ® D · E(3)据(3)(2)(1)用传递规则得:⊢G ®◇C · (A · B)(4)由于P1:⊢◇C · ( A · B ) ® A · ( B ·◇C )(5) (4)(5)传递得:⊢G ® A · ( B ·◇C )据定义3.2(b)得:R3GA(B ·◇C))(6)&,nbsp;另一方面,假设(*)的结论不成立,即得:"st[R2sz&R3tys ® ~R3wxt]]枚举:R2◇CC & R3(B ·◇C)(B ·◇C) ® ~R3GA(B·◇C)(7)据I公理:◇C ®◇C和定义3.2(c)得:R2◇CC(8)据I公理:(B·◇C) ®(B·◇C)和定义3.2(b)得:R3(B·◇C)(B·◇C)(9)据(8)和(9)与(7)分离得:~R3GA(B·◇C)与(6)矛盾,于是(*)结论成立,故MK满足(*)。MK满足(**)的证明是类似的。
关于MK的所谓真值引理为:
引理3.4对任CL-公式j而言,MK, A⊨j当且仅当CL⊢A ® j。
证明过程参见Došen教授1992年的论文。
最后的完全性证明:如果CL⊬A ® B,据引理3.3和3.4,则存在CL-框架的模型MK满足:MK,A⊭B,则有A∉vK(B);由CL⊢A ® A据定义3.2(d)有:A∈vK(A),因此vK(A)⊈vK(B)。
【参考文献】
[1] Došen,K.(1992) : A brief survey of frames for the Lambek calculus, Z.Math.Logik Grundlag.Math.38.[2] Moortgat, M.(1988) : Categorial Investgations. Foris Publication. [3] Moortgat, M.(1997) : Categorical type logic. In Handbook of Logic and Language, J. van Benthem and A. ter Meulen, eds. The MIT Press,Cambridge, MA., pp93 — 177.[4] Moortgat, M.(2002): Categorial Grammar and Formal Semantics. Article #231, Encyclopedia of Cognitive Science, Nature Publishing Group, Macmillan Publisher Ltd.[5] Moot, R.(2001) :Proof Nets for Linguistic Analysis, PhD thesis,UtrechtUniversity.[6]蒋严潘海华(1998) :《形式语义学引论》,中国社会科学出版社,北京。[7]吴平(2005) :《逻辑语义分析》,待出。
(原载《哲学研究》,2006年第9期。录入编辑:神秘岛),ype: symbol; mso-symbol-font-family: Symbol; mso-hansi-: 'Times New Roman'; mso-ascii-: 'Times New Roma,n'">® CA·B ® C
A ® C/BB ® A\CA ® C/BB ® A\CA·B ® CA·B ® C(3)仅仅跟毗连算子有关——结构公设:(ass)A·(B·C) « (A·B)·C(comm)A·B « B·A基于(1)和(2)对(3)的两条公设进行取舍,就形成了多模态范畴逻辑公理表述的4个基本系统:NL = (1) + (2);L = (1) + (2) + (ass);NLP = (1) + (2) + (com);LP = (1) + (2) + (3)。NL又叫做非结合的Lambek演算;L叫做结合的Lambek演算;NLP称作非结合的交换Lambek演算;LP称之为结合交换的Lambek演算。其次,多模态范畴逻辑还采取便于解决判定问题的Gentzen后承表述(Moortgat, 1997, pp105—106, p136)。从证明论角度看,多模态范畴逻辑的公理表述存在不足,即无法给定理证明提供能行的判定程序。问题出在传递规则的使用上,从A ® B和B ® C推出A ® C意味:凭借B的帮助获得A ® C,但从中却看不到B的踪迹。因为存在无穷多个可能的B,对此不可能进行穷尽搜索。概言之,传递规则的使用使得在多模态范畴逻辑中不可能进行定理证明的搜索判定。而Gentzen后承表述与其公理表述是等价的,推出的定理集是相等的。在Gentzen表述中,与传递规则对应的Cut规则是可消去的,因此多模态范畴逻辑的Gentzen表述能够解决定理证明的有穷搜索问题,即所谓判定问题。此外,多模态范畴逻辑还具有与Gentzen后承表述等价的自然演绎系统。在莫特盖特看来,某种意义讲自然演绎比Gentzen后承表述更能体现证明和推演的精神(Moortgat, 1997, p110),其推演能力最终与公理表述等价。公理表述虽适于元逻辑性质的讨论,如完全性的证明,但自然演绎却使人能够更清楚直观地感受从自然语言词条来源到范畴推演的过程,有利于对自然语言语句进行范畴分析的演示。从模态逻辑的视角看,展示范畴推演规律的函子范畴和范畴的毗连都是模态公式,范畴毗连的结构性质甚至还通过一元模态算子表现出来。在多模态范畴逻辑系统中,“/”、“\”和“·”等联结词均被看作是二元模态算子,同时可引进一元模态算子“◇”和“¯”用以刻画语言的结构性质,有关的推演规则为:◇A ® BA ®¯BA ®¯B◇A ® B既然系统中的公式涉及模态算子,系统的语义理论自然就跟可能世界关系语义学分不开。系统的框架语义学表现为:三元和二元的混合框架áW, R3, R2ñ。这里W被当作是自然语言来源(符号、句法和语义的信息)的集合。R3表示语言毗连生成的情况,“R3xyz”的直观涵义为:x是y和z的毗连。R2与语言的结构性质有关,“R2xy”的涵义为:x是y的满足某结构性质的变种。框架语义基础上的赋值函项v定义为:对原子公式p而言:v(p) Í Wv(A·B) = {x | $y$z[R3xyz & y∈v(A) & z∈v(B)]}v(A/B) = {y | "x"z[R3xyz & z∈v(B) Þ x∈v(A)]}v(A\B) = {z | "x"y[R3xyz & y∈v(A) Þ x∈v(B)]}v(◇A) = {x | $y (Rxy & y Îv(A))}v(¯A) = { x | "y (Ryx ® y Îv(A))}在多模态范畴逻辑的框架语义学那里,结构公设总要对框架中的R3或R2产生影响。按照对应论(correspondence theory)的要求,对每一结构公设而言,必须给R3或R2定义某个性质(类似模态逻辑中R的自返或传递性质),即对R3或R2进行某种限制。如对应(ass)和(comm),有关R3的限制分别为:
$t.Rtxy & Rutz Û ,$v.Rvyz & RuxvRxyz Û Rxzy
基于上述框架语义及其赋值,我们可以定义典范模型,证明所谓真值引理,最后获得多模态范畴逻辑系统的可靠性和完全性证明(Došen, 1992, Moortgat, 1997)。
应该指出,多模态范畴逻辑中除了具有涉及单纯毗连算子的结构公设,还可能有涉及混合毗连算子以及通过一元模态算子显示出的结构公设。这样就使得多模态范畴逻辑由于结构公设的不同而产生了多种多样的系统。
三、多模态范畴逻辑的汉语研究汉语句子具有比较灵活的语序,其主语、宾语和谓语动词可以出现在不同的位置上,而不影响基本的语义。从范畴语法角度看,需要建立针对汉语灵活语序的范畴推演机制。为此,本文提出关于范畴分析的自然语言来源的位置移动的结构公设,形成特定的范畴逻辑系统,即一种多模态系统(multimodal system),并给该系统框架语义解释的可通达关系确立相应的限制条件,然后进行系统的元逻辑讨论——可靠性和完全性的证明。
语言学研究早就注意到汉语句子语序的灵活性。在汉语不少句子那里,主语、宾语和谓语可以出现在不同的位置上(吴平2005年第53页,蒋严、潘海华1998年第200页),如:正常句:(1a)刘强爱看言情片(2a)张三买了á西游记ñ话题句:(1b)言情片刘强爱看(2b)á西游记ñ张三买了焦点句:(1c)刘强言情片爱看(2c)张三á西游记ñ买了以上两组句子在重音或焦点的处理上有所不同,但有一点是共同的,即这些句子在汉语那里都是说得通的,并且具有相同的基本语义。人们感到困惑的是:“根据类型论的规定,每个词项都被赋予相应的句法范畴和语义类型。动词的句法范畴规定了相关的名词论元出现的左右位置。这样,作为大前提的动词就会朝某个方向去搜寻论元并与之合并。然而,有些论元由于种种原因,有时并不出现在规定的方位,却出现在相反的方向。这样,动词就寻觅不到所需的论元。而另一方面,正因为动词无法与相关论元合并,整个句子便出现了一个额外的、不能用的论元。组合机制因此陷于停顿,句子便无以生成。”(蒋严、潘海华1998年第199页)。逻辑研究者应该说明这些不同语序的汉语句之所以能够成立的原因。其深层的内在原因是它们具有大致相同的语义,并且从不同的句法形式能够推出相同的语义。本文试图从多模态范畴逻辑的角度给出这样的说明。在范畴语法看来,句法上合语法的句子能够通过范畴推演获得句子范畴s。比如:在给(1a)中各词条指派一定范畴的前提下根据范畴推演定理就能够获得范畴s。采用自然演绎推演如下:刘强爱看言情片np(np\s)/npnp据有关规则(爱看,言情片)⊢(np\s)据有关规则(刘强,(爱看,言情片))⊢s这表明(1a)是合语法的语句。但同样的范畴指派,显然不能分别从(1b)和(1c)那样的排列语序推得范畴s,从而无法判定它们是合语法的句子。如(1d)的情况为:
言情片刘强爱看npnp(np\s)/np?(刘强,爱看)⊢??(言情片,(刘强,爱看))⊢?然而,汉语的灵活语序机制则允许(1b)和(1c)具有与(1a)相同的基本语义,在这里要求都能够推出s。多模态范畴逻辑要反映这种机制,在给有关词条指派固定范畴的前提下,必须揭示汉语特有的关于毗连的结构性质。这种结构性质使得(1a)—(1c)能够推出相同的语义,即(1b)—(1c)的范畴推演都获得s,从而表明它们都是合语法的句子。汉语的灵活语序表现为语词符号的位置移动,在多模态范畴逻辑看来,这是一种结构性质。基于此,我们确立关于位置移动的结构公设来概括这些性质。比如:P1若(A, ( B,◇C ))⊢D则(◇C, ( A, B ))⊢DP2若(◇C, ( A, B ))⊢D则(A, (◇C, B))⊢DP1后件的前提是(1a)的结构抽象,P1前件的前提是对(1b)的抽象。回到具体,“言情片”变成了“◇言情片”。这里,一元模态算子究竟起什么作用?在汉语那里,从(1a)到(1b),再到(1c),我们看到宾语“言情片”位置的移动。移动的后果是给它指派的范畴np无法跟毗邻的范畴进行运算,相当于用一元模态算子“ð¯”锁住了np,使之无所作为。所以在汉语的范畴语法词库中可以定义:
言情片⊢ð¯np刘强⊢np爱看⊢(np\s)/np¼¼在正常语序句(1a)这里,“言情片”对应的范畴是可以同动词对应的函子范畴进行运算的。必须用规则“如果A⊢ð¯B则◇A⊢B”把锁打开而获得“◇言情片⊢np”,这样范畴推演才得以展开。开锁的钥匙是约束“言情片”的一元模态算子“◇”,这个钥匙承载了结构性质P1和P2的信息,表明其管辖的表达式“言情片”满足P1和P2所显示的位置移动,表明这些移动使我们照样能够获得移动前所得到的范畴推演结果。换言之,这一系列操作意味:“言情片”作为表现汉语灵活语序的特殊表达式,先给它指派上锁的范畴“ð¯np”,使之无法运算;在正常语序句情况下,作为宾语的“言情片”对应的范畴则可以进行运算,是可以解禁的,开锁模态算子“◇”约束“言情片”意味对“言情片”的范畴“ð¯np”进行解禁而获得“np”。同时意味“◇”约束的表达式可以满足P1和P2揭示的结构性质,表明汉语的焦点句、话题句和正常句一样具有相同的范畴推演结果,最终具有相同的基本语义,这就是我们对汉语灵活语序内在机制的说明。
本文处理汉语灵活语序的多模态范畴逻辑的自然演绎表述有下列规则:
[Ax]A⊢A
[/I]( G, B)⊢A[/E]G⊢A/BD⊢B
G⊢A/B(G, D)⊢A
[\I]( B, G)⊢A[\E] G⊢BD⊢B\A
G⊢B\A(G, D)⊢A
[·I]G⊢AD⊢B[·E]D⊢A · BG[(A, B)]⊢C
(G, D)⊢A · BG[D]⊢C
[ð¯E]G⊢ð¯A[ð¯I]áGñ⊢A
, áGñ⊢AG⊢ð¯A
[◇I]G⊢A[◇E]D⊢◇AG[áAñ]⊢B
áGñ⊢◇AG[áDñ]⊢B这里结构规则可以针对范畴推演的来源,即自然语言位置移动的情况:
[P1]G[(△1,(△2,á△3ñ))]⊢A[P2]G[(á△3ñ,(△1,△2))]⊢AG[(á△3ñ,(△1,△2))]⊢AG[(△1,(á△3ñ,△2))]⊢A我们以(1a) — (1c)的范畴推演分析为例演示如下:
刘强爱看言情片np(np\s)/npð¯np[ð¯E]á言情片ñ⊢np[/E](爱看,á言情片ñ)⊢np\s[\E](刘强,(爱看,á言情片ñ))⊢s(1a)的范畴分析[P1](á言情片ñ,(刘强,爱看))⊢s(1b)的范畴分析[P2](刘强,(á言情片ñ,爱看))⊢s(1c)的范畴分析
通过我们确立的范畴推演机制,我们从(1a)、(1b)和(1c)分别推出范畴s,表明它们都是合语法的句子。如果把这个机制延伸到类型-逻辑语义学的范围,给这里的s配上l-词项,就能见出三个句子具有相同的逻辑语义表现。为了便于讨论上述多模态范畴逻辑的元逻辑问题,我们需要从自然演绎方式回到相应的公理表述上来,令CL为这样的多模态范畴系统。
CL的合式公式定义为:
F∷=A½F/F½F·F½F\F½◇F½ð¯F
CL的公理和推演规则为:A ® A(同一公理)
A ® B, B ® C⊢A ® C(传递规则)
A · B ® C⊢⊣A ® C/B(冗余规则1和2)
A · B ® C⊢⊣B ® A\C(冗余规则3和4)
A ® ð¯B⊢◇A ® B(开锁规则)
◇A ® B⊢A ® ð¯B(上锁规则) CL的结构公设为:
P1◇C·( A·B ) ® A·( B·◇C )P2A·(◇C·B) ®◇C·( A·B )CL的框架语义模型为:áW, R3, R2, vñ。有关W, R2, R3和v按照通常的理解,参见上文的说明,这里从略。
CL框架语义具有对应P1和对应P2的框架性质,分别为:
(*)$uv[R2uz & R3vxy & R3wuv] Þ $st[R2sz&R3tys& R3wxt]
(**)$st[R2sz&R3tys&R3wxt] Þ $uv[R2uz & R3vxy & R3wuv]
元逻辑讨论的主要内容是系统的模型可靠性和完全性:定理3.1:CL⊢A ® B当且仅当对每个满足(*)和(**)的CL框架áW, R3, R2ñ的每个赋值v而言,v(A) Í v(B)。从左到右的可靠性证明需要施归纳于A®B推演的长度:长度为1时证明公理公设的有效性,假定长度为n时断言成立,要证长度为n + 1时断言成立,即证明推理规则保持有效性(参见Došen, 1992)。从右到左的完全性证明需要使用通常的典范模型方法。典范模型MK定义为:定义3.2MK= á,WK, R3K, R2K vKñ
(a)WK是F中公式的集合
(b)R3K(ABC)当且仅当CL⊢A ® B · C
(c)R2K(AB)当且仅当CL⊢A ®◇B
(d)A∈vK(p)即MK, A⊨p当且仅当CL⊢A ® p
由于CL的框架语义具有性质(*)和(**),要表明定义3.2给出的MK是一个CL框架上的模型,就必须证明:引理3.3MK满足(*)和(**)。证明:设(*)的前提$uv[[R2uz & R3vxy & R3wuv]成立;枚举:R2DC:据定义3.2(c)得:⊢D ®◇C据I公理和单调规则:⊢D · (A · B) ®◇C · (A · B)(1)R3EAB:据定义3.2(b)得:⊢E ® A · B据I公理和单调规则:⊢D · E ® D · (A · B)(2)R3GDE:据定义3.2(b)得:⊢G ® D · E(3)据(3)(2)(1)用传递规则得:⊢G ®◇C · (A · B)(4)由于P1:⊢◇C · ( A · B ) ® A · ( B ·◇C )(5) (4)(5)传递得:⊢G ® A · ( B ·◇C )据定义3.2(b)得:R3GA(B ·◇C))(6)另一方面,假设(*)的结论不成立,即得:"st[R2sz&R3tys ® ~R3wxt]]枚举:R2◇CC & R3(B ·◇C)(B ·◇C) ® ~R3GA(B ·◇C)(7)据I公理:◇C ®◇C和定义3.2(c)得:R2◇CC(8)据I公理:(B·◇C) ®(B·◇C)和定义3.2(b)得:R3(B·◇C)(B·◇C)(9)据(8)和(9)与(7)分离得:~R3GA(B·◇C)与(6)矛盾,于是(*)结论成立,故MK满足(*)。MK满足(**)的证明是类似的。
关于MK的所谓真值引理为:
引理3.4对任CL-公式j而言,MK, A⊨j当且仅当CL⊢A ® j。
证明过程参见Došen教授1992年的论文。
最后的完全性证明:如果CL⊬A ® B,据引理3.3和3.4,则存在CL-框架的模型MK满足:MK,A⊭B,则有A∉vK(B);由CL⊢A ® A据定义3.2(d)有:A∈vK(A),因此vK(A)⊈vK(B)。
参考文献
[1] Došen,K.(1992) : A brief survey of frames for the Lambek calculus, Z.Math.Logik Grundlag.Math.38.[2] Moortgat, M.(1988) : Categorial Investgations. Foris Publication. [3] Moortgat, M.(1997) : Categorical type logic. In Handbook of Logic and Language, J. van Benthem and A. ter Meulen, eds. The MIT Press,Cambridge, MA., pp93 — 177.[4] Moortgat, M.(2002): Categorial Grammar and Formal Semantics. Article #231, Encyclopedia of Cognitive Science, Nature Publishing Group, Macmillan Publisher Ltd.[5] Moot, R.(2001) :Proof Nets for Linguistic Analysis, PhD thesis,UtrechtUniversity.[6]蒋严潘海华(1998) :《形式语义学引论》,中国社会科学出版社,北京。[7]吴平(2005) :《逻辑语义分析》,待出。
(原载《哲学研究》,2006年第9期。录入编辑:神秘岛), style="LETTER-SPACING: 0.2pt; mso-bidi-font-size: 10.5pt"> B ® C
A ® C/BB ® A\CA ® C/BB ® A\CA·B ® CA·B ® C(3)仅仅跟毗连算子有关——结构公设:(ass)A·(B·C) « (A·B)·C(comm)A·B « B·A基于(1)和(2)对(3)的两条公设进行取舍,就形成了多模态范畴逻辑公理表述的4个基本系统:NL = (1) + (2);L = (1) + (2) + (ass);NLP = (1) + (2) + (com);LP = (1) + (2) + (3)。NL又叫做非结合的Lambek演算;L叫做结合的Lambek演算;NLP称作非结合的交换Lambek演算;LP称之为结合交换的Lambek演算。其次,多模态范畴逻辑还采取便于解决判定问题的Gentzen后承表述(Moortgat, 1997, pp105—106, p136)。从证明论角度看,多模态范畴逻辑的公理表述存在不足,即无法给定理证明提供能行的判定程序。问题出在传递规则的使用上,从A ® B和B ® C推出A ® C意味:凭借B的帮助获得A ® C,但从中却看不到B的踪迹。因为存在无穷多个可能的B,对此不可能进行穷尽搜索。概言之,传递规则的使用使得在多模态范畴逻辑中不可能进行定理证明的搜索判定。而Gentzen后承表述与其公理表述是等价的,推出的定理集是相等的。在Gentzen表述中,与传递规则对应的Cut规则是可消去的,因此多模态范畴逻辑的Gentzen表述能够解决定理证明的有穷搜索问题,即所谓判定问题。此外,多模态范畴逻辑还具有与Gentzen后承表述等价的自然演绎系统。在莫特盖特看来,某种意义讲自然演绎比Gentzen后承表述更能体现证明和推演的精神(Moortgat, 1997, p110),其推演能力最终与公理表述等价。公理表述虽适于元逻辑性质的讨论,如完全性的证明,但自然演绎却使人能够更清楚直观地感受从自然语言词条来源到范畴推演的过程,有利于对自然语言语句进行范畴分析的演示。从模态逻辑的视角看,展示范畴推演规律的函子范畴和范畴的毗连都是模态公式,范畴毗连的结构性质甚至还通过一元模态算子表现出来。在多模态范畴逻辑系统中,“/”、“\”和“·”等联结词均被看作是二元模态算子,同时可引进一元模态算子“◇”和“¯”用以刻画语言的结构性质,有关的推演规则为:◇A ® BA ®¯BA ®¯B◇A ® B既然系统中的公式涉及模态算子,系统的语义理论自然就跟可能世界关系语义学分不开。系统的框架语义学表现为:三元和二元的混合框架áW, R3, R2ñ。这里W被当作是自然语言来源(符号、句法和语义的信息)的集合。R3表示语言毗连生成的情况,“R3xyz”的直观涵义为:x是y和z的毗连。R2与语言的结构性质有关,“R2xy”的涵义为:x是y的满足某结构性质的变种。框架语义基础上的赋值函项v定义为:对原子公式p而言:v(p) Í Wv(A·B) = {x | $y$z[R3xyz & y∈v(A) & z∈v(B)]}v(A/B) = {y | "x"z[R3xyz & z∈v(B) Þ x∈v(A)]}v(A\B) = {z | "x"y[R3xyz & y∈v(A) Þ x∈v(B)]}v(◇A) = {x | $y (Rxy & y Îv(A))}v(¯A) = { x | "y (Ryx ® y Îv(A))}在多模态范畴逻辑的框架语义学那里,结构公设总要对框架中的R3或R2产生影响。按照对应论(correspondence theory)的要求,对每一结构公设而言,必须给R3或R2定义某个性质(类似模态逻辑中R的自返或传递性质),即对R3或R2进行某种限制。如对应(ass)和(comm),有关R3的限制分别为:
$t.Rtxy & Rutz Û $v.Rvyz & RuxvRxyz Û Rxzy
基于上述框架语义及其赋值,我们可以定义典范模型,证明所谓真值引理,最后获得多模态范畴逻辑系统的可靠性和完全性证明(Došen, 1992, Moortgat, 1997)。
应该指出,多模态范畴逻辑中除了具有涉及单纯毗连算子的结构公设,还可能有涉及混合毗连算子以及通过一元模态算子显示出的结构公设。这样就使得多模态范畴逻辑由于结构公设的不同而产生了多种多样的系统。
三、多模态范畴逻辑的汉语研究汉语句子具有比较灵活的语序,其主语、宾语和谓语动词可以出现在不同的位置上,而不影响基本的语义。从范畴语法角度看,需要建立针对汉语灵活语序的范畴推演机制。为此,本文提出关于范畴分析的自然语言来源的位置移动的结构公设,形成特定的范畴逻辑系统,即一种多模态系统(multimodal system),并给该系统框架语义解释的可通达关系确立相应的限制条件,然后进行系统的元逻辑讨论——可靠性和完全性的证明。
语言学研究早就注意到汉语句子语序的灵活性。在汉语不少句子那里,主语、宾语和谓语可以出现在不同的位置上(吴平2005年第53页,蒋严、潘海华1998年第200页),如:正常句:(1a)刘强爱看言情片(2a)张三买了á西游记ñ话题句:(1b)言情片刘强爱看(2b)á西游记ñ张三买了焦点句:(1c)刘强言情片爱看(2c)张三á西游记ñ买了以上两组句子在重音或焦点的处理上有所不同,但有一点是共同的,即这些句子在汉语那里都是说得通的,并且具有相同的基本语义。人们感到困惑的是:“根据类型论的规定,每个词项都被赋予相应的句法范畴和语义类型。动词的句法范畴规定了相关的名词论元出现的左右位置。这样,作为大前提的动词就会朝某个方向去搜寻论元并与之合并。然而,有些论元由于种种原因,有时并不出现在规定的方位,却出现在相反的方向。这样,动词就寻觅不到所需的论元。而另一方面,正因为动词无法与相关论元合并,整个句子便出现了一个额外的、不能用的论元。组合机制因此陷于停顿,句子便无以生成。”(蒋严、潘海华1998年第199页)。逻辑研究者应该说明这些不同语序的汉语句之所以能够成立的原因。其深层的内在原因是它们具有大致相同的语义,并且从不同的句法形式能够推出相同的语义。本文试图从多模态范畴逻辑的角度给出这样的说明。在范畴语法看来,句法上合语法的句子能够通过范畴推演获得句子范畴s。比如:在给(1a)中各词条指派一定范畴的前提下根据范畴推演定理就能够获得范畴s。采用自然演绎推演如下:刘强爱看言情片np(np\s)/npnp据有关规则(爱看,言情片)⊢(np\s)据有关规则(刘强,(爱看,言情片))⊢s这表明(1a)是合语法的语句。但同样的范畴指派,显然不能分别从(1b)和(1c)那样的排列语序推得范畴s,从而无法判定它们是合语法的句子。如(1d)的情况为:
言情片刘强爱看npnp(np\s)/np?(刘强,爱看)⊢??(言情片,(刘强,爱看))⊢?然而,汉语的灵活语序机制则允许(1b)和(1c)具有与(1a)相同的基本语义,在这里要求都能够推出s。多模态范畴逻辑要反映这种机制,在给有关词条指派固定范畴的前提下,必须揭示汉语特有的关于毗连的结构性质。这种结构性质使得(1a)—(1c)能够推出相同的语义,即(1b)—(1c)的范畴推演都获得s,从而表明它们都是合语法的句子。汉语的灵活语序表现为语词符号的位置移动,在多模态范畴逻辑看来,这是一种结构性质。基于此,我们确立关于位置移动的结构公设来概括这些性质。比如:P1若(A, ( B,◇C ))⊢D则(◇C, ( A, B ))⊢DP2若(◇C, ( A, B ))⊢D则(A, (◇C, B))⊢DP1后件的前提是(1a)的结构抽象,P1前件的前提是对(1b)的抽象。回到具体,“言情片”变成了“◇言情片”。这里,一元模态算子究竟起什么作用?在汉语那里,从(1a)到(1b),再到(1c),我们看到宾语“言情片”位置的移动。移动的后果是给它指派的范畴np无法跟毗邻的范畴进行运算,相当于用一元模态算子“ð¯”锁住了np,使之无所作为。所以在汉语的范畴语法词库中可以定义:
言情片⊢ð¯np刘强⊢np爱看⊢(np\s)/np¼¼在正常语序句(1a)这里,“言情片”对应的范畴是可以同动词对应的函子范畴进行运算的。必须用规则“如果A⊢ð¯B则◇A⊢B”把锁打开而获得“◇言情片⊢np”,这样范畴推演才得以展开。开锁的钥匙是约束“言情片”的一元模态算子“◇”,这个钥匙承载了结构性质P1和P2的信息,表明其管辖的表达式“言情片”满足P1和P2所显示的位置移动,表明这些移动使我们照样能够获得移动前所得到的范畴推演结果。换言之,这一系列操作意味:“言情片”作为表现汉语灵活语序的特殊表达式,先给它指派上锁的范畴“ð¯np”,使之无法运算;在正常语序句情况下,作为宾语的“言情片”对应的范畴则可以进行运算,是可以解禁的,开锁模态算子“◇”约束“言情片”意味对“言情片”的范畴“ð¯np”进行解禁而获得“np”。同时意味“◇”约束的表达式可以满足P1和P2揭示的结构性质,表明汉语的焦点句、话题句和正常句一样具有相同的范畴推演结果,最终具有相同的基本语义,这就是我们对汉语灵活语序内在机制的说明。
本文处理汉语灵活语序的多模态范畴逻辑的自然演绎表述有下列规则:
[Ax]A⊢A
[/I]( G, B)⊢A[/E]G⊢A/BD⊢B
G⊢A/B(G, D)⊢A
[\I]( B, G< ,span lang="EN-US">)⊢A[\E] G⊢BD⊢B\A
G⊢B\A(G, D)⊢A
[·I]G⊢AD⊢B[·E]D⊢A · BG[(A, B)]⊢C
(G, D)⊢A · BG[D]⊢C
[ð¯E]G⊢ð¯A[ð¯I]áGñ⊢A
áGñ⊢AG⊢ð¯A
[◇I]G⊢A[◇E]D⊢◇AG[áAñ]⊢B
áGñ⊢◇AG[áDñ]⊢B这里结构规则可以针对范畴推演的来源,即自然语言位置移动的情况:
[P1]G[(△1,(△2,á△3ñ))]⊢A[P2]G[(á△3ñ,(△1,△2))]⊢AG[(á△3ñ,(△1,△2))]⊢AG[(△1,(á△3ñ,△2))]⊢A我们以(1a) — (1c)的范畴推演分析为例演示如下:
刘强爱看言情片np(np\s)/npð¯np[ð¯E]á言情片ñ⊢np&,nbsp;[/E](爱看,á言情片ñ)⊢np\s[\E](刘强,(爱看,á言情片ñ))⊢s(1a)的范畴分析&nb,sp;&n,bsp;,&nbs,p;[P1](á言情片ñ,(刘强,爱看))⊢s(1b)的范畴分析[P2](刘强,(á言情片ñ,爱看))⊢s(1c)的范畴分析
通过我们确立的范畴推演机制,我们从(1a)、(1b)和(1c)分别推出范畴s,表明它们都是合语法的句子。如果把这个机制延伸到类型-逻辑语义学的范围,给这里的s配上l-词项,就能见出三个句子具有相同的逻辑语义表现。为了便于讨论上述多模态范畴逻辑的元逻辑问题,我们需要从自然演绎方式回到相应的公理表述上来,令CL为这样的多模态范畴系统。
CL的合式公式定义为:
F∷=A½F/F½F·F½F\F½◇F½ð¯F
CL的公理和推演规则为:A ® A(同一公理)
A ® B, B ® C⊢A ® C(传递规则)
A · B ® C⊢⊣A ® C/B(冗余规则1和2)
A · B ® C⊢⊣B ® A\C(冗余规则3和4)
A ® ð¯B⊢◇A ® B(开锁规则)
◇A ® B⊢A ® ð¯B(上锁规则) CL的结构公设为:
P1◇C·( A·B ) ® A·( B·◇C )P2A·(◇C·B) < ,span style="mso-char-type: symbol; mso-symb,ol-font-family: Sy,mbol">®,◇C·( A·B )CL的框架语义模型为:áW, R3, R2, vñ。有关W, R2, R3和v按照通常的理解,参见上文的说明,这里从略。
CL框架语义具有对应P1和对应P2的框架性质,分别为:
(*)$uv[R2uz & R3vxy & R3wuv] Þ $st[R2sz&R3tys& R3wxt]
(**)$st[R2sz&R3tys&R3wxt] Þ $uv[R2uz & R3vxy & R3wuv]
元逻辑讨论的主要内容是系统的模型可靠性和完全性:定理3.1:CL⊢A ® B当且仅当对每个满足(*)和(**)的CL框架áW, R3, R2ñ的每个赋值v而言,v(A) Í v(B)。从左到右的可靠性证明需要施归纳于A®B推演的长度:长度为1时证明公理公设的有效性,假定长度为n时断言成立,要证长度为n + 1时断言成立,即证明推理规则保持有效性(参见Došen, 1992)。从右到左的完全性证明需要使用通常的典范模型方法。典范模型MK定义为:定义3.2MK= áWK, R3K, R2K vKñ
(a)WK是F中公式的集合
(b)R3K(ABC)当且仅当CL⊢A ® B · C
(c)R2K(AB)当且仅当CL⊢A ®◇B
(d)A∈vK(p)即MK, A⊨p当且仅当CL⊢A ® p
由于CL的框架语义具有性质(*)和(**),要表明定义3.2给出的MK是一个CL框架上的模型,就必须证明:引理3.3MK满足(*)和(**)。证明:设(*)的前提$uv[[R2uz & R3vxy & R3wuv]成立;枚举:R2DC:据定义3.2(c)得:⊢D ®◇C据I公理和单调规则:⊢D · (A · B) ®◇C · (A · B)(1)R3EAB:据定义3.2(b)得:⊢E ® A · B据I公理和单调规则:⊢D · E ® D · (A · B)(2)R3GDE:据定义3.2(b)得:⊢G ® D · E(3)据(3)(2)(1)用传递规则得:⊢G ®◇C · (A · B)(4)由于P1:⊢◇C · ( A · B ) ® A · ( B ·◇C )(5) (4)(5)传递得:⊢G ® A · ( B ·◇C )据定义3.2(b)得:R3GA(B ·◇C))(6)另一方面,假设(*)的结论不成立,即得:"st[R2sz&R3tys ® ~R3wxt]]枚举:R2◇CC & R3(B ·◇C)(B ·◇C) ® ~R3GA(B ·◇C)(7)据I公理:◇C ®◇C和定义3.2(c)得:R2◇CC(8)据I公理:(B·◇C) ®(B·◇C)和定义3.2(b)得:R3(B·◇C)(B·◇C)(9)据(8)和(9)与(7)分离得:~R3GA(B·◇C)与(6)矛盾,于是(*)结论成立,故MK满足(*)。MK满足(**)的证明是类似的。
关于MK的所谓真值引理为:
引理3.4对任CL-公式j而言,MK, A⊨j当且仅当CL⊢A ® j。
证明过程参见Došen教授1992年的论文。
最后的完全性证明:如果CL⊬A ® B,据引理3.3和3.4,则存在CL-框架的模型MK满足:MK,A⊭B,则有A∉vK(B);由CL⊢A ® A据定义3.2(d)有:A∈vK(A),因此vK(A)⊈vK(B)。
【参考文献】
[1] Došen,K.(1992) : A brief survey of frames for the Lambek calculus, Z.Math.Logik Grundlag.Math.38.[2] Moortgat, M.(1988) : Categorial Investgations. Foris Publication. [3] Moortgat, M.(1997) : Categorical type logic. In Handbook of Logic and Language, J. van Benthem and A. ter Meulen, eds. The MIT Press,Cambridge, MA., pp93 — 177.[4] Moortgat, M.(2002): Categorial Grammar and Formal Semantics. Article #231, Encyclopedia of Cognitive Science, Nature Publishing Group, Macmillan Publisher Ltd.[5] Moot, R.(2001) :Proof Nets for Linguistic Analysis, PhD thesis,UtrechtUniversity.[6]蒋严潘海华(1998) :《形式语义学引论》,中国社会科学出版社,北京。[7]吴平(2005) :《逻辑语义分析》,待出。
作者:邹崇理,中国社科院哲学研究所,原载《哲学研究》,2006年第9期。
附件:
上一篇:公共疼痛及孪生地球疼痛:对心灵哲学中渐逝型取消主义的一种阐述
下一篇:“错觉论证”与析取论