CN1904880A - 一种用于句子分析中动词歧义结构消解的语义分析方法 - Google Patents

一种用于句子分析中动词歧义结构消解的语义分析方法 Download PDF

Info

Publication number
CN1904880A
CN1904880A CN 200510088741 CN200510088741A CN1904880A CN 1904880 A CN1904880 A CN 1904880A CN 200510088741 CN200510088741 CN 200510088741 CN 200510088741 A CN200510088741 A CN 200510088741A CN 1904880 A CN1904880 A CN 1904880A
Authority
CN
China
Prior art keywords
sentence
semantic
verb
ambiguity
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510088741
Other languages
English (en)
Other versions
CN100349161C (zh
Inventor
晋耀红
苗传江
邬郑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CNB2005100887410A priority Critical patent/CN100349161C/zh
Publication of CN1904880A publication Critical patent/CN1904880A/zh
Application granted granted Critical
Publication of CN100349161C publication Critical patent/CN100349161C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了用于句子分析中动词歧义结构消解的语义分析方法,包括:语义模型的构建和语义分析方法,所述的语义模型用于表达动词的歧义结构,所述的语义分析方法根据语义模型实现歧义结构的判断、消解和计算。本发明的优点在于:建立一种表达动词歧义结构的统一的语义模型,把歧义结构上升到句子层面进行处理,把歧义结构的计算转换成句蜕类型的判断;把该语义模型形式化为句类演绎规则,使得歧义结构的计算、推理过程,有法可依、有章可循。

Description

一种用于句子分析中动词歧义结构消解的语义分析方法
技术领域
本发明涉及智能信息处理技术,特别涉及一种计算机理解自然语言的句子时,对包含动词的歧义结构的语义分析方法。
背景技术
歧义问题是语言中普遍存在的现象,特别是由于汉语的“一字多义、一义多用”,使得汉语中的歧义现象更是普遍。语言学家对歧义问题有比较多的研究,比较重要的论著有赵元任(1959)《汉语中的歧义现象》、朱德熙(1980)《汉语句法中的歧义现象》、吕叔湘(1984)《歧义类例》、黄国营(1985)《现代汉语歧义短语》、邵敬敏(1994)《歧义分化方法探讨》,等等,这些文献归纳了大量的歧义现象,而且探讨了这些歧义的分化方法。从计算机信息处理的角度,也有较多的研究,冯志伟(1995)《论歧义结构的潜在性》探讨了歧义格式实例化为歧义结构的可能、詹卫东(2000)《面向中文信息处理的现代汉语短语结构规则研究》对现代汉语短语结构的定界歧义和结构关系的判定歧义做了系统的考察。
歧义结构是指语言中存在的某种构成形式,它可以承载多种语言现象,形成多种内部关系,或者承载的一种语言现象同时具有多种内部关系,从而形成了歧义现象。动词歧义结构是指此结构中一定包含动词。
歧义结构一般可以分为两类:
1、结构型歧义。结构型歧义是指同一结构,在语言表达中,如果所承载的语言现象不同,所处的语言环境不同,其所表达的语义关系就不同。比如下面的三个例子中的划线部分,同是“v+FKQ+的+FKH”结构,其中v代表动词,FKQ表示语义结构中“的”之前的部分,FKH表示语义结构中“的”之后的部分。在三个例子中,动词v和FKQ、FKH之间的语义关系却各不相同。
        参与这个计划的俄罗斯企业也遇到了一些严重的问题。
        国家为 维持产品的低价格而压低生产资料的价格。
        大家对 制定这个计划的背景都很清楚。
2、内容型歧义。内容型歧义是指同一语言现象,其内容本身的语义关系存在歧义。语言学界常见的例子,如“鸡不吃了”、“咬死了猎人的狗”,就是内容型歧义的代表。
结构型歧义具有以下两个特点:
1)、结构型歧义是潜在的,当这个结构被具体语言现象实例化后,这种歧义就不复存在。对人理解来说,结构型歧义没有任何困难,但对计算机来说,则需要对同一结构,针对不同的条件,给出不同的检验操作,这样才能保证计算机面对结构型歧义时,不会无所适从。总结结构型歧义及其处理规则,是自然语言理解系统设计开发中最主要,也是最复杂的工作。
2)、结构型歧义一般只局限于结构内部。结构的边界划分、内部的语义关系确定是结构型歧义解决的关键。
与结构型歧义不同的是,内容型歧义,单就这个结构本身来说,对人和计算机都是有歧义的,这个歧义的解决,一般需要借助外部语言环境的帮助。
语言学家研究较多的是内容型歧义,而计算机处理语言时,在关注内容型歧义的同时,还要关注结构型歧义。歧义结构的分析,不仅要靠歧义结构内部的语义约束,而且要靠外部的语言环境(句子层面或篇章层面)。以往的歧义结构研究大都是在短语层面进行,而且基本上只在语法层面研究歧义结构内部的约束,缺乏系统,可计算性差,严重制约了计算机理解语言的发展,也直接影响着机器翻译、自动摘要等深层次的语言分析技术的发展。本发明给出了一种统一的计算模型和方法,能有效地进行歧义结构的判断、消解和计算。
发明内容
本发明的目的是克服现有的动词歧义结构消解方法可计算性差等缺点,提供一种用于句子分析中动词歧义结构消解的语义分析方法,实现对动词歧义结构的判断、消解和计算。
为了实现上述目的,本发明提供了一种用于句子分析中动词歧义结构消解的语义分析方法,包括:一用于表达动词的歧义结构的语义模型和根据语义模型进行动词歧义结构的判断、消解、计算的语义分析算法;包括以下具体步骤:
1)、选择一待处理的句子;
2)、假设句子中的某一个动词为全局的语义中心,根据全局语义中心对句子进行语义块切分,所述的全局语义中心是决定句子语义类型和句子内部语义关系的词语;
3)、根据句子的预期知识做初步检验,检查句子的格式是否正确,若正确,转至步骤5),否则,执行步骤4);
4)、检查句子中是否还有其他动词可假设为全局语义中心,若没有,结束操作,否则,跳转到步骤2);
5)、检查句子中是否还有其他动词可以假设为局部语义中心,所述的局部语义中心是指句子中的子句的语义中心,若没有,结束操作,否则,执行步骤6);
6)、根据上述语义块切分结果,确定局部语义中心中的动词的作用域,所述作用域为所在语义块的前后边界;
7)、利用句类演绎规则,在作用域内进行句蜕类型判断;
8)、根据步骤7)的判断结果,若只有一种句蜕类型,则句子无歧义,结束操作,否则,执行下一步;
9)、利用句子全局语义核心的预期知识对歧义结构的语义角色进行判断,去除不符合预期知识的句蜕类型;
10)、利用句子局部语义核心的预期知识,对句蜕类型的合理性进行判断,得到歧义结构的合理语义表示。
上述技术方案中,所述的语义模型是利用句类演绎规则,把动词歧义结构上升到句子层面,将动词歧义结构的计算转换成句蜕类型的判断,所述的句蜕类型包括原型句蜕、包装句蜕、要素句蜕,当一个动词结构可同时满足两种以上句蜕类型的句类演绎规则时,该动词结构存在歧义。
上述技术方案中,所述的句类演绎规则是对语义块内部的动词的语义角色和语义块内部的切分关系进行判断的规则,它的巴克斯范式是:
<句类演绎规则>∷=$<语义核心块所在的语义块内部的结构表示式KFJ>
                 <入口><Eg属性><E属性><K属性>
                 <检验条件>
               <判断结果类型>
<语义核心块所在语义块内部的句类表示式KMJ>$
其中,Eg表示全局语义核心块,E表示局部语义核心块,K表示语义块。
上述技术方案中,所述的步骤2)中,所述的语义块切分的切分规则与语法学中的语义块切分规则相同。
上述技术方案中,所述的步骤4)中,所述的预期知识是根据语法学研究所得到的句子语法规则。
上述技术方案中,在所述的步骤7)中,包括:
7-1、选取一种句蜕类型的句类演绎规则;
7-2、根据步骤7-1所选取的句类演绎规则,对作用域的语义块结构表达式做结构匹配操作,匹配成功,执行下一步,否则,跳转到步骤7-7;
7-3、将句子的局部语义中心的属性和全局语义中心的属性分别与句类演绎规则的局部语义中心的属性和全局语义中心的属性做匹配操作,若匹配成功,执行下一步,否则,跳转到步骤7-7;
7-4、对句类演绎规则中的“检验条件”逐个进行判断,判断成功,执行下一步,否则,跳转到步骤7-7;
7-5、将局部语义中心所在的语义块的属性与句类演绎规则中的K属性做匹配,匹配成功执行下一步,否则,跳转到步骤7-7;
7-6、步骤7-1所选取的句类演绎规则匹配成功,该句类演绎规则所对应的句蜕类型成立;
7-7、判断是否还有其他类型的句类演绎规则,若有,跳转到步骤7-1,否则,结束操作。
本发明的优点在于:
1、建立了一种表达动词歧义结构的统一的语义模型,把歧义结构上升到句子层面进行处理,把歧义结构的计算转换成句蜕类型的判断。
2、把该语义模型形式化为句类演绎规则,使得歧义结构的计算、推理过程,有法可依、有章可循。
3、分析算法以句子语义中心确定和歧义结构的角色确定为前提,使得歧义结构的处理能做到有法可依、有章可循。
4、句类演绎规则对句蜕类型的判断依据是概念关联性,概念关联性的表示是高度数字化的,这保证了整个模型的可计算性。
附图说明
图1为本发明的动词歧义结构消解的语义分析方法的流程图;
图2为本发明的动词歧义结构消解的语义分析方法中句蜕类型判断的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行说明。
在对动词歧义结构做消解之前,首先要为句子创建语义模型,利用语义模型将歧义结构上升到句子层面做处理。
本发明所述的语义模型包括以下内容:
1)用句蜕模型描述动词歧义结构内部的语义表示。动词歧义结构一般就是一个完整的子句或其变形,因此歧义结构的表示必须在句子层面才能给出。句蜕,顾名思义,就是句子的蜕化,一个句子(或其变形)蜕化为另一个句子的一部分,但是又保留了句子内部各成分之间的语义关系。根据语言环境,可以将句蜕模型分为多个种类,如表1所示,对常见的句蜕类型进行说明。
                                表1常见的句蜕类型
  例子   句蜕类型   说明
  美军进攻伊拉克。   句子原貌
  美军进攻伊拉克违背国际社会的意愿。   原型句蜕   子句整体作为“违背”的主语。
  美军进攻伊拉克的行动违背国际社会的意愿。   包装句蜕   子句整体作了“行动”的限定。
  美军对伊拉克的进攻违背国际社会的意愿。   要素句蜕   子句变形后,其语义中心“进攻”作为代表做“违背”的主语。
  进攻伊拉克的美军遭到国际社会的谴责。   要素句蜕   子句变形后,“进攻”的动作发出者“美军”作为代表和其后的内容发生关系。
  被美军进攻的伊拉克得到国际社会的同情。   要素句蜕   子句变形后,“进攻”的对象“伊拉克”作为代表和其后的内容发生关系。
在上表中,“美军进攻伊拉克”是一个完整的句子,在后面的例子中,该句或其变形成为另一个句子的一部分,也就成为句蜕。由该句在整个句子中所起的作用,可以将句蜕分为多个种类,包括原型句蜕、要素句蜕、包装句蜕等。但无论是何种句蜕,它的基本意思不变,“美军”始终是“进攻”的动作发出者(施事),“伊拉克”始终是“进攻”的对象(受事)。不同的句蜕方式,只是给出了变形的特征而已。
利用句蜕模型,就可以把歧义结构的判断上升到子句层面,转换为句蜕类型的判断。如前所述,歧义结构一般可以分为结构型歧义和内容型歧义,结构型歧义的本质就是,一个结构实例化后形成了不同的句蜕类型,即一个相似的结构在不同句子中可以形成不同的句蜕类型。比如:
        参与这个计划的俄罗斯企业也遇到了一些严重的问题。
        国家为 维持产品的低价格而压低生产资料的价格。
        大家对 制定这个计划的背景都很清楚。
上述例子划线部分是典型的结构型歧义,其结构为“v+FKQ+的+FKH”,但其形成的句蜕类型分别是:
JK1要素句蜕    <v+JK2+的+JK1>         (JK2=FKQ;JK1=FKH)
原型句蜕       {v+JK2}                (JK2=FKQ+的+FKH)
包装句蜕       \{v+JK2}+的+包装品/    (JK2=FKQ;包装品=FKH)
其中,JK1表示句子中的第一语义块,JK2表示句子中的第二语义块,v表示动词。
内容型歧义的本质就是,一个结构实例化后的同一语言现象,形成了句蜕类型的混淆,也就是在同一个句子中,有着不同的句蜕类型。比如:
        咬死猎人的狗逃跑了。
        小王研究鲁迅的文章发表了。
第一个例子中的歧义结构有两种语义:一是“[咬死][猎人的狗]”,此时,句子中的划线部分是一个原型句蜕(本身是一个完整的句子,但是却蜕化成为另外一个句子的一部分);二是“狗咬死了猎人”,但是经过变形,把“狗”作为整个子句的代表和“逃跑”发生语义关系,此时划线部分是要素句蜕。
第二个例子中的歧义结构也有两种语义:一是“[小王][研究][鲁迅的文章]”,此时划线部分是一个原型句蜕;二是“[小王][研究][鲁迅]”,“文章”是其结果,而且只有“文章”和“发表”发生语义关系,此时划线部分是包装句蜕。
2)动词结构发生歧义的条件,综合结构型歧义与内容型歧义各自的特点,当一个动词结构可以被分析为多个句蜕类型时,此动词结构产生歧义。比如:同样是“v1+n1+的+n2”结构,“咬死猎人的狗”既可以被分析成原型句蜕,又可以被分析成要素句蜕,因此形成歧义结构,而“维持产品的低价格”、“制定这个计划的背景”则不能形成歧义。
         咬死猎人的狗逃跑了。
         维持产品的低价格是国家压低生产资料的价格的原因。
         制定这个计划的背景已经很清楚。
3)对动词歧义结构做消解可以利用外部语言环境的预期知识。此处所述的外部语言环境的预期知识主要是上级句子的语义中心对歧义结构所在部分的句蜕类型的预期,它是根据语法学的句子语法规则得到。同样的歧义结构,如果处在不同的语言环境中,则歧义消解的结果不同,其语义表示也不同。如:
         咬死猎人的狗逃跑了。
         咬死猎人的狗是熊逃跑的唯一出路。
上述两个例子中,划线部分的上级语义中心分别是“逃跑”和“是”,而“ 咬死 猎人的狗”这个歧义结构,在第一个例子中是要素句蜕,划线部分的含义为“狗咬死了猎人,狗逃跑了”,在第二个例子中是原型句蜕,划线部分的含义是“猎人的狗被咬死了”。划线部分的具体含义是由“逃跑”和“是”的语义决定的,而这种语义上的差异在句类表示框架中是一目了然的:“逃跑”的句类是状态过程句SPJ,其第一个语义块不允许原型句蜕;而“是”的句类是基本判断句jDJ,其第一个语义块一般都是原型句蜕。
4)句蜕模型保证了语义模型的可计算性。句蜕模型可将歧义结构内部的语义约束的计算转换成各个成分与动词所指示的句类的预期知识的匹配计算。比如:汉语动词“打动”的预期知识如下:
@S A=A+AC%;A
      A:p;
      AC:r{r65239;};g{g6500;g30a;};
   B=XB%+YB
      XB:p
      YB:g{g7;}
      YB:|心
其中,@是一个开始符号,@S表示预期知识的开始。A表示作用发出者,B表示作用对象。“=”右边的是语义块构成知识,“:”后的是构成里的每个要素的概念优先性,所谓的概念优先性是对每个要素的预期知识的概念表示。%表示邻接的部分不能省略,必须出现并满足。{r65239;}、g{g6500;g30a;}等是概念表示符号,其中的字母和数字分别代表概念的类型和具体含义,是对词语语义的一种编码。第一个构成以及其概念优先性的意思是,“打动”的作用发出者可以是某个人(A:p),或者是某个人(A:p)的“精神、行为”等(AC:r{r65239;};g{g6500;g30a;};)。第二个构成的意思是“打动”的作用对象一般也是某个人(XB:p),或者人(XB:p)的感情(YB:g{g7;})或“人心”(YB:|心)。这就是“打动”对其作用者和作用对象的预期。动词的预期知识从语言学研究中得到。
如下述实施例:
车队渐渐消失在车流中,被真情打动了的交警,站在那里许久未动。
在上面的例子中,“被真情打动了的交警”是一个要素句蜕,其语句代码是<!12XJ>。对该要素句蜕做分析,“真情”是“打动”的作用发出者,它可以归类为某个人的“精神、行为”,“交警”是“打动”的作用对象,它是某个人。对该要素句蜕的具体划分如下。
<被真情|打动了|的交警>
<A     |X     |B    >
其内部的语义计算包括:
“真情”=>AC:r{r65239;};g{g6500;g30a;};“交警”=>XB:p
其中,“=>”表示该符号前的词语的概念表示必须蕴含在其后的语义角色所指示的概念表示中,也即两者的概念表示进行语义距离计算。概念表示和预期知识都是高度符号化的,计算的过程就是对符号串做匹配运算,因此具有很好的可计算性。
建立句蜕模型后,可利用句蜕模型对动词歧义结构进行语义分析,消解歧义结构。在语义分析之前,首先要建立句类演绎规则。句类演绎规则(Sentence CategoryDeduction Rule,简称SCDR),是对语义块内部的动词的语义角色和语义块内部的切分关系进行判断的规则。句类演绎规则主要利用的是整个句子的句类表达式(EgJ)的句类知识,包括语义块检验预期、Eg的属性,以及K(动词歧义结构所在的句子的局部)中局部E的句类知识。
在一个实施例中,假设一个句子中有两个语义核心块全局语义核心块Eg、局部语义核心块E,则语义核心块的语义角色就有四种可能:句蜕(El)、块扩(Er)、复合(E2)和!v,分别表示句蜕型局部语义核心、因果型局部语义核心、第二语义核心、非语义核心。
句类演绎规则用BNF范式表示:
<句类演绎规则>∷=$<语义核心块所在的语义块内部的结构表示式KFJ>
                   <入口><Eg属性><E属性><K属性>
                   <检验条件>
                <判断结果类型>
                <语义核心块所在语义块内部的句类表示式KMJ>$
<KFJ>         ∷=∑Ki+v[+的]+∑Kj(i+j=n-1,n是KFJ形式上切分出块的个数,其中的Ki、Kj也经常用FKQ、FKH代替。其中的v是E的核心动词。)
<入口>        ∷=[<Eg在整句的相对位置>]
                +[<E在K中的相对位置>]
                +[<Eg和E的相对位置>]
                +[<K中“的”和E的相对位置>]
<Eg在整句的相对位置cEgRelPos>∷=HEAD|TAIL|MIDDLE
<E在K中的相对位置cERelPos>∷=HEAD|TAIL|MIDDLE
<Eg和E的相对位置cEgERelPos>∷=BEFORE_FAR|BEFORE_NEXT|AFTER_FAR|AFTER_NEXT
<“的”和E的相对位置cChineseDeERelPos>∷=BEFORE_FAR|BEFORE_NEXT|AFTER_FAR|AFTER_NEXT
<Eg属性>   ∷=[<其句类的语义块个数>]+[<v属性>]
<E属性>    ∷=[<其句类的语义块个数>]+[<v属性>]
    <其句类的语义块个数cJkTotal>∷=2|3|4
    <v属性>   ∷=AE_FLAG_GeneralXorY|AE_FLAG_KuaiKuo|……
<K属性>       ∷=A|B|C|BC
<检验条件>    ∷=E-Ki“=>”E-JKj检验(i=n-1,j=1-3)
                  |Eg-Km“=>”E-JKk检验(m=n-1,k=1-3)
<判断结果类型>∷=句蜕|复合|块扩|要素句蜕|原型句蜕|包装句蜕
<语义中心块所在语义块内部的句类表示式KMJ>
              ∷=<句类标记符><KFJ>
<句类标记符>  ∷=<前标记>+<后标记>
<前标记>      ∷=句蜕前标记’(‘|要素句蜕前标记’<’|原型句蜕前标记’{’|包装句蜕前标记’\’|复合前标记’*’
<后标记>      ∷=句蜕后标记’)‘|要素句蜕后标记’>’|原型句蜕后标记’}’|包装句蜕后标记’/’|复合后标记’*’
其中,“语义核心块所在的语义块K内部的结构表示式KFJ”中所述的“语义块K”可以是主语义块JK,也可以是辅语义块fK。“KFJ”可以是语义块K整体的结构表示式,也可以是局部的结构表示式。
“入口”是句类演绎规则的入口条件,只有满足这些条件,才能使用规则。
“Eg属性”:只有当“所在的语义块”是主语义块(JK)时,才需要使用Eg属性。本属性是指包含“E所在语义块K”的句类表示式中的EgJ的属性。这里的EgJ是相对的,如果上级是整句,则这里是真正的Eg;否则,是其上级的因果型子句(ErJ)或句蜕子句(ElJ)。所述的因果型子句一般是局部语义核心所在的子句,所述的句蜕子句一般是句蜕型局部语义核心所在的子句。
“E属性”是指局部E本身的属性。
“K属性”,只有当“所在的语义块K”是JK时,才需要使用。是指主语义块JK的语义角色类别基元或其组合。
“检验条件”:是指使用“同行检验”,还是“预期检验”,所述的“同行检验”是指根据两个词本身的语义关联性做检验。“预期检验”是指根据动词的作用对象的预期来做检验。对KFJ中的每个Ki,都需要给出检验动作的预期。检验动作有“=>”,是“满足语义约束”的意思,也有“!=>”,是“不能满足语义约束”的意思。如:E-Ki=>E-JK1即表示E-Ki满足E-JK1的语义约束,也即E-JK1检验必须通过,规则才可能得到结果。规则中,一般有“检验条件v”和“检验条件Eg”,分别是局部E必须满足的检验和Eg必须满足的检验。
“判断结果类型”:句类演绎规则的判断结果总类型有3种:块扩(Er)、复合(E2)、句蜕(El)。其中句蜕内部还有JK句蜕(用YaoSuJuTuiE表示)、EK句蜕(YaoSuJuTuiE)、包装句蜕(BaoZhuangJuTui)、原型句蜕(YuanXingJuTui)四种。
“语义中心块所在语义块内部的句类表示式KMJ”:是指在KFJ上加了“句类标记符”的KMJ。“句类标记符”指示了语义中心块的语义角色。规则中,KFJ和KMJ是混合在一起表达的,读者看到的形式是KMJ,去掉其中的句类标记符就是KFJ。
句类演绎规则中,“E属性”和“检验条件v”主要是针对结构内部的语义关系判断的,这是所有的歧义判断都需要的;而“Eg属性”、“检验条件Eg”和“K属性”则主要体现外部语言环境的影响,主要是内容型歧义判断需要,规则中把这三个知识项也作为一种条件而使用,这样,就把结构型歧义和内容型歧义都纳入到一个统一的框架下。
建立句蜕模型和句类演绎规则后,结合实施例,对动词歧义结构消解中的语义分析过程进行说明。
实施例1:咬死猎人的狗逃跑了。
在例句中有两个动词,分别为“咬死”和“逃跑”,语义分析过程如图1所示。
步骤101、选定待处理的句子;
步骤102、假设句子的某一个动词是语义中心,在实施例中可以先假设“逃跑”为语义中心,如果逃跑不符合语义中心的相关条件,再假设“咬死”为语义中心;
步骤103、根据句子的预期知识做初步检验,检验句子的格式是否正确,检验成功,转至步骤105,否则,转至步骤104;
步骤104、检查句子中是否还有其他动词可以假设为语义中心Eg,若没有,结束操作,否则,跳转到步骤102;
步骤105、检查句子中是否还有其他动词可以假设为局部语义中心E,若没有,结束操作,否则,执行下一步;
步骤106、确定局部语义中心E中的动词的作用域,例如,动词“咬死”的作用域为“咬死……狗”;
步骤107、在作用域内进行句蜕类型判断;
步骤108、观察判断结果,看是否能得到多个句蜕类型,如果只有一种句蜕类型,则句子无歧义,结束操作;否则,执行下一步;
步骤109、一个动词的作用域内有多种句蜕类型,该句的结构存在歧义;例如,动词“咬死”的作用域有两种句蜕类型,分别是原型句蜕和JK要素句蜕,因此例句中的“咬死猎人的狗”部分存在歧义;
步骤110、利用句子全局语义核心Eg的预期知识对歧义结构的语义角色进行判断;例如,根据预期知识,“逃跑”之前应该是其动作发出者,因此否定原型句蜕,
步骤111、利用句子局部语义核心E的预期知识,对歧义结构内部的句蜕类型的合理性进行判断,得到歧义结构的合理语义表示。在上一步骤中,已经否定了原型句蜕,保留了JK要素句蜕,在本步骤中要实现对JK要素句蜕本身合理性做判断。由句子局部语义核心E的预期知识,可知JK要素句蜕在本实施例中是合理的,因此例句中的子句“咬死猎人的狗”的语义表示如下:
<咬死|猎人|的狗>
在上述的步骤107中,句蜕类型判断涉及句类演绎规则,判断过程较为复杂,下面结合实例,对句蜕类型判断的具体操作过程进行说明。
步骤71、对语义块结构表达式(KFJ)做结构匹配操作,对例句中的“咬死猎人的狗”,其动词结构的形式为:v+FKQ+的+FKH。能匹配上的规则依次是:
句类演绎规则1    //    JK句蜕
  @@@句蜕Cstructl
  @@     <(v+FKQ)+的+FKH>
  @判断结果    YaoSuJuTuiJK
  @入口
    cERelPos=HEAD
    cChineseDeERelPos=AFTER_FAR
  @检验条件Eg
    Eg-FKH=>E-JKm
  @Eg属性
  @检验条件v
    v-FKH=>E-JK1
    v-FKQ=>E-JK2
  @E属性    cEJkTotal=3
  @K属性
句类演绎规则2    //原型句蜕
  @@@句蜕Cstructl
  @@    (v+*FKQ+的+FKH*)
  @判断结果    JuTui
  @入口
    cElRelPos=HEAD
    cChineseDeElRelPos=AFTER_FAR
  @检验条件Eg
    Eg-JK2!=>E-JKm
  @Eg属性
  @检验条件v
    v-FKH=>E-JK2
  @E属性
    cElJkTotal=3
  @K属性
    cFromChunkType=CHUNK_TYPE_AC
    cFromChunkType=CHUNK_TYPE_BC
    cFromChunkType=CHUNK_TYPE_ABC
句类演绎规则3    //包装句蜕
  @@             ((v+FKQ)+的+FKH)
  @判断结果      BaoZuangJuTui
  @入口
    cElRelPos=HEAD
    cChineseDeElRelPos=AFTER_FAR
  @检验条件Eg
    Eg-JK2=>E-JKm
  @Eg属性
  @检验条件v
    v-FKQ=>E-JK2
    v-FKH!=>E-JK1
    FKH∈BZP
  @E属性    cElJkTotal=3
  @K属性
步骤72、将例句的E属性与规则的E属性做匹配,将例句的Eg属性与规则的Eg属性做匹配,若匹配成功,则句子适用相应的句类演绎规则。已知动词“咬死”的E属性可以和“cElJkTotal=3”相匹配,此处的“cElJkTotal=3”表示局部E要求有3个语义块,其中有作用者和作用对象。而Eg属性为空,无需匹配,因此,3个句类演绎规则都适用。
步骤73、做检验条件的判断,其中的检验有:
规则1:咬死-猎人=>E-JK2“猎人”是否能作“咬死”的对象
       咬死-狗=>E-JK1“狗”是否能作“咬死”的动作发出者
规则2:
咬死-狗=>E-J2“狗”是否能作“咬死”的对象
规则3:咬死-猎人=>E-JK2“猎人”是否能作“咬死”的对象
       咬死-狗!=>E-JK1“狗”是否不能作“咬死”的动作发出者
       狗∈BZP          “狗”是否能作包装品
经过检验,“猎人”可以作“咬死”的对象,“狗”可以作“咬死”的动作发出者,规则1成立;“狗”也可以作“咬死”的对象,规则2成立。因此,规则1和2均满足。
步骤74、做K属性匹配。
步骤75、根据匹配结果,得到句蜕类型。对“咬死猎人的狗”这一结构,其句蜕类型为JK要素句蜕和原型句蜕。
实施例2:咬死猎人的狗是逃跑的唯一出路。
在本实施例中,有3个动词,包括“咬死”、“是”和“逃跑”。该实施例对句子结构的判断过程与实施例1相类似,下面描述从略。
步骤1、假设句子的语义中心是“是”。
步骤2、根据句子的预期知识,“是”之前应该是判断的对象,之后是判断的内容。
步骤3、确定“咬死”的作用域为“咬死……狗”。
步骤4、在作用域内进行句蜕类型判断。
步骤5、由判断结果得到这个动词结构可能的两种句蜕类型:原型句蜕和JK句蜕。
步骤6、该句子结构是歧义结构。
步骤7、根据上述的预期知识“是”之前应该是判断的对象”,否定JK句蜕,保留原型句蜕,从而得到此歧义结构的语义表示如下,其中“猎人”是对“狗”的限定。
        {咬死|猎人的狗}

Claims (6)

1、一种用于句子分析中动词歧义结构消解的语义分析方法,包括:一用于表达动词的歧义结构的语义模型和根据语义模型进行动词歧义结构的判断、消解、计算的语义分析算法;具体步骤如下:
1)、首先将要分析的文章输入计算机,选择一待处理的句子;
2)、假设句子中的某一个动词为全局的语义中心,根据全局语义中心对句子进行语义块切分,所述的全局语义中心是决定句子语义类型和句子内部语义关系的词语;
3)、根据句子的预期知识做初步检查,检查句子的格式是否正确,若正确,转至步骤5),否则,执行步骤4);
4)、检查句子中是否还有其他动词可假设为全局语义中心,若没有,结束操作,否则,跳转到步骤2);
5)、检查句子中是否还有其他动词可以假设为局部语义中心,所述的局部语义中心是指句子中的子句的语义中心,若没有,结束操作,否则,执行步骤6);
6)、根据上述语义块切分结果,确定局部语义中心中的动词的作用域,所述作用域为所在语义块的前后边界;
7)、利用句类演绎规则,在作用域内进行句蜕类型判断;
8)、根据步骤7)的判断结果,若只有一种句蜕类型,则句子无歧义,结束操作,否则,执行下一步;
9)、利用句子全局语义核心的预期知识对歧义结构的语义角色进行判断,去除不符合预期知识的句蜕类型;
10)、利用句子局部语义核心的预期知识,对句蜕类型的合理性进行判断,得到歧义结构的合理语义表示。
2、根据权利要求1所述的用于句子分析中动词歧义结构消解的语义分析方法,其特征在于,所述的语义模型是利用句类演绎规则,把动词歧义结构上升到句子层面,将动词歧义结构的计算转换成句蜕类型的判断,所述的句蜕类型包括原型句蜕、包装句蜕、要素句蜕,当一个动词结构可同时满足两种以上句蜕类型的句类演绎规则时,该动词结构存在歧义。
3、根据权利要求1所述的用于句子分析中动词歧义结构消解的语义模型,其特征在于,所述的句类演绎规则是对语义块内部的动词的语义角色和语义块内部的切分关系进行判断的规则,它的巴克斯范式是:
<句类演绎规则>::=$<语义核心块所在的语义块内部的结构表示式KFJ>
                    <入口><Eg属性><E属性><K属性>
                    <检验条件>
                  <判断结果类型>
<语义核心块所在语义块内部的句类表示式KMJ>$
其中,Eg表示全局语义核心块,E表示局部语义核心块,K表示语义块。
4、根据权利要求1所述的用于句子分析中动词歧义结构消解的语义分析算法,其特征在于,在权利要求1所述的步骤2)中,所述的语义块切分的切分规则与语法学中的语义块切分规则相同。
5、根据权利要求1所述的用于句子分析中动词歧义结构消解的语义分析算法,其特征在于,在权利要求1所述的步骤4)中,所述的预期知识是根据语法学研究所得到的句子语法规则。
6、根据权利要求1所述的用于句子分析中动词歧义结构消解的语义分析算法,其特征在于,在权利要求1所述的步骤7)中,包括:
7-1、选取一种句蜕类型的句类演绎规则;
7-2、根据步骤7-1所选取的句类演绎规则,对作用域的语义块结构表达式做结构匹配操作,匹配成功,执行下一步,否则,跳转到步骤7-7;
7-3、将句子的局部语义中心的属性和全局语义中心的属性分别与句类演绎规则的局部语义中心的属性和全局语义中心的属性做匹配操作,若匹配成功,执行下一步,否则,跳转到步骤7-7;
7-4、对句类演绎规则中的“检验条件”逐个进行判断,判断成功,执行下一步,否则,跳转到步骤7-7;
7-5、将局部语义中心所在的语义块的属性与句类演绎规则中的K属性做匹配,匹配成功执行下一步,否则,跳转到步骤7-7;
7-6、步骤7-1所选取的句类演绎规则匹配成功,该句类演绎规则所对应的句蜕类型成立;
7-7、判断是否还有其他类型的句类演绎规则,若有,跳转到步骤7-1,否则,结束操作。
CNB2005100887410A 2005-07-29 2005-07-29 一种用于句子分析中动词歧义结构消解的语义分析方法 Expired - Fee Related CN100349161C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005100887410A CN100349161C (zh) 2005-07-29 2005-07-29 一种用于句子分析中动词歧义结构消解的语义分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100887410A CN100349161C (zh) 2005-07-29 2005-07-29 一种用于句子分析中动词歧义结构消解的语义分析方法

Publications (2)

Publication Number Publication Date
CN1904880A true CN1904880A (zh) 2007-01-31
CN100349161C CN100349161C (zh) 2007-11-14

Family

ID=37674146

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100887410A Expired - Fee Related CN100349161C (zh) 2005-07-29 2005-07-29 一种用于句子分析中动词歧义结构消解的语义分析方法

Country Status (1)

Country Link
CN (1) CN100349161C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102306144A (zh) * 2011-07-18 2012-01-04 南京邮电大学 一种基于语义词典的词语消歧方法
CN102844775A (zh) * 2010-04-27 2012-12-26 阿尔卡特朗讯 用于改编文本内容以适应在线社区的语言行为的方法和系统
CN109299455A (zh) * 2017-12-20 2019-02-01 北京联合大学 一种汉语动名词超常搭配的计算机语言处理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0424767A (ja) * 1990-05-15 1992-01-28 Fujitsu Ltd 機械翻訳システム
CN1310171C (zh) * 2004-09-29 2007-04-11 上海交通大学 建立基于语法模型的语义分析器的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102844775A (zh) * 2010-04-27 2012-12-26 阿尔卡特朗讯 用于改编文本内容以适应在线社区的语言行为的方法和系统
CN102306144A (zh) * 2011-07-18 2012-01-04 南京邮电大学 一种基于语义词典的词语消歧方法
CN102306144B (zh) * 2011-07-18 2013-05-08 南京邮电大学 一种基于语义词典的词语消歧方法
CN109299455A (zh) * 2017-12-20 2019-02-01 北京联合大学 一种汉语动名词超常搭配的计算机语言处理方法

Also Published As

Publication number Publication date
CN100349161C (zh) 2007-11-14

Similar Documents

Publication Publication Date Title
CN1174332C (zh) 转换表达方式的方法和装置
CN1311881A (zh) 语言变换规则产生装置、语言变换装置及程序记录媒体
CN1168031C (zh) 基于文本内容特征相似度和主题相关程度比较的内容过滤器
CN1578954A (zh) 机器翻译
CN1942877A (zh) 信息提取系统
CN1196103C (zh) 语音识别设备和方法以及记录了语音识别程序的记录媒体
CN1608259A (zh) 机器翻译
CN1215457C (zh) 语句识别装置和方法
CN100336056C (zh) 基于成熟工艺文档的工艺术语提取、规律分析和重用方法
CN1777888A (zh) 基于移动结构概念的句子结构分析及使用其的自然语言搜索
CN1571980A (zh) 字符串识别
CN1871597A (zh) 利用一套消歧技术处理文本的系统和方法
CN1281191A (zh) 信息检索方法和信息检索装置
CN1955991A (zh) 在业务模型中集成模型语义和领域语义的方法和装置
CN1474379A (zh) 语音识别/响应系统、语音/识别响应程序及其记录介质
CN101055588A (zh) 获取限制词信息的方法、优化输出的方法和输入法系统
CN1455357A (zh) 一种实现多路对话的人-机汉语口语对话系统的方法
CN1696933A (zh) 基于动态规划的文本概念关系自动提取方法
CN101030257A (zh) 基于汉字特征的文档图像分割方法
CN1741012A (zh) 文本检索装置及方法
CN1904880A (zh) 一种用于句子分析中动词歧义结构消解的语义分析方法
CN1991819A (zh) 语言形态分析器
CN1647069A (zh) 对话控制系统和对话控制方法
CN1514387A (zh) 语音查询中的辨音方法
CN1111841C (zh) 在语言识别中通过计算机来确定至少两个单词的序列出现概率的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071114

Termination date: 20100729