CN106021286A

CN106021286A - 一种基于语言结构的语言理解方法

Info

Publication number: CN106021286A
Application number: CN201610283792.7A
Authority: CN
Inventors: 李娜
Original assignee: Northeast Dianli University
Current assignee: Northeast Electric Power University
Priority date: 2016-04-29
Filing date: 2016-04-29
Publication date: 2016-10-12
Anticipated expiration: 2036-04-29
Also published as: CN106021286B

Abstract

本发明公开了一种基于语言结构的语言理解方法，其包括以下步骤：(1)语素分析；(2)语法分析及语义分析；(3)查询数据库；(4)获得语义节点的层次；(5)从语义数据库中查询与之匹配度最高的匹配模板；(6)基于匹配模板，将步骤(1)中的语素分析结果反馈匹配到匹配模板中。其通过语素分析来进行语义分析和语法分析，并根据语义分析和语法分析得出语义节点，并根据语义节点分析出与该待分析的语言最为匹配的匹配模板，将语素分析的结果再反馈给该匹配模板，实现语言的层次化分析，本发明通过逐层次的对语言结构进行分析，并将分析后的匹配结果反馈到语素分析中，通过反馈与层次结合的方法，实现了语言结构的准确、快速的理解。

Description

一种基于语言结构的语言理解方法

技术领域

本发明属于自然语言处理技术领域，尤其是涉及一种基于语言结构的语言理解方法。

背景技术

自然语言理解是使用自然语言同计算机进行通讯的技术，因为处理自然语言的关键是要让计算机理解自然语言，所以自然语言理解，一方面它是语言信息处理的一个分支，研究使用计算机通过计算理解和生成自然语言，另一方面它是人工智能的核心课题之一，研究让计算机使用自然语言这一人类智能的重要标志之一。虽然我们知道了计算机处理和理解自然语言的过程和层次，但一个现实的问题是，现在的计算机智能还远远没有达到能够像人一样理解自然语言的水平，而且在可预见的将来也达不到这样的水平。与此同时，随着计算机和互联网的广泛应用昭示着信息时代的到来，计算机可处理的自然语言文本数量空前增长，面向海量信息的文本挖掘、信息提取、跨语言信息处理、人机交互等应用需求急速增长，自然语言处理研究必将对我们的生活产生深远的影响。

在国际自然语言理解技术不断革新和进步的影响下，在国内学者的共同努力下，自然语言理解研究也在不断的深入和提高，受到互联网和信息技术空前发展的带动，自然语言理解技术又出现了新的需求和新的难题，总的来说这一时期呈现出多元化、多角度的研究态势。因此，语言理解方法需要从不同角度、不同方面进行多方面研究，集各种理解层次与结构于一体，实现更佳的理解方法，逐步提高计算机的语言识别能力。

发明内容

本发明针对现有的技术问题，提供一种基于语言结构的语言理解方法，其通过语素分析来进行语义分析和语法分析，并根据语义分析和语法分析得出语义节点，并根据语义节点分析出与该待分析的语言最为匹配的匹配模板，然后，将语素分析的结果再反馈给该匹配模板，实现语言的层次化分析，本发明通过逐层次的对语言结构进行分析，并将分析后的匹配结果反馈到语素分析中，通过反馈与层次结合的方法，实现了语言结构的准确、快速的理解。

为实现上述目的，本发明提供如下技术方案：一种基于语言结构的语言理解方法，其特征在于，其包括以下步骤：

(1)输入待理解的语句，控制器对该待理解的语句进行语素分析，得出一串词及其定义；

(2)基于提取出的语素信息，控制器进行语法分析及语义分析；

(3)语法分析和语义解释配合进行，语义随时指令推理，系统作出推论，同时，查询数据库；

(4)根据步骤(3)中的语法分析和语义解释，获得语义节点的层次；

(5)基于语义节点的层次，从语义数据库中查询与之匹配度最高的匹配模板；

(6)基于匹配模板，将步骤(1)中的语素分析结果反馈匹配到匹配模板中，实现对语言的理解。

进一步，作为优选，所述步骤(1)中，对语素分析时，至少包括语素的提取以及语素之间关系的分析，其中，提取语素是基于单音节语素，双音节语素和多音节语素进行提取的，语素之间关系的分析至少包括分析语素之间是平等的、不分主次的联合关系、有主次之分的偏正关系、相互支配关系、相互陈述说明的陈述关系、相互补充说明的补充关系、事物之间计量关系、附加组合的组合关系还是重复语素的重叠式关系。

进一步，作为优选，所述步骤(2)中，语法分析至少包括分析主语、谓语、宾语、述语以及它们之间的结构关系，语义分析至少包括分析动作行为、性质状态、施事、受事、工具、处所以及它们之间的关系。

进一步，作为优选，所述步骤(3)中的数据库中，存储有语义解析标准指令、语义解析规则、语法解析标准指令和语法解析规则。

进一步，作为优选，所述步骤(4)中，生成语义节点是根据步骤(3)中分析出来的语义逻辑关系、语义动态关系和语义静态关系进行生成，其中，语义逻辑关系的分析是通过与数据库中的逻辑词语进行一一比较，通过比较筛选出来的逻辑词语，语义动态关系是通过与数据库中的动词进行比较，筛选出来的动作词语，语义静态关系是通过与数据库中的名词进行比较，筛选出来的名词词语，基于这些名词、动词、逻辑词以及语言中的标点信息，以标点为导向优先考虑的对象，确定语言中的各个语义节点，以便将语言分割成由各个语义节点分开的语义。

进一步，作为优选，所述步骤(4)中，当一个语言中包括多个动词时，需要先从数据库中的语义解析规则和语法解析规则中进行查询比较，寻找出最为核心的动词，基于该最为核心的动词，对各个语义节点进行设置。

进一步，作为优选，所述步骤(5)中，采用一一映射与余弦相似度公式的方式进行计算匹配度。

与现有技术相比，本发明的有益效果是：

本发明通过语素分析来进行语义分析和语法分析，并根据语义分析和语法分析得出语义节点，并根据语义节点分析出与该待分析的语言最为匹配的匹配模板，然后，将语素分析的结果再反馈给该匹配模板，实现语言的层次化分析，本发明通过逐层次的对语言结构进行分析，并将分析后的匹配结果反馈到语素分析中，通过反馈与层次结合的方法，实现了语言结构的准确、快速的理解。

附图说明

图1为本发明一种基于语言结构的语言理解方法的结构流程示意图；

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供一种技术方案：一种基于语言结构的语言理解方法，其特征在于，其包括以下步骤：

在本实施例中，所述步骤(1)中，对语素分析时，至少包括语素的提取以及语素之间关系的分析，其中，提取语素是基于单音节语素，双音节语素和多音节语素进行提取的，语素之间关系的分析至少包括分析语素之间是平等的、不分主次的联合关系、有主次之分的偏正关系、相互支配关系、相互陈述说明的陈述关系、相互补充说明的补充关系、事物之间计量关系、附加组合的组合关系还是重复语素的重叠式关系。所述步骤(2)中，语法分析至少包括分析主语、谓语、宾语、述语以及它们之间的结构关系，语义分析至少包括分析动作行为、性质状态、施事、受事、工具、处所以及它们之间的关系。所述步骤(3)中的数据库中，存储有语义解析标准指令、语义解析规则、语法解析标准指令和语法解析规则。所述步骤(4)中，生成语义节点是根据步骤(3)中分析出来的语义逻辑关系、语义动态关系和语义静态关系进行生成，其中，语义逻辑关系的分析是通过与数据库中的逻辑词语进行一一比较，通过比较筛选出来的逻辑词语，语义动态关系是通过与数据库中的动词进行比较，筛选出来的动作词语，语义静态关系是通过与数据库中的名词进行比较，筛选出来的名词词语，基于这些名词、动词、逻辑词以及语言中的标点信息，以标点为导向优先考虑的对象，确定语言中的各个语义节点，以便将语言分割成由各个语义节点分开的语义。

此外，在本实施例中，所述步骤(4)中，当一个语言中包括多个动词时，需要先从数据库中的语义解析规则和语法解析规则中进行查询比较，寻找出最为核心的动词，基于该最为核心的动词，对各个语义节点进行设置。

同时，所述步骤(5)中，采用一一映射与余弦相似度公式的方式进行计算匹配度，这种匹配相似度的方法已经在中国专利CN104850539A中有所记载，在此不在赘述。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于语言结构的语言理解方法，其特征在于，其包括以下步骤：

2.根据权利要求1所述的一种基于语言结构的语言理解方法，其特征在于：所述步骤(1)中，对语素分析时，至少包括语素的提取以及语素之间关系的分析，其中，提取语素是基于单音节语素，双音节语素和多音节语素进行提取的，语素之间关系的分析至少包括分析语素之间是平等的、不分主次的联合关系、有主次之分的偏正关系、相互支配关系、相互陈述说明的陈述关系、相互补充说明的补充关系、事物之间计量关系、附加组合的组合关系还是重复语素的重叠式关系。

3.根据权利要求1所述的一种基于语言结构的语言理解方法，其特征在于：所述步骤(2)中，语法分析至少包括分析主语、谓语、宾语、述语以及它们之间的结构关系，语义分析至少包括分析动作行为、性质状态、施事、受事、工具、处所以及它们之间的关系。

4.根据权利要求1所述的一种基于语言结构的语言理解方法，其特征在于：所述步骤(3)中的数据库中，存储有语义解析标准指令、语义解析规则、语法解析标准指令和语法解析规则。

5.根据权利要求2所述的一种基于语言结构的语言理解方法，其特征在于：所述步骤(4)中，生成语义节点是根据步骤(3)中分析出来的语义逻辑关系、语义动态关系和语义静态关系进行生成，其中，语义逻辑关系的分析是通过与数据库中的逻辑词语进行一一比较，通过比较筛选出来的逻辑词语，语义动态关系是通过与数据库中的动词进行比较，筛选出来的动作词语，语义静态关系是通过与数据库中的名词进行比较，筛选出来的名词词语，基于这些名词、动词、逻辑词以及语言中的标点信息，以标点为导向优先考虑的对象，确定语言中的各个语义节点，以便将语言分割成由各个语义节点分开的语义。

6.根据权利要求5所述的一种基于语言结构的语言理解方法，其特征在于：所述步骤(4)中，当一个语言中包括多个动词时，需要先从数据库中的语义解析规则和语法解析规则中进行查询比较，寻找出最为核心的动词，基于该最为核心的动词，对各个语义节点进行设置。

7.根据权利要求1所述的一种基于语言结构的语言理解方法，其特征在于：所述步骤(5)中，采用一一映射与余弦相似度公式的方式进行计算匹配度。