CN112579733A

CN112579733A - 规则匹配方法、规则匹配装置、存储介质及电子设备

Info

Publication number: CN112579733A
Application number: CN201910941381.6A
Authority: CN
Inventors: 陈开济; 王家凯; 孙忠; 丁勇
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2021-03-30
Anticipated expiration: 2039-09-30
Also published as: CN112579733B; WO2021063089A1

Abstract

本发明实施例涉及一种规则匹配方法、规则匹配装置、存储介质及电子设备，该方法包括：使用匹配文本信息，在规则库中进行迭代规则匹配，每轮规则匹配用于在规则库中匹配到规则，每个规则配置有对应的第一通配符；若第i轮规则匹配的匹配结果满足预设条件，则在第i轮规则匹配所匹配到的规则中选取至少一个第一规则，将对应的匹配文本信息中与每个第一规则匹配成功的部分文本信息替换为与第一规则对应的第一通配符，以生成第i+1轮规则匹配所需的匹配文本信息；若第i轮规则匹配的匹配结果不满足预设条件，停止迭代，基于预设的评分机制，在每轮规则匹配后匹配到的规则中分别确定目标规则。上述方法能够减少知识问答的规则库中需要编写的规则数量。

Description

规则匹配方法、规则匹配装置、存储介质及电子设备

技术领域

本发明涉及数据处理技术领域，具体涉及一种规则匹配方法、规则匹配装置、存储介质及电子设备。

背景技术

知识问答(Knowledge Base Question Answering)的规则数量一般与知识库中不同类型的属性、关系和实体的数量成比例增长。针对不同的属性、关系和不同类型的问句，需要编写不同的规则来进行匹配。例如，针对简单的人物知识库，假设只包含一种实体类型人物，且人物只有两个属性：国籍和年龄，只存在一种关系：配偶。为了提供该知识库的二元事实查询(Binary Factoid Question,BFQ)和列举查询，至少需要准备6个规则来完成每个查询类型的国籍、年龄和配偶查询语义解析。通过这6个规则，系统将支持解析类似“某人的国籍是什么”、“列举所有女性”的知识查询问句。针对前述例子中的场景，如果用户叠加了关系和属性，询问“某人配偶的年龄是什么”或“列举国籍与某人配偶一样的人”，则需要增加对应的逻辑的规则才能进行语义解析。由于叠加次数理论上是没有上限的，现有规则匹配方法无法通过增加有限数量的规则来覆盖所有具有叠加逻辑属性的用户问句。这些问题导致了基于规则的语义解析方法在实际应用到业务中时，往往需要添加大量的规则才能保证其召回率可用，而大量的规则也会降低规则引擎匹配的效率，限制了规则语义匹配系统所能支持的知识库的最大规模。

发明内容

本发明实施例提供一种规则匹配方法、规则匹配装置、存储介质及电子设备，用于解决现有技术中需要添加大量的规则来适应具有叠加逻辑属性的用户问句，导致需要编写的规则数量过多的问题。

第一方面，本发明实施例提供了一种规则匹配方法，包括：

使用匹配文本信息，在规则库中进行迭代规则匹配，每轮规则匹配用于在所述规则库中匹配到规则，每个规则配置有对应的第一通配符；所述迭代规则匹配包括：若第i轮规则匹配得到的匹配结果满足预设条件，则在第i轮规则匹配所匹配到的规则中选取至少一个第一规则，将对应的匹配文本信息中与每个所述第一规则匹配成功的部分文本信息替换为与所述第一规则对应的第一通配符，以生成第i+1轮规则匹配所需的匹配文本信息；若第i轮规则匹配得到的匹配结果不满足预设条件，则停止迭代，其中，i为大于或等于1的自然数；

基于预设的评分机制，在每轮规则匹配后匹配到的规则中分别确定目标规则。

可选地，在所述使用所述匹配文本信息，在规则库中进行迭代规则匹配之前，所述方法还包括：

获取文本信息；

对所述文本信息进行分词处理，得到多个分词；

对所述多个分词中的至少部分分词进行词性标注处理，得到所述至少部分分词的词性信息；

对进行词性标注处理后的文本信息进行实体连接处理，将所述多个分词中为实体的分词以对应的通配符替代，以得到第一轮规则匹配所需的匹配文本信息。

可选地，每个规则配置有对应的元数据信息，所述元数据信息包括所述第一通配符，所述元数据信息还包括还包括文本信息、词性通配符及属性信息中的一种或者多种。

可选地，使用匹配文本信息，在规则库中匹配到的规则与匹配文本信息之间满足以下条件：

所述匹配文本信息中的至少部分分词与所述规则对应的元数据信息中的至少部分文本信息相同或者属于同一词类；和/或

所述匹配文本信息中的至少部分分词对应的词性通配符与所述规则对应的元数据信息中的至少部分词性通配符相同；和/或

所述匹配文本信息中的至少部分分词对应的属性信息与所述规则对应的元数据信息中的至少部分属性信息相同。

可选地，所述若第i轮规则匹配得到的匹配结果满足预设条件，则在第i轮规则所匹配到的规则中选取至少一个第一规则，包括：

根据所述预设的评分机制，对第i轮规则匹配所得到的匹配结果中的每个匹配结果进行评分，并根据评分结果对第i轮规则匹配所得到的每个匹配结果进行排序，选取排名小于或等于M的匹配结果对应的规则作为所述第一规则，M为大于等于1的自然数。

可选地，所述第i轮规则匹配的匹配结果满足预设条件，包括：所述第i轮规则匹配所匹配到的匹配结果的数量大于或等于1。

可选地，在所述规则库中进行迭代规则匹配通过最优化搜索算法或动态规划算法或启发式搜索算法实现。

第二方面，本发明实施例提供了一种规则匹配装置，包括：

匹配模块，用于使用匹配文本信息，在规则库中进行迭代规则匹配，每轮规则匹配用于在所述规则库中匹配到规则，每个规则配置有对应的第一通配符；所述迭代规则匹配包括：若第i轮规则匹配得到的匹配结果满足预设条件，则在第i轮规则匹配所匹配到的规则中选取至少一个第一规则，将对应的匹配文本信息中与每个所述第一规则匹配成功的部分文本信息替换为与所述第一规则对应的第一通配符，以生成第i+1轮规则匹配所需的匹配文本信息；若第i轮规则匹配得到的匹配结果不满足预设条件，则停止迭代，其中，i为大于或等于1的自然数；及

确定模块，用于基于预设的评分机制，在每轮规则匹配后匹配到的规则中分别确定目标规则。

第三方面，本发明实施例提供了一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行上述方法。

第四方面，本发明实施例提供了一种电子设备，包括存储器和处理器，所述存储器用于存储包括程序指令的信息，所述处理器用于控制程序指令的执行，所述程序指令被处理器加载并执行时实现上述方法。

可以理解，本发明实施例基于自迭代规则匹配的技术思路，在使用匹配文本信息，从规则库中进行一轮规则匹配后，判断匹配到的规则是否可以进行下一次匹配，若可以，将匹配文本信息中与规则匹配成功的部分文本信息替换为与匹配到的规则对应的通配符，然后生成新的匹配文本信息，在规则库中进行迭代匹配，直到匹配到的规则不再满足迭代条件时，跳出迭代。

通过上述的自迭代规则匹配方法，相对于现有方案，本发明实施例只需配置支持属性、关系、问句类型所对应的简单查询规则，就能实现任意次数叠加的复杂查询，大大提升了基于规则的知识问答系统的可扩展性，并减少了规则编写的工作量。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1为本发明实施例提供的一种规则匹配方法的应用场景图；

图2为图1所示的语音助手平台的部分功能模块的交互流程图；

图3为本发明实施例提供的一种规则匹配方法的流程图；

图4为本发明实施例提供的一种基于规则的语义解析流程图；

图5本发明实施例提供的迭代规则匹配的流程框图；

图6为本发明实施例提供的一种电子设备的示意性框图。

具体实施例

为了更好的理解本发明的技术方案，下面结合附图对本发明实施例进行详细描述。

应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其它含义。

应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本发明实施例提供了一种规则匹配方法，用于针对复杂的查询问题时，例如实现多意图叠加问句时，需要编写对应的规则才能实现对多意图叠加问句的匹配的问题，由于叠加次数理论上是没有上限的，现有规则匹配方法难以通过增加有限数量的规则来覆盖所有限定类型和属性的用户问句，同时，随着业务的增长，多意图叠加问句的数量也会更多，需要不断编写新的规则，在增加编写工作量的同时，大量的规则也会降低规则引擎匹配的效率，限制了规则语义匹配系统所能支持的知识库的最大规模。

基于以上问题，本发明实施例基于自迭代规则匹配的技术思路，在使用匹配文本信息，从规则库中进行一轮规则匹配后，判断匹配到的结果是否可以进行迭代匹配，若可以，将匹配文本信息中与规则匹配成功的部分文本信息替换为与匹配到的规则对应的通配符，然后生成新的匹配文本信息，在规则库中进行迭代匹配，直到匹配到的规则不再满足迭代条件(例如无法再匹配到规则)时，跳出迭代。

请参阅附图1，图1为本发明实施例提供的一种规则匹配方法的应用场景图，图1示出了一种语音助手平台的框架，语音助手平台包括设备及与设备通信连接的服务器，设备指的是与用户生活紧密相关的智能设备或移动设备，例如，设备可以包括但不限于智能手机、可穿戴设备、智能家居、车载设备等。其中可穿戴设备可以包括但不限于智能手表、手环、智能眼镜等。另外，在本发明实施方式中，服务器为云服务器。

在本发明实施例中，设备包括语音助手及语音识别(ASR，Automatic SpeechRecognition)模块，云服务器包括对话管理(Dialog Management，DM)模块、语音合成(text-to-speech，TTS)模块，知识问答模块及在线图谱模块。需要说明的是，知识问答模块及在线图谱模块，可以位于同一个服务器上，也可以分别位于不同的服务器上。

应理解，本发明实施例中，语音助手可以为集成在设备中的处理模块或者安装在设备中的客户端，语音助手对应的客户端可以在设备的显示屏幕上显示相应的图标或界面，也可以不显示相应的图标或界面而仅在后台运行。语音助手可以通过预存储的语音数据识别相应的语音数据。本发明实施例中的语音助手也可以称为智能助理、或个人助理等，本发明实施例对此并不限定。

如附图1所示，用户需要发起查询时，向语音助手发送语音信息(在其他实施方式中，还可以是文本信息)，语音助手将语音信息发送给ASR模块，ASR模块将用户发送的语音信息转换为文本信息后返回给语音助手，其中，语音识别技术可将语音信息转换成文本信息实现“声音”到“文字”的转换。具体地可以是预先分析出语音特征参数，制作语音特征参数对应的文本信息模板，并存放在语音特征参数库中；待识别的语音即用户的语音信息进行处理得到语音特征参数，将得到的语音特征参数与语音特征参数库中的语音模板中的语音特征参数进行比较，确定出最接近的语音特征参数对应的文本信息，作为识别结果。

然后，语音助手向DM模块发起文本查询，DM模块基于文本查询语句中的文本信息向知识问答模块发起知识查询，发起知识查询的查询语句中携带有文本信息，知识问答模块采用本发明实施例中提供的规则匹配方法，将输入的文本信息转换为针对在线图谱模块的所能“理解”的查询语句后，向在线图谱模块发起查询，知识问答模块获取在线图谱模块针对文本信息返回的查询结果后，生成问答结果返回给DM模块，DM模块调用TTS模块将问答结果转换为语音播报信息，包装为知识卡片后返回给语音助手并传递给用户。

本发明实施例中在线图谱模块需要依赖一个离线的知识图谱系统，该系统通过知识采集模块获取不同来源不同格式的信息，根据简单的领域分类后，转换为不同类别的文件。知识挖掘模块处理知识采集模块生成的文件，根据文件所属领域和格式，采用不同的知识挖掘流程处理，获取知识图谱支持的结构化图数据，并输出给知识存储模块。知识存储模块组织和保存结构化的知识图谱数据，提供数据基本的增删改查能力和数据可靠性、一致性支持。知识图谱系统通过知识服务模块对外提供查询和推理能力，在线图谱模块作为知识服务的一个子模块获取标签泛化所需的数据，并执行相应的知识查询和推理。

应当知道，规则引擎除了用在基于规则的知识问答系统，在NLU(NaturalLanguage Understanding，自然语言理解)意图识别领域也有广泛应用。意图识别是任务型语音助手的一个关键能力，通过解析用户输入的自然语言问句，提取该问句希望执行的任务即为意图提取，而为了执行该任务所需的其他参数信息，则为槽位提取。举个例子，用户输入问句“帮我订一个晚上5点在附近西餐厅的座位”，NLU需要提取该问句的意图为“订餐厅”，为了完成“订餐厅”意图，还需要“今晚5点”这个时间参数和“附近西餐厅”这个餐厅名称参数。目前通常通过编写正则表达式规则来处理意图识别问题，本发明实施例提出的基于自迭代的规则匹配方法可以用在该问题中，帮助NLU系统在编写每一个意图的匹配规则后，支持多意图叠加问句的意图识别和匹配。针对前述例子，餐厅名称参数“附近西餐厅”无法直接作为可用的餐厅名称参数来使用，因此，需要专门编写对应的规则才能完成识别。结合了本发明实施例提供的规则匹配方法后，会迭代对该参数继续进行规则匹配，获取其地图查询意图和查询条件参数，让解析得到的多个叠加意图和参数在任务执行时具有可行性。

请参阅附图2，图2为图1所示的语音助手平台中的部分功能模块的交互流程图；如附图2所示，设备通过语音助手向知识问答模块中的知识问答引擎发送文本信息，知识问答引擎对文本信息进行分词及词性标注处理后，将处理后的文本信息发送给知识问答模块中的索引服务子模块，索引服务子模块对接收到的文本信息进行实体连接处理，以实现查找用户语句中实体上位词的功能，然后知识问答引擎将文本信息中的实体部分以对应的通配符代替，得到匹配文本信息，知识问答引擎使用匹配文本信息向知识问答模块中的规则引擎发起规则匹配，规则引擎基于匹配文本信息进行自迭代规则匹配，并根据匹配到的生成对应的语义表达式并返回给知识问答引擎，使得知识问答引擎能够逻辑表达式生成对应的图查询语句，向在线图谱模块中的图计算引擎发起知识查询，最终向知识问答引擎返回查询结果，知识问答引擎生成对应的答案文本后，将答案文本返回给语音助手。

请参阅附图3，图3为本发明实施例提供的一种规则匹配方法的流程图，本发明实施例的规则匹配方法，可以应用于本发明任一实施例中的服务器及/或知识问答模块中，该规则匹配方法包括：

步骤S01：获取文本信息，对文本信息进行自然语言处理，得到匹配文本信息；

步骤S02：使用匹配文本信息，在规则库中进行迭代规则匹配，每轮规则匹配用于在规则库中匹配到规则，每个规则配置有对应的第一通配符；迭代规则匹配包括：若第i轮规则匹配得到的匹配结果满足预设条件，则在第i轮规则匹配所匹配到的规则中选取至少一个第一规则，将对应的匹配文本信息中与每个第一规则匹配成功的部分文本信息替换为与第一规则对应的第一通配符，以生成第i+1轮规则匹配所需的匹配文本信息；若第i轮规则匹配得到的匹配结果不满足预设条件，则停止迭代，其中，i为大于或等于1的自然数；

步骤S03：基于预设的评分机制，在每轮规则匹配后匹配到的规则中分别确定目标规则。

下面对本实施例提供的规则匹配方法的具体技术方案进行详细的说明。

首先，执行步骤S01：获取文本信息，对文本信息进行自然语言处理，得到匹配文本信息。

请参阅附图4，附图4为本发明实施例提供的一种基于规则的语义解析流程图，对上述自然语言处理的具体过程进行了介绍。

具体地，在本发明实施方式中，步骤S01中，对文本信息进行自然语言处理，得到匹配文本信息，包括：

步骤S011，对文本信息进行分词处理及词性标注处理，得到多个分词以及多个分词中至少部分分词的词性信息；

以接收的文本信息为“姚明配偶的父亲是谁”作为示例进行说明。

对文本信息“姚明配偶的父亲是谁”进行分词处理，得到若干分词“姚明”，“配偶”，“的”，“父亲”，“是”，“谁”。

分词处理可用采用现有的NLP分词模型，例如正向(逆向)最大匹配法、最佳匹配法、逐词遍历法或词频统计法，或其他合适的分词方法。

对分词进行词性标注处理，得到分词的词性信息的目的是为后续将输入的文本匹配信息与规则进行匹配提供匹配的依据。

进行词性标注处理时，可以对每个分词进行词性标注处理，得到每个分词的词性信息，也可以对只对部分分词进行词性标注处理，得到部分分词的词性信息。

在具体的实施例中，标注上述的分词“姚明”的词性为第一个名词，标注分词“配偶”的词性为第二个名词，标注分词“的”的词性为冠词，标注分词“父亲”的词性为第三个名词，标注分词“是”为第一个动词，标注分词“谁”的词性为第一个代词。需要说明的是词性标注为第一个名词时表示分词“姚明”为第一个具有名词词性的分词，第二个名词、第一个动词等解释类似。

在进行词性标注时，还可以结合上下文的语义环境，以提高词性标注的准确率。

步骤S012，对进行词性标注处理后的文本信息进行实体连接处理，将多个分词中为实体的分词以对应的通配符替代，以得到匹配文本信息。

在进行实体连接之前，需要将文本信息进行实体识别处理，一般来说，实体识别处理的任务就是识别文本信息中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体，当然用户还可以按照自己应用增加特殊类型。比如“我要听刘德华的忘情水”，可以通过传统的NER模型识别出“刘德华”是人名，“忘情水”是歌名，并且确定它们在句子中的起始结束位置。

进行实体识别后，对识别出的实体进行实体连接处理，将实体指称连接到知识图谱中的某个实体，然后将多个分词中为实体的分词以对应的通配符替代，以得到规则匹配所需的匹配文本信息。

依然以文本信息“姚明配偶的父亲是谁”为例，经过实体识别后，实体指称“姚明”被通配符“PERSON”替代，则文本信息对应的分词为：{“PERSON”，“配偶”，“的”，“父亲”，“是”，“谁”}。

然后，执行步骤S02：使用匹配文本信息，在规则库中进行迭代规则匹配，每轮规则匹配用于在规则库中匹配到规则，每个规则配置有对应的第一通配符；迭代规则匹配包括：若第i轮规则匹配得到的匹配结果满足预设条件，则在第i轮规则匹配所匹配到的规则中选取至少一个第一规则，将对应的匹配文本信息中与每个第一规则匹配成功的部分或全部文本信息替换为与第一规则对应的第一通配符，以生成第i+1轮规则匹配所需的匹配文本信息；若第i轮规则匹配得到的匹配结果不满足预设条件，则停止迭代，i为大于或等于1的自然数，更具体地，i＝1，2，3，…，Nt+1，Nt为迭代次数。

应当理解的是，规则可以理解为正则表达式，正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串，在很多文本编辑器里，正则表达式通常被用来检索、替换那些匹配某个模式的文本。正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。基于正则表达式的规则系统可解释便于开发，在代码生成、文本匹配等很多领域得到了广泛应用。例如，正则表达式被应用于基于规则的知识问答系统/装置/模块中，能提供召回率较低但准确率很高的知识问答体验。由于业务的复杂性增加，一个业务系统中所需的基于规则的决策流程变得很大，规则匹配本身的代价不能再被忽视，业界基于推理引擎发展出来了规则引擎，实现了将业务决策从应用程序代码中分离出来，并使用预定义的语义模块编写业务决策，帮助各业务快速、高效地进行规则匹配。

在本发明实施例中，针对每条规则，配置了相应的元数据信息，元数据信息包括第一通配符，第一通配符为该规则所对应的正则表达式的通配符，每条规则对应一个第一通配符。在本发明实施例中，元数据信息还包括文本信息、词性通配符、属性信息中及问句类型信息的一个或者多种，例如，元数据信息为：通过[concept1][action][concept2]办理，则元数据信息中的“通过”及“办理”为文本信息，“concept1”“action”“concept2”为词性通配符。

可选地，使用匹配文本信息，在规则库中进行规则匹配所得到的规则满足以下条件：

匹配文本信息中的至少部分分词与规则对应的元数据信息中的至少部分文本信息相同或者属于同一词类；和/或

匹配文本信息中的至少部分分词对应的词性通配符与规则对应的元数据信息中的至少部分词性通配符相同；和/或

匹配文本信息中的至少部分分词对应的属性信息与规则对应的元数据信息中的至少部分属性信息相同。

应当知道的是，在其他实施方式中，还可以包括其它条件，在此不一一列举。

可选地，第i轮规则匹配的匹配结果满足预设条件，包括：第i轮规则匹配所匹配到的匹配结果的数量大于或等于1，即，在本发明实施例中，若进行规则匹配后得到匹配结果的数量不为0，则会进入下一轮迭代。在其它实施方式中，该预设条件还可以根据业务需求自由设定。

可选地，在规则库中进行迭代规则匹配通过最优化搜索算法或动态规划算法或启发式搜索算法实现。

优选地，若第i轮规则匹配得到的匹配结果满足预设条件，则在第i轮规则所匹配到的规则中选取至少一个第一规则，包括：

根据预设的评分机制，对第i轮规则匹配所得到的匹配结果中的每个匹配结果进行评分，并根据评分结果对第i轮规则匹配所得到的每个匹配结果进行排序，选取排名小于或等于M的匹配结果对应的规则作为第一规则，M为大于等于1的自然数。其中，匹配结果为第i轮规则匹配对应的匹配文本信息中与匹配到的规则匹配成功的全部或部分文本信息。

可以理解，为了防止多次迭代匹配后生成的匹配文本信息过多，造成负载过大，因此通过设置阈值M，对每次迭代匹配的匹配文本信息(输入文本)的数量进行限定，例如，当M为2时，不论当前匹配流程中，匹配到的规则的数量为多少，确定的第一规则的数量均不会超过2，对应生成的作为下一轮规则匹配所需的输入文本(匹配文本信息)的数量也不会超过2，因此，可以限定每一轮规则匹配过程中的计算量，保证系统的搜索速度和工作量。

下面结合附图5对迭代规则匹配的过程进行详细的描述。

请参阅附图5，附图5示出了迭代规则匹配的流程框图，首先，将基于自然语言处理后的匹配文本信息作为输入文本，在规则库中进行第一轮规则匹配，若匹配到规则，则基于匹配到的规则生成匹配结果列表，其中，匹配结果列表中包括至少一个匹配结果，为了方便描述，本发明实施例将第一轮规则匹配得到的匹配结果列表称作为第一匹配结果列表，对应的，将第二、三轮规则匹配得到的匹配结果列表称作为第二、三匹配结果列表。若第一轮规则匹配没有匹配到规则，则不再进行迭代。

在本发明实施例中，得到第一匹配结果列表后，可以根据预设的评分机制对每个匹配结果进行评分，举例来说，若第一匹配结果列表中包括匹配结果1，匹配结果2及匹配结果3，可以根据预设的评分机制分别对匹配结果1，匹配结果2及匹配结果3分别进行评分，例如，匹配结果1的得分为0.8，匹配结果2的得分为0.7，匹配结果3的得分为0.6。若本发明实施例中的M为2，则可以选取匹配结果1及匹配结果2对应的规则1及规则2作为第一规则，针对匹配结果3及其对应的规则3则不再进行下一步处理。

选出第一规则后，对每个第一规则进行文本替换处理。

具体地，文本替换处理具体为：将匹配文本信息中与匹配结果(即匹配成功的文本信息)相同的文本替换为与第一规则对应的第一通配符，举例来说，若第一匹配文本信息对应的文本为：“Person配偶的父亲是谁？”，对应的匹配结果(第一匹配文本信息与规则1匹配成功的文本)为“Person的配偶”，则将“Person配偶的父亲是谁？”中的“Person配偶”用与规则1对应的元数据信息中的第一通配符代替，假设规则1对应的第一通配符为“Person”，则基于规则1生成的第二匹配文本信息对应的文本为：“Person的父亲是谁？”，可以理解，本发明实施例基于将复杂文本信息与多个简单的子规则进行匹配的方式，无需配置与复杂的文本信息相对应的复杂规则，只需通过多个子规则进行叠加，实现复杂文本信息的语义解析处理，且简单的子规则匹配的效率更高。

进行文本替换后，将生成的所有第二匹配文本信息分别在规则库中进行第二轮规则匹配，以得到第二匹配结果列表。

例如，将基于规则1生成的第二匹配文本信息，在规则库中进行规则匹配后，得到：基于规则1-1的匹配结果1-1及基于规则1-2的匹配结果1-2，将基于规则2生成的第二匹配文本信息2，在规则库中进行规则匹配后，得到：基于规则2-1的匹配结果2-1及基于规则2-2的匹配结果2-2，因此，经过第二轮规则匹配后，得到的第二匹配结果列表包括：匹配结果1-1、匹配结果1-2、匹配结果2-1及匹配结果2-2。得到第二匹配结果列表后，同样的，采取预设的评分机制在第二匹配结果列表中选出第二轮规则匹配中的得分较高的匹配结果，仍然以M＝2为例，选出得分较高的两个匹配结果，将该两个匹配结果对应的规则确定为第一规则，然后再根据第二轮规则匹配确定出的第一规则所配置的第一通配符与第二匹配信息进行文本替换，生成用于进行第三轮规则匹配的第三匹配文本信息，同样的，若第三轮规则匹配后得到的匹配结果仍然满足预设条件(例如，匹配到的规则的数量或者得到的匹配结果的数量大于0)，进行文本替换后，再进行第四轮规则匹配，如此循环，后续的循环流程与上文相同，为避免重复，不再一一描述。

应当知道，若第Nt+1轮规则匹配后得到的匹配结果不满足预设条件(例如，得到的匹配结果的数量为0)时，会停止迭代流程，其中，Nt为迭代的次数，且Nt为大于或等于0的自然数。

可以理解，整个进行迭代规则匹配的工作流程可以类比为寻找知识问句的一个最优分割方案的问题，可以采用但不限于最优化搜索算法、动态规划算法或启发式搜索算法来实现。

进一步地，在本发明实施例中，在每轮规则匹配后，还会对上一轮规则匹配得到的所有匹配结果进行停止判断，停止判断的方法具体为根据停止标签判断匹配结果是否已停止，对于未配置有停止标签的匹配结果，添加至待扩展队列中，对于已配置有停止标签的匹配结果，由于在每轮规则匹配后会对每个匹配结果进行评分，因此，对于已配置有停止标签的匹配结果(例如匹配结果Q)，如果当前排序结果队列内保存的匹配结果的数量小于k，则将已配置有停止标签的匹配结果添加至排序结果队列中，如果当前排序结果队列内保存的匹配结果数量大于或等于k，则判断排序结果队列中是否存在得分低于该匹配结果Q对应的至少一个匹配结果，若存在，则将匹配结果Q添加至排序结果队列中，以及在得分低于该匹配结果Q的至少一个匹配结果中确定一个得分最低的结果并将其从排序结果队列删除。若第i轮规则匹配得到的某个匹配结果，且基于该匹配结果生成的匹配文本信息在第i+1轮规则匹配没有匹配到规则，则该匹配结果的停止标签会被设置为否，反之，若基于该匹配结果生成的匹配文本信息在第i+1轮规则匹配匹配到了规则，则该匹配结果的停止标签会被设置为是(即有效)。

可以理解，通过设置排序结果队列，动态的保持得分较高的K个匹配结果，能够将最优的匹配结果筛选出来，同时可以减少存储空间的占用。

在本发明实施例中，对匹配结果进行评分的方法可以包括但不限于以下形式：

针对第一轮规则匹配得到的匹配结果，其得分与其占输入的匹配文本信息的比例相关联，例如，匹配结果占输入的匹配文本信息的比例越高，得分越高。在其它实施例中，匹配结果的得分还可以和其与匹配文本信息之间的匹配类型相关联，例如，可以为不同的匹配类型设置不同的权重，根据权重进行加权计算，匹配类型可以包括字面匹配、属性匹配及通配符匹配，例如，可以将字面匹配、通配符匹配及属性匹配的权重分别设为0.3、0.2及0.1。

针对第j轮(j为大于等于2的自然数)规则匹配后得到的规则，其得分不仅与其自身占输入的匹配文本信息的比例和/或匹配类型相关联，还与第j-1轮(前一轮)规则匹配后得到的匹配结果中与其具有第一关系的匹配结果的得分相关联，其中，当一个匹配结果基于另一个匹配结果生成时，视为这两个匹配结果具有第一关系。例如，当匹配结果C由基于匹配结果B生成的匹配文本信息在规则库中匹配得到时，视为匹配结果C与匹配结果B具有第一关系，除此之外，若匹配结果B与匹配结果A具有第一关系，则匹配结果A与匹配结果C同样具有第一关系。在本发明实施例中，会将相互之间具有第一关系的匹配结果形成匹配结果集，例如，匹配结果集为：{匹配结果A，匹配结果B，匹配结果C}，其中，匹配结果B基于匹配结果B生成，匹配结果C基于匹配结果B生成。若存在匹配结果没有与其具有第一关系的匹配结果，则该匹配结果单独形成一个匹配结果集，例如匹配结果集可以为：{匹配结果D}，因此，每个匹配结果集包括一个或多个匹配结果。需要知道的是，本发明实施例中的第一关系以及匹配结果集是为了便于描述及说明而定义的，不应对本发明的范围造成限定。

接下来，执行步骤S03，基于预设的评分机制，在每轮规则匹配后匹配到的规则中分别确定目标规则，基于目标规则，生成与文本信息对应的语义表达式。

具体地，若第j轮规则匹配后，所有的匹配文本信息均没有匹配到对应的规则，则可以将第j-1轮规则匹配到的匹配结果中得分最高的一个或者多个匹配结果(可以是位于排序结果队列内的匹配结果)对应的匹配结果集作为目标匹配结果集，然后基于目标匹配结果集确定目标规则集，具体为：将每个目标匹配结果集内的每个匹配结果对应的规则作为一个目标规则集，每个目标规则集包括一个或多个目标规则，然后根据目标规则生成与文本信息对应的语义表达式，以实现下一步的图查询流程。

本发明实施例还提供一种规则匹配装置，该规则匹配装置用于实现本发明实施例中知识问答模块的功能，规则匹配装置包括：

匹配模块，用于使用匹配文本信息，在规则库中进行迭代规则匹配，每轮规则匹配用于在规则库中匹配到规则，每个规则配置有对应的第一通配符；迭代规则匹配包括：若第i轮规则匹配得到的匹配结果满足预设条件，则在第i轮规则匹配所匹配到的规则中选取至少一个第一规则，将对应的匹配文本信息中与每个第一规则匹配成功的部分文本信息替换为与第一规则对应的第一通配符，以生成第i+1轮规则匹配所需的匹配文本信息；若第i轮规则匹配得到的匹配结果不满足预设条件，则停止迭代，其中，i为大于或等于1的自然数；及

可选地，规则匹配装置还包括文本处理模块，用于执行以下步骤：

获取文本信息；

对文本信息进行分词处理，得到多个分词；

对多个分词中的至少部分分词进行词性标注处理，得到至少部分分词的词性信息；

对进行词性标注处理后的文本信息进行实体连接处理，将多个分词中为实体的分词以对应的通配符替代，以得到第一轮规则匹配所需的匹配文本信息。

可选地，每个规则配置有对应的元数据信息，元数据信息包括第一通配符，元数据信息还包括文本信息、词性通配符及属性信息中的一种或者多种。

可选地，匹配模块具体被配置为执行以下步骤：

根据预设的评分机制，对第i轮规则匹配所得到的匹配结果中的每个匹配结果进行评分，并根据评分结果对第i轮规则匹配所得到的每个匹配结果进行排序，选取排名小于或等于M的匹配结果对应的规则作为第一规则，M为大于等于1的自然数。

可选地，第i次迭代匹配到的匹配结果的数量大于或等于1时，确定第i次迭代匹配到的匹配结果满足预设条件。

关于规则匹配装置其它的实施例可参见上文规则匹配方法的对应内容，为避免重复，在此不再一一赘述。

本发明实施例还提供一种存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行本发明任一实施例中的规则匹配方法，为避免重复，此处不一一赘述。或者，该计算机程序被处理器执行时实现实施例中规则匹配装置中各模块/单元的功能，为避免重复，此处不一一赘述。

请参阅附图6，本发明实施例提供了一种电子设备50，该实施例的电子设备50包括：处理器51、存储器52以及存储在存储器52中并可在处理器51上运行的计算机程序53，该计算机程序53被处理器51执行时实现实施例中的经纬度校验方法，为避免重复，此处不一一赘述。或者，该计算机程序被处理器51执行时实现实施例中规则匹配装置中各模型/单元的功能，为避免重复，此处不一一赘述。

电子设备50可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。电子设备50可包括但不仅限于处理器51、存储器52。本领域技术人员可以理解，图6仅仅是电子设备50的示例，并不构成对电子设备50的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如电子设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器51可以是中央处理单元(Central Processing Unit，CPU)，还可以是其它通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable GateArray，FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器52可以是电子设备50的内部存储单元，例如电子设备50的硬盘或内存。存储器52也可以是电子设备50的外部存储设备，例如电子设备50上配备的插接式硬盘，智能存储卡(SmartMedia Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器52还可以既包括电子设备50的内部存储单元也包括外部存储设备。存储器52用于存储计算机程序以及电子设备所需的其它程序和数据。存储器52还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机，服务器，或者网络装置等)或处理器(Processor)执行本发明各个实施例方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种规则匹配方法，其特征在于，包括：

2.如权利要求1所述的规则匹配方法，其特征在于，在所述使用所述匹配文本信息，在规则库中进行迭代规则匹配之前，所述方法还包括：

获取文本信息；

对所述文本信息进行分词处理，得到多个分词；

3.如权利要求2所述的规则匹配方法，其特征在于，每个规则配置有对应的元数据信息，所述元数据信息包括所述第一通配符，所述元数据信息还包括还包括文本信息、词性通配符及属性信息中的一种或者多种。

4.如权利要求3所述的规则匹配方法，其特征在于，使用所述匹配文本信息，在所述规则库中匹配到的规则与所述匹配文本信息之间满足以下条件：

5.如权利要求1所述的规则匹配方法，其特征在于，所述若第i轮规则匹配得到的匹配结果满足预设条件，则在第i轮规则所匹配到的规则中选取至少一个第一规则，包括：

6.如权利要求1所述的规则匹配方法，其特征在于，所述第i轮规则匹配的匹配结果满足预设条件，包括：所述第i轮规则匹配所匹配到的匹配结果的数量大于或等于1。

7.如权利要求1所述的规则匹配方法，其特征在于，在所述规则库中进行迭代规则匹配通过最优化搜索算法或动态规划算法或启发式搜索算法实现。

8.一种规则匹配装置，其特征在于，包括：

匹配模块，用于在规则库中进行迭代规则匹配，每轮规则匹配用于在所述规则库中匹配到规则，每个规则配置有对应的第一通配符；所述迭代规则匹配包括：若第i轮规则匹配得到的匹配结果满足预设条件，则在第i轮规则匹配所匹配到的规则中选取至少一个第一规则，将对应的匹配文本信息中与每个所述第一规则匹配成功的部分文本信息替换为与所述第一规则对应的第一通配符，以生成第i+1轮规则匹配所需的匹配文本信息；若第i轮规则匹配得到的匹配结果不满足预设条件，则停止迭代，其中，i为大于或等于1的自然数；及

9.一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行1至7任意一项所述的方法。

10.一种电子设备，包括存储器和处理器，所述存储器用于存储包括程序指令的信息，所述处理器用于控制程序指令的执行，其特征在于：所述程序指令被处理器加载并执行时实现权利要求1至7任意一项所述的方法。