CN109558479A - 一种规则匹配方法、装置、设备及存储介质 - Google Patents

一种规则匹配方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109558479A
CN109558479A CN201811446858.5A CN201811446858A CN109558479A CN 109558479 A CN109558479 A CN 109558479A CN 201811446858 A CN201811446858 A CN 201811446858A CN 109558479 A CN109558479 A CN 109558479A
Authority
CN
China
Prior art keywords
rule
user instruction
instruction text
matched
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811446858.5A
Other languages
English (en)
Other versions
CN109558479B (zh
Inventor
孟振南
胡晓慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen China Investment Co Ltd
Mobvoi Innovation Technology Co Ltd
Original Assignee
Beijing Yufanzhi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yufanzhi Information Technology Co ltd filed Critical Beijing Yufanzhi Information Technology Co ltd
Priority to CN201811446858.5A priority Critical patent/CN109558479B/zh
Publication of CN109558479A publication Critical patent/CN109558479A/zh
Application granted granted Critical
Publication of CN109558479B publication Critical patent/CN109558479B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例公开了一种规则匹配方法、装置、设备及存储介质,其中,该方法包括:确定用户指令文本;基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体;将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本;对所述新用户指令文本进行规则匹配,得到与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的规则。本发明实施例提供的技术方案可以准确识别用户指令文本中的实体,提高识别准确率,可以覆盖多种语言场景,满足识别多种类型的文本的需求。

Description

一种规则匹配方法、装置、设备及存储介质
技术领域
本发明实施例涉及意图识别技术,特别是涉及一种规则匹配方法、装置、设备及存储介质。
背景技术
近年随着语音识别、人机对话、自然语言处理等技术迅猛发展。用户意图识别是对这一类助手型对话产品来说极为重要,且又极具挑战的一项任务。用户意图识别是从用户的输入中理解用户的需求。
其中,意图识别方法可以是基于规则进行匹配,从而识别语音槽,进而识别用户意图。但是发明人在具体实施过程中,发现现有技术中存在如下问题:现有技术中的匹配规则方法并不能对用户指令文本中的实体进行准确识别,降低了识别的准确率。并且现有技术中的规则匹配过程中,通过用户指令文本中的实体与规则进行匹配,由于规则有限,很难覆盖较多的场景。
发明内容
本发明实施例提供了一种规则匹配方法、装置、设备及存储介质,可以准确识别用户指令文本中的实体,提高识别准确率,可以覆盖多种语言场景,满足识别多种类型的文本的需求。
本发明实施例主要提供如下技术方案:
第一方面,本发明实施例提供了一种规则匹配方法,包括:
确定用户指令文本;
基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体;
将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本;
对所述新用户指令文本进行规则匹配,得到与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的规则。
第二方面,本发明实施例还提供一种规则匹配装置,包括:
第一确定模块,用于确定用户指令文本;
第二确定模块,用于基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体;
替换模块,用于将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本;
匹配模块,用于对所述新用户指令文本进行规则匹配,得到与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的规则。
第三方面,本发明实施例还提供了一种电子设备,包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;其中,
所述处理器、存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行本发明实施例提供的一种规则匹配方法。
第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行本发明实施例提供的一种规则匹配方法。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明实施例提供的技术方案,通过知识图谱对用户指令文本进行实体匹配,得到匹配的目标实体,可以准确识别用户指令文本中的实体,可以消除用户指令文本中某些词的含义,从而进行准确进行规则匹配,从而提高识别准确率;通过将目标实体对应的语义槽替换该目标实体,得到新用户指令文本,对新用户指令文本进行规则匹配,得到匹配的目标规则,作为用户指令文本匹配的目标规则,可以设置较少的规则就可以覆盖多种语言场景,满足识别多种类型的文本的需求。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的一种规则匹配方法流程图;
图2是本发明实施例提供的一种规则匹配方法流程图;
图3是本发明实施例提供的一种规则匹配方法流程图;
图4是本发明实施例提供的一种规则匹配方法流程图;
图5a是本发明实施例提供的一种规则匹配方法流程图;
图5b是本发明实施例提供的一种规则匹配方法主要流程图;
图6是本发明实施例提供的一种规则匹配装置结构框图;
图7是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是本发明实施例提供的一种规则匹配方法流程图,所述方法由规则匹配装置来执行,所述装置可以由软件和/或硬件来实现,所述装置可以配置在智能手机、平板电脑等设备中,所述方法可以应用于对意图和/或语义槽进行识别的场景中,具体的,可以应用于人机对话的场景中。
如图1所示,本发明实施例提供的技术方案包括:
S110:确定用户指令文本。
在本发明实施例中,可以直接获取用户输入的文本,即用户指令文本。或者也可以是获取用户输入的语音会话,将语音会话转换成文本。
S120:基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体。
在本发明实施例中,知识图谱又称为科学知识图谱,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源极其载体,挖掘、分析、构建、绘制和显示知识它们之间的相互联系。
知识图谱主要的目标是用来描述真实世界中存在的各种实体和概念,以及它们之间的关联关系。知识图谱可被看作是一张巨大的图,图中的节点表示实体或概念,而图中的边则由属性或关系构成。
在本发明实施例中,知识图谱中包含实体以及属性或者关系。先将用户指令文本与知识图谱中进行实体匹配,得到匹配的目标实体。
由此,基于知识图谱对用户指令文本进行实体匹配,得到匹配的实体,可以准确对用户指令文本进行准确划分,可以准确识别用户指令文本中的实体,可以消除用户指令文本中某些词的含义,从而进行准确进行规则匹配,从而提高识别准确率。
S130:将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本。
在本发明实施例中,语义槽即为从用户文本中提取的关键字,如“我要去上海”,语义槽就是“地址”,取值为“上海”。其中,知识图谱中的每个实体可以设置对应的语义槽,实体与语义槽具有对应关系。
本发明实施例中,将知识图谱中与用户指令文本匹配的实体作为目标实体,将目标实体对应的语义槽替换目标实体,得到新用户指令文本。例如,用户指令文本是“我要去上海”,知识图谱中与“我要去上海”匹配的目标实体是“上海”。而“上海”对应的语义槽“地址”,则把“上海”替换成“地址”,因此,得到新用户指令是“我要去地址”。
S140:对所述新用户指令文本进行规则匹配,得到与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的目标规则。
在本发明实施例中,具体可以是将新用户指令文本与预设的规则进行匹配,得到与新用户指令文本匹配的目标规则,该目标规则作为与用户指令文本匹配的目标规则。
其中,在新用户指令文本与预设的规则进行匹配时,可以判断新用户指令文本是否符合规则中的匹配条件,若目标规则符合匹配条件,则目标规则与新用户指令文本匹配。通过匹配的目标规则,可以识别用户指令文本中的语义槽和用户指令文本对应的意图,通过该意图以及识别的语义槽对应的实体,可以将反馈结果提供给用户。
由此,本发明实施例通过将语义槽替换对应的实体,得到新用户指令文本,将新用户指令文本进行规则匹配,可以设置较少的规则就可以覆盖多种语言场景,满足识别多种类型的文本的需求。
本发明实施例提供的技术方案,通过知识图谱对用户指令文本进行实体匹配,得到匹配的目标实体,可以准确识别用户指令文本中的实体,可以消除用户指令文本中某些词的含义,从而进行准确进行规则匹配,从而提高识别准确率;通过将目标实体对应的语义槽替换该目标实体,得到新用户指令文本,对新用户指令文本进行规则匹配,得到匹配的目标规则,作为用户指令文本匹配的目标规则,可以设置较少的规则就可以覆盖多种语言场景,满足识别多种类型的文本的需求。
图2是本发明实施例提供的一种规则匹配方法流程图,如图2所示,本发明实施例提供的技术方案包括:
S210:对每个正则表达式扩展下述的至少一项,得到多个规则:
设置语义槽的位置和名称;设置正则表达式的意图或者设置所述正则表达式的优先级;设置是否使用序列标注模型;其中,所述序列标注模型,用于识别语义槽;所述正则表达式是否被复用,以及设置被复用的正则表达式的标识。
其中,正则表达式的扩展语法可以是如下的形式:
${slot}:设置了语义槽的位置及名字。
${rule_name}:规则复用,可以指定被复用的规则名字。
=>:结果标志符,结果标志符的左侧是匹配指令的表达式,结果标志符的右侧是该表达式对应的结果,如意图结果,语义槽标签结果,优先级等。
Intent:在结果标识符右侧,设置了正则表达式的意图。
Priority:在结果标识符右侧,指定了正则表达式的优先级。
use_crf_tag:在结果标识符右侧,设置是否使用序列标注模型。
以查询电影的规则为例,该规则可以是如下形式:^.{0,3}{movie}还有票吗?=>intent:other;use_crf_tag:true.
该规则中,通过“${movie}”这种固定格式来指定语义槽的在正则表达式中的位置,然后通过知识图谱库中对应实体的查询,来对用户指令文本中相应位置的词进行标签;“=>”是结果标志符;“intent”指定了该规则所对应的意图结果;“use_crf_tag”是否使用序列标注模型的标志符,若为true则是使用序列标注模型,以序列标注的模型的结果为准,若为false则不使用序列标注模型,以规则匹配的结果为准。
其中,在正则表达式中,可以设置语义槽的位置和名称,从而可以从规则中实现对语义槽的设置,可以满足识别多种语义槽类型的需求。
其中,设置正则表达式的优先级,即是设置规则的优先级。当与用户指令文本匹配的规则存在多个时,可以根据优先级选择最优的规则,从而提高语义槽和意图识别的准确率。
其中,在正则表达式中设置是否使用序列标注模型,其中,序列标注模型可以用于识别语义槽。当正则表达式中,没有对语义槽进行设置时,正则表达式可以设置使用序列标注模型。
其中,在正则表达式中可以设置正则表达式是否被复用,若是,该正则表达式可以被复用,当正则表达式被复用时,可以设置被复用的正则表达式的标识。当需要添加一些新的规则时,原来的有些规则是可以复用的。因此,可以复用原来的有些规则,并在这些规则中添加其他的约束条件,得到新的规则。由此,通过在正则表达式中设置是否被复用,可以提高可复用性,提高了使用效率。
其中,在正则表达式中设置意图,当用户指令文本与规则匹配时,若得到匹配的规则,即可以识别意图,从而提高意图的识别效率。
其中,若知识图谱中没有包含目标实体,将所述目标实体对应的语义槽添加到规则中。
在本发明实施例中,若知识图谱中没有目标实体,则当用户指令文本中出现该目标实体时,则基于知识图谱对用户指令文本匹配时,知识图谱中匹配不到与用户指令文本匹配到实体,则不能确定与该目标实体对应的语义槽,则从而不能对用户指令文本进行规则匹配,不能识别出用户指令文本中的语义槽。因此,可以将目标实体对应的语义槽添加到规则中,可以直接对用户指令文本进行规则匹配,从而识别出语义槽。
例如,以一条指定语义槽的规则为例,该规则可以是如下形式:^我要看李茶的姑妈$=>intent:other;use_crf_tag:false,priority:5;movie:李茶的姑妈
该规则中,通过“李茶的姑妈”指定相应的语义槽movie,定义较高的优先级5,并将“use_crf_tag”设置为false,即为不使用序列标注模型,可以准确将其识别出来。也就是说若知识图谱中没有“李茶的姑妈”这个实体,则不能对包含有“李茶的姑妈”的用户指令文本进行实体匹配,则不能实现语义槽的识别,则在规则中添加知识图谱中没有的目标实体对应的语义槽,可以识别特殊的用户指令文本。
S220:确定用户指令文本。
S230:基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体;
S240:将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本;
S250:对所述新用户指令文本进行规则匹配,得到与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的目标规则。
图3是本发明实施例提供的一种规则匹配方法流程图,本发明实施例中,可选的,所述对所述新用户指令文本进行规则匹配,包括:
对所述新用户指令文本基于有限状态机的匹配方法进行规则匹配。
如图3所示,本发明实施例提供的技术方案包括:
S310:确定用户指令文本。
S320:基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体。
S330:将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本;
S340:对所述新用户指令文本基于有限状态机的匹配方法进行规则匹配。
在本发明实施例中,有限状态机(finite-state machine,FSM)又称有限状态自动机,简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。当通过有限状态机的匹配方法进行规则匹配时,匹配时,可以将是否匹配上的条件通过状态进行表示,从而可以避免规则匹配时的重复匹配问题,从而提高规则匹配的效率,从而可以提高设备系统的运行效率。
S350:若匹配到的规则存在多个,选择优先级最高的规则作为与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的规则。
在本发明实施例中,若匹配到的规则存在多个,选择优先级最高的规则作为与用户指令文本匹配的规则,可以提高指令文本中语义槽识别的正确率以及提高意图的识别正确率,并且可以提高识别效率。其中,多个规则的优先级可以是设定优先级,或者也可以是通过其他方法计算出的优先级。
图4是本发明实施例提供的一种规则匹配方法流程图,在本实施例中,可选的,所述得到与所述新用户指令文本匹配的目标规则,可以包括:
若匹配到的规则存在多个,且匹配到的多个规则的设定优先级相同,将设定优先级相同的规则输入到预先训练的排序模型中,得到优先级最高的规则,并作为与所述新用户指令文本匹配的目标规则。
如图4所示,本发明实施例提供的技术方案包括:
S410:确定用户指令文本。
S420:基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体。
S430:将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本。
S440:对所述新用户指令文本基于有限状态机的匹配方法进行规则匹配。
S450:若匹配到的规则存在多个,且匹配到的多个规则的设定优先级相同,将设定优先级相同的规则输入到预先训练的排序模型中,得到优先级最高的规则,并作为与所述新用户指令文本匹配的目标规则,将目标规则作为与用户指令文本匹配的规则。
在本发明实施例中,排序模型可以用于识别规则的优先级。其中,可以对排序模型进行训练,得到预先训练的排序模型。其中,排序模型训练的具体过程可以是,将规则样本为排序模型的输入,以规则样本的优先级为排序模型的输出,对排序模型进行训练,得到预先训练的排序模型。
其中,若匹配到的规则存在多个,且匹配到的多个规则的设定优先级相同,可以将设定优先级相同的规则输入到预先训练的排序模型中,得到优先级最高的规则,作为与用户指令文本匹配的规则。其中,该设定优先级为规则中规定的优先级,该优先级可以设置在正则表达式中。
由此,通过当多个匹配的规则的设定优先级相同时,将设定优先级相同的规则输入到排序模型中,选择优先级最高的规则作为与用户指令文本匹配的规则,可以提高指令文本中语义槽识别的正确率以及提高意图的识别正确率,并且可以提高识别效率,可以提高自然语言理解(Natural Language Understanding,NLU)系统的整体的召回率。
其中,在本发明实施例另外一个实施方式中,所述得到与所述新用户指令文本匹配的目标规则,还可以包括:若匹配到的规则存在多个,且多个规则中存在未设定优先级的个别规则,将所述个别规则输入到预先训练的排序模型中,确定所述个别规则的优先级;
将所述个别规则与其他规则进行优先级比较,确定优先级最高的规则,并作为与所述新用户指令文本匹配的目标规则,其中,所述其他规则为所述多个规则中除所述个别规则之外的规则。
例如,匹配的规则存在3个,其中两个的设定优先级分别为5和4,另外一个匹配的规则并没有设定优先级,则将没有设定优先级的规则输入到排序模型中,得到该规则的优先级,例如,为6。将该规则的优先级与另外两个设定优先级的规则进行优先级比较,确定该规则的优先级最高,则将该规则作为与新用户指令文本匹配的目标规则。
由此,通过选择优先级最高的规则作为与用户指令文本匹配的规则,可以提高指令文本中语义槽识别的正确率以及提高意图的识别正确率,并且可以提高识别效率,可以提高NLU系统的整体的召回率。
在上述实施例的基础上,本发明任意实施例提供的技术方案还可以包括:基于所述目标规则,识别所述用户指令文本中的语义槽以及所述用户指令文本对应的意图;基于所述意图以及识别的语义槽对应的实体,确定提供给用户的反馈结果。
其中,目标规则中设置有语义槽和意图,若目标规则与用户指令文本匹配,通过目标规则中的设置内容可以识别用户指令文本中的语义槽以及用户指令文本对应的意图。在本发明任意实施例中,在规则匹配的过程中,用户指令文本中实体对应的语义槽可以更新,将语义槽替换实体,得到新用户指令文本,当新用户指令文本匹配到规则时,可以确定实体对应的语义槽是合适的。若新用户指令文本没有匹配到规则,可以更换实体对应的语义槽,重新进行规则匹配,直至匹配到规则。
其中,根据基于意图以及识别的语义槽对应的实体,可以确定提供给用户的反馈结果。例如,用户指令文本是“我要去上海”,基于知识图谱匹配到的实体是“上海”,识别到的语义槽是“地址”,意图是查询车票。则根据“查询车票”的意图以及“地址”对应的实体(上海),查询到上海的车票,提供用户反馈结果。由此,通过匹配到的规则识别语义槽和用户意图,可以提高识别效率。
图5a是本发明实施例提供的一种规则匹配方法流程图,如图5a所示,本发明实施例提供的技术方案包括:
S510:构建知识图谱来描述实体及其属性。
S520:确定知识图谱中的实体对应的语义槽。
S530:设置用户指令文本的匹配规则。其中,规则的设置方法可以参考上述实施例,不再累述。
S540:训练一个规则排序的排序模型,用于计算规则匹配的优先顺序。
S550:对需要预测的用户指令文本,基于知识图谱进行实体匹配,将匹配到的实体替换为其对应的语义槽。
S560:将替换后的用户指令文本,使用基于有限状态机的匹配方法,进行规则匹配。
S570:若匹配到多条规则,则选择优先级最高的规则;若多条规则设置优先级相同或者未指定优先级,则根据规则排序模型计算得到最先匹配的规则。
本发明实施例提供的技术方案的主要过程可以参考图5b。
图6是本发明实施例提供的一种规则匹配装置结构示意图,如图6所示,本发明实施例提供的第一确定模块610、第二确定模块620、替换模块630和匹配模块640。
其中,第一确定模块610,用于确定用户指令文本;
第二确定模块620,用于基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体;
替换模块630,用于将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本;
匹配模块640,用于对所述新用户指令文本进行规则匹配,得到与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的规则。
可选的,所述装置还包括:扩展模块,用于对每个正则表达式扩展下述的至少一项,得到多个规则:
设置语义槽的位置和名称;
设置正则表达式的意图或者设置所述正则表达式的优先级;
设置是否使用序列标注模型;其中,所述序列标注模型,用于识别语义槽;
所述正则表达式是否被复用,以及设置被复用的正则表达式的标识。
所述扩展模块,还用于若知识图谱中没有包含目标实体,将所述目标实体对应的语义槽添加到规则中。
可选的,所述对所述新用户指令文本进行规则匹配,包括:
对所述新用户指令文本基于有限状态机的匹配方法进行规则匹配。
可选的,所述得到与所述新用户指令文本匹配的目标规则,包括:
若匹配到的规则存在多个,选择优先级最高的规则作为与所述新用户指令文本匹配的目标规则。
可选的,所述得到与所述新用户指令文本匹配的目标规则,包括:
若匹配到的规则存在多个,且匹配到的多个规则的设定优先级相同或者多个规则中存在未设定优先级的个别规则;
将设定优先级相同的规则输入到预先训练的排序模型中,得到优先级最高的规则,并作为与所述新用户指令文本匹配的目标规则;或者,
将所述个别规则输入到预先训练的排序模型中,确定所述个别规则的优先级;
将所述个别规则与其他规则进行优先级比较,确定优先级最高的规则,并作为与所述新用户指令文本匹配的目标规则,其中,所述其他规则为所述多个规则中除所述个别规则之外的规则。
可选的,所述装置还包括反馈结果提供模块,用于:
基于所述目标规则,识别所述用户指令文本中的语义槽以及所述用户指令文本对应的意图;
基于所述意图以及识别的语义槽对应的实体,确定提供给用户的反馈结果。
由于本实施例所介绍的规则匹配装置为可以执行本发明实施例中的规则匹配方法的装置,故而基于本发明实施例中所介绍的规则匹配方法,本领域所属技术人员能够了解本实施例的规则匹配装置的具体实施方式以及其各种变化形式,所以在此对于该规则匹配装置如何实现本发明实施例中的多个规则匹配方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中规则匹配方法所采用的装置,都属于本申请所欲保护的范围。
本发明实施例提供了一种电子设备,如图7所示,包括:至少一个处理器(processor)41;以及与所述处理器41连接的至少一个存储器(memory)42、总线43;其中,
所述处理器41、存储器42通过所述总线43完成相互间的通信;
所述处理器41用于调用所述存储器42中的程序指令,以执行上述方法实施例中的步骤,即:
确定用户指令文本;
基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体;
将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本;
对所述新用户指令文本进行规则匹配,得到与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的规则。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,即:
确定用户指令文本;
基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体;
将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本;
对所述新用户指令文本进行规则匹配,得到与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的规则。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种规则匹配方法,其特征在于,包括:
确定用户指令文本;
基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体;
将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本;
对所述新用户指令文本进行规则匹配,得到与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的规则。
2.根据权利要求1所述的方法,其特征在于,还包括:
对每个正则表达式扩展下述的至少一项,得到多个规则:
设置语义槽的位置和名称;
设置正则表达式的意图或者设置所述正则表达式的优先级;
设置是否使用序列标注模型;其中,所述序列标注模型,用于识别语义槽;
所述正则表达式是否被复用,以及设置被复用的正则表达式的标识。
3.根据权利要求2所述的方法,其特征在于,还包括:
若知识图谱中没有包含目标实体,将所述目标实体对应的语义槽添加到规则中。
4.根据权利要求1所述的方法,其特征在于,所述对所述新用户指令文本进行规则匹配,包括:
对所述新用户指令文本基于有限状态机的匹配方法进行规则匹配。
5.根据权利要求1所述的方法,其特征在于,所述得到与所述新用户指令文本匹配的目标规则,包括:
若匹配到的规则存在多个,选择优先级最高的规则作为与所述新用户指令文本匹配的目标规则。
6.根据权利要求1所述的方法,其特征在于,所述得到与所述新用户指令文本匹配的目标规则,包括:
若匹配到的规则存在多个,且匹配到的多个规则的设定优先级相同或者多个规则中存在未设定优先级的个别规则;
将设定优先级相同的规则输入到预先训练的排序模型中,得到优先级最高的规则,并作为与所述新用户指令文本匹配的目标规则;或者,
将所述个别规则输入到预先训练的排序模型中,确定所述个别规则的优先级;
将所述个别规则与其他规则进行优先级比较,确定优先级最高的规则,并作为与所述新用户指令文本匹配的目标规则,其中,所述其他规则为所述多个规则中除所述个别规则之外的规则。
7.根据权利要求1所述的方法,其特征在于,还包括:
基于所述目标规则,识别所述用户指令文本中的语义槽以及所述用户指令文本对应的意图;
基于所述意图以及识别的语义槽对应的实体,确定提供给用户的反馈结果。
8.一种规则匹配装置,其特征在于,包括:
第一确定模块,用于确定用户指令文本;
第二确定模块,用于基于知识图谱对所述用户指令文本进行实体匹配,确定匹配的目标实体;
替换模块,用于将所述目标实体对应的语义槽替换所述目标实体,得到新用户指令文本;
匹配模块,用于对所述新用户指令文本进行规则匹配,得到与所述新用户指令文本匹配的目标规则,并作为与所述用户指令文本匹配的规则。
9.一种电子设备,其特征在于,包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;其中,
所述处理器、存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行权利要求1-7中任一项所述的一种规则匹配方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行权利要求1-7中任一项所述的一种规则匹配方法。
CN201811446858.5A 2018-11-29 2018-11-29 一种规则匹配方法、装置、设备及存储介质 Active CN109558479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811446858.5A CN109558479B (zh) 2018-11-29 2018-11-29 一种规则匹配方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811446858.5A CN109558479B (zh) 2018-11-29 2018-11-29 一种规则匹配方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109558479A true CN109558479A (zh) 2019-04-02
CN109558479B CN109558479B (zh) 2022-12-02

Family

ID=65868026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811446858.5A Active CN109558479B (zh) 2018-11-29 2018-11-29 一种规则匹配方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109558479B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110246496A (zh) * 2019-07-01 2019-09-17 珠海格力电器股份有限公司 语音识别方法、系统、计算机设备及储存介质
CN110609885A (zh) * 2019-09-17 2019-12-24 出门问问信息科技有限公司 一种对话处理方法、设备及计算机可读存储介质
CN111046653A (zh) * 2019-11-14 2020-04-21 深圳市优必选科技股份有限公司 一种语句识别方法、语句识别装置及智能设备
CN111046654A (zh) * 2019-11-14 2020-04-21 深圳市优必选科技股份有限公司 一种语句识别方法、语句识别装置及智能设备
CN111581399A (zh) * 2020-06-10 2020-08-25 北京海致星图科技有限公司 一种知识图谱指标规则动态计算方法、系统、介质及设备
CN111858950A (zh) * 2019-04-30 2020-10-30 广东小天才科技有限公司 一种基于知识图谱扩充正则句式的方法和装置
CN111858949A (zh) * 2019-04-30 2020-10-30 广东小天才科技有限公司 基于知识图谱扩充正则表达式的方法和装置、学习设备
CN111859976A (zh) * 2019-04-30 2020-10-30 广东小天才科技有限公司 一种基于知识图谱扩充正则表达式的方法和装置
CN112069267A (zh) * 2019-06-10 2020-12-11 阿里巴巴集团控股有限公司 一种数据处理方法和装置
CN112395872A (zh) * 2019-08-16 2021-02-23 阿里巴巴集团控股有限公司 一种信息处理方法及装置
CN112767933A (zh) * 2020-12-22 2021-05-07 中国公路工程咨询集团有限公司 公路养护管理系统的语音交互方法、装置、设备及介质
CN113095788A (zh) * 2021-04-22 2021-07-09 北京百度网讯科技有限公司 问题分发方法、装置、电子设备以及存储介质
WO2021180062A1 (zh) * 2020-03-09 2021-09-16 华为技术有限公司 意图识别方法及电子设备
CN113810237A (zh) * 2021-11-16 2021-12-17 北京安博通科技股份有限公司 一种网络设备配置合规性的检查方法
CN114187388A (zh) * 2021-12-10 2022-03-15 铅笔头(深圳)科技有限公司 动画制作方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050240876A1 (en) * 2001-10-31 2005-10-27 Qcorps Residential, Inc. System and method for generating XSL transformation documents
CN102779114A (zh) * 2011-05-12 2012-11-14 商业对象软件有限公司 利用自动规则生成的非结构化数据支持
CN103593410A (zh) * 2013-10-22 2014-02-19 上海交通大学 通过替换概念性词语进行搜索推荐系统
CN104850554A (zh) * 2014-02-14 2015-08-19 北京搜狗科技发展有限公司 一种搜索方法和系统
CN105095186A (zh) * 2015-07-28 2015-11-25 百度在线网络技术(北京)有限公司 语义解析方法和装置
US20150340024A1 (en) * 2014-05-23 2015-11-26 Google Inc. Language Modeling Using Entities
CN105512105A (zh) * 2015-12-07 2016-04-20 百度在线网络技术(北京)有限公司 语义解析方法和装置
CN106294744A (zh) * 2016-08-11 2017-01-04 上海动云信息科技有限公司 兴趣识别方法及系统
CN107015964A (zh) * 2017-03-22 2017-08-04 北京光年无限科技有限公司 面向智能机器人开发的自定义意图实现方法及装置
CN107515857A (zh) * 2017-08-31 2017-12-26 科大讯飞股份有限公司 基于定制技能的语义理解方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050240876A1 (en) * 2001-10-31 2005-10-27 Qcorps Residential, Inc. System and method for generating XSL transformation documents
CN102779114A (zh) * 2011-05-12 2012-11-14 商业对象软件有限公司 利用自动规则生成的非结构化数据支持
CN103593410A (zh) * 2013-10-22 2014-02-19 上海交通大学 通过替换概念性词语进行搜索推荐系统
CN104850554A (zh) * 2014-02-14 2015-08-19 北京搜狗科技发展有限公司 一种搜索方法和系统
US20150340024A1 (en) * 2014-05-23 2015-11-26 Google Inc. Language Modeling Using Entities
CN105095186A (zh) * 2015-07-28 2015-11-25 百度在线网络技术(北京)有限公司 语义解析方法和装置
CN105512105A (zh) * 2015-12-07 2016-04-20 百度在线网络技术(北京)有限公司 语义解析方法和装置
CN106294744A (zh) * 2016-08-11 2017-01-04 上海动云信息科技有限公司 兴趣识别方法及系统
CN107015964A (zh) * 2017-03-22 2017-08-04 北京光年无限科技有限公司 面向智能机器人开发的自定义意图实现方法及装置
CN107515857A (zh) * 2017-08-31 2017-12-26 科大讯飞股份有限公司 基于定制技能的语义理解方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XIAOJUAN ZHANG等: "Identifying user intent through query refinements", 《CHINESE JOURNAL OF LIBRARY AND INFORMATION SCIENCE》 *
王秋月等: "扩展知识图谱上的实体关系检索", 《计算机应用》 *
石刚: "一种基于知识图谱的用户搜索意图挖掘方法的研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858950B (zh) * 2019-04-30 2024-08-16 广东小天才科技有限公司 一种基于知识图谱扩充正则句式的方法和装置
CN111859976B (zh) * 2019-04-30 2024-10-18 广东小天才科技有限公司 一种基于知识图谱扩充正则表达式的方法和装置
CN111858949B (zh) * 2019-04-30 2024-05-14 广东小天才科技有限公司 基于知识图谱扩充正则表达式的方法和装置、学习设备
CN111858950A (zh) * 2019-04-30 2020-10-30 广东小天才科技有限公司 一种基于知识图谱扩充正则句式的方法和装置
CN111858949A (zh) * 2019-04-30 2020-10-30 广东小天才科技有限公司 基于知识图谱扩充正则表达式的方法和装置、学习设备
CN111859976A (zh) * 2019-04-30 2020-10-30 广东小天才科技有限公司 一种基于知识图谱扩充正则表达式的方法和装置
CN112069267A (zh) * 2019-06-10 2020-12-11 阿里巴巴集团控股有限公司 一种数据处理方法和装置
CN110246496A (zh) * 2019-07-01 2019-09-17 珠海格力电器股份有限公司 语音识别方法、系统、计算机设备及储存介质
CN112395872A (zh) * 2019-08-16 2021-02-23 阿里巴巴集团控股有限公司 一种信息处理方法及装置
CN110609885A (zh) * 2019-09-17 2019-12-24 出门问问信息科技有限公司 一种对话处理方法、设备及计算机可读存储介质
CN111046654B (zh) * 2019-11-14 2023-12-29 深圳市优必选科技股份有限公司 一种语句识别方法、语句识别装置及智能设备
CN111046654A (zh) * 2019-11-14 2020-04-21 深圳市优必选科技股份有限公司 一种语句识别方法、语句识别装置及智能设备
CN111046653A (zh) * 2019-11-14 2020-04-21 深圳市优必选科技股份有限公司 一种语句识别方法、语句识别装置及智能设备
CN111046653B (zh) * 2019-11-14 2023-12-29 深圳市优必选科技股份有限公司 一种语句识别方法、语句识别装置及智能设备
WO2021180062A1 (zh) * 2020-03-09 2021-09-16 华为技术有限公司 意图识别方法及电子设备
CN111581399A (zh) * 2020-06-10 2020-08-25 北京海致星图科技有限公司 一种知识图谱指标规则动态计算方法、系统、介质及设备
CN112767933A (zh) * 2020-12-22 2021-05-07 中国公路工程咨询集团有限公司 公路养护管理系统的语音交互方法、装置、设备及介质
CN113095788B (zh) * 2021-04-22 2023-07-11 北京百度网讯科技有限公司 问题分发方法、装置、电子设备以及存储介质
CN113095788A (zh) * 2021-04-22 2021-07-09 北京百度网讯科技有限公司 问题分发方法、装置、电子设备以及存储介质
CN113810237B (zh) * 2021-11-16 2022-02-15 北京安博通科技股份有限公司 一种网络设备配置合规性的检查方法
CN113810237A (zh) * 2021-11-16 2021-12-17 北京安博通科技股份有限公司 一种网络设备配置合规性的检查方法
CN114187388A (zh) * 2021-12-10 2022-03-15 铅笔头(深圳)科技有限公司 动画制作方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109558479B (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
CN109558479B (zh) 一种规则匹配方法、装置、设备及存储介质
US9542477B2 (en) Method of automated discovery of topics relatedness
CN110866091B (zh) 一种数据检索方法及装置
CN109036424A (zh) 语音识别方法、装置、电子设备及计算机可读存储介质
CN107679208A (zh) 一种图片的搜索方法、终端设备及存储介质
CN114610951A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN112579733A (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
CN105161095A (zh) 语音识别语法树的构图方法及装置
CN115982376A (zh) 基于文本、多模数据和知识训练模型的方法和装置
CN110851597A (zh) 一种基于同类实体替换的语句标注的方法及装置
WO2024159917A1 (zh) 数据处理方法、装置及设备
CN111488737B (zh) 文本识别方法、装置及设备
CN110008807B (zh) 一种合同内容识别模型的训练方法、装置及设备
CN109635125B (zh) 一种词汇图谱搭建方法及电子设备
CN113569007B (zh) 一种处理知识服务资源的方法、装置及存储介质
CN110795547A (zh) 文本识别方法和相关产品
CN111274812B (zh) 一种人物关系识别方法、设备及存储介质
CN115878793B (zh) 多标签文档分类方法、装置、电子设备及介质
CN112632962B (zh) 人机交互系统中实现自然语言理解方法和装置
CN115759048A (zh) 一种剧本文本处理方法及装置
CN116127154A (zh) 知识标签推荐方法、装置、电子设备及存储介质
CN111723177B (zh) 信息提取模型的建模方法、装置及电子设备
CN114218431A (zh) 视频搜索方法、装置、电子设备以及存储介质
CN114385779A (zh) 一种应急调度指令执行方法、装置及电子设备
CN113434695A (zh) 金融事件抽取方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220524

Address after: 210038 8th floor, building D11, Hongfeng science and Technology Park, Nanjing Economic and Technological Development Zone, Jiangsu Province

Applicant after: New Technology Co.,Ltd.

Applicant after: VOLKSWAGEN (CHINA) INVESTMENT Co.,Ltd.

Address before: 100080 Room 501, 5th floor, NO.67, North Fourth Ring Road West, Haidian District, Beijing

Applicant before: Beijing Yufanzhi Information Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant