CN110543633A - 语句意图识别方法、装置 - Google Patents

语句意图识别方法、装置 Download PDF

Info

Publication number
CN110543633A
CN110543633A CN201910810569.7A CN201910810569A CN110543633A CN 110543633 A CN110543633 A CN 110543633A CN 201910810569 A CN201910810569 A CN 201910810569A CN 110543633 A CN110543633 A CN 110543633A
Authority
CN
China
Prior art keywords
intention
target
sentence
words
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910810569.7A
Other languages
English (en)
Other versions
CN110543633B (zh
Inventor
王自昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910810569.7A priority Critical patent/CN110543633B/zh
Publication of CN110543633A publication Critical patent/CN110543633A/zh
Application granted granted Critical
Publication of CN110543633B publication Critical patent/CN110543633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本申请涉及自然语言处理技术领域,揭示了一种语句意图识别方法、装置。该识别方法包括:获取目标语句;将所述目标语句分发给多个垂直领域的意图解析节点;对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,以得到所述目标语句在多个垂直领域中的意图解析结果;根据预设的判读规则,判读所述目标语句在多个垂直领域的意图解析节点中的意图解析结果,以识别出所述目标语句的目标意图。本申请实施例的技术方案可以缩短语句意图识别所需的耗时,提高语句意图识别效率。

Description

语句意图识别方法、装置
技术领域
本申请涉及自然语言处理技术领域,具体而言,涉及一种语句意图识别方法、装置。
背景技术
在语句意图的识别场景中,例如在手机语音助手中的云端自然语句意图识别场景,通常是基于由多个意图领域对应语法句式而构建的单语言识别模型来完成对自然语句意图的识别。但是,如何能够提高语句意图识别的效率是亟待解决的技术问题。
发明内容
本申请的实施例提供了一种语句意图识别方法、装置,进而至少在一定程度上提高语句意图识别的效率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种语句意图识别方法,包括:获取目标语句;将所述目标语句分发给多个垂直领域的意图解析节点;对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,以得到所述目标语句在多个垂直领域中的意图解析结果;根据预设的判读规则,判读所述目标语句在多个垂直领域的意图解析节点中的意图解析结果,以识别出所述目标语句的目标意图。
根据本申请实施例的一个方面,提供了一种语句意图识别装置,包括:获取单元,被用于获取目标语句;分发单元,被用于将所述目标语句分发给多个垂直领域的意图解析节点;解析单元,被用于对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,以得到所述目标语句在多个垂直领域中的意图解析结果;判读单元,被用于根据预设的判读规则,判读所述目标语句在多个垂直领域的意图解析节点中的意图解析结果,以识别出所述目标语句的目标意图。
在本申请的一些实施例中,基于前述方案,所述获取单元配置为:获取待意图识别的语句;检测所述待意图识别的语句中是否存在预先设定的非正常的字符和/或字符组合;删改所述待意图识别的语句中存在的非正常的字符和/或字符组合,得到目标语句。
在本申请的一些实施例中,基于前述方案,所述解析单元包括:第一命名实体识别单元,被用于基于多个垂直领域的意图解析节点中的第一字词库,对在多个垂直领域的意图解析节点中的目标语句进行命名实体识别,以确定多个垂直领域的意图解析节点中的目标语句的实体关键字词;第一确定单元,被用于将多个垂直领域的意图解析节点中的目标语句的实体关键字词确定为槽位字词和/或意图字词;生成单元,被用于基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在本申请的一些实施例中,基于前述方案,所述解析单元包括:第一命名实体识别单元,被用于基于多个垂直领域的意图解析节点中的第一字词库,对在多个垂直领域的意图解析节点中的目标语句进行命名实体识别,以确定多个垂直领域的意图解析节点中的目标语句的实体关键字词;映射单元,被用于对所述实体关键字词进行实体映射,以得到所述实体关键字词的映射关键字词;第二确定单元,被用于将多个垂直领域的意图解析节点中的目标语句的实体关键字词以及对应的映射关键字词确定为槽位字词和/或意图字词;生成单元,被用于基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在本申请的一些实施例中,基于前述方案,所述多个垂直领域的意图解析节点包括多个子意图解析节点,所述解析单元包括:第一分发单元,被用于将多个垂直领域的意图解析节点中的目标语句分发给多个垂直领域的意图解析节点中的多个子意图解析节点;第二命名实体识别单元,被用于基于多个子意图解析节点中的第二字词库,对在多个子意图解析节点中的目标语句进行命名实体识别,以确定多个子意图解析节点中的目标语句的实体关键字词;第三确定单元,被用于将多个子意图解析节点中的目标语句的实体关键字词确定为槽位字词和/或意图字词;生成单元,被用于基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在本申请的一些实施例中,基于前述方案,所述多个垂直领域的意图解析节点包括多个子意图解析节点,所述解析单元包括:第一分发单元,被用于将多个垂直领域的意图解析节点中的目标语句分发给多个垂直领域的意图解析节点中的多个子意图解析节点;第二命名实体识别单元,被用于基于多个子意图解析节点中的第二字词库,对在多个子意图解析节点中的目标语句进行命名实体识别,以确定多个子意图解析节点中的目标语句的实体关键字词;映射单元,被用于对所述实体关键字词进行实体映射,以得到所述实体关键字词的映射关键字词;第四确定单元,被用于将多个子意图解析节点中的目标语句的实体关键字词以及对应的映射关键字词确定为槽位字词和/或意图字词;生成单元,被用于基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在本申请的一些实施例中,基于前述方案,所述生成单元配置为:检测所确定的槽位字词和/或意图字词是否能匹配为标准句式;若所确定的槽位字词和/或意图字词能匹配为标准句式,则按照句式匹配规则将所确定的槽位字词和/或确定的意图字词匹配为标准句式,以将所述标准句式作为所述目标语句的意图解析结果;若所确定的槽位字词和/或意图字词不能匹配为标准句式,则返回空结果,以将所述空结果作为所述目标语句的意图解析结果。
在本申请的一些实施例中,基于前述方案,所述判读单元中预设有包括如下任意一种判读规则:确定所述匹配的标准句式中的槽位字词的槽位字词覆盖率,将所述槽位字词覆盖率最高的标准句式作为识别出的所述目标语句的目标意图;确定所述匹配的标准句式中的槽位字词数量,将所述槽位字词数量最多的标准句式作为识别出的所述目标语句的目标意图;确定所述匹配的标准句式中的槽位字词的打分的总分,将所述槽位字词的打分的总分最高的标准句式作为识别出的所述目标语句的目标意图;确定所述匹配的标准句式的优先级,将所述优先级最高的标准句式作为识别出的所述目标语句的目标意图。
在本申请的一些实施例中,基于前述方案,所述判读单元中预设有包括如下判读规则:确定所述匹配的标准句式中的槽位字词的槽位字词覆盖率,将所述槽位字词覆盖率最高的标准句式作为识别出的所述目标语句的目标意图;若出现多个标准句式中的槽位字词覆盖率相同,则确定所述匹配的标准句式中的槽位字词数量,将所述槽位字词数量最多的标准句式作为识别出的所述目标语句的目标意图;若出现多个标准句式中的槽位字词数量相同,则确定所述匹配的标准句式中的槽位字词的打分的总分,将所述槽位字词的打分的总分最高的标准句式作为识别出的所述目标语句的目标意图;若出现多个标准句式中的槽位字词的打分的总分相同,则确定所述匹配的标准句式的优先级,将所述优先级最高的标准句式作为识别出的所述目标语句的目标意图。
根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的语句意图识别方法。
根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的语句意图识别方法。
在本申请的一些实施例所提供的技术方案中,通过将所需要进行意图识别的目标语句分发给多个垂直领域的意图解析节点,使得多个垂直领域的意图解析节点根据属于自身垂直领域的意图解析规则,可以并发或者同时对同一目标语句进行意图解析,以得到所述目标语句在多个垂直领域中的意图解析结果,然后再根据预先设定的判读规则对所述目标语句在多个垂直领域中的意图解析结果进行判读,以将最符合所述判读规则的意图解析结果确定为所识别出的目标语句的目标意图。由于通过多个垂直领域的意图解析节点并发或者同时对同一目标语句进行意图解析,故可以提高语句意图识别的效率,同时还有利于提高语句意图识别的准确性,从而解决现有技术中存在的不能提高语句意图识别的效率以及准确性的技术问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图;
图2示出了根据本申请的一个实施例的语句意图识别方法的流程图;
图3示出了根据本申请的一个实施例的获取目标语句的细节流程图;
图4示出了根据本申请的一个实施例的语句意图识别方法的有向无环图;
图5示出了根据本申请的一个实施例的解析目标语句意图的细节流程图;
图6示出了根据本申请的一个实施例的解析目标语句意图的细节流程图;
图7示出了根据本申请的一个实施例的解析目标语句意图的细节流程图;
图8示出了根据本申请的一个实施例的语句意图识别方法的有向无环图;
图9示出了根据本申请的一个实施例的解析目标语句意图的细节流程图;
图10示出了根据本申请的一个实施例的生成目标语句意图解析结果的细节流程图;
图11示出了根据本申请的一个实施例的判读目标语句意图解析结果的规则图;
图12示出了根据本申请的语句意图识别的一个具体实施例示意图;
图13示出了根据本申请的一个实施例的语句意图识别装置的框图;
图14示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
如图1所示,系统架构可以包括终端设备(如图1中所示智能手机101、平板电脑102和便携式计算机103中的一种或多种,当然也可以是台式计算机等等)、网络104和服务器105。网络104用以在终端设备和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线通信链路、无线通信链路等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本申请的技术方案主要涉及自然语言处理(Nature Language processing,NLP)技术领域。自然语言处理是一门融语言学、计算机科学、数学于一体的科学,是计算机科学领域与人工智能领域中的一个重要方向。它主要研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言。在本申请中,则主要提出了在自然语言处理技术领域中一种识别语句意图的技术。
在本申请的一个实施例中,用户可以利用终端设备向服务器105上传需要意图识别的自然语句(所述自然语句可以是以一段文字的形式表现,也可以是一段语音的形式表现),服务器105在获取到终端设备上传的自然语句之后,可以将所述自然语句进行预处理而得到便于意图识别的目标语句,然后将所述目标语句分发给多个垂直领域的意图解析节点,并由多个垂直领域的意图解析节点中对所述目标语句进行意图解析,从而得到多个意图解析结果。需要注意的是,在本申请中,所述多个垂直领域的意图解析节点是指至少包括一个但不限于一个垂直领域的意图解析节点,与之相对应的,所述得到的多个意图解析结果是指至少包括一个但不限于一个意图解析结果。例如,存在两个垂直领域的意图解析节点对所述目标语句进行意图解析,其中每一个垂直领域的意图解析节点得到的一个解析结果,即共得到两个意图解析结果。
在本申请的一个实施例中,当得到多个意图解析结果之后,服务器105可以进一步根据预设的判读规则,判读所述目标语句在多个垂直领域的意图解析节点中的意图解析结果,进而识别出所述目标语句的目标意图,并将识别出目标意图返回给终端设备。
可见,由于本申请实施例的技术方案可以通过多个垂直领域的意图解析节点并发或者同时对同一目标语句进行意图解析,因此能够缩短语句意图识别的耗时,提高语句意图识别的效率,同时还有利于提高语句意图识别的准确性。
需要说明的是,本申请实施例所提供的语句意图识别方法一般由服务器105执行,相应地,语句意图识别装置一般设置于服务器105中。但是,在本申请的其它实施例中,终端设备也可以与服务器具有相似的功能,从而执行本申请实施例所提供的语句意图识别方案。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
根据本公开的第一方面,提供了一种语句意图识别方法。
参见图2,示出了根据本申请的一个实施例的语句意图识别方法的流程图,该识别方法可以由具有计算处理功能的设备来执行,比如可以由图1中所示的服务器105来执行。该识别方法可包括步骤210至240:
步骤210,获取目标语句。
步骤220,将所述目标语句分发给多个垂直领域的意图解析节点。
步骤230,对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,以得到所述目标语句在多个垂直领域中的意图解析结果。
步骤240,根据预设的判读规则,判读所述目标语句在多个垂直领域的意图解析节点中的意图解析结果,以识别出所述目标语句的目标意图。
下面将对如上实施步骤进行详细说明:
在步骤210中,获取目标语句。
在本申请中,目标语句中载有用户意图,对于计算机而言,是一种需要处理的数据对象。具体的,所述目标语句的语言种类可以是中文、英文或者是日文,也可以是其它任意种类的语言。此外,目标语句的获取方式可以有多种,例如,可以由如图1所示的服务器105用户接收用户利用终端设备上传的需要意图识别的一段语音,然后由服务器105对所述语音进行文字转换,将转换的文字作为目标语句。还例如,可以由如图1所示的服务器105接收用户利用终端设备直接上传的需要意图识别的一段文字,并将所述一段文字作为目标语句。需要注意的是,所述目标语句可以是一个句子,也可以是多个句子的组合。
在本申请的一个实施例中,在将获取到的语句作为计算处理的目标语句之前,还可以对所述获取到的语句进行预处理,进而获取目标语句。进一步的,获取目标语句可以通过如图3所示的步骤实现。
参见图3,示出了根据本申请的一个实施例的获取目标语句的细节流程图,具体可包括步骤211至213:
步骤211,获取待意图识别的语句。
在本实施例中,所述获取的待意图识别的语句是指与用户在形式上的表达内容完全相同的语句。
步骤212,检测所述待意图识别的语句中是否存在预先设定的非正常的字符和/或字符组合。
由于获取到的待意图识别的语句是用户表达的最原始的语句,因此,这些语句中难免会出现一些不利于意图解析的字、词或者符号。例如,获取到的待意图识别的语句中存在语气字词,或者是存在错别字词,或者是存在空格,还或者存在“淫秽”、“邪教”、以及“黄赌毒”类的字词。
步骤213,删改所述待意图识别的语句中存在的非正常的字符和/或字符组合,得到目标语句。
基于上述步骤212,若检测到所述待意图识别的语句中存在预先设定的非正常的字符和/或字符组合,则需要删改所述待意图识别的语句中存在的非正常的字符和/或字符组合,以得到目标语句。具体的,例如,所述获取的待意图识别的语句为“我是真的想去深圳看大嗨呢!”,而预先设定的非正常的字符和/或字符组合中包括有“是真的”、“呢”、“大嗨”,其中“大嗨”被标记为错别字词,对应的修改为“大海”。据此,对所述获取到的待意图识别的语句进行删改之后,可以得到目标语句“我想去深圳看大海”。
删改所述待意图识别的语句中存在的非正常的字符和/或字符组合的好处在于,可以避免目标语句中出现一些影响意图解析的字、词或者符号,从而提高语句意图识别的准确性。
在步骤220中,将所述目标语句分发给多个垂直领域的意图解析节点。
在本申请中,所述多个垂直领域是指对所有可能出现的语句对应的意图进行分类而得到的多个意图领域。例如,所述垂直领域可以分为旅游意图领域,影视意图领域,音乐意图领域以及体育意图领域等其它的意图领域。对于本领域技术人员而言,应该理解到,所述多个垂直领域还可以是根据其它方面的实际需要对意图进行分类而确定的。
在本申请中的一个实施例中,在所述多个垂直领域的意图解析节点中可以分别嵌入一个语句意图解析模型,以用于对目标语句进行意图解析,其中,所述语句意图解析模型可以通过训练决策树模型得来,也可以是通过训练深度学习的神经网络模型得来。可以理解的是,所述意图解析模型的获得可以是任意的,并不限于如上所示出的那些。
在本申请的一个实施例中,将所述目标语句分发给多个垂直领域的意图解析节点可以通过如图4所示出的根据本申请的一个实施例的语句意图识别方法的有向无环图得以理解。
如图4所示,位置410所在的节点将目标语句单向传递给位置420所在的多个节点,而位置420所在的多个节点即为如上所述的多个垂直领域的意图解析节点,对于位置420的任何一个垂直领域的意图解析节点,都可以对所述目标语句在相应的垂直领域范围内进行意图解析。例如,旅游意图领域中的意图解析节点对目标语句的意图解析结果是与旅游相关的,影视意图领域中的意图解析节点对目标语句的意图解析结果是与影视相关的。
在步骤230中,对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,以得到所述目标语句在多个垂直领域中的意图解析结果。
在本申请的一个实施例中,解析目标语句意图可以通过如图5所示的步骤实现。
参见图5,示出了根据本申请的一个实施例的解析目标语句意图的细节流程图,具体可包括步骤2321、步骤2341以及步骤2350:
步骤2321,基于多个垂直领域的意图解析节点中的第一字词库,对在多个垂直领域的意图解析节点中的目标语句进行命名实体识别,以确定多个垂直领域的意图解析节点中的目标语句的实体关键字词。
在本实施例中,所述第一字词库中存储有若干个字词,每一个垂直领域的意图解析节点都对应的设有一个第一字词库。其中,对一个垂直领域的意图解析节点中的第一字词库中的字词进行自由组合,能够得到且只能得到与这个垂直领域的意图相关的句式。需要注意的是,在本申请中,每一个垂直领域的意图解析节点中的第一字词库中字词的自由组合可以穷尽与相应垂直领域的意图相关的所有句式。
具体的,本实施例的步骤需要基于所述第一字词库,对与所述第一字词库相应的垂直领域的意图解析节点中的目标语句进行命名实体识别,以确定所述目标语句在相应垂直领域的意图解析节点中的实体关键字词。例如,在旅游意图领域的意图解析节点的第一字词库中,存在有关键字词“深圳”、“大海”、“想”、“去”以及“看”,当对目标语句如“我想去深圳看大海”进行命名实体识别之后,则将“深圳”、“大海”、“想”、“去”和“看”确定为实体关键字词。
步骤2341,将多个垂直领域的意图解析节点中的目标语句的实体关键字词确定为槽位字词和/或意图字词。
在本申请中,所述意图字词是为了确定目标语句的主体意图,所述槽位字词是为了对目标语句的主体意图的进一步限定。一般来讲,一个语句中一定会包括谓语和宾语,基于这一语法规则,可以首先确定意图字词,然后再确定槽位字词,例如在“我想去深圳看大海”的目标语句中,可以将在步骤2321中确定的关键字词“看”和“大海”确定为意图字词,然后再将关键字词“想”、“去”和“深圳”确定为槽位字词。
步骤2350,基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在本申请的一个实施例中,解析目标语句意图可以通过如图6所示的步骤实现。
参见图6,示出了根据本申请的一个实施例的解析目标语句意图的细节流程图,具体可包括步骤2321、步骤2331、步骤2342以及步骤2350:
步骤2321,基于多个垂直领域的意图解析节点中的第一字词库,对在多个垂直领域的意图解析节点中的目标语句进行命名实体识别,以确定多个垂直领域的意图解析节点中的目标语句的实体关键字词。
步骤2331,对所述实体关键字词进行实体映射,以得到所述实体关键字词的映射关键字词。
相对于前述实施例,本实施例进一步的对所述实体关键字词进行实体映射,以得到所述实体关键字词的映射关键字词。具体而言,是根据已确定的实体关键字词,确定与所述实体关键字词的词义和/或字义相近的关键字词。例如,在目标语句“我想去深圳看大海”中,对确定的实体关键字词“深圳”进行实体映射,得到映射关键字词“鹏城”(深圳的别称),对实体关键字词“大海”进行实体映射,得到映射关键字词“海”和“海洋”,对实体关键字词“想”进行实体映射,得到映射关键字词“希望”、“期待”和“期望”,对实体关键字词“看”进行实体映射,得到映射关键字词“瞧”和“见”。
步骤2342,将多个垂直领域的意图解析节点中的目标语句的实体关键字词以及对应的映射关键字词确定为槽位字词和/或意图字词。
这里需要注意的是,根据上述实施例步骤2341,若将实体关键字词确定为意图字词,那么所述实体关键字词对应的映射关键字词也可以确定为意图字词。若将实体关键字词确定为槽位字词,那么所述实体关键字词对应的映射关键字词也可以确定为槽位字词。
对所述实体关键字词进行实体映射,得到所述实体关键字词的映射关键字词,并将所述映射关键字词也确定为意图字词或槽位字词的好处在于可以扩展用于意图解析的字词来源,进而有利于提高语句意图识别的准确性。
步骤2350,基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在本申请的一个实施例中,所述多个垂直领域的意图解析节点中可以包括有多个子意图解析节点,即一个垂直领域的意图解析节点中可以包括有多个子意图解析节点。其中,一个垂直领域的意图解析节点中的多个子意图解析节点是对所述垂直领域中的所有意图进行分类而得到的。例如,在旅游意图领域,与旅游相关的意图可以进一步分为风景旅游类的子意图解析节点、文化旅游类的子意图解析节点以及休闲旅游类的子意图解析节点等等。对于本领域技术人员而言,应该理解到,所述多个子意图解析节点还可以是根据其它方面的实际需要对意图进行分类而确定的。
在上述实施例的一个具体实现中,解析目标语句意图可以通过如图7所示的步骤实现。
参见图7,示出了根据本申请的一个实施例的解析目标语句意图的细节流程图,具体可包括步骤2311、步骤2322、步骤2343以及步骤2350:
步骤2311,将多个垂直领域的意图解析节点中的目标语句分发给多个垂直领域的意图解析节点中的多个子意图解析节点。
具体的,将多个垂直领域的意图解析节点中的目标语句分发给多个垂直领域的意图解析节点中的多个子意图解析节点可以通过如图8所示出的根据本申请的一个实施例的语句意图识别方法的有向无环图得以理解。如图8可见,位置820为垂直领域的意图解析节点,在所述垂直领域的意图解析节点中,进一步包括如8201所示的子意图解析节点,在如820所述的垂直领域的意图解析节点接收到目标语句之后,可以进一步的将所述目标语句分发给如8201所示的子意图解析节点。需要注意的是,图8所示出的位置820的结构仅仅是示例性的,本领域技术人员应该理解,图8中的其它垂直领域的意图解析节点也应该同位置820所示的垂直领域的意图解析节点一样,将目标语句分发给自身垂直领域的意图解析节点对应的多个子意图解析节点。即每一个垂直领域的意图解析节点将目标语句分发给自身垂直领域的意图解析节点对应的多个子意图解析节点。
步骤2322,基于多个子意图解析节点中的第二字词库,对在多个子意图解析节点中的目标语句进行命名实体识别,以确定多个子意图解析节点中的目标语句的实体关键字词。
步骤2343,将多个子意图解析节点中的目标语句的实体关键字词确定为槽位字词和/或意图字词。
步骤2350,基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
如上述实施例,在多个子意图解析节点中对目标语句进行意图识别的好处在于,通过多个子意图解析节点处理目标语句可以进一步缩短语句意图识别所需的耗时,故可以进一步提高语句意图识别的效率。
在上述实施例的一个具体实现中,解析目标语句意图可以通过如图9所示的步骤实现。
参见图9,示出了根据本申请的一个实施例的解析目标语句意图的细节流程图,具体可包括步骤2321、步骤2331、步骤2342以及步骤2350:
步骤2311,将多个垂直领域的意图解析节点中的目标语句分发给多个垂直领域的意图解析节点中的多个子意图解析节点。
步骤2322,基于多个子意图解析节点中的第二字词库,对在多个子意图解析节点中的目标语句进行命名实体识别,以确定多个子意图解析节点中的目标语句的实体关键字词。
步骤2331,对所述实体关键字词进行实体映射,以得到所述实体关键字词的映射关键字词。
步骤2344,将多个子意图解析节点中的目标语句的实体关键字词以及对应的映射关键字词确定为槽位字词和/或意图字词。
步骤2350,基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在如上所述的多个实施例中,步骤2350所述的生成目标语句意图解析结果可以通过如图10所示的步骤实现。
参见图10,示出了根据本申请的一个实施例的生成目标语句意图解析结果的细节流程图,具体可包括步骤2351至2353:
步骤2351,检测所确定的槽位字词和/或意图字词是否能匹配为标准句式。
需要注意的是,将槽位字词和/或意图字词匹配为标准句式的前提是在垂直领域的意图解析节点中或子意图解析节点中存在槽位字词和/或意图字词,在此基础上,进一步检测在垂直领域的意图解析节点中或子意图解析节点中是否存在与所述槽位字词和/或意图字词相关的标准句式。
步骤2352,若所确定的槽位字词和/或意图字词能匹配为标准句式,则按照句式匹配规则将所确定的槽位字词和/或确定的意图字词匹配为标准句式,以将所述标准句式作为所述目标语句的意图解析结果。
具体的,例如,在旅游意图领域,对于“我想去深圳看大海”的目标语句,存在槽位字词“想”、“去”和“深圳”,存在意图字词“看”和“大海”,而在旅游意图领域的节点中,存在句式“看大海”,因此,可以将“我想去深圳看大海”的目标语句解析为“想去深圳看大海”的标准句式,其中“看大海”为旅游意图领域中的意图,“想去深圳”为意图“看大海”的进一步限定,即限定之后的意图为“想去看深圳的大海”。
步骤2353,若所确定的槽位字词和/或意图字词不能匹配为标准句式,则返回空结果,以将所述空结果作为所述目标语句的意图解析结果。
具体的,例如,在音乐意图领域,对于“我想去深圳看大海”的目标语句,存在槽位字词“想”、“去”和“深圳”,存在意图字词“看”和“大海”,但在音乐意图领域的节点中,不存在句式“看大海”,因此,“我想去深圳看大海”的目标语句不能在音乐意图领域中解析为标准句式,即返回空结果。
如上所述,还例如,存在目标语句“宝马5系卖多少钱”,在汽车意图领域中,可以确定槽位字词“宝马5系”以及意图字词“卖”和“多少钱”,进一步的可以根据所述意图字词和槽位字词匹配属于汽车意图领域的标准句式。而在音乐意图领域中,有可能不存在关于“宝马5系”的槽位字词,因而无法匹配属于音乐意图领域的标准句式,进而返回空结果。
在步骤240中,根据预设的判读规则,判读所述目标语句在多个垂直领域的意图解析节点中的意图解析结果,以识别出所述目标语句的目标意图。
在本申请的一个实施例中,所述预设的判读规则具体包括如下任意一种:
第一种、确定所述匹配的标准句式中的槽位字词的槽位字词覆盖率,将所述槽位字词覆盖率最高的标准句式作为识别出的所述目标语句的目标意图。
在本实施例中,所述槽位字词覆盖率是可以指在一个标准句式中,被确定的槽位字词数量占被确定的实体关键词和实体关键字总数的百分比。例如,在旅游意图领域,对于“想去深圳看大海”的标准句式,存在“想”、“去”和“深圳”共三个槽位字词,而“想去深圳看大海”中被确定的关键字和关键词为“想”、“去”、深圳”、“看”和“大海”共5个,因此可见。标准句式“想去深圳看大海”在旅游意图领域中的槽位字词覆盖率为60%。
基于如上所述,在每一个垂直领域的意图解析节点或者子意图解析节点中生成标准句式中均可以计算出一个槽位字词覆盖率,通过比较在每一个垂直领域的意图解析节点或者子意图解析节点中生成的标准句式中的槽位字词覆盖率,将所述槽位字词覆盖率最高的标准句式作为识别出的所述目标语句的目标意图。
第二种、确定所述匹配的标准句式中的槽位字词数量,将所述槽位字词数量最多的标准句式作为识别出的所述目标语句的目标意图。
第三种、确定所述匹配的标准句式中的槽位字词的打分的总分,将所述槽位字词的打分的总分最高的标准句式作为识别出的所述目标语句的目标意图。
需要注意的是,所述槽位字词的打分可以是由专家根据槽位字词的重要程度来预先标记分数,也可以是根据槽位字词在历史上被使用的次数来对所述槽位字词进行打分。例如,槽位字词“想”、“去”和深圳”在旅游意图领域中的打分就可以分别为7分、5分和4分。进一步的,对于标准句式“想去深圳看大海”而言,所述槽位字词的打分的总分就为16分。
第四种、确定所述匹配的标准句式的优先级,将所述优先级最高的标准句式作为识别出的所述目标语句的目标意图。
可以同上述第三种判读规则一样,所述标准句式的优先级可以是由专家根据标准句式的重要程度来确定的,也可以是根据标准句式在历史上被使用的次数来确定,具体说明在此就不再一一赘述。
在本申请的一个实施例中,所述预设的判读规则还可以通过如图11所示的步骤设定:
参见图11,示出了根据本申请的一个实施例的判读目标语句意图解析结果的规则图,具体可包括步骤241至244:
步骤241,确定所述匹配的标准句式中的槽位字词的槽位字词覆盖率,将所述槽位字词覆盖率最高的标准句式作为识别出的所述目标语句的目标意图;
步骤242,若出现多个标准句式中的槽位字词覆盖率相同,则确定所述匹配的标准句式中的槽位字词数量,将所述槽位字词数量最多的标准句式作为识别出的所述目标语句的目标意图;
步骤243,若出现多个标准句式中的槽位字词数量相同,则确定所述匹配的标准句式中的槽位字词的打分的总分,将所述槽位字词的打分的总分最高的标准句式作为识别出的所述目标语句的目标意图;
步骤244,若出现多个标准句式中的槽位字词的打分的总分相同,则确定所述匹配的标准句式的优先级,将所述优先级最高的标准句式作为识别出的所述目标语句的目标意图。
在本申请中,为了使本领域技术人员进一步理解本方案一个整体实施细节,本方案通过如图12所示的步骤加以说明。
参见图12,示出了根据本申请的语句意图识别的一个具体实施例的示意图:
如图所示,在获取到用户需要意图解析的自然语言1211之后,用户的自然语言被传递到自然语言预处理层1212中的预处理节点。预处理节点在对用户的自然语言进行处理之后得到用于意图识别的目标语句。然后目标语句从自然语言预处理层1212被分发传递到意图处理层1213中的意图节点1、意图节点2以及意图节点3,意图节点1、意图节点2以及意图节点3根据自身的字词库和语句意图解析规则,同时或者并发的队所述目标语句进行解析,以得到多个意图解析结果。最后,意图节点1、意图节点2以及意图节点3将自身对目标语句的解析结果传递给意图判断层1214中的意图判别节点,意图判别节点根据预设的判读规则分别对来自意图节点1、意图节点2以及意图节点3的意图解析结果进行判读,以最终确定并输出用户的真实意图1215。
在本申请的一些实施例所提供的技术方案中,通过将所需要进行意图识别的目标语句分发给多个垂直领域的意图解析节点,使得多个垂直领域的意图解析节点根据属于自身垂直领域的意图解析规则,可以并发或者同时对同一目标语句进行意图解析,以得到所述目标语句在多个垂直领域中的意图解析结果,然后再根据预先设定的判读规则对所述目标语句在多个垂直领域中的意图解析结果进行判读,以将最符合所述判读规则的意图解析结果确定为所识别出的目标语句的目标意图。由于通过多个垂直领域的意图解析节点并发或者同时对同一目标语句进行意图解析,从而避免了由多个意图领域对应语法句式而构建的单语言识别模型对目标语句进行意图解析,故可以提高语句意图识别的效率,同时还有利于提高语句意图识别的准确性,进而解决现有技术中存在的不能提高语句意图识别的效率以及准确性的技术问题。
本申请发明人通过实验发现,本申请技术方案在应用于手机语音助手的垂直领域意图识别特别是在多种意图识别时,其整体计算耗时缩短75%,准确率提高23%。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的语句意图识别方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的语句意图识别方法的实施例。
图13示出了根据本申请的一个实施例的语句意图识别装置的框图。
参照图13所示,根据本申请的一个实施例的语句意图识别装置1300,包括:获取单元1310、分发单元1320、解析单元1330和判读单元1340。
其中,获取单元1310被用于获取目标语句;分发单元1320被用于将所述目标语句分发给多个垂直领域的意图解析节点;解析单元1330被用于对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,以得到所述目标语句在多个垂直领域中的意图解析结果;判读单元1340被用于根据预设的判读规则,判读所述目标语句在多个垂直领域的意图解析节点中的意图解析结果,以识别出所述目标语句的目标意图。
在本申请的一些实施例中,基于前述方案,所述获取单元1310配置为:获取待意图识别的语句;检测所述待意图识别的语句中是否存在预先设定的非正常的字符和/或字符组合;删改所述待意图识别的语句中存在的非正常的字符和/或字符组合,得到目标语句。
在本申请的一些实施例中,基于前述方案,所述解析单元1330包括:第一命名实体识别单元,被用于基于多个垂直领域的意图解析节点中的第一字词库,对在多个垂直领域的意图解析节点中的目标语句进行命名实体识别,以确定多个垂直领域的意图解析节点中的目标语句的实体关键字词;第一确定单元,被用于将多个垂直领域的意图解析节点中的目标语句的实体关键字词确定为槽位字词和/或意图字词;生成单元,被用于基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在本申请的一些实施例中,基于前述方案,所述解析单元1330包括:第一命名实体识别单元,被用于基于多个垂直领域的意图解析节点中的第一字词库,对在多个垂直领域的意图解析节点中的目标语句进行命名实体识别,以确定多个垂直领域的意图解析节点中的目标语句的实体关键字词;映射单元,被用于对所述实体关键字词进行实体映射,以得到所述实体关键字词的映射关键字词;第二确定单元,被用于将多个垂直领域的意图解析节点中的目标语句的实体关键字词以及对应的映射关键字词确定为槽位字词和/或意图字词;生成单元,被用于基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在本申请的一些实施例中,基于前述方案,所述多个垂直领域的意图解析节点包括多个子意图解析节点,所述解析单元1330包括:第一分发单元,被用于将多个垂直领域的意图解析节点中的目标语句分发给多个垂直领域的意图解析节点中的多个子意图解析节点;第二命名实体识别单元,被用于基于多个子意图解析节点中的第二字词库,对在多个子意图解析节点中的目标语句进行命名实体识别,以确定多个子意图解析节点中的目标语句的实体关键字词;第三确定单元,被用于将多个子意图解析节点中的目标语句的实体关键字词确定为槽位字词和/或意图字词;生成单元,被用于基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在本申请的一些实施例中,基于前述方案,所述多个垂直领域的意图解析节点包括多个子意图解析节点,所述解析单元1330包括:第一分发单元,被用于将多个垂直领域的意图解析节点中的目标语句分发给多个垂直领域的意图解析节点中的多个子意图解析节点;第二命名实体识别单元,被用于基于多个子意图解析节点中的第二字词库,对在多个子意图解析节点中的目标语句进行命名实体识别,以确定多个子意图解析节点中的目标语句的实体关键字词;映射单元,被用于对所述实体关键字词进行实体映射,以得到所述实体关键字词的映射关键字词;第四确定单元,被用于将多个子意图解析节点中的目标语句的实体关键字词以及对应的映射关键字词确定为槽位字词和/或意图字词;生成单元,被用于基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
在本申请的一些实施例中,基于前述方案,所述生成单元配置为:检测所确定的槽位字词和/或意图字词是否能匹配为标准句式;若所确定的槽位字词和/或意图字词能匹配为标准句式,则按照句式匹配规则将所确定的槽位字词和/或确定的意图字词匹配为标准句式,以将所述标准句式作为所述目标语句的意图解析结果;若所确定的槽位字词和/或意图字词不能匹配为标准句式,则返回空结果,以将所述空结果作为所述目标语句的意图解析结果。
在本申请的一些实施例中,基于前述方案,所述判读单元1340中预设有包括如下任意一种判读规则:确定所述匹配的标准句式中的槽位字词的槽位字词覆盖率,将所述槽位字词覆盖率最高的标准句式作为识别出的所述目标语句的目标意图;确定所述匹配的标准句式中的槽位字词数量,将所述槽位字词数量最多的标准句式作为识别出的所述目标语句的目标意图;确定所述匹配的标准句式中的槽位字词的打分的总分,将所述槽位字词的打分的总分最高的标准句式作为识别出的所述目标语句的目标意图;确定所述匹配的标准句式的优先级,将所述优先级最高的标准句式作为识别出的所述目标语句的目标意图。
在本申请的一些实施例中,基于前述方案,所述判读单元1340中预设有包括如下判读规则:确定所述匹配的标准句式中的槽位字词的槽位字词覆盖率,将所述槽位字词覆盖率最高的标准句式作为识别出的所述目标语句的目标意图;若出现多个标准句式中的槽位字词覆盖率相同,则确定所述匹配的标准句式中的槽位字词数量,将所述槽位字词数量最多的标准句式作为识别出的所述目标语句的目标意图;若出现多个标准句式中的槽位字词数量相同,则确定所述匹配的标准句式中的槽位字词的打分的总分,将所述槽位字词的打分的总分最高的标准句式作为识别出的所述目标语句的目标意图;若出现多个标准句式中的槽位字词的打分的总分相同,则确定所述匹配的标准句式的优先级,将所述优先级最高的标准句式作为识别出的所述目标语句的目标意图。
图14示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图14示出的电子设备的计算机系统1400仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图14所示,计算机系统1400包括中央处理单元(Central Processing Unit,CPU)1401,其可以根据存储在只读存储器(Read-Only Memory,ROM)1402中的程序或者从存储部分1408加载到随机访问存储器(Random Access Memory,RAM)1403中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 1403中,还存储有系统操作所需的各种程序和数据。CPU 1401、ROM 1402以及RAM 1403通过总线1404彼此相连。输入/输出(Input/Output,I/O)接口1405也连接至总线1404。
以下部件连接至I/O接口1405:包括键盘、鼠标等的输入部分1406;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1407;包括硬盘等的存储部分1408;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1409。通信部分1409经由诸如因特网的网络执行通信处理。驱动器1410也根据需要连接至I/O接口1405。可拆卸介质1411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1410上,以便于从其上读出的计算机程序根据需要被安装入存储部分1408。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1409从网络上被下载和安装,和/或从可拆卸介质1411被安装。在该计算机程序被中央处理单元(CPU)1401执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种语句意图识别方法,其特征在于,包括:
获取目标语句;
将所述目标语句分发给多个垂直领域的意图解析节点;
对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,以得到所述目标语句在多个垂直领域中的意图解析结果;
根据预设的判读规则,判读所述目标语句在多个垂直领域的意图解析节点中的意图解析结果,以识别出所述目标语句的目标意图。
2.根据权利要求1所述的方法,其特征在于,所述获取目标语句,包括:
获取待意图识别的语句;
检测所述待意图识别的语句中是否存在预先设定的非正常的字符和/或字符组合;
删改所述待意图识别的语句中存在的非正常的字符和/或字符组合,得到目标语句。
3.根据权利要求1所述的方法,其特征在于,所述对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,包括:
基于多个垂直领域的意图解析节点中的第一字词库,对在多个垂直领域的意图解析节点中的目标语句进行命名实体识别,以确定多个垂直领域的意图解析节点中的目标语句的实体关键字词;
将多个垂直领域的意图解析节点中的目标语句的实体关键字词确定为槽位字词和/或意图字词;
基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
4.根据权利要求1所述的方法,其特征在于,所述对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,包括:
基于多个垂直领域的意图解析节点中的第一字词库,对在多个垂直领域的意图解析节点中的目标语句进行命名实体识别,以确定多个垂直领域的意图解析节点中的目标语句的实体关键字词;
对所述实体关键字词进行实体映射,以得到所述实体关键字词的映射关键字词;
将多个垂直领域的意图解析节点中的目标语句的实体关键字词以及对应的映射关键字词确定为槽位字词和/或意图字词;
基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
5.根据权利要求1所述的方法,其特征在于,所述多个垂直领域的意图解析节点包括多个子意图解析节点,
所述对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,包括:
将多个垂直领域的意图解析节点中的目标语句分发给多个垂直领域的意图解析节点中的多个子意图解析节点;
基于多个子意图解析节点中的第二字词库,对在多个子意图解析节点中的目标语句进行命名实体识别,以确定多个子意图解析节点中的目标语句的实体关键字词;
将多个子意图解析节点中的目标语句的实体关键字词确定为槽位字词和/或意图字词;
基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
6.根据权利要求1所述的方法,其特征在于,所述多个垂直领域的意图解析节点包括多个子意图解析节点,
所述对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,包括:
将多个垂直领域的意图解析节点中的目标语句分发给多个垂直领域的意图解析节点中的多个子意图解析节点;
基于多个子意图解析节点中的第二字词库,对在多个子意图解析节点中的目标语句进行命名实体识别,以确定多个子意图解析节点中的目标语句的实体关键字词;
对所述实体关键字词进行实体映射,以得到所述实体关键字词的映射关键字词;
将多个子意图解析节点中的目标语句的实体关键字词以及对应的映射关键字词确定为槽位字词和/或意图字词;
基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果。
7.根据权利要求3至6中任一项所述的方法,其特征在于,所述基于所确定的槽位字词和/或意图字词,生成所述目标语句的意图解析结果,包括:
检测所确定的槽位字词和/或意图字词是否能匹配为标准句式;
若所确定的槽位字词和/或意图字词能匹配为标准句式,则将所确定的槽位字词和/或确定的意图字词匹配为标准句式,以将所述标准句式作为所述目标语句的意图解析结果;
若所确定的槽位字词和/或意图字词不能匹配为标准句式,则返回空结果,以将所述空结果作为所述目标语句的意图解析结果。
8.根据权利要求7所述的方法,所述预设的判读规则具体包括如下任意一种:
确定所述匹配的标准句式中的槽位字词的槽位字词覆盖率,将所述槽位字词覆盖率最高的标准句式作为识别出的所述目标语句的目标意图;
确定所述匹配的标准句式中的槽位字词数量,将所述槽位字词数量最多的标准句式作为识别出的所述目标语句的目标意图;
确定所述匹配的标准句式中的槽位字词的打分的总分,将所述槽位字词的打分的总分最高的标准句式作为识别出的所述目标语句的目标意图;
确定所述匹配的标准句式的优先级,将所述优先级最高的标准句式作为识别出的所述目标语句的目标意图。
9.根据权利要求7所述的方法,所述预设的判读规则具体包括::
确定所述匹配的标准句式中的槽位字词的槽位字词覆盖率,将所述槽位字词覆盖率最高的标准句式作为识别出的所述目标语句的目标意图;若出现多个标准句式中的槽位字词覆盖率相同,则
确定所述匹配的标准句式中的槽位字词数量,将所述槽位字词数量最多的标准句式作为识别出的所述目标语句的目标意图;若出现多个标准句式中的槽位字词数量相同,则
确定所述匹配的标准句式中的槽位字词的打分的总分,将所述槽位字词的打分的总分最高的标准句式作为识别出的所述目标语句的目标意图;若出现多个标准句式中的槽位字词的打分的总分相同,则
确定所述匹配的标准句式的优先级,将所述优先级最高的标准句式作为识别出的所述目标语句的目标意图。
10.一种语句意图识别装置,其特征在于,包括:
获取单元,被用于获取目标语句;
分发单元,被用于将所述目标语句分发给多个垂直领域的意图解析节点;
解析单元,被用于对在多个垂直领域的意图解析节点中的所述目标语句进行意图解析,以得到所述目标语句在多个垂直领域中的意图解析结果;
判读单元,被用于根据预设的判读规则,判读所述目标语句在多个垂直领域的意图解析节点中的意图解析结果,以识别出所述目标语句的目标意图。
CN201910810569.7A 2019-08-29 2019-08-29 语句意图识别方法、装置 Active CN110543633B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910810569.7A CN110543633B (zh) 2019-08-29 2019-08-29 语句意图识别方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910810569.7A CN110543633B (zh) 2019-08-29 2019-08-29 语句意图识别方法、装置

Publications (2)

Publication Number Publication Date
CN110543633A true CN110543633A (zh) 2019-12-06
CN110543633B CN110543633B (zh) 2021-06-29

Family

ID=68710993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910810569.7A Active CN110543633B (zh) 2019-08-29 2019-08-29 语句意图识别方法、装置

Country Status (1)

Country Link
CN (1) CN110543633B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046666A (zh) * 2019-12-19 2020-04-21 天津新开心生活科技有限公司 事件识别方法及装置、计算机可读存储介质、电子设备
CN111159546A (zh) * 2019-12-24 2020-05-15 腾讯科技(深圳)有限公司 事件推送方法、装置、计算机可读存储介质和计算机设备
CN113076397A (zh) * 2021-03-29 2021-07-06 Oppo广东移动通信有限公司 意图识别方法、装置、电子设备及存储介质
WO2021184794A1 (zh) * 2020-03-18 2021-09-23 思必驰科技股份有限公司 对话文本的技能领域确定方法及装置
WO2023029513A1 (zh) * 2021-08-30 2023-03-09 康键信息技术(深圳)有限公司 基于人工智能的搜索意图识别方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120179454A1 (en) * 2011-01-11 2012-07-12 Jung Eun Kim Apparatus and method for automatically generating grammar for use in processing natural language
KR20140138011A (ko) * 2013-05-24 2014-12-03 삼성전자주식회사 음성 인식 장치 및 그 제어 방법
CN109063221A (zh) * 2018-11-02 2018-12-21 北京百度网讯科技有限公司 基于混合策略的查询意图识别方法和装置
CN109241524A (zh) * 2018-08-13 2019-01-18 腾讯科技(深圳)有限公司 语义解析方法及装置、计算机可读存储介质、电子设备
CN109344395A (zh) * 2018-08-30 2019-02-15 腾讯科技(深圳)有限公司 一种数据处理方法、装置、服务器及存储介质
CN109697282A (zh) * 2017-10-20 2019-04-30 阿里巴巴集团控股有限公司 一种语句的用户意图识别方法和装置
CN110162775A (zh) * 2019-03-11 2019-08-23 腾讯科技(深圳)有限公司 确定意图识别准确度的方法、装置及计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120179454A1 (en) * 2011-01-11 2012-07-12 Jung Eun Kim Apparatus and method for automatically generating grammar for use in processing natural language
KR20140138011A (ko) * 2013-05-24 2014-12-03 삼성전자주식회사 음성 인식 장치 및 그 제어 방법
CN109697282A (zh) * 2017-10-20 2019-04-30 阿里巴巴集团控股有限公司 一种语句的用户意图识别方法和装置
CN109241524A (zh) * 2018-08-13 2019-01-18 腾讯科技(深圳)有限公司 语义解析方法及装置、计算机可读存储介质、电子设备
CN109344395A (zh) * 2018-08-30 2019-02-15 腾讯科技(深圳)有限公司 一种数据处理方法、装置、服务器及存储介质
CN109063221A (zh) * 2018-11-02 2018-12-21 北京百度网讯科技有限公司 基于混合策略的查询意图识别方法和装置
CN110162775A (zh) * 2019-03-11 2019-08-23 腾讯科技(深圳)有限公司 确定意图识别准确度的方法、装置及计算机设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046666A (zh) * 2019-12-19 2020-04-21 天津新开心生活科技有限公司 事件识别方法及装置、计算机可读存储介质、电子设备
CN111046666B (zh) * 2019-12-19 2023-05-05 天津新开心生活科技有限公司 事件识别方法及装置、计算机可读存储介质、电子设备
CN111159546A (zh) * 2019-12-24 2020-05-15 腾讯科技(深圳)有限公司 事件推送方法、装置、计算机可读存储介质和计算机设备
CN111159546B (zh) * 2019-12-24 2023-10-24 深圳市雅阅科技有限公司 事件推送方法、装置、计算机可读存储介质和计算机设备
WO2021184794A1 (zh) * 2020-03-18 2021-09-23 思必驰科技股份有限公司 对话文本的技能领域确定方法及装置
CN113076397A (zh) * 2021-03-29 2021-07-06 Oppo广东移动通信有限公司 意图识别方法、装置、电子设备及存储介质
WO2023029513A1 (zh) * 2021-08-30 2023-03-09 康键信息技术(深圳)有限公司 基于人工智能的搜索意图识别方法、装置、设备及介质

Also Published As

Publication number Publication date
CN110543633B (zh) 2021-06-29

Similar Documents

Publication Publication Date Title
CN110543633B (zh) 语句意图识别方法、装置
CN110276023B (zh) Poi变迁事件发现方法、装置、计算设备和介质
US11409964B2 (en) Method, apparatus, device and storage medium for evaluating quality of answer
CN111339255A (zh) 目标情感分析的方法、模型训练方法、介质和设备
CN109766418B (zh) 用于输出信息的方法和装置
US20220358292A1 (en) Method and apparatus for recognizing entity, electronic device and storage medium
US20220156467A1 (en) Hybrid Natural Language Understanding
CN112185361B (zh) 一种语音识别模型训练方法、装置、电子设备及存储介质
CN113761190A (zh) 文本识别方法、装置、计算机可读介质及电子设备
CN111597807B (zh) 分词数据集生成方法、装置、设备及其存储介质
CN116541493A (zh) 基于意图识别的交互应答方法、装置、设备、存储介质
CN112084769A (zh) 依存句法模型优化方法、装置、设备及可读存储介质
CN114492661A (zh) 文本数据分类方法和装置、计算机设备、存储介质
CN113821587B (zh) 文本相关性确定方法、模型训练方法、装置及存储介质
CN114357195A (zh) 基于知识图谱的问答对生成方法、装置、设备及介质
CN112925914B (zh) 数据安全分级方法、系统、设备及存储介质
CN114330483A (zh) 数据处理方法及模型训练方法、装置、设备、存储介质
CN111767714B (zh) 一种文本通顺度确定方法、装置、设备及介质
CN113705207A (zh) 语法错误识别方法及装置
CN114398903B (zh) 意图识别方法、装置、电子设备及存储介质
CN115730590A (zh) 意图识别方法以及相关设备
CN115620726A (zh) 语音文本生成方法、语音文本生成模型的训练方法、装置
CN116127066A (zh) 文本聚类方法、文本聚类装置、电子设备及存储介质
CN115129859A (zh) 意图识别方法、装置、电子装置及存储介质
CN109933788B (zh) 类型确定方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant