CN109918673A

CN109918673A - 语义仲裁方法、装置、电子设备和计算机可读存储介质

Info

Publication number: CN109918673A
Application number: CN201910188457.2A
Authority: CN
Inventors: 黄海荣; 李林峰; 薛强; 石渊
Original assignee: Hubei Ecarx Technology Co Ltd
Current assignee: Ecarx Hubei Tech Co Ltd
Priority date: 2019-03-14
Filing date: 2019-03-14
Publication date: 2019-06-21
Anticipated expiration: 2039-03-14
Also published as: CN109918673B

Abstract

本发明提供了一种语义仲裁方法、装置、电子设备和计算机可读存储介质，涉及人工智能的技术领域，通过引入根据当前输入语句的前一语句得到的语义场景，领域分类网络模型将文本向量、词槽类型信息和语义场景进行分类，确定出当前输入语句所属的目标对话领域和所属该目标对话领域的概率，再通过所属的目标领域对应的语义规则对当前输入语句进行语义匹配，进而得到多个候选语义，根据候选语义与语义规则的匹配程度以及此候选语义对应的目标领域的概率从候选语义中筛选出目标语义，实现在多轮对话中有效解决语义歧义的问题，能够获知同一语句在不同上下文场景下的不同意图，以提升语义识别的准确度。

Description

语义仲裁方法、装置、电子设备和计算机可读存储介质

技术领域

本发明涉及人工智能技术领域，尤其是涉及一种语义仲裁方法、装置、电子设备和计算机可读存储介质。

背景技术

通用语音助手应用中，多领域语义仲裁是核心功能之一，但在支持多轮对话以及跨领域的场景切换等情况下，语义仲裁的难度很大。

现有的语义仲裁模型中，对于语义识别的准确度有待进一步提升。

发明内容

有鉴于此，本发明的目的在于提供语义仲裁方法、装置、电子设备和计算机可读存储介质，在多轮对话中有效解决语义歧义，提升语义识别的准确度。

第一方面，本发明实施例提供了一种语义仲裁方法，包括：

获取当前输入语句的文本向量和从所述当前输入语句提取词槽类型信息；

获取当前输入语句的前一语句的语义场景，所述语义场景表示前一语句所在的对话领域和对话状态；

将所述文本向量、所述词槽类型信息和所述语义场景输入已训练的领域分类网络模型确定出所述当前输入语句所属的目标对话领域及各所述目标对话领域的概率；

根据所述当前输入语句所属的各目标对话领域对应的语义规则对所述当前输入语句进行语义匹配得到多个候选语义；

根据各所述候选语义的匹配程度及各所述候选语义对应的目标对话领域的概率从多个所述候选语义筛选出目标语义。

结合第一方面，本发明实施例提供了第一方面的第一种可能的实施方式，其中，所述将所述文本向量、所述词槽类型信息和所述语义场景输入已训练的领域分类网络模型确定出所述当前输入语句所属的目标对话领域及各所述目标对话领域的概率，包括：

将所述文本向量、所述词槽类型信息和所述语义场景输入已训练的领域分类网络模型确定出所述当前输入语句所属的各个对话领域及各个所述对话领域的概率；

按照各所述对话领域的概率从大到小的顺序对各所述对话领域进行排序；

筛选出排名靠前的设定数量个对话领域作为目标对话领域及目标对话领域的概率。

结合第一方面，本发明实施例提供了第一方面的第二种可能的实施方式，其中，所述根据各所述候选语义的匹配程度及其对应的目标对话领域的概率从多个所述候选语义筛选出目标语义，包括：

根据各所述候选语义中包括的词槽的数量、词槽的有效性以及匹配出词槽的字符数量确定各所述候选语义的匹配程度评分；

计算各所述候选语义的匹配程度评分和预设匹配程度权重的乘积，得到各所述候选语义的匹配程度的得分；

计算各所述候选语义的匹配程度的得分与各所述候选语义对应的目标对话领域的概率之和，得到各所述候选语义的综合评分；

根据各所述候选语义的综合评分的大小，从多个所述候选语义中筛选出目标语义。

结合第一方面，本发明实施例提供了第一方面的第三种可能的实施方式，其中，所述获取当前输入语句的前一语句的语义场景，包括：

识别出前一语句中包括的关键词；

根据关键词的词槽类型确定所述前一语句所在的对话领域；

根据预先设定的针对所述前一语句的反馈语句确定所述前一语句的对话状态；

根据预先定义的语义场景模式，确定出包括所述前一语句所在对话领域和对话状态的语义场景。

结合第一方面，本发明实施例提供了第一方面的第四种可能的实施方式，其中，所述领域分类网络模型通过以下方式训练得到：

获取多个样本语句，各所述样本语句包括输入语句、所述输入语句所属的对话领域和所述输入语句中包含的词槽类型信息；

将各所述样本语句依次输入领域分类网络模型对所述领域分类网络模型进行训练，得到已训练的领域分类网络模型。

结合第一方面，本发明实施例提供了第一方面的第五种可能的实施方式，其中，所述词槽类型信息包括：词槽类型和词槽类型对应的向量值。

结合第一方面，本发明实施例提供了第一方面的第六种可能的实施方式，其中，所述方法还包括：将从所述多个候选语义中筛选出的所述目标语义转换成自然语言进行输出。

第二方面，本发明实施例还提供一种语义仲裁装置，应用于电子设备，所述装置包括：

第一获取模块，用于获取当前输入语句的文本向量和从所述当前输入语句提取词槽类型信息；

第二获取模块，用于获取当前输入语句的前一语句的语义场景，所述语义场景表示前一语句所在的对话领域和对话状态；

分类模块，用于将所述文本向量、所述词槽类型信息和所述语义场景输入已训练的领域分类网络模型确定出所述当前输入语句所属的目标对话领域及各所述目标对话领域的概率；

匹配模块，用于根据所述当前输入语句所属的各目标对话领域对应的语义规则对所述当前输入语句进行语义匹配得到多个候选语义；

筛选模块，用于根据各所述候选语义的匹配程度及各所述候选语义对应的目标对话领域的概率从多个所述候选语义筛选出目标语义。

第三方面，本发明实施例还提供一种电子设备，包括存储器、处理器及存储在所述存储器上并且能够在所述处理器上运行的程序，所述处理器执行所述程序时实现如上所述的语义仲裁方法。

第四方面，本发明实施例还提供一种计算机可读存储介质，所述可读存储介质中存储有计算机程序，所述计算机程序被执行时实现如上所述的语义仲裁方法。

本发明提供了一种语义仲裁方法、装置、电子设备和计算机可读存储介质，通过引入根据当前输入语句的前一语句得到的语义场景，领域分类网络模型将文本向量、词槽类型信息和语义场景进行分类，确定出当前输入语句所属的目标对话领域和所属该目标对话领域的概率，再通过所属的目标领域对应的语义规则对当前输入语句进行语义匹配，进而得到多个候选语义，根据候选语义与语义规则的匹配程度以及此候选语义对应的目标领域的概率从候选语义中筛选出目标语义，实现在多轮对话中有效解决语义歧义的问题，能够获知同一语句在不同上下文场景下的不同意图，以提升语义识别的准确度。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种语义仲裁方法流程图；

图2为本发明实施例提供的另一种语义仲裁方法流程图；

图3为本发明实施例提供的电子设备的硬件架构示意图；

图4是本申请一示例性实施例示出的一种语义仲裁装置的方框示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

自然语言理解技术是对话系统、智能机器人等高级应用的基础。自然语言理解(Natural Language Understanding，NLU)技术主要涉及对用户问句的意图识别和关键要素抽取(也叫词槽抽取，或实体提取)。

目前，在实际对话应用中，由于对话情景具有上下文多个语句，需要准确识别当前语句所属的对话领域，在支持多轮对话以及跨领域的场景切换等情况下，语义仲裁(根据语义所属领域进行准确地语义理解裁决)的难度很大。

例如：“明天去北京的票”这句话，在前一句输入分别为“帮我要买火车票”和“帮我买飞机票”的情况下，分别属于“火车票”和“飞机票”两个不同的垂直领域。再例如：“附近哪里有A”和“附近哪里有B”，这两句话的句式完全一样，区别在于“A”和“B”这两个实体店铺可能具有不同的类型，如A为餐馆名，B为商店名，则需要将这两句话分别分类到“餐饮”和“购物”这两个领域，在没有特定领域知识的情况下，是很难正确完成的。

已有的基于深度学习算法的网络模型，解决方法是将输入语句转化为向量，作为网络模型的输入，并得到分类标签，也就是输入语句的所属对话领域。在这个过程中，由于没有考虑输入语句的上下文信息以及上下文信息对应的领域信息，因此无法区分同一个输入语句(或者不同领域的相似语句)在输入语句对应的不同上下文场景下的不同意图。

基于此，本发明实施例提供的一种语义仲裁方法、装置、电子设备和计算机可读存储介质，在多轮对话中有效解决语义歧义，能够获知同一语句在不同上下文场景下的不同意图，以提升语义识别的准确度。

为便于对本实施例进行理解，首先对本发明实施例所公开的一种语义仲裁方法进行详细介绍。

图1为本发明实施例提供的一种语义仲裁方法流程图。

参照图1，本发明实施例描述了一种应用于多轮对话中的语义仲裁方法，该方法将上下文的对话场景融合到基于深度学习的领域分类网络模型中，包括以下步骤：

步骤S110，获取当前输入语句的文本向量和从当前输入语句提取词槽类型信息，其中，通过对当前输入语句进行分词后的分词特性可获得文本向量；通过提取当前输入语句的词槽类型获得词槽类型信息。

这里，词槽类型信息包括：词槽类型和词槽类型对应的向量值。

具体地，获取当前输入语句，将当前输入语句进行分词处理，得到各个词组；在预设文本向量表中查找与各个词组相一致的各个向量；通过各个向量生成文本向量，该文本向量一般为向量矩阵。

步骤S120，获取当前输入语句的前一语句的语义场景，语义场景表示前一语句所在的对话领域和对话状态。

作为一种可选的实施例，上述语义场景以及词槽类型信息可选用向量形式，具体如下：

语义场景向量：获取前一语句的语义场景；在预设场景向量列表进行查找与语义场景一致的一维数组，将该一维数组作为场景向量。

词槽类型向量：将当前输入语句与预设词槽组中词槽进行匹配；若匹配成功，则将词槽所在数组项置为1；若匹配失败，则将词槽所在数组项置为0；当当前输入语句中的词槽全部遍历完成时，得到一维数组，将该一维数组作为词槽类型向量。

其中，词槽类型向量可采用独热码one-hot编码方式，即生成一个长度为n的数组(n为所有可能的词槽类型的个数)，数组的每一项对应一个词槽类型。对于当前输入语句中出现的词槽，其对应的数组项置为1，否则置为0。

步骤S130，将文本向量、词槽类型信息和语义场景输入已训练的领域分类网络模型确定出当前输入语句所属的目标对话领域及各目标对话领域的概率。

需要说明的是，领域分类网络模型可粗略地确定出当前输入语句所属的一个或多个目标对话领域以及所属该目标对话领域的概率。

步骤S140，根据当前输入语句所属的各目标对话领域对应的语义规则对当前输入语句进行语义匹配得到多个候选语义。

步骤S150，根据各候选语义的匹配程度及各候选语义对应的目标对话领域的概率从多个候选语义筛选出目标语义。

在实际应用的优选实施例中，通过引入根据当前输入语句的前一语句得到的语义场景，领域分类网络模型将文本向量、词槽类型信息和语义场景进行分类，确定出当前输入语句所属的目标对话领域和所属该目标对话领域的概率，再通过所属的目标领域对应的语义规则对当前输入语句进行语义匹配，进而得到多个候选语义，根据候选语义与语义规则的匹配程度以及此候选语义对应的目标领域的概率从候选语义中筛选出目标语义，实现在多轮对话中有效解决语义歧义的问题，能够获知同一语句在不同上下文场景下的不同意图，以提升语义识别的准确度。

作为一种示例性实施例，上述语义仲裁方法应用的领域分类网络模型可通过以下步骤训练得到：

步骤S210，获取多个样本语句，各样本语句包括输入语句、输入语句所属的对话领域和输入语句中包含的词槽类型信息；

对于进行训练的网络模型来说，训练样本的构成，除了包含输入语句、输入语句所属的对话领域及其概率以外，还包含该输入语句中包含的词槽类型列表，词槽类型列表中包括词槽类型信息。因此，对于在不同场景下有歧义的同一语句，可设计多个样本。例如表1所示：

表1

步骤S220，将各样本语句依次输入领域分类网络模型对领域分类网络模型进行训练，得到已训练的领域分类网络模型。

在进行上述训练过程之前，为了进一步确保训练结果的准确性，需要定义出应用该语义仲裁方法的对话系统所支持的对话场景列表和词槽类型列表。

示例性地，首先，根据业务需求，定义所支持的对话场景列表。所谓的对话场景列表中的对话场景(语义场景)，指的是上一句对话处理完成之后，对话系统处于哪个对话领域(对话意图)和对话状态。例如，用户询问“今天的天气”，即前一输入语句为“今天的天气”，对话系统回答“请问您要查询哪里的天气”时，对话系统处于查询“天气预报”的对话领域，并且对话状态为“询问地点”，我们为定义这个语义场景为“天气_询问地点”；以此类推，我们可以定义一系列其他的语义场景，例如“天气_询问日期”、“火车票_询问目的地”、“火车票_询问出发时间”、“导航_确认目的地”等等。

其次，根据对话系统所支持的功能，需要定义所支持的词槽类型列表。词槽类型列表中包括例如：“日期”、“时间”、“城市名”、“火车站”、“歌手名”、“歌曲名”等等的词槽类型。可采用基于深度学习的命名实体识别模型或者基于字典的检索模型从输入语句中进行词槽提取，得到候选词槽列表，候选词槽列表包括大量的词槽及各词槽对应的词槽类型。

在定义对话场景列表和词槽类型列表后，需要使用大量的训练样本(样本语句)对领域分类网络模型进行训练，从而获得领域分类网络模型的权重参数，以及每一种对话场景的嵌入向量，根据训练好的分类网络模型中的权重参数和相应对话场景的嵌入向量，对输入语句进行分类，确定该输入语句所属的目标对话领域及概率。

这里，嵌入向量(英文为embedding)的含义是将离散变量转化为连续数值向量，以方便网络模型进行计算处理。例如，词向量(word embedding)是将每个单词转化为对应的浮点数向量，场景向量就是将每一种语义场景转化为对应的浮点数向量。得到这些向量的具体方法是首先将上述所有的向量都初始化为随机数值，然后用训练样本对网络模型进行训练，在训练过程中逐步将这些向量的值调整成为连续数值向量，使得训练后的网络模型的分类错误率最小。

领域分类网络模型的输入包括文本向量，以及场景向量和词槽类型向量，由于领域分类网络模型是通过大量训练样本进行训练的，通过训练样本指示领域分类网络模型当前输入语句在某个场景下应该如何分类，因此训练出来的网络模型会综合考虑这些向量来得到分类结果。对于前一句话和后一句话之间没有关联性的情况，需要通过对训练样本进行标注指示领域分类网络模型，例如一些无论在什么对话场景下都不影响其含义的对话意图较强的语句，也需要给出在各种场景下的训练样本，即使对于这些不同场景下的训练样本都训练得出同一个训练结果。因此，采用这种方法所需要的训练样本的数量会比传统的无场景分类模型要多一些。对网络模型进行训练后，网络模型会参考语义场景得到分类结果。

在应用过程中，上述实施例中的步骤S120所述的获取当前输入语句的前一语句的语义场景可以用以下步骤实现，包括：

步骤S310，识别出前一语句中包括的关键词；

步骤S320，根据关键词的词槽类型确定前一语句所在的对话领域；

步骤S330，根据预先设定的针对前一语句的反馈语句确定前一语句的对话状态；

步骤S340，根据预先定义的语义场景模式，确定出包括前一语句所在对话领域和对话状态的语义场景。

例如，用户询问“今天的天气”，即对话系统将“今天的天气”作为前一输入语句，并识别出关键词“天气”以及该关键词对应的词槽类型，通过该词槽类型得到对应的对话领域“天气”，根据对话系统预先设定的反馈语句(该反馈语句为根据对话领域预先定义的语句)，对话系统针对该输入语句的反馈语句例如为“请问您要查询哪里的天气”，此时，对话系统处于查询“天气预报”的对话领域，并且根据反馈语句可以确定对话状态为“询问地点”，根据预先定义的包含对话领域和对话状态的各种场景模式，可以确定出该前一语句，即“今天的天气”所在的语义场景，例如定义这个语义场景为“天气_询问地点”。

若当前输入语句为：北京，则后续可以确定出当前的用户意图是需要查询北京的天气，这样根据前一语句的语义场景可以更准确的识别用户的意图。

在应用过程中，步骤S130还可以用以下步骤实现，包括：

步骤S410，将文本向量、词槽类型信息和语义场景输入已训练的领域分类网络模型确定出当前输入语句所属的各个对话领域及各个对话领域的概率；

步骤S420，按照各对话领域的概率从大到小的顺序对各对话领域进行排序；

步骤S430，筛选出排名靠前的设定数量个对话领域作为目标对话领域及目标对话领域的概率。

这里，将各个对话领域的概率进行排序，选取预设个数的数值较大的概率对应的对话领域作为目标对话领域，其中，选中的目标对话领域可用字符串来表示。

其中，领域分类网络模型可支持固定数量的对话领域分类，可输出一个数组形式的分类标签，该分类标签包括该输入语句对应于每一个对话领域的相应概率，这个概率可以理解为输入语句属于该对话领域的可能性。每一个对话领域的概率都是0到1之间的小数，所有对话领域的概率之和为1。

经过训练的领域分类网络模型，对输入语句进行分类，预测其属于各个对话领域的概率。对话系统不仅仅需要判断输入语句属于哪个对话领域，还需要判断其具体意图和状态，目前效果较好的方法是采用语义规则进行匹配。

领域分类网络模型输出的是较为粗略的对话领域，例如只分类到一个大的领域，而每个领域内还需要进一步细分为许多种不同的具体意图；同时，语句中的词槽上常常会有一些表示程度的修饰词，例如表示价格的词槽需要区分“100元左右”、“不到100元”、“100元以上”、“100元到200元”等区别，用语义规则来进行匹配是一种较为有效的方法，能够判断细分的意图并将语义中较为微妙的程度含义，如“左右”、“不到”、“以上”提取出来，在匹配到各种前后缀修饰词时，在输出语义时添加一些附加信息，以进行语义的正确识别，并进行相应的处理。

在对话系统支持的对话领域较多时，对话领域对应的语义规则较多，需要的运算能力和内存都是比较大的。因此使用领域分类网络模型的预设个数(如前3个)概率值最高的对话领域作为参考，可以将大多数与输入语句无关的对话领域对应的语义规则过滤掉，这样能够大大地节约服务器资源。

在一些可能的优选实施例中，为了极大程度地减少了计算量，提高了云端服务的业务处理能力，使用领域分类网络模型输出的目标对话领域以及所属该目标对话领域的概率对语义规则的搜索空间进行裁剪。

优选地，上述实施例提供的步骤S140所述的根据当前输入语句所属的各目标对话领域对应的语义规则对当前输入语句进行语义匹配得到多个候选语义具体可以包括:

当前输入语句在所属的各目标对话领域内基于语义规则进行语义匹配得到多个候选语义。

这里各个目标对话领域所对应的语义规则可能是不同的，一个目标对话领域可对应一个语义规则，其中，语义规则指对输入语句进行语义识别的算法，该算法可采用已有的语义识别算法，可识别出输入语句的意图或者含义。

在根据语义规则对输入语句进行语义匹配的具体方法，例如为，可将当前输入语句进行分词处理，得到各个词组以及各个词组的词槽类型及各词语之间的关联性等得到对当前输入语句的多个候选语义。

举个例子，当前输入语句为“刘德华的忘情水”，经过分词处理，得到词组包括“刘德华”、“的”、“忘情水”，其中，“刘德华”为人名(也可能为歌曲名)、“的”为助词、“忘情水”为歌曲名(也可能为饮料名、形容词等)，按照语义规则进行识别可知晓，“刘德华”表示为人名(或者歌曲名)，作为助词的“的”表示连接助词，“忘情水”可表示歌曲名(或者饮料名)，据此，可能得到多个候选语义，例如，当前输入语句的候选语义为：想听刘德华的忘情水这首歌、想喝忘情水这种饮料，想听刘德华这首歌并且想喝忘情水这种饮料。

可以理解的是，这里将当前输入语句进行分词处理后的词组可能包括一个词语或一个字。

在应用过程中，步骤S150所述的根据各候选语义的匹配程度及各所述候选语义对应的目标对话领域的概率从多个所述候选语义筛选出目标语义，可以用以下步骤实现，包括：

步骤S610，根据各候选语义中包括的词槽的数量、词槽的有效性以及匹配出词槽的字符数量确定各候选语义的匹配程度评分；

步骤S620，计算各候选语义的匹配程度评分和预设匹配程度权重的乘积，得到各候选语义的匹配程度的得分；

步骤S630，计算各候选语义的匹配程度的得分与各候选语义对应的目标对话领域的概率之和，得到各候选语义的综合评分；

步骤S640，根据各候选语义的综合评分的大小，从多个候选语义中筛选出目标语义。

语义规则自身有一个匹配度的综合评分，评分依据包含多个因素，例如词槽的数量、词槽的有效性、匹配出的词槽的字符数量等等，其中，词槽的有效性指词槽的内容的有效性，即对于一些可能的情况，由于一些失误操作，语义规则中出现的词槽的内容出现问题，导致该词槽内容不能呈现一个正确的内容含义，此时的词槽不具备有效性。

例如，对于“刘德华的忘情水”进行语义匹配得到的多个候选语义分别为：想听刘德华的忘情水这首歌、想喝忘情水这种饮料，想听刘德华这首歌并且想喝忘情水这种饮料。对于“想听刘德华的忘情水这首歌”该候选语义中，包含的词槽数量为三个“刘德华”、“的”、“忘情水”，有效的词槽也为三个，能匹配的字符数量为七个。对于“想喝忘情水这种饮料”该候选语义中，包含的词槽数量为一个“忘情水”，有效的词槽为一个“忘情水(假设有忘情水这种饮料)”，能匹配的字符数量为三个。对于“想听刘德华这首歌并且想喝忘情水这种饮料”该候选语义中，包含的词槽数量为两个“刘德华”(假设有刘德华这首歌)、“忘情水”(假设有忘情水这种饮料)，有效的词槽也为两个，能匹配的字符数量为六个。

根据上述三个候选语义的匹配程度评分，评分最高的候选语义为“想听刘德华的忘情水这首歌”(例如为90)、其次为“想听刘德华这首歌并且想喝忘情水这种饮料”(例如为80)，再次为“想喝忘情水这种饮料”(例如为60)。

由于每个语义规则都可以对应到前述领域分类网络模型的一个对话领域，因此可以将该对话领域的概率与语义规则对各候选语义的匹配程度的得分进行加权求和，得到最终的得分，并将该得分作为排序依据。例如某候选语义的匹配程度评分是x,可选取一个预设匹配程度权重a，候选语义的匹配程度评分和预设匹配程度权重的乘积a*x则为候选语义的匹配程度的得分，得到各所述候选语义的匹配程度的得分，与此同时，候选语义对应的语义规则所属的对话领域的概率是y，那么候选语义的综合评分可以采用a*x+y。其中，预设匹配程度权重可以通过多次尝试以得到一个效果最好的取值，如0.5。

例如，对于上述三个候选语义对应的目标对话领域，假设属于音乐领域的概率为0.7，属于零售领域的概率为0.5，其他领域的为0.3，则上述三个候选语义中，“想听刘德华的忘情水这首歌(对应领域为音乐领域)”的综合评分为90*0.5+0.7＝45.7；“想听刘德华这首歌并且想喝忘情水这种饮料(对应领域为其他领域)”的综合评分为80*0.5+0.3＝40.3；“想喝忘情水这种饮料(对应领域为零售领域)”的综合评分为60*0.5+0.5＝30.5。

可见，上述三个候选语义中，综合评分最高的为“想听刘德华的忘情水这首歌”，可将该候选语义作为目标语义，或者从三个候选语义中筛选出两个综合评分最高的。

在实际应用的过程中，使用语义规则匹配会产生多个可能的语义结果，需要进行逐条处理，以获取最佳结果。通过将各对话领域的概率结合语义规则对各候选语义的匹配程度的得分作为排序依据，使得整体匹配度较高的结果排在前面，整体匹配度较高的结果对应的候选语义为目标语义，使得能够更快地命中最佳结果，提高了处理效率。

作为另一种可选的实施例，本发明实施例提供的语义仲裁方法还包括：将从多个候选语义中筛选出的目标语义转换成自然语言进行输出，以便其他智能系统可对该自然语言进行理解或应用。

作为一种可能的应用场景，通过前一语句的语义场景可获知当前输入语句处于的对话领域可以是：“购买火车票”，对话系统内部通常有一个状态机，表示系统当前的对话状态，如系统当前在等待用户回答某个问题，或者等待用户进行选择，或者等到用户对刚才的问题进行确认等，以及系统当前的对话属于哪个对话领域。例如：用户说“我要买火车票”,系统回答“请问你要去哪里”，此时系统期望用户回答一个地点，那么就会将对话状态设置为“火车票_询问地点”。

对话系统中的上下文管理模块包括“对话领域_对话状态”(当前输入语句所处于的语义场景)，即为前一语句的语义场景，比如“火车票_询问地点”,“飞机票_询问时间”，“拨打电话_等待确认”这些语义场景。

对话系统中的对话管理模块处理完一个语句后，系统会进入特定的对话领域和对话状态(即语义场景)的识别，比如识别出输入语句属于火车票领域的询问地点状态。每一种语义场景都有其对应的场景向量，将场景向量和当前输入语句对应的词槽类型向量和文本向量一起输入到领域分类网络模型中，就得到该当前输入语句的对话领域以及对应的概率。当前输入语句所处语义场景(包括对话领域和对话状态)是通过对前一句话进行识别得到的，即前一语句的语义场景，而当前输入语句的目标语义也会直接影响后一输入语句的对应的对话领域的分类结果，这种影响是通过语义场景对应的场景向量来实现的。

如图2所示，本发明实施例还提供一种语义仲裁方法，应用于包括输入文本嵌入模块、命名实体识别模型、场景嵌入模块、领域分类网络模型、语义识别模型、筛选模块、对话管理模块、上下文管理模块的对话系统，这里，语义仲裁方法包括：

首先，将当前输入语句输入文本嵌入模块和命名实体识别模型，文本嵌入模块经过word2vec等算法得到文本向量，可采用例如LSTM-CRF的命名实体识别模型，从输入语句中抽取的词槽类型向量。

其次，从场景嵌入模块根据当前输入语句的前一输入语句语义场景产生的场景向量。

再次，将文本向量、词槽类型向量和场景向量输入到包括基于深度学习算法的文本分类模型，如fastText、LSTM、textCNN等的领域分类网络模型中进行分类，得到从对话领域中挑选出的前n个(典型值为3个)概率最高的目标对话领域及其概率；

再次，将当前输入语句以及前n个目标对话领域及其概率输入语义识别模型，根据目标对话领域语义识别模型基于语义规则对当前输入语句进行语义匹配，得到多个候选语义，例如，包括m个。

再次，将各个候选语义以及前n个目标对话领域及其概率输入到筛选模块中，筛选模块将根据各候选语义的匹配程度及各候选语义对应的目标对话领域的概率从候选语义中筛选出得到最为匹配的目标语义。

再次，将目标语义输入到对话管理模块中，对话管理模块根据目标语义识别出当前输入语句的语义场景，并且还可以将目标语义转换成自然语言进行输出。

进一步的，上下文管理模块会获取当前输入语句的前一语句的包括对话领域和对话状态的语义场景，作为领域分类网络模型的输入。

并且，对话管理模块会将基于目标语义获取的当前输入语句对应的语义场景输出给上下文管理模块，使得上下文管理模块获取到的对话领域和对话状态(当前语义场景)，进而根据当前语义场景生成的场景向量作为当前输入语句的下一输入语句的语义场景，即作为领域分类网络模型的输入，影响下一输入语句对话领域的分类结果。

本发明实施例提供了一种应用于多轮对话中的语义仲裁方法，该方法将对话场景融合到基于深度学习的文本分类模型中，在多轮对话中有效解决语义歧义；同时将基于深度学习的文本分类模型与基于语义规则的语义分析模型相互结合，使用分类模型输出结果对语义规则模型的搜索空间进行裁剪，从而极大地减少了计算量，提高了云端服务的业务处理能力。

进一步地，如图3所示，是本发明实施例提供的用于实现所述语义仲裁方法的电子设备300的示意图。本实施例中，所述电子设备300可以是，但不限于，个人电脑(PersonalComputer，PC)、笔记本电脑、监控设备、服务器等具备分析及处理能力的计算机设备。

图3为本发明实施例提供的电子设备300的硬件架构示意图。参见图3所示，该计算机设备包括：机器可读存储介质301和处理器302，还可以包括非易失性介质303、通信接口304和总线305；其中，机器可读存储介质301、处理器302、非易失性介质303和通信接口304通过总线305完成相互间的通信。处理器502通过读取并执行机器可读存储介质301中语义仲裁方法的机器可执行指令，可执行上文实施例描述语义仲裁方法。

本文中提到的机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置，可以包含或存储信息，如可执行指令、数据，等等。例如，机器可读存储介质可以是：RAM(Radom Access Memory，随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、dvd等)，或者类似的存储介质，或者它们的组合。

非易失性介质可以是非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、dvd等)，或者类似的非易失性存储介质，或者它们的组合。

本实施例还提供了一种语义仲裁装置，如图4所示，所述语义仲裁装置包括：

第一获取模块210，用于获取当前输入语句的文本向量和从所述当前输入语句提取词槽类型信息，可实现如图2中所示的文本嵌入模块和命名实体识别模型的功能；

第二获取模块220，用于获取当前输入语句的前一语句的语义场景，所述语义场景表示前一语句所在的对话领域和对话状态，可实现如图2中所示的对话管理模块、上下文管理模块和场景嵌入模块的功能；

分类模块230，用于将所述文本向量、所述词槽类型信息和所述语义场景输入已训练的领域分类网络模型确定出所述当前输入语句所属的目标对话领域及各所述目标对话领域的概率，可实现如图2中所示的领域分类网络模型的功能；

匹配模块240，用于根据所述当前输入语句所属的各目标对话领域对应的语义规则对所述当前输入语句进行语义匹配得到多个候选语义，可实现如图2中所示的语义识别模型的功能；

筛选模块250，用于根据各所述候选语义的匹配程度及各所述候选语义对应的目标对话领域的概率从多个所述候选语义筛选出目标语义。

此外，对话管理模块还用于将从多个候选语义中筛选出的目标语义转换成自然语言进行输出。

可以理解的是，本实施例中的各功能模块的具体操作方法可参照上述方法实施例中相应步骤的详细描述，在此不再重复赘述。

本发明实施例所提供计算机可读存储介质，所述可读存储介质中存储有计算机程序，所述计算机程序代码被执行时可实现上述任一实施例所述的语义仲裁方法，具体实现可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。

Claims

1.一种语义仲裁方法，其特征在于，包括：

2.根据权利要求1所述的语义仲裁方法，其特征在于，所述将所述文本向量、所述词槽类型信息和所述语义场景输入已训练的领域分类网络模型确定出所述当前输入语句所属的目标对话领域及各所述目标对话领域的概率，包括：

3.根据权利要求1所述的语义仲裁方法，其特征在于，所述根据各所述候选语义的匹配程度及其对应的目标对话领域的概率从多个所述候选语义筛选出目标语义，包括：

4.根据权利要求1所述的语义仲裁方法，其特征在于，所述获取当前输入语句的前一语句的语义场景，包括：

识别出前一语句中包括的关键词；

根据关键词的词槽类型确定所述前一语句所在的对话领域；

5.根据权利要求1-4任一项所述方法，其特征在于，所述领域分类网络模型通过以下方式训练得到：

6.根据权利要求1-4任一项所述的语义仲裁方法，其特征在于，所述词槽类型信息包括：词槽类型和词槽类型对应的向量值。

7.根据权利要求1-4任一项所述的语义仲裁方法，其特征在于，所述方法还包括：将从所述多个候选语义中筛选出的所述目标语义转换成自然语言进行输出。

8.一种语义仲裁装置，其特征在于，应用于电子设备，所述装置包括：

9.一种电子设备，其特征在于，包括存储器、处理器及存储在所述存储器上并且能够在所述处理器上运行的程序，所述处理器执行所述程序时实现如权利要求1至7中任一项所述的语义仲裁方法。

10.一种计算机可读存储介质，其特征在于，所述可读存储介质中存储有计算机程序，所述计算机程序被执行时实现权利要求1-7中任意一项所述的语义仲裁方法。