CN113127602B

CN113127602B - 一种意图识别方法及装置

Info

Publication number: CN113127602B
Application number: CN202110482962.5A
Authority: CN
Inventors: 简仁贤; 李佳纯; 佘昌宪
Original assignee: Emotibot Technologies Ltd
Current assignee: Emotibot Technologies Ltd
Priority date: 2021-04-30
Filing date: 2021-04-30
Publication date: 2023-05-26
Anticipated expiration: 2041-04-30
Also published as: CN113127602A

Abstract

本申请提供了一种意图识别方法及装置，该方法包括：使用预设模型对同一句子预测M次；将每次预测获得的意图类别信心值P_i和无意图类别的信心值TH比较，保留P_i＞TH的意图类别；将所述保留的意图类别信心值进行调分，获得信心分数。本申请上述实施例提供的技术方案，可以解决无法精准识别长句子中所包含的多个意图的问题。

Description

一种意图识别方法及装置

技术领域

本申请涉及人工智能领域，特别涉及一种意图识别方法及装置。

背景技术

在人机对话的过程中，输入至机器的句子往往会包含长句子，而长句子往往会包含多个意图。因此，长句子容易造成机器学习模型不能判断出句子中所有的意图，最终导致句子经过机器学习模型预测所输出的意图类别不完整。在这种情况下，机器无法精准识别出长句子中的意图，进而无法根据句子中的意图进行相应的对话，即使可以对话，但出现错误的可能性也极大。

发明内容

有鉴于此，本申请实施例提供了一种意图识别方法，可以解决无法精准识别长句子中所包含的多个意图的问题。

本申请实施例提供的了一种意图识别方法，包括：使用预设模型对同一句子预测M次；将每次预测获得的意图类别信心值P_i和无意图类别的信心值TH比较，保留P_i＞TH的意图类别；将所述保留的意图类别信心值进行调分，获得信心分数。

在一个实施例中，所述使用预设模型对同一句子预测M次之前，包括：将用户输入的语料和无意图语料一同训练，获得所述预设模型；其中，所述无意图语料为在用户人机对话的历史日志中随机抽取的无意图的句子；所述预设模型的输出为意图类别和无意图类别的信心值，所述信心值为意图类别和无意图类别的机率分布。

在一个实施例中，所述预设模型每次预测获得的P_i与TH之和为1。

在一个实施例中，所述使用预设模型对同一句子预测M次，包括：抽取所述句子中长度为N的子字串，共抽取M次；使用所述预设模型分别对所述子字串进行预测。

在一个实施例中，所述抽取所述句子中长度为N的子字串，共抽取M次，包括：抽取所述句子中第一个字到第N个字作为第一子字串；位移W个字，抽取所述句子中第W个字到第N+W个字作为第二子字串，重复该步骤直至子字串的长度小于等于N，该子字串为第M子字串。

在一个实施例中，所述将所述保留的意图类别信心值进行调分，获得信心分数，包括：将所述保留的意图类别的信心值转化成与平均信心值的倍数差距Q_i；对Q_i进行调分，获得信心分数F(Q_i)。

在一个实施例中，所述Q_i＝(P_i-1/K_i)*K_i，其中，K_i为每次预测获得的意图类别和无意图类别的类别总数。

在一个实施例中，所述F(Q_i)＝1/(1+e^-Qi/2)，其中，e为自然常数。

在一个实施例中，所述将所述保留的意图类别信心值进行调分，获得信心分数之后，包括：当所述保留的意图类别中存在相同意图类别时，保留信心分数高的意图类别。

本申请实施例提供了一种意图识别装置，包括：预测模块，用于使用预设模型对同一句子预测M次；比较模块，用于将每次预测获得的意图类别信心值P_i和无意图类别的信心值TH比较，保留P_i＞TH的意图类别；调分模块，用于将所述保留的意图类别信心值进行调分，获得信心分数。

本申请上述实施例提供的技术方案，通过使用适当的预设模型对长句子进行多次预测，剔除信心值低于无意图类别的意图，保留下的意图类别可以完整体现出长句子所包含的意图。同时，通过对保留下来的意图类别信心值进行调分，经过调分后的信心值能够适当反映出各意图类别信心值的差异，有利于人机对话系统中机器能更精准的出话，提高机器的智能程度。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。通过附图所示，本申请的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图，重点在于示出本申请的主旨。

图1为本申请实施例提供的模型训练方法的流程示意图；

图2为本申请另一实施例提供的模型训练方法的流程示意图；

图3为本申请另一实施例提供的模型训练方法的流程示意图；

图4为本申请实施例提供的模型训练装置的框图。

图5为本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

在人机对话的真实系统中，在用户和机器对话的过程里，用户输入长句子的可能性很大，用户会在一个句子中表达多个意图。如果按通常的方式，通过模型预测出长句子的意图，极有可能导致部分意图类别无法被预测到。

另外，人机对话的真实系统中一般会设定信心阈值，只有信心值达到信心阈值的意图才会作为模型预测的结果输出，这样那些不能体现用户真实意图的意图类别可被剔除。但是，由于长句子往往包含多个意图，就导致预测的信心值容易过低，并且各个意图的信心值直接差异很小，导致真实场景下无法确定合适的信心阈值。

基于上述情况，对于用户输入的长句子，由于无法准确的预测其中包含的意图，机器就无法给出精准的应答，整个人机对话系统智能程度较低。

为了解决上述问题，需要改变模型对句子预测的方式，并且对预测结果进行调分。本申请实施例提供了一种意图识别方法、装置、电子设备及计算机可读存储介质，以实现精准的获得用户在长句子中所表达的意图类别，同时为后续机器出话提供了更加适当的意图类别信心分数。该技术可采用相应的软件、硬件以及软硬结合的方式实现。以下对本申请实施例进行详细介绍。

请参阅图1，本申请实施例提供一种应用于电子设备的意图识别方法，该方法包括：

步骤S101：使用预设模型对同一句子预测M次。

在本申请实施例中，电子设备可以是机器人，用户与机器人的对话过程中，用户会向机器人输入大量的句子，句子中有长句子和短句子。当机器人收到用户输入的句子后，会识别句子中所包含的用户的意图，并根据这些意图及其信心值触发后续的机器人服务。当机器人收到用户的句子后，首先会确定句子的长度，当句子长度小于N时，此时表明收到句子是短句，机器人使用预设模型对收到的句子预测一次。当句子长度大于N时，此时表明收到的句子是长句子，机器人使用预设模型对收到的句子预测M次。通过多次预测同一个长句子，可以尽可能的将句子中的意图预测完整。

上述预测模型可以通过用户输入的语料和无意图语料一同训练得到，用户输入的语料可以是人工撰写或人工标注所得到的，这样可以保证用户输入的语料绝大部分都是有意图的，无意图语料可以从用户和机器人对话的历史日志中随机抽取的无意图的句子，用户输入的语料抽取的数量例如可以是无意图语料的2倍。训练得到的预测模型的输出可以是各个意图类别的信心值和无意图类别的出现机率分布，各个意图类别信心值可以是意图类别的出现机率，无意图类别信心值可以是无意图类别的出现机率。预测模型每进行一次预测所输出的所有信心值之和为1。

当机器人收到的句子长度大于N时，机器人将抽取句子中长度为N的子字串，共抽取M次，对于抽取得到的子字串均使用预设模型进行预测。对于抽取子字串的规则，可以是按照句子的前后顺序随机抽取长度为N的子字串，并且预设M的数值。抽取的规则也可以是按照一定的顺序进行抽取，例如，抽取句子中的第一个字到第N个字作为第一字串，然后位移W个字，抽取句子中第W个字到第N+W个字作为第二子字串。继续位移W个字，抽取句子中第2W个字到第N+2W个字作为第三子字串。不断重复位移和抽取，直至所要抽取的子字串的长度小于等于N时，停止位移和抽取，此时，该长度小于等于N的子字串就是第M个子字串。

在一个实施例中，上述每个子字串的长度N可以是预设模型所有训练语料长度的平均数取整后的数值，上述W可以是[N/2]([]表示取整)。

通过上述步骤，在预测一个长句子的意图时，可以选择预设一个适当的模型，模型需要多次对同一个长句子的子字串进行预测，并且子字串的确定可以采用一定的抽取规则，这样的方式可以使得一个长句子的完整意图均被预测出来。

步骤S102：将每次预测获得的意图类别信心值P_i和无意图类别的信心值TH比较，保留P_i＞TH的意图类别。

在本申请实施例中，对于用户输入的大于N的长句子，会使用预测模型预测M次，每一次预测都会获得若干个意图类别和一个无意图类别，并且还能预测获得若干个意图类别所对应的信心值P_i，以及无意图类别所对应的信心值TH。将所有的P_i逐一与TH进行比较，当P_i≤TH时，将这些P_i所对应的意图类别剔除，只留下P_i＞TH的意图类别。通过上述筛选，可以剔除与用户输入的长句子不相关的意图类别，使得预测的结果更加准确。

步骤S103：将所述保留的意图类别信心值进行调分，获得信心分数。

在本申请实施例中，机器人可以将保留下来的意图类别信心值分别转化成Q_i，转化的具体公式为Q_i＝(P_i-1/K_i)*K_i。其中，K_i是每次预测获得的意图类别的数量和无意图别类的数量之和。通过上述转化，信心值就调整成了与平均信心值的倍数差距，这能够适当的反应出各个意图类别的信心值之间的差异。在一个实施例中，机器人还可以对Q_i进行调分，具体的调分公式为F(Q_i)＝1/(1+e^-Qi/2)，其中，e为自然常数。经过调分之后，所获得的F(Q_i)就是信心分数。经过转化和调分之后，各个意图的信心值转变成了信心分数，信心分数相较于信心值会变大，并且信心分数能够适当的反应出各类意图之间的差异。在人机对话的真实系统中，可以较容易的设置信心阈值，通过信心阈值剔除那些不能体现用户真实意图的意图类别。这样机器可以进一步精准的获得用户在长句子中所表达的意图，并根据这些意图及其信心分数触发后续服务，机器人的智能程度将提高，人机对话系统的用户体验就可大幅提升。

当然，上述保留下来的意图类别中仍有可能存在相同的情况，在此情况下，机器人会将信心分数高的意图类别保留下来。同时，还可以将信心分数转化为百分制。经过上述一系列的预测、比较和调分，机器人就可以获得用户输入的长句子中包含的所有意图和这些意图的信心分数，而这些意图和信心分数也会作为机器人提供后续服务的依据。

通过上述步骤101-103，可以使用适当的模型对长句子进行多次预测，将预测获得的信心值大于无意图类别信心值的意图类别保留，并且将保留下来的意图类别信心分数进行调分，最终获得数值较大并且各个意图类别间差异较大的信心分数。这样，针对于人机对话过程中用户输入的长句子可以很好的识别出长句子中包含的意图。同时，在真实的人机对话系统中，可以容易的设置信心阈值，不会因为信心阈值而导致错误的剔除或保留长句子中所包含的意图。最终，机器人对用户输入的长句子中的意图可以进行精准的识别，机器人出话效果好，智能程度高，用户体验佳。

请参阅图2，本申请实施例提供一种应用于电子设备的意图识别方法，该方法具体包括：

步骤S201：使用用户输入的语料和无意图语料进行训练，获得预设模型。

在本申请实施例中，用户和机器人对话的历史日志中包含如下：

机器人在历史日志中随机抽取用户输入的语料，具体如下：

意图	句子
		订机票	帮我订上海到北京的机票一张
查机票	查一下明天下午深圳到上海的机票，要商务舱
		说笑话	说个笑话来听
查天气	明天天气如何
		查时间	现在几点几分

机器人在历史日志中随机抽取无意图的句子，具体如下：

意图	句子
		无意图	你好呀
无意图	哈哈你真逗

将上述抽取出的语料一起进行训练，获得预设模型。

步骤S202：接收用户输入的句子″我想知道现在几点还有明天会下雨吗″。

在本申请实施例中，机器人首先计算用来获得预设模型语料(包括有意图的和无意图的)的平均长度(13+20+6+6+6+3+5)/7，取整后为8。然后，统计用户输入的句子的长度，具体为16个字。用户输入的句子长度比用来获得预设模型语料的平均长度要长，因此，确认此时用户输入的句子为长句。

步骤S203：抽取用户输入的句子中的子字串，使用预设模型对子字串进行预测。

在本申请实施例中，机器人会按规则抽取用户输入的句子，形成子字串。抽取规则为：抽取的子字串的长度为用来获得预设模型语料的平均长度，位移的长度为子字串长度的一半。具体为：抽取句子中的第1个字到第8个字作为第一字串，然后位移4个字，抽取句子中第4个字到第12个字作为第二子字串。继续位移4个字，抽取句子中第8个字到第16个字作为第三子字串。获得的三个子字串如下：

第一子字串：我想知道现在几点

第二子字串：现在几点还有明天

第三子字串：还有明天会下雨吗

在获得了子字串后，预设模型将分别对三个子字串进行预测，共计预测3次，具体可以获得如下的出现机率分布，每个出现机率也即信心值：

第一子字串：查时间0.5、无意图0.3、订机票0.05、查机票0.05、说笑话0.05、查天气0.05

第二子字串：查时间0.3、无意图0.3、订机票0.1、查机票0.1、说笑话0.1、查天气0.1

第三子字串：查天气0.4、无意图0.35、订机票0.05、查机票0.05、说笑话0.05、查时间0.1

步骤S204：将每个子字串中信心值大于无意图类别信心值的意图类别保留。

在本申请实施例中，针对步骤S203中的预测结果，机器人将会对比每个子字串中意图类别信心值与无意图类别信心值的大小，对于那些信心值小于或等于无意图类别信心值的意图类别做剔除处理。经过处理后，每个子字串保留下如下意图类别及其信心值：

第一子字串：查时间0.5

第二子字串：(无)

第三子字串：查天气0.4

步骤S205：将保留的意图类别信心值进行转化和调分，获得信心分数。

在本申请实施例中，机器人在经过预测和比较后，会对保留下来的意图类别信心值进行转化，转化为与平均信心值的倍数差距Q_i，转化的公式为：Q_i＝(P_i-1/K_i)*K_i，其中，K_i是每次预测获得的意图类别的数量和无意图别类的数量之和，在本实施例中，每个子字串的K_i均为6。

信心值转为与平均分数的倍数差距的具体情况如下：

第一子字串：查时间0.5，变为Q₁＝(0.5-1/6)*6＝2.0

第三子字串：查天气0.4，变为Q₃＝(0.4-1/6)*6＝1.4

信心值转化后的Q_i还需要进行调分，获得信心分数F(Q_i)，调分的公式为F(Q_i)＝1/(1+e^-Qi/2)，具体情况如下：

第一子字串：查时间Q₁＝2.0，F(Q₁)＝F(2.0)＝0.7310

第三子字串：查天气Q₃＝1.4，F(Q₃)＝F(1.4)＝0.6681

最后，将保留下来的意图类别的信心分数转为100分制，则可以看到对于用户输入的句子″我想知道现在几点还有明天会下雨吗″，机器人可以预测出：查天气73.1分、查天气66.8分。

通过这种对同一个句子进行多次预测并进行调分方法，在人机对话中，机器可以识别出长句子中用户所要表达的完整的意图，同时，机器还会对所识别出的意图进行调分后，这对于后续机器人出话有很大帮助，可提高整个人机对话系统的智能程度。

请参阅图3，本申请实施例提供一种应用于电子设备的意图识别方法，该方法具体包括：

步骤S301：使用用户输入的语料和无意图语料进行训练，获得预设模型。

机器人在历史日志中随机抽取用户输入的语料，具体如下：

意图	句子
		订机票	帮我订上海到北京的机票一张
查机票	查一下明天下午深圳到上海的机票，要商务舱
		说笑话	说个笑话来听
查天气	明天天气如何
		查时间	现在几点几分
查时间	现在是纽约时间几点呀

机器人在历史日志中随机抽取无意图的句子，具体如下：

将上述抽取出的语料一起进行训练，获得预设模型。

步骤S302：接收用户输入的句子″我下个月放了长假帮我查上海到波士顿的机票，对了波士顿现在几点，我要打个电话给阿姨″。

在本申请实施例中，机器人首先计算用来获得预设模型语料(包括有意图的和无意图的)的平均长度(13+20+6+6+6+9+9+11+11)/9，取整后为10。然后，统计用户输入的句子的长度，具体为40个字。用户输入的句子长度比用来获得预设模型语料的平均长度要长，因此，确认此时用户输入的句子为长句。

步骤303：抽取用户输入的句子中的子字串，使用预设模型对子字串进行预测。

在本申请实施例中，机器人会按规则抽取用户输入的句子，形成子字串。抽取规则为：抽取的子字串的长度为用来获得预设模型语料的平均长度，位移的长度为子字串长度的一半。具体为：抽取句子中的第1个字到第10个字作为第一字串，然后位移5个字，抽取句子中第5个字到第15个字作为第二子字串。继续位移5个字，抽取句子中第10个字到第20个字作为第三子字串。不断重复位移和抽取，直至所要抽取的子字串的长度小于等于10时，停止位移和抽取，此时，该长度小于等于10的子字串就是最后一个子字串。获得的八个子字串如下：

第一子字串：我下个月放了长假帮我

第二子字串：了长假帮我查上海到波

第三子字串：查上海到波士顿的机票

第四子字串：士顿的机票，对了波士

第五子字串：，对了波士顿现在几点

第六子字串：顿现在几点，我要打个

第七子字串：，我要打个电话给阿姨

第八子字串：电话给阿姨

在获得了子字串后，预设模型将分别对八个子字串进行预测，共计预测8次，具体可以获得如下的出现机率分布，每个出现机率也即信心值：

第一子字串：无意图0.8、查时间0.04、订机票0.04、查机票0.04、说笑话0.04、查天气0.04

第二子字串：无意图0.45、查机票0.45、查时间0.03、订机票0.03、说笑话0.03、查天气0.01

第三子字串：查机票0.7、无意图0.15、订机票0.1、查天气0.02分、说笑话0.02、查时间0.01

第四子字串：查机票0.45、无意图0.35、订机票0.1、查天气0.04、说笑话0.03、查时间0.03

第五子字串：查时间0.8、无意图0.1、查天气0.03、订机票0.03、查机票0.03、说笑话0.01

第六子字串：查时间0.4、无意图0.3、订机票0.1、查机票0.1、查天气0.05、说笑话0.05

第七子字串：无意图0.45、查时间0.45、查机票0.03、订机票0.03、说笑话0.03、查天气0.01

第八子字串：无意图0.8、查时间0.04、订机票0.04、查机票0.04、说笑话0.04、查天气0.04

步骤S304：将每个子字串中信心值大于无意图类别信心值的意图类别保留。

在本申请实施例中，针对步骤S303中的预测结果，机器人将会对比每个子字串中意图类别信心值与无意图类别信心值的大小，对于那些信心值小于或等于无意图类别信心值的意图类别做剔除处理。经过处理后，每个子字串保留下如下意图类别及其信心值：

第一子字串：(无)

第二子字串：(无)

第三子字串：查机票0.7

第四子字串：查机票0.45

第五子字串：查时间0.8

第六子字串：查时间0.4

第七子字串：(无)

第八子字串：(无)

步骤S305：将保留的意图类别信心值进行转化和调分，获得信心分数。

信心值转为与平均分数的倍数差距的具体情况如下：

第三子字串：查机票0.7，变为Q₃＝(0.7-1/6)*6＝3.2

第四子字串：查机票0.45，变为Q₄＝(0.45-1/6)*6＝1.7

第五子字串：查时间0.8，变为Q₅＝(0.8-1/6)*6＝3.8

第六子字串：查时间0.4，变为Q₆＝(0.4-1/6)*6＝1.4

第三子字串：查机票Q₃＝3.2，F(Q₃)＝F(3.2)＝0.8320

第四子字串：查机票Q₄＝1.7，F(Q₄)＝F(1.7)＝0.7005

第五子字串：查时间Q₅＝3.8，F(Q₅)＝F(3.8)＝0.8698

第六子字串：查时间Q₆＝1.4，F(Q₆)＝F(1.4)＝0.6681

步骤S306：当保留的意图类别存在相同的类别时，保留信心分数较高的意图类别。

在本申请实施例中，查机票和查时间的意图类别分别有两个，因此，机器人会将信心分数较低的剔除，具体情况如下：

第三子字串：查机票Q₃＝3.2，F(Q₃)＝F(3.2)＝0.8320

第五子字串：查时间Q₅＝3.8，F(Q₅)＝F(3.8)＝0.8698

最后，将最终保留下来的意图类别的信心分数转为100分制，则可以看到对于用户输入的句子″我下个月放了长假帮我查上海到波士顿的机票，对了波士顿现在几点，我要打个电话给阿姨″，机器人可以预测出：查机票83.2分、查时间86.98分。

请参阅图4，本申请实施例提供一种意图识别装置，该装置包括：预测模块401、比较模块402和调分模块403。

预测模块401，用于使用预设模型对同一句子预测M次。

比较模块402，用于将每次预测获得的意图类别信心值P_i和无意图类别的信心值TH比较，保留P_i＞TH的意图类别。

调分模块403，用于将所述保留的意图类别信心值进行调分，获得信心分数。

在一实施例中，该装置还包括训练模块404，用于将用户输入的语料和无意图语料一同训练，获得所述预设模型。其中，无意图语料为在用户人机对话的历史日志中随机抽取的无意图的句子；预设模型的输出为意图类别和无意图类别的出现机率分布，P_i为意图类别的出现机率，TH为无意图类别的出现机率。

在一实施例中，预设模型每次预测获得的P_i与TH之和为1。

在一实施例中，上述预测模块401，用于抽取所述句子中长度为N的子字串，共抽取M次；使用所述预设模型分别对所述子字串进行预测。。

在一实施例中，上述预测模块401，用于抽取所述句子中第一个字到第N个字作为第一子字串；位移W个字，抽取所述句子中第W个字到第N+W个字作为第二子字串，重复该步骤直至子字串的长度小于等于N，该子字串为第M子字串。

在一实施例中，上述调分模块403，用于将所述保留的意图类别的信心值转化成与平均信心值的倍数差距Q_i；对Q_i进行调分，获得信心分数F(Q_i)。

在一实施例中，上述Q_i＝(P_i-1/K_i)*K_i，其中，K_i为每次预测获得的意图类别和无意图类别的类别总数。

在一实施例中，上述F(Q_i)＝1/(1+e^-Qi/2)，其中，e为自然常数。

上述装置中各个模块的功能和作用的实现过程具体详见上述模型训练方法中对应步骤的实现过程，在此不再赘述。

请参阅图5，本申请实施例提供一种电子设备，该电子设备500包括处理器501，以及用于存储处理器501可执行指令的存储器502。其中，上述处理器501被配置为执行上述任一实施例中的意图识别方法。

处理器501可以是一种集成电路芯片，具有信号处理能力。上述处理器501可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(NetworkProcessor，简称NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。

存储器502可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read Only Memory，简称EPROM)，可编程只读存储器(Programmable Red-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。存储器502中还存储有一个或多个模块，分别借由该一个或多个处理器501执行，以完成上述任一实施例中的意图识别方法步骤。

本申请实施例还提供了一种计算机可读存储介质，上述存储介质存储有计算机程序，上述计算机程序可由处理器501执行以完成上述任一实施例中的意图识别方法。

在本申请所提供的几个实施例中，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种意图识别方法，其特征在于，包括：

使用预设模型对同一句子预测M次，包括：抽取所述句子中长度为N的子字串，共抽取M次；使用所述预设模型分别对所述子字串进行预测；其中，所述抽取所述句子中长度为N的子字串，共抽取M次，包括：抽取所述句子中第一个字到第N个字作为第一子字串；位移W个字，抽取所述句子中第W个字到第N+W个字作为第二子字串，重复该步骤直至子字串的长度小于等于N，该子字串为第M子字串；

将每次预测获得的意图类别信心值P_i和无意图类别的信心值TH比较，保留P_i＞TH的意图类别；

将所述保留的意图类别信心值进行调分，获得信心分数，包括：将所述保留的意图类别的信心值转化成与平均信心值的倍数差距Q_i；对Q_i进行调分，获得信心分数F(Q_i)，其中，所述Q_i＝(P_i-1/K_i)*K_i，其中，K_i为每次预测获得的意图类别和无意图类别的类别总数，所述F(Q_i)＝1/(1+e^-Qi/2)，其中，e为自然常数。

2.根据权利要求1所述的方法，其特征在于，所述使用预设模型对同一句子预测M次之前，包括：

将用户输入的语料和无意图语料一同训练，获得所述预设模型；

其中，所述无意图语料为在用户人机对话的历史日志中随机抽取的无意图的句子；所述预设模型的输出为意图类别和无意图类别的出现机率分布，所述P_i为意图类别的出现机率，所述TH为无意图类别的出现机率。

3.根据权利要求1或2所述的方法，其特征在于，所述预设模型每次预测获得的P_i与TH之和为1。

4.根据权利要求1中所述的方法，其特征在于，所述将所述保留的意图类别信心值进行调分，获得信心分数之后，包括：

当所述保留的意图类别中存在相同意图类别时，保留信心分数高的意图类别。

5.一种意图识别装置，其特征在于，包括：

预测模块，用于使用预设模型对同一句子预测M次，包括：抽取所述句子中长度为N的子字串，共抽取M次；使用所述预设模型分别对所述子字串进行预测；其中，所述抽取所述句子中长度为N的子字串，共抽取M次，包括：抽取所述句子中第一个字到第N个字作为第一子字串；位移W个字，抽取所述句子中第W个字到第N+W个字作为第二子字串，重复该步骤直至子字串的长度小于等于N，该子字串为第M子字串；

比较模块，用于将每次预测获得的意图类别信心值P_i和无意图类别的信心值TH比较，保留P_i＞TH的意图类别；

调分模块，用于将所述保留的意图类别信心值进行调分，获得信心分数，包括：将所述保留的意图类别的信心值转化成与平均信心值的倍数差距Q_i；对Q_i进行调分，获得信心分数F(Q_i)，其中，所述Q_i＝(P_i-1/K_i)*K_i，其中，K_i为每次预测获得的意图类别和无意图类别的类别总数，所述F(Q_i)＝1/(1+e^-Qi/2)，其中，e为自然常数。