意图识别方法、电子设备及存储介质
技术领域
本发明实施例涉及数据处理领域,特别涉及一种意图识别方法、电子设备及存储介质。
背景技术
人机对话一方面为被服务者提供了更及时的服务,另一方面在企业提高效率、降低成本方面发挥重要作用。而人机对话中关键的一步是在会话过程中准确地识别出用户所关心的垂直领域。相对于其他文本分类任务,具有待选类别多、语句相对口语化等难点,且对响应延迟的要求较为严格。
然而,发明人发现现有技术中至少存在如下问题:目前的意图识别模型的识别效率和/或准确性不高。
发明内容
本发明实施方式的目的在于提供一种意图识别方法、电子设备及存储介质,使得能够提高意图识别模型的准确性和/或效率。
为解决上述技术问题,本发明的实施方式提供了一种意图识别方法,包括以下步骤:获取待检测文本;将待检测文本输入意图识别模型,得到待检测文本的意图类别;其中,意图识别模型包括机器学习子模型和深度学习子模型,用于根据机器学习子模块的输出和/或深度学习子模块的识别结果,确定待检测文本的意图类别;机器学习子模型用于基于机器学习算法,确定机器学习子模型的输入数据属于各意图类别的置信度,深度学习子模型用于基于深度学习算法,确定深度学习子模型的输入数据属于各意图类别的置信度。
本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施方式提及的意图识别方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述实施方式提及的意图识别方法。
本发明实施方式相对于现有技术而言,由于机器学习算法具有高效率的优点,深度学习算法具有高质量的优点,意图识别模型中同时设置有基于机器学习算法的机器学习子模型和基于深度学习算法的深度学习子模块,可以将两者进行结合,使得意图识别过程更为高效和/或准确。
另外,将待检测文本输入意图识别模型,得到待检测文本的意图类别,具体包括:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度;根据待检测文本属于各意图类别的第一置信度,确定待检测文本的候选意图类别;根据待检测文本的候选意图类别,对待检测文本进行实体替换;将替换后的待检测文本输入深度学习子模型,确定替换后的待检测文本属于各意图类别的置信度;根据替换后的待检测文本属于各意图类别的置信度,确定待检测文本的意图类别。这降低了实体的搜索空间,提高处理效率。
另外,将待检测文本输入意图识别模型,得到待检测文本的意图类别,具体包括:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度;判断待检测文本属于各意图类别的第一置信度中最大的第一置信度是否大于第一阈值;若确定是,将最大的第一置信度对应的意图类别,作为待检测文本的意图类别;若确定不是,根据待检测文本属于各意图类别的第一置信度,确定待检测文本的候选意图类别;根据待检测文本的候选意图类别,对待检测文本进行实体替换;将替换后的待检测文本输入深度学习子模型,确定替换后的所述待检测文本属于各意图类别的置信度;根据替换后的待检测文本属于各意图类别的置信度,确定待检测文本的意图类别。这减少了电子设备的计算量,降低了功耗。
另外,根据替换后的待检测文本属于各意图类别的置信度,确定待检测文本的意图类别,具体包括:根据替换后的待检测文本属于各意图类别的置信度,以及待检测文本属于各意图类别的第一置信度,确定待检测文本属于各意图类别的第二置信度;根据待检测文本属于各意图类别的第二置信度,确定待检测文本的意图类别。这提高了识别结果的准确性。
另外,根据待检测文本属于各意图类别的第一置信度,确定待检测文本的候选意图类别,具体包括:将大于第二阈值的第一置信度所对应的意图类别,作为待检测文本的候选意图类别。
另外,在根据待检测文本的候选意图类别,对待检测文本进行实体替换之前,意图识别方法还包括:判断待检测文本的候选意图类别的个数是否大于1;若确定是,执行根据待检测文本的候选意图类别,对待检测文本进行实体替换的步骤;若确定不是,将待检测文本的候选意图类别作为待检测文本的意图类别。
另外,将待检测文本输入意图识别模型,得到待检测文本的意图类别,具体包括:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度;判断待检测文本属于各意图类别的第一置信度中最大的第一置信度是否大于第一阈值;若确定是,将最大的第一置信度对应的意图类别,作为待检测文本的意图类别;若确定不是,根据待检测文本和深度学习子模型,确定待检测文本属于各意图类别的第二置信度;根据待检测文本属于各意图类别的第二置信度,确定待检测文本的意图类别。这同时保障了电子设备的识别效率和准确性。
另外,根据待检测文本属于各意图类别的第二置信度,确定待检测文本的意图类别,具体包括:根据待检测文本属于各意图类别的第一置信度,以及待检测文本属于各意图类别的第二置信度,确定待检测文本属于各意图类别的第三置信度;根据待检测文本属于各意图类别的第三置信度,确定待检测文本的意图类别。
另外,将待检测文本输入意图识别模型,得到待检测文本的意图类别,具体包括:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度;将待检测文本输入深度学习子模型,确定待检测文本属于各意图类别的第二置信度;根据待检测文本属于各意图类别的第一置信度,以及待检测文本属于各意图类别的第二置信度,确定待检测文本属于各意图类别的第三置信度;根据待检测文本属于各意图类别的第三置信度,确定待检测文本的意图类别。这提高了识别结果的准确性。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本发明的第一实施方式的意图识别方法的流程图;
图2是本发明的第二实施方式的意图识别方法的流程图;
图3是本发明的第三实施方式的意图识别方法的流程图;
图4是本发明的第四实施方式的意图识别方法的流程图;
图5是本发明的第五实施方式的意图识别方法的流程图;
图6是本发明的第六实施方式的意图识别方法的流程图;
图7是本发明的第七实施方式的意图识别方法的流程图;
图8是本发明的第八实施方式的意图识别方法的流程图;
图9是本发明的第九实施方式的意图识别装置的结构示意图;
图10是本发明的第十实施方式的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的第一实施方式涉及一种意图识别方法,应用于电子设备,如终端(电脑等)和服务器。如图1所示,意图识别方法包括以下步骤:
步骤101:获取待检测文本。
具体地说,待检测文本可以是用户输入的请求文本,也可以是其他文本。待检测文本可以通过语音输入、拼音输入、手写输入、外部导入等任意方式输入该电子设备。
步骤102:将待检测文本输入意图识别模型,得到待检测文本的意图类别。
具体地说,意图识别模型包括机器学习子模型和深度学习子模型,用于根据机器学习子模块的输出和/或深度学习子模块的输出,确定待检测文本的意图类别;机器学习子模型用于基于机器学习算法,确定并输出机器学习子模型的输入数据属于各意图类别的置信度,深度学习子模型用于基于深度学习算法,确定并输出深度学习子模型的输入数据属于各意图类别的置信度。
在一个实施例中,机器学习算法可以是逻辑回归算法、支持向量机算法、梯度下降树算法、词频-逆向文件频率(term frequency–inverse document frequency,tf-idf)与朴素贝叶斯组合算法等,此处不一一列举。
在一个实施例中,深度学习子模型可以是卷积神经网络(Convolutional NeuralNetworks,CNN)模型、基于多层神经元的自编码神经网络模型、深度置信网络(Deep BeliefNetwork,DBN)模型等,此处不一一列举。
需要说明的是,本领域技术人员可以理解,实际应用中,意图类别可以根据需要设置,例如,可以设置为天气意图类别、歌曲意图类别、诗词意图类别等。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中提供的意图识别方法,由于机器学习算法具有高效率的优点,深度学习算法具有高质量的优点,意图识别模型中同时设置有基于机器学习算法的机器学习子模型和基于深度学习算法的深度学习子模块,可以将两者进行结合,使得意图识别过程更为高效和/或准确。
本发明的第二实施方式涉及一种意图识别方法,本实施方式是对第一实施方式中的步骤102的举例说明。
具体的说,如图2所示,在本实施方式中,电子设备将待检测文本输入意图识别模型,得到待检测文本的意图类别的过程包括以下步骤:
步骤201:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度。
具体地说,机器学习子模型可以自身的机器学习算法,对待检测文本进行分析,确定待检测文本属于各意图类别的第一置信度。
例如,机器学习子模型是基于tf-idf算法的识别模型。该识别模型可以基于N-Gram自然语言,对待检测文本进行关键词提取,得到待检测文本的关键词;基于各个意图类别的语料库,确定待检测文本的关键词属于各个意图识别中的tf-idf置信度;根据待检测文本的关键词在各个意图类别的tf-idf置信度,确定待检测文本属于各个类别的第一置信度。
需要说明的是,机器学习子模型也可以是基于其他机器学习算法的模型,基于机器学习算法确定待检测文本属于各意图类别的第一置信度的具体过程不是本实施方式的重点内容,此处不一一赘述。
步骤202:根据待检测文本属于各意图类别的第一置信度,确定待检测文本的候选意图类别。
在一个实施例中,电子设备将大于第二阈值的第一置信度所对应的意图类别,作为待检测文本的候选意图类别。具体地说,电子设备将待检测文本属于各意图类别的第一置信度分别与第二阈值比较,根据比较结果,判断是否存在大于第二阈值的第一置信度;若确定是,将大于第二阈值的第一置信度所对应的意图类别,作为待检测文本的候选意图类别,若确定不是,则确定待检测文本的候选意图类别为默认意图类别或者未知意图类别。
需要说明的是,本领域技术人员可以理解,第二阈值可以作为意图识别模型中的超参数,在训练过程中,不断调整其具体取值,确定第二阈值的最优值,将最优值的作为其实际使用过程中的取值。
步骤203:根据待检测文本的候选意图类别,对待检测文本进行实体替换。
具体地说,当候选意图类别有多个时,电子设备针对每个候选意图类别的知识库,将待检测文本的实体进行替换为该候选意图类别对应的预设文本。其中,每个意图类别的知识库中存储有该意图所对应的实体。
需要说明的是,本领域技术人员可以根据需要设置各个意图类别对应的预设文本,例如,可以设置为意图类别的名称等。
在一个实施例中,电子设备在根据待检测文本的候选意图类别,对待检测文本进行实体替换之前,判断待检测文本的候选意图类别的个数是否大于1;若确定是,执行步骤203至步骤205;若确定不是,将待检测文本的候选意图类别作为待检测文本的意图类别,结束流程。
以下结合实际场景,举例说明意图识别的过程。
假设,待检测文本为“北京今天有没有大雪”,候选意图类别包括天气意图类别和农历意图类别。在天气意图类别中,识别出的实体有《城市(city)》类型的“北京”、《天气现象(weather-phenomenon)》类型的“大雪”,则实体替换后的待检测文本为“《city》今天有没有《weather-phenomenon》”。而在农历意图类别中,不考虑《city》类型的实体,考虑《weather-phenomenon》类型的实体,故替换后的待检测文本为“北京今天有没有《weather-phenomenon》”。
值得一提的是,对候选意图类别的个数进行检测,使得电子设备可以在候选意图类别个数为1时跳过实体替换等步骤,减少了电子设备的计算量。
步骤204:将替换后的待检测文本输入深度学习子模型,确定替换后的待检测文本属于各意图类别的置信度。
具体地说,深度学习子模型是预先训练好的模型,其训练数据中的输入数据是训练文本,输出数据是训练文本的类别。训练后的深度学习子模型能够确定深度学习子模型的输入数据属于各意图类别的置信度。
步骤205:根据替换后的待检测文本属于各意图类别的置信度,确定待检测文本的意图类别。
在一个实施例中,电子设备可以选择置信度最大的意图类别,作为待检测文本的意图类别。
在一个实施例中,电子设备先判断替换后的待检测文本属于各意图类别的置信度中的置信度的最大值是否大于预先设置的第三阈值后,若是,则将置信度最大的意图类别作为待检测文本的意图类别,若不是,则确定待检测文本的意图类别为未知类别,或,提示识别失败。
需要说明的是,本领域技术人员可以理解,第三阈值的具体取值可以根据需要设置,例如,可以设置为(80%,90%)中的任意数值,本实施方式不限制其具体取值。
在意图识别过程中,如果能通过知识库,将待检测文本中的实体进行替换,例如,将“给我唱一首叫我们的歌曲”中的“我们”替换为“《歌曲名称(song-title)》”,可以显著提高意图识别的准确率。然而,发明人发现,这种实体替换存在以下缺点:在所有的意图类别的知识库中寻找待检测文本中出现的实体需要较大的计算资源和处理时间;不同意图类别的实体存在交叉。例如:舞蹈意图类别的待检测文本“给我们跳一支舞吧”中的“我们”并不代表歌曲名,如果替换为“《song-title》”,会对后续基于模型的意图识别造成很大的干扰。因此,在不清楚待检测文本的意图识别领域时进行实体替换,这会造成较大的误差。但是意图识别的目的是识别待检测文本的意图类别,意图识别和实体替换形成了一个互相依赖的死循环。本实施方式中,通过包括机器学习子模型进行预识别,解决此问题。电子设备先通过机器学习子模型对待检测文本进行初步的分类,然后在第一置信度大于第一预设值的意图类别进行实体替换,将实体替换后的若干待检测文本交给深度学习子模型进行意图识别。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中提供的意图识别方法,先通过机器学习子模型进行预识别,再进行实体替换,降低了实体的搜索空间,提高处理效率,明显提升了替换的准确率,为深度学习子模型的意图识别降低难度,在提高意图识别结果的准确率的同时,提高了意图识别的效率。
本发明的第三实施方式涉及一种意图识别方法,本实施方式是对第二实施方式的进一步改进,具体改进之处在于,在步骤202之前,增加了其他相关步骤。
具体的说,如图3所示,在本实施方式中,电子设备将待检测文本输入意图识别模型,得到待检测文本的意图类别的过程包括步骤301至步骤307,其中,步骤301、步骤304至步骤307分别与第二实施方式的步骤201至步骤205大致相同,此处不再赘述,下面主要介绍第二实施方式和第三实施方式的不同之处:
步骤301:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度。
步骤302:判断待检测文本属于各意图类别的第一置信度中最大的第一置信度是否大于第一阈值。
具体地说,电子设备若确定最大的第一置信度大于第一阈值,执行步骤303,否则,执行步骤304。
需要说明的是,本领域技术人员可以理解,第二阈值可以作为意图识别模型中的超参数,在训练过程中,不断调整其具体取值,确定第二阈值的最优值,将最优值的作为其实际使用过程中的取值。
步骤303:将最大的第一置信度对应的意图类别,作为待检测文本的意图类别。
具体地说,电子设备若确定最大的第一置信度大于第一阈值,说明最大的第一置信度对应的意图类别是待检测文本的实际意图类别的概率符合开发人员对识别结果的准确性的要求,可以将最大的第一置信度对应的意图类别作为最终的识别结果,即待检测文本的意图类别。
步骤304:根据待检测文本属于各意图类别的第一置信度,确定待检测文本的候选意图类别。
步骤305:根据待检测文本的候选意图类别,对待检测文本进行实体替换。
步骤306:将替换后的待检测文本输入深度学习子模型,确定替换后的待检测文本属于各意图类别的置信度;
步骤307:根据替换后的待检测文本属于各意图类别的置信度,确定待检测文本的意图类别。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中提供的意图识别方法,先通过机器学习子模型进行预识别,再进行实体替换,降低了实体的搜索空间,提高处理效率,明显提升了替换的准确率,为深度学习子模型的意图识别降低难度,在提高意图识别结果的准确率的同时,提高了意图识别的效率。除此之外,在机器学习子模型的识别得到的意图类型符合开发人员对意图识别的准确性的要求时,将机器学习子模型的识别的最大的第一置信度对应的意图类别作为待检测文本的意图类别,不进行实体替换,减少了电子设备的计算量,降低了功耗。
本发明的第四实施方式涉及一种意图识别方法,本实施方式举例说明了第二实施方式的步骤205的一种实现方式。
具体的说,如图4所示,在本实施方式中,电子设备将待检测文本输入意图识别模型,得到待检测文本的意图类别的过程包括步骤401至步骤406,其中,步骤401至步骤404分别与第二实施方式的步骤201至步骤204大致相同,此处不再赘述,下面主要介绍第二实施方式和第四实施方式的不同之处:
步骤401:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度。
步骤402:根据待检测文本属于各意图类别的第一置信度,确定待检测文本的候选意图类别。
步骤403:根据待检测文本的候选意图类别,对待检测文本进行实体替换。
步骤404:将替换后的待检测文本输入深度学习子模型,确定替换后的待检测文本属于各意图类别的置信度。
步骤405:根据替换后的待检测文本属于各意图类别的置信度,以及待检测文本属于各意图类别的第一置信度,确定待检测文本属于各意图类别的第二置信度。
具体地说,电子设备针对每个意图类别,计算替换后的待检测文本属于该意图类别的置信度和待检测文本的第二置信度的加权平均值,将计算得到的加权平均值作为待检测文本属于该意图类别的第二置信度。
需要说明的是,本领域技术人员可以理解,替换后的待检测文本属于该意图类别的置信度的权重和第一置信度的权重可以根据需要设置,两者的权重的和为1,在确定替换后的待检测文本属于该意图类别的置信度的权重和第一置信度的权重的过程中,可以将两者作为超参数,通过相关的优化算法,不断调整其具体取值,从而确定其最优值。
步骤406:根据待检测文本属于各意图类别的第二置信度,确定待检测文本的意图类别。
具体地说,在确定待检测文本属于各意图类别的第二置信度后,选择最大的第二置信度对应的意图类别,作为该待检测文本的意图类别。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中提供的意图识别方法,先通过机器学习子模型进行预识别,再进行实体替换,降低了实体的搜索空间,提高处理效率,明显提升了替换的准确率,为深度学习子模型的意图识别降低难度,在提高意图识别结果的准确率的同时,提高了意图识别的效率。除此之外,综合考虑机器学习子模型的识别结果和深度学习子模型的识别结果,提高了识别结果的准确性。
本发明的第五实施方式涉及一种意图识别方法,本实施方式是对第二实施方式的进一步改进,具体改进之处在于,在步骤202之前,增加了其他相关步骤,并举例说明了步骤205的实现方式。
具体的说,如图5所示,在本实施方式中,电子设备将待检测文本输入意图识别模型,得到待检测文本的意图类别的过程包括步骤501至步骤508,其中,步骤501、步骤504至步骤506分别与第二实施方式的步骤201至步骤204大致相同,步骤502和步骤503与第三实施方式的步骤302和步骤303大致相同,步骤507和步骤508与第四实施方式的步骤405和步骤406大致相同,此处不再赘述。
步骤501:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度。
步骤502:判断待检测文本属于各意图类别的第一置信度中最大的第一置信度是否大于第一阈值。
具体地说,电子设备若确定最大的第一置信度大于第一阈值,执行步骤503,否则,执行步骤504。
步骤503:将最大的第一置信度对应的意图类别,作为待检测文本的意图类别。之后结束流程。
步骤504:根据待检测文本属于各意图类别的第一置信度,确定待检测文本的候选意图类别。
步骤505:根据待检测文本的候选意图类别,对待检测文本进行实体替换。
步骤506:将替换后的待检测文本输入深度学习子模型,确定替换后的待检测文本属于各意图类别的置信度。
步骤507:根据替换后的待检测文本属于各意图类别的置信度,以及待检测文本属于各意图类别的第一置信度,确定待检测文本属于各意图类别的第二置信度。
步骤508:根据待检测文本属于各意图类别的第二置信度,确定待检测文本的意图类别。
以下结合实际场景,说明确定待检测文本的意图类别的过程。
假设,待检测文本为“北京今天有没有大雪”,机器学习子模型的算法为tf-idf和朴素贝叶斯结合的算法。因为tf-idf算法从待检测文本中抽取到的关键词较少且特征不明显,朴素贝叶斯算法得到的识别结果具有较低的可靠度。若其得到的待检测文本属于各意图类别的第一置信度均小于或等于第一阈值,筛选出大于第二阈值的第一置信度对应的意图类别(天气意图类别和农历意图类别),作为候选类别。在天气意图类别中,识别出的实体有《city》类型的“北京”、《weather-phenomenon》类型的“大雪”,进行实体替换后的待检测文本为“《city》今天有没有《weather-phenomenon》”。而在农历意图类别中,不考虑《city》类型的实体,故替换后的待检测文本为“北京今天有没有《weather-phenomenon》”。天气意图类别中替换后的待检测文本多了一个天气类的关键词《city》,因此在深度学习子模型中,替换后的待检测文本属于天气意图类别的置信度高于替换后的待检测文本属于农历意图类别的置信度。针对各意图类别,将待检测文本属于该意图类别的第一置信度和替换后的待检测文本属于该意图类别的置信度加权求和得到的待检测文本属于该意图类别的第二置信度,选择其中最大值对应的意图类别作为待检测文本的意图类别,即识别结果返回即可。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中提供的意图识别方法,先通过机器学习子模型进行预识别,再进行实体替换,降低了实体的搜索空间,提高处理效率,明显提升了替换的准确率,为深度学习子模型的意图识别降低难度,在提高意图识别结果的准确率的同时,提高了意图识别的效率。除此之外,在机器学习子模型的识别得到的意图类型符合开发人员对意图识别的准确性的要求时,将机器学习子模型的识别的最大的第一置信度对应的意图类别作为待检测文本的意图类别,不进行实体替换,减少了电子设备的计算量,降低了功耗。综合考虑机器学习子模型的识别结果和深度学习子模型的识别结果,提高了识别结果的准确性。
本发明的第六实施方式涉及一种意图识别方法,本实施方式是对第一实施方式中的步骤102的举例说明。
具体的说,如图6所示,在本实施方式中,电子设备将待检测文本输入意图识别模型,得到待检测文本的意图类别的过程包括以下步骤:
步骤601:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度。
具体地说,由于机器学习算法的识别速度更快,电子设备先使用机器学习子模型,对待检测文本的意图进行识别,确定待检测文本属于各意图类别的第一置信度。
步骤602:判断待检测文本属于各意图类别的第一置信度中最大的第一置信度是否大于第一阈值。
具体地说,电子设备若确定最大的第一置信度大于第一阈值,执行步骤603,否则,执行步骤604。
步骤603:将最大的第一置信度对应的意图类别,作为待检测文本的意图类别。之后结束流程。
具体地说,电子设备若确定最大的第一置信度大于第一阈值,说明最大的第一置信度对应的意图类别是待检测文本的实际意图类别的概率符合开发人员对识别结果的准确性的要求,可以将最大的第一置信度对应的意图类别作为最终的识别结果,即待检测文本的意图类别。
步骤604:根据待检测文本和深度学习子模型,确定待检测文本属于各意图类别的第二置信度。
具体地说,电子设备若确定最大的第一置信度不大于第一阈值,说明最大的第一置信度对应的意图类别是待检测文本的实际意图类别的概率不符合开发人员对识别结果的准确性的要求,需要通过更为准确的深度学习子模型对待检测文本的意图类别进行识别。电子设备将待检测文本输入深度学习子模型。深度学习子模型是预先训练好的网络模型,能够确定输入自身的文本属于各意图类别的置信度。
步骤605:根据待检测文本属于各意图类别的第二置信度,确定待检测文本的意图类别。
在一个实施例中,电子设备将最大的第二置信度对应的意图类别,作为待检测文本的意图类别。
在一个实施例中,电子设备判断最大的第二置信度对应的意图类别是否大于第四阈值,若确定是,将最大的第二置信度对应的意图类别,作为待检测文本的意图类别,否则,确定待检测文本的意图类别为未知类别,或者,提示识别失败。
需要说明的是,本领域技术人员可以理解,实际应用中,第四阈值可以根据需要设置,例如,可以设置为(80%,90%)中的任意数值,本实施方式不限制第四阈值的具体取值。
值得一提的是,电子设备综合考虑机器学习算法和深度学习算法的识别结果,提高了最终的识别结果的准确性。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中提供的意图识别方法,在机器学习子模型的识别得到的意图类型符合开发人员对意图识别的准确性的要求时,将机器学习子模型的识别的最大的第一置信度对应的意图类别作为待检测文本的意图类别,不使用深度学习子模型进行识别,减少了识别时间。在机器学习子模型的识别得到的意图类型不符合开发人员对意图识别的准确性的要求时,使用准确率更高的深度学习子模型进行识别,保证识别结果的准确性。将机器学习子模型和深度学习子模型相结合,使得可以同时兼顾识别效率和识别准确性。
本发明的第七实施方式涉及一种意图识别方法,本实施方式举例说明了第六实施方式的步骤605的一种实现方式。
具体地说,如图7所示,在本实施方式中,电子设备将待检测文本输入意图识别模型,得到待检测文本的意图类别的过程包括步骤701至步骤706,其中,步骤701至步骤704分别与第二实施方式的步骤601至步骤604大致相同,此处不再赘述,下面主要介绍第二实施方式和第四实施方式的不同之处:
步骤701:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度。
步骤702:判断待检测文本属于各意图类别的第一置信度中最大的第一置信度是否大于第一阈值。
具体地说,电子设备若确定最大的第一置信度大于第一阈值,执行步骤703,否则,执行步骤704。
步骤703:将最大的第一置信度对应的意图类别,作为待检测文本的意图类别。之后结束流程。
步骤704:根据待检测文本和深度学习子模型,确定待检测文本属于各意图类别的第二置信度。
步骤705:根据待检测文本属于各意图类别的第一置信度,以及待检测文本属于各意图类别的第二置信度,确定待检测文本属于各意图类别的第三置信度。
具体地说,电子设备针对各意图类别,分别进行以下操作:计算待检测文本属于该意图类别的第一置信度和待检测文本属于该意图类别的第二置信度的加权平均值,将计算得到的加权平均值作为待检测文本属于该意图类别的第三置信度。
需要说明的是,本领域技术人员可以理解,第一置信度的权重和第二置信度的权重可以根据需要设置,两者的权重的和为1,在确定第一置信度的权重和第二置信度的权重的过程中,可以将两者作为超参数,通过相关的优化算法,不断调整其具体取值,从而确定其最优值。
步骤706:根据待检测文本属于各意图类别的第三置信度,确定待检测文本的意图类别。
在一个实施例中,电子设备将最大的第三置信度对应的意图类别,确定待检测文本的意图类别。
在另一实施例中,电子设备将判断最大的第三置信度是否大于第五阈值,若确定是,则将最大的第三置信度对应的意图类别,确定待检测文本的意图类别,否则,确定待检测文本的意图类别为未知类别,或,提示识别失败。
需要说明的是,本领域技术人员可以理解,实际应用中,第四阈值可以根据需要设置,例如,可以设置为(80%,90%)中的任意数值,本实施方式不限制第四阈值的具体取值。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中提供的意图识别方法,在机器学习子模型的识别得到的意图类型符合开发人员对意图识别的准确性的要求时,将机器学习子模型的识别的最大的第一置信度对应的意图类别作为待检测文本的意图类别,不使用深度学习子模型进行识别,减少了识别时间。在机器学习子模型的识别得到的意图类型不符合开发人员对意图识别的准确性的要求时,使用准确率更高的深度学习子模型进行识别,保证识别结果的准确性。将机器学习子模型和深度学习子模型相结合,使得可以同时兼顾识别效率和识别准确性。除此之外,综合考虑机器学习子模型和深度学习子模型的识别结果,提高了识别结果的准确性。
本发明的第八实施方式涉及一种意图识别方法,本实施方式是对第一实施方式中的步骤102的举例说明。
具体的说,如图8所示,在本实施方式中,电子设备将待检测文本输入意图识别模型,得到待检测文本的意图类别的过程包括以下步骤:
步骤801:将待检测文本输入机器学习子模型,确定待检测文本属于各意图类别的第一置信度。
具体地说,电子设备使用机器学习算法对待检测文本进行意图识别,确定待检测文本属于各意图类别的第一置信度。
步骤802:将待检测文本输入深度学习子模型,确定待检测文本属于各意图类别的第二置信度。
具体地说,电子设备使用深度学习算法对待检测文本进行意图识别,确定待检测文本属于各意图类别的第一置信度。
步骤803:根据待检测文本属于各意图类别的第一置信度,以及待检测文本属于各意图类别的第二置信度,确定待检测文本属于各意图类别的第三置信度。
具体地说,电子设备针对各意图类别,分别进行以下操作:计算待检测文本属于该意图类别的第一置信度和待检测文本属于该意图类别的第二置信度的加权平均值,将计算得到的加权平均值作为待检测文本属于该意图类别的第三置信度。
步骤804:根据待检测文本属于各意图类别的第三置信度,确定待检测文本的意图类别。
在一个实施例中,电子设备将最大的第三置信度对应的意图类别,确定待检测文本的意图类别。
在另一实施例中,电子设备将判断最大的第三置信度是否大于第五阈值,若确定是,则将最大的第三置信度对应的意图类别,确定待检测文本的意图类别,否则,确定待检测文本的意图类别为未知类别,或,提示识别失败。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中提供的意图识别方法,综合考虑机器学习算法的识别结果和深度学习算法的识别结果,确定最终的识别结果,相对于只使用一种算法进行识别的意图识别模型而言,识别结果更为准确,意图识别模型的鲁棒性更好。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明的第九实施方式涉及一种意图识别装置,如图9所示,包括:获取模块901和识别模块902。获取模块901用于获取待检测文本;识别模块902用于将待检测文本输入意图识别模型,得到待检测文本的意图类别;其中,意图识别模型包括机器学习子模型和深度学习子模型,用于根据机器学习子模块的输出和/或深度学习子模块的识别结果,确定待检测文本的意图类别;机器学习子模型用于基于机器学习算法,确定机器学习子模型的输入数据属于各意图类别的置信度,深度学习子模型用于基于深度学习算法,确定深度学习子模型的输入数据属于各意图类别的置信度。
不难发现,本实施方式为与第一实施方式至第八实施方式相对应的系统实施例,本实施方式可与第一实施方式至第八实施方式互相配合实施。第一实施方式至第八实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式至第八实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明的第十实施方式涉及一种电子设备,如图10所示,包括:至少一个处理器111;以及,与至少一个处理器111通信连接的存储器112;其中,存储器112存储有可被至少一个处理器111执行的指令,指令被至少一个处理器111执行,以使至少一个处理器111能够执行上述实施方式提及的意图识别方法。
该电子设备包括:一个或多个处理器111以及存储器112,图10中以一个处理器111为例。处理器111、存储器112可以通过总线或者其他方式连接,图10中以通过总线连接为例。存储器112作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器111通过运行存储在存储器112中的非易失性软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述意图识别方法。
存储器112可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储选项列表等。此外,存储器112可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施方式中,存储器112可选包括相对于处理器111远程设置的存储器,这些远程存储器可以通过网络连接至外接设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器112中,当被一个或者多个处理器111执行时,执行上述任意方法实施方式中的意图识别方法。
上述产品可执行本申请实施方式所提供的方法,具备执行方法相应的功能模块和有益效果,未在本实施方式中详尽描述的技术细节,可参见本申请实施方式所提供的方法。
本发明的第十一实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。