CN113076080B

CN113076080B - 模型训练方法和装置、意图识别方法和装置

Info

Publication number: CN113076080B
Application number: CN202110432066.8A
Authority: CN
Inventors: 高兵兵; 张海杰; 林立
Original assignee: Baidu Online Network Technology Beijing Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd
Priority date: 2021-04-21
Filing date: 2021-04-21
Publication date: 2022-05-17
Anticipated expiration: 2041-04-21
Also published as: CN113076080A

Abstract

本公开提供了一种模型训练方法和装置，涉及智能搜索、深度学习等技术领域。具体实现方案为：获取不同时间段的搜索行为数据以及已训练的意图识别模型对搜索行为数据的意图识别结果；将各个时间段中的搜索行为数据以及与搜索行为数据对应意图识别结果作为一个数据样本；基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集；基于标注数据集，对意图再识别模型进行训练，得到训练完成的意图再识别模型。该实施方式提高了搜索行为数据的意图识别的准确率。

Description

模型训练方法和装置、意图识别方法和装置

技术领域

本公开涉及计算机技术领域，具体涉及智能搜索、深度学习等技术领域，尤其涉及一种模型训练方法和装置、意图识别方法和装置、电子设备、计算机可读介质以及计算机程序产品。

背景技术

虚拟助理是一种拟人化产品，该产品具有为用户提供搜索、闲聊服务的意图识别模型，意图识别模型需要进行意图识别判断用户的意图是搜索或者闲聊，假设闲聊的概率和搜索的概率和为1，概率大于0.6为搜索意图，概率小于0.4为闲聊意图，而概率在0.4到0.6之间为非显著搜索或者闲聊意图，通过不断的进行意图识别模型的迭代可以提高搜索或者闲聊意图的比例，但是非显著搜索或者闲聊意图仅采用搜索意图或闲聊意图满足会出现歧义。

发明内容

提供了一种模型训练方法和装置、意图识别方法和装置、电子设备、计算机可读介质以及计算机程序产品。

根据第一方面，提供了一种模型训练方法，上述方法包括：获取不同时间段的搜索行为数据以及已训练的意图识别模型对搜索行为数据的意图识别结果；将各个时间段中的搜索行为数据以及与搜索行为数据对应意图识别结果作为一个数据样本；基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集；基于标注数据集，对意图再识别模型进行训练，得到训练完成的意图再识别模型。

根据第二方面，提供了一种意图识别方法，上述方法包括：获取待识别行为数据；基于待识别行为数据，获取已训练的意图识别模型的意图识别结果；将待识别行为数据、意图识别结果输入采用如第一方面的方法生成的意图再识别模型，得到意图分类结果。

根据第三方面，提供了一种模型训练装置，该装置包括：获取单元，被配置成获取不同时间段的搜索行为数据以及已训练的意图识别模型对搜索行为数据的意图识别结果；取样单元，被配置成将各个时间段中的搜索行为数据以及与搜索行为数据对应意图识别结果作为一个数据样本；标注单元，被配置成基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集；训练单元，被配置成基于标注数据集，对意图再识别模型进行训练，得到训练完成的意图再识别模型。

根据第四方面，提供了一种意图识别装置，上述装置包括：数据获取单元，被配置成获取待识别行为数据；结果获取单元，被配置成基于待识别行为数据，获取已训练的意图识别模型的意图识别结果；得到单元，被配置成将待识别行为数据、意图识别结果输入采用如第一方面的方法生成的意图再识别模型，得到意图分类结果。

根据第五方面，提供了一种电子设备，该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器，其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行如第一方面或第二方面任一实现方式描述的方法。

根据第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行如第一方面或第二方面任一实现方式描述的方法。

根据第七方面，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现如第一方面或第二方面任一实现方式描述的方法。

本公开的实施例提供的模型训练方法和装置，首先，获取不同时间段的搜索行为数据以及已训练的意图识别模型对搜索行为数据的意图识别结果；其次，将各个时间段中的搜索行为数据以及与搜索行为数据对应意图识别结果作为一个数据样本；从次，基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集；最后，基于标注数据集，对意图再识别模型进行训练，得到训练完成的意图再识别模型。由此，基于不同的搜索行为数据以及与搜索行为数据对应的意图识别模型的识别结果训练意图再识别模型，使训练后的意图再识别模型对搜索行为数据的识别结果相对于意图识别模型更准确，提高了对行为数据进行意图识别的准确率。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开模型训练方法的一个实施例的流程图；

图2是根据本公开意图识别方法的一个实施例的流程图；

图3是根据本公开模型训练装置的实施例的结构示意图；

图4是根据本公开意图识别装置的实施例的结构示意图；

图5是用来实现本公开实施例的模型训练方法或意图识别方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1示出了根据本公开模型训练方法的一个实施例的流程100，上述模型训练方法包括以下步骤：

步骤101，获取不同时间段的搜索行为数据以及已训练的意图识别模型对搜索行为数据的意图识别结果。

本实施例中，模型训练方法运行于其上的执行主体可以实时获取到不同时间段的搜索行为数据，而搜索行为数据可以是用户进行信息查询或者信息交流的用户行为数据。模型训练方法运行于其上的执行主体可以自动从互联网搜集用户行为数据，经过一定整理后，提供给已训练的意图识别模型进行意图识别。

本实施例中，模型训练方法运行于其上的执行主体还可以通过终端实时获取不同对象的不同时间段的搜索行为数据，而该搜索行为数据可以不限定类型和形式，比如，搜索行为数据为图片、文本、声音中的一种或多种，搜索行为数据的内容可以是问句、陈述句等。将搜索行为数据输入已训练的意图识别模型，得到意图识别模型输出的意图识别结果。

本实施例中，已训练的意图识别模型的输入为搜索行为数据，输出为与搜索行为数据对应的意图识别结果，意图识别结果可以是搜索行为数据所属的对话的类型，该类型可以根据意图识别模型的设置需求进行设置，例如，类型包括：搜索、闲聊。搜索行为数据为一个问句：萱草属于什么科？意图识别模型输出的意图识别结果为：搜索类型。再如，搜索行为数据为：今天天气好吗？意图识别模型输出的意图识别结果为：闲聊类型。

本实施例中，已训练的意图识别模型可以是虚拟助理(具有动画形象的虚拟人物)或者机器人的一部分，通过已训练的意图识别模型帮助虚拟助理或机器人识别不同用户行为数据的意图，使虚拟助理或机器人基于得到意图识别结果对搜索行为数据进行处理。例如，虚拟助理或机器人确定“萱草属于什么科”是具有搜索意图的行为数据，则通过搜索引擎搜索该“萱草属于什么科”的答案，并输出搜索到的答案“萱草属于百合科”。

可选地，上述获取不同时间段的搜索行为数据以及已训练的意图识别模型对搜索行为数据的意图识别结果，包括：通过已训练的意图识别模型对所有不同类型的搜索行为数据进行意图识别，得到意图识别结果；将预设时间段中时间间隔小于设定时间的相同类型的搜索行为数据，作为一个时间段中的搜索行为数据；筛选意图识别结果中各个时间段的搜索行为数据对应的意图识别结果，得到不同时间段的意图识别模型对搜索行为数据的意图识别结果。搜索行为数据的类型可以搜索行为数据的表现形式，例如，语音、图像、文本等。

步骤102，将各个时间段中的搜索行为数据以及与搜索行为数据对应意图识别结果作为一个数据样本。

本实施例中，一个时间段可以根据搜索需求而设置，比如，5s为一个时间段；每个时间段中可以具有一个搜索行为数据或者多个搜索行为数据，每个时间段中的搜索行为与各个搜索行为数据对应的意图识别结果为一个数据样本，即每个数据样本具有至少一个搜索行为数据以及各个搜索行为数据对应的意图识别结果。

步骤103，基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集。

本实施例中，由于各个数据样本中包括意图识别模型对搜索行为数据的意图识别结果，为了通过意图再识别模型更清楚地确定意图识别模型的意图识别结果，可以在上一时间段的数据样本中的意图识别模型的意图识别结果的基础上，为各个时间段的搜索行为数据进行意图类别标注，得到意图再识别模型的标注数据集，其中，该意图类别标注可以更清楚划分各个时间段的搜索行为数据对应的意图识别结果，该标注数据集为用于训练意图再识别模型的样本集，意图再识别模型的输入可以为：当前搜索行为数据以及当前搜索行为数据之前上一个搜索行为数据对应的意图识别结果，意图再识别模型的输出可以为：当前搜索行为数据对应的意图识别结果。

可选地，当意图识别结果包括至少两种意图类别时，意图类别标注是指将搜索行为数据标记为上述意图识别结果中的任意一种意图类别，通过对搜索行为数据进行意图类别标注可以使意图再识别模型在训练过程中确定搜索行为数据的意图类别。

例如，意图识别结果包括：闲聊意图、搜索意图，在确定当前时间段的上一时间段的数据样本中的意图识别模型的意图识别结果为闲聊意图，即当前时间段的上一个时间段的数据样本属于闲聊意图时，为当前时间段的搜索行为数据进行意图类别标记，是指将当前时间段的搜索行为数据标注为闲聊意图，由此在参考上一时间段中数据样本的意图识别结果的基础上，为当前时间段中数据样本的数据标注提供可靠依据。

本实施例中，标注数据集包括至少一个标注数据，每个标注数据可以包括：当前时间段的搜索行为数据、与当前时间段相邻的上一时间段的数据样本、当前时间段的搜索行为数据的意图类别，其中，意图类别可以由意图识别模型的意图识别结果确定，比如，意图类别包括：搜索意图和闲聊意图；意图识别结果可以包括：搜索意图和搜索意图概率；闲聊意图和闲聊意图的概率值。

可选地，基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集包括：针对所有时间段中的各个时间段，获取与该时间段相邻的上一时间段的数据样本和上一时间段之前的数据样本对应的意图类别；确定上一时间段中搜索行为数据的意图类别；基于上一时间段中搜索行为数据的意图类别和上一时间段之前的数据样本对应的意图类别确定该时间段的数据样本中的意图标注结果，组合上一时间段的数据样本、该时间段的搜索行为数据、该时间段的数据样本的意图标注结果，得到标注数据集中的标注数据。其中，意图标注结果与意图分类结果相对应，且意图标注结果还可以与意图识别模型的意图识别结果相对应。

步骤104，基于标注数据集，对意图再识别模型进行训练，得到训练完成的意图再识别模型。

本实施例中，意图再识别模型是与意图识别模型不同的模型，该意图再识别模型基于意图识别模型的识别结果和搜索行为数据，对搜索行为数据进行意图分类，得到意图分类结果。

意图再识别模型的输入为：当前搜索行为数据以及当前搜索行为数据之前上一个搜索行为数据对应的意图识别结果，当前搜索行为数据可以包括多个具有预设间隔的用户行为数据，而与当前搜索行为数据之前上一个搜索行为数据也包括多个具有预设间隔的用户行为数据，且当前搜索行为数据之前上一个搜索行为数据对应一个意图识别结果。需要说明的是，意图再识别模型输出的意图分类结果可以与意图识别模型的意图识别结果的类型相同，例如，意图分类结果为搜索行为数据所属的对话的类型，该类型可以包括：搜索、闲聊。意图再识别模型输出的意图分类结果也可以与意图识别模型的意图识别结果的类型不同，相对于意图识别模型的意图识别结果，意图再识别模型输出的意图分类结果更加准确，所表述的意图的类型更加精确。

本实施例中，执行主体在得到标注数据集之后，采用标注数据集中的标注数据训练意图再识别初始模型，经过对初始模型的多次训练、评估和算法调参后，获得训练完成的意图再识别模型。将当前搜索行为数据、当前搜索行为数据之前上一个搜索行为数据对应的意图识别结果输入意图再识别模型后，可以得出当前搜索行为数据对应的意图分类结果。

具体地，意图再识别模型训练过程可以如下：

采用诸如深度神经网络等模型结构构建意图再识别模型。然后利用标注数据集中的标注数据对意图再识别模型进行训练。在训练过程中，可以根据意图再识别模型对标注数据中的当前时间段的搜索行为数据的意图分类结果与标注数据集中当前时间段的搜索行为数据的意图类别标注信息之间的差异确定意图再识别模型的误差，利用误差反向传播的方式迭代调整意图再识别模型的参数，使其误差逐步缩小。在意图再识别模型的误差收敛至一定的范围内或迭代的次数达到预设的次数阈值时可以停止调整参数，得到训练完成的意图再识别模型。

在本实施例的一些可选实现方式中，意图识别模型的意图识别结果包括至少两种意图类别，意图再识别模型用于对至少两种意图类别中任意两种类别之间的界限进行再划分。

本可选实现方式中，意图类别可以根据不同意图需求进行划分，例如，意图类别包括：闲聊意图、搜索意图等。针对虚拟场景下的虚拟助理，可以提高虚拟助理的意图识别精准度。

本可选实现方式中，当通过意图识别模型对意图识别结果中任意相邻两种意图类别之间界限对意图识别模型较难划分时，采用意图再识别模型可以更清楚地划分至少两种意图类别中的任意两种类别之间的界限。例如，针对意图识别模型输出的概率在0.4到0.6之间的非显著搜索或者闲聊意图，意图再识别模型可以减少非显著搜索或者闲聊意图出现概率，或者相对意图识别模型，减小非显著搜索或者闲聊意图对应概率范围，例如概率值为0.45到0.55之间。

本可选实现方式中，通过训练得到的意图再识别模型，可以提高多种意图类别界限划分的清晰度，针对虚拟助理场景下非精准意图识别部分提高了意图识别的准确度。

在本实施例的一些可选实现方式中，意图再识别模型可以采用基于预训练语言的深度神经网络，该深度神经网络包括：串联连接的三层全连接层和一层激活函数层。

本可选实现方式中，利用基于预训练语言的深度神经网络进行训练，得到意图识别模型，可以在意图再识别模型应用于虚拟助理时，提高虚拟助理对预训练语言的理解程度。

可选地，上述基于预训练语言的深度神经网络可以包括：串联连接的ERNIE(Enhanced Representation from Knowledge Integration，知识增强语义表示模型)模型、三层全连接层和一层激活函数层。

可选地，上述基于预训练语言的深度神经网络可以包括：串联连接的BERT(Bidirectional Encoder Representations from Transformers，基于多层双向转换解码)模型、三层全连接层和一层激活函数层。

上述深度神经网络的激活函数层的激活函数可以根据需求进行设置，比如，采用sigmod函数作为激活函数层的激活函数。

本公开的实施例提供的模型训练方法，首先，获取不同时间段的搜索行为数据以及已训练的意图识别模型对搜索行为数据的意图识别结果；其次，将各个时间段中的搜索行为数据以及与搜索行为数据对应意图识别结果作为一个数据样本；从次，基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集；最后，基于标注数据集，对意图再识别模型进行训练，得到训练完成的意图再识别模型。由此，基于不同的搜索行为数据以及与搜索行为数据对应的意图识别模型的识别结果训练意图再识别模型，使训练后的意图再识别模型对搜索行为数据的分类结果相对于意图识别模型的识别结果更准确，提高了对行为数据进行意图识别的准确率。

在本实施例的一些可选实现方式中，获取不同时间段的搜索行为数据以及已训练的意图识别模型对搜索行为数据的意图识别结果，包括：通过已训练的意图识别模型对不同时间不同对象的搜索行为数据进行意图识别，得到意图识别结果；获取不同时间不同对象的搜索行为数据；将同一对象的时间间隔小于设定时间的搜索行为数据，作为一个时间段中的搜索行为数据；筛选意图识别结果中与不同对象的各个时间段的搜索行为数据对应的意图识别结果，得到不同时间段的意图识别模型对搜索行为数据的意图识别结果。

本可选实现方式中，当意图识别模型是虚拟助理的一部分时，针对虚拟助理线上的用户行为以对话时间段的方式进行数据标注，对话时间段为上述时间段的一种表现形式，对话时间段的切割方式可以以用户为维度，例如，相邻两次同一个用户行为小于1分钟的用户行为数据在同一个对话时间段中，同一个对话时间段的已训练的意图识别模型对搜索行为数据的意图识别结果可以包括虚拟助理当前播报话术、助理表情和助理肢体动作。

本可选实现方式中，通过意图识别模型对不同时间不同对象的搜索行为数据进行意图识别，相对于对于同一对象或者对同一时间的搜索行为数据进行意图识别，提高意图识别模型进行意图识别的多样性，为后续数据样本的获取提供数据可靠性依据。

在虚拟助理中，意图识别模型可以用于对搜索行为数据进行搜索与闲聊二分类识别。在本实施例的一些可选实现方式中，通过已训练的意图识别模型对不同时间不同对象的搜索行为数据进行意图识别，得到意图识别结果，包括：将不同时间不同对象的搜索行为数据输入已训练的意图识别模型，得到由已训练的意图识别模型输出的不同时间不同对象的搜索行为数据属于搜索或闲聊不同意图类别的概率值。

本可选实现方式中，意图识别模型用于对搜索行为数据进行搜索和闲聊二分类，可选地，意图识别模型还可以用于对搜索行为数据进行导航、搜索和闲聊等多分类，其中，导航类型是对搜索行为数据中的地名或者目的地进行路径设置。

本可选实现方式中，通过已训练的意图识别模型对搜索行为数据进行搜索和闲聊二分类，可以应用于用户虚与拟助理或机器人的信息交互，为用户的意图识别提供了可靠的依据。

在本实施例的一些可选实现方式中，上述搜索或闲聊不同意图类别包括：显著搜索意图、较显著搜索意图、显著闲聊意图、较显著闲聊意图、非显著搜索或闲聊意图。本实施例中，通过对不同意图类别进行细化，提高了意图类别细化效果。

可选地，上述搜索或闲聊不同意图类别包括：搜索意图、闲聊意图以及非显著搜索或闲聊意图。

虚拟助理是一个拟人化的助理产品，虚拟助理中的意图识别模型可以为用户提供搜索、闲聊服务，因此虚拟助理中的意图识别模型需要判断用户的搜索行为数据是搜索意图或者闲聊意图，假设在意图识别模型中定义的搜索意图的标签是1，闲聊意图的标签是0，理想的状态下意图识别模型预测出来的用户每个搜索行为数据预测的意图分布为趋近0(闲聊意图)或者趋近1(搜索意图)，而且闲聊意图的概率和搜索意图的概率值的和为1。例如，概率值大于或者等于0.8的为显著搜索意图，概率值大于0.6且概率小于0.8为较显著搜索意图，概率值小于或者等于0.2的为显著闲聊意图，概率值大于或等于0.2且概率小于0.4的为较显著闲聊意图，剩余的概率值在0.4及0.6之间的搜索行为数据属于意图识别模型比较难区分的非显著搜索或闲聊意图。非显著搜索或者闲聊意图的搜索行为数据，通过不断的进行意图识别模型的迭代可以提高显著搜索意图、较显著搜索意图、显著闲聊意图、较显著闲聊意图的比例，但非显著搜索或者闲聊意图的比例不会消失，而采用意图再识别模型可以减小非显著搜索或者闲聊意图的比例。

在本实施例的一些可选实现方式中，基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集，包括：针对所有时间段中的各个时间段，获取与该时间段相邻的上一时间段的数据样本；确定上一时间段的数据样本的意图类别；将意图类别作为该时间段的数据样本中的意图标注结果；组合上一时间段的数据样本，该时间段的搜索行为数据以及与该时间段的搜索行为数据对应的意图标注结果，得到标注数据集中的标注数据。

本可选实现方式中，每个搜索行为数据的意图的标注参考当前时间段的上一时间段对话交互记录。

本可选实现方式中，标注数据集包括至少一个标注数据，标注数据通过对当前数据样本相邻的上一时间段的数据样本进行意图类别得到，从而使标注数据集中的各个标注数据具有依存关系，保证了标注数据集中数据标注的可靠性。

图2示出了根据本公开意图识别方法的一个实施例的流程图200，上述意图识别方法包括以下步骤：

步骤201，获取待识别行为数据。

本实施例中，待识别行为数据是一种搜索行为数据，可以是用户向虚拟助理或机器人主动发出的对话内容，例如，问题，陈述句等。

本实施例中，意图识别方法运行于其上的执行主体可以通过多种手段获取待识别行为数据，比如实时从用户的客户端获取用户的图像、文本、语音等内容作为待识别行为数据；再如，从数据库中获取预存的搜索行为数据作为待识别行为数据。

步骤202，基于待识别行为数据，获取已训练的意图识别模型的意图识别结果。

本实施例中，已训练的意图识别模型的输入为待识别行为数据，输出为与待识别行为数据对应的意图识别结果，意图识别结果可以是搜索行为数据所属的对话的类型，该类型可以根据意图识别模型的设置需求进行设置，例如，类型包括：搜索、闲聊。

本实施例中，已训练的意图识别模型可以是虚拟助理(具有动画形象的虚拟人物)或者机器人的一部分，通过已训练的意图识别模型帮助虚拟助理或机器人识别不同用户行为数据的意图，使虚拟助理或机器人基于得到意图识别结果对待识别行为数据进行处理。

步骤203，将待识别行为数据、意图识别结果输入意图再识别模型，得到意图分类结果。

在本实施例中，意图再识别模型可以是采用如上述图1实施例所描述的方法而生成的。具体生成过程可以参见图1实施例的相关描述，在此不再赘述。

需要说明的是，本实施例提供的意图识别方法可以用于测试上述各实施例所生成的意图再识别模型。进而根据意图分类结果可以不断地优化意图再识别模型。该方法也可以是上述各实施例所生成的意图再识别模型的实际应用方法。采用上述各实施例所生成的意图再识别模型，来进行意图识别，确定待识别行为数据的意图的类型，有助于提高意图识别的准确度。

在本实施例的一些可选实现方式中，意图分类结果包括：待识别行为数据属于搜索或闲聊不同意图类别的概率值；方法还包括：基于概率值，对待识别行为数据进行处理，得到处理结果。

本可选实现方式中，基于概率值确定不同待识别行为数据是属于搜索意图还是属于闲聊意图，并在确定搜索意图或闲聊意图之后，进行相应的处理，例如，对于搜索意图的待识别行为数据，采用搜索引擎在互联网中进行结果搜索，得到待识别行为数据的搜索结果。再如，对于闲聊意图的待识别行为数据，分析待识别行为数据的语义内容，输出与待识别行为数据对应的回复。

本可选实现方式中，通过不同行为数据属于搜索或闲聊不同意图类别的概率值，保证了意图识别之后处理的及时性和可靠性。

在本实施例的一些可选实现方式中，上述基于概率值，对待识别行为数据进行处理，得到处理结果，包括：响应于概率值大于闲聊概率阈值且小于搜索概率阈值，对待识别行为数据进行搜索并展示搜索结果，同时对待识别行为数据进行回复。

可选地，上述基于概率值，对待识别行为数据进行处理，得到处理结果还可以包括：响应于概率值小于或等于闲聊概率阈值，对待识别行为数据进行闲聊回复。

可选地，上述基于概率值，对待识别行为数据进行处理，得到处理结果还可以包括：响应于概率值大于或等于搜索概率阈值，对待识别行为数据进行搜索并展示搜索结果。

本可选实现方式中，闲聊概率阈值和搜索概率阈值可以根据模型训练需求进行设置，例如，闲聊概率阈值为0.4，搜索概率阈值为0.6。当属于搜索或闲聊不同意图类别的概率值大于或等于0.6为精准搜索意图，进行搜索结果播报并展示搜索结果。属于搜索或闲聊不同意图类别的概率值小于或等于0.4为精准闲聊意图，进行闲聊回复，属于搜索或闲聊不同意图类别的概率值在(0.4，0.6)之间时定义为非精准意图，执行主体使用待识别行为数据的闲聊回复和搜索结果进行播报，并且显示搜索结果。

本可选实现方式中，属于搜索或闲聊不同意图类别的概率值大于闲聊概率阈值且小于搜索概率阈值时，同时对待识别行为数据进行回复，从而使闲聊和搜索意图都得到了满足，保证了待识别行为数据回复的及时性。

进一步参考图3，作为对上述各图所示方法的实现，本公开提供了模型训练装置的一个实施例，该装置实施例与图1所示的方法实施例相对应，该装置具体可应用于各种电子设备中。

如图3所示，本实施例提供的模型训练装置300包括：获取单元301，取样单元302，标注单元303，训练单元304。其中，上述获取单元301，可以被配置成获取不同时间段的搜索行为数据以及已训练的意图识别模型对搜索行为数据的意图识别结果。上述取样单元302，可以被配置成将各个时间段中的搜索行为数据以及与搜索行为数据对应意图识别结果作为一个数据样本。上述标注单元303，可以被配置成基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集。上述训练单元304，可以被配置成基于标注数据集，对意图再识别模型进行训练，得到训练完成的意图再识别模型。

在本实施例中，模型训练装置300中：获取单元301，取样单元302，标注单元303，训练单元304的具体处理及其所带来的技术效果可分别参考图1对应实施例中的步骤101、步骤102、步骤103、步骤104的相关说明，在此不再赘述。

在本实施例的一些可选的实现方式中，上述获取单元301包括：识别模块(图中未示出)、获取模块(图中未示出)、设置模块(图中未示出)、筛选模块(图中未示出)。其中，上述识别模块，可以被配置成通过已训练的意图识别模型对不同时间不同对象的搜索行为数据进行意图识别，得到意图识别结果。上述获取模块，可以被配置成获取不同时间不同对象的搜索行为数据。上述设置模块，可以被配置成将同一对象的时间间隔小于设定时间的搜索行为数据，作为一个时间段中的搜索行为数据。上述筛选模块，可以被配置成筛选意图识别结果中与不同对象的各个时间段的搜索行为数据对应的意图识别结果，得到不同时间段的意图识别模型对搜索行为数据的意图识别结果。

在本实施例的一些可选的实现方式中，上述标注单元303包括：标注模块(图中未示出)、确定模块(图中未示出)、配置模块(图中未示出)、组合模块(图中未示出)。其中，上述标注模块，可以被配置成针对所有时间段中的各个时间段，获取与该时间段相邻的上一时间段的数据样本。上述确定模块，可以被配置成确定上一时间段的数据样本的意图类别。上述配置模块，可以被配置成将意图类别作为该时间段的数据样本中的意图标注结果。上述组合模块，可以被配置成组合上一时间段的数据样本，该时间段的搜索行为数据以及与该时间段的搜索行为数据对应的意图标注结果，得到标注数据集中的标注数据。

在本实施例的一些可选的实现方式中，上述意图再识别模型采用基于预训练语言的深度神经网络，深度神经网络包括：串联连接的三层全连接层和一层激活函数层。

在本实施例的一些可选的实现方式中，上述识别模块进一步被配置成将不同时间不同对象的搜索行为数据输入已训练的意图识别模型，得到由已训练的意图识别模型输出的不同时间不同对象的搜索行为数据属于搜索或闲聊不同意图类别的概率值。

在本实施例的一些可选的实现方式中，上述搜索或闲聊不同意图类别包括：显著搜索意图、较显著搜索意图、显著闲聊意图、较显著闲聊意图、非显著搜索或闲聊意图。

进一步参考图4，作为对上述各图所示方法的实现，本公开提供了意图识别装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可应用于各种电子设备中。

如图4所示，本实施例提供的意图识别装置400包括：数据获取单元401，结果获取单元402，得到单元403。其中，上述数据获取单元401，可以被配置成获取待识别行为数据。上述结果获取单元402，可以被配置成基于待识别行为数据，获取已训练的意图识别模型的意图识别结果。上述得到单元403，可以被配置成被配置成将待识别行为数据、意图识别结果输入如上述图1或图2所描述的方法生成的意图再识别模型，得到意图分类结果。

在本实施例中，意图识别装置400中：数据获取单元401，结果获取单元402，得到单元403的具体处理及其所带来的技术效果可分别参考图1对应实施例中的步骤201、步骤202、步骤203的相关说明，在此不再赘述。

在本实施例的一些可选的实现方式中，上述意图分类结果包括：待识别行为数据属于搜索或闲聊不同意图类别的概率值；上述装置400还包括：处理单元(图中未示出)。其中，上述处理单元，可以被配置成基于概率值，对待识别行为数据进行处理，得到处理结果。

在本实施例的一些可选的实现方式中，上述处理单元进一步被配置成响应于概率值大于闲聊概率阈值且小于搜索概率阈值，对待识别行为数据进行搜索并展示搜索结果，同时对待识别行为数据进行回复。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图5所示，设备500包括计算单元501，其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序，来执行各种适当的动作和处理。在RAM 503中，还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

设备500中的多个部件连接至I/O接口505，包括：输入单元506，例如键盘、鼠标等；输出单元507，例如各种类型的显示器、扬声器等；存储单元508，例如磁盘、光盘等；以及通信单元509，例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理，例如模型训练方法或意图识别方法。例如，在一些实施例中，模型训练方法或意图识别方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元508。在一些实施例中，计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时，可以执行上文描述的模型训练方法或意图识别方法的一个或多个步骤。备选地，在其他实施例中，计算单元501可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行模型训练方法或意图识别方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种模型训练方法，所述方法包括：

获取不同时间段的搜索行为数据以及已训练的意图识别模型对所述搜索行为数据的意图识别结果；

将各个时间段中的搜索行为数据以及与搜索行为数据对应意图识别结果作为一个数据样本；

基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集，所述标注数据集包括至少一个标注数据，每个标注数据包括：当前时间段的搜索行为数据、与当前时间段相邻的上一个时间段的数据样本、当前时间段的搜索行为数据的意图类别；

基于所述标注数据集，对意图再识别模型进行训练，得到训练完成的意图再识别模型，所述意图再识别模型的输出为：当前搜索行为数据对应的意图识别结果。

2.根据权利要求1所述的方法，其中，所述意图识别结果包括至少两种意图类别，所述意图再识别模型用于对所述至少两种意图类别中任意两种类别之间的界限进行再划分。

3.根据权利要求1所述的方法，其中，所述获取不同时间段的搜索行为数据以及已训练的意图识别模型对所述搜索行为数据的意图识别结果，包括：

通过已训练的意图识别模型对不同时间不同对象的搜索行为数据进行意图识别，得到意图识别结果；

获取所述不同时间不同对象的搜索行为数据；

将同一对象的时间间隔小于设定时间的搜索行为数据，作为一个时间段中的搜索行为数据；

筛选所述意图识别结果中与不同对象的各个时间段的搜索行为数据对应的意图识别结果，得到不同时间段的所述意图识别模型对所述搜索行为数据的意图识别结果。

4.根据权利要求1所述的方法，其中，所述基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集，包括：

针对所有时间段中的各个时间段，获取与该时间段相邻的上一时间段的数据样本；

确定所述上一时间段的数据样本的意图类别；

将所述意图类别作为该时间段的数据样本中的意图标注结果；

组合所述上一时间段的数据样本，该时间段的搜索行为数据以及与该时间段的搜索行为数据对应的意图标注结果，得到标注数据集中的标注数据。

5.根据权利要求1所述的方法，其中，所述意图再识别模型采用基于预训练语言的深度神经网络，所述深度神经网络包括：串联连接的三层全连接层和一层激活函数层。

6.根据权利要求3所述的方法，其中，所述通过已训练的意图识别模型对不同时间不同对象的搜索行为数据进行意图识别，得到意图识别结果，包括：

将不同时间不同对象的搜索行为数据输入已训练的意图识别模型，得到由所述已训练的意图识别模型输出的不同时间不同对象的搜索行为数据属于搜索或闲聊不同意图类别的概率值。

7.根据权利要求6所述的方法，其中，搜索或闲聊不同意图类别包括：显著搜索意图、较显著搜索意图、显著闲聊意图、较显著闲聊意图、非显著搜索或闲聊意图。

8.一种意图识别方法，所述方法包括：

获取待识别行为数据；

基于所述待识别行为数据，获取已训练的意图识别模型的意图识别结果；

将所述待识别行为数据、所述意图识别结果输入采用如权利要求1-7中任一项所述的方法生成的意图再识别模型，得到意图分类结果。

9.根据权利要求8所述的方法，其中，所述意图分类结果包括：所述待识别行为数据属于搜索或闲聊不同意图类别的概率值；所述方法还包括：基于所述概率值，对所述待识别行为数据进行处理，得到处理结果。

10.根据权利要求9所述的方法，其中，所述基于所述概率值，对所述待识别行为数据进行处理，得到处理结果，包括：

响应于所述概率值大于闲聊概率阈值且小于搜索概率阈值，对所述待识别行为数据进行搜索并展示搜索结果，同时对所述待识别行为数据进行回复。

11.一种模型训练装置，所述装置包括：

获取单元，被配置成获取不同时间段的搜索行为数据以及已训练的意图识别模型对所述搜索行为数据的意图识别结果；

取样单元，被配置成将各个时间段中的搜索行为数据以及与搜索行为数据对应意图识别结果作为一个数据样本；

标注单元，被配置成基于与各个时间段相邻的上一时间段的数据样本，为各个时间段的搜索行为数据进行意图类别标注，得到标注数据集，所述标注数据集包括至少一个标注数据，每个标注数据包括：当前时间段的搜索行为数据、与当前时间段相邻的上一个时间段的数据样本、当前时间段的搜索行为数据的意图类别；

训练单元，被配置成基于所述标注数据集，对意图再识别模型进行训练，得到训练完成的意图再识别模型，所述意图再识别模型的输出为：当前搜索行为数据对应的意图识别结果。

12.一种意图识别装置，所述装置包括：

数据获取单元，被配置成获取待识别行为数据；

结果获取单元，被配置成基于所述待识别行为数据，获取已训练的意图识别模型的意图识别结果；

得到单元，被配置成将所述待识别行为数据、所述意图识别结果输入采用如权利要求1-7中任一项所述的方法生成的意图再识别模型，得到意图分类结果。

13.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。

15.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现权利要求1-10中任一项所述的方法。