CN117235530A

CN117235530A - 一种意图预测模型训练的方法、装置及电子设备

Info

Publication number: CN117235530A
Application number: CN202311396907.XA
Authority: CN
Inventors: 陆奕强; 刘健
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2023-10-25
Filing date: 2023-10-25
Publication date: 2023-12-15

Abstract

本说明书一个或多个实施例公开了一种意图预测模型训练的方法、装置及电子设备。所述方法包括：从使用第一训练数据训练好的第一预测模型中，提取用户操作特征，所述第一训练数据包括在多个第一时间段内、由用户在各个操作节点的操作数据构成的第一历史操作序列；将所述用户操作特征输入第二预测模型，得到用户在所述第一历史操作序列中的预设操作节点的预测操作数据；基于所述预测操作数据与用户在所述预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略，所述意图预测模型是将所述第一预测模型中的特征提取模块与所述第二预测模型进行组合得到的模型；根据所述训练策略对所述意图预测模型进行训练。

Description

一种意图预测模型训练的方法、装置及电子设备

技术领域

本说明书涉及数据处理技术领域，尤其涉及一种意图预测模型训练的方法、装置及电子设备。

背景技术

随着互联网的快速发展和消费者行为的不断变化，线上营销在商业领域的重要性日益凸显。线上营销已成为企业获取市场份额、增加销售和建立品牌形象的关键手段。了解用户的交易意图，有助于个性化用户体验、吸引新的潜在客户等。因此，确定用户的交易意图，是线上营销的重要一环。

用户在应用程序内的操作序列，对于判断用户在应用程序的交易意图有很重要的意义。因此，目前主要是在保护用户隐私数据的前提下，通过从操作序列中提取出的用户交易特征来预测用户交易意图。然而，随着时间的推移，线上营销的内容不断变化，用户的交易意图也会不断变化，已有的预测用户真实交易意图的方法的准确率会急剧下降。因此，目前亟需提供一种更优的意图预测模型训练的方案。

发明内容

本说明书实施例提供一种意图预测模型训练的方法、装置及电子设备，以提供一种符合线上营销相关人员预期的意图预测模型训练方案。

第一方面，本说明书一个或多个实施例提供一种意图预测模型训练的方法，包括：从使用第一训练数据训练好的第一预测模型中，提取用户操作特征，所述第一训练数据包括在多个第一时间段内、由用户在各个操作节点的操作数据构成的第一历史操作序列；将所述用户操作特征输入第二预测模型，得到用户在所述第一历史操作序列中的预设操作节点的预测操作数据，所述第二预测模型中的预测标签根据用户在预设时间段内的操作数据确定；基于所述预测操作数据与用户在所述预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略，所述意图预测模型是将所述第一预测模型中的特征提取模块与所述第二预测模型进行组合得到的模型；根据所述训练策略对所述意图预测模型进行训练。

第二方面，本说明书实施例提供了一种意图预测模型训练的装置，包括：从使用第一训练数据训练好的第一预测模型中，提取用户操作特征，所述第一训练数据包括在多个第一时间段内、由用户在各个操作节点的操作数据构成的第一历史操作序列；将所述用户操作特征输入第二预测模型，得到用户在所述第一历史操作序列中的预设操作节点的预测操作数据，所述第二预测模型中的预测标签根据用户在预设时间段内的操作数据确定；基于所述预测操作数据与用户在所述预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略，所述意图预测模型是将所述第一预测模型中的特征提取模块与所述第二预测模型进行组合得到的模型；根据所述训练策略对所述意图预测模型进行训练。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括：处理器，以及被安排成存储计算机可执行指令的存储器，在所述可执行指令被执行时，能够使得所述处理器：从使用第一训练数据训练好的第一预测模型中，提取用户操作特征，所述第一训练数据包括在多个第一时间段内、由用户在各个操作节点的操作数据构成的第一历史操作序列；将所述用户操作特征输入第二预测模型，得到用户在所述第一历史操作序列中的预设操作节点的预测操作数据，所述第二预测模型中的预测标签根据用户在预设时间段内的操作数据确定；基于所述预测操作数据与用户在所述预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略，所述意图预测模型是将所述第一预测模型中的特征提取模块与所述第二预测模型进行组合得到的模型；根据所述训练策略对所述意图预测模型进行训练。

第四方面，本说明书实施例提供一种存储介质，用于存储计算机程序，所述计算机程序能够被处理器执行以实现以下流程：从使用第一训练数据训练好的第一预测模型中，提取用户操作特征，所述第一训练数据包括在多个第一时间段内、由用户在各个操作节点的操作数据构成的第一历史操作序列；将所述用户操作特征输入第二预测模型，得到用户在所述第一历史操作序列中的预设操作节点的预测操作数据，所述第二预测模型中的预测标签根据用户在预设时间段内的操作数据确定；基于所述预测操作数据与用户在所述预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略，所述意图预测模型是将所述第一预测模型中的特征提取模块与所述第二预测模型进行组合得到的模型；根据所述训练策略对所述意图预测模型进行训练。

附图说明

为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本说明书一实施例的一种意图预测模型训练方法的示意性流程图。

图2是根据本说明书一实施例的一种意图预测模型训练的方法的应用场景示意图。

图3示出了本说明书一实施例的对第一预测模型进行训练的流程示意图。

图4是根据本说明书一实施例的一种文本类特征的编码器的结构示意图。

图5是根据本说明书一实施例的一种结构化类特征的编码器的结构示意图

图6是根据本说明书一实施例的一种意图预测模型训练的装置的结构示意图。

图7是根据本说明书一实施例的一种电子设备的结构示意图。

具体实施方式

下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本说明书的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

下面结合附图，通过具体的实施例及其应用场景对本说明书实施例提供的意图预测模型训练的方法、装置及电子设备进行详细地说明。

操作序列是由至少一个操作节点对应的有序的操作数据构成的序列。用户在小程序等应用程序内的操作序列，包括访问进入应用程序后，所进行的一系列的点击、滑动、访问新页面、转发等操作，以及每个操作节点上产生的埋点点击文本、页面标题(title)、页面浏览时长等文本和结构化特征。

同一用户操作可能对应多种交易意图，如，用户访问小程序，具体是要进行点餐还是电信充值，如果是点餐的话，是到店点餐还是送到家？本说明书中认为：各个操作节点之间的关系与交易意图存在较大的关联，比如到店和到家的意图区别过程中，核心的一点是确认付款节点前有没有确认或者添加收货地址。因此，前述的文本和结构化特征对于判断用户在小程序的交易意图有很重要的意义。例如，准确区分用户的意图，可以支持线上营销或风险控制等场景。

以往，为利用用户操作序列预测交易意图，大多使用有监督学习进行定制化的分类任务训练，即以操作序列以及序列上的多模态特征作为训练数据，以真实交易意图作为标签，训练一个有监督的分类任务。

但在小程序等场景下，目标分类可能有几十甚至上百种意图(如到店/到家、充值/提现、求职/考试等等)，且随事物发展，需要区分的意图还在不断增加且分布有所迁移，而意图标签的分布变化会导致预测模型的长期效果衰减，这时就需要对已有的模型进行更新。但是，在算法方案基本一致的情况下，重新定制复杂模型或者反复进行已有模型的重训，会导致计算资源的大量浪费，违反绿色计算的原则。

因此，在用户的意图标签迁移的情况下，如何实现意图预测模型的快速、绿色训练，得到预测更准确的意图预测模型，是本领域研究的难点之一。

图1示出本发明的一个实施例提供的一种意图预测模型训练的方法，该方法可以由电子设备执行，该电子设备可以包括：服务器和/或终端设备，其中终端设备可以例如车载终端或手机终端等。换言之，该方法可以由安装在前述电子设备的软件或硬件来执行，该方法包括如下步骤：

S102：从使用第一训练数据训练好的第一预测模型中，提取用户操作特征。

其中，第一预测模型是用于提取通用的用户操作特征的模型，第一预测模型在训练时所使用的数据为第一训练数据。本说明书对第一训练数据的大小不做具体限定，可以根据实际情况进行确定。具体的，第一训练数据可以为从一个应用程序中提取的数据，还可以是从多个相似的应用程序中提取的数据。

操作序列是由至少一个操作节点对应的有序的操作数据构成的序列。在一示例中，第一训练数据包括在多个第一时间段内、由用户在各个操作节点的操作数据构成的历史操作序列。其中，第一时间段为每个第一历史操作序列对应的时间长度。本说明书中对用户数量和第一时间段的长度不做具体要求，可以根据实际情况进行确定。具体的，第一时间段内可以包含用户的一个或多个用户交易事项(如交易成功事项、交易失败事项等)。

操作数据是与用户交易意图相关的数据。本说明书中对操作数据的类型不做具体限定，可以根据实际情况进行确定。具体的，操作数据可以包括在第一历史操作序列中的各个操作节点对应的页面的文本信息(如页面标题、按钮文字、区域文字等)，也可以包括在第一历史操作序列中的各个操作节点对应的页面的图像信息(如页面元素信息、被截图的页面信息、主页或详情页图片等)，还可以包括在第一历史操作序列中的各个操作节点对应的用户的结构化信息(如点击次数、划动次数、停留时间等)。

用户操作特征是从用户操作行为数据中提取的与用户交易相关的特征，其可以是从文本类型数据中提取的特征，也可以是从结构化类型数据中提取的特征，还可以是从图像类型数据中提取的特征，还可以是从多种类型数据中提取的特征。在一示例中，第一训练数据可以包含多个相似的应用程序的用户的多种类型的操作数据，以使从使用第一训练数据训练的第一预测模型中提取的用户操作特征具有更强的泛化性。具体的，可以使用自监督学习的方式，进行第一预测模型的训练，以降低获取用户操作特征所需的成本。本说明书中对第一预测模型的训练目标(如对用户关系进行分类、对用户交易意图进行预测等)不做具体限定，可以根据实际情况进行确定。

S104：将用户操作特征输入第二预测模型，得到用户在第一历史操作序列中的预设操作节点的预测操作数据。

其中，第二预测模型是用于根据用户操作特征预测用户交易意图的模型。第二预测模型中的预测标签根据用户在预设时间段内的操作数据确定。其中，预设时间段是标签迁移后的时间段。第二预测模型中的预测标签是在用户交易意图的标签迁移后的用户交易意图标签。例如，在用于外卖的点餐应用程序中，刚开始设定的交易意图标签是“外卖”和“堂食”，随着到店打包带走的客户的增多，就会产生了用户交易意图的标签迁移，即新增“到店自取”这一交易意图标签。

通过对第二预测模型的训练，即可得到根据用户操作特征进行用户意图预测的模型，且该模型具备新的应用场景(标签迁移后的场景)下的用户交易意图标签。在一示例中，可以将之前对意图预测模型训练的模型的预测标签的数量和/或内容进行修改，得到第二预测模型。具体的，第二预测模型可以是包含分类层的模型。由于根据第一历史操作序列得到的用户操作特征与用户的操作数据相对应，将用户操作特征输入第二预测模型，即可得到与用户操作特征对应的用户在第一历史操作序列中的预设操作节点的预测操作数据。

为了更好的说明本发明，凸显本发明的主旨，本说明书中的具体实施例以用户交易意图预测这一类型的第二预测模型为描述对象，本领域技术人员应当理解，对于其它的能够使用用户操作特征进行用户信息挖掘的第二预测模型，本说明书也同样可以以类似的方法实施。例如，可以将用户操作特征复用到图(Graph)模型的各个节点中，进行可疑交易以及可疑交易团伙的挖掘等。

S106：基于预测操作数据与用户在预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略。

其中，意图预测模型是在用户交易意图迁移的情况下重新确定的对用户交易意图进行预测的模型。具体的，可以将第一预测模型的特征提取模块与第二预测模块组合，得到意图预测模型。在对第二预测模型进行训练前，可以先将用户操作特征直接输入第二预测模型，测试从第一预测模型中提取的用户操作特征在第二预测模型的表现，以确定第一预测模型中特征提取模块的参数是否需要在用户交易意图迁移的情况下进行调整。

具体的，当同一用户操作特征在第二预测模型中对应的标签(预测操作数据)与第一训练数据中该用户操作特征对应的实际操作数据一致的情况下，说明第一预测模型的特征提取模块所提取的特征能够用于进行用户交易意图的预测，其对应的参数不需要与第二预测模型同时进行调整，否则，第一预测模型的特征提取模块对应的参数需要与第二预测模型同时进行调整，以提高意图预测模型的预测准确度。

S108：根据训练策略对意图预测模型进行训练。

具体的，意图预测模型在根据训练策略完成训练后，可以根据当前用户的历史操作序列，进行当前操作节点的交易意图的预测。

在本说明书实施例中，通过第一预测模型中的特征提取模块和第二预测模型进行组合，得到意图预测模型，并通过从第一预测模型中提取的通用用户操作特征来确定意图预测模型的训练策略，以进行用户交易意图的预测。该过程中，由于第一预测模型的预训练过程已使第一预测模型具备了较强的泛化预测能力，使得意图预测模型训练的难度大大降低，实现了意图预测模型的轻量化迭代和绿色计算，提高了意图预测模型的训练速度，同时，意图预测模型的训练过程，使得意图预测模型对标签迁移后的用户交易意图的预测能力大大增强，提高了对意图预测模型训练的准确度。

图2提供了一个意图预测模型训练的方法的应用场景示意图，如图2所示，用户交易意图预测服务器201向模型训练服务器202发出意图预测模型训练命令，模型训练服务器202在收到意图预测模型训练命令后，读取第一数据库203中的第一预测模型，提取用户操作特征，使用本说明书中的意图预测模型训练的方法得到新的意图预测模型，并将意图预测模型存放到第二数据库204中，同时将训练结果反馈给用户交易意图预测服务器201，以使用户交易意图预测服务器201使用新的意图预测模型进行用户交易意图预测。

在一种实现方式中，步骤S106，可以执行为如下步骤A1-A2：

步骤A1，在预设操作数据与实际操作数据的差异在预设差异范围的情况下，使用用户操作特征对意图预测模型中的第二预测模型进行训练；

步骤A2，在预设操作数据与实际操作数据的差异超出预设差异范围的情况下，使用第二训练数据对意图预测模型中的特征提取模块和第二预测模型同时进行训练。

其中，第二训练数据包括用户在第二时间段内、由用户各个操作节点的操作数据构成的第二历史操作序列，第二历史操作序列可以是在用户交易意图标签迁移后所采集的操作序列。其中，第二时间段为每个第二历史操作序列对应的时间长度。本说明书中对第二时间段的长度不做具体要求，可以根据实际情况进行确定。具体的，第二时间段内可以包含用户的一个或多个用户交易事项(如交易成功事项、交易失败事项等)。

在预设操作数据与实际操作数据的差异在预设差异范围内时，说明当前意图预测模型中的特征提取模块所提取的用户操作特征能够较好的适应标签迁移后的用户交易场景，无需进行特征提取模块的参数调整；在预设操作数据与实际操作数据的差异超出预设差异范围内时，说明当前意图预测模型中的特征提取模块所提取的用户操作特征不能够较好的适应标签迁移后的用户交易场景，需要与意图预测模型中的第二预测模型一同进行参数调整。

在一示例中，可以根据第一训练数据与第二训练数据的分布差异大小，来确定在同时训练意图预测模型中的特征提取模块和第二预测模型时，特征提取模块中参数调整的范围。具体的，在第二训练数据与第一训练数据的分布差异较小时，可以冻结特征提取模块的前k层，微调剩下的n-k层；在第二训练数据与第一训练数据的分布差异较大时，可以微调特征提取模块的全部参数。其中，k的数值可以根据实际情况进行确定。

在本说明书实施例中，根据预设操作数据与实际操作数据的差异，来确定意图预测模型中的参数调整范围，实现了对意图预测模型的参数的针对性调整，有效降低了训练意图预测模型的计算成本，提高了意图预测模型的训练速度。

在一种实现方式中，第一预测模型的训练过程，可以执行为如下步骤B1-B3：

步骤B1，对第一历史操作序列中至少一个操作节点对应的操作数据进行遮盖，得到遮盖后的第一历史操作序列；

步骤B2，将遮盖后的第一历史操作序列输入第一预测模型，得到用户在至少一个操作节点对应的预测操作数据；

步骤B3，基于至少一个操作节点对应的预测操作数据与用户在至少一个操作节点对应的实际操作数据的差异，对第一预测模型进行训练。

其中，可以随机确定第一历史操作序列中被遮盖的操作节点，通过第一预测模型的输出层输出的预测原本被掩码遮盖的操作节点的操作数据，来进行第一预测模型的训练。在一示例中，可以确定第一训练数据中被遮盖的操作节点在所有操作节点中的比例。具体的，可以使用15％的掩码遮盖比例，对选中的操作节点对应的所有类型的操作数据全部进行遮盖。图3示出了对第一预测模型进行训练的流程示意图，如图3所示，输入数据主要包含时间和操作节点信息类型两个维度信息，时间长度为T，节点信息类型总个数为P个，第t个时刻第p个类型的数据为X_tp，两个虚线框中分别是被遮掩的操作节点数据和预测出的操作节点数据。具体的，图3中各个时刻节点信息类型为两种：结构化类特征和文本类特征，预测出的操作节点数据限定为结构化类型。其中，预测出的操作节点数据也可以是预测页面标题信息、订单详情等被遮盖的文本类的信息。

进一步的，在图3中的第一预测模型完成训练后，可以直接在MLP输出的向量后接第二预测模型，本说明书中对第二预测模型的结构不做具体限定，可以根据实际情况进行确定。

具体的，对于文本类型的操作数据，掩码遮盖的方法可以是使用[MASK]符号取代原先位置的词语，但这将带来预训练阶段(即第一预测模型的训练阶段)和微调阶段(即意图预测模型的参数调整阶段)的不一致，因为在微调阶段的输入文本中不存在[MASK]符号。因此，在掩码遮盖的过程中，可以将一部分被遮盖的文本类型的操作数据直接使用[MASK]符号取代，一部分被遮盖的文本类型的操作数据使用随机词语取代，剩下的被遮盖的文本类型的操作数据的情况可以直接保留原来的词语。图像类型和结构化类型的操作数据的掩码遮盖的方法与文本类型的操作数据的掩码遮盖的方法类似，此处不再详述。

在本说明书实施例中，对第一历史操作序列中的部分操作节点进行遮盖，得到遮盖后的第一历史操作序列，进而根据遮盖后的第一历史操作序列进行第一预测模型的训练。该过程实现了利用无标签数据对第一预测模型进行自监督训练，降低了对第一预测模型进行训练的数据的标注成本，进而可以实现使用大量数据对第一预测模型进行训练，使得第一预测模型能够充分学习到跟用户交易意图相关的各种用户操作特征，提高意图预测模型的预测准确度。

在一种实现方式中，步骤B2，可以执行为如下步骤C1-C3：

步骤C1，使用特征提取模块对遮盖后的第一历史操作序列进行编码，得到遮盖后的第一历史操作序列中各个操作节点对应的初始向量；

步骤C2，对初始向量进行特征交叉编码，得到中间向量；

步骤C3，基于中间向量，对用户在至少一个操作节点的操作数据进行预测，得到预测操作数据。

其中，初始向量是对第一历史操作序列中各个操作节点的操作数据进行编码后得到的向量。具体的，由于不同类型的操作数据的编码方式不同，因此，可以在特征提取模块中，对不同类型的操作数据设置不同的编码器，以进行不同操作数据的编码，得到各种类型的操作数据对应的向量。进一步的，可以将同一操作节点对应的各种类型的操作数据对应的向量进行连接，得到初始向量。在一种实现方式中，步骤C1，可以执行为如下步骤D1-D2：

步骤D1，使用特征提取模块，将遮盖后的第一历史操作序列中各个操作节点的操作数据按照数据类型分别映射到高维特征空间，得到遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量；

步骤D2，将遮盖后的历史操作序列中同一操作节点对应的各个数据类型的高维向量进行连接处理，得到初始向量。

具体的，当操作节点对应的操作数据有多种数据类型时，可以分别映射为高维向量，再进行各个操作节点的不同数据类型连接，以得到初始向量。

在得到初始向量后，可以使用对初始向量进行特征交叉编码，得到中间向量。在本说明书实施例中对特征交叉编码的实现形式不做具体限定，可以根据实际情况进行选择。具体的，在第一预测模型中，可以在特征提取模块中设置多层感知机(MultilayerPerceptron，MLP)，使用多层感知机进行初始向量的交叉注意力编码。

进一步的，可以将中间向量输入第一预测模型中的分类层。分类层在接受输入后，对各个被掩盖节点的离散化后的特征进行多分类预测，以实现有效提取操作序列节点之间关系的目的。

在本说明书实施例中，通过对遮盖的第一历史操作序列的编码、特征交叉编码等操作，实现了对遮盖的操作节点的操作数据的预测，进而可以利用预测操作数据实现对第一预测模型的自监督训练，提高意图预测模型的预测准确度。

在一种实现方式中，步骤D1，可以执行为如下步骤E1-E2：

步骤E1，在遮盖后的第一历史操作序列中各个操作节点的操作数据包含文本数据的情况下，使用特征提取模块中的文本编码器，将遮盖后的第一历史操作序列中各个操作节点的文本数据映射到高维特征空间，得到第一向量；

步骤E2，从第一向量中，提取表征遮盖后的第一历史操作序列中各个操作节点对应的文本数据之间关系的高维向量。

其中，文本编码器是特征提取模块中设置的从文本数据中提取文本特征的编码器。具体的，文本编码器中可以包含嵌入层，用于将遮盖后的第一历史操作序列中各个操作节点的文本数据映射到高维特征空间，得到第一向量，以供文本编码器进一步使用。进一步的，文本编码器中还可以包含特征编码层，用于从第一向量中提取第一历史操作序列中各个操作节点对应的文本数据之间的关系的特征(即表征文本数据之间关系的高维向量)。具体的，步骤E2，可以执行为如下步骤F1-F3：

步骤F1，从第一向量中，提取遮盖后的第一历史操作序列中各个操作节点与相邻的预设数量的操作节点的文本数据之间的局部特征；

步骤F2，从局部特征中，提取遮盖后的第一历史操作序列中任意两个操作节点的文本数据之间的全局特征；

步骤F3，基于全局特征，得到遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量。

具体的，在特征提取时，可以同时提取第一历史操作序列中各个操作节点与邻近操作节点之间的局部特征、所有操作节点之间的全局特征，以提高最后得到的高维向量对操作节点对应的文本数据的表征能力，使得各个操作节点对应的高维向量同时具有相邻操作节点之间的关系特征，还具有所有操作节点之间的全局特征。在一示例中，可以在特征编码层中设置卷积层和注意力层，卷积层通过窗口滑动，固定的学习相邻N个操作节点之间的关系，注意力层则会通过两两对比学习所有操作节点之间的关系。

进一步的，还可以将一个卷积层和一个注意力层组合成一个基本执行模块(如残差块ResBlock)，进而可以在特征编码层设置多个ResBlock纵向叠加，实现以单元形式对第一向量中的信息进行抽取。本说明书中对文本编码器中ResBlock的数量不做具体限定，可以根据实际情况进行选择。图4示出了一种文本类特征的编码器的结构示意图。如图4所示，文本编码器中包含了嵌入层、卷积层和注意力层。其中，卷积层和注意力层组合成ResBlock，文本编码器中包含了多个纵向叠加的ResBlock。

在本说明书实施例中，通过文本编码器，可以有效提取遮盖后的第一历史操作序列中各个操作节点对应的文本数据类型的高维向量，进而可以基于文本数据类型的高维向量进行意图预测模型的训练，降低意图预测模型训练的难度。

在一种实现方式中，步骤D1，可以执行为如下步骤G1-G2：

步骤G1，在遮盖后的第一历史操作序列中各个操作节点的操作数据包含结构化数据的情况下，使用特征提取模块中的结构化编码器，将遮盖后的第一历史操作序列中各个操作节点的结构化数据映射到高维特征空间，得到第二向量；

步骤G2，将遮盖后的第一历史操作序列中各个操作节点对应的第二向量进行特征交叉编码，得到遮盖后的第一历史操作序列中各个操作节点对应的结构化数据类型的高维向量。

其中，结构化编码器是特征提取模块中设置的从结构化数据中提取结构化特征的编码器。具体的，结构化编码器中可以包含嵌入层，用于将遮盖后的第一历史操作序列中各个操作节点的结构化数据映射到高维特征空间，得到第二向量，以供结构化编码器进一步使用。进一步的，结构化编码器中还可以包含特征编码层，用于从第二向量中提取第一历史操作序列中各个操作节点对应的结构数据之间的关系的特征(即表征结构化数据之间关系的高维向量)。其中，特征编码层可以包括多层感知机(Multilayer Perceptron，MLP)，使用多层感知机对第二向量进行非线性变化操作，以实现交叉特征提取，得到结构化数据类型对应的高维向量。

图5示出了一种结构化类特征的编码器的结构示意图。如图5所示，结构化编码器中包含了嵌入层和多次感知机层。

在本说明书实施例中，通过结构化编码器，可以有效提取遮盖后的第一历史操作序列中各个操作节点对应的结构化数据类型的高维向量，进而可以基于高维向量进行意图预测模型的训练，降低意图预测模型训练的难度。

本说明书实施例提供的意图预测模型训练的方法，执行主体可以为意图预测模型训练的装置，或者该意图预测模型训练的装置中的用于执行意图预测模型训练的方法的控制模块。本说明书实施例中以意图预测模型训练的装置执行意图预测模型训练的方法为例，说明本说明书实施例提供的意图预测模型训练的装置。

图6是根据本发明实施例的意图预测模型训练的装置的结构示意图。如图6所示，意图预测模型训练的装置600包括：

提取模块610，用于从使用第一训练数据训练好的第一预测模型中，提取用户操作特征，第一训练数据包括在多个第一时间段内、由用户在各个操作节点的操作数据构成的第一历史操作序列；

数据获取模块620，用于将用户操作特征输入第二预测模型，得到用户在第一历史操作序列中的预设操作节点的预测操作数据，第二预测模型中的预测标签根据用户在预设时间段内的操作数据确定；

策略确定模块630，用于基于预测操作数据与用户在预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略，意图预测模型是将第一预测模型中的特征提取模块与第二预测模型进行组合得到的模型；

训练模块640，用于根据训练策略对意图预测模型进行训练。

在一个实施例中，策略确定模块630，包括：

第一训练单元，用于在预设操作数据与实际操作数据的差异在预设差异范围的情况下，使用用户操作特征对意图预测模型中的第二预测模型进行训练；

第二训练单元，用于在预设操作数据与实际操作数据的差异超出预设差异范围的情况下，使用第二训练数据对意图预测模型中的特征提取模块和第二预测模型同时进行训练，第二训练数据包括用户在第二时间段内、由用户各个操作节点的操作数据构成的第二历史操作序列。

在一个实施例中，第一预测模型的训练过程，包括：

对第一历史操作序列中至少一个操作节点对应的操作数据进行遮盖，得到遮盖后的第一历史操作序列；

将遮盖后的第一历史操作序列输入第一预测模型，得到用户在至少一个操作节点对应的预测操作数据；

基于至少一个操作节点对应的预测操作数据与用户在至少一个操作节点对应的实际操作数据的差异，对第一预测模型进行训练。

在一个实施例中，将遮盖后的第一历史操作序列输入第一预测模型，得到用户在至少一个操作节点对应的预测操作数据，包括：

使用特征提取模块对遮盖后的第一历史操作序列进行编码，得到遮盖后的第一历史操作序列中各个操作节点对应的初始向量；

对初始向量进行特征交叉编码，得到中间向量；

基于中间向量，对用户在至少一个操作节点的操作数据进行预测，得到预测操作数据。

在一个实施例中，使用特征提取模块对遮盖后的第一历史操作序列进行编码，得到遮盖后的第一历史操作序列中各个操作节点对应的初始向量，包括：

使用特征提取模块，将遮盖后的第一历史操作序列中各个操作节点的操作数据按照数据类型分别映射到高维特征空间，得到遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量；

将遮盖后的历史操作序列中同一操作节点对应的各个数据类型的高维向量进行连接处理，得到初始向量。

在一个实施例中，使用特征提取模块，将遮盖后的第一历史操作序列中各个操作节点的操作数据按照数据类型分别映射到高维特征空间，得到遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量，包括：

在遮盖后的第一历史操作序列中各个操作节点的操作数据包含文本数据的情况下，使用特征提取模块中的文本编码器，将遮盖后的第一历史操作序列中各个操作节点的文本数据映射到高维特征空间，得到第一向量；

从第一向量中，得到遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量。

在一个实施例中，从第一向量中，得到遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量，包括：

从第一向量中，提取遮盖后的第一历史操作序列中各个操作节点与相邻的预设数量的操作节点的文本数据之间的局部特征；

从局部特征中，提取遮盖后的第一历史操作序列中任意两个操作节点的文本数据之间的全局特征；

基于全局特征，得到遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量。

在遮盖后的第一历史操作序列中各个操作节点的操作数据包含结构化数据的情况下，使用特征提取模块中的结构化编码器，将遮盖后的第一历史操作序列中各个操作节点的结构化数据映射到高维特征空间，得到第二向量；

将遮盖后的第一历史操作序列中各个操作节点对应的第二向量进行特征交叉编码，得到遮盖后的第一历史操作序列中各个操作节点对应的结构化数据类型的高维向量。

本说明书实施例中的意图预测模型训练的装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等，非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本说明书实施例不作具体限定。

本说明书实施例中的意图预测模型训练的装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为IOS操作系统，还可以为其他可能的操作系统，本说明书实施例不作具体限定。

本说明书实施例提供的意图预测模型训练的装置能够实现图1的方法实施例中实现的各个过程，为避免重复，这里不再赘述。

基于同样的思路，本说明书一个或多个实施例还提供一种电子设备，如图7所示。电子设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器701和存储器702，存储器702中可以存储有一个或一个以上存储应用程序或数据。其中，存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括对电子设备中的一系列计算机可执行指令。更进一步地，处理器701可以设置为与存储器702通信，在电子设备上执行存储器702中的一系列计算机可执行指令。电子设备还可以包括一个或一个以上电源703，一个或一个以上有线或无线网络接口704，一个或一个以上输入输出接口705，一个或一个以上键盘706。

具体在本实施例中，电子设备包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对电子设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

从使用第一训练数据训练好的第一预测模型中，提取用户操作特征，第一训练数据包括在多个第一时间段内、由用户在各个操作节点的操作数据构成的第一历史操作序列；

将用户操作特征输入第二预测模型，得到用户在第一历史操作序列中的预设操作节点的预测操作数据，第二预测模型中的预测标签根据用户在预设时间段内的操作数据确定；

基于预测操作数据与用户在预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略，意图预测模型是将第一预测模型中的特征提取模块与第二预测模型进行组合得到的模型；

根据训练策略对意图预测模型进行训练。

本说明书一个或多个实施例还提出了一种存储介质，该存储介质存储一个或多个计算机程序，该一个或多个计算机程序包括指令，该指令当被包括多个应用程序的电子设备执行时，能够使该电子设备执行上述意图预测模型训练的方法实施例的各个过程，并具体用于执行：

根据训练策略对意图预测模型进行训练。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于上述一种存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述实施例阐明的方法、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书一个或多个实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书一个或多个实施例而已，并不用于限制本申请。对于本领域技术人员来说，本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书个或多个实施例的权利要求范围之内。

Claims

1.一种意图预测模型训练的方法，包括：

从使用第一训练数据训练好的第一预测模型中，提取用户操作特征，所述第一训练数据包括在多个第一时间段内、由用户在各个操作节点的操作数据构成的第一历史操作序列；

将所述用户操作特征输入第二预测模型，得到用户在所述第一历史操作序列中的预设操作节点的预测操作数据，所述第二预测模型中的预测标签根据用户在预设时间段内的操作数据确定；

基于所述预测操作数据与用户在所述预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略，所述意图预测模型是将所述第一预测模型中的特征提取模块与所述第二预测模型进行组合得到的模型；

根据所述训练策略对所述意图预测模型进行训练。

2.根据权利要求1所述的方法，所述基于所述预测操作数据与用户在所述预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略，包括：

在所述预设操作数据与所述实际操作数据的差异在预设差异范围的情况下，使用所述用户操作特征对所述意图预测模型中的第二预测模型进行训练；

在所述预设操作数据与所述实际操作数据的差异超出所述预设差异范围的情况下，使用第二训练数据对所述意图预测模型中的特征提取模块和第二预测模型同时进行训练，所述第二训练数据包括用户在第二时间段内、由用户各个操作节点的操作数据构成的第二历史操作序列。

3.根据权利要求1所述的方法，所述第一预测模型的训练过程，包括：

对所述第一历史操作序列中至少一个操作节点对应的操作数据进行遮盖，得到遮盖后的第一历史操作序列；

将所述遮盖后的第一历史操作序列输入所述第一预测模型，得到用户在所述至少一个操作节点对应的预测操作数据；

基于所述至少一个操作节点对应的预测操作数据与用户在所述至少一个操作节点对应的实际操作数据的差异，对所述第一预测模型进行训练。

4.根据权利要求3所述的方法，所述将所述遮盖后的第一历史操作序列输入所述第一预测模型，得到用户在所述至少一个操作节点对应的预测操作数据，包括：

使用所述特征提取模块对所述遮盖后的第一历史操作序列进行编码，得到所述遮盖后的第一历史操作序列中各个操作节点对应的初始向量；

对所述初始向量进行特征交叉编码，得到中间向量；

基于所述中间向量，对用户在所述至少一个操作节点的操作数据进行预测，得到所述预测操作数据。

5.根据权利要求4所述的方法，所述使用所述特征提取模块对所述遮盖后的第一历史操作序列进行编码，得到所述遮盖后的第一历史操作序列中各个操作节点对应的初始向量，包括：

使用所述特征提取模块，将所述遮盖后的第一历史操作序列中各个操作节点的操作数据按照数据类型分别映射到高维特征空间，得到所述遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量；

将所述遮盖后的历史操作序列中同一操作节点对应的各个数据类型的高维向量进行连接处理，得到所述初始向量。

6.根据权利要求5所述的方法，所述使用所述特征提取模块，将所述遮盖后的第一历史操作序列中各个操作节点的操作数据按照数据类型分别映射到高维特征空间，得到所述遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量，包括：

在所述遮盖后的第一历史操作序列中各个操作节点的操作数据包含文本数据的情况下，使用所述特征提取模块中的文本编码器，将所述遮盖后的第一历史操作序列中各个操作节点的文本数据映射到高维特征空间，得到第一向量；

从所述第一向量中，得到所述遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量。

7.根据权利要求6所述的方法，所述从所述第一向量中，得到所述遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量，包括：

从所述第一向量中，提取所述遮盖后的第一历史操作序列中各个操作节点与相邻的预设数量的操作节点的文本数据之间的局部特征；

从所述局部特征中，提取所述遮盖后的第一历史操作序列中任意两个操作节点的文本数据之间的全局特征；

基于所述全局特征，得到所述遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量。

8.根据权利要求5所述的方法，所述使用所述特征提取模块，将所述遮盖后的第一历史操作序列中各个操作节点的操作数据按照数据类型分别映射到高维特征空间，得到所述遮盖后的第一历史操作序列中各个操作节点对应的各个数据类型的高维向量，包括：

在所述遮盖后的第一历史操作序列中各个操作节点的操作数据包含结构化数据的情况下，使用所述特征提取模块中的结构化编码器，将所述遮盖后的第一历史操作序列中各个操作节点的结构化数据映射到高维特征空间，得到第二向量；

将所述遮盖后的第一历史操作序列中各个操作节点对应的第二向量进行特征交叉编码，得到所述遮盖后的第一历史操作序列中各个操作节点对应的结构化数据类型的高维向量。

9.一种意图预测模型训练的装置，包括：

提取模块，用于从使用第一训练数据训练好的第一预测模型中，提取用户操作特征，所述第一训练数据包括在多个第一时间段内、由用户在各个操作节点的操作数据构成的第一历史操作序列；

数据获取模块，用于将所述用户操作特征输入第二预测模型，得到用户在所述第一历史操作序列中的预设操作节点的预测操作数据，所述第二预测模型中的预测标签根据用户在预设时间段内的操作数据确定；

策略确定模块，用于基于所述预测操作数据与用户在所述预设操作节点的实际操作数据的匹配程度，确定对意图预测模型进行训练的训练策略，所述意图预测模型是将所述第一预测模型中的特征提取模块与所述第二预测模型进行组合得到的模型；

训练模块，用于根据所述训练策略对所述意图预测模型进行训练。

10.一种电子设备，包括：

处理器，以及

被安排成存储计算机可执行指令的存储器，在所述可执行指令被执行时，能够使得所述处理器：

根据所述训练策略对所述意图预测模型进行训练。