CN114648070A

CN114648070A - 关键行为抽取网络、关键属性抽取网络的训练方法及装置

Info

Publication number: CN114648070A
Application number: CN202210296932.XA
Authority: CN
Inventors: 宋博文; 李佳霓; 张天翼; 马樱珍; 曹林春; 朱明超
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2022-03-24
Filing date: 2022-03-24
Publication date: 2022-06-21
Anticipated expiration: 2042-03-24
Also published as: CN114648070B

Abstract

本说明书实施例提供关键行为抽取网络、关键属性抽取网络的训练方法及装置。其中，关键行为抽取网络的训练方法包括：先将原始行为序列输入关键行为抽取网络，得到若干关键行为，形成关键行为序列；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为；再将所述关键行为序列输入预先训练好的业务预测模型，得到业务预测结果；之后，基于所述业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络。如此，可以自动精准地抽取关键行为，有效增强对完整行为序列的业务预测结果的可解释性。

Description

关键行为抽取网络、关键属性抽取网络的训练方法及装置

技术领域

本说明书一个或多个实施例涉及机器学习技术领域，尤其涉及一种关键行为抽取网络的训练方法及装置，一种关键属性抽取网络的训练方法及装置。

背景技术

在许多业务场景下，需要对用户操作行为等进行分析和处理，例如，评估与用户相关的风险程度，以便进行风险防控等。通常，可以基于用户做出的某项操作行为本身的特征进行分析，进一步地，还可以更全面地考虑用户的行为序列。行为序列是用户在日常操作使用中产生的一系列点击、访问、购买等行为的发生过程，可表示为行为集合的时间序列，它蕴含了用户的细粒度习惯偏好等特点，便于更全面地分析用户的操作历史和操作模式。

随着机器学习的发展，构建机器学习模型分析用户行为序列已成为研究热点。有些情况下，需要对利用机器学习模型得到的针对用户行为序列的业务预测结果进行解释，例如在风险防控场景下，当用户因感知其操作行为被干预或阻断而向客服人员询问相关事由时，客服人员需要向用户进行解释说明。

然而，目前对业务分析结果的解释大多依赖于对用户行为序列的人工分析，导致成本高，且效率和准确率都十分有限。因此，迫切需要一种方案，可以有效增强业务结果的可解释性。

发明内容

本说明书一个或多个实施例描述关键行为抽取网络的训练方法及装置，以及关键属性抽取网络的训练方法及装置，可以自动确定出原始行为序列中的关键行为，和/或，行为的关键属性，从而有效增强业务结果的可解释性。

根据第一方面，提供一种关键行为抽取网络的训练方法，包括：将原始行为序列输入关键行为抽取网络，得到若干关键行为，形成关键行为序列；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为。将所述关键行为序列输入预先训练好的业务预测模型，得到业务预测结果。基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络。

在一个实施例中，所述关键行为抽取网络包括概率预测层、离散化层和输出层；其中，将原始行为序列输入关键行为抽取网络，得到若干关键行为，包括：利用所述概率预测层，预测所述T个操作行为对应的T个采样概率；利用所述离散化层，确定所述T个采样概率对应的T个离散值；利用所述输出层，输出所述T个离散值中等于预设数值的若干离散值所对应的若干操作行为，作为所述若干关键行为。

在一个具体的实施例中，利用所述离散化层，确定所述T个采样概率对应的T个离散值，包括：确定属于预设数据分布的T个随机采样值；将所述T个随机采样值对应叠加至所述T个采样概率，得到T个新概率；利用softmax函数处理所述T个新概率，得到所述T个离散值。

在一个实施例中，所述业务预测模型基于以下步骤预先训练：获取多个训练样本，其中各个训练样本包括对应的历史行为序列和业务标签，所述历史行为序列包括对应用户做出的按时间顺序排列的T个历史操作行为；利用所述多个训练样本，训练业务预测模型。

在一个实施例中，在基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络之前，所述方法还包括：将所述原始行为序列输入所述业务预测模型，从而将输出的业务预测结果作为所述业务标签。

在一个实施例中，在基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络之前，所述方法还包括：针对所述若干关键行为中的各个关键行为，将其对应N个属性字段的N个属性值输入关键属性抽取网络，得到若干关键属性值，形成对应的重构行为；将基于所述若干关键行为对应的若干重构行为而形成的重构行为序列，输入所述业务预测模型，得到业务预测结果；其中，基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络，包括：基于所述关键行为序列和重构行为序列各自对应的业务预测结果，以及所述业务标签，训练所述关键行为抽取网络和关键属性抽取网络。

根据第二方面，提供一种关键属性抽取网络的训练方法，包括：将原始行为序列输入采用第一方面提供的方法训练出的关键行为抽取网络，得到若干关键行为；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为。针对各个关键行为，将其对应N个属性字段的N个属性值输入所述关键属性抽取网络，得到若干关键属性值，形成重构行为。将基于所述若干关键行为对应的若干重构行为而形成的重构行为序列，输入训练好的业务预测模型，得到业务预测结果。基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键属性抽取网络。

在一个实施例中，所述关键属性抽取网络包括概率预测层、离散化层和输出层；其中，得到若干关键属性值，包括：利用所述概率预测层，预测所述N个属性值对应的N个采样概率；利用所述离散化层，确定所述N个采样概率对应的N个离散值；利用所述输出层，输出所述N个离散值中等于预设数值的若干离散值所对应的若干属性值，作为所述若干关键属性值。

在一个具体的实施例中，利用所述离散化层，确定所述N个采样概率对应的N个离散值，包括：确定属于预设数据分布的N个随机采样值；将所述N个随机采样值对应叠加至所述N个采样概率，得到N个新概率；利用softmax函数处理所述N个新概率，得到所述N个离散值。

在一个实施例中，基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键属性抽取网络之前，所述方法还包括：将基于所述若干关键行为形成的关键行为序列输入所述业务预测模型，从而将输出的业务预测结果作为所述业务标签。

根据第三方面，提供一种关键行为抽取网络的训练装置，包括：关键行为抽取单元，配置为将原始行为序列输入关键行为抽取网络，得到若干关键行为，形成关键行为序列；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为；业务结果预测单元，配置为将所述关键行为序列输入预先训练好的业务预测模型，得到业务预测结果；训练单元，配置为基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络。

根据第四方面，提供一种关键属性抽取网络的训练装置，包括：关键行为抽取单元，配置为将原始行为序列输入采用第三方面提供的装置训练出的关键行为抽取网络，得到若干关键行为；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为；关键属性抽取单元，配置为针对各个关键行为，将其对应N个属性字段的N个属性值输入所述关键属性抽取网络，得到若干关键属性值，形成重构行为；业务结果预测单元，配置为将基于所述若干关键行为对应的若干重构行为而形成的重构行为序列，输入训练好的业务预测模型，得到业务预测结果；训练单元，配置为基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键属性抽取网络。

根据第五方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面或第二方面的方法。

根据第六方面，提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，该处理器执行所述可执行代码时，实现第一方面或第二方面的方法。

采用本说明书实施例提供的方法和装置，可以实现将神经网络应用到关键行为、关键属性的采样，从而利用训练好的神经网络自动、精准地确定出完整行为序列中的关键行为，以及行为中的关键属性，用以对完整行为序列的业务预测结果进行支撑性解释，进而有效增强业务结果的可解释性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出本说明书实施例披露的关键行为抽取网络的训练方案实施架构示意图；

图2示出本说明书实施例披露的关键行为抽取网络的训练方法流程示意图；

图3示出本说明书实施例披露的关键行为抽取网络的训练框架示意图；

图4示出本说明书实施例披露的关键属性抽取网络的训练方法流程示意图；

图5示出本说明书实施例披露的关键行为抽取网络的训练装置结构示意图；

图6示出本说明书实施例披露的关键属性抽取网络的训练装置结构示意图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

如前所述，需要增强业务结果的可解释性。图1示出本说明书实施例披露的关键行为抽取网络的训练方案实施架构示意图。如图1所示，在方案的实施过程中，先获取原始行为序列和对应的业务标签，其中原始行为序列包括按时间顺序排列的T个操作行为(或称操作事件)，即E₁至E_T；然后，将该原始行为序列输入关键行为抽取网络，得到抽取出的若干关键行为(图1中示意为E₂、E₄和E₇)，形成关键行为序列(或称关键子序列)；再将此关键行为序列输入预先训练好的业务预测模型，得到业务预测结果；从而基于业务预测结果和业务标签确定训练损失，用以更新关键行为抽取网络中的模型参数。依此，对关键行为抽取网络进行多次迭代更新，可以得到训练好的关键行为抽取网络，用于可靠、高效地从原始的完整行为序列中抽取出关键子序列，以解释完整行为序列对应的业务预测结果，从而实现对业务结果可解释性的有效增强。

下面详细描述上述方案的实施步骤。图2示出本说明书实施例披露的关键行为抽取网络的训练方法流程示意图，所述方法的执行主体可以为任何具有计算、处理能力的装置、服务器或设备集群。如图2所示，所述方法包括以下步骤：

步骤S210，获取原始行为序列和对应的业务标签，所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为；步骤S220，将原始行为序列输入关键行为抽取网络，得到若干关键行为，形成关键行为序列；步骤S230，将所述关键行为序列输入预先训练好的业务预测模型，得到业务预测结果；步骤S240，基于所述业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络。

对以上步骤的展开介绍如下：

首先，在步骤S210，获取原始行为序列和对应的业务标签。

参见图1，原始行为序列中包括按照时间顺序排列的T个操作行为E₁,E₂,…,E_T；并且，这T个操作行为均由同一用户(或称目标用户)做出，其中T为大于1的整数。在一个实施例中，T个操作行为都是目标用户的历史操作行为；在另一个实施例中，T个操作行为可以包括目标用户的当前操作行为以及向前回溯的T-1个历史操作行为。另一方面，在一个实施例中，可以采集具有同一类型的T个操作行为，如登录类行为或交易类行为；在另一个实施例中，可以根据预先设定的多种行为类型，如点击行为、购买行为等，采集T个操作行为。

原始行为序列中的每个操作行为具有相关的属性信息，包括对应N个属性字段的N个属性值，其中N为大于1的整数。为了业务分析的全面性，在此可以获取各个行为的细粒度的全面的属性信息以供后续处理。示例性地，属性信息可以包括行为类型(如登录操作，充值操作，支付操作，交易操作等)、行为时间、地理位置、用户操作所使用的设备信息(如设备类型、设备型号、MAC地址，IP地址等)，以及所使用的软件方面的信息(如浏览器类型，app版本等)；进一步，如果操作行为是交易类行为，属性信息还可以包括交易行为的涉及金额，支付渠道，支付卡号，支付卡的发卡行，交易对象，等等。

此外，对于历史操作事件而言，对应的属性信息还可以包括，历史操作行为的操作结果，例如操作成功，失败，超时，等等。而对于当前操作事件，一般是有待进行分析预测的事件，其尚未产生操作结果，其对应操作结果的字段值可以是缺省值；通常来说，对于当前操作事件进行业务分析，正是用于决定是否允许本次操作，也就是决定其操作结果。

以上介绍原始行为序列。对于该原始行为序列对应的业务标签，其与需执行的业务预测任务有关，业务预测任务针对的业务对象可以是用户，也可以是用户的当前操作行为。在一个实施例中，业务预测任务为针对用户或当前操作的风险评估任务，相应，业务标签为风险类别标签，如高风险、中风险、低风险，或有风险和无风险，等等；在另一个实施例中，业务预测任务为针对用户的信用预测任务，相应，业务标签可以是信用分数或信用等级。另一方面，需执行的业务预测任务也可以包括多项，相应，原始行为序列对应的业务标签为多个。在一个实施例中，业务预测任务包括识别风险用户以及选取针对高风险用户的行为干预方式，相应，业务标签包括风险类别标签，如高风险和低风险，还包括干预类别标签，如电话询问、要求二次核身、短信提醒等。

又一方面，对于上述业务标签的获取方式，在一个实施例中，可以直接获取通过人工标注得到的业务标签。在另一个实施例中，对于没有人工标注的业务标签的情况，例如，上述原始行为序列响应于当前操作行为E_T而采集，来不及进行人工标注，此时，可以将上述原始行为序列输入训练好的业务预测模型中，得到对应的业务预测结果，作为该原始行为序列对应的业务标签。需说明，一方面，业务预测模型可以基于DNN(Deep NeuralNetworks，深度神经网络)或RNN(Recurrent Neural Network，循环神经网络)等机器学习算法实现；另一方面，业务预测模型可以采用监督学习的方式进行训练而得到。具体，可以采集多个历史行为序列和对应的多个人工标注标签，然后，基于采集的这些训练数据，对该业务预测模型进行多轮次迭代训练，从而得到训练好的业务预测模型。

以上，对获取的原始行为序列和业务标签进行介绍。然后，基于获取到的原始行为序列，在步骤S220，将该原始行为序列输入关键行为抽取网络，得到若干关键行为，形成关键行为序列。需理解，文中的若干指代一个或多个，并且，对于不同原始行为序列，对其抽取出的关键行为的个数可能相同也可能不同。

在一种实施方式中，利用关键行为抽取网络，确定T个操作行为对应的T个采样概率，从将确定该T个采样概率中大于预定阈值的若干采样概率，并将该若干采样概率对应的若干操作行为确定为若干关键行为。然而，从T个操作行为对应的离散概率空间进行采样，这个采样动作是离散的，不可导的，那么计算图就不能传递梯度，导致参数难以进行更新。

由此，考虑将离散的采样概率转换为服从连续概率分布，从而实现梯度的计算和传递，进而实现参数更新。相应，在另一种实施方式中，关键行为抽取网络中包括概率预测层和离散化层，基于此，先利用概率预测层预测T个操作行为对应的T个采样概率，再在离散化层，结合根据预设数据分布采样的随机变量值，将T个采样概率离散化为T个离散值，进而，可以根据T个离散值确定出若干关键行为。

在一个实施例中，在概率预测层，先利用行为表征网络，确定T个操作行为对应的T个行为表征，再利用sigmoid函数分别处理此T个行为表征，得到T个采样概率。在一个具体的实施例中，其中行为表征子网络可以实现为浅层的MLP(Multi Layer Perceptron，多层感知机)网络或时序网络等。示例性地，参见图3，其中以T＝5为例，基于5个操作行为的行为特征，即x₁,...,x₅，确定出5个行为表征，即z₁,...,z₅，再利用sigmoid函数，即σ，分别处理z₁,...,z₅，得到5个采样概率p₁,...,p₅。如此，可以得到T个采样概率。

在一个实施例中，在离散化层，先确定属于预设连续分布的T个随机采样值，再将该T个随机采样值对应叠加至T个采样概率，得到T个新概率，之后，通过利用softmax函数处理T个新概率，确定对应的T个离散值。在一个具体的实施例中，对于利用softmax函数处理T个新概率而得到的T个处理值中的任一处理值，若其大于预设阈值(例如，0.5)，则将该处理值转换为第一离散值(例如，1)，否则将其转换为不同于第一离散值的第二离散值(例如，0)。

在一个具体的实施例中，上述预设数据分布是连续变量的数据分布，例如，可以设定为高斯分布、多项式分布或Gumbel分布。为便于理解，以Gumbel分布为例对概率的离散化处理进行说明。首先，从均匀分布U(0,1)中采样T个独立的随机样本，记作u₁,...,u_T；再采用式G_i＝-log(-log(u_i))进行计算，得到服从Gumbel分布的T个随机采样值(或称T个随机变量值)，记作G₁,...,G_T；然后，将T个采样概率和T个随机采样值对应相加，得到T个新概率，记作p₁+G₁,...,p_T+G_T；之后，通过softmax函数处理T个新概率，从而使得其中各个新概率转换为逼近0或1的离散值，进而得到T个离散值。在一个例子中，可以采用下式计算第i个离散值m_i。

m_i＝softmax([(log(p_i/(1-p_i))+G_i]/τ) (1)

其中，τ是温度参数，其取值大于0，控制着softmax的平滑(soft)程度，τ的值越大，生成的分布越平滑，越小，生成的分布越接近离散的独热(one-hot)分布。在训练中，可以通过之间降低τ的取值，以逐步逼近真实的离散分布。需说明，τ可以是需人工设定的超参，也可以是训练中需学习的参数。

示例性地，参见图3，其中示意5个采样概率p₁,...,p₅被对应转换为离散值1,0,1,0,1。

如此，可以将T个采样概率转换为T个离散值。

在一个具体的实施例中，T个离散值中的各离散值非1即0，由此，可以将T个操作行为形成的向量与T个离散值形成的向量进行对位相乘处理，从而得到关键行为序列。示例性地，参见图3，可以利用式x_s＝x⊕m计算关键行为序列，显然，x_s＝(x₁,0,x₃,0,x₅)。如此，可以根据T个离散值抽取出关键行为序列。

通过采样上述另一种实施方式，可以实现将原本服从离散分布的采样概率转换成服从连续分布，使得后续能够计算梯度，从而实现模型参数的更新。

由上，可以实现从原始行为序列中抽取出关键行为序列，然后，在步骤S230，将该关键行为序列输入预先训练好的业务预测模型，得到业务预测结果。从而在步骤S240，基于此业务预测结果和原始行为序列的上述业务标签，训练关键行为抽取网络。

根据一个实施例，参见图3，其中示出将原始行为序列x输入业务预测模型，得到用作业务标签的预测结果P(y|x)，以及，将关键行为序列x_s输入业务预测模型，得到对应的业务预测结果P(y|x_s)，由此，根据业务标签P(y|x)和业务预测结果P(y|x_s)确定预测损失，用以更新模型参数。

进一步，在一个实施例中，可以采用下式计算预测损失：

L＝-D[P(y|x),P(y|x_s)]+λ₁||p||-λ₂(1-p)log(1-p) (2)

在上式中，D[]表示度量函数，例如，可以使用互信息(Mutual Information)或KL散度(Kullback-Leibler Divergence)；λ₁和λ₂是超参；p对应上述T个采样概率形成的概率向量；||p||约束的目的是为了让采样概率的输出结果区域稀疏，熵约束-(1-p)log(1-p)的目的是希望采样概率的分值趋于两极。

如此，可以确定预测损失，从而进行梯度计算以及利用反向传播法实现对模型参数的更新。

由上，可以实现对关键行为抽取网络的更新。

综上，采用本说明书实施例披露的关键行为抽取网络的训练方法，可以实现将神经网络应用到关键行为采样，从而利用训练好的关键行为抽取网络自动、精准地确定出支撑完整行为序列的业务预测结果的关键行为，进而有效增强业务结果的可解释性。

图4示出本说明书实施例披露的关键属性抽取网络的训练方法流程示意图，所述方法的执行主体可以实现为任何具有计算、处理能力的服务器、装置或设备集群等。如图4所示，所述方法包括以下步骤：

步骤S410，将原始行为序列输入训练好的关键行为抽取网络，得到若干关键行为；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为；步骤S420，针对各个关键行为，将其对应N个属性字段的N个属性值输入所述关键属性抽取网络，得到若干关键属性值，形成重构行为；步骤S430，将基于所述若干关键行为对应的若干重构行为而形成的重构行为序列，输入训练好的业务预测模型，得到业务预测结果；步骤S440，基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键属性抽取网络。

对以上步骤的展开介绍如下：

首先，在步骤S410，将原始行为序列输入训练好的关键行为抽取网络，得到若干关键行为。需说明，关键行为抽取网络可以采用图2示出的方法进行多次迭代训练而得到。另外，对原始行为序列的描述可以参见前述实施例中的相关描述，在此不作赘述。

然后，在步骤S420，针对各个关键行为，将其对应N个属性字段的N个属性值输入所述关键属性抽取网络，得到若干关键属性值，形成重构行为。

在一个实施例中，关键属性抽取网络包括概率预测层、离散化层和输出层，基于此，本步骤可以包括：利用所述概率预测层，预测所述N个属性值对应的N个采样概率；利用所述离散化层，确定所述N个采样概率对应的N个离散值；利用所述输出层，输出所述N个离散值中等于预设数值的若干离散值所对应的若干属性值，作为所述若干关键属性值。进一步，在一个具体的实施例中，上述N个离散值的确定可以包括：确定属于预设数据分布的N个随机采样值；将所述N个随机采样值对应叠加至所述N个采样概率，得到N个新概率；利用softmax函数处理所述N个新概率，得到所述N个离散值。

另外需说明，可以将本步骤中对关键属性的抽取类比步骤S220中对关键行为的抽取，参照步骤S220的实施方式实施本步骤，相应，对本步骤的描述可以参见前述对步骤S220的相关描述，在此不作赘述。

由上，针对各个关键行为，可以得到基于抽取的关键属性而组成的重构行为。需理解，对于不同关键行为，抽取的关键属性可能存在不同。

接着，在步骤S430，将基于若干关键行为对应的若干重构行为而形成的重构行为序列，输入训练好的业务预测模型，得到业务预测结果。需理解，此处训练好的业务预测模型，可以复用前述训练关键行为抽取网络时使用的业务预测模型。

之后，在步骤S440，基于得到的业务预测结果和原始行为序列的业务标签，训练关键属性抽取网络。对于该业务标签，在一个实施例中，可以是基于该原始行为序列进行人工打标而得到的标签；在另一个实施例中，将利用业务预测模型处理该原始行为序列而得到的预测结果作为业务标签；在还一个实施例中，将利用业务预测模型处理该关键行为序列而得到的预测结果作为业务标签。

需说明，对步骤S440的介绍，还可以参见对步骤S240的描述。

综上，采用本说明书实施例披露的关键属性抽取网络的训练方法，可以实现将神经网络应用到关键属性采样，从而在确定出关键行为的基础上，利用训练好的关键属性抽取网络自动、精准地确定出关键行为中的关键属性，用以支撑完整序列的业务预测结果，进而有效增强业务结果的可解释性。

以上，分别对关键行为抽取网络的训练，以及基于训练好的关键行为抽取网络，训练关键属性抽取网络的方式进行介绍。根据另一方面的实施例，提出还可以对关键行为抽取网络和关键属性抽取网络进行联合训练。为便于理解，结合图2示出的方法进行说明。

具体，在步骤S240之前，图2示出的方法还可以包括：针对步骤S220中预测出的若干关键行为中的各个关键行为，将其对应N个属性字段的N个属性值输入关键属性抽取网络，得到若干关键属性值，形成对应的重构行为；将基于该若干关键行为对应的若干重构行为而形成的重构行为序列，输入所述业务预测模型，得到业务预测结果；从而在步骤S240中，基于关键行为序列和重构行为序列各自对应的业务预测结果，以及原始行为序列对应的业务标签，训练关键行为抽取网络和关键属性抽取网络。

如此，通过多次迭代训练，可以同时得到训练好的关键行为抽取网络和关键属性抽取网络，用于抽取关键行为和关键属性，从而有效增强业务结果的可解释性。

根据又一方面的实施例，对于训练好的关键行为抽取网络和关键属性抽取网络的使用。在一种使用方式中，响应于用户的当前操作行为，向前回溯T-1个历史操作行为，从而，将基于T个操作行为形成的操作行为序列输入训练好的业务预测模型，得到业务预测结果，并且，将此操作行为序列输入关键行为抽取网络，得到若干关键行为，提供给运营或客服人员，用于对该业务预测结果进行支撑性解释。进一步，还可以将该若干关键行为中的各个关键行为，分别输入关键属性抽取网络，得到对应的若干关键属性。在另一种使用方式，也可以直接将当前操作行为输入关键属性抽取网络中，得到对应的关键属性，提供给工作人员进行重点分析。

与上述训练方法相对应的，本说明书实施例还披露训练装置。图5示出本说明书实施例披露的关键行为抽取网络的训练装置结构示意图，所述装置可以实现为任何具有计算、处理能力的服务器或设备集群等。如图5所示，所述装置500包括：

关键行为抽取单元510，配置为将原始行为序列输入关键行为抽取网络，得到若干关键行为，形成关键行为序列；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为。第一预测单元520，将所述关键行为序列输入预先训练好的业务预测模型，得到业务预测结果；训练单元530，配置为基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络。

在一个实施例中，所述关键行为抽取网络包括概率预测层、离散化层和输出层；所述关键行为抽取单元510具体配置为：利用所述概率预测层，预测所述T个操作行为对应的T个采样概率；利用所述离散化层，确定所述T个采样概率对应的T个离散值；利用所述输出层，输出所述T个离散值中等于预设数值的若干离散值所对应的若干操作行为，作为所述若干关键行为。

在一个具体的实施例中，关键行为抽取单元510进一步配置为：确定属于预设数据分布的T个随机采样值；将所述T个随机采样值对应叠加至所述T个采样概率，得到T个新概率；利用softmax函数处理所述T个新概率，得到所述T个离散值。

在一个实施例中，所述业务预测模型基于以下步骤预先训练：获取多个训练样本，其中各个训练样本包括对应的历史行为序列和业务标签，该历史行为序列包括对应用户做出的按时间顺序排列的T个历史操作行为；利用所述多个训练样本，训练所述业务预测模型。

在一个实施例中，所述装置500还包括：业务标签确定单元540，配置为将所述原始行为序列输入所述业务预测模型，从而将输出的业务预测结果作为所述业务标签。

在一个实施例中，所述装置还包括：关键属性抽取单元550，配置为针对所述若干关键行为中的各个关键行为，将其对应N个属性字段的N个属性值输入关键属性抽取网络，得到若干关键属性值，形成对应的重构行为；第二预测单元560，配置为将基于所述若干关键行为对应的若干重构行为而形成的重构行为序列，输入所述业务预测模型，得到业务预测结果；所述训练单元530配置为：基于所述关键行为序列和重构行为序列各自对应的业务预测结果，以及所述业务标签，训练所述关键行为抽取网络和关键属性抽取网络。

综上，采用本说明书实施例披露的关键行为抽取网络的训练装置，可以实现将神经网络应用到关键行为采样，从而利用训练好的关键行为抽取网络自动、精准地确定出支撑完整行为序列的业务预测结果的关键行为，进而有效增强业务结果的可解释性。

图6示出本说明书实施例披露的关键属性抽取网络的训练装置结构示意图，所述装置可以实现为任何具有计算、处理能力的服务器或设备集群等。如图6所示，所述装置600包括：

关键行为抽取单元610，配置为将原始行为序列输入采用图5示出的装置训练出的关键行为抽取网络，得到若干关键行为；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为。关键属性抽取单元620，配置为针对各个关键行为，将其对应N个属性字段的N个属性值输入所述关键属性抽取网络，得到若干关键属性值，形成重构行为；业务结果预测单元630，配置为将基于所述若干关键行为对应的若干重构行为而形成的重构行为序列，输入训练好的业务预测模型，得到业务预测结果；训练单元640，配置为基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键属性抽取网络。

在一个实施例中，所述关键属性抽取网络包括概率预测层、离散化层和输出层；其中，关键属性抽取单元620配置为：利用所述概率预测层，预测所述N个属性值对应的N个采样概率；利用所述离散化层，确定所述N个采样概率对应的N个离散值；利用所述输出层，输出所述N个离散值中等于预设数值的若干离散值所对应的若干属性值，作为所述若干关键属性值。

在一个具体的实施例中，关键属性抽取单元620进一步配置为：确定属于预设数据分布的N个随机采样值；将所述N个随机采样值对应叠加至所述N个采样概率，得到N个新概率；利用softmax函数处理所述N个新概率，得到所述N个离散值。

在一个实施例中，业务标签确定单元650配置为：将基于所述若干关键行为形成的关键行为序列输入所述业务预测模型，从而将输出的业务预测结果作为所述业务标签。

综上，采用本说明书实施例披露的关键属性抽取网络的训练装置，可以实现将神经网络应用到关键属性采样，从而在确定出关键行为的基础上，利用训练好的关键属性抽取网络自动、精准地确定出关键行为中的关键属性，用以支撑完整序列的业务预测结果，进而有效增强业务结果的可解释性。

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图2或图4所描述的方法。

根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图2或图4所描述的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种关键行为抽取网络的训练方法，包括：

将原始行为序列输入关键行为抽取网络，得到若干关键行为，形成关键行为序列；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为；

将所述关键行为序列输入预先训练好的业务预测模型，得到业务预测结果；

基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络。

2.根据权利要求1所述的方法，其中，所述关键行为抽取网络包括概率预测层、离散化层和输出层；其中，将原始行为序列输入关键行为抽取网络，得到若干关键行为，包括：

利用所述概率预测层，预测所述T个操作行为对应的T个采样概率；

利用所述离散化层，确定所述T个采样概率对应的T个离散值；

利用所述输出层，输出所述T个离散值中等于预设数值的若干离散值所对应的若干操作行为，作为所述若干关键行为。

3.根据权利要求2所述的方法，其中，利用所述离散化层，确定所述T个采样概率对应的T个离散值，包括：

确定属于预设数据分布的T个随机采样值；

将所述T个随机采样值对应叠加至所述T个采样概率，得到T个新概率；

利用softmax函数处理所述T个新概率，得到所述T个离散值。

4.根据权利要求1所述的方法，其中，所述业务预测模型基于以下步骤预先训练：

获取多个训练样本，其中各个训练样本包括对应的历史行为序列和业务标签，所述历史行为序列包括对应用户做出的按时间顺序排列的T个历史操作行为；

利用所述多个训练样本，训练所述业务预测模型。

5.根据权利要求1所述的方法，其中，在基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络之前，所述方法还包括：

将所述原始行为序列输入所述业务预测模型，从而将输出的业务预测结果作为所述业务标签。

6.根据权利要求1所述的方法，其中，在基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络之前，所述方法还包括：

针对所述若干关键行为中的各个关键行为，将其对应N个属性字段的N个属性值输入关键属性抽取网络，得到若干关键属性值，形成对应的重构行为；

将基于所述若干关键行为对应的若干重构行为而形成的重构行为序列，输入所述业务预测模型，得到业务预测结果；

其中，基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络，包括：

基于所述关键行为序列和重构行为序列各自对应的业务预测结果，以及所述业务标签，训练所述关键行为抽取网络和关键属性抽取网络。

7.一种关键属性抽取网络的训练方法，包括：

将原始行为序列输入采用权利要求1所述的方法训练出的关键行为抽取网络，得到若干关键行为；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为；

针对各个关键行为，将其对应N个属性字段的N个属性值输入所述关键属性抽取网络，得到若干关键属性值，形成重构行为；

将基于所述若干关键行为对应的若干重构行为而形成的重构行为序列，输入训练好的业务预测模型，得到业务预测结果；

基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键属性抽取网络。

8.根据权利要求7所述的方法，其中，所述关键属性抽取网络包括概率预测层、离散化层和输出层；其中，得到若干关键属性值，包括：

利用所述概率预测层，预测所述N个属性值对应的N个采样概率；

利用所述离散化层，确定所述N个采样概率对应的N个离散值；

利用所述输出层，输出所述N个离散值中等于预设数值的若干离散值所对应的若干属性值，作为所述若干关键属性值。

9.根据权利要求8所述的方法，其中，利用所述离散化层，确定所述N个采样概率对应的N个离散值，包括：

确定属于预设数据分布的N个随机采样值；

将所述N个随机采样值对应叠加至所述N个采样概率，得到N个新概率；

利用softmax函数处理所述N个新概率，得到所述N个离散值。

10.根据权利要求7所述的方法，其中，基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键属性抽取网络之前，所述方法还包括：

将基于所述若干关键行为形成的关键行为序列输入所述业务预测模型，从而将输出的业务预测结果作为所述业务标签。

11.一种关键行为抽取网络的训练装置，包括：

关键行为抽取单元，配置为将原始行为序列输入关键行为抽取网络，得到若干关键行为，形成关键行为序列；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为；

业务结果预测单元，配置为将所述关键行为序列输入预先训练好的业务预测模型，得到业务预测结果；

训练单元，配置为基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键行为抽取网络。

12.一种关键属性抽取网络的训练装置，包括：

关键行为抽取单元，配置为将原始行为序列输入采用权利要求11所述的装置训练出的关键行为抽取网络，得到若干关键行为；所述原始行为序列包括目标用户做出的按时间顺序排列的T个操作行为；

关键属性抽取单元，配置为针对各个关键行为，将其对应N个属性字段的N个属性值输入所述关键属性抽取网络，得到若干关键属性值，形成重构行为；

业务结果预测单元，配置为将基于所述若干关键行为对应的若干重构行为而形成的重构行为序列，输入训练好的业务预测模型，得到业务预测结果；

训练单元，配置为基于该业务预测结果和所述原始行为序列的业务标签，训练所述关键属性抽取网络。

13.一种计算机可读存储介质，其上存储有计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-10中任一项所述的方法。

14.一种计算设备，包括存储器和处理器，其中，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-10中任一项所述的方法。