CN117350351A

CN117350351A - 用户响应预测系统的训练方法、用户响应预测方法及装置

Info

Publication number: CN117350351A
Application number: CN202311645094.3A
Authority: CN
Inventors: 张雷; 何建杉; 褚崴
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2023-12-04
Filing date: 2023-12-04
Publication date: 2024-01-05
Anticipated expiration: 2043-12-04
Also published as: CN117350351B

Abstract

本说明书实施例中提供了一种包括用户响应预测系统的训练方法，系统包括行为预测模型、干预表征模型、特征映射模型和倾向预测模型。方法包括获取样本，样本中包括用户特征，对用户施加的第一干预和施加第一干预后用户做出的第一响应；将用户特征输入已训练的行为预测模型，得到第二响应；将第一干预输入干预表征模型，得到干预表征；将用户特征分别输入特征映射模型和倾向预测模型，得到映射特征和倾向性特征；基于干预表征、映射特征和倾向性特征，对第二响应进行修正，得到第三响应；基于根据第一响应和第三响应的差异而确定的第一损失和根据倾向性特征和第一干预表征的差异而确定的第二损失，训练干预表征模型、特征映射模型和倾向预测模型。

Description

用户响应预测系统的训练方法、用户响应预测方法及装置

技术领域

本说明书实施例属于人工智能（artificial intelligence,AI）技术领域，尤其涉及一种用户响应预测系统的训练方法、用户响应预测方法及装置。

背景技术

在许多领域，都需要研究干预(treatment)对用户响应(outcome)的影响(impact)。例如，在营销领域，需要分析优惠券等权益的发放，对用户使用平台服务意愿的影响，从而辅助决策是否进行权益发放；又例如，在医疗领域，需要分析某些治疗手段对病人健康状态的影响，从而辅助进行治疗手段的选取。

随着机器学习技术的兴起，通过构建机器学习模型对上述outcome进行分析预测已是大势所趋。然而，目前构建出的预测模型的性能有限，难以满足实际应用中在多重干预（multiple treatment）下对outcome的预测。因此，需要一种方案，可以实现在multipletreatment下对outcome的预测。

发明内容

本说明书实施例旨在提供一种用户响应预测系统的训练方法、用户响应预测方法、装置、计算机可读存储介质及计算设备，可以实现在multiple treatment下对outcome的预测。

为实现上述目的，本说明书第一方面提供一种用户响应预测系统的训练方法，包括：获取样本数据，其中第一样本的样本数据包括，第一用户的用户特征，对所述第一用户施加的第一干预，以及施加所述第一干预后所述第一用户做出的第一响应；其中，所述第一干预是预设的N种干预之一，N>=2；将所述用户特征输入已训练好的行为预测模型，得到预测的第二响应；将所述第一干预输入干预表征模型，得到第一干预表征；所述干预表征模型用于对所述N种干预进行表征；将所述用户特征分别输入特征映射模型和倾向预测模型，得到映射特征和倾向性特征，所述倾向性特征表示所述用户特征与第一干预之间的关联倾向表征；基于所述第一干预表征，所述映射特征和所述倾向性特征，对所述第二响应进行修正，得到第三响应；基于预测损失训练所述干预表征模型，所述特征映射模型和所述倾向预测模型；其中所述预测损失包括第一损失和第二损失，所述第一损失根据所述第一响应和所述第三响应的差异而确定，所述第二损失根据所述倾向性特征和所述第一干预表征的差异而确定，其中，训练好的所述行为预测模型、训练好的所述特征映射模型、训练好的所述倾向预测模型和训练好的所述干预表征模型构成所述用户响应预测系统。

本说明书第二方面提供一种用户响应预测方法，包括：获取目标样本，所述目标样本中包括：用户的用户特征和有待对所述用户施加的N个备选干预，N>=2；将所述目标样本输入采用第一方面所述的方法训练得到的用户响应预测系统，以得到施加各个所述备选干预后所述用户的响应；其中，在所述用户响应预测系统中，利用所述行为预测模型、所述特征映射模型和所述干预预测模型处理所述用户特征，分别得到第五响应、第一映射特征和第一倾向性特征，并利用所述干预表征模型处理所述N个备选干预，得到N个第二干预表征，以及，基于所述第五响应、所述第一映射特征、所述第一倾向性特征和各个所述第二干预表征，得到施加各个所述备选干预后所述用户的响应。

本说明书第三方面提供一种用户响应预测方法，包括：获取目标样本，所述目标样本中包括：用户的用户特征和有待对所述用户施加的N个备选干预，N>=2；将所述目标样本输入采用第一方面所述的方法训练得到的用户响应预测系统，以得到施加各个所述备选干预所带来的增量；其中，在所述用户响应预测系统中，利用所述特征映射模型和所述干预预测模型处理所述用户特征，分别得到第一映射特征和第一倾向性特征，并利用所述干预表征模型处理所述N个备选干预，得到N个第二干预表征，以及，基于所述第一映射特征、所述第一倾向性特征和各个所述第二干预表征，得到施加各个所述备选干预所带来的增量。

本说明书第四方面提供一种用户响应预测系统的训练装置，包括：获取模块，用于获取样本数据，其中第一样本的样本数据包括，第一用户的用户特征，对所述第一用户施加的第一干预，以及施加所述第一干预后所述第一用户做出的第一响应；其中，所述第一干预是预设的N种干预之一，N>=2；处理模块，用于将所述用户特征输入已训练好的行为预测模型，得到预测的第二响应；所述处理模块，还用于将所述第一干预输入干预表征模型，得到第一干预表征；所述干预表征模型用于对所述N种干预进行表征；所述处理模块，还用于将所述用户特征分别输入特征映射模型和倾向预测模型，得到映射特征和倾向性特征，所述倾向性特征表示所述用户特征与第一干预之间的关联倾向表征；所述处理模块，还用于基于所述第一干预表征，所述映射特征和所述倾向性特征，对所述第二响应进行修正，得到第三响应；所述处理模块，还用于基于预测损失训练所述干预表征模型，所述特征映射模型和所述倾向预测模型；其中所述预测损失包括第一损失和第二损失，所述第一损失根据所述第一响应和所述第三响应的差异而确定，所述第二损失根据所述倾向性特征和所述第一干预表征的差异而确定，其中，训练好的所述行为预测模型、训练好的所述特征映射模型、训练好的所述倾向预测模型和训练好的所述干预表征模型构成所述用户响应预测系统。

本说明书第五方面提供一种用户响应预测装置，包括：获取模块，用于获取目标样本，所述目标样本中包括：用户的用户特征和有待对所述用户施加的N个备选干预，N>=2；处理模块，用于将所述目标样本输入采用第一方面所述的方法训练得到的用户响应预测系统，以得到施加各个所述备选干预后所述用户的响应；其中，在所述用户响应预测系统中，利用所述行为预测模型、所述特征映射模型和所述干预预测模型处理所述用户特征，分别得到第五响应、第一映射特征和第一倾向性特征，并利用所述干预表征模型处理所述N个备选干预，得到N个第二干预表征，以及，基于所述第五响应、所述第一映射特征、所述第一倾向性特征和各个所述第二干预表征，得到施加各个所述备选干预后所述用户的响应。

本说明书第六方面提供一种用户响应预测装置，包括：获取模块，用于获取目标样本，所述目标样本中包括：用户的用户特征和有待对所述用户施加的N个备选干预，N>=2；处理模块，用于将所述目标样本输入采用第一方面所述的方法训练得到的用户响应预测系统，以得到施加各个所述备选干预所带来的增量；其中，在所述用户响应预测系统中，利用所述特征映射模型和所述干预预测模型处理所述用户特征，分别得到第一映射特征和第一倾向性特征，并利用所述干预表征模型处理所述N个备选干预，得到N个第二干预表征，以及，基于所述第一映射特征、所述第一倾向性特征和各个所述第二干预表征，得到施加各个所述备选干预所带来的增量。

本说明书第七方面提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算设备中执行时，计算设备执行上述第一方面、第二方面或第三方面所述的方法。

本说明书第八方面提供一种计算设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时，实现上述第一方面、第二方面或第三方面所述的方法。

通过本说明书一个或多个实施例中提供的方法及装置，可以实现对任意treatment的表征，从而使得训练得到的用户响应预测系统可以有效支持多类权益发放业务中的Multiple Treatment，降低了建模难度和成本。

附图说明

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本说明书一实施例中一种用户响应预测系统的结构示意图；

图2是本说明书一实施例中一种用户响应预测系统的训练方法的流程示意图；

图3是本说明书一实施例中一种用户响应预测方法的流程示意图；

图4是本说明书一实施例中另一种用户响应预测方法的流程示意图；

图5是本说明书一实施例中一种用户响应预测系统的训练装置的结构示意图；

图6是本说明书一实施例中一种用户响应预测装置的结构示意图；

图7是本说明书一实施例中另一种用户响应预测装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

一般的，在对outcome进行预测时，常通过机器学习模型对outcome进行建模。而在建模过程中常采用Propensity Score Model，S-Learner或R-Learner等算法。但这些算法只能对一种treatment进行建模，且建模得到的机器学习模型只能处理施加特定的treatment的场景。对于multiple treatment，只能将其拆解为多个treatment来分别进行建模。当treatment过多或十分复杂时，这种建模方式需要建立多个机器学习模型，建模过程复杂且成本高；同时，也不切合实际。

鉴于此，本申请实施例提供了一种用户响应预测系统，其可以实现对任意treatment的表征，从而使得该系统可以有效支持多类权益发放业务中的MultipleTreatment，降低了建模难度和成本。

示例性的，图1示出了本申请实施例提供的一种用户响应预测系统的结构示意图。如图1所示，该用户响应预测系统100可以包括：行为预测模型110、特征映射模型120、倾向预测模型130和干预表征模型140。行为预测模型110、特征映射模型120和倾向预测模型130的输入数据均为用户的用户特征。行为预测模型110的输出数据为预测的用户的响应；特征映射模型120的输出数据为映射特征；倾向预测模型130的输出数据为倾向性特征。其中，倾向性特征可以表示用户特征与干预之间的关联倾向表征。通过倾向性特征可以体现出用户特征和施加的干预之间的关联性，从而在后续可以消除两者之间的关联性，进而使得预测得到响应是由施加干预后所带来的。干预表征模型140的输入数据为treatment，输出数据为对施加的treatment进行表征得到的干预表征。本实施例中，干预表征模型140可以对N种（N＞=2）施加的treatment进行表征。

本实施例中，行为预测模型110可以包括：深度交叉神经网络（deep crossnetwork，DCN）111和多层感知机（multilayer perceptron，MLP）112。DCN111可以用于对用户特征进行交叉运算。MLP112可以用来对DCN111输出的结果进行维度变换，以预测出用户的响应。在一些实施例中，DCN111也可以替换为MLP或者深度神经网络（deep neuralnetwork，DNN）等。

特征映射模型120可以包括DCN121和MLP122。DCN121可以用于对用户特征进行交叉运算。MLP122可以用来对DCN121输出的结果进行维度变换，以得到映射特征。在一些实施例中，DCN111也可以替换为MLP或者DNN等。

倾向预测模型130可以包括DCN131和MLP132。DCN131可以用于对用户特征进行交叉运算。MLP132可以用来对DCN131输出的结果进行维度变换，以得到倾向性特征。在一些实施例中，DCN111也可以替换为MLP或者DNN等。

干预表征模型140可以包括：图神经网络（graph neural networks，GNN）141。GNN141可以用来对施加的任意的treatment进行表征，以得到treatment的干预表征。在一些实施例中，GNN141也可以替换为独热（one-hot）函数等。

在图1所示的用户响应预测系统100中，在获取到行为预测模型110的输出m(x)、特征映射模型120的输出g(x)、倾向预测模型130的输出e(x)和干预表征模型140的输出h(T)，可以通过响应计算公式计算出施加干预T后与用户特征X相关的用户的响应。其中，响应计算公式为：Y=m(x)+g(x)*(h(T)-e(x))。

以上即是对本申请实施例提供的用户响应预测系统100的介绍。接下来，对该用户响应预测系统100的训练过程进行介绍。

示例性的，图2示出了本申请实施例提供的一种用户响应预测系统的训练方法的流程示意图。可以理解，该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图2所示，该用户响应预测系统的训练方法可以包括以下步骤：

S201、获取样本数据，其中第一样本的样本数据包括，第一用户的用户特征，对第一用户施加的第一干预，以及施加第一干预后第一用户做出的第一响应；其中，第一干预是预设的N种干预之一，N>=2。

本实施例中，训练所需的样本可以至少为一个。样本的样本数据可以是预先构建的。样本的样本数据中可以包括用户的用户特征，对用户施加的干预，以及施加干预后用户做出的响应。样本数据中包含的干预是预设的N种干预之一，N>=2。其中，用户特征可以包括：画像特征和网络操作行为特征等。示例性的，画像特征可以包括消费人群（如高消费人群或低消费人群）、兴趣圈（如电子产品或地方美食）等；网络操作行为特征可以包括操作频次、操作时段、网络环境（如IP地址等）、操作终端的MAC地址等。干预可以是发放的权益（比如红包、礼包、优惠券、兑换码、支付券或者积分等），即干预是与权益相关的。施加干预后用户做出的响应，可以为用户使用与干预相关的权益的概率（如点击红包的概率或者使用支付券支付的概率等）。应理解的是，本实施例中，样本数据中包含的干预是需要对用户施加的干预。

在获取到样本数据后，就可以基于样本数据，训练用户响应预测系统100。为便于描述，下面将以基于第一样本，训练用户响应预测系统100为例进行介绍。其中，第一样本的样本数据包括：第一用户的用户特征，对第一用户施加的第一干预，以及施加第一干预后第一用户做出的第一响应。

S202、将用户特征输入已训练好的行为预测模型，得到预测的第二响应。

本实施例中，可以将第一用户的用户特征输入至已训练好的行为预测模型110，以通过该行为预测模型110对用户特征进行处理，得到预测的第二响应。示例性的，该第二响应可以理解为是在不考虑干预的情况下用户做出的响应。其中，在训练行为预测模型110时，可以以第一用户的用户特征为样本，施加第一干预后第一用户做出的第一响应为标签，对行为预测模型110进行训练。具体地，可以先将第一用户的用户特征输入至待训练的行为预测模型110，得到第四响应。然后，在根据第四响应和第一响应之间的差异，确定出第三损失。例如，可以通过交叉熵(cross-entropy)损失函数，对第四响应和第一响应进行处理，以确定出第三损失。最后，在基于第三损失，比如，以最小化第三损失为目标等，训练行为预测模型110。

S203、将第一干预输入干预表征模型，得到第一干预表征，该干预表征模型用于对N种干预进行表征。

本实施例中，可以将对第一用户施加的第一干预输入至干预表征模型140，以通过干预表征模型140对第一干预进行表征，得到第一干预表征。

S204、将用户特征分别输入特征映射模型和倾向预测模型，得到映射特征和倾向性特征，倾向性特征表示用户特征与第一干预之间的关联倾向表征。

本实施例中，可以将第一用户的用户特征分别输入特征映射模型120和倾向预测模型130，以通过特征映射模型120对用户特征进行处理，得到映射特征，以及，通过倾向预测模型130对应用户特征进行处理，得到倾向性特征。该倾向性特征可以用来表示第一用户的用户特征和对第一用户施加的第一干预之间的关联倾向表征。

S205、基于第一干预表征，映射特征和倾向性特征，对第二响应进行修正，得到第三响应。

本实施例中，在获取到第一干预表征、映射特征和倾向性特征后，可以基于第一干预表征、映射特征和倾向性特征，对行为预测模型110预测得到的第二响应进行修正，以得到第三响应。其中，修正的过程可以为：先通过第一干预表征减去倾向性特征，得到第一特征；再通过映射特征和第一特征做点积，得到第一增量；最后，在通过第一增量，对第二响应进行修正，得到第三响应。示例性的，修正的过程可以理解为是前述的响应计算公式Y=m(x)+g(x)*(h(T)-e(x))的处理过程。在该公式中，h(T)为第一干预表征，e(x)为倾向性特征，g(x)为映射特征，m(x)为第二响应。

S206、基于预测损失训练干预表征模型，特征映射模型和倾向预测模型；其中预测损失包括第一损失和第二损失，第一损失根据第一响应和第三响应的差异而确定，第二损失根据倾向性特征和第一干预表征的差异而确定。

本实施例中，可以先通过第一响应和第三响应之间的差异来确定第一损失，以及，通过倾向性特征和第一干预表征之间的差异来确定第二损失。例如，可以通过交叉熵(cross-entropy)损失函数，对第一响应和第三响应进行处理，以得到第一损失；以及，通过均方误差（mean square error，MSE）损失函数，对倾向性特征和第一干预表征进行处理，以得到第二损失。

在得到第一损失和第二损失之后，可以基于第一损失和第二损失，训练干预表征模型140、特征映射模型120和倾向预测模型130。例如，可以以最小化第一损失和第二损失为目标，来训练干预表征模型140、特征映射模型120和倾向预测模型130。

在完成对行为预测模型110、特征映射模型120、倾向预测模型130和干预表征模型140的训练后，就完成了对用户响应预测系统100的训练。应理解的是，上述图2中是以第一样本为例来介绍用户响应预测系统100的训练过程，在使用其他样本，训练用户响应预测系统100的过程，均可以参见以第一样本为例来介绍用户响应预测系统100的训练过程，此处就不再一一赘述。

在完成对用户响应预测系统100的训练后，就可以使用该用户响应预测系统100，来预测施加干预后用户做出的响应。由于用户响应预测系统100中的干预表征模型140可以实现对任意的treatment的表征，这就使得用户响应预测系统100可以实现对任意treatment的表征，从而使得通过一次训练，就可以获得能够支持多类权益发放业务中的Multiple Treatment的用户响应预测系统，降低了建模难度和成本。

下面对使用用户响应预测系统100进行预测的过程进行介绍。

示例性的，图3示出了本申请实施例提供的一种用户响应预测方法的流程示意图。可以理解，该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图3所示，该用户响应预测方法可以包括以下步骤：

S301、获取目标样本，目标样本中包括：用户的用户特征和有待对用户施加的N个备选干预，N>=2。

本实施例中，目标样本可以是预先构建的，也可以是实时构建的。其中，目标样本中包括：用户的用户特征和有待对用户施加的N个备选干预，N>=2。

S302、将目标样本输入训练好的用户响应预测系统，以得到施加各个备选干预后用户的响应。

本实施例中，获取到目标样本后，可以将目标样本输入至通过前述图2所示的方法训练好的用户响应预测系统100，以通过用户响应预测系统100对目标样本进行处理，从而得到施加各个备选干预后用户的响应。

其中，在用户响应预测系统100中，可以利用行为预测模型110对目标样本中的用户特征进行处理，得到第五响应，以及，分别利用特征映射模型120和干预预测模型130分别对目标样本中的用户特征进行处理，得到第一映射特征和第一倾向性特征。同时，可以利用干预表征模型140对N个备选干预中的每个干预均进行表征化处理，以得到N个第二干预表征。其中，一个第二干预表征与一个备选干预相关联。最后，在通过前述的响应计算公式，对第五响应、第一映射特征、第一倾向性特征和各个第二干预表征进行处理，就可以得到施加各个备选干预后用户的响应。示例性的，对于得到施加N个备选干预中的任意一个干预后用户的响应，可以先通过对该任意一个干预进行表征处理得到的第二干预表征减去第一倾向性特征，得到第二特征。然后，在通过第一映射特征与第二特征做点积，得到第二增量。最后，在通过第二增量，对第五响应进行修正，得到施加该任意一个干预后用户的响应。

这样，通过一次训练得到的用户响应预测系统，就完成对施加多种不同的备选干预中每个干预后用户的响应的预测，提升了预测效率。

示例性的，图4示出了本申请实施例提供的另一种用户响应预测方法的流程示意图。可以理解，该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。其中，图4中的S401与图3中的S301相同，此处就不再赘述。如图4所示，该用户响应预测方法可以包括以下步骤：

S401、获取目标样本，目标样本中包括：用户的用户特征和有待对用户施加的N个备选干预，N>=2。

S402、将目标样本输入训练好的用户响应预测系统，以得到施加各个备选干预所带来的增量。

本实施例中，获取到目标样本后，可以将目标样本输入至通过前述图2所示的方法训练好的用户响应预测系统100，以通过用户响应预测系统100对目标样本进行处理，从而得到施加各个备选干预所带来的增量。

其中，在用户响应预测系统100中，可以分别利用特征映射模型120和干预预测模型130分别对目标样本中的用户特征进行处理，得到第一映射特征和第一倾向性特征。同时，可以利用干预表征模型140对N个备选干预中的每个干预均进行表征化处理，以得到N个第二干预表征。其中，一个第二干预表征与一个备选干预相关联。最后，在基于第一映射特征、第一倾向性特征和各个第二干预表征，得到施加各个备选干预所带来的增量。示例性的，对于得到施加N个备选干预中的任意一个干预所带来的增量，可以先通过对该任意一个干预进行表征处理得到的第二干预表征减去第一倾向性特征，得到第二特征。然后，在通过第一映射特征与第二特征做点积，得到施加该任意一个干预所带来的增量。

这样，在得到施加各个备选干预所带来的增量后，就可以基于增量的大小，选择出所需施加的干预。

与前述图2中的方法实施例基于相同的构思，本说明书实施例中还提供了一种用户响应预测系统的训练装置。

示例性的，图5为本说明书实施例中提供的一种用户响应预测系统的训练装置的结构示意图。如图5所示，该用户响应预测系统的训练装置500可以包括：获取模块501和处理模块502。其中，获取模块501，用于获取样本数据，其中第一样本的样本数据包括，第一用户的用户特征，对第一用户施加的第一干预，以及施加第一干预后第一用户做出的第一响应；其中，第一干预是预设的N种干预之一，N>=2。处理模块502，用于将用户特征输入已训练好的行为预测模型，得到预测的第二响应。处理模块502，还用于将第一干预输入干预表征模型，得到第一干预表征；干预表征模型用于对N种干预进行表征。处理模块502，还用于将用户特征分别输入特征映射模型和倾向预测模型，得到映射特征和倾向性特征，倾向性特征表示用户特征与第一干预之间的关联倾向表征。处理模块502，还用于基于第一干预表征，映射特征和倾向性特征，对第二响应进行修正，得到第三响应。处理模块502，还用于基于预测损失训练干预表征模型，特征映射模型和倾向预测模型；其中预测损失包括第一损失和第二损失，第一损失根据第一响应和第三响应的差异而确定，第二损失根据倾向性特征和第一干预表征的差异而确定，其中，训练好的行为预测模型、训练好的特征映射模型、训练好的倾向预测模型和训练好的干预表征模型构成用户响应预测系统。

在一些实施例中，处理模块502在将用户特征输入已训练好的行为预测模型，得到预测的第二响应之前，还用于：将用户特征输入至行为预测模型，得到第四响应；基于第三损失，训练行为预测模型，第三损失根据第一响应和第四响应的差异而确定。

在一些实施例中，处理模块502在基于第一干预表征，映射特征和倾向性特征，对第二响应进行修正，得到第三响应时，具体用于：通过第一干预表征减去倾向性特征，得到第一特征；通过映射特征与第一特征点积，得到第一增量；通过第一增量，对第二响应进行修正，得到第三响应。

在一些实施例中，行为预测模型包括：第一深度交叉神经网络DCN和第一多层感知机MLP，其中，第一DCN用于对用户特征进行交叉运算，第一MLP用于对第一DCN输出的结果进行维度变换。

在一些实施例中，特征映射模型包括：第二深度交叉神经网络DCN和第二多层感知机MLP，其中，第二DCN用于对用户特征进行交叉运算，第二MLP用于对第二DCN输出的结果进行维度变换。倾向预测模型包括：第三DCN和第三MLP，其中，第三DCN用于对用户特征进行交叉运算，第三MLP用于对第三DCN输出的结果进行维度变换。

在一些实施例中，干预表征模型为图神经网络GNN或者one-hot函数。

在一些实施例中，与第一干预相关的权益为以下一项或多项：红包、礼包、优惠券、兑换码、支付券或者积分。第一响应为用户使用与第一干预相关的权益的概率。

应当理解的是，上述装置用于执行上述图2示出的实施例中的方法，装置中相应的程序模块，其实现原理和技术效果与上述方法中的描述类似，该装置的工作过程可参考上述方法中的对应过程，此处不再赘述。

与前述图3中的方法实施例基于相同的构思，本说明书实施例中还提供了一种用户响应预测装置。

示例性的，图6为本说明书实施例中提供的一种用户响应预测装置的结构示意图。如图6所示，该用户响应预测装置可以包括：获取模块601和处理模块602。其中，获取模块601，用于获取目标样本，目标样本中包括：用户的用户特征和有待对用户施加的N个备选干预，N>=2。处理模块602，用于将目标样本输入采用图3描述的方法训练得到的用户响应预测系统，以得到施加各个备选干预后用户的响应。其中，在用户响应预测系统中，利用行为预测模型、特征映射模型和干预预测模型处理用户特征，分别得到第五响应、第一映射特征和第一倾向性特征，并利用干预表征模型处理N个备选干预，得到N个第二干预表征，以及，基于第五响应、第一映射特征、第一倾向性特征和各个第二干预表征，得到施加各个备选干预后用户的响应。

在一些实施例中，处理模块602在基于第五响应、第一映射特征、第一倾向性特征和各个第二干预表征，得到施加各个备选干预后用户的响应时，具体用于：对于得到施加第一干预后用户的响应，通过第二干预表征减去第一倾向性特征，得到第二特征，第一干预为N个备选干预中的任意一个；通过第一映射特征与第二特征点积，得到第二增益；通过第二增益，对第五响应进行修正，得到施加第一干预后用户的响应。

应当理解的是，上述装置用于执行上述图3示出的实施例中的方法，装置中相应的程序模块，其实现原理和技术效果与上述方法中的描述类似，该装置的工作过程可参考上述方法中的对应过程，此处不再赘述。

与前述图4中的方法实施例基于相同的构思，本说明书实施例中还提供了一种用户响应预测装置。

示例性的，图7为本说明书实施例中提供的一种用户响应预测装置的结构示意图。如图7所示，该用户响应预测装置可以包括：获取模块701和处理模块702。获取模块701，用于获取目标样本，目标样本中包括：用户的用户特征和有待对用户施加的N个备选干预，N>=2。处理模块702，用于将目标样本输入采用图4描述的方法训练得到的用户响应预测系统，以得到施加各个备选干预所带来的增量。其中，在用户响应预测系统中，利用特征映射模型和干预预测模型处理用户特征，分别得到第一映射特征和第一倾向性特征，并利用干预表征模型处理N个备选干预，得到N个第二干预表征，以及，基于第一映射特征、第一倾向性特征和各个第二干预表征，得到施加各个备选干预所带来的增量。

在一些实施例中，处理模块702在基于第一映射特征、第二倾向性特征和各个第二干预表征，得到施加各个备选干预所带来的增量时，具体用于：对于得到施加第一干预所带来的增益，通过第二干预表征减去第一倾向性特征，得到第二特征，第一干预为N个备选干预中的任意一个；通过第一映射特征与第二特征点积，得到施加第一干预所带来的增量。

应当理解的是，上述装置用于执行上述图4示出的实施例中的方法，装置中相应的程序模块，其实现原理和技术效果与上述方法中的描述类似，该装置的工作过程可参考上述方法中的对应过程，此处不再赘述。

基于上述实施例中的方法，本申请还提供了一种计算机可读存储介质。该计算机可读存储介质上存储有计算机程序，当所述计算机程序在计算设备中执行时，计算设备执行上述实施例中的方法。

基于上述实施例中的方法，本申请还提供了一种计算设备。该计算设备可以包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时，实现上述实施例中的方法。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进（例如，对二极管、晶体管、开关等电路结构的改进）还是软件上的改进（对于方法流程的改进）。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件（Programmable Logic Device, PLD）（例如现场可编程门阵列（Field Programmable GateArray，FPGA））就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器（logic compiler）”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言（Hardware Description Language，HDL），而HDL也并非仅有一种，而是有许多种，如ABEL（Advanced Boolean Expression Language）、AHDL（Altera Hardware DescriptionLanguage）、Confluence、CUPL（Cornell University Programming Language）、HDCal、JHDL（Java Hardware Description Language）、Lava、Lola、MyHDL、PALASM、RHDL（RubyHardware Description Language）等，目前最普遍使用的是VHDL（Very-High-SpeedIntegrated Circuit Hardware Description Language）与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该（微）处理器执行的计算机可读程序代码（例如软件或固件）的计算机可读介质、逻辑门、开关、专用集成电路（Application Specific Integrated Circuit，ASIC）、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为服务器系统。当然，本申请不排除随着未来计算机技术的发展，实现上述实施例功能的计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

虽然本说明书一个或多个实施例提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或终端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行（例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境）。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。例如若使用到第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书一个或多个时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

本发明是参照根据本发明实施例的方法、装置（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储、石墨烯存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员应明白，本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本本说明书一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本说明书一个或多个实施例的实施例而已，并不用于限制本本说明书一个或多个实施例。对于本领域技术人员来说，本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在权利要求范围之内。

Claims

1.一种用户响应预测系统的训练方法，包括：

获取样本数据，其中第一样本的样本数据包括，第一用户的用户特征，对所述第一用户施加的第一干预，以及施加所述第一干预后所述第一用户做出的第一响应；其中，所述第一干预是预设的N种干预之一，N>=2；

将所述用户特征输入已训练好的行为预测模型，得到预测的第二响应；

将所述第一干预输入干预表征模型，得到第一干预表征；所述干预表征模型用于对所述N种干预进行表征；

将所述用户特征分别输入特征映射模型和倾向预测模型，得到映射特征和倾向性特征，所述倾向性特征表示所述用户特征与第一干预之间的关联倾向表征；

基于所述第一干预表征，所述映射特征和所述倾向性特征，对所述第二响应进行修正，得到第三响应；

基于预测损失训练所述干预表征模型，所述特征映射模型和所述倾向预测模型；其中所述预测损失包括第一损失和第二损失，所述第一损失根据所述第一响应和所述第三响应的差异而确定，所述第二损失根据所述倾向性特征和所述第一干预表征的差异而确定，其中，训练好的所述行为预测模型、训练好的所述特征映射模型、训练好的所述倾向预测模型和训练好的所述干预表征模型构成所述用户响应预测系统。

2.根据权利要求1所述的方法，其中，在将所述用户特征输入已训练好的行为预测模型，得到预测的第二响应之前，还包括：

将所述用户特征输入至所述行为预测模型，得到第四响应；

基于第三损失，训练所述行为预测模型，所述第三损失根据所述第一响应和所述第四响应的差异而确定。

3.根据权利要求1所述的方法，其中，基于所述第一干预表征，所述映射特征和所述倾向性特征，对所述第二响应进行修正，得到第三响应，包括：

通过所述第一干预表征减去所述倾向性特征，得到第一特征；

通过所述映射特征与所述第一特征点积，得到第一增量；

通过所述第一增量，对所述第二响应进行修正，得到所述第三响应。

4.根据权利要求1所述的方法，其中，所述行为预测模型包括：第一深度交叉神经网络DCN和第一多层感知机MLP，其中，所述第一DCN用于对所述用户特征进行交叉运算，所述第一MLP用于对所述第一DCN输出的结果进行维度变换。

5.根据权利要求1所述的方法，其中，所述特征映射模型包括：第二深度交叉神经网络DCN和第二多层感知机MLP，其中，所述第二DCN用于对所述用户特征进行交叉运算，所述第二MLP用于对所述第二DCN输出的结果进行维度变换；

所述倾向预测模型包括：第三DCN和第三MLP，其中，所述第三DCN用于对所述用户特征进行交叉运算，所述第三MLP用于对所述第三DCN输出的结果进行维度变换。

6.根据权利要求1所述的方法，其中，所述干预表征模型为图神经网络GNN或者one-hot函数。

7.根据权利要求1-6任一所述的方法，其中，与所述第一干预相关的权益为以下一项或多项：红包、礼包、优惠券、兑换码、支付券或者积分；

所述第一响应为所述用户使用与所述第一干预相关的权益的概率。

8.一种用户响应预测方法，包括：

获取目标样本，所述目标样本中包括：用户的用户特征和有待对所述用户施加的N个备选干预，N>=2；

将所述目标样本输入采用权利要求1-7中任一所述的方法训练得到的用户响应预测系统，以得到施加各个所述备选干预后所述用户的响应；

其中，在所述用户响应预测系统中，利用所述行为预测模型、所述特征映射模型和所述干预预测模型处理所述用户特征，分别得到第五响应、第一映射特征和第一倾向性特征，并利用所述干预表征模型处理所述N个备选干预，得到N个第二干预表征，以及，基于所述第五响应、所述第一映射特征、所述第一倾向性特征和各个所述第二干预表征，得到施加各个所述备选干预后所述用户的响应。

9.根据权利要求8所述的方法，其中，基于所述第五响应、所述第一映射特征、所述第一倾向性特征和各个所述第二干预表征，得到施加各个所述备选干预后所述用户的响应，包括：

对于得到施加第一干预后所述用户的响应，通过所述第二干预表征减去所述第一倾向性特征，得到第二特征，所述第一干预为所述N个备选干预中的任意一个；

通过所述第一映射特征与所述第二特征点积，得到第二增量；

通过所述第二增量，对所述第五响应进行修正，得到施加所述第一干预后所述用户的响应。

10.一种用户响应预测方法，包括：

将所述目标样本输入采用权利要求1-7中任一所述的方法训练得到的用户响应预测系统，以得到施加各个所述备选干预所带来的增量；

其中，在所述用户响应预测系统中，利用所述特征映射模型和所述干预预测模型处理所述用户特征，分别得到第一映射特征和第一倾向性特征，并利用所述干预表征模型处理所述N个备选干预，得到N个第二干预表征，以及，基于所述第一映射特征、所述第一倾向性特征和各个所述第二干预表征，得到施加各个所述备选干预所带来的增量。

11.根据权利要求10所述的方法，其中，基于所述第一映射特征、所述第一倾向性特征和各个所述第二干预表征，得到施加各个所述备选干预所带来的增量，包括：

对于得到施加第一干预所带来的增益，通过所述第二干预表征减去所述第一倾向性特征，得到第二特征，所述第一干预为所述N个备选干预中的任意一个；

通过所述第一映射特征与所述第二特征点积，得到施加第一干预所带来的增量。

12.一种用户响应预测系统的训练装置，包括：

获取模块，用于获取样本数据，其中第一样本的样本数据包括，第一用户的用户特征，对所述第一用户施加的第一干预，以及施加所述第一干预后所述第一用户做出的第一响应；其中，所述第一干预是预设的N种干预之一，N>=2；

处理模块，用于将所述用户特征输入已训练好的行为预测模型，得到预测的第二响应；

所述处理模块，还用于将所述第一干预输入干预表征模型，得到第一干预表征；所述干预表征模型用于对所述N种干预进行表征；

所述处理模块，还用于将所述用户特征分别输入特征映射模型和倾向预测模型，得到映射特征和倾向性特征，所述倾向性特征表示所述用户特征与第一干预之间的关联倾向表征；

所述处理模块，还用于基于所述第一干预表征，所述映射特征和所述倾向性特征，对所述第二响应进行修正，得到第三响应；

所述处理模块，还用于基于预测损失训练所述干预表征模型，所述特征映射模型和所述倾向预测模型；其中所述预测损失包括第一损失和第二损失，所述第一损失根据所述第一响应和所述第三响应的差异而确定，所述第二损失根据所述倾向性特征和所述第一干预表征的差异而确定，其中，训练好的所述行为预测模型、训练好的所述特征映射模型、训练好的所述倾向预测模型和训练好的所述干预表征模型构成所述用户响应预测系统。

13.一种用户响应预测装置，包括：

获取模块，用于获取目标样本，所述目标样本中包括：用户的用户特征和有待对所述用户施加的N个备选干预，N>=2；

处理模块，用于将所述目标样本输入采用权利要求1-7中任一所述的方法训练得到的用户响应预测系统，以得到施加各个所述备选干预后所述用户的响应；

14.一种用户响应预测装置，包括：

处理模块，用于将所述目标样本输入采用权利要求1-7中任一所述的方法训练得到的用户响应预测系统，以得到施加各个所述备选干预所带来的增量；

15.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算设备中执行时，计算设备执行权利要求1-7任一所述的方法，或者，执行权利要求8或9任一所述的方法，或者，执行权利要求10或11所述的方法。

16.一种计算设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时，实现权利要求1-7任一所述的方法，或者，实现权利要求8或9任一所述的方法，或者，实现权利要求10或11所述的方法。