CN112989929B

CN112989929B - 目标用户的识别方法、装置和电子设备

Info

Publication number: CN112989929B
Application number: CN202110157082.0A
Authority: CN
Inventors: 杨哲; 杨一鹏
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-02-04
Filing date: 2021-02-04
Publication date: 2022-08-09
Anticipated expiration: 2041-02-04
Also published as: CN112989929A

Abstract

本公开实施例提供一种目标用户的识别方法、装置和电子设备，其中该方法由联邦学习系统中的协作方执行；所述联邦学习系统包括第一数据方、第二数据方和协作方；识别方法包括：获取第一数据方对应的第一数据以及第二数据方对应的第二数据；第一数据是根据第一数据方拥有的第一用户的第一特征数据得到，第二数据是根据第二数据方拥有的所述第一用户的第二特征数据得到；基于第一数据和第二数据，通过预先训练的用户识别模型进行预测，根据所述预测结果确定第一用户是否是预定的目标用户。本公开实施例提升了用户识别的准确率。

Description

目标用户的识别方法、装置和电子设备

技术领域

本公开涉及机器学习技术，具体涉及一种目标用户的识别方法、装置和电子设备。

背景技术

识别风险用户是很多场景中需要做的风险防控措施。例如，在支付场景中，由于市场竞争越来越激烈，为了提升市场份额，需要通过各种营销活动来提升用户使用某种特定支付工具(例如，支付宝)的意愿。希望通过营销活动，不仅提升用户当笔的支付成功率，还可以带来更多后续的交易笔数。以支付宝为例，支付宝和外部商户可以合作进行营销活动，即有些营销活动是由支付宝发起的，有些营销活动是由外部商户发起的。不过，在营销运营的过程中发现，存在部分薅羊毛用户每次都是仅在有营销活动的时候才使用该特定支付工具付款，其他情况很少使用。这种用户称为营销作弊用户，需要识别出来并避免对这部分用户进行营销，以减少无效营销资金的浪费，提升营销资金的转化效果。

传统的方法中，支付宝和外部商户各自来识别某个用户是否是营销作弊用户，并根据各自的识别结果来决定是否对该用户进行营销活动。例如，支付宝通常根据支付宝收集的某用户的数据来识别该用户是否是营销作弊用户，以据此决定是否对该用户发起营销；同理，外部商户根据外部商户的APP收集的该用户的数据识别营销作弊用户，减少被薅羊毛的可能性。但是实践中发现，这种方法对营销作弊用户有时识别不准确。

发明内容

有鉴于此，本公开至少提供一种目标用户的识别方法、装置和电子设备，以提高对目标用户识别的准确率。

第一方面，提供一种目标用户的识别方法，所述方法由联邦学习系统中的协作方执行；所述联邦学习系统包括第一数据方、第二数据方和所述协作方；所述识别方法包括：

获取所述第一数据方对应的第一数据、以及第二数据方对应的第二数据；所述第一数据是根据第一数据方拥有的第一用户的第一特征数据得到，所述第二数据是根据第二数据方拥有的所述第一用户的第二特征数据得到；

基于所述第一数据和第二数据，通过预先训练的用户识别模型进行预测，根据所述预测结果确定所述第一用户是否是预定的目标用户。

第二方面，提供一种目标用户的识别方法，所述方法由联邦学习系统中的任一数据方执行，所述任一数据方是第一数据方或者第二数据方；所述联邦学习系统包括所述第一数据方、第二数据方和协作方；所述识别方法包括：

根据本地拥有的第一用户的特征数据，得到用户数据；

向所述协作方发送所述用户数据，以使得所述协作方利用所述用户数据以及其他数据方的用户数据通过用户识别模型识别第一用户是否是目标用户。

第三方面，提供一种目标用户的识别装置，所述装置应用于联邦学习系统中的协作方，所述联邦学习系统包括第一数据方、第二数据方和所述协作方；所述装置包括：

数据获取模块，用于获取所述第一数据方对应的第一数据、以及第二数据方对应的第二数据；所述第一数据是根据第一数据方拥有的第一用户的第一特征数据得到，所述第二数据是根据第二数据方拥有的所述第一用户的第二特征数据得到；

识别处理模块，用于基于所述第一数据和第二数据，通过预先训练的用户识别模型进行预测，根据所述预测结果确定第一用户是否是预定的目标用户。

第四方面，提供一种目标用户的识别装置，所述装置应用于联邦学习系统中的任一数据方，所述任一数据方是第一数据方或者第二数据方；所述联邦学习系统包括所述第一数据方、第二数据方和协作方；所述装置包括：

数据获得模块，用于根据本地拥有的第一用户的特征数据，得到用户数据；

数据发送模块，用于向所述协作方发送所述用户数据，以使得所述协作方利用所述用户数据以及其他数据方的用户数据通过用户识别模型识别第一用户是否是目标用户。

第五方面，提供一种电子设备，所述设备包括存储器、处理器，所述存储器用于存储可在处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时实现本公开任一实施例的方法。

第六方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现本公开任一实施例的方法。

第七方面，提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现本公开任一实施例的方法。

本公开实施例提供的目标用户的识别方法、装置和电子设备，通过采用联邦学习的方式训练用户识别模型，同时利用了各数据方的数据，解决了数据孤岛问题，对用户的刻画更加完善，训练的用户识别模型的预测结果更加准确，提升了利用模型识别目标用户的准确率。

附图说明

为了更清楚地说明本公开一个或多个实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开一个或多个实施例中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1示出了本公开至少一个实施例提供的一种联邦学习系统的示意图；

图2示出了本公开至少一个实施例提供的一种营销活动的界面示意图；

图3示出了本公开至少一个实施例提供的一种目标用户的识别方法；

图4示出了本公开至少一个实施例提供的另一种目标用户的识别方法；

图5示出了本公开至少一个实施例提供的一种识别营销作弊用户的流程；

图6示出了本公开至少一个实施例提供的一种目标用户的识别装置；

图7示出了本公开至少一个实施例提供的另一种目标用户的识别装置。

具体实施方式

为了使本技术领域的人员更好地理解本公开一个或多个实施例中的技术方案，下面将结合本公开一个或多个实施例中的附图，对本公开一个或多个实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开一个或多个实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。

在用户识别的场景中，一般是根据用户的特征数据识别某个用户是否是目标用户(例如，该目标用户即营销作弊用户)，然而，有些情况下，一个用户的多个特征数据分别被不同的数据方拥有，比如，第一数据方拥有该用户的特征数据{f1,f2,f3,f4}，第二数据方拥有该用户的特征数据{f5,f6,f7}。其中，具体实施中，第一数据方的数量可以是多个，第二数据方的数量也可以是至少一个。

并且，基于保护用户的数据隐私和数据安全的原则，上述的第一数据方和第二数据方之间不能相互泄露各自的数据，不能简单的将这些数据方的数据整合到一起去训练一个用于识别目标用户的用户识别模型。本公开实施例中引入了联邦学习，通过联邦学习的方式联合多个数据方的数据共同训练用户识别模型。这样既能够遵守数据隐私保护的原则，又能够联合多个数据方的数据训练模型，由于联合了多个数据方拥有的用户的特征数据，将能够使得对用户的刻画更为完整和全面，进而提升用户识别模型的效果，使得通过该模型识别目标用户的准确率更高。

如下以支付营销场景为例，描述如何通过本公开实施例的方法训练能够识别营销作弊用户的用户识别模型，并通过该模型来识别营销作弊用户。但可以理解的是，该方法不局限于支付营销场景，也可以应用于其他场景。

请参见图1所示，本公开实施例通过联邦学习系统来训练能够识别营销作弊用户的用户识别模型。如图1所示，该联邦学习系统可以包括：第一数据方11、第二数据方12和协作方13。协作方13和各个数据方可以是服务器，也可以是PC、智能手机、平板电脑等终端设备，协作方13可以与各数据方通信连接。其中，如下描述中，以第一数据方和第二数据方的数量均为一个为例，可以理解的是，数据方的数量也可以多于一个。在一个示例中，第一数据方11可以是支付宝，第二数据方12可以是商户。

在该支付营销场景中，作为第二数据方12的商户可以包括购物客户端APP和商户服务端，用户可以通过该购物APP浏览和选择自己要购买的商品，并且在下单结算时可以选择支付宝或者其他支付方式进行付款。其中，为了鼓励用户使用支付宝付款，支付宝可以与商户进行联合营销活动，即有些营销活动可以由支付宝发起(参见图2的示例，可以通过降低结算额的方式鼓励用户使用)，有些营销活动可以由商户发起。对于支付宝发起的营销活动，如果用户只在活动时使用支付宝，则可以称为支付宝营销作弊用户；对于商户发起的营销活动，如果用户只在活动时使用支付宝，则可以称为商户营销作弊用户。

用户识别模型的训练阶段：

首先，在该支付营销场景中，支付宝和商户各自的用户群体之间，存在较多的重叠的共有用户，不过即使存在共有用户，用户特征之间重叠较少，例如，对于同一个用户，支付宝拥有该用户的一部分用户特征，商户拥有该用户的另一部分用户特征。基于此，本公开实施例采用“纵向联邦学习”的方式进行模型训练，取出双方用户相同而用户特征不同的数据联合进行训练。

具体的，支付宝和商户各自可以提供如下的数据参与模型训练，需要说明的是，如下的数据仅为示例，双方也可以提供如下示例之外的其他数据参数，只要该数据有助于营销作弊用户的识别即可：

以要识别用户U1是否是支付营销场景下的营销作弊用户为例，该用户U1可以暂且称为第一用户。作为第一数据方的支付宝可以提供该第一用户的第一特征数据，所述的第一特征数据包括但不限于如下至少一项：

用户U1在支付宝的用户基础属性：例如，该用户基础属性可以包括“性别、年龄、所在城市”等等。示例性的，用户U1的性别是“女”，年龄“23岁”，所在城市“上海”。

用户U1在支付宝的支付信息：例如，该支付信息可以包括用户U1在线上或线下使用支付宝的支付信息，比如，可以是该用户U1在一段时间内的消费频次(如，在时间段T1内使用支付宝消费了n笔)，该用户U1的支付成功率(如，20笔付款中的18笔成功使用支付宝付款，另外两笔退回)，或者还可以是该用户U1使用支付宝付款的支付时间/地点/金额，如，用户U1在某时间t2在某线下店铺B使用支付宝支付了18元。再如，该支付信息还可以是用户U1的历史参与营销活动的信息，比如，在时间段T1内，支付宝发起了10笔营销活动，该用户U1参与了其中的8笔，营销活动参与率达到了80％。

此外，作为第一数据方的支付宝除了拥有上述的第一用户的第一特征数据之外，在训练过程中还可以提供本次模型训练的训练标签。该训练标签可以包括三种：第一标签、第二标签和第三标签，示例如下：

第一标签：0，表示正常用户，可以对该用户进行正常营销活动。

第二标签：1，表示该用户是支付宝营销作弊用户，支付宝不对该用户进行营销活动。

第三标签：2，表示该用户是商户营销作弊用户，商户不对该该用户进行营销活动。

作为第二数据方的商户可以提供该第一用户的第二特征数据，所述的第二特征数据包括但不限于如下至少一项：

第一用户U1在商户的用户基础属性：例如，该用户基础属性可以包括，用户U1在商户的用户等级，如，钻石VIP客户，普通客户等。

第一用户U1在商户的购物客户端中的购物行为参数：例如，该购物行为参数可以包括用户U1在商户的购物APP内的浏览行为参数(如，浏览频次，浏览时间)，用户U1在购物APP中的商品购买行为参数(如，购买的商品类别)，用户U1在购物APP中账户的充值行为参数(充值次数/充值金额等)。购物行为参数还可以是用户U1在商户侧的历史参与营销活动信息，比如，在时间段T3内，商户发起了10笔营销活动，该用户U1参与了其中的6笔，营销活动参与率达到了60％。

上述支付宝和商户双方的特征数据可以共同刻画某个用户，使得对该用户的属性和行为的表征更加准确。并且，在训练过程中，支付宝和商户双方提供的是同一时间段的数据，以保证后续的样本数据对齐。比如，双方都选取3月1日至3月30日之间的数据来参与用户识别模型的训练。

在利用双方数据训练模型之前，可以先采用RSA算法对支付宝和商户的数据进行加密样本对齐。在联邦学习的架构下，可以由协作方产生公钥分发给支付宝和商户，对用户的特征数据进行加密后传给协作方，再由协作方通过私钥将加密的用户特征数据进行解密，取出支付宝和商户的共有用户。上述的样本对齐技术可以采用现有的对齐技术，本公开实施例将不再详述。通过进行样本对齐，支付宝和商户双方可以在不公开各自数据的前提下，确认双方的共有用户，并且不暴露不互相重叠的用户，联合这些用户的特征数据进行建模。

在进行样本对齐之后，同一个训练样本中的特征数据既包括支付宝提供的第一特征数据，也包括商户提供的第二特征数据，并且同一训练样本中的第一特征数据和第二特征数据可以是同一时间段且属于同一用户的数据。

例如，一个训练样本是{f1,f2,f3,f4,f5,f6,f7}，其中，{f1,f2,f3,f4}是支付宝提供的3月1日至3日的用户U1的第一特征数据，{f5,f6,f7}是商户提供的3月1日至3日的用户U1的第二特征数据。

接着，可以根据对齐后得到的训练样本的集合，来训练用户识别模型。示例性的，所述的用户识别模型可以是逻辑回归、GDBT、Xgboost等用于分类的模型。该用户识别模型的训练过程可以采用常规的联邦学习方式。如下简单说明作为第一数据方的支付宝、作为第二数据方的商户和协作方以联邦学习方式训练用户识别模型的过程：

1)、协作方把公钥分发给支付宝和商户，该公钥用以对训练过程中需要交换的数据进行加密。

2)支付宝和商户分别计算和自己相关的中间结果，并加密交互中间结果后，计算加密的梯度值。

所述的中间结果是用于计算梯度值。双方加密交换上述的中间结果，并利用该中间结果计算梯度值。

例如，支付宝可以根据本地拥有的用户U1的第一特征数据、以及本轮参数更新中的支付宝本地的模型参数，计算得到第一中间结果。并可以通过协作方发送的公钥对该第一中间结果进行加密，得到第一加密中间结果。支付宝还可以根据该第一加密中间结果和支付宝拥有的训练标签计算得到第二加密中间结果。支付宝可以将该第二加密中间结果发送给商户方，商户可以根据该第二加密中间结果以及商户侧本地拥有的第二特征数据，计算得到商户方的加密梯度值。而支付宝可以根据该第二加密中间结果和支付宝本地拥有的第一特征数据，计算得到支付宝本地模型参数对应的加密梯度值。

梯度值的计算可以采用如下方式：

假设目标函数为：

设

加密过后的目标函数为：

设

那么梯度为：

其中，A表示支付宝，B表示商户，i是第i个样本，x是特征，y是目标值(即训练标签)，u是半模型的预测值，该半模型即支付宝或者商户侧的本地模型，属于用户识别模型的一部分，u^A即支付宝侧的半模型的预测值，u^B即商户侧的半模型的预测值。Θ是模型的权重；λ是正则表达式系数，d是加密的残差(用于求梯度)。

3)支付宝和商户将加密的梯度值进分别发送给协作方，并且，支付宝根据其拥有的训练标签计算损失，将损失也发送给协作方。

4)协作方根据支付宝和商户发送的梯度值计算总梯度，并将其解密，协作方将解密后的梯度分别回传给支付宝和商户。

本实施例中，预设的模型训练停止条件可以是损失函数收敛、或者迭代训练的次数大于预定次数、或者迭代训练时间大于预设时间等，以损失函数收敛为例，协作方可以根据支付宝侧同步的损失，判断损失函数是否收敛。如果没有收敛，即尚未达到模型训练的停止条件，则协作方可以将解密后的总梯度传给支付宝和商户。

5)支付宝和商户根据协作方传回的梯度值，更新各自的模型参数。

6)迭代上述步骤进行训练，直至检测到满足预设的训练停止条件，例如，损失函数收敛，这样就完成了整个训练过程。

需要说明的是，第一数据方、第二数据方和协作方的联合训练过程，不局限于上述的示例流程，也可以采用其他的训练处理过程，不再详述。

在模型训练好之后，支付宝和商户侧均各自拥有一个半模型，这两个半模型的总和构成一个用户识别模型。在具体部署时，可以由支付宝和商户各自在本地保存一个半模型，这样各自可以根据该半模型得到一个关于用户识别的初步预测结果，再由协作方对两个初步预测结果进行融合得到最终的预测结果。例如，支付宝根据本地半模型预测某用户U1是目标用户(即营销作弊用户)的概率是0.5，商户侧根据本地半模型预测用户U1是目标用户的概率是0.8，协作方可以对这两个初步预测结果进行加权融合，得到总概率。加权参数可以是在模型的训练过程中训练得到。或者，还可以是，支付宝和商户将训练好的各自的半模型都发送给协作方，协作方侧存储一个完整的用户识别模型。

用户识别模型的应用阶段：

图3示例了一种目标用户的识别方法，该方法可以由联邦学习系统中的任一数据方执行，所述任一数据方是第一数据方或者第二数据方。如图3所示，该方法可以包括如下处理：

在步骤300中，根据本地拥有的第一用户的特征数据，得到用户数据。

在一个示例中，如果将完整的用户识别模型部署在协作方，那么第一数据方和第二数据方可以将自己拥有的第一用户的特征数据作为用户数据，发送给协作方，由协作方根据第一数据方提供的第一用户的第一特征数据、以及第二数据方提供的第一用户的第二特征数据，通过训练好的用户识别模型进行预测，得到第一用户是否属于目标用户的预测结果。

在另一个示例中，如果由第一数据方和第二数据方分别保存用户识别模型的半模型，那么任一数据方可以根据其本地拥有的第一用户的特征数据，通过本地存储的模型参数进行预测，得到一个初步预测结果，并将该初步预测结果作为用户数据发给协作方。例如，支付宝可以根据本地拥有的第一用户的性别、年龄、消费频次、支付成功率等特征数据，通过本地半模型进行预测，预测得到的初步预测结果可以是0.5。

在步骤302中，向协作方发送用户数据，以使得协作方利用所述用户数据以及其他数据方的用户数据通过用户识别模型识别第一用户是否是目标用户。

不论数据方发送的用户数据是数据方拥有的用户特征数据本身，还是数据方根据用户特征数据计算得到的初步预测结果，协作方都可以根据该用户数据以及用户识别模型得到预测结果。协作方的处理可以参见图4的处理流程。

图4示例了一种目标用户的识别方法，该方法可以由联邦学习系统中的协作方执行，如图4所示，该方法可以包括如下处理：

在步骤400中，获取所述第一数据方对应的第一数据、以及第二数据方对应的第二数据。

其中，协作方接收的所述第一数据是根据第一数据方拥有的第一用户的第一特征数据得到，所述第二数据是根据第二数据方拥有的所述第一用户的第二特征数据得到。

在一个示例中，该第一数据可以是第一数据方拥有的第一用户的第一特征数据(例如，用户的性别、年龄、消费频次等)本身，第二数据是第二数据方拥有的该第一用户的第二特征数据(例如，该用户在商户的购物APP内的浏览频次、购买的商品类型等)本身。

在另一个示例中，该第一数据可以是第一数据方根据用户的第一特征数据以及第一数据方侧的半模型参数计算得到的初步预测结果，该初步预测结果可以称为第一预测结果。该第二数据可以是第二数据方根据用户的第二特征数据以及第二数据方侧的半模型参数计算得到的初步预测结果，该初步预测结果可以称为第二预测结果。

在步骤402中，基于所述第一数据和第二数据，通过预先训练的用户识别模型进行预测，根据所述预测结果确定所述第一用户是否是预定的目标用户。

本步骤中，若协作方接收的第一数据是第一预测结果，第二数据是第二预测结果，那么协作方可以将该第一预测结果和第二预测结果进行加权处理，得到最终的预测结果。其中，协作方侧可以保存有用户识别模型中用于融合第一预测结果和第二预测结果的权重参数，该权重参数可以是在用户识别模型的训练过程中学习得到。

若协作方接收的第一数据是第一特征数据，第二数据是第二特征数据，那么协作方可以将所述第一特征数据和第二特征数据输入协作方保存的完整的用户识别模型，得到对用户是否是目标用户的预测结果。

图5示例一种在用户使用商户的购物APP进行购物支付时，通过本公开实施例的目标用户识别方法来实时预测该用户是否是营销作弊用户的处理流程。需要说明的是，该方法也可以应用于非实时预测，例如，也可以是在用户于购物APP购物支付之前，就根据该用户的历史相关数据预测得到该用户是否是营销作弊用户，在支付时根据预先得到的预测结果决定是否对用户营销即可。

如图5所示，如下的描述以实时预测为例来进行说明，其中，第二数据方以商户为例，第一数据方以支付宝为例；并且，该示例中以协作方侧保存完整的用户识别模型为例，数据方将特征数据发给协作方。

在步骤500中，商户方检测到第一用户在购物客户端发起支付。

例如，商户方可以包括商户的购物客户端以及购物服务端。

用户可以在商户的购物客户端APP内浏览要购买的商品，待选好商品后进行下单，比如，用户在将要购买的商品放入购物车后，可以点击“去结算”。购物APP检测到该用户要发起支付，可以采集用户在APP的实时购物行为参数，该实时购物行为参数可以包括但不限于：购买的商品类别、浏览时长等。购物APP可以向商户的购物服务端发送支付通知，以通知购物服务端该用户要发起支付。

在步骤502中，商户方获取所述第一用户的历史购物行为参数和用户基础属性，并根据所述实时购物行为参数、历史购物行为参数和用户基础属性得到所述用户数据。

本步骤中，购物服务端可以获取该用户的一些用户基础属性，比如用户等级，还可以获取该用户的历史购物行为参数，比如，在某段时间内的浏览频次、该时间段内的购买商品类别、充值行为参数(如，在某时间段内充值了n次)、该时间段内的历史参与商户营销活动的参数(如，参与了80％的营销活动)等。

上述的用户本次购买的商品类别等实时购物行为参数，以及历史购物行为参数和用户基础属性都是该用户的第二特征数据，可以作为用户数据。

在步骤504中，商户方向所述协作方发送对所述第一用户的识别请求，所述识别请求中携带所述用户数据。

商户的购物服务端可以向协作方发送识别请求，其中携带用户的用户标识、以及该用户的用户数据。该识别请求用于请求识别用户是否是营销作弊用户。

在步骤506中，协作方获取支付宝侧的第一数据。

例如，协作方可以根据用户标识，由支付宝侧获取该用户的第一特征数据，比如该用户在支付宝侧的用户基础属性(性别、年龄等)、以及支付信息(某段时间内的消费频次、支付成功率)等参数。将该第一特征数据作为第一数据。

在步骤508中，协作方根据由支付宝和商户获取的用户数据，通过预先训练好的用户识别模型，得到预测结果。

协作方可以将获取到的支付宝和商户侧的数据输入预先训练好的用户识别模型，得到模型输出的预测结果。

例如，预测结果可以包括三种结果：

第一预测结果，用于表示第一用户是第一数据方的营销作弊用户。

第二预测结果，用于表示第一用户是第二数据方的营销作弊用户。

第三预测结果，用于表示第一用户是正常用户，可以进行正常营销活动。

在步骤510中，响应于所述预测结果表示第一用户是营销作弊用户，向所述营销作弊用户对应的服务端发送放弃营销指示，以指示所述服务端不再向所述第二数据方的购物客户端发送支付营销信息。

例如，假设预测结果是该第一用户是商户侧的营销作弊用户，则协作方可以向商户的购物服务端发送放弃营销指示，以指示购物服务端不再向商户侧的购物APP发送支付营销信息。同理，如果预测结果是该第一用户是支付宝侧的营销作弊用户，则协作方可以向支付宝的服务端发送放弃营销指示，以指示支付宝的服务端不再向支付宝APP发送支付营销活动。

在其他的示例中，为了提高用户识别的效率，也可以采用由支付宝和商户各自存储半模型的部署方式。这种部署方式下，商户侧在检测到用户发起支付时，可以获取本方拥有的该用户的第二特征数据(例如，本次购买的商品类别、历史参与营销活动信息、用户等级等)，并根据该第二特征数据以及训练好的半模型，得到商户方预测输出的第二预测结果。同理，商户方可以通知支付宝方对该用户进行预测，携带该用户的用户标识，支付宝方可以根据拥有的该用户的第一特征数据(例如，性别，年龄、消费频次、支付成功率等)以及支付宝方存储的半模型，得到预测输出的第一预测结果。支付宝和商户可以将第一预测结果和第二预测结果发送给协作方，由协作方根据用户识别模型中的权重参数，将两个结果进行加权融合，得到最终的预测结果，即可获知该用户是正常用户，或者是支付宝营销作弊用户等。

上述的由支付宝和商户各自存储半模型的部署方式，相比于协作方侧保存完整的用户识别模型，由于数据方可以直接将第一预测结果或第二预测结果发给协作方，不用再将各自的用户特征数据加密传输给协作方，减少了加解密处理过程，能够提高用户识别的效率。

此外，通过采用联邦学习的方式训练用户识别模型，同时利用了各数据方的数据，解决了数据孤岛问题，对用户的刻画更加完善，训练的用户识别模型的预测结果更加准确，提升了模型识别的准确率，进而提升营销活动的效果；并且，通过联邦学习的加密技术，也保证了各数据方之间不会存在隐私泄露的风险，保护了用户隐私和数据安全。再者，在上述支付营销的场景中，由支付宝和商户共同做营销作弊用户的识别，不再需要分别识别，也减少了资源浪费。还有，训练的用户识别模型可以是多分类模型(正常用户、支付宝营销作弊用户、商户营销作弊用户)，也提升了模型预测的适用性。

图6是本公开一示例性实施例提供的目标用户的识别装置的结构，该装置可以应用于执行本公开任一实施例的目标用户的识别方法，该装置可以应用于联邦学习系统中的协作方，所述联邦学习系统包括第一数据方、第二数据方和所述协作方。如图6所示，该装置可以包括：数据获取模块61和识别处理模块62。

数据获取模块61，用于获取所述第一数据方对应的第一数据、以及第二数据方对应的第二数据；所述第一数据是根据第一数据方拥有的第一用户的第一特征数据得到，所述第二数据是根据第二数据方拥有的所述第一用户的第二特征数据得到。

识别处理模块62，用于基于所述第一数据和第二数据，通过预先训练的用户识别模型进行预测，根据所述预测结果确定第一用户是否是预定的目标用户。

图7是本公开一示例性实施例提供的另一种目标用户的识别装置的结构，该装置可以应用于联邦学习系统中的任一数据方，所述任一数据方是第一数据方或者第二数据方；所述联邦学习系统包括所述第一数据方、第二数据方和协作方。如图7所示，该装置可以包括：数据获得模块71和数据发送模块72。

数据获得模块71，用于根据本地拥有的第一用户的特征数据，得到用户数据。

数据发送模块72，用于向所述协作方发送所述用户数据，以使得所述协作方利用所述用户数据以及其他数据方的用户数据通过用户识别模型识别第一用户是否是目标用户。

本公开还提供了一种电子设备，所述设备包括存储器、处理器，所述存储器用于存储可在处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时实现本公开任一实施例的方法。

本公开还提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现本公开任一实施例所述的方法。

本领域技术人员应明白，本公开一个或多个实施例可提供为方法、系统或计算机程序产品。因此，本公开一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本公开一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开实施例还提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现本公开任一实施例所述的方法。

本公开中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于数据处理设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本公开特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的行为或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本公开中描述的主题及功能操作的实施例可以在以下中实现：数字电子电路、有形体现的计算机软件或固件、包括本公开中公开的结构及其结构性等同物的计算机硬件、或者它们中的一个或多个的组合。本公开中描述的主题的实施例可以实现为一个或多个计算机程序，即编码在有形非暂时性程序载体上以被数据处理装置执行或控制数据处理装置的操作的计算机程序指令中的一个或多个模块。可替代地或附加地，程序指令可以被编码在人工生成的传播信号上，例如机器生成的电、光或电磁信号，该信号被生成以将信息编码并传输到合适的接收机装置以由数据处理装置执行。计算机存储介质可以是机器可读存储设备、机器可读存储基板、随机或串行存取存储器设备、或它们中的一个或多个的组合。

本公开中描述的处理及逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程计算机执行，以通过根据输入数据进行操作并生成输出来执行相应的功能。所述处理及逻辑流程还可以由专用逻辑电路—例如FPG多(现场可编程门阵列)或多SIC(专用集成电路)来执行，并且装置也可以实现为专用逻辑电路。

适合用于执行计算机程序的计算机包括，例如通用和/或专用微处理器，或任何其他类型的中央处理单元。通常，中央处理单元将从只读存储器和/或随机存取存储器接收指令和数据。计算机的基本组件包括用于实施或执行指令的中央处理单元以及用于存储指令和数据的一个或多个存储器设备。通常，计算机还将包括用于存储数据的一个或多个大容量存储设备，例如磁盘、磁光盘或光盘等，或者计算机将可操作地与此大容量存储设备耦接以从其接收数据或向其传送数据，抑或两种情况兼而有之。然而，计算机不是必须具有这样的设备。此外，计算机可以嵌入在另一设备中，例如移动电话、个人数字助理(PD多)、移动音频或视频播放器、游戏操纵台、全球定位系统(GPS)接收机、或例如通用串行总线(USB)闪存驱动器的便携式存储设备，仅举几例。

适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备，例如包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部硬盘或可移动盘)、磁光盘以及CD ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路补充或并入专用逻辑电路中。

虽然本公开包含许多具体实施细节，但是这些不应被解释为限制任何公开的范围或所要求保护的范围，而是主要用于描述特定公开的具体实施例的特征。本公开内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面，在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外，虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护，但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除，并且所要求保护的组合可以指向子组合或子组合的变型。

类似地，虽然在附图中以特定顺序描绘了操作，但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行，以实现期望的结果。在某些情况下，多任务和并行处理可能是有利的。此外，上述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中均需要这样的分离，并且应当理解，所描述的程序组件和系统通常可以一起集成在单个软件产品中，或者封装成多个软件产品。

由此，主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下，权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外，附图中描绘的处理并非必需所示的特定顺序或顺次顺序，以实现期望的结果。在某些实现中，多任务和并行处理可能是有利的。

以上所述仅为本公开一个或多个实施例的较佳实施例而已，并不用以限制本公开一个或多个实施例，凡在本公开一个或多个实施例的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开一个或多个实施例保护的范围之内。

Claims

1.一种目标用户的识别方法，所述方法由联邦学习系统中的协作方执行；所述联邦学习系统包括第一数据方、第二数据方和所述协作方；所述识别方法包括：

基于所述第一数据和第二数据，通过预先训练的用户识别模型进行预测，根据所述预测结果确定所述第一用户是否是预定的目标用户；

所述通过预先训练的用户识别模型进行预测，根据预测结果确定第一用户是否是预定的目标用户，包括：

响应于预测结果是第一预测结果，确定所述第一用户是第一数据方的营销作弊用户；或者，

响应于预测结果是第二预测结果，确定所述第一用户是第二数据方的营销作弊用户。

2.根据权利要求1所述的方法，所述目标用户是支付营销场景中的营销作弊用户；

所述第一数据方拥有的第一用户的第一特征数据，包括：所述第一用户在第一数据方的用户基础属性和支付信息中的至少一项；

所述第二数据方拥有的第一用户的第二特征数据，包括：所述第一用户在第二数据方的用户基础属性以及在购物客户端中的购物行为参数中的至少一项。

3.根据权利要求2所述的方法，所述获取所述第一数据方对应的第一数据、以及第二数据方对应的第二数据之前，所述方法还包括：

接收所述第二数据方发送的用于指示识别目标用户的识别请求，所述识别请求是所述第二数据方检测到所述第一用户发起支付时发送；

所述根据预测结果确定所述第一用户是否是预定的目标用户之后，所述方法还包括：响应于所述预测结果表示第一用户是营销作弊用户，向所述营销作弊用户对应的服务端发送放弃营销指示，以指示所述服务端不再向所述第二数据方的购物客户端发送支付营销信息。

4.根据权利要求1所述的方法，所述获取所述第一数据方对应的第一数据、以及第二数据方对应的第二数据，包括：接收第一数据方发送的第一预测结果作为第一数据，所述第一预测结果由第一数据方根据第一特征数据计算得到；并接收第二数据方发送的第二预测结果作为第二数据，所述第二预测结果是由第二数据方根据第二特征数据计算得到；

所述基于所述第一数据和第二数据，通过预先训练的用户识别模型进行预测，包括：根据所述用户识别模型中的权重参数，将所述第一预测结果和第二预测结果进行加权处理，得到所述预测结果。

5.根据权利要求1所述的方法，所述获取所述第一数据方对应的第一数据、以及第二数据方对应的第二数据，包括：接收所述第一数据方发送的第一特征数据作为所述第一数据，并接收第二数据方发送的第二特征数据作为所述第二数据；

所述基于所述第一数据和第二数据，通过预先训练的用户识别模型进行预测，包括：将所述第一特征数据和第二特征数据输入所述用户识别模型，得到所述预测结果。

6.一种目标用户的识别方法，所述方法由联邦学习系统中的任一数据方执行，所述任一数据方是第一数据方或者第二数据方；所述联邦学习系统包括所述第一数据方、第二数据方和协作方；所述识别方法包括：

根据本地拥有的第一用户的特征数据，得到用户数据；

向所述协作方发送所述用户数据，以使得所述协作方利用所述用户数据以及其他数据方的用户数据通过用户识别模型识别第一用户是否是目标用户；

所述目标用户是支付营销场景中的营销作弊用户；

所述本地拥有的第一用户的特征数据，包括：

若所述数据方是第一数据方，所述特征数据包括所述第一用户的用户基础属性和支付信息的至少一项；

若所述数据方是第二数据方，所述特征数据包括所述第一用户在第二数据方的用户基础属性以及在购物客户端中的购物行为参数中的至少一项；

当所述数据方是第二数据方时，所述向所述协作方发送所述用户数据，包括：

接收所述购物客户端发送的支付通知，所述支付通知是所述购物客户端在检测到所述第一用户发起支付的情况下发送，所述支付通知中携带所述购物客户端采集的本次购物的实时购物行为参数；

获取所述第一用户的历史购物行为参数和用户基础属性，并根据所述实时购物行为参数、历史购物行为参数和用户基础属性得到所述用户数据；

向所述协作方发送对所述第一用户的识别请求，所述识别请求中携带所述用户数据。

7.根据权利要求6所述的方法，所述根据本地拥有的第一用户的特征数据，得到用户数据，包括：

获取本地拥有的第一用户的特征数据本身作为所述用户数据；

或者，根据本地拥有的第一用户的特征数据，通过本地存储的所述用户识别模型的部分模型参数，预测得到初步预测结果，并将所述初步预测结果作为所述用户数据。

8.一种目标用户的识别装置，所述装置应用于联邦学习系统中的协作方，所述联邦学习系统包括第一数据方、第二数据方和所述协作方；所述装置包括：

识别处理模块，用于基于所述第一数据和第二数据，通过预先训练的用户识别模型进行预测，根据所述预测结果确定第一用户是否是预定的目标用户；

9.一种目标用户的识别装置，所述装置应用于联邦学习系统中的任一数据方，所述任一数据方是第一数据方或者第二数据方；所述联邦学习系统包括所述第一数据方、第二数据方和协作方；所述装置包括：

数据发送模块，用于向所述协作方发送所述用户数据，以使得所述协作方利用所述用户数据以及其他数据方的用户数据通过用户识别模型识别第一用户是否是目标用户；

所述目标用户是支付营销场景中的营销作弊用户；

所述本地拥有的第一用户的特征数据，包括：

10.一种电子设备，所述设备包括存储器、处理器，所述存储器用于存储可在处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时实现权利要求1至5任一所述的方法，或者实现权利要求6至7任一所述的方法。

11.一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现权利要求1至5任一所述的方法，或者实现权利要求6至7任一所述的方法。