CN113255231A

CN113255231A - 一种数据处理方法、装置、设备及存储介质

Info

Publication number: CN113255231A
Application number: CN202110681185.7A
Authority: CN
Inventors: 何远舵
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-06-18
Filing date: 2021-06-18
Publication date: 2021-08-13
Anticipated expiration: 2041-06-18
Also published as: CN113255231B

Abstract

本申请实施例公开了一种人工智能领域的数据处理方法、装置、设备及存储介质，其该方法包括：获取目标对象的特征数据；通过目标行为预测模型，根据目标对象的特征数据确定多个时间单元各自对应的目标行为参考概率；目标行为预测模型是基于多个时间单元各自对应的训练样本集训练的，时间单元对应的训练样本集包括在目标应用程序上的注册时长满足该时间单元对应的注册时长的各个注册对象各自对应的训练样本，注册对象对应的训练样本包括特征数据以及目标行为标注数据；针对每个时间单元，根据该时间单元对应的目标行为参考概率，确定在该时间单元对应的参考时长内目标对象的目标行为产生概率。该方法可以准确地对象产生特定行为的概率。

Description

一种数据处理方法、装置、设备及存储介质

技术领域

本申请涉及人工智能(Artificial Intelligence，AI)技术领域，尤其涉及一种数据处理方法、装置、设备及存储介质。

背景技术

对于很多应用程序(Application，APP)而言，用户通过该应用程序触发产生某种特定行为的概率，可能对该应用程序有着重要的影响。例如，用户通过游戏应用程序触发产生付费行为的概率，是影响该游戏应用程序对其上投放的在线广告进行定价的重要因素。基于此，一些应用程序的研发人员致力于研究如何准确地预测用户通过应用程序触发产生特定行为的概率。

对于新上线的应用程序，目前普遍通过以下方式预测用户触发产生特定行为的概率：对于已上线N(N为大于或等于1的整数)的应用程序，按照预设的窗口截取规则截取n(n为小于或等于N的正整数)天作为观察窗口，进而，采集注册时间大于或等于n天的用户在其注册的前n天内的特定行为产生数据作为训练样本，并利用该训练样本训练行为预测模型；完成对于该行为预测模型的训练后，针对注册该应用程序的新用户，利用该行为预测模型预测其注册该应用程序后n天内产生特定行为的概率。

然而，上述行为预测方案在实际应用中的效果并不理想。一方面，按照窗口截取规则截取固定长度的观察窗口，利用注册时间大于或等于该观察窗口的用户在该观察窗口内的特定行为产生数据作为训练样本，没有实现对于应用程序的所有注册用户的所有特定行为产生数据的充分利用，容易因采集的训练样本不足，导致训练得到的行为预测模型性能不佳，预测结果不准确。另一方面，上述行为预测模型只能预测用户在固定的观察窗口内产生特定行为的概率，使用范围比较局限，在很多情况下难以满足实际的预测需求。

发明内容

本申请实施例提供了一种数据处理方法、装置、设备及存储介质，能够针对新上线的应用程序，准确地预测用户在多种不同长度的观察窗口内通过该应用程序产生特定行为的概率。

有鉴于此，本申请第一方面提供了一种数据处理方法，所述方法包括：

获取注册目标应用程序的目标对象的用户特征数据；

通过目标行为预测模型，根据所述目标对象的特征数据，确定多个时间单元各自对应的目标行为参考概率；所述目标行为预测模型是基于所述多个时间单元各自对应的训练样本集训练的，所述时间单元对应的训练样本集包括在所述目标应用程序上的注册时长满足所述时间单元对应的注册时长的各个注册对象各自对应的训练样本，所述注册对象对应的训练样本中包括所述注册对象的特征数据、以及根据所述注册对象在所述时间单元对应的注册时长内的目标行为产生情况生成的目标行为标注数据；

针对每个所述时间单元，根据所述时间单元对应的目标行为参考概率，确定在所述时间单元对应的参考时长内所述目标对象的目标行为产生概率。

本申请第二方面提供了一种数据处理装置，所述装置包括：

数据获取模块，用于获取注册目标应用程序的目标对象的特征数据；

第一预测模块，用于通过目标行为预测模型，根据所述目标对象的特征数据，确定多个时间单元各自对应的目标行为参考概率；所述目标行为预测模型是基于所述多个时间单元各自对应的训练样本集训练的，所述时间单元对应的训练样本集包括在所述目标应用程序上的注册时长满足所述时间单元对应的注册时长的各个注册对象各自对应的训练样本，所述注册对象对应的训练样本中包括所述注册对象的特征数据、以及根据所述注册对象在所述时间单元对应的注册时长内的目标行为产生情况生成的目标行为标注数据；

第二预测模块，用于针对每个所述时间单元，根据所述时间单元对应的目标行为参考概率，确定在所述时间单元对应的参考时长内所述目标对象的目标行为产生概率。

本申请第三方面提供了一种设备，所述设备包括处理器以及存储器：

所述存储器用于存储计算机程序；

所述处理器用于根据所述计算机程序，执行上述第一方面所述的数据处理方法的步骤。

本申请第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行上述第一方面所述的数据处理方法的步骤。

本申请第五方面提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述第一方面所述的数据处理方法的步骤。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请实施例提供了一种数据处理方法，该方法采用基于生存分析理论训练得到的目标行为预测模型，根据注册目标应用程序的目标对象的特征数据，预测在多种不同长度的观察窗口内该目标对象通过该目标应用程序产生目标行为的概率。生存分析理论是用于预测感兴趣事件发生时间的统计方法，其特别适合处理存在删失(如因观察窗口有限而尚未发生感兴趣事件)的数据；本申请实施例基于生存分析理论的思想，充分地利用了目标应用程序上所有注册对象在其注册时长满足的各个观察窗口内的目标行为产生数据，对目标行为预测模型进行训练，对于新上线的目标应用程序来说，如此实现了在训练目标行为预测模型时充分地利用所有训练样本的所有观察窗口，从而可以最大程度地保证训练得到的目标行为预测模型具有较好的模型性能，能够较准确地预测对象通过目标应用程序产生目标行为的概率。此外，通过上述方式训练得到的目标行为预测模型，可以预测对象在不同长度的观察窗口内产生目标行为的概率，使得目标行为的预测不再局限于固定长度的观察窗口，更符合实际应用需求。

附图说明

图1为应用程序上线初期的观察窗口示意图；

图2为本申请实施例提供的数据处理方法的应用场景示意图；

图3为本申请实施例提供的数据处理方法的流程示意图；

图4为本申请实施例提供的一种目标行为预测模型的工作原理示意图；

图5为本申请实施例提供的一种示例性的全连接网络结构的示意图；

图6为本申请实施例提供的循环神经网络结构的工作原理示意图；

图7为本申请实施例提供的一种示例性的预测单元的结构示意图；

图8为本申请实施例提供的另一种目标行为预测模型的工作原理示意图；

图9为本申请实施例提供的目标行为预测模型的训练方法的流程示意图；

图10为本申请实施例提供的模型测试结果的示意图；

图11为本申请实施例提供的第一种数据处理装置的结构示意图；

图12为本申请实施例提供的第二种数据处理装置的结构示意图；

图13为本申请实施例提供的第三种数据处理装置的结构示意图；

图14为本申请实施例提供的第四种数据处理装置的结构示意图；

图15为本申请实施例提供的终端设备的结构示意图；

图16为本申请实施例提供的服务器的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

本申请实施例提供的方案涉及人工智能技术，具体通过如下实施例进行说明：(需要说明的是，在本申请实施例中用户又可以被称为对象，即本申请实施例中提及的目标对象与目标用户是等同的，注册用户与注册对象是等同的)

应用程序上线时，该应用程序的后台管理侧通常会利用该应用程序上线初期积累的目标行为产生数据，训练用于预测用户产生目标行为的概率的模型，从而利用该模型针对注册该应用程序的新用户预测其产生目标行为的概率，以便后续将该概率作为其它事件的参考因素。例如，新游(即新上线的游戏应用程序)上线时，新游后台侧会利用该游戏应用程序上线初期积累的用户付费行为数据，训练用于预测用户产生付费行为的概率的模型，后续可以利用该模型针对注册该游戏应用程序的新用户预测其产生付费行为的概率，并利用该概率指导该游戏应用程序上的广告投放。

图1所示为应用程序上线初期的观察窗口示意图。假设应用程序于X日上线，且当前已上线N(N为大于1的整数)天，相应地，该应用程序上注册日期不同的用户对应的观察窗口长度不同。如图1所示，对于在X日注册该应用程序的用户来说，其当前具有N天的观察窗口；对于在X+1日注册该应用程序的用户来说，其当前具有N-1天的观察窗口；而对于在X+N-1日注册该应用程序的用户来说，其当前仅具有1天的观察窗口。如果不加区分地将该应用程序上所有注册用户的行为数据均作为训练数据，并以X+N-1日截止时用户是否产生目标行为作为对应的标签，那么基于此训练得到的模型会倾向于低估用户在注册该应用程序后N天内产生目标行为的概率，其原因在于在X+1日后注册该应用程序的用户的观察窗口的长度均小于N，而这些用户很可能在其实际对应的观察窗口外产生目标行为。

对于上述应用程序上线初期因用户注册该应用程序的时间不同而导致所使用的训练数据实际对应的观察窗口长度不同的问题，当前业界的主流做法是对齐观察窗口。常见的观察窗口对齐方式包括：选择最小窗口、选择最大窗口和选择中间窗口；选择最小窗口，即选择初始时间单元(即用户注册应用程序后的第一个时间单元)对应的注册时长作为观察窗口，如选择1天作为观察窗口，获取应用程序的所有注册用户在其注册当天产生的行为数据作为训练数据，并基于该训练数据训练得到用于预测用户注册1天内产生目标行为的概率的模型；选择最大窗口，即选择当前时间所属的时间单元(又可称为终止时间单元，即自应用程序上线开始算起在时间顺序上最靠后的时间单元)对应的注册时长作为观察窗口，如选择N天作为观察窗口，获取在该应用程序上线日注册该应用程序的用户产生的行为数据作为训练数据，并基于该训练数据训练得到用于预测用户注册N天内产生目标行为的概率的模型；选择中间窗口是上述两种方案的折中，即选择固定的观察窗口长度(大于初始时间单元对应的注册时长、且小于终止时间单元对应的注册时长)，利用应用程序上注册时间满足该观察窗口长度的用户在该观察窗口长度内产生的行为数据作为训练数据，并基于该训练数据训练得到用于预测用户在该观察窗口长度内产生目标行为的概率的模型。

然而，经本申请发明人研究发现，上述对齐观察窗口的方案无法实现对数据的有效利用。具体的，对数据的有效利用包括两个维度，即用户维度和窗口维度；选择最小窗口的方案可以使用到全部用户的行为数据，但是无法实现对所有窗口的利用；选择最大窗口的方案可以使用到全部的窗口，但是只能利用一小部分用户的行为数据；选择中间窗口的方案在用户维度和窗口维度上都会有所损失。在无法实现对数据的有效利用的情况下，训练得到的模型性能通常较差，难以准确地预测用户产生目标行为的概率；并且，上述对齐观察窗口的方案只能在固定的观察窗口内预测用户产生目标行为的概率，使用范围比较局限。

针对上述相关技术存在的问题，本申请实施例提供了一种数据处理方法，该方法能够针对新上线的应用程序，准确地预测其注册用户在多种长度的观察窗口内产生目标行为的概率。

具体的，在本申请实施例提供的数据处理方法中，先获取注册目标应用程序的目标对象的特征数据。然后通过目标行为预测模型，根据该目标对象的特征数据，确定多个时间单元各自对应的目标行为参考概率；此处的目标行为预测模型是基于多个时间单元各自对应的训练样本集训练的，时间单元对应的训练样本集包括在目标应用程序上的注册时长满足该时间单元对应的注册时长的各个注册对象各自对应的训练样本，注册对象对应的训练样本中包括注册对象的特征数据、以及根据注册对象在该时间单元对应的注册时长内的目标行为产生情况生成的目标行为标注数据。进而，针对每个时间单元，根据该时间单元对应的目标行为参考概率，确定在该时间单元对应的参考时长内该目标对象的目标行为产生概率。

上述数据处理方法中采用的目标行为预测模型是基于生存分析理论训练得到的，生存分析理论是用于预测感兴趣事件发生时间的统计方法，其特别适合处理存在删失(如因观察窗口有限而未观察到感兴趣事件发生)的数据；相比相关技术中为了对齐观察窗口而将用户的行为数据截断的处理方式，本申请实施例基于生存分析理论的思想训练目标行为预测模型时，无需对用户的行为数据进行截断，可以充分利用目标应用程序上所有注册用户在其注册时长满足的各个观察窗口内的目标行为产生数据，对目标行为预测模型进行训练，即实现了对所有训练样本的所有观察窗口的充分利用，如此可以最大程度地保证训练得到的目标行为预测模型具有较好的模型性能，能够较准确地预测用户通过目标应用程序产生目标行为的概率。此外，通过上述方式训练得到的目标行为预测模型可以预测用户在不同长度的观察窗口内产生目标行为的概率，使得目标行为的预测不再局限于固定长度的观察窗口，更符合实际应用需求。

应理解，本申请实施例提供的数据处理方法可以应用于具备数据处理能力的电子设备，如终端设备或服务器。其中，终端设备具体可以为计算机、智能手机、平板电脑、个人数字助理(Personal Digital Assitant，PDA)等；服务器具体可以为应用服务器或Web服务器，实际部署时，可以为独立服务器，也可以为集群服务器或云服务器。

为了便于理解本申请实施例提供的数据处理方法，下面以本申请实施例提供的数据处理方法的执行主体为服务器为例，对该数据处理方法的应用场景进行示例性介绍。

参见图2，图2为本申请实施例提供的数据处理方法的应用场景示意图。如图2所示，该应用场景中包括服务器210和数据库220，服务器210可以通过网络从数据库220中调取所需的特征数据，或者数据库220也可以集成在服务器210中。其中，服务器210为新上线的目标应用程序的后台服务器，其用于执行本申请实施例提供的数据处理方法；数据库220用于存储该目标应用程序的注册用户的特征数据。

在实际应用中，针对注册目标应用程序的目标用户预测其通过目标应用程序产生目标行为的概率时，服务器210可以从数据库220中调取该目标用户的特征数据；此处目标用户的特征数据例如可以包括该目标用户注册该目标应用程序时预留的基本信息(如年龄、性别、职业、爱好等)，也可以包括该目标用户在其它关联应用程序上的目标行为产生数据，当然还可以包括其它类型的特征数据，本申请在此不对该特征数据做任何限定。

服务器210获取到目标用户的特征数据后，可以利用预先训练好的目标行为预测模型对该特征数据进行处理，从而获得该目标行为预测模型输出的多个时间单元各自对应的目标行为参考概率。此处的时间单元可以是按照预设的时间单元长度对目标应用程序的上线时长进行划分得到的，例如，假设目标应用程序已上线N天，若按照时间单元长度“天”对该目标应用程序的上线时长进行划分，将得到N个时间单元，即第1天、第2天、……、第N天。此处时间单元对应的目标行为参考概率可以用于表征在参考前提条件下目标用户在该时间单元内产生目标行为的概率；例如，时间单元对应的目标行为参考概率可以用于表征：在该时间单元的前一个时间单元内目标用户没有产生目标行为的条件下，该目标用户在该时间单元内产生目标行为的概率；又例如，时间单元对应的目标行为参考概率也可以用于表征：在该时间单元前的各个时间单元内目标用户均没有产生目标行为的条件下，该目标用户在该时间单元内产生目标行为的概率。

需要说明的是，上述目标行为预测模型是基于多个时间单元各自对应的训练样本集训练的，时间单元对应的训练样本集中包括在目标应用程序上的注册时长满足该时间单元对应的注册时长的各个注册用户各自对应的训练样本，注册用户对应的训练样本中包括该注册用户的特征数据、以及根据该注册用户在该时间单元对应的注册时长内的目标行为产生情况生成的目标行为标注数据。以上述多个时间单元分别为第1天、第2天、……、第N天为例；第1天对应的训练样本集应当包括在目标应用程序上的注册时长大于或者等于一天的各个注册用户各自对应的训练样本，该训练样本集中注册用户对应的训练样本中包括该注册用户的特征数据、以及根据该注册用户在其注册目标应用程序后一天内的目标行为产生情况生成的目标行为标注数据；第2天对应的训练样本集应当包括在目标应用程序上的注册时长大于或者等于两天的各个注册用户各自对应的训练样本，该训练样本集中注册用户对应的训练样本中包括该注册用户的特征数据、以及根据该注册用户在其注册目标应用程序后两天内的目标行为产生情况生成的目标行为标注数据；以此类推。

由于目标行为预测模型输出的时间单元对应的目标行为参考概率，通常表征的是在参考前提条件下目标用户在该时间单元内产生目标行为的概率，因此，服务器210可以对目标行为预测模型输出的时间单元对应的目标行为参考概率做进一步处理，得到该时间单元对应的参考时长内目标用户的目标行为产生概率。示例性的，时间单元对应的参考时长可以是该时间单元对应的注册时长，例如，对于时间单元“第2天”，该时间单元对应的注册时长应当为两天；相应地，在该时间单元对应的注册时长内目标用户的目标行为产生概率，所表征的是目标用户在其注册目标应用程序后两天内产生目标行为的概率。示例性的，时间单元对应的参考时长也可以是该时间单元本身，例如，对于时间单元“第2天”，该时间单元本身即是用户注册目标应用程序后的第2天；相应地，在该时间单元对应的注册时长内目标用户的目标行为产生概率，所表征的是目标用户在其注册目标应用程序后的第2天内产生目标行为的概率。当然，在实际应用中，服务器也可以直接将目标行为预测模型输出的时间单元对应的目标行为参考概率，作为该时间单元对应的参考时长内的目标行为产生概率。

应理解，图1所示的应用场景仅为示例，在实际应用中，除了可以由服务器210执行本申请实施例提供的数据处理方法外，还可以由相关终端设备执行本申请实施例提供的数据处理方法，在此不对本申请实施例提供的数据处理方法的应用场景做任何限定。

下面通过方法实施例对本申请提供的数据处理方法进行详细介绍。

参见图3，图3为本申请实施例提供的数据处理方法的流程示意图。为了便于描述，下述实施例仍以该数据处理方法的执行主体为服务器为例进行介绍。如图3所示，该数据处理方法包括以下步骤：

步骤301：获取注册目标应用程序的目标对象的特征数据。

服务器针对注册目标应用程序的目标对象(也可被称为目标用户)，预测其在特定的时间区间内通过该目标应用程序产生目标行为的概率时，需要先获取该目标对象的特征数据。

需要说明的是，本申请实施例中的目标应用程序可以为新上线的应用程序，新上线的应用程序是指上线时间短于预设上线时长的应用程序，该预设上线时长可以根据实际需求设定，例如可以为一个月、两个月、半年等等；该目标应用程序可以为各种类型的应用程序，例如游戏应用程序、即时通讯应用程序、多媒体播放应用程序、购物应用程序等等，本申请在此不对目标应用程序的类型做任何限定。本申请实施例中的目标行为可以为任意一种可以通过目标应用程序产生的操作行为，例如付费行为、点赞行为、分享行为等等，本申请在此也不对该目标行为做任何限定。本申请实施例中的目标对象(也即目标用户)可以为任一注册目标应用程序的用户；目标对象的特征数据是指能够反映该目标对象产生目标行为的特点的数据，例如目标对象在其它应用程序上的目标行为产生数据、目标对象的基本信息数据等等。

在一种可能的实现方式中，服务器可以通过以下方式获取目标对象的特征数据：获取该目标对象通过关联应用程序产生的目标行为数据，获取该目标对象注册目标应用程序时预留的基本信息数据，进而，将该目标行为数据和基本信息数据作为目标对象的特征数据。

具体实现时，服务器可以从关联应用程序的后台数据库中调取目标对象的目标行为数据；关联应用程序可以是与目标应用程序具有合作关系或关联关系的应用程序，目标应用程序的服务器具有访问该关联应用程序的后台数据库的权限。相应地，目标应用程序的服务器可以根据目标对象注册该目标应用程序时使用的个人身份信息(如手机号、身份证号、特定应用程序的账号等)，在关联应用程序的后台数据库中查找是否存在使用该个人身份信息在关联应用程序上注册的账号，若存在，则进一步从该关联应用程序的后台数据库中调取该账号通过该关联应用程序产生的目标行为数据，即该账号通过该关联应用程序产生目标行为时产生的行为记录数据。此外，目标应用程序的服务器还可以从自身的后台数据库中调取该目标对象注册该目标应用程序时预留的基本信息数据，如性别、年龄、籍贯、爱好、个人标签等等。进而，将所获取的目标对象通过关联应用程序产生的目标行为数据、和目标对象注册目标应用程序时预留的基本信息数据，作为该目标对象的特征数据。

如此，将目标对象在其它关联应用程序上的目标行为产生数据以及目标对象在目标应用程序上预留的基本信息数据，作为目标对象的特征数据，即作为预测该目标对象通过目标应用程序产生目标行为的概率的基础参考数据，能够有助于目标行为预测模型从这些特征数据中更好地学习目标对象产生目标行为的特点，从而更有助于保证预测结果的准确性。

应理解，在实际应用中，目标对象的特征数据可以仅包括上述通过关联应用程序产生的目标行为数据和基本信息数据中的任意一种，或者，目标对象的特征数据也可以包括其它能够反映目标对象产生目标行为的特点的特征数据，本申请在此不对目标对象的特征数据做任何限定。

步骤302：通过目标行为预测模型，根据所述目标对象的特征数据，确定多个时间单元各自对应的目标行为参考概率；所述目标行为预测模型是基于所述多个时间单元各自对应的训练样本集训练的，所述时间单元对应的训练样本集包括在所述目标应用程序上的注册时长满足所述时间单元对应的注册时长的各个注册对象各自对应的训练样本，所述注册对象对应的训练样本中包括所述注册对象的特征数据、以及根据所述注册对象在所述时间单元对应的注册时长内的目标行为产生情况生成的目标行为标注数据。

服务器获取到目标对象的特征数据后，可以将该目标对象的特征数据输入预先训练好的目标行为预测模型，该目标行为预测模型通过对所输入的特征数据进行分析处理，将相应地输出多个时间单元各自对应的目标行为参考概率。

此处的多个时间单元可以是按照预设的时间单元长度对目标应用程序的上线时长进行划分得到的；例如，假设目标应用程序的上线时长为N(N为大于1的整数)天，按照预设的时间单元长度“天”对该上线时长进行划分，将得到N个时间单元，分别是第1天、第2天、……、第N天；当然，上述预设的时间单元长度也可以根据实际需求设置为其它时间长度，如一个小时、一周等等，本申请在此不对时间单元的时间长度做任何限定。此处的时间单元对应的目标行为参考概率是指在参考前提条件下目标对象在该时间单元内产生目标行为的概率，该参考前提条件例如可以为目标对象在该时间单元的前一个时间单元内不产生目标行为，该参考前提条件又例如可以为目标对象在该时间单元前的各个时间单元内均不产生目标行为；以多个时间单元分别为第1天、第2天、……、第N天为例，第i(i为大于等于1、且小于等于N的整数)天对应的目标行为参考概率用于表征在参考前提条件下目标对象在第i天内产生目标行为的概率，该参考前提条件可以是目标对象在第i-1天内不产生目标行为，该参考前提条件也可以是目标对象在第1天到第i-1天均不产生目标行为。

需要说明的是，上述目标行为预测模型是基于多个时间单元各自对应的训练样本集训练得到的，时间单元对应的训练样本集中包括在目标应用程序上的注册时长满足该时间单元对应的注册时长的各个注册对象(也即注册用户)各自对应的训练样本，注册对象对应的训练样本中包括该注册对象的特征数据、以及根据该注册对象在该时间单元对应的注册时长内的目标行为产生情况生成的目标行为标注数据。仍以多个时间单元分别为第1天、第2天、……、第N天为例，目标行为预测模型是基于第1天对应的训练样本集、第2天对应的训练样本集、……、第N天对应的训练样本集训练得到的；第i天对应的训练样本集中包括在目标应用程序上的注册时长大于或等于i天(第i天对应的注册时长即为i天)的各个注册对象各自对应的训练样本，该训练样本集中注册对象对应的训练样本包括该注册对象的特征数据、以及根据该注册对象在其注册目标应用程序后的i天内通过该目标应用程序产生目标行为的情况生成的目标行为标注数据。下文将通过另一实施例对该目标行为预测模型的训练方法进行详细介绍。

在一种可能的实现方式中，目标行为预测模型可以包括特征表示层、循环建模层和输出预测层，该目标行为预测模型具体工作时，可以先通过特征表示层，根据目标对象的特征数据确定对象特征表示向量；然后，通过循环建模层，根据对象特征表示向量确定多个时间单元各自对应的状态表示向量；进而，通过输出预测层，针对每个时间单元，根据该时间单元对应的状态表示向量确定该时间单元对应的目标行为参考概率。

图4所示为本申请实施例提供的一种目标行为预测模型的工作原理示意图。如图4所示，该目标行为预测模型包括特征表示层、循环建模层和输出预测层；其中，特征表示层用于基于输入的特征数据学习对象特征表示向量；循环建模层用于基于对象特征表示向量，建模对象注册目标应用程序后的每个时间单元的用户状态，即每个时间单元对应的状态表示向量；输出预测层用于基于循环建模层建模的状态表示向量，预测对象注册目标应用程序后的每个时间单元对应的目标行为参考概率。

应理解，若以天作为时间单元长度，自目标应用程序上线的第2天起即可训练并部署上述目标行为预测模型；具体的，目标应用程序上线的第2天可以训练观察窗口长度为一天的目标行为预测模型，该目标行为预测模型可以预测用户注册该目标应用程序后的第1天对应的目标行为参考概率；目标应用程序上线的第3天可以训练观察窗口长度为一天和两天的目标行为预测模型，该目标行为预测模型可以预测用户注册该目标应用程序后的第1天对应的目标行为参考概率、以及注册该目标应用程序后的第2天对应的目标行为参考概率；以此类推。

下面对上述目标行为预测模型中的特征表示层、循环建模层和输出预测层的工作原理分别进行介绍。

作为一种示例，特征表示层可以包括全连接网络结构、卷积神经网络结构和图神经网络结构中的至少一种，特征表示层中包括的网络结构类型通常取决于目标行为预测模型所需处理的特征数据。当特征数据中包括结构化特征数据时，可以通过全连接网络结构，根据该结构化特征数据确定对象特征表示向量；当特征数据中包括目标类型的特征数据(例如图像特征数据和文本特征数据中的至少一种)时，可以通过卷积神经网络结构，根据该目标类型的特征数据确定对象特征表示向量；当特征数据中包括社交关系特征数据时，可以通过图神经网络结构，根据该社交关系特征数据确定对象特征表示向量。

结构化特征数据是指具有特定结构的特征数据，例如，将各项个人基本信息数据相应地填充至预先构建的特征数据结构的各个字段中，即可得到具有特定结构的特征数据，即结构化特征数据。对于该种结构化特征数据，通常适合采用全连接网络结构对其进行处理，学习对象特征表示向量。图5所示为一种示例性的全连接网络结构的示意图，其中包括三层全连接神经网络，假设输入的特征数据为x，该全连接网络结构输出的对象特征表示向量为u，则二者的函数关系具体可以表现为式(1)：

u＝σ₃(σ₂(σ₁(x))) (1)

其中，σ_i是第i层全连接神经网络的函数表达式；其具体可以表现为式(2)：

σ_i(x)＝Relu(W_iv+b_i) (2)

其中，v是上一层全连接神经网络的输出，W_i和b_i分别是第i层全连接神经网络的权重和偏置参数，Relu是激活函数，在实际应用中，全连接神经网络也可以采用其它激活函数，如Sigmoid等。

目标类型的特征数据可以是图像特征数据和文本特征数据中的至少一种，对于该种目标类型的特征数据，通常适合采用卷积神经网络结构对其进行处理，以从中学习对象特征表示向量。特征数据中的图像特征数据可以是目标对象的头像、目标对象通过目标应用程序支持的社交平台发表的图像等，特征数据中的文本特征数据可以是目标对象的个性签名、目标对象通过目标应用程序支持的社交平台发表的文本等，本申请在此不对特征数据中的图像特征数据和文本特征数据做任何限定。

社交关系特征数据可以表征目标对象在目标应用程序支持的社交平台上与其他对象之间的关联关系，对于社交关系特征数据，通常适合采用图神经网络结构对其进行处理，以从中学习对象特征表示向量。

应理解，当特征数据同时包括结构化特征数据、目标类型的特征数据和社交关系特征数据中的任意两种或三种时，目标行为预测模型可以将对应的网络结构构建的对象特征向量拼接融合起来，作为循环建模层的输入，如此实现对于多维度的特征数据的融合。

上述特征表示层可以支持处理多种不同类型的特征数据，即支持基于不同类型的特征数据构建对应的对象特征表示向量，可以实现多维度的对象特征表示向量的构建，从而保证构建的对象特征表示向量能够更充分地反映目标对象产生目标行为的特点。

当然，在实际应用中，上述特征表示层除了可以采用全连接网络结构、卷积神经网络结构和图神经网络结构外，还可以采用其它模型结构，例如transformer结构、DIN(DeepInterest Network)模型结构等；本申请在此不对特征表示层的模型结构做具体限定。甚至在一些情况下，可以不使用特征表示层对特征数据进行特征提取处理，即目标行为预测模型中不包括特征表示层，而直接将特征数据作为循环建模层的输入。

作为一种示例，循环建模层可以包括多个状态建模单元，多个状态建模单元与多个时间单元之间一一对应；循环建模层具体工作时，可以通过第i个状态建模单元，根据对象特征表示向量以及第i-1个状态建模单元建模得到的状态表示向量中的至少一个，确定第i个时间单元对应的状态表示向量；此处的i为大于或等于1的整数。当i等于1时，第i个状态建模单元用于根据对象特征表示向量确定第i个时间单元对应的状态表示向量；当i大于1时，第i个状态建模单元用于根据对象特征表示向量和第i-1个状态建模单元建模得到的状态表示向量确定第i个时间单元对应的状态表示向量，或者用于根据第i-1个状态建模单元建模得到的状态表示向量确定第i个时间单元对应的状态表示向量。

循环建模层具体可以为循环神经网络(RecurrentNeural Network，RNN)结构，该循环神经网络结构的工作原理可以如图6中的(a)或(b)所示。

当循环建模层基于图6中(a)所示的原理工作时，循环建模层中的第1个状态建模单元需要根据特征表示层输出的对象特征表示向量，建模第1个时间单元对应的状态表示向量；循环建模层中除第1个状态建模单元以外的其它状态建模单元，需要根据特征表示层输出的对象特征表示向量和前一个状态建模单元建模得到的状态表示向量，建模与该状态建模单元对应的时间单元对应的状态表示向量。该循环建模层的函数关系表现为式(3)和式(4)：

h_i＝Relu(W_r(h_i-1⊙u)+b_r) (3)

y_i＝Relu(W_yh_i+b_y) (4)

其中，⊙表示向量拼接操作，初始的h_-1为零向量；h_i是目标对象注册目标应用程序后的第i个时间单元的状态向量，也可以理解为第i个时间单元对应的状态表示向量；u为对象特征表示向量；y_i是通过全连接网络层对h_i进行处理，得到的第i个时间单元对应的状态表示向量的编码输出，在很多情况下，也可以不对h_i进行编码处理直接输出该h_i，h_i和y_i均可被视为第i个时间单元对应的状态表示向量。W_r和b_r、以及W_y和b_y均是循环建模层的模型参数。

当循环建模层基于图6中(b)所示的原理工作时，循环建模层中的第1个状态建模单元需要根据特征表示层输出的对象特征表示向量，建模第1个时间单元对应的状态表示向量；循环建模层中除第1个状态建模单元以外的其它状态建模单元，需要根据该状态建模单元的前一个状态建模单元建模得到的状态表示向量，建模与该状态建模单元对应的时间单元对应的状态表示向量。该循环建模层的函数关系表现为式(5)和式(6)：

y_i＝Relu(W_yh_i+b_y) (6)

式(5)和式(6)中各项参数所表示的含义与式(3)和式(4)中相同，详细可参见对于式(3)和式(4)中各项参数的解释。

在实际应用中，上述循环神经网络具体可以采用门控循环单元(Gated RecurrentUnit，GRU)、长短期记忆网络(Long Short Term Memory，LSTM)等实现，本申请在此不对该循环神经网络做任何限定。

如此，通过上述循环建模层建模对象在各个时间单元内的状态表示向量，可以保证建模得到的状态表示向量能够准确地表征对象在该时间单元内的状态，进而保证后续基于该状态表示向量可以准确地预测对象在该时间单元内产生目标行为的概率。

作为一种示例，输出预测层可以包括多个预测单元，这多个预测单元与循环建模层中包括的多个状态建模单元一一对应；其中，每个预测单元可以包括多层全连接神经网络，图7所示为一种示例性的预测单元的结构，其中包括两层全连接神经网络和一个神经元。该预测单元的输入为循环建模层中与其对应的状态建模单元输出的时间单元各自对应的状态表示向量(h_i或者y_i)，该预测单元的输出为该时间单元对应的目标行为参考概率P_i。图7所示的预测单元的函数关系表现为式(7)和式(8)：

y_i′＝Relu(W_oy_i+b_o) (7)

P_i＝Sigmoid(W_py_i′+b_p) (8)

其中，y_i′为经全连接神经网络对时间单元对应的状态表示向量进行处理得到的结果；W_o和b_o、以及W_p和b_p均是预测单元的模型参数。

当然，在实际应用中，该输出预测层的结构也可以根据实际情况设定，例如，可以使输出预测层中每个预测单元只包括1个神经元，实现对于目标行为参考概率的直接预测；又例如，可以采用注意力机制，对多个时间单元各自对应的状态表示向量进行加权预测。本申请在此不对该输出预测层的结构做任何限定。

上述目标行为预测模型结合循环神经网络结构，在时间维度上将各时间单元内对象的状态融合起来，可以充分地学习利用目标对象的特征数据，从而保证预测出的目标行为参考概率具有较高的准确性。

在另一种可能的实现方式中，目标行为预测模型可以包括特征表示层和输出预测层，该输出预测层包括多个预测单元，这多个预测单元与多个时间单元之间一一对应；该目标行为预测模型具体工作时，可以先通过特征表示层，根据目标对象的特征数据确定对象特征表示向量；然后，针对每个时间单元，通过输出预测层中与该时间单元对应的预测单元，根据对象特征表示向量，确定该时间单元对应的目标行为参考概率。

图8所示为本申请实施例提供的另一种目标行为预测模型的工作原理示意图。如图8所示，该目标行为预测模型包括特征表示层和输出预测层；其中，特征表示层用于基于输入的特征数据学习对象特征表示向量；输出预测层用于基于所构建的对象特征表示向量，预测目标对象注册目标应用程序后的每个时间单元对应的目标行为参考概率。

图8所示的目标行为预测模型中的特征表示层的工作原理与图4所示的目标行为预测模型中的特征表示层的工作原理相同，详细可参见上文中对于特征表示层的工作原理的介绍内容，此处不再赘述。

图8所示的目标行为预测模型中的输出预测层中包括多个预测单元，这多个预测单元与多个时间单元之间具有一一对应的关系。示例性的，输出预测层中的每个预测单元具体可以是全连接网络结构，该全连接网络结构可以根据特征表示层输出的对象特征表示向量，相应地预测与该全连接网络结构对应的时间单元对应的目标行为参考概率。

上述目标行为预测模型结构简单，在实际应用中便于训练和部署，可以在极大程度上提高模型训练的效率和模型部署的效率，并且可以在一定程度上保证所预测的目标行为参考概率的准确性。

应理解，在实际应用中，上述目标行为预测模型还可以表现为其它模型结构，本申请在此不对该目标行为预测模型的模型结构做具体限定。

步骤303：针对每个所述时间单元，根据所述时间单元对应的目标行为参考概率，确定在所述时间单元对应的参考时长内所述目标对象的目标行为产生概率。

服务器通过目标行为预测模型，得到多个时间单元各自对应的目标行为参考概率后，可以进一步针对每个时间单元，根据该时间单元对应的目标行为参考概率，确定在该时间单元对应的参考时长内目标对象的目标行为产生概率。此处的时间单元对应的参考时长可以为时间单元本身对应的时间区间，例如，对于时间单元“第i天”，该时间单元对应的参考时长可以为目标对象注册目标应用程序后的第i天；此处的时间单元对应的参考时长也可以为该时间单元对应的注册时长，例如，对于时间单元“第i天”，该时间单元对应的参考时长可以为目标对象注册目标应用程序后的i天内。

在一种可能的实现方式中，若时间单元对应的目标行为参考概率用于表征在参考前提条件下目标对象在该时间单元内产生目标行为的概率，并且该参考前提条件为目标对象在该时间单元的前一个时间单元内不产生目标行为，则服务器可以通过以下方式确定在该时间单元对应的参考时长内目标对象的目标行为产生概率：根据该时间单元对应的目标行为参考概率、以及时间顺序上位于该时间单元前的各个参考时间单元各自对应的目标行为参考概率，确定第一目标行为产生概率和第二目标行为产生概率中的至少一种；其中，第一目标行为产生概率用于表征目标对象对应的目标行为首次产生时间属于该时间单元的概率，该目标行为首次产生时间是目标对象通过目标应用程序首次产生目标行为的时间；第二目标行为产生概率用于表征目标对象在该时间单元对应的注册时长内通过目标应用程序产生目标行为的概率。

示例性的，假设第i个时间单元对应的目标行为参考概率为P_i，该目标行为参考概率P_i用于表征在第i-1个时间单元内目标对象不产生目标行为的前提条件下目标对象在第i个时间单元内产生目标行为的概率；则服务器可以通过式(9)计算该第i个时间单元对应的第一目标行为产生概率：

其中，P_pay-on-i-day为第i个时间单元对应的第一目标行为产生概率，其用于表征目标对象通过目标应用程序首次产生目标行为的时间属于该第i个时间单元的概率，即目标对象在前i-1个时间单元内均未产生目标行为、而在第i个时间单元内产生目标行为的概率。

服务器可以通过式(10)计算该第i个时间单元对应的第二目标行为产生概率：

其中，P_{pay-within-i-days}为第i个时间单元对应的第二目标行为产生概率，其用于表征目标对象在其注册目标应用程序后的i天内产生目标行为的概率。

通过上述方式计算得到的第一目标行为产生概率和第二目标行为产生概率，在实际应用中通常具有较高的参考价值，能够为目标应用程序上与目标行为相关的事件提供重要的参考数据。例如，对于新上线的游戏应用程序来说，通过上述方式计算得到的对象在特定的时间单元内产生付费行为的概率、以及对象在特定的注册时长内产生付费行为的概率，均对该游戏应用程序上的广告投放具有较高的参考价值。

在另一种可能的实现方式中，若时间单元对应的目标行为参考概率用于表征在参考前提条件下目标对象在该时间单元内产生目标行为的概率，并且该参考前提条件为目标对象在该时间单元前的各个参考时间单元内均不产生目标行为，则服务器可以直接将该时间单元对应的目标行为参考概率，作为在该时间单元对应的参考时长内目标对象的目标行为产生概率(也即上文中的第一目标行为产生概率)。

可选的，服务器还可以根据实际需求，基于在该时间单元对应的参考时长内目标对象的目标行为产生概率，推导计算目标对象在该时间单元对应的注册时长内的目标行为产生概率(也即上文中的第二目标行为产生概率)。

当然，在实际应用中，服务器还可以采用其它方式，根据时间单元对应的目标行为参考概率，确定在该时间单元对应的参考时长内目标对象的目标行为产生概率，本申请在此不对根据目标行为参考概率确定目标行为产生概率的实现方式做任何限定。

针对图3所示实施例中使用的目标行为预测模型，本申请实施例还提供了一种该目标行为预测模型的训练方法，下面通过方法实施例对该目标行为预测模型的训练方法进行详细介绍。

参见图9，图9为本申请实施例提供的目标行为预测模型的训练方法的流程示意图。为了便于描述，下述实施例以该目标行为预测模型的训练方法的执行主体为服务器为例进行介绍；应理解，在实际应用中，该目标行为预测模型的训练方法也可以由终端设备执行。如图9所示，该目标行为预测模型的训练方法包括以下步骤：

步骤901：获取所述多个时间单元各自对应的训练样本集，每个所述时间单元对应的训练样本集中包括多个训练样本。

服务器针对新上线的目标应用程序训练其适用的目标行为预测模型时，需要基于该目标应用程序上的注册对象的目标行为产生数据，构建训练目标行为预测模型时使用的多个时间单元各自对应的训练样本集，其中每个时间单元对应的训练样本集中均包括多个训练样本。

正如图3所示实施例提及的，上述多个时间单元可以是按照预设的时间单元长度对目标应用程序的上线时长进行划分得到的；例如，假设目标应用程序当前的上线时长为N(N为大于1的整数)天，按照预设的时间单元长度“天”对该上线时长进行划分，将得到N个时间单元，分别是第1天、第2天、……、第N天。在实际应用中，上述预设的时间单元长度也可以根据实际需求设置为其它时间长度，如一个小时、一周等等，本申请在此不对时间单元的时间长度做任何限定。

时间单元对应的训练样本集中包括在目标应用程序上的注册时长满足该时间单元对应的注册时长的各个注册对象各自对应的训练样本，注册对象对应的训练样本中包括该注册对象的特征数据、以及根据该注册对象在该时间单元对应的注册时长内的目标行为产生情况生成的目标行为标注数据。以多个时间单元分别为第1天、第2天、……、第N天为例，第i(i为大于等于1、且小于等于N的整数)天对应的训练样本集中包括在目标应用程序上的注册时长大于或等于i天的各个注册对象各自对应的训练样本，注册对象对应的训练样本中包括该注册对象的特征数据以及根据该注册对象在其注册目标应用程序后的i天内的目标行为产生情况生成的目标行为标注数据。

训练样本中包括的注册对象的特征数据，与上文中介绍的目标对象的特征数据相类似，其是能够反映该注册对象产生目标行为的特点的数据，例如注册对象在与目标应用程序相关的关联应用程序上的目标行为产生数据、注册对象注册目标应用程序时预留的信息数据等等。

训练样本中包括的目标行为标注数据，可以包括目标行为产生标签和目标行为时间标签，该目标行为产生标签用于表征在时间单元对应的注册时长内该注册对象是否产生过目标行为；若该目标行为产生标签表征在该时间单元对应的注册时长内该注册对象产生过目标行为，则该目标行为时间标签为该注册对象通过该目标应用程序首次产生目标行为的时间所属的时间单元；若该目标行为产生标签表征在该时间单元对应的注册时长内该注册对象没有产生过目标行为，则该目标行为时间标签为该时间单元本身。

为了便于理解上述训练样本的表现形式，下面对该训练样本的表现形式进行示例性介绍。第i个时间单元对应的训练样本集中的训练样本具体可以表现为D＝{(x,p,t)}；其中，x为注册对象的特征数据；p为目标行为产生标签p∈{0,1}，t为目标行为时间标签；p＝1表示注册对象在第i个时间单元对应的注册时长内产生过目标行为，此时t是注册对象首次通过目标应用程序产生目标行为的时间所属的时间单元，例如，若该注册对象在其注册目标应用程序后的第j个时间单元内首次产生目标行为，则t应当等于j，j是小于或等于i的整数；p＝0表示注册对象在第i个时间单元对应的注册时长内未产生过目标行为，此时t等于i。

上述表现形式的训练样本体现了本申请训练目标行为预测模型时采用了生存分析理论，即本申请在训练目标行为预测模型时未对对象的目标行为产生数据进行截断，而是充分地利用了所有训练样本的所有观察窗口，从而保证训练得到的目标行为预测模型具有较优的模型性能。

步骤902：通过待训练的目标行为预测模型，根据所述训练样本中包括的所述注册对象的特征数据，确定所述多个时间单元各自对应的目标行为预测参考概率；并且针对每个所述时间单元，根据所述时间单元对应的目标行为预测参考概率，确定在所述时间单元对应的参考时长内所述注册对象的目标行为预测产生概率，作为所述时间单元对应的目标行为预测产生概率。

服务器获取到多个时间单元各自对应的训练样本集后，可以针对训练样本集中包括的训练样本，通过待训练的目标行为预测模型，根据该训练样本中包括的注册对象的特征数据，确定多个时间单元各自对应的目标行为预测参考概率。进而，针对每个时间单元，根据该时间单元对应的目标行为预测参考概率，确定在该时间单元对应的参考时长内该注册对象的目标行为预测产生概率，并将其作为该时间单元对应的目标行为预测产生概率。

应理解，待训练的目标行为预测模型是已搭建好模型结构、但模型性能尚未达到预设标准的模型，本申请实施例旨在采用多个时间单元各自对应的训练样本集对该待训练的目标行为预测模型进行训练，调整该待训练的目标行为预测模型的模型参数，使得该待训练的目标行为预测模型的模型性能达到预设标准。该待训练的目标行为预测模型的工作原理与图3所示实施例中介绍的目标行为预测模型的工作原理相同，详细可参见上文中对图4和图8所示的目标行为预测模型的工作原理的介绍内容，此处不再赘述。

服务器对待训练的目标行为预测模型进行训练时，可以将训练样本集中的训练样本中包括注册对象的特征数据，输入该待训练的目标行为预测模型，该待训练的目标行为预测模型通过对该特征数据进行相应地分析处理后，会相应地输出多个时间单元各自对应的目标行为预测参考概率。该时间单元对应的目标行为预测参考概率用于表征参考前提条件下该注册对象在该时间单元内产生目标行为的预测概率，该参考前提条件例如可以为注册对象在该时间单元的前一个时间单元内不产生目标行为，该参考前提条件又例如可以为目标对象在该时间单元前的各个时间单元内均不产生目标行为。为了便于后续构建用于训练该待训练的目标行为预测模型的损失函数，服务器得到多个时间单元各自对应的目标行为预测参考概率后，可以进一步针对每个时间单元，根据该时间单元对应的目标行为预测参考概率，推导计算在该时间单元对应的参考时长内该注册对象的目标行为预测产生概率。

在一种可能的实现方式中，若时间单元对应的目标行为预测参考概率用于表征在参考前提条件下注册对象在该时间单元内产生目标行为的概率，且该参考前提条件为注册对象在该时间单元的前一个时间单元内不产生目标行为，则服务器可以通过以下方式在该时间单元对应的参考时长内注册对象的目标行为预测产生概率：根据该时间单元对应的目标行为预测参考概率、和时间顺序上位于该时间单元前的各个参考时间单元各自对应的目标行为预测参考概率，确定第一目标行为预测产生概率和第二目标行为预测产生概率；其中，第一目标行为预测产生概率用于表征该注册对象通过目标应用程序首次产生目标行为的时间属于该时间单元的预测概率，第二目标行为预测产生概率用于表征该注册对象在该时间单元对应的注册时长内通过目标应用程序产生目标行为的预测概率。

示例性的，假设第i个时间单元对应的目标行为预测参考概率为P_i，该目标行为预测参考概率P_i用于表征在第i-1个时间单元内注册对象不产生目标行为的前提条件下该注册对象在第i个时间单元内产生目标行为的预测概率；则服务器可以通过式(11)计算该第i个时间单元对应的第一目标行为预测产生概率：

其中，P_pay-on-i-day为第i个时间单元对应的第一目标行为预测产生概率，其用于表征注册对象通过目标应用程序首次产生目标行为的时间属于该第i个时间单元的预测概率，即注册对象在前i-1个时间单元内均未产生目标行为、而在第i个时间单元内产生目标行为的预测概率。

服务器可以通过式(12)计算该第i个时间单元对应的第二目标行为预测产生概率：

其中，P_{pay-within-i-days}为第i个时间单元对应的第二目标行为预测产生概率，其用于表征注册对象在其注册目标应用程序后的i天内产生目标行为的预测概率。

当然，在实际应用中，若时间单元对应的目标行为预测参考概率表征的是在其它参考前提条件下注册对象在该时间单元内产生目标行为的预测概率，则服务器可以采用相应的计算方式，根据该时间单元对应的目标行为预测参考概率，计算上述第一目标行为预测产生概率和第二目标行为预测产生概率；本申请在此不对时间单元对应的目标行为预测参考概率所表征的含义做任何限定，也不对第一目标行为预测产生概率和第二目标行为预测产生概率的计算方式做任何限定。

步骤903：针对每个所述时间单元，根据所述时间单元对应的目标行为预测产生概率以及所述训练样本中包括的所述目标行为标注数据，构建损失函数；基于所述损失函数，训练所述待训练的目标行为预测模型。

服务器通过上述操作，得到多个时间单元各自对应的目标行为预测产生概率后，可以针对每个时间单元，根据该时间单元对应的目标行为预测产生概率以及训练样本中包括的目标行为标注数据构建损失函数；进而，基于所构建的损失函数，对该待训练的目标行为预测模型进行训练，调整该待训练的目标行为预测模型的模型参数，使该待训练的目标行为预测模型的模型性能达到预设标准。

服务器具体训练该待训练的目标行为预测模型时，可以采用极大似然的思路，即使得基于待训练的目标行为预测模型确定的预测结果，与训练样本中包括的目标行为标注数据相符的概率最大。在训练样本中的目标行为标注数据包括目标行为产生标签和目标行为时间标签，且通过步骤902计算得到的时间单元对应的目标行为预测产生概率中包括第一目标行为预测产生概率和第二目标行为预测产生概率的情况下，服务器可以通过以下方式构建损失函数：

根据第二目标行为预测产生概率确定目标行为预测未产生概率；该目标行为预测未产生概率用于表征注册对象在时间单元对应的注册时长内通过该目标应用程序没有产生过目标行为的预测概率。进而，根据第一目标行为预测产生概率、目标行为预测未产生概率、目标行为产生标签和目标行为时间标签，构建该损失函数。

具体的，根据训练样本中包括的目标行为产生标签和目标行为时间标签，可以细分为两种情况。一种情况是注册对象在时间单元对应的注册时长内未产生过目标行为，即目标行为产生标签表征注册对象在时间单元对应的注册时长内未产生过目标行为的情况，此时，根据上述式(12)可以计算注册对象对应的目标行为预测未产生概率，计算公式如式(13)所示：

其中，P_unpay即为注册对象对应的目标行为预测未产生概率。

另一种情况是注册对象在时间单元对应的注册时长内产生过目标行为，即目标行为产生标签表征注册对象在时间单元对应的注册时长内产生过目标行为的情况，此时，可以直接利用通过上述式(11)计算得到的第一目标行为预测产生概率，即P_pay-on-i-day。

上述两种情况可以统一通过式(14)来表示：

其中，p和t分别为训练样本中目标行为标注数据中包括的目标行为产生标签和目标行为时间标签。

上述式(14)即为极大似然的表现形式，本申请实施例提供的方法旨在最大化式(14)的计算结果。考虑到最大化式(14)的计算结果难度较高，服务器可以确定式(14)的负对数作为训练待训练的目标行为预测模型时使用的损失函数，该损失函数具体表现为式(15)：

L(t,p)＝-(1-p)log P_unpay-p log P_pay-on-t-_daypay (15)

对待训练的目标行为预测模型进行训练时，可以将最小化该式(15)的计算结果作为优化目标。

在实际应用中，对待训练的目标行为预测模型的迭代训练次数达到预设次数阈值时，即可认为该待训练的目标行为预测模型已满足训练结束条件，可以将其作为图3所示实施例中的目标行为预测模型投入实际应用。又或者，服务器可以在对待训练的目标行为预测模型进行训练的过程中，采用测试样本对该待训练的目标行为预测模型的模型性能进行测试，若测试结果表示该待训练的目标行为预测模型的模型性能当前已达到预设标准，例如，基于该待训练的目标行为预测模型的预测结果计算得到的目标行为预测产生概率的准确度已到达预设准确度阈值，则也可以认为该待训练的目标行为预测模型已满足训练结束条件，可以将其作为图3所示实施例中的目标行为预测模型投入实际应用。本申请在此不对该目标行为预测模型的训练结束条件做任何限定。

上述目标行为预测模型的训练方法，基于生存分析理论对待训练的目标行为预测模型进行训练。鉴于生存分析理论是用于预测感兴趣事件发生时间的统计方法，其特别适合处理存在删失(如因观察窗口有限而未观察到感兴趣事件发生)的数据，因此，本申请实施例基于生存分析理论的思想训练目标行为预测模型时，无需对用户的行为数据进行截断，可以充分利用目标应用程序上所有注册用户在其注册时长满足的各个观察窗口内的目标行为产生数据，对目标行为预测模型进行训练，即实现了对所有训练样本的所有观察窗口的充分利用，如此可以最大程度地保证训练得到的目标行为预测模型具有较好的模型性能，能够较准确地预测用户通过目标应用程序产生目标行为的概率。此外，通过上述方式训练得到的目标行为预测模型可以预测用户在不同长度的观察窗口内产生目标行为的概率，使得目标行为的预测不再局限于固定长度的观察窗口，更符合实际应用需求。

为了便于进一步理解本申请实施例提供的技术方案，下面以本申请实施例提供的数据处理方法应用于针对注册新游的用户预测其产生付费行为的概率的场景为例，对本申请实施例提供的数据处理方法进行整体示例性介绍。

新游上线初期，游戏应用程序的后台服务器需要利用该游戏应用程序上线初期积累的用户的付费行为产生数据训练付费行为预测模型，该付费行为预测模型用于预测注册该游戏应用程序的用户在不同长度的观察窗口内产生付费行为的概率。该付费行为预测模型预测的预测结果，后续可以用于指导该游戏应用程序上的广告投放和优化。

训练该付费行为预测模型时，服务器需要先获取多个时间单元各自对应的训练样本集。以该游戏应用程序当前已上线N(N为大于1的整数)天为例，多个时间单元可以分别为第1天、第2天、……、第N天。第i(i为大于等于1、且小于等于N的整数)天对应的训练样本集包括在该游戏应用程序上的注册时长大于或等于i天的注册用户各自对应的训练样本，注册用户的训练样本具体表现为D＝{(x,p,t)}；其中，x是注册用户的特征数据；p是付费行为产生标签，若该注册用户在其注册该游戏应用程序后的i天内产生过付费行为，则p＝1，若该注册用户在其注册该游戏应用程序后的i天内没有产生过付费行为，则p＝0；t是付费行为时间标签，当p＝1时t用于表征注册用户首次产生付费行为时的注册天数，当p＝0时t用于该训练样本对应的观察窗口长度，即i天。

举个例子，注册用户的特征数据可以包括该注册用户在其它应用程序上的付费行为产生数据、以及该注册用户的标签、年龄、性别等个人基本信息数据。(p,t)＝(1,5)表示该注册用户在其注册该游戏应用程序后的第5天产生付费行为，(p,t)＝(0,5)表示该注册用户在其注册该游戏应用程序后的5天内均没产生过付费行为，且该训练样本对应的观察窗口长度为5天。

示例性的，所训练的付费行为预测模型的模型工作原理可以如图4所示。该付费行为预测模型包括特征表示层、循环建模层和输出预测层；其中，特征表示层用于基于输入的特征数据学习用户特征表示向量；循环建模层用于利用循环神经网络，建模用户自注册该游戏应用程序后的每一天的用户状态；输出预测层用于基于循环神经网络对用户状态的建模结果，预测用户自注册该游戏应用程序后的每一天产生付费行为的条件概率。

应理解，自该游戏应用程序上线第2天起，即可训练并部署该付费行为预测模型。具体的，该游戏应用程序上线第2天可以训练最大长度为一天的RNN模型，该模型可以预测用户注册该游戏应用程序后一天内产生付费行为的概率；该游戏应用程序上线第3天可以训练最大长度为两天的RNN模型，该模型可以预测用户注册该游戏应用程序后两天内的产生付费行为的概率；以此类推。

下面对上述特征表示层、循环建模层和输出预测层的工作原理分别进行详细介绍。

特征表示层具体可以表现为图5所示的全连接网络结构。该全连接网络结构中包括三层全连接神经网络，假设输入的特征数据为x，输出的用户特征表示向量(即上文中的对象特征表示向量)为u，二者之间的函数关系具体表现如下：

u＝σ₃(σ₂(σ₁(x)))

其中，σ_i是第i层全连接神经网络的函数表达式。其函数形式如下：

σ_i(x)＝Relu(W_iv+b_i)

全连接网络结构适合处理结构化特征数据，若特征数据中包括图像特征数据或者文本特征数据，可以采用卷积神经网络构成上述特征表示层，若特征数据中包括社交关系特征数据，可以采用图神经网络构成上述特征表示层。

循环建模层用于基于用户特征表示向量u，建模用户注册该游戏应用程序后各天的状态h₁、h₂、……、h_N。该循环建模层具体可以表现为图6中(a)所示的循环神经网络，该循环神经网络的函数关系具体表现如下：

h_i＝Relu(W_r(h_i-1⊙u)+b_r)

y_i＝Relu(W_yh_i+b_y)

其中，⊙表示向量拼接操作，初始的h-₁为零向量；h_i是用户注册游戏应用程序后的第i天的状态向量；y_i是基于用户隐含状态的编码输出。

输出预测层用于根据用户状态h_i或者y_i，预测用户在其注册该游戏应用程序后的第i天内的付费条件概率P_i；该付费条件概率P_i描述的物理意义是，用户在其注册该游戏应用程序后的第i-1天不产生付费行为的前提下，该用户在第i天产生付费行为的概率。该输出预测层常见的模型结构是采用全连接网络结构，如图7所示，但是该全连接网络结构的输出结果只有一个神经元，且激活函数是sigmoid。假设该全连接网络结构的输入是状态向量y_i，输出是P_i，二者之间的函数关系具体表现如下：

y_i′＝Relu(W_oy_i+b_o)

P_i＝Sigmoid(W_py_i′+b_p)

对于已经注册该游戏应用程序N天的注册用户来说，可以通过上述付费行为预测模型获得P₁、P₂、……、P_N。根据条件概率公式，可以通过下式计算该注册用户在其注册该游戏应用程序后的第i天首次产生付费行为的概率：

该注册用户在其注册该游戏应用程序后的前i天内产生付费行为的概率可以通过下式计算：

进而，服务器可以基于上述P_pay-on-i-day和P_{pay-within-i-days}，构建训练该付费行为预测模型时使用的损失函数，该损失函数是采用极大似然思路构建的，即训练样本中的注册用户产生付费行为的情况应该是概率最大的情况。

根据训练样本中注册用户产生付费行为的情况，可细分为以下两种情况：

情况1：注册用户在训练样本对应的观察窗口内未产生过付费行为，即p＝0；根据上述预测结果，推导得到的该注册用户不产生付费行为的概率如下：

情况2：注册用户在训练样本对应的观察窗口内产生过付费行为，且该注册用户首次产生付费行为的时间在其注册该游戏应用程序后的第t天，即(p,t)＝(1,t)；根据上述预测结果，可以确定用户在第t天首次产生付费行为的概率如下：

上述两种情况可以统一采用以下公式描述：

计算该公式的负对数，即可得到用于训练付费行为预测模型的损失函数，该损失函数具体表示如下：

L(t,p)＝-(1-p)log P_unpay-p log P_{pay-on-t-daypay}

对于该付费行为预测模型的训练过程，即是最小化该损失函数的过程。

本申请发明人采用了某新游上线9天内注册用户产生的付费行为数据，对本申请实施例提供的基于生存分析理论训练得到的付费行为预测模型和两种采用业界常规手段训练得到的付费行为预测模型进行训练和测试，得到的测试结果如图10所示。

其中，pay-survival是本申请实施例中基于生存分析理论训练得到的付费行为预测模型；pay-fullsamples是取1天作为观察窗口使用全部训练样本训练得到的付费行为预测模型，该模型的预测结果的真实物理含义是用户注册该新游后一天内产生付费行为的概率；pay-fullwindow是取9天作为观察窗口，只使用在新游上线的第1天注册的用户对应的训练样本训练得到的付费行为预测模型，该模型的预测结果的真实物理含义是用户注册该新游后九天内产生付费行为的概率。

根据图10所示的实验结果可以看出，以AUC(Area Under Curve)作为衡量指标，随着观察窗口长度的增加，pay-fullsamples和pay-fullwindow的模型效果下降的都非常明显，而pay-survival的模型效果的下降幅度远低于上述pay-fullsamples和pay-fullwindow，采用pay-survival进行付费行为预测的方案对多天观察窗口的预测效果相比其它方法至少提高20％。

针对上文描述的数据处理方法，本申请还提供了对应的数据处理装置，以使上述数据处理方法在实际中得以应用及实现。

参见图11，图11是与上文图3所示的数据处理方法对应的一种数据处理装置1100的结构示意图。如图11所示，该数据处理装置1100包括：

数据获取模块1101，用于获取注册目标应用程序的目标对象的特征数据；

第一预测模块1102，用于通过目标行为预测模型，根据所述目标对象的特征数据，确定多个时间单元各自对应的目标行为参考概率；所述目标行为预测模型是基于所述多个时间单元各自对应的训练样本集训练的，所述时间单元对应的训练样本集包括在所述目标应用程序上的注册时长满足所述时间单元对应的注册时长的各个注册对象各自对应的训练样本，所述注册对象对应的训练样本中包括所述注册对象的特征数据、以及根据所述注册对象在所述时间单元对应的注册时长内的目标行为产生情况生成的目标行为标注数据；

第二预测模块1103，用于针对每个所述时间单元，根据所述时间单元对应的目标行为参考概率，确定在所述时间单元对应的参考时长内所述目标对象的目标行为产生概率。

可选的，在图11所示的数据处理装置的基础上，所述时间单元对应的目标行为参考概率用于表征在参考前提条件下所述目标对象在所述时间单元内产生目标行为的概率，所述参考前提条件为所述目标对象在所述时间单元的前一个时间单元内不产生所述目标行为；则所述第二预测模块1103具体用于：

根据所述时间单元对应的目标行为参考概率、以及时间顺序上位于所述时间单元前的各个参考时间单元各自对应的目标行为参考概率，确定第一目标行为产生概率和第二目标行为产生概率中的至少一种；

其中，所述第一目标行为产生概率用于表征所述目标对象对应的目标行为首次产生时间属于所述时间单元的概率，所述目标行为首次产生时间是所述目标对象通过所述目标应用程序首次产生所述目标行为的时间；所述第二目标行为产生概率用于表征所述目标对象在所述时间单元对应的注册时长内通过所述目标应用程序产生所述目标行为的概率。

可选的，在图11所示的数据处理装置的基础上，参见图12，图12为本申请实施例提供的另一种数据处理装置1200的结构示意图。在数据处理装置1200中，所述目标行为预测模型包括特征表示层、循环建模层和输出预测层；则所述第一预测模块1102包括：

特征表示子模块1201，用于通过所述特征表示层，根据所述目标对象的特征数据，确定对象特征表示向量；

循环建模子模块1202，用于通过所述循环建模层，根据所述对象特征表示向量，确定所述多个时间单元各自对应的状态表示向量；

输出预测子模块1203，用于通过所述输出预测层，针对每个所述时间单元，根据所述时间单元对应的状态表示向量，确定所述时间单元对应的目标行为参考概率。

可选的，在图12所示的数据处理装置的基础上，所述循环建模层包括多个状态建模单元，所述多个状态建模单元与所述多个时间单元一一对应；则所述循环建模子模块1202具体用于：

通过第i个状态建模单元，根据所述对象特征表示向量以及第i-1个状态建模单元建模得到的状态表示向量中的至少一个，确定第i个时间单元对应的状态表示向量；所述i为大于或等于1的整数；

当所述i等于1时，所述第i个状态建模单元用于根据所述对象特征表示向量确定所述第i个时间单元对应的状态表示向量；当所述i大于1时，所述第i个状态建模单元用于根据所述对象特征表示向量和所述第i-1个状态建模单元建模得到的状态表示向量确定所述第i个时间单元对应的状态表示向量，或者，用于根据所述第i-1个状态建模单元建模得到的状态表示向量确定所述第i个时间单元对应的状态表示向量。

可选的，在图11所示的数据处理装置的基础上，参见图13，图13为本申请实施例提供的另一种数据处理装置1300的结构示意图。在数据处理装置1300中，所述目标行为预测模型包括特征表示层和输出预测层，所述输出预测层包括多个预测单元，所述多个预测单元与所述多个时间单元一一对应；则所述第一预测模块1102包括：

特征表示子模块1301，用于通过所述特征表示层，根据所述目标对象的特征数据，确定对象特征表示向量；

输出预测子模块1302，用于针对每个所述时间单元，通过所述输出预测层中与所述时间单元对应的预测单元，根据所述对象特征表示向量，确定所述时间单元对应的目标行为参考概率。

可选的，在图12或图13所示的数据处理装置的基础上，所述特征表示层包括全连接网络结构、卷积神经网络结构和图神经网络结构中的至少一种；则所述特征表示子模块具体用于执行以下至少一种操作：

当所述特征数据中包括结构化特征数据时，通过所述全连接网络结构，根据所述结构化特征数据确定所述对象特征表示向量；

当所述特征数据中包括目标类型的特征数据时，通过所述卷积神经网络结构，根据所述目标类型的特征数据确定所述对象特征表示向量；所述目标类型的特征数据包括以下至少一种：图像特征数据和文本特征数据；

当所述特征数据中包括社交关系特征数据时，通过所述图神经网络结构，根据所述社交关系特征数据确定所述对象特征表示向量。

可选的，在图11所示的数据处理装置的基础上，所述数据获取模块1101具体用于：

获取所述目标对象通过关联应用程序产生的目标行为数据；

获取所述目标对象注册所述目标应用程序时预留的基本信息数据；

将所述目标行为数据和所述个人基本信息数据，作为所述目标对象的特征数据。

可选的，在图11所示的数据处理装置的基础上，参见图14，图14为本申请实施例提供的另一种数据处理装置1400的结构示意图。如图14所示，该装置还包括：模型训练模块1401；所述模型训练模块1401包括：

样本获取子模块14011，用于获取所述多个时间单元各自对应的训练样本集，每个所述时间单元对应的训练样本集中包括多个训练样本；

数据处理子模块14012，用于通过待训练的目标行为预测模型，根据所述训练样本中包括的所述注册对象的特征数据，确定所述多个时间单元各自对应的目标行为预测参考概率；并且针对每个所述时间单元，根据所述时间单元对应的目标行为预测参考概率，确定在所述时间单元对应的参考时长内所述注册对象的目标行为预测产生概率，作为所述时间单元对应的目标行为预测产生概率；

模型训练子模块14013，用于针对每个所述时间单元，根据所述时间单元对应的目标行为预测产生概率以及所述训练样本中包括的所述目标行为标注数据，构建损失函数；基于所述损失函数，训练所述待训练的目标行为预测模型。

可选的，在图14所示的数据处理装置的基础上，所述目标行为标注数据包括目标行为产生标签和目标行为时间标签；所述目标行为产生标签用于表征在所述时间单元对应的注册时长内所述注册对象是否产生过目标行为；若所述目标行为产生标签表征在所述时间单元对应的注册时长内所述注册对象产生过所述目标行为，则所述目标行为时间标签为所述注册对象通过所述目标应用程序首次产生所述目标行为的时间所属的时间单元；若所述目标行为产生标签表征在所述时间单元对应的注册时长内所述注册对象未产生过所述目标行为，则所述目标行为时间标签为所述时间单元。

可选的，在图14所示的数据处理装置的基础上，所述时间单元对应的目标行为预测参考概率用于表征在参考前提条件下所述注册对象在所述时间单元内产生目标行为的预测概率，所述参考前提条件为所述注册对象在所述时间单元的前一个时间单元内不产生所述目标行为；则所述数据处理子模块14012具体用于：

根据所述时间单元对应的目标行为预测参考概率、以及时间顺序上位于所述时间单元前的各个参考时间单元各自对应的目标行为预测参考概率，确定第一目标行为预测产生概率和第二目标行为预测产生概率；所述第一目标行为预测产生概率用于表征所述注册对象对应的目标行为首次产生时间属于所述时间单元的预测概率，所述第二目标行为预测产生概率用于表征所述注册对象在所述时间单元对应的注册时长内通过所述目标应用程序产生所述目标行为的预测概率；

则所述模型训练子模块14013具体用于：

根据所述第二目标行为预测产生概率，确定目标行为预测未产生概率；所述目标行为预测未产生概率用于表征所述注册对象在所述时间单元对应的注册时长内通过所述目标应用程序没有产生过所述目标行为的预测概率；

根据所述第一目标行为预测产生概率、所述目标行为预测未产生概率、所述目标行为产生标签和所述目标行为时间标签，构建所述损失函数。

上述数据处理装置中采用的目标行为预测模型是基于生存分析理论训练得到的，生存分析理论是用于预测感兴趣事件发生时间的统计方法，其特别适合处理存在删失(如因观察窗口有限而未观察到感兴趣事件发生)的数据；相比相关技术中为了对齐观察窗口而将用户的行为数据截断的处理方式，本申请实施例基于生存分析理论的思想训练目标行为预测模型时，无需对用户的行为数据进行截断，可以充分利用目标应用程序上所有注册用户在其注册时长满足的各个观察窗口内的目标行为产生数据，对目标行为预测模型进行训练，即实现了对所有训练样本的所有观察窗口的充分利用，如此可以最大程度地保证训练得到的目标行为预测模型具有较好的模型性能，能够较准确地预测用户通过目标应用程序产生目标行为的概率。此外，通过上述方式训练得到的目标行为预测模型可以预测用户在不同长度的观察窗口内产生目标行为的概率，使得目标行为的预测不再局限于固定长度的观察窗口，更符合实际应用需求。

本申请实施例还提供了一种用于预测行为的设备，该设备具体可以是终端设备或者服务器，下面将从硬件实体化的角度对本申请实施例提供的终端设备和服务器进行介绍。

参见图15，图15是本申请实施例提供的终端设备的结构示意图。如图15所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(英文全称：PersonalDigital Assistant，英文缩写：PDA)、销售终端(英文全称：Point of Sales，英文缩写：POS)、车载电脑等任意终端设备，以终端为计算机为例：

图15示出的是与本申请实施例提供的终端相关的计算机的部分结构的框图。参考图15，计算机包括：射频(英文全称：Radio Frequency，英文缩写：RF)电路1510、存储器1520、输入单元1530(其中包括触控面板1531和其他输入设备1532)、显示单元1540(其中包括显示面板1541)、传感器1550、音频电路1560(其可以连接扬声器1561和传声器1562)、无线保真(英文全称：wireless fidelity，英文缩写：WiFi)模块1570、处理器1580、以及电源1590等部件。本领域技术人员可以理解，图15中示出的计算机结构并不构成对计算机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

存储器1520可用于存储软件程序以及模块，处理器1580通过运行存储在存储器1520的软件程序以及模块，从而执行计算机的各种功能应用以及数据处理。存储器1520可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1520可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器1580是计算机的控制中心，利用各种接口和线路连接整个计算机的各个部分，通过运行或执行存储在存储器1520内的软件程序和/或模块，以及调用存储在存储器1520内的数据，执行计算机的各种功能和处理数据，从而对计算机进行整体监控。可选的，处理器1580可包括一个或多个处理单元；优选的，处理器1580可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1580中。

在本申请实施例中，该终端所包括的处理器1580还具有以下功能：

获取注册目标应用程序的目标对象的特征数据；

可选的，所述处理器1580还用于执行本申请实施例提供的数据处理方法的任意一种实现方式的步骤。

参见图16，图16为本申请实施例提供的一种服务器1600的结构示意图。该服务器1600可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1622(例如，一个或一个以上处理器)和存储器1632，一个或一个以上存储应用程序1642或数据1644的存储介质1630(例如一个或一个以上海量存储设备)。其中，存储器1632和存储介质1630可以是短暂存储或持久存储。存储在存储介质1630的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1622可以设置为与存储介质1630通信，在服务器1600上执行存储介质1630中的一系列指令操作。

服务器1600还可以包括一个或一个以上电源1626，一个或一个以上有线或无线网络接口1650，一个或一个以上输入输出接口1658，和/或，一个或一个以上操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由服务器所执行的步骤可以基于该图16所示的服务器结构。

其中，CPU 1622用于执行如下步骤：

获取注册目标应用程序的目标对象的特征数据；

可选的，CPU 1622还可以用于执行本申请实施例提供的数据处理方法的任意一种实现方式的步骤。

本申请实施例还提供一种计算机可读存储介质，用于存储计算机程序，该计算机程序用于执行前述各个实施例所述的一种数据处理方法中的任意一种实施方式。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行前述各个实施例所述的一种数据处理方法中的任意一种实施方式。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文全称：Read-OnlyMemory，英文缩写：ROM)、随机存取存储器(英文全称：Random Access Memory，英文缩写：RAM)、磁碟或者光盘等各种可以存储计算机程序的介质。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

获取注册目标应用程序的目标对象的特征数据；

2.根据权利要求1所述的方法，其特征在于，所述时间单元对应的目标行为参考概率用于表征在参考前提条件下所述目标对象在所述时间单元内产生目标行为的概率，所述参考前提条件为所述目标对象在所述时间单元的前一个时间单元内不产生所述目标行为；

所述根据所述时间单元对应的目标行为参考概率，确定在所述时间单元对应的参考时长内所述目标对象的目标行为产生概率，包括：

3.根据权利要求1所述的方法，其特征在于，所述目标行为预测模型包括特征表示层、循环建模层和输出预测层；所述通过目标行为预测模型，根据所述目标对象的特征数据，确定多个时间单元各自对应的目标行为参考概率，包括：

通过所述特征表示层，根据所述目标对象的特征数据，确定对象特征表示向量；

通过所述循环建模层，根据所述对象特征表示向量，确定所述多个时间单元各自对应的状态表示向量；

通过所述输出预测层，针对每个所述时间单元，根据所述时间单元对应的状态表示向量，确定所述时间单元对应的目标行为参考概率。

4.根据权利要求3所述的方法，其特征在于，所述循环建模层包括多个状态建模单元，所述多个状态建模单元与所述多个时间单元一一对应；所述通过所述循环建模层，根据所述对象特征表示向量，确定所述多个时间单元各自对应的状态表示向量，包括：

5.根据权利要求1所述的方法，其特征在于，所述目标行为预测模型包括特征表示层和输出预测层，所述输出预测层包括多个预测单元，所述多个预测单元与所述多个时间单元一一对应；所述通过目标行为预测模型，根据所述目标对象的特征数据，确定多个时间单元各自对应的目标行为参考概率，包括：

针对每个所述时间单元，通过所述输出预测层中与所述时间单元对应的预测单元，根据所述对象特征表示向量，确定所述时间单元对应的目标行为参考概率。

6.根据权利要求3或5所述的方法，其特征在于，所述特征表示层包括全连接网络结构、卷积神经网络结构和图神经网络结构中的至少一种；所述通过所述特征表示层，根据所述目标对象的特征数据，确定对象特征表示向量，包括以下至少一种：

7.根据权利要求1所述的方法，其特征在于，所述获取注册目标应用程序的目标对象的特征数据，包括：

获取所述目标对象通过关联应用程序产生的目标行为数据；

将所述目标行为数据和所述基本信息数据，作为所述目标对象的特征数据。

8.根据权利要求1所述的方法，其特征在于，所述目标行为预测模型是通过以下方式训练得到的：

获取所述多个时间单元各自对应的训练样本集，每个所述时间单元对应的训练样本集中包括多个训练样本；

通过待训练的目标行为预测模型，根据所述训练样本中包括的所述注册对象的特征数据，确定所述多个时间单元各自对应的目标行为预测参考概率；并且针对每个所述时间单元，根据所述时间单元对应的目标行为预测参考概率，确定在所述时间单元对应的参考时长内所述注册对象的目标行为预测产生概率，作为所述时间单元对应的目标行为预测产生概率；

针对每个所述时间单元，根据所述时间单元对应的目标行为预测产生概率以及所述训练样本中包括的所述目标行为标注数据，构建损失函数；基于所述损失函数，训练所述待训练的目标行为预测模型。

9.根据权利要求1或8所述的方法，其特征在于，所述目标行为标注数据包括目标行为产生标签和目标行为时间标签；所述目标行为产生标签用于表征在所述时间单元对应的注册时长内所述注册对象是否产生过目标行为；若所述目标行为产生标签表征在所述时间单元对应的注册时长内所述注册对象产生过所述目标行为，则所述目标行为时间标签为所述注册对象通过所述目标应用程序首次产生所述目标行为的时间所属的时间单元；若所述目标行为产生标签表征在所述时间单元对应的注册时长内所述注册对象未产生过所述目标行为，则所述目标行为时间标签为所述时间单元。

10.根据权利要求9所述的方法，其特征在于，所述时间单元对应的目标行为预测参考概率用于表征在参考前提条件下所述注册对象在所述时间单元内产生目标行为的预测概率，所述参考前提条件为所述注册对象在所述时间单元的前一个时间单元内不产生所述目标行为；

所述根据所述时间单元对应的目标行为预测参考概率，确定在所述时间单元对应的参考时长内所述注册对象的目标行为预测产生概率，包括：

所述根据所述时间单元对应的目标行为预测产生概率以及所述训练样本中包括的所述目标行为标注数据，构建损失函数，包括：

11.一种数据处理装置，其特征在于，所述装置包括：

12.根据权利要求11所述的装置，其特征在于，所述时间单元对应的目标行为参考概率用于表征在参考前提条件下所述目标对象在所述时间单元内产生目标行为的概率，所述参考前提条件为所述目标对象在所述时间单元的前一个时间单元内不产生所述目标行为；则所述第二预测模块具体用于：

其中，所述第一目标行为产生概率用于表征所述目标对象通过所述目标应用程序首次产生所述目标行为的时间属于所述时间单元的概率；所述第二目标行为产生概率用于表征所述目标对象在所述时间单元对应的注册时长内通过所述目标应用程序产生所述目标行为的概率。

13.根据权利要求11所述的装置，其特征在于，所述目标行为预测模型包括特征表示层、循环建模层和输出预测层；所述第一预测模块包括：

特征表示子模块，用于通过所述特征表示层，根据所述目标对象的特征数据，确定对象特征表示向量；

循环建模子模块，用于通过所述循环建模层，根据所述对象特征表示向量，确定所述多个时间单元各自对应的状态表示向量；

输出预测子模块，用于通过所述输出预测层，针对每个所述时间单元，根据所述时间单元对应的状态表示向量，确定所述时间单元对应的目标行为参考概率。

14.一种设备，其特征在于，所述设备包括处理器及存储器；

所述存储器用于存储计算机程序；

所述处理器用于根据所述计算机程序执行权利要求1至10中任一项所述的数据处理方法。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行权利要求1至10中任一项所述的数据处理方法。