CN116703457A

CN116703457A - 用户生命周期价值的预测方法和预测装置

Info

Publication number: CN116703457A
Application number: CN202211657078.1A
Authority: CN
Inventors: 李立; 蒋宇; 邱李晴
Original assignee: Honor Device Co Ltd
Current assignee: Honor Device Co Ltd
Priority date: 2022-12-16
Filing date: 2022-12-22
Publication date: 2023-09-05
Anticipated expiration: 2042-12-22
Also published as: CN116703457B

Abstract

本申请提供了一种用户生命周期价值的预测方法和预测装置，有利于提高对用户生命周期价值预测的准确性。该方法包括：获取目标应用的特征数据和目标用户的特征数据；将目标应用的特征数据和目标用户的特征数据输入至训练好的生命周期价值预测模型，得到目标用户在未来预设时间段内的生命周期价值；其中，生命周期价值预测模型包括输入层、多个专家网络、多个注意力层和付费水平任务子模型。

Description

用户生命周期价值的预测方法和预测装置

本申请要求于2022年12月16日提交中国专利局、申请号为202211625364.X、申请名称为“用户生命周期价值的预测方法和预测装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及终端技术领域，尤其涉及一种用户生命周期价值的预测方法和预测装置。

背景技术

随着终端技术发展，终端设备上可以安装各种应用程序(简称“应用”)，而对于任一应用而言，为了更好地获取该应用的投资回报率(即收益与投资之间的比值)，不仅需要预测已有用户的生命周期价值，还需要获取潜在用户的生命周期价值。生命周期价值是指应用从获取到用户至用户流失所得到的收益，潜在用户是指目前尚未安装上述应用但是对该应用可能有使用需求的用户。

目前，存在一种用户生命周期价值的预测方法，该方法基于深度神经网络对用户生命周期价值建模，数据处理设备可以基于该模型预测用户的生命周期价值，但是该方法无法预测潜在用户的生命周期价值。目前还存在一种用户生命周期价值的预测方法，数据处理设备可以利用深度学习的无监督的人工神经网络模型对用户的生命周期价值进行预测，但是该方法无法得到用户的具体付费金额，此外，该方法无法预测潜在用户的生命周期价值。

在上述两种方法的基础上，还存在一种用户生命周期价值的预测方法，该方法对用户的注册任务、付费任务及付费水平任务进行了建模，该方法虽然可以解决用户的付费金额和潜在用户的生命周期价值预测的问题，但是存在对生命周期价值的预测准确性低的问题。

发明内容

本申请提供了一种用户生命周期价值的预测方法和预测装置，有利于提高对用户生命周期价值预测的准确性。

第一方面，提供了一种用户生命周期价值的预测方法，该方法包括：获取目标应用的特征数据和目标用户的特征数据；将目标应用的特征数据和目标用户的特征数据输入至训练好的生命周期价值预测模型，得到目标用户在未来预设时间段内的生命周期价值；其中，生命周期价值预测模型包括输入层、多个专家网络、多个注意力层和付费水平任务子模型，输入层用于将目标应用的特征数据和目标用户的特征数据拼接为第一目标特征向量，多个专家网络用于将第一目标特征向量转换为多个第二目标特征向量，多个注意力层用于对多个第二目标特征向量进行加权处理，得到多个第三目标特征向量，付费水平任务子模型用于基于多个第三目标特征向量中的全部或部分向量进行生命周期价值的预测。

在一种可能的实现方式中，目标用户为潜在用户，目标用户在未来预设时间段内的生命周期价值表示目标用户从注册目标应用开始到未来预设时间段内的生命周期价值。

在另一种可能的实现方式中，目标用户为已注册目标应用的用户，目标用户在未来预设时间段内的生命周期价值表示从此刻开始到未来预设时间段内目标用户的生命周期价值。

应理解，潜在用户可以为未注册过目标应用的用户，也可以为注册过但是又卸载了的目标应用的用户，本申请实施例对此不作限定。

在一种可能的实现方式中，生命周期价值预测模型不包括注册任务子模型和付费任务子模型，数据处理设备基于多个第三特征向量的全部向量进行生命周期价值的预测。

在另一种可能的实现方式中，生命周期价值预测模型还包括注册任务子模型和付费任务子模型，数据处理设备基于多个第三特征向量中的部分向量进行目标用户是否会注册的预测，基于多个第三特征向量中的部分向量进行目标用户是否会付费的预测，基于多个第三特征向量中的剩余向量进行生命周期价值的预测。

本申请实施例的用户生命周期价值的预测方法，通过将目标应用的特征数据和目标用户的特征数据输入至训练好的生命周期价值预测模型，而训练好的生命周期价值预测模型中的多个注意力层对多个第二特征向量进行加权处理得到多个第三目标特征向量，从而数据处理设备基于加权处理后的多个第三特征向量的全部或部分向量进行生命周期价值的预测，从而可以避免上述“跷跷板”问题，有利于提高对生命周期价值预测的准确性。

在一种可能的实现方式中，第三特征向量的数量为1，则生命周期价值预测模型中的付费水平任务子模型为一个。换句话说，该付费水平任务子模型是以用户付费水平为单峰分布构建的，即以用户付费水平为正态分布构建的。

以用户付费水平为正态分布构建付费水平任务子模型，即生命周期价值预测模型中的付费水平任务子模型为一个，可以使模型形式简单化，降低数据处理设备的处理复杂程度。

在另一种可能的实现方式中，第三特征向量的数量为大于1的正整数，则生命周期价值预测模型中的付费水平任务子模型为多个。换句话说，该付费水平任务子模型是以用户付费水平为多峰分布构建的。

以用户付费水平为多峰分布构建付费水平任务子模型，即生命周期价值预测模型中的付费水平任务子模型为多个，与用户实际付费情况比较贴近，有利于提高模型预测的准确性。

结合第一方面，在第一方面的某些实现方式中，多个注意力层中的每个注意力层的输入为第一目标特征向量和多个第二目标特征向量，输出为对多个第二目标特征向量加权求和后得到的第三目标特征向量。

结合第一方面，在第一方面的某些实现方式中，生命周期价值预测模型还包括：注册任务子模型和付费任务子模型；其中，注册任务子模型用于基于多个第三目标特征向量中的一部分向量预测目标用户在未来预设时间段内是否在目标应用上注册，付费任务子模型用于基于多个第三目标特征向量中的一部分向量预测目标用户在未来预设时间段内是否在目标应用上付费。

结合第一方面，在第一方面的某些实现方式中，还包括：获取样本数据，样本数据包括多个应用的特征数据、多个用户的特征数据、以及多个用户与多个应用之间的交互数据，交互数据包括多个用户是否注册过多个应用，多个用户是否在多个应用上付费和多个用户中的每个用户在历史预设时间段内在多个应用中的每个应用上的付费总额；基于样本数据，对生命周期价值预测模型进行训练，得到训练好的生命周期价值预测模型。

应理解，历史预设时间段的天数与上述未来预设时间段的天数相同，上述未来预设时间段为N天，历史预设时间段也为N天，历史预设时间段表示从此刻开始至过去N天，表示数据处理设备可以基于历史时间段N天内的样本数据预测未来预设时间段N天内任一用户的生命周期价值。

结合第一方面，在第一方面的某些实现方式中，基于样本数据，对生命周期价值预测模型进行训练，得到训练好的生命周期价值预测模型，包括：将多个应用的特征数据和多个用户的特征数据输入至输入层，得到第一特征向量；将第一特征向量分别输入至多个专家网络，得到多个第二特征向量，多个专家网络中的每个专家网络输出一个第二特征向量；将第一特征向量和多个第二特征向量分别输入至多个注意力层，得到多个第三特征向量，多个注意力层中的每个注意力层输出一个第三特征向量；将多个第三特征向量中的一部分特征向量输入至注册任务子模型，将多个第三特征向量中的一部分向量输入至付费任务子模型，将多个第三特征向量中的剩余特征向量输入至付费水平任务子模型，得到历史预设时间段的预测结果，历史预设时间段的预测结果包括每个用户在历史预设时间段内是否在每个应用上注册、每个用户在历史预设时间段内是否在每个应用上付费、以及多个用户中每个用户在每个应用的付费水平，付费水平包括付费均值和付费方差。

应理解，应用的特征数据为多维的向量，用户的特征数据为多维向量，输入至输入层的应用的特征数据和用户的特征数据得到的第一特征向量，可以为拼接应用的特征数据的多维向量和用户的特征数据的多维向量得到向量。

上述多个专家网络不相同，输出的多个第二特征向量也不相同，因此通过多个第二特征向量得到的多个第三特征向量也不相同，数据处理设备基于多个第三特征向量处理注册任务、付费任务以及付费水平任务时可以避免“跷跷板”问题，从而有利于提高模型输出结果准确的准确性。

结合第一方面，在第一方面的某些实现方式中，付费水平任务子模型包括多个预设神经网络和两个注意力层，多个预设神经网络的数量与上述剩余特征向量的数量相等，两个注意力层包括用于计算付费均值的第一注意力层和用于计算付费方差的第二注意力层。

应理解，付费水平任务子模型包括多个预设神经网络和两个注意力层表示付费水平任务子模型的输入为多个第三特征向量，其中，一个第三特征向量输入至一个预设神经网络，可以得到一个均值和一个方差，得到的均值再输入至第一注意力层，得到的方差再输入至第二注意力层。

结合第一方面，在第一方面的某些实现方式中，得到多个用户中每个用户在每个应用的付费水平，包括：将剩余特征向量分别输入至多个预设神经网络，得到多个均值和多个方差；将第一特征向量和多个均值输入至第一注意力层，得到付费均值，付费均值用于表示生命周期价值；将第一特征向量和多个方差输入至第二注意力层，得到付费方差。

在生命周期价值预测模型中，除了预测用户付费均值，即除了预测用户的生命周期价值，还预测了用户付费方差，而均值用于表示多次预测用户付费的平均水平，方差用于表示每次预测用户付费在平均水平附近的波动程度，因此输出方差能更好的体现模型预测的准确度，从而在应用推广以获取新用户的场景中，能够避免该模型对该应用的潜在用户的生命周期价值预测不准确却还去向该用户推广该应用的情况，有利于减小应用推广的成本。

结合第一方面，在第一方面的某些实现方式中，基于样本数据，对生命周期价值预测模型进行训练，得到训练好的生命周期价值预测模型，包括：基于历史预设时间段的预测结果和多个用户与多个应用之间的交互数据，计算损失函数；基于损失函数，调整生命周期价值预测模型的参数，并将训练样本重复输入至生命周期价值预测模型进行训练，使得损失函数满足预设条件。

结合第一方面，在第一方面的某些实现方式中，预设条件包括下列任一项：训练样本输入至生命周期价值预测模型的次数大于或等于第一预设阈值；生命周期价值预测模型的训练时间大于或等于第二预设阈值；或者，损失函数小于或等于第三预设阈值。

应理解，预设次数和预设时长的关系为：预设时长越长，训练样本输入至生命周期价值预测模型的次数越多。

若预设的时长较长，则训练样本输入至生命周期价值预测模型的次数较多，有利于提高生命周期价值预测模型的准确性。若预设的时间较短，则训练样本输入至生命周期价值预测模型的次数较少，有利于提高生命周期价值预测模型的确定效率。

可选地，多个用户与多个应用之间的交互数据可以更新，换句话说，样本数据可以更新，数据处理设备基于更新后的样本数据对生命周期预测模型重复训练，得到样本数据更新后的生命周期预测模型。

由于时间在变化，也就是说用户和应用的交互数据处于动态变化中。因此数据处理设备可以通过不断更新样本数据，不断的对生命周期价值预测模型重复训练，并基于重复训练后的生命周期价值预测模型预测用户的生命周期价值，有利于提高对用户的生命周期价值预测的准确性。

第二方面，提供了一种用户生命周期价值的预测装置，用于执行上述第一方面中任一种可能的实现方式中的方法。具体地，该预测装置包括用于执行上述第一方面中任一种可能的实现方式中的方法的模块。

在一种设计中，该预测装置可以包括执行上述第一方面中所描述的方法/操作/步骤/动作所一一对应的模块，该模块可以是硬件电路，也可是软件，也可以是硬件电路结合软件实现。

第三方面，提供了一种用户生命周期价值的预测装置，包括：处理器和存储器，该处理器用于读取存储器中存储的指令，以执行上述第一方面中的任一种可能实现方式中的方法。

可选地，处理器为一个或多个，存储器为一个或多个。

可选地，存储器可以与处理器集成在一起，或者存储器与处理器分离设置。

在具体实现过程中，存储器可以为非瞬时性(non-transitory)存储器，例如只读存储器(read only memory，ROM)，其可以与处理器集成在同一块芯片上，也可以分别设置在不同的芯片上，本申请实施例对存储器的类型以及存储器与处理器的设置方式不做限定。

上述第三方面中的用户生命周期价值的预测装置可以是一个芯片，该处理器可以通过硬件来实现也可以通过软件来实现，当通过硬件实现时，该处理器可以是逻辑电路、集成电路等；当通过软件来实现时，该处理器可以是一个通用处理器，通过读取存储器中存储的软件代码来实现，该存储器可以集成在处理器中，可以位于该处理器之外，独立存在。

第四方面，提供了一种计算机程序产品，计算机程序产品包括：计算机程序(也可以称为代码，或指令)，当计算机程序被运行时，使得计算机执行上述第一方面中的任一种可能实现方式中的方法。

第五方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序(也可以称为代码，或指令)当其在计算机上运行时，使得计算机执行上述第一方面中的任一种可能实现方式中的方法。

附图说明

图1是本申请实施例提供的一种生命周期价值预测方法的示意性流程图；

图2是用户的付费水平分布的示意图；

图3是本申请实施例提供的一种用户的付费水平分布的示意图；

图4是本申请实施例提供的一种生命周期价值预测模型；

图5是本申请实施例提供的一种用户生命周期价值的预测装置的示意性框图；

图6是本申请实施例提供的另一种用户生命周期价值的预测装置的示意性框图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

为了便于清楚描述本申请实施例的技术方案，在本申请的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。

需要说明的是，本申请中，“示例性地”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性地”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言，使用“示例性地”或者“例如”等词旨在以具体方式呈现相关概念。

此外，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a、b和c中的至少一项(个)，可以表示：a，或b，或c，或a和b，或a和c，或b和c，或a、b和c，其中a，b，c可以是单个，也可以是多个。

随着终端技术发展，终端设备上可以安装各种应用程序(简称“应用”)，而对于任一应用而言，为了更好的获取该应用的投资回报率(即收益与投资之间的比值)，不仅需要预测已有用户的生命周期价值，还需要获取潜在用户的生命周期价值，生命周期价值是指应用从获取到用户至用户流失所得到的收益，潜在用户是指目前尚未安装上述应用但是可能对该应用有使用需求的用户。

目前，存在下述三种用户生命周期价值的预测方法。

第一种用户生命周期价值的预测方法，基于深度神经网络对用户生命周期价值建模，数据处理设备基于该模型预测用户的生命周期价值。但是该方法没有考虑用户的注册的任务，导致无法预测潜在用户的生命周期价值。

第二种用户生命周期价值的预测方法，数据处理设备利用深度学习的无监督的人工神经网络模型对用户的生命周期价值进行预测，但是该方法预测得到的结果仅为用户的付费金额范围，无法得到用户的具体付费金额，此外，该方法没有考虑用户的注册的任务，无法预测潜在用户的生命周期价值。

在上述两种方法的基础上，还存在第三种用户生命周期价值的预测方法，该方法对用户的注册任务、付费任务及付费水平任务进行了建模，该方法虽然可以解决用户的付费金额和潜在用户的生命周期价值预测的问题。但是，在该方法中，由于输入到注册任务、付费任务及付费水平任务模型中的特征向量是经过一个神经网络处理得到的，所以，若其中一个任务模型预测的比较准确，那么就会使得剩余任务模型预测不准确，导致该方法存在“跷跷板”问题，导致对用户生命周期价值的预测准确性低。

为了解决上述问题，本申请实施例提供了一种用户生命周期价值的预测方法和预测装置，该方法采用多门混合专家算法(multi-gate mixture-of-experts，MMoE)，即：通过将多个专家网络处理得到的多个特征向量再经过多个注意力层的加权处理，数据处理设备得到多个注意力层处理后的多个特征向量。数据处理设备基于处理后的多个特征向量进行生命周期价值的预测，有利于避免“跷跷板”问题，从而有利于提高对生命周期价值预测的准确性。

接下来，介绍本申请实施例提供的用户生命周期价值的预测方法100，该方法100可以应用于获取应用的投资回报率的场景中，或者应用于应用推广以获取新用户的场景中。该方法100由数据处理设备执行，具体可以为终端设备、网络设备、服务器等具有数据处理功能的设备，该终端设备可以为安装有待预测应用的设备，也可以为未安装待预测应用的设备，本申请实施例对此不作限定。

方法100包括下列步骤：

S101，获取目标应用的特征数据和目标用户的特征数据。

应理解，目标应用的特征数据和目标用户的特征数据是基于特征工程分别从目标应用的原始数据和目标用户的原始数据中提取得到的，特征工程用于从应用的原始数据和用户的原始数据中提取特征，从而转换为数据处理设备易处理的特征数据。

示例性地，目标应用的原始数据可以包括目标应用的类型、用途、厂商、目标应用的相似应用，已有付费用户的付费规律等，若该应用为未上市应用，可以获取相似应用的已有付费用户的付费规律。目标用户的原始数据可以包括目标用户的自然人画像、目标用户使用各应用的数据和目标用户的付费偏好等，其中，目标用户的自然人画像可以包括目标用户的性别和年龄等，目标用户使用各应用的数据可以包括目标用户注册过什么应用，在这些应用上付费多少等，目标用户的付费偏好可以包括目标用户喜欢在什么应用上付费，喜欢一次性付费还是阶段性付费等。

S102，将目标应用的特征数据和目标用户的特征数据输入至训练好的生命周期价值预测模型，得到目标用户在未来预设时间段内的生命周期价值。其中，生命周期价值预测模型包括输入层、多个专家网络、多个注意力层和付费水平任务子模型，输入层用于将目标应用的特征数据和目标用户的特征数据拼接为第一目标特征向量，多个专家网络用于将第一目标特征向量转换为多个第二目标特征向量，多个注意力层用于对多个第二目标特征向量进行加权处理，得到多个第三目标特征向量，付费水平任务子模型用于基于多个第三目标特征向量中的全部或部分向量进行生命周期价值的预测。

示例性地，预设时间段为N天，若目标用户为潜在用户，目标用户在未来预设时间段内的生命周期价值表示目标用户从注册目标应用开始到未来N天的生命周期价值。若目标用户为已注册目标应用的用户，目标用户在未来预设时间段内的生命周期价值表示从此刻开始到未来N天内目标用户的生命周期价值。其中，N为正整数。

在一种可能的实现方式中，上述输入至付费水平任务子模型的第三特征向量的数量为1，则生命周期价值预测模型中的付费水平任务子模型为一个。换句话说，该付费水平任务子模型是以用户付费水平为单峰分布构建的，即以用户付费水平为正态分布构建的，如图2所示。

图2是用户的付费水平分布的示意图。图2中的横坐标表示用户的付费总额，纵坐标表示用户数量，该图中的峰表示有11个用户的付费总额为10，其余的用户的付费总额集中在10附近。

在另一种可能的实现方式中，上述输入至付费水平任务子模型的第三特征向量的数量大于1，则生命周期价值预测模型中的付费水平任务子模型可以分别基于一个第三特征向量进行建模和预测。换句话说，该付费水平任务子模型是以用户付费水平为多峰分布构建的，如图3所示。

图3是本申请实施例提供的用户的付费水平分布的示意图。在该图中，横坐标表示用户付费总额，纵坐标表示用户数量，该图中存在三个峰，表示在三个金额附近都有多个用户付费。具体而言，第一个峰表示有7个用户付费，每个用户的付费总额为4，第二个峰表示有11个用户付费，每个用户的付费总额为8，第三个峰表示有9个用户付费，每个用户的付费总额为14，其余用户的付费额集中在该三个峰附近。

以用户付费水平为多峰分布构建付费水平任务子模型，即生命周期价值预测模型中的付费水平任务子模型的输入为多个第三特征向量，与用户实际付费情况比较贴近，有利于提高模型预测的准确性。

可选地，上述多个注意力层中的每个注意力层的输入为第一目标特征向量和多个第二目标特征向量，输出为对多个第二目标特征向量加权求和后得到的第三目标特征向量。

可选地，生命周期价值预测模型还包括：注册任务子模型和付费任务子模型。其中，注册任务子模型用于基于多个第三目标特征向量中的一部分向量预测目标用户在未来预设时间段内是否在目标应用上注册，付费任务子模型用于基于多个第三目标特征向量中的一部分向量预测目标用户在未来预设时间段内是否在目标应用上付费。

接下来，以生命周期价值预测模型中的付费水平任务子模型的输入为多个第三特征向量、且生命周期价值模型还包括注册任务子模型和付费任务子模型为例，详细介绍生命周期价值预测模型的训练过程。

应理解，生命周期价值预测模型的训练过程可以由不同于上述数据处理设备的另一数据处理设备执行，也可以由与上述数据处理设备执行，本申请实施例对此不作限定。

可选地，上述方法还包括：获取样本数据，样本数据包括多个应用的特征数据、多个用户的特征数据、以及多个用户与多个应用之间的交互数据，交互数据包括多个用户是否注册过多个应用，多个用户是否在多个应用上付费和多个用户中的每个用户在历史预设时间段内在多个应用中的每个应用上的付费总额；基于样本数据，对生命周期价值预测模型进行训练，得到训练好的生命周期价值预测模型。

可选地，基于样本数据，对生命周期价值预测模型进行训练，得到训练好的生命周期价值预测模型，包括：将多个应用的特征数据和多个用户的特征数据输入至输入层，得到第一特征向量。将第一特征向量分别输入至多个专家网络，得到多个第二特征向量，多个专家网络中的每个专家网络输出一个第二特征向量。将第一特征向量和多个第二特征向量分别输入至多个注意力层，得到多个第三特征向量，多个注意力层中的每个注意力层输出一个第三特征向量。将多个第三特征向量中的一部分特征向量输入至注册任务子模型，将多个第三特征向量中的一部分向量输入至付费任务子模型，将多个第三特征向量中的剩余特征向量输入至付费水平任务子模型，得到历史预设时间段的预测结果，历史预设时间段的预测结果包括每个用户在历史预设时间段内是否在每个应用上注册、每个用户在历史预设时间段内是否在每个应用上付费、以及多个用户中每个用户在每个应用的付费水平，付费水平包括付费均值和付费方差。

示例性地，应用的特征数据为(1，2，3)，用户的特征数据为为(4，5，6),第一特征向量为(1，2，3，4，5，6)。

可选地，付费水平任务子模型包括多个预设神经网络和两个注意力层，多个预设神经网络的数量与剩余特征向量的数量相等，两个注意力层包括用于计算付费均值的第一注意力层和用于计算付费方差的第二注意力层。

可选地，得到多个用户中每个用户在每个应用的付费水平，包括：将剩余特征向量分别输入至多个预设神经网络，得到多个均值和多个方差；将第一特征向量和多个均值输入至第一注意力层，得到付费均值，付费均值用于表示生命周期价值；将第一特征向量和多个方差输入至第二注意力层，得到付费方差。

可选地，基于样本数据，对生命周期价值预测模型进行训练，得到训练好的生命周期价值预测模型，包括：基于历史预设时间段的预测结果和多个用户与多个应用之间的交互数据，计算损失函数；基于损失函数，调整生命周期价值预测模型的参数，并将训练样本重复输入至生命周期价值预测模型进行训练，使得损失函数满足预设条件。

应理解，损失函数包括下面三个部分：

(1)“预测结果中每个用户在历史时间段内在每个应用上是否会注册”与“训练样本中多个用户中的每个用户在多个应用中的每个应用上是否会注册”之间的交叉熵损失函数L₁。

具体地，预测结果中每个用户在历史时间段内在每个应用上是否会注册表示用户是否会注册的概率，而模型输出的每个用户在历史时间段内在每个应用上是否会注册与训练样本中多个用户中的每个用户在多个应用中的每个应用上是否会注册之间的交叉熵损失函数L₁表示模型输出的是否会注册的概率与训练样本中用户是否会注册的标准值之间的差异，交叉熵损失函数L₁越小，表明该差异越小。

“预测结果中每个用户在历史时间段内在每个应用上是否会注册”与“训练样本中多个用户中的每个用户在多个应用中的每个应用上是否会注册”之间的交叉熵损失函数L₁满足下列关系：

其中，针对多个用户中的任一用户和多个应用中的任一应用而言，y表示训练样本中该用户是否注册过该应用的真实标签，例如该用户注册过该应用，真实标签为1，该用户没有注册过该应用，真实标签为0。表示生命周期价值预测模型中输出的该用户在历史时间段内是否会注册的预测概率值。

示例性地，若多个用户中的任一用户在历史时间段内在多个应用中的任一应用上是否会注册的预测结果为1，训练样本中该用户是否注册过该应用的真实标签为1，则在历史时间段内的预测值与训练样本的真实标签之间的差异为0，则交叉熵损失函数值为0，说明生命周期价值预测模型的预测值与训练样本中的真实标签无差异。

(2)“预测结果中每个用户在历史时间段内在每个应用上是否会付费”与“练样本中多个用户中的每个用户在多个应用中的每个应用上是否会付费”之间的交叉熵损失函数L₂。

交叉熵损失函数L₂可以参照上述公式，为避免重复，在此不再赘述。

(3)“预测结果中每个用户在历史时间段内在每个应用上的付费均值”与“练样本中多个用户中的每个用户在多个应用中的每个应用上的付费总额”之间的损失函数L₃。

示例性地，损失函数L₃可以为零膨胀对数正态分布(zero-inflated lognormaldistribution，ZILN)损失函数，ZILN损失函数满足下列关系：

其中，针对多个用户中的任一用户和多个应用中的任一应用而言，μ表示生命周期价值预测模型输出的该用户在历史时间段内在该应用上的付费均值，σ表示生命周期价值预测模型输出的该用户在历史时间段内在该应用上的付费方差，x表示训练样本中该用户在该应用的真实付费总额。

因此生命周期价值预测模型的损失函数为：L＝L₁+L₂+L₃。

可选地，预设条件包括下列任一项：训练样本输入至生命周期价值预测模型的次数大于或等于第一预设阈值；生命周期价值预测模型的训练时间大于或等于第二预设阈值；或者，损失函数小于或等于第三预设阈值。

示例性地，数据处理设备可以通过自适应矩估计(adaptive moment estimation，Adam)训练算法对生命周期价值预测模型进行训练，在训练的过程中，数据处理设备对生命周期价值预测模型中的参数进行调整，使得损失函数L₁、损失函数L₂及损失函数L₃均极小化，从而使得生命周期价值预测模型的损失函数L极小化。

示例性地，数据处理设备还可以在开始调整生命周期价值预测模型中的参数的时候开始计时器，以统计生命周期价值预测模型的训练时间。或者，数据处理设备还可以在开始调整生命周期价值预测模型中的参数的时候开启计数器，以统计训练样本输入至生命周期价值预测模型的次数。其中，生命周期价值预测模型的训练时间为从模型开始训练到模型训练结束之间的时长。

示例性地，N可以取14、90或者365，N取14表示数据处理设备可以基于此刻至过去14天内的样本数据预测任一用户未来14天内的生命周期价值，N取90表示数据处理设备可以基于此刻至过去90天内的样本数据预测任一用户未来90天内的生命周期价值，N取365表示数据处理设备可以基于此刻至过去365天内的样本数据预测任一用户未来365天内的生命周期价值。

由于时间在变化，也就是说从此刻至过去N天的用户和应用的交互数据与从昨天开始至过去N天的用户和应用的交互数据发生了变化，即用户和应用的交互数据处于动态变化中。因此数据处理设备可以通过不断更新样本数据，不断的对生命周期价值预测模型重复训练，并基于重复训练后的生命周期价值预测模型预测用户的生命周期价值，有利于提高对用户的生命周期价值预测的准确性。

下面，结合图4，介绍本申请实施例的生命周期价值预测模型的确定过程。

图4是本申请实施例提供的一种生命周期价值预测模型。模型的确定包括下列步骤：

步骤1，获取多个应用中每个应用的原始的数据，并基于特征工程提取多个应用中每个应用的原始数据的特征，得到多个应用的特征数据。获取多个用户中的每个用户的原始数据，并基于特征工程提取多个用户中每个用户的原始数据的特征，得到多个用户的特征数据。获取上述多个应用中的每个应用与上述多个用户中的每个用户之间的交互数据。

示例性地，每个应用和每个用户的交互数据可以包括该用户是否注册过该应用、该用户是否在该应用付费以及该用户从此刻开始过去N天在该应用上的付费总额。其中，1表示用户注册过该应用，0表示用户没有注册过该应用。1表示用户在该应用付过费，0表示用户在该应用没有付过费。用户过去N天在该应用的付费总额可以用4、9、10、12、14等表示，在实际中用户过去N天在该应用的付费总额可以不为这些值，此处仅为示例。

下面，结合表一，介绍多个应用中的每个应用和多个用户中的每个用户的交互数据。

表一

应理解，上述示例只是示例性地给出应用的数量和用户的数量，实际中应用的数量和用户的数量可以为其他数量，本申请实施例对此不作限定。

还应理解，表一中N的取值和过去N天付费额与上述相同，为避免重复，在此不再赘述。

因此，表一中的训练样本包括应用1至应用10的特征数据，用户1至用户5的特征数据，以及应用1至应用10与用户1至用户5的交互数据，该交互数据包括：用户1至用户5是否注册过应用1至应用10，用户1至用户5是否在应用1至应用10上付费，以及用户1至用户5中的每个用户在应用1至应用10中的每个应用上过去N天的付费总额。

步骤2，将上述多个应用的特征数据和多个用户的特征数据输入至输入层，得到第一特征向量。

步骤3，将第一特征向量分别输入至专家网络1、专家网络2和专家网络3中，专家网络1得到特征向量1，专家网络2得到特征向量2，专家网络3得到特征向量3。特征向量1、特征向量2和特征向量3为上述多个第二特征向量。

步骤4，将上述第一特征向量、特征向量1、特征向量2以及特征向量3分别输入至多个注意力层(又称为“多门注意力层”)。具体而言，将第一特征向量和特征向量1、特征向量2和特征向量3输入至注意力层1，得到特征向量A。将第一特征向量和特征向量1、特征向量2和特征向量3输入至注意力层2，得到特征向量B。将第一特征向量和特征向量1、特征向量2和特征向量3输入至注意力层3，得到特征向量C。将第一特征向量和特征向量1、特征向量2和特征向量3输入至注意力层4，得到特征向量D。将第一特征向量和特征向量1、特征向量2和特征向量3输入至注意力层5，得到特征向量E。特征向量A、B、C、D和E为上述多个第三特征向量。

假设上述三个第二特征向量分别为E₁、E₂和E₃，数据处理设备基于注意力层1得到的特征向量A处理注册任务，则E₁、E₂和E₃在注册任务中的权重为：(w₁,w₂,w₃)＝f_A(input,E₁,E₂,E₃)，其中，f_A表示第一注意力层中的变化关系，input表示第一特征向量，w₁,w₂,w₃分别表示第二特征向量E₁、E₂和E₃在注册任务中的权重，且w₁+w₂+w₃＝1。基于三个第二特征向量E₁、E₂和E₃在注册任务中的权重，计算得到第二特征向量E₁、E₂和E₃的加权平均值为：T_A＝w₁×E₁+w₂×E₂+w₃×E₃。因此，注意力层1得到的特征向量A为T_A，用于处理注册任务。

应理解，基于多门注意力层中的其余注意力层得到的特征向量的计算方法与注意力层1相同，为避免重复，在此不再赘述。

步骤5，将特征向量A输入至注册任务子模型，预测每个用户在过去N天是否在每个应用上注册。将特征向量B输入至付费任务子模型，预测每个用户在过去N天在每个应用上是否付费。将特征向量C输入至付费水平任务子模型1，得到均值1和方差1。将特征向量D输入至付费水平任务子模型2，得到均值2和方差2。将特征向量E输入至付费水平任务子模型3，得到均值3和方差3。

应理解，付费水平任务子模型的输入为三个特征向量，分别为C、D和E，所以付费水平任务子模型有三个，分别为第一付费水平任务子模型、第二付费水平任务子模型及第三付费水平任务子模型。第一付费水平任务子模型包括付费水平任务子模型1，第二付费水平任务子模型包括付费水平任务子模型2，第三付费水平任务子模型包括付费水平任务子模型3。

针对注册任务而言，将上述T_A输入至注册任务子模型，若上述w₁为0.7，w₂为0.2，w₃为0.1，则数据处理设备选择E₁处理70％的注册任务，选择E₂处理20％的注册任务，选择E₃处理10％的注册任务，并得到每个用户在过去N天是否在每个应用上注册的概率值。

步骤6，将均值1、均值2及均值3输入至注意力层6(即上述第一注意力层)，预测多个用户中每个用户在过去N天在每个应用上的付费均值μ。将方差1、方差2及方差3输入至注意力层7(即上述第二注意力层)，预测多个用户中每个用户在过去N天在每个应用上的付费方差σ。

应理解，上述付费水平任务子模型1、注意力层6及注意力层7为上述第一付费水平任务子模型。上述付费水平任务子模型2、注意力层6及注意力层7为上述第二付费水平任务子模型。上述付费水平任务子模型3、注意力层6及注意力层7为上述第三付费水平任务子模型。

还应理解，注意力层6和注意力层7内部的计算和多门注意力层的每个注意力层的计算原理相似，为避免重复，在此不再赘述。

可选地，样本数据可以更新，数据处理设备基于更新后的样本数据对生命周期预测模型重复训练，得到样本数据更新后的生命周期预测模型，为避免重复，在此不再赘述。

因此，确定了生命周期价值预测模型，接下来对确定下来的生命周期价值预测模型进行训练，便可以得到训练好的生命周期价值预测模型。对生命周期价值预测模型的训练可以通过不断的调整模型中的参数，使得生命周期价值预测模型的损失函数满足预设条件，详细的过程可以参照上述描述，为避免重复，在此不再赘述。

本申请实施例的用户生命周期价值的预测方法，通过生命周期价值预测模型中的多个注意力层对输入至其内部的特征向量进行的加权处理，数据处理设备基于加权处理后的特征向量进行各个任务的处理，从而确定的生命周期价值预测模型，可以避免上述“跷跷板”问题，有利于提高生命周期价值预测模型的准确性，从而提高对用户的生命周期价值预测的准确性。

应理解，上述各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

上文结合图1至图4，详细描述了本申请实施例的用户生命周期价值的预测方法，下面结合图5和图6，详细描述本申请实施例的用户生命周期价值的预测装置。

图5是本申请实施例提供的一种用户生命周期价值的预测装置500。该预测装置500包括获取模块501和处理模块502。

应理解，用户生命周期价值的预测装置500可以具体为上述实施例中的数据处理设备，并且可以用于执行上述方法实施例中与数据处理设备对应的各个步骤和/或流程。

其中，取模块501用于：获取目标应用的特征数据和目标用户的特征数据；处理模块502用于：将目标应用的特征数据和目标用户的特征数据输入至训练好的生命周期价值预测模型，得到目标用户在未来预设时间段内的生命周期价值；其中，生命周期价值预测模型包括输入层、多个专家网络、多个注意力层和付费水平任务子模型，输入层用于将目标应用的特征数据和目标用户的特征数据拼接为第一目标特征向量，多个专家网络用于将第一目标特征向量转换为多个第二目标特征向量，多个注意力层用于对多个第二目标特征向量进行加权处理，得到多个第三目标特征向量，付费水平任务子模型用于基于多个第三目标特征向量中的全部或部分向量进行生命周期价值的预测。

可选地，多个注意力层中的每个注意力层的输入为第一目标特征向量和多个第二目标特征向量，输出为对多个第二目标特征向量加权求和后得到的第三目标特征向量。

可选地，生命周期价值预测模型还包括：注册任务子模型和付费任务子模型；其中，注册任务子模型用于基于多个第三目标特征向量中的一部分向量预测目标用户在未来预设时间段内是否在目标应用上注册，付费任务子模型用于基于多个第三目标特征向量中的一部分向量预测目标用户在未来预设时间段内是否在目标应用上付费。

可选地，获取模块501还用于：获取样本数据，样本数据包括多个应用的特征数据、多个用户的特征数据、以及多个用户与多个应用之间的交互数据，交互数据包括多个用户是否注册过多个应用，多个用户是否在多个应用上付费和多个用户中的每个用户在历史预设时间段内在多个应用中的每个应用上的付费总额；处理模块502还用于：基于样本数据，对生命周期价值预测模型进行训练，得到训练好的生命周期价值预测模型。

可选地，处理模块502还用于：将多个应用的特征数据和多个用户的特征数据输入至输入层，得到第一特征向量；将第一特征向量分别输入至多个专家网络，得到多个第二特征向量，多个专家网络中的每个专家网络输出一个第二特征向量；将第一特征向量和多个第二特征向量分别输入至多个注意力层，得到多个第三特征向量，多个注意力层中的每个注意力层输出一个第三特征向量；将多个第三特征向量中的一部分特征向量输入至注册任务子模型，将多个第三特征向量中的一部分向量输入至付费任务子模型，将多个第三特征向量中的剩余特征向量输入至付费水平任务子模型，得到历史预设时间段的预测结果，历史预设时间段的预测结果包括每个用户在历史预设时间段内是否在每个应用上注册、每个用户在历史预设时间段内是否在每个应用上付费、以及多个用户中每个用户在每个应用的付费水平，付费水平包括付费均值和付费方差。

可选地，付费水平任务子模型包括多个预设神经网络和两个注意力层，多个预设神经网络的数量与上述剩余特征向量的数量相等，两个注意力层包括用于计算付费均值的第一注意力层和用于计算付费方差的第二注意力层。

可选地，处理模块502还用于：将剩余特征向量分别输入至多个预设神经网络，得到多个均值和多个方差；将第一特征向量和多个均值输入至第一注意力层，得到付费均值，付费均值用于表示生命周期价值；将第一特征向量和多个方差输入至第二注意力层，得到付费方差。

可选地，处理模块502还用于：基于历史预设时间段的预测结果和多个用户与多个应用之间的交互数据，计算损失函数；基于损失函数，调整生命周期价值预测模型的参数，并将训练样本重复输入至生命周期价值预测模型进行训练，使得损失函数满足预设条件。

图6是本申请实施例提供的另一种用户生命周期价值的预测装置600。该预测装置600包括：处理器601和存储器602。其中，处理器601和存储器602通过内部连接通路互相通信，该存储器602用于存储指令，该处理器601用于执行该存储器602存储的指令。

应理解，用户生命周期价值的预测装置600可以具体为上述实施例中的数据处理设备，并且可以用于执行上述方法实施例中与数据处理设备对应的各个步骤和/或流程。可选地，该存储器602可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如，存储器还可以存储设备类型的信息。该处理器601可以用于执行存储器中存储的指令，并且当该处理器601执行存储器602中存储的指令时，该处理器601用于执行上述与数据处理设备对应的方法实施例的各个步骤和/或流程。

应理解，在本申请实施例中，该处理器可以是中央处理单元(central processingunit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器执行存储器中的指令，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

本申请还提供了一种计算机可读存储介质，该计算机可读存储介质用于存储计算机程序，该计算机程序用于实现上述实施例中与数据处理设备对应的方法。

本申请还提供了一种计算机程序产品，该计算机程序产品包括计算机程序(也可以称为代码，或指令)，当该计算机程序在计算机上运行时，该计算机可以执行上述实施例所示的数据处理设备所对应的方法。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请实施例的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请实施例的保护范围之内。因此，本申请实施例的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种用户生命周期价值的预测方法，其特征在于，包括：

获取目标应用的特征数据和目标用户的特征数据；

将所述目标应用的特征数据和所述目标用户的特征数据输入至训练好的生命周期价值预测模型，得到所述目标用户在未来预设时间段内的生命周期价值；

其中，所述生命周期价值预测模型包括输入层、多个专家网络、多个注意力层和付费水平任务子模型，所述输入层用于将所述目标应用的特征数据和所述目标用户的特征数据拼接为第一目标特征向量，所述多个专家网络用于将所述第一目标特征向量转换为多个第二目标特征向量，所述多个注意力层用于对所述多个第二目标特征向量进行加权处理，得到多个第三目标特征向量，所述付费水平任务子模型用于基于所述多个第三目标特征向量中的全部或部分向量进行生命周期价值的预测。

2.根据权利要求1所述的方法，其特征在于，所述多个注意力层中的每个注意力层的输入为所述第一目标特征向量和所述多个第二目标特征向量，输出为对所述多个第二目标特征向量加权求和后得到的第三目标特征向量。

3.根据权利要求1或2所述的方法，其特征在于，所述生命周期价值预测模型还包括：注册任务子模型和付费任务子模型；

其中，所述注册任务子模型用于基于所述多个第三目标特征向量中的一部分向量预测所述目标用户在所述未来预设时间段内是否在所述目标应用上注册，所述付费任务子模型用于基于所述多个第三目标特征向量中的一部分向量预测所述目标用户在所述未来预设时间段内是否在所述目标应用上付费。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

获取样本数据，所述样本数据包括多个应用的特征数据、多个用户的特征数据、以及所述多个用户与所述多个应用之间的交互数据，所述交互数据包括所述多个用户是否注册过所述多个应用，所述多个用户是否在所述多个应用上付费和所述多个用户中的每个用户在历史预设时间段内在所述多个应用中的每个应用上的付费总额；

基于所述样本数据，对所述生命周期价值预测模型进行训练，得到所述训练好的生命周期价值预测模型。

5.根据权利要求4所述的方法，其特征在于，所述基于所述样本数据，对所述生命周期价值预测模型进行训练，得到所述训练好的生命周期价值预测模型，包括：

将所述多个应用的特征数据和所述多个用户的特征数据输入至所述输入层，得到第一特征向量；

将所述第一特征向量分别输入至所述多个专家网络，得到多个第二特征向量，所述多个专家网络中的每个专家网络输出一个第二特征向量；

将所述第一特征向量和所述多个第二特征向量分别输入至所述多个注意力层，得到多个第三特征向量，所述多个注意力层中的每个注意力层输出一个第三特征向量；

将所述多个第三特征向量中的一部分特征向量输入至所述注册任务子模型，将所述多个第三特征向量中的一部分向量输入至所述付费任务子模型，将所述多个第三特征向量中的剩余特征向量输入至所述付费水平任务子模型，得到历史预设时间段的预测结果，所述历史预设时间段的预测结果包括所述每个用户在所述历史预设时间段内是否在所述每个应用上注册、所述每个用户在所述历史预设时间段内是否在所述每个应用上付费、以及所述多个用户中每个用户在所述每个应用的付费水平，所述付费水平包括付费均值和付费方差。

6.根据权利要求5所述的方法，其特征在于，所述付费水平任务子模型包括多个预设神经网络和两个注意力层，所述多个预设神经网络的数量与所述剩余特征向量的数量相等，所述两个注意力层包括用于计算付费均值的第一注意力层和用于计算付费方差的第二注意力层。

7.根据权利要求6所述的方法，其特征在于，所述得到所述多个用户中每个用户在所述每个应用的付费水平，包括：

将所述剩余特征向量分别输入至所述多个预设神经网络，得到多个均值和多个方差；

将所述第一特征向量和所述多个均值输入至所述第一注意力层，得到所述付费均值，所述付费均值用于表示所述生命周期价值；

将所述第一特征向量和所述多个方差输入至所述第二注意力层，得到所述付费方差。

8.根据权利要求5至7任一项所述的方法，其特征在于，所述基于所述样本数据，对所述生命周期价值预测模型进行训练，得到所述训练好的生命周期价值预测模型，包括：

基于所述历史预设时间段的预测结果和所述多个用户与所述多个应用之间的交互数据，计算损失函数；

基于所述损失函数，调整所述生命周期价值预测模型的参数，并将所述训练样本重复输入至所述生命周期价值预测模型进行训练，使得所述损失函数满足预设条件。

9.根据权利要求8所述的方法，其特征在于，所述预设条件包括下列任一项：

所述训练样本输入至所述生命周期价值预测模型的次数大于或等于第一预设阈值；

所述生命周期价值预测模型的训练时间大于或等于第二预设阈值；或者，

所述损失函数小于或等于第三预设阈值。

10.一种用户生命周期价值的预测装置，其特征在于，包括：

获取模块，用于获取目标应用的特征数据和目标用户的特征数据；

处理模块，用于将所述目标应用的特征数据和所述目标用户的特征数据输入至训练好的生命周期价值预测模型，得到所述目标用户在未来预设时间段内的生命周期价值；

11.根据权利要求10所述的预测装置，其特征在于，所述多个注意力层中的每个注意力层的输入为所述第一目标特征向量和所述多个第二目标特征向量，输出为对所述多个第二目标特征向量加权求和后得到的第三目标特征向量。

12.根据权利要求10或11所述的预测装置，其特征在于，所述生命周期价值预测模型还包括：注册任务子模型和付费任务子模型；

13.根据权利要求12所述的预测装置，其特征在于，所述获取模块还用于：

所述处理模块还用于：

14.根据权利要求13所述的预测装置，其特征在于，所述处理模块还用于：

15.根据权利要求14所述的预测装置，其特征在于，所述付费水平任务子模型包括多个预设神经网络和两个注意力层，所述多个预设神经网络的数量与所述剩余特征向量的数量相等，所述两个注意力层包括用于计算付费均值的第一注意力层和用于计算付费方差的第二注意力层。

16.根据权利要求15所述的预测装置，其特征在于，所述处理模块还用于：

17.根据权利要求14至16任一项所述的预测装置，其特征在于，所述处理模块还用于：

18.根据权利要求17所述的预测装置，其特征在于，所述预设条件包括下列任一项：

所述损失函数小于或等于第三预设阈值。

19.一种用户生命周期价值的预测装置，其特征在于，包括：处理器，所述处理器与存储器耦合，所述存储器用于存储计算机程序，当所述处理器调用所述计算机程序时，使得所述预测装置执行如权利要求1至9中任一项所述的方法。

20.一种计算机可读存储介质，其特征在于，用于存储计算机程序，所述计算机程序包括用于实现如权利要求1至9中任一项所述的方法的指令。

21.一种计算机程序产品，其特征在于，所述计算机程序产品中包括计算机程序代码，当所述计算机程序代码在计算机上运行时，使得所述计算机实现如权利要求1至9中任一项所述的方法。