CN112749335A

CN112749335A - 生命周期状态预测方法、装置、计算机设备和存储介质

Info

Publication number: CN112749335A
Application number: CN202010935540.4A
Authority: CN
Inventors: 张友然; 蔡锴; 谢年华; 吴书; 于雪莉
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-09-08
Filing date: 2020-09-08
Publication date: 2021-05-04
Anticipated expiration: 2040-09-08
Also published as: CN112749335B

Abstract

本申请涉及一种基于人工智能的生命周期状态预测方法、装置、计算机设备和存储介质。方法包括：获取用户行为数据；根据用户行为数据，对用户参与业务的生命周期状态初始化，得到用户的二元表达；针对每个用户的参与业务，根据资源消耗情况和生命周期状态数量初始化业务动态矩阵；利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，以拟合用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差；将用户的均方误差赋值到对应动态业务矩阵的相应位置；迭代训练，动态规划求解学习得到一条使均方误差最小的生命周期状态路径；根据生命周期状态路径，确定用户的生命周期状态。该方法提高了生命周期状态预测的准确度。

Description

生命周期状态预测方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能技术领域，特别是涉及一种生命周期状态预测方法、装置、计算机设备和存储介质。

背景技术

随着互联网技术的发展和智能终端的普及，人们的生活越来越离不开智能终端。智能终端提供了很多应用程序，人们可基于应用程序进行相关业务处理，包括视频播放、游戏和办公等。对于应用程序运营商而言，准确把握用户需求，基于用户需求进行精准推荐是提高用户粘性的重要方式。

基于对某项产品或服务用户生命周期的了解，可以更好地为用户提供服务。用户生命周期一般是指用户从接触某项产品或服务开始，到用户与该产品或服务脱离的整个阶段。目前，对用户生命周期的数据管理方法，主要通过设置预设的更新条件，当满足更新条件时生命周期状态之间可以通过进行更新。例如，假设某个用户注册了账号，进入新手期，但是持续一个月未使用，那么“持续一个月未使用”这个操作数据就触发了“衰败期”的生命周期更新条件，这个用户的当前生命周期状态直接更新为“衰败期”。

这种实现生命状态周期更新的方式，局限于预设条件，例如，虽然用户的使用频率有限，但用户充值数较大，若仅因频率就将这个用户的生命周期标注为“衰败期”，则并不准确。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高准确度的生命周期状态预测方法、装置、计算机设备和存储介质。

一种生命周期状态预测方法，其特征在于，所述方法包括：

获取用户行为数据；

根据所述用户行为数据，对用户参与业务的生命周期状态初始化，得到用户的二元表达；

针对每个用户的参与业务，根据资源消耗情况和生命周期状态数量初始化业务动态矩阵；

利用矩阵分解方法，对所述用户的二元表达与业务表达进行交互学习，以拟合所述用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差；

将所述用户的均方误差赋值到对应动态业务矩阵的相应位置；

动态规划求解学习得到一条使所述动态业务矩阵中的均方误差最小的生命周期状态路径；

根据所述生命周期状态路径确定生命周期状态，利用所述生命周期状态更新所述用户的二元表达；

根据更新的所述用户的二元表达迭代进行训练，得到最终的生命周期状态路径；

根据所述最终的生命周期状态路径，确定所述用户的生命周期状态。

一种生命周期状态预测装置，所述装置包括：

行为数据获取模块，用于获取用户行为数据；

用户初始化模块，用于根据所述用户行为数据，对用户参与业务的生命周期状态初始化，得到用户的二元表达；

矩阵初始化模块，用于针对每个用户的参与业务，根据资源消耗情况和生命周期状态数量初始化业务动态矩阵；

学习模块，用于利用矩阵分解方法，对所述用户的二元表达与业务表达进行交互学习，以拟合所述用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差；

矩阵处理模块，用于将所述用户的均方误差赋值到对应动态业务矩阵的相应位置；

迭代处理模块，用于动态规划求解学习得到一条使所述动态业务矩阵中的均方误差最小的生命周期状态路径；

更新模块，用于根据所述生命周期状态路径确定生命周期状态，利用所述生命周期状态更新所述用户的二元表达；

迭代控制模块，用于根据更新的所述用户的二元表达迭代进行训练，得到最终的生命周期状态路径；

预测模块，用于根据所述最终的生命周期状态路径，确定所述用户的生命周期状态。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取用户行为数据；

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取用户行为数据；

上述生命周期状态预测方法、装置、计算机设备和存储介质，通过根据生命周期状态构建用户的二元表达，利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，以拟合用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差；将用户的均方误差赋值到对应动态业务矩阵的相应位置，迭代训练，动态规划求解学习得到一条使均方误差最小的生命周期状态路径。引入二元表达后，通过细化的二元表达近一步去学习用户的潜在表达，动态根据资源消耗情况挖掘用户生命周期状态，不局限于特定预设条件，提高了生命周期状态预测的准确度。

附图说明

图1为一个实施例中生命周期状态预测方法的应用环境图；

图2为一个实施例中生命周期状态预测方法的流程示意图；

图3为一个实施例中用于生命周期状态预测的模型训练过程示意图；

图4为一个实施例中生命周期状态预测装置的结构框图；

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

本申请实施例提供的方案涉及人工智能的机器学习等技术，具体通过如下实施例进行说明:

本申请提供的生命周期状态预测方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。终端102向服务器104上报用户行为数据。服务器104基于用户行为数据进行分析，预测用户的生命周期状态。进而根据用户的生命周期状态进行产品推荐，将推荐产品推送至终端102。其中，服务器进行生命周期状态预测的方法，包括：获取用户行为数据；根据所述用户行为数据，对用户参与业务的生命周期状态初始化，得到用户的二元表达；针对每个用户的参与业务，根据资源消耗情况和生命周期状态数量初始化业务动态矩阵；利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，以拟合用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差；将用户的均方误差赋值到对应动态业务矩阵的相应位置；迭代训练，动态规划求解学习得到一条使所述动态业务矩阵中的均方误差最小的生命周期状态路径；根据所述生命周期状态路径，确定用户的生命周期状态。

其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2和图3所示，提供了一种生命周期状态预测方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤202，获取用户行为数据。

其中，用户行为数据是用户在应用软件操作所记录的行为数据。如用户在应用程序所点击的广告类型，观看时长。又如用户在应用程序所玩的游戏，每次的登录时长，付费情况等。其中，按行为发生时间的先后顺序，对用户行为数据进行排序。

步骤204，根据所述用户行为数据，对用户参与业务的生命周期状态初始化，得到用户的二元表达。

二元表达考虑了用户的二元属性。通常一元表达只用一维数据表达用户，在第一元表达的基础上，本实施例中将生命周期状态作为第二元表达。生命周期状态是指用户在某一类型业务所处生命周期阶段。

用户参与业务是指用户消耗资源所使用的业务，消耗资源可以为消耗时间资源、金钱资源等。其中，业务可以指业务大类，即用户所使用的应用程序，将其作为一个业务。业务还可以指应用程序中独立的内容实体，如一个游戏应用程序中每款游戏都是一个业务。即，用户参与业务可以指用户所使用的应用程序，也可以指用户所使用的应用程序中的每一个独立的内容实体。

具体地，预先根据用户从接触某一类型业务到退出的全过程作为一个生命周期，生命周期涵盖了用户在某一类型业务的开始至结束。用户在参与业务的消耗资源，体现了用户对业务的参与度，用户参与度高，有意愿为业务消耗资源的程度，体现了用户对业务的关注度。一段时间内为业务消耗资源的变化情况，可以窥见用户对业务的关注度变化。而通常认为，用户对某项事务的关注度由少变多，稳定，再慢慢减少。根据这种变化情况，以及用户在业务所消耗的资源变化情况，将生命周期划分为五个阶段。如图3所示，一个生命周期的五个阶段即五个状态，分别为获取，提升，成熟，衰退和流失。

其中，在获取状态，用户首次接触某一业务类型，在这一阶段，用户在该业务所消耗的资源逐渐提升，但比较少。其中，资源可以为时间，金钱等。随着用户在该业务消耗的资源越来越多，生命周期进入到了提升状态。在提升状态，用户在该业务消耗的资源逐步提升，且达到一定数值。随后，用户在该业务消耗的资源稳定在一定的水平，生命周期进入到成熟状态。随着用户在该业务消耗的资源开始减少，生命周期进入到衰退状态。当用户在该业务消耗的资源减少到较低的一个水平，直至完全退出，用户在该业务的生命周期进入到流失状态。

在业务类型为某一款游戏为例，根据用户在游戏的登录时长和付费随着时间的变化情况，将用户在该款游戏的生命周期分为获取，提升，成熟，衰退和流失五个状态。

其中，对用户参与业务的生命周期状态初始化，是指将用户在一个时间点所对应的生命周期状态，初始化为预设生命周期状态中的任意一个，具体地初始化生命周期状态为获取，提升，成熟三个状态中的任意一个。

具体地，根据所述用户行为数据，对用户参与业务的生命周期状态初始化，得到用户的二元表达，包括：根据所述用户行为数据，获取用户的各参与业务；针对用户的各参与业务，以用户标识作为用户第一维表达；随机初始化所述参与业务各时间点的生命周期状态作为用户的第二维表达；根据所述第一维表达和所述第二维表达，得到用户的各参与业务对应的二元表达。其中，用户行为数据已按行为发生时间的先后顺序进行排序预处理。对用户行为数据的预处理还可以包括数据筛选处理，剔除出用户行为数据中的重复数据和空值等。分别按用户标识对用户行为数据进行分类，对于每一个用户的用户行为数据，进一步地按参与业务进行分类，得到每个用户的每个参与业务的用户行为数据。

针对用户的各参与业务，以用户标识作为用户的第一维表达。同时，随机初始化参与业务各时间点的生命周期状态作为用户的第二维表达。可以理解的是，用户在不同时间段为资源的消耗变化情况所体现的对业务的关注度变化。一段时间连续的为资源的消耗情况，体现处于所处的生命周期状态。

在实际业务中，对于用户行为数据，按行为时间进行排序，设置采样时间点，如每周，统计每周的资源消耗情况。同时，随机初始化参与业务各时间点的生命周期状态作为用户的第二维表达，将用户在一个时间点所对应的生命周期状态，初始化为预设生命周期状态中的任意一个，如为获取，提升，成熟，衰退和流失五个状态中的任意一个。

根据所述第一维表达和所述第二维表达，得到用户的各参与业务对应的二元表达，具体为融合所述第一维表达和所述第二维表达，得到各参与业务的用户的二元表达，其中，融合方式包括以下方式中的任意一种：拼接、卷积、相乘和加权求和。

步骤206，针对每个用户的参与业务，根据资源消耗情况和生命周期状态数量初始化业务动态矩阵。

具体地，业务动态矩阵的横轴为采样时间点的资源消耗情况，纵轴为生命周期状态。生命周期动态的数量与纵轴元素的数量相同。其中，采样时间点可以为每周，即横轴为每周的资源消耗情况，如当周用户在某个游戏的登录时长。

针对每个用户的参与业务，初始的业务动态矩阵为零矩阵。例如，采集时间点为15，生命周期状态数量为5个，则初始的业务动态矩阵为5*15的零矩阵。以游戏为例，若用户在游戏业务平台，针对每个用户所玩的每一款游戏，初始化资源消耗情况和生命周期状态数量的零矩阵，得到业务动态矩阵。

步骤208，利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，以拟合用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差。

其中，矩阵分解是指将矩阵拆解为数个矩阵的乘积。利用矩阵分解的方法，将用户与业务的矩阵分解，分解为用户的二维表达和业务表达，通过计算用户的二元表达与业务表达的内积，并以用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，学习其交互表达，并进行二者的交互学习，初步学习一轮，得到初步的二维表达和业务表达。

其中，业务表达是指用户参与的业务信息，具体为用户参与的业务ID。

利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，以拟合用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差，包括：根据所述用户数据，获取用户参与业务的实际资源消耗量；利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，预测得到用户参与业务的预测资源消耗量；根据所述实际资源消耗量与所述预测资源消耗量的差值得到均方误差。

具体地，以拟合用户参与业务折消耗资源量为目标，期望拟合一条曲表示资源消耗量的变化情况。其中，资源消耗量可以为在参与业务的登录时长。

用户的实际资源消耗量为根据用户行为信息获取的用户在该时间点的实际资源消耗。均方误差是预测资源消耗量和实际资源消耗量的差值。训练的目标是使所述动态业务矩阵中的均方误差最小。

步骤210，将用户的均方误差赋值到对应动态业务矩阵的相应位置。

具体地，将用户的均方误差，即预测资源消耗量和实际资源消耗量的差值，赋值到对应动态业务矩阵的相应位置。其中，对应动态业务矩阵是指与用户的参与业务对应的动态业务矩阵，即根据用户ID和业务ID确定对应的动态业务矩阵，进而，根据采样时间点，将根据该采样时间点的用户的二元表达预测预测资源消耗量确定的均方误差，赋值到动态业务矩阵中与该采集时间点和生命周期状态对应的位置。

步骤212，动态规划求解学习得到一条使所述动态业务矩阵中的均方误差最小的生命周期状态路径。

具体地，采用类似最长公共子序列(LCS)的方法，学习出一条使得均方误差值最小的生命周期状态路径。其中，动态规划的方向只能单向，从获取状态向流失状态，不能回撤。其中，生命周期状态路径即动态业务矩阵中各采样时间点生命周期状态的连线。

步骤214，根据所述生命周期状态路径确定生命周期状态，利用所述生命周期状态更新所述用户的二元表达。

生命周期状态路径上的每个点代表生命周期状态，根据所述生命周期状态更新用户的二元表达，具体为更新用户的二元表达中的第二维的生命周期状态。

步骤216，根据更新的所述用户的二元表达迭代进行训练，得到最终的生命周期状态路径。

具体地，迭代返回执行步骤208至步骤212，根据更新的用户的二元表达迭代进行训练，直至模型收敛，达到迭代停止条件，得到最终的生命周期状态路径。

步骤218，根据所述生命周期状态路径，确定用户的生命周期状态。

由于生命周期状态路径表示不同时间点的用户的生命周期状态，因此，通过生命周期状态路径，可确定不同时间用户的生命周期状态。

通过根据生命周期状态构建用户的二元表达，利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，以拟合用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差；将用户的均方误差赋值到对应动态业务矩阵的相应位置，迭代训练，动态规划求解学习得到一条使均方误差最小的生命周期状态路径。引入二元表达后，通过细化的二元表达近一步去学习用户的潜在表达，动态根据资源消耗情况挖掘用户生命周期状态，不局限于特定预设条件，提高了生命周期状态预测的准确度。

具体地，根据所述生命周期状态路径，获取距离当前时间最近的生命周期状态，得到用户当前的生命周期状态，通常而言，生命周期状态路径最后一个表示用户对当前业务的生命状态。

用户当前的生命周期状态对于业务系统挖掘用户喜好，对用户进行业务推荐具有重要意义，能够提高用户推荐的准确性。

一种实施方式中，可建立生命周期状态和推荐产品的对应关系，根据这种对应关系，向用户推荐相关产品。具体地，每个生命周期状态设置了对应的推荐产品，当处于向用户推荐的业务场景中，获取用户的生命周期状态，以及和生命周期状态匹配的推荐产品，将该推荐产品向用户进行推荐。如对于生命周期状态为衰退状态的用户，可向用户推荐业务优惠活动信息，以对用户进行挽留。

一种实施方式中，根据用户行为数据以及生命周期状态，进一步地训练点击率预测模型。将预测的所述用户当前的生命周期状态以及所述用户行为数据，根据所述点击率预测模型，确定用户对候选推荐产品的点击率，根据用户对候选推荐产品的点击率，确定推荐产品，具体为将预测点击率较高的产品作为用户的推荐产品。由于是根据生命周期状态和用户行为数据对点击率进行预测确定的推荐产品，因而用户对该推荐产品的点击的可能性较大，从而能够提高用户对推荐产品的点击率。

通过使用用户所参与业务的历史用户行为数据，以及用户本身的生命周期状态信息对模型参数进行学习。学习完成后，可预测用户对某个业务的下阶段生命周期状态。从而达到在不同状态下，对用户实施不同的营销策略的目的。

通过细化建模对象的潜在语义表达，提高了推荐预测的准确性；将层次类目属性与状态属性解耦开来。可以通过该模型清晰的分析用户的偏好与习惯。同时，模型中获得的对象的层次类目属性和偏好属性还可以指导其他工作，作为其他特征工程中的一个有益的特征补充功能。

本申请还提供一种应用场景，该应用场景应用上述的生命周期状态预测方法。具体地，该生命周期状态预测方法在该应用场景的应用如下：

步骤S1，获取平台上用户参与某项或某些业务(如图片、视频等多媒体内容，或者APP、游戏等软件，或者所学习的课程等服务项目，等等)的用户行为数据，如根据具体的业务，行为数据可以包括每次的登录时长、浏览时长、付费情况、点赞行为等等。按时间先后顺序对用户所参与业务对应的用户行为数据进行排序整理；

步骤S2，按照用户与业务类别，分别初始化其第一维的表达，同时，随机初始化用户第二维的生命周期状态表达。将用户的类别表达与生命周期状态表达作串联，作为用户的整体的二元表达。

步骤S3，针对每个用户的所参与的业务，根据登录时长和生命周期状态数量初始化业务动态的零矩阵。

步骤S4，利用矩阵分解的方法，通过计算用户二元表达与游戏表达的内积，并以拟合用户基于对应业务的登录时长为目标，均方误差为损失函数，得到均方误差。

具体地，学习其交互表达，并进行二者的交互学习，初步学习一轮，得到初步的用户表达与业务表达。

步骤S5，在学习过程中，将相应业务的均方误差值赋到业务动态矩阵的对应位置.

步骤S6，采用类似最长公共子序列(LCS)的方法，学习出一条使得业务动态矩阵中均方误差值最小的生命周期状态路径。

步骤S7，根据所述生命周期状态路径确定生命周期状态，利用所述生命周期状态更新所述用户的二元表达。

步骤S4至S6循环进行，直到模型收敛为止，得到最终的生命周期状态路径。此时的用户的生命周期状态路径，即为其相应的生命周期状态曲线。

步骤S8，根据所述最终的生命周期状态路径，确定用户的生命周期状态。

通过使用用户所参与业务的历史数据，以及用户本身的生命周期状态信息对模型参数进行学习。学习完成后，可预测用户对某项业务或某些业务的下阶段生命周期状态。从而达到在不同状态下，对用户提供更好的服务感受，例如：根据生命周期状态提供更有针对性的服务、推荐其他业务等。

应该理解的是，虽然图2的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图4所示，提供了一种生命周期状态预测装置，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：

行为数据获取模块402，用于获取用户行为数据；

用户初始化模块404，用于根据所述用户行为数据，对用户参与业务的生命周期状态初始化，得到用户的二元表达；

矩阵初始化模块406，用于针对每个用户的参与业务，根据资源消耗情况和生命周期状态数量初始化业务动态矩阵；

学习模块408，用于利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，以拟合用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差；

矩阵处理模块410，用于将用户的均方误差赋值到对应动态业务矩阵的相应位置；

动态规划处理模块412，用于动态规划求解学习得到一条使所述动态业务矩阵中的均方误差最小的生命周期状态路径；

更新模块414，用于根据所述生命周期状态路径确定生命周期状态，利用所述生命周期状态更新所述用户的二元表达；

迭代控制模块416，用于根据更新的所述用户的二元表达迭代进行训练，得到最终的生命周期状态路径；

预测模块418，用于根据所述最终的生命周期状态路径，确定用户的生命周期状态。

上述生命周期状态预测装置，通过根据生命周期状态构建用户的二元表达，利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，以拟合用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差；将用户的均方误差赋值到对应动态业务矩阵的相应位置，迭代训练，动态规划求解学习得到一条使均方误差最小的生命周期状态路径。引入二元表达后，通过细化的二元表达近一步去学习用户的潜在表达，动态根据资源消耗情况挖掘用户生命周期状态，不局限于特定预设条件，提高了生命周期状态预测的准确度。

在另一个实施例中，用户初始化模块，包括：

业务获取模块，用于根据所述用户行为数据，获取用户的各参与业务；

一维表达模块，用于针对用户的各参与业务，以用户标识作为用户第一维表达；

二维表达模块，用于随机初始化所述参与业务各时间点的生命周期状态作为用户的第二维表达；

融合模块，用于根据所述第一维表达和所述第二维表达，得到用户的各参与业务对应的二元表达。

其中，融合模块，用于融合所述第一维表达和所述第二维表达，得到各参与业务的用户的二元表达，其中，融合方式包括以下方式中的任意一种：拼接、卷积、相乘和加权求和。

在另一个实施例中，学习模块，包括：

资源获取模块，用于根据所述用户数据，获取用户参与业务的实际资源消耗量；

资源预测模块，用于利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，预测得到用户参与业务的预测资源消耗量；

均方误差获取模块，用于根据所述实际资源消耗量与所述预测资源消耗量的差值得到均方误差。

在另一个实施例中，动态规划模块，用于利用最长公共子序列的方法，学习出使得所述动态业务矩阵中的均方误差最小的生命周期状态路径。

在另一个例中，还包括：预测模块，根据所述最终的生命周期状态路径，获取距离当前时间最近的生命周期状态，得到用户当前的生命周期状态。

在另一个实施例中，还包括：

点击率模块训练模块，用于根据所述生命周期状态和所述用户行为数据，训练点击率预测模型；

点击率预测模块，用于将预测的所述用户当前的生命周期状态以及所述用户行为数据，根据所述点击率预测模型，确定用户对候选推荐产品的点击率；

产品推荐模块，用于根据用户对候选推荐产品的点击率，确定推荐产品。

关于生命周期状态预测装置的具体限定可以参见上文中对于生命周期状态预测方法的限定，在此不再赘述。上述生命周期状态预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户行为数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种生命周期状态预测法。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种生命周期状态预测方法，其特征在于，所述方法包括：

获取用户行为数据；

2.根据权利要求1所述的方法，其特征在于，根据所述用户行为数据，对用户参与业务的生命周期状态初始化，得到用户的二元表达，包括：

根据所述用户行为数据，获取用户的各参与业务；

针对用户的各参与业务，以用户标识作为用户第一维表达；

随机初始化所述参与业务各时间点的生命周期状态作为用户的第二维表达；

根据所述第一维表达和所述第二维表达，得到所述用户的各参与业务对应的二元表达。

3.根据权利要求2所述的方法，其特征在于，根据所述第一维表达和所述第二维表达，得到各参与业务的用户的二元表达，包括：

融合所述第一维表达和所述第二维表达，得到各参与业务的用户的二元表达，其中，融合方式包括以下方式中的任意一种：拼接、卷积、相乘和加权求和。

4.根据权利要求1所述的方法，其特征在于，利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，以拟合用户参与业务的消耗资源量为目标，均方误差为损失函数，进行训练，得到均方误差，包括：

根据所述用户数据，获取用户参与业务的实际资源消耗量；

利用矩阵分解方法，对用户的二元表达与业务表达进行交互学习，预测得到用户参与业务的预测资源消耗量；

根据所述实际资源消耗量与所述预测资源消耗量的差值得到均方误差。

5.根据权利要求1或4所述的方法，其特征在于，动态规划求解学习得到一条使所述动态业务矩阵中的均方误差最小的生命周期状态路径，包括：

利用最长公共子序列的方法，学习出使得所述动态业务矩阵中的均方误差最小的生命周期状态路径。

6.根据权利要求1所述的方法，其特征在于，根据所述最终的生命周期状态路径，确定用户的生命周期状态，包括：

根据所述最终的生命周期状态路径，获取距离当前时间最近的生命周期状态，得到用户当前的生命周期状态。

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

根据所述生命周期状态和所述用户行为数据，训练点击率预测模型；

将预测的所述用户当前的生命周期状态以及所述用户行为数据，根据所述点击率预测模型，确定用户对候选推荐产品的点击率；

根据用户对候选推荐产品的点击率，确定推荐产品。

8.一种生命周期状态预测装置，其特征在于，所述装置包括：

行为数据获取模块，用于获取用户行为数据；

动态规划处理模块，用于动态规划求解学习得到一条使所述动态业务矩阵中的均方误差最小的生命周期状态路径；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。