CN109544197B

CN109544197B - 一种用户流失预测方法和装置

Info

Publication number: CN109544197B
Application number: CN201710868129.8A
Authority: CN
Inventors: 卓可秋
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2017-09-22
Filing date: 2017-09-22
Publication date: 2023-09-22
Anticipated expiration: 2037-09-22
Also published as: CN109544197A

Abstract

本发明公开了一种用户流失预测方法和装置，所述方法包括：在历史用户数据中抽取用户的基础特征信息；根据所述用户的基础特征信息，对能够表征用户使用特性的参数进行建模，得到所述参数的二次特征组；根据所述用户的流失状态，利用所述二次特征组，对预置的分类器进行训练，得到训练好的分类器模型；利用所述分类器模型进行用户流失预测。本发明引入二次特征提取机制，对提取的二次特征分别进行建模，得到新的特征组，并将新的特征组作为分类器模型的训练数据，提高了流失与非流失用户体验的可分性，进而提高了流失用户预测的精度。

Description

一种用户流失预测方法和装置

技术领域

本发明涉及信息处理领域，尤其涉及一种用户流失预测方法和装置。

背景技术

电信运营商为用户提供IPTV(Internet Protocol Television，互联网协议电视)视频业务时，往往很关心用户是否会离网，也就是流失。用户流失对运营商来说损失巨大，因为再也无法从该用户中获取利润了。有研究表明，开发一个新用户的成本是挽留一个老用户的五倍。显然，有效的用户流失预测方法，能帮助运营商及时发现即将离网的用户，从而采取一定策略来挽留这部分用户，最终增加运营利润。

现有技术中存在一些用户流失预测的方法，但这些预测方法流失与非流失用户的可分性不高，严重影响了流失用户的预测精度。

发明内容

鉴于上述问题，提出了本发明以便提供一种解决上述问题用户流失预测方法和装置。

依据本发明的一个方面，提供一种用户流失预测方法，包括：

在历史用户数据中抽取用户的基础特征信息；

根据所述用户的基础特征信息，对能够表征用户使用特性的参数进行建模，得到所述参数的二次特征组；

根据所述用户的流失状态，利用所述二次特征组，对预置的分类器进行训练，得到训练好的分类器模型；

利用所述分类器模型进行用户流失预测。

可选地，所述历史用户数据包括：IPTV视频业务的历史用户数据。此时，所述能够表征用户使用特性的参数包括如下参数中的一个或多个：用户家庭情况、用户兴趣爱好、用户体验质量和用户观看行为。当然，本领域技术人员也可以根据实际情况对上述参数进行增加或减少。

依据本发明的另一个方面，提供一种用户流失预测装置，包括：

信息提取模块，用于在历史用户数据中抽取用户的基础特征信息；

二次特征提取模块，用于根据所述用户的基础特征信息，对能够表征用户使用特性的参数进行建模，得到所述参数的二次特征组；

模型训练模块，用于根据所述用户的流失状态，利用所述二次特征组，对预置的分类器进行训练，得到训练好的分类器模型；

预测模块，用于利用所述分类器模型进行用户流失预测。

依据本发明的第三个方面，提供一种用户流失预测装置，包括：处理器、存储器及通信总线；所述通信总线用于实现处理器和存储器之间的连接通信；所述处理器用于执行存储器中存储的用户流失预测程序，以实现本发明所述的用户流失预测方法的步骤。

本发明有益效果如下：

首先，本发明所述方法和装置，引入二次特征提取机制，对提取的二次特征分别进行建模，得到新的特征组，并将新的特征组作为分类器模型的训练数据，提高了流失与非流失用户体验的可分性，进而提高了流失用户预测的精度。

其次，本发明所述方法和装置，通过强化学习，以可挽留的用户为参考基准，调整分类器模型，使得预测出的高风险流失用户更具商业价值。此外，从运营策略和服务质量两个层面进行优化，从而提高挽留住高风险流失用户的可能性。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本发明第一实施例提供的一种用户流失预测方法的流程图；

图2为本发明第二实施例提供的一种用户流失预测方法的流程图；

图3为本发明第二实施例中时间序列模型的拓扑结构；

图4为本发明第二实施例中LSTM元内部结构图；

图5为本发明第二实施例中模型训练、预测与强化学习流程图；

图6为本发明第二实施例中基于强化学习的分类器模型调整结构图；

图7为本发明第三实施例提供的一种用户流失预测装置的结构框图；

图8为本发明第三实施例提供的又一用户流失预测装置的结构框图；

图9为本发明第四实施例提供的一种用户流失预测装置的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供一种用户流失预测方法和装置，目的在于提高流失与非流失用户相关数据可分性，进而提高流失用户预测精度；同时，通过强化学习，以可挽留的用户为参考基准，调整流失预测模型，使得预测出的高风险流失用户更具商业价值。下面通过几个具体实施例对本发明的实施过程进行详细说明。

在本发明第一实施例中，提供一种用户流失预测方法，如图1所示，所述方法包括如下步骤：

步骤S101，在历史用户数据中抽取用户的基础特征信息；

可选地/可能地，本发明实施例中，在历史用户数据中抽取用户的基础特征信息之前还包括：对所述历史用户数据进行数据清洗。

其中，对所述历史用户数据进行数据清洗包括但不限于为：

(1)采用统一数据接口，将所述历史用户数据处理为统一格式的数据；

(2)剔除所述历史用户数据中的噪声数据。

步骤S102，根据所述用户的基础特征信息，对能够表征用户使用特性的参数进行建模，得到所述参数的二次特征组；

本发明实施例中，在不同的应用场景下，表征用户使用特性的参数不同，本领域技术人员可以根据应用场景，确定其所需的能够表征用户使用特性的参数。例如，在IPTV应用场景下，所述能够表征用户使用特性的参数包括如下信息中的一个或多个：用户家庭情况、用户兴趣爱好、用户体验质量和用户观看行为。当然，这只是示例性的说明，并非唯一限定，本领域技术人员可以在此基础上增加或减少参数。

步骤S103，根据所述用户的流失状态，利用所述二次特征组，对预置的分类器进行训练，得到训练好的分类器模型；

本发明实施例中，由于采用的是历史数据，所以用户为流失用户还是非流失用户，即用户的流失状态已经是已知信息。在对分类器进行训练时，要筛选出流失用户和非流失用户，利用流失用户和非流失用户的二次特征组对分类器进行训练。

步骤S104，利用所述分类器模型进行用户流失预测。更为具体地，本实施例中，利用分类器模型对高概率流失用户进行预测。

在本发明的一个具体实施例中，利用所述分类器模型进行用户流失预测，包括：

(1)在目标时间段之前的用户数据中，选取指定时间范围内的用户数据；

(2)以选取的用户数据为训练数据，对所述分类器模型进行训练；

(3)利用训练的所述分类器模型，预测所述目标时间段内的高概率流失用户。

可选地/可能地，本发明实施例中，在对高概率流失用户进行预测后，还包括：

在设定时间段后，确定出经过挽留措施后的可挽留的高概率流失用户、以及没有被预测为高概率流失用户而流失的用户；

通过设定的强化学习算法，以提高所述可挽留的高概率流失用户的占比、降低所述没有被预测为高概率流失用户而流失的用户的占比为基准，调整所述分类器模型的流失概率阈值。

在本发明的一个具体实施例中，所述的强化学习算法为Q-学习算法。

综上可知，本发明实施例所述方法，引入二次特征提取机制，对提取的二次特征分别进行建模，得到新的特征组，并将新的特征组作为分类器模型的训练数据，提高了流失与非流失用户体验的可分性，进而提高了流失用户预测的精度。另外，本发明实施例所述方法，通过强化学习，以可挽留的用户为参考基准，调整分类器模型，使得预测出的高风险流失用户更具商业价值。

在本发明的第二实施例中，结合IPTV应用场景，对本发明所述用户流失预测方法进行更相近的说明，需要指出的是，本实施例中公开的大量技术细节用于解释本发明，并不用于唯一限定本发明。

具体地，如图2所示，本实施例所述用户流失预测方法包括如下步骤：

步骤S201：对历史用户数据进行数据清洗，并抽取用户的基础关键特征。

本发明实施例中，数据清洗主要包括统一数据接口处理和噪声用户剔除。

其中，统一数据接口处理是指，将各类型的话单数据，按照预先规定的接口模式处理成统一的格式。通过这种接口处理，能让来自各系统上格式类型多样的话单数据格式变得统一。

噪声用户是指对用户流失预测存在干扰的用户。这些用户由于各种原因而产生，比如用户表中用户归属EPG(Electronic Program Guide，电子节目指南)服务器分组名称(简称EPG)包含“测试”、用户表中EPG字段等于空、用户表中用户名为空或者用户名包含“测试”、预付费用户长期欠费而处于异常状态、用户几个月内没有任何电视观看记录等。

需要说明的是，本发明实施例所预测的流失用户是处于用户生命周期衰退期的用户，而不是那种有明显信息显示其将要流失的用户。比如用户处于被动停机或者几个月内都没有观看电视行为，这部分用户是明显属于高概率流失用户，不在本发明的考虑范畴。所以，将该类用户判定为噪声用户。

可选地/可能地，本发明实施例中，用户的基础关键特征主要包括用户的基础信息(Base Information)、用户近期性(Currency)、价值性(Monetary)和频率性(Frequency)等模块。用户基础信息包括用户代码、业务区代码、EPG模板代码、用户分组代码、在网时长等等。用户近期性包括用户状态标识、最后一次登录时间。价值性包括单次订购次数、最小单次订购金额、平均单次订购金额、最大单次订购金额、付费模式、租金发生次数、最小租金额、平均租金额、最大租金额、初始月份租金额等等。频率性包括观看天数、最小观看时长、平均观看时长、最大观看时长、最小观看频道数、平均观看频道数、最大观看频道数等等。

上述特征来自多个话单中。具体的特征、特征含义、特征计算说明和特征来源话单请见下表。

步骤S202：基于用户的基础关键特征，进行二次特征提取。

本实施例中，二次特征提取主要包括用户家庭情况、用户兴趣、用户体验质量、观看行为等。针对这几部分分别建模，作为新的特征组参与分类器训练，可提高流失与非流失用户可分性。

可选地/可能地，本实施例中，用户家庭情况包括：家庭组成和家庭消费能力两部分。家庭组成由年轻夫妇、单身青年、有老人、有小孩、仅有老人等一种或多种组合。家庭消费能力按1-5五个等级构成，值越高代表消费能力越强。根据用户在IPTV上的观看行为和消费情况，能够分别构建出家庭组成和家庭消费能力模型，得到用户家庭情况的二次特征组。

例如用户观看节目中，如果仅老人类节目，那么可以将该用户家庭组成定为仅有老人；如果又有儿童类节目，那么说明该家庭有小孩；如果没有老人类节目，又没有儿童类节目，说明是个年轻的单身或夫妇；进一步地，如果观看节目单一，则说明该家庭是单身的，如果比较混杂，说明该家庭是一对年轻夫妇。

所以，本实施例中，可根据所述用户的基础特征信息，得到所述用户观看的节目类型和所述用户的消费信息；对所述用户观看的节目类型和消费信息进行统计分析，确定所述用户的家庭组成和家庭消费能力，得到所述用户家庭情况的二次特征组。

可选地/可能地，本发明实施例中，用户兴趣爱好主要体现在用户喜爱的节目类型，这些节目类型可通过一定的向量来表示，也就是用一个二次特征组来描述用户兴趣爱好。

具体的，本实施例中，根据所述用户的基础特征信息，得到所述用户所观看的节目；按照设定的向量转换算法，得到所述用户所观看的节目的向量；按设定的权重，将所述用户所观看的节目的向量进行加权；对加权后的向量进行归一化，得到所述用户兴趣爱好的二次特征组。

在本发明的一个示例性实施例中，基于doc2vec算法来构建用户喜爱的节目类型。具体实现过程为：首先，利用doc2vec算法得到各个节目的向量空间；其次，根据用户所观看的具体节目，按设定权重将这些观看的节目的doc2ve向量加权；第三，将用户的doc2vec向量归一化，从而得到以向量表示的用户喜爱的节目类型。

上述中的doc2vec算法是一种将文档或句子转换成一个固定长度的向量的算法，其过程为先获得word2vec向量，接着通过word2vec向量，合并文本中的词向量，获得文本的初始向量，然后把文本当作一个词向量看待，按word2vec相同的方法，训练文本向量，此时只更新文本向量，词向量固定。其训练方法就是，对于一篇文本，其上的词所分类的结果，不仅要得到上下文的词，还要增加一个文本向量。word2vec的原理是，以1个词为输入，通过D维投射层，以及分类器(softmax或log-linear)，让该词分类到前后若干个词之间。前后词个数越多，word2vec模型的准确性越高，但计算量也越大。具有相同上下文的两个词，认为这两个词相似。

可选地/可能地，本实施例中，对于用户体验质量(QoE，Quality of Experience)，本实施例采用基于MOS时间序列的方式构建得到QoE部分的二次特征组。

具体的，本实施例中，根据用户的基础特征信息，得到特定时间段内的最小MOS(平均意见评分)时间序列和平均MOS的时间序列；根据最小MOS时间序列和平均MOS时间序列构成的时间序列语料，利用已经训练好的深度学习中时间序列模型进行回归预测，得到用户体验质量的二次特征组。

例如，在一个时段中，如1天，得到平均MOS和最小MOS的时间序列。这个时间段是根据实际需求设定。平均MOS的时间序列样式是：{3.1,3,5,4.1,4.8,…}；最小MOS的时间序列样式是：{1.5,2,2,1.3,3,…}。根据平均MOS和最小MOS二元组构成的时间序列语料，利用已经训练好的深度学习中时间序列模型(如LSTM(Long Short Term Memory，长短时记忆元)，GRU(Gated Re current Unit，门控循环单元))进行回归预测，就能得到QoE部分的二次特征组。

可选地/可能地，本实施例中，针对用户的观看行为，以大数据方式，直接获得用户观看的总体。本实施例中，采用用户历史观看行为的时间序列数据，通过时间序列模型构建用户观看行为的二次特征组。

具体的，本实施例中，根据所述用户的基础特征信息，得到所述用户历史观看行为的时间序列；根据所述用户历史观看行为的时间序列构成的时间序列语料，利用已经训练好的深度学习中时间序列模型进行回归预测，得到所述用户观看行为的二次特征组。

本发明实施例中，时间序列模型可以但不限于为LSTM时间序列模型，LSTM时间序列模型中间只用一层隐藏层。如图3所示，LSTM时间序列模型的拓扑结构为：输入层由两个普通神经元组成，隐藏层由十个LSTM元组成，输出层由两个普通神经元组成。输入层分别接收用户每天观看单个节目的平均时长和最短时长；输出层的目标值分为1和0，1代表流失用户，0代表非流失用户。之所以能够判断用户是否是流失的，是因为采用历史数据，已经知道了用户是否流失。在用户流失的预测中，会利用已经训练好的LSTM模型来预测用户的观看行为这一维度的值，作为一个二次特征，参与后续分类器的预测。

如图4所示，LSTM元的结构是这样的，它包括新输入x_t、输出h_t、输入门i_t、忘记门f_t、输出门o_t，引入输入门i_t、忘记门f_t、输出门o_t的目的是为了控制每一步输出的值，使得误差在该神经元传递中保持不变。LSTM元是循环神经网络的一个特例，新输入和每个门都会将前一次的输出h_t-1作为本次输入的一部分，因此新输入x_t、输入门i_t、忘记门f_t、输出门o_t的输入都是由x_t,h_t-1二元组构成。本实施例中x_t是由平均和最小时间序列预料构成的二维向量。

本实施例中，隐藏层LSTM元上的σ_i、σ_f、σ_o这三个激活函数采用tanh函数；输出层中两个普通神经元的激活函数采用softmax函数。在训练过程中，各个权值的更新是采用Nesterov(涅斯捷罗夫)方法，而其中的梯度则采用随机梯度下降法；训练的学习率设为0.025。

步骤S203：根据已知历史数据，筛选出流失用户和非流失用户。

本发明实施例关注的流失用户是指，初始时期的用户不再出现在截止时期的用户列表上，而且用户没有处于明显的异常状态。这些明显的异常状态包括被动停机和几个月内都没有观看电视行为。不是流失的，且没有明显异常的用户，就列为非流失用户。

步骤S204：利用经过基础关键特征和二次特征提取的流失和非流失用户数据，对分类器模型进行训练，得到相应的分类器模型。

其中，所述的分类器可以是GBDT(Gradient Boost Decision Tree，梯度提升决策树)、随机森林或BPNN(Back Propagation Neural Network，后向传播神经网络)或其他。

下面以随机森林为例，对利用处理后的数据进行分类器训练的过程进行说明。

随机森林(Random Forest，简称RF)是Bagging(黑袋模型)的一个扩展变体。RF在以决策树为基学习器的基础上，进一步在决策树的训练过程中引入了随机属性选择。具体来说，在数据集采样方面，RF采用随机有放回地采样；在属性选择方面，随机选择k(k通常设为log₂d，d为数据集的属性维度)个属性。也就是说，通过样本扰动和属性扰动，使得最终集成的泛化性能可通过个体学习器之间差异度的增加而进一步提升。

本实施例中，将历史用户数据集D按七三原则划分，取70％作为训练集，30％作为测试集。利用上述的RF算法进行训练。由于流失的样本与非流失的样本比例差别很大，所以采用过采样(over-sample)技术，使得训练集中流失的样本与非流失样本按β(β∈0,1)占比构成。比如原有训练集中流失样本100个，非流失样本10000个，假定过采样比例β为1，那么新的训练集就会有流失样本10000个(通过重复复制100个流失样本的方式得到)，非流失样本10000个。

用70％的数据进行训练得出模型后，就用30％的数据进行测试。对于RF回归模型，设置了一个阈值θ(θ∈0.5,1)来控制流失用户预测的准确性，并称该阈值为流失概率阈值。流失概率阈值θ越高，预测的准确率就会越高，但召回率就会越低。所以需要自动调整流失概率阈值θ来最大化流失用户预测的准确性。举个例子，预测时，用RF回归模型预测用户，其回归的结果值为0.8，当我们的流失概率阈值θ设为0.75，显然回归的结果值大于流失概率阈值θ，那么我们就将该用户预测为高概率流失用户，其流失概率为80％。

使用RF预测流失用户时，利用准确率P和召回率R的加权值F，得到最优的流失概率阈值θ。准确率P、召回率R和加权值F的公式如下：

F＝μP+(1-μ)R

其中，μ∈0,1为权重值，控制P和R的加权权重。

正式使用模型中，不再把数据集划分成训练集和测试集，而是直接使用全部的数据集进行RF模型训练。得到这个模型后，可以将模型序列化存储到磁盘上，以便后续重复使用。预测时，加载该模型即可进行预测，预测速度很快。

步骤S205：根据已经训练好的分类器，预测未来一定时期内(如一个月、半个月)高概率流失用户。

如图5所示，假设当前月为A，本实施例中，采用前A-7到A-1六个月的历史数据作为训练数据，训练分类器。本实施例中，以在前一个月中出现而未在当前月中出现的用户归为流失用户，反之归为非流失用户。且所诉训练数据中已经剔除掉了噪声用户。

训练好的分类器，就会用A-6到A六个月的历史数据来预测A+1个月高概率流失用户。

步骤S206：通过强化学习，以可挽留的、高价值用户为参考基准，调整分类器模型。

强化学习是指，机器处于环境E中，状态空间为X，其中每个状态是机器感知到的环境的描述，机器能够采取的动作构成了动作空间A，机器会在动作空间A中采取行动，环境会根据潜在的奖赏函数反馈给机器一个值，这种反馈值有正的有负的，分别表示奖赏和惩罚，通过长期累积反馈(通常称这种反馈为奖赏)，就能找到一个最优的策略。

本实施例，首先通过分类器模型来预测出高概率流失用户，运营商得到高概率流失用户，会采取一定措施，尽力挽留这部分高概率流失用户。经过一段时间，例如一个月，有部分高概率流失用户被挽留，有部分用户无法留住，有部分用户没有被预测为高概率流失用户而流失了。对此，本实施例采用Q-学习算法，更新分类器模型中的流失概率阈值θ，减少流失概率阈值θ的人工影响。该算法评估的是∈-贪心策略，而执行的是原始策略。Q-学习算法的表达式如下：

Q(x，a)＝Q(x，a)+α(r+γQ(x‘，a’)-Q(x，a))

其中，Q(x，a)表示在状态x执行动作a获得的累积奖赏值，α表示强化学习率，γ表示折扣因子，x‘表示下一步的状态，a’在下一步状态执行的动作。本实施例中，状态x对应流失概率阈值θ；动作a对应流失概率阈值θ的调整步数m，m的范围是从-1到1；r对应执行动作a到达状态x‘所带来的回报，当预测流失用户后得到的加权值F变大，r就为1，否则就为-1。初始化时Q(x，a)为0，α为0.01，γ为0.2。

举个例子，假设当前月A要预测下个月A+1的高概率流失用户，前一个月A-1对应强化学习部分的流失概率阈值取值θ为0.8。那么会根据历史的预测的准确性记录进行模拟，预测执行动作所带来的Q值，该动作包括两种情况：m＝0.01，m＝-0.01。当模拟出来后，如果得到执行动作“m＝0.01”所带来的Q值大于动作“m＝-0.01”，那么就选取动作“m＝0.01”作为当前的动作，也就是调整强化学习部分的流失概率阈值θ为0.81，即设定当前月A的强化学习部分的流失概率阈值θ为0.81；反之，设定当前月A的强化学习部分的流失概率阈值θ为0.79。本实施例中，会将强化学习部分中的流失概率阈值θ与RF预测流失用户时得到最优的流失概率阈值θ按设定比例(例如0.5)加权，来作为最终划分高概率流失用户的阈值，用于预测下个月A+1高概率流失用户。

可见，如图6所示，本发明实施例通过分类器模型预测出高概率流失用户，再根据可挽留用户和真实流失用户环境，利用强化学习算法，对分类器模型的流失概率阈值进行奖赏或惩罚。最后，通过长期累积反馈这种强化学习方式，就能找到一个最优的分类器模型，以提高用户流失预测精度。

综上可知，本发明实施例所述方法，在用户体验和用户行为中，引入二次特征提取方法，从多个维度描述用户体验和行为。二次特征提取方法，分别包括人口统计信息、用户兴趣、用户体验质量、观看行为等的二次特征。针对这几部分分别建模，作为新的特征组，以提高流失与非流失用户体验的可分性。

另外，本发明实施例所述方法，通过强化学习，以可挽留的用户为参考基准，调整流失预测模型，使得预测出的高风险流失用户更具商业价值。此外，从运营策略和视频网络服务质量两个层面进行优化，从而提高挽留住高风险流失用户的可能性。

在本发明第三实施例中，提供一种用户流失预测装置，如图7所示，包括：

信息提取模块710，用于在历史用户数据中抽取用户的基础特征信息；

二次特征提取模块720，用于根据所述用户的基础特征信息，对能够表征用户使用特性的参数进行建模，得到所述参数的二次特征组；

模型训练模块730，用于根据所述用户的流失状态，利用所述二次特征组，对预置的分类器进行训练，得到训练好的分类器模型；

预测模块740，用于利用所述分类器模型进行用户流失预测。

可选地/可能地，本发明实施例中，所述历史用户数据包括：互联网协议电视IPTV视频业务的历史用户数据。此时，所述能够表征用户使用特性的参数包括如下参数中的一个或多个：用户家庭情况、用户兴趣爱好、用户体验质量和用户观看行为。

可选地/可能地，本发明实施例中，二次特征提取模块720，包括如下单元中的一个或多个：

第一特征提取单元，用于根据所述用户的基础特征信息，得到所述用户观看的节目类型和所述用户的消费信息；对所述用户观看的节目类型和消费信息进行统计分析，确定所述用户的家庭组成和家庭消费能力，得到所述用户家庭情况的二次特征组。

第二特征提取单元，用于根据所述用户的基础特征信息，得到所述用户所观看的节目；按照设定的向量转换算法，得到所述用户所观看的节目的向量；按设定的权重，将所述用户所观看的节目的向量进行加权；对加权后的向量进行归一化，得到所述用户兴趣爱好的二次特征组。

第三特征提取单元，用于根据所述用户的基础特征信息，得到特定时间段内的最小平均意见评分MOS时间序列和平均MOS的时间序列；根据所述最小MOS时间序列和平均MOS时间序列构成的时间序列语料，利用已经训练好的深度学习中时间序列模型进行回归预测，得到所述用户体验质量的二次特征组。

第四特征提取单元，用于根据所述用户的基础特征信息，得到所述用户历史观看行为的时间序列；根据所述用户历史观看行为的时间序列构成的时间序列语料，利用已经训练好的深度学习中时间序列模型进行回归预测，得到所述用户观看行为的二次特征组。

可选地/可能地，本发明实施例中，预测模块740，具体用于在目标时间段之前的用户数据中，选取指定时间范围内的用户数据；以选取的用户数据为训练数据，对所述分类器模型进行训练；利用训练的所述分类器模型，预测所述目标时间段内的高概率流失用户。

可选地/可能地，如图8所示，本发明实施例所述装置，还包括：

强化学习模块750，用于在预测模块740利用所述分类器模型进行用户流失预测的设定时间段后，确定出经过挽留措施后的可挽留的高概率流失用户、以及没有被预测为高概率流失用户而流失的用户；通过设定的强化学习算法，以提高所述可挽留的高概率流失用户的占比、降低所述没有被预测为高概率流失用户而流失的用户的占比为基准，调整所述分类器模型的流失概率阈值。

其中，强化学习算法包括但不限于为Q-学习算法。

可选地/可能地，信息提取模块710，具体包括：

数据清洗单元，用于对所述历史用户数据进行数据清洗；

提取单元，用于在数据清洗后，在所述历史用户数据中抽取用户的基础特征信息。

在本发明的一个具体实施例中，数据清洗单元，具体用于采用统一数据接口，将所述历史用户数据处理为统一格式的数据；剔除所述历史用户数据中的噪声数据。

综上可知，本发明实施例所述装置，引入二次特征提取机制，对提取的二次特征分别进行建模，得到新的特征组，并将新的特征组作为分类器模型的训练数据，提高了流失与非流失用户体验的可分性。另外，本发明实施例所述方法，通过强化学习，以可挽留的用户为参考基准，调整分类器模型，使得预测出的高风险流失用户更具商业价值。

在本发明的第四实施例中，提供一种用户流失预测装置，如图9所示，包括：处理器、存储器及通信总线；所述通信总线用于实现处理器和存储器之间的连接通信；所述处理器用于执行存储器中存储的用户流失预测程序，以实现如下方法步骤：

步骤1，在历史用户数据中抽取用户的基础特征信息；

步骤2，根据所述用户的基础特征信息，对能够表征用户使用特性的参数进行建模，得到所述参数的二次特征组；

步骤3，根据所述用户的流失状态，利用所述二次特征组，对预置的分类器进行训练，得到训练好的分类器模型；

步骤4，利用所述分类器模型进行用户流失预测。

可选地/可能地，本发明实施例中，当能够表征用户使用特性的参数包括用户家庭情况、用户兴趣爱好、用户体验质量和用户观看行为时，上述步骤2的实施过程包括：

针对用户家庭情况，根据所述用户的基础特征信息，得到所述用户观看的节目类型和所述用户的消费信息；对所述用户观看的节目类型和消费信息进行统计分析，确定所述用户的家庭组成和家庭消费能力，得到所述用户家庭情况的二次特征组。

针对用户兴趣爱好，根据所述用户的基础特征信息，得到所述用户所观看的节目；按照设定的向量转换算法，得到所述用户所观看的节目的向量；按设定的权重，将所述用户所观看的节目的向量进行加权；对加权后的向量进行归一化，得到所述用户兴趣爱好的二次特征组。

针对用户体验质量，根据所述用户的基础特征信息，得到特定时间段内的最小平均意见评分MOS时间序列和平均MOS的时间序列；根据所述最小MOS时间序列和平均MOS时间序列构成的时间序列语料，利用已经训练好的深度学习中时间序列模型进行回归预测，得到所述用户体验质量的二次特征组。

针对用户观看行为，根据所述用户的基础特征信息，得到所述用户历史观看行为的时间序列；根据所述用户历史观看行为的时间序列构成的时间序列语料，利用已经训练好的深度学习中时间序列模型进行回归预测，得到所述用户观看行为的二次特征组。

可选地/可能地，本发明实施例中，利用所述分类器模型进行用户流失预测，具体包括：在目标时间段之前的用户数据中，选取指定时间范围内的用户数据；以选取的用户数据为训练数据，对所述分类器模型进行训练；利用训练的所述分类器模型，预测所述目标时间段内的高概率流失用户。

可选地/可能地，本发明实施例中，处理器执行用户流失预测程序时，还执行如下操作：

在利用所述分类器模型进行用户流失预测的设定时间段后，确定出经过挽留措施后的可挽留的高概率流失用户、以及没有被预测为高概率流失用户而流失的用户；通过设定的强化学习算法，以提高所述可挽留的高概率流失用户的占比、降低所述没有被预测为高概率流失用户而流失的用户的占比为基准，调整所述分类器模型的流失概率阈值。

其中，强化学习算法包括但不限于为Q-学习算法。

可选地/可能地，本发明实施例中，在历史用户数据中抽取用户的基础特征信息之前，还包括：

对所述历史用户数据进行数据清洗；

在数据清洗后，在所述历史用户数据中抽取用户的基础特征信息。

在本发明的一个具体实施例中，对所述历史用户数据进行数据清洗，包括：采用统一数据接口，将所述历史用户数据处理为统一格式的数据；剔除所述历史用户数据中的噪声数据。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：ROM、RAM、磁盘或光盘等。

总之，以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种用户流失预测方法，其特征在于，包括：

在历史用户数据中抽取用户的基础特征信息；

利用所述分类器模型进行用户流失预测；

其中，在利用所述分类器模型进行用户流失预测之后，还包括：

2.如权利要求1所述的方法，其特征在于，所述历史用户数据包括：互联网协议电视IPTV视频业务的历史用户数据；

所述能够表征用户使用特性的参数包括如下参数中的一个或多个：用户家庭情况、用户兴趣爱好、用户体验质量和用户观看行为。

3.如权利要求2所述的方法，其特征在于，所述根据所述用户的基础特征信息，对能够表征用户使用特性的参数进行建模，得到所述参数的二次特征组，包括：

根据所述用户的基础特征信息，得到所述用户观看的节目类型和所述用户的消费信息；

对所述用户观看的节目类型和消费信息进行统计分析，确定所述用户的家庭组成和家庭消费能力，得到所述用户家庭情况的二次特征组。

4.如权利要求2所述的方法，其特征在于，所述根据所述用户的基础特征信息，对能够表征用户使用特性的参数进行建模，得到所述参数的二次特征组，包括：

根据所述用户的基础特征信息，得到所述用户所观看的节目；

按照设定的向量转换算法，得到所述用户所观看的节目的向量；

按设定的权重，将所述用户所观看的节目的向量进行加权；

对加权后的向量进行归一化，得到所述用户兴趣爱好的二次特征组。

5.如权利要求2所述的方法，其特征在于，所述根据所述用户的基础特征信息，对能够表征用户使用特性的参数进行建模，得到所述参数的二次特征组，包括：

根据所述用户的基础特征信息，得到特定时间段内的最小平均意见评分MOS时间序列和平均MOS的时间序列；

根据所述最小MOS时间序列和平均MOS时间序列构成的时间序列语料，利用已经训练好的深度学习中时间序列模型进行回归预测，得到所述用户体验质量的二次特征组。

6.如权利要求2所述的方法，其特征在于，所述根据所述用户的基础特征信息，对能够表征用户使用特性的参数进行建模，得到所述参数的二次特征组，包括：

根据所述用户的基础特征信息，得到所述用户历史观看行为的时间序列；

根据所述用户历史观看行为的时间序列构成的时间序列语料，利用已经训练好的深度学习中时间序列模型进行回归预测，得到所述用户观看行为的二次特征组。

7.如权利要求1所述的方法，其特征在于，所述利用所述分类器模型进行用户流失预测，包括：

在目标时间段之前的用户数据中，选取指定时间范围内的用户数据；

以选取的用户数据为训练数据，对所述分类器模型进行训练；

利用训练的所述分类器模型，预测所述目标时间段内的高概率流失用户。

8.如权利要求1所述的方法，其特征在于，所述在历史用户数据中抽取用户的基础特征信息之前，还包括：对所述历史用户数据进行数据清洗。

9.如权利要求8所述的方法，其特征在于，所述对所述历史用户数据进行数据清洗包括：

采用统一数据接口，将所述历史用户数据处理为统一格式的数据；

剔除所述历史用户数据中的噪声数据。

10.一种用户流失预测装置，其特征在于，包括：

预测模块，用于利用所述分类器模型进行用户流失预测；

强化学习模块，用于在所述预测模块利用所述分类器模型进行用户流失预测的设定时间段后，确定出经过挽留措施后的可挽留的高概率流失用户、以及没有被预测为高概率流失用户而流失的用户；通过设定的强化学习算法，以提高所述可挽留的高概率流失用户的占比、降低所述没有被预测为高概率流失用户而流失的用户的占比为基准，调整所述分类器模型的流失概率阈值。

11.如权利要求10所述的装置，其特征在于，所述历史用户数据包括：互联网协议电视IPTV视频业务的历史用户数据；

12.一种用户流失预测装置，其特征在于，包括：处理器、存储器及通信总线；所述通信总线用于实现处理器和存储器之间的连接通信；所述处理器用于执行存储器中存储的用户流失预测程序，以实现如权利要求1至8任意一项所述方法步骤。