CN105281959A - 一种基于隐马尔可夫模型的移动通信用户流失预测方法 - Google Patents

一种基于隐马尔可夫模型的移动通信用户流失预测方法 Download PDF

Info

Publication number
CN105281959A
CN105281959A CN201510741904.4A CN201510741904A CN105281959A CN 105281959 A CN105281959 A CN 105281959A CN 201510741904 A CN201510741904 A CN 201510741904A CN 105281959 A CN105281959 A CN 105281959A
Authority
CN
China
Prior art keywords
state node
month
data
hidden
moon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510741904.4A
Other languages
English (en)
Other versions
CN105281959B (zh
Inventor
于端云
顾宁伦
才鑫
曾令兵
夏兴有
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201510741904.4A priority Critical patent/CN105281959B/zh
Publication of CN105281959A publication Critical patent/CN105281959A/zh
Application granted granted Critical
Publication of CN105281959B publication Critical patent/CN105281959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Abstract

本发明公开一种基于隐马尔可夫模型的移动通信用户流失预测方法,属于数据业务领域。采集移动用户的通信记录数据;数据预处理;建立隐马尔可夫模型;对观测状态节点对应的数据进行处理;利用前T个月已知的观测状态节点的趋势状态数据,计算第T月隐状态节点的概率分布,再进行归一化,利用第T月隐状态节点的概率分布计算隐状态节点的状态之间的概率转移得到移动用户第T+1月的流失概率;各步骤均是在hadoop大数据平台上完成。本发明在大数据Hadoop分布式平台上对通信数据进行分析并预测,充分利用大数据的优势,对移动通信用户的所有数据进行分析,提升了预测移动通信用户流失的准确性和高效性。

Description

一种基于隐马尔可夫模型的移动通信用户流失预测方法
技术领域
本发明属于数据业务领域,特别涉及一种基于隐马尔可夫模型的移动通信用户流失预测方法。
背景技术
移动通信用户流失预测,对移动通信网络制定适当的营销策略非常关键。营销策略是移动通信网络公司通过对移动通信用户的通信数据进行详细分析,向移动通信用户推荐合适的套餐,减少用户的损失,有利于挽回将要流失的其他通信网络的用户,由此加强移动用户的忠诚度,挽回和吸引其他通信网络的用户,从而促进移动通信网络的发展。
有关移动通信用户流失预测方法的现有文献中,硕士学位论文“基于数据挖掘的移动客户虚假离网研究”比较接近,其中的虚假离网是指某在网用户因各种原因暂时离网后,又以相同(或不同)的名义入网。该方法主要是通过人工分析影响移动客户流失的因素有哪些,从而建立模型,研究移动客户虚假离网。但该方法仅仅是通过对小量数据进行分析建模,难免会对移动用户流失的关键因素产生错误判断。
发明内容
针对现有技术存在的不足,本发明提供一种基于隐马尔可夫模型的移动通信用户流失预测方法。
本发明的技术方案是这样:
一种基于隐马尔可夫模型的移动通信用户流失预测方法,包括以下步骤且各步骤均是在hadoop大数据平台上完成:
步骤1:采集移动用户的通信记录数据;
步骤2:数据预处理;
基于移动用户的通信记录数据,以月为单位,并按照下述8种属性类别对移动用户的通信情况进行统计:(1)计费用户号码;(2)月通话时长;(3)月通话次数;(4)月主被叫比例;(5)月漫游次数;(6)月掉话次数;(7)月基本费用;(8)月长途费用;
步骤3:建立隐马尔可夫模型,以下简称HMM模型;
定义隐马尔可夫模型中的观测状态节点集合Ssum={S0,S1,…,S6}对应{月通话时长,月通话次数,月主被叫比例,月漫游次数,月掉话次数,月基本费用,月长途费用};隐状态节点X={0,1},其中0代表客户流失状态,1代表客户未流失状态;
步骤4:对观测状态节点对应的数据进行处理;
步骤4.1:将观测状态节点对应的静态数据转换成趋势数据;
利用公式(1)将观测状态节点的静态数据转换成趋势数据;
Y i ( t ) = - 1 , &Sigma; i S i ( t ) = 0 0 , S i ( t ) - S i ( t - 1 ) < - S i &OverBar; 1 , | S i ( t ) - S i ( t - 1 ) | < S i &OverBar; 1 , &Sigma; i S i ( t - 1 ) = 0 2 , S i ( t ) - S i ( t - 1 ) > S i &OverBar; - - - ( 1 )
其中i的取值范围0~6;表示观测状态节点Si在第t个月的数据值;表示转换后的观测状态节点Si在第t个月的趋势状态数据;-1表示该用户这个月没有通信数据;0表示该用户这个月的通信数据下降;1表示该用户这个月的通信数据平稳;2表示该用户这个月的通信数据上升;
步骤4.2:将多个观测状态节点压缩成一个观测状态节点;
利用状态压缩的方式将多个观测状态节点压缩成一个观测状态节点,如公式(2)所示;
步骤5:基于建立的HMM模型进行移动用户流失预测;
利用前T个月已知的观测状态节点的趋势状态数据,计算第T月隐状态节点的概率分布,再进行归一化,利用第T月隐状态节点的概率分布计算隐状态节点的状态之间的概率转移得到移动用户第T+1月的流失概率;具体包括如下步骤:
步骤5.1:利用步骤1至步骤4的方法获得T个月观测状态节点的趋势状态数据;
步骤5.2:初始化HMM模型参数λ=(A,B,π),并设置t=0;
步骤5.3:通过第t个月的隐状态节点X的概率分布Bel(Xt),利用隐状态节点概率转移矩阵A计算第t+1个月隐状态节点X的概率分布其中Bel(Xt)表示隐状态节点X在第t个月时的修正概率分布;P(Xt+1|Xt)表示隐状态节点X在第t个月转移到第t+1个月的概率转移;
步骤5.4:使用隐状态节点与观测状态节点的概率转移矩阵B,修正第t+1个月隐状态节点X的概率分布得到修正概率分布Bel(Xt+1)∝P(Yt+1|Xt+1)Bel′(Xt+1);其中P(Yt+1|Xt+1)表示在第t+1个月隐状态节点与观测状态节点的概率转移,目的通过第t+1个月的观测状态节点修正第t+1个月的隐状态节点的概率分布;
步骤5.5:对第t+1个月的隐状态节点X的修正概率分布进行归一化,使隐状态节点的所有状态的概率和为1;
步骤5.6:令t=t+1;
步骤5.7:若t<T,跳转执行步骤5.3,否则执行步骤5.8;
步骤5.8:利用移动通信用户第T个月隐状态节点X的概率分布Bel(XT),通过隐状态节点概率转移矩阵A,计算下一个月即第T+1月移动通信用户的隐状态节点X的概率分布 Bel &prime; ( X T + 1 ) = &Sigma; x T P ( X T + 1 | X T ) B e l ( X T ) .
根据所述的基于隐马尔可夫模型的移动通信用户流失预测方法,所述用户流失为该用户在一个月内没有任何通信记录的状态;
根据所述的基于隐马尔可夫模型的移动通信用户流失预测方法,所述步骤5.2中所述初始化HMM模型参数,包括如下具体步骤:
步骤5.2.1:初始化隐含状态转移概率矩阵A;
a i j = &Sigma; t N U M ( X t = x i , X t + 1 = x j ) &Sigma; t N U M ( X t = x i ) - - - ( 3 )
A = a 00 a 01 a 10 a 11 - - - ( 4 )
其中NUM(Xt=xi,Xt+1=xj)表示在第t个月隐状态节点X取值等于xi并且在第t+1个月隐状态节点X取值等于xj的移动通信用户数量总和;根据公式(3),(4)所示,在完整数据集中,参数A的初始化是统计所有aij,即可得到隐状态节点X的隐含状态转移概率矩阵;
步骤5.2.2:初始化观测状态转移概率矩阵B;
b i ( j ) = &Sigma; t N U M ( X t = x , Y t = y ) &Sigma; t N U M ( X t = x ) - - - ( 5 )
B = b 0 ( 0 ) ... b 0 ( m - 1 ) b 1 ( 0 ) ... b 1 ( m - 1 ) - - - ( 6 )
在公式(5)中,NUM(Xt=x,Yt=y)表示在第t个月隐状态节点X取值为x,并且在第t个月观测状态节点Y取值为y的移动通信用户数量总和;根据公式(5),(6)可知,参数B的初始化操作与参数A的初始化操作相似,但又有点不同,那就是参数A是不同月份隐状态节点的状态转移概率,而参数B是同一月份隐状态节点与观测状态节点间的转移概率;
步骤5.2.3:初始化初始状态概率矩阵π;
针对参数π,π表示初始隐状态节点的状态出现的概率,相当于第0个月隐状态节点的概率分布,因为该参数π无法从数据集中学习,一般设置每个状态出现的概率相等,即
&pi; i = 1 2 , 1 &le; i &le; 2 - - - ( 7 ) .
本发明的有益效果:本发明在大数据Hadoop分布式平台上对通信数据进行分析并预测,充分利用大数据的优势,对移动通信用户的所有数据进行分析,提升了预测移动通信用户流失的准确性和高效性,为移动网络通信营销策略的规划方案提供依据。
附图说明
图1为本发明具体实施方式的基于隐马尔可夫模型的移动通信用户流失预测方法流程图;
图2为本发明具体实施方式构建的隐马尔可夫模型的机构示意图;
图3为本发明具体实施方式基于建立的隐马尔可夫模型进行移动用户流失预测的流程图。
具体实施方式
下面结合附图对本发明的具体实施方式做详细说明。
本实施方式的基于隐马尔可夫模型的移动通信用户流失预测方法,如图1所示,包括如下步骤,其中步骤S2至步骤S6是在hadoop大数据平台上完成的:
步骤S1:定义移动用户的流失状态;
建立用户流失预测模型的一个主要问题是对流失用户给定一个逻辑定义。在前面大部分的文献研究中,移动通信用户是与移动通信服务商签订合约,使用移动通信服务商提供的通信服务。因此,“流失”应该被定义成用户单方面终止合约或者合约过期。但是对于预付费的移动通信服务商来说情况不同,用户与服务商没有合约,任何一个人可以买一个SIM卡成为用户。因此任何用户在一段时间内停止使用移动通信服务商提供的服务,即可认定为流失用户,也就是说流失用户发生在没有任何通话记录的情况下。在本实施方式中认定当一个用户在一个月内没有任何通信记录,即定义为流失用户。
步骤S2:采集移动用户的通信记录信息;
通信记录信息指移动用户每次通信产生的数据,包括:计费用户号码,对端用户号码,通话起始时间,通话时长,呼叫类型,漫游类型,本地计费单元量,长途计费单元量,标准批价基本费,标准批价长途费,生成时间(用户第一次使用计费用户号码的时间);
步骤S3:通过在hadoop大数据平台上对移动用户通话记录数据进行预处理;
根据移动用户的通信记录信息,以月为单位,并按照下述8种属性类别对移动用户的通信情况进行统计;
(1)计费用户号码:移动通信用户的唯一标识;(2)月通话时长:移动通信用户每个月的通话总时长;(3)月通话次数:移动通信用户每个月的通话总次数;(4)月主被叫比例:移动通信用户每个月的主叫次数除以被叫次数;(5)月漫游次数:移动通信用户每个月的漫游总次数;(6)月掉话次数:移动通信用户每个月的掉话次数;所述掉话次数为某一移动通信用户给同一用户在30秒内进行2次及以上的通话次数,定义该移动通信用户通信过程中发生掉话现象;(7)月基本费用:移动通信用户每个月的本地通信费用总和;(8)月长途费用:移动通信用户每个月的长途通信费用总和;
步骤S4:建立隐马尔可夫模型;
隐马尔可夫模型(HiddenMarkovModel,HMM)(以下称为HMM模型)如图2所示,其结构主要分为观测状态节点和隐状态节点两部分。本实施方式中定义隐马尔可夫模型中的观测状态节点集合Ssum={S0,S1,…,S6}对应{月通话时长,月通话次数,月主被叫比例,月漫游次数,月掉话次数,月基本费用,月长途费用}。本实施方式中定义隐状态节点X={0,1},其中0代表客流失状态,1代表未流失状态。隐马尔可夫模型中的观测状态节点会对隐状态节点产生影响,而利用月通话时长,月通话次数等这些观测状态节点并不能直接表示出对隐状态节点的具体影响如何,需要对观测状态节点数据作进一步处理,参见步骤5。
步骤S5:对观测状态节点对应的数据进行处理;
步骤S5.1:将观测状态节点静态数据转换成趋势数据;
为了使观测状态节点数据能直接反映其对隐状态节点数据的影响,本实施方式将观测状态节点静态数据转换成趋势数据,比如移动通信用户费用突增,就能直接反应移动通信用户的流失状态。本实施方式利用公式(1)将观测状态节点的静态数据转换成趋势数据。
Y i ( t ) = - 1 , &Sigma; i S i ( t ) = 0 0 , S i ( t ) - S i ( t - 1 ) < - S i &OverBar; 1 , | S i ( t ) - S i ( t - 1 ) | < S i &OverBar; 1 , &Sigma; i S i ( t - 1 ) = 0 2 , S i ( t ) - S i ( t - 1 ) > S i &OverBar; - - - ( 1 )
其中i的取值范围0~6;表示观测状态节点Si在第t个月的数据值;表示转换后的观测状态节点Si在第t个月的趋势状态数据;-1表示该用户这个月没有通信数据;0表示该用户这个月的通信数据下降;1表示该用户这个月的通信数据平稳;2表示该用户这个月的通信数据数据上升。
步骤S5.2:将多个观测状态节点压缩成一个观测状态节点;
HMM模型的观测状态节点只有一个,因此需要将前述多个观测状态节点压缩成一个观测状态节点,本实施方式利用状态压缩的方式将多个观测状态节点压缩成一个观测状态节点,如公式(2)所示。
步骤S6:移动用户流失预测;
利用前T个月已知的观测状态节点的趋势状态数据,计算第T月隐状态节点的概率分布,再进行归一化,利用第T月隐状态节点的概率分布计算隐状态节点的状态之间的概率转移得到移动用户第T+1月的流失概率。如图3所示,具体过程如下:
步骤S6.1:利用步骤S2至步骤S5的方法获得T个月观测状态节点的趋势状态数据;
步骤S6.2:初始化HMM模型参数λ=(A,B,π),并设置t=0;
所述初始化HMM模型参数,具体包括如下步骤:
HMM的模型参数λ=(A,B,π)不随时序的变化而改变,是一个静态参数。
步骤S6.2.1:初始化隐含状态转移概率矩阵A;
a i j = &Sigma; t N U M ( X t = x i , X t + 1 = x j ) &Sigma; t N U M ( X t = x i ) - - - ( 3 )
A = a 00 a 01 a 10 a 11 - - - ( 4 )
其中NUM(Xt=xi,Xt+1=xj)表示在第t个月隐状态节点X取值等于xi并且在第t+1个月隐状态节点X取值等于xj的移动通信用户数量总和。根据公式(3),(4)所示,在完整数据集中,参数A的初始化是统计所有aij,即可得到隐状态节点X的隐含状态转移概率矩阵。
步骤S6.2.2:初始化观测状态转移概率矩阵B;
b i ( j ) = &Sigma; t N U M ( X t = x , Y t = y ) &Sigma; t N U M ( X t = x ) - - - ( 5 )
B = b 0 ( 0 ) ... b 0 ( m - 1 ) b 1 ( 0 ) ... b 1 ( m - 1 ) - - - ( 6 )
在公式(5)中,NUM(Xt=x,Yt=y)表示在第t个月隐状态节点X取值为x,并且在第t个月观测状态节点Y取值为y的移动通信用户数量总和。根据公式(5),(6)可知,参数B的初始化操作与参数A的初始化操作相似,但又有点不同,那就是参数A是不同月份隐状态节点的状态转移概率,而参数B是同一月份隐状态节点与观测状态节点间的转移概率。
步骤S6.2.3:初始化初始状态概率矩阵π;
针对参数π,π表示初始隐状态节点的状态出现的概率,相当于第0个月隐状态节点概率分布,因为该参数π无法从数据集中学习,一般设置每个状态出现的概率相等,即
&pi; i = 1 2 , 1 &le; i &le; 2 - - - ( 7 )
步骤S6.3:通过第t个月的隐状态节点X的概率分布Bel(Xt),利用隐状态节点概率转移矩阵A计算第t+1个月隐状态节点X的概率分布其中Bel(Xt)表示隐状态节点X在第t个月时的修正概率分布;P(Xt+1|Xt)表示隐状态节点X在第t个月转移到第t+1个月的概率转移;
步骤S6.4:使用隐状态节点与观测状态节点的概率转移矩阵B,修正第t+1个月隐状态节点X的概率分布得到修正概率分布Bel(Xt+1)∝P(Yt+1|Xt+1)Bel′(Xt+1);其中P(Yt+1|Xt+1)表示在第t+1个月隐状态节点与观测状态节点的概率转移,目的通过第t+1个月的观测状态节点修正第t+1个月的隐状态节点的概率分布;
步骤S6.5:对第t+1个月的隐状态节点X的修正概率分布进行归一化,使隐状态节点的所有状态的概率和为1;
步骤S6.6:t=t+1;
步骤S6.7:若t<T,跳转执行步骤S6.3,否则执行步骤S6.8;
步骤S6.8:利用移动通信用户第T个月隐状态节点X的概率分布Bel(XT),通过隐状态节点概率转移矩阵A,计算下一个月即第T+1月移动通信用户的隐状态节点X的概率分布也就是预测出该用户当前月的下个月的流失概率分布。
实验结果
用户流失预测准确率计算公式如公式(10)所示:
Accuracy=(TP+TN)/(TP+FP+TN+FN)(8)
公式(10)中TP是预测为正样本,实际也为正样本的特征数;FP是预测为正样本,实际为负样本的特征数;TN是预测为负样本,实际也为负样本的特征数;FN是预测为负样本,实际为正样本的特征数。
本实施方式应用到具体的移动用户流失预测中,在具体实施中,当设置用户的流失概率大于70%时,确定用户为流失状态,用户流失预测的准确率达到最高,用户流失的准确率如表1所示。由表1可明显看出,本实施方式的基于隐马尔可夫模型的移动通信用户流失预测方法的移动用户流失预测准确率高于基于贝叶斯网络的移动用户流失预测准确率。
表1基于隐马尔可夫模型与基于贝叶斯网络的移动用户流失预测方法准确率比较

Claims (3)

1.一种基于隐马尔可夫模型的移动通信用户流失预测方法,其特征在于:包括以下步骤且各步骤均是在hadoop大数据平台上完成:
步骤1:采集移动用户的通信记录数据;
步骤2:数据预处理;
基于移动用户的通信记录数据,以月为单位,按照下述8种属性类别对移动用户的通信情况进行统计:(1)计费用户号码;(2)月通话时长;(3)月通话次数;(4)月主被叫比例;(5)月漫游次数;(6)月掉话次数;(7)月基本费用;(8)月长途费用;
步骤3:建立隐马尔可夫模型,以下简称HMM模型;
定义HMM模型中的观测状态节点集合Ssum={S0,S1,...,S6}对应{月通话时长,月通话次数,月主被叫比例,月漫游次数,月掉话次数,月基本费用,月长途费用};隐状态节点X={0,1},其中0代表客户流失状态,1代表客户未流失状态;
步骤4:对观测状态节点对应的数据进行处理;
步骤4.1:将观测状态节点对应的静态数据转换成趋势数据;
利用公式(1)将观测状态节点的静态数据转换成趋势数据;
Y i ( t ) = - 1 , &Sigma; i S i ( t ) = 0 0 , S i ( t ) - S i ( t - 1 ) < - S i &OverBar; 1 , | S i ( t ) - S i ( t - 1 ) | < S i &OverBar; 1 , &Sigma; i S i ( t - 1 ) = 0 2 , S i ( t ) - S i ( t - 1 ) > S i &OverBar; - - - ( 1 )
其中i的取值范围0~6;表示观测状态节点Si在第t个月的数据值;表示转换后的观测状态节点Si在第t个月的趋势状态数据;-1表示该用户这个月没有通信数据;0表示该用户这个月的通信数据下降;1表示该用户这个月的通信数据平稳;2表示该用户这个月的通信数据上升;
步骤4.2:将多个观测状态节点压缩成一个观测状态节点;
利用状态压缩的方式将多个观测状态节点压缩成一个观测状态节点,如公式(2)所示;
步骤5:基于建立的HMM模型进行移动用户流失预测;
利用前T个月已知的观测状态节点的趋势状态数据,计算第T月隐状态节点的概率分布,再进行归一化,利用第T月隐状态节点的概率分布计算隐状态节点的状态之间的概率转移得到移动用户第T+1月的流失概率;具体包括如下步骤:
步骤5.1:利用步骤1至步骤4的方法获得T个月观测状态节点的趋势状态数据;
步骤5.2:初始化HMM模型参数λ=(A,B,π),并设置t=0;
步骤5.3:通过第t个月的隐状态节点X的概率分布Bel(Xt),利用隐状态节点概率转移矩阵A计算第t+1个月隐状态节点X的概率分布其中Bel(Xt)表示隐状态节点X在第t个月时的修正概率分布;P(Xt+1|Xt)表示隐状态节点X在第t个月转移到第t+1个月的概率转移;
步骤5.4:使用隐状态节点与观测状态节点的概率转移矩阵B,修正第t+1个月隐状态节点X的概率分布得到修正概率分布Bel(Xt+1)∝P(Yt+1|Xt+1)Bel′(Xt+1);其中P(Yt+1|Xt+1)表示在第t+1个月隐状态节点与观测状态节点的概率转移,目的通过第t+1个月的观测状态节点修正第t+1个月的隐状态节点的概率分布;
步骤5.5:对第t+1个月的隐状态节点X的修正概率分布进行归一化,使隐状态节点的所有状态的概率和为1;
步骤5.6:令t=t+1;
步骤5.7:若t<T,跳转执行步骤5.3,否则执行步骤5.8;
步骤5.8:利用移动通信用户第T个月隐状态节点X的概率分布Bel(XT),通过隐状态节点概率转移矩阵A,计算下一个月即第T+1月移动通信用户的隐状态节点X的概率分布 Bel &prime; ( X T + 1 ) = &Sigma; x T P ( X T + 1 | X T ) B e l ( X T ) .
2.根据权利要求1所述的基于隐马尔可夫模型的移动通信用户流失预测方法,其特征在于:所述用户流失为该用户在一个月内没有任何通信记录的状态。
3.根据权利要求3所述的基于隐马尔可夫模型的移动通信用户流失预测方法,其特征在于:所述步骤5.2中所述初始化HMM模型参数,包括如下具体步骤:
步骤5.2.1:初始化隐含状态转移概率矩阵A;
a i j = &Sigma; t N U M ( X t = x i , X t + 1 = x j ) &Sigma; t N U M ( X t = x i ) - - - ( 3 )
A = a 00 a 01 a 10 a 11 - - - ( 4 )
其中NUM(Xt=xi,Xt+1=xj)表示在第t个月隐状态节点X取值等于xi并且在第t+1个月隐状态节点X取值等于xj的移动通信用户数量总和;根据公式(3),(4)所示,在完整数据集中,参数A的初始化是统计所有aij,即可得到隐状态节点X的隐含状态转移概率矩阵;
步骤5.2.2:初始化观测状态转移概率矩阵B;
b i ( j ) = &Sigma; t N U M ( X t = x , Y t = y ) &Sigma; t N U M ( X t = x ) - - - ( 5 )
B = b 0 ( 0 ) ... b 0 ( m - 1 ) b 1 ( 0 ) ... b 1 ( m - 1 ) - - - ( 6 )
在公式(5)中,NUM(Xt=x,Yt=y)表示在第t个月隐状态节点X取值为x,并且在第t个月观测状态节点Y取值为y的移动通信用户数量总和;根据公式(5),(6)可知,参数B的初始化操作与参数A的初始化操作相似,但又有点不同,那就是参数A是不同月份隐状态节点的状态转移概率,而参数B是同一月份隐状态节点与观测状态节点间的转移概率;
步骤5.2.3:初始化初始状态概率矩阵π;
针对参数π,π表示初始隐状态节点的状态出现的概率,相当于第0个月隐状态节点的概率分布,因为该参数π无法从数据集中学习,一般设置每个状态出现的概率相等,即
&pi; i = 1 2 , 1 &le; i &le; 2 - - - ( 7 ) .
CN201510741904.4A 2015-11-04 2015-11-04 一种基于隐马尔可夫模型的移动通信用户流失预测方法 Active CN105281959B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510741904.4A CN105281959B (zh) 2015-11-04 2015-11-04 一种基于隐马尔可夫模型的移动通信用户流失预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510741904.4A CN105281959B (zh) 2015-11-04 2015-11-04 一种基于隐马尔可夫模型的移动通信用户流失预测方法

Publications (2)

Publication Number Publication Date
CN105281959A true CN105281959A (zh) 2016-01-27
CN105281959B CN105281959B (zh) 2018-05-04

Family

ID=55150331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510741904.4A Active CN105281959B (zh) 2015-11-04 2015-11-04 一种基于隐马尔可夫模型的移动通信用户流失预测方法

Country Status (1)

Country Link
CN (1) CN105281959B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108377204A (zh) * 2018-02-13 2018-08-07 中国联合网络通信集团有限公司 一种用户离网的预测方法及装置
CN109451527A (zh) * 2018-12-21 2019-03-08 广东宜通世纪科技股份有限公司 一种移动通信用户流失日粒度预测方法及装置
CN110018843A (zh) * 2018-01-09 2019-07-16 北京小度互娱科技有限公司 应用程序运行策略的测试方法和装置
CN111754341A (zh) * 2020-07-07 2020-10-09 浪潮卓数大数据产业发展有限公司 一种计算小微企业贷款违约概率pd的方法
CN113256044A (zh) * 2020-02-13 2021-08-13 中国移动通信集团广东有限公司 一种策略的确定方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571432A (zh) * 2012-01-10 2012-07-11 中山大学 一种非平稳Web流的监控、预测与仿真方法
CN103297956A (zh) * 2013-05-06 2013-09-11 北京航空航天大学 一种基于贝叶斯理论与熵理论的动态轻量级信任评估方法
US20150049634A1 (en) * 2012-02-20 2015-02-19 Aptima, Inc. Systems and methods for network pattern matching
CN104598987A (zh) * 2014-12-16 2015-05-06 南京华苏科技股份有限公司 一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法
CN104616077A (zh) * 2015-01-30 2015-05-13 南京邮电大学 基于Markov链和关联规则的用户业务行为预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571432A (zh) * 2012-01-10 2012-07-11 中山大学 一种非平稳Web流的监控、预测与仿真方法
US20150049634A1 (en) * 2012-02-20 2015-02-19 Aptima, Inc. Systems and methods for network pattern matching
CN103297956A (zh) * 2013-05-06 2013-09-11 北京航空航天大学 一种基于贝叶斯理论与熵理论的动态轻量级信任评估方法
CN104598987A (zh) * 2014-12-16 2015-05-06 南京华苏科技股份有限公司 一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法
CN104616077A (zh) * 2015-01-30 2015-05-13 南京邮电大学 基于Markov链和关联规则的用户业务行为预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
林璐: "基于马尔科夫毯网络的客户流失分析", 《计算机光盘软件与应用》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110018843A (zh) * 2018-01-09 2019-07-16 北京小度互娱科技有限公司 应用程序运行策略的测试方法和装置
CN110018843B (zh) * 2018-01-09 2022-08-30 北京小度互娱科技有限公司 应用程序运行策略的测试方法和装置
CN108377204A (zh) * 2018-02-13 2018-08-07 中国联合网络通信集团有限公司 一种用户离网的预测方法及装置
CN108377204B (zh) * 2018-02-13 2020-03-24 中国联合网络通信集团有限公司 一种用户离网的预测方法及装置
CN109451527A (zh) * 2018-12-21 2019-03-08 广东宜通世纪科技股份有限公司 一种移动通信用户流失日粒度预测方法及装置
CN109451527B (zh) * 2018-12-21 2019-09-20 宜通世纪科技股份有限公司 一种移动通信用户流失日粒度预测方法及装置
CN113256044A (zh) * 2020-02-13 2021-08-13 中国移动通信集团广东有限公司 一种策略的确定方法、装置及电子设备
CN113256044B (zh) * 2020-02-13 2023-08-15 中国移动通信集团广东有限公司 一种策略的确定方法、装置及电子设备
CN111754341A (zh) * 2020-07-07 2020-10-09 浪潮卓数大数据产业发展有限公司 一种计算小微企业贷款违约概率pd的方法
CN111754341B (zh) * 2020-07-07 2022-07-12 浪潮卓数大数据产业发展有限公司 一种计算小微企业贷款违约概率pd的方法

Also Published As

Publication number Publication date
CN105281959B (zh) 2018-05-04

Similar Documents

Publication Publication Date Title
Zhang et al. Citywide cellular traffic prediction based on densely connected convolutional neural networks
CN105281959A (zh) 一种基于隐马尔可夫模型的移动通信用户流失预测方法
Chu et al. Toward a hybrid data mining model for customer retention
CN103854065A (zh) 一种用于客户流失预测的方法和装置
Al-Zuabi et al. Predicting customer’s gender and age depending on mobile phone data
CN109978608A (zh) 目标用户画像的营销标签分析提取方法及系统
Yang et al. Green internet of things and big data application in smart cities development
CN101821757A (zh) 广告方法、sns广告系统以及记录介质
CN111724039B (zh) 一种向电力用户推荐客服人员的推荐方法
CN110766438B (zh) 一种通过人工智能对电网用户的用户行为进行分析的方法
CN107528761A (zh) 一种微信公众号自动回复信息的方法和系统
CN106204162A (zh) 一种互联网环境下新入网电力用户用电模式预测方法
WO2022057108A1 (zh) 基于联邦学习的个人资质评估方法、装置及系统及存储介质
CN111383093A (zh) 账单逾期智能催收方法及系统
CN111582850A (zh) 基于手机银行的电费充值方法及装置
Maji et al. Data warehouse based analysis on CDR to retain and acquire customers by targeted marketing
CN102196366B (zh) 通信用户组的识别方法及系统
Mitrovic et al. Scalable RFM-enriched representation learning for churn prediction
Rehman et al. Customer churn prediction, segmentation and fraud detection in telecommunication industry
CN102411594B (zh) 一种获取信息的方法及装置
CN104008150A (zh) 一种对社交网络信息传播趋势预测的方法及系统
CN116596640A (zh) 电力零售电费套餐的推荐方法、系统、设备及存储介质
Droftina et al. A diffusion model for churn prediction based on sociometric theory
CN102750288B (zh) 一种互联网内容推荐方法及装置
CN109766541B (zh) 一种营销策略的识别方法、服务器和计算机存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Yu Ruiyun

Inventor after: Gu Ninglun

Inventor after: Cai Xin

Inventor after: Zeng Lingbing

Inventor after: Xia Xingyou

Inventor before: Yu Duanyun

Inventor before: Gu Ninglun

Inventor before: Cai Xin

Inventor before: Zeng Lingbing

Inventor before: Xia Xingyou

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant