CN113706187A - 一种基于时空图卷积的电信用户流失行为预测方法及系统 - Google Patents

一种基于时空图卷积的电信用户流失行为预测方法及系统 Download PDF

Info

Publication number
CN113706187A
CN113706187A CN202110787603.0A CN202110787603A CN113706187A CN 113706187 A CN113706187 A CN 113706187A CN 202110787603 A CN202110787603 A CN 202110787603A CN 113706187 A CN113706187 A CN 113706187A
Authority
CN
China
Prior art keywords
data
user
model
behavior
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110787603.0A
Other languages
English (en)
Inventor
蒋云良
沈莅凯
邬惠峰
刘勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202110787603.0A priority Critical patent/CN113706187A/zh
Publication of CN113706187A publication Critical patent/CN113706187A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提出了一种基于时空图卷积的电信用户流失行为预测方法及系统,该预测方法包括以下步骤:L1.获取用户数据,对数据进行标记,根据需求将用户标记为流失或非流失,对数据进行预处理;L2.将数据整理为训练数据集和测试数据集,从空间维度上使用图卷积网络提取用户关系特征,从时间维度上使用LSTM网络提取用户行为特征,生成对应子模型;L3.采用异维度特征相互约束的特性,将提取的特征融合合并,训练融合模型,得到最终的用户流失行为特征;L4.将测试数据转换为符合模型输入的格式并输入模型中,获取用户流失行为结果。本发明通过将人工智能技术应用于用户流失预测问题,通过时空图卷积方法,精准预测用户流失行为,为通讯服务供应商提供策略依据。

Description

一种基于时空图卷积的电信用户流失行为预测方法及系统
【技术领域】
本发明涉及用户行为预测的技术领域,特别是一种基于时空图卷积的电信用户流失行为预测方法及系统。
【背景技术】
得益于互联网行业的发展,网络越来越成为人们生活中必不可少的部分。而人们在网络中的各种活动,也依赖于网络运营商与电商企业的支持。随着互联网行业的不断发展,人口红利的消失,消费市场的用户基础呈断崖式缩减,越来越多的网络运营商与电商企业无法只依赖新用户的增长所带来的收益盈利。供应商们需要不断求变求存,将原本注重用户增量的发展方式转变为注重存量用户的精细化运营方式。因此在这之后的发展中,对于存量用户的挽留,存量用户价值的发掘,更能提升企业的收益。
在网络环境下,用户的所有行为都会产生其所对应的行为数据,这些用户行为数据总量,也在不断地逐年增长。而对这些数据的有效利用,近年来也在开发用户价值领域发挥越来越大的作用。如何从海量的数据中提取有用的特征,分析用户行为特征,以对用户未来的行为进行预估,从而实现用户流失结果的准确预测,这就需要快速定位和预测用户流失行为的技术支持,现提出一种基于时空图卷积的电信用户流失行为预测方法及系统。
【发明内容】
本发明的目的就是解决现有技术中存在的问题,提出一种基于时空图卷积的电信用户流失行为预测方法及系统,能够有效的减少即将流失用户的比例,帮助企业策略者及时使用行之有效的策略,对这些用户进行挽留,减少用户流失。
本发明提出了一种基于时空图卷积的电信用户流失行为预测方法,包括以下步骤:
L1.获取用户数据,并对数据进行标记,根据需求将用户标记为流失或非流失,并对数据进行预处理;
L2.将数据整理为训练数据集和测试数据集,从空间维度上使用图卷积网络提取用户关系特征,从时间维度上使用LSTM网络提取用户行为特征,生成对应子模型;
L3.采用异维度特征相互约束的特性,将提取的特征融合合并,训练融合模型,得到最终的用户流失行为特征;
L4.将测试数据转换为符合模型输入的格式并输入模型中,最终获取用户流失行为结果。
作为优选,步骤L1具体包括以下步骤:
L11.通过Hive将通讯服务供应商的用户数据,根据用户手机号码及其他敏感数据脱敏处理产生的ref_id标签进行存储,包括月数据,日数据,静态数据以及余额数据;
L12.按照定义,某个月语音数据和流量数据同时为0且上个月语音数据或流量数据不为0的用户为已经流失用户,且定义该用户为上个月流失;依据此定义,对存到本地系统的所有用户进行标定,确定流失用户和非流失用户;
L13.对数据进行预处理,依据3σ准则将异常值剔除,将含有缺失值的样本剔除,对于连续性属性,采用如下两种标准化方式进行处理:
Figure BDA0003159660090000021
或者
Figure BDA0003159660090000022
其中xmin,xmax,xmean,σ分别表示数据的最小值,最大值,平均值和标准差;对于离散性变量,采用one-hot进行编码。
作为优选,步骤L2具体包括以下步骤:
L21.对数据集进行划分,从月数据中根据流失标签定义方法抽取流失用户为数据集正样本,非流失用户为数据集负样本,在所有数据中划分为训练集和测试集,保证训练集和测试集的正负样本比例与实际样本分布相同;
L22.预测子模型初始化,设置子模型包括图学习层子模型,图卷积网络子模型以及LSTM子模型,图学习层子模型通过用户自适应的方式,学习用户关系矩阵,图卷积网络子模型结合图学习层输出的自适应矩阵,从月数据中提取用户关系特征,LSTM子模型从日数据以及余额数据中提取用户行为特征;
图学习层子模型:
N1=tanh(βT1η1)
N2=tanh(βT2η2)
其中,T1和T2代表着各个用户的静态数据转化的特征矩阵,η1和η2代表模型参数,β代表控制激活函数的超参数;
M=ReLU(tanh(β(N1N2 T-N2N1 T)))
其中,N1,N2表示特征映射在-1到1之间构建的1*n特征向量,使用激活函数ReLU,tanh对图邻接矩阵进行调整;
for i=1,2,…,K
idx=argtopk(M[i,:])
M[i,-idx]=0
其中,K表示第k个节点,argtopk表示随机选取一定数量节点的函数;
图卷积网络子模型:
Figure BDA0003159660090000031
用以计算Delta算子,f代表一个单射映射,
Figure BDA0003159660090000032
代表任意邻接矩阵,X代表特征,σ代表激活函数;
Figure BDA0003159660090000033
Figure BDA0003159660090000034
Figure BDA0003159660090000035
其中,α是一个超参数,来控制根节点的保留比例;i代表深度,Hin代表上一层输出的输入隐藏状态,Hout代表当前层的输出隐藏状态,W(i)初始化特征;
LSTM子模型:
ot=σ(Wo·[ht-1,xt]+bo),
ft=σ(Wf·[ht-1,xt]+bf)
其中,ht-1表示上一个单元的输出,xt表示当前单元的输入,σ代表激活函数;
Figure BDA0003159660090000036
ht=ot*tanh(Ct),it=σ(Wi·[ht-1,xt]+bi),
Figure BDA0003159660090000037
Wf,Wo,Wi,WC表示对应各个时刻的权重矩阵,bf,bo,bi,bC表示相对应的偏置项;
通过最小化预测值与实际值的误差来更新模型参数,得到最终的子预测模型,通过预测子模型,可以得到用户流失行为特征组;
L23.设置损失函数来处理数据集的非平衡分布,在损失函数部分增加调节系数用于控制正负样本下模型的损失,具体表达如下:
Figure BDA0003159660090000038
其中,
Figure BDA0003159660090000039
表示第i个训练样本预测结果集,yi表示第i个训练样本结果集;
L24.训练预测子模型,将训练数据集按照5折交叉验证进行划分,最终训练集数据的评估结果为5次训练的平均值。
作为优选,步骤L3具体包括以下步骤:
L31.将输入的时间维度数据与提取出的用户关系特征融合,利用用户间关系特征对用户行为特征进行约束的能力,获取更优质特征:
Tin i=[Aout i,Tout i-1]
Tin i表示第i层的用户行为特征提取模块输入的特征,Aout i表示第i层的用户关系特征提取模块输出的特征,Tout i-1表示第i-1层的用户行为特征提取模块输出的特征。
作为优选,步骤L4具体包括以下步骤:
L41.将测试集数据进行预处理,按照模型设计的模型接口格式,生成能够用于模型输入的数据集;
L42.设定评价指标,定义正确率和召回率为分类器最终的评价指标,具体表达如下:
Figure BDA0003159660090000041
其中P表示正确率,R表示召回率;TP表示预测为正样本,且实际也为正样本的样本数,FP表示预测为正样本,但实际为负样本的样本数,FN表示预测为负样本,但实际为正样本的样本数;
L43.基于模型和数据,获得最终的用户流失行为结果。
为实现上述目的,本发明还提出了一种基于时空图卷积的电信用户流失行为预测系统,包括以下模块:
数据收集模块,用于获取用户时间数据、空间维度数据,以及数据的预处理,将用户标记为流失及非流失;
模型训练模块,将数据集划分为训练数据集和测试数据集,使用图学习层学习自适应的用户关系矩阵,之后通过图卷积的方式,从空间维度上提取用户关系特征;再使用LSTM模块从时间维度上提取用户行为特征;建立捕获用户行为特征和用户关系特征的子模型;
特征融合模块,将生成的用户关系特征和用户行为特征进行融合;
输出模块,将融合后的特征输入模块中,输出用户行为结果。
作为优选,所述数据收集模块包括数据采集单元、数据标定单元和数据预处理单元,
数据采集单元:通讯服务供应商的用户数据位于hadoop分布式数据库中,根据用户手机号码及敏感数据脱敏处理产生的ref_id标签,使用hivesql语句将用户数据取出,包括月数据,日数据,静态数据以及余额数据;
数据标定单元:定义某个月语音数据和流量数据同时为0且上个月语音数据或流量数据不为0的用户为已经流失用户,且定义该用户为上个月流失,依据此对用户进行标定;
数据预处理单元,用于处理采集数据的异常值和缺失值,字符串数据的转换,以及数据的标准化。
作为优选,所述模型训练模块包括数据集划分单元、图学习层单元、图卷积单元、LSTM单元、非平衡样本处理单元和子模型训练单元,
数据集划分单元,用于划分训练数据集和测试数据集,从月数据中根据流失标签定义方法抽取当月流失用户为数据集正样本,按1:1抽样负样本,即非流失用户;在所有数据中划分为训练集和测试集,其中训练集和测试集的正负样本比例与实际样本分布相同;
图学习层单元,用于将输入的用户静态数据自适应的学习图邻接矩阵;
图卷积单元,使用基于混合传播的图卷积方法,结合图学习层输出的自适应矩阵,从月数据中提取用户关系特征;
LSTM单元,用于从日数据以及余额数据中提取用户行为特征,通过最小化预测值与实际值的误差来更新模型参数,得到最终的子预测模型;
非平衡样本处理单元,用于修正模型的损失函数,在损失函数部分增加调节系数用于控制正负样本下模型的损失;
子模型训练单元,完成对子预测模型的训练。
作为优选,所述特征融合模块包括用户关系特征与用户行为特征融合模块,基于LSTM模块提取用户行为特征的能力,将输入的时间维度数据与提取出的用户关系特征融合,利用用户间关系特征对用户行为特征进行约束的能力,优化特征。
作为优选,所述输出模块包括测试集数据预处理模块、模型性能评估单元和用户流失行为输出单元,
测试集数据预处理模块,用于将测试集数据进行预处理,按照模型设计的模型接口格式,生成能够用于模型输入的数据集;
模型性能评估单元,用于设定分类器评价指标;
用户流失行为输出单元,用于输出测试集数据的用户流失行为结果。
本发明的有益效果:本发明通过数据收集模块获取用户时间维度数据以及空间维度数据,去除错误数据,并对用户进行流失标签设立。模型训练模块能够将数据集划分为训练数据集和测试数据集,建立捕获用户行为特征和用户关系特征的子模型;特征融合模块能够将子模型的特征进行更多层次的融合;通过输出模块将融合后的特征输入,直接输出用户是否发生了流失行为。本发明将人工智能技术应用于用户流失预测问题,通过时空图卷积方法,精准预测用户流失行为,为通讯服务供应商提供策略依据,有效的减少即将流失用户的比例。
本发明的特征及优点将通过实施例结合附图进行详细说明。
【附图说明】
图1是本发明一种基于时空图卷积的电信用户流失行为预测方法的流程图;
图2是本发明基于端到端模型的用户流失预测模型整体框架示意图;
图3是图1数据收集的具体流程示意图;
图4是图1预测子模型训练的具体流程示意图;
图5是图1特征融合训练的具体流程示意图;
图6是图1用户流失结果预测的具体流程示意图;
图7是数据采集后在本地的存储方式示意图;
图8是用户流失预测模型在测试集上相对于其他模型的效果示意图。
【具体实施方式】
本发明本发明提出了一种基于时空图卷积的电信用户流失行为预测方法,包括以下步骤:
L1.通过数据收集模块合法合规地获取用户数据,并对数据进行标记,根据需求将用户标记为流失或非流失,并对数据进行预处理,具体包括以下步骤:
L11.通过Hive将通讯服务供应商的用户数据,根据用户手机号码及其他敏感数据脱敏处理产生的ref_id标签进行存储,包括月数据,日数据,静态数据以及余额数据;静态数据中包含每个用户自身属性,包括用户的生日,性别,所选用套餐编号,是否进行首次充值及首次充值金额,填写时省份编号;月数据包含用户每个月所产生的用量数据,包括当月话费,月底余额,近30天无语音使用量天数,近30天无流量使用量天数,主动呼叫时长数,被叫时长数,arpu值,语音总使用量,流量总使用量;日数据包括日主叫数据和日被叫数据:日主叫数据包含用户每日用量数据,包括每日主动呼叫次数,主动呼叫号码个数,主动呼叫号码总时长,流量使用量,流量使用时长总和,经过基站数量;日被叫数据包含互拨总次数,互拨总号码次数,互拨总时长;余额数据包含用户每日实时余额记录,包含特征每日实时余额;
L12.按照定义,某个月语音数据和流量数据同时为0且上个月语音数据或流量数据不为0的用户为已经流失用户,且定义该用户为上个月流失;依据此定义,对存到本地系统的所有用户进行标定,确定流失用户和非流失用户;
L13.对数据进行预处理,依据3σ准则将异常值剔除,将含有缺失值的样本剔除,对于连续性属性,采用如下两种标准化方式进行处理:
Figure BDA0003159660090000061
或者
Figure BDA0003159660090000062
其中xmin,xmax,xmean,σ分别表示数据的最小值,最大值,平均值和标准差;对于离散性变量,采用one-hot进行编码。
L2.将数据整理为训练数据集和测试数据集,采用端到端的模式,从空间维度上使用图卷积网络提取用户关系特征,从时间维度上使用LSTM网络提取用户行为特征,生成对应子模型,包括用户行为特征提取模块、用户关系特征提取模块;具体包括以下步骤:
L21.对数据集进行划分,从月数据中根据流失标签定义方法抽取流失用户为数据集正样本,非流失用户为数据集负样本,在所有数据中划分为训练集和测试集,保证训练集和测试集的正负样本比例与实际样本分布相同;
L22.预测子模型初始化,设置子模型包括图学习层子模型,图卷积网络子模型(GCN)以及LSTM子模型(长短时间记忆网络),图学习层子模型通过用户自适应的方式,学习用户关系矩阵,图卷积网络子模型结合图学习层输出的自适应矩阵,从月数据中提取用户关系特征,LSTM子模型从日数据以及余额数据中提取用户行为特征;
图学习层子模型:
N1=tanh(βT1η1)
N2=tanh(βT2η2)
其中,T1和T2代表着各个用户的静态数据转化的特征矩阵,η1和η2代表模型参数,β代表控制激活函数的超参数;
M=ReLU(tanh(β(N1N2 T-N2N1 T)))
其中,N1,N2表示特征映射在-1到1之间构建的1*n特征向量,使用激活函数ReLU,tanh对图邻接矩阵进行调整;
for i=1,2,…,K
idx=argtopk(M[i,:])
M[i,-idx]=0
其中,K表示第k个节点,argtopk表示随机选取一定数量节点的函数;
图卷积网络子模型:
Figure BDA0003159660090000071
用以计算Delta算子,f代表一个单射映射,
Figure BDA0003159660090000072
代表任意邻接矩阵,X代表特征,σ代表激活函数;
Figure BDA0003159660090000081
Figure BDA0003159660090000082
Figure BDA0003159660090000083
其中,α是一个超参数,来控制根节点的保留比例;i代表深度,Hin代表上一层输出的输入隐藏状态,Hout代表当前层的输出隐藏状态,W(i)代表初始化特征;
LSTM子模型:
ot=σ(Wo·[ht-1,xt]+bo),
ft=σ(Wf·[ht-1,xt]+bf)
其中,ht-1表示上一个单元的输出,xt表示当前单元的输入,σ代表激活函数;
Figure BDA0003159660090000084
ht=ot*tanh(Ct),it=σ(Wi·[ht-1,xt]+bi),
Figure BDA0003159660090000085
Wf,Wo,Wi,WC表示对应各个时刻的权重矩阵,bf,bo,bi,bC表示相对应的偏置项;
通过最小化预测值与实际值的误差来更新模型参数,得到最终的子预测模型,通过预测子模型,可以得到用户流失行为特征组;
L23.设置损失函数来处理数据集的非平衡分布,在损失函数部分增加调节系数用于控制正负样本下模型的损失,具体表达如下:
Figure BDA0003159660090000086
其中,
Figure BDA0003159660090000087
表示第i个训练样本预测结果集,yi表示第i个训练样本结果集;当正负样本预测结果越准确,也就是MAE越接近0,那么损失将会变得很小,而对于不确定的样本,损失会增大,也就是说模型更加关注难以分类的样本;
L24.训练预测子模型,将训练数据集按照5折交叉验证进行划分,最终训练集数据的评估结果为5次训练的平均值。
L3.采用异维度特征相互约束的特性,将各模块提取的特征融合合并,训练融合模型,得到最终的用户流失行为特征,具体包括以下步骤:
L31.用基于LSTM模块提取用户行为特征的能力,将输入的时间维度数据与提取出的用户关系特征融合,利用用户间关系特征对用户行为特征进行约束的能力,获取更优质特征:
Tin i=[Aout i,Tout i-1]
Tin i表示第i层的用户行为特征提取模块输入的特征,Aout i表示第i层的用户关系特征提取模块输出的特征,Tout i-1表示第i-1层的用户行为特征提取模块输出的特征。
L4.将测试数据转换为符合模型输入的格式并输入模型中,最终获取用户流失行为结果,具体包括以下步骤:
L41.将测试集数据进行预处理,按照模型设计的模型接口格式,生成能够用于模型输入的数据集;
L42.设定评价指标,定义正确率和召回率为分类器最终的评价指标,具体表达如下:
Figure BDA0003159660090000091
其中P表示正确率,R表示召回率;TP表示预测为正样本,且实际也为正样本的样本数,FP表示预测为正样本,但实际为负样本的样本数,FN表示预测为负样本,但实际为正样本的样本数;
L43.基于模型和数据,获得最终的用户流失行为结果。
本发明还提出了一种基于时空图卷积的电信用户流失行为预测系统,包括以下模块,
数据收集模块,用于获取用户时间数据、空间维度数据,以及数据的预处理,将用户标记为流失及非流失;
模型训练模块,将数据集划分为训练数据集和测试数据集,使用图学习层学习自适应的用户关系矩阵,之后通过图卷积的方式,从空间维度上提取用户关系特征;再使用LSTM模块从时间维度上提取用户行为特征;建立捕获用户行为特征和用户关系特征的子模型;
特征融合模块,将生成的用户关系特征和用户行为特征进行融合;
输出模块,将融合后的特征输入模块中,输出用户行为结果。
进一步地,所述数据收集模块包括数据采集单元、数据标定单元和数据预处理单元,
数据采集单元:通讯服务供应商的用户数据位于hadoop分布式数据库中,根据用户手机号码及其他敏感数据脱敏处理产生的ref_id标签,使用hivesql语句将用户数据取出,包括月数据,日数据,静态数据以及余额数据;静态数据中包含每个用户自身属性,包括用户的生日,性别,所选用套餐编号,是否进行首次充值及首次充值金额,填写时省份编号;月数据包含用户每个月所产生的用量数据,包括当月话费,月底余额,近30天无语音使用量天数,近30天无流量使用量天数,主动呼叫时长数,被叫时长数,arpu值,语音总使用量,流量总使用量;日数据包括日主叫数据和日被叫数据:日主叫数据包含用户每日用量数据,包括每日主动呼叫次数,主动呼叫号码个数,主动呼叫号码总时长,流量使用量,流量使用时长总和,经过基站数量;日被叫数据包含互拨总次数,互拨总号码次数,互拨总时长;余额数据包含用户每日实时余额记录,包含特征每日实时余额;
数据标定单元:定义某个月语音数据和流量数据同时为0且上个月语音数据或流量数据不为0的用户为已经流失用户,且定义该用户为上个月流失,依据此对用户进行标定;
数据预处理单元,用于处理采集数据的异常值和缺失值,字符串数据的转换,以及数据的标准化,标准化的具体表达为;
Figure BDA0003159660090000101
或者
Figure BDA0003159660090000102
其中xmin,xmax,xmean,σ分别表示数据的最小值,最大值,平均值和标准差。
进一步地,所述模型训练模块包括数据集划分单元、图学习层单元、图卷积单元、LSTM单元、非平衡样本处理单元和子模型训练单元,
数据集划分单元,用于划分训练数据集和测试数据集,从月数据中根据流失标签定义方法抽取当月流失用户为数据集正样本,按1:1抽样负样本,即非流失用户;在所有数据中划分为训练集和测试集,其中训练集和测试集的正负样本比例与实际样本分布相同;
图学习层单元,用于将输入的用户静态数据自适应的学习图邻接矩阵,具体表达如下:
N1=tanh(βT1η1)
N2=tanh(βT2η2)
其中,T1和T2代表着各个用户的静态数据转化的特征矩阵,η1和η2代表模型参数,β代表控制激活函数的超参数;
M=ReLU(tanh(β(N1N2 T-N2N1 T)))
其中,N1,N2表示特征映射在-1到1之间构建的1*n特征向量,使用激活函数ReLU,tanh对图邻接矩阵进行调整;
for i=1,2,…,K
idx=argtopk(M[i,:])
M[i,-idx]=0
其中,K表示第k个节点,argtopk表示随机选取一定数量节点的函数;
图卷积单元,使用基于混合传播的图卷积方法,结合图学习层输出的自适应矩阵,从月数据中提取用户关系特征:
Figure BDA0003159660090000103
用以计算Delta算子,f代表一个单射映射,
Figure BDA0003159660090000111
代表任意邻接矩阵,X代表特征,σ代表激活函数;
Figure BDA0003159660090000112
Figure BDA0003159660090000113
Figure BDA0003159660090000114
其中,α是一个超参数,来控制根节点的保留比例;i代表深度,Hin代表上一层输出的输入隐藏状态,Hout代表当前层的输出隐藏状态,W(i)代表初始化特征;
LSTM单元,从日数据以及余额数据中提取用户行为特征:
ot=σ(Wo·[ht-1,xt]+bo),
ft=σ(Wf·[ht-1,xt]+bf)
其中,ht-1表示上一个单元的输出,xt表示当前单元的输入,σ代表激活函数;
Figure BDA0003159660090000115
ht=ot*tanh(Ct),it=σ(Wi·[ht-1,xt]+bi),
Figure BDA0003159660090000116
Wf,Wo,Wi,WC表示对应各个时刻的权重矩阵,bf,bo,bi,bC表示相对应的偏置项;
通过最小化预测值与实际值的误差来更新模型参数,得到最终的子预测模型;
非平衡样本处理单元,用于修正模型的损失函数,在损失函数部分增加调节系数用于控制正负样本下模型的损失,具体表达如下:
Figure BDA0003159660090000117
其中,
Figure BDA0003159660090000118
表示第i个训练样本预测结果集,yi表示第i个训练样本结果集;
子模型训练单元,完成对子预测模型的训练,为了得到整个训练集的评估结果,又确保用来训练的数据不出现在验证集中,使用5-折交叉验证来得到训练集的准确率;将训练集数据均分为5份,每次取其中4份作为训练集数据,另外1份作为验证集数据;依次训练5次模型,最终训练集数据的评估结果为5次训练的平均。
进一步地,所述特征融合模块包括用户关系特征与用户行为特征融合模块,基于LSTM模块提取用户行为特征的能力,将输入的时间维度数据与提取出的用户关系特征融合,利用用户间关系特征对用户行为特征进行约束的能力,获取更优质特征:Tin i=[Aout i,Tout i-1]
其中,Tin i表示第i层的用户行为特征提取模块输入的特征,Aout i表示第i层的用户关系特征提取模块输出的特征,Tout i-1表示第i-1层的用户行为特征提取模块输出的特征。
进一步地,所述输出模块包括测试集数据预处理模块、模型性能评估单元和用户流失行为输出单元,
测试集数据预处理模块,用于将测试集数据进行预处理,按照模型设计的模型接口格式,生成能够用于模型输入的数据集;
模型性能评估单元,用于设定分类器评价指标,定义正确率和召回率为分类器最终的评价指标,具体表达如下:
Figure BDA0003159660090000121
其中,P表示正确率,R表示召回率;TP表示预测为正样本,且实际也为正样本的样本数,FP表示预测为正样本,但实际为负样本的样本数,FN表示预测为负样本,但实际为正样本的样本数,正确率和召回率均期望达到一个较高的值;
用户流失行为输出单元,用于输出测试集数据的用户流失行为结果。
实施例1
在本实施例中所提供的图示仅限于通过示意的方式解释本发明的基本结构,并不代表发明中内部组件的具体连接方式以及物理结构特征。其实施的过程中各个组建的数量、形态以及相对比例可以进行任意的变化,每个模块内部结构也可能会更加复杂。
如图1所示,本发明一种基于时空图卷积的电信用户流失行为预测方法的步骤示意图,通过大数据以及人工智能的思想,对电信行业用户流失情况进行预测,该用户流失预测模型具体包括:
数据收集模块:用于获取用户时间数据以及空间维度数据,将用户状态标记为流失及非流失。数据收集过程主要由hiveSql语句编写,具体过程如图3所示。
子模型训练模块:将数据整理为训练数据集和测试数据集,采用端到端的模型,从多个方面提取数据中的特征,生成预测子模型。预测子模型在Python3.6环境下进行编写,将数据采集模块采集的数据进行整理用来训练预测子模型,将数据分批输入到预测子模型中,通过MAE来训练模型参数,训练后存储最终的训练子模型。具体过程如图4所示。
特征融合模块:用于将子模型输出的特征进行融合,生成特征融合模型。该模块继续用Python3.6进行编写,具体过程如图5所示。将子模型和融合模型组合,生成完整的用户流失结果预测模型,框架如图2所示。
用户流失预测结果输出模块:用于提供数据接口,将测试数据转换为符合模型输入的格式,获取最终的用户流失结果预测结果,具体过程如图6所示。
参阅图3,显示为图1中数据收集模块的具体流程图,如图3所示,具体包括数据采集单元,数据标定单元。
数据采集单元用于采集位于企业服务器中的用户数据,将数据采集到本地,方便后面模型的建立。利用HiveSql语句读取服务器中的数据,根据用户手机号码及其他敏感数据脱敏处理产生的ref_id标签进行存储。其中包括月数据,日数据,静态数据以及余额数据。静态数据中包含每个用户自身属性,包括用户的生日,性别,所选用套餐编号,是否进行首次充值及首次充值金额,填写时省份编号;月数据包含用户每个月所产生的用量数据,包括当月话费,月底余额,近30天无语音使用量天数,近30天无流量使用量天数,主动呼叫时长数,被叫时长数,arpu值,语音总使用量,流量总使用量;日数据包括日主叫数据和日被叫数据:日主叫数据包含用户每日用量数据,包括每日主动呼叫次数,主动呼叫号码个数,主动呼叫号码总时长,流量使用量,流量使用时长总和,经过基站数量;日被叫数据包含互拨总次数,互拨总号码次数,互拨总时长;余额数据包含用户每日实时余额记录,包含特征每日实时余额。采集后的数据文件如图7所示。
数据标定单元用于定义已经流失用户,本发明中采用的定义为某个月语音数据和流量数据同时为0且上个月语音数据或流量数据不为0的用户定义为上个月流失,依据此对用户进行标定。标定后的用户数据属性中会增加一个新的Label属性,Label为1时表示该用户流失,Label为0时表示该用户为非流失用户。
参阅图4,显示为图1中子模型训练模块的具体流程图,如图4所示,具体包括数据预处理单元,数据集划分单元,模型初始化单元,非平衡样本处理单元,损失函数设立单元,图学习层子模型,图卷积子模型,LSTM子模型,子模型训练单元。
数据预处理单元,用于处理采集数据的异常值和缺失值,字符串数据的转换,以及数据的标准化。
数据集划分单元将采集的数据用于划分成训练数据集和测试数据集。从月数据中根据流失标签定义方法抽取当月流失用户为数据集正样本,按1:1抽样负样本,也就是非流失用户。其中训练集和测试集的正负样本比例与实际样本分布相同;
模型初始化单元通过设定用户流失结果预测子模型的初试参数和结构,初始化图学习层子模型,图卷积子模型,LSTM子模型。图学习层子模型,通过自适应的方式,学习合适的图邻接矩阵表达用户间的关系,图卷积子模型使用混合传播图卷积网络,捕获用户关系特征。LSTM子模型,使用长短时间记忆网络(LSTM)捕获用户行为特征,从而让建立的模型能够完备的预测用户流失行为。
模型参数:损失函数使用MAE;LSTM采用三个时间步(2个月),输入大小为31,隐藏层大小为128,层数为3;图学习层,输入大小为4,隐藏层大小为128,输入通道数为4(用户的生日,性别,是否进行首次充值及首次充值金额);图卷积网络有46个离散特征(近三个月的话费、余额、语音、流量、性别年龄等),3个连续特征(最近两个平均基站数、入网日期)和一个多值离散特征(每月top10APP)。整个模型的层数:3,学习率:0.0015,权重衰减:0.0001。
非平衡样本处理单元主要是对模型的损失函数进行调整,在损失函数部分增加调节系数用于控制正负样本下模型的损失,增加正样本的损失,同时减少负样本的损失,也就是让正样本发挥更大的作用。
损失函数设立单元进行损失函数的设立,设立为:
Figure BDA0003159660090000141
其中,
Figure BDA0003159660090000142
表示第i个训练样本预测结果集,yi表示第i个训练样本结果集;
子模型训练单元完成对三个子模型的训练。
参阅图5,显示为特征融合训练的具体流程图,验证集数据经过图学习子模型,图卷积子模型提取用户关系特征,LSTM子模型提取用户行为特征。在特征融合模块中,将用户关系特征与用户行为特征合并,完成最后的用户流失行为预测。并根据结果进行特征融合过程的训练优化。
用户关系特征与用户行为特征融合模块,基于LSTM模块提取用户行为特征的能力,将输入的时间维度数据与提取出的用户关系特征融合,利用用户间关系特征对用户行为特征进行约束的能力,获取更优质特征:
Tin i=[Aout i,Tout i-1]
Tin i表示第i层的用户行为特征提取模块输入的特征,Aout i表示第i层的用户关系特征提取模块输出的特征,Tout i-1表示第i-1层的用户行为特征提取模块输出的特征。
参阅图6,显示为图1中用户流失结果预测模块的具体流程图,如图6所示,具体包括测试集数据预处理单元,模型性能评估单元,用户流失结果输出单元。
测试集数据预处理单元将测试集数据处理成与训练数据相同属性的数据集,模型性能评估单元设置准确率和召回率为最终评价模型的指标,用户流失结果输出单元通过对测试集的预测,完成最终准确率和召回率的输出。
图8显示为融合模型与其他模型的性能对比。将融合模型与随机森林(LR),K近邻(KNN),逻辑回归(RF)进行用户流失结果预测。将预测的结果与真实值进行计算准确率(precision),召回率(recall),Area Under Curve(AUC)进行比较。通过这些指标的比较能够得出:但比较召回率,虽然LR方法较高,但整体结果较不理想。而融合结果在AUC有着较大的结果值,此外准确率与召回率也较为优秀。所以融合模型结果与经典模型相比较,强于经典模型。
上述实施例是对本发明的说明,不是对本发明的限定,任何对本发明简单变换后的方案均属于本发明的保护范围。

Claims (10)

1.一种基于时空图卷积的电信用户流失行为预测方法,其特征在于:包括以下步骤:
L1.获取用户数据,并对数据进行标记,根据需求将用户标记为流失或非流失,并对数据进行预处理;
L2.将数据整理为训练数据集和测试数据集,从空间维度上使用图卷积网络提取用户关系特征,从时间维度上使用LSTM网络提取用户行为特征,生成对应子模型;
L3.采用异维度特征相互约束的特性,将提取的特征融合合并,训练融合模型,得到最终的用户流失行为特征;
L4.将测试数据转换为符合模型输入的格式并输入模型中,最终获取用户流失行为结果。
2.如权利要求1所述的一种基于时空图卷积的电信用户流失行为预测方法,其特征在于:步骤L1具体包括以下步骤:
L11.通过Hive将通讯服务供应商的用户数据,根据用户手机号码及敏感数据脱敏处理产生的ref_id标签进行存储,包括月数据,日数据,静态数据以及余额数据;
L12.按照定义,某个月语音数据和流量数据同时为0且上个月语音数据或流量数据不为0的用户为已经流失用户,且定义该用户为上个月流失;依据此定义,对存到本地系统的所有用户进行标定,确定流失用户和非流失用户;
L13.对数据进行预处理,依据3σ准则将异常值剔除,将含有缺失值的样本剔除,对于连续性属性,采用如下两种标准化方式进行处理:
Figure FDA0003159660080000011
或者
Figure FDA0003159660080000012
其中xmin,xmax,xmean,σ分别表示数据的最小值,最大值,平均值和标准差;对于离散性变量,采用one-hot进行编码。
3.如权利要求1所述的一种基于时空图卷积的电信用户流失行为预测方法,其特征在于:步骤L2具体包括以下步骤:
L21.对数据集进行划分,从月数据中根据流失标签定义方法抽取流失用户为数据集正样本,非流失用户为数据集负样本,在所有数据中划分为训练集和测试集,保证训练集和测试集的正负样本比例与实际样本分布相同;
L22.预测子模型初始化,设置子模型包括图学习层子模型,图卷积网络子模型以及LSTM子模型,图学习层子模型通过用户自适应的方式,学习用户关系矩阵,图卷积网络子模型结合图学习层输出的自适应矩阵,从月数据中提取用户关系特征,LSTM子模型从日数据以及余额数据中提取用户行为特征;
图学习层子模型:
N1=tanh(βT1η1)
N2=tanh(βT2η2)
其中,T1和T2代表着各个用户的静态数据转化的特征矩阵,η1和η2代表模型参数,β代表控制激活函数的超参数;
M=ReLU(tanh(β(N1N2 T-N2N1 T)))
其中,N1,N2表示特征映射在-1到1之间构建的1*n特征向量,使用激活函数ReLU,tanh对图邻接矩阵进行调整;
for i=1,2,…,K
idx=argtopk(M[i,:])
M[i,-idx]=0
其中,K表示第k个节点,argtopk表示随机选取一定数量节点的函数;
图卷积网络子模型:
Figure FDA0003159660080000021
用以计算Delta算子,f代表一个单射映射,
Figure FDA0003159660080000022
代表任意邻接矩阵,X代表特征,σ代表激活函数;
Figure FDA0003159660080000023
Figure FDA0003159660080000024
Figure FDA0003159660080000025
其中,α是一个超参数,来控制根节点的保留比例;i代表深度,Hin代表上一层输出的输入隐藏状态,Hout代表当前层的输出隐藏状态,W(i)代表初始化特征;
LSTM子模型:
ot=σ(Wo·[ht-1,xt]+bo),
ft=σ(Wf·[ht-1,xt]+bf)
其中,ht-1表示上一个单元的输出,xt表示当前单元的输入,σ代表激活函数;
Figure FDA0003159660080000026
ht=ot*tanh(Ct),it=σ(Wi·[ht-1,xt]+bi),
Figure FDA0003159660080000031
Wf,Wo,Wi,WC表示对应各个时刻的权重矩阵,bf,bo,bi,bC表示相对应的偏置项;
通过最小化预测值与实际值的误差来更新模型参数,得到最终的子预测模型,通过预测子模型,可以得到用户流失行为特征组;
L23.设置损失函数来处理数据集的非平衡分布,在损失函数部分增加调节系数用于控制正负样本下模型的损失,具体表达如下:
Figure FDA0003159660080000032
其中,
Figure FDA0003159660080000033
表示第i个训练样本预测结果集,yi表示第i个训练样本结果集;
L24.训练预测子模型,将训练数据集按照5折交叉验证进行划分,最终训练集数据的评估结果为5次训练的平均值。
4.如权利要求1所述的一种基于时空图卷积的电信用户流失行为预测方法,其特征在于:步骤L3具体包括以下步骤:
L31.将输入的时间维度数据与提取出的用户关系特征融合,利用用户间关系特征对用户行为特征进行约束的能力,获取特征:
Tin i=[Aout i,Tout i-1]
Tin i表示第i层的用户行为特征提取模块输入的特征,Aout i表示第i层的用户关系特征提取模块输出的特征,Tout i-1表示第i-1层的用户行为特征提取模块输出的特征。
5.如权利要求1所述的一种基于时空图卷积的电信用户流失行为预测方法,其特征在于:步骤L4具体包括以下步骤:
L41.将测试集数据进行预处理,按照模型设计的模型接口格式,生成能够用于模型输入的数据集;
L42.设定评价指标,定义正确率和召回率为分类器最终的评价指标,具体表达如下:
Figure FDA0003159660080000034
其中P表示正确率,R表示召回率;TP表示预测为正样本,且实际也为正样本的样本数,FP表示预测为正样本,但实际为负样本的样本数,FN表示预测为负样本,但实际为正样本的样本数;
L43.基于模型和数据,获得最终的用户流失行为结果。
6.一种基于时空图卷积的电信用户流失行为预测系统,其特征在于:包括以下模块,
数据收集模块,用于获取用户时间数据、空间维度数据,以及数据的预处理,将用户标记为流失及非流失;
模型训练模块,将数据集划分为训练数据集和测试数据集,使用图学习层学习自适应的用户关系矩阵,之后通过图卷积的方式,从空间维度上提取用户关系特征;再使用LSTM模块从时间维度上提取用户行为特征;建立捕获用户行为特征和用户关系特征的子模型;
特征融合模块,将生成的用户关系特征和用户行为特征进行融合;
输出模块,将融合后的特征输入模块中,输出用户行为结果。
7.如权利要求6所述的一种基于时空图卷积的电信用户流失行为预测系统,其特征在于:所述数据收集模块包括数据采集单元、数据标定单元和数据预处理单元,
数据采集单元:通讯服务供应商的用户数据位于hadoop分布式数据库中,根据用户手机号码及敏感数据脱敏处理产生的ref_id标签,使用hivesql语句将用户数据取出,包括月数据,日数据,静态数据以及余额数据;
数据标定单元:定义某个月语音数据和流量数据同时为0且上个月语音数据或流量数据不为0的用户为已经流失用户,且定义该用户为上个月流失,依据此对用户进行标定;
数据预处理单元,用于处理采集数据的异常值和缺失值,字符串数据的转换,以及数据的标准化。
8.如权利要求6所述的一种基于时空图卷积的电信用户流失行为预测系统,其特征在于:所述模型训练模块包括数据集划分单元、图学习层单元、图卷积单元、LSTM单元、非平衡样本处理单元和子模型训练单元,
数据集划分单元,用于划分训练数据集和测试数据集,从月数据中根据流失标签定义方法抽取当月流失用户为数据集正样本,按1:1抽样负样本,即非流失用户;在所有数据中划分为训练集和测试集,其中训练集和测试集的正负样本比例与实际样本分布相同;
图学习层单元,用于将输入的用户静态数据自适应的学习图邻接矩阵;
图卷积单元,使用基于混合传播的图卷积方法,结合图学习层输出的自适应矩阵,从月数据中提取用户关系特征;
LSTM单元,从日数据以及余额数据中提取用户行为特征,通过最小化预测值与实际值的误差来更新模型参数,得到最终的子预测模型;
非平衡样本处理单元,用于修正模型的损失函数,在损失函数部分增加调节系数用于控制正负样本下模型的损失;
子模型训练单元,完成对子预测模型的训练。
9.如权利要求6所述的一种基于时空图卷积的电信用户流失行为预测系统,其特征在于:所述特征融合模块包括用户关系特征与用户行为特征融合模块,基于LSTM模块提取用户行为特征的能力,将输入的时间维度数据与提取出的用户关系特征融合,利用用户间关系特征对用户行为特征进行约束的能力,优化特征。
10.如权利要求6所述的一种基于时空图卷积的电信用户流失行为预测系统,其特征在于:所述输出模块包括测试集数据预处理模块、模型性能评估单元和用户流失行为输出单元,
测试集数据预处理模块,用于将测试集数据进行预处理,按照模型设计的模型接口格式,生成能够用于模型输入的数据集;
模型性能评估单元,用于设定分类器评价指标;
用户流失行为输出单元,用于输出测试集数据的用户流失行为结果。
CN202110787603.0A 2021-07-13 2021-07-13 一种基于时空图卷积的电信用户流失行为预测方法及系统 Pending CN113706187A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110787603.0A CN113706187A (zh) 2021-07-13 2021-07-13 一种基于时空图卷积的电信用户流失行为预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110787603.0A CN113706187A (zh) 2021-07-13 2021-07-13 一种基于时空图卷积的电信用户流失行为预测方法及系统

Publications (1)

Publication Number Publication Date
CN113706187A true CN113706187A (zh) 2021-11-26

Family

ID=78648650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110787603.0A Pending CN113706187A (zh) 2021-07-13 2021-07-13 一种基于时空图卷积的电信用户流失行为预测方法及系统

Country Status (1)

Country Link
CN (1) CN113706187A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114389962A (zh) * 2021-12-27 2022-04-22 中国电信股份有限公司 宽带流失用户确定方法、装置、电子设备和存储介质
CN115145899A (zh) * 2022-06-29 2022-10-04 广东工业大学 一种基于制造企业数据空间的时空数据异常检测方法
CN115633366A (zh) * 2022-11-04 2023-01-20 中国联合网络通信集团有限公司 用户离网预测方法、装置及计算机可读存储介质
WO2023115876A1 (zh) * 2021-12-24 2023-06-29 深圳前海微众银行股份有限公司 一种信息处理方法及装置、存储介质
CN116934385A (zh) * 2023-09-15 2023-10-24 山东理工昊明新能源有限公司 用户流失预测模型的构建方法、用户流失预测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109272332A (zh) * 2018-08-02 2019-01-25 华南理工大学 一种基于递归神经网络的客户流失预测方法
CN109886755A (zh) * 2019-03-04 2019-06-14 深圳微品致远信息科技有限公司 一种基于进化算法的通讯用户流失预测方法及系统
CN109919685A (zh) * 2019-03-18 2019-06-21 苏州大学 客户流失预测方法、装置、设备及计算机可读存储介质
CN111538873A (zh) * 2019-12-23 2020-08-14 浙江大学 一种基于端对端模型的电信客户流失概率预测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109272332A (zh) * 2018-08-02 2019-01-25 华南理工大学 一种基于递归神经网络的客户流失预测方法
CN109886755A (zh) * 2019-03-04 2019-06-14 深圳微品致远信息科技有限公司 一种基于进化算法的通讯用户流失预测方法及系统
CN109919685A (zh) * 2019-03-18 2019-06-21 苏州大学 客户流失预测方法、装置、设备及计算机可读存储介质
CN111538873A (zh) * 2019-12-23 2020-08-14 浙江大学 一种基于端对端模型的电信客户流失概率预测方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SAMI ABU-EL-HAIJA等: "Mixhop: Higher-order graph convolutional architectures via sparsified neighborhood mixing", PROCEEDINGS OF THE 36TH INTERNATIONAL CONFERENCE ON MACHINE LEARNING , PMLR 97, 19 June 2019 (2019-06-19), pages 21 - 29 *
ZONGHAN WU等: "Connecting the dots:Multivariate time series forecasting with graph neural networks", PROCEEDINGS OF THE 26TH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY & DATA MINING, 24 August 2020 (2020-08-24), pages 753 - 763, XP058987387, DOI: 10.1145/3394486.3403118 *
徐子伟 等: "基于分步特征提取和组合分类器的电信客户流失预测模型", 微型机与应用, vol. 35, no. 13, 10 July 2016 (2016-07-10), pages 51 - 54 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023115876A1 (zh) * 2021-12-24 2023-06-29 深圳前海微众银行股份有限公司 一种信息处理方法及装置、存储介质
CN114389962A (zh) * 2021-12-27 2022-04-22 中国电信股份有限公司 宽带流失用户确定方法、装置、电子设备和存储介质
CN115145899A (zh) * 2022-06-29 2022-10-04 广东工业大学 一种基于制造企业数据空间的时空数据异常检测方法
CN115633366A (zh) * 2022-11-04 2023-01-20 中国联合网络通信集团有限公司 用户离网预测方法、装置及计算机可读存储介质
CN116934385A (zh) * 2023-09-15 2023-10-24 山东理工昊明新能源有限公司 用户流失预测模型的构建方法、用户流失预测方法及装置
CN116934385B (zh) * 2023-09-15 2024-01-19 山东理工昊明新能源有限公司 用户流失预测模型的构建方法、用户流失预测方法及装置

Similar Documents

Publication Publication Date Title
CN113706187A (zh) 一种基于时空图卷积的电信用户流失行为预测方法及系统
CN112633962B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN108829766B (zh) 一种兴趣点推荐方法、系统、设备及计算机可读存储介质
CN111611488B (zh) 基于人工智能的信息推荐方法、装置、电子设备
US20230401833A1 (en) Method, computer device, and storage medium, for feature fusion model training and sample retrieval
CN112612908A (zh) 自然资源知识图谱构建方法、装置、服务器及可读存储器
CN112200375B (zh) 预测模型生成方法、预测模型生成装置和计算机可读介质
CN109787821B (zh) 一种大规模移动客户流量消费智能预测方法
CN110502702A (zh) 用户行为预测方法以及装置
CN110955828A (zh) 一种基于深度神经网络的多因素嵌入个性化套餐推荐方法
CN110378739B (zh) 一种数据流量匹配方法及装置
CN117575858B (zh) 一种智能排课系统的管理方法、系统及存储介质
CN110378526A (zh) 基于gw及svr的汽车站移动流量预测方法、系统及存储介质
Peng et al. Research on telecom customer churn prediction based on ga-xgboost and shap
CN116258923A (zh) 图像识别模型训练方法、装置、计算机设备和存储介质
CN114881348A (zh) 智能外呼时段预测方法、装置、计算机设备及存储介质
CN112532429B (zh) 一种基于位置信息的多变量QoS预测方法
CN113282821A (zh) 基于高维会话数据融合的智能应用预测方法、装置及系统
CN113239272A (zh) 一种网络管控系统的意图预测方法和意图预测装置
CN111242656A (zh) 一种基于电信大数据的用户信用评价方法及系统
CN114417817B (zh) 一种会话信息切割方法和装置
CN112822045B (zh) 基于多特征混合神经网络的内容传播热区预测方法
CN115495573A (zh) 一种特定业务类型App的高效准确分类方法
CN118171698A (zh) 神经网络模型量化方法
CN117909975A (zh) 一种基于图卷积神经网络的安卓恶意软件检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination