CN114374618A - 训练方法、用户欠费离网预测方法及装置 - Google Patents

训练方法、用户欠费离网预测方法及装置 Download PDF

Info

Publication number
CN114374618A
CN114374618A CN202111594899.0A CN202111594899A CN114374618A CN 114374618 A CN114374618 A CN 114374618A CN 202111594899 A CN202111594899 A CN 202111594899A CN 114374618 A CN114374618 A CN 114374618A
Authority
CN
China
Prior art keywords
user
value
grid
predicted
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111594899.0A
Other languages
English (en)
Inventor
张嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202111594899.0A priority Critical patent/CN114374618A/zh
Publication of CN114374618A publication Critical patent/CN114374618A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/24Accounting or billing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本公开实施例公开了训练方法、用户欠费离网预测方法及装置,通过建立用户欠费离网预测模型,并通过上述训练方法对建立的用户欠费离网预测模型进行训练,可以得到训练后的用户欠费离网预测模型。这样可以通过训练后的用户欠费离网预测模型,来预测用户在未来(例如,数月后)是否会欠费离网,以得到存在欠费离网可能性的高风险用户。之后,可以利用监控单元在实际业务发生时对高风险用户进行监控,可以有效地提高对高风险用户进行限制的效率。大大降低了移动通信用户的欠费离网率,减少了移动通信运营商的坏账。

Description

训练方法、用户欠费离网预测方法及装置
技术领域
本公开涉及通信技术领域,特别涉及训练方法、用户欠费离网预测方法及装置。
背景技术
随着移动通信技术的发展,移动通信用户的数量也急剧增加。然而,当某些欠费用户的欠费数额很大时,很可能部分用户不再进行充值,而是放弃使用该移动通信业务,即所谓的欠费离网。当大量的移动通信用户出现欠费离网情况时,将导致移动通信用户的欠费离网率呈上升趋势,从而给运营商造成大量的坏账,对移动通信运营商的经济效益产生了比较大的影响。然而,目前主要是依据工作人员对移动通信用户的历史数据进行分析,确定出潜在的欠费离网用户。而通过工作人员对历史数据进行分析,容易因工作人员主观判断导致确定的潜在欠费离网用户不准确,同时增加了人工的工作量。
发明内容
本公开提供的训练方法、用户欠费离网预测方法及装置,用以预测出潜在的欠费离网用户,降低移动通信运营商的坏账。
本公开实施例提供的训练方法,包括:
建立基于机器学习算法的用户欠费离网预测模型,并依次将所述用户欠费离网预测模型中的欠费离网阈值设置为不同的初始数值;
针对每个所述初始数值,将预先确定出的训练集输入到所述欠费离网阈值设置为所述初始数值时的用户欠费离网预测模型中,输出所述初始数值对应的预测值;所述训练集包括正类样本集和负类样本集;
根据每个所述初始数值对应的预测值,从所述初始数值中确定目标数值;
将所述用户欠费离网预测模型中的欠费离网阈值设置为所述目标数值,得到训练后的用户欠费离网预测模型。
基于上述实施例,本公开实施例的有益效果如下:
通过建立用户欠费离网预测模型,并通过上述训练方法对建立的用户欠费离网预测模型进行训练,可以得到训练后的用户欠费离网预测模型。这样可以通过训练后的用户欠费离网预测模型,来预测用户在未来(例如,数月后)是否会欠费离网,以得到存在欠费离网可能性的高风险用户。之后,可以利用监控单元在实际业务发生时对高风险用户进行监控,可以有效地提高对高风险用户进行限制的效率。大大降低了移动通信用户的欠费离网率,减少了移动通信运营商的坏账。
在一些示例中,所述根据每个所述初始数值对应的预测值,从所述初始数值中确定目标数值,包括:
根据每个所述初始数值对应的预测值,确定ROC曲线;
根据所述ROC曲线,从所述初始数值中确定所述目标数值。
在一些示例中,所述根据每个所述初始数值对应的预测值,确定ROC曲线,包括:
根据每个所述初始数值对应的预测值,确定每个所述初始数值对应的召回率和误报率;
根据每个所述初始数值对应的召回率和误报率,绘制所述ROC曲线;
所述目标数值为所述ROC曲线中最左侧处的召回率和误报率对应的初始数值。
在一些示例中,所述确定训练集包括:
获取正类样本和负样本的基本信息;其中,所述基本信息包括:用户通信信息、月消费金额信息、套餐订购信息、历史停复机记录信息;
确定所述正类样本在连续的多个设定月内用户通信信息的平均值和月消费金额信息的平均值,以及确定所述负类样本在连续的多个设定月内用户通信信息的平均值和月消费金额信息的平均值;
将所述正类样本对应的套餐订购信息、历史停复机记录信息以及确定出的用户通信信息的平均值和月消费金额信息的平均值,作为所述正类样本集;以及将所述负类样本对应的套餐订购信息、历史停复机记录信息以及确定出的用户通信信息的平均值和月消费金额信息的平均值,作为所述负类样本集。
在一些示例中,所述机器学习算法包括逻辑回归算法。
本公开实施例提供的用户欠费离网预测方法,包括:
获取待预测的当前在网用户的预测基本信息;其中,所述预测基本信息包括:所述待预测用户的套餐订购信息、历史停复机记录信息,以及在连续的多个设定月内用户通信信息的平均值和月消费金额信息的平均值;
将所述预测基本信息输入到用户欠费离网预测模型中,确定所述待预测的当前在网用户的预测值;
根据所述预测值,确定所述待预测的当前在网用户的欠费离网情况。
基于上述实施例,本公开实施例的有益效果如下:
通过训练后的用户欠费离网预测模型,来预测用户在未来(例如,数月后)是否会欠费离网,以得到存在欠费离网可能性的高风险用户。之后,可以利用监控单元在实际业务发生时对高风险用户进行监控,可以有效地提高对高风险用户进行限制的效率。大大降低了移动通信用户的欠费离网率,减少了移动通信运营商的坏账。
在一些示例中,所述预测值为二进制数值;
所述根据所述预测值,确定所述待预测的当前在网用户的欠费离网情况,包括:
在所述预测值为1时,确定所述待预测用户不会欠费离网;
在所述预测值为0时,确定所述待预测用户会欠费离网。
在一些示例中,所述预测值为二进制数值;
所述根据所述预测值,确定所述待预测的当前在网用户的欠费离网情况,包括:
在所述预测值为0时,确定所述待预测用户不会欠费离网;
在所述预测值为1时,确定所述待预测用户会欠费离网。
本公开实施例提供的计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,当所述计算机程序被处理器执行时,实现上述训练方法或者上述的用户欠费离网预测方法。
本公开实施例提供的计算机设备,所述计算机设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述训练方法或者上述用户欠费离网预测方法。
本公开实施例的有益效果如下:
本公开提供的训练方法、用户欠费离网预测方法及装置,通过建立用户欠费离网预测模型,并通过上述训练方法对建立的用户欠费离网预测模型进行训练,可以得到训练后的用户欠费离网预测模型。这样可以通过训练后的用户欠费离网预测模型,来预测用户在未来(例如,数月后)是否会欠费离网,以得到存在欠费离网可能性的高风险用户。之后,可以利用监控单元在实际业务发生时对高风险用户进行监控,可以有效地提高对高风险用户进行限制的效率。大大降低了移动通信用户的欠费离网率,减少了移动通信运营商的坏账。
附图说明
图1为本公开实施例中的一些方法的流程图;
图2为本公开实施例中的另一些方法的流程图;
图3为本公开实施例中的又一些方法的流程图;
图4为本公开实施例中的又一些方法的流程图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。并且在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
需要注意的是,附图中各图形的尺寸和形状不反映真实比例,目的只是示意说明本公开内容。并且自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。
结合图1所示,本公开实施例提供一种训练方法,可以包括如下步骤:
S110、建立基于机器学习算法的用户欠费离网预测模型,并依次将用户欠费离网预测模型中的欠费离网阈值设置为不同的初始数值。
示例性地,将用户通信信息的平均值、月消费金额信息的平均值、套餐订购信息、历史停复机记录信息作为特征变量,采用机器学习算法建立用户欠费离网预测模型。例如,机器学习算法可以包括逻辑回归(Logistic Regression)算法,在可以采用逻辑回归算法建立用户欠费离网预测模型,以通过该用户欠费离网预测模型,来预测用户在未来(例如,数月后)是否会欠费离网,以得到存在欠费离网可能性的高风险用户。之后,可以利用监控单元在实际业务发生时对高风险用户进行监控,可以有效地提高对高风险用户进行限制的效率。大大降低了移动通信用户的欠费离网率,减少了移动通信运营商的坏账。
示例性地,欠费离网阈值可以是百分比数值,例如,欠费离网阈值可以设置为20%、30%、40%、50%、60%、70%、80%、90%。当然,在实际应用中,欠费离网阈值也可以设置为其他百分比数值,其可以根据实际应用的需求进行确定,在此不作限定。
S120、针对每个初始数值,将预先确定出的训练集输入到欠费离网阈值设置为初始数值时的用户欠费离网预测模型中,输出初始数值对应的预测值。示例性地,预先确定出的训练集可以包括正类样本集和负类样本集。其中,正类样本集包括确定非欠费离网用户的特征信息。负类样本集包括确定欠费离网用户的特征信息。
示例性地,如图2所示,确定训练集,可以包括如下步骤:
S210、获取正类样本和负样本的基本信息。其中,基本信息包括:用户通信信息、月消费金额信息、套餐订购信息、历史停复机记录信息。示例性地,用户通信信息可以包括流量使用、主叫时长等。
示例性地,正类样本的基本信息可以为非欠费离网用户的基本信息。例如,可以将这些非欠费离网用户的历史用户通信信息、历史月消费金额信息、历史套餐订购信息、历史停复机记录信息作为其基本信息。或者,也可以将这些非欠费离网用户在特定的几个月(例如连续的三个月)中的用户通信信息和月消费金额信息,以及历史套餐订购信息、历史停复机记录信息作为其基本信息。
以及,负类样本的基本信息可以为欠费离网用户的基本信息。例如,可以将这些欠费离网用户的历史用户通信信息、历史月消费金额信息、历史套餐订购信息、历史停复机记录信息作为其基本信息。或者,也可以将这些欠费离网用户在特定的几个月中的用户通信信息和月消费金额信息,以及历史套餐订购信息、历史停复机记录信息作为其基本信息。
在实际应用中,欠费类型的选择主要考虑业务的关注点,比如,同样是欠费用户,有的可能是比较关心语音方面的欠费用户或是欠费金额达到某个级别的用户。在这里划分了五类欠费用户:语音通信欠费类、短消息欠费类、GPRS欠费类、移动互联网欠费类、点播欠费类、综合欠费类,每种类型的欠费用户,其该类欠费金额应达到总欠费金额的70%,如均没有达到70%,则为综合类欠费。
并且,考虑到为了防止移动通信用户欠费离网的风险,在这里,“欠费”是指在月帐出帐后一个月内,用户的欠费费用没有结清的,则该用户为欠费用户。大多数实时欠费用户在一段时间内,都会主动结清已欠费用,并继续正常使用移动通信业务,这类用户不是本公开实施例所关注的对象。
S220、确定正类样本在连续的多个设定月内用户通信信息的平均值和月消费金额信息的平均值,以及确定负类样本在连续的多个设定月内用户通信信息的平均值和月消费金额信息的平均值。
示例性地,正类样本在连续的多个设定月可以是基本信息中用户通信信息和月消费金额信息对应的特定的几个月。这样可以将基本信息中的用户通信信息取平均,得到正类样本的用户通信信息的平均值。或者,也可以在基本信息中的历史用户通信信息中,选取需要的多个月份,以将选取的这些月份中的用户通信信息取平均,得到正类样本的用户通信信息的平均值。
并且,正类样本在连续的多个设定月可以是基本信息中用户通信信息和月消费金额信息对应的特定的几个月。这样可以将基本信息中的月消费金额信息取平均,得到正类样本的月消费金额信息的平均值。或者,也可以在基本信息中的历史月消费金额信息中,选取需要的多个月份,以将选取的这些月份中的月消费金额信息取平均,得到正类样本的月消费金额信息的平均值。
示例性地,负类样本在连续的多个设定月可以是基本信息中用户通信信息和月消费金额信息对应的特定的几个月。这样可以将基本信息中的用户通信信息取平均,得到负类样本的用户通信信息的平均值。或者,也可以在基本信息中的历史用户通信信息中,选取需要的多个月份,以将选取的这些月份中的用户通信信息取平均,得到负类样本的用户通信信息的平均值。
并且,负类样本在连续的多个设定月可以是基本信息中用户通信信息和月消费金额信息对应的特定的几个月。这样可以将基本信息中的月消费金额信息取平均,得到负类样本的月消费金额信息的平均值。或者,也可以在基本信息中的历史月消费金额信息中,选取需要的多个月份,以将选取的这些月份中的月消费金额信息取平均,得到负类样本的月消费金额信息的平均值。
需要说明的是,正类样本在连续的多个设定月和负类样本在连续的多个设定月可以相同,也可以不同,在此不作限定。
S230、将正类样本对应的套餐订购信息、历史停复机记录信息以及确定出的用户通信信息的平均值和月消费金额信息的平均值,作为正类样本集;以及将负类样本对应的套餐订购信息、历史停复机记录信息以及确定出的用户通信信息的平均值和月消费金额信息的平均值,作为负类样本集。
示例性地,将非欠费离网用户对应的套餐订购信息、历史停复机记录信息以及确定出的用户通信信息的平均值和月消费金额信息的平均值,作为非欠费离网用户的特征信息,形成正类样本集。
以及,将欠费离网用户对应的套餐订购信息、历史停复机记录信息以及确定出的用户通信信息的平均值和月消费金额信息的平均值,作为欠费离网用户的特征信息,形成负类样本集。
示例性地,在用户欠费离网预测模型的欠费离网阈值设置为50%时,将预先确定出的训练集,输入该用户欠费离网预测模型中,该用户欠费离网预测模型可以输出正样本集中每一个非欠费离网用户对应的预测值,以及输出负样本中每一个欠费离网用户对应的预测值。
示例性地,在用户欠费离网预测模型的欠费离网阈值设置为40%时,将预先确定出的训练集,输入该用户欠费离网预测模型中,该用户欠费离网预测模型可以输出正样本集中每一个非欠费离网用户对应的预测值,以及输出负样本中每一个欠费离网用户对应的预测值。
示例性地,在用户欠费离网预测模型的欠费离网阈值设置为60%时,将预先确定出的训练集,输入该用户欠费离网预测模型中,该用户欠费离网预测模型可以输出正样本集中每一个非欠费离网用户对应的预测值,以及输出负样本中每一个欠费离网用户对应的预测值。
示例性地,在用户欠费离网预测模型的欠费离网阈值设置为70%时,将预先确定出的训练集,输入该用户欠费离网预测模型中,该用户欠费离网预测模型可以输出正样本集中每一个非欠费离网用户对应的预测值,以及输出负样本中每一个欠费离网用户对应的预测值。
示例性地,在用户欠费离网预测模型的欠费离网阈值设置为80%时,将预先确定出的训练集,输入该用户欠费离网预测模型中,该用户欠费离网预测模型可以输出正样本集中每一个非欠费离网用户对应的预测值,以及输出负样本中每一个欠费离网用户对应的预测值。
其余依次类推,在此不作赘述。
示例性地,预测值可以为二进制数值。例如,在预测值为1时,可以确定非欠费离网用户是属于非欠费离网用户这一类的,以及确定欠费离网用户也是属于非欠费离网用户这一类的。在预测值为0时,可以确定非欠费离网用户是属于欠费离网用户这一类的,以及确定欠费离网用户也是属于欠费离网用户这一类的。
或者,在预测值为0时,可以确定非欠费离网用户是属于非欠费离网用户这一类的,以及确定欠费离网用户也是属于非欠费离网用户这一类的。在预测值为1时,可以确定非欠费离网用户是属于欠费离网用户这一类的,以及确定欠费离网用户也是属于欠费离网用户这一类的。
S130、根据每个初始数值对应的预测值,从初始数值中确定目标数值。
示例性地,可以从这些初始数值对应的预测值中,选取出相比来说最准确的预测值,将该预测值对应的初始数值作为目标数值。
在本公开实施例中,根据每个初始数值对应的预测值,从初始数值中确定目标数值,可以包括:根据每个初始数值对应的预测值,确定ROC曲线;根据ROC曲线,从初始数值中确定目标数值。示例性地,根据每个初始数值对应的预测值,确定ROC曲线,可以包括:根据每个初始数值对应的预测值,确定每个初始数值对应的召回率和误报率;根据每个初始数值对应的召回率和误报率,绘制ROC曲线;目标数值为ROC曲线中最左侧处的召回率和误报率对应的初始数值。
示例性地,如图3所示,步骤S130,具体可以包括如下步骤:
S131、根据每个初始数值对应的预测值,确定每个初始数值对应的召回率(TurePositive Rate,TPR)和误报率(False Positive Rate,FPR)。需要说明的是,TPR和FPR的确定方式可以与现有技术中的基本相同,在此不作赘述。
S132、根据每个初始数值对应的召回率和误报率,绘制接受者操作特性曲线(Receiver Operating Characteristic Curve,ROC曲线)。需要说明的是,根据TPR和FPR绘制ROC曲线的方式可以与现有技术中的基本相同,在此不作赘述。
S133、根据ROC曲线,将ROC曲线中最左侧处的召回率和误报率对应的初始数值确定为目标数值。例如,ROC曲线中最左侧处的召回率和误报率对应的初始数值为60%,则将60%作为目标数值。
S140、将用户欠费离网预测模型中的欠费离网阈值设置为目标数值,得到训练后的用户欠费离网预测模型。
示例性地,根据目标数值对用户欠费离网预测模型中的欠费离网阈值进行调整,从而使用户欠费离网预测模型中的欠费离网阈值设置为作为目标数值的60%,从而可以使训练完成后的用户欠费离网预测模型的预测效果可以达到优化。
本公开实施例还提供一种用户欠费离网预测方法,如图4所示,可以包括如下步骤:
S410、获取待预测的当前在网用户的预测基本信息;其中,预测基本信息包括:待预测用户的套餐订购信息、历史停复机记录信息,以及在连续的多个设定月内用户通信信息的平均值和月消费金额信息的平均值。
示例性地,待预测的当前在网用户的预测基本信息,可以为该当前在网用户的历史用户通信信息、历史月消费金额信息、历史套餐订购信息、历史停复机记录信息作为其基本信息。或者,也可以是该当前在网用户在特定的几个月(例如近三个月)中的用户通信信息和月消费金额信息,以及历史套餐订购信息、历史停复机记录信息作为其基本信息。
S420、将预测基本信息输入到上述训练完成的用户欠费离网预测模型中,确定待预测的当前在网用户的预测值。示例性地,预测值可以为二进制数值。例如,输出的预测值可以为“1”,或者,输出的预测值可以为“0”。
S430、根据预测值,确定待预测的当前在网用户的欠费离网情况。
示例性地,在预测值为1时,确定待预测用户不会欠费离网。在预测值为0时,确定待预测用户会欠费离网。
或者,在预测值为0时,确定待预测用户不会欠费离网。在预测值为1时,确定待预测用户会欠费离网。
本公开实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,当计算机程序被处理器执行时,实现上述训练方法或者上述用户欠费离网预测方法。
本公开实施例还提供了一种计算机设备,计算机设备包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述训练方法或者上述用户欠费离网预测方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种训练方法,其特征在于,包括:
建立基于机器学习算法的用户欠费离网预测模型,并依次将所述用户欠费离网预测模型中的欠费离网阈值设置为不同的初始数值;
针对每个所述初始数值,将预先确定出的训练集输入到所述欠费离网阈值设置为所述初始数值时的用户欠费离网预测模型中,输出所述初始数值对应的预测值;所述训练集包括正类样本集和负类样本集;
根据每个所述初始数值对应的预测值,从所述初始数值中确定目标数值;
将所述用户欠费离网预测模型中的欠费离网阈值设置为所述目标数值,得到训练后的用户欠费离网预测模型。
2.如权利要求1所述的训练方法,其特征在于,所述根据每个所述初始数值对应的预测值,从所述初始数值中确定目标数值,包括:
根据每个所述初始数值对应的预测值,确定ROC曲线;
根据所述ROC曲线,从所述初始数值中确定所述目标数值。
3.如权利要求2所述的训练方法,其特征在于,所述根据每个所述初始数值对应的预测值,确定ROC曲线,包括:
根据每个所述初始数值对应的预测值,确定每个所述初始数值对应的召回率和误报率;
根据每个所述初始数值对应的召回率和误报率,绘制所述ROC曲线;
所述目标数值为所述ROC曲线中最左侧处的召回率和误报率对应的初始数值。
4.如权利要求1-3任一项所述的训练方法,其特征在于,所述确定训练集包括:
获取正类样本和负样本的基本信息;其中,所述基本信息包括:用户通信信息、月消费金额信息、套餐订购信息、历史停复机记录信息;
确定所述正类样本在连续的多个设定月内用户通信信息的平均值和月消费金额信息的平均值,以及确定所述负类样本在连续的多个设定月内用户通信信息的平均值和月消费金额信息的平均值;
将所述正类样本对应的套餐订购信息、历史停复机记录信息以及确定出的用户通信信息的平均值和月消费金额信息的平均值,作为所述正类样本集;以及将所述负类样本对应的套餐订购信息、历史停复机记录信息以及确定出的用户通信信息的平均值和月消费金额信息的平均值,作为所述负类样本集。
5.如权利要求1-3任一项所述的训练方法,其特征在于,所述机器学习算法包括逻辑回归算法。
6.一种用户欠费离网预测方法,其特征在于,包括:
获取待预测的当前在网用户的预测基本信息;其中,所述预测基本信息包括:所述待预测用户的套餐订购信息、历史停复机记录信息,以及在连续的多个设定月内用户通信信息的平均值和月消费金额信息的平均值;
将所述预测基本信息输入到如权利要求1-5任一项所述的用户欠费离网预测模型中,确定所述待预测的当前在网用户的预测值;
根据所述预测值,确定所述待预测的当前在网用户的欠费离网情况。
7.如权利要求6所述的用户欠费离网预测方法,其特征在于,所述预测值为二进制数值;
所述根据所述预测值,确定所述待预测的当前在网用户的欠费离网情况,包括:
在所述预测值为1时,确定所述待预测用户不会欠费离网;
在所述预测值为0时,确定所述待预测用户会欠费离网。
8.如权利要求6所述的用户欠费离网预测方法,其特征在于,所述预测值为二进制数值;
所述根据所述预测值,确定所述待预测的当前在网用户的欠费离网情况,包括:
在所述预测值为0时,确定所述待预测用户不会欠费离网;
在所述预测值为1时,确定所述待预测用户会欠费离网。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,当所述计算机程序被处理器执行时,实现如权利要求1-5任一项所述的训练方法或者如权利要求6-8任一项所述的用户欠费离网预测方法。
10.一种计算机设备,其特征在于,所述计算机设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-5任一项所述的训练方法或者如权利要求6-8任一项所述的用户欠费离网预测方法。
CN202111594899.0A 2021-12-24 2021-12-24 训练方法、用户欠费离网预测方法及装置 Pending CN114374618A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111594899.0A CN114374618A (zh) 2021-12-24 2021-12-24 训练方法、用户欠费离网预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111594899.0A CN114374618A (zh) 2021-12-24 2021-12-24 训练方法、用户欠费离网预测方法及装置

Publications (1)

Publication Number Publication Date
CN114374618A true CN114374618A (zh) 2022-04-19

Family

ID=81141555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111594899.0A Pending CN114374618A (zh) 2021-12-24 2021-12-24 训练方法、用户欠费离网预测方法及装置

Country Status (1)

Country Link
CN (1) CN114374618A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118469041A (zh) * 2024-07-10 2024-08-09 中建五局第三建设(深圳)有限公司 围标检测模型的训练方法、预测方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102076000A (zh) * 2009-11-24 2011-05-25 中国移动通信集团广西有限公司 移动用户欠费监控系统及方法
CN106022505A (zh) * 2016-04-28 2016-10-12 华为技术有限公司 一种预测用户离网的方法及装置
CN110210686A (zh) * 2019-06-13 2019-09-06 郑州轻工业学院 一种电力大数据的电费风险模型构建方法
CN111198907A (zh) * 2019-12-24 2020-05-26 深圳供电局有限公司 潜在欠费用户识别方法、装置、计算机设备和存储介质
CN113256008A (zh) * 2021-05-31 2021-08-13 国家电网有限公司大数据中心 一种欠费风险等级确定方法、装置、设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102076000A (zh) * 2009-11-24 2011-05-25 中国移动通信集团广西有限公司 移动用户欠费监控系统及方法
CN106022505A (zh) * 2016-04-28 2016-10-12 华为技术有限公司 一种预测用户离网的方法及装置
CN110210686A (zh) * 2019-06-13 2019-09-06 郑州轻工业学院 一种电力大数据的电费风险模型构建方法
CN111198907A (zh) * 2019-12-24 2020-05-26 深圳供电局有限公司 潜在欠费用户识别方法、装置、计算机设备和存储介质
CN113256008A (zh) * 2021-05-31 2021-08-13 国家电网有限公司大数据中心 一种欠费风险等级确定方法、装置、设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118469041A (zh) * 2024-07-10 2024-08-09 中建五局第三建设(深圳)有限公司 围标检测模型的训练方法、预测方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN111242700A (zh) 广告的预测点击率获取方法、装置、电子设备和存储介质
CN111581508B (zh) 业务监控方法、装置、设备及存储介质
EP2915081A2 (en) System and method for generating subscriber churn predictions
CN103678514B (zh) 一种业务趋势预测方法及系统
CN101662773A (zh) 支持降低通信欺诈风险的计算机实现方法和设备
CN103796183A (zh) 一种垃圾短信识别方法及装置
CN106878236A (zh) 一种用户请求处理方法和设备
CN109327334A (zh) 一种针对于设备性能的告警方法、装置及设备
CN114374618A (zh) 训练方法、用户欠费离网预测方法及装置
CN108805332B (zh) 一种特征评估方法和装置
CN111091460A (zh) 一种数据处理方法及装置
CN113689125A (zh) 信息推送方法和装置
CN111865665A (zh) 一种网络设备故障自愈方法和装置
CN117495315A (zh) 一种基于pipeline流程的业务管理方法及装置
CN113111139A (zh) 一种基于物联传感器的告警检测方法和装置
CN111598275B (zh) 一种电动汽车信用分评测方法、装置、设备和介质
CN113393325A (zh) 交易检测方法、智能设备及计算机存储介质
CN112905987B (zh) 账号识别方法、装置、服务器及存储介质
CN114997879B (zh) 一种支付路由方法、装置、设备和存储介质
CN110020728B (zh) 业务模型强化学习方法以及装置
CN116645134A (zh) 一种信用卡分期的推荐方法、装置、设备及介质
CN111625720A (zh) 数据决策项目执行策略的确定方法、装置、设备和介质
CN107357703B (zh) 一种终端应用耗电检测方法及服务器
CN111583010A (zh) 一种数据处理方法、装置、设备及存储介质
CN115827232A (zh) 一种为业务模型确定配置的方法、装置、系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination