CN108712279B - 用户离网的预测方法及装置 - Google Patents

用户离网的预测方法及装置 Download PDF

Info

Publication number
CN108712279B
CN108712279B CN201810389327.0A CN201810389327A CN108712279B CN 108712279 B CN108712279 B CN 108712279B CN 201810389327 A CN201810389327 A CN 201810389327A CN 108712279 B CN108712279 B CN 108712279B
Authority
CN
China
Prior art keywords
data
network
user
telecommunication network
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810389327.0A
Other languages
English (en)
Other versions
CN108712279A (zh
Inventor
许丹丹
刘静沙
刘颖慧
刘楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201810389327.0A priority Critical patent/CN108712279B/zh
Publication of CN108712279A publication Critical patent/CN108712279A/zh
Application granted granted Critical
Publication of CN108712279B publication Critical patent/CN108712279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种用户离网的预测方法及装置,该方法包括:获取待预测用户的电信网络数据;对电信网络数据进行特征提取,形成电信网络数据的特征数据;根据特征数据及优化后的预测算法,对待预测用户预设时间段后的离网参数进行预测,由于优化后的预测算法为对预设时间段后的离网参数进行预测的优化后的算法,所以能够对预设时间段后的离网参数进行预测,能够为后续维挽措施预留时间,能够根据离网参数对高危离网用户进行有效的挽留。

Description

用户离网的预测方法及装置
技术领域
本发明实施例涉及电信技术领域,尤其涉及一种用户离网的预测方法及装置。
背景技术
用户是电信网络运营的基础,是业务需求和收入的根本来源。然而对于用户来说看,用户可根据自身的需求来选择电信运营商,但用户的需求可能会发生变化,导致用户转网现象的发生。而对电信网络运营商而言,用户的转网即离网。为了提高自身的竞争力争取更多的客户资源,如何对用户离网进行预测并在用户离网前进行挽留,成为电信网络运营商关注的焦点。
现有技术中对用户离网的预测方法多数情况下是根据以往专家经验,通过少量的用户数据进行简单的离网预测。
所以现有技术中的用户离网的预测方法并没有为后续维挽措施预留时间,导致无法对高危离网用户进行有效的挽留。
发明内容
本发明实施例提供一种用户离网的预测方法及装置,解决了现有技术中的用户离网的预测方法并没有为后续维挽措施预留时间,导致无法对高危离网用户进行有效的挽留的技术问题。
本发明实施例提供一种用户离网的预测方法,包括:
获取待预测用户的电信网络数据;
对所述电信网络数据进行特征提取,形成所述电信网络数据的特征数据;
根据所述特征数据及优化后的预测算法,对所述待预测用户预设时间段后的离网参数进行预测;
其中,所述优化后的预测算法为对预设时间段后的离网参数进行预测的优化后的算法。
进一步地,如上所述的方法,所述根据所述特征数据及优化后的预测算法,对所述待预测用户预设时间段后的离网参数进行预测之前,还包括:
获取样本数据,每个所述样本数据包括对应用户的电信网络数据及预设时间段后的实际离网状态数据;
对所述样本数据进行预处理;
获取训练集和测试集中的样本数据;
对所述训练集和所述测试集中的样本数据进行特征提取,形成每个样本数据的特征数据;
将所述训练集和所述测试集中的特征数据输入到预测算法中,对所述预测算法进行优化,以获得所述优化后的预测算法。
进一步地,如上所述的方法,对所述样本数据进行预处理,具体包括:
剔除所述样本数据中的干扰样本数据;
确定样本数据中的在网用户和离网用户的比例为预设比例。
进一步地,如上所述的方法,所述对所述电信网络数据进行特征提取,形成所述电信网络数据的特征数据,具体包括:
对所述电信网络数据进行格式化处理;
以计数、比例、差值为指标对所述电信网络数据进行特征数据的构造;
以特征数据的相关度或差异度或显著度为指标进行特征数据的选择,形成所述电信网络数据的特征数据。
进一步地,如上所述的方法,所述根据所述特征数据及优化后的预测算法,对所述待预测用户预设时间段后的离网参数进行预测之后,还包括:
获取两组高危离网用户的电信网络数据,所述高危离网用户为所述离网参数中的离网概率大于预设阈值的用户;
根据所述电信网络数据确定相匹配的维挽措施,并向所述第一组高危离网用户通过移动终端推送所述维挽措施;
根据所述两组高危离网用户的实际离网率计算所述维挽措施的提升率。
本发明实施例提供一种用户离网的预测装置,包括:
获取模块,用于获取待预测用户的电信网络数据;
特征提取模块,用于对所述电信网络数据进行特征提取,形成所述电信网络数据的特征数据;
预测模块,用于根据所述特征数据及优化后的预测算法,对所述待预测用户预设时间段后的离网参数进行预测;
其中,所述优化后的预测算法为对预设时间段后的离网参数进行预测的优化后的算法。
进一步地,如上所述的装置,还包括:预处理模块及优化模块;
所述获取模块,还用于获取样本数据,每个所述样本数据包括对应用户的电信网络数据及预设时间段后的实际离网状态数据;
所述预处理模块,用于对所述样本数据进行预处理;
所述获取模块,还用于获取训练集和测试集中的样本数据;
所述特征提取模块,还用于对所述训练集和所述测试集中的样本数据进行特征提取,形成每个样本数据的特征数据;
所述优化模块,用于将所述训练集和所述测试集中的特征数据输入到预测算法中,对所述预测算法进行优化,以获得所述优化后的预测算法。
进一步地,如上所述的装置,所述预处理模块,具体用于:
剔除所述样本数据中的干扰样本数据;确定样本数据中的在网用户和离网用户的比例为预设比例。
进一步地,如上所述的装置,所述特征提取模块,具体用于:
对所述电信网络数据进行格式化处理;以计数、比例、差值为指标对所述电信网络数据进行特征数据的构造;以特征数据的相关度或差异度或显著度为指标进行特征数据的选择,形成所述电信网络数据的特征数据。
进一步地,如上所述的装置,还包括:推送模块及计算模块;
所述获取模块,还用于获取两组高危离网用户的电信网络数据,所述高危离网用户为所述离网参数中的离网概率大于预设阈值的用户;
所述推送模块,用于根据所述电信网络数据确定相匹配的维挽措施,并向所述第一组高危离网用户通过移动终端推送所述维挽措施;
所述计算模块,用于根据所述两组高危离网用户的实际离网率计算所述维挽措施的提升率。
本发明实施例提供一种用户离网的预测方法及装置,通过获取待预测用户的电信网络数据;对电信网络数据进行特征提取,形成电信网络数据的特征数据;根据特征数据及优化后的预测算法,对待预测用户预设时间段后的离网参数进行预测,由于优化后的预测算法为对预设时间段后的离网参数进行预测的优化后的算法,所以能够对预设时间段后的离网参数进行预测,能够为后续维挽措施预留时间,能够根据离网参数对高危离网用户进行有效的挽留。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明用户离网的预测方法实施例一的流程图;
图2为本发明用户离网的预测方法实施例二的流程图;
图3为本发明用户离网的预测装置实施例一的结构示意图;
图4为本发明用户离网的预测装置实施例二的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
图1为本发明用户离网的预测方法实施例一的流程图,如图1所示,本实施例的执行主体为用户离网的预测装置,该用户离网的预测装置可以集成在计算机、平板设备、服务器、或者有独立计算和处理能力的其他设备中,以网页、客户端或其他方式向用户提供服务。则本实施例提供的用户离网的预测方法包括以下几个步骤。
步骤101,获取待预测用户的电信网络数据。
具体地,本实施例中,可通过与电信网络数据存储设备通信获取待预测用户的电信网络数据。
其中,待预测用户为当前在网用户。
本实施例中,电信网络数据至少包括:用户基本数据,当前账单数据及历史账单数据。
其中,用户基本数据至少包括:用户姓名、联系方式、年龄、性别、星座、入网时间、业务类型、所在地市等用户静态信息。当前账单数据至少包括:当月的通话次数、当月的通话费用、当月的上网时长、当月的上网流量、当月的充值次数等数据。历史账单数据至少包括:预设时间段前的单月话费、单月余额、单月流量使用情况及单月剩余流量等数据。
其中,预设时间段可以为三个月,六个月,或其他适宜的时间段。
步骤102,对电信网络数据进行特征提取,形成电信网络数据的特征数据。
具体地,本实施例中,获取待预测用户的电信网络数据后,对电信网络数据进行格式化处理,处理成统一格式后,以计数、比例、差值为指标进行特征数据的构造,形成电信网络数据的特征数据。
步骤103,根据特征数据及优化后的预测算法,对待预测用户预设时间段后的离网参数进行预测。
其中,优化后的预测算法为对预设时间段后的离网参数进行预测的优化后的算法。
本实施例中,该优化后的预测算法可以为逻辑回归算法,决策树算法,随机森林算法,支持向量机算法等机器学习算法,本实施例中对此不做限定。
具体地,本实施例中,将特征数据输入到优化后的预测算法中,由于该优化后的预测算为对预设时间段后的离网参数进行预测的优化后的算法,所以能够对待预测用户预设时间段后的离网参数进行预测。
本实施例中,优化后的预测算法是通过将训练样本和测试样本中的每个样本的特征数据输入到预测算法中,对预测算法进行优化后得到的。其中,训练样本和测试样本的每个样本数据包括对应用户的电信网络数据及预设时间段后的实际离网状态数据,预设时间段后的实际离网状态数据中“1”表示离网状态,“0”表示在网状态。
其中,离网参数可以为离网概率和/或在网离网状态数据。其中,离网概率为0-1之间的一个数值,在网离网状态数据中,“1”表示离网状态,“0”表示在网状态。
本实施例提供的用户离网的预测方法,通过获取待预测用户的电信网络数据;对电信网络数据进行特征提取,形成电信网络数据的特征数据;根据特征数据及优化后的预测算法,对待预测用户预设时间段后的离网参数进行预测,由于优化后的预测算法为对预设时间段后的离网参数进行预测的优化后的算法,所以能够对预设时间段后的离网参数进行预测,能够为后续维挽措施预留时间,能够根据离网参数对高危离网用户进行有效的挽留。
图2为本发明用户离网的预测方法实施例二的流程图,如图2所示,本实施例提供的用户离网的预测方法,是在本发明用户离网的预测方法实施例一的基础上,对步骤102的进一步细化,并且还包括了获取优化后的预测算法的步骤,以及向高危离网用户推送维挽措施计算维挽措施对应的提升率的步骤,则本实施例提供的用户离网的预测方法包括以下步骤。
步骤201,获取样本数据。
其中,每个样本数据包括对应用户的电信网络数据及预设时间段后的实际离网状态数据,即每个样本数据对应一个用户的电信网络数据及预设时间段后的实际离网状态数据。其中,预设时间段后的实际离网状态数据中可以用“1”表示离网状态,“0”表示在网状态。
本实施例中,获取的每个样本数据的用户的电信网络数据至少包括:用户基本数据,当前账单数据及历史账单数据。同理,用户基本数据至少包括:用户姓名、联系方式、年龄、性别、星座、入网时间、业务类型、所在地市等用户静态信息。当前账单数据至少包括:当月的通话次数、当月的通话费用、当月的上网时长、当月的上网流量、当月的充值次数等数据。历史账单数据至少包括:预设时间段前的单月话费、单月余额、单月流量使用情况及单月剩余流量等数据。
步骤202,对样本数据进行预处理。
进一步地,本实施例中,对样本数据进行预处理,具体包括:
首先,剔除样本数据中的干扰样本数据。
具体地,本实施例中,由于在存储样本数据的数据库中有时不能及时对样本数据的电信网络数据进行更新,导致存在一些干扰样本数据,该干扰样本数据可以为三无用户的样本数据,该三无用户的样本数据为该用户的电信网络数据被记录,但用户的真实状态为已经离网状态,其对用户离网预测的结果影响较大,进行剔除。
其次,确定样本数据中的在网用户和离网用户的比例为预设比例。
具体地,本实施例中,由于现实中离网用户相对全网用户数据占比较少,针对不同的省分、地市用户,在网用户有可能比例超过99%,数据分布的不平稳导致不能反映离网预测行为,所以确定样本数据中的在网用户和离网用户的比例为预设比例,该预设比例可以为5:1,或其他适宜的比例,以能够反映离网预测行为。
步骤203,获取训练集和测试集中的样本数据。
具体地,本实施例中,训练集和测试集中的样本数据的在网用户和离网用户的比例也可以为预设比例。
步骤204,对训练集和测试集中的样本数据进行特征提取,形成每个样本数据的特征数据。
进一步地,本实施例中,对训练集和测试集中的样本数据进行特征提取,形成每个样本数据的特征数据,具体包括:
首先,对样本数据的电信网络数据进行格式化处理。
举例说明为:时间数据的转化为1117代码能识别的时间格式。数据中“%”的格式转化为浮点值。将入网时长数据中入网时长大于6个月的转化为0,入网时长小于6个月的转化为1。对缺失值进行补充,首先确定缺失的种类,是完全随机缺失、随机缺失或完全非随机缺失,进而选择缺失值的处理方法为补缺或是仅作为一种状态。
然后,以计数、比例、差值为指标对样本数据进行特征数据的构造。
具体地,由于在样本数据中,电信网络数据中存在当前账单数据及历史账单数据。当前账单数据及历史账单数据中有多种数据,有些数据需要以计数为指标进行特征数据构造,有些数据需要以比例为指标进行构造,有些数据需要以差值为指标进行特征构造。
举例说明为:对于计数指标而言,用户历史上预设时间段的通话次数进行求和并计数,对用户历史上预设时间段的消费总额进行求和并计数。对于比例指标而言,计算超套餐的流量占总流量的比例。对于差值而言,计算用户的套餐及相关业务变动的标准差。用户历史上变动套餐的波动率等。
最后,以特征数据的相关度或差异度或显著度为指标进行特征数据的选择,形成样本数据的特征数据。
具体地,本实施例中,在以相关度为指标进行特征数据的选择时,计算两两数据的相关度,当两两数据的相关度大于预设相关度阈值时,只需保留一个特征数据。在以差异度为指标进行特征数据的选择时,差异度以方差膨胀因子(简称:VIF)衡量,选择VIF小于预设方差膨胀因子阈值的特征数据。在以显著度为指标进行特征数据的选择时,显著度以信息值衡量,选择信息值大于预设信息阈值的特征数据。
步骤205,将训练集和测试集中的特征数据输入到预测算法中,对预测算法进行优化,以获得优化后的预测算法。
具体地,本实施例中,将训练集和测试集中的特征数据输入到预测算法的初始模型中,以回归系数及模型负责度为衡量标准,进行预测算法模型的参数估计。同时以超参数优化方法来实现参数寻优过程中的多重参数指标的自由组合,进行最优参数的自动筛选。
可以理解的是,本实施例中,步骤201-步骤205并非在每次对用户离网进行预测时均执行,在初次形成优化后的预测模型,或定期对优化后的预测模型进行更新时,需要执行步骤201-步骤205。
步骤206,获取待预测用户的电信网络数据。
本实施例中,步骤206的实现方式与本发明用户离网的预测方法实施例一中的步骤101的实现方式相同。
步骤207,对电信网络数据进行特征提取,形成电信网络数据的特征数据。
进一步地,本实施例中,对电信网络数据进行特征提取,形成电信网络数据的特征数据,具体包括:
首先,对电信网络数据进行格式化处理。
其次,以计数、比例、差值为指标对电信网络数据进行特征数据的构造。
最后,以特征数据的相关度或差异度或显著度为指标进行特征数据的选择,形成电信网络数据的特征数据。
本实施例中,对电信网络数据进行特征提取的方法与本发明用户离网的预测方法实施例二中的步骤204中对训练集和测试集中的样本数据进行特征提取的方法相似,在此不再一一赘述。
步骤208,根据特征数据及优化后的预测算法,对待预测用户预设时间段后的离网参数进行预测。
进一步地,本实施例中,将特征数据输入到优化后的预测算法中,输出待预测用户预设时间段后的离网参数,该离网参数包括离网概率及在网离网状态数据。其中,离网概率为0-1之间的一个数值,在网离网状态数据中,“1”表示离网状态,“0”表示在网状态。
可选地,本实施例中,还可输出影响用户离网的具有较高权重的特征数据,为推送维挽措施提供依据。
本实施例中,以在网离网状态数据及离网概率为目标字段,便于用户群体的细粒度划分,保障了对用户预测的在网、离网离散值的标定的同时,提供了根据离网概率来动态筛选高危离网用户群体的方法。
其中,将离散概率大于预设离散概率阈值的用户确定为高危离网用户。
步骤209,获取两组高危离网用户的电信网络数据,高危离网用户为离网参数中的离网概率大于预设阈值的用户,根据电信网络数据确定相匹配的维挽措施,并向第一组高危离网用户通过移动终端推送维挽措施,根据两组高危离网用户的实际离网率计算维挽措施的提升率。
进一步地,本实施例中,获取两组高危离网用户的电信网络数据,对第一组高危离网用户的电信网络数据进行分析,分析影响该组高危离网用户离网的主要原因,根据主要原因确定相匹配的维挽措施,向第一组高危离网用户通过移动终端推送的维挽措施,在预设时间段后,获取第一组高危离网用户实际离网率,并获取第二组未推送维挽措施的高危离网用户的实际离网率,计算两组高危离网用户的实际离网率的差值,该差值即为维挽措施的提升率。
本实施例提供的用户离网的预测方法,获取样本数据,对样本数据进行预处理,获取训练集和测试集中的样本数据,对训练集和测试集中的样本数据进行特征提取,形成每个样本数据的特征数据,将训练集和测试集中的特征数据输入到预测算法中,对预测算法进行优化,以获得优化后的预测算法,获取待预测用户的电信网络数据,对电信网络数据进行特征提取,形成电信网络数据的特征数据,根据特征数据及优化后的预测算法,对待预测用户预设时间段后的离网参数进行预测,不仅能够对预设时间段后的离网参数进行预测,而且通过对样本数据的预处理和特征提取,提高了预测结果的精确度。
本实施例提供的用户离网的预测方法,通过根据特征数据及优化后的预测算法,对待预测用户预设时间段后的离网参数进行预测之后,还包括:获取两组高危离网用户的电信网络数据,高危离网用户为离网参数中的离网概率大于预设阈值的用户;根据电信网络数据确定相匹配的维挽措施,并向第一组高危离网用户通过移动终端推送维挽措施;根据两组高危离网用户的实际离网率计算维挽措施的提升率,能够为推出有效的维挽措施指引方向。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图3为本发明用户离网的预测装置实施例一的结构示意图,如图3所示,本实施例提供的用户离网的预测装置包括:获取模块31,特征提取模块32及预测模块33。
其中,获取模块31,用于获取待预测用户的电信网络数据。特征提取模块32,用于对电信网络数据进行特征提取,形成电信网络数据的特征数据。预测模块33,用于根据特征数据及优化后的预测算法,对待预测用户预设时间段后的离网参数进行预测。
其中,优化后的预测算法为对预设时间段后的离网参数进行预测的优化后的算法。
本实施例提供的用户离网的预测装置可以执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图4为本发明用户离网的预测装置实施例二的结构示意图,如图4所示,本实施例提供的用户离网的预测装置在本发明用户离网的预测装置实施例一的基础上,进一步地,还包括:预处理模块41,优化模块42,推送模块43及计算模块44。
进一步地,获取模块31,还用于获取样本数据,每个样本数据包括对应用户的电信网络数据及预设时间段后的实际离网状态数据。预处理模块41,用于对样本数据进行预处理。获取模块31,还用于获取训练集和测试集中的样本数据。特征提取模块32,还用于对训练集和测试集中的样本数据进行特征提取,形成每个样本数据的特征数据。优化模块42,用于将训练集和测试集中的特征数据输入到预测算法中,对预测算法进行优化,以获得优化后的预测算法。
进一步地,预处理模块41,具体用于:剔除样本数据中的干扰样本数据;确定样本数据中的在网用户和离网用户的比例为预设比例。
进一步地,特征提取模块32,具体用于:对电信网络数据进行格式化处理;以计数、比例、差值为指标对电信网络数据进行特征数据的构造;以特征数据的相关度或差异度或显著度为指标进行特征数据的选择,形成电信网络数据的特征数据。
进一步地,获取模块31,还用于获取两组高危离网用户的电信网络数据,高危离网用户为离网参数中的离网概率大于预设阈值的用户。推送模块43,用于根据电信网络数据确定相匹配的维挽措施,并向第一组高危离网用户通过移动终端推送维挽措施。计算模块44,用于根据两组高危离网用户的实际离网率计算维挽措施的提升率。
本实施例提供的用户离网的预测装置可以执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (8)

1.一种用户离网的预测方法,其特征在于,包括:
获取待预测用户的电信网络数据;
对所述电信网络数据进行特征提取,形成所述电信网络数据的特征数据;
根据所述特征数据及优化后的预测算法,对所述待预测用户预设时间段后的离网参数进行预测;
其中,所述优化后的预测算法为对预设时间段后的离网参数进行预测的优化后的算法;
电信网络数据至少包括:用户基本数据,当前账单数据及历史账单数据;
所述对所述电信网络数据进行特征提取,形成所述电信网络数据的特征数据,具体包括:
对所述电信网络数据进行格式化处理;
以计数、比例、差值为指标对所述电信网络数据进行特征数据的构造;
以特征数据的相关度或差异度或显著度为指标进行特征数据的选择,形成所述电信网络数据的特征数据;
其中,在以相关度为指标进行特征数据的选择时,计算两两数据的相关度,当两两数据的相关度大于预设相关度阈值时,将其中的一个数据确定为特征数据;
在以差异度为指标进行特征数据的选择时,差异度以方差膨胀因子衡量,选择方差膨胀因子小于预设方差膨胀因子阈值的特征数据;
在以显著度为指标进行特征数据的选择时,显著度以信息值衡量,选择信息值大于预设信息阈值的特征数据;
所述当前账单数据至少包括:当月的通话次数、当月的通话费用、当月的上网时长、当月的上网流量、当月的充值次数;
所述历史账单数据至少包括:预设时间段前的单月话费、单月余额、单月流量使用情况及单月剩余流量。
2.根据权利要求1所述的方法,其特征在于,所述根据所述特征数据及优化后的预测算法,对所述待预测用户预设时间段后的离网参数进行预测之前,还包括:
获取样本数据,每个所述样本数据包括对应用户的电信网络数据及预设时间段后的实际离网状态数据;
对所述样本数据进行预处理;
获取训练集和测试集中的样本数据;
对所述训练集和所述测试集中的样本数据进行特征提取,形成每个样本数据的特征数据;
将所述训练集和所述测试集中的特征数据输入到预测算法中,对所述预测算法进行优化,以获得所述优化后的预测算法。
3.根据权利要求2所述的方法,其特征在于,对所述样本数据进行预处理,具体包括:
剔除所述样本数据中的干扰样本数据;
确定样本数据中的在网用户和离网用户的比例为预设比例。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据所述特征数据及优化后的预测算法,对所述待预测用户预设时间段后的离网参数进行预测之后,还包括:
获取两组高危离网用户的电信网络数据,所述高危离网用户为所述离网参数中的离网概率大于预设阈值的用户;
根据所述电信网络数据确定相匹配的维挽措施,并向第一组高危离网用户通过移动终端推送所述维挽措施;
根据所述两组高危离网用户的实际离网率计算所述维挽措施的提升率。
5.一种用户离网的预测装置,其特征在于,包括:
获取模块,用于获取待预测用户的电信网络数据;
特征提取模块,用于对所述电信网络数据进行特征提取,形成所述电信网络数据的特征数据;
预测模块,用于根据所述特征数据及优化后的预测算法,对所述待预测用户预设时间段后的离网参数进行预测;
其中,所述优化后的预测算法为对预设时间段后的离网参数进行预测的优化后的算法;
电信网络数据至少包括:用户基本数据,当前账单数据及历史账单数据;
所述特征提取模块,具体用于:
对所述电信网络数据进行格式化处理;以计数、比例、差值为指标对所述电信网络数据进行特征数据的构造;以特征数据的相关度或差异度或显著度为指标进行特征数据的选择,形成所述电信网络数据的特征数据;
其中,在以相关度为指标进行特征数据的选择时,计算两两数据的相关度,当两两数据的相关度大于预设相关度阈值时,将其中的一个数据确定为特征数据;
在以差异度为指标进行特征数据的选择时,差异度以方差膨胀因子衡量,选择方差膨胀因子小于预设方差膨胀因子阈值的特征数据;
在以显著度为指标进行特征数据的选择时,显著度以信息值衡量,选择信息值大于预设信息阈值的特征数据;
所述当前账单数据至少包括:当月的通话次数、当月的通话费用、当月的上网时长、当月的上网流量、当月的充值次数;
所述历史账单数据至少包括:预设时间段前的单月话费、单月余额、单月流量使用情况及单月剩余流量。
6.根据权利要求5所述的装置,其特征在于,还包括:预处理模块及优化模块;
所述获取模块,还用于获取样本数据,每个所述样本数据包括对应用户的电信网络数据及预设时间段后的实际离网状态数据;
所述预处理模块,用于对所述样本数据进行预处理;
所述获取模块,还用于获取训练集和测试集中的样本数据;
所述特征提取模块,还用于对所述训练集和所述测试集中的样本数据进行特征提取,形成每个样本数据的特征数据;
所述优化模块,用于将所述训练集和所述测试集中的特征数据输入到预测算法中,对所述预测算法进行优化,以获得所述优化后的预测算法。
7.根据权利要求6所述的装置,其特征在于,所述预处理模块,具体用于:
剔除所述样本数据中的干扰样本数据;确定样本数据中的在网用户和离网用户的比例为预设比例。
8.根据权利要求5-7中任一项所述的装置,其特征在于,还包括:推送模块及计算模块;
所述获取模块,还用于获取两组高危离网用户的电信网络数据,所述高危离网用户为所述离网参数中的离网概率大于预设阈值的用户;
所述推送模块,用于根据所述电信网络数据确定相匹配的维挽措施,并向第一组高危离网用户通过移动终端推送所述维挽措施;
所述计算模块,用于根据所述两组高危离网用户的实际离网率计算所述维挽措施的提升率。
CN201810389327.0A 2018-04-27 2018-04-27 用户离网的预测方法及装置 Active CN108712279B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810389327.0A CN108712279B (zh) 2018-04-27 2018-04-27 用户离网的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810389327.0A CN108712279B (zh) 2018-04-27 2018-04-27 用户离网的预测方法及装置

Publications (2)

Publication Number Publication Date
CN108712279A CN108712279A (zh) 2018-10-26
CN108712279B true CN108712279B (zh) 2021-08-17

Family

ID=63867486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810389327.0A Active CN108712279B (zh) 2018-04-27 2018-04-27 用户离网的预测方法及装置

Country Status (1)

Country Link
CN (1) CN108712279B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113543117B (zh) * 2020-04-22 2022-10-04 中国移动通信集团重庆有限公司 携号转网用户的预测方法、装置及计算设备
CN112200375B (zh) * 2020-10-15 2023-08-29 中国联合网络通信集团有限公司 预测模型生成方法、预测模型生成装置和计算机可读介质
CN113115301B (zh) * 2021-03-15 2022-11-22 中国联合网络通信集团有限公司 一种确定方法、设备以及可读存储介质
CN115633366A (zh) * 2022-11-04 2023-01-20 中国联合网络通信集团有限公司 用户离网预测方法、装置及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1897573A (zh) * 2006-06-30 2007-01-17 南京联创科技股份有限公司 基于神经网络改进算法的电信客户流失预测方法
CN104866922A (zh) * 2015-05-22 2015-08-26 中国联合网络通信集团有限公司 一种用户离网的预测方法及装置
CN105447583A (zh) * 2014-07-30 2016-03-30 华为技术有限公司 一种预测用户离网的方法及装置
CN106022505A (zh) * 2016-04-28 2016-10-12 华为技术有限公司 一种预测用户离网的方法及装置
CN106203679A (zh) * 2016-06-27 2016-12-07 武汉斗鱼网络科技有限公司 一种用户流失预测方法及系统
CN107609708A (zh) * 2017-09-25 2018-01-19 广州赫炎大数据科技有限公司 一种基于手机游戏商店的用户流失预测方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1897573A (zh) * 2006-06-30 2007-01-17 南京联创科技股份有限公司 基于神经网络改进算法的电信客户流失预测方法
CN105447583A (zh) * 2014-07-30 2016-03-30 华为技术有限公司 一种预测用户离网的方法及装置
CN104866922A (zh) * 2015-05-22 2015-08-26 中国联合网络通信集团有限公司 一种用户离网的预测方法及装置
CN106022505A (zh) * 2016-04-28 2016-10-12 华为技术有限公司 一种预测用户离网的方法及装置
CN106203679A (zh) * 2016-06-27 2016-12-07 武汉斗鱼网络科技有限公司 一种用户流失预测方法及系统
CN107609708A (zh) * 2017-09-25 2018-01-19 广州赫炎大数据科技有限公司 一种基于手机游戏商店的用户流失预测方法及系统

Also Published As

Publication number Publication date
CN108712279A (zh) 2018-10-26

Similar Documents

Publication Publication Date Title
CN108712279B (zh) 用户离网的预测方法及装置
CN112633962B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN102082703A (zh) 业务支撑系统设备性能监控的方法及装置
CN111915156B (zh) 基于用户价值的业务推送方法、电子设备及存储介质
CN110991875A (zh) 一种平台用户质量评估系统
CN108923996A (zh) 一种容量分析方法及装置
CN111162925A (zh) 网络流量预测方法、装置、电子设备及存储介质
CN113312578B (zh) 一种数据指标的波动归因方法、装置、设备、及介质
CN111340606A (zh) 一种全流程收入稽核方法和装置
CN106408325A (zh) 基于用户支付信息的用户消费行为预测分析方法及系统
CN115797005A (zh) 预测模型的训练、商品推荐方法、装置、电子设备及介质
CN111415027A (zh) 构建件量预测模型的方法和装置
CN114782123A (zh) 一种信用评估方法及系统
US20210027319A1 (en) Method and system for collecting and analyzing data to generate performance forecasts for assets
CN113643061A (zh) 一种基于大数据机器学习智能投放系统
CN107784511A (zh) 一种用户流失预测方法及装置
CN115271282A (zh) 基于模糊逻辑的客户价值确定方法及装置
CN115170153A (zh) 一种基于多维属性的工单处理方法、装置及存储介质
CN110472863B (zh) 一种预警指数评价方法、装置及存储介质
Havrylovych et al. Survival analysis methods for churn prevention in telecommunications industry.
CN113205391A (zh) 基于历史订单匹配度的派单方法、电子设备和计算机可读介质
CN111026863A (zh) 客户行为预测方法、装置、设备及介质
CN115759733B (zh) 基于业务事件的用户违约风险确定方法、装置、介质及设备
CN112419050B (zh) 基于电话通讯网络和社交行为的信用评估方法及装置
CN117291640A (zh) 消费行为识别的方法及装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant