CN108156025A - 一种用户离网预测的方法及装置 - Google Patents
一种用户离网预测的方法及装置 Download PDFInfo
- Publication number
- CN108156025A CN108156025A CN201711327730.2A CN201711327730A CN108156025A CN 108156025 A CN108156025 A CN 108156025A CN 201711327730 A CN201711327730 A CN 201711327730A CN 108156025 A CN108156025 A CN 108156025A
- Authority
- CN
- China
- Prior art keywords
- broadband
- network
- account
- broadband account
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请提供一种用户离网预测的方法,涉及通信领域,能够有效地预测宽带用户的离网情况,保证宽带用户的体验。该方法包括:获取宽带账户各自对应的宽带关联数据,一个宽带账户对应至少一个终端,宽带关联数据为反映终端对宽带的依赖程度;根据宽带账户各自对应的宽带关联数据创建决策树;根据决策树,对网络中的目标宽带账户进行离网预测。
Description
技术领域
本申请涉及通信领域,尤其涉及一种用户离网预测的方法及装置。
背景技术
对于运营商而言,用户离网体现在以下几方面:(1)用户从本运营商转网到其他电信运营商(2)用户平均消费量降低。通常,当用户离网后,运营商收益显著下降,因此,如何避免用户离网,成为运营商极为关注的问题,基于此,运营商需提前感知用户是否即将离网,即运营商需对用户离网进行预测,以便于运营商采取特定措施来提升待离网用户的体验,挽留待离网的用户。
目前,在移动网用户中,预测用户离网的方法是获取注册终端的操作信息,计算该终端的平均活跃度,若预定时间段内的终端平均活跃度值呈下降趋势,则确定该终端用户为待离网的用户,例如,若用户的月资费降低或者通话时长下降,则该用户很可能即将离网。
但是,由于目前主流的宽带用户均采取包年措施,一般均在合同到期后更换宽带运营商,在此之前,并不会出现流量减少、资费降低的情况,因此,采取上述的用户离网预测方案并不能有效地对宽带用户的离网情况进行预测,不能保证宽带用户的体验。
发明内容
本申请提供一种用户离网预测的方法及装置,能够有效地预测宽带用户的离网情况,保证宽带用户的体验。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供一种用户离网预测方法,该方法可以包括:
获取预设数量的宽带账户各自对应的宽带关联数据,一个宽带账户对应至少一个终端,所述宽带关联数据为反映终端对宽带的依赖程度;根据预设数量的宽带账户各自对应的宽带关联数据创建决策树;根据所述决策树,对网络中的目标宽带账户进行离网预测。
第二方面,本申请提供一种用户离网预测的装置,该装置包括:获取模块、创建模块和预测模块。
其中,获取模块,用于获取宽带账户对应的宽带关联数据,一个宽带账户对应至少一个终端,所述宽带关联数据为反映终端对所述宽带的依赖程度;创建模块,用于根据宽带账户对应的宽带关联数据创建决策树;预测模块,用于根据所述决策树,对网络中的目标宽带账户进行离网预测。
第三方面,本申请提供一种用户离网预测的装置,该装置包括:处理器、收发器和存储器。其中,存储器用于存储一个或多个程序,一个或多个程序包括指令,当装置运行时,处理器执行存储器存储的指令,以使装置执行第一方面及其各种可选的实现方式中任意之一所述的用户离网预测方法。
第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有一个或多个程序,一个或多个程序包括计算机执行指令,当该装置的处理器执行该计算机执行指令时,该装置执行上述第一方面及其各种可选的实现方式中任意之一所述的用户离网预测方法。
本申请提供的用户离网预测的方法及装置,根据宽带账户的特点,获取与宽带账户对应的宽带关联数据,然后根据宽带关联数据创建相应的决策树,并利用决策树对目标宽带账户的离网情况进行预测。由于获取的宽带关联数据反映终端对宽带的依赖程度,所以,根据宽带关联数据创建的决策树也能反映出终端对宽带的依赖程度,然后根据决策树判断目标账户对宽带的依赖程度,进而能够有效地判断出目标账户是否即将离网。
附图说明
图1为本申请实施例提供的一种用户离网预测方法示意图;
图2为本申请实施例提供的一种决策树的示例性示意图;
图3为本申请实施例提供的另一种用户离网预测方法示意图;
图4为本申请实施例提供的一种用户离网预测装置的结构示意图一;
图5为本申请实施例提供的一种用户离网预测装置的结构示意图二;
图6为本申请实施例提供的一种用户离网预测装置的结构示意图三。
具体实施方式
下面结合附图对本申请实施例提供的用户离网预测方法及装置进行详细地描述。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
本申请实施例提供一种用户离网预测方法,如图1所示,该方法可以包括S101-S103:
S101、获取宽带账户各自对应的宽带关联数据。
需要说明的是,本申请实施例提供的用户离网预测方法的执行主体可以为用户离网预测的装置,该装置可以为数据分析平台。
其中,一个宽带账户对应至少一个终端,一个宽带账户可以为一个家庭或企业的宽带账户,每个家庭或企业的宽带账户对应的局域网可向多个终端提供宽带服务。示例性地,宽带账户为家庭宽带账户,该家庭宽带账户对应的局域网内有终端1、终端2和终端3,则该局域网可以为终端1、终端2和终端3提供宽带服务。
上述宽带关联数据为反映终端对宽带的依赖程度。宽带关联数据具有以下至少一种属性:
宽带账户对应的终端的活跃时长、宽带账户对应的终端的总流量、宽带账户对应的入网时长、宽带账户对应的签约到期情况、宽带账户对应的签约网络带宽、宽带账户对应的网络类型、宽带账户对应的业务类型、宽带账户对应的网络协议电视(InternetProtocol Television,IPTV)业务的开通情况以及宽带账户对应的网络故障次数,网络类型包括城镇网络类型和乡村网络类型,业务类型包括视频业务类型、网页业务类型和网游业务类型,在活跃时长内终端的每小时的流量大于或等于流量阈值且终端的流量在秒量级呈现均匀分布。
需要说明的是,在存在网络攻击的场景下,由于网络攻击往往集中在一小段时间内,所以,很可能在1小时内,前55分钟内终端流量较小,而后5分钟内终端流量突增,在这种场景下,终端的流量并非主动产生,所以,会影响最终预测结果的准确性。因此,在本申请实施例中,活跃时间段指的是在一个小时的大部分时间段内均产生流量,且每个时间段内产生流量大致相近的时间段。
表1
属性 | 属性的具体值 |
入网时长 | 已入网2年(2015-10-10至2017-10-10) |
是否在2个月内签约到期 | 否 |
网络带宽 | 20M |
网络类型 | 城镇网络类型 |
是否开通IPTV | 已开通IPTV |
活跃时长 | 18:00至22:00(4小时) |
总流量 | 20G |
业务类型 | 视频业务类型 |
每年故障次数 | 2次 |
是否已离网 | 否 |
例如,如表1为宽带账户1的宽带关联数据,假定现在时间为2017年10月10日,家庭宽带账户1于2015年10月10日入网,则家庭宽带账户的入网时长为2年;家庭宽带账户1的签约时限为3年,则家庭宽带账户1的签约到期时间为2018年10月10日,也就是家庭宽带账户1在2个月内并没有签约到期;家庭宽带账户1的签约网络带宽为20M;宽带账户1的网络类型为城镇网络类型;该宽带账户1已开通IPTV业务;假定该家庭局域网内,终端1至终端3均在18:00至22:00产生较多的流量,则如表1所示,该家庭宽带账户1对应的活跃时间为18:00至22:00,家庭宽带账户1对应的活跃时长为4小时;在18:00至22:00时间段内,终端1至终端3产生的总流量为20G;且终端1至终端3使用宽带的主要目的是观看视频,则如表1所示,该家庭宽带账户1的业务类型为视频业务类型;该家庭宽带账户1入网2年来,平均每年网络故障次数为2次。
作为一种可能的实现方式,数据分析平台从验证、授权和记账(Authentication、Authorization、Accounting,AAA)服务器获取各个宽带账户的认证信息。然后,从客服后台服务器获取各个宽带账户的签约信息,包括宽带账户对应的签约网络类型、签约到期情况、是否开通IPTV业务、网络故障次数、宽带网络保修情况以及宽带网络投诉情况等。
数据分析平台还可以采用域名系统(Domain Name System,DNS)技术获取终端访问的网址记录,通过netflow技术从宽带远程接入服务器(Broadband Remote AccessServer,BRAS)获取终端上网所用端口、协议和流量,再通过数据包深度检测(Deep PacketInspection,DPI)技术对上网数据包的载荷进行检测,从而识别出业务类型。具体地,当终端访问的内容中有网游、网页和视频时,根据各个业务类型所占比例确定最终的业务类型,例如,终端访问的内容中网游占30%、网页占10%、视频占50%、其他类型业务内容占10%,则将终端的业务类型确定为视频业务类型。
家庭宽带账户2对应的宽带关联数据如表2所示:
表2
属性 | 属性的具体值 |
入网时长 | 已入网1年(2016-10-10至2017-10-10) |
是否在2个月内签约到期 | 否 |
网络带宽 | 20M |
网络类型 | 城镇网络类型 |
是否开通IPTV | 已开通IPTV |
活跃时长 | 18:00至22:00(4小时) |
总流量 | 500G |
业务类型 | 视频业务类型 |
每年故障次数 | 2次 |
是否已离网 | 否 |
家庭宽带账户3对应的宽带关联数据如表3所示:
表3
家庭宽带账户4对应的宽带关联数据如表4所示:
表4
属性 | 属性的具体值 |
入网时长 | 已入网2年(2015-10-10至2017-10-10) |
是否在2个月内签约到期 | 否 |
网络带宽 | 20M |
网络类型 | 城镇网络类型 |
是否开通IPTV | 已开通IPTV |
活跃时长 | 18:00至22:00(4小时) |
总流量 | 50G |
业务类型 | 视频业务类型 |
每年故障次数 | 2次 |
是否已离网 | 否 |
家庭宽带账户5对应的宽带关联数据如表5所示:
表5
属性 | 属性的具体值 |
入网时长 | 已入网2年(2015-10-10至2017-10-10) |
是否在2个月内签约到期 | 否 |
网络带宽 | 20M |
网络类型 | 城镇网络类型 |
是否开通IPTV | 已开通IPTV |
活跃时长 | 18:00至22:00(4小时) |
总流量 | 8G |
业务类型 | 视频业务类型 |
每年故障次数 | 2次 |
是否已离网 | 是 |
家庭宽带账户6对应的宽带关联数据如表6所示:
表6
家庭宽带账户7对应的宽带关联数据如表7所示:
表7
属性 | 属性的具体值 |
入网时长 | 已入网2年(2015-10-10至2017-10-10) |
是否在2个月内签约到期 | 否 |
网络带宽 | 20M |
网络类型 | 城镇网络类型 |
是否开通IPTV | 已开通IPTV |
活跃时长 | 18:00至22:00(4小时) |
总流量 | 250G |
业务类型 | 视频业务类型 |
每年故障次数 | 2次 |
是否已离网 | 否 |
家庭宽带账户8对应的宽带关联数据如表8所示:
表8
S102、根据宽带账户对应的宽带关联数据创建决策树。
具体地,S102可以实现为S1021至S1023。
S1021、计算宽带账户对应的宽带关联数据中各个属性对应的熵值,单个属性对应的熵值为在单个属性的条件下宽带账户离网的熵值。单个属性对应的熵值其中,单个属性具有至少一个子属性,pi为子属性i在单个属性中出现的概率,entropyi为在子属性i的条件下宽带账户离网的熵值。
例如,针对总流量这一属性,可以将总流量划分为3个等级,5G至10G为低流量、10G至100G为中流量、100G以上为高流量,即总流量这一属性具有3个子属性:低流量、中流量和高流量。则根据表1至表8,获得表9。
表9
宽带账户 | 子属性 | 是否离网 |
宽带账户5 | 低流量(8G) | 是 |
宽带账户8 | 低流量(9G) | 否 |
宽带账户1 | 中流量(20G) | 否 |
宽带账户3 | 中流量(15G) | 是 |
宽带账户4 | 中流量(50G) | 否 |
宽带账户6 | 高流量(200G) | 是 |
宽带账户7 | 高流量(250G) | 否 |
宽带账户2 | 高流量(500G) | 否 |
对于如表9的宽带账户1至宽带账户8,有3个宽带账户离网(即离网宽带账户的数量占总宽带账户数量的),则宽带账户离网的熵值为
表9中,低流量这一子属性出现的概率为即中流量这一子属性出现的概率为即高流量这一子属性出现的概率为即在低流量这一子属性的条件下,宽带账户离网的概率为即entropyi为1(i=1),在中流量这一子属性的条件下,宽带账户离网的概率即entropyi为0.918(i=2),在高流量这一子属性的条件下,宽带账户离网的概率为即entropyi为0.918(i=3)。
所以,在总流量这一属性的条件下宽带账户离网的熵值为:
同样地,参考上述计算过程计算宽带关联数据的其他属性的熵值。
S1022、计算宽带账户对应的宽带关联数据中各个属性对应的信息增益,单个属性的信息增益为宽带账户离网的熵值与单个属性的熵值之间的差值。
具体地,计算宽带账户1至宽带账户8对应的表1至表8的宽带关联数据中各个属性的信息增益,结合上述举例中已计算出的宽带账户离网的熵值(即),总流量这一属性对应的信息增益为:
0.954-0.9385=0.0155。
对宽带关联数据中其他属性对应的信息增益的计算,可以参考以上计算总流量的信息增益的方法,本申请实施例不再对此进行赘述。
根据不同的参数取值,设定不同的阈值,
S1023、确定信息增益最高的属性为决策树的根节点属性,并创建决策树。
可以理解的是,信息增益越高的属性,对用户离网预测结果的影响越大,说明该属性为重要属性,对于这样的属性,优先将其作为决策树的根节点属性。例如,在计算各个属性的信息增益之后,确定信息增益最高的属性为总流量属性,则将总流量这一属性作为决策树的根节点属性,并创建决策树。
可以理解的是,可以对各个属性的信息增益进行排序,按照信息增益由大到小的顺序,依次生成决策树的各个节点。假定,按照信息增益由大到小的顺序,各个属性依次为:总流量、网络带宽、网络故障次数、签约到期情况、活跃时长、入网时长、网络类型、业务类型、IPTV开通情况,则根据宽带账户的宽带关联数据创建的决策树可以如图2所示。需要说明的是,图2中,当判断签约是否到期这一属性时,分支为1表示签约即将到期,分支为0表示签约并非即将到期,并且,在本申请实施例中,针对各个属性设置不同的阈值,例如,图2中,设置了阈值a至阈值l。其中,阈值可根据实际应用情况设置,具体设置阈值的方法可参考现有技术,本申请实施例对此不再进行赘述。
S103、根据决策树,对网络中的目标宽带账户进行离网预测。
假定目标宽带账户的总流量为高流量,签约即将到期,目标宽带账户的每日活跃时长为5小时,入网之后其平均每年的故障次数为3次,业务类型为网页业务类型,图2中阈值a为6(单位:小时),阈值c为2(单位:次),则根据图2所示的决策树,当总流量为高流量时,判断签约到期情况,由于目标宽带账户的签约即将到期,则接下来判断活跃时长,由于目标宽带账户对应的每日活跃时长(5小时)小于阈值a(6小时),则接下来判断目标宽带账户的故障次数,由于目标宽带账户的故障次数(3次)大于阈值c(2次),则接下来判断目标宽带账户的业务类型,由于目标宽带账户的业务类型为网页业务类型(即非网游业务类型),则得到的最终预测结果为不离网。
值得注意的是,在S103之后,可以对离网预测的结果进行验证,若确定离网预测的结果错误,则获取目标宽带账户对应的宽带关联数据,并根据目标宽带账户对应的宽带关联数据修正决策树。
在本申请实施例的另一种实现方式中,如图3所示,对获取总流量的方式进行了说明,该方法包括:
S301、采集宽带账户对应的终端收发的数据包。
S302、根据预设的采样比和采集的数据包确定宽带账户对应的总流量。宽带账户对应的总流量V_flow=N*ratio_sample*flow,其中,N为采集的流数量,ratio_sample为预设采样比,flow为每个流中的数据包对应的大小。
例如,针对宽带账户,当前采集到200个netflow流,每个流中数据包的大小为200M,预设采样比为200,则该宽带账户对应的总流量V_flow=200*200*200M=8000 000M。
本申请提供的用户离网预测的方法及装置,根据宽带账户的特点,获取与宽带账户对应的宽带关联数据,然后根据宽带关联数据创建相应的决策树,并利用决策树对目标宽带账户的离网情况进行预测。由于获取的宽带关联数据反映终端对宽带的依赖程度,所以,根据宽带关联数据创建的决策树也能反映出终端对宽带的依赖程度,然后根据决策树判断目标账户对宽带的依赖程度,进而能够有效地判断出目标账户是否即将离网。
本申请实施例可以根据上述方法示例对用户离网预测装置进行功能模块或者功能单元的划分,例如,可以对应各个功能划分各个功能模块或者功能单元,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块或者功能单元的形式实现。其中,本申请实施例中对模块或者单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图4所示,本申请实施例提供一种用户离网预测的装置400,包括修正模块401、获取模块402、创建模块403和预测模块404。
其中,获取模块402,用于获取宽带账户对应的宽带关联数据,一个宽带账户对应至少一个终端,宽带关联数据为反映终端对宽带的依赖程度。
其中,宽带关联数据具有以下至少一种属性:
宽带账户对应的终端的活跃时长、宽带账户对应的终端的总流量、宽带账户对应的入网时长、宽带账户对应的签约到期情况、宽带账户对应的签约网络带宽、宽带账户对应的网络类型、宽带账户对应的业务类型、宽带账户对应的网络协议电视IPTV业务的开通情况以及宽带账户对应的网络故障次数,网络类型包括城镇网络类型和乡村网络类型,业务类型包括视频业务类型和网游业务类型。
宽带账户对应的总流量V_flow=N*ratio_sample*flow,其中,N为采集的流数量,ratio_sample为预设采样比,flow为每个流中的数据包对应的大小
可选地,获取模块402,还用于采集宽带账户对应的终端收发的数据包,然后根据预设的采样比和采集的数据包确定宽带账户对应的总流量。
创建模块403,用于根据获取模块402获取的宽带账户对应的宽带关联数据创建决策树。
作为一种可能的实现方式,创建模块403,具体用于计算各个宽带账户对应的宽带关联数据中各个属性对应的熵值,单个属性对应的熵值为在单个属性的条件下宽带账户离网的熵值;计算宽带账户对应的宽带关联数据中各个属性对应的信息增益,单个属性的信息增益为宽带账户离网的熵值与单个属性的熵值之间的差值;确定信息增益最高的属性为决策树的根节点属性,并创建决策树。
其中,单个属性对应的熵值其中,单个属性具有至少一个子属性,pi为子属性i在单个属性中出现的概率,entropyi为在子属性i的条件下宽带账户离网的熵值。
预测模块404,用于根据创建模块403创建的决策树,对网络中的目标宽带账户进行离网预测。
在本申请实施例的另一种实现方式中,获取模块402,还用于若确定离网预测的结果错误,则获取目标宽带账户对应的宽带关联数据。
修正模块401,用于根据获取模块402获取的目标宽带账户对应的宽带关联数据修正决策树。
本申请提供的用户离网预测的装置,根据宽带账户的特点,获取与宽带账户对应的宽带关联数据,然后根据宽带关联数据创建相应的决策树,并利用决策树对目标宽带账户的离网情况进行预测。由于获取的宽带关联数据反映终端对宽带的依赖程度,所以,根据宽带关联数据创建的决策树也能反映出终端对宽带的依赖程度,然后根据决策树判断目标账户对宽带的依赖程度,进而能够有效地判断出目标账户是否即将离网。
如图5所示,本申请实施例提供装置的另一种可能的结构示意图。该装置500包括:处理单元501。处理单元501用于对装置500的动作进行控制管理,例如,执行上述获取模块402、创建模块403、预测模块404和修正模块401执行的步骤,和/或用于执行本文所描述的技术的其它过程。装置500还可以包括存储单元502和通信单元503,存储单元502用于存储装置500的程序代码和数据;通信单元503用于支持装置500与其他网络实体的通信。
其中,参阅图6所示,上述处理单元501可以是装置600中的处理器601或控制器,该处理器601或控制器可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器601或控制器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理(Digital Signal Processing,DSP)和微处理器的组合等。
存储单元502可以是装置600中的存储器602等,该存储器602可以包括易失性存储器,例如随机存取存储器;该存储器602也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。
通信单元503可以是装置600中的收发器、收发电路或通信接口603等。
总线604可以是扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。总线604可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有一个或多个程序,一个或多个程序包括指令,当上述装置的处理器执行该指令时,该装置执行上述方法实施例所示的方法流程中装置执行的各个步骤。
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
结合本申请公开内容所描述的方法或者算法的步骤可以由硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM、闪存、ROM、可擦除可编程只读存储器(easable programmable ROM,EPROM)、电可擦可编程只读存储器(electrically EPROM,EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuit,ASIC)中。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable ProgrammableRead Only Memory,EPROM)、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-OnlyMemory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种用户离网预测的方法,其特征在于,包括:
获取宽带账户对应的宽带关联数据,一个宽带账户对应至少一个终端,所述宽带关联数据为反映终端对所述宽带的依赖程度;
根据宽带账户对应的宽带关联数据创建决策树;
根据所述决策树,对网络中的目标宽带账户进行离网预测。
2.根据权利要求1所述的用户离网预测的方法,其特征在于,所述宽带关联数据具有以下至少一种属性:
宽带账户对应的终端的活跃时长、宽带账户对应的终端的总流量、宽带账户对应的入网时长、宽带账户对应的签约到期情况、宽带账户对应的签约网络带宽、宽带账户对应的网络类型、宽带账户对应的业务类型、宽带账户对应的网络协议电视IPTV业务的开通情况以及宽带账户对应的网络故障次数,网络类型包括城镇网络类型和乡村网络类型,业务类型包括视频业务类型和网游业务类型。
3.根据权利要求2所述的用户离网预测的方法,其特征在于,所述根据预设数量的宽带账户对应的宽带关联数据创建决策树包括:
计算各个宽带账户对应的宽带关联数据中各个属性对应的熵值,单个属性对应的熵值为在所述单个属性的条件下宽带账户离网的熵值;
计算宽带账户对应的宽带关联数据中各个属性对应的信息增益,单个属性的信息增益为宽带账户离网的熵值与所述单个属性的熵值之间的差值;
确定信息增益最高的属性为所述决策树的根节点属性,并创建所述决策树。
4.根据权利要求3所述的用户离网预测的方法,其特征在于,所述获取宽带账户对应的宽带关联数据包括:
采集宽带账户对应的终端收发的数据包;
根据预设的采样比和采集的数据包确定宽带账户对应的总流量。
5.根据权利要求4所述的用户离网预测的方法,其特征在于,在对网络中的目标宽带账户进行离网预测之后,所述方法还包括:
若确定所述离网预测的结果错误,则获取所述目标宽带账户对应的宽带关联数据,并根据所述目标宽带账户对应的宽带关联数据修正所述决策树。
6.根据权利要求5所述的用户离网预测的方法,其特征在于,
宽带账户对应的总流量V_flow=N*ratio_sample*flow,其中,N为采集的流数量,ratio_sample为预设采样比,flow为每个流中的数据包对应的大小;
单个属性对应的熵值其中,所述单个属性具有至少一个子属性,pi为子属性i在所述单个属性中出现的概率,entropyi为在子属性i的条件下宽带账户离网的熵值。
7.一种用户离网预测的装置,其特征在于,包括:
获取模块,用于获取宽带账户对应的宽带关联数据,一个宽带账户对应至少一个终端,所述宽带关联数据为反映终端对所述宽带的依赖程度;
创建模块,用于根据所述获取模块获取的宽带账户对应的宽带关联数据创建决策树;
预测模块,用于根据所述创建模块创建的所述决策树,对网络中的目标宽带账户进行离网预测。
8.根据权利要求7所述的用户离网预测的装置,其特征在于,所述宽带关联数据具有以下至少一种属性:
宽带账户对应的终端的活跃时长、宽带账户对应的终端的总流量、宽带账户对应的入网时长、宽带账户对应的签约到期情况、宽带账户对应的签约网络带宽、宽带账户对应的网络类型、宽带账户对应的业务类型、宽带账户对应的网络协议电视IPTV业务的开通情况以及宽带账户对应的网络故障次数,网络类型包括城镇网络类型和乡村网络类型,业务类型包括视频业务类型和网游业务类型;
所述创建模块,还用于计算各个宽带账户对应的宽带关联数据中各个属性对应的熵值,单个属性对应的熵值为在所述单个属性的条件下宽带账户离网的熵值;计算宽带账户对应的宽带关联数据中各个属性对应的信息增益,单个属性的信息增益为宽带账户离网的熵值与所述单个属性的熵值之间的差值;确定信息增益最高的属性为所述决策树的根节点属性,并创建所述决策树。
9.根据权利要求8所述的用户离网预测的装置,其特征在于,
所述获取模块,还用于采集宽带账户对应的终端收发的数据包;根据预设的采样比和采集的数据包确定宽带账户对应的总流量。
10.根据权利要求9所述的用户离网预测的装置,其特征在于,所述装置还包括修正模块;
所述获取模块,还用于若确定所述离网预测的结果错误,则获取所述目标宽带账户对应的宽带关联数据;
所述修正模块,用于根据所述获取模块获取的所述目标宽带账户对应的宽带关联数据修正所述决策树;
宽带账户对应的总流量V_flow=N*ratio_sample*flow,其中,N为采集的流数量,ratio_sample为预设采样比,flow为每个流中的数据包对应的大小;
单个属性对应的熵值其中,所述单个属性具有至少一个子属性,pi为子属性i在所述单个属性中出现的概率,entropyi为在子属性i的条件下宽带账户离网的熵值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711327730.2A CN108156025A (zh) | 2017-12-13 | 2017-12-13 | 一种用户离网预测的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711327730.2A CN108156025A (zh) | 2017-12-13 | 2017-12-13 | 一种用户离网预测的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108156025A true CN108156025A (zh) | 2018-06-12 |
Family
ID=62467112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711327730.2A Pending CN108156025A (zh) | 2017-12-13 | 2017-12-13 | 一种用户离网预测的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108156025A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109086931A (zh) * | 2018-08-01 | 2018-12-25 | 中国联合网络通信集团有限公司 | 预测用户离网方法及系统 |
CN109190874A (zh) * | 2018-07-12 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 多分支业务流程的实现方法和装置 |
CN109982312A (zh) * | 2019-03-28 | 2019-07-05 | 中国联合网络通信集团有限公司 | 一种转副卡行为识别方法、识别装置和服务器 |
CN111740866A (zh) * | 2020-06-24 | 2020-10-02 | 中国联合网络通信集团有限公司 | 一种离网预测方法及装置 |
CN112671573A (zh) * | 2020-12-17 | 2021-04-16 | 北京神州泰岳软件股份有限公司 | 识别宽带业务中潜在离网用户的方法及装置 |
CN113014907A (zh) * | 2019-12-19 | 2021-06-22 | 中国电信股份有限公司 | 网络协议电视故障预警方法、装置和存储介质 |
CN114786173A (zh) * | 2022-03-29 | 2022-07-22 | 中国联合网络通信集团有限公司 | 基于宽带的携号转网识别方法、装置、设备及存储介质 |
CN116886571A (zh) * | 2023-09-07 | 2023-10-13 | 武汉博易讯信息科技有限公司 | 针对家庭宽带用户的分析方法、设备及计算机可读介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567807A (zh) * | 2010-12-23 | 2012-07-11 | 上海亚太计算机信息系统有限公司 | 加油卡客户流失预测方法 |
WO2017032253A1 (zh) * | 2015-08-22 | 2017-03-02 | 华为技术有限公司 | 一种数据传输方法、使用该方法的交换机以及网络控制系统 |
CN106529714A (zh) * | 2016-11-03 | 2017-03-22 | 大唐融合通信股份有限公司 | 一种用户流失的预测方法及系统 |
CN107230133A (zh) * | 2017-05-26 | 2017-10-03 | 努比亚技术有限公司 | 一种数据处理方法、设备和计算机存储介质 |
-
2017
- 2017-12-13 CN CN201711327730.2A patent/CN108156025A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567807A (zh) * | 2010-12-23 | 2012-07-11 | 上海亚太计算机信息系统有限公司 | 加油卡客户流失预测方法 |
WO2017032253A1 (zh) * | 2015-08-22 | 2017-03-02 | 华为技术有限公司 | 一种数据传输方法、使用该方法的交换机以及网络控制系统 |
CN106529714A (zh) * | 2016-11-03 | 2017-03-22 | 大唐融合通信股份有限公司 | 一种用户流失的预测方法及系统 |
CN107230133A (zh) * | 2017-05-26 | 2017-10-03 | 努比亚技术有限公司 | 一种数据处理方法、设备和计算机存储介质 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190874A (zh) * | 2018-07-12 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 多分支业务流程的实现方法和装置 |
CN109086931A (zh) * | 2018-08-01 | 2018-12-25 | 中国联合网络通信集团有限公司 | 预测用户离网方法及系统 |
CN109982312A (zh) * | 2019-03-28 | 2019-07-05 | 中国联合网络通信集团有限公司 | 一种转副卡行为识别方法、识别装置和服务器 |
CN109982312B (zh) * | 2019-03-28 | 2021-10-15 | 中国联合网络通信集团有限公司 | 一种转副卡行为识别方法、识别装置和服务器 |
CN113014907A (zh) * | 2019-12-19 | 2021-06-22 | 中国电信股份有限公司 | 网络协议电视故障预警方法、装置和存储介质 |
CN111740866A (zh) * | 2020-06-24 | 2020-10-02 | 中国联合网络通信集团有限公司 | 一种离网预测方法及装置 |
CN112671573A (zh) * | 2020-12-17 | 2021-04-16 | 北京神州泰岳软件股份有限公司 | 识别宽带业务中潜在离网用户的方法及装置 |
CN112671573B (zh) * | 2020-12-17 | 2023-05-16 | 北京神州泰岳软件股份有限公司 | 识别宽带业务中潜在离网用户的方法及装置 |
CN114786173A (zh) * | 2022-03-29 | 2022-07-22 | 中国联合网络通信集团有限公司 | 基于宽带的携号转网识别方法、装置、设备及存储介质 |
CN114786173B (zh) * | 2022-03-29 | 2023-06-09 | 中国联合网络通信集团有限公司 | 基于宽带的携号转网识别方法、装置、设备及存储介质 |
CN116886571A (zh) * | 2023-09-07 | 2023-10-13 | 武汉博易讯信息科技有限公司 | 针对家庭宽带用户的分析方法、设备及计算机可读介质 |
CN116886571B (zh) * | 2023-09-07 | 2023-11-21 | 武汉博易讯信息科技有限公司 | 针对家庭宽带用户的分析方法、设备及计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108156025A (zh) | 一种用户离网预测的方法及装置 | |
CN109495317B (zh) | 数据网流量预测方法及装置 | |
CN102098686A (zh) | 移动通信网络优化“三层一体”评估模型 | |
CN111681102B (zh) | 信贷预测方法、装置、设备和存储介质 | |
CN111191918A (zh) | 一种智能电网通信网的业务路由规划方法及装置 | |
CN109359948A (zh) | 一种基于区块链的合同管理方法及相关设备 | |
CN108768879A (zh) | 一种策略优先级调整方法和装置 | |
CN104243332A (zh) | 基于dpi识别的分通道应用流量控制方法 | |
CN108074185A (zh) | 保险信息处理方法和装置 | |
CN111598457B (zh) | 一种电力无线网络质量的确定方法及装置 | |
METİN ÖZCAN et al. | The relationship between energy efficiency and economic performance in G20 countries | |
CN107682316B (zh) | 动态密码发送策略的生成方法和动态密码发送方法 | |
Deno et al. | Probabilistic trust management in pervasive computing | |
CN105306385B (zh) | 下行网络带宽的控制方法及装置 | |
CN112035519A (zh) | 用户画像方法、装置、计算机可读存储介质及终端设备 | |
CN107948149B (zh) | 基于随机森林的策略自学习和优化方法及装置 | |
CN107294986A (zh) | 一种访问https网站的方法、装置及系统 | |
CN116760726A (zh) | 一种基于编解码算法的供应商作弊检测方法 | |
CN112115324B (zh) | 一种基于幂律分布确认刷赞用户的方法及装置 | |
CN110070392A (zh) | 用户流失预警方法和装置 | |
CN115002843A (zh) | 服务质量校验方法、装置、存储介质及电子设备 | |
CN114448810A (zh) | 带宽牵引方法、装置及电子设备 | |
CN107071090A (zh) | 虚拟网络地址在网路链接中的应用方法及系统 | |
Beckstedde et al. | Strategic behaviour in flexibility markets: new games and sequencing options | |
CN108229993A (zh) | 一种数据处理的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180612 |
|
RJ01 | Rejection of invention patent application after publication |