CN109711865A - 一种基于用户行为挖掘的移动通信网流量精细化预测的方法 - Google Patents
一种基于用户行为挖掘的移动通信网流量精细化预测的方法 Download PDFInfo
- Publication number
- CN109711865A CN109711865A CN201811493635.4A CN201811493635A CN109711865A CN 109711865 A CN109711865 A CN 109711865A CN 201811493635 A CN201811493635 A CN 201811493635A CN 109711865 A CN109711865 A CN 109711865A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- function
- cell
- flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000004891 communication Methods 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000007637 random forest analysis Methods 0.000 claims abstract description 21
- 238000011161 development Methods 0.000 claims abstract description 14
- 230000006698 induction Effects 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 64
- 230000006399 behavior Effects 0.000 claims description 27
- 230000008859 change Effects 0.000 claims description 19
- 230000033001 locomotion Effects 0.000 claims description 18
- 230000018109 developmental process Effects 0.000 claims description 13
- 238000003066 decision tree Methods 0.000 claims description 11
- 230000004907 flux Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000010801 machine learning Methods 0.000 claims description 8
- 238000009825 accumulation Methods 0.000 claims description 6
- 230000000737 periodic effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 4
- 238000004220 aggregation Methods 0.000 claims description 4
- 230000007774 longterm Effects 0.000 claims description 4
- 238000007418 data mining Methods 0.000 claims description 3
- 238000012886 linear function Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000002085 persistent effect Effects 0.000 claims description 3
- 230000011664 signaling Effects 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 230000003442 weekly effect Effects 0.000 claims description 3
- 210000004027 cell Anatomy 0.000 description 44
- 230000000694 effects Effects 0.000 description 9
- 238000007726 management method Methods 0.000 description 9
- 230000009466 transformation Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000009172 bursting Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 241001290864 Schoenoplectus Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于用户行为挖掘的移动通信网流量精细化预测的方法,该方法包括:采集移动通信网核心网侧的数据,对采集的移动性管理数据和上网数据均按照每次业务事件形成完整的上网记录日志信息;基于用户的上网记录日志信息,建立涵盖用户常驻特性、用户移动特性、时段错峰特性、业务发展特性在内的多维小区特性模型,并统计出每个小区的基础数据;将基础数据进行随机森林训练分类,将小区按照用户规律、业务规律、负荷规律归纳总结成不同的类;对不同类的小区进行不同的时间序列预测模型训练,并不断校准,建立贴近实际的业务流量预测模型体系。本发明的方法有效解决了以往预测困难、预测周期长、预测与实际误差较大等系列难题。
Description
技术领域
本发明属于机器学习及大数据结合的领域,具体涉及一种基于用户行为挖掘的移动通信网流量精细化预测的方法。
背景技术
传统的业务流量预测工作通常简单采用线性规划算法,但是流量在并不是简单的线性增长,而是呈现周期性的变化,预测结果与实际偏差较大,尤其是在重大活动或者节假日时,流量数据会出现突增,根据以往的一般的线性预测模型无法预测节日的流量突增,如此对流量的预测误差较大,无法满足用户和运营商的实际使用需求。
随着网络运营工作由之前的粗犷式向精细化转变的背景,流量预测工作也应适应市场需求,深挖用户行为,将用户行为规律反映到流量变化中,是目前精细化转变的重要过程,因此,如何把用户的行为精准的反映移动通信网网络流量变化便成为了目前亟待解决的技术问题。
发明内容
本发明的目的是提供一种基于用户行为挖掘的移动通信网流量精细化预测的方法,以实现对移动通信网的流量更加准确的预测,从而解决以往预测困难、预测周期长、预测与实际误差较大等系列难题,为资源评估、调配、避免节假日及重要活动时大流量冲击提供强有力的数据支撑。
本发明采用的技术方案如下:
一种基于用户行为挖掘的移动通信网流量精细化预测的方法,所述方法包括:所述方法包括:
步骤S1,采集移动通信网核心网侧的数据,包含移动性管理数据及详细的上网数据,并对所述移动性管理数据和上网数据均按照每次业务事件形成完整的上网记录日志信息;
步骤S2,基于用户的上网记录日志信息结合日常数据挖掘经验,设定分析周期,运用大数据技术深度加工处理,建立涵盖用户常驻特性、用户移动特性、时段错峰特性、业务发展特性在内的多维小区特性模型,并统计出每个小区的基础数据;
步骤S3,将基础数据进行随机森林训练分类,依据计算的小区特性结合机器学习,把网络中的小区按照用户规律、业务规律、负荷规律归纳总结成不同的类,将拥有同样或相似特征的小区集合在一起进行流量预测模型训练;
步骤S4,对不同类的小区进行不同的时间序列预测模型训练,并不断校准,建立贴近实际的业务流量预测模型体系。
进一步地,所述业务流量预测模型体系的建立方法为:对流量数据的整体趋势变化、周期性变化和突发性变化分别建立预测模型,再将3个预测模型线性累加,得到最终的流量预测模型。
进一步地,在步骤S2中,对用户常驻特性的特性模型的建立方法为:
基于信令大数据,研究用户行为规律设定用户位置模型,挖掘移动性管理数据,挑选用户位置变化的关键流程,包含业务态及空闲态,将移动性管理数据按照时间顺序依照位置变化的时间点,计算出用户在每个小区的驻留时长;
同时将用户日常潮汐规律以时间段进行驻留场景划分;
周期性累积用户驻留小区信息,建立用户的常驻小区特性模型,形成常驻用户不同时间范围的位置清单,从而得到小区的常驻用户数及总用户数的特征结果。
进一步地,在步骤S2中,对用户移动特性的特性模型的建立方法为:
在挖掘用户常驻特性的基础上,更深一步基于用户实际位置的运动变更,判断用户周期内运动速率,将一段时间内的用户细分为相对静止、低速运动、中速运动、高速运动不同的运动状态,透视小区各速率区间的用户比例,得到不同时段内的小区用户流动特性数据。
进一步地,在步骤S2中,对用户时段错峰特性的特性模型的建立方法为:
基于详细的上网数据,将用户和业务进行时段拟合,挖掘用户迁移规律,周期性聚类小区时域特性数据,体现小区当日错峰、周末或节日错峰、定期聚集不同的错峰标签。
进一步地,在步骤S2中,对用户业务发展特性的特性模型的建立方法为:
依赖强大的业务特征积累和更新,识别热门TOP应用,并将热门TOP应用进行深度识别,进一步有效区分应用的流量细分归属,设定即时通信社交类、视频播放类、网页浏览、游戏众多类别,监测小区流量主要类别变化趋势,建立不同小区的具体业务发展模型。
进一步地,在所述步骤S3中,对基础数据进行随机森林训练分类的方法为:
用每天的小区数据用作训练样本,使用基于驻留场景建模生成的用户常驻特性中的常驻用户数和小区的总用户数、基于移动特性建模生成的不同时段内的小区用户流动特性数据、基于时段错峰特性建模生成的小区当日错峰、周末或节日错峰、定期聚集不同错峰标签、基于业务发展特性模型建模生成的不同时段的主流业务等作为特征属性,对决策树的每个节点,先从该节点的属性集合中随机选取包含k个属性的子属性集,然后选择最优属性用于划分,将分类结果多数投票机制来进行预测;随机森林训练过程中需不断调整决策树的个数m、特征属性的个数k、决策树的深度,从而将全网小区训练成不同的分类。
进一步地,流量预测模型看成是一个关于时间t的函数y(t),把y(t)拆分为4个部分,设定y(t)的数学表达式为:
y(t)=g(t)+s(t)+h(t)+ε,其中,
g(t)是对于流量整体趋势变化的函数,s(t)是关于流量周期性变化的周期函数,h(t)是流量在突发变化的函数,ε是小区特性建模过程中出现的误差。
进一步地,流量的整体趋势变化函数g(t)的计算方法为:
先将整体函数分n段,对每个分段i用线性函数拟合,函数如下:
gi(t)=at+b,
公式中a代表流量随时间的增长率,b代表补偿参数,使用历史流量数据,直接使用最小二乘法,分段拟合出每个分段的趋势变化gi(t),将所有的分段函数衔接在一起,得到最终的整体趋势变化函数g(t)。
进一步地,流量的周期性变化函数s(t)的计算方法为:
用以下公式标识流量周期变化函数:
该函数需要确定该的未知变量为an,bn和wn,an,bn代表正弦函数和余弦函数的强度,wn代表正弦函数和余弦函数的频率;然后使用过去的历史数据以及整体趋势函数g(t)来计算周期函数,具体方法为:
计算p(t)=y(t)-g(t);
对函数p(t)做傅里叶变化,得到函数在频域内的强度和频率分布;
由于现阶段数据的周期性仅表现在每周之内,因此去除周期大于7天的部分;
叠加周期小于7天的正弦和余弦函数,得到周期函数。
进一步地,流量在突发变化的函数h(t)的计算方法为:
我们直接对每个节假日拟合一个权重,设定公式:h(t)=kZ(t),k代表了每个节日的权重,Z(t)判断该日期是否为节假日,若当天是节假日,Z(t)=1,否则Z(t)=0。
与现有技术相比,本发明所公开的一种基于用户行为挖掘的移动通信网流量精细化预测的方法,达到了如下技术效果:
1、本发明摒弃了传统简单运用线性规划算法的流量预测,创新性地将用户活动规律与流量预测相结合,并将海量数据综合运用大数据、机器学习进行训练,对之后网络中的流量作出更贴近实际用户行为的预测判断。
2、本发明基于海量移动通信网内的上网记录日志信息,深入挖掘用户行为,对无线基站下的用户活动建模总结成用户常驻、用户移动、时段错峰、业务发展等诸多特性,然后将建模结果运用机器学习训练分类,最终将不同基站的分类结果连同基站流量数据设定整体趋势变化、周期性变化和突发化等预测模型,从而更加精准地预测移动通信网流量。本方法可有效解决以往预测困难、预测周期长、预测与实际误差较大等系列难题,为资源评估、调配、避免节假日及重要活动时大流量冲击提供强有力的数据支撑。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所述的基于用户行为挖掘的移动通信网流量精细化预测的方法的流程示意图。
图2为本发明实施例所述的傅里叶变换的流程示意图。
图3是本发明实施例所述的最小二乘法的曲线拟合效果图。
图4是本发明实施例所述的流量预测模型的函数示意图。
图5是本发明实施例所述的随机森林算法的树模型的结构示意图。
图6是本发明实施例所述的随机森林算法的分裂选取的过程图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。
随着网络运营工作由之前的粗犷式向精细化转变的背景,流量预测工作也应适应市场需求,深挖用户行为,将用户行为规律反映到流量变化中,更为精准的反映移动通信网网络流量变化。针对海量用户上网日志记录信息,本发明提出了贴近用户行为的用户常驻、用户移动、时段错峰、业务发展等诸多特性模型,综合运用大数据、机器学习进行训练,并将训练结果连同基站数据使用时间序列预测模型再次训练,最终形成贴近实际应用需求的预测数据。
参照图1所示,本发明实施例所提供的一种基于用户行为挖掘的移动通信网流量精细化预测的方法,包括如下步骤:
步骤S1,采集移动通信网核心网侧的数据,包含移动性管理数据及详细的上网数据。移动性管理数据主要涉及用户的位置变化;而详细的上网数据包含用户上网的时间、上网位置、上网访问的业务、业务持续时长及所耗流量等系列信息,对移动性管理数据和详细的上网数据均按照每次业务事件形成完整的上网记录日志信息。
步骤S2,考虑到现有运营商对移动基站小区的场景归类划分较粗,同时小区的诸多特性也并非一成不变,举个例子如同样归属于高校教学楼的A和B两个小区,教学楼A小区主要覆盖楼内,而B小区主要覆盖操场,那么覆盖场景的不同就不能按照统一的模型进行流量预测;再如A小区工作日每天出现的人群是有一定规律的,而该规律又和周末并非同样的特性,那么工作日和周末也不能基于一套模型。在本步骤中,基于用户的上网记录日志信息结合日常数据挖掘经验,设定分析周期,运用大数据处理技术进行深度加工处理,建立起涵盖用户常驻特性、用户移动特性、时段错峰特性、业务发展特性等在内的多维小区特性模型,识别每个小区的基础特性并持续更新,为精细化、精准化的流量预测提供基础数据。
用户常驻模型的建立方法为:基于信令大数据,研究用户行为规律设定用户位置模型,挖掘移动性管理数据,挑选用户位置变化的关键流程(包含业务态及空闲态),如开机附着、跟踪区更新、站内切换、站间切换、关机等,将移动性管理数据按照时间顺序依照位置变化的时间点,计算出用户在每个小区的驻留时长;同时将用户日常潮汐规律以时间段进行驻留场景划分:白天(9-11点,14-17点),晚上(20-23点),夜间(1点-6点),周期性累积用户驻留小区信息,建立用户的常驻小区组模型,形成常驻用户不同时间范围的位置清单,从而得到小区的常驻用户数及总用户数的特征结果。
用户流动特性模型的建立方法为:在挖掘用户常驻特性的基础上,更深一步基于用户实际位置的运动变更,判断用户周期内运动速率,将一段时间内的用户细分为相对静止、低速运动、中速运动、高速运动等。有效呈现小区各速率区间的用户数量,透视小区各速率区间的用户比例,得到不同时段内的小区用户流动特性数据。
时段错峰特性模型的建立方法为:基于详细的上网数据,将用户和业务进行时段拟合,挖掘用户迁移规律,周期性聚类小区时域特性数据,体现小区当日错峰、周末或节日错峰、定期聚集等不同错峰标签。
业务发展特性模型的建立方法为:随着LTE及5G技术的发展,移动通信网内业务纷繁芜杂,可能涉及几万种,依赖强大的业务特征积累和更新,识别热门TOP应用,并将热门TOP应用进行深度识别,进一步有效区分应用的流量细分归属,设定即时通信社交类、视频播放类(包含直播)、网页浏览、游戏等众多类别,监测小区流量主要类别变化趋势,建立不同小区的具体业务发展模型。
步骤S3,将基础数据进行随机森林训练分类,依据计算的小区特性结果机器学习,把网络中的小区按照用户规律、业务规律、负荷规律等归纳总结成不同的类,从而将拥有同样相似特征的小区集合在一起进行流量预测模型训练。
利用随机森林方法建造每种分类的方法为:随机森林是一个包含多个决策树的分类器,其输出的类别是由个别树输出的类别的众数而定。用每天的小区数据用作训练样本,使用基于驻留场景建模生成的用户常驻特性中的常驻用户数和小区的总用户数、基于移动特性建模生成的不同时段内的小区用户流动特性数据、基于时段错峰特性建模生成的小区当日错峰、周末或节日错峰、定期聚集等不同错峰标签、基于业务发展特性模型建模生成的不同时段的主流业务等作为特征属性,对决策树的每个节点,先从该节点的属性集合中随机选取包含k个属性的子属性集,然后选择最优属性用于划分,将分类结果多数投票机制来进行预测,提高准确率。随机森林训练过程中需不断调整决策树的个数m、特征属性的个数k、决策树的深度,从而将全网小区训练成不同的分类。
关于随机森林的算法过程,具体如下:
1.数据的随机选取:
首先,从原始的数据集中采取有放回的抽样,构造子数据集,子数据集的数据量是和原始数据集相同的。不同子数据集的元素可以重复,同一个子数据集中的元素也可以重复。第二,利用子数据集来构建子决策树,将这个数据放到每个子决策树中,每个子决策树输出一个结果。最后,如果有了新的数据需要通过随机森林得到分类结果,就可以通过对子决策树的判断结果的投票,得到随机森林的输出结果了。如图5所示,假设随机森林中有3棵子决策树,2棵子树的分类结果是A类,1棵子树的分类结果是B类,那么随机森林的分类结果就是A类。
每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后会被采用。
2.待选特征的随机选取
与数据集的随机选取类似,随机森林中的子树的每一个分裂过程并未用到所有的待选特征,而是从所有的待选特征中随机选取一定的特征,之后再在随机选取的特征中选取最优的特征。这样能够使得随机森林中的决策树都能够彼此不同,提升系统的多样性,从而提升分类性能。
图6中,上方的六个方块及三个方块代表所有可以被选择的特征,也就是目前的待选特征。底部的单一方块是分裂特征。左边是一棵决策树的分裂特征选取过程,通过在待选特征中选取最优的分裂特征(比如D3算法,C4.5算法,CART算法等等),完成分裂。右边是一个随机森林中的子树的分裂特征选取过程,从6个方块代表的待选特征中先随机选取3个,然后从三个中再选取最优的分裂特征。
步骤S4,不同类的小区进行不同的时间序列预测模型训练,各自调整不同类的模型参数,后续就可基于长时间的历史数据积累,不断训练和校准模型,建立起一套贴近实际的业务流量预测体系,实现小区级流量的精准预测,进一步汇总实现基站、区域、全网的精准流量预测,支撑网络规划、网络优化、市场运营等工作开展。
预测模型的建立方法为:模型的核心理论方法是建立一个可分解的时序分析模型,对流量数据的整体趋势变化、周期性变化和突发性变化分别建立预测模型,再将3个预测模型线性累加,得到最终的流量预测模型。
流量预测模型看成是一个关于时间t的函数y(t)。在这里,我们把y(t)拆分为4个部分,y(t)的具体数学表达式为:
y(t)=g(t)+s(t)+h(t)+ε
其中g(t)是对于流量整体趋势变化的函数,s(t)是关于流量周期性变化的周期函数,h(t)是流量在突发时(如节假日或重大活动)的函数,ε是小区特性建模过程中出现的误差,在得到了对于整体趋势、周期变化和突发性影响的模型后,将3个模型线性叠加,得到最终的流量预测模型。
流量整体趋势变化模型g(t)的计算方式为:
由于流量的整体趋势与时间线性相关,但在一些点会出现变化,因此先将整体函数分n段,对每个分段i用线性函数拟合,函数如下:
gi(t)=at+b
公式中a代表流量随时间的增长率,b代表补偿参数。我们使用历史流量数据,直接使用最小二乘法,分段拟合出每个分段的趋势变化gi(t),将所有的分段函数衔接在一起,得到最终的整体趋势变化函数g(t)。
最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法常用于曲线拟合。效果如图3所示。
流量周期性变化模型的计算方式为:
对于任何的周期变化函数,都可以看做是正弦函数和余弦函数的叠加,因此,我们使用以下公式标识流量周期变化函数:
该函数需要确定该的未知变量为an,bn和wn,an,bn代表正弦函数和余弦函数的强度,wn代表正弦函数和余弦函数的频率。接下来使用过去的历史数据以及整体趋势函数g(t)来计算周期函数,具体方法如下:
1、计算p(t)=y(t)-g(t)
2、对函数p(t)做傅里叶变化,得到函数在频域内的强度和频率分布
3、由于现阶段数据的周期性仅表现在每周之内,因此去除周期大于7天的部分。
4、叠加周期小于7天的正弦和余弦函数,得到周期函数
任何连续周期信号都可以由一组适当的正弦曲线组合而成。虽然正弦曲线无法组合成一个带有棱角的信号。但是,我们可以用正弦曲线来非常逼近地表示它,逼近到两种表示方法不存在能量差别。傅里叶变换使一种线性的积分变换,这种变换是从时间转换为频率的变换或其相互转换。常见的傅里叶变换如图2所示。
突发性影响模型的计算方法为:
对于突发性如节假日导致的网元流量突增,我们直接对每个节假日拟合一个权重,表示该节日对于流量的影响。
h(t)=kZ(t);
k代表了每个节日的权重,Z(t)判断该日期是否为节假日,若当天是节假日,Z(t)=1,否则Z(t)=0。
在得到了对于整体趋势、周期变化和节假日影响的模型后,将3个模型线性叠加,得到最终的流量预测模型。
将y(t)为分解为趋势函数g(t)和周期变化函数s(t),具体图片如图4所示。
本发明实施例所述的一种基于用户行为挖掘的移动通信网流量精细化预测的方法,首先基于海量移动通信网内的上网记录日志信息,深入挖掘用户行为,对无线基站下的用户活动建模总结成用户常驻、用户移动、时段错峰、业务发展等诸多特性,然后将建模结果运用机器学习训练分类,最终将不同基站的分类结果连同基站流量数据设定整体趋势变化、周期性变化和突发化等预测模型,从而更加精准地预测移动通信网流量。该方法可有效解决以往预测困难、预测周期长、预测与实际误差较大等系列难题,为资源评估、调配、避免节假日及重要活动时大流量冲击提供强有力的数据支撑。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (11)
1.一种基于用户行为挖掘的移动通信网流量精细化预测的方法,其特征在于,所述方法包括:
步骤S1,采集移动通信网核心网侧的数据,包含移动性管理数据及详细的上网数据,并对所述移动性管理数据和上网数据均按照每次业务事件形成完整的上网记录日志信息;
步骤S2,基于用户的上网记录日志信息结合日常数据挖掘经验,设定分析周期,运用大数据技术深度加工处理,建立涵盖用户常驻特性、用户移动特性、时段错峰特性、业务发展特性在内的多维小区特性模型,并统计出每个小区的基础数据;
步骤S3,将基础数据进行随机森林训练分类,依据计算的小区特性结合机器学习,把网络中的小区按照用户规律、业务规律、负荷规律归纳总结成不同的类,将拥有同样或相似特征的小区集合在一起进行流量预测模型训练;
步骤S4,对不同类的小区进行不同的时间序列预测模型训练,并不断校准,建立贴近实际的业务流量预测模型体系。
2.根据权利要求1所述的移动通信网流量精细化预测的方法,其特征在于,所述业务流量预测模型体系的建立方法为:对流量数据的整体趋势变化、周期性变化和突发性变化分别建立预测模型,再将三个预测模型进行线性累加,得到最终的流量预测模型。
3.根据权利要求1或2所述的移动通信网流量精细化预测的方法,其特征在于,在步骤S2中,对用户常驻特性的特性模型的建立方法为:
基于信令大数据,研究用户行为规律设定用户位置模型,挖掘移动性管理数据,挑选用户位置变化的关键流程,包含业务态及空闲态,将移动性管理数据按照时间顺序依照位置变化的时间点,计算出用户在每个小区的驻留时长;
同时将用户日常潮汐规律以时间段进行驻留场景划分;
周期性累积用户驻留小区信息,建立用户的常驻小区特性模型,形成常驻用户不同时间范围的位置清单,从而得到小区的常驻用户数及总用户数的特征结果。
4.根据权利要求1或2所述的移动通信网流量精细化预测的方法,其特征在于,在步骤S2中,对用户移动特性的特性模型的建立方法为:
在挖掘用户常驻特性的基础上,更深一步基于用户实际位置的运动变更,判断用户周期内运动速率,将一段时间内的用户细分为相对静止、低速运动、中速运动、高速运动不同的运动状态,透视小区各速率区间的用户比例,得到不同时段内的小区用户流动特性数据。
5.根据权利要求1或2所述的移动通信网流量精细化预测的方法,其特征在于,在步骤S2中,对用户时段错峰特性的特性模型的建立方法为:
基于详细的上网数据,将用户和业务进行时段拟合,挖掘用户迁移规律,周期性聚类小区时域特性数据,体现小区当日错峰、周末或节日错峰、定期聚集不同的错峰标签。
6.根据权利要求1或2所述的移动通信网流量精细化预测的方法,其特征在于,在步骤S2中,对用户业务发展特性的特性模型的建立方法为:
依赖强大的业务特征积累和更新,识别热门TOP应用,并将热门TOP应用进行深度识别,进一步有效区分应用的流量细分归属,设定即时通信社交类、视频播放类、网页浏览、游戏众多类别,监测小区流量主要类别变化趋势,建立不同小区的具体业务发展模型。
7.根据权利要求1或3所述的移动通信网流量精细化预测的方法,其特征在于,在所述步骤S3中,对基础数据进行随机森林训练分类的方法为:
用每天的小区数据用作训练样本,使用基于驻留场景建模生成的用户常驻特性中的常驻用户数和小区的总用户数、基于移动特性建模生成的不同时段内的小区用户流动特性数据、基于时段错峰特性建模生成的小区当日错峰、周末或节日错峰、定期聚集不同错峰标签、基于业务发展特性模型建模生成的不同时段的主流业务等作为特征属性,对决策树的每个节点,先从该节点的属性集合中随机选取包含多个个属性的子属性集,然后选择最优属性用于划分,将分类结果多数投票机制来进行预测;随机森林训练过程中需不断调整决策树的个数、特征属性的个数、决策树的深度,从而将全网小区训练成不同的分类。
8.根据权利要求2所述的移动通信网流量精细化预测的方法,其特征在于,流量预测模型看成是一个关于时间t的函数y(t),把y(t)拆分为4个部分,设定y(t)的数学表达式为:
y(t)=g(t)+s(t)+h(t)+∈,其中,
g(t)是对于流量整体趋势变化的函数,s(t)是关于流量周期性变化的周期函数,h(t)是流量在突发变化的函数,∈是小区特性建模过程中出现的误差。
9.根据权利要求8所述的移动通信网流量精细化预测的方法,其特征在于,流量的整体趋势变化函数g(t)的计算方法为:
先将整体函数分n段,对每个分段i用线性函数拟合,函数如下:
gi(t)=at+b,
公式中a代表流量随时间的增长率,b代表补偿参数,使用历史流量数据,直接使用最小二乘法,分段拟合出每个分段的趋势变化gi(t),将所有的分段函数衔接在一起,得到最终的整体趋势变化函数g(t)。
10.根据权利要求8所述的移动通信网流量精细化预测的方法,其特征在于,流量的周期性变化函数s(t)的计算方法为:
用以下公式标识流量周期变化函数:
该函数需要确定该的未知变量为an,bn和wn,an,bn代表正弦函数和余弦函数的强度,wn代表正弦函数和余弦函数的频率;然后使用过去的历史数据以及整体趋势函数g(t)来计算周期函数,具体方法为:
1、计算p(t)=y(t)-g(t);
2、对函数p(t)做傅里叶变化,得到函数在频域内的强度和频率分布;
3、由于现阶段数据的周期性仅表现在每周之内,因此去除周期大于7天的部分;
4、叠加周期小于7天的正弦和余弦函数,得到周期函数。
11.根据权利要求8所述的移动通信网流量精细化预测的方法,其特征在于,流量在突发变化的函数h(t)的计算方法为:
我们直接对每个节假日拟合一个权重,设定公式:h(t)=kZ(t),k代表了每个节日的权重,Z(t)判断该日期是否为节假日,若当天是节假日,Z(t)=1,否则Z(t)=0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811493635.4A CN109711865A (zh) | 2018-12-07 | 2018-12-07 | 一种基于用户行为挖掘的移动通信网流量精细化预测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811493635.4A CN109711865A (zh) | 2018-12-07 | 2018-12-07 | 一种基于用户行为挖掘的移动通信网流量精细化预测的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109711865A true CN109711865A (zh) | 2019-05-03 |
Family
ID=66255485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811493635.4A Pending CN109711865A (zh) | 2018-12-07 | 2018-12-07 | 一种基于用户行为挖掘的移动通信网流量精细化预测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109711865A (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110175711A (zh) * | 2019-05-17 | 2019-08-27 | 北京市天元网络技术股份有限公司 | 一种基于联合lstm基站小区流量预测方法以及装置 |
CN110309307A (zh) * | 2019-06-20 | 2019-10-08 | 上海上湖信息技术有限公司 | 一种基于应用程序预测用户文化水平的方法和系统 |
CN110474808A (zh) * | 2019-08-20 | 2019-11-19 | 中国联合网络通信集团有限公司 | 一种流量预测方法及装置 |
CN111027592A (zh) * | 2019-11-14 | 2020-04-17 | 中科软智(北京)科技有限公司 | 细粒度对象流量分析方法和装置 |
CN111083710A (zh) * | 2019-12-20 | 2020-04-28 | 大唐网络有限公司 | 一种用于5g系统的智慧组网方法 |
CN111241225A (zh) * | 2020-01-10 | 2020-06-05 | 北京百度网讯科技有限公司 | 常驻区域变更的判断方法、装置、设备及存储介质 |
CN111415192A (zh) * | 2020-02-27 | 2020-07-14 | 重庆森鑫炬科技有限公司 | 基于大数据的用户用水性质预测方法 |
CN112085282A (zh) * | 2020-09-11 | 2020-12-15 | 中国联合网络通信集团有限公司 | 小区流量预测方法及服务器 |
CN112118587A (zh) * | 2019-06-19 | 2020-12-22 | 大唐移动通信设备有限公司 | 一种小区管理的方法和设备 |
CN112202585A (zh) * | 2019-07-08 | 2021-01-08 | 中国移动通信集团浙江有限公司 | 无线网络流量预测方法、装置及电子设备 |
CN112529624A (zh) * | 2020-12-15 | 2021-03-19 | 北京百度网讯科技有限公司 | 生成业务预测模型的方法、装置、设备以及存储介质 |
CN112561551A (zh) * | 2019-09-26 | 2021-03-26 | 富士通株式会社 | 用于优化对象预测的方法、设备和存储介质 |
CN112862195A (zh) * | 2021-02-19 | 2021-05-28 | 金陵科技学院 | 基于sft-als的时间序列粉丝涨幅预测方法 |
CN113038302A (zh) * | 2019-12-25 | 2021-06-25 | 中国电信股份有限公司 | 流量预测方法及装置、计算机可存储介质 |
CN113347573A (zh) * | 2021-05-12 | 2021-09-03 | 东莞理工学院 | 基于用户移动位置预测的负载均衡切换优化方法及系统 |
WO2022001480A1 (zh) * | 2020-06-28 | 2022-01-06 | 中兴通讯股份有限公司 | 热门应用识别方法、网络系统、网络设备及存储介质 |
CN113935881A (zh) * | 2021-12-16 | 2022-01-14 | 北京融信数联科技有限公司 | 一种基于大数据的人口结构分析方法、系统及可读存储介质 |
CN113973315A (zh) * | 2020-07-22 | 2022-01-25 | 中国移动通信有限公司研究院 | 一种信息处理方法、装置、网络设备及存储介质 |
CN114143266A (zh) * | 2021-11-29 | 2022-03-04 | 中国平安财产保险股份有限公司 | 基于机器学习的流量管控方法、装置、设备及介质 |
CN116016303A (zh) * | 2022-12-05 | 2023-04-25 | 浪潮通信信息系统有限公司 | 一种基于人工智能的核心网业务质量问题识别方法 |
CN116595428A (zh) * | 2023-07-18 | 2023-08-15 | 天翼云科技有限公司 | 一种基于cnn使用日志频谱分析的用户分类方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103227999A (zh) * | 2013-05-02 | 2013-07-31 | 中国联合网络通信集团有限公司 | 网络流量预测方法和装置 |
CN103714139A (zh) * | 2013-12-20 | 2014-04-09 | 华南理工大学 | 一种移动海量客户群识别的并行数据挖掘方法 |
CN106228389A (zh) * | 2016-07-14 | 2016-12-14 | 武汉斗鱼网络科技有限公司 | 基于随机森林算法的网络潜力用户挖掘方法及系统 |
CN107609712A (zh) * | 2017-09-30 | 2018-01-19 | 新智能源系统控制有限责任公司 | 一种基于分类预测的能量对齐方法和装置 |
CN110417607A (zh) * | 2018-04-26 | 2019-11-05 | 中移(苏州)软件技术有限公司 | 一种流量预测方法、装置及设备 |
-
2018
- 2018-12-07 CN CN201811493635.4A patent/CN109711865A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103227999A (zh) * | 2013-05-02 | 2013-07-31 | 中国联合网络通信集团有限公司 | 网络流量预测方法和装置 |
CN103714139A (zh) * | 2013-12-20 | 2014-04-09 | 华南理工大学 | 一种移动海量客户群识别的并行数据挖掘方法 |
CN106228389A (zh) * | 2016-07-14 | 2016-12-14 | 武汉斗鱼网络科技有限公司 | 基于随机森林算法的网络潜力用户挖掘方法及系统 |
CN107609712A (zh) * | 2017-09-30 | 2018-01-19 | 新智能源系统控制有限责任公司 | 一种基于分类预测的能量对齐方法和装置 |
CN110417607A (zh) * | 2018-04-26 | 2019-11-05 | 中移(苏州)软件技术有限公司 | 一种流量预测方法、装置及设备 |
Non-Patent Citations (3)
Title |
---|
王伟军: "《大数据分析》", 31 May 2017, 重庆大学出版社 * |
童明荣: "《城市物流系统规划 理论、实践与案例》", 31 May 2014, 浙江大学出版社 * |
马海印: "面向场景的3G移动数据业务流量建模分析及预测", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110175711A (zh) * | 2019-05-17 | 2019-08-27 | 北京市天元网络技术股份有限公司 | 一种基于联合lstm基站小区流量预测方法以及装置 |
CN112118587A (zh) * | 2019-06-19 | 2020-12-22 | 大唐移动通信设备有限公司 | 一种小区管理的方法和设备 |
WO2020253228A1 (zh) * | 2019-06-19 | 2020-12-24 | 大唐移动通信设备有限公司 | 一种小区管理的方法和设备 |
CN110309307A (zh) * | 2019-06-20 | 2019-10-08 | 上海上湖信息技术有限公司 | 一种基于应用程序预测用户文化水平的方法和系统 |
CN112202585B (zh) * | 2019-07-08 | 2022-07-01 | 中国移动通信集团浙江有限公司 | 无线网络流量预测方法、装置及电子设备 |
CN112202585A (zh) * | 2019-07-08 | 2021-01-08 | 中国移动通信集团浙江有限公司 | 无线网络流量预测方法、装置及电子设备 |
CN110474808A (zh) * | 2019-08-20 | 2019-11-19 | 中国联合网络通信集团有限公司 | 一种流量预测方法及装置 |
CN110474808B (zh) * | 2019-08-20 | 2022-02-18 | 中国联合网络通信集团有限公司 | 一种流量预测方法及装置 |
CN112561551A (zh) * | 2019-09-26 | 2021-03-26 | 富士通株式会社 | 用于优化对象预测的方法、设备和存储介质 |
CN111027592A (zh) * | 2019-11-14 | 2020-04-17 | 中科软智(北京)科技有限公司 | 细粒度对象流量分析方法和装置 |
CN111027592B (zh) * | 2019-11-14 | 2023-07-11 | 中科软智(北京)科技有限公司 | 细粒度对象流量分析方法和装置 |
CN111083710A (zh) * | 2019-12-20 | 2020-04-28 | 大唐网络有限公司 | 一种用于5g系统的智慧组网方法 |
CN113038302A (zh) * | 2019-12-25 | 2021-06-25 | 中国电信股份有限公司 | 流量预测方法及装置、计算机可存储介质 |
CN113038302B (zh) * | 2019-12-25 | 2022-09-30 | 中国电信股份有限公司 | 流量预测方法及装置、计算机可存储介质 |
CN111241225B (zh) * | 2020-01-10 | 2023-08-08 | 北京百度网讯科技有限公司 | 常驻区域变更的判断方法、装置、设备及存储介质 |
CN111241225A (zh) * | 2020-01-10 | 2020-06-05 | 北京百度网讯科技有限公司 | 常驻区域变更的判断方法、装置、设备及存储介质 |
CN111415192A (zh) * | 2020-02-27 | 2020-07-14 | 重庆森鑫炬科技有限公司 | 基于大数据的用户用水性质预测方法 |
WO2022001480A1 (zh) * | 2020-06-28 | 2022-01-06 | 中兴通讯股份有限公司 | 热门应用识别方法、网络系统、网络设备及存储介质 |
CN113973315A (zh) * | 2020-07-22 | 2022-01-25 | 中国移动通信有限公司研究院 | 一种信息处理方法、装置、网络设备及存储介质 |
CN112085282B (zh) * | 2020-09-11 | 2023-08-04 | 中国联合网络通信集团有限公司 | 小区流量预测方法及服务器 |
CN112085282A (zh) * | 2020-09-11 | 2020-12-15 | 中国联合网络通信集团有限公司 | 小区流量预测方法及服务器 |
CN112529624B (zh) * | 2020-12-15 | 2024-01-09 | 北京百度网讯科技有限公司 | 生成业务预测模型的方法、装置、设备以及存储介质 |
CN112529624A (zh) * | 2020-12-15 | 2021-03-19 | 北京百度网讯科技有限公司 | 生成业务预测模型的方法、装置、设备以及存储介质 |
CN112862195A (zh) * | 2021-02-19 | 2021-05-28 | 金陵科技学院 | 基于sft-als的时间序列粉丝涨幅预测方法 |
CN112862195B (zh) * | 2021-02-19 | 2023-06-20 | 金陵科技学院 | 基于sft-als的时间序列粉丝涨幅预测方法 |
CN113347573A (zh) * | 2021-05-12 | 2021-09-03 | 东莞理工学院 | 基于用户移动位置预测的负载均衡切换优化方法及系统 |
CN114143266A (zh) * | 2021-11-29 | 2022-03-04 | 中国平安财产保险股份有限公司 | 基于机器学习的流量管控方法、装置、设备及介质 |
CN113935881A (zh) * | 2021-12-16 | 2022-01-14 | 北京融信数联科技有限公司 | 一种基于大数据的人口结构分析方法、系统及可读存储介质 |
CN116016303A (zh) * | 2022-12-05 | 2023-04-25 | 浪潮通信信息系统有限公司 | 一种基于人工智能的核心网业务质量问题识别方法 |
CN116595428A (zh) * | 2023-07-18 | 2023-08-15 | 天翼云科技有限公司 | 一种基于cnn使用日志频谱分析的用户分类方法及系统 |
CN116595428B (zh) * | 2023-07-18 | 2023-10-13 | 天翼云科技有限公司 | 一种基于cnn使用日志频谱分析的用户分类方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109711865A (zh) | 一种基于用户行为挖掘的移动通信网流量精细化预测的方法 | |
Zhong et al. | Detecting the dynamics of urban structure through spatial network analysis | |
Moghadam et al. | Urban energy planning procedure for sustainable development in the built environment: A review of available spatial approaches | |
Andrienko et al. | A visual analytics framework for spatio-temporal analysis and modelling | |
Musolino et al. | Freight vehicle routing with reliable link travel times: A method based on network fundamental diagram | |
CN101794296B (zh) | 一种基于空中活动目标数据的挖掘方法 | |
CN108764663A (zh) | 一种电力客户画像生成管理的方法及系统 | |
Zhao et al. | Impact of smart city planning and construction on economic and social benefits based on big data analysis | |
CN106408343A (zh) | 一种基于bp神经网络的用户行为分析与预测的建模方法及其装置 | |
CN108492134A (zh) | 基于多周期回归树集成的大数据用户用电行为分析系统 | |
CN106599038A (zh) | 面向电力应用的可视化统计发布系统 | |
CN108537691A (zh) | 一种区域游览智能管理系统及方法 | |
CN106846163A (zh) | 一种电力缴费渠道综合分析系统 | |
Feng et al. | [Retracted] Design and Simulation of Human Resource Allocation Model Based on Double‐Cycle Neural Network | |
CN108416524A (zh) | 基于一张图通用框架的产业规划精细化解读方法 | |
CN106980874B (zh) | 一种面向配网大数据的多时态维度数据融合方法 | |
Salley et al. | The Natural Resources Conservation Service land resource hierarchy and ecological sites | |
CN108830423A (zh) | 一种基于预报域的年径流预测方法 | |
CN111985716B (zh) | 一种客运信息可视化的客运量预测系统 | |
CN116187640B (zh) | 一种基于网格多属性画像体系的配电网规划方法及装置 | |
CN110009416A (zh) | 一种基于大数据清洗和ai精准营销的系统 | |
Broach et al. | Calibrated labeling method for generating bicyclist route choice sets incorporating unbiased attribute variation | |
CN109978215A (zh) | 巡防管理方法和装置 | |
CN109345296A (zh) | 民众出行需求预测方法、装置及计算机终端 | |
CN108038734A (zh) | 基于点评数据的城市商业设施空间分布探测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190503 |