CN112954726A - 一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质 - Google Patents

一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质 Download PDF

Info

Publication number
CN112954726A
CN112954726A CN202110195670.3A CN202110195670A CN112954726A CN 112954726 A CN112954726 A CN 112954726A CN 202110195670 A CN202110195670 A CN 202110195670A CN 112954726 A CN112954726 A CN 112954726A
Authority
CN
China
Prior art keywords
holiday
base station
flow
algorithm
station sector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110195670.3A
Other languages
English (en)
Other versions
CN112954726B (zh
Inventor
张海霞
康天宇
袁东风
梁聪
梁道君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202110195670.3A priority Critical patent/CN112954726B/zh
Publication of CN112954726A publication Critical patent/CN112954726A/zh
Application granted granted Critical
Publication of CN112954726B publication Critical patent/CN112954726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质,节假日无线流量预测方法包括:步骤1)依据日期的不同分别定义节假日权重;步骤2)依据节假日权重计算基站扇区的节假日系数;步骤3)依据节假日系数将所有基站扇区的流量模式进行分类;步骤4)构建混合算法模型;步骤5)得到不同流量模式对应的训练好的混合算法模型;步骤6)使用训练好的混合算法模型对基站扇区进行无线流量预测。本发明提出将基站扇区通过节假日系数分为不同流量模式,对各个模式训练一个公共的模型的架构可以有效解决过拟合的问题,使模型具有灵活性与捕捉流量变化特征的能力。

Description

一种基于相关性聚类混合算法模型的节假日无线流量预测方 法、系统、设备及介质
技术领域
本发明涉及一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质,属于无线流量预测技术领域。
背景技术
随着智能手机等设备的普及,无线蜂窝网络具有越来越重要的作用。准确预测基站扇区的流量对于基站资源部署、功率分配等具有重要的参考意义,是实现智能通信网络的重要前提。特别是在节假日期间,由于人口的大量流动,许多地区的流量使用情况会发生改变,比如在许多农村地区,许多外出工作者会在节假日期间集中回乡,而他们正是使用流量的主力,这将会导致这些地区在节假日期间的无线流量使用量激增。相反的,在很多学校或者办公区域,在节假日期间会因为人员放假而导致无线流量使用量锐减。如果可以准确预测到这些变化,那就可以针对这些变化提前做出部署,比如在无线流量使用增多的地区进行扩容或者加大功率以保证用户使用体验,在无线流量使用减少的地区减小功率以降低成本,使得基站可以低碳,低成本,高效率运行。
总结目前使用人工智能进行无线流量预测的工作,大体上分为三种思路,一是改进模型,使模型更适合无线流量预测;二是将无线流量本身进行分为不同的部分,然后分别预测这些部分,最后将这些部分相加得到最终的预测结果;三是结合无线流量之外的其他相关信息共同进行预测,比如使用基站所在的空间特性以及天气情况等。但是,现有工作主要聚焦于数分钟、数小时等短期持续时间内的无线流量预测,且所使用的的数据一般为非节假日数据或未对节假日时期的预测做出特别处理。然而,在一些重要节假日,比如春节,由于放假时间很长,许多人会选择出行,加之对手机等需要消耗流量的智能终端的使用时间与平常相比也有较大变化,这些会导致某些地区的流量使用异于平常,有些极剧烈的变化会超出基站所能提供的最大服务范围。为了防止基站在节假日时期无法为用户提供优质的服务,运营商会选择提前对某些基站做出调整,对无线流量使用量增加的基站进行物理资源扩容。相似的,也会调低某些流量使用量降低的基站的功率等,避免资源的浪费。因此,精确预测基站在节假日期间的流量可以指导运营商进行提前的部署,提高服务质量。
在流量预测领域,目前使用较多的思路是对每个基站单独进行处理,为每一个基站训练一个模型,当进行预测时,使用各个基站对应的模型进行预测。然而,当针对春节期间的流量值预测,由于春节期间的流量模式与平时变化很大,因此非节假日时期的流量对于春节时期的流量预测效果有限,甚至有时会造成错误干扰。在节假日无线流量预测的过程中,在可用数据较少的场景,所获得的每个基站的流量数据中只包含一次春节期间的数据,如果只使用该扇区对应的春节数据进行模型训练的话,会导致过拟合,使得预测的某一年春节期间的数据与上一年的数据十分相似。
发明内容
针对现有技术的不足,本发明提供了一种基于相关性聚类混合算法模型的节假日无线流量预测方法及预测系统,先依据日期的不同分别定义节假日权重,然后依据节假日权重计算节假日系数,再利用节假日系数将所有基站扇区的流量模式进行分类;使用各个流量模式下包含的所有基站扇区的数据构建训练集,对相应流量模式的预测模型进行训练;使用训练所得的混合算法模型进行基于基站扇区的无线流量预测。本发明提出将基站扇区通过节假日系数分为不同流量模式,对各个模式训练一个公共的模型的架构可以有效解决过拟合的问题,使模型具有灵活性与捕捉流量变化特征的能力;
本发明还提供了一种计算机设备及存储介质。
术语解释:
1.长短时记忆算法:简称LSTM算法,LSTM算法可以用来预测时间序列的数值,是一种特殊的RNN算法,可以学习长期依赖信息。LSTM由Hochreiter&Schmidhuber(1997)提出,并在近期被Alex Graves进行了改良和推广。在很多问题,LSTM都取得相当巨大的成功,并得到了广泛的使用。LSTM通过特别的设计来避免长期记忆消失问题。记住长期的信息在实践中是LSTM的默认行为,而非需要付出很大代价才能获得的能力。所有RNN都具有一种重复神经网络模块的链式的形式。在标准的RNN中,这个重复的模块只有一个非常简单的结构,例如一个tanh层。LSTM同样是这样的结构,但是重复的模块拥有一个不同的结构。不同于单一神经网络层,这里是有四个,以一种非常特殊的方式进行交互。LSTM的核心是细胞状态,用贯穿细胞的水平线表示。细胞状态像传送带一样。它贯穿整个细胞却只有很少的分支,这样能保证信息不变的流过整个RNNs。LSTM网络能通过一种被称为门的结构对细胞状态进行删除或者添加信息。门能够有选择性的决定让哪些信息通过。LSTM由三个门来控制细胞状态,这三个门分别称为忘记门、输入门和输出门,通过这种机制可以使算法具有对信息的长期记忆能力,在时序信号处理中可同时利用近期信息和长期信息。
2.随机森林回归算法:简称RFR算法,是一种数值预测算法,属于集成学习流派,是对Bagging算法进行了改进。随机森林回归算法构建若干弱学习器,使用弱学习器对同一输入进行预测,然后将各个弱学习器输出的结果进行集成融合,得到最终的输出。
3.支持向量回归算法:简称SVR算法,支持向量回归可用来拟合曲线,起到预测数值的效果。支持向量回归通过计算模型输出与真实值之间的差别来计算损失,将难以在低纬度通过函数准确拟合的曲线映射到高纬度进行拟合,并且可以通过设置间隔带来提高模型的鲁棒性。
4.线性回归算法:简称LR算法,线性回归是回归问题中的一种,线性回归假设目标值与特征之间线性相关,即满足一个多元一次方程。通过构建损失函数,来求解损失函数最小时的参数w和b。通常可以表达成如下公式:y=wx+b,其中x是输入,w和b是需要学习的参数,y是输出。线性回归的目标是找到w和b使得在输入x时,wx+b的值与y最接近。
本发明的技术方案为:
一种基于相关性聚类混合算法模型的节假日无线流量预测方法,用于对基站扇区的流量进行预测,具体步骤包括:
步骤1)依据日期的不同分别定义节假日权重;通过节假日权重来表征每一天的重要性,节假日系数越高则说明该日期是一个重要的节假日;
步骤2)依据节假日权重计算基站扇区的节假日系数;
步骤3)依据节假日系数将所有基站扇区的流量模式进行分类;
步骤4)使用线性回归算法、长短时记忆算法、随机森林回归算法、支持向量回归算法共同构建混合算法模型;选择多种算法来共同构建混合算法模型是为了同时学习同一个流量模式下的基站扇区的公共特征和独立特征,即通过线性回归算法学习基站扇区的公共特征,通过长短时记忆算法、随机森林回归和支持向量回归算法学习独立特征。
步骤5)将不同流量模式下包含的所有基站扇区的流量数据分别构建训练集,并使用不同流量模式对应的训练集分别训练混合算法模型,得到不同流量模式对应的训练好的混合算法模型;即每一种流量模式对应的训练集训练得到一种混合算法模型;
步骤6)使用训练好的混合算法模型对基站扇区进行无线流量预测。
根据本发明优选的,步骤1)中,依据日期的不同分别定义节假日权重,具体为:
(1)对除春节外的节假日进行流量预测时:工作日的节假日权重为0,非节假日周末和寒暑假的权重为1,节假日时长小于等于三天的日期的节假日权重为3,节假日时长大于三天的日期的节假日权重为5,将春节前七天的节假日权重赋值为3,春节后七天的节假日权重赋值为7;由于在中国春节是一个最重要的节日,其持续时间也与一般节假日不同,春节前的一段时间虽然不是法定节假日,但是陆续会有很多人返乡,因此在设定春节期间的节假日系数时我们进行了单独赋值。
(2)对春节进行流量预测时:为更准确的对基站扇区在春节时期的流量表现进行分类,提高模型的预测准确性,截取春节前三周的日期定义为节假日权重Ws,定义如下:
Figure BDA0002946347980000041
式(II)中,D为春节日期,d为春节前三周内的任意一天,即距离春节大于8天的日期的春节权重都设置为0;距离春节八天内的日期,每天的权重从1到8依次增加,即在除夕当天权重达到8。
根据本发明优选的,步骤2)中,依据节假日权重计算基站扇区的节假日系数,具体操作步骤如下:
计算节假日权重序列与基站扇区的流量序列之间的皮尔逊相关性系数,将皮尔逊相关性系数作为基站扇区的节假日系数,皮尔逊相关性系数ρX,Y的计算公式为:
Figure BDA0002946347980000051
式(I)中,X是节假日权重序列,节假日权重序列为按照时间先后顺序由不同日期对应的节假日权重组成的一维序列;Y是基站扇区的流量序列,基站扇区的流量序列为按照时间先后顺序由基站扇区每天的无线流量组成的一维序列;E(·)表示数学期望,即平均值;σX表示节假日权重序列的方差,σY表示基站扇区的流量序列的方差,μX表示节假日权重序列的平均值,μY表示基站扇区的流量序列的平均值。
皮尔逊相关性是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。当取值为1时两个序列呈正线性相关,当取值为-1时两个序列呈负线性相关,为0则代表二者没有明显的线性相关性。需要计算所有基站扇区的节假日系数,以据此对基站扇区进行分类。
根据本发明优选的,步骤3)中,利用节假日系数将所有基站扇区的流量模式分为5类模式,具体为:0.4≤节假日系数<1,基站扇区的流量模式为强正相关模式;
当0.2≤节假日系数<0.4,基站扇区的流量模式为弱正相关模式;
当-0.1≤节假日系数<0.2,基站扇区的流量模式为不相关模式;
当-0.3≤节假日系数<-0.1,基站扇区的流量模式为弱负相关模式;
当1≤节假日系数<-0.3,基站扇区的流量模式为强负相关模式。
节假日系数表征一个基站扇区的流量随节假日的变化情况,节假日系数接近1,表征该基站扇区在节假日期间流量会增高;节假日系数接近0,表征该基站扇区的流量变化与节假日无明显线性关系;节假日系数接近-1,表征该基站扇区的流量会在节假日期间降低。
根据本发明优选的,步骤5)中,使用不同流量模式对应的训练集分别训练混合算法模型,得到不同流量模式对应的训练好的混合算法模型,具体过程为:
5-1、将某一种流量模式对应的训练集分别输入到线性回归算法、长短时记忆算法、随机森林回归算法、支持向量回归算法中进行训练,当各算法的损失函数值不再下降时,确定个算法中神经元的权重和连接系数;
5-2、将步骤5-1得到的4个算法加权融合,再将某一种流量模式对应的训练集输入到混合算法模型中进行训练,通过训练确定最终预测结果中各个算法的权重,得到最终预测结果yPred满足:
yPred=wLine*yLine+wLSTM*yLSTM+wRF*yRF+wSVM*ySVM (III)
式(III)中,yPred为最终预测结果,yLine为线性回归算法的预测输出,wLine为线性回归算法的权重,yLSTM为长短时记忆算法的预测输出,wLSTM为长短时记忆算法的权重,yRF为随机森林回归算法的预测输出,wRF为随机森林回归算法的权重,ySVM为支持向量回归算法的预测输出,wSVM为支持向量回归算法的权重;
步骤5-2训练结束的条件为最终预测结果yPred的损失函数不再下降;
5-3、重复步骤5-1和5-2,将其他四种流量模式对应的混合算法模型。
根据本发明优选的,步骤6)中,使用训练好的混合算法模型对基站扇区进行无线流量预测,具体过程为:
6-1、确定待预测节假日的日期,获取进行预测时之前两周的待预测基站扇区的流量值;
6-2、查询待预测基站扇区在进行预测时之前两周所属的流量模式;
6-3、将待预测时之前两周的基站扇区的流量值输入到步骤6-2流量模式对应的训练好的混合算法模型中,训练好的混合算法模型输出该基站扇区在节假日的流量值,实现对基站扇区的无线流量预测。
为了方便调整,提前三天进行节假日的预测;预测时,输入量为进行预测时之前两周的该基站扇区的流量值。例如,要预测除夕当日的某基站扇区的流量值,则要在腊月二十七进行预测,预测时输入腊月十三到腊月二十六该基站扇区的流量值。
根据本发明优选的,依据步骤6)得到的无线预测结果对基站进行调整部署,具体为:
当预测结果显示某基站扇区在节假日的流量使用量增加50%以上时,提前3天的时间对该基站扇区进行资源扩容或者提升该基站扇区的功率,以保证用户的使用体验;
当预测结果显示某基站扇区在节假日的流量使用量降低50%以上时,降低该基站扇区的功率,降低运营成本,低碳运行。
一种基于相关性聚类混合算法模型的节假日无线流量预测系统,该系统用于实现所述基于相关性聚类混合算法模型的节假日无线流量预测方法,依据日期的不同分别定义节假日权重,然后依据节假日权重计算节假日系数;再利用节假日系数将所有基站扇区的流量模式进行分类;使用各个流量模式下包含的所有基站扇区的数据构建训练集,对相应流量模式的混合算法模型进行训练;使用训练所得的混合算法模型进行基于基站扇区的无线流量预测。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述基于相关性聚类混合算法模型的节假日无线流量预测方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于相关性聚类混合算法模型的节假日无线流量预测方法的步骤。
本发明的有益效果为:
1.本发明一种基于相关性聚类混合算法模型的节假日无线流量预测方法,提出将基站扇区通过节假日系数分为不同模式,对各个模式训练一个公共的模型的架构可以有效解决过拟合的问题,使模型具有灵活性与捕捉流量变化特征的能力。
2.本发明提出的架构可以大大减少需要训练的模型数量。以本发明所使用的数据集为例,该数据集包含2830个基站扇区,按照常规方法需要训练2830个模型对其分别进行预测。本发明所提架构只需对每一种流量模式训练一个公共的模型,本发明将2830个基站扇区分为了五种流量模式,因此在预测某一节假日的流量时只需训练5个模型。
3.本发明使用实际运营商的流量数据对本发明所提模型进行性能验证,结果以流量值的平均绝对值误差MSE进行衡量,所有基站的平均绝对值误差MAE为4.23;而常规算法中,对每一个基站扇区都训练一个单独的模型的方法,常规算法的MAE为6.87;本发明提供的预测方法明显优于常规算法以及人工预测结果。
4.本发明所提模型为提前三天进行预测,为运营商进行基站调整留出充足的操作时间,适于实际应用场景。
5.基于本发明所预测结果可对基站调整,可以提高用户流量使用体验,并可对部分流量使用量减少的基站扇区调低功率,节约运营成本。
附图说明
图1为长短时记忆算法的示意图;
图2为随机森林回归算法的示意图;
图3为支持向量回归算法的示意图;
图4为实施例2中基站扇区节假日系数分布图;
图5为实施例2中节假日系数最高的基站扇区的无线流量和节假日权重图;
图6为实施例2中节假日系数最低的基站扇区的无线流量和节假日权重图;
图7为实施例2中节假日系数最接近0的基站扇区的无线流量和节假日权重图;
图8为本发明提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法的过程示意图。
具体实施方式
下面结合实施例和说明书附图对本发明做进一步说明,但不限于此。
实施例1
一种基于相关性聚类混合算法模型的节假日无线流量预测方法,用于对基站扇区的流量进行预测,如图8所示,具体步骤包括:
步骤1)依据日期的不同分别定义节假日权重;通过节假日权重来表征每一天的重要性,节假日系数越高则说明该日期是一个重要的节假日;
步骤2)依据节假日权重计算基站扇区的节假日系数;
步骤3)依据节假日系数将所有基站扇区的流量模式进行分类;
步骤4)使用线性回归算法、长短时记忆算法、随机森林回归算法、支持向量回归算法共同构建混合算法模型;选择多种算法来共同构建混合算法模型是为了同时学习同一个流量模式下的基站扇区的公共特征和独立特征,即通过线性回归算法学习基站扇区的公共特征,通过长短时记忆算法、随机森林回归和支持向量回归算法学习独立特征。
步骤5)将不同流量模式下包含的所有基站扇区的流量数据分别构建训练集,并使用不同流量模式对应的训练集分别训练混合算法模型,得到不同流量模式对应的训练好的混合算法模型;即每一种流量模式对应的训练集训练得到一种混合算法模型;
步骤6)使用训练好的混合算法模型对基站扇区进行无线流量预测。
实施例2
根据实施例1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,区别在于:
步骤1)中,依据日期的不同分别定义节假日权重,具体为:
(1)对除春节外的节假日进行流量预测时:工作日的节假日权重为0,非节假日周末和寒暑假的权重为1,节假日时长小于等于三天的日期的节假日权重为3,节假日时长大于三天的日期的节假日权重为5,将春节前七天的节假日权重赋值为3,春节后七天的节假日权重赋值为7;由于在中国春节是一个最重要的节日,其持续时间也与一般节假日不同,春节前的一段时间虽然不是法定节假日,但是陆续会有很多人返乡,因此在设定春节期间的节假日系数时我们进行了单独赋值。
(2)对春节进行流量预测时:为更准确的对基站扇区在春节时期的流量表现进行分类,提高模型的预测准确性,截取春节前三周的日期定义为节假日权重Ws,定义如下:
Figure BDA0002946347980000091
式(II)中,D为春节日期,d为春节前三周内的任意一天,即距离春节大于8天的日期的春节权重都设置为0;距离春节八天内的日期,每天的权重从1到8依次增加,即在除夕当天权重达到8。
步骤2)中,依据节假日权重计算基站扇区的节假日系数,具体操作步骤如下:
计算节假日权重序列与基站扇区的流量序列之间的皮尔逊相关性系数,将皮尔逊相关性系数作为基站扇区的节假日系数,皮尔逊相关性系数ρX,Y的计算公式为:
Figure BDA0002946347980000101
式(I)中,X是节假日权重序列,节假日权重序列为按照时间先后顺序由不同日期对应的节假日权重组成的一维序列;Y是基站扇区的流量序列,基站扇区的流量序列为按照时间先后顺序由基站扇区每天的无线流量组成的一维序列;E(·)表示数学期望,即平均值;σX表示节假日权重序列的方差,σY表示基站扇区的流量序列的方差,μX表示节假日权重序列的平均值,μY表示基站扇区的流量序列的平均值;
皮尔逊相关性是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。当取值为1时两个序列呈正线性相关,当取值为-1时两个序列呈负线性相关,为0则代表二者没有明显的线性相关性。需要计算所有基站扇区的节假日系数,以据此对基站扇区进行分类。
在进行春节时期的流量预测时,可计算春节系数。春节系数通过计算春节时期的春节权重序列与对应日期的流量序列的皮尔逊相关性系数得到。
本实施例中,通过中国某城市移动公司获取以天为最小单位进行统计的、时间跨度为1年、2830个基站的无线流量值,进行基于扇区的节假日无线流量预测研究。
不同基站扇区对应的节假日系数的如图4所示。图4中每一个点代表一个基站扇区,横坐标为对应基站扇区的代号,纵坐标为该基站扇区的节假日系数。
步骤3)中,利用节假日系数将所有基站扇区的流量模式分为5类模式,具体为:
0.4≤节假日系数<1,基站扇区的流量模式为强正相关模式;
当0.2≤节假日系数<0.4,基站扇区的流量模式为弱正相关模式;
当-0.1≤节假日系数<0.2,基站扇区的流量模式为不相关模式;
当-0.3≤节假日系数<-0.1,基站扇区的流量模式为弱负相关模式;
当1≤节假日系数<-0.3,基站扇区的流量模式为强负相关模式。
节假日系数表征一个基站扇区的流量随节假日的变化情况,节假日系数接近1,表征该基站扇区在节假日期间流量会增高;节假日系数接近0,表征该基站扇区的流量变化与节假日无明显线性关系;节假日系数接近-1,表征该基站扇区的流量会在节假日期间降低。
图5为第2757号基站扇区,在不同日期时,节假日权重与无线流量值之间的相关关系,第2757号基站扇区的节假日系数为0.794,基站扇区的流量模式为强正相关模式,即当节假日权重较高时,对应的无线流量值也较高。
图6为第1533号基站扇区,在不同日期时,节假日权重与无线流量值之间的相关关系,第1533号基站扇区的节假日系数为-0.579,基站扇区的流量模式为强负相关模式,即当节假日权重较高时,对应的无线流量值较小。
图7为第1664号基站扇区,在不同日期时,节假日权重与无线流量值之间的相关关系,第1664号基站扇区的节假日系数为-0.065,基站扇区的流量模式为不相关模式,即节假日权重与无线流量值不存在明显的对应关系。
步骤4)中,选用线性回归算法、LSTM算法、随机森林回归算法、支持向量回归算法构建混合算法模型,这四种流量预测研究领域常用的算法,而且也通过实验证明了其效果是较好的。
线性回归算法、随机森林回归算法和支持向量回归算法是调用的python中sklearn库的算法;
如图2所示,该图为随机森林模型示意图,X为模型的输入,Tree 1到Tree n为n棵弱决策树,每棵决策树的输入都为X,F为融合函数,可将n棵弱决策树的输出进行融合,得到随机森林模型的输出Y。
如图3所示,该图为支持向量回归模型示意图,图中所示为二阶支持向量回归,f(x)为对输入进行拟合得到的预测函数,其中ε为能容忍的预测值与真实值之间的偏差,当且仅当二者的差别绝对值大于ε时,才计算损失,此时相当于以f(x)为中心,构建一个宽度为2ε的间隔带,若训练样本落入此间隔带,则认为是被预测正确的。使用SVR算法可在一定程度上缓解过拟合问题,并且可以提高模型的泛化能力。
LSTM算法是调用的python中keras库中的算法,LSTM神经网络包括三层网络结构,第一层为LSTM层,第一层的输出为长度为256的一维向量,第二层也为LSTM层,第二层输出为长度为32的一维向量,第三层为全连接层,经过三层网络结构后通过一个softmax层输出预测结果;如图1所示,该图为LSTM算法模型图,图中xt为当前时刻的输入,ht为当前时刻的输出,ht-1为前一时刻的输出,Ct-1为前一时刻的模型状态,Ct为当前时刻的模型状态。图1中x和+分别为乘法运算和加法运算,σ为sigmoid激活函数,tanh为Tanh激活函数。
步骤5)中,使用不同流量模式对应的训练集分别训练混合算法模型,得到不同流量模式对应的训练好的混合算法模型,具体过程为:
5-1、将某一种流量模式对应的训练集分别输入到线性回归算法、长短时记忆算法、随机森林回归算法、支持向量回归算法中进行训练,当各算法的损失函数值不再下降时,确定个算法中神经元的权重和连接系数;
5-2、将步骤5-1得到的4个算法加权融合,再将某一种流量模式对应的训练集输入到混合算法模型中进行训练,通过训练确定最终预测结果中各个算法的权重,得到最终预测结果yPred满足:
yPred=wLine*yLine+wLSTM*yLSTM+wRF*yRF+wSVM*ySVM (III)
式(III)中,yPred为最终预测结果,yLine为线性回归算法的预测输出,wLine为线性回归算法的权重,yLSTM为长短时记忆算法的预测输出,wLSTM为长短时记忆算法的权重,yRF为随机森林回归算法的预测输出,wRF为随机森林回归算法的权重,ySVM为支持向量回归算法的预测输出,wSVM为支持向量回归算法的权重;
步骤5-2训练结束的条件为最终预测结果yPred的损失函数不再下降;
5-3、重复步骤5-1和5-2,将其他四种流量模式对应的混合算法模型。
即将五种流量模式对应的训练集分别训练,最终得到五个混合算法模型。
步骤6)中,使用训练好的混合算法模型对基站扇区进行无线流量预测,具体过程为:
6-1、确定待预测节假日的日期,获取进行预测时之前两周的待预测基站扇区的流量值;
6-2、查询待预测基站扇区在进行预测时之前两周所属的流量模式;
6-3、将待预测时之前两周的基站扇区的流量值输入到步骤6-2流量模式对应的训练好的混合算法模型中,训练好的混合算法模型输出该基站扇区在节假日的流量值,实现对基站扇区的无线流量预测。
为了方便调整,提前三天进行节假日的预测;预测时,输入量为进行预测时之前两周的该基站扇区的流量值。例如,要预测除夕当日的某基站扇区的流量值,则要在腊月二十七进行预测,预测时输入腊月十三到腊月二十六该基站扇区的流量值。
实施例3
根据实施例2提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,区别在于:
依据步骤6)得到的无线预测结果对基站进行调整部署,具体为:
当预测结果显示某基站扇区在节假日的流量使用量增加50%以上时,提前3天的时间对该基站扇区进行资源扩容或者提升该基站扇区的功率,以保证用户的使用体验;
当预测结果显示某基站扇区在节假日的流量使用量降低50%以上时,降低该基站扇区的功率,降低运营成本,低碳运行。
使用实际运营商的流量数据对本发明所提模型进行性能验证,性能验证即比较使用本发明所得的预测结果与真实结果之间的差距,结果以流量值的平均绝对值误差MAE进行衡量,所有基站的平均绝对值误差MAE为4.23;而常规算法中,对每一个基站扇区都训练一个单独的模型的方法,常规算法的MAE为6.87;本发明提供的预测方法明显优于常规算法以及人工预测结果。
实施例4
一种基于相关性聚类混合算法模型的节假日无线流量预测系统,用于实现实施例1-3任一个提供的节假日无线流量预测方法,依据日期的不同分别定义节假日权重,然后依据节假日权重计算节假日系数;再利用节假日系数将所有基站扇区的流量模式进行分类;使用各个流量模式下包含的所有基站扇区的数据构建训练集,对相应流量模式的混合算法模型进行训练;使用训练所得的混合算法模型进行基于基站扇区的无线流量预测。
实施例5
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现实施例1-3任一个实施例提供的基于相关性聚类混合算法模型的节假日无线流量预测方法的步骤。
实施例6
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现实施例1-3任一个实施例提供的基于相关性聚类混合算法模型的节假日无线流量预测方法的步骤。

Claims (10)

1.一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,用于对基站扇区的流量进行预测,其特征在于,具体步骤包括:
步骤1)依据日期的不同分别定义节假日权重;
步骤2)依据节假日权重计算基站扇区的节假日系数;
步骤3)依据节假日系数将所有基站扇区的流量模式进行分类;
步骤4)使用线性回归算法、长短时记忆算法、随机森林回归算法、支持向量回归算法共同构建混合算法模型;
步骤5)将不同流量模式下包含的所有基站扇区的流量数据分别构建训练集,并使用不同流量模式对应的训练集分别训练混合算法模型,得到不同流量模式对应的训练好的混合算法模型;即每一种流量模式对应的训练集训练得到一种混合算法模型;
步骤6)使用训练好的混合算法模型对基站扇区进行无线流量预测。
2.根据权利要求1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,步骤1)中,依据日期的不同分别定义节假日权重,具体为:
(1)对除春节外的节假日进行流量预测时:工作日的节假日权重为0,非节假日周末和寒暑假的权重为1,节假日时长小于等于三天的日期的节假日权重为3,节假日时长大于三天的日期的节假日权重为5,将春节前七天的节假日权重赋值为3,春节后七天的节假日权重赋值为7;
(2)对春节进行流量预测时:截取春节前三周的日期定义为节假日权重Ws,定义如下:
Figure FDA0002946347970000011
式(II)中,D为春节日期,d为春节前三周内的任意一天,即距离春节大于8天的日期的春节权重都设置为0;距离春节八天内的日期,每天的权重从1到8依次增加,即在除夕当天权重达到8。
3.根据权利要求1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,步骤2)中,依据节假日权重计算基站扇区的节假日系数,具体操作步骤如下:
计算节假日权重序列与基站扇区的流量序列之间的皮尔逊相关性系数,将皮尔逊相关性系数作为基站扇区的节假日系数,皮尔逊相关性系数ρX,Y的计算公式为:
Figure FDA0002946347970000021
式(I)中,X是节假日权重序列,节假日权重序列为按照时间先后顺序由不同日期对应的节假日权重组成的一维序列;Y是基站扇区的流量序列,基站扇区的流量序列为按照时间先后顺序由基站扇区每天的无线流量组成的一维序列;E(·)表示数学期望,即平均值;σX表示节假日权重序列的方差,σY表示基站扇区的流量序列的方差,μX表示节假日权重序列的平均值,μY表示基站扇区的流量序列的平均值。
4.根据权利要求1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,步骤3)中,利用节假日系数将所有基站扇区的流量模式分为5类模式,具体为:0.4≤节假日系数<1,基站扇区的流量模式为强正相关模式;
当0.2≤节假日系数<0.4,基站扇区的流量模式为弱正相关模式;
当-0.1≤节假日系数<0.2,基站扇区的流量模式为不相关模式;
当-0.3≤节假日系数<-0.1,基站扇区的流量模式为弱负相关模式;
当1≤节假日系数<-0.3,基站扇区的流量模式为强负相关模式。
5.根据权利要求1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,步骤5)中,使用不同流量模式对应的训练集分别训练混合算法模型,得到不同流量模式对应的训练好的混合算法模型,具体过程为:
5-1、将某一种流量模式对应的训练集分别输入到线性回归算法、长短时记忆算法、随机森林回归算法、支持向量回归算法中进行训练,当各算法的损失函数值不再下降时,确定个算法中神经元的权重和连接系数;
5-2、将步骤5-1得到的4个算法加权融合,再将某一种流量模式对应的训练集输入到混合算法模型中进行训练,通过训练确定最终预测结果中各个算法的权重,得到最终预测结果yPred满足:
yPred=wLine*yLine+wLSTM*yLSTM+wRF*yRF+wSVM*ySVM (III)
式(III)中,yPred为最终预测结果,yLine为线性回归算法的预测输出,wLine为线性回归算法的权重,yLSTM为长短时记忆算法的预测输出,wLSTM为长短时记忆算法的权重,yRF为随机森林回归算法的预测输出,wRF为随机森林回归算法的权重,ySVM为支持向量回归算法的预测输出,wSVM为支持向量回归算法的权重;
步骤5-2训练结束的条件为最终预测结果yPred的损失函数不再下降;
5-3、重复步骤5-1和5-2,将其他四种流量模式对应的混合算法模型。
6.根据权利要求1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,步骤6)中,使用训练好的混合算法模型对基站扇区进行无线流量预测,具体过程为:
6-1、确定待预测节假日的日期,获取进行预测时之前两周的待预测基站扇区的流量值;
6-2、查询待预测基站扇区在进行预测时之前两周所属的流量模式;
6-3、将待预测时之前两周的基站扇区的流量值输入到步骤6-2流量模式对应的训练好的混合算法模型中,训练好的混合算法模型输出该基站扇区在节假日的流量值,实现对基站扇区的无线流量预测。
7.根据权利要求1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,依据步骤6)得到的无线预测结果对基站进行调整部署,具体为:
当预测结果显示某基站扇区在节假日的流量使用量增加50%以上时,提前3天的时间对该基站扇区进行资源扩容或者提升该基站扇区的功率;
当预测结果显示某基站扇区在节假日的流量使用量降低50%以上时,降低该基站扇区的功率。
8.一种基于相关性聚类混合算法模型的节假日无线流量预测系统,其特征在于,该系统用于实现权利要求1-7任一项所提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,依据日期的不同分别定义节假日权重,然后依据节假日权重计算节假日系数;再利用节假日系数将所有基站扇区的流量模式进行分类;使用各个流量模式下包含的所有基站扇区的数据构建训练集,对相应流量模式的预测模型进行训练;使用训练所得的混合算法模型进行基于基站扇区的无线流量预测。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1-7任一项所提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一项所提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法的步骤。
CN202110195670.3A 2021-02-22 2021-02-22 一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质 Active CN112954726B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110195670.3A CN112954726B (zh) 2021-02-22 2021-02-22 一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110195670.3A CN112954726B (zh) 2021-02-22 2021-02-22 一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN112954726A true CN112954726A (zh) 2021-06-11
CN112954726B CN112954726B (zh) 2022-06-07

Family

ID=76245115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110195670.3A Active CN112954726B (zh) 2021-02-22 2021-02-22 一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN112954726B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114374983A (zh) * 2021-12-29 2022-04-19 中国电信股份有限公司 一种基站流量预测方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978597A (zh) * 2019-01-22 2019-07-05 广东工业大学 一种节假日效应下的商品销量预测方法
CN111695722A (zh) * 2020-05-13 2020-09-22 南京理工大学 一种城市轨道交通车站节假日短时客流预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978597A (zh) * 2019-01-22 2019-07-05 广东工业大学 一种节假日效应下的商品销量预测方法
CN111695722A (zh) * 2020-05-13 2020-09-22 南京理工大学 一种城市轨道交通车站节假日短时客流预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHUANTING ZHANG ET AL: ""Deep_Transfer_Learning_for_Intelligent_Cellular_Traffic_Prediction_Based_on_Cross-Domain_Big_Data"", 《IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS》 *
MEHRNOOSH TORABI ET AL: ""A Hybrid Clustering and Classification Technique for Forecasting Short-Term Energy Consumption"", 《ENVIRONMENTAL PROGRESS & SUSTAINABLE ENERGY》 *
光志瑞: "城市轨道交通节假日客流预测研究", 《交通工程》 *
金聪等: "基于天气对地铁的短时客流预测", 《物流科技》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114374983A (zh) * 2021-12-29 2022-04-19 中国电信股份有限公司 一种基站流量预测方法、装置及电子设备

Also Published As

Publication number Publication date
CN112954726B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
Zhang et al. Citywide cellular traffic prediction based on densely connected convolutional neural networks
CN108280551B (zh) 一种利用长短期记忆网络的光伏发电功率预测方法
US20210133536A1 (en) Load prediction method and apparatus based on neural network
CN110674999A (zh) 基于改进聚类和长短期记忆深度学习的小区负荷预测方法
CN108932671A (zh) 一种采用深度q神经网络调参的lstm风电负荷预测方法
CN101541016B (zh) 数据预测方法和设备
CN109769280B (zh) 一种基于机器学习的wifi智能预测切换方法
CN108134979B (zh) 基于深度神经网络的小基站开关控制方法
CN112954726B (zh) 一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质
CN110675278A (zh) 一种基于rbf神经网络的光伏功率短期预测方法
CN110766190A (zh) 一种配电网负荷预测方法
CN101706888A (zh) 一种旅行时间预测的方法
CN112787878A (zh) 一种网络指标的预测方法及电子设备
Huang et al. ContextFL: Context-aware federated learning by estimating the training and reporting phases of mobile clients
Korecki et al. Analytically guided reinforcement learning for green it and fluent traffic
CN110830939B (zh) 基于改进的cpn-wlan指纹定位数据库的定位方法
CN114726463B (zh) 基于神经网络的移动通信用户时空分布预测方法及装置
Lawal et al. Improving HSDPA traffic forecasting using ensemble of neural networks
CN116862043A (zh) 一种基于多层前馈网络的负荷预测方法及系统
Oladeji et al. Determination of voice traffic busy hour and traffic forecasting in Global System of Mobile Communication (GSM) in Nigeria
CN114390582B (zh) 基站站址预测方法及装置
CN114372615A (zh) 一种考虑空间相关性的短期光伏功率预测方法及系统
Ping et al. A hybrid location algorithm based on BP neural networks for mobile position estimation
CN111669767A (zh) 一种传感器网络动态部署方法
Liu et al. Forecast of bicycle sharing demand using BP neural network based on improved brain storm optimization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant