CN110417607A - 一种流量预测方法、装置及设备 - Google Patents
一种流量预测方法、装置及设备 Download PDFInfo
- Publication number
- CN110417607A CN110417607A CN201810385375.2A CN201810385375A CN110417607A CN 110417607 A CN110417607 A CN 110417607A CN 201810385375 A CN201810385375 A CN 201810385375A CN 110417607 A CN110417607 A CN 110417607A
- Authority
- CN
- China
- Prior art keywords
- flow
- feature
- period
- value
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
- H04L43/0882—Utilisation of link capacity
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种流量预测方法、装置及设备,包括:根据流量和与流量相关的多个关键特征在过去N个周期的数据,建立时序预测模型,预测未来周期的流量值,根据突发因素导致的流量增长值和与突发因素相关的多个特征的历史数据,建立突发因素模型,预测未来周期的流量增长值,进而根据预测的未来周期的流量值和流量增长值,得到未来周期的流量值。可见,在进行流量预测时,除了考虑历史的流量数据以外,还考虑了与流量相关的多个关键特征,以及突发因素的影响,并针对与流量相关的多个关键特征建立时序预测模型,预测未来周期的流量趋势,针对突发因素建立突发因素模型,预测未来周期的流量增幅,从而有效提高了流量预测的准确性。
Description
技术领域
本发明涉及计算机数据处理技术领域,尤其涉及一种流量预测方法、装置及设备。
背景技术
随着互联网技术的高速发展、4G网络的实施推广和智能终端数量指数性的增长,移动运营商的4G用户数量和数据业务数量不断增长。为了更好的推广4G业务,各大运营商推出了视频流量包等类似活动,将在短期内导致数据流量的增长,如果不提前做好数据流量预估工作,进行相关的网络整改支撑,将会导致的网络拥塞、崩溃等故障频繁发生,严重影响用户体验。为了维护网络安全,提高网络性能,提升用户服务质量,应对活动推广带来的流量冲击、需对数据流量进行精准预测。
现有的技术方案一般基于长期的历史数据流量数据采用统计回归、平滑或传统时序分析模型进行预测,而仅仅通过流量历史数据分析预测未能全面考虑多方因素综合预测,结果准确性很难保证。
综上所述,目前亟需要一种流量预测方法,用以提高流量预测的准确性。
发明内容
本发明提供一种流量预测方法、装置及设备,用以提高流量预测的准确性。
本发明实施例提供的一种流量预测方法,包括:
根据流量和与流量相关的多个关键特征在过去N个周期的数据,建立时序预测模型,预测未来周期的流量值;
根据突发因素导致的流量增长值和与所述突发因素相关的多个特征的历史数据,建立突发因素模型,预测所述未来周期的流量增长值;
根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值。
可选地,所述与流量相关的多个关键特征是通过如下方式确定出的:
根据流量和与流量相关的多个特征在过去N个周期的历史数据,生成随机森林,所述随机森林中包括多个决策树;
针对所述多个特征中的任一特征,根据对所述任一特征扰动前后,所述各个决策树对其对应的测试数据集分类成功的正确率,确定所述任一特征的重要性量度;
选取所述各个特征中重要性量度大于设定阈值或重要性量度较大的前L个特征,作为所述关键特征。
可选地,所述突发因素为活动推广;
根据突发因素导致的流量增长值、与所述突发因素相关的多个特征的历史数据,建立突发因素模型,预测所述未来周期的流量增长值,包括:
针对未来的第P个周期,根据与活动推广有关的多个特征的历史数据,以及各个活动在推广P个周期后引起的历史流量增长值,建立第P突发因素模型,预测未来第P个周期的流量增长值,其中,P小于等于N。
可选地,与所述活动推广有关的多个特征至少包括如下类型的特征:
地域活力特征、活动推广力度特征、活动吸引力特征。
可选地,所述地域活力特征至少包括如下特征中的一项或多项:
上网普及率、4G用户占比、每用户平均流量消费额DOU、每用户平均收入ARPU值、4G驻留比、流量饱和度;
所述活动推广力度特征至少包括如下特征中的一项或多项:
推广时间、推广区域、推广渠道、活动目标客户占比;
所述活动吸引力特征至少包括如下特征中的一项或多项:
活动是否可转赠、是否只针对4G用户、流量是否分区域、流量是否分时段、流量是否分网络、使用周期。
可选地,根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值,包括:
针对所述第P个周期,将所述时序预测模型预测的所述第P个周期的流量值,与所述第P突发因素模型预测的所述第P个周期的流量增长值相加,得到所述第P个周期的总流量。
可选地,所述时序预测模型为循环神经网络RNN模型或长短期记忆网络LSTM模型,所述突发因素模型为统计回归模型或人工神经网络模型。
基于同样的发明构思,本发明还提供一种流量预测装置,包括:
第一预测模块,用于根据流量和与流量相关的多个关键特征在过去N个周期的数据,建立时序预测模型,预测未来周期的流量值;
第二预测模块,用于根据突发因素导致的流量增长值和与所述突发因素相关的多个特征的历史数据,建立突发因素模型,预测所述未来周期的流量增长值;
处理模块,用于根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值。
可选地,所述第一预测模块还用于:
根据流量和与流量相关的多个特征在过去N个周期的历史数据,生成随机森林,所述随机森林中包括多个决策树;
针对所述多个特征中的任一特征,根据对所述任一特征扰动前后,所述各个决策树对其对应的测试数据集分类成功的正确率,确定所述任一特征的重要性量度;
选取所述各个特征中重要性量度大于设定阈值或重要性量度较大的前L个特征,作为所述关键特征。
可选地,所述突发因素为活动推广;
所述第二预测模块还用于:
针对未来的第P个周期,根据与活动推广有关的多个特征的历史数据,以及各个活动在推广P个周期后引起的历史流量增长值,建立第P突发因素模型,预测未来第P个周期的流量增长值,其中,P小于等于N。
可选地,与所述活动推广有关的多个特征至少包括如下类型的特征:
地域活力特征、活动推广力度特征、活动吸引力特征。
可选地,所述地域活力特征至少包括如下特征中的一项或多项:
上网普及率、4G用户占比、每用户平均流量消费额DOU、每用户平均收入ARPU值、4G驻留比、流量饱和度。
所述活动推广力度特征至少包括如下特征中的一项或多项:
推广时间、推广区域、推广渠道、活动目标客户占比。
所述活动吸引力特征至少包括如下特征中的一项或多项:
活动是否可转赠、是否只针对4G用户、流量是否分区域、流量是否分时段、流量是否分网络、使用周期。
可选地,所述处理模块具体用于:
针对所述第P个周期,将所述时序预测模型预测的所述第P个周期的流量值,与所述第P突发因素模型预测的所述第P个周期的流量增长值相加,得到所述第P个周期的总流量。
可选地,所述时序预测模型为循环神经网络RNN模型或长短期记忆网络LSTM模型,所述突发因素模型为统计回归模型或人工神经网络模型。
本发明另一实施例提供了一种流量预测设备,其包括存储器和处理器,其中,所述存储器用于存储程序指令,所述处理器用于调用所述存储器中存储的程序指令,按照获得的程序执行上述任一种方法。
本发明另一实施例提供了一种计算机存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行上述任一种方法。
本发明实施例中,根据流量和与流量相关的多个关键特征在过去N个周期的数据,建立时序预测模型,预测未来周期的流量值,根据突发因素导致的流量增长值和与所述突发因素相关的多个特征的历史数据,建立突发因素模型,预测所述未来周期的流量增长值,进而根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值。可见,在进行流量预测时,除了考虑历史的流量数据以外,还考虑了与流量相关的多个关键特征,以及突发因素的影响,并针对与流量相关的多个关键特征建立时序预测模型,预测未来周期的流量趋势,针对突发因素建立突发因素模型,预测未来周期的流量增幅,从而有效提高了流量预测的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种流量预测方法所对应的流程示意图;
图2为本发明实施例提供的关键特征选择方法所对应的流程示意图;
图3为本发明实施例提供的一种流量预测装置的结构示意图;
图4为本发明实施例提供的一种流量预测设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例,仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面结合说明书附图对本发明实施例做进一步详细描述。
图1示出了本发明实施例中提供的一种流量预测方法所对应的流程示意图,如图1所示,所述方法包括:
步骤S101:根据流量和与流量相关的多个关键特征在过去N个周期的数据,建立时序预测模型,预测未来周期的流量值;
步骤S102:根据突发因素导致的流量增长值和与所述突发因素相关的多个特征的历史数据,建立突发因素模型,预测所述未来周期的流量增长值;
步骤S103:根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值。
可见,在进行流量预测时,除了考虑历史的流量数据以外,还考虑了与流量相关的多个关键特征,以及突发因素的影响,并针对与流量相关的多个关键特征建立时序预测模型,预测未来周期的流量趋势,针对突发因素建立突发因素模型,预测未来周期的流量增幅,从而有效提高了流量预测的准确性。
需要说明的是,本发明实施例对步骤S101和步骤S102的执行顺序不做具体限制,也可以先执行S102预测未来周期的流量增长值,再执行步骤S101预测未来周期的流量值。
在步骤S101的具体实施中,可先根据业务需求确定与流量相关的多个特征,进而再从这与流量相关的多个特征中,筛选出关键特征,以构建时序预测模型。
如下表1为本发明实施例中所选用的与流量相关的多个特征,如表1所示,与流量相关的多个特征至少包括:日期、用户数、用户平均在网时长、4G在网时长、本月平均APRU(AverageRevenuePerUser,每用户平均收入)、4G客户占比、高流量客户占比、中高端客户占比、流量饱和度、4G驻留比、超套餐流量费用、视频流量占比、本月4G流量、本月流量。
需要说明的是,表1中所列出的与流量相关的多个特征是由本领域技术人员筛选出来的业务指标,基于对业务的理解,本领域技术人员还可对上述特征加以修改或添加其他特征,本发明对此不做具体限制。
表1
具体的,可采用多种类型的特征选择算法中从上述与流量相关的多个特征中筛选出关键特征。特征选择算法具有多样性,一般来说,特征选择算法可分为过滤式(Filter)、包裹式(Wrapper)、嵌入式(Embedded)三类,其中,过滤式不依赖于模型,包裹式和嵌入式均需要结合模型进行特征选择。通过特征选择算法,选择出对流量预测具有更好解释力的特征,从而提高预测模型的性能,提高最终流量预测的准确性。
可选地,本发明实施例具体采用随机森林平均精确率减少算法选择关键特征,该算法属于一种嵌入式算法,如图2所示,具体可采用如下步骤实施:
步骤S201:根据流量和与流量相关的多个特征在过去N个周期的历史数据,生成随机森林;其中N为正整数;
在步骤S201的具体实施中,采集流量和与流量相关的多个特征在过去N个周期的历史数据,构成原始数据集,原始数据集中的每个样本均具有M个特征,其中M为正整数,数值等于选取的与流量相关的特征的数量加一。
所述随机森林由多个决策树构成,以其中的任一决策树为例,生成决策树的过程包括:确定该决策树对应的处理数据集和测试数据集;其中,每个决策树的处理数据集中的样本是从原始数据集中随机有放回地抽取的,其包含的样本数量小于原始数据集中的样本数量,未包括在处理数据集中的其他样本则都归类于该决策树的测试数据集中,而且,不同决策树的处理数据集中包含的样本数量相同。
从M个特征中随机选取m个特征,构建决策树,决策树中的每一个节点都是关于某个特征的条件,依据该条件可将处理数据集按照该特征一分为二。具体的,在决策树的每个节点处,计算m个特征中的还未进行分类的各个特征的分类能力,并选取分类能力最强的特征对处理数据集进行节点分裂。令各个决策树自然生长,不进行剪枝。m为小于M的正整数。
步骤S202:针对所述多个特征中的任一特征,根据对所述任一特征扰动前后,所述各个决策树对其对应的测试数据集分类成功的正确率,确定所述任一特征的重要性量度;
在步骤S202的具体实施中,使用构建好的决策树,对各个决策树对应的测试数据集进行分类,统计分类正确的样本个数;
随后,针对M个特征中的各个特征逐一执行如下处理:对各个决策树的测试数据集中该特征的特征值进行扰动,得到扰动后的测试数据集,使用构建好的决策树,对各个决策树扰动后的测试数据集进行分类,统计分类正确的样本的个数;
某一特征的重要性量度等于对各个决策树的测试数据集扰动后分类成功的正确率,即:
其中,Xj为M个特征中的任一特征,,为特征Xj的重要性量度,K为决策树的数量,k表示随机森林中的某一决策树,为对特征Xj扰动前,第k个决策树对其测试数据集分类正确的样本数量,为对特征Xj扰动后,第k个决策树对其扰动后的测试数据集分类正确的样本数量。
步骤S203:选取所述各个特征中重要性量度大于设定阈值或重要性量度较大的前L个特征,作为所述关键特征。其中,L为小于M的正整数。
进而,在步骤S101的具体实施中,确定L个关键特征后,可根据过去N个周期的流量数据和L个关键特征的特征数据,采用深度学习算法,建立时序预测模型,预测未来周期的流量值。其中,所述未来周期可以为未来的某一个或多个周期,例如当前时间为1月份,该未来周期为2月份,或2月至5月的4个月。
本发明实施例中,该时序预测模型具体为RNN(Recurrent Neural Networks,循环神经网络)模型,或者RNN模型的各种变体,如LSTM模型等,本发明对此不做具体限制。
例如,选取过去一年以月为粒度(即周期)的流量数据F(t-12)、F(t-11)至F(t-1),以及L个关键特征在相同时段内相同粒度下的特征数据E1(t-12)、E1(t-11)至E1(t-1),E2(t-12)、E2(t-11)至E2(t-1),……EL(t-12)、EL(t-11)至EL(t-1)训练RNN模型,并预测以月为粒度的流量值F(t+1)、F(t+2)……F(t+p),p小于等于12。
需要说明的是,本领域技术人员可根据数据的具体情况和业务需求,合理设置或修改数据的来源的时段和粒度,本发明对此不做具体限制。
此外,由于该RNN模型可预测未来多个周期(如未来的P个月,P为正整数)的流量值,因此,在利用流量和关键特征的历史数据训练RNN模型的模型参数之前,本领域技术人员还需确定RNN模型的神经网络结构,并设置输出的个数,即上例中的p值。
相比于传统的时序预测模型,本发明实施例中所采用的循环神经网络模型,在计算过程中加入了时序的特征,将隐含层单元增加反馈,每个隐含层的输入既包括当前样本特征,又包含上一个时序所带来的信息,从而使得计算结果具备记忆之前的几次结果的特点,提高了预测数据的准确性。
在步骤S102中,所述突发因素可包括多种类型的突发因素,但对于流量这一时序指标来说,目前最为重要的是运行商对新推业务(如4G业务)进行的活动推广。
本发明实施例中,活动推广因素可至少包括如下三类特征:
1、地域活力特征。其中,地域活力特征可包括省地市上网普及率、4G用户占比、平均DOU(Dataflow of usage,每用户平均流量消费额)、平均APRU(Average Revenue PerUser,每用户平均收入)、4G驻留比、流量饱和度等与区域相关,且影响活动推广情况的特征。
2、活动推广力度特征。其中,活动推广力度特征可包括推广时间、推广区域、推广渠道、活动目标客户占比等与活动推广力度相关的特征。
3、活动吸引力特征。活动吸引力特征可包括活动是否可转赠、是否只针对4G用户、流量是否分区域、流量是否分时段、流量是否分网络、使用周期。
在步骤S102的具体实施中,可根据历史上各次活动的推广活动特征、推广力度特征、推广区域特征的相关影响特征与推广活动后由于活动带来的流量增幅,采用回归算法或神经网络算法,建立突发因素模型,基于不同业务活动的相关特征综合评估活动推广对流量增幅的影响。所述突发因素模型可为统计回归模型或人工神经网络模型。
具体来说,可针对未来待预测的各个周期(如未来的1至p个月),以不同省地市、不同活动的活动相关特征为自变量,以活动推广后1至p个月参与活动的用户流量增长值作为因变量,分别建立突发因素模型。如此,若要预测由于活动推广因素而导致的未来P个周期的流量增长值,则可建立P个突发因素模型,分别用来预测未来第1个周期、第2个周期,……第P个周期的流量增长值。
例如,针对未来的第P个周期,根据与活动推广相关的多个特征的历史数据,以及各个活动在推广P个周期后引起的历史流量增长值,建立第P突发因素模型;将本次活动的活动相关特征作为模型输入,输入到该第p突发因素模型中,预测得到未来第P个周期的流量增长值,其中,P小于等于N。
现有技术中基于突发因素的预测很大程度地依赖于专家经验,并未进行精确计算,使得预测结果的准确性很难保证。本发明实施例中,基于活动相关特征的历史数据,建立突发因素模型预测未来的流量增长值,可有效提高流量增幅预测的准确性。
需要说明的是,本发明实施例中主要考虑了活动推广这一突发因素对流量增幅的影响,对于其他存在的历史数据、可控的突发因素,同样也可以采用类似的方法建立模型进行评估和预测,本发明对此不做具体限制。
在步骤S103的具体实施中,可根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值。
具体的,由于时序预测模型可预测未来P个周期的流量值,同时通过P个突发因素模型也可预测该未来P个周期由于活动相关特征导致的流量增长值,因而,针对未来的某一个周期,可将预测的流量值和流量增长值对应相加,进而得到该周期的流量预测值。
例如,由关键特征RNN时序模型预测得到的p个月的流量值F(t+1)、…、F(t+p)和由突发因素模型预测得到的由活动推广带来的流量增长值BI1、BI2、…、BIp对应求和,得到未来p个月流量预测值FP(t+1)、…、FP(t+p),计算公式如下:
FP(t+i)=F(t+i)+BIi i=1…p 公式二
需要说明的是,本发明实施例中所提供的预测方法也可适用于其他时序指标的预测,例如其他业务的用户数、资源利用率、带宽等,本发明实施例对此不做具体限制。
基于同样的发明构思,本发明实施例还提供一种流量预测装置,图3为本发明实施例中提供的一种流量预测装置的结构示意图,如图3所示,该装置300包括:
第一预测模块301,用于根据流量和与流量相关的多个关键特征在过去N个周期的数据,建立时序预测模型,预测未来周期的流量值;
第二预测模块302,用于根据突发因素导致的流量增长值和与所述突发因素相关的多个特征的历史数据,建立突发因素模型,预测所述未来周期的流量增长值;
处理模块303,用于根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值。
可选地,所述第一预测模块301还用于:
根据流量和与流量相关的多个特征在过去N个周期的历史数据,生成随机森林,所述随机森林中包括多个决策树;
针对所述多个特征中的任一特征,根据对所述任一特征扰动前后,所述各个决策树对其对应的测试数据集分类成功的正确率,确定所述任一特征的重要性量度;
选取所述各个特征中重要性量度大于设定阈值或重要性量度较大的前L个特征,作为所述关键特征。
可选地,所述突发因素为活动推广;
所述第二预测模块302还用于:
针对未来的第P个周期,根据与活动推广有关的多个特征的历史数据,以及各个活动在推广P个周期后引起的历史流量增长值,建立第P突发因素模型,预测未来第P个周期的流量增长值,其中,P小于等于N。
可选地,与所述活动推广有关的多个特征至少包括如下类型的特征:
地域活力特征、活动推广力度特征、活动吸引力特征。
可选地,所述地域活力特征至少包括如下特征中的一项或多项:
上网普及率、4G用户占比、每用户平均流量消费额DOU、每用户平均收入ARPU值、4G驻留比、流量饱和度。
所述活动推广力度特征至少包括如下特征中的一项或多项:
推广时间、推广区域、推广渠道、活动目标客户占比。
所述活动吸引力特征至少包括如下特征中的一项或多项:
活动是否可转赠、是否只针对4G用户、流量是否分区域、流量是否分时段、流量是否分网络、使用周期。
可选地,所述处理模块303具体用于:
针对所述第P个周期,将所述时序预测模型预测的所述第P个周期的流量值,与所述第P突发因素模型预测的所述第P个周期的流量增长值相加,得到所述第P个周期的总流量。
可选地,所述时序预测模型为循环神经网络RNN模型或长短期记忆网络LSTM模型,所述突发因素模型为统计回归模型或人工神经网络模型。
本发明另一实施例提供了一种流量预测设备,其包括存储器和处理器,其中,所述存储器用于存储程序指令,所述处理器用于调用所述存储器中存储的程序指令,按照获得的程序执行上述任一种方法。
本发明另一实施例提供了一种计算机存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行上述任一种方法。
基于同样的发明构思,本发明实施例还提供另一种流量预测设备,该设备具体可以为桌面计算机、便携式计算机、智能手机、平板电脑、个人数字助理(Personal DigitalAssistant,PDA)等。如图4所示,该设备400可以包括中央处理器(Center ProcessingUnit,CPU)402、存储器403、输入/输出设备404及总线系统405等。其中,输入设备可以包括键盘、鼠标、触摸屏等,输出设备可以包括显示设备,如液晶显示器(Liquid CrystalDisplay,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器提供存储器中存储的程序指令和数据。在本发明实施例中,存储器可以用于存储上述流量预测方法的程序。
处理器通过调用存储器存储的程序指令,处理器用于按照获得的程序指令执行上述流量预测方法。
基于同样的发明构思,本发明实施例提供了一种计算机存储介质,用于储存为上述检测终端所用的计算机程序指令,其包含用于执行上述流量预测方法的程序。
所述计算机存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等。
由上述内容可以看出:
本发明实施例中,根据流量和与流量相关的多个关键特征在过去N个周期的数据,建立时序预测模型,预测未来周期的流量值,根据突发因素导致的流量增长值和与所述突发因素相关的多个特征的历史数据,建立突发因素模型,预测所述未来周期的流量增长值,进而根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值。可见,在进行流量预测时,除了考虑历史的流量数据以外,还考虑了与流量相关的多个关键特征,以及突发因素的影响,并针对与流量相关的多个关键特征建立时序预测模型,预测未来周期的流量趋势,针对突发因素建立突发因素模型,预测未来周期的流量增幅,从而有效提高了流量预测的准确性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或两个以上其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或两个以上流程和/或方框图一个方框或两个以上方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或两个以上流程和/或方框图一个方框或两个以上方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或两个以上流程和/或方框图一个方框或两个以上方框中指定的功能的步骤。
尽管已描述了本发明的可选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括可选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种流量预测方法,其特征在于,所述方法包括:
根据流量和与流量相关的多个关键特征在过去N个周期的数据,建立时序预测模型,预测未来周期的流量值;
根据突发因素导致的流量增长值和与所述突发因素相关的多个特征的历史数据,建立突发因素模型,预测所述未来周期的流量增长值;
根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值。
2.根据权利要求1所述的方法,其特征在于,所述与流量相关的多个关键特征是通过如下方式确定出的:
根据流量和与流量相关的多个特征在过去N个周期的历史数据,生成随机森林,所述随机森林中包括多个决策树;
针对所述多个特征中的任一特征,根据对所述任一特征扰动前后,所述各个决策树对其对应的测试数据集分类成功的正确率,确定所述任一特征的重要性量度;
选取所述各个特征中重要性量度大于设定阈值或重要性量度较大的前L个特征,作为所述关键特征。
3.根据权利要求1所述的方法,其特征在于,所述突发因素为活动推广;
根据突发因素导致的流量增长值、与所述突发因素相关的多个特征的历史数据,建立突发因素模型,预测所述未来周期的流量增长值,包括:
针对未来的第P个周期,根据与活动推广有关的多个特征的历史数据,以及各个活动在推广P个周期后引起的历史流量增长值,建立第P突发因素模型,预测未来第P个周期的流量增长值,其中,P小于等于N。
4.根据权利要求3所述的方法,其特征在于,与所述活动推广有关的多个特征至少包括如下类型的特征:
地域活力特征、活动推广力度特征、活动吸引力特征。
5.根据权利要求4所述的方法,其特征在于,所述地域活力特征至少包括如下特征中的一项或多项:
上网普及率、4G用户占比、每用户平均流量消费额DOU、每用户平均收入ARPU值、4G驻留比、流量饱和度;
所述活动推广力度特征至少包括如下特征中的一项或多项:
推广时间、推广区域、推广渠道、活动目标客户占比;
所述活动吸引力特征至少包括如下特征中的一项或多项:
活动是否可转赠、是否只针对4G用户、流量是否分区域、流量是否分时段、流量是否分网络、使用周期。
6.根据权利要求4所述的方法,其特征在于,根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值,包括:
针对所述第P个周期,将所述时序预测模型预测的所述第P个周期的流量值,与所述第P突发因素模型预测的所述第P个周期的流量增长值相加,得到所述第P个周期的总流量。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述时序预测模型为循环神经网络RNN模型或长短期记忆网络LSTM模型,所述突发因素模型为统计回归模型或人工神经网络模型。
8.一种流量预测装置,其特征在于,包括:
第一预测模块,用于根据流量和与流量相关的多个关键特征在过去N个周期的数据,建立时序预测模型,预测未来周期的流量值;
第二预测模块,用于根据突发因素导致的流量增长值和与所述突发因素相关的多个特征的历史数据,建立突发因素模型,预测所述未来周期的流量增长值;
处理模块,用于根据预测的所述未来周期的流量值和流量增长值,得到所述未来周期的流量值。
9.一种流量预测设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如权利要求1至7中任一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810385375.2A CN110417607B (zh) | 2018-04-26 | 2018-04-26 | 一种流量预测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810385375.2A CN110417607B (zh) | 2018-04-26 | 2018-04-26 | 一种流量预测方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110417607A true CN110417607A (zh) | 2019-11-05 |
CN110417607B CN110417607B (zh) | 2021-03-02 |
Family
ID=68345710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810385375.2A Active CN110417607B (zh) | 2018-04-26 | 2018-04-26 | 一种流量预测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110417607B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109711865A (zh) * | 2018-12-07 | 2019-05-03 | 恒安嘉新(北京)科技股份公司 | 一种基于用户行为挖掘的移动通信网流量精细化预测的方法 |
CN111144629A (zh) * | 2019-12-17 | 2020-05-12 | 国网辽宁省电力有限公司 | 一种水力发电站来水量预测方法及系统 |
CN111461384A (zh) * | 2019-12-10 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 对象流量预测方法、装置及设备 |
CN112291807A (zh) * | 2020-10-15 | 2021-01-29 | 山东科技大学 | 一种基于深度迁移学习和跨域数据融合的无线蜂窝网络流量预测方法 |
CN113067724A (zh) * | 2021-03-11 | 2021-07-02 | 西安电子科技大学 | 基于随机森林的周期性流量预测方法 |
CN114124733A (zh) * | 2020-08-27 | 2022-03-01 | 中国电信股份有限公司 | 业务流量的预测方法和装置 |
CN115396328A (zh) * | 2021-05-08 | 2022-11-25 | 中国移动通信有限公司研究院 | 一种网络指标预测方法、装置及电子设备 |
CN116502863A (zh) * | 2023-06-15 | 2023-07-28 | 武汉漫悠悠互联网科技有限公司 | 一种应用于智能公交线路的均衡调度方法及系统 |
CN114124733B (zh) * | 2020-08-27 | 2024-05-14 | 中国电信股份有限公司 | 业务流量的预测方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060104213A1 (en) * | 2004-11-18 | 2006-05-18 | Roger Sumner | Discrete choice method of reporting and predicting multiple transaction types |
CN103987056A (zh) * | 2014-05-30 | 2014-08-13 | 南京华苏科技有限公司 | 基于大数据统计模型的无线网络话务量预测方法 |
CN105703954A (zh) * | 2016-03-17 | 2016-06-22 | 福州大学 | 一种基于arima模型的网络数据流预测方法 |
CN106357456A (zh) * | 2016-10-11 | 2017-01-25 | 广东工业大学 | 一种网络流量的预测方法及装置 |
-
2018
- 2018-04-26 CN CN201810385375.2A patent/CN110417607B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060104213A1 (en) * | 2004-11-18 | 2006-05-18 | Roger Sumner | Discrete choice method of reporting and predicting multiple transaction types |
CN103987056A (zh) * | 2014-05-30 | 2014-08-13 | 南京华苏科技有限公司 | 基于大数据统计模型的无线网络话务量预测方法 |
CN105703954A (zh) * | 2016-03-17 | 2016-06-22 | 福州大学 | 一种基于arima模型的网络数据流预测方法 |
CN106357456A (zh) * | 2016-10-11 | 2017-01-25 | 广东工业大学 | 一种网络流量的预测方法及装置 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109711865A (zh) * | 2018-12-07 | 2019-05-03 | 恒安嘉新(北京)科技股份公司 | 一种基于用户行为挖掘的移动通信网流量精细化预测的方法 |
CN111461384B (zh) * | 2019-12-10 | 2024-04-05 | 阿里巴巴集团控股有限公司 | 对象流量预测方法、装置及设备 |
CN111461384A (zh) * | 2019-12-10 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 对象流量预测方法、装置及设备 |
CN111144629A (zh) * | 2019-12-17 | 2020-05-12 | 国网辽宁省电力有限公司 | 一种水力发电站来水量预测方法及系统 |
CN114124733B (zh) * | 2020-08-27 | 2024-05-14 | 中国电信股份有限公司 | 业务流量的预测方法和装置 |
CN114124733A (zh) * | 2020-08-27 | 2022-03-01 | 中国电信股份有限公司 | 业务流量的预测方法和装置 |
CN112291807A (zh) * | 2020-10-15 | 2021-01-29 | 山东科技大学 | 一种基于深度迁移学习和跨域数据融合的无线蜂窝网络流量预测方法 |
CN112291807B (zh) * | 2020-10-15 | 2022-09-23 | 山东科技大学 | 一种基于深度迁移学习和跨域数据融合的无线蜂窝网络流量预测方法 |
CN113067724B (zh) * | 2021-03-11 | 2022-04-19 | 西安电子科技大学 | 基于随机森林的周期性流量预测方法 |
CN113067724A (zh) * | 2021-03-11 | 2021-07-02 | 西安电子科技大学 | 基于随机森林的周期性流量预测方法 |
CN115396328A (zh) * | 2021-05-08 | 2022-11-25 | 中国移动通信有限公司研究院 | 一种网络指标预测方法、装置及电子设备 |
CN116502863A (zh) * | 2023-06-15 | 2023-07-28 | 武汉漫悠悠互联网科技有限公司 | 一种应用于智能公交线路的均衡调度方法及系统 |
CN116502863B (zh) * | 2023-06-15 | 2023-09-19 | 武汉漫悠悠互联网科技有限公司 | 一种应用于智能公交线路的均衡调度方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110417607B (zh) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110417607A (zh) | 一种流量预测方法、装置及设备 | |
CN108364085B (zh) | 一种外卖配送时间预测方法和装置 | |
CN110097066A (zh) | 一种用户分类方法、装置及电子设备 | |
CN104504084B (zh) | 确定用户留存率的方法及装置 | |
CN107547154B (zh) | 一种建立视频流量预测模型的方法及装置 | |
CN109325640A (zh) | 用户价值预测方法、装置、存储介质及设备 | |
CN103150696A (zh) | 选择目标增值业务潜在客户的方法及装置 | |
CN109345263A (zh) | 预测客户满意度的方法和系统 | |
CN106156092B (zh) | 数据处理方法及装置 | |
CN103647671A (zh) | 一种基于Gur Game的群智感知网络管理方法及其系统 | |
CN105933920A (zh) | 一种预测用户满意度的方法及装置 | |
CN110233741A (zh) | 服务计费方法、装置、设备及存储介质 | |
CN111428885B (zh) | 一种联邦学习中用户的索引方法及联邦学习装置 | |
CN112016773A (zh) | 一种确定潜力主播的方法及装置 | |
CN106991577A (zh) | 一种确定目标用户的方法及装置 | |
CN112101674B (zh) | 基于群智能算法资源配置匹配方法、装置、设备及介质 | |
WO2022267715A1 (zh) | 一种预言机节点筛选方法、装置、存储介质及电子装置 | |
CN106453143A (zh) | 带宽设置方法、装置和系统 | |
CN108595526A (zh) | 资源推荐方法及装置 | |
CN107784511A (zh) | 一种用户流失预测方法及装置 | |
CN109978575A (zh) | 一种挖掘用户流量经营场景的方法及装置 | |
CN109934675A (zh) | 对于新入网用户的套餐推荐方法、装置及系统 | |
CN109428760B (zh) | 一种基于运营商数据的用户信用评估方法 | |
CN113592156A (zh) | 电厂煤量调度方法、装置、终端设备及存储介质 | |
CN110910036A (zh) | 引导用户行为的资源份额发放方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |