CN107547154A - 一种建立视频流量预测模型的方法及装置 - Google Patents
一种建立视频流量预测模型的方法及装置 Download PDFInfo
- Publication number
- CN107547154A CN107547154A CN201610465136.9A CN201610465136A CN107547154A CN 107547154 A CN107547154 A CN 107547154A CN 201610465136 A CN201610465136 A CN 201610465136A CN 107547154 A CN107547154 A CN 107547154A
- Authority
- CN
- China
- Prior art keywords
- data
- characteristic
- video
- data set
- video flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
本发明涉及无线通信技术领域,尤其涉及一种建立视频流量预测模型的方法及装置,该方法包括:获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集;将获取得到的历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集;采用预设的特征选择算法组合对用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数;利用用于建立视频流量预测模型的数据集采用预设模型训练算法进行模型训练,获得与视频流量相关的至少一种特征参数与视频流量之间的映射关系,提高视频流量预测的准确性。
Description
技术领域
本发明涉及无线通信技术领域,尤其涉及一种建立视频流量预测模型的方法及装置。
背景技术
视频业务已经成为网络通信的主要组成部分,同时移动数据流量的大幅增长也主要由视频业务带动。建立精确的视频流量预测模型能有效提高资源容量规划的准确性。
目前视频流量预测方法主要是针对流量单维度地实现大空间尺度的预测,例如,基于时间序列的视频流量预测模型一般反映视频流量的三种实际变化规律:趋势变化、周期性变化、随机性变化。
具体的,参阅图1所述,在基于时间序列的视频流量预测模型中,以数据叠加/分拆的原理,对历史视频流量数据进行分拆,得到突发、趋势、周期、随机等分量,并分别提取各个分量的规律,进而获得各个分量分别对应的预测数据,然后再叠加起来获得预测的视频流量,该模型的优点在于简单易行,便于掌握,一般适用于短期和中期预测。
但是,视频流量具有复杂的强非线性特征,在采用基于时间序列的视频流量预测模型进行视频流量预测时,只通过历史视频流量数据获得预设结果,当历史视频流量数据变化剧烈时,比如小空间尺度的历史视频流量数据往往波动性很大,因此,单独使用一种数据进行预测,预测准确度较差。
发明内容
本发明实施例的目的是提供一种建立视频流量预测模型的方法及装置,以解决现有视频流量预测模型采用的数据源单一,预测精确度较差的问题。
本发明实施例的目的是通过以下技术方案实现的:
第一方面,一种建立视频流量预测模型的方法,包括:
获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集,其中,所述历史视频流量数据集中的每条历史视频流量数据携带历史视频流量值以及所述历史视频流量值对应的至少一个特征参数值,每种特征数据集中的每条特征数据携带描述终端产生视频流量过程中的至少一种特征参数值;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集;
采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数;
利用所述用于建立视频流量预测模型的数据集采用预设模型训练算法进行模型训练,获得与所述视频流量相关的至少一种特征参数与视频流量之间的映射关系。
在一种可能的实现方式中,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括测量报告MR数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,包括:
针对每条视频流量业务话单数据,执行:
从所述MR数据集中筛选出与当前视频流量业务话单数据相关联的MR,所述MR满足以下两个条件:
所述MR中包括的隧道端点标识符TEID与所述当前视频流量业务话单数据中包括的TEID相同;
所述MR的上报时间T3满足:
T1-T<T3<T2+T;
T1为所述当前视频流量业务话单数据的开始时间,T2为所述当前视频流量业务话单数据的结束时间,T为预设的时间间隔。
在一种可能的实现方式中,若存在至少两个MR的上报时间T3均满足T1-T<T3<T2+T,则选择T3-T1最小的MR与所述当前视频流量业务话单数据相关联。
因此,本发明实施例中通过将视频流量业务话单数据与MR关联,实现将MR中包含的特征参数添加入关联的视频流量业务话单中,使得用于建立视频流量预测模型的数据集中的数据包含多种维度的信息来描述视频流量,进而能够有效提高视频流量预测的准确性,实现多维度的视频流量预测。
在一种可能的实现方式中,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括话统数据数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,包括:
针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的基站小区标识ECI,确定基站标识eNodeBID和所述eNodeBID对应的基站所在的小区的标识CELLID;
从所述话统数据数据集中筛选出与所述当前视频流量业务话单数据相关联的话统数据,所述话统数据满足以下三个条件:
所述话统数据中包括的eNodeBID与所述当前视频流量业务话单数据中包括的eNodeBID相同;
所述话统数据中包括的CELLID与所述当前视频流量业务话单数据中包括的CELLID相同;
所述话统数据的开始时间T4和所述话统数据的结束时间T5满足:
T1<T4<T5<T2;
T1为所述当前视频流量业务话单数据的开始时间,T2为所述当前视频流量业务话单数据的结束时间。
因此,本发明实施例中通过将视频流量业务话单数据与话统数据关联,实现将话统数据中包含的特征参数添加入关联的视频流量业务话单中,使得用于建立视频流量预测模型的数据集中的数据包含多种维度的信息来描述视频流量,进而能够有效提高视频流量预测的准确性,实现多维度的视频流量预测。
在一种可能的实现方式中,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括工程参数数据数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,包括:
针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的ECI确定eNodeBID和CELLID;
从所述工程参数数据数据集中筛选出与所述当前视频流量业务话单数据相关联的工程参数数据,所述工程参数数据满足以下两个条件:
所述工程参数数据中包括的eNodeBID与所述当前视频流量业务话单数据中包括的eNodeBID相同;
所述工程参数数据中包括的CELLID与所述当前视频流量业务话单数据中包括的CELLID相同。
因此,本发明实施例中通过将视频流量业务话单数据与工程参数数据关联,实现将工程参数数据中包含的特征参数添加入关联的视频流量业务话单中,使得用于建立视频流量预测模型的数据集中的数据包含多种维度的信息来描述视频流量,进而能够有效提高视频流量预测的准确性,实现多维度的视频流量预测。
在一种可能的实现方式中,所述预设的特征选择算法组合为基于特征分布的特征选择算法,基于相关性系数的特征选择算法,基于随机森林重要性的特征选择算法和迭代特征估计的特征选择算法中的至少一种。
在一种可能的实现方式中,得到用于建立视频流量预测模型的数据集之后,采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选之前,还包括:
将所述用于建立视频流量预测模型的数据集进行栅格化处理。
在一种可能的实现方式中,得到用于建立视频流量预测模型的数据集之后,采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选之前,还包括:
将所述用于建立视频流量预测模型的数据集进行数据清洗。
在一种可能的实现方式中,所述预设模型训练算法为随机森林算法或梯度提升树算法,或支持向量算法中的任一一种。
第二方面、一种建立视频流量预测模型的装置,包括:
获取单元,用于获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集,其中,所述历史视频流量数据集中的每条历史视频流量数据携带历史视频流量值以及所述历史视频流量值对应的至少一个特征参数值,每种特征数据集中的每条特征数据携带描述终端产生视频流量过程中的至少一种特征参数值;
关联单元,用于将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集;
筛选单元,用于采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数;
模型训练单元,用于利用所述用于建立视频流量预测模型的数据集采用预设模型训练算法进行模型训练,获得与所述视频流量相关的至少一种特征参数与视频流量之间的映射关系。
在一种可能的实现方式中,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括测量报告MR数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联时,所述关联单元,具体用于:
针对每条视频流量业务话单数据,执行:
从所述MR数据集中筛选出与当前视频流量业务话单数据相关联的MR,所述MR满足以下两个条件:
所述MR中包括的隧道端点标识符TEID与所述当前视频流量业务话单数据中包括的TEID相同;
所述MR的上报时间T3满足:
T1-T<T3<T2+T;
T1为所述当前视频流量业务话单数据的开始时间,T2为所述当前视频流量业务话单数据的结束时间,T为预设的时间间隔。
在一种可能的实现方式中,所述关联单元,还用于:若存在至少两个MR的上报时间T3均满足T1-T<T3<T2+T,则选择T3-T1最小的MR与所述当前视频流量业务话单数据相关联。
在一种可能的实现方式中,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括话统数据数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联时,所述关联单元,具体用于:
针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的基站小区标识ECI,确定基站标识eNodeBID和所述eNodeBID对应的基站所在的小区的标识CELLID;
从所述话统数据数据集中筛选出与所述当前视频流量业务话单数据相关联的话统数据,所述话统数据满足以下三个条件:
所述话统数据中包括的eNodeBID与所述当前视频流量业务话单数据中包括的eNodeBID相同;
所述话统数据中包括的CELLID与所述当前视频流量业务话单数据中包括的CELLID相同;
所述话统数据的开始时间T4和所述话统数据的结束时间T5满足:
T1<T4<T5<T2;
T1为所述当前视频流量业务话单数据的开始时间,T2为所述当前视频流量业务话单数据的结束时间。
在一种可能的实现方式中,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括工程参数数据数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联时,所述关联单元,具体用于:
针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的ECI确定eNodeBID和CELLID;
从所述工程参数数据数据集中筛选出与所述当前视频流量业务话单数据相关联的工程参数数据,所述工程参数数据满足以下两个条件:
所述工程参数数据中包括的eNodeBID与所述当前视频流量业务话单数据中包括的eNodeBID相同;
所述工程参数数据中包括的CELLID与所述当前视频流量业务话单数据中包括的CELLID相同。
在一种可能的实现方式中,所述预设的特征选择算法组合为基于特征分布的特征选择算法,基于相关性系数的特征选择算法,基于随机森林重要性的特征选择算法和迭代特征估计的特征选择算法中的至少一种。
在一种可能的实现方式中,所述装置,还包括:
栅格化处理单元,用于在得到用于建立视频流量预测模型的数据集之后,在采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选之前,将所述用于建立视频流量预测模型的数据集进行栅格化处理。
在一种可能的实现方式中,所述装置,还包括:
数据清洗单元,用于在得到用于建立视频流量预测模型的数据集之后,在采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选之前,将所述用于建立视频流量预测模型的数据集进行数据清洗。
在一种可能的实现方式中,所述预设模型训练算法为随机森林算法或梯度提升树算法,或支持向量算法中的任一一种。
第三方面,一种建立视频流量预测模型的设备,包括:
收发器;
存储器,用于存储处理器执行的程序代码;和
所述处理器,与所述存储器和所述收发器分别相连,用于通过所述存储器中存储的程序代码,执行以下操作:
获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集,其中,所述历史视频流量数据集中的每条历史视频流量数据携带历史视频流量值以及所述历史视频流量值对应的至少一个特征参数值,每种特征数据集中的每条特征数据携带描述终端产生视频流量过程中的至少一种特征参数值;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集;
采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数;
利用所述用于建立视频流量预测模型的数据集采用预设模型训练算法进行模型训练,获得与所述视频流量相关的至少一种特征参数与视频流量之间的映射关系。
综上所述,获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集,将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集,因此,通过将多个数据源与历史视频流量数据相关联,使得用于建立视频流量预测模型的数据集中的数据包含多种维度的信息来描述视频流量。采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数,因此,通过算法组合筛选得到与视频流量相关的至少一种特征参数,提高特征参数筛选的有效性以及建立视频流量预测模型的效率。利用所述用于建立视频流量预测模型的数据集采用预设模型训练算法进行模型训练,获得与所述视频流量相关的至少一种特征参数与视频流量之间的映射关系。最终得到的视频流量预测模型包含多个来自不同数据源的特征参数,能够有效提高视频流量预测的准确性,并实现多维度的视频流量预测,包括多时间尺度即短中长期预测),多空间尺度即区域级,小区级和栅格级别预测。
附图说明
图1为本发明背景技术中基于时间序列的视频流量预测模型的示意图;
图2为本发明实施例中建立视频流量预测模型的方法的概述流程图;
图3为本发明实施例中视频流量业务话单数据与MR关联的具体流程图;
图4为本发明实施例中视频流量业务话单数据与话统数据关联的具体流程图;
图5为本发明实施例中视频流量业务话单数据与话统数据关联的具体流程图;
图6为本发明实施例中特征参数提取过程的示意图;
图7为本发明实施例中视频流量与用户平均速率和用户数的关系图;
图8为本发明实施例中总视频流量预测结果的示意图;
图9为本发明实施例中建立视频流量预测模型的具体流程图
图10为本发明实施例中流量预测模型库的功能实现图;
图11为本发明实施例中建立视频流量预测模型的装置示意图;
图12为本发明实施例中建立视频流量预测模型的设备示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。
参阅图2所示,本发明实施例提供一种建立视频流量预测模型的方法,包括:
步骤200:获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集。
其中,历史视频流量数据集中的每条历史视频流量数据携带历史视频流量值以及历史视频流量值对应的至少一个特征参数值,每种特征数据集中的每条特征数据携带描述终端产生视频流量过程中的至少一种特征参数值。
步骤210:将获取得到的历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集。
步骤220:采用预设的特征选择算法组合对用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数。
步骤230:利用用于建立视频流量预测模型的数据集采用预设模型训练算法进行模型训练,获得与视频流量相关的至少一种特征参数与视频流量之间的映射关系。
针对步骤200,历史视频流量数据集包括视频流量业务话单数据,其中,视频流量业务话单数据包含视频业务来源,服务小区,业务量等信息。
至少一种特征数据集可以为话统数据数据集、测量报告(Measurement Report,MR)数据集和工程参数数据数据集。
话统数据包含无线侧相关指标,例如,服务小区,关键性能指标(Key PerformanceIndicators,KPI)指标(例如,掉话率、切换成功率、CPU负荷等等信息)。
MR是指终端反馈给设备侧的信息,包含有终端所处的服务小区及邻区、及这些小区对应的信号强度等信息。
工程参数数据指无线网络规划中天线相关的数据,例如,天线方位角、天线下倾角、天线挂高、天线经纬度信息、发射功率等信息。
因此,本发明实施例中采集了多种数据源作为获取视频流量预测模型所需的输入,实现从多维度对视频流量进行描述,保证了视频流量预测模型能够进行多维度的视频流量预测,且提高了视频流量预测的准确性。
针对步骤210,由于一般用于模型训练的数据源是通过网络不同接口获取的,各个原始数据中包含的特征比较分散,必须进行数据关联处理。
可选地,本发明实施例提供历史视频流量数据与三种不同特征数据进行关联的具体实施过程。
第一种情况:历史视频流量数据集包括视频流量业务话单数据,至少一种特征数据集包括MR数据集。
将获取得到的每条视频流量业务话单数据分别与MR数据集中的MR进行关联时,针对每条视频流量业务话单数据,执行:
从MR数据集中筛选出与当前视频流量业务话单数据相关联的MR,筛选出的MR满足以下两个条件:
(1)MR中包括的隧道端点标识符(Tunnel Endpoint ID,TEID)与当前视频流量业务话单数据中包括的TEID相同。
(2)MR的上报时间T3满足:
T1-T<T3<T2+T。
T1为当前视频流量业务话单数据的开始时间,T2为当前视频流量业务话单数据的结束时间,T为预设的时间间隔。其中,T可以根据经验值设为5000ms。
此外,若存在至少两个MR的上报时间T3均满足T1-T<T3<T2+T,则选择T3-T1最小的MR与当前视频流量业务话单数据相关联。
参阅图3所示,为视频流量业务话单数据与MR关联的具体流程图。
S301:循环读取MR数据集中的MR。
S302:循环读取视频流量业务话单数据。
S301和S302不分先后。
S303:获取该MR的UlGtpTeId、T3=MR的上报时间。
S304:获取该话单数据的S1U_SGW_TEID、T1=话单数据的开始时间,T2=话单数据的结束时间。
S303和S304不分先后。
S305:关联条件:话单数据S1U_SGW_TEID=MR中UlGtpTeId、T1-T<T3<T2+T。
S306:将满足关联条件的MR填入关联到的话单数据中。
在一条视频流量业务话单数据与MR关联后,将该MR填入到该视频流量业务话单数据,作为一条用于建立视频流量预测模型的数据集中的数据,该数据中不仅包含视频流量业务话单中的视频业务来源,服务小区,业务量等信息,还包含与该视频流量业务话单关联的MR中包括的终端所处的服务小区及邻区、及这些小区对应的信号强度等信息。
第二种情况:历史视频流量数据集包括视频流量业务话单数据,至少一种特征数据集包括话统数据数据集。
将获取得到的每条视频流量业务话单数据分别与话统数据数据集中的话统数据进行关联,针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的基站小区标识ECI,确定基站标识(eNodeBID)和该eNodeBID对应的基站所在的小区的标识(CELLID)。
具体的,将ECI转换成10进制数据,则转换后的10进制数据的前三个字节为eNodeBID,后一个字节为CELLID。
接下来,从话统数据数据集中筛选出与当前视频流量业务话单数据相关联的话统数据,筛选出的话统数据满足以下三个条件:
(1)话统数据中包括的eNodeBID与当前视频流量业务话单数据中包括的eNodeBID相同。
(2)话统数据中包括的CELLID与当前视频流量业务话单数据中包括的CELLID相同。
(3)话统数据的开始时间T4和话统数据的结束时间T5满足:
T1<T4<T5<T2。
T1为当前视频流量业务话单数据的开始时间,T2为当前视频流量业务话单数据的结束时间。
参阅图4所示,为视频流量业务话单数据与话统数据关联的具体流程图。
S401:循环读取话统数据数据集中的话统数据。
S402:循环读取视频流量业务话单数据。
S401和S402不分先后。
S403:获取话统数据的eNodeBID、CELLID、T1=话统数据的开始时间,T2=话统数据的结束时间。
S404:获取该话单数据的小区标识ECI,转换成10进制数据,前三个字段为eNodeBID,后一个字节为CELLID,T3=话单数据的开始时间,T4=话单数据的结束时间。
S403和S404不分先后。
S405:关联条件:话统数据中的eNodeBID和话单数据中的eNodeBID相同、话统数据中的CELLID和话单数据中的CELLID相同、T1<T3<T4<T2。
S406:将满足关联条件的话统数据填入关联的话单数据中。
在一条视频流量业务话单数据与话统数据关联后,将该话统数据填入到该视频流量业务话单数据,作为一条用于建立视频流量预测模型的数据集中的数据,该数据中不仅包含视频流量业务话单中的视频业务来源,服务小区,业务量等信息,还包含与该视频流量业务话单关联的话统数据中包括的服务小区,KPI指标等信息。此外,若该视频流量业务话单也与MR关联,则该数据还包括MR中包括的终端所处的服务小区及邻区、及这些小区对应的信号强度等信息。因此,通过多个数据源进行关联,得到用于建立视频流量模型的数据集中的数据包含多种维度的信息来描述视频流量。
第三种情况:历史视频流量数据集包括视频流量业务话单数据,至少一种特征数据集包括工程参数数据数据集。
将获取得到的每条视频流量业务话单数据分别与工程参数数据数据集中的工程参数数据进行关联时,针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的ECI确定eNodeBID和CELLID。
这里与第二种情况中,通过ECI确定eNodeBID和CELLID的方法相同,此处不再赘述。
接下来,从工程参数数据数据集中筛选出与当前视频流量业务话单数据相关联的工程参数数据,筛选出的工程参数数据满足以下两个条件:
(1)工程参数数据中包括的eNodeBID与当前视频流量业务话单数据中包括的eNodeBID相同。
(2)工程参数数据中包括的CELLID与当前视频流量业务话单数据中包括的CELLID相同。
参阅图5所示,为视频流量业务话单数据与话统数据关联的具体流程图。
S501:循环读取工程参数数据数据集中的工程参数数据。
S502:循环读取视频流量业务话单。
S501和S502不分先后。
S503:获取工程参数数据的eNodeBID、CELLID。
S504:获取该话单数据的小区标识ECI,转换成10进制数据,前三个字段为eNodeBID,后一个字节为CELLID。
S503和S504不分先后。
S505:关联条件:工程参数数据中的eNodeBID与话单数据中的eNodeBID相同,工程参数数据中的CELLID与话单数据中的CELLID相同。
S506:将满足关联条件的工程参数数据填入关联的话单数据中。
在一条视频流量业务话单与工程参数数据关联后,将该工程参数数据填入到该视频流量业务话单,作为一条用于建立视频流量预测模型的数据集中的数据,该数据中不仅包含视频流量业务话单中的视频业务来源,服务小区,业务量等信息,还包含与该视频流量业务话单关联的工程参数数据中包括的天线方位角、天线下倾角、天线挂高、天线经纬度信息、发射功率等信息。同时,若该视频流量业务话单与MR关联且与话统数据关联,则该数据将包括更为丰富的信息。因此,通过多个数据源进行关联,得到用于建立视频流量模型的数据集中的数据包含多种维度的信息来描述视频流量,进而有效提高视频流量预测的准确性。
在执行完步骤210后,在执行步骤220之前,还需对用于建立视频流量预测模型的数据集进行栅格化处理。
具体的,与MR关联后的视频业务话单数据,包含经纬度和相关话务指标等信息,此时将栅格大小设为50*50米(可以根据需要设置栅格大小),将50m*50m栅格的经纬度保持一致,即栅格化后同一栅格内包含的数据对应的经纬度更新为统一的经纬度,然后将同一个栅格的流量汇聚,作为对应该栅格的视频流量,完成对用于建立视频流量预测模型的数据集进行栅格化处理。
在执行完步骤210后,在执行步骤220之前,在对用于建立视频流量预测模型的数据集进行栅格化处理之后,还需对该数据集进行数据清洗。
具体的,数据清洗一般在建立视频流量预测模型之前进行,通常包括无效数据清洗,统计分析噪声清洗和技术分析噪声清洗,以及对异常数据进行数据清洗工作,以提升建立视频流量预测模型的准确性。
例如,数据清洗主要内容可以为如下两种:
第一种为“残数据”处理,即清洗掉流量为空值数据即可。
第二种为“矛盾数据”处理,即对数据之间存在矛盾或者错误的数据进行分析处理。
数据清洗的方式包括很多种,这里不一一列举,以上仅作为数据清洗方式的举例,实际数据清洗过程中并不限于上述数据清洗方式。
针对步骤220,本发明实施例中提到的预设的特征选择算法组合为基于特征分布的特征选择算法,基于相关性系数的特征选择算法,基于随机森林重要性的特征选择算法和迭代特征估计的特征选择算法中的至少一种。
须知,以上特征选择算法仅作为举例,并不限于上述特征选择算法及其组合。
在对用于建立视频流量预测模型的数据集进行特征参数筛选时,可以采用如图6所示的特征参数提取过程。在该过程中。特征参数的提取流程为依次采用基于特征分布的特征选择算法,基于相关性系数的特征选择算法,基于随机森林重要性的特征选择算法和迭代特征估计的特征选择算法。
下面对各个特征选择算法进行简单介绍。
(1)基于特征分布的特征选择算法
基于特征分布的特征选择算法主要是用来剔除近似于常量的特征向量。如果一个特征参数对应的特征向量中某一元素值或某几个元素值在这个特征向量中出现的频次较多,那么这个特征向量就认为是常变量。常变量的判断方法是通过每个特征参数对应的特征向量作方差分析,方差值小于ε则判定为该列为常数,并将该特征向量剔除。ε值可自行设定。
(2)基于相关性系数的特征选择算法:
基于相关性系数的特征选择算法主要是去除相互间相关性强的自变量,通过计算自变量两两间的相关性系数并取绝对值,如果两个变量间的相关性系数高于设定的阈值(cutoff),例如,cutoff=0.85,就分别求取这两个变量的平均绝对相关性系数,然后去除平均绝对相关性系数更高的自变量。
(3)基于随机森林重要性的特征选择算法:
随机森林能够提供输入的每个自变量特征x对应变量y的影响的重要性系数,x的重要性系数越大表示其对y的影响力越大,相关性越强。根据重要性系数排名,选取重要性系数排在TOP10的自变量,剔除排名靠后的自变量,在满足预测精度的需求前提时,能达到降维的效果,提升算法效率。
(4)迭代特征估计的特征选择算法:
该算法采用交叉抽样与后向选择相结合的方法,交叉抽样能够避免选取的特征参数出现局部最优的问题,而后向选择是一种特征参数个数的迭代选取方法,一开始将所有的特征参数考虑进来,然后不断迭代的计算模型的好坏以及特征参数的重要性,在每次迭代之后,将不重要的特征参数去除,逐步减小特征参数个数,直到找到合适的特征参数数量。
通过使用上述四个特征选择算法,最后可以从上百个特征参数中选择出与视频流量相关的主要特征参数,包括视频用户数,分辨率,智能终端数量,用户平均速率,信号与干扰加噪声比(Signal to Interference plus Noise Ratio,SINR)平均值,参考信号接收功率(Reference Signal Receiving Power,RSRP)平均值,物理资源块(Physical ResourceBlock,PRB)利用率,带宽信息,无线资源控制(Radio Resource Control,RRC)建立成功率。
其中,视频用户数,分辨率,智能终端数量,用户平均速率是来自于视频流量业务话单数据的特征参数,SINR平均值,RSRP平均值是来自于MR的特征参数,RPB利用率,RRC建立成功率是来自于话统数据的特征参数,带宽信息是来自于工程参数数据的特征参数。
参阅图7所示,为视频流量与用户平均速率和用户数的关系图。图7中,横坐标代表用户数,左边的纵坐标代表用户平均速率,右边的图例以不同深浅颜色代表视频流量,颜色越深代表流量越大。因此,由图7可知,当用户数增长,用户平均速率增大的情况下,视频流量也增大。
针对步骤230,根据用于建立视频流量预测模型的数据集进行采用预设模型训练算法进行模型学习以及回归验证。
其中,预设模型训练算法为随机森林算法或梯度提升树算法,或支持向量算法中的任一一种。
下面以通过随机森林算法训练出视频流量预测模型为例进行说明。随机森林回归算法是一种迭代的回归树算法,该算法由多棵回归树组成,每棵树对训练数据的一个特征参数进行二叉树预测(预测值是二分类后目标值的均值),后续树的学习目标是使预测值的残差减少,所有树节点的预测值累加,残差不断减小,逐步逼近真实值,完成模型训练。采用随机抽样形成多颗回归树,即随机森林,多次回归的综合结果作为最终预测结果。
例如,将运营商A的历史视频流量数据集分成两部分,假设运营商A的历史视频流量数据为1月至3月,则选取前两个月的数据建立预测模型,调用建立好的预测模型进行模型验证,获得3月的预测值,进一步地,为了评价预测模型的优劣,根据3月的实际值与3月的预测值计算偏差,采用随机森林回归算法预测区域内栅格平均相对偏差(Mean AbsolutePercent Error,MAPE)作为模型的评价指标。其中,MAPE定义如下:
其中,Yi为实际值,为预测值,N为预测样本数。
又例如,预测三个月后与视频流量相关的特征参数值,将其输入到栅格级视频流量预测模型,输出三个月后栅格级视频流量结果,这里可以获取多维度的视频流量预测结果,包括总视频流量预测结果,区分视频分辨率的视频流量预测结果,不同视频来源的流量预测结果。例如,根据本发明实施例提供的方法获得总视频流量预测结果,参阅图8所示。
参阅图9所示,图9为采用本发明实施例提供的方法建立视频流量预测模型的具体流程图。从左向右,第一,数据预处理,包括将获取的各个数据集进行关联,得到用于建立视频流量预测模型的数据集,然后对得到的数据集进行数据栅格化处理。第二,数据清洗,包括无效数据清洗、统计分析噪声清洗和技术分析噪声清洗。第三,数据探索-特征抽取,包括特征分布特征选择,相关性特征选择,随机森林重要性特征选择,迭代特征估计特征选择。第四,模型学习与回归验证,包括采用RF随机森林、梯度提升树、支持向量机进行模型训练,并进行回归验证,算法参数调优,算法模型选择,对视频流量预测模型进行验证,若满足精度要求,则确定最终的视频流量预测模型,否则,重新进行数据清洗之后的步骤,直到获得满足精度要求的视频流量预测模型。
因此,通过如图9所示的建立视频流量预测模型的具体流程可以得到了流量预测模型库,用以满足不同精度需要,以及满足包括不同的特征参数,如图10所示,传统的视频流量预测模型从单一纬度入手,例如,基于时间序列建立视频流量预测模型,而本发明实施例提出将历史视频流量数据与多数据源进行关联,全面覆盖各种描述视频流量的指标,实现多维度地描述视频流量,并通过多维度的分析预测获得针对视频流量预测模型的流量预测模型库。
基于同一发明构思,本发明实施例中还提供了一种建立视频流量预测模型的装置。该装置可以用于执行上述图2对应的方法实施例,因此本发明实施例提供的建立视频流量预测模型的装置的实施方式可以参见该方法的实施方式,重复之处不再赘述。
参阅图11所示,一种建立视频流量预测模型的装置,包括:
获取单元1101,用于获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集,其中,所述历史视频流量数据集中的每条历史视频流量数据携带历史视频流量值以及所述历史视频流量值对应的至少一个特征参数值,每种特征数据集中的每条特征数据携带描述终端产生视频流量过程中的至少一种特征参数值;
关联单元1102,用于将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集;
筛选单元1103,用于采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数;
模型训练单元1104,用于利用所述用于建立视频流c量预测模型的数据集采用预设模型训练算法进行模型训练,获得与所述视频流量相关的至少一种特征参数与视频流量之间的映射关系。
在一种可能的实现方式中,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括测量报告MR数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联时,所述关联单元1102,具体用于:
针对每条视频流量业务话单数据,执行:
从所述MR数据集中筛选出与当前视频流量业务话单数据相关联的MR,所述MR满足以下两个条件:
所述MR中包括的隧道端点标识符TEID与所述当前视频流量业务话单数据中包括的TEID相同;
所述MR的上报时间T3满足:
T1-T<T3<T2+T;
T1为所述当前视频流量业务话单数据的开始时间,T2为所述当前视频流量业务话单数据的结束时间,T为预设的时间间隔。
在一种可能的实现方式中,所述关联单元1102,还用于:若存在至少两个MR的上报时间T3均满足T1-T<T3<T2+T,则选择T3-T1最小的MR与所述当前视频流量业务话单数据相关联。
在一种可能的实现方式中,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括话统数据数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联时,所述关联单元1102,具体用于:
针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的基站小区标识ECI,确定基站标识eNodeBID和所述eNodeBID对应的基站所在的小区的标识CELLID;
从所述话统数据数据集中筛选出与所述当前视频流量业务话单数据相关联的话统数据,所述话统数据满足以下三个条件:
所述话统数据中包括的eNodeBID与所述当前视频流量业务话单数据中包括的eNodeBID相同;
所述话统数据中包括的CELLID与所述当前视频流量业务话单数据中包括的CELLID相同;
所述话统数据的开始时间T4和所述话统数据的结束时间T5满足:
T1<T4<T5<T2;
T1为所述当前视频流量业务话单数据的开始时间,T2为所述当前视频流量业务话单数据的结束时间。
在一种可能的实现方式中,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括工程参数数据数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联时,所述关联单元1102,具体用于:
针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的ECI确定eNodeBID和CELLID;
从所述工程参数数据数据集中筛选出与所述当前视频流量业务话单数据相关联的工程参数数据,所述工程参数数据满足以下两个条件:
所述工程参数数据中包括的eNodeBID与所述当前视频流量业务话单数据中包括的eNodeBID相同;
所述工程参数数据中包括的CELLID与所述当前视频流量业务话单数据中包括的CELLID相同。
在一种可能的实现方式中,所述预设的特征选择算法组合为基于特征分布的特征选择算法,基于相关性系数的特征选择算法,基于随机森林重要性的特征选择算法和迭代特征估计的特征选择算法中的至少一种。
在一种可能的实现方式中,所述装置,还包括:
栅格化处理单元1105,用于在得到用于建立视频流量预测模型的数据集之后,在采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选之前,将所述用于建立视频流量预测模型的数据集进行栅格化处理。
在一种可能的实现方式中,所述装置,还包括:
数据清洗单元1106,用于在得到用于建立视频流量预测模型的数据集之后,在采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选之前,将所述用于建立视频流量预测模型的数据集进行数据清洗。
在一种可能的实现方式中,所述预设模型训练算法为随机森林算法或梯度提升树算法,或支持向量算法中的任一一种。
基于同一发明构思,本发明实施例中还提供了一种建立视频流量预测模型的设备。该设备可以用于执行上述图2对应的方法实施例,因此本发明实施例提供的建立视频流量预测模型的设备的实施方式可以参见该方法的实施方式,重复之处不再赘述。
参阅图12所示,一种建立视频流量预测模型的设备1200,包括:
收发器1201;
存储器1202,用于存储处理器1203执行的程序代码;和
所述处理器1203,与所述存储器1202和所述收发器1201分别相连,用于通过所述存储器1202中存储的程序代码,执行以下操作:
获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集,其中,所述历史视频流量数据集中的每条历史视频流量数据携带历史视频流量值以及所述历史视频流量值对应的至少一个特征参数值,每种特征数据集中的每条特征数据携带描述终端产生视频流量过程中的至少一种特征参数值;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集;
采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数;
利用所述用于建立视频流量预测模型的数据集采用预设模型训练算法进行模型训练,获得与所述视频流量相关的至少一种特征参数与视频流量之间的映射关系。
需要说明的是图12所示的各部分之间的连接方式仅为一种可能的示例,也可以是,收发器与存储器均与处理器连接,且收发器与存储器之间没有连接,或者,也可以是其他可能的连接方式。
综上所述,获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集,将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集,因此,通过将多个数据源与历史视频流量数据相关联,使得用于建立视频流量预测模型的数据集中的数据包含多种维度的信息来描述视频流量。采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数,因此,通过算法组合筛选得到与视频流量相关的至少一种特征参数,提高特征参数筛选的有效性以及建立视频流量预测模型的效率。利用所述用于建立视频流量预测模型的数据集采用预设模型训练算法进行模型训练,获得与所述视频流量相关的至少一种特征参数与视频流量之间的映射关系。最终得到的视频流量预测模型包含多个来自不同数据源的特征参数,能够有效提高视频流量预测的准确性,并实现多维度的视频流量预测,包括多时间尺度即短中长期预测),多空间尺度即区域级,小区级和栅格级别预测。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (18)
1.一种建立视频流量预测模型的方法,其特征在于,包括:
获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集,其中,所述历史视频流量数据集中的每条历史视频流量数据携带历史视频流量值以及所述历史视频流量值对应的至少一个特征参数值,每种特征数据集中的每条特征数据携带描述终端产生视频流量过程中的至少一种特征参数值;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集;
采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数;
利用所述用于建立视频流量预测模型的数据集采用预设模型训练算法进行模型训练,获得与所述视频流量相关的至少一种特征参数与视频流量之间的映射关系。
2.如权利要求1所述的方法,其特征在于,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括测量报告MR数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,包括:
针对每条视频流量业务话单数据,执行:
从所述MR数据集中筛选出与当前视频流量业务话单数据相关联的MR,所述MR满足以下两个条件:
所述MR中包括的隧道端点标识符TEID与所述当前视频流量业务话单数据中包括的TEID相同;
所述MR的上报时间T3满足:
T1-T<T3<T2+T;
T1为所述当前视频流量业务话单数据的开始时间,T2为所述当前视频流量业务话单数据的结束时间,T为预设的时间间隔。
3.如权利要求2所述的方法,其特征在于,若存在至少两个MR的上报时间T3均满足T1-T<T3<T2+T,则选择T3-T1最小的MR与所述当前视频流量业务话单数据相关联。
4.如权利要求1所述的方法,其特征在于,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括话统数据数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,包括:
针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的基站小区标识ECI,确定基站标识eNodeBID和所述eNodeBID对应的基站所在的小区的标识CELLID;
从所述话统数据数据集中筛选出与所述当前视频流量业务话单数据相关联的话统数据,所述话统数据满足以下三个条件:
所述话统数据中包括的eNodeBID与所述当前视频流量业务话单数据中包括的eNodeBID相同;
所述话统数据中包括的CELLID与所述当前视频流量业务话单数据中包括的CELLID相同;
所述话统数据的开始时间T4和所述话统数据的结束时间T5满足:
T1<T4<T5<T2;
T1为所述当前视频流量业务话单数据的开始时间,T2为所述当前视频流量业务话单数据的结束时间。
5.如权利要求1所述的方法,其特征在于,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括工程参数数据数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,包括:
针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的ECI确定eNodeBID和CELLID;
从所述工程参数数据数据集中筛选出与所述当前视频流量业务话单数据相关联的工程参数数据,所述工程参数数据满足以下两个条件:
所述工程参数数据中包括的eNodeBID与所述当前视频流量业务话单数据中包括的eNodeBID相同;
所述工程参数数据中包括的CELLID与所述当前视频流量业务话单数据中包括的CELLID相同。
6.如权利要求1-5任一项所述的方法,其特征在于,所述预设的特征选择算法组合为基于特征分布的特征选择算法,基于相关性系数的特征选择算法,基于随机森林重要性的特征选择算法和迭代特征估计的特征选择算法中的至少一种。
7.如权利要求1-6任一项所述的方法,其特征在于,得到用于建立视频流量预测模型的数据集之后,采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选之前,还包括:
将所述用于建立视频流量预测模型的数据集进行栅格化处理。
8.如权利要求1-7任一项所述的方法,其特征在于,得到用于建立视频流量预测模型的数据集之后,采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选之前,还包括:
将所述用于建立视频流量预测模型的数据集进行数据清洗。
9.如权利要求1-8任一项所述的方法,其特征在于,所述预设模型训练算法为随机森林算法或梯度提升树算法,或支持向量算法中的任一一种。
10.一种建立视频流量预测模型的装置,其特征在于,包括:
获取单元,用于获取在预设时长内针对预设地理区域上产生的历史视频流量数据集和至少一种特征数据集,其中,所述历史视频流量数据集中的每条历史视频流量数据携带历史视频流量值以及所述历史视频流量值对应的至少一个特征参数值,每种特征数据集中的每条特征数据携带描述终端产生视频流量过程中的至少一种特征参数值;
关联单元,用于将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联,得到用于建立视频流量预测模型的数据集;
筛选单元,用于采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选,确定与视频流量相关的至少一种特征参数;
模型训练单元,用于利用所述用于建立视频流量预测模型的数据集采用预设模型训练算法进行模型训练,获得与所述视频流量相关的至少一种特征参数与视频流量之间的映射关系。
11.如权利要求10所述的装置,其特征在于,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括测量报告MR数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联时,所述关联单元,具体用于:
针对每条视频流量业务话单数据,执行:
从所述MR数据集中筛选出与当前视频流量业务话单数据相关联的MR,所述MR满足以下两个条件:
所述MR中包括的隧道端点标识符TEID与所述当前视频流量业务话单数据中包括的TEID相同;
所述MR的上报时间T3满足:
T1-T<T3<T2+T;
T1为所述当前视频流量业务话单数据的开始时间,T2为所述当前视频流量业务话单数据的结束时间,T为预设的时间间隔。
12.如权利要求11所述的装置,其特征在于,所述关联单元,还用于:若存在至少两个MR的上报时间T3均满足T1-T<T3<T2+T,则选择T3-T1最小的MR与所述当前视频流量业务话单数据相关联。
13.如权利要求10所述的装置,其特征在于,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括话统数据数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联时,所述关联单元,具体用于:
针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的基站小区标识ECI,确定基站标识eNodeBID和所述eNodeBID对应的基站所在的小区的标识CELLID;
从所述话统数据数据集中筛选出与所述当前视频流量业务话单数据相关联的话统数据,所述话统数据满足以下三个条件:
所述话统数据中包括的eNodeBID与所述当前视频流量业务话单数据中包括的eNodeBID相同;
所述话统数据中包括的CELLID与所述当前视频流量业务话单数据中包括的CELLID相同;
所述话统数据的开始时间T4和所述话统数据的结束时间T5满足:
T1<T4<T5<T2;
T1为所述当前视频流量业务话单数据的开始时间,T2为所述当前视频流量业务话单数据的结束时间。
14.如权利要求10所述的装置,其特征在于,所述历史视频流量数据集包括视频流量业务话单数据,所述至少一种特征数据集包括工程参数数据数据集;
将获取得到的所述历史视频流量数据集中包括的每条历史视频流量数据分别与每种特征数据集中的特征数据进行关联时,所述关联单元,具体用于:
针对每条视频流量业务话单数据,执行:
根据当前视频流量业务话单数据中包括的ECI确定eNodeBID和CELLID;
从所述工程参数数据数据集中筛选出与所述当前视频流量业务话单数据相关联的工程参数数据,所述工程参数数据满足以下两个条件:
所述工程参数数据中包括的eNodeBID与所述当前视频流量业务话单数据中包括的eNodeBID相同;
所述工程参数数据中包括的CELLID与所述当前视频流量业务话单数据中包括的CELLID相同。
15.如权利要求10-14任一项所述的装置,其特征在于,所述预设的特征选择算法组合为基于特征分布的特征选择算法,基于相关性系数的特征选择算法,基于随机森林重要性的特征选择算法和迭代特征估计的特征选择算法中的至少一种。
16.如权利要求10-15任一项所述的装置,其特征在于,所述装置,还包括:
栅格化处理单元,用于在得到用于建立视频流量预测模型的数据集之后,在采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选之前,将所述用于建立视频流量预测模型的数据集进行栅格化处理。
17.如权利要求10-16任一项所述的装置,其特征在于,所述装置,还包括:
数据清洗单元,用于在得到用于建立视频流量预测模型的数据集之后,在采用预设的特征选择算法组合对所述用于建立视频流量预测模型的数据集进行特征参数筛选之前,将所述用于建立视频流量预测模型的数据集进行数据清洗。
18.如权利要求10-17任一项所述的装置,其特征在于,所述预设模型训练算法为随机森林算法或梯度提升树算法,或支持向量算法中的任一一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610465136.9A CN107547154B (zh) | 2016-06-23 | 2016-06-23 | 一种建立视频流量预测模型的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610465136.9A CN107547154B (zh) | 2016-06-23 | 2016-06-23 | 一种建立视频流量预测模型的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107547154A true CN107547154A (zh) | 2018-01-05 |
CN107547154B CN107547154B (zh) | 2020-06-09 |
Family
ID=60960231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610465136.9A Active CN107547154B (zh) | 2016-06-23 | 2016-06-23 | 一种建立视频流量预测模型的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107547154B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564116A (zh) * | 2018-04-02 | 2018-09-21 | 深圳市安软慧视科技有限公司 | 一种摄像头场景图像的成分智能分析方法 |
CN108898415A (zh) * | 2018-05-29 | 2018-11-27 | 北京奇艺世纪科技有限公司 | 一种视频剧集的流量相关指标预测方法及装置 |
CN108900856A (zh) * | 2018-07-26 | 2018-11-27 | 腾讯科技(深圳)有限公司 | 一种视频帧率预测方法、装置及设备 |
CN109451352A (zh) * | 2018-12-11 | 2019-03-08 | 北京奇艺世纪科技有限公司 | 一种视频播放流量预测方法及装置 |
CN109587515A (zh) * | 2018-12-11 | 2019-04-05 | 北京奇艺世纪科技有限公司 | 一种视频播放流量预测方法及装置 |
CN109862392A (zh) * | 2019-03-20 | 2019-06-07 | 济南大学 | 互联网游戏视频流量的识别方法、系统、设备及介质 |
CN110380904A (zh) * | 2019-07-23 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 带宽分配方法、装置、电子设备及存储介质 |
CN111062527A (zh) * | 2019-12-10 | 2020-04-24 | 北京爱奇艺科技有限公司 | 一种视频集流量预测方法及装置 |
WO2020140419A1 (zh) * | 2019-01-04 | 2020-07-09 | 烽火通信科技股份有限公司 | 网络流量增量统计、分析方法及系统 |
CN112105048A (zh) * | 2020-07-27 | 2020-12-18 | 北京邮电大学 | 基于双周期Holt-Winters模型和SARIMA模型的组合预测方法 |
CN112398670A (zh) * | 2019-08-15 | 2021-02-23 | 中国移动通信集团浙江有限公司 | 流量预测方法、装置、计算设备及计算机存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN202394387U (zh) * | 2011-12-23 | 2012-08-22 | 北京易华录信息技术股份有限公司 | 一种融合多种交通数据的交通状况预测系统 |
US8418249B1 (en) * | 2011-11-10 | 2013-04-09 | Narus, Inc. | Class discovery for automated discovery, attribution, analysis, and risk assessment of security threats |
CN105376089A (zh) * | 2015-10-23 | 2016-03-02 | 上海华为技术有限公司 | 一种网络规划方法及装置 |
CN105634787A (zh) * | 2014-11-26 | 2016-06-01 | 华为技术有限公司 | 网络关键指标的评估方法、预测方法及装置和系统 |
-
2016
- 2016-06-23 CN CN201610465136.9A patent/CN107547154B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8418249B1 (en) * | 2011-11-10 | 2013-04-09 | Narus, Inc. | Class discovery for automated discovery, attribution, analysis, and risk assessment of security threats |
CN202394387U (zh) * | 2011-12-23 | 2012-08-22 | 北京易华录信息技术股份有限公司 | 一种融合多种交通数据的交通状况预测系统 |
CN105634787A (zh) * | 2014-11-26 | 2016-06-01 | 华为技术有限公司 | 网络关键指标的评估方法、预测方法及装置和系统 |
CN105376089A (zh) * | 2015-10-23 | 2016-03-02 | 上海华为技术有限公司 | 一种网络规划方法及装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564116A (zh) * | 2018-04-02 | 2018-09-21 | 深圳市安软慧视科技有限公司 | 一种摄像头场景图像的成分智能分析方法 |
CN108898415A (zh) * | 2018-05-29 | 2018-11-27 | 北京奇艺世纪科技有限公司 | 一种视频剧集的流量相关指标预测方法及装置 |
CN108900856A (zh) * | 2018-07-26 | 2018-11-27 | 腾讯科技(深圳)有限公司 | 一种视频帧率预测方法、装置及设备 |
CN108900856B (zh) * | 2018-07-26 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 一种视频帧率预测方法、装置及设备 |
CN109587515A (zh) * | 2018-12-11 | 2019-04-05 | 北京奇艺世纪科技有限公司 | 一种视频播放流量预测方法及装置 |
CN109451352A (zh) * | 2018-12-11 | 2019-03-08 | 北京奇艺世纪科技有限公司 | 一种视频播放流量预测方法及装置 |
CN109587515B (zh) * | 2018-12-11 | 2021-10-12 | 北京奇艺世纪科技有限公司 | 一种视频播放流量预测方法及装置 |
WO2020140419A1 (zh) * | 2019-01-04 | 2020-07-09 | 烽火通信科技股份有限公司 | 网络流量增量统计、分析方法及系统 |
CN109862392A (zh) * | 2019-03-20 | 2019-06-07 | 济南大学 | 互联网游戏视频流量的识别方法、系统、设备及介质 |
CN109862392B (zh) * | 2019-03-20 | 2021-04-13 | 济南大学 | 互联网游戏视频流量的识别方法、系统、设备及介质 |
CN110380904A (zh) * | 2019-07-23 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 带宽分配方法、装置、电子设备及存储介质 |
CN110380904B (zh) * | 2019-07-23 | 2021-09-21 | 腾讯科技(深圳)有限公司 | 带宽分配方法、装置、电子设备及存储介质 |
CN112398670A (zh) * | 2019-08-15 | 2021-02-23 | 中国移动通信集团浙江有限公司 | 流量预测方法、装置、计算设备及计算机存储介质 |
CN111062527A (zh) * | 2019-12-10 | 2020-04-24 | 北京爱奇艺科技有限公司 | 一种视频集流量预测方法及装置 |
CN111062527B (zh) * | 2019-12-10 | 2023-12-05 | 北京爱奇艺科技有限公司 | 一种视频集流量预测方法及装置 |
CN112105048A (zh) * | 2020-07-27 | 2020-12-18 | 北京邮电大学 | 基于双周期Holt-Winters模型和SARIMA模型的组合预测方法 |
CN112105048B (zh) * | 2020-07-27 | 2021-10-12 | 北京邮电大学 | 基于双周期Holt-Winters模型和SARIMA模型的组合预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107547154B (zh) | 2020-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107547154A (zh) | 一种建立视频流量预测模型的方法及装置 | |
CN105898762B (zh) | 基站优化及部署方法和装置 | |
CN111867049B (zh) | 定位方法、装置及存储介质 | |
CN109548041A (zh) | 一种无线覆盖分析方法及系统 | |
CN107423742A (zh) | 人群流量的确定方法及装置 | |
CN111294819B (zh) | 一种网络优化方法及装置 | |
Sotiroudis et al. | Neural networks and random forests: A comparison regarding prediction of propagation path loss for NB-IoT networks | |
KR102655903B1 (ko) | 기지국의 에너지를 절약하기 위한 처리 방법 및 처리 장치 | |
EP4084365A1 (en) | Channel identification method and apparatus, transmission method, transmission device, base station, and medium | |
CN106934514A (zh) | 一种回归模型的生成方法以及装置 | |
CN112950243A (zh) | 一种5g站址规划方法、装置、电子设备及存储介质 | |
CN108989092A (zh) | 一种无线网络预测方法、电子设备及存储介质 | |
CN110366188B (zh) | 干扰测量点部署方法、干扰测量路径规划方法及系统 | |
CN109996253A (zh) | 一种小区信号覆盖范围合理性的评估方法及装置 | |
CN110650483B (zh) | 一种设备选型方法和装置 | |
CN114786199A (zh) | 一种网络问题点的确定方法、装置、设备及存储介质 | |
CN114615693A (zh) | 网络容量预测方法、装置、电子设备及计算机存储介质 | |
CN106604392A (zh) | 一种基于双向信号强度数据的wifi定位方法及服务器 | |
CN110730461B (zh) | 一种设备选型方法和装置 | |
CN107484182A (zh) | 划分超级小区的方法及装置 | |
CN110753352B (zh) | 一种设备选型方法和装置 | |
CN110719595B (zh) | 一种设备选型方法和装置 | |
CN105992263A (zh) | 基站站址偏移预评估方法及系统 | |
CN110677206B (zh) | 一种设备选型方法和装置 | |
CN110708703B (zh) | 一种设备选型方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |