CN111343650A - 一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法 - Google Patents

一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法 Download PDF

Info

Publication number
CN111343650A
CN111343650A CN202010093523.0A CN202010093523A CN111343650A CN 111343650 A CN111343650 A CN 111343650A CN 202010093523 A CN202010093523 A CN 202010093523A CN 111343650 A CN111343650 A CN 111343650A
Authority
CN
China
Prior art keywords
data
network
wireless service
cross
traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010093523.0A
Other languages
English (en)
Other versions
CN111343650B (zh
Inventor
张海霞
张传亭
袁东风
郭帅帅
周晓天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202010093523.0A priority Critical patent/CN111343650B/zh
Publication of CN111343650A publication Critical patent/CN111343650A/zh
Application granted granted Critical
Publication of CN111343650B publication Critical patent/CN111343650B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,用于提升无线业务流量预测的整体性能,步骤包括:(1)得到无线业务流量数据D;(2)获取城市尺度的跨域数据C;(3)获取时间特征mt;(4)得到训练集Strain和测试集Stest;(5)构建生成器网络G,输出预测数据;(6)构建鉴别器网络D;(7)对生成器网络G和鉴别器网络D进行联合训练,直至循环结束。本发明能够有效地捕捉无线业务流量在时空维度上的依赖性和跨域数据对流量产生的空间约束性;并在生成器网络中采用对抗损失函数,大幅提升了无线业务流量预测的总体性能。

Description

一种基于跨域数据和对抗损失的城市尺度无线业务流量预测 方法
技术领域
本发明涉及一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,属于通信网络和人工智能技术领域。
背景技术
无线通信系统正在朝着智能化的方向发展,基于机器学习的智能无线业务流量预测是通信系统迈向智能化的重要组成部分。无线业务流量预测有助于通信网络实现自组织管理、自优化配置,并能大幅提升管理效率和网络能效。但是,由于终端用户其移动行为和通信行为的复杂性、时变性和突发性,精准的无线业务流量预测存在诸多挑战,特别是对城市尺度无线业务流量的协同预测。这是因为不同小区的流量在空间维度上同时存在相似性和差异性,在时间维度上又存在自相关性。此外,训练单个模型执行多目标预测时,模型的预测值趋于样本空间的统计平均,对低流量小区存在预测不准确现象。
无线业务流量预测从本质上可以建模为时间序列预测问题,现有的预测方案主要分为两大类:基于传统统计学习的算法和基于机器学习的预测算法。对于前者,预测方法主要是自回归模型、移动平均模型、差分整合移动平均自回归模型;对于后者,主要有支持向量回归、随机森林以及神经网络模型。
随着数据量和计算能力的不断增加,基于深度学习的无线业务流量预测取得了比较优越的预测性能。中国专利文献CN109257760B公开了一种无线网络中的用户流量预测方法,通过特征提取对用户流量进行分析,根据用户在区域中使用流量情况,基于循环神经网络模型预测下一时段流量。专利文献CN108900346A公开了一种基于LSTM网络的无线网络流量预测方法。通过构造LSTM复合网络,获取相关数据,然后初始化网络参数并进行参数训练。该方法可以有效利用LSTM的长期记忆特性,根据当前状态自动调整历史信息对当前预测的贡献。但是,以上基于深度学习的预测方案主要关注无线业务流量数据本身,在算法上采用多层感知机或LSTM网络或卷积网络,以lp损失(p∈{1,2})为目标函数,采用随机梯度下降进行优化求解。这类无线业务流量预测方法只关注历史数据本身,忽略了对无线业务流量产生有巨大影响的跨域数据,比如:小区内的基站数量、商场数量。此外,以lp损失作为目标函数有一个隐含的、对数据分布性质的假设,那就是数据高斯分布。但是由于终端用户复杂的移动行为和通信行为以及城市功能区差异性,无线业务流量的分布并不严格满足高斯分布,而是呈现一种多模态的分布特性。在这种分布特性下,以lp损失为优化目标进行学习并以得到的模型进行预测时,预测结果趋于样本空间的均值或者中值,这就导致多小区(城市尺度)的无线业务流量预测不准确。
发明内容
针对现有技术的不足,本发明提供了一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,本发明通过对无线业务流量历史数据、跨域数据和提取的时间特征进行充分学习和高效融合,能够有效地捕捉无线业务流量在时空维度上的依赖性和跨域数据对流量产生的空间约束性;并在生成器网络中采用对抗损失函数来避免预测趋于均值,大幅提升了无线业务流量预测的总体性能。
术语解释:
1、滑动窗口方法:滑动窗口方法是用来将时间序列数据处理成监督学习样本的通用方法。给定一个时间序列,选定一个窗口大小s,则将前s个数据点作为输入,下一个数据点作为输出,并通过向右滑动,不断构造训练和测试样本。
2、梯度下降算法:梯度下降算法是训练机器学习模型常用的优化算法。目标函数关于参数的梯度是损失函数上升最快的方向。由于训练机器学习模型是最小化损失函数,所以需要将参数沿着梯度相反的方向前进一个步长,就可以实现损失函数的下降。对训练数据集进行多次梯度下降,就可以学习到参数的局部最优解。
3、最大最小归一化准则:将原始数据线性化的方法转换到[01]的范围,归一化公式如下:
Figure BDA0002384505640000021
其中,xmax为样本数据的最大值,xmin为样本数据的最小值。
本发明的技术方案为:
一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,用于提升无线业务流量预测的整体性能,具体步骤如下:
(1)将原始无线业务流量日志数据按照时间粒度和空间粒度处理成数据矩阵,得到无线业务流量数据
Figure BDA0002384505640000031
其中,
Figure BDA0002384505640000032
表示在第t个时间段所有小区的无线业务流量值,
Figure BDA0002384505640000033
表示实数,W表示矩阵的列数,H表示矩阵的行数,T表示总的时间段数量;
把城市区域分成不同的方格,把每个方格当成一个小区,获取到小区中心点的坐标(h,w),(h,w)表示的是位于第h行、第w列的小区坐标;dh,w表示第h行第w列小区的无线业务流量,且h∈{1,2,…,H},w∈{1,2,…,W};
(2)获取城市尺度的跨域数据,
Figure BDA0002384505640000034
表示跨域数据,c为跨域数据的种类;
(3)获取时间特征mt
Figure BDA0002384505640000035
mt表示第t个时间段对应的时间特征,
Figure BDA0002384505640000036
表示星期几,
Figure BDA0002384505640000037
表示小时,
Figure BDA0002384505640000038
表示是否为工作日,
Figure BDA0002384505640000039
表示是否为周末;提取出星期、小时、是否工作日以及是否周末四个特征;
(4)利用滑动窗口方法得到训练集
Figure BDA00023845056400000310
和测试集
Figure BDA00023845056400000311
Figure BDA00023845056400000312
令Xt=(Dt-s,Dt-s+1,…,Dt-1,mt,C),其中,Dt-s表示在第t-s个时间段所有小区的无线业务流量值,Dt-s+1表示在第t-s+1个时间段所有小区的无线业务流量值,Dt-1表示在第t-1个时间段所有小区的无线业务流量值;Yt=Dt,则St=(Xt,Yt)=((Dt-s,Dt-s+1…,Dt-1,mt,C),Dt);
同理可得,
Figure BDA00023845056400000313
令X′t=(Dt-s,Dt-s+1,…,Dt-1,mt,C),Y′t=Dt,S′t=(X′t,Y′t)=((Dt-s,Dt-s+1,…,Dt-1,mt,C),Dt);
(5)根据无线业务流量数据Dt,跨域数据C以及时间特征mt,构建生成器网络G,生成器网络输出无线业务流量预测值;Dt用来捕捉无线业务流量的时空相关性,C用来捕捉跨域数据对无线业务流量的空间约束性,mt用来捕捉显式时间特征;
(6)以生成器网络G输出无线业务流量预测值G(Xt)和从真实样本中采样的数据Yt为输入,构建鉴别器网络D;构建鉴别器网络D最大化区分输入样本的真假概率;
鉴别器网络的好处是对生成器网络的预测值进行再一次判断,判断预测值有多大概率来自于真实样本的分布,即预测值有多大概率是正确的。区分输入样本的真假概率的目的是为了提升生成器网络的预测能力。
(7)对步骤(5)中的生成器网络G和步骤(6)中的鉴别器网络D进行联合训练,设定循环次数,当达到设定的循环次数后,循环结束,联合训练结束。
根据本发明优选的,所述步骤(5)中,根据无线业务流量数据Dt,跨域数据C以及时间特征mt,构建生成器网络G,输出无线业务流量预测值的具体步骤包括:
A、构建卷积长短记忆网络fConvLSTM,对无线业务流量Dt进行特征学习,目的是为了同时刻画无线业务流量的时空依赖性以及序列性,特征学习的过程如式(I)所示:
Figure BDA0002384505640000041
式(I)中,Ftraffic表示对无线业务流量Dt经过学习后得到的特征值,
Figure BDA0002384505640000042
表示第一层卷积长短记忆网络,
Figure BDA0002384505640000043
表示第二层卷积长短记忆网络;
B、采用卷积网络fConv对跨域数据C进行特征学习,特征学习的过程如式(II)所示:
Figure BDA0002384505640000044
式(II)中,Fcross表示对C经过学习后得到的特征值,
Figure BDA0002384505640000045
表示第一层卷积网络,
Figure BDA0002384505640000046
表示第二层卷积网络;
C、采用全连接网络fLinear对显式时间特征mt进行特征学习,显示时间特征即给定日期时间,能够直接得到的时间特征;目的是为了克服显式时间特征mt的维度与无线业务流量的维度不同;然后将输出维度设置为与Xt相同,特征学习的过程如式(III)所示:
Figure BDA0002384505640000047
式(III)中,Fmeta表示对mt学习之后得到的特征值,
Figure BDA0002384505640000048
表示第一层全连接网络,
Figure BDA0002384505640000049
表示第二层全连接网络;
D、对无线业务流量数据Dt,跨域数据C以及时间特征mt三种特征进行融合,形成初步特征输入
Figure BDA00023845056400000410
其中,
Figure BDA00023845056400000411
表示拼接操作;
设计密集连接卷积网络对F进行进一步非线性学习,在密集连接卷积网络第l层学到的特征Fl,如式(IV)所示:
Figure BDA00023845056400000412
式(IV)中,F1表示在密集连接卷积网络的第1层学到的特征,F2表示在密集连接卷积网络的第2层学到的特征,Fl-1表示在密集连接卷积网络的第l-1层学到的特征;
E、对学到的最终特征FL进行非线性激活,得到生成器网络的输出无线业务流量预测值G(Xt);L表示密集连接卷积网络的总的网络层数,FL表示在密集连接卷积网络的最后一层学到的特征;
F、生成器网络的目标函数
Figure BDA0002384505640000051
如式(V)所示,
Figure BDA0002384505640000052
式(V)中,λ表示调节预测准确性与相似性的参数,
Figure BDA0002384505640000053
表示预测的无线业务流量值,
Figure BDA0002384505640000054
表示在给定输入Xt,真实业务流量值Yt的条件下的对抗损失函数,||·||F表示F范数,
Figure BDA0002384505640000055
表示鉴别器网络将生成器的预测的无线业务流量值
Figure BDA0002384505640000056
判断为真的概率。
在生成器网络中引入对抗损失的好处在于,能够对生成器网络的预测值进行约束,使其与真实样本数据分布一致,在保证预测准确性的前提下,提升预测值与真实值的空间相似性。
根据本发明优选的,所述步骤(6)中,以生成器网络G输出无线业务流量预测值G(Xt)和从真实样本中采样的数据Yt为输入,构建鉴别器网络D,具体步骤包括:
A、将(Xt;Yt)的标签设置为1,将(Xt;G(Xt))的标签设置为0,样本At满足:At∈{(Xt,Yt),(Xt,G(Xt)};
B、将样本At输入到鉴别器网络D进行特征学习,具体过程如式(VI)所示:
Figure BDA0002384505640000057
式(VI)中,o表示对输入数据At进行两层卷积网络学习以及两层全连接网络学习后的特征值;
C、对鉴别器网络D的输出进行非线性映射,得到鉴别器网络D的输出值为D(Xt,Yt)和D(Xt;G(Xt));鉴别器网络的目标函数
Figure BDA0002384505640000058
如式(VII)所示:
Figure BDA0002384505640000059
式(VII)中,lbce(·)表示二元交叉熵损失,
Figure BDA00023845056400000510
表示给定输入Xt,真实业务流量值Yt的条件下的对抗损失函数。
通过鉴别器的对抗损失函数能够最大化区分输入样本是来自于真实样本,还是生成器网络的输出。优化该损失,能够间接地提升生成器网络的预测性能。
根据本发明优选的,步骤(2)中,所述跨域数据的种类包括小区内的兴趣点数据、社交活动水平数据、以及基站数量;获取城市尺度的跨域数据C的具体步骤为:
A、通过地图开放平台,获取小区周围的兴趣点数据;兴趣点数据包括商场数量、公交站点数量、酒店数量;
B、根据得到的兴趣点数据,将每个小区坐标(h;w)内的不同兴趣点数据做累加和;
C、通过开源项目的应用接口获取到每个小区内的基站数量以及社交活动水平数据,最终得到城市尺度的跨域数据C。
根据本发明优选的,步骤(4)中,利用滑动窗口方法得到训练集
Figure BDA0002384505640000061
和测试集
Figure BDA0002384505640000062
的具体步骤为:
A、对于无线业务流量数据D,选择前pT的时间段的数据作为训练数据,剩余(1-p)T的时间段的数据为测试数据;
B、对于训练数据和测试数据,选取窗口大小s;然后根据滑动窗口方法进行样本构建,即如果Dt为预测目标,则[Dt-s;Dt-s+1…;Dt-1]为特征输入;
C、在训练数据中,得到小区流量的最大值dmax和最小值dmin,然后根据最大最小归一化准则,对训练数据和测试数据进行归一化处理,得到训练集
Figure BDA0002384505640000063
和测试集
Figure BDA0002384505640000064
Figure BDA0002384505640000065
令Xt=(Dt-s,Dt-s+1,…,Dt-1,mt,C),其中,Dt-s表示在第t-s个时间段所有小区的无线业务流量值,Dt-s+1表示在第t-s+1个时间段所有小区的无线业务流量值,Dt-1表示在第t-1个时间段所有小区的无线业务流量值;Yt=Dt,则St=(Xt,Yt)=((Dt-s;Dt-s+1…;Dt-1;mt;C);Dt);
同理可得,Stest={S′t;t=1;2;…;n′},令X′t=(Dt-s;Dt-s+1;…;Dt-1;mt;C),Y′t=DtS′t=(X′t;Y′t)=((Dt-s;Dt-s+1;…;Dt-1;mt;C);Dt)。
根据本发明优选的,步骤(1)中,所述时间粒度以分钟或小时为单位,所述空间粒度以平方米为单位。
本发明的有益效果为:
1.本发明通过对无线业务流量历史数据、跨域数据和提取的时间特征进行充分学习和高效融合,能够有效地捕捉无线业务流量在时空维度上的依赖性和跨域数据对流量产生的空间约束性。
2.本发明通过合理的设计生成器网络,充分考虑了无线业务流量在时间维度的自相似性、空间维度的模式相关性,以及与跨域数据的依赖关系,并设计了高效融合及特征学习策略,并在生成器网络中采用对抗损失函数来避免预测趋于均值,大幅提升了无线业务流量预测的总体性能。
3.发明中设计的鉴别器网络是一个高效的分类器网络,能够有效判断生成器的预测是否符合真实样本分布。
4.通过生成器网络和鉴别器网络的联合学习,本发明所提出的无线业务流量预测方法能够有效地融合除无线业务流量之外的其它跨域信息,提高了预测准确性和业务流量在空间上的相似性。
附图说明
图1是本发明中基于跨域数据和对抗损失的城市尺度无线业务流量预测示意图;
图2是本发明的算法流程框图;
图3是本发明中采用的密集连接卷积网络示意图;
图4是实施例1提供的预测值与真实值及现有技术的预测值之间的对比结果示意图。
具体实施方式
下面结合实施例和说明书附图对本发明做进一步说明,但不限于此。
实施例1
如图1所示,一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,其具体算法执行如图2所示,具体步骤包括:
(1)将原始无线业务流量日志数据按照时间粒度和空间粒度处理成数据矩阵,得到无线业务流量数据
Figure BDA0002384505640000071
其中,
Figure BDA0002384505640000072
表示在第t个时间段所有小区的无线业务流量值,R表示实数,W表示矩阵的列数,H表示矩阵的行数,T表示总的时间段数量;
把城市区域分成不同的方格,把每个方格当成一个小区,获取到小区中心点的坐标(h,w),(h,w)表示的是位于第h行、第w列的小区坐标;dh,w表示第h行第w列小区的无线业务流量,且h∈{1,2,…,H},w∈{1,2,…,W};
步骤(1)中,所述时间粒度以分钟或小时为单位,所述空间粒度以平方米为单位。本实施例中,W=100,H=100,T=1448。
(2)获取城市尺度的跨域数据,
Figure BDA0002384505640000073
表示跨域数据,c为跨域数据的种类;
步骤(2)中,所述跨域数据的种类包括小区内的兴趣点数据、社交活动水平数据、以及基站数量;获取城市尺度的跨域数据C的具体步骤为:
A、通过地图开放平台,如百度地图API、谷歌地图API,获取小区周围的兴趣点数据,兴趣点数据包括商场数量、公交站点数量、酒店数量;
B、根据得到的兴趣点数据,将每个小区坐标(h,w)内的不同兴趣点数据做累加;
C、通过开源项目的应用接口获取到每个小区内的基站数量以及社交活动水平数据,最终得到城市尺度的跨域数据C。开源项目如OpenCellId和Dandelion,开源项目对于任何人来说都可以获取。
(3)获取时间特征mt
Figure BDA0002384505640000081
mt表示第t个时间段对应的时间特征,
Figure BDA0002384505640000082
表示星期几,例如,当为星期一时,
Figure BDA0002384505640000083
表示小时,例如,当为13:00时,
Figure BDA0002384505640000084
Figure BDA0002384505640000085
表示是否为工作日,当工作日时,
Figure BDA0002384505640000086
非工作日,
Figure BDA0002384505640000087
表示是否为周末,当工作日时,
Figure BDA0002384505640000088
非工作日时,
Figure BDA0002384505640000089
提取出星期、小时、是否工作日以及是否周末四个特征;
(4)利用滑动窗口方法得到训练集
Figure BDA00023845056400000810
和测试集
Figure BDA00023845056400000811
具体步骤为:
A、对于无线业务流量数据
Figure BDA00023845056400000812
选择前pT的时间段的数据作为训练数据,剩余(1-p)T的时间段的数据为测试数据;p选择20%,30%,或者50%。本实施例中,对于无线业务流量,选择前1320个时间段作为训练数据,剩余168的时间段为测试数据。
B、对于训练数据和测试数据,选取窗口大小s;本实施例中,s=3。然后根据滑动窗口方法进行样本构建,即如果Dt为预测目标,则[Dt-s,Dt-s+1…,Dt-1]为特征输入;
C、在训练数据中,得到小区流量的最大值dmax和最小值dmin,然后根据最大最小归一化准则,对训练数据和测试数据进行归一化处理,得到训练集
Figure BDA00023845056400000813
和测试集
Figure BDA00023845056400000814
Figure BDA00023845056400000815
令Xt=(Dt-s,Dt-s+1,…,Dt-1,mt,C),其中,Dt-s表示在第t-s个时间段所有小区的无线业务流量值,Dt-s+1表示在第t-s+1个时间段所有小区的无线业务流量值,Dt-1表示在第t-1个时间段所有小区的无线业务流量值;Yt=Dt,则St=(Xt,Yt)=((Dt-s,Dt-s+1…,Dt-1,mt,C),Dt);
同理可得,Stest={S′t,t=1,2,…,n′},令X′t=(Dt-s,Dt-s+1,…,Dt-1,mt,C),Y′t=DtS…t=(X′t,Y′t)=((Dt-s,Dt-s+1,…,Dt-1,mt,C),Dt)。
(5)根据无线业务流量数据Dt,跨域数据C以及时间特征mt,构建生成器网络G,生成器网络输出无线业务流量预测值;Dt用来捕捉无线业务流量的时空相关性,C用来捕捉跨域数据对无线业务流量的空间约束性,mt用来捕捉显式时间特征;
所述步骤(5)中,根据无线业务流量数据Dt,跨域数据C以及时间特征mt,构建生成器网络G,输出无线业务流量预测值的具体步骤包括:
A、构建卷积长短记忆网络fConvLSTM,对Dt进行特征学习,目的是为了同时刻画无线业务流量的时空依赖性以及序列性,特征学习的过程如式(I)所示:
Figure BDA0002384505640000091
式(I)中,Ftraffic表示对无线业务流量Dt经过学习后得到的特征值,
Figure BDA0002384505640000092
表示第一层卷积长短记忆网络,
Figure BDA0002384505640000093
表示第二层卷积长短记忆网络;
B、采用卷积网络fConv对跨域数据C进行特征学习,特征学习的过程如式(II)所示:
Figure BDA0002384505640000094
式(II)中,Fcross表示对C经过学习后得到的特征值,
Figure BDA0002384505640000095
表示第一层卷积网络,
Figure BDA0002384505640000096
表示第二层卷积网络;
C、采用全连接网络fLinear对显式时间特征mt进行特征学习,显示时间特征即给定日期时间,能够直接得到的时间特征;目的是为了克服显式时间特征mt的维度与无线业务流量的维度不同;然后将输出维度设置为与Xt相同,特征学习的过程如式(III)所示:
Figure BDA0002384505640000097
式(III)中,Fmeta表示对mt学习之后得到的特征,
Figure BDA0002384505640000098
表示第一层全连接网络,
Figure BDA0002384505640000099
表示第二层全连接网络;
D、对无线业务流量数据Dt,跨域数据C以及时间特征mt三种特征进行融合,形成初步特征输入
Figure BDA00023845056400000910
其中,
Figure BDA00023845056400000911
表示拼接操作;
设计密集连接卷积网络对F进行进一步非线性学习,密集连接卷积网络如图3所示,在密集连接卷积网络第l层学到的特征Fl,如式(IV)所示:
Figure BDA00023845056400000912
式(IV)中,F1表示在密集连接卷积网络的第1层学到的特征,F2表示在密集连接卷积网络的第2层学到的特征,Fl-1表示在密集连接卷积网络的第l-1层学到的特征;
E、对学到的最终特征FL进行非线性激活,得到生成器网络的输出G(Xt);L表示网络层数,FL表示在最后一层学到的特征;
F、生成器网络的目标函数
Figure BDA0002384505640000101
如式(V)所示,
Figure BDA0002384505640000102
具体推导过程如下所示:
Figure BDA0002384505640000103
式(V)中,λ表示调节预测准确性与相似性的参数,
Figure BDA0002384505640000104
表示给定输入Xt,真实值Yt的条件下,生成器网络的Lp损失函数;
Figure BDA0002384505640000105
表示给定输入Xt,真实值Yt的条件下,生成器网络的对抗损失函数;l2(·)表示L2损失,lbce(·)表示二元交叉熵损失,||·||F表示F范数,D(Xt;G(Xt))表示鉴别器网络D将生成器的预测判断为真的概率。
在生成器网络中引入对抗损失的好处在于,能够对生成器网络的预测值进行约束,使其与真实样本数据分布一致,在保证预测准确性的前提下,提升预测值与真实值的空间相似性。
(6)以生成器网络G输出无线业务流量预测值G(Xt)和从真实样本中采样的数据Yt为输入,构建鉴别器网络D;构建鉴别器网络D最大化区分输入样本的真假概率;
鉴别器网络的好处是对生成器网络的预测值进行再一次判断,判断预测值有多大概率来自于真实样本的分布,即预测值有多大概率是正确的。区分输入样本的真假概率的目的是为了提升生成器网络的预测能力。当输入样本来自于真实样本,则最大化输出为真;如果样本来自于生成器网络,则最大化输出为假。当样本为真的时候,鉴别器最大化输出为真(1);当样本为假,即样本来自生成器网络的时候,鉴别器最大化输出为假(0)。
所述步骤(6)中,以生成器网络G输出无线业务流量预测值G(Xt)和从真实样本中采样的数据Yt为输入,构建鉴别器网络D,具体步骤包括:
A、将(Xt;Yt)的标签设置为1,将(Xt;G(Xt))的标签设置为0,样本At满足:At∈{(Xt;Yt);(Xt;G(Xt)};
B、将样本At输入到鉴别器网络D进行特征学习,具体过程如式(VI)所示:
Figure BDA0002384505640000106
式(VI)中,o表示对输入数据At进行两层卷积网络学习以及两层全连接网络学习后的特征值;
C、对鉴别器网络D的输出进行非线性映射,得到鉴别器网络D的输出值为D(Xt,Yt)和D(Xt,G(Xt));鉴别器网络的目标函数
Figure BDA0002384505640000114
如式(VII)所示:
Figure BDA0002384505640000111
式(VII)中,lbce(·)表示二元交叉熵损失,
Figure BDA0002384505640000112
表示给定输入Xt,真实业务流量值Yt的条件下的对抗损失函数。
通过鉴别器的对抗损失函数能够最大化区分输入样本是来自于真实样本,还是生成器网络的输出。优化该损失,能够间接地提升生成器网络的预测性能。
(7)采用梯度下降算法,对步骤(5)中的生成器网络G和步骤(6)中的鉴别器网络D进行联合训练,设定循环次数,当达到设定的循环次数后,循环结束,联合训练结束;比如,循环次数设定为100次。
通过联合训练对生成器网络G的参数和鉴别器网络D的参数进行更新,从而使得提升生成器网络的预测性能。
现有技术中用来预测无线业务流量值的方法与实施例1提供的预测方法区别之处在于:现有技术不考虑对抗损失和跨域数据的预测方法,其目标函数是生成器网络的一部分,即:
Figure BDA0002384505640000113
此处的输入只包含无线业务流量数据。它只关心输入值跟输出值之间的误差,并不考虑输出值是否符合真实样本分布。现有技术对无线业务流量值的预测效果与本发明提供的预测方法及真实流量值之间的对比如图4所示,从图4可以看出,本实施例提供的预测方法引入跨域数据和对抗损失能够有效地提升预测性能,预测值跟真实值相近,误差较小。本发明可用于未来通信系统中的智能流量预测模块,辅助网络管理。

Claims (6)

1.一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,其特征在于,用于提升无线业务流量预测的整体性能,具体步骤如下:
(1)将原始无线业务流量日志数据按照时间粒度和空间粒度处理成数据矩阵,得到无线业务流量数据
Figure FDA0002384505630000011
其中,
Figure FDA0002384505630000012
表示在第t个时间段所有小区的无线业务流量值,
Figure FDA0002384505630000019
表示实数,W表示矩阵的列数,H表示矩阵的行数,T表示总的时间段数量;
把城市区域分成不同的方格,把每个方格当成一个小区,获取到小区中心点的坐标(h,w),(h,w)表示的是位于第h行、第w列的小区坐标;dh,w表示第h行第w列小区的无线业务流量,且h∈{1,2,…,H},w∈{1,2,…,W};
(2)获取城市尺度的跨域数据,
Figure FDA0002384505630000013
表示跨域数据,c为跨域数据的种类;
(3)获取时间特征mt
Figure FDA0002384505630000014
mt表示第t个时间段对应的时间特征,
Figure FDA0002384505630000015
表示星期几,
Figure FDA0002384505630000016
表示小时,
Figure FDA0002384505630000017
表示是否为工作日,
Figure FDA0002384505630000018
表示是否为周末;
(4)利用滑动窗口方法得到训练集
Figure FDA00023845056300000112
和测试集
Figure FDA00023845056300000113
Figure FDA00023845056300000111
令Xt=(Dt-s,Dt-s+1,…,Dt-1,mt,C),其中,Dt-s表示在第t-s个时间段所有小区的无线业务流量值,Dt-s+1表示在第t-s+1个时间段所有小区的无线业务流量值,Dt-1表示在第t-1个时间段所有小区的无线业务流量值;Yt=Dt,则St=(Xt,Yt)=((Dt-s,Dt-s+1…,Dt-1,mt,C),Dt);
同理可得,
Figure FDA00023845056300000110
令X′t=(Dt-s,Dt-s+1,…,Dt-1,mt,C),Y′t=Dt,S′t=(X′t,Y′t)=((Dt-s,Dt-s+1,…,Dt-1,mt,C),Dt);
(5)根据无线业务流量数据Dt,跨域数据C以及时间特征mt,构建生成器网络G,生成器网络输出无线业务流量预测值;Dt用来捕捉无线业务流量的时空相关性,C用来捕捉跨域数据对无线业务流量的空间约束性,mt用来捕捉显式时间特征;
(6)以生成器网络G输出无线业务流量预测值G(Xt)和从真实样本中采样的数据Yt为输入,构建鉴别器网络D;构建鉴别器网络D最大化区分输入样本的真假概率;
(7)对步骤(5)中的生成器网络G和步骤(6)中的鉴别器网络D进行联合训练,设定循环次数,当达到设定的循环次数后,循环结束,联合训练结束。
2.根据权利要求1所述的一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,其特征在于,所述步骤(5)中,根据无线业务流量数据Dt,跨域数据C以及时间特征mt,构建生成器网络G,输出无线业务流量预测值的具体步骤包括:
A、构建卷积长短记忆网络fConvLSTM,对无线业务流量Dt进行特征学习,特征学习的过程如式(I)所示:
Figure FDA0002384505630000021
式(I)中,Ftraffic表示对无线业务流量Dt经过学习后得到的特征值,
Figure FDA0002384505630000022
表示第一层卷积长短记忆网络,
Figure FDA0002384505630000023
表示第二层卷积长短记忆网络;
B、采用卷积网络fConv对跨域数据C进行特征学习,特征学习的过程如式(II)所示:
Figure FDA0002384505630000024
式(II)中,Fcross表示对C经过学习后得到的特征值,
Figure FDA0002384505630000025
表示第一层卷积网络,
Figure FDA0002384505630000026
表示第二层卷积网络;
C、采用全连接网络fLinear对显式时间特征mt进行特征学习,特征学习的过程如式(III)所示:
Figure FDA0002384505630000027
式(III)中,Fmeta表示对mt学习之后得到的特征值,
Figure FDA0002384505630000028
表示第一层全连接网络,
Figure FDA0002384505630000029
表示第二层全连接网络;
D、对无线业务流量数据Dt,跨域数据C以及时间特征mt三种特征进行融合,形成初步特征输入
Figure FDA00023845056300000210
其中,
Figure FDA00023845056300000211
表示拼接操作;
设计密集连接卷积网络对F进行进一步非线性学习,在密集连接卷积网络第l层学到的特征Fl,如式(IV)所示:
Figure FDA00023845056300000212
式(IV)中,F1表示在密集连接卷积网络的第1层学到的特征,F2表示在密集连接卷积网络的第2层学到的特征,Fl-1表示在密集连接卷积网络的第l-1层学到的特征;
E、对学到的最终特征FL进行非线性激活,得到生成器网络的输出无线业务流量预测值G(Xt);L表示密集连接卷积网络的总的网络层数,FL表示在密集连接卷积网络的最后一层学到的特征;
F、生成器网络的目标函数
Figure FDA0002384505630000031
如式(V)所示,
Figure FDA0002384505630000032
式(V)中,λ表示调节预测准确性与相似性的参数,
Figure FDA0002384505630000033
表示预测的无线业务流量值,
Figure FDA0002384505630000034
表示在给定输入Xt,真实业务流量值Yt的条件下的对抗损失函数,||·||F表示F范数,
Figure FDA0002384505630000035
表示鉴别器网络将生成器的预测的无线业务流量值
Figure FDA0002384505630000036
判断为真的概率。
3.根据权利要求2所述的一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,其特征在于,所述步骤(6)中,以生成器网络G输出无线业务流量预测值G(Xt)和从真实样本中采样的数据Yt为输入,构建鉴别器网络D,具体步骤包括:
A、将(Xt;Yt)的标签设置为1,将(Xt;G(Xt))的标签设置为0,样本At满足:At∈{(Xt;Yt);(Xt;G(Xt)};
B、将样本At输入到鉴别器网络D进行特征学习,具体过程如式(VI)所示:
Figure FDA0002384505630000037
式(VI)中,o表示对输入数据At进行两层卷积网络学习以及两层全连接网络学习后的特征值;
C、对鉴别器网络D的输出进行非线性映射,得到鉴别器网络D的输出值为D(Xt;Yt)和D(Xt;G(Xt));鉴别器网络的目标函数
Figure FDA0002384505630000038
如式(VII)所示:
Figure FDA0002384505630000039
式(VII)中,lbce(·)表示二元交叉熵损失,
Figure FDA00023845056300000310
表示给定输入Xt,真实业务流量值Yt的条件下的对抗损失函数。
4.根据权利要求1所述的一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,其特征在于,步骤(2)中,所述跨域数据的种类包括小区内的兴趣点数据、社交活动水平数据、以及基站数量;获取城市尺度的跨域数据C的具体步骤为:
A、通过地图开放平台,获取小区周围的兴趣点数据;
B、根据得到的兴趣点数据,将每个小区坐标(h,w)内的不同兴趣点数据做累加和;
C、通过开源项目的应用接口获取到每个小区内的基站数量以及社交活动水平数据,最终得到城市尺度的跨域数据C。
5.根据权利要求1所述的一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,其特征在于,步骤(4)中,利用滑动窗口方法得到训练集
Figure FDA0002384505630000041
和测试集
Figure FDA0002384505630000042
的具体步骤为:
A、对于无线业务流量数据
Figure FDA0002384505630000043
选择前pT的时间段的数据作为训练数据,剩余(1-p)T的时间段的数据为测试数据;
B、对于训练数据和测试数据,选取窗口大小s;然后根据滑动窗口方法进行样本构建,即如果Dt为预测目标,则[Dt-s,Dt-s+1…,Dt-1]为特征输入;
C、在训练数据中,得到小区流量的最大值dmax和最小值dmin,然后根据最大最小归一化准则,对训练数据和测试数据进行归一化处理,得到训练集
Figure FDA0002384505630000044
和测试集
Figure FDA0002384505630000045
Figure FDA0002384505630000046
令Xt=(Dt-s,Dt-s+1,…,Dt-1,mt,C),其中,Dt-s表示在第t-s个时间段所有小区的无线业务流量值,Dt-s+1表示在第t-s+1个时间段所有小区的无线业务流量值,Dt-1表示在第t-1个时间段所有小区的无线业务流量值;Yt=Dt,则St=(Xt,Yt)=((Dt-s,Dt-s+1…,Dt-1,mt,C),Dt);
同理可得,
Figure FDA0002384505630000047
令X't=(Dt-s,Dt-s+1,…,Dt-1,mt,C),Y't=DtS't=(X't,Y't)=((Dt-s,Dt-s+1,…,Dt-1,mt,C),Dt)。
6.根据权利要求1-5任一项所述的一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法,其特征在于,步骤(1)中,所述时间粒度以分钟或小时为单位,所述空间粒度以平方米为单位。
CN202010093523.0A 2020-02-14 2020-02-14 一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法 Active CN111343650B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010093523.0A CN111343650B (zh) 2020-02-14 2020-02-14 一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010093523.0A CN111343650B (zh) 2020-02-14 2020-02-14 一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法

Publications (2)

Publication Number Publication Date
CN111343650A true CN111343650A (zh) 2020-06-26
CN111343650B CN111343650B (zh) 2021-11-30

Family

ID=71185222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010093523.0A Active CN111343650B (zh) 2020-02-14 2020-02-14 一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法

Country Status (1)

Country Link
CN (1) CN111343650B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112291807A (zh) * 2020-10-15 2021-01-29 山东科技大学 一种基于深度迁移学习和跨域数据融合的无线蜂窝网络流量预测方法
CN112437451A (zh) * 2020-11-10 2021-03-02 南京大学 一种基于生成对抗网络的无线网络流量预测方法和设备
CN112532439A (zh) * 2020-11-24 2021-03-19 山东科技大学 一种基于注意力多组件时空跨域神经网络模型的网络流量预测方法
CN112910711A (zh) * 2021-02-03 2021-06-04 山东大学 一种基于自注意力卷积网络的无线业务流量预测方法、设备及介质
CN113505611A (zh) * 2021-07-09 2021-10-15 中国人民解放军战略支援部队信息工程大学 在生成对抗中获得更好的语音翻译模型的训练方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160142492A1 (en) * 2014-11-18 2016-05-19 Fujitsu Limited Methods and devices for controlling vehicular wireless communications
CN107967532A (zh) * 2017-10-30 2018-04-27 厦门大学 融合区域活力的城市交通流量预测方法
CN109816095A (zh) * 2019-01-14 2019-05-28 湖南大学 基于改进门控循环神经网络的网络流量预测方法
CN109902880A (zh) * 2019-03-13 2019-06-18 南京航空航天大学 一种基于Seq2Seq生成对抗网络的城市人流预测方法
CN110689184A (zh) * 2019-09-21 2020-01-14 广东毓秀科技有限公司 一种通过深度学习进行轨交人流预测的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160142492A1 (en) * 2014-11-18 2016-05-19 Fujitsu Limited Methods and devices for controlling vehicular wireless communications
CN107967532A (zh) * 2017-10-30 2018-04-27 厦门大学 融合区域活力的城市交通流量预测方法
CN109816095A (zh) * 2019-01-14 2019-05-28 湖南大学 基于改进门控循环神经网络的网络流量预测方法
CN109902880A (zh) * 2019-03-13 2019-06-18 南京航空航天大学 一种基于Seq2Seq生成对抗网络的城市人流预测方法
CN110689184A (zh) * 2019-09-21 2020-01-14 广东毓秀科技有限公司 一种通过深度学习进行轨交人流预测的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHUANTING ZHANG; HAIXIA ZHANG; DONGFENG YUAN; MINGGAO ZHANG: "Citywide Cellular Traffic Prediction Based on Densely Connected Convolutional Neural Networks", 《IEEE COMMUNICATIONS LETTERS》 *
YUXUAN ZHANG; SENZHANG WANG; BING CHEN; JIANNONG CAO: "GCGAN: Generative Adversarial Nets with Graph CNN for Network-Scale Traffic Prediction", 《2019 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN)》 *
张传亭: "基于深度学习的城市尺度无线流量预测", 《中国博士学位论文全文数据库(电子期刊)》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112291807A (zh) * 2020-10-15 2021-01-29 山东科技大学 一种基于深度迁移学习和跨域数据融合的无线蜂窝网络流量预测方法
CN112291807B (zh) * 2020-10-15 2022-09-23 山东科技大学 一种基于深度迁移学习和跨域数据融合的无线蜂窝网络流量预测方法
CN112437451A (zh) * 2020-11-10 2021-03-02 南京大学 一种基于生成对抗网络的无线网络流量预测方法和设备
CN112532439A (zh) * 2020-11-24 2021-03-19 山东科技大学 一种基于注意力多组件时空跨域神经网络模型的网络流量预测方法
CN112910711A (zh) * 2021-02-03 2021-06-04 山东大学 一种基于自注意力卷积网络的无线业务流量预测方法、设备及介质
CN112910711B (zh) * 2021-02-03 2021-12-24 山东大学 一种基于自注意力卷积网络的无线业务流量预测方法、设备及介质
CN113505611A (zh) * 2021-07-09 2021-10-15 中国人民解放军战略支援部队信息工程大学 在生成对抗中获得更好的语音翻译模型的训练方法和系统
CN113505611B (zh) * 2021-07-09 2022-04-15 中国人民解放军战略支援部队信息工程大学 在生成对抗中获得更好的语音翻译模型的训练方法和系统

Also Published As

Publication number Publication date
CN111343650B (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN111343650B (zh) 一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法
CN110647900B (zh) 基于深度神经网络的安全态势智能预测方法、装置及系统
WO2022135265A1 (zh) 气候变化影响下水库调度规则的失效预警分析方法
CN110648014B (zh) 一种基于时空分位数回归的区域风电预测方法及系统
CN110837915B (zh) 一种基于混合集成深度学习的电力系统低压负荷点预测及概率预测方法
CN110222592B (zh) 一种基于互补时序行为提案生成的时序行为检测网络模型的构建方法
CN113672865A (zh) 一种基于深度图高斯过程的交通流量预测方法
CN113177652A (zh) 一种光伏出力预测方法
CN108989092A (zh) 一种无线网络预测方法、电子设备及存储介质
CN115051925B (zh) 一种基于迁移学习的时空序列预测方法
CN114265913A (zh) 工业物联网边缘设备上基于联邦学习的空时预测算法
CN115964503B (zh) 基于社区设备设施的安全风险预测方法及系统
CN108960486A (zh) 基于灰支持向量回归机预测适应值的交互式集合进化方法
CN117565727A (zh) 基于人工智能的无线充电自动控制方法及系统
CN114357670A (zh) 一种基于bls和自编码器的配电网用电数据异常预警方法
CN114444811A (zh) 一种基于注意力机制的铝电解混频数据过热度预测方法
CN112801357B (zh) 日照辐射量预测方法、装置、设备及存储介质
CN113033898A (zh) 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统
CN117113202A (zh) 基于联合误差堆叠模型的电力回路能耗检测方法及设备
CN117494034A (zh) 基于交通拥堵指数和多源数据融合的空气质量预测方法
CN116486611A (zh) 一种城市道路车辆速度预测方法
CN116167465A (zh) 基于多变量时间序列集成学习的太阳辐照度预测方法
Cao et al. Research On Regional Traffic Flow Prediction Based On MGCN-WOALSTM
CN115841167A (zh) 基于多维度交叉注意力机制的光伏数据预测方法
CN115310355A (zh) 考虑多能耦合的综合能源系统多元负荷预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant