CN115225520B - 一种基于元学习框架的多模态网络流量预测方法及装置 - Google Patents
一种基于元学习框架的多模态网络流量预测方法及装置 Download PDFInfo
- Publication number
- CN115225520B CN115225520B CN202210831071.0A CN202210831071A CN115225520B CN 115225520 B CN115225520 B CN 115225520B CN 202210831071 A CN202210831071 A CN 202210831071A CN 115225520 B CN115225520 B CN 115225520B
- Authority
- CN
- China
- Prior art keywords
- data
- meta
- prediction
- learning framework
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种基于元学习框架的多模态网络流量预测方法及装置,该方法包括:获取历史多模态数据;将历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据。该方案:预测得到的网络流量数据具有较高的准确率和可靠性。
Description
技术领域
本发明属于深度学习和网络流量预测技术领域,特别涉及一种基于元学习框架的多模态网络流量预测方法及装置。
背景技术
随着互联网和移动通信技术的飞速发展,网络规模和复杂度在不断增大,网络流量数据呈现规模大、维度高、类型复杂、格式非结构化的特点,给网络流量分析方法带来严峻挑战。此外,随着各类移动设备和应用程序的广泛使用,用户的网络流量需求也在激增,对运营商的网络管理和规划提出了更高的要求。为了更好的对网络进行高效管理和合理规划,可以利用深度学习方法刻画蜂窝流量数据的变化趋势,准确预估未来时刻的流量数据,一方面可以帮助管理人员优化网络资源配置,有效应对突发的网络拥堵问题,避免网络故障的发生。同时,通过优化流量管理策略,可以进一步提升运营公司的网络服务质量,满足个性化用户的服务体验。因此,网络流量预测的准确性、预测稳健性的提高,具有十分重要的现实意义。
近年来,随着人工智能技术的不断发展,基于深度学习的网络流量预测方法受到了广泛关注。为了充分挖掘网络流量数据复杂的时空特征,研究人员探索了诸多深度学习方法。1)基于时域特征的方法:循环神经网络、长短期记忆神经网络、门控循环神经网络、注意力机制等方法可以高效捕捉时间序列的长期时序依赖特征。然而,这类方法忽略了高维时间序列数据的空间相关性。2)基于时空域特征的方法:研究人员提出了ConvLSTM、DeseNet、STNet、st_tran等模型,采用序列模型捕捉时间序列的长期时域依赖,同时利用卷积神经网络等结构捕捉蜂窝流量数据的局部空间依赖关系。众所周知,基于深度学习的网络流量预测方法依赖大量的数据资源,当数据量十分充足时,上述方法可以获得较为理想的性能。然而,面向新站基站应用场景,尤其是刚投入使用的基站只能采集到十分有限的网络数据,针对小样本数据的网络流量预测任务,现有的方法难以获得理想的模型参数,且容易出现过拟合的问题。其次,网络流量数据具有高时变动态,容易受到诸多外部因素(例如,社交活动,社会新闻事件等)的影响,这些多模态数据包含了丰富的信息,能够补充单一来源数据存在信息量不足的缺点。然而,现有的研究缺乏探究多模态数据对网络流量预测性能的影响,使得流量预测的准确率难以继续提升。此外,随着预测方法的不断发展,预测值的可靠性问题也逐渐受到了关注。然而,网络流量预测方法在预测值的不确定性方面的研究目前仍然是空白的。
发明内容
本说明书实施例的目的是提供一种基于元学习框架的多模态网络流量预测方法及装置。
为解决上述技术问题,本申请实施例通过以下方式实现的:
第一方面,本申请提供一种基于元学习框架的多模态网络流量预测方法,该方法包括:
获取历史多模态数据;
将历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据。
在其中一个实施例中,将历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据,包括:
对历史多模态数据进行预处理,得到处理后多模态数据;
将处理后多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据。
在其中一个实施例中,历史多模态数据包括数值型数据、文本数据、图像数据;数值型数据包括流量数据和元数据;
对历史多模态数据进行预处理,得到处理后多模态数据,包括:
对流量数据进行归一化处理,得到处理后流量数据;
对元数据进行独热编码,得到处理后元数据;
对文本数据进行信息提取,得到处理后文本数据;
对图像数据进行缩放处理,得到处理后图像数据。
在其中一个实施例中,预建基于元学习框架的预测模型包括并行的第一编码器-解码器模块和第二编码器-解码器模块;第一编码器-解码器模块和第二编码器-解码器模块均包括若干时空模块;时空模块用于挖掘处理后多模态数据的时空特征;
将历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据,包括:
利用第一编码器-解码器模块捕捉历史多模态数据的周期性序列的特征,得到周期性时空特征;
利用第二编码器-解码器模块捕捉历史多模态数据的短期性序列的特征,得到短期性时空特征;
根据周期性时空特征和短期性时空特征,得到网络流量数据。
在其中一个实施例中,时空模块包括基于事件驱动的多头注意力机制、图卷积神经网络和卷积神经网络;
时空模块用于挖掘处理后多模态数据的时空特征,包括:
基于事件驱动的多头注意力机制捕捉流量数据和文本数据的长期时域特征;
图卷积神经网络捕捉流量数据的空域特征;
卷积神经网络挖掘图像数据的空域特征;
将流量数据和文本数据的长期时域特征进行融合,并利用多头注意力机制捕捉时域特征,得到处理后多模态数据的时域特征;
将流量数据和图像数据的空域特征进行有机融合,得到处理后多模态数据的空域特征;
将处理后多模态数据的时域特征和空域特征融合,得到处理后多模态数据的时空特征。
在其中一个实施例中,预建基于元学习框架的预测模型的构建包括:
获取训练任务数据集;
在训练任务数据集中采样并获得元训练支持集和元训练查询集;
根据元训练支持集优化Metaformer模型,通过内循环得到初始化模型参数;
根据元训练查询集,利用梯度下降优化算法进一步优化初始化模型参数,更新初始化模型参数;
获取新任务数据集;
在新任务数据集中采样并获得元测试支持集和元测试查询集;
利用元测试支持集对初始化模型参数进行微调,得到微调后的初始化模型参数;
利用元测试查询集评估预建基于元学习框架的预测模型的点预测性能。
在其中一个实施例中,该方法还包括:
获取修正任务数据集;
将修正任务数据集划分为元修正支持集和元修正查询集;
根据元修正支持集,获得不确定性估计的数值;
根据元修正查询集,获得预测区间。
第二方面,本申请提供一种基于元学习框架的多模态网络流量预测装置,该装置包括:
获取模块,用于获取历史多模态数据;
预测模块,用于将历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如第一方面的基于元学习框架的多模态网络流量预测方法。
第四方面,本申请提供一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面的基于元学习框架的多模态网络流量预测方法。
由以上本说明书实施例提供的技术方案可见,该方案:
通过将获取的历史多模态数据输入预建基于元学习框架的预测模型中,进行网络流量数据的预测,可以解决由于数据量稀少而造成预测性能差的问题,为部署在面向小样本数据的网络流量预测场景提供参考。
预建基于元学习框架的预测模型中设计了两个并行的编码器-解码器,分别提取短期和周期性的流量序列的有效特征,从而实现细粒度流量序列的时空特征挖掘,有助于提升模型的预测性能。
编码器-解码器中设计了时空模块,利用多种深度神经网络结构充分挖掘多模态数据的长期时域依赖和局部空间特征,并通过有机融合获得多模态数据的时空特征,旨在提升模型的预测精度。
利用保形预测评估预测值的可信度,即在给定置信水平条件下,实现面向网络流量预测任务的区间预测,能够更加准确的评估模型的可靠性。此外,通过量化预测值的不确定性,以便进行更加准确的风险评估和决策,为部署在真实蜂窝网络场景中提供理论保证和技术支撑。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的基于元学习框架的多模态网络流量预测方法的流程示意图;
图2为本申请提供的预建基于元学习框架的结构示意图;
图3为本申请提供的时空模块的结构示意图;
图4为本申请提供的数据集划分示意图;
图5为本申请提供的元训练阶段的训练过程示意图;
图6为本申请提供的元测试阶段的测试过程示意图;
图7为在公开的Milan数据集上比较本申请方法的预测性能与现有方法的预测性能的对比图;
图8为不同置信水平条件下,真实值落在预测区间的覆盖示意图;
图9为本申请提供的基于元学习框架的多模态网络流量预测装置的结构示意图;
图10为本申请提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
在不背离本申请的范围或精神的情况下,可对本申请说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本申请的说明书得到的其他实施方式对技术人员而言是显而易见得的。本申请说明书和实施例仅是示例性的。
关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。
本申请中的“份”如无特别说明,均按质量份计。
下面结合附图和实施例对本发明进一步详细说明。
参照图1,其示出了适用于本申请实施例提供的基于元学习框架的多模态网络流量预测方法的流程示意图。
如图1所示,基于元学习框架的多模态网络流量预测方法,可以包括:
S110、获取历史多模态数据。
具体的,历史多模态数据可以根据实际需求周期进行选取,例如选取待预测时刻前一天内的所有历史多模态数据,例如选取待预测时刻前一周内的所有历史多模态数据,这里对此不作限制。可以理解的,历史多模态数据可以存储于执行基于元学习框架的多模态网络流量预测方法的设备的存储器中,也可以存储于存储服务器中,还可以存储于存储介质中,这里对此不作限制,只要能获取到即可。
其中,多模态数据可以包括数值型数据、文本数据和图像数据,其中,数值型数据可以包括流量数据和元数据。
S120、将历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据。
可以理解的,在将历史多模态数据输入预建基于元学习的预测模型之前,需要对历史多模态数据进行预处理。下述实施例中的多模态数据为进行预处理后的多模态数据。
在一个实施例中,将历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量,可以包括:
对历史多模态数据进行预处理,得到处理后多模态数据;
将处理后多模态数据输入预建基于元学习框架的预测模型,预测网络流量。
可选的,对历史多模态数据进行预处理,得到处理后多模态数据,可以包括:
对流量数据进行归一化处理,得到处理后流量数据;
对元数据进行独热编码,得到处理后元数据;
对文本数据进行信息提取,得到处理后文本数据;
对图像数据进行缩放处理,得到处理后图像数据。
具体的,可以采用最大-最小归一化方法对流量数据进行归一化处理。元数据例如星期数、小时数,可以对星期数、小时数等元数据进行独热编码。针对文本数据,可以提取文本数据集的有效信息,例如,文章的类型、数量等。针对图像数据,可以采用opencv的resize()函数对图片进行统一缩放,获得(宽度,高度,通道数)格式的图像数据。
其中,预建基于元学习框架的预测模型为预先构建的预测模型,模型通过利用历史多模态数据预测未来时刻的网络流量数据。
图2为预建基于元学习框架的结构示意图。如图2所示,预建基于元学习框架的预测模型包括并行的第一编码器-解码器模块和第二编码器-解码器模块;第一编码器-解码器模块和第二编码器-解码器模块均包括若干时空模块(ST-block);时空模块用于挖掘处理后多模态数据的时空特征。
在一个实施例中,将历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据,包括:
利用第一编码器-解码器模块捕捉历史多模态数据的周期性序列的特征,得到周期性时空特征;
利用第二编码器-解码器模块捕捉历史多模态数据的短期性序列的特征,得到短期性时空特征;
根据周期性时空特征和短期性时空特征,得到网络流量数据。
图3为时空模块的结构示意图,如图3所示,时空模块包括基于事件驱动的多头注意力机制、图卷积神经网络和卷积神经网络。
在一个实施例中,时空模块用于挖掘处理后多模态数据的时空特征,包括:
基于事件驱动的多头注意力机制捕捉流量数据和文本数据的长期时域特征;
图卷积神经网络捕捉流量数据的空域特征;
卷积神经网络挖掘图像数据的空域特征;
将流量数据和文本数据的长期时域特征进行融合,并利用多头注意力机制捕捉时域特征,得到处理后多模态数据的时域特征;
将流量数据和图像数据的空域特征进行有机融合,得到处理后多模态数据的空域特征;
将处理后多模态数据的时域特征和空域特征融合,得到处理后多模态数据的时空特征。
具体的,为了捕捉流量序列复杂的时空特征,本申请设计了ST-block结构,充分挖掘多模态数据中的长期时域依赖(即长期时域特征)和局部空间依赖关系(即空域特征)。
继续参照图3,基于事件驱动的多头注意力机制中,令Xtra,Xtxt分别表示历史流量数据(又称为流量序列,为数值型数据中一种)和文本数据(例如社交活动、社会新闻事件等)。通过Embedding操作获得流量序列和文本数据的向量化表达,分别表示为Htra,Htxt。然后利用特征融合方法对其进行有效融合,得到融合特征H'。其中,特征融合方法的公式如下所示:
Htra=Embedding(Xtra) (1)
Htxt=Embedding(Xtxt) (2)
Z=Sigmoid(Htra+Htxt) (3)
H'=ZHtra+(1-Z)Htxt (4)
然后,利用多头注意力机制捕捉流量序列的长期时域依赖关系(即长期时域特征)。假设多头注意力机制一共有m个头,其中,第i个头Hi,i=1,...,m的计算公式如下所示:
其中,表示可学习的参数,da表示矩阵的维度,fatt(·)表示注意力机制的类型,比如标准的点乘注意力等。
进一步地,通过如下公式,可以获得处理后多模态数据的时域特征Htemporal,
其中,表示可学习参数。
为了刻画多模态数据的空间相关性,采用图卷积神经网络fgcn(·)捕捉历史流量数据间的空间依赖关系,同时利用卷积神经网络fcnn(·)挖掘图像数据中的空间相关性(即空域特征),然后利用公式(9)对两种空域特征进行融合,从而获得多模态数据的Hspatial,具体如下公式所示:
Hgcn=fgcn(Htra,G) (7)
Hcnn=fcnn(Htxt) (8)
Hspatial=Hgcn×Hcnn (9)
其中,Hgcn,Hcnn分别表示从图卷积神经网络和卷积神经网络中提取到的有效特征。表示基于空间地理位置的空间相关系数矩阵。
然后,将多模态数据的时域特征和空域特征进行有效融合,并获得处理后多模态数据的时空特征Hst,具体见如下公式所示,
Hst=Htemporal×Hspatial (10)
本申请分别收集了短期和周期性流量序列,并设计了两个并行的编码器-解码器结构,分别捕捉流量序列的短期性(每小时)和周期性(每日)特征。令Hc,Hp分别表示流量序列的短期和周期性特征,W1,W2,b分别表示可学习的参数,则可以通过如下公式获得预测值
构建预建基于元学习框架的预测模型Metaformer模型包括点预测部分和区间预测部分。其中,点预测部分是基于元学习框架利用多模态数据实现高维时间序列点预测任务。区间预测部分是基于保形预测实现高维时间序列的区间预测任务。其中,点预测部分包括元训练阶段和元测试阶段。
在一个实施例中,预建基于元学习框架的预测模型的构建包括:
获取N个任务数据集,其中,包括N-1个训练任务数据集和1个修正任务数据集,每个任务数据集都是由一定区域范围内临近小区的多模态数据组成;
在N-1个训练任务数据集中采样并获得元训练支持集和元训练查询集;
根据元训练支持集优化Metaformer模型,通过内循环得到初始化模型;
根据多个任务的元测试查询集,利用梯度下降优化算法进一步优化初始化模型参数,更新初始化模型参数(又称为外循环);
获取新任务数据集,即第N+1个任务数据集;
在新任务数据集中采样并获得元测试支持集和元测试查询集;
利用元测试支持集对初始化模型参数进行微调,得到微调后的模型初始化参数;
利用元测试查询集评估预建基于元学习框架的预测模型的点预测性能。
可以理解的,基于元学习框架的多模态网络流量预测还可以包括元修正,用于实现预测值的不确定性估计。
在一个实施例中,该方法还包括:
获取修正任务数据集,即第N个任务数据集;
将修正任务数据集划分为元修正支持集和元修正查询集;
根据元修正支持集,获得不确定性分数;
根据元修正查询集,获得预测区间。
具体的,假设一共有N个已知的任务,表示第i个任务,所有的任务具有相同的分布/>此外,每个任务都是由数值型数据、文本数据和图像数据的多模态数据组成。针对任务/>表示第i个任务的历史流量数据,/>表示第i个任务的文本数据,D,Dext分别表示流量序列和外部信息的维度。/>表示第i个任务的图像数据,W,H,C分别表示图像的宽度,高度和通道数。本申请的目标是利用N个任务数据集训练一个深度学习模型(即预建基于元学习框架的预测模型),使得该模型在新任务数据集/>上,只通过少量的训练数据和有限的迭代次数就能达到比较理想的预测性能。将任务数据集/>划分为支持集/>和查询集/>具体的数据集划分如图4所示。
如图5所示,在元训练阶段,首先在N-1个训练任务数据集(也称为元训练任务池)中分别采样并获得N-1个任务的元训练支持集和元训练查询集。其次,元训练阶段的训练过程包含内循环和外循环,其中,内循环是针对单个任务而言的,对于单一的任务数据集/>首先将该任务中元训练支持集的训练样本/>输入Metaformer模型,然后利用该任务中支持集的测试样本/>计算损失函数/>利用梯度下降算法优化模型参数。单个任务的损失函数表示如公式(13)所示:
其中,表示期望,NQ表示样本数量。φi表示利用训练模型在第i个任务数据集的输出值。
元训练阶段的外循环是对所有的训练任务而言的,通过计算所有N-1个元训练任务中查询集的损失函数,并再次利用梯度下降优化算法(例如Adam算法)进一步优化初始化模型参数,具体见公式(14)所示。
上述构建预建基于元学习框架的预测模型,采用端到端的方式进行迭代训练,直至模型收敛。
如图6所示,在元测试阶段,首先在新任务数据集(也称为元测试任务池)中采样一定数量的元测试支持集/>和元测试查询集/>并将训练好的模型参数θ*作为Metaformer的初始化模型参数,利用新任务中元测试支持集/>对其进行微调,然后利用新任务中元测试查询集/>评估模型的点预测性能。
在元修正阶段,将元修正任务数据集划分为元修正支持集/>和元修正查询集当给定置信水平α∈[0,1],本申请利用保形预测方法获得预测区间,即真实值落在预测区间的概率满足如下公式:
其中,yi为真实值,为预测区间下限,/>为预测区间上限。
将元修正支持集数据输入Metaformer结构,获得元修正预测其中,D表示向量的维度,
然后,计算预测值和真实值的绝对残差,具体见如下公式所示,
然后,将第i,i∈{1,...,D}个维度的Ltest个绝对残差值Ri按递减顺序排序,可以表示为其中,Ltest表示测试集的样本数量。当给定置信水平α后,我们可以获得修正分数/>即第/>个最小残差值。同理,我们可以获得D个维度的修正分数/>在此为了简化表达,我们省略了下标p。
进一步地,根据修正分数和预测值/>我们可以进一步获得预测区间的下限/>和上限/>其中,/>分别可以根据如下公式获得:
下述利用均方根误差(RMSE)和平均绝对误差(MAE)这两个评价指标对模型的预测性能进行评估。图7是在公开的Milan数据集上比较了本申请所提出方法的性能与现有方法的预测性能。其中,(a)和(b)展示了不同模型在提前一步预测任务(预测未来1小时的网络流量)中的性能差异,(c)和(d)展示了在提前24步预测任务(预测未来一天的网络流量)中不同模型的预测性能差异。由此可见,本申请所提出的方法优于现有的其他蜂窝网络流量预测方法,可以说明本申请基于元学习框架的多模态网络流量预测方法具有先进性。此外,图8展示了不同置信水平条件下,真实值落在预测区间的覆盖情况,本申请首次利用保形预测方法,实现预测值的不确定性评估。
参照图9,其示出了根据本申请一个实施例描述的基于元学习框架的多模态网络流量预测装置的结构示意图。
如图9所示,基于元学习框架的多模态网络流量预测装置,可以包括:
获取模块910,用于获取历史多模态数据;
预测模块920,用于将历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据。
可选的,预测模块920还用于:
对历史多模态数据进行预处理,得到处理后多模态数据;
将处理后多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据。
可选的,预测模块920还用于:历史多模态数据包括数值型数据、文本数据、图像数据;数值型数据包括流量数据和元数据;
对历史多模态数据进行预处理,得到处理后多模态数据,包括:
对流量数据进行归一化处理,得到处理后流量数据;
对元数据进行独热编码,得到处理后元数据;
对文本数据进行信息提取,得到处理后文本数据;
对图像数据进行缩放处理,得到处理后图像数据。
可选的,预测模块920还用于:预建基于元学习框架的预测模型包括并行的第一编码器-解码器模块和第二编码器-解码器模块;第一编码器-解码器模块和第二编码器-解码器模块均包括若干时空模块;时空模块用于挖掘处理后多模态数据的时空特征;
将历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据,包括:
利用第一编码器-解码器模块捕捉历史多模态数据的周期性序列的特征,得到周期性时空特征;
利用第二编码器-解码器模块捕捉历史多模态数据的短期性序列的特征,得到短期性时空特征;
根据周期性时空特征和短期性时空特征,得到网络流量数据。
可选的,时空模块包括基于事件驱动的多头注意力机制、图卷积神经网络和卷积神经网络;
时空模块用于挖掘处理后多模态数据的时空特征,包括:
基于事件驱动的多头注意力机制捕捉流量数据和文本数据的长期时域特征;
图卷积神经网络捕捉流量数据的空域特征;
卷积神经网络挖掘图像数据的空域特征;
将流量数据和文本数据的长期时域特征进行融合,并利用多头注意力机制捕捉时域特征,得到处理后多模态数据的时域特征;
将流量数据和图像数据的空域特征进行有机融合,得到处理后多模态数据的空域特征;
将处理后多模态数据的时域特征和空域特征融合,得到处理后多模态数据的时空特征。
可选的,该装置还包括构建模块,用于构建预建基于元学习框架的预测模型,包括:
获取训练任务数据集;
在训练任务数据集中采样并获得元训练支持集和元训练查询集;
根据元训练支持集优化Metaformer模型,通过内循环得到初始化模型参数;
根据元训练查询集,利用梯度下降优化算法进一步优化初始化模型参数,更新初始化模型参数;
获取新任务数据集;
在新任务数据集中采样并获得元测试支持集和元测试查询集;
利用元测试支持集对初始化模型参数进行微调,得到微调后的初始化模型参数;
利用元测试查询集评估预建基于元学习框架的预测模型的点预测性能。
可选的,该装置还包括:修正模块,用于:
获取修正任务数据集;
将修正任务数据集划分为元修正支持集和元修正查询集;
根据元修正支持集,获得不确定性估计的数值;
根据元修正查询集,获得预测区间。
本实施例提供的一种基于元学习框架的多模态网络流量预测装置,可以执行上述方法的实施例,其实现原理和技术效果类似,在此不再赘述。
图10为本发明实施例提供的一种电子设备的结构示意图。如图10所示,示出了适于用来实现本申请实施例的电子设备300的结构示意图。
如图10所示,电子设备300包括中央处理单元(CPU)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储部分308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有设备300操作所需的各种程序和数据。CPU 301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
以下部件连接至I/O接口305:包括键盘、鼠标等的输入部分306;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至I/O接口306。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器310上,以便于从其上读出的计算机程序根据需要被安装入存储部分308。
特别地,根据本公开的实施例,上文参考图1描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行上述基于元学习框架的多模态网络流量预测方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分309从网络上被下载和安装,和/或从可拆卸介质311被安装。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、笔记本电脑、行动电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
作为另一方面,本申请还提供了一种存储介质,该存储介质可以是上述实施例中前述装置中所包含的存储介质;也可以是单独存在,未装配入设备中的存储介质。存储介质存储有一个或者一个以上程序,前述程序被一个或者一个以上的处理器用来执行描述于本申请的基于元学习框架的多模态网络流量预测方法。
存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
Claims (8)
1.一种基于元学习框架的多模态网络流量预测方法,其特征在于,所述方法包括:
获取历史多模态数据;
将所述历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据;
其中,所述获取历史多模态数据,还包括:
对所述历史多模态数据进行预处理,得到处理后多模态数据;
将所述处理后多模态数据输入所述预建基于元学习框架的预测模型,预测所述网络流量数据;
所述预建基于元学习框架的预测模型包括并行的第一编码器-解码器模块和第二编码器-解码器模块;所述第一编码器-解码器模块和所述第二编码器-解码器模块均包括若干时空模块;所述时空模块用于挖掘所述处理后多模态数据的时空特征;
所述将所述历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据,还包括:
利用所述第一编码器-解码器模块捕捉所述历史多模态数据的周期性序列的特征,得到周期性时空特征;
利用所述第二编码器-解码器模块捕捉所述历史多模态数据的短期性序列的特征,得到短期性时空特征;
根据所述周期性时空特征和所述短期性时空特征,得到所述网络流量数据。
2.根据权利要求1所述的方法,其特征在于,所述历史多模态数据包括数值型数据、文本数据、图像数据;所述数值型数据包括流量数据和元数据;
所述对所述历史多模态数据进行预处理,得到处理后多模态数据,包括:
对所述流量数据进行归一化处理,得到处理后流量数据;
对所述元数据进行独热编码,得到处理后元数据;
对所述文本数据进行信息提取,得到处理后文本数据;
对所述图像数据进行缩放处理,得到处理后图像数据。
3.根据权利要求2所述的方法,其特征在于,所述时空模块包括基于事件驱动的多头注意力机制、图卷积神经网络和卷积神经网络;
所述时空模块用于挖掘所述处理后多模态数据的时空特征,包括:
所述基于事件驱动的多头注意力机制捕捉所述流量数据和文本数据的长期时域特征;
所述图卷积神经网络捕捉所述流量数据的空域特征;
所述卷积神经网络挖掘所述图像数据的空域特征;
将所述流量数据和所述文本数据的长期时域特征进行融合,并利用多头注意力机制捕捉时域特征,得到所述处理后多模态数据的时域特征;
将所述流量数据和所述图像数据的空域特征进行有机融合,得到所述处理后多模态数据的空域特征;
将所述处理后多模态数据的时域特征和空域特征融合,得到所述处理后多模态数据的时空特征。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述预建基于元学习框架的预测模型的构建包括:
获取训练任务数据集;
在所述训练任务数据集中采样并获得元训练支持集和元训练查询集;
根据所述元训练支持集优化Metaformer模型,通过内循环得到初始化模型参数;
根据所述元训练查询集,利用梯度下降优化算法进一步优化所述初始化模型参数,更新所述初始化模型参数;
获取新任务数据集;
在所述新任务数据集中采样并获得元测试支持集和元测试查询集;
利用所述元测试支持集对所述初始化模型参数进行微调,得到微调后的初始化模型参数;
利用所述元测试查询集评估所述预建基于元学习框架的预测模型的点预测性能。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取修正任务数据集;
将所述修正任务数据集划分为元修正支持集和元修正查询集;
根据所述元修正支持集,获得不确定性估计的数值;
根据所述元修正查询集,获得预测区间。
6.一种基于元学习框架的多模态网络流量预测装置,其特征在于,所述装置包括:
获取模块,用于获取历史多模态数据;
预测模块,用于将所述历史多模态数据输入预建基于元学习框架的预测模型,预测网络流量数据;
其中,所述获取模块,还包括:
预处理模块;用于对所述历史多模态数据进行预处理,得到处理后多模态数据;
输入模块:用于将所述处理后多模态数据输入所述预建基于元学习框架的预测模型,预测所述网络流量数据;
所述预测模块,还包括:
周期捕捉模块:用于利用第一编码器-解码器模块捕捉所述历史多模态数据的周期性序列的特征,得到周期性时空特征;
短期捕捉模块:用于利用第二编码器-解码器模块捕捉所述历史多模态数据的短期性序列的特征,得到短期性时空特征;
处理模块:用于根据所述周期性时空特征和所述短期性时空特征,得到所述网络流量数据。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一所述的基于元学习框架的多模态网络流量预测方法。
8.一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的基于元学习框架的多模态网络流量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210831071.0A CN115225520B (zh) | 2022-07-15 | 2022-07-15 | 一种基于元学习框架的多模态网络流量预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210831071.0A CN115225520B (zh) | 2022-07-15 | 2022-07-15 | 一种基于元学习框架的多模态网络流量预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115225520A CN115225520A (zh) | 2022-10-21 |
CN115225520B true CN115225520B (zh) | 2023-09-26 |
Family
ID=83611173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210831071.0A Active CN115225520B (zh) | 2022-07-15 | 2022-07-15 | 一种基于元学习框架的多模态网络流量预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115225520B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240171516A1 (en) * | 2022-11-18 | 2024-05-23 | Huawei Technologies Co., Ltd. | Distributed neural network encoder-decoder system and method for traffic engineering |
CN117201334B (zh) * | 2023-11-08 | 2024-01-26 | 之江实验室 | 一种多模态网络流量预测方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109873712A (zh) * | 2018-05-18 | 2019-06-11 | 新华三信息安全技术有限公司 | 一种网络流量预测方法及装置 |
CN111182220A (zh) * | 2020-01-09 | 2020-05-19 | 西安万像电子科技有限公司 | 图像处理装置、远端设备及通信系统 |
CN112738014A (zh) * | 2020-10-28 | 2021-04-30 | 北京工业大学 | 一种基于卷积时序网络的工控流量异常检测方法及系统 |
CN114462679A (zh) * | 2022-01-04 | 2022-05-10 | 广州杰赛科技股份有限公司 | 基于深度学习的网络流量预测方法、装置、设备及介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111130839B (zh) * | 2019-11-04 | 2021-07-16 | 清华大学 | 一种流量需求矩阵预测方法及其系统 |
-
2022
- 2022-07-15 CN CN202210831071.0A patent/CN115225520B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109873712A (zh) * | 2018-05-18 | 2019-06-11 | 新华三信息安全技术有限公司 | 一种网络流量预测方法及装置 |
CN111182220A (zh) * | 2020-01-09 | 2020-05-19 | 西安万像电子科技有限公司 | 图像处理装置、远端设备及通信系统 |
CN112738014A (zh) * | 2020-10-28 | 2021-04-30 | 北京工业大学 | 一种基于卷积时序网络的工控流量异常检测方法及系统 |
CN114462679A (zh) * | 2022-01-04 | 2022-05-10 | 广州杰赛科技股份有限公司 | 基于深度学习的网络流量预测方法、装置、设备及介质 |
Non-Patent Citations (2)
Title |
---|
Yang Jiao等.TimeAutoAD: Autonomous Anomaly Detection With Self-Supervised Contrastive Loss for Multivariate Time Series.《IEEE Transactions on Network Science and Engineering》.2022,全文. * |
Yuxia Xie等.Domain Adaptive Log Anomaly Prediction for Hadoop System.《IEEE Internet of Things Journal》.2022,全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN115225520A (zh) | 2022-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115225520B (zh) | 一种基于元学习框架的多模态网络流量预测方法及装置 | |
CN110928993B (zh) | 基于深度循环神经网络的用户位置预测方法及系统 | |
Shen et al. | Deepapp: a deep reinforcement learning framework for mobile application usage prediction | |
CN110008414B (zh) | 地理信息点的确定方法和装置 | |
US8478289B1 (en) | Predicting geographic population density | |
CN108399564B (zh) | 信用评分方法及装置 | |
US20190392258A1 (en) | Method and apparatus for generating information | |
Qin et al. | Simulating and Predicting of Hydrological Time Series Based on TensorFlow Deep Learning. | |
CN111091196B (zh) | 客流数据确定方法、装置、计算机设备和存储介质 | |
JP7334205B2 (ja) | 目的地の予測方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム | |
US20180285779A1 (en) | Method and Device for Generating Information | |
CN114285728B (zh) | 一种预测模型训练方法、流量预测方法、装置及存储介质 | |
CN112668238B (zh) | 一种降雨量处理方法、装置、设备和存储介质 | |
CN114943456B (zh) | 资源的调度方法、装置、电子设备及存储介质 | |
CN115017400A (zh) | 一种应用app推荐方法及电子设备 | |
US11676075B2 (en) | Label reduction in maintaining test sets | |
CN114418093B (zh) | 训练路径表征模型、输出信息的方法和装置 | |
CN113590971B (zh) | 一种基于类脑时空感知表征的兴趣点推荐方法及系统 | |
CN114972877A (zh) | 一种图像分类模型训练方法、装置及电子设备 | |
Pryor et al. | Differential credibility assessment for statistical downscaling | |
CN110674208B (zh) | 用于确定用户的职住地信息的方法和装置 | |
US11651271B1 (en) | Artificial intelligence system incorporating automatic model updates based on change point detection using likelihood ratios | |
CN113723712B (zh) | 风电功率预测方法、系统、设备及介质 | |
US11636377B1 (en) | Artificial intelligence system incorporating automatic model updates based on change point detection using time series decomposing and clustering | |
CN111339446B (zh) | 一种兴趣点挖掘方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |