CN113762485B - 一种基于注意力机制的多数据集联合预测方法 - Google Patents

一种基于注意力机制的多数据集联合预测方法 Download PDF

Info

Publication number
CN113762485B
CN113762485B CN202111155973.9A CN202111155973A CN113762485B CN 113762485 B CN113762485 B CN 113762485B CN 202111155973 A CN202111155973 A CN 202111155973A CN 113762485 B CN113762485 B CN 113762485B
Authority
CN
China
Prior art keywords
data
neural network
anomaly detection
amount
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111155973.9A
Other languages
English (en)
Other versions
CN113762485A (zh
Inventor
张娇阳
孙黎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202111155973.9A priority Critical patent/CN113762485B/zh
Publication of CN113762485A publication Critical patent/CN113762485A/zh
Application granted granted Critical
Publication of CN113762485B publication Critical patent/CN113762485B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于注意力机制的多数据集联合预测方法,包括以下步骤:1)对CDR数据集内不同类型的活动数据采用基于特征提取的移动网络异常检测方法进行异常检测,剔除异常的活动数据,再将各类型的活动数据分别放入相同结构的循环神经网络中;2)将各循环神经网络的输出结果输入到注意力单元中,再将注意力单元的输出结果输入到用于流量数据预测的循环神经网络中;3)将用于流量数据预测的循环神经网络的输出作为蜂窝流量的预测结果,该方法准确预测未来时刻的流量数据。

Description

一种基于注意力机制的多数据集联合预测方法
技术领域
本发明涉及一种预测方法,具体涉及一种基于注意力机制的多数据集联合预测方法。
背景技术
流量预测是无线网络数据分析和管理中的重要任务之一。无线网络中的流量预测是时间序列预测问题,根据历史流量数据序列预估未来一段时间内单位时刻上的流量值。流量预测对服务提供商而言非常有价值。预测未来时刻的流量数据可为网络运营商提供更多热点区域相关信息,审视已有资源分配方案的合理性、指导网络资源的动态分配和调整,然而现有技术并没有给出类似的公开。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供了一种基于注意力机制的多数据集联合预测方法,该方法准确预测未来时刻的流量数据。
为达到上述目的,本发明所述的基于注意力机制的多数据集联合预测方法包括以下步骤:
1)对CDR数据集内不同类型的活动数据采用基于特征提取的移动网络异常检测方法进行异常检测,剔除异常的活动数据,再将各类型的活动数据分别放入相同结构的循环神经网络中;
2)将各循环神经网络的输出结果输入到注意力单元中,再将注意力单元的输出结果输入到用于流量数据预测的循环神经网络中;
3)将用于流量数据预测的循环神经网络的输出作为蜂窝流量的预测结果。
步骤1)中活动数据的类型包括互联网活动量、短消息发送量、短消息接收量、电话接听量及电话拨出量。
步骤1)之前还包括:根据城市基站分布,将所关注的城市区域划分为M×N的网格区域,其中,M及N均为正整数,使用pandas聚合每个网格区域的蜂窝流量值,得以小时为单位的蜂窝流量总值,然后将所检测时间段划分为K个时隙,形成一个高维的时间序列向量,将所述时间序列向量作为原始蜂窝流量向量,任意网格j中,原始蜂窝流量向量xj=[xj[1],xj[2]L xj[p]L xj[K]]T,xj[p]表示网格j在第p小时内的手机流量总值。
步骤2)中,对CDR数据集内不同类型的活动数据采用基于特征提取的移动网络异常检测方法进行异常检测。
对CDR数据集内不同类型的活动数据采用基于特征提取的移动网络异常检测方法进行异常检测的具体操作为:
将原始蜂窝流量放入LSTM自编码器中提取流量特征,在特征空间中将离群点对应的网格标记为异常网格,然后对异常网格中的数据使用K-means聚类检测异常出现的具体时刻,最后剔除异常网格中异常时刻的数据。
步骤2)中,将各循环神经网络的输出结果进行归一化后再输入到注意力单元中。
步骤2)中,注意力单元对流量向量生成查询张量,对短消息发送量、短消息接受量、电话接听量及电话拨出量均生成键张量及值张量。
CDR数据集内存储有前168h的流量数据,利用前168h的流量数据预测未来24小时的流量数据。
本发明具有以下有益效果:
本发明所述的基于注意力机制的多数据集联合预测方法在具体操作时,利用循环神经网络预测不同活动数据,再引入注意力机制学习不同业务间的相关性,从而对不同活动数据的预测结果进行聚合,以提高未来时刻数据流量的预测准确性,有助于服务提供商来管理和控制网络以及优化网络资源分配。
附图说明
图1为LSTM自编码器的示意图;
图2为特征空间样本的分布图;
图3a为异常网格3667内的蜂窝流量分布图;
图3b为异常网格3983内的蜂窝流量分布图;
图3c为异常网格4181内的蜂窝流量分布图;
图3d为异常网格4621内的蜂窝流量分布图;
图4a为异常网格3667内流量异常检测结果图;
图4b为异常网格3983内流量异常检测结果图;
图4c为异常网格4181内流量异常检测结果图;
图4d为异常网格4621内流量异常检测结果图;
图5为预测模型的结构图;
图6为注意力机制内部的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,不是全部的实施例,而并非要限制本发明公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要的混淆本发明公开的概念。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
在附图中示出了根据本发明公开实施例的结构示意图。这些图并非是按比例绘制的,其中为了清楚表达的目的,放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
参考图1至图6,本发明所述的基于注意力机制的多数据集联合预测方法包括以下步骤:
1)对CDR数据集内不同类型的活动数据采用基于特征提取的移动网络异常检测方法进行异常检测,剔除异常的活动数据,再将各类型的活动数据分别放入相同结构的循环神经网络中;
2)将各循环神经网络的输出结果输入到注意力单元中,再将注意力单元的输出结果输入到用于流量数据预测的循环神经网络中;
3)将用于流量数据预测的循环神经网络的输出作为蜂窝流量的预测结果。
步骤1)中活动数据的类型包括互联网活动量、短消息发送量、短消息接收量、电话接听量及电话拨出量。
步骤1)之前还包括:根据城市基站分布,将所关注的城市区域划分为M×N的网格区域,其中,M及N均为正整数,使用pandas聚合每个网格区域的蜂窝流量值,得以小时为单位的蜂窝流量总值,然后将所检测时间段划分为K个时隙,形成一个高维的时间序列向量,将所述时间序列向量作为原始蜂窝流量向量,任意网格j中,原始蜂窝流量向量xj=[xj[1],xj[2]L xj[p]L xj[K]]T,xj[p]表示网格j在第p小时内的手机流量总值。
步骤2)中,对CDR数据集内不同类型的活动数据采用基于特征提取的移动网络异常检测方法进行异常检测。
对CDR数据集内不同类型的活动数据采用基于特征提取的移动网络异常检测方法进行异常检测的具体操作为:
将原始蜂窝流量放入LSTM自编码器中提取流量特征,在特征空间中将离群点对应的网格标记为异常网格,然后对异常网格中的数据使用K-means聚类检测异常出现的具体时刻,最后剔除异常网格中异常时刻的数据,参考表1。
表1
步骤2)中,将各循环神经网络的输出结果进行归一化后再输入到注意力单元中。
步骤2)中,注意力单元对流量向量生成查询张量,对短消息发送量、短消息接受量、电话接听量及电话拨出量均生成键张量及值张量。
CDR数据集内存储有前168h的流量数据,利用前168h的流量数据预测未来24小时的流量数据。
参考图1,编码部分每步输入24维流量向量,共输入28步,隐藏层设置为3层;编码所得流量特征为2维向量;将特征向量逐步输入解码器中,共输入28步,解码器隐藏层设置为3层,得重构数据;将输入自编码器的流量数据与自编码器输出的重构数据的均方误差作为优化目标训练LSTM自编码器,最后得到新空间的流量特征。

Claims (4)

1.一种基于注意力机制的多数据集联合预测方法,其特征在于,包括以下步骤:
1)对CDR数据集内不同类型的活动数据采用基于特征提取的移动网络异常检测方法进行异常检测,剔除异常的活动数据,再将各类型的活动数据分别放入相同结构的循环神经网络中;
2)将各循环神经网络的输出结果输入到注意力单元中,再将注意力单元的输出结果输入到用于流量数据预测的循环神经网络中;
3)将用于流量数据预测的循环神经网络的输出作为蜂窝流量的预测结果;
步骤1)中活动数据的类型包括互联网活动量、短消息发送量、短消息接收量、电话接听量及电话拨出量;
步骤1)之前还包括:根据城市基站分布,将所关注的城市区域划分为M×N的网格区域,其中,M及N均为正整数,使用pandas聚合每个网格区域的蜂窝流量值,得以小时为单位的蜂窝流量总值,然后将所检测时间段划分为K个时隙,形成一个高维的时间序列向量,将所述时间序列向量作为原始蜂窝流量向量,任意网格j中,原始蜂窝流量向量xj=[xj[1],xj[2]…xj[p]…xj[K]]T,xj[p]表示网格j在第p小时内的手机流量总值;
步骤2)中,对CDR数据集内不同类型的活动数据采用基于特征提取的移动网络异常检测方法进行异常检测;
对CDR数据集内不同类型的活动数据采用基于特征提取的移动网络异常检测方法进行异常检测的具体操作为:
将原始蜂窝流量放入LSTM自编码器中提取流量特征,在特征空间中将离群点对应的网格标记为异常网格,然后对异常网格中的数据使用K-means聚类检测异常出现的具体时刻,最后剔除异常网格中异常时刻的数据。
2.根据权利要求1所述的基于注意力机制的多数据集联合预测方法,其特征在于,步骤2)中,将各循环神经网络的输出结果进行归一化后再输入到注意力单元中。
3.根据权利要求1所述的基于注意力机制的多数据集联合预测方法,其特征在于,步骤2)中,注意力单元对流量向量生成查询张量,对短消息发送量、短消息接受量、电话接听量及电话拨出量均生成键张量及值张量。
4.根据权利要求1所述的基于注意力机制的多数据集联合预测方法,其特征在于,CDR数据集内存储有前168h的流量数据,利用前168h的流量数据预测未来24小时的流量数据。
CN202111155973.9A 2021-09-29 2021-09-29 一种基于注意力机制的多数据集联合预测方法 Active CN113762485B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111155973.9A CN113762485B (zh) 2021-09-29 2021-09-29 一种基于注意力机制的多数据集联合预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111155973.9A CN113762485B (zh) 2021-09-29 2021-09-29 一种基于注意力机制的多数据集联合预测方法

Publications (2)

Publication Number Publication Date
CN113762485A CN113762485A (zh) 2021-12-07
CN113762485B true CN113762485B (zh) 2024-04-02

Family

ID=78798330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111155973.9A Active CN113762485B (zh) 2021-09-29 2021-09-29 一种基于注意力机制的多数据集联合预测方法

Country Status (1)

Country Link
CN (1) CN113762485B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860785A (zh) * 2020-07-24 2020-10-30 中山大学 基于注意力机制循环神经网络的时间序列预测方法及系统
AU2020104133A4 (en) * 2020-12-16 2021-03-04 Anjanamma, Chappidi MRS Expected conditional clustered regressive deep multilayer precepted neural learning for iot based cellular network traffic prediction with big data
CN112532439A (zh) * 2020-11-24 2021-03-19 山东科技大学 一种基于注意力多组件时空跨域神经网络模型的网络流量预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860785A (zh) * 2020-07-24 2020-10-30 中山大学 基于注意力机制循环神经网络的时间序列预测方法及系统
CN112532439A (zh) * 2020-11-24 2021-03-19 山东科技大学 一种基于注意力多组件时空跨域神经网络模型的网络流量预测方法
AU2020104133A4 (en) * 2020-12-16 2021-03-04 Anjanamma, Chappidi MRS Expected conditional clustered regressive deep multilayer precepted neural learning for iot based cellular network traffic prediction with big data

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭佳 ; 余永斌 ; 杨晨阳 ; .基于全注意力机制的多步网络流量预测.信号处理.2019,(第05期),全文. *

Also Published As

Publication number Publication date
CN113762485A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
US10931700B2 (en) Method and system for anomaly detection and network deployment based on quantitative assessment
EP3644581B1 (en) Edge-cloud collaboration system for analyzing internet of things data and operating method thereof
CN111867049B (zh) 定位方法、装置及存储介质
CN110267292B (zh) 基于三维卷积神经网络的蜂窝网络流量预测方法
CN111405585B (zh) 一种基于卷积神经网络的邻区关系预测方法
CN113709779B (zh) 一种蜂窝网络故障诊断方法
CN113382477B (zh) 应用于无线网络用户间上行干扰建模的方法
CN110062410B (zh) 一种基于自适应谐振理论的小区中断检测定位方法
CN111294812A (zh) 一种资源扩容规划的方法及系统
CN108900980A (zh) 一种在异构网络中基于移动性预测的资源分配优化方法
CN113779247A (zh) 基于意图驱动的网络故障诊断方法及系统
CN117082547A (zh) 小区异常检测方法、装置、电子设备和可读存储介质
Ouyang et al. Application behaviors driven self-organizing network (SON) for 4G LTE networks
Nabi et al. Deep learning based fusion model for multivariate LTE traffic forecasting and optimized radio parameter estimation
Rajesh et al. Achieving QoS in GSM Network by Efficient Anomaly Mitigation and Data Prediction Model
Wang et al. Cellular traffic prediction using deep convolutional neural network with attention mechanism
Gao et al. A deep learning framework with spatial-temporal attention mechanism for cellular traffic prediction
He et al. Network traffic prediction method based on multi-channel spatial-temporal graph convolutional networks
CN113762485B (zh) 一种基于注意力机制的多数据集联合预测方法
Peng et al. Hmm-lstm for proactive traffic prediction in 6g wireless networks
Ma et al. Cellular traffic prediction via deep state space models with attention mechanism
CN112581177B (zh) 结合自动特征工程及残差神经网络的营销预测方法
CN113301585B (zh) 信息处理方法、装置、电子设备及存储介质
Zhang et al. Cellular QoE prediction for video service based on causal structure learning
CN113747441A (zh) 一种基于特征降维的移动网络流量异常检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant