CN115474219A - 基于多时间序列数据挖掘的5g/b5g电力通信网络流量分析方法 - Google Patents
基于多时间序列数据挖掘的5g/b5g电力通信网络流量分析方法 Download PDFInfo
- Publication number
- CN115474219A CN115474219A CN202210866043.2A CN202210866043A CN115474219A CN 115474219 A CN115474219 A CN 115474219A CN 202210866043 A CN202210866043 A CN 202210866043A CN 115474219 A CN115474219 A CN 115474219A
- Authority
- CN
- China
- Prior art keywords
- flow
- power communication
- communication network
- time
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/04—Arrangements for maintaining operational condition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
- H04L43/045—Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/06—Testing, supervising or monitoring using simulated traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Analysis (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- Physics & Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及一种基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,具体方法步骤包括:1)5G/B5G电力通信网流量特性分析2)建立5G/B5G电力通信网络流量模型,选择多时间序列数据挖掘方法进行流量模型建立,描述基于电力业务的5G/B5G通信网络的业务的真实情况。区别于传统意义上的电力通信流量分析,对5G/B5G电力通信流量层级进行了新的划分,采用多时间序列数据挖掘算法,对5G/B5G电力通信流量进行合理的统计描述,将多个流量特征时间序列作为一个整体进行分析,产生有效的异常网络流量特征关联规则,准确描述整个5G/B5G电力通信网络的安全状况,对电力通信故障预判、网络设计、流量控制、资源管理及网络设计都有十分重要的应用价值。
Description
技术领域
本发明属于电力通信领域,涉及电力通信网络流量分析技术,尤其是基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法。
背景技术
5G通信在4G通信的基础上发展出了更加繁杂多样的应用场景,增强型移动宽带场景要求极高的数据传输速率,海量机器类型通信场景要求密集的设备互联,低时延高可靠性通信场景要求极低的延迟和极高的可靠性。在智能通信网络中,大量的二次设备的接入、实时数据的更新需求,造成了5G电力通信网络流量的大量增加和复杂变化。如何规划电缆的配置、路由的选择、带宽的分配,如何较少突发情况造成的重大损失,如何有效提高网络运行的速度和利用率,5G电力通信网络流量分析和预测技术起到了关键作用。网络流量的在线实时监测流量走向,快速扫描全网、及时响应预警网络异常或者病毒发作,并为日常网络维护提供实时、精准的网络流量流向和流量成分的分析,为未来网络优化、网络调整、网络建设提供决策支持的数据依据。
5G/B5G电力通信网络流量预测对网络管理有重要的意义,5G/B5G电力通信网络流量的统计特征有自相似性、多分形性,以及周期性、混沌性等特点。针对5G/B5G电力通信网络的不同业务的流量特点和参数属性,建立合适的能够准确、有效地描述网络流量特性的流量模型,对QoS、网络性能管理等都有重要的意义和作用。
目前的5G/B5G电力通信网络并没有对网络流量进行实时监测,往往是当流量出现异常情况时,在网络管理系统发出警告通知后,由网络管理人员着手解决出现的问题。这是一种响应式的行为,即先有问题后处理的方式。这样的方式,很可能由于没有足够的时间来分析和处理,而影响网络的正常运行。如果能预测流量过载,在流量过载发生之前分析和解决问题,就能显著提高网络的可用性。
发明内容
本发明的目的在于克服现有技术的不足之处,提供一种对电力通信故障预判、网络设计、流量控制、资源管理及网络设计都有十分重要的意义的基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析与异常流量辨识方法。
本发明解决其技术问题是采取以下技术方案实现的:
基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,具体方法步骤如下:
1)5G/B5G电力通信网流量特性分析,包括确定性与混沌性分析、自相似性分析、多重分形性分析,并建立5G/B5G电力通信网流量分析层级:由三个层次组成,从下到上分别是数据包层、流量层及全网层,并对数据包层流量、流量层流量及全网层流量进行分析;
2)建立5G/B5G电力通信网络流量模型,基于上述步骤1)电力通信网流量特性分析,选择多时间序列数据挖掘方法进行流量的模型建立,描述基于电力业务的5G/B5G通信网络的业务的真实情况,具体方法步骤如下:
步骤一:计算在每个时间段上收集的5G/B5G电力通信流量级特征的熵,熵作为一种度量,用于度量捕获分布的分散度或集中度,各种各样的异常流量将影响IP特征之一的分布,如:
P(X=xi)是事件xi∈X发生的概率,即数据包数量除以给定时间间隔内的数据包总数为定义该数据包发生的概率,其中,每个5分钟的数据包由一组聚合特性进行汇总,在5G/B5G电力通信网络中,流量被正式定义为一个5元组,包括源地址、目的地址、源端口、目的端口和协议类型,获取6个字段,包括源地址或源IP,并表示为srcIP、目的地址或目的IP,表示为dstIP、源端口,表示为srcPort、目的端口,表示为dstPort、字节数和协议类型;
步骤二:将主成分分析和子空间方法应用于熵时间序列,采用主成分分析法将5G/B5G电力通信流量分离成正常流量和异常流量,子空间方法是分离正常和异常网络流量的一种有效方法,具体的,把5G/B5G流量数据点看成一个n维的云,第一个主成分PC1是变化最大的方向点,PC2是站在PC1正交方向上变化最大的方向点,当所有主要数据均被发现后上述过程结束,n指的是数据的维度,确保所有主要分量正交收敛,从而形成正交基,第一个数轴方向上的数据变化最大,而第二个轴上的数据变化小于第一个,其他分量也是如此,子空间方法使用上述主成分分析定义正常子空间和异常子空间,即用来区分正常5G通信流量和异常5G/B5G通信流量,对于某m,正常子空间是PC1到PCm所跨越的空间,异常子空间类似于PCm到PCm+1(m≤n)所跨越的空间;
步骤三:将时频分析方法、分段聚合近似和符号聚合近似应用于异常时间熵序列来定位5G/B5G电力通信异常流量,具体包括分段聚合近似、符号聚合近似及小波变换与小波包变换,并应用于Choi-Williams分布和伪Wigner-Ville分布;
步骤四:将关联规则挖掘应用于5G/B5G电力通信流量符号序列,I={i1,i2,...,ik}是一组集合,T={t1,ti+1,...,in}是一组交易,定义Sup(X)如下:
以最小的支持度和置信度找到所有X→Y的规则,支持度是一个交易包含X∪Y的概率,定义为Sup(X∪Y),置信度是交易包含X和Y的条件概率,表示为Sup(X∪Y)/Sup(X)。
而且,所述的数据包层流量分析中每个数据包包括时间戳、IP地址或前缀、端口号、协议类型、字节和内容,IP报头信息包括IP地址或协议的流量、数据包流的突发、数据包属性,TCP包头信息包括应用程序的流量细分、TCP拥塞和流量控制、每个会话的字节数和数据包数,应用头信息包括URL、HTTP头、DNS查询和响应。
而且,所述流量层流量分析中5G/B5G电力通信网流量的基本信息包括源IP地址、目的IP地址、端口号、报文和字节数、起始和结束时间。
而且,所述全网层流量分析中全网层流量分析结合了流量、拓扑和状态信息,全网层流量分析主要指流量矩阵分析。
而且,所述的分段聚合近似PAA是将时间序列表示为矩形基函数序列,一种降维表示方法,具体的,
而且,所述的符号聚合近似是将时间序列转换为离散的符号序列,在将时间序列数据转换为PAA之后,应用SAX来获得离散符号表示,由于归一化5G/B5G通信流量时间序列具有高斯分布,可以确定在高斯分布曲线下产生c个等大小区域的“断点”,一旦得到断点,就可以将时间序列离散化为符号序列,具体的,首先得到起源时间序列的PAA方式,小于最小断点的所有PAA系数转换为符号“a”,大于或等于最小断点但小于第二小断点的所有系数转换为符号“b”,即长度为N的子序列P可以表示为让αi表示字母表中的第i个元素,α1=a和α2=b,然后得到从PAA逼近Pappr到词的变换如下:
PAA表示只是获得SAX的中间步骤。
离散小波变换DW将离散时间信号转换为离散小波表示,离散小波变换将输入序列x0,x1,...xk转换为一个高通小波系数序列和一个低通小波系数序列,如(5)和(6)所示:
其中sk(z)和tk(z)是小波滤波器,m为滤波器长度,i=0,1,...[n/2]-1,
小波包变换WPT是一种对信号进行时频分解的方法,WPT具有信号自适应特性,应用于5G/B5G电力通信流量分析中,能有效地显示信号的时频特性,通过正交镜滤波器就可以得到WPT分解,假设信号y(t),得到
函数集{y(t)}称为小波包,它是对原始信号在不同尺度上的所有频带进行整体分解的结果,让k=n-2j,则是k波段在j尺度上分解的结果,WPT可以由多种正交基组成,小波基是典型的正交基,在所有组合中,最小熵是较好的基础,良好基的分解能很好地反映5G流量信号的时频特性,说明该方法对5G电力通信流量信号是自适应的。
而且,Choi-Williams分布是为了减少Chio-William分布的扰动分量,目的是获取使扰动值最小的因素,Choi-Williams是为了解决这个问题而提出的
Wigner-Ville分布C(t,f)满足边缘条件和位移特性,但不满足弱和有限的支持特性,当σ→∞时,满足弱且有限的支护特性。
而且,伪Wigner-Ville分布是在给定的时间内,Wigner-Ville分布可以描述5G/B5G电力通信流量信号的全局分布,此外,对于给定的频率,它还可以相等地测量高于或低于给定频率的所有频率,即在获取某一时刻t的分布形状时,主要获取其附近5G电力通信流量信号的特征,进而通过增加一些窗口和删除非局部分量来压缩多变量信号的跨项,最后将Wigner-Ville分布转化为局部分布,伪Wigner-Ville分布将信号的局部行为描述为如下公式,以便于挖掘5G/B5G电力通信中异常信号的局部特征,如
h(t)是窗口函数。
与一般的关联规则挖掘不同,时间序列关联规则挖掘主要关注数据点的时间。由于每一个特征元素在每一时刻都有不同的值,所以将关联规则挖掘应用于同一时间间隔内不同网络流量特征的不同值。不同时间序列在同一时间段的突变通常具有一定的基序关联模式。该规则为分析5G电力通信网络的异常流量奠定了基础。通过这种方法,可以获得5G电力通信网络中各种异常行为的不同主题模式,并可用于网络流量分析。
本发明的优点和积极效果是:
本发明设计科学合理,提供基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,区别于传统意义上的电力通信流量,对5G/B5G电力通信流量层级进行了新的划分,同时,采用多时间序列数据挖掘算法,对5G/B5G电力通信流量进行合理的统计描述,将多个流量特征时间序列作为一个整体进行分析,产生有效的异常网络流量特征关联规则,准确描述整个5G/B5G电力通信网络的安全状况,对电力通信故障预判、网络设计、流量控制、资源管理及网络设计都有十分重要的应用价值。
附图说明
图1为本发明流量模型建立流程图;
图2为本发明将PAA系数映射为SAX符号图;
图3为本发明多时间序列关联规则图;
图4为本发明将小波变换应用于时间熵序列图;
图5为本发明将Choi-Williams分布应用于时间熵序列图;
图6为本发明将伪Wigner-Ville分布应用于时间熵序列图。
具体实施方式
下面通过具体实施例对本发明作进一步详述,以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。
本发明提供基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,具体方法步骤如下:
1)5G/B5G电力通信网流量特性分析
确定性与混沌性分析:5G电力通信流量确定性强,表现为大量由时间驱动的状态监测与信息采集业务占流量的主要成分(遥信、遥测、分布式能源/储能站监测等),即业务的发送时间与流量大小取值固定。5G/B5G电力通信流量中除主要的确定性特征外,仍存在着无规律的流量行为,即混沌性流量。主要表现在传输时间与通信量大小的未知性上(但前后时刻上流量是明显相关的)。
自相似性分析:流量统计自相似性是指不同时间尺度上的流量有着相似的波动趋势,自相似性的发现使得诸如泊松过程和马尔科夫过程等短相关性流量模型不再能合理解释网络流量现象。
多重分形性分析:实际的网络流量不仅仅表现出自相似的单分形特性,而是一个复杂分形过程,即多重分形特性。多重分形过程可以准确的表述小时间尺度上的流量突发特征,5G电力通信流中的多重分形特性可以用来描述不同业务流量呈现出的复杂多重自相似性。
5G/B5G电力通信网流量分析层级:由三个层次组成,从下到上分别是数据包层、流量层、全网层。
数据包层流量分析:每个数据包包括时间戳、IP地址或前缀、端口号、协议类型、字节和内容。IP报头信息包括IP地址或协议的流量、数据包流的突发、数据包属性。TCP包头信息包括应用程序的流量细分、TCP拥塞和流量控制、每个会话的字节数和数据包数。应用头信息包括URL、HTTP头、DNS查询和响应等。
流量层流量分析:5G电力通信网流量的基本信息包括源IP地址、目的IP地址、端口号、报文和字节数、起始和结束时间等。
全网层流量分析:全网层流量分析结合了流量、拓扑和状态信息。全网层流量分析在本文中主要指流量矩阵分析。
2)建立5G电力通信网络流量模型
如图1所示,基于上述步骤1)电力通信网流量特性分析,选择多时间序列数据挖掘方法进行流量的模型建立,描述基于电力业务的5G/B5G通信网络的业务的真实情况。
具体实施方法过程步骤如下:
步骤一:计算在每个时间段上收集的5G/B5G电力通信流量级特征的熵。
每个5分钟的数据包由一组聚合特性进行汇总。在5G电力通信网络中,流量被正式定义为一个5元组:源地址、目的地址、源端口、目的端口和协议类型。我们关注6个字段:源地址(有时称为源IP,并表示为srcIP)、目的地址(或目的IP,表示为dstIP)、源端口(srcPort)、目的端口(dstPort)、字节数和协议类型。
熵是一种度量,它捕获了分布的分散度或集中度。各种各样的异常流量将影响所讨论的IP特征之一的分布,如:
P(X=xi)是事件xi∈X发生的概率,例如,看到IP 129.173.192.0的概率被定义为使用IP 129.173.192.0的数据包数量除以给定时间间隔内的数据包总数。
步骤二:将主成分分析和子空间方法应用于熵时间序列。
子空间方法是分离正常和异常网络流量的一种有效方法,主成分分析(PCA)是发挥这一功能的主要方法。因此采用主成分分析法将5G电力通信流量分离成正常流量和异常流量。
我们把5G流量数据点看成一个n维的云,第一个主成分PC1是变化最大的方向点。PC2是站在PC1正交方向上变化最大的方向点。这个过程直到所有主要数据都被发现才结束,n指的是数据的维度。确保所有主要分量正交收敛,从而形成正交基。第一个数轴方向上的数据变化最大,而第二个轴上的数据变化小于第一个,其他分量也是如此。
子空间方法使用上述主成分分析定义正常子空间和异常子空间,即用来区分正常5G通信流量和异常5G通信流量。对于某m,正常子空间是PC1到PCm所跨越的空间,异常子空间类似于PCm到PCm+1(m≤n)所跨越的空间。
步骤三:将时频分析方法、分段聚合近似和符号聚合近似应用于异常时间熵序列来定位5G电力通信异常流量。
(1)分段聚合近似:分段聚合近似(PAA)的基本思想是将时间序列表示为矩形基函数序列。它本质上是一种降维表示方法
(2)符号聚合近似:符号聚合近似的基本思想是,它将时间序列转换为离散的符号序列。在将时间序列数据转换为PAA之后,我们可以应用SAX来获得离散符号表示。由于归一化5G通信流量时间序列具有高斯分布,我们可以确定在高斯分布曲线下产生c个等大小区域的“断点”。一旦得到断点,我们就可以将时间序列离散化为符号序列。我们首先得到了起源时间序列的PAA方式。小于最小断点的所有PAA系数转换为符号“a”,大于或等于最小断点但小于第二小断点的所有系数转换为符号“b”等等,如图2所示。“a”、“b”和“c”这3个符号的概率近似相等。
PAA表示只是获得SAX的中间步骤。
离散小波变换(DWT)的基本思想是将离散时间信号转换为离散小波表示。离散小波变换将输入序列x0,x1,...xk转换为一个高通小波系数序列和一个低通小波系数序列(每个长度为2n),如(5)和(6)所示:
其中sk(z)和tk(z)是小波滤波器,m为滤波器长度,i=0,1,...[n/2]-1。
小波包变换(WPT)是一种对信号进行时频分解的方法。WPT具有信号自适应特性,应用于5G电力通信流量分析中,能有效地显示信号的时频特性。通过正交镜滤波器就可以得到WPT分解。假设信号y(t),我们可以得到
函数集{y(t)}称为小波包,它是对原始信号在不同尺度上的所有频带进行整体分解的结果。让k=n-2j,则是k波段在j尺度上分解的结果,WPT可以由多种正交基组成,小波基是典型的正交基。在所有组合中,最小熵是较好的基础。良好基的分解能很好地反映5G流量信号的时频特性,说明该方法对5G电力通信流量信号是自适应的。
(4)Choi-Williams分布:为了减少Chio-William分布的扰动分量,我们应该研究使扰动值最小的因素。Choi-Williams是为了解决这个问题而提出的
Wigner-Ville分布C(t,f)满足边缘条件和位移特性,但不满足弱和有限的支持特性。当σ→∞时,满足弱且有限的支护特性。
(5)伪Wigner-Ville分布:在给定的时间内,Wigner-Ville分布可以描述5G电力通信流量信号的全局分布。此外,对于给定的频率,它还可以相等地测量高于或低于给定频率的所有频率。
事实上,我们不能研究-∞和+∞之间的所有积分,只能研究有限范围内的积分。在研究某一时刻(t)的分布形状时,我们应该研究该时刻附近5G电力通信流量信号的特征。从某种意义上说,它是通过增加一些窗口和删除非局部分量来压缩多变量信号的跨项。最后将Wigner-Ville分布转化为局部分布。伪Wigner-Ville分布将信号的局部行为描述为如下公式,便于挖掘5G电力通信中异常信号的局部特征,如
h(t)是窗口函数。
步骤四:将关联规则挖掘应用于5G电力通信流量符号序列。
I={i1,i2,...,ik}是一组集合,T={t1,ti+1,...,in}是一组交易,定义Sup(X)如下:
我们以最小的支持度和置信度找到所有X→Y的规则。支持度是一个交易包含X∪Y的概率,定义为Sup(X∪Y),置信度是交易包含X和Y的条件概率,表示为Sup(X∪Y)/Sup(X)。与一般的关联规则挖掘不同,时间序列关联规则挖掘主要关注数据点的时间,如图3所示,为本发明多时间序列关联规则图。
由于每一个特征元素在每一时刻都有不同的值,所以我们将关联规则挖掘应用于同一时间间隔内不同网络流量特征的不同值。不同时间序列在同一时间段的突变通常具有一定的基序关联模式。该规则为我们分析5G电力通信网络的异常流量奠定了基础。通过这种方法,可以获得5G电力通信网络中各种异常行为的不同主题模式,并可用于网络流量分析。
为了分析5G电力通信网络流量并定位异常,我们将小波包变换、Choi-Williams分布和伪Wigner-Ville分布方法应用于异常熵时间序列的仿真结果如图4、图5、图6所示。
尽管为说明目的公开了本发明的实施例,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换、变化和修改都是可能的,因此,本发明的范围不局限于实施例所公开的内容。
Claims (9)
1.基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,其特征在于:具体方法步骤如下:
1)5G/B5G电力通信网流量特性分析,包括确定性与混沌性分析、自相似性分析、多重分形性分析,并建立5G/B5G电力通信网流量分析层级:由三个层次组成,从下到上分别是数据包层、流量层及全网层,并对数据包层流量、流量层流量及全网层流量进行分析;
2)建立5G/B5G电力通信网络流量模型,基于上述步骤1)电力通信网流量特性分析,选择多时间序列数据挖掘方法进行流量的模型建立,描述基于电力业务的5G/B5G通信网络的业务的真实情况,具体方法步骤如下:
步骤一:计算在每个时间段上收集的5G/B5G电力通信流量级特征的熵,熵作为一种度量,用于度量捕获分布的分散度或集中度,各种各样的异常流量将影响IP特征之一的分布,如:
P(X=xi)是事件xi∈X发生的概率,即数据包数量除以给定时间间隔内的数据包总数为定义该数据包发生的概率,其中,每个5分钟的数据包由一组聚合特性进行汇总,在5G/B5G电力通信网络中,流量被正式定义为一个5元组,包括源地址、目的地址、源端口、目的端口和协议类型,获取6个字段,包括源地址或源IP,并表示为srcIP、目的地址或目的IP,表示为dstIP、源端口,表示为srcPort、目的端口,表示为dstPort、字节数和协议类型;
步骤二:将主成分分析和子空间方法应用于熵时间序列,采用主成分分析法将5G/B5G电力通信流量分离成正常流量和异常流量,子空间方法是分离正常和异常网络流量的一种有效方法,具体的,把5G/B5G流量数据点看成一个n维的云,第一个主成分PC1是变化最大的方向点,PC2是站在PC1正交方向上变化最大的方向点,当所有主要数据均被发现后上述过程结束,n指的是数据的维度,确保所有主要分量正交收敛,从而形成正交基,第一个数轴方向上的数据变化最大,而第二个轴上的数据变化小于第一个,其他分量也是如此,子空间方法使用上述主成分分析定义正常子空间和异常子空间,即用来区分正常5G通信流量和异常5G/B5G通信流量,对于某m,正常子空间是PC1到PCm所跨越的空间,异常子空间类似于PCm到PCm+1(m≤n)所跨越的空间;
步骤三:将时频分析方法、分段聚合近似和符号聚合近似应用于异常时间熵序列来定位5G/B5G电力通信异常流量,具体包括分段聚合近似、符号聚合近似及小波变换与小波包变换,并应用于Choi-Williams分布和伪Wigner-Ville分布;
步骤四:将关联规则挖掘应用于5G/B5G电力通信流量符号序列,I={i1,i2,...,ik}是一组集合,T={t1,ti+1,...,in}是一组交易,定义Sup(X)如下:
以最小的支持度和置信度找到所有X→Y的规则,支持度是一个交易包含X∪Y的概率,定义为Sup(X∪Y),置信度是交易包含X和Y的条件概率,表示为Sup(X∪Y)/Sup(X)。
2.根据权利要求1所述的基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,其特征在于:所述的数据包层流量分析中每个数据包包括时间戳、IP地址或前缀、端口号、协议类型、字节和内容,IP报头信息包括IP地址或协议的流量、数据包流的突发、数据包属性,TCP包头信息包括应用程序的流量细分、TCP拥塞和流量控制、每个会话的字节数和数据包数,应用头信息包括URL、HTTP头、DNS查询和响应。
3.根据权利要求1所述的基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,其特征在于:所述流量层流量分析中5G/B5G电力通信网流量的基本信息包括源IP地址、目的IP地址、端口号、报文和字节数、起始和结束时间。
4.根据权利要求1所述的基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,其特征在于:所述全网层流量分析中全网层流量分析结合了流量、拓扑和状态信息,全网层流量分析主要指流量矩阵分析。
6.根据权利要求1所述的基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,其特征在于:所述的符号聚合近似是将时间序列转换为离散的符号序列,在将时间序列数据转换为PAA之后,应用SAX来获得离散符号表示,由于归一化5G/B5G通信流量时间序列具有高斯分布,可以确定在高斯分布曲线下产生c个等大小区域的“断点”,一旦得到断点,就可以将时间序列离散化为符号序列,具体的,首先得到起源时间序列的PAA方式,小于最小断点的所有PAA系数转换为符号“a”,大于或等于最小断点但小于第二小断点的所有系数转换为符号“b”,即长度为N的子序列P可以表示为让αi表示字母表中的第i个元素,α1=a和α2=b,然后得到从PAA逼近Pappr到词的变换如下:
PAA表示只是获得SAX的中间步骤。
7.根据权利要求1所述的基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,其特征在于:所述的小波变换与小波包变换是指采用小波变换定位5G/B5G通信网络流量的异常,假设x(t)∈L2(R),ψ(t)是基本小波函数,是基本小波函数的位移和尺度扩展,如
离散小波变换DW将离散时间信号转换为离散小波表示,离散小波变换将输入序列x0,x1,...xk转换为一个高通小波系数序列和一个低通小波系数序列,如(5)和(6)所示:
其中sk(z)和tk(z)是小波滤波器,m为滤波器长度,i=0,1,...[n/2]-1,
小波包变换WPT是一种对信号进行时频分解的方法,WPT具有信号自适应特性,应用于5G/B5G电力通信流量分析中,能有效地显示信号的时频特性,通过正交镜滤波器就可以得到WPT分解,假设信号y(t),得到
9.根据权利要求1所述的基于多时间序列数据挖掘的5G/B5G电力通信网络流量分析方法,其特征在于:伪Wigner-Ville分布是在给定的时间内,Wigner-Ville分布可以描述5G/B5G电力通信流量信号的全局分布,此外,对于给定的频率,它还可以相等地测量高于或低于给定频率的所有频率,即在获取某一时刻t的分布形状时,主要获取其附近5G电力通信流量信号的特征,进而通过增加一些窗口和删除非局部分量来压缩多变量信号的跨项,最后将Wigner-Ville分布转化为局部分布,伪Wigner-Ville分布将信号的局部行为描述为如下公式,以便于挖掘5G/B5G电力通信中异常信号的局部特征,如
h(t)是窗口函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210866043.2A CN115474219A (zh) | 2022-07-22 | 2022-07-22 | 基于多时间序列数据挖掘的5g/b5g电力通信网络流量分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210866043.2A CN115474219A (zh) | 2022-07-22 | 2022-07-22 | 基于多时间序列数据挖掘的5g/b5g电力通信网络流量分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115474219A true CN115474219A (zh) | 2022-12-13 |
Family
ID=84366121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210866043.2A Pending CN115474219A (zh) | 2022-07-22 | 2022-07-22 | 基于多时间序列数据挖掘的5g/b5g电力通信网络流量分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115474219A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117424753A (zh) * | 2023-12-15 | 2024-01-19 | 广东云百科技有限公司 | 基于物联网的流量池监控方法及系统 |
-
2022
- 2022-07-22 CN CN202210866043.2A patent/CN115474219A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117424753A (zh) * | 2023-12-15 | 2024-01-19 | 广东云百科技有限公司 | 基于物联网的流量池监控方法及系统 |
CN117424753B (zh) * | 2023-12-15 | 2024-02-27 | 广东云百科技有限公司 | 基于物联网的流量池监控方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10375090B2 (en) | Machine learning-based traffic classification using compressed network telemetry data | |
EP4277207A2 (en) | Network telemetry collection with packet metadata filtering | |
CN111541661A (zh) | 基于因果知识的电力信息网络攻击场景重构方法及系统 | |
CN109873726B (zh) | Sdn中基于深度学习的鲁棒服务质量预测与保障方法 | |
US7903657B2 (en) | Method for classifying applications and detecting network abnormality by statistical information of packets and apparatus therefor | |
CN114630352B (zh) | 一种接入设备的故障监测方法和装置 | |
CN112788062B (zh) | SDN中基于ET-EDR的LDoS攻击检测与缓解方法 | |
US12120002B2 (en) | Method and apparatus for detecting anomaly of traffic of internet of things device based on automata | |
WO2012000540A1 (en) | Method and apparatus for analysis of the operation of a communication system using events | |
CN112235288A (zh) | 一种基于gan的ndn网络入侵检测方法 | |
CN115474219A (zh) | 基于多时间序列数据挖掘的5g/b5g电力通信网络流量分析方法 | |
CN108023895B (zh) | 海量数据定向分类传输方法及系统 | |
US8826296B2 (en) | Method of supervising a plurality of units in a communications network | |
Pham et al. | Lightweight Convolutional Neural Network Based Intrusion Detection System. | |
Nougnanke et al. | Low-overhead near-real-time flow statistics collection in SDN | |
CN113727092B (zh) | 基于决策树的视频监控质量巡检方法及装置 | |
CN112583808B (zh) | 针对物联网设备的异常流量检测方法 | |
Burgetová et al. | Anomaly detection of ICS communication using statistical models | |
Portela et al. | T-For: An Adaptable Forecasting Model for Throughput Performance | |
CN114785617A (zh) | 一种5g网络应用层异常检测方法及系统 | |
Ehrlich et al. | Passive flow monitoring of hybrid network connections regarding quality of service parameters for the industrial automation | |
CN111614611A (zh) | 一种用于电网嵌入式终端的网络安全审计方法及装置 | |
Wang et al. | Generalized Network Temperature for DDoS Detection through Rényi Entropy | |
CN113395579B (zh) | 一种音频处理方法及视频通信系统 | |
KR102582663B1 (ko) | 네트워크 관리 방법 및 네트워크 관리 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |