CN117411811B - 一种电力通信设备的故障智能监测方法 - Google Patents
一种电力通信设备的故障智能监测方法 Download PDFInfo
- Publication number
- CN117411811B CN117411811B CN202311722851.2A CN202311722851A CN117411811B CN 117411811 B CN117411811 B CN 117411811B CN 202311722851 A CN202311722851 A CN 202311722851A CN 117411811 B CN117411811 B CN 117411811B
- Authority
- CN
- China
- Prior art keywords
- value
- frequency value
- isolated
- frequency
- sample point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000004891 communication Methods 0.000 title claims abstract description 36
- 238000012544 monitoring process Methods 0.000 title claims abstract description 27
- 230000002159 abnormal effect Effects 0.000 claims abstract description 75
- 230000005856 abnormality Effects 0.000 claims description 11
- 239000006185 dispersion Substances 0.000 claims description 9
- 230000008569 process Effects 0.000 description 16
- 238000010276 construction Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/16—Threshold monitoring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/55—Prevention, detection or correction of errors
- H04L49/555—Error detection
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Mining & Analysis (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及电力通信设备故障监测技术领域,具体涉及一种电力通信设备的故障智能监测方法。方法包括:获取交换机当前时间段对应的网络流量数据序列;基于网络流量数据序列中每种网络流量数据对应的频率值构建频率值序列;根据频率值序列中频率值的波动情况,确定疑似异常频率值;根据频率值序列中每个频率值与疑似异常频率值之间的差异,获得上限阈值和下限阈值,进而构建孤立森林;根据孤立森林中每个样本点在每棵孤立树中的路径长度和每棵孤立树中所有数据的离散程度,得到每个样本点的路径长度加权平均值,进而获得每个样本点的异常得分值;基于异常得分值判断交换机是否出现故障。本发明提高了待监测交换机故障监测结果的准确度。
Description
技术领域
本发明涉及电力通信设备故障监测技术领域,具体涉及一种电力通信设备的故障智能监测方法。
背景技术
在通信网络更加复杂化的同时,通信网络所面临的危险也更加严峻,容易遭到网络攻击。当前网络防御是保证电网以及通信网络安全运行的关键。交换机是电力通信设备中较重要的一个设备。流量异常检测作为网络内防的重要手段,能够及时发现网络中的异常流量并采取相应措施,阻断攻击的进程,对网络的安全运行有着十分重要的意义。交换机是电力通信设备中比较重要的一个设备,它主要实现局域网内的数据包交换和传输。因此对交换机的网络流量进行异常检测可以及时发现电力通信中存在的隐患。
在使用孤立森林方法对交换机的网络流量进行异常数据检测时,孤立树的深度通常是人为设置的。由于交换机网络流量数据中的异常数据较少,如果子树的深度设置不准确,可能导致某些子集被过度抽样,而其他子集则被抽样不足,这会使模型产生过拟合或者欠拟合的情况,进而影响模型的预测能力和稳定性,导致电力通信设备的故障监测结果的可信度较低。
发明内容
为了解决现有方法在对电力通信设备的故障监测时存在的监测结果可信度的问题,本发明的目的在于提供一种电力通信设备的故障智能监测方法,所采用的技术方案具体如下:
本发明提供了一种电力通信设备的故障智能监测方法,该方法包括以下步骤:
获取待监测交换机当前时间段对应的网络流量数据序列;
基于所述网络流量数据序列中每种网络流量数据对应的频率值构建频率值序列;根据所述频率值序列中频率值的波动情况,确定疑似异常频率值;根据频率值序列中每个频率值与所述疑似异常频率值之间的差异,获得上限阈值和下限阈值;基于所述上限阈值、所述下限阈值和所述网络流量数据序列构建孤立森林;
根据所述孤立森林中每个样本点在每棵孤立树中的路径长度以及每棵孤立树中所有数据的离散程度,得到所述孤立森林中每个样本点的路径长度加权平均值;基于所述路径长度加权平均值获得每个样本点的异常得分值;
基于所述异常得分值,判断待监测交换机是否出现故障。
优选的,所述根据所述频率值序列中频率值的波动情况,确定疑似异常频率值,包括:
将所述频率值序列中除第一个频率值和最后一个频率值外的其他所有频率值记为待分析频率值;
根据每个待分析频率值与其相邻频率值之间的差异,得到每个待分析频率值对应的异常指标;
将异常指标最大的待分析频率值确定为疑似异常频率值。
优选的,根据每个待分析频率值与其相邻频率值之间的差异,得到每个待分析频率值对应的异常指标,包括:
对于所述频率值序列中的第i个待分析频率值:
将第i个待分析频率值左侧与其相邻的频率值和第i个待分析频率值之间的比值,记为第一比值;将第i个待分析频率值与其右侧相邻的频率值之间的比值,记为第二比值;
将所述第一比值与所述第二比值之间的差值绝对值,确定为第i个待分析频率值对应的异常指标。
优选的,所述根据频率值序列中每个频率值与所述疑似异常频率值之间的差异,获得上限阈值和下限阈值,包括:
将频率值序列中的最小频率值作为特征频率区间的下限值,将所述疑似异常频率值作为特征频率区间的上限值,基于所述下限值和所述上限值获得特征频率区间;
计算所述特征频率区间内所有频率值对应的所有网络流量数据的平均值;
根据所述特征频率区间内每个频率值对应的所有网络流量数据与所述平均值之间的差异,确定上限阈值和下限阈值。
优选的,根据所述特征频率区间内每个频率值对应的所有网络流量数据与所述平均值之间的差异,确定上限阈值和下限阈值,包括:
将所述特征频率区间内小于所述平均值的频率值记为第一频率值,分别将每个第一频率值与所述平均值之间的差值记为每个第一频率值对应的第一差异值,将最大的第一差异值对应的第一频率值确定为下限阈值;
将所述特征频率区间内大于所述平均值的频率值记为第二频率值,分别将每个第二频率值与所述平均值之间的差值记为每个第二频率值对应的第二差异值,将最大的第二差异值对应的第二频率值确定为上限阈值。
优选的,所述基于所述上限阈值、所述下限阈值和所述网络流量数据序列构建孤立森林,包括:
对于孤立森林中孤立树的第k个叶子节点;
分别获取第k个叶子节点对应的所有网络流量数据中的最大值和最小值;
将第k个叶子节点对应的所有网络流量数据中的最小值与所述下限阈值的差值,记为第k个叶子节点的第一特征值;将第k个叶子节点对应的所有网络流量数据中的最大值与所述上限阈值的差值,记为第k个叶子节点的第二特征值;
判断所述第一特征值是否大于0且所述第二特征值是否小于0,若均是,则第k个叶子节点停止向下分裂;若存在不是,则第k个叶子节点继续向下分裂,直至对应的第一特征值大于0且对应的第二特征值小于0,获得孤立森林。
优选的,所述根据所述孤立森林中每个样本点在每棵孤立树中的路径长度以及每棵孤立树中所有数据的离散程度,得到所述孤立森林中每个样本点的路径长度加权平均值,包括:
对于所述孤立森林中第j个样本点:
将孤立森林中包含第j个样本点的第r棵孤立树中第j个样本点的路径长度与第r棵孤立树的总深度的比值,记为第j个样本点在包含其的第r棵孤立树中的路径长度占比;
分别将孤立森林中每棵孤立树中数据的均方差记为每棵孤立树的参考值,计算所有孤立树的参考值的和值;将孤立森林中包含第j个样本点的第r棵孤立树的参考值与所述和值的比值,记为第j个样本点在包含其的第r棵孤立树中的波动占比;
根据第j个样本点在包含其的所有孤立树中的路径长度占比和波动占比,获得所述孤立森林中第j个样本点的路径长度加权平均值。
优选的,采用如下公式计算所述孤立森林中第j个样本点的路径长度加权平均值:
;
其中,表示所述孤立森林中第j个样本点的路径长度加权平均值,R表示孤立森林中包含第j个样本点的孤立树的数量,/>表示孤立森林中包含第j个样本点的第r棵孤立树的总深度,/>表示孤立森林中包含第j个样本点的第r棵孤立树中第j个样本点的路径长度,/>表示孤立森林中包含第j个样本点的第r棵孤立树中所有数据的均方差,M表示孤立森林中孤立树的数量,/>表示孤立森林中第m棵孤立树中数据的均方差。
优选的,所述基于所述异常得分值,判断待监测交换机是否出现故障,包括:
将异常得分值大于预设异常得分阈值的样本点作为异常样本点;
判断异常样本点的总数量是否大于预设数量阈值,若大于,则判定待监测交换机出现故障;若小于或等于,则判定待监测交换机未出现故障。
优选的,所述获取待监测交换机当前时间段对应的网络流量数据序列,包括:
获取待监测交换机当前时间段内每个采集时刻的网络流量数据;
按照时间先后顺序,将当前时间段内所有采集时刻的网络流量数据构成的序列,记为待监测交换机当前时间段对应的网络流量数据序列。
本发明至少具有如下有益效果:
本发明考虑到传统的孤立森林构建过程中每棵孤立树的深度是根据经验提前设置的,但是在孤立森林的实际构建过程中,如果样本集中的异常数据早早的被分裂出来并且没有达到预设的深度值,那么孤立树会继续分裂,不仅会导致计算量增加,还会导致模型产生过拟合的情况。本发明基于待监测交换机当前时间段对应的网络流量数据序列中网络流量数据对应的频率值,确定了上限阈值和下限阈值,进而结合上限阈值和下限阈值进行孤立森林的构建,使得孤立森林中孤立树在构建的过程中达到了深度自适应的效果。考虑到构建完成的孤立森林中存在由于样本集的离散度较小导致正常样本点的路径长度也较小的情况,本发明根据孤立森林中每个样本点在每棵孤立树中的路径长度以及每棵孤立树中所有数据的离散程度,确定了每个样本点的路径长度加权平均值,进而获得了每个样本点的异常得分值,提高了异常得分值的获取精度,基于异常得分值对待监测交换机是否出现故障进行了判断,本发明提供的方法在孤立森林构建过程中能够动态调整孤立树的深度值,减小计算复杂性,减小模型过拟合的情况发生,在样本点异常得分值的获取过程中,基于样本点在孤立树中的路径长度以及孤立树中所有数据的离散程度,确定了准确的路径长度加权平均值,保证了后续分析结果的准确性,提高了待监测交换机故障监测结果的准确度与可信度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明实施例所提供的一种电力通信设备的故障智能监测方法的流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种电力通信设备的故障智能监测方法进行详细说明如下。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种电力通信设备的故障智能监测方法的具体方案。
一种电力通信设备的故障智能监测方法实施例:
本实施例所针对的具体场景为:电力通信设备的故障检测智能监测过程中,交换机是电力通信设备中的一个重要设备,它主要实现局域网内的数据包交换和传输。因此对交换机的网络流量进行异常检测可以及时发现电力通信存在的隐患,本实施例将获取待监测交换机当前时间段内的网络流量数据,对获取到的网络流量数据进行分析,判断待监测交换机是否存在异常,若出现异常,则及时进行预警。
本实施例提出了一种电力通信设备的故障智能监测方法,如图1所示,本实施例的一种电力通信设备的故障智能监测方法包括以下步骤:
步骤S1,获取待监测交换机当前时间段对应的网络流量数据序列。
电力通信设备是一种专门用于在电力系统中传输和处理数据的设备,这些设备的主要目的是实现电力系统的自动化、远程监控和信息传输等功能。其中电力通信设备包含路由器、交换机、无线通信设备等。通过分析这些数据可以了解到设备的运行状态,并且通过分析其中的异常数据可以在后续设备运行过程中及时发布相关预警信息。本实施例将采集当前时间段内待监测交换机的网络流量数据,由于一天中待监测交换机的工作强度不同,因此当前时间段内交换机网络流量数据中不仅包含较高网络流量的数据和较低网络流量的数据,也包含由于受到攻击从而流量激增或者通信受阻等异常的数据。因此本实施例将根据网络流量数据的直方图分布来确定一个上限阈值和一个下限阈值,使尽可能多的正常网络流量数据包含在阈值范围内,然后在构建子孤立树的过程中计算每一个叶子节点的网络流量数据特征值,根据上限阈值和下限阈值来动态调整叶子节点是否继续向下进行分裂,从而动态调整子树的深度。
本实施例首先采集当前时间段内每个采集时刻待监测交换机的网络流量数据,当前时间段为与当前时刻的时间间隔小于或等于预设时长的所有历史时刻以及当前时刻构成的集合,本实施例中的预设时长为1个月,因此本实施例中的当前时间段为最近一个月,在具体应用中,实施者可根据具体情况进行设置;本实施例中每一秒采集一次网络流量数据,在具体应用中,实施者可根据具体情况设置网络流量数据的采集频率。
至此,本实施例获得了待监测交换机当前时间段内每个采集时刻的网络流量数据。
步骤S2,基于所述网络流量数据序列中每种网络流量数据对应的频率值构建频率值序列;根据所述频率值序列中频率值的波动情况,确定疑似异常频率值;根据频率值序列中每个频率值与所述疑似异常频率值之间的差异,获得上限阈值和下限阈值;基于所述上限阈值、所述下限阈值和所述网络流量数据序列构建孤立森林。
交换机在受到攻击或者特定源和目标地址之间的通讯受阻等原因的干扰时,会导致网络流量数据中出现明显高于正常网络流量或者明显低于正常网络流量的数据,且由于工作程度的不同,采集到的网络流量数据中通常也会存在较大或者较小的网络流量数据。因此需要计算出一个上限阈值和下限阈值使尽可能多的正常数据落入上下限阈值区间内。
统计当前时间段内每种网络流量数据对应的频率值,根据当前时间段内每种网络流量数据对应的频率值,可以绘制对应的直方图,其中横轴表示网络流量数据值,纵轴表示网络流量数据出现的频率值。需要说明的是:本实施例将相同的网络流量数据作为同一种网络流量数据。由于通常情况下数据集中包含的异常数据比正常数据少,且正常数据的离散程度通常较低,因此直方图中峰值最高的部分是正常数据所在的区域;异常数据是较少的,所以其对应的频率值较小。基于此,直方图中峰值越平缓的部分是异常数据的可能性越高,也即频率值越大的网络流量数据为异常数据的可能性越小,频率值越小的网络流量数据为异常数据的可能性越大。因此,本实施例将根据所述网络流量数据序列中网络流量数据的波动情况以及每个网络流量数据对应的频率值,确定上限阈值和下限阈值。
具体地,将所述频率值序列中除第一个频率值和最后一个频率值外的其他所有频率值记为待分析频率值;根据每个待分析频率值与其相邻频率值之间的差异,得到每个待分析频率值对应的异常指标;将异常指标最大的待分析频率值确定为疑似异常频率值。
接下来本实施例将根据每个待分析频率值与其相邻频率值之间的差异,得到每个待分析频率值对应的异常指标。
对于所述频率值序列中的第i个待分析频率值:
将第i个待分析频率值左侧与其相邻的频率值和第i个待分析频率值之间的比值,记为第一比值;将第i个待分析频率值与其右侧相邻的网络流量数据之间的比值,记为第二比值;将第i个待分析频率值与其右侧相邻的频率值之间的比值,记为第二比值;第一比值越大,说明第i个频率值相比其左侧相邻的频率值变化幅度越大;第二比值越小,说明第i个待分析频率值相比其右侧相邻的频率值变化幅度越小。将所述第一比值与所述第二比值之间的差值绝对值,确定为第i个待分析频率值对应的异常指标。因为异常数据的频率值相对较小,如果第i个频率值相比其左侧相邻频率值的变化幅度较大,相比其右侧相邻频率值的变化幅度也较大,说明第i个待分析频率值是正常数据对应的频率值的可能性越大。如果第i个频率值相比其左侧相邻频率值的变化幅度较大,相比其右侧相邻频率值的变化幅度较小,说明第i个待分析频率值是异常数据对应的频率值的可能性越大。异常指标的最大值就表示对应频率值相比其左侧相邻频率值幅度发生了突变,但相比起右侧相邻频率值变化程度较小。基于此,本实施例将频率值序列中的最小频率值作为特征频率区间的下限值,将所述疑似异常频率值作为特征频率区间的上限值,基于所述下限值和所述上限值获得特征频率区间,也即将频率值序列中的最小频率值作为了特征频率区间的最小值,将疑似异常频率值作为了特征频率区间的最大值,获得了特征频率区间。计算所述特征频率区间内所有频率值对应的所有网络流量数据的平均值;将所述特征频率区间内小于所述平均值的频率值记为第一频率值,分别将每个第一频率值与所述平均值之间的差值记为每个第一频率值对应的第一差异值,将最大的第一差异值对应的第一频率值确定为下限阈值;将所述特征频率区间内大于所述平均值的频率值记为第二频率值,分别将每个第二频率值与所述平均值之间的差值记为每个第二频率值对应的第二差异值,将最大的第二差异值对应的第二频率值确定为上限阈值。
本实施例获得的上限阈值和下限阈值将对孤立森林中孤立树构建过程中的每一个叶子节点是否继续向下分裂进行动态调整,达到自适应深度的效果。
对于孤立树构建过程中的第k个叶子节点:
获取第k个叶子节点对应的所有网络流量数据中的最大值和第k个叶子节点对应的所有网络流量数据中的最小值。将第k个叶子节点对应的所有网络流量数据中的最小值与所述下限阈值的差值,记为第k个叶子节点的第一特征值;将第k个叶子节点对应的所有网络流量数据中的最大值与所述上限阈值的差值,记为第k个叶子节点的第二特征值;第一特征值大于0,表示第k个叶子节点对应的所有网络流量数据中最小的数据值都大于下限阈值,说明该数据集中已经不包含疑似异常网络流量数据;第二特征值小于0,表示第k个叶子节点对应的所有网络流量数据中最大的数据值都小于上限阈值,说明该数据集中已经不包含疑似异常网络流量数据。基于此,判断所述第一特征值是否大于0且所述第二特征值是否小于0,若均是,则第k个叶子节点停止向下分裂;若存在不是,则第k个叶子节点继续向下分裂,直至对应的第一特征值大于0且对应的第二特征值小于0,从而达到深度自适应的效果,也即获得了构建完成的孤立森林。孤立森林的构建过程为现有技术,此处不再过多赘述。
步骤S3,根据所述孤立森林中每个样本点在每棵孤立树中的路径长度以及每棵孤立树中所有数据的离散程度,得到所述孤立森林中每个样本点的路径长度加权平均值;基于所述路径长度加权平均值获得每个样本点的异常得分值。
本实施例已经基于待监测交换机当前时间段内所有的网络流量数据构建了孤立森林,在孤立森林中孤立树的构建过程中进行叶子节点向下分裂的动态调整后,有些孤立树的样本集中存在数据值较小的情况,导致正常数据的路径长度也较小,在计算样本点的平均路径长度时,正常样本点数据的平均路径长度也会较小,因此需要对其进行调整。本实施例将根据所述孤立森林中每个样本点在每棵孤立树中的路径长度以及每棵孤立树中所有数据的离散程度,得到所述孤立森林中每个样本点的路径长度加权平均值。
具体地,对于所述孤立森林中第j个样本点:
将孤立森林中包含第j个样本点的第r棵孤立树中第j个样本点的路径长度与第r棵孤立树的总深度的比值,记为第j个样本点在包含其的第r棵孤立树中的路径长度占比;分别将孤立森林中每棵孤立树中数据的均方差记为每棵孤立树的参考值,计算所有孤立树的参考值的和值;将孤立森林中包含第j个样本点的第r棵孤立树的参考值与所述和值的比值,记为第j个样本点在包含其的第r棵孤立树中的波动占比;根据第j个样本点在包含其的所有孤立树中的路径长度占比和波动占比,获得所述孤立森林中第j个样本点的路径长度加权平均值。所述孤立森林中第j个样本点的路径长度加权平均值的具体计算公式为:
其中,表示所述孤立森林中第j个样本点的路径长度加权平均值,R表示孤立森林中包含第j个样本点的孤立树的数量,/>表示孤立森林中包含第j个样本点的第r棵孤立树的总深度,/>表示孤立森林中包含第j个样本点的第r棵孤立树中第j个样本点的路径长度,/>表示孤立森林中包含第j个样本点的第r棵孤立树中所有数据的均方差,M表示孤立森林中孤立树的数量,/>表示孤立森林中第m棵孤立树中数据的均方差。
表示第j个样本点在包含其的第r棵孤立树中的路径长度占比;/>表示所有孤立树的参考值的和值;/>表示第j个样本点在包含其的第r棵孤立树中的波动占比,波动占比越大,说明第j个样本点在包含其的第r棵孤立树中数据的离散程度越大,对应该孤立树中样本点的相对路径长度所占的权重就越大。
采用上述方法,能够获得孤立森林中每个样本点的路径长度加权平均值,接下来本实施例根据孤立森林中每个样本点的路径长度加权平均值,计算孤立森林中每个样本点的异常得分值。根据路径长度加权平均值计算异常得分的过程为现有技术,此处不再过多赘述。
至此,本实施例获得了每个样本点的异常得分值。
步骤S4,基于所述异常得分值,判断待监测交换机是否出现故障。
本实施例在步骤S3中获得了每个样本点的异常得分值,异常的分值越大,说明对应样本点越可能为异常点,因此本实施例将异常得分值大于预设异常得分阈值的样本点作为异常样本点;本实施例中的异常得分阈值为0.7,在具体应用中,实施者可根据具体情况进行设置。
异常样本点的数量越多,说明待监测交换机越可能出现了异常;统计异常样本点的总数量,判断异常样本点的总数量是否大于预设数量阈值,若大于,则判定待监测交换机出现故障,及时进行故障预警,提醒工作人员进行检修;若小于或等于,则判定待监测交换机未出现故障。本实施例中预设数量阈值为孤立森林中样本点总数量的5%,在具体应用中,实施者可根据具体情况进行设置。
至此,采用本实施例提供了方法,完成了对待监测交换机的故障智能监测。
本实施例考虑到传统的孤立森林构建过程中每棵孤立树的深度是根据经验提前设置的,但是在孤立森林的实际构建过程中,如果样本集中的异常数据早早的被分裂出来并且没有达到预设的深度值,那么孤立树会继续分裂,不仅会导致计算量增加,还会导致模型产生过拟合的情况。本实施例基于待监测交换机当前时间段对应的网络流量数据序列中网络流量数据对应的频率值,确定了上限阈值和下限阈值,进而结合上限阈值和下限阈值进行孤立森林的构建,使得孤立森林中孤立树在构建的过程中达到了深度自适应的效果。考虑到构建完成的孤立森林中存在由于样本集的离散度较小导致正常样本点的路径长度也较小的情况,本实施例根据孤立森林中每个样本点在每棵孤立树中的路径长度以及每棵孤立树中所有数据的离散程度,确定了每个样本点的路径长度加权平均值,进而获得了每个样本点的异常得分值,提高了异常得分值的获取精度,基于异常得分值对待监测交换机是否出现故障进行了判断,本实施例提供的方法在孤立森林构建过程中能够动态调整孤立树的深度值,减小计算复杂性,减小模型过拟合的情况发生,在样本点异常得分值的获取过程中,基于样本点在孤立树中的路径长度以及孤立树中所有数据的离散程度,确定了准确的路径长度加权平均值,保证了后续分析结果的准确性,提高了待监测交换机故障监测结果的准确度与可信度。
需要说明的是:以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种电力通信设备的故障智能监测方法,其特征在于,该方法包括以下步骤:
获取待监测交换机当前时间段对应的网络流量数据序列;
基于所述网络流量数据序列中每种网络流量数据对应的频率值构建频率值序列;根据所述频率值序列中频率值的波动情况,确定疑似异常频率值;根据频率值序列中每个频率值与所述疑似异常频率值之间的差异,获得上限阈值和下限阈值;基于所述上限阈值、所述下限阈值和所述网络流量数据序列构建孤立森林;
根据所述孤立森林中每个样本点在每棵孤立树中的路径长度以及每棵孤立树中所有数据的离散程度,得到所述孤立森林中每个样本点的路径长度加权平均值;基于所述路径长度加权平均值获得每个样本点的异常得分值;
基于所述异常得分值,判断待监测交换机是否出现故障;
所述根据所述频率值序列中频率值的波动情况,确定疑似异常频率值,包括:
将所述频率值序列中除第一个频率值和最后一个频率值外的其他所有频率值记为待分析频率值;
根据每个待分析频率值与其相邻频率值之间的差异,得到每个待分析频率值对应的异常指标;
将异常指标最大的待分析频率值确定为疑似异常频率值;
根据每个待分析频率值与其相邻频率值之间的差异,得到每个待分析频率值对应的异常指标,包括:
对于所述频率值序列中的第i个待分析频率值:
将第i个待分析频率值左侧与其相邻的频率值和第i个待分析频率值之间的比值,记为第一比值;将第i个待分析频率值与其右侧相邻的频率值之间的比值,记为第二比值;
将所述第一比值与所述第二比值之间的差值绝对值,确定为第i个待分析频率值对应的异常指标;
所述根据频率值序列中每个频率值与所述疑似异常频率值之间的差异,获得上限阈值和下限阈值,包括:
将频率值序列中的最小频率值作为特征频率区间的下限值,将所述疑似异常频率值作为特征频率区间的上限值,基于所述下限值和所述上限值获得特征频率区间;
计算所述特征频率区间内所有频率值对应的所有网络流量数据的平均值;
根据所述特征频率区间内每个频率值对应的所有网络流量数据与所述平均值之间的差异,确定上限阈值和下限阈值;
根据所述特征频率区间内每个频率值对应的所有网络流量数据与所述平均值之间的差异,确定上限阈值和下限阈值,包括:
将所述特征频率区间内小于所述平均值的频率值记为第一频率值,分别将每个第一频率值与所述平均值之间的差值记为每个第一频率值对应的第一差异值,将最大的第一差异值对应的第一频率值确定为下限阈值;
将所述特征频率区间内大于所述平均值的频率值记为第二频率值,分别将每个第二频率值与所述平均值之间的差值记为每个第二频率值对应的第二差异值,将最大的第二差异值对应的第二频率值确定为上限阈值;
所述基于所述上限阈值、所述下限阈值和所述网络流量数据序列构建孤立森林,包括:
对于孤立森林中孤立树的第k个叶子节点;
分别获取第k个叶子节点对应的所有网络流量数据中的最大值和最小值;
将第k个叶子节点对应的所有网络流量数据中的最小值与所述下限阈值的差值,记为第k个叶子节点的第一特征值;将第k个叶子节点对应的所有网络流量数据中的最大值与所述上限阈值的差值,记为第k个叶子节点的第二特征值;
判断所述第一特征值是否大于0且所述第二特征值是否小于0,若均是,则第k个叶子节点停止向下分裂;若存在不是,则第k个叶子节点继续向下分裂,直至对应的第一特征值大于0且对应的第二特征值小于0,获得孤立森林。
2.根据权利要求1所述的一种电力通信设备的故障智能监测方法,其特征在于,所述根据所述孤立森林中每个样本点在每棵孤立树中的路径长度以及每棵孤立树中所有数据的离散程度,得到所述孤立森林中每个样本点的路径长度加权平均值,包括:
对于所述孤立森林中第j个样本点:
将孤立森林中包含第j个样本点的第r棵孤立树中第j个样本点的路径长度与第r棵孤立树的总深度的比值,记为第j个样本点在包含其的第r棵孤立树中的路径长度占比;
分别将孤立森林中每棵孤立树中数据的均方差记为每棵孤立树的参考值,计算所有孤立树的参考值的和值;将孤立森林中包含第j个样本点的第r棵孤立树的参考值与所述和值的比值,记为第j个样本点在包含其的第r棵孤立树中的波动占比;
根据第j个样本点在包含其的所有孤立树中的路径长度占比和波动占比,获得所述孤立森林中第j个样本点的路径长度加权平均值。
3.根据权利要求1所述的一种电力通信设备的故障智能监测方法,其特征在于,采用如下公式计算所述孤立森林中第j个样本点的路径长度加权平均值:
;
其中,表示所述孤立森林中第j个样本点的路径长度加权平均值,R表示孤立森林中包含第j个样本点的孤立树的数量,/>表示孤立森林中包含第j个样本点的第r棵孤立树的总深度,/>表示孤立森林中包含第j个样本点的第r棵孤立树中第j个样本点的路径长度,表示孤立森林中包含第j个样本点的第r棵孤立树中所有数据的均方差,M表示孤立森林中孤立树的数量,/>表示孤立森林中第m棵孤立树中数据的均方差。
4.根据权利要求1所述的一种电力通信设备的故障智能监测方法,其特征在于,所述基于所述异常得分值,判断待监测交换机是否出现故障,包括:
将异常得分值大于预设异常得分阈值的样本点作为异常样本点;
判断异常样本点的总数量是否大于预设数量阈值,若大于,则判定待监测交换机出现故障;若小于或等于,则判定待监测交换机未出现故障。
5.根据权利要求1所述的一种电力通信设备的故障智能监测方法,其特征在于,所述获取待监测交换机当前时间段对应的网络流量数据序列,包括:
获取待监测交换机当前时间段内每个采集时刻的网络流量数据;
按照时间先后顺序,将当前时间段内所有采集时刻的网络流量数据构成的序列,记为待监测交换机当前时间段对应的网络流量数据序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311722851.2A CN117411811B (zh) | 2023-12-15 | 2023-12-15 | 一种电力通信设备的故障智能监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311722851.2A CN117411811B (zh) | 2023-12-15 | 2023-12-15 | 一种电力通信设备的故障智能监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117411811A CN117411811A (zh) | 2024-01-16 |
CN117411811B true CN117411811B (zh) | 2024-02-23 |
Family
ID=89492997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311722851.2A Active CN117411811B (zh) | 2023-12-15 | 2023-12-15 | 一种电力通信设备的故障智能监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117411811B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117574307B (zh) * | 2024-01-17 | 2024-05-17 | 广东云百科技有限公司 | 一种物联网数据的安全管理系统及方法 |
CN117807547B (zh) * | 2024-02-29 | 2024-05-10 | 国网山东省电力公司经济技术研究院 | 一种区域级综合能源大规模数据清洗方法 |
CN117874653B (zh) * | 2024-03-11 | 2024-05-31 | 武汉佳华创新电气有限公司 | 一种基于多源数据的电力系统安全监测方法及系统 |
CN117892095B (zh) * | 2024-03-14 | 2024-05-28 | 山东泰开电力电子有限公司 | 一种储能系统用的散热系统故障智能检测方法 |
CN117971625B (zh) * | 2024-03-27 | 2024-06-07 | 莱芜职业技术学院 | 基于计算机云平台的性能数据智能监测系统 |
CN118400299B (zh) * | 2024-06-27 | 2024-09-06 | 长春汽车工业高等专科学校 | 基于云计算的车载网络智能化监控系统 |
CN118468205B (zh) * | 2024-07-12 | 2024-10-15 | 青岛有屋科技有限公司 | 基于人工智能的集中式家居设备状态故障检测方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111833172A (zh) * | 2020-05-25 | 2020-10-27 | 百维金科(上海)信息科技有限公司 | 一种基于孤立森林的消费信贷欺诈行为检测方法及其系统 |
CN112181706A (zh) * | 2020-10-23 | 2021-01-05 | 北京邮电大学 | 一种基于对数区间隔离的电力调度数据异常检测方法 |
CN112686286A (zh) * | 2020-12-18 | 2021-04-20 | 博锐尚格科技股份有限公司 | 建筑运行能耗异常识别方法、系统、计算机可读存储介质 |
CN113420073A (zh) * | 2021-08-23 | 2021-09-21 | 平安科技(深圳)有限公司 | 基于改进的孤立森林的异常样本检测方法及相关设备 |
CN113627521A (zh) * | 2021-08-09 | 2021-11-09 | 西华大学 | 基于孤立森林法的物流无人机异常行为智能识别方法 |
CN115034839A (zh) * | 2021-03-05 | 2022-09-09 | 腾讯科技(深圳)有限公司 | 办公区域状态的检测方法、装置和存储介质及电子设备 |
CN115065597A (zh) * | 2022-06-14 | 2022-09-16 | 中国电信股份有限公司 | 一种容器资源配置方法、装置、介质和设备 |
KR102489502B1 (ko) * | 2021-09-27 | 2023-01-17 | (주)엘 테크 | 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템 |
CN115840095A (zh) * | 2021-09-20 | 2023-03-24 | 费斯托股份有限两合公司 | 用于电气系统中的异常检测的机器学习方法 |
CN115839806A (zh) * | 2021-09-20 | 2023-03-24 | 费斯托股份有限两合公司 | 用于气动系统中泄漏检测的机器学习方法 |
CN117148045A (zh) * | 2023-09-28 | 2023-12-01 | 国网河南省电力公司开封供电公司 | 配电网运行状态的故障研判管理系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113033084B (zh) * | 2021-03-11 | 2022-04-05 | 哈尔滨工程大学 | 一种基于孤立森林和滑动时窗的核电站系统在线监测方法 |
-
2023
- 2023-12-15 CN CN202311722851.2A patent/CN117411811B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111833172A (zh) * | 2020-05-25 | 2020-10-27 | 百维金科(上海)信息科技有限公司 | 一种基于孤立森林的消费信贷欺诈行为检测方法及其系统 |
CN112181706A (zh) * | 2020-10-23 | 2021-01-05 | 北京邮电大学 | 一种基于对数区间隔离的电力调度数据异常检测方法 |
CN112686286A (zh) * | 2020-12-18 | 2021-04-20 | 博锐尚格科技股份有限公司 | 建筑运行能耗异常识别方法、系统、计算机可读存储介质 |
CN115034839A (zh) * | 2021-03-05 | 2022-09-09 | 腾讯科技(深圳)有限公司 | 办公区域状态的检测方法、装置和存储介质及电子设备 |
CN113627521A (zh) * | 2021-08-09 | 2021-11-09 | 西华大学 | 基于孤立森林法的物流无人机异常行为智能识别方法 |
CN113420073A (zh) * | 2021-08-23 | 2021-09-21 | 平安科技(深圳)有限公司 | 基于改进的孤立森林的异常样本检测方法及相关设备 |
CN115840095A (zh) * | 2021-09-20 | 2023-03-24 | 费斯托股份有限两合公司 | 用于电气系统中的异常检测的机器学习方法 |
CN115839806A (zh) * | 2021-09-20 | 2023-03-24 | 费斯托股份有限两合公司 | 用于气动系统中泄漏检测的机器学习方法 |
KR102489502B1 (ko) * | 2021-09-27 | 2023-01-17 | (주)엘 테크 | 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템 |
CN115065597A (zh) * | 2022-06-14 | 2022-09-16 | 中国电信股份有限公司 | 一种容器资源配置方法、装置、介质和设备 |
CN117148045A (zh) * | 2023-09-28 | 2023-12-01 | 国网河南省电力公司开封供电公司 | 配电网运行状态的故障研判管理系统 |
Non-Patent Citations (1)
Title |
---|
基于孤立森林算法的取用水量异常数据检测方法;赵臣啸;薛惠锋;王磊;万毅;;中国水利水电科学研究院学报(01);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117411811A (zh) | 2024-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117411811B (zh) | 一种电力通信设备的故障智能监测方法 | |
CN103812577A (zh) | 非正常无线电信号的自动识别系统及其方法 | |
CN107092654B (zh) | 基于均值变化检测的报警正常与异常数据检测方法和装置 | |
CN101309179B (zh) | 一种基于主机活跃性和通信模式分析实时异常流量检测方法 | |
CN103987056A (zh) | 基于大数据统计模型的无线网络话务量预测方法 | |
CN106936517A (zh) | 一种异常无线电信号的自动识别系统及其方法 | |
CN115456479B (zh) | 一种基于物联网的智慧农业大棚环境监测系统 | |
CN106358212A (zh) | 室内分布系统的检测方法和装置 | |
CN105515888A (zh) | 基于多维熵序列分类的智能变电站通信网络异常检测方法 | |
CN110011966B (zh) | 一种智能变电站过程层网络流量异常检测方法 | |
CN112291107A (zh) | 网络分析程序、网络分析装置以及网络分析方法 | |
CN109143157B (zh) | 基于信号强度值混合滤波的动态更新参数的测距方法 | |
JP2008118242A (ja) | 異常トラヒック検出方法およびその装置およびプログラム | |
CN114912490A (zh) | 一种基于傅里叶变换算法的特征电流识别检定方法及装置 | |
CN117579344B (zh) | 一种网络结构特征异常检测系统 | |
CN101106487A (zh) | 一种检测网络流量异常的方法及装置 | |
CN113794680A (zh) | 基于频域分析的高带宽场景下的恶意流量检测方法和装置 | |
CN116707902A (zh) | 一种基于决策树的LoRaWAN网络攻击检测方法 | |
CN116961799A (zh) | 一种基于时频域分布特征的信号干扰检测方法 | |
CN114662058A (zh) | 无线站点监测方法及装置 | |
CN109142952A (zh) | 一种电流温度故障指示装置及控制方法 | |
CN118137679B (zh) | 变电站安全智慧管控集成系统 | |
WO2019080735A1 (zh) | 一种基于WiFi信号的门窗开闭状态检测方法 | |
CN115907567B (zh) | 基于鲁棒性随机分割森林算法的负荷事件检测方法及系统 | |
CN116778661B (zh) | 一种烟感智能预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |