CN113242213A - 一种电力通信骨干网节点脆弱性诊断方法 - Google Patents
一种电力通信骨干网节点脆弱性诊断方法 Download PDFInfo
- Publication number
- CN113242213A CN113242213A CN202110407544.XA CN202110407544A CN113242213A CN 113242213 A CN113242213 A CN 113242213A CN 202110407544 A CN202110407544 A CN 202110407544A CN 113242213 A CN113242213 A CN 113242213A
- Authority
- CN
- China
- Prior art keywords
- node
- vulnerability
- data
- power communication
- decision tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1433—Vulnerability analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Hardware Design (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及一种电力通信骨干网节点脆弱性诊断方法,首先获取待诊断的电力通信网的拓扑结构和运行数据;其次,从拓扑结构、带宽配置、运行态势等方面对节点进行特征筛选,选出适合全面诊断需求的特征;然后,运用改进的随机森林算法对节点的脆弱性进行诊断;最后,将最终产生的电力通信骨干网的各节点脆弱性结果与待诊断的电力通信网骨干网设备节点对应设置,可实现对电力通信网的节点进行全面、动态、智能地脆弱性诊断。
Description
技术领域
本发明涉及电力系统通信技术领域,特别是一种在电力通信骨干网的节点脆弱性诊断方法。
背景技术
随着泛在电力物联网的推行,准确辨识电力通信网的关键节点,可有效地降低电力通信网的脆弱性,保障网络的正常运行。节点重要度越大,节点脆弱值也越高,面临的脆弱性威胁越大。在现有的研究中,对节点重要度的评价方法大都只考虑网络拓扑层面,或者结合拓扑结构和业务重要性两方面进行评价,这些方法所涉及的指标特征较为单一、所运用的评估算法也较为传统。
发明内容
有鉴于此,本发明的目的是提出一种电力通信骨干网的节点脆弱性诊断方法,利用大数据和机器学习算法识别电力通信网中节点的脆弱性,可考虑节点的多方面特征属性,包括拓扑结构、带宽配置、运行态势等方面,将对节点脆弱性进行更全面的诊断。
本发明采用以下方案实现:一种电力通信骨干网节点脆弱性诊断方法,包括以下步骤:
步骤S1:获取待诊断的电力通信骨干网的拓扑结构和运行数据,所述运行数据包括带宽配置、运行状态;
步骤S2:通过拓扑结构、带宽配置、运行状态对电力通信网节点进行特征选取;
步骤S3:运用改进的随机森林算法对节点进行脆弱性诊断。
进一步的,还包括步骤S4:通过将节点脆弱性诊断结果与待诊断的电力通信骨干网节点对应设置。
进一步的,所述步骤S1具体还包括以下子步骤:
S11:获取待诊断的电力通信骨干网节点设备的邻接矩阵A=(aij)n×n;当aij=1时,表示节点i和节点j之间有连接;当aij=0时,表示节点i和节点j之间无连接;其中,所述n表示该电力通信骨干网的节点数;
S12:获取运行数据,所述运行数据包括节点设备的配置带宽、节点设备的已使用带宽、节点设备投运年龄、节点的设备类型、节点设备类型历史故障次数。
进一步的,所述步骤S2具体还包括以下子步骤:
步骤S201:选取特征属性;
步骤S202:通过对步骤S201选取的特征属性进行数据标准化处理,消除量纲对精确识别特征属性和脆弱性诊断结果之间关系的影响;具体如下:
正向指标:所述正向指标指该指标指越大,节点被诊断为脆弱性大的可能性越高;根据如下公式对正向指标x1,x2,x4,x5,x6,x7正向指标进行数据标准化处理;
式中,i表示节点编号,j表示属性标号;xj(i)表示数据标准化处理前第i个节点的第j个属性值,xj(i)′表示数据标准化处理后第i个节点的第j个属性值;
负向指标:负向指标指该指标指越大,节点被诊断为脆弱性大的可能性越低;,根据如下公式对负向指标x3做数据归一化处理;
式中,i表示节点编号,j表示属性标号;xj(i)表示数据标准化处理前第i个节点的第j个属性值,xj(i)′表示数据标准化处理后第i个节点的第j个属性值。
进一步的,所述特征属性包括,节点介数、节点度、带宽配置、已使用带宽、节点设备投运年龄、节点的设备类型、节点设备类型历史故障次数;其中,
所述节点介数在全局网络中,通过迪杰斯特拉算法求邻接矩阵A=(aij)n×n中任意两点间的最短路径,计算出经过节点i的最短路径数目x1(i);
所述节点度x2(i)通过拓扑结构计算得出;
所述带宽配置x3(i)通过台账信息进行收集;
所述已使用带宽x4(i)通过台账信息进行收集;
所述节点设备的投运年龄x5(i)通过台账信息进行收集;
所述节点的设备类型x6(i)通过台账信息进行收集;
所述节点设备的历史故障次数x7(i)通过台账信息进行收集。
进一步的,所述步骤S3诊断方法,具体包括以下子步骤:
S301.将步骤S202中归一化处理后的数据结果和人工分类的节点脆弱性诊断结果Y=[y(i)]n×1组合成随机森林算法所需的数据集data;
S302.数据集data中,y(i)∈{1,0},若y(i)=1,则表示节点i被分类为脆弱性大的节点;若y(i)=0,则表示节点i被分类为脆弱性小的节点;
S303.节点脆弱性大小的划分依据如下:根据特征属性集合对节点的脆弱性大小进行人工分类,将1/2的节点划分为脆弱性大的节点,将剩下1/2的节点划分为脆弱性小的节点;
S304.将数据集data按一定的比例划分为随机森林算法的训练集data-train和测试集data-test。
进一步的,所述改进随机森林算法具体包括以下步骤:
S311.输入:训练集data-train;
随机森林中的决策树数目trees-num;
确定随机抽取的特征子集的大小m;
测试样例data-test1;
S312.从训练集data-train中按一定比例有放回的抽取一个子集T(i),一共构建trees-num个子集;
S313.在每个子集T(i)中,从7个特征属性中随机抽取m个属性,用决策树算法在训练子集T(i)上训练决策树DT(i);
S314.将步骤S313重复trees-num次,然后训练出trees-num棵决策树,形成一个随机森林;
S315.将决策树DT(i)对训练子集T(i)进行脆弱性决策诊断,并计算每个DT(i)决策诊断的正确率CR(i);
S316.改进随机森林算法的加成投票机制。
进一步的,所述加成投票机制具体如下:
S3161.当trees-num棵决策树对某个样例节点i进行脆弱性诊断时,诊断结果为“1”的决策树构成集合DT1={DT(1),...,DT(i),...DT(na)};诊断结果为“0”的决策树构成集合DT0={DT(1),...,DT(i),...DT(nb)},其中,所述na为集合DT1的元素个数,nb为集合DT0的元素个数;
S3162.在集合DT1中找出正确率最高的最佳决策树,再计算集合DT1中其他决策树对最佳决策树的正确率CRA的加成效果,用来表征整个集合DT1的诊断正确率CR1;加成机制定义如下式:
其中,所述CR1表示集合DT1的正确率;CRA表示集合DT1的最佳决策树的正确率;na-1表示集合DT1除了最佳决策树后剩下的决策树数目;CR(i)表示表示除了最佳决策树后剩下的决策树的正确率;q表示加成因子,需要具体调节该参数值;
S3163.在集合DT0中找出正确率最高的最佳决策树,再计算集合DT0中其他决策树对最佳决策树的正确率CRB的加成效果,用来表征整个集合DT0的诊断正确率CR0;加成机制定义如下式:
其中,CR0表示集合DT0正确率;CRB表示集合DT0的最佳决策树的正确率;nb-1表示集合DT0除了最佳决策树后剩下的决策树数目;CR(i)表示表示除了最佳决策树后剩下的决策树的正确率;q表示加成因子,需要具体调节该参数值;
S3164.将CR1和CR0进行比较,若CR1>=CR0,则改进随机森林对样例节点i的投票结果为“1”,否则,投票结果为“0”;
S3165.输出测试样例data-test1的诊断类别标签y-test(i)
本发明的有益效果:
(1)本发明不仅使对电力通信网的诊断跳出传统的拓扑诊断,还能根据现今的运行态势进行动态诊断。每更新一次节点的运行数据,即可得到相应的脆弱性诊断结果,为电力通信网脆弱节点的更新、巡检提供智能辅助决策;
(2)本发明提出一种基于随机森林改进的电力通信网节点脆弱性诊断方法,对电力通信网的运行数据进行数据挖掘,可得出更加科学可靠的电力通信网节点脆弱性诊断结果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的方法流程示意图;
图2为本发明实施例的步骤S3的流程示意图;
图3为原始随机森林和本发明改进算法的两种算法的诊断结果对比图;
图4为原始随机森林和本发明改进算法的两种算法的预测效果对比图;
图5为原始随机森林和本发明改进算法的ROC曲线对比图;
图6为本发明验证集使用的某市电力通信网拓扑图;
图7中本发明对某市电力通信网脆弱性诊断结果。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供了一种电力通信骨干网的节点脆弱性诊断方法,具体包括以下步骤:
步骤S1:获取待诊断的电力通信骨干网的拓扑结构和运行数据;
步骤S2:从拓扑结构、带宽配置、运行状态等方面对电力通信网节点进行特征选取;
步骤S3:运用改进的随机森林算法对节点进行脆弱性诊断;
步骤S4:将节点脆弱性诊断结果与待诊断的电力通信骨干网节点对应设置,可实现对电力通信网的节点进行全面、动态、智能地脆弱性诊断。
进一步地,步骤S1具体为:
1)获取待诊断的电力通信骨干网节点设备的邻接矩阵A=(aij)n×n。若aij=1,表示节点i和节点j之间有连接;若aij=0,表示节点i和节点j之间无连接;n表示该电力通信骨干网的节点数。
2)获取节点设备配置带宽、节点设备已使用带宽、节点设备投运年龄、节点的设备类型、节点设备的历史故障数等基本运行数据。
进一步地,步骤S2中,所述从拓扑结构、带宽配置、运行状态等方面对电力通信网节点进行特征选取具体包括以下步骤:
步骤S21:选取介数、节点度、节点设备配置带宽、节点设备已使用带宽、节点设备投运年龄、节点的设备类型、节点设备的历史故障次数等七个特征属性。各特征属性的计算公式和定义如下:
1)介数,表征节点i在全局拓扑结构中的关键度信息。计算方法,在全局网络中,用迪杰斯特拉算法(Dijkstra)求邻接矩阵A=(aij)n×n中任意两点间的最短路径,计算出经过节点i的最短路径数目x1(i)。
2)节点度x2(i):与节点i直接连接的节点数目,该值由拓扑结构计算得出。
3)带宽配置x3(i):由台账信息收集。
4)已使用带宽x4(i):由台账信息收集。
5)节点设备投运年龄x5(i):由台账信息收集。
6)节点的设备类型x6(i):由台账信息收集。
7)节点设备的历史故障次数x7(i):由台账信息收集。
步骤S22:为消除量纲对精确识别特征属性和脆弱性诊断结果之间关系的影响,对各特征属性进行数据标准化处理,具体如下:
1)针对x1,x2,x4,x5,x6,x7等正向指标,根据公式(1)做数据标准化处理。
式中,i表示节点编号,j表示属性标号。xj(i)表示数据标准化处理前第i个节点的第j个属性值,xj(i)′表示数据标准化处理后第i个节点的第j个属性值。
2)针对x3等负向指标,根据公式(2)做数据归一化处理。
式中,i表示节点编号,j表示属性标号。xj(i)表示数据标准化处理前第i个节点的第j个属性值,xj(i)′表示数据标准化处理后第i个节点的第j个属性值。
进一步地,步骤S3具体包括以下步骤:
1、步骤S3中,所述运用改进的随机森林算法对节点的脆弱性进行诊断具体包括以下步骤:
步骤S31:构建改进随机森林算法对节点脆弱性诊断所需的训练集、测试集
3)节点脆弱性大小的划分依据如下:根据特征属性集合对节点的脆弱性大小进行人工分类,将1/2的节点划分为脆弱性大的节点,将剩下1/2的节点划分为脆弱性小的节点。
4)将数据集data按一定的比例划分为随机森林算法的训练集data-train和测试集data-test。
步骤S32:所述改进的随机森林算法具体包括以下步骤:
1)输入:
训练集
其中,n1为训练集的样本数目。
确定随机森林中的决策树数目trees-num;
确定随机抽取的特征子集的大小m;
测试样例
其中,n2为测试样例的样本数目。
2)从训练集data-train中按一定比例有放回的抽取一个子集T(i),一共构建trees-num个子集。
3)在每个子集T(i)中,从7个特征属性中随机抽取m个属性,用决策树算法在训练子集T(i)上构建决策树DT(i)。
4)将步骤3重复trees-num次,然后构建trees-num棵决策树,形成一个随机森林。
5)将DT(i)用于整个训练集data-train的脆弱性决策诊断,并计算每个DT(i)决策诊断的正确率CR(i)。
6)改进随机森林算法的加成投票机制,该机制定义如下:
当trees-num棵决策树对某个样例节点i进行脆弱性诊断时,诊断结果为“1”的决策树构成集合DT1={DT(1),...,DT(i),...DT(na)};诊断结果为“0”的决策树构成集合DT0={DT(1),...,DT(i),…DT(nb)}。其中na为集合DT1的元素个数,nb为集合DT0的元素个数。
在集合DT1中找出正确率最高的最佳决策树,再计算集合DT1中其他决策树对最佳决策树的正确率CRA的加成效果,用来表征整个集合DT1的诊断正确率CR1。加成机制定义如下式:
式中,CR1:集合DT1正确率。
CRA:集合DT1的最佳决策树的正确率。
na-1:集合DT1除了最佳决策树后剩下的决策树数目。
CR(i):表示除了最佳决策树后剩下的决策树的正确率。
q:加成因子,需要具体调节该参数值。
同理,在集合DT0中找出正确率最高的最佳决策树,再计算集合DT0中其他决策树对最佳决策树的正确率CRB的加成效果,用来表征整个集合DT0的诊断正确率CR0。加成机制定义如下式:
式中,CR0:集合DT0正确率。
CRB:集合DT0的最佳决策树的正确率。
nb-1:集合DT0除了最佳决策树后剩下的决策树数目。
CR(i):表示除了最佳决策树后剩下的决策树的正确率。
q:加成因子,需要具体调节该参数值。
将CR1和CR0进行比较,若CR1>=CR0,则改进随机森林对样例节点i的投票结果为“1”,否则,投票结果为“0”。
7)输出:测试样例data-test1的诊断类别标签y-test(i)。
进一步地,步骤S4具体包括以下步骤:
将步骤S32中的节点脆弱性诊断结果与待诊断的电力通信骨干网节点对应设置,可实现对电力通信网的节点进行全面、动态、智能地脆弱性诊断。
特别的,将本发明用于某市的电力通信网络进行节点脆弱性诊断实验。该网络存在1104个节点,将704个节点的数据用于做训练集,将400个节点的数据用于做测试集。
本实施例将本实施例的方法与原始的随机森林算法进行对比。
本实例运用混淆矩阵对节点诊断结果进行预测结果对比分析。具体的,在对节点进行脆弱性预测时,会出现以下的诊断情况。
TP(True Positive):正确分类脆弱性大的节点数;
TN(True Negative):正确分类脆弱性小的节点数;
FP(False Positive):错误分类脆弱性大的节点数;
FN(False Negative):错误分类脆弱性小的节点数。
两种算法对于测试集的诊断结果如下表所示:
图3为两种算法的诊断结果对比图。
本发明对电力通信网的节点进行脆弱性诊断,实际上也是一个预测问题。因此,采用以下指标对两种算法进行预测效果评价。
1)精确度
精确率指模型预测为正的样本中实际也为正的样本占被预测为正的样本的比例。计算公式为:
精确度Precision=TP/(TP+FP)
2)召回率
召回率指实际为正的样本中被预测为正的样本所占实际为正的样本的比例。计算公式为:
召回率Recall=TP/(TN+FN)
3)真正例率(TPR)
真正例率(TPR)表示预测为正例且真实情况为正例的,占所有真实情况中正例的比率。
TPR=TP/(TP+FN)
4)假正例率(FPR)
假正例率(FPR)表示预测为正例但真实情况为反例的,占所有真实情况中反例的比率。
FPR=FP/(FP+TN)
对两种算法的评价效果如下表所示:
图4为两种算法的评价效果对比图。
为准确识别两种算法的优劣性,以TPR为纵坐标,以FPR为横坐标绘制ROC曲线。当曲线与直线x=1,y=0围成的面积越大,说明该算法的预测效果越好。
两种算法的ROC曲线与直线x=1,y=0围成的面积如下表所示。
图5为两种算法的ROC曲线对比图。
由上表可知,相比于原始随机森林算法,采用本发明算法进行电力通信网节点脆弱性诊断,可获得更优的诊断效果。
以上实例用于说明本发明相比于传统随机森林算法的优越性。最后,运用本发明已经训练出的算法模型,对图6所示的实际的电力通信网进行节点脆弱性诊断,输出如图7所示的诊断结果。在图7中,红色节点为脆弱性大的节点,蓝色节点为脆弱性小的节点。根据本发明的诊断结果,应当加强该网络中脆弱性大的节点的巡检与监测,以保证电力通信网络的安全可靠运行。
经过上述仿真结果可以说明:利用本发明识别电力通信网中节点的脆弱性,可对节点的多方面特征属性进行覆盖,包括拓扑结构、带宽配置、运行态势等方面,将对节点脆弱性进行更全面的诊断。不仅使对电力通信网的诊断跳出传统的拓扑诊断,还能根据现今的运行态势进行动态诊断,为电力通信网脆弱节点的更新、巡检提供智能辅助决策。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
Claims (8)
1.一种电力通信骨干网节点脆弱性诊断方法,其特征在于,包括以下步骤:
步骤S1:获取待诊断的电力通信骨干网的拓扑结构和运行数据,所述运行数据包括带宽配置、运行状态;
步骤S2:通过拓扑结构、带宽配置、运行状态对电力通信网节点进行特征选取;
步骤S3:运用改进的随机森林算法对节点进行脆弱性诊断。
2.根据权利要求1所述的一种电力通信骨干网节点脆弱性诊断方法,其特征在于,还包括步骤S4:通过将节点脆弱性诊断结果与待诊断的电力通信骨干网节点对应设置。
3.根据权利要求1所述的一种电力通信骨干网节点脆弱性诊断方法,其特征在于,所述步骤S1具体还包括以下子步骤:
S11:获取待诊断的电力通信骨干网节点设备的邻接矩阵A=(aij)n×n;当aij=1时,表示节点i和节点j之间有连接;当aij=0时,表示节点i和节点j之间无连接;其中,所述n表示该电力通信骨干网的节点数;
S12:获取运行数据,所述运行数据包括节点设备的配置带宽、节点设备的已使用带宽、节点设备投运年龄、节点的设备类型、节点设备类型历史故障次数。
4.根据权利要求1所述的一种电力通信骨干网节点脆弱性诊断方法,其特征在于,所述步骤S2具体还包括以下子步骤:
步骤S201:选取特征属性;
步骤S202:通过对步骤S201选取的特征属性进行数据标准化处理,消除量纲对精确识别特征属性和脆弱性诊断结果之间关系的影响;具体如下:
正向指标:所述正向指标指该指标指越大,节点被诊断为脆弱性大的可能性越高;根据如下公式对正向指标x1,x2,x4,x5,x6,x7正向指标进行数据标准化处理;
式中,i表示节点编号,j表示属性标号;xj(i)表示数据标准化处理前第i个节点的第j个属性值,xj(i)′表示数据标准化处理后第i个节点的第j个属性值;
负向指标:负向指标指该指标指越大,节点被诊断为脆弱性大的可能性越低;,根据如下公式对负向指标x3做数据归一化处理;
式中,i表示节点编号,j表示属性标号;xj(i)表示数据标准化处理前第i个节点的第j个属性值,xj(i)′表示数据标准化处理后第i个节点的第j个属性值。
5.根据权利要求4所述的一种电力通信骨干网节点脆弱性诊断方法,其特征在于,所述特征属性包括,节点介数、节点度、带宽配置、已使用带宽、节点设备投运年龄、节点的设备类型、节点设备类型历史故障次数;其中,
所述节点介数在全局网络中,通过迪杰斯特拉算法求邻接矩阵A=(aij)n×n中任意两点间的最短路径,计算出经过节点i的最短路径数目x1(i);
所述节点度x2(i)通过拓扑结构计算得出;
所述带宽配置x3(i)通过台账信息进行收集;
所述已使用带宽x4(i)通过台账信息进行收集;
所述节点设备的投运年龄x5(i)通过台账信息进行收集;
所述节点的设备类型x6(i)通过台账信息进行收集;
所述节点设备的历史故障次数x7(i)通过台账信息进行收集。
6.根据权利要求4所述的一种电力通信骨干网节点脆弱性诊断方法,其特征在于,所述步骤S3诊断方法,具体包括以下子步骤:
S301.将步骤S202中归一化处理后的数据结果和人工分类的节点脆弱性诊断结果Y=[y(i)]n×1组合成随机森林算法所需的数据集data;
S302.数据集data中,y(i)∈{1,0},若y(i)=1,则表示节点i被分类为脆弱性大的节点;若y(i)=0,则表示节点i被分类为脆弱性小的节点;
S303.节点脆弱性大小的划分依据如下:根据特征属性集合对节点的脆弱性大小进行人工分类,将1/2的节点划分为脆弱性大的节点,将剩下1/2的节点划分为脆弱性小的节点;
S304.将数据集data按一定的比例划分为随机森林算法的训练集data-train和测试集data-test。
7.根据权利要求6所述的一种电力通信骨干网节点脆弱性诊断方法,其特征在于,所述改进随机森林算法具体包括以下步骤:
S311.输入:训练集data-train;
随机森林中的决策树数目trees-num;
确定随机抽取的特征子集的大小m;
测试样例data-test1;
S312.从训练集data-train中按一定比例有放回的抽取一个子集T(i),一共构建trees-num个子集;
S313.在每个子集T(i)中,从7个特征属性中随机抽取m个属性,用决策树算法在训练子集T(i)上训练决策树DT(i);
S314.将步骤S313重复trees-num次,然后训练出trees-num棵决策树,形成一个随机森林;
S315.将决策树DT(i)对训练子集T(i)进行脆弱性决策诊断,并计算每个DT(i)决策诊断的正确率CR(i);
S316.改进随机森林算法的加成投票机制。
8.根据权利要求7所述的一种电力通信骨干网节点脆弱性诊断方法,其特征在于,所述加成投票机制具体如下:
S3161.当trees-num棵决策树对某个样例节点i进行脆弱性诊断时,诊断结果为“1”的决策树构成集合DT1={DT(1),...,DT(i),...DT(na)};诊断结果为“0”的决策树构成集合DT0={DT(1),...,DT(i),...DT(nb)},其中,所述na为集合DT1的元素个数,nb为集合DT0的元素个数;
S3162.在集合DT1中找出正确率最高的最佳决策树,再计算集合DT1中其他决策树对最佳决策树的正确率CRA的加成效果,用来表征整个集合DT1的诊断正确率CR1;加成机制定义如下式:
其中,所述CR1表示集合DT1的正确率;CRA表示集合DT1的最佳决策树的正确率;na-1表示集合DT1除了最佳决策树后剩下的决策树数目;CR(i)表示表示除了最佳决策树后剩下的决策树的正确率;q表示加成因子,需要具体调节该参数值;
S3163.在集合DT0中找出正确率最高的最佳决策树,再计算集合DT0中其他决策树对最佳决策树的正确率CRB的加成效果,用来表征整个集合DT0的诊断正确率CR0;加成机制定义如下式:
其中,CR0表示集合DT0正确率;CRB表示集合DT0的最佳决策树的正确率;nb-1表示集合DT0除了最佳决策树后剩下的决策树数目;CR(i)表示表示除了最佳决策树后剩下的决策树的正确率;q表示加成因子,需要具体调节该参数值;
S3164.将CR1和CR0进行比较,若CR1>=CR0,则改进随机森林对样例节点i的投票结果为“1”,否则,投票结果为“0”;
S3165.输出测试样例data-test1的诊断类别标签y-test(i)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110407544.XA CN113242213B (zh) | 2021-04-15 | 2021-04-15 | 一种电力通信骨干网节点脆弱性诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110407544.XA CN113242213B (zh) | 2021-04-15 | 2021-04-15 | 一种电力通信骨干网节点脆弱性诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113242213A true CN113242213A (zh) | 2021-08-10 |
CN113242213B CN113242213B (zh) | 2022-10-21 |
Family
ID=77128182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110407544.XA Active CN113242213B (zh) | 2021-04-15 | 2021-04-15 | 一种电力通信骨干网节点脆弱性诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113242213B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114781674A (zh) * | 2022-06-16 | 2022-07-22 | 深圳市信润富联数字科技有限公司 | 风电设备故障的定位方法及装置、存储介质、电子设备 |
CN117554751A (zh) * | 2023-12-14 | 2024-02-13 | 胡波 | 基于人工智能的电力系统故障诊断系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132149A1 (en) * | 2010-06-10 | 2013-05-23 | Dong Wei | Method for quantitative resilience estimation of industrial control systems |
CN106156885A (zh) * | 2016-06-27 | 2016-11-23 | 国家电网公司 | 一种电网整体脆弱性综合评价方法 |
CN106603294A (zh) * | 2016-12-20 | 2017-04-26 | 国网新疆电力公司信息通信公司 | 一种基于电力通信网结构和状态的综合脆弱性评估方法 |
CN106789190A (zh) * | 2016-12-05 | 2017-05-31 | 国网河南省电力公司信息通信公司 | 一种电力通信网脆弱性评估及路由优化方法 |
CN107193274A (zh) * | 2017-07-04 | 2017-09-22 | 广东电网有限责任公司电力调度控制中心 | 一种基于多维度综合指标的电网脆弱性评估方法 |
US20180176134A1 (en) * | 2016-12-21 | 2018-06-21 | Cisco Technology, Inc. | MACHINE LEARNING-DERIVED ENTROPY PATH GRAPH FROM IN-SITU OAM (iOAM) DATA |
US20180260561A1 (en) * | 2017-03-08 | 2018-09-13 | General Electric Company | Generic framework to detect cyber threats in electric power grid |
CN110020815A (zh) * | 2019-05-07 | 2019-07-16 | 云南电网有限责任公司 | 一种基于网络层次分析法的电网节点综合脆弱性指标计算方法 |
CN110191137A (zh) * | 2019-06-12 | 2019-08-30 | 北京理工大学 | 一种网络系统量化安全评估方法与装置 |
CN110971525A (zh) * | 2019-11-26 | 2020-04-07 | 武汉大学 | 一种面向电力通信网的业务运行的业务路由寻址方法 |
-
2021
- 2021-04-15 CN CN202110407544.XA patent/CN113242213B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132149A1 (en) * | 2010-06-10 | 2013-05-23 | Dong Wei | Method for quantitative resilience estimation of industrial control systems |
CN106156885A (zh) * | 2016-06-27 | 2016-11-23 | 国家电网公司 | 一种电网整体脆弱性综合评价方法 |
CN106789190A (zh) * | 2016-12-05 | 2017-05-31 | 国网河南省电力公司信息通信公司 | 一种电力通信网脆弱性评估及路由优化方法 |
CN106603294A (zh) * | 2016-12-20 | 2017-04-26 | 国网新疆电力公司信息通信公司 | 一种基于电力通信网结构和状态的综合脆弱性评估方法 |
US20180176134A1 (en) * | 2016-12-21 | 2018-06-21 | Cisco Technology, Inc. | MACHINE LEARNING-DERIVED ENTROPY PATH GRAPH FROM IN-SITU OAM (iOAM) DATA |
US20180260561A1 (en) * | 2017-03-08 | 2018-09-13 | General Electric Company | Generic framework to detect cyber threats in electric power grid |
CN107193274A (zh) * | 2017-07-04 | 2017-09-22 | 广东电网有限责任公司电力调度控制中心 | 一种基于多维度综合指标的电网脆弱性评估方法 |
CN110020815A (zh) * | 2019-05-07 | 2019-07-16 | 云南电网有限责任公司 | 一种基于网络层次分析法的电网节点综合脆弱性指标计算方法 |
CN110191137A (zh) * | 2019-06-12 | 2019-08-30 | 北京理工大学 | 一种网络系统量化安全评估方法与装置 |
CN110971525A (zh) * | 2019-11-26 | 2020-04-07 | 武汉大学 | 一种面向电力通信网的业务运行的业务路由寻址方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114781674A (zh) * | 2022-06-16 | 2022-07-22 | 深圳市信润富联数字科技有限公司 | 风电设备故障的定位方法及装置、存储介质、电子设备 |
CN117554751A (zh) * | 2023-12-14 | 2024-02-13 | 胡波 | 基于人工智能的电力系统故障诊断系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113242213B (zh) | 2022-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111639497B (zh) | 一种基于大数据机器学习的异常行为发现方法 | |
CN113242213B (zh) | 一种电力通信骨干网节点脆弱性诊断方法 | |
CN107168995B (zh) | 一种数据处理方法及服务器 | |
CN110874744B (zh) | 一种数据异常检测方法及装置 | |
CN114444608B (zh) | 数据集质量评估方法及装置、电子设备及存储介质 | |
CN112202718B (zh) | 一种基于XGBoost算法的操作系统识别方法、存储介质及设备 | |
CN111310139A (zh) | 行为数据识别方法、装置及存储介质 | |
CN112579789A (zh) | 一种设备故障诊断的方法和装置及设备 | |
CN116862081B (zh) | 一种污染治理设备运维方法及系统 | |
CN107111609A (zh) | 用于神经语言行为识别系统的词法分析器 | |
CN115640159A (zh) | 一种微服务故障诊断方法及系统 | |
CN112801434A (zh) | 性能指标健康度的监测方法、装置、设备和存储介质 | |
CN111160959A (zh) | 一种用户点击转化预估方法及装置 | |
CN117034143A (zh) | 一种基于机器学习的分布式系统故障诊断方法及装置 | |
CN107977672A (zh) | 基于海量数据并行运算的sf6设备二级故障诊断方法 | |
CN113704389A (zh) | 一种数据评估方法、装置、计算机设备及存储介质 | |
Khoshgoftaar et al. | Detecting outliers using rule-based modeling for improving CBR-based software quality classification models | |
CN116599743A (zh) | 4a异常绕行检测方法、装置、电子设备及存储介质 | |
Zhang et al. | Predicting consistent clone change | |
CN114710344B (zh) | 一种基于溯源图的入侵检测方法 | |
CN110880117A (zh) | 虚假业务识别方法、装置、设备和存储介质 | |
CN115994093A (zh) | 测试用例推荐方法和装置 | |
CN111654853B (zh) | 一种基于用户信息的数据分析方法 | |
CN114416410A (zh) | 一种异常分析方法、设备和计算机可读存储介质 | |
CN113962216A (zh) | 文本处理方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |