CN113242213A

CN113242213A - 一种电力通信骨干网节点脆弱性诊断方法

Info

Publication number: CN113242213A
Application number: CN202110407544.XA
Authority: CN
Inventors: 李琦; 金翠; 特古斯; 石磊; 程晓磊; 蔡文斌; 王鹏; 吕海霞; 王渊; 李晔
Original assignee: Economic and Technological Research Institute of State Grid Inner Mongolia Electric Power Co Ltd
Current assignee: Economic and Technological Research Institute of State Grid Inner Mongolia Electric Power Co Ltd
Priority date: 2021-04-15
Filing date: 2021-04-15
Publication date: 2021-08-10
Anticipated expiration: 2041-04-15
Also published as: CN113242213B

Abstract

本发明涉及一种电力通信骨干网节点脆弱性诊断方法，首先获取待诊断的电力通信网的拓扑结构和运行数据；其次，从拓扑结构、带宽配置、运行态势等方面对节点进行特征筛选，选出适合全面诊断需求的特征；然后，运用改进的随机森林算法对节点的脆弱性进行诊断；最后，将最终产生的电力通信骨干网的各节点脆弱性结果与待诊断的电力通信网骨干网设备节点对应设置，可实现对电力通信网的节点进行全面、动态、智能地脆弱性诊断。

Description

一种电力通信骨干网节点脆弱性诊断方法

技术领域

本发明涉及电力系统通信技术领域，特别是一种在电力通信骨干网的节点脆弱性诊断方法。

背景技术

随着泛在电力物联网的推行，准确辨识电力通信网的关键节点，可有效地降低电力通信网的脆弱性，保障网络的正常运行。节点重要度越大，节点脆弱值也越高，面临的脆弱性威胁越大。在现有的研究中，对节点重要度的评价方法大都只考虑网络拓扑层面，或者结合拓扑结构和业务重要性两方面进行评价，这些方法所涉及的指标特征较为单一、所运用的评估算法也较为传统。

发明内容

有鉴于此，本发明的目的是提出一种电力通信骨干网的节点脆弱性诊断方法，利用大数据和机器学习算法识别电力通信网中节点的脆弱性，可考虑节点的多方面特征属性，包括拓扑结构、带宽配置、运行态势等方面，将对节点脆弱性进行更全面的诊断。

本发明采用以下方案实现：一种电力通信骨干网节点脆弱性诊断方法，包括以下步骤：

步骤S1：获取待诊断的电力通信骨干网的拓扑结构和运行数据，所述运行数据包括带宽配置、运行状态；

步骤S2：通过拓扑结构、带宽配置、运行状态对电力通信网节点进行特征选取；

步骤S3：运用改进的随机森林算法对节点进行脆弱性诊断。

进一步的，还包括步骤S4：通过将节点脆弱性诊断结果与待诊断的电力通信骨干网节点对应设置。

进一步的，所述步骤S1具体还包括以下子步骤：

S11：获取待诊断的电力通信骨干网节点设备的邻接矩阵A＝(a_ij)_n×n；当a_ij＝1时，表示节点i和节点j之间有连接；当a_ij＝0时，表示节点i和节点j之间无连接；其中，所述n表示该电力通信骨干网的节点数；

S12:获取运行数据，所述运行数据包括节点设备的配置带宽、节点设备的已使用带宽、节点设备投运年龄、节点的设备类型、节点设备类型历史故障次数。

进一步的，所述步骤S2具体还包括以下子步骤：

步骤S201：选取特征属性；

步骤S202：通过对步骤S201选取的特征属性进行数据标准化处理，消除量纲对精确识别特征属性和脆弱性诊断结果之间关系的影响；具体如下：

正向指标：所述正向指标指该指标指越大，节点被诊断为脆弱性大的可能性越高；根据如下公式对正向指标x₁,x₂,x₄,x5，x₆,x₇正向指标进行数据标准化处理；

式中，i表示节点编号，j表示属性标号；x_j(i)表示数据标准化处理前第i个节点的第j个属性值，x_j(i)′表示数据标准化处理后第i个节点的第j个属性值；

负向指标：负向指标指该指标指越大，节点被诊断为脆弱性大的可能性越低；，根据如下公式对负向指标x3做数据归一化处理；

式中，i表示节点编号，j表示属性标号；x_j(i)表示数据标准化处理前第i个节点的第j个属性值，x_j(i)′表示数据标准化处理后第i个节点的第j个属性值。

进一步的，所述特征属性包括，节点介数、节点度、带宽配置、已使用带宽、节点设备投运年龄、节点的设备类型、节点设备类型历史故障次数；其中，

所述节点介数在全局网络中，通过迪杰斯特拉算法求邻接矩阵A＝(a_ij)_n×n中任意两点间的最短路径，计算出经过节点i的最短路径数目x₁(i)；

所述节点度x₂(i)通过拓扑结构计算得出；

所述带宽配置x₃(i)通过台账信息进行收集；

所述已使用带宽x₄(i)通过台账信息进行收集；

所述节点设备的投运年龄x₅(i)通过台账信息进行收集；

所述节点的设备类型x₆(i)通过台账信息进行收集；

所述节点设备的历史故障次数x₇(i)通过台账信息进行收集。

进一步的，所述步骤S3诊断方法，具体包括以下子步骤：

S301.将步骤S202中归一化处理后的数据结果和人工分类的节点脆弱性诊断结果Y＝[y(i)]_n×1组合成随机森林算法所需的数据集data；

S302.数据集data中，y(i)∈{1,0}，若y(i)＝1，则表示节点i被分类为脆弱性大的节点；若y(i)＝0，则表示节点i被分类为脆弱性小的节点；

S303.节点脆弱性大小的划分依据如下：根据特征属性集合对节点的脆弱性大小进行人工分类，将1/2的节点划分为脆弱性大的节点，将剩下1/2的节点划分为脆弱性小的节点；

S304.将数据集data按一定的比例划分为随机森林算法的训练集data-train和测试集data-test。

进一步的，所述改进随机森林算法具体包括以下步骤：

S311.输入：训练集data-train；

随机森林中的决策树数目trees-num；

确定随机抽取的特征子集的大小m；

测试样例data-test1；

S312.从训练集data-train中按一定比例有放回的抽取一个子集T(i),一共构建trees-num个子集；

S313.在每个子集T(i)中，从7个特征属性中随机抽取m个属性，用决策树算法在训练子集T(i)上训练决策树DT(i)；

S314.将步骤S313重复trees-num次，然后训练出trees-num棵决策树，形成一个随机森林；

S315.将决策树DT(i)对训练子集T(i)进行脆弱性决策诊断，并计算每个DT(i)决策诊断的正确率CR(i)；

S316.改进随机森林算法的加成投票机制。

进一步的，所述加成投票机制具体如下：

S3161.当trees-num棵决策树对某个样例节点i进行脆弱性诊断时，诊断结果为“1”的决策树构成集合DT1＝{DT(1),...,DT(i),...DT(n_a)}；诊断结果为“0”的决策树构成集合DT0＝{DT(1),...,DT(i),...DT(n_b)}，其中，所述n_a为集合DT1的元素个数，n_b为集合DT0的元素个数；

S3162.在集合DT1中找出正确率最高的最佳决策树，再计算集合DT1中其他决策树对最佳决策树的正确率CR_A的加成效果，用来表征整个集合DT1的诊断正确率CR1；加成机制定义如下式：

其中，所述CR1表示集合DT1的正确率；CR_A表示集合DT1的最佳决策树的正确率；na-1表示集合DT1除了最佳决策树后剩下的决策树数目；CR(i)表示表示除了最佳决策树后剩下的决策树的正确率；q表示加成因子，需要具体调节该参数值；

S3163.在集合DT0中找出正确率最高的最佳决策树，再计算集合DT0中其他决策树对最佳决策树的正确率CR_B的加成效果，用来表征整个集合DT0的诊断正确率CR0；加成机制定义如下式：

其中，CR0表示集合DT0正确率；CR_B表示集合DT0的最佳决策树的正确率；n_b-1表示集合DT0除了最佳决策树后剩下的决策树数目；CR(i)表示表示除了最佳决策树后剩下的决策树的正确率；q表示加成因子，需要具体调节该参数值；

S3164.将CR1和CR0进行比较，若CR1>＝CR0，则改进随机森林对样例节点i的投票结果为“1”，否则，投票结果为“0”；

S3165.输出测试样例data-test1的诊断类别标签y-test(i)

本发明的有益效果：

(1)本发明不仅使对电力通信网的诊断跳出传统的拓扑诊断，还能根据现今的运行态势进行动态诊断。每更新一次节点的运行数据，即可得到相应的脆弱性诊断结果，为电力通信网脆弱节点的更新、巡检提供智能辅助决策；

(2)本发明提出一种基于随机森林改进的电力通信网节点脆弱性诊断方法，对电力通信网的运行数据进行数据挖掘，可得出更加科学可靠的电力通信网节点脆弱性诊断结果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的方法流程示意图；

图2为本发明实施例的步骤S3的流程示意图；

图3为原始随机森林和本发明改进算法的两种算法的诊断结果对比图；

图4为原始随机森林和本发明改进算法的两种算法的预测效果对比图；

图5为原始随机森林和本发明改进算法的ROC曲线对比图；

图6为本发明验证集使用的某市电力通信网拓扑图；

图7中本发明对某市电力通信网脆弱性诊断结果。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1所示，本实施例提供了一种电力通信骨干网的节点脆弱性诊断方法，具体包括以下步骤：

步骤S1：获取待诊断的电力通信骨干网的拓扑结构和运行数据；

步骤S2：从拓扑结构、带宽配置、运行状态等方面对电力通信网节点进行特征选取；

步骤S3：运用改进的随机森林算法对节点进行脆弱性诊断；

步骤S4：将节点脆弱性诊断结果与待诊断的电力通信骨干网节点对应设置，可实现对电力通信网的节点进行全面、动态、智能地脆弱性诊断。

进一步地，步骤S1具体为：

1)获取待诊断的电力通信骨干网节点设备的邻接矩阵A＝(a_ij)_n×n。若a_ij＝1，表示节点i和节点j之间有连接；若a_ij＝0，表示节点i和节点j之间无连接；n表示该电力通信骨干网的节点数。

2)获取节点设备配置带宽、节点设备已使用带宽、节点设备投运年龄、节点的设备类型、节点设备的历史故障数等基本运行数据。

进一步地，步骤S2中，所述从拓扑结构、带宽配置、运行状态等方面对电力通信网节点进行特征选取具体包括以下步骤：

步骤S21：选取介数、节点度、节点设备配置带宽、节点设备已使用带宽、节点设备投运年龄、节点的设备类型、节点设备的历史故障次数等七个特征属性。各特征属性的计算公式和定义如下：

1)介数，表征节点i在全局拓扑结构中的关键度信息。计算方法，在全局网络中，用迪杰斯特拉算法(Dijkstra)求邻接矩阵A＝(a_ij)_n×n中任意两点间的最短路径，计算出经过节点i的最短路径数目x₁(i)。

2)节点度x₂(i)：与节点i直接连接的节点数目，该值由拓扑结构计算得出。

3)带宽配置x₃(i)：由台账信息收集。

4)已使用带宽x₄(i):由台账信息收集。

5)节点设备投运年龄x₅(i)：由台账信息收集。

6)节点的设备类型x₆(i)：由台账信息收集。

7)节点设备的历史故障次数x₇(i)：由台账信息收集。

步骤S22：为消除量纲对精确识别特征属性和脆弱性诊断结果之间关系的影响，对各特征属性进行数据标准化处理，具体如下：

1)针对x₁,x₂,x₄,x₅,x₆,x₇等正向指标，根据公式(1)做数据标准化处理。

式中，i表示节点编号，j表示属性标号。x_j(i)表示数据标准化处理前第i个节点的第j个属性值，x_j(i)′表示数据标准化处理后第i个节点的第j个属性值。

2)针对x₃等负向指标，根据公式(2)做数据归一化处理。

进一步地，步骤S3具体包括以下步骤：

1、步骤S3中，所述运用改进的随机森林算法对节点的脆弱性进行诊断具体包括以下步骤：

步骤S31：构建改进随机森林算法对节点脆弱性诊断所需的训练集、测试集

1)有训练集数据，才能训练随机算法的模型。因此，将步骤S22中归一化处理后的数据结果和人工分类的节点脆弱性诊断结果Y＝[y(i)]_n×1组合成随机森林算法所需的数据集

2)数据集

中，y(i)∈{1,0}，若y(i)＝1，则表示节点i为脆弱性大的节点；若y(i)＝0，则表示节点i为脆弱性小的节点。

3)节点脆弱性大小的划分依据如下：根据特征属性集合对节点的脆弱性大小进行人工分类，将1/2的节点划分为脆弱性大的节点，将剩下1/2的节点划分为脆弱性小的节点。

4)将数据集data按一定的比例划分为随机森林算法的训练集data-train和测试集data-test。

步骤S32：所述改进的随机森林算法具体包括以下步骤：

1)输入：

训练集

其中，n₁为训练集的样本数目。

确定随机森林中的决策树数目trees-num；

确定随机抽取的特征子集的大小m；

测试样例

其中，n₂为测试样例的样本数目。

2)从训练集data-train中按一定比例有放回的抽取一个子集T(i),一共构建trees-num个子集。

3)在每个子集T(i)中，从7个特征属性中随机抽取m个属性，用决策树算法在训练子集T(i)上构建决策树DT(i)。

4)将步骤3重复trees-num次，然后构建trees-num棵决策树，形成一个随机森林。

5)将DT(i)用于整个训练集data-train的脆弱性决策诊断，并计算每个DT(i)决策诊断的正确率CR(i)。

6)改进随机森林算法的加成投票机制，该机制定义如下：

当trees-num棵决策树对某个样例节点i进行脆弱性诊断时，诊断结果为“1”的决策树构成集合DT1＝{DT(1),...,DT(i),...DT(n_a)}；诊断结果为“0”的决策树构成集合DT0＝{DT(1),...,DT(i),…DT(n_b)}。其中n_a为集合DT1的元素个数，n_b为集合DT0的元素个数。

在集合DT1中找出正确率最高的最佳决策树，再计算集合DT1中其他决策树对最佳决策树的正确率CR_A的加成效果，用来表征整个集合DT1的诊断正确率CR1。加成机制定义如下式：

式中，CR1：集合DT1正确率。

CRA：集合DT1的最佳决策树的正确率。

n_a-1：集合DT1除了最佳决策树后剩下的决策树数目。

CR(i)：表示除了最佳决策树后剩下的决策树的正确率。

q：加成因子，需要具体调节该参数值。

同理，在集合DT0中找出正确率最高的最佳决策树，再计算集合DT0中其他决策树对最佳决策树的正确率CR_B的加成效果，用来表征整个集合DT0的诊断正确率CR0。加成机制定义如下式：

式中，CR0：集合DT0正确率。

CRB：集合DT0的最佳决策树的正确率。

n_b-1：集合DT0除了最佳决策树后剩下的决策树数目。

CR(i)：表示除了最佳决策树后剩下的决策树的正确率。

q：加成因子，需要具体调节该参数值。

将CR1和CR0进行比较，若CR1>＝CR0，则改进随机森林对样例节点i的投票结果为“1”，否则，投票结果为“0”。

7)输出：测试样例data-test1的诊断类别标签y-test(i)。

进一步地，步骤S4具体包括以下步骤：

将步骤S32中的节点脆弱性诊断结果与待诊断的电力通信骨干网节点对应设置，可实现对电力通信网的节点进行全面、动态、智能地脆弱性诊断。

特别的，将本发明用于某市的电力通信网络进行节点脆弱性诊断实验。该网络存在1104个节点，将704个节点的数据用于做训练集，将400个节点的数据用于做测试集。

本实施例将本实施例的方法与原始的随机森林算法进行对比。

本实例运用混淆矩阵对节点诊断结果进行预测结果对比分析。具体的，在对节点进行脆弱性预测时，会出现以下的诊断情况。

TP(True Positive)：正确分类脆弱性大的节点数；

TN(True Negative)：正确分类脆弱性小的节点数；

FP(False Positive)：错误分类脆弱性大的节点数；

FN(False Negative)：错误分类脆弱性小的节点数。

两种算法对于测试集的诊断结果如下表所示：

图3为两种算法的诊断结果对比图。

本发明对电力通信网的节点进行脆弱性诊断，实际上也是一个预测问题。因此，采用以下指标对两种算法进行预测效果评价。

1)精确度

精确率指模型预测为正的样本中实际也为正的样本占被预测为正的样本的比例。计算公式为：

精确度Precision＝TP/(TP+FP)

2)召回率

召回率指实际为正的样本中被预测为正的样本所占实际为正的样本的比例。计算公式为：

召回率Recall＝TP/(TN+FN)

3)真正例率(TPR)

真正例率(TPR)表示预测为正例且真实情况为正例的，占所有真实情况中正例的比率。

TPR＝TP/(TP+FN)

4)假正例率(FPR)

假正例率(FPR)表示预测为正例但真实情况为反例的，占所有真实情况中反例的比率。

FPR＝FP/(FP+TN)

对两种算法的评价效果如下表所示：

图4为两种算法的评价效果对比图。

为准确识别两种算法的优劣性，以TPR为纵坐标，以FPR为横坐标绘制ROC曲线。当曲线与直线x＝1,y＝0围成的面积越大，说明该算法的预测效果越好。

两种算法的ROC曲线与直线x＝1,y＝0围成的面积如下表所示。

图5为两种算法的ROC曲线对比图。

由上表可知，相比于原始随机森林算法，采用本发明算法进行电力通信网节点脆弱性诊断，可获得更优的诊断效果。

以上实例用于说明本发明相比于传统随机森林算法的优越性。最后，运用本发明已经训练出的算法模型，对图6所示的实际的电力通信网进行节点脆弱性诊断，输出如图7所示的诊断结果。在图7中，红色节点为脆弱性大的节点，蓝色节点为脆弱性小的节点。根据本发明的诊断结果，应当加强该网络中脆弱性大的节点的巡检与监测，以保证电力通信网络的安全可靠运行。

经过上述仿真结果可以说明：利用本发明识别电力通信网中节点的脆弱性，可对节点的多方面特征属性进行覆盖，包括拓扑结构、带宽配置、运行态势等方面，将对节点脆弱性进行更全面的诊断。不仅使对电力通信网的诊断跳出传统的拓扑诊断，还能根据现今的运行态势进行动态诊断，为电力通信网脆弱节点的更新、巡检提供智能辅助决策。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅是本发明的较佳实施例而已，并非是对本发明作其它形式的限制，任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型，仍属于本发明技术方案的保护范围。

Claims

1.一种电力通信骨干网节点脆弱性诊断方法，其特征在于，包括以下步骤：

步骤S3：运用改进的随机森林算法对节点进行脆弱性诊断。

2.根据权利要求1所述的一种电力通信骨干网节点脆弱性诊断方法，其特征在于，还包括步骤S4：通过将节点脆弱性诊断结果与待诊断的电力通信骨干网节点对应设置。

3.根据权利要求1所述的一种电力通信骨干网节点脆弱性诊断方法，其特征在于，所述步骤S1具体还包括以下子步骤：

4.根据权利要求1所述的一种电力通信骨干网节点脆弱性诊断方法，其特征在于，所述步骤S2具体还包括以下子步骤：

步骤S201：选取特征属性；

正向指标：所述正向指标指该指标指越大，节点被诊断为脆弱性大的可能性越高；根据如下公式对正向指标x₁,x₂,x₄,x₅，x₆,x₇正向指标进行数据标准化处理；

5.根据权利要求4所述的一种电力通信骨干网节点脆弱性诊断方法，其特征在于，所述特征属性包括，节点介数、节点度、带宽配置、已使用带宽、节点设备投运年龄、节点的设备类型、节点设备类型历史故障次数；其中，

所述节点度x₂(i)通过拓扑结构计算得出；

所述带宽配置x₃(i)通过台账信息进行收集；

所述已使用带宽x₄(i)通过台账信息进行收集；

所述节点设备的投运年龄x₅(i)通过台账信息进行收集；

所述节点的设备类型x₆(i)通过台账信息进行收集；

所述节点设备的历史故障次数x₇(i)通过台账信息进行收集。

6.根据权利要求4所述的一种电力通信骨干网节点脆弱性诊断方法，其特征在于，所述步骤S3诊断方法，具体包括以下子步骤：

7.根据权利要求6所述的一种电力通信骨干网节点脆弱性诊断方法，其特征在于，所述改进随机森林算法具体包括以下步骤：

S311.输入：训练集data-train；

随机森林中的决策树数目trees-num；

确定随机抽取的特征子集的大小m；

测试样例data-test1；

S316.改进随机森林算法的加成投票机制。

8.根据权利要求7所述的一种电力通信骨干网节点脆弱性诊断方法，其特征在于，所述加成投票机制具体如下：

其中，所述CR1表示集合DT1的正确率；CR_A表示集合DT1的最佳决策树的正确率；n_a-1表示集合DT1除了最佳决策树后剩下的决策树数目；CR(i)表示表示除了最佳决策树后剩下的决策树的正确率；q表示加成因子，需要具体调节该参数值；

S3165.输出测试样例data-test1的诊断类别标签y-test(i)。