CN117113234A

CN117113234A - 一种基于机器学习的输电线路故障检测方法及系统

Info

Publication number: CN117113234A
Application number: CN202311319053.5A
Authority: CN
Inventors: 马祥瑞; 马天资
Original assignee: Zhejiang Fenghui Energy Technology Co ltd; Jinan Quanxiao Electrical Equipment Co ltd
Current assignee: Zhejiang Fenghui Energy Technology Co ltd; Jinan Quanxiao Electrical Equipment Co ltd
Priority date: 2023-10-12
Filing date: 2023-10-12
Publication date: 2023-11-24

Abstract

本发明公开了一种基于机器学习的输电线路故障检测方法及系统，方法包括：数据采集、数据预处理、特征提取、输电线路故障检测和模型评估。本发明涉及故障检测技术领域，具体是指一种基于机器学习的输电线路故障检测方法及系统，本方案采用基于神经网络和多层感知器插补的混合模型进行缺失值插补，提高了缺失值插补的准确率，本方案在构建决策树模型进行特征划分时采用最大信息增益率进行划分，在信息增益的基础上计算信息拆分率和信息增益率，公平选择属性节点，全面评估特征的重要性，选择更准确的特征进行划分，提高了决策树模型的准确率。

Description

一种基于机器学习的输电线路故障检测方法及系统

技术领域

本发明涉及故障检测技术领域，具体是指一种基于机器学习的输电线路故障检测方法及系统。

背景技术

输电线路故障检测是电力系统运行和维护中的重要任务，输电线路连接电源和用户，输送电能，但在运行过程中，可能会出现各种故障，因此需要对输电线路进行故障检测。现有的一种基于机器学习的输电线路故障检测方法及系统存在着对采集的输电线路实时监测数据中的缺失值进行插补时，插补方法单一，插补精度低的问题；构建决策树模型进行特征划分时存在着属性节点选择不公平，导致构建的决策树模型陷入局部最优解而非全局最优解的问题。

发明内容

针对上述情况，为克服现有技术的缺陷，本发明提供一种基于机器学习的输电线路故障检测方法及系统，针对采集的输电线路实时监测数据中的缺失值进行插补时，插补方法单一，插补精度低的问题，本方案采用基于神经网络和多层感知器插补的混合模型进行缺失值插补，将采集的输电线路实时数据集以矩阵的形式作为模型的输入，对矩阵非缺失元素进行归一化处理，并计算L层中每个节点的输出数据集，得到多重插补后的输电线路预处理数据集，提高了缺失值插补的准确率；针对构建决策树模型进行特征划分时属性节点选择不公平，导致构建的决策树模型陷入局部最优解而非全局最优解的问题，本方案在构建决策树模型进行特征划分时采用最大信息增益率进行划分，在信息增益的基础上计算信息拆分率和信息增益率，公平选择属性节点，全面评估特征的重要性，选择更准确的特征进行划分，提高了决策树模型的准确率。

本发明采用的技术方法如下：本发明提供的一种基于机器学习的输电线路故障检测方法，该方法包括以下步骤：

步骤S1：数据采集，具体为采集输电线路的历史数据和实时监测数据；

步骤S2：数据预处理，具体为通过基于神经网络和多层感知器插补的混合模型进行缺失值插补，采集的输电线路实时数据集以矩阵的形式作为模型的输入，对矩阵非缺失元素进行归一化处理，并计算L层中每个节点的输出数据集，得到输电线路预处理数据集；

步骤S3：特征提取，具体为对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取，得到输电线路特征值数据集；

步骤S4：输电线路故障检测，具体为在构建决策树模型进行特征划分时采用最大信息增益率进行划分，在信息增益的基础上计算信息拆分率和信息增益率，得到输电线路故障检测结果；

步骤S5：模型评估，具体为通过对比输电线路历史数据集和输电线路故障检测结果，得到模型评估结果。

进一步地，在步骤S1中，所述数据采集，具体为采集输电线路的历史数据和对应标签，所述对应标签为正常状态和异常状态，得到输电线路历史数据集Ta，并设置时间间隔和监测位置，通过传感器和监控设备采集输电线路的实时监测数据，得到输电线路实时数据集Tb。

进一步地，在步骤S2中，所述数据预处理，具体为通过基于神经网络和多层感知器插补的混合模型进行缺失值插补，得到输电线路预处理数据集Tc，具体包括以下步骤：

步骤S21：构建基于神经网络和多层感知器插补的混合模型，具体为将输电线路实时数据集以M×q矩阵的形式输入模型，所用公式如下：

；

式中D表示模型的输入，d_t+e，n表示监测位置n处时间间隔e的监测量，M表示模型的时间间隔数，q表示监测位置的数量，t表示监测数据进行插补的起始时间，e表示时间间隔的索引，n表示监测位置的索引；

步骤S22：预设d_t+m，n中缺失N个元素，其中m表示缺失数据的起始时间间隔，n表示监测位置的索引，M=m+N；

步骤S23：归一化，具体为对矩阵非缺失元素进行归一化处理，得到归一化矩阵，所用公式如下：

；

式中，表示归一化矩阵，d_u，v表示去除缺失元素后的矩阵，M表示模型的时间间隔数，q表示监测位置的数量，t表示监测数据的起始时间；

步骤S24：计算L层中每个节点的输出数据集，具体为设置权重矩阵为W，偏差项矩阵为B，所用公示如下：

；

式中，z^[L]表示L层中每个节点的输出数据集，表示权重矩阵W中的元素，/>表示偏差项矩阵B中的元素，m表示缺失数据的起始时间间隔，n表示监测位置的索引；

步骤S25：设置输入到层L的数据为，采用激活函数tanh进行激活，所用公示如下：

；

式中，表示输入到层L的数据，tanh（）表示激活函数，z^[L]表示层L中每个节点的输出数据集；；

步骤S26：输出插补后的数据集，具体为通过计算L层中每个节点的输出数据集，得到输电线路预处理数据集Tc。

进一步地，在步骤S3中，所述特征提取，具体为通过对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取，得到输电线路特征值数据集Td。

进一步地，在步骤S4中，所述输电线路故障检测，具体为通过构建决策树模型进行数据分类，得到输电线路故障检测结果，具体包含以下步骤：

步骤S41：划分数据集，具体为通过将输电线路特征值数据集和对应标签作为样本数据集，所述对应标签为异常状态和正常状态，划分70%的样本数据作为训练数据集，其余30%样本数据作为测试数据集；

步骤S42：构建决策树模型，具体包含以下步骤：

步骤S421：以训练数据集被特征C划分为例，训练数据集表示为X={x₁，x₂，…，x_n}，特征C包含各种特征值；

步骤S422：计算训练数据集的信息熵，所用公式如下：

；

式中，Info（X）表示训练数据集的信息熵，i表示分类标签数目，p_i表示分类标签数目i的占比；

步骤S423：计算特征C对训练数据集的条件熵，具体为通过特征C对训练数据集进行划分，按照属性a划分成m份，得到特征C对训练数据集的条件熵，所用公式如下：

；

式中，Infoa（X）表示特征C对训练数据集的条件熵，X表示训练数据集，X_j表示任一样本数据，j表示样本数据的索引；

步骤S424：计算训练数据集的信息增益，所用公式如下：

；

式中，Gain（a）表示训练数据集的信息增益，Info（X）表示训练数据集的信息熵，Infoa（X）表示特征C对训练数据集的条件熵；

步骤S425：计算训练数据集的信息拆分率，所用公式如下：

；

式中，spInfoa（X）表示训练数据集的信息拆分率，X表示训练数据集，X_j表示任一样本数据，j表示样本数据的索引；

步骤S426：计算训练数据集的信息增益率，通过选择具有最大信息增益率的特征值及阈值进行划分操作，并不断对训练子集进行拆分，直至所有训练子集数据属于同一类别或无法再进行划分，所用公式如下：

；

式中，spGain（a）表示训练数据集的信息增益率，Gain（a）表示训练数据集的信息增益，spInfoa（X）表示训练数据集的信息拆分率；

步骤S43：决策树判定，预先设定测试阈值，利用决策树对测试数据集分类，分类时忽略标签维度，分类后将标签与分类结果对照，判定分类是否正确，若测试数据集的分类正确率高于测试阈值，则分类完成转至步骤S44；否则重新划分训练数据集和测试数据集并转至步骤S42；

步骤S44：具体运行，通过步骤S3得到的输电线路特征值数据集作为样本数据集进行分类，得到分类结果，输出输电线路故障检测结果。

进一步地，在步骤S5中，所述模型评估，具体为通过对比输电线路历史数据集和输电线路故障检测结果，得到模型评估结果，具体包含以下步骤：

步骤S51：计算模型的准确率，所用公式如下：

；

式中，Q表示模型的准确率，TP表示检测结果正确的样本数据，FP表示检测结果异常的样本数据；

步骤S52：计算模型的召回率，所用公式如下：

；

式中，K表示模型的召回率，TP表示检测结果正确的数据，FN表示检测结果正确但是被判断异常的样本数据；

步骤S53：计算模型的F1得分，所用公式如下：

；

式中，F1表示模型的F1得分，Q表示模型的准确率，K表示模型的召回率。

本发明提供的一种基于机器学习的输电线路故障检测系统，包含数据采集模块、数据预处理模块、特征提取模块、输电线路故障检测模块和模型评估模块；

所述数据采集模块采集输电线路的历史数据和对应标签，所述对应标签为正常状态和异常状态，得到输电线路历史数据集，并设置时间间隔和监测位置，通过传感器和监控设备采集输电线路的实时监测数据，得到输电线路实时数据集，并将输电线路历史数据集发送至模型评估模块，将输电线路实时数据集发送至数据预处理模块；

所述数据预处理模块接收来自数据采集模块的输电线路实时数据集，采用基于神经网络和多层感知器插补的混合模型进行缺失值插补，得到输电线路预处理数据集，并将输电线路预处理数据集发送至特征提取模块；

所述特征提取模块接收来自数据预处理模块的输电线路预处理数据集，对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取，得到输电线路特征值数据集，并将输电线路特征值数据集发送至输电线路故障检测模块；

所述输电线路故障检测模块接收来自特征提取模块的输电线路特征值数据集，通过构建决策树模型进行数据分类，得到输电线路故障检测结果，并将输电线路故障检测结果发送至模型评估模块；

所述模型评估模块接收来自数据采集模块的输电线路历史数据集和输电线路故障检测模块的输电线路故障检测结果，通过对比输电线路历史数据集和输电线路故障检测结果，得到模型评估结果。

采用上述方案本发明取得的有益效果如下：

（1）针对采集的输电线路实时监测数据中的缺失值进行插补时，插补方法单一，插补精度低的问题，本方案采用基于神经网络和多层感知器插补的混合模型进行缺失值插补，将采集的输电线路实时数据集以矩阵的形式作为模型的输入，对矩阵非缺失元素进行归一化处理，并计算L层中每个节点的输出数据集，得到多重插补后的输电线路预处理数据集，提高了缺失值插补的准确率。

（2）针对构建决策树模型进行特征划分时属性节点选择不公平，导致构建的决策树模型陷入局部最优解而非全局最优解的问题，本方案在构建决策树模型进行特征划分时采用最大信息增益率进行划分，在信息增益的基础上计算信息拆分率和信息增益率，公平选择属性节点，全面评估特征的重要性，选择更准确的特征进行划分，提高了决策树模型的准确率。

附图说明

图1为本发明提供的一种基于机器学习的输电线路故障检测方法的流程示意图；

图2为本发明提供的一种基于机器学习的输电线路故障检测系统的结构框图；

图3为步骤S2的流程示意图；

图4为步骤S4的流程示意图。

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例；基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要理解的是，术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

实施例一，参阅图1，本发明提供的一种基于机器学习的输电线路故障检测方法，该方法包括以下步骤：

实施例二，参阅图1，该实施例基于上述实施例，在步骤S1中，所述数据采集，具体为采集输电线路的历史数据和对应标签，所述对应标签为正常状态和异常状态，得到输电线路历史数据集Ta，并设置时间间隔和监测位置，通过传感器和监控设备采集输电线路的实时监测数据，得到输电线路实时数据集Tb。

实施例三，参阅图1和图3，该实施例基于上述实施例，在步骤S2中，所述数据预处理，具体为通过基于神经网络和多层感知器插补的混合模型进行缺失值插补，得到输电线路预处理数据集Tc，具体包括以下步骤：

；

式中，表示输入到层L的数据，tanh（）表示激活函数，z^[L]表示层L中每个节点的输出数据集；

通过执行上述操作，针对采集的输电线路实时监测数据中的缺失值进行插补时，插补方法单一，插补精度低的问题，本方案采用基于神经网络和多层感知器插补的混合模型进行缺失值插补，将采集的输电线路实时数据集以矩阵的形式作为模型的输入，对矩阵非缺失元素进行归一化处理，并计算L层中每个节点的输出数据集，得到多重插补后的输电线路预处理数据集，提高了缺失值插补的准确率。

实施例四，参阅图1，该实施例基于上述实施例，在步骤S3中，所述特征提取，具体为通过对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取，得到输电线路特征值数据集Td。

实施例五，参阅图1和图4，该实施例基于上述实施例，在步骤S4中，所述输电线路故障检测，具体为通过构建决策树模型进行数据分类，得到输电线路故障检测结果，具体包含以下步骤：

步骤S42：构建决策树模型，具体包含以下步骤：

步骤S422：计算训练数据集的信息熵，所用公式如下：

；

式中，Infoa（X）表示特征C对训练数据集的条件熵，X表示训练数据集，Xj表示任一样本数据，j表示样本数据的索引；

步骤S424：计算训练数据集的信息增益，所用公式如下：

；

步骤S425：计算训练数据集的信息拆分率，所用公式如下：

；

通过执行上述操作，针对构建决策树模型进行特征划分时属性节点选择不公平，导致构建的决策树模型陷入局部最优解而非全局最优解的问题，本方案在构建决策树模型进行特征划分时采用最大信息增益率进行划分，在信息增益的基础上计算信息拆分率和信息增益率，公平选择属性节点，全面评估特征的重要性，选择更准确的特征进行划分，提高了决策树模型的准确率。

实施例六，参阅图1，该实施例基于上述实施例，在步骤S5中，所述模型评估，具体为通过对比输电线路历史数据集和输电线路故障检测结果，得到模型评估结果，具体包含以下步骤：

步骤S51：计算模型的准确率，所用公式如下：

；

步骤S52：计算模型的召回率，所用公式如下：

；

步骤S53：计算模型的F1得分，所用公式如下：

；

实施例七，参阅图2，该实施例基于上述实施例，本发明提供的一种基于机器学习的输电线路故障检测系统，包含数据采集模块、数据预处理模块、特征提取模块、输电线路故障检测模块和模型评估模块；

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

以上对本发明及其实施方式进行了描述，这种描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.一种基于机器学习的输电线路故障检测方法，其特征在于：该方法包括以下步骤：

2.根据权利要求1所述的一种基于机器学习的输电线路故障检测方法，其特征在于：在步骤S2中，所述数据预处理，具体为通过基于神经网络和多层感知器插补的混合模型进行缺失值插补，得到输电线路预处理数据集Tc，具体包括以下步骤：

；

步骤S24：计算L层中每个节点的输出数据集，具体为设置权重矩阵为W，偏差项矩阵为B，所用公式如下：

；

步骤S25：设置输入到层L的数据为，采用激活函数tanh进行激活，所用公式如下：

；

3.根据权利要求1所述的一种基于机器学习的输电线路故障检测方法，其特征在于：在步骤S4中，所述输电线路故障检测，具体为通过构建决策树模型进行数据分类，得到输电线路故障检测结果，具体包含以下步骤：

步骤S42：构建决策树模型，具体包含以下步骤：

步骤S421：训练数据集被特征C划分，训练数据集表示为X={x₁，x₂，…，x_n}，特征C包含各种特征值；

步骤S422：计算训练数据集的信息熵，所用公式如下：

；

步骤S424：计算训练数据集的信息增益，所用公式如下：

；

步骤S425：计算训练数据集的信息拆分率，所用公式如下：

；

4.根据权利要求1所述的一种基于机器学习的输电线路故障检测方法，其特征在于：在步骤S5中，所述模型评估，具体为通过对比输电线路历史数据集和输电线路故障检测结果，得到模型评估结果，具体包含以下步骤：

步骤S51：计算模型的准确率，所用公式如下：

；

步骤S52：计算模型的召回率，所用公式如下：

；

步骤S53：计算模型的F1得分，所用公式如下：

；

5.根据权利要求1所述的一种基于机器学习的输电线路故障检测方法，其特征在于：在步骤S3中，所述特征提取，具体为通过对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取，得到输电线路特征值数据集Td。

6.根据权利要求1所述的一种基于机器学习的输电线路故障检测方法，其特征在于：在步骤S1中，所述数据采集，具体为采集输电线路的历史数据和对应标签，所述对应标签为正常状态和异常状态，得到输电线路历史数据集Ta，并设置时间间隔和监测位置，通过传感器和监控设备采集输电线路的实时监测数据，得到输电线路实时数据集Tb。

7.一种基于机器学习的输电线路故障检测系统，用于实现如权利要求1-6中任一项所述的一种基于机器学习的输电线路故障检测方法，其特征在于：包含数据采集模块、数据预处理模块、特征提取模块、输电线路故障检测模块和模型评估模块。

8.根据权利要求7所述的一种基于机器学习的输电线路故障检测系统，其特征在于：所述数据采集模块采集输电线路的历史数据和对应标签，所述对应标签为正常状态和异常状态，得到输电线路历史数据集，并设置时间间隔和监测位置，通过传感器和监控设备采集输电线路的实时监测数据，得到输电线路实时数据集，并将输电线路历史数据集发送至模型评估模块，将输电线路实时数据集发送至数据预处理模块；