发明内容
为了解决现有技术对光伏变压器的电故障检测方法存在故障判断误差较大且判断结果不够准确的技术问题,本发明的目的在于提供一种光伏变压器电故障检测方法,所采用的技术方案具体如下:
本发明提出了一种光伏变压器电故障检测方法,所述方法包括:
根据预设采样频率采集预设时间长度内的光伏变压器的电压数据得到电压时序序列;
通过聚类算法对电压时序序列中电压数据进行聚类分析得到两个以上电压数据集合;
基于每个电压数据集合内的电压数据拟合高斯混合模型;通过计算两两电压数据集合之间的高斯混合模型的相似性得到每个电压数据集合的初步判定值,对每个电压数据集合的初步判定值通过预设判定阈值筛选出异常电故障数据集合和正常数据集合,根据异常电故障数据集合和正常数据集合之间的数据差异与所述异常电故障数据集合中每个异常电故障数据和相邻异常电故障数据之间的差异计算每个异常电故障数据对应的电故障真实度;
根据电故障真实度在异常电故障数据集合中筛选出真实电故障数据;根据真实电故障数据检测光伏电压器的故障情况。
进一步地,所述通过聚类算法对电压时序序列中电压数据进行聚类分析得到两个以上电压数据集合包括:
通过DBSCAN聚类算法根据预设邻域最大半径和预设最小点,自适应选取核心点对电压时序序列中电压数据进行聚类分析得到两个以上电压数据集合。
进一步地,核心点的获取方法包括:
将电压时序序列平均分为两个以上电压数据子序列,根据电压数据在电压时序序列和电压数据子序列的分布情况建立数据熵分析模型,得到每个电压数据对应的数据熵,所述数据熵分析模型包括:
获取目标电压数据与其所在的电压数据子序列中电压值相同的电压数据之间空间距离的方差并记为第一方差,获取目标电压数据在电压时序序列中与目标电压数据的电压值相同的电压数据之间空间距离的方差并记为第二方差,计算第一方差与第二方差之间的比值得到方差比值,根据与目标电压数据电压值相同的电压数据在电压时序序列中出现的概率计算分布熵,将分布熵和方差比值的乘积作为目标电压数据的数据熵;改变目标电压数据得到所有电压数据的数据熵;选取与预设核心点相同数量的最小数据熵对应的电压数据作为聚类分析的核心点。
进一步地,每个电压数据集合的初步判定值获取方法包括:
在所有电压数据集合的高斯混合模型上设置预设数量个固定采样点;计算其他电压数据集合与目标电压数据集合之间对应固定采样点的高斯混合模型值的模型值相似性,将模型值相似性的均值作为目标电压数据的初步判定值;
改变目标电压数据集合得到所有电压数据集合对应的初步判定值。
进一步地,所述对每个电压数据集合的初步判定值通过预设判定阈值筛选出异常电故障数据集合和正常数据集合包括:
将初步判定值大于预设判定阈值的电压数据集合记为异常电故障数据集合,将初步判定值小于等于预设判定阈值的电压数据集合记为正常数据集合。
进一步地,电故障真实度的获取方法包括:
获得目标异常电故障数据与每个正常数据集合的元素均值的第一数据差异,以最小数据差异作为第一参考数据差异;
获得目标异常电故障数据与相邻其他异常电故障数据的第二数据差异,若目标异常电故障数据存在两个相邻其他异常电故障数据,则选择最小的第二数据差异作为第二参考数据差异;否则,将所述第二数据差异作为第二参考数据差异;
第一次参考数据差异和第二参考数据差异的和值作为目标异常电故障数据的电故障真实度;改变目标异常电故障数据得到所有异常电故障数据的电故障真实度。
进一步地,所述根据真实电故障数据检测光伏电压器的故障情况包括:
将所有真实电故障数据的电故障真实度的累加值作为电故障检测指标,当电故障检测指标大于预设故障阈值时,认为光伏电压器存在故障。
本发明具有如下有益效果:
考虑到直接采用聚类后的数据进行异常数据的判定会产生许多判断误差,因此本发明基于对聚类后的数据分布拟合高斯混合模型,通过计算两两电压数据集合之间的相似性得到电压数据的初步判定值,根据初步判定值筛选出异常电故障数据集合,使得得到的异常电故障数据集合更能准确的表征故障情况,即降低了故障检测的误差。由于通过异常数据与正常数据进行对比判断光伏变压器的电故障情况,所得到的故障检测结果不能排除噪声数据和偶然产生的突变数据对故障检测的影响,所以本发明针对噪声数据和突变数据的特殊性,通过异常电故障数据集合中数据本身与正常数据集合中数据的差异和异常电故障数据在电压时序序列中与相邻数据的差异,计算每个异常电故障数据的电故障真实度,本发明所得到的电故障真实度同时表征了异常电故障数据个体与整体上的差异情况,使得对变压器的故障检测精度更高。综上所述,本发明在降低故障检测误差的同时提高了故障检测的精度。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种光伏变压器电故障检测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种光伏变压器电故障检测方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种光伏变压器电故障检测方法流程图,该方法包括:
步骤S1:根据预设采样频率采集预设时间长度内的光伏变压器的电压数据得到电压时序序列。
本发明目的是实现光伏变压器的电故障检测,考虑到光伏变压器的电故障通常不会表现在光伏电压器的表面,因此本发明通过对光伏变压器工作过程中的电参数进行分析以实现对光伏变压器的电故障检测。需要说明的是,在光伏变压器的工作过程中能够通过光伏变压器的电压和电流等电参数的分析实现对光伏变压器的电故障检测,而本发明所提供的电故障检测方法对不同种类的电参数分析过程一致,因此本发明实施例仅对电参数数据的电压数据进行分析,其他电参数数据的处理方法与电压数据的处理方法一致。
首先通过相应的传感器采集对应的电参数数据,考虑到光伏变压器的电参数数据位连续性的数据,为了方便后续对数据的分析,本发明将所采集到的电参数数据离散化。具体电参数数据采集过程为:通过传感器根据预设采样频率采集预设时间长度内对应的电参数数据,得到对应的电参数时序序列。在本发明实施例中,通过电压传感器采集光伏变压器的电压数据,预设采样频率为一秒一次,预设时间长度为300秒,根据预设采样频率和预设时间长度采集得到电压时序序列,即所采集到的电压时序序列长度为300,其中每一个数据代表每一秒所采集到的电压数据的电压值。需要说明的是,其他电参数数据的采集和后续的处理方法与电压数据一致,后续的处理方法以电压数据为例进行说明。
步骤S2:通过聚类算法对电压时序序列中电压数据进行聚类分析得到两个以上电压数据集合。
至此,通过步骤S1得到电压数据对应的电压时序序列,该电压时序序列为后续分析检测电故障的基础数据。考虑到当光伏电压器出现电故障情况时,对应的电压时序序列中数据分布会存在异常,即电压时序序列中数据会呈现一些无规则波动。为了能够分离出不同类型数据的特征,本发明对电压时序序列中电压数据进行聚类分析,将聚类分析后的产生的数据集合作为初步分析的结果进行进一步分析。
本发明对电压时序序列中电压数据进行聚类分析,所采用的聚类算法为基于密度的聚类方法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)即DBSCAN聚类算法,通过DBSCAN聚类算法根据预设邻域最大半径和预设最小点将电压时序序列中电压数据进行聚类分析得到两个以上电压数据集合。在本发明实施例中,预设邻域最大半径设置为5,预设最小点设置为10。需要说明的是,预设邻域最大半径和预设最小点具体值的设定根据样本容量设定,即根据电压时序序列的长度设定,且DBSCAN聚类算法为本领域技术人员所熟知的现有技术,在此不做进一步限定和赘述。
但是考虑到直接通过聚类算法对电压数据进行聚类分析的计算量较大。因此为了减少计算量,自适应选取核心点对电压时序序列中电压数据进行聚类分析得到两个以上电压数据集合。自适应选取核心点的具体过程为:将电压时序序列平均分为两个以上电压数据子序列,根据电压数据在电压时序序列和电压数据子序列的分布情况建立数据熵分析模型,得到每个电压数据对应的数据熵,数据熵分析模型包括:
获取目标电压数据与其所在的电压数据子序列中电压值相同的电压数据之间空间距离的方差并记为第一方差,获取目标电压数据在电压时序序列中与目标电压数据的电压值相同的电压数据之间空间距离的方差并记为第二方差,计算第一方差与第二方差之间的比值得到方差比值,根据与目标电压数据电压值相同的电压数据在电压时序序列中出现的概率计算分布熵,将分布熵和方差比值的乘积作为目标电压数据的数据熵;改变目标电压数据得到所有电压数据的数据熵;选取与预设核心点相同数量的最小数据熵对应的电压数据作为聚类分析的核心点。在公式上表现为:
其中,为电压数据对应的数据熵,为电压数据对应的电压值,为电压数据与其所在的电压数据子序列内电压值相同的电压数据之间空间距离的方差,为在电压时序序列中电压值为的电压数据之间空间距离的方差,为电压值为的电压数据在电压时序序列中出现的概率,为电压时序序列中电压数据的数量。当相同电压值的分布越混乱,即分布熵越大,对应电压值的电压数据的数据熵越大;当电压数据子序列中电压值相同的电压数据之间空间距离的方差越大,对应的子序列分布越不规律,则对应的电压数据的数据熵越大,而当电压时序序列内电压值相同的数据对应的反差越小,说明数据分布越散乱,稳定性越差,对应的数据熵越大。
对于本发明所提出的数据熵分析模型,首先该数据熵表征每个电压数据所在的子序列内电压值相同的电压数据之间的空间分布状况,用于表征电压值的空间分布状况,根据空间分布状况所得到的数据熵来作为核心点选取的依据,因为数据熵越大时,数据分布和稳定性越差,对应的电压数据作为核心点时对应的聚类效果差,所以本发明选取与预设核心点相同数量的最小数据熵对应的电压数据作为聚类分析的核心点。进一步根据自适应选取的核心点通过DBSCAN聚类算法将电压时序序列划分为两个以上电压数据集合,因为在DBSCAN聚类算法执行之前就将核心点筛选出来,因此在执行DBSCAN聚类算法时可直接在预先筛选出的核心点上进行聚类分析,使得整个聚类算法更快速准确。
步骤S3:基于每个电压数据集合内的电压数据拟合高斯混合模型;通过计算两两电压数据集合之间的高斯混合模型的相似性得到每个电压数据集合的初步判定值,对每个电压数据集合的初步判定值通过预设判定阈值筛选出异常电故障数据集合和正常数据集合,根据异常电故障数据集合和正常数据集合之间的数据差异与异常电故障数据集合中每个异常电故障数据和相邻异常电故障数据之间的差异计算每个异常电故障数据对应的电故障真实度。
至此,通过步骤S2完成对电压时序序列的精准划分得到两个以上电压数据集合。由于聚类分析是根据相似性对电压时序序列中数据进行划分,因此所划分出的各个电压数据集合内的电压数据具有一定的相似性,因此影响电故障异常的电压数据一般都在对应分布在异常电故障数据集合中,因此本发明首先将所有电压数据集合划分为异常电故障数据集合和正常数据集合。
首先,由于当光伏变压器出现疑似故障的情况时,所采集到的光伏变压器的电压数据只有少部分为异常电压数据;而当光伏变压器完全故障时,所采集到数据绝大多数为异常电压数据。而本发明是对光伏变压器进行实时电故障检测,当光伏变压器出现疑似故障的情况时,就会发出预警,即光伏变压器完全故障的情况不会直接出现,所以在电压时序序列中,异常电压数据仅为少数电压数据,即异常电故障数据集合较少。而且由于在光伏变压器正产运作过程中,产生的正常数据差异不大,对应的正常数据集合之间差异不大,而正常数据集合和异常电故障数据集合之间存在明显差异。
因此根据各个电压数据集合数据之间的差异筛选出异常电故障数据集合和正常电故障数据集合,具体的:通过计算两两电压数据集合之间的高斯混合模型的相似性得到每个电压数据集合的初步判定值,对每个电压数据集合的初步判定值通过预设判定阈值筛选出异常电故障数据集合和正常数据集合。
优选地,在所有电压数据集合的高斯混合模型上设置预设数量个固定采样点。通过设置固定采样点可以保证在计算高斯混合模型的相似性时能够保证数据点一一对应。计算其他电压数据集合与目标电压数据集合之间对应固定采样点的高斯混合模型值的模型值相似性,将模型值相似性的均值作为目标电压数据的初步判定值;改变目标电压数据集合得到所有电压数据集合对应的初步判定值。在本发明实施例中,固定采样点的预设数量设置为5,需要说明的是,固定采样点的预设数量根据各个电压数据集合中数据的分布情况决定,且固定采样点的预设数量不能大于最少电压数据集合的电压数据数量。获取初步判定值的过程在公式上表现为:
其中,为电压数据集合对应的初步判定值,为固定采样点的预设数量,为电压数据集合的数量,为电压数据集合的序号,为每个电压数据集合中固定采样点的编号,为第个电压数据集合中第个固定采样点的高斯混合模型值,为电压数据集合中第个固定采样点的高斯混合模型值。表征第个聚类集合和聚类集合之间的高斯分布的相似性,当两个数据集合越相似,对应的越接近于1,则整体越接近于0。当电压数据集合为正常数据集合时,该电压数据集合与其他大部分的正常数据集合相似度高,对应的初步判定值小;相反,当电压数据集合为异常电故障数据集合时,由于电压数据集合中大部分为与异常电故障数据集合差异较大的正常数据集合,因此所求出的电压数据集合对应的初步判定值越大。
获取初步判定值的公式通过异常电故障数据的特殊性、电压数据集合内数据的相似性和异常电故障数据集合与其他电压数据集合的一致性状况得到每个电压数据集合的初步判定值。该判定值能够清楚的根据电压数据集合的特点筛选出异常电故障数据集合,具体的:将初步判定值大于预设判定阈值的电压数据集合记为异常电故障数据集合,将初步判定值小于等于预设判定阈值的电压数据集合记为正常数据集合。
但是考虑到由于聚类算法所得到聚类集合会存在一些误差,导致筛选出的异常电故障数据集合中数据并非都是真实电故障数据,其中可能存在噪声信息或者突变值信息,因此本发明对异常电故障数据中电压数据进行进一步分析筛选出真实电故障数据。
当异常电故障数据集合中存在正常数据时,该正常数据对应的电压值与正常数据集合的电压值应相似,即该正常数据的电压值与正常数据集合中电压数据均值的电压值差异较小。但是考虑到在电压时序序列中,异常电故障数据通常会成段出现,而当成段出现的电故障数据中可能存在由于噪声影响造成部分异常电故障数据的电压值与正常数据的电压值大小相似,所以为了排除噪声对异常电故障数据对电压值的影响,本发明结合异常电故障数据集合中电压数据在电压时序序列中的分布情况,进一步判定每个异常电故障数据中的电压数据是否为真实电故障数据。本发明实施例根据异常电故障数据集合和正常数据集合之间的数据差异与所述异常电故障数据集合中每个异常电故障数据和相邻异常电故障数据之间的差异计算每个异常电故障数据对应的电故障真实度。
优选地,获得目标异常电故障数据与每个正常数据集合的元素均值的第一数据差异,以最小数据差异作为第一参考数据差异;获得目标异常电故障数据与相邻其他异常电故障数据的第二数据差异,若目标异常电故障数据存在两个相邻其他异常电故障数据,则选择最小的第二数据差异作为第二参考数据差异;否则,将所述第二数据差异作为第二参考数据差异;第一次参考数据差异和第二参考数据差异的和值作为目标异常电故障数据的电故障真实度;改变目标异常电故障数据得到所有异常电故障数据的电故障真实度。需要说明的是,目标异常电故障数据为异常电故障数据集合中的电压数据。获取目标异常电故障数据的电故障真实度在公式上表现为:
其中,其中,为异常电故障数据的电故障真实度,为异常电故障数据对应的电压值,为正常数据集合的序号,为正常数据集合的数量,为第个正常数据集合中电压数据对应电压值的均值,为异常电故障数据在电压时序序列中前一个电压数据的电压值,为异常电故障数据在电压时序序列中后一个电压数据的电压值,为避免分母为零的预设常数,为最小值选取函数。为第一参考数据差异,表征异常电故障数据的电压值与正常数据集合中电压值均值的差值;为第二参考数据差异,表征异常电故障数据在电压时序序列中的分布情况。需要说明的是,当异常电故障数据位于电压时序序列的首端和末端时,将异常电故障数据的相邻电压数据作为第二参考数据差异。
目标异常电故障数据的电故障真实度公式,通过结合异常电故障数据集合中电压数据在电压时序序列中的分布情况,和该电压数据的电压值与正常数据集合中电压值均值的差值,进一步得到异常电故障数据集合中每个电压数据对应的电故障真实度,通过选取每个参考数据差异的最小值能够最大限度的减小识别电故障数据的误差。
步骤S4:根据电故障真实度在异常电故障数据集合中筛选出真实电故障数据;根据真实电故障数据检测光伏电压器的故障情况。
至此,通过步骤S3得到异常电故障数据集合中每个电压数据对应的电故障真实度,该电故障真实度表征了在异常电故障数据集合中每个电压数据的故障特征。进一步根据电故障真实度在异常电故障数据集合中筛选出真实电故障数据,具体地,将电故障真实度大于电故障真实度阈值的电压数据作为真实电故障数据。在本发明实施例中,电故障真实度阈值设置为0.65。需要说明的是,电故障真实度阈值的具体设置根据实施人员的具体实施环境和变压器运行情况具体设置。
在检测出真实电故障数据之后,根据真实电故障数据的电故障真实度完成对光伏变压器的电故障检测。优选地,将所有真实电故障数据的电故障真实度的累加值作为电故障检测指标,当电故障检测指标大于预设故障阈值时,认为光伏电压器存在故障。在公式上表现为:
其中,为电压时序序列对应的电故障检测指标,为第个真实电故障数据对应的电故障真实度,为真实电故障数据的数量。
当电压时序序列对应的电故障检测指标高于预设故障阈值时,认为光伏变压器存在故障,需要检修。在本发明实施例中,预设故障阈值设置为0.5。需要说明的是,预设故障阈值的设置需要根据实施人员的具体实施环境具体设置。
至此,完成对光伏变压器的电故障检测。
综上所述,本发明通过对电压时序序列进行聚类分析得到两个以上电压数据集合,根据电压数据集合之间的一致性将电压数据集合划分为正常数据集合和异常电故障数据集合,根据异常电故障数据集合中电压数据与相邻数据和正常数据集合中数据的差异,得到异常电故障数据集合中每个电压数据的电故障真实度,根据电故障真实度判断光伏变压器的故障情况。本发明在降低故障检测误差的同时提高了故障检测的精度。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。