CN111178397B - 基于风力曲线图像的异常数据检测与清洗方法 - Google Patents
基于风力曲线图像的异常数据检测与清洗方法 Download PDFInfo
- Publication number
- CN111178397B CN111178397B CN201911279068.7A CN201911279068A CN111178397B CN 111178397 B CN111178397 B CN 111178397B CN 201911279068 A CN201911279068 A CN 201911279068A CN 111178397 B CN111178397 B CN 111178397B
- Authority
- CN
- China
- Prior art keywords
- image
- data
- wind
- wpc
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004140 cleaning Methods 0.000 title claims abstract description 32
- 238000001514 detection method Methods 0.000 title claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 57
- 238000001914 filtration Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000007797 corrosion Effects 0.000 claims description 9
- 238000005260 corrosion Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000013506 data mapping Methods 0.000 claims description 3
- 238000003708 edge detection Methods 0.000 claims description 3
- 238000003709 image segmentation Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 abstract description 5
- 238000007635 classification algorithm Methods 0.000 abstract 1
- 238000003064 k means clustering Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 3
- 241000039077 Copula Species 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E10/00—Energy generation through renewable energy sources
- Y02E10/70—Wind energy
- Y02E10/72—Wind turbines with rotation axis in wind direction
Abstract
本发明公开了现代工业中风能行业风力涡轮机的运营与维护技术领域的基于风力曲线图像的异常数据检测与清洗方法,该方法通过将风力曲线图像转化为二值图像,利用数学形态学方法与Hu矩提取代表正常数据的图像主要部分,最小化提取主要部分和参考风力曲线间的差异确定最优结构元尺寸,为验证算法有效性将其与LOF、CA和K均值分类算法比较,经过两个风电场涡轮机数据的实例验证,本发明与另外三种算法相比具有更好的过滤堆叠异常点能力,更好的泛化能力,更快的计算速度,还能提供异常点类别信息,具有实际应用潜力。
Description
技术领域
本发明涉及现代工业中风能行业风力涡轮机的运营与维护技术领域,具体为基于风力曲线图像的异常数据检测与清洗方法。
背景技术
风力涡轮机设计技术与建造的成熟化使其在世界范围内被广泛安装使用。风电场的运营与维护也愈发受到重视。数据监测与采集系统(SCADA)的风力涡轮机数据能体现涡轮机的运行状况,常被用于进行风力涡轮机的状态检测、风力预测等。但由于风力涡轮机故障、弃风、极端天气等原因,会使其出现偏航系统故障、发电机刷磨损等故障。不同的故障使SCADA采集的数据包含多种异常点。风力曲线(WPC)上的异常点将会影响风力涡轮机的状态检测,进而影响风电场的运营与维护。因此异常数据的诊断与清洗对WPC的应用至关重要。
现在对风力曲线图像异常数据诊断与清洗的研究主要分为两类。
第一类利用异常数据与正常数据在统计特性上的不同,例如用数据点密度、距离、方差等指标进行清洗。例如先将数据分类,再用局部异常因子(LOF)检测不合理数据;通过使用加权距离、平方欧式距离、City-Block距离的k最近邻法估计离群值的界限;通过分位数发现离散的异常值,再用基于密度的空间聚类清除堆叠的异常值等方法。
第二类是利用大量的正常数据对风力曲线建模来诊断异常点。例如基于Copula条件分位数方法对风力曲线构建概率模型;基于混合高斯模型与Copula函数结合的方法拟合风力曲线等。
上述现有的诊断风力曲线异常点方法存在以下不足:
(1)基于数据密度或数据间距离的检测方法适用于发现离散的异常值,而堆叠的异常值不能被有效过滤,尤其当数据量较大时;
(2)为了训练出可靠的风力曲线模型,需要大量的正常数据。而当故障出现时大部分数据为异常数据;
(3)模型参数的设定依赖于具体数据,模型的泛化能力受到限制。
基于此,本发明设计了基于风力曲线图像的异常数据检测与清洗方法,以解决上述提到的问题。
发明内容
本发明的目的在于提供基于风力曲线图像的异常数据检测与清洗方法,以解决上述背景技术中提出的问题。
由于现有的风力曲线异常数据诊断技术存在一定的缺陷,本发明提出了一种基于图像的算法,通过WPC图像检测并清洗异常数据。其中WPC图像由SCADA系统采集的数据生成,图像的横坐标为风速,单位m/s;纵坐标为风力,单位为kW。
为实现上述目的,本发明提供如下技术方案:基于风力曲线图像的异常数据检测与清洗方法,将异常点分为3类,负值异常点、离散异常点与堆叠异常点,其中负值异常点指风速大于接通速度且风力小于零的点。产生原因主要包括计划外的维护、风力涡轮机故障和弃风;离散异常点指随机分布在正常点构成的风力曲线周围的点,常服从无规则分布。产生原因包括传感器故障、传感器噪声及一些不可控的随机因素;堆叠异常点经常在一个连续的时间段内出现,堆叠在风力值的某一条线上。当数据量大时常被误认为正常数据。产生原因包括弃风与通信故障等。
本发明技术共分为3步,数据预清洗、正常数据提取和数据标记,具体包括如下步骤:
S1:数据预清理:过滤并删除第一类负值异常点,满足v=vcut-in且P<0,其中vcut-in是接通速度;
S2:用预清洗后的剩余数据生成WPC二值图像,用MMO方法使用多种不同尺寸的结构元提取WPC二值图像的主要部分,计算提取主要部分的Hu矩与参考WPC图像,然后使用Hu矩计算提取的主要部分与理想风力曲线间的差异性确定结构元的最优尺寸,这样提取出的主要部分就代表了正常数据部分;
再用数学形态学MMO算法提取。最优MMO模型的参数利用Hu矩法,通过最小化提取数据的主要部分与参考WPC之间的差异确定;
S3:识别WPC图像的边缘,将边缘外的数据点识别为第二类离散异常点,并将第二类离散异常点过滤掉,再过滤正常数据点,将剩余数据点识别为第三类堆叠异常点,建立WPC图像点与二值图像像素点间的映射关系,基于这个映射关系,标记出正常数据点与三类异常数据点。
优选的,所述用预清洗后的剩余数据生成WPC二值图像的具体步骤为:将预处理后的剩余数据点转换为WPC图像,基于图像中像素点灰度值的不同,将风力曲线灰度图进一步转化为二值图像。
优选的,所述步骤S2还包括对WPC二值图像进行边缘检测、噪声消除、图像增强和图像分割操作。
优选的,所述参考WPC图像由正常风力涡轮机数据生成,具体为:正常风力涡轮机数据先经人工操作去除异常点,再用剩余数据生成参考WPC图像。
优选的,所述不同尺寸的结构元提取WPC二值图像的主要部分采用运开算进行,所述开运算由腐蚀运算和膨胀运算结合而成,即输入的二值图像A与结构元B,分别用于减小对象的尺寸,滤除散射噪声与图像外的部分和增加对象的尺寸,滤除图像的内部噪声,
优选的,所述使用Hu矩计算提取的主要部分与理想风力曲线间的差异性方法如下:设风力曲线二值图像f(x,y)的尺寸为M×N像素,图像的p+q阶中心距为:
为消除图像放缩造成的影响,将中心矩标准化:
ηpq=μpq/μγ 00,γ=1+(p+q)/2,p+q=2,3…,
二阶和三阶标准化中心矩组成7个不变矩I1,……,I7称为Hu矩。在计算图片间的非相似性上,Hu矩进一步写为:
mi=sign(Ii)·log(Ii),i=1,…,7
其中ma,i、mb,i分别表示图像a与图像b被第i个Hu矩作用的转换参数,图像a与图像b非相似性D(a,b)的计算方式为:
优选的,所述提取的主要部分用最大轮廓代替,Hu矩用来代表二值图像与参考图像的最大轮廓,所述结构元最佳尺寸的计算方法为:
其中ne为结构元的最大尺寸。
优选的,所述步骤S3中,WPC图像点与二值图像像素点间的映射关系建立方法如下:
设WPC二值图像f(x,y)的像素点为(x,y),x=1,…,M,y=1,…,N。第i个风力图像点为(vi,Pi),图像尺度参数为(Δx,Δy),
Δx的计算公式为:Δx=(xmax-xmin)/(vmax-vmin)
Δy的计算公式为:Δx=(ymax-ymin)/(Pmax-Pmin)
其中xmax=max(x丨f(x,y)=1),xmin=min(x丨f(x,y)=1),
ymax=max(y丨f(x,y)=1),xmin=min(y丨f(x,y)=1),
vmax、vmin分别是风速的最大值与最小值,Pmax、Pmin分别是风力的最大值与最小值,风力图像点(vi,Pi)与像素点(xi,yi)的对应关系为:
xi=xmin+(vi-vmin)×Δx
yi=ymax+(Pi-Pmin)×Δy
基于数据映射算法,完成了SCADA采集数据中正常数据与异常数据的标记。
与现有技术相比,本发明的有益效果是:
(1)与用传统的统计学方法或数据挖掘方法相比,基于WPC图像的异常点检测更加直观。
(2)本发明技术能使用到的统计特征不受大量堆叠异常数据的影响。
(3)经过实施例可验证,本发明技术在异常数据检测与清洗上是有效、高效以及广泛适用的。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供一种技术方案:基于风力曲线图像的异常数据检测与清洗方法,将异常点分为3类,负值异常点、离散异常点与堆叠异常点,具体包括如下步骤:
S1:数据预清理:过滤并删除第一类负值异常点,满足v=vcut-in且P<0,其中vcut-in是接通速度;
S2:用预清洗后的剩余数据生成WPC二值图像,用MMO方法使用多种不同尺寸的结构元提取WPC二值图像的主要部分,计算提取主要部分的Hu矩与参考WPC图像,然后使用Hu矩计算提取的主要部分与理想风力曲线间的差异性确定结构元的最优尺寸,这样提取出的主要部分就代表了正常数据部分;
用预清洗后的剩余数据生成WPC二值图像的具体步骤为:将预处理后的剩余数据点转换为WPC图像,基于图像中像素点灰度值的不同,将风力曲线灰度图进一步转化为二值图像。接着使用MMO方法与Hu矩提取WPC图像的主要部分。其中Hu矩在数学形态学上主要用来决定最优结构元尺寸。还包括对WPC二值图像进行边缘检测、噪声消除、图像增强和图像分割操作。参考WPC图像由正常风力涡轮机数据生成,具体为:正常风力涡轮机数据先经人工操作去除异常点,再用剩余数据生成参考WPC图像。
不同尺寸的结构元提取WPC二值图像的主要部分采用运开算进行,所述开运算由腐蚀运算和膨胀运算结合而成,即输入的二值图像A与结构元B,分别用于减小对象的尺寸,滤除散射噪声与图像外的部分和增加对象的尺寸,滤除图像的内部噪声,
由于结构元B的尺寸会影响图像主要部分的提取结果,因此在本发明中使用Hu矩计算提取的主要部分与理想风力曲线间的差异性,通过最小化差异性得到理想的提取结果。Hu矩属于图像不变矩,它不受图像旋转、翻转、按比例缩放等操作的影响。
使用Hu矩计算提取的主要部分与理想风力曲线间的差异性方法如下:设风力曲线二值图像f(x,y)的尺寸为M×N像素,图像的p+q阶中心距为:
为消除图像放缩造成的影响,将中心矩标准化:
ηpq=μpq/μγ 00,γ=1+(p+q)/2,p+q=2,3…,
二阶和三阶标准化中心矩组成7个不变矩I1,……,I7称为Hu矩。在计算图片间的非相似性上,Hu矩进一步写为:
mi=sign(Ii)·log(Ii),i=1,…,7
其中ma,i、mb,i分别表示图像a与图像b被第i个Hu矩作用的转换参数,图像a与图像b非相似性D(a,b)的计算方式为:
为节省计算量,本发明中提取的主要部分用最大轮廓代替,Hu矩用来代表二值图像与参考图像的最大轮廓,所述结构元最佳尺寸的计算方法为:
其中ne为结构元的最大尺寸。
S3:识别WPC图像的边缘,将边缘外的数据点识别为第二类离散异常点,并将第二类离散异常点过滤掉,再过滤正常数据点,将剩余数据点识别为第三类堆叠异常点,建立WPC图像点与二值图像像素点间的映射关系,基于这个映射关系,标记出正常数据点与三类异常数据点。
为了基于WPC图像的检测结果标记实际风力涡轮机数据,WPC图像点与二值图像像素点间的映射关系建立方法如下:
设WPC二值图像f(x,y)的像素点为(x,y),x=1,…,M,y=1,…,N。第i个风力图像点为(vi,Pi),图像尺度参数为(Δx,Δy),
Δx的计算公式为:Δx=(xmax-xmin)/(vmax-vmin)
Δy的计算公式为:Δx=(ymax-ymin)/(Pmax-Pmin)
其中xmax=max(x丨f(x,y)=1),xmin=min(x丨f(x,y)=1),
ymax=max(y丨f(x,y)=1),xmin=min(y丨f(x,y)=1),
vmax、vmin分别是风速的最大值与最小值,Pmax、Pmin分别是风力的最大值与最小值,风力图像点(vi,Pi)与像素点(xi,yi)的对应关系为:
xi=xmin+(vi-vmin)×Δx
yi=ymax+(Pi-Pmin)×Δy
基于数据映射算法,完成了SCADA采集数据中正常数据与异常数据的标记。
实施例1、
为验证本发明提出的基于风力曲线图像的异常数据检测与清洗技术的有效性与泛化能力,选取江苏马塘风电场与山西高家沟风电场的SCADA数据。其中,江苏马塘风电场收集从2016年1月1日至8月31日每10分钟的SCADA数据,山西高家沟风电场收集从2015年4月1日至2016年12月31日每10分钟的SCADA数据。
在本发明的较佳实施例中,设置风力涡轮机WPC图像的分辨率为288×432PPI,每个点都由2×2PPI表示。在参考WPC图中,曲线部分的最小宽度约为12PPI。因此,结构元的大小将从2×2至9×9中选择。选取马塘风电场M-09号风力涡轮机作为示例详细展示本发明提出算法的性能。
结果显示弃风能显著影响风电曲线的形状,但本发明提出的算法能有效检测并清除异常点。在本发明的实施例中,发现随着结构元尺寸n的增大,提取的正常点区域在缩小,且最大轮廓与参考WPC图像的差异性先下降后上升。这说明提取的正常点部分所含的信息过多或过少都会影响两者的差异性。
在本发明的较佳实施例中,选择异常数据删除率R(%)与计算时间T(s)作为检验指标。且为验证所提算法的泛化能力,两个风电场所有风力涡轮机的算法参数设置与参考WPC图像均与马塘风电场的M-09一致。结果显示,数据预清洗与主要部分提取步骤的计算时间几乎不受数据量的影响,而数据标记时间随着数据量的增加而增大。基于数据预清洗的异常数据删除率,发现马塘风电场的弃风现象比高家沟风电场更频繁。
为验证本发明提出算法的有效性,选择四分位数(CA)算法、局部异常因子(LOF)算法和K均值聚类算法与本发明提出的算法作对比。其中LOF算法是一种典型的聚类算法,常用于过滤异常点。LOF算法通过计算每个点最近的k个点的加权距离计算得分,评价隔离级别,将得分与阈值比较来识别异常点。根据另外3种算法的性能,设定k=300,LOF算法的阈值为10%。CA算法首先通过检测方差变化率的变化点清除部分异常数据,再从剩余数据中提取正常数据。根据惯例,参数风速间隔设置为0.5m/s。K均值聚类算法是典型的数据驱动方法,根据参考文献,本发明实施例中设定K=13。
在本发明的一个较佳实施例中,结果显示LOF算法的异常点清除效果最差。LOF算法的阈值直接影响到算法效果,阈值选取的困难使LOF算法的灵活性降低。CA算法与本发明提出算法的R值会因情况而异,说明它们比LOF算法有更好的泛化能力。K均值聚类算法的R值在两个风电场间的差异很大。由于该算法性能取决于数据,为取得最佳效果,应根据具体情况设定K值。此外,由于CA算法需计算每个风速间隔的方差变化率,CA算法花费的时间最多,而本发明提出的算法花费的时间最少。
本发明实施例显示,本发明提出的基于图像的算法对异常点的数量及分布更稳健。由于本发明提出的算法可以检测到更多风速过小或弃风产生的异常数据,因此比另外3种算法的平均R值更高。
本发明实施例结果进一步显示,本发明提出算法明显优于LOF算法、CA算法及K均值聚类算法,尤其在堆叠大量异常数据的情况下。M-06,M-09和M-10号风力涡轮机的弃风现象严重,由于受LOF得分与方差变化率的影响,LOF算法和CA算法不能完全滤除异常点。由于本发明基于图像而不是实际数据来削减异常数据密度的影响,因此当异常数据量较大时仍有很好的性能。此外,基于图像的算法还能清楚地提供异常数据的类别信息。
总之,本发明技术与LOF算法、CA算法及K均值聚类算法相比,具有以下优势:由于基于图像的算法直接作用在图像上,因此更加直观。且该算法在相同的参数设置下对不同的风力涡轮机都能得到较好的结果,说明具有更好的泛化能力。该方法的计算时间也明显短于另外3种算法,尤其当数据量较大时。此外,该算法可以为风电场运营商提供有价值的异常数据的类别信息。综上所述,基于其泛化能力、计算效率及有效性,本发明提出的算法的实际应用潜力远大于LOF算法、CA算法及K均值聚类算法。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (8)
1.基于风力曲线图像的异常数据检测与清洗方法,其特征在于:将异常点分为3类,负值异常点、离散异常点与堆叠异常点,具体包括如下步骤:
S1:数据预清理:过滤并删除第一类负值异常点,满足v=vcut-in且P<0,其中vcut-in是接通速度;
S2:用预清洗后的剩余数据生成WPC二值图像,用MMO方法使用多种不同尺寸的结构元提取WPC二值图像的主要部分,计算提取主要部分的Hu矩与参考WPC图像,然后使用Hu矩计算提取的主要部分与理想风力曲线间的差异性确定结构元的最优尺寸,这样提取出的主要部分就代表了正常数据部分;
S3:识别WPC图像的边缘,将边缘外的数据点识别为第二类离散异常点,并将第二类离散异常点过滤掉,再过滤正常数据点,将剩余数据点识别为第三类堆叠异常点,建立WPC图像点与二值图像像素点间的映射关系,基于这个映射关系,标记出正常数据点与三类异常数据点。
2.根据权利要求1所述的基于风力曲线图像的异常数据检测与清洗方法,其特征在于:所述用预清洗后的剩余数据生成WPC二值图像的具体步骤为:将预处理后的剩余数据点转换为WPC图像,基于图像中像素点灰度值的不同,将风力曲线灰度图进一步转化为二值图像。
3.根据权利要求1所述的基于风力曲线图像的异常数据检测与清洗方法,其特征在于:所述步骤S2还包括对WPC二值图像进行边缘检测、噪声消除、图像增强和图像分割操作。
4.根据权利要求1所述的基于风力曲线图像的异常数据检测与清洗方法,其特征在于:所述参考WPC图像由正常风力涡轮机数据生成,具体为:正常风力涡轮机数据先经人工操作去除异常点,再用剩余数据生成参考WPC图像。
8.根据权利要求1所述的基于风力曲线图像的异常数据检测与清洗方法,其特征在于:所述步骤S3中,WPC图像点与二值图像像素点间的映射关系建立方法如下:
设WPC二值图像f(x,y)的像素点为(x,y),x=1,…,M,y=1,…,N,第i个风力图像点为(vi,Pi),图像尺度参数为(Δx,Δy),
Δx的计算公式为:Δx=(xmax-xmin)/(vmax-vmin)
Δy的计算公式为:Δx=(ymax-ymin)/(Pmax-Pmin)
其中xmax=max(x丨f(x,y)=1),xmin=min(x丨f(x,y)=1),
ymax=max(y丨f(x,y)=1),xmin=min(y丨f(x,y)=1),
vmax、vmin分别是风速的最大值与最小值,Pmax、Pmin分别是风力的最大值与最小值,风力图像点(vi,Pi)与像素点(xi,yi)的对应关系为:
xi=xmin+(vi-vmin)×Δx
yi=ymax+(Pi-Pmin)×Δy
基于数据映射算法,完成了SCADA采集数据中正常数据与异常数据的标记。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911279068.7A CN111178397B (zh) | 2019-12-13 | 2019-12-13 | 基于风力曲线图像的异常数据检测与清洗方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911279068.7A CN111178397B (zh) | 2019-12-13 | 2019-12-13 | 基于风力曲线图像的异常数据检测与清洗方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111178397A CN111178397A (zh) | 2020-05-19 |
CN111178397B true CN111178397B (zh) | 2023-06-16 |
Family
ID=70656369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911279068.7A Active CN111178397B (zh) | 2019-12-13 | 2019-12-13 | 基于风力曲线图像的异常数据检测与清洗方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111178397B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113034733A (zh) * | 2021-03-29 | 2021-06-25 | 南京格物智能科技有限公司 | 一种地铁牵引电机滤网堵塞的检测方法及其检测装置 |
CN114969017B (zh) * | 2022-07-28 | 2022-11-11 | 深圳量云能源网络科技有限公司 | 风功率数据清洗方法、清洗装置及预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140109132A (ko) * | 2013-03-05 | 2014-09-15 | 한국전력공사 | 파워커브 모니터링을 통한 경보 발생 방법 |
CN108171400A (zh) * | 2017-12-06 | 2018-06-15 | 浙江大学 | 一种基于异常点及离群点检测的风机功率曲线数据预处理方法 |
CN109919199A (zh) * | 2019-02-13 | 2019-06-21 | 东南大学 | 基于图像处理的风电机组异常数据的检测方法 |
-
2019
- 2019-12-13 CN CN201911279068.7A patent/CN111178397B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140109132A (ko) * | 2013-03-05 | 2014-09-15 | 한국전력공사 | 파워커브 모니터링을 통한 경보 발생 방법 |
CN108171400A (zh) * | 2017-12-06 | 2018-06-15 | 浙江大学 | 一种基于异常点及离群点检测的风机功率曲线数据预处理方法 |
CN109919199A (zh) * | 2019-02-13 | 2019-06-21 | 东南大学 | 基于图像处理的风电机组异常数据的检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111178397A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111178397B (zh) | 基于风力曲线图像的异常数据检测与清洗方法 | |
CN111798412B (zh) | 一种基于红外图像的变电设备缺陷智能诊断方法及系统 | |
CN109145872B (zh) | 一种基于CFAR与Fast-RCNN融合的SAR图像舰船目标检测方法 | |
CN107144569A (zh) | 基于选择性搜索分割的风机叶片表面缺陷诊断方法 | |
Wang et al. | A fast abnormal data cleaning algorithm for performance evaluation of wind turbine | |
CN106780486A (zh) | 一种钢板表面缺陷图像提取方法 | |
CN101794435B (zh) | 基于积分图的二值图像降噪方法以及二值图像处理系统 | |
CN106570790B (zh) | 一种计及风速数据分段特性的风电场出力数据修复方法 | |
Liang et al. | Wind power curve data cleaning by image thresholding based on class uncertainty and shape dissimilarity | |
Perera | Statistical filter based sensor and DAQ fault detection for onboard ship performance and navigation monitoring systems | |
CN108335294A (zh) | 复杂条件下的配电房异常状态图像识别方法 | |
CN107679495A (zh) | 一种输电线路周边活动工程车辆的检测方法 | |
CN109919199A (zh) | 基于图像处理的风电机组异常数据的检测方法 | |
CN113888462A (zh) | 一种裂纹识别方法、系统、可读介质及存储介质 | |
CN107230214A (zh) | 基于递归otsu算法的sar图像水域自动检测方法 | |
CN110956077A (zh) | 基于配电站房防误操作及作业安全的方法 | |
CN113487563A (zh) | 一种基于el图像的光伏组件隐裂自适应检测方法 | |
CN112465776A (zh) | 一种基于风力机表面模糊图像的裂纹智能检测方法 | |
Taylor et al. | Adaptive local fusion systems for novelty detection and diagnostics in condition monitoring | |
CN108734709B (zh) | 一种绝缘子凸缘形状参数识别与破坏检测方法 | |
CN114548843B (zh) | 风力发电机功率数据的处理方法、计算机设备及介质 | |
CN103065296A (zh) | 一种基于边缘特征的高分辨率遥感影像居民区提取方法 | |
CN114281846B (zh) | 一种基于机器学习的新能源发电预测方法 | |
Dongye et al. | A pavement disease detection method based on the improved mask r-cnn | |
CN111145109B (zh) | 基于图像的风力发电功率曲线异常数据识别与清洗方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |