CN111145109A - 基于图像的风力发电功率曲线异常数据识别与清洗方法 - Google Patents

基于图像的风力发电功率曲线异常数据识别与清洗方法 Download PDF

Info

Publication number
CN111145109A
CN111145109A CN201911253021.3A CN201911253021A CN111145109A CN 111145109 A CN111145109 A CN 111145109A CN 201911253021 A CN201911253021 A CN 201911253021A CN 111145109 A CN111145109 A CN 111145109A
Authority
CN
China
Prior art keywords
image
data
pixel
wind power
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911253021.3A
Other languages
English (en)
Other versions
CN111145109B (zh
Inventor
梁国远
宿亚浩
陈帆
周力凯
吴新宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201911253021.3A priority Critical patent/CN111145109B/zh
Publication of CN111145109A publication Critical patent/CN111145109A/zh
Application granted granted Critical
Publication of CN111145109B publication Critical patent/CN111145109B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于信息技术领域,涉及一种基于图像的风力发电功率曲线异常数据识别与清洗方法,包括以下步骤:1)建立映射关系,将风力发电的散点数据转化为二值数字图像;2)将二值数字图像转化为特征灰度图像;3)对特征灰度图像进行识别,进行数据清洗。本发明通过栅格化散点数据,建立散点数据与数字图像之间的映射,将基于传统数据挖掘算法的数据清洗问题转化为图像分割问题,运用成熟的图像分割算法来解决数据清洗问题。

Description

基于图像的风力发电功率曲线异常数据识别与清洗方法
技术领域
本发明属于信息技术领域,涉及一种基于图像的风力发电功率曲线异常数据识别与清洗方法。
背景技术
风能是一种清洁和可再生的能源。近年来,世界各地安装的风力发电机越来越多,风电机组安装的数据采集与监视控制系统已经广泛的用于风力发电工况检测,其中包括风电曲线异常数据检测。风电功率曲线是在风电机组运行特性的评价过程中的一项重要指标,即是风电机组的设计依据、性能评价指标、发电量考核指标,与风电场的收益也息息相关。
由于风速和风向的变化导致风力发电具有波动性、间歇性和随机性等特点,所以SCADA数据包含不同类型的异常数据,这会对风力发电机运行状态和特性的分析产生不利影响。
基于风电功率曲线的异常数据可以归纳为以下三种类型:I类为负异常数据,II类为离散异常数据,III类为堆积异常数据。如图1所示。
(1)I类异常数据是风速大于切入速度且功率低于零的负异常数据。当风力发电机吸收来自电网的功率时,功率输出将被记录为负值。负异常数据大多接近于零。产生I型异常数据的主要原因有计划外维修、风机故障和风力削减等。
(2)II类异常数据是离散的异常数据。它们围绕正常曲率随机分布。传感器故障,传感器噪声和一些不受控制的随机因素导致这些异常数据。因此,它们遵循随意分布,并且不可预测且不连续。
(3)III类异常数据是堆叠的异常数据。这些异常数据通常出现在连续的时间段内,并在功率曲线中排成一行。因此,当数量很大时,它们很容易识别为正常数据。它们通常由限电命令或通信故障引起,尤其是限电期间和限功率运行。
数据清洗是风电场运行和维护过程中的一个重要环节,风电机组功率曲线的异常数据的识别与清洗是当前的研究热点。
常规方法主要基于离散的数据点,利用与正常数据不同的异常数据的统计特征来清理异常数据,包括数据密度、距离、方差等。常规的基于数据的方法主要问题是大量的堆叠数据没有得到有效的清理,主要原因是假设正常数据是主体成分,并根据主体成分的统计特征来检测异常数据,当风力出现经常缩减时,大量堆叠的异常数据也会成为主体成分。
文献Long H,Sang L,Wu Z,and Gu W.Image-based abnormal data detectionand cleaning algorithm via wind power curve[J].IEEE Transactions onSustainable Energy.2019(04),1-1,提出一种基于图像的数学形态学操作方法,分为以下三步:
1)预处理清洗:过滤并检测I类异常点(负异常数据)满足v>vcut-in且p<0,其中vcut-in是切入速度。
2)基于图像的正常数据提取:对I类异常数据进行过滤后,其余数据的散点绘图将转化为数字图像,基于每个像素点的灰度值,将该灰度图进一步转换为二值图像。然后,用图像数学形态学的开运算提取风电曲线图像的主要部分。计算提取风电曲线的主要部分与参考模板(由专家手工标记的标准风电曲线模型)的相似度差异(图像不变矩的欧式距离),确定开运算中的结构单元的大小。
3)识别图像边缘,过滤位于边缘外的数据,确定为II类异常数据(离散异常数据);保留正常数据,其余部分视为III类异常数据(堆叠的异常数据)。将风力散点映射为散点绘图中的像素点,基于映射关系标记正常和三种类型的异常数据。
其主要的问题在于会清除掉风速从零到切入风速时功率为零的正常数据和风速大于额定风速时功率稳定的正常数据,参见图2。
发明内容
为解决上述背景技术中存在的问题,本发明提出一种基于图像的风力发电功率曲线异常数据识别与清洗方法,该方法可以准确识别与清洗在风力发电场安装的数据采集与监视控制系统中所采集风力发电数据的风电曲线异常数据。
本发明解决上述问题的技术方案是:一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特殊之处在于,包括以下步骤:
1)建立映射关系,将风力发电的散点数据转化为二值数字图像;
2)将二值数字图像转化为特征灰度图像;
3)对特征灰度图像进行识别,进行数据清洗。
进一步地,所述步骤1)具体为:
通过栅格化将散点数据的散点划分到不同的框,每个框代表数字图像中的一个像素点,(x,y)是数字图像f(x,y)的一个像素点,其中x=1,...,M,y=1,...,N,第i个数据点是(vi,pi),其中v是风速,p是功率;像素与数据点之间的缩放参数是(Δx,Δy),Pmax,Pmin分别代表最大和最小功率,vmax,vmin分别代表最大和最小风速;第i个像素(xi,yi)与数据点之间的对应可以由式(1)计算,通过缩放参数,一个像素点可以对应许多数据点;有数据对应的像素点的灰度值设为255,其余像素点的灰度值设为0,
Figure BDA0002309559890000031
图像的尺寸大小M×N由式(2)计算
Figure BDA0002309559890000032
通过以上方式可建立风电数据点与生成的数字图像的映射关系,生成的二值数字图像。
进一步地,所述步骤2)具体为:
计算有值像素点到连通域边界的像素在八个方向上的距离,然后计算距离的中位数作为当前像素的灰度值。
进一步地,所述步骤3)包括以下步骤:
3.1)在确定阈值t下,以异常数据对应的像素为背景,正常数据对应的像素为前景,计算图像的类不确定性,通过类不确定性理论对图像进行分析;
3.2)然后将分类不确定性与参考模板的傅里叶描述子结合构建能量函数,通过最小化能量函数寻找最优阈值t;
3.3)最后,通过阈值分割结果,对前景和背景进行分割,根据之前的映射关系,达到识别和分类正常数据和异常数据的作用。
进一步地,所述步骤3.1)具体为:
在灰度特征图中,令C表示图像中灰度值零以上的所有像素(不包含零,黑色背景不计入),令c表示某一个元素,且c∈C。令Fo,t和Fb,t表示有阈值t产生的空间元素属于前景和背景的集合,此时前景属于正常数据,背景属于要清洗的异常数据,其表达式为Fo,t={c|c∈C andf(c)≥t}
Fb,t={c|c∈C andf(c)≥t}
由阈值t产生前景概率为
Figure BDA0002309559890000041
其中,|X|表示X的数量。
这里引入集合G=[MIN,MAX],MIN表示一副图像中的最小的灰度值,MAX表示一副图像中的最大的灰度值。在阈值t的条件下,我们可以将po(g)和pb(g)写成概率密度函数的形式,则
Figure BDA0002309559890000042
Figure BDA0002309559890000043
其中,mo(t)和mb(t)分别表示前景像素的灰度均值和背景像素的灰度均值,σo(t)和σb(t)分别表示前景像素和背景像素的标准差。
在阈值t情况下,将类不确定性表达为阈值为t的函数,当灰度值为g时,其公式为:
Figure BDA0002309559890000051
其中,pt(g)如公式所示
pt(g)=θ(t)po,t(g)+(1-θ(t))pb,t(g)
在阈值为t时,对于每个像素点,可以得到不同的熵Ht(g)来表示当前像素点的类不确定性。将其小到大按照由蓝到绿再到红可视化,可以得到代表类不确定的能量图。当t发生变化时,可以得到不同阈值下能量图。
进一步地,所述步骤3.2)具体为:
傅里叶描绘子是一种图像特征,具体来说,是一个用来描述轮廓的特征参数。其基本思想是用物体边界信息的傅里叶变换作为形状特征,将轮廓特征从空间域变换到频域内,提取频域信息作为图像的特征向量。即用一个向量代表一个轮廓,将轮廓数字化,只需少量的描子(即向量中得到数不需要太多)即可大致代表整个轮廓。其次,对傅里叶描述子进行简单的归一化操作后,即可使描述子具有平移、旋转、尺寸不变性。
先将提取二值图像中的轮廓图,轮廓包含K个像素点,从任意像素点在图像中的像素位置(x0,y0)开始,以顺时针方向在该边界上行进时,会遇到像素位置坐标对(x0,y0),(x1,y1),(x2,y2),…,(xK-1,yK-1)。这些坐标可以表示为x(k)=xK,y(k)=yK的形式。使用这种表示法,轮廓本身可以表示为坐标序列s(k)=[x(k),y(k)],k=0,1,2,…,K-1。此外,每个坐标对可当做一个复数来处理,即
s(k)=x(k)+iy(k)
其中k=0,1,2,…,K-1。也就是说,x轴为复数序列的实轴,y轴为复数序列的虚轴。尽管对该序列的解释是全新的,但边界本身的性质并未改变。当然,这种表示方法的一大优点是它将二维问题简化成了一维问题。
s(k)的离散傅里叶变换(DFT)为
Figure BDA0002309559890000061
式中u=0,1,2,…,K-1。复系数a(u)称为边界的傅里叶描绘子。本文取u=0到u=12作为轮廓描绘子。
将其简单归一化:
Figure BDA0002309559890000062
两轮廓之间的相似性差异可用归一化后的两个傅里叶描绘子向量之间的欧式距离作为度量,如下式
Figure BDA0002309559890000063
rA(i),rB(i)分别是对象轮廓A和B的归一化后傅里叶描绘子,d为两轮廓间的相似性差异。
对于特征灰度图像,在不同阈值分割下,会有不同的分割前景,对于每个分割前景,取最大连通域作为所得正常数据,取其轮廓;
当阈值t变化时,不同轮廓与模板风电曲线按照以上计算方式,都有对应相似性差异的值计为d(t)。
同时在灰度图像M中,在一个固定阈值t的情况下,灰度图像M中有n个灰度值非零的像素点,每个像素点i的灰度值g对应的类不确定性值为ht(i)=Ht(g),将所有像素点的类不确定性值相加并归一化:
Figure BDA0002309559890000064
在阈值为t的情况下,特征灰度的整体类不确定性e(t)越小,同时,分割结果与模板WPC的傅里叶描绘子的相似性差异d(t)越小,当前阈值t的分割结果越好,式
E(t)=e(t)*(1-d(t))+(1-e(t))*d(t)
其中E(t)最小时,得到最合理的分割结果。
进一步地,所述步骤3.3)具体为:
在步骤1)中,会建立起像素点与数据点的映射关系,根据图像阈值分割结果,可以将正常数据与异常数据对应的像素点进行分类,然后通过之前的映射关系,可以将原始的风电散点数据进行分类,并识别和清洗异常数据。
本发明的优点:
(1)本发明通过栅格化散点数据,建立散点数据与数字图像之间的映射,将基于传统数据挖掘算法的数据清洗问题转化为图像分割问题,运用成熟的图像分割算法来解决数据清洗问题;
(2)本发明引入了图像分割算法中的类不确定性理论来处理数据分类的不确定性问题,并引入傅里叶描绘子这种新的特征作为相似性差异度量。
附图说明
图1是基于风电曲线的异常数据类型;
图2基于图像的数学形态学的方法
图3是本发明的方法流程图;
图4是栅格化散点数据将其转化为二值数字图像,其中:(a)散点数据;(b)二值数字图像;
图5是二值数字图像;
图6是计算距离的八个方向,距离为该方向上像素点的个数;
图7是(a)灰度特征图的直方图;(b)直方图均衡化后的显示图像;
图8是不同阈值下的类不确定性可视化图像;
图9风电曲线在复坐标系中的轮廓线,x代表实轴,y代表虚轴;
图10图像阈值化后的图像轮廓;
图11阈值分割后结果;
图12数据清理结果。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。
参见图3,本发明为一种对来自风电机组安装的数据采集与监视控制系统的风电曲线的异常数据进行清洗的方法。
首先是通过栅格化建立一种映射关系,将风力发电的散点数据转化为二值数字图像,具体为:
散点数据因为存在于连续空间所以需要先被栅格化,才能变成数字图像。可以通过栅格化将散点数据的散点划分到不同的框。每个框代表数字图像中的一个像素点。(x,y)是数字图像f(x,y)的一个像素点,其中x=1,...,M,y=1,...,N。第i个数据点是(vi,pi),其中v是风速,p是功率。像素与数据点之间的缩放参数是(Δx,Δy)。Pmax,Pmin分别代表最大和最小功率,vmax,vmin分别代表最大和最小风速。第i个像素(xi,yi)与数据点之间的对应可以由式(1)计算,通过缩放参数,一个像素点可以对应许多数据点。有数据对应的像素点的灰度值设为255,其余像素点的灰度值设为0,参见图4。
Figure BDA0002309559890000081
图像的尺寸大小M×N由式(2)计算
Figure BDA0002309559890000082
通过这种方式可建立风电数据点与生成的数字图像的映射关系,生成的二值数字图像如图5所示。
第二步是将二值数字图像转化为特征灰度图像,通过计算有值像素点到连通域边界的像素在八个方向上的距离,然后计算距离的中值作为当前像素的灰度值,具体为:
参见图6,为了区分异常数据和正常数据,在第二步构建特征灰度图。该步骤是计算有值像素点到连通域边界的像素在八个方向上的距离,然后计算距离的中位数作为当前像素的灰度值。
第三步,在确定阈值t下,以异常数据对应的像素为背景,正常数据对应的像素为前景,计算图像的类不确定性,通过类不确定性理论对图像进行分析,参见图7。然后将分类不确定性与参考模板的傅里叶描述子结合构建能量函数,通过最小化能量函数寻找最优阈值t。最后,通过阈值分割结果,对前景和背景进行分割,根据之前的映射关系,达到识别和分类正常数据和异常数据的作用。
具体为:
①基于阈值类不确定性
在灰度特征图中,令C表示图像中灰度值零以上的所有像素(不包含零,黑色背景不计入),令c表示某一个元素,且c∈C。令Fo,t和Fb,t表示有阈值t产生的空间元素属于前景和背景的集合,此时前景属于正常数据,背景属于要清洗的异常数据,其表达式为Fo,t={c|c∈C andf(c)≥t}
Fb,t={c||c∈C andf(c)≥t}
由阈值t产生前景概率为
Figure BDA0002309559890000091
其中,|X|表示X的数量。
这里引入集合G=[MIN,MAX],MIN表示一副图像中的最小的灰度值,MAX表示一副图像中的最大的灰度值。在阈值t的条件下,我们可以将po(g)和pb(g)写成概率密度函数的形式,则
Figure BDA0002309559890000101
Figure BDA0002309559890000102
其中,mo(t)和mb(t)分别表示前景像素的灰度均值和背景像素的灰度均值,σo(t)和σb(t)分别表示前景像素和背景像素的标准差。
在阈值t情况下,将类不确定性表达为阈值为t的函数,当灰度值为g时,其公式为
Figure BDA0002309559890000103
其中,pt(g)如公式所示
pt(g)=θ(t)po,t(g)+(1-θ(t))pb,t(g)
在阈值为t时,对于每个像素点,可以得到不同的熵Ht(g)来表示当前像素点的类不确定性。将其小到大按照由蓝到绿再到红可视化,可以得到代表类不确定的能量图。当t发生变化时,可以得到不同阈值下能量图,图8为部分能量图.
②傅里叶描绘子相似性度量
傅里叶描绘子是一种图像特征,具体来说,是一个用来描述轮廓的特征参数。其基本思想是用物体边界信息的傅里叶变换作为形状特征,将轮廓特征从空间域变换到频域内,提取频域信息作为图像的特征向量。即用一个向量代表一个轮廓,将轮廓数字化,只需少量的描子(即向量中得到数不需要太多)即可大致代表整个轮廓。其次,对傅里叶描述子进行简单的归一化操作后,即可使描述子具有平移、旋转、尺寸不变性。
参见图9,先将提取二值图像中的轮廓图,轮廓包含K个像素点,从任意像素点在图像中的像素位置(x0,y0)开始,以顺时针方向在该边界上行进时,会遇到像素位置坐标对(x0,y0),(x1,y1),(x2,y2),…,(xK-1,yK-1)。这些坐标可以表示为x(k)=xK,y(k)=yK的形式。使用这种表示法,轮廓本身可以表示为坐标序列
s(k)=[x(k),y(k)],k=0,1,2,…,K-1。此外,每个坐标对可当做一个复数来处理,即
s(k)=x(k)+iy(k)
其中k=0,1,2,…,K-1。也就是说,x轴为复数序列的实轴,y轴为复数序列的虚轴。尽管对该序列的解释是全新的,但边界本身的性质并未改变。当然,这种表示方法的一大优点是它将二维问题简化成了一维问题。
s(k)的离散傅里叶变换(DFT)为
Figure BDA0002309559890000111
式中u=0,1,2,…,K-1。复系数a(u)称为边界的傅里叶描绘子。本文取u=0到u=12作为轮廓描绘子。
将其简单归一化:
Figure BDA0002309559890000112
两轮廓之间的相似性差异可用归一化后的两个傅里叶描绘子向量之间的欧式距离作为度量,如下式
Figure BDA0002309559890000113
rA(i),rB(i)分别是对象轮廓A和B的归一化后傅里叶描绘子,d为两轮廓间的相似性差异。
对于特征灰度图像,在不同阈值分割下,会有不同的分割前景,对于每个分割前景,取最大连通域作为所得正常数据,取其轮廓,图10为部分轮廓。
当阈值t变化时,不同轮廓与模板风电曲线按照以上计算方式,都有对应相似性差异的值计为d(t)。
同时在灰度图像M中,在一个固定阈值t的情况下,灰度图像M中有n个灰度值非零的像素点,每个像素点i的灰度值g对应的类不确定性值为ht(i)=Ht(g),将所有像素点的类不确定性值相加并归一化:
Figure BDA0002309559890000121
在阈值为t的情况下,特征灰度的整体类不确定性e(t)越小,同时,分割结果与模板WPC的傅里叶描绘子的相似性差异d(t)越小,当前阈值t的分割结果越好,式
E(t)=e(t)*(1-d(t))+(1-e(t))*d(t)
其中E(t)最小时,得到最合理的分割结果,参见图11。
③数据标记
在第一步时,会建立起像素点与数据点的映射关系,根据图像阈值分割结果,可以将正常数据与异常数据对应的像素点进行分类,然后通过之前的映射关系,可以将原始的风电散点数据进行分类,并识别和清洗异常数据。将风电数据的散点图绘制出如图12所示。
以上所述仅为本发明的实施例,并非以此限制本发明的保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的系统领域,均同理包括在本发明的保护范围内。

Claims (7)

1.一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于,包括以下步骤:
1)建立映射关系,将风力发电的散点数据转化为二值数字图像;
2)将二值数字图像转化为特征灰度图像;
3)对特征灰度图像进行识别,进行数据清洗。
2.根据权利要求1所述的一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于:
所述步骤1)具体为:
通过栅格化将散点数据的散点划分到不同的框,每个框代表数字图像中的一个像素点,(x,y)是数字图像f(x,y)的一个像素点,其中x=1,...,M,y=1,...,N,第i个数据点是(vi,pi),其中v是风速,p是功率;像素与数据点之间的缩放参数是(Δx,Δy),Pmax,Pmin分别代表最大和最小功率,vmax,vmin分别代表最大和最小风速;第i个像素(xi,yi)与数据点之间的对应可以由式(1)计算,通过缩放参数,一个像素点可以对应许多数据点;有数据对应的像素点的灰度值设为255,其余像素点的灰度值设为0,
Figure FDA0002309559880000011
图像的尺寸大小M×N由式(2)计算
Figure FDA0002309559880000012
通过以上方式可建立风电数据点与生成的数字图像的映射关系,生成的二值数字图像。
3.根据权利要求2所述的一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于:
所述步骤2)具体为:
计算有值像素点到连通域边界的像素在八个方向上的距离,然后计算距离的中位数作为当前像素的灰度值。
4.根据权利要求1-3任一所述的一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于:
所述步骤3)包括以下步骤:
3.1)在确定阈值t下,以异常数据对应的像素为背景,正常数据对应的像素为前景,计算图像的类不确定性,通过类不确定性理论对图像进行分析;
3.2)然后将分类不确定性与参考模板的傅里叶描述子结合构建能量函数,通过最小化能量函数寻找最优阈值t;
3.3)最后,通过阈值分割结果,对前景和背景进行分割,根据之前的映射关系,达到识别和分类正常数据和异常数据的作用。
5.根据权利要求4所述的一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于:
所述步骤3.1)具体为:
在灰度特征图中,令C表示图像中灰度值零以上的所有像素,令c表示某一个元素,且c∈C,令Fo,t和Fb,t表示有阈值t产生的空间元素属于前景和背景的集合,此时前景属于正常数据,背景属于要清洗的异常数据,其表达式为:
Fo,t={c|c∈Candf(c)≥t}
Fb,t={c|c∈Candf(c)≥t}
由阈值t产生前景概率为:
Figure FDA0002309559880000031
其中,|X|表示X的数量;
这里引入集合G=[MIN,MAX],MIN表示一副图像中的最小的灰度值,MAX表示一副图像中的最大的灰度值;在阈值t的条件下,我们可以将po(g)和pb(g)写成概率密度函数的形式,则
Figure FDA0002309559880000032
Figure FDA0002309559880000033
其中,mo(t)和mb(t)分别表示前景像素的灰度均值和背景像素的灰度均值,σo(t)和σb(t)分别表示前景像素和背景像素的标准差;
在阈值t情况下,将类不确定性表达为阈值为t的函数,当灰度值为g时,其公式为:
Figure FDA0002309559880000034
其中,pt(g)如公式所示:
pt(g)=θ(t)po,t(g)+(1-θ(t))pb,t(g)
在阈值为t时,对于每个像素点,可以得到不同的熵Ht(g)来表示当前像素点的类不确定性;将其小到大按照由蓝到绿再到红可视化,可以得到代表类不确定的能量图;当t发生变化时,可以得到不同阈值下能量图。
6.根据权利要求5所述的一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于:
所述步骤3.2)具体为:
先将提取二值图像中的轮廓图,轮廓包含K个像素点,从任意像素点在图像中的像素位置(x0,y0)开始,以顺时针方向在该边界上行进时,会遇到像素位置坐标对(x0,y0),(x1,y1),(x2,y2),…,(xK-1,yK-1);这些坐标可以表示为x(k)=xK,y(k)=yK的形式,使用这种表示法,轮廓本身可以表示为坐标序列:
s(k)=[x(k),y(k)],k=0,1,2,…,K-1;此外,每个坐标对可当做一个复数来处理,即:
s(k)=x(k)+iy(k)
其中k=0,1,2,…,K-1;也就是说,x轴为复数序列的实轴,y轴为复数序列的虚轴;
s(k)的离散傅里叶变换(DFT)为
Figure FDA0002309559880000041
式中u=0,1,2,…,K-1;复系数a(u)称为边界的傅里叶描绘子;取u=0到u=12作为轮廓描绘子;
将其简单归一化:
Figure FDA0002309559880000042
两轮廓之间的相似性差异可用归一化后的两个傅里叶描绘子向量之间的欧式距离作为度量,如下式:
Figure FDA0002309559880000051
rA(i),rB(i)分别是对象轮廓A和B的归一化后傅里叶描绘子,d为两轮廓间的相似性差异;
对于特征灰度图像,在不同阈值分割下,会有不同的分割前景,对于每个分割前景,取最大连通域作为所得正常数据,取其轮廓;
当阈值t变化时,不同轮廓与模板风电曲线按照以上计算方式,都有对应相似性差异的值计为d(t);
同时在灰度图像M中,在一个固定阈值t的情况下,灰度图像M中有n个灰度值非零的像素点,每个像素点i的灰度值g对应的类不确定性值为ht(i)=Ht(g),将所有像素点的类不确定性值相加并归一化:
Figure FDA0002309559880000052
在阈值为t的情况下,特征灰度的整体类不确定性e(t)越小,同时,分割结果与模板WPC的傅里叶描绘子的相似性差异d(t)越小,当前阈值t的分割结果越好,式
E(t)=e(t)*(1-d(t))+(1-e(t))*d(t)
其中E(t)最小时,得到最合理的分割结果。
7.根据权利要求6所述的一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于:
所述步骤3.3)具体为:
在步骤1)中,会建立起像素点与数据点的映射关系,根据图像阈值分割结果,可以将正常数据与异常数据对应的像素点进行分类,然后通过之前的映射关系,可以将原始的风电散点数据进行分类,并识别和清洗异常数据。
CN201911253021.3A 2019-12-09 2019-12-09 基于图像的风力发电功率曲线异常数据识别与清洗方法 Active CN111145109B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911253021.3A CN111145109B (zh) 2019-12-09 2019-12-09 基于图像的风力发电功率曲线异常数据识别与清洗方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911253021.3A CN111145109B (zh) 2019-12-09 2019-12-09 基于图像的风力发电功率曲线异常数据识别与清洗方法

Publications (2)

Publication Number Publication Date
CN111145109A true CN111145109A (zh) 2020-05-12
CN111145109B CN111145109B (zh) 2023-03-31

Family

ID=70517841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911253021.3A Active CN111145109B (zh) 2019-12-09 2019-12-09 基于图像的风力发电功率曲线异常数据识别与清洗方法

Country Status (1)

Country Link
CN (1) CN111145109B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113436194A (zh) * 2021-08-26 2021-09-24 北京工业大数据创新中心有限公司 一种风电机组的异常检测方法、装置及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013002256A1 (ja) * 2011-06-28 2013-01-03 三菱重工業株式会社 運転監視システム、運転監視方法、及びプログラム
US20130155235A1 (en) * 2011-12-17 2013-06-20 Apem Limited Image processing method
CN107527057A (zh) * 2017-09-07 2017-12-29 北京国能日新系统控制技术有限公司 一种风速功率异常数据剔除方法及装置
WO2018014825A1 (zh) * 2016-07-21 2018-01-25 浙江运达风电股份有限公司 一种风电机组对风误差自动校准方法及装置
CN108590982A (zh) * 2018-03-26 2018-09-28 华北电力大学 一种风电机组限功率运行的异常数据处理方法
CN109657547A (zh) * 2018-11-13 2019-04-19 成都四方伟业软件股份有限公司 一种基于伴随模型的异常轨迹分析方法
CN109919199A (zh) * 2019-02-13 2019-06-21 东南大学 基于图像处理的风电机组异常数据的检测方法
CN110134919A (zh) * 2019-04-30 2019-08-16 华北电力大学 风电机组异常数据清洗方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013002256A1 (ja) * 2011-06-28 2013-01-03 三菱重工業株式会社 運転監視システム、運転監視方法、及びプログラム
US20130155235A1 (en) * 2011-12-17 2013-06-20 Apem Limited Image processing method
WO2018014825A1 (zh) * 2016-07-21 2018-01-25 浙江运达风电股份有限公司 一种风电机组对风误差自动校准方法及装置
CN107527057A (zh) * 2017-09-07 2017-12-29 北京国能日新系统控制技术有限公司 一种风速功率异常数据剔除方法及装置
CN108590982A (zh) * 2018-03-26 2018-09-28 华北电力大学 一种风电机组限功率运行的异常数据处理方法
CN109657547A (zh) * 2018-11-13 2019-04-19 成都四方伟业软件股份有限公司 一种基于伴随模型的异常轨迹分析方法
CN109919199A (zh) * 2019-02-13 2019-06-21 东南大学 基于图像处理的风电机组异常数据的检测方法
CN110134919A (zh) * 2019-04-30 2019-08-16 华北电力大学 风电机组异常数据清洗方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
沈小军: ""风电机组风速-功率异常运行数据"", 《电工技术学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113436194A (zh) * 2021-08-26 2021-09-24 北京工业大数据创新中心有限公司 一种风电机组的异常检测方法、装置及设备

Also Published As

Publication number Publication date
CN111145109B (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
CN111428748B (zh) 一种基于hog特征和svm的红外图像绝缘子识别检测方法
CN109389180A (zh) 一款基于深度学习的电力设备图像识别方法及巡查机器人
CN110264448B (zh) 一种基于机器视觉的绝缘子故障检测方法
CN107895376A (zh) 基于改进Canny算子和轮廓面积阈值的太阳能电池板识别方法
Wang et al. A fast abnormal data cleaning algorithm for performance evaluation of wind turbine
CN105447512A (zh) 一种精粗结合的光学表面缺陷的检测方法及装置
CN111539330B (zh) 一种基于双svm多分类器的变电站数显仪表识别方法
Liang et al. Wind power curve data cleaning by image thresholding based on class uncertainty and shape dissimilarity
CN108009574B (zh) 一种轨道扣件检测方法
CN109447036A (zh) 一种图像数字分割与识别方法及系统
CN111402224A (zh) 一种用于电力设备的目标识别方法
Yang et al. An efficient method for vehicle model identification via logo recognition
CN112150412B (zh) 一种基于投影曲线分析的绝缘子自爆缺陷检测方法
CN111145109B (zh) 基于图像的风力发电功率曲线异常数据识别与清洗方法
Pan et al. Improving scene text detection by scale-adaptive segmentation and weighted CRF verification
CN111862073A (zh) 一种电力设备的温度采集方法和装置
CN116823725A (zh) 一种基于支持向量机的航空发动机叶片表面缺陷检测方法
CN116311201A (zh) 一种基于图像识别技术的变电站设备状态识别方法及系统
CN105354547A (zh) 一种结合纹理和彩色特征的行人检测方法
CN109740607B (zh) 字符图像的残缺区域检测和残缺字符图像恢复方法
CN111950606B (zh) 一种刀闸状态识别方法、装置、设备和存储介质
CN109829511B (zh) 基于纹理分类的下视红外图像中云层区域检测方法
CN112418241A (zh) 一种基于红外成像技术的电力设备识别方法
CN109784261A (zh) 基于机器视觉的行人分割与识别方法
CN115471845A (zh) 基于深度学习和OpenCV的换流站数字仪表识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant