CN109740175A - 一种面向风电机组功率曲线数据的离群点判别方法 - Google Patents

一种面向风电机组功率曲线数据的离群点判别方法 Download PDF

Info

Publication number
CN109740175A
CN109740175A CN201811374105.8A CN201811374105A CN109740175A CN 109740175 A CN109740175 A CN 109740175A CN 201811374105 A CN201811374105 A CN 201811374105A CN 109740175 A CN109740175 A CN 109740175A
Authority
CN
China
Prior art keywords
data
power curve
point
outlier
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811374105.8A
Other languages
English (en)
Other versions
CN109740175B (zh
Inventor
杨秦敏
鲍雨浓
陈积明
孙优贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201811374105.8A priority Critical patent/CN109740175B/zh
Publication of CN109740175A publication Critical patent/CN109740175A/zh
Application granted granted Critical
Publication of CN109740175B publication Critical patent/CN109740175B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Wind Motors (AREA)

Abstract

本发明公开了一种面向风电机组功率曲线数据的离群点判别方法。该方法基于包括风速、有功功率等在内的风电机组数据采集与监视控制(SCADA)系统实时运行数据,在经过一系列预处理步骤后,分别依据一定风速、功率间隔划分数据;进一步基于均值距离判别(AVDC)、局部异常因子(LOF)以及考虑噪声的基于密度的聚类(DBSCAN)这3种离群点检测算法检测疑似离群点;最后基于真实离群点判别准则从疑似离群点中识别真实离群点。本发明方法基于数据驱动,对风电机组其他信息无特殊要求,具有较强的普适性。与现有技术相比,在结合主流离群点检测方法优势的同时兼顾了功率曲线数据集特征,为数据质量提供了保证,具有较强的理论性与应用性。

Description

一种面向风电机组功率曲线数据的离群点判别方法
技术领域
本发明涉及一种数据离群点判别方法,特别涉及一种面向风电机组功率曲线数据的离群点判别方法。
背景技术
在传统化石能源储量日益匮乏和环境恶化加剧的现代社会,风能作为一种新能源替代选择之一而因其环境友好、储量丰富以及可再生的优异特性而广泛为大众所关注,我国风电设备的总装机量以及装机量增速也逐渐跃居为全球排名前三甲。在我国,随着大数据技术在工业领域的逐渐普及,近十年内风力发电行业从选址、布局、建设,到风电机组优化、调度、控制,再到后续的评估、运维、管理等方面均有着长足的进步,但在我国风电行业飞速发展的同时,居高不下的运维费用仍然是阻碍风力发电行业广泛部署的主要因素。由于风电机组的能量来源——风本身具有间歇性与高度不确定性的随机特点,且由于现有传感器的测量问题而导致相关数据在测量过程中会出现数值偏移等异常问题,致使风电机组在运行过程中测量得到的数据中包含很多的异常信息及噪声信息,从而对判断风电机组的运行状况、量化风电机组发电性能以及判断风电机组故障情况产生十分严重的负面影响,进一步造成巨额的运维支出。因此,如何判断风电机组数据的异常问题,是利用智能大数据分析技术解决风力发电领域中行业痛点问题与降低风力发电行业运维管理成本的重中之重。
考虑到风电机组的功率曲线数据在评估风电机组发电性能方面十分重要,因此对于风电机组功率曲线数据的准确获取是进一步进行详细分析的首要基础。而对于风电机组的功率曲线数据而言,如何将包含异常数据以及噪声数据在内的数据集信息处理为统一的、准确的数据信息则是研究的重点内容。然而,目前现有的功率曲线数据在对其异常点、离群点检测的方法中主要存在着以下不足之处:(1)大部分异常点、离群点相关研究将不同工况下的数据整体进行异常情况检测,忽略不同工况的差异带来的影响;(2)传统的功率曲线数据离群点、异常点判别方法往往仅采用单一算法进行检测,效果大幅受限于少量参数的主观选取约束。
因此,现有的功率曲线数据在异常点、离群点检测方面无法从数据集中处理出准确率较高的风电机组功率曲线数据信息,需要综合功率曲线数据特征的相关算法加以改进。
发明内容
本发明目的在于对现有研究和技术存在的不足之处加以完善与规范化,提出一种面向风电机组功率曲线数据的离群点判别方法。该方法考虑不同运行工况对风电机组功率曲线数据设计更为规范、准确的异常点、离群点检测及判别流程,可以提高最终获取到的功率曲线数据的准确性与可靠性,更具有实用价值;进一步考虑了不同离群点检测与判别算法对风电机组功率曲线数据的适合程度,从而获取更为客观的离群点判别结果,方法的普适性与扩展性更高。
本发明的目的通过以下的技术方案实现:一种面向风电机组功率曲线数据的离群点判别方法,该方法包括以下步骤:
1)根据待评估风电机组功率曲线获取需求,读取相应需求周期内总计N条待评估风电机组的SCADA系统中测量得到的风电机组运行数据信息,该信息包含风速{vi}、有功功率{Pi}、桨距角{βi}、风电机组运行状态{Condi}、环境气压{Bi}以及环境温度{Ti},将信息数据集记为其中i=1,2,3,…,N;
2)将步骤1)中的信息数据集进行数据预处理操作,剔除机组异常运行状态并修正空气密度的影响,保留余下的N′条运行数据作为预处理后的风电机组正常数据集{Xi},其中i=1,2,3,…,N′;
3)将步骤2)得到的正常数据集{Xi}中的风速信息以及功率信息{Pi}合成为功率曲线散点数据集{PCi},即其中i=1,2,3,…,N′;
4)对步骤3)得到的功率曲线散点数据集{PCi}中的风速信息以及功率信息{Pi}分别进行归一化,得到归一化功率曲线散点数据集{PCnorm,i},其中i=1,2,3,…,N′;
5)分别按照一定的风速间隔(ws)和功率间隔(ap)将步骤4)中的归一化功率曲线散点数据集{PCnorm,i}各划分为M个区间,并分别记第j个区间中的数据个数为Mseg,j、归一化功率曲线散点数据集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j
6)利用均值距离判别(AVDC)离群点检测算法分别对步骤5)中的2M个区间进行疑似离群点检测,并分别记第j个区间的疑似离群点个数为归一化功率曲线疑似离群点集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j
所述均值距离判别(AVDC)离群点检测算法具体为:对于数据个数Mseg,j小于给定最小阈值δM的区间,认为该区间归一化功率曲线疑似离群点集否则对于第j个风速区间或第j个功率区间,首先计算区间内归一化功率曲线数据集中各数据点的判别距离进一步设定疑似离群点的占比并确定第j个区间中疑似离群点个数通过由大到小对判别距离进行排序的方式确定前个数据构成第j个区间的归一化功率曲线疑似离群点集
所述判别距离的计算方式具体如下:
其中分别为第j个风速区间内归一化功率曲线数据集的功率平均值和第j个功率区间内归一化功率曲线数据集的风速平均值,l=1,2,3,…,Mseg,j
7)分别利用局部异常因子(LOF)以及考虑噪声的基于密度的聚类(DBSCAN)这两种离群点检测算法对步骤5)中的2M个区间进行判别离群点检测,并分别记第j个区间的判别离群点个数为归一化功率曲线判别离群点集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j,method={LOF,DBSCAN};
8)基于真实离群点判别准则,从步骤6)的功率曲线疑似离群点集和步骤7)的功率曲线判别离群点集中获取真实离群点集其中seg={ws,ap},j=1,2,3,…,M,method={LOF,DBSCAN};
所述真实离群点判别准则定义为:对于第j个区间的归一化功率曲线数据集中的任一数据点Q,若其属于疑似离群点集并且属于LOF判别离群点集或DBSCAN判别离群点集之一,则点Q为第j个区间的真实离群点;
9)基于步骤8)中得到的各风速区间真实离群点集以及各功率区间真实离群点集利用最终离群点判断准则获得功率曲线散点数据集{PCi}的最终离群点判别结果集{Outlier},作为最终离群点判别结果;
所述最终离群点判断准则定义为:对于功率曲线散点数据集{PCi}中的任一数据点Q′,若其在归一化功率曲线散点数据集{PCnorm,i}中对应的数据点Q是某风速区间的真实离群点或某功率区间的真实离群点,则点Q′为功率曲线散点数据集{PCi}的最终离群点。
作为更进一步描述,所述方法步骤2)中,信息数据集进行的数据预处理操作流程如下:
2-a)基于信息数据集记为中的风电机组运行状态{Condi}信息进行异常运行状况检测并剔除异常点,记剔除异常点后的风电机组运行数据集为
2-b)利用步骤2-a)中的风电机组运行数据集为计算得出相应时刻的空气密度集{ρi},并将风电机组运行数据集中的风速{vi}修正替换为参考空气密度ρ0下的修正风速并记新数据集为风电机组正常数据集{Xi}。
作为更进一步描述,所述方法步骤2-a)中,利用信息数据集记为中的信息进行异常运行状况检测,具体检测判据如下:
表1风电机组异常运行状况检测判据
其中Condnormal为风电机组正常运行状态,Condls为风电机组低风速正常运行状态,Condhs为风电机组高风速正常运行状态,Prated为风电机组额定有功功率,Pthres为有功功率阈值,βthres为桨距角阈值。
作为更进一步描述,所述方法步骤2-b)中,空气密度ρi以及修正风速的计算公式如下:
2-b-a)空气密度ρi
其中R0为干燥空气的比气体常数;Rw为水蒸气的比气体常数;Pw为水蒸气的气压;Bi为环境气压,通过SCADA系统获取,或者通过估计,其中B0为标准海平面大气压强,e为自然常数,g为重力加速度,z为风电机组轮毂处海拔高度,R为空气的比气体常数;为相对环境湿度,通过SCADA系统获取,或者设置
2-b-b)修正风速
其中ρ0为参考空气密度。
作为更进一步描述,所述方法步骤4)中,利用最大值最小值标准化方法对数据进行归一化,具体流程如下:
4-a)确定功率曲线散点数据集{PCi}中风速信息以及功率信息{Pi}的最大值与最小值,记风速信息的最大值为vmax,最小值为vmin;功率信息{Pi}的最大值为Pmax,最小值为Pmin
4-b)利用如下公式计算标准化后的风速信息以及标准化后的功率信息{Pnorm,i}:
4-c)将标准化风速信息以及标准化功率信息{Pnorm,i}合成为归一化功率曲线散点数据集{PCnorm,i},即
作为更进一步描述,所述方法步骤5)中,归一化功率曲线散点数据集{PCnorm,i}的划分方法具体如下:
5-a)确定归一化功率曲线散点数据集{PCnorm,i}的区间划分个数M;
5-b)以为划分间隔,将数据集{PCnorm,i}按照风速进行均匀划分,则第j个风速区间的归一化功率曲线数据集定义为
其中Mws,j为第j个风速区间归一化功率曲线数据集中的数据个数;
5-c)以为划分间隔,将数据集{PCnorm,i}按照功率进行均匀划分,则第j个功率区间的归一化功率曲线数据集定义为
其中Map,j为第j个功率区间归一化功率曲线数据集中的数据个数。
作为更进一步描述,所述方法步骤6)中,利用均值距离判别(AVDC)离群点检测算法进行中各区间内疑似离群点检测,算法具体流程如下:
6-a)设定初始离群点检测区间j=1;
6-b)若第j个区间对应归一化功率曲线数据集中的数据个数Mseg,j小于给定最小阈值δM,则认为第j个区间的疑似离群点个数为0、归一化功率曲线疑似离群点集并跳至步骤6-g)继续执行;反之则继续执行步骤6-c);
6-c)设定疑似离群点在第j个区间归一化功率曲线数据集中的占比并计算第j个区间中疑似离群点个数计算公式定义为
其中函数为向上取整函数;
6-d)计算第j个风速区间归一化功率曲线数据集中各数据点的风速判别距离计算公式如下
其中为第j个风速区间内归一化功率曲线数据集的功率平均值;
6-e)计算第j个功率区间归一化功率曲线数据集中各数据点的功率判别距离计算公式如下
其中为第j个功率区间内归一化功率曲线数据集的风速平均值;
6-f)将第j个区间的判别距离数据集分别由大到小进行排序,并分别选取排序后的判别距离数据集中的前个数据,构成第j个区间的归一化功率曲线疑似离群点集其中l=1,2,3,…,Mseg,j
6-g)设置检测区间j=j+1,并重复进行步骤6-b)至步骤6-f),直到j>M为止。
作为更进一步描述,所述方法步骤7)中,利用局部异常因子(LOF)离群点检测算法进行中各区间内LOF判别离群点检测,算法具体流程如下:
7-1a)设定初始离群点检测区间j=1;
7-1b)若第j个区间对应归一化功率曲线数据集中的数据个数Mseg,j小于给定最小阈值δM,则认为第j个区间的LOF判别离群点个数为0、归一化功率曲线LOF判别离群点集并跳至步骤7-1j)继续执行;反之则继续执行步骤7-1c);
7-1c)设定LOF判别离群点在第j个区间归一化功率曲线数据集中的占比并计算第j个区间中判别离群点个数计算公式如下
其中函数为向上取整函数,同时设定第j个区间归一化功率曲线数据集中各数据点的邻域参数k;
7-1d)计算第j个区间归一化功率曲线数据集中各数据点之间的欧式距离d(P,Q),计算公式如下
其中满足P≠Q且
7-1e)基于步骤7-1d)中的距离数据确定第j个区间归一化功率曲线数据集中各数据点的k距离distk(P)以及k邻域确定方法如下
distk(P)=d(P,P′)
其中P′满足如下条件:
(i)存在至多k-1个点满足d(P,Q)<d(P,P′);
(ii)存在至少k个点满足d(P,Q)≤d(P,P′);
7-1f)计算第j个区间归一化功率曲线数据集中各数据点与其k邻域内各数据点之间的可达距离rdistk(P,Q),计算公式如下
rdistk(P,Q)=max{distk(Q),d(P,Q)}
其中
7-1g)计算第j个区间归一化功率曲线数据集中各数据点的局部可达密度lrdk(P),计算公式如下
其中表示数据点的k邻域中除P以外的其他数据点个数;
7-1h)计算第j个区间归一化功率曲线数据集中各数据点的局部离群因子lofk(P),计算公式如下
7-1i)将第j个区间归一化功率曲线数据集中各数据点的局部离群因子lofk(P)由大到小进行排序,并分别选取其中前个数据,构成第j个区间的归一化功率曲线LOF判别离群点集
7-1j)设置检测区间j=j+1,并重复进行步骤7-1b)至步骤7-1i),直到j>M为止。
作为更进一步描述,所述方法步骤7)中,利用考虑噪声的基于密度的聚类(DBSCAN)离群点检测算法进行和各区间内DBSCAN判别离群点检测,算法具体流程如下:
7-2a)设定初始离群点检测区间j=1;
7-2b)若第j个区间对应归一化功率曲线数据集中的数据个数Mseg,j小于给定最小阈值δM,则认为第j个区间的DBSCAN判别离群点个数为0、归一化功率曲线DBSCAN判别离群点集并跳至步骤7-2m)继续执行,反之则继续执行步骤7-2c);
7-2c)计算第j个区间归一化功率曲线数据集中各数据点之间的欧式距离d(P,Q),计算公式如下
其中满足并设定第j个区间归一化功率曲线数据集中的ε邻域判别半径eps以及核心点判别参数MinPts;
7-2d)确定第j个区间归一化功率曲线数据集中各数据点的ε邻域确定公式如下
其中满足
7-2e)将第j个区间归一化功率曲线数据集中的所有数据点际记为“未处理”状态,并设定初始簇编号C=0;
7-2f)设定初始分析点l=1;
7-2g)若第j个区间归一化功率曲线数据集中的第l个数据点已经被标记为“已处理”状态,则跳转至步骤7-2k)继续执行,反之则继续执行7-2h);
7-2h)标记第l个数据点为“已处理”状态,并判断数据点Pl的初始类型,判断方法如下:
则标记数据点Pl为“核心点”,并继续执行步骤7-2i);
则标记数据点Pl为“噪声点”,并跳转至步骤7-2k)继续执行;
7-2i)设置簇编号C=C+1,将数据点Pl添加至簇C中,并设置数据点Pl的初始密度可达数据集
7-2j)对数据点Pl的初始密度可达数据集中的所有数据点Q按照步骤7-2j-a)至7-2j-c)流程进行处理,直到所有数据点均处于“已处理”状态为止:
7-2j-a)若Q已被标记为“噪声点”,则重新将Q标记为“边界点”,并将数据点Q添加至簇C中;
7-2j-b)若Q已处于“已处理”状态,则跳过步骤7-2j-c)直接对其他数据点进行处理;
7-2j-c)若Q仍处于“未处理”状态,则首先标记Q为“已处理”状态,并将Q添加至簇C中,进一步判断数据点Q的ε邻域中的数据个数与MinPts的关系,若 则标记数据点Q为“核心点”,并将中的所有数据点插入至密度可达数据集中,反之不进行操作;
7-2k)设置分析数据点l=l+1,并重复进行步骤7-2g)至步骤7-2j),直到l>Mseg,j为止;
7-2l)提取第j个区间归一化功率曲线数据集中被标记为“噪声点”的数据点,构成第j个区间归一化功率曲线DBSCAN判别离群点集为并记集合中离群点元素个数为
7-2m)设置检测区间j=j+1,并重复进行步骤7-2b)至步骤7-2l),直到j>M为止。
与现有技术相比,本发明具有以下创新优势及显著效果:
1)针对现有风电机组功率曲线异常点、离群点检测及判别算法中未考虑不同工况给判别流程带来的影响这一问题,通过风速及功率区间划分的方式来约束运行工况的方式来进行分段研究,保证功率曲线数据在风电机组运行工况方面一定程度的统一,使离群点检测结果更准确;
2)针对单一异常点、离群点检测及判别算法主观确定的参数在功率曲线数据集上的应用效果存在限制这一问题,通过结合不同离群点检测判别算法的分析结果的方式确定最终的真实离群点,确保离群点检测结果的客观性与可靠性。
附图说明
图1是本发明所面向风电机组功率曲线数据的离群点判别方法整体流程图;
图2是本发明实施例中的原始数据集功率曲线散点图;
图3是本发明实施例步骤2)中功率曲线数据集的异常运行状态检测结果图;
图4是本发明实施例步骤4)归一化&空气密度修正及步骤5)基于风速和功率划分数据集的相关结果图;
图5是本发明实施例步骤6)在风速划分数据下的AVDC疑似离群点检测结果图;
图6是本发明实施例步骤6)在功率划分数据下的AVDC疑似离群点检测结果图;
图7是本发明实施例步骤7)在风速划分数据下的LOF判别离群点检测结果图;
图8是本发明实施例步骤7)在风速划分数据下的DBSCAN判别离群点检测结果图;
图9是本发明实施例步骤7)在功率划分数据下的LOF判别离群点检测结果图;
图10是本发明实施例步骤7)在功率划分数据下的DBSCAN判别离群点检测结果图;
图11是本发明实施例步骤8)在风速划分数据下的真实离群点检测结果图;
图12是本发明实施例步骤8)在功率划分数据下的真实离群点检测结果图;
图13是本发明实施例步骤9)在功率曲线数据集下的最终离群点检测结果图。
具体实施方式
以下结合附图对本发明的具体实施方法与工作原理作如下详述:
实施例
本实施例对某风电场的某台风电机组的SCADA系统在2013年9月至2015年10月期间内采集到的数据进行风电机组功率曲线数据离群点检测,其中风电机组SCADA系统的数据采样间隔为10min,时间范围为2013.09.02-17:30:00至2015.10.04-16:00:00,数据条目数共计105978条。数据集包括的具体变量以及相关数据信息如表2、表3所示:
表2风电机组SCADA仿真数据集变量信息
变量名称 变量含义 变量单位
时间戳 数据采集时间 年-月-日 时:分:秒
风速v 当前风电机组机舱风速 m/s
有功功率P 当前风电机组有功功率 kW
桨距角β 当前风电机组桨叶桨距角 °
运行状态Cond 当前风电机组运行状态 无量纲
环境温度T 风电机组运行环境温度
环境气压B 风电机组运行环境气压 Pa
表3风电机组SCADA仿真数据集部分数据
数据序号 时间戳 风速 有功功率 桨距角 运行状态 环境温度 环境气压
1180 1378821600 2.35 0.04 85.59 7 23.89 100463
1181 1378822200 2.11 0.04 85.59 7 23.99 100461
1182 1378822800 1.96 0.04 85.59 7 24.04 100461
80183 1427949600 11.22 1328.17 4.72 1 7.83 100414
80184 1427950200 11.57 1405.71 4.92 1 7.9 100413
80185 1427950800 10.86 1218.09 4.7 1 7.98 100411
本实施例中默认将6个月的功率曲线数据集进行离群点判别,方法结果为基于流程判别出的该数据集对应的最终真实离群点集{Outlier},其详细实施步骤具体如下:
1)根据待评估风电机组功率曲线获取需求,读取相应需求周期内总计N条待评估风电机组的SCADA系统中测量得到的风电机组运行数据信息,该信息包含风速{vi}、有功功率{Pi}、桨距角{βi}、风电机组运行状态{Condi}、环境气压{Bi}以及环境温度{Ti},将信息数据集记为其中i=1,2,3,…,N;根据表2以及表3所列出的数据集变量信息,本实施例中的数据集包括了本步骤中的所有必要信息,图2所示的结果为本步骤中风电机组功率曲线原始数据散点图;
2)将步骤1)中的信息数据集进行数据预处理操作,剔除机组异常运行状态并修正空气密度的影响,保留余下的N′条运行数据作为预处理后的风电机组正常数据集{Xi},其中i=1,2,3,…,N′;首先基于表4中的风电机组异常运行状况检测判据对机组的异常运行运行状态进行检测:
表4风电机组异常运行状况检测判据
其中Condnormal为风电机组正常运行状态,在本实施例中为0或1;Condls为风电机组低风速正常运行状态,在本实施例中为0;Condhs为风电机组高风速正常运行状态,在本实施例中为1;Prated为风电机组额定有功功率,在本实施例中为1500kW;Pthres为有功功率阈值,在本实施例中取20kW;βthres为桨距角阈值,在本实施例中取3°。图3所示的结果为本步骤中的异常运行状态检测结果,其中不同异常类型由不同形状的数据散点表示。之后将将实施例中风电机组运行数据集中的风速{vi}修正替换为参考空气密度ρ0下的修正风速在本实施例中参考空气密度ρ0取1.225kg/m3
3)将步骤2)得到的正常数据集{Xi}中的风速信息以及功率信息{Pi}合成为功率曲线散点数据集{PCi},即其中i=1,2,3,…,N′;
4)对步骤3)得到的功率曲线散点数据集{PCi}中的风速信息以及功率信息{Pi}分别进行归一化,得到归一化功率曲线散点数据集{PCnorm,i},其中i=1,2,3,…,N′;归一化的主要目的是消除风速和功率的不同量纲与取值范围的影响,剔除异常点与风速修正后的功率曲线散点图如图4黑色实心圆点所示。
5)分别按照一定的风速间隔(ws)和功率间隔(ap)将步骤4)中的归一化功率曲线散点数据集{PCnorm,i}各划分为M个区间,并分别记第j个区间中的数据个数为Mseg,j、归一化功率曲线散点数据集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j;采用的一种优选划分方法具体如下,但不限于此:
5-a)确定归一化功率曲线散点数据集{PCnorm,i}的区间划分个数M;
5-b)以为划分间隔,将数据集{PCnorm,i}按照风速进行均匀划分,则第j个风速区间的归一化功率曲线数据集定义为
其中Mws,j为第j个风速区间归一化功率曲线数据集中的数据个数;
5-c)以为划分间隔,将数据集{PCnorm,i}按照功率进行均匀划分,则第j个功率区间的归一化功率曲线数据集定义为
其中Map,j为第j个功率区间归一化功率曲线数据集中的数据个数。在本实施例中M取40,对应风速间隔(ws)和功率间隔(ap)划分结果如图4中虚线和点虚线所示。
6)利用均值距离判别(AVDC)离群点检测算法分别对步骤5)中的2M个区间进行疑似离群点检测,并分别记第j个区间的疑似离群点个数为归一化功率曲线疑似离群点集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j;均值距离判别(AVDC)离群点检测算法的详细步骤为:
6-a)设定初始离群点检测区间j=1;
6-b)若第j个区间对应归一化功率曲线数据集中的数据个数Mseg,j小于给定最小阈值δM,则认为第j个区间的疑似离群点个数为0、归一化功率曲线疑似离群点集并跳至步骤6-g)继续执行;反之则继续执行步骤6-c);
6-c)设定疑似离群点在第j个区间归一化功率曲线数据集中的占比并计算第j个区间中疑似离群点个数计算公式定义为
其中函数为向上取整函数;
6-d)计算第j个风速区间归一化功率曲线数据集中各数据点的风速判别距离计算公式如下
其中为第j个风速区间内归一化功率曲线数据集的功率平均值;
6-e)计算第j个功率区间归一化功率曲线数据集中各数据点的功率判别距离计算公式如下
其中为第j个功率区间内归一化功率曲线数据集的风速平均值;
6-f)将第j个区间的判别距离数据集分别由大到小进行排序,并分别选取排序后的判别距离数据集中的前个数据,构成第j个区间的归一化功率曲线疑似离群点集其中l=1,2,3,…,Mseg,j
6-g)设置检测区间j=j+1,并重复进行步骤6-b)至步骤6-f),直到j>M为止。由于篇幅限制,本实施例中有关离群点的相关分析均略去各过程参数的计算过程及结果,相关重要参数取值如下:给定最小阈值δM取10,疑似离群点占比均取0.02。最终基于风速间隔(ws)和功率间隔(ap)的归一化功率曲线疑似离群点检测结果分别如图5、图6中的“×”符号所示,其余正常数据点以“·”符号表示。
7)分别利用局部异常因子(LOF)以及考虑噪声的基于密度的聚类(DBSCAN)这两种离群点检测算法对步骤5)中的2M个区间进行判别离群点检测,并分别记第j个区间的判别离群点个数为归一化功率曲线判别离群点集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j,method={LOF,DBSCAN};本实施例中,有关LOF判别离群点检测的相关重要参数取值如下:给定最小阈值δM取10,LOF判别离群点占比均取0.02,k距离计算中的邻域参数k取10;有关DBSCAN判别离群点检测的相关重要参数取值如下:给定最小阈值δM取10,ε邻域判别半径eps取0.02,核心点判别参数MinPts取10。最终基于风速间隔(ws)和功率间隔(ap)的归一化功率曲线LOF及DBSCAN判别离群点检测结果分别如图7、图8、图9和图10中的“×”符号所示,其余正常数据点均以“·”符号表示。
8)基于真实离群点判别准则,从步骤6)的功率曲线疑似离群点集和步骤7)的功率曲线判别离群点集中获取真实离群点集其中seg={ws,ap},j=1,2,3,…,M,method={LOF,DBSCAN};所述真实离群点判别准则定义为:对于第j个区间的归一化功率曲线数据集中的任一数据点Q,若其属于疑似离群点集并且属于LOF判别离群点集或DBSCAN判别离群点集之一,则点Q为第j个区间的真实离群点。即第j个区间的真实离群点集可表示为
针对本实施例,基于真实离群点判断准则判断出的风速间隔(ws)和功率间隔(ap)下归一化功率曲线真实离群点检测结果分别如图11和图12中的“×”符号所示,其余正常数据点均以“·”符号表示。
9)基于步骤8)中得到的各风速区间真实离群点集以及各功率区间真实离群点集利用最终离群点判断准则获得功率曲线散点数据集{PCi}的最终离群点判别结果集{Outlier},作为最终离群点判别结果;所述最终离群点判断准则定义为:对于功率曲线散点数据集{PCi}中的任一数据点Q′,若其在归一化功率曲线散点数据集{PCnorm,i}中对应的数据点Q是某风速区间的真实离群点或某功率区间的真实离群点,则点Q′为功率曲线散点数据集{PCi}的最终离群点;即功率曲线散点数据集的最终离群点集{Outlier}可表示为
其中j1∈{1,2,3,…,M},j2∈{1,2,3,…,M},为{PCnorm,i}到{PCi}的数据映射函数。
针对本实施例,基于最终离群点判断准则判断出归一化功率曲线真实离群点检测结果,即{Outlier}数据集结果如图13中的“×”符号所示,最终的正常数据点均以“·”符号表示。
至此,面向风电机组功率曲线数据的离群点判别方法检测结果{Outlier}已成功获得。
本发明面向风电机组功率曲线数据的离群点判别方法,主要包括功率曲线异常数据监测、空气密度修正、风速及功率数据区间划分、均值距离判别AVDC疑似离群点检测、局部离群因子LOF及考虑噪声的基于密度的聚类DBSCAN判别离群点检测、真实离群点及最终离群点判别等环节组成。图1为面向风电机组功率曲线数据的离群点判别方法实施与应用的具体流程。整个实施例按照图1中所示的流程,对风电机组功率曲线数据进行分析并最终获取到功率曲线数据中的离群点,图2-图13分别为使用本发明面向风电机组功率曲线数据的离群点判别方法进行最终功率曲线离群点判别的各个环节相关结果。对风电机组功率曲线数据进行离群点判别有助于反映风电机组在正常运行状况下的真实运行性能,从而使得有关功率曲线的拟合与后续分析可以得到更加符合实际、更加精确的结果,从而为后续针对风电机组的性能分析与性能提升方案的制定奠定准确的研究基础。

Claims (9)

1.一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,包括以下步骤:
1)根据待评估风电机组功率曲线获取需求,读取相应需求周期内总计N条待评估风电机组的SCADA系统中测量得到的风电机组运行数据信息,该信息包含风速{vi}、有功功率{Pi}、桨距角{βi}、风电机组运行状态{Condi}、环境气压{Bi}以及环境温度{Ti},将信息数据集记为其中i=1,2,3,…,N;
2)将步骤1)中的信息数据集进行数据预处理操作,剔除机组异常运行状态并修正空气密度的影响,保留余下的N′条运行数据作为预处理后的风电机组正常数据集{Xi},其中i=1,2,3,…,N′;
3)将步骤2)得到的正常数据集{Xi}中的风速信息以及功率信息{Pi}合成为功率曲线散点数据集{PCi},即其中i=1,2,3,…,N′;
4)对步骤3)得到的功率曲线散点数据集{PCi}中的风速信息以及功率信息{Pi}分别进行归一化,得到归一化功率曲线散点数据集{PCnorm,i},其中i=1,2,3,…,N′;
5)分别按照一定的风速间隔(ws)和功率间隔(ap)将步骤4)中的归一化功率曲线散点数据集{PCnorm,i}各划分为M个区间,并分别记第j个区间中的数据个数为Mseg,j、归一化功率曲线散点数据集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j
6)利用均值距离判别(AVDC)离群点检测算法分别对步骤5)中的2M个区间进行疑似离群点检测,并分别记第j个区间的疑似离群点个数为归一化功率曲线疑似离群点集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j
所述均值距离判别(AVDC)离群点检测算法具体为:对于数据个数Mseg,j小于给定最小阈值δM的区间,认为该区间归一化功率曲线疑似离群点集否则对于第j个风速区间或第j个功率区间,首先计算区间内归一化功率曲线数据集中各数据点的判别距离进一步设定疑似离群点的占比并确定第j个区间中疑似离群点个数通过由大到小对判别距离进行排序的方式确定前个数据构成第j个区间的归一化功率曲线疑似离群点集
所述判别距离的计算方式具体如下:
其中分别为第j个风速区间内归一化功率曲线数据集的功率平均值和第j个功率区间内归一化功率曲线数据集的风速平均值,l=1,2,3,…,Mseg,j
7)分别利用局部异常因子(LOF)以及考虑噪声的基于密度的聚类(DBSCAN)这两种离群点检测算法对步骤5)中的2M个区间进行判别离群点检测,并分别记第j个区间的判别离群点个数为归一化功率曲线判别离群点集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j,method={LOF,DBSCAN};
8)基于真实离群点判别准则,从步骤6)的功率曲线疑似离群点集和步骤7)的功率曲线判别离群点集中获取真实离群点集其中seg={ws,ap},j=1,2,3,…,M,method={LOF,DBSCAN};
所述真实离群点判别准则定义为:对于第j个区间的归一化功率曲线数据集中的任一数据点Q,若其属于疑似离群点集并且属于LOF判别离群点集或DBSCAN判别离群点集之一,则点Q为第j个区间的真实离群点;
9)基于步骤8)中得到的各风速区间真实离群点集以及各功率区间真实离群点集利用最终离群点判断准则获得功率曲线散点数据集{PCi}的最终离群点判别结果集{Outlier},作为最终离群点判别结果;
所述最终离群点判断准则定义为:对于功率曲线散点数据集{PCi}中的任一数据点Q′,若其在归一化功率曲线散点数据集{PCnorm,i}中对应的数据点Q是某风速区间的真实离群点或某功率区间的真实离群点,则点Q′为功率曲线散点数据集{PCi}的最终离群点。
2.根据权利要求1所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤2)中,信息数据集进行的数据预处理操作流程如下:
2-a)基于信息数据集记为中的风电机组运行状态{Condi}信息进行异常运行状况检测并剔除异常点,记剔除异常点后的风电机组运行数据集为
2-b)利用步骤2-a)中的风电机组运行数据集为计算得出相应时刻的空气密度集{ρi},并将风电机组运行数据集中的风速{vi}修正替换为参考空气密度ρ0下的修正风速并记新数据集为风电机组正常数据集{Xi}。
3.根据权利要求2所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤2-a)中,利用信息数据集记为中的信息进行异常运行状况检测,具体检测判据如下:
表1风电机组异常运行状况检测判据
其中Condnormal为风电机组正常运行状态,Condls为风电机组低风速正常运行状态,Condhs为风电机组高风速正常运行状态,Prated为风电机组额定有功功率,Pthres为有功功率阈值,βthres为桨距角阈值。
4.根据权利要求2所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤2-b)中,空气密度ρi以及修正风速的计算公式如下:
2-b-a)空气密度ρi
其中R0为干燥空气的比气体常数;Rw为水蒸气的比气体常数;Pw为水蒸气的气压;Bi为环境气压,通过SCADA系统获取,或者通过估计,其中B0为标准海平面大气压强,e为自然常数,g为重力加速度,z为风电机组轮毂处海拔高度,R为空气的比气体常数;为相对环境湿度,通过SCADA系统获取,或者设置
2-b-b)修正风速
其中ρ0为参考空气密度。
5.根据权利要求1所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤4)中,利用最大值最小值标准化方法对数据进行归一化,具体流程如下:
4-a)确定功率曲线散点数据集{PCi}中风速信息以及功率信息{Pi}的最大值与最小值,记风速信息的最大值为vmax,最小值为vmin;功率信息{Pi}的最大值为Pmax,最小值为Pmin
4-b)利用如下公式计算标准化后的风速信息以及标准化后的功率信息{Pnorm,i}:
4-c)将标准化风速信息以及标准化功率信息{Pnorm,i}合成为归一化功率曲线散点数据集{PCnorm,i},即
6.根据权利要求1所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤5)中,归一化功率曲线散点数据集{PCnorm,i}的划分方法具体如下:
5-a)确定归一化功率曲线散点数据集{PCnorm,i}的区间划分个数M;
5-b)以为划分间隔,将数据集{PCnorm,i}按照风速进行均匀划分,则第j个风速区间的归一化功率曲线数据集定义为
其中Mws,j为第j个风速区间归一化功率曲线数据集中的数据个数;
5-c)以为划分间隔,将数据集{PCnorm,i}按照功率进行均匀划分,则第j个功率区间的归一化功率曲线数据集定义为
其中Map,j为第j个功率区间归一化功率曲线数据集中的数据个数。
7.根据权利要求1所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤6)中,利用均值距离判别(AVDC)离群点检测算法进行中各区间内疑似离群点检测,算法具体流程如下:
6-a)设定初始离群点检测区间j=1;
6-b)若第j个区间对应归一化功率曲线数据集中的数据个数Mseg,j小于给定最小阈值δM,则认为第j个区间的疑似离群点个数为0、归一化功率曲线疑似离群点集并跳至步骤6-g)继续执行;反之则继续执行步骤6-c);
6-c)设定疑似离群点在第j个区间归一化功率曲线数据集中的占比并计算第j个区间中疑似离群点个数计算公式定义为
其中函数为向上取整函数;
6-d)计算第j个风速区间归一化功率曲线数据集中各数据点的风速判别距离计算公式如下
其中为第j个风速区间内归一化功率曲线数据集的功率平均值;
6-e)计算第j个功率区间归一化功率曲线数据集中各数据点的功率判别距离计算公式如下
其中为第j个功率区间内归一化功率曲线数据集的风速平均值;
6-f)将第j个区间的判别距离数据集分别由大到小进行排序,并分别选取排序后的判别距离数据集中的前个数据,构成第j个区间的归一化功率曲线疑似离群点集其中l=1,2,3,…,Mseg,j
6-g)设置检测区间j=j+1,并重复进行步骤6-b)至步骤6-f),直至j>M为止。
8.根据权利要求1所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤7)中,利用局部异常因子(LOF)离群点检测算法进行中各区间内LOF判别离群点检测,算法具体流程如下:
7-1a)设定初始离群点检测区间j=1;
7-1b)若第j个区间对应归一化功率曲线数据集中的数据个数Mseg,j小于给定最小阈值δM,则认为第j个区间的LOF判别离群点个数为0、归一化功率曲线LOF判别离群点集并跳至步骤7-1j)继续执行;反之则继续执行步骤7-1c);
7-1c)设定LOF判别离群点在第j个区间归一化功率曲线数据集中的占比并计算第j个区间中判别离群点个数计算公式如下
其中函数为向上取整函数,同时设定第j个区间归一化功率曲线数据集中各数据点的邻域参数k;
7-1d)计算第j个区间归一化功率曲线数据集中各数据点之间的欧式距离d(P,Q),计算公式如下
其中满足P≠Q且
7-1e)基于步骤7-1d)中的距离数据确定第j个区间归一化功率曲线数据集中各数据点的k距离distk(P)以及k邻域确定方法如下
distk(P)=d(P,P′)
其中P′满足如下条件:
(i)存在至多k-1个点满足d(P,Q)<d(P,P′);
(ii)存在至少k个点满足d(P,Q)≤d(P,P′);
7-1f)计算第j个区间归一化功率曲线数据集中各数据点与其k邻域内各数据点之间的可达距离rdistk(P,Q),计算公式如下
rdistk(P,Q)=max{distk(Q),d(P,Q)}
其中
7-1g)计算第j个区间归一化功率曲线数据集中各数据点的局部可达密度lrdk(P),计算公式如下
其中表示数据点的k邻域中除P以外的其他数据点个数;
7-1h)计算第j个区间归一化功率曲线数据集中各数据点的局部离群因子lofk(P),计算公式如下
7-1i)将第j个区间归一化功率曲线数据集中各数据点的局部离群因子lofk(P)由大到小进行排序,并分别选取其中前个数据,构成第j个区间的归一化功率曲线LOF判别离群点集
7-1j)设置检测区间j=j+1,并重复进行步骤7-1b)至步骤7-1i),直到j>M为止。
9.根据权利要求1所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤7)中,利用考虑噪声的基于密度的聚类(DBSCAN)离群点检测算法进行中各区间内DBSCAN判别离群点检测,算法具体流程如下:
7-2a)设定初始离群点检测区间j=1;
7-2b)若第j个区间对应归一化功率曲线数据集中的数据个数Mseg,j小于给定最小阈值δM,则认为第j个区间的DBSCAN判别离群点个数为0、归一化功率曲线DBSCAN判别离群点集并跳至步骤7-2m)继续执行,反之则继续执行步骤7-2c);
7-2c)计算第j个区间归一化功率曲线数据集中各数据点之间的欧式距离d(P,Q),计算公式如下
其中满足并设定第j个区间归一化功率曲线数据集中的ε邻域判别半径eps以及核心点判别参数MinPts;
7-2d)确定第j个区间归一化功率曲线数据集中各数据点的ε邻域确定公式如下
其中满足
7-2e)将第j个区间归一化功率曲线数据集中的所有数据点标记为“未处理”状态,并设定初始簇编号C=0;
7-2f)设定初始分析点l=1;
7-2g)若第j个区间归一化功率曲线数据集中的第l个数据点已经被标记为“已处理”状态,则跳转至步骤7-2k)继续执行,反之则继续执行7-2h);
7-2h)标记第l个数据点为“已处理”状态,并判断数据点Pl的初始类型,判断方法如下:
则标记数据点Pl为“核心点”,并继续执行步骤7-2i);
则标记数据点Pl为“噪声点”,并跳转至步骤7-2k)继续执行;
7-2i)设置簇编号C=C+1,将数据点Pl添加至簇C中,并设置数据点Pl的初始密度可达数据集
7-2j)对数据点Pl的初始密度可达数据集中的所有数据点Q按照步骤7-2j-a)至7-2j-c)流程进行处理,直到所有数据点均处于“已处理”状态为止:
7-2j-a)若Q已被标记为“噪声点”,则重新将Q标记为“边界点”,并将数据点Q添加至簇C中;
7-2j-b)若Q已处于“已处理”状态,则跳过步骤7-2j-c)直接对其他数据点进行处理;
7-2j-c)若Q仍处于“未处理”状态,则首先标记Q为“已处理”状态,并将Q添加至簇C中,进一步判断数据点Q的ε邻域中的数据个数与MinPts的关系,若 则标记数据点Q为“核心点”,并将中的所有数据点插入至密度可达数据集中,反之不进行操作;
7-2k)设置分析数据点l=2+1,并重复进行步骤7-2g)至步骤7-2j),直到l>Mseg,j为止;
7-21)提取第j个区间归一化功率曲线数据集中被标记为“噪声点”的数据点,构成第j个区间归一化功率曲线DBSCAN判别离群点集为并记集合中离群点元素个数为
7-2m)设置检测区间j=j+1,并重复进行步骤7-2b)至步骤7-21),直到j>M为止。
CN201811374105.8A 2018-11-18 2018-11-18 一种面向风电机组功率曲线数据的离群点判别方法 Active CN109740175B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811374105.8A CN109740175B (zh) 2018-11-18 2018-11-18 一种面向风电机组功率曲线数据的离群点判别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811374105.8A CN109740175B (zh) 2018-11-18 2018-11-18 一种面向风电机组功率曲线数据的离群点判别方法

Publications (2)

Publication Number Publication Date
CN109740175A true CN109740175A (zh) 2019-05-10
CN109740175B CN109740175B (zh) 2020-12-08

Family

ID=66355676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811374105.8A Active CN109740175B (zh) 2018-11-18 2018-11-18 一种面向风电机组功率曲线数据的离群点判别方法

Country Status (1)

Country Link
CN (1) CN109740175B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188094A (zh) * 2019-05-29 2019-08-30 国网山东省电力公司电力科学研究院 一种基于lof算法的主变油色谱数据清洗方法
CN110334310A (zh) * 2019-07-01 2019-10-15 北京源清慧虹信息科技有限公司 一种风机功率曲线的确定方法及确定装置
CN110489852A (zh) * 2019-08-14 2019-11-22 北京天泽智云科技有限公司 提高风电系统数据质量的方法及装置
CN110532119A (zh) * 2019-07-26 2019-12-03 中国船舶重工集团公司第七一九研究所 动力系统运行异常点检测方法
CN110533314A (zh) * 2019-08-23 2019-12-03 西安交通大学 一种基于概率密度分布的风电场异常机组识别方法
CN110925134A (zh) * 2019-12-03 2020-03-27 上海明华电力科技有限公司 一种风电机组的输出功率给定值实时修正系统及方法
CN111260503A (zh) * 2020-01-13 2020-06-09 浙江大学 一种基于聚类中心优化的风电机组功率曲线离群点检测方法
CN111275570A (zh) * 2020-01-13 2020-06-12 浙江大学 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法
CN111563543A (zh) * 2020-04-26 2020-08-21 国网冀北电力有限公司电力科学研究院 一种风电机组的风速-发电功率数据的清洗方法及装置
CN111666458A (zh) * 2020-06-22 2020-09-15 中国船级社质量认证公司 风电机组功率曲线的拟合方法
CN111814848A (zh) * 2020-06-22 2020-10-23 浙江大学 一种风电机组温度故障的自适应预警策略设计方法
CN111814849A (zh) * 2020-06-22 2020-10-23 浙江大学 一种基于da-rnn的风电机组关键组件故障预警方法
CN111881617A (zh) * 2020-07-02 2020-11-03 上海电气风电集团股份有限公司 数据处理方法、风力发电机组的性能评估方法及系统
CN112598539A (zh) * 2020-12-28 2021-04-02 江苏徐工信息技术股份有限公司 一种风力发电机组风功率曲线优化计算及异常值检测方法
CN112800103A (zh) * 2020-12-09 2021-05-14 华能陕西发电有限公司 一种scada数据挖掘的风电机组功率曲线的获取系统及方法
CN113515512A (zh) * 2021-06-22 2021-10-19 国网辽宁省电力有限公司鞍山供电公司 一种工业互联网平台数据的质量治理及提升方法
CN114295928A (zh) * 2022-03-09 2022-04-08 广州市保伦电子有限公司 一种校园电器故障检测方法、后台服务器及系统
CN114358176A (zh) * 2021-12-30 2022-04-15 河南省气象服务中心(河南省气象影视和宣传中心) 一种基于lof算法的风电站原始风电数据质量控制的方法
CN114579827A (zh) * 2022-05-06 2022-06-03 昆仑智汇数据科技(北京)有限公司 一种工业设备数据性能曲线的处理方法、装置及设备
CN115600119A (zh) * 2022-12-13 2023-01-13 青岛左岸数据科技有限公司(Cn) 适用于风力发电的数据处理方法及系统
CN116992389A (zh) * 2023-09-26 2023-11-03 河北登浦信息技术有限公司 一种物联网虚假数据检测方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630885A (zh) * 2015-12-18 2016-06-01 国网福建省电力有限公司泉州供电公司 一种用电异常检测方法及系统
CN105654735A (zh) * 2016-03-24 2016-06-08 安徽四创电子股份有限公司 基于离群点分析算法的套牌车快速甄别方法
CN106295683A (zh) * 2016-08-01 2017-01-04 上海理工大学 一种基于尖锐度的时间序列数据的离群点检测方法
US20170186094A1 (en) * 2013-03-15 2017-06-29 State Farm Mutual Automobile Insurance Company Assessing Property Damage using a 3D Point Cloud of a Scanned Property
CN107545273A (zh) * 2017-07-06 2018-01-05 北京航空航天大学 一种基于密度的局部离群点检测方法
CN107679215A (zh) * 2017-10-19 2018-02-09 西安交通大学 一种基于质心的离群点检测方法
CN107808209A (zh) * 2017-09-11 2018-03-16 重庆大学 基于加权kNN距离的风电场异常数据辨识方法
CN108171400A (zh) * 2017-12-06 2018-06-15 浙江大学 一种基于异常点及离群点检测的风机功率曲线数据预处理方法
CN108564485A (zh) * 2018-04-16 2018-09-21 国网河南省电力公司电力科学研究院 基于电压曲线相似性分析的低压台区用户相位识别方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170186094A1 (en) * 2013-03-15 2017-06-29 State Farm Mutual Automobile Insurance Company Assessing Property Damage using a 3D Point Cloud of a Scanned Property
CN105630885A (zh) * 2015-12-18 2016-06-01 国网福建省电力有限公司泉州供电公司 一种用电异常检测方法及系统
CN105654735A (zh) * 2016-03-24 2016-06-08 安徽四创电子股份有限公司 基于离群点分析算法的套牌车快速甄别方法
CN106295683A (zh) * 2016-08-01 2017-01-04 上海理工大学 一种基于尖锐度的时间序列数据的离群点检测方法
CN107545273A (zh) * 2017-07-06 2018-01-05 北京航空航天大学 一种基于密度的局部离群点检测方法
CN107808209A (zh) * 2017-09-11 2018-03-16 重庆大学 基于加权kNN距离的风电场异常数据辨识方法
CN107679215A (zh) * 2017-10-19 2018-02-09 西安交通大学 一种基于质心的离群点检测方法
CN108171400A (zh) * 2017-12-06 2018-06-15 浙江大学 一种基于异常点及离群点检测的风机功率曲线数据预处理方法
CN108564485A (zh) * 2018-04-16 2018-09-21 国网河南省电力公司电力科学研究院 基于电压曲线相似性分析的低压台区用户相位识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
石鸿雁 等: "改进的 DBSCAN 聚类和 LAOF 两阶段混合数据离群点检测方法", 《小型微型计算机系统》 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188094A (zh) * 2019-05-29 2019-08-30 国网山东省电力公司电力科学研究院 一种基于lof算法的主变油色谱数据清洗方法
CN110334310B (zh) * 2019-07-01 2023-04-07 北京源清慧虹信息科技有限公司 一种风机功率曲线的确定方法及确定装置
CN110334310A (zh) * 2019-07-01 2019-10-15 北京源清慧虹信息科技有限公司 一种风机功率曲线的确定方法及确定装置
CN110532119A (zh) * 2019-07-26 2019-12-03 中国船舶重工集团公司第七一九研究所 动力系统运行异常点检测方法
CN110489852A (zh) * 2019-08-14 2019-11-22 北京天泽智云科技有限公司 提高风电系统数据质量的方法及装置
CN110533314A (zh) * 2019-08-23 2019-12-03 西安交通大学 一种基于概率密度分布的风电场异常机组识别方法
CN110925134A (zh) * 2019-12-03 2020-03-27 上海明华电力科技有限公司 一种风电机组的输出功率给定值实时修正系统及方法
CN110925134B (zh) * 2019-12-03 2021-06-18 上海明华电力科技有限公司 一种风电机组的输出功率给定值实时修正系统及方法
CN111260503A (zh) * 2020-01-13 2020-06-09 浙江大学 一种基于聚类中心优化的风电机组功率曲线离群点检测方法
CN111275570A (zh) * 2020-01-13 2020-06-12 浙江大学 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法
CN111260503B (zh) * 2020-01-13 2023-10-27 浙江大学 一种基于聚类中心优化的风电机组功率曲线离群点检测方法
CN111563543A (zh) * 2020-04-26 2020-08-21 国网冀北电力有限公司电力科学研究院 一种风电机组的风速-发电功率数据的清洗方法及装置
CN111563543B (zh) * 2020-04-26 2023-07-04 国网冀北电力有限公司电力科学研究院 一种风电机组的风速-发电功率数据的清洗方法及装置
CN111814849A (zh) * 2020-06-22 2020-10-23 浙江大学 一种基于da-rnn的风电机组关键组件故障预警方法
CN111814848A (zh) * 2020-06-22 2020-10-23 浙江大学 一种风电机组温度故障的自适应预警策略设计方法
CN111666458A (zh) * 2020-06-22 2020-09-15 中国船级社质量认证公司 风电机组功率曲线的拟合方法
CN111814849B (zh) * 2020-06-22 2024-02-06 浙江大学 一种基于da-rnn的风电机组关键组件故障预警方法
CN111814848B (zh) * 2020-06-22 2024-04-09 浙江大学 一种风电机组温度故障的自适应预警策略设计方法
CN111881617A (zh) * 2020-07-02 2020-11-03 上海电气风电集团股份有限公司 数据处理方法、风力发电机组的性能评估方法及系统
CN111881617B (zh) * 2020-07-02 2024-03-26 上海电气风电集团股份有限公司 数据处理方法、风力发电机组的性能评估方法及系统
CN112800103A (zh) * 2020-12-09 2021-05-14 华能陕西发电有限公司 一种scada数据挖掘的风电机组功率曲线的获取系统及方法
CN112800103B (zh) * 2020-12-09 2023-03-03 华能陕西发电有限公司 一种scada数据挖掘的风电机组功率曲线的获取系统及方法
CN112598539B (zh) * 2020-12-28 2024-01-30 徐工汉云技术股份有限公司 一种风力发电机组风功率曲线优化计算及异常值检测方法
CN112598539A (zh) * 2020-12-28 2021-04-02 江苏徐工信息技术股份有限公司 一种风力发电机组风功率曲线优化计算及异常值检测方法
CN113515512A (zh) * 2021-06-22 2021-10-19 国网辽宁省电力有限公司鞍山供电公司 一种工业互联网平台数据的质量治理及提升方法
CN114358176A (zh) * 2021-12-30 2022-04-15 河南省气象服务中心(河南省气象影视和宣传中心) 一种基于lof算法的风电站原始风电数据质量控制的方法
CN114295928A (zh) * 2022-03-09 2022-04-08 广州市保伦电子有限公司 一种校园电器故障检测方法、后台服务器及系统
CN114579827B (zh) * 2022-05-06 2022-08-05 昆仑智汇数据科技(北京)有限公司 一种工业设备数据性能曲线的处理方法、装置及设备
CN114579827A (zh) * 2022-05-06 2022-06-03 昆仑智汇数据科技(北京)有限公司 一种工业设备数据性能曲线的处理方法、装置及设备
CN115600119B (zh) * 2022-12-13 2023-06-16 青岛左岸数据科技有限公司 适用于风力发电的数据处理方法及系统
CN115600119A (zh) * 2022-12-13 2023-01-13 青岛左岸数据科技有限公司(Cn) 适用于风力发电的数据处理方法及系统
CN116992389A (zh) * 2023-09-26 2023-11-03 河北登浦信息技术有限公司 一种物联网虚假数据检测方法及系统
CN116992389B (zh) * 2023-09-26 2023-12-29 河北登浦信息技术有限公司 一种物联网虚假数据检测方法及系统

Also Published As

Publication number Publication date
CN109740175B (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
CN109740175A (zh) 一种面向风电机组功率曲线数据的离群点判别方法
CN108171400A (zh) 一种基于异常点及离群点检测的风机功率曲线数据预处理方法
CN107766990B (zh) 一种光伏电站发电功率的预测方法
US20210262439A1 (en) Method of identification and compensation of inherent deviation of yaw error of wind turbine based on true power curve
CN102364408B (zh) 用于识别和评价遮蔽的方法
CN109667727A (zh) 一种基于功率曲线分析的风电机组偏航误差固有偏差辨识及补偿方法
CN110362045B (zh) 一种考虑海洋气象因素的海上双馈风电机组故障判别方法
CN107944175B (zh) 一种考虑风湍流强度的风机真实功率曲线获取方法
CN104299044A (zh) 基于聚类分析的风功率短期预测系统及预测方法
CN106529741B (zh) 一种基于空间相关特征的超短期风电功率预测方法
CN103955521B (zh) 一种风电场机群划分方法
CN107730399B (zh) 基于风力发电特性曲线的理论线损评估方法
CN111260503A (zh) 一种基于聚类中心优化的风电机组功率曲线离群点检测方法
CN109146192A (zh) 一种考虑风电机组运行工况的风电功率预测方法
CN110991701A (zh) 一种基于数据融合的风电场风机风速预测方法及系统
CN114595762A (zh) 一种光伏电站异常数据序列提取方法
CN110022130A (zh) 一种光伏阵列故障检测设备和方法
CN116800172B (zh) 一种光电转换方法及储能系统
CN113610285A (zh) 一种分散式风电的功率预测方法
CN109101659A (zh) 一种小水电数据采集系统中功率数据异常的方法
CN117332288A (zh) 一种建筑节能技术评估系统及方法
CN110400019A (zh) 一种基于数据挖掘的风电场功率预测优化方法
CN114912807A (zh) 一种风电机组技改后发电量提升效果评估方法和评估系统
CN114169681B (zh) 一种考虑时空离群点检测的风电机组功率曲线数据预处理方法
CN110163437A (zh) 基于DPK-means的日前光伏发电功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant