CN107808209B - 基于加权kNN距离的风电场异常数据辨识方法 - Google Patents

基于加权kNN距离的风电场异常数据辨识方法 Download PDF

Info

Publication number
CN107808209B
CN107808209B CN201710809929.2A CN201710809929A CN107808209B CN 107808209 B CN107808209 B CN 107808209B CN 201710809929 A CN201710809929 A CN 201710809929A CN 107808209 B CN107808209 B CN 107808209B
Authority
CN
China
Prior art keywords
data
value
parameter
power plant
wind power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710809929.2A
Other languages
English (en)
Other versions
CN107808209A (zh
Inventor
胡博
李昌林
汪硕承
谢开贵
朱小军
刘育明
孔得壮
王蕾报
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd
State Grid Corp of China SGCC
Original Assignee
Chongqing University
Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd
State Grid Corp of China SGCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University, Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd, State Grid Corp of China SGCC filed Critical Chongqing University
Priority to CN201710809929.2A priority Critical patent/CN107808209B/zh
Publication of CN107808209A publication Critical patent/CN107808209A/zh
Application granted granted Critical
Publication of CN107808209B publication Critical patent/CN107808209B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Wind Motors (AREA)

Abstract

本发明涉及一种基于加权kNN距离的风电场异常数据辨识方法,其特征在于按以下步骤进行:步骤1、步骤2、步骤3、步骤4、步骤5。本发明提出了一种基于灵敏度分析的模型参数最优确定方法,该方法不需要预先利用正常数据样本进行训练,可以对处于正常值范围内的异常数据进行辨识,从而提高风电场输出功率的预测精确度,缩短预测时间,实现风电场输出功率的可靠控制。

Description

基于加权kNN距离的风电场异常数据辨识方法
技术领域
本发明涉及新能源发电技术领域,具体涉及一种基于加权kNN距离的风电场异常数据辨识方法。
背景技术
随着风电并网量的增加,风电的间歇性和不确定性给电网的运营带来了挑战,要提高风电渗透率和减少风电弃风率,最直接的方法就是提高风电的预测精确度。
由于风电场地形和风资源的复杂性,很难利用物理方法对风电场功率预测进行精确建模,所以,基于风电场历史运行数据的数据驱动型方法得到了广泛使用;而风电场历史运行数据的有效性和准确性将会影响功率预测结果,因此,对风电场历史运行数据进行异常数据辨识将变得尤为重要。
目前对风电场异常数据辨识的研究方法主要分两类,第一类是越限判断方法,通过判断风速和功率值的是否超过正常范围值,这类方法比较依赖于人工经验,不能对处于正常值范围内的异常数据进行辨识;第二类是人工智能算法,此类方法可克服越限判断方法依赖人工经验的不足,但该类方法的辨识精度依赖于大量正确数据,实际情况下通常很难得到大量正确分类的数据样本。
发明内容
针对现有技术的不足,本发明提出了一种用加权kNN距离定义每个数据点的离群程度,再通过数据点的离群程度对数据中的异常数据进行辨识的方法,从而提高风电场输出功率的预测精确度。
本发明的技术方案为:
一种基于加权kNN距离的风电场异常数据辨识方法,其关键在于按以下步骤进行:
步骤1:对风电场历史运行数据进行丢失数据与停运数据辨识,删除丢失数据与停运数据,得到数据集W_S;
步骤2:计算步骤1中数据集W_S的分布标准差;
步骤3:建立带未知参数k、离群点数量参数n的基于加权kNN的离群点辨识模型;
步骤4:采用基于灵敏度分析的参数确定方法,计算基于加权kNN的离群点辨识模型的未知参数k、n,得到基于加权kNN的离群点辨识模型;
步骤5:对风电场历史运行数据进行异常数据辨识并从剔除,得到风电场历史正常运行数据,并将该风电场历史正常运行数据输入到风电场功率预估系统,对下一时段风电场功率进行预估,实现输出功率平稳控制。
上述方案中,kNN距离算法为:邻近距离算法。
所述步骤1中对风电场历史运行数据进行丢失数据与停运数据的辨识方法按如下步骤进行:
步骤1.1:输入风电场历史运行数据集W[(v1,p1),(v2,p2),…,(vm,pm)],其中vi和pi(i=1,2,…,m)表示第i时刻的风速与风电功率值;
步骤1.2:遍历数据集中的点,通过判别风速和功率是否为数值的方法对丢失数据进行过滤,判断数据点功率值是否为无效值,如果是,则删除该数据;
步骤1.3:遍历数据集中的点,判断数据点风速在切入和切出风速间的功率值是否为0,如果是,则删除该数据;
停运数据辨识后的风电场数据集为W_S。
所述步骤2中数据分布标准差的计算方法如下:
步骤2.1:将风电场W_S数据按照风速大小,由大到小排序,把风速[0,vmax]以0.1m/s为间隔划分成Z(Z=vmax×10)个区间,即:{[0,0.1],(0.1,0.2]…(vmax-0.1,vmax]};
步骤2.2:对每个区间中点的风电功率值求取标准差,公式如下:
Figure GDA0003179863370000031
其中,N为第i个风速区间内点的数量,pj为风速区间内点的功率值,
Figure GDA0003179863370000032
为区间内所有点的功率的平均值,σi为当前第i区间的标准差;
步骤2.3:重复Z次步骤2.2,得到每个区间数据的离散程度,最后将所有部分的标准差进行求和,便得到风电场v-p数据的分布标准差,公式如下:
Figure GDA0003179863370000041
其中Z为划分的区间数,σtotal为求得的分布标准差。
所述步骤4中确定辨识模型中k、n的取值方法按如下步骤:
步骤4.1:在同一数据集和离群点数量参数n的情况下,改变参数k的取值,观察分布标准差,即观察辨识效果的变化情况,从而确定参数k的取值;
步骤4.2:确定参数k值后,得到过滤数据百分比与分布标准差的关系图,图中分布标准差随着过滤数据百分比的增加先快速下降后缓慢下降,找出下降趋势的拐点,确定出离群点数量参数n的值;
步骤4.3:验证参数模型的正确性;取所述拐点对应的过滤数据百分比值,作出分布标准差与参数k值的关系图,观察图中分布标准差稳定的区间的k值,对比步骤3.1中所取的k值是否在该区间内,在该区间内则说明该参数模型正确。
所述步骤5中辨识模型的辨识方法步骤如下:
步骤5.1:输入经丢失数据与停运数据辨识后的数据集W_S,最邻近点数量参数kmax和离群点数量参数n;
步骤5.2:对风电场数据W_S采用离差标准化处理,消除数据中功率和风速的量纲,消除数据中数值范围存在的差异;
步骤5.3:计算数据集W_S中每个点的权值;
步骤5.4:计算数据集W_S中每个点的加权kNN距离;
步骤5.5:对数据集W_S中的点按照加权kNN距离值由到小进行排序,加权kNN距离最大的X个点为筛选出的离群点。
所述步骤5.2中风速数据离差标准化处理的公式为:
Figure GDA0003179863370000051
其中,vi为风速数据集合V中的值,vmin为风速数据集合V中的最小值,vmax为V中的最大值,vi′为离差标准化处理后的数据值,vi′值的取值范围在[0,1]之间;
所述功率数据离差标准化处理公式如下:
Figure GDA0003179863370000052
其中,pi为功率数据集合P中的值,pmin为风速数据集合P中的最小值,pmax为P中的最大值,pi′为离差标准化处理后的数据值,pi′值的取值范围在[0,1]之间。
所述步骤5.3中权值的计算方法如下:
在数据集{(v1,p1),(v2,p2),...,(vm,pm)}中,对于数据点(vi,pi),i∈m,权重值Dik为数据点(vi,pi)到其第k个最邻近点的距离;
权重值Dik的计算公式如下:
Figure GDA0003179863370000053
其中(vk,pk)表示离(vi,pi)第k个最邻近的点。
所述步骤5.4中加权kNN距离的计算方法如下:
在数据集{(v1,p1),(v2,p2),...,(vm,pm)}中,对于数据点(vi,pi),i∈m,其加权kNN距离
Figure GDA0003179863370000054
为:
Figure GDA0003179863370000061
其中,j∈k,j表示到点(vi,pi)距离最近的k个点,k为最邻近点的个数,Dj,k为点(vj,pj)的权重值。
有益效果:本发明提出了一种基于灵敏度分析的模型参数最优确定方法,该方法不需要预先利用正常数据样本进行训练,可以对处于正常值范围内的异常数据进行辨识,从而提高风电场输出功率的预测精确度,缩短预测时间,实现风电场输出功率的可靠控制。
附图说明
图1为本发明实施例使用的风电场历史运行数据的v-p散点图;
图2为不同辨识比例下分布标准差与模型参数k的取值关系图;
图3为过滤数据百分比与分布标准差的关系图;
图4为Pct=4.2%时分布标准差与模型中参数k的取值关系图;
图5为模型辨识后的风电场数据散点图。
具体实施方式
下面结合附图及实施例对本发明作进一步描述:
一种基于加权kNN距离的风电场异常数据辨识方法,其关键在于按以下步骤进行:
步骤1:如图1所示,对风电场历史运行数据进行丢失数据与停运数据辨识;本实施例中,使用某风电场2014.01.01至2014.12.31间每小时运行数据,共8760组数据作为风电场历史运行数据读入。数据集为W[(v1,p1),(v2,p2),…,(v8760,p8760)],其中vi和pi(i=1,2,…,8760)表示第i时刻的风速与风电功率值;共辨识得到的异常数据131个,辨识后的数据集为W_S。
步骤2:利用公式计算风电场W_S数据分布标准差;
步骤2.1:将风电场W_S数据按照风速大小,由大到小排序,把风速[0,vmax]以0.1m/s为间隔划分成Z(Z=vmax×10)个区间,即:{[0,0.1],(0.1,0.2]…(vmax-0.1,vmax]};
步骤2.2:对每个区间中点的风电功率值求取标准差,公式如下:
Figure GDA0003179863370000071
其中,N为第i个风速区间内点的数量,pj为风速区间内点的功率值,
Figure GDA0003179863370000072
为区间内所有点的功率的平均值,σi为当前第i区间的标准差;
步骤2.3:重复Z次步骤2.2,得到每个区间数据的离散程度,最后将所有部分的标准差进行求和,便得到风电场v-p数据的分布标准差,公式如下:
Figure GDA0003179863370000073
其中Z为划分的区间数,σtotal为求得的分布标准差。
步骤3:建立带未知参数k、离群点数量参数n的基于加权kNN的离群点辨识模型;
步骤4:采用基于灵敏度分析的参数确定方法,计算基于加权kNN的离群点辨识模型的未知参数k、n,得到基于加权kNN的离群点辨识模型;
步骤4.1:辨识模型中参数k的确定;本实施例中,为了参数设置的方便,这里使用辨识比例Pct来代替离群点数量参数n,离群比例Pct为离群点数量参数n与总数据数量的比值。在不知道原始数据离群点数量的情况下,本实例对Pct取3%-30%之间的四组值进行统计分析;
从图2可以看出,随着参数k取值的增大,四组值的分布标准差均表现出先随k取值的增大而逐渐减小、最终趋向于稳定的趋势,这表明当参数k增大到一定值后,对模型辨识结果影响将变得很小;此时分析图2可得到,在过滤数据百分比为3%、5%、10%和30%时,k取值大于等于9时,分布标准差便趋于稳定,本实例使用的风电场数据,模型参数k取值15。
步骤4.2:辨识模型中离群点数量参数n的确定;
当模型参数k值取15时,得到过滤数据百分比与分布标准差的关系图,如附图3;从图3中可以看出,分布标准差随着过滤数据百分比的增加先快速下降后缓慢下降;分布标准差快速下降的过程,正是整个风速-功率数据中的异常数据被过滤的过程,缓慢下降表明异常数据被过滤掉后,开始过滤到了正常数据;因此,分布标准差开始缓慢下降就表明异常数据基本被辨识过滤掉,只需找到下降趋势的拐点就能确定离群点数量参数n的值。从图3可以看出,拐点对应的过滤数据百分比Pct=4.2%,也就是离群点数量参数n=368。
步骤4.3:为了验证参数k取值的正确性,取过滤数据百分比Pct=4.2%,得到分布标准差与k取值的关系图,如附图4;从图4中可以看出,在Pct=4.2%的条件下,当k取值大于等于10时,便对辨识结果基本没有影响了,而本实例在确定过滤数量参数时k的取值为15,此时取得的最优离群点数量参数n和参数k的值是正确有效的。
步骤5:输入经丢失数据与停运数据辨识后的数据集W_S,同时输入最邻近点数量参数kmax=15和离群点数量参数n=368,对数据集W_S进行离差标准化处理,建立基于加权kNN的离群点辨识模型,再计算数据集W_S中每个点的加权kNN距离,对数据及W_S中的点按照加权kNN距离值由大到小进行排序,加权kNN距离最大的X个点为筛选出的离群点,此时X的值为图5中异常数据“×”的数量,从图5可以看出,即原始数据中的异常数据得到了辨识。
参照风电功率预测模型,分别使用辨识前后的风电场历史运行数据对风电功率进行预测,两种数据的风电功率预测均方根误差如下表:
Figure GDA0003179863370000091
可以看出使用进行过异常数据过滤的数据进行风电功率预测的均方根误差比使用原始数据预测的均方根误差要小。

Claims (6)

1.一种基于加权kNN距离的风电场异常数据辨识方法,其特征在于按以下步骤进行:
步骤1:对风电场历史运行数据进行丢失数据与停运数据辨识,删除丢失数据与停运数据,得到数据集W_S;
步骤2:计算步骤1中数据集W_S的分布标准差;
步骤3:建立带未知参数k、离群点数量参数n的基于加权kNN的离群点辨识模型;
步骤4:采用基于灵敏度分析的参数确定方法,计算基于加权kNN的离群点辨识模型的未知参数k、n,得到基于加权kNN的离群点辨识模型;
步骤5:对风电场历史运行数据进行异常数据辨识并从剔除,得到风电场历史正常运行数据,并将该风电场历史正常运行数据输入到风电场功率预估系统,对下一时段风电场功率进行预估,实现输出功率平稳控制;
所述步骤4中确定辨识模型中未知参数k、离群点数量参数n的取值方法按如下步骤:
步骤4.1:在同一数据集和离群点数量参数n的情况下,设置多组离群点数量参数取值,分别观察参数k对辨识效果的影响,当多组分布标准差的变化都平缓时,即可确定参数k的值;
步骤4.2:确定参数k值后,得到过滤数据百分比与分布标准差的关系图,图中分布标准差随着过滤数据百分比的增加先快速下降后缓慢下降,找出下降趋势的拐点,取该拐点对应过滤数据百分比值,再将原始数据的总数乘以该过滤数据百分比,得到离群点数量参数n的值;
步骤4.3:验证参数模型的正确性;取所述拐点对应的过滤数据百分比值,作出分布标准差与参数k值的关系图,观察图中分布标准差稳定的区间的L值,对比步骤3.1中所取的k值是否在该区间内,在该区间内则说明该参数模型正确;
所述步骤5中辨识模型的辨识方法步骤如下:
步骤5.1:输入经丢失数据与停运数据辨识后的数据集W_S,最邻近点数量参数kmax和离群点数量参数n;
步骤5.2:对风电场数据W_S采用离差标准化处理,消除数据中功率和风速的量纲,消除数据中数值范围存在的差异;
步骤5.3:计算数据集W_S中每个点的权值;
步骤5.4:根据步骤5.3中计算出的每个点的权值,计算数据集W_S中每个点的加权kNN距离;
步骤5.5:对数据集W_S中的点按照加权kNN距离值由大到小进行排序,加权kNN距离最大的X个点为筛选出的离群点。
2.根据权利要求1所述的基于加权kNN距离的风电场异常数据辨识方法,其特征在于:所述步骤1中对风电场历史运行数据进行丢失数据与停运数据的辨识步骤如下:
步骤1.1:输入风电场历史运行数据集W[(v1,p1),(v2,p2),…,(vm,pm)],其中vi和pi(i=1,2,…,m)表示第i时刻的风速与风电功率值;
步骤1.2:遍历数据集中的点,通过判别风速和功率是否为数值的方法对丢失数据进行过滤,判断数据点功率值是否为无效值,如果是,则删除该数据;
步骤1.3:遍历数据集中的点,判断数据点风速在切入和切出风速间的功率值是否为0,如果是,则删除该数据;
停运数据辨识后的风电场数据集为W_S。
3.根据权利要求1所述的基于加权kNN距离的风电场异常数据辨识方法,其特征在于:所述步骤2中分布标准差的计算方法如下:
步骤2.1:将风电场数据集W_S中的数据按照风速大小,由大到小排序,把风速[0,vmax]以0.1m/s为间隔划分成Z(Z=vmax×10)个区间,即:{[0,0.1],(0.1,0.2]…(vmax-0.1,vmax]};
步骤2.2:对每个区间中数据点的风电功率值求取标准差,公式如下:
Figure FDA0003179863360000031
其中,N为第i个风速区间内数据点的数量,pj为风速区间内数据点的功率值,
Figure FDA0003179863360000032
为区间内所有点的功率平均值,σi为当前第i区间的标准差;
步骤2.3:重复Z次步骤2.2,得到每个区间数据的离散程度,最后将所有区间的标准差进行求和,便得到风电场v-p数据的分布标准差,公式如下:
Figure FDA0003179863360000041
其中Z为划分的区间数,σtotal为求得的分布标准差。
4.根据权利要求1所述的基于加权kNN距离的风电场异常数据辨识方法,其特征在于:所述步骤5.2中风速数据离差标准化处理的公式为:
Figure FDA0003179863360000042
其中,vi为风速数据集合V中的值,vmin为风速数据集合V中的最小值,vmax为V中的最大值,v′i为离差标准化处理后的数据值,v′i值的取值范围在[0,1]之间;
所述功率数据离差标准化处理公式如下:
Figure FDA0003179863360000043
其中,pi为功率数据集合P中的值,pmin为风速数据集合P中的最小值,pmax为P中的最大值,p′i为离差标准化处理后的数据值,p′i值的取值范围在[0,1]之间。
5.根据权利要求1所述的基于加权kNN距离的风电场异常数据辨识方法,其特征在于:所述步骤5.3中权值的计算方法如下:
在数据集{(v1,p1),(v2,p2),...,(vm,pm)}中,对于数据点(vi,pi),i∈m,权重值Dik为数据点(vi,pi)到其第k个最邻近点的距离;
权重值Dik的计算公式如下:
Figure FDA0003179863360000051
其中(vk,pk)表示离(vi,pi)第k个最邻近的点。
6.根据权利要求1所述的基于加权kNN距离的风电场异常数据辨识方法,其特征在于:所述步骤5.4中加权kNN距离的计算方法如下:
在数据集{(v1,p1),(v2,p2),...,(vm,pm)}中,对于数据点(vi,pi),i∈m,其加权kNN距离
Figure FDA0003179863360000052
为:
Figure FDA0003179863360000053
其中,j∈k,j表示到点(vi,pi)距离最近的k个点,k为最邻近点的个数,Dj,k为点(vj,pj)的权重值。
CN201710809929.2A 2017-09-11 2017-09-11 基于加权kNN距离的风电场异常数据辨识方法 Active CN107808209B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710809929.2A CN107808209B (zh) 2017-09-11 2017-09-11 基于加权kNN距离的风电场异常数据辨识方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710809929.2A CN107808209B (zh) 2017-09-11 2017-09-11 基于加权kNN距离的风电场异常数据辨识方法

Publications (2)

Publication Number Publication Date
CN107808209A CN107808209A (zh) 2018-03-16
CN107808209B true CN107808209B (zh) 2021-09-14

Family

ID=61576555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710809929.2A Active CN107808209B (zh) 2017-09-11 2017-09-11 基于加权kNN距离的风电场异常数据辨识方法

Country Status (1)

Country Link
CN (1) CN107808209B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740175B (zh) * 2018-11-18 2020-12-08 浙江大学 一种面向风电机组功率曲线数据的离群点判别方法
CN110674864B (zh) * 2019-09-20 2024-03-15 国网上海市电力公司 一种含同步相量量测装置的风电异常数据辨识方法
CN117290802B (zh) * 2023-11-27 2024-03-26 惠州市鑫晖源科技有限公司 一种基于数据处理的主机电源运行监测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182803A (zh) * 2014-08-13 2014-12-03 东北电力大学 风电数据预处理方法及风电功率预测方法和系统
CN106127614A (zh) * 2016-08-30 2016-11-16 西南交通大学 一种基于三参数威尔分布的电力异常数据辨识方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10395759B2 (en) * 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182803A (zh) * 2014-08-13 2014-12-03 东北电力大学 风电数据预处理方法及风电功率预测方法和系统
CN106127614A (zh) * 2016-08-30 2016-11-16 西南交通大学 一种基于三参数威尔分布的电力异常数据辨识方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于FKNN算法的风电功率短期预测;郭晓利 等;《电测与仪表》;20140810;第51卷(第15期);第1-7页 *

Also Published As

Publication number Publication date
CN107808209A (zh) 2018-03-16

Similar Documents

Publication Publication Date Title
CN106055918B (zh) 一种电力系统负荷数据的辨识及修正方法
CN107038292B (zh) 一种基于自适应多变量非参数核密度估计的多风电场出力相关性建模方法
CN117093879A (zh) 一种数据中心智能化运营管理方法及系统
CN111680820B (zh) 分布式光伏电站故障诊断方法和装置
CN107808209B (zh) 基于加权kNN距离的风电场异常数据辨识方法
CN110685868A (zh) 一种基于改进梯度提升机的风电机组故障检测方法及装置
Hu et al. Adaptive confidence boundary modeling of wind turbine power curve using SCADA data and its application
CN113344288B (zh) 梯级水电站群水位预测方法、装置及计算机可读存储介质
CN112186761A (zh) 一种基于概率分布的风电功率场景生成方法及系统
CN113626767A (zh) 一种风机限电识别方法、系统、设备和存储介质
CN110879927A (zh) 一种用于海目标检测的海杂波幅度统计分布现场建模方法
CN110020680B (zh) 一种基于随机矩阵理论和模糊c均值聚类算法的pmu数据分类方法
CN110991689B (zh) 基于LSTM-Morlet模型的分布式光伏发电系统短期预测方法
CN109921462B (zh) 一种基于lstm的新能源消纳能力评估方法及系统
CN116335925A (zh) 基于数据增强的煤矿井下乳化泵站智能调控系统
CN116404186A (zh) 一种功率型锂锰电池生产系统
CN112700050B (zh) 一种光伏电站超短期第1点功率预测方法及系统
CN114429238A (zh) 一种基于时空特征提取的风电机组故障预警方法
CN116662829B (zh) 一种场群风机标准功率曲线定义规则和偏差验证方法
CN110765420A (zh) 一种基于pso-fi的地面自动气象站气温观测资料质量控制方法
CN114692729A (zh) 基于深度学习的新能源场站不良数据辨识与修正方法
CN115563848A (zh) 一种基于深度学习的分布式光伏总辐射预测方法及系统
CN110083804B (zh) 基于条件分布回归的风电场scada数据缺失的智能修复方法
CN113554079A (zh) 一种基于二次检测法的电力负荷异常数据检测方法及系统
CN111178601A (zh) 一种基于气象数据后处理的风电机组功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant