CN107067100A - 风电功率异常数据辨识方法及辨识装置 - Google Patents
风电功率异常数据辨识方法及辨识装置 Download PDFInfo
- Publication number
- CN107067100A CN107067100A CN201710055628.5A CN201710055628A CN107067100A CN 107067100 A CN107067100 A CN 107067100A CN 201710055628 A CN201710055628 A CN 201710055628A CN 107067100 A CN107067100 A CN 107067100A
- Authority
- CN
- China
- Prior art keywords
- wind power
- wind
- data
- change
- abnormal data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000002547 anomalous effect Effects 0.000 title claims abstract description 33
- 230000002159 abnormal effect Effects 0.000 claims abstract description 130
- 230000008859 change Effects 0.000 claims abstract description 92
- 230000001788 irregular Effects 0.000 claims abstract description 65
- 238000004458 analytical method Methods 0.000 claims abstract description 35
- 230000035772 mutation Effects 0.000 claims abstract description 25
- 238000007405 data analysis Methods 0.000 claims description 13
- 230000001419 dependent effect Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 11
- 230000005611 electricity Effects 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 2
- 238000004321 preservation Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012850 discrimination method Methods 0.000 description 3
- 239000000428 dust Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000004576 sand Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000000556 factor analysis Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Wind Motors (AREA)
Abstract
本发明涉及一种风电功率异常数据辨识方法,其中,所述方法包括:根据异常数据的来源和时间序列的不规则变化,将异常数据进行分类,得到异常数据分类结果;根据异常数据的分类结果,获取异常数据判断标准;根据异常数据判断标准,对同时段风电功率序列和风速序列分别进行概率变点分析,辨识时间序列中的不规则突变;根据风电功率序列和风速序列建立混合回归模型,根据各回归变量重要性排序的变化,获得风电功率序列中的模型变点。本发明还涉及一种风电功率异常数据辨识装置。本发明提供的风电功率异常数据辨识方法和装置能够对风电功率异常数据进行准确辨识。
Description
技术领域
本发明涉及一种风电功率异常数据辨识方法及辨识装置,尤其涉及一种基于变点分析的风电功率异常数据辨识方法及辨识装置,属于电力系统预测与控制技术领域。
背景技术
风电大规模并网背景下,其具有的波动性和随机性给传统电力系统的安全稳定运行带来巨大挑战,风电功率预测技术是帮助解决这一问题的重要手段。目前用于生产实践的功率预测系统大多采用数值天气预报(NWP)和统计学相结合的方法,不仅用到未来的天气预报情况,还用到了历史实际运行数据。历史样本是统计学方法的研究对象,其质量好坏对风电功率预测统计学方法建模效果影响很大。原始数据预处理可以为串行模式下充分发挥样本统计特性对预测精度的提升作用提供可靠的数据基础,也是风电功率预测系统的必备环节。
以往的研究当中常用控制图方法来辨识风电功率数据中的异常值,然而,基于控制图原理的风电功率异常数据辨识方法中,大部分分散点,不论是错误数据还是不规则数据,都被辨识为异常点去除,无法适用于精细化功率预测,使得风电功率的预测的准确度不够高。
发明内容
综上所述,确有必要提出一种能够准确对风电功率异常数据进行辨识的方法及装置。
一种风电功率异常数据辨识方法,其中,所述方法包括:
根据异常数据的来源和风电功率序列的不规则变化,将异常数据进行分类,得到异常数据分类结果;
根据异常数据的分类结果,建立基于风速序列的异常数据判断标准;
根据预设的异常数据判断标准,对位于同时段的风电功率序列和风速序列分别进行概率变点分析,得到风电功率序列和风速序列中的概率变点,通过概率变点辨识风电功率序列以及风速时间序列中的不规则突变,根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别风电功率异常数据的类型;
根据风电功率序列和风速序列建立混合回归模型,根据混合回归模型中各回归变量重要性排序的变化,获得风电功率序列中的模型变点,并根据模型变点识别剩余风电功率异常数据的类型。
在其中一个实施例中,异常数据包括错误数据和不规则数据;错误数据包括在数据量测、传输和保存等环节中由于干扰导致的失真数据;不规则数据包括正常记录存储的数据,但由于极端天气过程引起的第一类不规则数据或人工控制干预而表现异常的数据第二类不规则数据。
在其中一个实施例中,根据风电功率的不规则变化与风速序列的不规则变化对应关系,异常数据包括三种类型:
类型一:若不规则变化变化是由于风资源/风电功率的非平稳、非线性特征导致,则风电功率序列中的异常突变对应于相同或相近时刻风速序列中的突变,为第一类不规则数据;
类型二:若风电功率序列中的异常突变与相同或相近时刻风速序列中的突变不对应,则风电功率序列中的异常突变属于错误数据;以及
类型三:人工控制干预导致的风电功率序列异常数据,为第二类不规则数据。
在其中一个实施例中,基于风速序列的异常数据判断标准包括:
若风电功率序列和风速序列中同时存在的不规则突变则属于第一类不规则数据;
若只在风电功率序列中存在的不规则突变则属于错误数据;
若风速序列不变而风电功率序列中存在的预定时长的不规则变化,为第二类不规则数据。
在其中一个实施例中,所述根据风电功率序列和风速序列建立混合回归模型,根据各回归变量重要性排序的变化,获得风电功率序列中的模型变点的步骤包括:
以风电功率序列的一阶差分结果作为因变量数组,风速序列一阶差分作为自变量数组,建立混合回归模型;
根据各回归变量重要性排序的变化,分析辨识风电功率序列中的模型变点。
在其中一个实施例中,对位于同时段的风电功率序列和风速序列分别进行概率变点分析,得到风电功率序列和风速序列中的概率变点包括:
当获得一个概率变点后,将原风电功率序列根据该概率变点位置拆分为前后两个子序列;
分别对每个子序列进行辨识,直到没有新的概率变点被发现,获得风电功率序列中所有的概率变点。
在其中一个实施例中,进一步包括:
利用特殊影响因子对异常数据进行分析,根据正态分布均值的假设检验,获得异常数据的产生与特殊影响因子之间的相关关系。
一种风电功率异常数据辨识装置,其中,所述装置包括:
异常数据分类模块,用于根据异常数据的来源和风电功率序列的不规则变化,将异常数据进行分类,得到异常数据分类结果;
标准建立模块,用于根据异常数据的分类结果,建立基于风速序列的异常数据判断标准;
第一异常数据分析模块,用于根据异常数据判断标准,对位于同时段的风电功率序列和风速序列分别进行概率变点分析,得到风电功率序列和风速序列中的概率变点,通过概率变点辨识风电功率序列以及风速序列中的不规则突变,根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别风电功率异常数据的类型;
第二异常数据分析模块,用于根据风电功率序列和风速序列建立混合回归模型,根据混合回归模型中各回归变量重要性排序的变化,获得风电功率序列中的模型变点,并根据模型变点识别剩余风电功率异常数据的类型。
在其中一个实施例中,所述第二异常数据分析模块包括:
回归模型获取单元,用于以风电功率序列的一阶差分结果作为因变量数组,风速序列一阶差分作为自变量数组,建立混合回归模型;
模型变点获取单元,根据各回归变量重要性排序的变化,分析辨识风电功率序列中的模型变点。
在其中一个实施例中,所述第一异常数据分析模块还用于:
当获得一个概率变点后,将原风电功率序列根据该概率变点位置拆分为前后两个子序列;
分别对每个子序列进行辨识,直到没有新的概率变点被发现,获得风电功率序列中所有的概率变点。
在其中一个实施例中,所述装置还包括:
相关关系建立模块,用于利用特殊影响因子对异常数据进行分析,根据正态分布均值的假设检验,获得异常数据的来源与特殊影响因子之间的相关关系。
上述实施例根据异常数据分析判断原则对其成因进行分类,并结合了概率变点和模型变点的时序关系,符合风资源/风电序列的时序相依特性,能够对风电功率异常数据进行准确辨识。
附图说明
图1为一个实施例提供的风电功率异常数据辨识方法的流程框图;
图2为风电功率异常数据辨识方法中多变点分析流程的示意图;
图3为滚动建模子样本形成过程的示意图;
图4为其中一个实施例中概率变点分析的示意图;
图5为另一个实施例中概率变点分析的示意图;
图6为实施例提供的风电功率异常数据辨识方法中采用的样本曲线的示意图;
图7为不同延迟步长变量的排序情况,其中n0=16,n=96,p=4。
图8为一个实施例中电功率异常数据辨识方法与传统方法的异常点辨识效果对比;
图9为一个实施例提供的风电功率异常数据辨识装置的结构框图。
具体实施方式
下面根据说明书附图并结合具体实施例对本发明的技术方案进一步详细表述。
本发明提供的基于变点分析的风电功率异常数据辨识方法,用于为系统后续预测建模提供可靠的数据基础。本发明提供的风电功率异常数据辨识方法,通过将待分析的时间序列看作某非线性系统的输出,根据不同类型异常数据的产生机理制定分析判断原则,从概率、模型、特殊影响因子三个角度开展异常数据辨识和分析。
请参阅图1,本发明实施例提供的风电功率异常数据的辨识方法,主要包括以下步骤:
S10,根据异常数据的来源和风电功率序列的不规则变化,将异常数据进行分类,得到异常数据分类结果;
S20,获取异常数据的分类结果与风速序列的对应关系,建立基于风速序列的异常数据判断标准;
S30,根据异常数据判断标准,对位于同时段风电功率序列和风速序列分别进行概率变点分析,风电功率序列和风速序列中的概率变点,通过概率变点辨识风电功率序列以及风速序列中的不规则突变,根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别异常数据的类型;
S40,根据风电功率序列和风速序列建立混合回归模型,根据各回归变量重要性排序的变化,获得风电功率序列中的模型变点,并根据模型变点识别异常数据的类型。
在其中一个实施例中,在步骤S10中,可以根据异常数据的产生机理将异常数据进行分类。
其中,根据异常数据的产生机理可将异常数据分为错误数据和不规则数据两类;错误数据指在数据量测、传输和保存等环节中由于干扰导致的失真数据,不规则数据则是指正常记录存储的数据,但由于极端天气过程引起的第一类不规则数据或人工控制干预等原因而表现异常引起的第二类不规则数据。
进一步,风电功率异常数据的表现都可以归纳为时间序列的不规则变化,即根据风电功率的不规则变化与风速序列的不规则变化对应关系,异常数据可包括三种类型:
类型一:若不规则变化变化是由于风资源/风电功率的非平稳、非线性特征导致,则风电功率序列中的异常突变对应于相同或相近时刻风速序列中的突变,为第一类不规则数据。
类型二:若风电功率序列中的异常突变与相同或相近时刻风速序列中的突变不对应,则风电功率序列中的异常突变属于错误数据。
类型三:人工控制干预导致的风电功率序列异常数据,为第二类不规则数据。
虽然风速序列中不会有所反应,但这类功率控制措施下功率序列的变化,受技术和安全等条件限制,相对于错误数据的即时产生,一般是一个较为缓变的过程,且一旦发生,会持续一段时间,即对应于第二类不规则数据,风速序列不变而风电功率序列中存在的预定时长的不规则变化。
在步骤S20中,获取异常数据的分类结果与风速序列的对应关系,建立异常数据基本判断标准如下:
对风电功率和风速序列中的不规则变化进行识别;
若风电功率和风速中同时存在的不规则突变则属于不规则数据;
若只在风电功率中存在的不规则突变则属于错误数据;
若风速序列不变而风电功率序列中存在的预定时长的不规则变化,为第二类不规则数据。
可以理解,变点问题的分析方法很多,根据不同类型风电功率异常数据的产生机理,可通过概率变点和模型变点对类型一、类型二以及类型三进行辨识。具体的,可选取概率变点作为类型一、类型二中不规则突变的辨识方法,选择模型变点作为类型三中较缓慢不规则变化的辨识方法,并利用特殊影响因子变点分析异常数据产生的遥相关性。
作为其中一个实施例,在步骤S30中,基于概率变点的不规则数据辨识,对同时段风电功率序列和风速序列分别进行概率变点分析,获得风电功率序列和风速序列中的概率变点,通过概率变点辨识风电功率序列中的不规则突变。
具体的,可根据累积概率分析变点问题,基于原假设下的渐近分布对其进行检验。考虑一类简单情况,假设时间序列中只有一个变点,事件的发生概率开始保持在p1,时刻mc下发生概率突然变化为p2,则mc即为变点发生时间。为了估计mc,不同时刻事件累计发生次数Cn计算如下:
式中{zi},i=1,...,n,是表示每个时刻下事件是否发生的时间序列,zi=1表示事件在i时刻发生,zi=0表示没有发生。统计量Tn为:
式中Cn/n是截止到时刻n的事件发生频次,CN/N是总事件发生频次。Tn的期望值为:
一开始,|E(Tn)|的值随着n的增加而增大,在n=mc-1时到达最大值,然后|E(Tn)|开始减小。因此,变点判断流程可以总结为;
S31:计算统计量Tn的绝对值|Tn|,n=1,2,...,N
S32:找到变点发生时间m*,使|Tm*|=max(|Tn|),n=1,2,...,N
S33:将作为变点发生的时刻。
假设p1=p2下,统计量Nn1 -1n2 -1|Tm*|的渐近分布与斯米尔诺夫检验(CMNPHOBtesting)统计量相同,其中n1=CN,n2=N-CN。因此,如果有:
式中lα是n1、α限制下的斯米尔诺夫检验临界值,则对于给定置信度水平α下,原假设p1=p2不成立,变点存在,且其估计可信度可由检验置信水平保证。
具体的,作为其中一个实施例,请参阅图2,当检验得到一个概率变点后,将原风电功率序列根据变点位置拆分为前后两个子序列,分别对每个子序列重复上述辨识过程,直到没有新的概率变点被发现,获得所有的概率变点。另外,可以根据相邻两点间的跃变是否超过一定比例将时间序列转化为0-1序列。然后将上述方法用于检验风电功率、风速序列中是否存在突变点。
在步骤S40中,可以风电功率序列的一阶差分结果作为因变量数组,风速序列一阶差分作为自变量数组,建立混合回归模型,根据各回归变量重要性序列的变化,来分析辨识风电功率序列中的模型变点,该模型变点用于识别经过概率变点分析之后剩余的风电功率异常数据,且风电功率异常数据的第二类不规则数据。
作为其中一个实施例,可采用疏系数混合回归模型来建立输入、输出变量之间的关系:
yt=α0+α1yt-1+α2yt-2+...+αpyt-p
+β1,1x1,t-1+β1,2x1,t-2+...+β1,px1,t-p+...
+βm,1xm,t-1+βm,2xm,t-2+...+βm,pxm,t-p+εt (5)
式中{yt},t=1,2,...,N是因变量序列,{xi,t},i=1,...,m,t=1,2,...,N,是m种相关影响变量序列,α1,...,αp是因变量延迟变量系数,β1,1,...,β1,p,...,βm,p是相关影响变量延迟变量系数,p是最大延迟步长,εt是白噪声序列。式(5)中回归模型既包含了对因变量自回归特性的考虑,也包含了对其影响变量混合回归特性的考虑。
下面简要介绍模型估计过程,将式(5)整理为一般回归模型因变量和自变量形式:
yt=α1'xt,1'+α2'xt,2'+...+αs'xt,s'+εt (6)
式中s=mp+1。进一步写成:
Y=Xα+ε (7)
式中Y=[y1,y2,...,yN]T,α=[α1',α2',...,αs']T,ε=[ε1,...,εN]T,求解的正规方程为:
XTXα=XTY (8)
对式(8)进行中心化和标准化,得到:
Tα'=Y' (9)
式中T的第i行、第j列的元素是ti,j,i,j=1,2,...,s,Y'=[y1',y2',...,ys']T。对T加边,得到其中y0=1。
采用逐步回归的方法,对T进行s阶削去变换。在每一阶,比较不同变量削去后的残差变化量yi 2/ti,i,若某变量对应的残差变化量是最小值,则说明该变量对因变量的贡献最小,应将其削去。对T矩阵全部阶数的削去变换完成后,按照BIC准则(BayesianInformation Criterion,贝叶斯信息准则),比较各阶削去后的BIC值,得到定阶模型。对于本发明的研究,更重要的是,根据各阶变换削去情况,也同时得到了回归变量的重要性排序。
采用对总样本滚动建模的方式来考察样本中的变点问题。请一并参阅图3,n0是滚动时间间隔,n为子样本大小,p为最大延迟步长。变点分析步骤如下:
第一步:设定n0,n,p的大小;
第二步:利用每份子样本建立疏系数混合回归模型,同时根据残差变化量对回归变量的重要性进行排序;
第三步:以不同子样本对应模型回归变量重要性排序的变化表征回归模型统计特性的变化。若从第l期样本建模开始,变量排序发生变化,则可估计变点发生的时段为(l-2)n0+n~(l-1)n0+n。
进一步,可利用特殊影响因子对异常数据进行分析,从较长期统计角度,根据正态分布均值的假设检验,获得异常数据的产生与特殊影响因子之间的遥相关关系。
受风资源/风电时空波动特性影响,风电功率的变化会受到某些影响因子遥相关关系的影响。一些情况下,风电功率序列中异常数据的产生原因是特殊天气过程,例如雨、雪、霾等,作为特殊影响因子。从较长期统计角度,根据正态分布均值的假设检验,来分析异常数据的产生与特殊影响因子之间的关系。
将{yt},t=1,...,N作为待分析的对象,是一定时间段Δt内的异常数据量组成的时间序列。选取可能导致{yt}发生变化的特殊影响因子,将其发生的时段作为特殊时段,标记为t1,t2,...,tn,tn≤N。按照和特殊时段相隔不同时间从{yt}中抽取子样本l=0,±1,±2,...,±L,L为影响因子最大考察时间间隔。对于每一份子样本计算其均值
式中如果则nl为有效样本数量。统计量U计算如下:
式中μ为{yt}的均值,σ为其标准差。原假设为即{yt}不受特殊因子影响,与μ没有显著性区别。但是,如果|U|超过了一定置信度水平下的临界值,则表明与μ存在显著性区别。这种情况下,说明距离特殊因子发生l·Δt时间会对异常数据的发生有影响。
实施例一
下面结合具体的实际数据,进一步说明本发明应用于风电功率异常数据辨识的效果。算例中使用的数据来源于我国北方某并网大型风电场,风电功率数据和测风塔数据从SCADA系统中采集,覆盖时间窗口为1年。具体步骤如下:(1)基于概率变点的不规则突变数据辨识
对同时段风电功率序列和风速序列分别进行概率变点分析,辨识序列中的不规则突变,进一步比较二者分析结果,来帮助判断造成功率序列中不规则突变的原因。请一并参阅图4及图5,分别给出了两种典型分析结果。在图4中,功率序列的分析结果|Tn|在i=32达到最大值,风速序列的分析结果在i=31达到最大值,且对应的式(4)计算结果分别为2.040和2.271,均大于斯米尔诺夫检验临界值l0.01=1.628,因而判定为变点存在。功率序列变点的发生时刻与风速变点十分相近,根据本发明中所述分析判断原则,该功率变点属于类型一:由天气变化导致的功率突变,为不规则数据。对照功率和风速曲线图相应时刻的变化也可以验证该辨识结果。而图5中,功率序列|Tn|在i=29达到最大值,且统计量计算结果为2.045,大于l0.01=1.628,但该功率变点对应时段附近(i±2)不存在风速变点,因此判断时刻的功率样本属于类型二:错误数据。该结果同样可以在功率和风速曲线图上得到验证。
(2)基于模型变点的异常数据分析
以风电功率序列的一阶差分结果作为{yt},风速序列一阶差分作为{x1,t},根据式(5)建立混合回归模型,根据各回归变量重要性排序的变化,来分析辨识风电功率序列中的模型变点。以图6和图7所示算例说明模型辨识效果。对于图6中截取的风速、风电功率序列,图7按照不同类型的回归变量(风速/功率),给出了每次滚动建模得到的变量重要性排序前两位变化情况,其中延迟步长的时间间隔是15分钟,横坐标第(l-1)n0+1~(l-1)n0+n0序列点对应的是第l期子样本建模排序。可以看出,从第16、17期建模开始,风速变量的排序发生了明显变化,则推知功率序列中模型变点对应的位置在321~352点。在这之前,变量排序基本符合风速/风电功率在较短延迟步长下的自相关性,即yt-1,x1,t-1分别是功率、风速重要性排序第一的回归变量。变点发生后,yt-1保持第一的排序,但x1,t-1排序变得较为不规律,且这种情况在其后多期建模中持续。本算例中,对比图7中的序列波动情况,该模型变点代表特殊功率控制时段的开始,为异常数据类型三所述的情况,属于不规则数据。
(3)特殊天气因子影响分析
选取沙尘和降雪作为特殊天气因子来研究其与异常数据发生之间的关联性。所用的异常数据包括先前剔除的明显错误数据,以及变点分析所得的异常数据。式(12)中的统计量U计算结果如表1所示。对于沙尘天气因子,在取式(11)中延迟量l为0和1时,统计量U大于正态分布限值1.64(置信度水平0.1),说明沙尘的发生与当天发生及后1日的异常数据产生之间具有显著的关联性。对于降雪影响因子,从统计量U的计算结果看,降雪和异常数据产生的关联性可以从发生当天开始一直到发生后2日。
表1异常数据发生与天气因子之间的关系(间隔时段Δt=1day)
(4)不同异常数据辨识方法获得的风速-功率散点图比较
为了进一步论证基于变点分析的异常数据辨识方法的优势,将其与传统的基于控制图原理的异常数据辨识方法进行比较,图8给出了使用两种方法前后的风速-功率散点图对比。比较数据窗口为2个月。变点分析结果的图例中,“控制”对应类型三的异常数据,“突变”对应类型一的异常数据,“错误”对应类型二的异常数据。
可以看出,受样本分散性较高的影响,基于控制图原理的三倍标准差法的异常数据筛选结果不太理想,特别是高风速区段,由于限电较多,控制图方法基本无法对其进行辨识。
进一步,本发明实施例进一步提供一种风电功率异常数据辨识装置,所述装置包括:
异常数据分类模块110,用于根据异常数据的来源和风电功率序列的不规则变化,将异常数据进行分类,得到异常数据分类结果;
标准建立模块120,用于获取异常数据的分类结果与风速序列的对应关系,建立基于风速序列的异常数据判断标准;
第一异常数据分析模块130,用于根据异常数据判断标准,对位于同时段的风电功率序列和风速序列分别进行概率变点分析,得到风电功率序列和风速序列中的概率变点,通过概率变点辨识风电功率序列以及风速序列中的不规则突变,根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别异常数据的类型;
第二异常数据分析模块140,用于根据风电功率序列和风速序列建立混合回归模型,根据各回归变量重要性排序的变化,获得风电功率序列中的模型变点,并根据模型变点识别异常数据的类型。
在其中一个实施例中,所述第一异常数据分析模块还用于:
当获得一个概率变点后,将原风电功率序列根据该概率变点位置拆分为前后两个子序列;
分别对每个子序列进行辨识,直到没有新的概率变点被发现,获得风电功率序列中所有的概率变点。
在其中一个实施例中,所述第二异常数据分析模块还包括:
回归模型获取单元,用于以风电功率序列的一阶差分结果作为因变量数组,风速序列一阶差分作为自变量数组,建立混合回归模型;
模型变点获取单元,根据各回归变量重要性排序的变化,分析辨识风电功率序列中的模型变点。在其中一个实施例中,所述风电功率异常数据辨识装置还包括:
相关关系建立模块,用于利用特殊影响因子对异常数据进行分析,根据正态分布均值的假设检验,获得异常数据的来源与特殊影响因子之间的相关关系。
本发明实施例提供的异常数据辨识方法及装置,具有以下特点:(1)不仅可以辨识异常数据,还可以对其成因进行分类;(2)不论是概率变点方法还是模型变点方法,都考虑了样本点间的时序关系,而不是完全将其作为孤立点看待,因此从图8中可以看出不仅离散分布的异常点可以被辨识,位于样本集中区域的异常点也可以被辨识。(3)特殊影响因子的变点分析,可以帮助判断特殊天气现象与异常数据发生之间的关联性,这为不同类型数据间的遥相关分析提供了一种有效方法,也有助于利用极端天气的预报结果,对异常数据的多发进行预判、预警。(4)由于变点分析方法对数据分布没有特定假设,因此并不局限于风电功率异常数据辨识,也可用于风电功率预测复合数据源中其它类型的数据,如风速、风向、气温等,从而提高了风电概率预测的准确性。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种风电功率异常数据辨识方法,其特征在于,所述方法包括:
根据异常数据的来源和风电功率序列的不规则变化,将异常数据进行分类,得到异常数据分类结果;
获取异常数据的分类结果与风速序列的对应关系,建立基于风速序列的异常数据判断标准;
根据异常数据判断标准,对位于同时段的风电功率序列和风速序列分别进行概率变点分析,得到风电功率序列和风速序列中的概率变点,通过概率变点辨识风电功率序列以及风速序列中的不规则突变,根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别风电功率异常数据的类型;
根据风电功率序列和风速序列建立混合回归模型,根据混合回归模型中各回归变量重要性排序的变化,获得风电功率序列中的模型变点,并根据模型变点识别剩余风电功率异常数据的类型。
2.根据权利要求1所述的风电功率异常数据辨识方法,其特征在于,根据风电功率的不规则变化与风速序列的不规则变化对应关系,异常数据包括三种类型:
类型一:若不规则变化变化是由于风资源/风电功率的非平稳、非线性特征导致,则风电功率序列中的异常突变对应于相同或相近时刻风速序列中的突变,为第一类不规则数据,该第一类不规则数据为正常记录存储但由于极端天气过程引起的异常数据;
类型二:若风电功率序列中的异常突变与相同或相近时刻风速序列中的突变不对应,则风电功率序列中的异常突变属于错误数据,该错误数据为在数据量测、传输和保存等环节中由于干扰导致的失真数据;以及
类型三:人工控制干预导致的风电功率序列异常数据,为第二类不规则数据,该第二类不规则数据为正常记录存储但由于人工控制干预而表现异常的数据。
3.根据权利要求2所述的风电功率异常数据辨识方法,其特征在于,基于风速序列的异常数据判断标准包括:
若风电功率序列和风速序列中同时存在的不规则突变则属于第一类不规则数据;
若只在风电功率序列中存在的不规则突变则属于错误数据;
若风速序列不变而风电功率序列中存在的预定时长的不规则变化,为第二类不规则数据。
4.根据权利要求1所述的风电功率异常数据辨识方法,其特征在于,所述根据风电功率序列和风速序列建立混合回归模型,根据各回归变量重要性排序的变化,获得风电功率序列中的模型变点的步骤包括:
以风电功率序列的一阶差分结果作为因变量数组,风速序列一阶差分作为自变量数组,建立混合回归模型;
根据各回归变量重要性排序的变化,分析辨识风电功率序列中的模型变点。
5.根据权利要求1所述的风电功率异常数据辨识方法,其特征在于,对位于同时段的风电功率序列和风速序列分别进行概率变点分析,得到风电功率序列和风速序列中的概率变点包括:
当获得一个概率变点后,将原风电功率序列根据该概率变点位置拆分为前后两个子序列;
分别对每个子序列进行辨识,直到没有新的概率变点被发现,获得风电功率序列中所有的概率变点。
6.根据权利要求1所述的风电功率异常数据辨识方法,其特征在于,进一步包括:
利用特殊影响因子对异常数据进行分析,根据正态分布均值的假设检验,获得异常数据的来源与特殊影响因子之间的相关关系。
7.一种风电功率异常数据辨识装置,其特征在于,所述装置包括:
异常数据分类模块,用于根据异常数据的来源和风电功率序列的不规则变化,将异常数据进行分类,得到异常数据分类结果;
标准建立模块,用于根据异常数据的分类结果,建立基于风速序列的异常数据判断标准;
第一异常数据分析模块,用于根据预设的异常数据判断标准,对位于同时段的风电功率序列和风速序列分别进行概率变点分析,得到风电功率序列和风速序列中的概率变点,通过概率变点辨识风电功率序列以及风速时间序列中的不规则突变,根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别风电功率异常数据的类型;
第二异常数据分析模块,用于根据风电功率序列和风速序列建立混合回归模型,根据混合回归模型中各回归变量重要性排序的变化,获得风电功率序列中的模型变点,并根据模型变点识别剩余风电功率异常数据的类型。
8.如权利要求7所述的装置,其特征在于,所述第二异常数据分析模块包括:
回归模型获取单元,用于以风电功率序列的一阶差分结果作为因变量数组,风速序列一阶差分作为自变量数组,建立混合回归模型;
模型变点获取单元,根据各回归变量重要性排序的变化,分析辨识风电功率序列中的模型变点。
9.如权利要求7所述的装置,其特征在于,所述第一异常数据分析模块还用于:
当获得一个概率变点后,将原风电功率序列根据该概率变点位置拆分为前后两个子序列;
分别对每个子序列进行辨识,直到没有新的概率变点被发现,获得风电功率序列中所有的概率变点。
10.如权利要求7所述的装置,其特征在于,所述装置还包括:
相关关系建立模块,用于利用特殊影响因子对异常数据进行分析,根据正态分布均值的假设检验,获得异常数据的来源与特殊影响因子之间的相关关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710055628.5A CN107067100B (zh) | 2017-01-25 | 2017-01-25 | 风电功率异常数据辨识方法及辨识装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710055628.5A CN107067100B (zh) | 2017-01-25 | 2017-01-25 | 风电功率异常数据辨识方法及辨识装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107067100A true CN107067100A (zh) | 2017-08-18 |
CN107067100B CN107067100B (zh) | 2020-12-04 |
Family
ID=59598402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710055628.5A Active CN107067100B (zh) | 2017-01-25 | 2017-01-25 | 风电功率异常数据辨识方法及辨识装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107067100B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108412710A (zh) * | 2018-01-30 | 2018-08-17 | 同济大学 | 一种风电机组风功率数据清洗方法 |
CN109299080A (zh) * | 2018-08-02 | 2019-02-01 | 国电南京自动化股份有限公司 | 一种电力生产运行数据的清洗方法及计算设备 |
CN110674864A (zh) * | 2019-09-20 | 2020-01-10 | 国网上海市电力公司 | 一种含同步相量量测装置的风电异常数据辨识方法 |
CN110751213A (zh) * | 2019-10-21 | 2020-02-04 | 东北电力大学 | 一种测风塔异常风速数据识别与补齐的方法 |
CN110826750A (zh) * | 2018-08-08 | 2020-02-21 | 阿里巴巴集团控股有限公司 | 一种电力负荷预测方法、装置、设备及系统 |
CN111542846A (zh) * | 2018-01-19 | 2020-08-14 | 株式会社日立制作所 | 故障预测系统和故障预测方法 |
CN114444820A (zh) * | 2022-04-11 | 2022-05-06 | 南方电网数字电网研究院有限公司 | 基于气象-功率特性的新能源功率预测限电数据识别方法 |
CN114579827A (zh) * | 2022-05-06 | 2022-06-03 | 昆仑智汇数据科技(北京)有限公司 | 一种工业设备数据性能曲线的处理方法、装置及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102075263A (zh) * | 2010-12-21 | 2011-05-25 | 西安电子科技大学 | 基于分段能量处理的截尾型序贯检验方法 |
US20110229032A1 (en) * | 2010-03-16 | 2011-09-22 | Honda Motor Co., Ltd. | Detecting And Labeling Places Using Runtime Change-Point Detection |
CN104766175A (zh) * | 2015-04-16 | 2015-07-08 | 东南大学 | 一种基于时间序列分析的电力系统异常数据辨识与修正方法 |
CN105134484A (zh) * | 2015-07-28 | 2015-12-09 | 国家电网公司 | 风电功率异常数据点的识别方法 |
CN105486945A (zh) * | 2015-11-23 | 2016-04-13 | 中国南方电网有限责任公司 | 一种10kV线路线损异常的判断方法 |
CN105719002A (zh) * | 2016-01-18 | 2016-06-29 | 重庆大学 | 一种基于组合预测的风电机组状态参数异常辨识方法 |
-
2017
- 2017-01-25 CN CN201710055628.5A patent/CN107067100B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110229032A1 (en) * | 2010-03-16 | 2011-09-22 | Honda Motor Co., Ltd. | Detecting And Labeling Places Using Runtime Change-Point Detection |
CN102075263A (zh) * | 2010-12-21 | 2011-05-25 | 西安电子科技大学 | 基于分段能量处理的截尾型序贯检验方法 |
CN104766175A (zh) * | 2015-04-16 | 2015-07-08 | 东南大学 | 一种基于时间序列分析的电力系统异常数据辨识与修正方法 |
CN105134484A (zh) * | 2015-07-28 | 2015-12-09 | 国家电网公司 | 风电功率异常数据点的识别方法 |
CN105486945A (zh) * | 2015-11-23 | 2016-04-13 | 中国南方电网有限责任公司 | 一种10kV线路线损异常的判断方法 |
CN105719002A (zh) * | 2016-01-18 | 2016-06-29 | 重庆大学 | 一种基于组合预测的风电机组状态参数异常辨识方法 |
Non-Patent Citations (6)
Title |
---|
MAN XU: "Application of change-point analysis to abnormal wind power data detection", 《2014 IEEE PES GENERAL MEETING | CONFERENCE & EXPOSITION》 * |
付宇: "交通流模型变点统计方法", 《中国优秀硕士学位论文全文数据库》 * |
夏媛媛: "交通流在间歇流状态下的概率变点模型", 《山东理工大学学报》 * |
王博: "非平稳序列的疏系数混合回归模型", 《水电能源科学》 * |
王惠惠: "回归模型中变点识别的一种稳健方法", 《计算机仿真》 * |
王红: "一种新的时间序列变点算法在变形数据分析中的应用", 《测绘科学》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111542846A (zh) * | 2018-01-19 | 2020-08-14 | 株式会社日立制作所 | 故障预测系统和故障预测方法 |
CN111542846B (zh) * | 2018-01-19 | 2023-08-29 | 株式会社日立制作所 | 故障预测系统和故障预测方法 |
CN108412710A (zh) * | 2018-01-30 | 2018-08-17 | 同济大学 | 一种风电机组风功率数据清洗方法 |
CN109299080B (zh) * | 2018-08-02 | 2022-09-06 | 南京华盾电力信息安全测评有限公司 | 一种电力生产运行数据的清洗方法及计算设备 |
CN109299080A (zh) * | 2018-08-02 | 2019-02-01 | 国电南京自动化股份有限公司 | 一种电力生产运行数据的清洗方法及计算设备 |
CN110826750A (zh) * | 2018-08-08 | 2020-02-21 | 阿里巴巴集团控股有限公司 | 一种电力负荷预测方法、装置、设备及系统 |
CN110826750B (zh) * | 2018-08-08 | 2023-09-26 | 阿里巴巴集团控股有限公司 | 一种电力负荷预测方法、装置、设备及系统 |
CN110674864A (zh) * | 2019-09-20 | 2020-01-10 | 国网上海市电力公司 | 一种含同步相量量测装置的风电异常数据辨识方法 |
CN110674864B (zh) * | 2019-09-20 | 2024-03-15 | 国网上海市电力公司 | 一种含同步相量量测装置的风电异常数据辨识方法 |
CN110751213A (zh) * | 2019-10-21 | 2020-02-04 | 东北电力大学 | 一种测风塔异常风速数据识别与补齐的方法 |
CN114444820B (zh) * | 2022-04-11 | 2022-10-18 | 南方电网数字电网研究院有限公司 | 基于气象-功率特性的新能源功率预测限电数据识别方法 |
CN114444820A (zh) * | 2022-04-11 | 2022-05-06 | 南方电网数字电网研究院有限公司 | 基于气象-功率特性的新能源功率预测限电数据识别方法 |
CN114579827B (zh) * | 2022-05-06 | 2022-08-05 | 昆仑智汇数据科技(北京)有限公司 | 一种工业设备数据性能曲线的处理方法、装置及设备 |
CN114579827A (zh) * | 2022-05-06 | 2022-06-03 | 昆仑智汇数据科技(北京)有限公司 | 一种工业设备数据性能曲线的处理方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107067100B (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107067100A (zh) | 风电功率异常数据辨识方法及辨识装置 | |
CN106779505B (zh) | 一种基于大数据驱动的输电线路故障预警方法及系统 | |
CN104700200B (zh) | 一种面向数字化车间的产品多元质量监控方法 | |
CN105225979A (zh) | 一种半导体器件制程预测系统和方法 | |
CN103631681A (zh) | 一种在线修复风电场异常数据的方法 | |
CN110400231B (zh) | 一种加权非线性贝叶斯的电能计量设备失效率预估方法 | |
CN104808587A (zh) | 一种基于机加工设备运行状态的稼动率统计方法 | |
CN107480731A (zh) | 一种火电厂汽动给水泵组故障特征的早期识别方法 | |
CN112036089A (zh) | 一种基于dpc-mnd和多元状态估计的磨煤机故障预警方法 | |
CN110059845B (zh) | 基于时序演化基因模型的计量装置时钟误差趋势预测方法 | |
CN111352408B (zh) | 一种基于证据k近邻的多工况流程工业过程故障检测方法 | |
CN107038453A (zh) | 一种风电机组的故障预警系统及判断方法 | |
CN117195137B (zh) | 基于数据分析的转子压铸误差检测系统 | |
CN116400126B (zh) | 一种具有数据处理系统的低压电力箱 | |
CN101738991A (zh) | 检测产品品质超规与评估产品实际测量值的方法 | |
CN114358427B (zh) | 一种预测页岩气井最终可采储量的方法 | |
CN113298297A (zh) | 一种基于孤立森林与wgan网络的风电输出功率预测方法 | |
CN111275570A (zh) | 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法 | |
CN116432123A (zh) | 一种基于cart决策树算法的电能表故障预警方法 | |
CN110751213A (zh) | 一种测风塔异常风速数据识别与补齐的方法 | |
Yang et al. | Short-term wind power prediction based on multi-parameters similarity wind process matching and weighed-voting-based deep learning model selection | |
CN116756505B (zh) | 一种基于大数据的光伏设备智能管理系统及方法 | |
CN111192163B (zh) | 基于风电机组运行数据的发电机可靠度中短期预测方法 | |
CN110175705B (zh) | 一种负荷预测方法及包含该方法的存储器、系统 | |
CN109884426B (zh) | 获得环控系统冷却塔能效随运营年限演化特性的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |