CN107180391A - 一种风电数据跨度选取方法及装置 - Google Patents
一种风电数据跨度选取方法及装置 Download PDFInfo
- Publication number
- CN107180391A CN107180391A CN201710205064.9A CN201710205064A CN107180391A CN 107180391 A CN107180391 A CN 107180391A CN 201710205064 A CN201710205064 A CN 201710205064A CN 107180391 A CN107180391 A CN 107180391A
- Authority
- CN
- China
- Prior art keywords
- mrow
- data
- days
- span
- msub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000005611 electricity Effects 0.000 title claims abstract description 38
- 238000005070 sampling Methods 0.000 claims abstract description 70
- 239000013598 vector Substances 0.000 claims description 43
- 238000009826 distribution Methods 0.000 claims description 7
- 230000002146 bilateral effect Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000004364 calculation method Methods 0.000 abstract description 4
- 238000004422 calculation algorithm Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 241001269238 Data Species 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000005684 electric field Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Wind Motors (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种风电数据跨度选取方法及装置,所述方法包括:采集风电厂出力数据,对所述数据预处理,剔除噪点天数,得到有效数据;对所述有效数据进行分类;计算各类数据的最佳采样天数;根据各类数据的最佳采样天数,计算总采样天数;根据总采样天数确定数据跨度窗,并根据所述数据跨度窗计算风电数据跨度。本发明提供的技术方案,大大减少了风电场进行出力预测和储能容量配置等技术的计算量,提高了计算速度。
Description
技术领域
本发明涉及风力发电技术,具体涉及一种风电数据跨度选取方法及装置。
背景技术
近年来,随着我国风力发电装机容量逐年增高,风力发电越来越受到业界的重视。风力发电厂的出力预测和储能容量配置是风力发电技术中的两个重要方向。而这两项技术均需以数据为基础来实现。而实际能够表征风力发电厂出力水平和特点的数据量往往非常巨大,如果将所有的数据均参与计算则非常容易导致计算陷入“计算灾害”。
因此,需要一种风电数据跨度选取方法及装置,能够采取有效的方法对海量数据进行处理,从海量数据中抽取出适量的样本用以表征整体数据水平,在保证计算精准度的同时,减少参与计算的数据量。
发明内容
本发明提供一种风电数据跨度选取方法,所述方法包括如下步骤:
采集风电厂出力数据,对所述数据预处理得到有效数据;
对所述有效数据进行分类;
计算各类数据的最佳采样天数;
根据各类数据的最佳采样天数,计算总采样天数;
根据总采样天数确定数据跨度窗,并根据所述数据跨度窗计算风电数据跨度。
所述有效数据为向量形式,所述对所述有效数据进行分类包括:
从向量中随机选取K个向量分别作为初始质心;
计算除了初始质心外剩余的向量到每个质心的距离,并将该向量归到距离最近的质心的类中,重新计算得到各个类的新的质心,直至新的质心与初始质心相等或新的质心与初始质心的距离小于指定阈值。
根据下式计算向量到质心的距离D:
其中,k为每个向量的维度,i=1、2...m,m为向量的个数,Xi1、Xik为需要计算距离的两个向量的第i维坐标。
所述计算各类数据的最佳采样天数包括:
根据下式计算日出力表征系数Bi:
其中,Pij用于表示第i天第j个功率采样点的功率值,N是每天的总采样点数;
根据所述日出力表征系数B计算各类数据的最佳采样天数。
根据所述日出力表征系数B计算各类数据的最佳采样天数包括:
日出力表征系数B的一个样本包括(B1,B2,B3...,Bn),样本均值E(B)=u,样本方差D(B)=σ2,标准正态分布的双侧分位数tα的密度函数如下式所示:
其中,σ为标注差,n为抽样点数;
如式(3)所示,当抽样点数n足够大时,近似服从正态分布N(0,1),置信水平α如下式所示:
为使抽样误差合理,需满足下式:
其中,ε0允许的绝对误差上限;
根据公式(4)和(5),得出按下式计算最佳采样天数即抽样点数n:
n=σ2·tα 2/(u·ε)2 (6)
其中,ε为相对精度,ε·u=ε0。
所述总采样天数为各类数据的最佳采样天数的加和。
所述根据总采样天数和数据跨度窗计算风电数据跨度包括:
根据总采样天数和数据跨度窗确定预选跨度数据天数;
将所述预选跨度数据天数与在数据预处理时剔除的噪点天数相加,得到风电数据跨度。
所述根据总采样天数确定数据跨度窗:
确定时间起点,在选择的基础跨度窗长度范围内寻找各类数据的最佳采样天数,若跨度窗内包含所有类别数据所需的最佳采样天数,则变换起点;若跨度窗内不包含所有类别数据所需的最佳采样天数,增加跨度窗长度,直至满足任一时间起点的连续跨度窗内包含了所有数据所需的最佳采样天数。
本发明提供一种风电数据跨度选取装置,所述装置包括:
采集模块,用于采集风电厂出力数据;
数据预处理模块,用于对采集到的风电厂出力数据预处理得到有效数据;
数据分类模块,用于对所述有效数据进行分类;
第一计算模块,用于计算各类数据的最佳采样天数;
第二计算模块,用于根据各类数据的最佳采样天数,计算总采样天数;
第三计算模块,根据总采样天数确定数据跨度窗,并根据所述数据跨度窗计算风电数据跨度。
所述有效数据为向量形式,所述数据分类模块具体用于从向量中随机选取K个向量分别作为初始质心,计算除了初始质心外剩余的向量到每个质心的距离,并将该向量归到距离最近的质心的类中,重新计算得到各个类的新的质心,直至新的质心与初始质心相等或新的质心与初始质心的距离小于指定阈值。
与最接近的现有技术比,本发明提供的技术方案具有以下优异效果:
用该发明提出的技术方案对风电数据进行处理,可以大大减少风电场进行出力预测和储能容量配置等技术的计算量,提高计算速度。同时,在做风电厂出力预测时,若没有可用的风电场全年数据,可通过利用采样数据的方法对风电厂出力进行预测。
本发明提供的技术方案克服了现有技术将所有的数据均参与计算则非常容易导致计算陷入“计算灾害”的弊端。
本发明提供的技术方案实现了处理海量数据时,能从中抽取出适量的样本用以表征整体数据水平,在保证计算精准度的同时,减少参与计算的数据量。
附图说明
图1为本发明实施例一种风电数据跨度选取方法的流程图;
图2为本发明实施例K-means算法的工作原理及流程图;
图3为本发明实施例跨度选取原理图。
具体实施方式
下面结合附图对本发明最进一步详细的说明:
如图1所示,为本发明风电数据跨度选取方法的算法流程图,首先对数据进行预处理得到可进行计算的有效数据;将预处理得到的数据用K-means算法分类,得到分类结果为下一步计算做准备,此时每一类数据的质心即为代表该类数据的特征曲线;接下来分别对每一类数据应用表征系数法,求得可以表示该类数据的最佳采样天数;获得用以表征每类数据的最佳采样天数之后,应用数据跨度窗对全年数据进行处理,求得包含所有类别的最佳采样天数的最短的全年数据跨度;最后,将使用跨度窗求得的数据天数与去掉的噪点数据天数相加,得到的结果即为求取的典型风电数据跨度。
K-means采用距离作为相似性的评价指标,即认为两个向量的距离越近,其相似度就越大。该算法认为簇是由距离靠近的向量组成的,因此把得到紧凑且独立的簇作为最终目标。
k个初始类聚类中心点的选取对聚类结果具有较大的影响,因为在该算法第一步中是随机的选取任意k个向量作为初始聚类的中心,初始地代表一个簇。该算法在每次迭代中对数据集中剩余的每个向量,根据其与各个簇中心的距离将每个向量重新赋给最近的簇。当考察完所有数据向量后,一次迭代运算完成,新的聚类中心被计算出来。如果在一次迭代前后,J的值没有发生变化,说明算法已经收敛。
K-means算法的工作原理及流程如图2所示,具体算法过程如下:
a)从M个向量中随机选取K个向量作为初始质心;
b)对剩余的每个向量测量其到每个初始质心的距离,并把它归到最近的初始质心的类;
c)重新计算已经得到的各个类的质心;
d)迭代b~c步直至新的质心与初始质心相等或新的质心与初始质心的距离小于指定阈值,算法结束。
K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。
欧氏距离计算表达式如公式1所示:
其中,k为每个向量的维度,i=1、2…m,m为向量的个数。
K-means算法接受输入量K;然后将M个数据向量划分为K个聚类以便使得所获得的聚类满足:同一聚类中的向量相似度较高;而不同聚类中的向量相似度较小。聚类相似度是利用各聚类中向量的均值所获得一个“中心对象”来进行计算的。
对数据进行分类的目的是把向量按照其内在规律进行分类,将属于同一类的向量聚合在一起作为跨度选取的基础。在聚类中,每一类数据向量都会通过计算得到一个新的质心,用该聚类中心绘制的曲线即为该类数据的特征曲线。
(2)各类数据最佳采样天数计算
为了表征任意一天风力发电出力数据的特点,定义日出力表征系数为Bi:
其中,Pij用于表示第i天第j个功率采样点的功率值,N是每天的总采样点数。
为了计算数据跨度,首先需要对上一节中分类的N种数据的日出力表征系数分别进行最适样本容量的估计,所有类别的样本容量估计之和即可作为数据跨度选取的基准。对系统状态空间进行随机的抽样,以抽取的样本来代替整体水平。样本抽取的越多,反应数据整体的信息就越全面。但在实际的计算中,抽样点数n不可能太大,因为n过大会导致计算量增大,因此需要根据实际允许的误差精度合理的去选择n值。
设的一个样本包括(B1,B2,B3...,Bn)是来自日出力表征系数总体B的一个样本,样本均值E(B)=u,样本方差D(B)=σ2,由中心极限定理可知,对于实数tα,有:
根据公式(3)可知,当抽样点数n足够大时,近似服从正态分布N(0,1)。因此对于给定的置信水平α有:
tα为标准正态分布的双侧分位数,可以通过查询正态分布统计表得到。设ε0为允许的绝对误差上限,为使抽样误差合理,应有:
比较公式(4)和(5)可知,设ε为相对精度,则有ε·u=ε0。由此得到的最适样本容量为:
n=σ2·tα 2/(u·ε)2 (6)
置信度为95%时,t0.05=1.96,总体均值u可由样本均值E(B)估计。在统计原理中,因s2(s为样本标准差)为σ2的无偏估计,因此可以用s2代替σ2进行计算。
相对精度由研究者设定,不同的相对误差精度决定着不同的最适样本容量数,即最合适的取样天数,也就是最佳的类采样天数。
方法第一步已将风电数据分类,再通过这一步骤的计算可以得出能够代表每一类风电数据的典型采样数据个数。即通过这一步骤的计算可知,从每一类数据中抽取多少个样本最为准确。
(3)“跨度窗”法求取典型数据跨度
以允许误差精度为ε为例继续对典型数据跨度选取进行分析,在相对误差精度为ε时,若将原始有效数据分为K类,每一类中的样本容量分别为:k1,k2,…,kK。选用全年循环数据作为跨度数据选取样本。跨度选取方法如下:
首先定义此处所指的跨度窗的定义:在无限长或循环数据串中,跨度窗是指包含以任意一点为起点的定长数据串的窗格,该窗格的长度N可以根据需求变化。当长度为C和C+i(i=1、2、3…)的跨度窗内数据满足数据选取要求、但长度为C-1的跨度窗内数据不满足数据选取要求时,认为此时的跨度窗长度合理。
以任意一天为起点,在选择的基础“跨度窗”长度范围内寻找各类数据的天数,若“跨度窗”内包含所有类别所需最低天数,则变换起点;若跨度窗内不包含所有类别所需最低天数,增加“跨度窗”长度,直至满足要求;按照此种逻辑方法进行推算,直至所需“跨度窗”长度满足以任意一天为起点的连续“跨度窗”天数内包含了所有类别所需的最低天数,即此时的跨度窗内包含了K类的k1,k2,…,kK天。原理如图3所示。
按照此跨度选取原理对数据样本进行处理,处理结果显示,当选取“跨度窗”宽度为C天时,能够满足跨度选取方法中提出的要求。但是,考虑到样本中剔除了的O天噪点数据,为了保证跨度选取的准确性,将“跨度窗”宽度设置为S=C+O天。
此种寻取数据跨度的方法是在默认相邻年之间风电场出力规模和水平均相同或相近的前提下进行的,因此,若此方法应用于此种前提下,则方法具有普适性,否则此种方法只能用于数据样本包含的样本容量中。
在前两部分的基础上,再通过这一步的计算即可得出能够代表全部风场数据的典型采样数据天数,即得到典型风电数据跨度。
图2:图2为K-means算法的工作原理及流程,算法开始首先从N个对象中随机选取K个对象作为质心,然后对剩余的每个对象测量其到每个质心的距离,并把它归到最近的质心的类,然后通过计算重新计算已经得到的各个类的质心,迭代2~3步直至新的质心与原质心相等或小于指定阈值,算法结束。
图3:图3为跨度选取原理图,应用跨度窗对全年风电场处理数据进行寻找,跨度窗的长度可以变化,寻优的结果为直至所需“跨度窗”长度满足以任意一天为起点的连续“跨度窗”天数内包含了所有类别所需的最低天数,即此时的跨度窗内包含了K类的k1,k2,…,kK天时,认为寻优成功,得到所需最优解。
以某风电场全年365天出力数据为例对本专利方法进行举例说明。
(1)通过计算剔除全年出力数据中13天无效数据,将剩余的352天数据作为基础数据应用于该方法。
(2)使用K-means法对352天风电数据进行分类,通过计算可知将352天数据分为9个类别最为准确。分类结果如下表所示:
类别 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
包含天数 | 17 | 41 | 16 | 41 | 15 | 32 | 146 | 20 | 24 |
(3)应用表征系数法进行最佳类采样天数计算。以允许误差精度ε=0.25,置信水平α取为95%为例对数据跨度选取进行分析,在相对误差精度为0.25时,按1到9类的顺序所需的各类天气的天数依次为2、5、4、2、2、5、23、1、1天。
(4)由(3)可知,所要选取出的数据跨度内需要至少包含第1、2、3、4、5、6、7、8、9类天气数据2、5、4、2、2、5、23、1、1天。根据加和结果应用数据“跨度窗”对典型风电数据进行处理,最终通过计算得出可用于替代风电场全年数据的典型数据跨度为140天。因此可知最终需要选取的典型风电数据跨度为140+13=153天。
基于同一发明构思,本发明实施例还提供了一种风电数据跨度选取装置,下面进行说明。
所述装置可以包括:
采集模块,用于采集风电厂出力数据;
数据预处理模块,用于对采集到的风电厂出力数据预处理得到有效数据;
数据分类模块,用于对所述有效数据进行分类;
第一计算模块,用于计算各类数据的最佳采样天数;
第二计算模块,用于根据各类数据的最佳采样天数,计算总采样天数;
第三计算模块,根据总采样天数确定数据跨度窗,并根据所述数据跨度窗计算风电数据跨度。
所述有效数据为向量形式,所述数据分类模块具体用于从向量中随机选取K个向量分别作为初始质心,计算除了初始质心外剩余的向量到每个质心的距离,并将该向量归到距离最近的质心的类中,重新计算得到各个类的新的质心,直至新的质心与初始质心相等或新的质心与初始质心的距离小于指定阈值。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用于说明本发明的技术方案而非对其保护范围的限制,尽管参照上述实施例对本申请进行了详细的说明,所属领域的普通技术人员应当理解:本领域技术人员阅读本申请后依然可对申请的具体实施方式进行种种变更、修改或者等同替换,但这些变更、修改或者等同替换,均在申请待批的权利要求保护范围之内。
Claims (10)
1.一种风电数据跨度选取方法,其特征在于,所述方法包括如下步骤:
采集风电厂出力数据,对所述数据预处理得到有效数据;
对所述有效数据进行分类;
计算各类数据的最佳采样天数;
根据各类数据的最佳采样天数,计算总采样天数;
根据总采样天数确定数据跨度窗,并根据所述数据跨度窗计算风电数据跨度。
2.如权利要求1所述的风电数据跨度选取方法,其特征在于,所述有效数据为向量形式,所述对所述有效数据进行分类包括:
从向量中随机选取K个向量分别作为初始质心;
计算除了初始质心外剩余的向量到每个质心的距离,并将该向量归到距离最近的质心的类中,重新计算得到各个类的新的质心,直至新的质心与初始质心相等或新的质心与初始质心的距离小于指定阈值。
3.如权利要求2所述的风电数据跨度选取方法,其特征在于,根据下式计算向量到质心的距离D:
<mrow>
<mi>D</mi>
<mo>=</mo>
<msqrt>
<msup>
<mrow>
<mo>(</mo>
<munderover>
<mi>&Sigma;</mi>
<mn>1</mn>
<mi>k</mi>
</munderover>
<msub>
<mi>X</mi>
<mrow>
<mi>i</mi>
<mn>1</mn>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>X</mi>
<mrow>
<mi>i</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</msqrt>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,k为每个向量的维度,i=1、2...m,m为向量的个数,Xi1、Xik为需要计算距离的两个向量的第i维坐标。
4.如权利要求1所述的风电数据跨度选取方法,其特征在于,所述计算各类数据的最佳采样天数包括:
根据下式计算日出力表征系数Bi:
<mrow>
<msub>
<mi>B</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mi>N</mi>
<msup>
<mrow>
<mo>(</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>P</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>-</mo>
<mfrac>
<mn>1</mn>
<mi>N</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>P</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>P</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,Pij用于表示第i天第j个功率采样点的功率值,N是每天的总采样点数;
根据所述日出力表征系数B计算各类数据的最佳采样天数。
5.如权利要求4所述的风电数据跨度选取方法,其特征在于,根据所述日出力表征系数B计算各类数据的最佳采样天数包括:
日出力表征系数B的一个样本包括(B1,B2,B3...,Bn),样本均值E(B)=u,样本方差D(B)=σ2,标准正态分布的双侧分位数tα的密度函数如下式所示:
<mrow>
<mi>&Phi;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>t</mi>
<mi>&alpha;</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munder>
<mi>lim</mi>
<mrow>
<mi>n</mi>
<mo>&RightArrow;</mo>
<mi>&infin;</mi>
</mrow>
</munder>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mrow>
<msub>
<mover>
<mi>B</mi>
<mo>&OverBar;</mo>
</mover>
<mi>n</mi>
</msub>
<mo>-</mo>
<mi>u</mi>
</mrow>
<mrow>
<mi>&sigma;</mi>
<mo>/</mo>
<msqrt>
<mi>n</mi>
</msqrt>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Integral;</mo>
<mrow>
<mo>-</mo>
<mi>&infin;</mi>
</mrow>
<msub>
<mi>t</mi>
<mi>&alpha;</mi>
</msub>
</munderover>
<mfrac>
<mn>1</mn>
<msqrt>
<mrow>
<mn>2</mn>
<mi>&pi;</mi>
</mrow>
</msqrt>
</mfrac>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<msup>
<mi>t</mi>
<mn>2</mn>
</msup>
<mo>/</mo>
<mn>2</mn>
</mrow>
</msup>
<mi>d</mi>
<mi>t</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,σ为标注差,n为抽样点数;
如式(3)所示,当抽样点数n足够大时,近似服从正态分布N(0,1),置信水平α如下式所示:
<mrow>
<mn>1</mn>
<mo>-</mo>
<mi>&alpha;</mi>
<mo>=</mo>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mrow>
<msub>
<mover>
<mi>B</mi>
<mo>&OverBar;</mo>
</mover>
<mi>n</mi>
</msub>
<mo>-</mo>
<mi>u</mi>
</mrow>
<mrow>
<mi>&sigma;</mi>
<mo>/</mo>
<msqrt>
<mi>n</mi>
</msqrt>
</mrow>
</mfrac>
<mo>&le;</mo>
<msub>
<mi>t</mi>
<mi>&alpha;</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
1
为使抽样误差合理,需满足下式:
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mo>|</mo>
<msub>
<mover>
<mi>B</mi>
<mo>&OverBar;</mo>
</mover>
<mi>n</mi>
</msub>
<mo>-</mo>
<mi>u</mi>
<mo>|</mo>
<mo>&le;</mo>
<msub>
<mi>&epsiv;</mi>
<mn>0</mn>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>1</mn>
<mo>-</mo>
<mi>&alpha;</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,ε0允许的绝对误差上限;
根据公式(4)和(5),得出按下式计算最佳采样天数即抽样点数n:
n=σ2·tα 2/(u·ε)2 (6)
其中,ε为相对精度,ε·u=ε0。
6.如权利要求1所述的风电数据跨度选取方法,其特征在于,所述总采样天数为各类数据的最佳采样天数的加和。
7.如权利要求1所述的风电数据跨度选取方法,其特征在于,所述根据总采样天数和数据跨度窗计算风电数据跨度包括:
根据总采样天数和数据跨度窗确定预选跨度数据天数;
将所述预选跨度数据天数与在数据预处理时剔除的噪点天数相加,得到风电数据跨度。
8.如权利要求1所述的风电数据跨度选取方法,其特征在于,所述根据总采样天数确定数据跨度窗:
确定时间起点,在选择的基础跨度窗长度范围内寻找各类数据的最佳采样天数,若跨度窗内包含所有类别数据所需的最佳采样天数,则变换起点;若跨度窗内不包含所有类别数据所需的最佳采样天数,增加跨度窗长度,直至满足任一时间起点的连续跨度窗内包含了所有数据所需的最佳采样天数。
9.一种风电数据跨度选取装置,其特征在于,所述装置包括:
采集模块,用于采集风电厂出力数据;
数据预处理模块,用于对采集到的风电厂出力数据预处理得到有效数据;
数据分类模块,用于对所述有效数据进行分类;
第一计算模块,用于计算各类数据的最佳采样天数;
第二计算模块,用于根据各类数据的最佳采样天数,计算总采样天数;
第三计算模块,根据总采样天数确定数据跨度窗,并根据所述数据跨度窗计算风电数据跨度。
10.如权利要求9所述的风电数据跨度选取装置,其特征在于,所述有效数据为向量形式,所述数据分类模块具体用于从向量中随机选取K个向量分别作为初始质心,计算除了初始质心外剩余的向量到每个质心的距离,并将该向量归到距离最近的质心的类中,重新计算得到各个类的新的质心,直至新的质心与初始质心相等或新的质心与初始质心的距离小于指定阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710205064.9A CN107180391B (zh) | 2017-03-31 | 2017-03-31 | 一种风电数据跨度选取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710205064.9A CN107180391B (zh) | 2017-03-31 | 2017-03-31 | 一种风电数据跨度选取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107180391A true CN107180391A (zh) | 2017-09-19 |
CN107180391B CN107180391B (zh) | 2023-03-24 |
Family
ID=59829851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710205064.9A Active CN107180391B (zh) | 2017-03-31 | 2017-03-31 | 一种风电数据跨度选取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107180391B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107707494A (zh) * | 2017-10-10 | 2018-02-16 | 苏州大学 | 用于64‑qam相干光通信系统的光纤非线性均衡方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101852863A (zh) * | 2009-04-03 | 2010-10-06 | 中国石油集团东方地球物理勘探有限责任公司 | 一种利用高精度单道频谱分析技术处理地震数据的方法 |
CN103389966A (zh) * | 2012-05-09 | 2013-11-13 | 阿里巴巴集团控股有限公司 | 一种海量数据的处理、搜索、推荐方法及装置 |
CN105825002A (zh) * | 2016-03-14 | 2016-08-03 | 华侨大学 | 一种基于动态灰关联分析法的风电场动态等值建模方法 |
-
2017
- 2017-03-31 CN CN201710205064.9A patent/CN107180391B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101852863A (zh) * | 2009-04-03 | 2010-10-06 | 中国石油集团东方地球物理勘探有限责任公司 | 一种利用高精度单道频谱分析技术处理地震数据的方法 |
CN103389966A (zh) * | 2012-05-09 | 2013-11-13 | 阿里巴巴集团控股有限公司 | 一种海量数据的处理、搜索、推荐方法及装置 |
CN105825002A (zh) * | 2016-03-14 | 2016-08-03 | 华侨大学 | 一种基于动态灰关联分析法的风电场动态等值建模方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107707494A (zh) * | 2017-10-10 | 2018-02-16 | 苏州大学 | 用于64‑qam相干光通信系统的光纤非线性均衡方法 |
CN107707494B (zh) * | 2017-10-10 | 2020-02-11 | 苏州大学 | 用于64-qam相干光通信系统的光纤非线性均衡方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107180391B (zh) | 2023-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102663100B (zh) | 一种两阶段混合粒子群优化聚类方法 | |
CN103218435B (zh) | 一种中文文本数据聚类方法及系统 | |
CN103400143B (zh) | 一种基于多视角的数据子空间聚类方法 | |
CN108376262B (zh) | 一种风电出力典型特性的分析模型构建方法 | |
CN102324038B (zh) | 一种基于数字图像的植物种类识别方法 | |
CN106909933A (zh) | 一种三阶段多视角特征融合的窃电分类预测方法 | |
CN111259933B (zh) | 基于分布式并行决策树的高维特征数据分类方法及系统 | |
CN110175416A (zh) | 基于主成分分析和神经网络的三峡水库水温预测方法 | |
CN110826618A (zh) | 一种基于随机森林的个人信用风险评估方法 | |
CN103886030B (zh) | 基于代价敏感决策树的信息物理融合系统数据分类方法 | |
CN106067034A (zh) | 一种基于高维矩阵特征根的配电网负荷曲线聚类方法 | |
CN113032613B (zh) | 一种基于交互注意力卷积神经网络的三维模型检索方法 | |
CN112287018A (zh) | 一种台风灾害下10kV杆塔受损风险评估方法及系统 | |
CN111401603A (zh) | 一种多类型能源需求预测方法 | |
CN110738232A (zh) | 一种基于数据挖掘技术的电网电压越限成因诊断方法 | |
CN116739541B (zh) | 一种基于ai技术的智能人才匹配方法及系统 | |
CN105808582A (zh) | 基于分层策略的决策树并行生成方法和装置 | |
CN103902798B (zh) | 数据预处理方法 | |
CN111612319A (zh) | 基于一维卷积自编码器的负荷曲线深度嵌入聚类方法 | |
CN117150232B (zh) | 一种大模型非时序训练数据质量评价方法 | |
CN114330486A (zh) | 基于改进Wasserstein GAN的电力系统不良数据辨识方法 | |
CN113392877A (zh) | 一种基于蚁群算法与c-k算法的日负荷曲线聚类方法 | |
CN109409407A (zh) | 一种基于le算法的工业监测数据聚类方法 | |
CN107180391A (zh) | 一种风电数据跨度选取方法及装置 | |
CN116662860A (zh) | 一种基于能源大数据的用户画像与分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |