CN114091354A - 风电机组功率预测模型样本集的获取方法及装置 - Google Patents
风电机组功率预测模型样本集的获取方法及装置 Download PDFInfo
- Publication number
- CN114091354A CN114091354A CN202210012553.3A CN202210012553A CN114091354A CN 114091354 A CN114091354 A CN 114091354A CN 202210012553 A CN202210012553 A CN 202210012553A CN 114091354 A CN114091354 A CN 114091354A
- Authority
- CN
- China
- Prior art keywords
- data set
- boundary function
- sub data
- power
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/06—Wind turbines or wind farms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/06—Power analysis or power optimisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Abstract
本发明提供一种风电机组功率预测模型样本集的获取方法及装置,所述方法包括将第一数据集分割成第一子数据集、第二子数据集和第三子数据集;基于所述第一子数据集和所述装机容量,确定上边界函数和下边界函数;通过所述上边界函数和所述下边界函数对所述第一数据集进行筛选,得到第二数据集。本发明的方法通过将第一数据集分割为不同的数据子集能筛选掉无意义数据使得确定的上、下边界函数更加准确,进而能根据上、下边界函数分别对不同的数据子集进行清洗,提升了数据清洗的针对性和准确性,能够使得功率预测模型在进行功率预测时输出更加精准的风电机组功率数据。
Description
技术领域
本发明涉及风力发电技术领域,尤其涉及一种风电机组功率预测模型样本集的获取方法及装置。
背景技术
作为一种清洁可再生能源,风能已成为极其重要的电力能源来源。由于风具有很强的间歇性和波动性,在风电机组发电的穿透功率较高的情况下,会对电网带来冲击。为保障电网安全可靠运行,减少弃风限电,尽可能满足电力部门的调度计划需要,对未来的风电功率进行准确预测变得十分重要。风电机组的实际功率是业界主流的功率预测模型的标签数据,其数据质量对最终预测功率的准确性有根本性的影响。
在风电机组的实际运行环境中,风电机组实际功率数据受各种因素的影响会产生各种类型的脏数据。相关技术中,通过采用一定的方法对风电机组功率数据进行清洗可以得到期望的功率数据来作为标签数据。但是当原始数据质量较差时甚至出现严重数据倾斜时,相关技术中的各种数据处理方法受到的影响较大,处理后的数据使得功率预测模型的输出结果存在较大偏差。
发明内容
本发明提供一种风电机组功率预测模型样本集的获取方法及装置,用以解决现有技术中风电机组功率预测模型样本数据质量差的缺陷,实现获取准确的样本数据并提高功率预测模型的预测准确性。
本发明提供一种风电机组功率预测模型样本集的获取方法,包括:
将第一数据集分割成第一子数据集、第二子数据集和第三子数据集,其中,所述第一数据集、所述第一子数据集、所述第二子数据集和所述第三子数据集均用于表示风速信息与功率信息形成的数对的集合;
基于所述第一子数据集和所述装机容量,确定上边界函数和下边界函数,所述上边界函数和所述下边界函数均用于表示功率信息和风速信息的对应关系;
通过所述上边界函数和所述下边界函数对所述第一数据集进行筛选,得到第二数据集。
根据本发明提供的一种风电机组功率预测模型样本集的获取方法,所述通过所述上边界函数和所述下边界函数对所述第一数据集进行筛选,得到第二数据集,包括:
通过所述上边界函数和所述下边界函数对所述第一子数据集和所述第二子数据集进行筛选,得到第一目标数据集;
通过所述下边界函数对所述第三子数据集进行筛选,得到第二目标数据集;
基于所述第一目标数据集和所述第二目标数据集,得到所述第二数据集。
根据本发明提供的一种风电机组功率预测模型样本集的获取方法,所述通过所述上边界函数和所述下边界函数对所述第一子数据集和所述第二子数据集进行筛选,得到第一目标数据集,包括:
将所述第一子数据集和所述第二子数据集中数对的风速信息分别代入所述上边界函数和所述下边界函数,得到第一功率信息p1和第二功率信息p2;
将所述第一子数据集和所述第二子数据集中的第一目标数对组成所述第一目标数据集,所述第一目标数对中的功率信息p满足p2≤p≤p1。
根据本发明提供的一种风电机组功率预测模型样本集的获取方法,所述通过所述下边界函数对所述第三子数据集进行筛选,得到第二目标数据集,包括:
将所述第三子数据集中数对的功率信息代入所述下边界函数,得到第一风速信息x’;
将所述第三子数据集中的第二目标数对组成所述第二目标数据集,所述第二目标数对中的风速信息x满足x≥x’。
根据本发明提供的一种风电机组功率预测模型样本集的获取方法,所述基于所述第一子数据集和所述装机容量,确定上边界函数和下边界函数,包括:
基于所述第一子数据集,确定第三目标数对,所述第三目标数对用于表示所述第一子数据集中功率密度堆积区间的数对集合;
基于所述第三目标数对,确定初始边界函数;所述初始边界函数用于表示功率信息和风速信息的对应关系;
基于所述初始边界函数和所述装机容量,确定所述上边界函数和所述下边界函数。
根据本发明提供的一种风电机组功率预测模型样本集的获取方法,所述基于所述第三目标数对,确定初始边界函数,包括:
将所述第三目标数对中的功率信息按照从小到大的顺序排序;
按照功率信息的大小对所述第三目标数对中的数对进行复制,得到扩增数对数量后的第三数据集,其中,功率信息越小的数对复制的数量越多;
基于所述第三数据集,确定所述初始边界函数。
根据本发明提供的一种风电机组功率预测模型样本集的获取方法,所述风速信息用于表示风速值的平方值。
本发明还提供一种功率预测模型的训练方法,包括:以如上述的风电机组功率预测模型样本集的获取方法获取的第二数据集为训练样本集,对所述功率预测模型进行训练。
本发明还提供一种风电机组的功率预测方法,包括:将待预测风速信息输入如上述的功率预测模型的训练方法训练得到的功率预测模型,得到所述功率预测模型输出的预测功率信息。
本发明还提供一种风电机组功率预测模型样本集的获取装置,包括:
第一处理模块,用于将第一数据集分割成第一子数据集、第二子数据集和第三子数据集,其中,所述第一数据集、所述第一子数据集、所述第二子数据集和所述第三子数据集均用于表示风速信息与功率信息形成的数对的集合;
第二处理模块,用于基于所述第一子数据集和装机容量,确定上边界函数和下边界函数,所述上边界函数和所述下边界函数均用于表示功率信息和风速信息的对应关系;
第三处理模块,用于通过所述上边界函数和所述下边界函数对所述第一数据集进行筛选,得到第二数据集。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述风电机组功率预测模型样本集的获取方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述风电机组功率预测模型样本集的获取方法的步骤。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述风电机组功率预测模型样本集的获取方法的步骤。
本发明提供的风电机组功率预测模型样本集的获取方法及装置,通过将第一数据集分割为不同的数据子集能筛选掉无意义数据使得确定的上、下边界函数更加准确,进而能根据上、下边界函数分别对不同的数据子集进行清洗,提升了数据清洗的针对性和准确性,能够使得功率预测模型在进行功率预测时输出更加精准的风电机组功率数据。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的风电机组功率预测模型样本集的获取方法的流程示意图;
图2是本发明提供的第一子数据集的风速信息-功率信息散点图之一;
图3是本发明提供的第一子数据集的风速信息-功率信息散点图之二;
图4是本发明提供的第一子数据集的风速信息-功率信息散点图之三;
图5是本发明提供的第一子数据集的风速信息-功率信息散点图之四;
图6是本发明提供的风电机组功率预测模型样本集的获取装置的结构示意图;
图7是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图7描述本发明的风电机组功率预测模型样本集的获取方法及装置。
如图1所示,本发明实施例的风电机组功率预测模型样本集的获取方法包括步骤110、步骤120和步骤130。
本发明实施例提供的风电机组功率预测模型样本集的获取方法的执行主体可以是控制器,当然,执行主体并不限于控制器,还可以是服务器等。
需要说明的是,数据采集与监视控制(Supervisory Control And DataAcquisition, SCADA)系统广泛应用于电力系统中。服务器可以从SCADA系统中采集风电机组的运行数据并得到风电机组的风速和功率数据。相关技术中,通常将风电机组的运行数据作为风电机组功率预测模型的样本集来对模型进行训练,进而实现对风电机组的功率进行预测。
在风电机组实际运行过程中,风电机组的功率数据容易受到各类硬件、软件以及电网调度等因素影响,从SCADA系统中直接获取的数据中存在大量不利于模型训练的低质量数据。
由于风力发电机组的装机容量一定,功率数据值的大小不会超过装机容量的值,因此,功率数据值大于装机容量值的数据属于异常数据。
可以理解的是,风速的大小为正数,且自然条件下的风速存在一定的上限,例如,陆地上的风速超过30m/s都属于罕见现象。因此,可以将风速为负数以及风速大于50m/s的数据作为异常数据。
在步骤110之前,可以先将从SCADA系统中直接获取的数据作为初始数据集并进行初步筛选,将初始数据集中的异常数据删除后得到第一数据集。
步骤110、将第一数据集分割成第一子数据集、第二子数据集和第三子数据集。
第一数据集是通过初始数据集删除异常数据后得来的,第一数据集中包含风速信息和与风速信息对应的功率信息。风速信息和与风速信息对应的功率信息可以以数对的形式保存于第一数据集。
在本实施方式中,考虑到一些数据对边界函数的拟合存在干扰,因此需要将第一数据集中的一些数据进行分隔。在确定边界函数时,对数据进行分隔的手段能降低不合理的数据对边界函数的影响。
在一些实施例中,可以将功率信息中值为零的数对筛选出来得到第二子数据集。在功率值为零的情况下,第二子数据集中的数对对边界函数的确定没有意义,并会影响边界函数参数的准确性。
在一些实施例中,可以将功率信息中值较高数对筛选出来得到第三子数据集。
在本实施方式中,以装机容量为基准,将功率信息数值接近装机容量数值的数据筛选出来得到第三子数据集。将功率信息p≥cap*m的数据筛选出来作为第三子数据集,m为经验值,m的取值范围可以是0.85≤m<1,例如,m=0.9。在功率信息大小接近装机容量的情况下,该数据属于合理数据,对边界函数的确定没有意义。
第一数据集在去除第二子数据集和第三子数据集后得到第一子数据集。由于第一子数据集、第二子数据集和第三子数据集均由第一数据集分割得到,第一数据集、第一子数据集、第二子数据集和第三子数据集均用于表示风速信息与功率信息形成的数对的集合。
在一些实施例中,风速信息用于表示风速值ws的平方值。即第一数据集、第一子数据集、第二子数据集和第三子数据集中的风速信息均表示风速值的平方值。
在本实施方式中,通过将风速数据进行二次方处理能够使得二次方得到的风速信息与功率信息之间更加符合线性关系,可以有效避免常规的一元多次等拟合方法遇到数据质量差等数据倾斜时产生的不稳定。
步骤120、基于第一子数据集和装机容量,确定上边界函数和下边界函数。
可以理解的是,在步骤110中,通过对零功率数据和高功率数据的筛除得到了第一子数据集。
在第一子数据集中,可以根据数据在不同功率以及不同风速大小的区间的分布情况进一步对数据进行筛选,使得数据的重心向风电机组实际运行的常态方向进行倾斜。
在本实施方式中,上边界函数和下边界函数均用于表示功率信息和风速信息的对应关系,在考虑到装机容量值的大小的情况下,可以通过第一子数据集中的数据来确定上边界函数和下边界函数。
在一些实施例中,通过第一子数据集中的数据来确定上边界函数和下边界函数可以通过以下步骤实现。
步骤121、基于第一子数据集,确定第三目标数对。
需要说明的是,第三目标数对用于表示第一子数据集中功率密度堆积区间的数对。
如图2所示,在确定第一子数据集中功率密度堆积区间的数对时,可以根据第一数据集中的数对绘制散点图,再根据散点图来直观地确定功率密度堆积区间进而得到第三目标数对。
在本实施方式中,散点图的横坐标可以是第一子数据集中的风速信息ws2,纵坐标可以是第一子数据集中的功率信息p,功率信息p的单位为MW,风速信息可以为风速值的平方值,风速信息ws2的单位为m2/s2。
在确定散点图后,可以在散点图上划分出h*l个网格,通过对网格中数对点的密度进行统计来确定功率密度堆积区间。其中,h和l都是正整数。
在一些实施例中,可以按照装机容量的大小以及最大风速信息的大小来确定网格的划分方式。
例如,在功率的单位为MW、风速的单位为m/s时,装机容量cap的单位为MW,风速信息的单位为m2/s2。h可以为cap/e取整后的值,10≤e≤50,例如,e=20。l可以为L*10的值,L为ws2/f取整后的值,ws2表示风速信息,50≤f≤200,例如,f=100。
如图2-图5所示,根据本实施例中发电机组的装机容量以及风速信息,每一个网格的宽度大小可以代表10m2/s2,每一个网格的高度大小可以代表10MW。
当然,在其他实施方式中,还可以按照其它方式对散点图进行网格的划分,此处不做限制。
在本实施方式中,第一子数据集中数对的散点图被划分为h*l个网格,每一个网格可以作为一个功率区间。根据划分的网格,统计h*l个网格中每个网格中数对的数量r,r用来表示每个网格的密度值。
如图3所示,在确定第三目标数对时,可以将h行的每一行中r值最大的网格作为功率密度堆积区间。在散点图的h行中一共可以确定出h个网格作为功率密度堆积区间。图3中的白底框格用于表示每行中r值最大的网格。
可以理解的是,在获取到第三目标数对后,基于散点图上划分的网格,可以对每个功率密度堆积区间网格中的数对求出功率信息的平均值p_avg和风速信息的平均值ws2_avg。
需要说明的是,第三目标数对为上述的h个网格中每个网格中的数对求平均值后得到的数对,第三目标数对共有h个。
步骤122、基于第三目标数对,确定初始边界函数。
在上述步骤中获取到第三目标数对后,为增加样本数据数量,以使得确定的初始边界函数更加符合数据清洗的需求,可以对第三目标数对的数量进行扩增。
第三目标数对的数量扩增后可以得到第三数据集,第三数据集能够便于确定出初始边界函数,初始边界函数用于表示功率信息和风速信息的对应关系。初始边界函数可以用于确定出上边界函数和下边界函数,以实现对数据的清洗。
在一些实施例中,在对第三目标数对的数量进行扩增前可以先将第三目标数对中的功率信息按照从小到大的顺序排序。
在本实施方式中,可以按照功率信息的大小对第三目标数对中的数对进行复制,进而得到扩增数对数量后的第三数据集。具体地,功率信息越小的数对复制的数量越多。
例如,可以将第三目标数对中功率信息p_avg值最小的数对复制后得到共计h个,将第三目标数对中功率信息p_avg值第二小的数对复制后得到共计h-1个,将第三目标数对中功率信息p_avg值第三小的数对复制后得到共计h-2个……第三目标数对中功率信息p_avg值最大的数对共计一个,按照此规律得到共计h(h+1)/2条数据构成第三数据集。
当然,第三目标数对的数量还可以按照其他方式进行扩增,此处不做限制。
在扩增时需要考虑到将值较小的功率信息所对应的数对的数量扩增的更多,提高第三数据集中值较小的功率信息所对应的数对的比例。
根据本申请实施例提供的风电机组功率预测模型样本集的获取方法,通过在确定初始边界函数前进行数据扩增,使风速和功率越小的数据点扩增数量越大,该思路遵循风电行业普遍的限电规律,即限电主要分布在中、高风速段,能够使初始边界函数在确定时数据重心尽量偏向小风速段,可有效减少限电过多等数据倾斜时产生的不稳定。
可以理解的是,在确定出第三数据集后,可以根据第三数据集中的多个数对确定出初始边界函数。
在一些实施方式中,如图4所示,可以将第三数据集中的风速信息ws2_avg作为x、将第三数据集中功率信息p_avg作为y,并采用最小二乘法确定出初始边界函数的公式y=ax+b,其中a和b是求得的最优参数,a和b均为常数。图4中的倾斜线条用于表示初始边界函数y=ax+b的一种示例方式。
当然,在其他实施例中,最小二乘法还可以采用其他线性回归算法如Lasso、岭回归等替代,此处对初始边界函数的确定方式不作限制。
步骤123、基于初始边界函数和装机容量,确定上边界函数和下边界函数。
根据上述步骤中得到的初始边界函数,可以将初始边界函数中y的值向上或者向下调整一定的范围以分别得到上边界函数和下边界函数。
在本实施方式中,选取装机容量作为调整的基准来对初始边界函数进行调整得到上边界函数和下边界函数。上边界函数的公式可以为y=ax+b+cap*n,下边界函数的公式可以为y=ax+b-cap*n。其中,n为经验值,n的取值范围可以是0<n≤0.25,例如n=0.1。
根据本申请实施例提供的风电机组功率预测模型样本集的获取方法,通过利用装机容量和第三数据集来确定出上边界函数和下边界函数,充分利用到了原始数据的特性,使得上边界函数以及下边界函数对被清洗的数据有更好的适应性。
步骤130、通过上边界函数和下边界函数对第一数据集进行筛选,得到第二数据集。
第二数据集是第一数据集经过上边界函数和下边界函数筛选清洗后得到的数据集,第二数据集中的数据能作为功率预测模型的样本集。
可以理解的是,第一数据集被分割成第一子数据集、第二子数据集和第三子数据集。针对上述三个不同的数据集,可以根据每个数据集的特性来采用不同的边界函数对其中的数据进行针对性地筛选。
在一些实施例中,通过上边界函数和下边界函数对第一子数据集和第二子数据集进行筛选,得到第一目标数据集;
在本实施方式中,上边界函数和下边界函数在第一子数据集的散点图上可以围出一定的范围,属于该范围内的数对可以放入第一目标数据集中。
需要说明的是,第二子数据集中一些数对的功率信息为零,但是风速信息很小不为零。为了兼顾到第二子数据集中风速信息不为零的数对,可以通过上边界函数和下边界函数对第二子数据集进行筛选。
在本实施方式中,可以先将第一子数据集和第二子数据集中数对的风速信息分别代入上边界函数和下边界函数,得到第一功率信息p1和第二功率信息p2。将第一子数据集和第二子数据集中的第一目标数对组成第一目标数据集,其中,第一目标数对中的功率信息p满足p2≤p≤p1。
可以理解的是,第一目标数据集中的功率信息满足风速信息在上边界函数和第下边界函数中球的两个功率值之间的范围。如图5所示,第一目标数据集可以包括图中灰度更高的点所对应的数对。
在对第三子数据集进行筛选时,通过下边界函数对第三子数据集进行筛选,得到第二目标数据集。
在本实施方式中,可以先将第三子数据集中数对的功率信息代入下边界函数,得到第一风速信息x’。将第三子数据集中的第二目标数对组成第二目标数据集,第二目标数对中的风速信息x满足x≥x’。
可以理解的是,第二目标数据集中风速信息大于功率信息通过下边界函数得到的第一风速信息x’。
根据上述方法得到的第一目标数据集和第二目标数据集,将第一目标数据集和第二目标数据集合并可以得到第二数据集。
根据本申请实施例提供的风电机组功率预测模型样本集的获取方法,通过将第一数据集分割为不同的数据子集能筛选掉无意义数据使得确定的上、下边界函数更加准确,进而能根据上、下边界函数分别对不同的数据子集进行清洗,提升了数据清洗的针对性和准确性,能够使得功率预测模型在进行功率预测时输出更加精准的风电机组功率数据。
本发明还提供一种功率预测模型的训练方法,该功率预测模型用于根据上述的风电机组功率预测模型样本集的获取方法获取的第二数据集为训练样本集,对功率预测模型进行训练。
在本实施方式中,可以利用第二数据集中的风速信息作为样本,利用第二数据集中的功率信息作为样本标签对功率预测模型进行训练。
根据本申请实施例提供的功率预测模型的训练方法,通过利用筛选、清洗掉质量较差的数据,提升了模型的训练效果,能使得模型的训练结果更加准确。
由于风具有很强的间歇性和波动性,当风电功率较高时,会对电网带来冲击。为保障电网安全可靠运行,减少弃风限电,尽可能满足电力部门的调度计划需要,因此对未来的风电功率进行准确预测变得十分重要。
本发明还提供一种风电机组的功率预测方法,通过将待预测风速信息输入上述的功率预测模型的训练方法训练得到的功率预测模型,得到功率预测模型输出的预测功率信息。
根据本申请实施例提供的风电机组的功率预测方法,由于功率预测模型是由经过筛选、清洗掉质量较差的数据后的训练样本集训练得到的,能够针对待预测风速信息输出准确的预测功率信息,提高了功率预测的准确性。
下面对本发明提供的风电机组功率预测模型样本集的获取装置进行描述,下文描述的风电机组功率预测模型样本集的获取装置与上文描述的风电机组功率预测模型样本集的获取方法可相互对应参照。
如图6所示,本发明提供的风电机组功率预测模型样本集的获取装置包括:第一处理模块610、第二处理模块620和第三处理模块630。
第一处理模块610用于将第一数据集分割成第一子数据集、第二子数据集和第三子数据集,其中,第一数据集、第一子数据集、第二子数据集和第三子数据集均用于表示风速信息与功率信息形成的数对的集合;
第二处理模块620用于基于第一子数据集和装机容量,确定上边界函数和下边界函数,上边界函数和下边界函数均用于表示功率信息和风速信息的对应关系;
第三处理模块630用于通过上边界函数和下边界函数对第一数据集进行筛选,得到第二数据集。
根据本申请实施例提供的风电机组功率预测模型样本集的获取装置,通过将第一数据集分割为不同的数据子集能筛选掉无意义数据使得确定的上、下边界函数更加准确,进而能根据上、下边界函数分别对不同的数据子集进行清洗,提升了数据清洗的针对性和准确性,能够使得功率预测模型在进行功率预测时输出更加精准的风电机组功率数据。
在一些实施例中,第三处理模块630还用于通过上边界函数和下边界函数对第一子数据集和第二子数据集进行筛选,得到第一目标数据集;通过下边界函数对第三子数据集进行筛选,得到第二目标数据集;基于第一目标数据集和第二目标数据集,得到第二数据集。
在一些实施例中,第三处理模块630还用于将第一子数据集和第二子数据集中数对的风速信息分别代入上边界函数和下边界函数,得到第一功率信息p1和第二功率信息p2;将第一子数据集和第二子数据集中的第一目标数对组成第一目标数据集,第一目标数对中的功率信息p满足p2≤p≤p1。
在一些实施例中,第三处理模块630还用于将第三子数据集中数对的功率信息代入下边界函数,得到第一风速信息x’;将第三子数据集中的第二目标数对组成第二目标数据集,第二目标数对中的风速信息x满足x≥x’。
在一些实施例中,第二处理模块620还用于基于第一子数据集,确定第三目标数对,第三目标数对用于表示第一子数据集中功率密度堆积区间的数对集合;基于第三目标数对,确定初始边界函数;初始边界函数用于表示功率信息和风速信息的对应关系;基于初始边界函数和装机容量,确定上边界函数和下边界函数。
在一些实施例中,第二处理模块620还用于将第三目标数对中的功率信息按照从小到大的顺序排序;按照功率信息的大小对第三目标数对中的数对进行复制,得到扩增数对数量后的第三数据集,其中,功率信息越小的数对复制的数量越多;基于第三数据集,确定初始边界函数。
在一些实施例中,风速信息用于表示风速值的平方值。
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行风电机组功率预测模型样本集的获取方法,该方法包括:将第一数据集分割成第一子数据集、第二子数据集和第三子数据集,其中,第一数据集、第一子数据集、第二子数据集和第三子数据集均用于表示风速信息与功率信息形成的数对的集合;基于第一子数据集和装机容量,确定上边界函数和下边界函数,上边界函数和下边界函数均用于表示功率信息和风速信息的对应关系;通过上边界函数和下边界函数对第一数据集进行筛选,得到第二数据集。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的风电机组功率预测模型样本集的获取方法,该方法包括:将第一数据集分割成第一子数据集、第二子数据集和第三子数据集,其中,第一数据集、第一子数据集、第二子数据集和第三子数据集均用于表示风速信息与功率信息形成的数对的集合;基于第一子数据集和装机容量,确定上边界函数和下边界函数,上边界函数和下边界函数均用于表示功率信息和风速信息的对应关系;通过上边界函数和下边界函数对第一数据集进行筛选,得到第二数据集。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的风电机组功率预测模型样本集的获取方法,该方法包括:将第一数据集分割成第一子数据集、第二子数据集和第三子数据集,其中,第一数据集、第一子数据集、第二子数据集和第三子数据集均用于表示风速信息与功率信息形成的数对的集合;基于第一子数据集和装机容量,确定上边界函数和下边界函数,上边界函数和下边界函数均用于表示功率信息和风速信息的对应关系;通过上边界函数和下边界函数对第一数据集进行筛选,得到第二数据集。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种风电机组功率预测模型样本集的获取方法,其特征在于,包括:
将第一数据集分割成第一子数据集、第二子数据集和第三子数据集,其中,所述第一数据集、所述第一子数据集、所述第二子数据集和所述第三子数据集均用于表示风速信息与功率信息形成的数对的集合;
基于所述第一子数据集和装机容量,确定上边界函数和下边界函数,所述上边界函数和所述下边界函数均用于表示功率信息和风速信息的对应关系;
通过所述上边界函数和所述下边界函数对所述第一数据集进行筛选,得到第二数据集。
2.根据权利要求1所述的风电机组功率预测模型样本集的获取方法,其特征在于,所述通过所述上边界函数和所述下边界函数对所述第一数据集进行筛选,得到第二数据集,包括:
通过所述上边界函数和所述下边界函数对所述第一子数据集和所述第二子数据集进行筛选,得到第一目标数据集;
通过所述下边界函数对所述第三子数据集进行筛选,得到第二目标数据集;
基于所述第一目标数据集和所述第二目标数据集,得到所述第二数据集。
3.根据权利要求2所述的风电机组功率预测模型样本集的获取方法,其特征在于,所述通过所述上边界函数和所述下边界函数对所述第一子数据集和所述第二子数据集进行筛选,得到第一目标数据集,包括:
将所述第一子数据集和所述第二子数据集中数对的风速信息分别代入所述上边界函数和所述下边界函数,得到第一功率信息p1和第二功率信息p2;
将所述第一子数据集和所述第二子数据集中的第一目标数对组成所述第一目标数据集,所述第一目标数对中的功率信息p满足p2≤p≤p1。
4.根据权利要求2所述的风电机组功率预测模型样本集的获取方法,其特征在于,所述通过所述下边界函数对所述第三子数据集进行筛选,得到第二目标数据集,包括:
将所述第三子数据集中数对的功率信息代入所述下边界函数,得到第一风速信息x’;
将所述第三子数据集中的第二目标数对组成所述第二目标数据集,所述第二目标数对中的风速信息x满足x≥x’。
5.根据权利要求1-4中任一项所述的风电机组功率预测模型样本集的获取方法,其特征在于,所述基于所述第一子数据集和装机容量,确定上边界函数和下边界函数,包括:
基于所述第一子数据集,确定第三目标数对,所述第三目标数对用于表示所述第一子数据集中功率密度堆积区间的数对集合;
基于所述第三目标数对,确定初始边界函数;所述初始边界函数用于表示功率信息和风速信息的对应关系;
基于所述初始边界函数和所述装机容量,确定所述上边界函数和所述下边界函数。
6.根据权利要求5所述的风电机组功率预测模型样本集的获取方法,其特征在于,所述基于所述第三目标数对,确定初始边界函数,包括:
将所述第三目标数对中的功率信息按照从小到大的顺序排序;
按照功率信息的大小对所述第三目标数对中的数对进行复制,得到扩增数对数量后的第三数据集,其中,功率信息越小的数对复制的数量越多;
基于所述第三数据集,确定所述初始边界函数。
7.根据权利要求1-4中任一项所述的风电机组功率预测模型样本集的获取方法,其特征在于,所述风速信息用于表示风速值的平方值。
8.一种功率预测模型的训练方法,其特征在于,包括:
以如权利要求1-7中任一项所述的风电机组功率预测模型样本集的获取方法获取的第二数据集为训练样本集,对所述功率预测模型进行训练。
9.一种风电机组的功率预测方法,其特征在于,包括:
将待预测风速信息输入如权利要求8中所述的功率预测模型的训练方法训练得到的功率预测模型,得到所述功率预测模型输出的预测功率信息。
10.一种风电机组功率预测模型样本集的获取装置,其特征在于,包括:
第一处理模块,用于将第一数据集分割成第一子数据集、第二子数据集和第三子数据集,其中,所述第一数据集、所述第一子数据集、所述第二子数据集和所述第三子数据集均用于表示风速信息与功率信息形成的数对的集合;
第二处理模块,用于基于所述第一子数据集和装机容量,确定上边界函数和下边界函数,所述上边界函数和所述下边界函数均用于表示功率信息和风速信息的对应关系;
第三处理模块,用于通过所述上边界函数和所述下边界函数对所述第一数据集进行筛选,得到第二数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210012553.3A CN114091354B (zh) | 2022-01-07 | 2022-01-07 | 风电机组功率预测模型样本集的获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210012553.3A CN114091354B (zh) | 2022-01-07 | 2022-01-07 | 风电机组功率预测模型样本集的获取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114091354A true CN114091354A (zh) | 2022-02-25 |
CN114091354B CN114091354B (zh) | 2022-05-17 |
Family
ID=80308385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210012553.3A Active CN114091354B (zh) | 2022-01-07 | 2022-01-07 | 风电机组功率预测模型样本集的获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114091354B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991508A (zh) * | 2017-05-25 | 2017-07-28 | 华北电力大学 | 一种基于dbscan的风电机组运行状态识别方法 |
CN108412710A (zh) * | 2018-01-30 | 2018-08-17 | 同济大学 | 一种风电机组风功率数据清洗方法 |
CN108763584A (zh) * | 2018-06-11 | 2018-11-06 | 北京天泽智云科技有限公司 | 一种风功率曲线散点过滤的方法及其系统 |
CN110134919A (zh) * | 2019-04-30 | 2019-08-16 | 华北电力大学 | 风电机组异常数据清洗方法 |
CN113626990A (zh) * | 2021-07-19 | 2021-11-09 | 许昌许继风电科技有限公司 | 基于风功率预测测风塔的风电机组功率曲线验证方法 |
-
2022
- 2022-01-07 CN CN202210012553.3A patent/CN114091354B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991508A (zh) * | 2017-05-25 | 2017-07-28 | 华北电力大学 | 一种基于dbscan的风电机组运行状态识别方法 |
CN108412710A (zh) * | 2018-01-30 | 2018-08-17 | 同济大学 | 一种风电机组风功率数据清洗方法 |
CN108763584A (zh) * | 2018-06-11 | 2018-11-06 | 北京天泽智云科技有限公司 | 一种风功率曲线散点过滤的方法及其系统 |
CN110134919A (zh) * | 2019-04-30 | 2019-08-16 | 华北电力大学 | 风电机组异常数据清洗方法 |
CN113626990A (zh) * | 2021-07-19 | 2021-11-09 | 许昌许继风电科技有限公司 | 基于风功率预测测风塔的风电机组功率曲线验证方法 |
Non-Patent Citations (1)
Title |
---|
SHUAI WANG ET AL.: "Short-term wind power prediction based on multidimensional data cleaning and feature reconfiguration", 《APPLIED ENERGY》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114091354B (zh) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110685857A (zh) | 一种基于集成学习的山地风电机组行为预测模型 | |
CN109670213B (zh) | 一种风电场多机等值建模方法及装置 | |
CN109004679B (zh) | 一种可再生能源接入的电网安全稳定监控方法 | |
CN109471847B (zh) | 一种i/o拥塞控制方法及控制系统 | |
CN109447441B (zh) | 一种考虑新能源机组不确定性的暂态稳定风险评估方法 | |
CN106897945A (zh) | 风力发电机组的聚类方法和设备 | |
CN104268576A (zh) | 一种基于tnn-svm的电力系统暂态稳定分类方法 | |
Xue et al. | Adaptive ultra-short-term wind power prediction based on risk assessment | |
CN111177128A (zh) | 基于改进的离群点检测算法的计量大数据批量处理方法及系统 | |
CN114091354B (zh) | 风电机组功率预测模型样本集的获取方法及装置 | |
CN112633315A (zh) | 一种电力系统扰动分类方法 | |
CN108921452B (zh) | 一种基于模糊算法的输电线路风险评估复合预警方法 | |
Sharma et al. | A semi-supervised generalized vae framework for abnormality detection using one-class classification | |
CN112036718B (zh) | 一种考虑新能源不确定性的电力系统安全风险评估方法 | |
CN111091141B (zh) | 一种基于分层Softmax的光伏背板故障诊断方法 | |
CN111931990A (zh) | 基于优化最小二乘支持向量机的电力负荷预测方法 | |
CN111898446A (zh) | 基于多算法归一化分析的单相接地故障研判方法 | |
CN112085335A (zh) | 一种用于配电网故障预测的改进随机森林算法 | |
CN112855458A (zh) | 一种风力发电机组的风速仪故障诊断方法、系统及介质 | |
CN115840920A (zh) | 光伏组串单日可分异常分类方法、装置、设备及存储介质 | |
CN115454863A (zh) | 一种软件缺陷预测方法和系统 | |
CN113268552B (zh) | 一种基于局部敏感哈希的发电机设备隐患预警方法 | |
CN115687788A (zh) | 一种智能化商机推荐方法和系统 | |
CN107784015B (zh) | 一种基于电力系统在线历史数据的数据约简方法 | |
CN111931861A (zh) | 一种异质性数据集的异常检测方法及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |