CN114020729A - 一种基于风机功率曲线的风电场功率数据清洗方法 - Google Patents

一种基于风机功率曲线的风电场功率数据清洗方法 Download PDF

Info

Publication number
CN114020729A
CN114020729A CN202111225106.8A CN202111225106A CN114020729A CN 114020729 A CN114020729 A CN 114020729A CN 202111225106 A CN202111225106 A CN 202111225106A CN 114020729 A CN114020729 A CN 114020729A
Authority
CN
China
Prior art keywords
wind speed
power
data
wind
curve
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111225106.8A
Other languages
English (en)
Inventor
史仍辉
李义强
张洪鑫
周彦彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MingYang Smart Energy Group Co Ltd
Original Assignee
MingYang Smart Energy Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MingYang Smart Energy Group Co Ltd filed Critical MingYang Smart Energy Group Co Ltd
Priority to CN202111225106.8A priority Critical patent/CN114020729A/zh
Publication of CN114020729A publication Critical patent/CN114020729A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Abstract

本发明公开了一种基于风机功率曲线的风电场功率数据清洗方法,包括:1)根据风机切入风速Vi、额定风速Vr和切出风速Vo,将风速区间分为三段;2)根据风机技术资料中的“风速‑功率”曲线数据拟合在三个风速区间内风电场整场的“风速‑功率”曲线Pwfr(v);3)对风电场在三个风速区间内原始的整场风速‑功率数据集W,使用Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速‑功率偏差大于阈值的数据后,对三个风速区间分段拟合风电场整场的“风速‑功率”拟合曲线Po(v);4)对数据集W,使用Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。本发明方法简单可靠、高效且通用性强。

Description

一种基于风机功率曲线的风电场功率数据清洗方法
技术领域
本发明涉及风力发电大数据的技术领域,尤其是指一种基于风机功率曲线的风电场功率数据清洗方法。
背景技术
新能源的发展已经成为推动全球能源转型的重要力量,是全球绿色低碳转型的重要方向。由于风能的随机波动性、间歇性、不可控性等,其大规模并入电网,其发电量和输出功率随机性较大,接入电网后对电网的安全和管理可能带来一系列的问题,将给电力系统的生产和运行带来极大的挑战。因此需要对风力发电场的输出功率进行科学预测,以便合理安排运行方式和应对措施,充分利用风能资源,降低风力接入对电网的不利影响,提高电网运行的安全性和稳定性,提高电网接纳风电的能力,减少电力系统的运行成本,提升经济效益和社会效益。
准确获得风电场实际运行的风速和功率数据,能够为风电场的输出功率预测、经济安全运行和优化控制策略提供根本的数据支撑。但是在风电场运行过程中,由于机组停机、减载、设备故障和限功率运行等因素,会产生大量异常数据。如果这些数据不经处理直接使用,得到的风力发电统计特性会发生畸变,会影响风电场的输出功率预测和运行特性分析结果等。为了提高数据质量,数据清洗已成为数据挖掘过程中不可或缺的环节。目前,应用较广泛的聚类、统计模型等数据挖掘方法,其清洗过程较为繁琐,清洗条件苛刻。考虑到风电场实际功率曲线复杂多变的特点,传统的数据清洗方法普遍缺乏通用性,且当只存在风速和功率两个数据维度或者缺少历史训练数据时,大部分数据清洗方法失效。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于风机功率曲线的风电场功率数据清洗方法,该方法简单可靠、高效且通用性强。
为实现上述目的,本发明所提供的技术方案为:一种基于风机功率曲线的风电场功率数据清洗方法,包括以下步骤:
步骤1:根据风机切入风速Vi、额定风速Vr和切出风速Vo,将风速区间分为三段:
Figure BDA0003313928510000021
其中,Vi、Vr、Vo和v为风速值,单位m/s;
步骤2:根据风机技术资料中的“风速-功率”曲线数据拟合在三个风速区间内风电场整场的“风速-功率”曲线Pwfr(v);
步骤3:对风电场在三个风速区间内原始的整场风速-功率数据集W,其中风速为风电场所有风机机舱风速的平均值,功率为风电场所有风机输出功率之和;使用步骤2中的曲线Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速-功率偏差大于阈值的数据后,对三个风速区间分段拟合风电场整场的“风速-功率”拟合曲线Po(v);
数据集W表示如下:
W={(v1,p1),…,(vi,pi),…,(vn,pn)}
其中,vi表示第i个数据点的风速,pi表示第i个数据点的功率,i=1,2,…,n,n为数据集W中风速-功率数据点的总数;
步骤4:对步骤3中的数据集W,使用步骤3中的曲线Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。
进一步,所述步骤2的具体过程如下:
步骤2.1:根据风机技术资料中切入风速Vi和额定风速Vr区间内“风速-功率”数据,使用多项式拟合的方法拟合风速区间2内风机单机的“风速-功率”拟合曲线Pwtr(v);
步骤2.2:再根据风电场内风机数量Nwt分段得到三个风速区间内风电场整场的“风速-功率”拟合曲线Pwfr(v)如下:
Figure BDA0003313928510000031
其中,Pwtr(Vr)为风机单机在额定风速Vr时拟合曲线Pwtr(v)的拟合功率值。
进一步,所述步骤3的具体过程如下:
步骤3.1:风电场在风速区间2内原始的整场风速-功率子数据集W2表示如下:
W2={(v1,p1),…,(vj,pj),…,(vm,pm)}
其中,vj表示第j个数据点的风速,pj表示第j个数据点的功率,j=1,2,…,m,m为子数据集W2中风速-功率数据点的总个数;
对子数据集W2使用步骤2中的曲线Pwfr(v)进行数据清洗,剔除风速-功率偏差大于阈值的数据,得到清洗后的数据Wdc2,子数据集W2内的风速-功率数据点(vj,pj)剔除规则如下:
Figure BDA0003313928510000032
其中,Pwfr(vj)为风电场在在风速vj时拟合曲线Pwfr(v)的拟合功率值;c为数据清洗判断阈值,能够根据风电场装机容量动态调整;
步骤3.2:对步骤3.1清洗后的数据Wdc2,使用多项式拟合的方法拟合风速区间2内风电场整场的“风速-功率”曲线Pr(v);
步骤3.3:根据步骤3.2拟合的曲线Pr(v)和风机的风速-功率特性,在三个风速区间分段拟合形成“风速-功率”曲线Po(v):
Figure BDA0003313928510000041
其中,Vi为切入风速值、Vr为额定风速值、Vo切出风速值;v为某一时刻的风速值,单位m/s;Pwmax为数据集W中功率最大值,Po(v)为风速v时的拟合功率。
进一步,在步骤4中,数据集W内的风速-功率数据点(vi,pi)数据清洗剔除异常数据的规则如下:
Figure BDA0003313928510000042
其中,Po(vi-1)为风速(vi-1)时的拟合功率;Pwmax为数据集W中功率最大值;c为数据清洗判断阈值。
本发明与现有技术相比,具有如下优点与有益效果:
本发明方法数据清洗过程简单、清洗条件宽松,仅使用风机功率曲线即可完成风电场功率数据清洗,效率极高,且清洗效果佳,具有实际应用价值,值得推广。
附图说明
图1为某风电场2020年全年风速-功率数据散点图。
图2为本发明方法的流程框图。
图3为某风电场风机的“风速-功率”曲线图。
图4为某风电场整场的“风速-功率”拟合曲线图。
图5为某风电场风速区间2内数据集清洗后数据点及拟合曲线图。
图6为某风电场风速区间2内未清洗原始数据点及拟合曲线图。
图7为某风电场风速区间分段拟合的“风速-功率”曲线图。
图8为使用本发明方法进行数据清洗后的效果图。
具体实施方式
下面以对某风电场功率数据进行数据清洗为实施例,详细说明本发明的方法。
某风电场装机容量为49.5MW,安装2MW风机24台、1.5MW风机1台,共25台;其中,2MW风机切入风速为3m/s、额定风速为11m/s、切出风速为25m/s,1.5MW风机切入风速为3m/s、额定风速为11.3m/s、切出风速为25m/s;2MW和1.5MW风机技术参数基本一致,将1台1.5MW风机等效为0.75台2MW风机,则该风电场等效为安装24.75台2MW风机。
该风电场2020年全年风速-功率数据散点如图1所示,可以看出,在曲线下面有堆积和分散的异常数据。
如图2所示,本实施例所提供的基于风机功率曲线的风电场功率数据清洗方法,包括如下步骤:
步骤1:根据风机切入风速Vi、额定风速Vr和切出风速Vo将风速区间分为三段:
Figure BDA0003313928510000061
其中,Vi、Vr、Vo和v为风速值,单位m/s。
本实施例中某风电场风机的切入风速为3m/s、额定风速为11m/s、切出风速为25m/s,其风速区间划分如下:
Figure BDA0003313928510000062
步骤2:根据风机技术资料中的“风速-功率”曲线数据拟合在三个风速区间内风电场整场的“风速-功率”曲线Pwfr(v)。具体如下:
步骤2.1:根据风机技术资料中切入风速Vi和额定风速Vr区间内“风速-功率”数据,使用多项式拟合的方法拟合风速区间2内风机单机的“风速-功率”拟合曲线Pwtr(v);
步骤2.2:再根据风电场内风机数量Nwt分段得到三个风速区间内风电场整场的“风速-功率”拟合曲线Pwfr(v)如下:
Figure BDA0003313928510000063
其中,Pwtr(Vr)为风机单机在额定风速Vr时拟合曲线Pwtr(v)的拟合功率值。
本实施例中某风电场单个风机的“风速-功率”曲线如图3所示。根据图3曲线数据拟合得到的三个风速区间内风电场整场的“风速-功率”拟合曲线Pwfr(v)如图4所示。
步骤3:对风电场在三个风速区间内原始的整场风速-功率(风速为风电场所有风机机舱风速的平均值,功率为风电场所有风机输出功率之和)数据集W,使用步骤2中的曲线Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速-功率偏差过大的数据后,对三个风速区间分段拟合风电场整场的“风速-功率”拟合曲线Po(v)。
数据集W表示如下:
W={(v1,p1),…,(vi,pi),…,(vn,pn)}
其中,vi表示第i个数据点的风速,pi表示第i个数据点的功率,i=1,2,…,n,n为数据集W中风速-功率数据点的总数。具体步骤如下:
步骤3.1:风电场在风速区间2内原始的整场风速-功率子数据集W2表示如下:
W2={(v1,p1),…,(vj,pj),…,(vm,pm)}
其中,vj表示第j个数据点的风速,pj表示第j个数据点的功率,j=1,2,…,m,m为子数据集W2中风速-功率数据点的总个数。
对子数据集W2使用步骤2中的曲线Pwfr(v)进行数据清洗,剔除风速-功率偏差过大的数据,得到清洗后的数据Wdc2,子数据集W2内的风速-功率数据点(vj,pj)剔除规则如下:
Figure BDA0003313928510000071
其中,Pwfr(vj)为风电场在在风速vj时拟合曲线Pwfr(v)的拟合功率值;c为数据清洗判断阈值,能够根据风电场装机容量动态调整。
步骤3.2:对步骤3.1清洗后的数据Wdc2,使用多项式拟合的方法拟合风速区间2内风电场整场的“风速-功率”曲线Pr(v);
步骤3.3:根据步骤3.2拟合的曲线Pr(v)和风机的风速-功率特性,在三个风速区间分段拟合形成“风速-功率”曲线Po(v):
Figure BDA0003313928510000081
其中,Vi为切入风速值、Vr为额定风速值、Vo切出风速值、v为某一时刻的风速值,单位m/s;Pwmax为数据集W中功率最大值,Po(v)为风速v时的拟合功率。
本实施例中某风电场装机容量为49.5MW,数据清洗判断阈值c设置为装机容量的十分之一,即为4.95MW。针对该风电场子数据集W2清洗后数据点及风速区间2内拟合曲线如图5所示。图6为子数据集W2未清洗的原始数据拟合曲线,可以看出,该曲线在高风速(8-11m/s)时拟合值偏小,拟合曲线受到下方异常数据的影响,该拟合曲线无法用于后续的数据清洗。
该风电场2020年数据集W中功率最大值Pwmax为48.23MW,步骤3.3分段拟合的“风速-功率”曲线Po(v)见图7所示。
步骤4:对步骤3中的数据集W,使用步骤3中的曲线Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。
W数据集内的风速-功率数据点(vi,pi)数据清洗剔除异常数据的规则如下:
Figure BDA0003313928510000082
实施例根据图7中分段拟合的“风速-功率”曲线Po(v)及步骤4中异常数据剔除规则清洗后的效果见图8所示,可以看出,依照本发明方法的实施例具有较好的数据清洗效果,值得推广。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (4)

1.一种基于风机功率曲线的风电场功率数据清洗方法,其特征在于,包括以下步骤:
步骤1:根据风机切入风速Vi、额定风速Vr和切出风速Vo,将风速区间分为三段:
Figure FDA0003313928500000011
其中,Vi、Vr、Vo和v为风速值,单位m/s;
步骤2:根据风机技术资料中的“风速-功率”曲线数据拟合在三个风速区间内风电场整场的“风速-功率”曲线Pwfr(v);
步骤3:对风电场在三个风速区间内原始的整场风速-功率数据集W,其中风速为风电场所有风机机舱风速的平均值,功率为风电场所有风机输出功率之和;使用步骤2中的曲线Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速-功率偏差大于阈值的数据后,对三个风速区间分段拟合风电场整场的“风速-功率”拟合曲线Po(v);
数据集W表示如下:
W={(v1,p1),…,(vi,pi),…,(vn,pn)}
其中,vi表示第i个数据点的风速,pi表示第i个数据点的功率,i=1,2,…,n,n为数据集W中风速-功率数据点的总数;
步骤4:对步骤3中的数据集W,使用步骤3中的曲线Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。
2.根据权利要求1所述的一种基于风机功率曲线的风电场功率数据清洗方法,其特征在于,所述步骤2的具体过程如下:
步骤2.1:根据风机技术资料中切入风速Vi和额定风速Vr区间内“风速-功率”数据,使用多项式拟合的方法拟合风速区间2内风机单机的“风速-功率”拟合曲线Pwtr(v);
步骤2.2:再根据风电场内风机数量Nwt分段得到三个风速区间内风电场整场的“风速-功率”拟合曲线Pwfr(v)如下:
Figure FDA0003313928500000021
其中,Pwtr(Vr)为风机单机在额定风速Vr时拟合曲线Pwtr(v)的拟合功率值。
3.根据权利要求1所述的一种基于风机功率曲线的风电场功率数据清洗方法,其特征在于,所述步骤3的具体过程如下:
步骤3.1:风电场在风速区间2内原始的整场风速-功率子数据集W2表示如下:
W2={(v1,p1),…,(vj,pj),…,(vm,pm)}
其中,vj表示第j个数据点的风速,pj表示第j个数据点的功率,j=1,2,…,m,m为子数据集W2中风速-功率数据点的总个数;
对子数据集W2使用步骤2中的曲线Pwfr(v)进行数据清洗,剔除风速-功率偏差大于阈值的数据,得到清洗后的数据Wdc2,子数据集W2内的风速-功率数据点(vj,pj)剔除规则如下:
Figure FDA0003313928500000022
其中,Pwfr(vj)为风电场在在风速vj时拟合曲线Pwfr(v)的拟合功率值;c为数据清洗判断阈值,能够根据风电场装机容量动态调整;
步骤3.2:对步骤3.1清洗后的数据Wdc2,使用多项式拟合的方法拟合风速区间2内风电场整场的“风速-功率”曲线Pr(v);
步骤3.3:根据步骤3.2拟合的曲线Pr(v)和风机的风速-功率特性,在三个风速区间分段拟合形成“风速-功率”曲线Po(v):
Figure FDA0003313928500000031
其中,Vi为切入风速值、Vr为额定风速值、Vo切出风速值;v为某一时刻的风速值,单位m/s;Pwmax为数据集W中功率最大值,Po(v)为风速v时的拟合功率。
4.根据权利要求1所述的一种基于风机功率曲线的风电场功率数据清洗方法,其特征在于,在步骤4中,数据集W内的风速-功率数据点(vi,pi)数据清洗剔除异常数据的规则如下:
Figure FDA0003313928500000032
其中,Po(vi-1)为风速(vi-1)时的拟合功率;Pwmax为数据集W中功率最大值;c为数据清洗判断阈值。
CN202111225106.8A 2021-10-21 2021-10-21 一种基于风机功率曲线的风电场功率数据清洗方法 Pending CN114020729A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111225106.8A CN114020729A (zh) 2021-10-21 2021-10-21 一种基于风机功率曲线的风电场功率数据清洗方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111225106.8A CN114020729A (zh) 2021-10-21 2021-10-21 一种基于风机功率曲线的风电场功率数据清洗方法

Publications (1)

Publication Number Publication Date
CN114020729A true CN114020729A (zh) 2022-02-08

Family

ID=80056879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111225106.8A Pending CN114020729A (zh) 2021-10-21 2021-10-21 一种基于风机功率曲线的风电场功率数据清洗方法

Country Status (1)

Country Link
CN (1) CN114020729A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114969017A (zh) * 2022-07-28 2022-08-30 深圳量云能源网络科技有限公司 风功率数据清洗方法、清洗装置及预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114969017A (zh) * 2022-07-28 2022-08-30 深圳量云能源网络科技有限公司 风功率数据清洗方法、清洗装置及预测方法

Similar Documents

Publication Publication Date Title
WO2023020524A1 (zh) 一种风电机组切入/切出风速调优方法、系统及设备介质
CN106815771B (zh) 一种风电场载荷的长期评估方法
CN110159484B (zh) 基于风电场场级能量控制的风电机群启停机控制方法
CN110533092B (zh) 一种基于运行工况的风力发电机组scada数据分类方法及应用
CN113555881A (zh) 一种风电场调频风机排序方法
CN111062617A (zh) 一种海上风电出力特性分析方法及系统
CN114091265A (zh) 一种基于局部搜索策略的风电场布局优化方法及系统
CN114020729A (zh) 一种基于风机功率曲线的风电场功率数据清洗方法
CN108988381B (zh) 风力发电机组低电压穿越控制方法、装置及系统
CN114386718A (zh) 一种结合粒子群神经网络的风电场输出功率短时预测算法
CN103915855A (zh) 一种降低风电机组机械损耗的风电场内优化调度方法
CN113339207A (zh) 一种风电机组主传动系统的运行工况划分方法及系统
Ma et al. A study of fault statistical analysis and maintenance policy of wind turbine system
CN116451454A (zh) 一种基于风-浪资源的风机和波浪能装置联合开发最优配置选型方法
Su et al. A coordinative optimization method of active power and fatigue distribution in onshore wind farms
CN116050072A (zh) 一种基于随机采样一致性的风电机组理论功率曲线识别方法和装置
CN111178601B (zh) 一种基于气象数据后处理的风电机组功率预测方法
CN115392560A (zh) 一种基于决策树的变流器故障预测方法和系统
CN110334951B (zh) 一种风电机组高温降容状态的智能评估方法及系统
CN114623051A (zh) 一种风电叶片覆冰状态智能识别及预警方法
CN110808614B (zh) 新能源消纳能力计算方法、系统及存储介质
CN109779836B (zh) 一种基于遗传算法寻优的风力发电机组发电量提升方法
Lou et al. A data-mining approach for wind turbine power generation performance monitoring based on power curve
Yin et al. Research on Wind Deviation Detection Based on DENCLUE Abnormal Working Condition Filtering
CN112906928B (zh) 一种风电场集群有功功率预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination