CN114020729A - 一种基于风机功率曲线的风电场功率数据清洗方法 - Google Patents
一种基于风机功率曲线的风电场功率数据清洗方法 Download PDFInfo
- Publication number
- CN114020729A CN114020729A CN202111225106.8A CN202111225106A CN114020729A CN 114020729 A CN114020729 A CN 114020729A CN 202111225106 A CN202111225106 A CN 202111225106A CN 114020729 A CN114020729 A CN 114020729A
- Authority
- CN
- China
- Prior art keywords
- wind speed
- power
- data
- wind
- curve
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
Abstract
本发明公开了一种基于风机功率曲线的风电场功率数据清洗方法,包括:1)根据风机切入风速Vi、额定风速Vr和切出风速Vo,将风速区间分为三段;2)根据风机技术资料中的“风速‑功率”曲线数据拟合在三个风速区间内风电场整场的“风速‑功率”曲线Pwfr(v);3)对风电场在三个风速区间内原始的整场风速‑功率数据集W,使用Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速‑功率偏差大于阈值的数据后,对三个风速区间分段拟合风电场整场的“风速‑功率”拟合曲线Po(v);4)对数据集W,使用Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。本发明方法简单可靠、高效且通用性强。
Description
技术领域
本发明涉及风力发电大数据的技术领域,尤其是指一种基于风机功率曲线的风电场功率数据清洗方法。
背景技术
新能源的发展已经成为推动全球能源转型的重要力量,是全球绿色低碳转型的重要方向。由于风能的随机波动性、间歇性、不可控性等,其大规模并入电网,其发电量和输出功率随机性较大,接入电网后对电网的安全和管理可能带来一系列的问题,将给电力系统的生产和运行带来极大的挑战。因此需要对风力发电场的输出功率进行科学预测,以便合理安排运行方式和应对措施,充分利用风能资源,降低风力接入对电网的不利影响,提高电网运行的安全性和稳定性,提高电网接纳风电的能力,减少电力系统的运行成本,提升经济效益和社会效益。
准确获得风电场实际运行的风速和功率数据,能够为风电场的输出功率预测、经济安全运行和优化控制策略提供根本的数据支撑。但是在风电场运行过程中,由于机组停机、减载、设备故障和限功率运行等因素,会产生大量异常数据。如果这些数据不经处理直接使用,得到的风力发电统计特性会发生畸变,会影响风电场的输出功率预测和运行特性分析结果等。为了提高数据质量,数据清洗已成为数据挖掘过程中不可或缺的环节。目前,应用较广泛的聚类、统计模型等数据挖掘方法,其清洗过程较为繁琐,清洗条件苛刻。考虑到风电场实际功率曲线复杂多变的特点,传统的数据清洗方法普遍缺乏通用性,且当只存在风速和功率两个数据维度或者缺少历史训练数据时,大部分数据清洗方法失效。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于风机功率曲线的风电场功率数据清洗方法,该方法简单可靠、高效且通用性强。
为实现上述目的,本发明所提供的技术方案为:一种基于风机功率曲线的风电场功率数据清洗方法,包括以下步骤:
步骤1:根据风机切入风速Vi、额定风速Vr和切出风速Vo,将风速区间分为三段:
其中,Vi、Vr、Vo和v为风速值,单位m/s;
步骤2:根据风机技术资料中的“风速-功率”曲线数据拟合在三个风速区间内风电场整场的“风速-功率”曲线Pwfr(v);
步骤3:对风电场在三个风速区间内原始的整场风速-功率数据集W,其中风速为风电场所有风机机舱风速的平均值,功率为风电场所有风机输出功率之和;使用步骤2中的曲线Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速-功率偏差大于阈值的数据后,对三个风速区间分段拟合风电场整场的“风速-功率”拟合曲线Po(v);
数据集W表示如下:
W={(v1,p1),…,(vi,pi),…,(vn,pn)}
其中,vi表示第i个数据点的风速,pi表示第i个数据点的功率,i=1,2,…,n,n为数据集W中风速-功率数据点的总数;
步骤4:对步骤3中的数据集W,使用步骤3中的曲线Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。
进一步,所述步骤2的具体过程如下:
步骤2.1:根据风机技术资料中切入风速Vi和额定风速Vr区间内“风速-功率”数据,使用多项式拟合的方法拟合风速区间2内风机单机的“风速-功率”拟合曲线Pwtr(v);
步骤2.2:再根据风电场内风机数量Nwt分段得到三个风速区间内风电场整场的“风速-功率”拟合曲线Pwfr(v)如下:
其中,Pwtr(Vr)为风机单机在额定风速Vr时拟合曲线Pwtr(v)的拟合功率值。
进一步,所述步骤3的具体过程如下:
步骤3.1:风电场在风速区间2内原始的整场风速-功率子数据集W2表示如下:
W2={(v1,p1),…,(vj,pj),…,(vm,pm)}
其中,vj表示第j个数据点的风速,pj表示第j个数据点的功率,j=1,2,…,m,m为子数据集W2中风速-功率数据点的总个数;
对子数据集W2使用步骤2中的曲线Pwfr(v)进行数据清洗,剔除风速-功率偏差大于阈值的数据,得到清洗后的数据Wdc2,子数据集W2内的风速-功率数据点(vj,pj)剔除规则如下:
其中,Pwfr(vj)为风电场在在风速vj时拟合曲线Pwfr(v)的拟合功率值;c为数据清洗判断阈值,能够根据风电场装机容量动态调整;
步骤3.2:对步骤3.1清洗后的数据Wdc2,使用多项式拟合的方法拟合风速区间2内风电场整场的“风速-功率”曲线Pr(v);
步骤3.3:根据步骤3.2拟合的曲线Pr(v)和风机的风速-功率特性,在三个风速区间分段拟合形成“风速-功率”曲线Po(v):
其中,Vi为切入风速值、Vr为额定风速值、Vo切出风速值;v为某一时刻的风速值,单位m/s;Pwmax为数据集W中功率最大值,Po(v)为风速v时的拟合功率。
进一步,在步骤4中,数据集W内的风速-功率数据点(vi,pi)数据清洗剔除异常数据的规则如下:
其中,Po(vi-1)为风速(vi-1)时的拟合功率;Pwmax为数据集W中功率最大值;c为数据清洗判断阈值。
本发明与现有技术相比,具有如下优点与有益效果:
本发明方法数据清洗过程简单、清洗条件宽松,仅使用风机功率曲线即可完成风电场功率数据清洗,效率极高,且清洗效果佳,具有实际应用价值,值得推广。
附图说明
图1为某风电场2020年全年风速-功率数据散点图。
图2为本发明方法的流程框图。
图3为某风电场风机的“风速-功率”曲线图。
图4为某风电场整场的“风速-功率”拟合曲线图。
图5为某风电场风速区间2内数据集清洗后数据点及拟合曲线图。
图6为某风电场风速区间2内未清洗原始数据点及拟合曲线图。
图7为某风电场风速区间分段拟合的“风速-功率”曲线图。
图8为使用本发明方法进行数据清洗后的效果图。
具体实施方式
下面以对某风电场功率数据进行数据清洗为实施例,详细说明本发明的方法。
某风电场装机容量为49.5MW,安装2MW风机24台、1.5MW风机1台,共25台;其中,2MW风机切入风速为3m/s、额定风速为11m/s、切出风速为25m/s,1.5MW风机切入风速为3m/s、额定风速为11.3m/s、切出风速为25m/s;2MW和1.5MW风机技术参数基本一致,将1台1.5MW风机等效为0.75台2MW风机,则该风电场等效为安装24.75台2MW风机。
该风电场2020年全年风速-功率数据散点如图1所示,可以看出,在曲线下面有堆积和分散的异常数据。
如图2所示,本实施例所提供的基于风机功率曲线的风电场功率数据清洗方法,包括如下步骤:
步骤1:根据风机切入风速Vi、额定风速Vr和切出风速Vo将风速区间分为三段:
其中,Vi、Vr、Vo和v为风速值,单位m/s。
本实施例中某风电场风机的切入风速为3m/s、额定风速为11m/s、切出风速为25m/s,其风速区间划分如下:
步骤2:根据风机技术资料中的“风速-功率”曲线数据拟合在三个风速区间内风电场整场的“风速-功率”曲线Pwfr(v)。具体如下:
步骤2.1:根据风机技术资料中切入风速Vi和额定风速Vr区间内“风速-功率”数据,使用多项式拟合的方法拟合风速区间2内风机单机的“风速-功率”拟合曲线Pwtr(v);
步骤2.2:再根据风电场内风机数量Nwt分段得到三个风速区间内风电场整场的“风速-功率”拟合曲线Pwfr(v)如下:
其中,Pwtr(Vr)为风机单机在额定风速Vr时拟合曲线Pwtr(v)的拟合功率值。
本实施例中某风电场单个风机的“风速-功率”曲线如图3所示。根据图3曲线数据拟合得到的三个风速区间内风电场整场的“风速-功率”拟合曲线Pwfr(v)如图4所示。
步骤3:对风电场在三个风速区间内原始的整场风速-功率(风速为风电场所有风机机舱风速的平均值,功率为风电场所有风机输出功率之和)数据集W,使用步骤2中的曲线Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速-功率偏差过大的数据后,对三个风速区间分段拟合风电场整场的“风速-功率”拟合曲线Po(v)。
数据集W表示如下:
W={(v1,p1),…,(vi,pi),…,(vn,pn)}
其中,vi表示第i个数据点的风速,pi表示第i个数据点的功率,i=1,2,…,n,n为数据集W中风速-功率数据点的总数。具体步骤如下:
步骤3.1:风电场在风速区间2内原始的整场风速-功率子数据集W2表示如下:
W2={(v1,p1),…,(vj,pj),…,(vm,pm)}
其中,vj表示第j个数据点的风速,pj表示第j个数据点的功率,j=1,2,…,m,m为子数据集W2中风速-功率数据点的总个数。
对子数据集W2使用步骤2中的曲线Pwfr(v)进行数据清洗,剔除风速-功率偏差过大的数据,得到清洗后的数据Wdc2,子数据集W2内的风速-功率数据点(vj,pj)剔除规则如下:
其中,Pwfr(vj)为风电场在在风速vj时拟合曲线Pwfr(v)的拟合功率值;c为数据清洗判断阈值,能够根据风电场装机容量动态调整。
步骤3.2:对步骤3.1清洗后的数据Wdc2,使用多项式拟合的方法拟合风速区间2内风电场整场的“风速-功率”曲线Pr(v);
步骤3.3:根据步骤3.2拟合的曲线Pr(v)和风机的风速-功率特性,在三个风速区间分段拟合形成“风速-功率”曲线Po(v):
其中,Vi为切入风速值、Vr为额定风速值、Vo切出风速值、v为某一时刻的风速值,单位m/s;Pwmax为数据集W中功率最大值,Po(v)为风速v时的拟合功率。
本实施例中某风电场装机容量为49.5MW,数据清洗判断阈值c设置为装机容量的十分之一,即为4.95MW。针对该风电场子数据集W2清洗后数据点及风速区间2内拟合曲线如图5所示。图6为子数据集W2未清洗的原始数据拟合曲线,可以看出,该曲线在高风速(8-11m/s)时拟合值偏小,拟合曲线受到下方异常数据的影响,该拟合曲线无法用于后续的数据清洗。
该风电场2020年数据集W中功率最大值Pwmax为48.23MW,步骤3.3分段拟合的“风速-功率”曲线Po(v)见图7所示。
步骤4:对步骤3中的数据集W,使用步骤3中的曲线Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。
W数据集内的风速-功率数据点(vi,pi)数据清洗剔除异常数据的规则如下:
实施例根据图7中分段拟合的“风速-功率”曲线Po(v)及步骤4中异常数据剔除规则清洗后的效果见图8所示,可以看出,依照本发明方法的实施例具有较好的数据清洗效果,值得推广。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (4)
1.一种基于风机功率曲线的风电场功率数据清洗方法,其特征在于,包括以下步骤:
步骤1:根据风机切入风速Vi、额定风速Vr和切出风速Vo,将风速区间分为三段:
其中,Vi、Vr、Vo和v为风速值,单位m/s;
步骤2:根据风机技术资料中的“风速-功率”曲线数据拟合在三个风速区间内风电场整场的“风速-功率”曲线Pwfr(v);
步骤3:对风电场在三个风速区间内原始的整场风速-功率数据集W,其中风速为风电场所有风机机舱风速的平均值,功率为风电场所有风机输出功率之和;使用步骤2中的曲线Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速-功率偏差大于阈值的数据后,对三个风速区间分段拟合风电场整场的“风速-功率”拟合曲线Po(v);
数据集W表示如下:
W={(v1,p1),…,(vi,pi),…,(vn,pn)}
其中,vi表示第i个数据点的风速,pi表示第i个数据点的功率,i=1,2,…,n,n为数据集W中风速-功率数据点的总数;
步骤4:对步骤3中的数据集W,使用步骤3中的曲线Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。
3.根据权利要求1所述的一种基于风机功率曲线的风电场功率数据清洗方法,其特征在于,所述步骤3的具体过程如下:
步骤3.1:风电场在风速区间2内原始的整场风速-功率子数据集W2表示如下:
W2={(v1,p1),…,(vj,pj),…,(vm,pm)}
其中,vj表示第j个数据点的风速,pj表示第j个数据点的功率,j=1,2,…,m,m为子数据集W2中风速-功率数据点的总个数;
对子数据集W2使用步骤2中的曲线Pwfr(v)进行数据清洗,剔除风速-功率偏差大于阈值的数据,得到清洗后的数据Wdc2,子数据集W2内的风速-功率数据点(vj,pj)剔除规则如下:
其中,Pwfr(vj)为风电场在在风速vj时拟合曲线Pwfr(v)的拟合功率值;c为数据清洗判断阈值,能够根据风电场装机容量动态调整;
步骤3.2:对步骤3.1清洗后的数据Wdc2,使用多项式拟合的方法拟合风速区间2内风电场整场的“风速-功率”曲线Pr(v);
步骤3.3:根据步骤3.2拟合的曲线Pr(v)和风机的风速-功率特性,在三个风速区间分段拟合形成“风速-功率”曲线Po(v):
其中,Vi为切入风速值、Vr为额定风速值、Vo切出风速值;v为某一时刻的风速值,单位m/s;Pwmax为数据集W中功率最大值,Po(v)为风速v时的拟合功率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111225106.8A CN114020729A (zh) | 2021-10-21 | 2021-10-21 | 一种基于风机功率曲线的风电场功率数据清洗方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111225106.8A CN114020729A (zh) | 2021-10-21 | 2021-10-21 | 一种基于风机功率曲线的风电场功率数据清洗方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114020729A true CN114020729A (zh) | 2022-02-08 |
Family
ID=80056879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111225106.8A Pending CN114020729A (zh) | 2021-10-21 | 2021-10-21 | 一种基于风机功率曲线的风电场功率数据清洗方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114020729A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114969017A (zh) * | 2022-07-28 | 2022-08-30 | 深圳量云能源网络科技有限公司 | 风功率数据清洗方法、清洗装置及预测方法 |
-
2021
- 2021-10-21 CN CN202111225106.8A patent/CN114020729A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114969017A (zh) * | 2022-07-28 | 2022-08-30 | 深圳量云能源网络科技有限公司 | 风功率数据清洗方法、清洗装置及预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023020524A1 (zh) | 一种风电机组切入/切出风速调优方法、系统及设备介质 | |
CN106815771B (zh) | 一种风电场载荷的长期评估方法 | |
CN110159484B (zh) | 基于风电场场级能量控制的风电机群启停机控制方法 | |
CN110533092B (zh) | 一种基于运行工况的风力发电机组scada数据分类方法及应用 | |
CN113555881A (zh) | 一种风电场调频风机排序方法 | |
CN111062617A (zh) | 一种海上风电出力特性分析方法及系统 | |
CN114091265A (zh) | 一种基于局部搜索策略的风电场布局优化方法及系统 | |
CN114020729A (zh) | 一种基于风机功率曲线的风电场功率数据清洗方法 | |
CN108988381B (zh) | 风力发电机组低电压穿越控制方法、装置及系统 | |
CN114386718A (zh) | 一种结合粒子群神经网络的风电场输出功率短时预测算法 | |
CN103915855A (zh) | 一种降低风电机组机械损耗的风电场内优化调度方法 | |
CN113339207A (zh) | 一种风电机组主传动系统的运行工况划分方法及系统 | |
Ma et al. | A study of fault statistical analysis and maintenance policy of wind turbine system | |
CN116451454A (zh) | 一种基于风-浪资源的风机和波浪能装置联合开发最优配置选型方法 | |
Su et al. | A coordinative optimization method of active power and fatigue distribution in onshore wind farms | |
CN116050072A (zh) | 一种基于随机采样一致性的风电机组理论功率曲线识别方法和装置 | |
CN111178601B (zh) | 一种基于气象数据后处理的风电机组功率预测方法 | |
CN115392560A (zh) | 一种基于决策树的变流器故障预测方法和系统 | |
CN110334951B (zh) | 一种风电机组高温降容状态的智能评估方法及系统 | |
CN114623051A (zh) | 一种风电叶片覆冰状态智能识别及预警方法 | |
CN110808614B (zh) | 新能源消纳能力计算方法、系统及存储介质 | |
CN109779836B (zh) | 一种基于遗传算法寻优的风力发电机组发电量提升方法 | |
Lou et al. | A data-mining approach for wind turbine power generation performance monitoring based on power curve | |
Yin et al. | Research on Wind Deviation Detection Based on DENCLUE Abnormal Working Condition Filtering | |
CN112906928B (zh) | 一种风电场集群有功功率预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |