CN114969017B - 风功率数据清洗方法、清洗装置及预测方法 - Google Patents

风功率数据清洗方法、清洗装置及预测方法 Download PDF

Info

Publication number
CN114969017B
CN114969017B CN202210895422.4A CN202210895422A CN114969017B CN 114969017 B CN114969017 B CN 114969017B CN 202210895422 A CN202210895422 A CN 202210895422A CN 114969017 B CN114969017 B CN 114969017B
Authority
CN
China
Prior art keywords
wind speed
data
power
wind
cleaning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210895422.4A
Other languages
English (en)
Other versions
CN114969017A (zh
Inventor
周晓玲
银磊
张瑞光
刘贞贞
覃明文
汤蔚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Liangyun Energy Network Technology Co ltd
Original Assignee
Shenzhen Liangyun Energy Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Liangyun Energy Network Technology Co ltd filed Critical Shenzhen Liangyun Energy Network Technology Co ltd
Priority to CN202210895422.4A priority Critical patent/CN114969017B/zh
Publication of CN114969017A publication Critical patent/CN114969017A/zh
Application granted granted Critical
Publication of CN114969017B publication Critical patent/CN114969017B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/70Wind energy
    • Y02E10/72Wind turbines with rotation axis in wind direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Wind Motors (AREA)

Abstract

本发明涉及风功率预测技术领域,尤其涉及一种风功率数据清洗方法、一种风功率数据清洗装置及一种风功率预测方法。其中,一种风功率数据清洗方法,包括:数据获取步骤,获取并生成原始风速‑风功率数据样本;以及,第一清洗步骤,利用公式1对数据样本进行数据清洗,得出第一清洗数据集。本方案的数据清洗效率高,适用性广,能够准确识别出风功率数据中由于多种因素导致的异常数据并进行清洗,从而获得干净的风功率数据,以用于提高后续的风功率预测精度。

Description

风功率数据清洗方法、清洗装置及预测方法
技术领域
本发明涉及风功率预测技术领域,尤其涉及一种风功率数据清洗方法、一种风功率数据清洗装置及一种风功率预测方法。
背景技术
风功率预测是以风电场的历史功率、历史风速、地形地貌、数值天气预报、风电机组运行状态等数据建立风电场输出功率的预测模型,以风速、功率等数据作为模型的输入,结合风电场机组的设备状态及运行工况,预测风电场未来的功率,以实现电力调度部门对风电调度的要求。
现有技术中,对风功率或风电功率数据进行清洗的主流方法主要基于密度的聚类算法,比如IF、DBSCAN等算法,但这些主流的数据清洗方法无法完全适用于每个风电场的风功率曲线特性,以及由于其他因素导致的异常数据,同时清洗过程较为繁琐,从而导致每预测一个风电场的风功率需要对一个风场进行特定的数据清洗,通用性差。详细有公开号为CN114077924A的中国发明所公开的一种考虑极端大风天气的用于风电功率预测的大风数据增强方法,其仅对极端大风天气下的异常数据进行清洗,使极端大风天气下风电预测功率的误差得到改善。然而,受机组故障、环境变化和监测传感器设备异常等因素的影响,在风力发电的实际过程中产生了大量的异常数据,这些问题都将会干扰到后期风功率预测的精度。
因此,业界亟待一种新的数据清洗方法,能够准确识别出风功率数据中由于如上所述多种因素导致的异常数据并进行清洗,从而获得干净的风功率数据,以提高风功率的预测精度。
发明内容
本发明的目的在于针对现有技术的不足提供一种风功率数据清洗方法、一种风功率数据清洗装置及一种风功率预测方法,旨在能够准确识别出风功率数据中由于如上所述多种因素导致的异常数据并进行清洗,从而获得干净的风功率数据,以提高风功率的预测精度。
本发明通过以下技术方案来实现上述目的:一种风功率数据清洗方法,包括如下步骤:
数据获取步骤:获取历史实测风速数据和实测风功率数据,生成原始风速-风功率数据样本;以及
第一清洗步骤:利用公式1对原始风速-风功率数据样本进行数据清洗,得出第一清洗数据集:
公式1:
Figure DEST_PATH_IMAGE001
其中,
Figure DEST_PATH_IMAGE002
为第
Figure DEST_PATH_IMAGE003
个时刻的整场风速,
Figure DEST_PATH_IMAGE004
为第
Figure 579418DEST_PATH_IMAGE003
个时刻的整场功率,
Figure DEST_PATH_IMAGE005
为额定风速,
Figure DEST_PATH_IMAGE006
为额定功率,
Figure DEST_PATH_IMAGE007
为正常数据集,
Figure DEST_PATH_IMAGE008
为异常数据集,
Figure DEST_PATH_IMAGE009
的参数为
Figure DEST_PATH_IMAGE010
作为本发明进一步的方案:第一清洗步骤的后一步骤还包括:
区间划分步骤:将原始风速-风功率数据样本按照零风速-切入风速、切入风速-额 定风速和额定风速-切出风速依次划分成第一区间
Figure DEST_PATH_IMAGE011
、第二区间
Figure DEST_PATH_IMAGE012
和第三区间
Figure DEST_PATH_IMAGE013
其中,
Figure DEST_PATH_IMAGE014
为切入风速,
Figure 873390DEST_PATH_IMAGE005
为额定风速,
Figure DEST_PATH_IMAGE015
为切出风速;
第二清洗步骤:采用LOF算法分别对第一区间
Figure 246602DEST_PATH_IMAGE011
和第三区间
Figure 172970DEST_PATH_IMAGE013
的第一清洗 数据集进行局部异常点识别,剔除离群点样本,得到异常数据集
Figure DEST_PATH_IMAGE016
以及
第三清洗步骤:对第二区间
Figure 925025DEST_PATH_IMAGE012
的第一清洗数据集进行风速-风功率曲线拟合, 得出曲线拟合方程,利用曲线拟合方程和公式2对第二区间
Figure 403280DEST_PATH_IMAGE012
中的区间
Figure DEST_PATH_IMAGE017
的第一 清洗数据集进行数据清洗,得出异常数据集
Figure DEST_PATH_IMAGE018
和清洗数据集
Figure DEST_PATH_IMAGE019
曲线拟合方程:
Figure DEST_PATH_IMAGE020
公式2:
Figure DEST_PATH_IMAGE021
其中,
Figure 916651DEST_PATH_IMAGE002
是第
Figure 646710DEST_PATH_IMAGE003
个时刻的整场风速,
Figure DEST_PATH_IMAGE022
为整场风速
Figure 253272DEST_PATH_IMAGE002
下的拟合整场功率,
Figure DEST_PATH_IMAGE023
分别为多项式对应的系数,
Figure DEST_PATH_IMAGE024
为三次多项式曲线的常数,
Figure 105690DEST_PATH_IMAGE004
为第
Figure 781391DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 49561DEST_PATH_IMAGE018
为 异常数据集
Figure 979471DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE025
表示单位为
Figure DEST_PATH_IMAGE026
的风速,
Figure DEST_PATH_IMAGE027
表示为在风速
Figure 533949DEST_PATH_IMAGE025
下的拟合功 率。
作为本发明进一步的方案:第三清洗步骤的后一步骤还包括:
第一修正步骤:利用公式3对异常数据集
Figure DEST_PATH_IMAGE028
进行数据修正,得出修正 数据集
Figure DEST_PATH_IMAGE029
公式3:
Figure DEST_PATH_IMAGE030
其中,
Figure 903138DEST_PATH_IMAGE014
为切入风速,
Figure 709420DEST_PATH_IMAGE005
为额定风速,
Figure 274263DEST_PATH_IMAGE015
为切出风速,
Figure 281533DEST_PATH_IMAGE002
为第
Figure 807192DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 72957DEST_PATH_IMAGE004
为第
Figure 711880DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 280265DEST_PATH_IMAGE006
为额定功率,
Figure DEST_PATH_IMAGE031
为异常数据集,
Figure 417854DEST_PATH_IMAGE022
为整场风速
Figure 706884DEST_PATH_IMAGE002
下的 拟合整场功率。
作为本发明进一步的方案:第一修正步骤的后一步骤还包括:
第二修正步骤:利用公式4和公式5对修正数据集
Figure 590526DEST_PATH_IMAGE029
在第三区间
Figure 185937DEST_PATH_IMAGE013
的数据集再 次进行数据修正:
公式4:
Figure DEST_PATH_IMAGE032
公式5:
Figure DEST_PATH_IMAGE033
其中,
Figure 482926DEST_PATH_IMAGE002
为第
Figure 434702DEST_PATH_IMAGE003
个时刻的整场风速,
Figure DEST_PATH_IMAGE034
Figure 110534DEST_PATH_IMAGE002
下的直线拟合整场功率,
Figure DEST_PATH_IMAGE035
Figure DEST_PATH_IMAGE036
Figure 551879DEST_PATH_IMAGE004
为第
Figure 273848DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 419527DEST_PATH_IMAGE006
为额定功率,
Figure 153128DEST_PATH_IMAGE005
为 额定风速,
Figure 361780DEST_PATH_IMAGE015
为切出风速,
Figure 305465DEST_PATH_IMAGE025
表示单位为
Figure 739989DEST_PATH_IMAGE026
的风速,
Figure DEST_PATH_IMAGE037
为修正数据集
Figure 108522DEST_PATH_IMAGE029
中风速
Figure DEST_PATH_IMAGE038
所对应的最小风功率,
Figure DEST_PATH_IMAGE039
为修正数据集
Figure 767036DEST_PATH_IMAGE029
中正常数据集
Figure 588231DEST_PATH_IMAGE007
中的最大风速。
本发明还提供了另一技术方案:一种风功率数据清洗装置,包括:
数据获取模块,用于获取历史实测风速数据和实测风功率数据,生成原始风速-风功率数据样本;
第一数据清洗模块,用于利用公式1对原始风速-风功率数据样本进行数据清洗,得出第一清洗数据集:
公式1:
Figure 685500DEST_PATH_IMAGE001
其中,
Figure 659272DEST_PATH_IMAGE002
为第
Figure 675638DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 593916DEST_PATH_IMAGE004
为第
Figure 370242DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 791996DEST_PATH_IMAGE005
为额定风速,
Figure 265351DEST_PATH_IMAGE006
为额定功率,
Figure 405345DEST_PATH_IMAGE007
为正常数据集,
Figure 985362DEST_PATH_IMAGE008
为异常数据集,
Figure 527202DEST_PATH_IMAGE009
的参数为
Figure 150950DEST_PATH_IMAGE010
作为本发明进一步的方案:该装置还包括:
区间划分模块,用于将原始风速-风功率数据样本按照零风速-切入风速、切入风 速-额定风速和额定风速-切出风速依次划分成第一区间
Figure 43820DEST_PATH_IMAGE011
、第二区间
Figure 161948DEST_PATH_IMAGE012
和第三区 间
Figure 558295DEST_PATH_IMAGE013
其中,
Figure 352944DEST_PATH_IMAGE014
为切入风速,
Figure 467531DEST_PATH_IMAGE005
为额定风速,
Figure 389350DEST_PATH_IMAGE015
为切出风速;
第二数据清洗模块,用于采用LOF算法分别对第一区间
Figure 640203DEST_PATH_IMAGE011
和第三区间
Figure 605754DEST_PATH_IMAGE013
的 第一清洗数据集进行局部异常点识别,剔除离群点样本,得到异常数据集
Figure DEST_PATH_IMAGE040
第三数据清洗模块,用于对第二区间
Figure 614161DEST_PATH_IMAGE012
的第一清洗数据集进行风速-风功率曲 线拟合,得出曲线拟合方程,利用曲线拟合方程和公式2对第二区间
Figure 198726DEST_PATH_IMAGE012
中的区间
Figure 962808DEST_PATH_IMAGE017
的第一清洗数据集进行数据清洗,得出异常数据集
Figure 709047DEST_PATH_IMAGE018
和清洗数据集
Figure 408012DEST_PATH_IMAGE019
曲线拟合方程:
Figure 186481DEST_PATH_IMAGE020
公式2:
Figure 146347DEST_PATH_IMAGE021
其中,
Figure 470012DEST_PATH_IMAGE002
是第
Figure 46487DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 97489DEST_PATH_IMAGE022
为整场风速
Figure 177440DEST_PATH_IMAGE002
下的拟合整场功率,
Figure 672006DEST_PATH_IMAGE023
分别为多项式对应的系数,
Figure 470198DEST_PATH_IMAGE024
为三次多项式曲线的常数,
Figure 324891DEST_PATH_IMAGE004
为第
Figure 259349DEST_PATH_IMAGE003
个时刻的整场功 率,
Figure 924816DEST_PATH_IMAGE018
为异常数据集
Figure 210304DEST_PATH_IMAGE018
Figure 600178DEST_PATH_IMAGE025
表示单位为
Figure 654722DEST_PATH_IMAGE026
的风速,
Figure 491091DEST_PATH_IMAGE027
表示为在风速
Figure 998296DEST_PATH_IMAGE025
下的 拟合功率;
以及
第一数据修正模块,用于利用公式3对异常数据集
Figure 194791DEST_PATH_IMAGE028
进行数据修正, 得出修正数据集
Figure 369420DEST_PATH_IMAGE029
公式3:
Figure 111111DEST_PATH_IMAGE030
其中,
Figure 371191DEST_PATH_IMAGE014
为切入风速,
Figure 105798DEST_PATH_IMAGE005
为额定风速,
Figure 134934DEST_PATH_IMAGE015
为切出风速,
Figure 47526DEST_PATH_IMAGE002
为第
Figure 794902DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 333200DEST_PATH_IMAGE004
为第
Figure 216842DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 565915DEST_PATH_IMAGE006
为额定功率,
Figure 535008DEST_PATH_IMAGE031
为异常数据集,
Figure 879926DEST_PATH_IMAGE022
为整场风速
Figure 883655DEST_PATH_IMAGE002
下的 拟合整场功率。
作为本发明进一步的方案:该装置还包括:
第二数据修正模块,用于利用公式4和公式5对修正数据集
Figure 138049DEST_PATH_IMAGE029
在第三区间
Figure 594439DEST_PATH_IMAGE013
的 数据集再次进行数据修正:
公式4:
Figure 474539DEST_PATH_IMAGE032
公式5:
Figure 332773DEST_PATH_IMAGE033
其中,
Figure 23649DEST_PATH_IMAGE002
为第
Figure 357547DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 651125DEST_PATH_IMAGE034
Figure 239232DEST_PATH_IMAGE002
下的直线拟合整场功率,
Figure 225643DEST_PATH_IMAGE035
Figure 781258DEST_PATH_IMAGE036
Figure 878527DEST_PATH_IMAGE004
为第
Figure 586720DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 744032DEST_PATH_IMAGE006
为额定功率,
Figure 784014DEST_PATH_IMAGE005
为 额定风速,
Figure 419394DEST_PATH_IMAGE015
为切出风速。
作为本发明的又一种方案:一种风功率预测方法,包括:
确定训练样本步骤:将前述所述的风功率数据清洗方法得到的修正数据集
Figure 982094DEST_PATH_IMAGE029
作 为风功率预测模型的第一训练样本;
预测数据获取步骤:获取待预测时段的风速预测数据;
预测功率输出步骤:将获取到的风速预测数据作为预先训练的风功率预测模型的输入,得到风功率预测模型输出的功率预测数据;
其中,所述预先训练的风功率预测模型采用所述第一训练样本进行模型训练。
作为本发明进一步的方案:一种风功率预测方法,包括:
确定训练样本步骤:将前述所述的风功率数据清洗方法对修正数据集
Figure 700520DEST_PATH_IMAGE029
进行再 次数据修正后得到的数据集作为风功率预测模型的第二训练样本;
预测数据获取步骤:获取待预测时段的风速预测数据;
预测功率输出步骤:将获取到的风速预测数据作为预先训练的风功率预测模型的输入,得到风功率预测模型输出的功率预测数据;
其中,所述预先训练的风功率预测模型采用所述第二训练样本进行模型训练。
本发明还提供了另一技术方案:一种风功率预测方法,包括:
确定训练样本步骤:将前述所述的风功率数据清洗装置对修正数据集
Figure 840514DEST_PATH_IMAGE029
进行再 次数据修正后得到的数据集作为风功率预测模型的第三训练样本;
预测数据获取步骤:获取待预测时段的风速预测数据;
预测功率输出步骤:将获取到的风速预测数据作为预先训练的风功率预测模型的输入,得到风功率预测模型输出的功率预测数据;
其中,所述预先训练的风功率预测模型采用所述第三训练样本进行模型训练。
本发明的有益效果:
本发明的技术方案,通过利用公式1对原始数据进行总体数据清洗,得出第一清洗数据集,以实现数据清洗效果,从而将第一清洗数据集作为干净的数据用于后续的风功率预测。本技术方案的数据清洗效率高,适用性广,能够准确识别出风功率数据中由于多种因素导致的异常数据并进行清洗,从而获得干净的风功率数据,以用于提高后续的风功率预测精度。
附图说明
图1为本发明一种实施例的原始风速-风功率数据样本的曲线示意图。
图2为图1经过第三清洗步骤清洗数据后的数据集曲线示意图。
图3为图2经过第一修正步骤和第二修正步骤进行数据修正后得到的风速-风功率曲线示意图。
图4为本发明一种实施例的流程示意图。
具体实施方式
以下结合附图对本发明进行详细的描述。
如图1~4所示,在本发明实施例中提供了一种风功率数据清洗方法,包括如下步骤:
数据获取步骤:获取历史实测风速数据和实测风功率数据,生成原始风速-风功率数据样本;以及
第一清洗步骤:利用公式1对原始风速-风功率数据样本进行数据清洗,得出第一清洗数据集:
公式1:
Figure 420531DEST_PATH_IMAGE001
其中,
Figure 962371DEST_PATH_IMAGE002
为第
Figure 851699DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 478989DEST_PATH_IMAGE005
为额定风速,
Figure 331538DEST_PATH_IMAGE004
为第
Figure 993464DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 788113DEST_PATH_IMAGE006
为额定功率,
Figure 43645DEST_PATH_IMAGE007
为正常数据集,
Figure 558940DEST_PATH_IMAGE008
为异常数据集,
Figure 468515DEST_PATH_IMAGE009
的参数为
Figure 309432DEST_PATH_IMAGE010
。其中优选
Figure DEST_PATH_IMAGE041
。另外,经过第一清洗步骤得出的第一清洗数据集,此时第一清洗数据集为正常数据 集
Figure 317839DEST_PATH_IMAGE007
本发明的技术方案,通过利用公式1对原始数据进行总体数据清洗,得出第一清洗数据集,以实现数据清洗效果,从而将第一清洗数据集作为干净的数据用于后续的风功率预测。本技术方案的数据清洗效率高,适用性广,能够准确识别出风功率数据中由于多种因素导致的异常数据并进行清洗,从而获得干净的风功率数据,以用于提高后续的风功率预测精度。
在一个实施例中,第一清洗步骤的后一步骤还包括:
区间划分步骤:将原始风速-风功率数据样本按照零风速-切入风速、切入风速-额 定风速和额定风速-切出风速依次划分成第一区间
Figure 292618DEST_PATH_IMAGE011
、第二区间
Figure 663556DEST_PATH_IMAGE012
和第三区间
Figure 550741DEST_PATH_IMAGE013
其中,
Figure 374340DEST_PATH_IMAGE014
为切入风速,
Figure 887230DEST_PATH_IMAGE005
为额定风速,
Figure 253620DEST_PATH_IMAGE015
为切出风速;
第二清洗步骤:采用LOF算法分别对第一区间
Figure 436340DEST_PATH_IMAGE011
和第三区间
Figure 137449DEST_PATH_IMAGE013
的第一清 洗数据集进行局部异常点识别,剔除离群点样本,得到异常数据集
Figure 63816DEST_PATH_IMAGE040
以及
第三清洗步骤:对第二区间
Figure 19134DEST_PATH_IMAGE012
的第一清洗数据集进行风速-风功率曲线拟合, 得出曲线拟合方程,利用曲线拟合方程和公式2对第二区间
Figure 638334DEST_PATH_IMAGE012
中的区间
Figure 558230DEST_PATH_IMAGE017
的第 一清洗数据集进行数据清洗,得出异常数据集
Figure 22709DEST_PATH_IMAGE018
和清洗数据集
Figure 98113DEST_PATH_IMAGE019
曲线拟合方程:
Figure 888214DEST_PATH_IMAGE020
公式2:
Figure 32757DEST_PATH_IMAGE021
其中,
Figure 566506DEST_PATH_IMAGE002
是第
Figure 496416DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 191840DEST_PATH_IMAGE022
为整场风速
Figure 89257DEST_PATH_IMAGE002
下的拟合整场功率,
Figure 161119DEST_PATH_IMAGE023
分别为多项式对应的系数,
Figure 945535DEST_PATH_IMAGE024
为三次多项式曲线的常数,
Figure 343018DEST_PATH_IMAGE004
为第
Figure 196574DEST_PATH_IMAGE003
个时刻的整场功 率,
Figure 72126DEST_PATH_IMAGE018
为异常数据集
Figure 976628DEST_PATH_IMAGE018
Figure 13854DEST_PATH_IMAGE025
表示为
Figure DEST_PATH_IMAGE042
的风速,
Figure 158569DEST_PATH_IMAGE027
表示为在风速
Figure 572233DEST_PATH_IMAGE025
下的拟合功率。具体地,将总的原始数据划分为三个区间,并对三个区间的数据集分 别采用不同的清洗方式再次进行数据清洗,从而得到更为干净的清洗数据,具体为采用LOF 算法对第一区间
Figure 331241DEST_PATH_IMAGE011
和第三区间
Figure 539369DEST_PATH_IMAGE013
的第一清洗数据集进行局部异常点识别,剔除 离群点样本,得到异常数据集
Figure 633096DEST_PATH_IMAGE040
,利用局部离群因子LOF算法对数据集形成的风功率曲线进 行筛选异常值,由于不同区间的数据密度不同,故对
Figure DEST_PATH_IMAGE043
Figure DEST_PATH_IMAGE044
中的正常集 合
Figure 788133DEST_PATH_IMAGE007
(即第一清洗数据集)分别进行LOF算法筛选异常值,最后将筛选到的异常值划分为异 常数据集
Figure 647986DEST_PATH_IMAGE040
。具体地,对于第二区间
Figure 292594DEST_PATH_IMAGE012
,由于风速-风功率曲线拟合的理论曲线是三次 多项式曲线,此处主要是做三次多项式拟合。利用拟合曲线对区间
Figure 624350DEST_PATH_IMAGE017
的风功率数据 再次清洗及筛选异常值,即当
Figure DEST_PATH_IMAGE045
时,整场功率
Figure 35608DEST_PATH_IMAGE004
比前0.5m/s的风速下所对应的 拟合功率小,则判断为异常数据集
Figure 893843DEST_PATH_IMAGE018
,具体表示详见前述公式2。清洗后的总体数据集
Figure 584718DEST_PATH_IMAGE019
包 括整场风速
Figure 262824DEST_PATH_IMAGE002
、整场功率
Figure 884299DEST_PATH_IMAGE004
和该样本所属的数据类型
Figure DEST_PATH_IMAGE046
,其中分别表示异常数据 集
Figure DEST_PATH_IMAGE047
,正常数据集
Figure 49570DEST_PATH_IMAGE007
,则
Figure 911346DEST_PATH_IMAGE019
表示如下:
Figure DEST_PATH_IMAGE048
在一个实施例中,第三清洗步骤的后一步骤还包括:
第一修正步骤:利用公式3对异常数据集
Figure 266629DEST_PATH_IMAGE028
进行数据修正,得出修 正数据集
Figure 239264DEST_PATH_IMAGE029
公式3:
Figure 540932DEST_PATH_IMAGE030
其中,
Figure 88457DEST_PATH_IMAGE014
为切入风速,
Figure 741155DEST_PATH_IMAGE005
为额定风速,
Figure 517482DEST_PATH_IMAGE015
为切出风速,
Figure 204815DEST_PATH_IMAGE002
为第
Figure 657662DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 532077DEST_PATH_IMAGE004
为第
Figure 971148DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 653934DEST_PATH_IMAGE006
为额定功率,
Figure 277682DEST_PATH_IMAGE031
为异常数据集,
Figure 639393DEST_PATH_IMAGE022
为整场风速
Figure 23101DEST_PATH_IMAGE002
下 的拟合整场功率。
在一个实施例中,第一修正步骤的后一步骤还包括:
第二修正步骤:利用公式4和公式5对修正数据集
Figure 419447DEST_PATH_IMAGE029
在第三区间
Figure 89463DEST_PATH_IMAGE013
的数据集 再次进行数据修正:
公式4:
Figure 60175DEST_PATH_IMAGE032
公式5:
Figure 106628DEST_PATH_IMAGE033
其中,
Figure 498426DEST_PATH_IMAGE002
为第
Figure 339343DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 800280DEST_PATH_IMAGE034
Figure 384845DEST_PATH_IMAGE002
下的直线拟合整场功率,
Figure 631150DEST_PATH_IMAGE035
Figure 642969DEST_PATH_IMAGE036
Figure 856781DEST_PATH_IMAGE004
为第
Figure 979458DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 611427DEST_PATH_IMAGE006
为额定功率,
Figure 528568DEST_PATH_IMAGE005
为额定风速,
Figure 964097DEST_PATH_IMAGE015
为切出风速,
Figure 890465DEST_PATH_IMAGE025
表示单位为
Figure 111362DEST_PATH_IMAGE026
的风速,
Figure 464983DEST_PATH_IMAGE037
为修正数据集
Figure 656317DEST_PATH_IMAGE029
中风 速
Figure 120797DEST_PATH_IMAGE038
所对应的最小风功率,
Figure 196200DEST_PATH_IMAGE039
为修正数据集
Figure 720722DEST_PATH_IMAGE029
中正常数据集
Figure 130844DEST_PATH_IMAGE007
中的最大风速。具体 地,采用直线方程对第三区间
Figure 805539DEST_PATH_IMAGE013
中,
Figure 594503DEST_PATH_IMAGE044
的数据集进行最后一次清洗,主要取 两个点建立有关风速-风功率直线方程
Figure DEST_PATH_IMAGE049
,将整场功率
Figure 945719DEST_PATH_IMAGE004
小于
Figure 718503DEST_PATH_IMAGE049
的值判断为异常 值,并赋值为
Figure 931310DEST_PATH_IMAGE006
首先取两个点,第一个点为修正数据集
Figure 964994DEST_PATH_IMAGE029
中风速
Figure 831318DEST_PATH_IMAGE038
和该风速对应的最小风 功率
Figure 825819DEST_PATH_IMAGE037
,第二个点为数据集
Figure 576738DEST_PATH_IMAGE029
中正常数据集
Figure 340294DEST_PATH_IMAGE007
中的最大风速
Figure 764804DEST_PATH_IMAGE039
和风电场的额定功率
Figure 246601DEST_PATH_IMAGE006
,即
Figure DEST_PATH_IMAGE050
Figure DEST_PATH_IMAGE051
直线方程:
Figure DEST_PATH_IMAGE052
其中
Figure 253740DEST_PATH_IMAGE002
表示为第
Figure 12748DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 486455DEST_PATH_IMAGE049
Figure 580182DEST_PATH_IMAGE002
下的直线拟合整场功率,
Figure DEST_PATH_IMAGE053
Figure DEST_PATH_IMAGE054
Figure 735220DEST_PATH_IMAGE044
时,将整场功率
Figure 598002DEST_PATH_IMAGE004
小于直线拟合功率
Figure 242610DEST_PATH_IMAGE049
的值判定为异常值,并 赋值为
Figure 574366DEST_PATH_IMAGE006
,即
公式5:
Figure 329832DEST_PATH_IMAGE033
。因此,完成了整个风电场风功率数据 清洗与修正。
另一种实施例:一种风功率数据清洗装置,包括:
数据获取模块,用于获取历史实测风速数据和实测风功率数据,生成原始风速-风功率数据样本;
第一数据清洗模块,用于利用公式1对原始风速-风功率数据样本进行数据清洗,得出第一清洗数据集:
公式1:
Figure 315630DEST_PATH_IMAGE001
其中,
Figure 865560DEST_PATH_IMAGE002
为第
Figure 684612DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 243769DEST_PATH_IMAGE004
为第
Figure 81144DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 67554DEST_PATH_IMAGE005
为额定风速,
Figure 108323DEST_PATH_IMAGE006
为额定功率,
Figure 205592DEST_PATH_IMAGE007
为正常数据集,
Figure 163052DEST_PATH_IMAGE008
为异常数据集,
Figure 320364DEST_PATH_IMAGE009
的参数为
Figure 848429DEST_PATH_IMAGE010
在一个实施例中,该装置还包括:
区间划分模块,用于将原始风速-风功率数据样本按照零风速-切入风速、切入风 速-额定风速和额定风速-切出风速依次划分成第一区间
Figure 749388DEST_PATH_IMAGE011
、第二区间
Figure 561356DEST_PATH_IMAGE012
和第三 区间
Figure 889569DEST_PATH_IMAGE013
其中,
Figure 904929DEST_PATH_IMAGE014
为切入风速,
Figure 344001DEST_PATH_IMAGE005
为额定风速,
Figure 843482DEST_PATH_IMAGE015
为切出风速;
第二数据清洗模块,用于采用LOF算法分别对第一区间
Figure 342597DEST_PATH_IMAGE011
和第三区间
Figure 845253DEST_PATH_IMAGE013
的第一清洗数据集进行局部异常点识别,剔除离群点样本,得到异常数据集
Figure 88016DEST_PATH_IMAGE040
第三数据清洗模块,用于对第二区间
Figure 608996DEST_PATH_IMAGE012
的第一清洗数据集进行风速-风功率 曲线拟合,得出曲线拟合方程,利用曲线拟合方程和公式2对第二区间
Figure 419957DEST_PATH_IMAGE012
中的区间
Figure 534544DEST_PATH_IMAGE017
的第一清洗数据集进行数据清洗,得出异常数据集
Figure 315418DEST_PATH_IMAGE018
和清洗数据集
Figure 690904DEST_PATH_IMAGE019
曲线拟合方程:
Figure 531821DEST_PATH_IMAGE020
公式2:
Figure 9070DEST_PATH_IMAGE021
其中,
Figure 593635DEST_PATH_IMAGE002
是第
Figure 89208DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 101026DEST_PATH_IMAGE022
为整场风速
Figure 65571DEST_PATH_IMAGE002
下的拟合整场功率,
Figure 188248DEST_PATH_IMAGE023
分别为多项式对应的系数,
Figure 541256DEST_PATH_IMAGE024
为三次多项式曲线的常数,
Figure 989555DEST_PATH_IMAGE004
为第
Figure 175817DEST_PATH_IMAGE003
个时刻的整场功 率,
Figure 102185DEST_PATH_IMAGE018
为异常数据集
Figure 572349DEST_PATH_IMAGE018
Figure 66915DEST_PATH_IMAGE025
表示单位为
Figure 599528DEST_PATH_IMAGE026
的风速,
Figure 329587DEST_PATH_IMAGE027
表示为在风速
Figure 654257DEST_PATH_IMAGE025
下的拟合功率;
以及
第一数据修正模块,用于利用公式3对异常数据集
Figure 178780DEST_PATH_IMAGE028
进行数据修 正,得出修正数据集
Figure 339634DEST_PATH_IMAGE029
公式3:
Figure 998017DEST_PATH_IMAGE030
其中,
Figure 786982DEST_PATH_IMAGE014
为切入风速,
Figure 747984DEST_PATH_IMAGE005
为额定风速,
Figure 396134DEST_PATH_IMAGE015
为切出风速,
Figure 202416DEST_PATH_IMAGE002
为第
Figure 498750DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 506020DEST_PATH_IMAGE004
为第
Figure 500521DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 110494DEST_PATH_IMAGE006
为额定功率,
Figure 264264DEST_PATH_IMAGE031
为异常数据集,
Figure 567069DEST_PATH_IMAGE022
为整场风速
Figure 924232DEST_PATH_IMAGE002
下 的拟合整场功率。
在一个实施例中,该装置还包括:
第二数据修正模块,用于利用公式4和公式5对修正数据集
Figure 337896DEST_PATH_IMAGE029
在第三区间
Figure 346172DEST_PATH_IMAGE013
的数据集再次进行数据修正:
公式4:
Figure 819879DEST_PATH_IMAGE032
公式5:
Figure 664338DEST_PATH_IMAGE033
其中,
Figure 616113DEST_PATH_IMAGE002
为第
Figure 744475DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 389083DEST_PATH_IMAGE034
Figure 720839DEST_PATH_IMAGE002
下的直线拟合整场功率,
Figure 476305DEST_PATH_IMAGE035
Figure 196524DEST_PATH_IMAGE036
Figure 12033DEST_PATH_IMAGE004
为第
Figure 831085DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 390242DEST_PATH_IMAGE006
为额定功率,
Figure 227617DEST_PATH_IMAGE005
为额定风速,
Figure 948448DEST_PATH_IMAGE015
为切出风速。
又一种实施例:一种风功率预测方法,包括:
确定训练样本步骤:将前述所述的风功率数据清洗方法得到的修正数据集
Figure 254796DEST_PATH_IMAGE029
作 为风功率预测模型的第一训练样本;
预测数据获取步骤:获取待预测时段的风速预测数据;
预测功率输出步骤:将获取到的风速预测数据作为预先训练的风功率预测模型的输入,得到风功率预测模型输出的功率预测数据;
其中,所述预先训练的风功率预测模型采用所述第一训练样本进行模型训练。
一种风功率预测方法,包括:
确定训练样本步骤:将前述所述的风功率数据清洗方法对修正数据集
Figure 352065DEST_PATH_IMAGE029
进行再 次数据修正后得到的数据集作为风功率预测模型的第二训练样本;
预测数据获取步骤:获取待预测时段的风速预测数据;
预测功率输出步骤:将获取到的风速预测数据作为预先训练的风功率预测模型的输入,得到风功率预测模型输出的功率预测数据;
其中,所述预先训练的风功率预测模型采用所述第二训练样本进行模型训练。
一种风功率预测方法,包括:
确定训练样本步骤:将前述所述的风功率数据清洗装置对修正数据集
Figure 309525DEST_PATH_IMAGE029
进行再 次数据修正后得到的数据集作为风功率预测模型的第三训练样本;
预测数据获取步骤:获取待预测时段的风速预测数据;
预测功率输出步骤:将获取到的风速预测数据作为预先训练的风功率预测模型的输入,得到风功率预测模型输出的功率预测数据;
其中,所述预先训练的风功率预测模型采用所述第三训练样本进行模型训练。
本发明方法适用性和效率较高,同时可结合每个风电场的风功率曲线特性进行批量清洗,并且具有较好的清洗效果。
具体实施例,下面对某个风电场功率数据进行清洗,作为本发明的优选实例讲解:
某风电场总装机容量(额定功率)为50MW,安装了25台MY2.0风机,MY2.0风机的切入风速为3m/s,额定风速为10.4m/s,切出风速为25m/s。
本实例主要对该风电场2021年全年15分钟为时间分辨率的风功率数据进行清洗,功率以W为单位,风速以m/s为单位,从图1可见该风速-风功率曲线存在许多因限功率等不利因素影响采集到的异常数据,接下来按照上述的步骤对风功率数据进行清洗。
步骤一:根据切入风速、额定风速、切出风速将风速区间划分为以下三部分区间
Figure DEST_PATH_IMAGE055
Figure DEST_PATH_IMAGE056
Figure DEST_PATH_IMAGE057
步骤二:总体数据清洗
(1)不妨设第
Figure 794733DEST_PATH_IMAGE003
个时刻的整场风速为
Figure 713011DEST_PATH_IMAGE002
,第
Figure 489337DEST_PATH_IMAGE003
个时刻的整场功率为
Figure 911091DEST_PATH_IMAGE004
,然后根据以 下的筛选规则标注异常数据集合,表示如下:
Figure DEST_PATH_IMAGE058
(2)分别对整场风速
Figure DEST_PATH_IMAGE059
Figure DEST_PATH_IMAGE060
内的正常数据集使用局部离群因 子LOF算法筛选异常点,并将其异常点归类为异常数据集
Figure 829850DEST_PATH_IMAGE040
(3)在区间
Figure DEST_PATH_IMAGE061
拟合三次多项式风速-风功率曲线,拟合曲线 表达式表示如下:
Figure DEST_PATH_IMAGE062
其中
Figure 32161DEST_PATH_IMAGE002
为第
Figure 736812DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 403285DEST_PATH_IMAGE022
为拟合的整场功率,拟合曲线的R方为 98.6%,可看出该曲线拟合效果很好。
(4)利用上述三次多项式曲线在
Figure DEST_PATH_IMAGE063
区间筛选异常值,如果整 场功率
Figure 308924DEST_PATH_IMAGE004
比前0.5m/s的拟合功率小,则判断为异常值,即满足下列式子,则判断为异常数据 集
Figure 936215DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE064
(5)通过上述筛选后,我们可以筛选出大部分的异常值,可见图2总体数据清洗后的风速-风功率曲线图,大部分的异常数据已经被筛选出来了。
步骤三:风功率数据异常值修正处理,规则如下:
Figure DEST_PATH_IMAGE065
步骤四:采用直线方程对区间
Figure 241294DEST_PATH_IMAGE060
的数据集进行最后一次清洗,首先筛选 两个点,一个点为
Figure DEST_PATH_IMAGE066
,另外一个点为
Figure DEST_PATH_IMAGE067
,可建立的直线方程如下:
Figure DEST_PATH_IMAGE068
其中
Figure 234045DEST_PATH_IMAGE002
为第
Figure 904061DEST_PATH_IMAGE003
时刻的整场风速,
Figure 143282DEST_PATH_IMAGE049
为拟合的整场功率。当
Figure 924156DEST_PATH_IMAGE060
时,若
Figure DEST_PATH_IMAGE069
,则
Figure DEST_PATH_IMAGE070
该风场根据本发明方法进行异常数据清洗后的效果可见图3数据清洗后的风速-风功率曲线图,即包括前述中所述一种风功率预测方法所提及的第二训练样本或第三训练样本,从而可看出本发明方法具有较好的数据清洗效果。
综上所述可知本发明乃具有以上所述的优良特性,得以令其在使用上,增进以往技术中所未有的效能而具有实用性,成为一极具实用价值的产品。
以上内容仅为本发明的较佳实施例,对于本领域的普通技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种风功率数据清洗方法,其特征在于,包括如下步骤:
数据获取步骤:获取历史实测风速数据和实测风功率数据,生成原始风速-风功率数据样本;以及
第一清洗步骤:利用公式1对原始风速-风功率数据样本进行数据清洗,得出第一清洗数据集:
公式1:
Figure 449350DEST_PATH_IMAGE001
其中,
Figure 641297DEST_PATH_IMAGE002
为第
Figure 596614DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 356760DEST_PATH_IMAGE004
为第
Figure 154952DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 760376DEST_PATH_IMAGE005
为额定风速,
Figure 960414DEST_PATH_IMAGE006
为额 定功率,
Figure 625881DEST_PATH_IMAGE007
为正常数据集,
Figure 52315DEST_PATH_IMAGE008
为异常数据集,
Figure 320485DEST_PATH_IMAGE009
的参数为
Figure 247465DEST_PATH_IMAGE010
区间划分步骤:将原始风速-风功率数据样本按照零风速-切入风速、切入风速-额定风 速和额定风速-切出风速依次划分成第一区间
Figure 208468DEST_PATH_IMAGE011
、第二区间
Figure 856618DEST_PATH_IMAGE012
和第三区间
Figure 928479DEST_PATH_IMAGE013
其中,
Figure 978475DEST_PATH_IMAGE014
为切入风速,
Figure 985745DEST_PATH_IMAGE005
为额定风速,
Figure 245825DEST_PATH_IMAGE015
为切出风速;
第二清洗步骤:采用LOF算法分别对第一区间
Figure 731164DEST_PATH_IMAGE011
和第三区间
Figure 25879DEST_PATH_IMAGE013
的第一清洗数 据集进行局部异常点识别,剔除离群点样本,得到异常数据集
Figure 938472DEST_PATH_IMAGE016
以及
第三清洗步骤:对第二区间
Figure 685848DEST_PATH_IMAGE012
的第一清洗数据集进行风速-风功率曲线拟合,得出 曲线拟合方程,利用曲线拟合方程和公式2对第二区间
Figure 974878DEST_PATH_IMAGE012
中的区间
Figure 999466DEST_PATH_IMAGE017
的第一清 洗数据集进行数据清洗,得出异常数据集
Figure 473172DEST_PATH_IMAGE018
和清洗数据集
Figure 320561DEST_PATH_IMAGE019
曲线拟合方程:
Figure 537916DEST_PATH_IMAGE020
公式2:
Figure 417010DEST_PATH_IMAGE021
其中,
Figure 796039DEST_PATH_IMAGE002
是第
Figure 127794DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 24206DEST_PATH_IMAGE022
为整场风速
Figure 882441DEST_PATH_IMAGE002
下的拟合整场功率,
Figure 573316DEST_PATH_IMAGE023
分 别为多项式对应的系数,
Figure 782581DEST_PATH_IMAGE024
为三次多项式曲线的常数,
Figure 217104DEST_PATH_IMAGE004
为第
Figure 805211DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 791622DEST_PATH_IMAGE018
为异 常数据集,
Figure 97970DEST_PATH_IMAGE025
表示单位为
Figure 460818DEST_PATH_IMAGE026
的风速,
Figure 900502DEST_PATH_IMAGE027
表示为在风速
Figure 57814DEST_PATH_IMAGE025
下的拟合功率。
2.根据权利要求1所述的风功率数据清洗方法,其特征在于,第三清洗步骤的后一步骤还包括:
第一修正步骤:利用公式3对异常数据集
Figure 117037DEST_PATH_IMAGE028
进行数据修正,得出修正数 据集
Figure 627784DEST_PATH_IMAGE029
公式3:
Figure 315117DEST_PATH_IMAGE030
其中,
Figure 66166DEST_PATH_IMAGE014
为切入风速,
Figure 338317DEST_PATH_IMAGE005
为额定风速,
Figure 918334DEST_PATH_IMAGE015
为切出风速,
Figure 460174DEST_PATH_IMAGE002
为第
Figure 100234DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 727524DEST_PATH_IMAGE004
为 第
Figure 580074DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 382945DEST_PATH_IMAGE006
为额定功率,
Figure 318540DEST_PATH_IMAGE031
为异常数据集,
Figure 341116DEST_PATH_IMAGE022
为整场风速
Figure 997356DEST_PATH_IMAGE002
下的拟合 整场功率。
3.根据权利要求2所述的风功率数据清洗方法,其特征在于,第一修正步骤的后一步骤还包括:
第二修正步骤:利用公式4和公式5对修正数据集
Figure 654733DEST_PATH_IMAGE029
在第三区间
Figure 495650DEST_PATH_IMAGE013
的数据集再次进 行数据修正:
公式4:
Figure 987548DEST_PATH_IMAGE032
公式5:
Figure 572113DEST_PATH_IMAGE033
其中,
Figure 818417DEST_PATH_IMAGE002
为第
Figure 830236DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 529202DEST_PATH_IMAGE034
Figure 183037DEST_PATH_IMAGE002
下的直线拟合整场功率,
Figure 283848DEST_PATH_IMAGE035
Figure 466568DEST_PATH_IMAGE036
Figure 183988DEST_PATH_IMAGE004
为第
Figure 985722DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 65673DEST_PATH_IMAGE006
为额定功率,
Figure 560240DEST_PATH_IMAGE005
为额定风速,
Figure 358431DEST_PATH_IMAGE015
为 切出风速,
Figure 698277DEST_PATH_IMAGE025
表示单位为
Figure 898314DEST_PATH_IMAGE026
的风速,
Figure 826431DEST_PATH_IMAGE037
为修正数据集
Figure 846340DEST_PATH_IMAGE029
中风速
Figure 255456DEST_PATH_IMAGE038
所对应的最小 风功率,
Figure 486498DEST_PATH_IMAGE039
为修正数据集
Figure 322867DEST_PATH_IMAGE029
中正常数据集
Figure 95651DEST_PATH_IMAGE007
中的最大风速。
4.一种风功率数据清洗装置,其特征在于,包括:
数据获取模块,用于获取历史实测风速数据和实测风功率数据,生成原始风速-风功率数据样本;以及
第一数据清洗模块,用于利用公式1对原始风速-风功率数据样本进行数据清洗,得出第一清洗数据集:
公式1:
Figure 42878DEST_PATH_IMAGE001
其中,
Figure 951928DEST_PATH_IMAGE002
为第
Figure 959199DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 94645DEST_PATH_IMAGE004
为第
Figure 970197DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 874699DEST_PATH_IMAGE005
为额定风速,
Figure 911925DEST_PATH_IMAGE006
为额 定功率,
Figure 797317DEST_PATH_IMAGE007
为正常数据集,
Figure 210981DEST_PATH_IMAGE008
为异常数据集,
Figure 969989DEST_PATH_IMAGE009
的参数为
Figure 584642DEST_PATH_IMAGE010
区间划分模块,用于将原始风速-风功率数据样本按照零风速-切入风速、切入风速-额 定风速和额定风速-切出风速依次划分成第一区间
Figure 694680DEST_PATH_IMAGE011
、第二区间
Figure 912035DEST_PATH_IMAGE012
和第三区间
Figure 525550DEST_PATH_IMAGE013
其中,
Figure 170158DEST_PATH_IMAGE014
为切入风速,
Figure 767492DEST_PATH_IMAGE005
为额定风速,
Figure 522959DEST_PATH_IMAGE015
为切出风速;
第二数据清洗模块,用于采用LOF算法分别对第一区间
Figure 256560DEST_PATH_IMAGE011
和第三区间
Figure 72069DEST_PATH_IMAGE013
的第一 清洗数据集进行局部异常点识别,剔除离群点样本,得到异常数据集
Figure 625541DEST_PATH_IMAGE016
第三数据清洗模块,用于对第二区间
Figure 316855DEST_PATH_IMAGE012
的第一清洗数据集进行风速-风功率曲线拟 合,得出曲线拟合方程,利用曲线拟合方程和公式2对第二区间
Figure 29596DEST_PATH_IMAGE012
中的区间
Figure 891373DEST_PATH_IMAGE017
的 第一清洗数据集进行数据清洗,得出异常数据集
Figure 322354DEST_PATH_IMAGE018
和清洗数据集
Figure 294989DEST_PATH_IMAGE040
曲线拟合方程:
Figure 862237DEST_PATH_IMAGE020
公式2:
Figure 160494DEST_PATH_IMAGE021
其中,
Figure 813192DEST_PATH_IMAGE002
是第
Figure 589518DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 276852DEST_PATH_IMAGE022
为整场风速
Figure 746010DEST_PATH_IMAGE002
下的拟合整场功率,
Figure 761371DEST_PATH_IMAGE023
分 别为多项式对应的系数,
Figure 200442DEST_PATH_IMAGE024
为三次多项式曲线的常数,
Figure 617648DEST_PATH_IMAGE004
为第
Figure 116763DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 616490DEST_PATH_IMAGE018
为异 常数据集,
Figure 124831DEST_PATH_IMAGE025
表示单位为
Figure 662123DEST_PATH_IMAGE026
的风速,
Figure 332139DEST_PATH_IMAGE027
表示为在风速
Figure 56512DEST_PATH_IMAGE025
下的拟合功率;
以及
第一数据修正模块,用于利用公式3对异常数据集
Figure 243911DEST_PATH_IMAGE028
进行数据修正,得出修 正数据集
Figure 494764DEST_PATH_IMAGE029
公式3:
Figure 335681DEST_PATH_IMAGE030
其中,
Figure 812930DEST_PATH_IMAGE014
为切入风速,
Figure 272861DEST_PATH_IMAGE005
为额定风速,
Figure 643800DEST_PATH_IMAGE015
为切出风速,
Figure 530984DEST_PATH_IMAGE002
为第
Figure 620163DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 883785DEST_PATH_IMAGE004
为 第
Figure 374809DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 435825DEST_PATH_IMAGE006
为额定功率,
Figure 746721DEST_PATH_IMAGE031
为异常数据集,
Figure 548455DEST_PATH_IMAGE022
为整场风速
Figure 34931DEST_PATH_IMAGE002
下的拟合 整场功率。
5.根据权利要求4所述的风功率数据清洗装置,其特征在于,该装置还包括:
第二数据修正模块,用于利用公式4和公式5对修正数据集
Figure 388552DEST_PATH_IMAGE029
在第三区间
Figure 62110DEST_PATH_IMAGE013
的数据 集再次进行数据修正:
公式4:
Figure 792168DEST_PATH_IMAGE032
公式5:
Figure 867572DEST_PATH_IMAGE033
其中,
Figure 392094DEST_PATH_IMAGE002
为第
Figure 818527DEST_PATH_IMAGE003
个时刻的整场风速,
Figure 758801DEST_PATH_IMAGE034
Figure 813345DEST_PATH_IMAGE002
下的直线拟合整场功率,
Figure 384135DEST_PATH_IMAGE035
Figure 294934DEST_PATH_IMAGE036
Figure 366796DEST_PATH_IMAGE004
为第
Figure 151212DEST_PATH_IMAGE003
个时刻的整场功率,
Figure 548695DEST_PATH_IMAGE006
为额定功率,
Figure 418562DEST_PATH_IMAGE005
为额定风速,
Figure 435060DEST_PATH_IMAGE015
为 切出风速。
6.一种风功率预测方法,其特征在于,包括:
确定训练样本步骤:将权利要求2所述的风功率数据清洗方法得到的修正数据集
Figure 198616DEST_PATH_IMAGE029
作 为风功率预测模型的第一训练样本;
预测数据获取步骤:获取待预测时段的风速预测数据;
预测功率输出步骤:将获取到的风速预测数据作为预先训练的风功率预测模型的输入,得到风功率预测模型输出的功率预测数据;
其中,所述预先训练的风功率预测模型采用所述第一训练样本进行模型训练。
7.一种风功率预测方法,其特征在于,包括:
确定训练样本步骤:将权利要求3所述的风功率数据清洗方法对修正数据集
Figure 376788DEST_PATH_IMAGE029
进行再 次数据修正后得到的数据集作为风功率预测模型的第二训练样本;
预测数据获取步骤:获取待预测时段的风速预测数据;
预测功率输出步骤:将获取到的风速预测数据作为预先训练的风功率预测模型的输入,得到风功率预测模型输出的功率预测数据;
其中,所述预先训练的风功率预测模型采用所述第二训练样本进行模型训练。
8.一种风功率预测方法,其特征在于,包括:
确定训练样本步骤:将权利要求5所述的风功率数据清洗装置对修正数据集
Figure 858585DEST_PATH_IMAGE029
进行再 次数据修正后得到的数据集作为风功率预测模型的第三训练样本;
预测数据获取步骤:获取待预测时段的风速预测数据;
预测功率输出步骤:将获取到的风速预测数据作为预先训练的风功率预测模型的输入,得到风功率预测模型输出的功率预测数据;
其中,所述预先训练的风功率预测模型采用所述第三训练样本进行模型训练。
CN202210895422.4A 2022-07-28 2022-07-28 风功率数据清洗方法、清洗装置及预测方法 Active CN114969017B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210895422.4A CN114969017B (zh) 2022-07-28 2022-07-28 风功率数据清洗方法、清洗装置及预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210895422.4A CN114969017B (zh) 2022-07-28 2022-07-28 风功率数据清洗方法、清洗装置及预测方法

Publications (2)

Publication Number Publication Date
CN114969017A CN114969017A (zh) 2022-08-30
CN114969017B true CN114969017B (zh) 2022-11-11

Family

ID=82969001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210895422.4A Active CN114969017B (zh) 2022-07-28 2022-07-28 风功率数据清洗方法、清洗装置及预测方法

Country Status (1)

Country Link
CN (1) CN114969017B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111178397A (zh) * 2019-12-13 2020-05-19 南京松数科技有限公司 基于风力曲线图像的异常数据检测与清洗方法
CN112240267A (zh) * 2019-07-17 2021-01-19 成都信息工程大学 基于风速相关性与风功率曲线的风机监测方法
CN113236508A (zh) * 2021-05-31 2021-08-10 浙江运达风电股份有限公司 一种用于风力发电机组风速-功率异常数据检测的方法
CN113931808A (zh) * 2021-10-25 2022-01-14 中国华能集团清洁能源技术研究院有限公司 风电机组偏航误差的诊断方法及装置
CN114764741A (zh) * 2021-01-15 2022-07-19 深圳光耀智微科技有限公司 一种风力发电机运行风功率预测的方法和系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108412710B (zh) * 2018-01-30 2019-08-06 同济大学 一种风电机组风功率数据清洗方法
CN109002650A (zh) * 2018-08-21 2018-12-14 同济大学 一种风电机组功率曲线建模方法
CN110795690A (zh) * 2019-10-24 2020-02-14 大唐(赤峰)新能源有限公司 风电场运行异常数据检测方法
CN111209914A (zh) * 2019-12-18 2020-05-29 中电投电力工程有限公司 一种异常风功率数据的剔除方法
CN112598539B (zh) * 2020-12-28 2024-01-30 徐工汉云技术股份有限公司 一种风力发电机组风功率曲线优化计算及异常值检测方法
CN114020729A (zh) * 2021-10-21 2022-02-08 明阳智慧能源集团股份公司 一种基于风机功率曲线的风电场功率数据清洗方法
CN113988398A (zh) * 2021-10-22 2022-01-28 华北电力大学 一种风电机组功率预测方法、装置、电子设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112240267A (zh) * 2019-07-17 2021-01-19 成都信息工程大学 基于风速相关性与风功率曲线的风机监测方法
CN111178397A (zh) * 2019-12-13 2020-05-19 南京松数科技有限公司 基于风力曲线图像的异常数据检测与清洗方法
CN114764741A (zh) * 2021-01-15 2022-07-19 深圳光耀智微科技有限公司 一种风力发电机运行风功率预测的方法和系统
CN113236508A (zh) * 2021-05-31 2021-08-10 浙江运达风电股份有限公司 一种用于风力发电机组风速-功率异常数据检测的方法
CN113931808A (zh) * 2021-10-25 2022-01-14 中国华能集团清洁能源技术研究院有限公司 风电机组偏航误差的诊断方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于参数关联性的电站参数异常点清洗方法;徐搏超;《电力系统自动化》;20201025(第20期);第213-220页 *
基于风速-功率曲线模型风功率预报系统精度分析与改进;张磊;《应用能源技术》;20181125(第11期);第30-33+46页 *

Also Published As

Publication number Publication date
CN114969017A (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN106779223B (zh) 一种光伏系统发电功率实时预测方法及装置
CN1837767A (zh) 降级系统的健康参数或症状的估计
CN108443088B (zh) 一种基于累计概率分布的风电机组状态判定方法
CN106570790B (zh) 一种计及风速数据分段特性的风电场出力数据修复方法
CN110335168B (zh) 基于gru优化用电信息采集终端故障预测模型的方法及系统
CN108448625B (zh) 一种基于数据驱动的风机切入风速计算方法
CN111522808B (zh) 一种风电机组异常运行数据处理方法
CN114492675B (zh) 一种电容式电压互感器故障原因智能诊断方法
CN111080039B (zh) 一种风机集群故障预测方法及系统
CN112598207A (zh) 一种基于多重清洗的风电机组运行功率曲线评估方法
CN112032003A (zh) 一种大型风电机组运行性能监测方法
Scheibelhofer et al. A methodology for predictive maintenance in semiconductor manufacturing
CN112862347A (zh) 基于联邦学习的设备异常监测方法、系统、存储介质及终端
CN115115090A (zh) 一种基于改进lstm-cnn的风功率短期预测方法
CN114548199A (zh) 一种基于深度迁移网络的多传感器数据融合方法
CN112597620A (zh) 一种基于k-medoids算法的风电机组功率曲线建模方法
CN114969017B (zh) 风功率数据清洗方法、清洗装置及预测方法
CN117290666A (zh) 一种光伏异常功率数据清洗方法
CN111209914A (zh) 一种异常风功率数据的剔除方法
CN114090559A (zh) 一种光伏电站异常数据清洗的方法
CN115408860A (zh) 一种风电场风速-功率数据的异常值监测及修正方法
CN113554203B (zh) 基于高维网格化和LightGBM的风电预测方法及装置
CN113946977A (zh) 一种基于决策树算法预警风机变桨故障的应用方法
CN110175705B (zh) 一种负荷预测方法及包含该方法的存储器、系统
CN117688497B (zh) 基于后向轨迹模型的海上风电尾流干扰的数据处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant