CN108734359B - 一种风电功率预测数据预处理方法 - Google Patents

一种风电功率预测数据预处理方法 Download PDF

Info

Publication number
CN108734359B
CN108734359B CN201810584951.6A CN201810584951A CN108734359B CN 108734359 B CN108734359 B CN 108734359B CN 201810584951 A CN201810584951 A CN 201810584951A CN 108734359 B CN108734359 B CN 108734359B
Authority
CN
China
Prior art keywords
data
sample
uncertain
data points
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810584951.6A
Other languages
English (en)
Other versions
CN108734359A (zh
Inventor
程亚丽
王鸿
江秀臣
王致杰
盛戈皞
韩紫薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dianji University
Original Assignee
Shanghai Dianji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dianji University filed Critical Shanghai Dianji University
Priority to CN201810584951.6A priority Critical patent/CN108734359B/zh
Publication of CN108734359A publication Critical patent/CN108734359A/zh
Application granted granted Critical
Publication of CN108734359B publication Critical patent/CN108734359B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • H02J3/386
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/70Wind energy
    • Y02E10/76Power conversion electric or electronic aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Water Supply & Treatment (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种风电功率预测数据预处理方法,风电功率数据通过SCADA系统采集,该预处理方法是在三类支持向量机对SCADA系统采集到的数据分类之后,将数据集中的不确定性区域筛选出来,对筛选出来的不确定数据区域测量不确定度,最后对离散数据进行拟合。

Description

一种风电功率预测数据预处理方法
技术领域
本发明属于风电技术领域,特别涉及一种风电功率预测数据预处理方法。
背景技术
随着我国“十三五”规划纲要的提出,可再生能源利用技术得到迅速发展,风力发电是发展水平相对成熟的可再生能源发电技术之一,并已在各国大规模得到开发推广。风电功率预测以及风电功率爬坡预测技术的研究也较为成熟,但对风电场SCADA系统采集到的数据进行预处理的方法还有待研究。SCADA系统在进行数据采集过程中,可能会发生信号中断、设备损坏或者程序中断等传输故障,都会使得收集到错误的数据或者引起数据缺失。如果不预先采取有效的方法处理这些系统数据库中的干扰数据,而是直接或者处理方法不佳进行风电功率预测或风电功率爬坡预测都会降低预测的精确度。
专利文献201410398277.4公开了一种用于风电功率预测的风电数据预处理方法以及风电功率预测方法和系统,其中,风电数据预处理方法包括:对风电数据进行聚类形成簇,得到簇外孤立点,并从每个簇内提取出中心点;以及,基于与簇内点的功率值的差异,从所述簇外孤立点中筛选出一个或多个孤立点。风电功率预测方法包括:对于采集到的风电数据,根据上述风电数据预处理方法选出部分数据;以及根据选出的数据预测风电功率信息。
专利文献201310714939.X公开了一种基于隶属云理论的不确定性推理方法,主要解决上下文存在不确定性信息时的推理问题。首先用数字特征表述给定的定型概念,将其理解为没有确定度信息的云滴,然后构造云规则控制器,将没有确定度的云滴作为控制器的输入,通过控制器,输出具有确定度的云滴向量,最后将所有的输出云滴进行精确化,得到输出结果。
发明内容
本发明提供一种风电功率预测数据预处理方法,目的在于解决现有风电场SCADA系统对于风电功率预测数据不准确的问题。
本发明实施例之一,一种风电功率预测数据预处理方法,风电功率数据通过SCADA系统采集,该预处理方法是在三类支持向量机对SCADA系统采集到的数据分类之后,将数据集中的不确定性区域筛选出来,对筛选出来的不确定数据区域测量不确定度,最后对离散数据进行拟合。
本发明实施例之一,一种风电功率预测数据预处理系统,所述预处理系统包括:
三类支持向量机分类模型模块;
基于测量不确定度的离散数据拟合模型模块;
猴群算法拟合优化模块,其中,
三类支持向量机分类模型模块的处理过程是,
设训练样本数据集合:
Figure BDA0001689259170000031
下标i=1,2,…,表示每一类样本集合中样本的序号,k=-1,0,1分别表示错误数据点、不确定数据点和正确数据点,
l-1,l0,l1分别表示错误、不确定和正确数据点的个数,假设不确定数据点位于正确数据点和错误数据点的中间,把SCADA系统采集到的风速数据分为三类:第一类称为正确数据点;第二类称为错误数据点;第三类称为不确定数据点,
寻找两个平行的最优超平面H和H’,将三类样本数据点正确划分,并同时要求两个最近样本集间的距离最小;
基于测量不确定度的离散数据拟合模型模块的处理过程是,
即假设某样本数据服从正态分布,按规定,测量的最大允许误差为3σ,输入样本数据,利用最小二乘法找到最佳逼近曲线,若D为某点到拟合曲线L的距离,如果D>3σ,则称该点为异常点,予以舍弃;
猴群算法拟合优化模块的处理过程是:在剔除异常点后,再次利用最小二乘法拟合曲线,并采用猴群算法优化,使得拟合曲线尽量近似样本数据曲线,有利于对样本缺失数据进行替换。
本发明实施例针对SCADA系统采集到的数据都是具有不确定性(即存在误差),使用最小二乘、支持向量机等单一方法很容易受到误差点(由于受到各种测试条件和工作环境的影响,离散数据存在不确定性)的干扰,即离散数据中存在冗余信息。
本发明采用不确定性理论对SCADA系统采集到的数据进行检测和剔除风速异常点,并采用最小二乘法拟合找到风速最佳逼近曲线,为了提高拟合度,采用猴群优化算法对拟合曲线修正,以提高风电场功率预测和风电场功率爬坡预测精度。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1是本发明实施例中三类支持向量机。
图2是本发明实施例中三类支持向量机分类模型流程图。
图3是本发明实施例中基于测量不确定度的离散数据拟合模型流程图。
图4是本发明实施例中猴群算法流程图。
图5是本发明实施例中风电场SCADA系统采集数据预处理实现整体框图。
具体实施方式
根据一个或者多个实施例,如图5所示,对风电场SCADA系统采集到的数据进行预处理,风电功率预测数据预处理方法是在三类支持向量机对SCADA系统采集到的风速数据分类之后,将数据集中的不确定性区域筛选出来,对筛选出来的不确定数据区域测量不确定度,删除异常数据,最后对新的数据采用基于猴群算法的最小二乘法曲线拟合,能够有效提高风电功率预测精度,是一种有效的风速数据预处理方法。
根据一个或者多个实施例,如图2所示,三类支持向量机分类模型的基本步骤如下:
把SCADA系统采集到的风速数据作为模型的输入数据,构建基于三类支持向量机学习的训练样本;设定相关参数,输入学习样本数据;根据样本容量大小,进行分解,使其成为便于进行训练的子样本;使用三类支持向量机分类器对分解后的子样本数据进行训练;若训练结束,输出训练结果;否则增加数据样本容量,继续训练。
根据一个或者多个实施例,如图3所示,基于测量不确定度的离
散数据拟合模型基本步骤如下:
基于测量不确定度的离散数据拟合模型基本步骤如下:图二中,输出的错误数据点剔除,正确数据点保留,对于不确定数据区用测量不确定度理论检测异常点并剔除。
根据最小二乘法的定义,应使各残差平方和最小,即应满足:
Figure BDA0001689259170000051
式中,
Figure BDA0001689259170000052
为残差,n为不确定区数据点个数。把不确定区的风速数据作为构建基于测量不确定度的学习样本;分析试验数据,利用最小二乘法找到最佳逼近曲线;研究最佳逼近曲线图,进行测量不确定度评定,本发明使用A类评定不确定度;依据评定结果,按测量不确定理论的3σ原则进行识别、剔除异常点数据;若训练结束,则输出结果数据;若训练不结束,则继续添加新的样本数据,不断提高模型的预测能力。
根据一个或者多个实施例,如图4所示,猴群优化算法的基本步骤如下:舍弃异常点之后,使用LS-SVM方法再次进行数据拟合,拟合过程中采用猴群算法进行优化,使拟合曲线逐步逼近新的样本数据曲线。
根据一个或者多个实施例,如图5所示,一种风电功率预测数据预处理系统,对风电场SCADA系统采集到的数据进行预处理实现整体框图。该预处理系统是在三类支持向量机对SCADA系统采集到的风速数据分类之后,将数据集中的不确定性区域筛选出来,对筛选出来的不确定数据区域测量不确定度,删除异常数据,最后对新的数据采用基于猴群算法的最小二乘法曲线拟合,能够有效提高风电功率预测精度,是一种有效的风速数据预处理系统。
值得说明的是,虽然前述内容已经参考若干具体实施方式描述了本发明创造的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (2)

1.一种风电功率预测数据预处理方法,风电功率数据通过SCADA系统采集,其特征在于,该预处理方法是在三类支持向量机对SCADA系统采集到的数据分类之后,将数据集中的不确定性区域筛选出来,对筛选出来的不确定数据区域测量不确定度,最后对离散数据进行拟合,
所述预处理方法包括:
建立三类支持向量机分类模型;
建立基于测量不确定度的离散数据拟合模型;
采用猴群算法拟合优化,其中,
三类支持向量机分类模型建立过程是,
设训练样本数据集合:
Figure FDA0003204247230000011
下标i=1,2,…,表示每一类样本集合中样本的序号,k=-1,0,1分别表示错误数据点、不确定数据点和正确数据点,
l-1,l0,l1分别表示错误、不确定和正确数据点的个数,假设不确定数据点位于正确数据点和错误数据点的中间,把SCADA系统采集到的风速数据分为三类:第一类称为正确数据点;第二类称为错误数据点;第三类称为不确定数据点,
寻找两个平行的最优超平面H和H’,将三类样本数据点正确划分,并同时要求两个最近样本集间的距离最小;
建立基于测量不确定度的离散数据拟合模型的过程是,
即假设某样本数据服从正态分布,按规定,测量的最大允许误差为3σ,输入样本数据,利用最小二乘法找到最佳逼近曲线,若D为某点到拟合曲线L的距离,如果D>3σ,则称该点为异常点,予以舍弃;
猴群算法拟合优化过程是:在剔除异常点后,再次利用最小二乘法拟合曲线,并采用猴群算法优化,使得拟合曲线尽量近似样本数据曲线,有利于对样本缺失数据进行替换。
2.一种风电功率预测数据预处理系统,其特征在于,所述预处理系统包括:
三类支持向量机分类模型模块;
基于测量不确定度的离散数据拟合模型模块;
猴群算法拟合优化模块,其中,
三类支持向量机分类模型模块的处理过程是,
设训练样本数据集合:
Figure FDA0003204247230000021
下标i=1,2,…,表示每一类样本集合中样本的序号,k=-1,0,1分别表示错误数据点、不确定数据点和正确数据点,
l-1,l0,l1分别表示错误、不确定和正确数据点的个数,假设不确定数据点位于正确数据点和错误数据点的中间,把SCADA系统采集到的风速数据分为三类:第一类称为正确数据点;第二类称为错误数据点;第三类称为不确定数据点,
寻找两个平行的最优超平面H和H’,将三类样本数据点正确划分,并同时要求两个最近样本集间的距离最小;
基于测量不确定度的离散数据拟合模型模块的处理过程是,
即假设某样本数据服从正态分布,按规定,测量的最大允许误差为3σ,输入样本数据,利用最小二乘法找到最佳逼近曲线,若D为某点到拟合曲线L的距离,如果D>3σ,则称该点为异常点,予以舍弃;
猴群算法拟合优化模块的处理过程是:在剔除异常点后,再次利用最小二乘法拟合曲线,并采用猴群算法优化,使得拟合曲线尽量近似样本数据曲线,有利于对样本缺失数据进行替换。
CN201810584951.6A 2018-06-08 2018-06-08 一种风电功率预测数据预处理方法 Active CN108734359B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810584951.6A CN108734359B (zh) 2018-06-08 2018-06-08 一种风电功率预测数据预处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810584951.6A CN108734359B (zh) 2018-06-08 2018-06-08 一种风电功率预测数据预处理方法

Publications (2)

Publication Number Publication Date
CN108734359A CN108734359A (zh) 2018-11-02
CN108734359B true CN108734359B (zh) 2021-10-01

Family

ID=63932525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810584951.6A Active CN108734359B (zh) 2018-06-08 2018-06-08 一种风电功率预测数据预处理方法

Country Status (1)

Country Link
CN (1) CN108734359B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740301A (zh) * 2019-03-14 2019-05-10 华北电力大学 一种基于bp神经网络的燃气机组碳排放量的核算方法
CN110566405B (zh) * 2019-08-29 2021-02-19 北京金风科创风电设备有限公司 风力发电机组的功率优化方法及装置
CN111191815B (zh) * 2019-11-25 2022-08-16 清华大学 一种用于风电集群的超短期出力预测方法及系统
CN112801356A (zh) * 2021-01-21 2021-05-14 上海电机学院 一种基于ma-lssvm的电力负荷预测方法
CN117967498B (zh) * 2024-03-15 2024-10-01 三峡新能源海上风电运维江苏有限公司 风机变桨距的控制方法、装置、设备、介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101449264A (zh) * 2006-07-12 2009-06-03 柯法克斯公司 用于转导数据分类的方法和系统以及使用机器学习方法的数据分类方法
CN102184453A (zh) * 2011-05-16 2011-09-14 上海电气集团股份有限公司 基于模糊神经网络和支持向量机的风电功率组合预测方法
CN102545211A (zh) * 2011-12-21 2012-07-04 西安交通大学 一种通用的用于风电功率预测的数据预处理装置及方法
CN102866396A (zh) * 2011-07-05 2013-01-09 长春理工大学 基于不确定度的坐标系数据融合统一技术

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927695B (zh) * 2014-04-22 2017-11-24 国家电网公司 基于自学习复合数据源的风电功率超短期预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101449264A (zh) * 2006-07-12 2009-06-03 柯法克斯公司 用于转导数据分类的方法和系统以及使用机器学习方法的数据分类方法
CN102184453A (zh) * 2011-05-16 2011-09-14 上海电气集团股份有限公司 基于模糊神经网络和支持向量机的风电功率组合预测方法
CN102866396A (zh) * 2011-07-05 2013-01-09 长春理工大学 基于不确定度的坐标系数据融合统一技术
CN102545211A (zh) * 2011-12-21 2012-07-04 西安交通大学 一种通用的用于风电功率预测的数据预处理装置及方法

Also Published As

Publication number Publication date
CN108734359A (zh) 2018-11-02

Similar Documents

Publication Publication Date Title
CN108734359B (zh) 一种风电功率预测数据预处理方法
CN108985380B (zh) 一种基于聚类集成的转辙机故障识别方法
CN101516099B (zh) 一种传感器网络异常检测方法
CN110750524A (zh) 一种有源配电网故障特征的确定方法及系统
CN110400231B (zh) 一种加权非线性贝叶斯的电能计量设备失效率预估方法
CN109670676A (zh) 基于支持向量数据描述的配网台区风险预警方法及系统
CN110443117B (zh) 一种风电机组故障诊断方法
CN114861788A (zh) 一种基于dbscan聚类的负荷异常检测方法及系统
CN115099296A (zh) 基于深度学习算法的海浪高度预测方法
CN113554079B (zh) 一种基于二次检测法的电力负荷异常数据检测方法及系统
CN111797545A (zh) 一种基于实测数据的风电机组偏航折减系数计算方法
CN112801350B (zh) 基于不确定度的深度学习超短时风电功率预测系统及方法
CN114298132A (zh) 风电功率预测方法及装置、电子设备
CN112508278A (zh) 一种基于证据回归多模型的多联供系统负荷预测方法
CN116885703A (zh) 一种高维多元气象数据融合的短期风光功率预测方法
CN116070669A (zh) 一种基于改进深度置信网络的车间能耗预测方法与管理系统
CN108874974A (zh) 基于频繁词集的并行化话题跟踪方法
CN115511159A (zh) 一种基于贝叶斯神经网络的快速路事件检测方法和装置
CN113554203B (zh) 基于高维网格化和LightGBM的风电预测方法及装置
CN113298148A (zh) 一种面向生态环境评价的不平衡数据重采样方法
CN111539096A (zh) 一种基于实时测试参数的电驱动系统可靠度评估方法
CN114372616B (zh) 基于组合识别和空间相关性的新能源出力异常校正方法
CN118199030B (zh) 基于深度强化学习的新能源电站发电量预测方法及系统
CN118425687B (zh) 基于行波特征的输电线缆故障监测方法及系统
CN113792610B (zh) 一种谐波减速器健康评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant