CN112257953A - 一种基于极地新能源发电功率预测的数据处理方法 - Google Patents

一种基于极地新能源发电功率预测的数据处理方法 Download PDF

Info

Publication number
CN112257953A
CN112257953A CN202011212128.6A CN202011212128A CN112257953A CN 112257953 A CN112257953 A CN 112257953A CN 202011212128 A CN202011212128 A CN 202011212128A CN 112257953 A CN112257953 A CN 112257953A
Authority
CN
China
Prior art keywords
data
power generation
new energy
energy power
polar region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011212128.6A
Other languages
English (en)
Other versions
CN112257953B (zh
Inventor
杨帆
申亚
李东东
林顺富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai University of Electric Power
Shanghai Electric Power University
University of Shanghai for Science and Technology
Original Assignee
Shanghai Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Electric Power University filed Critical Shanghai Electric Power University
Priority to CN202011212128.6A priority Critical patent/CN112257953B/zh
Publication of CN112257953A publication Critical patent/CN112257953A/zh
Application granted granted Critical
Publication of CN112257953B publication Critical patent/CN112257953B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Control Of Eletrric Generators (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于极地新能源发电功率预测的数据处理方法,包括,清洗、归一化处理采集的极地气候及新能源发电功率的数据;基于所述数据代入互信息函数,建立最大相关和最小冗余模型并选取合适的气候特征变量组合;根据所述特征变量构建多维特征数据集并输入到K均值聚类算法,聚类划分极地寒暖季不同天气类型;利用相对距离量化每一种类型中各个样本数据与待测日的相似度;基于所述相似度的排序结果,输入相似度高的几组数据训练集到预测模型中,完成预测。本发明可以减小特征集中特征量的数量,减小冗余特征对预测时间的影响,降低相邻日天气不同造成的预测误差,提高新能源发电功率预测的精度,减小预测运算时间。

Description

一种基于极地新能源发电功率预测的数据处理方法
技术领域
本发明涉及新能源处理预测的技术领域,尤其涉及一种基于极地新能源发电功率预测的数据处理方法。
背景技术
近年来,随着我国新能源发电的不断发展,大量的新能源发电引入到发电运行中,对极地微电网的能量管理造成一定的影响,为了能够更加安全稳定的对极地微电网进行调度,需要对其进行准确的预测。但由于采集到的极地数据存在缺失、异常的数据,为了避免干扰因素对预测精度的影响,对其进行清洗处理;同时因极地新能源发电功率与气候数据具有相关性,以及气候数据之间具有相关性,如果只考虑前者的关系忽略后者的影响,选择的特征集具有冗余性,为了能够节省预测时间、提高聚类的准确性进行特征选择;K均值对天气类型聚类划分,减小相邻日的天气类型不同对预测精度造成影响,有利于更好地提高模型预测的精度和稳定性。所以在极地新能源发电功率预测前对数据处理是十分有必要的。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在极地新能源发电功率预测精度低、运算时间长的问题,提出了本发明。
因此,本发明解决的技术问题是:提高新能源发电功率预测的精度,减小预测运算时间。
为解决上述技术问题,本发明提供如下技术方案:清洗、归一化处理采集的极地气候及新能源发电功率的数据;基于所述数据代入互信息函数,建立最大相关和最小冗余模型并选取合适的气候特征变量组合;根据所述特征变量构建多维特征数据集并输入到K均值聚类算法,聚类划分极地寒暖季不同天气类型;基于所述划分的类型结果,利用相对距离量化每一种类型中各个样本数据与待测日的相似度;基于所述相似度的排序结果,输入相似度高的几组数据训练集到预测模型中,完成预测。
作为本发明所述的基于极地新能源发电功率预测的数据处理方法的一种优选方案,其中:所述极地气候数据及新能源发电功率数据包括,定义所述极地发电功率数据Y*;定义所述气候数据
Figure BDA0002759175230000025
包括大气风速V*、相对风向Vf*、环境气压Pa*、相对湿度D*、环境温度T*、辐射强度S*
作为本发明所述的基于极地新能源发电功率预测的数据处理方法的一种优选方案,其中:定义清洗后所述数据包括,定义清洗后气候特征数据以及新能源发电数据包括,
XΔ∈{Ti Δ,YΔ}
作为本发明所述的基于极地新能源发电功率预测的数据处理方法的一种优选方案,其中:定义归一化处理所述数据包括,基于离差标准化方法对所述数据进行线性变换包括,
Figure BDA0002759175230000021
XΔ max表示最大值,XΔ min为表示最小值,X∈{Ti,Y}表示归一化后值,其中Ti,Y分别表示归一化处理后的气候特征数据以及新能源发电数据值。
作为本发明所述的基于极地新能源发电功率预测的数据处理方法的一种优选方案,其中:所述最大相关性包括,定义最大相关性如下所示:
Figure BDA0002759175230000022
Figure BDA0002759175230000023
其中,p(Ti,Y)表示Ti和Y的联合概率质量函数,p(Ti)和p(Y)分别表示Ti和Y的边际概率质量函数,W表示Ti的特征集,|W|表示W中特征的维数,I表示Ti和Y的互信息。
作为本发明所述的基于极地新能源发电功率预测的数据处理方法的一种优选方案,其中:所述最小冗余包括,定义最小冗余如下所示:
Figure BDA0002759175230000024
根据上述公式所得结果如下所示:
maxφ(D,H),φ=D-H
定义输出最佳特征量组合为W={S T Vf D},其中,S、T、Vf、D分别表示辐射强度、环境温度、相对风向、相对湿度。
作为本发明所述的基于极地新能源发电功率预测的数据处理方法的一种优选方案,其中:所述多维特征数据库包括,最大辐射SM、平均辐射Sa、最大温度TM、最小温度TX、平均温度Ta、平均风向Vf、平均湿度D;基于1*7阶矩阵表示为:R=[SM Sa TM TX Ta Vf D]。
作为本发明所述的基于极地新能源发电功率预测的数据处理方法的一种优选方案,其中:所述K均值聚类算法包括,定义两天特征信息量Ri和Rj欧式距离公式如下:
Figure BDA0002759175230000031
作为本发明所述的基于极地新能源发电功率预测的数据处理方法的一种优选方案,其中:所述相对距离包括,
Figure BDA0002759175230000032
其中,Ri表示历史数据点,li表示历史数据点到待测日的距离,lR=med{li1,...,lij}(j=1,2,...n)表示簇中除Ri外所有点到待测日距离lij的中位数。
作为本发明所述的基于极地新能源发电功率预测的数据处理方法的一种优选方案,其中:所述预测模型包括,
Figure BDA0002759175230000033
其中,t表示时间序列,y1为表示新能源实际发电输出功率,a、b1、b2、b3、b4表示微分方程系数。
本发明的有益效果:本发明可以减小特征集中特征量的数量,减小冗余特征对预测时间的影响,对寒暖季天气类型进行聚类划分,降低相邻日天气不同造成的预测误差,提高新能源发电功率预测的精度,减小预测运算时间。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明提供一种基于极地新能源发电功率预测的数据处理方法的基本流程图;
图2为本发明提供一种基于极地新能源发电功率预测的数据处理方法的本文方法和未采用本方法预测结果对比图;
图3为本发明提供一种基于极地新能源发电功率预测的数据处理方法的寒、暖季不同天气类型日新能源发电功率预测图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1,为本发明的第一个实施例,提供了一种基于极地新能源发电功率预测的数据处理方法,包括:
S1:清洗、归一化处理采集的极地气候及新能源发电功率的数据。需要说明的是极地气候数据及新能源发电功率数据,包括:
定义极地发电功率数据Y*
定义气候数据
Figure BDA0002759175230000052
包括大气风速V*、相对风向Vf*、环境气压Pa*、相对湿度D*、环境温度T*、辐射强度S*
其中,定义清洗后数据包括,
定义清洗后气候特征数据以及新能源发电数据包括,
XΔ∈{Ti Δ,YΔ}
定义归一化处理数据包括,
基于离差标准化方法对数据进行线性变换包括,
Figure BDA0002759175230000051
XΔ max表示最大值,XΔ min为表示最小值,X∈{Ti,Y}表示归一化后值,其中Ti,Y分别表示归一化处理后的气候特征数据以及新能源发电数据值。
具体的,鉴于采集到的新能源发电数据以及大气风速、相对风向、环境气压、相对湿度、环境温度、辐射强度等气候数据存在部分缺失,极地新能源发电功率影响因素众多,且影响因素之间存在相关性,以及天气类型不同对预测精度的影响等问题,首先对采集到的数据进行清洗,为避免量纲不同的影响,对清洗后数据进行归一化处理。
更加具体的,对于获得的极地发电功率数据Y*以及气候数据T* i(大气风速V*、相对风向Vf*、环境气压Pa*、相对湿度D*、环境温度T*、辐射强度S*),首先要观察是否存在缺失值、异常值、重复值等,对于本文数据存在缺失值的现象,通过估算的方法,根据数据分布趋势情况,采用中位数进行填充,其中XΔ∈{Ti Δ,YΔ}为清洗后气候特征数据以及新能源发电数据。同时由于数据量纲问题,通过离差标准化方法即以下公式对数据进行线性变换:
Figure BDA0002759175230000061
XΔ max表示最大值,XΔ min为表示最小值,X∈{Ti,Y}表示归一化后值,其中Ti,Y分别表示归一化处理后的气候特征数据以及新能源发电数据值。
S2:基于上述数据代入互信息函数,建立最大相关和最小冗余模型并选取合适的气候特征变量组合。其中该步骤的最大相关性及最小冗余包括:
定义最大相关性如下所示:
Figure BDA0002759175230000062
Figure BDA0002759175230000063
其中,p(Ti,Y)表示Ti和Y的联合概率质量函数,p(Ti)和p(Y)分别表示Ti和Y的边际概率质量函数,W表示Ti的特征集,|W|表示W中特征的维数,I表示Ti和Y的互信息。
定义最小冗余如下所示:
Figure BDA0002759175230000064
根据上述公式所得结果如下所示:
maxφ(D,H),φ=D-H
定义输出最佳特征量组合为W={S T Vf D},其中,S、T、Vf、D分别表示辐射强度、环境温度、相对风向、相对湿度。
具体的,因极地新能源发电功率与气候数据具有相关性,以及气候数据之间具有相关性,如果只考虑前者的关系忽略后者的影响,选择的特征集具有冗余性,为了能够节省预测时间,提高聚类的准确性,将上述步骤中归一化处理后的Ti,Y数据输入到互信息函数I中,采用MRMR进行特征选择,选择合适的特征集。
其中定义最大相关性如下所示:
Figure BDA0002759175230000071
Figure BDA0002759175230000072
其中,p(Ti,Y)表示Ti和Y的联合概率质量函数,p(Ti)和p(Y)分别表示Ti和Y的边际概率质量函数,W表示Ti的特征集,|W|表示W中特征的维数,I表示Ti和Y的互信息。
定义最小冗余如下所示:
Figure BDA0002759175230000073
将上述公式代入如下公式:
maxφ(D,H),φ=D-H
对函数进行求解,输出最佳特征量组合为W={S T Vf D},其中,S、T、Vf、D分别表示辐射强度、环境温度、相对风向、相对湿度。
S3:根据特征变量构建多维特征数据集并输入到K均值聚类算法,聚类划分极地寒暖季不同天气类型。需要说明的是所述多维特征数据库包括:
最大辐射SM、平均辐射Sa、最大温度TM、最小温度TX、平均温度Ta、平均风向Vf、平均湿度D;基于1*7阶矩阵表示为:R=[SM Sa TM TX Ta Vf D]。
其中,K均值聚类算法包括,
定义两天特征信息量Ri和Rj欧式距离公式如下:
Figure BDA0002759175230000074
具体的,为了对每日的天气类型进行聚类划分,先根据MRMR获得的最佳特征变量,将一个周期内的特征变量最大、最小、平均值进行综合考虑,使其代表一天的数据,建立多维特征数据集,此方法降低了数据集的阶数,减小了聚类算法计算复杂度,其中多维特征数据库由最大辐射SM、平均辐射Sa、最大温度TM、最小温度TX、平均温度Ta、平均风向Vf、平均湿度D,共计7种特征量构成,基于1*7阶矩阵表示为:R=[SM Sa TM TX Ta Vf D]。K均值聚类将多维特征数据集通过欧式距离划分为K个聚类簇,同一个簇内的数据代表着天气类型相似的一类,通过聚类中心点由小到大得出该簇内天气类型标签。K均值聚类算法采用欧式距离作为度量距离,任意两天特征信息量Ri和Rj欧式距离公式如下:
Figure BDA0002759175230000081
S4:基于划分的类型结果,利用相对距离量化每一种类型中各个样本数据与待测日的相似度。需要说明的是相对距离包括:
Figure BDA0002759175230000082
其中,Ri表示历史数据点,li表示历史数据点到待测日的距离,lR=med{li1,...,lij}(j=1,2,...n)表示簇中除Ri外所有点到待测日距离lij的中位数。
具体的,由于极地气候的多变性,可能出现晴天、多云、雪天、暴风天等,为了研究方便,将非晴天的情况统称为阴天,将数据集聚类为两种天气类型。分别对每种天气类型中的数据通过相对距离作为相似度评判指标,获得与待预测日的相似度,其中相对距离即历史数据点Ri到待测日的距离li与簇中除Ri外所有点到待测日距离lij的中位数即lR=med{li1,...,lij}(j=1,2,...n)之比用于同种天气类型中历史数据与待预测数据相似度检测,其中相对距离如下式所示:
Figure BDA0002759175230000083
S5:基于相似度的排序结果,输入相似度高的几组数据训练集到预测模型中,完成预测。其中,预测模型包括,
Figure BDA0002759175230000084
其中,t表示时间序列,y1为表示新能源实际发电输出功率,a、b1、b2、b3、b4表示微分方程系数。
需要说明的是,该预测模型仅为示意,不具有限制性,该数据处理方法适用于任何预测模型。
其中,训练数据包括:
相似度比较高的几日的发电数据以及辐射强度、环境温度、相对风向、相对湿度多维样本数据。
具体的,根据上述方法,分别对寒暖季中同一种天气类型下的样本数据与待测数据相似度进行排序,选取相似度比较高的几日的发电数据以及辐射强度、环境温度、相对风向、相对湿度多维样本数据构建训练数据并将所述训练集输入到上述预测模型中,完成预测。
实施例2
对本方法中采用的技术效果加以验证说明,本实施例在构建的数据集上进行验证实验,选择未经过聚类排序处理后的数据集采用本发明进行对比测试,以科学论证的手段对比试验结果,以验证本方法所具有的真实效果。
将通过上述步骤获得的数据集输入到预测模型中,获得未来一天的新能源发电功率数据,先将获取2018-2019年的极地新能源发电数据清洗、归一化处理采集的极地气候及新能源发电功率的数据;基于所述数据代入互信息函数,建立最大相关和最小冗余模型并选取合适的气候特征变量组合;根据所述特征变量构建多维特征数据集并针对极地新能源发电数据集的数据为间隔1小时,周期24小时特点采用K均值聚类算法对每日天气类型进行划分;基于所述划分的类型结果,利用相对距离量化每一种类型中各个样本数据与待测日的相似度;基于所述相似度的排序结果,将同一种天气类型下相似度比较高的6天144组发电数据和辐射强度、环境温度、相对风向、相对湿度多维数据作为训练数据,将构建的极地数据集输入到灰色神经网络中,得到未来一天24的极地新能源发电功率数据。
将未经过聚类排序处理后的数据集得到的预测结果与本文方法进行对比,可知本文方法明显的缩短了预测时间,并且在相邻日天气类型不同时,提高了预测精度,如图2所示为采用本文方法和未采用时新能源发电功率预测结果对比图,分别对寒暖季不同天气类型日新能源发电功率进行预测,结果如图3所示,由图可看出所测的数据曲线与实际值相差无几。通过对比可知对数据处理、构建合适的训练数据集对提高极地新能源发电功率预测精度有一定影响。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种基于极地新能源发电功率预测的数据处理方法,其特性在于,包括:
清洗、归一化处理采集的极地气候及新能源发电功率的数据;
将所述数据代入互信息函数,建立最大相关和最小冗余模型并选取合适的气候特征变量组合;
根据所述特征变量构建多维特征数据集并输入到K均值聚类算法,聚类划分极地寒暖季不同天气类型;
基于划分的类型结果,利用相对距离量化每一种类型中各个样本数据与待测日的相似度;
基于所述相似度的排序结果,输入相似度高的几组数据训练集到预测模型中,完成预测。
2.如权利要求1所述的基于极地新能源发电功率预测的数据处理方法,其特征在于:所述极地气候数据及新能源发电功率数据包括,
定义所述极地发电功率数据Y*
定义所述气候数据T* i包括大气风速V*、相对风向Vf*、环境气压Pa*、相对湿度D*、环境温度T*、辐射强度S*
3.如权利要求1或2所述的基于极地新能源发电功率预测的数据处理方法,其特征在于:定义清洗后所述数据包括,
定义清洗后气候特征数据以及新能源发电数据包括,
XΔ∈{Ti Δ,YΔ} 。
4.如权利要求3所述的基于极地新能源发电功率预测的数据处理方法,其特征在于:定义归一化处理所述数据包括,
基于离差标准化方法对所述数据进行线性变换包括,
Figure FDA0002759175220000011
XΔ max表示最大值,XΔ min为表示最小值,X∈{Ti,Y}表示归一化后值,其中Ti,Y分别表示归一化处理后的气候特征数据以及新能源发电数据值。
5.如权利要求4所述的基于极地新能源发电功率预测的数据处理方法,其特征在于:所述最大相关性包括,
定义最大相关性如下所示:
Figure FDA0002759175220000021
Figure FDA0002759175220000022
其中,p(Ti,Y)表示Ti和Y的联合概率质量函数,p(Ti)和p(Y)分别表示Ti和Y的边际概率质量函数,W表示Ti的特征集,|W|表示W中特征的维数,I表示Ti和Y的互信息。
6.如权利要求5所述的基于极地新能源发电功率预测的数据处理方法,其特征在于:所述最小冗余包括,
定义最小冗余如下所示:
Figure FDA0002759175220000023
根据上述公式所得结果如下所示:
maxφ(D,H),φ=D-H
定义输出最佳特征量组合为W={S T Vf D},其中,S、T、Vf、D分别表示辐射强度、环境温度、相对风向、相对湿度。
7.如权利要求6所述的基于极地新能源发电功率预测的数据处理方法,其特征在于:所述多维特征数据库包括,
最大辐射SM、平均辐射Sa、最大温度TM、最小温度TX、平均温度Ta、平均风向Vf、平均湿度D;
基于1*7阶矩阵表示为:R=[SM Sa TM TX Ta Vf D]。
8.如权利要求7所述的基于极地新能源发电功率预测的数据处理方法,其特征在于:所述K均值聚类算法包括,
定义两天特征信息量Ri和Rj欧式距离公式如下:
Figure FDA0002759175220000024
9.如权利要求8所述的基于极地新能源发电功率预测的数据处理方法,其特征在于:所述相对距离包括,
Figure FDA0002759175220000025
其中,Ri表示历史数据点,li表示历史数据点到待测日的距离,lR=med{li1,...,lij}(j=1,2,...n)表示簇中除Ri外所有点到待测日距离lij的中位数。
10.如权利要求9所述的基于极地新能源发电功率预测的数据处理方法,其特征在于:所述预测模型包括,
Figure FDA0002759175220000031
其中,t表示时间序列,y1为表示新能源实际发电输出功率,a、b1、b2、b3、b4表示微分方程系数。
CN202011212128.6A 2020-11-03 2020-11-03 一种基于极地新能源发电功率预测的数据处理方法 Active CN112257953B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011212128.6A CN112257953B (zh) 2020-11-03 2020-11-03 一种基于极地新能源发电功率预测的数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011212128.6A CN112257953B (zh) 2020-11-03 2020-11-03 一种基于极地新能源发电功率预测的数据处理方法

Publications (2)

Publication Number Publication Date
CN112257953A true CN112257953A (zh) 2021-01-22
CN112257953B CN112257953B (zh) 2021-09-24

Family

ID=74267673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011212128.6A Active CN112257953B (zh) 2020-11-03 2020-11-03 一种基于极地新能源发电功率预测的数据处理方法

Country Status (1)

Country Link
CN (1) CN112257953B (zh)

Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202167895U (zh) * 2011-02-11 2012-03-14 宁夏回族自治区电力公司 风电/光伏功率预测系统
US20120210287A1 (en) * 2008-10-14 2012-08-16 Lsi Corporation Circuit Timing Analysis Incorporating the Effects of Temperature Inversion
US20130253718A1 (en) * 2012-03-23 2013-09-26 Power Analytics Corporation Systems and methods for integrated, model, and role-based management of a microgrid based on real-time power management
CN104978608A (zh) * 2015-06-24 2015-10-14 云南电网有限责任公司电力科学研究院 一种风电功率预测装置及预测方法
CN105426842A (zh) * 2015-11-19 2016-03-23 浙江大学 基于支持向量机的表面肌电信号多类手部动作识别方法
CN105654207A (zh) * 2016-01-07 2016-06-08 国网辽宁省电力有限公司锦州供电公司 基于风速、风向信息的风电功率预测方法
CN106228278A (zh) * 2016-08-19 2016-12-14 长园深瑞继保自动化有限公司 光伏功率预测系统
CN106971205A (zh) * 2017-04-06 2017-07-21 哈尔滨理工大学 一种基于k近邻互信息估计的嵌入式动态特征选择方法
CN107341569A (zh) * 2017-06-26 2017-11-10 清华大学 结合光伏功率物理模型与数据驱动的光伏功率预测方法
CN108205717A (zh) * 2017-12-30 2018-06-26 国网江苏省电力公司无锡供电公司 一种光伏发电功率多时间尺度预测方法
CN108280545A (zh) * 2018-01-19 2018-07-13 上海电力学院 一种基于k均值聚类神经网络的光伏功率预测方法
CN108803554A (zh) * 2017-05-04 2018-11-13 上海电气集团股份有限公司 一种发电机信号的智能诊断方法
CN109033332A (zh) * 2018-07-20 2018-12-18 汉纳森(厦门)数据股份有限公司 驾驶行为分析方法、介质及系统
CN109308571A (zh) * 2018-08-29 2019-02-05 华北电力科学研究院有限责任公司 配电线路线变关系检测方法
CN109902743A (zh) * 2019-02-28 2019-06-18 广东工业大学 一种风电机组输出功率预测方法
CN110705789A (zh) * 2019-09-30 2020-01-17 国网青海省电力公司经济技术研究院 一种光伏电站短期功率预测方法
CN110750524A (zh) * 2019-09-12 2020-02-04 中国电力科学研究院有限公司 一种有源配电网故障特征的确定方法及系统
CN110969310A (zh) * 2019-12-16 2020-04-07 合肥众建翔新能源有限公司 一种新能源发电系统的功率预测方法
CN111275240A (zh) * 2019-12-27 2020-06-12 华北电力大学 一种基于多能耦合场景下的负荷预测方法
CN111369045A (zh) * 2020-02-28 2020-07-03 南京邮电大学 一种短期光伏发电功率预测的方法
CN111429027A (zh) * 2020-04-15 2020-07-17 国网福建省电力有限公司经济技术研究院 一种基于大数据的地区输电网运行多维度分析方法
CN111541237A (zh) * 2020-04-02 2020-08-14 浙江大学 基于机会约束极限学习机的风电功率非参数区间预测方法
CN111612319A (zh) * 2020-05-11 2020-09-01 上海电力大学 基于一维卷积自编码器的负荷曲线深度嵌入聚类方法
CN111815021A (zh) * 2020-06-04 2020-10-23 上海电力大学 一种基于太阳辐射气候特征识别的光伏功率预测方法
CN111860600A (zh) * 2020-06-22 2020-10-30 国家电网有限公司 一种基于最大相关最小冗余判据的用户用电特征选择方法

Patent Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120210287A1 (en) * 2008-10-14 2012-08-16 Lsi Corporation Circuit Timing Analysis Incorporating the Effects of Temperature Inversion
CN202167895U (zh) * 2011-02-11 2012-03-14 宁夏回族自治区电力公司 风电/光伏功率预测系统
US20130253718A1 (en) * 2012-03-23 2013-09-26 Power Analytics Corporation Systems and methods for integrated, model, and role-based management of a microgrid based on real-time power management
CN104978608A (zh) * 2015-06-24 2015-10-14 云南电网有限责任公司电力科学研究院 一种风电功率预测装置及预测方法
CN105426842A (zh) * 2015-11-19 2016-03-23 浙江大学 基于支持向量机的表面肌电信号多类手部动作识别方法
CN105654207A (zh) * 2016-01-07 2016-06-08 国网辽宁省电力有限公司锦州供电公司 基于风速、风向信息的风电功率预测方法
CN106228278A (zh) * 2016-08-19 2016-12-14 长园深瑞继保自动化有限公司 光伏功率预测系统
CN106971205A (zh) * 2017-04-06 2017-07-21 哈尔滨理工大学 一种基于k近邻互信息估计的嵌入式动态特征选择方法
CN108803554A (zh) * 2017-05-04 2018-11-13 上海电气集团股份有限公司 一种发电机信号的智能诊断方法
CN107341569A (zh) * 2017-06-26 2017-11-10 清华大学 结合光伏功率物理模型与数据驱动的光伏功率预测方法
CN108205717A (zh) * 2017-12-30 2018-06-26 国网江苏省电力公司无锡供电公司 一种光伏发电功率多时间尺度预测方法
CN108280545A (zh) * 2018-01-19 2018-07-13 上海电力学院 一种基于k均值聚类神经网络的光伏功率预测方法
CN109033332A (zh) * 2018-07-20 2018-12-18 汉纳森(厦门)数据股份有限公司 驾驶行为分析方法、介质及系统
CN109308571A (zh) * 2018-08-29 2019-02-05 华北电力科学研究院有限责任公司 配电线路线变关系检测方法
CN109902743A (zh) * 2019-02-28 2019-06-18 广东工业大学 一种风电机组输出功率预测方法
CN110750524A (zh) * 2019-09-12 2020-02-04 中国电力科学研究院有限公司 一种有源配电网故障特征的确定方法及系统
CN110705789A (zh) * 2019-09-30 2020-01-17 国网青海省电力公司经济技术研究院 一种光伏电站短期功率预测方法
CN110969310A (zh) * 2019-12-16 2020-04-07 合肥众建翔新能源有限公司 一种新能源发电系统的功率预测方法
CN111275240A (zh) * 2019-12-27 2020-06-12 华北电力大学 一种基于多能耦合场景下的负荷预测方法
CN111369045A (zh) * 2020-02-28 2020-07-03 南京邮电大学 一种短期光伏发电功率预测的方法
CN111541237A (zh) * 2020-04-02 2020-08-14 浙江大学 基于机会约束极限学习机的风电功率非参数区间预测方法
CN111429027A (zh) * 2020-04-15 2020-07-17 国网福建省电力有限公司经济技术研究院 一种基于大数据的地区输电网运行多维度分析方法
CN111612319A (zh) * 2020-05-11 2020-09-01 上海电力大学 基于一维卷积自编码器的负荷曲线深度嵌入聚类方法
CN111815021A (zh) * 2020-06-04 2020-10-23 上海电力大学 一种基于太阳辐射气候特征识别的光伏功率预测方法
CN111860600A (zh) * 2020-06-22 2020-10-30 国家电网有限公司 一种基于最大相关最小冗余判据的用户用电特征选择方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
S.P. SHIVA PRAKASH 等: "Energy Optimized Path Selection in Cluster Based Routing for Wireless Mesh Network", 《2015 INTERNATIONAL CONFERENCE ON COMPUTATIONAL INTELLIGENCE AND NETWORKS》 *
WENBIN WU 等: "A Data Mining Approach Combining K -Means Clustering With Bagging Neural Network for Short-Term Wind Power Forecasting", 《IEEE INTERNET OF THINGS JOURNAL》 *
任利强 等: "基于优化聚类的IXGBoost短期电力负荷预测", 《计算机与数字工程》 *
李嘉周 等: "基于模糊聚类与互信息的电网运营指标类间筛选策略", 《电力大数据》 *
李扬 等: "基于改进最大相关最小冗余判据的暂态稳定评估特征选择", 《中国电机工程学报》 *
王钊 等: "区域多风电场功率的分位数回归概率预测方法", 《电网技术》 *
秦本双: "基于实测数据的风电场风速和风功率预测研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
赵永宁 等: "区域风电场短期风电功率预测的最大相关-最小冗余数值天气预报特征选取策略", 《中国电机工程学报》 *

Also Published As

Publication number Publication date
CN112257953B (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN108898251B (zh) 考虑气象相似性和功率波动的海上风电场功率预测方法
WO2018045642A1 (zh) 一种母线负荷预测方法
CN107992976B (zh) 热点话题早期发展趋势预测系统及预测方法
CN108320016A (zh) 一种建筑能耗短期预测方法
KR102215690B1 (ko) 시계열의 데이터를 모니터링 하는 방법 및 그 장치
CN111695736B (zh) 一种基于多模型融合的光伏发电短期功率预测方法
CN109492748B (zh) 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法
CN110766200A (zh) 一种基于K-means均值聚类的风电机组发电功率预测方法
CN114117852B (zh) 一种基于有限差分工作域划分的区域热负荷滚动预测方法
CN115186923A (zh) 光伏发电功率的预测方法、装置及电子设备
CN115759389A (zh) 基于天气类型的相似日组合策略的日前光伏功率预测方法
CN113715629B (zh) 基于改进符号回归和XGBoost算法的剩余续驶里程预测方法
CN114330915A (zh) 一种短期风电功率组合模型预测方法
CN112257953B (zh) 一种基于极地新能源发电功率预测的数据处理方法
CN115688982B (zh) 基于wgan和鲸鱼优化算法的楼宇光伏数据补全方法
CN112200346A (zh) 一种天气波动过程划分与匹配的短期风电功率预测方法
CN114970698B (zh) 一种基于改进lwpls的计量设备运行性能预测方法
CN116565840A (zh) 一种用于风电场风功率预测的高精度风速软测量方法
CN111062509A (zh) 一种基于改进神经网络的风功率中短期预测方法及系统
CN113988414B (zh) 一种基于P_LSTNet与加权Markov校验的风电输出功率预测方法
CN112348700B (zh) 一种结合som聚类与ifou方程的线路容量预测方法
JP7458183B2 (ja) エネルギー需要変動パターンの分類方法及びシステム
CN113570191B (zh) 一种河流凌汛冰塞险情智能诊断方法
CN116885703B (zh) 一种高维多元气象数据融合的短期风光功率预测方法
CN115730715A (zh) 基于特征提取与密度峰值聚类的风速短期混合预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant