CN116362915B - 一种光伏电站气象数据补齐方法、装置及相关设备 - Google Patents

一种光伏电站气象数据补齐方法、装置及相关设备 Download PDF

Info

Publication number
CN116362915B
CN116362915B CN202310628403.XA CN202310628403A CN116362915B CN 116362915 B CN116362915 B CN 116362915B CN 202310628403 A CN202310628403 A CN 202310628403A CN 116362915 B CN116362915 B CN 116362915B
Authority
CN
China
Prior art keywords
meteorological
data
sequence
weather
observation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310628403.XA
Other languages
English (en)
Other versions
CN116362915A (zh
Inventor
张东晓
陈云天
蒋春碧
赵辛
李哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Dongli Digital Energy Technology Co ltd
Shenzhen Fenghe Digital Intelligence Technology Co ltd
Original Assignee
Ningbo Dongli Digital Energy Technology Co ltd
Shenzhen Fenghe Digital Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Dongli Digital Energy Technology Co ltd, Shenzhen Fenghe Digital Intelligence Technology Co ltd filed Critical Ningbo Dongli Digital Energy Technology Co ltd
Priority to CN202310628403.XA priority Critical patent/CN116362915B/zh
Publication of CN116362915A publication Critical patent/CN116362915A/zh
Application granted granted Critical
Publication of CN116362915B publication Critical patent/CN116362915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种光伏电站气象数据补齐方法、装置及相关设备,包括:利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列;基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列;其中,该模型为以从各气象序列中随机抽取的观察数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值。本申请可以从横向上习得不同气象属性的气象数据之间的相关性,以及从纵向上习得同一气象属性的气象数据在时间上的相关性,从而能够对存在数据缺失的各气象序列进行数据预估,实现气象数据的补齐。

Description

一种光伏电站气象数据补齐方法、装置及相关设备
技术领域
本申请涉及数据处理技术领域,更具体地说,是涉及一种光伏电站气象数据补齐方法、装置及相关设备。
背景技术
太阳能作为清洁能源,在保护生态环境、延缓全球变暖、推进可持续发展等方面具有重要积极的意义。然而,太阳能发电具有间歇性和难以调度的特征,为降低其对电能质量及电力系统稳定运行的消极影响,需要对光伏电站的发电功率进行预测。随着机器学习算法在各行各业的广泛应用,机器学习算法也被应用于光伏发电功率的预测,通常地,基于天气预报、光伏电站功率、气象监测等数据,预测光伏电站的发电功率。由于采集器出现异常或者其他原因,气象监测数据会存在缺失的情况,而很多机器学习算法不能接受输入数据存在缺失值。因此,在将数据输入到机器学习模型之前,需要对数据中的缺失值进行补齐。
目前,补齐缺失气象数据的方法主要有线性插值法,即根据已知的数据点之间的趋势估算缺失变量的数值。然而,站点监测的气象数据为时间序列数据,对气象数据应用线性插值方法需要对每一个观测变量,需要构建单独的插值函数。
发明内容
有鉴于此,本申请提供了一种光伏电站气象数据补齐方法、装置及相关设备,以实现对光伏电站气象数据的补齐。
为实现上述目的,本申请第一方面提供了一种光伏电站气象数据补齐方法,包括:
利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列;
基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列;
其中,所述模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值。
优选地,所述模型包括依次连接的图网络单元、第一全连接层、循环神经网络单元和第二全连接层。
优选地,所述利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列的过程,包括:
将所述多个第一气象序列中的每一时间截面的气象数据转换成一图结构数据,并通过图网络单元对所述图结构数据进行特征提取,得到图网络单元中各节点的向量表征;
通过第一全连接层对图网络单元中各节点的向量表征进行线性叠加,得到每一时间截面的中间结果;
通过循环神经网络单元对各时间截面的中间结果进行特征提取,得到各时间截面的特征表示;
通过第二全连接层对各时间截面的特征表示进行线性叠加,得到各时间截面的目标数据;
基于各时间截面的目标数据,确定各第二气象序列。
优选地,所述多个第一气象序列中的每一时间截面的气象数据包括同一观测点下各种气象属性的数值;
将所述多个第一气象序列中的每一时间截面的气象数据转换成一图结构数据的过程,包括:
基于所述气象数据的观测点,生成类型为观测点的节点;
基于所述气象数据的气象属性,生成类型为观测变量的节点;
基于所述气象数据中各气象属性的数值,生成类型为观测点的节点与类型为观测变量的节点之间的边。
优选地,所述图网络单元包含具有L层的图网络模型,所述图网络模型的第层图网络结构的节点的向量表征通过下述方程式进行更新:
所述图网络模型的第层图网络结构的边的向量表征通过下述方程式进行更新:
其中,、/>分别表示第/>层和第/>层图网络结构的节点/>的向量表征,/>、/>分别表示第/>层和第/>层图网络结构的节点/>与节点/>之间的边的向量表征,/>、/>、/>表示所述图网络模型的权重,/>表示数据合并,/>表示集成函数,/>表示激活函数。
优选地,所述模型的训练过程,包括:
获取所述光伏电站的历史气象实测数据集,所述历史气象实测数据集包括各气象属性在各观测点上的数值;
基于所述历史气象实测数据集,构建训练集和验证集,其中,训练集及验证集均包含特征数据以及对应于所述特征数据的标注数据,所述特征数据在每一观测点上存在至少一种气象属性的数据缺失,所述标注数据包括所述特征数据所缺失的数值;
确定模型的参数以及模型训练中的超参数;
利用所述训练集对模型进行训练,并基于模型在所述验证集中的表现,确定训练后的模型。
优选地,基于所述历史气象实测数据集,构建训练集和验证集的过程,包括:
将所述历史气象实测数据集中预设比例的历史气象实测数据归类为训练数据,并将所述历史气象实测数据集中剩下的历史气象实测数据归类为验证数据;
根据预设的序列长度,将训练数据及验证数据划分为多个序列片,每个序列片包括同一时间段内各气象属性的气象序列;
利用下述方程式确定训练集及验证集的特征数据及对应于所述特征数据的标注数据:
其中,为第i个序列片的特征数据,/>为第i个序列片的标注数据,/>为第i个序列片的随机掩码,/>表示第i个序列片中第j个气象属性在观测点t处的观测值存在缺失,反之,/>表示第i个序列片中第j个气象属性在观测点t处的观测值不存在缺失,T为所述预设的序列长度,d为气象属性的总数,/>为点乘运算。
优选地,基于各第二气象序列,对各第一气象序列中的空缺值进行补齐的过程,包括:
基于第一气象序列中的空缺值的索引,获取目标第二气象序列中对应于所述索引的数值,并将所述数值填补到所述第一气象序列中;
其中,所述目标第二气象序列与所述第一气象序列具有相同的气象属性。
优选地,所述气象属性包括空气温度、面板温度、空气湿度、水平辐照强度和垂直辐照强度。
本申请第二方面提供了一种光伏电站气象数据补齐装置,包括:
数据处理单元,用于利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列;
数据补齐单元,用于基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列;
其中,所述模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值。
本申请第三方面提供了一种光伏电站气象数据补齐设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现上述的光伏电站气象数据补齐方法的各个步骤。
本申请第四方面提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述的光伏电站气象数据补齐方法的各个步骤。
经由上述的技术方案可知,本申请首先利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列。然后,基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列。其中,所述模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值。由于每一气象序列对应有一种气象属性在多个观测点上的数值,那么,各气象序列包含各气象属性在多个观测点上的数值,可以理解,在横向上,各气象序列包含在同一观测点上各气象属性的数值,在纵向上,每一气象序列包含同一气象属性在时间序列上的各数值。因此,经过训练后的模型可以从横向上习得不同气象属性的气象数据之间的相关性,以及从纵向上习得同一气象属性的气象数据在时间上的相关性,从而能够对存在数据缺失的各气象序列(多个观察变量)进行数据预估,实现气象数据的补齐。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的光伏电站气象数据补齐方法的示意图;
图2为本申请实施例公开的模型结构示意图;
图3为本申请实施例公开的多个序列片的示意图;
图4为本申请实施例公开的包含具体数值的序列片示意图;
图5为本申请实施例公开的多个气象序列构成的数据矩阵示意图;
图6为本申请实施例公开的图结构数据的示意图;
图7为本申请实施例公开的特征数据及标注数据的示意图;
图8为本申请实施例公开的光伏电站气象数据补齐装置的示意图;
图9为本申请实施例公开的光伏电站气象数据补齐设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面介绍本申请实施例提供的光伏电站气象数据补齐方法。请参阅图1,本申请实施例提供的光伏电站气象数据补齐方法可以包括如下步骤:
步骤S101,利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列。
光伏电站在光伏发电预测中所关注的气象属性通常地包括空气温度、面板温度、空气湿度、水平辐照强度和垂直辐照强度,而这些气象属性之间具备一定的相关性,因此,在每一个第一气象序列对应有一种气象属性在多个观测点(观测时间点)上的数值的情况下,那么,输入到模型的多个第一气象序列可以完整地包括表征各气象属性的时间序列,即,该多个第一气象序列可以包括空气温度序列、面板温度序列、空气湿度序列、水平辐照强度序列和垂直辐照强度序列。
需要注明的是,该模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值。因此,经过训练后的模型对各第一气象序列处理后,所得到的各第二气象序列为不存在数据缺失的气息序列,且各第二气象序列的维度与各第一气象序列的维度一致,即,假设各第一气象序列可构成矩阵,那么,各第二气象序列可构成矩阵/>,其中,T为气象序列的长度,d为气象属性的总数。
步骤S102,基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列。
示例性地,可以预先记录下各第一气象序列中数据缺失的位置(如序列中的位置索引),然后从各第二气象序列中提取相应的数值,并将其填补到第一气象序列中,最终所得到的气象序列即为目标气象序列。
本申请首先利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列。然后,基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列。其中,所述模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值。由于每一气象序列对应有一种气象属性在多个观测点上的数值,那么,各气象序列包含各气象属性在多个观测点上的数值,可以理解,在横向上,各气象序列包含在同一观测点上各气象属性的数值,在纵向上,每一气象序列包含同一气象属性在时间序列上的各数值。因此,经过训练后的模型可以从横向上习得不同气象属性的气象数据之间的相关性,以及从纵向上习得同一气象属性的气象数据在时间上的相关性,从而能够对存在数据缺失的各气象序列进行数据预估,实现气象数据的补齐。由于各气象序列包括各气象属性,因此,本申请可以实现对各观测变量(空气温度、面板温度、空气湿度、水平辐照强度和垂直辐照强度)的预测,无需针对每一观测变量单独构建预测算法。
在本申请的一些实施例中,如图2所示,步骤S101中提及的模型可以包括依次连接的图网络单元(GNN)、第一全连接层(FC1)、循环神经网络单元(GRU)和第二全连接层(FC2),图中,为各第一气象序列中观测点t处的数据,/>为各第二气象序列中观测点t处的数据。可以理解,通过整合各观测点处的数据,可以得到各第二气象序列,即得到模型的最终输出。
在本申请的一些实施例中,步骤S101利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列的过程,可以包括:
S1,将该多个第一气象序列中的每一时间截面的气象数据转换成一图结构数据,并通过图网络单元对该图结构数据进行特征提取,得到图网络单元中各节点的向量表征。
其中,时间截面指同一片气象序列中具有相同位置索引的数据面。在模型应用过程中,该多个第一气象序列可以是一个序列片,这种情况下,该多个第一气象序列中的每一时间截面的气象数据包括同一观测点下各种气象属性的数值。示例性地,如图3所示,假设在一次模型应用中,所输入的序列片为序列片1,其包含时间至时间/>之间的d个气象序列,那么,对于这个序列片来说,包含T个时间截面,每一时间截面为对应于/>的一行数据,其中,/>
通过该图网络单元,单个观测点上某个气象属性的缺失值,可以由该观测点的其他气象属性的观测值计算得到。
S2,通过第一全连接层对图网络单元中各节点的向量表征进行线性叠加,得到每一时间截面的中间结果。
S3,通过循环神经网络单元对各时间截面的中间结果进行特征提取,得到各时间截面的特征表示。
图网络单元连同循环神经网络单元,形成一个循环图神经网络结构,通过该循环图神经网络结构,单个观测点上的某个气象属性的缺失值,不仅可以由该观测点的其他气象属性的观测值计算得到,还可以由与该观测点相邻的其它观测点的同一气象属性的观测值计算得到。
S4,通过第二全连接层对各时间截面的特征表示进行线性叠加,得到各时间截面的目标数据。
S5,基于各时间截面的目标数据,确定各第二气象序列。
在本申请的一些实施例中,上述S1将该多个第一气象序列中的每一时间截面的气象数据转换成一图结构数据的过程,可以包括:
S11,基于该气象数据的观测点,生成类型为观测点的节点。
S12,基于该气象数据的气象属性,生成类型为观测变量的节点。
S13,基于该气象数据中各气象属性的数值,生成类型为观测点的节点与类型为观测变量的节点之间的边。
由此可知,该图结构数据可以表征成一个双图(Bipartite Graph),其中,/>表示节点,且/>由两类节点构成:/>,其中,表示类型为观测点的节点集合,/>表示第i个观测点,表示类型为观测变量的节点集合,/>表示第i个观测变量,表示图的边,边仅存在于类型为观测点的节点与类型为观测变量的节点之间。
当不存在数据缺失的时候,每个类型为观测点的节点与每个类型为观测变量的节点均存在连接边,在双图的情况下,每个类型为观测变量的节点与每个类型为观测点的节点也存在连接边。当某个观测点数据的某个观测变量存在缺失值,连接该观测点节点和该观测变量节点的边也不存在。观测点构成的节点的邻居为;观测变量构成的节点的邻居为,每个节点的向量表征为/>,每条边的向量表征为/>
示例性地,如图3所示,假设该多个第一气象序列仅包含序列片1(即),那么,对于第i个时间截面,基于该气象数据的观测点,可以得到1个类型为观测点的节点:/>;基于该气象数据的气象属性,可以得到d个类型为观测变量的节点:/>、/>、…、/>;基于各气象属性的数值,可以得到边:/>、/>、…、/>
假设该多个第一气象序列包含n个序列片:,那么,对于第i个时间截面,基于该气象数据的观测点,可以得到n个类型为观测点的节点:、/>、…、/>;基于该气象数据的气象属性,可以得到d个类型为观测变量的节点:、/>、…、/>;基于各气象属性的数值,可以得到边:
…,
可以理解,若存在数据缺失,则相应的边则不存在。具体地,如图4所示,假设该多个第一气象序列包含3个序列片:、/>及/>,示例性地,对于第2个时间截面,可以得到如图5所示的数据矩阵,以及如图6所示的图结构数据,具体地,该图结构数据中包括:类型为观测点的节点/>、/>和/>,类型为观测变量的节点:/>、/>、/>及/>,以及边:
且存在数值的各边及其值为:
其中,存在缺失值的边在图6中用虚线表示。
对于图6所示的图结构数据,包括3个观测点节点和4个观测变量节点,将这3个观测点节点的序号定为,将4个观测变量节点的序号定为/>。基于定义,节点向量表征的初始值为:
(1)
若图5所示的数据矩阵中不存在数据缺失,则其形成的边为:
(2)
上述表达式中,编号为0 的节点跟编号为的节点有连接,即在4个特征上都有测量值,编号为1的节点跟编号为/>的节点有连接边,即第2个观测点在四个特征上也有测量值,编号为2 的节点跟编号为/>的节点有连接边,即第3个观测点在四个特征上也有测量值,上述表达式对应的每条边的具体值为:
(3)
其中,NA表示缺失值,基于该数据缺失情况,将缺失值对应的边去掉,因此,式(2)变成:
(4)
基于此,将式(3)更新为:
(5)
式(5)可以作为边向量表征的初始化值。
在本申请的一些实施例中,前面提及的图网络单元包含具有L层的图网络模型,该图网络模型的第层图网络结构的节点的向量表征通过方程式(6)进行更新:
(6)
(7)
该图网络模型的第l层图网络结构的边的向量表征通过方程式(8)进行更新:
(8)
其中,、/>分别表示第/>层和第/>层图网络结构的节点/>的向量表征,/>、/>分别表示第/>层和第/>层图网络结构的节点/>与节点/>之间的边的向量表征,/>、/>、/>表示该图网络结构的权重,/>表示数据合并,/>表示集成函数,/>表示激活函数。
、/>及式(4)代入至式(6)至式(8),即可以计算得到补齐后的数据矩阵。
经过图网络单元中各层的更新后,在该图网络单元最后一层的输出为每个节点的向量表征。将/>输入至第一全连接层后得到:
(9)
其中,为第一全连接层(FC1)的输出,/>表示第一全连接层(FC1)的权重,上标t表示时间截面。/>
在本申请的一些实施例中,步骤S101提及的模型的训练过程,可以包括:
S1,获取光伏电站的历史气象实测数据集。
其中,该历史气象实测数据集包括各气象属性在各观测点上的数值。
S2,基于该历史气象实测数据集,构建训练集和验证集。
其中,训练集及验证集均包含特征数据以及对应于该特征数据的标注数据,需要注明的是,为便于模型训练,特征数据在每一观测点上存在至少一种气象属性的数据缺失,标注数据(即样本标签)则包括该特征数据所缺失的数值。
示例性地,如图7所示的历史气象实测数据中,虚线框内的数据可以作为标注数据,其他数据则可以作为特征数据,图中,WS表示风速,T_air表示空气温度,T_p表示面板温度,H表示空气湿度,IR_h表示水平辐照强度。
S3,确定模型的参数以及模型训练中的超参数。
其中,模型的参数可以包括循环神经网络单元的神经元个数、第一全连接层及第二全连接层的神经元个数、节点向量表征的长度以及边向量表征的长度等。模型训练中的超参数可以包括学习率、训练轮数、优化器等。
S4,利用训练集对模型进行训练,并基于模型在验证集中的表现,确定训练后的模型。
示例性地,可以采用MSE(Mean Square Error,均方误差)来评估模型的表现,训练后选定的模型为所有训练轮中在验证集表现得到最低MSE 分数的模型。
在本申请的一些实施例中,上述S2基于该历史气象实测数据集,构建训练集和验证集的过程,可以包括:
S21,将历史气象实测数据集中预设比例的历史气象实测数据归类为训练数据,并将历史气象实测数据集中剩下的历史气象实测数据归类为验证数据。
通常地,训练数据与验证数据的比例为3:1,因此,可以将该预设比例设为75%。
S22,根据预设的序列长度,将训练数据及验证数据划分为多个序列片,每个序列片包括同一时间段内各气象属性的气象序列。
需要注明的是,每个序列片内部的时间段一致,各序列片之间的时间段不相重合。划分多个序列片的目的在于模型训练时可以按批进行训练,以提高训练效率。
S23,利用方程式(5)及(6)确定训练集及验证集的特征数据及对应于所述特征数据的标注数据:
(5)
(6)
其中,为第i个序列片的特征数据,/>为第i个序列片的标注数据,/>为第i个序列片的随机掩码,/>表示第i个序列片中第j个气象属性在观测点t处的观测值存在缺失,反之,/>表示第i个序列片中第j个气象属性在观测点t处的观测值不存在缺失,T为前述预设的序列长度,d为气象属性的总数,/>为点乘运算。
如图7所示,在随机掩码的作用下,任一观测点下任一气象属性均可能成为标注数据,这使得训练后的模型可以预测任一位置处的缺失值。
在本申请的一些实施例中,步骤S102基于各第二气象序列,对各第一气象序列中的空缺值进行补齐的过程,可以包括:
基于第一气象序列中的空缺值的索引,获取目标第二气象序列中对应于该索引的数值,并将该数值填补到第一气象序列中。
其中,目标第二气象序列与第一气象序列具有相同的气象属性。
具体地,各第二气象序列与各第一气象序列的数据维度一致,且各第二气象序列为数据补齐后的数据,即,不存在数据缺失,因此,在预先记录下各第一气象序列中的数据缺失位置后,再对应于各第二气象序列,则可以定位出相应的目标数值,将其填补到第一气象序列中的相应位置,最终可以得到完成数据补齐的目标气象序列。
下面对本申请实施例提供的光伏电站气象数据补齐装置进行描述,下文描述的光伏电站气象数据补齐装置与上文描述的光伏电站气象数据补齐方法可相互对应参照。
请参见图8,本申请实施例提供的光伏电站气象数据补齐装置,可以包括:
数据处理单元21,用于利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列;
数据补齐单元22,用于基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列;
其中,所述模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值。
所述模型包括依次连接的图网络单元、第一全连接层、循环神经网络单元和第二全连接层。
在本申请的一些实施例中,数据处理单元21利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列的过程,可以包括:
将所述多个第一气象序列中的每一时间截面的气象数据转换成一图结构数据,并通过图网络单元对所述图结构数据进行特征提取,得到图网络单元中各节点的向量表征;
通过第一全连接层对图网络单元中各节点的向量表征进行线性叠加,得到每一时间截面的中间结果;
通过循环神经网络单元对各时间截面的中间结果进行特征提取,得到各时间截面的特征表示;
通过第二全连接层对各时间截面的特征表示进行线性叠加,得到各时间截面的目标数据;
基于各时间截面的目标数据,确定各第二气象序列。
在本申请的一些实施例中,所述多个第一气象序列中的每一时间截面的气象数据包括同一观测点下各种气象属性的数值;
数据处理单元21将所述多个第一气象序列中的每一时间截面的气象数据转换成一图结构数据的过程,可以包括:
基于所述气象数据的观测点,生成类型为观测点的节点;
基于所述气象数据的气象属性,生成类型为观测变量的节点;
基于所述气象数据中各气象属性的数值,生成类型为观测点的节点与类型为观测变量的节点之间的边。
在本申请的一些实施例中,数据补齐单元22基于各第二气象序列,对各第一气象序列中的空缺值进行补齐的过程,可以包括:
基于第一气象序列中的空缺值的索引,获取目标第二气象序列中对应于所述索引的数值,并将所述数值填补到所述第一气象序列中;
其中,所述目标第二气象序列与所述第一气象序列具有相同的气象属性。
在本申请的一些实施例中,所述气象属性包括空气温度、面板温度、空气湿度、水平辐照强度和垂直辐照强度。
本申请实施例提供的光伏电站气象数据补齐装置可应用于光伏电站气象数据补齐设备,如计算机等。可选的,图9示出了光伏电站气象数据补齐设备的硬件结构框图,参照图9,光伏电站气象数据补齐设备的硬件结构可以包括:至少一个处理器31,至少一个通信接口32,至少一个存储器33和至少一个通信总线34。
在本申请实施例中,处理器31、通信接口32、存储器33、通信总线34的数量为至少一个,且处理器31、通信接口32、存储器33通过通信总线34完成相互间的通信;
处理器31可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路等;
存储器33可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器33存储有程序,处理器31可调用存储器33存储的程序,所述程序用于:
利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列;
基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列;
其中,所述模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列;
基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列;
其中,所述模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
综上所述:
本申请首先利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列。然后,基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列。其中,所述模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值。由于每一气象序列对应有一种气象属性在多个观测点上的数值,那么,各气象序列包含各气象属性在多个观测点上的数值,可以理解,在横向上,各气象序列包含在同一观测点上各气象属性的数值,在纵向上,每一气象序列包含同一气象属性在时间序列上的各数值。因此,经过训练后的模型可以从横向上习得不同气象属性的气象数据之间的相关性,以及从纵向上习得同一气象属性的气象数据在时间上的相关性,从而能够对存在数据缺失的各气象序列进行数据预估,实现气象数据的补齐。由于各气象序列包括各气象属性,因此,本申请可以实现对各观测变量(空气温度、面板温度、空气湿度、水平辐照强度和垂直辐照强度)的预测,无需针对每一观测变量单独构建预测算法。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种光伏电站气象数据补齐方法,其特征在于,包括:
利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列;
基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列;
其中,所述模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值;
所述模型包括依次连接的图网络单元、第一全连接层、循环神经网络单元和第二全连接层;
所述利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列的过程,包括:
将所述多个第一气象序列中的每一时间截面的气象数据转换成一图结构数据,并通过图网络单元对所述图结构数据进行特征提取,得到图网络单元中各节点的向量表征;
通过第一全连接层对图网络单元中各节点的向量表征进行线性叠加,得到每一时间截面的中间结果;
通过循环神经网络单元对各时间截面的中间结果进行特征提取,得到各时间截面的特征表示;
通过第二全连接层对各时间截面的特征表示进行线性叠加,得到各时间截面的目标数据;
基于各时间截面的目标数据,确定各第二气象序列。
2.根据权利要求1所述的方法,其特征在于,所述多个第一气象序列中的每一时间截面的气象数据包括同一观测点下各种气象属性的数值;
将所述多个第一气象序列中的每一时间截面的气象数据转换成一图结构数据的过程,包括:
基于所述气象数据的观测点,生成类型为观测点的节点;
基于所述气象数据的气象属性,生成类型为观测变量的节点;
基于所述气象数据中各气象属性的数值,生成类型为观测点的节点与类型为观测变量的节点之间的边。
3.根据权利要求1所述的方法,其特征在于,所述模型的训练过程,包括:
获取所述光伏电站的历史气象实测数据集,所述历史气象实测数据集包括各气象属性在各观测点上的数值;
基于所述历史气象实测数据集,构建训练集和验证集,其中,训练集及验证集均包含特征数据以及对应于所述特征数据的标注数据,所述特征数据在每一观测点上存在至少一种气象属性的数据缺失,所述标注数据包括所述特征数据所缺失的数值;
确定模型的参数以及模型训练中的超参数;
利用所述训练集对模型进行训练,并基于模型在所述验证集中的表现,确定训练后的模型。
4.根据权利要求3所述的方法,其特征在于,基于所述历史气象实测数据集,构建训练集和验证集的过程,包括:
将所述历史气象实测数据集中预设比例的历史气象实测数据归类为训练数据,并将所述历史气象实测数据集中剩下的历史气象实测数据归类为验证数据;
根据预设的序列长度,将训练数据及验证数据划分为多个序列片,每个序列片包括同一时间段内各气象属性的气象序列;
利用下述方程式确定训练集及验证集的特征数据及对应于所述特征数据的标注数据:
其中,为第i个序列片的特征数据,/>为第i个序列片的标注数据,/>为第i个序列片的随机掩码,/>表示第i个序列片中第j个气象属性在观测点t处的观测值存在缺失,/>表示第i个序列片中第j个气象属性在观测点t处的观测值不存在缺失,T为所述预设的序列长度,d为气象属性的总数,/>为点乘运算。
5.根据权利要求1所述的方法,其特征在于,基于各第二气象序列,对各第一气象序列中的空缺值进行补齐的过程,包括:
基于第一气象序列中的空缺值的索引,获取目标第二气象序列中对应于所述索引的数值,并将所述数值填补到所述第一气象序列中;
其中,所述目标第二气象序列与所述第一气象序列具有相同的气象属性。
6.根据权利要求1所述的方法,其特征在于,所述气象属性包括空气温度、面板温度、空气湿度、水平辐照强度和垂直辐照强度。
7.一种光伏电站气象数据补齐装置,其特征在于,包括:
数据处理单元,用于利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列;
数据补齐单元,用于基于各第二气象序列,对各第一气象序列中的空缺值进行补齐,得到各目标气象序列;
其中,所述模型为从各气象序列中随机抽取的观测数值为输入特征,以其余的其他观察数值为标注训练得到的,每一气象序列对应有一种气象属性在多个观测点上的数值,且各气象序列不存在缺失值;
所述模型包括依次连接的图网络单元、第一全连接层、循环神经网络单元和第二全连接层;
所述利用训练后的模型对光伏电站的多个第一气象序列进行处理,得到各第二气象序列的过程,包括:
将所述多个第一气象序列中的每一时间截面的气象数据转换成一图结构数据,并通过图网络单元对所述图结构数据进行特征提取,得到图网络单元中各节点的向量表征;
通过第一全连接层对图网络单元中各节点的向量表征进行线性叠加,得到每一时间截面的中间结果;
通过循环神经网络单元对各时间截面的中间结果进行特征提取,得到各时间截面的特征表示;
通过第二全连接层对各时间截面的特征表示进行线性叠加,得到各时间截面的目标数据;
基于各时间截面的目标数据,确定各第二气象序列。
8.一种光伏电站气象数据补齐设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~6中任一项所述的光伏电站气象数据补齐方法的各个步骤。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~6中任一项所述的光伏电站气象数据补齐方法的各个步骤。
CN202310628403.XA 2023-05-31 2023-05-31 一种光伏电站气象数据补齐方法、装置及相关设备 Active CN116362915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310628403.XA CN116362915B (zh) 2023-05-31 2023-05-31 一种光伏电站气象数据补齐方法、装置及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310628403.XA CN116362915B (zh) 2023-05-31 2023-05-31 一种光伏电站气象数据补齐方法、装置及相关设备

Publications (2)

Publication Number Publication Date
CN116362915A CN116362915A (zh) 2023-06-30
CN116362915B true CN116362915B (zh) 2023-08-15

Family

ID=86923575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310628403.XA Active CN116362915B (zh) 2023-05-31 2023-05-31 一种光伏电站气象数据补齐方法、装置及相关设备

Country Status (1)

Country Link
CN (1) CN116362915B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117743808B (zh) * 2024-02-20 2024-05-14 中铁西南科学研究院有限公司 一种隧道变形预测方法、系统、设备及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403015A (zh) * 2017-08-07 2017-11-28 南京金水尚阳信息技术有限公司 一种基于时间序列相似性的短期光功率预测方法
WO2019196278A1 (zh) * 2018-04-11 2019-10-17 平安科技(深圳)有限公司 天气数据获取方法及装置、计算机装置及可读存储介质
CN111080009A (zh) * 2019-12-13 2020-04-28 北京瑞莱智慧科技有限公司 基于时间序列的数据预测及补全方法、装置、介质和设备
JP2020181256A (ja) * 2019-04-23 2020-11-05 Kddi株式会社 複数のセンサの時系列の計測値群における欠損値を補完するプログラム、装置及び方法
AU2020104000A4 (en) * 2020-12-10 2021-02-18 Guangxi University Short-term Load Forecasting Method Based on TCN and IPSO-LSSVM Combined Model
CN113569972A (zh) * 2021-08-03 2021-10-29 中国科学院地理科学与资源研究所 气象数据插补方法、装置、电子设备及存储介质
CN114925047A (zh) * 2022-04-21 2022-08-19 中国科学院国家天文台南京天文光学技术研究所 南极视宁度缺失值在线填补方法
CN115510042A (zh) * 2022-08-30 2022-12-23 北京邮电大学 基于生成对抗网络的电力系统负荷数据填补方法及装置
CN116109018A (zh) * 2023-04-12 2023-05-12 深圳市峰和数智科技有限公司 一种光伏电站功率预测方法、装置及相关设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403015A (zh) * 2017-08-07 2017-11-28 南京金水尚阳信息技术有限公司 一种基于时间序列相似性的短期光功率预测方法
WO2019196278A1 (zh) * 2018-04-11 2019-10-17 平安科技(深圳)有限公司 天气数据获取方法及装置、计算机装置及可读存储介质
JP2020181256A (ja) * 2019-04-23 2020-11-05 Kddi株式会社 複数のセンサの時系列の計測値群における欠損値を補完するプログラム、装置及び方法
CN111080009A (zh) * 2019-12-13 2020-04-28 北京瑞莱智慧科技有限公司 基于时间序列的数据预测及补全方法、装置、介质和设备
AU2020104000A4 (en) * 2020-12-10 2021-02-18 Guangxi University Short-term Load Forecasting Method Based on TCN and IPSO-LSSVM Combined Model
CN113569972A (zh) * 2021-08-03 2021-10-29 中国科学院地理科学与资源研究所 气象数据插补方法、装置、电子设备及存储介质
CN114925047A (zh) * 2022-04-21 2022-08-19 中国科学院国家天文台南京天文光学技术研究所 南极视宁度缺失值在线填补方法
CN115510042A (zh) * 2022-08-30 2022-12-23 北京邮电大学 基于生成对抗网络的电力系统负荷数据填补方法及装置
CN116109018A (zh) * 2023-04-12 2023-05-12 深圳市峰和数智科技有限公司 一种光伏电站功率预测方法、装置及相关设备

Also Published As

Publication number Publication date
CN116362915A (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
Ibrahim et al. A novel hybrid model for hourly global solar radiation prediction using random forests technique and firefly algorithm
US10290066B2 (en) Method and device for modeling a long-time-scale photovoltaic output time sequence
Salcedo-Sanz et al. Feature selection in wind speed prediction systems based on a hybrid coral reefs optimization–Extreme learning machine approach
CN112529282A (zh) 基于时空图卷积神经网络的风电场集群短期功率预测方法
CN116362915B (zh) 一种光伏电站气象数据补齐方法、装置及相关设备
CN110852902A (zh) 一种基于bas-bp的光伏发电功率预测方法
CN103514353A (zh) 新增风机的功率预测方法和系统
CN108717579B (zh) 一种短期风电功率区间预测方法
Sogabe et al. Optimization of decentralized renewable energy system by weather forecasting and deep machine learning techniques
CN112100911B (zh) 一种基于深度bilstm的太阳辐射预测方法
Wang et al. Application of DBN for estimating daily solar radiation on horizontal surfaces in Lhasa, China
CN108830411A (zh) 一种基于数据处理的风电功率预测方法
CN115829126A (zh) 基于多视角自适应特征融合的光伏发电功率预测方法
CN112925824A (zh) 针对极端天气类型的光伏功率预测方法及系统
Alrashidi et al. Short-term PV output forecasts with support vector regression optimized by cuckoo search and differential evolution algorithms
CN117216526B (zh) 基于人工智能的光伏出力预测方法及系统
US20240054267A1 (en) Method for planning a layout of a renewable energy site
CN116109018B (zh) 一种光伏电站功率预测方法、装置及相关设备
CN104699979A (zh) 基于复杂网络的城市湖库藻类水华混沌时间序列预测方法
CN107844872A (zh) 一种用于风力发电的短期风速预报方法
CN114744623B (zh) 一种基于深度学习的新能源发电预测方法和系统
Wan et al. Turbine location wind speed forecast using convolutional neural network
Qu et al. Data imputation of wind turbine using generative adversarial nets with deep learning models
CN113779871A (zh) 一种电热耦合系统调度方法、装置、电子设备及其存储介质
CN117556262B (zh) 大气甲烷排放强度监测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant