CN117437086A

CN117437086A - 一种基于深度学习的太阳能资源缺测数据插补方法和系统

Info

Publication number: CN117437086A
Application number: CN202311761780.7A
Authority: CN
Inventors: 张猛; 胡琴; 熊晶; 王建宝; 王洋; 韦霁轩; 余世元; 庞晨雨; 何兴; 陈思齐; 向新
Original assignee: PowerChina Guiyang Engineering Corp Ltd
Current assignee: PowerChina Guiyang Engineering Corp Ltd
Priority date: 2023-12-20
Filing date: 2023-12-20
Publication date: 2024-01-23

Abstract

本发明公开了一种基于深度学习的太阳能资源缺测数据插补方法和系统。属于太阳能资源数据监测及数据插补技术领域；包括如下步骤：S1.在太阳能资源数据监测过程中，获取训练用实测完整数据；S2.基于所述训练用实测完整数据，制作训练用缺陷数据表；S3.基于所述训练用缺陷数据表，构建缺失位置矩阵；搭建插补模型，再基于所述缺失位置矩阵，对所述插补模型进行训练；使用训练后的插补模型，计算得到预测缺陷值；S4.计算所述预测缺陷值与对应实测数据值之间的差分比；S5.基于所述差分比，得到修正差分比；S6.基于所述预测缺陷值和修正差分比，得到最终的插补数据。本发明具有预测精度高的特点。

Description

一种基于深度学习的太阳能资源缺测数据插补方法和系统

技术领域

本发明属于太阳能资源数据监测及数据插补技术领域，具体涉及一种基于深度学习的太阳能资源缺测数据插补方法和系统。

背景技术

在“双碳”发展目标下，光伏发电在我国能源系统结构中的比重不断攀升，准确合理的太阳能资源评估是建设光伏发电站的关键第一步。

光伏电站太阳能资源数据的完整性和准确性对项目选址和后期发电量的计算十分重要。但大多时候由于监测设备的故障、测量精度或其它外部因素的影响，所监测的太阳能资源实测数据会存在不合理值和缺测值。《太阳能资源评估方法》（GB/T 37256—2019）明确规定，需要从实测数据系列中选择与缺测时刻最近、天气现象相同、有实测数据的时刻进行数据插补，但并未提供实际细化的插补方法。

由于太阳能资源各要素数据的特殊性，采用常规的插补算法不仅会导致误差偏高，甚至会影响光伏发电站太阳能资源评估的准确性。

发明内容

本发明的目的是：提供了一种基于深度学习的太阳能资源缺测数据插补方法和系统。本发明具有预测精度高的特点。

本发明的技术方案是：一种基于深度学习的太阳能资源缺测数据插补方法，包括如下步骤：

S1.在太阳能资源数据监测过程中，获取训练用实测完整数据；

S2.基于所述训练用实测完整数据，制作训练用缺陷数据表；

S3.基于所述训练用缺陷数据表，构建缺失位置矩阵；搭建插补模型，再基于所述缺失位置矩阵，对所述插补模型进行训练；使用训练后的插补模型，计算得到预测缺陷值；

S4.计算所述预测缺陷值与对应实测数据值之间的差分比；

S5.基于所述差分比，得到修正差分比；

S6.基于所述预测缺陷值和修正差分比，得到最终的插补数据，完成太阳能资源缺测数据插补。

前述的基于深度学习的太阳能资源缺测数据插补方法中，步骤S1中，所述训练用实测完整数据为二维列表形式；其中，列为需要监测的太阳能资源各要素，共有J列，分别记为D ₁～D _J；行为时间步相同的、连续的时间间隔，即每个时间点获取到的实测数据，共有I行。

前述的基于深度学习的太阳能资源缺测数据插补方法中，步骤S2中，制作所述训练用缺陷数据表的方法包括：

将第j列太阳能资源要素J _j中的第i个时间点的实测数据单独保存，并标记为实测数据值D _ij；之后删除该数据，并标记为F _ij，由此形成训练用缺陷数据表。

前述的基于深度学习的太阳能资源缺测数据插补方法中，步骤S3具体如下：

基于所述训练用缺陷数据表，构建缺失位置矩阵M；

采用最大最小归一化结合缺失位置矩阵M对训练用实测完整数据的各要素列分别进行归一化处理，归一化后的数据表示为X _norm；

采用AML-CAE模型搭建插补模型；

使用X _norm对所述插补模型进行训练；

使用训练好的插补模型计算得到所述预测缺陷值。

前述的基于深度学习的太阳能资源缺测数据插补方法中，插补模型搭建时，使用LeakyReLU作为激活函数。

前述的基于深度学习的太阳能资源缺测数据插补方法中，步骤S4中，差分比的计算公式为：

其中，DE _ij为第j列要素在第i个时间点时，实测数据值D _ij与预测缺陷值P _ij的差分比。

前述的基于深度学习的太阳能资源缺测数据插补方法中，步骤S5具体如下：

重复步骤S2～S4，获得太阳能资源要素J _j所在列中不同时间点的多个差分比DE，然后使用这些差分比，计算该列的平均差分比，即得修正差分比。

一种基于深度学习的太阳能资源缺测数据插补系统，使用了前述的插补方法；所述插补系统包括：

数据源模块，用于获取训练用实测完整数据；

缺陷数据模块，用于基于所述训练用实测完整数据，制作训练用缺陷数据表；

插补预测模块，用于基于所述训练用缺陷数据表，构建缺失位置矩阵；再基于所述缺失位置矩阵，对插补模型进行训练，最终得到预测缺陷值；

差分模块，用于计算所述预测缺陷值与对应实测数据值之间的差分比；

修正模块，用于基于所述差分比，得到修正差分比；

插补数据模块，用于基于预测缺陷值和所述修正差分比，得到最终的插补数据。

前述的基于深度学习的太阳能资源缺测数据插补系统中，所述插补预测模块包括：

矩阵单元，用于基于所述训练用缺陷数据表，构建缺失位置矩阵M；

归一化处理单元，用于采用最大最小归一化结合缺失位置矩阵M对各要素列分别进行归一化处理；

插补模型单元，用于基于AML-CAE模型搭建插补模型，并使用归一化处理后的数据X _norm对所述插补模型进行训练，以及使用训练好的插补模型得到所述预测缺陷值。

本发明的优点是：与现有技术相比，本发明以实测数据自身作训练集，采用深度学习理论，预测插补值，再结合预测插补值与实测值之间的差距，进一步修正预测值，从而得到更为精确的预测插补值。

本发明通过构建二维列表、缺失位置矩阵进行缺失值预测，充分考虑了太阳能资源各要素之间的相关关联，并进一步增加修正预测，使预测后的插补数据更为实用、可靠。

本发明所提出的插补方法具有更高的插补精度和更低的插补误差，可对光伏发电站太阳能资源缺测数据的插补研究提供一定的借鉴和参考。

本发明采用卷积自编码器作为深度学习网络结构，并结合人工缺失位置掩码的更新策略，用于插补缺失值，该方法采用自监督学习策略，不依赖于完整的数据集，具有更高的实用性和应用意义。

与常规插补方法相比，本发明具有更小的误差，插补值具有实际应用价值。

附图说明

图1为本发明实施例1的基于深度学习的太阳能资源缺测数据插补方法流程示意图；

图2为本发明实施例1中使用的AML-CAE模型结构和参数示意图；

图3为本发明实施例2中的基于深度学习的太阳能资源缺测数据插补系统结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的说明，但并不作为对本发明限制的依据。

实施例1。如图1所示，一种基于深度学习的太阳能资源缺测数据插补方法，主要包括以下步骤：

S1.获取太阳能资源数据监测的完整的实测数据，并以二维列表形式呈现，即训练用实测完整数据。其中，列为需要监测的太阳能资源各要素，共有J列，分别记为D ₁-D _J；行为时间步相同的、连续的时间间隔，即每个时间点获取到的实测数据，共有I行。通常，当实时监测数据出现不合理数据、或者数据为空时，将该时间点之前的数据内容截取，形成该训练用实测完整数据。其中，将不合理数据、以及空数据，均标记为实测缺失数据。

S2.基于训练用实测完整数据，制作训练用缺陷数据表。

本发明采用实时监测数据中具有完整数据的部分，制作训练用缺陷数据表。具体的，在训练用实测完整数据中，将第j列太阳能资源要素J _j（1≤j≤J）中的第i（0.9I≤i≤I）时间点的实测数据单独保存，并标记为实测数据值D _ij。之后删除该数据（可以是人为删除），并标记为F _ij，由此形成训练用缺陷数据表。

S3.基于训练用缺陷数据表，构建缺失位置矩阵M，再基于缺失位置矩阵M，使用训练后的插补模型，计算得到F _ij对应的预测缺陷值P _ij。

S3.1.构建缺失位置矩阵

由于太阳能资源数据的特殊性，其各个环境要素间影响很大，为了满足卷积的格式要求，并考虑多个要素属性之间的相关性，以缺失位置矩阵M表示。

首先，获取训练用缺陷数据表中的缺失数据的位置，并将训练用缺陷数据表以列要素的特征矩阵的形式表示，该特征矩阵将作为输入的原始缺失数据F，同时根据F中缺失数据的位置得到缺失位置矩阵M _i,j。

S3.2.同样，由于太阳能资源数据的特殊性，其各个环境要素间影响很大，存在着较强的相关性，将它们作为并行输入，有助于提高缺失数据计算的准确性。但由于太阳能资源各要素在数值上有较大的差距，为了使模型能够更快的收敛，需要对各要素数据分别进行归一化处理。本发明采用最大最小归一化(Min Max Normalization)结合缺失位置矩阵M对各要素列分别进行归一化处理，归一化后数据表示为X _norm。

S3.3.搭建插补模型。本发明采用AML-CAE(人工掩码卷积自编码器)模型，结构和参数如图2所示。该过程针对的训练用缺陷数据表，共有I×J个数据（实际是I×J-1个有效数据，及1个缺失数据），即大小为I×J的矩阵。在本实施例中，太阳能资源要素取4项为例，包括：湿度、温度、水平面总辐照度、水平面直接辐照度。时间取1天，时间步为10分钟，则1小时取值6次，全天共取144个时间点的数据。由于卷积操作需要在通道维度上进行处理，因此需要在输入矩阵中添加一个通道维度，形成一个大小为I×J×1的矩阵，即4×144×1的矩阵。编码器由四个卷积层组成，解码器由五个转置卷积层组成。使用LeakyReLU激活函数，该函数解决了神经元死亡问题，增强了梯度流动，提高了模型的表达能力。迭代次数为500次，优化器选用Adam算法。

图2中Conv2D是卷积层的一种类型，用于特征的卷积操作。这个操作可以捕捉多元负荷中的空间结构和特征。Conv2Dtran是反卷积操作，将输入数据进行上采样，使得输出特征图的尺寸比输入特征图的尺寸更大。LeakyReLU是一种激活函数，它在负数输入时引入了一个小的负斜率，以避免神经元死亡(输出恒为零)。与传统的ReLU激活函数相比，LeakyReLU具有一定的负值响应能力，可以更好地处理梯度消失问题。filters是指定卷积层中的滤波器数量。滤波器在卷积操作中用于提取多元负荷的多方面特征。filters＝n，意味着卷积层将输出n个不同的特征图。kernel用于定义卷积操作的感受野，kernel＝(i,j)表示每次进行卷积操作时，会考虑输入数据的i×j区域。strides用于控制滑动窗口在输入数据上的移动步长。strides＝(i,j)表示滤波器在水平方向上每次移动i个元素，而在垂直方向上每次移动j个元素。padding表示卷积操作中的填充操作，用于在输入数据的边缘周围添加额外的元素。padding＝(i,j)表示在垂直方向(上下)填充的i个元素，在水平方向(左右)填充j个元素，填充的元素为0。

S3.4.对插补模型AML-CAE进行训练。首先对归一化后的数据X _norm采用线性插值进行处理得到初始化的数据，接着在第k次迭代中，通过更新缺失位置矩阵M ^k，将1-M ^k与/>进行哈达玛积操作，得到缺失的数据/>，最后对/>同样采用线性插值进行处理得到插补模型AML-CAE的输入数据/>。/>将作为插补模型AML-CAE训练过程的输入，得到模型重构后的数据/>。

其中缺失位置矩阵M ^k、、/>、/>与/>可分别表示为：

，

其中Lin(·)表示线性插值函数，用于填充变量中的缺失值。⊙表示哈达玛积操作。AML-CAE(·)表示AML-CAE的正向传播。中的第n组样本/>通过前向传播，可以得到重构的结果/>。输入与重构之间的误差L _aml可表示为：

如果当前迭代中，数据样本未训练完，则转到下一组样本中；否则，转到下一个迭代。

S3.5.插补模型AML-CAE通过减少L _aml以学到非缺失值的分布，AML-CAE迭代完成后可得到训练好的插补模型AML-CAE，插补后的数据X _{n_imp}可表示为：

对X _{n_imp}进行反归一化处理，得到最终完整的预测缺陷值P _ij。

S4.计算F _ij的预测缺陷值P _ij与实测数据值D _ij之间的差分比DE _ij。

虽然该插补模型AML-CAE体现了要素之间的相互关联关系，并经迭代优化，但终究是预测值，其与实际监测值之间可能依然存在差距。若只是插补一个缺失值，该差距影响可能不大，但若连续插补多个缺失值，则可能会造成累积差距，甚至使后续的插补值失去意义。因此，本发明进一步通过差分比，对预测值做出修正。

。

S5.一个差分比，只能反映一个时间点的数据修正，并不能很好的反映其他时间点的数据修正，这样，在对缺失数据点进行插补时，依然会出现偏差。所以，本发明采用评价差分比，作为该列要素的修正差分比。

具体的，重复S2-S4，获得太阳能资源要素J _j所在列中不同时间点（0.9I≤i≤I）的多个差分比DE，然后使用这些差分比，计算该列的平均差分比AVG _j,DE。平均差分比AVG _j,DE作为该列要素的修正差分比。

S6.当在实时监测数据中遇到实测缺失数据时，先使用S3中的经过训练后的插补模型，计算预测缺陷值P _ij，再结合该列要素J _j的修正差分比AVG _j,DE，计算得到最终的插补数据。

在计算实测缺失数据时，要以时间为顺序，从前向后，逐行查询。当某一列要素出现不合适数据、或者空数据时，就将该处标记为实测缺失数据，计算该处的插补数据后，再继续下一时间的插补操作。

为了验证本发明的实用性和可靠性，以西藏某光伏发电项目某年的太阳能资源数据为例，进行合理性和完整性核验。其中使用到的部分要素数据如

表1所示。

表1

表1中10:00之前的数据也是完整的可用的，受限于篇幅，只展示10:00之后的数据。

将13:30、14:20、15:30、15:40、15:50共5个时间点的DHI数据删除后，再采用本发明，对这两个数据进行插补计算，并与其他主流插补方法进行对比，如表2、表3所示。

表2

各插补算法结果的均方根误差与平均误差百分比对比如表3所示。

表3

实施例2。如图3所示，一种基于深度学习的太阳能资源缺测数据插补系统，主要包括：数据源模块、缺陷数据模块、插补预测模块、差分模块、修正模块和插补数据模块。

具体的，数据源模块用于在太阳能资源数据监测过程中，获取训练用实测完整数据。缺陷数据模块用于基于训练用实测完整数据，制作训练用缺陷数据表。插补预测模块用于基于训练用缺陷数据表，构建缺失位置矩阵，再基于缺失位置矩阵，使用训练后的插补模型，计算得到预测缺陷值。差分模块用于计算预测缺陷值与实测数据值之间的差分比。修正模块用于基于差分比，得到修正差分比。插补数据模块用于基于训练后的插补模型得到的预测缺陷值和修正差分比，得到最终的插补数据，完成太阳能资源缺测数据插补。

在本实施例中，数据源模块获取到的太阳能资源数据监测的完整的实测数据，以二维列表形式呈现，即训练用实测完整数据。其中，列为需要监测的太阳能资源各要素，共有J列，分别记为D ₁-D _J，行为时间步相同的、连续的时间间隔，即每个时间点获取到的实测数据，共有I行。通常，当实时监测数据出现不合理数据、或者数据为空时，将该时间点之前的数据内容截取，形成该训练用实测完整数据。其中，将不合理数据、以及空数据，均标记为实测缺失数据。

缺陷数据模块采用实时监测数据中具有完整数据的部分，制作训练用缺陷数据表。具体的，在训练用实测完整数据中，将第j列太阳能资源要素J _j（1≤j≤J）中的第i（0.9I≤i≤I）时间点的实测数据单独保存，并标记为实测数据值D _ij。之后删除该数据（可以是人为删除），并标记为F _ij，由此形成训练用缺陷数据表。

插补预测模块包括矩阵单元、归一化处理单元和插补模型单元。

其中，矩阵单元用于基于训练用缺陷数据表，构建缺失位置矩阵M。归一化处理单元采用最大最小归一化结合缺失位置矩阵M对各要素列分别进行归一化处理，归一化后数据表示为X _norm。插补模型单元用于基于AML-CAE模型搭建插补模型，并使用归一化处理后的数据X _norm对插补模型进行训练，以及使用训练好的插补模型得到预测缺陷值。

差分模块中，差分比的计算方法为：

修正模块中，得到修正差分比的方法包括：

基于太阳能资源要素J _j所在列中不同时间点（0.9I≤i≤I）的多个差分比DE，然后使用这些差分比，计算该列的平均差分比AVG _j,DE。平均差分比AVG _j,DE作为该列要素的修正差分比。

最后，当在实时监测数据中遇到实测缺失数据时，插补数据模块先使用插补预测模块计算预测缺陷值P _ij，再结合该列要素J _j的修正差分比AVG _j,DE，计算得到最终的插补数据。

以上所述的实施例仅是对本申请优选方式进行的描述，并非对本申请的范围进行限定，在不脱离本申请设计精神的前提下，本领域普通技术人员对本申请的技术方案做出的各种变形和改进，均应落入本申请权利要求书确定的保护范围内。

Claims

1.一种基于深度学习的太阳能资源缺测数据插补方法，其特征在于，包括如下步骤：

S1.在太阳能资源数据监测过程中，获取训练用实测完整数据；所述训练用实测完整数据为二维列表形式；其中，列为需要监测的太阳能资源各要素，共有J列，分别记为D ₁～D _J；行为时间步相同的、连续的时间间隔，共有I行；

S2.基于所述训练用实测完整数据，制作训练用缺陷数据表；制作所述训练用缺陷数据表的方法包括：

将第j列太阳能资源要素J _j中的第i个时间点的实测数据单独保存，并标记为实测数据值D _ij；之后删除该数据，并标记为F _ij，由此形成训练用缺陷数据表；

S4.计算所述预测缺陷值与对应实测数据值之间的差分比；

S5.基于所述差分比，得到修正差分比；

S6.基于所述预测缺陷值和修正差分比，得到最终的插补数据。

2.根据权利要求1所述的基于深度学习的太阳能资源缺测数据插补方法，其特征在于，步骤S3具体如下：

基于所述训练用缺陷数据表，构建缺失位置矩阵M；

采用AML-CAE模型搭建插补模型；

使用X _norm对所述插补模型进行训练；

使用训练好的插补模型计算得到所述预测缺陷值。

3.根据权利要求2所述的基于深度学习的太阳能资源缺测数据插补方法，其特征在于，插补模型搭建时，使用LeakyReLU作为激活函数。

4.根据权利要求1所述的基于深度学习的太阳能资源缺测数据插补方法，其特征在于，步骤S4中，差分比的计算公式为：

；

5.根据权利要求1所述的基于深度学习的太阳能资源缺测数据插补方法，其特征在于，步骤S5具体如下：

6.一种基于深度学习的太阳能资源缺测数据插补系统，其特征在于，使用权利要求1-5任一项所述的插补方法；所述插补系统包括：

数据源模块，用于获取训练用实测完整数据；

修正模块，用于基于所述差分比，得到修正差分比；

7.根据权利要求6所述的基于深度学习的太阳能资源缺测数据插补系统，其特征在于，所述插补预测模块包括：