CN117578438A

CN117578438A - 一种用于预测新能源发电量的生成对抗网络方法及系统

Info

Publication number: CN117578438A
Application number: CN202311583941.8A
Authority: CN
Inventors: 杨强; 杜秀举; 沈光友; 颜宗辉; 李青峰; 张玉莲; 董仁梅; 吴胜安; 汪永; 牟景艳; 胡海; 隆孝斌; 陈朝宽; 周凤; 李秋硕; 程云; 刘禹成; 张凯; 夏超; 张云菊
Original assignee: Guizhou Power Grid Co Ltd
Current assignee: Guizhou Power Grid Co Ltd
Priority date: 2023-11-24
Filing date: 2023-11-24
Publication date: 2024-02-20

Abstract

本发明公开了一种用于预测新能源发电量的生成对抗网络方法及系统，涉及新能源发电技术和人工智能技术交叉领域，包括收集数据，并对收集的数据进行数据预处理；对抗网络架构设计，创建一个生成器和一个判别器网络模型；进行对抗网络模型的训练，生成器和判别器交替训练；对模型评估和预测，用测试集的数据来评估模型的性能。生成合成的发电数据，以及扩充真实数据集，从有助于改善预测模型的泛化能力和准确性。具有数据增强、逼真的数据生成、捕捉时空相关性、提高稳健性和鲁棒性、提高预测效率以及数据的隐私保护等有益技术效果。这些效果使得GAN网络成为新能源发电预测的有力工具，能够提高预测的准确性和可行性。

Description

一种用于预测新能源发电量的生成对抗网络方法及系统

技术领域

本发明涉及新能源发电技术和人工智能技术交叉领域，特别是一种用于预测新能源发电量的生成对抗网络方法及系统。

背景技术

光伏能源是一种可再生能源，通过将太阳能转换为电能来产生电力。太阳能电池板中的光伏电池可以将阳光转化为电流。光伏发电系统通常受到太阳辐射、光照强度、温度和其他气象因素的影响。光伏能源发电数据通常是时间序列数据，其中包括历史发电量、光照强度、温度等变量。这些数据按时间顺序记录，通常以小时或分钟为单位。

生成对抗网络(Generative Adversarial Network，简称GAN)是一种深度学习模型，GAN包括两个主要部分：生成器(Generator)和判别器(Discriminator)，它们通过对抗训练相互竞争来生成和评估数据。

生成器是GAN的一部分，其任务是生成伪造的数据，这些数据应该尽量接近真实数据分布。本发明生成器由LSTM长短时记忆网络，可以有效地生成时序数据。初始时，生成器产生的数据可能是随机的，但通过训练逐渐改进，使生成的数据更加接近真实值。

判别器是GAN的另一部分，其任务是评估给定数据是真实数据还是生成器产生的伪造数据，判别器也是一个深度神经网络，它输出一个介于0和1之间的分数，表示给定数据是真实数据的概率。通过训练，判别器应该能够准确地区分真实数据和伪造数据。

对抗训练GAN的训练是一个对抗过程，生成器和判别器相互竞争。生成器试图生成足够逼真的伪造数据，以骗过判别器，使其无法准确区分。判别器则试图提高准确性，以更好地区分真实数据和伪造数据。这个对抗过程会导致生成器不断改进，生成的数据逐渐接近真实数据分布。GAN的训练使用损失函数来度量生成器和判别器的性能。生成器的损失是判别器评估伪造数据为真实数据的概率的负对数似然。判别器的损失包括对真实数据的负对数似然和对伪造数据的负对数似然。通过最小化生成器和判别器的损失函数，GAN实现了对抗训练。

在这样的背景下，光伏能源的发电性能受多种气象因素的影响，包括太阳辐射、光照强度和温度等。GAN网络在发电预测中具有以下几个优势：

数据增强：GAN网络可以通过生成虚拟的发电数据来增强真实数据集，从而扩充样本空间。这有助于提高模型的泛化能力和鲁棒性，减少过拟合的风险。

捕捉复杂特征：GAN网络是一种无监督学习方法，能够从数据中自动学习到复杂的特征表示。在发电预测中，这些特征可能包括季节性变化、天气模式、负荷曲线等。通过训练生成器和判别器，GAN网络可以学习到这些特征的分布，并生成与之相符合的发电数据。

解决数据不平衡问题：在发电预测中，可能存在数据不平衡的情况，如频繁发生的异常事件只占据数据集的一小部分。GAN网络可以通过生成更多的异常发电数据来平衡数据分布，从而提高模型对异常情况的预测能力。

对抗训练：GAN网络通过生成器和判别器之间的对抗训练，可以推动生成器不断优化生成的发电数据，使其逼近真实的发电数据分布。这有助于改善生成器的生成能力，使生成的发电数据更真实，并具有更好的数据分布特征。

灵活性和可拓展性：GAN网络可以通过调整生成器和判别器的架构和超参数，灵活地适应不同的发电预测任务和数据特征。同时，GAN网络也可以与其他深度学习模型(如循环神经网络)相结合，从而进一步提升发电预测的性能。

总的来说，GAN网络在发电预测中能够提供更好的数据增强能力、复杂特征学习能力、解决数据不平衡问题的能力，以及灵活性和可拓展性等优势。这些优势使得GAN网络成为一种有潜力的方法，用于提高发电预测模型的性能和效果。

针对现有技术中的缺陷和不足，本发明一种用于预测新能源(如太阳能或风能)发电量的生成对抗网络(GAN)方法，这一技术融合了先进的人工智能技术和新能源发电技术，无监督学习：GAN是一种无监督学习技术，不需要标注的训练数据。相比于传统的监督学习方法，它不需要依赖于大量标记的训练数据，因此更灵活和可扩展。GAN可以应对输入数据中的缺失值问题。通过以缺失值为条件，生成器可以生成与原始数据特征相匹配的合成数据，从而恢复原始数据。这在光伏能源领域具有巨大潜力，可用于优化电力网络管理、电池储能系统控制和电力市场交易等关键应用，有助于实现智能电力系统和减少对传统化石能源的依赖，推动可持续能源技术的普及。

发明内容

鉴于上述存在的问题，提出了本发明。

因此，本发明所要解决的问题是：如何进行预测新能源发电量的对抗网络方法生成的问题。

为解决上述技术问题，本发明提供如下技术方案：一种用于预测新能源发电量的生成对抗网络方法，包括，收集数据，并对收集的数据进行数据预处理；对抗网络架构设计，创建一个生成器和一个判别器网络模型；进行对抗网络模型的训练，生成器和判别器交替训练；对模型评估和预测，用测试集的数据来评估模型的性能。

作为本发明所述一种用于预测新能源发电量的生成对抗网络方法的一种优选方案，其中：所述数据包括光照强度、温度、风速、电流、电压和发电量参数；所述数据预处理包括采用插值法补充缺失值和采用Robust统计方法筛选异常值；采用Robust统计方法筛选异常值表示为：

M_ed＝Z(x₁,x₂,x₃,...,x_n)

M_J＝|x_i-M_ed|

MAD＝Z(|x₁-M_ed|,|x₂-M_ed|,...,|x_n-M_ed|)

Y＝{x||x_i-M_ed|＞k×MAD}

其中，M_ed为数据点的中位数，Z(·)为取中位数，M_J为绝对偏差，MAD为中位数绝对离差，Y为异常值，x为数据点，k为异常阈值，n为数据点的个数，x_i为第i个数据点。

作为本发明所述一种用于预测新能源发电量的生成对抗网络方法的一种优选方案，其中：所述对抗网络包括，使用卷积神经网络作为判别器，生成器使用递归神经网络LSTM生成数据；所述生成器包括，生成器的输入为一个噪声向量z，LSTM单元的输入是噪声向量z，LSTM层使用LSTM处理输入序列z，LSTM的输出是一个隐藏状态h_t，更新公式表示为：

i_t＝σ(W_i*[h_t-1,z_t]+b_i)

f_t＝σ(W_f*[h_t-1,z_t]+b_f)

g_t＝tanh(W_g*[h_t-1,z_t]+b_g)

o_t＝f_t*c_t-1+i_t*g_t

c_t＝f_t*c_t-1+i_t*g_t

h_t＝ot*tanh(ct)

其中，i_t为LSTM单元的输入门的激活值，f_t为LSTM单元的遗忘门的激活值，g_t为LSTM单元的细胞门的激活值，o_t为LSTM单元的输出门的激活值，W_i为LSTM单元的输入门的权重矩阵，W_f为LSTM单元的遗忘门的权重矩阵，W_g为LSTM单元的细胞门的权重矩阵，W_o为LSTM单元的输出门的权重矩阵，b_i为LSTM单元的输入门的偏置项，b_f为LSTM单元的遗忘门的偏置项，b_g为LSTM单元的细胞门的偏置项，b_o为LSTM单元的输出门的偏置项，h_t为隐藏状态，C_t为细胞状态；生成器的输出为一个与数据维度相匹配的向量。

作为本发明所述一种用于预测新能源发电量的生成对抗网络方法的一种优选方案，其中：所述对抗网络的训练包括，使用历史数据集进行训练，生成器从随机噪声向量中生成合成发电数据，判别器评估生成的数据与真实数据的相似度，生成器和判别器通过对抗学习使得生成器提高生成数据的质量，判别器也提高鉴别真伪的能力。

作为本发明所述一种用于预测新能源发电量的生成对抗网络方法的一种优选方案，其中：所述对抗网络的训练还包括，在每个训练迭代中，训练判别器区分真实的发电数据和生成的发电数据，初始化判别器的权重和偏置，对生成器生成的发电数据和真实的发电数据进行分类，使用真实发电数据作为正例，并从生成器生成的发电数据作为负例，构建一个具有标签的数据集，将包含真实和生成数据的数据集输入到判别器中，然后计算预测结果，并计算损失函数，生成器的损失函数采用对抗损失函数，指导生成器生成更逼真的数据，表示为：

L_gen＝-mean(log(D(G(z))))

其中，L_gen为生成器的损失函数，D为判别器的输出，G为生成器的输出，z为生成器的输入噪声；判别器的损失函数采用二进制交叉熵损失函数，表示为：

L_dis＝-mean(log(D(x))+log(1-D(G(z))))

其中，L_dis为判别器的损失函数，D(x)为判别器对真实数据的评估，D(G(z))为判别器对生成器生成的数据的评估，在训练过程中，生成器和判别器是相互竞争的，生成器的目标是最小化L_gen，而判别器的目标是最小化L_dis；若连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，并且生成器和判别器的损失函数变化都很小，则认为模型稳定，停止训练；若连续多次迭代中，L_gen≤生成器阈值，但L_dis＞判别器阈值，则判别器的训练存在问题，增加判别器的训练频率或训练迭代次数，直至连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，停止训练，若经过100次迭代后判别器的损失函数仍高于判别器阈值，则调整判别器的网络架构，并重新检查数据是否存在偏差或不足；若连续多次迭代中，L_dis≤判别器阈值，但L_gen＞生成器阈值，则生成器的训练存在问题，增加生成器的训练频率或训练迭代次数，引入更复杂的噪声模式，直至连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，停止训练，若经过100次迭代后生成器的损失函数仍高于生成器阈值，则调整生成器的网络结构，并实验不同的噪声输入模式；若经过100次迭代后，L_dis＞判别器阈值且L_gen＞生成器阈值，则整个对抗网络的训练存在问题，同时增加生成器和判别器的训练迭代次数，直至连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，停止训练，若经过100次迭代后生成器和判别器的损失仍高于阈值，则对整个网络架构进行大规模的调整或重新设计，深入分析训练数据，确保数据的质量和代表性，重新思考训练策略，重新进行训练。

作为本发明所述一种用于预测新能源发电量的生成对抗网络方法的一种优选方案，其中：所述模型评估包括，在评估训练完成的GAN模型时，通过计算生成的发电数据与真实发电数据之间的准确性来评估模型的性能，指标包括准确度、精确度、召回率和F1分数；所述准确度衡量生成的发电数据中正确预测的比例，即真阳性和真阴性样本的比例，表示为：

其中，A为准确度，N为总样本数，N₁₁为真阳性的样本数量，N₁₂为真阴性的样本数量；所述精确度指生成的发电数据中正例的预测准确率，即真阳性样本比例，表示为：

其中，P为精确度，N₂₁为假阳性的样本数量；所述召回率衡量模型对正例的识别能力，即正确预测的正例样本与实际正例样本的比例，表示为：

其中，R为召回率，N₂₂为假阴性的样本数量；所述F1分数综合了精确度和召回率，是精确度和召回率的调和平均值，表示为：

其中，F1为F1分数。

作为本发明所述一种用于预测新能源发电量的生成对抗网络方法的一种优选方案，其中：所述模型评估还包括，若A≥0.9且F1≥0.9，则模型评估为优秀，实施持续的性能监控，定期检查防止模型性能下降，进一步挖掘和利用数据中的深层次信息，在不同的数据集和实际应用场景中测试模型；若A≥0.8且F1≥0.8或A≥0.9且0.8＜F1＜0.89，则模型评估为良好，进行微调提高准确度或F1分数，引入更多样化的数据，提升模型对不同数据分布的适应性，使用更复杂的对抗训练策略；若A≥0.7且F1≥0.7或A≥0.8且0.7＜F1＜0.79或A≥0.9且F1＜0.8，则模型评估为中等，进行改进，分析错误分类的样本，识别模型的弱点，对现有网络架构进行调整，增加层次、改变激活函数或引入新的网络模块；若A≥0.6且F1≥0.6或A≥0.7且0.6＜F1＜0.69或A＜0.6且F1≥0.7，则模型评估为差，深入分析原因，重新考虑数据源，彻底审查原始数据集，确保数据质量和相关性，使用不同的网络结构，重新进行对抗网络模型的训练；若A＜0.6且F1＜0.6，则模型评估为不合格，性能远不符合要求，需要从头开始重新设计，重新构建模型架构，检查数据集是否适合问题，或者是否需要重新定义问题，重新评估问题设置、数据质量和是否有必要收集更多或不同类型的数据。

本发明的另外一个目的是提供一种用于预测新能源发电量的生成对抗网络方法的系统，其能通过构建对抗网络生成系统，解决了一种用于预测新能源发电量的生成对抗网络的问题。

为解决上述技术问题，本发明提供如下技术方案：一种用于预测新能源发电量的生成对抗网络系统，包括，数据采集模块、数据预处理模块、生成器模块、判别器模块、模型训练优化模块及模型评估模块；所述数据采集模块收集和准备用于训练和测试模型的数据，包括从各种来源收集原始数据；所述数据预处理模块清洗和转换原始数据，用于模型训练，包括处理缺失值、筛选异常值；所述生成器模块负责生成真实数据的新数据样本；所述判别器模块区分生成器生成的数据和真实数据，通过与生成器的对抗训练，提高模型在处理真实世界数据时的准确性和鲁棒性；所述模型训练优化模块使用训练数据集训练和优化生成器和判别器；所述模型评估模块使用测试集和各种评估指标评估模型的性能。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如上所述一种用于预测新能源发电量的生成对抗网络方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上所述一种用于预测新能源发电量的生成对抗网络方法的步骤。

本发明有益效果为：本发明提供的一种用于预测新能源发电量的生成对抗网络方法可以生成合成的发电数据，以及扩充真实数据集，从而提供更多样化和全面的数据。这有助于改善预测模型的泛化能力和准确性。可以通过对抗学习的方式生成逼真的发电数据，与真实数据的分布相似。这使得模型能够更准确地模拟真实的发电情况，从而提供更精确的预测结果。新能源发电受天气、季节和时间等因素的影响，具有时空相关性。GAN网络可以学习并捕捉这些相关性，从而提供更准确的预测结果。相比传统方法，GAN能够更好地利用数据中的时空信息。GAN网络的数据多样性和生成能力使得模型对于不同的发电情况和变化更具有容错性。它能够应对新能源系统中的不确定性和变动性，提供更稳定和鲁棒的预测结果。通过使用合成数据和优化的GAN网络，可以提高预测模型的效率和速度。相对于传统方法，GAN网络可以更快地生成预测结果，提供及时的反馈和决策支持。利用GAN网络生成的合成数据可以减少对真实数据的直接使用，从而保护数据的隐私性。这对于一些敏感性高的数据集，如能源系统的运营数据，是尤为重要的。利用GAN网络预测新能源发电相比传统方法具有数据增强、逼真的数据生成、捕捉时空相关性、提高稳健性和鲁棒性、提高预测效率以及数据的隐私保护等有益技术效果。这些效果使得GAN网络成为新能源发电预测的有力工具，能够提高预测的准确性和可行性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为本发明第一个实施例提供的一种用于预测新能源发电量的生成对抗网络方法的整体流程图。

图2为本发明第一个实施例提供的一种用于预测新能源发电量的生成对抗网络方法的数据预处理阶段利用可视化箱型图筛选异常数据图。

图3为本发明第一个实施例提供的一种用于预测新能源发电量的生成对抗网络方法的GAN网络说明图。

图4为本发明第二个实施例提供的一种用于预测新能源发电量的生成对抗网络系统的结构图。

图5为本发明第三个实施例提供的一种用于预测新能源发电量的生成对抗网络方法的预测效果实验图。

图6为本发明第三个实施例提供的一种用于预测新能源发电量的生成对抗网络方法的本发明预测效果图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合说明书附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

实施例1

参照图1～图3，为本发明第一个实施例，该实施例提供了一种用于预测新能源发电量的生成对抗网络方法，包括：收集数据，并对收集的数据进行数据预处理；对抗网络架构设计，创建一个生成器和一个判别器网络模型；进行对抗网络模型的训练，生成器和判别器交替训练；对模型评估和预测，用测试集的数据来评估模型的性能。

步骤一、数据收集和准备：收集历史新能源系统数据，包括光照强度、温度、风速、电流、电压和发电量等参数。这些数据可以来自传感器、监测设备、日志记录系统等。数据预处理：检查数据中是否存在缺失值、异常值或错误的数据。对于缺失值，选择填充、删除或插值来处理。异常值可能需要进行修复或标记，以防止其影响模型的性能。归一化通常用于将数据缩放到0到1的范围内，这有助于一些模型的性能。

光照强度(Irradiance)：光照强度是太阳辐射能量的度量，通常以瓦特每平方米(W/m²)为单位。它是光伏发电的主要驱动因素之一，因为光伏电池的发电效率与光照强度之间存在直接关联。这是预测光伏发电的关键参数之一。时间戳：时间戳是每个数据点的时间信息，通常以日期和时间格式表示。时间戳用于构建时间序列数据集，使数据变成时间相关的序列，以便进行时间序列分析和预测。数据清洗和处理：处理缺失值：检查数据集中是否存在缺失值(NaN或null值)。在光伏预测的真实数据集中存在一些由于物理原因造成缺失值的问题。因此本方法采用插值法来补充缺失值保证数据的完整性。识别数据集中的异常值，这些异常值可能是由于错误测量或其他原因引起的。本方法通过使用Robust统计方法来筛选异常值，Robust统计方法如中位数、MAD(中位数绝对离差)等对异常值更具抵抗力，因为它们不受异常值的极端影响。这些方法可以在计算统计量时降低异常值的权重。

数据预处理包括采用插值法补充缺失值和采用Robust统计方法筛选异常值。如图2所示。采用Robust统计方法筛选异常值表示为：

M_ed＝Z(x₁,x₂,x₃,...,x_n)

M_J＝|x_i-M_ed|

MAD＝Z(|x₁-M_ed|,|x₂-M_ed|,...,|x_n-M_ed|)

Y＝{x||x_i-M_ed|＞k×MAD}

步骤二、GAN架构设计，创建一个生成器(Generator)和一个判别器(Discriminator)神经网络。生成器(Generator)使用LSTM神经网络，其输入是历史环境参数(如光照强度、温度、风速等)，输出是预测的新能源发电量。输入层：接受历史环境参数的时间序列数据。LSTM层：LSTM层用于捕捉时间序列数据中的时间相关性和序列依赖关系。可以包含一个或多个LSTM层。全连接层：将LSTM的输出映射到预测新能源发电量的尺度上。输出层：输出预测的新能源发电量。同时也能处理时空特征和数据分布(通过CNN判别器)。判别器的架构，输入层：接受生成器生成的数据和真实数据。卷积层：使用卷积核来捕捉时空特征。卷积层可以包括多个卷积核，每个卷积核用于检测不同的特征。如图3所示。

在生成对抗网络(GAN)中，通常使用卷积神经网络(CNN)作为判别器，而生成器通常使用递归神经网络(如循环神经网络RNN或长短时记忆网络LSTM)来生成数据。生成器的LSTM架构：定义输入和噪声向量：

对抗网络使用卷积神经网络作为判别器，生成器使用递归神经网络LSTM生成数据；生成器的输入为一个噪声向量z，LSTM单元的输入是噪声向量z，LSTM层使用LSTM处理输入序列z，LSTM的输出是一个隐藏状态h_t，更新公式表示为：

i_t＝σ(W_i*[h_t-1,z_t]+b_i)

f_t＝σ(W_f*[h_t-1,z_t]+b_f)

g_t＝tanh(W_g*[h_t-1,z_t]+b_g)

o_t＝f_t*c_t-1+i_t*g_t

c_t＝f_t*c_t-1+i_t*g_t

h_t＝ot*tanh(ct)

其中，i_t为LSTM单元的输入门的激活值，f_t为LSTM单元的遗忘门的激活值，g_t为LSTM单元的细胞门的激活值，o_t为LSTM单元的输出门的激活值，W_i为LSTM单元的输入门的权重矩阵，W_f为LSTM单元的遗忘门的权重矩阵，W_g为LSTM单元的细胞门的权重矩阵，W_o为LSTM单元的输出门的权重矩阵，b_i为LSTM单元的输入门的偏置项，b_f为LSTM单元的遗忘门的偏置项，b_g为LSTM单元的细胞门的偏置项，b_o为LSTM单元的输出门的偏置项，h_t为隐藏状态，C_t为细胞状态；生成器的输出是一个与数据维度相匹配的向量，用于生成模型所需的数据。在输出层，可以应用适当的激活函数以确保生成的数据处于合适的范围。

模型评估是一个迭代的过程，通常需要多次调整和改进模型，以确保其在实际应用中能够提供准确和可靠的预测。不同问题和任务可能需要不同的评估方法和指标，本方法也是利用优化算法对其进行迭代，找到最适合预测的模型。

构建GAN是关键的技术特征，包括生成器的网络架构，利用长短时神经网络构建GAN的生成器处理时序信号。同时利用卷积神经网络判别器的架构与生成器的架构相对称，以便更好地进行对抗学习。使用生成对抗网络中的二进制交叉熵损失函数作为判别器的损失，同时考虑其他的损失函数，如L1损失或均方差损失。利用Adam优化算法结合学习率调度和正则化技术来提高模型的训练效果和稳定性。

结合学习率调度和正则化技术来提高模型的训练效果和稳定性。GAN网络在新能源预测发电任务中具有数据增强、数据逼真性、数据多样性、时空相关性捕捉、可扩展性和优化训练稳定性等优势。这些特点使得GAN网络成为预测新能源发电的有力工具，能够提高任务的准确性和可行性。在未来，建立更加完善的GAN模型、选取更加合适的评估标准和数据集，将有助于进一步提高GAN网络在新能源预测发电任务中的表现和应用效果。

Adam算法是一种用于优化算法的学习率自适应优化算法，可以用于优化GAN模型在新能源发电预测任务中。Adam算法优化GAN预测新能源发电的技术特点：自适应学习率：Adam算法根据每个参数的梯度的一阶和二阶矩估计，自适应地调整每个参数的学习率。这有助于平衡模型的收敛速度和稳定性，在训练过程中更好地控制参数更新。较少的超参数：Adam算法只有两个重要的超参数，即学习率和衰减率。相比其他优化算法，如随机梯度下降法(SGD)，需要调整更多的超参数，Adam算法更为简单和易于使用。快速收敛：Adam算法结合了动量方法和自适应学习率的优点，可以快速收敛到全局最优解。这对于GAN模型的优化尤为重要，因为GAN网络通常存在训练不稳定和模式坍塌的问题。处理稀疏梯度：在新能源发电预测任务中，可能会遇到稀疏的梯度问题，即某些参数的梯度更新值较小。Adam算法通过自适应地调整学习率，可以更好地处理这种稀疏梯度情况，避免参数更新停滞。内存效率：Adam算法仅需保存每个参数的一阶和二阶矩估计，而不需要保存完整的梯度历史。这使得算法更加内存高效，尤其对于大规模的新能源发电预测任务有较大的优势。

Adam算法在优化GAN模型预测新能源发电任务中具有自适应学习率、较少的超参数、快速收敛、处理稀疏梯度和内存效率等优势。通过选择合适的学习率和衰减率，并结合其他GAN网络的优化策略，可以改善GAN模型的训练稳定性、收敛速度和预测准确性。

步骤三、GAN的训练过程：生成器生成新能源发电量的预测数据，使用历史环境参数作为输入。判别器接受生成器生成的数据和真实数据，尝试区分哪些数据是真实的，哪些是生成的。生成器和判别器交替训练。生成器的目标是生成逼真的发电量数据，以欺骗判别器，使其无法准确区分生成的数据和真实数据。判别器的目标是尽可能准确地分类生成的数据和真实数据。在每个训练迭代中，生成器通过梯度下降来更新其权重，以提高生成的数据的逼真度。判别器也通过梯度下降来更新权重，以提高其分类性能。

使用训练集的数据来训练GAN网络模型训练GAN模型的过程包括两个主要步骤：训练判别器和训练生成器。这两个步骤交替进行，以使整个GAN模型能够逐渐收敛。

训练判别器(Discriminator Training)：在每个训练迭代中，首先需要训练判别器来区分真实的发电数据和生成的发电数据。具体步骤如下：

训练判别器(Discriminator Training)：初始化判别器的权重和偏置，用于对生成器生成的发电数据和真实的发电数据进行分类。使用真实发电数据作为正例，并从生成器生成的发电数据作为负例，构建一个具有标签的数据集。将这个包含真实和生成数据的数据集输入到判别器中，然后计算预测结果，并计算损失函数。生成器的损失函数(Generator Loss)通常采用对抗损失函数(Adversarial Loss)，用于指导生成器生成更逼真的数据。常见的对抗损失函数是二进制交叉熵(Binary Cross Entropy)损失函数：

L_gen＝-mean(log(D(G(z))))

其中，L_gen为生成器的损失函数，D为判别器的输出，G为生成器的输出，z为生成器的输入噪声；判别器的损失函数(DiscriminatorLoss)也采用二进制交叉熵损失函数，它用于指导判别器区分生成器生成的数据和真实数据，表示为：

L_dis＝-mean(log(D(x))+log(1-D(G(z))))

其中，L_dis为判别器的损失函数，D(x)为判别器对真实数据的评估，D(G(z))为判别器对生成器生成的数据的评估，在训练过程中，生成器和判别器是相互竞争的，生成器的目标是最小化L_gen，而判别器的目标是最小化L_dis，使其准确地区分生成器生成的数据和真实数据。

进行100次迭代，若连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，并且生成器和判别器的损失函数变化都很小，则认为模型稳定，停止训练；若连续多次迭代中，L_gen≤生成器阈值，但L_dis＞判别器阈值，则判别器的训练存在问题，增加判别器的训练频率或训练迭代次数，直至连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，停止训练，若经过100次迭代后判别器的损失函数仍高于判别器阈值，则调整判别器的网络架构，并重新检查数据是否存在偏差或不足；若连续多次迭代中，L_dis≤判别器阈值，但L_gen＞生成器阈值，则生成器的训练存在问题，增加生成器的训练频率或训练迭代次数，引入更复杂的噪声模式，直至连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，停止训练，若经过100次迭代后生成器的损失函数仍高于生成器阈值，则调整生成器的网络结构，并实验不同的噪声输入模式，提高生成数据的质量和多样性；若经过100次迭代后，L_dis＞判别器阈值且L_gen＞生成器阈值，则整个对抗网络的训练存在问题，同时增加生成器和判别器的训练迭代次数，直至连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，停止训练，若经过100次迭代后生成器和判别器的损失仍高于阈值，则对整个网络架构进行大规模的调整或重新设计，深入分析训练数据，确保数据的质量和代表性，重新思考训练策略，重新进行训练。

步骤四、通过以上三种步骤；需要对模型评估和预测：用测试集的数据来评估模型的性能，通常使用各种性能指标。一旦模型通过测试，可以使用它来进行未来光伏发电的预测。

在评估训练完成的GAN模型时，通过计算生成的发电数据与真实发电数据之间的准确性来评估模型的性能，指标包括准确度、精确度、召回率和F1分数；准确度衡量生成的发电数据中正确预测的比例，即真阳性和真阴性样本的比例，表示为：

其中，A为准确度，N为总样本数，N₁₁为真阳性的样本数量，N₁₂为真阴性的样本数量；精确度指生成的发电数据中正例的预测准确率，即真阳性样本比例，表示为：

其中，P为精确度，N₂₁为假阳性的样本数量；召回率衡量模型对正例的识别能力，即正确预测的正例样本与实际正例样本的比例，表示为：

其中，R为召回率，N₂₂为假阴性的样本数量；F1分数综合了精确度和召回率，是精确度和召回率的调和平均值，表示为：

其中，F1为F1分数。

A和F1的数值均为接近1的时候模型预测性能好。若A≥0.9且F1≥0.9，则模型评估为优秀，实施持续的性能监控，定期检查防止模型性能下降，进一步挖掘和利用数据中的深层次信息，在不同的数据集和实际应用场景中测试模型；若A≥0.8且F1≥0.8或A≥0.9且0.8＜F1＜0.89，则模型评估为良好，进行微调提高准确度或F1分数，引入更多样化的数据，提升模型对不同数据分布的适应性，使用更复杂的对抗训练策略，增强生成器和判别器的性能；若A≥0.7且F1≥0.7或A≥0.8且0.7＜F1＜0.79或A≥0.9且F1＜0.8，则模型评估为中等，进行改进，分析错误分类的样本，识别模型的弱点，对现有网络架构进行调整，增加层次、改变激活函数或引入新的网络模块；若A≥0.6且F1≥0.6或A≥0.7且0.6＜F1＜0.69或A＜0.6且F1≥0.7，则模型评估为差，深入分析原因，重新考虑数据源，彻底审查原始数据集，确保数据质量和相关性，使用不同的网络结构，重新进行对抗网络模型的训练；若A＜0.6且F1＜0.6，则模型评估为不合格，性能远不符合要求，需要从头开始重新设计，重新构建模型架构，检查数据集是否适合问题，或者是否需要重新定义问题，重新评估问题设置、数据质量和是否有必要收集更多或不同类型的数据。

实施例2

参照图4，为本发明第二个实施例，其不同于前一个实施例的是，提供了一种用于预测新能源发电量的生成对抗网络系统，包括：数据采集模块、数据预处理模块、生成器模块、判别器模块、模型训练优化模块及模型评估模块。

数据采集模块收集和准备用于训练和测试模型的数据，包括从各种来源收集原始数据。

数据预处理模块清洗和转换原始数据，用于模型训练，包括处理缺失值、筛选异常值。

生成器模块负责生成真实数据的新数据样本。

判别器模块区分生成器生成的数据和真实数据，通过与生成器的对抗训练，提高模型在处理真实世界数据时的准确性和鲁棒性。

模型训练优化模块使用训练数据集训练和优化生成器和判别器。

模型评估模块使用测试集和各种评估指标评估模型的性能。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)、便携式计算机盘盒(磁装置)、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编辑只读存储器(EPROM或闪速存储器)、光纤装置以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方其中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

实施例3

参照图5和图6，为本发明第三个实施例，其不同于前两个实施例的是：为对本发明中采用的技术效果加以验证说明，以验证本方法所具有的真实效果。

将得到的模型用于实时预测新能源发电，根据实际的天气数据和时间戳，生成对应的发电数据。可以通过每隔一段时间重新训练模型来不断优化预测结果。

为了将已训练的GAN模型成功部署到目标应用程序中，必须导出该模型并将其集成到系统中，同时建立数据输入接口，以确保模型能够接受不同来源的输入数据。核心任务是模型推理，即确保模型能够根据输入数据生成准确的预测结果。此外，性能优化是关键，以确保模型能够高效运行，可能需要压缩和量化等技术。最后，安全性是不可或缺的，确保数据的隐私和完整性，包括数据的加密和安全控制。这些技术特征共同确保了模型的有效性、可靠性和安全性，使其在实际应用中能够成功应用于光伏发电预测等领域。

通过真实数据集对于短时间内光伏发电功率进行预测，对于真实数据的缺失值采用0来代替，同时利用箱型图剔除异常值。

实验中评估了利用GAN光伏发电的loss图像收敛图，通过Adam优化算法对模型进行优化，提高模型的收敛速度。图5和图6说明了本发明利用测试数据集对模型进行测试本发明提出的方法能够较为准确地预测短期光伏发电其预测值与真实值相差不大。

应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种用于预测新能源发电量的生成对抗网络方法，其特征在于：包括，

收集数据，并对收集的数据进行数据预处理；

对抗网络架构设计，创建一个生成器和一个判别器网络模型；

进行对抗网络模型的训练，生成器和判别器交替训练；

对模型评估和预测，用测试集的数据来评估模型的性能。

2.如权利要求1所述的一种用于预测新能源发电量的生成对抗网络方法，其特征在于：所述数据包括光照强度、温度、风速、电流、电压和发电量参数；

所述数据预处理包括采用插值法补充缺失值和采用Robust统计方法筛选异常值；

采用Robust统计方法筛选异常值表示为，

M_ed＝Z(x₁,x₂,x₃,...,x_n)

M_J＝|x_i-M_ed|

MAD＝Z(|x₁-M_ed|,|x₂-M_ed|,...,|x_n-M_ed|)

Y＝{x||x_i-M_ed|＞k×MAD}

3.如权利要求2所述的一种用于预测新能源发电量的生成对抗网络方法，其特征在于：所述对抗网络包括，使用卷积神经网络作为判别器，生成器使用递归神经网络LSTM生成数据；

所述生成器包括，生成器的输入为一个噪声向量z，LSTM单元的输入是噪声向量z，LSTM层使用LSTM处理输入序列z，LSTM的输出是一个隐藏状态h_t，更新公式表示为，

i_t＝σ(W_i*[h_t-1,z_t]+b_i)

f_t＝σ(W_f*[h_t-1,z_t]+b_f)

g_t＝tanh(W_g*[h_t-1,z_t]+b_g)

o_t＝f_t*c_t-1+i_t*g_t

c_t＝f_t*c_t-1+i_t*g_t

h_t＝ot*tanh(ct)

其中，i_t为LSTM单元的输入门的激活值，f_t为LSTM单元的遗忘门的激活值，g_t为LSTM单元的细胞门的激活值，o_t为LSTM单元的输出门的激活值，W_i为LSTM单元的输入门的权重矩阵，W_f为LSTM单元的遗忘门的权重矩阵，W_g为LSTM单元的细胞门的权重矩阵，W_o为LSTM单元的输出门的权重矩阵，b_i为LSTM单元的输入门的偏置项，b_f为LSTM单元的遗忘门的偏置项，b_g为LSTM单元的细胞门的偏置项，b_o为LSTM单元的输出门的偏置项，h_t为隐藏状态，C_t为细胞状态；

生成器的输出为一个与数据维度相匹配的向量。

4.如权利要求3所述的一种用于预测新能源发电量的生成对抗网络方法，其特征在于：所述对抗网络的训练包括，使用历史数据集进行训练，生成器从随机噪声向量中生成合成发电数据，判别器评估生成的数据与真实数据的相似度，生成器和判别器通过对抗学习使得生成器提高生成数据的质量，判别器也提高鉴别真伪的能力。

5.如权利要求4所述的一种用于预测新能源发电量的生成对抗网络方法，其特征在于：所述对抗网络的训练还包括，在每个训练迭代中，训练判别器区分真实的发电数据和生成的发电数据，初始化判别器的权重和偏置，对生成器生成的发电数据和真实的发电数据进行分类，使用真实发电数据作为正例，并从生成器生成的发电数据作为负例，构建一个具有标签的数据集，将包含真实和生成数据的数据集输入到判别器中，然后计算预测结果，并计算损失函数，生成器的损失函数采用对抗损失函数，指导生成器生成更逼真的数据，表示为，L_gen＝-mean(log(D(G(z))))

其中，L_gen为生成器的损失函数，D为判别器的输出，G为生成器的输出，z为生成器的输入噪声；

判别器的损失函数采用二进制交叉熵损失函数，表示为，

L_dis＝-mean(log(D(x))+log(1-D(G(z))))

其中，L_dis为判别器的损失函数，D(x)为判别器对真实数据的评估，D(G(z))为判别器对生成器生成的数据的评估，

在训练过程中，生成器和判别器是相互竞争的，生成器的目标是最小化L_gen，而判别器的目标是最小化L_dis；

若连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，并且生成器和判别器的损失函数变化都很小，则认为模型稳定，停止训练；

若连续多次迭代中，L_gen≤生成器阈值，但L_dis＞判别器阈值，则判别器的训练存在问题，增加判别器的训练频率或训练迭代次数，直至连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，停止训练，若经过100次迭代后判别器的损失函数仍高于判别器阈值，则调整判别器的网络架构，并重新检查数据是否存在偏差或不足；

若连续多次迭代中，L_dis≤判别器阈值，但L_gen＞生成器阈值，则生成器的训练存在问题，增加生成器的训练频率或训练迭代次数，引入更复杂的噪声模式，直至连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，停止训练，若经过100次迭代后生成器的损失函数仍高于生成器阈值，则调整生成器的网络结构，并实验不同的噪声输入模式；

若经过100次迭代后，L_dis＞判别器阈值且L_gen＞生成器阈值，则整个对抗网络的训练存在问题，同时增加生成器和判别器的训练迭代次数，直至连续多次迭代中，L_gen≤生成器阈值且L_dis≤判别器阈值，停止训练，若经过100次迭代后生成器和判别器的损失仍高于阈值，则对整个网络架构进行大规模的调整或重新设计，深入分析训练数据，确保数据的质量和代表性，重新思考训练策略，重新进行训练。

6.如权利要求5所述的一种用于预测新能源发电量的生成对抗网络方法，其特征在于：所述模型评估包括，在评估训练完成的GAN模型时，通过计算生成的发电数据与真实发电数据之间的准确性来评估模型的性能，指标包括准确度、精确度、召回率和F1分数；

所述准确度衡量生成的发电数据中正确预测的比例，即真阳性和真阴性样本的比例，表示为，

其中，A为准确度，N为总样本数，N₁₁为真阳性的样本数量，N₁₂为真阴性的样本数量；

所述精确度指生成的发电数据中正例的预测准确率，即真阳性样本比例，表示为，

其中，P为精确度，N₂₁为假阳性的样本数量；

所述召回率衡量模型对正例的识别能力，即正确预测的正例样本与实际正例样本的比例，表示为，

其中，R为召回率，N₂₂为假阴性的样本数量；

所述F1分数综合了精确度和召回率，是精确度和召回率的调和平均值，表示为，

其中，F1为F1分数。

7.如权利要求6所述的一种用于预测新能源发电量的生成对抗网络方法，其特征在于：所述模型评估还包括，若A≥0.9且F1≥0.9，则模型评估为优秀，实施持续的性能监控，定期检查防止模型性能下降，进一步挖掘和利用数据中的深层次信息，在不同的数据集和实际应用场景中测试模型；

若A≥0.8且F1≥0.8或A≥0.9且0.8＜F1＜0.89，则模型评估为良好，进行微调提高准确度或F1分数，引入更多样化的数据，提升模型对不同数据分布的适应性，使用更复杂的对抗训练策略；

若A≥0.7且F1≥0.7或A≥0.8且0.7＜F1＜0.79或A≥0.9且F1＜0.8，则模型评估为中等，进行改进，分析错误分类的样本，识别模型的弱点，对现有网络架构进行调整，增加层次、改变激活函数或引入新的网络模块；

若A≥0.6且F1≥0.6或A≥0.7且0.6＜F1＜0.69或A＜0.6且F1≥0.7，则模型评估为差，深入分析原因，重新考虑数据源，彻底审查原始数据集，确保数据质量和相关性，使用不同的网络结构，重新进行对抗网络模型的训练；

若A＜0.6且F1＜0.6，则模型评估为不合格，性能远不符合要求，需要从头开始重新设计，重新构建模型架构，检查数据集是否适合问题，或者是否需要重新定义问题，重新评估问题设置、数据质量和是否有必要收集更多或不同类型的数据。

8.一种采用如权利要求1～7任一所述的一种用于预测新能源发电量的生成对抗网络方法的系统，其特征在于：包括，数据采集模块、数据预处理模块、生成器模块、判别器模块、模型训练优化模块及模型评估模块；

所述数据采集模块收集和准备用于训练和测试模型的数据，包括从各种来源收集原始数据；

所述数据预处理模块清洗和转换原始数据，用于模型训练，包括处理缺失值、筛选异常值；

所述生成器模块负责生成真实数据的新数据样本；

所述判别器模块区分生成器生成的数据和真实数据，通过与生成器的对抗训练，提高模型在处理真实世界数据时的准确性和鲁棒性；

所述模型训练优化模块使用训练数据集训练和优化生成器和判别器；

所述模型评估模块使用测试集和各种评估指标评估模型的性能。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于：所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的一种用于预测新能源发电量的生成对抗网络方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于：所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的一种用于预测新能源发电量的生成对抗网络方法的步骤。