CN118133677A - 自适应风力机功率概率区间曲线建模方法及其应用系统 - Google Patents
自适应风力机功率概率区间曲线建模方法及其应用系统 Download PDFInfo
- Publication number
- CN118133677A CN118133677A CN202410340988.XA CN202410340988A CN118133677A CN 118133677 A CN118133677 A CN 118133677A CN 202410340988 A CN202410340988 A CN 202410340988A CN 118133677 A CN118133677 A CN 118133677A
- Authority
- CN
- China
- Prior art keywords
- neural network
- data
- network model
- qrbilstm
- wind turbine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000003062 neural network model Methods 0.000 claims abstract description 100
- 238000012549 training Methods 0.000 claims abstract description 70
- 238000005457 optimization Methods 0.000 claims abstract description 40
- 238000011156 evaluation Methods 0.000 claims abstract description 20
- 239000002245 particle Substances 0.000 claims abstract description 15
- 238000009826 distribution Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000010248 power generation Methods 0.000 claims abstract description 9
- 230000008859 change Effects 0.000 claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 23
- 238000012544 monitoring process Methods 0.000 claims description 22
- 210000002569 neuron Anatomy 0.000 claims description 22
- 238000004458 analytical method Methods 0.000 claims description 21
- 230000003044 adaptive effect Effects 0.000 claims description 20
- 238000007726 management method Methods 0.000 claims description 19
- 238000002790 cross-validation Methods 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 12
- 238000004140 cleaning Methods 0.000 claims description 11
- 238000013508 migration Methods 0.000 claims description 10
- 230000005012 migration Effects 0.000 claims description 10
- 238000013500 data storage Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000011217 control strategy Methods 0.000 claims description 6
- 230000000007 visual effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 46
- 238000010586 diagram Methods 0.000 description 8
- 238000012800 visualization Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 7
- 230000010354 integration Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013079 data visualisation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 230000008713 feedback mechanism Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011056 performance test Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 108090000672 Annexin A5 Proteins 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Landscapes
- Wind Motors (AREA)
Abstract
本发明涉及自适应风力机功率概率区间曲线建模方法及其应用系统,该方法包括:获取风电机组的目标数据,目标数据包括:风速数据和功率数据;对目标数据进行预处理,构建QRBiLSTM神经网络模型,利用粒子群算法对QRBiLSTM神经网络模型的网络结构参数搜索空间和训练参数进行自适应寻优,获取最优QRBiLSTM神经网络模型;将预处理后的目标数据输入最优QRBiLSTM神经网络模型,获取风力机功率概率区间曲线。本发明通过提供功率概率分布信息和置信区间,全面展现风力机实际功率输出的特性,能够根据风力机周围环境变化灵活调整模型,提高预测精度,为风力发电行业提供更可靠、准确的性能评估,为决策制定提供可信依据。
Description
技术领域
本发明涉及风电行业基于数据驱动的功率曲线建模技术领域,特别是涉及自适应风力机功率概率区间曲线建模方法及其应用系统。
背景技术
在风力发电领域,功率曲线建模是评估风力机性能和预测风能发电量的核心。传统确定性模型无法捕捉风能波动性和不确定性,限制了对风力机输出的准确预测。而且现有功率建模系统部署的预测模型是既定的模型,具有固定的参数和结构,静态无法考虑因机组实际运行中的动态变化且无法适应环境变化,降低了预测精度,阻碍了对风力机性能的准确评估和可靠预测。
功率概率区间曲线模型相比确定性功率曲线模型更全面考虑风速波动性和确定性对功率波动的影响。在概率区间预测中,区间预测与置信区间有关,置信区间由分位数确定,代表概率分布的不同位置,反映预测结果的上限或下限。神经网络能够通过多层次的特征提取和抽象,自动学习输入数据中的关键特征,精确捕获风速和功率之间的关系,从而更好地进行预测。过去的方法提出利用历史时段内风电功率概率的累积分布函数与预设概率对应的回归系数矩阵,修正预测时刻的风电功率概率预测的累积分布函数,实现功率的概率预测,这种基于回归系数的修正对数据质量和模型泛化有一定依赖性。过去的方法还提出一种基于子集误差集合的条件经验分布和各时刻的风电功率预测结果以及条件经验分布,获得风电功率概率预测结果。这种基于条件经验分布的方法则严重依赖先验分布的假设性。
发明内容
本发明的目的是旨在解决传统确定性风功率曲线建模方法的局限性,提出自适应风力机功率概率区间曲线建模方法及其应用系统,开发一种高度精确、全面考虑不确定性的风力机功率概率区间曲线建模方法,通过提供概率分布信息和置信区间,全面展现风力机实际功率输出的特性,能够根据风力机周围环境变化灵活调整模型,提高预测精度,为风力发电行业提供更可靠、准确的性能评估,为决策制定提供可信依据。
为实现上述目的,本发明提供了如下方案:
自适应风力机功率概率区间曲线建模方法,包括:
获取风电机组的目标数据,所述目标数据包括:风速数据和功率数据;
对所述目标数据进行预处理,构建QRBiLSTM神经网络模型,利用粒子群算法对所述QRBiLSTM神经网络模型的网络结构参数搜索空间和训练参数进行自适应寻优,获取最优QRBiLSTM神经网络模型;
将预处理后的所述目标数据输入所述最优QRBiLSTM神经网络模型,获取风力机功率概率区间曲线。
可选地,对所述目标数据进行预处理包括:
对所述目标数据进行数据清洗,将数据清洗后的目标数据进行归一化处理,对归一化处理后的目标数据进行数据切分,按照0.8:0.2的比例将数据切分成训练集和测试集。
可选地,构建所述QRBiLSTM神经网络模型前包括:
确定构建所述QRBiLSTM神经网络模型所需区间分布条件:
q=0.±05α
其中,q为分位数区间,α为置信度水平。
可选地,对所述QRBiLSTM神经网络模型的网络结构参数搜索空间进行自适应寻优包括:
设置所述QRBiLSTM神经网络模型的网络结构参数搜索空间,所述网络结构参数搜索空间包括:网络层数搜索空间和神经元数搜索空间;
通过使用嵌套循环的外层循环迭代遍历所述网络层数搜索空间中的每个元素,确定所述QRBiLSTM神经网络模型的层数量,针对所确定的层数量,在内循环中通过Python的itertools.product函数,并根据所设置的神经元数搜索空间,生成层数量对应的神经元数组合,即神经网络结构组合;
获取历史目标数据,根据所述神经网络结构组合,构建若干所述QRBiLSTM神经网络模型,定义适应度函数,设置各个所述QRBiLSTM神经网络模型的目标分位数,对所述历史目标数据进行5折交叉验证,获取每个所述目标分位数所对应的第一适应度函数值,将所述第一适应度函数值最小所对应的QRBiLSTM神经网络模型作为待寻优神经网络模型。
可选地,所述适应度函数为:
其中,Fitness为适应度函数值,mean为均值函数,MAE0.05、MAE0.5、MAE0.95为绝对误差,RMSE0.05、RMSE0.5、RMSE0.95为均方根误差。
可选地,对所述QRBiLSTM神经网络模型的训练参数进行自适应寻优,获取最优神经网络模型包括:
设置所述QRBiLSTM神经网络模型的训练参数,对所述训练参数进行组合,生成神经网络参数组合;所述训练参数包括:迭代次数和批处理量;
将所述神经网络参数组合分别输入所述的待寻优神经网络模型进行训练,获取所述待寻优神经网络模型的目标分位数所对应的第二适应度函数值,将所述第二适应度函数最小值所对应的待寻优神经网络模型作为最优神经网络模型。
可选地,获取所述最优神经网络模型后包括:
基于历史目标数据划分的测试集评估所述最优神经网络模型的性能,判断所述最优神经网络模型是否为最优性能,当所述优神经网络模型并非最优性能时,则重新对所述QRBiLSTM神经网络模型的训练参数进行自适应寻优,直至获取最优性能的神经网络模型。
为实现上述目的,本发明还提供了自适应风力机功率概率区间曲线建模方法的应用系统,包括以下步骤:
数据储存管理模块,用于从不同数据源获取风电机组的目标数据并整合,同时记录目标数据的相关信息,支持目标数据的追溯、分析以及备份,所述目标数据包括:风速数据和功率数据;
数据质量管理模块,用于对目标数据进行预处理,设置数据质量指标,通过所述数据质量指标对所述目标数据的质量进行监控,生成数据质量报告,跟踪数据质量变化,基于质量变化优化目标数据;
模型参数迁移模块,用于构建QRBiLSTM神经网络模型,对预处理后的目标数据进行数据相似性判断,若预处理后的目标数据与历史数据类似,则调用历史数据所对应的历史模型的参数作为所述QRBiLSTM神经网络模型的初始参数;
自适应建模模块,用于对所述QRBiLSTM神经网络模型的网络结构参数搜索空间和训练参数进行自适应寻优,获取最优神经网络模型;将预处理后的所述目标数据输入最优神经网络模型,获取风力机功率概率区间曲线;
可视化分析模块,用于将风力机功率概率区间曲线以图形化方式进行展示,评估模型在预测功率曲线方面的性能,根据评估结果,手动对最优神经网络模型的参数进行调整,并进行风力机的性能、发电量、控制策略的评估和决策;
系统状态监控模块,用于持续监测各个模块的运行状态,若出现故障,则显示出现问题的环节并发出预警。
本发明的有益效果为:
本发明精准的风力机功率概率区间曲线预测:利用粒子群优化技术驱动双向长短期记忆分位数回归神经网络,实现了对风力机功率概率区间曲线的自适应建模,不仅准确预测风力机功率输出,还能提供置信区间,全面反映实际功率输出的不确定性。
本发明自适应建模:根据操作人员的设定实时自适应建模,灵活适应不同环境条件和数据变化,这使得预测模型能够及时调整,提高了预测的准确性和可靠性。
本发明完善的应用系统设计:包含完整的应用系统,涵盖数据管理、质量管理、模型参数迁移、自适应调整与预测、可视化与分析以及系统状态监控等多个关键模块,这些模块相互协作,能够实时监测建模状态、处理数据质量问题,并提供用户友好的界面和深度数据探索功能,增强用户对模型的配置和数据的分析能力。
本发明增强决策支持能力:该系统性设计提升了风力机运行决策的可靠性,结合预测模型和历史数据,用户可以进行自主深度数据探索,做出更合理可靠的决策,这为风力机性能评估、发电量评估、控制策略优化和电力交易等提供了更高效、可靠的解决方案。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的QRBiLSTM分位数神经网示意图;
图2为本发明实施例的自适应分段优化策略流程图;
图3为本发明实施例的自适应风力机功率概率区间曲线建模方法流程图;
图4为本发明实施例的自适应风力机功率概率区间曲线建模方法的应用系统示意图;
图5为本发明实施例的建模所用的原始数据示意图;
图6为本发明实施例的建模使用的预处理后的数据示意图;
图7为本发明实施例的神经网络结构参数搜索空间组合生成程序示意图;
图8为本发明实施例的训练参数组合生成程序示意图;
图9为本发明实施例的功率概率区间曲线建模结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明主要涉及两个部分,第一部分是基于粒子群优化驱动的双向长短期记忆分位数神经网络的风力机功率概率区间曲线自适应建模方法,第二部分是利用建模方法实现在线自适应建模的系统。
本发明使用进行概率区间建模的双向长短期分位数回归神经网络主要由BiLSTM层和分位数损失函数构成。利用如下式的分位数损失函数估计目标变量的条件分布,从而提供不同分位数对应的预测结果。
其中,Lossq是某分位数对应的损失函数,y是实际值,是分位数q对应的预测值。QRBiLSTM的原理示意图如图1所示。
为了适应任何一个数据集都有精度足够高的模型,使用粒子群优化算法对QRBiLSTM神经网络的网络结构参数搜索空间和训练参数进行自适应寻优。在进行自适应模型调整时,为节省计算资源,采用分段优化策略,将优化过程划分为两个关键阶段。即先根据经验定迭代次数和批处理量进行网络结构的寻优,然后再在最优网络结构参数搜索空间的基础上进行训练参数的寻优。如图2所示是分段优化方案。
如图3所示,本发明公开了自适应风力机功率概率区间曲线建模方法,包括:获取风电机组的目标数据,目标数据包括:风速数据和功率数据;对目标数据进行预处理,构建QRBiLSTM神经网络模型,对QRBiLSTM神经网络模型的网络结构参数搜索空间和训练参数进行自适应寻优,获取最优神经网络模型;将预处理后的目标数据输入最优神经网络模型,获取风力机功率概率区间曲线。
对目标数据进行预处理包括:对目标数据采用基于四分位数法和回归检测综合异常值清洗方法进行数据清洗,将数据清洗后的目标数据进行归一化处理,对归一化处理后的目标数据进行数据切分。
数据预处理:在本技术方案中,数据清洗环节作为整个建模流程的关键步骤之一,旨在确保所使用数据的质量和可靠性,以提高功率曲线建模的可靠性和准确性。该步骤涉及对数据质量的提升,包括缺失值填充处理、特殊符号处理、异常值识别及清洗等环节。数据归一化:为了避免量纲和数据尺度在模型训练时的影响,对数据进行归一化处理,将数据缩放到[0,1]范围之内。数据切分:对归一化后的数据进行切分,将数据按照8:2的比例拆分成训练集、测试集。
构建QRBiLSTM神经网络模型前包括:确定构建QRBiLSTM神经网络模型所需区间分布条件,按照区间建模目标确定建模使用的分位数。分位数区间和置信度水平α转化满足:
q=0.5±0.5α
其中,q为分位数区间,α为置信度水平。
对QRBiLSTM神经网络模型的网络结构参数搜索空间进行自适应寻优包括:设置QRBiLSTM神经网络模型的网络结构参数搜索空间,对网络结构参数搜索空间进行组合,生成神经网络结构组合;网络结构参数搜索空间包括:网络层数和每层神经元数;获取历史目标数据,将历史目标数据划分为训练集和测试集,根据神经网络结构组合,构建若干QRBiLSTM神经网络模型,根据若干QRBiLSTM神经网络模型,设定各个模型的目标分位数,对训练集进行5折交叉验证,获取每个目标分位数所对应的适应度函数,将适应度函数最小所对应的QRBiLSTM神经网络模型作为待寻优神经网络模型,具体的最优模型寻找过程:采用分段寻优过程,第一阶段,固定迭代次数epoch和批处理batch_size,在粒子群优化程序中,设置神经网络参数范围,并使用神经网络结构组合生成方法神经生成不同的神经网络结构组合,作为粒子群的搜索空间,粒子群在进行最优搜索时,每搜索到一个神经网络结构组合,便会通过如图1所示的方法构建神经网络模型,进而使用数据分割得到的训练集数据进行模型训练。在模型训练时,采用5折交叉验证方法评估模型性能,在使用五折交叉验证方法时,会将训练集数据随机分为五份,每次将其中四份作为训练数据进行模型的训练,另外一份作为验证集,使用训练好的模型来预测验证集对应不同分位数对应的预测值,(每个分位数对应一个预测值输出),进而使用验证集对应的真实值和预测值来计算能评估该模型性能的每个分位数对应的平均绝对误差MAE和均方根误差。这样的操作进行五次,将每一份数据都做一次验证集来计算评估值。最后,在结束5折交叉验证时,使用公式计算一个平均值作为粒子群算法的适应度值。
模型结构优化:
模型结构参数搜索范围定义:设定BiLSTM网络结构进行参数搜索时的范围,包括每层神经元数和网络层数。
神经网络结构参数搜索空间组合空间生成。
定义适应度函数:
每一轮参数搜索时,目标分位数对应的5折交叉验证的绝对误差和均方根误差的均值作为优化算法的适应度函数。
PSO优化算法搜索最优参数组合:
在每一轮搜索中,使用参数组合搭建模型,并进行5折交叉验证,返回每个目标分位数对应的5折交叉验证的绝对误差和均方根误差的均值最小的模型参数组合对应的模型。
获取适应度函数的方法为:
其中,Fitness为适应度值,mean为均值,MAE0.05、MAE0.5、MAE0.95为分位数0.05,0.5,0.95对应的绝对误差,RMSE0.05、RMSE0.5、RMSE0.95为分位数0.05,0.5,0.95对应的均方根误差。
对QRBiLSTM神经网络模型的训练参数进行自适应寻优,获取最优神经网络模型包括:设置QRBiLSTM神经网络模型的训练参数范围,对训练参数进行组合生成,生成神经网络参数组合;训练参数包括:迭代次数和批处理量;将神经网络参数组合分别输入待寻优神经网络模型进行训练,获取待寻优神经网络模型的目标分位数所对应的适应度函数,将适应度函数最小所对应的训练后的待寻优最优网络结构的神经网络模型作为最优神经网络模型。
模型参数训练优化:
模型训练参数搜索范围定义:设定参数搜索空间,如迭代次数、批处理量等。
神经网络训练参数组合空间生成。
PSO优化算法搜索最优训练参数组合:使用和第一阶段相同的适应度函数和最优神经网络结构的模型,每次带入不同的训练参数进行模型训练,返回每个目标分位数对应的5折交叉验证的绝对误差和均方根误差的均值最小的模型训练参数组合。
获取最优神经网络模型后包括:基于测试集评估最优神经网络模型的性能,判断最优神经网络模型是否为最优性能,当优神经网络模型并非最优性能时,则重新对QRBiLSTM神经网络模型的训练参数进行自适应寻优,直至获取最优性能的神经网络模型。
性能评估
在测试集上根据第一阶段和第二阶段获得的最优网络结构参数搜索空间和最优训练参数组成的最优模型进行性能测试,如果在测试集上的目标分位数对应的拟合预测评估值平均绝对误差(Mean Absolute Error.MAE)、均方根误差(Root Mean Square Error)RMSE和区间性能评估值平均预测区间中心偏差(Mean Predict Interval CenterDeviation.MPICD)、综合指标(Composite Indicator.CI)小于阈值,则将该寻优结果所得到的模型作为最适应某特定运行阶段风功率数据概率功率区间曲线模型。如果大于阈值则重新生成不同的参数组合进行寻优。
如图4所示,自适应风力机功率概率区间曲线建模方法的应用系统,包括以下步骤:数据储存管理模块,用于从不同数据源获取风电机组的目标数据并整合,同时记录目标数据的相关信息,支持目标数据的追溯、分析以及备份,目标数据包括:风速数据和功率数据;数据质量管理模块,用于对目标数据进行预处理,设置数据质量指标,通过数据质量指标对目标数据的质量进行监控,生成数据质量报告,跟踪数据质量变化,基于质量变化优化目标数据;模型参数迁移模块,用于构建QRBiLSTM神经网络模型,对预处理后的目标数据进行数据相似性判断,若预处理后的目标数据与历史数据类似,则调用历史数据所对应的历史模型的参数作为QRBiLSTM神经网络模型的初始参数;自适应建模模块,用于对QRBiLSTM神经网络模型的网络结构参数搜索空间和训练参数进行自适应寻优,获取最优神经网络模型;将预处理后的目标数据输入最优神经网络模型,获取风力机功率概率区间曲线;可视化分析模块,用于将风力机功率概率区间曲线以图形化方式进行展示,评估模型在预测功率曲线方面的性能,根据评估结果,手动对最优神经网络模型的参数进行调整,并进行风力机的性能、发电量、控制策略的评估和决策;系统状态监控模块,用于持续监测各个模块的运行状态,若出现故障,则显示出现问题的环节并发出预警。
自适应风力机功率概率区间曲线建模方法的应用系统主要包括数据储存管理模块、数据质量管理模块、历史模型参数迁移模块、模型自适应调整与预测模块、可视化与分析模块、系统状态监控模块,如图4所示。每个模块包括的单元和实现的功能如下:
1.数据储存管理模块:
数据集成与整合单元:
功能:负责从不同风力机SCADA系统和气象数据源等收集数据,并将其整合成统一格式以供后续处理和分析,并记录数据来源、采集时间、地理位置信息等,以支持数据的追溯和分析。
数据存储与归档单元:
功能:负责数据的安全存储和归档,确保数据长期保存,并提供快速可靠的检索能力。
历史模型与参数存储单元:
功能:记录历史模型和参数,对历史模型和参数进行分类管理,以便于区分和调用不同类型数据对应的模型参数,支持模型追溯、调用和管理。
数据备份与恢复单元:
功能:定期备份数据,提供数据恢复功能,以防止数据丢失或损坏。
2.数据质量管理模块
数据清洗与异常处理单元:
功能:负责识别和处理数据中的异常、噪声、重复项以及缺失值,确保数据的质量和准确性。
数据标准化与规范化单元:
功能:将数据进行转换,以适应神经网络的训练。
质量度量与监控单元:
功能:设立和监控数据质量指标,及时发现数据问题并进行调整和优化。
质量报告与记录单元:
功能:生成数据质量报告,跟踪数据质量变化,提出改进措施以维护和提升数据质量水平。
3.模型参数迁移模块
历史模型与参数调用单元:
功能:调用历史模型及其相应的参数、维护历史模型和参数的记录。
数据相似性判断单元:
功能:对比新数据类型与历史数据类型,评估相似性以确定模型参数迁移的可能性。
参数初始化支持单元:
功能:如果新数据与历史数据类型相似,则支持利用历史模型的参数作为初始值,用于新模型的参数初始化。
4.自适应建模模块
数据接收单元:
功能:接收其他模块传输的数据,负责处理和准备数据以供模型使用。其主要任务是有效地接收、整合和准备来自各个模块的数据,以满足模型的输入要求。
自适应参数优化单元:
功能:使用PSO算法实时调整模型参数,包括结构和训练参数,以适应不断变化的数据和环境。
自适应预测与输出单元:
功能:利用经过自适应调整的模型进行实时预测,生成风力机功率概率区间曲线或相关预测结果。
性能监测与反馈单元:
功能:定期监控模型在实际数据上的性能表现,评估模型预测的准确性和效果,识别模型的潜在问题或不准确性。提供反馈机制,使模型能够根据监测到的性能指标进行调整和优化,以实现持续性能改进和适应环境变化。
5.可视化与分析模块
数据可视化单元:
功能:负责将不同环境条件下的风力机概率功率区间曲线、风速分布等数据以图形化方式展示,便于用户直观理解和分析。
交互式界面单元:
功能:创建可交互的界面,允许操作人员设定模型调整的参数和条件,以满足特定的预测需求,如精度、时间范围等设定。
数据探索分析与决策单元:
功能:允许操作人员利用模型和数据进行深入分析,进行风力机的性能、发电量、控制策略等的评估和决策。
实时反馈与调整单元:
功能:基于实时数据和模型输出,评估模型在预测功率概率区间曲线方面的性能,以图表形式呈现评估结果,提供即时反馈,支持用户对系统参数、模型、评估指标以及其它参数进行设置和调整,以优化预测效果和系统性能。
6.系统状态监控模块:
实时监控单元:持续监测系统运行状态,包括数据更新情况、模型训练进度等,确保系统稳定运行。
故障检测与预警单元:监控模型训练和预测的异常情况,并在必要时发出预警,以便及时调整和修复。
以如图5-6所示的数据及为例,利用本发明提出的基于粒子群优化驱动的双向长短期记忆分位数神经网络的风力机概率区间功率曲线自适应建模方法对两个不同类型数据集进行自适应概率功率区间曲线建模。
第一步:数据接收
接收风电机组某一个时间段内的风速和功率数据,如图1所示的数据。
第二步:数据预处理
使用方案技术中描述的数据预处理方法对数据进行处理。处理结果如图6所示。
第三步:数据归一化
为了避免量纲和数据尺度在模型训练时的影响,对数据进行归一化处理,将数据缩放到[0,1]范围之内。
归一化公式如下:
第四步:数据切分
将数据按照8:2的比例拆分成训练集、测试集。
第五步:确定分布条件
以置信度百分之九十为例,进行概率功率曲线建模。置信度百分之九十,即由分位数0.05和分位数0.95组成的置信区间。
第六步:自适应概率功率区间建模
第一阶段:模型结构优化
模型结构参数搜索范围定义:设定QRBiLSTM网络的参数搜索范围,包括每层神经元数和网络层数,每层神经元数设置为[16,32,64,128],网络层数设置为[2,3,4,5,6]。
神经网络结构组合生成:利用如图7所示的程序生成神经网络结构组合。
首先确定网络层数和每层神经元。例如层数=[2,3,4,5],经元数=[16,32,64,128],使用嵌套循环遍历了这两个参数空间中的所有可能组合,首先,外层循环迭代遍历了层数中的每个元素,确定了BiLSTM层的数量。在内层循环中,本发明通过使用嵌套循环的外层循环迭代遍历所述网络层数搜索空间中的每个元素,确定所述QRBiLSTM神经网络模型的层数量,针对所确定的层数量,在内循环中通过Python的itertools.product函数根据设置的神经元数搜索空间生成层数量对应的神经元数组合,即神经网络结构组合,使得本发明能够全面地探索参数空间,从而提高模型的性能和准确性。
按照图3的输入,则会生成组合1360个神经网络结构参数搜索空间组合,比如[16,16],[16,32],[16,64],...,[16,32,64]等不同的神经网络结构组合。
定义适应度函数
每一轮参数搜索时,目标分位数对应的5折交叉验证的绝对误差和均方根误差的均值作为优化算法的适应度函数。
PSO优化算法搜索最优参数组合:
在每一轮搜索中,使用参数组合搭建模型,搭建模型的程序如补图所示。根据搜索的参数组合搭建的模型训练集上进行5折交叉验证,返回每个目标分位数对应的5折交叉验证的绝对误差和均方根误差的均值最小的模型并保存。数据集1和2神经网络结构寻优结果分别是(16,16,64,32)和(32,64,64,128,128),即数据集1的最优神经网络结构是总共4层,第一层16个神经元,第二层16个神经元,第三层64个神经元,第四层32个神经元;数据集2的最优神经网络结构是总共5层,第一层32个神经元,第二层64个神经元,第三层64个神经元,第四层128个神经元,第五层128个神经元。
5折交叉验证是在训练集上进行的。具体实现过程是将训练集分为5份,然后每次选择四份作为训练集进行模型训练,一份作为验证集进行模型性能评估,计算评估值,即每个分位数对应的MAE和RMSE。这样的操作进行5此,达到将每一份数据集做一次验证机,另外四份数据集训练一个模型。最后将每次计算的评估数值进行平均,将平均值作为粒子群优化算法的适应度值。至于如果获取均值最小的模型,就是通过粒子群优化算法搜索不同参数组合对应的5折验证的评估值均值最小值来实现的。粒子群寻优目标就是寻找适应度函数的最小值。
第二阶段:模型训练参数优化
模型训练参数搜索范围定义:设定参数搜索空间,如迭代次数、批处理量等。迭代次数选择=[64,128,256,512],批处理量选择=[32,64,128,256];
神经网络结构组合生成:利用如图8的程序生成不同迭代次数、批处理、的组合。
PSO优化算法搜索最优训练参数组合:使用上述的适应度函数和的最优神经网络结构的模型,每次带入不同的训练参数进行模型训练,返回每个目标分位数对应的5折交叉验证的绝对误差和均方根误差的均值最小的模型训练参数组合。本发明数据集1的训练参数寻优结果是迭代次数=128,批处理量=64,数据集2的训练参数训练结果是迭代次数=256,批处理量=128。
最优模型训练性能评估
在测试集上根据第一阶段和第二阶段获得的最优网络结构参数搜索空间和最优训练参数组成的最优模型进行性能测试,如果在测试集上的目标分位数对应的拟合预测评估值平均绝对误差MAE、均方根误差RMSE和区间性能评估值平均预测区间中心偏差MPICD、综合性能指标CI小于设定的阈值,则将该寻优结果所得到的模型作为最适应某特定运行阶段风功率数据概率功率区间曲线模型。如果大于阈值则重新调整参数搜索范围进行寻优。
平均绝对误差MAE:
均方根误差RMSE:
平均预测区间中心偏差MPICD:
综合性能指标CI:CI=PINAW/PICP
预测区间覆盖率:
预测区间归一化平均宽度:
其中,N是预测数据点总数,pi是第i个功率实际值,是第i个功率预测值,ui是第i个功率区间预测的置信上界预测值,li是第i个功率区间预测的置信下界预测值。
使用最优模型在整个数据集上进行风功率概率区间功率曲线建模,建模结果如图9所示。
针对本发明提出的自适应风力机功率概率区间曲线建模方法的应用系统,以构建一个特定风功率数据集的功率概率区间曲线为例,各模块及单元的工作如下。
当操作人员启动自适应建模时,可视化与分析模块的交互式界面单元提供用户友好的界面,允许设置建模要求。
当接到建模命令数据储存管理模块数据集成与整合单元负责从不同数据源收集数据并整合,确保数据完整性,同时记录数据的相关信息,支持数据的追溯和分析,并且数据备份与恢复单元对数据进行备份,防止数据丢失。
数据质量管理模块的数据清洗与异常处理单元接收到数据集成与整合单元集成的数据开始识别并处理数据中的异常、噪声、重复项和缺失值,确保数据质量,接着数据标准化与规范化单元将数据进行转换,保证神经网络的正常训练;同时质量度量与监控单元根据操作人员在可视化与分析模块的实时反馈与调整单元提前设置好的数据质量指标,对数据质量进行监控,及时发现数据问题并进行调整和优化;同时质量报告与改进单元生成数据质量报告,跟踪数据质量变化,提出改进措施以维护和提升数据质量水平。
将处理好的数据传递到模型参数迁移模块中的数据相似性判断单元进行判断数据相似性,如果数据和数据储存管理模块中的历史模型与参数存储单元的历史数据类似,则通过历史模型与参数调用单元从历史记录中调用相似模型和参数作为新模型的初始值,然后模型参数迁移模块中参数初始化支持单元将该类似模型的参数设置为新模型的初始化参数。
接着自适应建模模块的数据接收单元接收、整合和准备来自数据质量管理模块、历史模型参数迁移模块、可视化与分析模块的数据并传递给自适应参数优化单元,该单元使用粒子群优化算法(PSO)调整QR-BiLSTM模型参数以构建某特定环境下的功率概率区间曲线模型;然后自适应预测与输出单元利用经过调整的模型和经过处理的数据进行概率区间功率曲线建模预测,生成概率区间功率曲线;同时性能监测与反馈单元定期监测模型预测的准确性,并提供反馈机制,优化模型性能。
预测得到的概率区间功率曲线和性能表现数据通过可视化与分析模块的数据可视化单元以图形化方式展示出来,便于用户直观理解和分析;实时反馈与调整单元会基于实时数据和模型输出,评估模型在预测功率曲线方面的性能,以图表形式呈现评估结果,提供即时反馈,用户可以根据可视化评估结果直接对系统参数或模型进行手动调整,以优化预测效果和系统性能;同时操作人员根据可视化结果还可以通过数据探索分析与决策单元,利用模型预测结果和数据进行深入分析,进行风力机的性能、发电量、控制策略等的评估和决策。每次优化得到的模型、参数及数据会通过数据储存管理模块中的历史模型与参数存储单元进行分类整合并保存以支持后期模型追溯、调用和管理。
系统状态监控模块的实时监控单元在整个系统运行时持续监测系统运行状态,包括数据更新情况、模型训练进度等,确保系统稳定运行。如果发现系统在建模运行过程中出现问题或者故障,故障检测与预警单元及时显示出现问题的环节并发出预警,以便及操作人员及时调整和修复。
这些模块及单元通过数据的传递和处理相互连接,构成了一个完整的自适应建模流程,为操作人员提供高效、准确的建模平台。
以上所述的实施例仅是对本发明优选方式进行的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (8)
1.自适应风力机功率概率区间曲线建模方法,其特征在于,包括:
获取风电机组的目标数据,所述目标数据包括:风速数据和功率数据;
对所述目标数据进行预处理,构建QRBiLSTM神经网络模型,利用粒子群算法对所述QRBiLSTM神经网络模型的网络结构参数搜索空间和训练参数进行自适应寻优,获取最优QRBiLSTM神经网络模型;
将预处理后的所述目标数据输入所述最优QRBiLSTM神经网络模型,获取风力机功率概率区间曲线。
2.根据权利要求1所述的自适应风力机功率概率区间曲线建模方法,其特征在于,对所述目标数据进行预处理包括:
对所述目标数据进行数据清洗,将数据清洗后的目标数据进行归一化处理,对归一化处理后的目标数据进行数据切分,按照0.8:0.2的比例将数据切分成训练集和测试集。
3.根据权利要求1所述的自适应风力机功率概率区间曲线建模方法,其特征在于,构建所述QRBiLSTM神经网络模型前包括:
确定构建所述QRBiLSTM神经网络模型所需区间分布条件:
q=0.5±0.5α
其中,q为分位数区间,α为置信度水平。
4.根据权利要求1所述的自适应风力机功率概率区间曲线建模方法,其特征在于,对所述QRBiLSTM神经网络模型的网络结构参数搜索空间进行自适应寻优包括:
设置所述QRBiLSTM神经网络模型的网络结构参数搜索空间,所述网络结构参数搜索空间包括:网络层数搜索空间和神经元数搜索空间;
通过使用嵌套循环的外层循环迭代遍历所述网络层数搜索空间中的每个元素,确定所述QRBiLSTM神经网络模型的层数量,针对所确定的层数量,在内循环中通过Python的itertools.product函数,并根据所设置的神经元数搜索空间,生成层数量对应的神经元数组合,即神经网络结构组合;
获取历史目标数据,根据所述神经网络结构组合,构建若干所述QRBiLSTM神经网络模型,定义适应度函数,设置各个所述QRBiLSTM神经网络模型的目标分位数,对所述历史目标数据进行5折交叉验证,获取每个所述目标分位数所对应的第一适应度函数值,将所述第一适应度函数值最小所对应的QRBiLSTM神经网络模型作为待寻优神经网络模型。
5.根据权利要求4所述的自适应风力机功率概率区间曲线建模方法,其特征在于,所述适应度函数为:
其中,Fitness为适应度函数值,mean为均值函数,MAE0.05、MAE0.5、MAE0.95为绝对误差,RMSE0.05、RMSE0.5、RMSE0.95为均方根误差。
6.根据权利要求4所述的自适应风力机功率概率区间曲线建模方法,其特征在于,对所述QRBiLSTM神经网络模型的训练参数进行自适应寻优,获取最优神经网络模型包括:
设置所述QRBiLSTM神经网络模型的训练参数,对所述训练参数进行组合,生成神经网络参数组合;所述训练参数包括:迭代次数和批处理量;
将所述神经网络参数组合分别输入所述的待寻优神经网络模型进行训练,获取所述待寻优神经网络模型的目标分位数所对应的第二适应度函数值,将所述第二适应度函数最小值所对应的待寻优神经网络模型作为最优神经网络模型。
7.根据权利要求6所述的自适应风力机功率概率区间曲线建模方法,其特征在于,获取所述最优神经网络模型后包括:
基于历史目标数据划分的测试集评估所述最优神经网络模型的性能,判断所述最优神经网络模型是否为最优性能,当所述优神经网络模型并非最优性能时,则重新对所述QRBiLSTM神经网络模型的训练参数进行自适应寻优,直至获取最优性能的神经网络模型。
8.自适应风力机功率概率区间曲线建模方法的应用系统,其特征在于,基于权利要求1-7任一项所述的自适应风力机功率概率区间曲线建模方法,所述系统包括以下步骤:
数据储存管理模块,用于从不同数据源获取风电机组的目标数据并整合,同时记录目标数据的相关信息,支持目标数据的追溯、分析以及备份,所述目标数据包括:风速数据和功率数据;
数据质量管理模块,用于对目标数据进行预处理,设置数据质量指标,通过所述数据质量指标对所述目标数据的质量进行监控,生成数据质量报告,跟踪数据质量变化,基于质量变化优化目标数据;
模型参数迁移模块,用于构建QRBiLSTM神经网络模型,对预处理后的目标数据进行数据相似性判断,若预处理后的目标数据与历史数据类似,则调用历史数据所对应的历史模型的参数作为所述QRBiLSTM神经网络模型的初始参数;
自适应建模模块,用于对所述QRBiLSTM神经网络模型的网络结构参数搜索空间和训练参数进行自适应寻优,获取最优神经网络模型;将预处理后的所述目标数据输入最优神经网络模型,获取风力机功率概率区间曲线;
可视化分析模块,用于将风力机功率概率区间曲线以图形化方式进行展示,评估模型在预测功率曲线方面的性能,根据评估结果,手动对最优神经网络模型的参数进行调整,并进行风力机的性能、发电量、控制策略的评估和决策;
系统状态监控模块,用于持续监测各个模块的运行状态,若出现故障,则显示出现问题的环节并发出预警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410340988.XA CN118133677A (zh) | 2024-03-25 | 2024-03-25 | 自适应风力机功率概率区间曲线建模方法及其应用系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410340988.XA CN118133677A (zh) | 2024-03-25 | 2024-03-25 | 自适应风力机功率概率区间曲线建模方法及其应用系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118133677A true CN118133677A (zh) | 2024-06-04 |
Family
ID=91243264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410340988.XA Pending CN118133677A (zh) | 2024-03-25 | 2024-03-25 | 自适应风力机功率概率区间曲线建模方法及其应用系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118133677A (zh) |
-
2024
- 2024-03-25 CN CN202410340988.XA patent/CN118133677A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10902368B2 (en) | Intelligent decision synchronization in real time for both discrete and continuous process industries | |
CN110148285B (zh) | 一种基于大数据技术的油井参数智能预警系统及其预警方法 | |
Adedipe et al. | Bayesian network modelling for the wind energy industry: An overview | |
Ochella et al. | Artificial intelligence in prognostics and health management of engineering systems | |
CN115578015B (zh) | 基于物联网的污水处理全过程监管方法、系统及存储介质 | |
CN114048600A (zh) | 一种数字孪生驱动的多模型融合工业系统异常检测方法 | |
CN116681187B (zh) | 一种基于企业经营数据的企业碳配额预测方法 | |
CN109471698B (zh) | 云环境下虚拟机异常行为检测系统和方法 | |
CN117234785B (zh) | 基于人工智能自查询的集控平台错误分析系统 | |
CN112363896A (zh) | 日志异常检测系统 | |
Dao et al. | Offshore wind turbine reliability and operational simulation under uncertainties | |
CN116683588B (zh) | 锂离子电池充放电控制方法及系统 | |
Huang et al. | Reliable machine prognostic health management in the presence of missing data | |
CN115238573A (zh) | 考虑工况参数的水电机组性能劣化趋势预测方法和系统 | |
Wang et al. | Tracking and predicting technological knowledge interactions between artificial intelligence and wind power: Multimethod patent analysis | |
CN117988988A (zh) | 一种基于特征扩增的航空发动机故障诊断方法及系统 | |
CN117523793A (zh) | 一种电厂设备故障预警方法和计算机设备 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
CN111984514A (zh) | 基于Prophet-bLSTM-DTW的日志异常检测方法 | |
Bond et al. | A hybrid learning approach to prognostics and health management applied to military ground vehicles using time-series and maintenance event data | |
CN118133677A (zh) | 自适应风力机功率概率区间曲线建模方法及其应用系统 | |
Li et al. | Research on digital twin and collaborative cloud and edge computing applied in operations and maintenance in wind turbines of wind power farm | |
Vasudevan et al. | A systematic data science approach towards predictive maintenance application in manufacturing industry | |
CN117829822B (zh) | 一种电力变压器故障预警方法及系统 | |
CN116760033B (zh) | 一种基于人工智能的实时电力需求预测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |