CN116701877A

CN116701877A - 一种基于条件扩散模型的风机异常值修复方法

Info

Publication number: CN116701877A
Application number: CN202310775360.8A
Authority: CN
Inventors: 朱圣晨; 马一鸣; 王彬
Original assignee: Mita Carbon Hangzhou Intelligent Technology Co ltd
Current assignee: Mita Carbon Hangzhou Intelligent Technology Co ltd
Priority date: 2023-06-28
Filing date: 2023-06-28
Publication date: 2023-09-05

Abstract

本发明公开了一种基于条件扩散模型的风机异常值修复方法，通过对风机的空间地理位置进行聚类，对聚类后的风机位置聚类簇内的目标风机和参考风机的历史风速数据进行分析，并确定各风机中的待进行功率异常值修复的目标风机与不需要进行功率异常值修复的若干参考风机；以参考风机对应的历史风速数据作为引导条件，基于条件扩散模型的扩散过程从噪声样本序列中随机提取噪声样本，进行加噪获取带噪信息的样本数据；通过带噪信息的样本数据训练优化去噪声模型∈_θ；并基于条件扩散模型的逆扩散过程，对噪声样本集进行逆运算实现风机异常值的修复。提高了风功率预测的准确率，提高风场的经济效益，为高精度风功率预测打下坚实的基础。

Description

一种基于条件扩散模型的风机异常值修复方法

技术领域

本发明涉及风力发电领域的风机异常值修复技术领域，尤其涉及一种基于条件扩散模型的风机异常值修复方法。

背景技术

在双碳背景下，风力发电至关重要。据调查，风力发电每发一度电，所消耗的碳仅有火力发电的1％。电网调度部门要进行合理的发电计划安排，提高电网运行的经济性、安全性、可靠性，因此风电功率的预测，成为至关重要的一环。

一般风机均有自身的风速-功率曲线，可由风速来预估功率，但是由于测风仪器故障、电网限电等问题，采集到的风速和实际发电功率，存在很多异常值，导致并不符合理想条件下的风速-功率曲线。对风场来说，风功率预测精度达不到国家标准，会被除以一定数额的罚款，并且可能对电网造成损害。修复风机异常值，为高精度风功率预测打下坚实基础。单个风场下，往往有数十甚至上百台风机，风机之间的地理位置及风机间的尾流，使得风机间的风速相互影响，造成通过风速-功率曲线对风机风电功率异常值的预测准确率较低的问题，为了更为准确的进行风功率预测，风机异常值的修复至关重要。

发明内容

本发明提供一种基于条件扩散模型的风机异常值修复方法，以克服上述技术问题。

为了实现上述目的，本发明的技术方案是：

一种基于条件扩散模型的风机异常值修复方法，包括以下步骤：

步骤S1：获取风场内的各风机所在位置的经纬度，根据所述各风机所在位置的经纬度对风机进行空间聚类，获取多个风机位置聚类簇；

基于所述风机位置聚类簇设定各风机的编码；并按时间顺序获取所述编码后的各风机每日内多个时间序列对应的历史风速数据；

所述历史风速数据包括异常数据与正常数据；

步骤S2：对获取的编码后的各风机的历史风速数据的异常数据进行数据清洗，确定各风机中的待进行功率异常值修复的目标风机与不需要进行功率异常值修复的若干参考风机；

步骤S3：从正态高斯分布中提取随机噪声获取噪声样本集；以所述参考风机对应的历史风速数据作为引导条件，基于条件扩散模型的扩散过程从噪声样本序列中随机提取噪声样本，并填充至所述目标风机的待进行功率异常值修复的数据，获取带噪信息的样本数据；

步骤S4：通过所述带噪信息的样本数据对去噪声模型∈_θ进行训练，优化所述去噪声模型∈_θ；

步骤S5：以所述参考风机对应的历史风速数据作为引导条件，通过所述优化的去噪声模型∈_θ基于条件扩散模型的逆扩散过程，对所述噪声样本集进行逆运算，实现风机异常值的修复。

进一步的，步骤S1中所述的并按时间顺序获取编码后的各风机每日内多个时间序列对应的历史风速数据为

基于第一时间间隔，对一定时间范围的历史风速数据进行采样并获取对应的第一时间序列历史风速数据表；同时基于第二时间间隔，获取对应的第二时间序列历史风速数据表，且所述第一时间间隔大于第二时间间隔。

进一步的，步骤S1中所述对历史风速数据的异常数据为

当风机满足：风机所接收的风速大于切入风速且小于切出风速，风机的功率为0；

或者风机所接收的风速大于风机的额定风速，风机的功率低于额定功率；

或者风机所接收的风速小于风机的额定风速，风机的功率不等于0；此时所述风机产生的数据均为异常数据。

进一步的，步骤S4中，所述优化去噪声模型具体为

步骤S4.1：设置去噪声模型的最大迭代次数，将带噪信息的样本数据输入去噪声模型∈_θ中，基于所述去噪声模型∈_θ对所述带噪信息的样本数据进行噪声估计，获得预测噪音样本序列；

步骤S4.2：根据所述预测噪音样本序列与从噪声样本序列中随机提取噪声样本计算损失函数；

步骤S4.3：采用梯度下降法最小化所述损失函数，进而优化更新所述去噪声模型中的学习参数；

步骤S4.4：判断所述去噪声模型∈_θ的损失函数是否收敛，若是，则停止训练，并保存训练好的去噪声模型∈_θ的学习参数；

否则，继续训练，直至达到最大迭代次数。

进一步的，步骤S3中所述基于条件扩散模型的扩散过程从噪声样本序列中随机提取噪声样本，并填充至所述目标风机的待进行功率异常值修复的数据，所述进行噪声填充的计算公式为

式中：表示扩散第t步后的带噪信息样本数据；α_t表示第t步噪声参数；∈表示采样时添加的符合标准高斯分布的噪声；∈～N(0，I)，N表示高斯分布；I表示单位矩阵；t～Uniform({1,…,T})，T表示预设条件扩散模型的最大扩散步数；/>表示条件扩散模型的待进行功率异常值修复的数据与引导条件的联合数据。

进一步的，步骤S4.3中所述采用梯度下降法最小化损失函数的表达式为

式中：表示梯度下降法的运算符号；θ表示模型参数；/>表示损失函数；∈表示采样时添加的符合标准高斯分布的噪声序列；∈～N(0，I)；∈_θ表示U-net神经网络；/>表示在待进行功率异常值修复的初始数据/>扩散第t步的条件下，获取的预测噪音样本。

进一步的，所述S5中对所述噪声样本集进行逆运算，具体为

步骤S5.1：以所述参考风机对应的历史风速数据作为引导条件，设定初始化扩散步数t₀为条件扩散模型的最大扩散步数T，对目标风机的待填充风速数据加入高斯噪声，获取扩散T步后的带噪信息样本数据

步骤S5.2：将所述带噪信息样本数据与引导条件输入至训练完成的去噪模型∈_θ，获得扩散T步后的带噪信息样本数据/>的预测噪音样本/>

步骤S5.3：将获取的扩散T步后的带噪信息样本数据与预测噪音样本导入逆向运算公式，获取扩散第T-1步后的带噪信息样本数据/>

且所述逆向运算公式为

式中：α_t表示第t步噪声参数；表示前t步的噪声累计；/>表示扩散第t步后的带噪信息样本数据；/>表示扩散第t-1步后的带噪信息样本数据；t表示扩散步数；ta表示目标风机的风速异常修复的引导条件；z表示符合标准高斯分布的噪声，且z～N(0，I)；N表示高斯分布；I表示单位矩阵；

步骤S5.4：重复执行步骤S5.3进行逆向迭代，直至获取扩散步数t＝1时对应的带噪信息样本数据

且所述扩散步数t＝1时对应的带噪信息样本数据即为目标风机异常值的修复数据。

有益效果：本发明公开了一种基于条件扩散模型的风机异常值修复方法，通过对风机的空间地理位置进行聚类，对聚类后的风机位置聚类簇内的目标风机和参考风机的历史风速数据进行分析，并确定各风机中的待进行功率异常值修复的目标风机与不需要进行功率异常值修复的若干参考风机；从正态高斯分布中提取随机噪声获取噪声样本集；以参考风机对应的历史风速数据作为引导条件，基于条件扩散模型的扩散过程从噪声样本序列中随机提取噪声样本，并填充至目标风机的待进行功率异常值修复的数据获取带噪信息的样本数据；通过带噪信息的样本数据对去噪声模型∈_θ进行训练，优化去噪声模型∈_θ；优化的去噪声模型∈_θ基于条件扩散模型的逆扩散过程，对噪声样本集进行逆运算实现风机异常值的修复。进而能够提高风功率预测的准确率，提高风场的经济效益，为高精度风功率预测打下坚实的基础。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种基于条件扩散模型的风机异常值修复方法流程图；

图2为本实施例中风机理想条件下的风速功率曲线示意图；

图3为本实施例中风机存在传感器故障、电网限电时的风速-功率曲线呈示意图；

图4为本实施例中风机沿时间轴的风速数据清洗示意图；

图5为本实施例中条件扩散模型的扩散与逆扩散的过程示意图；

图6为本实施例中基于条件扩散模型的逆过程恢复风机预测风速数据的流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本实施例提供了一种基于条件扩散模型的风机异常值修复方法，如图1所示，包括以下步骤：

步骤S1：获取风场内的各风机所在位置的经纬度，根据所述各风机所在位置的经纬度对风机进行空间聚类，获取多个风机位置聚类簇；其中，根据风场内各风机所在位置的，对风机进行空间聚类，采用的聚类方法为KMeans聚类；

所述按时间顺序获取编码后的各风机每日内多个时间序列对应的历史风速数据，具体为：基于第一时间间隔，对一定时间范围的历史风速数据进行采样并获取对应的第一时间序列历史风速数据表；同时基于第二时间间隔，获取对应的第二时间序列历史风速数据表，且所述第一时间间隔大于第二时间间隔；所述第一时间序列的时间间隔为1小时；所述第二时间序列的时间间隔为15分钟；例如：将某日中午11:00至12:00的第一时间序列进行划分，生成若干第二时间序列，所述第二时间序列即为11:00至11:15、11:15至11:30、11:30至11:45以及11:45至12:00；将所述历史风速数据表中的对应时间的历史风速数据进行匹配设置；

所述历史风速数据包括异常数据与正常数据；

在本实施例中，如当前第二时间序列为某日的15:00至15:15分，针对#1、#2、#3、#4风机的历史风速数据，其中#1风机风速值缺失为异常值，且#1风机为目标风机；其中异常值记为nan；#2、#3、#4风机的历史风速数据为正常值，则#2、#3、#4风机为参考风机，取#2、#3、#4风机的该第二时间序列的正常值作为引导条件，基于条件扩散模型来修复1#风机当前15:00至15:15时刻的风速数据，以此来完成风机异常值的修复。

具体地，风机存在切入风速、切出风速、额定风速，在出厂时均进行了标记。只有当风速在切入切出风速间，风机才能正常发电，当风速大于等于额定风速，小于切出风速时，风机的发电功率为额定功率，因此，理想条件下的风速功率曲线呈如图2所示；然而由于传感器故障、电网限电等一系列现实问题的存在，往往风速-功率曲线呈如图3所示：

当风机满足：风机所接收的风速大于切入风速且小于切出风速，风机的功率为0；或者风机所接收的风速大于风机的额定风速，风机的功率低于额定功率；或者风机所接收的风速小于风机的额定风速，风机的功率不等于0；此时所述风机产生的数据均为异常数据；否则，所述风机产生的数据为正常数据；

所述数据清洗具体为：基于风速-功率曲线清除掉切出风速范围内，功率为0的点；清除掉风速大于额定风速，功率却低于额定功率较多的点；清除掉风速小于额定风速，功率不为0的点；且清除后的数据如图4所示，实心点表示未被清除的数据，空心点表示被清除的数据，异常值记为nan；

步骤S5：以所述参考风机对应的历史风速数据作为引导条件，所述优化的去噪声模型∈_θ基于条件扩散模型的逆扩散过程，对所述噪声样本集进行逆运算，实现风机异常值的修复。

本发明通过对风机的空间地理位置进行聚类，对聚类后的风机位置聚类簇内的目标风机和参考风机的历史风速数据进行分析，并确定各风机中的待进行功率异常值修复的目标风机与不需要进行功率异常值修复的若干参考风机；从正态高斯分布中提取随机噪声获取噪声样本集；以参考风机对应的历史风速数据作为引导条件，基于条件扩散模型的扩散过程从噪声样本序列中随机提取噪声样本，并填充至目标风机的待进行功率异常值修复的数据获取带噪信息的样本数据；通过带噪信息的样本数据对去噪声模型∈_θ进行训练，优化去噪声模型∈_θ；优化的去噪声模型∈_θ基于条件扩散模型的逆扩散过程，对噪声样本集进行逆运算实现风机异常值的修复。电网需要风场提前上报未来的发电量，如果预报的发电量和实际发电量差异过大，将会被罚款，所以要对风功率进行精确预报，需要通过历史风速数据、功率数据对现有的风功率模型训练，但是风机异常值会造成功率模型精度下降，因此对风机异常值进行修复，有利于提高提高风功率预报精度，进而能够提高风功率预测的准确率，提高风场的经济效益，为高精度风功率预测打下坚实的基础。

在具体实施例中，步骤S4中，所述优化去噪声模型具体为

否则，继续训练，直至达到最大迭代次数。

具体地，所述基于条件扩散模型的扩散过程从噪声样本序列中随机提取噪声样本，并填充至所述目标风机的待进行功率异常值修复的数据，所述进行噪声填充的计算公式为

由于条件扩散模型包括扩散过程(Diffusion Process)模型与逆扩散过程模型，所述扩散过程(Diffusion Process)模型是实现逐步的向真实数据中添加噪声的扩散过程，以及逆扩散过程(也叫去噪过程Denoising Process)模型，实现从噪声中逐步进行预测的真实数据的逆扩散过程。如图5所示，扩散模型可以基于马尔可夫链，也可以基于其他的可以实现向真实数据中添加噪声的扩散过程的模型。比如，在基于马尔科夫链的扩散模型中，当前状态只与上一时刻的状态有关。基于马尔可夫链平稳性的特点，一个概率分布随时间变化，在马尔可夫链的作用下，随着时间延长，它就会趋于某种平稳分布(例如高斯分布)。因此，在扩散过程中，随着采样时间t不断增大，最终概率分布变成独立的高斯分布。定义真实数据X₀，其对应的条件概率密度函数为q(X₀)，在扩散过程中逐步随机加入一个的高斯噪声∈，∈～N(0，I)，N表示高斯分布；I表示单位矩阵；且共加入T步，从而产生了一系列加噪的高斯噪声样本序列x＝{X₁，X₂，…，X_t}，其中，X_t＝X_t-1+∈，t＝1～T，∈的方差与均值由高斯噪声参数β_t决定，而且在扩散过程中所加的噪声是越来越大的；

根据上述可知：由于扩散过程是一个马尔可夫过程，所以给定X₀的X₁：T的联合概率分布为：/>上述式子计算q(x_1：T|x₀)不断迭代，给定X₀、t和β_t就可以计算出来X_t；且X_t在X_t-1上添加噪声得到，当t越来越大，X_t越来越接近纯噪声；以上所述即为加噪过程。

在具体实施例中，步骤S4.3中所述采用梯度下降法最小化损失函数的表达式为

在具体实施例中，如图6所示，所述S5中对所述噪声样本集进行逆运算，具体为

且所述逆向运算公式为

所述条件扩散模型逆扩散过程可以也是一个马尔科夫链过程，也可以是基于其他的可以实现将噪声恢复到真实数据的模型。在基于马尔科夫链的模型中，所述逆扩散过程是从高斯噪声X_t中预测X₀，条件概率密度函数为p_θ(x_t-1|x_t)；由于扩散过程中每次迭代加的噪声很小，所以逆向过程的结果也是一个高斯分布。

综上所述，扩散模型的扩散过程模型不存在预测值，只有逆扩散过程模型存在预测值，且预测的是噪声的分布。在每次训练过程中，扩散过程模型在多个扩散步数t逐步加入噪声得到最终的噪声样本，并通过去噪模型∈_θ确定与扩散过程相对应的每个t时刻的预测噪声与所加的真实噪声之间的均方差损失值，再通过损失值来指导扩散过程模型进行训练。即扩散过程为从右至左，原始数据逐步加入噪声，逆过程为从噪声中逐步恢复出原始数据。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于条件扩散模型的风机异常值修复方法，其特征在于，包括以下步骤：

所述历史风速数据包括异常数据与正常数据；

2.根据权利要求1所述的一种基于条件扩散模型的风机异常值修复方法，其特征在于，步骤S1中所述的并按时间顺序获取编码后的各风机每日内多个时间序列对应的历史风速数据为

3.根据权利要求1所述的一种基于条件扩散模型的风机异常值修复方法，其特征在于，步骤S1中所述对历史风速数据的异常数据为

4.根据权利要求1所述的一种基于条件扩散模型的风机异常值修复方法，其特征在于，步骤S4中，所述优化去噪声模型具体为

否则，继续训练，直至达到最大迭代次数。

5.根据权利要求1所述的一种基于条件扩散模型的风机异常值修复方法，其特征在于，步骤S3中所述基于条件扩散模型的扩散过程从噪声样本序列中随机提取噪声样本，并填充至所述目标风机的待进行功率异常值修复的数据，所述进行噪声填充的计算公式为

6.根据权利要求1所述的一种基于条件扩散模型的风机异常值修复方法，其特征在于，步骤S4.3中所述采用梯度下降法最小化损失函数的表达式为

7.根据权利要求1所述的一种基于条件扩散模型的风机异常值修复方法，其特征在于，所述S5中对所述噪声样本集进行逆运算，具体为

步骤S5.3：将获取的扩散T步后的带噪信息样本数据与预测噪音样本/>导入逆向运算公式，获取扩散第T-1步后的带噪信息样本数据/>

且所述逆向运算公式为