CN117992899A

CN117992899A - 基于小样本的电力新能源设备故障诊断方法及装置

Info

Publication number: CN117992899A
Application number: CN202410405937.0A
Authority: CN
Inventors: 吕峰; 于云霞; 李茂轩; 秦立刚; 陈龙; 刘杨; 庄斌; 于坤宇
Original assignee: State Grid Shandong Electric Power Co Mengyin County Power Supply Co
Current assignee: State Grid Shandong Electric Power Co Mengyin County Power Supply Co
Priority date: 2024-04-07
Filing date: 2024-04-07
Publication date: 2024-05-07

Abstract

本发明提供了一种基于小样本的电力新能源设备故障诊断方法及装置，涉及数据处理的技术领域，包括：获取电力新能源设备的原始样本数据集合，其中，原始样本数据集合包括：传感器数据集合和各项传感器数据对应的状态标签集合；基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，以扩充原始样本数据集合，确定目标样本数据集合；基于目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型，其中，目标故障诊断模型用于对待分类的电力新能源设备故障数据进行故障分类处理，确定故障分类结果。本发明可以显著提升故障诊断的精确度。

Description

基于小样本的电力新能源设备故障诊断方法及装置

技术领域

本发明涉及数据处理的技术领域，尤其是涉及一种基于小样本的电力新能源设备故障诊断方法及装置。

背景技术

在电力新能源领域，设备的稳定运行和高效性是至关重要的，电力新能源设备，例如，风力发电机、太阳能板、储能设备等，都是高度复杂且昂贵的投资，而且它们在运行过程中会持续产生大量的操作数据，这些数据来自设备的各种传感器，例如温度传感器、压力传感器、电流和电压测量设备等，正确地分析和解释这些数据可以有效帮助检测设备的健康状况，预测潜在的故障，并采取预防措施，从而确保设备的长寿命和最大效率。

由于高质量的标注数据通常是稀缺的，因此设备故障不是一个常见的事件，这使得基于传统机器学习方法的故障诊断成为一个小样本问题，目前，相关技术提出，可以通过旋转、缩放和裁剪等传统的数据扩充方法进行数据扩充后对设备故障进行诊断，但上述方案中，传统的数据扩充方法缺乏能够生成高质量、多样性且与原始数据高度相关的新样本的能力，并且现有的分类方法难以有效处理小样本数据或捕获数据中的复杂非线性关系，此外，传统的神经网络主要依赖梯度下降法或其变体进行优化，容易受到梯度消失、梯度爆炸或局部最优的影响，从而导致对小样本的电力新能源设备进行故障诊断时，难以捕获和识别与故障相关的关键特征，进而导致故障诊断的精确度较低。

发明内容

有鉴于此，本发明的目的在于提供一种基于小样本的电力新能源设备故障诊断方法及装置，可以显著提升故障诊断的精确度。

第一方面，本发明实施例提供了一种基于小样本的新能源设备故障诊断方法，方法包括：获取电力新能源设备的原始样本数据集合，其中，原始样本数据集合包括：传感器数据集合和各项传感器数据对应的状态标签集合；基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，以扩充原始样本数据集合，确定目标样本数据集合；基于目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型，其中，目标故障诊断模型用于对待分类的电力新能源设备故障数据进行故障分类处理，确定故障分类结果。

在一种实施方式中，基于改进德卡尔特的生成对抗网络包括：生成器、判别器和坐标映射器，基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，以扩充原始样本数据集合，确定目标样本数据集合的步骤，包括：通过坐标映射器将原始样本数据集合映射至高维空间，并利用生成器对高维空间中的原始样本数据集合进行数据括充处理，确定第一扩充数据；通过坐标映射器将第一扩充数据进行逆映射处理，以使第一扩充数据映射回原始维度，确定第二扩充数据；通过判别器对第二扩充数据进行数据鉴定处理，确定目标样本数据集合。

在一种实施方式中，利用生成器对高维空间中的原始样本数据集合进行数据括充处理，确定第一扩充数据的步骤，包括：基于熵加权算法确定原始样本数据集合对应的锚点集合，其中，锚点集合中包括数据主要特征对应的锚点；通过生成器，基于德卡尔特坐标在高维空间中的坐标转换规则，以各项锚点为中心，对原始样本数据进行数据括充处理，确定第一扩充数据。

在一种实施方式中，基于熵加权算法确定原始样本数据集合对应的锚点集合的步骤，包括：通过聚类算法在高维空间中确定候选锚点集合；通过熵加权算法，基于原始样本数据集合中各数据点所属类别的熵，对候选锚点集合进行熵加权处理，确定候选锚点集合中各候选锚点对应的熵权重；根据各候选锚点对应的熵权重和预设权重阈值，确定原始样本数据集合对应的锚点集合。

在一种实施方式中，基于目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型的步骤，包括：根据液滴冲击与散溅机制的神经网络优化算法，对目标样本数据集合进行特征提取处理，确定目标特征集；将目标样本数据集合和目标特征集输入至预设分类器中，基于改进的低秩近似极限学习机算法，对分类器进行分类训练，确定故障分类模型。

在一种实施方式中，根据液滴冲击与散溅机制的神经网络优化算法，对目标样本数据集合进行特征提取处理，确定目标特征集的步骤，包括：通过液滴冲击与散溅机制的神经网络优化算法，对预设初始化神经网络模型中的参数集合进行参数更新处理，确定目标神经网络模型；利用目标神经网络模型对样本数据进行特征提取处理，确定目标特征集。

在一种实施方式中，通过液滴冲击与散溅机制的神经网络优化算法，对预设初始化神经网络模型中的参数集合进行参数更新处理，确定目标神经网络模型的步骤，包括：将神经网络的误差映射为液滴的能量，并通过模拟液滴冲击产生的液滴飞溅信息，确定液滴更新位置以及液滴更新位置对应的神经网络参数，其中，液滴飞溅信息包括：散溅液滴方向和散溅液滴距离；针对液滴更新位置对应的神经网络参数进行自适应调整处理和收敛检测处理，确定目标神经网络参数，并根据目标神经网络参数确定目标神经网络模型。

第二方面，本发明实施例还提供一种基于小样本的新能源设备故障诊断装置，装置包括：样本数据采集模块，获取电力新能源设备的原始样本数据集合，其中，原始样本数据集合包括：传感器数据集合和各项传感器数据对应的状态标签集合；数据扩充模块，基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，以扩充原始样本数据集合，确定目标样本数据集合；模型训练模块，基于目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型，其中，目标故障诊断模型用于对待分类的电力新能源设备故障数据进行故障分类处理，确定故障分类结果。

第三方面，本发明实施例还提供一种服务器，包括处理器和存储器，存储器存储有能够被处理器执行的计算机可执行指令，处理器执行计算机可执行指令以实现第一方面提供的任一项的方法。

第四方面，本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质存储有计算机可执行指令，计算机可执行指令在被处理器调用和执行时，计算机可执行指令促使处理器实现第一方面提供的任一项的方法。

本发明实施例带来了以下有益效果：

本发明实施例提供的一种基于小样本的电力新能源设备故障诊断方法及装置，该方法在获取电力新能源设备的原始样本数据集合后，基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，以扩充原始样本数据集合，确定目标样本数据集合，并基于目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型，其中，目标故障诊断模型用于对待分类的电力新能源设备故障数据进行故障分类处理，确定故障分类结果。上述方法在对小样本的电力新能源设备的原始样本数据集合进行数据扩充时，由于基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，相较于相关技术中，通过旋转、缩放和裁剪等传统的数据扩充方法进行数据扩充，可以生成高质量、多样性且与原始数据高度相关的新样本，从而优化训练模型，显著提升故障诊断的精确度。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于小样本的新能源设备故障诊断方法的流程示意图；

图2为本发明实施例提供的一种模型训练方法的流程示意图；

图3为本发明实施例提供的一种基于小样本的新能源设备故障诊断装置的结构示意图；

图4为本发明实施例提供的一种服务器的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

目前，在电力新能源领域，设备的稳定运行和高效性是至关重要的，电力新能源设备，例如，风力发电机、太阳能板、储能设备等，都是高度复杂且昂贵的投资，而且它们在运行过程中会持续产生大量的操作数据，这些数据来自设备的各种传感器，例如温度传感器、压力传感器、电流和电压测量设备等，正确地分析和解释这些数据可以有效帮助检测设备的健康状况，预测潜在的故障，并采取预防措施，从而确保设备的长寿命和最大效率，由于高质量的标注数据通常是稀缺的，因此设备故障不是一个常见的事件，这使得基于传统机器学习方法的故障诊断成为一个小样本问题，相关技术提出，可以通过旋转、缩放和裁剪等传统的数据扩充方法进行数据扩充后对设备故障进行诊断，但上述方案中，传统的数据扩充方法缺乏能够生成高质量、多样性且与原始数据高度相关的新样本的能力，并且现有的分类方法难以有效处理小样本数据或捕获数据中的复杂非线性关系，此外，传统的神经网络主要依赖梯度下降法或其变体进行优化，容易受到梯度消失、梯度爆炸或局部最优的影响，从而导致对小样本的电力新能源设备进行故障诊断时，难以捕获和识别与故障相关的关键特征，进而导致故障诊断的精确度较低，基于此，本发明实施提供的基于小样本的新能源设备故障诊断方法，实现了高效的数据扩充、优化的参数调整、快速高效的分类和更好的模型泛化，通过生成对抗网络，有效地增强了小样本数据的数量和多样性，进而提高模型的泛化能力和精度。

参见图1所示的一种基于小样本的新能源设备故障诊断方法的流程示意图，该方法主要包括以下步骤S102至步骤S106：

步骤S102获取电力新能源设备的原始样本数据集合，其中，原始样本数据集合包括：传感器数据集合和各项传感器数据对应的状态标签集合，在一种实施方式中，电力新能源设备包括风力发电机、太阳能板、储能设备等，在运行过程中会持续产生大量的操作数据，这些数据来自设备的各种传感器，如温度传感器、压力传感器、电流和电压测量设备等，采集到的数据以结构化的表格形式存储，每一行代表一个时间点的多个传感器读数，而每一列则对应一个特定的传感器或数据属性，具体的，数据属性及特征可以表示为：：环境温度，单位为°C；：装载的电力，单位为kW；：电相电流，单位为A；：电相电压，单位为V；：风速，单位为m/s；：生成的电力，单位为kW；：转子角度，单位为度；：设备温度，单位为°C；：传感器状态（正常/异常）；：故障标签，用于标识设备是否发生故障，及其故障类型。

在实际应用中，考虑一台设备在某个状态下的数据样本，该样本的属性值具体包括如下：°C；kW；A；V；m/s；kW；°；°C；=正常；=无故障。此数据样本为一个正常工作状态下的电力新能源设备。为了训练和测试模型，需要收集大量上述的数据样本，并通过专家进行标注，确定其是否存在故障以及故障的类型，特别的，本发明的实施例数据属性的数量为10，但实际应用场景中数据属性的数量可能更多，甚至能达到数百个，故，基于人工判断设备是否故障是不可靠的，基于此，本发明提出的基于小样本的电力新能源设备故障诊断方法利用人工智能算法实现新能源设备的故障诊断。

在另一种实施方式中，在开始模型训练之前还需要进行数据预处理，对于电力新能源设备故障分类，预处理的目的是确保数据集中的每个数据点都是完整、准确、并且在正确的格式中。

首先，进行数据规范化处理，考虑到电力新能源设备的多种数据属性，规范化是确保所有属性在同一尺度上的关键。可以表示为：

其中，是原始数据，是规范化后的数据，和分别是数据集中对应的属性的最小值和最大值。

进一步地，进行缺失值处理。由于设备故障数据可能存在某些缺失值，本发明采用均值插补方法对缺失值进行处理，可以表示为：

其中，是填充后的数据，是非缺失数据的数量，是第个非缺失数据。

进一步地，进行异常值处理设备故障数据可能存在异常值，例如由于传感器故障引起的错误读数，使用中值滤波器对异常值进行处理，以保持数据的稳定性，可以表示为：

其中，是处理后的数据，是滤波器的窗口大小的一半，是位于窗口中的数据。

步骤S104，基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，以扩充原始样本数据集合，确定目标样本数据集合，其中，基于改进德卡尔特的生成对抗网络包括：生成器、判别器和坐标映射器，在一种实施方式中，数据的采集、标注和预处理是耗时耗力的，尤其在小样本情况下，数据量不足容易导致模型泛化性差、精度低，因此，在特征提取完成后，本发明提出一种基于改进德卡尔特的生成对抗网络算法原理进行样本生成，进而实现样本扩充：基于改进德卡尔特的生成对抗网络中的生成对抗网络由两部分组成：生成器(G)和判别器(D)，生成器用于从随机噪声中创建数据，判别器用于尝试区分来自真实数据集的数据和生成器创建的数据。

在本发明的基于改进德卡尔特的生成对抗网络中，融合了德卡尔特的思想，即，利用多维数据空间来捕捉数据的复杂性和内在的结构，此外，本发明不再仅仅从随机噪声中生成数据，而是使用德卡尔特坐标系统中的点作为种子来增强数据的质量；传统的生成对抗网络可能会遗漏一些重要的数据分布，因此本发明引入一个改进的锚点策略，该策略的核心思想是确定原始数据空间中的关键点（称为“锚点”），这些点捕捉了数据的主要特征，然后生成器以这些锚点为中心创建新的数据点，此外，除传统生成对抗网络中的生成器和判别器，在本发明的基于改进德卡尔特的生成对抗网络中，引入第三个组件：坐标映射器(C)。

步骤S106，基于目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型，其中，目标故障诊断模型用于对待分类的电力新能源设备故障数据进行故障分类处理，确定故障分类结果，在一种实施方式中，将扩充后的数据输入到神经网络中进行特征提取：传统的神经网络采用梯度下降法进行参数的优化，本发明提出一种基于液滴冲击与散溅机制优化策略的神经网络优化算法，避免传统的梯度下降法产生的梯度消失和梯度爆炸现象，同时避免参数在寻优时陷入局部最优解；受启发于自然界中的液滴冲击与散溅机制，当雨滴落到水面上时，由于液体与液体的相互作用，会形成波纹与液滴飞溅，这个过程涉及多种物理现象，如动量守恒、能量守恒等，本发明将这种液滴的冲击与散溅机制应用到神经网络参数的优化中，通过模拟液滴冲击的过程，为网络参数找到最佳的值。

在另一种实施方式中，本发明提出一种基于改进的低秩近似极限学习机算法进行分类，极限学习机是一种单隐层前馈神经网络，其关键优势是可以直接求解输出权重而无需迭代，本发明使用低秩结构来近似隐藏层和输出层之间的权重，此外，传统的神经网络采用整数阶求导，而本发明使用分数阶求导，可以在小样本的场景中更好地捕捉数据间的非线性关系。

本发明实施例提供的上述基于小样本的电力新能源设备故障诊断方法，基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，可以有效地增强了小样本数据的数量和多样性，进而提高模型的泛化能力和精度。

参见图2所示的一种模型训练方法的流程示意图，本发明实施例还提供了一种模型训练方法的实施方式，具体的参见以下步骤S202至步骤S206：

步骤S202，基于改进德卡尔特的生成对抗网络算法原理进行样本数据扩充。通过坐标映射器将原始样本数据集合映射至高维空间，并利用生成器对高维空间中的原始样本数据集合进行数据括充处理，确定第一扩充数据，并通过坐标映射器将第一扩充数据进行逆映射处理，以使第一扩充数据映射回原始维度，确定第二扩充数据，最后，通过判别器对第二扩充数据进行数据鉴定处理，确定目标样本数据集合的步骤包括如下（1）至（2）：

（1）基于熵加权算法确定原始样本数据集合对应的锚点集合，通过生成器，基于德卡尔特坐标在高维空间中的坐标转换规则，以各项锚点为中心，对原始样本数据进行数据括充处理，确定第一扩充数据，其中，锚点集合中包括数据主要特征对应的锚点，具体的，需要进行：初始化、高维映射、高维锚点选择、德卡尔特种子生成与变换、高维数据生成、数据逆映射、数据鉴定、生成器、判别器和映射器的联合优化和锚点更新策略等步骤进行数据扩充处理。

首先要进行初始化，用原始数据集初始化判别器，并训练一个基本的生成器，再通过高维映射，利用坐标映射器，将原始数据映射到高维空间。定义坐标映射器为函数，可以表示为：

其中，为原始数据向量；为映射矩阵。

进一步地，映射矩阵的作用是保持原始数据的某些特性，同时转移到高维空间，本发明定义为一个对角矩阵，其对角线上的元素是数据的主成分分析(PCA)的前个主成分，其中是数据的维度，公式为：

其中，是原始数据的第个主成分；为映射矩阵的第个对角线元素。

在进行高维锚点选择的步骤时，需要在高维空间中，选择捕获数据主要特征的锚点。在高维空间中，本发明选择捕获数据主要特征的锚点。假设本发明有个锚点，则：

其中，为在高维空间中选取的锚点集合；为第个锚点。

进一步地，在锚点选择时，本发明使用K-means聚类在高维空间中选择锚点，可以表示为：

其中，是K-means聚类算法中第个簇的中心。

在进行德卡尔特种子生成与变换的步骤时，需要在高维空间中，基于德卡尔特坐标随机选择种子点，并通过坐标映射器进行转换。对于高维空间中的任意种子点，其转换为：

其中，为在高维空间中随机选择的种子点；为通过坐标映射器转换后的种子点。

在进行高维数据生成的步骤时，需要利用生成器和锚点在高维空间中生成数据。使用生成器，则高维数据的生成方式可以表示为：

其中，是一个缩放系数，控制锚点的贡献。是所有锚点的平均位置。

进一步地，本发明中的生成器由三层全连接神经网络组成，具有激活函数，公式为：

其中，和是生成器第层的权重和偏置；为生成器在给定种子和锚点的情况下生成的数据；为ReLU激活函数。

在进行数据逆映射的步骤时，需要使用坐标映射器的逆映射，将高维数据映射回原始维度。逆映射公式为：

其中，是映射矩阵的逆；为生成器；为判别器；和为坐标映射器及其逆。

进一步地，坐标映射器的损失函数是基于重建误差的，即原始数据和通过映射器再映射回来的数据之间的误差。公式为：

在进行数据鉴定的步骤时，需要判别器鉴定由在原始维度上生成的数据点。判别器的目标是最小化来自生成器的数据和真实数据之间的差异，可以表示为：

其中，和为分别代表判别器和坐标映射器的损失函数。

进一步地，本发明中的判别器也由三层全连接神经网络组成，但其最后一层使用Sigmoid激活函数。公式为：

在进行生成器、判别器和映射器的联合优化的步骤时，需要基于判别器的反馈，联合优化生成器、判别器和坐标映射器的权重。在迭代优化的过程中，总损失可以表示为：

其中，是坐标映射器的损失，表示映射的准确性。是权重，控制在总损失中的重要性。通过使用梯度下降方法，更新生成器，判别器，和坐标映射器的权重。

在进行锚点更新策略的步骤时，需要定期基于新生成的数据更新锚点。基于新生成的数据，锚点的更新方式可以表示为：

其中，是一个介于0和1之间的权重因子，为第i个锚点的熵权重，为当前迭代的学习率。

（2）通过聚类算法在高维空间中确定候选锚点集合，并通过熵加权算法，基于原始样本数据集合中各数据点所属类别的熵，对候选锚点集合进行熵加权处理，确定候选锚点集合中各候选锚点对应的熵权重，根据各候选锚点对应的熵权重和预设权重阈值，确定原始样本数据集合对应的锚点集合，具体的，为了确保所选择的锚点能够更加代表性地捕捉数据的特性，本发明引入了熵加权策略来增强锚点的选择。熵作为一种信息论的测量工具，可以提供关于数据分布不确定性的信息，通过使用熵加权策略，可以确保所选择的锚点能够捕捉到数据的多样性，具体的，为每个数据点计算其所属类别的熵，对于数据点和其标签分布，熵定义为：

其中，是类别的数量，是数据点属于第类的概率。

进一步地，进行熵加权的锚点选择。使用上述K-means方法选出的候选锚点集合中的每个候选锚点都会得到一个熵权重，计算公式为：

其中，是候选锚点的数量。

进一步地，学习率由动态调整，为了增强模型的训练速度和准确性，在学习过程中的不同阶段可能需要不同的学习速度。在损失下降缓慢时，可能需要增加学习率以跳过局部最小值，而在损失下降迅速时，可能需要减小学习率以确保模型收敛。即，在动态学习率计算计算时，首先，定义一个基础学习率和一个学习率调整因子，其初始值为1。在每个训练周期，计算损失的变化：

其中，和分别是当前和前一个训练周期的损失。

进一步地，如果小于一个预定的小值阈值，增加学习率，可以表示为：

如果大于一个预定的大值阈值，减少学习率，可以表示为：

其中，是一个小的调整值。

进一步地，在更新学习率时，使用上述调整因子，则计算动态学习率的方式可以表示为：

重复上述德卡尔特种子生成与变换至锚点更新策略的步骤，直到满足特定的收敛准则或达到预定的迭代次数时，进行数据融合，将生成的数据与原始数据集融合，形成一个扩展的数据集。

步骤S204，将扩充后的数据输入到神经网络中进行特征提取。根据液滴冲击与散溅机制的神经网络优化算法，对目标样本数据集合进行特征提取处理，确定目标特征集：通过液滴冲击与散溅机制的神经网络优化算法，对预设初始化神经网络模型中的参数集合进行参数更新处理，确定目标神经网络模型，并利用目标神经网络模型对样本数据进行特征提取处理，确定目标特征集，具体地，特征提取的步骤包括：初始化、多尺度选择、评估与能量转化、冲击与散溅、参数更新、自适应调整、收敛检测与退火策略等步骤进行特征提取处理。

在进行初始化和多尺度选择的步骤时，需要为神经网络的参数赋予随机值，同时随机设定一个初始的液滴冲击力度和方向，并根据当前的优化状态，选择一个合适的尺度对液滴进行模拟。

在进行评估与能量转化的步骤时，需要计算神经网络的误差并转化为液滴的能量。对于神经网络的输出误差，将其映射为液滴的能量，进一步地，为了增强这一关系的非线性特性，本发明引入一个指数函数表示误差与能量的关系：

其中，是一个大于1的实数，增强误差与能量之间的非线性关系。为神经网络的输出误差；为代表液滴的能量；为是一个常数，用于控制误差与能量之间的映射关系；为一个大于1的实数，增强误差与能量之间的非线性关系。

在进行冲击与散溅的步骤时，需要在所选的尺度上模拟液滴的冲击。进一步地，根据液滴的能量和动量，计算散溅液滴的方向和距离。液滴的冲击可以通过动量来描述，表示为：

其中，是液滴的初始速度；为液滴的动量。

进一步地，由液滴的冲击产生的飞溅液滴的方向和距离可由以下公式得出：

其中，是一个常数，用于控制散溅距离；为散溅液滴的方向；为散溅液滴的距离。

进一步地，模拟连锁飞溅，并考虑飞溅液滴的动量。连锁飞溅产生的液滴数量与其动量可以表示为：

其中，是一个涉及连锁飞溅的常数，为第i个液滴的权重。为连锁飞溅产生的液滴数量；为一个涉及连锁飞溅的常数；为连锁飞溅液滴的动量。

进一步地，考虑到液滴的大小可能影响其动量，为每个液滴引入一个权重，可以表示为：

其中，是第个液滴的能量。

在进行参数更新的步骤时，需要将模拟得到的液滴的新位置对应到神经网络的参数，并进行更新，模拟液滴的移动方式可以表示为：

其中，为散溅影响高斯项；，为更新后和更新前的权重值；，为更新后和更新前的偏置值；为学习率。

进一步地，为了考虑液滴散溅的影响区域，散溅影响高斯项定义为：

其中，控制散溅的影响范围。

在进行自适应调整的步骤时，需要分析当前的优化状态，调整液滴的冲击力度和方向。进一步地，根据历史的优化记录，确定下一次迭代的液滴尺度。液滴的冲击力度和方向可以根据历史的优化记录进行调整，可以表示为：

其中，是上一次迭代的冲击力度；为液滴的冲击力度。

进一步地，方向的调整考虑延迟效应，可以表示为：

其中，是能量的变化量，是迭代次数，是上一次迭代的方向；为液滴的冲击方向；为能量的变化量；为迭代次数；为一个介于0和1之间的延迟因子。

在进行收敛检测与退火策略的步骤时，需要检查参数是否趋于稳定。如果未达到预期准确率，则根据退火策略调整液滴的能量，减少液滴的冲击力度，并返回第2步。其中，退火策略可以通过调整能量来实现，可以表示为：

其中，是退火策略中的一个小于1的常数，用于降低能量。

在进行保存与结束的步骤时，需要当满足结束条件时，保存当前的最佳参数，并结束算法，此复杂的DOA流程确保了在各种尺度上对参数的细致优化，并通过自适应机制、连锁飞溅和多尺度模拟，使得参数更新更为全面和深入。

步骤S206，基于改进的低秩近似极限学习机算法训练分类器。将目标样本数据集合和目标特征集输入至预设分类器中，基于改进的低秩近似极限学习机算法，对分类器进行分类训练，确定故障分类模型：将神经网络的误差映射为液滴的能量，并通过模拟液滴冲击产生的液滴飞溅信息，确定液滴更新位置以及液滴更新位置对应的神经网络参数，针对液滴更新位置对应的神经网络参数进行自适应调整处理和收敛检测处理，确定目标神经网络参数，并根据目标神经网络参数确定目标神经网络模型，其中，液滴飞溅信息包括：散溅液滴方向和散溅液滴距离，具体地，训练分类器的步骤包括：初始化与权重设置、数据映射到隐藏层、动态低秩近似的权重求解、分数阶反向传播与梯度修正、自适应批次选择、在线学习与数据增强、终止条件与模型验证和集成策略等步骤进行训练分类器处理。

在进行初始化与权重设置的步骤时，需要随机选择隐藏层的权重和偏置，并使用正则化技术（如L2正则化）对初始化权重进行调整，以防止过拟合。具体的，隐藏层权重和偏置随机初始化为：

其中，是输入维度，是隐藏层神经元数量。进一步地，使用L2正则化对权重进行调整，可以表示为：

其中，是正则化系数。

在进行数据映射到隐藏层的步骤时，需要将输入数据映射到隐藏层。使用多种激活函数（如Sigmoid，tanh，ReLU等）进行非线性转换，为每种激活函数的结果分配一个系数，用于后续的加权平均。具体的，数据映射到隐藏层的输出计算方式可以表示为：

其中，是Sigmoid函数，是各激活函数的加权系数，且。为隐藏层的权重矩阵；为隐藏层的偏置向量；为经L2正则化后的隐藏层权重矩阵；为隐藏层的输出；

进一步地，本发明考虑Sigmoid，tanh，ReLU三种激活函数，分别表示为：

Sigmoid函数：

Tanh函数：

ReLU函数：

在进行动态低秩近似的权重求解的步骤时，需要采用矩阵分解的方式找到隐藏层和输出层之间的权重的多种低秩近似表示，动态选择最优的低秩近似策略，基于验证集的性能。具体的，假设隐藏层到输出层的权重为，使用SVD进行低秩近似，有：

其中，是SVD分解的结果，本发明仅选取前个奇异值对应的列，进行近似，可以表示为：

其中，为隐藏层到输出层的权重矩阵；为分别代表SVD分解后的左奇异向量矩阵、奇异值对角矩阵和右奇异向量矩阵；为选取的奇异值的数量，用于近似；为低秩近似后的权重矩阵。

在进行分数阶反向传播与梯度修正的步骤时，需要使用分数阶求导进行反向传播，损失函数关于权重的分数阶梯度为：

其中，表示1.5阶微分操作；为损失函数；为损失函数关于权重的1.5阶梯度；为1.5阶微分操作。

进一步地，进行分数阶反向传播与梯度修正，更新权重的方式可以表示为：

其中，是学习率；为更新后的隐藏层权重矩阵。

在进行自适应批次选择的步骤时，需要根据模型在前3个epoch的表现，动态调整每个epoch的批次大小，具体的，调整方式为：

给定一个初始批次大小，每次epoch后，计算当前epoch的损失和前一个epoch的损失。

如果（其中是一个小的阈值），则，否则。

其中，分别为初始和新的批次大小；分别为当前和前一个epoch的损失；为用于自适应批次选择策略的小的阈值。

在进行在线学习与数据增强的步骤时，需要在每次epoch后，随机选择一部分训练数据进行微小的变换（如旋转、缩放或添加噪声）并添加到训练集中，提高模型的泛化能力。部分数据经过变换得到新数据，可以表示为：

其中，是一个变换函数，具体的数据变换函数可以表示为一个组合函数，如：

其中，是添加噪声的函数，是缩放函数，是旋转函数；为输入数据；为数据增强后的输入数据；为数据变换函数。

在进行终止条件与模型验证的步骤时，需要引入早停机制，当验证集上的性能在连续多个epoch中没有提高时，停止训练。进一步地，使用K折交叉验证进行模型评估，并进行必要的超参数调整。具体的，使用早停机制，如果在连续个epochs中，验证损失没有下降，则停止训练，可以表示为：

其中，是验证集损失。

在进行集成策略的步骤时，需要训练多个基于改进的低秩近似极限学习机模型，每个模型使用不同的初始化和参数。具体的，训练得到多个模型的输出权重集合，最终的分类决策是这些模型的加权平均，最后，通过投票机制或平均策略结合所有模型的预测结果。

综上所述，本发明可以结合德卡尔特坐标系统与传统的生成对抗网络，不仅增强了数据的质量和多样性，而且更有效地捕获数据的复杂性和内在结构，通过生成对抗网络，有效地增强了小样本数据的数量和多样性，进而提高模型的泛化能力和精度；通过液滴冲击与散溅机制的神经网络优化策略模拟了液滴冲击的过程，为神经网络参数寻优提供了一个创新的方法，有效地避免了传统梯度下降法中的问题，液滴冲击与散溅机制为神经网络提供了更全面和深入的参数更新方式，从而更好地优化模型性能；基于改进的低秩近似极限学习机算法：结合低秩结构和分数阶求导，既提高了计算效率，又能更好地捕捉数据的非线性关系，特别是在小样本的场景中；动态锚点更新策略和熵加权策略可以确保所选的锚点更具代表性，更好地捕捉数据的特性；多尺度模拟和自适应机制可以在液滴冲击与散溅机制优化策略中，这些机制确保了对参数的细致优化，通过液滴冲击与散溅机制优化策略和基于改进的低秩近似极限学习机算法，使得模型具有更强的泛化能力和更高的分类精度。因此，本发明实施例提供的上述基于小样本的电力新能源设备故障诊断方法可以基于改进德卡尔特的生成对抗网络实现高效的数据扩充、基于液滴冲击与散溅机制的神经网络优化策略实现优化参数调整、基于改进的低秩近似极限学习机算法实现快速高效的分类和更好的模型泛化。

对于前述实施例提供的基于小样本的新能源设备故障诊断方法，本发明实施例提供了一种基于小样本的新能源设备故障诊断装置，参见图3所示的一种基于小样本的新能源设备故障诊断装置的结构示意图，该装置包括以下部分：

样本数据采集模块302，获取电力新能源设备的原始样本数据集合，其中，原始样本数据集合包括：传感器数据集合和各项传感器数据对应的状态标签集合；

数据扩充模块304，基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，以扩充原始样本数据集合，确定目标样本数据集合；

模型训练模块306，基于目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型，其中，目标故障诊断模型用于对待分类的电力新能源设备故障数据进行故障分类处理，确定故障分类结果。

本申请实施例提供的上述基于小样本的电力新能源设备故障诊断装置，基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，可以有效地增强了小样本数据的数量和多样性，进而提高模型的泛化能力和精度。

一种实施方式中，基于改进德卡尔特的生成对抗网络包括：生成器、判别器和坐标映射器，在进行基于改进德卡尔特的生成对抗网络，对原始样本数据集合进行数据扩充处理，以扩充原始样本数据集合，确定目标样本数据集合的步骤时，上述数据扩充模块304还用于：通过坐标映射器将原始样本数据集合映射至高维空间，并利用生成器对高维空间中的原始样本数据集合进行数据括充处理，确定第一扩充数据；通过坐标映射器将第一扩充数据进行逆映射处理，以使第一扩充数据映射回原始维度，确定第二扩充数据；通过判别器对第二扩充数据进行数据鉴定处理，确定目标样本数据集合。

一种实施方式中，在进行利用生成器对高维空间中的原始样本数据集合进行数据括充处理，确定第一扩充数据的步骤时，上述数据扩充模块304还用于：基于熵加权算法确定原始样本数据集合对应的锚点集合，其中，锚点集合中包括数据主要特征对应的锚点；通过生成器，基于德卡尔特坐标在高维空间中的坐标转换规则，以各项锚点为中心，对原始样本数据进行数据括充处理，确定第一扩充数据。

一种实施方式中，在进行基于熵加权算法确定原始样本数据集合对应的锚点集合的步骤时，上述数据扩充模块304还用于：通过聚类算法在高维空间中确定候选锚点集合；通过熵加权算法，基于原始样本数据集合中各数据点所属类别的熵，对候选锚点集合进行熵加权处理，确定候选锚点集合中各候选锚点对应的熵权重；根据各候选锚点对应的熵权重和预设权重阈值，确定原始样本数据集合对应的锚点集合。

一种实施方式中，在进行基于目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型的步骤时，上述模型训练模块306还用于：根据液滴冲击与散溅机制的神经网络优化算法，对目标样本数据集合进行特征提取处理，确定目标特征集；将目标样本数据集合和目标特征集输入至预设分类器中，基于改进的低秩近似极限学习机算法，对分类器进行分类训练，确定故障分类模型。

一种实施方式中，在进行根据液滴冲击与散溅机制的神经网络优化算法，对目标样本数据集合进行特征提取处理，确定目标特征集的步骤时，上述模型训练模块306还用于：通过液滴冲击与散溅机制的神经网络优化算法，对预设初始化神经网络模型中的参数集合进行参数更新处理，确定目标神经网络模型；利用目标神经网络模型对样本数据进行特征提取处理，确定目标特征集。

一种实施方式中，在进行通过液滴冲击与散溅机制的神经网络优化算法，对预设初始化神经网络模型中的参数集合进行参数更新处理，确定目标神经网络模型的步骤时，上述模型训练模块306还用于：将神经网络的误差映射为液滴的能量，并通过模拟液滴冲击产生的液滴飞溅信息，确定液滴更新位置以及液滴更新位置对应的神经网络参数，其中，液滴飞溅信息包括：散溅液滴方向和散溅液滴距离；针对液滴更新位置对应的神经网络参数进行自适应调整处理和收敛检测处理，确定目标神经网络参数，并根据目标神经网络参数确定目标神经网络模型。

本发明实施例所提供的装置，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

本发明实施例提供了一种服务器，具体的，该服务器包括处理器和存储装置；存储装置上存储有计算机程序，计算机程序在被所述处理器运行时执行如上所述实施方式的任一项所述的方法。

图4为本发明实施例提供的一种服务器的结构示意图，该服务器100包括：处理器40，存储器41，总线42和通信接口43，所述处理器40、通信接口44和存储器41通过总线42连接；处理器40用于执行存储器41中存储的可执行模块，例如计算机程序。

其中，存储器41可能包含高速随机存取存储器（RAM，Random Access Memory），也可能还包括非不稳定的存储器（non-volatilememory），例如至少一个磁盘存储器。通过至少一个通信接口43（可以是有线或者无线）实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网，广域网，本地网，城域网等。

总线42可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

其中，存储器41用于存储程序，所述处理器40在接收到执行指令后，执行所述程序，前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器40中，或者由处理器40实现。

处理器40可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器40中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器40可以是通用处理器，包括中央处理器(CentralProcessingUnit，简称CPU)、网络处理器(NetworkProcessor，简称NP)等；还可以是数字信号处理器(Digital SignalProcessing，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器41，处理器40读取存储器41中的信息，结合其硬件完成上述方法的步骤。

本发明实施例所提供的可读存储介质的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见前述方法实施例，在此不再赘述。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种基于小样本的电力新能源设备故障诊断方法，其特征在于，所述方法包括：

获取电力新能源设备的原始样本数据集合，其中，所述原始样本数据集合包括：传感器数据集合和各项传感器数据对应的状态标签集合；

基于改进德卡尔特的生成对抗网络，对所述原始样本数据集合进行数据扩充处理，以扩充所述原始样本数据集合，确定目标样本数据集合；

基于所述目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型，其中，所述目标故障诊断模型用于对待分类的电力新能源设备故障数据进行故障分类处理，确定故障分类结果。

2.根据权利要求1所述的基于小样本的电力新能源设备故障诊断方法，其特征在于，所述基于改进德卡尔特的生成对抗网络包括：生成器、判别器和坐标映射器，所述基于改进德卡尔特的生成对抗网络，对所述原始样本数据集合进行数据扩充处理，以扩充所述原始样本数据集合，确定目标样本数据集合的步骤，包括：

通过所述坐标映射器将所述原始样本数据集合映射至高维空间，并利用所述生成器对高维空间中的所述原始样本数据集合进行数据括充处理，确定第一扩充数据；

通过所述坐标映射器将所述第一扩充数据进行逆映射处理，以使所述第一扩充数据映射回原始维度，确定第二扩充数据；

通过所述判别器对所述第二扩充数据进行数据鉴定处理，确定所述目标样本数据集合。

3.根据权利要求2所述的基于小样本的电力新能源设备故障诊断方法，其特征在于，利用所述生成器对高维空间中的所述原始样本数据集合进行数据括充处理，确定第一扩充数据的步骤，包括：

基于熵加权算法确定所述原始样本数据集合对应的锚点集合，其中，所述锚点集合中包括数据主要特征对应的锚点；

通过所述生成器，基于德卡尔特坐标在高维空间中的坐标转换规则，以各项所述锚点为中心，对所述原始样本数据进行数据括充处理，确定第一扩充数据。

4.根据权利要求3所述的基于小样本的电力新能源设备故障诊断方法，其特征在于，所述基于熵加权算法确定所述原始样本数据集合对应的锚点集合的步骤，包括：

通过聚类算法在高维空间中确定候选锚点集合；

通过熵加权算法，基于所述原始样本数据集合中各数据点所属类别的熵，对所述候选锚点集合进行熵加权处理，确定所述候选锚点集合中各候选锚点对应的熵权重；

根据各候选锚点对应的所述熵权重和预设权重阈值，确定所述原始样本数据集合对应的所述锚点集合。

5.根据权利要求1所述的基于小样本的电力新能源设备故障诊断方法，其特征在于，所述基于所述目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型的步骤，包括：

根据液滴冲击与散溅机制的神经网络优化算法，对所述目标样本数据集合进行特征提取处理，确定目标特征集；

将所述目标样本数据集合和所述目标特征集输入至预设分类器中，基于改进的低秩近似极限学习机算法，对所述分类器进行分类训练，确定故障分类模型。

6.根据权利要求5所述的基于小样本的电力新能源设备故障诊断方法，其特征在于，所述根据液滴冲击与散溅机制的神经网络优化算法，对所述目标样本数据集合进行特征提取处理，确定目标特征集的步骤，包括：

通过液滴冲击与散溅机制的神经网络优化算法，对预设初始化神经网络模型中的参数集合进行参数更新处理，确定目标神经网络模型；

利用所述目标神经网络模型对所述样本数据进行特征提取处理，确定所述目标特征集。

7.根据权利要求5所述的基于小样本的电力新能源设备故障诊断方法，其特征在于，通过液滴冲击与散溅机制的神经网络优化算法，对预设初始化神经网络模型中的参数集合进行参数更新处理，确定目标神经网络模型的步骤，包括：

将神经网络的误差映射为液滴的能量，并通过模拟液滴冲击产生的液滴飞溅信息，确定液滴更新位置以及所述液滴更新位置对应的神经网络参数，其中，所述液滴飞溅信息包括：散溅液滴方向和散溅液滴距离；

针对所述液滴更新位置对应的神经网络参数进行自适应调整处理和收敛检测处理，确定目标神经网络参数，并根据所述目标神经网络参数确定所述目标神经网络模型。

8.一种基于小样本的电力新能源设备故障诊断装置，其特征在于，所述装置包括：

样本数据采集模块，获取电力新能源设备的原始样本数据集合，其中，所述原始样本数据集合包括：传感器数据集合和各项传感器数据对应的状态标签集合；

数据扩充模块，基于改进德卡尔特的生成对抗网络，对所述原始样本数据集合进行数据扩充处理，以扩充所述原始样本数据集合，确定目标样本数据集合；

模型训练模块，基于所述目标样本数据集合，对预设的电力新能源设备故障诊断模型进行模型训练处理，确定目标故障诊断模型，其中，所述目标故障诊断模型用于对待分类的电力新能源设备故障数据进行故障分类处理，确定故障分类结果。

9.一种服务器，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机可执行指令，所述处理器执行所述计算机可执行指令以实现权利要求1至7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令在被处理器调用和执行时，计算机可执行指令促使处理器实现权利要求1至7任一项所述的方法。