CN115913112A

CN115913112A - 一种智能化光伏组件复合故障诊断方法

Info

Publication number: CN115913112A
Application number: CN202211678142.4A
Authority: CN
Inventors: 刘琦; 杨博; 刘宇翔; 于文彬; 陈彩莲; 关新平
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2022-12-26
Filing date: 2022-12-26
Publication date: 2023-04-04

Abstract

本发明公开了一种智能化光伏组件复合故障诊断方法，涉及光伏组件运维技术领域，该方法包括以下步骤：数据预处理；局部关键点搜索；局部关键区域区间选取；局部关键区域插值重构；以及构建全局‑局部双流协同诊断框架。该方法使得全局模型和局部模型可以共享相同网络结构的CNN开展训练，将原始的单标签多分类问题转化为多标签二分类问题进行解决，提出了模型参数自适应切换机制以及全局‑局部双流协同模型融合机制，有效提高了模型复合故障诊断精度，有利于在多种故障同时发生后快速准确地开展快速维护。

Description

一种智能化光伏组件复合故障诊断方法

技术领域

本发明涉及光伏组件运维技术领域，尤其涉及一种智能化光伏组件复合故障诊断方法。

背景技术

随着科技的进步，人类社会正面临前所未有的能源挑战，例如资源短缺、环境污染、气候变化、发展不均衡等，这些问题促使国家大力发展清洁能源，新能源发电成为国家战略。光伏发电作为一种最常见的可再生能源，不仅可以被分布式利用，还具有清洁、高效、易获取等特点，正受到人们日益广泛的关注，迅速成为可持续发展和能源战略的重要组成部分。光伏组件是光伏系统运行的核心部件，光伏组件的健康状况会极大程度上影响整个系统的运行安全和发电效率。然而，由于光伏电站大多建立在戈壁或者荒漠这样的恶劣环境中，使得光伏系统组件长时间暴露于室外环境下，光伏组件在系统运行过程中不可避免地会出现一系列故障，从而导致发电经济损失甚至安全事故。此外，实际现场难以大规模部署精密传感器，现场采集的多种类、大批量检测数据也难以人工手动筛选，导致传统的机理建模方法难以应用，基于人工智能技术实现光伏系统智能故障诊断是大势所趋。

现有光伏故障智能诊断方法大多只考虑了单一故障类型诊断，也即光伏组件在同一时刻只会发生一种故障。然而，随着当今光伏电站规模的不断扩大，光伏系统的串并联拓扑结构变得十分复杂，实际光伏阵列运行时往往存在复合故障，也即多种故障同时发生的情况。如果继续采用现有方法进行诊断，即使阵列同时发生两个或两个以上相互关联、相互影响的故障，模型最终也只会预报出一种故障，这意味着现有单一故障类型诊断方法无法全面准确地反映光伏组件的健康状况，从而导致故障难以被发现以及维修不及时。因此，针对实际光伏阵列数据特点研究一种新的光伏复合故障诊断方法，在单一故障和多种故障同时发生的情况下快速准确地识别各种故障类型十分必要，对于降低光伏运营发电损失和维护成本具有重要意义。

现有光伏故障诊断方案中，有的是基于参数辨识方法建立物理模型，将理论计算值与实际测试情况进行对比分析故障类型。具体来说，该方案首先需要搭建与实际光伏阵列结构相近的仿真模型，并通过仿真模型采集得到实际阵列中相应故障类型的I-V曲线数据。之后，构建能够描述仿真模型输出值的待辨识参数集合并利用进化算法不断调整阵列仿真模型的待辨识参数，让仿真模型输出的I-V曲线不断地逼近实测I-V曲线，最终使得两者误差达到最小，从而辨识出故障参数判断故障类型。虽然该方案能够辨识出多种故障同时发生时的故障参数，但仅仅适用小规模、拓扑结构简单以及少量故障类型诊断的光伏阵列。该方案所采用的参数辨识方法实质上是一种机理建模方法，需要先搭建相应的仿真模型，然而对于实际光伏电站来说，光伏阵列不仅规模巨大而且各种串并联拓扑结构复杂，事先搭建与实际电站结构相近的仿真模型是十分困难且成本高昂的，无论现有方案如何优化待辨识参数，仿真模型输出的I-V曲线都会与实际I-V曲线具有显著差异，这意味着该方案所采用的参数辨识方法在大型光伏电站中是无法实施应用的。同时，该方案应用到不同故障类型故障诊断或者不同拓扑结构和不同规模的实际光伏阵列时，都需要重新根据实际阵列的结构重新搭建故障仿真模型并进行参数辨识，这意味着该方案不具备可迁移性，模型的泛化性和准确性差，建模效率低。此外，该方案所搭建的仿真模型不可避免地存在误差，即使该方案也相应扩大了参数搜索范围，但其所采用的故障判断依据是自行定义的且大多是基于经验判断的，这种经验判断容易受到实际光伏系统的规模、结构以及所处地理环境等因素的干扰导致辨识参数精度不高、诊断结果易受模型误差的影响不够准确。

现有技术中，还有的方案是基于多级故障诊断思想实现光伏复合故障诊断。具体来说，该方案在第一级故障诊断中通过计算功率增量比来判别光伏并网逆变器所在支路是否发生故障并判断部分故障类型；在第二级故障诊断中通过电流电压相似度法判别光伏并网逆变器支路下的各光伏组串是否发生故障；在第三级故障诊断过程，基于训练完成的三层BP故障诊断神经网络进行光伏组串内部故障组件定位。虽然，该方案可以区分光伏组件的单一故障和复合故障，但是该方案只是简单地将两种或两种以上同时发生的单一故障都归类到多重故障，也即该方案只能粗略地识别各种类型的单一故障以及整个大类的多重故障，无法对多重故障的具体类型进行诊断。这意味着该方法在实际应用中只能给出一个模糊笼统的复合故障提示(只知道系统同时发生了多种类型的故障，但并不知道具体是哪几种)，运维人员还需要进一步针对各种单一故障类型逐一进行判断，这对于实际现场的维护检修是极其不便的。显然，为了尽可能地降低组件故障对系统造成的发电损失，光伏运营商不仅希望知道阵列发生了多重故障，更需要具体准确地知道是哪几种单一故障同时发生了，以便实现快速检修恢复系统运行。同时，该方案所能识别的故障类型是短路、开路、遮挡以及多重故障，不具备识别老化故障的能力，而本发明则可以实现，本发明方法能诊断故障类型更多，而且对多重故障也能进一步给出具体是哪些单一故障类型同时发生。此外，该方案将故障诊断过程分为三级执行，且第一级和第二级均是基于机理模型计算实际数值再与对应的参考变量和阈值进行比较来判别故障类型，在分析实际数据时效率较低。此外，机理模型的准确性将极大影响该方法的判断准确率，例如一旦第一级或者第二级诊断过程中机理模型计算的结果有偏差，就会导致最终模型诊断错误。同时，机理模型还需要配合实际光伏阵列的拓扑结构来使用，模型的泛化性和迁移性较差。

此外，现有涉及全局和局部信息融合思想的发明方案都是针对图像识别领域(人脸图像)或者机械轴承领域(振动时序性数据)，而光伏组件复合故障诊断问题所采用的数据是I-V曲线以及对应的温度和辐照度信息(非图像也非时序性数据)，现有图像领域方案所采用的图像分割、特征图融合等图像处理方法以及快速傅里叶变换、小波变换等时序性数据时域频域变换方法都无法应用于光伏数据。同时，现有发明方法大多需要构建多个不同结构的模型分别训练全局和局部信息，忽略了各种单一故障之间的隐含联系，而且建模成本更高且模型稳定性降低。此外，现有发明所采用的信息融合方案是将多个子模型的预测概率向量加权得到融合预测向量，然而这种加权方式需要手动调节，对操作人员的先验知识(事先积累的经验)要求较高，而且每次调节后模型都需要重新训练，导致该训练过程的可解释性较差往往不能达到预期的精度。

综上，现有技术的缺点至少包括以下几点：

1、现有光伏故障诊断技术大多都是针对单一故障类型识别建模的，没有考虑多种故障类型同时发生的复合故障诊断情形。然而，随着当今光伏电站规模的不断扩大，光伏系统的串并联拓扑结构变得十分复杂，实际光伏阵列运行时往往会同时发生两个或两个以上相互关联、相互影响的故障，然而现有技术建立的单一故障类型诊断模型只能预报出一种故障，无法准确全面地反映光伏组件的健康状况，从而导致故障难以被发现以及维修不及时。

2、现有光伏复合故障诊断技术采用的是机理建模方法，无论是参数辨识方案还是多级诊断方案，都是通过物理参数之间的一些理论关系式估计机理模型中的部分未知变量或参数，得到近似的I-V曲线或关键参考量的预测表达式，然而，实际现场难以大规模部署精密传感器，现场采集的多种类、大批量检测数据也难以人工手动筛选，这些表达式中的参数在实际现场并不一定都是可以采集到的，导致现有基于机理建模的光伏复合故障诊断方法难以应用。同时，机理建模中的近似表达式计算得到的结果与真实值存在一定的误差难以消除，程序运算量较大，对处理器运行速度要求较高，难以实现工程化。

3、现有光伏复合故障诊断技术在建模时还需要结合实际光伏阵列的拓扑结构来开展，而且往往需要建立多个不同结构的模型综合判断，不仅建模效率低，而且模型的泛化性和迁移性较差。

4、现有光伏复合故障诊断技术忽略了各种单一故障之间的隐含联系，也没有针对光伏故障数据的特点设计专门的方法来充分利用光伏数据的局部信息，所能够诊断的复合故障类型数量十分有限，难以真正应用于实际现场复合故障种类繁多的情形。

5、现有技术中的信息融合方案大多是将多个子模型的预测概率向量加权得到融合预测向量，然而这种加权方式需要手动调节，对操作人员的先验知识(事先积累的经验)要求较高，而且每次调节后模型都需要重新训练模型，训练过程的可解释性较差往往不能达到预期的精度。

因此，基于以上分析，在光伏电站运维中，亟需一种有效的光伏组件复合故障诊断方法，使得模型的训练和推理都是数据驱动的，可以实现端到端快速故障诊断，从而在实际光伏系统同时发生多种故障类型的复杂情况下，能够有效提升模型对复合故障的诊断速度以及模型的准确性和泛化性。为此，本领域的技术人员致力于开发一种智能化光伏组件复合故障诊断方法，可以在多种单一故障类型同时发生时准确识别出相应的类型。

发明内容

有鉴于现有技术的上述缺陷，本发明所要解决的技术问题是如何在实际光伏系统同时发生多种故障类型的复杂情况下，准确识别出相应的类型，提升模型对复合故障的诊断速度以及模型的准确性。

为实现上述目的，本发明提供了一种智能化光伏组件复合故障诊断方法，包括以下步骤：

步骤1、数据预处理；

步骤2、局部关键点搜索；

其中包括：

步骤21、全局样本获取；经过所述数据预处理后的完整I-V曲线记为全局样本，所述全局样本是由40个离散数据点(x_i，y_i)构成，并且在曲线上是均匀分布的；

步骤22、局部一阶差分计算；定义I-V线上相邻两采样点(x_m，y_m)，(x_m+1，y_m+1)且(x_m+1>x_m)在(x_m，y_m)处的局部一阶差分值g′(x_m)为：

步骤23、平缓点筛选，定义完整I-V曲线中局部一阶差分绝对值小于α的采样点为平缓采样点；基于所述步骤S22中依次计算出的所述全局样本中相邻两采样点的39个所述一阶差分值，筛选出所述I-V曲线上的平缓点集合T：

T＝find(abs|g′(x_i)<α|)，i＝2，...，39

其中，find()函数的作用是筛选出满足括号内约束条件的采样点相对位置，abs||为绝对值函数，α为事先给定的常数值；

S24、局部关键点搜索；

其中包括：定义所述平缓采样点比相邻左侧局部一阶差分绝对值至少小β倍为第一为局部关键点，所述平缓采样点比相邻右侧局部一阶差分绝对值至少小γ倍的采样点为第二局部关键点，并筛选出I-V曲线上的局部关键点集合O：

O₁＝find(β*abs|g′(x_i)|≤abs|.g′(x_i-1)|)，i＝2，...，38

0₂＝find(γ*abs|g′(x_i)|≤abs|g′(x_i+1)|)，i＝2，...，38

O＝0₁UO₂

其中，O₁表示第一局部关键点子集，0₂分别表示第二局部关键点子集，符号U表示并集，β和γ为事先给定的常数值；

步骤3、局部关键区域区间选取；

其中包括：

步骤31、复合故障样本分组抽样；将训练集中遮挡、老化、短路以及开路四种单一故障类型同时发生时的复合故障全局样本数T平均分为z组，每组采用不放回采样方式得到k个随机样本，即

步骤32、局部关键点标记；分别对各个组中的所有样本执行所述步骤S24局部关键点筛选，执行完毕后每个全局样本的I-V曲线上都会被标记相应数量的局部关键点；

步骤33、局部关键点分类；

其中包括：

将所述局部关键点细分为局部特征头部标记点、局部特征尾部标记点和局部特征中部标记点；其中，所述局部特征头部标记点是相对位置最靠前的局部关键点；所述局部特征尾部标记点是相对位置最靠后的局部关键点；所述局部特征中部标记点是排除所述局部特征头部标记点和所述局部特征尾部标记点的剩余标记点；

步骤34、数据分布随机组分类；

其中包括：将所述局部特征头部标记点的数据归为局部特征头部随机组

对应的局部特征头部随机组总体样本记为X^h，将所述局部特征尾部标记点的数据归为局部特征中部随机组

对应的局部特征中部随机组总体样本记为X^m，将所述局部特征尾部标记点的数据归为局部特征尾部随机组

对应的局部特征尾部随机组总体样本记为X^l；

步骤35、数据分布转化；

其中包括：假定所述头部随机组样本或者所述中部随机组样本或者所述尾部随机组样本记为{X_i}，总体样本记为X，总体样本的均值记为μ，方差记为σ²，概率分布函数记为Φ，i表示同一种类型的不同随机组，i＝1,2，...，z；显然各组样本{X_i}满足独立同分布，且

其中

和

分别表示总体样本的均值和方差；

令：

同时，令

为

的特征函数，可得：

其中，

和

分别是特征函数

的一阶导数和二阶导数，j为复数，故j²＝-1；从而可以进一步得到

的特征函数

在原点的泰勒展开式为：

记X_z的特征函数为

可得：

当分组数z较大时

近似服从正态分布

可得对应的期望、方差以及概率分布分别为：

将所述头部随机组样本、所述中部随机组样本以及所述尾部随机组样本三类随机组的局部关键点分布转化为近似服从正态分布，也即

步骤36、构建局部关键区域区间；即在保障至少95％置信度的前提下分别确定最终的头部局部关键区域、中部局部关键区域以及尾部局部关键区域；

其中包括：

步骤361、针对局部特征头部随机组

依据以下公式

得到所述头部局部关键区域区间为

其中i＝1,2，...，z；

步骤362、针对局部特征中部随机组

依据以下公式

得到中部局部关键区域区间为

其中i＝1,2,....，z；

步骤363、针对局部特征尾部随机组

依据以下公式

得到所述尾部局部关键区域区间为

其中i＝1,2，...，z；

步骤4、局部关键区域插值重构；按照局部关键区域插值方法对所述头部局部关键区域、所述中部局部关键区域以及所述尾部局部关键区域进行重构；

其中所述局部关键区域插值方法包括：

步骤41、基于全局维度，计算出区间内每两个原始样本点之间所需的重采样点个数；

步骤42、得到I-V曲线上相邻两插值点x_m，x_m+1的函数值及局部一阶差分值分别为：

y_i＝g(x_i)，t_i＝g′(x_i)，(i＝m，m+1)，

步骤S43、构造局部特征插值多项式C(x)，使其满足：

C(x_i)＝y_i，C′(x_i)＝t_i，(i＝m，m+1)

引入四个指针函数r₁(x)，r₂(x)，s₁(x)，s₂(x)来表征局部特征插值函数C(x)的两个组成部分C_i，(i＝1,2)，它们都是阶次小于等于二的多项式：

C₁(x)＝y_mr₁(x)+t_ms₁(x)

C₂(x)＝y_m+1r₂(x)+t_m+1s₂(x)

β_i(x_j)＝0，β′_i(x_j)＝δ_ij，(i＝1,2)，

C(x_i)＝y_i，C′(x_i)＝y′₀，(i＝m，m+1)，

局部特征插值函数C(x)表示为：

C(x)＝C₁(x)+C₂(x)

x_m+1是r₁(x)的二重零点，r₁(x)的在x_m+1处的指针函数值和局部差分函数值相同且均为零，令：

r₁(x)＝px²+px_m+1 ²+qx²-2px*x_m+1+qx_m+1 ²-2qx*x_m+1

由r₁(x_m+1)＝r₁′(x_m+1)＝0可得：

将x_m，x_m+1互换可得：

同理可得：

两点间的局部插值公式为：

C(x)＝C₁(x)+C₂(x)＝y_mr₁(x)+t_ms₁(x)+y_m+1r₂(x)+t_m+1s₂(x)；

步骤5、构建全局-局部双流协同诊断框架；

其中包括：

步骤51、全局样本获取；

步骤52、局部样本获取，以获得头部初始局部样本、中部初始局部样本和尾部初始局部样本；

步骤53、标签编码与数据集构建；

其中包括：

将每种故障类型的标签编码为一个维度为1×4的二值向量，分别对应4种单一故障类型，其中第一列代表遮挡故障，第二列代表老化故障，第三列代表短路故障，第四列代表开路故障；

对所述全局样本以及所述头部初始局部样本、所述中部初始局部样本和所述尾部初始局部样本，分别单独编码一个标志位；

步骤54、搭建共享CNN网络模型；

步骤55、执行模型参数自适应切换；

其中包括：

步骤551、初始化一个共享CNN网络，记全局多标签分类模型的网络参数向量为W_g，记头部局部多标签分类模型的网络参数向量为W_h、中部局部多标签分类模型的网络参数向量为W_m，尾部局部多标签分类模型的网络参数向量为W_l，并将它们组合构建得到全局-局部模型参数向量W_switch：

W_switch＝[W_g，W_h，W_m，W_l]

步骤552、将待诊断的样本输入所述共享CNN网络并优先读取样本的标志位，从而识别出样本属于所述全局样本、或者所述头部初始局部样本、或者所述中部初始局部样本、或者所述尾部初始局部样本中的哪一个；

步骤553、基于标志位的识别结果，共享CNN网络模型自适应地从全局-局部模型参数向量W_switch中选择相应的模型参数向量进行加载实现模型参数切换，记模型参数切换为W_g，W_h，W_m和W_l时的共享CNN网络模型分别为CNN_g，CNN_h，CNN_m和CNN_l，其中CNN_g记为多标签分类全局模型，CNN_h，CNN_m和CNN_l分别记为多标签分类模型头部局部模型、多标签分类中部局部模型、多标签分类尾部局部模型；

步骤554、利用模型参数切换后的共享CNN网络模型对待诊断样本进行预测分别得到相应所述多标签分类全局模型、所述多标签分类头部局部模型、所述多标签分类中部局部模型、所述多标签分类尾部局部模型的多标签预测结果；

步骤56、执行全局-局部模型融合机制，得到诊断结果。

进一步地，所述步骤52包括：

步骤521、定位；即对所述全局样本执行所述局部关键点搜索，在所述全局样本上定位并标注出对应的局部关键点；

步骤522、筛选；即对带标注的全局样本执行所述构建局部关键区域区间，从所述全局样本中分别筛选出所述头部局部关键区域区间、所述中部局部关键区域区间以及所述尾部局部关键区域区间，获得头部初始局部样本、中部初始局部样本和尾部初始局部样本；

步骤523、重构；对所述头部初始局部样本、所述中部初始局部样本和所述尾部初始局部样本执行所述局部关键区域插值方法，保障最终插值重构后的样本具有与全局样本相同的数据维度，能够共享相同结构的神经网络模型进行训练。

进一步地，所述步骤56包括：

步骤561、基于所述模型参数自适应切换机制，分别利用所述全局模型、所述头部局部模型、所述中部局部模型、所述尾部局部模型对验证集中的样本进行测试，分别得到全局信息流、头部局部信息流、中部局部信息流和尾部局部信息流；定义全局样本输入全局多标签分类模型CNN_g得到的最终预测向量

为全局信息流，定义头部、中部和尾部三个局部样本输入对应的局部多标签分类模型CNN_h，CNN_m和CNN_l得到的最终预测向量

和

为局部信息流，如下所示。

进一步地，所述步骤56还包括：

步骤562、通过对验证集中的所有样本进行测试，并逐个将上述

和

信息流输入阈值函数

计算不同模型参数下共享CNN模型对各种单一故障类型识别的准确率，得到的四种信息流对应的平均按类准确率向量分别为：

其中，

表示多标签分类全局模型在验证集上对遮挡故障的识别准确率，

和

则分别表示多标签分类模型头部局部模型、所述多标签分类中部局部模型、所述多标签分类尾部局部模型在验证集上对遮挡故障的识别准确率。

进一步地，所述步骤56还包括：

所述步骤563、根据验证集测试情况，找出对各种单一故障类型识别最准确的模型，再将对应的信息流进行融合，得到最终的全局-局部双流协同概率预测向量，进一步将其输入阈值函数

得到融合模型最终的故障诊断结果：

其中，i表示四种单一故障类型，A_max函数的作用是返回所述步骤562中四种准确率向量相同列中最大值所对应的信息流概率预测值；

通过对i＝1,2,3,4分别进行判断，A_max总共返回4个概率预测值构成

得到全局-局部双流协同模型的融合预测向量，也即确定最终融合模型的第1～4列分别取哪一个信息流相应列的预测结果，基于阈值函数

计算得到诊断结果Result。

进一步地，所述共享CNN网络模型中，配合Sigmoid函数以及阈值函数

输出的光伏复合故障诊断分类结果的显示表达为：

x＝[x_i]，i＝1,2,3,4

其中，x是表示最后一层全连接层的输出向量，其总共包含4项，将其输入到Sigmoid函数得到对应4种单一故障类型发生的预测概率向量

表示单一故障类型i发生的预测概率，τ表示阈值；利用阈值函数

对

做进一步判别，预测概率大于等于τ则认为发生了该类型单一故障，最后综合4列判别结果得到最终的光伏复合故障诊断分类结果；

所选用的损失函数为二元交叉熵(Binary Cross Entropy，BCE)，对应的数学表达式如下：

其中，

和

分别表示全局模型损失函数和局部模型损失函数，C表示单一故障类型数，K表示训练样本总数，

表示第i个样本中单一故障类型j的真实标签，发生为1，不发生为0，

和

是由阈值函数

输出的，分别表示全局模型和局部模型对第i个样本中单一故障类型j的预测标签。

进一步地，所述全局-局部模型融合通过采用其它模型融合方法得到。

进一步地，所述α设定为10^-4。

进一步地，所述β设定为5，所述γ设定为3。

进一步地，所述τ设定为0.5。

与现有技术方案相比，本发明的有益技术效果至少包括：

(1)本发明考虑了光伏组件可能同时发生多种故障的复杂情况，不同于现有技术大多采用机理建模方法进行复合故障诊断，本发明方案提出了一种新的全局-局部双流协同的光伏复合故障诊断框架，模型的训练和推理都是数据驱动的，可以实现端到端快速故障诊断，从而在实际光伏系统同时发生多种故障类型时，解决了现有技术建模效率低以及模型的准确性和泛化性差的问题。

(2)不同于现有技术仅利用全局信息进行光伏故障诊断，本发明针对光伏数据的特点，设计了新的局部关键点搜索算法、局部关键区域区间选取方法以及局部关键区域插值算法来进一步获取局部信息。

(3)本发明方法从复合故障机理角度出发，将复合故障视为多种已知故障的叠加，将复合故障诊断问题转化为识别多种单一故障，也即将原始的单标签多分类问题转化为多标签二分类问题进行解决，通过协同利用光伏故障数据的全局信息和关键局部信息，解决了现有技术诊断故障类型少以及复合故障诊断精度低的问题。

(4)本发明设计了新的模型参数自适应切换机制，使得全局和局部样本可以共享相同结构的CNN模型训练，克服了现有发明方法需要采用多个不同结构的网络模型分别训练的不足，既提高了建模效率，又提升了诊断模型的鲁棒性。

(5)本发明设计了新的全局-局部模型融合机制，可以直接通过局部模型来修正全局模型对部分单一故障类别的识别准确率，解决了现有发明方法需要基于先验知识或人工经验对预测概率向量手动加权融合的问题。

以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明，以充分地了解本发明的目的、特征和效果。

附图说明

图1是本发明的一个较佳实施例的整体流程图；

图2是本发明的一个较佳实施例的局部一阶差分示意图；

图3是本发明的一个较佳实施例的头部局部关键区域插值效果图；

图4是本发明的一个较佳实施例的中部局部关键区域插值效果图；

图5是本发明的一个较佳实施例的尾部局部关键区域插值效果图；

图6是本发明的一个较佳实施例的基于全局-局部双流协同的光伏复合故障诊断框架；

图7是本发明的一个较佳实施例的多标签分类CNN网络结构图。

具体实施方式

以下参考说明书附图介绍本发明的多个优选实施例，使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现，本发明的保护范围并非仅限于文中提到的实施例。

在光伏系统的日常运行过程中，光伏组件最容易出现的单一故障类型包括：遮挡故障(阴影)、老化故障、短路故障本以及开路故障。然而，实际光伏阵列运行时往往存在复合故障，也即上述四类单一故障同时发生两种或两种以上的情况。为此，本发明以遮挡、老化、短路、开路这四种常见单一故障为基础，开展复合故障诊断研究，通过排列组合总共得到正常状态、四种单一故障以及十一种复合故障类型(共计十六种故障类型)，并分别采集了相应状态下原始伏安特性曲线(I-V曲线)以及温度和辐照度，也即原始数据包括电流、电压、温度以及辐照度这四列特征，所提出的光伏组件复合故障诊断方法包括以下步骤：

步骤一：数据预处理，一方面，不同原始I-V曲线上的采样点数目不同(数据维度不同)，无法用统一的网络输入维度进行模型训练，另一方面，这些采样点在曲线上分布不均衡，直接训练模型会导致网络权重失配。为此，本发明采用双线性插值、上采样以及数据重构的方法对原始I-V曲线统一进行数据预处理。具体包括：

S11、读取原始I-V曲线，记录开路电压Vo和短路电流Isc；

S12、对数据进行降采样，在[0，Vo]范围内等距重新采样20个电压V_Rx，在[0，Isc]范围内等距重新采样20个电流I_Rx，压缩原始伏安特性曲线的数据量从而节省计算资源；

S13、对数据进行双线性插值，计算出20个重采样电流I_Rx处对应的电压值，以及20个重采样电压V_Rx处对应的电流值；并利用下式分别计算出20个重新采样电流I_Rx处的电压V_{Rx_n}以及20个重新采样电流V_Rx处的电压I_{Rx_n}：

其中，(I1，V1)、(I2,V2)是原始伏安曲线上I_Rx和V_Rx两侧最相邻的采样点。

S14、获取重采样后的伏安特性曲线，将双线性插值得到的40个重采样点按电压降序进行排列，得到40*2的数组；

S15、数据重构，将40个重采样点对应的温度和辐照度构建为40*2的环境向量，与重采样后40*2的伏安特性曲线数组重构成40*4的二维数组。

步骤二：局部关键点搜索。考虑到同时发生的单一故障类型越多，对应的复合故障I-V特性曲线相较于正常状态下的I-V曲线畸变就会越严重，也即叠加后的故障特征区域越多。因此，不同类型原始I-V曲线上的关键局部区域数量是不同的。为了确保局部样本能够尽可能包含关键故障特征信息，本发明中提出的关键局部搜索算法选取最复杂的复合故障情形(遮挡、老化、短路以及开路四种单一故障类型同时发生)来定位关键局部采样点的相对位置，这里的相对位置是指所标记的局部关键采样点是40个离散数据点中的第几个点。主要包括：

S21、全局样本获取，对原始I-V曲线统一进行数据预处理，经过数据预处理后的完整I-V曲线记为全局样本，它们都是由40个离散数据点构成的，并且这些重采样点在曲线上是均匀分布的；

S22、局部一阶差分计算，考虑到经过数据预处理后得到的全局样本(完整光伏I-V曲线)是由40个离散数据点(x_i，y_i)构成的，不能像连续函数一样计算各点的导数值，为此本发明从数据差分的角度着手，定义I-V线上相邻两采样点(x_m，y_m)，(x_m+1，y_m+1)且(x_m+1>x_m)在(x_m，y_m)处的局部一阶差分g′(x_m)为：

S23、平缓点筛选，定义完整I-V曲线中局部一阶差分绝对值小于α的采样点为平缓点。基于上述S1中的方法依次计算出全局样本中相邻两采样点的一阶差分值(40个离散点总共计算出39个局部一阶差分值)，以某个遮挡、老化、短路以及开路四种故障类型同时发生的复合故障样本为例，其完整I-V曲线对应得到的局部一阶差分如附图2所示，并筛选出I-V曲线上的平缓点集合T：

T＝find(abs|g′(x_i)<α|)，i＝2，...，39

其中，find()函数的作用是筛选出满足括号内约束条件的采样点相对位置，abs||为绝对值函数，α为事先给定的常数值，在本发明中常数值α设定为10^-4。

S24、局部关键点筛选，定义平缓采样点比相邻左侧局部一阶差分绝对值至少小β倍或者平缓采样点比相邻右侧局部一阶差分绝对值至少小γ倍的采样点为局部关键点，并筛选出I-V曲线上的局部关键点集合O：

0₁＝find(β*abs|g′(x_i)|≤abs|g′(x_i-₁)|)，i＝2，...，38

O₂＝find(γ*abs|g′(x_i)|≤abs|g′(x_i+1)|)，i＝2，...，38

O＝O₁UO₂

其中，O₁和O₂分别表示两个局部关键点子集，符号U表示并集，β和γ为事先给定的常数值，在本发明中常数值β设定为5，常数值γ设定为3。

步骤三：局部关键区域区间选取。由于在不同温度和辐照状态下采集的复合故障原始I-V曲线存在显著差异，而且经过数据预处理后的I-V曲线是由40个离散数据点构成的，因此不同样本间，经过步骤二所得到的局部关键采样点在I-V曲线上的相对位置存在差异。为了统一不同故障类型样本的局部关键区域区间，本发明进一步设计了局部关键区域区间选取方法，具体包括：

S31、复合故障样本分组抽样，本发明将训练集中遮挡、老化、短路以及开路四种单一故障类型同时发生时的复合故障全局样本数T平均分为z组，每组采用不放回采样方式得到k个随机样本，可得：

S32、局部关键点标记，分别对各个组中的所有样本执行此前所述的局部关键点搜索算法，执行完毕后每个全局样本的I-V曲线上都会被标记相应数量的局部关键采样点；

S33、局部关键点分类，本发明考虑如何从同一条I-V曲线上所标注的若干个局部关键采样点来确定局部关键区域。在本发明中，按照搜索算法在一条复合故障I-V曲线上得到的关键点相对位置，进一步将这些局部关键点细分为三大类：(1)相对位置最靠前的局部关键点(第一个标记点)记为局部特征的头部标记点；(2)相对位置最靠后的局部关键点(最后一个标记点)记为局部特征的尾部标记点(3)取其余标记点(排除头部和尾部标记点剩余的标记点)的中位数记为局部特征的中部标记点；

S34、数据分布随机组分类，为了更加准确地获取这些关键点的数据分布情况，本发明进一步将每组随机复合故障样本中局部关键采样点的相对位置按照上述头部、中部和尾部规则整体分为三大类，也即局部特征头部随机组、局部特征中部随机组以及局部特征尾部随机组，对应的随机组样本分别记为

和

对于此前所述三种类型局部关键点的总体样本记为X^h，X^m和X^l；

S35、数据分布转化，在上述步骤S34的基础上对三种类型局部关键点的随机组进行数据分布转化。由于对三种类型局部关键点的分析方法是类似的，下面仅以某种类型为例，具体介绍所本发明提出的数据分布分析方法。假定某种类型(头部、中部或者尾部)的随机组样本记为{X_i}，总体样本记为x，总体样本的均值记为μ，方差记为σ²，概率分布函数记为Φ，i表示同一种类型的不同随机组，i＝1,2，...，z。显然各组样本{X_i}满足独立同分布，且

其中

和

分别表示总体样本的均值和方差。进一步地，在本发明中令：

同时，令

为

的特征函数，可得：

其中，

和

分别是特征函数

的一阶导数和二阶导数，j为复数，故j²＝-1。从而可以进一步得到

的特征函数

在原点的泰勒展开式为：

为了便于表述，在本发明中记X_z的特征函数为

可得：

因此，当分组数z较大时

近似服从正态分布

可得对应的期望、方差以及概率分布分别为：

经过上述步骤，可以将三种类别随机组的局部关键点分布转化为近似服从正态分布，也即

假定数据预处理后I-V曲线上的40个采样点，分别记为IV(x)，x＝1,2，...，40。在本发明中，定义V|b|为数据预处理后I-V曲线上电压数值不小于b的最近采样点电压值(I-V曲线的横坐标值)，记为优化上界。U|b|为数据预处理后I-V曲线上电压数值不大于b的最近采样点电压值(I-V曲线的横坐标值)，记为优化下界，L(V|b|)和L(U|b|)则分别对应优化上界和优化下界在对应I-V曲线上的相对坐标(也即相应的横坐标对应I-V曲线上40个采样点中的第几个点)；

S36、在步骤三S31～S35的基础上，本发明进一步针对三种不同类别的局部样本数据分布改进了置信区间方法，从而在保障至少95％置信度的前提下分别确定最终的头部、中部以及尾部局部关键区域，下面分三大类具体进行介绍：

①针对局部特征头部随机组

只需要确定头部区域区间的上界和优化上界，之后确定优化上界相对坐标，并对所有局部特征头部随机组的优化上界相对坐标取最大值，也即将数据预处理后I-V曲线上的第一个采样点IV(0)至最大优化上界相对坐标间的区域划分为本发明的头部局部关键区域。由正态分布的概率函数可得：

可得，头部局部关键区域区间为

其中i＝1,2，...，z。

②针对局部特征中部随机组

需要分别确定中部区域区间的上界、下界以及优化下界和优化上界，之后确定优化上界和优化下界的相对坐标，并对所有局部特征中部随机组优化上界相对坐标取最大值，对所有局部特征中部随机组优化下界相对坐标取最小值，再对两侧各拓展三个采样点，也即将最小优化下界相对坐标左侧第三个采样点至最大优化上界相对坐标右侧第三个采样点间的区域划分为本发明的中部局部关键区域。由正态分布的概率函数可得：

可得，中部局部关键区域区间为

其中i＝1,2,...，z。

③针对局部特征尾部随机组

只需要确定尾部区域区间的下界和优化下界，之后确定优化下界相对坐标，并对所有局部特征尾部随机组的优化下界相对坐标取最小值，也即将最大优化上界相对坐标至数据预处理后I-V曲线上的最后一个采样点IV(40)间的区域划分为本发明的尾部局部关键区域。由正态分布的概率函数可得：

可得，尾部局部关键区域区间为

其中i＝1,2，...，z。

步骤四：局部关键区域插值重构。考虑到上述局部关键点搜索算法以及局部关键区域区间选取方法得到的不同局部关键区域所包含的样本点个数存在差异，为此本发明进一步设计了局部关键区域插值算法，从而保障最终插值重构后的局部样本具有与全局样本相同的数据维度，能够共享相同网络结构的CNN进行训练，具体包括：

S41、各局部区域基于全局维度(完整I-V曲线采样点数为40)计算出区间内每两个原始样本点之间所需的重采样点个数；

S42、基于此前局部关键点搜索算法中所述的差分计算方法，得到I-V曲线上相邻两插值点x_m，x_m+1的函数值及局部一阶差分值分别为：

y_i＝g(x_i)，t_i＝g′(x_i)，(i＝m，m+1)，

S43、为了进一步补充和放大局部关键区域的信息，本发明构造了局部特征插值多项式C(x)，使其满足：

C(x_i)＝y_i，C′(x_i)＝t_i，(i＝m，m+1)

为了便于求解和描述插值函数，本发明进一步引入四个指针函数r₁(x)，r₂(x)，s₁(x)，s₂(x)来表征局部特征插值函数C(x)的两个组成部分C_i，(i＝1,2)，它们都是阶次小于等于二的多项式：

C₁(x)＝y_mr₁(x)+t_ms₁(x)

C₂(x)＝y_m+1r₂(x)+t_m+1s₂(x)

β_i(x_j)＝0，β′_i(x_j)＝δ_ij，(i＝1,2)，

C(x_i)＝y_i，C′(x_i)＝y′₀，(i＝m，m+1)，

因此，局部特征插值函数C(x)可以用四个插值基函数表示为：

C(x)＝C₁(x)+C₂(x)

由此前所述指针函数的函数值和局部差分函数值可知：x_m+1是r₁(x)的二重零点，r₁(x)的在x_m+1处的指针函数值和局部差分函数值相同且均为零，可令：

r₁(x)＝px²+px_m+1 ²+qx²-2px*x_m+1+qx_m+1 ²-2qx*x_m+1

由r₁(x_m+1)＝r₁′(x_m+1)＝0可得：

如上述方法，将x_m，x_m+1互换可得：

同理可得：

综上所述，可得两点间的局部插值公式为：

C(x)＝C₁(x)+C₂(x)＝y_mr₁(x)+t_ms₁(x)+y_m+1r₂(x)+t_m+1s₂(x)

以遮挡、老化、短路以及开路四种单一故障类型同时发生时的复合故障样本为例，其头部、中部以及尾部局部关键区域插值前后的结果如附图3、4和5所示。

步骤五：构建全局-局部双流协同诊断框架，对于光伏复合故障诊断而言，仅仅依靠完整I-V曲线进行全局诊断或者局部关键区域进行局部诊断都无法准确识别相似故障，这是因为全局信息往往难以突出局部细节，而局部信息难以全面准确地把握整体故障特征。基于上述局部关键点搜索算法、局部关键区域区间选取方法以及局部关键区域插值算法，本发明进一步挖掘关键局部特征并将其与全局信息相融合，针对光伏数据特点提出了一种新的全局-局部双流协同诊断框架，如附图6所示，具体包括：

S51、全局样本获取：基于双线性插值、上采样以及数据重构对原始I-V曲线数据进行预处理。在本发明中，将数据预处理后的完整I-V曲线称为全局样本，其中包含的信息称为全局信息，基于全局样本训练得到的模型称为全局模型；

S52、局部样本获取：局部样本的获取主要包含定位、筛选以及重构三个部分。考虑到不同故障类型全局样本I-V曲线相较于正常I-V曲线的畸变程度是不同的，为了确保局部样本能够尽可能包含关键故障特征信息，其中定位和筛选步骤是基于最复杂的复合故障情形(遮挡、老化、短路以及开路四种单一故障类型同时发生)来开展的。值得注意的是，当筛选出最优局部关键区域区间后，这个区间会统一运用至所有故障类型的样本，也即最终所有故障类型的局部关键区域区间是固定的、相同的，具体包括：

①定位，对全局样本执行上述局部关键点搜索算法，从而可以在全局样本上定位并标注出对应的局部关键点；

②筛选，对带标注的全局样本执行上述局部关键区域区间选取方法，从而从全局样本中分别筛选出头部、中部以及尾部局部关键区域区间(所有故障类型均采用这三个区间)，值得注意的是这三个区间均能保证95％以上的置信度，保障了局部特征的有效性。此时，从每个全局样本筛选出的三个区间可以获得三个初始局部样本；

③重构，由于不同初始局部样本的维度是不同的(所包含的原始采样点个数不同)，进一步对这些初始局部样本执行上述局部关键区域插值算法，从而保障最终插值重构后的样本具有与全局样本相同的数据维度，能够共享相同结构的神经网络模型进行训练；

在本发明中，将经过定位、筛选以及重构后得到的I-V曲线称为局部样本，其中包含的信息称为局部信息，基于局部样本训练得到的模型称为局部模型。

S53、标签编码与数据集构建：为了后续利用神经网络训练监督学习模型，需要进一步对全局样本和局部样本进行标签编码。现有专利大多采用单标签多分类方案，无论是单一故障类型还是复合故障类型，样本所对应的数据标签都是一个单一数值(例如四种单一故障的标签分别为1～4，某种复合故障的标签为5)，也即只是简单地将复合故障视为一种新的类型与单一故障样本一同训练，随着复合故障类型的增加，数据标签将会呈指数增长导致模型难以训练。为此，本发明从复合故障机理角度出发，将复合故障视为多种已知故障的叠加，将复合故障诊断问题转化为识别多种单一故障，也即将原始的单标签多分类问题转化为多标签二分类问题进行解决。具体来说，在本发明中所有复合故障均可细分为遮挡、老化、短路以及开路这4种单一故障类型的叠加，因此本发明采用了多标签编码方案，将每种故障类型的标签编码为一个维度为1×4的二值(0和1)向量，分别对应4种单一故障类型(0表示没有发生该故障，1表示发生了该故障)，其中第一列代表遮挡故障，第二列代表老化故障，第三列代表短路故障，第四列代表开路故障。例如，标签[1，0,0,0]表示此时只发生了遮挡这一种故障，而标签[1，0，1，0]表示发生了复合故障，且是由遮挡和短路两种故障构成。此外，对全局样本以及三类局部样本，分别单独编码一个标志位，便于后续模型训练以及诊断，其中全局模型标志位为g，头部、中部以及尾部局部样本的标志位分别为h、m以及l；

S54、搭建共享CNN网络模型：由于本发明中的方法能够确保全局样本和局部样本具有相同的数据维度，因此可以共享具有相同网络结构的CNN训练全局和局部模型，下面对共享CNN网络进行具体介绍：

①卷积层：标准二维卷积层(Conv2d)的引入可以方便实现网络权重共享，从而大幅降低模型训练过程中的自由参数，同时还有助于改善网络的性能。定义二维卷积层和一维卷积层的计算过程如下：

其中，x是表示输入数据(二维矩阵)，i和j分别对应输入二维矩阵中的坐标，内核矩阵用K来表示，其维度大小为m×m，是模型训练时可学习的参数。二维内核矩阵的坐标索引分别用w和h来表示，第k个输入神经元的内核大小用K_k表示，符号*表示不采用零填充的互相关算子。

②最大池化层：其主要作用是增大网络感受野，降低信息冗余，降低模型计算量，降低网络优化难度，防止网络过拟合以及使模型对输入数据中的特征变化更加鲁棒。最大池化(Max Pooling)是将输入的数据划分为若干个矩形区域，对每个子区域输出最大值，其定义如下：

其中，x_kpq表示与第k个特征图相关的在矩形区域

中位于(p，q)位置的元素，y_kij代表与第k个特征图相关的在矩形区域

的最大池化输出值；

③ReLU激活函数：ReLU全名Rectified Linear Unit，意思是修正线性单元。Relu激活函数是常用的神经激活函数，它实质上是一种分段线性函数，把所有的负值都变为0，而正值不变，这种操作被称为单侧抑制，其数学表达式如下：

其中，x是输入特征，ReLu具有稀疏性，可以使稀疏后的模型能够更好地挖掘相关特征，拟合训练数据；在x≥0区域上，不会出现梯度饱和、梯度消失的问题，计算复杂度低，不需要进行指数运算，只要一个阈值就可以得到激活值。

④全连接层(FC)与Sigmoid函数：全连接层的主要作用就是将前层(卷积、池化等层)计算得到的特征空间映射样本标记空间，简单地说就是将特征表示整合成一个值，其优点在于减少特征位置对于分类结果的影响，提高了整个网络的鲁棒性，其数学表达式如下：

y＝W_N×Dx_D×M+b_N×M

全连接的另一个作用是充当分类器，通过与合适的输出函数相结合，可以输出网络最终的分类结果。对于本发明来说，由于最复杂的复合故障情形是遮挡、老化、短路以及开路四种单一故障同时发生，因此最终通过网络输出的应该是一个维度为1×4的向量，其中每一列的数值分别对应一种单一故障类型发生的预测概率。由于FC被放置在最后一层，配合Sigmoid函数以及阈值函数

输出的就是光伏复合故障诊断分类结果的显示表达：

x＝[x_i]，i＝1,2,3,4

表示单一故障类型i发生的预测概率，τ表示阈值。利用阈值函数

对

做进一步判别，预测概率大于等于τ则认为发生了该类型单一故障，最后综合4列判别结果得到最终的光伏复合故障诊断分类结果，在本发明中常数值τ设定为0.5。

由于本发明将复合故障诊断问题转化为多标签二分类问题进行解决，所选用的损失函数为二元交叉熵(Binary Cross Entropy，BCE)，对应的数学表达式如下：

其中，

和

分别表示全局和局部模型损失函数，C表示单一故障类型数，K表示训练样本总数，

表示第i个样本中单一故障类型j的真实标签(发生为1，不发生为0)，

和

是由上述阈值函数

输出的，分别表示全局和局部模型对第i个样本中单一故障类型j的预测标签。

值得注意的是，不同于现有专利方法需要采用多个不同结构的网络模型，本发明对局部信息进行重构保障了全局和局部样本可以共享相同结构的CNN模型训练，既提高了建模效率，又提升了诊断模型的鲁棒性。通过将原始光伏组件复合故障诊断问题转化为多标签二分类问题，本发明仅利用一种共享CNN就能训练得到准确的多标签分类模型，CNN网络结构包括二维卷积层、一维卷积层、最大池化层、全连接层以及Sigmoid输出函数，具体的多标签分类CNN结构如附图7所示。

S55、模型参数自适应切换机制：利用全局样本训练全局多标签分类模型，根据不同标志位分别利用头部、中部和尾部局部样本训练三个局部多标签分类模型。在实际诊断时，每个待诊断的未知故障样本(真实标签未知的原始I-V曲线)首先经过上述步骤一至步骤三得到全局样本以及头部、中部和尾部这三个局部样本。如步骤四中所述，由于本发明保障了全局样本和局部样本都具有相同的数据维度，因此可以共享相同结构的CNN网络，因此在进行模型推理诊断时，无需像现有专利那样一次将样本输入不同机器学习模型中分别计算结果，而是可以通过本发明所设计的模型参数自适应切换机制来实现，具体包括：

①基于步骤四，初始化一个共享CNN网络，记全局多标签分类模型的网络参数向量为W_g，记头部、中部和尾部三个局部多标签分类模型的网络参数向量分别为W_h，W_m和W_l，并将它们组合构建得到全局-局部模型参数向量W_switch：

W_switch＝[W_g，W_h，W_m，W_l]

②将待诊断的样本输入共享CNN网络并优先读取样本的标志位，从而识别出样本属于全局样本还是三类局部样本；

③基于标志位的识别结果，共享CNN网络模型自适应地从全局-局部模型参数向量W_switch中选择相应的模型参数向量进行加载实现模型参数切换，记模型参数切换为W_g，W_h，W_m和W_l时的共享CNN网络模型分别为CNN_g，CNN_h，CNN_m和CNN_l，其中CNN_g记为全局模型，CNN_h，CNN_m和CNN_l记为局部模型；

④利用模型参数切换后的共享CNN网络模型对待诊断样本进行预测就能分别得到相应全局模型和局部模型的多标签预测结果；

S56、全局-局部模型融合机制：考虑到全局信息往往难以突出局部细节，而局部信息难以全面准确地把握整体故障特征，为此本发明进一步通过全局-局部双流融合实现复合故障诊断。值得注意的是，现有专利大多通过对预测概率向量加权得到融合预测向量，用于诊断故障。然而这种加权方式需要手动调节，对操作人员的先验知识(事先积累的经验)要求较高，而且每次调节后模型都需要重新训练，导致该训练过程的可解释性较差往往不能达到预期的精度。为此，本发明改进了全局-局部信息流的融合机制，具体包括：

①基于上述S5中的模型参数自适应切换机制，分别利用全局模型和局部模型对验证集中的样本进行测试，分别得到全局信息流和局部信息流。本发明定义全局样本输入全局多标签分类模型CNN_g得到的最终预测向量

和

为局部信息流：

②通过对验证集中的所有样本进行测试，并逐个将上述

和

信息流输入阈值函数

计算不同模型参数下共享CNN模型对各种单一故障类型识别的准确率(不同信息流对应概率预测向量单一列的识别准确性)，得到的四种信息流对应的平均按类准确率向量分别为：

其中，

表示多标签分类全局模型在验证集上对第一种单一故障(遮挡故障)的识别准确率，

和

则分别表示三种多标签分类局部模型在验证集上对第一种单一故障(遮挡故障)的识别准确率；

③根据验证集测试情况，找出对各种单一故障类型识别最准确的模型，再将对应的信息流进行融合，也即用局部模型概率预测向量的部分列替代全局模型Sigmoid概率预测向量的部分列，得到最终的全局-局部双流协同概率预测向量，进一步将其输入阈值函数M得到融合模型最终的故障诊断结果：

其中，i表示四种单一故障类型(也即信息流中的第i列)，A_max函数的作用是返回②中四种准确率向量相同列中最大值所对应的信息流概率预测值。例如，对于准确率向量

的第一列

如果最大值是

则

得到全局-局部双流协同模型的融合预测向量，也即确定最终融合模型的第1～4列分别取哪一个信息流相应列的预测结果，诊断结果Result则可以进一步基于阈值函数M计算得到。基于本发明所提出的全局-局部双流协同复合故障诊断方法，可以利用局部模型来修正全局模型对部分单一故障类别的识别准确率，从而有效提高最终融合模型对光伏组件复合故障的诊断精度。

本发明中的局部关键点搜索算法是基于局部一阶差分设计的，这里的一阶差分可以被其它能够反映曲线变化趋势的方法替代，例如二阶差分、拉格朗日中值定理等。对于曲线上平缓点和关键点的选取，也可以适当调整规则得到近似方案。

本发明中的局部关键区域区间选取方法是通过数据分布变换以及改进正态分布置信区间方法得到的，该部分也可以被其它类型数据分布的置信区间替换，例如泊松分布、τ分布等。

本发明中的阈值函数不局限于文中所设置的常数值，这个值可以改动，既可以是固定值也可以是动态变化的。

本发明中全局信息和局部信息的融合方法可以采用其它模型融合方法得到近似方案。

综上，本发明的技术贡献至少包括：

(1)本发明针对光伏组件可能同时发生多种故障的复杂情况，设计了一种新的全局-局部双流协同的光伏复合故障诊断框架，模型的训练和推理都是数据驱动的，可以实现光伏组件复合故障的端到端快速诊断，解决了现有光伏组件复合故障诊断机理建模技术效率低以及模型泛化性差的问题；

(2)本发明从复合故障机理角度出发，将复合故障视为多种已知故障的叠加，将复合故障诊断问题转化为识别多种单一故障，也即将原始的单标签多分类问题转化为多标签二分类问题进行解决，能够很好地保留了各类单一故障间的潜在联系，解决了现有技术诊断故障类型少以及复合故障诊断精度低的问题；

(3)不同于现有技术仅利用全局信息进行光伏故障诊断，本发明针对光伏数据的特点，设计了新的局部关键点搜索算法、局部关键区域区间选取方法以及局部关键区域插值算法来进一步获取局部信息，通过协同利用光伏故障数据的全局信息和关键局部信息有效提升了模型对光伏组件复合故障的识别准确率；

(4)本发明设计了新的模型参数自适应切换机制，使得全局和局部样本可以共享相同结构的CNN模型训练，克服了现有发明方法需要采用多个不同结构的网络模型分别训练的不足，既提高了建模效率，又提升了诊断模型的鲁棒性；

本发明通过将原始完整的I-V特性曲线视为全局信息，同时基于光伏I-V数据的特点设计了新的局部关键点搜索算法、局部关键区域区间选取方法以及局部关键区域插值算法来挖掘原始完整I-V曲线的局部信息，不仅能够很好地保留各类单一故障间的潜在联系，同时还能保障局部信息和全局信息具有相同的数据维度，使得全局模型和局部模型可以共享相同网络结构的CNN开展训练，从而节省了模型搭建成本提升了建模效率。本发明从复合故障机理角度出发，将复合故障视为多种已知故障的叠加，将复合故障诊断问题转化为识别多种单一故障，也即将原始的单标签多分类问题转化为多标签二分类问题进行解决，基于共享CNN建立了多标签分类全局模型和多标签分类局部模型。此外，本发明提出了新的模型参数自适应切换机制以及全局-局部双流协同模型融合机制，能够基于验证集情况直接用局部模型Sigmoid概率预测向量的部分列替代全局模型Sigmoid概率预测向量的部分列，不存在加权问题，从而用局部模型来修正全局模型对部分单一故障类别的识别准确率，大幅改善模型出现误判和漏判的情况，有效提高了模型复合故障诊断精度，对于现场运维人员在多种故障同时发生后快速准确地开展快速维护，避免光伏组件故障运行造成巨大的发电经济损失和重大安全事故具有重要意义。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种智能化光伏组件复合故障诊断方法，其特征在于，包括以下步骤：

步骤1、数据预处理；

步骤2、局部关键点搜索；

其中包括：

步骤21、全局样本获取；经过所述数据预处理后的完整I-V曲线记为全局样本，所述全局样本是由40个离散数据点(x_i,y_i)构成，并且在曲线上是均匀分布的；

步骤22、局部一阶差分计算；定义I-V线上相邻两采样点(x_m,y_m)，(x_m+1,y_m+1)且(x_m+1>x_m)在(x_m,y_m)处的局部一阶差分值g′(x_m)为：

T＝find(abs|g′(x_i)＜α|)，i＝2，...，39

S24、局部关键点搜索；

O₁＝find(β*abs|g′(x_i)|≤abs|g′(x_i-₁)|)，i＝2，...，38

O₂＝find(γ*abs|g′(x_i)|≤abs|g′(x_i+1)|)，i＝2，...，38

O＝O₁∪O₂

其中，O₁表示第一局部关键点子集，O₂分别表示第二局部关键点子集，符号∪表示并集，β和γ为事先给定的常数值；

步骤3、局部关键区域区间选取；

其中包括：

步骤32、局部关键点标记；分别对各个组中的所有样本执行所述步骤S24局部

关键点筛选，执行完毕后每个全局样本的I-V曲线上都会被标记相应数量的局部关键点；

步骤33、局部关键点分类；

其中包括：

步骤34、数据分布随机组分类；

对应的局部特征尾部随机组总体样本记为X^l；

步骤35、数据分布转化；

其中包括：假定所述头部随机组样本或者所述中部随机组样本或者所述尾部随机组样本记为{X_i}，总体样本记为X，总体样本的均值记为μ，方差记为σ²，概率分布函数记为Φ，i表示同一种类型的不同随机组，i＝1,2,...,z；显然各组样本{X_i}满足独立同分布，且

其中

和

分别表示总体样本的均值和方差；

令：

同时，令

为

的特征函数，可得：

其中，

和

分别是特征函数

的特征函数

在原点的泰勒展开式为：

记X_z的特征函数为

可得：

当分组数z较大时

近似服从正态分布

可得对应的期望、方差以及概率分布分别为：

其中包括：

步骤361、针对局部特征头部随机组

依据以下公式

得到所述头部局部关键区域区间为

其中i＝1,2,...,z；

步骤362、针对局部特征中部随机组

依据以下公式

得到中部局部关键区域区间为

其中i＝1，2，...，z；

步骤363、针对局部特征尾部随机组

依据以下公式

得到所述尾部局部关键区域区间为

其中i＝1,2,...,z；

其中所述局部关键区域插值方法包括：

y_i＝g(x_i)，t_i＝g′(x_i)，(i＝m，m+1)，

步骤S43、构造局部特征插值多项式C(x)，使其满足：

C(x_i)＝y_i，C′(x_i)＝t_i，(i＝m，m+1)

引入四个指针函数r₁(x),r₂(x),s₁(x),s₂(x)来表征局部特征插值函数C(x)的两个组成部分C_i,(i＝1,2)，它们都是阶次小于等于二的多项式：

C₁(x)＝y_mr₁(x)+t_ms₁(x)

C₂(x)＝y_m+1r₂(x)+t_m+1s₂(x)

β_i(x_j)＝0，β′_i(x_j)＝δ_ij，(i＝1，2)，

C(x_i)＝y_i，C′(x_i)＝y′₀，(i＝m，m+1)，

局部特征插值函数C(x)表示为：

C(x)＝C₁(x)+C₂(x)

r₁(x)＝px²+px_m+1 ²+qx²-2px*x_m+1+qx_m+1 ²-2qx*x_m+1

由r₁(x_m+1)＝r₁′(x_m+1)＝0可得：

将x_m，x_m+1互换可得：

同理可得：

两点间的局部插值公式为：

C(x)＝C₁(x)+C₂(x)＝y_mr₁(x)+t_mS₁(x)+y_m+1r₂(x)+t_m+1S₂(x)；

步骤5、构建全局-局部双流协同诊断框架；

其中包括：

步骤51、全局样本获取；

步骤53、标签编码与数据集构建；

其中包括：

步骤54、搭建共享CNN网络模型；

步骤55、执行模型参数自适应切换；

其中包括：

W_switch＝[W_g，W_h，W_m，W_l]

步骤553、基于标志位的识别结果，共享CNN网络模型自适应地从全局-局部模型参数向量W_switch中选择相应的模型参数向量进行加载实现模型参数切换，记模型参数切换为W_g,W_h,W_m和W_l时的共享CNN网络模型分别为CNN_g,CNN_h,CNN_m和CNN_l，其中CNN_g记为多标签分类全局模型，CNN_h,CNN_m和CNN_l分别记为多标签分类模型头部局部模型、多标签分类中部局部模型、多标签分类尾部局部模型；

步骤56、执行全局-局部模型融合机制，得到诊断结果。

2.如权利要求1所述的智能化光伏组件复合故障诊断方法，其特征在于，所述步骤52包括：

3.如权利要求1所述的智能化光伏组件复合故障诊断方法，其特征在于，所述步骤56包括：