CN113221468B - 基于集成学习的光伏阵列故障诊断方法 - Google Patents

基于集成学习的光伏阵列故障诊断方法 Download PDF

Info

Publication number
CN113221468B
CN113221468B CN202110605736.1A CN202110605736A CN113221468B CN 113221468 B CN113221468 B CN 113221468B CN 202110605736 A CN202110605736 A CN 202110605736A CN 113221468 B CN113221468 B CN 113221468B
Authority
CN
China
Prior art keywords
fault
model
algorithm
photovoltaic array
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110605736.1A
Other languages
English (en)
Other versions
CN113221468A (zh
Inventor
陈志聪
林月达
吴丽君
程树英
林培杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202110605736.1A priority Critical patent/CN113221468B/zh
Publication of CN113221468A publication Critical patent/CN113221468A/zh
Application granted granted Critical
Publication of CN113221468B publication Critical patent/CN113221468B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/08Thermal analysis or thermal optimisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/50Photovoltaic [PV] energy

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Testing Of Individual Semiconductor Devices (AREA)
  • Photovoltaic Devices (AREA)

Abstract

本发明涉及基于集成学习的光伏阵列故障诊断方法,包括以下步骤:获取光伏面板的实际I‑V特性曲线信息和环境信息;计算I‑V特性曲线的电气参数、几何特征,并结合光伏阵列单二极管等效模型电路的模型参数和光伏阵列的背板温度、环境辐照度作为故障特征;对特征数据进行零均值标准化处理,并对故障标签进行序号编码;根据集成学习的模型堆叠方法搭建故障诊断模型,以极端随机树、LightGBM、支持向量机和K‑近邻算法作为模型堆叠第一层的算法,极端随机树作为第二层算法,并用网格搜索选择算法的超参数;根据训练好的模型预测光伏阵列的故障类型,评估和优化光伏电站的工作状态。本发明结合不同算法的优点,提升了故障诊断算法的预测精度和稳定性。

Description

基于集成学习的光伏阵列故障诊断方法
技术领域
本发明涉及光伏阵列监测与故障诊断技术领域,特别是一种基于集成学习的光伏阵列故障诊断方法。
背景技术
为了缓解环境污染、化石能源消耗、气候变化等一系列问题,近年来光伏发电装机量在世界范围内迅猛增长。光伏阵列作为光伏发电系统的核心能量采集部件,长期工作在恶劣户外环境下易发生性能退化及遭受各种故障,因此评估其工作状态对提高发电效率、减少火灾事故发生等方面具有重要意义。
目前常用的光伏阵列故障诊断方法有:基于信号处理分析的方法,该方法主要是通过波形信号的分析来检测和定位出现故障的光伏组件,噪声对该方法的实验结果影响较大。基于红外热成像的方法,该方法利用高分辨率的红外成像仪采集光伏阵列的红外图像,然后采用图像分析算法检测故障类型和位置,因为恶劣的环境条件对采集高质量的红外图像也有很大挑战,因此该方法很难得到推广。基于I-V特性曲线的方法,该方法是对比光伏阵列发生故障和正常状态下的I-V曲线来确定是否存在故障。
近年来人工智能发展迅速,并在多领域表现了其强大的能力,因为人工智能算法对数据强大的分析能力,国内外研究学者开始将其应用在光伏阵列的故障诊断上。该方法主要根据光伏阵列的I-V特性曲线、RGB图像、时域暂态序列数据等设计特征,训练深度学习模型(如ResNet、ELM、CNN等),然后预测待测样本的故障类型。大量的研究表明利用人工智能算法相比传统方法能够更高效地定位光伏阵列的故障,并准确分析其故障类型。但现有算法仍存在很多不足,比如要求大量的数据才能训练得到一个稳定,准确的模型,这对实际数据的获取和计算资源的要求都提出了不少挑战。
发明内容
有鉴于此,本发明的目的是提供一种基于集成学习的光伏阵列故障诊断方法,结合多种算法的优势,提高光伏阵列故障诊断的准确性和稳定性。
本发明采用以下方案实现:一种基于集成学习的光伏阵列故障诊断方法,包括以下步骤:
步骤S1:获取光伏面板的实际I-V特性曲线信息和环境信息;
步骤S2:根据步骤S1获取的信息完成特征工程,获取光伏阵列故障特征;
步骤S3:对步骤S2获取的故障特征进行归一化处理,并对故障标签进行编码;
步骤S4:根据集成学习方法搭建故障诊断模型,并选择模型超参数,训练故障诊断模型;
步骤S5:根据训练好的模型预测光伏阵列的故障类型即将故障特征输入到训练好的模型,输出待测数据的故障类型。
进一步地,步骤S1所述I-V特性曲线信息包括:工作电压V和输出电流I;所述环境信息包括:阵列背板温度T和环境辐照度Trr。
进一步地,通过特征构建和特征选择完成步骤S2中所述的特征工程。
进一步地,所述特征构建具体按照如下步骤建立:
步骤Sa:将I-V特性曲线的电气参数作为故障特征集,包括:开路电压Voc、短路电流Isc、最大功率Pm、最大功率电压Vm和最大功率电流Im
步骤Sb:根据I-V特性曲线计算曲线的几何特征添加到故障特征集,包括:FF、slop1、slop2、slop3、slop4、f1、f2,按如下方式获取:
Figure GDA0003594573250000031
Figure GDA0003594573250000032
Figure GDA0003594573250000033
Figure GDA0003594573250000034
Figure GDA0003594573250000035
Figure GDA0003594573250000036
Figure GDA0003594573250000037
步骤Sc:根据光伏模型参数辨识算法提取光伏阵列单二极管模型的模型参数添加到故障特征集,包括:光电流Iph、二极管反向饱和电流Io、二极管理想化因子n、等效串联电阻Rs、等效并联电阻Rsh
步骤Sd:将阵列背板温度T和光照度Trr添加到故障特征集。
进一步地,所述特征选择具体按照如下步骤建立:
步骤SA:选择斯皮尔曼相关系数法计算特征之间的相关性选择特征;
步骤SB:选择XGBoost算法计算特征重要性选择特征。
进一步地,所述步骤S3具体按照如下步骤建立:
步骤1:选择零均值标准化方法对特征数据进行归一化处理,其计算公式如下:
Figure GDA0003594573250000041
其中,μ代表原始数据均值,δ代表原始数据标准差;
步骤2:选择序号编码对故障类型进行编码,故障类型包括:短路一块组件、短路两块组件、组件老化、组串老化、阴影一块组件、阴影两块组件以及正常工作状态共7种工况数据。
进一步地,步骤S4所述集成学习方法采用模型堆叠的Stacking方法,选择极端随机树(ET)、LightGBM(LGBM)、支持向量机(SVM)和K-近邻算法(KNN)作为模型堆叠结构的第一层基础算法,选择ET作为第二层算法;模型超参数采用网格搜索进行确定。
进一步地,所述训练故障诊断模型的具体内容为:
步骤a:数据集的70%作为训练集,30%作为测试集;所述故障特征集是每条数据的特征集合;
步骤b:网格搜索确定集成学习第一层结构极端随机树、LightGBM、支持向量机和K-近邻算法的超参数;
步骤c:选择5折交叉验证的方式用训练集分别训练极端随机树、LightGBM、支持向量机和K-近邻算法;每折交叉验证后四个模型都会预测验证集的故障标签,预测测试集故障的概率,交叉验证训练结束后计算概率平均值,概率最大的结果为测试集的故障标签;
步骤d:将步骤c的预测结果作为数据的新特征,和原始数据标签结合构成新数据集;
步骤e:网格搜索确定集成学习第二层结构ET算法的超参数;
步骤f:新训练集训练ET算法,预测测试集的输出结果。
与现有技术相比,本发明具有以下有益效果:
本发明根据I-V特性曲线、单二极管模型参数和环境参数设计具有代表性的故障特征,并采用斯皮尔曼相关系数法分析特征相关性和XGBoost计算特征重要性进行特征选择,提高算法的运行效率;选择四种不同的机器学习模型,包括极端随机树、LightGBM、支持向量机和K近邻算法,采用网格搜索的方法选择模型的超参数,并通过集成学习Stacking的方法将这四种模型融合成一个强分类器来判断光伏阵列故障类型。相较于单一机器学习算法,集成学习的方法能够进一步提高故障诊断的准确率和稳定性。
附图说明
图1为本发明实施例的集成学习基本框图。
图2为本发明实施例的集成学习单模型算法流程图。
图3为本发明实施例的基于集成学习的光伏阵列故障诊断流程图。
图4为本发明实施例的单二极管模型的等效电路图。
图5为本发明优选实施例的实验数据,其中(a)为本发明实施例的温度和辐照度传感器和I-V曲线采集仪,(b)为本发明实施例的光伏阵列开路故障示意图,(c)为本发明实施例的光伏阵列老化故障示意图,(d)为本发明实施例的光伏阵列阴影故障示意图,(e)为本发明实施例的光伏阵列短路故障示意图。
图6为本发明实施例的故障特征的斯皮尔曼相关系数图。
图7为本发明实施例的XGBoost故障特征重要性分析图。
图8为本发明实施例的特征个数和故障诊断准确率的关系图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本实施例提供一种基于集成学习的光伏阵列故障诊断方法,包括以下步骤:
步骤S1:获取光伏面板的实际I-V特性曲线信息和环境信息;
步骤S2:根据步骤S1获取的信息完成特征工程,获取光伏阵列故障特征;
步骤S3:对步骤S2获取的故障特征进行归一化处理,并对故障标签进行编码;
步骤S4:根据集成学习方法搭建故障诊断模型,并选择模型超参数,训练故障诊断模型;
步骤S5:根据训练好的模型预测光伏阵列的故障类型即将待测数据的特征(后文详述的故障特征)输入到训练好的模型,输出待测数据的故障类型。
在本实施例中,步骤S1所述I-V特性曲线信息包括:工作电压V和输出电流I;所述环境信息包括:阵列背板温度T和环境辐照度Trr。
在本实施例中,通过特征构建和特征选择完成步骤S2中所述的特征工程。
在本实施例中,所述特征构建具体按照如下步骤建立:
步骤Sa:将I-V特性曲线的电气参数作为故障特征集,包括:开路电压Voc、短路电流Isc、最大功率Pm、最大功率电压Vm和最大功率电流Im
步骤Sb:根据I-V特性曲线计算曲线的几何特征添加到故障特征集,包括:FF、slop1、slop2、slop3、slop4、f1、f2,按如下方式获取:
Figure GDA0003594573250000071
Figure GDA0003594573250000072
Figure GDA0003594573250000073
Figure GDA0003594573250000074
Figure GDA0003594573250000075
Figure GDA0003594573250000076
Figure GDA0003594573250000077
步骤Sc:根据光伏模型参数辨识算法提取光伏阵列单二极管模型的模型参数添加到故障特征集,包括:光电流Iph、二极管反向饱和电流Io、二极管理想化因子n、等效串联电阻Rs、等效并联电阻Rsh
步骤Sd:将阵列背板温度T和光照度Trr添加到故障特征集。
在本实施例中,所述特征选择具体按照如下步骤建立:
步骤SA:选择斯皮尔曼相关系数法计算特征之间的相关性选择特征;
步骤SB:选择XGBoost算法计算特征重要性选择特征。
在本实施例中,所述步骤S3具体按照如下步骤建立:
步骤1:选择零均值标准化方法对特征数据进行归一化处理,其计算公式如下:
Figure GDA0003594573250000081
其中,μ代表原始数据均值,δ代表原始数据标准差;
步骤2:选择序号编码对故障类型进行编码,故障类型包括:短路一块组件、短路两块组件、组件老化、组串老化、阴影一块组件、阴影两块组件以及正常工作状态共7种工况数据。
在本实施例中,步骤S4所述集成学习方法采用模型堆叠的Stacking方法,选择极端随机树(ET)、LightGBM(LGBM)、支持向量机(SVM)和K-近邻算法(KNN)作为模型堆叠结构的第一层基础算法,选择ET作为第二层算法;模型超参数采用网格搜索进行确定。
在本实施例中,所述训练故障诊断模型的具体内容为:
步骤a:数据集的70%作为训练集,30%作为测试集;
数据集指用来训练和测试模型的许多条数据,可以是仿真I-V曲线数据集或者如后文图5所示方法采集的实测I-V曲线数据集,前述的故障特征集是每条数据的特征集合。
步骤b:网格搜索确定集成学习第一层结构极端随机树、LightGBM、支持向量机和K-近邻算法的超参数;
步骤c:选择5折交叉验证的方式用训练集分别训练极端随机树、LightGBM、支持向量机和K-近邻算法;每折交叉验证后四个模型都会预测验证集的故障标签,预测测试集故障的概率,交叉验证训练结束后计算概率平均值,概率最大的结果为测试集的故障标签;
步骤d:将步骤c的预测结果作为数据的新特征,和原始数据标签结合构成新数据集;
步骤e:网格搜索确定集成学习第二层结构ET算法的超参数;
步骤f:新训练集训练ET算法,预测测试集的输出结果。
较佳的,本实施例故障诊断流程图如图3所示。根据图5所示设备和方法在实验室模拟光伏阵列故障,获取不同工况的I-V特性曲线数据,计算I-V特性曲线的电气参数、几何特征,并结合如图4所示的光伏阵列单二极管等效模型电路的模型参数,和光伏阵列的背板温度、环境辐照度设计故障特征。采用集成学习的模型堆叠方法搭建故障诊断模型,以ET、LGBM、SVM、KNN作为模型堆叠第一层的算法,ET作为第二层算法,用实测数据训练该模型。当需要通过待测数据判断阵列的工况时,就可以将待测数据输入到训练好的模型判断故障类型。具体按照如下步骤实现:
步骤S1:获取光伏面板的实际I-V特性曲线信息和环境信息;
步骤S2:根据步骤S1所述数据完成特征工程,获取光伏阵列故障特征;
步骤S3:对步骤S2所述特征数据进行归一化处理,并对故障标签进行编码;
步骤S4:根据集成学习方法搭建故障诊断模型,并选择模型超参数;
步骤S5:根据训练好的模型预测光伏阵列的故障类型,评估和优化光伏电站的工作状态。
在本实施例中,在步骤S1中,按图5方式获取实验数据,所述I-V特性曲线信息包括:工作电压(V)、输出电流(I);所述环境信息包括:阵列背板温度(T)、环境辐照度(Trr)。
在本实施例中,特征构建方法具体按照如下步骤建立:
步骤S1:根据I-V特性曲线计算曲线的电气参数作为故障特征,包括:开路电压(Voc)、短路电流(Isc)、最大功率(Pm)、最大功率电压(Vm)和最大功率电流(Im);
步骤S2:根据I-V特性曲线计算曲线的几何特征作为故障特征,包括:FF、slop1、slop2、slop3、slop4、f1、f2,按如下方式获取:
Figure GDA0003594573250000101
Figure GDA0003594573250000102
Figure GDA0003594573250000103
Figure GDA0003594573250000104
Figure GDA0003594573250000105
Figure GDA0003594573250000106
Figure GDA0003594573250000107
步骤S3:根据光伏模型参数辨识算法提取图4所示的光伏阵列单二极管模型的模型参数作为故障特征,包括:光电流(Iph)、二极管反向饱和电流(Io)、二极管理想化因子(n)、等效串联电阻(Rs)、等效并联电阻(Rsh)、算法的均方根误差(RMSE);
步骤S4:将阵列背板温度(T)和光照度(Trr)添加到故障特征集。
在本实施例中,特征选择方法具体按照如下步骤建立:
步骤S1:选择斯皮尔曼相关系数法计算特征之间的相关性,如图6所示,设置阈值为0.9,剔除相关性大于0.9的特征;
步骤S2:在皮尔曼相关系数法基础上,选择XGBoost算法计算特征重要性,如图7所示;当特征数量大于9个时,准确率不在上升,如图8所示,因此选择特征重要性排名前9的特征。
在本实施例中,数据预处理具体按照如下步骤建立:
步骤S1:选择零均值标准化方法对特征数据进行归一化处理,其计算公式如下:
Figure GDA0003594573250000111
其中,μ代表原始数据均值,δ代表原始数据标准差;
步骤S2:选择序号编码对故障类型进行编码,故障类型包括:短路一块组件、短路两块组件、组件老化、组串老化、阴影一块组件、阴影两块组件以及正常工作状态共8种工况数据,分别按0-7方式编码。
在本实施例中,步骤S4所述集成学习方法采用模型堆叠的Stacking方法,选择极端随机树(ET)、LightGBM(LGBM)、支持向量机(SVM)、K-近邻算法(KNN)作为模型堆叠结构的第一层基础算法,选择ET作为第二层算法;模型超参数采用网格搜索进行确定。
在本实施例中,训练基于集成学习的光伏阵列故障诊断模型,集成学习的基本框架如图1所示,具体按照如下步骤建立:
步骤S1:将数据集拆分成训练集、验证集和测试集;
步骤S2:网格搜索确定集成学习第一层结构ET、LGBM、SVM、KNN算法的超参数;
步骤S3:选择交叉验证的方式用训练集分别训练ET、LGBM、SVM、KNN,每个模型的训练方式如图2所示;每次训练后预测验证集的故障标签,预测测试集故障的概率,交叉验证训练结束后计算概率平均值,概率最大的结果为测试集的故障标签;
步骤S4:将步骤S3所述的预测结果作为数据的新特征,和原始数据标签结合构成新数据集;
步骤S5:网格搜索确定集成学习第二层结构ET算法的超参数;
步骤S6:新训练集训练ET算法,预测测试集的输出结果。
为了让本领域技术人员进一步了解本发明提出的技术方案,下面结合具体实例进行说明。
如表1所示,为本方法和四种机器学习算法在实验室采集的数据集上的故障诊断准确率
表1
Figure GDA0003594573250000121
Figure GDA0003594573250000131
可以看出,集成学习的故障诊断方法整体准确率高于所有的机器学习算法,其中对6种工况的诊断准确率最高。如表2所示为运行20次算法,每个模型故障诊断准确率的统计信息,其中计算准确率的方差可以评判算法的稳定性。
表2
Figure GDA0003594573250000132
可以看出,对于四种统计指标,集成学习的方法都能够获得最优的结果,表明该方法的稳定性最好。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (4)

1.一种基于集成学习的光伏阵列故障诊断方法,其特征在于:包括以下步骤:
步骤S1:获取光伏面板的实际I-V特性曲线信息和环境信息;
步骤S2:根据步骤S1获取的信息完成特征工程,获取光伏阵列故障特征;
步骤S3:对步骤S2获取的故障特征进行归一化处理,并对故障标签进行编码;
步骤S4:根据集成学习方法搭建故障诊断模型,并选择模型超参数,训练故障诊断模型;
步骤S5:根据训练好的模型预测光伏阵列的故障类型即将故障特征输入到训练好的模型,输出待测数据的故障类型;
通过特征构建和特征选择完成步骤S2中所述的特征工程;
所述特征构建具体按照如下步骤建立:
步骤Sa:将I-V特性曲线的电气参数作为故障特征集,包括:开路电压Voc、短路电流Isc、最大功率Pm、最大功率电压Vm和最大功率电流Im
步骤Sb:根据I-V特性曲线计算曲线的几何特征添加到故障特征集,包括:FF、slop1、slop2、slop3、slop4、f1、f2,按如下方式获取:
Figure FDA0003603282180000011
Figure FDA0003603282180000012
Figure FDA0003603282180000013
Figure FDA0003603282180000014
Figure FDA0003603282180000021
Figure FDA0003603282180000022
Figure FDA0003603282180000023
步骤Sc:根据光伏模型参数辨识算法提取光伏阵列单二极管模型的模型参数添加到故障特征集,包括:光电流Iph、二极管反向饱和电流Io、二极管理想化因子n、等效串联电阻Rs、等效并联电阻Rsh
步骤Sd:将阵列背板温度T和光照度Trr添加到故障特征集;
所述特征选择具体按照如下步骤建立:
步骤SA:选择斯皮尔曼相关系数法计算特征之间的相关性选择特征;
步骤SB:选择XGBoost算法计算特征重要性选择特征;
步骤S4所述集成学习方法采用模型堆叠的Stacking方法,选择极端随机树、LightGBM、支持向量机和K-近邻算法作为模型堆叠结构的第一层基础算法,选择ET作为第二层算法;模型超参数采用网格搜索进行确定。
2.根据权利要求1所述的一种基于集成学习的光伏阵列故障诊断方法,其特征在于:步骤S1所述I-V特性曲线信息包括:工作电压V和输出电流I;所述环境信息包括:阵列背板温度T和环境辐照度Trr。
3.根据权利要求1所述的一种基于集成学习的光伏阵列故障诊断方法,其特征在于:所述步骤S3具体按照如下步骤建立:
步骤1:选择零均值标准化方法对特征数据进行归一化处理,其计算公式如下:
Figure FDA0003603282180000024
其中,μ代表原始数据均值,δ代表原始数据标准差;
步骤2:选择序号编码对故障类型进行编码,故障类型包括:短路一块组件、短路两块组件、组件老化、组串老化、阴影一块组件、阴影两块组件以及正常工作状态共7种工况数据。
4.根据权利要求1所述的一种基于集成学习的光伏阵列故障诊断方法,其特征在于:所述训练故障诊断模型的具体内容为:
步骤a:数据集的70%作为训练集,30%作为测试集;所述故障特征集是每条数据的特征集合;
步骤b:网格搜索确定集成学习第一层结构极端随机树、LightGBM、支持向量机和K-近邻算法的超参数;
步骤c:选择5折交叉验证的方式用训练集分别训练极端随机树、LightGBM、支持向量机和K-近邻算法;每折交叉验证后四个模型都会预测验证集的故障标签,预测测试集故障的概率,交叉验证训练结束后计算概率平均值,概率最大的结果为测试集的故障标签;
步骤d:将步骤c的预测结果作为数据的新特征,和原始数据标签结合构成新数据集;
步骤e:网格搜索确定集成学习第二层结构ET算法的超参数;
步骤f:新训练集训练ET算法,预测测试集的输出结果。
CN202110605736.1A 2021-05-31 2021-05-31 基于集成学习的光伏阵列故障诊断方法 Active CN113221468B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110605736.1A CN113221468B (zh) 2021-05-31 2021-05-31 基于集成学习的光伏阵列故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110605736.1A CN113221468B (zh) 2021-05-31 2021-05-31 基于集成学习的光伏阵列故障诊断方法

Publications (2)

Publication Number Publication Date
CN113221468A CN113221468A (zh) 2021-08-06
CN113221468B true CN113221468B (zh) 2022-07-08

Family

ID=77081951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110605736.1A Active CN113221468B (zh) 2021-05-31 2021-05-31 基于集成学习的光伏阵列故障诊断方法

Country Status (1)

Country Link
CN (1) CN113221468B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113655391A (zh) * 2021-08-26 2021-11-16 江苏慧智能源工程技术创新研究院有限公司 一种基于LightGBM模型的储能电站电池故障诊断方法
CN113688987B (zh) * 2021-08-30 2023-08-01 远景智能国际私人投资有限公司 光伏监测模型的训练方法、光伏设备的监测方法及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1403649A2 (de) * 2002-09-30 2004-03-31 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Diagnose von Photovoltaikgenatoren
CN106021806A (zh) * 2016-06-06 2016-10-12 福州大学 一种基于核函数极限学习机的光伏组串故障诊断方法
CN106067758A (zh) * 2016-05-25 2016-11-02 河海大学常州校区 基于参数辨识的光伏发电系统故障诊断方法及系统
CN108923748A (zh) * 2018-07-16 2018-11-30 河海大学常州校区 一种基于iv曲线扫描的光伏阵列故障诊断方法
CN109194286A (zh) * 2018-11-27 2019-01-11 阳光电源股份有限公司 一种光伏组件的故障诊断方法和装置
CN109766952A (zh) * 2019-01-21 2019-05-17 福州大学 基于偏最小二乘法和极限学习机的光伏阵列故障检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1403649A2 (de) * 2002-09-30 2004-03-31 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Diagnose von Photovoltaikgenatoren
CN106067758A (zh) * 2016-05-25 2016-11-02 河海大学常州校区 基于参数辨识的光伏发电系统故障诊断方法及系统
CN106021806A (zh) * 2016-06-06 2016-10-12 福州大学 一种基于核函数极限学习机的光伏组串故障诊断方法
CN108923748A (zh) * 2018-07-16 2018-11-30 河海大学常州校区 一种基于iv曲线扫描的光伏阵列故障诊断方法
CN109194286A (zh) * 2018-11-27 2019-01-11 阳光电源股份有限公司 一种光伏组件的故障诊断方法和装置
CN109766952A (zh) * 2019-01-21 2019-05-17 福州大学 基于偏最小二乘法和极限学习机的光伏阵列故障检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Lodhi et.al.Performance Evaluation of Faults in a Photovoltaic Array Based on V-I and V-P Characteristic Curve.《2020 12th International Conference on Measuring Technology and Mechatronics Automation (ICMTMA). Proceedings》.2020, *
林培杰 等.一种PSO-SVM的光伏阵列故障检测与分类.《福州大学学报(自然科学版)》.2017, *
林文城 等.一种光伏组件I-V 特性曲线测试及参数辨识系统.《福州大学学报(自然科学版)》.2018, *

Also Published As

Publication number Publication date
CN113221468A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
CN113221468B (zh) 基于集成学习的光伏阵列故障诊断方法
CN109873610B (zh) 基于iv特性和深度残差网络的光伏阵列故障诊断方法
Liu et al. Fault diagnosis approach for photovoltaic array based on the stacked auto-encoder and clustering with IV curves
CN109660206B (zh) 一种基于Wasserstein GAN的光伏阵列故障诊断方法
CN105846780A (zh) 一种基于决策树模型的光伏组件故障诊断方法
CN110672905A (zh) 基于cnn的自监督电压暂降源辨识方法
CN109766952A (zh) 基于偏最小二乘法和极限学习机的光伏阵列故障检测方法
CN116842459B (zh) 一种基于小样本学习的电能计量故障诊断方法及诊断终端
CN109992911B (zh) 基于极限学习机和iv特性的光伏组件快速建模方法
CN108805256A (zh) 基于布谷鸟算法与bp神经网络的光伏组件故障诊断方法
CN111245365A (zh) 基于动态加权深度森林的光伏组件故障诊断方法
CN113283491A (zh) 一种基于优化深度置信网络的电动汽车交流充电桩的故障诊断方法
CN109583515A (zh) 一种基于BP_Adaboost的光伏发电故障检测与分类方法
CN115099296A (zh) 基于深度学习算法的海浪高度预测方法
CN115936177A (zh) 一种基于神经网络的光伏输出功率预测方法及系统
CN117411436B (zh) 光伏组件状态检测方法、系统及存储介质
CN114581699A (zh) 考虑多源信息时基于深度学习模型的变压器状态评估方法
CN114595762A (zh) 一种光伏电站异常数据序列提取方法
CN114330486A (zh) 基于改进Wasserstein GAN的电力系统不良数据辨识方法
CN116720095A (zh) 一种基于遗传算法优化模糊c均值的电特性信号聚类方法
CN116436405A (zh) 一种光伏组串的热斑故障诊断方法
CN115733258A (zh) 一种基于物联网技术的全户内智能变电站系统的控制方法
Gong et al. Fault diagnosis method of photovoltaic array based on random forest algorithm
CN115208315A (zh) 一种基于多故障特征值的光伏智能故障诊断方法
CN114974476A (zh) 一种钙钛矿电池修饰材料的选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant