CN117272184A - 一种基于issa-rf算法的光伏发电系统故障分类方法 - Google Patents

一种基于issa-rf算法的光伏发电系统故障分类方法 Download PDF

Info

Publication number
CN117272184A
CN117272184A CN202311209830.0A CN202311209830A CN117272184A CN 117272184 A CN117272184 A CN 117272184A CN 202311209830 A CN202311209830 A CN 202311209830A CN 117272184 A CN117272184 A CN 117272184A
Authority
CN
China
Prior art keywords
fault
sparrow
power generation
photovoltaic power
generation system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311209830.0A
Other languages
English (en)
Inventor
舒杰
廖卓颖
陈炯聪
张靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Institute of Energy Conversion of CAS
Original Assignee
Guangzhou Institute of Energy Conversion of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Institute of Energy Conversion of CAS filed Critical Guangzhou Institute of Energy Conversion of CAS
Priority to CN202311209830.0A priority Critical patent/CN117272184A/zh
Publication of CN117272184A publication Critical patent/CN117272184A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明针对在光伏发电系统故障诊断和分类中故障识别实时率差,数据样本过少,容易陷入局部最优等问题,提供了一种基于ISSA‑RF算法的光伏发电系统故障分类方法,本发明的优点在于:通过改进麻雀搜索算法以全局适应度最佳为目标,对随机森林算法中的两个参数:决策树数目和决策树深度进行动态寻优,避免了人为指定算法参数可能带来的误差,在样本有限的情况下具有良好的泛化能力,有效提高光伏发电系统故障分类的准确性,最后通过MATLAB程序进行仿真证明本专利提出的方法对于故障分类准确率可达98%。

Description

一种基于ISSA-RF算法的光伏发电系统故障分类方法
技术领域
本发明属于光伏发电系统故障检测和分类技术领域,特别是涉及一种基于ISSA-RF算法的光伏发电系统故障分类方法。
背景技术
太阳能光伏发电是技术成熟、产业化程度高的太阳能利用方式,具有广阔的发展前景。但是光伏发电具有随机性、间歇性输出特点,同时其通常工作在复杂的户外环境中,受到各种环境因素的影响,容易出现组件损坏、开路、局部阴影等各种故障,故障的发生会严重影响电力系统安全运行。故在此背景下,对光伏阵列故障的识别与诊断显得尤为重要,准确得出故障类型能有效根据知识图谱得出详细的处理方法,能大大提高故障处理的效率。
光伏阵列故障分类方法主要包括红外图像检测法、接地电容测量法和时域反射分析法等传统方法,还有人工神经网络、随机森林、模糊C均值聚类法、支持向量机和极限学习机等智能方法,传统方法往往存在故障检测精度不足、实时性差,检测结构复杂和诊断精度有限等缺陷,在具有一定规模的光伏阵列应用中难以推广。在实际工程中的故障诊断问题往往较难得到很大量的样本,因此故障样本的缺乏成为制约人工神经网络在光伏发电阵列故障诊断和分类中的瓶颈问题。
目前,在利用智能算法进行光伏阵列故障分类方面已有部分相关研究。例如申请公布号为CN104753461B的专利所公布的一种基于粒子群优化支持向量机的光伏发电阵列故障诊断与分类方法,将故障检验转化为二分类的问题,以光伏发电阵列最大功率点的电压和电流值作为特征向量实现其工作状态的判别,采用粒子群算法优化支持向量机中的参数c和g,再加上光伏发电阵列最大功率点的电压和电流值作为特征向量实现其工作状态的判别,但是由于支持向量机算法是借助二次规划来求解支持向量,当样本数目很大时该矩阵的存储和计算将耗费大量的机器内存和运算时间,同时此算法对缺失数据敏感。申请公布号为CN108665112A的专利所公布的一种基于改进粒子群优化Elman网络的光伏故障检测方法,采用改进的粒子群算法获取神经网络最优权值,克服了Elman神经网络陷于局部最优解的缺陷来得到光伏阵列故障分类模型,但是当数据样本不足时分类精度较差。因此本发明提出基于改进麻雀搜寻算法结合随机森林算法的光伏发电系统故障分类方法,对上述问题进行改进。
发明内容
有鉴于此,本发明的目的是提供一种基于ISSA-RF算法的光伏发电系统故障分类方法,通过改进后的麻雀搜索算法对随机森林算法里面的决策树数目和特征数进行寻优,基于光伏阵列和光伏系统元件的故障实验电气参数构造随机森林分类模型,进而实现对光伏发电系统故障的精准分类。
为实现上述目的,本发明所采用的技术方案包括以下内容:
本发明提供了一种光伏发电系统故障分类方法,其具体包括如下步骤:
获取不同工作状态下的若干个电气参数,所述电气参数采集于光伏发电阵列工作于最大功率点时,将所述电气参数的样本组合作为数据集;
对所述数据集的电气参数进行预处理;
设置ISSA-RF算法中涉及到的基本参数并以此建立基于ISSA-RF算法的故障分类模型,使用所述数据集中的训练集对该故障分类模型进行训练;
利用训练后的故障分类模型对该测试集中光伏发电系统工作时的电气参数进行检测和分类,判断光伏发电系统是否处于故障状态,若处于故障状态则输出故障类型。
进一步地,所述不同工作状态,具体包括:正常状态、逆变器故障、反馈传感器故障、电网异常故障、局部阴影故障、单支路开路故障、MPPT控制器故障和升压转换器控制器故障,然后分别对上述故障类型从1到8进行编号。
进一步地,所述电气参数,具体包括:光伏阵列电流、光伏阵列电压、直流电压、A相电流、B相电流、C相电流、A相电压、B相电压、C相电压、交流三相电流大小、交流三相电流频率、交流三相电压大小和交流三相电压频率。
进一步地,对所述数据集的电气参数进行预处理,具体包括步骤:
识别数据集中的电气参数类别数和样本数并打乱数据集;
划分训练集和测试集,根据类别数循环取出不同类别的样本数据并随机放入训练集和测试集,其中设定训练集占数据集数量的75%;
对训练集和测试集的样本数据进行归一化处理,即映射到区间[0,1]内。
进一步地,设置ISSA-RF算法中涉及到的基本参数,具体包括:优化参数个数、决策树数目与决策树深度的数值上下限和麻雀数量,其中,
优化参数个数=2;
决策树数目与决策树深度的数值上限=[500,13];
决策树数目与决策树深度的数值下限=[100,01];
麻雀数量=10。
进一步地,建立基于ISSA-RF算法的故障分类模型,具体包括步骤:
A、首先建立ISSA模型:
A1、对改进麻雀搜寻算法中的基础参数进行设置,其中安全阈值设定为0.5,发现者比例为20%,加入者比例为80%,预警者比例为10%,优化参数为2;
A2、精英反向学习优化初始种群,选取最优个体作为最终的初始种群,设当前麻雀种群个体位置的矩阵X和第i只麻雀位置的矩阵Xi分别为:
Xi=[xi,1,…,xi,j,…,xi,d]
式中,xi,j表示第i只麻雀在第j维中的位置信息,d是待优化变量的维度,令麻雀的适应度即目标函数表达式如下:
F=[f(X)1) … f(Xi) … f(Xn)]T
式中,f(Xi)=Xi 2是第i只麻雀的个体适应度,由以上可得第i只麻雀个体位置的反向解Xi*为:
Xi*=α3[min(xi,j)+max(xi,j)]-Xi
式中,α3是(0,1]范围的随机数,利用随机生成的α3值可以生成多个反向解,如果生成的反向解超出上下边界值,即上限[500,13]和下限[100,01],则重置反向解,然后对原可行解和反向解的适应度进行评估,选出更优解即精英个体位置作为初始种群的个体位置;
A3、计算每只麻雀适应度并排序;
A4、判断麻雀位置更新策略:设定转换概率p=0.7,若均匀分布随机数r∈[0,1]小于转换概率p,则使用原始公式更新麻雀发现者、加入者和预警者的位置,并利用自适应t变异公式更新每只麻雀的位置,公式如下:
①发现者位置更新:
式中,R是当前迭代次数,Rmax是最大迭代次数,α1是(0,1]范围均匀分布的随机数,Q是服从正态分布的随机数,L是各元素都为1的1行多维矩阵,Ra∈[0,1]和Rs∈[0.5,1]分别代表预警值和安全阈值;
②加入者位置更新:
式中,Xb和Xw分别表示全局最优位置和最劣位置,A表示一个1×d即一行多维的矩阵,其中每个元素随机赋值为1或-1;
③预警者位置更新,预警者在种群中随机地产生且占种群数量的10-20%:
式中,β1是步长控制参数,是服从均值为0,方差为1的正态分布随机数;α2是[-1,1]范围均匀分布的随机数;β2是避免当fn=fb时,分母为0的情况发生的最小常数;fn、fb和fw分别代表当前适应度、最佳适应值和最劣适应度;
④利用自适应t变异公式更新每只麻雀的位置,第i个麻雀的原位置Xi变异公式如下:
式中,代表t变异后麻雀的位置,ζ代表自适应因子,t(R)为以当前迭代次数R为
参量的t分布函数,其中自适应t分布的概率密度函数如下:
式中,为第2类欧拉积分,这里取迭代次数R作为x参量,k为自由度参量;
另外,若均匀分布随机数r∈[0,1]大于等于转换概率p,则应用精英反向策略更新发现者位置,应用萤火虫算法扰动加入者位置,应用原式更新预警者的位置,公式如下:
①精英反向策略更新发现者位置:
第i只发现者个体位置更新的原式为:
式中,R是当前迭代次数,Rmax是最大迭代次数,α1是(0,1]范围均匀分布的随机数,Q是服从正态分布的随机数,L是各元素都为1的1行多维矩阵,Ra∈[0,1]和Rs∈[0.5,1]分别代表预警值和安全阈值,在此基础上采用精英反向策略,则第i只发现者个体位置更新的反向解Xi (R+1)*为:
Xi (R+1)*=α3[min(xi,j (R+1))+max(xi,j (R+1))]-Xi (R+1)
式中,α3是(0,1]范围均匀分布的随机数,利用随机生成的α3值可以生成多个反向解,如果生成的反向解超出上下边界值,即上限[500,13]和下限[100,01],则重置反向解,然后对原可行解和反向解的适应度进行评估,选出更优解即精英个体位置作为发现者的个体位置;
②萤火虫算法扰动加入者位置:
第i只加入者个体位置更新的原式为:
式中,Xb和Xw分别表示全局最优位置和最劣位置,A表示一个1×d即一行多维的矩阵,其中每个元素随机赋值为1或-1,在此基础上采用萤火虫算法扰动策略,则第i只发现者个体位置Xi (R+1)'的更新公式为:
Xi (R+1)'=Xi (R+1)+λ(α4-0.5)
式中,λ∈[0,1]为步长因子,α4是(0,1]范围均匀分布的随机数,此策略在一定程度上避免过早陷入局部最优;
③应用原式更新预警者的位置;
A5、计算并更新每只麻雀的适应度值,对步骤(A4)越界的麻雀位置做越界处理,比较新适应度值和上一次迭代过程中的原适应值,若新适应度值优于原值则更新位置和适应度值,反之则保留;
A6、判断当前迭代次数R是否达到最大迭代次数,若是,则循环结束,输出麻雀全局最优位置结果,反之,返回步骤A4;
A7、把步骤A6中改进麻雀搜寻算法中的全局最优位置的二维坐标值输出到随机森林程序中分别作为决策树数目ntree的最优值和指定节点中用于二叉树的变量个数也叫决策深度mtry的最优值;
B、最后建立随机森林模型:
B1、首先从原始数据集中通过有放回的抽样方式,即每抽取一个样本后再将它放回总体的方式来进行样本的随机抽取;
B2、再利用子数据集构建决策树,假设一个子数据集有X个属性,在决策树的每个节点需要分裂时,从这些属性中随机抽选出Y个属性,其中Y<<X,再通过如信息增益等方式从Y个属性中选择一个作为该节点的分裂属性,不断重复这个步骤,直到达到决策深度值mtry为止;
B3、按照步骤B1-B2来构建若干的决策树直到达到决策树数目值ntree为止,这些决策树就会构成随机森林;
B4、将数据集输入到不同的决策树中会得到不同的判断结果,占比最大的判断结果则被选择为随机森林的最佳分类方案。
进一步地,输出故障类型之后,还包括步骤:
根据输出的所述故障类型和真实数据的差异,以此评价所述故障分类模型的分类准确度。
进一步地,评价所述故障分类模型的分类准确度采用如下设定评价指标:
其中,SimType为故障类型结果,Type为真实数据,N为样本数量。
本发明与现有技术相比,其有益效果在于:本发明使用了基于精英反向的改进型t分布麻雀算法(ISSA),能有效加强麻雀粒子之间的交流,加快算法收敛速度,同时使用精英反向学习策略保证麻雀种群均匀性并且增强全局搜索的能力,引入t分布算法前期增加全局搜索能力,后期增加局部寻优能力,采用萤火虫算法,进一步增加种群多样性;此改进麻雀搜索算法对基本随机森林算法进行了优化,以全局适应度最佳为目标,进行决策树数目和特征数的动态寻优,避免了人为指定算法参数可能带来的误差。进一步地,在样本有限的情况下具有良好的泛化能力,有效提高光伏发电系统故障分类的准确性,通过MATLAB程序进行仿真证明本专利提出的方法对于故障分类准确率可达98%。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图进行简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的流程图;
图2为本发明实施例的光伏发电阵列系统拓扑图;
图3为本发明实施例步骤S4中所述ISSA-RF算法的具体流程图;
图4为本发明实施例步骤S4中所述ISSA寻优适应度变化曲线;
图5为本发明实施例步骤S6中所述采用了ISSA-RF算法和普通SSA-RF算法的测试集准确度对比图;
图6为本发明实施例的系统的结构示意图;
图7是本发明实施例的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例:
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
本实施例提供一种基于ISSA-RF算法的光伏发电系统故障分类方法,流程框图如图1所示。图2为本实施例的光伏发电系统拓扑图,系统由M×N个太阳能组件组成,通过逆变器和升压变压器与电网进行连接实现并网发电,组件参数如表1所示。
表1光伏组件MPPT参数(温度为25℃,太阳辐射强度为1000W/㎡)
在本实施例中通过模拟光伏发电发电系统出现的不同的故障状况,例如开路、组件故障、局部阴影等工作状态,在不同的气候条件下,选择不同的时段,针对每种故障情况随机采集2000组电气参数,具体包括以下步骤:
步骤S1:采集不同工作状态下的光伏发电阵列工作于最大功率点时的若干个电气参数,得到的电气参数样本组合作为验证本专利算法的数据集;
步骤S2:将步骤S1中获取的数据集中的每个电气参数样本进行预处理;
步骤S3:对改进麻雀搜寻算法优化随机森林ISSA-RF算法中涉及到的基本参数进行设置,包括优化参数个数、决策树数目与决策树深度的数值上下限和麻雀数量;
步骤S4:建立基于ISSA-RF算法的故障分类模型,使用数据集中的训练集对模型进行训练;
步骤S5:利用所述步骤S4训练后的故障分类模型对测试集中光伏发电系统工作时的电气参数进行检测和分类,判断系统是否处于故障状态,若处于故障状态则给出故障类型;
步骤S6:比较步骤S5中测试集得出的故障类型结果与真实数据的差异,以此评价模型的分类准确度。
在本实施例中,所述步骤S1中不同的工作状态包括正常状态、逆变器故障、反馈传感器故障、电网异常故障、局部阴影故障、单支路开路故障、MPPT控制器故障和升压转换器控制器故障,然后分别对故障类型从1到8进行编号,如下表2所示。
表2光伏发电系统故障状态分类标签
在本实施例中,所述步骤S1中光伏发电阵列工作于最大功率点时的若干个电气参数集包括光伏阵列电流、光伏阵列电压、直流电压、A相电流、B相电流、C相电流、A相电压、B相电压、C相电压、交流三相电流大小、交流三相电流频率、交流三相电压大小和交流三相电压频率,如下表3所示;光伏并网发电系统的数据采集是在2022年8月份内分多个时间段,在不同的照度和温度下进行数据随机采集,采集的样本总数2000个,随机选取其中75%作为训练样本集,剩余25%作为验证样本集。
表3光伏发电系统故障电气参数集
在本实施例中,所述步骤S2中对每个电气参数样本进行预处理的内容包括:
(1)识别数据集中的电气参数类别数和样本数并打乱数据集;
(2)根据类别数循环取出不同类别的样本数据并分别放入训练集和测试集,其中设定训练集占数据集数量的75%;
(3)对训练集和测试集的样本数据进行归一化处理,即映射到区间[0,1]内。
在本实施例中,所述步骤S3中对基本参数进行设置包括:
(1)优化参数个数=2;
(2)决策树数目与决策树深度的数值上限=[500,13];
(3)决策树数目与决策树深度的数值上限=[100,01];
(4)麻雀数量=10。
参见图3,在本实施例中,所述步骤S4中,建立基于ISSA(Improved SparrowSearch Algorithm)-RF(Random Forest)算法的光伏发电系统故障分类模型,步骤如下:
A.首先建立ISSA模型:
(A1)对改进麻雀搜寻算法中的基础参数进行设置,其中安全阈值设定为0.5,发现者比例为20%,加入者比例为80%,预警者比例为10%,优化参数为2,优化参数分别即为改进麻雀搜索算法寻优的目标:随机森林决策树的数目ntree和决策树选取的特征个数也叫决策深度mtry;
(A2)精英反向学习优化初始种群,选取最优个体作为最终的初始种群,设当前麻雀种群个体位置的矩阵X和第i只麻雀位置的矩阵Xi分别为:
Xi=[xi,1,…,xi,j,…,xi,d]
式中,xi,j表示第i只麻雀在第j维中的位置信息,d是待优化变量的维度,令麻雀的适应度即目标函数表达式如下:
F=[f(X1) … f(Xi) … f(Xn)]T
式中,f(Xi)=Xi 2是第i只麻雀的个体适应度,由以上可得第i只麻雀个体位置的反向解Xi*为:
Xi*=α3[min(xi,j)+max(xi,j)]-Xi
式中,α3是(0,1]范围的随机数,利用随机生成的α3值可以生成多个反向解,如果生成的反向解超出上下边界值,即上限[500,13]和下限[100,01],则重置反向解,然后对原可行解和反向解的适应度进行评估,选出更优解即精英个体位置作为初始种群的个体位置;
(A3)计算每只麻雀适应度并排序;
(A4)判断麻雀位置更新策略:设定转换概率p=0.7,若均匀分布随机数r∈[0,1]小于转换概率p,则使用原始公式更新麻雀发现者、加入者和预警者的位置,并利用自适应t变异公式更新每只麻雀的位置,公式如下:
①发现者位置更新:
式中,R是当前迭代次数,Rmax是最大迭代次数,α1是(0,1]范围均匀分布的随机数,Q是服从正态分布的随机数,L是各元素都为1的1行多维矩阵,Ra∈[0,1]和Rs∈[0.5,1]分别代表预警值和安全阈值;
②加入者位置更新:
式中,Xb和Xw分别表示全局最优位置和最劣位置,A表示一个1×d即一行多维的矩阵,其中每个元素随机赋值为1或-1;
③预警者位置更新,预警者在种群中随机地产生且占种群数量的10-20%:
式中,β1是步长控制参数,是服从均值为0,方差为1的正态分布随机数;α2是[-1,1]范围均匀分布的随机数;β2是避免当fn=fb时,分母为0的情况发生的最小常数;fn、fb和fw分别代表当前适应度、最佳适应值和最劣适应度;
④利用自适应t变异公式更新每只麻雀的位置,第i个麻雀的原位置Xi变异公式如下:
式中,代表t变异后麻雀的位置,ζ代表自适应因子,t(R)为以当前迭代次数R为
参量的t分布函数,其中自适应t分布的概率密度函数如下:
式中,为第2类欧拉积分,这里取迭代次数R作为x参量,k为自由度参量;
另外,若均匀分布随机数r∈[0,1]大于等于转换概率p,则应用精英反向策略更新发现者位置,应用萤火虫算法扰动加入者位置,应用原式更新预警者的位置,公式如下:
①精英反向策略更新发现者位置:
第i只发现者个体位置更新的原式为:
式中,R是当前迭代次数,Rmax是最大迭代次数,α1是(0,1]范围均匀分布的随机数,
Q是服从正态分布的随机数,L是各元素都为1的1行多维矩阵,Ra∈[0,1]和Rs∈[0.5,1]
分别代表预警值和安全阈值,在此基础上采用精英反向策略,则第i只发现者个体位置更
新的反向解Xi (R+1)*为:
Xi (R+1)*=α3[min(xi,j (R+1))+max(xi,j (R+1))]-Xi (R+1)
式中,α3是(0,1]范围均匀分布的随机数,利用随机生成的α3值可以生成多个反向解,如果生成的反向解超出上下边界值,即上限[500,13]和下限[100,01],则重置反向解,然后对原可行解和反向解的适应度进行评估,选出更优解即精英个体位置作为发现者的个体位置;
②萤火虫算法扰动加入者位置:
第i只加入者个体位置更新的原式为:
式中,Xb和Xw分别表示全局最优位置和最劣位置,A表示一个1×d即一行多维的矩阵,其中每个元素随机赋值为1或-1,在此基础上采用萤火虫算法扰动策略,则第i只发现者个体位置Xi (R+1)'的更新公式为:
Xi (R+1)'=Xi (R+1)+λ(α4-0.5)
式中,λ∈[0,1]为步长因子,α4是(0,1]范围均匀分布的随机数,此策略在一定程度上避免过早陷入局部最优;
③应用原式更新预警者的位置;
(A5)计算并更新每只麻雀的适应度值,对步骤(A4)越界的麻雀位置做越界处理,比较新适应度值和上一次迭代过程中的原适应值,若新适应度值优于原值则更新位置和适应度值,反之则保留;
(A6)判断当前迭代次数R是否达到最大迭代次数,若是,则循环结束,输出麻雀全局最优位置结果,反之,返回步骤(A4);
(A7)把(A6)中改进麻雀搜寻算法中的全局最优位置的二维坐标值输出到随机森林程序中分别作为决策树数目ntree的最优值和指定节点中用于二叉树的变量个数也叫决策深度mtry的最优值;
B.最后建立随机森林模型:
(B1)首先从原始数据集中通过有放回的抽样方式,即每抽取一个样本后再将它放回总体的方式来进行样本的随机抽取;
(B2)再利用子数据集构建决策树,假设一个子数据集有X个属性,在决策树的每个节点需要分裂时,从这些属性中随机抽选出Y个属性,其中Y<<X,再通过如信息增益等方式从Y个属性中选择一个作为该节点的分裂属性,不断重复这个步骤,直到达到决策深度值mtry为止;
(B3)按照步骤(B1)-(B2)来构建若干的决策树直到达到决策树数目值ntree为止,这些决策树就会构成随机森林;
(B4)将步骤S2的数据集输入到不同的决策树中会得到不同的判断结果,占比最大的判断结果则被选择为随机森林的最佳分类方案。
在本实施例中,所述步骤S6中,比较步骤S5中测试集得出的故障类型结果SimType与真实数据Type的差异,N为样本数量,其评价指标为:
较佳的,本实施例可得到的ISSA寻优适应度变化曲线如图4所示,可以得到最佳的RF决策树数目ntree=176.30,决策树深度mtry=5.36,同时如图5所示可得该系统的故障分类准确度可达到98%,对比普通的SSA-RF算法提升了1.25%。
下面介绍实施例1所述的光伏发电系统故障分类方法的多个应用场景和应用媒介。
实施例2
参见图6,基于同一发明构思,本发明实施例还提供一种光伏发电系统故障分类系统,其具体包括:
数据获取单元,其用于获取不同工作状态下的若干个电气参数,所述电气参数采集于光伏发电阵列工作于最大功率点时,将所述电气参数的样本组合作为数据集;
数据处理单元,其用于执行以下步骤:
对所述数据集的电气参数进行预处理;
设置ISSA-RF算法中涉及到的基本参数并以此建立基于ISSA-RF算法的故障分类模型,使用所述数据集中的训练集对该故障分类模型进行训练;
利用训练后的故障分类模型对该测试集中光伏发电系统工作时的电气参数进行检测和分类,判断光伏发电系统是否处于故障状态,若处于故障状态则输出故障类型。
由于该系统是本发明实施例的光伏发电系统故障分类方法对应的系统,并且该系统解决问题的原理与该方法相似,因此该系统的实施可以参见上述方法实施例的实施过程,重复之处不再赘述。
实施例3
参见图7,基于同一发明构思,本发明实施例还提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行,以实现如上所述的光伏发电系统故障分类方法。
可以理解的是,存储器可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-OnlyMemory)。可选地,该存储器包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器可用于存储指令、程序、代码、代码集或指令集。存储器可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令、用于实现上述各个方法实施例的指令等;存储数据区可存储根据服务器的使用所创建的数据等。
处理器可以包括一个或者多个处理核心。处理器利用各种接口和线路连接整个服务器内的各个部分,通过运行或执行存储在存储器内的指令、程序、代码集或指令集,以及调用存储在存储器内的数据,执行服务器的各种功能和处理数据。可选地,处理器可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器可集成中央处理器(Central ProcessingUnit,CPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统和应用程序等;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器中,单独通过一块芯片进行实现。
由于该电子设备是本发明实施例的光伏发电系统故障分类方法对应的电子设备,并且该电子设备解决问题的原理与该方法相似,因此该电子设备的实施可以参见上述方法实施例的实施过程,重复之处不再赘述。
实施例4
基于同一发明构思,本发明实施例还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的光伏发电系统故障分类方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-OnlyMemory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-onlyMemory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-OnlyMemory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-OnlyMemory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
由于该存储介质是本发明实施例的光伏发电系统故障分类方法对应的存储介质,并且该存储介质解决问题的原理与该方法相似,因此该存储介质的实施可以参见上述方法实施例的实施过程,重复之处不再赘述。
实施例5
在一些可能的实施方式中,本发明实施例的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的光伏发电系统故障分类方法的步骤。其中,用于执行各个实施例的可执行的计算机程序代码或“代码”可以用诸如C、C++、C#、Smalltalk、Java、JavaScript、Visual Basic、结构化查询语言(例如,Transact-SQL)、Perl之类的高级编程语言或者用各种其它编程语言编写。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
上述实施例只是为了说明本发明的技术构思及特点,其目的是在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡是根据本发明内容的实质所做出的等效的变化或修饰,都应涵盖在本发明的保护范围内。

Claims (8)

1.一种光伏发电系统故障分类方法,其特征在于,具体包括如下步骤:
获取不同工作状态下的若干个电气参数,所述电气参数采集于光伏发电阵列工作于最大功率点时,将所述电气参数的样本组合作为数据集;
对所述数据集的电气参数进行预处理;
设置ISSA-RF算法中涉及到的基本参数并以此建立基于ISSA-RF算法的故障分类模型,使用所述数据集中的训练集对该故障分类模型进行训练;
利用训练后的故障分类模型对该测试集中光伏发电系统工作时的电气参数进行检测和分类,判断光伏发电系统是否处于故障状态,若处于故障状态则输出故障类型。
2.根据权利要求1所述的光伏发电系统故障分类方法,其特征在于,所述不同工作状态,具体包括:正常状态、逆变器故障、反馈传感器故障、电网异常故障、局部阴影故障、单支路开路故障、MPPT控制器故障和升压转换器控制器故障,然后分别对上述故障类型从1到8进行编号。
3.根据权利要求1所述的光伏发电系统故障分类方法,其特征在于,所述电气参数,具体包括:光伏阵列电流、光伏阵列电压、直流电压、A相电流、B相电流、C相电流、A相电压、B相电压、C相电压、交流三相电流大小、交流三相电流频率、交流三相电压大小和交流三相电压频率。
4.根据权利要求1所述的光伏发电系统故障分类方法,其特征在于,对所述数据集的电气参数进行预处理,具体包括步骤:
识别数据集中的电气参数类别数和样本数并打乱数据集;
划分训练集和测试集,根据类别数循环取出不同类别的样本数据并随机放入训练集和测试集,其中设定训练集占数据集数量的75%;
对训练集和测试集的样本数据进行归一化处理,即映射到区间[0,1]内。
5.根据权利要求1所述的光伏发电系统故障分类方法,其特征在于,设置ISSA-RF算法中涉及到的基本参数,具体包括:优化参数个数、决策树数目与决策树深度的数值上下限和麻雀数量,其中,
优化参数个数=2;
决策树数目与决策树深度的数值上限=[500,13];
决策树数目与决策树深度的数值下限=[100,01];
麻雀数量=10。
6.根据权利要求1所述的光伏发电系统故障分类方法,其特征在于,建立基于ISSA-RF算法的故障分类模型,具体包括步骤:
A、首先建立ISSA模型:
A1、对改进麻雀搜寻算法中的基础参数进行设置,其中安全阈值设定为0.5,发现者比例为20%,加入者比例为80%,预警者比例为10%,优化参数为2;
A2、精英反向学习优化初始种群,选取最优个体作为最终的初始种群,设当前麻雀种群个体位置的矩阵X和第i只麻雀位置的矩阵Xi分别为:
Xi=[xi,1,…,xi,j,…,xi,d]
式中,xi,j表示第i只麻雀在第j维中的位置信息,d是待优化变量的维度,令麻雀的适应度即目标函数表达式如下:
F=[f(X1) … f(Xi) … f(Xn)]T
式中,f(Xi)=Xi 2是第i只麻雀的个体适应度,由以上可得第i只麻雀个体位置的反向解Xi*为:
Xi*=α3[min(xi,j)+max(xi,j)]-Xi
式中,α3是(0,1]范围的随机数,利用随机生成的α3值可以生成多个反向解,如果生成的反向解超出上下边界值,即上限[500,13]和下限[100,01],则重置反向解,然后对原可行解和反向解的适应度进行评估,选出更优解即精英个体位置作为初始种群的个体位置;
A3、计算每只麻雀适应度并排序;
A4、判断麻雀位置更新策略:设定转换概率p=0.7,若均匀分布随机数r∈[0,1]小于转换概率p,则使用原始公式更新麻雀发现者、加入者和预警者的位置,并利用自适应t变异公式更新每只麻雀的位置,公式如下:
①发现者位置更新:
式中,R是当前迭代次数,Rmax是最大迭代次数,α1是(0,1]范围均匀分布的随机数,Q是服从正态分布的随机数,L是各元素都为1的1行多维矩阵,Ra∈[0,1]和Rs∈[0.5,1]分别代表预警值和安全阈值;
②加入者位置更新:
式中,Xb和Xw分别表示全局最优位置和最劣位置,A表示一个1×d即一行多维的矩阵,其中每个元素随机赋值为1或-1;
③预警者位置更新,预警者在种群中随机地产生且占种群数量的10-20%:
式中,β1是步长控制参数,是服从均值为0,方差为1的正态分布随机数;α2是[-1,1]范围均匀分布的随机数;β2是避免当fn=fb时,分母为0的情况发生的最小常数;fn、fb和fw分别代表当前适应度、最佳适应值和最劣适应度;
④利用自适应t变异公式更新每只麻雀的位置,第i个麻雀的原位置Xi变异公式如下:
式中,代表t变异后麻雀的位置,ζ代表自适应因子,t(R)为以当前迭代次数R为参量的t分布函数,其中自适应t分布的概率密度函数如下:
式中,为第2类欧拉积分,这里取迭代次数R作为x参量,k为自由度参量;
另外,若均匀分布随机数r∈[0,1]大于等于转换概率p,则应用精英反向策略更新发现者位置,应用萤火虫算法扰动加入者位置,应用原式更新预警者的位置,公式如下:
①精英反向策略更新发现者位置:
第i只发现者个体位置更新的原式为:
式中,R是当前迭代次数,Rmax是最大迭代次数,α1是(0,1]范围均匀分布的随机数,Q是服从正态分布的随机数,L是各元素都为1的1行多维矩阵,Ra∈[0,1]和Rs∈[0.5,1]分别代表预警值和安全阈值,在此基础上采用精英反向策略,则第i只发现者个体位置更新的反向解Xi (R+1)*为:
式中,α3是(0,1]范围均匀分布的随机数,利用随机生成的α3值可以生成多个反向解,如果生成的反向解超出上下边界值,即上限[500,13]和下限[100,01],则重置反向解,然后对原可行解和反向解的适应度进行评估,选出更优解即精英个体位置作为发现者的个体位置;
②萤火虫算法扰动加入者位置:
第i只加入者个体位置更新的原式为:
式中,Xb和Xw分别表示全局最优位置和最劣位置,A表示一个1×d即一行多维的矩阵,其中每个元素随机赋值为1或-1,在此基础上采用萤火虫算法扰动策略,则第i只发现者个体位置Xi (R+1)'的更新公式为:
Xi (R+1)'=Xi (R+1)+λ(α4-0.5)
式中,λ∈[0,1]为步长因子,α4是(0,1]范围均匀分布的随机数,此策略在一定程度上避免过早陷入局部最优;
③应用原式更新预警者的位置;
A5、计算并更新每只麻雀的适应度值,对步骤(A4)越界的麻雀位置做越界处理,比较新适应度值和上一次迭代过程中的原适应值,若新适应度值优于原值则更新位置和适应度值,反之则保留;
A6、判断当前迭代次数R是否达到最大迭代次数,若是,则循环结束,输出麻雀全局最优位置结果,反之,返回步骤A4;
A7、把步骤A6中改进麻雀搜寻算法中的全局最优位置的二维坐标值输出到随机森林程序中分别作为决策树数目ntree的最优值和指定节点中用于二叉树的变量个数也叫决策深度mtry的最优值;
B、最后建立随机森林模型:
B1、首先从原始数据集中通过有放回的抽样方式,即每抽取一个样本后再将它放回总体的方式来进行样本的随机抽取;
B2、再利用子数据集构建决策树,假设一个子数据集有X个属性,在决策树的每个节点需要分裂时,从这些属性中随机抽选出Y个属性,其中Y<<X,再通过如信息增益等方式从Y个属性中选择一个作为该节点的分裂属性,不断重复这个步骤,直到达到决策深度值mtry为止;
B3、按照步骤B1-B2来构建若干的决策树直到达到决策树数目值ntree为止,这些决策树就会构成随机森林;
B4、将数据集输入到不同的决策树中会得到不同的判断结果,占比最大的判断结果则被选择为随机森林的最佳分类方案。
7.根据权利要求1所述的光伏发电系统故障分类方法,其特征在于,输出故障类型之后,还包括步骤:
根据输出的所述故障类型和真实数据的差异,以此评价所述故障分类模型的分类准确度。
8.根据权利要求7所述的光伏发电系统故障分类方法,其特征在于,评价所述故障分类模型的分类准确度采用如下设定评价指标:
其中,SimType为故障类型结果,Type为真实数据,N为样本数量。
CN202311209830.0A 2023-09-19 2023-09-19 一种基于issa-rf算法的光伏发电系统故障分类方法 Pending CN117272184A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311209830.0A CN117272184A (zh) 2023-09-19 2023-09-19 一种基于issa-rf算法的光伏发电系统故障分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311209830.0A CN117272184A (zh) 2023-09-19 2023-09-19 一种基于issa-rf算法的光伏发电系统故障分类方法

Publications (1)

Publication Number Publication Date
CN117272184A true CN117272184A (zh) 2023-12-22

Family

ID=89213643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311209830.0A Pending CN117272184A (zh) 2023-09-19 2023-09-19 一种基于issa-rf算法的光伏发电系统故障分类方法

Country Status (1)

Country Link
CN (1) CN117272184A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117740727A (zh) * 2024-02-19 2024-03-22 南京信息工程大学 一种基于红外高光谱的纺织品成分定量反演方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117740727A (zh) * 2024-02-19 2024-03-22 南京信息工程大学 一种基于红外高光谱的纺织品成分定量反演方法
CN117740727B (zh) * 2024-02-19 2024-05-14 南京信息工程大学 一种基于红外高光谱的纺织品成分定量反演方法

Similar Documents

Publication Publication Date Title
Yan et al. MPPT perturbation optimization of photovoltaic power systems based on solar irradiance data classification
Chen et al. Perturbed stochastic fractal search for solar PV parameter estimation
CN112348292B (zh) 一种基于深度学习网络的短期风电功率预测方法和系统
CN109635506B (zh) 自适应混沌树和种子算法的光伏电池模型参数辨识方法
CN106059492B (zh) 基于功率预测的光伏组件阴影故障类型判定方法
CN111327271B (zh) 基于半监督极限学习机的光伏阵列故障诊断方法
CN110929953A (zh) 基于聚类分析的光伏电站超短期出力预测方法
CN110601250B (zh) 一种基于新能源电站接入点静态电压稳定性评估方法
CN114006369B (zh) 区域风光场站功率联合预测方法、装置、电子设备和存储介质
CN117272184A (zh) 一种基于issa-rf算法的光伏发电系统故障分类方法
LU500551B1 (en) Virtual load dominant parameter identification method based on incremental learning
CN113468817A (zh) 一种基于igoa优化elm的超短期风电功率预测方法
CN109359665A (zh) 一种基于支持向量机的家电负荷识别方法及装置
CN109242136A (zh) 一种微电网风电功率混沌遗传-bp神经网络预测方法
CN116383773A (zh) 基于自适应预测区间的数据中心能效异常检测方法、系统和介质
CN112069723A (zh) 一种用于评估电力系统暂态稳定的方法及系统
CN114970952A (zh) 一种考虑环境因素的光伏出力短期预测方法及系统
CN115995810A (zh) 一种考虑气象波动自适应匹配的风电功率预测方法及系统
CN116578551A (zh) 一种基于gru-gan的电网数据修复方法
Tebbal et al. Effects of Crossover Operators on Genetic Algorithms for the Extraction of Solar Cell Parameters from Noisy Data
Xia et al. Improved photovoltaic MPPT algorithm based on ant colony optimization and fuzzy logic under conditions of partial shading
CN114881176A (zh) 一种基于自适应优化随机森林的非侵入式负荷识别方法
CN113723670B (zh) 变时间窗口的光伏发电功率短期预测方法
CN113449466B (zh) 基于pca和混沌gwo优化relm的太阳辐射预测方法及系统
CN115528684A (zh) 一种超短期负荷预测方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination