CN112036456A - 光伏故障数据生成方法、装置及计算机可读存储介质 - Google Patents
光伏故障数据生成方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN112036456A CN112036456A CN202010841367.1A CN202010841367A CN112036456A CN 112036456 A CN112036456 A CN 112036456A CN 202010841367 A CN202010841367 A CN 202010841367A CN 112036456 A CN112036456 A CN 112036456A
- Authority
- CN
- China
- Prior art keywords
- fault data
- photovoltaic fault
- sample set
- photovoltaic
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000035772 mutation Effects 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 6
- 238000003672 processing method Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000007635 classification algorithm Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Photovoltaic Devices (AREA)
Abstract
本发明公开了一种光伏故障数据生成方法、装置及计算机可读存储介质,所述光伏故障数据生成方法包括:获取由光伏故障数据组成的原始样本集,其中,所述光伏故障数据由电流数据以及电压数据组成;通过交叉算子对所述原始样本集进行数量扩充,以得到扩充后的样本集;通过变异算子对所述扩充后的样本集进行变异,以得到变异后的样本集;确定所述变异后的样本集中的目标光伏故障数据;输出所述目标光伏故障数据。解决了光伏故障数据的数据量较少的问题。
Description
技术领域
本发明涉及光伏发电技术领域,尤其涉及一种光伏故障数据生成方法、装置及计算机可读存储介质。
背景技术
光伏组件的故障的类型存在多种,在针对光伏组件的故障进行处理时,需要根据不同的故障类型进行不同的处理,例如,故障类型可以是玻璃碎裂,阴影遮挡,热斑等,其中,为了明确故障的类型,需要借助光伏故障数据中的电流数据以及电压数据作为参考,电流数据以及电压数据的数据量的大小影响着确定故障类型时的准确率,在数据量不足时,确定故障类型的准确率较低,而为了获取电流数据以及电压数据,一般采取两种方式,其一是通过逆变器自身的扫描功能采样电流数据以及电压数据,其二是通过IV扫描仪执行扫描操作,二者皆受到天气、人力等不确定因素的影响,使得光伏组件的电流数据以及电压数据难于获取,从而导致了光伏故障数据的数据量不足。
发明内容
本发明的主要目的在于提供一种光伏故障数据生成方法、装置及计算机可读存储介质,旨在解决光伏故障数据不足的技术问题。
为实现上述目的,本发明提供一种光伏故障数据方法,所述光伏故障数据方法包括:
获取由光伏故障数据组成的原始样本集,其中,所述光伏故障数据由电流数据以及电压数据组成;
通过交叉算子对所述原始样本集进行数量扩充,以得到扩充后的样本集;
通过变异算子对所述扩充后的样本集进行变异,以得到变异后的样本集;
确定所述变异后的样本集中的目标光伏故障数据;
输出所述目标光伏故障数据。
可选地,所述光伏故障数据生成方法包括:
确定所述变异后的样本集与所述原始样本集的相似度;
在所述相似度低于预设阈值时,返回执行通过交叉算子对所述样本集进行数量扩充,以得到扩充后的样本集的步骤;
在所述相似度大于或等于所述预设阈值时,执行确定所述变异后的样本集中的目标光伏故障数据的步骤。
可选地,所述确定所述变异后的样本集与所述原始样本集的相似度的步骤包括:
确定所述变异后的样本集与所述原始样本集的相对熵;
根据所述相对熵确定所述相似度。
可选地,所述通过交叉算子对所述样本集进行数量扩充,以得到扩充后的样本集的步骤包括:
根据预设的交叉概率以及所述交叉算子对所述原始样本集中的任意两项所述光伏故障数据进行数量扩充处理,以得到扩充后的光伏故障数据;
根据所述扩充后的光伏故障数据,确定所述扩充后的样本集。
可选地,所述通过变异算子对所述扩充后的样本集进行变异,以得到变异后的样本集的步骤包括:
确定所述扩充后的样本集中的待变异光伏故障数据;
根据预设的变异概率以及所述变异算子对所述待变异光伏故障数据的值进行改变,得到变异后的所述光伏故障数据;
根据所述变异后的所述光伏故障数据以及所述扩充后的样本集生成所述变异后的样本集。
可选地,所述获取由光伏故障数据组成的原始样本集的步骤包括:
获取预设类型的光伏故障对应的所述电流数据以及所述电压数据;
对所述电流数据以及所述电压数据进行编码得到所述光伏故障数据;
确定由所述光伏故障数据构成的所述原始样本集。
可选地,所述对所述电流数据以及所述电压数据进行编码得到所述光伏故障数据的步骤包括:
对所述电流数据以及所述电压数据进行实数编码得到所述光伏故障数据。
可选地,所述确定所述变异后的样本集中的目标光伏故障数据的步骤包括:
对所述变异后的样本集进行解码,以得到解码后的样本集;
根据所述解码后的样本集,确定所述目标光伏故障数据。
可选地,所述输出所述目标光伏故障数据的步骤之后,还包括:
根据所述目标光伏故障数据,对所述光伏故障分类系统进行训练,以得到目标光伏故障分类系统;
获取待分类光伏故障数据;
根据所述目标光伏故障分类系统对所述待分类光伏故障数据进行分类,确定光伏故障的类型。
此外,为实现上述目的,本发明还提供一种光伏故障数据生成装置,所述光伏故障数据生成装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的光伏故障数据生成程序,所述光伏故障数据生成程序被所述处理器执行时实现上述任一项所述的光伏故障数据生成方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有光伏故障数据生成程序,所述光伏故障数据生成程序被处理器执行时实现上述任一项所述的光伏故障数据生成方法的步骤。
本发明提出的一种光伏故障数据生成方法、装置及计算机可读存储介质,通过对由光伏故障数据组成的原始样本集进行数量扩充、变异,得到了目标光伏故障数据,由于交叉、变异的过程对原始样本集中的光伏故障数据生成了新的数据,因此提升了光伏故障数据的数据量。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明光伏故障数据生成方法第一实施例的流程示意图;
图3为本发明光伏故障数据生成方法第二实施例的流程示意图;
图4为本发明光伏故障数据生成方法第三实施例的流程示意图;
图5为本发明光伏故障数据生成方法第四实施例的流程示意图;
图6为本发明光伏故障数据生成方法第五实施例的流程示意图;
图7为本发明光伏故障数据生成方法第六实施例的流程示意图;
图8为本发明光伏故障数据生成方法第七实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图。
如图1所示,该装置可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的装置构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及光伏故障数据生成程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的光伏故障数据生成程序,并执行以下操作:
获取由光伏故障数据组成的原始样本集,其中,所述光伏故障数据由电流数据以及电压数据组成;
通过交叉算子对所述原始样本集进行数量扩充,以得到扩充后的样本集;
通过变异算子对所述扩充后的样本集进行变异,以得到变异后的样本集;
确定所述变异后的样本集中的目标光伏故障数据;
输出所述目标光伏故障数据。
进一步地,处理器1001可以调用存储器1005中存储的光伏故障数据生成程序,还执行以下操作:
确定所述变异后的样本集与所述原始样本集的相似度;
在所述相似度低于预设阈值时,返回执行通过交叉算子对所述样本集进行数量扩充,以得到扩充后的样本集的步骤;
在所述相似度大于或等于所述预设阈值时,执行确定所述变异后的样本集中的目标光伏故障数据的步骤。
进一步地,处理器1001可以调用存储器1005中存储的光伏故障数据生成程序,还执行以下操作:
确定所述变异后的样本集与所述原始样本集的相对熵;
根据所述相对熵确定所述相似度。
进一步地,处理器1001可以调用存储器1005中存储的光伏故障数据生成程序,还执行以下操作:
根据预设的交叉概率以及所述交叉算子对所述原始样本集中的任意两项所述光伏故障数据进行数量扩充处理,以得到扩充后的光伏故障数据;
根据所述扩充后的光伏故障数据,确定所述扩充后的样本集。
进一步地,处理器1001可以调用存储器1005中存储的光伏故障数据生成程序,还执行以下操作:
确定所述扩充后的样本集中的待变异光伏故障数据;
根据预设的变异概率以及所述变异算子对所述待变异光伏故障数据的值进行改变,得到变异后的所述光伏故障数据;
根据所述变异后的所述光伏故障数据以及所述扩充后的样本集生成所述变异后的样本集。
进一步地,处理器1001可以调用存储器1005中存储的光伏故障数据生成程序,还执行以下操作:
获取预设类型的光伏故障对应的所述电流数据以及所述电压数据;
对所述电流数据以及所述电压数据进行编码得到所述光伏故障数据;
确定由所述光伏故障数据构成的所述原始样本集。
进一步地,处理器1001可以调用存储器1005中存储的光伏故障数据生成程序,还执行以下操作:
对所述电流数据以及所述电压数据进行实数编码得到所述光伏故障数据。
进一步地,处理器1001可以调用存储器1005中存储的光伏故障数据生成程序,还执行以下操作:
对所述变异后的样本集进行解码,以得到解码后的样本集;
根据解码后的所述样本集,确定所述目标光伏故障数据。
进一步地,处理器1001可以调用存储器1005中存储的光伏故障数据生成程序,还执行以下操作:
根据所述目标光伏故障数据,对所述光伏故障分类系统进行训练,以得到目标光伏故障分类系统;
获取待分类光伏故障数据;
根据所述目标光伏故障分类系统对所述待分类光伏故障数据进行分类,确定光伏故障的类型。
参照图2,本发明第一实施例提供一种光伏故障数据生成方法,所述光伏故障数据生成方法包括:
步骤S10,获取由光伏故障数据组成的原始样本集,其中,所述光伏故障数据由电流数据以及电压数据组成;
光伏故障数据是光伏部件出现故障时检测的数据,光伏故障数据由电流数据以及电压数据组成,光伏部件例如光伏组件以及组串,光伏组件是指具有封装及内部联结的,能单独提供直流电输出的,最小不可分割的光伏电池组合装置。在光伏部件出现故障时,由于不同故障类型对应的光伏特性曲线不同,因此可以通过光伏特性曲线确定光伏故障的类型,光伏特性曲线是电流和电压的关系曲线,为了得到光伏特性曲线一般通过逆变器扫描或者通过过IV扫描仪扫描,采用这两种扫描方式获取数据的过程受到环境因素和人力因素限制,导致最终获取到的光伏故障数据的数据量较低,进一步使得在通过这种数据量不足的光伏故障数据对分类算法进行训练时,分类算法的故障分类结果不够准确,并且由于部分类型的光伏故障数据相对更难获取,导致在对分类算法进行训练时,出现样本的不平衡问题,导致分类算法的分类效果不佳,从而降低确定光伏故障的类型的效果,难于对根据光伏故障类型解决故障。因此,为了更好的解决光伏故障问题,首先需要先解决光伏故障数据的数据量不足的问题。基于此,本实施例首先构建了由光伏故障数据组成的原始样本集,原始样本集是用于进行数量扩充以扩充数据的样本集,原始样本集由光伏故障数据组成,光伏故障数据可以选取真实场景中扫描得到的数据以提升原始样本集的准确性,光伏故障数据由电流数据以及电压数据组成,可以理解的是,为了进行数量扩充变异等操作,还可对电流数据以及电压数据进行编码处理,并在编码处理后得到光伏故障数据,换言之,光伏故障数据可以是进行编码处理后的电流数据以及电压数据,此外,编码之后形成的光伏故障数据也可称作个体。
步骤S20,通过交叉算子对所述原始样本集进行数量扩充,以得到扩充后的样本集;
交叉是遗传算法中基于遗传学的染色体交叉互换、生物杂交等现象发展而来的一个算法过程,交叉是将两个父本染色体上的基因进行重新组合及分配,从而产生后代个体的过程,交叉算子是遗传算法中用于交叉的一种算子,交叉算子在遗传算法中扩展求解空间,并达到全局最优的过程中发挥着至关重要的作用,交叉算子例如可以是单点交叉、两点交叉、均匀交叉、洗牌交叉以及缩小代理交叉等,此外还可以是适用于十进制编码的交叉算子例如中间重组和线性重组,还可以是用于浮点数编码的交叉算子例如算数交叉、离散交叉,在进行交叉时,可以根据实际需要选择具体的交叉算子。在本实施例中,父本染色体来源于原始样本集中的光伏故障数据,扩充后的样本集至少包括后代个体即交叉后的光伏故障数据组,此外,扩充后的样本集还可以包括原始样本集,即在进行扩充的时候,不删除原始样本集。
步骤S30,通过变异算子对所述扩充后的样本集进行变异,以得到变异后的样本集;
变异是遗传算法中将个体中的某些基因座上的基因值用该基因座上的其他等位基因进行替换的过程,变异算子是遗传算法中用于变异的算子,变异算子例如基本位变异、均匀变异、边界变异、非均匀变异以及高斯近似变异等,在本实施例中,通过变异将扩充后的样本集中的交叉后的光伏故障数据的值进行改变,从而得到变异后的光伏故障数据,以得到变异后的样本集,变异后的样本集至少包括变异后的光伏故障数据,此外,变异后的样本集还可以包括原始样本集以及进行交叉后的光伏故障数据。
此外,可以理解的是,可以根据实际需要预先设置交叉变异的迭代次数,或根据原始样本集与变异后的样本集的相似度控制交叉变异的次数,以确定交叉变异过程的终止条件。
步骤S40,确定所述变异后的样本集中的目标光伏故障数据;
变异后的样本集的目标光伏故障数据是对原始样本集中的光伏故障数据进行数量扩充和变异后得到的光伏故障数据,在进行数量扩充和变异后,目标光伏故障数据的数据量相比原始样本集中的光伏故障数据的数据量增多,从而提升了光伏故障数据的数据量。
步骤S50,输出所述目标光伏故障数据。
在得到目标光伏故障数据之后,将目标光伏故障数据进行输出,可以将其输出至计算机中的输出设备例如显示器,或将其输出至其他终端设备,或者将其输出至用于进行故障分类的设备或者系统,以进行光伏故障的类型的确定,也可以对目标光伏故障数据进行其他变换后输出,在此不做限定。
在本实施例中,通过对原始样本集中的光伏故障数据进行交叉扩充了原始样本集的数据量,并进一步对扩充后的样本集进行变异,得到了变异后的样本集,确定了变异后的样本集中的目标光伏故障数据并输出,目标光伏故障数据相比原始样本集中的光伏故障数据的数据量更丰富,从而解决了光伏故障数据的数据量不足的问题。
参照图3,基于第一实施例提出第二实施例,在本实施例中,所述光伏故障数据生成方法包括:
步骤S60,确定所述变异后的样本集与所述原始样本集的相似度;
相似度用于衡量变异后的样本集是否继承了原始样本集的特性,判断相似度可以基于相对熵、信息熵等信息论中的熵原理。通过相似度衡量生成目标光伏故障数据是否是所需要的光伏故障数据,例如,若生成的目标光伏故障数据是光伏故障的类型为玻璃碎裂的情况下的数据,那么通过与原始样本集进行相似度的对比可以确定生成的目标光伏故障数据是否是玻璃碎裂的类型对应的数据。此外,可以理解的是,在确定相似度时,也可以根据实际需要,将原始样本集替换成与原始样本集中的光伏故障数据同类型的其他光伏故障数据,这种情况仅仅是将原始样本集进行简单的替换,目的依然是为了确定相似度,未脱离本发明的构思。
步骤S70,在所述相似度低于预设阈值时,返回执行步骤S20;
步骤S80,在所述相似度大于或等于所述预设阈值时,执行步骤S40。
预设阈值是预先设置的用于评价相似度与预设标准的关系的阈值,在相似度低于预设阈值时,表明变异后的样本集已经丢失了原始样本集的特性,在这种情况下,返回执行通过交叉算子对所述原始样本集进行数量扩充,以得到扩充后的样本集的步骤以及后续步骤,直至相似度大于或等于预设阈值时确定目标光伏故障数据,此时,变异后的样本集保留了原始样本集的特性,因此,目标光伏故障数据符合原始样本集中的光伏故障数据的故障类型的特性,从而生成的目标光伏故障数据是实际需要的类型的数据。
在本实施例中,通过确定变异后的样本集与原始样本集的相似度,并将相似度与预设阈值进行比较,能够自适应的调节交叉变异的迭代次数,从而得到相似度满足条件的目标光伏故障数据,使得生成的目标光伏故障数据与原始样本集中的光伏故障数据的特征相同。
参照图4,基于第二实施例提出第三实施例,在本实施例中,第二实施例中的步骤S60包括:
步骤S61,确定所述变异后的样本集与所述原始样本集的相对熵;
相对熵,也称KL散度(KullbackLeibler divergence),相对熵是概率分布P和概率分布Q差别的非对称性度量。可以通过相对熵确定变异后的样本集与原始样本集的相似度,在确定相对熵时,选取变异后的样本集中的光伏故障数据以及原始样本集中的光伏故障数据进行确定,变异后的样本集至少包括进行变异后的光伏故障数据以及进行交叉后的光伏故障数据。例如,设变异后的某光伏故障数据(某个体)为IV_cro_muty,设原始样本集中的某光伏故障数据(某个体)为IVx,相对熵为KL(IVx||IV_cro_muty),设IVi为IVx中的第i个个体,IV_cro_muti为IV_cro_muty中的第i个个体,则变异后的某个体与原始样本集的某个体之间的相对熵为 若KL(IVx||IV_cro_muty)为0,则表明变异后的某个体与原始样本集中的某个体的概率分布相同,由此,可以计算每一变异后的光伏故障数据与原始样本集中的光伏故障数据的相对熵,可进一步得到变异后的样本集与原始样本集的相对熵。
步骤S62,根据所述相对熵确定所述相似度。
在得到相对熵之后可根据相对熵与相似度的预设映射关系确定相对熵对应的相似度,预设映射关系是预先建立的每一相对熵的值与相似度的值的关系,例如,可以根据将相似度划分为从0至1的N个区间,即相似度的值包含N个,将1设定为相似度最大的值,以此建立相对熵与相似度的关系,此时相似度为1对应于相对熵为0的情况。可以理解的是,还可以通过其他方式建立相似度与相对熵的映射关系,在此不做限定。
在本实施例中,通过变异后的样本集与原始样本集之间的相对熵确定了相似度,从而能够根据相似度进一步控制交叉变异的迭代次数,能够在不需要人工控制的情况下完成自适应调节并生成目标光伏故障数据的过程。
参照图5,基于第一实施例提出第四实施例,在本实施例中,第一实施例中的步骤S20包括:
步骤S21,根据预设的交叉概率以及所述交叉算子对所述原始样本集中的任意两项所述光伏故障数据进行数量扩充处理,以得到扩充后的光伏故障数据;
交叉概率用于控制光伏故障数据根据预设的概率进行交叉,在进行交叉时对被选中的光伏故障数据中任意两项进行交叉,从而进行数量扩充处理,得到扩充后的光伏故障数据。例如,交叉算子可以采用SBX算子(Simulated binary crossover,模拟二进制交叉算子),SBX算子是一种模拟单点二进制交叉的交叉算子,在局部优化搜索方面表现较佳,根据SBX算子可通过如下方法计算得到两个光伏故障数据(两个个体),设两个个体分别为IV_cro1和IV_cro2,设IV_cro1的第n个值为IV_cro1 n,设IV_cro2的第n个值为IV_cro2 n,设(IV)in为随机选取的个体(IV)i的第n个值,设(IV)jn为随机选取的个体(IV)j的第n个值,则IV_cro1=0.5*[(1+p)*(IV)in+(1-p)*(IV)jn],IV_cro2=0.5*[(1+p)*(IV)jn+(1-p)*(IV)jn],其中,p是由分布因子h按照按照以下方法随机决定的,设rand为(0,1)之间的随机数,h是自定义参数,h的值越大,交叉后的光伏故障数据与其父代中的光伏故障数据的相似的概率也就越大,在rand小于或等于0.5的情况下,p=(rand*2)1/(1+h),在rand大于0.5的情况下,p=(1/(2-rand*2))1/(1+h)。此外,也可以根据实际需要采用其他交叉算子、交叉概率进行数量扩充,在此不做限定。
步骤S22,根据所述扩充后的光伏故障数据,确定所述扩充后的样本集。
扩充后的光伏故障数据组成了扩充后的样本集,扩充后的样本集用于进行变异,可以理解的是,扩充后的样本集至少包括进行交叉的光伏故障数据,也可以包括原始样本集中的光伏故障数据。
步骤S31,确定所述扩充后的样本集中的待变异光伏故障数据;
待变异光伏故障数据为扩充后的样本集中的部分光伏故障数据,可以根据实际需要,控制需要进行的变异的待变异光伏故障数据的数据量。
步骤S32,根据预设的变异概率以及所述变异算子对所述待变异光伏故障数据的值进行改变,得到变异后的所述光伏故障数据;
变异概率是待变异光伏故障数据随机发生突变的概率,在进行变异时通过变异概率以及变异算子对待变异的光伏故障数据的值进行改变,可根据实际需要设置变异概率。在得到待变异光伏故障数据之后,还根据变异算子对待变异光伏故障数据的值进行改变,例如,设选取的待变异光伏故障数据(待变异个体)为IV_cro3,设IV_cro_hut3 i为变异后的待变异个体的第i个值,设IV_cro3 i为待变异个体的第i个值,u为[0,1)中的随机数,k为自定义的非负实数,一般取值为1,变异概率可设置为0.03,则IV_cro_hut3 i=IV_cro3 i+ai,其中,在u<0.5时,ai=(2u)(1/(k+1))-1,在u≥0.5时,ai=1-[2(1-u)(1/(k+1))]。此外,也可以根据需要设置其他的变异概率以及选择其他的变异算子,以进行变异得到变异后的光伏故障数据。
步骤S33,根据所述变异后的所述光伏故障数据以及所述扩充后的样本集生成所述变异后的样本集。
在对待变异数据进行变异完成之后,得到变异后的光伏故障数据,将变异后的光伏故障数据与扩充后的样本集中进行合并以得到变异后的样本集。
在本实施例中,通过预设的交叉概率和交叉算子对原始样本集进行数量扩充,并对扩充后的样本集中的待变异光伏故障数据进行变异,并将变异后的光伏故障数据与扩充后的样本集进行合并得到了变异后的样本集,从而实现了对原始样本集的数据量扩充的效果。
参照图6,基于第一实施例提出第五实施例,在本实施例中,第一实施例中的步骤S10包括:
步骤S11,获取预设类型的光伏故障对应的所述电流数据以及所述电压数据;
预设类型是预先设定的光伏故障的类型,可以根据实际需要设定预设类型,例如,可以将数据缺失比较严重的故障类型设定为预设类型,例如预设类型可以是组件严重电流失配的故障的类型。
步骤S12,对所述电流数据以及所述电压数据进行编码得到光伏故障数据;
在得到电流数据以及电压数据之后,还需要对电流数据以及电压数据进行编码,因为在遗传算法需要对编码后的数据进行处理,编码的方法例如二进制编码、实数编码等。
步骤S13,确定由所述光伏故障数据构成的所述原始样本集。
在编码完成后得到光伏故障数据,此时的光伏故障数据可以进行交叉变异处理,将光伏故障数据构成原始样本集,此时,原始样本集中的光伏故障数据是编码处理后的电流数据以及电压数据。
步骤S41,对所述变异后的样本集进行解码,以得到解码后的样本集;
步骤S42,根据所述解码后的样本集,确定所述目标光伏故障数据。
在得到变异后的样本集之后,由于变异后的样本集是经过编码的,因此,需要对其进行解码,解码后得到预设类型的目标光伏故障数据,解码的过程对应于编码的逆过程。
在本实施例中,通过对预设类型的光伏故障对应的电流数据以及电压数据进行编码得到了能够进行交叉变异的光伏故障数据,并进一步得到了原始样本集,完成了对电流数据以及电压数据的处理过程,并对变异后的样本集进行解码,得到了解码后的目标光伏故障数据。
参照图7,基于第五实施例提出第六实施例,在本实施例中,第五实施例中的步骤S12包括:
步骤S121,对所述电流数据以及所述电压数据进行实数编码得到所述光伏故障数据。
由于在进行变异时,二进制编码的数据可能会出现较大的波动,例如,若二进制编码从1000变化至0000,则其值从8变化至0,因此,本实施例通过实数编码对电流数据以及电压数据进行编码,进行实数编码之后的数据为(IV)i=Ii1Ui1 Ii2Ui2 Ii3Ui3 Ii4Ui4…IimUim,进一步处理得到由光伏故障数据组成的原始样本集IV,其中,(IV)i为光伏故障数据,其表示IV中的第i个光伏故障数据(个体),Ii1表示第i个个体的电流值,Ui1为第i个个体的电压值,m为个体重的电流数据以及电压数据组成的数据对的数量,由于逆变器可以稳定输出128点,因此m可以取值为128。
在本实施例中,通过实数编码得到了光伏故障数据,由于实数编码相较于二进制编码在变异过程中不会出现过大的波动,从而提升了变异过程的准确性,从而提升了生成目标光伏故障数据的准确性。
参照图8,基于第五实施例提出第七实施例,在本实施例中,第五实施例中的步骤S50之后,还包括:
步骤S90,根据所述目标光伏故障数据,对所述光伏故障分类系统进行训练,以得到目标光伏故障分类系统;
光伏故障分类系统是采用分类算法对光伏故障进行分类的系统,将目标光伏故障数据作为光伏分类系统的输入以对其进行训练,由于目标光伏故障数据的数据量充足,并且还扩充了数据量不足的故障类型的光伏故障数据,从而使得光伏故障分类系统的输入数据的类型更加平衡,在训练完成后得到的光伏故障分类系统的预测光伏故障类型的准确率更高。
步骤S100,获取待分类光伏故障数据;
步骤S110,根据所述目标光伏故障分类系统对所述待分类光伏故障数据进行分类,确定光伏故障的类型。
待分类光伏故障数据是需要进行分类的电流数据以及电压数据,通过将待分类光伏故障数据输入至光伏故障分类系统以确定待分类光伏故障数据对应的光伏故障的类型。
在本实施例中,通过目标光伏故障数据对光伏分类系统进行训练得到了分类准确率更高的光伏故障分类算法,并进一步通过该光伏故障分类系统对待分类光伏故障数据进行分类,从而完成了光伏故障的类型的确定,在实际应用场景中,能够根据该光伏故障的类型进行对应的处理,由于目标光伏故障的数据量充足,并且解决了数据量不平衡的问题,从而确定的光伏故障的类型更准确。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有光伏故障数据生成程序,所述光伏故障数据生成程序被处理器执行时实现上述任一项实施例所述的光伏故障数据生成方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (11)
1.一种光伏故障数据生成方法,其特征在于,所述光伏故障数据处理方法包括:
获取由光伏故障数据组成的原始样本集,其中,所述光伏故障数据由电流数据以及电压数据组成;
通过交叉算子对所述原始样本集进行数量扩充,以得到扩充后的样本集;
通过变异算子对所述扩充后的样本集进行变异,以得到变异后的样本集;
确定所述变异后的样本集中的目标光伏故障数据;
输出所述目标光伏故障数据。
2.如权利要求1所述的光伏故障数据生成方法,其特征在于,所述光伏故障数据生成方法包括:
确定所述变异后的样本集与所述原始样本集的相似度;
在所述相似度低于预设阈值时,返回执行通过交叉算子对所述样本集进行数量扩充,以得到扩充后的样本集的步骤;
在所述相似度大于或等于所述预设阈值时,执行确定所述变异后的样本集中的目标光伏故障数据的步骤。
3.如权利要求2所述的光伏故障数据生成方法,其特征在于,所述确定所述变异后的样本集与所述原始样本集的相似度的步骤包括:
确定所述变异后的样本集与所述原始样本集的相对熵;
根据所述相对熵确定所述相似度。
4.如权利要求1所述的光伏故障数据生成方法,其特征在于,所述通过交叉算子对所述样本集进行数量扩充,以得到扩充后的样本集的步骤包括:
根据预设的交叉概率以及所述交叉算子对所述原始样本集中的任意两项所述光伏故障数据进行数量扩充处理,以得到扩充后的光伏故障数据;
根据所述扩充后的光伏故障数据,确定所述扩充后的样本集。
5.如权利要求1所述的光伏故障数据生成方法,其特征在于,所述通过变异算子对所述扩充后的样本集进行变异,以得到变异后的样本集的步骤包括:
确定所述扩充后的样本集中的待变异光伏故障数据;
根据预设的变异概率以及所述变异算子对所述待变异光伏故障数据的值进行改变,得到变异后的所述光伏故障数据;
根据所述变异后的所述光伏故障数据以及所述扩充后的样本集生成所述变异后的样本集。
6.如权利要求1所述的光伏故障数据生成方法,其特征在于,所述获取由光伏故障数据组成的原始样本集的步骤包括:
获取预设类型的光伏故障对应的所述电流数据以及所述电压数据;
对所述电流数据以及所述电压数据进行编码得到所述光伏故障数据;
确定由所述光伏故障数据构成的所述原始样本集。
7.如权利要求6所述的光伏故障数据生成方法,其特征在于,所述对所述电流数据以及所述电压数据进行编码得到所述光伏故障数据的步骤包括:
对所述电流数据以及所述电压数据进行实数编码得到所述光伏故障数据。
8.如权利要求6所述的光伏故障数据生成方法,其特征在于,所述确定所述变异后的样本集中的目标光伏故障数据的步骤包括:
对所述变异后的样本集进行解码,以得到解码后的样本集;
根据所述解码后的样本集,确定所述目标光伏故障数据。
9.如权利要求6所述的光伏故障数据生成方法,其特征在于,所述输出所述目标光伏故障数据的步骤之后,还包括:
根据所述目标光伏故障数据,对所述光伏故障分类系统进行训练,以得到目标光伏故障分类系统;
获取待分类光伏故障数据;
根据所述目标光伏故障分类系统对所述待分类光伏故障数据进行分类,确定光伏故障的类型。
10.一种光伏故障数据生成装置,其特征在于,所述光伏故障数据生成装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的光伏故障数据生成程序,所述光伏故障数据生成程序被所述处理器执行时实现如权利要求1至9中任一项所述的光伏故障数据生成方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有光伏故障数据生成程序,所述光伏故障数据生成程序被处理器执行时实现如权利要求1至9中任一项所述的光伏故障数据生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010841367.1A CN112036456A (zh) | 2020-08-19 | 2020-08-19 | 光伏故障数据生成方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010841367.1A CN112036456A (zh) | 2020-08-19 | 2020-08-19 | 光伏故障数据生成方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112036456A true CN112036456A (zh) | 2020-12-04 |
Family
ID=73577662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010841367.1A Pending CN112036456A (zh) | 2020-08-19 | 2020-08-19 | 光伏故障数据生成方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112036456A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114710114A (zh) * | 2022-05-23 | 2022-07-05 | 北京华清未来能源技术研究院有限公司 | 光伏逆变器故障预测方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103645423A (zh) * | 2013-12-23 | 2014-03-19 | 国家电网公司 | 一种输电网络的故障定位方法和系统 |
CN107423818A (zh) * | 2017-06-26 | 2017-12-01 | 中国电力科学研究院 | 一种用电信息采集系统统一接口的测试数据集生成的方法及系统 |
CN108363896A (zh) * | 2018-05-10 | 2018-08-03 | 南京航空航天大学 | 一种液压缸故障诊断方法 |
CN108665112A (zh) * | 2018-05-16 | 2018-10-16 | 东华大学 | 基于改进粒子群优化Elman网络的光伏故障检测方法 |
CN109766952A (zh) * | 2019-01-21 | 2019-05-17 | 福州大学 | 基于偏最小二乘法和极限学习机的光伏阵列故障检测方法 |
CN110160789A (zh) * | 2019-05-08 | 2019-08-23 | 新疆大学 | 一种基于ga-enn的风电机组轴承故障诊断方法 |
CN110503153A (zh) * | 2019-08-26 | 2019-11-26 | 哈尔滨工程大学 | 基于差分进化算法和支持向量机的光伏系统故障诊断方法 |
CN110579709A (zh) * | 2019-08-30 | 2019-12-17 | 西南交通大学 | 一种有轨电车用质子交换膜燃料电池故障诊断方法 |
CN110932270A (zh) * | 2019-12-12 | 2020-03-27 | 南方电网科学研究院有限责任公司 | 一种包含柔性开关的配电网故障恢复方法和装置 |
CN111144540A (zh) * | 2019-12-05 | 2020-05-12 | 国网山东省电力公司电力科学研究院 | 反窃电仿真数据集的生成方法 |
CN111291370A (zh) * | 2020-01-19 | 2020-06-16 | 苏州浪潮智能科技有限公司 | 网络数据入侵检测方法、系统、终端及存储介质 |
-
2020
- 2020-08-19 CN CN202010841367.1A patent/CN112036456A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103645423A (zh) * | 2013-12-23 | 2014-03-19 | 国家电网公司 | 一种输电网络的故障定位方法和系统 |
CN107423818A (zh) * | 2017-06-26 | 2017-12-01 | 中国电力科学研究院 | 一种用电信息采集系统统一接口的测试数据集生成的方法及系统 |
CN108363896A (zh) * | 2018-05-10 | 2018-08-03 | 南京航空航天大学 | 一种液压缸故障诊断方法 |
CN108665112A (zh) * | 2018-05-16 | 2018-10-16 | 东华大学 | 基于改进粒子群优化Elman网络的光伏故障检测方法 |
CN109766952A (zh) * | 2019-01-21 | 2019-05-17 | 福州大学 | 基于偏最小二乘法和极限学习机的光伏阵列故障检测方法 |
CN110160789A (zh) * | 2019-05-08 | 2019-08-23 | 新疆大学 | 一种基于ga-enn的风电机组轴承故障诊断方法 |
CN110503153A (zh) * | 2019-08-26 | 2019-11-26 | 哈尔滨工程大学 | 基于差分进化算法和支持向量机的光伏系统故障诊断方法 |
CN110579709A (zh) * | 2019-08-30 | 2019-12-17 | 西南交通大学 | 一种有轨电车用质子交换膜燃料电池故障诊断方法 |
CN111144540A (zh) * | 2019-12-05 | 2020-05-12 | 国网山东省电力公司电力科学研究院 | 反窃电仿真数据集的生成方法 |
CN110932270A (zh) * | 2019-12-12 | 2020-03-27 | 南方电网科学研究院有限责任公司 | 一种包含柔性开关的配电网故障恢复方法和装置 |
CN111291370A (zh) * | 2020-01-19 | 2020-06-16 | 苏州浪潮智能科技有限公司 | 网络数据入侵检测方法、系统、终端及存储介质 |
Non-Patent Citations (1)
Title |
---|
魏伟杰 等: "一种用于数据挖掘算法的数据生成方法", 《东北大学学报(自然科学版)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114710114A (zh) * | 2022-05-23 | 2022-07-05 | 北京华清未来能源技术研究院有限公司 | 光伏逆变器故障预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110827924B (zh) | 基因表达数据的聚类方法、装置、计算机设备及存储介质 | |
US20020062296A1 (en) | Method and apparatus to model the variables of a data set | |
CN117575858B (zh) | 一种智能排课系统的管理方法、系统及存储介质 | |
US8639643B2 (en) | Classification of a document according to a weighted search tree created by genetic algorithms | |
CN111382875A (zh) | 联邦模型参数确定方法、装置、设备及存储介质 | |
CN111709535A (zh) | 基于演化计算的联邦学习方法、装置、中心服务器及介质 | |
CN107203558A (zh) | 对象推荐方法和装置、推荐信息处理方法和装置 | |
CN112036456A (zh) | 光伏故障数据生成方法、装置及计算机可读存储介质 | |
US11386332B2 (en) | Optimization calculation method and information processing apparatus | |
US9471871B2 (en) | Method of generating features optimal to a dataset and classifier | |
CN110335165B (zh) | 一种链路预测方法和装置 | |
CN112785418B (zh) | 信贷风险建模方法、装置、设备及计算机可读存储介质 | |
CN110990353B (zh) | 日志提取方法、日志提取装置及存储介质 | |
CN111026972A (zh) | 物联网中的订阅数据推送方法、装置、设备及存储介质 | |
US7805667B2 (en) | System and method for identifying target node graphs from predetermined seed node subsets | |
CN116302088A (zh) | 一种代码克隆检测方法、存储介质及设备 | |
CN115935284A (zh) | 电网异常电压检测方法、装置、设备及存储介质 | |
CN115456039A (zh) | 点击率预估模型训练方法、点击率预估方法及电子设备 | |
Abbas et al. | Volterra system identification using adaptive genetic algorithms | |
KR102103578B1 (ko) | 몬테카를로 유전자 알고리즘을 사용한 포트폴리오 자산 선택방법 | |
CN112381338A (zh) | 事件概率预测模型训练、事件概率预测方法及相关装置 | |
Sanches et al. | Node-depth encoding with recombination for multi-objective evolutionary algorithm to solve loss reduction problem in large-scale distribution systems | |
CN112541548A (zh) | 关系网络的生成方法、装置、计算机设备及存储介质 | |
CN113626474B (zh) | 数据库随机抽取方法、装置及设备 | |
KR20210050362A (ko) | 앙상블 모델 프루닝 방법, 유전자 가위를 검출하는 앙상블 모델 생성 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201204 |
|
RJ01 | Rejection of invention patent application after publication |