CN115761359A - 一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法 - Google Patents

一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法 Download PDF

Info

Publication number
CN115761359A
CN115761359A CN202211484701.8A CN202211484701A CN115761359A CN 115761359 A CN115761359 A CN 115761359A CN 202211484701 A CN202211484701 A CN 202211484701A CN 115761359 A CN115761359 A CN 115761359A
Authority
CN
China
Prior art keywords
photovoltaic
image
defect classification
model
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211484701.8A
Other languages
English (en)
Inventor
杨强
夏杰锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202211484701.8A priority Critical patent/CN115761359A/zh
Publication of CN115761359A publication Critical patent/CN115761359A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法。该方法通过在通用图像数据集上得到的预训练模型进行迁移学习,建立初始化缺陷分类模型;然后将采集得到的大量无标签图像通过初始化模型映射到特征空间中,根据特征空间中的L2距离进行聚类并得到对应标签,从而对初始模型不断进行再训练,从而提升光伏图像缺陷分类模型的准确率指标。本发明以海南某光伏电站的采集图像为测试数据,给出了详细的算法描述,设计测例对光伏图像的缺陷分类性能进行评价验证。

Description

一种基于迁移学习和无监督学习方法的光伏图像缺陷分类 方法
技术领域
本发明涉及电力系统缺陷检测领域,具体涉及一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法。
背景技术
过去几十年来,随着化石燃料向绿色可持续能源供应的转变,全球光伏发电厂的能源产量大幅增加。光伏组件的效率决定了电站的性能,而电站的性能在很大程度上受高温条件的影响。识别光伏组件的早期缺陷是提高光伏电站长期效率和防止光伏组件突然失效的有效且经济的方法。这一领域已经开展了大量研究,通过接触式传感器获得的电信号检测光伏组件中的电气故障。作为一种反应性维护策略,此类检测面临多种挑战,例如部署成本、传感器的错误读取以及其他一些挑战。
自动化系统可以对大型光伏系统进行非破坏性和非接触性检查,以在不中断系统运行的情况下识别视觉缺陷。在这样一个系统的帮助下,可以按顺序及时收集光伏组件的一系列图像,并存储以供进一步处理。然后,可以通过基于深度学习的方法对这些图像进行离线处理,以提取缺陷特征、缺陷图和汇总统计信息。为了进一步提高检测精度和减少人力标注工作,实现基于少标签或无标签的光伏缺陷分类需求已被列入议程。迁移学习作为一种新兴的深度学习范式,减少了模型对于基本特征提取能力的学习,成为实现少标签或无标签的光伏缺陷分类需求的一种很有前景的方法。
此外,数据标注是一个耗时费力的过程,需要领域专家进行手动筛选,并且可能涉及主观判断。如果可以在无需人工干预的情况下自动标注光伏组件缺陷类别,则可以进一步提高检测系统的效率。考虑到所有这些,提出了一种新的方法,将预处理的深度卷积神经网络模型与无监督学习相结合,用于构建我们的缺陷分类系统。
发明内容
针对现有技术存在的不足,本发明目的是提供一种迁移学习和无监督学习方法的光伏图像缺陷分类方法;本发明给出了高效且有创造性的预训练初始化模型方法以及无标签图像样本相似性评价方式,并通过改进k-means算法和伪标签实现对无标签图像的自动标注,最后通过微调预训练模型提升模型拟合能力。
本发明的目的是通过以下技术方案来实现的:一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法,包括以下步骤:
1)基于ImageNet上的通用图像预训练模型,通过迁移学习建立初始化光伏缺陷分类模型;
2)通过类别示例图像获取初始化光伏缺陷分类模型的特征空间中的初始化类别中心和初始类别间距阈值;
3)采集无标签光伏图像并将其通过初始化光伏缺陷分类模型映射入特征空间;基于改进k-means算法对无标签光伏图像进行类别划分得到伪标签图像集,并进行类别中心和类别间距阈值的更新;
4)根据步骤3)得到的伪标签图像集对初始化光伏缺陷分类模型进行再训练,获得训练好的光伏缺陷分类模型;
5)将待分类的光伏图像输入训练好的光伏缺陷分类模型,完成光伏图像缺陷分类。
作为本发明的优选方案,所述步骤1)具体为:基于ImageNet上的通用图像预训练模型,将其权重参数迁移到深度学习网络,得到初始化光伏缺陷分类模型MO=F(x,θ);其中x为输入的图像,θ为初始化光伏缺陷分类模型的权重参数。
作为本发明的优选方案,所述步骤2)具体为:将包含n种缺陷类别样例的类别示例图像Dn,嵌入到初始化光伏缺陷分类模型的特征空间,得到n个初始类别中心P0
Dn={(x1,y1),...,(xn,yn)}
pi=F(xi,θ)
P0={(Pi,yi)}
其中x1…xn为n种类别示例图像;y1…yn为模型需要识别的n种类型缺陷的标签;θ为初始化光伏缺陷分类模型的权重参数;pi为类别示例图像xi在初始化光伏缺陷分类模型Mo特征空间的映射,xi∈{x1…xn};yi∈{y1…yn}。
根据初始类别中心点的L2距离,得到初始类别间距阈值H0,其计算方式如下:
Figure BDA0003961569000000031
其中xi和xj为两张不同类别的示例图像。
作为本发明的优选方案,所述步骤3)中具体为:
a)对于采集的无标签光伏图像Du={x1…xm},通过初始化模型MO得到图像在特征空间的映射点:
pk=F(xk,θ)
其中xk∈Du;θ为初始化光伏缺陷分类模型的权重参数;
b)基于改进k-means算法计算映射点pk到n个初始类别中心P0的距离并将其分到L2距离最小的初始类别中心所对应的类别中;根据初始类别间距阈值HO筛选每个映射点pk是否能够获得该类别的伪标签,若pk到最近初始类别中心的距离小于等于HO,则使其获得该标签并将其所代表的无标签光伏图像放入伪标签图像集Dp中,否则仍留于Du中;
c)基于伪标签图像集Dp,重新计算n种类别的类别中心P:
Figure BDA0003961569000000032
P={(pn,yn)}
其中xk为伪标签图像集Dp中划分为同一标签的图片,pn为标签yn对应的第n个类别中心的更新值;
同时将初始类别间距阈值HO更新为类别间距阈值H:
Figure BDA0003961569000000033
其中pi和pj分别为更新得到的类别i和类别j的类别中心;
d)对于剩余无标签光伏图像Du重复进行步骤b)和c)的操作,直到满足无标签光伏图像Du中无样本,或达到最大循环次数。
与现有技术相比,本发明的有益效果为:
(1)本发明创造性地建立了一种基于迁移学习和无监督学习的光伏图像缺陷分类方法,形成了一套对于光伏图像缺陷识别分类模型的低成本高性能的学习范式。首先基于迁移学习方法,通过预训练权重构建初始化模型,减少了模型在光伏图像基础特征提取能力上的学习过程,节省了大量的数据需求和学习时间。同时,对于光伏图像数据标注时间长,专业要求高的问题,使用改进k-means聚类方法实现了光伏图像的自动化高质量标注。从而得到了对于模型缺陷分类性能的进一步提升和光伏图像数据获取成本的进一步控制。
(2)本发明的方法相比于现有的普通深度学习光伏缺陷分类方法,区别在于数据获取成本和模型训练方式不同,普通深度学习光伏缺陷分类方法中为了提升模型的性能往往需要大量有标签的光伏图像,并且需要从零开始长时间训练模型的特征提取能力。而本发明中基于无监督学习的改进k-means算法能够实现对于无标签图像的高质量标注,同时通过迁移预训练权重使模型获得基础特征提取能力。因此本发明采用的方法能够降低数据标注和模型训练成本并提升模型缺陷分类性能。
附图说明
图1是本发明的方法流程图。
具体实施方式
下面结合具体实施方式对本发明做进一步阐述和说明。所述实施例仅是本公开内容的示范且不圈定限制范围。本发明中各个实施方式的技术特征在没有相互冲突的前提下,均可进行相应组合。
本发明的一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法,包括以下几个步骤:
1)基于ImageNet上的通用图像预训练模型,通过迁移学习建立初始化光伏缺陷分类模型;
(2)通过类别示例图像获取初始化光伏缺陷分类模型的特征空间中的初始化类别中心和初始类别间距阈值;
(3)采集无标签光伏图像并将其通过初始化光伏缺陷分类模型映射入特征空间,基于改进k-means算法对无标签光伏图像进行类别划分得到伪标签图像并进行类别中心和类别间距阈值的更新。
(4)根据步骤(3)得到的伪标签图像对初始化光伏缺陷分类模型进行再训练,获得训练好的光伏缺陷分类模型;
(5)将待分类的光伏图像输入训练好的光伏缺陷分类模型,完成光伏图像缺陷分类。
在本发明的一项具体实施中,对本发明的各个步骤进行更加具体的说明。
通过在海南某光伏电场采集大量无标签光伏图像数据,共计1128张。根据需要识别的故障类别选择正常、热斑缺陷、接点过热和二极管短路四种类别。并对每个类别选择一张示例图像。
选择EfficientNet-B0作为光伏图像缺陷分类模型框架,将基于ImageNet上的预训练权重参数θ载入模型,迁移到深度学习网络,得到初始化模型MO=F(x,θ),其中x为输入的图像,模型的结构框架如下表所示。
表1EfficientNet-B0网络结构
Figure BDA0003961569000000051
将4张包含不同缺陷类别样例的类别示例图像集Dn={(x1,y1),...,(x4,y4)},嵌入初始化特征空间,得到类别中心P0={(p1,y1),...,(p4,y4)}。其中pi=F(xi,θ),为图像xi通过初始化模型M0在特征空间的映射,y1,...,y4为模型需要识别的4种类型缺陷的标签,分别表示正常、热斑缺陷、接点过热和二极管短路四种类别。根据类别中心点L2距离,得到类别间距阈值H0,其计算方式如下:
Figure BDA0003961569000000052
其中xi和xj为两张不同类别的示例图像。
将采集得到的1128张无标签光伏图像Du={x1,...,x1128},通过初始化模型M0得到图像在特征空间的映射点:
pk=F(xk,θ)
Pu={p1,...,p1128}
其中xk∈Du;θ为初始化光伏缺陷分类模型的权重参数。
针对映射点集Pu中每个映射点Pk,计算到4个类别中心Pn的距离并将其分到L2距离最小的类别中心所对应的类中:
Figure BDA0003961569000000061
根据类别间距阈值HO筛选每个映射点Pk是否可以获得该类别的伪标签,若Pk到最近类别中心Pi的距离小于等于HO,则使其获得该标签并放入Dp,否则仍留于Du中。
基于伪标签图像集Dp,重新计算4种类别的类别中心P:
Figure BDA0003961569000000062
P={(pn,yn)};n∈{1,…,4}
其中xk为伪标签集Dp中划分为同一标签yi的图片,pn为标签yn对应的第n个类别中心的更新值;
同时也对类别间距阈值H进行更新:
Figure BDA0003961569000000063
其中pi和pj分别为更新得到的类别i和类别j的类别中心;
基于改进k-means算法得到的伪标签图像集Dp,对初始化模型M0进行训练,得到增强的光伏图像缺陷分类模型M。训练过程以分类交叉熵作为目标损失函数,其计算公式为:
Figure BDA0003961569000000064
其中yi表示样本伪代码标签,当样本为第i类时yi=1否则yi=0;ti表示模型预测样本属于第i类的概率。在此基础上,对模型中的参数进行梯度传递更新,其计算方式为:
Figure BDA0003961569000000065
Figure BDA0003961569000000071
其中W表示模型的权重参数,b表示模型偏移量参数,W+表示W的更新量,b+表示b的更新量,η表示作为反向传播优化器Adam的学习率,
Figure BDA0003961569000000077
为目标损失函数的偏导,
Figure BDA0003961569000000078
为权重参数的偏导,
Figure BDA0003961569000000079
为偏移量参数的偏导。在此次实施中,使用批次大小为32的Adam优化器对模型进行优化,学习率初始化为0.0005,动量为0.9。我们对模型进行400个周期的训练。
构建测试标签图像集,按照7:3的比例设置350张伪标签图像和150张真实标签图像组成测试集,并通过精确率(Precision)、召回率(Recall)和准确率(Accuracy验证说明模型性能提升,三个指标的计算方式如下:
Figure BDA0003961569000000072
Figure BDA0003961569000000073
Figure BDA0003961569000000074
其中:TP为伪标签图像划分正确的个数;FP为真实标签图像划分正确的个数;FN为伪标签图像样本划分错误的个数;TN为真实标签图像划分错误的个数
由此得到本模型在测试集上的性能结果,如下表所示。
表2本方法和普通有监督深度学习在缺陷分类性能和训练时间上的比较
Figure BDA0003961569000000075
本次实施采用的实验环境如下表所示:
表3实验环境说明
Figure BDA0003961569000000076
Figure BDA0003961569000000081
结果表明,相比于普通的有监督深度学习方法,在相同的模型结构下,本方法在精确率,召回率和准确率三个性能指标上都具有明显的优势:在精确率(Precision)上达到94.2%,领先普通有监督9个百分点;在召回率(Recall)上达到88.3%,也领先普通有监督9个百分点;在准确率(Accuracy)上领先有监督11个百分点。同时,在训练的时间周期上,有监督需要1000个周期才能收敛到上述性能,而本方法仅需400个周期即可收敛。这说明本方法无论是在模型的缺陷分类性能上,还是在模型的训练时间成本上,相较普通的深度学习方法都有明显的提升,且不需要大量昂贵的打标图像数据。本方法对于实现低成本高性能的光伏图像缺陷分类具有重要的作用。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (6)

1.一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法,其特征在于,包括以下步骤:
1)基于ImageNet上的通用图像预训练模型,通过迁移学习建立初始化光伏缺陷分类模型;
2)通过类别示例图像获取初始化光伏缺陷分类模型的特征空间中的初始化类别中心和初始类别间距阈值;
3)采集无标签光伏图像并将其通过初始化光伏缺陷分类模型映射入特征空间;基于改进k-means算法对无标签光伏图像进行类别划分得到伪标签图像集,并进行类别中心和类别间距阈值的更新;
4)根据步骤3)得到的伪标签图像集对初始化光伏缺陷分类模型进行再训练,获得训练好的光伏缺陷分类模型;
5)将待分类的光伏图像输入训练好的光伏缺陷分类模型,完成光伏图像缺陷分类。
2.根据权利要求1所述的基于迁移学习和无监督学习方法的光伏图像缺陷分类方法,其特征在于,所述步骤1)具体为:
基于ImageNet上的通用图像预训练模型,将其权重参数迁移到深度学习网络,得到初始化光伏缺陷分类模型MO=F(x,θ);其中x为输入的图像,θ为初始化光伏缺陷分类模型的权重参数。
3.根据权利要求1所述的基于迁移学习和无监督学习方法的光伏图像缺陷分类方法,其特征在于,所述步骤2)具体为:
将包含n种缺陷类别样例的类别示例图像Dn,嵌入到初始化光伏缺陷分类模型的特征空间,得到n个初始类别中心P0
Dn={(x1,y1),...,(xn,yn)}
pi=F(xi,θ)
P0={(pi,yi)}
其中x1…xn为n种类别示例图像;y1…yn为模型需要识别的n种类型缺陷的标签;θ为初始化光伏缺陷分类模型的权重参数;pi为类别示例图像xi在初始化光伏缺陷分类模型MO特征空间的映射,xi∈{x1…xn};yi∈{y1…yn};
根据初始类别中心点的L2距离,得到初始类别间距阈值H0,其计算方式如下:
Figure FDA0003961568990000021
其中xi和xj为两张不同类别的示例图像。
4.根据权利要求1所述的基于迁移学习和无监督学习方法的光伏图像缺陷分类方法,其特征在于,所述步骤3)中具体为:
a)采集无标签光伏图像Du={x1…xm},并将其通过初始化光伏缺陷分类模型MO得到图像在特征空间的映射点:
pk=F(xk,θ)
其中xk∈Du;θ为初始化光伏缺陷分类模型的权重参数;
b)基于改进k-means算法计算映射点pk到n个初始类别中心P0的距离并将其分到L2距离最小的初始类别中心所对应的类别中;根据初始类别间距阈值HO筛选每个映射点pk是否能够获得该类别的伪标签,若pk到最近初始类别中心的距离小于等于HO,则使其获得该标签并将其所代表的无标签光伏图像放入伪标签图像集Dp中,否则仍留于Du中;
c)基于伪标签图像集Dp,重新计算n种类别的类别中心P:
Figure FDA0003961568990000022
P={(pn,yn)}
其中xk为伪标签图像集Dp中划分为同一标签的图片,pn为标签yn对应的第n个类别中心的更新值;
同时将初始类别间距阈值HO更新为类别间距阈值H:
Figure FDA0003961568990000023
其中pi和pj分别为更新得到的类别i和类别j的类别中心;
d)对于剩余无标签光伏图像Du重复进行步骤b)和c)的操作,直到满足无标签光伏图像Du中无样本,或达到最大循环次数。
5.根据权利要求1或4所述的基于迁移学习和无监督学习方法的光伏图像缺陷分类方法,其特征在于,所述步骤3)中改进k-means算法计算公式如下:
Figure FDA0003961568990000024
其中Pk为无标签光伏图像在初始化光伏缺陷分类模型特征空间的映射点,yk为映射点Pk划分得到的标签类型,pi为类别示例图像xi在初始化光伏缺陷分类模型MO特征空间的映射。
6.根据权利要求1所述的基于迁移学习和无监督学习方法的光伏图像缺陷分类方法,其特征在于,所述步骤4)具体为:
基于步骤3)得到的伪标签图像集Dp,对初始化模型M0进行训练,得到增强的光伏图像缺陷分类模型M;训练过程以分类交叉熵作为目标损失函数,其计算公式为:
Figure FDA0003961568990000031
其中yi表示样本伪代码标签,当样本为第i类时yi=1否则yi=0;ti表示模型预测样本属于第i类的概率;
在此基础上,对模型中的参数进行梯度传递更新,其计算方式为:
Figure FDA0003961568990000032
Figure FDA0003961568990000033
其中W表示模型的权重参数,b表示模型偏移量参数,W+表示W的更新量,b+表示b的更新量,η表示优化器的学习率,
Figure FDA0003961568990000034
为目标损失函数的偏导,
Figure FDA0003961568990000035
为权重参数的偏导,
Figure FDA0003961568990000036
为偏移量参数的偏导。
CN202211484701.8A 2022-11-24 2022-11-24 一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法 Pending CN115761359A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211484701.8A CN115761359A (zh) 2022-11-24 2022-11-24 一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211484701.8A CN115761359A (zh) 2022-11-24 2022-11-24 一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法

Publications (1)

Publication Number Publication Date
CN115761359A true CN115761359A (zh) 2023-03-07

Family

ID=85338272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211484701.8A Pending CN115761359A (zh) 2022-11-24 2022-11-24 一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法

Country Status (1)

Country Link
CN (1) CN115761359A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310463A (zh) * 2023-05-25 2023-06-23 深圳市森歌数据技术有限公司 一种无监督学习的遥感目标分类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310463A (zh) * 2023-05-25 2023-06-23 深圳市森歌数据技术有限公司 一种无监督学习的遥感目标分类方法
CN116310463B (zh) * 2023-05-25 2024-01-26 深圳市森歌数据技术有限公司 一种无监督学习的遥感目标分类方法

Similar Documents

Publication Publication Date Title
Akram et al. Automatic detection of photovoltaic module defects in infrared images with isolated and develop-model transfer deep learning
CN109740676B (zh) 基于相似目标的物体检测迁移方法
CN111239137B (zh) 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法
CN112990558B (zh) 一种基于深度迁移学习的气象温度、光照的预测方法
CN110766042B (zh) 一种基于最大相关最小冗余的多标记特征选择方法及装置
CN111860106B (zh) 一种无监督的桥梁裂缝识别方法
CN109543693B (zh) 基于正则化标签传播的弱标注数据降噪方法
CN112633382A (zh) 一种基于互近邻的少样本图像分类方法及系统
CN113591948A (zh) 一种缺陷模式识别方法、装置、电子设备和存储介质
Sridharan et al. Visual fault detection in photovoltaic modules using decision tree algorithms with deep learning features
CN113076834A (zh) 旋转机械故障信息处理方法、处理系统、处理终端、介质
CN112116950B (zh) 基于深度度量学习的蛋白质折叠识别方法
CN115761359A (zh) 一种基于迁移学习和无监督学习方法的光伏图像缺陷分类方法
CN116051479A (zh) 融合跨域迁移和异常检测的纺织品缺陷识别方法
CN113313166A (zh) 基于特征一致性学习的船舶目标自动标注方法
CN113869418B (zh) 一种基于全局注意力关系网络的小样本船舶目标识别方法
CN116310647A (zh) 一种基于增量学习的劳保物品目标检测方法及系统
Sohail et al. Fault detection and computation of power in PV cells under faulty conditions using deep-learning
CN114511532A (zh) 基于特征引导的通道蒸馏的太阳能电池表面缺陷检测方法
CN112101217B (zh) 基于半监督学习的行人再识别方法
CN116403071B (zh) 基于特征重构的少样本混凝土缺陷检测方法及装置
CN117009916A (zh) 基于多传感器信息融合与迁移学习的促动器故障诊断方法
CN112348700B (zh) 一种结合som聚类与ifou方程的线路容量预测方法
CN115876467A (zh) 一种基于伪标签传递式两阶段领域自适应的滚动轴承故障诊断方法
CN114550197A (zh) 一种端子排图像检测信息匹配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination