CN111860592A - 一种少样本条件下太阳能电池片缺陷分类检测方法 - Google Patents
一种少样本条件下太阳能电池片缺陷分类检测方法 Download PDFInfo
- Publication number
- CN111860592A CN111860592A CN202010546126.4A CN202010546126A CN111860592A CN 111860592 A CN111860592 A CN 111860592A CN 202010546126 A CN202010546126 A CN 202010546126A CN 111860592 A CN111860592 A CN 111860592A
- Authority
- CN
- China
- Prior art keywords
- domain
- source domain
- target
- target domain
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007547 defect Effects 0.000 title claims abstract description 81
- 238000001514 detection method Methods 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 47
- 238000013508 migration Methods 0.000 claims abstract description 31
- 230000005012 migration Effects 0.000 claims abstract description 31
- 238000012546 transfer Methods 0.000 claims abstract description 16
- 238000005259 measurement Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 49
- 238000009826 distribution Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 21
- 238000013135 deep learning Methods 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- 238000013526 transfer learning Methods 0.000 claims description 11
- 239000004576 sand Substances 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 230000001172 regenerating effect Effects 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000011160 research Methods 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000013145 classification model Methods 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000011946 reduction process Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims 1
- 238000013507 mapping Methods 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 54
- 238000013528 artificial neural network Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000005401 electroluminescence Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000001931 thermography Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005424 photoluminescence Methods 0.000 description 2
- 238000011202 physical detection method Methods 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/8851—Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/8851—Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
- G01N2021/8854—Grading and classifying of flaws
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/8851—Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
- G01N2021/8887—Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges based on image processing techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Signal Processing (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种少样本条件下太阳能电池片缺陷分类检测方法。包括以下步骤:首先,设计新型的深度多小波自动编码器,以学习太阳能电池片缺陷图像采集的重要特征;其次,运用参数传递原理,基于多重相似性度量构建目标域与各个源域的多重相似性关系;根据目标域分类器与相关源域分类器对目标域无标记样本具有相似决策值的平滑性假设,定义一种多源域迁移流形正则项;借助已学习的源域分类器来学习一个适用于目标域的分类器;最后,利用设计出的太阳能电池片缺陷目标分类器对太阳能电池片缺陷图像目标域样本进行分类检测。本发明有效地提高了少样本条件下太阳能电池片缺陷分类检测的准确率。
Description
技术领域
本发明涉及一种太阳能电池片缺陷分类检测方法,属于深度学习、图像分类技术领域,主要应用于少样本条件下或样本不平衡的太阳能电池片缺陷分类检测。
背景技术
太阳能是一种蕴藏丰富资源的可再生能源,它具有充足、广泛、安全、清洁等优点,在新兴能源中占据重要的战略地位。太阳能的主要利用形式是太阳能发电。太阳能发电,一般指的是通过载体将太阳光转化为电能的技术,简称“光电”,太阳能电池片是光电转换最常用的一种载体。但是在生产制作的过程当中,由于工艺缺陷和生产环境的限制,常常导致各种太阳能电池表面缺陷,如崩边、边缘脱晶、缺角、虚印、断栅、脏污等表面缺陷。若含缺陷电池片被光伏组件采用将会影响电池的光电转化效率和寿命。因此,在电池片投入使用前,检测并及时剔除不合格产品显得尤为重要。
在早期的生产中,太阳能电池片表面缺陷通常是由人工肉眼进行观察检测,这样导致检测效率低下,人工成本高,同时不能保证检测准确率。随着计算机科学技术、计算机硬件的飞速发展,实时地获取、保存和检测到太阳能电池片图像的缺陷成为可能。深度学习的兴起更是为解决复杂的缺陷检测问题带来了新思路。深度学习主要是通过模拟人脑的方式进行相关操作的神经网络,可以按照人的思维进行图像、声音以及文本等内容的分析。但是在深度学习中,神经网络拥有大量的参数,这些参数需要海量的图像数据作为支撑。现实中采集到的原始数据图像往往不多且原始数据集中正常无缺陷的图像与有缺陷的图像数量比例出现严重失衡的情况。直接采用这样的数据进行深度学习的训练将会导致过拟合的产生,使深度学习的的应用和效果都受到了限制。因此,研究少样本条件下,太阳能电池片缺陷图像的分类检测方法具有重要的理论意义和实用价值。
目前在太阳能电池片缺陷分类检测方面,具有代表性的研究主要有两类:
一类是传统的人工物理检测方法。如申请号为201811330450.1的专利“一种光伏太阳能电池片电致发光图像缺陷分类方法”。它采用电致发光原理,首先获取太阳能电池片电致发光图像,然后进行图像分块,在后描述每个图像块具体特征,最后用分类器进行训练测试。该方法在太阳能电池片裂纹、断栅等缺陷检测中具有显著的效果。申请号为201811380796.2的专利“一种太阳能电池板的缺陷检测方法”。它通过灰色面阵相机、远心镜头、环形光源和载物台搭建构成太阳能电池片测量系统,拍摄太阳能电池片的图像分别进行水平和竖直两个方向的膨胀处理,然后边缘检测,对图像进行旋转变换并修图像空洞值;在后进行图像滤波去噪处理,按均匀性原则分割图像;采用鲁棒主成分算法、APG梯度逼近算法处理得到缺陷的太阳能电池板图像,进而检测出缺陷位置。
以上两种方法均为人工物理检测方法。目前普遍的技术研究是基于电致发光、光致发光和红外热成像的,然而都需要近红外相机从而能够接收对应光谱,对采集图像的设备和成像环境相对较高。然而基于人工物理的太阳能电池片缺陷检测方法均存在一定的弊端。热成像法基于热成像原理,仅针对温度相关的缺陷有一定效果,而无法检测对温度不敏感的缺陷。电致发光法利用正向偏置电压下电池片所发出的近红外光图像,根据EL图像亮度对缺陷进行判断,可以检测隐性裂纹、隐性断栅与黑斑等隐性缺陷,但无法针对大部分外观缺陷和颜色进行有效检测。光致发光法采用特定激光照射太阳能电池片,其内部光子受到激发并向低能级跃迁,释放出光能,从而使电池片表面发出荧光。由于PL方法易受环境干扰、对于成像条件要求极为苛刻,在实际应用中存在一定困难。
另一类是基于深度学习的缺陷检测方法。如申请号为201810324996.X的专利“基于卷积神经网路的太阳能电池片断栅缺陷检测方法”。它首先获取太阳能电池片的断栅缺陷图像,分为测试机和训练集,然后通过训练集训练基于密集连接卷积神经网络的分类器,将测试集送入分类器中进行分类,得出分类结果用矩形区域标记出来。申请号为201910930241.9的专利“多尺度联合卷积神经网络的太阳能电池板缺陷检测方法”。首先获取太阳能电池板图像样本,然后依次进行预处理操作、划分训练集与测试机、构建多尺度联合卷积神经网络模型,再后将训练集导入到模型中进行训练,实现缺陷检测。该方法技术功能种类多、泛化能力强、通用性高、计算量小具有较高的缺陷检测效率。
以上两种方法均采用基于深度学习的方法进行太阳能电池片缺陷检测,在样本图像充足的情况下具有一定的分类检测效果。然而,深度学习技术是在大量数据和大规模训练的基础上,模拟或实现人类的学习行为,以获取新的知识或技能。这些数据的采集、标注需要耗费大量的人力成本。在现实中,随着更多应用场景的涌现,我们也将必然面临更多数据不足的问题,然而在标注数据比较少的情况下,神经网络通常容易过拟合,使深度学习的应用和效果都受到了限制。
总之,目前基于人工物理的缺陷检测方法检测功能单一,检测效率不高。基于深度学习的缺陷检测方法在面对样本图像稀少、样本比例失衡的请况下,容易出现过拟合现象,难以保证检测精度。使用新型的深度多小波自动编码器用于采集太阳能电池片缺陷特征,能够在训练数据极少的情况下,仍然可以获得较好的特征分类。并且使用迁移学习的方法,即使样本图像稀少,仍然可以获得精确的缺陷检测精度。
发明内容
本发明针对目前太阳能电池片缺陷分类检测中出现的样本图像稀少、不同类别的缺陷图像样本比例严重失衡的问题,提出了一种少样本条件下太阳能电池片缺陷分类检测方法。设计新型的深度多小波自动编码器以学习太阳能电池片缺陷图像的重要特征,同时运用迁移学习的方法,实现太阳能电池片缺陷的精确分类检测。
本发明所述的一种少样本条件下太阳能电池片缺陷分类检测方法,其技术方案特征是:包括以下步骤:步骤1,设计新型的深度多小波自动编码器学习太阳能电池片缺陷图像的重要特征;步骤2,运用参数传递原理,基于多重相似性度量构建目标域与各个源域的多重相似性关系;步骤3,根据目标域分类器与相关源域分类器对目标域无标记样本具有相似决策值的平滑性假设,定义一种多源域迁移流形正则项;借助已学习的源域分类器来学习一个适用于目标域的分类器;步骤4,利用设计出的太阳能电池片缺陷目标分类器对太阳能电池片缺陷图像目标域样本进行分类检测。
步骤1,设计新型的深度多小波自动编码器学习太阳能电池片缺陷图像的重要特征。
进一步的,所述自动编码器由编码器和解码器构成,是构建深度学习网络解决各种任务的有效基础模型。自动编码器通过编码器对所获得的所有太阳能电池片图像特征进行压缩降维,通过解码器提取出原始数据的主要特征。
进一步的,编码器的目标是获取输入的特征表示,而解码器的目标是从真实表示中恢复输入数据,编码器压缩降维过程的变换公式以及解码器特征提取过程的变换公式分别如下:
其中,x∈RN是维数为N的输入;h∈RM是维数为M的特征表示;z∈RN是输出;w(1)∈RM ×N和w(2)∈R(N×M)是编码器和解码器的权重;b(1)∈RM和b(2)∈RN是相应的偏差;sg和sf分别代表编码器和解码器的非线性变化函数。
进一步的,sg通常选择Sigmoid函数。为了使输出更接近输入,需要更新模型参数以最小化其损失函数。对于一个输入样本,损失函数可以表示为:
进一步的,深度多小波自编码器由多个多小波自编码器组成。
进一步的,多小波神经网络是传统小波神经网络的增强版本,其处理复杂信号相对于小波神经网络具有明显的优越性。
进一步的,多小波自动编码器及具有相应偏导数的定义如下:
以及:
根据多小波变换函数(3)、(4),输出可计算为:
其中,为隐藏单元j经过多小波变换后的输出;和分别为和的输出部分;xi为输入样本x的第i个维数元素;τ为重建特征输入;Wij表示连接隐藏单元j的权值;cj为隐藏单元第j个节点的网络参数;i为输入单元;Uij-1和Uij-2代表分别表示使用和连接隐藏单元j和输出单元i的权值。
其中,式中,zi表示侦察构造向量z中的第i维元素。与基本AE模型相似,多小波自编码器模型的损失函数中也加入了一个权值衰减项,以避免过拟合,定义为:
其中,δ为权重衰减系数。通过最小化损失函数,对多小波自动编码器模型的权值参数进行如下更新:
其中,η为学习率。
进一步的,所述步骤1具体包括:
步骤1.1:参数初始化;
步骤1.2:计算式(11)中的重构输出;
步骤1.3:计算式(12)中的损失函数;
步骤1.4:使用式(13)的梯度更新参数;
步骤1.5:对于q=1重复步骤2和步骤4,直到收敛或q=Q。Q为迭代次数设定值,Q越大,损失函数越小,特征解析越精准。
步骤2,运用参数传递原理,基于多重相似性度量构建目标域与各个源域的多重相似性关系。
所述参数传递是迁移学习策略的一种。当前的迁移学习策略主要包括实例迁移、特征迁移、参数传递和关系迁移。参数传递是目前最流行的迁移学习策略,其原理简单易懂,易于实现,从源领域学到的知识可以成功地转移到目标任务中,非常适合辅助训练数据的分类任务。使用参数传递对预先训练好的深度学习模型进行微调,比使用随机初始化的权重从零开始进行训练更快、更容易。
进一步的,所述参数传递存在M个源域,其中第s个源域为 和分别为第i个样本的特征矢量和标记,样本数量为NS。目标域有Ni个标记样本Nu个未标记样本 和分别为目标域第i个样本的特征矢量和标记。所有目标域样本集合为总样本数量为NT=Nl+Nu。
进一步的,每个源域与目标域之间的数据分布都是不完全相同的,即Ps(x,y)≠PT(x,y),s=1,...,M,并且源域之间的分布也不尽相同。由于目标域与源域的数据分布不同,分类模型也会有差别,源域分类器直接用于对目标域样本进行分类就会产生很大的误差。迁移学习的一个关键问题是如何找出目标域与源域之间的相关性关系。为此从域—域和样本—域两个层面来表征目标域与源域之间的相似性。
进一步的,所述步骤2具体包括:
步骤2.1,基于多重相似性度量构建目标域与各个源域的多重相似性关系。
进一步的,多重相似性构建的具体过程如下:
步骤2.1.1:从域整体上衡量目标域与源域之间的相似性,即域—域相似性。定义第s源域与目标域的相似性权值γs为:
其中,为第s源域与目标域之间数据分布的最大均值差异,是一种在再生核希尔伯特空间中能够有效比较数据分布的非参数化距离度量,NT、NS分别为为目标域和源域的总样本数量,分别为目标域与源域的数据分布函数。||||H为差值最大值。β1>0用于控制MMD的作用范围,一般取所有源域与目标域之间MMD的均值。
步骤3,根据目标域分类器与相关源域分类器对目标域无标记样本具有相似决策值的平滑性假设,定义一种多源域迁移流形正则项;借助已学习的源域分类器来学习一个适用于目标域的分类器。
进一步的,所述步骤3的具体步骤如下:
步骤3.1,根据目标域分类器与相关源域分类器对目标域无标记样本具有相似决策值的平滑性假设,定义一种多源域迁移流形正则项:
根据流形平滑假设,即目标函数在数据高密度区域对相邻数据有相似的决策值。迁移学习的算法研究中,假设若目标域与第s源域具有较高的相似性权值γs且目标域样本与第s源域也具有较高的相似性权值Ais,则fT和fs对具有相似的分类决策值。结合域间相似性,定义多源域迁移流形正则项为:
其中,为目标域未标记样本。γs为式(14)定义的目标域与第s源域的相似性权值,Ais为式(17)定义的目标域第i个未标记样本与第s源域的相似性权值。式(18)定义的ΩD(fT)通过相似性权值γs和Ais构建起目标分类器fT与各源域分类器fs之间的联系。相似性权值越大,目标分类器与该源域分类器对目标域样本就具有更相近的决策值。
步骤3.2,借助已学习的源域分类器来学习一个适用于目标域的分类器:
结合式(18)定义的多源域迁移流形正则项,给出一种能够同时最小化该正则项和目标域标记样本误分类损失的多源域迁移学习框架:
其中,Ω(fT)用于控制目标分类器fT的复杂度;ΩL(fT)为fT对目标域标记样本误分类的损失函数;ΩD(fT)为式(18)定义的多源域迁移流形正则项;λL、λD为正则参数。
目标分类器为如下形式:
步骤4,利用设计出的太阳能电池片缺陷目标分类器对太阳能电池片缺陷图像目标域样本进行分类检测。
进一步的,步骤4的具体步骤如下:
步骤4.1:根据经验设置参数:式(15)中的近邻个数Nk和式(19)中的正则参数λL、λD分别设置为:λL=λD=1,Nk=8,源域分类器的参数通过已有的源域训练模型得到;
步骤4.2:式(14)中所涉及的再生希尔伯特核空间核函数采用高斯核函数k(xi,xj)=exp(-||xi,xj||2/(2σ2)),核函数参数σ由目标域全部数据间的距离平均值决定;
步骤4.3:从目标域每一类中随机选择n个样本组成NT个目标域标记数据集,其余目标域数据作为目标域未标记数据集;
步骤4.4:目标域每类标记样本数n的取值范围为[0 2 4 6 10 15 20]。独立进20次,取平均分类准确率(即准确识别测试样本个数与总的测试样本个数之比)作分类检测结果。
与现有技术相比,本发明的有益效果是:通过设计新型的深度多小波自动编码器来学习太阳能电池片缺陷的重要特征。运用参数传递原理,基于多重相似性度量构建目标域与各个源域的多重相似性关系。根据目标域分类器与相关源域分类器对目标域无标记样本具有相似决策值的平滑性假设,定义一种多源域迁移流形正则项。借助已学习的源域分类器来学习一个适用于目标域的分类器。利用设计出的太阳能电池片缺陷目标分类器对太阳能电池片缺陷图像目标域样本进行分类检测。从而实现少样本条件下太阳能电池片缺陷图像的精确分类检测。有效地解决了现实生活中太阳能电池片缺陷图像采集困难的问题,对提高太阳能电池片缺陷智能检测模型的灵活性具有十分重要的现实意义。
附图说明
下面结合附图和具体实施方式作进一步详细说明。
图1是本发明所述的一种少样本条件下太阳能电池片缺陷分类检测方法原理图;
图2是本发明所述的自动编码器的结构图;
图3是本发明所述的多小波自动编码器的结构模型图;
图4是本发明所述的多小波自动编码器的训练算法图;
图5是本发明所述的深度多小波自动编码器模型实现原理图;
图6是本发明所述的太阳能电池片缺陷分类检测具体步骤流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
如图1所示,本发明所述的一种少样本条件下太阳能电池片缺陷分类检测方法,其特征在于:总体方案如下:首先,设计新型的深度多小波自动编码器学习太阳能电池片缺陷图像的重要特征;其次,运用参数传递原理,基于多重相似性度量构建目标域与各个源域的多重相似性关系;然后,根据目标域分类器与相关源域分类器对目标域无标记样本具有相似决策值的平滑性假设,定义一种多源域迁移流形正则项;借助已学习的源域分类器来学习一个适用于目标域的分类器;最后,利用设计出的太阳能电池片缺陷目标分类器对太阳能电池片缺陷图像目标域样本进行分类检测。
步骤1:设计新型的深度多小波自动编码器学习太阳能电池片缺陷图像的重要特征。
如图2所示,自动编码器的结构图。自动编码器由编码器和解码器构成,是构建深度学习网络解决各种任务的有效基础模型。自动编码器通过编码器对所获得的所有太阳能电池片图像特征进行压缩降维,通过解码器提取出原始数据的主要特征。
编码器的目标是获取输入的特征表示,而解码器的目标是从真实表示中恢复输入数据,编码器压缩降维过程的变换公式以及解码器特征提取过程的变换公式分别如下:
其中,x∈RN是维数为N的输入;h∈RM是维数为M的特征表示;z∈RN是输出;w(1)∈RM ×N和w(2)∈R(N×M)是编码器和解码器的权重;b(1)∈RM和b(2)∈RN是相应的偏差;sg和sf分别代表编码器和解码器的非线性变化函数。
sg通常选择Sigmoid函数。为了使输出更接近输入,需要更新模型参数以最小化其损失函数。对于一个输入样本,损失函数可以表示为:
如图3所示,多小波自动编码器的结构模型图。深度多小波自编码器是由多个多小波自编码器组成。多小波神经网络是传统小波神经网络的增强版本,其处理复杂信号相较于小波神经网络具有明显的优越性。
多小波自动编码器及具有相应偏导数的定义如下:
以及:
根据多小波变换函数(3)、(4),输出可计算为:
其中,为隐藏单元j经过多小波变换后的输出;和分别为和的输出部分;xi为输入样本x的第i个维数元素;τ为重建特征输入;Wij表示连接隐藏单元j的权值;cj为隐藏单元第j个节点的网络参数;i为输入单元;Uij-1和Uij-2代表分别表示使用和连接隐藏单元j和输出单元i的权值。
其中,式中,zi表示侦察构造向量z中的第i维元素。与基本AE模型相似,多小波自编码器模型的损失函数中也加入了一个权值衰减项,以避免过拟合,定义为:
其中,δ为权重衰减系数。通过最小化损失函数,对多小波自动编码器模型的权值参数进行如下更新:
其中,η为学习率。
如图4所示,多小波自动编码器的训练算法图。
具体步骤如下:
步骤1.1:参数初始化;
步骤1.2:计算式(11)中的重构输出;
步骤1.3:计算式(12)中的损失函数;
步骤1.4:使用式(13)的梯度更新参数;
步骤1.5:对于q=1重复步骤2和步骤4,直到收敛或q=Q。Q为迭代次数设定值,Q越大,损失函数越小,特征解析越精准。
如图5所示,将改进的参数传递策略引入到深度多小波自动编码器的训练过程中,实现了对深度多小波自动编码器模型的设计。
图6是本发明所述的太阳能电池片缺陷分类检测具体步骤流程图。
步骤2,运用参数传递原理,基于多重相似性度量构建目标域与各个源域的多重相似性关系。
参数传递是迁移学习策略的一种。当前的迁移学习策略主要包括实例迁移、特征迁移、参数传递和关系迁移。参数传递是目前最流行的迁移学习策略,其原理简单易懂,易于实现,从源领域学到的知识可以成功地转移到目标任务中,非常适合辅助训练数据的分类任务。使用参数传递对预先训练好的深度学习模型进行微调,比使用随机初始化的权重从零开始进行训练更快、更容易。参数传递存在M个源域,其中第s个源域为 和分别为第i个样本的特征矢量和标记,样本数量为NS。目标域有Ni个标记样本Nu个未标记样本 和分别为目标域第i个样本的特征矢量和标记。所有目标域样本集合为总样本数量为NT=Nl+Nu。每个源域与目标域之间的数据分布都是不完全相同的,即Ps(x,y)≠PT(x,y),s=1,...,M,并且源域之间的分布也不尽相同。由于目标域与源域的数据分布不同,分类模型也会有差别,源域分类器直接用于对目标域样本进行分类就会产生很大的误差。迁移学习的一个关键问题是如何找出目标域与源域之间的相关性关系。为此从域—域和样本—域两个层面来表征目标域与源域之间的相似性。
步骤2具体包括:
(1)基于多重相似性度量构建目标域与各个源域的多重相似性关系。
多重相似性构建的具体过程如下:
步骤2.1.1:从域整体上衡量目标域与源域之间的相似性,即域—域相似性。定义第s源域与目标域的相似性权值γs为:
其中,为第s源域与目标域之间数据分布的最大均值差异,是一种在再生核希尔伯特空间中能够有效比较数据分布的非参数化距离度量,NT、NS分别为为目标域和源域的总样本数量,分别为目标域与源域的数据分布函数。||||H为差值最大值。β1>0用于控制MMD的作用范围,一般取所有源域与目标域之间MMD的均值。
Ais=exp(-(di s)2/β2) (37)
步骤3,根据目标域分类器与相关源域分类器对目标域无标记样本具有相似决策值的平滑性假设,定义一种多源域迁移流形正则项;借助已学习的源域分类器来学习一个适用于目标域的分类器。具体的步骤如下:
(1)根据目标域分类器与相关源域分类器对目标域无标记样本具有相似决策值的平滑性假设,定义一种多源域迁移流形正则项:
根据流形平滑假设,即目标函数在数据高密度区域对相邻数据有相似的决策值。迁移学习的算法研究中,假设若目标域与第s源域具有较高的相似性权值γs且目标域样本与第s源域也具有较高的相似性权值Ais,则fT和fs对具有相似的分类决策值。结合域间相似性,定义多源域迁移流形正则项为:
其中,为目标域未标记样本。γs为式(34)定义的目标域与第s源域的相似性权值,Ais为式(37)定义的目标域第i个未标记样本与第s源域的相似性权值。式(38)定义的ΩD(fT)通过相似性权值γs和Ais构建起目标分类器fT与各源域分类器fs之间的联系。相似性权值越大,目标分类器与该源域分类器对目标域样本就具有更相近的决策值。
(2)借助已学习的源域分类器来学习一个适用于目标域的分类器:
结合式(38)定义的多源域迁移流形正则项,给出一种能够同时最小化该正则项和目标域标记样本误分类损失的多源域迁移学习框架:
其中,Ω(fT)用于控制目标分类器fT的复杂度;ΩL(fT)为fT对目标域标记样本误分类的损失函数;ΩD(fT)为式(38)定义的多源域迁移流形正则项;λL、λD为正则参数。
目标分类器为如下形式:
步骤4:利用设计出的太阳能电池片缺陷目标分类器对太阳能电池片缺陷图像目标域样本进行分类检测。
如图5所示,具体的步骤如下:
(1)根据经验设置参数:式(35)中的近邻个数Nk和式(39)中的正则参数λL、λD分别设置为:λL=λD=1,Nk=8,源域分类器的参数通过已有的源域训练模型得到;
(2)式(34)中所涉及的再生希尔伯特核空间核函数采用高斯核函数k(xi,xj)=exp(-||xi,xj||2/(2σ2)),核函数参数σ由目标域全部数据间的距离平均值决定;
(3)从目标域每一类中随机选择n个样本组成NT个目标域标记数据集,其余目标域数据作为目标域未标记数据集;
(4)目标域每类标记样本数n的取值范围为[02461015 20]。独立进20次,取平均分类准确率(即准确识别测试样本个数与总的测试样本个数之比)作为分类检测结果。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (10)
1.一种少样本条件下太阳能电池片缺陷分类检测方法,其特征在于:具体步骤包括:
步骤1,设计新型的深度多小波自动编码器,以学习太阳能电池片缺陷图像的重要特征;
步骤2,运用参数传递原理,基于多重相似性度量构建目标域与各个源域的多重相似性关系;
步骤3,根据目标域分类器与相关源域分类器对目标域无标记样本具有相似决策值的平滑性假设,定义一种多源域迁移流形正则项;借助已学习的源域分类器来学习一个适用于目标域的分类器;
步骤4,利用设计出的太阳能电池片缺陷目标分类器对太阳能电池片缺陷图像目标域样本进行分类检测。
2.根据权利要求1所述的一种少样本条件下太阳能电池片缺陷分类检测方法,其特征在于:所述自动编码器由编码器和解码器构成,是构建深度学习网络解决各种任务的有效基础模型,自动编码器通过编码器对所获得的太阳能电池片图像特征进行表示,通过解码器提取出原始数据的主要特征。
5.根据权利要求1所述的一种少样本条件下太阳能电池片缺陷分类检测方法,其特征在于:所述步骤1中深度多小波自动编码器由多个多小波自编码器组成;多小波自动编码器比例缩放函数及具有相应偏导数的显式形式定义如下:
以及:
根据多小波比例缩放函数(3)、(4),输出可计算为:
其中,为多小波缩放函数对隐藏单元j进行输出变换的输出,;和分别为和的输出部分;xi为输入样本x的第i个维数元素;τ为重建特征输入;Wij表示连接隐藏单元j和输入单元i的权重;aj、cj为隐藏单元第j个节点的网络参数;Uij-1和Uij-2分别表示使用和连接隐藏单元j和输出单元i的权值;
在计算出和输出部分后,通过sf变换得到最终的重建输出,该变换取决于输入数据的特定归一化范围,具体归一化范围设为[-1,1],为了使输出接近输入,由于其映射范围而选择了Tanh,Tanh为双曲正切函数:
其中zi表示重构向量z中的第i个维度元素,多小波自编码器模型的损失函数中也加入了一个权重衰减项,以避免过拟合,定义为:
其中,δ为权重衰减系数,通过最小化损失函数,对多小波自动编码器模型的权值参数进行如下更新:
其中,η为学习率。
6.根据权利要求5所述的一种少样本条件下太阳能电池片缺陷分类检测方法,其特征在于:多小波自动编码器的训练算法如下:
步骤1.1:参数初始化;
步骤1.2:计算式(11)中的重构输出;
步骤1.3:计算式(12)中的损失函数;
步骤1.4:使用式(13)的梯度更新参数;
步骤1.5:对于q=1重复步骤1.2和步骤1.4,直到收敛或q=Q,Q为迭代次数设定值,Q越大,损失函数越小,特征解析越精准。
7.根据权利要求1所述的一种少样本条件下太阳能电池片缺陷分类检测方法,其特征在于:所述步骤2中,存在M个源域,其中第s个源域为 和分别为源域第i个样本的特征矢量和标记,样本数量为NS,目标域有Ni个标记样本Nu个未标记样本 和分别为目标域第i个样本的特征矢量和标记,所有目标域样本集合为总样本数量为NT=Nl+Nu,每个源域与目标域之间的数据分布都是不完全相同的,即Ps(x,y)≠PT(x,y),s=1,...,M,并且源域之间的分布也不尽相同,由于目标域与源域的数据分布不同,分类模型也会有差别,源域分类器直接用于对目标域样本进行分类就会产生很大的误差,迁移学习的一个关键问题是如何找出目标域与源域之间的相关性关系,为此从域—域和样本—域两个层面来表征目标域与源域之间的相似性。
8.根据权利要求7所述的一种少样本条件下太阳能电池片缺陷分类检测方法,其特征在于:所述步骤2的具体过程为:
步骤2.1.1:从域整体上衡量目标域与源域之间的相似性,即域—域相似性,定义第s源域与目标域的相似性权值γs为:
其中,为第s源域与目标域之间数据分布的最大均值差异,是一种在再生核希尔伯特空间中能够有效比较数据分布的非参数化距离度量,NT、NS分别为为目标域和源域的总样本数量,分别为目标域与源域的数据分布函数,||||H为差值最大值,β1>0用于控制MMD的作用范围,一般取所有源域与目标域之间MMD的均值;
9.根据权利要求8所述的一种少样本条件下太阳能电池片缺陷分类检测方法,其特征在于:所述步骤3的具体过程为:
步骤3.1,根据目标域分类器与相关源域分类器对目标域无标记样本具有相似决策值的平滑性假设,定义一种多源域迁移流形正则项:
根据流形平滑假设,即目标函数在数据高密度区域对相邻数据有相似的决策值,迁移学习的算法研究中,假设若目标域与第s源域具有较高的相似性权值γs且目标域样本与第s源域也具有较高的相似性权值Ais,则fT和fs对具有相似的分类决策值,结合域间相似性,定义多源域迁移流形正则项为:
其中,为目标域未标记样本,γs为式(14)定义的目标域与第s源域的相似性权值,Ais为式(17)定义的目标域第i个未标记样本与第s源域的相似性权值;式(18)定义的ΩD(fT)通过相似性权值γs和Ais构建起目标分类器fT与各源域分类器fs之间的联系,相似性权值越大,目标分类器与该源域分类器对目标域样本就具有更相近的决策值;
步骤3.2,借助已学习的源域分类器来学习一个适用于目标域的分类器:
结合式(18)定义的多源域迁移流形正则项,给出一种能够同时最小化该正则项和目标域标记样本误分类损失的多源域迁移学习框架:
其中,Ω(fT)用于控制目标分类器fT的复杂度;ΩL(fT)为fT对目标域标记样本误分类的损失函数;ΩD(fT)为式(18)定义的多源域迁移流形正则项;λL、λD为正则参数;
目标分类器为如下形式:
10.根据权利要求9所述的一种少样本条件下太阳能电池片缺陷分类检测方法,其特征在于:步骤4的具体实现步骤如下:
步骤4.1:根据经验设置参数:式(15)中的近邻个数Nk和式(19)中的正则参数λL、λD分别设置为:λL=λD=1,Nk=8,源域分类器的参数通过已有的源域训练模型得到;
步骤4.2:式(14)中所涉及的再生希尔伯特核空间核函数采用高斯核函数k(xi,xj)=exp(-||xi,xj||2/(2σ2)),核函数参数σ由目标域全部数据间的距离平均值决定;
步骤4.3:从目标域每一类中随机选择n个样本组成NT个目标域标记数据集,其余目标域数据作为目标域未标记数据集;
步骤4.4:目标域每类标记样本数n的取值范围为[0 2 4 6 10 15 20],独立进20次,取平均分类准确率作为分类检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010546126.4A CN111860592A (zh) | 2020-06-16 | 2020-06-16 | 一种少样本条件下太阳能电池片缺陷分类检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010546126.4A CN111860592A (zh) | 2020-06-16 | 2020-06-16 | 一种少样本条件下太阳能电池片缺陷分类检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111860592A true CN111860592A (zh) | 2020-10-30 |
Family
ID=72986573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010546126.4A Pending CN111860592A (zh) | 2020-06-16 | 2020-06-16 | 一种少样本条件下太阳能电池片缺陷分类检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860592A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112540298A (zh) * | 2020-12-26 | 2021-03-23 | 福州大学 | 一种基于深度-迁移学习的锂离子电池soc估计方法 |
CN114444374A (zh) * | 2021-11-29 | 2022-05-06 | 河南工业大学 | 一种基于相似性度量的多源到多目标域自适应的方法 |
CN116777896A (zh) * | 2023-07-07 | 2023-09-19 | 浙江大学 | 一种表观缺陷跨域分类识别的负迁移抑制方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110751186A (zh) * | 2019-09-26 | 2020-02-04 | 北京航空航天大学 | 一种基于监督式表示学习的跨项目软件缺陷预测方法 |
-
2020
- 2020-06-16 CN CN202010546126.4A patent/CN111860592A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110751186A (zh) * | 2019-09-26 | 2020-02-04 | 北京航空航天大学 | 一种基于监督式表示学习的跨项目软件缺陷预测方法 |
Non-Patent Citations (2)
Title |
---|
HE ZHIYI等: "Deep transfer multi-wavelet auto-encoder for intelligent fault diagnosis of gearbox with few target training samples", KNOWLEDGE-BASED SYSTEMS, 30 November 2019 (2019-11-30), pages 1 - 14 * |
刘振: "基于域相关性与流形约束的多源域迁移学习分类算法", 计算机应用研究, vol. 34, no. 2, 28 February 2017 (2017-02-28), pages 351 - 356 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112540298A (zh) * | 2020-12-26 | 2021-03-23 | 福州大学 | 一种基于深度-迁移学习的锂离子电池soc估计方法 |
CN112540298B (zh) * | 2020-12-26 | 2022-05-10 | 福州大学 | 一种基于深度-迁移学习的锂离子电池soc估计方法 |
CN114444374A (zh) * | 2021-11-29 | 2022-05-06 | 河南工业大学 | 一种基于相似性度量的多源到多目标域自适应的方法 |
CN116777896A (zh) * | 2023-07-07 | 2023-09-19 | 浙江大学 | 一种表观缺陷跨域分类识别的负迁移抑制方法 |
CN116777896B (zh) * | 2023-07-07 | 2024-03-19 | 浙江大学 | 一种表观缺陷跨域分类识别的负迁移抑制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhu et al. | Fault diagnosis approach for photovoltaic arrays based on unsupervised sample clustering and probabilistic neural network model | |
CN111860592A (zh) | 一种少样本条件下太阳能电池片缺陷分类检测方法 | |
CN105825511A (zh) | 一种基于深度学习的图片背景清晰度检测方法 | |
CN106991666B (zh) | 一种适用于多尺寸图片信息的病害图像识别方法 | |
CN101794396A (zh) | 基于迁移网络学习的遥感图像目标识别系统及方法 | |
CN114973032B (zh) | 一种基于深度卷积神经网络的光伏板热斑检测方法及装置 | |
CN105262441B (zh) | 基于红外图像的光伏阵列故障等级划分方法 | |
Wan et al. | LFRNet: Localizing, focus, and refinement network for salient object detection of surface defects | |
CN113781466A (zh) | 基于多尺度注意力密集网络的太阳能电池板缺陷识别方法 | |
CN114283137A (zh) | 基于多尺度特征图推理网络的光伏组件热斑缺陷检测方法 | |
Ying et al. | Automatic detection of photovoltaic module cells using multi-channel convolutional neural network | |
Ni et al. | Intelligent defect detection method of photovoltaic modules based on deep learning | |
CN118196070B (zh) | 一种基于无人机热红外遥感的光伏板缺陷识别方法 | |
Hoffmann et al. | Deep‐learning‐based pipeline for module power prediction from electroluminescense measurements | |
CN106897998A (zh) | 太阳能直射辐射强度信息预测方法和系统 | |
Tao et al. | Electric insulator detection of UAV images based on depth learning | |
CN116486231A (zh) | 一种基于改进YOLOv5的混凝土裂缝检测方法 | |
CN112149502A (zh) | 一种基于卷积神经网络的不良地质定位预报方法 | |
Tang et al. | Automatic defect identification of PV panels with IR images through unmanned aircraft | |
CN110084804A (zh) | 一种基于弱监督深度学习的水下构筑物缺陷检测方法 | |
CN114359167A (zh) | 一种复杂场景下基于轻量化YOLOv4的绝缘子缺陷检测方法 | |
Otamendi et al. | A scalable framework for annotating photovoltaic cell defects in electroluminescence images | |
Wu et al. | Ghost-RetinaNet: Fast Shadow DetectionMethod for Photovoltaic Panels Based on Improved RetinaNet. | |
CN117788810A (zh) | 一种无监督语义分割的学习系统 | |
CN116152194A (zh) | 一种物体缺陷检测方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |