CN112200797B - 一种基于pcb噪声标注数据的有效训练方法 - Google Patents
一种基于pcb噪声标注数据的有效训练方法 Download PDFInfo
- Publication number
- CN112200797B CN112200797B CN202011174880.6A CN202011174880A CN112200797B CN 112200797 B CN112200797 B CN 112200797B CN 202011174880 A CN202011174880 A CN 202011174880A CN 112200797 B CN112200797 B CN 112200797B
- Authority
- CN
- China
- Prior art keywords
- training
- image
- pcb
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000002372 labelling Methods 0.000 title claims abstract description 12
- 230000006870 function Effects 0.000 claims abstract description 17
- 238000004140 cleaning Methods 0.000 claims abstract description 11
- 238000013526 transfer learning Methods 0.000 claims abstract description 9
- 230000006835 compression Effects 0.000 claims description 18
- 238000007906 compression Methods 0.000 claims description 18
- 238000010606 normalization Methods 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 4
- 238000010845 search algorithm Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30141—Printed circuit board [PCB]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开一种基于PCB噪声标注数据的有效训练方法,包括以下步骤:S1、收集图像,建立含有噪声标注的PCB图像数据集和经过数据清洗的PCB图像数据集;S2、通过集成的Efficientnet模型分别提取两个数据集中每一幅图像的图像特征;S3、将提取的图像特征通过深度卷积网络进行降维;S4、采用余弦损失函数训练分类器模型;S5、采用迁移学习交替训练两个数据集,并在含有噪声标注的PCB图像数据集中的较大分辨率图像上进行微调,最终实现数据的训练,本发明主要用于解决当训练集中含有大量噪声标注时实现图像检索的问题,并在检索过程中实现高效的速度和准确性。
Description
技术领域
本发明涉及图像检索技术领域,尤其涉及一种基于PCB噪声标注数据的有效训练方法。
背景技术
PCB板是现代众多信息化、自动化的电子产品的基础构件,在整个电子产业的发展中起到承上启下的作用。前些年,因为政治经济影响,智能手机、个人电脑等主要电子产品消费量较少,电子行业增速缓慢,后来通过新兴技术在全球市场的推广和普及,国际对PCB产量的需求越来越大,市场容量不断扩张,市场巨大。为了适应时代的要求,就必须提升PCB产品的质量,由于PCB的制作工艺复杂,整个生产过程中受各种因素的影响,会产生很多方面的瑕疵。在机器视觉技术未广泛应用之前,PCB缺陷检测的主要手段是人工检测,其检测过程繁琐。随着PCB板的设计日趋复杂,其表面焊接的元器件尺寸也越来越小、分布越来越密,导致人工检测更加困难、耗时长且占用过多人力资源导致生产成本的提升,同时人工检测对工人的视力损伤较大,也存在检测一致性、准确性低的问题。为了提高生产力,降低生产成本,提高检测效率与准确性,研发高效的基于机器视觉技术的PCB缺陷检测方法,但是在数据过多的情况下,通过网络数据挖掘对图像标记时,会产生大量的噪声标注,目前还没有很好的算法对这些数据实现有效的训练,因此提出一种基于PCB噪声标注数据的有效训练方法具有重要的现实意义。
发明内容
针对上述问题,本发明提出一种基于PCB噪声标注数据的有效训练方法,主要解决背景技术中的问题。
本发明提出一种基于PCB噪声标注数据的有效训练方法,包括以下步骤:
S1、收集图像,建立含有噪声标注的PCB图像数据集和经过数据清洗的PCB图像数据集;
S2、通过集成的Efficientnet模型分别提取两个数据集中每一幅图像的图像特征;
S3、将提取的图像特征通过深度卷积网络进行降维;
S4、采用余弦损失函数训练分类器模型;
S5、采用迁移学习交替训练两个数据集,并在含有噪声标注的PCB图像数据集中的较大分辨率图像上进行微调,最终实现数据的训练。
进一步改进在于,所述Efficientnet模型的网络表达式为:
其中,N表示分类网络,代表卷积操作,X表示输入张量,Fi表示基础网络层,i表示卷积层数,Li表示网络的长度;
所述Efficientnet模型通过网格搜索算法得到最优比例系数,然后按比例对网络宽度、深度和分辨率三个维度进行缩放,而所述最优比例系数为所述Efficientnet模型最大化精度值Accmax(N(d,w,r))时的d、w、r值,所述最大化精度值Accmax(N(d,w,r))的计算公式为:
其中,设置比例系数如下:深度宽度/>分辨率/>α,β,γ是变量,满足α×β2×γ2≈2,α≥1,β≥1,γ≥1。
进一步改进在于,所述Efficientnet模型包括MBConv模块和SE模块,所述MBConv模块由一个1*1的Conv+BN批量归一化层+Swish层、一个深度可分离卷积+BN批量归一化层+Swish层、一个1*1的Conv+BN批量归一化层依次连接组成,并在所述深度可分离卷积层后插入所述SE模块;
通过Efficientnet模型的图像特征提取过程如下:
S21、通过所述1*1的Conv+BN批量归一化层+Swish层对输入图像进行升维;
S22、通过深度可分离卷积+BN批量归一化层+Swish层对图像进行降采样;
S23、通过SE模块使得所述Efficientnet模型能够根据通道特征的重要程度进行学习;
S24、通过1*1的Conv+BN批量归一化层对图像进行降维。
进一步改进在于,所述深度可分离卷积层由一个深度卷积和一个1*1的卷积组成,降采样操作如下:
S221、假设输入一幅12*12*3的RGB图像;
S222、用5*5大小且通道数为1的三个卷积核对三个通道特征分别做卷积,得到三个通道的特征属性;
S223、对三个通道特征用尺寸1*1*3的卷积核再次卷积实现数据降维,最终得到输出8*8*1的图像。
进一步改进在于,所述SE模块包括压缩操作和激活操作;
所述压缩操作Fsq通过全局平均池化实现并得到全局描述特征,
其中,zC为压缩操作的输出,uC为压缩操作的输入,通常为上一层的卷积结果,Fsq为压缩操作,H,W分别为输入图像的高和宽;
所述激活操作通过学习各通道间的非线性关系,得到不同通道的权重,具体是:
s=Fex(z,W)=σ(g(z,W))=σ(W2Swish(W1z))
其中,s为各个通道的激活值,Fex为激活操作,W1,W2分别为两个全连接层的权重,z为经过压缩操作的输出结果。
进一步改进在于,所述集成的Efficientnet模型是将Efficientnet-B5、Efficientnet-B6和Efficientnet-B7按照不同的权重连接起来,其中所述权重是根据每个模型的性能给出的,具体算法如下:
(1)已知训练集X={(x1,y1),(x2,y2),(x3,y3),...,(xN,yN)},xi∈RN,yi∈{0,1};
(2)初始化样本权重向量D1=(W11,W12,W13,...,W1N),
(3)按照样本权重分布Dm训练数据得到第m个基学习器Gm(x);
(4)计算Gm(x)在加权训练数据集上的分类误差率:
其中,I(·)表示指示函数,表示当Gm(xi)≠yi时输出为1,否则输出为0;
(5)计算Gm(x)的权重系数:
(6)更新训练样本权重向量:
Dm+1=(wm+1,1,wm+1,2,...,wm+1,N),
(7)线性组合成强学习器:
(8)损失函数是指数函数:
优化目标为/>
(9)最终得到第m个基分类器Gm(xi)及其权重αm。
进一步改进在于,所述步骤S4中,余弦损失函数为:
其中,xi∈Rd为第i个样本的特征,其标签类别为yi,d是特征的维度。是yi标签类别的权重向量,Wj是第j类的权重,/>是xi与/>之间的夹角,θj,i是xi与Wj之间的夹角,N和C分别是样本数和类别数,s是对余弦值进行放缩的比例,是超参数。
进一步改进在于,所述步骤S5中,采用迁移学习交替训练两个数据集,训练过程如下:
S51、使用ImageNet数据集进行预训练;
S52、使用经过数据清洗的PCB图像数据集训练模型,输入图像分辨率为512*512,批量大小为64;
S53、将S52得到的模型在含有噪声标注的PCB图像数据集上训练,输入图像分辨率为512*512,批量大小为64;
S54、将S53得到的模型在含有噪声标注的PCB图像数据集上训练,输入图像分辨率为640*640,批量大小为64;同时将S53得到的模型在含有噪声标注的PCB图像数据集上训练,输入图像分辨率为736*736,批量大小为32*32;
S55、将S54中640*640分辨率数据训练得到的模型在经过数据清洗的PCB图像数据集上继续训练;同时将S54中736*736分辨率数据训练得到的模型在经过数据清洗的PCB图像数据集上继续训练。
与现有技术相比,本发明的有益效果为:
1、提取特征选用了Efficientnet网络结构,通过网格搜索算法得到最优解的比例系数,按比例对网络宽度、深度、分辨率各个维度进行缩放,这种复合缩放法平衡了宽度、深度、分辨率三个维度,使卷积网络在准确率和效率上得到了改善;
2、用深度可分离卷积代替了普通卷积,假设一幅RGB图像,普通卷积是对三个通道同时做卷积,而深度可分离卷积是用通道数为1的卷积核对三个通道分别做卷积,提高了运算效率;
3、可分离卷积后加入了SE模块,让模型学习到了各个通道的权重系数,从而使网络模型对不同通道的特征有更好的辨别能力,增强了特征提取的性能。
4、采用了模型集成方法,将几个弱学习器通过权重连接组合成一个强学习器,泛化错误率低,精度高;
5、在两个数据集上进行交替训练,通过迁移学习,并调整图像分辨率,提高了模型训练效率和精度。
附图说明
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
图1为本发明一实施方式的整体流程示意图;
图2为本发明一实施方式的MBConv模块结构示意图;
图3为本发明一实施方式的深度可分离卷积DWConv结构示意图;
图4为本发明一实施方式的SE模块结构示意图。
具体实施方式
下面结合附图和实施例对本发明的技术方案做进一步的说明。
本发明的目的在于提供一种基于PCB噪声标注数据的有效训练方法,其特点是首先收集图像,建立数据集,包括含有大量噪声标注的PCB图像数据集(Dataset1)和经过数据清洗的PCB图像数据集(Dataset2);然后通过集成的Efficientnet模型提取图像数据集中每一幅图像的特征;接着将提取的特征通过深度卷积网络进行降维;再采用余弦损失函数训练分类器模型;最后使用迁移学习交替训练两个数据集,并在Dataset2中分辨率大的图像上进行微调,最终实现数据的有效训练。该方法主要用于解决当训练集中含有大量噪声标注时实现图像检索的问题,并在检索过程中实现高效的速度和准确性。
参照图1到图4,一种基于PCB噪声标注数据的有效训练方法,包括以下步骤:
S1、收集图像,建立含有噪声标注的PCB图像数据集和经过数据清洗的PCB图像数据集;
S2、通过集成的Efficientnet模型分别提取两个数据集中每一幅图像的图像特征;
S3、将提取的图像特征通过深度卷积网络进行降维;
S4、采用余弦损失函数训练分类器模型;
S5、采用迁移学习交替训练两个数据集,并在含有噪声标注的PCB图像数据集中的较大分辨率图像上进行微调,最终实现数据的训练。
作为本发明一优选实施方案,所述步骤S2中,提取特征选用了Efficientnet网络结构,通过网格搜索算法得到最优解的比例系数,按比例对网络宽度、深度、分辨率各个维度进行缩放。Efficientnet网络表达式为:
其中N表示分类网络,/>代表卷积操作,X表示输入张量,Fi表示基础网络层,i表示卷积层数,Li表示网络的长度。该网络做到了同时调整三个维度来进行优化,需要找到最优的三个维度的缩放参数以满足在模型参数和计算量达到最大化时模型的准确率有所提高。模型的最大化精度记作Accmax(N(d,w,r)),计算公式为:
设置比例系数如下:深度宽度/>分辨率/>α,β,γ是变量,满足α×β2×γ2≈2,α≥1,β≥1,γ≥1,使用复合参数对网络的深度、宽度以及分辨率进行优化。
作为本发明一优选实施方案,所述Efficientnet模型包括MBConv模块和SE模块,所述MBConv模块示意图如图2所示,由一个1*1的Conv+BN批量归一化层+Swish层、一个深度可分离卷积+BN批量归一化层+Swish层、一个1*1的Conv+BN批量归一化层依次连接组成,并在所述深度可分离卷积层后插入所述SE模块;
通过Efficientnet模型的图像特征提取过程如下:
S21、通过所述1*1的Conv+BN批量归一化层+Swish层对输入图像进行升维;
S22、通过深度可分离卷积+BN批量归一化层+Swish层对图像进行降采样;
S23、通过SE模块使得所述Efficientnet模型能够根据通道特征的重要程度进行学习;
S24、通过1*1的Conv+BN批量归一化层对图像进行降维。
需要注意的是,当MBConv模块个数大于1时,第一个MBConv模块的卷积步长为S,其余的步长均为1;对特征的升维操作只在第一个MBConv模块的最后一个1*1卷积层进行,其他模块的特征通道维度不变。
作为本发明一优选实施方案,所述深度可分离卷积层由一个深度卷积和一个1*1的卷积组成,示意图如图3所示,降采样操作如下:
S221、假设输入一幅12*12*3的RGB图像;
S222、用5*5大小且通道数为1的三个卷积核对三个通道特征分别做卷积,得到三个通道的特征属性;
S223、对三个通道特征用尺寸1*1*3的卷积核再次卷积实现数据降维,最终得到输出8*8*1的图像。
深度可分离卷积和普通卷积效果是等效的,但是深度可分离卷积中存在大量的1*1卷积操作,可以使用高度优化矩阵相乘来完成计算,极大的提高了运算效率。
作为本发明一优选实施方案,所述SE模块包括压缩操作和激活操作。
所述压缩操作Fsq通过全局平均池化实现并得到全局描述特征,
其中,zC为压缩操作的输出,uC为压缩操作的输入,通常为上一层的卷积结果,Fsq为压缩操作,H,W分别为输入图像的高和宽;
所述激活操作通过学习各通道间的非线性关系,得到不同通道的权重,具体是:
s=Fex(z,W)=σ(g(z,W))=σ(W2Swish(W1z))
其中,s为各个通道的激活值,Fex为激活操作,W1,W2分别为两个全连接层的权重,z为经过压缩操作的输出结果。
SE模块结构图如图4所示,采用包含两个全连接层的瓶颈结构来实现,这种模型在降低模型复杂度的同时增强了模型的泛化能力。第一个全连接层作用是降维,后接Swish层进行激活;经过第二个全连接层恢复原始的维度后再经过sigmoid激活;最后将得到的各通道激活值sC乘以原始特征uC即可得到最终的特征
作为本发明一优选实施方案,所述集成的Efficientnet模型是将Efficientnet-B5、Efficientnet-B6和Efficientnet-B7按照不同的权重连接起来,通过集成它们三个的学习能力得到一个强学习器。集成原理是在之前学习器的基础上改变样本的权重,增加那些之前被分类错误的样本比重,降低分类正确样本的比重,这样之后的学习器将重点关注那些被分类错误的样本,最后通过将这些学习器通过加权组合成一个强学习器。权重是根据每个模型的性能给出的,分类正确率高的学习器权重较高,分类正确率低的学习器权重较低。具体算法如下:
(1)已知训练集X={(x1,y1),(x2,y2),(x3,y3),...,(xN,yN)},xi∈RN,yi∈{0,1};
(2)初始化样本权重向量D1=(W11,W12,W13,...,W1N),
(3)按照样本权重分布Dm训练数据得到第m个基学习器Gm(x);
(4)计算Gm(x)在加权训练数据集上的分类误差率:
其中,I(·)表示指示函数,表示当Gm(xi)≠yi时输出为1,否则输出为0;
(5)计算Gm(x)的权重系数:
(6)更新训练样本权重向量:
Dm+1=(wm+1,1,wm+1,2,...,wm+1,N),
(7)线性组合成强学习器:
(8)损失函数是指数函数:
优化目标为/>
(9)最终得到第m个基分类器Gm(xi)及其权重αm。
作为本发明一优选实施方案,所述步骤S4中,余弦损失函数为:
其中,xi∈Rd为第i个样本的特征,其标签类别为yi,d是特征的维度。是yi标签类别的权重向量,Wj是第j类的权重,/>是xi与/>之间的夹角,θj,i是xi与Wj之间的夹角,N和C分别是样本数和类别数,s是对余弦值进行放缩的比例,是超参数。
作为本发明一优选实施方案,所述步骤S5中,采用迁移学习交替训练两个数据集,训练过程如下:
S51、使用ImageNet数据集进行预训练;
S52、使用经过数据清洗的PCB图像数据集训练模型,输入图像分辨率为512*512,批量大小为64;
S53、将S52得到的模型在含有噪声标注的PCB图像数据集上训练,输入图像分辨率为512*512,批量大小为64;
S54、将S53得到的模型在含有噪声标注的PCB图像数据集上训练,输入图像分辨率为640*640,批量大小为64;同时将S53得到的模型在含有噪声标注的PCB图像数据集上训练,输入图像分辨率为736*736,批量大小为32*32;
S55、将S54中640*640分辨率数据训练得到的模型在经过数据清洗的PCB图像数据集上继续训练;同时将S54中736*736分辨率数据训练得到的模型在经过数据清洗的PCB图像数据集上继续训练。
最后发现在两个数据集上交替训练后,输入分辨率更高的模型精度更高。
图中,描述位置关系仅用于示例性说明,不能理解为对本专利的限制;显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (6)
1.一种基于PCB噪声标注数据的有效训练方法,其特征在于,包括以下步骤:
S1、收集图像,建立含有噪声标注的PCB图像数据集和经过数据清洗的PCB图像数据集;
S2、通过集成的Efficientnet模型分别提取两个数据集中每一幅图像的图像特征;
所述Efficientnet模型包括MBConv模块和SE模块,所述MBConv模块由一个1*1的Conv+BN批量归一化层+Swish层、一个深度可分离卷积+BN批量归一化层+Swish层、一个1*1的Conv+BN批量归一化层依次连接组成,并在所述深度可分离卷积层后插入所述SE模块;
通过Efficientnet模型的图像特征提取过程如下:
S21、通过所述1*1的Conv+BN批量归一化层+Swish层对输入图像进行升维;
S22、通过深度可分离卷积+BN批量归一化层+Swish层对图像进行降采样;
S23、通过SE模块使得所述Efficientnet模型能够根据通道特征的重要程度进行学习;
S24、通过1*1的Conv+BN批量归一化层对图像进行降维;
所述集成的Efficientnet模型是将Efficientnet-B5、Efficientnet-B6和Efficientnet-B7按照不同的权重连接起来,其中所述权重是根据每个模型的性能给出的,具体算法如下:
(1)已知训练集X={(x1,y1),(x2,y2),(x3,y3),...,(xN,yN)},xi∈RN,yi∈{0,1};
(2)初始化样本权重向量D1=(W11,W12,W13,...,W1N),
(3)按照样本权重分布Dm训练数据得到第m个基学习器Gm(x);
(4)计算Gm(x)在加权训练数据集上的分类误差率:
其中,I(·)表示指示函数,表示当Gm(xi)≠yi时输出为1,否则输出为0;
(5)计算Gm(x)的权重系数:
(6)更新训练样本权重向量:
Dm+1=(wm+1,1,wm+1,2,...,wm+1,N),
(7)线性组合成强学习器:
(8)损失函数是指数函数:
优化目标为/>
(9)最终得到第m个基分类器Gm(xi)及其权重αm;
S3、将提取的图像特征通过深度卷积网络进行降维;
S4、采用余弦损失函数训练分类器模型;
S5、采用迁移学习交替训练两个数据集,并在含有噪声标注的PCB图像数据集中的分辨率图像上进行微调,最终实现数据的训练。
2.根据权利要求1所述的一种基于PCB噪声标注数据的有效训练方法,其特征在于,所述Efficientnet模型的网络表达式为:
其中,N表示分类网络,代表卷积操作,X表示输入张量,Fi表示基础网络层,i表示卷积层数,Li表示网络的长度;
所述Efficientnet模型通过网格搜索算法得到最优比例系数,然后按比例对网络宽度、深度和分辨率三个维度进行缩放,而所述最优比例系数为所述Efficientnet模型最大化精度值Accmax(N(d,w,r))时的d、w、r值,所述最大化精度值Accmax(N(d,w,r))的计算公式为:
其中,设置比例系数如下:深度宽度/>分辨率/>α,β,γ是变量,满足α×β2×γ2≈2,α≥1,β≥1,γ≥1。
3.根据权利要求1所述的一种基于PCB噪声标注数据的有效训练方法,其特征在于,所述深度可分离卷积层由一个深度卷积和一个1*1的卷积组成,降采样操作如下:
S221、假设输入一幅12*12*3的RGB图像;
S222、用5*5大小且通道数为1的三个卷积核对三个通道特征分别做卷积,得到三个通道的特征属性;
S223、对三个通道特征用尺寸1*1*3的卷积核再次卷积实现数据降维,最终得到输出8*8*1的图像。
4.根据权利要求1所述的一种基于PCB噪声标注数据的有效训练方法,其特征在于,所述SE模块包括压缩操作和激活操作;
所述压缩操作Fsq通过全局平均池化实现并得到全局描述特征,
其中,zC为压缩操作的输出,uC为压缩操作的输入,通常为上一层的卷积结果,Fsq为压缩操作,H,W分别为输入图像的高和宽;
所述激活操作通过学习各通道间的非线性关系,得到不同通道的权重,具体是:
s=Fex(z,W)=σ(g(z,W))=σ(W2Swish(W1z))
其中,s为各个通道的激活值,Fex为激活操作,W1,W2分别为两个全连接层的权重,z为经过压缩操作的输出结果。
5.根据权利要求1所述的一种基于PCB噪声标注数据的有效训练方法,其特征在于,所述步骤S4中,余弦损失函数为:
其中,xi∈Rd为第i个样本的特征,其标签类别为yi,d是特征的维度,是yi标签类别的权重向量,Wj是第j类的权重,/>是xi与/>之间的夹角,θj,i是xi与Wj之间的夹角,N和C分别是样本数和类别数,s是对余弦值进行放缩的比例,是超参数。
6.根据权利要求1所述的一种基于PCB噪声标注数据的有效训练方法,其特征在于,所述步骤S5中,采用迁移学习交替训练两个数据集,训练过程如下:
S51、使用ImageNet数据集进行预训练;
S52、使用经过数据清洗的PCB图像数据集训练模型,输入图像分辨率为512*512,批量大小为64;
S53、将S52得到的模型在含有噪声标注的PCB图像数据集上训练,输入图像分辨率为512*512,批量大小为64;
S54、将S53得到的模型在含有噪声标注的PCB图像数据集上训练,输入图像分辨率为640*640,批量大小为64;同时将S53得到的模型在含有噪声标注的PCB图像数据集上训练,输入图像分辨率为736*736,批量大小为32*32;
S55、将S54中640*640分辨率数据训练得到的模型在经过数据清洗的PCB图像数据集上继续训练;同时将S54中736*736分辨率数据训练得到的模型在经过数据清洗的PCB图像数据集上继续训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011174880.6A CN112200797B (zh) | 2020-10-28 | 2020-10-28 | 一种基于pcb噪声标注数据的有效训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011174880.6A CN112200797B (zh) | 2020-10-28 | 2020-10-28 | 一种基于pcb噪声标注数据的有效训练方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112200797A CN112200797A (zh) | 2021-01-08 |
CN112200797B true CN112200797B (zh) | 2024-04-05 |
Family
ID=74011805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011174880.6A Active CN112200797B (zh) | 2020-10-28 | 2020-10-28 | 一种基于pcb噪声标注数据的有效训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112200797B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI771908B (zh) * | 2021-02-09 | 2022-07-21 | 鴻海精密工業股份有限公司 | 圖像分類標注方法、裝置、電子設備及存儲介質 |
CN113780385A (zh) * | 2021-08-30 | 2021-12-10 | 武汉理工大学 | 一种基于注意力机制的驾驶风险监测方法 |
CN115170569B (zh) * | 2022-09-07 | 2022-12-02 | 新乡学院 | 一种基于图像的高熵材料涂层刀具的失效检测方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657693A (zh) * | 2018-10-22 | 2019-04-19 | 中国科学院软件研究所 | 一种基于相关熵和迁移学习的分类方法 |
CN110060238A (zh) * | 2019-04-01 | 2019-07-26 | 桂林电子科技大学 | 基于深度学习的pcb板标注印刷质量检测方法 |
CN110598792A (zh) * | 2019-09-16 | 2019-12-20 | 福州大学 | 基于pggan迁移学习的排水管道缺陷检测训练数据生成方法 |
CN110728294A (zh) * | 2019-08-30 | 2020-01-24 | 北京影谱科技股份有限公司 | 一种基于迁移学习的跨领域图像分类模型构建方法和装置 |
CN111161207A (zh) * | 2019-11-14 | 2020-05-15 | 西安工程大学 | 一种集成的卷积神经网络织物疵点分类方法 |
CN111191735A (zh) * | 2020-01-04 | 2020-05-22 | 西安电子科技大学 | 基于数据差异和多尺度特征的卷积神经网络影像分类方法 |
CN111476283A (zh) * | 2020-03-31 | 2020-07-31 | 上海海事大学 | 基于迁移学习的青光眼眼底图像识别方法 |
CN111612008A (zh) * | 2020-05-21 | 2020-09-01 | 苏州大学 | 基于卷积网络的图像分割方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10599951B2 (en) * | 2018-03-28 | 2020-03-24 | Kla-Tencor Corp. | Training a neural network for defect detection in low resolution images |
-
2020
- 2020-10-28 CN CN202011174880.6A patent/CN112200797B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657693A (zh) * | 2018-10-22 | 2019-04-19 | 中国科学院软件研究所 | 一种基于相关熵和迁移学习的分类方法 |
CN110060238A (zh) * | 2019-04-01 | 2019-07-26 | 桂林电子科技大学 | 基于深度学习的pcb板标注印刷质量检测方法 |
CN110728294A (zh) * | 2019-08-30 | 2020-01-24 | 北京影谱科技股份有限公司 | 一种基于迁移学习的跨领域图像分类模型构建方法和装置 |
CN110598792A (zh) * | 2019-09-16 | 2019-12-20 | 福州大学 | 基于pggan迁移学习的排水管道缺陷检测训练数据生成方法 |
CN111161207A (zh) * | 2019-11-14 | 2020-05-15 | 西安工程大学 | 一种集成的卷积神经网络织物疵点分类方法 |
CN111191735A (zh) * | 2020-01-04 | 2020-05-22 | 西安电子科技大学 | 基于数据差异和多尺度特征的卷积神经网络影像分类方法 |
CN111476283A (zh) * | 2020-03-31 | 2020-07-31 | 上海海事大学 | 基于迁移学习的青光眼眼底图像识别方法 |
CN111612008A (zh) * | 2020-05-21 | 2020-09-01 | 苏州大学 | 基于卷积网络的图像分割方法 |
Non-Patent Citations (6)
Title |
---|
An Efficient Method of Casting Defects Detection Based on Deep Learning;Lin Xue, etal.;《2020 IEEE International Conference on Advances in Electrical Engineering and Computer Applications (AEECA)》;全文 * |
EfficientNet在阴虚证眼象识别中的应用研究;孙旭豪;傅中添;严玲;周作建;;中医药信息(03);全文 * |
基于改进DCNN结合迁移学习的图像分类方法;杨东旭;赖惠成;班俊硕;王俊南;;新疆大学学报(自然科学版)(02);全文 * |
基于深度学习与板卡控制的AOI识别算法应用研究;吴鹃;;信息技术(09);全文 * |
基于迁移学习的暴恐图像自动识别;陈猛夫;;北京航空航天大学学报(09);全文 * |
融合注意力机制和高效网络的糖尿病视网膜病变识别与分类;张子振;刘明;朱德江;;中国图象图形学报(08);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112200797A (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112200797B (zh) | 一种基于pcb噪声标注数据的有效训练方法 | |
CN107256246B (zh) | 基于卷积神经网络的印花织物图像检索方法 | |
CN111709909B (zh) | 基于深度学习的通用印刷缺陷检测方法及其模型 | |
CN112561910B (zh) | 一种基于多尺度特征融合的工业表面缺陷检测方法 | |
CN109035251B (zh) | 一种基于多尺度特征解码的图像轮廓检测方法 | |
CN109299716A (zh) | 神经网络的训练方法、图像分割方法、装置、设备及介质 | |
CN113239954B (zh) | 基于注意力机制的图像语义分割特征融合方法 | |
CN110533024B (zh) | 基于多尺度roi特征的双二次池化细粒度图像分类方法 | |
CN112686345B (zh) | 一种基于注意力机制的脱机英文手写识别方法 | |
CN111832546A (zh) | 一种轻量级自然场景文本识别方法 | |
CN109800795A (zh) | 一种果蔬识别方法及系统 | |
CN107679501B (zh) | 一种基于标签自提纯的深度学习方法 | |
CN104951791A (zh) | 数据分类方法和装置 | |
CN110348503A (zh) | 一种基于卷积神经网络的苹果品质检测方法 | |
CN111239137B (zh) | 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法 | |
CN116258990A (zh) | 一种基于跨模态亲和力的小样本参考视频目标分割方法 | |
CN115147418A (zh) | 缺陷检测模型的压缩训练方法和装置 | |
CN115409157A (zh) | 一种基于学生反馈的无数据知识蒸馏方法 | |
CN114092467A (zh) | 一种基于轻量化卷积神经网络的划痕检测方法及系统 | |
CN111368637B (zh) | 一种基于多掩模卷积神经网络的搬运机器人识别目标方法 | |
CN113743203A (zh) | 基于深度迁移学习网络的笔记本屏幕缺陷检测方法及设备 | |
CN110348339B (zh) | 一种基于实例分割的手写文档文本行的提取方法 | |
CN116563230A (zh) | 焊缝缺陷识别方法及系统 | |
CN114926702B (zh) | 一种基于深度注意力度量的小样本图像分类方法 | |
CN111160428A (zh) | 基于cnn-svm算法蔬菜自动识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |