CN111008649B - 一种基于三支决策的缺陷检测数据集预处理方法 - Google Patents

一种基于三支决策的缺陷检测数据集预处理方法 Download PDF

Info

Publication number
CN111008649B
CN111008649B CN201911104108.4A CN201911104108A CN111008649B CN 111008649 B CN111008649 B CN 111008649B CN 201911104108 A CN201911104108 A CN 201911104108A CN 111008649 B CN111008649 B CN 111008649B
Authority
CN
China
Prior art keywords
convolution
sample
layer
activation
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911104108.4A
Other languages
English (en)
Other versions
CN111008649A (zh
Inventor
许玉格
钟铭
吴宗泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201911104108.4A priority Critical patent/CN111008649B/zh
Publication of CN111008649A publication Critical patent/CN111008649A/zh
Application granted granted Critical
Publication of CN111008649B publication Critical patent/CN111008649B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于三支决策的缺陷检测数据集预处理方法,该方法通过构造一个卷积神经网络来进行图片特征的提取,利用随机梯度下降法基于分类网络中的交叉熵损失来进行卷积神经网络权值的更新,同时利用卷积神经网络输出的特征来进行样本所属域的划分,对划分后的负域和边界域样本进行数据增强,再利用数据增强后的数据集继续进行训练,直到分类网络达到一个较好的分类准确率。通过实验证明了本发明方法比直接对数据集中的图片进行无差别的增强后进行训练,模型的收敛速度更快,最终的分类准确率更高。

Description

一种基于三支决策的缺陷检测数据集预处理方法
技术领域
本发明涉及缺陷检测的技术领域,尤其是指一种基于三支决策的缺陷检测数据集预处理方法。
背景技术
在生产和日常的应用过程中,由于加工、设计、机床生产设备故障和工况恶劣等因素,制造产品极易发生产品内部孔洞、凹陷和擦伤等缺陷,而在产品正常的使用过程中,由于外界的各种不可抗因素极易使产品受到腐蚀和破坏,这使得企业生产成本增加,造成巨大的资源浪费和经济损失,甚至给人们的生命安全造成巨大的伤害。相比较于人工检测的效率低,检测过程中受到主观因素影响大,某些产品的检测极易对人体健康造成损伤,采用自动缺陷检测技术优势明显,其不仅可以长时间、高精度、高效率的工作,同时还可以提高生产效率和产品质量,降低生产成本。
在缺陷检测领域中,缺陷样本数据的采集往往是一个难题,由此导致检测系统中缺陷样本数据量和正常样本数据量在分布上表现出不平衡现象。缺陷检测问题实质上可以分成两个阶段,第一阶段是对样本有无缺陷进行分类,这一阶段本质上是一个模式识别问题,已有许多方法在该问题上的应用,如基于机器学习的支持向量机、误差逆传播神经网络、相关向量机等,第二阶段是在第一阶段分类的基础上对瑕疵样本位置和大小的检测问题,该阶段使用较多的是基于深度学习的方法。
针对缺陷检测第一阶段分类问题中数据不平衡,缺陷样本数据量少的现象,目前采用较多的数据增强方法包括图像切割、翻转、灰度变换、平移、噪声添加等。这类方法并没有考虑到瑕疵样本数据和正常样本数据在特征分布上的差异,只是采用数据增强方法扩大了数据样本量,但忽略了不同样本在特征空间中的分布差异。将样本属性特征纳入考量,对不同瑕疵样本和正常样本采用不同的数据增强方法进行增强是一个值得研究的问题。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于三支决策的缺陷检测数据集预处理方法,该方法对比直接对数据集中的图片进行无差别的增强后进行训练,模型的收敛速度更快,最终的分类准确率更高,实验证明,通过该方法进行增强的数据集可以提高缺陷检测中的检测准确率。
为实现上述目的,本发明所提供的技术方案为:一种基于三支决策的缺陷检测数据集预处理方法,包括以下步骤:
1)对输入的图片进行尺寸调整,统一输入图片的尺寸为2048×905,尺寸调整的方法为双线性插值法,同时对图片像素进行归一化处理,将像素值归一化到[0,1]区间;
2)采用卷积核为3×3和1×1的卷积层、激活函数为ReLU的激活层以及池化核为2×2的池化层构建出深度为16的卷积神经网络VGG16,将步骤1)中归一化后的图片输入到卷积神经网络中,提取得到特征图;
3)将步骤2)中提取出的特征图拉伸为一维的特征向量,输入到由softmax函数构建的分类网络和用于样本所属域划分的三支决策网络中,进行样本的分类及所属域的划分;
4)根据步骤3)中分类网络的损失函数得到的损失采用随机梯度下降法对卷积神经网络中的权值进行更新调整,同时根据样本所属域划分,对数据集中的负域和边界域样本进行数据增强,得到增强后的数据集;
5)基于步骤4)中进行数据增强之后的数据集和调整后的卷积神经网络继续进行迭代训练,设定迭代次数T,不断对数据集和卷积神经网络进行更新,使得网络的损失收敛,分类准确率增加,直至迭代次数达到预设值。
在步骤1)中,进行特征归一化的方法,具体过程如下:
1.1)对训练集中的图片进行随机采样,样本集合为Ds
1.2)在样本集Ds每张样本图片中随机切割出大小为w×h的一部分,其中w,h分别表示切割部分的宽和高,切割得到的数据集表示为Dsc,计算其在R,G,B这3个通道上的均值meani和方差stdi,其中i=1,2……N,N为输入图片数量;
1.3)计算数据集Dsc在R,G,B这3个通道上的均值和方差的平均值为mean和std,利用得到的均值和方差的平均值对图片进行归一化处理,归一化的公式为:
Figure BDA0002270749150000031
其中,Xoriginal表示输入图像矩阵,Xnorm表示归一化后的图像矩阵,adjusted_std为
Figure BDA0002270749150000032
在步骤2)中,卷积神经网络VGG16的构建过程如下:
2.1)输入图片首先经过一个卷积核为3×3,步长为1,卷积核个数为64的卷积层;再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,最后到达maxpool层,即最大值池化层,将得到的特征图输入到下一层;
2.2)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为128的卷积层;再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,最后到达maxpool层,将得到的特征图输入到下一层;
2.3)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为256的卷积层;再进入到激活层,激活后再次经过两个参数设置相同的卷积和激活操作,最后到达maxpool层,将得到的特征图输入到下一层;
2.4)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为512的卷积层;再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,将输出再次进行1×1卷积,最后到达maxpool层,将得到的特征图输入到下一层;
2.5)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为512的卷积层;再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,将输出再次进行1×1卷积,最后到达maxpool层,最后输出卷积完成的特征图。
在步骤3)中,分类网络和样本所属域划分方法,具体过程如下:
3.1)将特征图拉伸成一维向量,利用两个全连接层,先将该一维向量变换到4096的维度,再额外利用一个全连接层将输出变换到2个维度,最后利用softmax进行分类;
3.2)网络训练过程中使用的损失函数为交叉熵损失,其定义如下:
Figure BDA0002270749150000041
其中,n为每个批次中的样本数量,yi为样本i的真实标签,为0或1,pi为样本i预测为正类的概率。
3.3)进行样本所属域划分时,将得到的特征图先拉伸为一维向量,再将该一维向量通过全连接层变成为512维的输出,利用该512维的特征作为图片所属域划分的基本特征,域划分的具体过程表述如下:
3.3.1)对数据集中的每个样本,采用k近邻法计算得到其k个近邻样本;
3.3.2)计算每个样本的k个近邻样本中正类样本和负类样本的数量N0(δ(x))和N1(δ(x));
3.3.3)依据样本类别及对应的正类样本和负类样本数量N0(δ(x))和N1(δ(x)),根据实体评价函数:
Figure BDA0002270749150000042
计算出每个样本的实体评价函数值f(x);
3.3.4)基于给定实体评价函数f(x),构造邻域三支决策如下:
(P)如果f(x)≥α,则x∈POS(X)
(B)如果β<f(x)<α,则x∈BND(X)
(N)如果f(x)≤β,则x∈NEG(X)
其中,α和β为事先设定的阈值,决策(P)表示当f(x)不小于α时,将样本x划分到正域POS(X);决策(B)表示当f(x)大于β且小于α时,将样本x划分到边界域BND(X);决策(N)表示当f(x)不大于β时,将样本x划分到负域NEG(X);
3.3.5)依据实体评价值f(x)和α,β的大小关系,确定每个样本所属的区域。
在步骤4)中,卷积网络所采用的权值更新方法基于随机梯度下降策略,通过对分类网络中交叉熵损失函数得到的分类损失,对各个权值求偏导,基于求导结果和学习率,对权值进行更新。
在步骤4)中,对负域和边界域样本所采用的数据增强方法包括旋转、镜像、平移和噪声添加,每次迭代过程中都将会选用其中的两种方法设定不同的参数对目标样本进行增强。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明采用卷积神经网络的方法进行图片特征的提取,卷积神经网络可以在训练过程中自适应的调整自身的权值,有效的提高网络提取图片特征的能力,增强算法的稳定性。
2、本发明的神经网络中使用ReLU激活函数,该激活函数的收敛速度快,计算复杂度低,不需要进行指数运算,方便于后向传播,有利于模型快速达到较高的分类准确率。
3、本发明采用VGG16中的一部分作为模型的主干网络,该网络的拟合能力很强,适用于复杂的非线性映射将图片的浅层语义特征和深层语义特征特征提取出来,为后面的分类任务和样本所属域的决策任务提供输入特征的支撑。
4、本发明对图像进行了归一化操作,便于输入的数据可以有效的落在激活函数梯度较好的范围内,可以帮助模型快速收敛。
5、本发明使用基于三支决策的方法对数据集中的样本进行增强,考虑了样本在特征空间中的分布,通过预先设定阈值,结合实体评价函数,将样本进行域划分,有选择性的增强了难以分类的样本,在一定程度上解决了数据集的不平衡问题。
附图说明
图1为本发明方法的训练流程图。
图2为本发明方法的模型结构图。图中conv3-64表示卷积核为3×3,输出通道数为64的卷积层,conv3-128表示卷积核为3×3,输出通道数为128的卷积层,conv3-256表示卷积核为3×3,输出通道数为256的卷积层,conv3-512表示卷积核为3×3,输出通道数为512的卷积层,conv1-512表示卷积核为1×1,输出通道数为512的卷积层,maxpool表示最大值池化层。
具体实施方式
为更加清楚地表述本发明实施例的目的、技术方案和优点,下面将结合本发明实施例中的附图来对本发明实施例中的技术方案进行全面的描述。需要指出的是本实施例仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例、本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本文采用阿里云天池举办的“2019年广东工业智造创新大赛”提供布匹数据集作为实验用数据集。布匹图片数据来自纺织工厂,该数据集共包含瑕疵图片4351张,这4351张图片中共包含15种瑕疵,瑕疵的类别名称为:沾污,错花,水印,花毛,缝头,缝头印,虫粘,破洞,褶子,织疵,漏印,蜡斑,色差,网折,其它,这15种瑕疵不平衡分布于各张瑕疵图片中。在本文的任务中,只需要进行二分类,即网络只需要对输入图片判断有无瑕疵即可,随后通过分类过程中的交叉熵损失来进行网络模型的优化,从而利用三支决策进行数据集的增强。
本文采用的评价指标为分类准确率Acc。对于二分类问题,其混淆矩阵为:
表1二分类问题的混淆矩阵
Figure BDA0002270749150000071
其中,TP表示正确预测的正类样本的个数,FN表示错误预测的正类样本的个数,FP表示错误预测的负类样本的个数,TN表示正确预测的负类样本的个数。二分类问题的分类准确率基于混淆矩阵可定义如下:
Figure BDA0002270749150000072
/>
基于三支决策的缺陷检测数据集预处理方法在本例的具体实施过程如下,如图1和图2所示,包括以下步骤:
1)将输入的图片resize到固定的尺寸2048×905,resize的方法为双线性插值法,该方法的具体过程如下:
1.1)假设原始图片尺寸为M×N,采样后图片尺寸为P×Q,确定采样倍率为:
Figure BDA0002270749150000073
Figure BDA0002270749150000074
1.2)对于待插值的点(x,y),计算其在原图上的映射(x0,y0),(x1,y0),(x0,y1),(x1,y1)其映射计算方法为:
Figure BDA0002270749150000081
Figure BDA0002270749150000082
Figure BDA0002270749150000083
Figure BDA0002270749150000084
其中,floor()表示向下取整。
1.3)首先在x方向上进行插值:
Figure BDA0002270749150000085
Figure BDA0002270749150000086
1.4)其次在y方向上进行插值:
Figure BDA0002270749150000087
2)对输入图片的像素值进行归一化,归一化的具体步骤如下:
2.1)对训练集中的图片进行随机采样,样本容量为800,样本集合为Ds
2.2)在每张样本图片中随机切割出大小为32×32的一部分,切割得到的数据集表示为Dsc,计算其在R,G,B这3个通道上的均值meani和方差stdi,其中i=1,2,……,N,N为输入图片数量。
2.3)计算数据集Dsc在R,G,B这3个通道上的均值和方差的平均值为mean和std,利用得到的均值和方差的平均值对图片进行归一化处理,归一化的公式为:
Figure BDA0002270749150000088
其中,Xoriginal表示输入图像矩阵,Xnorm表示归一化后的图像矩阵,adjusted_std为
Figure BDA0002270749150000091
其中N为输入图片数量。
3)构建卷积神经网络进行图片特征的提取,该过程的具体步骤如下:
3.1)输入图片首先经过一个卷积核为3×3,步长为1,卷积核个数为64的卷积层,再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,最后到达maxpool层,将得到的特征图输入到下一层;
3.2)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为128的卷积层,再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,最后到达maxpool层,将得到的特征图输入到下一层;
3.3)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为256的卷积层,再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,最后到达maxpool层,将得到的特征图输入到下一层;
3.4)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为512的卷积层,再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,将输出再次进行1×1卷积,最后到达maxpool层,将得到的特征图输入到下一层;
3.5)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为512的卷积层,再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,将输出再次进行1×1卷积,最后到达maxpool层,最后输出卷积完成的特征图。
4)将得到的特征图分别输入到分类网络和三支决策网络中,进行样本的分类和所属域的划分,该过程的具体步骤如下:
4.1)将得到的特征图拉伸成一维向量,利用两个全连接层,先将该一维向量变换到4096的维度,再额外利用一个全连接层将输出变换到2个维度,最后利用softmax进行分类。
4.2)网络训练过程中使用的损失函数为交叉熵损失,其定义如下:
Figure BDA0002270749150000101
其中,n为每个批次训练中的样本数量,yi为样本i的真实标签,为0或1,pi为样本i预测为正类的概率。
4.3)进行样本所属域划分时,将得到的特征图先拉伸为一维向量,再将该一维向量通过全连接层变成512维的输出,利用该512维的特征作为图片所属域划分的基本特征,域划分的具体过程可表述如下:
4.3.1)对数据集中的每个样本,采用k近邻法计算得到其k个近邻样本。
4.3.2)计算每个样本的k个近邻样本中正类样本和负类样本的数量N0(δ(x))和N1(δ(x))。
4.3.3)依据样本类别及对应的正类样本和负类样本数量N0(δ(x))和N1(δ(x)),根据实体评价函数:
Figure BDA0002270749150000102
计算出每个样本的实体评价函数值f(x);
4.3.4)基于给定的实体评价函数f(x),设定邻域三支决策规则如下:
(P)如果f(x)≥α,则x∈POS(X)
(B)如果β<f(x)<α,则x∈BND(X)
(N)如果f(x)≤β,则x∈NEG(X)
其中,α和β为事先设定的阈值,在本例中α为0.5,β为0.7。决策(P)表示当f(x)不小于α时,将样本x划分到正域POS(X);决策(B)表示当f(x)大于β且小于α时,将样本x划分到边界域BND(X);决策(N)表示当f(x)不大于β时,将样本x划分到负域NEG(X)。
4.3.5)依据实体评价函数值f(x)和α,β的大小关系,确定每个样本所属的区域。
5)依据分类网络中的交叉熵损失对卷积神经网络中的权值进行更新,同时对负域和边界域中的样本进行增强,增强的方法为旋转、镜像、平移、噪声添加等。
6)利用增强后的数据集继续进行训练,直到达到最大迭代次数T=12。
采用普通的数据增强方式对数据集中的图片进行旋转、镜像、平移、噪声添加等增强操作和使用基于三支决策的缺陷检测数据集预处理方法进行对比实验,得到实验结果如表2所示:
表2对比试验结果
数据增强方法 迭代次数 Acc
旋转、镜像、平移、噪声添加 24 92.51%
基于三支决策的数据增强 12 99.64%
综上所述,本发明针对缺陷检测数据集预处理问题,重点研究了基于三支决策的缺陷检测数据集预处理方法。该方法通过构造一个卷积神经网络来进行图片特征的提取,利用分类网络中的交叉熵损失来进行卷积神经网络权值的更新,同时利用卷积神经网络输出的特征来进行样本所属域的划分,对划分后的负域和边界域样本进行数据增强,再利用数据增强后的数据集继续进行训练,直到分类网络达到一个较好的分类准确率。通过实验证明了该数据预处理方法对比直接对数据集中的图片进行无差别的增强后进行训练,模型的收敛速度更快,最终的分类准确率更高,值得推广。
上述实施例为本发明效果较好的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种基于三支决策的缺陷检测数据集预处理方法,其特征在于,包括以下步骤:
1)对输入的图片进行尺寸调整,统一输入图片的尺寸为2048×905,尺寸调整的方法为双线性插值法,同时对图片像素进行归一化处理,将像素值归一化到[0,1]区间;
2)采用卷积核为3×3和1×1的卷积层、激活函数为ReLU的激活层以及池化核为2×2的池化层构建出深度为16的卷积神经网络VGG16,将步骤1)中归一化后的图片输入到卷积神经网络中,提取得到特征图;
3)将步骤2)中提取出的特征图拉伸为一维的特征向量,输入到由softmax函数构建的分类网络和用于样本所属域划分的三支决策网络中,进行样本的分类及所属域的划分;
分类网络和样本所属域划分方法,具体过程如下:
3.1)将得到的特征图拉伸成一维向量,利用两个全连接层,先将该一维向量变换到4096的维度,再额外利用一个全连接层将输出变换到2个维度,最后利用softmax函数进行分类;
3.2)网络训练过程中使用的损失函数为交叉熵损失,其定义如下:
Figure FDA0004001437110000011
其中,n为每个批次中的样本数量,yi为样本i的真实标签,为0或1,pi为样本i预测为正类的概率;
3.3)进行样本所属域划分时,将得到的特征图先拉伸为一维向量,再将该一维向量通过全连接层变成为512维的输出,利用该512维的特征作为图片所属域划分的基本特征,域划分的具体过程表述如下:
3.3.1)对数据集中的每个样本,采用k近邻法计算得到其k个近邻样本;
3.3.2)计算每个样本x的k个近邻样本中正类样本和负类样本的数量N0(δ(x))和N1(δ(x));
3.3.3)依据样本类别及对应的正类样本和负类样本数量N0(δ(x))和N1(δ(x)),根据实体评价函数:
Figure FDA0004001437110000021
计算出每个样本的实体评价函数值f(x);
3.3.4)基于给定实体评价函数f(x),构造邻域三支决策规则如下:
(P)如果f(x)≥α,则x∈POS(X)
(B)如果β<f(x)<α,则x∈BND(X)
(N)如果f(x)≤β,则x∈NEG(X)
其中,α和β为事先设定的阈值,决策(P)表示当f(x)不小于α时,将样本x划分到正域POS(X);决策(B)表示当f(x)大于β且小于α时,将样本x划分到边界域BND(X);决策(N)表示当f(x)不大于β时,将样本x划分到负域NEG(X);
3.3.5)依据实体评价函数值f(x)和α,β的大小关系,确定每个样本所属的区域;
4)根据步骤3)中分类网络的损失函数得到的损失采用随机梯度下降法对卷积神经网络中的权值进行更新调整,同时根据样本所属域划分,对数据集中的负域和边界域样本进行数据增强,得到增强后的数据集;
5)基于步骤4)中进行数据增强之后的数据集和调整后的卷积神经网络继续进行迭代训练,设定迭代次数T,不断对数据集和卷积神经网络进行更新调整,使得网络的损失收敛,分类准确率增加,直至迭代次数达到预设值。
2.根据权利要求1所述的一种基于三支决策的缺陷检测数据集预处理方法,其特征在于,在步骤1)中,进行特征归一化的方法,具体过程如下:
1.1)对训练集中的图片进行随机采样,样本集合为Ds
1.2)在样本集Ds每张样本图片中随机切割出大小为w×h的一部分,其中w,h分别表示切割部分的宽和高,计算其在R,G,B这3个通道上的均值meani和方差stdi,其中i=1,2……N,N为输入图片数量;
1.3)计算数据集Dsc在R,G,B这3个通道上的均值和方差的平均值为mean和std,利用得到的均值和方差的平均值对图片进行归一化处理,归一化的公式为:
Figure FDA0004001437110000031
其中,Xoriginal表示输入图像矩阵,Xnorm表示归一化后的图像矩阵,adjusted_std为
Figure FDA0004001437110000032
3.根据权利要求1所述的一种基于三支决策的缺陷检测数据集预处理方法,其特征在于,在步骤2)中,卷积神经网络VGG16的构建过程如下:
2.1)输入图片首先经过一个卷积核为3×3,步长为1,卷积核个数为64的卷积层;再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,最后到达maxpool层,将得到的特征图输入到下一层;
2.2)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为128的卷积层;再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,最后到达maxpool层,将得到的特征图输入到下一层;
2.3)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为256的卷积层;再进入到激活层,激活后再次经过两个参数设置相同的卷积和激活操作,最后到达maxpool层,将得到的特征图输入到下一层;
2.4)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为512的卷积层;再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,将输出再次进行1×1卷积,最后到达maxpool层,将得到的特征图输入到下一层;
2.5)输入的特征图经过一个卷积核为3×3,步长为1,卷积核个数为512的卷积层;再进入到激活层,激活后再次进行参数设置相同的卷积和激活操作,将输出再次进行1×1卷积,最后到达maxpool层,最后输出卷积完成的特征图。
4.根据权利要求1所述的一种基于三支决策的缺陷检测数据集预处理方法,其特征在于:在步骤4)中,卷积网络所采用的权值更新方法基于随机梯度下降策略,通过对分类网络中交叉熵损失函数得到的分类损失,对各个权值求偏导,基于求导结果和学习率,对权值进行更新。
5.根据权利要求1所述的一种基于三支决策的缺陷检测数据集预处理方法,其特征在于:在步骤4)中,对负域和边界域样本所采用的数据增强方法包括旋转、镜像、平移和噪声添加,每次迭代过程中都将会选用其中的两种方法设定不同的参数对目标样本进行增强。
CN201911104108.4A 2019-11-13 2019-11-13 一种基于三支决策的缺陷检测数据集预处理方法 Active CN111008649B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911104108.4A CN111008649B (zh) 2019-11-13 2019-11-13 一种基于三支决策的缺陷检测数据集预处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911104108.4A CN111008649B (zh) 2019-11-13 2019-11-13 一种基于三支决策的缺陷检测数据集预处理方法

Publications (2)

Publication Number Publication Date
CN111008649A CN111008649A (zh) 2020-04-14
CN111008649B true CN111008649B (zh) 2023-03-28

Family

ID=70113140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911104108.4A Active CN111008649B (zh) 2019-11-13 2019-11-13 一种基于三支决策的缺陷检测数据集预处理方法

Country Status (1)

Country Link
CN (1) CN111008649B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418522B (zh) * 2020-11-23 2022-10-11 重庆邮电大学 一种基于三支集成预测模型的工业加热炉钢温预测方法
CN112580785B (zh) * 2020-12-18 2022-04-05 河北工业大学 基于三支决策的神经网络拓扑结构优化方法
CN112613581B (zh) * 2020-12-31 2023-10-13 广州大学华软软件学院 一种图像识别方法、系统、计算机设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830242A (zh) * 2018-06-22 2018-11-16 北京航空航天大学 基于卷积神经网络的sar图像海洋目标分类检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932480B (zh) * 2018-06-08 2022-03-15 电子科技大学 基于1d-cnn的分布式光纤传感信号特征学习与分类方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830242A (zh) * 2018-06-22 2018-11-16 北京航空航天大学 基于卷积神经网络的sar图像海洋目标分类检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于不平衡分类的Bagging集成污水处理故障诊断;许玉格 等;《华南理工大学学报(自然科学版)》;20180831;第46卷(第8期);第1-2页 *

Also Published As

Publication number Publication date
CN111008649A (zh) 2020-04-14

Similar Documents

Publication Publication Date Title
CN111008649B (zh) 一种基于三支决策的缺陷检测数据集预处理方法
CN109345508B (zh) 一种基于两阶段神经网络的骨龄评价方法
CN108960245B (zh) 轮胎模具字符的检测与识别方法、装置、设备及存储介质
CN112819772B (zh) 一种高精度快速图形检测识别方法
CN109086714A (zh) 表格识别方法、识别系统及计算机装置
CN110322445B (zh) 基于最大化预测和标签间相关性损失函数的语义分割方法
CN109978848B (zh) 基于多光源颜色恒常模型检测眼底图像中硬性渗出的方法
CN107220649A (zh) 一种素色布匹缺陷检测和分类方法
CN111161222B (zh) 一种基于视觉显著性的印刷辊筒缺陷检测方法
CN111507334B (zh) 一种基于关键点的实例分割方法
CN107784288A (zh) 一种基于深度神经网络的迭代定位式人脸检测方法
Thanikkal et al. Advanced plant leaf classification through image enhancement and canny edge detection
CN111080636A (zh) 彩钢瓦表面缺陷的cnn语义分割自学习检测方法
CN110458773B (zh) 一种基于边缘增强算子的各向异性扩散噪声处理方法
CN116823725A (zh) 一种基于支持向量机的航空发动机叶片表面缺陷检测方法
CN114723010A (zh) 一种异步事件数据的自动学习增强方法及系统
CN113159159B (zh) 一种基于改进cnn的小样本图像分类方法
CN113627481A (zh) 一种面向智慧园林的多模型组合的无人机垃圾分类方法
CN111161228B (zh) 一种基于迁移学习的纽扣表面缺陷检测方法
CN109859145B (zh) 一种基于多级权重相对总变差的图像去纹理方法
CN115457296A (zh) 一种面向非平稳纹理结构属性的结构提取方法
Tian et al. Dexined-based aluminum alloy grain boundary detection algorithm
CN115937095A (zh) 融合图像处理算法和深度学习的印刷缺陷检测方法及系统
CN114862786A (zh) 基于Retinex图像增强和Ostu阈值分割的隔离带检测方法及系统
CN113989567A (zh) 垃圾图片分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant