CN113808129A - 易混淆缺陷的有效检测方法 - Google Patents

易混淆缺陷的有效检测方法 Download PDF

Info

Publication number
CN113808129A
CN113808129A CN202111253353.9A CN202111253353A CN113808129A CN 113808129 A CN113808129 A CN 113808129A CN 202111253353 A CN202111253353 A CN 202111253353A CN 113808129 A CN113808129 A CN 113808129A
Authority
CN
China
Prior art keywords
class
sample
data
clustering
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111253353.9A
Other languages
English (en)
Inventor
邱增帅
王罡
潘正颐
侯大为
倪文渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Weiyizhi Technology Co Ltd
Original Assignee
Changzhou Weiyizhi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Weiyizhi Technology Co Ltd filed Critical Changzhou Weiyizhi Technology Co Ltd
Priority to CN202111253353.9A priority Critical patent/CN113808129A/zh
Publication of CN113808129A publication Critical patent/CN113808129A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • G01N21/88Investigating the presence of flaws or contamination
    • G01N21/8851Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • G01N21/88Investigating the presence of flaws or contamination
    • G01N21/8851Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
    • G01N2021/8887Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges based on image processing techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection

Abstract

本发明公开了一种易混淆缺陷的有效检测方法,获取工业相机扫描识别后经过缺陷检测装置检测到的异色与喷砂不均缺陷数据,将异色与喷砂不均缺陷数据作为样本数据;将样本数据进行中心标准化处理,去除样本数据中特征物理量之间的单位限制,转化为无量纲的纯数值数据;使用模糊C均值聚类法对样本数据进行聚类;使用轮廓系数来评价聚类结果;以不同的聚类中心数C值作为模糊C均值聚类数,聚类结束后,将C类中样本量为1的类别判断为异色缺陷,将C类中样本量大于1的类别判断为喷砂不均缺陷。该方法在不更改现有工业相机扫描方式的前提下,提高设备检测异色与喷砂不均的准确率,具有省时省力、降低项目成本以及提高缺陷检测效率的优点。

Description

易混淆缺陷的有效检测方法
技术领域
本发明涉及缺陷检测的技术领域,尤其是一种易混淆缺陷的有效检测方法。
背景技术
在现有的工业质检技术当中,工件的缺陷检测方法通常是将工件固定在检验机台上,由工业相机在不同尺寸视野下,按照特定轨迹进行扫描识别(工业相机只能识别异常,但不能判断异常原因),并通过缺陷检测装置对扫描识别出的缺陷进行类别检测,其中大部分的缺陷可以被正确识别并检测出其所属缺陷类别。
然而,由于工业相机移动轨迹固定的原因,一些较为特殊的密集但不连续的缺陷会被工业相机分别扫描识别成多个相似的其他缺陷。工业质检标准当中,喷砂不均缺陷属于密集但不连续的缺陷类型,喷砂不均缺陷由很多不规则块状小缺陷组成并成片出现。工业相机常常将喷砂不均缺陷分别识别成多个不规则块状小缺陷,缺陷检测装置将这些多个不规则块状小缺陷判断为异色缺陷,即缺陷检测装置会将原本是一处的喷砂不均缺陷误判为多块距离紧密的异色缺陷,这导致检测结果与实际工业质检标准间存在偏差。
现有的解决方案是采用人工核对的方法将工业相机识别出的易分错缺陷逐个进行复查,并人为再次标注识别不准确的缺陷,这种方法耗费大量人力,增加项目成本,同时效率也很难提高。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
为此,本发明提出一种易混淆缺陷的有效检测方法,在不更改现有工业相机扫描方式的前提下,提高设备检测异色与喷砂不均缺陷的准确率,具有省时省力、降低项目成本以及提高缺陷检测效率的优点。
根据本发明实施例的易混淆缺陷的有效检测方法,包括以下步骤:
第1步骤、获取工业相机扫描识别后经过缺陷检测装置检测到的异色与喷砂不均缺陷数据,将异色与喷砂不均缺陷数据作为样本数据;
第2步骤、将样本数据进行中心标准化处理,去除样本数据中特征物理量之间的单位限制,转化为无量纲的纯数值数据;
第3步骤、使用模糊C均值聚类法对样本数据进行聚类;
第4步骤、使用轮廓系数来评价聚类结果:模糊C均值聚类中聚为2类时,将两类命名为A类和B类,各自类别内样本间彼此的欧式距离称为类内距离,表示为a(i);计算A、B两类中,各自类别间彼此的欧式距离称为平均类间距离,表示为b(i);
假设存在第三类O类样本,Ae与O类的平均类间距离可同理得出,取Ae与其他非A类的平均类间距离的最小值作为b(Ae);
采用轮廓系数作为评价聚类的标准,公式如下:
Figure BDA0003323096110000021
其中,s(i)表示轮廓系数;b(i)表示样本与所有非本类样本的平均类间距离;a(i)表示样本与本类所有样本的类内距离;max(a(i),b(i))表示取a(i)和b(i)中最大值;s(i)的取值范围是[-1,1],轮廓系数越接近1,该聚类数的聚类效果越好;
以A类中某样本Ae为例,则Ae的轮廓系数计算公式是:
Figure BDA0003323096110000031
其中,s(Ae)表示Ae的轮廓系数;b(Ae)表示Ae与其他非本类样本的类间距离最小值;a(Ae)表示Ae与本类所有样本的类内距离;max(a(Ae),b(Ae))表示取a(Ae)和b(Ae)中最大值;
计算样本数据中所有样本的轮廓系数平均值,那么这个平均值就是将样本数据进行模糊C均值聚类中聚为A、B两类的整体轮廓系数;
第5步骤、以不同的聚类中心数C值作为模糊C均值聚类数,其中,C∈[1,n],n表示数据样本量个数,且n是大于等于1的正整数;重复第3步骤和第4步骤,这样就得到了n个轮廓系数,选择轮廓系数最大的C值作为模糊C均值最佳聚类数进行模糊C均值聚类;聚类结束后,将C类中样本量为1的类别判断为异色缺陷,将C类中样本量大于1的类别判断为喷砂不均缺陷。
本发明的有益效果是,本发明与缺陷检测装置协同合作,叠加在缺陷检测装置之后。在满足工业现场动态需求的情况下,提高执行效率,降低已有工业相机移动轨迹和缺陷检测装置的训练成本和影响,采用易混淆缺陷的有效检测方法对特殊缺陷特殊处理,这种方法不需要耗费大量人工并且准确率高,尤其适用样本量大的情况,可辅助完成对多项目多缺陷的缺陷精准检测及划分。
进一步具体地限定,上述技术方案中,在第4步骤中,以A类中某样本Ae为例,A类内样本间彼此的欧式距离的计算公式是:
Figure BDA0003323096110000032
其中,a(Ae)表示A类内样本间彼此的欧式距离;Ae表示A类中第e个样本;Aq表示A类中第q个样本;n表示数据样本量个数,且n是大于等于1的正整数;nA表示A类数据样本量个数;Aq是除Ae以外的其他A类样本;d(Ae,Aq)表示Ae与Aq之间的欧氏距离。
进一步具体地限定,上述技术方案中,在第4步骤中,以B类中某样本Bf为例,B类内样本间彼此的欧式距离的计算公式是:
Figure BDA0003323096110000041
其中,a(Bf)表示B类内样本间彼此的欧式距离;Bf表示B类中第f个样本;Br表示B类中第r个样本;n表示数据样本量个数,且n是大于等于1的正整数;nB表示B类数据样本量个数;Br是除Bf以外的其他B类样本;d(Bf,Br)表示Bf与Br之间的欧氏距离。
进一步具体地限定,上述技术方案中,在第4步骤中,以A类中某样本Ae为例,Ae与B类的平均类间距离的计算公式是:
Figure BDA0003323096110000042
其中,b(Ae)表示A类中样本Ae与其他非A类的平均类间距离;Ae表示A类中第e个样本;Bf是B类中第f个样本;nB表示B类数据样本量个数;d(Ae,Bf)表示Ae与Bf之间的欧氏距离;f为取值范围在[1,nB]的正整数。
进一步具体地限定,上述技术方案中,在第4步骤中,a(Ae)越小,表示样本Ae越应该被分到A类当中,a(Ae)也称作Ae的类内不相似度;a(Bf)越小,表示样本Bf越应该被分到B类当中,a(Bf)也称作Bf的类内不相似度。
进一步具体地限定,上述技术方案中,在第5步骤中,C的取值集合是1、2、3、4、……、n*2/3,其中,n表示数据样本量个数,且n是大于等于1的正整数,n*2/3向上取整,重复第3步骤和第4步骤,这样就得到了n*2/3个轮廓系数,其中n*2/3向上取整。
进一步具体地限定,上述技术方案中,在第1步骤中,对样本数据集进行一致性检查,缺失值、异常值处理,检查数据有无缺失,若缺失则删除此条数据,检查数值是否在实际特征物理量取值范围之内,若超出范围则删除此条数据。
进一步具体地限定,上述技术方案中,在第2步骤中,对某特征物理量序列z1、z2、z3、......、zn进行标准化转换,其中,n表示数据样本量个数,且n是大于等于1的正整数,中心标准化处理的计算公式是:
Figure BDA0003323096110000051
其中,yi表示中心标准化转换后的特征物理量;i为取值范围在[1,n]的正整数;z表示某个特征物理量;zi表示某特征物理量第i个数值;
Figure BDA0003323096110000052
表示特征物理量序列z的均值;σ表示标准差;
中心标准化后的某特征物理量序列为y1、y2、y3、......、yn,去除标准差σ为0的特征物理量。
进一步具体地限定,上述技术方案中,特征物理量序列z的均值
Figure BDA0003323096110000053
的计算公式是:
Figure BDA0003323096110000054
其中,n表示数据样本量个数,且n是大于等于1的正整数;zi表示某特征物理量第i个数值。
进一步具体地限定,上述技术方案中,标准差σ的计算公式是:
Figure BDA0003323096110000061
其中,n表示数据样本量个数,且n是大于等于1的正整数;zi表示某特征物理量第i个数值;
Figure BDA0003323096110000062
表示特征物理量序列z的均值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明检测方法的流程图;
图2是聚类的流程图;
图3是工业相机拍摄并由算法识别的缺陷示意图;
图4是聚类中心数C值等于2时的模糊C均值聚类结果示意图;
图5是聚类中心数C值等于3时的模糊C均值聚类结果示意图;
图6是聚类中心数C值等于5时的模糊C均值聚类结果示意图;
图7是以不同聚类中心数C值进行模糊C均值聚类的轮廓系数分布图。
具体实施方式
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
见图1和图2,本发明的一种易混淆缺陷的有效检测方法,包括以下步骤:
第1步骤、获取工业相机扫描识别后经过缺陷检测装置检测到的异色与喷砂不均缺陷数据,将异色与喷砂不均缺陷数据作为样本数据,由于无法完全信赖缺陷检测装置的检测结果,所以样本数据中没有区分缺陷类别的标签,只保留样本特征物理量,对样本数据集进行一致性检查,缺失值、异常值处理,检查数据有无缺失,若缺失则删除此条数据,检查数值是否在实际特征物理量取值范围之内,若超出范围则删除此条数据。
第2步骤、将样本数据进行中心标准化处理,去除样本数据中特征物理量之间的单位限制,转化为无量纲的纯数值数据,以便于不同特征物理量之间能够进行比较和加权;对某特征物理量序列z1、z2、z3、......、zn进行标准化转换,其中,n表示数据样本量个数,且n是大于等于1的正整数,中心标准化处理的计算公式是:
Figure BDA0003323096110000071
其中,yi表示中心标准化转换后的特征物理量;i为取值范围在[1,n]的正整数;z表示某个特征物理量;zi表示某特征物理量第i个数值;
Figure BDA0003323096110000072
表示特征物理量序列z的均值;σ表示标准差;
Figure BDA0003323096110000073
Figure BDA0003323096110000074
中心标准化后的某特征物理量序列为y1、y2、y3、......、yn,去除标准差σ为0的特征物理量,标准差σ为0表示该特征物理量在数据集中每一条数据上的表现相同(数值保持不变),则该特征物理量为冗余特征,做删除处理。
第3步骤、使用模糊C均值聚类法对样本数据进行聚类,其原理是对每个样本和每个簇赋予一个权值(权值表示指定样本属于该簇的程度),每个样本在哪个类的权值最大则归为哪个类,权值取值范围在[0,1]之间,越接近于1表示权值越大,越接近于0表示权值越小,对样本数据进行模糊C均值聚类法聚类之前需要确定聚类的簇数m和聚类中心数C,其中m是取值范围在[1,∞)的正整数,但通常设置簇数m的参数为2。首先选择簇数m=2和聚类中心数C=2进行模糊C均值聚类法聚类。聚类方法的具体步骤如下:
第3.1步骤、随机生成n*C的权值矩阵U(0);由于样本数据已做中心标准化处理,所以权值矩阵U(0)中的随机数值分布在[0,1]之间;n表示数据样本量个数,且n是大于等于1的正整数;C表示聚类中心数,取值范围在[2,p]的正整数,p为样本数据的特征个数,且p是大于等于1的正整数;U(0)中U表示权值矩阵,U(0)中的0表示该权值矩阵值为初始随机值,即第0次迭代;权值矩阵U(t)的公式如下:
Figure BDA0003323096110000081
其中,t表示第t次迭代,且t∈[0,∞);u11表示第一个样本的第一个聚类中心;u12表示第一个样本的第二个聚类中心;u13表示第一个样本的第三个聚类中心;u1c表示第一个样本的第c个聚类中心;u21表示第二个样本的第一个聚类中心;u22表示第二个样本的第二个聚类中心;u23表示第二个样本的第三个聚类中心;u2c表示第二个样本的第c个聚类中心;u31表示第三个样本的第一个聚类中心;u32表示第三个样本的第二个聚类中心;u33表示第三个样本的第三个聚类中心;u3c表示第三个样本的第c个聚类中心;un1表示第n个样本的第一个聚类中心;un2表示第n个样本的第二个聚类中心;un3表示第n个样本的第三个聚类中心;unc表示第n个样本的第c个聚类中心。
第3.2步骤、计算第j个聚类中心cj;cj的计算公式是:
Figure BDA0003323096110000091
其中,cj表示第j个聚类中心,j∈[1,p],p为样本数据的特征个数,且p是大于等于1的正整数;xi表示第i个样本,i∈[1,n],n表示数据样本量个数,且n是大于等于1的正整数;uij表示样本xi属于第j个聚类中心的权值;
Figure BDA0003323096110000092
表示样本xi属于第j个聚类中心的隶属度(即权值)的m次幂;uij的值从权值矩阵U中获取;m表示聚类的簇数;其中,
Figure BDA0003323096110000093
第3.3步骤、重新计算权值矩阵U,记为U(t),表示第t次迭代;权值矩阵U(t)的各权值计算方法是:
Figure BDA0003323096110000101
其中,uij表示样本xi属于第j个聚类中心的权值;C表示聚类中心的数量;cj表示第j个聚类中心,j∈[1,p],p为样本数据的特征个数,且p是大于等于1的正整数;ck表示第k个聚类中心,k∈[1,p],p为样本数据的特征个数,且p是大于等于1的正整数;d(xi,cj)表示样本xi到第j个聚类中心的欧氏距离;d(xi,ck)表示样本xi到第k个聚类中心的欧氏距离;以样本g和样本h为例,欧氏距离(Euclidean Distance)计算方法是:
Figure BDA0003323096110000102
其中,p为样本数据的特征个数,且p是大于等于1的正整数;l表示第l个特征,l∈[1,p],l为正整数;d(g,h)表示样本g(g1,g2,g3,...,gp)到样本h(h1,h2,h3,...,hp)的欧式距离。
第3.4步骤、计算本次迭代的误差平方和(Sum of the Squared Errors,简称SSE),当误差平方和相对较小时,则达到较优聚类结果;误差平方和的计算公式是:
Figure BDA0003323096110000103
其中,
Figure BDA0003323096110000104
表示样本xi属于第j个聚类中心的隶属度(即权值)的m次幂;d(xi,cj)表示样本xi到第j个聚类中心的欧氏距离。
第3.5步骤、重复第3.1步骤、第3.2步骤、第3.3步骤以及第3.4步骤,迭代计算聚类中心cj和权值矩阵U(t),迭代至SSE(t+1)与SSE(t)的结果几乎相同时,SSE(t+1)表示第t+1次迭代,SSE(t)表示第t次迭代,取第t次迭代中C个聚类中心和n*C的权值矩阵,根据第t次迭代后的权值矩阵按照模糊集合中的最大隶属原则确定每个样本的归属类别。这样就能确定在聚类中心C=2时样本数据集中每个样本所属的类别。
第4步骤、使用轮廓系数来评价聚类结果:模糊C均值聚类中聚为2类时(C=2),将两类命名为A类和B类,各自类别内样本间彼此的欧式距离称为类内距离,表示为a(i),以A类中某样本Ae为例,计算公式是:
Figure BDA0003323096110000111
其中,a(Ae)表示A类内样本间彼此的欧式距离;Ae表示A类中第e个样本;Aq表示A类中第q个样本;n表示数据样本量个数,且n是大于等于1的正整数;nA表示A类数据样本量个数;Aq是除Ae以外的其他A类样本;d(Ae,Aq)表示Ae与Aq之间的欧氏距离;a(Ae)越小,表示样本Ae越应该被分到A类当中,a(Ae)也称作Ae的类内不相似度;
同理,以B类中某样本Bf为例,计算公式是:
Figure BDA0003323096110000112
其中,a(Bf)表示B类内样本间彼此的欧式距离;Bf表示B类中第f个样本;Br表示B类中第r个样本;n表示数据样本量个数,且n是大于等于1的正整数;nB表示B类数据样本量个数;Br是除Bf以外的其他B类样本;d(Bf,Br)表示Bf与Br之间的欧氏距离;a(Bf)越小,表示样本Bf越应该被分到B类当中,a(Bf)也称作Bf的类内不相似度;
计算A、B两类中,各自类别间彼此的欧式距离称为平均类间距离,表示为b(i),以A类中某样本Ae为例,Ae与B类的平均类间距离的计算公式是:
Figure BDA0003323096110000121
其中,b(Ae)表示A类中样本Ae与其他非A类的平均类间距离;Ae表示A类中第e个样本;Bf是B类中第f个样本;nB表示B类数据样本量个数;d(Ae,Bf)表示Ae与Bf之间的欧氏距离;f为取值范围在[1,nB]的正整数;
假设存在第三类O类样本,Ae与O类的平均类间距离可同理得出,在Ae与B类的平均类间距离、Ae与O类的平均类间距离中,取Ae与其他非A类的平均类间距离的最小值作为b(Ae);
采用轮廓系数作为评价聚类的标准,公式如下:
Figure BDA0003323096110000122
其中,s(i)表示轮廓系数;b(i)表示样本与所有非本类样本的平均类间距离;a(i)表示样本与本类所有样本的类内距离;max(a(i),b(i))表示取a(i)和b(i)中最大值;s(i)的取值范围是[-1,1],轮廓系数越接近1,该聚类数的聚类效果越好;
以A类中某样本Ae为例,则Ae的轮廓系数计算公式是:
Figure BDA0003323096110000123
其中,s(Ae)表示Ae的轮廓系数;b(Ae)表示Ae与其他非本类样本的类间距离最小值;a(Ae)表示Ae与本类所有样本的类内距离;max(a(Ae),b(Ae))表示取a(Ae)和b(Ae)中最大值;
计算样本数据中所有样本的轮廓系数平均值,那么这个平均值就是将样本数据进行模糊C均值聚类中聚为A、B两类的整体轮廓系数。
第5步骤、以不同的聚类中心数C值作为模糊C均值聚类数,其中,C∈[1,n],n表示数据样本量个数,且n是大于等于1的正整数;重复第3步骤和第4步骤,这样就得到了n个轮廓系数,选择轮廓系数最大的C值作为模糊C均值最佳聚类数进行模糊C均值聚类;聚类结束后,将C类中样本量为1的类别判断为异色缺陷,将C类中样本量大于1的类别判断为喷砂不均缺陷。需要说明的是,在不确定最佳聚类数时,C的值可以是[1,n]以内的任意值;为了提高工作效率,选取[1,n*2/3]的聚类数分别进行评估,具体地,C的取值集合是1、2、3、4、……、n*2/3,其中,n表示数据样本量个数,且n是大于等于1的正整数,n*2/3向上取整,重复第3步骤和第4步骤,这样就得到了n*2/3个轮廓系数,其中n*2/3向上取整。
异色与喷砂不均的缺陷非常相似,区别在于异色是单独一块缺陷,而喷砂不均是一片紧密但可能不连续的多块类异色缺陷聚集在一起,所以,聚类后样本量不为1的类别属于喷砂不均,并且符合喷砂不均的形态,这样,易混淆缺陷就可以被检测出,该方法叠加在缺陷检测装置之后,不影响缺陷检测装置对其他缺陷的检出结果,只单独对异色与喷砂不均缺陷进行再次检测判断,提升效率的同时,减少了人工参与的成本。
见图3,使用工业相机拍摄的某一个工件部位。其中,白色矩形框是工业相机逐个标注的缺陷,并且被缺陷检测装置全部识别为异色缺陷。图中可以明显看出由于工业相机逐个标注的原因,标注处理后的缺陷部位很难准确判断缺陷所属类型。左上角和右下角两处缺陷紧密聚集的区域是两处喷砂不均缺陷(工业质检标准),图片其余三处缺陷是异色缺陷(工业质检标准)。原本是一整片喷砂不均的缺陷被分开标注处理,这可能导致检出结果有偏差。
见图4、图5和图6,当C=5时,模糊C均值聚类结果里样本大于1的类别是喷砂不均缺陷,样本数量为1的类别是异色缺陷。这说明模糊C均值聚类法聚为5类时,异色与喷砂不均缺陷可以被区分开。
见图7,该图为C分别等于2、3、4、5、6时,模糊C均值聚类的轮廓系数示意图。图中可以明显看出,当簇数为2时,轮廓系数在0.35~0.4之间;当簇数为3时,轮廓系数为0.45;当簇数为4时,轮廓系数在0.45~0.5之间;当簇数为5时,轮廓系数在0.55~0.6之间;当簇数为6时,轮廓系数在0.4~0.45之间。显然,当C=2时,聚类效果较差;当C=5时,聚类效果呈现比较好的状态,轮廓系数最高。所以选择将数据聚为5类,且聚类后的每个类的样本量,都符合异色与喷砂不均缺陷分布形态。这说明本发明的易混淆缺陷的有效检测方法可以在不更改现有工业相机扫描方式的前提下,有效地提高设备检测异色与喷砂不均缺陷的准确率,克服现阶段依赖人工核查工业相机拍摄结果的桎梏。
本发明与缺陷检测装置协同合作,叠加在缺陷检测装置之后。在满足工业现场动态需求的情况下,提高执行效率,降低已有工业相机移动轨迹和缺陷检测装置的训练成本和影响,采用易混淆缺陷的有效检测方法对特殊缺陷特殊处理,这种方法不需要耗费大量人工并且准确率高,尤其适用样本量大的情况,可辅助完成对多项目多缺陷的缺陷精准检测及划分。
本发明的易混淆缺陷的有效检测方法充分迎合了工业现场工业相机特定移动轨迹和庞大缺陷检测装置导致异色与喷砂不均缺陷类别检测不准确的情况。在无法改变工业相机现有移动轨迹的情况下,异色缺陷的表现形态与部分喷砂不均缺陷十分相似,单独对比时缺陷检测装置很难将缺陷区分开。因此引入了本发明的易混淆缺陷的有效检测方法,将工业相机标注的每一处缺陷都作为一条数据,使用这些数据进行不同类别数的模糊C均值聚类。以轮廓系数作为评价标准选出聚类效果比较好的类别数进行聚类,这样聚类结束后每个类别都是一处缺陷,数据量为1的类别数是异色缺陷,数据量大于1的类别数则是喷砂不均缺陷,以此来达到异色与喷砂不均缺陷分类的目的。这极大地降低了现有缺陷检测装置的训练成本和影响,在不破坏缺陷检测装置的前提下提升了工业现场准确率及执行效率。
以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种易混淆缺陷的有效检测方法,其特征在于,包括以下步骤:
第1步骤、获取工业相机扫描识别后经过缺陷检测装置检测到的异色与喷砂不均缺陷数据,将异色与喷砂不均缺陷数据作为样本数据;
第2步骤、将样本数据进行中心标准化处理,去除样本数据中特征物理量之间的单位限制,转化为无量纲的纯数值数据;
第3步骤、使用模糊C均值聚类法对样本数据进行聚类;
第4步骤、使用轮廓系数来评价聚类结果:模糊C均值聚类中聚为2类时,将两类命名为A类和B类,各自类别内样本间彼此的欧式距离称为类内距离,表示为a(i);计算A、B两类中,各自类别间彼此的欧式距离称为平均类间距离,表示为b(i);
假设存在第三类O类样本,Ae与O类的平均类间距离可同理得出,取Ae与其他非A类的平均类间距离的最小值作为b(Ae);
采用轮廓系数作为评价聚类的标准,公式如下:
Figure FDA0003323096100000011
其中,s(i)表示轮廓系数;b(i)表示样本与所有非本类样本的平均类间距离;a(i)表示样本与本类所有样本的类内距离;max(a(i),b(i))表示取a(i)和b(i)中最大值;s(i)的取值范围是[-1,1],轮廓系数越接近1,该聚类数的聚类效果越好;
以A类中某样本Ae为例,则Ae的轮廓系数计算公式是:
Figure FDA0003323096100000012
其中,s(Ae)表示Ae的轮廓系数;b(Ae)表示Ae与其他非本类样本的类间距离最小值;a(Ae)表示Ae与本类所有样本的类内距离;max(a(Ae),b(Ae))表示取a(Ae)和b(Ae)中最大值;
计算样本数据中所有样本的轮廓系数平均值,那么这个平均值就是将样本数据进行模糊C均值聚类中聚为A、B两类的整体轮廓系数;
第5步骤、以不同的聚类中心数C值作为模糊C均值聚类数,其中,C∈[1,n],n表示数据样本量个数,且n是大于等于1的正整数;重复第3步骤和第4步骤,这样就得到了n个轮廓系数,选择轮廓系数最大的C值作为模糊C均值最佳聚类数进行模糊C均值聚类;聚类结束后,将C类中样本量为1的类别判断为异色缺陷,将C类中样本量大于1的类别判断为喷砂不均缺陷。
2.根据权利要求1所述的易混淆缺陷的有效检测方法,其特征在于:在第4步骤中,以A类中某样本Ae为例,A类内样本间彼此的欧式距离的计算公式是:
Figure FDA0003323096100000021
其中,a(Ae)表示A类内样本间彼此的欧式距离;Ae表示A类中第e个样本;Aq表示A类中第q个样本;n表示数据样本量个数,且n是大于等于1的正整数;nA表示A类数据样本量个数;Aq是除Ae以外的其他A类样本;d(Ae,Aq)表示Ae与Aq之间的欧氏距离。
3.根据权利要求2所述的易混淆缺陷的有效检测方法,其特征在于:在第4步骤中,以B类中某样本Bf为例,B类内样本间彼此的欧式距离的计算公式是:
Figure FDA0003323096100000031
其中,a(Bf)表示B类内样本间彼此的欧式距离;Bf表示B类中第f个样本;Br表示B类中第r个样本;n表示数据样本量个数,且n是大于等于1的正整数;nB表示B类数据样本量个数;Br是除Bf以外的其他B类样本;d(Bf,Br)表示Bf与Br之间的欧氏距离。
4.根据权利要求3所述的易混淆缺陷的有效检测方法,其特征在于:在第4步骤中,以A类中某样本Ae为例,Ae与B类的平均类间距离的计算公式是:
Figure FDA0003323096100000032
其中,b(Ae)表示A类中样本Ae与其他非A类的平均类间距离;Ae表示A类中第e个样本;Bf是B类中第f个样本;nB表示B类数据样本量个数;d(Ae,Bf)表示Ae与Bf之间的欧氏距离;f为取值范围在[1,nB]的正整数。
5.根据权利要求4所述的易混淆缺陷的有效检测方法,其特征在于:在第4步骤中,a(Ae)越小,表示样本Ae越应该被分到A类当中,a(Ae)也称作Ae的类内不相似度;a(Bf)越小,表示样本Bf越应该被分到B类当中,a(Bf)也称作Bf的类内不相似度。
6.根据权利要求1所述的易混淆缺陷的有效检测方法,其特征在于:在第5步骤中,C的取值集合是1、2、3、4、……、n*2/3,其中,n表示数据样本量个数,且n是大于等于1的正整数,n*2/3向上取整,重复第3步骤和第4步骤,这样就得到了n*2/3个轮廓系数,其中n*2/3向上取整。
7.根据权利要求1所述的易混淆缺陷的有效检测方法,其特征在于:在第1步骤中,对样本数据集进行一致性检查,缺失值、异常值处理,检查数据有无缺失,若缺失则删除此条数据,检查数值是否在实际特征物理量取值范围之内,若超出范围则删除此条数据。
8.根据权利要求1所述的易混淆缺陷的有效检测方法,其特征在于:在第2步骤中,对某特征物理量序列z1、z2、z3、......、zn进行标准化转换,其中,n表示数据样本量个数,且n是大于等于1的正整数,中心标准化处理的计算公式是:
Figure FDA0003323096100000041
其中,yi表示中心标准化转换后的特征物理量;i为取值范围在[1,n]的正整数;z表示某个特征物理量;zi表示某特征物理量第i个数值;
Figure FDA0003323096100000042
表示特征物理量序列z的均值;σ表示标准差;
中心标准化后的某特征物理量序列为y1、y2、y3、......、yn,去除标准差σ为0的特征物理量。
9.根据权利要求8所述的易混淆缺陷的有效检测方法,其特征在于:特征物理量序列z的均值
Figure FDA0003323096100000043
的计算公式是:
Figure FDA0003323096100000044
其中,n表示数据样本量个数,且n是大于等于1的正整数;zi表示某特征物理量第i个数值。
10.根据权利要求8所述的易混淆缺陷的有效检测方法,其特征在于:标准差σ的计算公式是:
Figure FDA0003323096100000051
其中,n表示数据样本量个数,且n是大于等于1的正整数;zi表示某特征物理量第i个数值;
Figure FDA0003323096100000052
表示特征物理量序列z的均值。
CN202111253353.9A 2021-10-27 2021-10-27 易混淆缺陷的有效检测方法 Pending CN113808129A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111253353.9A CN113808129A (zh) 2021-10-27 2021-10-27 易混淆缺陷的有效检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111253353.9A CN113808129A (zh) 2021-10-27 2021-10-27 易混淆缺陷的有效检测方法

Publications (1)

Publication Number Publication Date
CN113808129A true CN113808129A (zh) 2021-12-17

Family

ID=78937869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111253353.9A Pending CN113808129A (zh) 2021-10-27 2021-10-27 易混淆缺陷的有效检测方法

Country Status (1)

Country Link
CN (1) CN113808129A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723751A (zh) * 2022-06-07 2022-07-08 中国空气动力研究与发展中心设备设计与测试技术研究所 一种基于无监督的带钢表面缺陷在线检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723751A (zh) * 2022-06-07 2022-07-08 中国空气动力研究与发展中心设备设计与测试技术研究所 一种基于无监督的带钢表面缺陷在线检测方法
CN114723751B (zh) * 2022-06-07 2022-09-23 中国空气动力研究与发展中心设备设计与测试技术研究所 一种基于无监督的带钢表面缺陷在线检测方法

Similar Documents

Publication Publication Date Title
CN109376792B (zh) 基于多通道残差神经网络的光伏电池外观缺陷分类方法
CN109977808B (zh) 一种晶圆表面缺陷模式检测与分析方法
CN111179251B (zh) 基于孪生神经网络利用模板比对的缺陷检测系统及方法
CN109829914B (zh) 检测产品缺陷的方法和装置
CN113838054B (zh) 基于人工智能的机械零件表面损伤检测方法
CN111724335A (zh) 检测方法及检测系统
CN111311576A (zh) 基于点云信息的缺陷检测方法
CN114910480A (zh) 一种基于机器视觉的晶圆表面缺陷检测方法
CN111950654B (zh) 基于svm分类的魔方色块颜色还原方法
KR100960543B1 (ko) 미지 품질의 패턴을 사용하여 기준 이미지를 생성하기 위한시스템 및 방법
CN115861307B (zh) 基于人工智能的筋膜枪供电驱动板焊接故障检测方法
CN112561849A (zh) 晶圆缺陷检测方法
CN115456955A (zh) 一种球笼防尘罩内部毛刺缺陷检测方法
Chavan et al. Quality control of PCB using image processing
CN114594114A (zh) 一种锂电芯全自动在线无损检测方法
CN113808129A (zh) 易混淆缺陷的有效检测方法
CN115272350A (zh) 一种计算机pcb主板生产质量检测方法
CN116152242A (zh) 一种篮球用天然皮革缺陷可视化检测系统
CN114897881A (zh) 一种基于边缘特征的晶粒缺陷检测方法
CN113516619A (zh) 一种基于图像处理技术的产品表面瑕疵识别方法
CN112561875A (zh) 一种基于人工智能的光伏电池板粗栅检测方法
CN110349119B (zh) 基于边缘检测神经网络的路面病害检测方法和装置
CN115082449B (zh) 一种电子元器件缺陷检测方法
CN113689432B (zh) 识别特殊点状类缺陷的检测方法
CN113780488A (zh) 基于位置聚合程度的刮伤与擦伤缺陷检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination