CN113808129A

CN113808129A - 易混淆缺陷的有效检测方法

Info

Publication number: CN113808129A
Application number: CN202111253353.9A
Authority: CN
Inventors: 邱增帅; 王罡; 潘正颐; 侯大为; 倪文渊
Original assignee: Changzhou Weiyizhi Technology Co Ltd
Current assignee: Changzhou Weiyizhi Technology Co Ltd
Priority date: 2021-10-27
Filing date: 2021-10-27
Publication date: 2021-12-17

Abstract

本发明公开了一种易混淆缺陷的有效检测方法，获取工业相机扫描识别后经过缺陷检测装置检测到的异色与喷砂不均缺陷数据，将异色与喷砂不均缺陷数据作为样本数据；将样本数据进行中心标准化处理，去除样本数据中特征物理量之间的单位限制，转化为无量纲的纯数值数据；使用模糊C均值聚类法对样本数据进行聚类；使用轮廓系数来评价聚类结果；以不同的聚类中心数C值作为模糊C均值聚类数，聚类结束后，将C类中样本量为1的类别判断为异色缺陷，将C类中样本量大于1的类别判断为喷砂不均缺陷。该方法在不更改现有工业相机扫描方式的前提下，提高设备检测异色与喷砂不均的准确率，具有省时省力、降低项目成本以及提高缺陷检测效率的优点。

Description

易混淆缺陷的有效检测方法

技术领域

本发明涉及缺陷检测的技术领域，尤其是一种易混淆缺陷的有效检测方法。

背景技术

在现有的工业质检技术当中，工件的缺陷检测方法通常是将工件固定在检验机台上，由工业相机在不同尺寸视野下，按照特定轨迹进行扫描识别(工业相机只能识别异常，但不能判断异常原因)，并通过缺陷检测装置对扫描识别出的缺陷进行类别检测，其中大部分的缺陷可以被正确识别并检测出其所属缺陷类别。

然而，由于工业相机移动轨迹固定的原因，一些较为特殊的密集但不连续的缺陷会被工业相机分别扫描识别成多个相似的其他缺陷。工业质检标准当中，喷砂不均缺陷属于密集但不连续的缺陷类型，喷砂不均缺陷由很多不规则块状小缺陷组成并成片出现。工业相机常常将喷砂不均缺陷分别识别成多个不规则块状小缺陷，缺陷检测装置将这些多个不规则块状小缺陷判断为异色缺陷，即缺陷检测装置会将原本是一处的喷砂不均缺陷误判为多块距离紧密的异色缺陷，这导致检测结果与实际工业质检标准间存在偏差。

现有的解决方案是采用人工核对的方法将工业相机识别出的易分错缺陷逐个进行复查，并人为再次标注识别不准确的缺陷，这种方法耗费大量人力，增加项目成本，同时效率也很难提高。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。

为此，本发明提出一种易混淆缺陷的有效检测方法，在不更改现有工业相机扫描方式的前提下，提高设备检测异色与喷砂不均缺陷的准确率，具有省时省力、降低项目成本以及提高缺陷检测效率的优点。

根据本发明实施例的易混淆缺陷的有效检测方法，包括以下步骤：

第1步骤、获取工业相机扫描识别后经过缺陷检测装置检测到的异色与喷砂不均缺陷数据，将异色与喷砂不均缺陷数据作为样本数据；

第2步骤、将样本数据进行中心标准化处理，去除样本数据中特征物理量之间的单位限制，转化为无量纲的纯数值数据；

第3步骤、使用模糊C均值聚类法对样本数据进行聚类；

第4步骤、使用轮廓系数来评价聚类结果：模糊C均值聚类中聚为2类时，将两类命名为A类和B类，各自类别内样本间彼此的欧式距离称为类内距离，表示为a(i)；计算A、B两类中，各自类别间彼此的欧式距离称为平均类间距离，表示为b(i)；

假设存在第三类O类样本，A_e与O类的平均类间距离可同理得出，取A_e与其他非A类的平均类间距离的最小值作为b(A_e)；

采用轮廓系数作为评价聚类的标准，公式如下：

其中，s(i)表示轮廓系数；b(i)表示样本与所有非本类样本的平均类间距离；a(i)表示样本与本类所有样本的类内距离；max(a(i),b(i))表示取a(i)和b(i)中最大值；s(i)的取值范围是[-1,1]，轮廓系数越接近1，该聚类数的聚类效果越好；

以A类中某样本A_e为例，则A_e的轮廓系数计算公式是：

其中，s(A_e)表示A_e的轮廓系数；b(A_e)表示A_e与其他非本类样本的类间距离最小值；a(A_e)表示A_e与本类所有样本的类内距离；max(a(A_e),b(A_e))表示取a(A_e)和b(A_e)中最大值；

计算样本数据中所有样本的轮廓系数平均值，那么这个平均值就是将样本数据进行模糊C均值聚类中聚为A、B两类的整体轮廓系数；

第5步骤、以不同的聚类中心数C值作为模糊C均值聚类数，其中，C∈[1,n]，n表示数据样本量个数，且n是大于等于1的正整数；重复第3步骤和第4步骤，这样就得到了n个轮廓系数，选择轮廓系数最大的C值作为模糊C均值最佳聚类数进行模糊C均值聚类；聚类结束后，将C类中样本量为1的类别判断为异色缺陷，将C类中样本量大于1的类别判断为喷砂不均缺陷。

本发明的有益效果是，本发明与缺陷检测装置协同合作，叠加在缺陷检测装置之后。在满足工业现场动态需求的情况下，提高执行效率，降低已有工业相机移动轨迹和缺陷检测装置的训练成本和影响，采用易混淆缺陷的有效检测方法对特殊缺陷特殊处理，这种方法不需要耗费大量人工并且准确率高，尤其适用样本量大的情况，可辅助完成对多项目多缺陷的缺陷精准检测及划分。

进一步具体地限定，上述技术方案中，在第4步骤中，以A类中某样本A_e为例，A类内样本间彼此的欧式距离的计算公式是：

其中，a(A_e)表示A类内样本间彼此的欧式距离；A_e表示A类中第e个样本；A_q表示A类中第q个样本；n表示数据样本量个数，且n是大于等于1的正整数；n_A表示A类数据样本量个数；A_q是除A_e以外的其他A类样本；d(A_e,A_q)表示A_e与A_q之间的欧氏距离。

进一步具体地限定，上述技术方案中，在第4步骤中，以B类中某样本B_f为例，B类内样本间彼此的欧式距离的计算公式是：

其中，a(B_f)表示B类内样本间彼此的欧式距离；B_f表示B类中第f个样本；B_r表示B类中第r个样本；n表示数据样本量个数，且n是大于等于1的正整数；n_B表示B类数据样本量个数；B_r是除B_f以外的其他B类样本；d(B_f,B_r)表示B_f与B_r之间的欧氏距离。

进一步具体地限定，上述技术方案中，在第4步骤中，以A类中某样本A_e为例，A_e与B类的平均类间距离的计算公式是：

其中，b(A_e)表示A类中样本A_e与其他非A类的平均类间距离；A_e表示A类中第e个样本；B_f是B类中第f个样本；n_B表示B类数据样本量个数；d(A_e,B_f)表示A_e与B_f之间的欧氏距离；f为取值范围在[1,n_B]的正整数。

进一步具体地限定，上述技术方案中，在第4步骤中，a(A_e)越小，表示样本A_e越应该被分到A类当中，a(A_e)也称作A_e的类内不相似度；a(B_f)越小，表示样本B_f越应该被分到B类当中，a(B_f)也称作B_f的类内不相似度。

进一步具体地限定，上述技术方案中，在第5步骤中，C的取值集合是1、2、3、4、……、n*2/3，其中，n表示数据样本量个数，且n是大于等于1的正整数，n*2/3向上取整，重复第3步骤和第4步骤，这样就得到了n*2/3个轮廓系数，其中n*2/3向上取整。

进一步具体地限定，上述技术方案中，在第1步骤中，对样本数据集进行一致性检查，缺失值、异常值处理，检查数据有无缺失，若缺失则删除此条数据，检查数值是否在实际特征物理量取值范围之内，若超出范围则删除此条数据。

进一步具体地限定，上述技术方案中，在第2步骤中，对某特征物理量序列z₁、z₂、z₃、......、z_n进行标准化转换，其中，n表示数据样本量个数，且n是大于等于1的正整数，中心标准化处理的计算公式是：

其中，y_i表示中心标准化转换后的特征物理量；i为取值范围在[1,n]的正整数；z表示某个特征物理量；z_i表示某特征物理量第i个数值；

表示特征物理量序列z的均值；σ表示标准差；

中心标准化后的某特征物理量序列为y₁、y₂、y₃、......、y_n，去除标准差σ为0的特征物理量。

进一步具体地限定，上述技术方案中，特征物理量序列z的均值

的计算公式是：

其中，n表示数据样本量个数，且n是大于等于1的正整数；z_i表示某特征物理量第i个数值。

进一步具体地限定，上述技术方案中，标准差σ的计算公式是：

其中，n表示数据样本量个数，且n是大于等于1的正整数；z_i表示某特征物理量第i个数值；

表示特征物理量序列z的均值。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明检测方法的流程图；

图2是聚类的流程图；

图3是工业相机拍摄并由算法识别的缺陷示意图；

图4是聚类中心数C值等于2时的模糊C均值聚类结果示意图；

图5是聚类中心数C值等于3时的模糊C均值聚类结果示意图；

图6是聚类中心数C值等于5时的模糊C均值聚类结果示意图；

图7是以不同聚类中心数C值进行模糊C均值聚类的轮廓系数分布图。

具体实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

见图1和图2，本发明的一种易混淆缺陷的有效检测方法，包括以下步骤：

第1步骤、获取工业相机扫描识别后经过缺陷检测装置检测到的异色与喷砂不均缺陷数据，将异色与喷砂不均缺陷数据作为样本数据，由于无法完全信赖缺陷检测装置的检测结果，所以样本数据中没有区分缺陷类别的标签，只保留样本特征物理量，对样本数据集进行一致性检查，缺失值、异常值处理，检查数据有无缺失，若缺失则删除此条数据，检查数值是否在实际特征物理量取值范围之内，若超出范围则删除此条数据。

第2步骤、将样本数据进行中心标准化处理，去除样本数据中特征物理量之间的单位限制，转化为无量纲的纯数值数据，以便于不同特征物理量之间能够进行比较和加权；对某特征物理量序列z₁、z₂、z₃、......、z_n进行标准化转换，其中，n表示数据样本量个数，且n是大于等于1的正整数，中心标准化处理的计算公式是：

表示特征物理量序列z的均值；σ表示标准差；

中心标准化后的某特征物理量序列为y₁、y₂、y₃、......、y_n，去除标准差σ为0的特征物理量，标准差σ为0表示该特征物理量在数据集中每一条数据上的表现相同(数值保持不变)，则该特征物理量为冗余特征，做删除处理。

第3步骤、使用模糊C均值聚类法对样本数据进行聚类，其原理是对每个样本和每个簇赋予一个权值(权值表示指定样本属于该簇的程度)，每个样本在哪个类的权值最大则归为哪个类，权值取值范围在[0,1]之间，越接近于1表示权值越大，越接近于0表示权值越小，对样本数据进行模糊C均值聚类法聚类之前需要确定聚类的簇数m和聚类中心数C，其中m是取值范围在[1,∞)的正整数，但通常设置簇数m的参数为2。首先选择簇数m＝2和聚类中心数C＝2进行模糊C均值聚类法聚类。聚类方法的具体步骤如下：

第3.1步骤、随机生成n*C的权值矩阵U⁽⁰⁾；由于样本数据已做中心标准化处理，所以权值矩阵U⁽⁰⁾中的随机数值分布在[0,1]之间；n表示数据样本量个数，且n是大于等于1的正整数；C表示聚类中心数，取值范围在[2,p]的正整数，p为样本数据的特征个数,且p是大于等于1的正整数；U⁽⁰⁾中U表示权值矩阵，U⁽⁰⁾中的0表示该权值矩阵值为初始随机值，即第0次迭代；权值矩阵U^(t)的公式如下：

其中，t表示第t次迭代，且t∈[0,∞)；u₁₁表示第一个样本的第一个聚类中心；u₁₂表示第一个样本的第二个聚类中心；u₁₃表示第一个样本的第三个聚类中心；u_1c表示第一个样本的第c个聚类中心；u₂₁表示第二个样本的第一个聚类中心；u₂₂表示第二个样本的第二个聚类中心；u₂₃表示第二个样本的第三个聚类中心；u_2c表示第二个样本的第c个聚类中心；u₃₁表示第三个样本的第一个聚类中心；u₃₂表示第三个样本的第二个聚类中心；u₃₃表示第三个样本的第三个聚类中心；u_3c表示第三个样本的第c个聚类中心；u_n1表示第n个样本的第一个聚类中心；u_n2表示第n个样本的第二个聚类中心；u_n3表示第n个样本的第三个聚类中心；u_nc表示第n个样本的第c个聚类中心。

第3.2步骤、计算第j个聚类中心c_j；c_j的计算公式是：

其中，c_j表示第j个聚类中心，j∈[1,p]，p为样本数据的特征个数，且p是大于等于1的正整数；x_i表示第i个样本，i∈[1,n]，n表示数据样本量个数，且n是大于等于1的正整数；u_ij表示样本x_i属于第j个聚类中心的权值；

表示样本x_i属于第j个聚类中心的隶属度(即权值)的m次幂；u_ij的值从权值矩阵U中获取；m表示聚类的簇数；其中，

第3.3步骤、重新计算权值矩阵U，记为U^(t)，表示第t次迭代；权值矩阵U^(t)的各权值计算方法是：

其中，u_ij表示样本x_i属于第j个聚类中心的权值；C表示聚类中心的数量；c_j表示第j个聚类中心，j∈[1,p]，p为样本数据的特征个数，且p是大于等于1的正整数；c_k表示第k个聚类中心，k∈[1,p]，p为样本数据的特征个数，且p是大于等于1的正整数；d(x_i,c_j)表示样本x_i到第j个聚类中心的欧氏距离；d(x_i,c_k)表示样本x_i到第k个聚类中心的欧氏距离；以样本g和样本h为例，欧氏距离(Euclidean Distance)计算方法是：

其中，p为样本数据的特征个数，且p是大于等于1的正整数；l表示第l个特征，l∈[1,p]，l为正整数；d(g,h)表示样本g(g₁,g₂,g₃,...,g_p)到样本h(h₁,h₂,h₃,...,h_p)的欧式距离。

第3.4步骤、计算本次迭代的误差平方和(Sum of the Squared Errors，简称SSE)，当误差平方和相对较小时，则达到较优聚类结果；误差平方和的计算公式是：

其中，

表示样本x_i属于第j个聚类中心的隶属度(即权值)的m次幂；d(x_i,c_j)表示样本x_i到第j个聚类中心的欧氏距离。

第3.5步骤、重复第3.1步骤、第3.2步骤、第3.3步骤以及第3.4步骤，迭代计算聚类中心c_j和权值矩阵U^(t)，迭代至SSE^(t+1)与SSE^(t)的结果几乎相同时，SSE^(t+1)表示第t+1次迭代，SSE^(t)表示第t次迭代，取第t次迭代中C个聚类中心和n*C的权值矩阵，根据第t次迭代后的权值矩阵按照模糊集合中的最大隶属原则确定每个样本的归属类别。这样就能确定在聚类中心C＝2时样本数据集中每个样本所属的类别。

第4步骤、使用轮廓系数来评价聚类结果：模糊C均值聚类中聚为2类时(C＝2)，将两类命名为A类和B类，各自类别内样本间彼此的欧式距离称为类内距离，表示为a(i)，以A类中某样本A_e为例，计算公式是：

其中，a(A_e)表示A类内样本间彼此的欧式距离；A_e表示A类中第e个样本；A_q表示A类中第q个样本；n表示数据样本量个数，且n是大于等于1的正整数；n_A表示A类数据样本量个数；A_q是除A_e以外的其他A类样本；d(A_e,A_q)表示A_e与A_q之间的欧氏距离；a(A_e)越小，表示样本A_e越应该被分到A类当中，a(A_e)也称作A_e的类内不相似度；

同理，以B类中某样本B_f为例，计算公式是：

其中，a(B_f)表示B类内样本间彼此的欧式距离；B_f表示B类中第f个样本；B_r表示B类中第r个样本；n表示数据样本量个数，且n是大于等于1的正整数；n_B表示B类数据样本量个数；B_r是除B_f以外的其他B类样本；d(B_f,B_r)表示B_f与B_r之间的欧氏距离；a(B_f)越小，表示样本B_f越应该被分到B类当中，a(B_f)也称作B_f的类内不相似度；

计算A、B两类中，各自类别间彼此的欧式距离称为平均类间距离，表示为b(i)，以A类中某样本A_e为例，A_e与B类的平均类间距离的计算公式是：

其中，b(A_e)表示A类中样本A_e与其他非A类的平均类间距离；A_e表示A类中第e个样本；B_f是B类中第f个样本；n_B表示B类数据样本量个数；d(A_e,B_f)表示A_e与B_f之间的欧氏距离；f为取值范围在[1,n_B]的正整数；

假设存在第三类O类样本，A_e与O类的平均类间距离可同理得出，在A_e与B类的平均类间距离、A_e与O类的平均类间距离中，取A_e与其他非A类的平均类间距离的最小值作为b(A_e)；

采用轮廓系数作为评价聚类的标准，公式如下：

以A类中某样本A_e为例，则A_e的轮廓系数计算公式是：

计算样本数据中所有样本的轮廓系数平均值，那么这个平均值就是将样本数据进行模糊C均值聚类中聚为A、B两类的整体轮廓系数。

第5步骤、以不同的聚类中心数C值作为模糊C均值聚类数，其中，C∈[1,n]，n表示数据样本量个数，且n是大于等于1的正整数；重复第3步骤和第4步骤，这样就得到了n个轮廓系数，选择轮廓系数最大的C值作为模糊C均值最佳聚类数进行模糊C均值聚类；聚类结束后，将C类中样本量为1的类别判断为异色缺陷，将C类中样本量大于1的类别判断为喷砂不均缺陷。需要说明的是，在不确定最佳聚类数时，C的值可以是[1,n]以内的任意值；为了提高工作效率，选取[1,n*2/3]的聚类数分别进行评估，具体地，C的取值集合是1、2、3、4、……、n*2/3，其中，n表示数据样本量个数，且n是大于等于1的正整数，n*2/3向上取整，重复第3步骤和第4步骤，这样就得到了n*2/3个轮廓系数，其中n*2/3向上取整。

异色与喷砂不均的缺陷非常相似，区别在于异色是单独一块缺陷，而喷砂不均是一片紧密但可能不连续的多块类异色缺陷聚集在一起，所以，聚类后样本量不为1的类别属于喷砂不均，并且符合喷砂不均的形态，这样，易混淆缺陷就可以被检测出，该方法叠加在缺陷检测装置之后，不影响缺陷检测装置对其他缺陷的检出结果，只单独对异色与喷砂不均缺陷进行再次检测判断，提升效率的同时，减少了人工参与的成本。

见图3，使用工业相机拍摄的某一个工件部位。其中，白色矩形框是工业相机逐个标注的缺陷，并且被缺陷检测装置全部识别为异色缺陷。图中可以明显看出由于工业相机逐个标注的原因，标注处理后的缺陷部位很难准确判断缺陷所属类型。左上角和右下角两处缺陷紧密聚集的区域是两处喷砂不均缺陷(工业质检标准)，图片其余三处缺陷是异色缺陷(工业质检标准)。原本是一整片喷砂不均的缺陷被分开标注处理，这可能导致检出结果有偏差。

见图4、图5和图6，当C＝5时，模糊C均值聚类结果里样本大于1的类别是喷砂不均缺陷，样本数量为1的类别是异色缺陷。这说明模糊C均值聚类法聚为5类时，异色与喷砂不均缺陷可以被区分开。

见图7，该图为C分别等于2、3、4、5、6时，模糊C均值聚类的轮廓系数示意图。图中可以明显看出，当簇数为2时，轮廓系数在0.35～0.4之间；当簇数为3时，轮廓系数为0.45；当簇数为4时，轮廓系数在0.45～0.5之间；当簇数为5时，轮廓系数在0.55～0.6之间；当簇数为6时，轮廓系数在0.4～0.45之间。显然，当C＝2时，聚类效果较差；当C＝5时，聚类效果呈现比较好的状态，轮廓系数最高。所以选择将数据聚为5类，且聚类后的每个类的样本量，都符合异色与喷砂不均缺陷分布形态。这说明本发明的易混淆缺陷的有效检测方法可以在不更改现有工业相机扫描方式的前提下，有效地提高设备检测异色与喷砂不均缺陷的准确率，克服现阶段依赖人工核查工业相机拍摄结果的桎梏。

本发明与缺陷检测装置协同合作，叠加在缺陷检测装置之后。在满足工业现场动态需求的情况下，提高执行效率，降低已有工业相机移动轨迹和缺陷检测装置的训练成本和影响，采用易混淆缺陷的有效检测方法对特殊缺陷特殊处理，这种方法不需要耗费大量人工并且准确率高，尤其适用样本量大的情况，可辅助完成对多项目多缺陷的缺陷精准检测及划分。

本发明的易混淆缺陷的有效检测方法充分迎合了工业现场工业相机特定移动轨迹和庞大缺陷检测装置导致异色与喷砂不均缺陷类别检测不准确的情况。在无法改变工业相机现有移动轨迹的情况下，异色缺陷的表现形态与部分喷砂不均缺陷十分相似，单独对比时缺陷检测装置很难将缺陷区分开。因此引入了本发明的易混淆缺陷的有效检测方法，将工业相机标注的每一处缺陷都作为一条数据，使用这些数据进行不同类别数的模糊C均值聚类。以轮廓系数作为评价标准选出聚类效果比较好的类别数进行聚类，这样聚类结束后每个类别都是一处缺陷，数据量为1的类别数是异色缺陷，数据量大于1的类别数则是喷砂不均缺陷，以此来达到异色与喷砂不均缺陷分类的目的。这极大地降低了现有缺陷检测装置的训练成本和影响，在不破坏缺陷检测装置的前提下提升了工业现场准确率及执行效率。

以上所述的，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种易混淆缺陷的有效检测方法，其特征在于，包括以下步骤：

第3步骤、使用模糊C均值聚类法对样本数据进行聚类；

采用轮廓系数作为评价聚类的标准，公式如下：

以A类中某样本A_e为例，则A_e的轮廓系数计算公式是：

2.根据权利要求1所述的易混淆缺陷的有效检测方法，其特征在于：在第4步骤中，以A类中某样本A_e为例，A类内样本间彼此的欧式距离的计算公式是：

3.根据权利要求2所述的易混淆缺陷的有效检测方法，其特征在于：在第4步骤中，以B类中某样本B_f为例，B类内样本间彼此的欧式距离的计算公式是：

4.根据权利要求3所述的易混淆缺陷的有效检测方法，其特征在于：在第4步骤中，以A类中某样本A_e为例，A_e与B类的平均类间距离的计算公式是：

5.根据权利要求4所述的易混淆缺陷的有效检测方法，其特征在于：在第4步骤中，a(A_e)越小，表示样本A_e越应该被分到A类当中，a(A_e)也称作A_e的类内不相似度；a(B_f)越小，表示样本B_f越应该被分到B类当中，a(B_f)也称作B_f的类内不相似度。

6.根据权利要求1所述的易混淆缺陷的有效检测方法，其特征在于：在第5步骤中，C的取值集合是1、2、3、4、……、n*2/3，其中，n表示数据样本量个数，且n是大于等于1的正整数，n*2/3向上取整，重复第3步骤和第4步骤，这样就得到了n*2/3个轮廓系数，其中n*2/3向上取整。

7.根据权利要求1所述的易混淆缺陷的有效检测方法，其特征在于：在第1步骤中，对样本数据集进行一致性检查，缺失值、异常值处理，检查数据有无缺失，若缺失则删除此条数据，检查数值是否在实际特征物理量取值范围之内，若超出范围则删除此条数据。

8.根据权利要求1所述的易混淆缺陷的有效检测方法，其特征在于：在第2步骤中，对某特征物理量序列z₁、z₂、z₃、......、z_n进行标准化转换，其中，n表示数据样本量个数，且n是大于等于1的正整数，中心标准化处理的计算公式是：

表示特征物理量序列z的均值；σ表示标准差；

9.根据权利要求8所述的易混淆缺陷的有效检测方法，其特征在于：特征物理量序列z的均值

的计算公式是：

10.根据权利要求8所述的易混淆缺陷的有效检测方法，其特征在于：标准差σ的计算公式是：

表示特征物理量序列z的均值。