CN113642680A - 边缘合成及超球体软拟合缺陷检测方法 - Google Patents

边缘合成及超球体软拟合缺陷检测方法 Download PDF

Info

Publication number
CN113642680A
CN113642680A CN202111192923.8A CN202111192923A CN113642680A CN 113642680 A CN113642680 A CN 113642680A CN 202111192923 A CN202111192923 A CN 202111192923A CN 113642680 A CN113642680 A CN 113642680A
Authority
CN
China
Prior art keywords
sample
samples
class
hypersphere
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111192923.8A
Other languages
English (en)
Other versions
CN113642680B (zh
Inventor
邱增帅
王罡
周佩涵
潘正颐
侯大为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Weiyizhi Technology Co Ltd
Original Assignee
Changzhou Weiyizhi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Weiyizhi Technology Co Ltd filed Critical Changzhou Weiyizhi Technology Co Ltd
Priority to CN202111192923.8A priority Critical patent/CN113642680B/zh
Publication of CN113642680A publication Critical patent/CN113642680A/zh
Application granted granted Critical
Publication of CN113642680B publication Critical patent/CN113642680B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Processing (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)

Abstract

本发明公开了一种边缘合成及超球体软拟合缺陷检测方法,找出小样本T类中的每一个样本
Figure 875759DEST_PATH_IMAGE001
的m个最近邻;将T类样本分为三类,它们分别为噪声类、危险类和安全类,噪声类的样本和安全类的样本均不做处理;对于处于危险类中的每个样本,计算出它的k个最近邻样本;使用危险类样本生成新数据并添加到训练数据当中;将训练数据映射到特征空间;计算包围正样本的超球体半径R,计算测试样本点到超球体球心的距离dist;判断是否
Figure 855217DEST_PATH_IMAGE002
,如果
Figure 697271DEST_PATH_IMAGE002
,则认为是正样本,如果dist大于R,则认为是负样本,最终得出测试样本分类结果。该方法具有减少工业零部件的不同缺陷在设备上识别出现断层、提高模型精确度、降低现场工作难度的优点。

Description

边缘合成及超球体软拟合缺陷检测方法
技术领域
本发明涉及缺陷检测的技术领域,尤其是一种边缘合成及超球体软拟合缺陷检测方法。
背景技术
由于工业现场质检数据本身存在多样性,工件新产生的缺陷类型常常在历史数据中没有发生过,缺乏先验信息且数据量极小。这直接导致了工业设备对缺陷的识别不准确,造成工业质检数据与实际现场环境存在误差。基于这个需求,亟需发明一种可以增加少量数据(扩大数据样本量)并且准确分类识别的方法,降低工业零部件的不同缺陷在设备上的识别断层,从而提高设备模型精确度,减少现场工作难度的目的。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
为此,本发明提出一种边缘合成及超球体软拟合缺陷检测方法,该边缘合成及超球体软拟合缺陷检测方法具有减少工业零部件的不同缺陷在设备上识别出现断层、提高模型精确度、降低现场工作难度的优点。
根据本发明实施例的边缘合成及超球体软拟合缺陷检测方法,具体步骤如下:
第1步骤、找出小样本 T类中的每一个样本
Figure 442394DEST_PATH_IMAGE001
的m个最近邻,其中的
Figure 256767DEST_PATH_IMAGE002
且m为 正整数,
Figure 141546DEST_PATH_IMAGE003
,分别统计每个小样本
Figure 473826DEST_PATH_IMAGE004
的m个最近邻所属类别,近邻为大样本 F的个数用
Figure 735043DEST_PATH_IMAGE005
表示;
第2步骤、将T类样本分为三类,它们分别为噪声类、危险类和安全类,其中,噪声类的样本T和安全类的样本T均不做处理;
第3步骤、处于危险类中的样本是小样本类别T的边界数据用
Figure 403922DEST_PATH_IMAGE006
表示,对于处于 危险类中的每个样本,计算出它的k个最近邻样本,其中的
Figure 459602DEST_PATH_IMAGE007
且k为正整数,该k个最近 邻样本可能包含T和F的样本;
第4步骤、使用危险类样本生成新数据并添加到训练数据当中;
第5步骤、将训练数据映射到特征空间;
第6步骤、计算包围正样本的超球体半径R,计算测试样本点到超球体球心的距离dist;
第7步骤、判断是否
Figure 276249DEST_PATH_IMAGE008
,如果
Figure 75577DEST_PATH_IMAGE008
,则认为是正样本,如果dist大于R,则认为 是负样本,最终得出测试样本分类结果。
本发明的有益效果是,本发明属于算法的协同合作,可以减少工业零部件的不同缺陷在设备上识别出现断层,从而提高模型精确度,降低现场工作难度,满足工业现场的动态需求,提高执行效率,降低已有算法的训练成本和影响,采用边缘合成及超球体软拟合缺陷检测的训练成本低并且准确率高,将新出现的缺陷类型数据量增加后添加到超球体软拟合技术当中后直接训练,解决了由于数据量过小导致的设备识别不准确的问题,克服了由于光照条件、相机角度、工件差异、亮度、湿度等导致的缺陷物理量描述不一的不利因素,完成对多项目多缺陷的缺陷精准检测及划分。
进一步具体地限定,上述技术方案中,在第1步骤中,最近邻所采用的距离为欧氏距离,表示为:
Figure 598963DEST_PATH_IMAGE009
(1)
其中,
Figure 91124DEST_PATH_IMAGE010
表示样本
Figure 395066DEST_PATH_IMAGE011
到样本
Figure 732507DEST_PATH_IMAGE012
的距离;
Figure 375978DEST_PATH_IMAGE013
表示训练集 的特征数h中的一个,其中
Figure 776391DEST_PATH_IMAGE014
Figure 567629DEST_PATH_IMAGE015
表示样本A在特征
Figure 708760DEST_PATH_IMAGE013
上的值;
Figure 206738DEST_PATH_IMAGE016
表示样本B在特征
Figure 40702DEST_PATH_IMAGE013
上的值。
进一步具体地限定,上述技术方案中,所述第4步骤的具体步骤是:
第4.1步骤、首先从
Figure 53657DEST_PATH_IMAGE017
中的k个最近邻中随机选择s个最近邻,其中
Figure 998479DEST_PATH_IMAGE018
且s为正 整数;
第4.2步骤、然后计算
Figure 350963DEST_PATH_IMAGE019
与其s个最近邻之间的差,用
Figure 355828DEST_PATH_IMAGE020
表示;
第4.3步骤、再将
Figure 856080DEST_PATH_IMAGE021
乘以随机数
Figure 341944DEST_PATH_IMAGE022
,其中其中随机数
Figure 814513DEST_PATH_IMAGE022
的范围是0~0.5;;
第4.4步骤、最后得到s个新的T类样本数据。
进一步具体地限定,上述技术方案中,对每一个
Figure 990280DEST_PATH_IMAGE023
重复上述步骤,生成大量新的 T类样本数据,由于新的数据是沿着区分小样本类别的边界样本数据和其最近邻之间样本 之间生成的,从而加强了样本区分的边界,危险类样本与其最近邻之间的差乘以0到0.5之 间的随机数,这样可以使新生成的样本更接近于小样本的类别。
进一步具体地限定,上述技术方案中,在第5步骤中,采用超球体软拟合技术对新 生成的数据进行分类训练,该超球体软拟合技术是单类别分类技术,可以识别并判断训练 样本和非训练样本两类;具体操作如下,首先将训练集与新生成的T样本数据从原始数据映 射到高维度的特征空间,采用非线性变换函数对数据进行映射
Figure 977827DEST_PATH_IMAGE024
,其中,
Figure 264452DEST_PATH_IMAGE025
表示拉 伸过后的函数;x表示特征向量;F表示特征空间。
进一步具体地限定,上述技术方案中,在第6步骤中,从特征空间中找出一个包围正样本的超球体,并通过最小化该超球体的体积让正样本点尽可能地被包围在超球体中,且负样本点尽可能地排除在超球体之外。
进一步具体地限定,上述技术方案中,在第7步骤中,将测试样本导入训练完成的超球体软拟合技术当中,判断测试样本是否在超球体表面或内部,对于某一个测试样本,该测试样本点到超球体球心的距离为dist,若测试样本在超球体表面或内部,则该测试样本为正样本,反之则为负样本,得出一系列测试样本属性,边缘合成超球体软拟合技术结束。
进一步具体地限定,上述技术方案中,在第2步骤中,T类样本的分类规则如下:如 果
Figure 325949DEST_PATH_IMAGE026
,即
Figure 672617DEST_PATH_IMAGE027
的所有m个最近邻都是F类的样本,则认为
Figure 147460DEST_PATH_IMAGE028
是噪声类;如果
Figure 237776DEST_PATH_IMAGE029
,即
Figure 419359DEST_PATH_IMAGE027
的m个最近邻样本中F类样本数大于T类样本数,且F类样本总数大于T类样本总数,F类样 本总数和T类样本总数之和等于m,则认为
Figure 671348DEST_PATH_IMAGE027
容易被误分类,并处于危险类;如果
Figure 648137DEST_PATH_IMAGE030
,即
Figure 276564DEST_PATH_IMAGE031
的最近邻样本中F类样本数小于T类样本数,则认为
Figure 640549DEST_PATH_IMAGE031
是安全类。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的流程图;
图2是使用BSMOTE方法前训练数据二维分布示意图;
图3是带有BSMOTE标注的训练数据二维分布示意图;
图4是使用BSMOTE方法后的训练数据二维分布示意图;
图5是超球体软拟合技术分类测试结果。
具体实施方式
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
见图1,本发明的一种边缘合成及超球体软拟合缺陷检测方法,具体步骤如下:
第1步骤、假设整体训练集共分为两类,其中一类样本数量小,另一类样本数量大, 小样本类别用T表示,大样本类别用F表示,其中T的样本数量用
Figure 63440DEST_PATH_IMAGE032
来表示,F的样本数量 用
Figure 512876DEST_PATH_IMAGE033
来表示。对于小样本量T类中的每一个样本
Figure 882678DEST_PATH_IMAGE034
,从训练集中找出小样本 T类中的每一个样本
Figure 835590DEST_PATH_IMAGE031
的m个最近邻,其中的
Figure 694962DEST_PATH_IMAGE035
且m为正整数,
Figure 366115DEST_PATH_IMAGE003
,分 别统计每个小样本
Figure 539607DEST_PATH_IMAGE036
的m个最近邻所属类别,近邻为大样本F的个数用
Figure 615535DEST_PATH_IMAGE037
表示,即m个最近邻 中的属于大样本F类的例子用
Figure 645808DEST_PATH_IMAGE038
个来表示。上述提到的最近邻所采用的距离为欧氏距离 (Euclidean Distance),表示为:
Figure 804257DEST_PATH_IMAGE009
(1)
其中,
Figure 515861DEST_PATH_IMAGE010
表示样本
Figure 443366DEST_PATH_IMAGE039
到样本
Figure 644540DEST_PATH_IMAGE040
的距离;h表示 训练集的特征个数;
Figure 290285DEST_PATH_IMAGE041
表示训练集的特征数h中的一个,其中
Figure 540000DEST_PATH_IMAGE042
Figure 587591DEST_PATH_IMAGE043
表示样本A在 特征
Figure 959666DEST_PATH_IMAGE041
上的值;
Figure 95637DEST_PATH_IMAGE016
表示样本B在特征
Figure 149044DEST_PATH_IMAGE041
上的值。
第2步骤、将T类样本分为三类,它们分别为噪声类(noise)、危险类(danger)和安全类(safe),分类规则如下:
如果
Figure 51141DEST_PATH_IMAGE044
,即
Figure 594118DEST_PATH_IMAGE045
的所有m个最近邻都是F类的样本,则认为
Figure 948875DEST_PATH_IMAGE045
是噪声类;
如果
Figure 805973DEST_PATH_IMAGE029
,即
Figure 562576DEST_PATH_IMAGE027
的m个最近邻样本中F类样本数大于T类样本数,且F类样本 总数大于T类样本总数,F类样本总数和T类样本总数之和等于m,则认为
Figure 276455DEST_PATH_IMAGE027
容易被误分类,并 处于危险;
如果
Figure 384088DEST_PATH_IMAGE046
,即
Figure 779297DEST_PATH_IMAGE045
的最近邻样本中F类样本数小于T类样本数,则认为
Figure 390407DEST_PATH_IMAGE045
是安全 类;
其中,噪声类的样本T和安全类的样本T均不做处理。
需要说明的是:F类样本表示数据集中大样本的数据,T类样本表示数据集中小样 本的数据,
Figure 543695DEST_PATH_IMAGE045
表示小样本数据中第i个小样本。T类样本总数 = 噪声类T样本总数+危险类T 样本总数+安全类T样本总数。以样本的m个最近邻样本类别数来判断该T类样本属于哪一 类。例如,
Figure 873046DEST_PATH_IMAGE045
的最近邻样本中F类样本数大于T类样本数,这里
Figure 71946DEST_PATH_IMAGE045
表示第i个小样本数据。最 近邻样本中F类样本数大于T类样本数表示当前的F类样本数+ T类样本数 = m,且F类样本 数 > T类样本数。
第3步骤、处于危险类中的样本是小样本类别T的边界数据用
Figure 537562DEST_PATH_IMAGE047
表示,对于处于危 险类中的每个样本,计算出它的k个最近邻样本,其中的
Figure 858822DEST_PATH_IMAGE007
且k为正整数,该k个最近邻 样本可能包含T和F的样本。
第4步骤、使用危险类样本生成新数据并添加到训练数据当中;具体步骤是:
第4.1步骤、首先从
Figure 613151DEST_PATH_IMAGE048
中的k个最近邻中随机选择s个最近邻,其中
Figure 412480DEST_PATH_IMAGE049
且s为 正整数;
第4.2步骤、然后计算
Figure 998182DEST_PATH_IMAGE048
与其s个最近邻之间的差,用
Figure 490343DEST_PATH_IMAGE050
表示,
Figure 466390DEST_PATH_IMAGE051
(2)
其中,
Figure 69409DEST_PATH_IMAGE048
表示小样本类中处于危险类的第i个样本;
Figure 766408DEST_PATH_IMAGE052
表示
Figure 163891DEST_PATH_IMAGE048
的s个最近邻之 一,
Figure 892813DEST_PATH_IMAGE053
且j为正整数;
第4.3步骤、再将
Figure 33944DEST_PATH_IMAGE050
乘以随机数
Figure 594239DEST_PATH_IMAGE054
,其中,随机数
Figure 162623DEST_PATH_IMAGE022
的范围是0~0.5;
第4.4步骤、最后得到s个新的T类样本数据;
对每一个
Figure 378841DEST_PATH_IMAGE055
重复上述步骤,生成大量新的T类样本数据,由于新的数据是沿着区分 小样本类别的边界样本数据(危险类)和其最近邻之间样本之间生成的,从而加强了样本区 分的边界,危险类样本与其最近邻之间的差乘以0到0.5之间的随机数,这样可以使新生成 的样本更接近于小样本的类别,新样本数据生成公式为:
Figure 323663DEST_PATH_IMAGE056
(3)
上述公式(3)也可以表示为:
Figure 738464DEST_PATH_IMAGE057
(4)
第5步骤、将训练数据映射到特征空间;采用超球体软拟合技术对新生成的数据进 行分类训练,该超球体软拟合技术是单类别分类技术,可以识别并判断训练样本和非训练 样本(即正样本和非正样本)两类;具体操作如下,首先将训练集与新生成的T样本数据从原 始数据映射到高维度的特征空间,采用非线性变换函数对数据进行映射
Figure 743329DEST_PATH_IMAGE024
(整体表 示为通过非线性函数将特征向量x映射到特征空间F),其中,
Figure 181264DEST_PATH_IMAGE058
表示拉伸过后的函数;x表示 特征向量;F表示特征空间。需要说明的是:对原始数据进行高维映射时,是对特征向量x里 的每个样本,也就是每一行的特征向量都进行了拉伸变换,使得对x中的每个元素,在F中有 唯一确定的元素f与之对应,将拉伸过后的函数叫做
Figure 667127DEST_PATH_IMAGE058
,则称
Figure 202014DEST_PATH_IMAGE058
为从x到F的映射。
第6步骤、计算包围正样本(训练样本)的超球体半径R,计算测试样本点到超球体球心的距离dist;从特征空间中找出一个包围正样本(训练样本)的超球体,并通过最小化该超球体的体积让正样本点尽可能地被包围在超球体中,且负样本点尽可能地排除在超球体之外;最小化超球体的体积公式为:
Figure 49884DEST_PATH_IMAGE059
(5)
其中,p表示第p个训练样本;
Figure 37432DEST_PATH_IMAGE060
表示超球体的球心;R表示超球体半径;
Figure 324057DEST_PATH_IMAGE061
表示松弛 因子;C表示一个权衡超球体体积和误分率的惩罚参数;n表示训练集的样本个数;求和符号 ∑右下角的p=1表示p取值从1开始直到p取值为n。
上述公式(5)中的对偶公式为:
Figure 713450DEST_PATH_IMAGE062
(6)
其中,求和符号∑右下角的p=1表示p取值从1开始直到p取值为n;q表示第q个训练 样本;
Figure 997800DEST_PATH_IMAGE063
表示核函数,等同于特征空间中样本的内积;
Figure 472644DEST_PATH_IMAGE064
表示样本
Figure 297381DEST_PATH_IMAGE065
对应的拉格朗日系 数,且
Figure 541280DEST_PATH_IMAGE066
Figure 996532DEST_PATH_IMAGE067
Figure 961602DEST_PATH_IMAGE068
表示样本
Figure 590029DEST_PATH_IMAGE069
对应的拉格朗日系数,且
Figure 688435DEST_PATH_IMAGE070
Figure 314589DEST_PATH_IMAGE071
;在所有训练样本中,把拉格朗日系数满足
Figure 764025DEST_PATH_IMAGE072
的样本称为支持向量,假 设训练数据集中属于支持向量的样本集合为SV,则:
Figure 930564DEST_PATH_IMAGE073
(7)
Figure 149055DEST_PATH_IMAGE074
(8)
其中,
Figure 946110DEST_PATH_IMAGE075
表示训练数据集中属于支持向量的样本集合
Figure 617263DEST_PATH_IMAGE076
中的点,
Figure 853072DEST_PATH_IMAGE077
Figure 929000DEST_PATH_IMAGE078
是核函数,等同于特征空间中样本的内积,即
Figure 896956DEST_PATH_IMAGE079
第7步骤、判断是否
Figure 55405DEST_PATH_IMAGE080
,如果
Figure 563747DEST_PATH_IMAGE081
,则认为是正样本,如果dist大于R,则 认为是负样本,最终得出测试样本分类结果。具体地,将测试样本导入训练完成的超球体软 拟合技术当中,判断测试样本是否在超球体表面或内部(即是否
Figure 756831DEST_PATH_IMAGE081
),对于某一个测试 样本
Figure 895688DEST_PATH_IMAGE082
,该测试样本点到超球体球心的距离为:
Figure 541433DEST_PATH_IMAGE083
(9)
若测试样本在超球体表面或内部,则该测试样本为正样本,反之则为负样本,得出一系列测试样本属性,边缘合成超球体软拟合技术结束。
见图2,圆点为小样本量数据T,三角形为大样本量数据F,T的数量为60个,F的数量为1580个。
见图3,圆点为小样本量数据T,三角形为大样本量数据F,五角星为边缘合成少数类过采样技术(BSMOTE)标注的小样本量数据中的危险类数据,可以明显看出危险类数据处于T和F样本分布的边界,T的数量为60个,F的数量为1580个,危险类的数量为24个。
见图4,圆点为小样本量数据T,三角形为大样本量数据F,T类数据明显增多,且使用边缘合成少数类过采样技术(BSMOTE)方法进行过采样后,T类数据的边界增强,轮廓清晰,T的数量为660个,F的数量为1580个。
超球体软拟合技术分类识别结果对比表
Figure 853466DEST_PATH_IMAGE085
以上对比表为未使用边缘合成少数类过采样技术(BSMOTE)进行边缘数据合成及使用后的超球体软拟合技术分类识别结果对比表,表中可以明显看出在测试样本不变的情况下,使用边缘合成少数类过采样技术(BSMOTE)进行边缘数据合成对模型识别缺陷的综合准确率提高了超过40%(F1分数达到94%)。计算过程是;
使用后的F1分数-使用前的F1分数=0.9416576 - 0.5271884=0.4144692*100% ≈41.4%(超过40%),这说明几乎所有的缺陷都被识别出来了。
见图5,超球体软拟合技术在模型训练时采用边缘合成少数类过采样技术(BSMOTE)进行边缘数据合成后的训练数据。图中位于黑色横线下方的样本点为正确识别的数据,横线上方为误识别的数据,可以很明显看出只有个别缺陷被误识别,这说明使用BSMOTE边缘合成数据和超球体软拟合技术协同使用的方法可以有效地提高算法识别的准确性。
边缘合成及超球体软拟合缺陷识别技术的关键点在于,它充分迎合了工业现场无法处理未知新缺陷或某类缺陷数量极少的情况。未知新缺陷的特征往往和某些已知的缺陷/污渍/毛絮等相似,很难在数据量极少的情况下将缺陷识别出来,因此引入了边缘合成技术进行人工合成新样本来增加小样本缺陷的样本量。由于危险类缺陷样本对决策影响大,处于边界附近的缺陷样本(危险类缺陷样本)更容易被错误分类,所以仅对缺陷中的危险类缺陷进行人工合成新的缺陷样本。这使得缺陷样本的边界清晰,缺陷数据的不确定性较小且克服了不同类样本之间混叠的现象。受未知新缺陷不存在历史数据库中的影响,现有的算法模型无法进行决策训练。超球体软拟合技术作为一种单一分类器,可以在无历史数据的情况下识别缺陷。即只用边缘合成技术后的未知新缺陷样本进行训练,然后使用超球体软拟合技术对测试数据进行决策,该技术可以识别出测试数据中属于未知新缺陷这一类别的数据。这极大地降低了现有算法的训练成本和影响,在不破坏现有算法的前提下提升了工业现场准确率及执行效率。
以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (8)

1.一种边缘合成及超球体软拟合缺陷检测方法,其特征在于,具体步骤如下:
第1步骤、找出小样本 T类中的每一个样本
Figure DEST_PATH_IMAGE001
的m个最近邻,其中的
Figure DEST_PATH_IMAGE002
且m为正整 数,
Figure DEST_PATH_IMAGE003
,分别统计每个小样本
Figure 616281DEST_PATH_IMAGE001
的m个最近邻所属类别,近邻为大样本F的 个数用
Figure DEST_PATH_IMAGE004
表示;
第2步骤、将T类样本分为三类,它们分别为噪声类、危险类和安全类,其中,噪声类的样本T和安全类的样本T均不做处理;
第3步骤、处于危险类中的样本是小样本类别T的边界数据用
Figure DEST_PATH_IMAGE005
表示,对于处于危险类 中的每个样本,计算出它的k个最近邻样本,其中的
Figure DEST_PATH_IMAGE006
且k为正整数,该k个最近邻样本 可能包含T和F的样本;
第4步骤、使用危险类样本生成新数据并添加到训练数据当中;
第5步骤、将训练数据映射到特征空间;
第6步骤、计算包围正样本的超球体半径R,计算测试样本点到超球体球心的距离dist;
第7步骤、判断是否
Figure DEST_PATH_IMAGE007
,如果
Figure 175307DEST_PATH_IMAGE007
,则认为是正样本,如果dist大于R,则认为是负 样本,最终得出测试样本分类结果。
2.根据权利要求1所述的边缘合成及超球体软拟合缺陷检测方法,其特征在于:在第1步骤中,最近邻所采用的距离为欧氏距离,表示为:
Figure DEST_PATH_IMAGE008
(1)
其中,
Figure DEST_PATH_IMAGE009
表示样本
Figure DEST_PATH_IMAGE010
到样本
Figure DEST_PATH_IMAGE011
的距离;表示训练集的特 征数h中的一个,其中
Figure DEST_PATH_IMAGE013
Figure DEST_PATH_IMAGE014
表示样本A在特征上的值;
Figure DEST_PATH_IMAGE015
表示样本B在特征上 的值。
3.根据权利要求1所述的边缘合成及超球体软拟合缺陷检测方法,其特征在于:所述第4步骤的具体步骤是:
第4.1步骤、首先从
Figure DEST_PATH_IMAGE017
中的k个最近邻中随机选择s个最近邻,其中
Figure DEST_PATH_IMAGE018
且s为正整 数;
第4.2步骤、然后计算
Figure 990783DEST_PATH_IMAGE017
与其s个最近邻之间的差,用
Figure DEST_PATH_IMAGE019
表示;
第4.3步骤、再将
Figure 955197DEST_PATH_IMAGE019
乘以随机数
Figure DEST_PATH_IMAGE020
,其中随机数
Figure 373540DEST_PATH_IMAGE020
的范围是0~0.5;
第4.4步骤、最后得到s个新的T类样本数据。
4.根据权利要求3所述的边缘合成及超球体软拟合缺陷检测方法,其特征在于:对每一 个
Figure DEST_PATH_IMAGE021
重复上述步骤,生成大量新的T类样本数据,由于新的数据是沿着区分小样本类别的 边界样本数据和其最近邻之间样本之间生成的,从而加强了样本区分的边界,危险类样本 与其最近邻之间的差乘以0到0.5之间的随机数,这样可以使新生成的样本更接近于小样本 的类别。
5.根据权利要求1所述的边缘合成及超球体软拟合缺陷检测方法,其特征在于:在第5 步骤中,采用超球体软拟合技术对新生成的数据进行分类训练,该超球体软拟合技术是单 类别分类技术,可以识别并判断训练样本和非训练样本两类;具体操作如下,首先将训练集 与新生成的T样本数据从原始数据映射到高维度的特征空间,采用非线性变换函数对数据 进行映射,其中,
Figure DEST_PATH_IMAGE023
表示拉伸过后的函数;x表示特征向量;F表示特征空间。
6.根据权利要求1所述的边缘合成及超球体软拟合缺陷检测方法,其特征在于:在第6步骤中,从特征空间中找出一个包围正样本的超球体,并通过最小化该超球体的体积让正样本点尽可能地被包围在超球体中,且负样本点尽可能地排除在超球体之外。
7.根据权利要求1所述的边缘合成及超球体软拟合缺陷检测方法,其特征在于:在第7 步骤中,将测试样本导入训练完成的超球体软拟合技术当中,判断测试样本是否在超球体 表面或内部,对于某一个测试样本
Figure DEST_PATH_IMAGE024
,该测试样本点到超球体球心的距离为dist,若测试 样本在超球体表面或内部,则该测试样本为正样本,反之则为负样本,得出一系列测试样本 属性,边缘合成超球体软拟合技术结束。
8.根据权利要求1所述的边缘合成及超球体软拟合缺陷检测方法,其特征在于:在第2 步骤中,T类样本的分类规则如下:如果,即
Figure DEST_PATH_IMAGE025
的所有m个最近邻都是F类的样本,则认为
Figure 915249DEST_PATH_IMAGE025
是噪声类;如果
Figure DEST_PATH_IMAGE026
,即
Figure 899910DEST_PATH_IMAGE025
的m个最近邻样本中F类样本数大于T类样本数,且F类样本 总数大于T类样本总数,F类样本总数和T类样本总数之和等于m,则认为
Figure 781147DEST_PATH_IMAGE025
容易被误分类,并 处于危险类;如果
Figure DEST_PATH_IMAGE027
,即
Figure 370391DEST_PATH_IMAGE025
的最近邻样本中F类样本数小于T类样本数,则认为
Figure 602659DEST_PATH_IMAGE025
是安全类。
CN202111192923.8A 2021-10-13 2021-10-13 边缘合成及超球体软拟合缺陷检测方法 Active CN113642680B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111192923.8A CN113642680B (zh) 2021-10-13 2021-10-13 边缘合成及超球体软拟合缺陷检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111192923.8A CN113642680B (zh) 2021-10-13 2021-10-13 边缘合成及超球体软拟合缺陷检测方法

Publications (2)

Publication Number Publication Date
CN113642680A true CN113642680A (zh) 2021-11-12
CN113642680B CN113642680B (zh) 2022-02-08

Family

ID=78426612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111192923.8A Active CN113642680B (zh) 2021-10-13 2021-10-13 边缘合成及超球体软拟合缺陷检测方法

Country Status (1)

Country Link
CN (1) CN113642680B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063873A (zh) * 2014-07-08 2014-09-24 华东交通大学 一种基于压缩感知的轴套类零件表面缺陷在线检测方法
WO2018000731A1 (zh) * 2016-06-28 2018-01-04 华南理工大学 一种曲面表面缺陷自动检测方法及其装置
CN109345523A (zh) * 2018-09-21 2019-02-15 中国科学院苏州生物医学工程技术研究所 表面缺陷检测和三维建模方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063873A (zh) * 2014-07-08 2014-09-24 华东交通大学 一种基于压缩感知的轴套类零件表面缺陷在线检测方法
WO2018000731A1 (zh) * 2016-06-28 2018-01-04 华南理工大学 一种曲面表面缺陷自动检测方法及其装置
CN109345523A (zh) * 2018-09-21 2019-02-15 中国科学院苏州生物医学工程技术研究所 表面缺陷检测和三维建模方法

Also Published As

Publication number Publication date
CN113642680B (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN110443281B (zh) 基于hdbscan聚类的文本分类自适应过采样方法
CN109255344B (zh) 一种基于机器视觉的数显式仪表定位与读数识别方法
Singh et al. Svm-bdt pnn and fourier moment technique for classification of leaf shape
CN111126446B (zh) 一种机器人视觉工业产品缺陷图像数据增广方法
CN114372968A (zh) 结合注意力机制与自适应记忆性融合网络的瑕疵检测方法
CN111340086A (zh) 无标签数据的处理方法、系统、介质及终端
CN111343147A (zh) 一种基于深度学习的网络攻击检测装置及方法
CN113591948A (zh) 一种缺陷模式识别方法、装置、电子设备和存储介质
CN114818809B (zh) 基于交叉小波的sca-svm电机滚动轴承的故障诊断方法
CN116823725A (zh) 一种基于支持向量机的航空发动机叶片表面缺陷检测方法
CN113781483B (zh) 工业产品外观缺陷检测方法和装置
CN116129242A (zh) 一种基于改进YOLOv4铝材表面缺陷识别方法
CN113762151A (zh) 一种故障数据处理方法、系统及故障预测方法
CN114565798A (zh) 基于铁谱图像分析的动力装置磨损故障诊断方法及系统
CN117576079A (zh) 一种工业产品表面异常检测方法、装置及系统
CN113642680B (zh) 边缘合成及超球体软拟合缺陷检测方法
CN117197559A (zh) 基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质
CN112396580A (zh) 一种圆形零件缺陷检测方法
CN116597275A (zh) 一种基于数据增强的高速移动目标识别方法
CN112862767B (zh) 基于度量学习的解决难分不平衡样本的表面缺陷检测方法
Mosin et al. Comparing input prioritization techniques for testing deep learning algorithms
Yunhui et al. The strip steel surface defects classification method based on weak classifier adaptive enhancement
CN116150687A (zh) 一种基于多分类g-wlstsvm模型的流体管道泄漏识别方法
CN111985826B (zh) 一种多指标工业产品的可视化质量分级方法和系统
CN115049870A (zh) 一种基于小样本的目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant