CN114648077B - 一种用于多点位工业数据缺陷检测的方法及装置 - Google Patents

一种用于多点位工业数据缺陷检测的方法及装置 Download PDF

Info

Publication number
CN114648077B
CN114648077B CN202210539286.5A CN202210539286A CN114648077B CN 114648077 B CN114648077 B CN 114648077B CN 202210539286 A CN202210539286 A CN 202210539286A CN 114648077 B CN114648077 B CN 114648077B
Authority
CN
China
Prior art keywords
sample
data
samples
labeled
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210539286.5A
Other languages
English (en)
Other versions
CN114648077A (zh
Inventor
宋艳枝
汪方军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Gauss Intelligent Technology Co ltd
Original Assignee
Hefei Gauss Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Gauss Intelligent Technology Co ltd filed Critical Hefei Gauss Intelligent Technology Co ltd
Priority to CN202210539286.5A priority Critical patent/CN114648077B/zh
Publication of CN114648077A publication Critical patent/CN114648077A/zh
Application granted granted Critical
Publication of CN114648077B publication Critical patent/CN114648077B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及人工智能技术领域,解决了人力标注成本高且分类预测准确率低的技术问题,尤其涉及一种用于多点位工业数据缺陷检测的方法,包括以下过程:根据点位信息对第一样本数据集进行划分;将相同点位下的标准样本和无标签样本组成的样本对,输入孪生网络中并将输出结果作为伪标签;基于第一样本数据集所划分的样本和所述伪标签进行点位内的数据融合以获得第二样本数据集;基于第二样本数据集构造两个分支的分类损失函数并利用随机梯度下降法优化。本发明通过多点位数据信息实现了工业数据的半监督学习,有效地提高了样本利用率,提高了自训练孪生网络方法在工业数据上的预测准确率,还降低了工业数据的人力标注成本。

Description

一种用于多点位工业数据缺陷检测的方法及装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种用于多点位工业数据缺陷检测的方法及装置。
背景技术
质量控制是工业生产中一项十分重要的工序,而实现质量控制的一个重要途径是利用卷积神经网络进行缺陷分类,但卷积神经网络的训练需要大量的带有标签的样本,需要耗费大量人力。因此,对工业数据进行半监督学习是很有必要的,其中,自训练方法是实现半监督学习的一个重要方式。
自训练方法的基本思路是先利用少量标签样本进行模型的训练,再对无标签样本进行预测,然后利用预测结果辅助模型训练。自训练方法的两个代表性方法是MixMatch和FixMatch,MixMatch使用MixUp来对标签数据和无标签数据进行融合,FixMatch则是取无标签数据的预测概率最大的类别作为伪类别,并通过设置阈值对伪类别进行过滤。
目前,对于多点位工业数据,不同点位因为描述的是不同工业元件位置因而数据具有明显的差异性。比如,针对不同生产线的零件或者同一零件的不同位置都可视为不同点位。但是,MixUp没有考虑到工业数据的这种特性,使用全部数据进行融合操作,不管这个数据是不是来自不同点位,这样做的后果是融合了不同点位的可能也包含大量信息的背景,这些信息将成为干扰信息,从而导致网络难以学习缺陷特征;而FixMatch方法虽然没有这个问题,但其为了过滤噪声样本而设置了阈值,导致每次迭代都会过滤掉很多无标签样本,为此无标签样本的批量需要设置的很大,以保证有足够的无标签样本量来进行模型训练。
发明内容
针对现有技术的不足,本发明提供了一种用于多点位工业数据缺陷检测的方法及装置,利用工业数据的多点位信息,提出基于多点位工业数据缺陷检测的自训练孪生网络方法,从而有效利用无标签数据,节省大量的人力标注,并提高了模型预测准确率。
为解决上述技术问题,本发明提供了如下技术方案:一种用于多点位工业数据缺陷检测的方法,包括以下过程:
根据点位信息对第一样本数据集进行划分,得到多点位标准样本集、多点位有标签样本集和多点位无标签样本集,其中,所述第一样本数据集是指通过图像采集装置所采集的标准的合格产品图像样本和真实的加工缺陷图像样本,所述真实的加工缺陷图像样本包括未标注的无标签样本和采用人工进行标注的有标签样本;
将相同点位下的标准样本和无标签样本组成的样本对,输入到孪生网络进行预测并将输出结果作为伪标签;
基于所述第一样本数据集所划分的样本和所述伪标签进行点位内的数据融合以获得第二样本数据集,所述数据融合包括有标签数据融合和无标签数据融合,其中,所述有标签数据融合的策略是从有标签样本中分别抽取一批大小不大于有标签样本大小的标准样本集和有标签样本集进行有监督训练得到有标签数据的融合样本;所述无标签数据融合的策略是抽取与有标签样本相同点位且大小相等的数据作为无标签样本和所述伪标签进行有监督训练得到无标签数据的融合样本;
根据所述第二样本数据集构造两个分支的分类损失函数作为所述进行预测的孪生网络的损失函数,其中,所述两个分支的分类损失函数分别是在有标签样本上的损失函数和在无标签样本上的损失函数;
基于所述第二样本数据集,根据随机梯度下降法对自训练孪生网络进行训练优化;
将待测样本和相同点位下的标准样本输入训练完成的孪生网络,对待测样本进行分类。
进一步地,所述随机梯度下降法训练对自训练孪生网络进行训练优化过程中,利用自适应机制动态的获取所述随机梯度下降法的学习率参数。
进一步地,对待测样本进行分类之后还包括,输出所述待测样本的分类结果。
一种用于多点位工业数据缺陷检测的装置,包括:
数据划分单元,所述数据划分单元用于根据点位信息对第一样本数据集进行划分,得到多点位标准样本集、多点位有标签样本集和多点位无标签样本集,其中,所述第一样本数据集是指通过图像采集装置所采集的标准的合格产品图像样本和真实的加工缺陷图像样本,所述真实的加工缺陷图像样本包括未标注的无标签样本和采用人工进行标注的有标签样本;
伪标签获得单元,所述伪标签获得单元用于将相同点位下的标准样本和无标签样本组成的样本对,输入到孪生网络进行预测并将输出结果作为伪标签;
数据融合单元,所述数据融合单元用于基于所述第一样本数据集所划分的样本和所述伪标签进行点位内的数据融合以获得第二样本数据集;
损失函数构造单元,所述损失函数构造单元用于根据所述第二样本数据集构造两个分支的分类损失函数作为所述进行预测的孪生网络的损失函数;
模型训练单元,所述模型训练单元用于基于所述第二样本数据集,根据随机梯度下降法对自训练孪生网络进行训练优化;
模型预测单元,所述模型预测单元用于将待测样本和相同点位下的标准样本输入训练完成的孪生网络,对待测样本进行分类。
进一步地,还包括结果输出单元,所述结果输出单元用于输出所述待测样本的分类结果。
借由上述技术方案,本发明提供了一种用于多点位工业数据缺陷检测的方法及装置,至少具备以下有益效果:
1、本发明基于自训练方式,通过利用有多点位信息的工业数据对孪生网络进行预测,同时通过对多点位数据进行融合,有效利用无标签数据,从而降低了工业数据的人力标注成本。
2、本发明通过利用融合数据构造损失函数,再根据随机梯度下降法训练得到最优自训练孪生网络模型,具有较高的泛化能力,从而提高了自训练孪生网络方法在工业数据上的预测效果及预测效率。
本发明通过利用工业数据的多点位信息,对有多点位信息的工业数据进行数据融合,有效地提高了样本利用率,提高了自训练孪生网络方法在工业数据上的分类预测准确率,降低了工业数据的人力标注成本,达到了基于自训练方式对工业数据进行半监督学习的目的。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明一种用于多点位工业数据缺陷检测的方法一实施例的流程示意图;
图2为本发明一种用于多点位工业数据缺陷检测的装置一实施例的结构示意图;
图3为本发明一种用于多点位工业数据缺陷检测的方法的自训练孪生网络框架示意图;
图4为本发明一种用于多点位工业数据缺陷检测的方法另一实施例的流程示意图;
图5为本发明一种用于多点位工业数据缺陷检测的装置另一实施例的结构示意图。
图中:10、数据划分单元;20、伪标签获得单元;30、数据融合单元;40、损失函数构造单元;50、模型训练单元;60、模型预测单元;70、结果输出单元。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。借此对本申请如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
在发明中,孪生网络是由一对孪生的神经网络构成,这两个神经网络之间共享权值和偏置等参数,每个神经网络均由特征提取网络和相似度计算层组成。为了使得训练出的网络模型稳定性更好,泛化能力更佳,并使得缺陷检测准确度更高,本发明对孪生网络进行了改进,提出基于多点位工业数据缺陷检测的自训练孪生网络方法,旨在利用工业数据的多点位信息并基于自训练方式,达到实现工业数据半监督学习的目的。
实施例一
请参照图1-图3,示出了根据本发明实施例一的一种用于多点位工业数据缺陷检测的方法,如图1所示,包括以下步骤:
S101.根据点位信息对第一样本数据集进行划分,得到多点位标准样本集、多点位有标签样本集和多点位无标签样本集,其中,第一样本数据集是指通过图像采集装置所采集的标准的合格产品图像样本和真实的加工缺陷图像样本,真实的加工缺陷图像样本包括未标注的无标签样本和采用人工进行标注的有标签样本。
第一样本数据集的划分策略为:将所述第一样本数据集记为D,且第一样本数据集D相应的点位记为P,从D中抽取N个有标签样本,余下|D|−N个当作无标签样本来进行半监督训练,并且在抽取过程中保证每个点位抽取的样本中至少有一个标准样本;由于抽取的有标签样本数N有可能小于点位数目|P|,为此设定每个数值N对应的抽取点位数为
Figure 923275DEST_PATH_IMAGE001
,则每个点位抽取有标签样本数目为
Figure 292946DEST_PATH_IMAGE002
。在本实施例中,每个点位最少的采样数目为2。
在训练过程中,从各点位数据中抽取一批大小为B的有标签样本集,记为X;一批大小为B的无标签样本集,记为U;相对应的一批大小为B的标准样本集,记为S,且XUS的点位保持一一对应,有:
Figure 10366DEST_PATH_IMAGE003
Figure 356640DEST_PATH_IMAGE004
Figure 374275DEST_PATH_IMAGE005
其中,b指样本在样本集中的索引,
Figure 134420DEST_PATH_IMAGE006
指索引为b的单个有标签样本,
Figure 853983DEST_PATH_IMAGE007
指样本
Figure 724988DEST_PATH_IMAGE008
的标签,
Figure 82282DEST_PATH_IMAGE009
指索引为b的单个无标签样本,
Figure 13329DEST_PATH_IMAGE010
指索引为b的单个标准样本,OK指标准样本
Figure 220188DEST_PATH_IMAGE011
的标签为正常。
S102.将相同点位下的标准样本和无标签样本组成的样本对,输入到孪生网络进行预测并将输出结果作为伪标签。
如图3所示,在训练的每次迭代过程中,切换网络状态为测试状态,针对输入的标准样本s∈S和无标签样本u∈U组成的样本对(s,u),输入到孪生网络中进行预测,得到多分类结果的伪标签和相似度结果的伪标签,设多分类伪标签记为q,相似度伪标签记为r。
S103.基于所述第一样本数据集所划分的样本和所述伪标签进行点位内的数据融合以获得第二样本数据集,其中,所述数据融合包括有标签数据融合和无标签数据融合。
有标签数据的融合策略为:如步骤S101所述,对于有标签样本分别抽取一批大小为B(B≤N)的标准样本集S和有标签样本集X进行有监督训练,设抽取的标准样本和有标签样本分别为s和x,且
Figure 894883DEST_PATH_IMAGE012
Figure 109613DEST_PATH_IMAGE013
,其中,
Figure 211562DEST_PATH_IMAGE014
指索引为b的样本对应点位的索引,
Figure 905717DEST_PATH_IMAGE015
指点位索引
Figure 852944DEST_PATH_IMAGE016
对应的点位,
Figure 450410DEST_PATH_IMAGE017
指点位
Figure 457680DEST_PATH_IMAGE018
对应的标准样本集,
Figure 639132DEST_PATH_IMAGE019
指点位
Figure 655629DEST_PATH_IMAGE020
对应的有标签样本集,有:
Figure 839093DEST_PATH_IMAGE021
Figure 548423DEST_PATH_IMAGE022
Figure 686012DEST_PATH_IMAGE023
Figure 240621DEST_PATH_IMAGE024
Figure 547100DEST_PATH_IMAGE025
其中,Beta(α,α)是由参数α确定的Beta分布,λ指有标签样本和无标签样本的融合系数,
Figure 161752DEST_PATH_IMAGE026
Figure 52216DEST_PATH_IMAGE027
Figure 410517DEST_PATH_IMAGE028
Figure 586150DEST_PATH_IMAGE029
分别指标准样本s和有标签样本x的多分类标签和相似度标签,
Figure 637283DEST_PATH_IMAGE030
指在有标签样本上新构造的有标签融合样本,
Figure 749464DEST_PATH_IMAGE031
Figure 911455DEST_PATH_IMAGE032
分别指新构造的有标签融合样本对应的多分类融合标签和相似度融合标签,由此,得到用于训练的有标签融合样本及其融合标签组成的集合,记为
Figure 661368DEST_PATH_IMAGE033
无标签数据的融合策略为:在训练过程中,抽取与有标签样本相同点位的批次大小为B的无标签样本集U,如步骤S102所述多分类伪标签q和相似度伪标签r。设抽取的无标签样本为u且
Figure 883402DEST_PATH_IMAGE034
,其中,
Figure 482879DEST_PATH_IMAGE035
指点位
Figure 448561DEST_PATH_IMAGE036
对应的无标签样本集,有:
Figure 315629DEST_PATH_IMAGE037
Figure 442985DEST_PATH_IMAGE038
Figure 795338DEST_PATH_IMAGE040
Figure 33553DEST_PATH_IMAGE042
Figure 289216DEST_PATH_IMAGE043
其中,
Figure 321894DEST_PATH_IMAGE044
Figure 161543DEST_PATH_IMAGE045
分别是无标签样本 u 的多分类伪标签和相似度伪标签,
Figure 469027DEST_PATH_IMAGE046
指在无标签样本上新构造的无标签融合样本,
Figure 50968DEST_PATH_IMAGE047
Figure 785706DEST_PATH_IMAGE048
分别指新构造的无标签融合样本对应的多分类融合伪标签和相似度融合伪标签;在公式中,确保标准样本s、有标签样本x和无标签样本u这三项的权重之和为1。由此,得到用于训练的无标签融合样本及其融合伪标签组成的集合,记为
Figure 581492DEST_PATH_IMAGE049
需要说明的是,网络训练前期对无标签样本预测噪声比较大,为此可以通过减小α而降低
Figure 692668DEST_PATH_IMAGE050
的期望,从而降低无标签样本u的权重;而在后期,随着训练的稳定,慢慢增加α,整个过程使
Figure 391765DEST_PATH_IMAGE051
保持在[0,0.5]之间,避免权重过大,该过程用公式表示为:
Figure 31825DEST_PATH_IMAGE052
其中,e为当前迭代轮数,E为训练的总迭代轮次数目,
Figure 314907DEST_PATH_IMAGE053
取0.3,
Figure 964195DEST_PATH_IMAGE054
指迭代轮数为e时α的值,用于Beta分布产生
Figure 514868DEST_PATH_IMAGE055
S104.根据所述第二样本数据集构造两个分支的分类损失函数作为所述进行预测的孪生网络的损失函数,其中,所述两个分支的分类损失函数分别是在有标签样本上的损失函数和在无标签样本上的损失函数。
在有标签样本上的损失函数表示如下:
Figure 856988DEST_PATH_IMAGE057
在无标签样本上的损失函数表示如下:
Figure 361787DEST_PATH_IMAGE059
其中,
Figure 814765DEST_PATH_IMAGE060
为监督相似度损失,
Figure 222875DEST_PATH_IMAGE061
为监督缺陷分类损失,
Figure 470317DEST_PATH_IMAGE062
表示集合
Figure 727992DEST_PATH_IMAGE063
中元素数目,
Figure 984661DEST_PATH_IMAGE064
为无监督相似度损失,
Figure 238488DEST_PATH_IMAGE065
为无监督缺陷分类损失,
Figure 922410DEST_PATH_IMAGE066
表示集合
Figure 136223DEST_PATH_IMAGE067
中元素数目,
Figure 196583DEST_PATH_IMAGE068
为交叉熵损失函数,
Figure 313706DEST_PATH_IMAGE069
是相似度相关的符号,
Figure 168529DEST_PATH_IMAGE070
是用于多分类的符号,
Figure 400796DEST_PATH_IMAGE071
指模型相似度分支的输出,
Figure 733689DEST_PATH_IMAGE072
指模型多分类分支的输出,θ指模型的参数。为此,总的损失为
Figure 702388DEST_PATH_IMAGE073
S105.基于所述第二样本数据集,根据随机梯度下降法对自训练孪生网络进行训练优化,自训练孪生网络的框架结构如图3所示。
本实施例中,根据随机梯度下降法对自训练孪生网络进行训练优化过程中,利用自适应机制动态的获取随机梯度下降法的学习率参数,即当采取的步长较大时,希望梯度记忆的大小较大,当采取的步长较小,希望梯度记忆的大小较小。这种自适应机制使得随机梯度下降法的学习率随时间动态的自适应调整,能够提高训练模型的稳定性,提高检测结果的准确率。
采用自适应机制计算随机梯度下降法的学习率的过程如下所示:
Figure 993692DEST_PATH_IMAGE074
Figure 447676DEST_PATH_IMAGE075
Figure 318680DEST_PATH_IMAGE076
其中,η为步长,
Figure 410395DEST_PATH_IMAGE077
为第t步的自适应衰减速率,
Figure DEST_PATH_IMAGE078
为第t步迭代的梯度的移动方差,
Figure DEST_PATH_IMAGE079
为第t步的一阶梯度,常数ε为一个非常小的数(可防止分母为0),
Figure DEST_PATH_IMAGE080
为第t步迭代的权重值,
Figure DEST_PATH_IMAGE081
为第t步迭代的权重修正值。
S106.将待测样本和相同点位下的标准样本输入训练完成的孪生网络,对待测样本进行分类。具体为,根据给定的待测样本,获取和待测样本相同点位的标准样本并共同输入训练完成的孪生网络中,对待测样本进行预测。
需要说明的是,在实际质量控制过程中,标准样本能够为检测提供更多指导性信息,便于提高工作效率和准确度。
本实施例中,通过利用有多点位信息的工业数据对孪生网络进行预测,同时通过对多点位数据进行融合,并根据融合数据构造损失函数,再根据随机梯度下降法训练得到最优自训练孪生网络模型,使其具有较高的泛化能力,有效利用无标签样本,降低了工业数据的人力标注成本,提高了自训练方法在工业数据上的预测准确率及预测效率,具有较高的社会价值和应用前景。
实施例二
请参照图3-图5,示出了根据本发明实施例二的一种用于多点位工业数据缺陷检测的方法,该方法的步骤S201~S206分别与步骤S101~S106相同,并进一步包括步骤S207,该方法的步骤流程如图4所示,步骤S207包括:
S207,输出所述待测样本的分类结果。
本实施例中,可以对待测样本进行检测之后进行结果保存,这样的好处是能够实现对经检测后的产品进行有效管理。
本发明还提供一种用于多点位工业数据缺陷检测的装置,如图2所示,该装置包括:
数据划分单元10,数据划分单元10用于根据点位信息对第一样本数据集进行划分,得到多点位标准样本集、多点位有标签样本集和多点位无标签样本集,其中,第一样本数据集是指通过图像采集装置所采集的标准的合格产品图像样本和真实的加工缺陷图像样本,真实的加工缺陷图像样本包括未标注的无标签样本和采用人工进行标注的有标签样本;
伪标签获得单元20,伪标签获得单元20用于将相同点位下的标准样本和无标签样本组成的样本对,输入到孪生网络进行预测并将输出结果作为伪标签;
数据融合单元30,数据融合单元30用于基于所述第一样本数据集所划分的样本和所述伪标签进行点位内的数据融合以获得第二样本数据集;
损失函数构造单元40,损失函数构造单元40用于根据所述第二样本数据集构造两个分支的分类损失函数作为所述进行预测的孪生网络的损失函数;
模型训练单元50,模型训练单元50用于基于所述第二样本数据集,根据随机梯度下降法对自训练孪生网络进行训练优化;
模型预测单元60,模型预测单元60用于将待测样本和相同点位下的标准样本输入训练完成的孪生网络,对待测样本进行分类。
如图5所示,该装置还包括结果输出单元70,结果输出单元70用于输出所述待测样本的分类结果。
本发明通过利用工业数据的多点位信息,通过对多点位数据进行数据融合,有效地提高了样本利用率,提高了自训练方法在工业数据上的分类预测准确率,还降低了工业数据的人力标注成本,达到了基于自训练方式对工业数据进行半监督学习的目的。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于以上各实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上实施方式对本发明进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (5)

1.一种用于多点位工业数据缺陷检测的方法,其特征在于,包括以下过程:
根据点位信息对第一样本数据集进行划分,得到多点位标准样本集、多点位有标签样本集和多点位无标签样本集,其中,所述第一样本数据集是指通过图像采集装置所采集的标准的合格产品图像样本和真实的加工缺陷图像样本,所述真实的加工缺陷图像样本包括未标注的无标签样本和采用人工进行标注的有标签样本;
将相同点位下的标准样本和无标签样本组成的样本对,输入到孪生网络进行预测并将输出结果作为伪标签;
基于所述第一样本数据集所划分的样本和所述伪标签进行点位内的数据融合以获得第二样本数据集,所述数据融合包括有标签数据融合和无标签数据融合,其中,所述有标签数据融合的策略为从有标签样本中分别抽取一批大小不大于有标签样本大小的标准样本集和有标签样本集进行有监督训练得到有标签数据的融合样本;所述无标签数据融合的策略为抽取一批与有标签样本相同点位且大小相等的数据作为无标签样本集和所述伪标签进行有监督训练得到无标签数据的融合样本;
根据所述第二样本数据集构造两个分支的分类损失函数作为所述进行预测的孪生网络的损失函数,其中,所述两个分支的分类损失函数分别是在有标签样本上的损失函数和在无标签样本上的损失函数;
基于所述第二样本数据集,根据随机梯度下降法对自训练孪生网络进行训练优化;
将待测样本和相同点位下的标准样本输入训练完成的孪生网络,对待测样本进行分类。
2.根据权利要求1所述的一种用于多点位工业数据缺陷检测的方法,其特征在于,所述随机梯度下降法训练对自训练孪生网络进行训练优化过程中,利用自适应机制动态的获取随机梯度下降法的学习率参数。
3.根据权利要求1所述的一种用于多点位工业数据缺陷检测的方法,其特征在于,对待测样本进行分类之后还包括,输出所述待测样本的分类结果。
4.一种用于多点位工业数据缺陷检测的装置,其特征在于,包括:
数据划分单元(10),所述数据划分单元(10)用于根据点位信息对第一样本数据集进行划分,得到多点位标准样本集、多点位有标签样本集和多点位无标签样本集,其中,所述第一样本数据集是指通过图像采集装置所采集的标准的合格产品图像样本和真实的加工缺陷图像样本,所述真实的加工缺陷图像样本包括未标注的无标签样本和采用人工进行标注的有标签样本;
伪标签获得单元(20),所述伪标签获得单元(20)用于将相同点位下的标准样本和无标签样本组成的样本对,输入到孪生网络进行预测并将输出结果作为伪标签;
数据融合单元(30),所述数据融合单元(30)用于基于所述第一样本数据集所划分的样本和所述伪标签进行点位内的数据融合以获得第二样本数据集;
损失函数构造单元(40),所述损失函数构造单元(40)用于根据所述第二样本数据集构造两个分支的分类损失函数作为所述进行预测的孪生网络的损失函数;
模型训练单元(50),所述模型训练单元(50)用于基于所述第二样本数据集,根据随机梯度下降法对自训练孪生网络进行训练优化;
模型预测单元(60),所述模型预测单元(60)用于将待测样本和相同点位下的标准样本输入训练完成的孪生网络,对待测样本进行分类。
5.根据权利要求4所述的一种用于多点位工业数据缺陷检测的装置,其特征在于,还包括结果输出单元(70),所述结果输出单元(70)用于输出所述待测样本的分类结果。
CN202210539286.5A 2022-05-18 2022-05-18 一种用于多点位工业数据缺陷检测的方法及装置 Active CN114648077B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210539286.5A CN114648077B (zh) 2022-05-18 2022-05-18 一种用于多点位工业数据缺陷检测的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210539286.5A CN114648077B (zh) 2022-05-18 2022-05-18 一种用于多点位工业数据缺陷检测的方法及装置

Publications (2)

Publication Number Publication Date
CN114648077A CN114648077A (zh) 2022-06-21
CN114648077B true CN114648077B (zh) 2022-09-06

Family

ID=81996778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210539286.5A Active CN114648077B (zh) 2022-05-18 2022-05-18 一种用于多点位工业数据缺陷检测的方法及装置

Country Status (1)

Country Link
CN (1) CN114648077B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657455A (zh) * 2021-07-23 2021-11-16 西北工业大学 一种基于三重网络与标注一致性正则化的半监督学习方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106025658A (zh) * 2016-06-30 2016-10-12 西安蓝钻电子科技有限公司 一种便于识别接线准确的接线端子
US20180322623A1 (en) * 2017-05-08 2018-11-08 Aquifi, Inc. Systems and methods for inspection and defect detection using 3-d scanning
CN109582003B (zh) * 2018-12-03 2021-04-20 东北林业大学 基于伪标签半监督核局部费舍尔判别分析轴承故障诊断方法
US11645456B2 (en) * 2020-01-28 2023-05-09 Microsoft Technology Licensing, Llc Siamese neural networks for flagging training data in text-based machine learning
CN112784130B (zh) * 2021-01-27 2022-05-27 杭州网易云音乐科技有限公司 孪生网络模型训练、度量方法、装置、介质和设备
CN113592832A (zh) * 2021-08-05 2021-11-02 深圳职业技术学院 一种工业品缺陷检测方法和装置
CN113723482B (zh) * 2021-08-20 2024-04-02 西安电子科技大学 基于多示例孪生网络的高光谱目标检测方法
CN113935947A (zh) * 2021-09-09 2022-01-14 合肥高斯智能科技有限公司 一种基于多点位双分支模型的工业视觉缺陷检测方法
CN114241271B (zh) * 2021-11-16 2023-04-25 电子科技大学 一种多孪生迁移学习融合多信息的机械故障智能诊断方法
CN114299000A (zh) * 2021-12-24 2022-04-08 哈尔滨工业大学(深圳) 一种基于可微分神经网络架构搜索的缺陷检测方法及系统
CN114419464B (zh) * 2022-03-29 2022-07-26 南湖实验室 一种基于深度学习的孪生网络变化检测模型的构建方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657455A (zh) * 2021-07-23 2021-11-16 西北工业大学 一种基于三重网络与标注一致性正则化的半监督学习方法

Also Published As

Publication number Publication date
CN114648077A (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
CN112699247B (zh) 一种基于多类交叉熵对比补全编码的知识表示学习方法
CN111126386B (zh) 场景文本识别中基于对抗学习的序列领域适应方法
CN109492026B (zh) 一种基于改进的主动学习技术的电信欺诈分类检测方法
CN109816032B (zh) 基于生成式对抗网络的无偏映射零样本分类方法和装置
CN114444986B (zh) 产品分析方法及系统及装置及介质
CN111552803B (zh) 一种基于图小波网络模型的文本分类方法
CN112685504B (zh) 一种面向生产过程的分布式迁移图学习方法
CN112069310A (zh) 基于主动学习策略的文本分类方法及系统
CN108364073A (zh) 一种多标记学习方法
Chu et al. Co-training based on semi-supervised ensemble classification approach for multi-label data stream
CN108596204B (zh) 一种基于改进型scdae的半监督调制方式分类模型的方法
CN114912423A (zh) 一种基于迁移学习的方面级别情感分析方法及装置
CN110796260B (zh) 一种基于类扩张学习的神经网络模型优化方法
CN112668633B (zh) 一种基于细粒度领域自适应的图迁移学习方法
CN114329124A (zh) 基于梯度重优化的半监督小样本分类方法
CN114662793A (zh) 基于可解释分层模型的业务流程剩余时间预测方法与系统
CN113705215A (zh) 一种基于元学习的大规模多标签文本分类方法
CN112163069B (zh) 一种基于图神经网络节点特征传播优化的文本分类方法
CN111783688B (zh) 一种基于卷积神经网络的遥感图像场景分类方法
CN114648077B (zh) 一种用于多点位工业数据缺陷检测的方法及装置
CN116701647A (zh) 基于嵌入向量与迁移学习融合的知识图谱补全方法及装置
CN116052168A (zh) 基于单目标域图像的跨域语义分割模型生成方法及装置
CN111708896B (zh) 一种应用于生物医学文献的实体关系抽取方法
CN112348275A (zh) 一种基于在线增量学习的区域生态环境变化预测方法
CN111460160A (zh) 一种基于强化学习的流式文本数据的事件聚类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant