CN116341650A - 一种基于噪声自训练的铁路货车螺栓丢失检测方法 - Google Patents

一种基于噪声自训练的铁路货车螺栓丢失检测方法 Download PDF

Info

Publication number
CN116341650A
CN116341650A CN202310290729.6A CN202310290729A CN116341650A CN 116341650 A CN116341650 A CN 116341650A CN 202310290729 A CN202310290729 A CN 202310290729A CN 116341650 A CN116341650 A CN 116341650A
Authority
CN
China
Prior art keywords
model
data set
training
noise
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310290729.6A
Other languages
English (en)
Other versions
CN116341650B (zh
Inventor
何鑫淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Kejia General Mechanical and Electrical Co Ltd
Original Assignee
Harbin Kejia General Mechanical and Electrical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Kejia General Mechanical and Electrical Co Ltd filed Critical Harbin Kejia General Mechanical and Electrical Co Ltd
Priority to CN202310290729.6A priority Critical patent/CN116341650B/zh
Publication of CN116341650A publication Critical patent/CN116341650A/zh
Application granted granted Critical
Publication of CN116341650B publication Critical patent/CN116341650B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/096Transfer learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

一种基于噪声自训练的铁路货车螺栓丢失检测方法,涉及铁路货车故障检测技术领域。本发明是为了解决现有通过深度学习模型对螺栓丢失故障的检测方法,人工标记影响模型性能,并且模型学习能力差,导致检测结果不准确的问题。本发明将被测图像输入至训练好的铁路货车螺栓丢失检测模型进行检测获得检测结果,训练过程为:利用数据集DGT对模型M50进行训练获得模型
Figure DDA0004141346720000011
对模型
Figure DDA0004141346720000012
进行带有噪声的自训练获得模型
Figure DDA0004141346720000013
采用逆向知识蒸馏法使模型M101向模型
Figure DDA0004141346720000014
学习,获得模型
Figure DDA0004141346720000015
对模型
Figure DDA0004141346720000016
进行带有噪声的自训练获得铁路货车螺栓丢失检测模型。

Description

一种基于噪声自训练的铁路货车螺栓丢失检测方法
技术领域
本发明属于铁路货车故障检测技术领域。
背景技术
螺栓丢失检测任务的目标是检测铁路货车的螺栓是否存在丢失,一般方法是通过目标检测的方法检测图像内的螺栓数量,并通过对比得出是否出现螺栓丢失异常。因此模型对于图像内螺栓的特征表征能力和检测能力对任务来说是最重要的。传统的铁路货车螺栓丢失任务中的模型训练方法依赖大量人工标注的带有螺栓位置、类别信息的图像数据集,再使用深度学习模型对图像进行目标检测及后处理。这种训练方法有很多弊端。首先,模型的性能依赖数据集的数量以及质量,人工标注的误差等会影响模型最终的性能。其次,模型在每一步迭代过程中接受的数据是相同的,即每次迭代都是由训练数据集中的全部数据进行训练,模型很容易只学习到数据集中的特征分布,从而在实际下游任务中表现较差。最终使得检测结果不准确。
发明内容
本发明是为了解决现有通过深度学习模型对螺栓丢失故障的检测方法,人工标记影响模型性能,并且模型学习能力差,导致检测结果不准确的问题,现提供一种基于噪声自训练的铁路货车螺栓丢失检测方法。
一种基于噪声自训练的铁路货车螺栓丢失检测方法,将被测图像输入至训练好的铁路货车螺栓丢失检测模型进行检测,获得检测结果,
所述铁路货车螺栓丢失检测模型的训练过程如下:
步骤一:利用数据集DGT对模型M50进行训练获得模型
Figure BDA0004141346700000011
训练过程中模型M50的第一层权重不变,所述模型M50为在ImageNet数据集上经过预训练的骨干网络为Resnet-50的faster-rcnn模型,所述数据集DGT为训练数据集D中人工标记的数据所构成的集合;
步骤二:对模型
Figure BDA0004141346700000012
进行带有噪声的自训练获得模型/>
Figure BDA0004141346700000013
训练过程中模型M50的第一层权重不变;
步骤三:采用逆向知识蒸馏法使模型M101向模型
Figure BDA0004141346700000014
学习,获得模型/>
Figure BDA0004141346700000015
所述模型M101为骨干网络为Resnet-101的faster-rcnn模型;
步骤四:对模型
Figure BDA0004141346700000021
进行带有噪声的自训练获得模型M,将模型M作为铁路货车螺栓丢失检测模型,训练过程中模型/>
Figure BDA0004141346700000022
的第一层权重不变。
进一步的,上述训练数据集D为全部铁路货车螺栓丢失异常检测数据集,
在训练数据集D的正常数据集DN中选取20%的数据进行人工标注,获得数据集
Figure BDA0004141346700000023
在训练数据集D的异常数据集DA中选取20%的数据进行人工标注,获得数据集
Figure BDA0004141346700000024
将数据集
Figure BDA0004141346700000025
与数据集/>
Figure BDA0004141346700000026
合并,获得数据集DGT
进一步的,上述步骤二具体为:
利用模型
Figure BDA0004141346700000027
在数据集DU上进行推理,获得带有软标签的数据集/>
Figure BDA0004141346700000028
所述数据集DU为训练数据集D中除人工标记的数据外剩余数据所构成的集合,
在数据集
Figure BDA0004141346700000029
和数据集DGT中加入数据噪声分别获得数据集/>
Figure BDA00041413467000000210
和数据集NDGT,利用数据集DT2对加入结构噪声的模型/>
Figure BDA00041413467000000211
进行训练,获得模型/>
Figure BDA00041413467000000212
所述数据集
Figure BDA00041413467000000213
进一步的,上述使用dropout作为结构噪声加入到模型
Figure BDA00041413467000000214
中。
进一步的,上述步骤三为:
利用模型
Figure BDA00041413467000000215
分别在数据集DU和数据集DGT上进行推理,分别获得带有软标签的数据集Ds和数据集/>
Figure BDA00041413467000000216
所述数据集DU为训练数据集D中除人工标记的数据外剩余数据所构成的集合,分别在数据集Ds、/>
Figure BDA00041413467000000217
和DGT中加入噪声获得数据集NDs、/>
Figure BDA00041413467000000218
和NDGT
将模型
Figure BDA00041413467000000219
作为教师网络,将加入结构噪声的模型M101作为学生网络,利用数据集DT3采用知识蒸馏法对学生网络进行训练,获得模型/>
Figure BDA00041413467000000220
所述数据集
Figure BDA00041413467000000221
进一步的,上述选择随机深度方法向模型M101中加入结构噪声。
进一步的,上述步骤四具体为:
利用模型
Figure BDA00041413467000000222
在数据集DU上进行推理,获得带有软标签的数据集/>
Figure BDA00041413467000000223
所述数据集DU为训练数据集D中除人工标记的数据外剩余数据所构成的集合,
分别在数据集
Figure BDA0004141346700000031
和数据集DGT中加入数据噪声获得数据集/>
Figure BDA0004141346700000032
和NDGT
利用数据集DT4对加入结构噪声的模型
Figure BDA0004141346700000033
进行训练,获得模型M,
所述数据集
Figure BDA0004141346700000034
进一步的,上述使用dropout作为结构噪声加入到模型
Figure BDA0004141346700000035
中。
进一步的,上述向数据集中加入的数据噪声的方法为:
将数据集中的RGB图像换为YUV图像,
依据下式对YUV图像的亮度进行调整,以实现向数据集中加入数据噪声:
Figure BDA0004141346700000036
其中,I和I_output分别为YUV图像调整前与调整后的亮度,mean为YUV图像的平均亮度,当图像变暗调整时p=-1,当图像变亮调整时p=1。
进一步的,上述向数据集中加入数据噪声的方法还包括:
对数据集中尺寸为(H,W)的图像边缘进行随机剪裁,裁剪后的图像尺寸为((1-α12)H,(1-α34)W),其中,α1、α2、α3和α4分别为图像四个边界的裁剪系数,且有α1≠α2≠α3≠α4,αi∈(0,0.2),i=1,2,3,4,H和W分别为图像的高度和宽度,
然后将尺寸为((1-α12)H,(1-α34)W)的图像尺寸还原为(H,W)。
本发明的有益效果如下:
1、本发明的铁路货车螺栓丢失检测方法,能够在仅有少量标注数据集的情况下完成对深度学习模型的训练,极大地减少了人工参与的工作量。
2、本发明的知识蒸馏的方法将已有模型的特征表征能力迁移到一个结构更复杂的模型,作为对结构复杂模型的预训练过程,通过继续对结构复杂模型迭代来避免由于结构局限性造成的识别性能瓶颈。
3、本发明通过随机对图像调整亮度以及对图像进行剪裁后重建的方式实现对数据集添加数据噪声,使深度学习网络模型在训练过程中学习到图像的不同特征表征,进而增强网络模型的鲁棒性,使模型更适用于真实场景的应用。
附图说明
图1为铁路货车螺栓丢失检测模型的训练流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
具体实施方式一:参照图1具体说明本实施方式,本实施方式所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法,将被测图像输入至训练好的铁路货车螺栓丢失检测模型进行检测,获得检测结果。
铁路货车螺栓丢失检测模型的训练过程如下:
训练数据集D为全部铁路货车螺栓丢失异常检测数据集,该训练数据集D包括人工标记的数据所构成的集合DGT、以及除人工标记的数据外剩余数据所构成的集合DU。在训练数据集D的正常数据集DN中选取20%的数据进行人工标注,获得数据集
Figure BDA0004141346700000041
在训练数据集D的异常数据集DA中选取20%的数据进行人工标注,获得数据集/>
Figure BDA0004141346700000042
将数据集/>
Figure BDA0004141346700000043
与数据集
Figure BDA0004141346700000044
合并,获得数据集DGT
选择骨干网络为Resnet-50的faster-rcnn作为模型M50。选择骨干网络为Resnet-101的faster-rcnn作为结构较为复杂的模型M101。模型M50的骨干网络Resnet-50为已经在ImageNet数据集上预训练好的模型,模型M101的骨干网络Resnet-101为没有经过预训练的模型。
步骤一:利用数据集DGT对模型M50进行训练获得模型
Figure BDA0004141346700000045
训练过程中模型M50的第一层权重不变,所述模型M50为在ImageNet数据集上经过预训练的骨干网络为Resnet-50的faster-rcnn模型。
在图像处理领域中,深度神经网络的浅层卷积层主要用来提取图像的浅层次特征信息,例如图像轮廓、色彩等信息,浅层卷积层的功能并不随着下游任务的改变而出现变化,因此保留已经预训练模型M50的第一层权重用来提取图像浅层特征。上述训练过程中与传统的深度学习训练过程相同。
步骤二:利用模型
Figure BDA0004141346700000051
在数据集DU上进行推理,获得带有软标签的数据集/>
Figure BDA0004141346700000052
在该过程中,分别在数据集/>
Figure BDA0004141346700000053
和数据集DGT中加入数据噪声,获得数据集/>
Figure BDA0004141346700000054
和数据集NDGT。使用dropout作为结构噪声加入到模型/>
Figure BDA0004141346700000055
中,防止模型在训练过程中过拟合。利用数据集DT2对加入结构噪声的模型/>
Figure BDA0004141346700000056
进行带有噪声的自训练,重复迭代N次获得模型/>
Figure BDA0004141346700000057
所述数据集/>
Figure BDA0004141346700000058
步骤三:采用逆向知识蒸馏法使模型M101学习到已经训练好的模型
Figure BDA0004141346700000059
的表征能力,获得模型/>
Figure BDA00041413467000000510
具体过程如下:
利用模型
Figure BDA00041413467000000511
分别在数据集DU和数据集DGT上进行推理,分别获得带有软标签的数据集Ds和数据集/>
Figure BDA00041413467000000512
分别在数据集Ds、/>
Figure BDA00041413467000000513
和DGT中加入数据噪声获得数据集NDs、/>
Figure BDA00041413467000000514
和NDGT。将模型/>
Figure BDA00041413467000000515
作为教师网络,将加入结构噪声的模型M101作为学生网络,选择随机深度方法向模型M101中加入结构噪声,以加快训练速度,同时增加模型的特征表征能力。利用数据集DT3采用知识蒸馏法对学生网络进行训练,训练过程固定模型的第一层卷积层,获得模型
Figure BDA00041413467000000516
所述数据集/>
Figure BDA00041413467000000517
步骤四:利用模型
Figure BDA00041413467000000518
在数据集DU上进行推理,获得带有软标签的数据集/>
Figure BDA00041413467000000519
分别在数据集/>
Figure BDA00041413467000000520
和数据集DGT中加入数据噪声获得数据集/>
Figure BDA00041413467000000521
和NDGT。使用dropout作为结构噪声加入到模型/>
Figure BDA00041413467000000522
中,防止模型在训练过程中过拟合。利用数据集DT4对加入结构噪声的模型/>
Figure BDA00041413467000000523
进行训练,训练过程固定模型的第一层卷积层,重复迭代N次获得模型M。
所述数据集
Figure BDA00041413467000000524
传统知识蒸馏的方法选择结构复杂、准确率高的神经网络作为教师网络,选择结构简单、计算量低的神经网络作为学生网络,通过迭代和反向传播算法让学生网络学习到教师网络的表征能力,使结构简单的小网络具有与结构复杂的大网络相似的准确率,从而实现压缩模型、提升模型识别效率。然而,传统的知识蒸馏算法会对模型准确率造成一定影响,因此在本实施方式中使用了一种新的知识蒸馏方法来进一步提升深度模型网络的识别准确率,从而提升铁路货车螺栓丢失检测任务的准确率。本实施方式首先通过对数据集中部分数据进行人工标注得到带有标签的图像数据集,使用传统方法训练一个结构较为简单的模型M50,再用训练好的模型M50对未进行标注的部分数据集进行推理,得到模型预测出的数据标签(也成为软标签)。在随后的每一步迭代训练中,将人工标注的数据集和模型预测得到的软标签数据集合并,并在合并后的数据集中随机加入数据噪声,同时在模型中加入结构噪声,使用加入噪声的数据集对加入结构噪声的模型进行迭代训练。
同时,本实施方式选择一个结构较为复杂的模型M101作为学生网络,上述步骤得到的网络作为教师网络,进行知识蒸馏。最后再对学生网络重复上述训练过程,得到最终的模型。本实施方式中的知识蒸馏方法使用模型结构较为简单的模型作为教师网络,选择模型结构复杂的网络作为学生网络。教师网络的作用是为学生网络提供对于原训练数据集中图像的软标签信息。最终模型对于螺栓的检测效果要优于直接训练得到的骨干网络为Resnet-101的faster-rcnn以及骨干网络为Resnet-50的faster-rcnn.。
通过以上四步训练,让结构简单的Resnet-50模型进行带有噪声的自训练,不断优化自身的特征表征能力。然后让已经自训练好的Resnet-50作为教师网络,使用逆向知识蒸馏方法将已经学习到的特征表征能力指导学生网络Resnet-101进行学习。本实施方式选择未预训练的Resnet-101是因为学生网络能够通过教师网络的指导进行学习,而教师网络是已经在通用数据集ImageNet上预训练后,且在下游任务领域数据集进行过自训练的成熟网络,学生网络的卷积结构能够通过教师网络更好地学习到基于下游任务的特征检测能力。最后再对经过教师网络指导学习的Resnet-101进行带有噪声的自训练,进一步针对下游任务优化模型性能。
本实施方式在训练过程中使用基于自训练的思想,让模型在训练过程中自身对未标注的数据集进行识别,得到软标签,这样模型在训练过程中不断优化数据集,再用优化后的数据集训练,进一步提升性能。同时在训练过程中加入了数据噪声和模型结构噪声。数据噪声使模型在自训练过程中出现随机的数据增强,让模型在每一步迭代中都遇到不同的图像特征,进而增强模型对不同图像特征的表征能力。结构噪声让模型在训练过程中随机屏蔽一部分网络结构,使模型在训练过程出现信息缺失,迫使模型在信息缺失的情况下也能够正确的预测出目标位置,进而提高模型性能。同时,本实施方式解决了模型在训练过程中由于模型结构导致的局限性。新知识蒸馏的方法将已有模型的特征表征能力迁移到一个结构更复杂的模型,作为对结构复杂模型的预训练过程,通过继续对结构复杂模型迭代来避免由于结构局限性造成的识别性能瓶颈。
具体实施方式二:本实施方式是对具体实施方式以所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法作进一步说明,本实施方式中,向数据集中加入的数据噪声的方法能够针对不同的下游任务实现自适应地对图像数据添加噪声。本实施方式的自适应数据噪声主要分为两部分:
第一、图像亮度调整。
将数据集中的RGB图像换为YUV图像。其中Y表示明亮度(Luminance/Luma),也称灰度值(灰阶值)。UY表示色度(Chrominance/Chroma),均表示影响的色彩和饱和度,用于指定像素的颜色。YUV都使用8个字节来表示,所以取值范围就是0~255。
然后计算输入图像的平均亮度mean。
由于对输入图像加入一个自适应的亮度变换,即根据输入图像的不同,亮度调整的方式也会不同。而对于数据集来说,如果将亮度很低的图像再降低亮度就会造成图像过黑,反之则会造成图像过曝,过黑和过曝的图像表达的信息会减少甚至扭曲,因此过黑或过曝的图像在数据集中会成为离群噪点,成为无用数据,非但不能让模型更好的学会图像特征表达,还会让模型训练过程中的梯度出现骤变,影响模型最终效果。因此本实施方式中图像亮度调整方法要避免造成过黑或过曝的图像。依据下式对YUV图像的亮度进行调整,以实现向数据集中加入数据噪声:
Figure BDA0004141346700000071
其中,I和I_output分别为YUV图像调整前与调整后的亮度。mean为YUV图像的平均亮度。p为调整图像是变暗还是变亮的开关,是一个以概率取值的变量,当图像变暗调整时p=-1,当图像变亮调整时p=1。
Figure BDA0004141346700000072
即当图像越亮时,p=-1的概率越大,即图像变暗调整的可能性越大;图像越暗时,p=1的可能性更大,即图像变量调整的可能性越大。本实施方式的自适应亮度调整方法能够根据图像自身的亮度决定调整亮度的方向,对较暗图像倾向于向亮度提升的方向进行调整,反之亦然。同时显示了亮度边界条件,防止出现过暗或过曝图像影响训练。
第二、图像随机剪裁后重建
数据集的数据在训练之前需要统一调整为相同的尺寸,这个尺寸记为(H,W)。对于一张输入图像来说,图像分类任务领域内任务待分类图像的主体位于图像中心,因此需要对图像边缘进行随机剪裁,剪裁系数αi∈(0,0.2)。
对数据集中尺寸为(H,W)的图像边缘进行随机剪裁,裁剪后的图像尺寸为((1-α12)H,(1-α34)W),其中,α1、α2、α3和α4分别为图像四个边界的裁剪系数,且有α1≠α2≠α3≠α4,αi∈(0,0.2),i=1,2,3,4,H和W分别为图像的高度和宽度。新图像的尺寸要小于原输入图像,因此再使用双线性插值,将图像扩充为尺寸(H,W)的重建图像。这样做的好处是可以在不损害图像主体本身的前提下对图像背景信息加入一定程度的噪声。
本实施方式能够让每一张图像在每一次迭代都随机的产生不同的图像噪声,而且可以根据图像自身的尺寸、亮度等信息决定图像噪声产生的方向和程度,即避免了人工添加噪声的单一性可能让模型学习到单一方向的图像特征,也避免了由于随机性导致图像过暗或过曝对训练过程造成影响。
虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其它所述实施例中。

Claims (10)

1.一种基于噪声自训练的铁路货车螺栓丢失检测方法,将被测图像输入至训练好的铁路货车螺栓丢失检测模型进行检测,获得检测结果,其特征在于,
所述铁路货车螺栓丢失检测模型的训练过程如下:
步骤一:利用数据集DGT对模型M50进行训练获得模型
Figure FDA0004141346690000011
训练过程中模型M50的第一层权重不变,所述模型M50为在ImageNet数据集上经过预训练的骨干网络为Resnet-50的faster-rcnn模型,所述数据集DGT为训练数据集D中人工标记的数据所构成的集合;
步骤二:对模型
Figure FDA0004141346690000012
进行带有噪声的自训练获得模型/>
Figure FDA0004141346690000013
训练过程中模型M50的第一层权重不变;
步骤三:采用逆向知识蒸馏法使模型M101向模型
Figure FDA0004141346690000014
学习,获得模型/>
Figure FDA0004141346690000015
所述模型M101为骨干网络为Resnet-101的faster-rcnn模型;
步骤四:对模型
Figure FDA0004141346690000016
进行带有噪声的自训练获得模型M,将模型M作为铁路货车螺栓丢失检测模型,训练过程中模型/>
Figure FDA0004141346690000017
的第一层权重不变。
2.根据权利要求1所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法,其特征在于,训练数据集D为全部铁路货车螺栓丢失异常检测数据集,
在训练数据集D的正常数据集DN中选取20%的数据进行人工标注,获得数据集
Figure FDA0004141346690000018
在训练数据集D的异常数据集DA中选取20%的数据进行人工标注,获得数据集
Figure FDA0004141346690000019
将数据集/>
Figure FDA00041413466900000110
与数据集/>
Figure FDA00041413466900000111
合并,获得数据集DGT
3.根据权利要求2所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法,其特征在于,步骤二具体为:
利用模型
Figure FDA00041413466900000112
在数据集DU上进行推理,获得带有软标签的数据集/>
Figure FDA00041413466900000113
所述数据集DU为训练数据集D中除人工标记的数据外剩余数据所构成的集合,
在数据集
Figure FDA00041413466900000114
和数据集DGT中加入数据噪声分别获得数据集/>
Figure FDA00041413466900000115
和数据集NDGT,利用数据集DT2对加入结构噪声的模型/>
Figure FDA00041413466900000116
进行训练,获得模型/>
Figure FDA00041413466900000117
所述数据集
Figure FDA00041413466900000118
4.根据权利要求3所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法,其特征在于,使用dropout作为结构噪声加入到模型
Figure FDA0004141346690000021
中。
5.根据权利要求2所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法,其特征在于,步骤三为:
利用模型
Figure FDA0004141346690000022
分别在数据集DU和数据集DGT上进行推理,分别获得带有软标签的数据集Ds和数据集/>
Figure FDA0004141346690000023
所述数据集DU为训练数据集D中除人工标记的数据外剩余数据所构成的集合,分别在数据集Ds、/>
Figure FDA0004141346690000024
和DGT中加入噪声获得数据集NDs、/>
Figure FDA0004141346690000025
和NDGT
将模型
Figure FDA0004141346690000026
作为教师网络,将加入结构噪声的模型M101作为学生网络,利用数据集DT3采用知识蒸馏法对学生网络进行训练,获得模型/>
Figure FDA0004141346690000027
所述数据集
Figure FDA0004141346690000028
6.根据权利要求5所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法,其特征在于,选择随机深度方法向模型M101中加入结构噪声。
7.根据权利要求2所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法,其特征在于,步骤四具体为:
利用模型
Figure FDA0004141346690000029
在数据集DU上进行推理,获得带有软标签的数据集/>
Figure FDA00041413466900000210
所述数据集DU为训练数据集D中除人工标记的数据外剩余数据所构成的集合,
分别在数据集
Figure FDA00041413466900000211
和数据集DGT中加入数据噪声获得数据集/>
Figure FDA00041413466900000212
和NDGT
利用数据集DT4对加入结构噪声的模型
Figure FDA00041413466900000213
进行训练,获得模型M,
所述数据集
Figure FDA00041413466900000214
8.根据权利要求7所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法,其特征在于,使用dropout作为结构噪声加入到模型
Figure FDA00041413466900000215
中。
9.根据权利要求3、4、5、6、7或8所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法,其特征在于,向数据集中加入的数据噪声的方法为:
将数据集中的RGB图像换为YUV图像,
依据下式对YUV图像的亮度进行调整,以实现向数据集中加入数据噪声:
Figure FDA0004141346690000031
其中,I和I_output分别为YUV图像调整前与调整后的亮度,mean为YUV图像的平均亮度,当图像变暗调整时p=-1,当图像变亮调整时p=1。
10.根据权利要求9所述的一种基于噪声自训练的铁路货车螺栓丢失检测方法,其特征在于,向数据集中加入数据噪声的方法还包括:
对数据集中尺寸为(H,W)的图像边缘进行随机剪裁,裁剪后的图像尺寸为((1-α12)H,(1-α34)W),其中,α1、α2、α3和α4分别为图像四个边界的裁剪系数,且有α1≠α2≠α3≠α4,αi∈(0,0.2),i=1,2,3,4,H和W分别为图像的高度和宽度,
然后将尺寸为((1-α12)H,(1-α34)W)的图像尺寸还原为(H,W)。
CN202310290729.6A 2023-03-23 2023-03-23 一种基于噪声自训练的铁路货车螺栓丢失检测方法 Active CN116341650B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310290729.6A CN116341650B (zh) 2023-03-23 2023-03-23 一种基于噪声自训练的铁路货车螺栓丢失检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310290729.6A CN116341650B (zh) 2023-03-23 2023-03-23 一种基于噪声自训练的铁路货车螺栓丢失检测方法

Publications (2)

Publication Number Publication Date
CN116341650A true CN116341650A (zh) 2023-06-27
CN116341650B CN116341650B (zh) 2023-12-26

Family

ID=86881827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310290729.6A Active CN116341650B (zh) 2023-03-23 2023-03-23 一种基于噪声自训练的铁路货车螺栓丢失检测方法

Country Status (1)

Country Link
CN (1) CN116341650B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116843985A (zh) * 2023-09-01 2023-10-03 中国地质调查局武汉地质调查中心 一种基于多重一致性约束的矿区图像半监督分类方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111652212A (zh) * 2020-05-21 2020-09-11 哈尔滨市科佳通用机电股份有限公司 基于深度学习的交叉杆端部紧固螺栓丢失故障检测方法
CN114090770A (zh) * 2021-10-19 2022-02-25 杭州电子科技大学 一种多阶段的无监督域适应因果关系识别方法
US20220083840A1 (en) * 2020-09-11 2022-03-17 Google Llc Self-training technique for generating neural network models
CN114331971A (zh) * 2021-12-08 2022-04-12 之江实验室 一种基于半监督自训练的超声内镜目标检测方法
CN114399640A (zh) * 2022-03-24 2022-04-26 之江实验室 一种不确定区域发现与模型改进的道路分割方法及装置
US20220129731A1 (en) * 2021-05-27 2022-04-28 Beijing Baidu Netcom Science Technology Co., Ltd. Method and apparatus for training image recognition model, and method and apparatus for recognizing image
US20230033768A1 (en) * 2021-07-30 2023-02-02 Zoom Video Communications, Inc. Noisy Far-Field Speech Recognition
CN115690708A (zh) * 2022-10-21 2023-02-03 苏州轻棹科技有限公司 基于跨模态知识蒸馏训练三维目标检测模型的方法和装置
US20230162049A1 (en) * 2020-04-03 2023-05-25 Presagen Pty Ltd Artificial intelligence (ai) method for cleaning data for training ai models

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230162049A1 (en) * 2020-04-03 2023-05-25 Presagen Pty Ltd Artificial intelligence (ai) method for cleaning data for training ai models
CN111652212A (zh) * 2020-05-21 2020-09-11 哈尔滨市科佳通用机电股份有限公司 基于深度学习的交叉杆端部紧固螺栓丢失故障检测方法
US20220083840A1 (en) * 2020-09-11 2022-03-17 Google Llc Self-training technique for generating neural network models
US20220129731A1 (en) * 2021-05-27 2022-04-28 Beijing Baidu Netcom Science Technology Co., Ltd. Method and apparatus for training image recognition model, and method and apparatus for recognizing image
US20230033768A1 (en) * 2021-07-30 2023-02-02 Zoom Video Communications, Inc. Noisy Far-Field Speech Recognition
CN114090770A (zh) * 2021-10-19 2022-02-25 杭州电子科技大学 一种多阶段的无监督域适应因果关系识别方法
CN114331971A (zh) * 2021-12-08 2022-04-12 之江实验室 一种基于半监督自训练的超声内镜目标检测方法
CN114399640A (zh) * 2022-03-24 2022-04-26 之江实验室 一种不确定区域发现与模型改进的道路分割方法及装置
CN115690708A (zh) * 2022-10-21 2023-02-03 苏州轻棹科技有限公司 基于跨模态知识蒸馏训练三维目标检测模型的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
QIZHE XIE ET AL.: "Self-training with noisy student improves imagenet classification", ARXIV:1911.04252V4[CS.LG] *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116843985A (zh) * 2023-09-01 2023-10-03 中国地质调查局武汉地质调查中心 一种基于多重一致性约束的矿区图像半监督分类方法
CN116843985B (zh) * 2023-09-01 2023-11-17 中国地质调查局武汉地质调查中心 一种基于多重一致性约束的矿区图像半监督分类方法

Also Published As

Publication number Publication date
CN116341650B (zh) 2023-12-26

Similar Documents

Publication Publication Date Title
CN109165697B (zh) 一种基于注意力机制卷积神经网络的自然场景文字检测方法
CN113313657A (zh) 一种用于低光照图像增强的非监督学习方法和系统
CN108986050B (zh) 一种基于多分支卷积神经网络的图像和视频增强方法
CN109872285B (zh) 一种基于变分约束的Retinex低照度彩色图像增强方法
CN113628152B (zh) 一种基于多尺度特征选择性融合的暗光图像增强方法
CN104268843A (zh) 基于直方图修饰的图像自适应增强方法
CN116341650B (zh) 一种基于噪声自训练的铁路货车螺栓丢失检测方法
US20130039577A1 (en) Method for improving image quality
CN112651917A (zh) 一种基于生成对抗网络的空间卫星低照度图像增强方法
CN114511479A (zh) 图像增强方法和装置
KR102277005B1 (ko) 비지도 학습을 이용한 저조도 영상 처리 방법 및 장치
CN113191956A (zh) 基于深度抠图的逆光图像增强方法
CN113947553B (zh) 一种图像亮度增强方法及设备
Bhandari et al. Multi-exposure optimized contrast and brightness balance color image enhancement
CN112991236B (zh) 一种基于模板的图像增强方法及装置
Zhuang et al. Image enhancement by deep learning network based on derived image and retinex
CN117611467A (zh) 一种能同时平衡不同区域细节和亮度的低光图像增强方法
CN117689550A (zh) 基于渐进式生成对抗网络的低光图像增强方法及装置
CN117422653A (zh) 一种基于权重共享和迭代数据优化的低光照图像增强方法
He et al. Low-light image enhancement combined with attention map and u-net network
CN116363015A (zh) 一种基于Retinex理论和卷积神经网络的低照度图像增强方法
Dixit et al. Image contrast optimization using local color correction and fuzzy intensification
CN116563133A (zh) 基于模拟曝光和多尺度融合的低照度彩色图像增强方法
CN116129417A (zh) 一种基于低质量图像的数字仪表读数检测方法
CN114299360A (zh) 色彩增强网络的训练方法及装置、色彩增强方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant