CN116310647A - 一种基于增量学习的劳保物品目标检测方法及系统 - Google Patents

一种基于增量学习的劳保物品目标检测方法及系统 Download PDF

Info

Publication number
CN116310647A
CN116310647A CN202310289172.4A CN202310289172A CN116310647A CN 116310647 A CN116310647 A CN 116310647A CN 202310289172 A CN202310289172 A CN 202310289172A CN 116310647 A CN116310647 A CN 116310647A
Authority
CN
China
Prior art keywords
network
student
model
teacher
target detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310289172.4A
Other languages
English (en)
Inventor
方阳
杜良奥
谢百连
邓欣
孙开伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202310289172.4A priority Critical patent/CN116310647A/zh
Publication of CN116310647A publication Critical patent/CN116310647A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于计算机视觉技术领域,特别涉及一种基于增量学习的劳保物品目标检测方法及系统,方法包括构建第一劳保物品目标检测数据集对教师网络进行训练;获取第二劳保物品目标检测数据集,根据第二劳保物品目标检测数据集中比第一劳保物品目标检测数据集多的标签类别数量,增加学生网络输出层神经元数量来扩展网络;对学生模型初始化,在学生模型与教师模型之间构建蒸馏损失函数;基于构建的蒸馏损失函数构建学生模型的损失函数,利用第二劳保物品目标检测数据集对学生模型进行训练;将训练好的学生模型部署到智慧工地平台上,对工地内进行目标检测;本发明克服传统深度学习算法在新样本上训练之后会产生灾难性遗忘的问题。

Description

一种基于增量学习的劳保物品目标检测方法及系统
技术领域
本发明属于计算机视觉技术领域,特别涉及一种基于增量学习的劳保物品目标检测方法及系统。
背景技术
佩戴劳保物品是基础设施建设工程中保护人员安全最基本的措施,对劳保物品佩戴与否的检测机制是对工作人员的一道安全防线,提升目标检测算法的实用性对工地智能化系统意义重大。同样地,开展劳保物品目标检测研究是提升安全监管能力的关键。近年来,得益于深度学习理论的不断发展和大规模目标捡测数据集的出现,目标检测相关研究取得了突破性进展。
在研究目标检测算法时,研究人员通常都会假设训练集和测试集是独立同分布的,即所有的图像数据都采集于同一分布并且相互独立。当训练集和测试集来源于同一数据集时,这样的假设通常会成立。然而,由于施工场景的特殊性,实际施工场景的数据的往往比较缺乏,并且随着施工进度不断推进,施工场景也在不断发生变化。因此,在实际工地作业场景的数据采集过程中,数据往往是以多批次、小批量形式不断增加。当目标类型发生变化时,对于训练集中未出现的目标无法准确识别。
当目标类型变换时,需要对模型进行重新训练。在没有增量学习的情况下,只用含有新的数据样本进行训练,会使模型对于原有知识产生灾难性遗忘。每次收集新的数据时从头开始重新训练一个模型涉及到巨大的计算开销、不可扩展以及数据效率低下。采用增量学习的方法,可以在原有模型的基础上加入新的数据进行训练,且可以避免模型对于原有知识产生遗忘。这种连续学习的能力,对于自动检测系统应对实际施工中规定佩戴的劳保物品目标变化至关重要。
发明内容
为了在进行劳保物品检测过程中可以适应劳保物品目标类型的变化,本发明提出一种基于增量学习的劳保物品目标检测方法,具体包括以下步骤:
通过工地摄像头拍摄真实师公环境下劳保物品目标图像,对拍摄的图像进行类别和位置信息的标签标注,构成第一劳保物品目标检测数据集;
构建目标检测网络作为教师模型,利用第一劳保物品目标检测数据集对教师网络进行训练;
通过工地摄像头拍摄真实师公环境下劳保物品目标图像,只对第一劳保物品目标检测数据集中没有出现过的新类别的劳保用品进行类别和位置信息标签的标注,构成第二劳保物品目标检测数据集;
根据第二劳保物品目标检测数据集中标签类别数量,增加学生网络输出层神经元数量来扩展网络;
使用训练好的教室网络的网络参数对学生网络进行初始化,并对学生模型中新增的神经元进行随机初始化;
在学生模型与教师模型之间构建蒸馏损失函数;
基于构建的蒸馏损失函数构建学生模型的损失函数,利用第二劳保物品目标检测数据集对学生模型进行训练;
将训练好的学生模型部署到智慧工地平台上,对工地内进行目标检测。
进一步的,在学生模型与教师模型之间构建蒸馏损失函数,蒸馏损失函数包括:
学生模型与教师模型最后一层输出之间的损失函数;
学生模型与教师模型主干特征提取网络最后一层输出之间的损失函数;
教师网络和学生网络对旧类别的分类分支输出之间的损失函数;
教师网络和学生网络对旧类别的回归分支输出之间的损失函数。
进一步的,利用第二劳保物品目标检测数据集对学生模型进行训练,训练过程中采用的损失函数为:
Figure BDA0004140770900000031
Figure BDA0004140770900000032
其中,Ldist_total表示利用第二劳保物品目标检测数据集对学生模型进行训练的损失函数;
Figure BDA0004140770900000033
表示学生模型与教师模型主干特征提取网络最后一层输出之间的损失函数,F为教师网络主干特征提取网络最后一层的特征图,/>
Figure BDA0004140770900000034
为学生网络主干特征提取网络最后一层的特征图;/>
Figure BDA0004140770900000035
为学生模型与教师模型最后一层输出之间的损失函数,P为教师网络模型最后一层的特征图,/>
Figure BDA0004140770900000036
为学生网络模型最后一层的特征图;
Figure BDA0004140770900000037
表示教师网络和学生网络对旧类别的分类分支输出之间的损失函数,CT为教师网络对旧类别的分类分支输出,CS为学生网络对旧类别的分类分支输出;
Figure BDA0004140770900000038
为教师网络和学生网络对旧类别的回归分支输出之间的损失函数,BT为教师网络模型预测出的每个边界框的概率矩阵,BS为学生网络模型预测出的每个边界框的概率矩阵;λ1、λ2为平衡因子。
进一步的,学生模型与教师模型主干特征提取网络最后一层输出之间的损失函数
Figure BDA0004140770900000039
表示为:
Figure BDA00041407709000000310
其中,Fi为代表教师网络主干特征提取网络对于第i个输入样本的最后一层特征图的输出,
Figure BDA00041407709000000311
为为代表学生网络主干特征提取网络对于第i个输入样本的最后一层特征图的输出;m为单次训练中同时处理的样本数量。
进一步的,,学生模型与教师模型最后一层输出之间的损失函数
Figure BDA00041407709000000312
表示为:
Figure BDA00041407709000000313
其中,Pi为教师网络最后一层输出,
Figure BDA00041407709000000314
为学生网络最后一层输出,m为单次训练中同时处理的样本数量。
进一步的,教师网络和学生网络对旧类别的分类分支输出之间的损失函数
Figure BDA0004140770900000041
表示为:
Figure BDA0004140770900000042
其中,
Figure BDA0004140770900000043
为教师网络对第i个输入样本的旧类别的分类分支输出,/>
Figure BDA0004140770900000044
为学生网络对第i个输入样本的旧类别的分类分支输出,m为单次训练中同时处理的样本数量。
进一步的,教师网络和学生网络对旧类别的回归分支输出之间的损失函数
Figure BDA0004140770900000045
表示为:
Figure BDA0004140770900000046
Figure BDA0004140770900000047
Figure BDA0004140770900000048
其中,J为模型对当前样本预测出的边界框的个数;
Figure BDA0004140770900000049
表示计算两个边界框中某一个边界的KL散度;/>
Figure BDA00041407709000000410
为教师网络第j个边界框的概率矩阵,/>
Figure BDA00041407709000000411
为学生网络第j个边界框的概率矩阵;pt、pb、pl、pr分别表示模型预测出的边界框的上边缘、下边缘、左边缘、右的概率分布,B为每个边界框的概率矩阵。
进一步的,利用劳保物品目标检测数据集对教师网络进行训练时的损失函数表示为:
Figure BDA00041407709000000412
其中,Loss为利用第一劳保物品目标检测数据集对教师网络进行训练时的损失函数;
Figure BDA00041407709000000413
为边界框损失,Y为教师网络对于分类类别的输出,/>
Figure BDA00041407709000000414
为分类真实值;
Figure BDA00041407709000000415
为边界框损失,B为教师网络输出的边界框位置信息,/>
Figure BDA00041407709000000416
为边界框真实值;
Figure BDA00041407709000000417
为置信度损失,C为教师模型输出的概率分布,表示预测结果的置信度信息,/>
Figure BDA00041407709000000418
为置信度真实值。
本发明还提出一种基于增量学习的劳保物品目标检测系统,用于实现一种基于增量学习的劳保物品目标检测方法,该系统包括目标检测服务器以及部署在工地的摄像头,摄像头采集工地现场的图像上传到服务器,服务器利用完成训练的学生模型对图像进行目标检测。
本发明使用知识蒸馏的方法,对劳保物品目标进行增量式的学习,应对施工环境的变化,使目标检测模型既获得对于新目标的识别能力,又对初始目标保持记忆,克服传统深度学习算法在新样本上训练之后会产生灾难性遗忘的问题,构建了一个可以连续学习的目标检测器。
附图说明
图1为本发明的一种基于增量学习的劳保物品目标检测方法的流程图;
图2为本发明的增量目标检测网络结构示意图;
图3为本发明的模型在智慧工地平台上部署的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出一种基于增量学习的劳保物品目标检测方法,具体包括以下步骤:
通过工地摄像头拍摄真实师公环境下劳保物品目标图像,对拍摄的图像进行类别和位置信息的标签标注,构成第一劳保物品目标检测数据集;
构建目标检测网络作为教师模型,利用第一劳保物品目标检测数据集对教师网络进行训练;
通过工地摄像头拍摄真实师公环境下劳保物品目标图像,只对第一劳保物品目标检测数据集中没有出现过的新类别的劳保用品进行类别和位置信息标签的标注,构成第二劳保物品目标检测数据集;
根据第二劳保物品目标检测数据集中标签类别数量,增加学生网络输出层神经元数量来扩展网络;
使用训练好的教室网络的网络参数对学生网络进行初始化,并对学生模型中新增的神经元进行随机初始化;
在学生模型与教师模型之间构建蒸馏损失函数;
基于构建的蒸馏损失函数构建学生模型的损失函数,利用第二劳保物品目标检测数据集对学生模型进行训练;
将训练好的学生模型部署到智慧工地平台上,对工地内进行目标检测。
在本实施例中,如图1所示,为基于增量学习的劳保物品目标检测方法的流程图,包括如下步骤:
(1)构建初始类别数据集,通过工地摄像头拍摄真实施工环境下劳保物品目标图像,并对初始的劳保物品目标进行类别和位置信息的标签标注,构建劳保物品目标检测数据集;
(2)构建教师网络模型,教师网络模型:使用任意目标检测网络作为教师网络。读取初始类别劳保物品目标数据集,对模型进行训练和测试。损失函数如下:
Figure BDA0004140770900000061
其中,
Figure BDA0004140770900000062
为边界框损失,/>
Figure BDA0004140770900000063
为分类损失,/>
Figure BDA0004140770900000064
为置信度损失
当损失值收敛后,对模型进行测试,当损失值未收敛时调整模型超参数,直至模型收敛。
(3)构建新类别数据集:通过工地摄像头拍摄真实施工环境下劳保物品目标图像,数据集中只对新类别的劳保物品目标进行类别和位置信息的标签标注,构建劳保物品目标检测数据集;
新类别是指初始类别数据集中未出现的劳保物品目标类别,即没有输入到目标检测网络模型中的类别。
(4)构建学生网络模型,学生网络与教师网络的整体结构相同,根据新类别目标数量增加相应的分类子网络;假设新增的劳保物品目标类别为n,则需要在学生网络的输出层增加n个神经元来扩展分类子网络;学生网络中的参数使用训练好的教师网络的参数进行初始化,分类子网络中新增加的神经元采用随机初始化。
(5)在教师网络和学生网络之间构建蒸馏损失函数,确保学生网络可以充分学习教师网络的知识。蒸馏损失函数主要包括四部分,一是在整个网络的最后一层之间建立损失函数,公式如下所示:
Figure BDA0004140770900000071
其中P代表教师网络模型最后一层的特征图,
Figure BDA0004140770900000072
代表代表学生网络模型最后一层的特征图;
第二部分在教师网络和学生网络的主干特征提取网络的最后一层之间建立构建损失函数,公式如下所示:
Figure BDA0004140770900000073
其中,F代表教师网络主干特征提取网络最后一层的特征图,
Figure BDA0004140770900000074
代表学生网络主干特征提取网络最后一层的特征图。
第三部分在教师网络和学生网络对旧类别的分类分支输出之间构建损失函数,公式如下所示:
Figure BDA0004140770900000075
其中CT代表教师网络对旧类别的分类分支输出,CS代表学生网络对旧类别的分类分支输出。
第四部分在教师网络和学生网络对旧类别的回归分支输出之间构建损失函数,公式如下所示:
Figure BDA0004140770900000076
Figure BDA0004140770900000077
Figure BDA0004140770900000081
其中,pt,pb,pl,pr代表模型预测出的边界框的每个边缘e的概率分布,B为每个边界框的概率矩阵,LKL为KL散度;
(6)在新类别劳保物品目标数据集上训练增量目标检测网络,需要将蒸馏损失和目标检测网络正常训练时的损失相加,得到新的损失函数,公式如下:
Figure BDA0004140770900000082
Figure BDA0004140770900000083
其中,λ1及λ2用来平衡不同损失之间的超参数。默认情况下,我们使用λ1=λ2=1;
训练时将图像同时输入教师网络和学生网络,冻结教师网络参数,只对学生网络中的参数进行更新,直至损失值收敛至最小。
(7)在智慧工地平台上部署训练好的模型,对目标进行检测。在智慧工地平台上部署训练好的模型,只需要将学生网络在智慧工地平台上进行部署,即可完成对新类别劳保物品目标的检测。
(8)增加新类别的检测目标时,重复执行步骤103至步骤107。
如图2所示为增量目标检测网络结构示意图。图中A表示初始类别数据集上训练好的教师网络模型,B表示需要增量学习新目标类别的学生网络模型。在学生网络和教师网络之间建立蒸馏损失函数,用来学习教师网络中的知识。蒸馏损失函数主要包括两部分,一是在整个网络的最后一层之间建立损失函数Ldist_output,二是在教师网络和学生网络的主干特征提取网络的最后一层之间建立损失函数Ldist_feature
Figure BDA0004140770900000084
表示学生网络在学习新目标类别时的损失函数。训练时将图像同时输入教师网络和学生网络,冻结教师网络参数,只对学生网络中的参数进行更新,直至损失值收敛至最小。
在本实施例中,将用于目标检测的神经网络划分为两个部分,一是用于根据数据提取其特征的主干提取网络,二是基于主干提取网络提取的特征进行目标检测的目标检测头,相当于一个分类网络;本领域技术人员可以选择现有技术中任意的特征提取单元和目标检测单元构建教师模型和学生模型,本实施例不对教师模型和学生模型的具体结构进行限定。
如图3所示模型在智慧工地平台上部署的示意图,在部署目标检测模型时只需要将学良好的学生网络模型移植到检测系统搭载的嵌入式平台上即可完成对劳保物品目标的检测。检测系统运行过程中,利用监控摄像头得到施工地图像,将图像输入到目标检测网络中得到检测结果,最后将结果输入到智慧工地平台的控制系统,即可为安全检测系统提供环境信息。
综上关于本发明基于增量学习的劳保物品目标检测方法,采用知识蒸馏的方式,解决了在学习新类别目标时的灾难性遗忘问题。在劳保物品目标类型发生变化时,可以对劳保物品目标进行增量式的学习,在获得对于新目标的识别能力,又对最初的目标保持记忆,构建了一个可以连续学习的目标检测器,可以使检测系统快速具备识别新类别劳保物品目标的能力。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (9)

1.一种基于增量学习的劳保物品目标检测方法,其特征在于,具体包括以下步骤:
通过工地摄像头拍摄真实师公环境下劳保物品目标图像,对拍摄的图像进行类别和位置信息的标签标注,构成第一劳保物品目标检测数据集;
构建目标检测网络作为教师模型,利用第一劳保物品目标检测数据集对教师网络进行训练;
通过工地摄像头拍摄真实师公环境下劳保物品目标图像,只对第一劳保物品目标检测数据集中没有出现过的新类别的劳保用品进行类别和位置信息标签的标注,构成第二劳保物品目标检测数据集;
根据第二劳保物品目标检测数据集中标签类别数量,增加学生网络输出层神经元数量来扩展网络;
使用训练好的教室网络的网络参数对学生网络进行初始化,并对学生模型中新增的神经元进行随机初始化;
在学生模型与教师模型之间构建蒸馏损失函数;
基于构建的蒸馏损失函数构建学生模型的损失函数,利用第二劳保物品目标检测数据集对学生模型进行训练;
将训练好的学生模型部署到智慧工地平台上,对工地内进行目标检测。
2.根据权利要求1所述的一种基于增量学习的劳保物品目标检测方法,其特征在于,在学生模型与教师模型之间构建蒸馏损失函数,蒸馏损失函数包括:
学生模型与教师模型最后一层输出之间的损失函数;
学生模型与教师模型主干特征提取网络最后一层输出之间的损失函数;
教师网络和学生网络对旧类别的分类分支输出之间的损失函数;
教师网络和学生网络对旧类别的回归分支输出之间的损失函数。
3.根据权利要求1或2所述的一种基于增量学习的劳保物品目标检测方法,其特征在于,利用第二劳保物品目标检测数据集对学生模型进行训练,训练过程中采用的损失函数为:
Figure FDA0004140770890000021
Figure FDA0004140770890000022
其中,Ldist_total表示利用第二劳保物品目标检测数据集对学生模型进行训练的损失函数;
Figure FDA0004140770890000023
表示学生模型与教师模型主干特征提取网络最后一层输出之间的损失函数,F为教师网络主干特征提取网络最后一层的特征图,/>
Figure FDA0004140770890000024
为学生网络主干特征提取网络最后一层的特征图;/>
Figure FDA0004140770890000025
为学生模型与教师模型最后一层输出之间的损失函数,P为教师网络模型最后一层的特征图,/>
Figure FDA0004140770890000026
为学生网络模型最后一层的特征图;
Figure FDA0004140770890000027
表示教师网络和学生网络对旧类别的分类分支输出之间的损失函数,CT为教师网络对旧类别的分类分支输出,CS为学生网络对旧类别的分类分支输出;
Figure FDA0004140770890000028
为教师网络和学生网络对旧类别的回归分支输出之间的损失函数,BT为教师网络模型预测出的每个边界框的概率矩阵,BS为学生网络模型预测出的每个边界框的概率矩阵;λ1、λ2为平衡因子。
4.根据权利要求3所述的一种基于增量学习的劳保物品目标检测方法,其特征在于,学生模型与教师模型主干特征提取网络最后一层输出之间的损失函数
Figure FDA0004140770890000029
表示为:
Figure FDA00041407708900000210
其中,Fi为教师网络主干特征提取网络对于第i个输入样本的最后一层特征图的输出,
Figure FDA00041407708900000211
为代表学生网络主干特征提取网络对于第i个输入样本的最后一层特征图的输出;m为单次训练中同时处理的样本数量。
5.根据权利要求3所述的一种基于增量学习的劳保物品目标检测方法,其特征在于,学生模型与教师模型最后一层输出之间的损失函数
Figure FDA00041407708900000212
表示为:
Figure FDA0004140770890000031
其中,Pi为教师网络最后一层输出,
Figure FDA0004140770890000032
为学生网络最后一层输出,m为单次训练中同时处理的样本数量。
6.根据权利要求3所述的一种基于增量学习的劳保物品目标检测方法,其特征在于,教师网络和学生网络对旧类别的分类分支输出之间的损失函数
Figure FDA0004140770890000033
表示为:
Figure FDA0004140770890000034
其中,
Figure FDA0004140770890000035
为教师网络对第i个输入样本的旧类别的分类分支输出,/>
Figure FDA0004140770890000036
为学生网络对第i个输入样本的旧类别的分类分支输出,m为单次训练中同时处理的样本数量。
7.根据权利要求3所述的一种基于增量学习的劳保物品目标检测方法,其特征在于,教师网络和学生网络对旧类别的回归分支输出之间的损失函数
Figure FDA0004140770890000037
表示为:
Figure FDA0004140770890000038
Figure FDA0004140770890000039
Figure FDA00041407708900000310
其中,J为模型对当前样本预测出的边界框的个数;
Figure FDA00041407708900000311
表示计算两个边界框中某一个边界的KL散度;/>
Figure FDA00041407708900000312
为教师网络第j个边界框的概率矩阵,/>
Figure FDA00041407708900000313
为学生网络第j个边界框的概率矩阵;pt、pb、pl、pr分别表示模型预测出的边界框的上边缘、下边缘、左边缘、右的概率分布,B为每个边界框的概率矩阵。
8.根据权利要求1所述的一种基于增量学习的劳保物品目标检测方法,其特征在于,利用劳保物品目标检测数据集对教师网络进行训练时的损失函数表示为:
Figure FDA0004140770890000041
其中,Loss为利用第一劳保物品目标检测数据集对教师网络进行训练时的损失函数;
Figure FDA0004140770890000042
为边界框损失,Y为教师网络对于分类类别的输出,/>
Figure FDA0004140770890000043
为分类真实值;
Figure FDA0004140770890000044
为边界框损失,B为教师网络输出的边界框位置信息,/>
Figure FDA0004140770890000045
为边界框真实值;
Figure FDA0004140770890000046
为置信度损失,C为教师模型输出的概率分布,表示预测结果的置信度信息,/>
Figure FDA0004140770890000047
为置信度真实值。
9.一种基于增量学习的劳保物品目标检测系统,其特征在于,用于实现权利要求1所述的一种基于增量学习的劳保物品目标检测方法,该系统包括目标检测服务器以及部署在工地的摄像头,摄像头采集工地现场的图像上传到服务器,服务器利用完成训练的学生模型对图像进行目标检测。
CN202310289172.4A 2023-03-23 2023-03-23 一种基于增量学习的劳保物品目标检测方法及系统 Pending CN116310647A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310289172.4A CN116310647A (zh) 2023-03-23 2023-03-23 一种基于增量学习的劳保物品目标检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310289172.4A CN116310647A (zh) 2023-03-23 2023-03-23 一种基于增量学习的劳保物品目标检测方法及系统

Publications (1)

Publication Number Publication Date
CN116310647A true CN116310647A (zh) 2023-06-23

Family

ID=86814755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310289172.4A Pending CN116310647A (zh) 2023-03-23 2023-03-23 一种基于增量学习的劳保物品目标检测方法及系统

Country Status (1)

Country Link
CN (1) CN116310647A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582372A (zh) * 2023-07-13 2023-08-11 深圳市前海新型互联网交换中心有限公司 一种物联网入侵检测方法、系统、电子设备及存储介质
CN117372819A (zh) * 2023-12-07 2024-01-09 神思电子技术股份有限公司 用于有限模型空间的目标检测增量学习方法、设备及介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582372A (zh) * 2023-07-13 2023-08-11 深圳市前海新型互联网交换中心有限公司 一种物联网入侵检测方法、系统、电子设备及存储介质
CN116582372B (zh) * 2023-07-13 2023-09-26 深圳市前海新型互联网交换中心有限公司 一种物联网入侵检测方法、系统、电子设备及存储介质
CN117372819A (zh) * 2023-12-07 2024-01-09 神思电子技术股份有限公司 用于有限模型空间的目标检测增量学习方法、设备及介质
CN117372819B (zh) * 2023-12-07 2024-02-20 神思电子技术股份有限公司 用于有限模型空间的目标检测增量学习方法、设备及介质

Similar Documents

Publication Publication Date Title
CN112131967B (zh) 基于多分类器对抗迁移学习的遥感场景分类方法
CN106250812B (zh) 一种基于快速r-cnn深度神经网络的车型识别方法
CN116310647A (zh) 一种基于增量学习的劳保物品目标检测方法及系统
CN110135295A (zh) 一种基于迁移学习的无监督行人重识别方法
CN111161315B (zh) 一种基于图神经网络的多目标跟踪方法和系统
CN108664924A (zh) 一种基于卷积神经网络的多标签物体识别方法
CN107636691A (zh) 用于识别图像中的文本的方法和设备
CN108875816A (zh) 融合置信度准则和多样性准则的主动学习样本选择策略
CN108629367A (zh) 一种基于深度网络增强服装属性识别精度的方法
CN105447473A (zh) 一种基于PCANet-CNN的任意姿态人脸表情识别方法
CN105701502A (zh) 一种基于蒙特卡罗数据均衡的图像自动标注方法
CN106203490A (zh) 一种安卓平台下基于属性学习和交互反馈的图像在线识别、检索方法
CN109902192B (zh) 基于无监督深度回归的遥感图像检索方法、系统、设备及介质
CN111860106B (zh) 一种无监督的桥梁裂缝识别方法
Pati et al. A novel hybrid machine learning approach for change detection in remote sensing images
CN110941734A (zh) 基于稀疏图结构的深度无监督图像检索方法
CN102867192B (zh) 一种基于监督测地线传播的场景语义迁移方法
CN108877947A (zh) 基于迭代均值聚类的深度样本学习方法
CN116051479A (zh) 融合跨域迁移和异常检测的纺织品缺陷识别方法
CN114723994A (zh) 一种基于双分类器对抗增强网络的高光谱图像分类方法
CN115690568A (zh) 一种基于增量学习的无人艇目标检测方法
CN116628212A (zh) 面向国民经济和社会发展调查领域的不确定性知识图谱建模方法
CN117333735A (zh) 一种基于知识蒸馏的劳保物品检测模型的训练方法
CN111401519B (zh) 一种基于物体内和物体间相似性距离的深层神经网络无监督学习方法
CN113537307A (zh) 一种基于元学习的自监督域适应方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination