CN114463603B - 图像检测模型的训练方法、装置、电子设备及存储介质 - Google Patents

图像检测模型的训练方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114463603B
CN114463603B CN202210387038.3A CN202210387038A CN114463603B CN 114463603 B CN114463603 B CN 114463603B CN 202210387038 A CN202210387038 A CN 202210387038A CN 114463603 B CN114463603 B CN 114463603B
Authority
CN
China
Prior art keywords
training
image
detection model
determining
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210387038.3A
Other languages
English (en)
Other versions
CN114463603A (zh
Inventor
王威
李一清
李林超
周凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zhuoyun Intelligent Technology Co ltd
Original Assignee
Zhejiang Zhuoyun Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Zhuoyun Intelligent Technology Co ltd filed Critical Zhejiang Zhuoyun Intelligent Technology Co ltd
Priority to CN202210387038.3A priority Critical patent/CN114463603B/zh
Publication of CN114463603A publication Critical patent/CN114463603A/zh
Application granted granted Critical
Publication of CN114463603B publication Critical patent/CN114463603B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种图像检测模型的训练方法、装置、电子设备及存储介质。其中,该方法包括:从无标注数据集获取本次训练使用的无标注图像;利用本次训练使用的第一检测模型基于本次训练使用的无标注图像构建本次训练使用的弱标注图像;根据强标注图像和本次训练使用的弱标注图像对本次训练使用的第一检测模型进行训练,得到本次训练出的第二检测模型;确定当前训练次数是否达到预设训练次数;若未达到预设训练次数,则返回执行获取本次训练使用的无标注图像,直至训练次数达到预设训练次数时,将最后一次训练出的第二检测模型确定为目标检测模型。本申请实施例提供的技术方案,可以提升半监督目标检测模型的检测精度与鲁棒性。

Description

图像检测模型的训练方法、装置、电子设备及存储介质
技术领域
本申请涉及图像识别技术领域,尤其涉及一种图像检测模型的训练方法、装置、电子设备及存储介质。
背景技术
深度学习技术的模型性能严重依赖带标注的训练数据,如在不同场景上线相同功能的检测模型时,需要花费较大代价获取足够数量的标注数据来提高模型在相应场景下的性能。目前,半监督目标检测是利用少量的标注数据和大量的无标注数据进行模型训练,用于提升模型的训练性能和泛化性能。半监督目标检测的研究对于一些存在海量数据的场景和人工标注难度较大的场景具有重要的意义,如智能安检、医学图像、工业质检等。
由于目标检测任务的复杂性, 现有技术中半监督目标检测存在以下缺点:(1)半监督目标检测算法中,面对大规模的无标注图像训练时模型不稳定,会产生强标注数据(人工标注)与弱标注数据(模型生成)的不平衡的问题。(2)由初始检测器所构造的弱标注数据一次性全部加入训练会很大的限制模型的精度。
发明内容
本申请实施例提供了一种图像检测模型的训练方法、装置、电子设备及存储介质,可以提升半监督目标检测模型的检测精度与鲁棒性。
第一方面,本申请实施例提供了一种图像检测模型的训练方法,该方法包括:
从无标注数据集获取本次训练使用的无标注图像;
利用所述本次训练使用的第一检测模型基于所述本次训练使用的无标注图像构建所述本次训练使用的弱标注图像,所述本次训练使用的第一检测模型为上次训练出的第二检测模型;
根据强标注图像和所述本次训练使用的弱标注图像对所述本次训练使用的第一检测模型进行训练,得到本次训练出的第二检测模型;
确定当前训练次数是否达到预设训练次数;
若未达到所述预设训练次数,则返回执行所述获取本次训练使用的无标注图像,直至训练次数达到所述预设训练次数时,将最后一次训练出的第二检测模型确定为目标检测模型。
第二方面,本申请实施例提供了一种图像检测模型的训练装置,该装置包括:
无标注图像获取模块,用于从无标注数据集获取本次训练使用的无标注图像;
弱标注图像构建模块,用于利用所述本次训练使用的第一检测模型基于所述本次训练使用的无标注图像构建所述本次训练使用的弱标注图像,所述本次训练使用的第一检测模型为上次训练出的第二检测模型;
检测模型训练模块,用于根据强标注图像和所述本次训练使用的弱标注图像对所述本次训练使用的第一检测模型进行训练,得到本次训练出的第二检测模型;
训练次数判断模块,用于确定当前训练次数是否达到预设训练次数;
模型训练循环模块,用于若未达到所述预设训练次数,则返回执行所述无标注图像获取模块、所述弱标注图像构建模块、所述检测模型训练模块和所述训练次数判断模块,直至训练次数达到所述预设训练次数时,将最后一次训练出的第二检测模型确定为目标检测模型。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请任意实施例所述的图像检测模型的训练方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本申请任意实施例所述的图像检测模型的训练方法。
本申请实施例提供了一种图像检测模型的训练方法、装置、电子设备及存储介质,该方法包括:从无标注数据集获取本次训练使用的无标注图像;利用本次训练使用的第一检测模型基于本次训练使用的无标注图像构建本次训练使用的弱标注图像,本次训练使用的第一检测模型为上次训练出的第二检测模型;根据强标注图像和本次训练使用的弱标注图像对本次训练使用的第一检测模型进行训练,得到本次训练出的第二检测模型;确定当前训练次数是否达到预设训练次数;若未达到预设训练次数,则返回执行获取本次训练使用的无标注图像,直至训练次数达到预设训练次数时,将最后一次训练出的第二检测模型确定为目标检测模型。本申请随着训练次数的增加,通过控制每次训练使用的弱标注图像来动态控制弱标注图像对于模型的贡献,将弱标注图像逐步加入可靠性越来越强的第一检测模型中训练,可以提升半监督目标检测模型的检测精度与鲁棒性。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其他特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例提供的图像检测模型的训练方法的第一流程示意图;
图2为本申请实施例提供的图像检测模型的训练方法的第二流程示意图;
图3为本申请实施例提供的图像检测模型的训练方法的第三流程示意图;
图4为本申请实施例提供的图像检测模型的训练装置的结构示意图;
图5是用来实现本申请实施例的图像检测模型的训练方法的电子设备的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的图像检测模型的训练方法的第一流程示意图,本实施例可适用于对图像检测模型进行训练的情况。本实施例提供的一种图像检测模型的训练方法可以由本申请实施例提供的图像检测模型的训练装置来执行,该装置可以通过软件和/或硬件的方式实现,并集成在执行本方法的电子设备中。
参见图1,本实施例的方法包括但不限于如下步骤:
S110、从无标注数据集获取本次训练使用的无标注图像。
其中,无标注数据集可以是现有的某一应用场景的大量图像构成的数据集,在智能安检场景下,该图像无标注数据集可以是利用安检现场的x光所采集到的物品图像。无标注图像是没有采用人工进行标注或者没有采用模型进行自动标注的图像,是直接采用工业生产中摄像头或者安检现场的x光所采集到的图像。
在本申请实施例中,首先可以通过获取用户输入的训练次数来确定模型的预设训练次数,也可以是默认的预设训练次数。然后,根据预设训练次数对无标注数据集进行划分得到每次训练对应的无标注图像。最后,从中挑选出本次训练所对应无标注图像。
可选的,根据预设训练次数对无标注数据集进行划分的方式可以是平均划分无标注数据集中的无标注图像,即每次训练的无标注图像数量都是相等的,也可以是按照训练次数逐步增加或逐步减少每次训练的无标注图像的数量,即每次训练的无标注图像数量是递增的或者递减的。
S120、利用本次训练使用的第一检测模型基于本次训练使用的无标注图像构建本次训练使用的弱标注图像。
其中,本次训练使用的第一检测模型为上次训练出的第二检测模型。弱标注图像是指采用第一检测模型进行自动标注的图像,弱标注图像可能存在只标注部分类别没有被完全标注的情况,可能存在标注错误的情况,也可能存在只提供了所有类别标注,没有提供图片样本里面物体的具体位置等属性信息(即缺乏详细信息)的情况。弱标注图像的具体情况是由第一检测模型的检测性能而决定。需要说明的是,随着训练次数的增加,第一检测模型的检测性能会越来越好。
在本申请实施例中,弱标注图像的构建方法可以是:获取到本次训练使用的无标注图像之后,再将该无标注图像输入至本次训练使用的第一检测模型,再结合已选择的数据标注方式对无标注图像进行标注,得到本次训练使用的弱标注图像。其中,数据标注方式可以是无监督标注方式或者弱监督标注方式。
在本申请实施例中,弱标注图像的构建方法还可以是:基于本次训练使用的第一检测模型对本次训练使用的无标注图像进行检测,得到对应无标注图像的检测结果;根据检测结果确定可靠性系数,从而得到本次训练使用的无标注图像中每个无标注图像的可靠性系数;按照可靠性系数从本次训练使用的无标注图像中筛选出符合预设标准的目标无标注图像,并将目标无标注图像扩充至弱标注数据集中,将弱标注数据集中的弱标注图像作为本次训练使用的弱标注图像。其中,筛选目标无标注图像符合的预设标准可以是筛选出可靠性系数较大的无标注图像,也可以是筛选出可靠性系数在某一区间的无标注图像。这样构建弱标注图像的好处在于,通过筛选符合预设标准的目标无标注图像可以在下述S130生成第二检测模型中提高模型的检测精度和准确度。
进一步的,当本次训练为首次训练时,在利用本次训练使用的第一检测模型基于本次训练使用的无标注图像构建本次训练使用的弱标注图像之前,还包括:采用强标注图像对初始检测模型进行训练,得到本次训练使用的第一检测模型。其中,强标注图像是采用人工进行标注的图像。初始检测模型可以是任意的具备图像检测功能的神经网络模型。
进一步的,在采用强标注图像对初始检测模型进行训练,得到本次训练使用的第一检测模型之后,还包括:确定强标注图像对应的强监督损失函数。强监督损失函数的确定方法可是采用现有计算损失的方法,本申请实施例在此不做赘述。
S130、根据强标注图像和本次训练使用的弱标注图像对本次训练使用的第一检测模型进行训练,得到本次训练出的第二检测模型。
目前半监督目标检测中,采用将大规模数量的无标注图像对第一检测模型进行训练会造成模型训练不稳定,会产生强标注图像与弱标注图像之间不平衡的问题。为了解决这一问题,本申请首先将强标注图像和本次训练使用的弱标注图像进行融合得到融合图像;再采用融合图像对本次训练使用的第一检测模型进行训练得到联合损失函数;最后基于联合损失函数对本次训练使用的第一检测模型进行反向传播,以便对本次训练使用的第一检测模型的参数进行更新得到本次训练出的第二检测模型。随着训练次数的增加,检测模型的模型稳定性和图像检测的可靠性会越来越强。
S140、确定当前训练次数是否达到预设训练次数。
在本申请实施例中,在每次训练开始或结束时记录当前训练的当前训练次数,并根据所记录的当前训练次数判断是否达到预设训练次数。若未达到预设训练次数,则返回执行S110;若达到预设训练次数,则执行S150。
S150、若达到预设训练次数,则将最后一次训练出的第二检测模型确定为目标检测模型。
在本申请实施例中,当预设当前训练次数达到预设训练次数时,表明无标注数据集中无标注图像已被训练完成,此时将最后一次训练出的第二检测模型确定为目标检测模型。
本实施例提供的技术方案,通过从无标注数据集获取本次训练使用的无标注图像;利用本次训练使用的第一检测模型基于本次训练使用的无标注图像构建本次训练使用的弱标注图像;根据强标注图像和本次训练使用的弱标注图像对本次训练使用的第一检测模型进行训练,得到本次训练出的第二检测模型;确定当前训练次数是否达到预设训练次数;若达到预设训练次数,则将最后一次训练出的第二检测模型确定为目标检测模型。本申请通过第一检测模型基于无标注图像构建本次训练使用的弱标注图像,再根据强标注图像和本次训练使用的弱标注图像联合训练第一检测模型。本申请可以解决现有技术中强标注数据弱标注数据的不平衡以及由初始检测器所构造的弱标注数据一次性全部加入训练会很大的限制模型的精度的问题,本申请随着训练次数的增加,通过控制每次训练使用的弱标注图像来动态控制弱标注图像对于模型的贡献,将弱标注图像逐步加入可靠性越来越强的第一检测模型中训练,可以提升半监督目标检测模型的检测精度与鲁棒性。
下面进一步描述本发明实施例提供的图像检测模型的训练方法,图2为本申请实施例提供的一种图像检测模型的训练方法的第二流程示意图。本申请实施例是在上述实施例的基础上进行优化,具体优化为:本实施例对本次训练使用的弱标注图像的构建过程进行详细的解释说明。
参见图2,本实施例的方法包括但不限于如下步骤:
S210、基于本次训练使用的第一检测模型对本次训练使用的无标注图像进行检测,得到对应无标注图像的检测结果。
其中,检测结果包括所检测出目标的位置和置信度。
在本申请实施例中,在当前次模型训练中,将本次训练使用的无标注图像输入至本次训练使用的第一检测模型中进行检测,检测出无标注图像中目标的位置和目标的置信度。
S220、根据位置和置信度确定无标注图像中每个目标的截断置信度。
在本申请实施例中,统计无标注图像中每个目标的位置与对应的置信度,并对置信度进行截断处理,得到每个目标的截断置信度。对置信度进行截断处理的好处在于,不仅可以过滤掉噪声,还可以加强可靠目标的学习。
具体的,对置信度进行截断处理的过程可以是:设置截断低阈值和截断高阈值;当某一位置的目标对应的置信度小于截断低阈值,那么将其置信度设置为零;当某一位置的目标对应的置信度大于截断高阈值,那么将其置信度设置为1。可选的,截断低阈值可以设为0.1,截断高阈值可以设为0.9。可以通过如下公式表示截断置信度:
Figure 892681DEST_PATH_IMAGE001
(1)
式中,p c 为截断置信度,p为目标的置信度,δ l 为截断低阈值;δ h 为截断高阈值,i为无标注图像中目标的索引。
S230、对无标注图像中全部目标的截断置信度求均值得到无标注图像的可靠性系数。
在本申请实施例中,可靠性系数是用于表示无标注图像的检测结果的可靠性。经上述步骤S220确定出无标注图像中每个目标的截断置信度之后,对无标注图像中全部目标的截断置信度相加求均值,将该均值作为无标注图像的可靠性系数。可以通过如下公式表示可靠性系数:
Figure 747505DEST_PATH_IMAGE002
(2)
式中,R为无标注图像的可靠性系数,p c 为截断置信度,i为无标注图像中目标的索引,n为无标注图像中目标的数量。
S240、确定可靠性分层的层次数。
在本申请实施例中,在模型训练的实际任务中,根据模型训练的难易程度设置可靠性分层的层次数,当模型训练的难度越大,那么层次数可以设置的越大,这样在下述S250-S260步骤中挑选出的目标无标注图像会更少,更利于提升检测模型的检测精度与鲁棒性。可选的,可靠性分层的层次数可以设置为3。
S250、按照可靠性系数对本次训练使用的无标注图像进行排序,得到排序之后的无标注图像。
在本申请实施例中,将本次训练使用的无标注图像按照可靠性系数从大到小的顺序进行排序,得到排序之后的无标注图像。
S260、基于层次数对排序之后的无标注图像进行可靠性分层得到对应层次的无标注图像,并将预设层次的无标注图像作为目标无标注图像。
在本申请实施例中,基于所确定的可靠性分层的层次数,对排序之后的无标注图像进行可靠性分层。示例地,假如层次数为3,那么将排序之后的无标注图像分为可靠性高、中和低三个层次。选择可靠性高对应层次的无标注图像作为目标无标注图像。
进一步的,在将预设层次的无标注图像作为目标无标注图像之后,还包括:对目标无标注图像中全部无标注图像的可靠性系数求均值得到目标无标注图像的分层可靠性系数。
在本申请实施例中,分层可靠性系数是指某一层中无标注图像(即全部的目标无标注图像)的检测结果的可靠性的均值。可以通过如下公式表示分层可靠性系数:
Figure 58400DEST_PATH_IMAGE003
(3)
式中,H为分层可靠性系数,j为无标注图像在当前层次的索引,n t 为该层次图像的数量,R为无标注图像的可靠性系数。
S270、将目标无标注图像扩充至弱标注数据集,并将弱标注数据集中的弱标注图像作为本次训练使用的弱标注图像。
需要说明的是,弱标注数据集中包括每次训练所得到的目标无标注图像,当本次训练为首次训练时,弱标注数据集为空。示例地,当训练次数为第二次时,第二次训练使用的弱标注图像为第一次训练和第二次训练所得到的目标无标注图像;第三次训练使用的弱标注图像为第一次训练、第二次训练和第三次训练所得到的目标无标注图像。
本实施例提供的技术方案,通过对排序之后的无标注图像可靠性分层,将可靠性高的无标注图像逐层次加入到弱标注数据集中参与训练,使模型随着本身检测效果的提升所产生的弱标注的检测结果质量也越来越高。通过可靠性层次将训练分成多个阶段,训练过程时逐渐加入越来越有把握的数据,有助于提升模型的学习效果与精度上限。
下面进一步描述本发明实施例提供的图像检测模型的训练方法,图3为本申请实施例提供的一种图像检测模型的训练方法的第三流程示意图。本申请实施例是在上述实施例的基础上进行优化,具体优化为:本实施例对本次训练的第二检测模型的训练过程进行详细的解释说明。
参考图3,本实施例的方法包括但不限于如下步骤:
S310、将强标注图像和本次训练使用的弱标注图像进行融合得到融合图像。
在本申请实施例中,在对第一检测模型进行训练之前,将强标注图像与本次训练使用的弱标注图像进行数据融合。本申请不限定图像融合方法,可以是采用Mosaic算法加Mixup算法的形式对一张强标注图像和一张弱标注图像进行数据融合处理。
可选的,本申请中图像融合方法为:每次训练时同时随机取出一张强标注图像和一张弱标注图像,将两张图像以水平或者垂直的方向堆叠,堆叠时允许一定面积随机重叠,重叠部分的像素值为两部分图像的像素值相乘,融合之后所得的融合图像中有弱标注图像区域、强标注图像区域和重叠区域。
S320、基于本次训练使用的第一检测模型对融合图像进行检测,得到融合图像中弱标注图像区域对应的目标候选框。
在本申请实施例中,经上述步骤得到融合图像之后,再将融合图像输入至本次训练使用的第一检测模型中进行目标检测,得到融合图像对应的候选框。因为融合图像中有弱标注图像区域、强标注图像区域和重叠区域,在本步骤中只需确定出弱标注图像区域对应的目标候选框。
S330、计算目标候选框与检测框之间的交并比IoU。
在上述实施例中,基于本次训练使用的第一检测模型对本次训练使用的无标注图像进行检测,得到对应无标注图像的检测结果。其中,检测结果还包括目标的位置对应的检测框。
交并比(Intersection Over Union,IoU)用于表示目标候选框与检测框之间的重叠程度,取值范围为0~1之间。由于本申请实施例中的检测模型具有标注锚框的功能,那么该检测模型对融合图像进行处理,生成的目标候选框也可以看作锚框形状,其具备关于候选框形状的各项参数(例如,坐标、长度、宽度等),那么计算目标候选框与检测框之间的IoU时,具体的计算方式可以采用现有计算IoU的方式,本申请实施例在此不做赘述。
S340、基于IoU确定目标候选框中的负样本候选框和正样本候选框。
在本申请实施例中,设置第一阈值和第二阈值,将IoU与第一阈值和第二阈值进行比较,根据比较结果确定目标候选框中的负样本候选框和正样本候选框。可选的,第一阈值可以为0.3,第二阈值为0.7。假如IoU小于0.3为负样本候选框,假如IoU大于0.7为正样本候选框,其余为忽略样本不参与训练。
S350、确定负样本候选框对应的第一损失,确定正样本候选框对应的第二损失,并根据第一损失和第二损失确定融合图像中弱标注图像区域对应的弱监督损失函数。
在本申请实施例中,经上述步骤S340确定出目标候选框中的负样本候选框和正样本候选框之后,再分别计算每个正样本候选框和负样本候选框的损失权重。
具体的,确定负样本候选框对应的第一损失,包括:判断负样本候选框对应的IoU是否大于零;若大于,则确定出与负样本候选框距离最近的目标检测框,也就是,与正样本候选框IoU最大的目标检测框,并将目标检测框的截断置信度作为负样本候选框的第一损失权重;若不大于,则确定第一损失权重为预设数值,预设阈值可以设为1;确定负样本候选框的分类损失,并基于第一损失权重和分类损失确定负样本候选框对应的第一损失。
具体的,确定正样本候选框对应的第二损失,包括:确定与正样本候选框距离最近的目标检测框,也就是,与正样本候选框IoU最大的目标检测框,并将目标检测框的截断置信度作为正样本候选框的第二损失权重;确定正样本候选框的分类损失和回归损失;基于第二损失权重、分类损失和回归损失确定正样本候选框对应的第二损失。
在本申请实施例中,对于融合图像中弱标注图像区域的损失函数采用弱监督动态损失函数进行计算。通过如下公式可以计算弱监督损失函数:
Figure 860134DEST_PATH_IMAGE004
(4)
式中,L w 为弱监督损失函数,e为正样本候选框的索引,M为正样本候选框集合,w m 为正样本候选框的第二损失权重,t为负样本索引,N为负样本候选框集合,w n 为负样本候选框的第一损失权重,L cls 为分类损失函数,L reg 为回归损失函数。
S360、基于强监督损失函数、弱监督损失函数和分层可靠性系数确定联合损失函数。
在本申请实施例中,在采用强标注图像对初始检测模型进行训练时,确定强标注图像对应的强监督损失函数。对目标无标注图像中全部无标注图像的可靠性系数求均值得到目标无标注图像的分层可靠性系数。基于强监督损失函数、弱监督损失函数和分层可靠性系数,可以通过如下公式计算融合图像的联合损失函数:
Figure 205665DEST_PATH_IMAGE005
(5)
式中,L为联合损失函数,H t 为分层可靠性系数, L w 为弱监督损失函数,L s 为强监督损失函数。
S370、基于联合损失函数对本次训练使用的第一检测模型进行反向传播,以便对本次训练使用的第一检测模型的参数进行更新得到本次训练出的第二检测模型。
在本申请实施例中,基于联合损失函数对本次训练使用的第一检测模型进行反向传播,例如,基于检测模型中的RoI Pooling网络层与RCNN网络层对模型参数进行迭代,得到本次训练出的第二检测模型。
本实施例提供的技术方案,将强标注图像与弱标注图像联合并融合成同一张图像训练,有助于模型训练的稳定。两种图像分开训练时,由于弱标注图像中的标注结果并不是那么可靠,会选择一定概率的噪声,极端情况下弱标注图像中结果均为噪声的话,当模型训练盗改图像时,产生的损失会有很大的波动,这样不利于模型的收敛。将强标注图像与弱标注图像融合成一张图像训练,可以保证每次训练时至少存在一部分的标注是一定准确的,这样有助于模型的收敛与学习的稳定。融合图像的联合损失函数可以动态的调整弱标注图像对于模型的贡献,当弱标注图像中目标的可靠性越高时,所贡献的损失越大,并通过截断置信度的设置直接过滤掉非常不可靠的目标。使用层次可靠性动态调节联合损失中弱标注图像区域损失与强标注图像区域损失比重,使模型根据当前批次数据的质量确定学习的侧重点,随着模型检测能力的提升对弱标注数据的关注度也越来越强,可以使模型更好的学习弱标注数据信息。
下面以一个具体的应用场景说明本发明实施提供的图像检测模型的训练方法。
比如,在智能安检场景下,利用安检现场的x光采集x光安检图像数据,强标注图像10000张,20%用作测试,无标注图像30000张。基线模型为Faster R-CNN-ResNet50,训练12epoch,弱标注层次数(即可靠性分层的层次数)为3,截断低阈值为0.1,截断低阈值为0.9。将强标注图像和弱标注图像进行融合得到融合图像,再将融合图像输入至第一检测模型中进行训练的到本次训练出的第二检测模型,将本次训练出的第二检测模型作为下次训练使用的第一检测模型,使用相同的方式将剩下的无标注图像逐层次扩充弱标注数据集,直到所有无标注图像全部训练完成。经实验可得,逐层次加入弱标注数据训练后模型的平均精度均值(mean Average Precision,mAP)均有提升,且最后层次3的提升最为明显,本申请方法与其它方法的mAP相对比,本申请mAP指标优于相近的其他方法。
图4为本申请实施例提供的一种图像检测模型的训练装置的结构示意图,如图4所示,该装置400可以包括:
无标注图像获取模块410,用于从无标注数据集获取本次训练使用的无标注图像;
弱标注图像构建模块420,用于利用所述本次训练使用的第一检测模型基于所述本次训练使用的无标注图像构建所述本次训练使用的弱标注图像,所述本次训练使用的第一检测模型为上次训练出的第二检测模型;
检测模型训练模块430,用于根据强标注图像和所述本次训练使用的弱标注图像对所述本次训练使用的第一检测模型进行训练,得到本次训练出的第二检测模型;
训练次数判断模块440,用于确定当前训练次数是否达到预设训练次数;
模型训练循环模块450,用于若未达到所述预设训练次数,则返回执行所述无标注图像获取模块、所述弱标注图像构建模块、所述检测模型训练模块和所述训练次数判断模块,直至训练次数达到所述预设训练次数时,将最后一次训练出的第二检测模型确定为目标检测模型。
进一步的,上述弱标注图像构建模块420,可以具体用于:基于所述本次训练使用的第一检测模型对所述本次训练使用的无标注图像进行检测,得到对应无标注图像的检测结果;根据所述检测结果确定可靠性系数,从而得到所述本次训练使用的无标注图像中每个无标注图像的可靠性系数;按照所述可靠性系数从所述本次训练使用的无标注图像中筛选出符合预设标准的目标无标注图像;将所述目标无标注图像扩充至弱标注数据集,并将所述弱标注数据集中的弱标注图像作为所述本次训练使用的弱标注图像。
进一步的,上述弱标注图像构建模块420可以包括:检测结果确定单元、可靠性系数确定单元、目标图像确定单元以及弱标注图像确定单元;
所述可靠性系数确定单元,用于根据所述位置和所述置信度确定所述无标注图像中每个目标的截断置信度;对所述无标注图像中全部目标的截断置信度求均值得到所述无标注图像的可靠性系数。
所述目标图像确定单元,用于确定可靠性分层的层次数;按照所述可靠性系数对所述本次训练使用的无标注图像进行排序,得到排序之后的无标注图像;基于所述层次数对所述排序之后的无标注图像进行可靠性分层得到对应层次的无标注图像,并将预设层次的无标注图像作为所述目标无标注图像。
进一步的,上述图像检测模型的训练装置,还可以包括:分层可靠系数确定模块;
所述分层可靠系数确定,用于在将预设层次的无标注图像作为所述目标无标注图像之后,对所述目标无标注图像中全部无标注图像的可靠性系数求均值得到所述目标无标注图像的分层可靠性系数。
进一步的,上述图像检测模型的训练装置,还可以包括:第一检测模型确定模块;
所述第一检测模型确定模块,用于当本次训练为首次训练时,在利用所述本次训练使用的第一检测模型基于所述本次训练使用的无标注图像构建所述本次训练使用的弱标注图像之前, 采用所述强标注图像对初始检测模型进行训练,得到所述本次训练使用的第一检测模型。
进一步的,上述图像检测模型的训练装置,还可以包括:强监督损失函数确定模块;
所述强监督损失函数确定模块,用于在采用所述强标注图像对初始检测模型进行训练,得到所述本次训练使用的第一检测模型之后,确定所述强标注图像对应的强监督损失函数。
进一步的,上述检测模型训练模块430,可以具体用于:将所述强标注图像和所述本次训练使用的弱标注图像进行融合得到融合图像;采用所述融合图像对所述本次训练使用的第一检测模型进行训练得到联合损失函数;基于所述联合损失函数对所述本次训练使用的第一检测模型进行反向传播,以便对所述本次训练使用的第一检测模型的参数进行更新得到所述本次训练出的第二检测模型。
进一步的,上述检测模型训练模块430,还可以具体用于:基于所述本次训练使用的第一检测模型对所述融合图像进行检测,得到所述融合图像中弱标注图像区域对应的目标候选框;计算所述目标候选框与所述检测框之间的交并比IoU;基于所述IoU确定所述目标候选框中的负样本候选框和正样本候选框;确定所述负样本候选框对应的第一损失,确定所述正样本候选框对应的第二损失,并根据所述第一损失和所述第二损失确定所述融合图像中弱标注图像区域对应的弱监督损失函数;基于强监督损失函数、所述弱监督损失函数和分层可靠性系数确定所述联合损失函数。
进一步的,上述检测模型训练模块430可以包括:第一损失确定单元和第二损失确定单元;
所述第一损失确定单元,用于判断所述负样本候选框对应的所述IoU是否大于零;若大于,则确定出与所述负样本候选框距离最近的目标检测框,并将所述目标检测框的截断置信度作为所述负样本候选框的第一损失权重;若不大于,则确定所述第一损失权重为预设数值;确定所述负样本候选框的分类损失,并基于所述第一损失权重和所述分类损失确定所述负样本候选框对应的第一损失。
所述第二损失确定单元,用于确定与所述正样本候选框距离最近的目标检测框,并将所述目标检测框的截断置信度作为所述正样本候选框的第二损失权重;确定所述正样本候选框的分类损失和回归损失;基于所述第二损失权重、所述分类损失和所述回归损失确定所述正样本候选框对应的第二损失。
本实施例提供的图像检测模型的训练装置可适用于上述任意实施例提供的图像检测模型的训练方法,具备相应的功能和有益效果。
图5是用来实现本申请实施例的一种图像检测模型的训练方法的电子设备的框图,图5示出了适于用来实现本申请实施例实施方式的示例性电子设备的框图。图5显示的电子设备仅仅是一个示例,不应对本申请实施例的功能和适用范围带来任何限制。该电子设备典型可以是智能手机、平板电脑、笔记本电脑、车载终端以及可穿戴设备等。
如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:一个或者多个处理器或者处理单元516,存储器528,连接不同系统组件(包括存储器528和处理单元516)的总线518。
总线518表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备500典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备500访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器528可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)530和/或高速缓存存储器532。电子设备500可以进一步包括其他可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统534可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储器528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储器528中,这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其他程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本申请实施例所描述的功能和/或方法。
电子设备500也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其他计算设备进行通信的任何设备(例如网卡,调制解调器等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且,电子设备500还可以通过网络适配器520与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器520通过总线518与电子设备500的其他模块通信。应当明白,尽管图5中未示出,可以结合电子设备500使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元516通过运行存储在存储器528中的程序,从而执行各种功能应用以及数据处理,例如实现本申请任一实施例所提供的图像检测模型的训练方法。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时可以用于执行本申请上述任一实施例所提供的图像检测模型的训练方法。
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦拭可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种图像检测模型的训练方法,其特征在于,所述方法包括:
从无标注数据集获取本次训练使用的无标注图像;
利用所述本次训练使用的第一检测模型基于所述本次训练使用的无标注图像构建所述本次训练使用的弱标注图像,所述本次训练使用的第一检测模型为上次训练出的第二检测模型;
根据强标注图像和所述本次训练使用的弱标注图像对所述本次训练使用的第一检测模型进行训练,得到本次训练出的第二检测模型,包括:
将所述强标注图像和所述本次训练使用的弱标注图像进行融合得到融合图像;
采用所述融合图像对所述本次训练使用的第一检测模型进行训练得到联合损失函数;
基于所述联合损失函数对所述本次训练使用的第一检测模型进行反向传播,以便对所述本次训练使用的第一检测模型的参数进行更新得到所述本次训练出的第二检测模型;
确定当前训练次数是否达到预设训练次数;
若未达到所述预设训练次数,则返回执行所述获取本次训练使用的无标注图像,直至训练次数达到所述预设训练次数时,将最后一次训练出的第二检测模型确定为目标检测模型;
其中,检测结果包括目标的位置对应的检测框,所述检测结果是基于所述本次训练使用的第一检测模型对所述本次训练使用的无标注图像进行检测得到的;所述采用所述融合图像对所述本次训练使用的第一检测模型进行训练得到联合损失函数,包括:
基于所述本次训练使用的第一检测模型对所述融合图像进行检测,得到所述融合图像中弱标注图像区域对应的目标候选框;
计算所述目标候选框与所述检测框之间的交并比IoU;
基于所述IoU确定所述目标候选框中的负样本候选框和正样本候选框;
确定所述负样本候选框对应的第一损失,包括:
判断所述负样本候选框对应的所述IoU是否大于零;
若大于,则确定出与所述负样本候选框距离最近的目标检测框,并将所述目标检测框的截断置信度作为所述负样本候选框的第一损失权重;
若不大于,则确定所述第一损失权重为预设数值;
确定所述负样本候选框的分类损失,并基于所述第一损失权重和所述分类损失确定所述负样本候选框对应的第一损失;
确定所述正样本候选框对应的第二损失,并根据所述第一损失和所述第二损失确定所述融合图像中弱标注图像区域对应的弱监督损失函数;
基于强监督损失函数、所述弱监督损失函数和分层可靠性系数确定所述联合损失函数。
2.根据权利要求1所述的图像检测模型的训练方法,其特征在于,所述利用所述本次训练使用的第一检测模型基于所述本次训练使用的无标注图像构建所述本次训练使用的弱标注图像,包括:
基于所述本次训练使用的第一检测模型对所述本次训练使用的无标注图像进行检测,得到对应无标注图像的检测结果;
根据所述检测结果确定可靠性系数,从而得到所述本次训练使用的无标注图像中每个无标注图像的可靠性系数;
按照所述可靠性系数从所述本次训练使用的无标注图像中筛选出符合预设标准的目标无标注图像;
将所述目标无标注图像扩充至弱标注数据集,并将所述弱标注数据集中的弱标注图像作为所述本次训练使用的弱标注图像。
3.根据权利要求2所述的图像检测模型的训练方法,其特征在于,所述按照所述可靠性系数从所述本次训练使用的无标注图像中筛选出符合预设标准的目标无标注图像,包括:
确定可靠性分层的层次数;
按照所述可靠性系数对所述本次训练使用的无标注图像进行排序,得到排序之后的无标注图像;
基于所述层次数对所述排序之后的无标注图像进行可靠性分层得到对应层次的无标注图像,并将预设层次的无标注图像作为所述目标无标注图像。
4.根据权利要求3所述的图像检测模型的训练方法,其特征在于,在将预设层次的无标注图像作为所述目标无标注图像之后,还包括:
对所述目标无标注图像中全部无标注图像的可靠性系数求均值得到所述目标无标注图像的分层可靠性系数。
5.根据权利要求1所述的图像检测模型的训练方法,其特征在于,当本次训练为首次训练时,在利用所述本次训练使用的第一检测模型基于所述本次训练使用的无标注图像构建所述本次训练使用的弱标注图像之前,还包括:
采用所述强标注图像对初始检测模型进行训练,得到所述本次训练使用的第一检测模型。
6.根据权利要求5所述的图像检测模型的训练方法,其特征在于,在采用所述强标注图像对初始检测模型进行训练,得到所述本次训练使用的第一检测模型之后,还包括:
确定所述强标注图像对应的强监督损失函数。
7.根据权利要求1所述的图像检测模型的训练方法,其特征在于,所述确定所述正样本候选框对应的第二损失,包括:
确定与所述正样本候选框距离最近的目标检测框,并将所述目标检测框的截断置信度作为所述正样本候选框的第二损失权重;
确定所述正样本候选框的分类损失和回归损失;
基于所述第二损失权重、所述分类损失和所述回归损失确定所述正样本候选框对应的第二损失。
8.一种图像检测模型的训练装置,其特征在于,所述装置包括:
无标注图像获取模块,用于从无标注数据集获取本次训练使用的无标注图像;
弱标注图像构建模块,用于利用所述本次训练使用的第一检测模型基于所述本次训练使用的无标注图像构建所述本次训练使用的弱标注图像,所述本次训练使用的第一检测模型为上次训练出的第二检测模型;
检测模型训练模块,用于根据强标注图像和所述本次训练使用的弱标注图像对所述本次训练使用的第一检测模型进行训练,得到本次训练出的第二检测模型;
训练次数判断模块,用于确定当前训练次数是否达到预设训练次数;
模型训练循环模块,用于若未达到所述预设训练次数,则返回执行所述无标注图像获取模块、所述弱标注图像构建模块、所述检测模型训练模块和所述训练次数判断模块,直至训练次数达到所述预设训练次数时,将最后一次训练出的第二检测模型确定为目标检测模型;
其中,所述检测模型训练模块,具体用于将所述强标注图像和所述本次训练使用的弱标注图像进行融合得到融合图像;采用所述融合图像对所述本次训练使用的第一检测模型进行训练得到联合损失函数;基于所述联合损失函数对所述本次训练使用的第一检测模型进行反向传播,以便对所述本次训练使用的第一检测模型的参数进行更新得到所述本次训练出的第二检测模型;
其中,检测结果包括目标的位置对应的检测框,所述检测结果是基于所述本次训练使用的第一检测模型对所述本次训练使用的无标注图像进行检测得到的;
所述检测模型训练模块,还具体用于基于所述本次训练使用的第一检测模型对所述融合图像进行检测,得到所述融合图像中弱标注图像区域对应的目标候选框;计算所述目标候选框与所述检测框之间的交并比IoU;基于所述IoU确定所述目标候选框中的负样本候选框和正样本候选框;确定所述负样本候选框对应的第一损失,确定所述正样本候选框对应的第二损失,并根据所述第一损失和所述第二损失确定所述融合图像中弱标注图像区域对应的弱监督损失函数;基于强监督损失函数、所述弱监督损失函数和分层可靠性系数确定所述联合损失函数;
其中,所述检测模型训练模块包括第一损失确定单元,所述第一损失确定单元,用于判断所述负样本候选框对应的所述IoU是否大于零;若大于,则确定出与所述负样本候选框距离最近的目标检测框,并将所述目标检测框的截断置信度作为所述负样本候选框的第一损失权重;若不大于,则确定所述第一损失权重为预设数值;确定所述负样本候选框的分类损失,并基于所述第一损失权重和所述分类损失确定所述负样本候选框对应的第一损失。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至7中任一所述的图像检测模型的训练方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7中任一所述的图像检测模型的训练方法。
CN202210387038.3A 2022-04-14 2022-04-14 图像检测模型的训练方法、装置、电子设备及存储介质 Active CN114463603B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210387038.3A CN114463603B (zh) 2022-04-14 2022-04-14 图像检测模型的训练方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210387038.3A CN114463603B (zh) 2022-04-14 2022-04-14 图像检测模型的训练方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114463603A CN114463603A (zh) 2022-05-10
CN114463603B true CN114463603B (zh) 2022-08-23

Family

ID=81418665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210387038.3A Active CN114463603B (zh) 2022-04-14 2022-04-14 图像检测模型的训练方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114463603B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116524297B (zh) * 2023-04-28 2024-02-13 迈杰转化医学研究(苏州)有限公司 一种基于专家反馈的弱监督学习训练方法
CN117274778B (zh) * 2023-11-21 2024-03-01 浙江啄云智能科技有限公司 基于无监督和半监督的图像搜索模型训练方法和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783844A (zh) * 2020-06-10 2020-10-16 东莞正扬电子机械有限公司 基于深度学习的目标检测模型训练方法、设备及存储介质
CN113762455A (zh) * 2020-08-07 2021-12-07 北京沃东天骏信息技术有限公司 检测模型训练方法、单字检测方法、装置、设备及介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10037471B2 (en) * 2016-07-05 2018-07-31 Nauto Global Limited System and method for image analysis
CN106934346B (zh) * 2017-01-24 2019-03-15 北京大学 一种目标检测性能优化的方法
CN110298298B (zh) * 2019-06-26 2022-03-08 北京市商汤科技开发有限公司 目标检测及目标检测网络的训练方法、装置及设备
CN110910467B (zh) * 2019-12-03 2023-04-18 浙江啄云智能科技有限公司 一种x射线图像样本生成方法、系统及用途
CN111079836B (zh) * 2019-12-16 2022-10-04 浙江大学 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN112381098A (zh) * 2020-11-19 2021-02-19 上海交通大学 基于目标分割领域自学习的半监督学习方法和系统
CN112669298A (zh) * 2020-12-31 2021-04-16 武汉科技大学 一种基于模型自训练的地基云图像云检测方法
CN112686326B (zh) * 2021-01-05 2022-09-06 中国科学技术大学 一种智能排序候选框的目标跟踪方法及系统
CN113688665B (zh) * 2021-07-08 2024-02-20 华中科技大学 一种基于半监督迭代学习的遥感影像目标检测方法及系统
CN114067109B (zh) * 2022-01-13 2022-04-22 安徽高哲信息技术有限公司 谷物检测方法及检测设备、存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783844A (zh) * 2020-06-10 2020-10-16 东莞正扬电子机械有限公司 基于深度学习的目标检测模型训练方法、设备及存储介质
CN113762455A (zh) * 2020-08-07 2021-12-07 北京沃东天骏信息技术有限公司 检测模型训练方法、单字检测方法、装置、设备及介质

Also Published As

Publication number Publication date
CN114463603A (zh) 2022-05-10

Similar Documents

Publication Publication Date Title
CN114463603B (zh) 图像检测模型的训练方法、装置、电子设备及存储介质
CN115797736B (zh) 目标检测模型的训练和目标检测方法、装置、设备和介质
CN109711427A (zh) 目标检测方法及相关产品
CN109492576A (zh) 图像识别方法、装置及电子设备
CN113487610B (zh) 疱疹图像识别方法、装置、计算机设备和存储介质
CN114882321A (zh) 深度学习模型的训练方法、目标对象检测方法和装置
CN113129335A (zh) 一种基于孪生网络的视觉跟踪算法及多模板更新策略
CN111291760A (zh) 图像的语义分割方法、装置及电子设备
CN111738085B (zh) 实现自动驾驶同时定位与建图的系统构建方法及装置
CN115471439A (zh) 显示面板缺陷的识别方法、装置、电子设备及存储介质
CN116758280A (zh) 目标检测方法、装置、设备以及存储介质
CN114972947B (zh) 一种基于模糊语义建模的深度场景文本检测方法和装置
CN115527083B (zh) 图像标注方法、装置和电子设备
CN116091784A (zh) 一种目标跟踪方法、设备及存储介质
CN114241411B (zh) 基于目标检测的计数模型处理方法、装置及计算机设备
CN113824989B (zh) 一种视频处理方法、装置和计算机可读存储介质
CN112784691B (zh) 一种目标检测模型训练方法、目标检测方法和装置
CN111765892B (zh) 一种定位方法、装置、电子设备及计算机可读存储介质
CN112446385B (zh) 一种场景语义分割方法、装置、电子设备
CN115240163A (zh) 一种基于一阶段检测网络的交通标志检测方法及系统
CN114399497A (zh) 文本图像质量检测方法、装置、计算机设备及存储介质
Peng et al. Instance-based dynamic label assignment for object detection
CN115761815B (zh) 人体检测模型的训练方法及人体检测方法、设备、介质
CN111881833B (zh) 一种车辆检测方法、装置、设备及存储介质
US20230281867A1 (en) Methods performed by electronic devices, electronic devices, and storage media

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant