CN114417965A - 图像处理模型的训练方法、目标检测方法及相关装置 - Google Patents
图像处理模型的训练方法、目标检测方法及相关装置 Download PDFInfo
- Publication number
- CN114417965A CN114417965A CN202111516693.6A CN202111516693A CN114417965A CN 114417965 A CN114417965 A CN 114417965A CN 202111516693 A CN202111516693 A CN 202111516693A CN 114417965 A CN114417965 A CN 114417965A
- Authority
- CN
- China
- Prior art keywords
- training
- image processing
- image data
- processing model
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像处理模型的训练方法、目标检测方法及相关装置,该图像处理模型的训练方法包括:将训练图像集中至少部分训练图像的第一区域的图像数据,复制至对应的训练图像中的第二区域,获得训练图像数据集;其中,同一训练图像中的第一区域和第二区域的重合程度小于或等于重合程度阈值;至少利用训练图像数据集,对待训练的图像处理模型进行训练,得到训练后的图像处理模型。上述方案,能够适配不同架构的图像处理模型并提高图像处理模型的检测准确率。
Description
技术领域
本申请涉及计算机视觉技术领域,特别是涉及一种图像处理模型的训练方法、目标检测方法及相关装置。
背景技术
目标检测(Object Detection,OD)作为计算机视觉领域的分支,在安防、工业领域得到了广泛应用,其中,基于深度学习网络的图像处理模型成为了目标检测的主流方式。现有技术中,通常会采用大量有标签的样本对图像处理模型进行训练,一旦有标签的样本有限,便会导致图像处理模型的检测准确率不佳,此外,现有技术中也会采取复用其他图像处理模型中的特征提取模块的方式,以减少对有标签的样本的需求,但是这样会限制新的图像处理模型的架构。有鉴于此,如何适配不同架构的图像处理模型并提高图像处理模型的检测准确率成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种图像处理模型的训练方法、目标检测方法及相关装置,能够适配不同架构的图像处理模型并提高图像处理模型的检测准确率。
为解决上述技术问题,本申请第一方面提供一种图像处理模型的训练方法,该方法包括:将训练图像集中至少部分训练图像的第一区域的图像数据,复制至对应的所述训练图像中的第二区域,获得训练图像数据集;其中,同一所述训练图像中的所述第一区域和所述第二区域的重合程度小于或等于重合程度阈值;至少利用所述训练图像数据集,对待训练的图像处理模型进行训练,得到训练后的图像处理模型。
为解决上述技术问题,本申请第二方面提供一种目标检测方法,该方法包括:获得待识别图像数据;将所述待识别图像数据输入图像处理模型,获得所述待识别图像数据上的目标对应的识别结果;其中,所述图像处理模型基于上述第一方面所述的方法获得。
为解决上述技术问题,本申请第三方面提供一种电子设备,该电子设备包括:相互耦接的存储器和处理器,其中,所述存储器存储有程序数据,所述处理器调用所述程序数据以执行上述第一方面或上述第二方面所述的方法。
为解决上述技术问题,本申请第四方面提供一种计算机可读存储介质,其上存储有程序数据,所述程序数据被处理器执行时实现上述第一方面或上述第二方面所述的方法。
上述方案,获得训练图像集并从训练图像集中提取至少部分训练图像,将被提取出的训练图像中的第一区域的图像数据,复制至对应的训练图像中的第二区域,从而构建训练图像数据集,其中,第二区域即可作为训练图像数据集中训练图像数据对应的检测标签,用于对不同架构的图像处理模型进行训练,使图像处理模型能够识别出训练图像数据上的第二区域,从而提高图像处理模型的识别能力并适配不同架构的图像处理模型,进而基于极少部分的有标签的训练图像即可完善对图像处理模型的训练,获得训练完成的图像处理模型,提高图像处理模型的检测准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请图像处理模型的训练方法一实施方式的流程示意图;
图2是本申请图像处理模型的训练方法另一实施方式的流程示意图;
图3是本申请获取训练图像数据一实施方式对应的示意图;
图4是本申请图2中步骤S204对应的一实施方式的流程示意图;
图5是本申请图像处理模型预训练时对应的一实施方式的示意图;
图6是本申请目标检测方法一实施方式的流程示意图;
图7是本申请电子设备一实施方式的结构示意图;
图8是本申请计算机可读存储介质一实施方式的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请图像处理模型的训练方法一实施方式的流程示意图,该方法包括:
S101:将训练图像集中至少部分训练图像的第一区域的图像数据,复制至对应的训练图像中的第二区域,获得训练图像数据集,其中,同一训练图像中的第一区域和第二区域的重合程度小于或等于重合程度阈值。
具体地,获得训练图像集,从训练图像集中提取至少部分训练图像,在各个提取出的训练图像中随机或按预设规则选择第一区域,然后将第一区域复制至对应的训练图像中的第二区域,获得提取出的各个训练图像对应的训练图像数据,组成训练图像数据集。
进一步地,同一训练图像对应的第一区域和第二区域的重合程度小于或等于重合程度阈值,其中,重合程度阈值可以是0-100%中的任一数值,当重合度阈值为0时,则表示第一区域和第二区域完全不重合,当重合度阈值为100%时,则表示第一区域和第二区域不完全重合即可。可选地,重合程度阈值也可设置为30%、50%或80%,本申请对此不做具体限制。
在一应用方式中,训练图像集包括多个无标签的训练图像和多个有标签的训练图像,且无标签的训练图像的数量超过有标签的训练图像。在训练图像集中的所有训练图像中分别随机选择第一区域,将第一区域中的图像数据复制至对应的训练图像的第二区域上。
在另一应用方式中,训练图像集包括多个无标签的训练图像,大量无标签的训练图像中提取其中的10%的图像进行人工标注,从而获得少量有标签的训练图像,将部分无标签的训练图像和已标注后的有标签的训练图像提取出来,在提取出的训练图像上按预设规则选择第一区域,将第一区域中的图像数据复制至对应的训练图像的第二区域上。其中,预设规则可以是从训练图像上选择一个小于训练图像面积一半的第一区域,本申请对预设规则不做具体限制,预设规则可自定义设置,从训练图像中能够提取第一区域且第一区域小于训练图像即可。
在一应用场景中,在训练图像上随机选择一个区域作为第一区域,第一区域的形状可以是任意形状且第一区域小于整个训练图像,将第一区域内的图像数据复制后移动至训练图像上的其他区域,复制后的第一区域内的图像数据最终的位置即为第二区域,且复制后的第一区域内的图像数据将第二区域内的图像数据覆盖,获得训练图像数据,遍历完训练图像集中的训练图像后,确定由训练图像数据组成的训练图像数据集。
在一具体应用场景中,在训练图像数据上建立笛卡尔坐标系,并在笛卡尔坐标系内随机选择一个第一坐标点,以第一坐标点为中心,生成一个小于整个训练图像的矩形框,将被选中的矩形框作为第一区域,在笛卡尔坐标系内随机选择一个第二坐标点,其中,第一坐标点和第二坐标点不重合,复制第一区域中的图像数据,将复制后的第一区域的中心移动至与第二坐标点重合,并以第二坐标点为中心转动复制后的第一区域,从而获得训练图像上复制后的第一区域的最终位置,确定第二区域。
S102:至少利用训练图像数据集,对待训练的图像处理模型进行训练,得到训练后的图像处理模型。
具体地,对于无标签的训练图像数据,训练图像数据中的第二区域可作为训练图像数据对应的检测标签,用于对不同架构的图像处理模型进行训练,使图像处理模型经过训练后具备识别能力,能够识别出训练图像数据中何处有重复内容以及识别出重复区域的大小。
在一应用方式中,利用训练图像数据集中的至少部分训练图像数据对图像处理模型进行预训练,以使预训练后的图像处理模型能够识别出训练图像数据中何处有重复内容以及识别出重复区域的大小。
进一步地,获得少量有标签的训练图像数据,其中,标签标注有目标的位置、范围和类别,利用有标签的图像数据对预训练后的图像处理模型进行有监督训练,得到训练后的图像处理模型,以使训练完成的图像处理模型能够对给定的视频或者图像,定位和识别出所关注的目标的位置、范围和类别。
可选地,当训练图像集中已经包括设置有标签的训练图像时,将有标签的训练图像筛选出来即可,当训练图像集中未包括设置有标签的训练图像时,将少量训练图像数据设置对应的标签即可。
在一应用场景中,图像处理模型包括骨干网络(backbone)、网络层(neck)和检测头(head),其中,骨干网络负责特征提取、网络层负责特征融合和检测头负责对目标进行分类和定位,将训练图像数据输入图像处理模型,以使骨干网络提取训练图像数据中的特征信息,网络层对特征进行融合进而检测头基于融合特征输出训练图像数据上的识别区域,基于识别区域与第二区域的误差调整骨干网络、网络层和检测头中的参数,直至误差趋于零,从而获得预训练后的图像处理模型,将有标签的训练图像输入预训练后的图像处理模型,以使骨干网络提取训练图像数据中的特征信息,网络层对特征进行融合进而检测头基于融合特征输出训练图像数据上的目标的预测参数,其中,预测参数包括目标对应的预测位置、预测范围和预测类别,基于预测参数与标签的误差调整骨干网络、网络层和检测头中的参数,直至误差趋于零,从而获得训练后的图像处理模型。
上述方案,获得训练图像集并从训练图像集中提取至少部分训练图像,将被提取出的训练图像中的第一区域的图像数据,复制至对应的训练图像中的第二区域,从而构建训练图像数据集,其中,第二区域即可作为训练图像数据集中训练图像数据对应的检测标签,用于对不同架构的图像处理模型进行训练,使图像处理模型能够识别出训练图像数据上的第二区域,从而提高图像处理模型的识别能力并适配不同架构的图像处理模型,进而基于极少部分的有标签的训练图像即可完善对图像处理模型的训练,获得训练完成的图像处理模型,提高图像处理模型的检测准确率。
请参阅图2,图2是本申请图像处理模型的训练方法另一实施方式的流程示意图,该方法包括:
S201:获得训练图像集中的训练图像,分别将至少部分训练图像作为目标训练图像。
具体地,获得训练图像集,其中,训练图像集包括多个无标签的训练图像和多个有标签的训练图像,且无标签的训练图像的数量超过有标签的训练图像。
进一步地,将训练图像集中的至少部分训练图像作为目标训练图像,进行下列步骤S202-S203。
可选地,统一训练图像集中训练图像的尺寸,以便于比对训练图像,管理后续的训练流程,将训练图像集中的所有训练图像作为目标训练图像。
在一应用场景中,获取包括所关注的目标的大量无标签的训练图像,在大量无标签的训练图像中提取其中的10%的图像进行人工标注,从而获得少量有标签的训练图像,确定训练图像集。
S202:在目标训练图像中随机或按照第一选取规则确定出第一区域和移动中心点。
具体地,在目标训练图像中随机选择第一区域和移动中心点,或者在目标训练图像中按照第一选取规则确定出第一区域和移动中心点。其中,移动中心点对应着复制后的第一区域所要移动至的位置。
在一应用方式中,对目标训练图像对应的坐标系进行归一化,在坐标系内随机生成归一化中心点;在预设范围内随机选择归一化长宽参数,基于归一化中心点和归一化长宽参数在目标训练图像中确定第一区域;其中,第一区域为矩形;在坐标系内基于归一化长宽参数确定移动中心点。
具体地,对训练图像对应的坐标系进行归一化处理,以便于统一所有训练图像选择第一区域和移动中心点的流程,在(0,1)的范围内生成归一化中心点,基于归一化中心点生成预设范围,在预设范围内随机取数确定归一化长宽参数,从而便于获取第一区域,且确保第一区域在训练图像数据的范围内,以归一化中心点为矩形的中心并根据归一化长宽参数确定矩形的第一区域。
进一步地,以长宽参数设置新的范围,在归一化后的坐标系内按新的范围随机取值作为移动中心点,以便第一区域以移动中心点为中心进行移动和转动时,仍保持在训练图像的范围内。
在一具体应用场景中,在(0,1)生成归一化中心点(xn,yn),在(0,2*min(1-xn,xn))和(0,2*min(1-yn,yn))随机取数得到归一化长宽参数(Hn,Wn),通过宽高相乘得到相应的第一区域rect(X0,Y0,H0,W0)。以长宽参数(Hn,Wn)生成新的范围(0,2*min(1-hn,hn))和(0,2*min(1-wn,wn)),在新的范围内生成新的归一化中心点(x1,y1)作为移动中心点。
S203:复制第一区域并移动至移动中心点对应的位置,将移动后的第一区域转动以移动中心点为中心旋转目标角度,使第一区域的图像数据覆盖第二区域的图像数据,得到目标训练图像对应的训练图像数据,并将训练图像数据作为训练图像数据集的数据,其中,第二区域为第一区域旋转后所覆盖的图像区域。
具体地,复制第一区域并将复制后的第一区域平移至移动中心点对应的位置,进而以移动中心点为中心使复制后的第一区域旋转目标角度,使旋转后的第一区域的图像数据覆盖当前位置处的训练图像的原始数据,得到目标训练图像对应的训练图像数据,其中,旋转后的第一区域所处的位置为第二区域,所有目标训练图像对应的训练图像数据组成训练图像数据集。
进一步地,目标角度是基于各个目标训练图像中包含的目标的类别确定的。其中,图像处理模型在进行目标检测时需要对目标进行分类,但是目标的类别的数量是不确定的,为了适应对目标进行分类时数目不确定的特点,将目标角度与目标的类别生成对应关系,从而提高对不同类别的目标的兼容性。
在一应用方式中,各个目标训练图像中包括各自对应的目标;将移动后的第一区域转动以移动中心点为中心旋转目标角度的步骤之前,还包括:确定各个目标训练图像中包含的目标所对应的各个类别和所有类别对应的总数量;将旋转总角度按总数量均分成多个旋转子角度;从各个类别中随机或按照第二选取规则,选取出一个类别作为预选类别,基于旋转子角度和预选类别确定目标角度。
具体地,基于本次训练时目标训练图像中的目标,确定目标的类别以及目标的类别所对应的总数量,将旋转总角度按目标的类别所对应的总数量进行平分获得旋转子角度,其中,旋转总角度可以为360度,在目标的类别所对应的总数量中随机或按照第二选取规则选择一个类别作为预选类别,从而将选中的数值与旋转子角度相乘,获得目标角度。
进一步地,在实际场景和应用中,图像处理模型所关注的目标是视需求决定的,因此,目标的总数量是不确定的,当图像处理模型所关注的目标为人,且需要对人的年龄段进行区分,则目标的类别可以包括青年、中年、老年,类别的总数量为三。当图像处理模型所关注的目标是动物,且需要对动物的进行区分,则目标的类别可以包括老虎、大象、狮子、猴子、长颈鹿,类别的总数量为五。当图像处理模型所关注的目标为物体,且需要对物种进行区分,则目标的类别可以包括人、动物、植物,类别的总数量为三。
可以理解的是,不同的图像处理模型可以有自定义的分类标准,因此,图像处理模型对目标进行分类时的数目是不确定的,为了适应对目标进行分类时数目不确定的特点,将目标角度离散成总数量对应的份数,从而提高对不同类别的目标的兼容性。
在一应用场景中,从各个类别中随机或按照第二选取规则,选取出一个类别作为预选类别,基于旋转子角度和预选类别确定目标角度的步骤,包括:为各个类别设置递增的编号;其中,编号为整数;从编号中随机选取一个编号对应的类别作为预选类别,基于旋转子角度以及预选类别对应的编号在所有类别对应的编号中的位置,确定目标角度。
具体地,为所有类别依次设置编号,且编号为递增的整数,其中,第一个标号可以从0开始,本申请对此不做具体限制。随机选择一个编号,将编号对应的类别作为预选类别,确定预选类别的编号在递增排序的编号中所在的位置,将该位置所对应的数值与旋转子角度相乘,确定第一区域对应的目标角度,从而适应对目标进行分类时数目不确定的特点,提高对不同类别的目标的兼容性。
在一应用方式中,复制第一区域并移动至移动中心点对应的位置,将移动后的第一区域转动以移动中心点为中心旋转目标角度,使第一区域的图像数据覆盖第二区域的图像数据,得到目标训练图像对应的训练图像数据的步骤,包括:复制第一区域并将复制后的第一区域平移至移动中心点对应的位置,以使第一区域的中心与移动中心点重合;以移动中心点为中心将平移至移动中心点的第一区域转动目标角度,使旋转后的第一区域的图像数据覆盖当前位置处的目标训练图像的原始数据,获得目标训练图像对应的训练图像数据。
具体地,复制第一区域并将复制后的第一区域平移至移动中心点对应的位置,以使第一区域的中心点与移动中心点重合,进而以移动中心点为中心使复制后的第一区域逆时针或顺时针旋转目标角度,使旋转后的第一区域的图像数据覆盖当前位置处的训练图像的原始数据,得到目标训练图像对应的训练图像数据,进而训练图像数据中包括第二区域,第二区域可在后续训练过程中作为检测标签。
在一具体应用场景中,请参阅图3,图3是本申请获取训练图像数据一实施方式对应的示意图,确定训练图像集中目标的类别总数量为M,将旋转总角度360度分成M份旋转子角度,对目标的类别从0开始递增编号,从训练图像中随机选定矩形区域rect(X0,Y0,H0,W0)作为第一区域,并随机产生一个移动中心点C(X1,Y1)和一个类别i,其中,类别i取[0,M-1]区间的整数。将矩形区域按中心平移至C(X1,Y1),使第一区域的中心与移动中心点重合,并按角度α=i×360/M进行旋转,得到训练图像数据。通过移动和旋转在训练图像的基础上构建出训练图像数据,其中,训练图像数据上移动和转动后所获得的第二区域在训练图像处理模型时可作为自监督学习的标签,以使训练后的图像处理模型能够识别出训练图像数据上重复的且经过平移和旋转的第二区域,尽管对角度进行分类与对目标进行识别有差异,但实践表明对旋转角度的识别有助于提升识别准确率。
可选地,在第一区域复制到第二区域之后,还包括:判断第一区域和第二区域的重合程度是否小于重合程度阈值;响应于重合程度小于重合程度阈值,生成训练图像数据;响应于重合程度大于或等于重合程度阈值,返回至在目标训练图像中随机或按照第一选取规则确定出第一区域和移动中心点的步骤。
具体地,在获得第二区域后判断第一区域和第二区域的重合程度是否小于重合程度阈值,也就是判断第一区域和第二区域之间的交并比是否小于预先设置的重合程度阈值,如果第一区域和第二区域重合程度超过重合程度阈值,则此时的训练图像数据为无效数据,则重新构建有效的训练图像数据。若果第一区域和第二区域重合程度阈值小于重合程度阈值,则此时的训练图像数据是有效的,则生成训练图像数据。通过设置重合程度阈值提高训练图像数据的质量和有效率。
可选地,重合程度阈值为1,当极端情况发生时交并比接近于1时,会导致难以准确判断复制后的第一区域的范围,这样的训练数据需要被剔除以提高训练效率。
S204:利用训练图像数据集,以及训练图像集中至少部分有标签的训练图像,对待训练的图像处理模型进行训练,得到训练后的图像处理模型。
具体地,训练图像集中包括多个无标签的训练图像和多个有标签的训练图像。
在一应用方式中,将训练图像数据集中每个训练图像数据中的第二区域作为检测标签,将训练图像数据输入图像处理模型,利用图像处理模型对训练图像数据中的第二区域进行检测,以使图像处理模型能够辨认出训练图像数据中的第二区域,基于图像处理模型输出的预测图像数据中所标注的识别区域与训练图像数据中的第二区域之间的误差,调整图像处理模型中的参数,直至误差收敛至预设条件,获得预训练后的图像处理模型,也就是说,预训练后的图像处理模型能够识别出图像中何处有重复内容以及识别出重复区域的大小,使图像处理模型具备识别能力。其中,训练图像数据集中的训练图像可以针对任何已经确定架构的图像处理模型进行训练,使图像处理模型具备识别能力,利用大量无标签的训练图像提高图像处理模型的识别能力,以提高图像处理模型的检测准确率。
进一步地,利用有标签的训练图像数据对预训练后的图像处理模型进行训练,调整图像处理模型中的参数,获得训练后的图像处理模型,以使训练后的图像处理模型能够定位和识别出所关注的目标的位置、范围和类别。
在一应用方式中,请参阅图4,图4是本申请图2中步骤S204对应的一实施方式的流程示意图,步骤S204具体包括:
S401:将各个训练图像数据对应的第二区域作为训练图像数据对应的检测标签。
具体地,训练图像数据中包括第二区域,而每个训练图像区域中的第二区域即为图像处理模型对应的检测标签,其中,训练图像数据由大量的无标签图像数据构建,训练图像数据中第二区域作为检测标签,即为图像处理模型在初步训练时需要检测出的目标。其中,前述步骤中通过对旋转角度的离散化为图像处理模型进行目标检测时构建了最直接的自监督学习任务,以使图像处理模型的任务中包括检测出不同旋转角度的第二区域。
S402:利用训练图像集中包括检测标签的各个训练图像数据对待训练的图像处理模型进行自监督训练,获得预训练后的图像处理模型,其中,预训练后的图像处理模型能够识别出训练图像数据上的第二区域。
具体地,将包括检测标签的各个训练图像数据输入图像处理模型中,对图像处理模型进行自监督训练,以使预训练后的图像处理模型能够识别出训练图像数据上的第二区域,从而获得预训练后的图像处理模型。
在一应用方式中,请参阅图5,图5是本申请图像处理模型预训练时对应的一实施方式的示意图,将训练图像数据输入至图像处理模型中,以使图像处理模型对训练图像数据中哪块区域出现了重复,且重复区域相较于初始区域移动方向和旋转角度进行检测,基于检测误差对图像处理模型中的参数进行调整,直至检测误差收敛至预设条件。其中,在训练图像处理模型时可以将大量的无标签图像利用起来,降低了过拟合风险并提升了图像处理模型的泛化能力,使预训练后的图像处理模型对具有同一规律的训练图像数据也能识别出其中的第一区域和第二区域。
进一步地,区别于复用其他图像处理模型中的特征提取模块的方式,本申请所提供的方法不需要将核心网络剥离出来,使整个训练过程均与目标检测任务相关,对于已经确定架构的图像处理模型而言,无需对架构进行调整即可适用于已有的图像处理模型。
S403:利用有标签的训练图像对预训练后的图像处理模型进行有监督训练,获得训练后的图像处理模型。
具体地,利用少量有标签的训练图像数据对预训练后的图像处理模型进行有监督训练,以使训练完成的图像处理模型能够定位和识别出所关注的目标的位置、范围和类别。
在一应用方式中,将有标签的训练图像数据输入预训练后的图像处理模型,以使图像处理模型输出检测图像,比较检测图像与有标签的训练图像之间的差异,基于差异微调图像处理模型中的参数,直至差异收敛至预设条件,获得训练完成的图像处理模型。
在本实施例中,通过在训练图像集中的训练图像上,尤其是无标签的训练图像上选定第一区域,将第一区域平移和旋转至第二区域从而获得训练图像数据,其中,第一区域旋转的目标角度与目标的类别对应的总数量相关,通过对目标角度的离散化为图像处理模型进行目标检测时构建了最直接的自监督学习任务,利用训练图像数据对图像处理模型进行预训练,提高图像处理模型的识别能力和泛化能力,进而利用有标签的训练图像对预训练后的图像处理模型进行微调,使该方法能适用于不同架构的图像处理模型对整个图像处理模型进行整体训练,并提高训练完成的图像处理模型的检测准确率。
请参阅图6,图6是本申请目标检测方法一实施方式的流程示意图,该方法包括:
S601:获得待识别图像数据。
具体地,获得包含待识别对象的待识别图像数据。其中,待识别对应的类别属于上述实施例中的训练图像集中的目标对应的类别。
S602:将待识别图像数据输入图像处理模型,获得待识别图像数据上的目标对应的识别结果。
具体地,图像处理模型是基于上述任一实施例中所述的方法获得。将待识别图像数据输入图像处理模型中,从而获得待识别图像数据上的目标所对应的识别结果。
请参阅图7,图7是本申请电子设备一实施方式的结构示意图,该电子设备70包括相互耦接的存储器701和处理器702,其中,存储器701存储有程序数据(图未示),处理器702调用程序数据以实现上述任一实施例中的方法,相关内容的说明请参见上述方法实施例的详细描述,在此不再赘叙。
请参阅图8,图8是本申请计算机可读存储介质一实施方式的结构示意图,该计算机可读存储介质80存储有程序数据800,该程序数据800被处理器执行时实现上述任一实施例中的方法,相关内容的说明请参见上述方法实施例的详细描述,在此不再赘叙。
需要说明的是,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (12)
1.一种图像处理模型的训练方法,其特征在于,所述方法包括:
将训练图像集中至少部分训练图像的第一区域的图像数据,复制至对应的所述训练图像中的第二区域,获得训练图像数据集;其中,同一所述训练图像中的所述第一区域和所述第二区域的重合程度小于或等于重合程度阈值;
至少利用所述训练图像数据集,对待训练的图像处理模型进行训练,得到训练后的图像处理模型。
2.根据权利要求1所述的图像处理模型的训练方法,其特征在于,所述训练图像集中包括多个无标签的训练图像和多个有标签的训练图像;
所述至少利用所述训练图像数据集,对待训练的图像处理模型进行训练,得到训练后的图像处理模型的步骤,包括:
利用所述训练图像数据集,以及所述训练图像集中至少部分有标签的训练图像,对所述待训练的图像处理模型进行训练,得到所述训练后的图像处理模型。
3.根据权利要求1所述的图像处理模型的训练方法,其特征在于,所述将训练图像集中至少部分训练图像的第一区域的图像数据,复制至对应的所述训练图像中的第二区域,获得训练图像数据集的步骤,包括:
分别将所述至少部分所述训练图像作为目标训练图像,进行如下操作:
在所述目标训练图像中随机或按照第一选取规则确定出所述第一区域和移动中心点;复制所述第一区域并移动至所述移动中心点对应的位置,将移动后的所述第一区域转动以所述移动中心点为中心旋转目标角度,使所述第一区域的图像数据覆盖第二区域的图像数据,得到所述目标训练图像对应的训练图像数据,并将所述训练图像数据作为所述训练图像数据集的数据;其中,所述第二区域为所述第一区域旋转后所覆盖的图像区域。
4.根据权利要求3所述的图像处理模型的训练方法,其特征在于,所述目标角度是基于各个所述目标训练图像中包含的目标的类别确定的。
5.根据权利要求4所述的图像处理模型的训练方法,其特征在于,各个所述目标训练图像中包括各自对应的目标;
所述将移动后的所述第一区域转动以所述移动中心点为中心旋转目标角度的步骤之前,还包括:
确定各个所述目标训练图像中包含的目标所对应的各个类别和所有所述类别对应的总数量;将旋转总角度按所述总数量均分成多个旋转子角度;
从所述各个类别中随机或按照第二选取规则,选取出一个类别作为预选类别,基于所述旋转子角度和所述预选类别确定目标角度。
6.根据权利要求5所述的图像处理模型的训练方法,其特征在于,所述从所述各个类别中随机或按照第二选取规则,选取出一个类别作为预选类别,基于所述旋转子角度和所述预选类别确定目标角度的步骤,包括:
为各个所述类别设置递增的编号;其中,所述编号为整数;
从所述编号中随机选取一个编号对应的类别作为所述预选类别,基于所述旋转子角度以及所述预选类别对应的编号在所有所述类别对应的编号中的位置,确定所述目标角度。
7.根据权利要求3所述的图像处理模型的训练方法,其特征在于,所述在所述目标训练图像中随机或按照第一选取规则确定出所述第一区域和移动中心点的步骤,包括:
对所述目标训练图像对应的坐标系进行归一化,在所述坐标系内随机生成归一化中心点;
在预设范围内随机选择归一化长宽参数,基于所述归一化中心点和所述归一化长宽参数在所述目标训练图像中确定所述第一区域;其中,所述第一区域为矩形;
在所述坐标系内基于所述归一化长宽参数确定所述移动中心点。
8.根据权利要求3所述的图像处理模型的训练方法,其特征在于,所述复制所述第一区域并移动至所述移动中心点对应的位置,将移动后的所述第一区域转动以所述移动中心点为中心旋转目标角度,使所述第一区域的图像数据覆盖第二区域的图像数据,得到所述目标训练图像对应的训练图像数据的步骤,包括:
复制所述第一区域并将复制后的所述第一区域平移至所述移动中心点对应的位置,以使所述第一区域的中心与所述移动中心点重合;
以所述移动中心点为中心将平移至所述移动中心点的所述第一区域转动所述目标角度,使旋转后的所述第一区域的图像数据覆盖当前位置处的所述目标训练图像的原始数据,获得所述目标训练图像对应的所述训练图像数据。
9.根据权利要求2所述的图像处理模型的训练方法,其特征在于,所述利用所述训练图像数据集和所述训练图像集中至少部分有标签的训练图像,对所述待训练的图像处理模型进行训练,得到所述训练后的图像处理模型的步骤,包括:
将各个所述训练图像数据对应的所述第二区域作为所述训练图像数据对应的检测标签;
利用所述训练图像集中包括所述检测标签的各个所述训练图像数据对所述待训练的图像处理模型进行自监督训练,获得预训练后的所述图像处理模型;其中,预训练后的所述图像处理模型能够识别出所述训练图像数据上的所述第二区域;
利用所述有标签的训练图像对预训练后的所述图像处理模型进行有监督训练,获得所述训练后的图像处理模型。
10.一种目标检测方法,其特征在于,所述方法包括:
获得待识别图像数据;
将所述待识别图像数据输入图像处理模型,获得所述待识别图像数据上的目标对应的识别结果;其中,所述图像处理模型基于权利要求1-9中任一项所述的方法获得。
11.一种电子设备,其特征在于,包括:相互耦接的存储器和处理器,其中,所述存储器存储有程序数据,所述处理器调用所述程序数据以执行如权利要求1-9或10中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有程序数据,其特征在于,所述程序数据被处理器执行时实现如权利要求1-9或10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111516693.6A CN114417965A (zh) | 2021-12-06 | 2021-12-06 | 图像处理模型的训练方法、目标检测方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111516693.6A CN114417965A (zh) | 2021-12-06 | 2021-12-06 | 图像处理模型的训练方法、目标检测方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114417965A true CN114417965A (zh) | 2022-04-29 |
Family
ID=81264791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111516693.6A Pending CN114417965A (zh) | 2021-12-06 | 2021-12-06 | 图像处理模型的训练方法、目标检测方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114417965A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116596878A (zh) * | 2023-05-15 | 2023-08-15 | 湖北纽睿德防务科技有限公司 | 一种带钢表面缺陷检测方法、系统、电子设备及介质 |
-
2021
- 2021-12-06 CN CN202111516693.6A patent/CN114417965A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116596878A (zh) * | 2023-05-15 | 2023-08-15 | 湖北纽睿德防务科技有限公司 | 一种带钢表面缺陷检测方法、系统、电子设备及介质 |
CN116596878B (zh) * | 2023-05-15 | 2024-04-16 | 湖北纽睿德防务科技有限公司 | 一种带钢表面缺陷检测方法、系统、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108038474B (zh) | 人脸检测方法、卷积神经网络参数的训练方法、装置及介质 | |
CN109145766B (zh) | 模型训练方法、装置、识别方法、电子设备及存储介质 | |
US20210056715A1 (en) | Object tracking method, object tracking device, electronic device and storage medium | |
CN113269073A (zh) | 一种基于yolo v5算法的船舶多目标追踪方法 | |
CN109343920B (zh) | 一种图像处理方法及其装置、设备和存储介质 | |
CN112200081A (zh) | 异常行为识别方法、装置、电子设备及存储介质 | |
CN111052128B (zh) | 用于检测和定位视频中的对象的描述符学习方法 | |
CN114821102A (zh) | 密集柑橘数量检测方法、设备、存储介质及装置 | |
JP2022521540A (ja) | オンライン学習を利用した物体追跡のための方法およびシステム | |
CN111985458A (zh) | 一种检测多目标的方法、电子设备及存储介质 | |
CN111027526A (zh) | 一种提高车辆目标检测识别检测效率的方法 | |
CN112560584A (zh) | 一种人脸检测方法及装置、存储介质、终端 | |
CN112541394A (zh) | 黑眼圈及鼻炎识别方法、系统及计算机介质 | |
CN111091104A (zh) | 一种目标物体的防护检测方法、装置、设备及存储介质 | |
CN114417965A (zh) | 图像处理模型的训练方法、目标检测方法及相关装置 | |
CN112150508B (zh) | 一种目标追踪方法、装置及相关设备 | |
CN111680680B (zh) | 一种目标码定位方法、装置、电子设备及存储介质 | |
CN109191489B (zh) | 一种飞行器着陆标志的检测跟踪方法与系统 | |
CN115953744A (zh) | 一种基于深度学习的车辆识别追踪方法 | |
CN116052189A (zh) | 一种文本识别方法、系统和存储介质 | |
CN116246161A (zh) | 领域知识引导下的遥感图像目标精细类型识别方法及装置 | |
CN115984759A (zh) | 变电站开关状态识别方法、装置、计算机设备和存储介质 | |
CN114927236A (zh) | 一种面向多重目标图像的检测方法及系统 | |
CN108734164A (zh) | 卡片、识别卡片的方法、绘本阅读机器人及存储设备 | |
Visalatchi et al. | Intelligent Vision with TensorFlow using Neural Network Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |