CN112784675B - 目标检测方法及装置、存储介质、终端 - Google Patents
目标检测方法及装置、存储介质、终端 Download PDFInfo
- Publication number
- CN112784675B CN112784675B CN202011339863.3A CN202011339863A CN112784675B CN 112784675 B CN112784675 B CN 112784675B CN 202011339863 A CN202011339863 A CN 202011339863A CN 112784675 B CN112784675 B CN 112784675B
- Authority
- CN
- China
- Prior art keywords
- target
- sample image
- preset
- image
- training data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Astronomy & Astrophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
一种目标检测方法及装置、存储介质、终端,所述方法包括:获取样本图像,所述样本图像包括目标样本图像,所述目标样本图像是指包含预设目标的样本图像;在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像;采用训练数据对检测模型进行训练,以得到训练后的检测模型,所述训练数据包括所述第一待训练图像;采用所述训练后的检测模型检测待检测图像,以确定其中是否包含所述预设目标。通过本发明的技术方案,能够高效准确地检测出图像中的预设目标。
Description
技术领域
本发明涉及计算机视觉领域,尤其涉及一种目标检测方法及装置、存储介质、终端。
背景技术
当前目标检测是计算机视觉领域中一个富有挑战性的课题,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域。随着相关技术的发展和产业的需要,对于目标检测的效率和准确度的要求越来越高。例如,在利用无人机进行航拍时,需要准确识别航拍得到的图像中的目标,由于其中目标的尺寸均非常小,识别难度较大,容易出现错检、漏检的情况。
因此,亟需提出一种高效、准确的目标检测方法。
发明内容
本发明所要解决的技术问题是提供一种目标检测方法,能够高效、准确地检测出图像中的预设目标。
为解决上述技术问题,本发明实施例提供一种目标检测方法,所述方法包括:获取样本图像,所述样本图像包括目标样本图像,所述目标样本图像是指包含预设目标的样本图像;在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像;采用训练数据对检测模型进行训练,以得到训练后的检测模型,所述训练数据包括所述第一待训练图像;采用所述训练后的检测模型检测待检测图像,以确定其中是否包含所述预设目标。
可选的,在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像包括:在所述目标样本图像周围增加第一预设空白区域;将所述目标样本图像中包含的各个预设目标至所述第一预设空白区域内,以得到所述第一待训练图像。
可选的,所述第一预设空白区域位于所述目标样本图像的下方,所述第一预设空白区域的宽度与所述目标样本图像的宽度相同,且所述第一预设空白区域的高度的取值范围为所述目标样本图像高度的1/10至1/5。
可选的,对于不同的目标样本图像,所述第一预设空白区域的位置和/或尺寸不同。
可选的,所述预设目标为尺寸占其所属图像的尺寸的比例不超过预设比例的目标,所述样本图像还包括普通样本图像,所述普通样本图像中不包含所述预设目标,采用训练数据对检测模型进行训练之前,还包括:在所述普通样本图像周围增加第二预设空白区域,以得到调整后的普通样本图像;判断所述调整后的普通样本图像中是否包含所述预设目标;如果是,则将所述调整后的普通样本图像添加至所述训练数据。
可选的,将所述调整后的普通样本图像添加至所述训练数据之前还包括:将所述调整后的普通样本图像中包含的各个预设目标复制至所述第二预设空白区域内。
可选的,采用训练数据对检测模型进行训练之前,还包括:对所述训练数据进行数据增强,所述数据增强包括以下一项或多项:调整所述训练数据的亮度和/或对比度、将所述训练数据旋转预设角度、为所述训练数据增加噪声。
可选的,所述目标样本图像中标记有所述预设目标的类别信息,所述方法还包括:在检测到所述待检测图像中包含所述预设目标时,一并识别所述预设目标的类别信息。
可选的,所述目标样本图像具有标识图形,所述标识图形用于指示所述预设目标在所述目标样本图像中的位置,在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像包括:在所述目标样本图像中查找所述标识图形;对所述标识图形指示的预设目标进行复制。
为解决上述技术问题,本发明实施例还提供一种目标检测装置,所述装置包括:获取模块,用于所述样本图像包括目标样本图像,所述目标样本图像是指包含预设目标的样本图像;增强模块,用于在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像;训练模块,用于采用训练数据对检测模型进行训练,以得到训练后的检测模型,所述训练数据包括所述第一待训练图像;检测模块,用于采用所述训练后的检测模型检测待检测图像,以确定其中是否包含所述预设目标。
本发明实施例还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行上述目标检测方法的步骤。
本发明实施例还提供一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述目标检测方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:本发明实施例提供一种目标检测方法,所述方法包括:获取样本图像,所述样本图像包括目标样本图像,所述目标样本图像是指包含预设目标的样本图像;在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像;采用训练数据对检测模型进行训练,以得到训练后的检测模型,所述训练数据包括所述第一待训练图像;采用所述训练后的检测模型检测待检测图像,以确定其中是否包含所述预设目标。在本发明实施例中,对目标样本图像中的预设目标进行复制,使得目标样本图像中包含的预设目标数量增多,从而可以增加预设目标在训练数据中的占比。由此,在采用训练数据训练检测模型时,能够使检测模型充分学习到预设目标的特征,从而高效、准确地检测待检测图像中是否包含预设目标,避免错检和漏检。
进一步地,本发明实施例在目标样本图像周围增加第一预设空白区域,并将目标样本图像中的各个预设目标复制至该第一预设空白区域内,由于第一预设空白区域位于目标样本图像之外,在第一预设空白区域内复制各个预设目标可以避免复制的预设目标对图像中原本的预设目标造成遮挡,影响检测效果。
进一步地,在本发明实施例中,对于不同的目标样本图像,增加的第一预设空白区域的位置和/或尺寸是不同的,从而得到的第一待训练图像也是不同的,提高了训练数据的多样性,从而使得训练后的检测模型的泛化性更好,可以进一步地提高检测的准确性。
附图说明
图1是本发明实施例中一种目标检测方法的流程示意图。
图2是本发明实施例中一种目标检测方法的场景示意图。
图3是本发明实施例中一种目标检测方法的效果示意图。
图4是本发明实施例中一种目标检测装置的结构示意图。
具体实施方式
如上所述,亟需一种目标检测方法,能够高效、准确地识别出图像中的预设目标。
本发明的发明人经过研究发现,针对正常尺寸目标的目标检测方法较为常见,但针对小尺寸目标的检测仍然存在诸多的障碍,这里的小尺寸目标可以是不超过预设尺寸的目标,也可以是尺寸占其所属图像的尺寸的比例不超过预设比例的目标。当前针对小尺寸目标的检测方法主要有两类,第一类是通过对训练数据过采样来提高小尺寸目标的检测准确度;第二类是通过图像的多尺度特征融合来提高小尺寸目标的检测准确度,两种方法均有明显的缺陷。
具体而言,第一类方法为了增加小尺寸目标在训练数据中的占比,重复采样包含小尺寸目标的样本图像。如果原本训练数据中小尺寸目标的数量占比很小,需要很大的过采样率才能使得小尺寸目标在训练数据中占比满足要求,这样会导致训练数据中样本图像的数量过多,使得检测模型的训练时间过长,浪费训练资源。第二类方法是通过调整训练模型的网络结构实现,主要借鉴特征金字塔(Feature Pyramid Networks,FPN)的思想,融合浅层的特征和高层的语义信息,采用的模型结构由多个下采样和上采样模块组成,由于下采样是通过卷积实现,上采样大部分都是通过反卷积来实现,大大增加了模型的复杂度,降低了模型的检测速度。
为了解决上述技术问题,本发明实施例提供一种目标检测方法,所述方法包括:获取样本图像,所述样本图像包括目标样本图像,所述目标样本图像是指包含预设目标的样本图像;在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像;采用训练数据对检测模型进行训练,以得到训练后的检测模型,所述训练数据包括所述第一待训练图像;采用所述训练后的检测模型检测待检测图像,以确定其中是否包含所述预设目标。在本发明实施例中,在本发明实施例中,目标样本图像中包含预设目标,对目标样本图像中的预设目标进行复制可以增加预设目标在训练数据中的占比,在采用训练数据训练检测模型时,能够使检测模型充分学习到预设目标的特征,从而高效、准确地检测待检测图像中是否包含预设目标,避免错检和漏检。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
参考图1,图1是本发明实施例中一种目标检测方法的流程示意图。所述目标检测方法可以由终端执行,所述终端可以是各种恰当的终端,例如手机、电脑、物联网设备等,但并不限于此。所述方法可以用于检测待检测图像中是否包含预设目标,所述待检测图像可以是终端实时采集到的图像,也可以是预先存储在终端上的图像,还可以是终端从外部接收到的图像,但并不限于此;所述预设目标可以是终端根据预先从外部接收到的指令来确定,也可以是终端通过各种适当的模型对输入图像进行识别来确定。
图1所示的目标检测方法具体可以包括如下步骤:
步骤S101:获取样本图像,所述样本图像包括目标样本图像,所述目标样本图像是指包含预设目标的样本图像;
步骤S102:在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像;
步骤S103:采用训练数据对检测模型进行训练,以得到训练后的检测模型,所述训练数据包括所述第一待训练图像;
步骤S104:采用所述训练后的检测模型检测待检测图像,以确定其中是否包含所述预设目标。
在步骤S101的具体实施中,终端可以从外部获取样本图像,也可以从存储在本地的训练集中选取至少一部分作为样本图像。所述样本图像可以包括目标样本图像,也可以包括普通样本图像,其中,目标样本图像是指包含预设目标的样本图像,普通样本图像是指不包含预设目标的样本图像。
进一步地,所述预设目标是指特定的目标对象,例如船只、人脸、汽车车牌等,该预设目标可以通过目标对象的特征值进行判断,例如可以通过人脸的特征值判断是否属于人脸。该预设目标可以是终端根据预先从外部接收到的指令来确定,也可以是终端通过各种适当的模型对输入图像进行识别来确定。此外,所述预设目标还可以额外增加其他条件,例如在特定的目标对象基础上,可以是尺寸不超过预设尺寸,也可以是尺寸占其所属图像的尺寸的比例不超过预设比例,但并不限于此。
在步骤S102的具体实施中,在训练检测模型之前,可以先对样本图像进行预处理。如果样本图像是目标样本图像,可以将其包含的预设目标在目标样本图像中进行复制,从而得到第一待训练图像,并将其作为训练数据的一部分。由此,本发明实施例通过复制预设目标的方式增加预设目标在训练数据中的占比,从而可以在采用训练数据训练检测模型时,使检测模型充分学习到预设目标的特征,提取到较多关于预设目标的语义信息,从而可以在检测待检测图像时避免预设目标的错检或漏检。
需要说明的是,在目标样本图像中进行复制可以包括在目标样本图像的区域内进行复制,也可以包括在目标样本图像的周围区域内进行复制,在此不作限制。此外,本发明实施例中,所述预设目标可以复制任意次数,例如3次。
进一步地,在所述目标样本图像中对所述目标样本图像包含的预设目标进行复制可以是在所述目标样本图像周围增加第一预设空白区域。该第一预设空白区域可以和目标样本图像邻接而不重叠,或者也可以和目标样本图像邻接并部分重叠,或者也可以和目标样本图像不邻接(也即二者之间有间隔)但位于同一图像中。优选地,第一预设空白区域和目标样本图像邻接而不重叠,并且位于目标样本图像的下方。此外,该第一预设空白区域是空白的,也即没有包含任何有实际含义的对象,其可以是完全空白的,也可以填充有预设颜色或预设图案。优选地,第一预设空白区域可以填充为黑色。在复制时,遍历所述目标样本图像中包含的各个预设目标,并将各个预设目标复制至所述第一预设空白区域内,以得到所述第一待训练图像。在将复制至所述第一预设空白区域内之前,也可以先将各个预设目标调整至合适的尺寸,使得复制到第一预设空白区域后,调整后的预设目标不会超出第一预设空白区域的范围。
进一步地,将所述目标样本图像中包含的各个预设目标复制至所述第一预设空白区域内可以是在第一预设空白区域内随机地复制所述目标样本图像中包含的各个预设目标。具体而言,复制后,各个预设目标在第一预设空白区域内的位置是随机的,和/或,各个预设目标在第一预设空白区域内的大小是随机的,和/或,各个预设目标在第一预设空白区域内的数量是随机的,也即,各个预设目标的复制次数是随机的,但并不限于此。
进一步地,在将所述目标样本图像中包含的各个预设目标复制至所述第一预设空白区域的过程中,如果所述第一预设空白区域已满,则停止复制。也即,如果将某一预设目标复制至第一预设空白区域中的任一位置均会对第一预设空白区域内已有的预设目标造成遮挡,则停止复制,并以当前的图像为所述第一待训练图像。
在本发明的一个非限制性实施例中,将所述目标样本图像中的各个预设目标在所述第一预设空白区域内复制2至4次。优选的,将各个预设目标在第一预设空白区域内复制3次。
参考图2,图2示出了本发明实施例中一种目标检测方法的场景示意图。
具体而言,图2中目标样本图像21中包含的预设目标有第一预设目标22和第二预设目标23,对目标样本图像21包含的第一预设目标22和第二预设目标23进行复制可以是先在所述目标样本图像21周围增加第一预设空白区域24,分别将第一预设目标22和第二预设目标23复制至所述第一预设空白区域24内,以得到所述第一待训练图像20。
继续参考图1,对于不同的目标样本图像,所述第一预设空白区域的位置和/或尺寸可以是不同的。具体而言,所述第一预设空白区域可以位于目标样本图像周围的一个或多个位置。例如,第一预设空白区域可以位于目标样本图像的下方,也可以位于目标样本图像的上方和下方,但并不限于此。对于不同的目标样本图像,所述第一预设空白区域的尺寸也可以是不同的,其宽度和/或高度可以取任意值。从而可以得到多样的训练数据,可以对检测模型进行多尺度的训练,提高检测模型的泛化性,使得训练后的检测模型不仅能高效准确地检测预设目标,也能在一定程度上提升其他目标的检测精度。
在本发明一个非限制性实施例中,所述第一预设空白区域可以位于目标样本图像的下方,其宽度可以与所述目标样本图像的宽度相同,且所述第一预设空白区域的高度的取值范围为所述目标样本图像高度的1/10至1/5。
进一步地,所述目标样本图像具有标识图形,所述标识图形用于指示所述预设目标在所述目标样本图像中的位置。具体而言,所述标识图形可以是预先标注在目标样本图像上的(也即,终端获取的目标样本图像上预先标注有标识图形),也可以是在终端获取目标样本图像后对目标样本图像进行操作后得到的,例如,可以由人工在目标样本图像上标注标识图形,也可以由终端自动地在目标样本图像上标注出所述标注图形,但并不限于此。所述标识图形可以是矩形、圆形、梯形等图形,但并不限于此。所述标识图形可以位于预设目标的四周以包围住整个预设目标,也可以只包围住预设目标的一部分,但并不限于此。在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像时,可以通过在所述目标样本图像中查找所述标识图形,以识别到预设目标,再对所述标识图形指示的预设目标进行复制。
以上实施例所述的方法可以适用于各类目标识别的场景,无论是常规的目标识别场景,还是小尺寸目标识别的场景。
具体而言,在小尺寸目标的识别场景中,所述预设目标是尺寸占其所属图像的尺寸的比例不超过预设比例的目标。在这种场景下,普通样本图像可能包含了特定的目标对象,不过由于该目标对象的尺寸比例超过了预设比例,导致其不属于预设目标,相应地,该图像也就属于普通样本图像。不过,在这种情况下,可以对普通样本图像进行处理,使处理后的样本图像尽量符合目标样本图像的要求,这样就可以丰富训练数据,使得训练结果更好。具体而言,对于各个普通样本图像,可以在普通样本图像的周围增加第二预设空白区域,以得到调整后的普通样本图像;然后判断调整后的普通样本图像中是否包含所述预设目标(也即,增加第二预设空白区域后,是否存在特定的目标对象,并且其尺寸占调整后的普通样本图像的尺寸比例不超过预设比例),如果是,则将调整后的样本图像加入至训练数据中,从而增加了预设目标在训练数据中的数量。
进一步地,在将所述调整后的普通样本图像添加至所述训练数据之前还可以包括:将所述调整后的普通样本图像中包含的各个预设目标复制至所述第二预设空白区域内。具体而言,依次判断调整后普通样本图像中的目标是否为预设目标(也即,判断其尺寸占调整后的普通样本图像的尺寸比例是否不超过预设比例),再依次遍历调整后普通样本图像中的各个预设目标,并将各个预设目标复制至第二预设空白区域内,复制完成后,再将调整后的普通样本图像添加至训练数据中。在将预设目标复制至所述第二预设空白区域内之前,也可以先将各个预设目标调整至合适的尺寸,使得复制到第二预设空白区域后,调整后的预设目标不会超出第二预设空白区域的范围。需要说明的是,所述第二预设空白区域的具体内容可以参照上文对于第一预设空白区域的相关描述,在此不再赘述。
还需要说明的是,也可以将普通样本图像直接加入训练数据,以训练所述检测模型。
进一步地,在检测待检测图像中的预设目标时,还容易受到光照、待检测图像角度等因素的影响,从而影响其检测准确度。因此,本发明实施例的方案中在采用训练数据对检测模型进行训练之前,还可以对所述训练数据进行数据增强,所述数据增强包括以下一项或多项:调整所述训练数据的亮度和/或对比度、将所述训练数据旋转预设角度、为所述训练数据增加噪声,但并不限于此。其中,所述训练数据中可以包括以下一项或多项:目标样本图像、第一待训练图像、普通样本图像、调整后的普通样本图像等,但并不限于此。
在步骤S103的具体实施中,所述检测模型可以是基于深度学习的模型,目前基于深度学习的模型可以分类两类,一类是基于回归的单阶段卷积神经网络模型,其不需要候选区域建议阶段,可以通过一个阶段直接产生物体的类别概率和位置坐标值,比较典型的算法有YOLO、SSD和RetinaNet等;一类是基于候选区域的两阶段卷积神经网络模型,其将检测问题划分为两个阶段,首先产生候选区域(region proposals),然后对候选区域进行分类和精修,这类算法的典型代表有R-CNN,Faster-RCNN等。本发明实施例的方案既可以适用于基于回归的单阶段卷积神经网络模型,也可以适用于基于候选区域的阶段卷积神经网络模型,还可以适用于任何恰当的网络模型,在此不做任何限制。由此,本发明实施例提供的目标检测方法对检测模型的具体结构并不作任何限制。
在步骤S104的具体实施中,终端可以先获取待检测图像,所述待检测图像可以是终端实时采集到的待检测图像,也可以是从外部接收到的待检测图像,还可以是预先存储在本地的待检测图像,但并不限于此。采用训练后的检测模型检测待检测图像,如果检测到所述待检测图像中包含所述预设目标,则可以输出预设目标的位置和范围,例如,可以在待检测图像中用包围盒(Bounding Box)标注出所述预设目标的位置和范围。
参考图3,图3示出了本发明实施中一种目标检测方法的效果示意图。通过采用本发明实施例中的方案,终端可以检测出待检测图像30中包含的预设目标,并采用包围盒(Bounding Box)31标注出所述预设目标的位置和范围。
继续参考图1,本发明实施例在检测到所述待检测图像中包含所述预设目标时,还可以一并识别所述预设目标的类别信息。
具体而言,所述目标样本图像中还可以标注有预设目标的类别信息,对目标样本图像中包含的预设目标进行复制,增加了预设目标在训练数据中的占比,采用训练数据训练所述检测模型时,不仅可以使检测模型充分学习到训练数据的位置特征,还可以使检测模型充分学习到预设目标的类别特征。因此,在检测到所述待检测图像中包含所述预设目标时,还可以一并识别所述预设目标的类别信息。
参考图4,图4是本发明实施例中一种目标检测装置的结构示意图。本发明实施例中的目标检测装置可以包括:获取模块41、增强模块42、训练模块43、检测模块44。
其中,获取模块41,用于所述样本图像包括目标样本图像,所述目标样本图像是指包含预设目标的样本图像;增强模块42,用于在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像;训练模块43,用于采用训练数据对检测模型进行训练,以得到训练后的检测模型,所述训练数据包括所述第一待训练图像;检测模块44,用于采用所述训练后的检测模型检测待检测图像,以确定其中是否包含所述预设目标。
关于所述一种目标检测装置的工作原理、工作方式的更多内容,可以参照上述图1至图3中的相关描述,在此不再赘述。
本发明实施例还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行上述目标检测方法的步骤。所述存储介质可以包括ROM、RAM、磁盘或光盘等。所述存储介质还可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。
本发明实施例还公开了一种终端,所述终端可以包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序。所述处理器运行所述计算机程序时可以执行图1至图4所示目标检测方法的步骤。所述终端包括但不限于手机、计算机、平板电脑等终端设备。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,表示前后关联对象是一种“或”的关系。
本申请实施例中出现的“多个”是指两个或两个以上。
本申请实施例中出现的第一、第二等描述,仅作示意与区分描述对象之用,没有次序之分,也不表示本申请实施例中对设备个数的特别限定,不能构成对本申请实施例的任何限制。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (11)
1.一种目标检测方法,其特征在于,所述方法包括:
获取样本图像,所述样本图像包括目标样本图像,所述目标样本图像是指包含预设目标的样本图像;
在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像;
采用训练数据对检测模型进行训练,以得到训练后的检测模型,所述训练数据包括所述第一待训练图像;
采用所述训练后的检测模型检测待检测图像,以确定其中是否包含所述预设目标;
其中,所述预设目标为尺寸占其所属图像的尺寸的比例不超过预设比例的目标,所述样本图像还包括普通样本图像,所述普通样本图像中不包含所述预设目标,采用训练数据对检测模型进行训练之前,还包括:
在所述普通样本图像周围增加第二预设空白区域,以得到调整后的普通样本图像;
判断所述调整后的普通样本图像中是否包含所述预设目标;
如果是,则将所述调整后的普通样本图像添加至所述训练数据。
2.根据权利要求1所述的目标检测方法,其特征在于,在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像包括:
在所述目标样本图像周围增加第一预设空白区域;
将所述目标样本图像中包含的各个预设目标复制至所述第一预设空白区域内,以得到所述第一待训练图像。
3.根据权利要求2所述的目标检测方法,其特征在于,所述第一预设空白区域位于所述目标样本图像的下方,所述第一预设空白区域的宽度与所述目标样本图像的宽度相同,且所述第一预设空白区域的高度的取值范围为所述目标样本图像高度的1/10至1/5。
4.根据权利要求2所述的目标检测方法,其特征在于,对于不同的目标样本图像,所述第一预设空白区域的位置和/或尺寸不同。
5.根据权利要求1所述的目标检测方法,其特征在于,将所述调整后的普通样本图像添加至所述训练数据之前还包括:
将所述调整后的普通样本图像中包含的各个预设目标复制至所述第二预设空白区域内。
6.根据权利要求1所述的目标检测方法,其特征在于,采用训练数据对检测模型进行训练之前,还包括:
对所述训练数据进行数据增强,所述数据增强包括以下一项或多项:调整所述训练数据的亮度和/或对比度、将所述训练数据旋转预设角度、为所述训练数据增加噪声。
7.根据权利要求1所述的目标检测方法,其特征在于,所述目标样本图像中标记有所述预设目标的类别信息,所述方法还包括:
在检测到所述待检测图像中包含所述预设目标时,一并识别所述预设目标的类别信息。
8.根据权利要求1至7任一项所述的目标检测方法,其特征在于,所述目标样本图像具有标识图形,所述标识图形用于指示所述预设目标在所述目标样本图像中的位置,在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像包括:
在所述目标样本图像中查找所述标识图形;
对所述标识图形指示的预设目标进行复制。
9.一种目标检测装置,其特征在于,所述装置包括:
获取模块,用于获取样本图像,所述样本图像包括目标样本图像,所述目标样本图像是指包含预设目标的样本图像;
增强模块,用于在所述目标样本图像中,对所述目标样本图像包含的预设目标进行复制,以得到第一待训练图像;
训练模块,用于采用训练数据对检测模型进行训练,以得到训练后的检测模型,所述训练数据包括所述第一待训练图像;
检测模块,用于采用所述训练后的检测模型检测待检测图像,以确定其中是否包含所述预设目标;
其中,所述预设目标为尺寸占其所属图像的尺寸的比例不超过预设比例的目标,所述样本图像还包括普通样本图像,所述普通样本图像中不包含所述预设目标,所述目标检测装置还包括:用于在采用训练数据对检测模型进行训练之前,在所述普通样本图像周围增加第二预设空白区域,以得到调整后的普通样本图像的模块;
用于判断所述调整后的普通样本图像中是否包含所述预设目标,如果是,则将所述调整后的普通样本图像添加至所述训练数据的模块。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1至8的任一项所述目标检测方法的步骤。
11.一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时执行权利要求1至8任一项所述目标检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011339863.3A CN112784675B (zh) | 2020-11-25 | 2020-11-25 | 目标检测方法及装置、存储介质、终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011339863.3A CN112784675B (zh) | 2020-11-25 | 2020-11-25 | 目标检测方法及装置、存储介质、终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112784675A CN112784675A (zh) | 2021-05-11 |
CN112784675B true CN112784675B (zh) | 2023-06-30 |
Family
ID=75750592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011339863.3A Active CN112784675B (zh) | 2020-11-25 | 2020-11-25 | 目标检测方法及装置、存储介质、终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112784675B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113688887A (zh) * | 2021-08-13 | 2021-11-23 | 百度在线网络技术(北京)有限公司 | 图像识别模型的训练与图像识别方法、装置 |
CN113837185B (zh) * | 2021-11-23 | 2022-08-23 | 深圳比特微电子科技有限公司 | 目标检测方法、系统、装置及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631797A (zh) * | 2015-12-24 | 2016-06-01 | 小米科技有限责任公司 | 水印添加方法及装置 |
CN106408038A (zh) * | 2016-09-09 | 2017-02-15 | 华南理工大学 | 一种基于卷积神经网络模型的旋转汉字识别方法 |
CN109255767A (zh) * | 2018-09-26 | 2019-01-22 | 北京字节跳动网络技术有限公司 | 图像处理方法和装置 |
CN109740571A (zh) * | 2019-01-22 | 2019-05-10 | 南京旷云科技有限公司 | 图像采集的方法、图像处理的方法、装置和电子设备 |
CN111027325A (zh) * | 2019-12-09 | 2020-04-17 | 北京知道创宇信息技术股份有限公司 | 一种模型生成方法、实体识别方法、装置及电子设备 |
CN111228821A (zh) * | 2020-01-15 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 智能检测穿墙外挂方法、装置、设备及其存储介质 |
CN111311475A (zh) * | 2020-02-21 | 2020-06-19 | 广州腾讯科技有限公司 | 检测模型训练方法、装置、存储介质和计算机设备 |
CN111768333A (zh) * | 2020-05-29 | 2020-10-13 | 北京沃东天骏信息技术有限公司 | 标识去除方法、装置、设备及存储介质 |
-
2020
- 2020-11-25 CN CN202011339863.3A patent/CN112784675B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631797A (zh) * | 2015-12-24 | 2016-06-01 | 小米科技有限责任公司 | 水印添加方法及装置 |
CN106408038A (zh) * | 2016-09-09 | 2017-02-15 | 华南理工大学 | 一种基于卷积神经网络模型的旋转汉字识别方法 |
CN109255767A (zh) * | 2018-09-26 | 2019-01-22 | 北京字节跳动网络技术有限公司 | 图像处理方法和装置 |
CN109740571A (zh) * | 2019-01-22 | 2019-05-10 | 南京旷云科技有限公司 | 图像采集的方法、图像处理的方法、装置和电子设备 |
CN111027325A (zh) * | 2019-12-09 | 2020-04-17 | 北京知道创宇信息技术股份有限公司 | 一种模型生成方法、实体识别方法、装置及电子设备 |
CN111228821A (zh) * | 2020-01-15 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 智能检测穿墙外挂方法、装置、设备及其存储介质 |
CN111311475A (zh) * | 2020-02-21 | 2020-06-19 | 广州腾讯科技有限公司 | 检测模型训练方法、装置、存储介质和计算机设备 |
CN111768333A (zh) * | 2020-05-29 | 2020-10-13 | 北京沃东天骏信息技术有限公司 | 标识去除方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
Augmentation for small object detection;Mate Kisantal 等;《arXiv》;20190219;第2-4节 * |
Mate Kisantal 等.Augmentation for small object detection.《arXiv》.2019, * |
Also Published As
Publication number | Publication date |
---|---|
CN112784675A (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108171112B (zh) | 基于卷积神经网络的车辆识别与跟踪方法 | |
CN111444921A (zh) | 划痕缺陷检测方法、装置、计算设备和存储介质 | |
CN110516514B (zh) | 一种目标检测模型的建模方法和装置 | |
CN112784675B (zh) | 目标检测方法及装置、存储介质、终端 | |
CN112801158A (zh) | 基于级联融合和注意力机制的深度学习小目标检测方法及装置 | |
CN111414807A (zh) | 一种基于yolo技术的潮水识别与危机预警方法 | |
CN111695373B (zh) | 斑马线的定位方法、系统、介质及设备 | |
CN110599453A (zh) | 一种基于图像融合的面板缺陷检测方法、装置及设备终端 | |
CN111126393A (zh) | 车辆外观改装判断方法、装置、计算机设备及存储介质 | |
CN111738036A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN112613387A (zh) | 一种基于YOLOv3的交通标志检测方法 | |
CN112686274A (zh) | 目标对象的检测方法及设备 | |
Tian et al. | License plate detection in an open environment by density-based boundary clustering | |
CN110544268B (zh) | 一种基于结构光及SiamMask网络的多目标跟踪方法 | |
CN116071294A (zh) | 一种光纤表面缺陷检测方法和装置 | |
CN111881984A (zh) | 一种基于深度学习的目标检测方法和装置 | |
CN112149707B (zh) | 图像采集控制方法、装置、介质及设备 | |
CN111881752B (zh) | 一种护栏检测分类方法、装置、电子设备及存储介质 | |
CN117635590A (zh) | 一种笔记本电脑外壳的缺陷检测方法、缺陷检测装置和存储介质 | |
CN115797314B (zh) | 零件表面缺陷检测方法、系统、设备及存储介质 | |
CN114550129B (zh) | 一种基于数据集的机器学习模型处理方法和系统 | |
CN112183485B (zh) | 基于深度学习的交通锥桶检测定位方法、系统及存储介质 | |
CN113569752B (zh) | 车道线结构识别方法、装置、设备及介质 | |
CN113221604B (zh) | 目标识别方法、装置、存储介质及电子设备 | |
CN114332814A (zh) | 一种停车框识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 200331 room e176, 1f, 406 Gulang Road, Putuo District, Shanghai Applicant after: Shanghai Xinyi Intelligent Technology Co.,Ltd. Address before: 200434 10th floor, 1388 Shuidian Road, Hongkou District, Shanghai Applicant before: Shanghai Xinyi Intelligent Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |