CN109697397B - 一种目标检测方法及装置 - Google Patents

一种目标检测方法及装置 Download PDF

Info

Publication number
CN109697397B
CN109697397B CN201711001606.7A CN201711001606A CN109697397B CN 109697397 B CN109697397 B CN 109697397B CN 201711001606 A CN201711001606 A CN 201711001606A CN 109697397 B CN109697397 B CN 109697397B
Authority
CN
China
Prior art keywords
image
interest
size
training
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711001606.7A
Other languages
English (en)
Other versions
CN109697397A (zh
Inventor
杨文鲜
刘昕冉
张翠翠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN201711001606.7A priority Critical patent/CN109697397B/zh
Publication of CN109697397A publication Critical patent/CN109697397A/zh
Application granted granted Critical
Publication of CN109697397B publication Critical patent/CN109697397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/582Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种目标检测方法及装置,目标检测方法包括:获取初始图像,初始图像中对兴趣目标标注有初始边界框;将初始图像输入预先训练的回归模型,得到回归模型输出的包含调整后边界框的待分割图像,回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到;将待分割图像中调整后边界框所包含的图像分割出来,作为包含兴趣目标的待分类图像。在本申请中,通过以上方式提高了兴趣目标的边界框的标注精度。

Description

一种目标检测方法及装置
技术领域
本申请涉及目标检测领域,更具体地说,涉及一种目标检测方法及装置。
背景技术
交通部门为了大众进行安全有序的行驶,通常将道路交通标志以标注的形式放置在路面两侧的标志牌或直接绘制在路面上,用于对驾驶员的驾驶进行警告、禁止、限制或指示。
在智能交通领域,道路交通标志有着巨大的作用,如导航服务商可以基于道路交通标志规划道路行程;智能汽车可以根据道路交通标志实时判断道路是否可以行驶等。因此,道路交通标志的识别显得尤为重要。现有道路交通标志的识别一般是采用图像分割技术,识别交通标志在图像中的位置区域,并将交通标志从图像中分割出来。然而,图像分割技术识别目标在图像中位置区域的精度往往不高,导致道路交通标志的识别精度不高。
发明内容
有鉴于此,本申请提供了一种目标检测方法及装置,用于解决采用图像分割技术从图像中识别道路交通标志,精度不高的问题。
为了实现上述目的,现提出的方案如下:
一种目标检测方法,包括:
获取初始图像,所述初始图像中对兴趣目标标注有初始边界框;
将所述初始图像输入预先训练的回归模型,得到所述回归模型输出的包含调整后边界框的待分割图像,所述回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到;
将所述待分割图像中所述调整后边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像。
优选的,所述回归模型的预训练过程,包括:
获取标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像;
利用所述训练图像对回归模型进行训练,以使得回归模型输出的对所述初始边界框调整后的边界框与所述真实边界框的位置重合度满足设定条件。
优选的,所述训练图像中标注有兴趣目标的初始边界框包括:
对兴趣目标的真实边界框进行位置扰动后得到的边界框。
优选的,还包括:
利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,所述分类模型为预先利用标记有分类类别的训练图像进行训练得到。
优选的,所述分类模型包括大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型;
所述大尺寸兴趣目标分类模型为利用标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像进行训练得到;
所述小尺寸兴趣目标分类模型为利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像进行训练得到;
所述利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,包括:
若各待分类图像中仅存在属于设定大尺寸级别的兴趣目标,则利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;
若各待分类图像中仅存在属于设定小尺寸级别的兴趣目标,则利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别。
优选的,利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,还包括:
若各待分类图像中同时存在属于设定大尺寸级别和设定小尺寸级别的兴趣目标,则首先利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;然后对于大尺寸兴趣目标分类模型确定的类别属于噪声的目标待分类图像,利用所述小尺寸兴趣目标分类模型,确定所述目标待分类图像所包含的兴趣目标的最终分类类别。
优选的,利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像训练得到小尺寸兴趣目标分类模型的过程,包括:
将标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像在其所属初始图像上,按照设定比例进行边界外扩,将边界外扩后的训练图像及所述训练图像作为输入训练图像对;
利用输入训练图像对,对小尺寸兴趣目标分类模型进行训练;
所述利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别,包括:
在所述初始图像中,将所述待分类图像的边界按照设定比例外扩,得到边界外扩后的待分类图像;
将所述待分类图像及其边界外扩后的待分类图像共同输入所述小尺寸兴趣目标分类模型,以得到小尺寸兴趣目标分类模型输出的所述待分类图像所包含的兴趣目标的类别。
一种目标检测装置,包括:
获取模块,用于获取初始图像,所述初始图像中对兴趣目标标注有初始边界框;
调整模块,用于将所述初始图像输入预先训练的回归模型,得到所述回归模型输出的包含调整后边界框的待分割图像,所述回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到;
分割模块,用于将所述待分割图像中所述调整后边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像。
优选的,还包括:回归模型训练模块,用于获取标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像,并利用所述训练图像对回归模型进行训练,以使得回归模型输出的对所述初始边界框调整后的边界框与所述真实边界框的位置重合度满足设定条件。
优选的,所述训练图像中标注有兴趣目标的初始边界框包括:
对兴趣目标的真实边界框进行位置扰动后得到的边界框。
优选的,还包括:
分类模块,用于利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,所述分类模型为预先利用标记有分类类别的训练图像进行训练得到。
优选的,所述分类模型包括大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型;该装置还包括:
大尺寸分类模型训练单元,用于利用标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像训练得到大尺寸兴趣目标分类模型;
小尺寸分类模型训练单元,用于利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像训练得到小尺寸兴趣目标分类模型;
所述分类模块,包括:
大尺寸分类单元,用于若各待分类图像中仅存在属于设定大尺寸级别的兴趣目标,则利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;
小尺寸分类单元,用于若各待分类图像中仅存在属于设定小尺寸级别的兴趣目标,则利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别。
优选的,所述分类模块还包括:
大小尺寸共同分类单元,用于若各待分类图像中同时存在属于设定大尺寸级别和设定小尺寸级别的兴趣目标,则首先利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;然后对于大尺寸兴趣目标分类模型确定的类别属于噪声的目标待分类图像,利用所述小尺寸兴趣目标分类模型,确定所述目标待分类图像所包含的兴趣目标的最终分类类别。
优选的,所述小尺寸分类模型训练单元包括:
第一小尺寸分类模型训练子单元,用于将标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像在其所属初始图像上,按照设定比例进行边界外扩,将边界外扩后的训练图像及所述训练图像作为输入训练图像对;
第二小尺寸分类模型训练子单元,用于利用输入训练图像对,对小尺寸兴趣目标分类模型进行训练;
所述小尺寸分类单元包括:
第一小尺寸分类子单元,用于在所述初始图像中,将所述待分类图像的边界按照设定比例外扩,得到边界外扩后的待分类图像;
第二小尺寸分类子单元,用于将所述待分类图像及其边界外扩后的待分类图像共同输入所述小尺寸兴趣目标分类模型,以得到小尺寸兴趣目标分类模型输出的所述待分类图像所包含的兴趣目标的类别。
从上述的技术方案可以看出,通过获取初始图像,所述初始图像中对兴趣目标标注有初始边界框;将所述初始图像输入预先训练的回归模型,得到所述回归模型输出的包含调整后边界框的待分割图像,所述回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到;将所述待分割图像中所述调整后边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像,实现目标检测。本申请中预先训练的回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到,因此将初始图像作为预先训练的回归模型的输入值后,回归模型可以对初始边界框进行调整,使调整后边界框更加贴近真实边界框,提高兴趣目标的边界框的标注精度,进而由回归模型输出包含调整后边界框的待分割图像,并根据调整后边界框,从待分割图像中分割出兴趣目标。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的一种目标检测方法流程图;
图2示例了兴趣目标的真实边界框及非真实边界框的示意图;
图3示例了将待分割图像中调整后边界框所包含的图像分割出来,得到的包含兴趣目标的待分类图像的示意图;
图4为本申请实施例公开的另一种目标检测方法流程图;
图5-1示例了不同尺寸级别的兴趣目标的一种示意图;
图5-2示例了不同尺寸级别的兴趣目标的另一种示意图;
图6为标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像及放大后的训练图像的示意图;
图7为本申请实施例公开的一种分类方法的流程图;
图8为本申请实施例公开的一种目标检测装置的逻辑结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例公开了一种目标检测方法,基于服务器(如导航服务商使用的服务器等)实现。其中,服务器主要利用预先训练的回归模型将初始图像中包含兴趣目标的图像分割出来,实现目标的检测。接下来对本申请提出的目标检测方法进行介绍,参见图1所示,该方法包括:
步骤S100、获取初始图像。
可选的,初始图像可以是导航采集车所采集的道路影像,也可以是通过其它方式、渠道获取的包含兴趣目标的图像,如用户上传、网络下载等。
本步骤中所获取的初始图像为对所包含的兴趣目标标注有初始边界框的初始图像。初始边界框的标注过程可以是通过现有图像处理技术(如图像区域分割技术)标注的,或者是将初始图像的边界框直接作为兴趣目标的初始边界框。
初始图像中兴趣目标标注的初始边界框具体可能为兴趣目标的真实边界框,如图2所示,兴趣目标的真实边界框即能精确包围兴趣目标的边界框,具体为能包围兴趣目标的最小外接框。
当然,初始图像中兴趣目标标注的初始边界框一般为:兴趣目标的非真实边界框。兴趣目标的非真实边界框标注的范围往往不够精确,不能精确的确定兴趣目标在初始图像中的位置区域,可以参见由非真实边界框2包围了整个初始图像的图2,如图2所示的涵盖部分兴趣目标和部分路灯(噪声)的非真实边界框1,其标注的范围为部分兴趣目标和部分噪声图像;非真实边界框2标注的过程即将初始图像的边界框直接作为兴趣目标的初始边界框,其标注的范围为整个兴趣目标和除兴趣目标之外的噪声。
在本实施例中,兴趣目标具体可以包括但不局限于为交通标识,例如红色圆形(红圆)标识:例如最大限速\限宽\禁止左转\禁止非机动车等标志;蓝色圆形(蓝圆)标识:例如直行\向左转弯\向右转弯等标志;黄色三角(黄三角)标识:例如减速慢行\注意施工\注意行人等标志。
在本实施例中,并不限定初始边界框的形状、标注方式及标注范围。具体的,初始边界框的形状具体可以包括但不局限于为矩形框。初始边界框的标注方式可以为人工预先标注,或者由机器自动进行标注。其中,机器自动进行标注具体可以包括但不局限于使用特征比对的方式在整个图像上寻找兴趣目标的所在位置,进行标注。比如,利用交通标志可能的大小(例如,20-40px)的矩形窗口在图片上(例如,2000x2000px)从横向和纵向两个方向按照一定的步长滑动,然后用浅层而快速的图像特征,判断窗口的图像是否是交通标志。
步骤S110、将所述初始图像输入预先训练的回归模型,得到所述回归模型输出的包含调整后边界框的待分割图像。
在本实施例中,所述回归模型为机器学习模型中的一种,其利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到。利用回归模型对初始图像中兴趣目标的初始边界框进行调整的操作,使调整后的边界框能够较为精确的确定兴趣目标在初始图像中的位置区域,从而较为精确的确定兴趣目标在初始图像中的位置区域。具体调整的过程为:将所述初始图像输入预先训练的回归模型,由预先训练的回归模型对初始图像中兴趣目标的初始边界框进行调整,得到所述回归模型输出的包含调整后边界框的待分割图像。
其中,回归模型具体可以包括但不局限于为神经网络模型。
兴趣目标的真实边界框即能精确包围兴趣目标的边界框,具体为能包围兴趣目标的最小外接框。
步骤S120:将所述待分割图像中所述调整后边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像。
在得到回归模型输出的包含调整后边界框的待分割图像后,已经能够确定初始图像中兴趣目标精确或较为精确的位置区域即调整后边界框标注的范围,在确定初始图像中兴趣目标精确或较为精确的位置区域后,将所述待分割图像中所述调整后边界框所包含的图像分割出来,即可得到包含所述兴趣目标的图像。
以图2示出的初始图像为例,初始图像中所述调整后边界框所包含的图像即真实边界框所包含的图像,将所述待分割图像中所述调整后边界框所包含的图像分割出来,得到的包含兴趣目标的待分类图像请参见图3,如图3所示,分割出来的图像包括完整的兴趣目标。
在本申请中,通过获取初始图像,所述初始图像中对兴趣目标标注有初始边界框;将所述初始图像输入预先训练的回归模型,得到所述回归模型输出的包含调整后边界框的待分割图像,所述回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到;将所述待分割图像中所述调整后边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像,实现目标检测。本申请中预先训练的回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到,因此将初始图像作为预先训练的回归模型的输入值后,回归模型可以对初始边界框进行调整,使调整后边界框更加贴近真实边界框,提高兴趣目标的边界框的标注精度,进而由回归模型输出包含调整后边界框的待分割图像,并根据调整后边界框,从待分割图像中分割出兴趣目标。
本申请通过提高兴趣目标的边界框的标注精度,来达到提高兴趣目标的识别精度的目的。
在本实施例中,提供了回归模型的预训练方案,具体的回归模型的预训练过程可以包括以下步骤:
S1、获取标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像。
兴趣目标的真实边界框即能精确包围兴趣目标的边界框,具体为能包围兴趣目标的最小外接框。
标注有兴趣目标的初始边界框的训练图像有多个,且每个训练图像中兴趣目标的初始边界框各不相同,兴趣目标的各个初始边界框是对兴趣目标的真实边界框进行位置扰动后得到的边界框。因各个初始边界框是对兴趣目标的真实边界框进行位置扰动后得到的边界框,因此各个初始边界框的标注范围必定与兴趣目标的真实边界框的标注范围不同。
需要说明的是,对兴趣目标的真实边界框进行位置扰动,得到兴趣目标的初始边界框是为了更好模拟实际情况下采集的初始图像中所可能出现的各种情况,以对回归模型进行更精确的训练,进而利用训练后的回归模型输出包含与兴趣目标的真实边界框相同或相近的边界框的待分割图像。
在本实施例中,并不限定标注有初始边界框的训练图像的个数,但是为了更精确的训练,参加训练的标注有初始边界框的训练图像的个数越多越好。
同样,并不限定对兴趣目标的真实边界框进行位置扰动的方式,具体可以包括但不局限于为缩放的扰动方式、偏移的扰动方式或缩放加偏移的扰动方式。
其中,兴趣目标的真实边界框请参见图2所示的真实边界框,对兴趣目标的真实边界框进行位置扰动后得到的边界框可以参见图2所示的各个非真实边界框。
S2、利用所述训练图像对回归模型进行训练,以使得回归模型输出的对所述初始边界框调整后的边界框与所述真实边界框的位置重合度满足设定条件。
以标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像作为训练样本,以回归模型输出的对初始边界框调整后的边界框与所述真实边界框的位置重合度达到设定条件为目标,对初始回归模型进行训练,得到训练后的回归模型,训练后的回归模型作为步骤S110中预先训练的回归模型,将初始图像作为输入值,输出包含调整后边界框的待分割图像。
在训练的过程中,回归模型输出的对所述初始边界框调整后的边界框与所述真实边界框的位置重合度越高,训练得到的回归模型越精确,进而使用训练得到的回归模型对初始图像中兴趣目标的初始边界框的调整越精确,得到的调整后边界框与兴趣目标的真实边界框的重合度越高。
在本实施例中,提供了另外一种目标检测方法,请参见图4,可以包括以下步骤:
步骤S200、获取初始图像。
步骤S210、将所述初始图像输入预先训练的回归模型,得到所述回归模型输出的包含调整后边界框的待分割图像。
步骤S220、将所述待分割图像中所述调整后边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像。
步骤S200-步骤S220与前述实施例中的步骤S100-步骤S120一一对应,步骤S200-步骤S220的详细过程参见前文介绍,此处不再赘述。
步骤S230、利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别。
在本实施例中,预先训练的分类模型为预先利用标记有分类类别的训练图像进行训练得到。
由于分类模型为预先利用标记有分类类别的训练图像进行训练得到,能够准确的对待分类图像进行分类,因此在执行步骤S200至步骤S220,得到包含兴趣目标的图像后,再利用预先训练的分类模型,确定包含兴趣目标的图像所包含的兴趣目标的类别,能够实现对兴趣目标的精细分类。并且,由于步骤S200-S220输出的包含兴趣目标的图像更加准确,即图像质量更高,因此通过分类模型进行分类后能够进一步提高分类的准确度。
在本实施例中,预先训练的分类模型具体可以包括:大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型。
将预先训练的分类模型设置为大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型的目的在于:在实际情况中,兴趣目标的尺寸会有大有小,为了分类结果更加准确,分类效率更高,可以利用对应的尺寸分类模型对相应尺寸的兴趣目标进行分类。
其中,大尺寸兴趣目标分类模型主要对大尺寸的兴趣目标进行分类,所述大尺寸兴趣目标分类模型为利用标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像进行训练得到。
小尺寸兴趣目标分类模型主要对小尺寸的兴趣目标进行分类,所述小尺寸兴趣目标分类模型为利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像进行训练得到。
需要说明的是,大尺寸级别的兴趣目标的大小大于小尺寸级别的兴趣目标的大小。大尺寸级别只是限定了大尺寸的一个范围,小尺寸级别只是限定了小尺寸的一个范围,并未限定尺寸的具体数值。不同的大尺寸级别的兴趣目标的尺寸大小也会有所不同,不同的小尺寸级别的兴趣目标的尺寸大小也会有所不同。
大尺寸级别和小尺寸级别均可以灵活设置,如摄像头可以认定为小尺寸级别的兴趣目标,交通标志指示牌可以认定为大尺寸级别的兴趣目标,如图5-1所示的摄像头为小尺寸级别的兴趣目标,交通标志指示牌为大尺寸级别的兴趣目标;或者,摄像头和交通标志指示牌可以认定为小尺寸级别的兴趣目标,路线指示牌可以认定为大尺寸级别的兴趣目标,如图5-2所示的摄像头和交通标志指示牌均为小尺寸级别的兴趣目标,路线指示牌为大尺寸级别的兴趣目标。
需要说明的是,在某一批次分类任务中,利用大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型进行分类之前,首先需要确定当前批次分类任务中是否仅存在大尺寸级别的兴趣目标或仅存在小尺寸级别的兴趣目标或同时存在大尺寸级别的兴趣目标和小尺寸级别的兴趣目标。当然,在某一批次分类任务中,想要分成的各类类别是确定的,进而可以根据确定的各类类别对应的目标来判断各待分类图像中是否存在大尺寸级别的兴趣目标和小尺寸级别的兴趣目标。例如,第一批次分类任务所确定的类别分别为类别1、类别2和类别3,类别1、类别2和类别3对应的目标均是大尺寸的,则可以认为各待分类图像中仅存在属于设定大尺寸级别的兴趣目标。第二批次分类任务所确定的类别分别为类别4和类别5,类别4和类别5对应的目标均是小尺寸的,则可以认为各分类图像中仅存在属于设定小尺寸级别的兴趣目标;第三批次分类任务所确定的类别为类别6、类别7和类别8,类别6和类别7对应的目标均是大尺寸的,类别8对应的目标是小尺寸的,则可以认为各分类图像中同时存在属于设定大尺寸级别和设定小尺寸级别的兴趣目标。
基于大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型及上述在某一批次分类任务中判断各待分类图像中是否存在大尺寸级别的兴趣目标和小尺寸级别的兴趣目标的过程,上述利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别的具体过程,可以包括以下步骤:
S1、若各待分类图像中仅存在属于设定大尺寸级别的兴趣目标,则利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别。
S2、若各待分类图像中仅存在属于设定小尺寸级别的兴趣目标,则利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别。
在本申请的另一个实施例中,对上述利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别的具体过程进一步扩展,在上述步骤S1和S2的基础上,还可以包括以下步骤:
S3、若各待分类图像中同时存在属于设定大尺寸级别和设定小尺寸级别的兴趣目标,则首先利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;然后对于大尺寸兴趣目标分类模型确定的类别属于噪声的目标待分类图像,利用所述小尺寸兴趣目标分类模型,确定所述目标待分类图像所包含的兴趣目标的最终分类类别。
对于大尺寸兴趣目标分类模型确定的类别属于噪声的目标待分类图像,无法利用大尺寸兴趣目标分类模型确定出属于噪声的目标待分类图像,但并不排除属于噪声的目标待分类图像为小尺寸图像的可能,则需要继续利用小尺寸兴趣目标分类模型,确定属于噪声的目标待分类图像所包含的兴趣目标的类别,作为属于噪声的目标待分类图像的最终类别,进一步提高图像分类的精细度。
在本实施例中,基于前述内容,对利用标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像进行训练得到大尺寸兴趣目标分类模型的过程进行介绍。
利用标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像进行训练得到大尺寸兴趣目标分类模型的过程,可以包括以下步骤:
S1、将标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像作为输入训练图像。
标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像即标记有分类类别,且由设定大尺寸级别的兴趣目标的真实边界框包围的图像。
S2、利用输入训练图像,对大尺寸兴趣目标分类模型进行训练。
训练后的大尺寸兴趣目标分类模型即利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别的具体过程中S1和S3两个步骤中使用的大尺寸兴趣目标分类模型。
在本实施例中,对利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像训练得到小尺寸兴趣目标分类模型的过程进行介绍。
第一种,较为简单的实施方式如下:
利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像训练得到小尺寸兴趣目标分类模型的具体过程,可以包括以下步骤:
S1、将标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像作为输入训练图像。
标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像即标记有分类类别,且由设定小尺寸级别的兴趣目标的真实边界框包围的图像。
S2、利用输入训练图像,对小尺寸兴趣目标分类模型进行训练。
训练后的小尺寸兴趣目标分类模型即利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别的具体过程中S2和S3两个步骤中使用的小尺寸兴趣目标分类模型。
第二种,优选的实施方式如下:
利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像训练得到小尺寸兴趣目标分类模型的具体过程,可以包括以下步骤:
S1、将标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像在其所属初始图像上,按照设定比例进行边界外扩,将边界外扩后的训练图像及所述训练图像作为输入训练图像对。
需要说明的是,标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像是从其所属初始图像上分割出来的。
进一步,为了保证小尺寸兴趣目标分类模型的学习精度,可以在训练图像所属初始图像上,将训练图像按照设定比例进行边界外扩,边界外扩后的训练图像包含更多的环境信息。
可以理解的是,将标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像在其所属初始图像上,按照设定比例进行边界外扩指的是,在保持兴趣目标的尺寸不变的基础上,增加兴趣目标周围的环境信息。
由于按照设定比例进行边界外扩后,在标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像基础上,增加了兴趣目标周围的环境信息,使小尺寸兴趣目标分类模型能学习到兴趣目标更多的相关信息,提高了小尺寸兴趣目标分类模型对设定小尺寸级别的兴趣目标的学习能力,进而提高训练得到的小尺寸兴趣目标分类模型识别小尺寸兴趣目标的能力。
对于不同分类类别,且包含设定小尺寸级别的兴趣目标的训练图像,可以分别按照不同的设定比例进行边界外扩,当然也可以按照相同的设定比例进行边界外扩。
结合图6所示,图6中最左侧图像为初始图像,中间图像为从初始图像中分割出来的标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像,最右侧图像为对分割出来的训练图像在其初始图像上,按照设定比例进行边界外扩后得到的训练图像。
S2、利用输入训练图像对,对小尺寸兴趣目标分类模型进行训练。
本实施例方法对小尺寸兴趣目标分类模型进行训练时,同时利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像,以及该训练图像边界外扩后的训练图像作为训练图像对,使得模型能够学习到原始的标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像及对其进行边界外扩后的图像中的特征,相比于仅利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像进行图像训练,训练得到的分类模型的分类精度更高。
与上述第一种实施方式所示的小尺寸兴趣目标分类模型的训练过程相对应,上述利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别的具体过程可以包括以下步骤:
S1、将所述待分类图像输入所述小尺寸兴趣目标分类模型,以得到小尺寸兴趣目标分类模型输出的所述待分类图像所包含的兴趣目标的类别。
与上述第二种实施方式所示的小尺寸兴趣目标分类模型的训练过程相对应,上述利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别的具体过程可以包括以下步骤:
S1、将所述初始图像中,待分类图像的边界按照设定比例外扩,得到边界外扩后的待分类图像。
需要说明的是,本步骤中的初始图像指的是待分类图像所属的初始图像,待分类图像从该初始图像中分割出来。
为了保证利用小尺寸兴趣目标分类模型进行分类的准确性,本步骤中的设定比例需要与上述第二种实施方式所示的小尺寸兴趣目标分类模型的训练过程中步骤S1的设定比例保持一致。
S2、将所述待分类图像及其边界外扩后的待分类图像共同输入所述小尺寸兴趣目标分类模型,以得到小尺寸兴趣目标分类模型输出的所述待分类图像所包含的兴趣目标的类别。
本实施例方法将待分类图像及其放大后的待分类图像共同作为小尺寸兴趣目标分类模型的输入值,使得小尺寸兴趣目标分类模型能够同时参考原始的待分类图像及对原始的待分类图像边界外扩后的待分类图像中的特征,确定待分类图像的类别,相比于仅参考原始的待分类图像中的特征,对小尺寸兴趣目标的识别准确度更高。
在本申请中,还提供了一种分类方法,具体过程可以参见图7,如图7所示,可以包括以下步骤:
步骤S300、获取初始图像,所述初始图像中对兴趣目标标注有初始边界框。
步骤S310、将初始图像中所述初始边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像。
步骤S320、利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别。
在本实施例中,预先训练的分类模型为预先利用标记有分类类别的训练图像进行训练得到。
在本实施例中,预先训练的分类模型具体可以包括:大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型。
其中,大尺寸兴趣目标分类模型主要对大尺寸的兴趣目标进行分类,所述大尺寸兴趣目标分类模型为利用标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像进行训练得到。
小尺寸兴趣目标分类模型主要对小尺寸的兴趣目标进行分类,所述小尺寸兴趣目标分类模型为利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像进行训练得到。
关于大尺寸兴趣目标分类模型及小尺寸兴趣目标分类模型的详细介绍,可以参照上文相关介绍。同时,在分类模型包括大尺寸兴趣目标分类模型及小尺寸兴趣目标分类模型的基础上述,上述步骤中S320中利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别的具体实施过程,也可以参照上文相关介绍,此处不再赘述。
在本实施例中,对应兴趣目标的尺寸会有大有小的实际情况,利用大尺寸兴趣目标分类模型主要对包含设定大尺寸级别的兴趣目标的图像进行分类,利用小尺寸兴趣目标分类模型主要对包含设定小尺寸级别的兴趣目标的图像进行分类,达到图像分类的目标。这种利用对应的尺寸分类模型对相应尺寸的兴趣目标进行分类的方式,使分类结果更加准确,分类效率更高。
下面对本申请实施例提供的目标检测装置进行描述,下文描述的目标检测装置与上文描述的目标检测方法可相互对应参照。
请参见图8,其示出了本申请提供的目标检测装置的一种逻辑结构示意图,目标检测装置包括:获取模块11、调整模块12和分割模块13。
获取模块11,用于获取初始图像,所述初始图像中对兴趣目标标注有初始边界框.
调整模块12,用于将所述初始图像输入预先训练的回归模型,得到所述回归模型输出的包含调整后边界框的待分割图像,所述回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到。
分割模块13,用于将所述待分割图像中所述调整后边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像。
在本实施例中,上述目标检测装置还包括:回归模型训练模块,用于获取标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像,并利用所述训练图像对回归模型进行训练,以使得回归模型输出的对所述初始边界框调整后的边界框与所述真实边界框的位置重合度满足设定条件。
其中,训练图像中标注有兴趣目标的初始边界框具体包括:对兴趣目标的真实边界框进行位置扰动后得到的边界框。
在本实施例中,上述目标检测装置还可以包括:分类模块,用于利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,所述分类模型为预先利用标记有分类类别的训练图像进行训练得到。
其中,预先训练的分类模型包括大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型;
上述目标检测装置还可以包括:大尺寸分类模型训练单元,用于利用标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像训练得到大尺寸兴趣目标分类模型;
小尺寸分类模型训练单元,用于利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像训练得到小尺寸兴趣目标分类模型。。
基于上述大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型,所述分类模块,具体可以包括:
大尺寸分类单元,用于若各待分类图像中仅存在属于设定大尺寸级别的兴趣目标,则将包含所述兴趣目标的图像作为待分类图像,利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;
小尺寸分类单元,用于若各待分类图像中仅存在属于设定小尺寸级别的兴趣目标,则利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别。
本实施例中,上述分类模块还可以包括:
大小尺寸共同分类单元,用于若各待分类图像中同时存在属于设定大尺寸级别和设定小尺寸级别的兴趣目标,则首先利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;然后对于大尺寸兴趣目标分类模型确定的类别属于噪声的目标待分类图像,利用所述小尺寸兴趣目标分类模型,确定所述目标待分类图像所包含的兴趣目标的最终分类类别。
在本实施例中,上述目标检测装置中的小尺寸分类模型训练单元,具体可以包括:
第一小尺寸分类模型训练子单元,用于将标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像在其所属初始图像上,按照设定比例进行边界外扩,将边界外扩后的训练图像及所述训练图像作为输入训练图像对;
第二小尺寸分类模型训练子单元,用于利用输入训练图像对,对小尺寸兴趣目标分类模型进行训练。
与小尺寸兴趣目标分类模型训练模块的训练过程相对应,小尺寸分类单元,具体可以包括:
第一小尺寸分类子单元,用于在所述初始图像中,将所述待分类图像的边界按照设定比例外扩,得到边界外扩后的待分类图像;
第二小尺寸分类子单元,用于将所述待分类图像及其边界外扩后的待分类图像共同输入所述小尺寸兴趣目标分类模型,以得到小尺寸兴趣目标分类模型输出的所述待分类图像所包含的兴趣目标的类别。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (12)

1.一种目标检测方法,用于将标注有初始边界框的初始图像中包含兴趣目标的图像分割出来,其特征在于,包括:
获取初始图像,所述初始图像中对兴趣目标标注有初始边界框;
将所述初始图像输入预先训练的回归模型,得到所述回归模型输出的包含调整后边界框的待分割图像,所述回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到,所述回归模型的预训练过程,包括:获取标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像;利用所述训练图像对回归模型进行训练,以使得回归模型输出的对所述初始边界框调整后的边界框与所述真实边界框的位置重合度满足设定条件;
将所述待分割图像中所述调整后边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像。
2.根据权利要求1所述的方法,其特征在于,所述训练图像中标注有兴趣目标的初始边界框包括:
对兴趣目标的真实边界框进行位置扰动后得到的边界框。
3.根据权利要求1-2任一项所述的方法,其特征在于,还包括:
利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,所述分类模型为预先利用标记有分类类别的训练图像进行训练得到。
4.根据权利要求3所述的方法,其特征在于:
所述分类模型包括大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型;
所述大尺寸兴趣目标分类模型为利用标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像进行训练得到;
所述小尺寸兴趣目标分类模型为利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像进行训练得到;
所述利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,包括:
若各待分类图像中仅存在属于设定大尺寸级别的兴趣目标,则利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;
若各待分类图像中仅存在属于设定小尺寸级别的兴趣目标,则利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别。
5.根据权利要求4所述的方法,其特征在于,利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,还包括:
若各待分类图像中同时存在属于设定大尺寸级别和设定小尺寸级别的兴趣目标,则首先利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;然后对于大尺寸兴趣目标分类模型确定的类别属于噪声的目标待分类图像,利用所述小尺寸兴趣目标分类模型,确定所述目标待分类图像所包含的兴趣目标的最终分类类别。
6.根据权利要求4或5所述的方法,其特征在于,利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像训练得到小尺寸兴趣目标分类模型的过程,包括:
将标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像在其所属初始图像上,按照设定比例进行边界外扩,将边界外扩后的训练图像及所述训练图像作为输入训练图像对;
利用输入训练图像对,对小尺寸兴趣目标分类模型进行训练;
所述利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别,包括:
在所述初始图像中,将所述待分类图像的边界按照设定比例外扩,得到边界外扩后的待分类图像;
将所述待分类图像及其边界外扩后的待分类图像共同输入所述小尺寸兴趣目标分类模型,以得到小尺寸兴趣目标分类模型输出的所述待分类图像所包含的兴趣目标的类别。
7.一种目标检测装置,用于将标注有初始边界框的初始图像中包含兴趣目标的图像分割出来,其特征在于,包括:
获取模块,用于获取初始图像,所述初始图像中对兴趣目标标注有初始边界框;
调整模块,用于将所述初始图像输入预先训练的回归模型,得到所述回归模型输出的包含调整后边界框的待分割图像,所述回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到;
分割模块,用于将所述待分割图像中所述调整后边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像;
所述装置还包括:回归模型训练模块,用于获取标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像,并利用所述训练图像对回归模型进行训练,以使得回归模型输出的对所述初始边界框调整后的边界框与所述真实边界框的位置重合度满足设定条件。
8.根据权利要求7所述的装置,其特征在于,所述训练图像中标注有兴趣目标的初始边界框包括:
对兴趣目标的真实边界框进行位置扰动后得到的边界框。
9.根据权利要求7-8任一项所述的装置,其特征在于,还包括:
分类模块,用于利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,所述分类模型为预先利用标记有分类类别的训练图像进行训练得到。
10.根据权利要求9所述的装置,其特征在于:
所述分类模型包括大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型;该装置还包括:
大尺寸分类模型训练单元,用于利用标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像训练得到大尺寸兴趣目标分类模型;
小尺寸分类模型训练单元,用于利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像训练得到小尺寸兴趣目标分类模型;
所述分类模块,包括:
大尺寸分类单元,用于若各待分类图像中仅存在属于设定大尺寸级别的兴趣目标,则利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;
小尺寸分类单元,用于若各待分类图像中仅存在属于设定小尺寸级别的兴趣目标,则利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别。
11.根据权利要求10所述的装置,其特征在于,所述分类模块还包括:
大小尺寸共同分类单元,用于若各待分类图像中同时存在属于设定大尺寸级别和设定小尺寸级别的兴趣目标,则首先利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;然后对于大尺寸兴趣目标分类模型确定的类别属于噪声的目标待分类图像,利用所述小尺寸兴趣目标分类模型,确定所述目标待分类图像所包含的兴趣目标的最终分类类别。
12.根据权利要求10或11所述的装置,其特征在于,所述小尺寸分类模型训练单元包括:
第一小尺寸分类模型训练子单元,用于将标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像在其所属初始图像上,按照设定比例进行边界外扩,将边界外扩后的训练图像及所述训练图像作为输入训练图像对;
第二小尺寸分类模型训练子单元,用于利用输入训练图像对,对小尺寸兴趣目标分类模型进行训练;
所述小尺寸分类单元包括:
第一小尺寸分类子单元,用于在所述初始图像中,将所述待分类图像的边界按照设定比例外扩,得到边界外扩后的待分类图像;
第二小尺寸分类子单元,用于将所述待分类图像及其边界外扩后的待分类图像共同输入所述小尺寸兴趣目标分类模型,以得到小尺寸兴趣目标分类模型输出的所述待分类图像所包含的兴趣目标的类别。
CN201711001606.7A 2017-10-24 2017-10-24 一种目标检测方法及装置 Active CN109697397B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711001606.7A CN109697397B (zh) 2017-10-24 2017-10-24 一种目标检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711001606.7A CN109697397B (zh) 2017-10-24 2017-10-24 一种目标检测方法及装置

Publications (2)

Publication Number Publication Date
CN109697397A CN109697397A (zh) 2019-04-30
CN109697397B true CN109697397B (zh) 2021-07-30

Family

ID=66227755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711001606.7A Active CN109697397B (zh) 2017-10-24 2017-10-24 一种目标检测方法及装置

Country Status (1)

Country Link
CN (1) CN109697397B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110162649B (zh) * 2019-05-24 2021-06-18 北京百度网讯科技有限公司 样本数据获取方法、获取系统、服务器和计算机可读介质
CN110737785B (zh) * 2019-09-10 2022-11-08 华为技术有限公司 一种图片标注的方法及装置
US11200455B2 (en) 2019-11-22 2021-12-14 International Business Machines Corporation Generating training data for object detection
CN112989872B (zh) * 2019-12-12 2024-05-07 华为技术有限公司 一种目标检测方法以及相关装置
CN112257605B (zh) * 2020-10-23 2021-07-23 中国科学院自动化研究所 基于自标注训练样本的三维目标检测方法、系统及装置
CN112508016B (zh) * 2020-12-15 2024-04-16 深圳万兴软件有限公司 一种图像处理方法、装置、计算机设备及存储介质
CN114998583A (zh) * 2022-05-11 2022-09-02 平安科技(深圳)有限公司 图像处理方法、图像处理装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355188A (zh) * 2015-07-13 2017-01-25 阿里巴巴集团控股有限公司 图像检测方法及装置
CN106599939A (zh) * 2016-12-30 2017-04-26 深圳市唯特视科技有限公司 一种基于区域卷积神经网络的实时目标检测方法
WO2017079522A1 (en) * 2015-11-04 2017-05-11 Nec Laboratories America, Inc. Subcategory-aware convolutional neural networks for object detection
CN106919900A (zh) * 2017-01-19 2017-07-04 博康智能信息技术有限公司上海分公司 一种建立车窗定位模型和车窗定位方法及装置
CN107038448A (zh) * 2017-03-01 2017-08-11 中国科学院自动化研究所 目标检测模型构建方法
CN107273816A (zh) * 2017-05-24 2017-10-20 浙江零跑科技有限公司 基于车载前视单目相机的交通限速标识检测识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355188A (zh) * 2015-07-13 2017-01-25 阿里巴巴集团控股有限公司 图像检测方法及装置
WO2017079522A1 (en) * 2015-11-04 2017-05-11 Nec Laboratories America, Inc. Subcategory-aware convolutional neural networks for object detection
CN106599939A (zh) * 2016-12-30 2017-04-26 深圳市唯特视科技有限公司 一种基于区域卷积神经网络的实时目标检测方法
CN106919900A (zh) * 2017-01-19 2017-07-04 博康智能信息技术有限公司上海分公司 一种建立车窗定位模型和车窗定位方法及装置
CN107038448A (zh) * 2017-03-01 2017-08-11 中国科学院自动化研究所 目标检测模型构建方法
CN107273816A (zh) * 2017-05-24 2017-10-20 浙江零跑科技有限公司 基于车载前视单目相机的交通限速标识检测识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks;Shaoqing Ren et al;《arXiv:1506.01497v3 [cs.CV]》;20160106;正文第1-5节 *

Also Published As

Publication number Publication date
CN109697397A (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN109697397B (zh) 一种目标检测方法及装置
US10037604B2 (en) Multi-cue object detection and analysis
Varadharajan et al. Vision for road inspection
CN110069986B (zh) 一种基于混合模型的交通信号灯识别方法及系统
Abdullah et al. YOLO-based three-stage network for Bangla license plate recognition in Dhaka metropolitan city
CN110619279B (zh) 一种基于跟踪的路面交通标志实例分割方法
CN110991221B (zh) 一种基于深度学习的动态交通闯红灯识别方法
Haltakov et al. Semantic segmentation based traffic light detection at day and at night
CN111274926B (zh) 图像数据筛选方法、装置、计算机设备和存储介质
KR20200115705A (ko) 자율주행용 클래스 레이블링 장치
CN110909598B (zh) 一种基于深度学习的非机动车道交通违法行驶识别方法
Borkar et al. An efficient method to generate ground truth for evaluating lane detection systems
CN112016605A (zh) 一种基于边界框角点对齐和边界匹配的目标检测方法
CN107330365A (zh) 基于最大稳定极值区域和svm的交通标志识别方法
CN111814593A (zh) 交通场景解析方法和设备、存储介质
Ravirathinam et al. Automatic license plate recognition for indian roads using faster-rcnn
Almutairy et al. Arts: Automotive repository of traffic signs for the united states
CN111008554B (zh) 一种基于深度学习的动态交通斑马线内不礼让行人识别方法
Bu et al. A UAV photography–based detection method for defective road marking
Pavaskar et al. Real-time vehicle-type categorization and character extraction from the license plates
Karungaru et al. Road traffic signs recognition using genetic algorithms and neural networks
Choudhury et al. An Efficient Algorithm for Detecting and Measure the Properties of Pothole
Surinwarangkoon et al. Traffic sign recognition system for roadside images in poor condition
US11328586B2 (en) V2X message processing for machine learning applications
Syed et al. Road lane line detection based on roi using hough transform algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200430

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 102200, No. 8, No., Changsheng Road, Changping District science and Technology Park, Beijing, China. 1-5

Applicant before: AUTONAVI SOFTWARE Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant