CN102375993A - 目标检测方法和设备 - Google Patents

目标检测方法和设备 Download PDF

Info

Publication number
CN102375993A
CN102375993A CN2010102643252A CN201010264325A CN102375993A CN 102375993 A CN102375993 A CN 102375993A CN 2010102643252 A CN2010102643252 A CN 2010102643252A CN 201010264325 A CN201010264325 A CN 201010264325A CN 102375993 A CN102375993 A CN 102375993A
Authority
CN
China
Prior art keywords
characteristic
candidate target
target
candidate
targets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102643252A
Other languages
English (en)
Inventor
韩博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to CN2010102643252A priority Critical patent/CN102375993A/zh
Publication of CN102375993A publication Critical patent/CN102375993A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本公开提供了目标检测方法和设备。在一种目标检测方法中,对于在至少一个图像中检测到的某个候选目标(为了叙述方便,称为第一候选目标),可以根据在所述至少一个图像中检测到的、在空间上位于该第一候选目标的位置附近且与该第一候选目标类别相同的多个相邻候选目标来估计该第一候选目标所属类别的目标的特征在该第一候选目标的位置附近的特征分布;然后可以根据所估计的特征分布来判断第一候选目标是否为误检测。还提供了目标特征分布的训练方法和设备以及包括上述设备的电子设备。

Description

目标检测方法和设备
技术领域
本公开涉及目标检测领域,具体地,涉及图像中的目标检测方法和设备、目标特征分布训练方法和设备以及利用这样的方法或包括这样的设备的电子设备。
背景技术
目标检测是图像/视频自动分析中的核心技术之一。误检测是目标检测应用中普遍存在的问题。在图像分析中,目标群(即在图像或视频中同时可见的较大数目的同种目标)的检测及密度估计有很高的应用价值。例如,体育视频中检测到的人群往往对应于观众席,而观众席镜头往往意味着此前出现了精彩事件;车站、广场等地点的视频监控需要对人群的分布和密度进行估计;交通路口视频监控的拥堵程度分析需要对汽车的分布和密度进行估计。
发明内容
本公开的一些实施例提供了目标检测方法和设备、目标特征分布训练方法和设备以及利用这样的方法或包括这样的设备的电子设备。
在下文中给出关于本公开的一些方面的简要概述,以便提供对于本公开的基本理解。应当理解,这个概述并不是对本公开的穷举性概述。该概述也并非意图确定本公开的关键或重要部分,也不是意图限定本公开的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
根据本公开的一个方面,提供了一种目标检测的方法。在该方法中,对于在至少一个图像中检测到的某个候选目标(为了方便,称为第一候选目标),可以根据在所述至少一个图像中检测到的、在空间上位于该第一候选目标的位置附近且与该第一候选目标类别相同的多个相邻候选目标来估计该第一候选目标所属类别的目标的特征在该第一候选目标的位置附近的特征分布;并根据所述特征分布来判断该第一候选目标是否为误检测。
根据本公开的另一方面,提供了一种目标检测设备。该目标检测设备可以包括估计装置和误检测判断装置。针对在至少一个图像中检测到的某个候选目标(为了方便,称为第一候选目标),估计装置可以根据在所述至少一个图像中检测到的、在空间上位于该第一候选目标的位置附近且与该候选目标类别相同的多个相邻候选目标来估计该候选目标所属类别的目标的特征在该第一候选目标的位置附近的特征分布。误检测判断装置可以根据所述特征分布来判断该第一候选目标是否为误检测。
根据本公开的另一方面,提供了包括上述目标检测设备的电子设备。
根据本公开的另一方面,提供了一种目标特征分布的训练方法。在该训练方法中,对于在多个图像样本中检测到的类别相同的多个候选目标中的每个候选目标,可以根据在空间上位于每个候选目标的位置附近的、同类别的多个相邻候选目标来估计所属类别的目标的特征在该每个候选目标的位置附近的特征分布,得到分别与所述多个候选目标的位置对应的多个特征分布。然后,可以保存所述多个特征分布,作为特征分布字典。
根据本公开的另一方面,提供了一种目标特征分布的训练设备。该训练设备包括估计装置和存储装置。该估计装置针对在多个图像样本中检测到的类别相同的多个候选目标中的每个候选目标,根据在空间上位于每个候选目标的位置附近的、同类别的多个相邻候选目标来估计所属类别的目标的特征在该每个候选目标的位置附近的特征分布,得到分别与所述多个候选目标的位置对应的多个特征分布。存储装置用于存储所述多个特征分布,作为特征分布字典。
根据本公开的另一方面,提供了包括上述目标特征分布的训练设备的电子设备。
根据本公开的另一方面,提供了一种目标检测方法。在该目标检测方法中,对于在图像中检测到的某个候选目标(称为第二候选目标),根据该第二候选目标在所述图像中所处的位置来查询特征分布字典,获得该第二候选目标所属类别的目标的特征在该位置附近的特征分布。然后,可以根据所述特征分布来判断该第二候选目标是否为误检测。所述特征分布字典包括所属类别目标的所述特征在图像中的多个位置处的多个特征分布。
根据本公开的另一方面,提供了一种目标检测设备。该目标检测设备包括分布查询装置和误检测判断装置。针对在图像中检测到的某个候选目标(称为第二候选目标),分布查询装置可以根据该第二候选目标在所述图像中所处的位置来查询特征分布字典,获得该第二候选目标所属类别的目标的特征在该位置附近的特征分布。所述特征分布字典包括所属类别目标的所述特征在图像中的多个位置处的多个特征分布。误检测判断装置可以根据分布查询装置所获得的特征分布来判断该第二候选目标是否为误检测。
根据本公开的另一方面,提供了包括上述目标检测设备的电子设备。
另外,本公开的实施例还提供了用于实现上述方法的计算机程序。
此外,本公开的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。
附图说明
参照下面结合附图对本公开实施例的说明,会更加容易地理解本公开的以上和其它目的、特点和优点。附图中的部件只是为了示出本公开的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
图1是示出了根据本公开的一个实施例的目标检测方法的示意性流程图;
图2是示出了根据所估计的特征分布来判断候选目标是否为误检测的一个具体方法实施例的示意性流程图;
图3是示出了根据所估计的特征分布来判断候选目标是否为误检测的另一具体方法实施例的示意性流程图;
图4A是示出了根据本公开的另一实施例的目标检测方法的示意性流程图;
图4B是示出了利用在特征上具有相似性的相邻候选目标来估计目标的特征模型的一个具体方法实施例的示意性流程图;
图4C是示出了利用在特征上具有相似性的相邻候选目标来估计目标的特征模型的另一具体方法实施例的示意性流程图;
图5是示出了图4B所示的估计目标的特征模型的方法的一个具体示例的示意图;
图6是示出了图4C所示的估计目标的特征模型的方法的一个具体示例的示意图;
图7是示出了根据本公开的一个实施例的目标检测设备的示意性框图;
图8(A)示出了一幅包括目标群的图像;
图8(B)示出了对图8(A)所示的图像进行了目标检测但没有采用根据本公开的实施例的方法进行误检测排除的目标检测结果;
图8(C)示出了根据本公开的一个实施例的目标检测方法或设备对图8(A)所示的图像进行处理后的目标检测结果;
图9是示出了根据本公开的一个实施例的目标特征分布的训练方法的示意性流程图;
图10是示出了根据本公开的一个实施例的目标特征分布的训练设备的示意性框图;
图11是示出了根据本公开的一个实施例、利用训练得到的目标特征分布进行目标检测的方法的示意性流程图;
图12是示出了根据本公开的一个实施例、利用训练得到的目标特征分布进行目标检测的设备的示意性框图;以及
图13是示出用于实现本公开的计算机的结构的示例性框图。
具体实施方式
下面参照附图来说明本公开的实施例。在本公开的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本公开无关的、本领域普通技术人员已知的部件和处理的表示和描述。
本公开中所谓的“图像”可以表示一幅或一组静止图像,也可以表示一个图像序列,如视频图像。
在包含大量目标(目标群)的图像中,各目标往往都很小,目标之间相互遮挡,而且不同目标经常处于不同的视角和姿态。在视频图像(例如对某些公共场所或交通流量的监控视频)中,在不同图像帧中出现的目标如果进行时域上的累积,往往也会形成这样的目标群。在这种情况下进行目标检测是比较困难的。本公开的发明人意识到,在包括目标群的图像或视频中,同类目标随着其在图像中的位置的变化其某些特征(如尺寸、亮度等)也是平滑变化的,即在空间上距离较近的同类目标的特征差别较小。换言之,在物理空间上位置相近或相邻的多个同类目标的某些特征往往存在很大程度上的相似性。如果能很好地利用这种相似性,那么将可以明显提高目标检测的准确率,并且在视频分析中还可以提高目标检测的速度。例如,在包括人群的图像中,图像中某个区域中的人脸或人头的大小通常是相似的,但由于拍摄位置与目标之间的距离不同,不同区域之间人脸或人头的大小又是变化的。又如,在某些包括阴影的图像中,处于阴影中的目标与不在阴影区域中的目标的亮度有很大的差异,但是均处于阴影或非阴影区域中的相邻目标的亮度之间具有相似性。
图1是示出了根据本公开的一个实施例的目标检测方法的示意性流程图。在该实施例中,在对图像(如一幅图像或视频)进行了目标检测之后,利用在空间中位置相邻的多个同类目标在某些特征(例如尺寸或亮度)上呈现出相似性这一特点对目标检测的检测结果(在本说明书中,目标检测的检测结果也被称为“候选目标”)进行误检测排除。
具体地,如图1所示,该方法可以包括步骤103和109。在步骤103中,对于在至少一个图像中检测到的某个候选目标(为了叙述方便,称为第一候选目标),根据在所述至少一个图像中检测到的、在空间上位于该第一候选目标的位置附近、且与该第一候选目标类别相同的多个相邻候选目标来估计所属类别的目标的某个特征(如尺寸或亮度)的特征分布。多个相邻候选目标是指在一个或更多个图像中检测到的与第一候选目标的距离较近(如在预定距离范围内)的多个同类候选目标。也就是说,位于第一候选目标的位置附近是指在空间上与第一候选目标的距离较近的位置,即在某一包含第一候选目标的较小空间范围内的位置。这些相邻候选目标可以是在同一图像中检测到的,也可以是在多幅图像(如视频图像)的对应位置上检测到的。由于在空间上距离较近,这些相邻候选目标在所述特征(如尺寸或亮度)上与第一候选目标呈现出相似性。换言之,用于估计所述特征分布的相邻候选目标的特征具有相似性。可以根据实际应用场景(如图像的拍摄角度、图像拍摄位置与待检测的候选目标之间的距离、图像的分辨率、目标的特征大小等)来确定或选择所述相邻候选目标,这里不作限定。在步骤109中,可以根据所估计的特征分布以及检测到的第一候选目标的所述特征来判断第一候选目标是否属于误检测。如果候选目标的所述特征不符合所估计的该候选目标的附近区域的特征分布特性,则可以确定其为误检测,否则,可以确定其不是误检测。
所采用的特征可以是在图像中位置相邻的目标呈现出相似性的任何特征,如目标的尺寸、亮度等,这里不一一列举。作为一个示例,所述特征可以是目标的尺寸,可以根据位于第一候选目标的位置附近的、多个同类别的相邻候选目标的尺寸来估计该类别的目标在第一候选目标的位置附近的尺寸分布,作为上述特征分布。可以判断候选目标的尺寸是否与所属类别的目标在该候选目标附近的尺寸分布特性一致,如果是,则可以确定该候选目标为误检测。否则,可以初步判断该候选目标不是误检测。
利用上述方法对在图像中检测到的各个候选目标进行判断,可以有效排除误检测,从而提高目标检测的正确率。另外,图1所示的方法计算简便。在将这种方法应用于视频分析的情况下,还可以提高目标检测的速度。在利用目标的尺寸的情况下,计算过程将更为简单,可以进一步提高目标检测的速度和准确度。
作为一个示例,“位于第一候选目标的位置附近”可以是指一个或更多个图像中与第一候选目标的位置之间的空间距离最近,换言之,多个相邻候选目标可以包括在图像中检测到的、在空间上距离第一候选目标的位置最近且与该第一候选目标类别相同的多个候选目标。即,可以根据与第一候选目标之间的距离来选择距离第一候选目标的最近的多个同类候选目标作为所述相邻候选目标,以所确定或选择的多个相邻候选目标的特征具有相似性为宜。例如,在包括目标群的单个图像的情况下,可以选择同类候选目标中距离第一候选目标最近的多个,作为所述相邻候选目标。在视频图像中的情况下,可以选择出现在不同图像帧中、但在空间位置上距离第一候选目标最近的多个同类候选目标,作为所述相邻候选目标。可以根据实际应用场景(如图像的拍摄角度、图像拍摄位置与待检测的候选目标之间的距离、图像的分辨率、目标的特征等)来确定这些相邻候选目标的个数,以所确定或选择的多个相邻候选目标的特征具有相似性为宜,这里不作限定。
作为另一示例,“位于第一候选目标的位置附近”可以是指一个或更多个图像中包括第一候选目标的位置的某个闭合区域,换言之,多个相邻候选目标可以包括在图像中包括第一候选目标的位置的某个闭合区域中检测到的、与第一候选目标类别相同的多个候选目标。例如,在检测视频图像中的目标的情况下,所谓的多个相邻候选目标可以包括在不同图像帧中在空间上与所述闭合区域对应的位置上检测到的同类候选目标。所述闭合区域的大小可以根据实际应用场景来确定,以闭合区域内的同类目标的特征具有相似性为宜。另外,所述闭合区域的大小可以是固定的,也可以是变化的,这里也不作限定。
作为一个示例,可以根据图像或视频的拍摄位置与待检测的候选目标(第一候选目标)之间的距离来确定用于估计所属类别的目标在该第一候选目标的位置附近的特征分布的多个同类别的相邻候选目标。作为具体示例,可以利用测距装置来估测拍摄位置与待检测的候选目标之间的距离,并根据该距离来调整用于确定在特征分布的估计中使用的相邻候选目标的策略,例如,可以根据该距离来调整所选择的相邻候选目标的个数,或者可以根据该距离调整所选择的闭合区域的大小。例如,当拍摄位置距离待检测的目标比较远时,图像中呈现的候选目标的特征可能不明显(如尺寸会比较小),为了提高误检测排除的准确度,可以增加用于特征分布的估计的相邻候选目标的个数(或者使上文所述的闭合区域中包括的同类候选目标的数量比较多)。而当拍摄位置距离待检测的目标比较近时,由于透视角度的问题,第一候选目标周围在特征上呈现出相似性的其他相邻候选目标的个数可能会减少,因此,可以减少用于特征分布的估计的相邻候选目标的个数(或者使上文所述的闭合区域中包括的同类候选目标的数量比较小),以便保证误检测排除的准确度,并提高误检测排除的效率。
图4A示出了根据本公开的另一实施例的目标检测方法,其中,利用彼此相邻的同类候选目标的特征的相似性,通过统计相邻候选目标的特征来估计所属类别的目标在包括这些相邻候选目标的区域中的特征模型。
如图4A所示,该方法可以包括步骤403和409。
在步骤403中,对于在至少一个图像中检测到的某个候选目标(也称为第一候选目标),统计在所述至少一个图像中检测到的、在空间上与第一候选目标的位置相邻且同类别的多个相邻候选目标的特征(如尺寸或亮度等),以估计第一候选目标所属类别的目标的特征在该第一候选目标的位置附近的特征模型(如尺寸模型或亮度模型)。作为一个示例,所估计的特征模型可以包括该类目标的特征的上限和/或下限。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或离差绝对值的均值。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或离差绝对值的均值。
在步骤409中,判断第一候选目标的所述特征是否符合所估计的特征模型,若是,则判断其不是误检测,若否,则判断其是误检测。
可选地,图4A所示的方法还可以包括步骤405(图4A中虚线表示的方框)。在步骤405中,可以根据每个相邻候选目标的置信度对所估计的特征(如尺寸或亮度)或特征模型(如尺寸模型或亮度模型)加权。这样,可以使得到的特征模型更准确地反映该类目标在第一候选目标的位置附近的区域内的特征分布,从而使后续的误检测判断更为准确,并进一步提高目标检测的正确率。
作为一个示例,可以计算多个相邻候选目标的特征(如尺寸或亮度)的平均值,并将该平均值作为上文中所描述的特征分布或特征模型。这种计算方法比较简便,可以提高处理的效率。作为另一示例,还可以计算多个相邻候选目标的特征的加权平均值,作为所述特征分布。例如,可以根据每个相邻候选目标的置信度对其特征进行加权,然后求这些加权值的平均值,并将该加权平均值作为该类目标的特征分布。与多个相邻候选目标的特征的平均相比,采用置信度加权的平均值能够更为准确地反映所属类别的目标的特征分布。作为另一示例,可以将多个相邻候选目标的特征(如尺寸或亮度)的中值。这种计算方法也比较简便,可以提高处理的效率。步骤103/403可以采用这样的方法来估计所述特征分布或特征模型,这里不再赘述。
图4B和图4C分别示出了利用在特征上具有相似性的相邻候选目标来估计目标的特征模型的其他具体实施例。
如图4B所示,根据相邻候选目标来估计目标的特征模型的方法可以包括步骤403-B1、403-B2和403-B3。具体地,在步骤403-B1中,利用每个相邻候选目标的所述特征来建立所属类别的目标的所述特征在该每个相邻候选目标的位置附近的分布概率模型,这样可以得到多个分布概率模型,每个分布概率模型对应于多个相邻候选目标中的一个。然后,在步骤403-B2中,在所述多个分布概率模型中搜索分布概率较大的区段。在步骤403-B3中,利用该区段来估计所属类别的目标在第一候选目标的位置附近的特征模型。
图5示出了图4B所示方法的一个具体示例。在图5的示例中,以图8(A)所示的人群图像为例,示出图像中多个相邻目标(人脸或人头)的尺寸特征的高斯分布的概率密度直方图。如图5所示,假设在图像中包括第一候选目标的区域中目标尺寸的分布如下:
ln(Size)~N(μ,σ)        (1)
其中,ln(Size)表示目标尺寸值Size的对数,N(μ,σ)表示期望值为μ、标准差为σ的高斯分布。可以假设标准差是一个常数。可以利用各个相邻候选目标的尺寸值,在直方图中累积不同的尺寸值的概率密度。每个检测结果(即每个相邻候选目标)对应于一个以其尺寸为均值的高斯分布函数。可选地,还可以采用每个检测结果的置信度为该高斯分布函数加权。可以通过窗口扫描(在图5的示例中,窗口的宽度为4σ,应理解该窗口的宽度可以根据实际应用情况来调整,而不限于该具体示例)来搜索覆盖最大概率值的区段。利用该区段来计算该类目标的特征模型,具体地,可以利用该区段来计算该类目标在第一候选目标附近的尺寸均值。
与上述实施例/示例中计算所有相邻候选目标的特征(如尺寸)的平均值或加权平均值或中值的方法相比,参考图4B或图5所描述的方法所得到的特征模型能够更加准确地反映目标的特征,因而能够提高后续的误检测判断准确率。
图8(A)示出了一幅包括目标群(人群)的图像,图8(B)示出了以人头或人脸为目标的目标检测结果,而图8(C)示出了利用参考图5所描述的方法、利用相邻目标的尺寸之间的相似性对图8(B)的目标检测结果进行误检测排除后的结果,其中的方框表示检测到的目标(人头或人脸),可以看出,通过利用相邻候选目标的尺寸信息进行误检测判断,有效排除了图8(B)中的一些误检测(如尺寸偏大和偏小的框),从而提高了目标检测的准确率。
如图4C所示,根据候选目标的同类相邻候选目标来估计目标的特征在该候选目标的位置附近的特征模型的方法可以包括步骤403-C1、403-C2和403-C3。在该示例中,按照将所属类别的目标的所述特征(如尺寸)分别呈现为多个相邻候选目标的检测特征值的似然概率之和最大化的准则,来估计目标的特征在该候选目标的位置附近的特征模型。具体地,在步骤403-C1中,提出该类目标在该候选目标(第一候选目标)的位置附近的特征分布假设。可以选取多个假设值,从而建立所属类别的目标的所述特征在第一候选目标的位置附近的多个特征分布假设。作为一个具体示例,可以采用高斯分布模型、以所述假设值为均值(可以选择一个常数作为方差)来建立所述特征分布假设。当然也可以采用其他概率分布模型,这里不一一列举。从理论上说,所述假设值的取值范围可以是无限的。在实际应用中,可以根据目标的所述特征在图像中的检测值的范围来选取所述假设值,也可以根据检测到的候选目标的所述特征的值而在一定范围内选取假设值,这里不作详述。在步骤403-C2中,计算多个相邻候选目标的特征值(即所述特征的检测值)在每个特征分布假设下的似然概率之和。应理解,可以采用任何适当的方法来计算似然概率,这里不作详述。另外,可选地,可以利用每个相邻候选目标的置信度将其似然概率加权。在步骤403-C3中,选择与最大的似然概率之和对应的特征分布假设,来估计所属类别的目标的特征在第一候选目标的位置附近的特征模型。
图6示出了图4C所示方法的一个具体示例。在图6所示的示例中,以目标的尺寸为例。首先,根据多个相邻候选目标的尺寸值,统计各个尺寸值所对应的相邻候选目标的个数。利用所属类别的目标的尺寸的假设值来估计尺寸分布的假设模型,例如,图6中的高斯模型(即以尺寸的假设值为均值的高斯分布模型)。在该假设模型之下,计算各个尺寸值的似然概率之和。可以选取多个假设值,并分别计算各个尺寸值在每个分布假设之下的似然概率之和。然后,利用与最大的似然概率之和对应的分布假设来估计该类目标在第一候选目标的位置附近的尺寸模型。所述多个假设值可以是在该类目标的实际尺寸值的邻域的多个值,这里不作限定。另外,可以理解,可以采用任何适当的方法来计算似然概率,这里也不作详述。
与上述实施例/示例中计算所有相邻候选目标的特征(如尺寸)的平均值或加权平均值或中值的方法相比,参考图4C或图6所描述的方法所得到的特征模型能够更加准确地反映目标的特征,因而能够提高后续的误检测判断准确率。
图2和图3是分别示出了根据所估计的特征分布来判断候选目标是否为误检测的方法示例的示意性流程图。
如图2所示,在估计了所属类别的目标在第一候选目标的位置附近的特征分布之后(如图1或4A的步骤103或403之后),在步骤109-A1中,根据在空间上位于每个相邻候选目标附近的多个同类候选目标来估计所属类别的目标的特征在每个相邻候选目标的位置附近的特征分布。在步骤109-A2中,计算每个候选目标(即第一候选目标及其多个相邻候选目标中的每个)的所述特征与其对应的特征分布的偏差。例如,在所估计的特征分布包括所属类别的目标的所述特征的均值的情况下,可以计算每个候选目标的所述特征与该均值的差。又如,在所估计的特征分布包括所属类别的目标的所述特征的上限或下限的情况下,可以计算每个候选目标的所述特征与该上限或下限的差,其中较大的值可以作为所述偏差。这里不一一列举。在步骤109-A3中,可以根据计算得到的多个偏差值将第一候选目标及其多个相邻候选目标中与值较大的偏差对应的一个或更多个候选目标作为误检测。作为一个示例,与较大的偏差对应的一个或更多个候选目标可以包括第一候选目标与多个相邻候选目标中与所估计的对应的特征分布之间的偏差超过一阈值的一个或更多个。如果所有的候选目标的偏差都不超过所述阈值,则可以确定其均非误检测。利用图2所示的方法,可以对在图像或视频中某个区域中检测到的多个同类候选目标一并进行误检测排除,从而可以进一步提高处理的效率。
与图2所示的示例不同,在图3所示的实施例中,根据某个设定的偏差阈值来判断候选目标是否误检测。如图3所示,在估计了所属类别的目标在第一候选目标的位置附近的特征分布之后(如图1或4A的步骤103或403之后),在步骤109-B1中,计算第一候选目标的特征与所估计的特征分布之间的偏差。在步骤109-B2中,判断该偏差是否大于某个阈值,若是,则确定第一候选目标为误检测,否则,则判断其不是误检测。
应理解,上述实施例/示例中的阈值可以根据实际应用场景(如图像分辨率、目标特征等)来确定,这里不作限定。
作为一个示例,可以重复执行上述实施例/示例中的方法,以对目标检测结果进行多次误检测排除,从而使得目标检测更加准确。
根据本公开的一些实施例,还提供了利用上述目标检测方法的目标检测设备。
图7示出了根据本公开的一个实施例的目标检测设备700。目标检测设备700采用图1所示的方法进行误检测排除,如图7所示,设备700可以包括估计装置702和误检测判断装置704。
估计装置702可以根据前期目标检测处理或设备的目标检测结果来估计图像中某个特定区域(如包括某个检测结果的区域)中某一类候选目标的特征分布。具体地,对于在图像中检测到的某个候选目标(称为第一候选目标),估计装置702可以根据在空间上位于该第一候选目标的位置附近且与第一候选目标类别相同的多个相邻候选目标来估计所属类别的目标的特征在第一候选目标的位置附近的特征分布。
误检测判断装置704可以检测到的根据第一候选目标的所述特征与估计装置702估计的特征分布来确定该第一候选目标是否属于误检测。如果检测到的候选目标的特征不符合所估计的特征分布的特性,则估计装置702将其确定为误检测,否则,估计装置702判断其不是误检测。
与图1所述的方法实施例相似,上述设备利用图像中同类别的相邻目标之间在某些特性(如尺寸)上具有相似性这一特点,根据相邻候选目标的特征来估计某类目标的特征分布,并将该特征分布作为判断某个候选目标是否为误检测的依据,从而可以有效排除目标检测中的误检测,提高目标检测的正确率。
与上述方法实施例/示例相似,这里所谓的多个相邻候选目标可以包括在图像中检测到的、在空间上距离第一候选目标的位置最近且与该第一候选目标类别相同的多个候选目标,或者可以包括在图像中包括第一候选目标的位置的某个闭合区域中检测到的、与第一候选目标类别相同的多个候选目标。所确定或选择的多个相邻候选目标应在特征上具有相似性。这里不作重复。
作为一个示例,设备700还可以包括选择装置(未示出)。该选择装置可以根据图像或视频的拍摄位置与待检测的候选目标(第一候选目标)之间的距离来确定或选择用于估计所属类别的目标在该第一候选目标的位置附近的特征分布的多个同类别的相邻候选目标。作为具体示例,如果拍摄位置是变化的,选择装置还可以测量拍摄位置与待检测的候选目标之间的距离,并根据该距离来调整用于确定在特征分布的估计中使用的相邻候选目标的策略,例如,选择装置可以根据该距离来调整所选择的相邻候选目标的个数,或者可以根据该距离调整所选择的闭合区域的大小,以便保证误检测排除的准确度,并提高误检测排除的效率。这里不再重复。
与上述方法实施例/示例相似,设备700采用的特征可以是在图像中位置相邻的目标呈现出相似性的任何特征,如目标的尺寸、亮度等,这里不再重复。
作为一个具体实施例,估计装置702可以采用图4A的步骤403所示的方法,利用彼此相邻的同类候选目标的特征的相似性,通过统计相邻候选目标的特征来估计所属类别的目标在包括这些相邻候选目标的区域中的特征模型。例如,估计装置702所估计的特征模型可以包括该类目标的特征的上限和/或下限。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或离差绝对值的均值。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或离差绝对值的均值。可选地,估计装置702还可以根据每个相邻候选目标的置信度对所估计的特征(如尺寸或亮度)或特征模型(如尺寸模型或亮度模型)加权。这样,可以使得到的特征模型更准确地反映该类目标在第一候选目标的位置附近的区域内的特征分布,从而使后续的误检测判断更为准确,并进一步提高目标检测的正确率。作为具体示例,估计装置702可以采用参考图4B-4C、图5-6所描述的方法来估计特征模型。这里不再重复。
作为其他示例,估计装置可以计算多个相邻候选目标的特征(如尺寸或亮度)的平均值、或加权平均值或中值(与上文参考方法示例/实施例作描述的相似,这里不再赘述)。
作为具体实施例,误检测判断装置704可以采用参考图2或3所描述的方法进行误检测判断。例如,估计装置702还可以利用在空间上位于每个相邻候选目标的位置附近的多个同类候选目标来估计所属类别的目标的特征在每个相邻候选目标的位置附近的特征分布,而误检测判断装置704可以计算第一候选目标及与其多个相邻候选目标中的每一个的特征(如尺寸)与相应的特征分布(如尺寸分布)的偏差;并将其中偏差较大的一个或更多个作为误检测。这样,可以对在图像或视频中某个区域中检测到的多个候选目标一并进行误检测排除,从而可以进一步提高处理的效率。又如,误检测判断装置704还可以计算某个候选目标(如第一候选目标)的特征(如尺寸)与对应的特征分布(如尺寸分布)的偏差,并判断该偏差是否大于某个阈值,若是,则判断该候选目标为误检测。应理解,上述阈值可以根据实际应用场景(如图像分辨率、目标大小等)来确定,这里不作限定。
作为一个示例,设备700可以对目标检测结果进行多次误检测排除,从而使得目标检测更加准确。
根据本公开的实施例,还提供了包括上述目标检测设备的电子设备,例如,用于(实时或非实时的)目标检测的电子设备或其他具有图像处理功能的电子设备,如电脑、照相机、摄像机、电子监控设备等。
根据本公开的实施例,还提供了利用图像中位置相邻的同类目标在特征上的相似性来训练目标特征分布的方法。
图9示出了根据一个实施例的目标特征分布的训练方法的示意图。
如图9所示,该训练方法可以包括步骤903和907。在步骤903中,对于在多个图像样本中检测到的类别相同的多个候选目标中的每个候选目标,根据在空间上位于每个候选目标的位置附近的、同类别的多个相邻候选目标来估计所属类别的目标的特征在该每个候选目标的位置附近的特征分布,得到分别与所述多个候选目标的位置对应的多个特征分布。换言之,每个特征分布与多个候选目标中的一个候选目标的位置相对应。在步骤907中,保存所述多个特征分布,作为特征分布字典。
与上述实施例/示例相似,所采用的特征可以是同类目标在每个区域中呈现相似性的任何特征,如目标的尺寸、亮度等,这里不再重复。
作为一个具体实施例,步骤903可以采用上文参考图4的步骤403所描述的方法来估计所述特征分布或模型。例如,可以通过统计位于每个候选目标的位置附近的多个同类候选目标的所述特征来估计所属类别的目标在该候选目标的位置附近的特征模型。作为一个示例,所估计的特征模型可以包括该类目标的特征的上限和/或下限。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或离差绝对值的均值。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或离差绝对值的均值。
作为具体示例,可以采用上文参考图4B、5或4C、6所描述的方法来估计所属类别的目标在每个候选目标的位置附近的特征模型。作为其他示例,在步骤903中,还可以参考上文中的方法示例来计算位于每个候选目标的位置附近的多个同类候选目标的所述特征的平均值或加权平均值或中值,作为所述特征分布或模型。这里不再重复这些具体的估计或计算方法。
上述训练方法中利用了包括目标群的图像中位置相邻的同类目标在某些特征(如尺寸或亮度等)上呈现相似性这样的特点。针对某类目标,建立该类目标在图像样本中检测到的多个候选目标的位置附近的区域中的特征分布(如尺寸分布或亮度分布),从而为后续的目标检测提供有效的检测依据。在进行目标检测时,可以利用这些不同位置处的特征分布或模型进行误检测排除,从而提高目标检测的准确度,在图像中包括大量目标的情况下,能够有效提高处理的速度。
作为一个示例,图9所示的方法还可以包括步骤905,在该步骤905中,利用位于每个候选目标的位置附近的同类候选目标的置信度对特征分布或模型进行加权(例如,可以利用置信度对每个同类候选目标的所述特征进行加权或对根据每个同类候选目标的特征估计的特征分布或模型加权),从而使得所估计的特征分布或模型更加准确。
作为一个示例,多个候选目标可以是在多个图像样本中累积得到的,而某个候选目标(也称为第一候选目标)的相邻候选目标可以包括在一个或更多个图像样本中检测到的、在空间上距离该候选目标的位置最近且与该候选目标类别相同的多个候选目标。以所确定或选择的多个相邻候选目标的特征具有相似性为宜。例如,在包括目标群的单个图像的情况下,多个相邻候选目标可以包括在图像样本中距离第一候选目标最近的多个候选目标。在视频图像中的情况下,多个相邻候选目标可以是出现在不同图像帧中、但在空间位置上距离第一候选目标近的候选目标。可以根据实际应用场景(如图像的拍摄角度、图像拍摄位置与待检测的候选目标之间的距离、图像的分辨率、目标的特征等)来确定这些相邻候选目标的个数,这里不作限定。
作为另一示例,某个候选目标(也称为第一候选目标)的多个相邻候选目标可以包括在图像样本中包括第一候选目标的位置的某个闭合区域中检测到的、与第一候选目标类别相同的多个候选目标。例如,在检测视频图像中的目标的情况下,所谓的多个相邻候选目标可以包括在不同图像帧中在空间上与所述闭合区域对应的位置上检测到的同类候选目标。所述闭合区域的大小可以根据实际应用场景来确定,以闭合区域内的同类目标的特征具有相似性为宜。另外,所述闭合区域的大小可以是固定的,也可以是变化的,这里也不作限定。作为一个具体示例,可以将图像样本在空间上划分为多个区域,然后根据在至少一个图像样本中与每个区域的对应的位置上检测到的、同类别的多个候选目标来估计所属类别的目标的特征在每个区域上的特征分布。这样,可以得到该类目标的特征在图像的多个区域上的多个特征分布,作为特征分布字典。
根据本公开的实施例,还提供了利用图像中相邻同类目标在特征上的相似性来训练目标特征分布的设备。
图10示出了根据一个实施例的目标特征分布的训练设备的示意图。如图10所示,训练设备1000可以包括估计装置1002和存储装置1004。估计装置1002可以针对在多个图像样本中检测到的类别相同的多个候选目标中的每个候选目标,根据在空间上位于每个候选目标的位置附近的、同类别的多个相邻候选目标来估计所属类别的目标的特征在该每个候选目标的位置附近的特征分布,得到分别与所述多个候选目标的位置对应的多个特征分布。存储装置1004可以保存所述多个特征分布,作为特征分布字典,以便在后续的目标检测中使用。
估计装置1002可以采用上文参考图4的步骤403所描述的方法来估计某类目标在每个候选目标的位置附近的特征分布或模型。例如,可以通过统计位于每个候选目标的位置附近的多个同类候选目标的所述特征来估计所属类别的目标在该候选目标的位置附近的特征模型。作为一个示例,所估计的特征模型可以包括该类目标的特征的上限和/或下限。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或离差绝对值的均值。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或离差绝对值的均值。
作为具体示例,估计装置1002可以采用上文参考图4B、5或4C、6所描述的方法来估计所属类别的目标在每个候选目标的位置附近的特征模型。作为其他示例,估计装置1002可以参考上文中的方法示例来计算位于每个候选目标的位置附近的多个同类候选目标的所述特征(如尺寸或亮度等)的平均值或加权平均值或中值,作为所述特征分布或模型。这里不再重复这些具体的估计或计算方法。
作为一个示例,估计装置1002可以利用位于每个候选目标的位置附近的多个同类候选目标的置信度对相应的特征分布或模型进行加权,从而使得所估计的特征分布或模型更加准确。
与上文的方法示例相似,估计装置1002所采用的多个候选目标可以是在多个图像样本中累积得到的,而某个候选目标(也称为第一候选目标)的相邻候选目标可以包括在一个或更多个图像样本中检测到的、在空间上距离该候选目标的位置最近且与该候选目标类别相同的多个候选目标。这里不再重复。
与上文的方法示例相似,某个候选目标(也称为第一候选目标)的多个相邻候选目标可以包括在图像样本中包括第一候选目标的位置的某个闭合区域中检测到的、与第一候选目标类别相同的多个候选目标。作为一个具体示例,估计装置1002可以在空间上将图像样本划分成多个区域。区域的大小可以根据实际应用情况来确定,以一个区域内的同类候选目标在特征(如尺寸、亮度等)上呈现相似性为宜。每个区域对应于多个图像样本中的相应位置。与上述实施例/示例相似,每个区域的大小可以根据图像的拍摄位置与每个区域之间的距离的远近来确定。然后,对于所述多个区域中的每个区域,估计装置1002根据在每个图像样本中与该区域对应的位置上检测到的、类别相同的多个候选目标来估计这些候选目标所属类别的目标的特征在该区域中的特征分布。
根据本公开的实施例,还提供了包括上述目标特征分布的训练设备的电子设备,例如,用于目标检测的电子设备或其他具有图像处理功能的电子设备,如电脑、照相机、摄像机、电子监控设备等。上述训练方法或训练设备可以利用多个训练样本图像来训练得到图像中不同区域中的不同的特征分布,用于后续的实时或非实时的目标检测。
根据本公开的实施例,还提供了利用训练得到的、某类目标在图像的不同区域中的特征分布对该类目标进行检测的方法。
图11示出了根据一个实施例的利用不同图像区域中的不同特征分布进行目标检测的方法。如图11所示,该方法可以包括步骤1107和1109。
在步骤1107中,对于图像中检测到的某个候选目标(为了叙述方便,称为第二候选目标),根据该第二候选目标在图像中所处的位置来查询特征分布字典,从而获得该第二候选目标所属类别的目标的特征在该位置附近的特征分布。这里所述的特征分布字典可以是采用参考图9所描述的方法训练得到的特征分布字典。特征分布字典可以包括所属类别的目标的特征在图像的多个位置或区域的多个特征分布。可以选择与第二候选目标的位置最近处所对应的特征分布,作为该候选目标的位置附近的特征分布。与上述实施例/示例相似,所采用的特征可以是在同类目标每个区域中呈现相似性的任何特征,如目标的尺寸、亮度等,这里不再重复。所估计的特征分布可以是根据位于所述第二候选目标的位置的附近且类别相同的多个相邻候选目标的特征来估计的所属类别的目标在所述第二候选目标的位置附近的特征模型(如尺寸模型)。作为一个示例,所估计的特征模型可以包括该类目标的特征的上限和/或下限。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或离差绝对值的均值。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或离差绝对值的均值。
在步骤1109中,根据该第二候选目标的位置附近的特征分布来判断该第二候选目标是否为误检测。如果第二候选目标的所述特征(如尺寸)符合该区域中的特征分布(如尺寸分布)的特性,则可以确定其不是误检测,否则,则将其作为误检测排除掉。
作为具体的示例,可以采用图2或3所示的方法来判断第二候选目标是否为误检测,例如,可以计算第二候选目标的所述特征与其所处区域所对应的特征分布之间的偏差,并判断该偏差是否大于某个阈值,若是,则确定所述第二候选目标为误检测。与前述实施例/示例中相似,所述阈值可以根据实际应用场景来确定,这里不作详述。
这种方法利用同类目标在图像的不同空间位置或区域中的不同的特征分布来进行误检测的排除,可以大大提高目标检测的效率和准确度。在图像中出现大量目标的情况下,可以大大提高目标检测的速度。
根据本公开的实施例,还提供了利用训练得到的、某类目标在图像的不同区域中的特征分布对该类目标进行检测的设备。
图12示出了根据一个实施例的利用不同图像区域中的不同特征分布进行目标检测的设备。如图12所示,目标检测设备1200可以包括分布查询装置1202和误检测判断装置1204。
对于图像中检测到的某个候选目标(为了叙述方便,称为第二候选目标),分布查询装置1202可以根据该第二候选目标在图像中所处的位置来查询特征分布字典,从而获得该第二候选目标所属类别的目标的特征在其位置附近的特征分布。图像的特征分布字典可以是采用例如图9所示的方法或图10所示的设备通过对多个训练样本图像进行训练而得到的,这里不再赘述。与上述实施例/示例相似,所采用的特征可以是在同类目标每个区域中呈现相似性的任何特征,如目标的尺寸、亮度等,这里不再重复。所估计的特征分布可以是根据位于所述第二候选目标的位置的附近且类别相同的多个相邻候选目标的特征来估计的所属类别的目标在所述第二候选目标的位置附近的特征模型(如尺寸模型)。作为一个示例,所估计的特征模型可以包括该类目标的特征的上限和/或下限。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或方差。作为另一示例,所估计的特征模型可以包括该类目标的特征的均值和/或离差绝对值的均值。作为另一示例,所估计的特征模型可以包括该类目标的特征的对数的均值和/或离差绝对值的均值。
误检测判断装置1204可以根据分布查询装置1202获得的该第二候选目标所处位置附近的特征分布来判断该第二候选目标是否为误检测。如果第二候选目标的所述特征(如尺寸)符合该区域中的特征分布(如尺寸分布)的特性,则可以确定其不是误检测,否则,则将其作为误检测排除掉。作为具体的示例,误检测判断装置1204可以采用图2或3所示的方法来判断第二候选目标是否为误检测,例如,误检测判断装置1204可以计算第二候选目标的所述特征与其所处区域所对应的特征分布之间的偏差,并判断该偏差是否大于某个阈值,若是,则确定所述第二候选目标为误检测。与前述实施例/示例中相似,所述阈值可以根据实际应用场景来确定,这里不作详述。
这种目标检测设备利用同类目标在图像的不同空间区域中的不同的特征分布来进行误检测的排除,可以大大提高目标检测的效率和准确度。在图像中出现大量目标的情况下,能够大大提高目标检测的速度。
本公开的实施例/示例可以应用于对各种类型的图像的目标检测处理。例如,所述图像可以是可见光图像,也可以是非可见光图像(如雷达图像),还可以是多光谱图像的组合。另外,所述图像还可以包括单个图像,也可以包括图像序列,如视频图像。所述图像可以采用任何使得的尺寸和格式,本公开对此不作限制。
本公开的实施例中,所述目标可以是人脸、人的头部或者汽车等。本公开可以应用于单类目标的检测,也可以应用于多类目标的检测。
另外,在本公开的实施例中,目标用矩形区域表示的情况下,目标的尺寸可以用其面积来表示,或者还可以用其宽度、高度、宽高比中的一个或更多个来表示。在同类目标的宽高比固定的情况下,目标的尺寸可以用该矩形区域的宽度或者高度之一来表示。在目标用圆形区域的情况下,目标的尺寸可以用其面积或者其半径或直径等来表示。当然,目标还可以用其他形状的区域来表示,这里不一一列举。
根据本公开实施例的上述方法、设备可以应用于对车站、广场、体育场等场所中人群的分布和密度的估计,还可以应用于对道路交通拥堵程度的分析以及道路上车辆分布和密度的估计。可以将根据本公开的目标检测设备或方法配置于用于(实时或非实时的)目标检测的各种电子设备中。当然,根据本公开的目标检测设备或方法还可以应用于其他具有图像处理功能的电子设备,如电脑、照相机、摄像机等等,这里不一一列举。
应理解,上述实施例和示例是示例性的,而不是穷举性的,本公开不应被视为局限于任何具体的实施例或示例。另外,在上述实施例和示例中,采用了“第一”、“第二”(如第一候选目标、第二候选目标等)等表述。本领域的普通技术人员应理解,上述表述只是为了对这些表述作文字上的区分,而并非表示其顺序或任何其他限定。
作为一个示例,上述方法的各个步骤以及上述设备的各个组成模块和/或单元可以实施为软件、固件、硬件或其组合。作为一个示例,在通过软件或固件实现的情况下,可以从存储介质或网络向具有专用硬件结构的计算机(例如图13所示的通用计算机1300)安装构成用于实施上述方法的软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
在图13中,中央处理单元(CPU)1301根据只读存储器(ROM)1302中存储的程序或从存储部分1308加载到随机存取存储器(RAM)1303的程序执行各种处理。在RAM 1303中,也根据需要存储当CPU 1301执行各种处理等等时所需的数据。CPU 1301、ROM 1302和RAM 1303经由总线1304彼此链路。输入/输出接口1305也链路到总线1304。
下述部件链路到输入/输出接口1305:输入部分1306(包括键盘、鼠标等等)、输出部分1307(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分1308(包括硬盘等)、通信部分1309(包括网络接口卡比如LAN卡、调制解调器等)。通信部分1309经由网络比如因特网执行通信处理。根据需要,驱动器1310也可链路到输入/输出接口1305。可拆卸介质1311比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1310上,使得从中读出的计算机程序根据需要被安装到存储部分1308中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1311安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图13所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1311。可拆卸介质1311的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 1302、存储部分1308中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本公开还提出一种存储有机器可读取的指令代码的程序产品。所述指令代码由机器读取并执行时,可执行上述根据本公开实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本公开的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。
在上面对本公开具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以用相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
此外,本公开的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本公开的技术范围构成限制。
尽管上面已经通过对本公开的具体实施例的描述对本公开进行了披露,但是,应该理解,上述的所有实施例和示例均是示例性的,而非限制性的。本领域的技术人员可在所附权利要求的精神和范围内设计对本公开的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本公开的保护范围内。

Claims (31)

1.一种目标检测方法,包括:
对于在至少一个图像中检测到的某个候选目标,该候选目标称为第一候选目标,根据在所述至少一个图像中检测到的、在空间上位于该第一候选目标的位置附近且与该第一候选目标类别相同的多个相邻候选目标来估计该第一候选目标所属类别的目标的特征在该第一候选目标的位置附近的特征分布;以及
根据所述特征分布来判断该第一候选目标是否为误检测。
2.如权利要求1所述的方法,其中,所述特征为目标的尺寸,所述特征分布为根据检测到的所述多个相邻候选目标的尺寸来估计的所属类别的目标在所述第一候选目标的位置附近的尺寸分布。
3.如权利要求1所述的方法,其中,所述多个相邻候选目标为在所述至少一个图像中检测到的在空间上距离该第一候选目标的位置最近且与所述第一候选目标类别相同的多个候选目标。
4.如权利要求1所述的方法,其中,所述多个相邻候选目标为在所述至少一个图像中与所述第一候选目标的位置对应的闭合区域中检测到的、与所述第一候选目标类别相同的多个候选目标。
5.如权利要求1所述的方法,其中,估计所述特征分布包括:通过统计所述多个相邻候选目标的所述特征来估计所属类别的目标在所述第一候选目标的位置附近的特征模型,所述特征模型包括下列各项中的至少一个:该类目标的所述特征的上限和下限、该类目标的所述特征的均值和方差、该类目标的所述特征的均值和离差绝对值的均值、该类目标的所述特征的对数的均值和方差、该类目标的所述特征的对数的均值和离差绝对值的均值。
6.如权利要求5所述的方法,其中,估计所属类别的目标在所述第一候选目标的位置附近的特征模型包括:
对于每个相邻候选目标,利用该每个相邻候选目标的所述特征来估计所属类别的目标的所述特征在该每个相邻候选目标的位置的分布概率模型,得到分别与所述多个相邻候选目标中的每一个对应的多个分布概率模型;
在包含所述多个分布概率模型的特征模型空间中搜索分布概率较大的区段;以及
利用该区段来估计所述特征模型。
7.如权利要求5所述的方法,其中,估计所属类别的目标在所述第一候选目标的位置附近的特征模型包括:
提出所属类别的目标在所述第一候选目标的位置附近的多个特征分布假设;
计算所述多个相邻候选目标的特征值在每个特征分布假设下的似然概率之和;以及
根据与最大的似然概率之和对应的特征分布假设来估计所述特征模型。
8.如权利要求1所述的方法,其中,估计所述特征分布包括:
计算所述多个相邻候选目标的所述特征的平均值、中值和以相应候选目标的置信度为权重的加权平均值中的一个。
9.如权利要求1所述的方法,其中,判断该第一候选目标是否为误检测包括:
根据在空间上位于每个相邻候选目标的位置附近的多个同类候选目标来估计所属类别的目标的所述特征在每个相邻候选目标附近的特征分布;
计算该第一候选目标及所述多个相邻候选目标中的每个候选目标的所述特征与对应的特征分布之间的偏差;以及
将该第一候选目标及所述多个相邻候选目标中的一个或多个与较大的偏差对应的候选目标作为误检测。
10.如权利要求1所述的方法,其中,判断该第一候选目标是否为误检测包括:计算该第一候选目标的所述特征与所述特征分布之间的偏差,并判断该偏差是否大于某个阈值,若是,则确定该候选目标为误检测。
11.如权利要求5所述的方法,还包括:
根据所述多个相邻候选目标的置信度对所述特征或所述特征模型加权。
12.如权利要求1所述的方法,其中,多次执行估计所述特征分布以及根据所述特征分布来判断所述第一候选目标是否为误检测的步骤。
13.一种目标检测设备,包括:
估计装置,用于针对在至少一个图像中检测到的某个候选目标,根据在所述至少一个图像中检测到的、在空间上位于该候选目标的位置附近且与该候选目标类别相同的多个相邻候选目标来估计该候选目标所属类别的目标的特征在该候选目标的位置附近的特征分布,该候选目标称为第一候选目标;以及
误检测判断装置,用于根据所述特征分布来判断该第一候选目标是否为误检测。
14.如权利要求13所述的设备,其中,所述特征为目标的尺寸,所述特征分布为所述估计装置根据检测到的所述多个相邻候选目标的尺寸来估计的所属类别的目标在所述第一候选目标的位置附近的尺寸分布。
15.如权利要求13所述的设备,其中,所述多个相邻候选目标为在所述至少一个图像中检测到的在空间上距离该第一候选目标的位置最近且与所述第一候选目标类别相同的多个候选目标。
16.如权利要求13所述的设备,其中,所述多个相邻候选目标为在所述至少一个图像中与所述第一候选目标的位置对应的闭合区域中检测到的、与所述第一候选目标类别相同的多个候选目标。
17.如权利要求13所述的设备,其中,所述估计装置被配置用于:通过统计所述多个相邻候选目标的所述特征来估计所属类别的目标在所述第一候选目标的位置附近的特征模型,所述特征模型包括下列各项中的至少一个:该类目标的所述特征的上限和下限、该类目标的所述特征的均值和方差、该类目标的所述特征的均值和离差绝对值的均值、该类目标的所述特征的对数的均值和方差、该类目标的所述特征的对数的均值和离差绝对值的均值。
18.如权利要求13所述的设备,其中,所述估计装置还被配置用于:根据在空间上位于每个相邻候选目标的位置附近的多个同类候选目标来估计所属类别的目标的所述特征在每个相邻候选目标附近的特征分布,并且
其中,所述误检测判断装置被配置用于:计算该第一候选目标及所述多个相邻候选目标中的每一个的所述特征与对应的特征分布之间的偏差;以及将该第一候选目标及所述多个相邻候选目标中的一个或多个与较大的偏差对应的候选目标作为误检测。
19.如权利要求13所述的设备,其中,所述误检测判断装置被配置用于:计算该第一候选目标的所述特征与所述特征分布之间的偏差,并判断该偏差是否大于某个阈值,若是,则确定该候选目标为误检测。
20.如权利要求17所述的设备,其中,所述估计装置还被配置用于:
根据所述多个相邻候选目标的置信度对所述特征或所述特征模型加权。
21.一种目标特征分布的训练方法,包括:
对于在多个图像样本中检测到的类别相同的多个候选目标中的每个候选目标,根据在空间上位于每个候选目标的位置附近的、同类别的多个相邻候选目标来估计所属类别的目标的特征在该每个候选目标的位置附近的特征分布,得到分别与所述多个候选目标的位置对应的多个特征分布;以及
保存所述多个特征分布,作为特征分布字典。
22.如权利要求21所述的方法,其中,所述特征为目标的尺寸,所述特征分布为尺寸分布。
23.如权利要求21所述的方法,其中,每个候选目标的所述多个相邻候选目标为在所述多个图像样本中检测到的在空间上距离该每个候选目标的位置最近且与该每个候选目标类别相同的多个候选目标。
24.如权利要求21所述的方法,其中,每个候选目标的所述多个相邻候选目标为在所述多个图像样本中与该每个候选目标的位置对应的闭合区域中检测到的、与该每个候选目标类别相同的多个候选目标。
25.如权利要求21所述的方法,其中,估计所属类别的目标的特征在每个候选目标的位置附近的特征分布包括:通过统计所在空间上位于每个候选目标的位置附近的多个同类候选目标的所述特征来估计所属类别的目标在该每个候选目标的位置附近的特征模型,所述特征模型包括下列各项中的至少一个:该类目标的所述特征的上限和下限、该类目标的所述特征的均值和方差、该类目标的所述特征的均值和离差绝对值的均值、该类目标的所述特征的对数的均值和方差、该类目标的所述特征的对数的均值和离差绝对值的均值。
26.一种目标特征分布的训练设备,包括:
估计装置,用于根据在空间上位于在多个图像样本中检测到的类别相同的多个候选目标中的每个候选目标的位置附近的、同类别的多个相邻候选目标来估计所属类别的目标的特征在该每个候选目标的位置附近的特征分布,得到分别与所述多个候选目标的位置对应的多个特征分布;以及
存储装置,用于保存所述多个特征分布,作为特征分布字典。
27.如权利要求26所述的设备,其中,所述特征为目标的尺寸,所述估计装置被配置用于根据位于每个候选目标的位置附近的、同类别的多个相邻候选目标的尺寸来估计所属类别的目标的特征在该每个候选目标的位置附近的尺寸分布。
28.如权利要求26所述的设备,其中,所述估计装置被配置用于通过以下来估计所属类别的目标在每个候选目标的位置附近的所述特征分布:通过统计每个候选目标的多个相邻候选目标的所述特征来估计所属类别的目标在每个候选目标的位置附近的特征模型,所述特征模型包括下列各项中的至少一个:该类目标的所述特征的上限和下限、该类目标的所述特征的均值和方差、该类目标的所述特征的均值和离差绝对值的均值、该类目标的所述特征的对数的均值和方差、该类目标的所述特征的对数的均值和离差绝对值的均值。
29.一种目标检测方法,包括:
对于在图像中检测到的某个候选目标,该候选目标称为第二候选目标,根据该第二候选目标在所述图像中所处的位置来查询特征分布字典,获得该第二候选目标所属类别的目标的特征在该位置附近的特征分布,所述特征分布字典包括所属类别的目标的所述特征在图像中的多个位置处的多个特征分布;以及
根据所述特征分布来判断该第二候选目标是否为误检测。
30.如权利要求29所述的方法,其中,判断所述第二候选目标是否为误检测包括:计算所述第二候选目标的所述特征与所属类别的目标在第二候选目标的位置附近的特征分布之间的偏差,并判断该偏差是否大于某个阈值,若是,则确定所述第二候选目标为误检测。
31.一种目标检测设备,包括:
分布查询装置,用于针对在图像中检测到的某个候选目标,该候选目标称为第二候选目标,根据该第二候选目标在所述图像中所处的位置来查询特征分布字典,获得该第二候选目标所属类别的目标的特征在该位置附近的特征分布,所述特征分布字典包括所属类别的目标的所述特征在图像中的多个位置处的多个特征分布;以及
误检测判断装置,用于根据所述特征分布来判断该第二候选目标是否为误检测。
CN2010102643252A 2010-08-23 2010-08-23 目标检测方法和设备 Pending CN102375993A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102643252A CN102375993A (zh) 2010-08-23 2010-08-23 目标检测方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102643252A CN102375993A (zh) 2010-08-23 2010-08-23 目标检测方法和设备

Publications (1)

Publication Number Publication Date
CN102375993A true CN102375993A (zh) 2012-03-14

Family

ID=45794570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102643252A Pending CN102375993A (zh) 2010-08-23 2010-08-23 目标检测方法和设备

Country Status (1)

Country Link
CN (1) CN102375993A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014094275A1 (en) * 2012-12-20 2014-06-26 Intel Corporation Accelerated object detection filter using a video motion estimation module
CN106295515A (zh) * 2016-07-28 2017-01-04 北京小米移动软件有限公司 确定图像中的人脸区域的方法及装置
CN107633238A (zh) * 2017-10-12 2018-01-26 深圳市信海通科技有限公司 一种视频分析方法以及智能分析服务器
CN109145752A (zh) * 2018-07-23 2019-01-04 北京百度网讯科技有限公司 用于评估对象检测和跟踪算法的方法、装置、设备和介质
CN109325406A (zh) * 2018-08-10 2019-02-12 广州广电运通金融电子股份有限公司 待评估检测算法检测性能的评估方法、装置和计算机设备
CN110626326A (zh) * 2018-06-21 2019-12-31 沃尔沃汽车公司 用于确定车辆中轮胎-道路摩擦的方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5907628A (en) * 1992-07-27 1999-05-25 Orbot Instruments Ltd. Apparatus and method for comparing and aligning two digital representations of an image
CN1303071A (zh) * 1999-12-15 2001-07-11 罗技电子股份有限公司 动态异常象素的检测与校正
JP2001351109A (ja) * 2000-06-09 2001-12-21 Matsushita Electric Ind Co Ltd 画像検出方法
US6356656B1 (en) * 1994-06-17 2002-03-12 Canon Kabushiki Kaisha Contour-information extraction apparatus and method
US20090226097A1 (en) * 2008-03-05 2009-09-10 Kabushiki Kaisha Toshiba Image processing apparatus
US20090292464A1 (en) * 2008-05-23 2009-11-26 Tele Atlas North America, Inc. System and method for providing geographic markers on electronic objects and real-world objects
CN101727452A (zh) * 2008-10-22 2010-06-09 富士通株式会社 图像处理方法和设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5907628A (en) * 1992-07-27 1999-05-25 Orbot Instruments Ltd. Apparatus and method for comparing and aligning two digital representations of an image
US6356656B1 (en) * 1994-06-17 2002-03-12 Canon Kabushiki Kaisha Contour-information extraction apparatus and method
CN1303071A (zh) * 1999-12-15 2001-07-11 罗技电子股份有限公司 动态异常象素的检测与校正
JP2001351109A (ja) * 2000-06-09 2001-12-21 Matsushita Electric Ind Co Ltd 画像検出方法
US20090226097A1 (en) * 2008-03-05 2009-09-10 Kabushiki Kaisha Toshiba Image processing apparatus
US20090292464A1 (en) * 2008-05-23 2009-11-26 Tele Atlas North America, Inc. System and method for providing geographic markers on electronic objects and real-world objects
CN101727452A (zh) * 2008-10-22 2010-06-09 富士通株式会社 图像处理方法和设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014094275A1 (en) * 2012-12-20 2014-06-26 Intel Corporation Accelerated object detection filter using a video motion estimation module
US9141855B2 (en) 2012-12-20 2015-09-22 Intel Corporation Accelerated object detection filter using a video motion estimation module
CN106295515A (zh) * 2016-07-28 2017-01-04 北京小米移动软件有限公司 确定图像中的人脸区域的方法及装置
CN106295515B (zh) * 2016-07-28 2019-10-15 北京小米移动软件有限公司 确定图像中的人脸区域的方法及装置
CN107633238A (zh) * 2017-10-12 2018-01-26 深圳市信海通科技有限公司 一种视频分析方法以及智能分析服务器
CN110626326A (zh) * 2018-06-21 2019-12-31 沃尔沃汽车公司 用于确定车辆中轮胎-道路摩擦的方法和系统
CN109145752A (zh) * 2018-07-23 2019-01-04 北京百度网讯科技有限公司 用于评估对象检测和跟踪算法的方法、装置、设备和介质
CN109325406A (zh) * 2018-08-10 2019-02-12 广州广电运通金融电子股份有限公司 待评估检测算法检测性能的评估方法、装置和计算机设备

Similar Documents

Publication Publication Date Title
CN108681693B (zh) 基于可信区域的车牌识别方法
CN106127148B (zh) 一种基于机器视觉的手扶电梯乘客异常行为检测方法
CN103020978B (zh) 结合多阈值分割与模糊聚类的sar图像变化检测方法
CN101404086B (zh) 基于视频的目标跟踪方法及装置
CN102375993A (zh) 目标检测方法和设备
CN105426905A (zh) 基于梯度直方图和支持向量机的机器人障碍物识别方法
CN102567994B (zh) 基于角点高斯特性分析的红外小目标检测方法
CN104200485A (zh) 一种面向视频监控的人体跟踪方法
CN103810703B (zh) 一种基于图像处理的隧道视频运动目标检测方法
CN112084869A (zh) 一种基于紧致四边形表示的建筑物目标检测方法
CN102867195B (zh) 一种遥感图像多类目标检测和识别方法
CN106780727B (zh) 一种车头检测模型重建方法及装置
CN103456009B (zh) 目标检测方法与装置、监控系统
CN102867183A (zh) 一种车辆遗撒物检测方法、装置及智能交通监控系统
CN103136534A (zh) 自适应的区域行人计数方法及装置
CN104599291B (zh) 基于结构相似度和显著性分析的红外运动目标检测方法
CN110490150A (zh) 一种基于车辆检索的违章图片自动审核系统及方法
CN101236646B (zh) 在频率域检测与估计图像显著的强相关方向的方法和系统
CN104282019B (zh) 基于自然场景统计和感知质量传播的盲图像质量评价方法
CN103198300A (zh) 基于双层背景的停车事件检测方法
CN110147748A (zh) 一种基于道路边缘检测的移动机器人障碍物识别方法
CN103456029A (zh) 一种抗相似颜色和光照变化干扰的Mean Shift跟踪方法
CN101996312B (zh) 跟踪目标的方法和装置
CN104331708B (zh) 一种人行横道线自动检测分析方法及系统
CN103136536A (zh) 对象检测系统和方法、图像的特征提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120314