CN113255411A - 目标检测方法、装置、电子设备及存储介质 - Google Patents

目标检测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113255411A
CN113255411A CN202010090507.6A CN202010090507A CN113255411A CN 113255411 A CN113255411 A CN 113255411A CN 202010090507 A CN202010090507 A CN 202010090507A CN 113255411 A CN113255411 A CN 113255411A
Authority
CN
China
Prior art keywords
target
image
frame
candidate
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010090507.6A
Other languages
English (en)
Inventor
朱晓星
杨凡
王成法
孙勇义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apollo Intelligent Connectivity Beijing Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010090507.6A priority Critical patent/CN113255411A/zh
Priority to US17/029,611 priority patent/US20210256725A1/en
Priority to JP2020193157A priority patent/JP7221920B2/ja
Priority to EP21156512.2A priority patent/EP3866065B1/en
Publication of CN113255411A publication Critical patent/CN113255411A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了目标检测方法、装置、电子设备及存储介质,涉及计算机视觉技术领域。具体实现方案为:在多帧图像中,确定包含候选目标的至少一帧第一图像;分别获取候选目标在各第一图像中的置信度;根据各第一图像的权重和置信度,计算候选目标的出现概率;在出现概率满足第一预设条件的情况下,将候选目标确定为最终目标。通过上述方案,可以利用多帧图像的检测结果对候选目标进行综合判断,从而确定检测到的最终目标。由于克服了只利用单一图像对最终目标进行检测,可以提高对于最终目标检测的准确性。

Description

目标检测方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机视觉技术领域,尤其涉及目标检测方法、装置、电子设备及存储介质。
背景技术
现有技术对于目标的检测依赖于单帧图像的识别。基于目标识别算法,得到检测目标。由于目标识别算法的本身的制约或者训练水平的制约,可能出现错检或漏检等情况,导致目标检测的准确性不高。
发明内容
本申请实施例提供一种目标检测方法、装置、电子设备及存储介质,以解决现有技术中的一个或多个技术问题。
第一方面,本申请提供一种目标检测方法,包括:
在多帧图像中,确定包含候选目标的至少一帧第一图像;
分别获取候选目标在各第一图像中的置信度;
根据各第一图像的权重和置信度,计算候选目标的出现概率;
在出现概率满足第一预设条件的情况下,将候选目标确定为最终目标。
通过上述方案,可以利用多帧图像的检测结果对候选目标进行综合判断,从而确定检测到的最终目标。可以克服单一图像错检、漏检的情况,提高对于最终目标检测的准确性。
在一种实施方式中,该方法还包括:
在多帧图像中的最后一帧图像不包含最终目标的情况下,根据最终目标在各第一图像中的位置变化,以及相邻帧图像的时间间隔,预测最终目标出现在最后一帧图像中的位置。
通过上述方案,即便多帧图像的最后一帧图像未检测到最终目标,也可以根据检测到最终目标的其他帧图像中的移动速度推算出最终目标在最后一帧图像中的位置。实现相对准确的确定出最终目标在最后一帧图像中的位置。
在一种实施方式中,计算候选目标的出现概率,包括:
分别将各第一图像的权重与候选目标在对应的第一图像中的置信度相乘,得到候选目标在各第一图像中的第一出现概率;
将候选目标在各第一图像中的第一出现概率相加,得到候选目标的出现概率。
通过上述方案,可以基于检测到候选目标的各帧图像的权重和候选目标在对应帧图像中的置信度,客观的反应出候选目标的出现概率。
在一种实施方式中,候选目标的确定方式包括:
对于任意一帧图像中的任一目标,在目标的置信度满足第二预设条件的情况下,将目标确定为候选目标。
通过上述方案,可以对候选目标进行相对准确的识别。
在一种实施方式中,目标的确定方式为:
获取任意一帧图像中的第一检测框;
在第一检测框与任意一帧图像之前的其他图像中的第二检测框的重叠度满足第三预设条件的情况下,确定第一检测框包含的目标为在其他图像中已检测到的目标;否则,确定第一检测框包含的目标为任意一帧图像中新检测到的目标。
通过上述方案,当存在目标在不同图像中出现位移的情况,依然可以实现对候选目标的准确确定。
第二方面,本申请提供一种目标检测装置,该装置包括:
图像确定模块,用于在多帧图像中,确定包含候选目标的至少一帧第一图像;
置信度获取模块,用于分别获取候选目标在各第一图像中的置信度;
出现概率计算模块,用于根据各第一图像的权重和置信度,计算候选目标的出现概率;
最终目标确定模块,用于在出现概率满足第一预设条件的情况下,将候选目标确定为最终目标。
在一种实施方式中,该装置还包括:
位置预测模块,用于在多帧图像中的最后一帧图像不包含最终目标的情况下,根据最终目标在各第一图像中的位置变化,以及相邻帧图像的时间间隔,预测最终目标出现在最后一帧图像中的位置。
在一种实施方式中,出现概率计算模块,包括:
第一出现概率计算子模块,用于分别将各第一图像的权重与候选目标在对应的第一图像中的置信度相乘,得到候选目标在各第一图像中的第一出现概率;
出现概率计算执行子模块,用于将候选目标在各第一图像中的第一出现概率相加,得到候选目标的出现概率。
在一种实施方式中,该装置还包括:
候选目标确定模块,用于对于任意一帧图像中的任一目标,在目标的置信度满足第二预设条件的情况下,将目标确定为候选目标。
在一种实施方式中,该装置还包括:
第一检测框确定模块,用于获取任意一帧图像中的第一检测框;
目标确定模块,用于在第一检测框与任意一帧图像之前的其他图像中的第二检测框的重叠度满足第三预设条件的情况下,确定第一检测框包含的目标为在其他图像中已检测到的目标;否则,确定第一检测框包含的目标为任意一帧图像中新检测到的目标。
第三方面,本申请实施例提供一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请任意一项实施例所提供的方法。
第四方面,本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本申请任意一项实施例所提供的方法。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例目标检测方法的流程图;
图2是本申请实施例目标检测方法的流程图;
图3是本申请实施例目标检测方法的流程图;
图4是本申请实施例目标检测装置的框图;
图5是本申请实施例目标检测装置的框图;
图6是本申请实施例目标检测装置的框图;
图7是用来实现本申请实施例的目标检测方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本申请提供一种目标检测方法。如图1所示,在一种实施方式中,目标检测方法包括以下步骤:
S101:在多帧图像中,确定包含候选目标的至少一帧第一图像。
S102:分别获取候选目标在各第一图像中的置信度。
S103:根据各第一图像的权重和置信度,计算候选目标的出现概率。
S104:在出现概率满足第一预设条件的情况下,将候选目标确定为最终目标。
候选目标可以包括车辆、行人、宠物、货物等。利用图像采集装置可以不间断的采集到连续帧图像,连续帧图像中的各帧图像的时间间隔可以相同。可以采用滑动窗的方式选择具有时间顺序的多帧图像,进而在选择的多帧图像中进行目标检测。
以候选目标为车辆为例,图像采集装置可以是交通探头。利用车辆识别算法可以检测到出现在由图像采集装置采集到的多帧图像中的候选目标。在确认当前帧图像检测到候选目标的情况下,可以获取候选目标在当前帧图像中的置信度。例如,车辆识别算法在当前帧图像中检测到了车辆、行人、树木三个目标。其中车辆的置信度为0.9,行人的置信度为0.1,树木的置信度为0.06。通过预先设置一置信度阈值(例如置信度阈值为0.75),在车辆识别算法识别出的目标的置信度不低于置信度阈值的情况下,可以确定识别出的目标为候选目标。对于低于置信度阈值的目标,可以忽略(置信度置0)。在上述例子中,由于车辆的置信度高于置信度阈值,行人和树木的置信度低于置信度阈值,因此可以确定,利用车辆识别算法检测到的车辆为当前帧图像中的候选目标。
各帧图像的权重可以根据时间设定。例如,可以根据距离当前时刻的远近设定各帧图像的权重。距离当前时刻最近的图像,可以设定最高的权重。另外,还可以根据各帧图像中检测到的候选目标的数量等其他因素设定权重,例如,检测到候选目标数量越多的图像,可以设定较低的权重。或者,可以结合时间或者候选目标的数量等因素综合设定权重。
例如,多帧图像可以是5帧图像,第1、5帧图像未检测到候选目标。其余3帧图像均检测到了候选目标。在此情况下,可以根据其余3帧图像的权重和候选目标在其余3帧图像中的置信度,得到候选目标的出现概率。
再例如,在多帧图像是5帧图像的情况下,只有第1帧图像检测到候选目标。可以根据第1帧图像的权重和候选目标在第1帧图像中的置信度,得到候选目标的出现概率。
在出现概率满足第一预设条件的情况下,将候选目标作为检测到的最终目标。第一预设条件可以是出现概率大于第一预定阈值,或者不小于第一预定阈值等。
在一帧图像中可以检测到多个候选目标,对于各候选目标是否可以作为最终目标的判断方式相同。本实施例仅以一个候选目标的判断过程为例进行说明。
通过上述方案,可以利用多帧图像的检测结果对候选目标进行综合判断,从而确定检测到的最终目标。滑动窗的每一次滑动,可以更新一次最终目标的检测。由于克服了只利用单一图像对最终目标进行检测,可以提高对于最终目标检测的准确性。
在一种实施方式中,该方法还包括:
在多帧图像中的最后一帧图像不包含最终目标的情况下,根据最终目标在各第一图像中的位置变化,以及相邻帧图像的时间间隔,预测最终目标出现在最后一帧图像中的位置。
可以采用多帧图像的最后一帧作为输出结果的参考帧。输出结果可以是最终目标出现在最后一帧图像中的位置,或者根据最终目标出现在最后一帧图像中的位置得到的最终目标在世界坐标系下的位置。
如前述示例当中,包括5帧图像,第1、5帧图像未检测到候选目标。通过判断,该候选目标可以作为检测到的最终目标。由于最后一帧(第5帧)图像未包含最终目标(候选目标),因此需要根据最终目标在剩余3帧图像中的位置变化预测出最终目标在在最后一帧图像中的位置。例如,可以选取检测到候选目标的任意相邻两帧图像。获取候选目标在选取的相邻两帧图像中的位移,以及选取的相邻两帧图像的时间间隔,从而可以计算出候选目标的在相邻两帧图像的移动速度。进而可以预测出候选目标出现在最后一帧图像中的位置。
或者,还可以根据检测到候选目标的3帧图像得到位置变化的均值,预测出候选目标出现在最后一帧图像中的位置。例如,获取候选目标在第2帧图像中的第一位置以及在第4帧图像中的第二位置。根据第一位置和第二位置得到候选目标在3帧图像中的位置变化。结合第2帧图像至第4帧图像的时间间隔,可以计算出候选目标在3帧图像中的平均移动速度。从而预测出候选目标出现在最后一帧图像中的位置。
通过上述方案,即便多帧图像的最后一帧图像未检测到最终目标,也可以根据最终目标在其他帧的移动速度推算出最终目标在最后一帧图像中的位置。实现相对准确的确定出最终目标在最后一帧图像中的位置。
如图2所示,在一种实施方式中,计算候选目标的出现概率,包括:
S201:分别将各第一图像的权重与候选目标在对应的第一图像中的置信度相乘,得到候选目标在各第一图像中的第一出现概率。
S202:将候选目标在各第一图像中的第一出现概率相加,得到候选目标的出现概率。
如前述示例当中,包括5帧图像,第1、5帧图像未检测到候选目标。则第2帧至4帧共3帧图像中检测到候选目标。
分别获取上述3帧图像的权重,记为:Q2、Q3、Q4
上述3帧图像中的候选目标的置信度分别记为:C2、C3、C4
上述3帧图像中候选目标在的第一出现概率分别记为:P2、P3、P4,其中,P2=Q2*C2、P3=Q3*C3、P4=Q4*C4
候选目标的出现概率可以表示为P,其中,P=P2+P3+P4
通过上述方案,可以基于各帧图像的权重和置信度,客观的反应出候选目标的出现概率。
在一种实施方式中,候选目标的确定方式包括:
对于任意一帧图像中的任一目标,在目标的置信度满足第二预设条件的情况下,将目标确定为候选目标。
图像采集装置所采集的图像中,可能包括多种目标,例如包括车辆、行人、宠物、绿植等多种目标。以候选目标为车辆为例,利用车辆识别算法可以对图像中的目标进行识别,并且每个目标可以对应得到一个置信度。
第二预设条件可以是置信度大于第二预定阈值,或者不小于第二预定阈值等。只有在置信度满足第二预设条件的情况下,才可以确认对应的目标为候选目标,即可以确认识别出车辆。
通过上述方案,可以对候选目标进行相对准确的识别。
如图3所示,在一种实施方式中,目标的确定方式包括:
S301:获取任意一帧图像中的第一检测框。
S302:在第一检测框与任意一帧图像之前的其他图像中的第二检测框的重叠度满足第三预设条件的情况下,确定第一检测框包含的目标为在其他图像中已检测到的目标;否则,确定第一检测框包含的目标为任意一帧图像中新检测到的目标。
具体地,在滑动窗所包括的多帧图像中,在任意帧图像检测到目标的情况下,可以生成目标对应的第一检测框。例如任意帧图像为第N帧图像,则可以从第N-1帧图像开始向前遍历。获取第N-1帧图像中的第二检测框。将第一检测框与第二检测框进行重叠度比较。直至检测到第一检测框与第二检测框的重叠度满足第三预设条件,遍历停止。
第三预设条件可以包括重叠度大于第三预定阈值,或者不小于第三预定阈值等。
在第一检测框与第二检测框的重叠度满足第三预设条件的情况下,表示目标已在当前帧之前的其他帧图像中出现过,从而可以对目标进行跟踪。跟踪的方式可以包括采用相同的标记在不同图像中对同一目标进行标注。
另一方面,在第一检测框与第二检测框的重叠度不满足第三预设条件的情况下,可以确定第一检测框包含的目标为该任意一帧图像中新检测到的目标。对于新检测到的目标,可以采用新标记对其进行标注。
本申请提供一种目标检测装置。如图4所示,在一种实施方式中,目标检测装置包括以下组成:
图像确定模块401,用于在多帧图像中,确定包含候选目标的至少一帧第一图像。
置信度获取模块402,用于分别获取候选目标在各第一图像中的置信度。
出现概率计算模块403,用于根据各第一图像的权重和置信度,计算候选目标的出现概率。
最终目标确定模块404,用于在出现概率满足第一预设条件的情况下,将候选目标确定为最终目标。
在一种实施方式中,该装置还可以包括:
位置预测模块,用于在多帧图像中的最后一帧图像不包含最终目标的情况下,根据最终目标在各第一图像中的位置变化,以及相邻帧图像的时间间隔,预测最终目标出现在最后一帧图像中的位置。
如图5所示,在一种实施方式中,出现概率计算模块403包括:
第一出现概率计算子模块4031,用于分别将各第一图像的权重与候选目标在对应的第一图像中的置信度相乘,得到候选目标在各第一图像中的第一出现概率。
出现概率计算执行子模块4032,用于将候选目标在各第一图像中的第一出现概率相加,得到候选目标的出现概率。
在一种实施方式中,还包括:
候选目标确定模块,用于对于任意一帧图像中的任一目标,在目标的置信度满足第二预设条件的情况下,将目标确定为候选目标。
如图6所示,在一种实施方式中,该装置还包括:
第一检测框确定模块405,用于获取任意一帧图像中的第一检测框;
目标确定模块406,用于在第一检测框与任意一帧图像之前的其他图像中的第二检测框的重叠度满足第三预设条件的情况下,确定第一检测框包含的目标为在其他图像中已检测到的目标;否则,确定第一检测框包含的目标为任意一帧图像中新检测到的目标。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的目标检测的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器710、存储器720,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示图形用户界面(Graphical User Interface,GUI)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器710为例。
存储器720即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的目标检测的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的目标检测的方法。
存储器720作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的目标检测的方法对应的程序指令/模块(例如,附图4所示的图像确定模块401、置信度获取模块402、出现概率计算模块403和最终目标确定模块404)。处理器710通过运行存储在存储器720中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的目标检测的方法。
存储器720可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据目标检测的电子设备的使用所创建的数据等。此外,存储器720可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器720可选包括相对于处理器710远程设置的存储器,这些远程存储器可以通过网络连接至目标检测的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
目标检测的方法的电子设备还可以包括:输入装置730和输出装置740。处理器710、存储器720、输入装置730和输出装置740可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置730可接收输入的数字或字符信息,以及产生与目标检测方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置740可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(Liquid Crystal Display,LCD)、发光二极管(Light EmittingDiode,LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuits,ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(programmable logic device,PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(Cathode Ray Tube,阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、音频信号输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (12)

1.一种目标检测方法,其特征在于,包括:
在多帧图像中,确定包含候选目标的至少一帧第一图像;
分别获取所述候选目标在各所述第一图像中的置信度;
根据各所述第一图像的权重和所述置信度,计算所述候选目标的出现概率;
在所述出现概率满足第一预设条件的情况下,将所述候选目标确定为最终目标。
2.根据权利要求1所述的方法,其特征在于,还包括:
在所述多帧图像中的最后一帧图像不包含所述最终目标的情况下,根据所述最终目标在各所述第一图像中的位置变化,以及相邻帧图像的时间间隔,预测所述最终目标出现在所述最后一帧图像中的位置。
3.根据权利要求1所述的方法,其特征在于,所述计算所述候选目标的出现概率,包括:
分别将各所述第一图像的权重与所述候选目标在对应的第一图像中的置信度相乘,得到所述候选目标在各所述第一图像中的第一出现概率;
将所述候选目标在各所述第一图像中的第一出现概率相加,得到所述候选目标的出现概率。
4.根据权利要求1至3任一所述的方法,其特征在于,所述候选目标的确定方式包括:
对于任意一帧图像中的任一目标,在所述目标的置信度满足第二预设条件的情况下,将所述目标确定为候选目标。
5.根据权利要求4所述的方法,其特征在于,所述目标的确定方式为:
获取任意一帧图像中的第一检测框;
在所述第一检测框与所述任意一帧图像之前的其他图像中的第二检测框的重叠度满足第三预设条件的情况下,确定所述第一检测框包含的目标为在所述其他图像中已检测到的目标;否则,确定所述第一检测框包含的目标为所述任意一帧图像中新检测到的目标。
6.一种目标检测装置,其特征在于,包括:
图像确定模块,用于在多帧图像中,确定包含候选目标的至少一帧第一图像;
置信度获取模块,用于分别获取所述候选目标在各所述第一图像中的置信度;
出现概率计算模块,用于根据各所述第一图像的权重和所述置信度,计算所述候选目标的出现概率;
最终目标确定模块,用于在所述出现概率满足第一预设条件的情况下,将所述候选目标确定为最终目标。
7.根据权利要求6所述的装置,其特征在于,还包括:
位置预测模块,用于在所述多帧图像中的最后一帧图像不包含所述最终目标的情况下,根据所述最终目标在各所述第一图像中的位置变化,以及相邻帧图像的时间间隔,预测所述最终目标出现在所述最后一帧图像中的位置。
8.根据权利要求6所述的装置,其特征在于,所述出现概率计算模块,包括:
第一出现概率计算子模块,用于分别将各所述第一图像的权重与所述候选目标在对应的第一图像中的置信度相乘,得到所述候选目标在各所述第一图像中的第一出现概率;
出现概率计算执行子模块,用于将所述候选目标在各所述第一图像中的第一出现概率相加,得到所述候选目标的出现概率。
9.根据权利要求6至8任一所述的装置,其特征在于,还包括:
候选目标确定模块,用于对于任意一帧图像中的任一目标,在所述目标的置信度满足第二预设条件的情况下,将所述目标确定为候选目标。
10.根据权利要求9所述的装置,其特征在于,还包括:
第一检测框确定模块,用于获取任意一帧图像中的第一检测框;
目标确定模块,用于在所述第一检测框与所述任意一帧图像之前的其他图像中的第二检测框的重叠度满足第三预设条件的情况下,确定所述第一检测框包含的目标为在所述其他图像中已检测到的目标;否则,确定所述第一检测框包含的目标为所述任意一帧图像中新检测到的目标。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至5中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1至5中任一项所述的方法。
CN202010090507.6A 2020-02-13 2020-02-13 目标检测方法、装置、电子设备及存储介质 Pending CN113255411A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202010090507.6A CN113255411A (zh) 2020-02-13 2020-02-13 目标检测方法、装置、电子设备及存储介质
US17/029,611 US20210256725A1 (en) 2020-02-13 2020-09-23 Target detection method, device, electronic apparatus and storage medium
JP2020193157A JP7221920B2 (ja) 2020-02-13 2020-11-20 目標検出方法、装置、電子デバイス、記憶媒体、及びプログラム
EP21156512.2A EP3866065B1 (en) 2020-02-13 2021-02-11 Target detection method, device and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010090507.6A CN113255411A (zh) 2020-02-13 2020-02-13 目标检测方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113255411A true CN113255411A (zh) 2021-08-13

Family

ID=74591821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010090507.6A Pending CN113255411A (zh) 2020-02-13 2020-02-13 目标检测方法、装置、电子设备及存储介质

Country Status (4)

Country Link
US (1) US20210256725A1 (zh)
EP (1) EP3866065B1 (zh)
JP (1) JP7221920B2 (zh)
CN (1) CN113255411A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114532918A (zh) * 2022-01-26 2022-05-27 深圳市杉川机器人有限公司 清洁机器人及其目标检测方法、装置及存储介质
CN114550269A (zh) * 2022-03-02 2022-05-27 北京百度网讯科技有限公司 口罩佩戴检测方法、设备和介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114397307B (zh) * 2021-12-20 2023-08-01 苏州镁伽科技有限公司 用于器件检测的方法、装置、设备及存储介质
CN114331798A (zh) * 2021-12-30 2022-04-12 北京百度网讯科技有限公司 图像数据处理方法、图像数据检测方法、装置和电子设备
CN114581647B (zh) * 2022-02-25 2024-08-06 浙江啄云智能科技有限公司 一种置信度后处理方法、装置、设备及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101968884A (zh) * 2009-07-28 2011-02-09 索尼株式会社 检测视频图像中的目标的方法和装置
CN103259962A (zh) * 2013-04-17 2013-08-21 深圳市捷顺科技实业股份有限公司 一种目标追踪方法和相关装置
CN103679743A (zh) * 2012-09-06 2014-03-26 索尼公司 目标跟踪装置和方法,以及照相机
WO2016174472A1 (en) * 2015-04-30 2016-11-03 Phase Focus Limited Method and apparatus for determining temporal behaviour of an object
CN107301657A (zh) * 2017-06-12 2017-10-27 西安交通大学 一种考虑目标运动信息的视频目标跟踪方法
WO2018024600A1 (en) * 2016-08-01 2018-02-08 Connaught Electronics Ltd. Method for capturing an object in an environmental region of a motor vehicle with prediction of the movement of the object, camera system as well as motor vehicle
CN108038837A (zh) * 2017-12-08 2018-05-15 苏州科达科技股份有限公司 视频中目标检测方法及系统
CN108141546A (zh) * 2015-10-15 2018-06-08 索尼公司 视频信号处理装置、视频信号处理方法和程序
CN108537822A (zh) * 2017-12-29 2018-09-14 西安电子科技大学 基于加权置信度估计的运动目标跟踪方法
CN108596944A (zh) * 2018-04-25 2018-09-28 普联技术有限公司 一种提取运动目标的方法、装置及终端设备
CN109583391A (zh) * 2018-12-04 2019-04-05 北京字节跳动网络技术有限公司 关键点检测方法、装置、设备及可读介质
CN110210304A (zh) * 2019-04-29 2019-09-06 北京百度网讯科技有限公司 用于目标检测和跟踪的方法及系统
CN110414447A (zh) * 2019-07-31 2019-11-05 京东方科技集团股份有限公司 行人跟踪方法、装置及设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5177068B2 (ja) 2009-04-10 2013-04-03 株式会社Jvcケンウッド 目標追尾装置、目標追尾方法
CN110097045A (zh) 2018-01-31 2019-08-06 株式会社理光 一种定位方法、定位装置及可读存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101968884A (zh) * 2009-07-28 2011-02-09 索尼株式会社 检测视频图像中的目标的方法和装置
CN103679743A (zh) * 2012-09-06 2014-03-26 索尼公司 目标跟踪装置和方法,以及照相机
CN103259962A (zh) * 2013-04-17 2013-08-21 深圳市捷顺科技实业股份有限公司 一种目标追踪方法和相关装置
WO2016174472A1 (en) * 2015-04-30 2016-11-03 Phase Focus Limited Method and apparatus for determining temporal behaviour of an object
CN108141546A (zh) * 2015-10-15 2018-06-08 索尼公司 视频信号处理装置、视频信号处理方法和程序
WO2018024600A1 (en) * 2016-08-01 2018-02-08 Connaught Electronics Ltd. Method for capturing an object in an environmental region of a motor vehicle with prediction of the movement of the object, camera system as well as motor vehicle
CN107301657A (zh) * 2017-06-12 2017-10-27 西安交通大学 一种考虑目标运动信息的视频目标跟踪方法
CN108038837A (zh) * 2017-12-08 2018-05-15 苏州科达科技股份有限公司 视频中目标检测方法及系统
CN108537822A (zh) * 2017-12-29 2018-09-14 西安电子科技大学 基于加权置信度估计的运动目标跟踪方法
CN108596944A (zh) * 2018-04-25 2018-09-28 普联技术有限公司 一种提取运动目标的方法、装置及终端设备
CN109583391A (zh) * 2018-12-04 2019-04-05 北京字节跳动网络技术有限公司 关键点检测方法、装置、设备及可读介质
CN110210304A (zh) * 2019-04-29 2019-09-06 北京百度网讯科技有限公司 用于目标检测和跟踪的方法及系统
CN110414447A (zh) * 2019-07-31 2019-11-05 京东方科技集团股份有限公司 行人跟踪方法、装置及设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KEYU LU ET AL.: "Efficient deep network for vision-based object detection in robotic applications", 《NEUROCOMPUTING》 *
杨延光 等: "车载前视GPSAR序列图像浅埋目标检测新方法", 《电子与信息学报》 *
陆子辉: "基于视觉的全天时车外安全检测算法研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114532918A (zh) * 2022-01-26 2022-05-27 深圳市杉川机器人有限公司 清洁机器人及其目标检测方法、装置及存储介质
CN114550269A (zh) * 2022-03-02 2022-05-27 北京百度网讯科技有限公司 口罩佩戴检测方法、设备和介质

Also Published As

Publication number Publication date
US20210256725A1 (en) 2021-08-19
JP7221920B2 (ja) 2023-02-14
EP3866065A1 (en) 2021-08-18
JP2021128753A (ja) 2021-09-02
EP3866065B1 (en) 2023-07-12

Similar Documents

Publication Publication Date Title
CN111640140B (zh) 目标跟踪方法、装置、电子设备及计算机可读存储介质
CN113255411A (zh) 目标检测方法、装置、电子设备及存储介质
CN110827325B (zh) 目标跟踪方法、装置、电子设备及存储介质
CN110659600B (zh) 物体检测方法、装置及设备
CN111722245B (zh) 定位方法、定位装置和电子设备
CN110532978A (zh) 仓储管理方法、装置、设备及存储介质
CN111292531B (zh) 交通信号灯的跟踪方法、装置、设备及存储介质
CN110929639A (zh) 用于确定图像中障碍物位置的方法、装置、设备和介质
CN110879395B (zh) 障碍物位置预测方法、装置和电子设备
CN110968718B (zh) 目标检测模型负样本挖掘方法、装置及电子设备
CN110717474B (zh) 目标关联计算方法、装置、设备和介质
CN110852321B (zh) 候选框过滤方法、装置以及电子设备
CN110717933B (zh) 针对运动物体漏检的后处理方法、装置、设备和介质
CN111275190A (zh) 神经网络模型的压缩方法及装置、图像处理方法及处理器
CN112528786A (zh) 车辆跟踪方法、装置及电子设备
CN111601013B (zh) 用于处理视频帧的方法和装置
US11361453B2 (en) Method and apparatus for detecting and tracking target, electronic device and storage media
CN111462174A (zh) 多目标跟踪方法、装置以及电子设备
CN111008305B (zh) 一种视觉搜索方法、装置以及电子设备
CN111626263A (zh) 一种视频感兴趣区域检测方法、装置、设备及介质
CN111339877B (zh) 盲区的长度检测方法、装置、电子设备及存储介质
CN111191619A (zh) 车道线虚线段的检测方法、装置、设备和可读存储介质
CN110798681B (zh) 成像设备的监测方法、装置和计算机设备
CN111027195A (zh) 仿真场景的生成方法、装置及设备
CN112508027A (zh) 用于实例分割的头部模型、实例分割模型、图像分割方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211019

Address after: 100176 Room 101, 1st floor, building 1, yard 7, Ruihe West 2nd Road, economic and Technological Development Zone, Daxing District, Beijing

Applicant after: Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd.

Address before: 2 / F, baidu building, 10 Shangdi 10th Street, Haidian District, Beijing 100085

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20210813

RJ01 Rejection of invention patent application after publication