CN111476063A - 目标跟踪方法、装置、存储介质和电子设备 - Google Patents

目标跟踪方法、装置、存储介质和电子设备 Download PDF

Info

Publication number
CN111476063A
CN111476063A CN201910065028.6A CN201910065028A CN111476063A CN 111476063 A CN111476063 A CN 111476063A CN 201910065028 A CN201910065028 A CN 201910065028A CN 111476063 A CN111476063 A CN 111476063A
Authority
CN
China
Prior art keywords
video frame
target object
tracking
video
searching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910065028.6A
Other languages
English (en)
Other versions
CN111476063B (zh
Inventor
白杨
吉祥虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Pinecone Electronic Co Ltd
Priority to CN201910065028.6A priority Critical patent/CN111476063B/zh
Publication of CN111476063A publication Critical patent/CN111476063A/zh
Application granted granted Critical
Publication of CN111476063B publication Critical patent/CN111476063B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/42Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Abstract

本公开涉及一种目标跟踪方法、装置、存储介质和电子设备,包括根据确定的目标物体对获取到的第一视频帧进行跟踪,得到带有目标物体标记的第二视频帧,并显示第二视频帧;若在跟踪过程中判定目标物体丢失,则直接显示第一视频帧;从丢失目标物体的时刻之后,对第一视频帧进行目标物体的查找,以查找得到一个带有目标物体标记的第三视频帧;从第三视频帧所对应的第一视频帧开始恢复对第一视频帧的跟踪,得到带有目标物体标记的第四视频帧,并显示第四视频帧。这样,能够在丢失目标物体之后完成对目标物体的重新查找和重新追踪,在保证跟踪速度的情况下提高了跟踪精度,且在一般的移动平台上就可以实现。

Description

目标跟踪方法、装置、存储介质和电子设备
技术领域
本公开涉及视频跟踪领域,具体地,涉及一种目标跟踪方法、装置、存储介质和电子设备。
背景技术
目标追踪是计算机视觉方向的一个主要研究领域,其应用在生活中无处不在,如:智能监控,无人机追踪,人机交互和无人驾驶等等。目前的追踪一般是指在视频或显示流的某一帧图像上人工标定出需要进行跟踪的目标物体(行人,车辆等等),然后需要算法在后续帧中持续的将目标物体标出。通常目标跟踪面临几大难点:外形变化,光照变化,快速移动与运动模糊,遮挡和出视野,以及背景相似干扰等。由于这些干扰的存在,在对目标物体跟踪的过程中可能会出现目标物体消失或者被遮挡或者无法检测到的情况,此时,各种跟踪算法就出现了如何在出现以上情况时保持对目标物体的跟踪状态以及保证跟踪精度的问题。
目前的跟踪算法大多是基于短时跟踪任务的,在长时间的跟踪任务上的完成效果不太理想,主要分为两大类:生成模型方法和判别模型方法。生成模型方法主要有kalman滤波,粒子滤波,mean-shift等。判别模型方法主要以相关滤波方法为主,主要原理是:后一帧通过搜索前一帧目标附近区域并进行相关计算,找出相关系数最大的区域作为当前帧的目标区域。以上这些跟踪算法大都无法很理想的处理跟踪丢失以及重新跟踪的问题。
近年来深度学习发展迅速,深度学习算法可以较为精确地检测到视频中每一个视频帧中需要被跟踪的目标物体的位置,但是深度学习网络需要强大的算力以及存储,在移动平台上无法达到实时运行。具体来说,对于一个30frames/sec的视频流来说,每一帧有不多于33ms的时间用于处理,33ms之后就需要把处理后的视频帧显示出来。但是目前大多数基于深度学习网络的方法在移动平台上无法在33ms内完成处理。这就导致了视频流的下一帧需要先缓存下来等待处理和显示。当视频流的每一帧都需要缓存并等待处理且处理时间永远大于视频流输入间隔时间时,就会造成预览buffer堵塞,显示的视频不流畅。
发明内容
本公开的目的是提供一种目标跟踪方法、装置、存储介质和电子设备,能够在对目标物体跟踪丢失时,利用深度学习的方法完成对目标物体的重新查找,并对目标物体进行重新追踪,在保证跟踪速度的情况下提高了跟踪精度。
为了实现上述目的,本公开提供一种目标跟踪方法,包括:
根据确定的目标物体对获取到的第一视频帧按照获取的顺序进行跟踪,得到带有目标物体标记的第二视频帧,并按照所述跟踪的顺序显示所述第二视频帧,其中,所述第二视频帧与所述第一视频帧一一对应;
若在所述跟踪过程中判定所述目标物体丢失,则在丢失所述目标物体的时刻之后,直接按照所述第一视频帧获取的顺序,显示不带所述目标物体标记的所述第一视频帧;
在丢失所述目标物体的时刻之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧;
从所述第三视频帧所对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧,并按照所述跟踪的顺序显示所述第四视频帧,其中,所述第四视频帧与所述第一视频帧一一对应。
可选地,所述在丢失所述目标物体的时刻之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体的第三视频帧包括:
在丢失所述目标物体之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,按照预设步长,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧。
可选地,所述在丢失所述目标物体的时刻之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体的第三视频帧包括:
在所述第一视频帧上查找与所述目标物体类型相同的所有第一物体;
在所述第一物体中查找与所述目标物体相同的第二物体,并将所述第二物体作为该第三视频帧上的所述目标物体。
可选地,所述从所述第三视频帧对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧,并按照所述跟踪的顺序显示所述第四视频帧包括:
从所述第三视频帧对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧;
若所述第四视频帧与正在显示的所述第一视频帧为同一帧,开始按照所述跟踪的顺序显示所述第四视频帧。
本公开还提供一种目标跟踪装置,所述装置包括:
跟踪模块,用于根据确定的目标物体对获取到的第一视频帧按照获取的顺序进行跟踪,得到带有目标物体标记的第二视频帧,并按照所述跟踪的顺序显示所述第二视频帧,其中,所述第二视频帧与所述第一视频帧一一对应;
第一丢失处理模块,用于,若在所述跟踪过程中判定所述目标物体丢失,则在丢失所述目标物体的时刻之后,直接按照所述第一视频帧获取的顺序,显示不带所述目标物体标记的所述第一视频帧;
第二丢失处理模块,用于在丢失所述目标物体的时刻之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧;
跟踪恢复模块,从所述第三视频帧所对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧,并按照所述跟踪的顺序显示所述第四视频帧,其中,所述第四视频帧与所述第一视频帧一一对应。
可选地,所述第二丢失处理模块还用于:
在丢失所述目标物体之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,按照预设步长,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧。
可选地,所述第二丢失处理模块包括::
第一查找子模块,用于在所述第一视频帧上查找与所述目标物体类型相同的所有第一物体
第二查找子模块,用于在所述第一物体中查找与所述目标物体相同的第二物体,并将所述第二物体作为该第三视频帧上的所述目标物体。
可选地,所述跟踪恢复模块包括:
跟踪子模块,用于从所述第三视频帧对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧;
显示子模块,用于,若所述第四视频帧与正在显示的所述第一视频帧为同一帧,开始按照所述跟踪的顺序显示所述第四视频帧。本公开还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以上所述目标跟踪方法的步骤。
本公开还提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现以上所述目标跟踪方法的步骤。
通过上述技术方案,能够使用跟踪速度较快的跟踪方法对目标跟踪物体区域进行跟踪,而且能够在对目标物体跟踪丢失时,完成对目标物体的重新查找,并对目标物体进行重新追踪,在保证跟踪速度的情况下提高了跟踪精度,对进行跟踪的设备的算力以及存储能力要求也不高,在一般的移动平台上就可以实时地实现对目标物体的长时间的跟踪。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据本公开一示例性实施例示出的一种目标跟踪方法的流程图。
图2是根据本公开一示例性实施例示出的一种目标跟踪方法中查找视频帧中的目标物体的方法的流程图。
图3是根据本公开一示例性实施例示出的一种目标跟踪方法中恢复跟踪的方法的流程图。
图4是根据本公开一示例性实施例示出的一种目标跟踪装置的结构框图。
图5是根据本公开一示例性实施例示出的又一目标跟踪装置的结构框图。
图6是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
图1是根据本公开一示例性实施例示出的一种目标跟踪方法的流程图。如图1所示,所述方法包括步骤101至步骤104。
在步骤101中,根据确定的目标物体对获取到的第一视频帧按照获取的顺序进行跟踪,得到带有所述目标物体标记的第二视频帧,并按照所述跟踪的顺序显示所述第二视频帧,其中,所述第二视频帧与所述第一视频帧一一对应。本公开可以是用于对实时拍摄的视频中的目标跟踪物体进行实时的跟踪,即该第一视频帧获取的顺序可以是拍摄设备对视频帧实时获取的顺序,则该第一视频帧获取的顺序就可以为从该第一视频存储空间中读取到的该第一视频帧在播放时间上的顺序,也可以是对已有视频、图片等进行随机或者人为排序后的第一视频帧在播放时间上的顺序。该目标物体是预先已经确定的,可以是用户主动进行标定的,也可以是由其他方式来进行确定,在通过用户或者其他的方式确定需要跟踪的目标物体之后,得到该目标物体所在的目标跟踪区域,通过之后的每一第一视频帧中该目标跟踪区域附近预设范围内的内容与最初设定的目标跟踪区域中的内容进行相似阈值的比较,就能够确定之后获取的每一第一视频帧中的目标物体所在的区域。在确定该目标物体所在区域之后,在该第一视频帧中对该目标物体进行标记,方法可以为例如通过标注包括该目标物体在内的矩形框、对所述目标物体的中心位置标记五角星等,在此不对标记的方式和标注的形式做限制。
其中,对该第一视频帧的跟踪可以为对所有获取到的第一视频帧都进行逐帧跟踪,也可以为按照预设间隔,在获取到的第一视频帧中抽取部分第一视频帧进行跟踪,例如每间隔2帧跟踪一次,或者,还可以按照预设的其他的规则在获取到的第一视频帧中对部分第一视频帧进行跟踪,对该第一视频帧进行跟踪的方式可以根据实际情况进行选择。
另外,在对带有目标物体标记的第二视频帧进行显示时,可以根据跟踪跟踪时对第一视频帧的选择来进行显示,例如,当在对该第一视频帧是逐帧跟踪时,即对所有的第一视频帧都进行了跟踪,此时,在显示时只显示跟踪之后得到的第二视频帧;当在对第一视频帧是按照预设间隔或者按照预设的其他的规则在获取到的第一视频帧中对部分第一视频帧进行跟踪时,可以是仅显示通过跟踪之后获得的带有目标物体标记的第二视频帧,也可以将该第二视频帧按照其与第一视频帧一一对应的关系替换掉第一视频帧中被跟踪后的第一视频帧,如此穿插在获取到的第一视频帧中来对该第二视频帧进行显示。在确定需要显示的内容之后,显示的方法也可以有多种,例如,可以是对需要进行显示的第一视频帧或第二视频帧逐帧进行显示,也可以是根据显示设备的能力在待显示的第一视频帧或第二视频帧中按照预设的其他规则选择部分视频帧来进行显示,对此,本公开中不做限制,只要能够实现将跟踪后得到的带有目标物体标记的第二视频帧显示出来的效果即可。
这样就能够实时地实现在任意移动设备等算力和存储能力都一般的平台上实现对目标跟踪物体的跟踪。上述跟踪所使用的方法可以是例如判别模型方法等传统的快速跟踪算法。
在步骤102中,若在所述跟踪过程中判定所述目标物体丢失,则在丢失所述目标物体的时刻之后,直接按照所述第一视频帧获取的顺序,显示不带所述目标物体标记的所述第一视频帧。在所述跟踪的过程中判定目标物体丢失的条件在本公开中不做限制。只要是在对某一个第一视频帧进行跟踪的过程中判定需要进行跟踪的目标物体丢失了,那么就立即按照该第一视频帧获取的顺序来直接将第一视频帧显示出来。这样可以避免视频的显示的卡顿情况,以及目标物体显示位置错误的情况。
其中,在丢失目标物体的时刻之后显示所述第一视频帧是指在确定所述目标物体之后,确定下一帧待显示的视频帧时,将其确定为直接获取的不带目标物体标记的第一视频帧中的视频帧,具体是在丢失该目标物体的该视频帧之后紧接着的第一视频帧,还是需要间隔预设帧数之后第一视频帧,需要根据在视频帧显示时的规则来确定,只要能够保证在确定丢失目标物体之后,显示中的视频能够流畅地显示不带目标物体标记的画面即可。
另外,在确定丢失所述目标物体之后,可以通过在之后显示的第一视频帧上添加提示文字或者提示图像等方式来提醒观看视频的用户目标物体已丢失。
在步骤103中,在丢失所述目标物体的时刻之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧。在丢失所述目标物体的时刻之后,对没有经过跟踪处理的第一视频帧直接进行显示的同时,可以对所述第一视频帧进行所述目标物体进行查找,其中,查找的方法可以是例如基于深度学习的物体检测方法或者是其他传统的物体检测方法等。由于利用基于深度学习的物体检测方法来查找第一视频帧中的目标物体能够比使用传统的跟踪的方法在第一视频帧中查找目标物体更加的精准,因此能够在一定程度上保障了目标物体丢失之后再次查找目标物体的精度,避免定位错误的情况出现。
在从丢失目标物体的该第一视频帧进行目标物体的查找时,可能会出现两种情况,一种是在该第一视频帧上就直接查找到了目标物体,另一种可能无法在该第一视频帧上查找到该目标物体,例如目标物体被遮挡或者目标物体没有出现在该第一视频帧上时,此时可以按照该第一视频帧获取的顺序对下一个第一视频帧进行查找,也可以按照预设步长先找到下一帧需要被查找的第一视频帧,然后对该第一视频帧继续进行目标物体的查找。该预设步长可以为预先设置的任意帧数的第一视频帧,例如可以为三帧,则在该丢失目标物体的第一视频帧上没有查找到该目标物体时,对该第一视频帧的三帧后的第一视频帧继续进行目标物体的查找,以此类推,直到在某一个第一视频帧上查找到目标物体为止,此时即查找得到一个带有所述目标物体的第三视频帧。
在步骤104中,从所述第三视频帧所对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧,并按照所述跟踪的顺序显示所述第四视频帧。此处对第四视频帧的显示与对第二视频帧的显示方法相同。在查找得到该带有目标物体标记的第三视频帧之后,不再继续对目标物体进行查找,直接根据该第三视频帧恢复对获取到的第一视频帧的跟踪,即,从该第三视频帧开始,根据该第三视频帧上查找到的目标物体恢复对该第三视频帧之后获取到的第一视频帧进行目标物体的跟踪,从而得到与该第一视频帧一一对应的,带有目标物体标记的第四视频帧,将该第四视频帧按照跟踪过程中的第一视频帧的顺序将该第四视频帧显示出来,从而实现对丢失的目标物体的重新跟踪,其中,所述第四视频帧与所述第一视频帧一一对应。
通过上述技术方案,能够使用跟踪速度较快的跟踪方法对目标跟踪物体区域进行跟踪,而且能够在对目标物体跟踪丢失时,完成对目标物体的重新查找,并对目标物体进行重新追踪,在保证跟踪速度的情况下提高了跟踪精度,对进行跟踪的设备的算力以及存储能力要求也不高,在一般的移动平台上就可以实时地实现对目标物体的长时间的跟踪。
图2是根据本公开一示例性实施例示出的一种目标跟踪方法中查找视频帧中的目标物体的方法的流程图。如图2所示,所述方法包括步骤201和在步骤202。
在步骤201中,在所述第一视频帧上查找与所述目标物体类型相同的所有第一物体。例如,可以利用基于深度学习的物体检测方法,先在需要查找目标物体的第一视频帧上查找所有与目标物体类型相同的其他所有第一物体的位置。这个过程就先排除了与该目标物体的类型不同的其他所有物体,只保留了在该第一视频帧上与该目标物体类型相同的第一物体。
在步骤202中,在所述第一物体中查找与所述目标物体相同的第二物体,并将该第二物体作为该第三视频帧上的所述目标物体。在筛除了与该目标物体的类型不相同的其他物体之后,在与目标物体的类型相同的第一物体中查找与该目标物体相同的第二物体,并将该第二物体作为该第三视频帧上的所述目标物体。其中,在步骤202中查找目标物体所使用的匹配算法可以是例如特征匹配算法(Scale-invariant feature transform,SIFT)、基于方向梯度直方图(Histogram of Oriented Gradient,HOG)特征的匹配算法、基于局部二值模式(Local Binary Patterns,LBP)特征的匹配算法等。
通过两次的查找,能够大大提高查找到目标物体的精度以及准确性,这样就能使得在跟踪过程中目标物体丢失之后,再次对目标物体的查找的精度和准确性大大提高。
图3是根据本公开一示例性实施例示出的一种目标跟踪方法中恢复跟踪的方法的流程图。如图3所示,所述方法包括步骤301和步骤302。
在步骤301中,从所述第三视频帧对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述逐帧跟踪,得到带有所述目标物体标记的第四视频帧。
在步骤302中,若所述第四视频帧与正在显示的所述第一视频帧为同一帧,开始按照所述跟踪的顺序逐帧显示所述第四视频帧。在丢失目标物体之后的再次第三视频帧上找到目标物体之后,对在该第三视频帧之后获取的第一视频帧重新开始进行跟踪,以得到与该第一视频帧一一对应的带有目标物体标记的第四视频帧。在按照跟踪顺序来对跟踪得到的第四视频帧进行显示之前,由于在重新对目标物体进行查找以及在查找到该目标物体、然后重新开始对之后的视频帧开始重新跟踪时,一直有未经过跟踪的第一视频帧在按照获取的顺序进行显示,因此需要在重新开始跟踪之后得到的第四视频帧追上正在显示的第一视频帧之后,再开始显示第四视频帧,即,在通过跟踪得到的第四视频帧与正在显示的第一视频帧为同一帧时,就能保证下一帧显示的第四视频帧所对应的第一视频帧是还没有显示过的第一视频帧,从而避免已经显示过的视频内容又重复显示的问题。由于对一帧视频帧进行跟踪的时间小于视频帧流入的间隔时间,因此在得到重新找到目标物体的第四视频帧之后,对第一视频帧的跟踪能够很快追上当前正在显示的第一视频帧,从而完成恢复对最初的跟踪状态的恢复。
其中,判断该第四视频帧与正在显示的第一视频帧的先后关系的方式可以是通过对视频帧的帧号来进行判断。
通过上述技术方案,能够在重新查找到丢失的目标物体之后恢复对待跟踪的视频的跟踪,且不会因为对目标物体的重新查找导致视频显示的卡顿,还能在恢复对待跟踪的视频的跟踪之后重新开始正常显示带有目标物体标记的视频帧,不仅不影响视频的显示流畅性,而且能够在目标物体丢失之后精确地重新找到该目标物体。
图4是根据本公开一示例性实施例示出的一种目标跟踪装置的结构框图。如图4所示,所述装置包括:跟踪模块10,用于根据确定的目标物体对获取到的第一视频帧按照获取的顺序进行跟踪,得到带有目标物体标记的第二视频帧,并按照所述跟踪的顺序显示所述第二视频帧,其中,所述第二视频帧与所述第一视频帧一一对应;第一丢失处理模块20,用于,若在所述跟踪过程中判定所述目标物体丢失,则在丢失所述目标物体的时刻之后,直接按照所述第一视频帧获取的顺序,显示不带所述目标物体标记的所述第一视频帧;第二丢失处理模块30,用于在丢失所述目标物体的时刻之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧;跟踪恢复模块40,从所述第三视频帧所对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧,并按照所述跟踪的顺序显示所述第四视频帧,其中,所述第四视频帧与所述第一视频帧一一对应。
通过上述技术方案,能够使用跟踪速度较快的跟踪方法对目标跟踪物体区域进行跟踪,而且能够在对目标物体跟踪丢失时,利用深度学习的方法完成对目标物体的重新查找,并对目标物体进行重新追踪,在保证跟踪速度的情况下提高了跟踪精度,对进行跟踪的设备的算力以及存储能力要求也不高,在一般的移动平台上就可以实时地实现对目标物体的长时间的跟踪。
在一种可能的实施方式中,所述第二丢失处理模块30还用于:在丢失所述目标物体之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,按照预设步长,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧。
图5是根据本公开一示例性实施例示出的又一目标跟踪装置的结构框图。如图5所示,所述第二丢失处理模块30包括:第一查找子模块301,用于在所述第一视频帧上查找与所述目标物体类型相同的所有第一物体;第二查找子模块302,用于在所述第一物体中查找与所述目标物体相同的第二物体,并将所述第二物体作为该第三视频帧上的所述目标物体。
通过两次的查找,能够大大提高查找到目标物体的精度以及准确性,这样就能使得在跟踪过程中目标物体丢失之后,再次对目标物体的查找的精度和准确性大大提高。
如图5所示,所述跟踪恢复模块40包括:跟踪子模块401,用于从所述第三视频帧对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧;显示子模块402,用于,若所述第四视频帧与正在显示的所述第一视频帧为同一帧,开始按照所述跟踪的顺序显示所述第四视频帧。
通过上述技术方案,能够在重新查找到丢失的目标物体之后恢复对待跟踪的视频的跟踪,且不会因为对目标物体的重新查找导致视频显示的卡顿,还能在恢复对待跟踪的视频的跟踪之后重新开始正常显示带有目标物体的视频帧,不仅不影响视频的显示流畅性,而且能够在目标物体丢失之后精确地重新找到该目标物体。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种电子设备600的框图。如图6所示,该电子设备600可以包括:处理器601,存储器602。该电子设备600还可以包括多媒体组件603,输入/输出(I/O)接口604,以及通信组件605中的一者或多者。
其中,处理器601用于控制该电子设备600的整体操作,以完成上述的目标跟踪方法中的全部或部分步骤。存储器602用于存储各种类型的数据以支持在该电子设备600的操作,这些数据例如可以包括用于在该电子设备600上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器602可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件603可以包括屏幕、音频组件、视频组件等。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号、视频组件用于输出和/或输入视频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器602或通过通信组件605发送。音频组件还包括至少一个扬声器,用于输出音频信号。所述视频组件还可以包括一个摄像头,摄像头用于拍摄视频信息,所接收的视频信息可以被进一步存储在存储器602或通过通信组件605发送。I/O接口604为处理器601和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件605用于该电子设备600与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(NearField Communication,简称NFC),2G、3G、4G、NB-IOT、eMTC、或其他5G等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件607可以包括:Wi-Fi模块,蓝牙模块,NFC模块等等。
在一示例性实施例中,电子设备600可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的目标跟踪方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的目标跟踪方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器602,上述程序指令可由电子设备600的处理器601执行以完成上述的目标跟踪方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (10)

1.一种目标跟踪方法,其特征在于,所述方法包括:
根据确定的目标物体对获取到的第一视频帧按照获取的顺序进行跟踪,得到带有目标物体标记的第二视频帧,并按照所述跟踪的顺序显示所述第二视频帧,其中,所述第二视频帧与所述第一视频帧一一对应;
若在所述跟踪过程中判定所述目标物体丢失,则在丢失所述目标物体的时刻之后,直接按照所述第一视频帧获取的顺序,显示不带所述目标物体标记的所述第一视频帧;
在丢失所述目标物体的时刻之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧;
从所述第三视频帧所对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧,并按照所述跟踪的顺序显示所述第四视频帧,其中,所述第四视频帧与所述第一视频帧一一对应。
2.根据权利要求1所述的方法,其特征在于,所述在丢失所述目标物体的时刻之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体的第三视频帧包括:
在丢失所述目标物体之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,按照预设步长,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧。
3.根据权利要求1或2所述的方法,其特征在于,所述在丢失所述目标物体的时刻之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体的第三视频帧包括:
在所述第一视频帧上查找与所述目标物体类型相同的所有第一物体;
在所述第一物体中查找与所述目标物体相同的第二物体,并将所述第二物体作为该第三视频帧上的所述目标物体。
4.根据权利要求1所述的方法,其特征在于,所述从所述第三视频帧对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧,并按照所述跟踪的顺序显示所述第四视频帧包括:
从所述第三视频帧对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧;
若所述第四视频帧与正在显示的所述第一视频帧为同一帧,开始按照所述跟踪的顺序显示所述第四视频帧。
5.一种目标跟踪装置,其特征在于,所述装置包括:
跟踪模块,用于根据确定的目标物体对获取到的第一视频帧按照获取的顺序进行跟踪,得到带有目标物体标记的第二视频帧,并按照所述跟踪的顺序显示所述第二视频帧,其中,所述第二视频帧与所述第一视频帧一一对应;
第一丢失处理模块,用于,若在所述跟踪过程中判定所述目标物体丢失,则在丢失所述目标物体的时刻之后,直接按照所述第一视频帧获取的顺序,显示不带所述目标物体标记的所述第一视频帧;
第二丢失处理模块,用于在丢失所述目标物体的时刻之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧;
跟踪恢复模块,从所述第三视频帧所对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧,并按照所述跟踪的顺序显示所述第四视频帧,其中,所述第四视频帧与所述第一视频帧一一对应。
6.根据权利要求5所述的装置,其特征在于,所述第二丢失处理模块还用于:
在丢失所述目标物体之后,在所述第一视频帧中按照所述第一视频帧获取的顺序,按照预设步长,对所述第一视频帧进行所述目标物体的查找,以查找得到一个带有所述目标物体标记的第三视频帧。
7.根据权利要求5或6所述的装置,其特征在于,所述第二丢失处理模块包括::
第一查找子模块,用于在所述第一视频帧上查找与所述目标物体类型相同的所有第一物体
第二查找子模块,用于在所述第一物体中查找与所述目标物体相同的第二物体,并将所述第二物体作为该第三视频帧上的所述目标物体。
8.根据权利要求5所述的装置,其特征在于,所述跟踪恢复模块包括:
跟踪子模块,用于从所述第三视频帧对应的所述第一视频帧开始,按照所述第一视频帧获取的顺序,恢复对所述第一视频帧的所述跟踪,得到带有所述目标物体标记的第四视频帧;
显示子模块,用于,若所述第四视频帧与正在显示的所述第一视频帧为同一帧,开始按照所述跟踪的顺序显示所述第四视频帧。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-4中任一项所述方法的步骤。
CN201910065028.6A 2019-01-23 2019-01-23 目标跟踪方法、装置、存储介质和电子设备 Active CN111476063B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910065028.6A CN111476063B (zh) 2019-01-23 2019-01-23 目标跟踪方法、装置、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910065028.6A CN111476063B (zh) 2019-01-23 2019-01-23 目标跟踪方法、装置、存储介质和电子设备

Publications (2)

Publication Number Publication Date
CN111476063A true CN111476063A (zh) 2020-07-31
CN111476063B CN111476063B (zh) 2023-04-25

Family

ID=71743354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910065028.6A Active CN111476063B (zh) 2019-01-23 2019-01-23 目标跟踪方法、装置、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN111476063B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298852A (zh) * 2021-07-27 2021-08-24 第六镜科技(北京)有限公司 目标跟踪方法、装置、电子设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018028533A1 (zh) * 2016-08-08 2018-02-15 腾讯科技(深圳)有限公司 媒体信息投放方法、终端、服务器、系统及存储介质
CN107784279A (zh) * 2017-10-18 2018-03-09 北京小米移动软件有限公司 目标跟踪方法及装置
CN108269269A (zh) * 2016-12-30 2018-07-10 纳恩博(北京)科技有限公司 目标跟踪方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018028533A1 (zh) * 2016-08-08 2018-02-15 腾讯科技(深圳)有限公司 媒体信息投放方法、终端、服务器、系统及存储介质
CN108269269A (zh) * 2016-12-30 2018-07-10 纳恩博(北京)科技有限公司 目标跟踪方法和装置
CN107784279A (zh) * 2017-10-18 2018-03-09 北京小米移动软件有限公司 目标跟踪方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘延飞;何燕辉;姜柯;张薇;: "采用异常值检测及重定位改进的KCF跟踪算法" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298852A (zh) * 2021-07-27 2021-08-24 第六镜科技(北京)有限公司 目标跟踪方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN111476063B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
US11538232B2 (en) Tracker assisted image capture
CN113810587B (zh) 一种图像处理方法及装置
US9633447B2 (en) Adaptable framework for cloud assisted augmented reality
EP3084577B1 (en) Selection and tracking of objects for display partitioning and clustering of video frames
US10620826B2 (en) Object selection based on region of interest fusion
JP7268076B2 (ja) 車両再識別の方法、装置、機器及び記憶媒体
JP2020513127A (ja) 環境センサデータを用いる効率的な画像解析
KR20180084085A (ko) 얼굴 위치 추적 방법, 장치 및 전자 디바이스
EP2998960B1 (en) Method and device for video browsing
CN110060276B (zh) 对象追踪方法、追踪处理方法、相应的装置、电子设备
KR102236616B1 (ko) 정보 처리 장치, 그의 제어 방법, 및 기억 매체
CN110706258B (zh) 对象追踪方法及装置
JP2019186955A (ja) 情報処理システム、情報処理方法及びプログラム
KR20140090078A (ko) 이미지 처리 방법 및 그 방법을 처리하는 전자 장치
US20180068451A1 (en) Systems and methods for creating a cinemagraph
US10432853B2 (en) Image processing for automatic detection of focus area
CN109671051B (zh) 图像质量检测模型训练方法及装置、电子设备和存储介质
CN103955494A (zh) 目标对象的搜索方法、装置及终端
WO2019084712A1 (zh) 一种图像处理方法、装置以及终端
CN111783639A (zh) 图像检测方法、装置、电子设备及可读存储介质
US9799376B2 (en) Method and device for video browsing based on keyframe
CN114390201A (zh) 对焦方法及其装置
WO2022099988A1 (zh) 目标跟踪方法及装置、电子设备和存储介质
CN111476063B (zh) 目标跟踪方法、装置、存储介质和电子设备
US20200134840A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant