CN115082516A - 一种目标跟踪方法、装置、设备及介质 - Google Patents
一种目标跟踪方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115082516A CN115082516A CN202110276360.4A CN202110276360A CN115082516A CN 115082516 A CN115082516 A CN 115082516A CN 202110276360 A CN202110276360 A CN 202110276360A CN 115082516 A CN115082516 A CN 115082516A
- Authority
- CN
- China
- Prior art keywords
- target
- position information
- video frame
- determining
- shooting position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 89
- 238000001514 detection method Methods 0.000 claims abstract description 25
- 238000013507 mapping Methods 0.000 claims abstract description 20
- 230000001360 synchronised effect Effects 0.000 claims abstract description 20
- 230000009466 transformation Effects 0.000 claims description 95
- 239000013598 vector Substances 0.000 claims description 38
- 238000006073 displacement reaction Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 12
- 230000001131 transforming effect Effects 0.000 claims description 4
- 238000011084 recovery Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 13
- 230000003287 optical effect Effects 0.000 description 13
- 230000008859 change Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20164—Salient point detection; Corner detection
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Abstract
本公开实施例涉及一种目标跟踪方法、装置、设备及介质,其中该方法包括:获取目标视频帧;通过对目标视频帧的特征检测确定目标区域在目标视频帧中的位置信息;如果目标区域在目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;根据目标拍摄位置信息以及相机投影算法,再次确定目标区域在目标视频帧中的位置信息。采用上述技术方案,在对视频帧的目标区域跟踪失败之后,可以根据同步定位与建图算法确定的拍摄位置来重新确定该视频帧中的目标区域的位置,实现跟踪恢复,在相机运动较快时也能实现目标跟踪,提升了跟踪鲁棒性。
Description
技术领域
本公开涉及视频处理技术领域,尤其涉及一种目标跟踪方法、装置、设备及介质。
背景技术
随着智能终端技术的不断发展,对视频内容识别和跟踪等需求日益增加。
目前,通过边缘特征可以对视频中各视频帧进行目标跟踪,但是上述方式在相机运动较快时会因检测不到目标而导致跟踪失败,鲁棒性较差。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种目标跟踪方法、装置、设备及介质。
本公开实施例提供了一种目标跟踪方法,所述方法包括:
获取目标视频帧;
通过对所述目标视频帧的特征检测确定目标区域在所述目标视频帧中的位置信息;
如果所述目标区域在所述目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;
根据所述目标拍摄位置信息以及相机投影算法,再次确定所述目标区域在所述目标视频帧中的位置信息。
本公开实施例还提供了一种目标跟踪装置,所述装置包括:
视频帧模块,用于获取目标视频帧;
第一位置模块,用于通过对所述目标视频帧的特征检测确定目标区域在所述目标视频帧中的位置信息;
拍摄位置模块,用于如果所述目标区域在所述目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;
第二位置模块,用于根据所述目标拍摄位置信息以及相机投影算法,再次确定所述目标区域在所述目标视频帧中的位置信息。
本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的目标跟踪方法。
本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的目标跟踪方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:本公开实施例提供的目标跟踪方案,获取目标视频帧;通过对目标视频帧的特征检测确定目标区域在目标视频帧中的位置信息;如果目标区域在目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;根据目标拍摄位置信息以及相机投影算法,再次确定目标区域在目标视频帧中的位置信息。采用上述技术方案,在对视频帧的目标区域跟踪失败之后,可以根据同步定位与建图算法确定的拍摄位置来重新确定该视频帧中的目标区域的位置,实现跟踪恢复,在相机运动较快时也能实现目标跟踪,提升了跟踪鲁棒性。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例提供的一种目标跟踪方法的流程示意图;
图2为本公开实施例提供的一种法向量投影的示意图;
图3为本公开实施例提供的另一种法向量投影的示意图;
图4为本公开实施例提供的另一种目标跟踪方法的流程示意图;
图5为本公开实施例提供的再一种目标跟踪方法的流程示意图;
图6为本公开实施例提供的一种目标跟踪装置的结构示意图;
图7为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1为本公开实施例提供的一种目标跟踪方法的流程示意图,该方法可以由目标跟踪装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法包括:
步骤101、获取目标视频帧。
视频帧也称图像帧,可以为组成视频的最小单位,也可以为单独的一个图像。其中,目标视频帧可以为任意一个需要进行检测和跟踪的图像帧,可以为采用具有视频采集功能的设备拍摄得到的视频或从互联网获取得到的视频中的一个视频帧,也可以为实时拍摄的一个图像,具体不限。
步骤102、通过对目标视频帧的特征检测确定目标区域在目标视频帧中的位置信息。
其中,目标区域是指目标视频帧中目标形状物体所在的区域,目标形状具体不限,例如目标形状可以包括椭圆形、圆形和矩形等,本公开实施例以目标区域为目标视频帧中椭圆形区域为例进行说明。目标区域的位置信息可以为能够表征目标区域在视频帧中位置的信息,具体可以包括目标区域在视频帧中的顶点坐标、中心点坐标等信息。
本公开实施例中,获取到目标视频帧之后,可以采用预设检测算法确定目标视频帧中目标区域的位置信息。上述预设检测算法可以为基于深度学习的检测算法或轮廓检测算法等,具体可以根据实际情况确定。例如目标区域为椭圆形区域时,预设检测算法可以为任意一种椭圆检测算法,确定视频帧中目标区域的位置信息的过程可以包括:采用椭圆检测算法对第一视频帧进行轮廓检测,然后对轮廓检测得到的椭圆轮廓进行拟合,得到椭圆形区域视频帧中的位置信息。
可选的,当目标视频帧为目标视频中的一个视频帧,确定目标视频帧中目标区域的位置信息,还可以包括:提取目标视频中的第一图像,并确定目标区域在第一图像中的第一位置信息;根据第一位置信息确定的初始特征点对目标视频帧进行光流跟踪,得到目标特征点;其中,目标视频帧为目标视频中第一图像的相邻视频帧;对目标特征点进行拟合,得到目标区域在目标视频帧中的位置信息。
目标视频帧可以为目标视频中的任意一个图像帧,第一图像可以为目标视频中与目标视频帧相邻的按照时间顺序的上一个图像帧。本公开实施例中,可以采用上述预设检测算法对第一图像进行目标区域的检测,确定目标区域在第一图像中的第一位置信息。根据第一位置信息确定初始特征点,包括:根据第一位置信息对第一图像中的目标区域的边缘轮廓进行采样,确定初始特征点。可选的,根据第一位置信息对第一图像中的目标区域的边缘轮廓进行采样,确定初始特征点,包括:当目标区域为椭圆形区域,根据第一位置信息将目标区域在极坐标下进行表示得到椭圆轮廓;其中,第一位置信息包括目标区域在第一图像中的顶点坐标和/或中心点坐标;按照预设极角间隔在椭圆轮廓中进行采样,得到初始特征点。之后,对上述采样得到的初始特征点采用光流跟踪算法进行跟踪,保留跟踪成功的特征点为目标特征点,剔除跟踪失败的特征点。对目标特征点进行拟合,得到目标区域在目标视频帧中的位置信息。
在一些实施例中,对目标特征点进行拟合,得到目标区域在目标视频帧中的位置信息,包括:如果目标特征点在目标区域的边缘轮廓上的覆盖范围大于或等于预设范围,则对目标特征点进行拟合,得到目标区域在目标视频帧中的位置信息。其中,预设范围是指预先设置的满足目标区域形状的范围,具体可以根据实际情况设置,例如预设范围可以为边缘轮廓的整个范围的3/4。具体的,确定目标特征点之后,可以判断目标点在目标区域的边缘轮廓上的覆盖范围是否大于或等于预设范围,若是,则采用拟合算法对目标特征点进行拟合,得到目标区域在在目标视频帧中的位置信息。如果目标特征点在目标区域的边缘轮廓上的覆盖范围小于预设范围,则可以直接采用预设检测算法对目标视频帧进行检测,确定目标区域在目标视频帧中的位置信息。
在一些实施例中,在确定目标区域在第一图像中的第一位置信息之后,还包括:确定目标视频帧相对于第一图像的变化参数;根据第一位置信息确定的初始特征点对目标视频帧进行光流跟踪,得到目标特征点,包括:如果基于变化参数确定目标不满足复用条件,则执行根据第一位置信息确定的初始特征点对目标视频帧进行光流跟踪,得到目标特征点。
其中,变换参数是指表征目标视频帧相对于第一图像的变化情况的参数。可选的,确定目标视频帧相对于第一图像的变化参数,可以包括:提取第一图像中的第一特征点;根据第一特征点对目标视频帧进行光流跟踪,确定第二特征点,将第二特征点与第一特征点之间的移动距离确定为变化参数。第一特征点可以为采用FAST角点检测算法对第一图像检测得到的角点。复用条件是指目标视频帧对目标区域的位置确定能否复用第一图像的具体判断条件。其中,变化阈值是指预先设置的阈值,可以根据实际情况设置,例如通过为目标视频帧中特征点相对于第一视频中对应的特征点的移动信息表征变化参数时,变换阈值可以为距离阈值设置为0.8。
具体的,确定目标视频帧相对于第一图像的变化参数之后,可以将变化参数与变化阈值进行比对,如果确定变化参数大于变化阈值,则可以确定目标视频帧不满足复用条件,需要重新跟踪,执行根据第一位置信息确定的初始特征点对目标视频帧进行光流跟踪,得到目标特征点;否则确定目标视频帧满足复用条件,则将第一位置信息确定为目标区域在目标视频帧中的位置信息。
在上述方案中,在对视频的一个图像帧的目标区域检测的基础上,通过特征点跟踪和拟合即可实现更加准确地确定目标视频帧中目标区域的位置,提升了对目标视频帧中目标区域位置确定的计算效率。并且,通过对相邻两个视频帧增加复用条件的判断,当视频中相邻两个视频帧的变化较大时,采用上述特征点跟踪和拟合实现目标区域的位置的确定;当视频中相邻两个视频帧的变化或差异较小时,则说明两个视频帧相似性较高,此时下一个视频帧可以直接复用上一个视频帧的目标区域的位置信息,不用重新进行检测,节省了工作量,提高了计算效率。
步骤103、如果目标区域在目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息。
本公开实施例中,在相机运动较快时可能在目标视频帧中未能成功确定目标区域的位置信息,则确定目标拍摄位置信息。目标拍摄位置信息是指拍摄位置在世界坐标系下的坐标。
本公开实施例中,确定目标拍摄位置信息,可以包括:通过同步定位与建图算法确定第一坐标系下的初始拍摄位置信息;确定第一坐标系与相机投影算法对应的第二坐标系的目标变换关系;根据初始拍摄位置信息以及目标变换关系,确定目标拍摄位置信息。
其中,同步定位与建图(Simultaneous Localization And Mapping,SLAM)算法,SLAM主要用于解决搭载特定传感器的设备在未知环境中运行时定位导航与地图构建的问题,如果传感器为相机时,可以确定相机的位置,也即拍摄位置。本公开实施例中通过SLAM算法来确定拍摄位置在第一坐标系下的初始拍摄位置信息。相机投影算法可以为相机的小孔投影模型的算法。
可选的,确定第一坐标系与相机投影算法对应的第二坐标系的目标变换关系,可以包括:通过同步定位与建图算法以及相机投影算法分别确定已检视频帧的第一拍摄位置信息和第二拍摄位置信息,其中,已检视频帧为对目标区域跟踪成功的视频帧;根据已检视频帧的第一拍摄位置信息和第二拍摄位置信息,确定目标变换关系。
已检视频帧是指跟踪成功的视频帧,也即成功确定目标区域的位置的视频帧。其中,已检视频帧的数量为一个或多个,当已检视频帧的数量为多个时,目标变换关系为各已检视频帧对应的变换关系的平均值,目标变换关系包括变换尺度和变换位移。目标变换关系是指同步定位与建图算法对应的第一坐标系与相机投影算法对应的第二坐标系之间的变换关系。目标变换关系可以包括两个坐标系之间在旋转、尺度和位移上的变换,由于两个坐标系的旋转是相同的,因此不需要进行旋转上的变换,也即目标变换关系包括变换尺度和变换位移。由当已检视频帧的数量为多个,针对每个已检视频帧均可以计算得到一个变换关系,因此目标变换关系可以为各已检视频帧对应的变换关系的平均值。
具体的,对于已检视频帧可以通过同步定位与建图算法确定第一拍摄位置信息,并通过相机投影算法确定第二拍摄位置信息,第一拍摄位置信息和第二拍摄位置信息为拍摄位置在上述第一坐标系和第二坐标系的位置信息,之后可以根据上述第一拍摄位置信息和第二拍摄位置信息采用最小二乘法确定上述第一坐标系和第二坐标系的目标变换关系。示例性的,第一拍摄位置信息可以采用slam_w_T_c表示,第二拍摄位置信息可以采用ellipse_w_T_c表示,目标变换关系表示为slam_w_T_c=ellipse_w_T_c*align_scale+align_translation,其中align_scale表示两个坐标系的变换尺度,align_translation表示两个坐标系的变换位移。
可以理解的是,上述第一坐标系可以为同步定位与建图算法对应的第一世界坐标系,上述第二坐标系可以为相机投影算法对应的第二世界坐标系或以目标形状物体为原点的空间坐标系,上述第一世界坐标系和第二世界坐标系的原点以及坐标轴等不同,也需要变换。
可选的,根据初始拍摄位置信息以及目标变换关系,确定目标拍摄位置信息,包括:基于目标变换关系将初始拍摄位置信息从第一坐标系的信息变换为第二坐标系的信息,得到目标拍摄位置信息。确定上述目标变换关系之后,可以将初始拍摄位置信息通过该目标变换关系从同步定位与建图算法对应的第一坐标系的信息变换为相机投影算法对应的第二坐标系的信息,之后可以通过变换坐标系之后的目标拍摄位置信息进行后续确定目标区域在目标视频帧的位置信息的步骤。
步骤104、根据目标拍摄位置信息以及相机投影算法,再次确定目标区域在目标视频帧中的位置信息。
本公开实施例中,根据目标拍摄位置信息以及相机投影算法,再次确定目标区域在目标视频帧中的位置信息,可以包括:根据目标拍摄位置信息以及目标区域对应的目标形状物体的位置信息进行位置求解,确定拍摄位置到目标形状物体的位移信息;其中,目标区域为目标视频帧中目标性形状物体所在区域;将拍摄位置到目标形状物体的位移信息输入相机投影算法的投影方程中,确定目标区域在目标视频帧中的位置信息。
上述目标形状物体的位置信息可以为预先设置的一个固定值,为已知量,例如世界坐标系的原点可以设置在目标形状物体所在的位置,该位置信息的坐标为(0,0,0)。根据目标形状物体的位置、目标拍摄位置以及变换方程,即可确定目标拍摄位置到目标形状物体的位移。上述变换方程可以表示为W10=W20+W12,其中,W10表示世界坐标系下拍摄位置信息,W20表示世界坐标系下目标形状物体的位置信息,W12表示世界坐标系下目标拍摄位置到目标区域的位移信息。上述W10、W20和W12三个均为世界坐标系下的向量,具有方向和大小。在该步骤中,可以将上述变换坐标系之后的目标拍摄位置信息W10和目标形状物体的位置信息W12输入变换方程中,得到目标拍摄位置到目标形状物体的位移信息W12。
投影方程中目标区域的位置信息与拍摄装置的内部参数、拍摄位置所在坐标系到世界坐标系的旋转矩阵、拍摄位置所在坐标系下世界坐标系的原点的位置信息相关。投影方程可以表示为p=π[K(R12*W20+T)],其中,π表示系数,K表示拍摄装置的内部参数,具体可以包括拍摄位置焦距、畸变参数等拍摄装置内部的一些参数,R12表示拍摄位置所在坐标系到世界坐标系的旋转矩阵,p表示目标区域的位置信息,T表示拍摄位置所在坐标系下世界坐标系的原点的位置信息。由上述投影方程p=π[K(R12*W20+T)]变换得到W12=-1*ratio*R21*K-1*p,R21表示从拍摄位置所在坐标系下到世界坐标系的旋转矩阵的逆矩阵,ratio=1/π,T为三维坐标,投影方程中等号号右侧的值也为三维坐标,p为二维坐标,ratio可以为三维坐标中最后一维的值。将上述世界坐标系下目标拍摄位置到目标形状物体的位移信息W12=-1*ratio*R21*K-1*p中,可以确定目标区域在目标视频帧中的位置信息p。
本公开实施例提供的目标跟踪方案,获取目标视频帧;通过对目标视频帧的特征检测确定目标区域在目标视频帧中的位置信息;如果目标区域在目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;根据目标拍摄位置信息以及相机投影算法,再次确定目标区域在目标视频帧中的位置信息。采用上述技术方案,在对视频帧的目标区域跟踪失败之后,可以根据同步定位与建图算法确定的拍摄位置来重新确定该视频帧中的目标区域的位置,实现跟踪恢复,在相机运动较快时也能实现目标跟踪,提升了跟踪鲁棒性。
在一些实施例中,目标跟踪方法还可以包括:确定目标区域对应的目标形状物体所在平面的初始法向量,并将初始法向量在水平面或竖平面上的投影确定为目标法向量。
其中,初始法向量是指空间中目标形状物体所在平面的法向量,目标法向量是指优化后的法向量。具体的,确定目标区域在目标视频帧以及相邻视频帧中的位置信息之后,通过对两个视频帧之间的单应矩阵进行分解可以确定初始法向量,上述单应矩阵通过目标区域上采样的点计算得到,分解方法可以采用奇异值分解(Singular ValueDecomposition,SVD)方式。确定初始法向量之后,可以将初始法向量在水平面或竖平面上的投影确定为目标法向量。示例性的,初始法向量为(0.05,0.03,0.994),目标法向量可以为(0,0,1)。
示例性的,图2为本公开实施例提供的一种法向量投影的示意图,图3为本公开实施例提供的另一种法向量投影的示意图,图2和图3分布表征了初始法向量在竖直方向和水平方向投影之后的目标法向量。
上述方案中,假设物体仅仅位于水平面或竖平面上,通过对初始法向量的投影可以得到优化后的目标法向量,避免了因计算法向量时假设相机为正交投影模型造成的误差,提高了空间中物体所在平面法向的精度,进而提高了基于法向进行的特效展示的准确性
图4为本公开实施例提供的另一种目标跟踪方法的流程示意图,本实施例在上述实施例的基础上,进一步优化了上述目标跟踪方法。
如图4所示,该方法包括:
步骤201、获取目标视频帧。
步骤202、通过对目标视频帧的特征检测确定目标区域在目标视频帧中的位置信息。
步骤203、如果目标区域在目标视频帧中的位置信息确定失败,则通过同步定位与建图算法确定第一坐标系下的初始拍摄位置信息。
步骤204、确定第一坐标系与相机投影算法对应的第二坐标系的目标变换关系。
可选的,确定第一坐标系与相机投影算法对应的第二坐标系的目标变换关系,包括:通过同步定位与建图算法以及相机投影算法分别确定已检视频帧的第一拍摄位置信息和第二拍摄位置信息,其中,已检视频帧为对目标区域跟踪成功的视频帧;根据已检视频帧的第一拍摄位置信息和第二拍摄位置信息,确定目标变换关系。
其中,已检视频帧的数量为一个或多个,当已检视频帧的数量为多个时,目标变换关系为各已检视频帧对应的变换关系的平均值,目标变换关系包括变换尺度和变换位移。
步骤205、根据初始拍摄位置信息以及目标变换关系,确定目标拍摄位置信息。
可选的,根据初始拍摄位置信息以及目标变换关系,确定目标拍摄位置信息,包括:基于目标变换关系将初始拍摄位置信息从第一坐标系的信息变换为第二坐标系的信息,得到目标拍摄位置信息。
步骤206、根据目标拍摄位置信息以及相机投影算法,再次确定目标区域在目标视频帧中的位置信息。
可选的,根据目标拍摄位置信息以及相机投影算法,再次确定目标区域在目标视频帧中的位置信息,包括:根据目标拍摄位置信息以及目标区域对应的目标形状物体的位置信息进行位置求解,确定拍摄位置到目标形状物体的位移信息;其中,目标区域为目标视频帧中目标性形状物体所在区域;将拍摄位置到目标形状物体的位移信息输入相机投影算法的投影方程中,确定目标区域在目标视频帧中的位置信息。
在一些实施例中,目标跟踪方法还可以包括:确定目标区域对应的目标形状物体所在平面的初始法向量,并将初始法向量在水平面或竖平面上的投影确定为目标法向量。
接下来通过一个具体的示例对本公开实施例中的目标跟踪方法进行进一步说明。示例性的,图5为本公开实施例提供的再一种目标跟踪方法的流程示意图,以目标区域为椭圆形区域,目标形状物体为圆形物体为例,具体过程可以包括:1.初始化:在目标视频的的前若干视频帧,使用SLAM算法完成对拍摄位置在第一坐标系下的计算,采用slam_w_T_c表示,使用相机投影算法根据已知的椭圆形区域的位置完成在第二坐标系下对拍摄位置的计算,采用ellipse_w_T_c表示,上述第一坐标系为第一世界坐标系,上述第二坐标系为第二世界坐标系或圆形物体坐标系。2.坐标系对齐。使用最小二乘法计算第一坐标系和第二坐标系之间已知旋转的相似变换关系,相机为智能终端中设置的图像采集模块时,旋转可以通过智能终端的惯性测量单应(Inertial Measurement Unit,IMU)获得,两个坐标系的旋转相同,因此相似变换关系包括相似变换所需的位移和尺度,从而完成两个坐标系之间的坐标系对齐(alignment)。3.跟踪:在目标视频中当前帧因为相机运动较快导致图像模糊检测不到椭圆形区域时,使用SLAM算法确定的拍摄位置和两个坐标系之间的目标变换关系,确定在相机投影算法对应的第二坐标系下的拍摄位置。采用SLAM算法确定的拍摄位置可以采用slam_w_T_c表示,相机投影算法对应的拍摄位置可以采用ellipse_w_T_c表示,目标变换关系表示为slam_w_T_c=ellipse_w_T_c*align_scale+align_translation,其中align_scale表示两个坐标系的变换尺度,align_translation表示两个坐标系的变换位移。之后根据第二坐标系下的拍摄位置、相机投影算法对应的投影方程和变换方程,确定当前帧中椭圆形区域的位置。
进一步的,上述相机投影算法确定的第二坐标系下的拍摄位置在一些情况下存在不准确的问题,导致第一坐标系和第二坐标系的变换关系的误差可能较大。针对上述问题,在整个跟踪过程中,可以设置两个队列,分别保存最近的设定数量的slam_w_T_c和ellipse_w_T_c,设定数量可以为10。当前帧因为相机运动较快导致图像模糊检测不到椭圆时,基于保存的若干个slam_w_T_c和ellipse_w_T_c进行两个坐标系的变换关系的确定,将多个变换关系的平均值确定为最终的目标变换关系。从而根据SLAM算法确定的拍摄位置和目标变换关系确定在相机投影算法对应的第二坐标系下的拍摄位置,之后根据二坐标系下的拍摄位置确定当前帧中椭圆形区域的位置。
本公开实施例提供的目标跟踪方案,获取目标视频帧;通过对目标视频帧的特征检测确定目标区域在目标视频帧中的位置信息;如果目标区域在目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;根据目标拍摄位置信息以及相机投影算法,再次确定目标区域在目标视频帧中的位置信息。采用上述技术方案,在对视频帧的目标区域跟踪失败之后,可以根据同步定位与建图算法确定的拍摄位置来重新确定该视频帧中的目标区域的位置,实现跟踪恢复,在相机运动较快时也能实现目标跟踪,提升了跟踪鲁棒性。
图6为本公开实施例提供的一种目标跟踪装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图6所示,该装置包括:
视频帧模块301,用于获取目标视频帧;
第一位置模块302,用于通过对所述目标视频帧的特征检测确定目标区域在所述目标视频帧中的位置信息;
拍摄位置模块303,用于如果所述目标区域在所述目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;
第二位置模块304,用于根据所述目标拍摄位置信息以及相机投影算法,再次确定所述目标区域在所述目标视频帧中的位置信息。
可选的,所述拍摄位置模块303用于:
通过同步定位与建图算法确定第一坐标系下的初始拍摄位置信息;
确定所述第一坐标系与所述相机投影算法对应的第二坐标系的目标变换关系;
根据所述初始拍摄位置信息以及所述目标变换关系,确定所述目标拍摄位置信息。
可选的,所述拍摄位置模块303用于:
通过所述同步定位与建图算法以及所述相机投影算法分别确定已检视频帧的第一拍摄位置信息和第二拍摄位置信息,其中,所述已检视频帧为对所述目标区域跟踪成功的视频帧;
根据所述已检视频帧的第一拍摄位置信息和第二拍摄位置信息,确定所述目标变换关系。
可选的,所述已检视频帧的数量为一个或多个,当所述已检视频帧的数量为多个时,所述目标变换关系为各所述已检视频帧对应的变换关系的平均值,所述目标变换关系包括变换尺度和变换位移。
可选的,所述拍摄位置模块303用于:
基于所述目标变换关系将所述初始拍摄位置信息从所述第一坐标系的信息变换为所述第二坐标系的信息,得到所述目标拍摄位置信息。
可选的,所述第二位置模块304用于:
根据所述目标拍摄位置信息以及所述目标区域对应的目标形状物体的位置信息进行位置求解,确定拍摄位置到所述目标形状物体的位移信息;其中,目标区域为所述目标视频帧中所述目标性形状物体所在区域;
将所述拍摄位置到所述目标形状物体的位移信息输入所述相机投影算法的投影方程中,确定所述目标区域在所述目标视频帧中的位置信息。
可选的,所述装置还包括法向模块,用于:
确定所述目标区域对应的目标形状物体所在平面的初始法向量,并将所述初始法向量在水平面或竖平面上的投影确定为目标法向量。
本公开实施例所提供的目标跟踪装置可执行本公开任意实施例所提供的目标跟踪方法,具备执行方法相应的功能模块和有益效果。
本公开实施例还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本公开任意实施例所提供的目标跟踪方法。
图7为本公开实施例提供的一种电子设备的结构示意图。下面具体参考图7,其示出了适于用来实现本公开实施例中的电子设备400的结构示意图。本公开实施例中的电子设备400可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的目标跟踪方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取目标视频帧;通过对所述目标视频帧的特征检测确定目标区域在所述目标视频帧中的位置信息;如果所述目标区域在所述目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;根据所述目标拍摄位置信息以及相机投影算法,再次确定所述目标区域在所述目标视频帧中的位置信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,本公开提供了一种目标跟踪方法,包括:
获取目标视频帧;
通过对所述目标视频帧的特征检测确定目标区域在所述目标视频帧中的位置信息;
如果所述目标区域在所述目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;
根据所述目标拍摄位置信息以及相机投影算法,再次确定所述目标区域在所述目标视频帧中的位置信息。
根据本公开的一个或多个实施例,本公开提供的目标跟踪方法中,所述确定目标拍摄位置信息,包括:
通过同步定位与建图算法确定第一坐标系下的初始拍摄位置信息;
确定所述第一坐标系与所述相机投影算法对应的第二坐标系的目标变换关系;
根据所述初始拍摄位置信息以及所述目标变换关系,确定所述目标拍摄位置信息。
根据本公开的一个或多个实施例,本公开提供的目标跟踪方法中,确定所述第一坐标系与所述相机投影算法对应的第二坐标系的目标变换关系,包括:
通过所述同步定位与建图算法以及所述相机投影算法分别确定已检视频帧的第一拍摄位置信息和第二拍摄位置信息,其中,所述已检视频帧为对所述目标区域跟踪成功的视频帧;
根据所述已检视频帧的第一拍摄位置信息和第二拍摄位置信息,确定所述目标变换关系。
根据本公开的一个或多个实施例,本公开提供的目标跟踪方法中,所述已检视频帧的数量为一个或多个,当所述已检视频帧的数量为多个时,所述目标变换关系为各所述已检视频帧对应的变换关系的平均值,所述目标变换关系包括变换尺度和变换位移。
根据本公开的一个或多个实施例,本公开提供的目标跟踪方法中,根据所述初始拍摄位置信息以及所述目标变换关系,确定所述目标拍摄位置信息,包括:
基于所述目标变换关系将所述初始拍摄位置信息从所述第一坐标系的信息变换为所述第二坐标系的信息,得到所述目标拍摄位置信息。
根据本公开的一个或多个实施例,本公开提供的目标跟踪方法中,根据所述目标拍摄位置信息以及相机投影算法,再次确定所述目标区域在所述目标视频帧中的位置信息,包括:
根据所述目标拍摄位置信息以及所述目标区域对应的目标形状物体的位置信息进行位置求解,确定拍摄位置到所述目标形状物体的位移信息;其中,目标区域为所述目标视频帧中所述目标性形状物体所在区域;
将所述拍摄位置到所述目标形状物体的位移信息输入所述相机投影算法的投影方程中,确定所述目标区域在所述目标视频帧中的位置信息。
根据本公开的一个或多个实施例,本公开提供的目标跟踪方法中,还包括:
确定所述目标区域对应的目标形状物体所在平面的初始法向量,并将所述初始法向量在水平面或竖平面上的投影确定为目标法向量。
根据本公开的一个或多个实施例,本公开提供了一种目标跟踪装置,包括:
视频帧模块,用于获取目标视频帧;
第一位置模块,用于通过对所述目标视频帧的特征检测确定目标区域在所述目标视频帧中的位置信息;
拍摄位置模块,用于如果所述目标区域在所述目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;
第二位置模块,用于根据所述目标拍摄位置信息以及相机投影算法,再次确定所述目标区域在所述目标视频帧中的位置信息。
根据本公开的一个或多个实施例,本公开提供的目标跟踪装置中,所述拍摄位置模块用于:
通过同步定位与建图算法确定第一坐标系下的初始拍摄位置信息;
确定所述第一坐标系与所述相机投影算法对应的第二坐标系的目标变换关系;
根据所述初始拍摄位置信息以及所述目标变换关系,确定所述目标拍摄位置信息。
根据本公开的一个或多个实施例,本公开提供的目标跟踪装置中,所述拍摄位置模块用于:
通过所述同步定位与建图算法以及所述相机投影算法分别确定已检视频帧的第一拍摄位置信息和第二拍摄位置信息,其中,所述已检视频帧为对所述目标区域跟踪成功的视频帧;
根据所述已检视频帧的第一拍摄位置信息和第二拍摄位置信息,确定所述目标变换关系。
根据本公开的一个或多个实施例,本公开提供的目标跟踪装置中,所述已检视频帧的数量为一个或多个,当所述已检视频帧的数量为多个时,所述目标变换关系为各所述已检视频帧对应的变换关系的平均值,所述目标变换关系包括变换尺度和变换位移。
根据本公开的一个或多个实施例,本公开提供的目标跟踪装置中,所述拍摄位置模块用于:
基于所述目标变换关系将所述初始拍摄位置信息从所述第一坐标系的信息变换为所述第二坐标系的信息,得到所述目标拍摄位置信息。
根据本公开的一个或多个实施例,本公开提供的目标跟踪装置中,所述第二位置模块用于:
根据所述目标拍摄位置信息以及所述目标区域对应的目标形状物体的位置信息进行位置求解,确定拍摄位置到所述目标形状物体的位移信息;其中,目标区域为所述目标视频帧中所述目标性形状物体所在区域;
将所述拍摄位置到所述目标形状物体的位移信息输入所述相机投影算法的投影方程中,确定所述目标区域在所述目标视频帧中的位置信息。
根据本公开的一个或多个实施例,本公开提供的目标跟踪装置中,所述装置还包括法向模块,用于:
确定所述目标区域对应的目标形状物体所在平面的初始法向量,并将所述初始法向量在水平面或竖平面上的投影确定为目标法向量。
根据本公开的一个或多个实施例,本公开提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开提供的任一所述的目标跟踪方法。
根据本公开的一个或多个实施例,本公开提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开提供的任一所述的目标跟踪方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
Claims (10)
1.一种目标跟踪方法,其特征在于,包括:
获取目标视频帧;
通过对所述目标视频帧的特征检测确定目标区域在所述目标视频帧中的位置信息;
如果所述目标区域在所述目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;
根据所述目标拍摄位置信息以及相机投影算法,再次确定所述目标区域在所述目标视频帧中的位置信息。
2.根据权利要求1所述的方法,其特征在于,所述确定目标拍摄位置信息,包括:
通过同步定位与建图算法确定第一坐标系下的初始拍摄位置信息;
确定所述第一坐标系与所述相机投影算法对应的第二坐标系的目标变换关系;
根据所述初始拍摄位置信息以及所述目标变换关系,确定所述目标拍摄位置信息。
3.根据权利要求2所述的方法,其特征在于,确定所述第一坐标系与所述相机投影算法对应的第二坐标系的目标变换关系,包括:
通过所述同步定位与建图算法以及所述相机投影算法分别确定已检视频帧的第一拍摄位置信息和第二拍摄位置信息,其中,所述已检视频帧为对所述目标区域跟踪成功的视频帧;
根据所述已检视频帧的第一拍摄位置信息和第二拍摄位置信息,确定所述目标变换关系。
4.根据权利要求3所述的方法,其特征在于,所述已检视频帧的数量为一个或多个,当所述已检视频帧的数量为多个时,所述目标变换关系为各所述已检视频帧对应的变换关系的平均值,所述目标变换关系包括变换尺度和变换位移。
5.根据权利要求2所述的方法,其特征在于,根据所述初始拍摄位置信息以及所述目标变换关系,确定所述目标拍摄位置信息,包括:
基于所述目标变换关系将所述初始拍摄位置信息从所述第一坐标系的信息变换为所述第二坐标系的信息,得到所述目标拍摄位置信息。
6.根据权利要求1所述的方法,其特征在于,根据所述目标拍摄位置信息以及相机投影算法,再次确定所述目标区域在所述目标视频帧中的位置信息,包括:
根据所述目标拍摄位置信息以及所述目标区域对应的目标形状物体的位置信息进行位置求解,确定拍摄位置到所述目标形状物体的位移信息;其中,目标区域为所述目标视频帧中所述目标性形状物体所在区域;
将所述拍摄位置到所述目标形状物体的位移信息输入所述相机投影算法的投影方程中,确定所述目标区域在所述目标视频帧中的位置信息。
7.根据权利要求1所述的方法,其特征在于,还包括:
确定所述目标区域对应的目标形状物体所在平面的初始法向量,并将所述初始法向量在水平面或竖平面上的投影确定为目标法向量。
8.一种目标跟踪装置,其特征在于,包括:
视频帧模块,用于获取目标视频帧;
第一位置模块,用于通过对所述目标视频帧的特征检测确定目标区域在所述目标视频帧中的位置信息;
拍摄位置模块,用于如果所述目标区域在所述目标视频帧中的位置信息确定失败,则确定目标拍摄位置信息;
第二位置模块,用于根据所述目标拍摄位置信息以及相机投影算法,再次确定所述目标区域在所述目标视频帧中的位置信息。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-7中任一所述的目标跟踪方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7中任一所述的目标跟踪方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110276360.4A CN115082516A (zh) | 2021-03-15 | 2021-03-15 | 一种目标跟踪方法、装置、设备及介质 |
PCT/CN2022/080985 WO2022194158A1 (zh) | 2021-03-15 | 2022-03-15 | 一种目标跟踪方法、装置、设备及介质 |
US18/468,647 US20240005552A1 (en) | 2021-03-15 | 2023-09-15 | Target tracking method and apparatus, device, and medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110276360.4A CN115082516A (zh) | 2021-03-15 | 2021-03-15 | 一种目标跟踪方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115082516A true CN115082516A (zh) | 2022-09-20 |
Family
ID=83240411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110276360.4A Pending CN115082516A (zh) | 2021-03-15 | 2021-03-15 | 一种目标跟踪方法、装置、设备及介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115082516A (zh) |
WO (1) | WO2022194158A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117218212B (zh) * | 2023-11-09 | 2024-02-13 | 杭州巨岩欣成科技有限公司 | 相机标定自适应调整方法、装置、计算机设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040039080A (ko) * | 2002-10-31 | 2004-05-10 | 전자부품연구원 | 영상 처리를 이용한 다채널 자동 트랙킹 및 자동 줌 방법 |
CN106713747A (zh) * | 2016-11-29 | 2017-05-24 | 维沃移动通信有限公司 | 一种对焦方法及移动终端 |
CN107993256A (zh) * | 2017-11-27 | 2018-05-04 | 广东工业大学 | 动态目标跟踪方法、装置及存储介质 |
CN108848304A (zh) * | 2018-05-30 | 2018-11-20 | 深圳岚锋创视网络科技有限公司 | 一种全景视频的目标跟踪方法、装置和全景相机 |
CN109598744A (zh) * | 2018-11-29 | 2019-04-09 | 广州市百果园信息技术有限公司 | 一种视频跟踪的方法、装置、设备和存储介质 |
CN109887003A (zh) * | 2019-01-23 | 2019-06-14 | 亮风台(上海)信息科技有限公司 | 一种用于进行三维跟踪初始化的方法与设备 |
CN110335292A (zh) * | 2019-07-09 | 2019-10-15 | 北京猫眼视觉科技有限公司 | 一种基于图片跟踪实现模拟场景跟踪的方法及系统 |
US20200302615A1 (en) * | 2018-04-27 | 2020-09-24 | Tencent Technology (Shenzhen) Company Limited | Repositioning method and apparatus in camera pose tracking process, device, and storage medium |
CN111709973A (zh) * | 2020-06-16 | 2020-09-25 | 北京百度网讯科技有限公司 | 目标跟踪方法、装置、设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3182373B1 (en) * | 2015-12-17 | 2019-06-19 | STMicroelectronics S.A. | Improvements in determination of an ego-motion of a video apparatus in a slam type algorithm |
CN107404615B (zh) * | 2017-06-29 | 2020-08-25 | 联想(北京)有限公司 | 图像录制方法及电子设备 |
CN109211241B (zh) * | 2018-09-08 | 2022-04-29 | 天津大学 | 基于视觉slam的无人机自主定位方法 |
CN111612827B (zh) * | 2020-05-21 | 2023-12-15 | 广州海格通信集团股份有限公司 | 基于多摄像头的目标位置确定方法、装置和计算机设备 |
-
2021
- 2021-03-15 CN CN202110276360.4A patent/CN115082516A/zh active Pending
-
2022
- 2022-03-15 WO PCT/CN2022/080985 patent/WO2022194158A1/zh active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040039080A (ko) * | 2002-10-31 | 2004-05-10 | 전자부품연구원 | 영상 처리를 이용한 다채널 자동 트랙킹 및 자동 줌 방법 |
CN106713747A (zh) * | 2016-11-29 | 2017-05-24 | 维沃移动通信有限公司 | 一种对焦方法及移动终端 |
CN107993256A (zh) * | 2017-11-27 | 2018-05-04 | 广东工业大学 | 动态目标跟踪方法、装置及存储介质 |
US20200302615A1 (en) * | 2018-04-27 | 2020-09-24 | Tencent Technology (Shenzhen) Company Limited | Repositioning method and apparatus in camera pose tracking process, device, and storage medium |
CN108848304A (zh) * | 2018-05-30 | 2018-11-20 | 深圳岚锋创视网络科技有限公司 | 一种全景视频的目标跟踪方法、装置和全景相机 |
CN109598744A (zh) * | 2018-11-29 | 2019-04-09 | 广州市百果园信息技术有限公司 | 一种视频跟踪的方法、装置、设备和存储介质 |
CN109887003A (zh) * | 2019-01-23 | 2019-06-14 | 亮风台(上海)信息科技有限公司 | 一种用于进行三维跟踪初始化的方法与设备 |
CN110335292A (zh) * | 2019-07-09 | 2019-10-15 | 北京猫眼视觉科技有限公司 | 一种基于图片跟踪实现模拟场景跟踪的方法及系统 |
CN111709973A (zh) * | 2020-06-16 | 2020-09-25 | 北京百度网讯科技有限公司 | 目标跟踪方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
邓颖娜;朱虹;李刚;黎璐;钱慧芳;: "基于场景模型的多摄像机目标跟踪算法", 计算机工程与应用, no. 05, 11 February 2008 (2008-02-11) * |
Also Published As
Publication number | Publication date |
---|---|
WO2022194158A1 (zh) | 2022-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111127563A (zh) | 联合标定方法、装置、电子设备及存储介质 | |
CN111292420B (zh) | 用于构建地图的方法和装置 | |
CN111369427B (zh) | 图像处理方法、装置、可读介质和电子设备 | |
CN109754464B (zh) | 用于生成信息的方法和装置 | |
CN111967515B (zh) | 图像信息提取方法、训练方法及装置、介质和电子设备 | |
CN110728622B (zh) | 鱼眼图像处理方法、装置、电子设备及计算机可读介质 | |
CN115115593B (zh) | 一种扫描处理方法、装置、电子设备及存储介质 | |
CN111325792B (zh) | 用于确定相机位姿的方法、装置、设备和介质 | |
CN114399588B (zh) | 三维车道线生成方法、装置、电子设备和计算机可读介质 | |
CN112818898B (zh) | 模型训练方法、装置和电子设备 | |
CN116182878B (zh) | 道路曲面信息生成方法、装置、设备和计算机可读介质 | |
CN112116655A (zh) | 目标对象的图像的位置信息确定方法和装置 | |
CN112330788A (zh) | 图像处理方法、装置、可读介质及电子设备 | |
CN112801907A (zh) | 深度图像的处理方法、装置、设备和存储介质 | |
CN114863071A (zh) | 目标对象标注方法、装置、存储介质及电子设备 | |
CN110717467A (zh) | 头部姿势的估计方法、装置、设备及存储介质 | |
CN114529452A (zh) | 用于显示图像的方法、装置和电子设备 | |
CN115082516A (zh) | 一种目标跟踪方法、装置、设备及介质 | |
CN111586295B (zh) | 图像生成方法、装置和电子设备 | |
CN115409696A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN115086538B (zh) | 一种拍摄位置确定方法、装置、设备及介质 | |
CN115086541B (zh) | 一种拍摄位置确定方法、装置、设备及介质 | |
CN112270242A (zh) | 轨迹的显示方法、装置、可读介质和电子设备 | |
CN111862351A (zh) | 定位模型优化方法、定位方法和定位设备 | |
CN112880675B (zh) | 用于视觉定位的位姿平滑方法、装置、终端和移动机器人 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |