CN114219831A - 目标跟踪方法、装置、终端设备及计算机可读存储介质 - Google Patents
目标跟踪方法、装置、终端设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN114219831A CN114219831A CN202111338801.5A CN202111338801A CN114219831A CN 114219831 A CN114219831 A CN 114219831A CN 202111338801 A CN202111338801 A CN 202111338801A CN 114219831 A CN114219831 A CN 114219831A
- Authority
- CN
- China
- Prior art keywords
- frame
- data
- target object
- target
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
- G06T2207/20104—Interactive definition of region of interest [ROI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30241—Trajectory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请适用于图像处理技术领域,提供了一种目标跟踪方法、装置、终端设备及计算机可读存储介质,所述方法包括:通过预设模型的第一特征模块分别获取初始帧中目标对象的第一特征数据、和当前帧中目标对象的第二特征数据;通过预设模型的第二特征模块分别获取第一特征数据中的第三特征数据、和第二特征数据中的第四特征数据;根据第三特征数据和第四特征数据检测当前帧中目标对象的中心位置点;生成中心位置点对应的目标对象的多个候选检测框;根据第一特征数据和第二特征数据从多个候选检测框中确定出当前帧中目标对象的目标检测框。通过上述方法,可以有效减少目标跟踪的算法复杂度,进而提高目标跟踪的效率。
Description
技术领域
本申请属于图像处理技术领域,尤其涉及一种目标跟踪方法、装置、终端设备及计算机可读存储介质。
背景技术
目标跟踪是指将多帧图像中检测出的目标对象进行关联的技术,是计算机视觉领域重要的研究方向之一。该技术被广泛应用于在体育赛事转播、安防监控、机器人等领域。现有的目标跟踪方法的算法复杂度较高,对运算设备的性能要求较高。对于性能较低的运算设备,如嵌入式设备等,运行现有的目标跟踪方法,则会出现运算速度较慢的情况,进而影响目标跟踪效果。
发明内容
本申请实施例提供了一种目标跟踪方法、装置、终端设备及计算机可读存储介质,可以有效减少目标跟踪的算法复杂度,进而提高目标跟踪的效率。
第一方面,本申请实施例提供了一种目标跟踪方法,所述预设模型包括依次连接的第一特征提取模块和第二特征提取模块,所述方法包括:
通过所述第一特征模块分别获取初始帧中目标对象的第一特征数据、和当前帧中所述目标对象的第二特征数据,其中,所述初始帧为所述目标对象的第一帧拍摄图像,所述当前帧为所述目标对象的第N帧拍摄图像,所述N为大于 1的正整数;
通过所述第二特征模块分别获取所述第一特征数据中的第三特征数据、和所述第二特征数据中的第四特征数据;
根据所述第三特征数据和所述第四特征数据检测所述当前帧中所述目标对象的中心位置点;
生成所述中心位置点对应的所述目标对象的多个候选检测框;
根据所述第一特征数据和所述第二特征数据从所述多个候选检测框中确定出所述当前帧中所述目标对象的目标检测框。
本申请实施例中,在目标对象的中心位置点检测过程中,利用预设模型中的第一特征提取模块和第二特征提取模块依次获取特征数据,在从多个候选框中确定目标检测框的过程中,利用预设模型中的第一特征提取模块输出的特征数据确定目标检测框。相当于在确定中心位置点时用到了较深层的特征数据,在确定目标检测框时用到了较浅层的特征数据。由于中心位置点的准确度更大程度上决定了当前帧中目标对象的检测位置,因此,利用较深层的特征数据可以保证确定出较准确的中心点位置;而后续确定目标检测框时,利于较浅层的特征数据,有利于减少计算量,提高检测效率。通过上述方法,在保证目标跟踪的准确度的同时,可以有效减少目标跟踪的算法复杂度,提高目标跟踪的效率。
在第一方面的一种可能的实现方式中,所述通过所述第一特征模块分别获取初始帧中目标对象的第一特征数据、和当前帧中所述目标对象的第二特征数据,包括:
对所述初始帧进行数据增强处理,得到增强数据;
将所述增强数据输入所述第一特征提取模块,获得所述第一特征数据;
将所述当前帧输入所述第一特征提取模块,获得所述第二特征数据。
在第一方面的一种可能的实现方式中,所述对所述初始帧进行数据增强处理,得到增强数据,包括:
对所述初始帧分别进行M种预处理,得到所述M种预处理各自对应的处理图像,其中,所述M为大于或等于1的正整数;
提取所述初始帧中所述目标对象的第一图像数据;
提取每张所述处理图像中所述目标对象的第二图像数据;
根据所述第一图像数据和所述第二图像数据生成所述增强数据。
在第一方面的一种可能的实现方式中,所述根据所述第三特征数据和所述第四特征数据检测所述当前帧中所述目标对象的中心位置点,包括:
将所述第三特征数据和所述第四特征数据输入训练后的分类模型中,得到所述当前帧中所述目标对象的多个关键点各自的置信度;
将所述多个关键点各自的置信度中最大值对应的关键点确定为所述当前帧中所述目标对象的中心位置点。
在第一方面的一种可能的实现方式中,所述生成所述中心位置点对应的所述目标对象的多个候选检测框,包括:
当所述N等于2时,在预设的第一长宽比范围内获取K个长宽比,并根据所述中心点位置生成所述K个长宽比各自对应的候选检测框,所述K为大于1 的正整数;
当所述N大于2时,统计目标帧中所述目标对象的目标检测框的第二长宽比范围;根据所述第二长宽比范围获取L个长宽比;根据所述中心点位置生成所述L个长宽比各自对应的候选检测框,所述L为大于1的正整数,所述目标帧包括所述当前帧之前的N-1帧拍摄图像。
在第一方面的一种可能的实现方式中,所述根据所述第一特征数据和所述第二特征数据从所述多个候选检测框中确定出所述当前帧中所述目标对象的目标检测框,包括:
根据所述第一特征数据和所述第二特征数据进行池化处理,得到池化数据;
根据所述池化数据计算所述多个候选检测框各自对应的交并比,所述交并比表示所述候选检测框与参考检测框的重叠率,所述参考检测框为所述初始帧中所述目标对象的检测框;
将计算出的所述交并比中最大值对应的候选检测框确定为所述当前帧中所述目标对象的目标检测框。
在第一方面的一种可能的实现方式中,所述方法还包括:利用预设加速算法对所述预设模型进行模型加速。
第二方面,本申请实施例提供了一种目标跟踪装置,应用于预设模型,所述预设模型包括依次连接的第一特征提取模块和第二特征提取模块,所述装置包括:
第一获取模块,用于通过所述第一特征模块分别获取初始帧中目标对象的第一特征数据、和当前帧中所述目标对象的第二特征数据,其中,所述初始帧为所述目标对象的第一帧拍摄图像,所述当前帧为所述目标对象的第N帧拍摄图像,所述N为大于1的正整数;
第二获取模块,用于通过所述第二特征模块分别获取所述第一特征数据中的第三特征数据、和所述第二特征数据中的第四特征数据;
中心检测模块,用于根据所述第三特征数据和所述第四特征数据检测所述当前帧中所述目标对象的中心位置点;
候选框生成模块,用于生成所述中心位置点对应的所述目标对象的多个候选检测框;
目标框确定模块,用于根据所述第一特征数据和所述第二特征数据从所述多个候选检测框中确定出所述当前帧中所述目标对象的目标检测框。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的目标跟踪方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的目标跟踪方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的目标跟踪方法。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的目标跟踪方法的流程示意图;
图2是本申请实施例提供的目标跟踪算法结构的示意图;
图3(a)至图3(e)是本申请实施例提供的预处理的示意图;
图4是本申请实施例提供的目标跟踪装置的结构框图;
图5是本申请实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。
参见图1,是本申请实施例提供的目标跟踪方法的流程示意图。本申请实施例应用于预设模型,所述预设模型包括依次连接的第一特征提取模块和第二特征提取模块。可选的,本申请实施例中的预设模型可以是神经网络模型,如 ResNet18和ResNet50等神经网络模型。
以ResNet18为例,该模型包括18个模块。如果利用18个模块依次进行特征提取,计算量较大。本申请实施例中,为了减少数据处理量,采用其中的部分模块进行特征提取。
示例性,参见图2,是本申请实施例提供的目标跟踪算法结构的示意图。如图2所示,本申请实施例中将ResNet18中的block1-2(模块1和模块2)作为第一特征提取模块,将block3(模块3)作为第二特征提取模块。
需要说明的是,图2中仅是预设模型的示例,并不对预设模型的网络结构或采用预设模型中模块的数量做具体限定。
下述方法均以ResNet18为例介绍。作为示例而非限定,所述方法可以包括以下步骤:
S101,通过第一特征模块分别获取初始帧中目标对象的第一特征数据、和当前帧中目标对象的第二特征数据。
其中,初始帧为目标对象的第一帧拍摄图像,当前帧为目标对象的第N帧拍摄图像,N为大于1的正整数。
可选的,在S101之前,可以对初始帧和当前帧进行数据转换处理。示例性的,通过调用OpenCV库,将初始帧和当前帧分别转换为图像数据,然后提取转换后的图像数据中的特征数据。通过这种方式,可以优化图像的读取和转换方式,将大矩阵计算由CPU迁移到GPU。
如图2所示,第一特征模块包括ResNet18中的block1和block2。
现有的目标跟踪算法,一种是对采集的每帧图像中的目标对象单独进行检测,这种方式检测出的每帧图像中的目标对象的关联性较差,目标跟踪精度较低。另一种是预先采集一张参考图像,然后利用参考图像对实时采集的每帧图像中的目标对象进行检测;这种方式下检测精度往往取决于参考图像,如果参考图像选取不当(如目标对象处有遮挡或形变等),则后续的检测精度较低。
本申请实施例中,将实时采集的目标对象的第一帧图像(即初始帧)作为参考图像。由于在特定应用场景下,目标对象的特征较为统一,因此,以初始帧作为参考图像可以有效减少参考图像和后续待检测帧之间的特征差异,进而有效提高检测精度。
在一个实施例中,S101的一种实现方式可以为:将初始帧输入第一特征提取模块,获得第一特征数据;将当前帧输入第一特征提取模块,获得第二特征数据。
由于本申请实施例中,初始帧作为参考图像,所以只有保证初始帧中目标对象的检测精度,才能保证后续各帧图像中目标对象的检测精度。为了提高初始帧中目标对象的检测精度。在一个实施例中,S101可以包括以下步骤:
对初始帧进行数据增强处理,得到增强数据;将增强数据输入第一特征提取模块,获得第一特征数据;将当前帧输入第一特征提取模块,获得第二特征数据。
当然,也可以对当前帧进行数据增强处理,但是这样会增加数据计算量。因此,本申请实施例中,对初始帧进行数据增强处理,以提高初始帧中目标对象的检测精度;而对当前帧不做数据增强处理,以减少数据计算量。
可选的,可以将当前帧输入第一特征提取模块,获得第二特征数据。还可以先提取当前帧中目标对象对应的局部图像数据,将该局部图像数据输入第一特征提取模块,获得第二特征数据。
可选的,对初始帧进行数据增强处理的一种实现方式可以包括:
对初始帧分别进行M种预处理,得到M种预处理各自对应的处理图像,其中,M为大于或等于1的整数;提取初始帧中目标对象的第一图像数据;提取每张处理图像中目标对象的第二图像数据;根据第一图像数据和第二图像数据生成增强数据。
本申请实施例中,预处理的方式可以包括图像旋转处理、图像翻转处理、图像模糊处理、图像平移处理、图像尺度变化处理、图像亮度变化处理、图像噪声处理。
参见图3(a)至图3(e),是本申请实施例提供的预处理的示意图。如图 3(a)所示,图像旋转处理指将图像顺时针或逆时针旋转预设角度。图像翻转处理包括镜面翻转(将图像的左右颠倒)和垂直翻转(将图像旋转180度)。如图3(b)所示的图像翻转为垂直翻转。图像模糊处理可以包括高斯模糊和均值滤波模块等。如图3(c)中左侧为原图,右侧图像为高斯模糊处理后的图像。图像亮度变化处理可以包括图像亮度增强和图像亮度减弱。如图3(d)中左侧图像为经过图像亮度增强处理后的图像,右侧图像为经过图像亮度减弱处理后的图像。图像噪声处理可以包括增加高斯噪声、白噪声和椒盐噪声等。通过增加不同类型的噪声,可以模仿由于各种原因导致的画面噪声,防止因噪声而导致的卷积结果错误。如图3(e)中左侧图像为增加高斯噪声处理后的图像,右侧图像为增加椒盐噪声处理后的图像。图像平移处理包括图像的上下移动和左右移动。图像尺度变化处理包括对图像进行放大、缩小和对局部区域增加数据等。
可以采用上述任意一种预处理方式对初始帧进行单独处理;还可以采用上述任意多种预处理方式对初始帧进行组合处理,例如,在对初始帧进行图像旋转处理后,再对旋转后的图像进行图像亮度增强处理,之后再在亮度增强后的图像上叠加高斯噪声。
根据第一图像数据和第二图像数据生成增强数据,可以是将第一图像数据和第二图像数据叠加。例如,第一图像数据包括初始帧中目标对象上的每个像素点对应的像素值,第二图像数据包括处理图像中目标对象上每个像素点对应的像素值,将第一图像数据和第二图像数据中相应的像素点的像素值相加。
根据第一图像数据和第二图像数据生成增强数据,还可以是将第一图像数据和第二图像数据组合。继续上述示例,可以将第一图像数据生成一个矩阵,将第二图像数据生成一个矩阵,然后将两个矩阵进行拼接。
将增强数据输入分类模型和预设模型中,能够提高预设模型对目标特征的识别能力,提高分类模型对目标特征的判别能力。另外,本申请实施例中减少了预设模型的网络深度,保留了浅层图像特征,通过上述对初始帧的数据增强处理,可以有效弥补网络深度变浅导致的精度损失,在减少计算量的同时,保证了特征的识别精度。
S102,通过第二特征模块分别获取第一特征数据中的第三特征数据、和第二特征数据中的第四特征数据。
如图2所示,第二特征模块包括ResNet18中的block3。通过第二特征模块,可以对第一特征模块输出的特征数据进一步提取特征。与第一特征模块输的的特征数据相比,第二特征模块输出的特征数据表示更深层的图像特征。
在一个实施例中,在利用预设模型提取特征数据时,可以利用预设加速算法对预设模型进行模型加速。例如,利用Nvidia TensorRT加速深度学习网络对预设模型进行模型加速,即在预设模型提取特征数据的运算过程进行算法加速。
在图2所示的目标跟踪算法结构中,相当于利用了孪生网络提取特征数据,即在提取初始帧中特征数据时采用的预设模型的模型参数、与提取当前帧中特征数据时采用的模型参数相同(参数共享)。利用孪生网络可以评价两个输入之间的相似度。换言之,通过预设模型分别提取的第三特征数据和第四特征数据,可以用于确定初始帧和当前帧之间的相似度。
S103,根据第三特征数据和第四特征数据检测当前帧中目标对象的中心位置点。
在目标对象的中心位置点检测过程中,利用预设模型中的第一特征提取模块和第二特征提取模块依次获取特征数据,相当于在确定中心位置点时用到了较深层的特征数据。由于中心位置点的准确度更大程度上决定了当前帧中目标对象的检测位置,因此,利用较深层的特征数据可以保证确定出较准确的中心点位置。
在一个实施例中,S103中检测中心位置点的方式可以包括:
将第三特征数据和第四特征数据输入训练后的分类模型中,得到当前帧中目标对象的多个关键点各自的置信度;将多个关键点各自的置信度中最大值对应的关键点确定为当前帧中目标对象的中心位置点。
分类模型可以是如图2所示的分类器。将第三特征数据和第四特征数据输入分类器,相当于以第三特征数据为参考对第四特征数据进行检测,即以初始帧中目标对象的特征数据为参考检测当前帧中的目标对象。
为了提高分类器的分类精度,可以预先对训练后的分类器进行初始化。具体的,初始化过程可以包括:利用如S101所述的对初始帧进行数据增强处理后得到的增强数据,对分类器进行迭代优化处理,得到优化后的分类器。
需要说明的是,为了简化目标跟踪过程中的计算步骤,可以保存对初始帧的处理结果,即保存获取到的初始帧中目标对象的第一特征数据和根据第一特征数据得到的第三特征数据。在检测初始帧后的每一帧图像时,读取保存的对初始帧的处理结果即可,无需重复对初始帧进行处理。
S104,生成中心位置点对应的目标对象的多个候选检测框。
在一个实施例中,可以预先设定第一长宽比范围,在第一长宽比范围内,随机选取多个长宽比,然后根据中心位置点生成每个长宽比对应的候选检测框。
但是上述方法生成的候选检测框可能与前一帧图像的目标检测框的形状区别较大。而实际应用中,通常对目标对象跟踪拍摄的帧率比较高,相邻两帧图像中目标对象的检测框不会发生较大形变。
为了获得更加准确的候选检测框,在一个实施例中,生成多个候选检测框的方式可以包括:
当N等于2时,在预设的第一长宽比范围内获取K个长宽比,并根据中心点位置生成K个长宽比各自对应的候选检测框,K为大于1的正整数。
当N大于2时,统计目标帧中目标对象的目标检测框的第二长宽比范围;根据第二长宽比范围获取L个长宽比;根据中心点位置生成L个长宽比各自对应的候选检测框,L为大于1的正整数,目标帧包括当前帧之前的N-1帧拍摄图像。
示例性的,假设当前帧为目标对象的第6帧图像,前5帧图像的目标检测框的长宽比分别为1,1.5,1.2,1.4和2。第二长宽比范围为1到2。在这个范围内,随机选取3个长宽比。假设选取的长宽比为1、1.5和2,相应的,根据中心位置点生成该3个长宽比各自对应的候选检测框。需要说明的是,随机选取的长宽比越多,后续确定目标检测框的计算量越大,但是精度也更高。
通过第二长宽比范围,可以避免候选检测框形状的突变。
可选的,在确定第二长宽比范围后,可以将该范围进行适当的压缩或扩张,得到变换后的第二长宽比范围,然后在变换后的第二长宽比范围内选取多个长宽比。继续上述示例,将第二长宽比范围1到2压缩二分之一,得到变换后的第二长宽比范围为1.25到1.75。
可选的,当N大于2时,还可以获取当前帧之前的H帧拍摄图像中目标检测框的长宽比,根据中心位置点生成这H个长宽比各自对应的候选检测框,其中,H大于1、且小于N-1。
S105,根据第一特征数据和第二特征数据从多个候选检测框中确定出当前帧中目标对象的目标检测框。
在一个实施例中,S105中确定目标检测框的步骤可以包括:
根据第一特征数据和第二特征数据进行池化处理,得到池化数据;根据池化数据计算多个候选检测框各自对应的交并比;将计算出的交并比中最大值对应的候选检测框确定为当前帧中目标对象的目标检测框。
其中,交并比表示候选检测框与参考检测框的重叠率,参考检测框为初始帧中目标对象的检测框。
池化处理可以为最大池化、平均池化,也可以如图2中所示的prpool(Precise ROIPooling,感兴趣区域的精准池化)。将池化数据进行全连接处理(如图2 所示的fc),即可得到每个候选框对应的交并比。如图2所示,当前帧中检测出三个候选检测框,各自对应的交并比为0.81、0.72和0.58。将交并比最大的候选检测框,即0.81对应的候选检测框,确定为目标检测框。
可选的,可以对第一特征数据进行卷积(如图2所示的conv)、池化(如图2所示的prpool)和全连接处理(如图2所示的fc),以挖掘更深层的特征信息。可以对第二特征数据进行二次卷积处理。需要说明的是,此步骤进行的卷积、池化和全连接处理的计算复杂度要远低于第二特征提取模块的计算复杂度。
在一个实施例中,在S105步骤之前,还可以对多个候选检测框进行细化处理。例如,确定的候选检测框的长宽比为1和2,经过细化处理,可以得到精度更高的长宽比,如1.2和2.3。
可以通过迭代优化的方法进行细化处理,但是可以通过控制迭代优化的次数,来控制计算成本。还可以通过剪除迭代优化过程中不必要的参数调用,来控制技术成本。
S105中相当于在确定目标检测框时用到了较浅层的特征数据。由于S101 和S102中已经采用较深层的特征数据确定出较准确的中心位置点,则在确定目标检测框时,利用较深层的特征数据,有利于减少计算量,提高检测效率。通过上述方法,在保证目标跟踪的准确度的同时,可以有效减少目标跟踪的算法复杂度,提高目标跟踪的效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的目标跟踪方法,图4是本申请实施例提供的目标跟踪装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图4,该装置包括:
第一获取模块41,用于通过所述第一特征模块分别获取初始帧中目标对象的第一特征数据、和当前帧中所述目标对象的第二特征数据,其中,所述初始帧为所述目标对象的第一帧拍摄图像,所述当前帧为所述目标对象的第N帧拍摄图像,所述N为大于1的正整数。
第二获取模块42,用于通过所述第二特征模块分别获取所述第一特征数据中的第三特征数据、和所述第二特征数据中的第四特征数据;
中心检测模块43,用于根据所述第三特征数据和所述第四特征数据检测所述当前帧中所述目标对象的中心位置点。
候选框生成模块44,用于生成所述中心位置点对应的所述目标对象的多个候选检测框。
目标框确定模块45,用于根据所述第一特征数据和所述第二特征数据从所述多个候选检测框中确定出所述当前帧中所述目标对象的目标检测框。
可选的,第一获取模块41还用于:
对所述初始帧进行数据增强处理,得到增强数据;将所述增强数据输入所述第一特征提取模块,获得所述第一特征数据;将所述当前帧输入所述第一特征提取模块,获得所述第二特征数据。
可选的,第一获取模块41还用于:
对所述初始帧分别进行M种预处理,得到所述M种预处理各自对应的处理图像,其中,所述M为大于或等于1的正整数;提取所述初始帧中所述目标对象的第一图像数据;提取每张所述处理图像中所述目标对象的第二图像数据;根据所述第一图像数据和所述第二图像数据生成所述增强数据。
可选的,中心检测模块43还用于:
将所述第三特征数据和所述第四特征数据输入训练后的分类模型中,得到所述当前帧中所述目标对象的多个关键点各自的置信度;将所述多个关键点各自的置信度中最大值对应的关键点确定为所述当前帧中所述目标对象的中心位置点。
可选的,候选框生成模块44还用于:
当所述N等于2时,在预设的第一长宽比范围内获取K个长宽比,并根据所述中心点位置生成所述K个长宽比各自对应的候选检测框,所述K为大于1 的正整数;
当所述N大于2时,统计目标帧中所述目标对象的目标检测框的第二长宽比范围;根据所述第二长宽比范围获取L个长宽比;根据所述中心点位置生成所述L个长宽比各自对应的候选检测框,所述L为大于1的正整数,所述目标帧包括所述当前帧之前的N-1帧拍摄图像。
可选的,目标框确定模块45还用于:
根据所述第一特征数据和所述第二特征数据进行池化处理,得到池化数据;
根据所述池化数据计算所述多个候选检测框各自对应的交并比,所述交并比表示所述候选检测框与参考检测框的重叠率,所述参考检测框为所述初始帧中所述目标对象的检测框;
将计算出的所述交并比中最大值对应的候选检测框确定为所述当前帧中所述目标对象的目标检测框。
可选的,装置4还包括:
加速模块46,用于利用预设加速算法对所述预设模型进行模型加速。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
另外,图4所示的目标跟踪装置可以是内置于现有的终端设备内的软件单元、硬件单元、或软硬结合的单元,也可以作为独立的挂件集成到所述终端设备中,还可以作为独立的终端设备存在。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图5是本申请实施例提供的终端设备的结构示意图。如图5所示,该实施例的终端设备5包括:至少一个处理器50(图5中仅示出一个)处理器、存储器51以及存储在所述存储器51中并可在所述至少一个处理器50上运行的计算机程序52,所述处理器50执行所述计算机程序52时实现上述任意各个目标跟踪方法实施例中的步骤。
所述终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,图5仅仅是终端设备5的举例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),该处理器50还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit, ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51在一些实施例中可以是所述终端设备5的内部存储单元,例如终端设备5的硬盘或内存。所述存储器51在另一些实施例中也可以是所述终端设备5的外部存储设备,例如所述终端设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储操作系统、应用程序、引导装载程序(Boot Loader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM, Random AccessMemory)、电载波信号、电信信号以及软件分发介质。例如U 盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种目标跟踪方法,其特征在于,应用于预设模型,所述预设模型包括依次连接的第一特征提取模块和第二特征提取模块,所述方法包括:
通过所述第一特征模块分别获取初始帧中目标对象的第一特征数据、和当前帧中所述目标对象的第二特征数据,其中,所述初始帧为所述目标对象的第一帧拍摄图像,所述当前帧为所述目标对象的第N帧拍摄图像,所述N为大于1的正整数;
通过所述第二特征模块分别获取所述第一特征数据中的第三特征数据、和所述第二特征数据中的第四特征数据;
根据所述第三特征数据和所述第四特征数据检测所述当前帧中所述目标对象的中心位置点;
生成所述中心位置点对应的所述目标对象的多个候选检测框;
根据所述第一特征数据和所述第二特征数据从所述多个候选检测框中确定出所述当前帧中所述目标对象的目标检测框。
2.如权利要求1所述的目标跟踪方法,其特征在于,所述通过所述第一特征模块分别获取初始帧中目标对象的第一特征数据、和当前帧中所述目标对象的第二特征数据,包括:
对所述初始帧进行数据增强处理,得到增强数据;
将所述增强数据输入所述第一特征提取模块,获得所述第一特征数据;
将所述当前帧输入所述第一特征提取模块,获得所述第二特征数据。
3.如权利要求2所述的目标跟踪方法,其特征在于,所述对所述初始帧进行数据增强处理,得到增强数据,包括:
对所述初始帧分别进行M种预处理,得到所述M种预处理各自对应的处理图像,其中,所述M为大于或等于1的正整数;
提取所述初始帧中所述目标对象的第一图像数据;
提取每张所述处理图像中所述目标对象的第二图像数据;
根据所述第一图像数据和所述第二图像数据生成所述增强数据。
4.如权利要求1所述的目标跟踪方法,其特征在于,所述根据所述第三特征数据和所述第四特征数据检测所述当前帧中所述目标对象的中心位置点,包括:
将所述第三特征数据和所述第四特征数据输入训练后的分类模型中,得到所述当前帧中所述目标对象的多个关键点各自的置信度;
将所述多个关键点各自的置信度中最大值对应的关键点确定为所述当前帧中所述目标对象的中心位置点。
5.如权利要求1所述的目标跟踪方法,其特征在于,所述生成所述中心位置点对应的所述目标对象的多个候选检测框,包括:
当所述N等于2时,在预设的第一长宽比范围内获取K个长宽比,并根据所述中心点位置生成所述K个长宽比各自对应的候选检测框,所述K为大于1的正整数;
当所述N大于2时,统计目标帧中所述目标对象的目标检测框的第二长宽比范围;根据所述第二长宽比范围获取L个长宽比;根据所述中心点位置生成所述L个长宽比各自对应的候选检测框,所述L为大于1的正整数,所述目标帧包括所述当前帧之前的N-1帧拍摄图像。
6.如权利要求1所述的目标跟踪方法,其特征在于,所述根据所述第一特征数据和所述第二特征数据从所述多个候选检测框中确定出所述当前帧中所述目标对象的目标检测框,包括:
根据所述第一特征数据和所述第二特征数据进行池化处理,得到池化数据;
根据所述池化数据计算所述多个候选检测框各自对应的交并比,所述交并比表示所述候选检测框与参考检测框的重叠率,所述参考检测框为所述初始帧中所述目标对象的检测框;
将计算出的所述交并比中最大值对应的候选检测框确定为所述当前帧中所述目标对象的目标检测框。
7.如权利要求1所述的目标跟踪方法,其特征在于,所述方法还包括:利用预设加速算法对所述预设模型进行模型加速。
8.一种目标跟踪装置,其特征在于,应用于预设模型,所述预设模型包括依次连接的第一特征提取模块和第二特征提取模块,所述装置包括:
第一获取模块,用于通过所述第一特征模块分别获取初始帧中目标对象的第一特征数据、和当前帧中所述目标对象的第二特征数据,其中,所述初始帧为所述目标对象的第一帧拍摄图像,所述当前帧为所述目标对象的第N帧拍摄图像,所述N为大于1的正整数;
第二获取模块,用于通过所述第二特征模块分别获取所述第一特征数据中的第三特征数据、和所述第二特征数据中的第四特征数据;
中心检测模块,用于根据所述第三特征数据和所述第四特征数据检测所述当前帧中所述目标对象的中心位置点;
候选框生成模块,用于生成所述中心位置点对应的所述目标对象的多个候选检测框;
目标框确定模块,用于根据所述第一特征数据和所述第二特征数据从所述多个候选检测框中确定出所述当前帧中所述目标对象的目标检测框。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111338801.5A CN114219831A (zh) | 2021-11-12 | 2021-11-12 | 目标跟踪方法、装置、终端设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111338801.5A CN114219831A (zh) | 2021-11-12 | 2021-11-12 | 目标跟踪方法、装置、终端设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114219831A true CN114219831A (zh) | 2022-03-22 |
Family
ID=80697041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111338801.5A Pending CN114219831A (zh) | 2021-11-12 | 2021-11-12 | 目标跟踪方法、装置、终端设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114219831A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115375929A (zh) * | 2022-10-25 | 2022-11-22 | 杭州华橙软件技术有限公司 | 目标模板集合的更新方法、装置及计算机可读存储介质 |
-
2021
- 2021-11-12 CN CN202111338801.5A patent/CN114219831A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115375929A (zh) * | 2022-10-25 | 2022-11-22 | 杭州华橙软件技术有限公司 | 目标模板集合的更新方法、装置及计算机可读存储介质 |
CN115375929B (zh) * | 2022-10-25 | 2023-02-07 | 杭州华橙软件技术有限公司 | 目标模板集合的更新方法、装置及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109543489B (zh) | 基于二维码的定位方法、装置和存储介质 | |
CN109711416B (zh) | 目标识别方法、装置、计算机设备和存储介质 | |
CN110334762B (zh) | 一种基于四叉树结合orb和sift的特征匹配方法 | |
CN109784250B (zh) | 自动引导小车的定位方法和装置 | |
CN110852311A (zh) | 一种三维人手关键点定位方法及装置 | |
CN112336342B (zh) | 手部关键点检测方法、装置及终端设备 | |
CN113112542A (zh) | 一种视觉定位方法、装置、电子设备及存储介质 | |
CN116452631A (zh) | 一种多目标跟踪方法、终端设备及存储介质 | |
CN114187333A (zh) | 一种图像对齐方法、图像对齐装置及终端设备 | |
CN115761826A (zh) | 掌静脉有效区域提取方法、系统、介质及电子设备 | |
WO2022199395A1 (zh) | 人脸活体检测方法、终端设备及计算机可读存储介质 | |
CN110673607A (zh) | 动态场景下的特征点提取方法、装置、及终端设备 | |
CN114219831A (zh) | 目标跟踪方法、装置、终端设备及计算机可读存储介质 | |
KR102421604B1 (ko) | 이미지 처리 방법, 장치 및 전자 기기 | |
Cai et al. | Feature detection and matching with linear adjustment and adaptive thresholding | |
CN111161348A (zh) | 一种基于单目相机的物体位姿估计方法、装置及设备 | |
CN111242084B (zh) | 机器人控制方法、装置、机器人及计算机可读存储介质 | |
CN112435283A (zh) | 图像的配准方法、电子设备以及计算机可读存储介质 | |
CN110969128A (zh) | 一种基于多特征融合的海面背景下红外船舰的检测方法 | |
WO2022205841A1 (zh) | 机器人导航方法、装置、终端设备及计算机可读存储介质 | |
CN112416128B (zh) | 一种手势识别方法及终端设备 | |
CN112200004B (zh) | 图像检测模型的训练方法、装置及终端设备 | |
CN106033550B (zh) | 目标跟踪方法及装置 | |
Xuejie et al. | An image registration method based on improved TLD and improved ORB for mobile augmented reality | |
CN113570535A (zh) | 视觉定位方法及相关装置、设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |