CN112884830A - 一种目标边框确定方法及装置 - Google Patents
一种目标边框确定方法及装置 Download PDFInfo
- Publication number
- CN112884830A CN112884830A CN202110080126.4A CN202110080126A CN112884830A CN 112884830 A CN112884830 A CN 112884830A CN 202110080126 A CN202110080126 A CN 202110080126A CN 112884830 A CN112884830 A CN 112884830A
- Authority
- CN
- China
- Prior art keywords
- frame
- video
- intelligent
- frames
- timestamp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000015572 biosynthetic process Effects 0.000 claims description 44
- 239000011159 matrix material Substances 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 10
- 238000012887 quadratic function Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 230000009191 jumping Effects 0.000 abstract description 6
- 230000008859 change Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种目标边框确定方法及装置,该方法和装置能够解决现有技术中因无法准确确定移动目标边框而导致的目标边框出现跳变的问题。其中,目标边框确定方法包括:对视频流进行解析,获得视频流中的多个视频帧以及与部分视频帧一一对应的智能帧;若确定多个视频帧中的第一视频帧不存在对应的智能帧,则确定出与第一视频帧在形成时刻上最为接近的具有智能帧的至少三个视频帧,并基于至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系拟合形成二次曲线;基于第一视频帧的形成时刻与二次曲线,确定第一视频帧中所包含的移动目标的预测位置坐标,并基于预测位置坐标绘制移动目标的边框。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种目标边框确定方法及装置。
背景技术
目前,处于前端的图像采集设备在采集图像数据形成视频帧之后,会针对视频帧中所包含的目标进行分析,从而获得对视频帧相对应的智能帧,该智能帧中包括了视频帧在形成时刻所包含的目标的位置坐标,即通过该智能帧能够确定绘制出视频帧中所包含目标的边框。但是由于图像采集设备往往性能有限,无法针对每个视频帧进行分析从而获得对应的智能帧,即智能帧的数量小于视频帧的数量,使得在显示设备中依次显示视频帧时,因部分视频帧没有对应的智能帧,导致同一目标的边框会发生跳变。为了使目标的边框能够平滑的显示,就需要为不具有智能帧的视频帧中所包含的目标添加目标边框,即插入智能帧。
现有技术中,当需要插帧时,是将目标的运动当做是直线运动,即将获得的两个智能帧所表示的位置坐标,拟合成直线,从而对出现在两个智能帧时间点之间的多个视频帧进行等分插值,但是若目标的移动轨迹未非直线,那么为目标添加目标边框的效果就较差,显示时会出现目标边框的跳变,即目标边框显示不够平滑。
可见,现有技术中在移动目标为非直线运行状态下采用等分方式进行插帧,无法准确确定移动目标的坐标位置,导致在显示时移动目标的边框会出现跳变。
发明内容
本发明实施例提供了一种目标边框确定方法及装置,该方法和装置能够解决现有技术中因无法较为准确的确定非直线运动状态下移动目标的位置而导致的目标边框出现跳变的问题。
第一方面,本发明实施例提供一种目标边框确定方法,所述方法包括:
对视频流进行解析,获得视频流中的多个视频帧以及与部分视频帧一一对应的智能帧,智能帧用于指示对应的视频帧在形成时刻所包含的移动目标的位置坐标;
若确定所述多个视频帧中的第一视频帧不存在对应的智能帧,则确定出与所述第一视频帧在形成时刻上最为接近的具有智能帧的至少三个视频帧,并基于所述至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系拟合形成二次曲线;
基于所述第一视频帧的形成时刻与所述二次曲线,确定所述第一视频帧中所包含的移动目标的预测位置坐标,并基于所述预测位置坐标绘制移动目标的边框。
本发明实施例中,通过将视频流进行解析,可以获得多个视频帧以及与部分视频帧相对应的智能帧,即可以确定出哪些视频帧存在对应的智能帧,哪些视频帧不存在对应的智能帧。例如,第一视频帧不存在对应的智能帧,那么就可以以第一视频帧的形成时刻为基准,确定出至少三个与第一视频帧的形成时刻最为接近且具有智能帧的视频帧,由于智能帧用于指示对应的视频帧在形成时刻所包含的移动目标的位置坐标,那么可以根据至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系进行拟合,从而形成二次曲线。在获得二次曲线之后,只要根据第一视频帧的形成时刻,就可以确定出第一视频帧中所包含的移动目标的位置坐标,进而基于所确定的位置坐标绘制目标边框。该方法中通过拟合出一个二次曲线来表征不同时刻移动目标所处的位置坐标,更加符合移动目标在非直线运动状态下的位置变化情况,那么基于二次曲线为移动目标绘制边框更加符合非直线运动状态下移动目标的移动规律,使得在显示时同一移动目标的边框更为平滑,减少了跳变问题的发生。
可选的,对视频流进行解析,获得视频流中的多个视频帧以及与部分视频帧一一对应的智能帧包括:
基于每一帧中成对设置的帧头与帧尾将视频流解析为所述多个视频帧以及与所述多个视频帧中部分视频帧一一对应的智能帧,其中,所述帧头中包括帧类型,所述帧类型包括视频帧与智能帧,所述帧头中还包括时间戳用于指示视频帧的形成时刻,一一对应的视频帧和智能帧具有相同时间戳,所述帧尾用于指示位于所述帧头之后的数据结束。
本发明实施例中,可以基于帧头所包括的帧类型将视频流中的视频帧与智能帧进行区分,同时还可以基于视频帧所包括的时间戳确定与视频帧相对应的智能帧,即确定视频流中哪些视频帧存在对应的智能帧,哪些视频帧不存在对应智能帧,以便于后续对不存在智能帧的视频帧进行插帧处理。
可选的,所述至少三个视频帧各自对应的智能帧包括第一智能帧、第二智能帧以及第三智能帧,基于所述至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系拟合形成二次曲线包括:
将所述第一智能帧、所述第二智能帧以及所述第三智能帧各自的时间戳所表征的形成时刻与移动目标位置坐标的对应关系代入预先构建的二次函数表达式,获得所述二次曲线,其中,所述第一智能帧的时间戳所表征的形成时刻、所述第二智能帧的时间戳所表征的形成时刻以及所述第三智能帧的时间戳所表征的形成时刻均被归一化到[0,1]之间;
将所述二次曲线转换为对应的矩阵表达式;
其中,[x(t),y(t)]为第一视频帧中所包含的移动目标的位置坐标,t为时间参数,矩阵中的i1-i9为常数,[x1,y1]为第一智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x2,y2]为第二智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x3,y3]为第三智能帧中时间戳所表征的形成时刻移动目标的位置坐标。
本发明实施例中,将第一智能帧、第二智能帧以及第三智能帧各自的时间戳所表征的形成时刻均归一化到[0,1]之间,且将各个经归一化处理后的形成时刻与移动目标位置坐标的对应关系代入到预先构建的二次函数中,就可以获得二次曲线。同时将所获得的二次曲线转换为矩阵表达式,以便于基于该矩阵表达式可以快速确定出不具有智能帧的视频帧在形成时刻所包含的移动目标的位置坐标。
可选的,基于所述第一视频帧的形成时刻与所述二次曲线,确定所述第一视频帧中所包含的移动目标的预测位置坐标包括:
将所述第一视频帧的时间戳所表征的形成时刻进行归一化处理,获得对应的时间参数;
将所述时间参数代入到所述二次曲线的矩阵表达式中,获得所述第一视频帧中所包含的移动目标的位置坐标。
本发明实施例中,将第一视频帧的时间戳所表征的形成时刻进行归一化处理后,就可以代入到二次曲线所对应的矩阵表达式中,从而较为准确的确定出第一视频帧在形成时刻所包含的移动目标的位置坐标。
可选的,若所述第一智能帧的时间戳所表征的形成时刻、所述第二智能帧的时间戳所表征的形成时刻以及所述第三智能帧的时间戳所表征的形成时刻依次增加,归一化处理基于如下公式:
其中,tx表示所述第一视频帧的时间戳所表征的形成时刻进行归一化处理后得到的时间参数,Tx表示所述第一视频帧的时间戳所表征的形成时刻,T1表示所述第一智能帧的时间戳所表征的形成时刻,T2表示所述第三智能帧的时间戳所表征的形成时刻。
本发明实施例中,通过一个简单的比例运算将第一视频帧的时间戳所表征的形成时刻转换为一个时间参数,使得在根据矩阵表达式确定第一视频帧在形成时刻所包含的移动目标的位置坐标时更为简便。
第二方面,本发明实施例中提供了一种目标边框确定装置,所述装置包括:
解析单元,用于对视频流进行解析,获得视频流中的多个视频帧以及与部分视频帧一一对应的智能帧,智能帧用于指示对应的视频帧在形成时刻所包含的移动目标的位置坐标;
第一处理单元,用于若确定所述多个视频帧中的第一视频帧不存在对应的智能帧,则确定出与所述第一视频帧在形成时刻上最为接近的具有智能帧的至少三个视频帧,并基于所述至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系拟合形成二次曲线;
第二处理单元,用于基于所述第一视频帧的形成时刻与所述二次曲线,确定所述第一视频帧中所包含的移动目标的预测位置坐标,并基于所述预测位置坐标绘制移动目标的边框。
可选的,所述解析单元具体用于:
基于每一帧中成对设置的帧头与帧尾将视频流解析为所述多个视频帧以及与所述多个视频帧中部分视频帧一一对应的智能帧,其中,所述帧头中包括帧类型,所述帧类型包括视频帧与智能帧,所述帧头中还包括时间戳用于指示视频帧的形成时刻,一一对应的视频帧和智能帧具有相同时间戳,所述帧尾用于指示位于所述帧头之后的数据结束。
可选的,所述至少三个视频帧各自对应的智能帧包括第一智能帧、第二智能帧以及第三智能帧,所述第一处理单元具体用于:
将所述第一智能帧、所述第二智能帧以及所述第三智能帧各自的时间戳所表征的形成时刻与移动目标位置坐标的对应关系代入预先构建的二次函数表达式,获得所述二次曲线,其中,所述第一智能帧的时间戳所表征的形成时刻、所述第二智能帧的时间戳所表征的形成时刻以及所述第三智能帧的时间戳所表征的形成时刻均被归一化到[0,1]之间;
将所述二次曲线转换为对应的矩阵表达式;
其中,[x(t),y(t)]为第一视频帧中所包含的移动目标的位置坐标,t为时间参数,矩阵中的i1-i9为常数,[x1,y1]为第一智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x2,y2]为第二智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x3,y3]为第三智能帧中时间戳所表征的形成时刻移动目标的位置坐标。
可选的,所述第二处理单元具体用于:
将所述第一视频帧的时间戳所表征的形成时刻进行归一化处理,获得对应的时间参数;
将所述时间参数代入到所述二次曲线的矩阵表达式中,获得所述第一视频帧中所包含的移动目标的位置坐标。
可选的,若所述第一智能帧的时间戳所表征的形成时刻、所述第二智能帧的时间戳所表征的形成时刻以及所述第三智能帧的时间戳所表征的形成时刻依次增加,归一化处理基于如下公式:
其中,tx表示所述第一视频帧的时间戳所表征的形成时刻进行归一化处理后得到的时间参数,Tx表示所述第一视频帧的时间戳所表征的形成时刻,T1表示所述第一智能帧的时间戳所表征的形成时刻,T2表示所述第三智能帧的时间戳所表征的形成时刻。
第三方面,本发明实施例提供一种目标边框确定装置,所述装置包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现如第一方面任一实施例所述方法的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一实施例所述方法的步骤。
附图说明
图1为本发明实施例提供的一种目标边框确定方法的流程示意图;
图2为本发明实施例提供的一种解析后的视频流的示意图;
图3为本发明实施例提供的一种拟合后的二次曲线的示意图;
图4为本发明实施例提供的一种目标边框确定装置的流程示意图;
图5为本发明实施例提供的一种目标边框确定装置的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
现有技术中,当需要对不存在智能帧的视频帧进行插帧处理时,并未考虑移动目标具体的运动状态,直接利用是将移动目标的运动看作是直线运动,从而利用两个智能帧各自所表征的时间与移动目标的位置坐标的对应关系,拟合出一条直线,从而基于拟合所形成的直线来确定移动目标在某个时刻的位置坐标,进而基于确定出的位置坐标来绘制移动目标的边框。当移动目标处于非直线运动状态时,会导致确定出来的位置坐标与实际位置坐标相差较大,使得当前时刻所绘制的目标边框与基于智能帧所绘制的目标边框相比会出现跳变问题,即在显示设备上表现为目标边框的显示不够平滑。
鉴于此,本发明实施例提供了一种目标边框确定方法,该方法通过拟合出一个二次曲线来表征不同时刻移动目标所处的位置,更加符合移动目标在非直线运动状态下的位置变化情况,那么基于二次曲线为移动目标绘制边框更加符合非直线运动状态下移动目标的移动规律,使得在显示时同一移动目标的边框更为平滑,减少了跳变问题的发生。
下面结合附图对本发明实施例提供的技术方案进行介绍。请参见图1,本发明提供了一种目标边框确定方法,该方法的流程描述如下:
步骤101:对视频流进行解析,获得视频流中的多个视频帧以及与部分视频帧一一对应的智能帧,智能帧用于指示对应的视频帧在形成时刻所包含的移动目标的位置坐标。
本发明实施例中,视频帧中可以认为存储有图像采集设备所采集的与移动目标(例如,人或车辆)相关的图像数据,而智能帧是基于对视频帧进行分析后得到的,且可以认为存储有对应的视频帧在形成时刻所包含的移动目标的位置坐标。视频帧与智能帧交错排列形成视频流,且受限于图像采集设备的分析能力,在单位时间内所形成的视频流中智能帧的数量远小于视频帧的数量。为了能够在显示设备上依次显示视频流中的视频帧,以及基于智能帧为对应的视频帧中所包含的移动目标绘制目标边框,就需要对视频流中所包含的视频帧与智能帧进行区分。
作为一种可能的实施方式,可以对视频流进行解析,从而从视频流中获得多个视频帧以及与部分视频帧一一对应的智能帧。
考虑到视频帧与智能帧中各自包含的数据不相同,例如,视频帧中包含的是移动目标的图像数据,而智能帧中包含的移动目标的位置坐标数据,那么在将上述图像数据和位置坐标数据分别封装成帧时,帧头中所包括的帧类型信息是不相同的。同时为了对视频流所包含的不同帧之间进行区分,还需要为帧头设置对应的帧尾,即帧尾用于指示位于帧头之后的数据结束。因此,本发明实施例中可以基于每一帧所包含的帧头与帧尾将视频流中的视频帧与智能帧进行区分。
作为一种可能的实施方式,可以基于每一帧中成对设置的帧头与帧尾将视频流解析为多个视频帧,以及与多个视频帧中部分视频帧一一对应的智能帧。
应理解,每一帧的帧头除了包括帧类型以外,还包括有用于指示视频帧形成时刻的时间戳,且一一对应的视频帧与智能帧具有相同的时间戳,那么就可以在对视频流中所包含的视频帧与智能帧进行区分的基础上,进一步确定出哪些视频帧存在对应的智能帧,哪些视频帧不存在对应的智能帧。
步骤102:若确定多个视频帧中的第一视频帧不存在对应的智能帧,则确定出与第一视频帧在形成时刻上最为接近的具有智能帧的至少三个视频帧,并基于至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系拟合形成二次曲线。
本发明实施例中,对于解析后获得的多个视频帧中任一视频帧,例如,第一视频帧,若确定第一视频帧存在对应的智能帧,那么当需要显示第一视频帧时,则可以基于智能帧为第一视频帧中所包含的移动目标绘制目标边框。若第视频帧不存在对应的智能帧,那么就需要为第一视频帧添加对应的智能帧,也就是说,确定出在第一视频帧的形成时刻所包含的移动目标的位置坐标。在这之前,可以选取多个时刻以及与每个时刻相对应的位置坐标来拟合一条二次曲线,该二次曲线可以认为能够较为准确的描述移动目标在非直线运动状态或者直线运动状态下的位置变化情况。
作为一种可能的实施方式,可以从多个视频帧中确定出与第一视频帧在形成时刻上最为接近的具有智能帧的至少三个视频帧,从而可以根据上述至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系来拟合形成二次曲线。
例如,请参见图2,解析后的多个视频帧包括:视频帧A、视频帧B、视频帧C、视频帧D、视频帧E、视频帧F以及视频帧G,其中,视频帧A存在对应的智能帧A,视频帧C存在对应的智能帧C,视频帧E存在对应的智能帧E,视频帧G存在对应的智能帧G,而视频帧B、视频帧D以及视频帧F不存在对应的智能帧,那么就需要分别针对视频帧B、视频帧D以及视频帧F确定出各自在形成时刻所包含的移动目标的位置坐标。在这之前,需要拟合出一条符合上述移动目标运动规律二次曲线。
对于视频帧B为例,在具有智能帧的视频帧中,视频帧A、视频帧C以及视频帧E在形成时刻上与视频帧B最为接近,因此可以利用视频帧A、视频帧C以及视频帧E各自的形成时刻与移动目标的位置坐标的对应关系来拟合形成二次曲线。
对于视频帧D而言,由于在形成时刻上距离视频帧A和视频帧G相同,因此既可以利用视频帧A、视频帧C以及视频帧E各自的形成时刻与移动目标的位置坐标的对应关系来拟合形成二次曲线,又可以利用视频帧C、视频帧E以及视频帧G各自的形成时刻与移动目标的位置坐标的对应关系来拟合形成二次曲线。
对于视频帧F而言,在具有智能帧的视频帧中,视频帧C、视频帧E以及视频帧G在形成时刻上与视频帧F最为接近,因此可以利用视频帧C、视频帧E以及视频帧G各自的形成时刻与移动目标的位置坐标的对应关系来拟合形成二次曲线。
应理解,首先,由于智能帧可以指示对应的视频帧在形成时刻所包含的移动目标的位置坐标,那么在拟合形成二次曲线的过程中,就必须选择具有智能帧的至少三个视频帧,否则就无法根据多组形成时刻与移动目标的位置坐标的对应关系拟合形成上述二次曲线;其次,考虑到即使移动目标处于非直线运动状态下,那么在不同时间段内,用于描述该移动目标的运动轨迹的二次曲线也可能发生变化,因此,通过选取与第一视频帧的形成时刻最为接近的具有智能帧的至少三个视频帧来拟合二次曲线,可以认为能够更加准确的描述移动目标的运行轨迹。
具体的,至少三个视频帧各自对应的智能帧包括第一智能帧、第二智能帧以及第三智能帧。然后可以将第一智能帧、第二智能帧以及第三智能帧各自的时间戳所表征的形成时刻均归一化到[0,1]之间,且将各个经归一化处理后的形成时刻与移动目标位置坐标的对应关系代入到预先构建的二次函数中,就可以获得二次曲线。同时还可以将所获得的二次曲线转换为矩阵表达式,以便于基于该矩阵表达式可以快速确定出不具有智能帧的视频帧在形成时刻所包含的移动目标的位置坐标。
例如,请参见图3,预先构建的二次函数为P(t)=A1+A2t+A3t2,其中,Ai为向量,i为不大于3的正整数,t为时间参数。由于第一智能帧、第二智能帧以及第三智能帧各自的时间戳所表征的形成时刻将均归一化到[0,1]之间,即第一智能帧的时间戳所表征的时刻可以作为起点时刻,第二智能帧的时间戳所表征的时刻作为中点时刻,第三智能帧的时间戳所表征的时刻作为终点时刻,然后分别将起点时刻、中点时刻以及终点时刻各自所对应的移动目标的位置坐标(P1、P2以及P3)代入到上述二次函数中,可以得到如下方程组:
t=0:P(0)=A1=P1
t=1:P(1)=A1+A2+A3=P3
t=0.5:P(0.5)=A1+0.5A2+0.25A3=P2
将Ai用Pi代入P(t),解出方程可得:
P(t)=A1+A2t+A3t2=(2t2-3t+1)P1+(-4t2+4t)P2+(2t2-t)P3
再将二次曲线P(t)转换为矩阵表达式:
进一步简化表示为:
其中,[x(t),y(t)]为第一视频帧中所包含的移动目标的位置坐标,t为时间参数,矩阵中的i1-i9为常数,[x1,y1]为第一智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x2,y2]为第二智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x3,y3]为第三智能帧中时间戳所表征的形成时刻移动目标的位置坐标。
应理解,不同移动目标的运动轨迹所对应的二次曲线可能不相同,因此上述用于拟合二次曲线的P1、P2以及P3为同一移动目标在不同视频帧的形成时刻分别对应的位置坐标,因此,拟合后所获得的二次曲线可以表征的是同一移动目标在任一时刻的位置坐标。
步骤103:基于第一视频帧的形成时刻与二次曲线,确定第一视频帧中所包含的移动目标的预测位置坐标,并基于预测位置坐标绘制移动目标的边框。
本发明实施例中,在获得二次曲线之后,就可以基于第一视频帧的形成时刻,确定出第一视频帧中所包含的移动目标的位置坐标。
作为一种可能的实施方式,可以基于第一视频帧的形成时刻与二次曲线,确定出第一视频帧中所包含的移动目标的预测位置坐标。
具体的,考虑到在拟合二次曲线的过程中,将第一智能帧、第二智能帧以及第三智能帧各自的时间戳所表征的形成时刻均归一化到[0,1]之间,在基于第一视频帧的形成时刻来确定移动目标的预测位置坐标时,也需要先将第一视频帧的时间戳所表征的形成时刻进行归一化处理,然后再代入到二次曲线所对应的矩阵表达式中,从而确定出第一视频帧在形成时刻所包含的移动目标的位置坐标。
例如,第一智能帧的时间戳所表征的形成时刻、第二智能帧的时间戳所表征的形成时刻以及第三智能帧的时间戳所表征的形成时刻依次增加,那么归一化处理基于如下公式:
其中,tx表示第一视频帧的时间戳所表征的形成时刻进行归一化处理后得到的时间参数,Tx表示第一视频帧的时间戳所表征的形成时刻,T1表示第一智能帧的时间戳所表征的形成时刻,T2表示第三智能帧的时间戳所表征的形成时刻。
应理解,0<tx<1时,则表明第一视频帧的形成时刻可能位于第一智能帧的时间戳所表征的形成时刻与第二智能帧的时间戳所表征的形成时刻之间,或者,第二智能帧的时间戳所表征的形成时刻与第三智能帧的时间戳所表征的形成时刻之间;当tx>1时,则表明第一视频帧的形成时刻晚于第三智能帧的时间戳所表征的形成时刻。
在确定第一视频帧中所包含的移动目标的预测位置坐标之后,就可以基于该预测位置坐标绘制出该移动目标所对应的目标边框。
应理解,本申请中可以当显示设备需要显示第一视频帧时,才基于上述过程来确定第一视频帧中所包含的移动目标的预测位置坐标,进而基于预设位置坐标为移动目标绘制目标边框,也可以将经解析后获得的多个视频帧以及与部分视频帧一一对应的智能帧分别进行缓存,即在显示设备未显示之前,就针对缓存中的第一视频帧(不存在对应的智能帧)的形成时刻确定出所包含的移动目标的位置坐标(由于分别对视频帧与智能帧进行了缓存,因此可以认为在拟合二次曲线时,能够基于第一视频帧的形成时刻从缓存的多个视频帧中确定出具有智能帧的至少三个视频帧,且第一视频帧的形成时刻位于至少三个视频帧的形成时刻之间,那么基于上述至少三个视频帧的形成时刻与移动目标的坐标的对应关系拟合所得到的二次曲线,来计算第一视频帧在形成时刻所包含的移动目标的位置坐标更为准确。),那么当通过显示设备显示第一视频帧时,直接根据预先确定的移动目标的预测位置坐标绘制对应的目标边框即可。此处不对何时确定第一视频帧中所包含的移动目标的预测位置坐标进行特别限制。
请参见图4,基于同一发明构思,本发明实施例提供了一种目标边框确定装置,该装置包括:解析单元201、第一处理单元202以及第二处理单元203。
解析单元201,用于对视频流进行解析,获得视频流中的多个视频帧以及与部分视频帧一一对应的智能帧,智能帧用于指示对应的视频帧在形成时刻所包含的移动目标的位置坐标;
第一处理单元202,用于若确定多个视频帧中的第一视频帧不存在对应的智能帧,则确定出与第一视频帧在形成时刻上最为接近的具有智能帧的至少三个视频帧,并基于至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系拟合形成二次曲线;
第二处理单元203,用于基于第一视频帧的形成时刻与二次曲线,确定第一视频帧中所包含的移动目标的预测位置坐标,并基于预测位置坐标绘制移动目标的边框。
可选的,解析单元201具体用于:
基于每一帧中成对设置的帧头与帧尾将视频流解析为多个视频帧以及与多个视频帧中部分视频帧一一对应的智能帧,其中,帧头中包括帧类型,帧类型包括视频帧与智能帧,帧头中还包括时间戳用于指示视频帧的形成时刻,一一对应的视频帧和智能帧具有相同时间戳,帧尾用于指示位于帧头之后的数据结束。
可选的,所述至少三个视频帧各自对应的智能帧包括第一智能帧、第二智能帧以及第三智能帧,第一处理单元202具体用于:
将第一智能帧、第二智能帧以及第三智能帧各自的时间戳所表征的形成时刻与移动目标位置坐标的对应关系代入预先构建的二次函数表达式,获得二次曲线,其中,第一智能帧的时间戳所表征的形成时刻、第二智能帧的时间戳所表征的形成时刻以及第三智能帧的时间戳所表征的形成时刻均被归一化到[0,1]之间;
将二次曲线转换为对应的矩阵表达式;
其中,[x(t),y(t)]为第一视频帧中所包含的移动目标的位置坐标,t为时间参数,矩阵中的i1-i9为常数,[x1,y1]为第一智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x2,y2]为第二智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x3,y3]为第三智能帧中时间戳所表征的形成时刻移动目标的位置坐标。
可选的,第二处理单元203具体用于:
将第一视频帧的时间戳所表征的形成时刻进行归一化处理,获得对应的时间参数;
将时间参数代入到二次曲线的矩阵表达式中,获得第一视频帧中所包含的移动目标的位置坐标。
可选的,若第一智能帧的时间戳所表征的形成时刻、第二智能帧的时间戳所表征的形成时刻以及第三智能帧的时间戳所表征的形成时刻依次增加,归一化处理基于如下公式:
其中,tx表示第一视频帧的时间戳所表征的形成时刻进行归一化处理后得到的时间参数,Tx表示第一视频帧的时间戳所表征的形成时刻,T1表示第一智能帧的时间戳所表征的形成时刻,T2表示第三智能帧的时间戳所表征的形成时刻。
请参见图5,基于同一发明构思,本发明实施例提供了一种目标边框确定装置,该装置包括至少一个处理器301,处理器301用于执行存储器中存储的计算机程序,实现本发明实施例提供的如图1所示的目标边框确定方法的步骤。
可选的,处理器301具体可以是中央处理器、特定ASIC,可以是一个或多个用于控制程序执行的集成电路。
可选的,该装置还可以包括与至少一个处理器301连接的存储器302,存储器302可以包括ROM、RAM和磁盘存储器。存储器302用于存储处理器301运行时所需的数据,即存储有可被至少一个处理器301执行的指令,至少一个处理器301通过执行存储器302存储的指令,执行如图1所示的方法。其中,存储器302的数量为一个或多个。其中,存储器302在图4中一并示出,但需要知道的是存储器302不是必选的功能模块,因此在图4中以虚线示出。
其中,解析单元201、第一处理单元202以及第二处理单元203所对应的实体设备均可以是前述的处理器301。该装置可以用于执行图1所示的实施例提供的方法。因此关于该装置中各功能模块所能够实现的功能,可参考图1所示的实施例中的相应描述,不多赘述。
本发明实施例还提供一种计算机存储介质,其中,计算机存储介质存储有计算机指令,当计算机指令在计算机上运行时,使得计算机执行如图1所述的方法。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种目标边框确定方法,其特征在于,所述方法包括:
对视频流进行解析,获得视频流中的多个视频帧以及与部分视频帧一一对应的智能帧,智能帧用于指示对应的视频帧在形成时刻所包含的移动目标的位置坐标;
若确定所述多个视频帧中的第一视频帧不存在对应的智能帧,则确定出与所述第一视频帧在形成时刻上最为接近的具有智能帧的至少三个视频帧,并基于所述至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系拟合形成二次曲线;
基于所述第一视频帧的形成时刻与所述二次曲线,确定所述第一视频帧中所包含的移动目标的预测位置坐标,并基于所述预测位置坐标绘制移动目标的边框。
2.如权利要求1所述的方法,其特征在于,对视频流进行解析,获得视频流中的多个视频帧以及与部分视频帧一一对应的智能帧包括:
基于每一帧中成对设置的帧头与帧尾将视频流解析为所述多个视频帧以及与所述多个视频帧中部分视频帧一一对应的智能帧,其中,所述帧头中包括帧类型,所述帧类型包括视频帧与智能帧,所述帧头中还包括时间戳用于指示视频帧的形成时刻,一一对应的视频帧和智能帧具有相同时间戳,所述帧尾用于指示位于所述帧头之后的数据结束。
3.如权利要求2所述的方法,其特征在于,所述至少三个视频帧各自对应的智能帧包括第一智能帧、第二智能帧以及第三智能帧,基于所述至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系拟合形成二次曲线包括:
将所述第一智能帧、所述第二智能帧以及所述第三智能帧各自的时间戳所表征的形成时刻与移动目标位置坐标的对应关系代入预先构建的二次函数表达式,获得所述二次曲线,其中,所述第一智能帧的时间戳所表征的形成时刻、所述第二智能帧的时间戳所表征的形成时刻以及所述第三智能帧的时间戳所表征的形成时刻均被归一化到[0,1]之间;
将所述二次曲线转换为对应的矩阵表达式;
其中,[x(t),y(t)]为第一视频帧中所包含的移动目标的位置坐标,t为时间参数,矩阵中的i1-i9为常数,[x1,y1]为第一智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x2,y2]为第二智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x3,y3]为第三智能帧中时间戳所表征的形成时刻移动目标的位置坐标。
4.如权利要求3所述的方法,其特征在于,基于所述第一视频帧的形成时刻与所述二次曲线,确定所述第一视频帧中所包含的移动目标的预测位置坐标包括:
将所述第一视频帧的时间戳所表征的形成时刻进行归一化处理,获得对应的时间参数;
将所述时间参数代入到所述二次曲线的矩阵表达式中,获得所述第一视频帧中所包含的移动目标的位置坐标。
6.一种目标边框确定装置,其特征在于,所述装置包括:
解析单元,用于对视频流进行解析,获得视频流中的多个视频帧以及与部分视频帧一一对应的智能帧,智能帧用于指示对应的视频帧在形成时刻所包含的移动目标的位置坐标;
第一处理单元,用于若确定所述多个视频帧中的第一视频帧不存在对应的智能帧,则确定出与所述第一视频帧在形成时刻上最为接近的具有智能帧的至少三个视频帧,并基于所述至少三个视频帧各自的形成时刻与移动目标的位置坐标的对应关系拟合形成二次曲线;
第二处理单元,用于基于所述第一视频帧的形成时刻与所述二次曲线,确定所述第一视频帧中所包含的移动目标的预测位置坐标,并基于所述预测位置坐标绘制移动目标的边框。
7.如权利要求6所述的装置,其特征在于,所述解析单元具体用于:
基于每一帧中成对设置的帧头与帧尾将视频流解析为所述多个视频帧以及与所述多个视频帧中部分视频帧一一对应的智能帧,其中,所述帧头中包括帧类型,所述帧类型包括视频帧与智能帧,所述帧头中还包括时间戳用于指示视频帧的形成时刻,一一对应的视频帧和智能帧具有相同时间戳,所述帧尾用于指示位于所述帧头之后的数据结束。
8.如权利要求7所述的装置,其特征在于,所述至少三个视频帧各自对应的智能帧包括第一智能帧、第二智能帧以及第三智能帧,所述第一处理单元具体用于:
将所述第一智能帧、所述第二智能帧以及所述第三智能帧各自的时间戳所表征的形成时刻与移动目标位置坐标的对应关系代入预先构建的二次函数表达式,获得所述二次曲线,其中,所述第一智能帧的时间戳所表征的形成时刻、所述第二智能帧的时间戳所表征的形成时刻以及所述第三智能帧的时间戳所表征的形成时刻均被归一化到[0,1]之间;
将所述二次曲线转换为对应的矩阵表达式;
其中,[x(t),y(t)]为第一视频帧中所包含的移动目标的位置坐标,t为时间参数,矩阵中的i1-i9为常数,[x1,y1]为第一智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x2,y2]为第二智能帧中时间戳所表征的形成时刻移动目标的位置坐标,[x3,y3]为第三智能帧中时间戳所表征的形成时刻移动目标的位置坐标。
9.一种目标边框确定装置,其特征在于,所述装置包括至少一个处理器以及与所述至少一个处理器连接的存储器,所述至少一个处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行是实现如权利要求1-5任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110080126.4A CN112884830B (zh) | 2021-01-21 | 2021-01-21 | 一种目标边框确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110080126.4A CN112884830B (zh) | 2021-01-21 | 2021-01-21 | 一种目标边框确定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112884830A true CN112884830A (zh) | 2021-06-01 |
CN112884830B CN112884830B (zh) | 2024-03-29 |
Family
ID=76050086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110080126.4A Active CN112884830B (zh) | 2021-01-21 | 2021-01-21 | 一种目标边框确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112884830B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105100718A (zh) * | 2015-07-29 | 2015-11-25 | 西安冉科信息技术有限公司 | 一种基于视频摘要的智能视频分析方法 |
CN105913454A (zh) * | 2016-04-06 | 2016-08-31 | 东南大学 | 一种视频图像中运动目标的像素坐标轨迹预测方法 |
WO2018086360A1 (en) * | 2016-11-08 | 2018-05-17 | Zhejiang Dahua Technology Co., Ltd. | Methods and systems for data visualization |
CN108983306A (zh) * | 2018-06-06 | 2018-12-11 | 浙江大华技术股份有限公司 | 一种物品边框平滑显示的方法及安检设备 |
CN109753883A (zh) * | 2018-12-13 | 2019-05-14 | 北京字节跳动网络技术有限公司 | 视频定位方法、装置、存储介质和电子设备 |
CN109781030A (zh) * | 2019-01-23 | 2019-05-21 | 四川大学 | 相位校正方法、装置、电子设备及计算机可读存储介质 |
CN110062272A (zh) * | 2019-04-30 | 2019-07-26 | 腾讯科技(深圳)有限公司 | 一种视频数据处理方法和相关装置 |
CN110264492A (zh) * | 2019-06-03 | 2019-09-20 | 浙江大学 | 一种高效的卫星图像自纠正多目标跟踪方法 |
CN110366029A (zh) * | 2019-07-04 | 2019-10-22 | 中国科学院深圳先进技术研究院 | 一种视频间插入图像帧的方法、系统及电子设备 |
CN111553256A (zh) * | 2020-04-26 | 2020-08-18 | 上海天诚比集科技有限公司 | 基于物体轨迹识别的高空抛物预警识别方法 |
CN112001851A (zh) * | 2019-05-27 | 2020-11-27 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
-
2021
- 2021-01-21 CN CN202110080126.4A patent/CN112884830B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105100718A (zh) * | 2015-07-29 | 2015-11-25 | 西安冉科信息技术有限公司 | 一种基于视频摘要的智能视频分析方法 |
CN105913454A (zh) * | 2016-04-06 | 2016-08-31 | 东南大学 | 一种视频图像中运动目标的像素坐标轨迹预测方法 |
WO2018086360A1 (en) * | 2016-11-08 | 2018-05-17 | Zhejiang Dahua Technology Co., Ltd. | Methods and systems for data visualization |
CN108983306A (zh) * | 2018-06-06 | 2018-12-11 | 浙江大华技术股份有限公司 | 一种物品边框平滑显示的方法及安检设备 |
CN109753883A (zh) * | 2018-12-13 | 2019-05-14 | 北京字节跳动网络技术有限公司 | 视频定位方法、装置、存储介质和电子设备 |
CN109781030A (zh) * | 2019-01-23 | 2019-05-21 | 四川大学 | 相位校正方法、装置、电子设备及计算机可读存储介质 |
CN110062272A (zh) * | 2019-04-30 | 2019-07-26 | 腾讯科技(深圳)有限公司 | 一种视频数据处理方法和相关装置 |
CN112001851A (zh) * | 2019-05-27 | 2020-11-27 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
CN110264492A (zh) * | 2019-06-03 | 2019-09-20 | 浙江大学 | 一种高效的卫星图像自纠正多目标跟踪方法 |
CN110366029A (zh) * | 2019-07-04 | 2019-10-22 | 中国科学院深圳先进技术研究院 | 一种视频间插入图像帧的方法、系统及电子设备 |
CN111553256A (zh) * | 2020-04-26 | 2020-08-18 | 上海天诚比集科技有限公司 | 基于物体轨迹识别的高空抛物预警识别方法 |
Non-Patent Citations (4)
Title |
---|
TSUNG-HAN TSAI ET AL.: "High Visual Quality Particle Based Frame Rate Up Conversion With Acceleration Assisted Motion Trajectory Calibration", JOURNAL OF DISPLAY TECHNOLOGY, vol. 8, no. 6, pages 1 - 10 * |
李猛;胡永健;刘贝;刘海永;廖广军;: "基于TCS-LBP算子的视频帧复制篡改检测算法", 华南理工大学学报(自然科学版), no. 05, 31 May 2018 (2018-05-31) * |
杨博;刘建;陈杰;任伟;戈志伟;周莉;: "采用亚像素缝雕刻的图像整形算法", 计算机辅助设计与图形学学报, no. 10, 31 October 2016 (2016-10-31) * |
王燕;陈婧;章菲菲;张旭;姜嘉浩;: "基于多核DSP平台的交通视频运动目标检测跟踪实现", 信息通信, no. 12, 31 December 2016 (2016-12-31) * |
Also Published As
Publication number | Publication date |
---|---|
CN112884830B (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108122234B (zh) | 卷积神经网络训练及视频处理方法、装置和电子设备 | |
LU101981B1 (en) | Traffic video background modeling method and system | |
JP6588053B2 (ja) | 点群データにアノテーションを付与する方法および装置 | |
US11135513B2 (en) | Virtual vehicle control method, model training method, control device and storage medium | |
EP3271865B1 (en) | Detecting segments of a video program | |
US20230186486A1 (en) | Vehicle tracking method and apparatus, and electronic device | |
CN111192292A (zh) | 基于注意力机制与孪生网络的目标跟踪方法及相关设备 | |
DE102016222267A1 (de) | Verfahren und System zum Erfassen eines sich bewegenden Objekts mit einer einzelnen Kamera | |
US11514625B2 (en) | Motion trajectory drawing method and apparatus, and device and storage medium | |
US11222431B2 (en) | Feature processing method and device for motion trajectory, and computer storage medium | |
KR101173559B1 (ko) | 비디오 동영상의 움직이는 다중 객체 자동 분할 장치 및 방법 | |
CN108235116A (zh) | 特征传播方法和装置、电子设备、程序和介质 | |
CN101572770B (zh) | 一种可用于实时监控的运动检测方法与装置 | |
CN114511041B (zh) | 模型训练方法、图像处理方法、装置、设备和存储介质 | |
CN110309720A (zh) | 视频检测方法、装置、电子设备和计算机可读介质 | |
CN109344801A (zh) | 一种物体检测方法及装置 | |
CN112381071A (zh) | 一种视频流中目标的行为分析方法、终端设备及介质 | |
CN108734127B (zh) | 年龄识别值调整方法、装置、设备及存储介质 | |
CN113505720A (zh) | 图像处理方法及装置、存储介质、电子装置 | |
CN110633630B (zh) | 一种行为识别方法、装置及终端设备 | |
CN112884830A (zh) | 一种目标边框确定方法及装置 | |
CN117274314A (zh) | 一种特征融合的视频目标跟踪方法及系统 | |
CN109102526B (zh) | 无人机的监控系统的前景检测方法以及装置 | |
CN110414845B (zh) | 针对目标交易的风险评估方法及装置 | |
CN114998172A (zh) | 图像处理方法及相关系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |