CN105100546A - 运动估计方法及装置 - Google Patents
运动估计方法及装置 Download PDFInfo
- Publication number
- CN105100546A CN105100546A CN201410854079.4A CN201410854079A CN105100546A CN 105100546 A CN105100546 A CN 105100546A CN 201410854079 A CN201410854079 A CN 201410854079A CN 105100546 A CN105100546 A CN 105100546A
- Authority
- CN
- China
- Prior art keywords
- present frame
- frame
- motion vector
- vector
- pyramid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000033001 locomotion Effects 0.000 title claims abstract description 115
- 238000000034 method Methods 0.000 title claims abstract description 100
- 239000013598 vector Substances 0.000 claims abstract description 177
- 238000012545 processing Methods 0.000 claims abstract description 21
- 230000008569 process Effects 0.000 claims description 44
- 238000013519 translation Methods 0.000 claims description 27
- 238000013461 design Methods 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 6
- 230000037431 insertion Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种运动估计方法及装置,其中该方法包括:将参考帧和当前帧的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量;根据旋转矢量和缩放矢量对当前帧进行插值,得到旋转缩放后的当前帧;对旋转缩放后的当前帧进行灰度投影处理,得到参考帧与当前帧之间的运动矢量。通过本发明,提高了运动估计的准确度。
Description
技术领域
本发明涉及图像处理领域,具体而言,涉及一种运动估计方法及装置。
背景技术
摄像机在移动过程中所拍摄的图像序列不仅包含了摄像机的主动运动,同时也引入了一些不希望的运动(如移动平台的振动),通常是不规则的随机运动。由于这种随机运动的存在,会因为视觉暂留而造成观察图像序列模糊和抖动,不便于观察,同时也给有用信息的提取和应用带来困难。图像稳定就是从输入的视频图像序列中去除因为摄像机的随机运动而引入的图像扰动,使图像序列稳定的处理过程。
稳像技术的发展,经历了从机械到光学再到目前的电子稳像等阶段。电子稳像技术采用高速数字图像信号处理技术,直接确定视频图像序列帧间运动矢量,分离图像序列的平稳运动和抖动参量,对抖动分量进行补偿,使输出视频序列看起来平滑、稳定。
与传统的光学稳像、机械稳像方法相比,电子稳像具有易于操作,更精确、更灵活、体积小以及价格低,能耗小、高智能化等特点。
电子稳像作为一种视频增强技术成为移动视频应用不可缺少的一部分,如为机器人的远程遥控系统、无人车辆导航系统提供平滑清晰的视频图像序列;为视频侦察系统中目标检测、跟踪提供可靠的预处理。近年来随着现代图像传感器技术、大规模集成电路技术、现代信号处理技术的飞速发展,所获取的图像分辨率越来越高,处理图像信号速度越来越快,使得电子稳像技术成为现代稳像技术发展的一个方向。
随着无人机和直升机应用的迅速发展,以及机器视觉技术的不断进步,航拍视频的处理和分析在电力巡线、林业防火、海域监控等诸多领域得到越来越广泛的应用。
由于无人机和直升机在拍摄过程中受到发动机、气流和人工控制因素而造成视频的抖动与模糊,对后续的检测和跟踪等处理造成严重不良的影响,有必要对航拍视频进行电子稳像处理,与机械稳像和光学稳像等传统的方法相比,基于图像处理的电子稳像具有精确、轻便、成本低、能耗小等优点,是新一代稳像方法,能更好的应用于无人机和直升机的视频拍摄,而运动估计是电子稳像的前提和基础,因此,对于航拍视频的运动估计方法的发明十分有意义。
运动估计的主要方法有块匹配法、位平面匹配法、特征匹配法、光流法和灰度投影法等。其中,块匹配法具有较高的精度,缺点是全局搜索,计算量大,实时性差;光流法能够准确估计全局运动,但存在遮挡、孔径等问题。位平面匹配法匹配速度快,但只能达到像素级精度。与其他方法不同的是,灰度投影法是一种对两帧图像进行灰度曲线匹配的运动估计方法,具有运算速度快、估计精度高等特点。航拍视频具有数据量大、运动复杂等特性,为了使灰度投影法更好地适用于航拍视频的运动估计,应针对传统的灰度投影法只能估计平移运动、像素级精度等缺陷进行改进。
发明内容
本发明提供了一种运动估计方法及装置,以至少解决现有技术运动模型很少针对具有数据量大、运动复杂特点的航拍视频的问题。
根据本发明的一个方面,提供了一种运动估计方法,包括:
将参考帧和当前帧的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量;
根据旋转矢量和缩放矢量对当前帧进行插值,得到旋转缩放后的当前帧;
对旋转缩放后的当前帧进行灰度投影处理,得到参考帧与当前帧之间的运动矢量。
进一步的:
将参考帧和当前帧的笛卡尔坐标转换为极坐标之前,还包括:以参考帧和当前帧的原始图像为最底层构建图像高斯金字塔,得到层数为L的参考帧金字塔和当前帧金字塔;
根据旋转矢量和缩放矢量对当前帧进行插值,得到旋转缩放后的当前帧,包括:将旋转矢量和缩放矢量插值到当前帧金字塔的各层图像,得到旋转缩放后的当前帧金字塔;
对旋转缩放后的当前帧进行灰度投影处理,得到参考帧与当前帧之间的运动矢量,包括:从插值得到的当前帧图像高斯金字塔的最高层开始,对最高层进行灰度投影处理得到平移运动矢量,并将平移矢量放大预定倍数后插入到下一层图像中,再对插入平移矢量后的下一层图像进行灰度投影处理得到平移运动矢量,将平移运动矢量放大预定倍数后插入下一层图像的下一层,直到插值得到的当前帧图像高斯金字塔的最底层;对插值得到的最底层进行分块灰度投影,得到当前帧的运动矢量,其中,该预定倍数与构建图像金字塔分辨率调整的倍数对应。
进一步的,将参考帧和当前帧的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量,包括:对当前帧金字塔和参考帧金字塔的最高层的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量。
进一步的,对插值得到的最底层进行分块灰度投影,得到当前帧的运动矢量,包括:对插值得到的最底层进行分块灰度投影,得到各个分块的运动矢量;建立运动模型,利用各分块的运动矢量确定相机载体的运动矢量。
进一步的,上述方法还包括:对当前帧的金字塔、灰度曲线进行循环利用。
根据本发明的另一个方面,提供了一种运动估计装置,包括:
第一处理模块,用于将参考帧和当前帧的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量;
插值模块,用于根据旋转矢量和缩放矢量对当前帧进行插值,得到旋转缩放后的当前帧;
第二处理模块,用于对旋转缩放后的当前帧进行灰度投影处理,得到参考帧与当前帧之间的运动矢量。
进一步的:
装置,还包括:建立模块,用于以参考帧和当前帧的原始图像为最底层构建图像高斯金字塔,得到层数为L的参考帧金字塔和当前帧金字塔;
插值模块,用于将旋转矢量和缩放矢量插值到当前帧金字塔的各层图像,得到旋转缩放后的当前帧金字塔;
第二处理模块,用于从插值得到的当前帧图像高斯金字塔的最高层开始,对最高层进行灰度投影处理得到平移运动矢量,并将平移矢量放大预定倍数后插入到下一层图像中,再对插入平移矢量后的下一层图像进行灰度投影处理得到平移运动矢量,将平移运动矢量放大预定倍数后插入下一层图像的下一层,直到插值得到的当前帧图像高斯金字塔的最底层;对插值得到的最底层进行分块灰度投影,得到当前帧的运动矢量,其中,该预定倍数与构建图像金字塔分辨率调整的倍数对应。
进一步的,第一处理模块,用于对当前帧金字塔和参考帧金字塔的最高层的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量。
进一步的,第二处理模块,用于对插值得到的最底层进行分块灰度投影,得到各个分块的运动矢量;建立运动模型,利用各分块的运动矢量确定相机载体的运动矢量。
进一步的,对当前帧的金字塔、灰度曲线进行循环利用。
通过本发明,将当前帧和参考帧进行坐标转换,在极坐标下可以确定旋转和缩放运动参数,通过旋转和缩放后再进行灰度投影得到当前帧的运动矢量,进而提高了运动估计的准确度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的运动估计方法的流程图;
图2是根据本发明实施例的运动估计装置的结构框图;
图3是根据本发明实施例可选的运动估计方法的流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种运动估计方法,图1是根据本发明实施例的运动估计方法的流程图,如图1所示,该流程包括如下步骤:
步骤S102,将参考帧和当前帧的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量;
步骤S104,根据旋转矢量和缩放矢量对当前帧进行插值,得到旋转缩放后的当前帧;
步骤S106,对旋转缩放后的当前帧进行灰度投影处理,得到参考帧与当前帧之间的运动矢量。
通过本发明实施例,针对具有数据量大、运动复杂特点的航拍视频的问题,采用极坐标转换法同时从图像中直接、准确地估计出航拍视频中的平移、旋转和缩放运动矢量。
在本发明实施例的一个可选实施方式中,针对现有方法对于航拍视频的大幅度平移、旋转、缩放运动估计能力不足问题,该可选实施方式采用金字塔法由粗到精的对运动进行估计,能够准确估计视频中的大幅度运动。
在上述可选实施方式中,上述步骤S102将参考帧和当前帧的笛卡尔坐标转换为极坐标之前,还包括:以参考帧和当前帧的原始图像为最底层构建图像高斯金字塔,得到层数为L的参考帧金字塔和当前帧金字塔;
上述步骤S104根据旋转矢量和缩放矢量对当前帧进行插值,得到旋转缩放后的当前帧,包括:将旋转矢量和缩放矢量插值到当前帧金字塔的各层图像,得到旋转缩放后的当前帧金字塔;
上述步骤S106,对旋转缩放后的当前帧进行灰度投影处理,得到参考帧与当前帧之间的运动矢量,包括:从插值得到的当前帧图像高斯金字塔的最高层开始,对最高层进行灰度投影处理得到平移运动矢量,并将平移矢量放大预定倍数后插入到下一层图像中,再对插入平移矢量后的下一层图像进行灰度投影处理得到平移运动矢量,将平移运动矢量放大预定倍数后插入下一层图像的下一层,直到插值得到的当前帧图像高斯金字塔的最底层;对插值得到的最底层进行分块灰度投影,得到当前帧的运动矢量,其中,预定倍数与构建图像金字塔分辨率调整的倍数对应。
通过上述可选实施方式,对于参考帧和当前帧建立了高斯金字塔,而目前的灰度投影算法没有考虑到航拍图像大幅度运动的特点,灰度投影的相关算法都只在原图像上进行计算,导致大幅度抖动无法准确估计。将笛卡尔坐标转换为极坐标再进行灰度投影计算,获得旋转和缩放参数在此基础上计算出平移矢量,而目前灰度投影相关算法都只能直接从图像估计出平移矢量,而无法直接估计出旋转和缩放矢量。将旋转缩放运动矢量插值到当前帧图像,再进行平移运动矢量的计算,提高了运动估计的准确性。将平移运动矢量插值到当前帧图像,再逐层的进行灰度投影计算,而目前灰度投影相关算法无法通过由粗到精的对运动进行估计,而是直接估计图像间的运动矢量。
在本发明实施例的一个可选实施方式中,将参考帧和当前帧的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量,包括:对当前帧金字塔和参考帧金字塔的最高层的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量。通过该可选实施方式,由于旋转缩放矢量不会随着图像分辨率的降低而改变,在最低分辨率上进行极坐标转换,估计旋转缩放矢量,降低了计算量。
在本发明实施例的一个可选实施方式中,对插值得到的最底层进行分块灰度投影,得到当前帧的运动矢量,包括:对插值得到的最底层进行分块灰度投影,得到各个分块的运动矢量;建立运动模型,利用各分块的运动矢量确定相机载体的运动矢量。通过该可选实施方式,在金字塔的最底层采用分块的灰度投影方法,而目前的方法则直接在原图像进行分块灰度投影法。采用金字塔法结合分块匹配法的改进方法,使运动估计达到亚像素级别。
在本发明实施例的一个可选实施方式中,可以对当前帧的金字塔、灰度曲线进行循环利用。
在本实施例中还提供了一种运动估计装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图2是根据本发明实施例的运动估计装置的结构框图,如图2所示,该装置包括:
第一处理模块10,用于将参考帧和当前帧的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量;
插值模块20,与第一处理模块10相连,用于根据旋转矢量和缩放矢量对当前帧进行插值,得到旋转缩放后的当前帧;
第二处理模块30,与插值模块20相连,用于对旋转缩放后的当前帧进行灰度投影处理,得到参考帧与当前帧之间的运动矢量。
在本发明实施例的一个可选实施方式中,如图3所示,除上述模块之外,该装置还包括:建立模块40,用于以参考帧和当前帧的原始图像为最底层构建图像高斯金字塔,得到层数为L的参考帧金字塔和当前帧金字塔;
插值模块20,用于将旋转矢量和缩放矢量插值到当前帧金字塔的各层图像,得到旋转缩放后的当前帧金字塔;
第二处理模块30,用于从插值得到的当前帧图像高斯金字塔的最高层开始,对最高层进行灰度投影处理得到平移运动矢量,并将平移矢量插入放大预定倍数后到下一层图像中,再对插入平移矢量后的下一层图像进行灰度投影处理得到平移运动矢量,将平移运动矢量放大预定倍数后插入下一层图像的下一层,直到插值得到的当前帧图像高斯金字塔的最底层;对插值得到的最底层进行分块灰度投影,得到当前帧的运动矢量,其中,该预定倍数与构建图像金字塔分辨率调整的倍数对应。
在本发明实施例的一个可选实施方式中,第一处理模块10,用于对当前帧金字塔和参考帧金字塔的最高层的笛卡尔坐标转换为极坐标,在极坐标下进行灰度投影处理,得到参考帧与当前帧之间的旋转矢量和缩放矢量。
在本发明实施例的一个可选实施方式中,第二处理模块30,用于对插值得到的最底层进行分块灰度投影,得到各个分块的运动矢量;建立运动模型,利用各分块的运动矢量确定相机载体的运动矢量。
进一步的,可以对当前帧的金字塔、灰度曲线进行循环利用。
下面对本发明实施例的可选实施方式进行描述。
可选实施方式一
在该可选实施方式中,运动估计方法基于金字塔和分块匹配的灰度投影法,能够实现基于航拍视频的运动估计。
图3是根据本发明实施例可选的运动估计方法的流程图,如图3所示,该流程包括以下步骤:
步骤S302,读取航拍视频的两帧图像,分别作为参考帧和当前帧;
步骤S304,对参考帧和当前帧图像进行灰度直方图均衡化的预处理,使整幅图像的灰度均匀的分布;
步骤S306-S308,对于视频中的任意一帧图像,规定原始图像为金字塔的最底层,通过向上降采样缩小图像分辨率构建图像高斯金字塔。
可选地,从金字塔的当前层生成更高层,先用高斯核对图像进行卷积,得到中间图像,然后删除中间图像所有的偶数行和偶数列,得到的更高层图像的面积为当前层图像的四分之一,更高层图像包含的运动量为当前层的二倍。对输入的图像进行循环的降采样操作,直到构建了指定层数的高斯。
步骤S310-S312,在最低分辨率图像层上,将图像笛卡尔坐标转换为极坐标,进行行列的灰度投影计算,可以得到旋转缩放运动矢量;
步骤S314,对当前金字塔层的当前帧按照旋转缩放运动矢量进行变换,将旋转缩放运动矢量插值到当前帧图像中;
步骤S316,在低分辨率上进行灰度投影计算平移运动矢量;
步骤S318,将平移运动矢量变为原来的二倍,对下一级金字塔层的当前帧按二倍的平移运动矢量进行变换,即将二倍的平移运动矢量插值到当前帧图像中。
步骤S320,循环执行步骤六、步骤七直到达到金字塔的最底层;
步骤S322-S326,在金字塔的最底层采用分块的灰度投影方法,建立仿射模型,获得旋转和平移参数;
步骤S328,将当前帧的图像金字塔、灰度曲线,更新为参考帧图像金字塔、灰度曲线,迭代利用,减少重复计算。
通过该可选实施方式,对于参考帧和当前帧建立了高斯金字塔,而目前的灰度投影算法没有考虑到航拍图像大幅度运动的特点,灰度投影的相关算法都只在原图像上进行计算,导致大幅度抖动无法准确估计。
进一步逇,将图像笛卡尔坐标转换为极坐标再进行灰度投影计算,获得旋转和缩放参数,在步骤六和步骤7计算出平移矢量,而目前灰度投影相关算法都只能直接从图像估计出平移矢量,而无法直接估计出旋转和缩放矢量。
进一步逇,由于旋转缩放矢量不会随着图像分辨率的降低而改变,在最低分辨率上进行极坐标转换,估计旋转缩放矢量,降低了计算量,目前还没有使用此策略的方法。
进一步逇,将旋转缩放运动矢量插值到当前帧图像,再进行平移运动矢量的计算,提高了运动估计的准确性,目前还没有使用此策略的方法。
进一步逇,将平移运动矢量插值到当前帧图像,再逐层的进行灰度投影计算,而目前灰度投影相关算法无法通过由粗到精的对运动进行估计,而是直接估计图像间的运动矢量。
进一步逇,在金字塔的最底层采用分块的灰度投影方法,而目前的方法则直接在原图像进行分块灰度投影法。
进一步逇,对于当前帧的图像金字塔、灰度曲线进行循环利用,目前还没有使用此策略的方法。
进一步逇,可以实现基于航拍视频的大幅度的平移、旋转、缩放的亚像素级估计。
可选实施方式二
在该可选实施方式中,针对航拍视频数据量大、运动幅度大、运动形式复杂的特点,采用改进的灰度投影法进行亚像素级的运动估计,首先,对采集的航拍视频的两帧构建图像金字塔,对金字塔的高层图像进行灰度投影法估计平移运动量,对图像进行极坐标转换,采用灰度投影法计算旋转、缩放运动量,并对平移运动量逐层对图像进行插值,直到达到金字塔最底层;其次,对金字塔的底层图像进行分块的灰度投影法计算运动量;最后,建立运动模型,利用各分块的运动量,计算得到相机载体的运动参数。采用如下步骤:
(1)对视频读入的视频帧进行灰度直方图均衡化,对图像进行增强。
(2)高斯图像金字塔的建立
对于读入视频的第m帧图像规定原始图像为金字塔的最底层,构建图像高斯金字塔,通过向上降采样缩小图像分辨率。设金字塔有l层,从金字塔的第i层生成(i+1)层,分别表示为和用一定的高斯核对进行卷积,得到中间图像然后删除图像所有的偶数行和偶数列,得到的(i+1)层图像的面积为i层图像的四分之一,因此第i+1层图像包含的运动量是第i层的2倍。对输入的进行循环的降采样操作,直到构建了l层的高斯金字塔。
(3)对数极坐标下的灰度投影计算
灰度投影算法是对两幅图像的行和列灰度投影曲线进行匹配,分别可估计出垂直和水平方向的运动量。
在金字塔的最高层(即最低分辨率)图像上估计旋转和缩放矢量,将图像从笛卡尔坐标转换到对数极坐标系,将笛卡尔坐标(x,y)变换为(log(r),θ),其中,
对对数极坐标图像进行灰度投影计算,设第i层的参考帧和当前帧的分别为第m帧图像和第m+k帧图像其坐标变换后的对数极坐标图像为和两幅图像第ir行的灰度投影分别为和图像的大小为h×w,ic为列编号,f表示灰度值,则
对两帧图像的行灰度投影曲线进行相关计算,计算使下式最小的pmin, 其中,1≤p≤2q+1粗估计出旋转角度θ,
θ=q+1-pmin
将行与列进行互换可以得到两幅对数极坐标图像的水平方向的变化量dr,缩放矢量的粗估计值为s,
s=exp(dr)
(4)旋转缩放运动插值
将(3)中计算得出的当前金字塔层的旋转矢量θ和缩放矢量s对参考帧图像进行变换,将旋转缩放矢量插值到参考帧图像上,得到插值后的参考帧图像为,
(5)平移矢量计算
在笛卡尔坐标系下,对参考帧和当前帧进行灰度投影计算,可以得到当前层第i层金字塔两幅图像间的垂直运动矢量和水平运动矢量
(6)平移矢量插值
对金字塔第(i-1)层的参考帧按第i层金字塔的矢量的2倍进行平移变换,得到插值后的第(i-1)层的参考帧
并且,两帧图像间的平移矢量dx、dy分别为,(两帧之间的平移矢量初始值为dx=0,dy=0)
(7)循环步骤(5)(6),直到当前层为金字塔最低层,此时,参考帧为当前帧为
(8)分块灰度投影计算
对参考帧图像分为N个分块,对运动矢量进行精估计。图像上第j个分块的中心点坐标为(xj,yi)T(j=1,2,3,..,N),其在图像上的匹配块的中心点坐标为(x′j,y′j)T,对于每个分块分别与当前帧进行灰度投影计算,由于已经在金字塔中进行了逐层的估计和插值,此时当前层的第j个分块的运动矢量 可以利用灰度投影法准确的估计出来,对于N个分块,按照仿射变换模型,
利用最小二乘估计,可以精估计出当前层的平移旋转矢量θ(0)、s(0),进而得到帧间的平移矢量dx、dy、旋转矢量θ、缩放矢量s,
θ=θ+θ(0)
s=s+s(0)
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种运动估计方法,其特征在于,包括:
将参考帧和当前帧的笛卡尔坐标转换为极坐标,在所述极坐标下进行灰度投影处理,得到所述参考帧与所述当前帧之间的旋转矢量和缩放矢量;
根据所述旋转矢量和所述缩放矢量对所述当前帧进行插值,得到旋转缩放后的当前帧;
对所述旋转缩放后的当前帧进行灰度投影处理,得到所述参考帧与所述当前帧之间的运动矢量。
2.根据权利要求1所述的方法,其特征在于,
将参考帧和当前帧的笛卡尔坐标转换为极坐标之前,还包括:以参考帧和当前帧的原始图像为最底层构建图像高斯金字塔,得到层数为L的参考帧金字塔和当前帧金字塔;
根据所述旋转矢量和所述缩放矢量对所述当前帧进行插值,得到旋转缩放后的当前帧,包括:将所述旋转矢量和所述缩放矢量插值到所述当前帧金字塔的各层图像,得到旋转缩放后的当前帧金字塔;
对所述旋转缩放后的当前帧进行灰度投影处理,得到所述参考帧与所述当前帧之间的运动矢量,包括:从插值得到的当前帧图像高斯金字塔的最高层开始,对最高层进行灰度投影处理得到平移运动矢量,并将平移矢量放大预定倍数后插入到下一层图像中,再对插入平移矢量后的所述下一层图像进行灰度投影处理得到平移运动矢量,将平移运动矢量放大所述预定倍数后插入所述下一层图像的下一层,直到所述插值得到的当前帧图像高斯金字塔的最底层;对所述插值得到的最底层进行分块灰度投影,得到所述当前帧的运动矢量,其中,所述预定倍数与构建图像金字塔分辨率调整的倍数对应。
3.根据权利要求2所述的方法,其特征在于,将参考帧和当前帧的笛卡尔坐标转换为极坐标,在所述极坐标下进行灰度投影处理,得到所述参考帧与所述当前帧之间的旋转矢量和缩放矢量,包括:
对所述当前帧金字塔和所述参考帧金字塔的最高层的笛卡尔坐标转换为极坐标,在所述极坐标下进行灰度投影处理,得到所述参考帧与所述当前帧之间的旋转矢量和缩放矢量。
4.根据权利要求2或3所述的方法,其特征在于,对所述插值得到的最底层进行分块灰度投影,得到所述当前帧的运动矢量,包括:
对所述插值得到的最底层进行分块灰度投影,得到各个分块的运动矢量;建立运动模型,利用各分块的运动矢量确定相机载体的运动矢量。
5.根据权利要求1至3中任一项所述的方法,其特征在于,还包括:对当前帧的金字塔、灰度曲线进行循环利用。
6.一种运动估计装置,其特征在于,包括:
第一处理模块,用于将参考帧和当前帧的笛卡尔坐标转换为极坐标,在所述极坐标下进行灰度投影处理,得到所述参考帧与所述当前帧之间的旋转矢量和缩放矢量;
插值模块,用于根据所述旋转矢量和所述缩放矢量对所述当前帧进行插值,得到旋转缩放后的当前帧;
第二处理模块,用于对所述旋转缩放后的当前帧进行灰度投影处理,得到所述参考帧与所述当前帧之间的运动矢量。
7.根据权利要求7所述的装置,其特征在于,
所述装置,还包括:建立模块,用于以参考帧和当前帧的原始图像为最底层构建图像高斯金字塔,得到层数为L的参考帧金字塔和当前帧金字塔;
所述插值模块,用于将所述旋转矢量和所述缩放矢量插值到所述当前帧金字塔的各层图像,得到旋转缩放后的当前帧金字塔;
所述第二处理模块,用于从插值得到的当前帧图像高斯金字塔的最高层开始,对最高层进行灰度投影处理得到平移运动矢量,并将平移矢量放大预定倍数后插入到下一层图像中,再对插入平移矢量后的所述下一层图像进行灰度投影处理得到平移运动矢量,将平移运动矢量放大所述预定倍数后插入所述下一层图像的下一层,直到所述插值得到的当前帧图像高斯金字塔的最底层;对所述插值得到的最底层进行分块灰度投影,得到所述当前帧的运动矢量,其中,所述预定倍数与构建图像金字塔分辨率调整的倍数对应。
8.根据权利要求7所述的装置,其特征在于,所述第一处理模块,用于对所述当前帧金字塔和所述参考帧金字塔的最高层的笛卡尔坐标转换为极坐标,在所述极坐标下进行灰度投影处理,得到所述参考帧与所述当前帧之间的旋转矢量和缩放矢量。
9.根据权利要求7或8所述的装置,其特征在于,所述第二处理模块,用于对所述插值得到的最底层进行分块灰度投影,得到各个分块的运动矢量;建立运动模型,利用各分块的运动矢量确定相机载体的运动矢量。
10.根据权利要求6至8中任一项所述的装置,其特征在于,对当前帧的金字塔、灰度曲线进行循环利用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410854079.4A CN105100546A (zh) | 2014-12-31 | 2014-12-31 | 运动估计方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410854079.4A CN105100546A (zh) | 2014-12-31 | 2014-12-31 | 运动估计方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105100546A true CN105100546A (zh) | 2015-11-25 |
Family
ID=54580019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410854079.4A Pending CN105100546A (zh) | 2014-12-31 | 2014-12-31 | 运动估计方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105100546A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107135397A (zh) * | 2017-04-28 | 2017-09-05 | 中国科学技术大学 | 一种全景视频编码方法和装置 |
CN107911615A (zh) * | 2017-12-26 | 2018-04-13 | 北京理工大学 | 一种灰度投影稳像方法及系统 |
CN108051031A (zh) * | 2017-12-20 | 2018-05-18 | 台州职业技术学院 | 全方位移动机器人的位姿测量方法 |
CN108352074A (zh) * | 2015-12-04 | 2018-07-31 | 德州仪器公司 | 准参数光学流估计 |
CN108507476A (zh) * | 2018-04-27 | 2018-09-07 | 中国石油大学(北京) | 用于材料表面的位移场测量方法、装置、设备及存储介质 |
WO2018209997A1 (zh) * | 2017-05-15 | 2018-11-22 | 蔚来汽车有限公司 | 用于目标跟踪的车载毫米波雷达滤波估计方法、装置及存储介质 |
CN108871197A (zh) * | 2018-04-27 | 2018-11-23 | 中国石油大学(北京) | 用于材料表面的位移场测量方法、装置、设备及存储介质 |
CN109544584A (zh) * | 2018-11-30 | 2019-03-29 | 国网山东省电力公司信息通信公司 | 一种实现巡检稳像精度测量的方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102098440A (zh) * | 2010-12-16 | 2011-06-15 | 北京交通大学 | 针对摄像机抖动下运动目标检测的电子稳像方法及系统 |
CN102742260A (zh) * | 2010-02-11 | 2012-10-17 | 微软公司 | 通用平台视频图像稳定化 |
CN103024247A (zh) * | 2011-09-28 | 2013-04-03 | 中国航天科工集团第二研究院二〇七所 | 一种基于改进块匹配的电子稳像方法 |
CN103079037A (zh) * | 2013-02-05 | 2013-05-01 | 哈尔滨工业大学 | 基于远近景切换的自适应电子稳像方法 |
CN103841296A (zh) * | 2013-12-24 | 2014-06-04 | 哈尔滨工业大学 | 一种具有大范围旋转及平移运动估计的实时电子稳像方法 |
-
2014
- 2014-12-31 CN CN201410854079.4A patent/CN105100546A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102742260A (zh) * | 2010-02-11 | 2012-10-17 | 微软公司 | 通用平台视频图像稳定化 |
CN102098440A (zh) * | 2010-12-16 | 2011-06-15 | 北京交通大学 | 针对摄像机抖动下运动目标检测的电子稳像方法及系统 |
CN103024247A (zh) * | 2011-09-28 | 2013-04-03 | 中国航天科工集团第二研究院二〇七所 | 一种基于改进块匹配的电子稳像方法 |
CN103079037A (zh) * | 2013-02-05 | 2013-05-01 | 哈尔滨工业大学 | 基于远近景切换的自适应电子稳像方法 |
CN103841296A (zh) * | 2013-12-24 | 2014-06-04 | 哈尔滨工业大学 | 一种具有大范围旋转及平移运动估计的实时电子稳像方法 |
Non-Patent Citations (1)
Title |
---|
余博等: "基于对数极坐标变换的灰度投影稳像算法", 《计算机应用》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108352074A (zh) * | 2015-12-04 | 2018-07-31 | 德州仪器公司 | 准参数光学流估计 |
US11341750B2 (en) | 2015-12-04 | 2022-05-24 | Texas Instruments Incorporated | Quasi-parametric optical flow estimation |
CN108352074B (zh) * | 2015-12-04 | 2021-11-26 | 德州仪器公司 | 光学流估计的图像处理系统和方法 |
CN107135397A (zh) * | 2017-04-28 | 2017-09-05 | 中国科学技术大学 | 一种全景视频编码方法和装置 |
WO2018209997A1 (zh) * | 2017-05-15 | 2018-11-22 | 蔚来汽车有限公司 | 用于目标跟踪的车载毫米波雷达滤波估计方法、装置及存储介质 |
CN108051031A (zh) * | 2017-12-20 | 2018-05-18 | 台州职业技术学院 | 全方位移动机器人的位姿测量方法 |
CN107911615B (zh) * | 2017-12-26 | 2019-07-02 | 北京理工大学 | 一种灰度投影稳像方法及系统 |
CN107911615A (zh) * | 2017-12-26 | 2018-04-13 | 北京理工大学 | 一种灰度投影稳像方法及系统 |
CN108871197A (zh) * | 2018-04-27 | 2018-11-23 | 中国石油大学(北京) | 用于材料表面的位移场测量方法、装置、设备及存储介质 |
CN108871197B (zh) * | 2018-04-27 | 2020-07-28 | 中国石油大学(北京) | 用于材料表面的位移场测量方法、装置、设备及存储介质 |
CN108507476B (zh) * | 2018-04-27 | 2020-08-07 | 中国石油大学(北京) | 用于材料表面的位移场测量方法、装置、设备及存储介质 |
CN108507476A (zh) * | 2018-04-27 | 2018-09-07 | 中国石油大学(北京) | 用于材料表面的位移场测量方法、装置、设备及存储介质 |
CN109544584A (zh) * | 2018-11-30 | 2019-03-29 | 国网山东省电力公司信息通信公司 | 一种实现巡检稳像精度测量的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105100546A (zh) | 运动估计方法及装置 | |
CN108665496B (zh) | 一种基于深度学习的端到端的语义即时定位与建图方法 | |
CN108848304B (zh) | 一种全景视频的目标跟踪方法、装置和全景相机 | |
CN102231792B (zh) | 基于特征匹配的电子稳像方法 | |
Shimizu et al. | Super-resolution from image sequence under influence of hot-air optical turbulence | |
CN110146099B (zh) | 一种基于深度学习的同步定位与地图构建方法 | |
CN107749987B (zh) | 一种基于块运动估计的数字视频稳像方法 | |
CN105758426A (zh) | 移动机器人的多传感器的联合标定方法 | |
CN105791705A (zh) | 适用于移动式延时摄影的视频防抖方法、系统及拍摄终端 | |
WO2014181726A1 (ja) | 背景差分抽出装置及び背景差分抽出方法 | |
CN103813099A (zh) | 一种基于特征点匹配的视频防抖方法 | |
CN104065854A (zh) | 一种图像处理方法及一种电子设备 | |
WO2018176929A1 (zh) | 一种图像背景虚化方法及装置 | |
CN103841297A (zh) | 一种适用于合成运动摄像载体的电子稳像方法 | |
CN110378250B (zh) | 用于场景认知的神经网络的训练方法、装置及终端设备 | |
US11132586B2 (en) | Rolling shutter rectification in images/videos using convolutional neural networks with applications to SFM/SLAM with rolling shutter images/videos | |
CN114979489A (zh) | 基于陀螺仪的重型装备生产场景视频监控稳像方法及系统 | |
CN111222459B (zh) | 一种视角无关的视频三维人体姿态识别方法 | |
CN104010130B (zh) | 一种多窗口跟踪的稳像方法 | |
US20230280441A1 (en) | Pisition locking method of underwater equipment, terminal equipment, system and non-transitory medium | |
Vlahović et al. | Deep learning in video stabilization homography estimation | |
CN111028290B (zh) | 一种用于绘本阅读机器人的图形处理方法及装置 | |
CN114972025A (zh) | 一种基于yuv色彩空间的图像快速拼接方法 | |
CN109934853B (zh) | 基于响应图置信区域自适应特征融合的相关滤波跟踪方法 | |
CN112529943A (zh) | 一种物体检测方法、物体检测装置及智能设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20151125 |