CN105809712B - 一种高效大位移光流估计方法 - Google Patents

一种高效大位移光流估计方法 Download PDF

Info

Publication number
CN105809712B
CN105809712B CN201610118042.4A CN201610118042A CN105809712B CN 105809712 B CN105809712 B CN 105809712B CN 201610118042 A CN201610118042 A CN 201610118042A CN 105809712 B CN105809712 B CN 105809712B
Authority
CN
China
Prior art keywords
seed point
layer
light stream
matching
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610118042.4A
Other languages
English (en)
Other versions
CN105809712A (zh
Inventor
宋锐
胡银林
李云松
贾媛
王养利
祝桂林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201610118042.4A priority Critical patent/CN105809712B/zh
Publication of CN105809712A publication Critical patent/CN105809712A/zh
Application granted granted Critical
Publication of CN105809712B publication Critical patent/CN105809712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种高效大位移光流估计方法,包括:从视频里获取两张连续图像,将两帧图像按时间顺序分别标记为I1和I2;以I1和I2为最底层分别构造图像金字塔图像金字塔的每层上生成相同数目的种子点,并将最顶层上的种子点的匹配初始化为随机值;将获得的种子点在由图像金字塔依次从顶层到底层逐层进行匹配,每层种子点的匹配结果作为下一层相应种子点的初始值;将最底层种子点的匹配结果利用对边缘敏感的插值算法进行插值,将插值结果作为光流估计的初始值,然后利用变分能量优化模型进行优化,最终得到大位移光流估计结果。本发明具有更高效、更灵活的效果,可以随时根据应用场景的不同控制种子点的数目,产生不同效率、不同精度的光流结果。

Description

一种高效大位移光流估计方法
技术领域
本发明属于数字视频处理领域,尤其涉及一种高效大位移光流估计方法。
背景技术
光流估计是计算机视觉领域内的一个重要基础模块,其研究目的是通过建模计算出视频连续两帧间的运动信息,具体就是第一帧中每个像素在第二帧中的对应匹配像素。经过三十多年的发展,光流估计问题已经有非常多的相关研究,但在真实世界视频里的鲁棒光流估计仍然是个富有挑战性的问题。
光流估计根据所采用的方法的不同,大体可以分为两种:一种是基于Horn和Schunck提出的变分能量优化模型,一种是基于匹配的插值优化模型。
基于变分能量优化模型的算法虽然能够在小位移光流估计中取得非常精确的结果,但这种方法通常会在有大位移运动物体的场景下失败。
基于匹配的插值优化模型主要利用了在大位移运动中,两帧之间视觉关键点的匹配信息对光流估计结果的重要性。以一种相对稠密的匹配结果作为光流估计的初始值,可以很好的解决传统变分能量优化模型存在的问题。
然而,基于匹配的插值优化模型主要问题在于计算稠密匹配需要相当大的代价,并且其匹配结果的精度也直接影响到最终光流估计的效果。针对这种问题,本发明提出一种新的适用于大位移光流估计的稠密匹配算法,可以高效地得到精确的匹配信息。
发明内容
本发明的目的在于提供一种高效大位移光流估计方法,旨在解决基于匹配的插值优化模型主要问题在于计算稠密匹配需要相当大的代价,并且其匹配结果的精度也直接影响到最终光流估计的效果的问题。
本发明是这样实现的,一种高效大位移光流估计方法,该高效大位移光流估计方法包括以下步骤:
步骤一、从视频里获取两张连续图像,将两帧图像按时间顺序分别标记为I1和I2
步骤二、以I1和I2为最底层分别构造图像金字塔
步骤三、在图像金字塔的每层上生成相同数目的种子点,并将最顶层 上的种子点的匹配初始化为随机值;
步骤四、将步骤三获得的种子点在由步骤二的图像金字塔依次从顶层到底层逐层进行匹配,每层种子点的匹配结果作为下一层相应种子点的初始值;
步骤五、将最底层种子点的匹配结果利用对边缘敏感的插值算法进行插值,将插值结果作为光流估计的初始值,然后利用变分能量优化模型进行优化,最终得到大位移光流估计结果。
进一步,所述步骤二将每一级图像的长宽缩小为原来的1/2,分别得到k幅图像,其中即是最底层的原图,是最顶层。
进一步,所述步骤三在图像金字塔的每层上生成相同数目的种子点中将最底层的种子点设计为间隔为d的图像网格交点;上层的种子点均是最底层种子点的对应缩放版本,即:
{p(sl)}=η·{p(sl-1)},l≥1
其中l代表金字塔层数,{p(sl)}表示第l层种子点的在其上的位置,η表示金字塔缩放系数。
进一步,所述步骤三中将最顶层上的种子点的匹配初始化为随机值,然后与进行匹配(PatchMatch),所述与进行匹配匹配包括以下步骤:
第一步:邻域传播,即:
其中sm表示当前种子点,Nm表示对网格种子点之间使用自然邻域系统时当前种子点的相邻种子点集合,f(sm)表示当前种子点的运动矢量,C(f(·))表示对当前种子点使用f(·)为运动矢量时的匹配代价;
第二步:随机搜索,以当前最佳运动矢量f(sm)为中心,以指数递减半径 为搜索域,进行随机试探;迭代进行以上两步,直至收敛。
进一步,所述步骤四层内匹配方法相同,每层种子点的匹配值初始化为上一层种子点匹配值的缩放版本,即:
其中{f(sl)}为第l层种子点的运动矢量,η为金字塔的缩放系数。
本发明只需要不断的使用大块的匹配结果来指导小块的匹配过程,就可以得到精确的大位移匹配;在图像金字塔上由顶层到底层的匹配过程中,不断优化匹配结果。对于在顶层中消失的细小物体,特别是高速运动的细小物体能够在由粗到细的过程中逐渐恢复。相比于传统的基于变分能量优化模型的方法可以更好的处理大位移运动,传统的基于变分能量优化模型的方法因为对初始值有非常高的要求,导致其对于大位移运动时无法找到一个合适的初始值,在即使使用了由粗到细的策略后也并不能解决这个问题,主要是因为在由粗到细的变分优化过程中,顶层的错误逐层传播到了底层,特别是在存在高速运动小物体的情况下,相反,本发明会在由粗到细的过程中,不断优化匹配结果,极大地限制了上层错误的传播;相比于基于匹配的插值优化方法,本发明具有更高效、更灵活的效果,本发明可以随时根据应用场景的不同控制种子点的数目,产生不同效率、不同精度的光流结果。
附图说明
图1是本发明实施例提供的高效大位移光流估计方法流程图;
图2是本发明实施例提供的构造图像金字塔的示意图;
图3是本发明实施例提供的图像网格交点示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以 解释本发明,并不用于限定本发明。
下面结合附图对本发明的应用原理作进一步描述。
如图1所示,本发明实施例的一种高效大位移光流估计方法,该高效大位移光流估计方法包括以下步骤:
S101:从视频里获取两张连续图像,将两帧图像按时间顺序分别标记为I1和I2
S102:以I1和I2为最底层分别构造图像金字塔
S103:在图像金字塔的每层上生成相同数目的种子点,并将最顶层上的种子点的匹配初始化为随机值;
S104:将S103获得的种子点在由S102的图像金字塔依次从顶层到底层逐层进行匹配,每层种子点的匹配结果作为下一层相应种子点的初始值;
S105:将最底层种子点的匹配结果利用对边缘敏感的插值算法进行插值,将插值结果作为光流估计的初始值,然后利用变分能量优化模型进行优化,最终得到大位移光流估计结果。
如图2是构造图像金字塔的示意图。
所述S102将每一级图像的长宽缩小为原来的1/2,分别得到k幅图像,其中即是最底层的原图,是最顶层。
所述S103在图像金字塔的每层上生成相同数目的种子点中将最底层的种子点设计为间隔为d的图像网格交点,如图3所示;
上层的种子点均是最底层种子点的对应缩放版本,即:
{p(sl)}=η·{p(sl-1)},l≥1
其中l代表金字塔层数,{p(sl)}表示第l层种子点的在其上的位置,η表示金字塔缩放系数。
所述S103中将最顶层上的种子点的匹配初始化为随机值,然后与进行匹配(PatchMatch),所述与进行匹配匹配包括以下步骤:
第一步:邻域传播,即:
其中sm表示当前种子点,Nm表示对网格种子点之间使用自然邻域系统时当前种子点的相邻种子点集合,f(sm)表示当前种子点的运动矢量,C(f(·))表示对当前种子点使用f(·)为运动矢量时的匹配代价;
第二步:随机搜索,以当前最佳运动矢量f(sm)为中心,以指数递减半径为搜索域,进行随机试探;迭代进行以上两步,直至收敛。
所述S104层内匹配方法相同,每层种子点的匹配值初始化为上一层种子点匹配值的缩放版本,即:
其中{f(sl)}为第l层种子点的运动矢量,η为金字塔的缩放系数。
下面结合附图对本发明的应用原理作进一步描述。
一般而言对于两张图像是否连续没有硬性的要求,只要求两张图像有50%以上是重合的,例如:对于高帧率视频,间隔多帧的两帧图像也能作为输入;
在构造图像金字塔的过程中,金字塔的缩放系数可以固定为0.5,也可以更具实际应用选择0.1~0.9之间的数,缩放系数越高意味着金字塔层数越多;
在金字塔每层上生成种子点的过程中,一般为考虑到匹配的稠密性,种子点需要在图像空间里大致均匀分布,可以根据不同的应用需求,调整种子点分布的稠密程度;
在层内对种子点进行匹配时,可以根据应用的不同,使用不同的匹配方法;
在最后对种子点的匹配进行插值时,可以使用不同的插值优化模型。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种高效大位移光流估计方法,其特征在于,该高效大位移光流估计方法包括以下步骤:
步骤一、从视频里获取两张连续图像,将两帧图像按时间顺序分别标记为I1和I2
步骤二、以I1和I2为最底层分别构造图像金字塔
步骤三、在图像金字塔的每层上生成相同数目的种子点,并将最顶层上的种子点的匹配初始化为随机值;
步骤四、将步骤三获得的种子点在由步骤二的图像金字塔依次从顶层到底层逐层进行匹配,每层种子点的匹配结果作为下一层相应种子点的初始值;
步骤五、将最底层种子点的匹配结果利用对边缘敏感的插值算法进行插值,将插值结果作为光流估计的初始值,然后利用变分能量优化模型进行优化,最终得到大位移光流估计结果;
所述步骤二将每一级图像的长宽缩小为原来的1/2,分别得到k幅图像,其中即是最底层的原图,是最顶层;
所述步骤三在图像金字塔的每层上生成相同数目的种子点中将最底层的种子点设计为间隔为d的图像网格交点;上层的种子点均是最底层种子点的对应缩放版本,也就是每层种子点在当前层的坐标位置均是下层种子点坐标位置的η倍,即:
{p(sl)}=η·{p(sl-1)},l≥1;
其中l代表金字塔层数,{p(sl)}表示第l层种子点的在其上的位置,η表示金字塔缩放系数;
所述步骤三中将最顶层上的种子点的匹配初始化为随机值,然后与进行匹配,所述与进行匹配包括以下步骤:
第一步:邻域传播,即:
其中sm表示当前种子点,Nm表示对网格种子点之间使用自然邻域系统时当前种子点的相邻种子点集合,f(sm)表示当前种子点的运动矢量,C(f(·))表示对当前种子点使用f(·)为运动矢量时的匹配代价;
第二步:随机搜索,以当前最佳运动矢量f(sm)为中心,以指数递减半径为搜索域,进行随机试探;迭代进行以上两步,直至收敛;
所述步骤四中,每层种子点的匹配结果作为下一层相应种子点的初始值,即:
其中{f(sl)}为第l层种子点的运动矢量,η为金字塔的缩放系数。
CN201610118042.4A 2016-03-02 2016-03-02 一种高效大位移光流估计方法 Active CN105809712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610118042.4A CN105809712B (zh) 2016-03-02 2016-03-02 一种高效大位移光流估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610118042.4A CN105809712B (zh) 2016-03-02 2016-03-02 一种高效大位移光流估计方法

Publications (2)

Publication Number Publication Date
CN105809712A CN105809712A (zh) 2016-07-27
CN105809712B true CN105809712B (zh) 2018-10-19

Family

ID=56466545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610118042.4A Active CN105809712B (zh) 2016-03-02 2016-03-02 一种高效大位移光流估计方法

Country Status (1)

Country Link
CN (1) CN105809712B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108810317B (zh) * 2017-05-05 2021-03-09 展讯通信(上海)有限公司 真实运动估计方法及装置、计算机可读存储介质、终端
WO2019000396A1 (zh) * 2017-06-30 2019-01-03 深圳市大疆创新科技有限公司 光流跟踪装置和方法
CN107993255B (zh) * 2017-11-29 2021-11-19 哈尔滨工程大学 一种基于卷积神经网络的稠密光流估计方法
CN108241854B (zh) * 2018-01-02 2021-11-09 天津大学 一种基于运动和记忆信息的深度视频显著性检测方法
CN108289205A (zh) * 2018-02-09 2018-07-17 唐堂 一种模拟光合作用中的数据信息采集系统
CN108682029A (zh) * 2018-03-22 2018-10-19 深圳飞马机器人科技有限公司 多尺度密集匹配方法和系统
CN108492361A (zh) * 2018-03-23 2018-09-04 南华大学 一种剪纸画的制作中模型数字化模拟管理系统
CN108515262A (zh) * 2018-05-03 2018-09-11 广东水利电力职业技术学院(广东省水利电力技工学校) 一种新型激光雕刻单元设备控制系统
CN108564658A (zh) * 2018-05-03 2018-09-21 宁德师范学院 一种基于逆向工程的逐渐三维实体模型构建系统及方法
CN108648236A (zh) * 2018-05-11 2018-10-12 武汉电力职业技术学院 一种用于坐标测量的间接方法及控制系统
CN108769050A (zh) * 2018-06-04 2018-11-06 宁德师范学院 一种基于dnp协议的电力系统在线通讯系统
CN109151474B (zh) * 2018-08-23 2020-10-30 复旦大学 一种生成新视频帧的方法
CN110008425A (zh) * 2019-03-12 2019-07-12 重庆三峡学院 一种基于云服务的文化产业创意综合公共服务平台
CN109991882B (zh) * 2019-03-29 2020-09-22 黄山学院 一种智能烹饪机器人及智能烹饪方法
CN110628986A (zh) * 2019-10-14 2019-12-31 武汉科技大学 一种复合喷吹搅拌铁水脱硫装置及方法
CN112884817B (zh) * 2019-11-29 2022-08-02 中移物联网有限公司 稠密光流计算方法、装置、电子设备以及存储介质
CN113066103B (zh) * 2021-03-18 2023-02-21 鹏城实验室 一种相机帧间运动确定方法
CN117152221B (zh) * 2023-10-26 2024-01-16 山东科技大学 一种图像非刚性配准方法、系统、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722890A (zh) * 2012-06-07 2012-10-10 内蒙古科技大学 基于光流场模型的非刚性心脏图像分级配准方法
CN103700117A (zh) * 2013-11-21 2014-04-02 北京工业大学 一种基于tv-l1变分模型的鲁棒光流场估计方法
CN104157006A (zh) * 2013-05-13 2014-11-19 哈尔滨点石仿真科技有限公司 基于匹配和方向平滑约束优化的多尺度微分光流计算方法
CN104978728A (zh) * 2014-04-08 2015-10-14 南京理工大学 一种光流法的图像匹配系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722890A (zh) * 2012-06-07 2012-10-10 内蒙古科技大学 基于光流场模型的非刚性心脏图像分级配准方法
CN104157006A (zh) * 2013-05-13 2014-11-19 哈尔滨点石仿真科技有限公司 基于匹配和方向平滑约束优化的多尺度微分光流计算方法
CN103700117A (zh) * 2013-11-21 2014-04-02 北京工业大学 一种基于tv-l1变分模型的鲁棒光流场估计方法
CN104978728A (zh) * 2014-04-08 2015-10-14 南京理工大学 一种光流法的图像匹配系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Flow Fields:Dense Correspondence Fields for Highly Accurate Large Displacement Optical Flow Estimation;C.Bailer et al.;《2015 IEEE International Conference on Computer Vision》;20151231;全文 *
一种变分偏微分多模型光流求解方法;项学智 等;《仪器仪表学报》;20140131;第35卷(第1期);全文 *
基于图像局部结构的区域匹配变分光流算法;陈震 等;《电子学报》;20151130;第43卷(第11期);论文第2-3节 *

Also Published As

Publication number Publication date
CN105809712A (zh) 2016-07-27

Similar Documents

Publication Publication Date Title
CN105809712B (zh) 一种高效大位移光流估计方法
Zou et al. Df-net: Unsupervised joint learning of depth and flow using cross-task consistency
CN109271933B (zh) 基于视频流进行三维人体姿态估计的方法
CN107578436B (zh) 一种基于全卷积神经网络fcn的单目图像深度估计方法
CN109993095B (zh) 一种面向视频目标检测的帧级别特征聚合方法
KR20190100320A (ko) 이미지 처리를 위한 신경망 모델 훈련 방법, 장치 및 저장 매체
CN111105432B (zh) 基于深度学习的无监督端到端的驾驶环境感知方法
CN103034982B (zh) 一种基于变焦视频序列的图像超分辨率重建方法
CN107909150B (zh) 基于逐块随机梯度下降法在线训练cnn的方法与系统
CN105654492A (zh) 基于消费级摄像头的鲁棒实时三维重建方法
CN110674742B (zh) 基于DLinkNet的遥感图像道路提取方法
CN109509211A (zh) 同时定位与建图技术中的特征点提取与匹配方法及系统
WO2021051526A1 (zh) 多视图3d人体姿态估计方法及相关装置
CN107993255A (zh) 一种基于卷积神经网络的稠密光流估计方法
CN113313810B (zh) 一种透明物体的6d姿态参数计算方法
CN108961385B (zh) 一种slam构图方法及装置
CN104992403A (zh) 一种基于视觉相似度度量的混合操作算子图像重定向方法
CN110443883A (zh) 一种基于dropblock的单张彩色图片平面三维重建方法
CN106952304A (zh) 一种利用视频序列帧间相关性的深度图像计算方法
CN108682029A (zh) 多尺度密集匹配方法和系统
CN111951368A (zh) 一种点云、体素和多视图融合的深度学习方法
CN109658361A (zh) 一种顾及运动估计误差的运动场景超分辨率重建方法
CN111553296B (zh) 一种基于fpga实现的二值神经网络立体视觉匹配方法
JP2015507272A (ja) 3dモデル・モーフィングのための方法および装置
CN113449612A (zh) 一种基于子流型稀疏卷积的三维目标点云识别的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant