CN111612825A - 基于光流与多尺度上下文的图像序列运动遮挡检测方法 - Google Patents
基于光流与多尺度上下文的图像序列运动遮挡检测方法 Download PDFInfo
- Publication number
- CN111612825A CN111612825A CN202010596307.8A CN202010596307A CN111612825A CN 111612825 A CN111612825 A CN 111612825A CN 202010596307 A CN202010596307 A CN 202010596307A CN 111612825 A CN111612825 A CN 111612825A
- Authority
- CN
- China
- Prior art keywords
- optical flow
- pyramid
- occlusion
- image sequence
- scale context
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/269—Analysis of motion using gradient-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于光流与多尺度上下文的图像序列运动遮挡检测方法,通过选择输入图像序列中的任意连续两帧图像;对选择的两帧图像进行特征金字塔下采样分层;在每层金字塔中对当前层中的连续帧图像特征计算相关度;构建基于光流和多尺度上下文的遮挡检测模块,为遮挡检测模块输入光流和特征图相关度的叠加,在金字塔各层中进行相同的遮挡检测,在到达金字塔顶层时,输出最终遮挡检测结果。本发明基于光流与多尺度上下文的图像序列运动遮挡检测方法,采用多尺度上下文获取更大范围图像信息,优化非刚性运动和大位移区域的遮挡信息,对于非刚性运动和大位移等图像序列具有更高的计算精度和更好的适用性。
Description
技术领域
本发明涉及图像序列光流计算技术领域,具体涉及一种基于光流与多尺度上下文的图像序列运动遮挡检测方法。
背景技术
运动遮挡是由图像序列中物体和场景相互运动引起的像素点遮挡现象,通过定位遮挡像素点提取运动遮挡区域是图像处理、计算机视觉等领域的热点问题。近年来,随着深度学习理论与技术的快速发展,卷积神经网络模型被广泛应用于遮挡检测技术研究,由于该类方法具有计算速度快、稳定性高等显著优点,因此逐渐成为遮挡检测研究领域的热点,研究成果被广泛应用于动作识别、人体姿态识别、光流估计、人脸识别、目标跟踪和三维重建等更高级视觉任务。
目前,基于光流前后一致性的遮挡检测技术是图像序列光流计算技术中最常采用的一类遮挡检测方法,该类方法能够计算得到较为粗糙的遮挡图。由于此类方法精度较低,并且对于包含非刚性运动和大位移的图像序列鲁棒性较差,限制了此类方法在各个领域的应用。
发明内容
本发明的目的在于针对现有技术的缺陷和不足,提供一种基于光流与多尺度上下文的图像序列运动遮挡检测方法,利用多尺度上下文优化金字塔各层的遮挡检测结果,以提高图像序列金字塔分层模型遮挡检测的精度和鲁棒性。
为实现上述目的,本发明采用的技术方案是这样的。基于光流与多尺度上下文的图像序列运动遮挡检测方法,包含如下步骤:
1)选择输入图像序列中的任意连续两帧图像;
2)对选择的两帧图像进行特征金字塔下采样分层,获取三层分辨率不同的特征图;
3)在每层金字塔中对当前层中的连续帧图像特征计算相关度,然后使用相关度计算光流;
4)构建基于光流和多尺度上下文的遮挡检测模块,模块中包括一个前置3×3卷积,四条平行分支,每条分支包含三个具有不同扩展率的3×3卷积,二个聚合3×3卷积,除去最后一个卷积外,每个卷积后的激活函数均为Leaky ReLU,计算公式如下:
式中:Fi代表了第i={1,2,3,4}条分支的输出,运算符号Convij代表了第i={1,2,3,4}条分支的第j={1,2,3}个卷积运算;
多尺度上下文的遮挡检测模块的最终输出可以表示为:
Fout=(ConvS2(ConvS1(concatenate(F1,F2,F3,F4)))) (2)
式中:ConvS1和ConvS2是具有相同扩展率的两个3×3卷积,代表最终聚合信息的卷积操作,concatenate是通道叠加运算;
5)为遮挡检测模块输入光流和特征图相关度的叠加,即可得到遮挡特征图;在遮挡特征图中,像素点的值越高,代表此像素点在第二帧中发生遮挡的概率越大,而像素点的值越低,代表此像素点在第二帧中发生遮挡的概率越小;
6)在金字塔各层中进行相同的遮挡检测,在到达金字塔顶层时,输出最终遮挡检测结果。
本发明基于光流与多尺度上下文的图像序列运动遮挡检测方法,采用多尺度上下文获取更大范围图像信息,优化非刚性运动和大位移区域的遮挡信息,对于非刚性运动和大位移等图像序列具有更高的计算精度和更好的适用性。
附图说明
图1是本发明实施例Markt5图像序列第一帧图像;
图2是本发明实施例Markt5图像序列第二帧图像;
图3是本发明实施例图像序列金字塔分层模型总体图;
图4是本发明实施例中多尺度上下文遮挡检测模块结构图;
图5是本发明实施例计算所得的Markt5图像序列遮挡检测特征图;
图6是本发明实施例计算所得的Markt5图像序列二值化遮挡检测特征图。
具体实施方式
下面结合附图,对本发明作进一步的说明。参看图1至图6所示,以下列举本发明的一个的实施例,基于特征变形误差遮挡检测的图像序列光流计算方法,使用Markt5图像序列光流计算实验进行说明:
它包含如下步骤:
一、输入Markt5图像序列第一帧图像和Markt5图像序列第二帧图像(如图1和图2所示);
二、对输入的Temple3图像序列进行特征金字塔下采样分层(如图3所示);第一帧图像It指的是Markt5图像序列第一帧图像,第一帧图像It+1指的是Markt5图像序列第二帧图像。分别对It和It+1进行下采样,建立特征金字塔,分层数为三层,得到三层分辨率不同的特征图。
三、在特征金字塔的每层中对相邻的两帧连续帧图像特征计算相关度,然后使用相关度计算光流(如图3所示);
四、构建基于光流和多尺度上下文遮挡检测模块(如图4所示),基于光流和多尺度上下文遮挡检测模块中包括一个前置3×3卷积,四条平行分支——每条分支包含三个具有不同扩展率的3×3卷积,二个聚合3×3卷积,除去最后一个卷积外,每个卷积后的激活函数均为Leaky ReLU,计算公式如下:
式中,Fi代表了第i={1,2,3,4}条分支的输出,运算符号Convij代表了第i={1,2,3,4}条分支的第j={1,2,3}个卷积运算;
多尺度上下文的遮挡检测模块的最终输出可以表示为:
Fout=(ConvS2(ConvS1(concatenate(F1,F2,F3,F4)))) (2)
式中,ConvS1和ConvS2是具有相同扩展率的两个3×3卷积,代表最终聚合信息的卷积操作,concatenate是通道叠加运算。
五、为遮挡检测模块输入光流和特征图相关度的叠加,即可得到Markt5图像序列遮挡特征图(如图5所示);图中像素点的值越高,代表此像素点在第二帧中发生遮挡的概率越大,而像素点的值越低,代表此像素点在第二帧中发生遮挡的概率越小。
六、在金字塔各层中进行相同的遮挡检测,在到达金字塔顶层时,输出最终Markt5图像序列二值化遮挡检测特征图(如图6所示)。
以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。
Claims (1)
1.基于光流与多尺度上下文的图像序列运动遮挡检测方法,包含如下步骤:
1)选择输入图像序列中的任意连续两帧图像;
2)对选择的两帧图像进行特征金字塔下采样分层,获取三层分辨率不同的特征图;
3)在每层金字塔中对当前层中的连续帧图像特征计算相关度,然后使用相关度计算光流;
4)构建基于光流和多尺度上下文的遮挡检测模块,模块中包括一个前置3×3卷积,四条平行分支,每条分支包含三个具有不同扩展率的3×3卷积,二个聚合3×3卷积,除去最后一个卷积外,卷积后的激活函数均为Leaky ReLU,计算公式如下:
式中:Fi代表了第i={1,2,3,4}条分支的输出,运算符号Convij代表了第i={1,2,3,4}条分支的第j={1,2,3}个卷积运算;
多尺度上下文的遮挡检测模块的最终输出可以表示为:
Fout=(ConvS2(ConvS1(concatenate(F1,F2,F3,F4)))) (2)
式中:ConvS1和ConvS2是具有相同扩展率的两个3×3卷积,代表最终聚合信息的卷积操作,concatenate是通道叠加运算;
5)为遮挡检测模块输入光流和特征图相关度的叠加,即可得到遮挡特征图;在遮挡特征图中,像素点的值越高,代表此像素点在第二帧中发生遮挡的概率越大,而像素点的值越低,代表此像素点在第二帧中发生遮挡的概率越小;
6)在金字塔各层中进行相同的遮挡检测,在到达金字塔顶层时,输出最终遮挡检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010596307.8A CN111612825B (zh) | 2020-06-28 | 2020-06-28 | 基于光流与多尺度上下文的图像序列运动遮挡检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010596307.8A CN111612825B (zh) | 2020-06-28 | 2020-06-28 | 基于光流与多尺度上下文的图像序列运动遮挡检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111612825A true CN111612825A (zh) | 2020-09-01 |
CN111612825B CN111612825B (zh) | 2023-05-02 |
Family
ID=72201139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010596307.8A Active CN111612825B (zh) | 2020-06-28 | 2020-06-28 | 基于光流与多尺度上下文的图像序列运动遮挡检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111612825B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112233179A (zh) * | 2020-10-20 | 2021-01-15 | 湘潭大学 | 一种视觉里程计测量方法 |
CN112465872A (zh) * | 2020-12-10 | 2021-03-09 | 南昌航空大学 | 一种基于可学习遮挡掩模与二次变形优化的图像序列光流估计方法 |
CN112767441A (zh) * | 2021-01-08 | 2021-05-07 | 南昌航空大学 | 一种基于残差场和位移场的图像光流优化方法及系统 |
CN113838102A (zh) * | 2021-09-26 | 2021-12-24 | 南昌航空大学 | 一种基于各向异性稠密卷积的光流确定方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787901A (zh) * | 2016-03-21 | 2016-07-20 | 昆明理工大学 | 一种用于太阳高分辨图像序列中相邻两帧间的多尺度速度场测量方法 |
CN111144465A (zh) * | 2019-12-17 | 2020-05-12 | 上海工程技术大学 | 一种面向多场景的烟雾检测算法及应用该算法的电子设备 |
CN111340844A (zh) * | 2020-02-24 | 2020-06-26 | 南昌航空大学 | 基于自注意力机制的多尺度特征光流学习计算方法 |
-
2020
- 2020-06-28 CN CN202010596307.8A patent/CN111612825B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787901A (zh) * | 2016-03-21 | 2016-07-20 | 昆明理工大学 | 一种用于太阳高分辨图像序列中相邻两帧间的多尺度速度场测量方法 |
CN111144465A (zh) * | 2019-12-17 | 2020-05-12 | 上海工程技术大学 | 一种面向多场景的烟雾检测算法及应用该算法的电子设备 |
CN111340844A (zh) * | 2020-02-24 | 2020-06-26 | 南昌航空大学 | 基于自注意力机制的多尺度特征光流学习计算方法 |
Non-Patent Citations (1)
Title |
---|
肖军;朱世鹏;黄杭;谢亚男;: "基于光流法的运动目标检测与跟踪算法", 东北大学学报(自然科学版) * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112233179A (zh) * | 2020-10-20 | 2021-01-15 | 湘潭大学 | 一种视觉里程计测量方法 |
CN112233179B (zh) * | 2020-10-20 | 2022-08-19 | 湘潭大学 | 一种视觉里程计测量方法 |
CN112465872A (zh) * | 2020-12-10 | 2021-03-09 | 南昌航空大学 | 一种基于可学习遮挡掩模与二次变形优化的图像序列光流估计方法 |
CN112465872B (zh) * | 2020-12-10 | 2022-08-26 | 南昌航空大学 | 一种基于可学习遮挡掩模与二次变形优化的图像序列光流估计方法 |
CN112767441A (zh) * | 2021-01-08 | 2021-05-07 | 南昌航空大学 | 一种基于残差场和位移场的图像光流优化方法及系统 |
CN112767441B (zh) * | 2021-01-08 | 2023-06-06 | 南昌航空大学 | 一种基于残差场和位移场的图像光流优化方法及系统 |
CN113838102A (zh) * | 2021-09-26 | 2021-12-24 | 南昌航空大学 | 一种基于各向异性稠密卷积的光流确定方法和系统 |
CN113838102B (zh) * | 2021-09-26 | 2023-06-06 | 南昌航空大学 | 一种基于各向异性稠密卷积的光流确定方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111612825B (zh) | 2023-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109377530B (zh) | 一种基于深度神经网络的双目深度估计方法 | |
CN111612825A (zh) | 基于光流与多尺度上下文的图像序列运动遮挡检测方法 | |
CN110490919B (zh) | 一种基于深度神经网络的单目视觉的深度估计方法 | |
CN111340844B (zh) | 基于自注意力机制的多尺度特征光流学习计算方法 | |
Ding et al. | Spatio-temporal recurrent networks for event-based optical flow estimation | |
CN112232134B (zh) | 一种基于沙漏网络结合注意力机制的人体姿态估计方法 | |
CN112465872B (zh) | 一种基于可学习遮挡掩模与二次变形优化的图像序列光流估计方法 | |
CN111402292B (zh) | 基于特征变形误差遮挡检测的图像序列光流计算方法 | |
CN113284251B (zh) | 一种自适应视角的级联网络三维重建方法及系统 | |
Xue et al. | Boundary-induced and scene-aggregated network for monocular depth prediction | |
CN111914756A (zh) | 一种视频数据处理方法和装置 | |
CN111652081A (zh) | 一种基于光流特征融合的视频语义分割方法 | |
CN116310098A (zh) | 一种基于注意力机制与可变卷积深度网络的多视图三维重建方法 | |
CN116596966A (zh) | 一种基于注意力和特征融合的分割与跟踪方法 | |
CN113838102B (zh) | 一种基于各向异性稠密卷积的光流确定方法和系统 | |
Cho et al. | Modified perceptual cycle generative adversarial network-based image enhancement for improving accuracy of low light image segmentation | |
CN117934308A (zh) | 一种基于图卷积网络的轻量化自监督单目深度估计方法 | |
CN112509014B (zh) | 金字塔遮挡检测块匹配的鲁棒插值光流计算方法 | |
CN112115786B (zh) | 基于注意力U-net的单目视觉里程计方法 | |
CN116188550A (zh) | 一种基于几何约束的自监督深度视觉里程计 | |
CN117952883A (zh) | 一种基于双边网格和显著性引导的逆光图像增强方法 | |
CN116486107B (zh) | 一种光流计算方法、系统、设备及介质 | |
CN116972874A (zh) | 一种基于光流全局感知的无监督单目视觉里程计 | |
CN108492308B (zh) | 一种基于相互结构引导滤波的变分光流的确定方法及系统 | |
AU2021104479A4 (en) | Text recognition method and system based on decoupled attention mechanism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |