CN111612825A - 基于光流与多尺度上下文的图像序列运动遮挡检测方法 - Google Patents

基于光流与多尺度上下文的图像序列运动遮挡检测方法 Download PDF

Info

Publication number
CN111612825A
CN111612825A CN202010596307.8A CN202010596307A CN111612825A CN 111612825 A CN111612825 A CN 111612825A CN 202010596307 A CN202010596307 A CN 202010596307A CN 111612825 A CN111612825 A CN 111612825A
Authority
CN
China
Prior art keywords
optical flow
pyramid
occlusion
image sequence
scale context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010596307.8A
Other languages
English (en)
Other versions
CN111612825B (zh
Inventor
张聪炫
冯诚
陈震
黎明
江少锋
陈昊
范兵兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Hangkong University
Original Assignee
Nanchang Hangkong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Hangkong University filed Critical Nanchang Hangkong University
Priority to CN202010596307.8A priority Critical patent/CN111612825B/zh
Publication of CN111612825A publication Critical patent/CN111612825A/zh
Application granted granted Critical
Publication of CN111612825B publication Critical patent/CN111612825B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/269Analysis of motion using gradient-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于光流与多尺度上下文的图像序列运动遮挡检测方法,通过选择输入图像序列中的任意连续两帧图像;对选择的两帧图像进行特征金字塔下采样分层;在每层金字塔中对当前层中的连续帧图像特征计算相关度;构建基于光流和多尺度上下文的遮挡检测模块,为遮挡检测模块输入光流和特征图相关度的叠加,在金字塔各层中进行相同的遮挡检测,在到达金字塔顶层时,输出最终遮挡检测结果。本发明基于光流与多尺度上下文的图像序列运动遮挡检测方法,采用多尺度上下文获取更大范围图像信息,优化非刚性运动和大位移区域的遮挡信息,对于非刚性运动和大位移等图像序列具有更高的计算精度和更好的适用性。

Description

基于光流与多尺度上下文的图像序列运动遮挡检测方法
技术领域
本发明涉及图像序列光流计算技术领域,具体涉及一种基于光流与多尺度上下文的图像序列运动遮挡检测方法。
背景技术
运动遮挡是由图像序列中物体和场景相互运动引起的像素点遮挡现象,通过定位遮挡像素点提取运动遮挡区域是图像处理、计算机视觉等领域的热点问题。近年来,随着深度学习理论与技术的快速发展,卷积神经网络模型被广泛应用于遮挡检测技术研究,由于该类方法具有计算速度快、稳定性高等显著优点,因此逐渐成为遮挡检测研究领域的热点,研究成果被广泛应用于动作识别、人体姿态识别、光流估计、人脸识别、目标跟踪和三维重建等更高级视觉任务。
目前,基于光流前后一致性的遮挡检测技术是图像序列光流计算技术中最常采用的一类遮挡检测方法,该类方法能够计算得到较为粗糙的遮挡图。由于此类方法精度较低,并且对于包含非刚性运动和大位移的图像序列鲁棒性较差,限制了此类方法在各个领域的应用。
发明内容
本发明的目的在于针对现有技术的缺陷和不足,提供一种基于光流与多尺度上下文的图像序列运动遮挡检测方法,利用多尺度上下文优化金字塔各层的遮挡检测结果,以提高图像序列金字塔分层模型遮挡检测的精度和鲁棒性。
为实现上述目的,本发明采用的技术方案是这样的。基于光流与多尺度上下文的图像序列运动遮挡检测方法,包含如下步骤:
1)选择输入图像序列中的任意连续两帧图像;
2)对选择的两帧图像进行特征金字塔下采样分层,获取三层分辨率不同的特征图;
3)在每层金字塔中对当前层中的连续帧图像特征计算相关度,然后使用相关度计算光流;
4)构建基于光流和多尺度上下文的遮挡检测模块,模块中包括一个前置3×3卷积,四条平行分支,每条分支包含三个具有不同扩展率的3×3卷积,二个聚合3×3卷积,除去最后一个卷积外,每个卷积后的激活函数均为Leaky ReLU,计算公式如下:
Figure BDA0002557368740000011
式中:Fi代表了第i={1,2,3,4}条分支的输出,运算符号Convij代表了第i={1,2,3,4}条分支的第j={1,2,3}个卷积运算;
多尺度上下文的遮挡检测模块的最终输出可以表示为:
Fout=(ConvS2(ConvS1(concatenate(F1,F2,F3,F4)))) (2)
式中:ConvS1和ConvS2是具有相同扩展率的两个3×3卷积,代表最终聚合信息的卷积操作,concatenate是通道叠加运算;
5)为遮挡检测模块输入光流和特征图相关度的叠加,即可得到遮挡特征图;在遮挡特征图中,像素点的值越高,代表此像素点在第二帧中发生遮挡的概率越大,而像素点的值越低,代表此像素点在第二帧中发生遮挡的概率越小;
6)在金字塔各层中进行相同的遮挡检测,在到达金字塔顶层时,输出最终遮挡检测结果。
本发明基于光流与多尺度上下文的图像序列运动遮挡检测方法,采用多尺度上下文获取更大范围图像信息,优化非刚性运动和大位移区域的遮挡信息,对于非刚性运动和大位移等图像序列具有更高的计算精度和更好的适用性。
附图说明
图1是本发明实施例Markt5图像序列第一帧图像;
图2是本发明实施例Markt5图像序列第二帧图像;
图3是本发明实施例图像序列金字塔分层模型总体图;
图4是本发明实施例中多尺度上下文遮挡检测模块结构图;
图5是本发明实施例计算所得的Markt5图像序列遮挡检测特征图;
图6是本发明实施例计算所得的Markt5图像序列二值化遮挡检测特征图。
具体实施方式
下面结合附图,对本发明作进一步的说明。参看图1至图6所示,以下列举本发明的一个的实施例,基于特征变形误差遮挡检测的图像序列光流计算方法,使用Markt5图像序列光流计算实验进行说明:
它包含如下步骤:
一、输入Markt5图像序列第一帧图像和Markt5图像序列第二帧图像(如图1和图2所示);
二、对输入的Temple3图像序列进行特征金字塔下采样分层(如图3所示);第一帧图像It指的是Markt5图像序列第一帧图像,第一帧图像It+1指的是Markt5图像序列第二帧图像。分别对It和It+1进行下采样,建立特征金字塔,分层数为三层,得到三层分辨率不同的特征图。
三、在特征金字塔的每层中对相邻的两帧连续帧图像特征计算相关度,然后使用相关度计算光流(如图3所示);
四、构建基于光流和多尺度上下文遮挡检测模块(如图4所示),基于光流和多尺度上下文遮挡检测模块中包括一个前置3×3卷积,四条平行分支——每条分支包含三个具有不同扩展率的3×3卷积,二个聚合3×3卷积,除去最后一个卷积外,每个卷积后的激活函数均为Leaky ReLU,计算公式如下:
Figure BDA0002557368740000031
式中,Fi代表了第i={1,2,3,4}条分支的输出,运算符号Convij代表了第i={1,2,3,4}条分支的第j={1,2,3}个卷积运算;
多尺度上下文的遮挡检测模块的最终输出可以表示为:
Fout=(ConvS2(ConvS1(concatenate(F1,F2,F3,F4)))) (2)
式中,ConvS1和ConvS2是具有相同扩展率的两个3×3卷积,代表最终聚合信息的卷积操作,concatenate是通道叠加运算。
五、为遮挡检测模块输入光流和特征图相关度的叠加,即可得到Markt5图像序列遮挡特征图(如图5所示);图中像素点的值越高,代表此像素点在第二帧中发生遮挡的概率越大,而像素点的值越低,代表此像素点在第二帧中发生遮挡的概率越小。
六、在金字塔各层中进行相同的遮挡检测,在到达金字塔顶层时,输出最终Markt5图像序列二值化遮挡检测特征图(如图6所示)。
以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.基于光流与多尺度上下文的图像序列运动遮挡检测方法,包含如下步骤:
1)选择输入图像序列中的任意连续两帧图像;
2)对选择的两帧图像进行特征金字塔下采样分层,获取三层分辨率不同的特征图;
3)在每层金字塔中对当前层中的连续帧图像特征计算相关度,然后使用相关度计算光流;
4)构建基于光流和多尺度上下文的遮挡检测模块,模块中包括一个前置3×3卷积,四条平行分支,每条分支包含三个具有不同扩展率的3×3卷积,二个聚合3×3卷积,除去最后一个卷积外,卷积后的激活函数均为Leaky ReLU,计算公式如下:
Figure FDA0002557368730000011
式中:Fi代表了第i={1,2,3,4}条分支的输出,运算符号Convij代表了第i={1,2,3,4}条分支的第j={1,2,3}个卷积运算;
多尺度上下文的遮挡检测模块的最终输出可以表示为:
Fout=(ConvS2(ConvS1(concatenate(F1,F2,F3,F4)))) (2)
式中:ConvS1和ConvS2是具有相同扩展率的两个3×3卷积,代表最终聚合信息的卷积操作,concatenate是通道叠加运算;
5)为遮挡检测模块输入光流和特征图相关度的叠加,即可得到遮挡特征图;在遮挡特征图中,像素点的值越高,代表此像素点在第二帧中发生遮挡的概率越大,而像素点的值越低,代表此像素点在第二帧中发生遮挡的概率越小;
6)在金字塔各层中进行相同的遮挡检测,在到达金字塔顶层时,输出最终遮挡检测结果。
CN202010596307.8A 2020-06-28 2020-06-28 基于光流与多尺度上下文的图像序列运动遮挡检测方法 Active CN111612825B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010596307.8A CN111612825B (zh) 2020-06-28 2020-06-28 基于光流与多尺度上下文的图像序列运动遮挡检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010596307.8A CN111612825B (zh) 2020-06-28 2020-06-28 基于光流与多尺度上下文的图像序列运动遮挡检测方法

Publications (2)

Publication Number Publication Date
CN111612825A true CN111612825A (zh) 2020-09-01
CN111612825B CN111612825B (zh) 2023-05-02

Family

ID=72201139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010596307.8A Active CN111612825B (zh) 2020-06-28 2020-06-28 基于光流与多尺度上下文的图像序列运动遮挡检测方法

Country Status (1)

Country Link
CN (1) CN111612825B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112233179A (zh) * 2020-10-20 2021-01-15 湘潭大学 一种视觉里程计测量方法
CN112465872A (zh) * 2020-12-10 2021-03-09 南昌航空大学 一种基于可学习遮挡掩模与二次变形优化的图像序列光流估计方法
CN112767441A (zh) * 2021-01-08 2021-05-07 南昌航空大学 一种基于残差场和位移场的图像光流优化方法及系统
CN113838102A (zh) * 2021-09-26 2021-12-24 南昌航空大学 一种基于各向异性稠密卷积的光流确定方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787901A (zh) * 2016-03-21 2016-07-20 昆明理工大学 一种用于太阳高分辨图像序列中相邻两帧间的多尺度速度场测量方法
CN111144465A (zh) * 2019-12-17 2020-05-12 上海工程技术大学 一种面向多场景的烟雾检测算法及应用该算法的电子设备
CN111340844A (zh) * 2020-02-24 2020-06-26 南昌航空大学 基于自注意力机制的多尺度特征光流学习计算方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787901A (zh) * 2016-03-21 2016-07-20 昆明理工大学 一种用于太阳高分辨图像序列中相邻两帧间的多尺度速度场测量方法
CN111144465A (zh) * 2019-12-17 2020-05-12 上海工程技术大学 一种面向多场景的烟雾检测算法及应用该算法的电子设备
CN111340844A (zh) * 2020-02-24 2020-06-26 南昌航空大学 基于自注意力机制的多尺度特征光流学习计算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖军;朱世鹏;黄杭;谢亚男;: "基于光流法的运动目标检测与跟踪算法", 东北大学学报(自然科学版) *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112233179A (zh) * 2020-10-20 2021-01-15 湘潭大学 一种视觉里程计测量方法
CN112233179B (zh) * 2020-10-20 2022-08-19 湘潭大学 一种视觉里程计测量方法
CN112465872A (zh) * 2020-12-10 2021-03-09 南昌航空大学 一种基于可学习遮挡掩模与二次变形优化的图像序列光流估计方法
CN112465872B (zh) * 2020-12-10 2022-08-26 南昌航空大学 一种基于可学习遮挡掩模与二次变形优化的图像序列光流估计方法
CN112767441A (zh) * 2021-01-08 2021-05-07 南昌航空大学 一种基于残差场和位移场的图像光流优化方法及系统
CN112767441B (zh) * 2021-01-08 2023-06-06 南昌航空大学 一种基于残差场和位移场的图像光流优化方法及系统
CN113838102A (zh) * 2021-09-26 2021-12-24 南昌航空大学 一种基于各向异性稠密卷积的光流确定方法和系统
CN113838102B (zh) * 2021-09-26 2023-06-06 南昌航空大学 一种基于各向异性稠密卷积的光流确定方法和系统

Also Published As

Publication number Publication date
CN111612825B (zh) 2023-05-02

Similar Documents

Publication Publication Date Title
CN111612825A (zh) 基于光流与多尺度上下文的图像序列运动遮挡检测方法
CN110490919B (zh) 一种基于深度神经网络的单目视觉的深度估计方法
CN109377530B (zh) 一种基于深度神经网络的双目深度估计方法
CN111340844B (zh) 基于自注意力机制的多尺度特征光流学习计算方法
CN112232134B (zh) 一种基于沙漏网络结合注意力机制的人体姿态估计方法
CN111402292B (zh) 基于特征变形误差遮挡检测的图像序列光流计算方法
CN112465872B (zh) 一种基于可学习遮挡掩模与二次变形优化的图像序列光流估计方法
CN113284251B (zh) 一种自适应视角的级联网络三维重建方法及系统
Xue et al. Boundary-induced and scene-aggregated network for monocular depth prediction
CN112767441B (zh) 一种基于残差场和位移场的图像光流优化方法及系统
CN112802197A (zh) 动态场景下基于全卷积神经网络的视觉slam方法及系统
CN116310098A (zh) 一种基于注意力机制与可变卷积深度网络的多视图三维重建方法
CN112581423A (zh) 一种基于神经网络的汽车表面缺陷的快速检测方法
CN116596966A (zh) 一种基于注意力和特征融合的分割与跟踪方法
CN113936034B (zh) 一种结合帧间光流的表观运动联合弱小运动目标检测方法
CN115035172A (zh) 基于置信度分级及级间融合增强的深度估计方法及系统
CN116188550A (zh) 一种基于几何约束的自监督深度视觉里程计
CN111444913B (zh) 一种基于边缘引导稀疏注意力机制的车牌实时检测方法
Cho et al. Modified perceptual cycle generative adversarial network-based image enhancement for improving accuracy of low light image segmentation
CN108492308B (zh) 一种基于相互结构引导滤波的变分光流的确定方法及系统
CN113838102B (zh) 一种基于各向异性稠密卷积的光流确定方法和系统
AU2021104479A4 (en) Text recognition method and system based on decoupled attention mechanism
CN112509014B (zh) 金字塔遮挡检测块匹配的鲁棒插值光流计算方法
Zhou et al. Facial expressions and body postures emotion recognition based on convolutional attention network
CN104751448A (zh) 基于pca和噪声分离的在线视频跟踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant