CN111340852B - 一种基于优化语义分割的图像序列光流计算方法 - Google Patents

一种基于优化语义分割的图像序列光流计算方法 Download PDF

Info

Publication number
CN111340852B
CN111340852B CN202010160371.1A CN202010160371A CN111340852B CN 111340852 B CN111340852 B CN 111340852B CN 202010160371 A CN202010160371 A CN 202010160371A CN 111340852 B CN111340852 B CN 111340852B
Authority
CN
China
Prior art keywords
pixel
representing
optical flow
current frame
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010160371.1A
Other languages
English (en)
Other versions
CN111340852A (zh
Inventor
张聪炫
邓士心
陈震
黎明
危水根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Hangkong University
Original Assignee
Nanchang Hangkong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Hangkong University filed Critical Nanchang Hangkong University
Priority to CN202010160371.1A priority Critical patent/CN111340852B/zh
Publication of CN111340852A publication Critical patent/CN111340852A/zh
Application granted granted Critical
Publication of CN111340852B publication Critical patent/CN111340852B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/269Analysis of motion using gradient-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/215Motion-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

一种基于优化语义分割的图像序列光流计算方法,它包含如下步骤:一、输入连续两帧图片,利用去均值归一化光流模型计算连续两帧间的前景后景光流;二、输入连续两帧图片,利用
Figure DEST_PATH_IMAGE002
语义模型分割出连续两帧的标签图;三、将步骤一计算出的光流以及步骤二的标签图作为输入,利用全连接分层算法,得到优化分割图像;四、将步骤一中的连续两帧图片和计算出的光流结果以及步骤三中的优化分割结果作为输入量,利用前景光流模型计算最终光流结果;本发明采用全连接去均值归一化模型上加入了边窗滤波计算光流,然后使用全连接分层模型优化的分割图先验信息,最终利用前景光流模型优化最终光流,克服了针对光照突变场景图像序列光流计算结果精度较低的问题。

Description

一种基于优化语义分割的图像序列光流计算方法
技术领域
本发明涉及图像序列光流计算技术领域,具体涉及一种基于优化语义分割的图像序列光流计算方法。
背景技术
光流场是分析序列图像中运动目标的重要方法。光流场不仅包含了被观察物体的运动信息,而且携带有光景物三维结构的信息,所以光流场在不同的领域中具有很重要的作用:在计算机视觉中,诸如目标分割、识别、跟踪、机器人导航以及形状信息恢复等及其重要的任务;光流场计算在工业和军事应用领域具有重要的现实意义,诸如在完成各种工业或军事任务的机器人视觉系统,基于运动分析的空间卫星跟踪系统;地对空导弹火控系统,进行资源勘探、天气预报或卫星照片的自动分析系统,医学上器官异常的分析和诊断系统等中均有广泛应用。
近年来,随着光流估计方法的发展,针对简单场景图像序列光流估计技术已经取得较大进步,但是在针对图像序列包含诸如运动边缘保护,光照突变等具有挑战性的困难场景光流估计仍然具有较大误差。
发明内容
本发明的目的在于针对现有技术的缺陷和不足,提供一种基于优化语义分割的图像序列光流计算方法,首先对输入图像序列并利用ZNCC算法减少图像序列中光照突变的影响计算出初始光流,然后同时利用全连接分层模型对图像序列分割图进行优化,将初始图象、优化分割图与初始光流同时作为输入,建立光流估计模型,以解决针对场景图像序列的光照突变以及运动边缘保护的问题。
为实现上述目的,本发明采用的技术方案是:它包含如下步骤:
一、输入连续两帧图片,利用去均值归一化光流模型计算连续两帧间的前景后景光流,模型如式(1)所示:
E(u,v)=λ·Edata(u,v)+Esmooth(u,v) (1)
式(1)中数据项Edata能量泛函如式(2):
Figure BDA0002405563290000021
式中u是光流的水平方向分量;v是光流的垂直方向分量;ui表示像素i的光流的水平方向分量;vi表示像素i的光流的垂直方向分量;Ω={(x,y)|1≤x≤N,1≤y≤M}代表图像中的所有像素点集合;k代表图像金字塔的层数;wi=(ui,vi)T表示像素i的光流值;C(·)代表匹配块之间的去均值归一化;
平滑项Esmooth(u,v)为:
Figure BDA0002405563290000022
式中:
Figure BDA0002405563290000023
代表像素i的邻域像素;Ω代表图像中的所有像素点集合;bfi,s代表平滑项权重,表示像素i和s属于同一物体的可能性;i和s属于同一个对象时bfi,s接近于1,如果该度量值bfi,s接近零,忽略该像素;bfi,s的计算公式如下:
Figure BDA0002405563290000024
式中Δc(i,s)为的i和s之间的的Lab颜色空间距离;Δd(i,s)计算的i和s之间的位置距离;σc和σd代表相似性测度系数;
二、输入连续两帧图片,利用Deeplabv3+语义模型分割出连续两帧的标签图;
三、将步骤一计算出的光流以及步骤二的标签图作为输入,利用全连接分层算法,得到优化分割图像,式(5)为全连接局部分层模型:
Figure BDA0002405563290000025
其中,式中u是光流的水平方向分量;v是光流的垂直方向分量;g代表物体所属的标签类别;θ表示输出运动模型的参数;I表示输入图像的灰度;k表示像素所在的图层,k∈{1,2};t表示当前帧时间序号,t+1表示下一帧时间序号;λtime表示时间项系数;λspace表示空间项系数;gt代表当前帧像素的语义标签;gt+1代表当下一帧像素的语义标签;ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;
数据项Edata公式如下:
Figure BDA0002405563290000031
其中ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;gt代表物体当前帧时间所属的标签类别;gt+1代表物体下一帧时间所属的标签类别;
Figure BDA0002405563290000032
表示当前帧像素p的语义标签,
Figure BDA0002405563290000033
表示下一帧像素q的语义标签,k表示像素所在的图层,k∈{1,2};t表示当前帧时间序号,t+1表示下一帧时间序号;
Figure BDA0002405563290000034
代表当
Figure BDA0002405563290000035
Figure BDA0002405563290000036
的两层的负对数似然;
空间项Espace公式如下:
Figure BDA0002405563290000037
其中,
Figure BDA0002405563290000038
表示空间项的权重系数;
Figure BDA0002405563290000039
表示当前帧像素p的语义标签;
Figure BDA00024055632900000310
表示当前帧像素r的语义标签,当
Figure BDA00024055632900000311
时,
Figure BDA00024055632900000312
不是相邻空间的像素,施加空间惩罚项;当
Figure BDA00024055632900000313
时,
Figure BDA00024055632900000314
像素处于相邻空间;
时间项Etime公式如下:
Figure BDA00024055632900000315
其中,
Figure BDA00024055632900000316
表示当前帧像素p的语义标签;
Figure BDA00024055632900000317
表示下一帧像素q的语义标签,当
Figure BDA00024055632900000318
时,
Figure BDA00024055632900000319
施加时间惩罚项;当
Figure BDA00024055632900000320
时,
Figure BDA00024055632900000321
两对应像素具有相同标签;
四、将步骤一中的连续两帧图片和计算出的光流结果以及步骤三中的优化分割结果作为输入量,利用前景光流模型计算最终光流结果:
Figure BDA0002405563290000041
其中,u是光流的水平方向分量;v是光流的垂直方向分量;ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;I表示输入图像的灰度;k表示像素所在的图层,k∈{1,2};t表示当前帧时间序号,t+1表示下一帧时间序号;λmotion表示运动项系数;λtime表示时间项系数;λspace表示空间项系数;kt代表当前帧像素的标签层;kt+1代表当下一帧像素的标签层;It代表当前帧图像的灰度,It+1代表下一帧图像的灰度;
Edata数据项表示为:
Figure BDA0002405563290000042
其中,ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;p表示当前帧的像素点;q表示像素p在下一帧的匹配像素;ρD表示鲁棒惩罚函数;
Figure BDA0002405563290000043
表示当前帧像素p的灰度值;
Figure BDA0002405563290000044
表示下一帧像素q的灰度值;λD表示对遮挡像素的恒定惩罚;
Figure BDA0002405563290000045
表示指示函数;
Figure BDA0002405563290000046
表示当前帧像素p的所在层,
Figure BDA0002405563290000047
表示下一帧像素q的所在层,并当
Figure BDA0002405563290000048
时,表示像素p与像素q处于不同的层,发生遮挡,此时
Figure BDA0002405563290000049
Edata同时施加外观一致性和遮挡惩罚;当
Figure BDA00024055632900000410
时,表示像素p与经过运动后的匹配像素q处于相同的前景或背景层,未发生遮挡,此时
Figure BDA00024055632900000411
Edata仅施加外观一致性;
运动项Emotion公式如下:
Figure BDA00024055632900000412
其中,r表示像素p的相邻像素;第一项中Np包含像素p的四个最近邻域,ρ表示运动项惩罚函数,
Figure BDA0002405563290000051
表示当前帧像素p的运动向量,
Figure BDA0002405563290000052
表示当前帧像素r的运动向量,
Figure BDA0002405563290000053
表示当前帧像素p的所处层,
Figure BDA0002405563290000054
表示当前帧像素r的所处层,当
Figure BDA0002405563290000055
时,表明像素p与相邻像素r处于同一前景层,则像素p与相邻像素r具有相似的运动,施加相似运动一致项;第二项中λaff表示仿射运动的平滑系数,ρaff表示添加形变后的仿射运动惩罚函数;
Figure BDA0002405563290000056
表示全局运动模型;
空间项Espace鼓励分层的空间邻接性,对非相邻空间的像素施加惩罚,表示为:
Figure BDA0002405563290000057
其中,
Figure BDA0002405563290000058
为空间项权重,
Figure BDA0002405563290000059
表示当前帧像素p的所处层,
Figure BDA00024055632900000510
表示前帧像素r的所处层,当
Figure BDA00024055632900000511
时,
Figure BDA00024055632900000512
Figure BDA00024055632900000513
时,
Figure BDA00024055632900000514
像素p与像素r处于相邻空间;
Etime时间项代表着相同像素在时间的推移下前后景不会发生改变,保证了分层模型的时间一致性:
Figure BDA00024055632900000515
其中,
Figure BDA00024055632900000516
表示当前帧像素p的所处层,
Figure BDA00024055632900000517
表示下一帧像素q的所处层,当
Figure BDA00024055632900000518
时,
Figure BDA00024055632900000519
Figure BDA00024055632900000520
时,
Figure BDA00024055632900000521
最小化能量泛函,最终输出计算光流。
采用上述方案后,本发明有益效果为:本发明所述的一种基于优化语义分割的图像序列光流计算方法,采用全连接去均值归一化模型上加入了边窗滤波计算光流,然后使用全连接分层模型优化的分割图先验信息,最终利用前景光流模型优化最终光流,克服了针对光照突变场景图像序列光流计算结果精度较低的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中KITTI图像序列连续两帧图片的第一帧图像;
图2是本发明实施例中KITTI图像序列连续两帧图片的第二帧图像;
图3是本发明实施例中去均值归一化光流估计程序流程框图;
图4是本发明实施例中语义分割图像优化模型图;
图5是KITTI图像序列连续两帧分割图像优化分割图;
图6是本发明实施例完整程序流程框图;
图7是本发明实施例计算所得的KITTI图像序列光流图。
具体实施方式
下面结合附图,对本发明作进一步的说明。
本实施例采用的技术方案是:它包含如下步骤:参看图6所示,
一、输入图1和图2是KITTI图像序列中连续两帧图片;其中图1是第一帧图像,图2是第二帧图像;
利用deeplabv3+语义模型分割出的KITTI图像序列连续两帧分割图像;
如图1-2所示,将原始图像序列建立去均值归一化光流模型计算连续两帧间的前景后景光流,模型如式(1):
E(u,v)=λ·Edata(u,v)+Esmooth(u,v) (1)
式(1)中数据项Edata能量泛函如下:
Figure BDA0002405563290000061
式中u是光流的水平方向分量;v是光流的垂直方向分量;ui表示像素i的光流的水平方向分量;vi表示像素i的光流的垂直方向分量;Ω={(x,y)|1≤x≤N,1≤y≤M}代表图像中的所有像素点集合;k代表图像金字塔的层数;wi=(ui,vi)T表示像素i的光流值;C(·)代表匹配块之间的去均值归一化;
平滑项Esmooth(u,v)为:
Figure BDA0002405563290000071
Figure BDA0002405563290000072
代表像素i的邻域像素;Ω代表图像中的所有像素点集合;bfi,s代表平滑项权重,表示像素i和s属于同一物体的可能性;i和s属于同一个对象时bfi,s接近于1,如果该度量值bfi,s接近零,忽略该像素;bfi,s的计算公式如下:
Figure BDA0002405563290000073
式中Δc(i,s)为的i和s之间的的Lab颜色空间距离;Δd(i,s)计算的i和s之间的位置距离;σc和σd代表相似性测度系数;
二、输入步骤一中连续两帧图片,利用Deeplabv3+语义模型分割出连续两帧的标签图;
三、如图3-5所示,将步骤一计算出的光流以及步骤二标签图作为输入,利用全连接分层算法,得到优化分割图像,建立全连接局部分层,模型如式(5)所示:
Figure BDA0002405563290000074
其中,u是光流的水平方向分量;v是光流的垂直方向分量;g代表物体所属的标签类别;θ表示输出运动模型的参数;I表示输入图像的灰度;k表示像素所在的图层,k∈{1,2};t表示当前帧时间序号,t+1表示下一帧时间序号;λtime表示时间项系数;λspace表示空间项系数;gt代表当前帧像素的语义标签;gt+1代表当下一帧像素的语义标签;ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;
数据项Edata公式如下:
Figure BDA0002405563290000075
其中,ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;gt代表物体当前帧时间所属的标签类别;gt+1代表物体下一帧时间所属的标签类别;
Figure BDA0002405563290000081
表示当前帧像素p的语义标签,
Figure BDA0002405563290000082
表示下一帧像素q的语义标签,k表示像素所在的图层,k∈{1,2};t表示当前帧时间序号,t+1表示下一帧时间序号;
Figure BDA0002405563290000083
代表当
Figure BDA0002405563290000084
Figure BDA0002405563290000085
的两层的负对数似然;
空间项Espace公式如下:
Figure BDA0002405563290000086
其中,
Figure BDA0002405563290000087
表示空间项的权重系数;
Figure BDA0002405563290000088
表示当前帧像素p的语义标签;
Figure BDA0002405563290000089
表示当前帧像素r的语义标签,当
Figure BDA00024055632900000810
时,
Figure BDA00024055632900000811
不是相邻空间的像素,施加空间惩罚项;当
Figure BDA00024055632900000812
时,
Figure BDA00024055632900000813
像素处于相邻空间;
时间项Etime公式如下:
Figure BDA00024055632900000814
其中,
Figure BDA00024055632900000815
表示当前帧像素p的语义标签;
Figure BDA00024055632900000816
表示下一帧像素q的语义标签,当
Figure BDA00024055632900000817
时,
Figure BDA00024055632900000818
施加时间惩罚项;当
Figure BDA00024055632900000819
时,
Figure BDA00024055632900000820
两对应像素具有相同标签;
四、如图7所示,将步骤一中的连续两帧图片和计算出的光流结果以及步骤三中的优化分割结果作为输入量,建立前景光流模型,模型如式(9)所示:
Figure BDA00024055632900000821
其中,u是光流的水平方向分量;v是光流的垂直方向分量;ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;I表示输入图像的灰度;k表示像素所在的图层,k∈{1,2};t表示当前帧时间序号,t+1表示下一帧时间序号;λmotion表示运动项系数;λtime表示时间项系数;λspace表示空间项系数;kt代表当前帧像素的标签层;kt+1代表当下一帧像素的标签层;It代表当前帧图像的灰度,It+1代表下一帧图像的灰度;
Edata数据项表示为:
Figure BDA0002405563290000091
其中,ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;p表示当前帧的像素点;q表示像素p在下一帧的匹配像素;ρD表示鲁棒惩罚函数;
Figure BDA0002405563290000092
表示当前帧像素p的灰度值;
Figure BDA0002405563290000093
表示下一帧像素q的灰度值;λD表示对遮挡像素的恒定惩罚;
Figure BDA0002405563290000094
表示指示函数;
Figure BDA0002405563290000095
表示当前帧像素p的所在层,
Figure BDA0002405563290000096
表示下一帧像素q的所在层,并当
Figure BDA0002405563290000097
时,表示像素p与像素q处于不同的层,发生遮挡,此时
Figure BDA0002405563290000098
Edata同时施加外观一致性和遮挡惩罚;当
Figure BDA0002405563290000099
时,表示像素p与经过运动后的匹配像素q处于相同的前景或背景层,未发生遮挡,此时
Figure BDA00024055632900000910
Edata仅施加外观一致性;
运动项Emotion公式如下:
Figure BDA00024055632900000911
其中,r表示像素p的相邻像素;第一项中Np包含像素p的四个最近邻域,ρ表示运动项惩罚函数,
Figure BDA00024055632900000912
表示当前帧像素p的运动向量,
Figure BDA00024055632900000913
表示当前帧像素r的运动向量,
Figure BDA00024055632900000914
表示当前帧像素p的所处层,
Figure BDA00024055632900000915
表示当前帧像素r的所处层,当
Figure BDA00024055632900000916
时,表明像素p与相邻像素r处于同一前景层,则像素p与相邻像素r具有相似的运动,施加相似运动一致项;第二项中λaff表示仿射运动的平滑系数,ρaff表示添加形变后的仿射运动惩罚函数;
Figure BDA00024055632900000917
表示全局运动模型;
空间项Espace鼓励分层的空间邻接性,对非相邻空间的像素施加惩罚,表示为:
Figure BDA0002405563290000101
其中,
Figure BDA0002405563290000102
为空间项权重,
Figure BDA0002405563290000103
表示当前帧像素p的所处层,
Figure BDA0002405563290000104
表示前帧像素r的所处层,当
Figure BDA0002405563290000105
时,
Figure BDA0002405563290000106
Figure BDA0002405563290000107
时,
Figure BDA0002405563290000108
像素p与像素r处于相邻空间;
Etime时间项代表着相同像素在时间的推移下前后景不会发生改变,保证了分层模型的时间一致性:
Figure BDA0002405563290000109
其中,
Figure BDA00024055632900001010
表示当前帧像素p的所处层,
Figure BDA00024055632900001011
表示下一帧像素q的所处层,当
Figure BDA00024055632900001012
时,
Figure BDA00024055632900001013
Figure BDA00024055632900001014
时,
Figure BDA00024055632900001015
最小化能量泛函,最终输出计算光流,图7展示了光流计算的结果。
以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.一种基于优化语义分割的图像序列光流计算方法,其特征在于它包含如下步骤:
一、输入连续两帧图片,利用去均值归一化光流模型计算连续两帧间的前景后景光流,模型如式(1)所示:
E(u,v)=λ·Edata(u,v)+Esmooth(u,v) (1)
式(1)中数据项Edata能量泛函如式(2):
Figure FDA0002405563280000011
式中u是光流的水平方向分量;v是光流的垂直方向分量;ui表示像素i的光流的水平方向分量;vi表示像素i的光流的垂直方向分量;Ω={(x,y)|1≤x≤N,1≤y≤M}代表图像中的所有像素点集合;k代表图像金字塔的层数;wi=(ui,vi)T表示像素i的光流值;C(·)代表匹配块之间的去均值归一化;
平滑项Esmooth(u,v)为:
Figure FDA0002405563280000012
式中:
Figure FDA0002405563280000013
代表像素i的邻域像素;Ω代表图像中的所有像素点集合;bfi,s代表平滑项权重,表示像素i和s属于同一物体的可能性;i和s属于同一个对象时bfi,s接近于1,如果该度量值bfi,s接近零,忽略该像素;bfi,s的计算公式如下:
Figure FDA0002405563280000014
式中Δc(i,s)为的i和s之间的Lab颜色空间距离;Δd(i,s)计算的i和s之间的位置距离;σc和σd代表相似性测度系数;
二、输入连续两帧图片,利用Deeplabv3+语义模型分割出连续两帧的标签图;
三、将步骤一计算出的光流以及步骤二的标签图作为输入,利用全连接分层算法,得到优化分割图像,式(5)为全连接局部分层模型:
Figure FDA0002405563280000021
其中,式中u是光流的水平方向分量;v是光流的垂直方向分量;g代表物体所属的标签类别;θ表示输出运动模型的参数;I表示输入图像的灰度;k表示像素所在的图层,k∈{1,2};t表示当前帧时间序号,t+1表示下一帧时间序号;λtime表示时间项系数;λspace表示空间项系数;gt代表当前帧像素的语义标签;gt+1代表当下一帧像素的语义标签;ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;
数据项Edata公式如下:
Figure FDA0002405563280000022
其中ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;gt代表物体当前帧时间所属的标签类别;gt+1代表物体下一帧时间所属的标签类别;
Figure FDA0002405563280000023
表示当前帧像素p的语义标签,
Figure FDA0002405563280000024
表示下一帧像素q的语义标签,k表示像素所在的图层,k∈{1,2};t表示当前帧时间序号,t+1表示下一帧时间序号;
Figure FDA0002405563280000025
代表当
Figure FDA0002405563280000026
Figure FDA0002405563280000027
的两层的负对数似然;
空间项Espace公式如下:
Figure FDA0002405563280000028
其中,
Figure FDA0002405563280000029
表示空间项的权重系数;
Figure FDA00024055632800000210
表示当前帧像素p的语义标签;
Figure FDA00024055632800000211
表示当前帧像素r的语义标签,当
Figure FDA00024055632800000212
时,
Figure FDA00024055632800000213
不是相邻空间的像素,施加空间惩罚项;当
Figure FDA00024055632800000214
时,
Figure FDA00024055632800000215
像素处于相邻空间;
时间项Etime公式如下:
Figure FDA00024055632800000216
其中,
Figure FDA00024055632800000217
表示当前帧像素p的语义标签;
Figure FDA00024055632800000218
表示下一帧像素q的语义标签,当
Figure FDA0002405563280000031
时,
Figure FDA0002405563280000032
施加时间惩罚项;当
Figure FDA0002405563280000033
时,
Figure FDA0002405563280000034
两对应像素具有相同标签;
四、将步骤一中的连续两帧图片和计算出的光流结果以及步骤三中的优化分割结果作为输入量,利用前景光流模型计算最终光流结果:
Figure FDA0002405563280000035
其中,u是光流的水平方向分量;v是光流的垂直方向分量;ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;I表示输入图像的灰度;k表示像素所在的图层,k∈{1,2};t表示当前帧时间序号,t+1表示下一帧时间序号;λmotion表示运动项系数;λtime表示时间项系数;λspace表示空间项系数;kt代表当前帧像素的标签层;kt+1代表当下一帧像素的标签层;It代表当前帧图像的灰度,It+1代表下一帧图像的灰度;
Edata数据项表示为:
Figure FDA0002405563280000036
其中,ut代表当前帧的光流的水平方向分量;vt代表当前帧的光流的垂直方向分量;p表示当前帧的像素点;q表示像素p在下一帧的匹配像素;ρD表示鲁棒惩罚函数;
Figure FDA0002405563280000037
表示当前帧像素p的灰度值;
Figure FDA0002405563280000038
表示下一帧像素q的灰度值;λD表示对遮挡像素的恒定惩罚;
Figure FDA0002405563280000039
表示指示函数;
Figure FDA00024055632800000310
表示当前帧像素p的所在层,
Figure FDA00024055632800000311
表示下一帧像素q的所在层,并当
Figure FDA00024055632800000312
时,表示像素p与像素q处于不同的层,发生遮挡,此时
Figure FDA00024055632800000313
Edata同时施加外观一致性和遮挡惩罚;当
Figure FDA00024055632800000314
时,表示像素p与经过运动后的匹配像素q处于相同的前景或背景层,未发生遮挡,此时
Figure FDA00024055632800000315
Edata仅施加外观一致性;
运动项Emotion公式如下:
Figure FDA0002405563280000041
其中,r表示像素p的相邻像素;第一项中Np包含像素p的四个最近邻域,ρ表示运动项惩罚函数,
Figure FDA0002405563280000042
表示当前帧像素p的运动向量,
Figure FDA0002405563280000043
表示当前帧像素r的运动向量,
Figure FDA0002405563280000044
表示当前帧像素p的所处层,
Figure FDA0002405563280000045
表示当前帧像素r的所处层,当
Figure FDA0002405563280000046
时,表明像素p与相邻像素r处于同一前景层,则像素p与相邻像素r具有相似的运动,施加相似运动一致项;第二项中λaff表示仿射运动的平滑系数,ρaff表示添加形变后的仿射运动惩罚函数;
Figure FDA0002405563280000047
表示全局运动模型;
空间项Espace鼓励分层的空间邻接性,对非相邻空间的像素施加惩罚,表示为:
Figure FDA0002405563280000048
其中,
Figure FDA0002405563280000049
为空间项权重,
Figure FDA00024055632800000410
表示当前帧像素p的所处层,
Figure FDA00024055632800000411
表示前帧像素r的所处层,当
Figure FDA00024055632800000412
时,
Figure FDA00024055632800000413
Figure FDA00024055632800000414
时,
Figure FDA00024055632800000415
像素p与像素r处于相邻空间;
Etime时间项代表着相同像素在时间的推移下前后景不会发生改变,保证了分层模型的时间一致性:
Figure FDA00024055632800000416
其中,
Figure FDA00024055632800000417
表示当前帧像素p的所处层,
Figure FDA00024055632800000418
表示下一帧像素q的所处层,当
Figure FDA00024055632800000419
时,
Figure FDA00024055632800000420
Figure FDA00024055632800000421
时,
Figure FDA00024055632800000422
最小化能量泛函,最终输出计算光流。
CN202010160371.1A 2020-03-10 2020-03-10 一种基于优化语义分割的图像序列光流计算方法 Active CN111340852B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010160371.1A CN111340852B (zh) 2020-03-10 2020-03-10 一种基于优化语义分割的图像序列光流计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010160371.1A CN111340852B (zh) 2020-03-10 2020-03-10 一种基于优化语义分割的图像序列光流计算方法

Publications (2)

Publication Number Publication Date
CN111340852A CN111340852A (zh) 2020-06-26
CN111340852B true CN111340852B (zh) 2022-09-27

Family

ID=71182268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010160371.1A Active CN111340852B (zh) 2020-03-10 2020-03-10 一种基于优化语义分割的图像序列光流计算方法

Country Status (1)

Country Link
CN (1) CN111340852B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105869178A (zh) * 2016-04-26 2016-08-17 昆明理工大学 一种基于多尺度组合特征凸优化的复杂目标动态场景无监督分割方法
CN103955948B (zh) * 2014-04-03 2016-10-05 西北工业大学 一种动态环境下的空间运动目标检测方法
EP3249609A1 (en) * 2016-05-25 2017-11-29 Rational Pixels S.L. Computer-implemented method and system for processing video with temporal consistency
CN107644429A (zh) * 2017-09-30 2018-01-30 华中科技大学 一种基于强目标约束视频显著性的视频分割方法
CN108986136A (zh) * 2018-07-23 2018-12-11 南昌航空大学 一种基于语义分割的双目场景流确定方法及系统
CN109753913A (zh) * 2018-12-28 2019-05-14 东南大学 计算高效的多模式视频语义分割方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6972756B2 (ja) * 2017-08-10 2021-11-24 富士通株式会社 制御プログラム、制御方法、及び情報処理装置
US11157985B2 (en) * 2017-11-29 2021-10-26 Ditto Technologies, Inc. Recommendation system, method and computer program product based on a user's physical features

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955948B (zh) * 2014-04-03 2016-10-05 西北工业大学 一种动态环境下的空间运动目标检测方法
CN105869178A (zh) * 2016-04-26 2016-08-17 昆明理工大学 一种基于多尺度组合特征凸优化的复杂目标动态场景无监督分割方法
EP3249609A1 (en) * 2016-05-25 2017-11-29 Rational Pixels S.L. Computer-implemented method and system for processing video with temporal consistency
CN107644429A (zh) * 2017-09-30 2018-01-30 华中科技大学 一种基于强目标约束视频显著性的视频分割方法
CN108986136A (zh) * 2018-07-23 2018-12-11 南昌航空大学 一种基于语义分割的双目场景流确定方法及系统
CN109753913A (zh) * 2018-12-28 2019-05-14 东南大学 计算高效的多模式视频语义分割方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Areal Multistart Method of Optimization for Image Recognition";Galyna Shcherbakova 等;《2018 IEEE Second International Conference on Data Stream Mining & Processing》;20181004;605-608 *
"Edge-Preserving Stereo Matching Using Minimum Spanning Tree";Zhang Congxuan 等;《IEEE Access》;20191210;第7卷;177909-177921 *
"基于视觉的三维目标检测算法研究综述";李宇杰 等;《计算机工程与应用》;20191012;第56卷(第1期);11-23 *
"相互结构引导滤波TV-L1变分光流估计";张聪炫 等;《电子学报》;20190331;第47卷(第3期);707-713 *

Also Published As

Publication number Publication date
CN111340852A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
CN110232350B (zh) 一种基于在线学习的实时水面多运动目标检测跟踪方法
CN110097568B (zh) 一种基于时空双分支网络的视频对象检测与分割方法
CN110570371B (zh) 一种基于多尺度残差学习的图像去雾方法
CN108596053B (zh) 一种基于ssd和车辆姿态分类的车辆检测方法和系统
CN108665496B (zh) 一种基于深度学习的端到端的语义即时定位与建图方法
Li et al. A deep learning method of water body extraction from high resolution remote sensing images with multisensors
Zhou et al. BOMSC-Net: Boundary optimization and multi-scale context awareness based building extraction from high-resolution remote sensing imagery
CN113610778B (zh) 一种基于语义分割的桥梁表面裂纹检测方法与系统
CN111753682B (zh) 一种基于目标检测算法的吊装区域动态监控方法
CN109242019B (zh) 一种水面光学小目标快速检测与跟踪方法
CN110827320B (zh) 基于时序预测的目标跟踪方法和装置
CN110555868A (zh) 一种复杂地面背景下运动小目标检测方法
CN113223045A (zh) 基于动态物体语义分割的视觉与imu传感器融合定位系统
CN115375737B (zh) 基于自适应时间与序列化时空特征的目标跟踪方法与系统
Gil et al. Comparing features for target tracking in traffic scenes
CN111612825A (zh) 基于光流与多尺度上下文的图像序列运动遮挡检测方法
CN116486102A (zh) 一种基于混合空间调制特征卷积神经网络的红外弱小目标检测方法
CN111354016A (zh) 基于深度学习和差异值哈希的无人机舰船跟踪方法及系统
CN112509014B (zh) 金字塔遮挡检测块匹配的鲁棒插值光流计算方法
CN116188550A (zh) 一种基于几何约束的自监督深度视觉里程计
CN111340852B (zh) 一种基于优化语义分割的图像序列光流计算方法
CN111767826A (zh) 一种定时定点场景异常检测方法
CN108492308B (zh) 一种基于相互结构引导滤波的变分光流的确定方法及系统
Li et al. Progressive attention-based feature recovery with scribble supervision for saliency detection in optical remote sensing image
CN114820931B (zh) 基于虚拟现实的智慧城市cim可视化实时成像方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant