CN108537806A

CN108537806A - 一种基于累积能量的立体图像线裁剪重定向方法

Info

Publication number: CN108537806A
Application number: CN201810342811.8A
Authority: CN
Inventors: 牛玉贞; 林玉清; 郭文忠
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2018-04-17
Filing date: 2018-04-17
Publication date: 2018-09-14

Abstract

本发明涉及一种基于累积能量的立体图像线裁剪重定向方法，包括以下步骤：1、输入立体图像和对应的视差图，初始化输入图像的能量矩阵和能量累积矩阵；2、采用动态规划的方法找到左、右视图的最优缝组并记录其路径；3、将最优缝组路径上的每个像素的能量累积到其相邻的8个像素上；4、检测并沿着最大边缘信息的方向继续向相邻的2个像素进行能量累积；5、删除最优缝组，更新图像的能量矩阵、能量累积矩阵M及对应的视差图；6、迭代上述步骤直至目标尺寸，获得重定向后的左、右视图和对应的视差图。该方法能够有效减少由于缝操作集中在图像某一区域从而引起的立体图像的视觉失真，并能保持左右图像的几何一致性，提高立体图像线裁剪的性能。

Description

一种基于累积能量的立体图像线裁剪重定向方法

技术领域

本发明涉及涉及图像处理及计算机视觉领域，特别是图像显示适应中一种基于累积能量的立体图像线裁剪重定向方法。

背景技术

近年来，图像重定向方法作为计算机视觉领域的一个热点课题得到许多学者的重视与研究，相关的成果也层出不穷。这些方法的共同目标是改变图像尺寸大小或者纵横比以适应不同的设备的显示屏幕，并且尽可能地减少图像内容的失真和保持原有的图像结构信息。线裁剪(Seam Carving,SC)方法最早是由Avidan等人提出来的，是基于内容的图像重定向的一种有效方法。一条缝是指在迭代地进行删除或者插入过程中，由能量最低的像素组成的最优路径。为了保证图像的内容和结构的完整性，学者们提出了不同的线裁剪方法，Rubinstein等人在删除缝的时候引入了前向能量。Kazu Mishiba等人将一条缝定义成由一对像素组成的路径，这样合并缝的方法能保留图像的结构信息。Grundmann等人提出了不连续的线裁剪方法。在线裁剪时，缝不再是由自上而下或者从左往右的像素组成的连通路径，而是变成了一段段不连续的缝(piece-wise seams)。Domingues等人使用缝流(a streamseam)，即缝的宽度大于一个像素，获得更符合人们视觉偏好的结果。Hsi-Chin Hsin提出了一种使用显著性直方图来均衡的基于内容的线裁剪方法，即通过创建一个非均匀的网格来均衡图像的显著性，在显著区域用网格处理方式也能够降低时间代价。

随着多媒体和显示设备的不断流行，立体图像重定向技术俨然变成了一个研究热点。尽管上述方法在处理单目图像时能产生令人满意的结果，然而在处理立体图像时，它们并不能保证左右视图的几何一致性。Tali Basha等人提出了立体图像线裁剪(SSC)的方法，在能量函数中考虑深度信息、几何结构信息以及左右视图中的遮挡/被遮挡像素。为了减少图像中物体的几何失真，Bin Yue等人在确定图像的显著对象时同时考虑了梯度强度和视觉融合区域。Kuo-Chin Lien等人提出了一种新算法，在进行立体图像重定向时使用高阶能量来同时约束左右视图的一对像素组，以此保证图像的2D和3D结构信息不被破坏。为了保持图像的几何一致性，Utsugi等人将左右视图对应的一对缝分为两类：能保持一致性的对应缝(corresponding seams)和改变一致性的遮挡缝(occluded seams)。

尽管线裁剪的方法在大多情况下可以得到相对较好地重定向结果，然而鉴于立体图像左右视图的几何一致性以及图像3D结构特性，而线裁剪又是通过连续地删除或插入最优缝来实现图像重定向，因此很可能集中在某区域删除或者插入某些像素，在进行立体图像线裁剪时也不可避免地产生了严重的失真结果。

发明内容

本发明的目的在于提供一种基于累积能量的立体图像线裁剪重定向方法，该方法能够有效减少由于缝操作集中在图像某一区域从而引起的立体图像的视觉失真，并能保持左右图像的几何一致性，提高立体图像线裁剪的性能。

为实现上述目的，本发明采用的技术方案是：一种基于累积能量的立体图像线裁剪重定向方法，包括以下步骤：

步骤S1：输入由左、右视图组成的一幅立体图像和对应的视差图，初始化输入图像的能量矩阵W和能量累积矩阵M；

步骤S2：采用动态规划的方法找到左、右视图的一组最优缝组并记录所述最优缝组的路径；

步骤S3：将记录的最优缝组路径上的每个像素的能量以一定的权重累积到其相邻的8个像素上；

步骤S4：采用索贝尔算子检测具有最大边缘信息的方向，沿着该方向继续向相邻的2个像素进行能量累积；

步骤S5：删除最优缝组，更新此时得到的图像的能量矩阵、能量累积矩阵M及对应的视差图；

步骤S6：迭代步骤S2～S5直至目标尺寸，获得重定向后的左、右视图和对应的视差图。

进一步地，所述步骤S1中，输入立体图像和视差图，初始化输入图像的能量矩阵W和能量累积矩阵M，包括以下步骤：

步骤S11：输入一对立体图像{I_L,I_R}和对应的视差图D；

步骤S12：计算能量函数中的前向能量项E_intensity；

为保持左视图和右视图中内容的一致性，从左、右视图中删除缝时，必须同时删除一组耦合缝，即耦合缝在图像第i行上的一对像素应满足如下关系：

j_R＝j_L+D(i,j)

其中，(i,j)是该对像素在左视图的像素位置，j_R是该对像素在右视图的纵坐标，D(i,j)是该对像素在左视图的(i,j)位置相对于其在右视图的位置的视差值；

当从左、右视图中同时删除一组耦合缝时，原先不相邻的像素相邻后将引入前向能量，对于左、右视图分别有E_L和E_R；假设从输入图像I删除一个像素，像素在能量矩阵W中的位置记为(i,j)，所述输入图像I为左视图I_L或右视图I_R，由于左、右视图的前向能量E_L、E_R的计算方法相同，因此采用相同公式计算如下：

E(i,j,j^±)＝Ev(i,j,j^±)+E^h(i,j)

其中，j^±是或的简单标记，表示从左视图或右视图中删除所述耦合缝上的像素(i,j)的上一行的像素位置；E^h(i,j)和E^v(i,j,j^±)分别表示在水平和垂直方向上产生的前向能量；水平方向上的前向能量为：

E^h(i,j)＝|F(i,j+1)-F(i,j-1)|

其中，F(i,j+1)表示输入图像I在(i,j+1)处的亮度值；

在垂直方向上，新引入的能量取决于第i-1行上的j^±，则有以下三种情况：

其中，

其中，F(i-1,k)、F(i,k-1)、F(i,k)分别表示输入图像I在(i-1,k)、(i,k-1)、(i,k)处的亮度值；

因此，当从左视图和右视图中删除耦合缝上相对应的一对像素时，引入的前向能量E_intensity为：

其中，E_intensity(i,j,j^±)表示输入图像在(i,j)处的前向能量值，E_L(i,j,j^±)表示输入图像的左视图在(i,j)处的前向能量值，表示输入图像的右视图在(i,j)处的前向能量值；

步骤S13：计算能量函数中的3D能量项E_3D：

E_3D(i,j,j^±)＝E_D(i,j,j^±)+β|D_n(i,j)|+γG(i,j)

其中，E_3D(i,j,j^±)表示在(i,j)处的3D能量值，E_D(i,j,j^±)表示视差图在(i,j)处的前向能量，可由上述前向能量的计算方法得到D_n(i,j)是由视差图D归一化到[0,1]区间后得到的(i,j)处的视差能量值，G(i,j)为输入图像(i,j)处左、右视图之间的亮度差异能量值，即G(i,j)＝|F_L(i,j)-F_R(i,j+D(i,j))|，F_L(i,j)和F_R(i,j)分别为左、右视图I_L和I_R在(i,j)处的亮度值，β、γ为权重系数，分别控制对应项的权重；

步骤S14：结合步骤S12和步骤S13初始化输入图像的能量矩阵W，最终的能量矩阵W为：

E(i,j,j^±)＝E_intensity(i,j,j^±)+αE_3D(i,j,j^±)

其中，E(i,j,j^±)表示输入图像(i,j)处的能量值，α为权重系数，用于控制前向能量项E_intensity和3D能量项E_3D的权重；

步骤S15：初始化能量累积矩阵M为步骤S14的能量矩阵W。

进一步地，所述步骤S2中，采用动态规划的方法找到左、右视图的一组最优缝组并记录所述最优缝组的路径，包括以下步骤：

步骤S21：采用动态规划的方法找到左视图的一条最优缝，记录路径为其中当该条最优缝为垂直缝时，表示左视图最优缝上第i行的像素，m表示图像的高度；当该条最优缝为水平缝时，表示左视图最优缝上第i列的像素，m表示图像的宽度；

步骤S22：右视图的最优缝路径由对应的视差图D计算得到，记录为其与左视图的最优缝满足如下关系：

其中，j_L(i)、j_R(i)分别表示在左、右视图的最优缝组中第i行的像素的列坐标位置；表示像素的视差值；

对于删除垂直缝的情况，假设将宽度为m的图像删除若干条垂直的最优缝后图像的宽度变为n，则它们满足映射关系j_L,j_R:[1,2,…,m]→[1,2,…,n]；在左视图的最优缝上，第i行的像素点满足则在右视图中对应的像素点为：删除水平缝的方法同理。

进一步地，所述步骤S3中，对于最优缝路径上的每个像素，从该像素的水平、垂直、45度、135度对角线这四个方向考虑能量累积的权重，这四个方向的能量累积的初始权重确定为：

w₁＝max(M(i,j-1),M(i,j+1))

w₂＝max(M(i-1,j),M(i+1,j))

w₃＝max(M(i-1,j-1),M(i+1,j+1))

w₄＝max(M(i-1,j+1),M(i+1,j-1))

其中，M(i,j-1)、M(i,j+1)、M(i-1,j)、M(i+1,j)、M(i-1,j-1)、M(i+1,j+1)、M(i-1,j+1)、M(i+1,j-1)分别表示在能量累积矩阵M中记录的像素(i,j-1)、(i,j+1)、(i-1,j)、(i+1,j)、(i-1,j-1)、(i+1,j+1)、(i-1,j+1)、(i+1,j-1)处的累积能量，w₁、w₂、w₃、w₄分别表示像素的水平、垂直、45度、135度对角线四个方向上的初始权重。

进一步地，所述步骤S4中，采用索贝尔算子检测具有最大边缘信息的方向，沿着该方向继续向相邻的2个像素进行能量累积，包括以下步骤：

步骤S41：使用索贝尔边缘信息检测算子计算该像素的水平、垂直、45度和135度对角线这四个方向上的边缘信息强度；索贝尔算子在四个方向上的模板分别为：

步骤S42：在检测到的边缘信息幅度最大的方向上持续进行能量累积，假设在水平方向上检测到的边缘信息幅度最大，则继续沿水平方向将能量向相邻的2个像素累积，能量累积的权重w_c计算公式为：

w_c＝w_i/2, i＝1,2,3,4

w_c由检测出的具有最大边缘信息的方向决定，当检测出为水平方向时，w_c＝w₁/2；当检测出为垂直方向时，w_c＝w₂/2；当检测出为45度对角线方向时，w_c＝w₃/2；当检测出为135度对角线方向时，w_c＝w₄/2；

步骤S43：结合步骤S3，可得被删除像素的周围的10个像素的能量累积的权重w_i最终为：

w_i＝w_i/(2×∑(w_i+w_c)+σ), i＝1,2,3,4

该公式用于归一化权重，w_c是持续向外累积的能量，σ为控制参数，用于避免除零项。

进一步地，所述步骤S5中，被删除像素的周围的10个像素的能量累积矩阵更新为：

M(i,j±1)＝M(i,j±1)+w₁×M(i,j)

M(i±1,j)＝M(i±1,j)+w₂×M(i,j)

M(i±1,j±1)＝M(i±1,j±1)+w₃×M(i,j)

其中，M(i,j)表示在能量累积矩阵M中记录的像素(i,j)处的累积能量，表示在能量累积矩阵M中记录的像素(i+1,j-1)和(i-1,j+1)处的累积能量，M(i,j±2)表示在能量累积矩阵M中记录的像素(i,j+2)和(i,j-2)处的累积能量，所述w₁、w₂、w₃、w₄为步骤S43中归一化后的权重w_i，θ＝0°、90°、45°、135°分别表示检测出具有最大边缘信息的方向为水平、垂直、45度、135度对角线这四个方向。

相较于现有立体图像线裁剪重定向方法，本发明的有益效果是：本发明在删除或者插入某条缝时，将被操作缝路径上的每个像素的能量以一定的权重累积到相邻的8连通像素，降低在该条缝附近区域连续地进行缝操作的概率，从而避免在图像的某一区域集中地删除或者插入缝，导致图像内容的不连续。此外，考虑到图像中不同物体的景深信息不同，像素所包含的信息具有各向异性(Anisotropic Difference)，像素在某一方向上所包含的边缘信息越大，表示该方向上包含图像内容信息越多。因此，本发明通过索贝尔算子检测得到边缘信息幅度最大的方向，并持续沿该方向上进行能量累积，从而进一步减少重定向结果的几何失真，保持图像内容的完整性。综上，本发明的方法能够有效地减少由于缝操作集中在图像某一区域从而引起的立体图像的视觉失真，并能保持左右图像的几何一致性，提高立体图像线裁剪的性能，可应用于图像显示适应、计算机视觉等领域。

附图说明

图1是本发明方法的流程框图。

图2是本发明实施例的步骤S1中最优缝上像素(i,j)周围的能量矩阵示例图。

图3是本发明实施例的步骤S2中实现周围8个像素的能量更新示例图。

图4是本发明实施例的步骤S3中实现水平方向向外2个像素持续能量更新示例图。

具体实施方式

下面结合附图及具体实施例对本发明作进一步的详细说明。

本发明提供一种基于累积能量的立体图像线裁剪重定向方法，如图1所示，包括以下步骤：

步骤S1：输入由左、右视图组成的一幅立体图像和对应的视差图，初始化输入图像的能量矩阵W和能量累积矩阵M。具体包括以下步骤：

步骤S11：输入一对立体图像{I_L,I_R}和对应的视差图D。

步骤S12：计算能量函数中的前向能量项E_intensity。

j_R＝j_L+D(i,j)

其中，(i,j)是该对像素在左视图的像素位置，j_R是该对像素在右视图的纵坐标，D(i,j)是该对像素在左视图的(i,j)位置相对于其在右视图的位置的视差值。

当从左、右视图中同时删除一组耦合缝时，原先不相邻的像素相邻后将引入前向能量，对于左、右视图分别有E_L和E_R。假设从输入图像I删除一个像素，像素在能量矩阵W中的位置记为(i,j)，所述输入图像I为左视图I_L或右视图I_R，由于左、右视图的前向能量E_L、E_R的计算方法相同，因此采用相同公式计算如下：

E(i,j,j^±)＝E^v(i,j,j^±)+E^h(i,j)

其中，j^±是或的简单标记，表示从左视图或右视图中删除所述耦合缝上的像素(i,j)的上一行的像素位置。耦合缝是由左、右视图上找到的最优缝组成的一组缝，立体图像线裁剪是在不连续的缝上操作，因此，删除的像素(i,j)可以是像素(i,j)上一行的任意一个像素，不一定是第j列的。E^h(i,j)和E^v(i,j,j^±)分别表示在水平和垂直方向上产生的前向能量。水平方向上的前向能量为：

E^h(i,j)＝|F(i,j+1)-F(i,j-1)|

其中，F(i,j+1)表示输入图像I在(i,j+1)处的亮度值。

其中，

其中，F(i-1,k)、F(i,k-1)、F(i,k)分别表示输入图像I在(i-1,k)、(i,k-1)、(i,k)处的亮度值。

其中，E_intensity(i,j,j^±)表示输入图像在(i,j)处的前向能量值，E_L(i,j,j^±)表示输入图像的左视图在(i,j)处的前向能量值，表示输入图像的右视图在(i,j)处的前向能量值。

步骤S13：计算能量函数中的3D能量项E_3D。为了保持图像的3D结构特性，在能量函数中还应该考虑像素的3D能量E_3D：

E_3D(i,j,j^±)＝E_D(i,j,j^±)+β|D_n(i,j)|+γG(i,j)

其中，E_3D(i,j,j^±)表示在(i,j)处的3D能量值，E_D(i,j,j^±)表示视差图在(i,j)处的前向能量，可由上述前向能量的计算方法得到D_n(i,j)是由视差图D归一化到[0,1]区间后得到的(i,j)处的视差能量值，G(i,j)为图像(i,j)处左、右视图之间的亮度差异能量值，即G(i,j)＝|F_L(i,j)-F_R(i,j+D(i,j))|，F_L(i,j)和FR(i,j)分别为左、右视图I_L和I_R在(i,j)处的亮度值，β、γ为权重系数，分别控制对应项的权重。在本实施例中，取值分别为0.68和0.5。

E(i,j,j^±)＝E_intensity(i,j,j^±)+αE_3D(i,j,j^±)

其中，E(i,j,j^±)表示输入图像(i,j)处的能量值，α为权重系数，用于控制前向能量项E_intensity和3D能量项E_3D的权重。在本实施例中，取值为0.5。

步骤S15：初始化能量累积矩阵M为步骤S14的能量矩阵W。如图2所示，M(i,j)表示在最优缝上的像素(i,j)的能量。

步骤S2：采用动态规划的方法找到左、右视图的一组最优缝组并记录所述最优缝组的路径。具体包括以下步骤：

步骤S21：采用动态规划的方法找到左视图的一条最优缝，记录路径为其中当该条最优缝为垂直缝时，表示左视图最优缝上第i行的像素，m表示图像的高度。当该条最优缝为水平缝时，表示左视图最优缝上第i列的像素，m表示图像的宽度。

其中，j_L(i)、j_R(i)分别表示在左、右视图的最优缝组中，第i行的像素的列坐标位置。表示像素的视差值。

对于删除垂直缝的情况，假设将宽度为m的图像删除若干条垂直的最优缝后图像的宽度变为n，则它们满足映射关系j_L,j_R:[1,2,…,m]→[1,2,…,n]。在左视图的最优缝上，第i行的像素点满足则在右视图中对应的像素点为：删除水平缝的方法同理。

步骤S3：将记录的最优缝组路径上的每个像素的能量以一定的权重累积到其相邻的8个像素上。

对于最优缝路径上的每个像素，像素的能量矩阵标记图如图3所示，从该像素的水平、垂直、45度、135度对角线这四个方向考虑能量累积的权重，这四个方向的能量累积的初始权重确定为：

w₁＝max(M(i,j-1),M(i,j+1))

w₂＝max(M(i-1,j),M(i+1,j))

w₃＝max(M(i-1,j-1),M(i+1,j+1))

w₄＝max(M(i-1,j+1),M(i+1,j-1))

步骤S4：采用索贝尔算子检测具有最大边缘信息的方向，沿着该方向继续向相邻的2个像素进行能量累积。具体包括以下步骤：

步骤S41：使用索贝尔(Sobel)边缘信息检测算子计算该像素的水平、垂直、45度和135度对角线这四个方向上的边缘信息强度。索贝尔算子在四个方向上的模板分别为：

w_c＝w_i/2, i＝1,2,3,4

w_c由检测出的具有最大边缘信息的方向决定，当检测出为水平方向时，w_c＝w₁/2；当检测出为垂直方向时，w_c＝w₂/2；当检测出为45度对角线方向时，w_c＝w₃/2；当检测出为135度对角线方向时，w_c＝w₄/2。

步骤S43：结合步骤S3，可得被删除像素的周围的10个像素(被删除像素的周围的10个像素指的步骤S3所述的相邻8个像素和步骤S42计算的沿着检测到的边缘信息幅度最大的方向相邻的2个像素)的能量累积的权重w_i最终为：

w_i＝w_i/(2×∑(w_i+w_c)+σ), i＝1,2,3,4

该公式用于归一化权重，w_c是持续向外累积的能量，σ为控制参数，实验中取0.00001，用于避免除零项。

步骤S5：删除最优缝组，更新此时得到的图像的能量矩阵、能量累积矩阵M及对应的视差图。

其中，被删除像素的周围的10个像素的能量累积矩阵更新为：

M(i,j±1)＝M(i,j±1)+w₁×M(i,j)

M(i±1,j)＝M(i±1,j)+w₂×M(i,j)

M(i±1,j±1)＝M(i±1,j±1)+w₃×M(i,j)

其中，M(i,j)表示在能量累积矩阵M中记录的像素(i,j)处的累积能量，表示在能量累积矩阵M中记录的像素(i+1,j-1)和(i-1,j+1)处的累积能量，M(i,j±2)表示在能量累积矩阵M中记录的像素(i,j+2)和(i,j-2)处的累积能量，所述w₁、w₂、w₃、w₄为步骤S43中归一化后的权重w_i，θ＝0°、90°、45°、135°分别表示检测出具有最大边缘信息的方向为水平、垂直、45度、135度对角线这四个方向。图4所示为检测出的方向为水平方向时，能量矩阵的更新示例图。

以上是本发明的较佳实施例，凡依本发明技术方案所作的改变，所产生的功能作用未超出本发明技术方案的范围时，均属于本发明的保护范围。

Claims

1.一种基于累积能量的立体图像线裁剪重定向方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于累积能量的立体图像线裁剪重定向方法，其特征在于，所述步骤S1中，输入立体图像和视差图，初始化输入图像的能量矩阵W和能量累积矩阵M，包括以下步骤：

步骤S11：输入一对立体图像{I_L,I_R}和对应的视差图D；

步骤S12：计算能量函数中的前向能量项E_intensity；

j_R＝j_L+D(i,j)

E(i,j,j^±)＝E^v(i,j,j^±)+E^h(i,j)

E^h(i,j)＝|F(i,j+1)-F(i,j-1)|

其中，F(i,j+1)表示输入图像I在(i,j+1)处的亮度值；

其中，

步骤S13：计算能量函数中的3D能量项E_3D：

E_3D(i,j,j^±)＝E_D(i,j,j^±)+β|D_n(i,j)|+γG(i,j)

E(i,j,j^±)＝E_intensity(i,j,j^±)+αE_3D(i,j,j^±)

步骤S15：初始化能量累积矩阵M为步骤S14的能量矩阵W。

3.根据权利要求2所述的一种基于累积能量的立体图像线裁剪重定向方法，其特征在于，所述步骤S2中，采用动态规划的方法找到左、右视图的一组最优缝组并记录所述最优缝组的路径，包括以下步骤：

4.根据权利要求3所述的一种基于累积能量的立体图像线裁剪重定向方法，其特征在于，所述步骤S3中，对于最优缝路径上的每个像素，从该像素的水平、垂直、45度、135度对角线这四个方向考虑能量累积的权重，这四个方向的能量累积的初始权重确定为：

w₁＝max(M(i,j-1),M(i,j+1))

w₂＝max(M(i-1,j),M(i+1,j))

w₃＝max(M(i-1,j-1),M(i+1,j+1))

w₄＝max(M(i-1,j+1),M(i+1,j-1))

5.根据权利要求4所述的一种基于累积能量的立体图像线裁剪重定向方法，其特征在于，所述步骤S4中，采用索贝尔算子检测具有最大边缘信息的方向，沿着该方向继续向相邻的2个像素进行能量累积，包括以下步骤：

w_c＝w_i/2,i＝1,2,3,4

w_i＝w_i/(2×∑(w_i+w_c)+σ),i＝1,2,3,4

6.根据权利要求5所述的一种基于累积能量的立体图像线裁剪重定向方法，其特征在于，所述步骤S5中，被删除像素的周围的10个像素的能量累积矩阵更新为：

M(i,j±1)＝M(i,j±1)+w₁×M(i,j)

M(i±1,j)＝M(i±1,j)+w₂×M(i,j)

M(i±1,j±1)＝M(i±1,j±1)+w₃×M(i,j)