CN108665470B

CN108665470B - 一种交互式轮廓提取方法

Info

Publication number: CN108665470B
Application number: CN201810457555.7A
Authority: CN
Inventors: 聂勇伟; 曹旭; 李桂清
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2018-05-14
Filing date: 2018-05-14
Publication date: 2020-09-22
Anticipated expiration: 2038-05-14
Also published as: CN108665470A

Abstract

本发明公开了一种交互式轮廓提取方法，包括步骤：1)建立l‑d轴坐标系，以用户交互草图为初始化，建立以初始曲线为中心的l‑d轴坐标系；2)局部轮廓线提取，将l‑d轴坐标系中寻找局部轮廓线的过程建模为最大化能量函数的问题，并使用动态规划求解局部最优解；3)多尺度局部轮廓线集合的生成，在初始化曲线上提取不同长度密集重叠的局部轮廓线集合；4)全局轮廓线融合，使用一种基于wPCA的方法，从冗余的局部轮廓线集合中提取出一条全局轮廓线。本发明方法能够表示任意复杂的物体轮廓，并且具有准确便捷，用户交互少，运行速度快，全局轮廓线连续和平滑的优点。

Description

一种交互式轮廓提取方法

技术领域

本发明涉及视频处理的技术领域，尤其是指一种交互式轮廓提取方法。

背景技术

随着计算机视觉和图像处理的快速发展，其相关技术的应用范围越来越广泛，尤其是在无人驾驶、人脸识别、增强现实(Augmented reality，简记为AR)、医学影像处理和工业控制等方面出现了很多新理论和新方法，并出现了很多优秀的商业化应用，使得这个领域被越来越多的人们所熟悉和关注。物体轮廓提取或检测是计算机视觉和图像处理中最重要的底层处理之一，它用于提取图像中对象的边界，提供图像中物体关键的轮廓信息。而这些信息可以用于图像分割、物体检测、遮挡和深度推理以及三维重建等很多领域，具有重要的研究意义和价值。

近年来计算机技术和光学摄影水平都得到了极大的提升，但是在实际中提取出精确的物体轮廓仍然有很大的困难。首先是场景、光照以及物体轮廓的复杂程度等物理条件方面的原因，在复杂场景和光照条件以及物体轮廓凹凸不平的情况下，提取物体轮廓本身就极具挑战性。另外是受摄影设备精度和图像数据压缩存储的影响，所处理的图像存在很多噪声。虽然可以通过图像去噪方法减轻这一问题，但难免会丢失细节信息，这对于提取精确的物体轮廓造成了干扰。目前提取出精确的物体轮廓仍然是一个十分具有挑战性的问题。

同时轮廓提取也是个经久不衰的研究领域，研究人员提出很多方法用于解决这个问题。早期的方法大都是一些局部分析方法，主要是使用显著的梯度信息定位图像的边缘。非常经典的局部方法有Robert，Sobel，Canny和Prewitt等。这些方法主要是用边缘检测模板来检测局部像素灰度的急剧变化。除了灰度信息，颜色和纹理信息也经常被用来帮助寻找图像边缘。局部轮廓提取方法得到的边缘信息经常是离散的，并不围成连续的闭合区域。所以全局方法则是试图将局部的边缘连接起来以获得完整的轮廓。全局方法通常使用图算法，将每个单独的边缘看作图的一个节点，然后将节点之间没有检测到的潜在边缘连接起来。全局的轮廓结构一般满足Gestalt准则，例如临近、闭合、对称等等。全局方法利用图算法，条件随机场、置信传播和特征值等方法，将上下文信息结合起来通过局部边缘推测全局结构。局部方法可以检测出边缘信息而无法提取出完整物体轮廓，全局方法的准确性和鲁棒性难以满足要求。

同时轮廓提取方法和图像分割技术十分相关,但是又不完全等同。图像分割是将图像分成不同的区域，每个区域对应着某个物体或者背景，而这块区域的边界就是物体的轮廓。轮廓提取常被用于辅助图像分割，但轮廓提取本身并不保证产生闭合的轮廓线，所以并不能将图像分为若干区域。反过来，根据图像分割的结果总是可以将所得区域的边界提取出来。图像分割的方法有很多种，例如图割(graph cuts)，正则化切割(normalizedcuts)，和均值漂移聚类(mean-shift clustering)等。但是图像分割的方法获得的轮廓质量较差，无法获得平滑精确的物体轮廓。

发明内容

本发明的目的在于克服现有技术的不足，提出了一种交互式轮廓提取的方法，可以灵活鲁棒地提取用户需要的物体轮廓。受素描技巧启发，本发明先通过动态规划生成局部轮廓线，然后基于主成分分析进行全局融合得到全局轮廓线，充分利用大量重叠局部轮廓线间的交叉验证，提高轮廓提取的有效性和准确性。

为实现上述目的，本发明所提供的技术方案为：一种交互式轮廓提取方法，包括以下步骤：

1)建立l-d轴坐标系，以用户交互草图为初始化，建立以初始曲线为中心的l-d轴坐标系；

2)局部轮廓线提取，将l-d轴坐标系中寻找局部轮廓线的过程建模为最大化能量函数的问题，并使用动态规划求解局部最优解；

3)多尺度局部轮廓线集合生成，在初始化曲线上提取不同长度密集重叠的局部轮廓线集合；

4)全局轮廓线融合，使用一种基于wPCA的方法，从冗余的局部轮廓线集合中提取出一条全局轮廓线。

在步骤1)中，所述的建立以初始曲线为中心的l-d轴坐标系，具体如下：

将初始化曲线的开始位置定义为l-d轴坐标系的原点O。沿着初始化曲线的是l坐标轴，垂直于初始化曲线的是d坐标轴。初始化曲线上的一个点p(x,y)，p点沿着初始化曲线到O点的距离是l₀。根据下面公式可以将l-d轴坐标系中的任意一点p'(l₀,d₀)转化到图像坐标系：

其中(x_p',y_p')是点p'在图像坐标系的坐标，

表示将(l₀,d₀)转换到图像坐标系。p点是(l₀,d₀)在l坐标轴上对应的位置，可以通过

计算，n是初始化曲线在点p处的法向量。

根据以上定义，对目标轮廓线进行采样，获取其在l-d轴坐标系中一系列的离散点。L是初始化曲线的总长度，在初始化曲线上均匀采样M个点{(l_i,0)|i∈{1,2,...,M}}，其中

目标轮廓线通过一系列离散点来表示：

其中

是目标轮廓线，(l_i,d_i)是目标轮廓线

上采样的点，M表示目标轮廓线

点的数目。

l-d轴坐标系中的局部轮廓线则可以通过其中一部分点来表示：

其中

是局部轮廓线，(l_i,d_i)是局部轮廓线

上均匀的点，其开始的位置是s，结束的位置是t，s≥1并且t≤M。

最后将d_i的范围限制在[-r,r]之间，这样所有的局部轮廓线都是在以初始化曲线为中心轴，宽度为2r的带状区域之内。

在步骤2)中，所述的局部轮廓线的提取，具体如下：

通过最大化局部轮廓线的能量函数，确定所有的d轴坐标d_i就可以确定这条局部轮廓线所在的位置。局部轮廓线{d_i|i∈{s,s+1,..,t-1,t}}的能量函数由两部分组成：

E({d_i})＝α·E_e({d_i})+β·E_s({d_i}),

其中{d_i}是所求局部轮廓线，E({d_i})表示局部轮廓线的能量。E_e是梯度项，表示局部轮廓线处梯度的大小；E_s是平滑项，表示局部轮廓线平滑的程度。α和β用于调节两项之间的权重。

然后使用动态规划求解能量函数的近似全局最优解。在l-d轴坐标系中，将d轴以

的间隔离散成为2N+1个坐标

获得了一个(t-s+1)×(2N+1)个节点的网格：{(l_i,d_i,j)|i∈{s,...,t-1,t},j∈{-N,...,0,...,N}}。在这些点上可以构建出一个网格图

每个点(l_i,d_i,j)对应网格图

中的一个节点n_i,j。两个节点n_i-1,j'和n_i,j通过边

相连，其中|j-j'|≤cmax。在离散的网格图中，连续的优化问题转化为在网格图

中寻找最佳路径的问题。

首先假设对于第i-1行所有节点，已经找到其从第1行到第i-1行的最佳路径。用

表示以节点n_i-1,j结尾的最佳路径。对于第i行任意一个节点n_i,j，以其结尾的最佳路径一定来自于下面几个路径之一：

符号

表示将边添加到某一路径的尾部成为一个新的路径，其中δ＝{-cmax,-cmax+1,...,cmax}，cmax为范围阈值。使用

和ε(e)分别表示一条路径和一条边的能量值，则在节点n_i,j处选择加入当前路径的最优边为：

其中δ^*表示加入当前路径的最优边的索引，并且δ＝{-cmax,-cmax+1,...,cmax}。

是第i-1行中节点n_i-1,j结尾的最佳路径的能量值，

是节点n_i,j处的有方向的梯度值。边的能量值

具体的含义是平滑项的能量：

其中平滑项

由边

与之前的一条边

的向量内积

表示，其中

是路径

上的倒数第二个点的索引。

表示边

的单位向量，通过以下方法计算：

其中

表示边

的单位向量，

是对应节点的坐标。

最后得到节点n_i,j处的最佳路径：

其中

是节点n_i,j处最佳路径，

是节点n_i-1,j+δ处最佳路径。同时获得节点n_i,j处最佳路径的能量值：

通过对网格图

的每个节点计算上式能量，最后可以算出对于最后一行每个节点结尾的最佳路径。选取其中能量值最大的一条就是所求的局部轮廓线。

在步骤3)中，所述的多尺度局部轮廓线集合的生成，具体如下：

因为参数s和t决定了一个局部轮廓线在l-d轴坐标系开始和结束的位置。多尺度局部轮廓线提取长度分别为t-s+1＝{24,30,39,51,66}的局部轮廓线。对于每一种长度的局部轮廓线，沿着初始化轮廓线以相邻两个重叠2/3的间隔采样。例如长度为24的局部轮廓线开始的位置应该是s＝{1,9,17,...}，而长度为30的局部轮廓线开始的位置应该是s＝{1,11,21,...}。给定开始的位置s和结束的位置t，就可以使用之前的动态规划算法提取对应的局部轮廓线。

多尺度局部轮廓提取经常需要寻找上百条局部轮廓线，因而无法达到实时的效果。通过GPU加速并行计算多尺度的局部轮廓线计算过程，用CUDA中每一个线程计算一个局部轮廓线，将算法加速到实时的效果。

在步骤4)中，所述的基于wPCA的全局轮廓线融合，具体如下：

全局融合方法基于主成分分析从局部轮廓线集合中通过动态规划提取全局轮廓线。P是局部轮廓线上点的集合。对于P中任意的一个点p_i，其协方差矩阵是：

其中

将远离p_i的点对其影响降低，r是两点之间的距离，σ是一个固定阈值。通过SVD分解这个协方差矩阵，可以获得其特征值和特征向量，对应最大特征值的特征向量就是p_i点处的主方向。

在得到每个点处的wPCA方向之后，通过动态规划的全局轮廓线融合的方法如下：

对于任意一个节点n_i,j，与其上一行的节点n_i-1,j+δ通过边

连接。则每个点节点处的能量值为：

其中

表示节点n_i,j处的能量，

表示节点n_i-1,j+δ处的能量值，

表示边

的单位向量，

表示节点n_i-1,j+δ处的wPCA的方向。通过对网格图

中的每个节点计算

能量，最终可以从可行路径中，找到一条基于wPCA方法的最优路径。

本发明与现有技术相比，具有如下优点与有益效果：

1、图像中物体轮廓通常是不规则的形状。在笛卡尔坐标系表示下，这种不规则的特性使得无法用一个简单的形式表示物体的轮廓线，以至于轮廓提取问题的建模变得异常复杂。本发明使用了以初始曲线为中心的l-d轴坐标系，能够非常便捷地表示任意复杂的物体轮廓。

2、本发明受画家常用的素描技巧启发，设计了一种新颖的物体轮廓提取方法。由局部轮廓提取和全局轮廓融合组成，其固有的交叉验证机制保证了本发明轮廓提取方法准确有效。

3、本发明轮廓提取方法使用了动态规划并使用CUDA进行加速，达到实时交互的效果，能够便捷准确地完成轮廓提取。

4、本发明提出了基于wPCA的全局轮廓线融合，保持了全局轮廓线的连续性和平滑性，并使用动态规划巧妙地舍弃了错误的局部轮廓线，从可行解中找了一条最优的全局轮廓线。

附图说明

图1是本发明交互式轮廓提取流程图。

图2是l-d轴坐标系及局部轮廓线示意图。

图3是动态规划方法求解网格图

中最佳路径示意图。

图4是全局轮廓线融合方法示意图。

图5是本发明局部轮廓和全局轮廓结果图。

图6是本发明轮廓提取方法不同初始化位置的结果比较。

图7是本发明应用于轮廓提取的示例以及与PASCAL数据集原始标记对比图。

具体实施方式

下面结合具体实施例对本发明作进一步说明。

如图1所示，本实施例所提供的交互式轮廓提取方法，包括以下步骤：

如图2所示，将初始化曲线的开始位置定义为l-d轴坐标系的原点O。沿着初始化曲线的是l坐标轴，垂直于初始化曲线的是d坐标轴。初始化曲线上的一个点p(x,y)，p点沿着初始化曲线到O点的距离是l₀。根据下面公式可以将l-d轴坐标系中的任意一点p'(l₀,d₀)转化到图像坐标系：

其中(x_p',y_p')是点p'在图像坐标系的坐标，

计算，n是初始化曲线在点p处的法向量。

目标轮廓线通过一系列离散点来表示：

其中

是目标轮廓线，(l_i,d_i)是目标轮廓线

上采样的点，M表示目标轮廓线

点的数目。

其中

是局部轮廓线，(l_i,d_i)是局部轮廓线

在步骤2)中，所述的局部轮廓线的提取，具体如下：

通过最大化局部轮廓线的能量函数，确定l_i处的d_i就可以确定这条局部轮廓线所在的位置。局部轮廓线{d_i|i∈{s,s+1,..,t-1,t}}的能量函数由两部分组成：

E({d_i})＝α·E_e({d_i})+β·E_s({d_i}),

然后使用动态规划求解能量函数的近似全局最优解。如图3所示，在l-d轴坐标系中，将d轴以

的间隔离散成为2N+1个坐标

每个点(l_i,d_i,j)对应网格图

中的一个节点n_i,j。两个节点n_i-1,j'和n_i,j通过边

中寻找最佳路径的问题。

符号

其中δ*表示加入当前路径的最优边的索引，并且δ＝{-cmax,-cmax+1,...,cmax}。

是第i-1行中节点n_i-1,j结尾的最佳路径的能量值，

是节点n_i,_j处的有方向的梯度值。边的能量值

具体的含义是平滑项的能量：

其中平滑项

由边

与之前的一条边

的向量内积

表示，其中

是路径

上的倒数第二个点的索引。

表示边

的单位向量，通过以下方法计算：

其中

表示边

的单位向量，

是对应节点的坐标。

最后得到节点n_i,j处的最佳路径：

其中

是节点n_i,j处最佳路径，

通过对网格图

因为参数s和t决定了一个局部轮廓线在l-d轴坐标系开始和结束的位置。本章的多尺度局部轮廓线提取长度分别为t-s+1＝{24,30,39,51,66}的局部轮廓线。对于每一种长度的局部轮廓线，沿着初始化轮廓线以相邻两个重叠2/3的间隔采样。例如长度为24的局部轮廓线开始的位置应该是s＝{1,9,17,...}，而长度为30的局部轮廓线开始的位置应该是s＝{1,11,21,...}。给定开始的位置s和结束的位置t，就可以使用之前的动态规划算法提取对应的局部轮廓线。

多尺度的局部轮廓提取经常需要寻找上百条局部轮廓线，因而无法达到实时的效果。通过GPU加速并行计算多尺度的局部轮廓线计算过程，用CUDA中每一个线程计算一个局部轮廓线，将算法加速到实时的效果。

在步骤4)中，所述的基于wPCA的全局轮廓线融合，具体如下：

其中

在得到每个点处的wPCA方向之后，如图4所示，通过动态规划的全局轮廓线融合的方法如下：

对于任意一个节点n_i,j，与其上一行的节点n_i-1,j+δ通过边

连接。则每个点节点处的能量值为：

其中

表示节点n_i,j处的能量，

表示节点n_i-1,j+δ处的能量值，

表示边

的单位向量，

表示节点n_i-1,j+δ处的wPCA的方向。通过对网格图

中的每个节点计算

图5展示了使用本文轮廓提取方法提取物体轮廓的一个例子，本发明轮廓提取方法准确有效，最终的全局轮廓线是从大量重叠的局部轮廓线上交叉验证得到的，即使一条局部的轮廓线偏离了正确的位置，很多附近的局部轮廓线能够矫正这一错误。

本发明对初始化位置鲁棒，如图6所示，使用不同的初始化均能获得准确的物体轮廓结果。图7展示了本发明应用于轮廓提取的示例以及与PASCAL数据集原始标记对比图。

以上所述实施例只为本发明之较佳实施例，并非以此限制本发明的实施范围，故凡依本发明之形状、原理所作的变化，均应涵盖在本发明的保护范围内。

Claims

1.一种交互式轮廓提取方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种交互式轮廓提取方法，其特征在于，在步骤1)中，所述的建立以初始曲线为中心的l-d轴坐标系，具体如下：

将初始化曲线的开始位置定义为l-d轴坐标系的原点O，沿着初始化曲线的是l坐标轴，垂直于初始化曲线的是d坐标轴，初始化曲线上的一个点p(x,y)，p点沿着初始化曲线到O点的距离是l₀，根据下面公式能够将l-d轴坐标系中的任意一点p'(l₀,d₀)转化到图像坐标系：

其中(x_p',y_p')是点p'在图像坐标系的坐标，

表示将(l₀,d₀)转换到图像坐标系，p点是(l₀,d₀)在l坐标轴上对应的位置，能够通过

计算，n是初始化曲线在点p处的法向量；

根据以上定义，对目标轮廓线进行采样，获取其在l-d轴坐标系中一系列的离散点，L是初始化曲线的总长度，在初始化曲线上均匀采样M个点{(l_i,0)|i∈{1,2,...,M}}，其中

目标轮廓线通过一系列离散点来表示：

其中

是目标轮廓线，(l_i,d_i)是目标轮廓线

上采样的点，M表示目标轮廓线

点的数目；

l-d轴坐标系中的局部轮廓线则能够通过其中一部分点来表示：

其中

是局部轮廓线，(l_i,d_i)是局部轮廓线

上均匀的点，其开始的位置是s，结束的位置是t，s≥1并且t≤M；

3.根据权利要求1所述的一种交互式轮廓提取方法，其特征在于：在步骤2)中，所述的局部轮廓线提取，具体如下：

通过最大化局部轮廓线的能量函数，确定所有的d轴坐标d_i就能够确定这条局部轮廓线所在的位置，局部轮廓线{d_i|i∈{s,s+1,..,t-1,t}}的能量函数由两部分组成：

E({d_i})＝α·E_e({d_i})+β·E_s({d_i}),

其中{d_i}是所求局部轮廓线，E({d_i})表示局部轮廓线的能量；E_e是梯度项，表示局部轮廓线处梯度的大小；E_s是平滑项，表示局部轮廓线平滑的程度；α和β用于调节两项之间的权重；

然后使用动态规划求解能量函数的近似全局最优解，在l-d轴坐标系中，将d轴以

的间隔离散成为2N+1个坐标

获得了一个(t-s+1)×(2N+1)个节点的网格：{(l_i,d_i,j)|i∈{s,...,t-1,t},j∈{-N,...,0,...,N}}，在这些点上能够构建出一个网格图

每个点(l_i,d_i,j)对应网格图

中的一个节点n_i,j，两个节点n_i-1,j'和n_i,j通过边

相连，其中|j-j'|≤cmax，在离散的网格图中，连续的优化问题转化为在网格图

中寻找最佳路径的问题；

首先，假设对于第i-1行所有节点，已经找到其从第1行到第i-1行的最佳路径，用

表示以节点n_i-1,j结尾的最佳路径，对于第i行任意一个节点n_i,j，以其结尾的最佳路径一定来自于下面几个路径之一：

符号

表示将边添加到某一路径的尾部成为一个新的路径，其中δ＝{-cmax,-cmax+1,...,cmax}，cmax为范围阈值；使用

其中δ^*表示加入当前路径的最优边的索引，并且δ＝{-cmax,-cmax+1,...,cmax}；

是第i-1行中节点n_i-1,j结尾的最佳路径的能量值，

是节点n_i,j处的有方向的梯度值；边的能量值

具体的含义是平滑项的能量：

其中平滑项

由边

与之前的一条边

的向量内积

表示，其中

是路径

上的倒数第二个点的索引；

表示边

的单位向量，通过以下方法计算：

其中

表示边

的单位向量，

是对应节点的坐标；

最后得到节点n_i,j处的最佳路径：

其中

是节点n_i,j处最佳路径，

是节点n_i-1,j+δ处最佳路径；同时获得节点n_i,j处最佳路径的能量值：

通过对网格图

的每个节点计算上式能量，最后能够算出对于最后一行每个节点结尾的最佳路径，选取其中能量值最大的一条就是所求的局部轮廓线。

4.根据权利要求1所述的一种交互式轮廓提取方法，其特征在于：在步骤3)中，所述的多尺度局部轮廓线集合的生成，具体如下：

因为参数s和t决定了一个局部轮廓线在l-d轴坐标系开始和结束的位置，多尺度局部轮廓线提取长度分别为t-s+1＝{24,30,39,51,66}的局部轮廓线，对于每一种长度的局部轮廓线，沿着初始化轮廓线以相邻两个重叠2/3的间隔采样，长度为24的局部轮廓线开始的位置应该是s＝{1,9,17,...}，而长度为30的局部轮廓线开始的位置应该是s＝{1,11,21,...}，给定开始的位置s和结束的位置t，就能够使用之前的动态规划算法提取对应的局部轮廓线；

多尺度局部轮廓提取经常需要寻找上百条局部轮廓线，因而无法达到实时的效果，通过GPU加速并行计算多尺度的局部轮廓线计算过程，用CUDA中每一个线程计算一个局部轮廓线，将算法加速到实时的效果。

5.根据权利要求1所述的一种交互式轮廓提取方法，其特征在于：在步骤4)中，所述的基于wPCA的全局轮廓线融合，具体如下：

全局融合方法基于主成分分析从局部轮廓线集合中通过动态规划提取全局轮廓线，P是局部轮廓线上点的集合，对于P中任意的一个点p_i，其协方差矩阵是：