CN106650777B

CN106650777B - 结合字典群的目标分割方法

Info

Publication number: CN106650777B
Application number: CN201610898208.9A
Authority: CN
Inventors: 姚劲草; 于慧敏
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2016-10-14
Filing date: 2016-10-14
Publication date: 2019-07-05
Anticipated expiration: 2036-10-14
Also published as: CN106650777A

Abstract

本发明公开了一种结合字典群的目标分割方法。该方法首先对训练形状集进行对数极坐标变换和模糊对数极坐标分解；利用分解获得的子形状集和原始训练集的对数极坐标变换组成形状集群；基于形状集群构造字典群；结合字典群构造字典群约束主项和辅项；结合底层概率形状函数构造统一分割模型；初始化稀疏系数和底层概率形状，利用标准梯度下降法和软阈值法进行函数最优化求解；通过判断优化是否收敛决定迭代或输出目标分割结果；本发明克服了小样本训练集背景下，目标存在局部形变时，现有稀疏形状表示方法无法充分利用训练集样本的局部信息重建目标形状的问题；同时也大幅提高了稀疏形状表示在目标与训练形状存在较大整体差异情况下的目标的表达能力。

Description

结合字典群的目标分割方法

技术领域

本发明涉及基于先验形状的图像目标分割领域，尤其涉及一种结合字典群的目标分割方法。

背景技术

利用计算机模拟人眼的功能准确分割图像中的目标，对于计算机视觉和图像处理至关重要。由于实际图像中的目标可能存在噪声、遮挡、缺损或背景粘连等因素的影响，仅依赖图像本身信息对目标进行分割往往效果不佳。结合先验形状生成形状字典，并利用稀疏形状表示指导目标分割可以较好的改善分割效果，因此近期基于字典和稀疏形状表示的目标分割技术成为了研究热点。

虽然基于形状字典和稀疏形状表示的目标分割方法研究已经取得了一定进展，现有的方法主要是基于全局形状结构的稀疏组合进行约束，这种约束方法的优点是有利于确保形状先验的整体刚性，而刚性的特点是可以较好的恢复目标因损坏、粘连或遮挡而缺失的原始形状。但同时这也带来两个弊端，首先它要求训练集中的形状近邻和目标原始形状具有较高的全局相似度。众所周知，在很多目标分割的应用场合，我们常常只能获得有限的训练样本，而在小样本的情况下训练集很难符合上述标准。其次，基于形状整体刚性的稀疏表示，一定程度上削弱了形状先验的模型的局部形变能力。当目标存在局部形变时，稀疏表形状示由于受全局刚性的影响，很难针对目标的局部形变重建一个较好的稀疏形状组合来准确表达目标原始形状。

如何在保持一定刚性的前提下，充分挖掘训练集中蕴含的形状信息，同时允许模型对目标形状的局部形变进行相应调整是完善现有稀疏形状表示的一个重要课题。针对这些问题，本发明提出了一种既能保持重建稀疏形状组合的刚性特点，同时也考虑目标存在局部形变的结合字典群的目标分割模型。该模型克服了小样本训练集背景下，目标存在局部形变时，现有稀疏形状表示方法无法充分利用训练集样本的局部信息重建目标形状的问题；同时也大幅提高了目标与训练形状存在较大整体差异情况下的目标的表达能力。

发明内容

本发明要解决的技术问题是提供一种涉及字典群的目标分割方法，该方法克服了现有分割模型抗几何形变能力弱，有噪声情况下形状表示能力差，分割效果不佳的问题。

本发明通过以下技术方案来解决上述技术问题：

一种结合字典群的目标分割方法，包括以下步骤：

S1：对原始训练形状集进行对数极坐标变换得到训练集对数极坐标形状，并对原始训练形状集进行模糊对数极坐标分解获得子形状集，利用所述子形状集和训练集对数极坐标形状组成形状集群；

S2：基于所述形状集群构造字典群，并结合所述字典群构造字典群约束主项和辅项；

S3：使用所述字典群约束主项和辅项结合底层概率形状函数构造统一分割模型；

S4：初始化基于字典群的稀疏系数和所述底层概率形状函数；

S5：由所述底层概率形状函数得到底层概率形状，并将所述底层概率形状嵌入所述字典群约束主项；

S6：利用标准梯度下降法和软阈值法对所述统一分割模型的能量函数进行最优化求解；

S7：判断优化结果是否收敛；若不收敛，则返回步骤S5继续执行直至收敛。

进一步的，步骤S2中，所述字典群约束主项和辅项的表达式为：

其中，等式右侧第一项为主项，第二项为辅项；s为稀疏系数；t_i为第i个局部约束系数；A为主字典；Dⁱ为第i个子字典；q_L为输入对数极坐标形状；Gⁱ(·)为第i个模糊对数极坐标变换子；ω_i为第i个权重系数；n为子字典个数；A和Dⁱ构成过完备字典群。

进一步的，步骤S3中，所述统一分割模型的表达式为：

其中，s为稀疏系数；t_i为第i个局部约束系数；M为映射空间变换矩阵；为A主字典；Dⁱ为第i个子字典；为训练集对数极坐标平均形状；Gⁱ(·)为第i个模糊对数极坐标变换子；ω_i为第i个权重系数；n为子字典个数；A和Dⁱ构成过完备字典群；φ_L为输入对数极坐标概率形状；φ为原始概率形状；r_o是目标概率分布，r_b是背景概率分布。

与现有技术相比，本发明有如下优点：

本发明提供了一种结合字典群的目标分割方法，涉及过完备字典群和稀疏形状表示，包括对训练形状集进行对数极坐标变换和模糊对数极坐标分解；利用分解获得的子形状集和原始训练集的对数极坐标变换组成形状集群；基于形状集群构造字典群；结合字典群构造字典群约束主项和辅项；结合底层概率形状函数构造统一分割模型；初始化稀疏系数和底层概率形状，利用标准梯度下降法和软阈值法进行函数最优化求解；通过判断优化是否收敛决定迭代或输出目标分割结果。

本发明的目标分割方法克服了现有方法利用全局形状结构作为约束导致的局部形变能力不足的问题。具体来说，本发明的目标分割方法克服了小样本训练集背景下，目标存在局部形变时，现有方法无法充分利用训练集样本的局部信息重建目标形状的问题；同时也大幅提高了分割模型在目标与训练形状存在较大整体差异情况下的目标的表达能力。

附图说明

图1为本发明的结合过完备字典群的目标分割方法的总体流程图。

图2为本发明的模糊对数极坐标分解中的隶属度函数。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及具体实施方式对本发明作进一步的详细描述。

实施例

如图1所示，本实施例提供一种结合过完备字典群的目标分割方法，包括以下步骤：

A1：对训练形状集进行对数极坐标变换和模糊对数极坐标分解；

A2：利用分解获得的子形状集和原始训练集对数极坐标变换组成形状集群；

A3：基于形状集群构造字典群；

A4：结合字典群构造字典群约束主项和辅项；

A5：结合底层概率形状函数构造统一分割模型；

A6：初始化稀疏系数和概率形状函数；

A7：将底层概率形状嵌入字典群约束主项；

A8：利用标准梯度下降法和软阈值法进行函数最优化求解；

A9：判断优化结果是否收敛；若不收敛，则返回A7继续执行直至收敛。

进一步，所述步骤A1假设存在训练形状集包含N个形状样本，其图像坐标定义在笛卡尔坐标系下；则对数极坐标坐标系下的坐标点定义为:y＝[y₁,y₂]∈R²，其中y₁表示对数对数半径，y₂表示角度。对于任意笛卡尔坐标系下的点x＝[x₁,x₂]∈R²与对数极坐标系下相应点的转换公式为

分解边缘采用模糊隶属度函数进行定义可以解决形状分解产生的块效应。本实施方案采用如图2所示梯形模糊隶属度函数G¹到G⁴，将对数极坐标形状分解为4个子形状。

进一步，所述步骤A2将原始训练形状的对数极坐标形状作为主形状集；将所有G¹分解所得的形状列为子形状集1；以此类推，G²到G⁴对应子形状集2到4。

进一步，所述A3基于形状集群构造字典群，这里采用主成分分析的方法。假设q_i是训练集的一个元素，其基于主成分分析的重建表达式为其中a_i,j重建系数，a_i＝[a_i,1,a_i,2,…,a_i,n]^T，表示任意一组稀疏系数。则主形状集对应的主字典为同理可获得子形状集相应子字典D¹到D⁴；则由主字典A和子字典D¹到D⁴可构成字典群。

进一步，所述A4中结合底层概率形状函数的统一分割模型表达式为：

其中，s为稀疏系数；t_i为第i个局部约束系数；M为主成分分析映射空间变换矩阵；为A主字典；Dⁱ为第i个子字典；为训练集对数极坐标平均形状；Gⁱ(·)为第i个模糊对数极坐标变换子；ω_i为第i个权重系数；n为子字典个数；A和Dⁱ构成过完备字典群；φ_L为输入对数极坐标概率形状；φ为原始概率形状；r_o是目标概率分布，r_b是背景概率分布。

进一步，所述A6初始化方法为令初始概率形状函数为圆，其半径为图像宽度三分一，令稀疏系数和约束参数为

其中，N为训练集样本个数；n＝4为分解个数。

进一步，所述A7所述嵌入方法为为将原始概率形状φ变换为对数极坐标概率形状φ_L并嵌入字典群约束主项。

进一步，所述A9误差函数定义为

可以根据具体应用设置e(s,φ)阈值，确定何时结束算法迭代。

以上实施例仅为本发明的一种实施方式，其描述较为具体和详细，但不能因此而理解为对本发明专利范围的限制。其具体结构和参数可根据实际需要进行相应的调整。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.一种结合字典群的目标分割方法，其特征在于，包括以下步骤：

S2：基于所述形状集群构造字典群，并结合所述字典群构造字典群约束主项和辅项，所述字典群约束主项和辅项的表达式为：

其中，等式右侧第一项为主项，第二项为辅项；s为稀疏系数；t_i为第i个局部约束系数；A为主字典；Dⁱ为第i个子字典；q_L为输入对数极坐标形状；Gⁱ(·)为第i个模糊对数极坐标变换子；ω_i为第i个权重系数；n为子字典个数；A和Dⁱ构成过完备字典群；

S3：使用所述字典群约束主项和辅项结合底层概率形状函数构造统一分割模型，所述统一分割模型的表达式为：

其中，s为稀疏系数；t_i为第i个局部约束系数；M为映射空间变换矩阵；A 为主字典；Dⁱ为第i个子字典；为训练集对数极坐标平均形状；Gⁱ(·)为第i个模糊对数极坐标变换子；ω_i为第i个权重系数；n为子字典个数；A和Dⁱ构成过完备字典群；φ_L为输入对数极坐标概率形状；φ为原始概率形状；ro是目标概率分布，r_b是背景概率分布；