CN112287935B

CN112287935B - 一种基于显著性先验的图像语义分割方法及系统

Info

Publication number: CN112287935B
Application number: CN202010915346.XA
Authority: CN
Inventors: 李庆武; 丁成龙; 叶倩; 陈俊锋; 余志宏
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2020-09-03
Filing date: 2020-09-03
Publication date: 2022-07-29
Anticipated expiration: 2040-09-03
Also published as: CN112287935A

Abstract

本发明公开了一种基于显著性先验的图像语义分割方法及系统，本发明计算基于深度紧密性的显著值、基于位置先验的显著值、基于颜色先验的显著值，基于条件随机场生成融合多尺度特征的显著图，清晰度和辨识度高，提高了分割精确度。

Description

一种基于显著性先验的图像语义分割方法及系统

技术领域

本发明涉及一种基于显著性先验的图像语义分割方法及系统，属于图像处理以及计算机视觉技术领域。

背景技术

图像语义分割是根据像素的语义对图像像素进行标注形成不同分割区域。语义分割是计算机视觉研究中的一个重要领域，其主要任务是让计算机能够知道图像中每个像素“是什么”。语义分割是图像理解的基石性技术，在自动驾驶系统的街景识别与理解、无人机着陆点判断、医学图像的病灶识别与定位中具有举足轻重的作用。

图像语义分割作为计算机视觉中的基础性技术，是将图像中的对象按照轮廓分割并语义标注出来，使得图像更加容易理解与分析。随着深度学习方法被提出及推广，与图像语义分割相结合，形成当前主流的图像语义分割方法模型，通过卷积神经网络、深度学习等方法提取像素特征，并训练基于像素的模型，最后逐一标注像素语义结果。然而，该模型没有模拟生物视觉的识别过程，单纯计算机式的从像素的角度出发，忽略了对象的整体性特性，将对图像对象的语义识别转化为对单个像素的逐一识别，虽然在提取像素的特征过程中融入了全局或者局部特征，但依然无法很好的考虑同一对象的像素之间的联系，造成图像对象的丢失以及图像对象轮廓的缺失问题，以至于最终语义分割结果精确度不足，在实际应用中受到限制，并且无法达到理想的实用性。

发明内容

本发明提供了一种基于显著性先验的图像语义分割方法及系统，解决了现有分割结果精确度不足的问题。

为了解决上述技术问题，本发明所采用的技术方案是：

一种基于显著性先验的图像语义分割方法，包括，

对待分割图像进行超像素分割，获得超像素块；

根据超像素块，分别计算基于深度紧密性的显著值、基于位置先验的显著值和基于颜色先验的显著值；

基于条件随机场将所有显著值对应的显著图进行融合；

提取融合后显著图的多维特征，将多维特征输入预先训练的分类器，获得图像语义分割结果。

根据超像素块，分别计算基于深度紧密性的显著值、基于位置先验的显著值和基于颜色先验的显著值，具体过程为，

根据超像素块，构建融合颜色信息和深度线索的图模型；

根据图模型和目标深度紧密性，计算基于深度紧密性的显著值；

根据图模型和目标位置先验，计算基于位置先验的显著值；

根据图模型和目标颜色先验，计算基于颜色先验的显著值；

将超像素块映射至深度图，构建融合颜色信息和深度线索的图模型；其中，图模型为G＝(V,E)，V为超像素块集合，E为两超像素块相连构成的边的集合，每条边配置有相应的权重，

其中，c_i为第i个超像素块v_i的RGB、LAB六维颜色空间特征向量，c_j为第j个超像素块v_j的RGB、LAB六维颜色空间特征向量，w_ij为边e_ij的权重，e_ij为v_i、v_j相连构成的边，σ为控制v_i、v_j相似程度的调节参数，d_i为深度空间下v_i内包含的所有像素点均值，d_j为深度空间下v_j内包含的所有像素点均值，μ_d为评估深度特征的深度置信值。

基于深度紧密性的显著值计算公式为，

V_m(i)＝λV_bm(i)+(1-λ)V_fm(i)

其中，V_m(i)为第i个超像素块基于深度紧密性的显著值，λ为深度紧密性调节参数，V_bm(i)为第i个超像素块基于背景目标种子点的显著值，V_fm(i)为第i个超像素块基于前景目标种子点的显著值；

其中，D为两对应超像素间度的矩阵，α为控制平衡系数，w_ij为边的权重，e_ij为第i个超像素块和第j个超像素块相连构成的边，W为w_ij的矩阵，FG和BG分别为前景目标种子和背景目标种子集合，Fr(j)表示第j个超像素块区域为前景，f_c表示第c个查询节点的排序值，查询节点为原始深度图的显著前景目标位置。

基于位置先验的显著值计算公式为，

其中，V_P(i)为第i个超像素块基于位置先验的显著值，β为位置最优先验调节系数，b_i为第i个超像素块的质心，r为中心l_r的位置，l_r为像素数最大的目标所在区域的中心。

基于颜色先验的显著值计算公式为，

其中，V_c(i)为第i个超像素块基于颜色先验的显著值，N为超像素块个数，n_j为第j个超像素块包含的像素个数，b_j为第j个超像素块的质心，r为中心l_r的位置，l_r为像素数最大的目标所在区域的中心，f_ij为查询节点排序优化后的度向量中第i行第j列的值，查询节点为原始深度图的显著前景目标位置。

提取融合后显著图的前景、背景多维特征，将多维特征输入预先训练的SVM分类器，获得图像语义分割结果。

一种基于显著性先验的图像语义分割系统，包括，

超像素分割模块：对待分割图像进行超像素分割，获得超像素块；

显著值计算模块：根据超像素块，分别计算基于深度紧密性的显著值、基于位置先验的显著值和基于颜色先验的显著值；

融合模块：基于条件随机场将所有显著值对应的显著图进行融合；

分类模块：提取融合后显著图的多维特征，将多维特征输入预先训练的分类器，获得图像语义分割结果。

一种存储一个或多个程序的计算机可读存储介质，所述一个或多个程序包括指令，所述指令当由计算设备执行时，使得所述计算设备执行基于显著性先验的图像语义分割方法。

一种计算设备，包括一个或多个处理器、一个或多个存储器以及一个或多个程序，其中一个或多个程序存储在所述一个或多个存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序包括用于执行基于显著性先验的图像语义分割方法的指令。

本发明所达到的有益效果：本发明计算基于深度紧密性的显著值、基于位置先验的显著值和基于颜色先验的显著值，基于条件随机场生成融合多尺度特征的显著图，清晰度和辨识度高，提高了分割精确度；同时本发明采用条件随机场，能够较好地解决了标记问题。

附图说明

图1为本发明的流程图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

如图1所示，一种基于显著性先验的图像语义分割方法，包括以下步骤：

步骤1，对待分割图像进行超像素分割，获得超像素块。

对待分割图像通过全局特征计算相应的显著图，在CIELAB颜色空间上采用简单线性迭代聚类(SLIC)算法对图像进行分割获得超级像素。具体方法如下：

设定聚类中心：首先设置欲分割出的超像素个数，在包含N1个像素的输入图像中，分割出K1个尺寸均匀的超像素，分割出的每个超级像素应包含N1/K1个像素。在图像中均匀分配聚类中心，即种子点，则两相邻聚类中心在图中的距离(步长)约为

为了产生大小相似的超像素，SLIC方法先采用网格法初始化聚类中心，并为每个聚类中心分配不同的标签。将聚类中心移动到其3*3领域的最小梯度处，以避免其位于图像边缘或噪声处。

SLIC方法的聚类方式与K均值聚类相似，但搜索范围远小于后者，为2S×2S。凭借计算每个像素与范围内的聚类中心之间的距离D′，便可确定每个像素点的标签。在处理过程中，该方法充分考虑到提取信息的全面性，计算距离：SLIC中的距离分为空间与颜色两方面。2S×2S领域内所有像素点，分别按下式计算像素点和该聚类中心的两种距离，公式如下：

其中，d_c为颜色距离，d_s为空间距离，x、y分别表示像素点在X轴和Y轴两个方向上的坐标值，x_ir、y_ir分别表示聚类中心在两个坐标轴上的坐标值。L、a、b分别为像素点在CIELAB颜色空间的三个分量，L_ir、a_ir、b_ir分别表示聚类中心在CIELAB颜色空间的三个分量，N_s为两相邻聚类中心在图中的距离，

N_c为最大的颜色距离，D′为每个像素与范围内的聚类中心之间的距离。

由于针对不同输入图片的类型与大小都不尽相同，在此用一个固定常数t来代入计算，综合两种距离得到D′如下：

因为每个像素点周围均有若干个聚类中心，在此方法中，分别度量该像素点与周围各个种子点间的距离，选取其中最小值对应的聚类中心作为该像素点的类标签。

迭代聚类：重复上面步骤直到图像中每个像素点所属种子点不再变动，即误差收敛，一般进行10次迭代。

增强连通性：经过上述迭代优化可能会有若干种误差，可以利用增强连通性来削弱误差带来的影响。具体方法为：首先建立标记表，将-1赋值给表内各个元素，依照由左至右，由上至下的顺序把过小尺寸的超像素、出现多连通的超像素重新分配给邻近的超像素，遍历过程中，用对应的标签标记每个像素点，待所有像素点均得到相应标签为止。

步骤2，根据超像素块，分别计算基于深度紧密性的显著值、基于位置先验的显著值和基于颜色先验的显著值。

具体过程如下：

21)根据超像素块，构建融合颜色信息和深度线索的图模型。

SLIC算法将图像P_origin分割成个近似均匀的超像素块，将超像素块映射至深度图，构建融合颜色信息和深度线索的图模型；其中，图模型为G＝(V,E)，V为超像素块集合，E为两超像素块相连构成的边的集合，每条边配置有相应的权重，

其中，c_i为第i个超像素块v_i的RGB、LAB六维颜色空间特征向量，c_j为第j个超像素块v_j的RGB、LAB六维颜色空间特征向量，w_ij为边e_ij的权重，e_ij为v_i、v_j相连构成的边，σ为控制v_i、v_j相似程度的调节参数，d_i为深度空间下v_i内包含的所有像素点均值，d_j为深度空间下v_j内包含的所有像素点均值，μ_d为评估深度特征的深度置信值；

μ_d＝exp((1-m_d)*CV*H)-1

其中，m_d为深度图所在空间的深度均值，CV为差异指数，H表示深度信息分布的随机性，μ_d与深度信息呈正相关，μ_d取值越大，深度信息越佳。

22)根据图模型和目标深度紧密性，计算基于深度紧密性的显著值；根据图模型和目标位置先验，计算基于位置先验的显著值；根据图模型和颜色先验，计算基于颜色先验的显著值。

基于深度紧密性的显著值计算，具体如下：

假设原始深度图的显著前景目标位于l₁、l₂、l₃、l₄顶点附近，以这4个顶点作为查询节点进行流形排序，其优化公式表示如下：

其中，f^*为n维度向量，f_a、f_b分别为节点l_a、l_b的排序值，ω_ab为以l_a、l_b为查询节点的两超像素间距，

表示两对应超像素间的度，

表示两对应超像素间的度，y_a＝1表示查询节点l_a存在，y_a＝0表示查询节点l_a不存在，μ为调节系数。

为提高效率，采用非归一化的拉普拉斯矩阵来进行最优解的计算，如下：

f^*＝(D-αW)^-1y

其中，D＝diag{d₁₁,d₂₂,...,d_nn}为两对应超像素间度的矩阵，α为控制平衡系数，W为w_ij的矩阵，y为每个查询节点的存在的指向向量。

超像素区域越松散，其属于背景区域的概率越大，判断某一区域松散程度的公式定义为：

其中，N为超像素块个数，De(j)表示第j个超像素块的松散程度，f^*＝[f_ij]_n×k，n_i为第i个超像素块包含的像素个数，b_i为第i个超像素块的质心，f_ij为查询节点排序优化后的度向量f^*中第i行第j列的值；

空间均值μ_j定位为：

其中，

分别表示第j个超像素块在X轴和Y轴两个方向上的空间均值，

分别表示第i个超像素块质心在X轴和Y轴两个方向上的值。

若当前区域属于前景目标，则De(j)取值较小，定义Fr(j)＝1-De(j)表示当前区域为前景，取F_m＝median{Fr(1),Fr(2),...,Fr(j)}作为前景与背景种子的分界点，构成前景目标种子和背景目标种子集合FG、BG。通常来讲，指定区域的显著值越大，距离背景种子越远，与背景种子的相似性成反比关系。

第i个超像素块基于背景目标种子点的显著值，其计算公式定义如下：

第i个超像素块基于前景目标种子点的显著值，其计算公式定义如下：

其中，V_bm(i)为第i个超像素块基于背景目标种子点的显著值，V_fm(i)为第i个超像素块基于前景目标种子点的显著值，f_c表示第c个查询节点l_c的排序值，加权融合后，得到基于深度紧密性的显著值，

V_m(i)＝λV_bm(i)+(1-λ)V_fm(i)

其中，V_m(i)为第i个超像素块基于深度紧密性的显著值，λ为深度紧密性调节参数，一般取0.4。

基于位置先验的显著值计算，具体如下：

假设图像的前景目标多数位于l₁、l₂、l₃、l₄附近，以这4个节点为中心各自围成A₁、A₂、A₃、A₄个矩形区域，构建集合Z＝{A_e}，e∈[1,4]。以A₁为起始区域，由上述的

得

进而计算出基于区域A₁的初始显著值，记作

同理，计算剩余矩形区域的初始显著值

对其融合后初步得到显著图

其中，norm(·)表示归一化函数，使V_fus∈[0，1]。

依次计算初始显著图中位于矩形区域A₁、A₂、A₃、A₄的像素数p_e，e∈[1,4]，将像素数降序排序后获取最大像素数所在区域的查询节点l_r，即l_r为像素数最大的目标所在区域的中心，以查询节点l_r为初始点进行位置先验，显著性计算的数学公式定义为：

其中，V_P(i)为第i个超像素块基于位置先验的显著值，β为位置最优先验调节系数，b_i为第i个超像素块的聚类中心，r为中心l_r的位置。

基于颜色先验的显著值计算，具体如下：

通常来讲，在整幅图像中显著前景目标由背景所包围，且背景的整体颜色较前景更为弥散，也就是在某一特定区域表现出较大空间颜色差异的一般多为背景，其显著值定义如下：

其中，V_c(i)为第i个超像素块基于颜色先验的显著值，n_j为第j个超像素块包含的像素个数，b_j为第j个超像素块的质心，r为查询节点中心l_r的位置，f_ij为度向量f^*中第i行第j列的值。

步骤3，基于条件随机场将所有显著值对应的显著图进行融合。

把上述图像显著性检测看成从背景分离显著性区域的二值标记问题，在条件随机场(CRF)框架下，输入图像I(p)的图像标注A(p)的条件概率为：

其中，Z为配分函数，E(A|I)为能量函数，A(p)＝1，说明该像素p属于显著区域，A(p)＝0说明该像素属于背景区域。

为了更加精确的检测显著性区域，需要融合多种显著性特征，将能量函数定义为K个显著性特征函数和这些特征的成对特征函数的线性组合，可以表示为：

其中，λ_k是第k个显著性特征的权值，p,p′是邻近的像素对。

显著性特征函数F_k(p)决定像素p是否属于显著性区域，可以定义为：

F_k(p)＝||A(p)-S_k(p)||₁

其中，|| ||₁为L1范数，S_k(p)为第k个特征的归一化特征显著图。

成对特征函数作为颜色差异惩罚项，颜色越相似的邻近像素对，分配到不同的标注的可能性越小。

成对特征函数可以表示为：

其中，σ_r为权值参数，d(p,p′)为像素对之间颜色差异归一化的L2范数。

为了获得最优的线性特征巧合，CRF学习的目标是在最大化似然值的标准下获得融合的线性权重参数λ＝{λ₁,λ₂,…λ_k}。为了得到最优的特征线性组合，对N幅训练图像

运用最大似然估计进行训练，对其取log之后表达式是凸函数，具有最优解

式中，A,I分别表示为训练的图像样本和标注。

步骤4，提取优化后显著图的前景、背景多维特征，将多维特征输入预先训练的分类器，获得图像语义分割结果。

利用上述显著性算法提取自然图像的前景区域A_ft、背景区域A_bt；将原始图像在HSV颜色空间进行色调、色饱和度及亮度的非均匀量化，考虑到通常情况下一幅自然图像所含颜色在整个颜色空间所占比例微乎其微，大多数前景目标或背景区域的主色数不超过4，因此这里用颜色直方图信息在区域A_ft、A_bt选取4个主色，利用颜色信息结合显著信息进行正负训练样本的选取；在训练样本中提取12维像素级特征向量F_im＝{u_im,h_im,r_im}，其中，u_im表示RGB、Lab六维颜色信息；表示4维纹理特征，将原始图像与求导后的高斯核函数相卷积，得到{0°,45°,90°,135°}这四个方向的梯度值，作为该像素的纹理信息；r_im表示像素im的空间坐标信息(x_im,y_im)；将提取的12维像素级特征向量作为输入，投入SVM分类器进行训练，训练结束后根据SVM的输出结果对整幅自然图像逐像素分类，进而实现显著目标的精确语义分割。

支持向量机分类器：支持向量机是用来进行解决分类问题的常用分类器工具，通过组建最优分类面从而达到类别之间的分类间隔趋向最大化来进行实现，分类间隔最大化代表分类器拥有更好的泛化能力。针对有监督分类问题，假设训练集可表示为x_ie，T＝{(x_ie,y_ie)∣x_ie∈Rⁿ},y_ie∈{±1},ie＝1,...,l。其中x_ie是n维空间上的第ie个样本点，y_ie是对应正类与对应负类的标记，假设分类超平面表示为：

w·x+b＝0

其中，w为超平面的法向量，b为截距。

上式可转化为下式：

y_ie((w·x_ie)+b)≥1,ie＝1,2,...,n

Claims

1.一种基于显著性先验的图像语义分割方法，其特征在于：包括，

对待分割图像进行超像素分割，获得超像素块；

根据超像素块，分别计算基于深度紧密性的显著值、基于位置先验的显著值和基于颜色先验的显著值，具体包括：

根据超像素块，构建融合颜色信息和深度线索的图模型，

根据图模型和目标深度紧密性，计算基于深度紧密性的显著值，

基于深度紧密性的显著值计算公式为，

V_m(i)＝λV_bm(i)+(1-λ)V_fm(i)

其中，V_m(i)为第i个超像素块基于深度紧密性的显著值，λ为深度紧密性调节参数，V_bm(i)为第i个超像素块基于背景目标种子点的显著值，V_fm(i)为第i个超像素块基于前景目标种子点的显著值，

其中，D为两对应超像素间度的矩阵，α为控制平衡系数，w_ij为边e_ij的权重，e_ij为第i个超像素块和第j个超像素块相连构成的边，W为w_ij的矩阵，FG和BG分别为前景目标种子和背景目标种子集合，Fr(j)表示第j个超像素块区域为前景，f_c表示第c个查询节点的排序值，查询节点为原始深度图的显著前景目标位置，

根据图模型和目标位置先验，计算基于位置先验的显著值，

根据图模型和目标颜色先验，计算基于颜色先验的显著值；

基于条件随机场将所有显著值对应的显著图进行融合；

2.根据权利要求1所述的一种基于显著性先验的图像语义分割方法，其特征在于：将超像素块映射至深度图，构建融合颜色信息和深度线索的图模型；其中，图模型为G＝(V,E)，V为超像素块集合，E为两超像素块相连构成的边的集合，每条边配置有相应的权重，

3.根据权利要求1所述的一种基于显著性先验的图像语义分割方法，其特征在于：基于位置先验的显著值计算公式为，

4.根据权利要求1所述的一种基于显著性先验的图像语义分割方法，其特征在于：基于颜色先验的显著值计算公式为，

5.根据权利要求1所述的一种基于显著性先验的图像语义分割方法，其特征在于：提取融合后显著图的前景、背景多维特征，将多维特征输入预先训练的SVM分类器，获得图像语义分割结果。

6.一种基于显著性先验的图像语义分割系统，其特征在于：包括，

具体包括：

根据超像素块，构建融合颜色信息和深度线索的图模型，

基于深度紧密性的显著值计算公式为，

V_m(i)＝λV_bm(i)+(1-λ)V_fm(i)

根据图模型和目标位置先验，计算基于位置先验的显著值，

根据图模型和目标颜色先验，计算基于颜色先验的显著值；

7.一种存储一个或多个程序的计算机可读存储介质，其特征在于：所述一个或多个程序包括指令，所述指令当由计算设备执行时，使得所述计算设备执行根据权利要求1至5所述的方法中的任一方法。

8.一种计算设备，其特征在于：包括，

一个或多个处理器、一个或多个存储器以及一个或多个程序，其中一个或多个程序存储在所述一个或多个存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序包括用于执行根据权利要求1至5所述的方法中的任一方法的指令。