WO2020107716A1

WO2020107716A1 - 目标图像分割方法、装置及设备

Info

Publication number: WO2020107716A1
Application number: PCT/CN2019/075205
Authority: WO
Inventors: 陈沅涛; 王进; 王磊; 张建明; 陈曦; 王志; 桂彦; 谷科
Original assignee: 长沙理工大学
Priority date: 2018-11-30
Filing date: 2019-02-15
Publication date: 2020-06-04
Also published as: CN109544568A

Abstract

本发明实施例公开了一种目标图像分割方法、装置及设备。其中，方法包括在待处理图像中根据初始目标区域设定条件定位目标所在位置的初始区域，利用初始目标区域的颜色直方图和视觉显著性直方图作为目标特征；利用预先构建的SVM模型从待处理图像中选取多个支持向量的目标像素点，各目标像素点的样本特征为由各自的颜色直方图和视觉显著性直方图构成；基于计算得到的各目标像素点与初始目标区域的特征距离，在待处理图像中确定显著性区域；根据目标特征和各样本特征，计算显著性区域中各像素点的权值，删除显著性区域中权值不满足预设条件的像素点后得到最终区域作为目标区域，用于进行图像提取分割。本申请提升了目标图像分割的稳定性和准确度。

Description

目标图像分割方法、装置及设备

技术领域

本发明实施例涉及图像处理技术领域，特别是涉及一种目标图像分割方法、装置及设备。

背景技术

随着视觉技术的快速发展，应用图像视觉显著性进行图像分割，越来越广泛的应用于目标识别和跟踪技术领域。目标跟踪与检测所面临的重要问题是机器视觉条件需要面对的不可预见性，从而导致预期目标的后续状态出现偏差，光照强度变化、目标形状和大小变化、变化复杂的背景以及不可预见的物体遮挡等各种因素都会影响目标图像分割方法的系统鲁棒性。

目前，相关技术通常采用颜色和边缘轮廓表示目标的特征，尽管颜色特征对于光线强度变化十分有效，但是图像颜色特征针对噪声信号和物体遮挡部分效果不佳，且当在目标主体的前景颜色与背景颜色状况非常近似，无法有效地区分目标与背景，从而导致图像分割效果不稳定。

发明内容

本公开实施例提供了一种目标图像分割方法、装置及设备，解决了相关技术中使用单独颜色特征所导致的图像分割效果不稳定问题，还有效地解决了光照强度变化、目标形变以及颜色分布类似而引起的目标图像分割不稳定问题，提升了目标图像分割的稳定性和准确度，还提高了图像分割的效率。

为解决上述技术问题，本发明实施例提供以下技术方案：

本发明实施例一方面提供了一种目标图像分割方法，包括：

根据预先设置的初始目标区域设定条件在待处理图像中定位初始目标区域，计算所述初始目标区域的颜色直方图和视觉显著性直方图，构成初始目标特征模型；

利用预先构建的SVM模型从所述待处理图像中选取多个支持向量的目标像素点，计算各目标像素点的颜色直方图和视觉显著性直方图，构成样本特征模型；

基于计算得到的各目标像素点与所述初始目标区域的特征距离，在所述待处理图像中确定显著性区域；

根据所述初始目标特征模型和各样本特征模型，计算所述显著性区域中各像素点的权值，删除所述显著性区域中权值不满足预设条件的像素点后得到最终区域，以作为目标区域进行提取分割。

可选的，所述利用预先构建的SVM模型从所述待处理图像中选取多个支持向量的目标像素点包括：

预先对所述待处理图像的各像素点进行样本标签标记；

采集所述待处理图像的多个像素点构成原始样本集，所述原始样本集中包含具有非支持向量和支持向量的像素点，且各像素点的权值相同；

在SVM训练所述原始样本集过程中，统计各像素点为非支持向量的次数；

删除非支持向量次数超过预设阈值的像素点，得到精简样本集；

从所述精简样本集中选取多个支持向量的目标像素点。

可选的，所述基于计算得到的各目标像素点与所述初始目标区域的特征距离，在所述待处理图像中确定显著性区域包括：

计算各目标像素点与所述初始目标区域的特征距离；

将多个目标像素点分为第一像素点集合和第二像素点集合，所述第一像素点集合中各目标像素点对应的特征距离均小于所述第二像素点集合中各目标像素点对应的特征距离；

利用所述第一像素点集合中的各目标像素点代替所述第二像素点集合中的目标像素点，得到显著性区域。

可选的，所述计算各目标像素点与所述初始目标区域的特征距离为：

利用下述公式计算各目标像素点与所述初始目标区域的特征距离d ^F(x _1i,x ₂)：

式中，x _1i为第i个目标像素点，x ₂为所述初始目标区域，K(x _1i,x _1i)为x _1i目标像素点与x _1i目标像素点之间的欧式距离，K(x _1i,x ₂)为x _1i目标像素点与所述初始目标区域中心之间的欧式距离，K(x ₂,x ₂)为所述初始目标区域中心与所述初始目标区域中心之间的欧式距离。

可选的，所述根据所述初始目标特征模型和各样本特征模型，计算所述显著性区域中各像素点的权值包括：

利用下述公式计算所述显著性区域中各像素点的权值

式中，

为第i个像素点的颜色与所述初始目标区域的颜色的相似度，

为第i个像素点的视觉显著性与与所述初始目标区域的视觉显著性的相似度，

是全部

的算术平均值，

是全部

的算术平均值；

为t时刻的先验概率密度，λ为调整参数。

可选的，所述计算所述初始目标区域的颜色直方图包括：

将所述待处理图像切换到HSV颜色空间，将H通道、S通道作为颜色特征，V通道作为明度特征；

利用下述公式计算所述初始目标区域的颜色直方图特征：

式中，x _i为所述初始目标区域中第i个像素点，

为以x像素点为中心区域的颜色分布模型，C为标准化因子，k为核函数，u为弱极限，a为所述初始目标区域的大小，N为所述初始目标区域中像素点的总数，b(x _i)为将第i个像素点的颜色特征分配到颜色直方图上相应部分，δ(·)为狄拉克函数。

可选的，所述计算所述初始目标区域的视觉显著性直方图包括：

将所述待处理图像的HSV颜色空间特征从空域转换至频域，得到所述待处理图像的图像幅度谱和图像相位谱；

对每种颜色空间特征，利用下述公式得到所述初始目标区域的各像素点的视觉显著性值V(i,j)：

式中，所述待处理图像的大小为M*N，x、y为像素点的横纵坐标值，φ(u,v)为所述待处理图像经过快速傅里叶变换以后所得相位谱；

利用下述公式将HSV颜色特征的各视觉显著图进行融合，得到最终视觉显著直方图V：

V＝w _H×V _H+w _S×V _S+w _V×V _V；

式中，V _H、V _S、V _V分别为HSV颜色空间特征进行视觉显著性计算获得的相对应视觉显著图，w _H、w _S、w _V分别为各颜色空间特征对应的特征权值。

可选的，在所述利用预先构建的SVM模型从所述待处理图像中选取多个支持向量的目标像素点之前，还包括：

利用下述公式对所述待处理图像进行去噪处理：

X _t＝AX _t-1+v _t-1；

式中，v _t-1为过程噪声信号，A为状态转移函数，t为时间，X _t为像素点。

本发明实施例另一方面提供了一种目标图像分割装置，包括：

初始目标区域定位模块，用于根据预先设置的初始目标区域设定条件在待处理图像中定位初始目标区域，计算所述初始目标区域的颜色直方图和视觉显著性直方图，构成初始目标特征模型；

样本点选取模块，用于利用预先构建的SVM模型从所述待处理图像中选取多个支持向量的目标像素点，计算各目标像素点的颜色直方图和视觉显著性直方图，构成样本特征模型；

显著性区域确定模块，用于基于计算得到的各目标像素点与所述初始目标区域的特征距离，在所述待处理图像中确定显著性区域；

目标区域确定模块，用于根据所述初始目标特征模型和各样本特征模型，计算所述显著性区域中各像素点的权值，删除所述显著性区域中权值不满足预设条件的像素点后得到最终区域，以作为目标区域进行提取分割。

本发明实施例还提供了一种目标图像分割设备，包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述目标图像分割方法的步骤。

本发明实施例最后还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有目标图像分割程序，所述目标图像分割程序被处理器执行时实现如前任一项所述目标图像分割方法的步骤。

本申请提供的技术方案的优点在于，将视觉显著性特征与颜色特征共同作为描述目标的特征，由于视觉显著性具有高鲁棒性、高稳健性和高抗干扰能力，不仅解决了使用单独颜色特征所导致的图像分割效果不稳定的问题，还有效解决了由于目标形变、光照变化以及目标和背景颜色分布相似而产生的检测困难的问题，从而有效的提升了目标图像分割的稳定性和准确度；此外，利用SVM模型从待处理图像中选择支持向量，并从支持向量中选择与分割目标区域相似度较高的有效像素点来确定最终目标区域，不仅提升了目标图像分割的效率，还进一步的提升了目标图像分割准确度。

此外，本发明实施例还针对目标图像分割方法提供了相应的实现装置及设备，进一步使得所述方法更具有实用性，所述装置、及设备具有相应的优点。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。

附图说明

为了更清楚的说明本发明实施例或相关技术的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种目标图像分割方法的流程示意图；

图2为本发明实施例提供的一种视角显著性计算方法的流程示意图；

图3为本发明实施例提供的另一种目标图像分割方法的流程示意图；

图4为本发明实施例提供的目标图像分割装置的一种具体实施方式结构图；

图5为本发明实施例提供的目标图像分割装置的另一种具体实施方式结构图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面结合附图和具体实施方式对本发明作进一步的详细说明。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象，而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可包括没有列出的步骤或单元。

在介绍了本发明实施例的技术方案后，下面详细的说明本申请的各种非限制性实施方式。

首先参见图1，图1为本发明实施例提供的一种目标图像分割方法的流程示意图，本发明实施例可包括以下内容：

S101：根据预先设置的初始目标区域设定条件在待处理图像中定位初始目标区域，计算初始目标区域的颜色直方图和视觉显著性直方图，构成初始目标特征模型。

初始目标区域设定条件为预先根据待处理图像中欲切割目标在图像中的位置和自身的参数信息，设定的一个可在待处理图像中定位大概区域的条件。举例来说，初始目标区域设定条件可为X ₀＝(x ₀，y ₀，h _x，h _y)，(x ₀，y ₀)为目标中心的坐标位置，(h _x，h _y)为目标区域的宽度高度，根据该条件可首先在待处理图像中定位目标中心，然后再根据高度和宽度定位确定区域范围，从而实现从待处理图像中检测到初始目标区域。

在得到初始目标区域后，提取初始目标区域的颜色特征和视觉显著性特征，利用颜色特征和视觉显著性特征共同描述初始目标区域，即初始目标特征模型包括初始目标区域的颜色特征和视觉显著性特征。

S102：利用预先构建的SVM模型从待处理图像中选取多个支持向量的目标像素点，计算各目标像素点的颜色直方图和视觉显著性直方图，构成样本特征模型。

SVM模型为预先基于自适应增量学习和减量学习算法训练所得的分类器，自适应增量学习和减量学习算法的实现过程可如下描述：

由于增量学习算法和减量学习算法缺乏针对训练集数据进行有选择淘汰，这样在很大程度上会对处理时间和处理精度产生影响。如果在增量执行过程中直接丢弃像素点样本中的非支持向量，但伴随后续增量训练过程的不断进行，之前被丢弃的非支持向量是有可能成为支持向量。而且，在单次训练中就直接丢弃像素点样本的非支持向量，很有可能丢弃部分重要处理有效信息，从而导致分类过程的精度下降。为了解决上述相关问题，通过引入阈值达到自适应处理的增量和减量学习算法，阈值为训练集中可以容忍像素点样本为非支持向量的次数最大值。

为了实现自适应算法，可预先对待处理图像的每个像素点进行样本标签标记，例如针对每个像素点样本(x _i，y _i)，称l(x _i)为像素点样本(x _i，y _i)的样本标记，赋值条件可为：

样本标签标记可用于确定某个像素点样本能否被丢弃的主要依据，在支持向量机的增量学习中，可以使用r(x _i)来存储的发生次数，即当l(x _i)＝1时，r(x _i)在原有数据基础上进行加1运算。

随着训练过程的不断深入执行，部分样本会产生“样本振荡”问题。为了解决此问题，可引入阈值来代表训练集上对于样本点数据是非支持向量次数最大值。阈值的取值需要考虑训练时间与训练精度平衡因素，本申请对此不做任何限定。

举例来说，对于(x _i，y _i)样本，当其r(x _i)达到预设阈值l(例如3次)后，即r(x _i)≥l，便可将该像素点样本(x _i，y _i)从整个训练集中丢弃，这种方法可以降低“振荡”现象的样本对分类器产生的相关影响。

在确定阈值l后，以(x _i，y _i)像素点样本为例，在SVM训练过程中，记录像素点样本为非支持向量的具体次数r(x _i)，当次数r(x _i)达到预定的阈值l之后，就将像素点样本(x _i，y _i)从训练集中执行丢弃操作。下面阐述自适应的增量和减量学习算法的具体算法说明：

初始化过程：设定阈值l的具体数值，获取样本图像中的像素点作为样本点，直到支持向量和非支持向量两类像素点样本都出现为止，设当前取得的像素点样本集为T。以T作为训练集执行训练过程，从而得到样本标记l(x _i)，令r(x _i)＝l(x _i)，i＝1,...,|T|。

设当前像素点样本集是T，且|T|＝m。新获取的像素点样本表达为(x _m+1,y _m+1)，令r(x _m+1)＝0，把T＝TU{(x _m+1,y _m+1)}作为训练集执行重新训练过程。

假设舍弃样本集为T _d，初始化舍弃样本集为T _d←φ；

依次遍历当前像素点样本集中的每个像素点样本：

若l(x _j)＝1，也即xj是非支持向量，那么r(x _j)←r(x _j)+1；

若l(x _j)≠1，r(x _j)保持不变。

判断r(x _j)≥l是否成立，若成立，则T _d←T _dU{x _j,y _j}；若不成立，则继续保留该像素点样本。

若T _d←φ，那么以T＝T-T _d成为训练集执行减量学习过程。

当存在新样本时，则根据上述过程继续执行增量学习和减量学习过程。

在SVM执行训练学习过程中，通过阈值的引入可以实现自适应策略，从而提高SVM训练精度和降低训练时间。

利用SVM模型从待处理图像中选取多个支持向量的目标像素点过程可包括：

采集待处理图像的多个像素点构成原始样本集，原始样本集中包含具有非支持向量和支持向量的像素点，且各像素点的权值相同。原始样本集中包含待处理图像中的所有显著特征的像素点，每个像素点的重要性权值相同，例如可赋值为1/N，N为原始样本集的样本总数。

在SVM训练原始样本集过程中，统计各像素点为非支持向量的次数，将非支持向量次数超过预设阈值的像素点删除，得到精简样本集；从精简样本集中选取多个支持向量的目标像素点。

提取每个目标像素点的特征时，同样提取的是该目标像素点的颜色特征和视觉显著性特征，利用颜色特征和视觉显著性特征共同描述每个目标样本像素点。

各目标像素点的样本特征模型生成方法可与初始目标区域的初始目标特征模型生成方法相同，当然，也可采用不同的方法。

S103：基于计算得到的各目标像素点与初始目标区域的特征距离，在待处理图像中确定显著性区域。

S102步骤中提取得到的目标像素点，为整个待处理图像中具有明显显著性特征的像素点，也即是与待分割目标相似性最高的像素点。

各目标像素点与初始目标区域的特征距离用于作为每个目标像素点与目标相似度的度量标准，初始目标区域为包含待分割目标的区域，像素点与初始目标区域距离越小，则二者相似度越高，也就是说目标像素点为待切割目标的可能性就越大。

基于各目标像素点和初始目标区域的特征距离，提取待处理图像的有效显著区域，有效显著区域为包含待分割目标的区域。

S104：根据初始目标特征模型和各样本特征模型，计算显著性区域中各像素点的权值，删除显著性区域中权值不满足预设条件的像素点后得到最终区域，以作为目标区域进行提取分割。

初始目标区域和各目标像素点的特征均是利用像素点颜色和像素点视觉显著性特征进行描述的，可利用初始目标区域和各目标像素点的颜色具体特征值和视觉显著性具体特征值之间的差别来描述二者之间的相似度，利用该相似度来计算各像素点的权值，权值用于表示该像素点与待切割目标的相似性权重度量，权值越大，二者相似度越高。

为了准确、精准定位目标所在区域，可将权重值较小的像素点丢弃，预设条件即为用于选择权重值较大的像素点，也就是将权重值不满足预设条件的像素点删除，例如将权重值低于80的像素点舍弃。

将显著性区域中低权值的像素点删除后，更新显著性区域中的像素点后，所得的显著性区域为与待切割目标相似度最高的区域，将该区域作为最终区域进行提取，从而实现图像分割。

在本发明实施例提供的技术方案中，将视觉显著性特征与颜色特征共同作为描述目标的特征，由于视觉显著性具有高鲁棒性、高稳健性和高抗干扰能力，不仅解决了使用单独颜色特征所导致的图像分割效果不稳定的问题，还有效解决了由于目标形变、光照变化以及目标和背景颜色分布相似而产生的检测困难的问题，从而有效的提升了目标图像分割的稳定性和准确度；此外，利用SVM模型从待处理图像中选择支持向量，并从支持向量中选择与分割目标区域相似度较高的有效像素点来确定最终目标区域，不仅提升了目标图像分割的效率，还进一步的提升了目标图像分割准确度。

在一种具体的实施方式中，S101步骤和S102中计算颜色直方图和视觉显著性直方图的方法可根据下述方法进行实施：

自适应的支持向量机中可利用多种相关特征对待检测目标进行形式表达。对于颜色特征的提取，由于颜色对于噪声信号和遮挡部分不够敏感且计算过程相对简单，因此颜色特征的应用非常广泛。HSV颜色空间和人类自身视觉系统特点类似，可利用公式1将处理图像由RGB三原色空间切换到HSV颜色空间：

式中，h为HSV颜色空间中H通道值，L为H通道值的算术平均值，s为HSV颜色空间中S通道值，v为HSV颜色空间中V通道值，g为RGB三原色R通道值，b为为RGB三原色B通道值，r为RGB三原色R通道值，max为各自对应通道值的最大值，min为各自对应通道值的最小值。

应用颜色直方图作为目标区域颜色模型，假定将颜色空间分成m个子区域，通过计算颜色向量在各子区域中出现的频率来获取包含m条颜色直方柱的颜色直方图。考虑像素点在目标区域位置上针对颜色分布情况的影响情况，可考虑增加核函数k(r)针对空间信息执行融合过程，具体操作方法见公式2：

式中，a'为所得曲线高度，b'为曲线在x轴的中心，c'为宽度(与半峰全宽有关)，r为核函数K的类别数。

应用

来表示以x像素点为中心区域的颜色分布模型，则有：

式中，x _i为初始目标区域中第i个像素点，

为以x像素点为中心区域的颜色分布模型，C为标准化因子，k为核函数，u为弱极限，

a为初始目标区域的大小，N为初始目标区域中像素点的总数，b(x _i)为将第i个像素点的颜色特征分配到颜色直方图上相应部分，δ(·)为狄拉克函数。

颜色对于光照变化情况非常敏感，当检测目标的颜色区间和背景颜色区间接近时，单纯使用颜色特征来作为目标特征表达模型，检测效果往往不容易达到理想状态。鉴于此，可使用视觉显著性与颜色特征融合来作为待检测目标的表示模型。

视觉显著性度量可由待处理图像上的HSV颜色特征作用产生，与单纯颜色特征相比，视觉显著性具有高鲁棒性、高稳健性和高抗干扰能力，视觉显著性计算方法具体过程见图2所示。

应用公式1将待处理图像由RGB空间切换成HSV空间，将H通道、S通道作为颜色特征，V通道作为明度特征，特殊性特征的表达式如公式4所示：

M(i,j)＝S(i,j,t)-S(i,j,t-1)；(4)

式中，S(i,j,t)表示像素点(i,j)在t时刻的取值、S(i,j,t-1)表示像素点(i,j)在t-1时刻的取值。

视觉显著性特征为由于图像区域与背景环境发生视觉变化而产生的特征，变化越明显则视觉显著性值越大。首先把图像特征从空域变为频域，从而可得图像幅度谱|F(u,v)|和图像相位谱φ(u,v)两种特征，表达为公式5：

式中，f(i,j)是像素点(i,j)的具体特征值，M×N是待处理图像的规模。

图像相位谱与图像幅度谱包含了图像的具体信息。图像幅度谱特征表示图像中每个频率点中信息变化量，图像相位谱特征表示信息变化位置具体信息。针对图像上每个像素点的视觉显著性执行计算，同时寻找视觉显著性明显的位置。利用图像相位谱特征进行图像恢复，输出视觉显著性值较大的像素点位置就针对原始图像中特征值变化较大位置，而这些位置即为视觉显著区域。因此，仅利用相位谱特征针对原始图像进行构造，进行傅里叶反变换IDFT后得到恢复图像就能够反映图像上各个部分的视觉显著图，即公式6所示：

式中，待处理图像的大小为M*N，x、y为像素点的横纵坐标值，φ(u,v)为待处理图像经过快速傅里叶变换以后所得相位谱。

在获得HSV颜色空间特征显著图之后，可利用下述公式7将HSV颜色特征的各视觉显著图进行融合，得到最终视觉显著直方图V：

V＝w _H×V _H+w _S×V _S+w _V×V _V；(7)

式中，V _H、V _S、V _V分别为HSV颜色空间特征进行视觉显著性计算获得的相对应视觉显著图，w _H、w _S、w _V分别为各颜色空间特征对应的特征权值。可选的，特征权值可各取其算术平均值来表示平均化特征融合。

综合视觉显著图是和待处理图像规模完全相同的灰度图像，每个像素点取值表示待处理图像中相应位置像素点的视觉显著性值大小。

考虑到待处理图像存在噪声信号，噪声的存在影响后续图像检测的精度和准确度，在从待处理图像中采样之前，本申请还可应用自回归模型(公式8)对待处理图像进行去噪处理：

X _t＝AX _t-1+v _t-1；(8)

为了进一步提升显著性区域中像素点和目标之间的相似度，提升显著性区域检测的准确度，S103的一种实现方式可根据下述方法进行实施：

计算各目标像素点与初始目标区域的特征距离。

将多个目标像素点分为第一像素点集合和第二像素点集合，第一像素点集合中各目标像素点对应的特征距离均小于第二像素点集合中各目标像素点对应的特征距离；

利用第一像素点集合中的各目标像素点代替第二像素点集合中的目标像素点，得到显著性区域。也即选择距离最小的视觉显著区域替换距离较大的部分支持向量，然后执行支持向量更新操作。

其中，对每个目标像素点，可利用公式9计算目标像素点与初始目标区域的特征距离d ^F(x _1i,x ₂)：

当然，还可采用其他方法进行计算目标像素点和初始目标区域之间的相关距离，作为二者之间相似度的度量标准，本申请对此不做任何限定。

在另外一些实施方式中，在S104中，可利用公式(10)计算显著性区域中各像素点的权值

式中，

为第i个像素点的颜色与初始目标区域的颜色的相似度，

为第i个像素点的视觉显著性与初始目标区域的视觉显著性的相似度，

是全部

的算术平均值，

是全部

的算术平均值；

为t时刻的先验概率密度，λ为调整参数。λ用于针对

表示相似度进行区分，其取值范围为(0,1)。

在计算

时，可参见粒子滤波方法，其实现原理可参阅下述过程：

粒子滤波算法的核心思想为依据t时刻系统状态结果Z _t＝{z ₀，z ₁，…，z _t}，应用概率方法理论执行迭代估计得到t时刻的系统状态x _t，等同于寻找后验概率分布函数P(x _t|z _t)。

假定系统状态空间模型具体表示为公式11：

在公式11中，x _t代表t时刻系统向量，x _t由待检测目标的具体位置、大小和加速度等特征组成。z _t代表t时刻系统状态观查结果。f(x)和h(x)是系统状态转移函数和系统状态观测函数，v _t-1和n _t是系统状态噪声信号和观测状态噪声信号。

滤波过程可分成预测步骤和更新步骤。预测步骤指在没有得到t时刻系统状态观测结果z _t情况下，可应用t-1时刻后验概率密度P(x _t-1|z _t-1)进行推演，从而求得t时刻先验概率密度的过程，具体情况如公式12所示。

P(x _t|z _t-1)＝∫P(x _i|x _t-1)P(x _t-1|z _t-1)dx _t-1；(12)

更新步骤作用是修正，即应用t时刻系统状态最新观测值z _t和之前求得t时刻先验概率密度P(x _t|z _t-1)，从而得到t时刻后验概率密度P(x _t|z _t)，具体如公式13所示。

假设

(N代表粒子数量)是在后验概率密度P(x _0:t|z _1:t)取样得到的样本集及样本权重，

x _0:t＝{x _j,j＝0,1,...,t}是样本集合，根据统计模拟方法原理，t时刻后验概率密度可使用离散加权公式来执行函数逼近过程，具体见公式14。

在公式14中，δ(g)为狄拉克函数(单位脉冲函数)。t时刻系统状态x _t的滤波估计值如公式15所示：

此外，本申请还提供了另外一个实施例，请参阅图3，具体可包括：

S301：根据预先设置的初始目标区域设定条件在待处理图像中定位初始目标区域，计算初始目标区域的颜色直方图和视觉显著性直方图，构成初始目标特征模型。

S302：利用自回归模型对待处理图像进行去噪处理。

S303：采集待处理图像的多个像素点构成原始样本集，待处理图像的各像素点预先被事先进了样本标签标记。

S304：基于自适应增量和减量学习算法，在SVM训练原始样本集过程中，统计各像素点为非支持向量的次数。

S305：删除非支持向量次数超过预设阈值的像素点，得到精简样本集，从精简样本集中选取多个支持向量的目标像素点，计算各目标像素点的颜色直方图和视觉显著性直方图，构成样本特征模型。

S306：计算各目标像素点与初始目标区域的特征距离，将多个目标像素点分为第一像素点集合和第二像素点集合。

S307：利用第一像素点集合中的各目标像素点代替第二像素点集合中的目标像素点，得到显著性区域。

S308：根据初始目标特征模型和各样本特征模型，计算显著性区域中各像素点的权值。

S309：从显著性区域中删除权值不满足预设条件的像素点后得到最终区域，以作为目标区域进行提取分割。

各个步骤的实现过程可参阅上述实施例相应步骤或相应方法的实现过程，此处，不再赘述。

由上可知，本发明实施例能够避免应用单个颜色特征所引发的目标图像分割的不稳定问题。在出现较大目标姿态变化、光照变化、形状变化以及出现遮挡的情况下都能够正确检测目标。本发明在目标如果长时间被遮挡和发生剧烈光照变化情况仍然有可能造成本算法的检测出现失败情况下，通过应用颜色特征与视觉显著性特征，采用合理表达模型实现了鲁棒性更高的目标图像分割方法。

为了证实本申请提供的技术方案能够克服利用单一颜色特征引发的目标分割不稳定问题，并且能够有效解决由于目标形变、光照变化以及目标和背景颜色分布相似而产生的目标分割问题。本申请在视频图像序列中进行相关实验，对斯坦福大学标准视频库上的目标分割有效性和实时性都取得优良效果。

AVLSVM实验部分

为了评估自适应增量和减量学习算法(缩写为AVLSVM)具体性能，从训练正确率、测试正确率、CPU执行时间三个要素来对比AVLSVM和相关技术在线增量学习算法。下面直接使用On-line表达相关技术提出的在线增量学习算法，用AVLSVM表示自适应的增量和减量学习算法，从线性情况、非线性情况分别执行相关数值实验。

在数值实验中，首先选取UCI机器学习数据库 ^[13]中有关数据集进行相关数值实验，通过将样本逐个加入训练集来模拟在线情况。取λ＝1.9/C，C为惩罚参数，ε要求达到10 ^-5。惩罚参数C则是通过从训练集中挑选的调整集经过训练过程选择的最优值。数值实验上阈值l的选定是通过在各种UCI机器学习数据集上经过不断调整和测试选定的。根据数值实验相关结果，最后发现l＝4阈值是确保训练成功率、测试成功率、CPU执行时间的最优解。

线性情况的实验结果如表1所示。从表1可见：AVLSVM在分类成功率上优于On-line，在CPU执行时间方面明显优于On-line，比如针对维数较高的Pima-diabetes数据集，AVLSVM的执行时间是1.85秒，而On-line的执行时间则是15.4012秒。

表1线性情况数值实验结果

表2非线性情况数值实验结果

针对非线性情况，采用径向基核函数K(x,y)＝exp(-p||x-y|| ²)，非线性情况数值实验结果如表2所示，p是核函数参数。根据表2显示的数值的实验结果可得出：AVLSVM的CPU执行时间比On-line明显要小；AVLSVM的训练正确率、测试正确率都比On-line方法明显要高。

视觉显著结果图实验

该部分实验针对Itti公布的视频数据集进行视频序列图像视觉显著性计算，此数据集包括白天和晚上视频、室内和室外视频、运动视频、新闻视频等各种情况视频。为了方便进行效果对比，可在原始输入图像上首先进行形状标注，这样在视觉显著图上可以很方便分辨模型结果的优劣。

根据视觉显著图结果可知，融入AVLSVM方法所得视觉显著图能够更好地反映原始图像的特点。同时，效果良好的视觉显著图在后续的目标图像分割过程中能够起到非常好的辅助作用。

目标图像分割算法测试实验

为了验证本申请的目标图像分割的正确率，选择在斯坦福大学的Stan Birchfield所发布的人脸跟踪测试视频上进行目标图像分割实验。实验测试软件环境是利用Matlab仿真环境实现目标图像分割，重点针对算法鲁棒性进行测试，包括光照强度变化、目标形状变化、目标遮挡情况下的检测结果，并与单独特征的目标图像分割算法执行效果比较。

第一组实验是针对遮挡情况的视频图像序列(128×96)进行人脸目标图像分割(视频文件名为movie_cubicle，共95帧视频图像)。实验对比的三种算法分别是考虑颜色特征的目标图像分割算法、应用视觉显著性特征的目标图像分割算法、应用AVLSVM和视觉显著性整体特征的目标图像分割算法。首先在遮挡情况下利用三种算法目标图像分割结果图。视频图像序列分别是第1、16、21、34、51、62、70、88帧图像。视频图像序列中的目标在运动过程中会出现遮挡情况，遮挡物体的颜色与待检测目标颜色相近。在考虑颜色特征的目标图像分割方法中，因为背景颜色分布与目标颜色近似，所以目标图像分割效果不佳；本申请考虑AVLSVM与视觉显著性整体特征进行融合。即使存在遮挡情况，本算法也能准确定位目标，体现算法鲁棒性。

第二组实验针对在目标执行旋转、形状变化等情况下，对视频图像序列执行头部目标图像分割(视频文件为movie_mb，500帧)，该测试视频图像共有500帧视频图像序列，本视频拍摄过程中目标对象和摄像机均有大幅度移动，目标形状、大小与人体姿态都有明显变化，视频图像序列分别为第1、55、78、95、115、160、195、285帧图像。从实验结果可见，当目标因为前后运动产生目标大小形变时，此时目标的颜色特征并没有显著变化，三种算法均能够检测正确；当目标发生旋转时，目标颜色分布特征会发生明显改变，使用单独颜色特征当作表达模型进行目标图像分割过程时，时常会失败并导致目标丢失。本方法应用AVLSVM与视觉显著性整体特征进行融合，比应用单个特征方法的系统鲁棒性要高。经过相关测试，本方法在目标发生旋转、形状变化、颜色改变时，都能够获得理想头部目标图像分割效果。

第三组实验针对在包含光照强度变化、目标姿态变化、目标遮挡下的视频序列中进行人脸目标图像分割(视频文件为movie_sb，500帧)，视频图像序列分别为第1、24、55、78、175、181、238、342帧图像。本视频图像序列中包括光照强度变化、目标遮挡、目标姿态变化综合情况。在只考虑单个特征的检测算法中，当光照变化情况较大、目标姿态变化情况较大情况下，目标图像分割结果会出现相关误差；而本申请因为融入视觉显著性特征与颜色特征，使得能够进行目标准确定位，并保证目标图像分割算法的正确性和高效性。

本申请在传统目标图像分割算法基础上，融入了视觉显著性特征和颜色特征模型共同作为目标图像分割的特征表示模型，以确保目标图像分割算法的有效性，而且本申请没有明显增加算法空间和时间复杂度，并确保了算法的实时性效果。在上述三组目标图像分割实验中，在支持向量数达到500时，本申请的平均耗时为24ms/帧视频图像；传统基于颜色特征的目标图像分割算法的平均耗时为19ms/帧视频图像。因为本申请需要计算相关视觉显著性，所以本申请的耗时会有所增加，为了提高目标图像分割算法效果精度，时间消耗是无法避免的情况，当支持向量数减少到200个时，本申请的平均耗时为15ms/帧视频图像，而且可以确保较高的目标图像分割精度。因此本申请在提高目标图像分割精度时又确保了目标图像分割实时性。

本申请在目标图像分割过程中将视觉显著性整体特征和AVLSVM相结合，将视觉显著性特征和颜色特征共同作为目标整体特征进行表示。根据视频图像序列中进行相关实验的结果可知，本申请在目标图像分割的有效性和实时性都取得优良效果。

本发明实施例还针对目标图像分割方法提供了相应的实现装置，进一步使得所述方法更具有实用性。下面对本发明实施例提供的目标图像分割装置进行介绍，下文描述的目标图像分割装置与上文描述的目标图像分割方法可相互对应参照。

参见图4，图4为本发明实施例提供的目标图像分割装置在一种具体实施方式下的结构图，该装置可包括：

初始目标区域定位模块401，用于根据预先设置的初始目标区域设定条件在待处理图像中定位初始目标区域，计算初始目标区域的颜色直方图和视觉显著性直方图，构成初始目标特征模型。

样本点选取模块402，用于利用预先构建的SVM模型从待处理图像中选取多个支持向量的目标像素点，计算各目标像素点的颜色直方图和视觉显著性直方图，构成样本特征模型。

显著性区域确定模块403，用于基于计算得到的各目标像素点与初始目标区域的特征距离，在待处理图像中确定显著性区域。

目标区域确定模块404，用于根据初始目标特征模型和各样本特征模型，计算显著性区域中各像素点的权值，删除显著性区域中权值不满足预设条件的像素点后得到最终区域，以作为目标区域进行提取分割。

可选的，在本实施例的一些实施方式中，所述样本点选取模块402可为预先对待处理图像的各像素点进行样本标签标记；采集待处理图像的多个像素点构成原始样本集，原始样本集中包含具有非支持向量和支持向量的像素点，且各像素点的权值相同；在SVM训练原始样本集过程中，统计各像素点为非支持向量的次数；删除非支持向量次数超过预设阈值的像素点，得到精简样本集；从精简样本集中选取多个支持向量的目标像素点的模块。

此外，在本发明实施例中，所述样本点选取模块402还可为利用下述公式计算各目标像素点与初始目标区域的特征距离d ^F(x _1i,x ₂)的模块：

式中，x _1i为第i个目标像素点，x ₂为初始目标区域，K(x _1i,x _1i)为x _1i目标像素点与x _1i目标像素点之间的欧式距离，K(x _1i,x ₂)为x _1i目标像素点与初始目标区域中心之间的欧式距离，K(x ₂,x ₂)为初始目标区域中心与初始目标区域中心之间的欧式距离。

在另外一些实施方式中所述显著性区域确定模块403还可为计算各目标像素点与初始目标区域的特征距离；将多个目标像素点分为第一像素点集合和第二像素点集合，第一像素点集合中各目标像素点对应的特征距离均小于第二像素点集合中各目标像素点对应的特征距离；利用第一像素点集合中的各目标像素点代替第二像素点集合中的目标像素点，得到显著性区域的模块。

可选的，所述目标区域确定模块404还可为利用下述公式计算显著性区域中各像素点的权值

的模块：

式中，

为第i个像素点的颜色与初始目标区域的颜色的相似度，

为第i个像素点的视觉显著性与与初始目标区域的视觉显著性的相似度，

是全部

的算术平均值，

是全部

的算术平均值；

为t时刻的先验概率密度，λ为调整参数。

在一些具体的实施方式中，所述初始目标区域定位模块401可为将待处理图像切换到HSV颜色空间，将H通道、S通道作为颜色特征，V通道作为明度特征；利用下述公式计算初始目标区域的颜色直方图特征的模块：

式中，x _i为初始目标区域中第i个像素点，

为以x像素点为中心区域的颜色分布模型，C为标准化因子，k为核函数，u为弱极限，a为初始目标区域的大小，N为初始目标区域中像素点的总数，b(x _i)为将第i个像素点的颜色特征分配到颜色直方图上相应部分，δ(·)为狄拉克函数。

所述初始目标区域定位模块401还可为将待处理图像的HSV颜色空间特征从空域转换至频域，得到待处理图像的图像幅度谱和图像相位谱；对每种颜色空间特征，利用下述公式得到初始目标区域的各像素点的视觉显著性值V(i,j)：

式中，待处理图像的大小为M*N，x、y为像素点的横纵坐标值，φ(u,v)为待处理图像经过快速傅里叶变换以后所得相位谱；利用下述公式将HSV颜色特征的各视觉显著图进行融合，得到最终视觉显著直方图V的模块：

V＝w _H×V _H+w _S×V _S+w _V×V _V；

可选的，在本发明实施例的其他一些实施方式中，请参阅图5，所述装置例如还可包括去噪模块405，所述去噪模块405用于利用下述公式对待处理图像进行去噪处理：

X _t＝AX _t-1+v _t-1；

本发明实施例所述目标图像分割装置的各功能模块的功能可根据上述方法实施例中的方法具体实现，其具体实现过程可以参照上述方法实施例的相关描述，此处不再赘述。

由上可知，本发明实施例解决了相关技术中使用单独颜色特征所导致的图像分割效果不稳定问题，还有效地解决了光照强度变化、目标形变以及颜色分布类似而引起的目标图像分割不稳定问题，提升了目标图像分割的稳定性和准确度，还提高了图像分割的效率。

本发明实施例还提供了一种目标图像分割设备，具体可包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序以实现如上任意一实施例所述目标图像分割方法的步骤。

本发明实施例所述目标图像分割设备的各功能模块的功能可根据上述方法实施例中的方法具体实现，其具体实现过程可以参照上述方法实施例的相关描述，此处不再赘述。

本发明实施例还提供了一种计算机可读存储介质，存储有目标图像分割程序，所述目标图像分割程序被处理器执行时如上任意一实施例所述目标图像分割方法的步骤。

本发明实施例所述计算机可读存储介质的各功能模块的功能可根据上述方法实施例中的方法具体实现，其具体实现过程可以参照上述方法实施例的相关描述，此处不再赘述。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本发明所提供的一种目标图像分割方法、装置、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干改进和修饰，这些改进和修饰也落入本发明权利要求的保护范围。

Claims

一种目标图像分割方法，其特征在于，包括：

根据预先设置的初始目标区域设定条件在待处理图像中定位初始目标区域，计算所述初始目标区域的颜色直方图和视觉显著性直方图，构成初始目标特征模型；

利用预先构建的SVM模型从所述待处理图像中选取多个支持向量的目标像素点，计算各目标像素点的颜色直方图和视觉显著性直方图，构成样本特征模型；

基于计算得到的各目标像素点与所述初始目标区域的特征距离，在所述待处理图像中确定显著性区域；

根据所述初始目标特征模型和各样本特征模型，计算所述显著性区域中各像素点的权值，删除所述显著性区域中权值不满足预设条件的像素点后得到最终区域，以作为目标区域进行提取分割。
根据权利要求1所述的目标图像分割方法，其特征在于，所述利用预先构建的SVM模型从所述待处理图像中选取多个支持向量的目标像素点包括：

预先对所述待处理图像的各像素点进行样本标签标记；

采集所述待处理图像的多个像素点构成原始样本集，所述原始样本集中包含具有非支持向量和支持向量的像素点，且各像素点的权值相同；

在SVM训练所述原始样本集过程中，统计各像素点为非支持向量的次数；

删除非支持向量次数超过预设阈值的像素点，得到精简样本集；

从所述精简样本集中选取多个支持向量的目标像素点。
根据权利要求1所述的目标图像分割方法，其特征在于，所述基于计算得到的各目标像素点与所述初始目标区域的特征距离，在所述待处理图像中确定显著性区域包括：

计算各目标像素点与所述初始目标区域的特征距离；

将多个目标像素点分为第一像素点集合和第二像素点集合，所述第一像素点集合中各目标像素点对应的特征距离均小于所述第二像素点集合中各目标像素点对应的特征距离；

利用所述第一像素点集合中的各目标像素点代替所述第二像素点集合中的目标像素点，得到显著性区域。
根据权利要求3所述的目标图像分割方法，其特征在于，所述计算各目标像素点与所述初始目标区域的特征距离为：

利用下述公式计算各目标像素点与所述初始目标区域的特征距离d ^F(x _1i,x ₂)：

式中，x _1i为第i个目标像素点，x ₂为所述初始目标区域，K(x _1i,x _1i)为x _1i目标像素点与x _1i目标像素点之间的欧式距离，K(x _1i,x ₂)为x _1i目标像素点与所述初始目标区域中心之间的欧式距离， K(x ₂,x ₂)为所述初始目标区域中心与所述初始目标区域中心之间的欧式距离。
根据权利要求1至4任意一项所述的目标图像分割方法，其特征在于，所述根据所述初始目标特征模型和各样本特征模型，计算所述显著性区域中各像素点的权值包括：

利用下述公式计算所述显著性区域中各像素点的权值

式中，
为第i个像素点的颜色与所述初始目标区域的颜色的相似度，
为第i个像素点的视觉显著性与与所述初始目标区域的视觉显著性的相似度，
是全部
的算术平均值，
是全部
的算术平均值；
为t时刻的先验概率密度，λ为调整参数。
根据权利要求1至4任意一项所述的目标图像分割方法，其特征在于，所述计算所述初始目标区域的颜色直方图包括：

将所述待处理图像切换到HSV颜色空间，将H通道、S通道作为颜色特征，V通道作为明度特征；

利用下述公式计算所述初始目标区域的颜色直方图特征：

式中，x _i为所述初始目标区域中第i个像素点，
为以x像素点为中心区域的颜色分布模型，C为标准化因子，k为核函数，u为弱极限，a为所述初始目标区域的大小，N为所述初始目标区域中像素点的总数，b(x _i)为将第i个像素点的颜色特征分配到颜色直方图上相应部分，δ(·)为狄拉克函数。
根据权利要求6所述的目标图像分割方法，其特征在于，所述计算所述初始目标区域的视觉显著性直方图包括：

将所述待处理图像的HSV颜色空间特征从空域转换至频域，得到所述待处理图像的图像幅度谱和图像相位谱；

对每种颜色空间特征，利用下述公式得到所述初始目标区域的各像素点的视觉显著性值V(i,j)：

式中，所述待处理图像的大小为M*N，x、y为像素点的横纵坐标值，φ(u,v)为所述待处理图像经过快速傅里叶变换以后所得相位谱；

利用下述公式将HSV颜色特征的各视觉显著图进行融合，得到最终视觉显著直方图V：

V＝w _H×V _H+w _S×V _S+w _V×V _V；

式中，V _H、V _S、V _V分别为HSV颜色空间特征进行视觉显著性计算获得的相对应视觉显著图，w _H、w _S、w _V分别为各颜色空间特征对应的特征权值。
根据权利要求1至4任意一项所述的目标图像分割方法，其特征在于，在所述利用预先构建的SVM模型从所述待处理图像中选取多个支持向量的目标像素点之前，还包括：

利用下述公式对所述待处理图像进行去噪处理：

X _t＝AX _t-1+v _t-1；

式中，v _t-1为过程噪声信号，A为状态转移函数，t为时间，X _t为像素点。
一种目标图像分割装置，其特征在于，包括：

初始目标区域定位模块，用于根据预先设置的初始目标区域设定条件在待处理图像中定位初始目标区域，计算所述初始目标区域的颜色直方图和视觉显著性直方图，构成初始目标特征模型；

样本点选取模块，用于利用预先构建的SVM模型从所述待处理图像中选取多个支持向量的目标像素点，计算各目标像素点的颜色直方图和视觉显著性直方图，构成样本特征模型；

显著性区域确定模块，用于基于计算得到的各目标像素点与所述初始目标区域的特征距离，在所述待处理图像中确定显著性区域；

目标区域确定模块，用于根据所述初始目标特征模型和各样本特征模型，计算所述显著性区域中各像素点的权值，删除所述显著性区域中权值不满足预设条件的像素点后得到最终区域，以作为目标区域进行提取分割。
一种目标图像分割设备，其特征在于，包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至8任一项所述目标图像分割方法的步骤。