CN111461139B

CN111461139B - 一种复杂场景下的多目标视觉显著性分层检测方法

Info

Publication number: CN111461139B
Application number: CN202010227331.4A
Authority: CN
Inventors: 李璇; 黄正华; 徐宇航; 田潇; 江毅; 程莉; 朱丽娜; 请求不公布姓名
Original assignee: Wuhan Institute of Technology
Current assignee: Wuhan Institute of Technology
Priority date: 2020-03-27
Filing date: 2020-03-27
Publication date: 2023-04-07
Anticipated expiration: 2040-03-27
Also published as: CN111461139A

Abstract

本发明公开了一种复杂场景下的多目标视觉显著性分层检测方法，属于计算机视觉和图像处理技术领域。方法包括：基于格式塔线索将待检图像划分为多个图像块，对全部图像块进行显著性检测，根据显著性检测结果对全部图像块进行组合，并将图像块组合后的显著性检测结果作为第一层线索；使用一般性目标检测方法对待检图像进行目标检测，将目标检测结果作为第二层线索；基于交叉扩散方法，将第一层线索和所述第二层线索进行线索融合，并得到显著性结果图。本发明将格式塔线索运用到图像显著性检测中，针对具有复杂视觉场景和多目标分布的图像，充分利用感知结构信息和多目标分布信息，从而全面、均匀的突显出图像中具有明确边界的目标显著性区域。

Description

一种复杂场景下的多目标视觉显著性分层检测方法

技术领域

本发明涉及计算机视觉和图像处理技术领域，特别是指一种复杂场景下的多目标视觉显著性分层检测方法。

背景技术

图像的显著性检测是图像处理方面非常重要的一个课题，显著性检测作为一种重要的视觉信息预处理手段，在计算机视觉和图像的理解与分析领域发挥着重要的作用。早期，国内外学者对于显著性检测的研究主要采用的是自底向上的方式，采用这类方式的方法主要有基于对比度的方法,基于傅里叶频域的方法，基于信息论的方法等，尽管这些方法对于处理具有简单背景和单一目标图像时效果明显，但不适用于复杂背景下的图像目标视觉显著性检测。

发明内容

为了更好的解决上述问题，本发明提供一种复杂场景下的多目标视觉显著性分层检测方法。

本发明提供一种复杂场景下的多目标视觉显著性分层检测方法，具体包括以下步骤：

S1、基于格式塔线索将待检图像划分为多个图像块，对全部所述图像块进行显著性检测，根据显著性检测结果对全部所述图像块进行组合，并将图像块组合后的显著性检测结果作为第一层线索；

S2、使用一般性目标检测方法对所述待检图像进行目标检测，将目标检测结果作为第二层线索；

S3、基于交叉扩散方法，将所述第一层线索和所述第二层线索进行线索融合，并得到显著性结果图。

优选的，所述步骤S1，具体包括：

S11、使用高斯滤波器对所述待检图像进行平滑处理，得到处理后的待检图像，然后基于格式塔法则中的近邻性线索和相似性线索提取图像遍历步长；

S12、利用所述图像遍历步长设置窗口实现图像遍历，将处理后的待检图像划分为多个图像块；

S13、融合格式塔法则的连续性线索和闭合性线索，对全部所述图像块进行显著性检测，得到显著性检测结果根据所述显著性检测结果对全部所述图像块进行组合，并将图像块组合后的显著性检测结果作为第一层线索。

本发明在进行基于图像块的显著性检测时，充分考虑并有效利用了图像块之间的感知组合和结构信息，根据格式塔法则中的四种感知组合：近邻性、相似性、闭合性和连续性设定自适应的步长进行图像块的划分，从而通过设定合理的检测域实现了基于图像块组合的视觉显著性区域线索的提取。

优选的，所述步骤S11，具体包括：

使用高斯滤波器对所述待检图像进行平滑处理，得到处理后的待检图像；

基于格式塔法则中的近邻性线索和相似性线索提取图像遍历步长，所述图像遍历步长根据以下公式计算：

L＝gesD(x)_aver

其中，aver为求平均值，gesD(x)为像素之间的格式塔距离函数，根据以下公式计算：

其中，x_i、x_j是像素点的距离特征线索，c_i、c_j为像素点的特征信息，

为所述待检图像中的任意两个像素i和j之间的近邻性线索，

为所述待检图像中的任意两个像素i和j之间的相似性线索。

优选的，构建一个图G(V，E，W)，其中V为所有像素的集合，记为V＝{1，2，3，…，N}，E＝{(i，j|i，j∈V)}表示连接像素点的边的集合，W＝(W_ij)_N×N为权值矩阵，W_ij为像素点i、j连线的边的权值，表示像素点i、j之间的相似程度。图像的格式塔线索通过图的权值矩阵来表示，因此矩阵的近邻性,相似性,连续性，闭合性线索可以分别由权值矩阵W^pro，W^sim，W^con，W^cls表示。在第一层分割中首先需要提取近邻性和相似性线索，基于近邻性和相似性线索提取合适的图像遍历步长，以实现图像的第一步分割。

图像中的两个像素和之间的近邻性线索定义为：

和

分别表示像素的颜色和纹理特征信息。

图像中的两个像素和之间的相似性线索定义为：

其中d(x)表示像素之间的欧式距离；σ_x、σ_sim为预设参数，参数σ_i是保证

的特殊参数。

优选的，以图像块为粒度的显著性检测方法中，一个图像块的显著性值是用它和图像中其他图像块的对比来进行定义的，具体的，一个图像块的显著性是通过比较其特征与整个图像中其他图像块的特征来得到的，所述特征包括但不限于颜色、对比度、亮度、位置。

图像I中图像块I_k的显著性值定义为：

其中，D(i，j)表示图像块i和j间的特征距离度量。L为一特定区域，该区域是根据预设规则判定的某一固定窗口大小，在本申请中为利用格式塔法则中的近邻性和相似性线索，充分考虑图像像素间的感知组合和结构信息，从而获得的用于自适应图像块划分的窗口大小L作为检测域。

优选的，所述步骤S13，具体包括：

融合格式塔法则的连续性线索和闭合性线索，对所述图像块进行显著性检测，并得到显著性检测结果，根据所述显著性检测结果对全部所述图像块进行组合，并将图像块组合后的显著性检测结果作为第一层线索，所述组合后的显著性检测结果W_s表示为：

其中，S_iv为所述图像块的显著性矩阵，即所述显著性检测结果，根据以下公式计算：

k表示某个图像块中超像素区域的个数，w_ij表示超像素块间近邻性和相似性线索的权值线性组合，根据以下公式计算：

其中，α、β为灵敏度参数；

U(i)为颜色和位置唯一性值，D(i)为每个超像素块颜色空间分布的方差值，分别根据以下公式计算：

其中，

为两个超像素块r_i和r_j之间的闭合性线索，

为两个超像素块r_i和r_j之间的连续性线索，分别根据以下公式计算：

其中，

和

为预设参数，g(r)为超像素块r的格式塔线索，根据以下公式计算：

其中，ω的闭合性p(z^cls|ω)为：

其中l＝1，2，...，K，|e_jl|表示线段e_jl的长度；

ω的连续性p(z^con|ω)为：

其中，r表示图像块中的超像素块，z表示格式塔线索，ω表示需要区分的目标超像素块，

g^cls、g^con分别表示超像素块的闭合性格式塔线索和连续性格式塔线索，z^cls、z^cls分别表示闭合性格式塔线索和连续性格式塔线索，对分割后的像素块边缘进行细化和跟踪，获得边缘线段的集合，所述边缘线段的集合表示为{e₁，e₂，...，e_j}，每条线段都对应两个超像素块r_i，r_j)，根据超像素块之间的显著性特征差异程度，将e_j的强度值设为

优选的，所述步骤S2，具体包括：

对图像进行尺寸上的处理，将其归一化到相同尺寸，组合该窗口的像素梯度幅值，采用支持向量机框架SVM进行学习，最终进行一般性目标估计。

为了获得图像的一般性特征,通过线性模型ω∈R⁶⁴对由尺寸或纵横比定义的窗口进行扫描，并对其进行评分，使用公式为：

s_l＝<w，g_l＞

l＝(i，x，y)

其中，s_l，g_l分别为过滤器得分和NG特征，l和i分别代表位置以及尺度，(x，y)则是窗口坐标。

通过非最大抑制比(NMS)来得到建议窗口，对象状态得分的计算公式为：

o_l＝v_i*s_l+t_i(v_i，t_i∈R)

优选的，本申请的一般性目标检测中，运用两级级联SVM。

第一级SVM训练，用全部的正样本以及随机选择的负样本以保证总样本数达到SVM训练总样本数进行训练，经过第一级SVM训练，得到线性模型参数w，对样本进行打分，得到新的正样本和负样本，为第二级SVM训练做准备。

第二级SVM训练，根据第一级SVM训练得到的新的正样本和负样本进行训练，可以得到权值v_i，t_i，因此可以用公式o_l＝v_i*s_l+t_i将一般性目标得分进行定义，即可以得到是否检测到一般性目标。

优选的，对第一级SVM训练得到的线性模型w以及NG特征值进行二值化，所述二值化的计算方式近似为：

N_w，β_j，a_j，分别为基向量个数，校准系数和基向量。因为二进制数字只能为0和1，所以取：

引入w与二进制内积公式得到：

而64维的NG特征值二值化可以近似表示为：

最后将二值化模型w和NG进行结合对窗口评分：

其中，C_j，k是使用CPU原子操作得到的。

假设一幅图像的候选框为N个，则第k个窗口的加权矩阵表示为

令

即候选窗口中的像素置1，其他的像素置0，则得到的图像中所有候选窗口的累加权重矩阵为W：

将W进行归一化，则得到一般性目标检测结果，用矩阵W_O表示。

优选的，所述步骤S3，具体包括：

S31、基于交叉扩散方法，构建显著性检测对象分层检测模型，根据所述第一层线索构建基于视觉线索的非负亲和矩阵，根据所述第二层线索构建基于一般性目标分布线索的非负亲和矩阵；

S32、对所述非负亲和矩阵分别进行归一化处理，得到归一化状态矩阵，作为核矩阵；

S33、对所述核矩阵进行预设次数的迭代，得到融合矩阵；

S34、根据所述融合矩阵，得到融合后的显著性结果图。

本发明通过充分考虑基于全局的多目标分布信息，采用基于交叉扩散过程的多层级线索融合策略将一般性目标检测结果与基于格式塔线索的图像块组合显著性检测结果进行合成，充分地利用了先验信息，极大地提高了显著性算法的整体性能。

优选的，所述S31步骤，具体包括：

构建分层检测模型，根据两层检测结果构建基于视觉线索非负亲和矩阵W_SC和基于一般性目标分布线索的非负亲和矩阵W_OC；

令待融合的线索加权图像分别为g_s和g_o，其对应的非负亲和矩阵分别为W_SC和W_OC；

根据交叉扩散过程的定义，对于每一个线索加权图g＝(v，ε，W)，v＝{1，…，n}表示图像的点，

表示图像的边，

表示非负亲和矩阵，W_ij表示点i，j之间的度量关系，当W_ij＝0时表示没有线索。

优选的，归一化状态矩阵P_S和P_O的计算公式为：

核矩阵

和

的计算公式为：

在输入图像g_s和g_o后，构造成新的图像

和

新的图像

满足以下条件：

具有与g相同的节点集，即

只保留连接相邻节点的g边缘,

当且仅当j∈Ω(i)，Ω(·）表示节点的邻域。

进而得到相应的非负亲和矩阵：

进而得到对应的归一化矩阵，即核矩阵：

经过t次迭代得到融合矩阵，公式如下：

其中

和

是迭代后的矩阵，两个亲和矩阵在迭代期间交换信息，由于核矩阵仅通过使用可靠的局部信息并且由状态矩阵构成，所以交叉扩散过程由此具有减少噪声和降低损耗风险的效果。

经历过t次迭代的亲和矩阵W_c计算方法如下：

其中

表示各元素的乘积，为了提高算法的鲁棒性，规定所有数据取正值。

其中η＞0，I是一个恒等矩阵。

交叉扩散的融合过程提高了多目标视觉显著性检测的有效性，并最终输出显著性结果图。

优选的，所述像素点的特征信息c_i包括：

颜色、亮度和方向。

本发明还提供一种复杂场景下的多目标视觉显著性分层检测装置，包括以下模块：

显著性检测模块，用于基于格式塔线索将待检图像划分为多个图像块，对全部所述图像块进行显著性检测，根据显著性检测结果对全部所述图像块进行组合，并将图像块组合后的显著性检测结果作为第一层线索；

目标检测模块，用于使用一般性目标检测方法对待检图像进行目标检测，将目标检测结果作为第二层线索；

线索融合模块，用于基于交叉扩散方法将所述第一层线索和所述第二层线索进行线索融合，并得到显著性结果图。

本发明还提供一种电子设备，所述设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述任一项所述的一种复杂场景下的多目标视觉显著性分层检测方法的步骤。

本发明还提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的一种复杂场景下的多目标视觉显著性分层检测方法的步骤。

本发明通过提出一种复杂背景下的多目标视觉显著性分层检测方法，将格式塔线索融入到图像块的划分和显著性区域提取的过程之中，有效地利用了像素、图像块这些视觉“对象”之间的感知组合和结构信息，构建的分层检测模型，结合基于格式塔线索的图像块组合显著性线索和基于全局的多目标似物性分布信息，全面、均匀的突显出图像中具有明确边界的目标显著性区域。该方法明显提升了复杂场景下进行多目标视觉显著性区域检测算法的性能。

本发明还利用基于交叉扩散过程的融合策略，将分层检测模型中的两层线索进行有机融合，充分地利用了先验信息，极大地提高了算法的整体性能，在显著性检测性能上获得了显著的提升。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例中的一种复杂场景下的多目标视觉显著性分层检测方法流程图；

图2是本发明实施例中的第一层线索的计算方法流程图；

图3是本发明实施例中的基于交叉扩散方法，融合得到显著性结果图的方法流程图；

图4是本发明实施例中的一种复杂场景下的多目标视觉显著性分层检测装置模块图；

图5(a)为本发明实施例中处理的原始图像示意图；

图5(b)为本发明实施例中将原始图像显著性检测处理后的示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

本发明的实施例提供一种复杂场景下的多目标视觉显著性分层检测方法，参见图1，具体包括以下步骤：

优选的，步骤S1，如图2所示，具体包括：

S12、利用图像遍历步长设置窗口实现图像遍历，将处理后的待检图像划分为多个图像块；

S13、融合格式塔法则的连续性线索和闭合性线索，对全部图像块进行显著性检测，得到显著性检测结果，根据显著性检测结果对全部图像块进行组合，并将图像块组合后的显著性检测结果作为第一层线索。

本发明的实施例在进行基于图像块的显著性检测时，充分考虑并有效利用了图像块之间的感知组合和结构信息，根据格式塔法则中的四种感知组合：近邻性、相似性、闭合性和连续性设定自适应的步长进行图像块的划分，从而通过设定合理的检测域实现了基于图像块组合的视觉显著性区域线索的提取。

优选的，所述步骤S11，具体包括：

L＝gesD(x)_aver

为所述待检图像中的任意两个像素i和j之间的近邻性线索，

为所述待检图像中的任意两个像素i和j之间的相似性线索。

优选的，构建一个图G(V，E，W)，其中V为所有像素的集合，记为V＝{1，2，3，...，N}，E＝{(i，j|i，j∈V)}表示连接像素点的边的集合，W＝(W_ij)_N×N为权值矩阵，W_ij为像素点i、j连线的边的权值，表示像素点i、j之间的相似程度。图像的格式塔线索通过图的权值矩阵来表示，因此矩阵的近邻性,相似性,连续性，闭合性线索可以分别由权值矩阵W^pro，W^sim，W^con，W^cls表示。在第一层分割中首先需要提取近邻性和相似性线索，基于近邻性和相似性线索提取合适的图像遍历步长实现图像的第一步分割。

图像中的两个像素和之间的近邻性线索定义为：

和

分别表示像素的颜色和纹理特征信息。

图像中的两个像素和之间的相似性线索定义为：

的特殊参数。

在一个具体的实施例中，σ_x和σ_sim分别设定为0.25和20。

优选的，以图像块为粒度的显著性检测方法中，一个图像块的显著性值是用它和图像中其他图像块的对比度来定义的，具体来说，一个图像块的显著性是通过比较其特征与整个图像中其他图像块的特征来得到的，所述特征包括但不限于颜色、对比度、亮度、位置。

图像I中图像块I_k的显著性值定义为：

其中，D(i，j)表示图像块i和j间的特征距离度量。L为一特定区域，该区域是根据预设规则判定的某一固定窗口大小，在本发明中为利用格式塔法则中的近邻性和相似性线索，充分考虑图像像素间的感知组合和结构信息，从而获得用于自适应图像块划分的窗口大小L作为检测域。

在一个具体的实施例中，通过选择合适的窗口实现图像的遍历，完成图像块的划分，本申请中采用图像遍历算法对图像进行显著性划分，通过使用一个图像遍历程序基于一定的步长对图像进行“块”的划分，其关键步骤在于步长的选择，合适的步长可以增加图像显著性识别的准确性，因此采取基于格式塔法则中的近邻性和相似性线索提取合适的图像遍历步长，避免误差较大的步长带来一系列的错误(如产生混叠，失真等)。

优选的，所述步骤S13，具体包括：

在一个具体的实施例中，图像块的组合即为矩阵的拼接，原始图像和显著性检测结果比较的示例如图5(a)和图5(b)所示。

其中，S_iv为所述图像块的显著性矩阵，即显著性检测结果，根据以下公式计算：

其中，α、β为灵敏度参数；

其中，

为两个超像素块r_i和r_j之间的闭合性线索，

其中，

和

其中，ω的闭合性p(z^cls|ω)为：

其中l＝1，2，...，K，|e_jl|表示线段e_jl的长度；

ω的连续性p(z^con|ω)为：

g^cls、g^con分别表示超像素块的闭合性格式塔线索和连续性格式塔线索，z^cls、z^cls分别表示闭合性格式塔线索和连续性格式塔线索，对分割后的像素块边缘进行细化和跟踪，获得边缘线段的集合，所述边缘线段的集合表示为{e₁，e₂，…，e_j}，每条线段都对应两个超像素块(r_i，r_j)，根据超像素块之间的显著性特征差异程度，将e_j的强度值设为

优选的，所述步骤S2，具体包括：

对图像进行尺寸上的处理，将其归一化到相同尺寸，组合该窗口的像素梯度幅值，采用一个支持向量机框架进行学习，最终来进行一般性目标估计。

在一个具体的实施例中，由于一般对象的梯度幅值以及完好的封闭轮廓之间具有强联系，首先对图像进行尺寸上的处理，将其归一化到相同尺寸8*8，而组合该窗口的像素梯度幅值(NG)作为一个64位特征，采用一个二级级联的支持向量机框架进行学习，最终来进行一般性目标估计。

为了获得图像的一般性特征,通过线性模型ω∈R⁶⁴对由尺寸或纵横比定义的窗口进行扫描，并对其进行评分：

s_l＝<w，g_l＞

l＝(i，x，y)

o_l＝v_i*s_l+t_i(v_i，t_i∈R)

在一个具体的实施例中，由于一些尺寸窗口(如10*500)相较于其他窗口(如100*100)包含对象可能性不大，因此将对象状态得分(校准过滤器得分)计算公式定义为o_l＝v_i*s_l+t_i(v_i，t_i∈R)。

优选的，本发明的一般性目标检测中，运用了两级级联SVM。

第一级SVM训练，用全部的正样本以及随机选择的负样本以保证总样本数达到SVM训练总样本数进行训练，经过第一级SVM训练，得到线性模型参数w，对样本进行打分，得到新的正负样本，为第二级SVM训练做准备。

第二级SVM训练，根据第一级SVM训练得到的新正负样本进行训练，可以得到权值v_i，t_i，因此可以用公式o_l＝v_i*s_l+t_i将一般性目标得分进行定义，即可以得到是否检测到一般性目标。

优选的，对第一集SVM训练得到的线性模型w以及NG特征值进行二值化，所述二值化的计算方式近似为：

N_w，β_j，a_j，分别为基向量个数，校准系数和基向量。因为二进制只能为0和1，所以取：

引入w与二进制内积公式得到：

而64维的NG特征值二值化可以近似表示为：

最后将二值化模型w和NG进行结合对窗口评分：

其中，C_j，k是使用一些简单的原子操作得到的。

令

优选的，所述步骤S3，如图3所示，具体包括：

S33、对所述核矩阵进行预设次数的迭代，得到融合矩阵；

S34、根据所述融合矩阵，得到融合后的显著性结果图。

本发明的实施例通过充分考虑基于全局的多目标分布信息，采用基于交叉扩散过程的多层级线索融合策略将一般性目标检测结果与基于格式塔线索的图像块组合显著性检测结果进行合成，充分地利用了先验信息，极大地提高了显著性算法的整体性能。

优选的，所述S31步骤，具体包括：

表示图像的边，

优选的，归一化状态矩阵P_S和P_O的计算公式为：

核矩阵

和

的计算公式为：

在输入图像g_s和g_o后，构造成新的图像

和

满足以下条件：

具有与g相同的节点集，即

只保留连接相邻节点的g边缘,

当且仅当j∈Ω(i)，Ω(·)表示节点的邻域。

进而得到相应的非负亲和矩阵：

进而得到对应的归一化矩阵，即核矩阵：

经过t次迭代得到融合矩阵，公式如下：

其中

和

经历过t次迭代的亲和矩阵W_c计算方法如下：

其中

表示各元素的乘积，为了提高算法的鲁棒性规定所有数据取正值。

其中η＞0，I是一个恒等矩阵。

在本发明中经历交叉扩散的融合过程提高了多目标视觉显著性检测的有效性，最终输出显著性结果图。

优选的，所述像素点的特征信息c_i包括：

颜色、亮度和方向。

本发明的实施例还提供一种复杂场景下的多目标视觉显著性分层检测装置，如图4所示，包括以下模块：

显著性检测模块81，用于基于格式塔线索将待检图像划分为多个图像块，对全部所述图像块进行显著性检测，根据显著性检测结果对全部所述图像块进行组合，并将图像块组合后的显著性检测结果作为第一层线索；

目标检测模块82，用于使用一般性目标检测方法对待检图像进行目标检测，将目标检测结果作为第二层线索；

线索融合模块83，用于基于交叉扩散方法将所述第一层线索和所述第二层线索进行线索融合，并得到显著性结果图。

优选的，所述显著性检测模块81，包括以下单元：

步长提取单元，用于使用高斯滤波器对所述待检图像进行平滑处理，得到处理后的待检图像，然后基于格式塔法则中的近邻性线索和相似性线索提取图像遍历步长；

图像块划分单元，用于利用所述图像遍历步长设置窗口实现图像遍历，将处理后的待检图像划分为多个图像块；

显著性检测单元，用于融合格式塔法则的连续性线索和闭合性线索，对全部所述图像块进行显著性检测，得到显著性检测结果；

组合单元，用于根据所述显著性检测结果对全部所述图像块进行组合，并将图像块组合后的显著性检测结果作为第一层线索。

优选的，所述线索融合模块83，包括以下单元：

矩阵构建单元，用于基于交叉扩散方法，构建显著性检测对象分层检测模型，根据所述第一层线索构建基于视觉线索的非负亲和矩阵，根据所述第二层线索构建基于一般性目标分布线索的非负亲和矩阵；

归一化处理单元，用于对所述非负亲和矩阵分别进行归一化处理，得到归一化状态矩阵，作为核矩阵；

迭代单元，用于对所述核矩阵进行预设次数的迭代，得到融合矩阵；

绘图单元，用于根据所述融合矩阵，得到融合后的显著性结果图。

本发明的实施例还提供一种电子设备，所述设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述任一项所述的一种复杂场景下的多目标视觉显著性分层检测方法的步骤。

本发明的实施例还提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的一种复杂场景下的多目标视觉显著性分层检测方法的步骤。

本发明的实施例通过提出一种复杂背景下的多目标视觉显著性分层检测算法，将格式塔线索融入到图像块的划分和显著性区域提取的过程之中，有效地利用了像素、图像块这些视觉“对象”之间的感知组合和结构信息，构建的分层检测模型，结合基于格式塔线索的图像块组合显著性线索和基于全局的多目标似物性分布信息，全面、均匀的突显出图像中具有明确边界的目标显著性区域。该方法明显提升了复杂场景下进行多目标视觉显著性区域检测算法的性能。

本发明的实施例还利用基于交叉扩散过程的融合策略，将分层检测模型中的两层线索进行有机融合，充分地利用了先验信息，极大地提高了算法的整体性能，在显著性检测性能上获得了显著的提升。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种复杂场景下的多目标视觉显著性分层检测方法，其特征在于，包括：

S3、基于交叉扩散方法，将所述第一层线索和所述第二层线索进行线索融合，并得到显著性结果图；

所述步骤S1具体包括：

S13、融合格式塔法则的连续性线索和闭合性线索，对全部所述图像块进行显著性检测，得到显著性检测结果，根据所述显著性检测结果对全部所述图像块进行组合，并将图像块组合后的显著性检测结果作为第一层线索。

2.根据权利要求1所述的一种复杂场景下的多目标视觉显著性分层检测方法，其特征在于，所述步骤S11具体包括：

L＝gesD(x)_aver

为所述待检图像中的任意两个像素i和j之间的近邻性线索，

为所述待检图像中的任意两个像素i和j之间的相似性线索。

3.根据权利要求2所述的一种复杂场景下的多目标视觉显著性分层检测方法，其特征在于，所述步骤S13具体包括：

其中，α、β为灵敏度参数；

其中，

为两个超像素块r_i和r_j之间的闭合性线索，

其中，

和

其中，ω的闭合性p(z^cls|ω)为：

其中l＝1,2,…,K，|e_jl|表示线段e_jl的长度；

ω的连续性p(z^con|ω)为：

g^cls、g^con分别表示超像素块的闭合性格式塔线索和连续性格式塔线索，z^cls、z^cls分别表示闭合性格式塔线索和连续性格式塔线索，对分割后的像素块边缘进行细化和跟踪，获得边缘线段的集合，所述边缘线段的集合表示为{e₁,e₂,…,e_j}，每条线段都对应两个超像素块(r_i,r_j)，根据超像素块之间的显著性特征差异程度，将e_j的强度值设为

4.根据权利要求1所述的一种复杂场景下的多目标视觉显著性分层检测方法，其特征在于，所述步骤S3具体包括：

S33、对所述核矩阵进行预设次数的迭代，得到融合矩阵；

S34、根据所述融合矩阵，得到融合后的显著性结果图。

5.根据权利要求4所述的一种复杂场景下的多目标视觉显著性分层检测方法，其特征在于，所述S31步骤，具体包括：

根据交叉扩散过程的定义，对于每一个线索加权图g＝(v,ε,W)，v＝{1,…,n+表示图像的点，

表示图像的边，

表示非负亲和矩阵，W_ij表示点i,j之间的度量关系，当W_ij＝0时表示没有线索。

6.根据权利要求2所述的一种复杂场景下的多目标视觉显著性分层检测方法，其特征在于，所述像素点的特征信息c_i包括：

颜色、亮度和方向。

7.一种复杂场景下的多目标视觉显著性分层检测装置，其特征在于，包括：

线索融合模块，用于基于交叉扩散方法将所述第一层线索和所述第二层线索进行线索融合，并得到显著性结果图；

所述显著性检测模块，包括以下单元：

8.一种电子设备，其特征在于，所述设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的一种复杂场景下的多目标视觉显著性分层检测方法的步骤。

9.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的一种复杂场景下的多目标视觉显著性分层检测方法的步骤。