CN104537355A - 一种利用图像边界信息和区域连通性的显著对象检测方法 - Google Patents

一种利用图像边界信息和区域连通性的显著对象检测方法 Download PDF

Info

Publication number
CN104537355A
CN104537355A CN201510013897.6A CN201510013897A CN104537355A CN 104537355 A CN104537355 A CN 104537355A CN 201510013897 A CN201510013897 A CN 201510013897A CN 104537355 A CN104537355 A CN 104537355A
Authority
CN
China
Prior art keywords
pixel
super
node
ring
centerdot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510013897.6A
Other languages
English (en)
Other versions
CN104537355B (zh
Inventor
邹北骥
刘晴
陈再良
胡旺
傅红普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201510013897.6A priority Critical patent/CN104537355B/zh
Publication of CN104537355A publication Critical patent/CN104537355A/zh
Application granted granted Critical
Publication of CN104537355B publication Critical patent/CN104537355B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种利用图像边界信息和区域连通性的显著对象检测方法,通过对待检测的图像进行超像素分割,利用超像素的平均Lab颜色特征向量和超像素的空间拓扑关系构建三个无向加权图,计算每个超像素到图像边界的最短路径,获取三个显著图,将三个显著图相乘得到最终的显著图,完成显著对象的检测;利用超像素的局部上下文信息对显著值进行修正,从而提高了显著对象检测的精度,进一步降低背景区域的显著性;此外,采用逻辑斯蒂回归器对根据不同连通性计算得到的修正后的显著图进行特征整合,得到最终的在显著对象区域均匀高亮的显著图。本方法能够快速的将显著对象区域高亮,并且能够降低背景中高对比度区域的误检率。

Description

一种利用图像边界信息和区域连通性的显著对象检测方法
技术领域
本发明属于图像检索和图像识别技术领域,涉及一种显著对象检测方法,具体地说,涉及一种利用图像边界信息和图像背景连通性先验来进行的一种新的显著对象检测方法。
背景技术
人类视觉系统具有的一个非凡的能力就是视觉注意,即能够快速地从复杂场景中选择出重要的信息进行进一步地加工处理,而忽略其他信息。显著对象检测的目的是通过建模生成一个显著图来预测人在观看图像时图像中最能吸引人的注意的对象,显著图中的每一个像素点的亮度代表该处的显著值,显著值越大,说明此处受到人关注的可能性越大。显著对象检测是计算机视觉中的一个基础问题,在图像缩放、图像压缩、对象识别和图像分类等领域具有广泛的应用前景。
当前已有的显著对象检测方法:
1、基于生物学假说的显著性检测方法。该方法提取了颜色、亮度和方向特征,基于生物视觉的拮抗特性,设计了中央-周边差算子来计算特征的局部对比度,得到特征显著图;然后依据特征整合理论,对特征显著图进行等权线性融合。该方法倾向于将具有高局部对比度的小对象进行高亮,但是不能够均匀地将整个显著对象检测出来,对于背景中具有高对比度的边界区域会被错误地检测出来。
2、基于全局对比度的显著对象检测方法。该类方法计算当前像素/区域的特征与图像中的剩余像素/区域特征之间的对比度,对对比度进行空间距离加权得到当前像素/区域的显著值。相比于受生物视觉启发的基于局部对比度的显著性计算方法,该类方法能够获得更好的检测精度,但是对于背景中具有高对比度的像素/区域,能够被错误地检测出来。
3、基于认知准则的显著对象检测方法。该类方法根据格式塔心理学的图/底组织规律,认为对象区域的特征具有特异性,并且在空间上对象区域具有高紧致性,而背景区域倾向于蔓延整个图像区域。另外,对象区域由于与背景区域之间存在高对比度,因此从对象区域到达图像的边界区域所花的代价大;而从背景区域具有连续性和同源性,因此,背景区域到达图像的边界区域所花的代价小。通过计算超像素到图像边界的最短路径,就可以计算出超像素的显著值。但是,该类方法会将背景中的局部高对比度的小尺度对象误检,而自然场景图像的背景中常常包含了具有高局部对比度的小尺度对象。
发明内容
针对现有技术的不足,本发明的目的在于提供一种基于图像背景信息和区域多级连通性的快速显著对象检测方法,该方法考虑了区域的不同连通性,并且学习了通过不同连通性计算得到的显著值的融合方式,该方法具有高的检测准确率,并且速度快,能够有效地抑制背景中具有高局部对比度的小尺度对象,并且检测出的显著对象区域具有均匀的显著值和清晰的边缘。
为了达到上述目的,本发明采用的技术方案如下:
一种利用图像边界信息和区域连通性的显著对象检测方法,包括以下几个步骤:
步骤1:输入待检测的图像;
步骤2:对待检测的图像进行超像素分割,得到超像素集合V={v1,v2,...,vM},并计算每个超像素vi的平均Lab颜色特征向量xi
vi表示第i个超像素,vi∈V,M为超像素的个数;
将图像分割成多个子区域,每一个子区域由表观相似且空间相近的像素构成,每一个子区域叫做超像素;
步骤3:根据超像素的空间拓扑结构及三个不同的邻域范围,对每个超像素创建三个无向加权图,包括一环邻接图、二环邻接图及三环邻接图,分别记为G1、G2和G3
其中,三个无向加权图中的节点为超像素,节点与相邻节点之间形成的边的权重为两相邻节点对应的两平均Lab颜色特征向量之间的距离;
所述三个不同的邻域是指一环邻域、二环邻域及三环邻域;
一环邻域,超像素vi的一环邻域为与其在空间上相邻接的超像素vj的集合,即超像素vj与超像素vi相邻};
二环邻域,超像素vi的二环邻域包括超像素vi的一环邻域中的超像素以及超像素vi的一环邻域中包含的超像素的一环邻域,即 N v i 2 = { N v i 1 ∪ v j | v k ∈ N v i 1 ^ v j ∈ N v k 1 } ;
三环邻域,超像素vi的三环邻域包括超像素vi的二环邻域中的超像素以及超像素vi的二环邻域中的超像素的一环邻域,即 N v i 3 = { N v i 2 ∪ v j | v k ∈ N v i 2 ^ v j ∈ N v k 1 } ;
步骤4:获取超像素v的显著值s(v),s(v)=s1(v)·s2(v)·s3(v),并将超像素的显著值赋值给超像素中的每一个像素,得到像素级的显著图,完成显著图的检测;
sl(v)表示每个无向加权图中每个节点到无向加权图的边界节点的累积最短路径,以节点的累积最短路径sl(v)作为对应的超像素的第l环的显著值,l={1,2,3};
s l ( v ) = min v 1 = v , v 2 , . . . , v n = B Σ i = 1 n - 1 c ( i ) ( i + 1 ) l s . t . ( v i , v i + 1 ) ∈ E l
其中,B表示虚拟背景节点,边界节点与虚拟背景节点B存在边,边的权重为0;表示在l环邻接图中相邻节点之间的边的权值;El表示l环邻接图中连接边的集合;n表示从起始节点到虚拟背景节点的路径上包含的节点总数。
累积路径的第一个结点v1为v,经过结点v2,v3,...,vn-1,到达终结点vn,即虚拟背景B。将此路径上的边的权重相加,就是起始结点v到达终结点B所需的代价。这样的路径会有多个,这样可以计算得到多个代价,从中选出代价最小的,就得到了sl(v)。
即根据G1计算得到的显著值s1(v),根据G2计算得到的显著值s2(v)和根据G3计算得到的显著值s3(v);
对于每个无向加权图中的每个结点的显著值sl(v),根据其局部上下文信息按照如下公式进行修正,使得具有相似表观的超像素具有相似的显著值
s ^ l ( v ) = λ s l ( v ) + ( 1 - λ ) Σ ( v , v j ) ∈ E 1 w j · s l ( v j ) Σ ( v , v j ) ∈ E 1 w j
其中,λ为权重因子,取值0.05-0.3;
在满足(v,vj)∈E1,wj表示属于1环邻接图中连接边上结点v与结点vj的表观相似性:σ2是为1环邻接图中相邻超像素特征对比度的方差,相邻超像素特征对比度即为相邻超像素的平均Lab颜色特征向量之间的距离;x和xj分别为结点v与结点vj的平均Lab颜色特征向量。
选用逻辑斯蒂回归器替代s(v)=s1(v)·s2(v)·s3(v),获取超像素的显著值,完成显著图的检测,具体过程如下:
根据超像素的三个显著值,生成二次特征项和三次特征项,将一次项,二次项,三次项以及偏差项1串联,得到20维特征向量,将20维的特征向量输入已训练好的逻辑斯蒂回归器中以逻辑斯蒂回归器输出的值作为对应超像素的显著值;
其中,二次特征项和三次特征项分别为 20维的特征向量 f = [ 1 , s ^ 1 , s ^ 2 , s ^ 3 , ( s ^ 1 ) 2 , ( s ^ 2 ) 2 , ( s ^ 3 ) 2 , s ^ 1 · s ^ 2 , s ^ 1 · s ^ 3 , s ^ 2 · s ^ 3 , ( s ^ 1 ) 3 , ( s ^ 2 ) 3 , ( s ^ 3 ) 3 , ( s ^ 1 ) 2 · s ^ 2 , ( s ^ 2 ) 2 · s ^ 1 , ( s ^ 3 ) 2 · s ^ 1 , ( s ^ 3 ) 2 · s ^ 2 , s ^ 1 · s ^ 2 · s ^ 3 ]
w是一个20维的权值矩阵,利用训练数据集MSRA10K训练逻辑斯蒂回归器时获得。
所述已训练好的逻辑斯蒂回归器的具体训练过程如下:
训练所用的数据集为MSRA10K,该数据集包含10000张彩色图像以及对应的由人工手动标记出了显著对象的标记图像;
步骤1):从MSRA10K数据集中随机选取2000张图像,对于每一张图像,执行步骤1-4,得到每张图像中每个超像素的20维特征向量,记为F=[f1,f2,...fN],N为总的超像素的个数;
步骤2):根据标记图像,如果超像素中一半以上的像素属于被标记的显著对象,则将该超像素标为1,否则标为0,从而得到标签向量L=[l1,l2,...,lN];
步骤3):采用极大似然法估计模型参数,似然函数为:
max w Σ n = 1 N [ l i ( w · f i ) - log ( 1 + exp ( w · f i ) ) ]
求解上述函数得到w,fi表示超像素的20维特征向量中的第i个特征向量。
所述每个无向加权图中每个节点到无向加权图的边界节点的累积最短路径采用Dijkstra最短路径算法计算。
所述步骤2中对待检测的图像进行超像素分割采用具有边缘保持的超像素分割方法,其中,边缘特征相对颜色特征的重要性,取值为0.9,超像素的规整性相对颜色特征的重要性,取值0.5,超像素尺度控制因子,取值为3000。
本方法的超像素分割方法采用的是Dollár P.,Zitnick C.L.:Structured forests for fast edgedetection.In:2013 IEEE International Conference on Computer Vision,pp1841-1848(2013)中的方法,该方法同时考虑了边缘特征,颜色特征以及超像素的规整性,超像素的尺度控制因子越大,超像素大小越大,个数越小。此设置能够保证对于300*400的图像,超像素的个数在200左右。
MSRA10K是公开的用于显著对象检测并被广泛使用的数据集,该数据集包含10000张彩色图像以及对应的人工标记出显著对象的标记图像。
有益效果
本发明提出了一种利用图像边界信息和区域连通性的显著对象检测方法,通过对待检测的图像进行超像素分割,利用超像素的平均Lab颜色特征向量和超像素的空间拓扑关系构建三个无向加权图,计算每个超像素到图像边界的最短路径,获取三个显著图,将三个显著图相乘得到最终的显著图,完成显著对象的检测;本发明将超像素的邻域扩大,同时考虑了一环邻域、二环邻域和三环邻域来降低背景中小尺度对象的显著性,提高了检测的精度。为了进一步降低背景区域的显著性,利用超像素的局部上下文信息对显著值进行修正,从而提高了显著对象检测的精度;此外,采用逻辑斯蒂回归器对根据不同连通性计算得到的修正后的显著图进行特征整合,得到最终的在显著对象区域均匀高亮的显著图。本方法能够快速的将显著对象区域高亮,并且能够降低背景中高对比度区域的误检率。
附图说明
图1为本发明所述方法的流程图;
图2为应用本发明对显著对象进行检测过程示意图,其中,图(a)为输入的待检测图像,图(b)为超像素分割图像,图(c1)—图(c3)为初始显著图,图(d1)—图(d3)为显著值修正图,图(e)为输出图像;
图3为应用本发明所述方法与其他方法的对比效果图,其中,图(a)为输入图像,图(b)为人工标记图像,图(c)为本发明的检测结果,图(d)为方法GS12的检测结果,图(e)为方法GC13的检测结果,图(f)为方法BMS13的检测结果,图(g)为方法CS13的检测结果,图(h)为方法SF12的检测结果;
图4为应用本发明在常用显著对象检测的含1000张图像的测试数据集ASD上的定量评价结果。
具体实施方式
下面将结合实施例和附图,对本发明做进一步说明。
如图1所示,为本发明所述方法的流程图,一种利用图像边界信息和区域连通性的显著对象检测方法,包括以下几个步骤:
步骤1:输入待检测的图像;
步骤2:对待检测的图像进行超像素分割,得到超像素集合V={v1,v2,...,vM},并计算每个超像素vi的平均Lab颜色特征向量xi
vi表示第i个超像素,vi∈V,M为超像素的个数;
采用具有边缘保持的超像素分割方法对输入图像进行过分割,分割结果如图2(b)所示;
步骤3:根据超像素的空间拓扑结构及三个不同的邻域范围,对每个超像素创建三个无向加权图,包括一环邻接图、二环邻接图及三环邻接图,分别记为G1、G2和G3
G1=(V,E1),V={v1,v2,...,vM},是超像素集合,是边的集合,边的权重的设置如下:
G2=(V,E2),V是超像素集合,是边的集合,边的权重的设置如下:
G3=(V,E3),V是超像素集合,是边的集合,边的权重的设置如下:
其中,三个无向加权图中的节点为超像素,节点与相邻节点之间形成的边的权重为两相邻节点对应的两平均Lab颜色特征向量之间的距离;
所述三个不同的邻域是指一环邻域、二环邻域及三环邻域;
一环邻域,超像素vi的一环邻域为与其在空间上相邻接的超像素vj的集合,即超像素vj与超像素vi相邻};
二环邻域,超像素vi的二环邻域包括超像素vi的一环邻域中的超像素以及超像素vi的一环邻域中包含的超像素的一环邻域,即 N v i 2 = { N v i 1 ∪ v j | v k ∈ N v i 1 ^ v j ∈ N v k 1 } ;
三环邻域,超像素vi的三环邻域包括超像素vi的二环邻域中的超像素以及超像素vi的二环邻域中的超像素的一环邻域,即 N v i 3 = { N v i 2 ∪ v j | v k ∈ N v i 2 ^ v j ∈ N v k 1 } ;
步骤4:获取超像素v的显著值s(v),s(v)=s1(v)·s2(v)·s3(v),并将超像素的显著值赋值给超像素中的每一个像素,得到像素级的显著图,完成显著图的检测;
sl(v)表示每个无向加权图中每个节点到无向加权图的边界节点的累积最短路径,以节点的累积最短路径sl(v)作为对应的超像素的第l环的显著值,l={1,2,3};
s l ( v ) = min v 1 = v , v 2 , . . . , v n = B Σ i = 1 n - 1 c ( i ) ( i + 1 ) l s . t . ( v i , v i + 1 ) ∈ E l
其中,B表示虚拟背景节点,边界节点与虚拟背景节点B存在边,边的权重为0;表示在l环邻接图中相邻节点之间的边的权值;El表示l环邻接图中连接边的集合;n表示从起始节点到虚拟背景节点的路径上包含的节点总数。
对于每一个结点v∈V,可以得到三个显著值,即根据G1计算得到的显著值s1(v),根据G2计算得到的显著值s2(v)和根据G3计算得到的显著值s3(v)。将显著值赋给超像素图像中的每一个像素,得到像素级的显著图,如图2(c1-c3)所示。
累积路径的第一个结点v1为v,经过结点v2,v3,...,vn-1,到达终结点vn,即虚拟背景B。将此路径上的边的权重相加,就是起始结点v到达终结点B所需的代价。这样的路径会有多个,这样可以计算得到多个代价,从中选出代价最小的,得到sl(v)。
步骤4:对于每个无向加权图中的每个结点的显著值sl(v),根据其局部上下文信息按照如下公式进行修正,使得具有相似表观的超像素具有相似的显著值
s ^ l ( v ) = λ s l ( v ) + ( 1 - λ ) Σ ( v , v j ) ∈ E 1 w j · s l ( v j ) Σ ( v , v j ) ∈ E 1 w j
其中,λ为权重因子,取值0.05-0.3;
在满足(v,vj)∈E1,wj表示属于一环邻接图中连接边上结点v与结点vj的表观相似性:σ2是为一环邻接图中相邻超像素特征对比度的方差,相邻超像素特征对比度即为相邻超像素的平均Lab颜色特征向量之间的距离;x和xj分别为结点v与结点vj的平均Lab颜色特征向量。
步骤5:选用逻辑斯蒂回归器获取超像素的显著值,完成显著图的检测,具体过程如下:
根据超像素的三个显著值,生成二次特征项和三次特征项,将一次项,二次项,三次项以及偏差项1串联,得到20维特征向量,将20维的特征向量输入已训练好的逻辑斯蒂回归器中以逻辑斯蒂回归器输出的值作为对应超像素中像素的显著值,得到最后的显著图,如图2(e)所示;
其中,二次特征项和三次特征项分别为 20维的特征向量 f = [ 1 , s ^ 1 , s ^ 2 , s ^ 3 , ( s ^ 1 ) 2 , ( s ^ 2 ) 2 , ( s ^ 3 ) 2 , s ^ 1 · s ^ 2 , s ^ 1 · s ^ 3 , s ^ 2 · s ^ 3 , ( s ^ 1 ) 3 , ( s ^ 2 ) 3 , ( s ^ 3 ) 3 , ( s ^ 1 ) 2 · s ^ 2 , ( s ^ 2 ) 2 · s ^ 1 , ( s ^ 3 ) 2 · s ^ 1 , ( s ^ 3 ) 2 · s ^ 2 , s ^ 1 · s ^ 2 · s ^ 3 ]
w是一个20维的权值矩阵,利用从数据集MSRA10K中随机选取2000张图像构成训练集训练逻辑斯蒂回归器时获得。
图3给出了更多的实例,说明如下:
从图3可以看出,本发明的检测结果与人工标记的结果最相近。
背景比较简单且显著对象简单的图像,从背景区域到达图像边界所花代价很小,因此根据一环邻域邻接图计算的最短累计路径能够将显著对象高亮;但是,对于背景中包含小尺度对象的图像,只考虑一环邻域时,会将小尺度对象也高亮,例如图3(a)中第一个图,两位老人站在散布有小红花的草地上,由于小红花与其相邻的超像素之间颜色对比度高,因此,到达图像边界的最小累积路径会较大,使得作为背景的小红花会被错误地高亮。而这种背景中含有小尺度对象的图像在自然图像中很常见。
图4是本发明的检测结果与其他方法在数据集ASD上的定量比较,采用的评价指标是平均绝对误差(Mean Absolute Error,MAE),平均绝对误差越小说明与人工标记的结果越相近,通过下式进行计算:
MAE = 1 | S | Σ p ∈ S | S ( p ) - GT ( p ) |
其中S为显著图,GT为人工标记图像,|S|表示显著图中像素的个数,|S(p)|表示像素p处的显著值,GT(p)为像素p处的标签,若像素p属于显著对象,则GT(p)=1,否则GT(p)=0。同图4可以看出,本发明的平均绝对误差最小。

Claims (6)

1.一种利用图像边界信息和区域连通性的显著对象检测方法,其特征在于,包括以下几个步骤:
步骤1:输入待检测的图像;
步骤2:对待检测的图像进行超像素分割,得到超像素集合V={v1,v2,...,vM},并计算每个超像素vi的平均Lab颜色特征向量xi
vi表示第i个超像素,vi∈V,M为超像素的个数;
步骤3:根据超像素的空间拓扑结构及三个不同的邻域范围,对每个超像素创建三个无向加权图,包括一环邻接图、二环邻接图及三环邻接图,分别记为G1、G2和G3
其中,三个无向加权图中的节点为超像素,节点与相邻节点之间形成的边的权重为两相邻节点对应的两平均Lab颜色特征向量之间的距离;
所述三个不同的邻域是指一环邻域、二环邻域及三环邻域;
一环邻域,超像素vi的一环邻域为与其在空间上相邻接的超像素vj的集合,即
二环邻域,超像素vi的二环邻域包括超像素vi的一环邻域中的超像素以及超像素vi的一环邻域中包含的超像素的一环邻域,即
三环邻域,超像素vi的三环邻域包括超像素vi的二环邻域中的超像素以及超像素vi的二环邻域中的超像素的一环邻域,即
步骤4:获取超像素v的显著值s(v),s(v)=s1(v)·s2(v)·s3(v),并将超像素的显著值赋值给超像素中的每一个像素,得到像素级的显著图,完成显著图的检测;
sl(v)表示每个无向加权图中每个节点到无向加权图的边界节点的累积最短路径,以节点的累积最短路径sl(v)作为对应的超像素的第l环的显著值,l={1,2,3};
s l ( v ) = min v 1 = v , v 2 , · · · , v n = B Σ i = 1 n - 1 c ( i ) ( i + 1 ) l s . t . ( v i , v i + 1 ) ∈ E l
其中,B表示虚拟背景节点,边界节点与虚拟背景节点B存在边,边的权重为0;表示在l环邻接图中相邻节点之间的边的权值;El表示l环邻接图中连接边的集合;n表示从起始节点到虚拟背景节点的路径上包含的节点总数。
2.根据权利要求1所述的一种利用图像边界信息和区域连通性的显著对象检测方法,其特征在于,对于每个无向加权图中的每个结点的显著值sl(v),根据其局部上下文信息按照如下公式进行修正,使得具有相似表观的超像素具有相似的显著值
s ^ l ( v ) = λ s l ( v ) + ( 1 - λ ) Σ ( v , v j ) ∈ E l w j · s l ( v j ) Σ ( v , v j ) ∈ E 1 w j
其中,λ为权重因子,取值0.05-0.3;
在满足(v,vj)∈E1,wj表示属于1环邻接图中连接边上结点v与结点vj的表观相似性:σ2是为1环邻接图中相邻超像素特征对比度的方差,相邻超像素特征对比度即为相邻超像素的平均Lab颜色特征向量之间的距离;x和xj分别为结点v与结点vj的平均Lab颜色特征向量。
3.根据权利要求2所述的一种利用图像边界信息和区域连通性的显著对象检测方法,其特征在于,选用逻辑斯蒂回归器替代s(v)=s1(v)·s2(v)·s3(v),获取超像素的显著值,完成显著图的检测,具体过程如下:
根据超像素的三个显著值,生成二次特征项和三次特征项,将一次项,二次项,三次项以及偏差项1串联,得到20维特征向量,将20维的特征向量输入已训练好的逻辑斯蒂回归器中以逻辑斯蒂回归器输出的值作为对应超像素的显著值;
其中,二次特征项和三次特征项分别为 20维的特征向量 f = [ 1 , s ^ 1 , s ^ 2 , s ^ 3 , ( s ^ 1 ) 2 , ( s ^ 2 ) 2 , ( s ^ 3 ) 2 , s ^ 1 · s ^ 2 , s ^ 1 · s ^ 3 , s ^ 2 · s ^ 3 , ( s ^ 1 ) 3 , ( s ^ 2 ) 3 , ( s ^ 3 ) 3 , ( s ^ 1 ) 2 · s ^ 2 , ( s ^ 2 ) 2 · s ^ 1 , ( s ^ 3 ) 2 · s ^ 1 , ( s ^ 3 ) 2 · s ^ 2 , s ^ 1 · s ^ 2 · s ^ 3 ] ;
w是一个20维的权值矩阵,利用训练数据集MSRA10K训练逻辑斯蒂回归器时获得。
4.根据权利要求3所述的一种利用图像边界信息和区域连通性的显著对象检测方法,其特征在于,所述已训练好的逻辑斯蒂回归器的具体训练过程如下:
训练所用的数据集为MSRA10K,该数据集包含10000张彩色图像以及对应的由人工手动标记出了显著对象的标记图像;
步骤1):从MSRA10K数据集中随机选取2000张图像,对于每一张图像,执行步骤1-4,得到每张图像中每个超像素的20维特征向量,记为F=[f1,f2,...fN],N为总的超像素的个数;
步骤2):根据标记图像,如果超像素中一半以上的像素属于被标记的显著对象,则将该超像素标为1,否则标为0,从而得到标签向量L=[l1,l2,...,lN];
步骤3):采用极大似然法估计模型参数,似然函数为:
max w Σ n = 1 N [ l i ( w · f i ) - log ( 1 + exp ( w · f i ) ) ]
求解上述函数得到w,fi表示超像素的20维特征向量中的第i个特征向量。
5.根据权利要求1-4任一项所述的一种利用图像边界信息和区域连通性的显著对象检测方法,其特征在于,所述每个无向加权图中每个节点到无向加权图的边界节点的累积最短路径采用Dijkstra最短路径算法计算。
6.根据权利要求1-4任一项所述的一种利用图像边界信息和区域连通性的显著对象检测方法,其特征在于,所述步骤2中对待检测的图像进行超像素分割采用具有边缘保持的超像素分割方法,其中,边缘特征相对颜色特征的重要性,取值为0.9,超像素的规整性相对颜色特征的重要性,取值0.5,超像素尺度控制因子,取值为3000。
CN201510013897.6A 2015-01-12 2015-01-12 一种利用图像边界信息和区域连通性的显著对象检测方法 Expired - Fee Related CN104537355B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510013897.6A CN104537355B (zh) 2015-01-12 2015-01-12 一种利用图像边界信息和区域连通性的显著对象检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510013897.6A CN104537355B (zh) 2015-01-12 2015-01-12 一种利用图像边界信息和区域连通性的显著对象检测方法

Publications (2)

Publication Number Publication Date
CN104537355A true CN104537355A (zh) 2015-04-22
CN104537355B CN104537355B (zh) 2017-11-24

Family

ID=52852875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510013897.6A Expired - Fee Related CN104537355B (zh) 2015-01-12 2015-01-12 一种利用图像边界信息和区域连通性的显著对象检测方法

Country Status (1)

Country Link
CN (1) CN104537355B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654096A (zh) * 2015-12-24 2016-06-08 大连理工大学 一种基于路径瓶颈分析的显著度检测方法
CN105654475A (zh) * 2015-12-25 2016-06-08 中国人民解放军理工大学 基于可区分边界和加权对比度的图像显著性检测方法及其装置
CN106204615A (zh) * 2016-07-20 2016-12-07 安徽大学 一种基于中心矩形构图先验的显著目标检测方法
CN106780506A (zh) * 2016-11-21 2017-05-31 北京交通大学 一种基于多源路径最短距离的交互式图像分割方法
CN107766857A (zh) * 2017-10-17 2018-03-06 天津大学 基于图模型构建与标签传播的视觉显著性检测算法
CN108027969A (zh) * 2015-09-04 2018-05-11 斯特拉克斯私人有限公司 识别图像中对象之间的间隙的方法和装置
CN108073935A (zh) * 2016-11-18 2018-05-25 北京体基科技有限公司 基于临近像素和连通路径识别手部区域的方法及装置
CN108073878A (zh) * 2016-11-18 2018-05-25 北京体基科技有限公司 基于预定区域和连通路径识别手部区域的方法及装置
CN108073872A (zh) * 2016-11-18 2018-05-25 北京体基科技有限公司 基于像素间相似度的手部区域识别方法及装置
CN108073937A (zh) * 2016-11-18 2018-05-25 北京体基科技有限公司 一种在图像中识别手部区域的方法及装置
CN109447136A (zh) * 2018-10-15 2019-03-08 方玉明 一种对于360度图像的显著性检测方法
WO2024017226A1 (zh) * 2022-07-22 2024-01-25 索尼集团公司 信息处理设备和方法、计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070201747A1 (en) * 2006-02-28 2007-08-30 Sanyo Electric Co., Ltd. Object detection apparatus
CN102262776A (zh) * 2010-05-27 2011-11-30 索尼公司 颜色变换设备、颜色变换方法、和颜色变换程序
CN102637253A (zh) * 2011-12-30 2012-08-15 清华大学 基于视觉显著性和超像素分割的视频前景目标提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070201747A1 (en) * 2006-02-28 2007-08-30 Sanyo Electric Co., Ltd. Object detection apparatus
CN102262776A (zh) * 2010-05-27 2011-11-30 索尼公司 颜色变换设备、颜色变换方法、和颜色变换程序
CN102637253A (zh) * 2011-12-30 2012-08-15 清华大学 基于视觉显著性和超像素分割的视频前景目标提取方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108027969B (zh) * 2015-09-04 2021-11-09 斯特拉克斯私人有限公司 识别图像中对象之间的间隙的方法和装置
CN108027969A (zh) * 2015-09-04 2018-05-11 斯特拉克斯私人有限公司 识别图像中对象之间的间隙的方法和装置
CN105654096A (zh) * 2015-12-24 2016-06-08 大连理工大学 一种基于路径瓶颈分析的显著度检测方法
CN105654096B (zh) * 2015-12-24 2018-08-21 大连理工大学 一种基于路径瓶颈分析的显著度检测方法
CN105654475A (zh) * 2015-12-25 2016-06-08 中国人民解放军理工大学 基于可区分边界和加权对比度的图像显著性检测方法及其装置
CN105654475B (zh) * 2015-12-25 2018-07-06 中国人民解放军理工大学 基于可区分边界和加权对比度的图像显著性检测方法及其装置
CN106204615A (zh) * 2016-07-20 2016-12-07 安徽大学 一种基于中心矩形构图先验的显著目标检测方法
CN106204615B (zh) * 2016-07-20 2019-02-22 安徽大学 一种基于中心矩形构图先验的显著目标检测方法
CN108073872A (zh) * 2016-11-18 2018-05-25 北京体基科技有限公司 基于像素间相似度的手部区域识别方法及装置
CN108073937A (zh) * 2016-11-18 2018-05-25 北京体基科技有限公司 一种在图像中识别手部区域的方法及装置
CN108073878A (zh) * 2016-11-18 2018-05-25 北京体基科技有限公司 基于预定区域和连通路径识别手部区域的方法及装置
CN108073935A (zh) * 2016-11-18 2018-05-25 北京体基科技有限公司 基于临近像素和连通路径识别手部区域的方法及装置
CN106780506A (zh) * 2016-11-21 2017-05-31 北京交通大学 一种基于多源路径最短距离的交互式图像分割方法
CN107766857A (zh) * 2017-10-17 2018-03-06 天津大学 基于图模型构建与标签传播的视觉显著性检测算法
CN109447136A (zh) * 2018-10-15 2019-03-08 方玉明 一种对于360度图像的显著性检测方法
WO2024017226A1 (zh) * 2022-07-22 2024-01-25 索尼集团公司 信息处理设备和方法、计算机可读存储介质

Also Published As

Publication number Publication date
CN104537355B (zh) 2017-11-24

Similar Documents

Publication Publication Date Title
CN104537355A (zh) 一种利用图像边界信息和区域连通性的显著对象检测方法
Wei et al. Toward automatic building footprint delineation from aerial images using CNN and regularization
CN108596974B (zh) 动态场景机器人定位建图系统及方法
JP6631179B2 (ja) 前景画像分割方法及び装置、プログラム、並びに記録媒体
CN104346370B (zh) 图像搜索、获取图像文本信息的方法及装置
CN112084869B (zh) 一种基于紧致四边形表示的建筑物目标检测方法
CN106951830B (zh) 一种基于先验条件约束的图像场景多对象标记方法
Idrees et al. Tracking in dense crowds using prominence and neighborhood motion concurrence
CN111882586B (zh) 一种面向剧场环境的多演员目标跟踪方法
CN104463865A (zh) 一种人像分割方法
CN104463870A (zh) 一种图像显著区域检测方法
CN104517095B (zh) 一种基于深度图像的人头分割方法
CN109063549B (zh) 基于深度神经网络的高分辨率航拍视频运动目标检测方法
CN102609723B (zh) 一种基于图像分类的全自动视频分割方法及装置
CN108022244B (zh) 一种基于前景和背景种子用于显著目标检测的超图优化方法
CN106997478B (zh) 基于显著中心先验的rgb-d图像显著目标检测方法
CN114399644A (zh) 一种基于小样本目标检测方法及装置
CN109492576A (zh) 图像识别方法、装置及电子设备
CN104766065A (zh) 基于多视角学习的鲁棒性前景检测方法
KR20160075738A (ko) 얼굴 인식 시스템 및 방법
CN111814754A (zh) 面向夜间场景的单帧图像行人检测方法和装置
Liu et al. Cbl: A clothing brand logo dataset and a new method for clothing brand recognition
CN113177470A (zh) 行人轨迹预测方法、装置、设备及存储介质
CN114170570A (zh) 一种适用于拥挤场景下的行人检测方法及系统
CN107948586A (zh) 基于视频拼接的跨区域运动目标检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171124

Termination date: 20190112

CF01 Termination of patent right due to non-payment of annual fee