CN103984953A - 基于多特征融合与Boosting决策森林的街景图像的语义分割方法 - Google Patents

基于多特征融合与Boosting决策森林的街景图像的语义分割方法 Download PDF

Info

Publication number
CN103984953A
CN103984953A CN201410164575.7A CN201410164575A CN103984953A CN 103984953 A CN103984953 A CN 103984953A CN 201410164575 A CN201410164575 A CN 201410164575A CN 103984953 A CN103984953 A CN 103984953A
Authority
CN
China
Prior art keywords
feature
image
pixels
training
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410164575.7A
Other languages
English (en)
Other versions
CN103984953B (zh
Inventor
王慧燕
付建海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Gongshang University
Original Assignee
Zhejiang Gongshang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Gongshang University filed Critical Zhejiang Gongshang University
Priority to CN201410164575.7A priority Critical patent/CN103984953B/zh
Publication of CN103984953A publication Critical patent/CN103984953A/zh
Application granted granted Critical
Publication of CN103984953B publication Critical patent/CN103984953B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种基于多特征融合与Boosting决策森林的街景图像的语义分割方法,包括如下步骤:步骤1,对图像进行超像素分割;步骤2,多特征提取;步骤3,特征融合;步骤4,训练学习以及分类识别;本发明将2D特征和3D特征有效的融合在一起,显著的提高了目标的识别率,与现有技术相比,分割结果一致,连通性好,边缘定位准确,引入了Boosting决策森林分类机制,保证了目标分类的稳定性。

Description

基于多特征融合与Boosting决策森林的街景图像的语义分割方法
技术领域
本发明属于图像处理技术领域,尤其涉及一种基于多特征融合与Boosting决策森林的街景图像语义分割方法。
背景技术
图像分割是将图像划分成多个具有相似特征区域的技术与过程,是图像处理中的重要问题。这里的特征可以是像素的灰度、颜色、纹理等,且预定义的目标可以是单个区域,也可以对应多个区域。图像分割不仅是目标表达的基础,对特征质量有着重要的影响,并且可以将原始图像转化为更加抽象的形式,使得更高层次的图像分析和理解成为可能。计算机视觉中的图像理解,如目标检测、目标特征提取和目标识别等,都依赖于图像分割的质量。图像处理强调在图像之间进行变换以改善图像的视觉效果。目前的图像分割算法大多是针对某一类图像进行的,且图像场景比较简单,包含的对象类别较少;同时,一般的图像分割算法对图像的亮度、缩放等信息比较敏感,所以可能会造成误分割。因此,把图像分割和图像的识别与理解结合起来,在保证图像处理效果的同时提高图像处理的效率,将具有非常重要的研究意义。但是目前基于视觉特征的分割算法得到的分割区域间没有清晰的边缘,而且对于不同的场景效果差异较大。在图像分割和识别中,若仅使用局部区域的视觉特征来表示目标对象,进行语义标注,则会产生二义性;或者仅仅使用2D特征或者3D特征也都无法得到理想的效果;目前一般都以像素为单位实现目标的识别,为一张图片中的每个像素赋予一个类别的标签。当分类结果为多类识别时,图片中相同类别标签的像素形成若干的连续区域,实现图像的语义分割。由于需要对每个像素进行判定,像素级别的目标识别算法也将会产生庞大的数据运算量,同时相邻像素的邻域大部分是重叠的,因此提取的特征也比较相似,最终的类别判定结果相差也不大,但是在计算过程中包含了大量的冗余数据,大大增加了计算量。在机器学习中当训练数据量很大的时候,处理效率和正确率得不到平衡,为此需要改进当前的分类器,使得准确率提高的情况下稳定性增强,并且消耗的时间不是太大。
发明内容
本发明针对现有技术的不足,提供了一种基于多特征融合与Boosting决策森林的街景图像语义分割方法。
基于多特征融合与Boosting决策森林的街景图像的语义分割方法,其特征在于该方法包括以下步骤:
步骤1,对图像进行超像素分割;针对街景图像所包含的对象比较复杂的特点,采用简单线性迭代聚类SILC(simple linear iterative clustering)对图像进行超像素分割;简单线性迭代聚类是对3维的CIELAB颜色空间L、a、b和2维的位置信息特征进行操作,采用了新的距离衡量方法,通过调节参数来控制超像素块的数目;无论在计算复杂度、控制超像素的尺寸和个数来看,简单线性迭代聚类在现有方法中表现都是很好的。
简单线性迭代聚类采用新的距离衡量D,表示如下:
d lab = ( l k - l i ) 2 + ( a k - a i ) 2 + ( b k - b i ) 2
d xy = ( x k - x i ) 2 + ( y k - y i ) 2 - - - ( 1 )
D s = d lab + m s d xy
其中k和i分别为两个像素,Ds表示lab距离和以网格距离归一化的xy空间的距离综合。变量m是一个常数,控制超像素的紧凑程度,可以调节超像素块的大小,当m的值越大时,则空间像素度的权重越大,我们这里选择m=10,图像分割的超像素数为1000块左右。
图形的梯度公式计算如下:
G(x,y)=||I(x+1,y)-I(x-1,y)||2+||I(x,y+1)-I(x,y-1)||2    (2)
其中I(x,y)表示Lab向量对应的像素点的位置,而||.||表示2范数,这样可以同时考虑亮度和位置信息。
s = N K - - - ( 3 )
其中S是步长,N为图像的像素总数,K是分割的超像素个数。简单线性迭代聚类的具体处理步骤:
1.1初始化聚类中心。按照步长S采用像素来初始化话聚类中心,在图像中均匀分布聚类中心;
1.2将聚类中心移动到邻域内梯度最小的地方,这样可以防止聚类中心落在边界上;
1.3在每个聚类中心2S*2S范围内,根据距离公式对像素进行K-means聚类,得到最新的聚类中心;
1.4计算新的聚类中心与旧的聚类中心之间的L1范数距离E;
1.5进行迭代运算,直到E小于一个很小的阈值,结束运算;
步骤2,多特征提取;特征是用来描述图像的最基本的属性,在图像分割和识别应用中,仅仅利用2D或者3D特征对目标对象进行标注时,可能会出现二义性,为了克服这种确定,采用多种有效特征综合起来联合强化框架;
2.1提取超像素块中物体距离地面的高度特征;
对于每一块超像素,计算超像素块中物体距离地面的高度,可以采用超像素块中的所有点到地面的距离之和的平均值;
2.2提取曲面法向量特征;
利用最小二乘法对超像素拟合一个平面,然后求其法向量。其x轴分量、y轴分量和z轴分量分别作为一维向量特征;
2.3提取超像素块中物体相对于摄像头的高度;
设在3D坐标系中的y坐标轴的方向是向上的,则现实世界中的一点w相对于摄像机的高度fH可如下表示:
fH(w)=wy-cy    (4)
fH是相对于摄像头的高度,w(x,y,z)是现实世界中的一点的3D坐标,c(x,y,z)是摄像机的3D坐标。
2.4提取3D像素块到摄像头的距离特征;
我们可以充分利用物体到摄像头的距离,来划分物体。通过计算超像素块中心到摄像头的最近距离,这个最近距离作为3D像素块到摄像头的距离;
2.5提取3D像素块的不平整度特征;
3D像素块的不平整度,以3D点到拟合平面的距离之和为度量值;
2.6提取颜色直方图特征。由于HSV空间更加接近于人们对颜色的主观认识,故在目标的HSV空间上提取目标的颜色直方图特征;对于被给定的目标0,它在t时刻的HSV颜色直方图特征可以表示为:
c t o = { y 1 , y 2 , . . . y 256 } - - - ( 5 )
其中yi表示HSV每一级别的值;
2.7提取深度直方图特征;
利用已获得的图像的深度图,分成若干个bin,提取出深度直方图,并且均衡化处理。
2.8提取基于灰度直方图的纹理特征;
基于灰度直方图的统计矩的纹理特征描述与提取方法是一种纹理统计方法。该方法可以定量的描述区域的平滑、粗糙、规则性等纹理特征。
设r为表示图像灰度级的随机变量;L为图像的灰度级数;p(ri)为对应的直方图(其中i=0,1,2,...,L-1);则r的均值m表示为:
m = Σ i = 0 L - 1 r i p ( r i ) - - - ( 6 )
r关于均值m的n阶矩阵表示为:
μ n ( r ) = Σ i = 0 L - 1 ( r i - m ) n p ( r i ) - - - ( 7 )
通过计算9式可知μ0=1,μ1=0;对于其他n阶矩阵:
(2.8.1)二阶矩阵μ2又称为方差,它是灰度级对比度的量度。利用二矩阵可以得到有关平滑度的描述因子,其计算公式为:
R = 1 - 1 1 + μ 2 = 1 - 1 1 + σ 2 - - - ( 8 )
由8式子可知,图像的纹理越平滑,对应的图像灰度起伏越小,图像的二阶矩越小,求得的R值越小;反之,图像的纹理越粗糙,对应的图像灰度起伏越大,图像的二阶矩越大,所求得的R值越大,其中σ为灰度直方图二阶矩阵的标准差。
(2.8.2)三阶矩μ3是图像直方图偏斜度的度量,可以用来确定直方图的对称性;
(2.8.3)四阶矩μ4可以表示直方图的相对平整度;五阶以上的矩和直方图形的联系度不大;
步骤3,特征融合;首先使用简单连续特征融合策略将上述多种特征结合;然后使用核PCA算法从融合的特征集中提取出非线性特征,从而将融合的特征集降到一定的维数;具体步骤为:
3.1对于一个被给定的目标O,它在t时刻利用连续特征融合策略获得的融合特征向量表示为:
F t o = ( V t o , C t o ) - - - ( 9 )
是在t时刻目标O的融合特征,是在t时刻目标O的颜色直方图特征,是除颜色直方图外的其它特征。
3.2将特征向量映射到一个高维的特征空间K(Fto),然后在K(Ft o)上实施PCA算法,从而获得最终的非线性特征在特征映射到高维空间过程中,使用了高斯核函数;
步骤4,训练学习以及分类识别;
通过改进决策森林,我们提出了Boosting决策森林,它既有随机森林的长处又兼有Boosting的优点,把单棵随机森林的分类问题转换多棵随机森林全局损耗函数能量最小化问题;在训练的过程中,为每个训练样本分配适当的权重,总是分类正确的样本权值低,分类错误的样本权值高,最终聚合多次训练的弱分类器(也就是针对同一个训练集训练不同的分类器)。将最终提取的融合非线性特征送入Boosting决策森林中进行训练学习,然后对街景目标进行分类识别,并且标注对应的标签,最终完成对图像的语义分割。
Boosting决策森林的训练步骤:
需要数据:设置训练标签训练树的最大层数Dmax,损耗函数选择为正切函数,d是训练树的当前层数(其中d=1,2,...,Dmax)。
输出:由若干个弱分类器构成最终的分类器G(x)
(4.1)初始化权重和根节点。
(4.2)检查所有节点是否符合停止分裂的条件,如果符合就停止分裂。
分裂函数s(x;Θ)有两类参数组成,Θ1是特征维数且Θ1∈{1,...,M}Θ2是一个阈值且Θ2∈□;如果x(Θ1)<Θ2则s(x;Θ)=0,其它情况下s(x;Θ)=1,x是训练样本。
(4.3)如果不符合就分裂节点,并且更新权重为下一次迭代做准备,权重公式如下。
w i t = | &PartialD; l ( y i , F 1 : t - 1 ( x i ; &Theta; &OverBar; ) ) &PartialD; F ( x ) |
其中xi是训练样本,t是迭代次数,l(□)是一个可微分的损耗函数,
是已经训练好的分类器,fj(x;Θj)是在第j次迭代下的分类器,是已收集的弱分类器参数,Θj是在当前迭代层j下的训练参数,ν是收缩因子。
(4.4)重复步骤4.2和4.3,直到d达到Dmax层。
分类识别:通过有监督式学习训练Boosting决策森林,输入要标注的图像,预测出类别,并输出完成标注的图像。
Boosting决策森林既有随机森林的长处又兼有Boosting的优点,把单棵随机森林的分类问题转换多棵随机森林全局损耗函数能量最小化问题。在训练的过程中,为每个训练样本分配适当的权重,总是分类正确的样本权值低,分类错误的样本权值高,最终聚合得到一个强分类器。将最终提取的融合非线性特征送入Boosting决策森林中进行训练学习,然后对街景目标进行分类识别,并且标注对应的标签,最终完成对图像的语义分割。
本发明的有益效果:该发明由于融合了目标的多种特征,显著提高了目标的识别率。该融合特征有效的结合了局部特征和全局特征,对提高目标识别效率有很好的效果。该发明对简单连续融合后的特征进行了核PCA降维,有效降低了融合后的特征维数,避免了维数灾难,缩短了目标的识别时间,并且提取出了融合特征中的非线性特征从而消除了因降维而造成的识别率下降。该发明还通过引入Boosting决策森林,该分类器对目标特征分类的稳定性大大增强,较好的实现了多目标识别的街景的语义分割问题。
附图说明
图1是本发明的流程图
具体实施方式
本发明方法包括目标的超像素分割和目标特征的表示及目标识别三个部分。我们将超像素块作为处理的基本单位,将多种有效特征融合,并通过PCA降维,提取出非线性特征作为训练模型,然后使用该融合特征作为改进的随机森林分类器的输入特征,进行有监督训练学习,最终实现对目标的分类识别,同时进行语义标注。
基于多特征融合与Boosting决策森林的街景图像的语义分割方法,其特征在于该方法包括以下步骤:
步骤1,对图像进行超像素分割;针对街景图像所包含的对象比较复杂的特点,采用简单线性迭代聚类SILC(simple linear iterative clustering)对图像进行超像素分割;简单线性迭代聚类是对3维的CIELAB颜色空间L、a、b和2维的位置信息特征进行操作,采用了新的距离衡量方法,通过调节参数来控制超像素块的数目;无论在计算复杂度、控制超像素的尺寸和个数来看,简单线性迭代聚类在现有方法中表现都是很好的。
简单线性迭代聚类采用新的距离衡量D,表示如下:
d lab = ( l k - l i ) 2 + ( a k - a i ) 2 + ( b k - b i ) 2
d xy = ( x k - x i ) 2 + ( y k - y i ) 2 - - - ( 1 )
D s = d lab + m s d xy
其中k和i分别为两个像素,Ds表示lab距离和以网格距离归一化的xy空间的距离综合。变量m是一个常数,控制超像素的紧凑程度,可以调节超像素块的大小,当m的值越大时,则空间像素度的权重越大,我们这里选择m=10,图像分割的超像素数为1000块左右。
图形的梯度公式计算如下:
G(x,y)=||I(x+1,y)-I(x-1,y)||2+||I(x,y+1)-I(x,y-1)||2    (2)
其中I(x,y)表示Lab向量对应的像素点的位置,而||.||表示2范数,这样可以同时考虑亮度和位置信息。
s = N K - - - ( 3 )
其中S是步长,N为图像的像素总数,K是分割的超像素个数。
简单线性迭代聚类的具体处理步骤:
1.1初始化聚类中心。按照步长S采用像素来初始化话聚类中心,在图像中均匀分布聚类中心;
1.2将聚类中心移动到邻域内梯度最小的地方,这样可以防止聚类中心落在边界上;
1.3在每个聚类中心2S*2S范围内,根据距离公式对像素进行K-means聚类,得到最新的聚类中心;
1.4计算新的聚类中心与旧的聚类中心之间的L1范数距离E;
1.5进行迭代运算,直到E小于一个很小的阈值,结束运算;
步骤2,多特征提取;特征是用来描述图像的最基本的属性,在图像分割和识别应用中,仅仅利用2D或者3D特征对目标对象进行标注时,可能会出现二义性,为了克服这种确定,采用多种有效特征综合起来联合强化框架;
2.1提取超像素块中物体距离地面的高度特征;
对于每一块超像素,计算超像素块中物体距离地面的高度,可以采用超像素块中的所有点到地面的距离之和的平均值;
2.2提取曲面法向量特征;
利用最小二乘法对超像素拟合一个平面,然后求其法向量。其x轴分量、y轴分量和z轴分量分别作为一维向量特征;2.3提取超像素块中物体相对于摄像头的高度;
设在3D坐标系中的y坐标轴的方向是向上的,则现实世界中的一点w相对于摄像机的高度fH可如下表示:
fH(w)=wy-cy    (4)
fH是相对于摄像头的高度,w(x,y,z)是现实世界中的一点的3D坐标,c(x,y,z)是摄像机的3D坐标。
2.4提取3D像素块到摄像头的距离特征;
我们可以充分利用物体到摄像头的距离,来划分物体。通过计算超像素块中心到摄像头的最近距离,这个最近距离作为3D像素块到摄像头的距离;
2.5提取3D像素块的不平整度特征;
3D像素块的不平整度,以3D点到拟合平面的距离之和为度量值;
2.6提取颜色直方图特征。由于HSV空间更加接近于人们对颜色的主观认识,故在目标的HSV空间上提取目标的颜色直方图特征;对于被给定的目标0,它在t时刻的HSV颜色直方图特征可以表示为:
c t o = { y 1 , y 2 , . . . y 256 } - - - ( 5 )
其中yi表示HSV每一级别的值;
2.7提取深度直方图特征;
利用已获得的图像的深度图,分成若干个bin,提取出深度直方图,并且均衡化处理。
2.8提取基于灰度直方图的纹理特征;
基于灰度直方图的统计矩的纹理特征描述与提取方法是一种纹理统计方法。该方法可以定量的描述区域的平滑、粗糙、规则性等纹理特征。
设r为表示图像灰度级的随机变量;L为图像的灰度级数;p(ri)为对应的直方图(其中i=0,1,2,...,L-1);则r的均值m表示为:
m = &Sigma; i = 0 L - 1 r i p ( r i ) - - - ( 6 )
r关于均值m的n阶矩阵表示为:
&mu; n ( r ) = &Sigma; i = 0 L - 1 ( r i - m ) n p ( r i ) - - - ( 7 )
通过计算9式可知μ0=1,μ1=0;对于其他n阶矩阵:
(2.8.1)二阶矩阵μ2又称为方差,它是灰度级对比度的量度。利用二矩阵可以得到有关平滑度的描述因子,其计算公式为:
R = 1 - 1 1 + &mu; 2 = 1 - 1 1 + &sigma; 2 - - - ( 8 )
由8式子可知,图像的纹理越平滑,对应的图像灰度起伏越小,图像的二阶矩越小,求得的R值越小;反之,图像的纹理越粗糙,对应的图像灰度起伏越大,图像的二阶矩越大,所求得的R值越大,其中σ为灰度直方图二阶矩阵的标准差。
(2.8.2)三阶矩μ3是图像直方图偏斜度的度量,可以用来确定直方图的对称性;
(2.8.3)四阶矩μ4可以表示直方图的相对平整度;五阶以上的矩和直方图形的联系度不大;
步骤3,特征融合;首先使用简单连续特征融合策略将上述多种特征结合;然后使用核PCA算法从融合的特征集中提取出非线性特征,从而将融合的特征集降到一定的维数;具体步骤为:
3.1对于一个被给定的目标O,它在t时刻利用连续特征融合策略获得的融合特征向量表示为:
F t o = ( V t o , C t o ) - - - ( 9 )
是在t时刻目标O的融合特征,是在t时刻目标O的颜色直方图特征,是除颜色直方图外的其它特征。
3.2将特征向量映射到一个高维的特征空间K(Ft o),然后在K(Ft o)上实施PCA算法,从而获得最终的非线性特征在特征映射到高维空间过程中,使用了高斯核函数;
步骤4,训练学习以及分类识别;
通过改进决策森林,我们提出了Boosting决策森林,它既有随机森林的长处又兼有Boosting的优点,把单棵随机森林的分类问题转换多棵随机森林全局损耗函数能量最小化问题;在训练的过程中,为每个训练样本分配适当的权重,总是分类正确的样本权值低,分类错误的样本权值高,最终聚合多次训练的弱分类器(也就是针对同一个训练集训练不同的分类器)。将最终提取的融合非线性特征送入Boosting决策森林中进行训练学习,然后对街景目标进行分类识别,并且标注对应的标签,最终完成对图像的语义分割。
Boosting决策森林的训练步骤:
需要数据:设置训练标签训练树的最大层数Dmax,损耗函数选择为正切函数,d是训练树的当前层数(其中d=1,2,...,Dmax)。
输出:由若干个弱分类器构成最终的分类器G(x)
(4.1)初始化权重和根节点。
(4.2)检查所有节点是否符合停止分裂的条件,如果符合就停止分裂。
分裂函数s(x;Θ)有两类参数组成,Θ1是特征维数且Θ1∈{1,...,M}Θ2是一个阈值且Θ2∈□;如果x(Θ1)<Θ2则s(x;Θ)=0,其它情况下s(x;Θ)=1,x是训练样本。
(4.3)如果不符合就分裂节点,并且更新权重为下一次迭代做准备,权重公式如下。
w i t = | &PartialD; l ( y i , F 1 : t - 1 ( x i ; &Theta; &OverBar; ) ) &PartialD; F ( x ) |
其中xi是训练样本,t是迭代次数,l(□)是一个可微分的损耗函数,
是已经训练好的分类器,fj(x;Θj)是在第j次迭代下的分类器,是已收集的弱分类器参数,Θj是在当前迭代层j下的训练参数,ν是收缩因子。
(4.4)重复步骤4.2和4.3,直到d达到Dmax层。
分类识别:通过有监督式学习训练Boosting决策森林,输入要标注的图像,预测出类别,并输出完成标注的图像。

Claims (1)

1.基于多特征融合与Boosting决策森林的街景图像的语义分割方法,其特征在于该方法包括以下步骤:
步骤1,对图像进行超像素分割;针对街景图像所包含的对象比较复杂的特点,采用简单线性迭代聚类SILC(simple linear iterative clustering)对图像进行超像素分割;简单线性迭代聚类是对3维的CIELAB颜色空间L、a、b和2维的位置信息特征进行操作,采用了新的距离衡量方法,通过调节参数来控制超像素块的数目;无论在计算复杂度、控制超像素的尺寸和个数来看,简单线性迭代聚类在现有方法中表现都是很好的。
简单线性迭代聚类采用新的距离衡量D,表示如下:
d lab = ( l k - l i ) 2 + ( a k - a i ) 2 + ( b k - b i ) 2
d xy = ( x k - x i ) 2 + ( y k - y i ) 2 - - - ( 1 )
D s = d lab + m s d xy
其中k和i分别为两个像素,Ds表示lab距离和以网格距离归一化的xy空间的距离综合。变量m是一个常数,控制超像素的紧凑程度,可以调节超像素块的大小,当m的值越大时,则空间像素度的权重越大,我们这里选择m=10,图像分割的超像素数为1000块左右。
图形的梯度公式计算如下:
G(x,y)=||I(x+1,y)-I(x-1,y)||2+||I(x,y+1)-I(x,y-1)||2    (2)
其中I(x,y)表示Lab向量对应的像素点的位置,而||.||表示2范数,这样可以同时考虑亮度和位置信息。
s = N K - - - ( 3 )
其中S是步长,N为图像的像素总数,K是分割的超像素个数。
简单线性迭代聚类的具体处理步骤:
1.1初始化聚类中心。按照步长S采用像素来初始化话聚类中心,在图像中均匀分布聚类中心;
1.2将聚类中心移动到邻域内梯度最小的地方,这样可以防止聚类中心落在边界上;
1.3在每个聚类中心2S*2S范围内,根据距离公式对像素进行K-means聚类,得到最新的聚类中心;
1.4计算新的聚类中心与旧的聚类中心之间的L1范数距离E;
1.5进行迭代运算,直到E小于一个很小的阈值,结束运算;
步骤2,多特征提取;特征是用来描述图像的最基本的属性,在图像分割和识别应用中,仅仅利用2D或者3D特征对目标对象进行标注时,可能会出现二义性,为了克服这种确定,采用多种有效特征综合起来联合强化框架;
2.1提取超像素块中物体距离地面的高度特征;
对于每一块超像素,计算超像素块中物体距离地面的高度,可以采用超像素块中的所有点到地面的距离之和的平均值;
2.2提取曲面法向量特征;
利用最小二乘法对超像素拟合一个平面,然后求其法向量。其x轴分量、y轴分量和z轴分量分别作为一维向量特征;
2.3提取超像素块中物体相对于摄像头的高度;
设在3D坐标系中的y坐标轴的方向是向上的,则现实世界中的一点w相对于摄像机的高度fH可如下表示:
fH(w)=wy-cy    (4)
fH是相对于摄像头的高度,w(x,y,z)是现实世界中的一点的3D坐标,c(x,y,z)是摄像机的3D坐标。
2.4提取3D像素块到摄像头的距离特征;
我们可以充分利用物体到摄像头的距离,来划分物体。通过计算超像素块中心到摄像头的最近距离,这个最近距离作为3D像素块到摄像头的距离;
2.5提取3D像素块的不平整度特征;
3D像素块的不平整度,以3D点到拟合平面的距离之和为度量值;
2.6提取颜色直方图特征。由于HSV空间更加接近于人们对颜色的主观认识,故在目标的HSV空间上提取目标的颜色直方图特征;对于被给定的目标0,它在t时刻的HSV颜色直方图特征可以表示为:
c t o = { y 1 , y 2 , . . . y 256 } - - - ( 5 )
其中yi表示HSV每一级别的值;
2.7提取深度直方图特征;
利用已获得的图像的深度图,分成若干个bin,提取出深度直方图,并且均衡化处理。
2.8提取基于灰度直方图的纹理特征;
基于灰度直方图的统计矩的纹理特征描述与提取方法是一种纹理统计方法。该方法可以定量的描述区域的平滑、粗糙、规则性等纹理特征。
设r为表示图像灰度级的随机变量;L为图像的灰度级数;p(ri)为对应的直方图(其中i=0,1,2,...,L-1);则r的均值m表示为:
m = &Sigma; i = 0 L - 1 r i p ( r i ) - - - ( 6 )
r关于均值m的n阶矩阵表示为:
&mu; n ( r ) = &Sigma; i = 0 L - 1 ( r i - m ) n p ( r i ) - - - ( 7 )
通过计算9式可知μ0=1,μ1=0;对于其他n阶矩阵:
(2.8.1)二阶矩阵μ2又称为方差,它是灰度级对比度的量度。利用二矩阵可以得到有关平滑度的描述因子,其计算公式为:
R = 1 - 1 1 + &mu; 2 = 1 - 1 1 + &sigma; 2 - - - ( 8 )
由8式子可知,图像的纹理越平滑,对应的图像灰度起伏越小,图像的二阶矩越小,求得的R值越小;反之,图像的纹理越粗糙,对应的图像灰度起伏越大,图像的二阶矩越大,所求得的R值越大,其中σ为灰度直方图二阶矩阵的标准差。
(2.8.2)三阶矩μ3是图像直方图偏斜度的度量,可以用来确定直方图的对称性;
(2.8.3)四阶矩μ4可以表示直方图的相对平整度;五阶以上的矩和直方图形的联系度不大;
步骤3,特征融合;首先使用简单连续特征融合策略将上述多种特征结合;然后使用核PCA算法从融合的特征集中提取出非线性特征,从而将融合的特征集降到一定的维数;具体步骤为:
3.1对于一个被给定的目标O,它在t时刻利用连续特征融合策略获得的融合特征向量表示为:
F t o = ( V t o , C t o ) - - - ( 9 )
是在t时刻目标O的融合特征,是在t时刻目标O的颜色直方图特征,是除颜色直方图外的其它特征。
3.2将特征向量映射到一个高维的特征空间K(Ft o),然后在K(Ft o)上实施PCA算法,从而获得最终的非线性特征在特征映射到高维空间过程中,使用了高斯核函数;
步骤4,训练学习以及分类识别;
通过改进决策森林,我们提出了Boosting决策森林,它既有随机森林的长处又兼有Boosting的优点,把单棵随机森林的分类问题转换多棵随机森林全局损耗函数能量最小化问题;在训练的过程中,为每个训练样本分配适当的权重,总是分类正确的样本权值低,分类错误的样本权值高,最终聚合多次训练的弱分类器(也就是针对同一个训练集训练不同的分类器)。将最终提取的融合非线性特征送入Boosting决策森林中进行训练学习,然后对街景目标进行分类识别,并且标注对应的标签,最终完成对图像的语义分割。
Boosting决策森林的训练步骤:
需要数据:设置训练标签训练树的最大层数Dmax,损耗函数选择为正切函数,d是训练树的当前层数(其中d=1,2,...,Dmax)。
输出:由若干个弱分类器构成最终的分类器G(x)
(4.1)初始化权重和根节点。
(4.2)检查所有节点是否符合停止分裂的条件,如果符合就停止分裂。
分裂函数s(x;Θ)有两类参数组成,Θ1是特征维数且Θ1∈{1,...,M}Θ2是一个阈值且Θ2∈□;如果x(Θ1)<Θ2则s(x;Θ)=0,其它情况下s(x;Θ)=1,x是训练样本。
(4.3)如果不符合就分裂节点,并且更新权重为下一次迭代做准备,权重公式如下。
w i t = | &PartialD; l ( y i , F 1 : t - 1 ( x i ; &Theta; &OverBar; ) ) &PartialD; F ( x ) |
其中xi是训练样本,t是迭代次数,l(□)是一个可微分的损耗函数,
是已经训练好的分类器,fj(x;Θj)是在第j次迭代下的分类器,是已收集的弱分类器参数,Θj是在当前迭代层j下的训练参数,ν是收缩因子。
(4.4)重复步骤4.2和4.3,直到d达到Dmax层。
分类识别:通过有监督式学习训练Boosting决策森林,输入要标注的图像,预测出类别,并输出完成标注的图像。
CN201410164575.7A 2014-04-23 2014-04-23 基于多特征融合与Boosting决策森林的街景图像的语义分割方法 Expired - Fee Related CN103984953B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410164575.7A CN103984953B (zh) 2014-04-23 2014-04-23 基于多特征融合与Boosting决策森林的街景图像的语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410164575.7A CN103984953B (zh) 2014-04-23 2014-04-23 基于多特征融合与Boosting决策森林的街景图像的语义分割方法

Publications (2)

Publication Number Publication Date
CN103984953A true CN103984953A (zh) 2014-08-13
CN103984953B CN103984953B (zh) 2017-06-06

Family

ID=51276915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410164575.7A Expired - Fee Related CN103984953B (zh) 2014-04-23 2014-04-23 基于多特征融合与Boosting决策森林的街景图像的语义分割方法

Country Status (1)

Country Link
CN (1) CN103984953B (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104299233A (zh) * 2014-09-30 2015-01-21 杭州电子科技大学 基于超像素块的蜂群和灰色关联算法的sar图像分割方法
CN105260723A (zh) * 2015-10-22 2016-01-20 四川膨旭科技有限公司 车辆行驶过程中对车辆进行识别的系统
CN105389584A (zh) * 2015-10-13 2016-03-09 西北工业大学 基于卷积神经网络与语义转移联合模型的街景语义标注方法
CN106023212A (zh) * 2016-05-24 2016-10-12 西安电子科技大学 一种基于金字塔逐层传播聚类的超像素分割方法
CN106384131A (zh) * 2016-10-09 2017-02-08 深圳云天励飞技术有限公司 基于相异性的特征融合识别方法
CN106991676A (zh) * 2017-04-06 2017-07-28 哈尔滨理工大学 一种局部相关的超像素融合方法
CN107423339A (zh) * 2017-04-29 2017-12-01 天津大学 基于极端梯度推进和随机森林的热门微博预测方法
CN107527054A (zh) * 2017-09-19 2017-12-29 西安电子科技大学 基于多视角融合的前景自动提取方法
CN107624193A (zh) * 2015-04-29 2018-01-23 西门子公司 腹腔镜和内窥镜2d/2.5d图像数据中语义分割的方法和系统
CN107636678A (zh) * 2015-06-29 2018-01-26 北京市商汤科技开发有限公司 用于预测图像样本的属性的方法和设备
CN107633522A (zh) * 2017-08-30 2018-01-26 山东财经大学 基于局部相似性活动轮廓模型的脑部图像分割方法和系统
CN107766794A (zh) * 2017-09-22 2018-03-06 天津大学 一种特征融合系数可学习的图像语义分割方法
CN107886512A (zh) * 2016-09-29 2018-04-06 法乐第(北京)网络科技有限公司 一种确定训练样本的方法
CN107886513A (zh) * 2016-09-29 2018-04-06 法乐第(北京)网络科技有限公司 一种确定训练样本的装置
CN108292366A (zh) * 2015-09-10 2018-07-17 美基蒂克艾尔有限公司 在内窥镜手术中检测可疑组织区域的系统和方法
CN108399430A (zh) * 2018-02-28 2018-08-14 电子科技大学 一种基于超像素和随机森林的sar图像舰船目标检测方法
CN108694225A (zh) * 2017-03-31 2018-10-23 阿里巴巴集团控股有限公司 一种图像搜索方法、特征向量的生成方法、装置及电子设备
CN108921054A (zh) * 2018-06-15 2018-11-30 华中科技大学 一种基于语义分割的行人多属性识别方法
CN109344618A (zh) * 2018-02-08 2019-02-15 中国人民解放军陆军炮兵防空兵学院郑州校区 一种基于深度森林的恶意代码分类方法
CN109416763A (zh) * 2016-07-01 2019-03-01 英特尔公司 对抗性环境中的机器学习
CN109934147A (zh) * 2019-03-05 2019-06-25 北京联合大学 基于深度神经网络的目标检测方法、系统及装置
CN110163033A (zh) * 2018-02-13 2019-08-23 京东方科技集团股份有限公司 正样本获取方法、行人检测模型生成方法和行人检测方法
CN110222644A (zh) * 2019-06-10 2019-09-10 哈尔滨理工大学 基于图像分割的森林火灾烟雾检测方法
CN110866547A (zh) * 2019-10-31 2020-03-06 浙江中医药大学 基于多特征和随机森林的中药饮片自动分类系统及方法
CN111104943A (zh) * 2019-12-17 2020-05-05 西安电子科技大学 基于决策级融合的彩色图像感兴趣区域提取方法
CN111242223A (zh) * 2020-01-15 2020-06-05 中国科学院地理科学与资源研究所 一种基于街景影像多特征融合的街道空间品质评价方法
CN111954053A (zh) * 2019-05-17 2020-11-17 上海哔哩哔哩科技有限公司 获取蒙版帧数据的方法、计算机设备及可读存储介质
WO2021093435A1 (zh) * 2019-11-12 2021-05-20 腾讯科技(深圳)有限公司 语义分割网络结构的生成方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819733A (zh) * 2012-08-09 2012-12-12 中国科学院自动化研究所 一种快速的街景图像中人脸的检测模糊方法
CN103336971A (zh) * 2013-07-08 2013-10-02 浙江工商大学 基于多特征融合与增量学习的多摄像机间的目标匹配方法
CN103606170A (zh) * 2013-12-05 2014-02-26 武汉大学 基于彩色尺度不变的街景影像特征检测与匹配方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819733A (zh) * 2012-08-09 2012-12-12 中国科学院自动化研究所 一种快速的街景图像中人脸的检测模糊方法
CN103336971A (zh) * 2013-07-08 2013-10-02 浙江工商大学 基于多特征融合与增量学习的多摄像机间的目标匹配方法
CN103606170A (zh) * 2013-12-05 2014-02-26 武汉大学 基于彩色尺度不变的街景影像特征检测与匹配方法

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
CHENXI ZHANG ET AL.: "Semantic Segmentation of Urban Scenes Using Dense Depth Maps", 《ECCV 10 PROCEEDINGS OF THE 11TH EUROPEAN CONFERENCE ON COMPUTER VISION:PART IV》 *
JIANXIONG XIAO ET AL.: "Multiple View Semantic Segmentation for Street View Images", 《2009 IEEE 12TH INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV)》 *
RADHAKRISHNA ACHANTA ET AL.: "SLIC Superpixels Compared to State-of-the-Art Superpixel Methods", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *
YOAV FREUND ET AL.: "An Efficient Boosting Algorithm for Combining Preferences", 《THE JOURNAL OF MACHINE LEARNING RESEARCH》 *
中野猛等: "《Hadoop Hacks(中文版)》", 31 January 2014 *
吴喜之: "《统计学:从数据到结论 第四版》", 31 March 2013 *
郭金鑫等: "基于HOG多特征融合与随机森林的人脸识别", 《计算机科学》 *
金萌萌等: "PCA-CCA在红外与可见光图像特征融合中的应用", 《沈阳理工大学学报》 *
顾幸方: "基于随机森林的视觉跟踪算法研究及应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104299233A (zh) * 2014-09-30 2015-01-21 杭州电子科技大学 基于超像素块的蜂群和灰色关联算法的sar图像分割方法
CN107624193A (zh) * 2015-04-29 2018-01-23 西门子公司 腹腔镜和内窥镜2d/2.5d图像数据中语义分割的方法和系统
CN107636678B (zh) * 2015-06-29 2021-12-14 北京市商汤科技开发有限公司 用于预测图像样本的属性的方法和设备
CN107636678A (zh) * 2015-06-29 2018-01-26 北京市商汤科技开发有限公司 用于预测图像样本的属性的方法和设备
CN108292366A (zh) * 2015-09-10 2018-07-17 美基蒂克艾尔有限公司 在内窥镜手术中检测可疑组织区域的系统和方法
CN108292366B (zh) * 2015-09-10 2022-03-18 美基蒂克艾尔有限公司 在内窥镜手术中检测可疑组织区域的系统和方法
US11132794B2 (en) 2015-09-10 2021-09-28 Magentiq Eye Ltd. System and method for detection of suspicious tissue regions in an endoscopic procedure
CN105389584B (zh) * 2015-10-13 2018-07-10 西北工业大学 基于卷积神经网络与语义转移联合模型的街景语义标注方法
CN105389584A (zh) * 2015-10-13 2016-03-09 西北工业大学 基于卷积神经网络与语义转移联合模型的街景语义标注方法
CN105260723A (zh) * 2015-10-22 2016-01-20 四川膨旭科技有限公司 车辆行驶过程中对车辆进行识别的系统
CN106023212A (zh) * 2016-05-24 2016-10-12 西安电子科技大学 一种基于金字塔逐层传播聚类的超像素分割方法
CN109416763B (zh) * 2016-07-01 2024-04-12 英特尔公司 对抗性环境中的机器学习
CN109416763A (zh) * 2016-07-01 2019-03-01 英特尔公司 对抗性环境中的机器学习
CN107886512A (zh) * 2016-09-29 2018-04-06 法乐第(北京)网络科技有限公司 一种确定训练样本的方法
CN107886513A (zh) * 2016-09-29 2018-04-06 法乐第(北京)网络科技有限公司 一种确定训练样本的装置
CN106384131B (zh) * 2016-10-09 2018-04-06 深圳云天励飞技术有限公司 基于相异性的特征融合识别方法
CN106384131A (zh) * 2016-10-09 2017-02-08 深圳云天励飞技术有限公司 基于相异性的特征融合识别方法
CN108694225B (zh) * 2017-03-31 2022-07-08 阿里巴巴集团控股有限公司 一种图像搜索方法、特征向量的生成方法、装置及电子设备
CN108694225A (zh) * 2017-03-31 2018-10-23 阿里巴巴集团控股有限公司 一种图像搜索方法、特征向量的生成方法、装置及电子设备
CN106991676B (zh) * 2017-04-06 2019-09-24 哈尔滨理工大学 一种局部相关的超像素融合方法
CN106991676A (zh) * 2017-04-06 2017-07-28 哈尔滨理工大学 一种局部相关的超像素融合方法
CN107423339A (zh) * 2017-04-29 2017-12-01 天津大学 基于极端梯度推进和随机森林的热门微博预测方法
CN107633522A (zh) * 2017-08-30 2018-01-26 山东财经大学 基于局部相似性活动轮廓模型的脑部图像分割方法和系统
CN107527054B (zh) * 2017-09-19 2019-12-24 西安电子科技大学 基于多视角融合的前景自动提取方法
CN107527054A (zh) * 2017-09-19 2017-12-29 西安电子科技大学 基于多视角融合的前景自动提取方法
CN107766794B (zh) * 2017-09-22 2021-05-14 天津大学 一种特征融合系数可学习的图像语义分割方法
CN107766794A (zh) * 2017-09-22 2018-03-06 天津大学 一种特征融合系数可学习的图像语义分割方法
CN109344618A (zh) * 2018-02-08 2019-02-15 中国人民解放军陆军炮兵防空兵学院郑州校区 一种基于深度森林的恶意代码分类方法
CN110163033A (zh) * 2018-02-13 2019-08-23 京东方科技集团股份有限公司 正样本获取方法、行人检测模型生成方法和行人检测方法
CN110163033B (zh) * 2018-02-13 2022-04-22 京东方科技集团股份有限公司 正样本获取方法、行人检测模型生成方法和行人检测方法
CN108399430B (zh) * 2018-02-28 2019-09-27 电子科技大学 一种基于超像素和随机森林的sar图像舰船目标检测方法
CN108399430A (zh) * 2018-02-28 2018-08-14 电子科技大学 一种基于超像素和随机森林的sar图像舰船目标检测方法
CN108921054A (zh) * 2018-06-15 2018-11-30 华中科技大学 一种基于语义分割的行人多属性识别方法
CN108921054B (zh) * 2018-06-15 2021-08-03 华中科技大学 一种基于语义分割的行人多属性识别方法
CN109934147A (zh) * 2019-03-05 2019-06-25 北京联合大学 基于深度神经网络的目标检测方法、系统及装置
CN111954053A (zh) * 2019-05-17 2020-11-17 上海哔哩哔哩科技有限公司 获取蒙版帧数据的方法、计算机设备及可读存储介质
CN111954053B (zh) * 2019-05-17 2023-09-05 上海哔哩哔哩科技有限公司 获取蒙版帧数据的方法、计算机设备及可读存储介质
CN110222644A (zh) * 2019-06-10 2019-09-10 哈尔滨理工大学 基于图像分割的森林火灾烟雾检测方法
CN110866547A (zh) * 2019-10-31 2020-03-06 浙江中医药大学 基于多特征和随机森林的中药饮片自动分类系统及方法
CN110866547B (zh) * 2019-10-31 2023-08-04 浙江中医药大学 基于多特征和随机森林的中药饮片自动分类系统及方法
WO2021093435A1 (zh) * 2019-11-12 2021-05-20 腾讯科技(深圳)有限公司 语义分割网络结构的生成方法、装置、设备及存储介质
CN111104943A (zh) * 2019-12-17 2020-05-05 西安电子科技大学 基于决策级融合的彩色图像感兴趣区域提取方法
CN111104943B (zh) * 2019-12-17 2022-05-17 西安电子科技大学 基于决策级融合的彩色图像感兴趣区域提取方法
CN111242223A (zh) * 2020-01-15 2020-06-05 中国科学院地理科学与资源研究所 一种基于街景影像多特征融合的街道空间品质评价方法

Also Published As

Publication number Publication date
CN103984953B (zh) 2017-06-06

Similar Documents

Publication Publication Date Title
CN103984953A (zh) 基于多特征融合与Boosting决策森林的街景图像的语义分割方法
CN108416307B (zh) 一种航拍图像路面裂缝检测方法、装置及设备
CN104599275B (zh) 基于概率图模型的非参数化的rgb-d场景理解方法
CN104408429B (zh) 一种视频代表帧提取方法及装置
CN108765371B (zh) 一种病理切片中非常规细胞的分割方法
CN103049763B (zh) 一种基于上下文约束的目标识别方法
CN106295460B (zh) 人的检测方法及设备
CN105631892B (zh) 一种基于阴影和纹理特征的航空影像建筑物损毁检测方法
CN105654107A (zh) 一种基于svm的有形成分分类方法
CN105956560A (zh) 一种基于池化多尺度深度卷积特征的车型识别方法
CN107392968B (zh) 融合颜色对比图和颜色空间分布图的图像显著性检测方法
CN104134234A (zh) 一种全自动的基于单幅图像的三维场景构建方法
CN109657610A (zh) 一种高分辨率多源遥感影像的土地利用变化检测方法
CN109583483A (zh) 一种基于卷积神经网络的目标检测方法和系统
CN104463199A (zh) 基于多特征及分割再校正的矿岩块度分类方法
CN103679187B (zh) 图像识别方法和系统
CN108154158B (zh) 一种面向增强现实应用的建筑物图像分割方法
CN110827312A (zh) 一种基于协同视觉注意力神经网络的学习方法
CN112580647A (zh) 一种面向堆叠物体的识别方法及系统
CN112200846A (zh) 融合无人机影像与地基雷达点云的林分因子提取方法
CN108073940B (zh) 一种非结构化环境中的3d目标实例物体检测的方法
CN108230330A (zh) 一种快速的高速公路路面分割和摄像机定位的方法
CN108629297A (zh) 一种基于空域自然场景统计的遥感图像云检测方法
CN107886066A (zh) 一种基于改进hog‑sslbp的行人检测方法
CN103235954A (zh) 一种基于改进AdaBoost算法的地基云图识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170606