一种基于轮廓片段空间关系的目标识别方法
技术领域
本发明涉及机器视觉与目标检测技术领域,更具体的是涉及一种基于图像轮廓片段空间关系特征的目标识别方法。
背景技术
目标识别一直是计算机视觉发展的重要研究方向。而在目标识别领域中,识别遮挡下的目标一直是目标识别领域内的难点和热点。通常情况下,都希望识别特征能对待识别目标的环境问题具有良好的适应性,从而能够更加有效地从场景图像中识别出目标实例。而在遮挡的情况下,目标无论是轮廓还是特征点都遭到了不同程度上的破坏,给识别造成了一定的难题。
轮廓形状具有非常重要和稳定的视觉特征,能够反映重要的特征信息。而得到更多的轮廓特征描述的有效信息无疑可以进一步提高目标的识别率。最近几年来提出了很多基于目标轮廓形状的目标识别方法,这些方法大多包含两个主要步骤:提取目标轮廓并对该目标轮廓进行描述,对目标轮廓和目标数据库轮廓进行相似性度量。而对目标轮廓的描述决定了该轮廓的特征信息数量,有效的特征信息越多,对目标的识别的帮助越大。
目标轮廓描述最具代表性的方法是2001年由Belongie等提出的形状上下文(Shape Context)描述方法,该方法通过轮廓上的某个点与其余轮廓点构成的线段向量集来表征该点的空间位置分布,并采用对数极坐标系对该向量集进行离散化,获得统计直方图作为轮廓点的特征描述子;Bartolini等提出一种基于傅里叶变换的描述子,该描述子以傅里叶系数的相位作为形状的描述信息;Peter等使用最大似然小波密度估计来进行图像和形状的表示。2014年Xinggang Wang等人提出一种基于轮廓片段集形状鲁棒性分类,该方法首先使用离散曲线演化方法(DCE)使每个形状的外轮廓分解为凸轮廓片段,然后用上下文特征对每一段轮廓特征进行描述并且使用局部约束线性编码(LLC)的方法把它们编成形状码,最后利用空间金字塔匹配(SPM)的形状识别。
在遮挡目标检测的过程中,可获得的目标的特征信息总是越多越好的,特征信息越多,遮挡目标识别率就会越高。本发明的目的是在目标识别过程中增加有助于目标识别的有效特征信息,在现有轮廓描述或者轮廓片段描述的基础之上,进一步考虑被识别目标轮廓片段的空间位置关系,提出基于轮廓片段空间关系的目标识别算法,该方法能够提高遮挡情况下用轮廓片段进行目标识别的识别率。
发明内容
发明目的:
针对复杂遮挡情况下的目标识别问题,提出一种基于轮廓片段空间关系的目标识别方法。该方法在传统基于形状目标识别的基础上,增加了目标轮廓片段空间关系这一有效信息,根据被识别目标轮廓片段的空间位置关系,制定空间关系参数约束标准,筛选满足空间关系约束标准的目标库图像为最后识别结果。该方法在传统基于形状目标识别的基础上,增加了目标轮廓片段空间关系这一有效信息,可以有效的提高遮挡目标的形状检索率和识别率。
技术方案
为解决上述技术问题,本发明的技术方案如下:
一种基于轮廓片段空间关系的目标识别方法,步骤如下:
(1)建立多类目标图像的数据库;
(2)采用外围轮廓提取算法,提取目标外围轮廓,并生成轮廓点集;
(3)根据轮廓点集的上下文形状特征,描述两个轮廓的形状,并根据两个形状的相似性度量结果得到目标粗匹配结果;
(4)分别根据完整图像的骨架和离散图像的轮廓质心构建库内图像和待识别遮挡图像的空间关系;
(5)建立空间关系特征参数的约束标准,并根据约束标准进行相似性度量;
在一种优选的技术方案中,步骤(2)的轮廓提取算法中,包含以下步骤:
(2.1)图像从三通道转化为单通道图像;
(2.2)对图像进行阈值化降噪处理;
(2.3)采用Canny微分算子对图像进行边缘的提取;
(2.4)采用图像形态学运算膨胀细小边缘并填充空洞,形成完整的外围轮廓;
(2.5)再一次采用Canny微分算子进行外围轮廓的准确提取。
阈值化处理图像可以最大限度的进行图像的降噪处理;图像形态学处理可以填补目标内部细小轮廓所带来的冗余空洞,两次利用Canny微分算子进行边缘轮廓的提取,最终得到图像的最外围轮廓。
在一种优选的技术方案中,步骤(3)中,具体包括以下步骤:
(3.1)图像的二值化:对于一幅二值图像,黑点表示字符,白点表示空白,这样就可以用黑点集合来表示一幅图像。轮廓点集表示为一个集合的形式:P={p1,p2,...,pn},pi∈R2;
(3.2)图像形状的描述:对于形状轮廓上的任意一点pi,为了让上下文的算子对pi和其相邻的像素特征点更为敏感,在这里把轮廓点集用放在极坐标系(r,θ)中。在对数极坐标系中,以pi为对数极坐标原点(0,0)。建立坐标系后,形状轮廓上的n-1个点就会落到对数极坐标系中。然后就可以计算这些点与坐标原点之间的距离。为了得到形状轮廓点之间的相对关系,将对数极坐标进行离散化,将对数极坐标进行离散化,对形状轮廓在距离和方向上划分为M个区,每个区域的面积相等,可减少图像旋转变换的影响,对于轮廓上的其他n-1个点,统计每个区域里面落入的点个数,并以形状直方图表示。点p的特征信息就由60个统计得到的形状直方图表示。这样对于一个形状来说,它是用n个轮廓点来表示的,这样一个形状就可以用n×M的矩阵A来表示,如下式所示。
其中an,M表示以第n个轮廓点为极坐标系原点时,落在第M个区域的轮廓点数。
(3)两个图像形状的相似性度量:对于两个形状A,B,需要计算两个形状描述矩阵每个样本点之间差别,在得到每个样本点的差别后,可以得到一个形状代价矩阵,采用匈牙利算法形状代价矩阵求解一个最优解使得这个匹配代价最小,最后用一个非矢量的数值来表示两个形状的上下文距离,该距离越小,代表两个形状的相似性越高。用上述上下文距离考量两个轮廓形状的相似性,得出形状粗匹配的待选目标集合。
在一种优选的技术方案中,步骤(4)中,包括图像:
(4.1)轮廓片段的质心求取:图像的质心是图像的第0和第1阶矩,首先需要得到轮廓上所有的点的集合,然后遍历轮廓上所有的点,求出轮廓片段的矩,进而计算出轮廓片段的质心像素坐标。
(4.2)图像骨架的提取:图像经过二值化后,提取图像的最外围轮廓,开始进行迭代腐蚀,直到迭代过程中没有像素点被腐蚀。剩余的像素点即为图像的骨架。
(4.3)空间关系的构建:分别以两幅图像的中心点为坐标系原点建立空间直角坐标系,轮廓片段图像以轮廓片段的质心像素坐标为关键点,库内模板图像以图像骨架的结合点为关键点,以上述点之间的空间矢量关系来描述图像轮廓的空间关系特征。
在一种优选的技术方案中,步骤(4.1)轮廓片段的质心求取中,对于一副连续的平面的图像来说,质心则由图像的矩决定。定义一副连续的图像f(x,y)≥0,p+q阶几何矩mpq和中心距μpq定义为:
对一幅M×N的离散图像f(i,j)≥0的p+q阶几何矩mpq和中心距μpq定义为:
其中,(ic,jc)为质心坐标。而且该坐标和几何矩有如下关系:ic=m10/m00、jc=m01/m00。即图像的质心就是图像第0和1阶矩。对于一幅存在遮挡的图像轮廓,只需要遍历图像上所有的轮廓点,进而就可求出各个片段的轮廓质心。
在一种优选的技术方案中,步骤(4.2)的轮廓骨架提取中,包括以下步骤:
(4.2.1)输入图像的二值化;
(4.2.2)遍历图像得到外部轮廓;
(4.2.3)对图像最外围轮廓上的点进行检测,依次检测这些轮廓点的8像素邻域,是否只含有3连通像素,如果有,把此点从轮廓点删除,并在目标图像中腐蚀掉对应点;
(4.2.4)分别依次检测轮廓点的8像素领域是否只含有3 or 4 or 5 or 6 or 7连通像素,如果有,把此点从轮廓点删除,并在目标图像中腐蚀掉对应点。如果迭代过程中没有像素点被腐蚀,停止迭代。
(4.2.5)再次检测轮廓点的8像素邻域是否只含有2or3 or 4 or 5 or 6 or 7连通像素,如果有,腐蚀掉该点。得到最终单像素宽度的骨架。
在一种优选的技术方案中,步骤(4.3)的空间关系构建中,分为以下部分:
(4.3.1)对于遮挡的轮廓片段来说,轮廓空间关系的参考点是轮廓片段的质心。以图像的像素中心点建立平面直角坐标系,中心像素点为原点(0,0),轮廓片段的质心像素坐标就落在了该坐标系的不同象限内,通过计算质心像素点坐标与原点之间的矢量空间关系,得到图像的空间关系特征参数。
(4.3.2)对于库内模板图像来说,因为图像轮廓是连通的,所以图像质心无法作为参考点来进行空间关系的建立,因此选用图像骨架的结合点作为空间关系的参考点。图像骨架的结合点定义为:若一个骨架点存在三个或更多的相邻点,则称其为骨架接合点(combine points)。骨架结合点的位置基本上代表了图像几个重要轮廓片段的位置,可以准确的描述出目标不同部位基于整体的空间关系,同样以图像的像素中心点建立平面直角坐标系,计算结合点像素坐标与原点之间的矢量空间关系,得到图像的空间关系特征参数。
在一种优选的技术方案中,步骤(5)中,采用一种计算准则来约束空间关系特征参数。其内容如下:
(5.1)从坐标系的第一象限开始,计算两图像同一象限空间关键点的空间关系参数;
(5.2)空间距离参数Dis定义为空间关键点相对于图像中心的欧氏距离与图像大小的比值;方位角参数The定义为空间关键点相对于图像中心连线斜率的反正切值。
(5.3)利用上述两个参数,对目标图像和模板图像进行空间关系参数的相似性度量。根据上述计算的参数,根据以下规则计算相似性:1、两张图像的关键点所代表的轮廓片段或者轮廓区域保持在同一象限;2、同一象限的目标图像轮廓片段和模板图像轮廓区域的空间距离参数Dis的差值须满足预设定阈值;3、同一象限的目标图像轮廓片段和模板图像轮廓区域的方位角参数The的差值的余弦值需满足预设定阈值。
优点效果
本发明有以下良好的效果:在复杂遮挡情况下,本发明考虑遮挡轮廓片段的空间关系特征,在目标识别的过程中为识别提供更多的特征信息。在目标遭到遮挡的情况下,往往目标会被分成几个部分,外部轮廓不再存在完整性,在这种情况下,考虑到不同轮廓片段之间的空间关系,可以把分散的轮廓片段全部利用起来,增加遮挡目标的识别率。
附图说明
图1是本发明识别的步骤图;
图2是空间关系建立的流程图;
图3是上下文特征相似性度量的流程图;
图4是轮廓片段质心提取示意图;
图5是骨架提取过程示意图;
图6是空间关系建立示意图;
具体实施方式
以下将结合附图和具体实施方式,对本发明作进一步的详细说明。
实施例1
一种基于轮廓片段空间关系的目标识别方法,如图1和图2所示,包括以下步骤:
(1)图像的预处理及轮廓提取:对待测目标图像和若干模板图像进行预处理并用轮廓提取算法提取各自的外围轮廓。所述的待测目标为不确定物体图像,模板图像为确定物体图像。
(2)基于上下文的图像轮廓粗匹配:提取待测目标的外部轮廓,在外部轮廓上选取N个特征点,提取N个特征点的上下文特征,与若干模板图像的上下文特征进行匹配,得出相似性较高的一部分待选目标。
(3)对待测目标图像进行轮廓片段质心的提取,建立空间关系;对从步骤(2)筛选出的模板图像提取骨架,找到骨架结合点,分别建立空间关系。
(4)根据步骤(3)中建立的坐标系,求取各个参考点与图像像素中心的空间关系特征参数。该参数包括两点之间的斜率值、方位角和欧氏距离。
(5)根据空间关系特征参数进行模板图像和待测图像的两两匹配,满足预设阈值条件的即为该类的图像。
其中步骤(1)包括如下步骤1.1~1.5:
(1.1)图像从三通道转化为单通道图像;
(1.2)对图像进行阈值化降噪处理;
(1.3)采用Canny微分算子对图像进行边缘的提取;
(1.4)采用图像形态学运算膨胀细小边缘并填充空洞,形成完整的外围轮廓;
(1.5)再一次采用Canny微分算子进行外围轮廓的准确提取。
其中步骤(2)包括如下步骤2.1~2.3
(2.1)在图像外部轮廓上提取N个有效特征点;
(2.2)对选取轮廓上的点用上下文的特征进行描述;
(2.3)对待测物体图像和模板图像的上下文特征进行相似性度量;
其中步骤(3)包括如下步骤3.1~3.3:
(3.1)对待测物体图像进行轮廓片段质心提取;
(3.2)对模板图像进行图像骨架和骨架关键点提取;
(3.3)分别根据(3.1)和(3.2)中的关键点对两图像建立坐标系;
步骤(2.1)中轮廓特征点的提取是进行的等间隔取样,选取一定数目的轮廓点。包括如下步骤:图像轮廓提取的完整轮廓点集P={p1,p2...pn},pi∈R2,选取轮廓点的数目为m,用总轮廓点数N除以所需要的点的数量m,可以得到轮廓的取样距离N/m,选取轮廓点的起点可以是随机的。由此可以得出取样点m的数量越大,描述出来的形状也就更准确。
如图3所示,步骤(2.2)中上下文的特征描述匹配包括以下步骤:
对于形状轮廓上的任意一点pi,为了让上下文的算子对pi和其相邻的像素特征点更为敏感,在这里把轮廓点集用放在极坐标系(r,θ)中。在对数极坐标系中,以pi为对数极坐标原点(0,0)。建立坐标系后,形状轮廓上的n-1个点就会落到对数极坐标系中。然后就可以计算这些点与坐标原点之间的距离。为了得到形状轮廓点之间的相对关系,将对数极坐标进行离散化,对形状轮廓在距离和方向上划分为60个区,即在方向上平均划分为12个区,在半径上则由内到外划分为5个半径区。每个区域的面积相等,可减少图像旋转变换的影响,对于轮廓上的其他n-1个点,统计每个区域里面落入的点个数,并以形状直方图表示。
hik=#{pj≠pi&pj∈bin(k)},i≠j
其中k为区域的序号(1<k<60),#为统计p点落在k区的点个数的统计运算符。点p的特征信息就由60个统计得到的形状直方图表示。这样对于一个形状来说,它是用n个轮廓点来表示的,这样一个形状就可以用n×60的矩阵A来表示
其中an,M表示以第n个轮廓点为极坐标系原点时,落在第M个区域的轮廓点数;
在两个形状的相似性度量中,通过计算两个形状点集合之间的匹配代价值cost值来进行匹配,对于两个形状A和B中的两个点pj和qj点之间的代价cost值可以通过计算它们的形状直方图的代价来得到。我们通过分别计算样本中所有相对应点之间的cost值,对轮廓点进行逐点匹配,从而最终完成两个形状之间的匹配。
如图4所示步骤(3.1)中的轮廓片段质心提取是对一幅图像上所有的分散的轮廓片段提取,包括以下步骤:遍历图像中所有的轮廓点,计算轮廓矩:
其中,(ic,jc)为质心坐标。而且该坐标和几何矩有如下关系:ic=m10/m00、jc=m01/m00。即图像的质心就是图像第0和1阶矩。对于一幅存在遮挡的图像轮廓,只需要遍历图像上所有的轮廓点,进而就可求出各个片段的轮廓质心。
如图5所示步骤(3.2)中的图像骨架提取是对一幅图像提取一条单像素宽度的“骨架”,包括以下步骤:
输入图像的二值化;
遍历图像得到外部轮廓;
对图像最外围轮廓上的点进行检测,依次检测这些轮廓点的8像素邻域,是否只含有3连通像素,如果有,把此点从轮廓点删除,并在目标图像中腐蚀掉对应点;
分别依次检测轮廓点的8像素领域是否只含有3 or 4 or 5 or 6 or 7连通像素,如果有,把此点从轮廓点删除,并在目标图像中腐蚀掉对应点。如果迭代过程中没有像素点被腐蚀,停止迭代。
检测轮廓点的8像素领域是否只含有2or3 or 4 or 5 or 6 or 7连通像素,如果有,腐蚀掉该点。得到最终单像素宽度的骨架。
如图6所示步骤3.3中对两幅图像分别建立坐标系。
步骤(4)中根据空间关系参数对图像进行空间特征参数计算包括以下步骤:
采用一种计算准则来约束空间关系特征参数。其内容如下:
从坐标系的第一象限开始匹配,计算两图像同一象限的空间关系参数;
定义Dis为空间距离参数,具体表示为空间关键点相对于图像中心的欧氏距离与图像大小的比值;定义The为方位角参数,具体表示为空间关键点相对于图像中心连线斜率的反正切值。
其中(x1,y1),(x2,y2)分别为空间关键点和图像中心点的像素坐标,row为图像的行长度,col为图像的列长度,θ为图像中心点与空间关键点的连线的角度。
步骤(5)中根据空间关系特征参数进行模板图像和待测图像的两两匹配,空间关系参数约束条件设定包括以下步骤:
利用步骤(4)上述两个参数,对目标图像和模板图像进行空间关系参数的相似性度量。根据上述计算的参数,根据以下规则计算相似性:
1)两张图像的关键点所代表的轮廓片段或者轮廓区域保持在同一象限;
2)同一象限的目标图像轮廓片段和模板图像轮廓区域的空间距离参数Dis的差值须满足预设定阈值;
3)同一象限的目标图像轮廓片段和模板图像轮廓区域的方位角参数The的差值的余弦值需满足预设定阈值。
当两图像的空间位置关系参数满足上述所有条件的时候,可以认定两幅图像为同一类别。