CN102819841A - 用于目标图像分割的全局阈值分割方法 - Google Patents
用于目标图像分割的全局阈值分割方法 Download PDFInfo
- Publication number
- CN102819841A CN102819841A CN2012102665621A CN201210266562A CN102819841A CN 102819841 A CN102819841 A CN 102819841A CN 2012102665621 A CN2012102665621 A CN 2012102665621A CN 201210266562 A CN201210266562 A CN 201210266562A CN 102819841 A CN102819841 A CN 102819841A
- Authority
- CN
- China
- Prior art keywords
- window
- threshold
- target
- image
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 238000000638 solvent extraction Methods 0.000 title abstract 4
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 4
- 238000004220 aggregation Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 244000144992 flock Species 0.000 claims description 3
- 230000002093 peripheral effect Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 description 15
- 238000001514 detection method Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 238000005520 cutting process Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 238000005286 illumination Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 241001270131 Agaricus moelleri Species 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 239000006002 Pepper Substances 0.000 description 1
- 241001354471 Pseudobahia Species 0.000 description 1
- 206010047571 Visual impairment Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种用于目标图像分割的全局阈值分割方法,包括:在总阈值区间内连续改变阈值,得到与阈值对应的目标窗口集合上的0阶类点数的最大值所对应的阈值,得到以该阈值为端点的一个优化阈值区间,其中0阶类点表示环绕指标等于0的像素点,环绕指标定义为在阈值图像的前景像素点的3×3像素的邻域内,除该前景像素点之外的其他所有前景像素点的个数除以2再取整后的值;在所述优化阈值区间上计算光滑性算子SD(3,t)曲线的极值点,若其超过2个,则只保留最大的两个SD(3,t)值所对应的极值点t31、t32;计算完整性算子SN(2,t31)和SN(2,t32),将其中较大的值所对应的阈值作为最优阈值,并输出该最优阈值对应的阈值图像。
Description
技术领域
本发明属于图像处理和目标检测技术领域,具体涉及图像处理分析系统(如目标检测系统、目标识别系统、文本图像检测系统、医学图像分析系统)中用于目标检测、目标定位等的阈值分割方法。
背景技术
近年来,目标检测成为科研和商业领域的研究热点,如小目标自动跟踪、车辆跟踪、行人跟踪、人脸检测、文字检测、飞机检测等领域。阈值分割技术是目标检测系统中的一种重要技术,其基本原理是假设目标的灰度和背景灰度不一致,通过合适的阈值分割,将目标与背景分离,极大地降低了背景干扰,为后续的识别跟踪提供了良好的图像条件。此外,阈值分割技术还广泛应用于遥感图像处理、目标识别、文字图像处理、医学图像处理、场景分析等许多领域。
几十年来,人们发展了很多种阈值分割技术。一般可以分成两大类,一类是全局阈值分割技术。顾名思义,其是指对图像全局使用相同的阈值。另一类是局部阈值分割技术,即图像的阈值随着局部区域的灰度变化而改变。相比后者,全局阈值技术更容易实现,计算更加快速,应用更加广泛。全局阈值技术的主要难点在于最优阈值的计算,人们在寻找最优阈值的计算方法上所做的努力从来没有停止过。
日本东京大学信息科学系教授Otsu(N.Otsu,“A threshold selectionmethod from grey level histogram”,IEEE Transactions on Systems,Man,andCybemetics(1979)62-66)首先提出了基于最大化类内方差和的方法。其后人们研究了很多种基于灰度直方图的阈值分割方法,包括最大熵方法、最小误差方法、最大梯度方法,等等。由于认识到一维方法的缺陷,一维方法无法区分灰度直方图相同,空间分布不同的图像。人们研究很多种利用空间相关性的阈值分割方法。美国坦普尔大学电子工程系教授Abutaleb(A.S.Abutaleb,“Automatic thresholding of gray-level pictures usingtwo-dimensional entropies”,Pattern Recognition 47(1989)22-32)提出了基于二维灰度直方图、二维Renyi熵、二维Tsallis熵的方法。武汉华中科技大学模式识别与人工智能研究所Haifeng Lu(Haifeng Lu,T.-x Zhang,L.-xYan,“Threshold Selection using Partial Structural Similarity”,InternationalJournal of Digital Content Technology and its Applications 5(2011)397-407)提出了基于部分结构相似性的方法。目前在全局阈值分割方法研究中,如何克服低对比度和噪声干扰,如何有效利用空间信息是研究的热点和难点。
法国滨海大学教授Rekik(A.Rekik,M.Zribi,A.B.Hamida,and M.Benjelloun,“An Optimal Unsupervised Satellite image SegmentationApproach Based on Pearson System and k-Means Clustering AlgorithmInitialization”,International Journal of Information and CommunicationEngineering 5(2009)38-45)指出,许多全局阈值分割方法在处理卫星遥感图像中经常失效,因为卫星遥感图像中的目标特征不具备纹理一致性。因此,假设目标具有相似纹理的阈值分割方法就不能适应。Haifeng Lu指出,许多阈值分割方法假设目标的灰度空间分布满足高斯混合模型,但这一假设不并不符合许多实际情况。
现有的全局阈值分割方法的适应面很窄,许多方法只对满足某些条件的图像有效,大部分方法在面对背景复杂、光照不均匀的图像时都会失效。因此现有的全局阈值分割方法无法解决小目标的分割定位问题,也无法解决卫星遥感图像的阈值分割问题。
因此,设计一种能够抗复杂背景干扰、光照干扰,适用于小目标的分割和定位、卫星遥感图像和各类普通图像的自动全局阈值分割方法具有广泛的实际应用前景和潜在的商业价值。
发明内容
(一)要解决的技术问题
本发明所要解决的技术问题是现有的用于目标图像分割的全局阈值分割方法扰干扰能力差,不能适应于小目标的分割和定位、卫星遥感图像的阈值分割的问题。
(二)技术方案
为解决上述技术问题,本发明提出一种用于目标图像分割的全局阈值分割方法,包括如下步骤:
S1、在总阈值区间内连续改变阈值,得到与阈值对应的目标窗口集合上的0阶类点数P(0,t)的最大值所对应的阈值tmax,得到以该阈值tmax为端点的一个优化阈值区间,其中P(0,t)表示与阈值t对应的阈值图像的目标窗口集合上0阶类点的数目,其中0阶类点表示环绕指标等于0的像素点,环绕指标定义为在阈值图像的前景像素点的3×3像素的邻域内,除该前景像素点之外的其他所有前景像素点的个数除以2再取整后的值;
S2、在所述优化阈值区间上计算光滑性算子SD(3,t)曲线的极值点,若其超过2个,则只保留最大的两个SD(3,t)值所对应的极值点t31、t32,其中D(k,t)表示光滑性算子,并且满足
S3、计算完整性算子SN(2,t31)和SN(2,t32),将其中较大的值所对应的阈值作为最优阈值,并输出该最优阈值对应的阈值图像,其中完整性算子SN(k,t)定义为:
(三)有益效果
本发明的图像阈值分割方法基于边界光滑性算子,非常适合小目标的分割和定位,有效地克服了背景复杂、光照干扰等因素的影响,非常适应于卫星遥感图像的处理、行人跟踪、车辆检测、人脸检测中的对图像阈值分割。
附图说明
图1是本发明的用于目标图像分割的全局阈值分割方法的流程图。
图2是本发明的无重叠的搜索窗阵列,窗口尺度=50。
图3是本发明的有重叠的搜索窗密集阵列,窗口尺度=50。
图4是本发明的经过中心滑动和前景面积筛选的搜索窗集合。
图5是本发明的过滤周边窗,保留中心窗口,最终筛选出的小目标窗口集合。
图6是北京机场例图,飞机的灰度和跑道很接近,采自google earth软件平台。
图7曲线为P(0,t),tmax=204为最大值顶点所对应的阈值。
图8曲线为SD(3,t),两个十字是在[204,255]区间内的局部极值点,对应阈值分别为230,240。
图9曲线为SN(2,t),两个十字标示230,240处的曲线值,显然240对应的SN(2,t)值更大,所以输出240,作为最优阈值。
图10最优阈值tbest=240对应的北京机场阈值图像,小目标清楚地分割出来了。
图11(a)柏林机场局部,(b)本方法结果,(c)Otsu方法结果,(d)Tsallis2D方法结果,(e)PSSIM方法结果,(f)本方法曲线图。
图12(a)麦卡伦机场局部,(b)本方法结果,(c)Otsu方法结果,(d)Tsallis2D方法结果,(e)PSSIM方法结果,(f)本方法曲线图。
图13(a)悉尼机场局部,(b)本方法结果,(c)Otsu方法结果,(d)Tsallis2D方法结果,(e)PSSIM方法结果,(f)本方法曲线图。
图14(a)北京机场局部,(b)本方法结果,(c)Otsu方法结果,(d)Tsallis2D方法结果,(e)PSSIM方法结果,(f)本方法曲线图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
本发明的设计思路来源于实验观察到的一个现象:在对图像进行阈值分割时,若阈值不合适,则生成的阈值图像会产生许多噪声,且图像内部松散,边界缺失,或者有许多毛刺。而良好的阈值图像则应不边界光滑、噪声少、内部紧密。受这个现象的启发,本发明人想到通过统计噪声点、毛刺点、缺陷点的平均密度,可以判断阈值的好坏。
要实现这个想法,必须对像素点进行分类。我们设计了一个环绕指标来对像素点进行分类,使之总共可以分成5类,分别对应0、1、2、3、4等不同阶的指标数。环绕指标能够很好地反映像素点周边的连接情况,同时环绕指标也具备一定的旋转不变性。环绕指标具有一个重要性质:高阶的类点,总是位于目标区域的内部,低阶的类点,总是位于区域的边界或者外部。发明人进一步发现,同类点的绝对密度总是一条单峰曲线,在上升到最高峰后会持续下降。因此,单纯依赖类点的密度曲线,不能得到最佳的阈值。并且,当阈值图像比较清晰时,区域的内部会比较紧密,边界会比较光滑,高阶的类点数较多,而低阶的类点数较少,所以高阶的类点数和低阶的类点数之比,是比较合适的度量。
发明人基于上述构想,通过将近一年的实验,证实了上述构想的可行性,并取得了很好的抗光照干扰和复杂背景干扰的能力。下面具体描述用于目标图像分割的全局阈值分割方法的步骤。
步骤S1、在总阈值区间内连续改变阈值,得到与阈值对应的目标窗口集合上的0阶类点数P(0,t)的最大值所对应的阈值tmax,得到以该阈值tmax为端点的优化阈值区间。
在此,我们设总阈值区间为[ts,te],ts为阈值区间的起点,te为阈值区间的终点。对于灰度阶数为256的图像来说,阈值区间为[0,255]。
此处所述的目标是指所述图像中的感兴趣目标,例如对于卫星遥感图像来说,感兴趣目标可能是机场的航站楼、跑道、飞机等,在别的应用中,其也可能是汽车、行人等。如前所述,本发明特别适合于小尺寸的目标的检测,例如跑道上的飞机、道路上的行人等。
本发明中所述的目标窗口,是指以图像中的目标为中心的图像区域,通常是一个矩形区域,优选为长宽相等的方形区域。多个目标窗口构成一个目标窗口集合。
在本发明中,P(k,t)表示k阶类点数,k阶类点数P(k,t)表示与阈值t对应的阈值图像的所有目标窗口集合上,环绕指标为k的像素点数总和。因此,P(0,t)表示与阈值t对应的阈值图像的目标窗口集合上0阶类点的数目。此其中0阶类点表示环绕指标等于0的像素点,环绕指标定义为:在阈值图像的前景像素点的3×3像素的邻域内,除该前景像素点之外的其他所有前景像素点的个数除以2再取整后的值。环绕指标的具体计算将在下文中描述。
步骤一具体如下几个分步骤:
步骤S11、根据给定的阈值,生成目标图像的阈值图像;
步骤S12、根据给定的目标尺度,在所述阈值图像上形成目标窗口集合;
步骤S13、计算阈值图像的所述目标窗口集合中,环绕指标等于0的像素点(也称0阶类点)的数目。
步骤S11、根据给定的阈值,生成目标图像的阈值图像。
本发明中所述的图像均为数字图像。对于给定的图像,其可能是灰度图像,也可能是彩色图像(如RGB三原色图像)。阈值图像是这样的图像:按照图像的像素点的灰度,以一个灰度阈值为临界点对所有像素点进行划分,将灰度低于灰度阈值的像素点作为背景、将灰度高于灰度阈值的点作为前景。该图像如图2、3所示,通常表现为黑白对比强列的图像,图中白色区域为前景,黑色区域为背景。例如,对于256阶灰度值的图像来说,对于给定的阈值t∈[0,255],对应的阈值图像按照如下规则生成:图像中的任意一个像素点,若该像素点的灰度大于等于t,则该像素点的阈值图像灰度设为255;若该像素点的灰度小于t,则该像素点的阈值图像灰度设为0。由于阈值图像是根据灰度图像计算得到的,因此,对于彩色图像,首先应当归一化该图像的灰度,生成对应该彩色图像的灰度图像。如图1所示,归一化图像灰度后生成灰度图像f(x,y),其中x和y分别表示像素点的横、纵坐标;然后,根据阈值t和灰度图像f(x,y),生成阈值图像ft(x,y)。
步骤S12、根据给定的目标尺度,在所述阈值图像上形成目标窗口集合。
下面具体描述根据本发明的形成目标窗口集合的具体步骤。
步骤S121:首先,如附图2所示,将阈值图像分割成纵横方向上均匀、紧密排布的网格阵列,并且使该网格阵列的每个网格的尺度相同,且不大于给定的目标尺度。
根据本发明的优选实施方式,为了避免遗漏,使所述网格在水平和垂直方向上滑动网格的边长的0.5倍,从而生成更加密集网格阵列。如附图3所示。根据采样定理,取最大频率的2倍作为采样频率能够充分保证采样精度。也就是说,优选为使网格的尺度小于给定的目标尺度的1/2,以提高目标窗口的采样精度。
步骤S122:然后将所述网格阵列的每个网络作为一个窗口,对所有的窗口进行移动和筛选,得到覆盖目标的多个目标窗口。
根据本发明的一个具体实施方式,我们通过如下方式来移动和筛选:
首先,计算每个窗口的前景的几何中心(或称为前景几何中心),并将该窗口平行移动,使该窗口的中心移动到该前景几何中心。
然后,计算移动后的窗口的前景面积占窗口总面积的比例r,筛选出该比例r在一定范围内的窗口。该范围例如在飞机目标分割中为:0.05≤r≤0.3。因为窗口内飞机目标的前景面积一般不会超过窗口总面积30%,并且一般大于窗口总面积5%。
根据本发明的优选实施方式,为了排除噪声干扰,在上述步骤之后,排除前景灰度和背景灰度差别较小的窗口。举例来说,同时计算移动后的窗口所对应的原始灰度图像的前景的平均灰度fa和背景的平均灰度fb,只保留前景平均灰度与背景平均灰度差大于一个临界灰度差值的窗口。例如,对于256阶的灰度,对于亮目标,前景灰度大于背景灰度,我们只保留fa-fb≥30的窗口,对于暗目标,前景灰度小于背景灰度,我们只保留fb-fa≥30的窗口这样,可以过滤掉一些包含噪声的窗口。该步骤之后的最终的结果如附图4所示。
步骤S123:基于上述筛选得到的多个目标窗口,对于聚集在一起的窗口,去除聚集区域周边位置的窗口,保留聚集区域中心位置的窗口。
特别是对于密集网格阵列,从附图4中可以看出,许多窗口聚集在一起,而只有一个位于目标的中心。因此,需要采取一种过滤方法,去除在窗口聚集区中处于周边位置的窗口,保留在窗口聚集区中处于中心位置的窗口,所谓窗口聚集区是指窗口互相重叠的区域。
根据本发明的优选实施方式,可以采用如下步骤来完成上述过滤:将与其他窗口距离较远的一个窗口,或者相互之间距离较近的多个窗口归为一个窗口群;并且,对于每一个窗口群,只保留一个窗口。
为了详细说明上述过滤方法,以下给出具体的示例。在此,设窗口的总数为M,窗口群的总数为N,窗口用Wi表示,窗口群用Cj表示,M、N均为自然数,且M≥N,1≤i≤M,1≤j≤N。并且,我们设定窗口群满足的条件参数为:窗品群中的窗口间的最大距离为dw,窗口到窗口群中心之间的距离的最大距离为dc。在此,我们定义:窗口群中心为窗口群内所有窗口的几何中心;窗口到窗口群的最小距离为该窗口的中心到该窗口群中所有窗口的距离中的最小值;窗口到窗口群的中心距离为该窗口的中心到该窗口群的几何中心之间的距离。
(1)首先,计算所有窗口之间的距离。
(2)任选一个窗口作为第一窗口W1,建立第一窗口群C1,并将窗口W1归类为第一窗口群C1。
(3)依次选择第二至第M窗口,即窗口W2~WM,对于其中的任意一个窗口Wi,即第i个窗口(1≤i≤M),假设当前已建立的窗品群为C1~Cn(n≤N),若第i窗口Wi到第j窗口群(1≤j≤n)Cj的最小距离小于距离dw,并且第i窗口Wi到第j窗口群的中心距离小于距离dc,则将窗口Wi归为窗口群Cj;否则,建立一个新的窗口群Cn+1,将该窗口Wi归为该新窗口群Cn+1。
(4)对所有窗口均归类为窗口群之后,对于每一个窗口群,仅保留前景面积最大的窗口。
对图4中的窗口进行以上过滤步骤之后,得到目标窗口集合,如图5所示。
步骤S13、计算阈值图像的所述目标窗口集合中,环绕指标等于0的像素点(也称0阶类点)的数目。
1、环绕指标的定义和计算
在本发明中,如前所述前景像素点的环绕指标定义为:在阈值图像的该前景像素点的3×3像素的邻域内,除该前景像素点之外的其他所有前景像素点的个数除以2再取整后的值。
例如,对于256阶灰度的阈值图像中的任意一个像素点(x,y),其中x和y分别是该像素点的横、纵坐标,若该像素点的阈值图像的灰度等于255,在3×3(像素)的邻域内,除该像素点(x,y)之外的其他所有阈值图像灰度等于255的像素点的个数除以2后再取整后的值。
这里的关键是为什么要除以2,如果不除以2,则环绕指标为可以为“0”到“8”,共9个不同的值,像素点被分为9类,这样处理的一个缺点是导致类别太多,很容易导致某些类的数目为零。而在除以2后,像素点总共只有5类,类别数目刚好合适。最重要的一点是,发明人发现,只有除以2后,才能够在最大程度地具有旋转不变性,所谓旋转不变性是指图像旋转任意角度后,指标的计算结果不变。即发明人发现除以2后,若图像旋转0,45,90,135,180度都不会影响环绕指标的计算结果,因此在一定程度上具有旋转不变性。
环绕指标具有清晰的几何意义,如下:
环绕指标=0:图像中的孤立像素点集合。在图像阈值化过程中,会产生大量的背景噪声,如椒盐噪声等。传统上为了处理噪声,需要借助连通域算法或其他过滤算法。噪声的最主要表现形式是孤立像素点集。
环绕指标=1:图像中的线状连续像素点集合。在图像阈值化过程中,同样会产生许多断线,它们主要是道路、建筑物、目标、背景等因为不合适的阈值而产生的残留图像,有时也是噪声的产物。这些不完整的线状图是我们所极力避免的。
环绕指标=2:图像中的目标的边界像素点集合。从数学上很容易严格证明,只要目标不是线状体,对于光滑边界上的像素点,3×3像素邻域内除中心像素点之外的阈值图像灰度等于255的像素点的个数必然在4和5之间。考虑到实际边界有可能出现缺陷或毛刺的现象,可以认为边界上的像素点的环绕指标等于2的可能性最大。
环绕指标=3:图像中的目标中有缺陷的内部像素点集合。周边只有1~2个像素有缺陷,这样的像素点当然是内部像素点。
环绕指标=4:图像中的目标中无缺陷的内部像素点集合。周边所有像素的阈值图像灰度都是255,这样的像素点当然是无缺陷的内部像素点。
由上述可见,基于环绕指标的像素点集的分类法简单实用巧妙,同时具有明确的、丰富的几何内涵。
步骤1-4、在阈值区间内连续改变阈值,并且重复步骤1-1至步骤1-3,得到与阈值对应的0阶类点数的最大值所对应的阈值tmax。
这里涉及到最优阈值区间的计算:
在实验中,我们发现在小目标窗口集合上,通常0阶类点的数目总是多于高阶类点,零阶类点曲线的最大值对应的阈值tmax总是对应噪声最大的阈值图像。显然,tmax不可能是最优阈值,假设目标比背景亮,那么目标的最优阈值应该在[tmax,255]区间上。当然,若目标比背景暗,则最优阈值应该在[0,tmax]。总之,在实际应用中,一般情况下我们总可以知道目标是亮目标还是暗目标,这里我们不妨假设目标为亮目标,则我们可以将最优阈值的合理范围缩小到[tmax,255],从而大大提高了计算效率和精度。
举例来说,当输入的原始图像如附图6所示时,计算0阶类点数得到的曲线如图7所示,其最大值所对应的阈值为tmax。
步骤二、在优化阈值区间上计算光滑性算子SD(3,t)曲线的极值点,若其超过2个,则只保留最大的两个SD(3,t)值所对应的极值点t31、t32。
如附图8所示,对于灰度阶数为256的图像来说,te=255,对于亮目标,阈值区间为[tmax,te],即[tmax,255]。
SD(k,t)表示光滑性算子,并且满足
上述式中,P(k,t)表示与阈值t对应的阈值图像的目标窗口集合上,环绕指标等于k的像素点(也称k阶类点)的数目总和,ε是一个非负因子。该非负因子是一个小的正整数,其取值范围为:ε=1,2,3,4,5。
<局部极值点提取方法>
给定一条曲线,计算曲线上的局部极值点是很普通的方法。但是,从数据处理的角度来说,局部极值点产生于数据的波动,所以数据噪声很容易影响极值点提取方法,在实际应用中,必须应用一些技巧才能得到真正想要的极值点。根据本发明,我们以256阶灰度图像为例给出详细步骤如下:
步骤S21:输入曲线数组a,将曲线数组a的值域归一化到[0,3],定义域为[0,255];
步骤S22:在[0,255]范围内,对曲线数组做5个像素点的平均值滤波;
步骤S23:将[0,255]等分成26个区间,前25个区间的间隔是10,最后一个是5;
步骤S24:求出26个区间内的极大值点pi,i=0,…,25;
步骤S25:对每一个极大值点pi,建立一个左区间[pi-10,pi],一个右区间[pi,pi+10],限制左区间的起点≥0,右区间的终点≤255;
步骤S26:计算左区间的极大值点pi0和右区间的极大值点pi1,计算左区间的极小值像素点pi2和右区间的极小值像素点pi2;
步骤S27:若pi满足下列5个条件中任意一个,则极值点pi被过滤掉:
①a[pi]<0.5;
②pi0≠pi;
③pi1≠pi;
④a[pi]-a[pi2]<0.15;
⑤a[pi]-a[pi3]<0.15。
条件①限制了极值点的最小高度;条件②、③检查极值点是否是左右区间的真正极大值点;条件④、⑤检查左右区间的坡度条件,极值点必须满足一定的坡度条件,以过滤过分平坦的极值点。
步骤三、计算完整性算子SN(2,t31)和SN(2,t32),将其中较大的值所对应的阈值作为最优阈值,并输出该最优阈值对应的阈值图像。
完整性算子SN(k,t)定义为:
同样,P(k,t)表示与阈值t对应的阈值图像的目标窗口集合上,环绕指标等于k的像素点(也称k阶类点)的数目之和。并且,ε是一个非负因子。该非负因子是一个小的正整数,其取值范围为:ε=1,2,3,4,5。该非负因子的作用是防止上述中的分母被0除。在通常情况下,P(k,t)远大于ε,因此SN(k,t)可以视为P(k,t)的倒数。SN(k,t)越高,P(k,t)就越小。
因此,SN(0,t)描述了窗口中孤立像素点的数量,SN(1,t)描述了窗口中线状连续像素点的总数,SN(2,t)描述了窗口中边界的总长度,SN(3,t)描述了窗口中有缺陷像素点的总数,SN(4,t)描述了窗口中无缺陷像素点的总数。这里需要解释的是为什么用倒数,原因是:对于k≤3,P(k,t)越小,图像质量就越清晰,所以我们关心的是P(k,t)的反比例数值。
但是,当阈值趋近于阈值图像的前景灰度值时,例如255时,阈值图像的前景总面积趋近于零。这时SN(k,t)很高,但图像质量却很差。为了避免这种无意义的情况,可以考虑用阈值图像的前景总面积与P(k,t)之比来代替SN(k,t)。但是,发明人在实验中又发现另一个极端,就是这样做的结果总是对大面积的目标有利。因为建筑物,背景的目标很大,它们的内部像素点数量远远超过边界像素点。
最后,发明人发现,如果选取相邻指标类的像素点数量之比,可以避免上述种种缺陷。
由此,定义光滑性算子指标SD(k,t)为:
在实验中发明人发现,SD(k,t)很好的描述了图像质量,高SD(k,t)所对应的阈值图像很清晰,边界很光滑,图像内部缺陷很少。根据发明人的实验,ε一般设为5左右为最佳。
在步骤三中,计算SN(2,t)曲线,若SN(2,t31)≥SN(2,t32),则输出t31作为最优阈值,SN(2,t31)<SN(2,t32),则输出t32作为最优阈值,如附图9所示。最终生成的最优阈值图像如附图10所示。
本方法和其他阈值分割方法的对比实验
为了检验本方法的有效性,发明人从GoogleEarth软件平台上采集了100张、71个城市的国际机场照片,包括伦敦、柏林、纽约、巴黎、莫斯科、北京等著名城市。我们和最基本的Otsu方法,比较主流的2维Tsallis熵方法,以及最新的基于结构相似性的PSSIM方法等进行比较
附图11、12、13、14分别提供了柏林、麦卡伦、悉尼、北京国际机场的对比例子。如图11至14所示,图11显示的是几十架不同大小的飞机停放在柏林机场不同区域,阳光很强烈。图12显示的是美国麦卡伦机场停放的双色飞机,机身是蓝色的,翅膀是白色,阳光很强烈。图13显示的是悉尼机场,周围环境复杂,有绿色的农田,暗色的河流。图14显示的是北京南苑机场,停放着两种不同颜色的飞机,周围有许多复杂建筑。
由上可知,本发明的方法对于小目标的分割精度远高于其他方法(至少高出40%)。这表明本发明在一定程度上具备了克服复杂背景干扰,克服强烈阳光干扰,克服低对比度图像等因素影响的能力,非常适合对小目标的分割定位,适合对卫星遥感图像的处理。在许多图像识别领域,如人物、车辆、文字等检测跟踪,只要涉及到小目标的分割定位,都可以应用本发明。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用于目标图像分割的全局阈值分割方法,其特征在于,包括如下步骤:
S1、在总阈值区间内连续改变阈值,得到与阈值对应的目标窗口集合上的0阶类点数P(0,t)的最大值所对应的阈值tmax,得到以该阈值tmax为端点的一个优化阈值区间,其中P(0,t)表示与阈值t对应的阈值图像的目标窗口集合上0阶类点的数目,其中0阶类点表示环绕指标等于0的像素点,环绕指标定义为在阈值图像的前景像素点的3×3像素的邻域内,除该前景像素点之外的其他所有前景像素点的个数除以2再取整后的值;
S2、在所述优化阈值区间上计算光滑性算子SD(3,t)曲线的极值点,若其超过2个,则只保留最大的两个SD(3,t)值所对应的极值点t31、t32,其中D(k,t)表示光滑性算子,并且满足
S3、计算完整性算子SN(2,t31)和SN(2,t32),将其中较大的值所对应的阈值作为最优阈值,并输出该最优阈值对应的阈值图像,其中完整性算子SN(k,t)定义为:
2.如权利要求1所述的用于目标图像分割的全局阈值分割方法,其特征在于,所述步骤S1包括:
步骤S11、根据给定的阈值,生成所述目标图像的阈值图像;
步骤S12、根据给定的目标尺度,在所述阈值图像上形成目标窗口集合;
步骤S13、计算阈值图像的所述目标窗口集合中0阶类点的数目。
3.如权利要求2所述的用于目标图像分割的全局阈值分割方法,其特征在于,所述步骤S12包括:
S121、将阈值图像分割成纵横方向上均匀、紧密排布的网格阵列,并且使该网格阵列的每个网格的尺度相同,且不大于给定的目标尺度;
S122、将所述网格阵列的每个网络作为一个窗口,对所有的窗口进行移动和筛选,得到覆盖目标的多个目标窗口;
S123、基于所述筛选得到的多个目标窗口,对于聚集在一起的窗口,去除聚集区域周边位置的窗口,保留聚集区域中心位置的窗口。
4.如权利要求3所述的用于目标图像分割的全局阈值分割方法,其特征在于,在步骤S121中,使网格的尺度小于给定的目标尺度的1/2,以提高目标窗口的采样精度。
5.如权利要求3所述的用于目标图像分割的全局阈值分割方法,其特征在于,步骤S122包括:
首先,计算每个窗口的前景的几何中心,并将该窗口平行移动,使该窗口的中心移动到该前景几何中心。
然后,计算移动后的窗口的前景面积占窗口总面积的比例r,筛选出该比例r在一定范围内的窗口。
6.如权利要求5所述的用于目标图像分割的全局阈值分割方法,其特征在于,0.05≤r≤0.3。
7.如权利要求5所述的用于目标图像分割的全局阈值分割方法,其特征在于,所述步骤S122还包括:排除前景灰度和背景灰度差别较小的窗口。
8.如权利要求3所述的用于目标图像分割的全局阈值分割方法,其特征在于,所述步骤S123包括:
将与其他窗口距离较远的一个窗口,或者相互之间距离较近的多个窗口归为一个窗口群;并且,对于每一个窗口群,只保留一个窗口。
9.如权利要求8所述的用于目标图像分割的全局阈值分割方法,其特征在于,所述步骤S123包括:
首先,计算所有窗口之间的距离;
接着,任选一个窗口作为第一窗口W1,建立第一窗口群C1,并将窗口W1归类为第一窗口群C1。
然后,依次选择第二至第M窗口,即窗口W2~WM,对于其中的任意一个窗口Wi,1≤i≤M,假设当前已建立的窗品群为C1~Cn,n≤N,若第i窗口Wi到第j窗口群Cj的最小距离小于窗品群中的窗口间的最大距离dw,1≤j≤n,并且第i窗口Wi到第j窗口群的中心距离小于窗口到窗口群中心之间的距离的最大距离dc,则将窗口Wi归为窗口群Cj;否则,建立一个新的窗口群Cn+1,将该窗口Wi归为该新窗口群Cn+1。
对所有窗口均归类为窗口群之后,对于每一个窗口群,仅保留前景面积最大的窗口。
10.如权利要求1所述的用于目标图像分割的全局阈值分割方法,其特征在于,所述步骤S2中对于256阶灰度图像计算极值点的步骤包括:
步骤S21:输入曲线数组a,将曲线数组a的值域归一化到[0,3],定义域为[0,255];
步骤S22:在[0,255]范围内,对曲线数组做5个像素点的平均值滤波;
步骤S23:将[0,255]等分成26个区间,前25个区间的间隔是10,最后一个是5;
步骤S24:求出26个区间内的极大值点pi,i=0,…,25;
步骤S25:对每一个极大值点pi,建立一个左区间[pi-10,pi],一个右区间[pi,pi+10],限制左区间的起点≥0,右区间的终点≤255;
步骤S26:计算左区间的极大值点pi0和右区间的极大值点pi1,计算左区间的极小值像素点pi2和右区间的极小值像素点pi2;
步骤S27:若pi满足下列5个条件中任意一个,则极值点pi被过滤掉:
①a[pi]<0.5;
②pi0≠pi;
③pi1≠pi;
④a[pi]-a[pi2]<0.15;
⑤a[pi]-a[pi3]<0.15。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210266562.1A CN102819841B (zh) | 2012-07-30 | 2012-07-30 | 用于目标图像分割的全局阈值分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210266562.1A CN102819841B (zh) | 2012-07-30 | 2012-07-30 | 用于目标图像分割的全局阈值分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102819841A true CN102819841A (zh) | 2012-12-12 |
CN102819841B CN102819841B (zh) | 2015-01-28 |
Family
ID=47303944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210266562.1A Active CN102819841B (zh) | 2012-07-30 | 2012-07-30 | 用于目标图像分割的全局阈值分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102819841B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279748A (zh) * | 2014-06-18 | 2016-01-27 | 江南大学 | 一种快速的像素尺度计算方法 |
CN105389811A (zh) * | 2015-10-30 | 2016-03-09 | 吉林大学 | 一种基于多级阈值分割的多模态医学图像处理方法 |
CN106023143A (zh) * | 2016-05-06 | 2016-10-12 | 中铁大桥科学研究院有限公司 | 一种跨海桥梁施工处波浪高度监测预警方法 |
CN109118509A (zh) * | 2018-08-16 | 2019-01-01 | 深圳市天英联合教育股份有限公司 | 板书图像的处理方法、装置、设备及存储介质 |
CN109214996A (zh) * | 2018-08-29 | 2019-01-15 | 深圳市元征科技股份有限公司 | 一种图像处理方法及装置 |
CN110210437A (zh) * | 2019-06-10 | 2019-09-06 | 上海联影医疗科技有限公司 | 一种图像中人体区域的确定方法及系统 |
CN112102350A (zh) * | 2020-08-28 | 2020-12-18 | 西安工程大学 | 一种基于Otsu和Tsallis熵的二次图像分割方法 |
CN112446894A (zh) * | 2020-12-04 | 2021-03-05 | 沈阳工业大学 | 基于方向空间的图像分割方法 |
CN113515981A (zh) * | 2020-05-22 | 2021-10-19 | 阿里巴巴集团控股有限公司 | 识别方法、装置、设备和存储介质 |
CN114782379A (zh) * | 2022-04-27 | 2022-07-22 | 北京航空航天大学 | 一种基于结构信息原理的图像层谱分割方法 |
CN117831033A (zh) * | 2024-03-04 | 2024-04-05 | 南京市浦口人民医院(江苏省人民医院浦口分院) | 基于图像分析的病原微生物智能提取识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7356182B1 (en) * | 2002-12-06 | 2008-04-08 | Altera Corporation | Method and apparatus for measuring image complexity |
US20080118136A1 (en) * | 2006-11-20 | 2008-05-22 | The General Hospital Corporation | Propagating Shell for Segmenting Objects with Fuzzy Boundaries, Automatic Volume Determination and Tumor Detection Using Computer Tomography |
CN101236607A (zh) * | 2008-03-03 | 2008-08-06 | 哈尔滨工程大学 | 一种用于灰度图像快速多阈值分割的方法 |
CN101777180A (zh) * | 2009-12-23 | 2010-07-14 | 中国科学院自动化研究所 | 基于背景建模和能量最小化的复杂背景实时替换方法 |
CN101976437A (zh) * | 2010-09-29 | 2011-02-16 | 中国资源卫星应用中心 | 基于自适应阈值分割的高分辨率遥感影像变化检测方法 |
US20110299777A1 (en) * | 2010-06-03 | 2011-12-08 | Space Administration | System and method for improved computational processing efficiency in the hseg algorithm |
-
2012
- 2012-07-30 CN CN201210266562.1A patent/CN102819841B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7356182B1 (en) * | 2002-12-06 | 2008-04-08 | Altera Corporation | Method and apparatus for measuring image complexity |
US20080118136A1 (en) * | 2006-11-20 | 2008-05-22 | The General Hospital Corporation | Propagating Shell for Segmenting Objects with Fuzzy Boundaries, Automatic Volume Determination and Tumor Detection Using Computer Tomography |
CN101236607A (zh) * | 2008-03-03 | 2008-08-06 | 哈尔滨工程大学 | 一种用于灰度图像快速多阈值分割的方法 |
CN101777180A (zh) * | 2009-12-23 | 2010-07-14 | 中国科学院自动化研究所 | 基于背景建模和能量最小化的复杂背景实时替换方法 |
US20110299777A1 (en) * | 2010-06-03 | 2011-12-08 | Space Administration | System and method for improved computational processing efficiency in the hseg algorithm |
CN101976437A (zh) * | 2010-09-29 | 2011-02-16 | 中国资源卫星应用中心 | 基于自适应阈值分割的高分辨率遥感影像变化检测方法 |
Non-Patent Citations (2)
Title |
---|
湛永松等: "基于图切分的交互式图像分割算法", 《系统仿真学报》 * |
陈睿等: "结合强度和边界信息的非参数前景背景分割方法", 《计算机辅助设计与图形学学报》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279748B (zh) * | 2014-06-18 | 2017-11-17 | 江南大学 | 一种快速的像素尺度计算方法 |
CN105279748A (zh) * | 2014-06-18 | 2016-01-27 | 江南大学 | 一种快速的像素尺度计算方法 |
CN105389811A (zh) * | 2015-10-30 | 2016-03-09 | 吉林大学 | 一种基于多级阈值分割的多模态医学图像处理方法 |
CN106023143A (zh) * | 2016-05-06 | 2016-10-12 | 中铁大桥科学研究院有限公司 | 一种跨海桥梁施工处波浪高度监测预警方法 |
CN106023143B (zh) * | 2016-05-06 | 2018-11-13 | 中铁大桥科学研究院有限公司 | 一种跨海桥梁施工处波浪高度监测预警方法 |
CN109118509A (zh) * | 2018-08-16 | 2019-01-01 | 深圳市天英联合教育股份有限公司 | 板书图像的处理方法、装置、设备及存储介质 |
CN109214996B (zh) * | 2018-08-29 | 2021-11-12 | 深圳市元征科技股份有限公司 | 一种图像处理方法及装置 |
CN109214996A (zh) * | 2018-08-29 | 2019-01-15 | 深圳市元征科技股份有限公司 | 一种图像处理方法及装置 |
CN110210437A (zh) * | 2019-06-10 | 2019-09-06 | 上海联影医疗科技有限公司 | 一种图像中人体区域的确定方法及系统 |
US11907838B2 (en) | 2020-05-22 | 2024-02-20 | Alibaba Group Holding Limited | Recognition method, apparatus, and device, and storage medium |
CN113515981A (zh) * | 2020-05-22 | 2021-10-19 | 阿里巴巴集团控股有限公司 | 识别方法、装置、设备和存储介质 |
CN112102350A (zh) * | 2020-08-28 | 2020-12-18 | 西安工程大学 | 一种基于Otsu和Tsallis熵的二次图像分割方法 |
CN112446894A (zh) * | 2020-12-04 | 2021-03-05 | 沈阳工业大学 | 基于方向空间的图像分割方法 |
CN112446894B (zh) * | 2020-12-04 | 2024-03-26 | 沈阳工业大学 | 基于方向空间的图像分割方法 |
CN114782379A (zh) * | 2022-04-27 | 2022-07-22 | 北京航空航天大学 | 一种基于结构信息原理的图像层谱分割方法 |
CN117831033A (zh) * | 2024-03-04 | 2024-04-05 | 南京市浦口人民医院(江苏省人民医院浦口分院) | 基于图像分析的病原微生物智能提取识别方法 |
CN117831033B (zh) * | 2024-03-04 | 2024-05-07 | 南京市浦口人民医院(江苏省人民医院浦口分院) | 基于图像分析的病原微生物智能提取识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102819841B (zh) | 2015-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102819841B (zh) | 用于目标图像分割的全局阈值分割方法 | |
CN103218831B (zh) | 一种基于轮廓约束的视频运动目标分类识别方法 | |
CN102509091B (zh) | 一种飞机尾号识别方法 | |
CN103383733B (zh) | 一种基于半机器学习的车道视频检测方法 | |
CN109614936B (zh) | 遥感图像飞机目标的分层识别方法 | |
CN102509098B (zh) | 一种鱼眼图像车辆识别方法 | |
CN103984946B (zh) | 一种基于K‑means的高分辨率遥感地图道路提取方法 | |
Alidoost et al. | A CNN-based approach for automatic building detection and recognition of roof types using a single aerial image | |
CN106815583B (zh) | 一种基于mser和swt相结合的夜间车辆车牌定位方法 | |
CN103218816A (zh) | 一种基于视频分析的人群密度估计方法与人流量统计方法 | |
CN103514448A (zh) | 船形识别方法和系统 | |
CN107944353B (zh) | 基于轮廓波bspp网络的sar图像变化检测方法 | |
CN102779273A (zh) | 一种基于局部对比模式的人脸识别方法 | |
CN104077605A (zh) | 一种基于颜色拓扑结构的行人搜索识别方法 | |
CN103793708A (zh) | 一种基于仿射校正的多尺度车牌精准定位方法 | |
An et al. | An automated airplane detection system for large panchromatic image with high spatial resolution | |
CN107154044B (zh) | 一种中餐食物图像的分割方法 | |
CN104809433A (zh) | 一种基于最大稳定区域和随机采样的斑马线检测方法 | |
CN105512622B (zh) | 一种基于图分割和监督学习的可见光遥感图像海陆分割方法 | |
Lin et al. | Application research of neural network in vehicle target recognition and classification | |
CN104851089A (zh) | 一种基于三维光场的静态场景前景分割方法和装置 | |
CN104318051A (zh) | 基于规则的大范围水体信息遥感自动提取系统及方法 | |
CN110310263B (zh) | 一种基于显著性分析和背景先验的sar图像居民区检测方法 | |
Harianto et al. | Data augmentation and faster rcnn improve vehicle detection and recognition | |
CN111524121A (zh) | 一种基于机器视觉技术的路桥病害自动检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |