一种自适应任意形状的数据场图像特征建模方法
技术领域
本发明属于图像识别技术领域,涉及一种自适应任意形状的数据场图像特征建模方法。
背景技术
图像目标模式识别是计算机视觉领域的重要研究方向之一,其中特征提取是首要关键环节,一直以来都受到广大研究者的广泛关注,在安全监控、军事侦察、摄影测量、灾害监测、气象预报、产品检验、人机交互和医学诊断等方面也已经取得了成功应用。特征是表征图像目标本质属性的信息集,是解决图像目标识别等问题的根本。特征提取的目标是获取一组少而精的特征量,独立、完备地反映图像内容。图像空间分辨率的提高使得大量细节信息在图像上充分表征,但是,传统特征建模方法不能有效描述复杂的高分辨率图像空间信息。
迄今为止,国内外研究者对图像特征提取问题展开了系列研究,与之相关的新算法、新技术层出不穷。灰度共生矩阵、空间自相关、小波等方法能提供相对有效的图像特征,但是,这些方法未能充分利用高分辨率图像的特点,有针对性地提取图像的形状、结构、大小等视觉敏感信息。其中近年来的一类方法采用模拟物理学的机制研究图像特征问题。如Nixon提出了模拟万有引力的力场收敛变换法并应用到人耳识别中,Liu将其改进为多视角变换,徐贵力等人利用该理论检测图像粗大边缘。孙根云等人提出了模拟万有 引力定律的边缘检测方法,Lopez利用三角模进行了扩展。Direkoglu提出了模拟热流的温度界面方法并进行形状提取。Cummings等人提出了基于光流变换的结构特征检测方法。近年来,其中一类更新颖的方法逐渐浮出水面,陈雪松等人将图像分析中的投影理论与物理学中的势能理论相结合,提出了基于图像势能的二值图像特征提取方法,并进一步研究了图像目标轮廓特征提取方法,蒋少华等人在此基础上研究了针对二值图像的灰度势特征提取方法,理论和实验分析表明了现有方法的可行性和有效性。尽管如此,模拟物理学机制仍然没有引起计算机视觉领域的足够重视,至少在计算机视觉中的研究远远不如智能优化等其他领域那样取得丰硕的成果和大众化的关注。因此,模拟物理学机制的图像特征提取仍然是一个开放式课题,尚存在可拓展空间。
事实上,各种物理模型和机制的根源都是物质之间的相互作用,统一场论是现代物理学的重要方向之一,根据场(或场的量子)的传递媒介性,用场统一地描述和揭示各种相互作用的共同本质和内在联系,在物理学对于客观世界的认知中起到了重要的作用。中国学者李德毅等人将现代物理学中对客观世界的认知理论引申到对主观世界的认知中,形成了数据场的思想,通过考察数据对象间的相互作用并建立场描述原始、混乱、复杂、不成形的数据关联,揭示不同抽象程度或概念层次上的知识,理论体系相对完备,并广泛应用于数据挖掘与知识发现、空间信息处理、图像分析与处理、智能优化、物流管理等领域。有鉴于此,抛开固有的物理形态,从场论的角度出发建立更一般的映射关系及其理论框架,进一步提出更鲁棒高效的图像特征提取方法是有益的。但是,传统的数据场方法仅对图像实施窗口操作,提取的图像特征极其有限。
发明内容
本发明的目的是提供一种自适应任意形状的数据场图像特征建模方法,检测的图像像素邻域能力高,不需要对图像实施窗口操作。
本发明所采用的技术方案是,一种自适应任意形状的数据场图像特征建模方法,具体按照以下步骤进行:
步骤1,可伸缩型任意形状数据场的构建,包括将传统的图像数据场方法扩展,增加形状要素,可充分顾及像素的空间信息上下文,通过增强位于相同形状区域的像素之间相互作用,减小这些像素在数据场中的分布差异,降低、消除噪声污染和光照不均匀带来的负面影响;反之,通过减小不同形状区域的像素之间相互作用,增大这些像素在数据场中的分布差异;
步骤2,鲁棒的数据场分布特征集计算算法,包括长轴、短轴、离心率、场分布指数、加权场分布指数、局部势方差计算方法;
步骤3,自适应图像特征选择与降维建模过程,包括矢量相似性、降维方法。
优选的,步骤1中,匹配增加形状要素,对传统数据场势值的计算公式进行修正,如式(5)所示,
其中是q对p的作用势,无需计算所有像素之间的相互作用,仅考虑符合形状约束范围ξ(p)内的部分质点作用,即同时满足三个形状约束,作用像素与中心像素在方向因子控制的方向线上、距离不大于尺度因子,质量因子为1。
优选的,所述方向因子、尺度因子、质量因子计算方法如下:
a)方向因子:ρd的确定采用图像处理领域惯常的方法,对图像多次进行实验,研究不同参数对实际建模效果的影响,反复尝试不同的参数确定较优的经验值;
b)质量因子:采用式(7)的自适应方法,仅当质量因子为1才有可能继续延伸形状,设μp,σp,μ,σ分别表示当前中心像素p的局部邻域灰度均值、标准差以及图像整体的灰度均值、标准差,gp为自适应局部质量度量;
gp=min(max(μp-0.5σp,μ-0.5σ),μ+0.5σ), (6)
c)尺度因子:对于任意形状区域的中心像素势值而言,通过搜索最大化的Shannon熵自动获得适用于给定图像的最优扩展形状要素集;
其中Bins表示离散划分势值直方图的子区间个数,根据图像灰度级的特点可设置为Bins=L,pl表示在当前约束下所建立的数据场中像素的势值落入第l个子区间的概率,在范围内建立不同的数据场,通过搜索最大化的熵自动获得适用于给定图像的最优参数形式化如下:
优选的,所述步骤2中,根据数据场延伸与扩展关系,获得每个数据质点p对应的方向因子扩展的势值贡献直方图,具体形如:
其中表示以p为像素中心的各条方向因子扩展方向的势值贡献;
数据场分布特征集中的长轴定义为方向势值贡献中的最大值,反映数据场势值计算图斑在某个方向因子上的最大同质性能;
数据场分布特征集中的短轴定义为方向势值贡献中的最小值,反映数据场势值计算图斑在某个方向因子上的最小同质性能;
数据场分布特征集中的离心率定义为方向势值贡献中的最小值与最大值的比值关系,反映数据场势值计算图斑在某个方向因子上的同质形状性能,具体计算时借鉴椭圆两焦点间距离和长轴长度的比值表达某一椭圆轨道与理想圆环的偏离,长椭圆轨道离心率高,近于圆形的轨道离心率低;为简化操作,同时保证计算特征的鲁棒性,直接采用前k个最小值和与前k个最大值和的比值,具体如下式,
数据场分布特征集中的场分布指数定义为当前像素的势值均值,综合反映图像上下文的形状信息,
数据场分布特征集中的加权场分布指数定义为场分布指数的加权,增加与同质性有关的权重指数,方式如下,表示同质性能越低,势值计算的贡献 在特征集中的比重也越低,其中σi表示第i个方向上势值贡献的标准差;
数据场分布特征集中的局部势方差定义为势值贡献与均值的偏差,衡量同质形状的总体分散情况,具体如下,
优选的,所述步骤3中,选用标准欧式距离计算方式作为特征相似性度量,具体标准化过程为,
换句话说,对于任意两个给定的n维特征集F1=(f11,f12,...,f1n)和F2=(f21,f22,...,f2n),可以计算其特征相似距离为,
依次计算所有特征的相似距离,选出距离最小的两个特征F1和F2,再依次计算F1和F2与其他特征的相似距离之和,取距离和小者,并删除对应的特征,直至满足特征数足够少为止。
本发明的有益效果是抛弃传统的窗口操作,直接根据图像局部同质特征建立了任意形状的数据场图像特征建模方法,并在此基础上,提出了自适应的多元结构特征集及特征选择方法。本发明所提出的一种自适应任意形状的数据场图像特征建模方法,根据图像特征,自动提取图像像素邻域范围内多个方向的空间信息,描述像素上下文的形状、结构特性,从空间形状的角度 提取图像特征,弥补传统方法的不足,更进一步,将该数据场模型扩展,构造多元结构特征集,提出了长轴、短轴、离心率、场分布指数、加权场分布指数、局部势值方差等多种特征指数,更全面地描述图像空间上下文结构,通过相似性函数降低维数算法,自适应提取图像的特征子集。
另外,本发明还具有以下优点:
1)传统方法采用固定窗口操作,本发明取消了严格的窗口操作。
2)本发明最大限度保持原始图像的灰度特征。
3)传统方法检测的图像像素邻域能力有限,本发明同时探测36个以上方向。
附图说明
图1是任意形状数据场建模示意图。
具体实施方式
一种自适应任意形状的数据场图像特征建模方法,具体按照以下步骤进行:
步骤1,可伸缩型任意形状数据场的构建,包括将传统的图像数据场方法扩展,增加形状要素,可充分顾及像素的空间信息上下文,主要思路是通过增强位于相同形状区域的像素之间相互作用,减小这些像素在数据场中的分布差异,降低、甚至消除噪声污染和光照不均匀等带来的负面影响;反之,通过减小不同形状区域的像素之间相互作用,增大这些像素在数据场中的分布差异。
场是物质存在的基本形态之一,也是描述空间中对象相互作用的一个重要方式,揭示了物理量或者数学函数在决策空间内的分布规律。场本身的性质与坐标选择无关,对各种场的分析和计算应该选择适当的坐标系,以简化 分析和计算。借鉴物理学中的场描述数据对象的相互作用,形成了数据场的思想。
给定空间中包含的n个数据对象{x1,x2,...,xn},xi=(xi1,xi2,....,xip)′,i=1,2,...,n。每个对象都相当于p维空间中具有一定质量的质点,其周围存在一个作用场,场内的任何对象都受到其他对象的联合作用,由此在整个论域空间上确定了一个数据场。
根据物理学中稳定有源场的势函数性质,即稳定有源场的势函数是一个关于场空间位置的单值函数,具有各向同性,空间任一点的势值大小与代表场源强度的参数成正比,与该点到场源的距离呈递减关系,即数据场势函数形态的基本准则,理论上说,符合该准则的函数形态都可以用于定义数据场的势函数,常见的可选势函数包括拟重力场、拟核力场、拟静电场等类型,其数学形态分别如下,
其中,mx≥0为数据对象的质量,代表场源强度;||x-y||代表两者之间的距离,包括Euclidean,Manhattan或者Chebyshev距离等;σ∈(0,+∞)用于控制对象间的相互作用力程,称为影响因子;自然数k称为距离指数。
假设图像每个像素是具有一定质量的质点,其周围存在一个局部作用场,位于场内的任何对象都受到其他对象的联合作用,所有图像局部区域的相互作用在图像空间上所构成的整体就形成了图像数据场,任意中心位置(x,y)的图像质点(像素)势值可以表示为:
其中质量m与具体应用有关,所采用的势函数形态为式2的拟核力场,表示位置(p,q)的像素对于中心位置(x,y)的图像像素所产生的势值贡献。上述图像数据场涉及到影响因子、距离和距离指数以及场强质量等待定的关键要素。
如图1所示,扩展形状要素从三个不同侧面控制局部任意形状的建模性能。质量因子ρm是作用像素和被作用像素之间可能产生相互作用力强度的度量,换句话说,当交互质量足够小时,计算任意两个像素之间的相互作用是无意义的。类似的,尺度因子ρs是像素之间产生相互作用力程大小的度量,当交互距离足够大时,也无需计算两者之间的相互作用。方向因子ρd是对图像形状上下文的细节保持能力的度量,当相邻方向角足够小时,势值的计算才有可能精确。从中心出发沿着一系列均匀的方向角向外不断延伸,直至不符合质量因子ρm的要求或者超过了尺度因子ρs定义的范围,其中方向角度由方向因子ρd控制。
为了提高算法效率,也匹配扩展形状要素,对传统数据场势值的计算公式进行修正,如式(5)所示,
其中是q对p的作用势,计算方法有很多种。无需计算所有像素之间的相互作用,仅考虑符合形状约束范围ξ(p)内的部分质点作用,即同时满足三个形状约束(作用像素与中心像素在方向因子控制的方向线上、距离不大于尺度因子、质量因子为1)。
扩展形状要素提供了更大的自由度建模,相应最优参数选择包括三个方面:
a)方向因子:ρd的确定可采用图像处理领域惯常的方法,对图像多次进行实验,研究不同参数对实际建模效果的影响,反复尝试不同的参数(trial and error)确定较优的经验值。一般直接设置ρd=10°可检测局部36个方向,完全足够。
b)质量因子:采用式(7)的自适应方法,仅当质量因子为1才有可能继续延伸形状,设μp,σp,μ,σ分别表示当前中心像素p的局部邻域灰度均值、标准差以及图像整体的灰度均值、标准差,式(2)中gp为自适应局部质量度量。
gp=min(max(μp-0.5σp,μ-0.5σ),μ+0.5σ) (6)
c)尺度因子:对于任意形状区域的中心像素势值而言,可通过搜索最大化的Shannon熵自动获得适用于给定图像的最优扩展形状要素集。
其中Bins表示离散划分势值直方图的子区间个数,根据图像灰度级的特点可设置为Bins=L,pl表示在当前约束下所建立的数据场中像素的势值落入第l个子区间的概率。在范围内建立不同的数据场,通过搜索最大化的熵自动获得适用于给定图像的最优参数形式化如下。
步骤2,鲁棒的数据场分布特征集计算算法,包括长轴、短轴、离心率、 场分布指数、加权场分布指数、局部势方差等计算方法。
根据数据场延伸与扩展关系,容易获得每个数据质点p对应的方向因子扩展的势值贡献直方图,具体形如:
其中表示以p为像素中心的各条方向因子扩展方向的势值贡献。
数据场分布特征集中的长轴定义为方向势值贡献中的最大值,反映数据场势值计算图斑在某个方向因子上的最大同质性能。
数据场分布特征集中的短轴定义为方向势值贡献中的最小值,反映数据场势值计算图斑在某个方向因子上的最小同质性能。
数据场分布特征集中的离心率定义为方向势值贡献中的最小值与最大值的比值关系,反映数据场势值计算图斑在某个方向因子上的同质形状性能。具体计算时可以借鉴椭圆两焦点间距离和长轴长度的比值表达某一椭圆轨道与理想圆环的偏离,长椭圆轨道离心率高,近于圆形的轨道离心率低。为简化操作,同时保证计算特征的鲁棒性,也可以直接采用前k个最小值和与前k个最大值和的比值,具体如下式,
数据场分布特征集中的场分布指数(Field Distribution Index,FDI)定义为当前像素的势值均值,综合反映图像上下文的形状信息,
数据场分布特征集中的加权场分布指数定义为场分布指数的加权,增加与同质性有关的权重指数,方法有多种,可以根据具体应用需要自适应选择,一种简化的方式如下,表示同质性能越低,势值计算的贡献在特征集中的比重也越低,其中σi表示第i个方向上势值贡献的标准差。
数据场分布特征集中的局部势方差定义为势值贡献与均值的偏差,衡量同质形状的总体分散情况,具体形如,
步骤3,自适应图像特征选择与降维建模过程,包括矢量相似性、降维等方法。
在数据场分布特征集生成以后,达到了鲁棒稳定的目的,但是,此时众多维信息存在可能的冗余,因此,需要进一步估算不同矢量特征之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算矢量间的距离(Distance,记为Dis)。具体计算也包括很多种方式,如欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离、夹角余弦、汉明距离、杰卡德距离与杰卡德相似系数、相关系数与相关距离、信息熵等。
考虑到各维特征数值的不一致性,同时为简化计算,这里选用一种标准欧式距离计算方式作为特征相似性度量,具体标准化过程为,
(式17)
换句话说,对于任意两个给定的n维特征集F1=(f11,f12,...,f1n)和F2=(f21,f22,...,f2n),可以计算其特征相似距离为,
(式18)
依次计算所有特征的相似距离,选出距离最小的两个特征F1和F2,再依次计算F1和F2与其他特征的相似距离之和,取距离和小者,并删除对应的特征。直至满足特征数足够少为止。