CN103530633A - 一种图像局部不变特征的语义映射方法及语义映射系统 - Google Patents

一种图像局部不变特征的语义映射方法及语义映射系统 Download PDF

Info

Publication number
CN103530633A
CN103530633A CN201310468210.9A CN201310468210A CN103530633A CN 103530633 A CN103530633 A CN 103530633A CN 201310468210 A CN201310468210 A CN 201310468210A CN 103530633 A CN103530633 A CN 103530633A
Authority
CN
China
Prior art keywords
sigma
image
vector
module
coloured image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310468210.9A
Other languages
English (en)
Other versions
CN103530633B (zh
Inventor
李岩山
谢维信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Plant Protection Uav Technology Co ltd
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201310468210.9A priority Critical patent/CN103530633B/zh
Publication of CN103530633A publication Critical patent/CN103530633A/zh
Application granted granted Critical
Publication of CN103530633B publication Critical patent/CN103530633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明适用于图像处理技术领域,提供了一种图像局部不变特征的语义映射方法,所述语义映射方法包括以下步骤:步骤A:对彩色图像局部不变特征提取及描述;步骤B:提取局部不变特征后,基于监督模糊谱聚类算法对彩色图像提取的局部不变特征生成视觉词典,所述视觉词典包含有视觉特征与视觉单词的隶属关系;步骤C:根据步骤B生成的视觉词典对步骤A提取的局部不变特征所隶属图像进行语义映射以及图像描述。采用所述的图像局部不变特征的语义映射方法能消除语义鸿沟问题,提高图像分类、图像检索以及目标识别的准确性,可以促进机器视觉的理论和方法的发展。

Description

一种图像局部不变特征的语义映射方法及语义映射系统
技术领域
本发明属于图像处理技术领域,尤其涉及一种图像局部不变特征的语义映射方法及语义映射系统。
背景技术
随着多媒体和互联网技术的迅猛发展,图像资源与日俱增,如何让计算机自动处理和分析这些海量数据已经成为计算机视觉中的一个难题。由于计算机仅能对图像的低层视觉特征,如颜色、纹理、形状等进行处理,而人类对图像的理解总是从图像表达的语义信息进行理解。如果计算机像人类一样能从图像中提取和理解图像的语义信息,那么计算机对图像的自动分析与理解的难题将能得到很好的解决。因此,如何使计算机提取和理解图像语义信息是计算机视觉领域一直关注的热点问题。从图像的低层特征提取语义已成为解决图像低层视觉特征与高级语义之间存在着的差距即“语义鸿沟”的关键技术,它从图像的本质属性中提取特征信息,通过低层特征信息到高层语义的传递、映射和融合过程,形成对图像的语义的描述。图像的语义映射技术已经成为基于内容的图像分类、检索、识别等技术的关键技术之一。
图像的局部不变特征是指描述了图像局部稳定的特性并且具有良好的可区分性的特征,它的核心是不变性,也就是说在发生光照变化、旋转、裁剪、缩放、视角等变化时,所提取的特征都不会发生变化,它对混叠和遮挡也具有很好的克服作用。目前较常用的有SIFT,SURF,SUSAN等等。正是由于图像局部不变特征的这些优良特性,它已经被广泛的应用于图像语义信息提取的研究中。
然而,图像局部不变特征存在低层特征与高层语义之间的“语义鸿沟”,局部不变特征和图像语义没有直接的对应关系。国内外学者提出对局部不变特征的集合通过机器学习构成视觉词典,通过视觉词典来实现语义信息的提取,已经取得了较好的效果。但是由于图像的局部特征很不稳定,同样的物体可能产生出不同的局部特征,相同的局部特征也可能是出自不同的物体,导致视觉词典中的多个视觉单词表示相同的概念即“一义多词”和一个视觉单词对应图像中的不同概念即“一词多义”,从而造成视觉词典中的视觉单词不能准确的表达图像或事物,提取的语义不准确,影响图像分类和目标识别的精确度。
目前,国内外有一大批研究机构在进行图像局部不变特征的语义映射的研究工作,其中包括普林斯顿大学计算机系,美国加州大学伯克利分校的计算机系,斯坦福大学的计算机系,伊利诺斯州立大学的Beckman学会,瑞典的IDIAP研究学会,中国科学院,浙江大学,北京交通大学,上海交通大学,西安电子科技大学等。目前在局部不变特征语义映射方面主要包括采用统计模型和采用概率生成模型两种方法。统计模型主要有词袋模型(Bag of Words,BOW)和潜在语义分析(Latent Semantic Analysis,LSA),概率生成模型主要有概率潜在语义分析(PLSA)、潜在狄里克雷分布(LDA)。下面对现有的比较有代表性的理论和算法进行介绍。
(1)基于统计模型的算法的研究现状
Josef等人提出BOW模型,先对训练图像集进行视觉特征提取、聚类形成视觉词典(visual dictionary)或码本(Code book),词典中的每个视觉单词(Visual Word),对应于图像中的一个局部块特征,再分别把各图像按视觉词典进行量化来表示。这种方法的缺点是未考虑“一义多词”(多个视觉单词表示相同的概念)和“一词多义”(一个视觉单词对应图像中的不同概念)问题。此外,由于图像的量化表示的维数太高,相当于视觉词典容量,导致分类性能低下。Jingen将图像表示成最大化互信息共聚类方式来学习潜在语义,对视觉单词聚类的同时,完成图像场景分类。FeiFei等提出了一种分层的Bayesian模型从低层图像特征提取图像语义,在场景分类中取得了良好的应用效果。Vailaya等提出了由图像的低层基本特征到高层语义分类特征之间进行映射的一种可行的数据描述方法,并通过基于Bayes概率公式的方法加以实现。
国内研究者也较早的开始了这方面的研究,近年来更是涌现了一大批优秀的算法。石跃祥、蔡自兴等从高级信息的角度来描述图像语义,建立图像语义的特征矢量空间和语义划分的结构关系,实现了图像与语义值的结构表达,构建了低层特征到高层语义的映射结构与计算表达式,并将特征值应用于图像检索。莫浩澜等通过在低层视觉特征上提取图像的局部颜色和纹理特征,再利用模糊神经网络建立低层视觉特征和高层语义特征之间的映射,实现了图像属性信息的有效传递和可靠检索。段菲和章毓晋提出了一种基于有监督子空间建模和稀疏表示的场景分类算法。该算法将采用非监督方式求取所有场景类别公共字典的稀疏编码模型分解为一系列各目标函数相互独立的多目标优化问题,实现了各类别字典的有监督学习。在所有类别的字典学习完毕后,再以各子空间和的基集来对每幅图像中所有局部特征进行协同编码,并借助空间金字塔表示(SPR)和特征各维最大汇总(max pooling)构成最终图像的全局特征表示。傅光磊、蒋兴浩等人提出了分层语义模型,将复杂语义进行解析从而形成层次化结构,并提出了与分层语义模型相对应的语义绑定的分层视觉词汇库,给出了构建词汇库的方法,并在基于内容和语义的图像检索系统进行了应用。赵春晖和王莹提出了一种基于兴趣区域(Region Of Interest,ROI)提取以及金字塔匹配原理的优化方法,在此基础上构建了词袋模型。王宇新和郭禾等人以传统的词袋模型为基础,根据同类场景图像具有空间相似性的特点,提出了一种用于图像场景分类的空间视觉词袋模型。首先将图像进行不同等级的空间划分,针对对应空间子区域进行特征提取和k均值聚类,形成该区域的视觉关键词,进而构建整个训练图像集的空间视觉词典。贾世杰和孔祥维提出基于数据驱动的核函数构建方法;并结合词包(BOW)模型,设计了一种基于TF-IDF规则的加权二次卡方(Weighted QuadriticChisquared,WQC)距离的直方图核函数。朱旭锋,马彩文和刘波为了解决飞机、直升机、导弹等三类空中目标图像的自动分类问题,提出了一种基于改进词袋模型的空中目标识别方法。庄凌和庄越挺等人提出通过研究文本与图像两种模态之间关系来构建反映两者间潜在语义关联的有效模型的思路,该模型使用稀疏的相关性分析方法提高模型可解释性和保证检索结果稳定性。
(2)基于概率生成模型的算法的研究现状
概率生成模型主要包括概率潜在语义分析(probabilisticLatentSemanticAnalysis,PLSA)和潜在狄利克雷分布(LatentDirichletAllocation,LoA)等。将图像看作是由多个语义主题所构成的场景,也可把其中发现的语义主题看作是目标类,那么一幅包含多个目标实例的场景可认为是由一组主题混合构建的概率模型而形成,通过场景中语义主题的分布划分语义类别。Pedro和Anna等学者认为PLSA模型在生成鲁棒的低维场景表示的同时,可以捕获有意义的场景主题。他们在使用灰度SIFT特征的基础上建立Bow描述,采用PLSA模型来产生图像场景的潜在语义信息,实现场景类的判别。Florent等人根据所有待考察的场景内容,在利用高斯混合模型(GaussianMixtureModel,GMM)对视觉词汇表进行建模的基础上,定义了一个通用视觉词典,在此基础上调整生成类视觉词典,并采用一组直方图,每个直方图对应某一类别,以判断图像适合采用何种视觉词典进行建模。FeifeiLi和Lijia Li提出了两种LDA的变形模型用于场景分类。在场景主题分布不变的前提下,通过对各场景类图像进行有监督的模型学习,将局部区域聚类为不同的主题(局部语义概念)。局部区域和中层语义的分布通过概率生成模型学习,避免了人为的图像标注过程。Anna Bosch等人首先利用概率潜在语义分析(PLSA)在每个图像数据上发现主题语义,然后利用多类分类器对每副图像的主题分布矢量进行分类。李志欣和施智平等人在概率潜语义分析的基础上,提出了一种融合语义主题的方法以进行图像的标注和检索,设计了一个概率模型分别从视觉模态和文本模态中捕获潜在语义主题,并提出了一种自适应的不对称学习方法融合两种语义主题,于是融合之后的概率模型适当地关联了视觉模态和文本模态的信息。
发明内容
本发明所要解决的技术问题在于提供一种图像局部不变特征的语义映射方法及语义映射系统,旨在解决局部不变特征与图像语义之间的映射的一词多义和一义多词的问题。
本发明是这样实现的,一种图像局部不变特征的语义映射方法,包括以下步骤:
步骤A:对彩色图像局部不变特征提取及描述;
步骤B:提取局部不变特征后,基于监督模糊谱聚类算法对彩色图像提取的局部不变特征生成视觉词典,所述视觉词典包含有视觉特征与视觉单词的隶属关系;
步骤C:根据步骤B生成的视觉词典对步骤A提取的局部不变特征所隶属图像进行语义映射以及图像描述。
进一步地,所述步骤A包括以下步骤:
步骤A1:对彩色图像建立彩色图像矢量场模型;
步骤A2:建立并分析所述彩色图像矢量场模型中的矢量场尺度空间,在所述矢量场尺度空间中搜索与定位局部不变特征;
步骤A3:对提取的所述局部不变特征进行描述。
进一步地,所述步骤A1包括以下步骤:
步骤A11:对彩色图像f建立的所述彩色图像矢量场模型为:其中e1,e2,e3为超虚构单元;f(x,y)表示彩色图像像素值,x表示像素点的x坐标,y表示像素点的y坐标,fi(x,y)表示彩色图像第i通道的像素值;
步骤A12:对所述彩色图像f进行变换,f(x,y)=flu(x,y)elu+fch(x,y)Ech,其中
Figure BDA0000392848980000061
所述的彩色图像f分成两个量,分别为flu亮度量、fch色度量,flu(x,y)中x表示x轴坐标,y表示y轴坐标,fch(x,y)中x表示x轴坐标,y表示y轴坐标,elu表示亮度投影轴,Ech表示色度投影平面,e1,e2,e3为超虚构单元。
进一步地,所述步骤A2包括以下步骤:
步骤A21:根据如下公式得到所述彩色图像f的矢量场尺度空间Lc:Lc={Lc(x,y,k∑)|k=1,2,....,m},其中
Figure BDA0000392848980000063
gk表示gk(x,y,∑),fk表示fk(x-i-p,y-j-q),g'l表示g'l(p,q,∑),M和N表示卷积窗口尺寸,Gn+2(·)和f(·)的积是几何积,G3+2(x,y,∑(i))表示高斯核, G 3 + 2 ( x , y , Σ ( i ) ) = Σ i = 1 3 ( 1 2 π ( Σ ( i ) ) 2 exp ( - ( x 2 + y 2 ) 2 ( Σ ( i ) ) 2 ) ) e i , G3+2(x,y,∑(i))中x表示x轴坐标,y表示y轴坐标,f(x,y)表示彩色图像,x表示x轴坐标,y表示y轴坐标,∑(i)=σi,0≤i≤n,σi是第i个通道的图像的高斯滤波函数的方差,为了表示的方便在文中用∑来表示∑(i);
步骤A22:在所述矢量场尺度空间Lc中,通过相邻尺度图像的差分,获得矢量高斯差分图,表示为D(x,y,∑),其中D(x,y,∑)=Lc(x,y,k∑)-Lc(x,y,∑),k为两相邻尺度空间尺度的倍数,
Figure BDA0000392848980000065
其中Di,j是矢量空间中的多维矢量,m和n是图像的尺寸。
进一步地,所述步骤A3包括以下步骤:
步骤A31:对于在Lc(x,y,Ω)中的一个特征点,其幅值和m(x,y)和方向θ(x,y)表示为:
m ( x , y ) = ( | L c ( x + 1 , y , Σ ) - L c ( x - 1 , y , Σ ) | ) 2 + ( | L c ( x , y + 1 , Σ ) - L c ( x , y - 1 , Σ ) | ) 2 ,
θ ( x , y ) = arccos ( ( L c ( x + 1 , y , Σ ) - L c ( x - 1 , y , Σ ) ) · ( L c ( x , y + 1 , Σ ) - L c ( x , y - 1 , Σ ) ) | ( L c ( x + 1 , y , Σ ) - L c ( x - 1 , y , Σ ) ) | | ( L c ( x , y + 1 , Σ ) - L c ( x , y - 1 , Σ ) ) | )
步骤A32:通过方向直方图来对特征点周围的方向进行统计,具有最大统计值的方向作为所述特征点的主方向,并形成特征描述矢量。
进一步地,所述步骤B包括以下步骤:
步骤B1:根据数据集构造一个无向加权图G={V,E},其表示形式为一对称矩阵W=[Wij]n×n,称该矩阵为相似矩阵,其中Z是顶点的集合,Wij表示连接顶点i与j的权值,Wij的值由测度函数
Figure BDA0000392848980000075
决定;
步骤B2:根据每个特征的类别信息建立每个特征对应类别的隶属度函数,根据隶属度函数重新调整相似矩阵W,生成模糊相似矩阵W’;
步骤B3:构造矩阵V=[v1,v2,…,vq]∈Rn×q,其中,vi为列向量,v1,v2,…,vq为H的q个最大特征值所对应的特征向量,L为对角度矩阵
Figure BDA0000392848980000073
w′ij=f(wijikjk);
步骤B4:将矩阵V的行向量规范化,得到矩阵Y,其中
Figure BDA0000392848980000074
将Y的每一行看成是Rq空间内的一点,使用核模糊C均值聚类将其聚为q类,图像局部不变特征在经过模糊谱聚类后形成q个聚类中心矢量,所述中心矢量即视觉单词,属于同一类物体目标的特征形成一个特定的单词词典,这些视觉单词词典组成一个视觉词典集合VW={VW1,VW2,...,VWm},其中VWi={vwi1,vwi2,...,vwik}为每个物体的视觉词典。
进一步地,所述步骤C包括以下步骤:
步骤C1:根据步骤A的方法提取测试图像f的局部不变特征,得到特征集合为:S={s1,s2,...sn},其中si为提取的局部不变特征,n为提取的特征个数;
步骤C2:定义视觉特征si到视觉单词vjt的隶属度函数为μ(si,vjt,L),其中L为视觉特征si到视觉单词vjt在空间上的拓扑关系;
设置隶属度函数为:
μ vw ik ( st i ) = 1 1 + [ α ( d ′ - γ ) ] β , d ′ > γ 1 , d ′ ≤ γ
其中
Figure BDA0000392848980000082
di=|vwik,sti|,是vwik,sti的欧式距离,dmax是D中的最大值,(α,β,γ)为(2.36881,1.40572,160079);
步骤C3:一个视觉特征对每个属于不同物体类别的视觉单词具有一个在[0,1]间的隶属度值,将测试图片中提取的所有特征点到视觉单词的隶属度值累加,形成视觉单词隶属度直方图,通过统计方法提取测试图像f含有的语义信息。
本发明还提供一种图像局部不变特征的语义映射系统,包括:
提取及描述模块,用于对彩色图像局部不变特征提取及描述;
视觉词典生成模块,利用模糊集理论基于有监督模糊谱聚类的方法生成视觉词典;
映射及描述模块,用于对基于局部不变特征隶属度的图像进行语义映射以及图像描述。
进一步地,所述提取及描述模块包括:
模型建立模块,用于对彩色图像建立彩色图像矢量场模型;
矢量场尺度空间建立与分析模块,用于建立并分析所述彩色图像矢量场模型的矢量场尺度空间,在所述矢量场尺度空间模块中搜索与定位局部不变特征;
特征提取和描述模块,用于对提取的所述局部不变特征进行矢量描述;
所述模型建立模块包含矢量场模型建立模块和图像变换模块;
所述矢量场模型建立模块生成的彩色图像矢量场模型为:
Figure BDA0000392848980000083
其中e1,e2,...,en为超虚构单元;f(x,y)表示彩色图像像素值,x表示像素点的x坐标,y表示像素点的y坐标,fi(x,y)表示彩色图像第i通道的像素值;
所述图像变换模块,对所述彩色图像f进行变换f(x,y)=flu(x,y)elu+fch(x,y)Ech,其中
Figure BDA0000392848980000091
所述的彩色图像f分成两个量,分别为flu亮度量、fch色度量,flu(x,y)中x表示x轴坐标,y表示y轴坐标,fch(x,y)中x表示x轴坐标,y表示y轴坐标,elu表示亮度投影轴,Ech表示色度投影平面,e1,e2,...,en为超虚构单元;
所述矢量场尺度空间建立与分析模块包含矢量场尺度空间建立模块和彩色图像SIFT特征提取模块;
所述矢量场尺度空间建立模块,根据公式Lc={Lc(x,y,kΩ)|k=1,2,....,m}得到矢量场尺度空间,其中
Figure BDA0000392848980000092
Figure BDA0000392848980000093
gk表示gk(x,y,∑),fk表示fk(x-i-p,y-j-q),g'l表示g'l(p,q,∑),M和N表示卷积窗口尺寸,Gn+2(·)和f(·)的积是几何积,G3+2(x,y,∑(i))表示高斯核, G 3 + 2 ( x , y , Σ ( i ) ) = Σ i = 1 3 ( 1 2 π ( Σ ( i ) ) 2 exp ( - ( x 2 + y 2 ) 2 ( Σ ( i ) ) 2 ) ) e i , G3+2(x,y,∑(i))中x表示x轴坐标,y表示y轴坐标,f(x,y)表示彩色图像,x表示x轴坐标,y表示y轴坐标,∑(i)=σi,0≤i≤n,σi是第i个通道的图像的高斯滤波函数的方差,后续用∑来表示∑(i);
所述彩色图像SIFT特征提取模块,在所述矢量场尺度空间Lc中,通过相邻尺度图像的差分,获得矢量高斯差分图,表示为D(x,y,∑),其中D(x,y,∑)=Lc(x,y,k∑)-Lc(x,y,∑),k为两相邻尺度空间尺度的倍数,
其中Di,j是矢量空间中的多维矢量,m和n是图像的尺寸;
所述特征提取和描述模块包含特征点描述模块和彩色图像SIFT特征描述模块;
所述特征点描述模块,对于在Lc(x,y,Ω)中的一个特征点,其幅值和m(x,y)和方向θ(x,y)表示为:
m ( x , y ) = ( | L c ( x + 1 , y , Σ ) - L c ( x - 1 , y , Σ ) | ) 2 + ( | L c ( x , y + 1 , Σ ) - L c ( x , y - 1 , Σ ) | ) 2 ,
θ ( x , y ) = arccos ( ( L c ( x + 1 , y , Σ ) - L c ( x - 1 , y , Σ ) ) · ( L c ( x , y + 1 , Σ ) - L c ( x , y - 1 , Σ ) ) | ( L c ( x + 1 , y , Σ ) - L c ( x - 1 , y , Σ ) ) | | ( L c ( x , y + 1 , Σ ) - L c ( x , y - 1 , Σ ) ) | ) ;
所述彩色图像SIFT特征描述模块,通过方向直方图来对特征点周围的方向进行统计,以具有最大统计值的方向作为所述特征点的主方向,并形成特征描述矢量。
进一步地,所述视觉词典生成模块包含:
对称矩阵模块,根据数据集构造一个无向加权图G={V,E},其表示形式为一对称矩阵W=[Wij]n×n,其中V是顶点的集合,Wij表示连接顶点i与j的权值,Wij的值由测度函数
Figure BDA0000392848980000104
决定;
模糊相似矩阵模块,根据每个特征的类别信息建立每个特征对应类别的隶属度函数,根据隶属度函数重新调整相似矩阵W,生成模糊相似矩阵W’;
构造矩阵模块,用于构造矩阵V=[v1,v2,…,vq]∈Rn×q,其中,vi为列向量,v1,v2,…,vq为H的q个最大特征值所对应的特征向量,
Figure BDA0000392848980000107
L为对角度矩阵
Figure BDA0000392848980000105
w′ij=f(wijikjk);
单词词典模块,将所述矩阵V的行向量规范化,得到矩阵Y,其中
Figure BDA0000392848980000106
将Y的每一行看成是Rq空间内的一点,使用核模糊C均值聚类将其聚为q类,图像局部不变特征在经过模糊谱聚类后形成q个聚类中心矢量,所述中心矢量即视觉单词,属于同一类物体目标的特征形成一个特定的单词词典,这些视觉单词词典组成一个视觉词典集合VW={VW1,VW2,...,VWm},其中VWi={vwi1,vwi2,...,vwik}为每个物体的视觉词典;
所述映射及描述模块包含:特征集合模块,根据步骤A的方法提取测试图像f的局部不变特征,得到特征集合为:S={s1,s2,...sn},其中si为提取的局部不变特征,n为提取的特征个数;
隶属度函数模块,定义视觉特征si到视觉单词vjt的隶属度函数为μ(si,vjt,L),其中L为视觉特征si到视觉单词vjt在空间上的拓扑关系;
设置隶属度函数为: μ vw ik ( st i ) = 1 1 + [ α ( d ′ - γ ) ] β , d ′ > γ 1 , d ′ ≤ γ , 其中 d i = d i d max , di=|vwik,sti|,是vwik,sti的欧式距离,dmax是D中的最大值,(α,β,γ)为(2.36881,1.40572,160079);
语义信息模块,根据视觉特征对每个属于不同物体类别的视觉单词具有一个在[0,1]间的隶属度值,将测试图片中提取的所有特征点到视觉单词的隶属度值累加,形成视觉单词隶属度直方图,并通过统计方法提取测试图像f含有的语义信息。
本发明所述的图像局部不变特征的语义映射方法通过分析图像局部不变特征的语义鸿沟问题,采用模糊集理论进行图像局部不变特征的语义的提取,消除语义鸿沟问题,提高图像分类、图像检索、目标识别的准确性,可以促进机器视觉的理论和方法的发展。
附图说明
图1是本发明图像局部不变特征的语义映射方法的步骤流程图;
图2是本发明具体实施例的方案流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明所述图像局部不变特征的语义映射方法及语义映射系统在模糊集理论的框架下,解决了局部不变特征与图像语义之间的映射的一词多义和一义多词的问题,解决的技术问题主要有:模糊视觉词典的生成方法;基于局部不变特征隶属度的图像语义映射以及图像描述方法。
如图1、图2所示,一种图像局部不变特征的语义映射方法,包括以下步骤:步骤A:对彩色图像局部不变特征提取及描述。在执行步骤A之前需要执行输入训练图像201和输入测试图像202。目前,特征提取算法都是针对灰度图像进行的,在处理彩色图像时,将彩色图像转换为灰度图像或在彩色图像的RGB三个通道上分别进行特征提取,这导致彩色图像的色彩信息丢失,从而使提取的特征的鲁棒性下降。本发明在提取彩色图像的局部不变特征时充分利用色彩信息,对基于彩色矢量分析的彩色图像局部不变特征提取及描述方法进行研究,以提高特征的独特性和鲁棒性,以及特征和语义的对应性。在几何代数的分析理论下,首先建立彩色图像矢量场模型,然后对彩色图像的矢量场尺度空间理论展开研究,接着在矢量场尺度空间中搜索与定位局部不变特征,并对提取的局部不变特征进行矢量描述。具体包括:
对彩色图像建立彩色图像矢量场模型,提取抗亮度变化的色彩成分。
在几何代数中,对彩色图像f建立的所述彩色图像矢量场模型为:
Figure BDA0000392848980000121
其中e1,e2,...,en为超虚构单元;f(x,y)表示彩色图像像素值,x表示像素点的x坐标,y表示像素点的y坐标,fi(x,y)表示彩色图像第i通道的像素值,n为彩色图像的波段数。
通过运用Young-Helmholtz彩色模型理论对所述彩色图像f进行变换,得到:f(x,y)=flu(x,y)elu+fch(x,y)Ech,其中
Figure BDA0000392848980000131
elu表示亮度投影轴,Ech表示色度投影平面,e1,e2,...,en为超虚构单元,所述的彩色图像f分成两个量,分别为flu亮度(强度)量、fch色度(颜色信息)量,这种颜色变换是一个线性映射,所述线性映射是由对角矢量elu=(1,1,1)=iR+iG+iB上颜色空间的颜色矢量值像素和二维平面πch(C)完成的,所述二维平面πch(C)和所述对角矢量elu垂直:πch(C)⊥elu,所述对角矢量elu称作亮度白矢量,所述二维平面πch(C)称作RGB空间的色度平面。因此,每一个像素同时被表示为一个实数flu和一个复数fch,分别对应亮度和色度信息。
分析所述彩色图像矢量场模型中的矢量场尺度空间。传统的图像尺度空间是建立在灰度图像即标量图像上的,而本发明提出在矢量场上建立尺度空间因此所建立起来的尺度空间中的各个尺度图像都是一个矢量场,称它为矢量场尺度空间。
传统的灰度图像的尺度空间是定义为原始图像I(x,y)与一个可变尺度的二维高斯函数G(x,y,delta)卷积运算。在几何代数的彩色空间中,卷积运算定义为:vn(r)=∫∫∫ΩQn(ξ)V(r-ξ)dξ,其中Qn(ξ)和V(r-ξ)均为几何代数空间中的n维多维矢量,他们之间的乘积为几何代数积。
在卷积运算定义的基础上,彩色图像f和高斯核Gn+2(x,y,αΩ的卷积可以表示为: G n + 2 ( x , y , Ω ) ⊗ f ( x , y ) = 1 MN Σ i = 0 M - 1 Σ j = 0 N - 1 ( G n + 2 ( i , j , Ω ) f ( x - i , y - j ) ) .
所述彩色图像f的矢量场尺度空间Lc可以由彩色图像f和高斯核Gn+2(x,y,Ω)的卷积得到,为Lc={Lc(x,y,k∑)|k=1,2,....,m},其中
Figure BDA0000392848980000141
Figure BDA0000392848980000142
gi表示gi(x,y,∑),fi表示fi(x-i-p,y-j-q),g'i表示g'i(p,q,∑),gk表示gk(x,y,∑),fk表示fk(x-i-p,y-j-q),g'l表示g'l(p,q,∑),M和N表示卷积窗口尺寸,Gn+2(·)和f(·)的积是几何积,G3+2(x,y,∑(i))表示高斯核, G 3 + 2 ( x , y , Σ ( i ) ) = Σ i = 1 3 ( 1 2 π ( Σ ( i ) ) 2 exp ( - ( x 2 + y 2 ) 2 ( Σ ( i ) ) 2 ) ) e i , G3+2(x,y,∑(i))中x表示x轴坐标,y表示y轴坐标,f(x,y)表示彩色图像,x表示x轴坐标,y表示y轴坐标,∑(i)=σi,0≤i≤n,σi是第i个通道的图像的高斯滤波函数的方差,为了表示方便,在文中用∑来表示∑(i)。
在所述矢量场尺度空间Lc中,通过相邻尺度图像的差分,获得矢量高斯差分图,表示为D(x,y,∑),其中D(x,y,∑)=Lc(x,y,k∑)-Lc(x,y,∑),k为两相邻尺度空间尺度的倍数,
Figure BDA0000392848980000144
其中Di,j是矢量空间中的多维矢量,m和n是图像的尺寸。
特征搜索策略可以采用SIFT算法的策略,在GA-DoG中进行极值点的搜索和定位。
在所述矢量场尺度空间中搜索与定位局部不变特征,并对提取的所述局部不变特征进行矢量描述。对提取的特征进行矢量化描述对特征的抗色彩变化、抗几何变化、唯一性和后续的计算复杂性等具有极大的影响,本发明从色彩分布、幅值、方向等方面展开特征描述。
对检测到的特征的描述,主要通过为每个特征点分配一个或多个方向和幅值来描述,对于在Lc(x,y,Ω)中的一个特征点,其幅值和m(x,y)和方向θ(x,y)表示为: m ( x , y ) = ( | L c ( x + 1 , y , Σ ) - L c ( x - 1 , y , Σ ) | ) 2 + ( | L c ( x , y + 1 , Σ ) - L c ( x , y - 1 , Σ ) | ) 2 ,
θ ( x , y ) = arccos ( ( L c ( x + 1 , y , Σ ) - L c ( x - 1 , y , Σ ) ) · ( L c ( x , y + 1 , Σ ) - L c ( x , y - 1 , Σ ) ) | ( L c ( x + 1 , y , Σ ) - L c ( x - 1 , y , Σ ) ) | | ( L c ( x , y + 1 , Σ ) - L c ( x , y - 1 , Σ ) ) | ) .
然后通过方向直方图来对特征点周围的方向进行统计,具有最大统计值的方向作为所述特征点的主方向,并形成特征描述矢量。所述的步骤即为彩色图像SIFT特征提取203。
步骤B:提取局部不变特征后,基于监督模糊谱聚类算法对彩色图像提取的局部不变特征生成视觉词典,所述视觉词典包含有视觉特征与视觉单词的隶属关系。
针对语义鸿沟的问题,本发明利用模糊集理论擅长处理不确定性问题的优势,提出基于有监督模糊集谱聚类204的视觉词典生成方法,并对特征相似度度量函数,模糊相似度矩阵生成方法进行分析。
设从n幅p类彩色图像中提取的局部不变特征集合为S={s1,s2,…,sn},这些特征所属的类为:C={c1,c2,...,cp},其中提取的每个特征是m维向量,即si={si1,si2,…,sim},每个特征向量都有类别标签信息。根据给定的数据集构造一个无向加权图G={V,E},其表示形式为一对称矩阵:W=[Wij]n×n,称该矩阵为相似矩阵,其中Z是顶点的集合,Wij表示连接顶点i与j的权值,Wij的值由测度函数
Figure BDA0000392848980000153
决定。
Wij的值由测度函数
Figure BDA0000392848980000154
决定,由于谱聚类算法是一种配对聚类方法,因而相似性度量的选择与算法在实际问题中的性能有着直接的关系,利用好的相似性度量不仅能够获得好的聚类性能,而且可以克服谱聚类算法对尺度参数选择较为敏感这一缺陷。因此在本发明中将对彩色图像的局部不变特征的结构关系,设计测度函数
由于特征存在对应多个语义,一个语义对应多个特征的不确定性问题,根据每个特征的类别信息建立每个特征对应类别的隶属度函数,根据隶属度函数重新调整相似矩阵,生成模糊相似矩阵,其设计方法如下:
由于提取出的局部不变特征有接近的特征,根据他们的距离将接近的特征归为同一个特征。设提取的彩色图像局部不变特征si∈ca,sj∈cb,则当dij=|sisj|<ε,则si=sj,其中ε为阈值,dij为欧式距离。
设与si的距离小于ε的特征集合为:S'i={si,sj|dij<ε},这些特征属于的类ck的集合为:C'k={ck|sj∈ck,sj∈S'i},则si属于C'k的隶属度函数为
Figure BDA0000392848980000161
其中count(S'i)为S'i中的元素个数,根据上式可以得到隶属度矩阵Τ={μik}。
用μik作为权值通过以下函数调整相似矩阵W:w′ij=f(wijikjk)。
通过函数f调整连接顶点i与j的权值,从而得到模糊相似矩阵W’。
构造Laplacian矩阵
Figure BDA0000392848980000164
其中L为对角度矩阵
Figure BDA0000392848980000162
求H的q个最大特征值所对应的特征向量v1,v2,…,vq,构造矩阵:V=[v1,v2,…,vq]∈Rn×q,其中,vi为列向量。
规范化V的行向量,得到矩阵Y,其中
Figure BDA0000392848980000163
将Y的每一行看成是Rq空间内的一点,使用核模糊C均值聚类将其聚为q类。如果Y的第i行属于第j类,则将原数据点xi也划分到第j类。
生成视觉词典205,图像局部不变特征在经过上述的模糊谱聚类204后形成q个聚类中心矢量,这些中心矢量即视觉单词,属于同一类物体目标的特征形成一个特定的单词词典,这些视觉单词词典组成一个视觉词典集合VW={VW1,VW2,...,VWm},其中VWi={vwi1,vwi2,...,vwik}为每个物体的视觉词典。
步骤C:根据步骤B生成的视觉词典对步骤A提取的局部不变特征所隶属图像进行语义映射以及图像描述。
设测试图像f,使用本发明所述的彩色图像特征提取方法提取203f的局部不变特征,得到特征集合为:S={s1,s2,...sn},其中si为提取的局部不变特征,n为提取的特征个数。
设由前面所提视觉词典生成算法得到的视觉词典集合为{VW1,VW2,...,VWm},其中VWi为一个物体目标的视觉词典,它由若干个视觉单词组成,即:VWi={vwi1,vwi2,...,vwik},其中vwij为视觉单词,k为VWi中的视觉单词的数量。
特征与视觉单词的相似度度量206,由于传统的视觉特征到视觉单词的映射过程中,存在视觉特征与多个视觉单词存在不同程度的相似度,采用精确的阈值进行划分容易造成图像描述不准确,因此本发明采用模糊多值逻辑方法进行特征到视觉单词的映射,定义视觉特征si到视觉单词vjt的隶属度函数为μ(si,vjt,L),其中L为视觉特征si到视觉单词vjt在空间上的拓扑关系。
视觉单词隶属度直方图描述图像207,一个视觉特征对每个属于不同物体类别的视觉单词具有一个在[0,1]间的隶属度值,将测试图片中提取的所有特征点到视觉单词的隶属度值累加,从而形成视觉单词隶属度直方图,通过统计方法提取测试图像f含有的语义信息。
基于上述图像局部不变特征语义映射方法的基础上,本发明还提供了图像局部不变特征的语义映射系统,包括:提取及描述模块、视觉词典生成模块和映射及描述模块。所述提取及描述模块用于对彩色图像局部不变特征提取及描述,所述视觉词典生成模块利用模糊集理论基于有监督模糊谱聚类的方法生成视觉词典,所述映射及描述模块用于对基于局部不变特征隶属度的图像进行语义映射以及图像描述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种图像局部不变特征的语义映射方法,其特征在于,包括以下步骤:
步骤A:对彩色图像局部不变特征提取及描述;
步骤B:提取局部不变特征后,基于监督模糊谱聚类算法对彩色图像提取的局部不变特征生成视觉词典,所述视觉词典包含有视觉特征与视觉单词的隶属关系;
步骤C:根据步骤B生成的视觉词典对步骤A提取的局部不变特征所隶属图像进行语义映射以及图像描述。
2.根据权利要求1所述的语义映射方法,其特征在于,所述步骤A包括以下步骤:
步骤A1:对彩色图像建立彩色图像矢量场模型;
步骤A2:建立并分析所述彩色图像矢量场模型中的矢量场尺度空间,在所述矢量场尺度空间中搜索与定位局部不变特征;
步骤A3:对提取的所述局部不变特征进行描述。
3.根据权利要求2所述的语义映射方法,其特征在于,所述步骤A1包括以下步骤:
步骤A11:对彩色图像f建立的所述彩色图像矢量场模型为:
Figure FDA0000392848970000011
其中e1,e2,e3为超虚构单元;f(x,y)表示彩色图像像素值,x表示像素点的x坐标,y表示像素点的y坐标,fi(x,y)表示彩色图像第i通道的像素值;
步骤A12:对所述彩色图像f进行变换,f(x,y)=flu(x,y)elu+fch(x,y)Ech,其中
Figure FDA0000392848970000012
所述的彩色图像f分成两个量,分别为flu亮度量、fch色度量,flu(x,y)中x表示x轴坐标,y表示y轴坐标,fch(x,y)中x表示x轴坐标,y表示y轴坐标,elu表示亮度投影轴,Ech表示色度投影平面,e1,e2,e3为超虚构单元。
4.根据权利要求2所述的语义映射方法,其特征在于,所述步骤A2包括以下步骤:
步骤A21:根据如下公式得到所述彩色图像f的矢量场尺度空间Lc:Lc={Lc(x,y,k∑)|k=1,2,....,m},其中
Figure FDA0000392848970000021
Figure FDA0000392848970000022
gk表示gk(x,y,∑),fk表示fk(x-i-p,y-j-q),g'l表示g'l(p,q,∑),M和N表示卷积窗口尺寸,Gn+2(·)和f(·)的积是几何积,G3+2(x,y,∑(i))表示高斯核, G 3 + 2 ( x , y , &Sigma; ( i ) ) = &Sigma; i = 1 3 ( 1 2 &pi; ( &Sigma; ( i ) ) 2 exp ( - ( x 2 + y 2 ) 2 ( &Sigma; ( i ) ) 2 ) ) e i , G3+2(x,y,∑(i))中x表示x轴坐标,y表示y轴坐标,f(x,y)表示彩色图像,x表示x轴坐标,y表示y轴坐标,∑(i)=σi,0≤i≤n,σi是第i个通道的图像的高斯滤波函数的方差,后续用∑来表示∑(i);
步骤A22:在所述矢量场尺度空间Lc中,通过相邻尺度图像的差分,获得矢量高斯差分图,表示为D(x,y,∑),其中D(x,y,∑)=Lc(x,y,k∑)-Lc(x,y,∑),k为两相邻尺度空间尺度的倍数,
Figure FDA0000392848970000024
其中Di,j是矢量空间中的多维矢量,m和n是图像的尺寸。
5.根据权利要求4所述的语义映射方法,其特征在于,所述步骤A3包括以下步骤:
步骤A31:对于在Lc(x,y,Ω)中的一个特征点,其幅值和m(x,y)和方向θ(x,y)表示为:
m ( x , y ) = ( | L c ( x + 1 , y , &Sigma; ) - L c ( x - 1 , y , &Sigma; ) | ) 2 + ( | L c ( x , y + 1 , &Sigma; ) - L c ( x , y - 1 , &Sigma; ) | ) 2 ,
&theta; ( x , y ) = arccos ( ( L c ( x + 1 , y , &Sigma; ) - L c ( x - 1 , y , &Sigma; ) ) &CenterDot; ( L c ( x , y + 1 , &Sigma; ) - L c ( x , y - 1 , &Sigma; ) ) | ( L c ( x + 1 , y , &Sigma; ) - L c ( x - 1 , y , &Sigma; ) ) | | ( L c ( x , y + 1 , &Sigma; ) - L c ( x , y - 1 , &Sigma; ) ) | )
步骤A32:通过方向直方图来对特征点周围的方向进行统计,具有最大统计值的方向作为所述特征点的主方向,并形成特征描述矢量。
6.根据权利要求1所述的语义映射方法,其特征在于,所述步骤B包括以下步骤:
步骤B1:根据数据集构造一个无向加权图G={V,E},其表示形式为一对称矩阵W=[Wij]n×n,称该矩阵为相似矩阵,其中Z是顶点的集合,Wij表示连接顶点i与j的权值,Wij的值由测度函数
Figure FDA0000392848970000033
决定;
步骤B2:根据每个特征的类别信息建立每个特征对应类别的隶属度函数,根据隶属度函数重新调整相似矩阵W,生成模糊相似矩阵W’;
步骤B3:构造矩阵V=[v1,v2,…,vq]∈Rn×q,其中,vi为列向量,v1,v2,…,vq为H的q个最大特征值所对应的特征向量,
Figure FDA0000392848970000036
L为对角度矩阵
Figure FDA0000392848970000034
w′ij=f(wijikjk);
步骤B4:将矩阵V的行向量规范化,得到矩阵Y,其中
Figure FDA0000392848970000035
将Y的每一行看成是Rq空间内的一点,使用核模糊C均值聚类将其聚为q类,图像局部不变特征在经过模糊谱聚类后形成q个聚类中心矢量,所述中心矢量即视觉单词,属于同一类物体目标的特征形成一个特定的单词词典,这些视觉单词词典组成一个视觉词典集合VW={VW1,VW2,...,VWm},其中VWi={vwi1,vwi2,...,vwik}为每个物体的视觉词典。
7.根据权利要求1所述的语义映射方法,其特征在于,所述步骤C包括以下步骤:
步骤C1:根据步骤A的方法提取测试图像f的局部不变特征,得到特征集合为:S={s1,s2,...sn},其中si为提取的局部不变特征,n为提取的特征个数;
步骤C2:定义视觉特征si到视觉单词vjt的隶属度函数为μ(si,vjt,L),其中L为视觉特征si到视觉单词vjt在空间上的拓扑关系;
设置隶属度函数为:
&mu; vw ik ( st i ) = 1 1 + [ &alpha; ( d &prime; - &gamma; ) ] &beta; , d &prime; > &gamma; 1 , d &prime; &le; &gamma;
其中
Figure FDA0000392848970000042
是vwik,sti的欧式距离,dmax是D中的最大值,(α,β,γ)为(2.36881,1.40572,160079);
步骤C3:一个视觉特征对每个属于不同物体类别的视觉单词具有一个在[0,1]间的隶属度值,将测试图片中提取的所有特征点到视觉单词的隶属度值累加,形成视觉单词隶属度直方图,通过统计方法提取测试图像f含有的语义信息。
8.一种图像局部不变特征的语义映射系统,其特征在于,包括:
提取及描述模块,用于对彩色图像局部不变特征提取及描述;
视觉词典生成模块,利用模糊集理论基于有监督模糊谱聚类的方法生成视觉词典;
映射及描述模块,用于对基于局部不变特征隶属度的图像进行语义映射以及图像描述。
9.根据权利要求8所述的语义映射系统,其特征在于,所述提取及描述模块包括:
模型建立模块,用于对彩色图像建立彩色图像矢量场模型;
矢量场尺度空间建立与分析模块,用于建立并分析所述彩色图像矢量场模型的矢量场尺度空间,在所述矢量场尺度空间模块中搜索与定位局部不变特征;
特征提取和描述模块,用于对提取的所述局部不变特征进行矢量描述;
所述模型建立模块包含矢量场模型建立模块和图像变换模块;
所述矢量场模型建立模块生成的彩色图像矢量场模型为:
Figure FDA0000392848970000043
其中e1,e2,...,en为超虚构单元;f(x,y)表示彩色图像像素值,x表示像素点的x坐标,y表示像素点的y坐标,fi(x,y)表示彩色图像第i通道的像素值;
所述图像变换模块,对所述彩色图像f进行变换f(x,y)=flu(x,y)elu+fch(x,y)Ech,其中
Figure FDA0000392848970000051
所述的彩色图像f分成两个量,分别为flu亮度量、fch色度量,flu(x,y)中x表示x轴坐标,y表示y轴坐标,fch(x,y)中x表示x轴坐标,y表示y轴坐标,elu表示亮度投影轴,Ech表示色度投影平面,e1,e2,...,en为超虚构单元;
所述矢量场尺度空间建立与分析模块包含矢量场尺度空间建立模块和彩色图像SIFT特征提取模块;
所述矢量场尺度空间建立模块,根据公式Lc={Lc(x,y,kΩ)|k=1,2,....,m}得到矢量场尺度空间,其中
Figure FDA0000392848970000052
Figure FDA0000392848970000053
gk表示gk(x,y,∑),fk表示fk(x-i-p,y-j-q),g'l表示g'l(p,q,∑),M和N表示卷积窗口尺寸,Gn+2(·)和f(·)的积是几何积,G3+2(x,y,∑(i))表示高斯核, G 3 + 2 ( x , y , &Sigma; ( i ) ) = &Sigma; i = 1 3 ( 1 2 &pi; ( &Sigma; ( i ) ) 2 exp ( - ( x 2 + y 2 ) 2 ( &Sigma; ( i ) ) 2 ) ) e i , G3+2(x,y,∑(i))中x表示x轴坐标,y表示y轴坐标,f(x,y)表示彩色图像,x表示x轴坐标,y表示y轴坐标,∑(i)=σi,0≤i≤n,σi是第i个通道的图像的高斯滤波函数的方差,后续用∑来表示∑(i);
所述彩色图像SIFT特征提取模块,在所述矢量场尺度空间Lc中,通过相邻尺度图像的差分,获得矢量高斯差分图,表示为D(x,y,∑),其中D(x,y,∑)=Lc(x,y,k∑)-Lc(x,y,∑),k为两相邻尺度空间尺度的倍数,
Figure FDA0000392848970000061
其中Di,j是矢量空间中的多维矢量,m和n是图像的尺寸;
所述特征提取和描述模块包含特征点描述模块和彩色图像SIFT特征描述模块;
所述特征点描述模块,对于在Lc(x,y,Ω)中的一个特征点,其幅值和m(x,y)和方向θ(x,y)表示为:
m ( x , y ) = ( | L c ( x + 1 , y , &Sigma; ) - L c ( x - 1 , y , &Sigma; ) | ) 2 + ( | L c ( x , y + 1 , &Sigma; ) - L c ( x , y - 1 , &Sigma; ) | ) 2 ,
&theta; ( x , y ) = arccos ( ( L c ( x + 1 , y , &Sigma; ) - L c ( x - 1 , y , &Sigma; ) ) &CenterDot; ( L c ( x , y + 1 , &Sigma; ) - L c ( x , y - 1 , &Sigma; ) ) | ( L c ( x + 1 , y , &Sigma; ) - L c ( x - 1 , y , &Sigma; ) ) | | ( L c ( x , y + 1 , &Sigma; ) - L c ( x , y - 1 , &Sigma; ) ) | ) ;
所述彩色图像SIFT特征描述模块,通过方向直方图来对特征点周围的方向进行统计,以具有最大统计值的方向作为所述特征点的主方向,并形成特征描述矢量。
10.根据权利要求8所述的语义映射系统,其特征在于,所述视觉词典生成模块包含:
对称矩阵模块,根据数据集构造一个无向加权图G={V,E},其表示形式为一对称矩阵W=[Wij]n×n,其中V是顶点的集合,Wij表示连接顶点i与j的权值,Wij的值由测度函数
Figure FDA0000392848970000064
决定;
模糊相似矩阵模块,根据每个特征的类别信息建立每个特征对应类别的隶属度函数,根据隶属度函数重新调整相似矩阵W,生成模糊相似矩阵W’;
构造矩阵模块,用于构造矩阵V=[v1,v2,…,vq]∈Rn×q,其中,vi为列向量,v1,v2,…,vq为H的q个最大特征值所对应的特征向量,
Figure FDA0000392848970000066
L为对角度矩阵
Figure FDA0000392848970000065
w′ij=f(wijikjk);
单词词典模块,将所述矩阵V的行向量规范化,得到矩阵Y,其中
Figure FDA0000392848970000071
将Y的每一行看成是Rq空间内的一点,使用核模糊C均值聚类将其聚为q类,图像局部不变特征在经过模糊谱聚类后形成q个聚类中心矢量,所述中心矢量即视觉单词,属于同一类物体目标的特征形成一个特定的单词词典,这些视觉单词词典组成一个视觉词典集合VW={VW1,VW2,...,VWm},其中VWi={vwi1,vwi2,...,vwik}为每个物体的视觉词典;
所述映射及描述模块包含:特征集合模块,根据步骤A的方法提取测试图像f的局部不变特征,得到特征集合为:S={s1,s2,...sn},其中si为提取的局部不变特征,n为提取的特征个数;
隶属度函数模块,定义视觉特征si到视觉单词vjt的隶属度函数为μ(si,vjt,L),其中L为视觉特征si到视觉单词vjt在空间上的拓扑关系;
设置隶属度函数为: &mu; vw ik ( st i ) = 1 1 + [ &alpha; ( d &prime; - &gamma; ) ] &beta; , d &prime; > &gamma; 1 , d &prime; &le; &gamma; , 其中 d i &prime; = d i d max , di=|vwik,sti|,是vwik,sti的欧式距离,dmax是D中的最大值,(α,β,γ)为(2.36881,1.40572,160079);
语义信息模块,根据视觉特征对每个属于不同物体类别的视觉单词具有一个在[0,1]间的隶属度值,将测试图片中提取的所有特征点到视觉单词的隶属度值累加,形成视觉单词隶属度直方图,并通过统计方法提取测试图像f含有的语义信息。
CN201310468210.9A 2013-10-09 2013-10-09 一种图像局部不变特征的语义映射方法及语义映射系统 Active CN103530633B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310468210.9A CN103530633B (zh) 2013-10-09 2013-10-09 一种图像局部不变特征的语义映射方法及语义映射系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310468210.9A CN103530633B (zh) 2013-10-09 2013-10-09 一种图像局部不变特征的语义映射方法及语义映射系统

Publications (2)

Publication Number Publication Date
CN103530633A true CN103530633A (zh) 2014-01-22
CN103530633B CN103530633B (zh) 2017-01-18

Family

ID=49932630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310468210.9A Active CN103530633B (zh) 2013-10-09 2013-10-09 一种图像局部不变特征的语义映射方法及语义映射系统

Country Status (1)

Country Link
CN (1) CN103530633B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927561A (zh) * 2014-04-29 2014-07-16 东南大学 一种基于概率融合和降维技术的行为识别方法
CN104156433A (zh) * 2014-08-11 2014-11-19 合肥工业大学 一种基于语义映射空间构建的图像检索方法
CN104794725A (zh) * 2015-05-04 2015-07-22 福建师范大学 一种基于局部不变特征的遥感影像对象表达方法
CN106021250A (zh) * 2015-09-16 2016-10-12 展视网(北京)科技有限公司 一种基于关键词的影像语义信息检索方法
CN107944454A (zh) * 2017-11-08 2018-04-20 国网电力科学研究院武汉南瑞有限责任公司 一种针对变电站的基于机器学习的语义标注方法
CN108509925A (zh) * 2018-04-08 2018-09-07 东北大学 一种基于视觉词袋模型的行人重识别方法
CN109816032A (zh) * 2019-01-30 2019-05-28 中科人工智能创新技术研究院(青岛)有限公司 基于生成式对抗网络的无偏映射零样本分类方法和装置
CN109934777A (zh) * 2019-01-09 2019-06-25 深圳市三宝创新智能有限公司 图像局部不变特征提取方法、装置、计算机设备及存储介质
CN112272832A (zh) * 2018-05-28 2021-01-26 三星电子株式会社 用于基于dnn的成像的方法和系统
CN113447771A (zh) * 2021-06-09 2021-09-28 上海交通大学 一种基于sift-lda特征的局部放电模式识别方法
CN113657196A (zh) * 2021-07-27 2021-11-16 中国科学院自动化研究所 Sar图像目标检测方法、装置、电子设备和存储介质
US11654566B2 (en) 2020-08-12 2023-05-23 General Electric Company Robotic activity decomposition

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070258648A1 (en) * 2006-05-05 2007-11-08 Xerox Corporation Generic visual classification with gradient components-based dimensionality enhancement
CN102629328A (zh) * 2012-03-12 2012-08-08 北京工业大学 融合颜色的显著特征概率潜在语义模型物体图像识别方法
CN103020111A (zh) * 2012-10-29 2013-04-03 苏州大学 基于词汇树层次语义模型的图像检索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070258648A1 (en) * 2006-05-05 2007-11-08 Xerox Corporation Generic visual classification with gradient components-based dimensionality enhancement
CN102629328A (zh) * 2012-03-12 2012-08-08 北京工业大学 融合颜色的显著特征概率潜在语义模型物体图像识别方法
CN103020111A (zh) * 2012-10-29 2013-04-03 苏州大学 基于词汇树层次语义模型的图像检索方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927561B (zh) * 2014-04-29 2017-02-22 东南大学 一种基于概率融合和降维技术的行为识别方法
CN103927561A (zh) * 2014-04-29 2014-07-16 东南大学 一种基于概率融合和降维技术的行为识别方法
CN104156433A (zh) * 2014-08-11 2014-11-19 合肥工业大学 一种基于语义映射空间构建的图像检索方法
CN104156433B (zh) * 2014-08-11 2017-05-17 合肥工业大学 一种基于语义映射空间构建的图像检索方法
CN104794725A (zh) * 2015-05-04 2015-07-22 福建师范大学 一种基于局部不变特征的遥感影像对象表达方法
CN106021250A (zh) * 2015-09-16 2016-10-12 展视网(北京)科技有限公司 一种基于关键词的影像语义信息检索方法
CN107944454A (zh) * 2017-11-08 2018-04-20 国网电力科学研究院武汉南瑞有限责任公司 一种针对变电站的基于机器学习的语义标注方法
CN107944454B (zh) * 2017-11-08 2021-09-14 国网电力科学研究院武汉南瑞有限责任公司 一种针对变电站的基于机器学习的语义标注方法
CN108509925B (zh) * 2018-04-08 2020-04-14 东北大学 一种基于视觉词袋模型的行人重识别方法
CN108509925A (zh) * 2018-04-08 2018-09-07 东北大学 一种基于视觉词袋模型的行人重识别方法
CN112272832A (zh) * 2018-05-28 2021-01-26 三星电子株式会社 用于基于dnn的成像的方法和系统
CN109934777A (zh) * 2019-01-09 2019-06-25 深圳市三宝创新智能有限公司 图像局部不变特征提取方法、装置、计算机设备及存储介质
CN109934777B (zh) * 2019-01-09 2023-06-02 深圳市三宝创新智能有限公司 图像局部不变特征提取方法、装置、计算机设备及存储介质
CN109816032B (zh) * 2019-01-30 2020-09-11 中科人工智能创新技术研究院(青岛)有限公司 基于生成式对抗网络的无偏映射零样本分类方法和装置
CN109816032A (zh) * 2019-01-30 2019-05-28 中科人工智能创新技术研究院(青岛)有限公司 基于生成式对抗网络的无偏映射零样本分类方法和装置
US11654566B2 (en) 2020-08-12 2023-05-23 General Electric Company Robotic activity decomposition
CN113447771A (zh) * 2021-06-09 2021-09-28 上海交通大学 一种基于sift-lda特征的局部放电模式识别方法
CN113657196A (zh) * 2021-07-27 2021-11-16 中国科学院自动化研究所 Sar图像目标检测方法、装置、电子设备和存储介质
CN113657196B (zh) * 2021-07-27 2024-05-28 中国科学院自动化研究所 Sar图像目标检测方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN103530633B (zh) 2017-01-18

Similar Documents

Publication Publication Date Title
CN103530633A (zh) 一种图像局部不变特征的语义映射方法及语义映射系统
Chen et al. 3d object proposals using stereo imagery for accurate object class detection
Xiang et al. Subcategory-aware convolutional neural networks for object proposals and detection
CN106682598B (zh) 一种基于级联回归的多姿态的人脸特征点检测方法
Wang et al. Autonomous garbage detection for intelligent urban management
Alidoost et al. A CNN-based approach for automatic building detection and recognition of roof types using a single aerial image
Zhu et al. Scene classification based on the fully sparse semantic topic model
CN105528575B (zh) 基于上下文推理的天空检测方法
Zhang et al. Unsupervised difference representation learning for detecting multiple types of changes in multitemporal remote sensing images
CN105488809A (zh) 基于rgbd描述符的室内场景语义分割方法
Li et al. An image-based hierarchical deep learning framework for coal and gangue detection
CN102622607A (zh) 一种基于多特征融合的遥感图像分类方法
CN102930300B (zh) 一种飞机目标识别方法及系统
CN103295025A (zh) 一种三维模型最优视图的自动选择方法
CN104182765A (zh) 一种互联网图像驱动的三维模型最优视图自动选择方法
CN107480620A (zh) 基于异构特征融合的遥感图像自动目标识别方法
CN106650744A (zh) 局部形状迁移指导的图像对象共分割方法
CN102708380A (zh) 一种基于机器视觉的室内一般物体识别方法
CN103065158A (zh) 基于相对梯度的isa模型的行为识别方法
CN104751463B (zh) 一种基于草图轮廓特征的三维模型最佳视角选取方法
CN111275052A (zh) 基于多层次聚合特征提取与融合的点云分类方法
CN103617413A (zh) 一种在图像中识别物体的方法
CN104966090A (zh) 实现面向图像理解的视觉单词生成和评价的系统及方法
CN102902976A (zh) 一种基于目标及其空间关系特性的图像场景分类方法
Li et al. An aerial image segmentation approach based on enhanced multi-scale convolutional neural network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20180816

Address after: 518000 North 801-805 unit, 8th floor, A building, 2, Guangdong, Shenzhen, Nanshan District.

Patentee after: SHENZHEN HI-TECH NEW AGRICULTURE TECHNOLOGIES Co.,Ltd.

Address before: 518060 3688 Nanhai Road, Nanshan District, Shenzhen, Guangdong

Patentee before: Shenzhen University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221124

Address after: Room 606, Comprehensive Building, Huanghua Comprehensive Bonded Zone, Qishan Community, Huanghua Town, Changsha County, Hunan 410100

Patentee after: Wang Kuiguang

Address before: 518000 North 801-805 unit, 8th floor, A building, 2, Guangdong, Shenzhen, Nanshan District.

Patentee before: SHENZHEN HI-TECH NEW AGRICULTURE TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230110

Address after: 1008-09, Building 4, Guanming Business Center, No. 798, Zhongyi 1st Road, Dongjing Street, Yuhua District, Changsha City, 410000, Hunan Province

Patentee after: Hunan Plant Protection UAV Technology Co.,Ltd.

Address before: Room 606, Comprehensive Building, Huanghua Comprehensive Bonded Zone, Qishan Community, Huanghua Town, Changsha County, Hunan 410100

Patentee before: Wang Kuiguang

TR01 Transfer of patent right