CN106570137B - 一种基于像素关联规则的遥感图像检索方法及装置 - Google Patents

一种基于像素关联规则的遥感图像检索方法及装置 Download PDF

Info

Publication number
CN106570137B
CN106570137B CN201610959157.6A CN201610959157A CN106570137B CN 106570137 B CN106570137 B CN 106570137B CN 201610959157 A CN201610959157 A CN 201610959157A CN 106570137 B CN106570137 B CN 106570137B
Authority
CN
China
Prior art keywords
image
remote sensing
images
association
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610959157.6A
Other languages
English (en)
Other versions
CN106570137A (zh
Inventor
刘军
陈劲松
陈凯
郭善昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201610959157.6A priority Critical patent/CN106570137B/zh
Publication of CN106570137A publication Critical patent/CN106570137A/zh
Application granted granted Critical
Publication of CN106570137B publication Critical patent/CN106570137B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及遥感影像检索技术领域,特别涉及一种基于像素关联规则的遥感图像检索方法及装置。所述基于像素关联规则的遥感图像检索方法包括:步骤a:提取影像库中每幅影像的边缘点像素,构建每幅影像事务集;步骤b:通过所述每幅影像事务集提取每幅影像中的关联规则;步骤c:根据支持度和置信度指标计算所述关联规则的相似度,根据所述待检索影像与影像库中检索影像的关联规则相似度进行影像检索。本发明通过从构建的事务集中提取遥感影像的关联规则,然后比较关联规则之间的相似度,从而实现遥感影像的检索,提高了遥感影像检索的准确率。

Description

一种基于像素关联规则的遥感图像检索方法及装置
技术领域
本发明涉及遥感影像检索技术领域,特别涉及一种基于像素关联规则的遥感图像检索方法及装置。
背景技术
遥感影像具有影像幅面大,影像内容多且复杂的特点,“同物异谱”和“异物同谱”的现象很普遍,给遥感影像的检索带来较大的难度。影像检索即搜索数据库中含有指定特征或具有相似内容的影像,当前主流的基于内容的影像检索(Content-Based ImageRetrieval,CBIR)方法能综合影像处理、信息检索、机器学习、计算机视觉、人工智能等诸多领域的知识,借助从影像中自动提取的视觉特征作为影像内容的描述;目前,基于内容的影像检索取得了大量的研究成果。
视觉特征提取在影像检索中具有重要作用,可以分为两个研究方向,一是研究影像的光谱、纹理、形状等低层视觉特征的提取及相似度度量,包括基于光谱曲线吸收特征提取的高光谱影像检索、利用颜色空间、颜色矩提取颜色特征、利用小波变换、Contourlet变换、Gabor小波、广义高斯模型、纹理谱等方法描述影像的纹理特征、基于像元形状指数、PHOG(Pyramid Histogram of Oriented Gradients,分层梯度方向直方图)形状与小波金字塔的遥感影像形状特征描述方法等。这类低层视觉特征的应用比较成熟,但是无法描述描述影像的语义信息,其提供的检索结果往往和人脑对遥感影像的认知有相当的差距,并不能完全令人满意。
针对这一问题,另一个研究方向即是建立低层视觉特征与语义的映射模型,在语义层次提高影像检索的准确率。主要研究成果包括基于统计学习的语义检索方法,如贝叶斯分类器模型上下文语境的贝叶斯网络、贝叶斯网络与EM(最大期望)参数估计等;基于语义标注的检索方法,如语言索引模型、概念语义分布模型等;基于GIS(地理信息系统,Geographic Information System)辅助的语义检索方法,如利用GIS数据中矢量要素的空间和属性信息引导语义赋予的方法;基于本体论的语义检索方法,如基于视觉对象领域本体的方法、GeoIRIS等。这类方法能够在一定程度上反映人脑对于影像检索的语义理解过程,具有较高的准确率,是未来影像检索的发展趋势。然而目前的语义检索方法往往过于关注低层视觉特征与语义映射模型的构建过程,忽略了所采用的低层视觉特征的种类、语义学习方法等因素,最终影响到语义检索的查准率。
近年来,人类视觉感知特性被引入到影像检索领域中,受到广泛的关注,但是这类方法尚处于起步阶段,还有许多问题有待解决:如人眼视觉系统的生理过程、更符合人眼视觉的特征描述方法、自底向上的感知模型、显著特征提取与度量、自顶向下的视觉注意机制等等。另外,针对遥感影像数据检索的典型成果主要包括瑞士RSIAII+III项目,研究基于光谱和纹理特征的多分辨率遥感影像数据的描述和检索;Berkeley数字图书馆项目开发的原型系统Blobworld,它以航空影像、USGS正射影像和地形图,SPOT卫星影像等作为数据源,让用户能够直观地改进检索结果;新加坡南洋理工大学的(RS)2I项目,其研究内容涵盖了遥感影像特征提取与描述、多维索引技术及分布式体系结构设计的众多方面;斯坦福大学的SIMPLIcity,利用一种稳健的综合区域匹配方法(Integrated Region Matching,IRM)来定义影像间的相似度,在卫星基于数据挖掘的遥感影像检索中取得不错的结果;微软亚洲研究院的iFind,系统通过影像的标注信息构造语义网络,并在相关反馈中与影像的视觉特征相结合,有效地实现了在两个层次上的相关反馈。这些系统取得了重要成果,但是不论是在特征提取还是在代表性特征选择方面仍需要进一步深入研究。
综上所述,不管是基于像素还是面向对象的影像检索方法,大多都关注于影像整体或局部或对象区域的颜色、纹理、形状等低层特征的统计信息。直接基于低层特征的检索方法无法提取感兴趣的目标,缺乏对影像空间信息进行描述的能力,存在特征维数过高、描述不完整、准确性差、缺乏规律性、特征描述与人类认知存在语义差距等缺点。与此同时,基于高层语义信息的遥感影像检索又缺乏成熟的理论和方法。低层特征与高层语义信息之间的“语义鸿沟”,阻碍了遥感影像检索的发展及应用。
发明内容
本发明提供了一种基于像素关联规则的遥感图像检索方法及装置,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本发明提供了如下技术方案:
一种基于像素关联规则的遥感图像检索方法,包括以下步骤:
步骤a:提取影像库中每幅影像的边缘点像素,构建每幅影像事务集;
步骤b:通过所述每幅影像事务集提取每幅影像中的关联规则;
步骤c:根据支持度和置信度指标计算所述关联规则的相似度,根据所述待检索影像与影像库中检索影像的关联规则相似度进行影像检索。
本发明实施例采取的技术方案还包括:所述步骤a还包括:对所述影像库中的每幅影像进行像素灰度级压缩。
本发明实施例采取的技术方案还包括:在所述步骤a中,所述构建每幅影像事务集的构建方法为:利用canny算子提取遥感影像的边缘,然后提取边缘点像素的多个方向,以邻域为单位,以该邻域内每个方向上的所有像素灰度值的排列构成事务集中的一个事务,则每个边缘点构成4个事务;影像越大,则构成的事务越多,组成的事务集越大。
本发明实施例采取的技术方案还包括:在所述步骤b中,所述提取每幅影像中的关联规则的提取方式为:计算频繁项集,通过所述频繁项集从事务集中提取出所有满足指定置信度与支持度的关联规则。
本发明实施例采取的技术方案还包括:在所述步骤c中,所述计算关联规则的相似度的计算方式为:对于每幅影像提取的所有关联规则,每条关联规则支持度与置信度的乘积联合起来,构成一个规则向量;通过比较待检索影像与影像库中每幅检索影像的两个规则向量的相似度实现影像检索;所述两个规则向量相似度的度量公式为:
在上述公式中,N为影像的关联规则数量,r1和r2分别为两个规则向量,μ1和μ2为两幅影像的均值,如果两个规则向量越接近,同时两幅影像的均值越接近,则D的值越小,两幅影像的相似度越高。
本发明实施例采取的另一技术方案为:一种基于像素关联规则的遥感图像检索装置,包括:
事务集构建模块:用于提取影像库中每幅影像的边缘点像素,构建每幅影像事务集;
关联规则提取模块:用于通过所述每幅影像事务集提取每幅影像中的关联规则;
相似度计算模块:用于根据支持度和置信度指标计算所述关联规则的相似度;
影像检索模块:用于根据所述待检索影像与影像库中检索影像的关联规则相似度进行影像检索。
本发明实施例采取的技术方案还包括影像压缩模块,所述影像压缩模块用于对所述影像库中的每幅影像进行像素灰度级压缩。
本发明实施例采取的技术方案还包括:所述事务集构建模块构建每幅影像事务集的构建方法为:利用canny算子提取遥感影像的边缘,然后提取边缘点像素的多个方向,以邻域为单位,以该邻域内每个方向上的所有像素灰度值的排列构成事务集中的一个事务,则每个边缘点构成4个事务;影像越大,则构成的事务越多,组成的事务集越大。
本发明实施例采取的技术方案还包括:所述关联规则提取模块提取每幅影像中的关联规则的提取方式为:计算频繁项集,通过所述频繁项集从事务集中提取出所有满足指定置信度与支持度的关联规则。
本发明实施例采取的技术方案还包括:所述相似度计算模块计算关联规则的相似度的计算方式为:对于每幅影像提取的所有关联规则,每条关联规则支持度与置信度的乘积联合起来,构成一个规则向量;通过比较待检索影像与影像库中每幅检索影像的两个规则向量的相似度实现影像检索;所述两个规则向量相似度的度量公式为:
在上述公式中,N为影像的关联规则数量,r1和r2分别为两个规则向量,μ1和μ2为两幅影像的均值,如果两个规则向量越接近,同时两幅影像的均值越接近,则D的值越小,两幅影像的相似度越高。
相对于现有技术,本发明实施例产生的有益效果在于:本发明实施例的基于像素关联规则的遥感图像检索方法及装置通过对遥感影像进行像素灰度级压缩,减小了关联规则挖掘的计算量;通过构建事务集,通过事务集提取遥感影像的关联规则,然后比较关联规则之间的相似度,从而实现遥感影像的检索;本发明提供了一种可行的从低层视觉特征到高层语义信息来实现基于数据挖掘的遥感影像检索的新途径,提高了遥感影像检索的准确率。
附图说明
图1是本发明实施例的基于像素关联规则的遥感图像检索方法的流程图;
图2是个边缘点像素4个方向上的像素灰度值示意图;
图3(a)为原始遥感影像,图3(b)为压缩后的遥感影像,图3(c)为边缘检测影像;
图4为本发明实施例的基于像素关联规则的遥感图像检索装置的结构示意图;
图5为8幅疏林地待检索影像;
图6为多波段关联规则检索前24幅返回影像;
图7为Gabor小波检索前24幅返回影像;
图8为采用各方法得到的疏林地检索结果平均查准率示意图;
图9为8幅居民地待检索影像;
图10为多波段关联规则检索前24幅返回影像;
图11为颜色矩检索方法前24幅返回影像;
图12为采用各方法得到的居民地检索结果平均查准率示意图;
图13为多波段关联规则方法的前8幅返回影像。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
数据挖掘被定义为“从数据中发现隐含的、先前不知道的、潜在有用的信息的非平凡过程”。由于人脑对于数据的处理是基于语义驱动的,而通过数据挖掘所得到的知识,经过一定的形式化处理和提升,即可形成对影像的语义描述,最终实现对影像的语义检索。因此,针对目前影像检索方法使用低层视觉特征存在的问题和发展趋势,本发明首先利用数据挖掘从遥感影像中提取图像上像素之间隐含的关联规则,然后比较关联规则之间的相似度,并通过概念提升形成高层语义信息,从而实现遥感影像的检索。其中,关联规则反映了数据内部元素之间的关联关系,对于影像而言,则反映了影像内像素之间的空间分布规律。同一传感器获取的两幅遥感影像,如果包含相同或类似地物,则其像素之间的空间分布规律(也即是关联规则)应该具有一定的相似度。
具体地,请参阅图1,是本发明实施例的基于像素关联规则的遥感图像检索方法的流程图。本发明实施例的基于像素关联规则的遥感图像检索方法包括以下步骤:
步骤100:对影像库中每幅影像进行像素灰度级压缩;
在步骤100中,以像素为基础的遥感影像有256个灰度级,如果直接利用256个灰度级进行遥感影像的关联规则挖掘,那么计算量是相当庞大的,同时由于灰度级过多,频繁项集的支持度会非常小,不利于提取到支持度和置信度都足够大的关联规则,因此在进行关联规则挖掘之前,需要先对影像库中的每幅影像进行像素灰度级压缩,将影像压缩至少数几个灰度级,以减小关联规则挖掘的计算量。
在本发明实施例中,遥感影像像素灰度级压缩的方法具体为:以邻域均值和方差进行影像压缩,对于遥感影像上每个3*3邻域内的像素,计算该邻域的均值μ和标准差σ,然后利用下式计算该邻域中心像素在压缩后的灰度级:
在公式(1)中,g为中心像素原始灰度级,g'为压缩后的中心像素灰度级,c为比例系数,取值范围在[0.1,0.5]之间。通过该方法,可以将原始遥感影像压缩至0,1,2这3个灰度级。
在本发明另一实施例中,根据所述灰度级采用均匀分段的方式,将各灰度级量化到[1,G]的范围,具体为:采用平均压缩的方法,将256个灰度级平均分配到若干个灰度级中,
其中G为最大灰度级,G=8,ceil()是向上取整函数,g+1是为了使影像的灰度级被压缩为1~8。
根据所述灰度级采用均匀分段的方式,将各灰度级量化到[1,G]的范围,具体为,采用线性分段的方法进行压缩,首先计算影像的最大灰度级gMax和最小灰度级gMin,然后利用下式计算压缩后的灰度级:
其中G为最大灰度级,G=8。
压缩后的灰度级越多,则进行关联规则挖掘的计算量越大,但反映出的像素之间的关系越接近于真实;反之压缩后的灰度级越少,压缩后像素之间的差异会越小,越不利于挖掘出有意义的关联规则,因此选择一个合适的灰度级数非常重要。本发明实施例中的最大灰度级数选定为8,采用的压缩方式为平均压缩,压缩公式如下:
在公式(4)中,G为最大灰度级数,G=8,ceil()是向上取整函数,g+1是为了使遥感影像的像素灰度级被压缩为1~8。
步骤200:提取每幅影像的边缘点像素,构建每幅影像事务集;
在步骤200中,遥感影像以像素为基础,因此在遥感影像的数据挖掘中需要在像素的基础上构建事务集。构建事务集的方法为:以邻域为单位,以该邻域内每个方向上的所有像素灰度值的排列作为事务集中的某一个事务,例如3*3邻域内9个像素的灰度值即可构成一个事务。那么对于100*100像素大小的影像,可以构成由98*98=9604个事务组成的事务集,每个事务包含9个项。遥感影像越大,则构成的事务越多,组成的事务集越大;一个事务包含的项越多,则需要计算的频繁项集越大,计算量也就越大,因此需要对每个事务包含的项数做一定的限制。考虑到遥感影像的边缘处包含了大量的有用信息,同时边缘具有方向性,因此本发明首先利用canny算子提取遥感影像的边缘,然后提取边缘点像素的4个方向,以每个方向上的3个像素灰度值作为一个项的元素。对于一个边缘点像素,其4个方向上的像素灰度值具体如图2所示,为一个边缘点像素4个方向上的像素灰度值示意图。
由于遥感影像上的边缘点像素占整个影像的比例很小,同时每个事务只包含3个项,因此计算量能够明显地降低。具体请参阅图3(a)、图3(b)和图3(c),图3(a)为原始遥感影像,大小为128*128像素;图3(b)为压缩后的遥感影像,为显示方便,每个灰度级均乘以256/G,从压缩影像可以看出,压缩后尽管灰度级数缩小至8个,但遥感影像的内容并没有太大的变化;图3(c)为边缘检测影像,检测出的边缘点数量为1964,因此构成的事务集大小为1964*4=7856,每个事务包含3个项。如果影像内的地物比较丰富,那么检测出的边缘点将更多,则最终构成的事务集将更大。表1显示了该事务集中的部分事务。
表1事务集中的部分项
步骤300:通过每幅影像事务集提取每幅影像中的关联规则;
在步骤300中,构建了每幅影像事务集之后,事务集中每个事务仅包含3个项,在此基础上,提取每幅影像中的关联规则。提取关联规则的方法具体包括:
首先需要计算频繁项集;计算频繁项集是关联规则挖掘中一个非常关键的步骤,其计算量直接影响了整个关联规则挖掘的计算量。对于由3个元素组成的项,设为[a b c],如果不考虑支持度,其提取的关联规则有下表2所示的12条:
表2 3个项所生成的关联规则
a=>b a=>c b=>c
b=>a c=>a c=>b
ab=>c ac=>b bc=>a
a=>bc b=>ac c=>ab
由于前6条关联规则仅涉及到两个元素之间的关系,尚不足以表达遥感影像的内容,且会增加关联规则挖掘和后续相似度计算的运算量,因此本发明实施例使用Apriori或者FP-Growth等挖掘关联规则的频繁项集算法从构建的事务集中提取出满足指定置信度与支持度的6条关联规则。
为了简单起见,本发明实施例仅选择了边缘点附近的三个像素,具体可根据检索需求进行选择。一般而言,选择的像素越多,则每一条事务所包含的项越多,计算量越大,但是每条关联规则所表现出的物理意义越丰富,检索精度会越高。
步骤400:根据支持度和置信度指标计算关联规则的相似度,根据待检索影像与影像库中检索影像的关联规则相似度进行影像检索;
在步骤400中,支持度反映了关联规则在遥感影像中的分布频度,而置信度则反映了该关联规则的可信程度,因此可以用支持度与置信度的乘积来表示该关联规则在遥感影像中的真实比重。
关联规则的相似度计算方法为:对于一幅遥感影像获取的若干条关联规则,每条关联规则支持度与置信度的乘积联合起来,即构成一个规则向量,用该规则向量来描述该遥感影像的内容。对于内容相同或者相似的遥感影像,其规则向量应该是相似的。
同时人眼视觉系统HVS的视觉特性可以用韦伯定律来描述。根据韦伯定律,HVS对相对亮度改变的敏感性要高于绝对亮度改变,遥感影像的均值反映了人眼对于影像的整体感受,设亮度变化前遥感影像的均值为μ1,R为相对于背景亮度的亮度改变,亮度变化后遥感影像的均值可以表示为μ2=(1+R)μ1,则表达式可以用来衡量该遥感影像变化的整体感受:
因此,仅为R的函数,表明与韦伯定律是一致的,能够表达人眼对于图像亮度的反应。当μ1与μ2越接近,越接近于1,说明两幅遥感影像在亮度上的相似度越高。
设待检索影像的关联规则有N条,影像库中任一检索影像的关联规则有M条,则以待检索影像的N条关联规则为基准,将影像库中检索影像的关联规则与之匹配,两条关联规则匹配成功的条件是两条关联规则的前件和后件分别相同。如果两条关联规则匹配成功,则保留该关联规则的支持度与置信度的乘积;如果匹配不成功,则该关联规则的支持度与置信度的乘积设置为0。因此该检索影像同样可以生成一个N维的规则向量,通过比较待检索影像与影像库中所有影像的N维规则向量的相似度,即可实现影像检索。
本发明实施例中,采用Kullback-Leibler散度一阶近似距离作为衡量两个规则向量相似度的度量,其表达式为:
在公式(6)中,r1和r2分别为两个规则向量,同时考虑到人眼视觉特性,最终的相似度度量指标为:
如果两个规则向量越接近,同时两幅遥感影像的均值越接近,则D的值越小,相似度越高。
请参阅图4,是本发明实施例的基于像素关联规则的遥感图像检索装置的结构示意图。本发明实施例的基于像素关联规则的遥感图像检索装置包括影像压缩模块、事务集构建模块、关联规则提取模块、相似度计算模块和影像检索模块。
影像压缩模块用于对影像库中所有影像进行像素灰度级压缩;其中,以像素为基础的遥感影像有256个灰度级,如果直接利用256个灰度级进行遥感影像的关联规则挖掘,那么计算量是相当庞大的,同时由于灰度级过多,频繁项集的支持度会非常小,不利于提取到支持度和置信度都足够大的关联规则,因此在进行关联规则挖掘之前,需要先对影像库中的所有影像进行像素灰度级压缩,将影像压缩至少数几个灰度级,以减小关联规则挖掘的计算量。
在本发明实施例中,遥感影像像素灰度级压缩的方法具体为:以邻域均值和方差进行影像压缩,对于遥感影像上每个3*3邻域内的像素,计算该邻域的均值μ和标准差σ,然后利用下式计算该邻域中心像素在压缩后的灰度级:
在公式(1)中,g为中心像素原始灰度级,g'为压缩后的中心像素灰度级,c为比例系数,取值范围在[0.1,0.5]之间。通过该方法,可以将原始遥感影像压缩至0,1,2这3个灰度级。
在本发明另一实施例中,根据所述灰度级采用均匀分段的方式,将各灰度级量化到[1,G]的范围,具体为:采用平均压缩的方法,将256个灰度级平均分配到若干个灰度级中,
其中G为最大灰度级,G=8,ceil()是向上取整函数,g+1是为了使影像的灰度级被压缩为1~8。
根据所述灰度级采用均匀分段的方式,将各灰度级量化到[1,G]的范围,具体为,采用线性分段的方法进行压缩,首先计算影像的最大灰度级gMax和最小灰度级gMin,然后利用下式计算压缩后的灰度级:
其中G为最大灰度级,G=8。
压缩后的灰度级越多,则进行关联规则挖掘的计算量越大,但反映出的像素之间的关系越接近于真实;反之压缩后的灰度级越少,压缩后像素之间的差异会越小,越不利于挖掘出有意义的关联规则,因此选择一个合适的灰度级数非常重要。本发明实施例中的最大灰度级数选定为8,采用的压缩方式为平均压缩,压缩公式如下:
在公式(4)中,G为最大灰度级数,G=8,ceil()是向上取整函数,g+1是为了使遥感影像的像素灰度级被压缩为1~8。
事务集构建模块用于提取每幅影像的边缘点像素,构建影像事务集;其中,遥感影像以像素为基础,因此在遥感影像的数据挖掘中需要在像素的基础上构建事务集。构建事务集的方法为:以邻域为单位,以该邻域内所有像素灰度值的排列作为事务集中的某一个事务,例如3*3邻域内9个像素的灰度值即可构成一个事务。那么对于100*100像素大小的影像,可以构成由98*98=9604个事务组成的事务集,每个事务包含9个项。遥感影像越大,则构成的事务越多,组成的事务集越大;一个事务包含的项越多,则需要计算的频繁项集越大,计算量也就越大,因此需要对每个事务包含的项数做一定的限制。考虑到遥感影像的边缘处包含了大量的有用信息,同时边缘具有方向性,因此本发明首先利用canny算子提取遥感影像的边缘,然后提取边缘点像素的4个方向,以每个方向上的3个像素灰度值作为一个项的元素。对于一个边缘点像素,其4个方向上的像素灰度值具体如图2所示,为一个边缘点像素4个方向上的像素灰度值示意图。
由于遥感影像上的边缘点像素占整个影像的比例很小,同时每个事务只包含3个项,因此计算量能够明显地降低。具体请参阅图3(a)、图3(b)和图3(c),图3(a)为原始遥感影像,大小为128*128像素;图3(b)为压缩后的遥感影像,为显示方便,每个灰度级均乘以256/G,从压缩影像可以看出,压缩后尽管灰度级数缩小至8个,但遥感影像的内容并没有太大的变化;图3(c)为边缘检测影像,检测出的边缘点数量为1964,因此构成的事务集大小为1964*4=7856,每个事务包含3个项。如果影像内的地物比较丰富,那么检测出的边缘点将更多,则最终构成的事务集将更大。
关联规则提取模块用于通过每幅影像事务集提取影像中的关联规则;其中,构建了每幅影像事务集之后,由于事务集中每个事务仅包含3个项,可以从事务集中构建三维数据立方体,在此基础上,提取影像中的关联规则。提取关联规则的方法具体包括:
首先需要计算频繁项集;计算频繁项集是关联规则挖掘中一个非常关键的步骤,其计算量直接影响了整个关联规则挖掘的计算量。对于由3个元素组成的项,设为[a b c],如果不考虑支持度,其提取的关联规则有下表3所示的12条:
表3 3个项所生成的关联规则
a=>b a=>c b=>c
b=>a c=>a c=>b
ab=>c ac=>b bc=>a
a=>bc b=>ac c=>ab
由于前6条关联规则仅涉及到两个元素之间的关系,尚不足以表达遥感影像的内容,且会增加关联规则挖掘和后续相似度计算的运算量,因此本发明实施例使用Apriori或者FP-Growth等挖掘关联规则的频繁项集算法从构建的事务集中提取出满足指定置信度与支持度的6条关联规则。
为了简单起见,本发明实施例仅选择了边缘点附近的三个像素,具体可根据检索需求进行选择。一般而言,选择的像素越多,则每一条事务所包含的项越多,计算量越大,但是每条关联规则所表现出的物理意义越丰富,检索精度会越高。
相似度计算模块用于根据支持度和置信度指标计算关联规则的相似度;其中,支持度反映了关联规则在遥感影像中的分布频度,而置信度则反映了该关联规则的可信程度,因此可以用支持度与置信度的乘积来表示该关联规则在遥感影像中的真实比重。
关联规则的相似度计算方法为:对于一幅遥感影像获取的若干条关联规则,每条关联规则支持度与置信度的乘积联合起来,即构成一个规则向量,用该规则向量来描述该遥感影像的内容。对于内容相同或者相似的遥感影像,其规则向量应该是相似的。
同时人眼视觉系统HVS的视觉特性可以用韦伯定律来描述。根据韦伯定律,HVS对相对亮度改变的敏感性要高于绝对亮度改变,遥感影像的均值反映了人眼对于影像的整体感受,设亮度变化前遥感影像的均值为μ1,R为相对于背景亮度的亮度改变,亮度变化后遥感影像的均值可以表示为μ2=(1+R)μ1,则表达式可以用来衡量该遥感影像变化的整体感受:
因此,仅为R的函数,表明与韦伯定律是一致的,能够表达人眼对于图像亮度的反应。当μ1与μ2越接近,越接近于1,说明两幅遥感影像在亮度上的相似度越高。
影像检索模块用于根据待检索影像与影像库中检索影像的关联规则相似度进行影像检索;设待检索影像的关联规则有N条,影像库中任一检索影像的关联规则有M条,则以待检索影像的N条关联规则为基准,将影像库中检索影像的关联规则与之匹配,两条关联规则匹配成功的条件是两条关联规则的前件和后件分别相同。如果两条关联规则匹配成功,则保留该关联规则的支持度与置信度的乘积;如果匹配不成功,则该关联规则的支持度与置信度的乘积设置为0。因此该检索影像同样可以生成一个N维的规则向量,通过比较待检索影像与影像库中所有影像的N维规则向量的相似度,即可实现影像检索。
本发明实施例中,采用Kullback-Leibler散度一阶近似距离作为衡量两个规则向量相似度的度量,其表达式为:
在公式(6)中,r1和r2分别为两个规则向量,同时考虑到人眼视觉特性,最终的相似度度量指标为:
如果两个规则向量越接近,同时两幅遥感影像的均值越接近,则D的值越小,相似度越高。
为了验证本发明的有效性,通过以下实施例对不同传感器的遥感影像进行了检索实验,并将本发明的基于像素关联规则的遥感图像检索方法与现有的直方图匹配、颜色矩、Gabor小波、DT-CWT(Dual-Tree Complex Wavelet Transform)的检索方法进行比较。
其中,颜色矩特征描述了颜色的分布信息,常用一阶矩(均值)、二阶矩(标准差)和三阶矩来表达图像的颜色分布信息,具有简单有效和计算量小的特点,这三个矩特征的定义如下:
一阶矩(均值):
二阶中心矩(标准差):
三阶中心矩:
对于彩色影像,本发明可以使用亮度影像和多波段影像分别进行关联规则挖掘,对应的关联规则分别命名为亮度关联规则和多波段关联规则。其中,亮度关联规则采用YUV颜色空间来提取亮度影像,其与RGB3个波段的关系为:
Y=0.299R+0.587G+0.114B (11)
在公式(11)中,Y为YUV颜色空间的亮度,当然也可以采用其他颜色空间中的亮度来挖掘关联规则。
Gabor小波选取5个尺度6个方向,因此每幅影像可以统计得到30维的向量;DT-CWT方法是采用双树复小波对影像进行变换,得到变换谱,然后计算变换谱的谱直方图作为影像的特征向量。
根据本发明的步骤,对于多波段的遥感影像,本实施例提供两种应用方式,即多波段关联规则方式和亮度关联规则方式。在多波段关联规则挖掘中,首先对多个波段分别挖掘关联规则,然后分别比较对应波段的关联规则的相似度,最后取这多个相似度的均值作为总的相似度,输出检索结果。在亮度关联规则挖掘中,首先对多波段影像计算其亮度影像,即所有波段在每个像素上的均值构成亮度影像,然后挖掘亮度影像的关联规则,最后比较亮度影像关联规则的相似度,输出检索结果。因此从方法上看,多波段关联规则的计算量比亮度关联规则要大,但是由于利用了多个波段的信息,因此其检索精度比亮度关联规则要高。
QuickBird影像检索实验
由于QuickBird影像库比较大,包含1512幅分块影像,同时影像上的地物类型较多,为方便统计检索精度,本发明实施例仅选择疏林地和居民地进行各种检索方法的检索结果对比,并分别选择各类地物的8幅分块影像,以这8幅影像作为待检索影像,使用影像库中影像的前64幅影像的平均查准率来衡量各检索方法的性能。计算时,分别统计前8、前16、前24、前32、前40、前48、前56、前64幅返回影像中的正确影像,取8幅影像的平均查准率作为最终的查准率。
(1)疏林地
如图5所示,为8幅疏林地待检索影像。从影像上来看,疏林地的分块影像中只包含少量树木,大部分是裸露的土壤,本发明实施例仅以多波段关联规则和Gabor小波检索方法的前24幅返回影像为例进行说明。请一并参阅图6、图7和图8,图6为多波段关联规则检索前24幅返回影像,图7为Gabor小波检索前24幅返回影像,图8为采用各方法得到的疏林地检索结果平均查准率示意图。从图8可以看出,本发明实施例的多波段关联规则方法的查准率始终高于其它方法,在很多检索结果中能够达到100%的查准率,因此总体查准率始终维持在90%以上。由于亮度关联规则方法只用到了亮度信息,所以其查准率稍低,但仍然高于其它方法。对于疏林地,每个分块影像上的林木数量不等,因此纹理信息不是很丰富和完整,但是整体而言,有大量的裸露地,颜色信息相对比较统一,因此颜色矩的效果要好于Gabor和DT-CWT方法。
(2)居民地
如图9所示,为8幅居民地待检索影像。从影像上看,居民地一般都集中在道路附近,且房屋呈明亮的白色,房屋周围分布着一定数量的树木。请一并参阅图10、图11和图12,图10为多波段关联规则检索前24幅返回影像,图11为颜色矩检索方法前24幅返回影像,图12为采用各方法得到的居民地检索结果平均查准率示意图。从图12可以看出,在分块影像上,居民地的视觉特征比较统一,白色的房子、四周分布着一定的树木以及灰色的道路,相互之间的直方图比较相似,所以前24幅返回影像的平均查准率基本保持在100%,但随着返回影像数量的增加,其平均查准率反而比本发明实施例的多波段关联规则方法和亮度关联规则方法要低。DT-CWT和颜色矩的平均查准率比较稳定,而Gabor小波的平均查准率波动比较大,这是因为虽然居民地的地物内容比较类似,但在各个方向上的分布并不统一。虽然多波段关联规则方法和亮度关联规则方法在前32幅影像上的平均查准率比直方图稍差,但随着返回影像的增多,其平均查准率却更高。实验中发现,这是因为在某一幅影像的返回结果中,前8幅返回影像中有2幅影像不属于居民地,具体如图13所示,为多波段关联规则方法的前8幅返回影像。正是因为第4和第8幅影像的影响,才导致所有影像的平均查准率一直偏低。下表是多波段关联规则方法在所有影像中查准率:
表4多波段关联规则方法的查准率
序号 8 16 24 32 40 48 56 64
1 1 1 1 1 1 1 1 1
2 1 1 1 1 1 1 1 1
3 1 1 1 1 1 1 1 1
4 1 1 1 1 1 1 1 1
5 1 1 1 1 1 1 1 1
6 1 0.9375 0.9583 0.9688 0.9750 0.9792 0.9821 0.9844
7 1 1 1 1 1 1 1 1
8 0.8750 0.8750 0.9167 0.9375 0.9500 0.9583 0.9643 0.9688
平均 0.9844 0.9766 0.9844 0.9883 0.9906 0.9922 0.9933 0.9941
从上表中可以看出,第8幅影像的查准率比较低,导致前32幅返回影像的平均查准率低于99%,但是大多数影像的平均查准率均达到100%,而且最终整体平均查准率达到99.41%,说明本发明实施例的影像检索方法具有非常高的检索精度。
本发明实施例的基于像素关联规则的遥感图像检索方法及装置通过对遥感影像进行像素灰度级压缩,减小了关联规则挖掘的计算量;通过构建事务集,通过事务集提取遥感影像的关联规则,然后比较关联规则之间的相似度,从而实现遥感影像的检索。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种基于像素关联规则的遥感图像检索方法,其特征在于,包括以下步骤:
步骤a:提取影像库中每幅影像的边缘点像素,构建每幅影像事务集;
步骤b:通过所述每幅影像事务集提取每幅影像中的关联规则;
步骤c:根据支持度和置信度指标计算所述关联规则的相似度,根据待检索影像与影像库中检索影像的关联规则相似度进行影像检索;
在所述步骤a中,所述构建每幅影像事务集的构建方法为:利用canny算子提取遥感影像的边缘,然后提取边缘点像素的多个方向,以邻域为单位,以该邻域内每个方向上的所有像素灰度值的排列构成事务集中的一个事务,则每个边缘点构成4个事务;影像越大,则构成的事务越多,组成的事务集越大。
2.根据权利要求1所述的基于像素关联规则的遥感图像检索方法,其特征在于,所述步骤a还包括:对所述影像库中的每幅影像进行像素灰度级压缩。
3.根据权利要求1所述的基于像素关联规则的遥感图像检索方法,其特征在于,在所述步骤b中,所述提取每幅影像中的关联规则的提取方式为:计算频繁项集,通过所述频繁项集从事务集中提取出所有满足指定置信度与支持度的关联规则。
4.根据权利要求3所述的基于像素关联规则的遥感图像检索方法,其特征在于,在所述步骤c中,所述计算关联规则的相似度的计算方式为:对于每幅影像提取的所有关联规则,每条关联规则支持度与置信度的乘积联合起来,构成一个规则向量;通过比较待检索影像与影像库中每幅检索影像的两个规则向量的相似度实现影像检索;所述两个规则向量相似度的度量公式为:
在上述公式中,N为影像的关联规则数量,r1和r2分别为两个规则向量,μ1和μ2为两幅影像的均值,如果两个规则向量越接近,同时两幅影像的均值越接近,则D的值越小,两幅影像的相似度越高。
5.一种基于像素关联规则的遥感图像检索装置,其特征在于,包括:
事务集构建模块:用于提取影像库中每幅影像的边缘点像素,构建每幅影像事务集;
关联规则提取模块:用于通过所述每幅影像事务集提取每幅影像中的关联规则;
相似度计算模块:用于根据支持度和置信度指标计算所述关联规则的相似度;
影像检索模块:用于根据待检索影像与影像库中检索影像的关联规则相似度进行影像检索;
所述事务集构建模块构建每幅影像事务集的构建方法为:利用canny算子提取遥感影像的边缘,然后提取边缘点像素的多个方向,以邻域为单位,以该邻域内每个方向上的所有像素灰度值的排列构成事务集中的一个事务,则每个边缘点构成4个事务;影像越大,则构成的事务越多,组成的事务集越大。
6.根据权利要求5所述的基于像素关联规则的遥感图像检索装置,其特征在于,还包括影像压缩模块,所述影像压缩模块用于对所述影像库中的每幅影像进行像素灰度级压缩。
7.根据权利要求5所述的基于像素关联规则的遥感图像检索装置,其特征在于,所述关联规则提取模块提取每幅影像中的关联规则的提取方式为:计算频繁项集,通过所述频繁项集从事务集中提取出所有满足指定置信度与支持度的关联规则。
8.根据权利要求7所述的基于像素关联规则的遥感图像检索装置,其特征在于,所述相似度计算模块计算关联规则的相似度的计算方式为:对于每幅影像提取的所有关联规则,每条关联规则支持度与置信度的乘积联合起来,构成一个规则向量;通过比较待检索影像与影像库中每幅检索影像的两个规则向量的相似度实现影像检索;所述两个规则向量相似度的度量公式为:
在上述公式中,N为影像的关联规则数量,r1和r2分别为两个规则向量,μ1和μ2为两幅影像的均值,如果两个规则向量越接近,同时两幅影像的均值越接近,则D的值越小,两幅影像的相似度越高。
CN201610959157.6A 2016-11-02 2016-11-02 一种基于像素关联规则的遥感图像检索方法及装置 Active CN106570137B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610959157.6A CN106570137B (zh) 2016-11-02 2016-11-02 一种基于像素关联规则的遥感图像检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610959157.6A CN106570137B (zh) 2016-11-02 2016-11-02 一种基于像素关联规则的遥感图像检索方法及装置

Publications (2)

Publication Number Publication Date
CN106570137A CN106570137A (zh) 2017-04-19
CN106570137B true CN106570137B (zh) 2019-12-06

Family

ID=58535713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610959157.6A Active CN106570137B (zh) 2016-11-02 2016-11-02 一种基于像素关联规则的遥感图像检索方法及装置

Country Status (1)

Country Link
CN (1) CN106570137B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139430A (zh) * 2015-08-27 2015-12-09 哈尔滨工程大学 一种基于图熵的医学图像聚类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8749812B2 (en) * 2008-09-26 2014-06-10 Konica Minolta Laboratory U.S.A., Inc. Variable data printing method utilizing separate printers for different content

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139430A (zh) * 2015-08-27 2015-12-09 哈尔滨工程大学 一种基于图熵的医学图像聚类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Recovery of Color Images by Composed Associatice Mining and Edge Detection;Chin-Feng Lee 等;《Journal of Information Hiding and Multimedia Signal Processing》;20101030;第1卷(第4期);310-324 *
基于关联规则挖掘的图像检索;周易;《软件》;20120430;第33卷(第4期);28-30 *
基于语义的图像检索相关问题研究;袁本刚;《中国优秀硕士学位论文全文数据库 信息科技辑》;20090815(第8期);I138-1206 *

Also Published As

Publication number Publication date
CN106570137A (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
CN108052966B (zh) 基于卷积神经网络的遥感图像场景自动提取和分类方法
US10102443B1 (en) Hierarchical conditional random field model for labeling and segmenting images
US10528620B2 (en) Color sketch image searching
US9116925B2 (en) Hierarchical ranking of facial attributes
CN102073748B (zh) 一种基于视觉关键词的遥感影像语义检索方法
CN102750385B (zh) 基于标签检索的相关性—质量排序图像检索方法
CN101937549B (zh) 网络购物导航领域的图片导航系统
CN104103082A (zh) 一种基于区域描述和先验知识的图像显著性检测方法
CN101950400B (zh) 网络购物导航方法领域的图片检索方法
US6792434B2 (en) Content-based visualization and user-modeling for interactive browsing and retrieval in multimedia databases
Sukhia et al. Content-based remote sensing image retrieval using multi-scale local ternary pattern
CN110363236B (zh) 空谱联合超图嵌入的高光谱图像极限学习机聚类方法
Wang et al. Image retrieval based on exponent moments descriptor and localized angular phase histogram
CN106844739A (zh) 一种基于神经网络协同训练的遥感图像变化信息检索方法
CN105183795B (zh) 基于内容的遥感图像变化检测信息检索方法
CN112561976A (zh) 一种图像主颜色特征提取方法、图像检索方法、存储介质及设备
Etemad et al. Color texture image retrieval based on Copula multivariate modeling in the Shearlet domain
Liu et al. RGB-D action recognition using linear coding
CN116883679B (zh) 基于深度学习的地物目标提取方法和装置
CN108985346A (zh) 融合低层图像特征及cnn特征的现勘图像检索方法
CN106570127B (zh) 基于对象属性关联规则的遥感图像检索方法及系统
CN106570137B (zh) 一种基于像素关联规则的遥感图像检索方法及装置
CN106570125B (zh) 一种旋转缩放平移不变性的遥感图像检索方法及装置
CN106570123B (zh) 基于邻接对象关联规则的遥感图像检索方法及系统
CN106570124B (zh) 基于对象级关联规则的遥感图像语义检索方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant