CN110222756A - 一种面向高光谱复杂背景的迭代聚类异常检测算法 - Google Patents

一种面向高光谱复杂背景的迭代聚类异常检测算法 Download PDF

Info

Publication number
CN110222756A
CN110222756A CN201910467217.6A CN201910467217A CN110222756A CN 110222756 A CN110222756 A CN 110222756A CN 201910467217 A CN201910467217 A CN 201910467217A CN 110222756 A CN110222756 A CN 110222756A
Authority
CN
China
Prior art keywords
pixel
density
hyperion
background
detection algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910467217.6A
Other languages
English (en)
Other versions
CN110222756B (zh
Inventor
李敏
黄江涛
李谱煌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Campus of Hohai University
Original Assignee
Changzhou Campus of Hohai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Campus of Hohai University filed Critical Changzhou Campus of Hohai University
Priority to CN201910467217.6A priority Critical patent/CN110222756B/zh
Publication of CN110222756A publication Critical patent/CN110222756A/zh
Application granted granted Critical
Publication of CN110222756B publication Critical patent/CN110222756B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了遥感信息处理技术领域的一种面向高光谱复杂背景的迭代聚类异常检测算法,旨在解决现有技术中针对复杂高光谱图像中背景包含不同规模地物及光谱特征上的差异,难以准确描述背景特征,导致异常检测效果不理想的技术问题。所述算法包括如下步骤:基于相对密度与迭代分析,建立全局背景模型;基于全局背景模型,利用马氏距离采用RX异常检测算法进行异常检测。

Description

一种面向高光谱复杂背景的迭代聚类异常检测算法
技术领域
本发明涉及一种面向高光谱复杂背景的迭代聚类异常检测算法,属于遥感信息处理技术领域。
背景技术
基于光谱特征分析的异常目标检测作为一种盲信号检测技术,无需地物先验知识、大气校正和辐射定标处理,在环境监控、矿藏资源勘探、国防安全等领域中得到了广泛应用。目前的异常检测方法主要是通过先提取背景信息,然后根据异常与背景之间光谱差异性的方式来判定。现实中地表地物分布情况往往比较复杂,存在着很多规模及光谱特性均不同的地物类别,整体背景建模的方法往往由于背景地物类别多,容易将与背景光谱特征类似的异常像元包含在背景模型中,即使用于估量异常显著性的背景模型中仅包含0.5%的异常像元,也会大幅度降低背景模型对实际异常的敏感程度。
高光谱遥感数据背景地物种类繁多,规模差异大,导致背景模型难以精确描述。基于现有背景建模方法针对高光谱遥感数据建立背景模型,存在一定局限性,具体表现为:通过数学模型描述背景地物分布特征的方法的计算复杂度高以及缺乏最优的评价标准;通过在高维特征空间估计,采用最小包含超球面来分离异常的方法,在背景窗口尺寸选择以及高斯径向函数中的尺度函数缺少精确估计;通过稀疏分解进行异常检测的方法,无法保证背景矩阵的秩和异常矩阵满足稀疏性的先验条件;通过找到光谱快速变化区域检测异常的方法,更适合于高光谱数据不存在复杂纹理特征以及光谱变化的情况;通过挖掘高光谱图像中的深层特征来实现对数据的分类并且通过构建简单的深度学习模型来降低对传统模型大量训练数据的需求,还在研究阶段,无成熟的结论可以使用;通过聚类分析的异常检测算法需要指定光谱类别数目。
现实情况中,复杂背景涵盖了不同属性的地物类别,且类别数目未知,各个类别在规模上存在较大差异,增加了背景地物实现准确分类的难度;另外,目前大多数聚类算法都是通过寻找最优分类边界(分类面)实现分类,仅可以解决凸集合的分类,对于非凸集合分类,构建非线性边界的复杂度很高。复杂背景下的异常检测,通常因光谱特征的复杂性以及异常与背景交叠分布,导致背景与异常存在非凸特征。
发明内容
本发明的目的在于克服现有技术中的不足,提供了一种面向高光谱复杂背景的迭代聚类异常检测算法,包括如下步骤:
基于相对密度与迭代分析,建立全局背景模型;
基于全局背景模型,利用马氏距离采用RX异常检测算法进行异常检测。
进一步地,基于相对密度与迭代分析,建立全局背景模型,包括:
基于密度-距离测度聚类算法,对高光谱遥感数据进行相似性分析;
基于相似性分析结果进行迭代筛选,获取全局背景模型。
进一步地,基于密度-距离测度聚类算法,对高光谱遥感数据进行相似性分析,包括:
基于密度尺度和距离尺度,在高光谱遥感数据像元中提取聚类中心;
高光谱遥感数据经提取聚类中心后剩余像元按最邻近聚类原则聚类,获取以聚类中心为中心点的地物类别。
进一步地,聚类中心的提取条件,包括:
密度最大,且与其他类别像元之间距离最大。
进一步地,基于相似性分析结果进行迭代筛选,获取全局背景模型,包括:
提取密度最大地物类别中的像元,纳入背景地物像元集合;
基于密度-距离测度聚类算法,对高光谱遥感数据经提取密度最大地物类别中的像元后剩余像元进行相似性分析;
重复密度最大地物类别中的像元的提取过程,直至高光谱遥感数据经提取出的背景像元数量占总像元数量的百分比达到预设阈值;
基于背景地物像元集合,获取全局背景模型。
进一步地,预设阈值的取值范围是85%至95%。
进一步地,还包括:采用多背景类别分别对待测像元进行异常检测,并通过融合算法获得检测结果。
与现有技术相比,本发明所达到的有益效果:首先,无需预先设定类别的数目作为算法分类的参数,对类的规模造成约束,通过密度分析自适应获取各个类别的聚类中心,并实现聚类,避免了因类别设定导致的分类误差;其次,设计迭代筛选进行逐步分类的机制,避免了相对密度分析误差导致的错误分类问题;最后,每次迭代仅提取当前具有最大相对密度的类别,避免了聚类过程中大规模地物类别对小规模地物类别的影响。
附图说明
图1是本发明算法流程图;
图2是本发明基于密度分析的类别中心判定图;
图3是本发明基于密度分析的迭代背景聚类算法流程图;
图4是本发明基于多背景类别的异常检测算法流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,是本发明算法流程图,一种面向高光谱复杂背景的迭代聚类异常检测算法,包括聚类、异常检测、融合三个部分。其中,聚类部分为基于相对密度与迭代分析建立全局背景模型,异常检测为利用马氏距离采用RX异常检测算法进行异常检测,融合为多背景类别判断结果的融合,获得最终的检测结果。
基于相对密度与迭代分析建立全局背景模型,包括如下步骤:
首先,基于密度-距离测度聚类算法,对高光谱遥感数据进行数据相似性分析;该算法从密度与中心距离出发,认为数据集中类别的中心点存在两点特征,即:比周围元素有着更高密度,与其他类别中心保持较大距离;根据这两点特征寻找类别中心,以挖掘类别之间的特征。
在对数据集进行数据分类处理时,必须获取元素的密度参数ρ和距离参数δ。要获得元素的密度参数ρ,其取决于在某种特征上与该元素相似度高的元素个数,根据元素密度参数能够大概知道区域内元素的分布情况;但仅仅根据密度参数无法有效定义分类边界,还需结合中心距离才可以有效地对类别中心进行识别,从而实现分类目的,所述中心距离即元素的距离参数δ。具体实现步骤如下:
步骤一,设定高光谱数据集X'中存在n个独立元素,每个元素代表了高光谱遥感数据中的像元,表达式为X′={x1,x2,x3…xn},每个像元的密度为与其具有相似光谱特性的像元个数。为充分考虑周围像元的影响以降低误差,采用高斯径向基函数计算密度,如式(1)所示:
式中,ρi为像元xi的密度参数,e为指数函数,Dij为像元xi与xj之间距离,dc为径向基函数参数,dc决定了ρi大小;像元xi与xj之间的距离Dij采用欧式距离定义,如式(2)所示:
Dij=||xi-xj||2 (2)
ρi大小代表了像元xi周围具有相似像元的数目,ρi越大则意味着与像元xi相似的像元数目越多,也即该像元处于一个大的类别中;ρi越小,表明与像元xi相似的像元较少,无法形成单独的类别,甚至成为孤立点;
步骤二,对于任意像元xi,定义其距离参数δi。该参数由像元之间的密度关系决定,当像元xi的密度ρi最大时,δi取Dij中的最大值;当像元xj的密度ρj大于像元xi的密度ρi时,那么δi取像元xi与xj之间的最小距离。如式(3)所示:
参数δi的大小,反映了像元xi与其它像元之间的距离关系。
对高光谱数据集X'中不同类别的聚类中心来说,需要满足两个条件:首先,聚类中心像元应具有较大密度,即与其具有相似光谱特征的像元数目较多;其次,聚类中心与其它类中心较远,即距离最大;
因此,当像元xi具有较大密度值,且与其他类别像元之间距离最大时,可以认为,像元xi是一个类别的聚类中心;在确定聚类中心后,就可以采用最邻近聚类原则进行聚类。
更具体地,如图2所示,是本发明基于密度分析的类别中心判定图,假设X、Y、Z、W四个像元均具有较大密度且与其它像元距离较远,其中,X和W两个像元相对于Y和Z两个像元具有更大的密度和距离,因此,以X和W为聚类中心获取的地物类别相对于以X和W为聚类中心获取的地物类别具有更大规模,前者对后者产生抑制效果。为提高Y和Z所在地物类别的显著性,降低较大规模类对于较小规模类的抑制效果,本发明采取迭代聚类的方法,每次将较大类提取出来,再采用基于密度-距离测度聚类算法,对剩余像元进行数据相似性分析,获得新的聚类中心,详见下述内容。
其次,设计迭代筛选背景地物的聚类算法,提取当前密度最大地物类别将其纳入背景像元集合,并在每次提取地物类别后再对剩余像元集合进行聚类;通过迭代聚类,逐步筛选背景地物,直到背景集合的像元个数大于预设阈值时,迭代终止;
设定B'为背景像元集合、S为提取地物类别后剩余像元集合、P为B'中像元数目占高光谱数据集X'像元数目的比例;由于异常与背景相比,具有明显不同的光谱特征,且异常在空间分布特性上表现出稀疏性,因此设定P作为迭代筛选的停止条件,即预设阈值,所述预设阈值的取值范围是85%至95%;考虑到在迭代选取大部分背景类像元后,S中像元数据较少,仅包含异常和少部分背景类像元,并且异常像元光谱各自差异大,在ρ-δ图中分布分散,较难实现聚类,因而迭代停止时选取的像元数目比P要小于实际背景像元的比例,本实施例中设定P=0.85,即背景像元集合B'中像元数达到高光谱数据集X'中像元数的85%时停止迭代;最终输出对应X'的异常显著性数据集R={r1,r2,r3…rn}。
最后,基于迭代筛选获得的背景像元集合B',获得全局背景模型。
更具体地,如图3所示,是本发明基于密度分析的迭代背景聚类算法流程图,其中,输入为高光谱数据集X',并初始化B'、S和P;通过基于密度-距离测度聚类算法,对高光谱数据集X'进行数据相似性分析;然后迭代提取当前最大的背景类别,并根据预设阈值P判断是否终止迭代筛选。如果满足终止条件,就开始异常检测,否则再对提取类别后的像元进行聚类。
异常检测采用RX检测算法,将马氏距离作为判断依据,具体如下:
考虑到每个地物背景类别在像元特征上的相似性,假设迭代过程获得的背景像元集合服从高斯分布,同时,异常像元出现的概率小,通常在10%左右;根据马氏距离的定义,基于背景像元集合B',以像元xi作为待测像元,计算其对应的马氏距离,如式(4)所示:
其中,
式中,di是像元xi与背景B'之间的马氏距离,μ为高光谱像元的均值向量,T为转置运算,Σ为背景像元集合B'的协方差矩阵;NB为B'中像元的数目,vj为B'中像元,μB为B'的均值向量。
更具体地,如图4所示,是本发明基于多背景类别的异常检测算法流程图,首先,输入待检测的高光谱数据;然后,基于相对密度与迭代分析建立全局背景模型,其中类1、类2、…类n,是聚类算法获得的多个背景类;接着,采用RX异常检测算法,通过马氏距离,检测单个背景类下像素的异常显著性;最后,融合算法将多个背景类检测获得的异常显著性进行融合,获得最后的异常检测结果。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (7)

1.一种面向高光谱复杂背景的迭代聚类异常检测算法,其特征是,包括如下步骤:
基于相对密度与迭代分析,建立全局背景模型;
基于全局背景模型,利用马氏距离采用RX异常检测算法进行异常检测。
2.根据权利要求1所述的面向高光谱复杂背景的迭代聚类异常检测算法,其特征是,基于相对密度与迭代分析,建立全局背景模型,包括:
基于密度-距离测度聚类算法,对高光谱遥感数据进行相似性分析;
基于相似性分析结果进行迭代筛选,获取全局背景模型。
3.根据权利要求2所述的面向高光谱复杂背景的迭代聚类异常检测算法,其特征是,基于密度-距离测度聚类算法,对高光谱遥感数据进行相似性分析,包括:
基于密度尺度和距离尺度,在高光谱遥感数据像元中提取聚类中心;
高光谱遥感数据经提取聚类中心后剩余像元按最邻近聚类原则聚类,获取以聚类中心为中心点的地物类别。
4.根据权利要求3所述的面向高光谱复杂背景的迭代聚类异常检测算法,其特征是,聚类中心的提取条件,包括:密度最大,且与其他类别像元之间距离最大。
5.根据权利要求3所述的面向高光谱复杂背景的迭代聚类异常检测算法,其特征是,基于相似性分析结果进行迭代筛选,获取全局背景模型,包括:
提取密度最大地物类别中的像元,纳入背景地物像元集合;
基于密度-距离测度聚类算法,对高光谱遥感数据经提取密度最大地物类别中的像元后剩余像元进行相似性分析;
重复密度最大地物类别中的像元的提取过程,直至高光谱遥感数据经提取出的背景像元数量占总像元数量的百分比达到预设阈值;
基于背景地物像元集合,获取全局背景模型。
6.根据权利要求5所述的面向高光谱复杂背景的迭代聚类异常检测算法,其特征是,预设阈值的取值范围是85%至95%。
7.根据权利要求1至6中任一项所述的面向高光谱复杂背景的迭代聚类异常检测算法,其特征是,还包括:采用多背景类别分别对待测像元进行异常检测,并通过融合算法获得检测结果。
CN201910467217.6A 2019-05-31 2019-05-31 一种面向高光谱复杂背景的迭代聚类异常检测方法 Active CN110222756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910467217.6A CN110222756B (zh) 2019-05-31 2019-05-31 一种面向高光谱复杂背景的迭代聚类异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910467217.6A CN110222756B (zh) 2019-05-31 2019-05-31 一种面向高光谱复杂背景的迭代聚类异常检测方法

Publications (2)

Publication Number Publication Date
CN110222756A true CN110222756A (zh) 2019-09-10
CN110222756B CN110222756B (zh) 2022-09-02

Family

ID=67819098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910467217.6A Active CN110222756B (zh) 2019-05-31 2019-05-31 一种面向高光谱复杂背景的迭代聚类异常检测方法

Country Status (1)

Country Link
CN (1) CN110222756B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160478A (zh) * 2019-12-31 2020-05-15 北京理工大学重庆创新中心 一种基于深度学习的高光谱目标显著性检测方法
CN115144350A (zh) * 2022-09-06 2022-10-04 中国科学院地理科学与资源研究所 基于高光谱相似像元比对的场地烃类污染判识方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110221926A1 (en) * 2010-03-12 2011-09-15 Kanaev Andrey V Spectral Anomaly Detection in Deep Shadows
CN105825512A (zh) * 2016-03-18 2016-08-03 武汉大学 基于稳健背景回归的高光谱遥感影像异常目标探测方法
CN108319959A (zh) * 2017-12-29 2018-07-24 中国科学院合肥物质科学研究院 一种基于图像特征压缩与检索的农作物病害图像识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110221926A1 (en) * 2010-03-12 2011-09-15 Kanaev Andrey V Spectral Anomaly Detection in Deep Shadows
CN105825512A (zh) * 2016-03-18 2016-08-03 武汉大学 基于稳健背景回归的高光谱遥感影像异常目标探测方法
CN108319959A (zh) * 2017-12-29 2018-07-24 中国科学院合肥物质科学研究院 一种基于图像特征压缩与检索的农作物病害图像识别方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160478A (zh) * 2019-12-31 2020-05-15 北京理工大学重庆创新中心 一种基于深度学习的高光谱目标显著性检测方法
CN111160478B (zh) * 2019-12-31 2022-07-26 北京理工大学重庆创新中心 一种基于深度学习的高光谱目标显著性检测方法
CN115144350A (zh) * 2022-09-06 2022-10-04 中国科学院地理科学与资源研究所 基于高光谱相似像元比对的场地烃类污染判识方法及系统
CN115144350B (zh) * 2022-09-06 2023-02-17 中国科学院地理科学与资源研究所 基于高光谱相似像元比对的场地烃类污染判识方法及系统

Also Published As

Publication number Publication date
CN110222756B (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN107563355B (zh) 基于生成对抗网络的高光谱异常检测方法
CN109871902B (zh) 一种基于超分辨率对抗生成级联网络的sar小样本识别方法
CN107992891B (zh) 基于光谱矢量分析多光谱遥感图像变化检测方法
Ke et al. Adaptive change detection with significance test
CN107895139B (zh) 一种基于多特征融合的sar图像目标识别方法
CN109919241B (zh) 基于概率模型和深度学习的高光谱未知类别目标检测方法
EP2291794B1 (en) Image processing
Roscher et al. Detection of disease symptoms on hyperspectral 3D plant models
CN109657610A (zh) 一种高分辨率多源遥感影像的土地利用变化检测方法
Deng et al. Cloud detection in satellite images based on natural scene statistics and gabor features
Domadia et al. Comparative analysis of unsupervised and supervised image classification techniques
Singh et al. Unsupervised change detection from remote sensing images using hybrid genetic FCM
Doulgeris et al. Automatic PolSAR segmentation with the U-distribution and Markov random fields
Trivedi et al. Automatic segmentation of plant leaves disease using min-max hue histogram and k-mean clustering
CN107742113A (zh) 一种基于目标数量后验的sar图像集群目标检测方法
Keshava Best bands selection for detection in hyperspectral processing
CN111291818B (zh) 一种面向云掩膜的非均匀类别的样本均衡化方法
CN110222756A (zh) 一种面向高光谱复杂背景的迭代聚类异常检测算法
Fernández-Michelli et al. Unsupervised Polarimetric SAR Image Classification Using $\mathcal {G} _ {p}^{0} $ Mixture Model
Lombardo et al. A new maximum-likelihood joint segmentation technique for multitemporal SAR and multiband optical images
Kusetogullari et al. Self-adaptive hybrid PSO-GA method for change detection under varying contrast conditions in satellite images
Zeng et al. Detecting and measuring fine roots in minirhizotron images using matched filtering and local entropy thresholding
CN111460943A (zh) 一种遥感影像地物分类方法及系统
CN116912582A (zh) 一种基于表征模型的强鲁棒性高光谱目标检测方法
Alarcon-Ramirez et al. A new methodology based on level sets for target detection in hyperspectral images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant