CN117853931A - 基于最近邻距离的高光谱图像孤立异常检测方法 - Google Patents
基于最近邻距离的高光谱图像孤立异常检测方法 Download PDFInfo
- Publication number
- CN117853931A CN117853931A CN202410239346.0A CN202410239346A CN117853931A CN 117853931 A CN117853931 A CN 117853931A CN 202410239346 A CN202410239346 A CN 202410239346A CN 117853931 A CN117853931 A CN 117853931A
- Authority
- CN
- China
- Prior art keywords
- band
- effective
- wave band
- nearest neighbor
- hyperspectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 claims abstract description 59
- 230000002159 abnormal effect Effects 0.000 claims abstract description 34
- 238000001228 spectrum Methods 0.000 claims abstract description 28
- 238000004364 calculation method Methods 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 9
- 230000003595 spectral effect Effects 0.000 claims description 24
- 208000022052 Bilateral acute depigmentation of the iris Diseases 0.000 claims description 19
- 230000005856 abnormality Effects 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 abstract description 45
- 230000007246 mechanism Effects 0.000 abstract description 7
- 238000002955 isolation Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 12
- 238000013507 mapping Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101100072420 Caenorhabditis elegans ins-5 gene Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/194—Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/12—Details of acquisition arrangements; Constructional details thereof
- G06V10/14—Optical characteristics of the device performing the acquisition or on the illumination arrangements
- G06V10/143—Sensing or illuminating at different wavelengths
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/58—Extraction of image or video features relating to hyperspectral data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/771—Feature selection, e.g. selecting representative features from a multi-dimensional feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Remote Sensing (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于最近邻距离的高光谱图像孤立异常检测方法,包括:获取三维高光谱遥感数据;并转换为二维高光谱遥感数据;根据所有波段数据,计算有效光谱指数ESI,筛选有效波段集;在有效波段集的任意波段中,计算背景‑目标区分指数,筛选有效波段子集;随机选取多个像元作为训练集,将训练集中所有像元以各自为圆心,以该像元到其最近邻像元的欧氏距离为半径,做出多个超球,根据超球集,计算待检测像元在每组超球集中的异常得分,进行均值计算,得到最终异常检测结果。本申请利用改进的孤立最近邻算法进行异常检测,不需要对背景进行建模,采用多维超球体切割数据空间来实现孤立机制,有效利用高光谱遥感图像的多个波段,提高了异常检测精度。
Description
技术领域
本发明涉及遥感图像技术领域,尤其涉及一种基于最近邻距离的高光谱图像孤立异常检测方法。
背景技术
高光谱分辨率(简称高光谱)遥感,可在获取地物形状、颜色等二维空间信息的同时,获取地物纳米级的精细光谱信息。因此,高光谱遥感图像同时包含地物的空间信息与丰富且细致的光谱信息,广泛应用于资源矿产调查、军事侦查、工业检测、精细农林等领域。其中,异常检测是高光谱遥感图像的重要应用之一,也是该领域的研究热点与难点之一。高光谱图像异常检测是指:在不掌握感兴趣目标先验信息前提下,探测出在光谱维或空间维与背景地物存在显著差异的像元。例如,调查区的围岩蚀变点、草地里伪装过的作战车辆、海洋上的舰船或石油泄漏点、机场停放的飞机等为异常目标,而草地、海洋和机场为背景地物。现有大多数高光谱图像异常检测方法核心是对背景地物的精确建模,即重点研究如何更优的描述背景地物的统计学分布、如何更优的建立背景像元模型,进而识别出与背景像元模型存在明显差异的像元。然而,高光谱遥感图像背景地物中异常像元的存在深度影响背景建模精度,进而降低异常像元和背景地物的可区分性。
近年来,基于孤立理论的异常检测方法在多个领域得到广泛应用。其中基于二叉树集合(多棵二叉树的集合即森林)来实现孤立机制的算法被引入到高光谱数据异常检测中,基于二叉树集合来实现孤立机制的算法即孤立森林算法,取得了较好的检测效果。
例如:文献1:“Li S , Zhang K , Duan P , et al. Hyperspectral AnomalyDetection With Kernel Isolation Forest[J]. IEEE Transactions on Geoscienceand Remote Sensing, 2019, PP(99):1-11”中公开了一种基于孤立森林算法的高光谱图像异常检测方法。该方法先将原始高光谱数据利用核主成分分析(kernel PCA)进行非线性映射,并选取指定的前ζ个主成分;然后将变换后的数据经孤立森林算法进行异常检测;最后,如有大面积的连通区域被标记为异常,则在该区域再次运行孤立森林算法进行二次探测。该方法通过预先核变换和后续二次检测这两步操作,分别从一定程度上提高了高光谱数据的可分性和改善了孤立森林算法的虚警问题;但该方法将未考虑以下三个问题:1)孤立森林算法每次只随机选取一个维度,大量维度未被使用,进而导致检测结果可靠性不足,故不适用高维数据;2)孤立森林算法的运行机制和对异常得分的定义使得该方法仅对全局异常点敏感,不擅长处理局部异常点;3)该方法只利用了高光谱数据立方体的光谱维信息,未考虑空间维信息;4)进行非线性映射时核函数的选择与参数的设置没有成熟的理论依据,需要通过大量的实践并根据经验进行选择。
在名称为“基于改进孤立森林算法的高光谱图像异常检测方法及装置”,申请号为:CN202110279476.3的发明专利中,公开了一种改进的孤立森林算法,将原始孤立森林算法中的异常得分计算公式由全局测度改进为局部测度,提高了孤立森林算法对局部异常的检测能力,但是该改进后的算法仍然是以二叉树来实现孤立理论,每次运算只能利用待检数据的一个属性,这对于包含上百个波段的高光谱遥感图像来说显然是不合理的。
文献3“Li S , Zhang K , Duan P , et al. Hyperspectral AnomalyDetection With Kernel Isolation Forest[J]. IEEE Transactions on Geoscienceand Remote Sensing, 2019, PP(99):1-11”中公开了一种基于孤立森林的高光谱图像异常检测方法。该方法首次将孤立森林算法引进到高光谱异常检测领域,其先将原始高光谱数据经核主成分分析进行非线性映射并选取指定的前ζ个主成分;然后将处理后的数据经孤立森林算法进行异常检测;最后,如有大面积的连通区域被标记为异常,则在该区域再次运行孤立森林算法进行二次探测。该方法通过预先核变换和后续二次检测这两步操作,分别从一定程度上提高了高光谱数据的可分性和改善了孤立森林算法的虚警问题;但该方法有以下三个缺点:1)孤立森林算法每次只随机选取一个维度,大量维度未被使用,进而导致检测结果可靠性不足,故不适用高维数据;2)孤立森林算法的运行机制和对异常得分的定义使得该方法仅对全局异常点敏感,不擅长处理局部异常点;3)该方法只利用了高光谱数据立方体的光谱维信息,未考虑空间维信息;4)进行非线性映射操作需计算高阶Gram核矩阵及其逆矩阵,计算复杂度和计算量较大;核函数的选择与参数的设置暂没有成熟的理论依据,需要通过大量的实践并根据经验进行选择。
文献4“Wang R , Nie F , Wang Z , et al. Multiple Features andIsolation Forest-Based Fast Anomaly Detector for Hyperspectral Imagery[J].IEEE Transactions on Geoscience and Remote Sensing, 2020, PP(99):1-13”中公开了一种基于孤立森林算法的高光谱图像空谱联合特性异常检测算法。该方法将原始高光谱数据、Gabor滤波后的数据、经扩展形态学剖面方法(EMP)处理后的数据和经扩展多属性剖面方法(EMAP)处理后的数据,这四部分数据作为输入分别利用孤立森林算法进行处理,进而得到四组异常检测结果,然后将四组结果取平均作为最终的异常目标检测结果。进一步的,该方法将原始高光谱数据作为输入利用孤立森林算法进行处理,是在利用高光谱数据的光谱维信息;将Gabor、EMP和EMAP处理后的数据作为输入,是在利用高光谱数据的空间信息。故,该方法同时利用了高光谱图像的空间信息与光谱特性进行异常目标检测,一定程度上提高了检测性能。此外,该方法未利用核变换对高光谱数据进行非线性映射,故不需计算高阶Gram核矩阵及其逆矩阵,计算复杂度和计算量虽然有所降低。但该方法仍然存在以下几个缺点:1)将原始高光谱数据作为输入利用孤立森林算法进行异常检测时,每次只随机选取一个波段,然后基于该波段下各像元的灰度值进行分类,大量波段信息未被利用,进而导致检测结果可靠性不足;2)高光谱图像的特征在于高光谱分辨率,图像的空间分辨则不是很高;而该方法最终检测结果中有三部分是利用空间信息获得的,只有一部分是由光谱信息获得的;也即,该方法较充分的利用了高光谱图像的空间信息,而未能充分利用高光谱图像丰富且细致的光谱信息,这与高光谱图像数据低空间分辨率而高光谱分辨率的特征相违背;3)未改善孤立森林算法仅对全局异常点敏感,不擅长处理局部异常点的问题。
文献5:“X. Song, S. Aryal, K. M. Ting, Z. Liu and B. He,"Spectral–Spatial Anomaly Detection of Hyperspectral Data Based on ImprovedIsolation Forest," in IEEE Transactions on Geoscience and RemoteSensing, vol. 60,2022, pp. 1-16”公开了一种基于改进孤立森林算法的空间-光谱联合特征高光谱遥感图像异常检测,利用Gabor滤波器、ERS分割和改进后的孤立森林算法充分利用高光谱遥感图像的空间特征与光谱特征,充分利用高光谱遥感图像的局部特征与全局特征,很好地改善了原始孤立森林算法在局部异常、高维特征提取上的短板。但该方法还是基于二叉树来实现孤立理论,上述改善与提高是基于增加计算量实现的,使得原始孤立森林算法计算效率高的优势不再明显。
综上所述,现有技术普遍存在以下问题:
1、进行异常检测时,每次只随机选取一个波段,大量波段信息未被利用,进而导致检测结果可靠性不足的问题。
2、孤立森林算法每次只随机选取一个维度,大量维度未被使用,进而导致检测结果可靠性不足,不适用高维数据。
3、孤立森林算法仅对全局异常点敏感,不适于处理局部异常点。
4、计算量大计算效率降低。
因此,本申请提出一种基于最近邻距离的高光谱图像孤立异常检测方法,对现有孤立森林算法进行改进,解决以上问题。
发明内容
因此,本发明目的在于提供一种基于最近邻距离的高光谱图像孤立异常检测方法,利用孤立最近邻算法设计高光谱图像异常检测方法,不需要对背景进行建模,采用多维超球体切割数据空间来实现孤立机制,同时利用高光谱遥感图像的多个波段,提高了高光谱遥感图像异常检测精度。
为了实现上述目的,本发明提供的一种基于最近邻距离的高光谱图像孤立异常检测方法,包括以下步骤:
S1、获取三维高光谱遥感数据;并将三维高光谱遥感数据转换为二维高光谱遥感数据;
S2、根据所述二维高光谱遥感数据中的所有波段数据,计算有效光谱指数ESI,根据得到的有效光谱指数ESI,筛选有效波段集;
S3、根据得到的有效波段集,在有效波段集的任意波段中,计算背景-目标区分指数BADI,筛选有效波段子集;
S4、在得到的有效波段子集中,随机选取多个像元作为训练集,将训练集中所有像元/>以各自为圆心,以/>到最近邻像元/>的欧氏距离为半径,做出多个超球,其中/>为像元/>的最近邻像元;将S4重复操作t次,生成t组超球集;
S5、根据得到的超球集,对任意待检测像元x,计算待检测像元x在每组超球集中的异常得分,根据每组得到的异常得分,进行均值计算,得到最终异常检测结果。
进一步优选地,在S2中,根据所述二维高光谱遥感数据中的所有波段数据,计算有效光谱指数ESI,包括采用自下而上逐点式搜索策略,计算所有波段的有效光谱指数ESI,包括:
S201、计算所有波段的协方差矩阵,将方差最大的波段标记为初始的有效波段集,其余波段标记为未被选择波段集;
S202、遍历未被选择波段集中的所有波段,每次选择一个波段加入临时有效波段集,计算有效光谱指数ESI,将使有效光谱指数ESI达到最优解的波段保留至有效波段集,其余波段从备选波段集中剔除,进入下一轮迭代,直至有效波段集中波段数量达到第一预设要求。
进一步优选地,在S2中,所述有效光谱指数ESI,采用如下公式(1)进行计算:
公式(1)
其中,表示波段/>和波段/>的有效光谱指数ESI,为协方差函数,用于表征波段/>和波段/>的相关性,/>为波段/>的标准差,代表波段/>的信息量;/>为波段/>的标准差,代表波段/>的信息量。
进一步优选地,在S3中,在有效波段集的任意波段中,计算背景-目标区分指数,筛选有效波段子集,包括以下步骤:
S301、遍历任意波段中的所有像元,将不同像元作为阈值,计算波段/>的背景-目标区分指数BADI,将背景-目标区分指数BADI的最大值作为波段/>的背景-目标区分指数;
S302、按照S301的步骤计算所有波段的背景-目标区分指数BADI,并按照BADI值从大到小排序;
S303、根据排序结果,筛选符合第二预设要求的波段,保留至有效波段子集中,将其余波段剔除。
进一步优选的,所述背景-目标区分指数BADI按照如下公式(2)进行计算:
公式(2)
其中,表示波段/>的标准差,/>表示波段/>中异常像元的标准差,表示波段/>中背景像元的标准差;/>表示波段/>的背景-目标区分指数。
进一步优选地,在S5中,在计算待检测像元x在每组超球集中的异常得分时,包括,当待测像元,未落在超球集中任意一个超球时,则像元/>在该超球集中的异常得分为1。
进一步优选的,在S5中,当待测像元,落在任意超球中时,对任意待检测像元x,按照如下公式(3)计算待检测像元x在每组超球集中的异常得分,包括:
公式(3)
其中,,/>表示以任意像元c为圆心的超球,/>为像元x的最近邻像元;/>表示像元/>的最近邻像元;/>表示以像元x为圆心的超球半径,/>表示以x的最近邻像元/>为圆心的超球半径;表示以/>为圆心的超球半径。
进一步优选地,在S5中,根据每组得到的异常得分,进行按照如下公式(4),均值计算,得到最终异常检测结果,
公式(4)
其中,表示得到的最终异常得分,t为超球集组数,/>表示第i组超球集中的异常得分。
本申请公开的基于最近邻距离的高光谱图像孤立异常检测方法,相比于现有技术至少具有以下优点:
1、通过相关性对波段进行初次筛选,使保留下来的波段数据具有较高的信息量,但是波段选择后的波段子集可能仍然存在较严重的信息冗余现象,因此本申请采用有效光谱指数,将信息量大、彼此之间相关性低的波段保留为有效波段。
2、本申请还采用背景-目标区分指数BADI,根据筛选出的波段中的异常像元和背景像元之间的光谱特性对波段进行进一步筛选,剔除信息量大且彼此之间相关性低,但异常像元与背景像元区分度不高的波段,进一步减少冗余数据。
3、本申请在原始孤立最近邻算法基础上,面向高光谱图像异常检测需求,改进了异常得分计算方法,提出的基于改进孤立最近邻距离的异常检测方法,不需要对背景进行建模,提高了检测效果。采用多维超球体切割数据空间来实现孤立机制,可同时利用高光谱遥感图像的多个波段,提高了高光谱遥感图像异常检测精度。
附图说明
图1为本发明的结构基于最近邻距离的高光谱图像孤立异常检测方法的流程示意图。
图2为本发明异常得分计算说明和超球生成方式示意图。
图3为本发明实施例中德克萨斯海岸城镇高光谱遥感图像与异常目标真实分布对比图。
图4为本发明实施例中圣地亚哥机场高光谱图像在不同方法下的检测结果对比图。
图5 为本发明实施例中圣地亚哥机场高光谱图像在不同方法下的ROC曲线图。
具体实施方式
以下通过附图和具体实施方式对本发明作进一步的详细说明。
如图1所示,本发明一方面实施例提供的一种基于最近邻距离的高光谱图像孤立异常检测方法,包括以下步骤:
S1、获取三维高光谱遥感数据;并将三维高光谱遥感数据转换为二维高光谱遥感数据;其中,高光谱遥感图像数据一般采用表示,/>代表图像高度也即像元行数,/>代表图像宽度也即像元列数,/>代表波段总数也即像元特征维度。本申请中将高光谱数据转换为/>进行处理,其中/>是图像的像元总数,/>是高光谱图像的波段总数,即将高光谱图像的/>个像元看作/>个向量,而每个向量有/>个坐标,故图像所有像元样本可表示为/>。
S2、根据所述二维高光谱遥感数据中的所有波段数据,计算有效光谱指数ESI,根据得到的有效光谱指数ESI,筛选有效波段集;
进一步优选的,在S2中,根据所述二维高光谱遥感数据中的所有波段数据,计算有效光谱指数ESI,包括采用自下而上逐点式搜索策略,计算所有波段的有效光谱指数ESI,包括:
S201、计算所有波段的协方差矩阵,将方差最大的波段标记为初始的有效波段集,其余波段标记为未被选择波段集;对于待检高光谱数据,将第/>波段和第/>波段之间的相关性用协方差来评价,记为/>;将第/>波段的信息量用标准差来评价,记为。其中,/>代表第/>波段的高光谱图像
S202、遍历未被选择波段集中的所有波段,每次选择一个波段加入临时有效波段集,计算有效光谱指数ESI,将使有效光谱指数ESI达到最优解的波段保留至有效波段集,其余波段从备选波段集中剔除,进入下一轮迭代,直至有效波段集中波段数量达到第一预设要求。
所述有效光谱指数ESI,采用如下公式(1)进行计算:
公式(1)
其中,表示波段/>和波段/>的有效光谱指数ESI,表示波段/>和波段/>的相关性协方差,/>为波段/>的标准差,代表波段/>的信息量;/>为波段/>的标准差,代表波段/>的信息量。
具体包括采用算法自下而上逐点式搜索。
Step1、输入参数:- 输入的高光谱图像, />– 预设的波段选择数量;
输出参数:有效波段集。
Step2、初始化
(1)中心化:所有波段均减其均值,为方便表示,中心化处理后的高光谱图像仍记为/>;
(2)计算的所有/>个波段的协方差矩阵:/>。将方差最大的波段标记为初始的有效波段集/>,其中,/>,进一步地,/>代表第/>个被选择波段的索引序号,/>为协方差矩阵/>的第/>个对角线元素。将初始未被选择的波段子集成为无效子集,记为/>,则存在/>。
S2022、光谱波段选择
(1)遍历全体未选择的光谱波段,将其加入临时有效波段子集,取使得ESI值最大的未选择波段为本次遍历的有效波段;
,其中/>;
需要说明的是,协方差矩阵可从全波段协方差矩阵/>中取值,无需每次遍历时都进行计算;
(2)将符合条件的光谱波段从无效子集中删除,并将其加入临时至有效波段子集/>中;/>时,执行/>并重复Step2;否则,执行Step3;
Step3、输出波段选择后的有效波段集;
高光谱数据波段之间的相关性可由协方差进行评价,波段间的协方差越大代表其相关性越高;某个波段的光谱信息量可由方差进行评价,方差越大代表信息量越大。可以理解地,若只考虑信息量这一指标,波段选择后的波段子集可能仍然存在较严重的信息冗余现象。换言之,只考虑信息量这单一指标时,波段选择后的子集可能仍然存在较高的相关性。举例说明,如果波段选择后保留三个波段作为波段子集,若这三个光谱波段存在较高的相关性,则这三个光谱波段其实只有一个波段可提供有效的光谱特征,另外两个波段提供的是与第一个波段非常相似的光谱特征,属于冗余信息。冗余信息除增加计算量外,并不会对异常检测性能有促进作用。因此,若将方差更大的波段标记为异常检测的有效波段子集,而不考虑波段之间的协方差矩阵,是无法解决信息冗余问题的。基于此,本申请设计波段选择策略,期望将那些信息量大、彼此之间相关性低的波段保留为有效波段。
在研究高光谱遥感图像分类任务时,ESI值的大小可作为波段选择的有效参考指标。然而,在异常目标检测任务中,单个异常目标像元的数量通常不超过整幅图像像元总数的1%。因此,相对于背景像元,图像异常像元的比例很小。这使得高光谱图像的方差和波段间协方差等参数主要受背景像元的影响。换句话说,本发明提出的ESI值的大小主要由背景像元情况决定。因此,针对高光谱异常像元检测任务,本发明在考虑ESI值的同时,还充分考虑了背景-目标区分指数的情况。
S3、根据得到的有效波段集,在有效波段集的任意波段中,计算背景-目标区分指数BADI,筛选有效波段子集;进一步优选的,在S3中,在有效波段集的任意波段中,计算背景-目标区分指数,筛选有效波段子集,包括以下步骤:
S301、遍历任意波段中的所有像元,将不同像元作为阈值,计算波段/>的背景-目标区分指数BADI,将背景-目标区分指数BADI的最大值作为波段/>的背景-目标区分指数;
S302、按照S301的步骤计算所有波段的背景-目标区分指数,并按照BADI值从大到小排序;
S303、根据排序结果,筛选符合第二预设要求的波段,保留至有效波段子集中,将其余波段剔除。
进一步优选的,所述背景-目标区分指数BADI按照如下公式(2)进行计算:
公式(2)
其中,表示波段/>的标准差,/>表示波段/>中异常像元的标准差,表示波段/>中背景像元的标准差;/>表示波段/>的背景-目标区分指数。
S4、在得到的有效波段子集中,随机选取多个像元作为训练集,将训练集中所有像元/>以各自为圆心,以像元/>到最近邻像元/>的欧氏距离为半径,作出多个超球,其中/>为像元/>的最近邻像元;将S4重复操作t次,生成t组超球集;
S401、从待检高光谱数据中随机选择/>个像元作为训练子集,然后每个像元都各自找到在/>中除自身外其他/>个像元中离自己最近的点(也即最近邻),以到该最近邻的距离为半径,自己为圆心作出/>个超球。(注:画1维是线段,2维数据是圆形,3维是球体,超过3维的就是超球体)。显然地,因为数据分布越密的地方取得的样本点也越多,所以这种以样本点画球的方法可以理解为,数据空间中数据点越密的地方画的球会越多而且体积越小,数据分布越稀疏的地方球越少且体积越大。
S402、从高光谱数据中随机选择/>个像元继续按S401作超球,重复该步骤/>次以得到/>组超球,每次像元的选取都是独立从所有原始数据中随机抽样产生。
S5、根据得到的超球集,对任意待检测像元x,计算待检测像元x在每组超球集中的异常得分,根据每组得到的异常得分,进行均值计算,得到最终异常检测结果。
进一步优选的,在S5中,在计算待检测像元x在每组超球集中的异常得分时,包括,当待测像元,未落在超球集中任意一个超球时,则像元/>在该超球集中的异常得分为1。
进一步优选的,在S5中,当待测像元,落在任意超球中时,对任意待检测像元x,按照如下公式(3)计算待检测像元x在每组超球集中的异常得分,包括:
公式(3)
其中,,/>表示以任意像元c为圆心的超球,/>表示像元x的最近邻像元表示为/>;/>表示像元/>的最近邻像元;表示以像元x为圆心的超球半径,/>表示以像元x的最近邻像元/>为圆心的超球半径;/>表示以/>为圆心的超球半径。
进一步优选的,在S5中,根据每组得到的异常得分,进行按照如下公式(4),均值计算,得到最终异常检测结果,
公式(4)
其中,表示得到的最终异常得分,t为异常得分个数,/>表示第i组超球集中的异常得分。
如图2所示,图中展示一组超球,a和b为待检像元。/>不在任何超球中,/>的异常得分为1。/>的异常得分为(/>)。其中,虚线线段/>为(包含测试点/>的)超球/>的半径,双虚线段/>为超球/>的半径(离超球/>最近的超球为超球/>),黑实线线段/>为超球的第二最近邻超球的半径。
按照该规则,把高光谱数据中的所有像元分别放进每组超球(共/>组)中进行评估,得出/>个异常得分,计算其平均值作为每个像元的最终异常得分。显然,异常得分由两个最近超球的半径比值求得,也即两个最近邻距离的比值。如果待检像元在某个大半径的超球内,且附近超球半径都比较小,则越容易被孤立,其异常值也就更高。
本发明的仿真实验是在主频2.30GHz*12的Intel(R)Core(TM)i9-12950HX CPU、内存为64GB的计算机设备上进行的。
参照图3,选用圣地亚哥机场高光谱遥感图像数据作为实验数据集,该高光谱数据由AVIRIS传感器获得,预处理后共包含189个波段信息;该实验数据截取了原始图像中100×100个像元的区域,将图像中三架飞机作为异常目标,图3左侧为是该数据集第80波段的灰度图;图3右侧是异常目标分布图。
参照图4,将实验数据转化为的形式进行处理,即转化为10000行189列的矩阵/>进行处理;其中,矩阵的10000行代表图像的10000个像元,换言之,每个行向量代表图像的一个像元,且每个行向量由189个坐标组成,对应高光谱数据的189个波段。
参照图4,在对实验数据归一化后,将其作为基于最近邻距离的孤立异常检测算法的输入,计算每个像元的异常得分;进而得到整幅图像10000个像元各自的异常得分;最终得到如图4右侧所示的高光谱图像的异常目标检测结果。
参照图4可知,本发明提供的方法所得检测结果在视觉上具有异常目标(三架飞机)更清晰、背景信息压制效果更好的特点,视觉效果明显优于高光谱图像异常检测领域的经典算法RX算法所得如图4左侧所示的检测结果;而且,在检测速度更快的前提下,检测效果优于如图4中间所示基于孤立森林模型的方法。
参照图5,本发明提供的方法不仅在主观视觉效果上优于现有算法,在客观评价指标上也具备优势。具体地,本发明所提供高光谱异常检测方法,参照图5所示ROC曲线下面积(Area Under Curve,AUC)这一异常检测定量评价指标,ROC曲线越靠近坐标系的左上角、ROC曲线与横轴组成的面积越大,代表异常检测精度越高;由图5可知,在大多数情况下,在横坐标一定时,本发明所得纵坐标值更大;在纵坐标一定时,本发明所得横坐标值更小。也即,在相同虚警率时,本发明具有更高的检测率;在相同检测率时,本发明具有更低的虚警率,具备更好的异常检测性能。如下表1所示,AUC(D,F),AUC(D,)和AUC(F,/>)分别用于评价异常检测算法有效性、异常像元检出能力和对背景像元的压制能力。已知,AUC(PD, PF)、AUC(PD, />)越大,代表异常检测器性能越强,AUC(PF, />)值越小代表虚警现象较少、异常检测器性能越强。进一步地,AUCOD值可用于评价异常检测器的总体探测性能(OverallDetection Performance),AUCSNPR值类似于信息论中信噪比(Signal-to-Noise Rate,SNR)的概念,两个指标可由以下公式计算得到:
,
。
由圣地亚哥机场高光谱图像在不同方法下的AUC值统计表(表1)可知,本发明所提iNNE方法具备最好的异常检测能力。表2为不同异常方法的运行时间表,可见,本发明所提方法比基于iForest的相关方法计算效率更高。综上所述,本发明所提供的方法可利用高光谱数据多个波段的光谱信息;无需像基于树的孤立检测方法那样对待测像元进行多次分割,进而降低了计算复杂度,运算速度快,并且检测能力优于基于孤立森林模型的算法,优于高光谱异常检测的经典算法RX算法。
表1 圣地亚哥机场高光谱图像在不同方法下的AUC值统计表
表2 圣地亚哥机场高光谱图像在不同方法下的运行时间图
显然,上述实施例仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (8)
1.一种基于最近邻距离的高光谱图像孤立异常检测方法,其特征在于,包括以下步骤:
S1、获取三维高光谱遥感数据;并将三维高光谱遥感数据转换为二维高光谱遥感数据;
S2、根据所述二维高光谱遥感数据中的所有波段数据,计算有效光谱指数ESI,根据得到的有效光谱指数ESI,筛选有效波段集;
S3、根据得到的有效波段集,在有效波段集的任意波段中,计算背景-目标区分指数BADI,筛选有效波段子集;
S4、在得到的有效波段子集中,随机选取多个像元作为训练集,将训练集/>中所有像元/>以各自为圆心,以/>到最近邻像元/>的欧氏距离为半径,做出多个超球,其中/>为像元/>的最近邻像元;将S4重复操作t次,生成t组超球集;
S5、根据得到的超球集,对任意待检测像元x,计算待检测像元x在每组超球集中的异常得分,根据每组得到的异常得分,进行均值计算,得到最终异常检测结果。
2.根据权利要求1所述的基于最近邻距离的高光谱图像孤立异常检测方法,其特征在于,在S2中,根据所述二维高光谱遥感数据中的所有波段数据,计算有效光谱指数ESI,包括采用自下而上逐点式搜索策略,计算所有波段的有效光谱指数ESI,包括:
S201、计算所有波段的协方差矩阵,将方差最大的波段标记为初始的有效波段集,其余波段标记为未被选择波段集;
S202、遍历未被选择波段集中的所有波段,每次选择一个波段加入临时有效波段集,计算有效光谱指数ESI,将使有效光谱指数ESI达到最优解的波段保留至有效波段集,其余波段从备选波段集中剔除,进入下一轮迭代,直至有效波段集中波段数量达到第一预设要求。
3.根据权利要求1所述的基于最近邻距离的高光谱图像孤立异常检测方法,其特征在于,在S2中,所述有效光谱指数ESI,采用如下公式(1)进行计算:
公式(1)
其中,表示波段/>和波段/>的有效光谱指数ESI,/>是协方差函数,表示波段/>和波段/>的相关性,/>为波段/>的标准差,代表波段/>的信息量;/>为波段/>的标准差,代表波段/>的信息量。
4.根据权利要求1所述的基于最近邻距离的高光谱图像孤立异常检测方法,其特征在于,在S3中,在有效波段集的任意波段中,计算背景-目标区分指数BADI,筛选有效波段子集,包括以下步骤:
S301、遍历任意波段中的所有像元,分别将不同像元作为阈值,迭代计算波段/>的背景-目标区分指数BADI,将迭代计算得到的背景-目标区分指数BADI最大值作为波段/>的背景-目标区分指数BADI;
S302、按照S301的步骤计算所有波段的背景-目标区分指数,并按照BADI值从大到小排序;
S303、根据排序结果,筛选符合第二预设要求的波段,保留至有效波段子集中,将其余波段剔除。
5.根据权利要求1所述的基于最近邻距离的高光谱图像孤立异常检测方法,其特征在于,所述背景-目标区分指数BADI按照如下公式(2)进行计算:
公式(2)
其中,表示波段/>的标准差,/>表示波段/>中异常像元的标准差,/>表示波段/>中背景像元的标准差;/>表示波段/>的背景-目标区分指数。
6.根据权利要求1所述的基于最近邻距离的高光谱图像孤立异常检测方法,其特征在于,在S5中,在计算待检测像元x在每组超球集中的异常得分时,包括,当待测像元,未落在超球集中任意一个超球时,则将像元/>在该超球集中的异常得分记为1。
7.根据权利要求1所述的基于最近邻距离的高光谱图像孤立异常检测方法,其特征在于,在S5中,当待测像元,落在任意超球中时,对任意待检测像元x,按照如下公式(3)计算待检测像元x在每组超球集中的异常得分,包括:
公式(3)
其中,,/>表示以任意像元c为圆心的超球,/>表示像元x的最近邻像元;/>表示像元/>的最近邻像元;/>表示以像元x为圆心的超球半径,/>表示以像元x的最近邻像元/>为圆心的超球半径;表示以/>为圆心的超球半径。
8.根据权利要求1所述的基于最近邻距离的高光谱图像孤立异常检测方法,其特征在于,在S5中,根据每组得到的异常得分,进行按照如下公式(4),均值计算,得到最终异常检测结果,
公式(4)
其中,表示得到的最终异常得分,t为超球集组数,/>表示第i组超球集中的异常得分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410239346.0A CN117853931B (zh) | 2024-03-04 | 2024-03-04 | 基于最近邻距离的高光谱图像孤立异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410239346.0A CN117853931B (zh) | 2024-03-04 | 2024-03-04 | 基于最近邻距离的高光谱图像孤立异常检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117853931A true CN117853931A (zh) | 2024-04-09 |
CN117853931B CN117853931B (zh) | 2024-05-14 |
Family
ID=90542043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410239346.0A Active CN117853931B (zh) | 2024-03-04 | 2024-03-04 | 基于最近邻距离的高光谱图像孤立异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117853931B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016000088A1 (zh) * | 2014-07-02 | 2016-01-07 | 中国林业科学研究院林业研究所 | 一种基于最佳指数-相关系数法的高光谱波段提取方法 |
CN110398466A (zh) * | 2019-08-05 | 2019-11-01 | 北京绿土科技有限公司 | 基于遥感反演的农作物生长状态监测方法 |
CN110443125A (zh) * | 2019-06-27 | 2019-11-12 | 武汉大学 | 一种基于判别森林子空间选择的高光谱异常探测方法 |
CN112990313A (zh) * | 2021-03-16 | 2021-06-18 | 中国科学院长春光学精密机械与物理研究所 | 高光谱图像异常检测方法、装置、计算机设备及存储介质 |
CN112990314A (zh) * | 2021-03-16 | 2021-06-18 | 中国科学院长春光学精密机械与物理研究所 | 基于改进孤立森林算法的高光谱图像异常检测方法及装置 |
CN113657199A (zh) * | 2021-07-28 | 2021-11-16 | 西安理工大学 | 基于空-谱提取的高光谱图像异常检测方法 |
-
2024
- 2024-03-04 CN CN202410239346.0A patent/CN117853931B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016000088A1 (zh) * | 2014-07-02 | 2016-01-07 | 中国林业科学研究院林业研究所 | 一种基于最佳指数-相关系数法的高光谱波段提取方法 |
CN110443125A (zh) * | 2019-06-27 | 2019-11-12 | 武汉大学 | 一种基于判别森林子空间选择的高光谱异常探测方法 |
CN110398466A (zh) * | 2019-08-05 | 2019-11-01 | 北京绿土科技有限公司 | 基于遥感反演的农作物生长状态监测方法 |
CN112990313A (zh) * | 2021-03-16 | 2021-06-18 | 中国科学院长春光学精密机械与物理研究所 | 高光谱图像异常检测方法、装置、计算机设备及存储介质 |
CN112990314A (zh) * | 2021-03-16 | 2021-06-18 | 中国科学院长春光学精密机械与物理研究所 | 基于改进孤立森林算法的高光谱图像异常检测方法及装置 |
CN113657199A (zh) * | 2021-07-28 | 2021-11-16 | 西安理工大学 | 基于空-谱提取的高光谱图像异常检测方法 |
Non-Patent Citations (2)
Title |
---|
THARINDU R. BANDARAGODA等: "Isolation-based anomaly detection using nearest-neighbor ensembles", 《COMPUTATIONAL INTELLIGENCE》, 31 December 2018 (2018-12-31), pages 968 - 998 * |
XIANGYU SONG等: "Spectral–Spatial Anomaly Detection of Hyperspectral Data Based on Improved Isolation Forest", 《IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING》, 31 December 2022 (2022-12-31), pages 1 - 16 * |
Also Published As
Publication number | Publication date |
---|---|
CN117853931B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jia et al. | A novel ranking-based clustering approach for hyperspectral band selection | |
CN103996047B (zh) | 基于压缩谱聚类集成的高光谱图像分类方法 | |
CN100507603C (zh) | 基于选择性核主成份分析的高光谱图像异常点的检测方法 | |
CN106503739A (zh) | 联合光谱和纹理特征的高光谱遥感影像svm分类方法及系统 | |
Ranjan et al. | Hyperspectral image classification: A k-means clustering based approach | |
CN108197650B (zh) | 局部相似性保持的高光谱图像极限学习机聚类方法 | |
CN112101271A (zh) | 一种高光谱遥感影像分类方法及装置 | |
Gao et al. | A multiscale dual-branch feature fusion and attention network for hyperspectral images classification | |
Shi et al. | Hyperspectral target detection with macro-micro feature extracted by 3-D residual autoencoder | |
CN111680579B (zh) | 一种自适应权重多视角度量学习的遥感图像分类方法 | |
CN112990314B (zh) | 基于改进孤立森林算法的高光谱图像异常检测方法及装置 | |
Wang et al. | SPATIAL ENTROPY BASED MUTUAL INFORMATION IN HYPERSPECTRAL BAND SELECTION FOR SUPERVISED CLASSIFICATION. | |
Diakite et al. | Hyperspectral image classification using 3D 2D CNN | |
CN112733736A (zh) | 基于增强过采样的类别不平衡高光谱图像分类方法 | |
CN107203779A (zh) | 基于空谱信息保持的高光谱降维方法 | |
CN104392454A (zh) | 高光谱遥感图像空谱结合分类框架下的基于地物类别隶属度评分的合并方法 | |
CN113469084B (zh) | 基于对比生成对抗网络的高光谱图像分类方法 | |
US8918347B2 (en) | Methods and systems for computer-based selection of identifying input for class differentiation | |
Sun et al. | Information entropy estimation based on point-set topology for hyperspectral anomaly detection | |
CN117853931B (zh) | 基于最近邻距离的高光谱图像孤立异常检测方法 | |
CN116704241A (zh) | 一种全通道3d卷积神经网络高光谱遥感图像分类方法 | |
Alburshaid et al. | Developing date palm tree inventory from satellite remote sensed imagery using deep learning | |
Zhou et al. | Lidar point cloud classification with coordinate attention blueprint separation involution neural network | |
Wang et al. | Multiscale fusion network based on global weighting for hyperspectral feature selection | |
Ding et al. | Ensemble classification of hyperspectral images by integrating spectral and texture features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |