CN104062008A - 一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法 - Google Patents

一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法 Download PDF

Info

Publication number
CN104062008A
CN104062008A CN201410264087.3A CN201410264087A CN104062008A CN 104062008 A CN104062008 A CN 104062008A CN 201410264087 A CN201410264087 A CN 201410264087A CN 104062008 A CN104062008 A CN 104062008A
Authority
CN
China
Prior art keywords
spectrum
sigma
sid
exceptional
curve
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410264087.3A
Other languages
English (en)
Other versions
CN104062008B (zh
Inventor
詹云军
苏余斌
黄解军
余晨
邓安鑫
朱捷缘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN201410264087.3A priority Critical patent/CN104062008B/zh
Publication of CN104062008A publication Critical patent/CN104062008A/zh
Application granted granted Critical
Publication of CN104062008B publication Critical patent/CN104062008B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,用局部度量欧氏距离ED、余弦角CA和整体度量光谱信息散度SID的值,进行归一化处理后计算表达式(ED×SID)/CA的值,人工确定阈值之后提出表达式(ED×SID)/CA位于阈值上方的光谱点,完成异常光谱的剔除。还可以在二维平面上以阈值为纵坐标,确定一个阈值线,在以光谱编号和表达式(ED×SID)/CA的值建立的二维平面散点图上剔除阈值线之上的光谱点,完成异常光谱的剔除。本发明加入光谱信息散度SID可定量表征光谱整体相似性。从光谱局部与整体性区分其与标准光谱集之间的差异,弥补了传统利用距离、角度度量不能区分光谱整体相似性的问题。

Description

一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法
技术领域
本发明属于一种实测光谱曲线中异常光谱的剔除方法,具体涉及一种考虑整体度量的实测光谱曲线中异常光谱剔除方法。
背景技术
光谱分析技术在地质遥感、农林生态、土壤调查、污染监测、食品检测、计量化学等领域应用广泛,在测量过程中,由于仪器噪声、外界环境干扰、操作不当及其他偶发因素的影响,采集到的光谱数据中往往存在异常光谱,如果直接使用这些数据进行建模分析,势必会影响模型的准确性和稳定性。因此,有必要识别出异常光谱并将其剔除。
以往运用距离、角度相似性的局部度量比较方法测量光谱与标准光谱集均值光谱之间的差异,由于距离、角度度量分别是利用谱段间的距离、角度差异的加权值,谱段间差异易相互抵消,难以区分整体波形结构差异,如果该测量光谱整体波形与标准光谱集均值光谱之间实际差异很大,但计算出的距离、角度相似性度量结果由于谱段间差异相互抵消造成相似性度量结果恰好很小,传统度量方法会认为该光谱是正常光谱且不能去除,势必会对后续光谱分析产生影响。
因此需要一种考虑到光谱整体相似性的比较方法应用于异常光谱 的剔除。
发明内容:
本发明要解决的技术问题是提供一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,从光谱局部与整体性区分其与标准光谱集之间的差异弥补了传统利用距离、角度度量不能区分光谱整体相似性的问题。
为了解决上述技术问题本发明的技术方案为:
一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,包括如下步骤:步骤1),对实测光谱曲线进行预处理;步骤2),计算经预处理的实测光谱曲线与标准光谱集平均光谱之间的局部度量和整体度量,并将计算结果归一化到0-1之间,局部度量包括欧氏距离ED和余弦角CA,整体度量包括光谱信息散度SID;步骤3),依据上述经归一化到0-1之间的欧氏距离ED、余弦角CA和光谱信息散度SID的值,计算表达式(ED×SID)/CA的值;步骤4),设定异常光谱阈值,表达式(ED×SID)/CA的值中位于异常光谱阈值之上的点即为异常光谱。
较佳地,步骤1)对实测光谱曲线进行预处理,包括三个步骤11)去除水汽影响波段,12)采用多项式平滑滤波,滤除原始光谱中高频噪声,13)包络线去除。
较佳地,步骤2)中局部度量和整体度量的计算方法为:经预处理的实测光谱曲线包括光谱曲线X和光谱曲线Y,各个光谱曲线X和光谱曲线Y均包含n个波段,即X=(x1,x2,x3,…xn),Y=(y1,y2,y3,…yn),
欧氏距离 ED ( X , Y ) = Σ i = 1 n ( x i - y i ) 2 ,
余弦角 CA ( X , Y ) = Σ i = 1 n x i y i Σ i = 1 n x i 2 Σ i = 1 n y i 2 ,
光谱信息散度 SID ( X , Y ) = Σ i = 1 n ( x i Σ i = 1 n x i - y i Σ i = 1 n y i ) log ( x i Σ i = 1 n x i / y i Σ i = 1 n y i ) .
较佳地,步骤3)中表达式(ED×SID)/CA的值
[ ( ED × SID ) / CA ] = Σ i = 1 n x i y i · Σ i = 1 n ( x i - y i ) 2 Σ i = 1 n x i 2 Σ i = 1 n y i 2 · Σ i = 1 n ( x i Σ i = 1 n x i - y i Σ i = 1 n y i ) log ( x i Σ i = 1 n x i / y i Σ i = 1 n y i ) .
较佳地,步骤4)中异常光谱阈值为人工经验参数。
较佳地,步骤4)设定的异常光谱阈值作为纵坐标得到二维平面中的异常光谱阈值线,依据表达式(ED×SID)/CA的值和光谱编号建立二维平面散点图,二维平面散点图中位于异常光谱阈值线之上的光谱点即为异常光谱。
较佳地,依据表达式(ED×SID)/CA的值和光谱变化得出二维平面散点图是以光谱编号为横坐标、以表达式(ED×SID)/CA归一化到0-1之间的值为纵坐标,建立二维平面散点图。
较佳地,人工设定异常光谱阈值还包括对其进行验证的步骤,验证方法为:剔除异常光谱后剩余光谱建立预测模型,依据验证评价指标得到不同阈值下的预测精度,验证评价指标包括相关系数、均方差、平均相对误差。
本发明用局部度量欧氏距离ED、余弦角CA和整体度量光谱信息散度SID的值,进行归一化处理后计算表达式(ED×SID)/CA的值,人工确定阈值之后提出表达式(ED×SID)/CA位于阈值上方的光谱点,完成异常光谱的剔除。作为更进一步的改进还可以在二维平面上以阈值为纵坐标,确定一个阈值线,在以光谱编号和表达式(ED×SID)/CA的值建立的二维平面散点图上剔除阈值线之上的光谱点,完成异常光谱的剔除。由于距离、角度等局部度量难以区分整体波形结构差异,因此本发明加入光谱信息散度SID可定量表征光谱整体相似性。从光谱局部与整体性区分其与标准光谱集之间的差异,弥补了传统利用距离、角度度量不能区分光谱整体相似性的问题。
附图说明
图1为本发明实施例一的流程图,
图2为本发明实施例二的流程图,
图3为本发明实施例二建立的二维平面散点图,
图4为本发明实施例二在二维平面散点图中确定的阈值线。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例一,如图1所示,一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,包括如下步骤:
步骤1)预处理
获取实测光谱曲线,并进行预处理,包括三个步骤11)去除水汽影响波段,12)采用多项式平滑滤波,滤除原始光谱中高频噪声,13)包络线去除。包络线去除后将反射率归一化到0-1之间,光谱的吸收和反射特征反映在一致的光谱背景上,有效突出光谱曲线的吸收、反射和发射特征。光谱数据预处理目的是去除噪声干扰、增强波形特征,为定量度量光谱差异提供更加可靠依据。
步骤2)光谱相似性度量
计算经预处理的实测光谱曲线与标准光谱集平均光谱之间的局部度量和整体度量,并将计算结果归一化到0-1之间,局部度量包括欧氏距离ED和余弦角CA,整体度量包括光谱信息散度SID对实测光谱曲线,具体计算方法为:
经预处理的实测光谱曲线包括光谱曲线X和光谱曲线Y,各个光谱曲线X和光谱曲线Y均包含n个波段,即X=(x1,x2,x3,…xn),Y=(y1,y2,y3,…yn),
欧氏距离 ED ( X , Y ) = Σ i = 1 n ( x i - y i ) 2 ,
余弦角 CA ( X , Y ) = Σ i = 1 n x i y i Σ i = 1 n x i 2 Σ i = 1 n y i 2 ,
光谱信息散度 SID ( X , Y ) = Σ i = 1 n ( x i Σ i = 1 n x i - y i Σ i = 1 n y i ) log ( x i Σ i = 1 n x i / y i Σ i = 1 n y i ) .
步骤3)计算表达式(ED×SID)/CA的值
依据上述经归一化到0-1之间的欧氏距离ED、余弦角CA和光 谱信息散度SID的值,计算表达式(ED×SID)/CA的值,
[ ( ED × SID ) / CA ] = Σ i = 1 n x i y i · Σ i = 1 n ( x i - y i ) 2 Σ i = 1 n x i 2 Σ i = 1 n y i 2 · Σ i = 1 n ( x i Σ i = 1 n x i - y i Σ i = 1 n y i ) log ( x i Σ i = 1 n x i / y i Σ i = 1 n y i ) .
步骤4)确定阈值,异常光谱剔除
人工依据经验设定异常光谱阈值,对人工设定异常光谱阈值进行验证,剔除异常光谱后剩余光谱建立预测模型,以相关系数、均方差、平均相对误差等作为验证的评价指标,得到不同阈值下的预测精度。
人工依据经验设定异常光谱阈值后,可以直接确定表达式(ED×SID)/CA的值中位于异常光谱阈值之上的点即为异常光谱,然后剔除异常光谱。
实施例二,如图2所示,本实施例步骤1)-3)与实施例一相同,完成步骤1)-3)值之后,如图3所示以表达式(ED×SID)/CA归一化到0-1之间的值为纵坐标建立二维平面散点图,然后以步骤4)相同方法确定阈值,如图4所示确定阈值之后将其作为纵坐标得到二维平面中的异常光谱阈值线,再以光谱编号为横坐标,二维平面散点图中位于异常光谱阈值线之上的光谱点即为异常光谱,然后剔除异常光谱。
上述两种方法都可以完成本实施例考虑整体度量剔除实测光谱曲线中的异常光谱。
由于距离、角度等局部度量难以区分整体波形结构差异,而相对熵是被用来衡量一个随机变量在整体中出现的期望值,可利用相对熵计算由光谱特征提供的光谱信息,因此本发明加入光谱信息散度SID 可定量表征光谱整体相似性。从光谱局部与整体性区分其与标准光谱集之间的差异,弥补了传统利用距离、角度度量不能区分光谱整体相似性的问题。

Claims (8)

1.一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,其特征在于,包括如下步骤:
步骤1),对实测光谱曲线进行预处理;
步骤2),计算经预处理的实测光谱曲线与标准光谱集平均光谱之间的局部度量和整体度量,并将计算结果归一化到0-1之间,所述局部度量包括欧氏距离ED和余弦角CA,所述整体度量包括光谱信息散度SID;
步骤3),依据上述经归一化到0-1之间的欧氏距离ED、余弦角CA和光谱信息散度SID的值,计算表达式(ED×SID)/CA的值;
步骤4),设定异常光谱阈值,表达式(ED×SID)/CA的值中位于所述异常光谱阈值之上的点即为异常光谱。
2.根据权利要求1所述的一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,其特征在于:所述步骤1)对实测光谱曲线进行预处理,包括三个步骤11)去除水气影响波段,12)采用多项式平滑滤波,滤除原始光谱中高频噪声,13)包络线去除。
3.根据权利要求1所述的一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,其特征在于:所述步骤2)中所述局部度量和所述整体度量的计算方法为:经预处理的所述实测光谱曲线包括光谱曲线X和光谱曲线Y,各个所述光谱曲线X和所述光谱曲线Y均包含n个波段,即X=(x1,x2,x3,…xn),Y=(y1,y2,y3,…yn),
所述欧氏距离 ED ( X , Y ) = Σ i = 1 n ( x i - y i ) 2 ,
所述余弦角 CA ( X , Y ) = Σ i = 1 n x i y i Σ i = 1 n x i 2 Σ i = 1 n y i 2 ,
所述光谱信息散度 SID ( X , Y ) = Σ i = 1 n ( x i Σ i = 1 n x i - y i Σ i = 1 n y i ) log ( x i Σ i = 1 n x i / y i Σ i = 1 n y i ) .
4.根据权利要求1所述的一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,其特征在于:所述步骤3)中表达式(ED×SID)/CA的值
[ ( ED × SID ) / CA ] = Σ i = 1 n x i y i · Σ i = 1 n ( x i - y i ) 2 Σ i = 1 n x i 2 Σ i = 1 n y i 2 · Σ i = 1 n ( x i Σ i = 1 n x i - y i Σ i = 1 n y i ) log ( x i Σ i = 1 n x i / y i Σ i = 1 n y i ) .
5.根据权利要求1所述的一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,其特征在于:所述步骤4)中所述异常光谱阈值为人工经验参数。
6.根据权利要求1所述的一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,其特征在于:所述步骤4)设定的异常光谱阈值作为纵坐标得到二维平面中的异常光谱阈值线,依据表达式(ED×SID)/CA的值和光谱编号建立二维平面散点图,所述二维平面散点图中位于所述异常光谱阈值线之上的光谱点即为异常光谱。
7.根据权利要求6所述的一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,其特征在于:所述依据表达式(ED×SID)/CA的值和光谱变化得出二维平面散点图是以光谱编号为横坐标、以表达式(ED×SID)/CA归一化到0-1之间的值为纵坐标,建立二维平面散点图。
8.根据权利要求5至7任一项所述的一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法,其特征在于:人工设定异常光谱阈值还包括对其进行验证的步骤,验证方法为:剔除异常光谱后剩余光谱建立预测模型,依据验证评价指标得到不同阈值下的预测精度,所述验证评价指标包括相关系数、均方差、平均相对误差。
CN201410264087.3A 2014-06-13 2014-06-13 一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法 Expired - Fee Related CN104062008B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410264087.3A CN104062008B (zh) 2014-06-13 2014-06-13 一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410264087.3A CN104062008B (zh) 2014-06-13 2014-06-13 一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法

Publications (2)

Publication Number Publication Date
CN104062008A true CN104062008A (zh) 2014-09-24
CN104062008B CN104062008B (zh) 2016-04-13

Family

ID=51549829

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410264087.3A Expired - Fee Related CN104062008B (zh) 2014-06-13 2014-06-13 一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法

Country Status (1)

Country Link
CN (1) CN104062008B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106500840A (zh) * 2016-10-20 2017-03-15 无锡创想分析仪器有限公司 一种全谱式直读光谱仪的异常光谱剔除方法
CN107958395A (zh) * 2017-12-13 2018-04-24 美林数据技术股份有限公司 一种电力系统异常用户的识别方法
CN109459409A (zh) * 2017-09-06 2019-03-12 盐城工学院 一种基于knn的近红外异常光谱识别方法
CN110175114A (zh) * 2019-04-19 2019-08-27 深圳壹账通智能科技有限公司 测试终端、app与摄像头兼容性测试方法及存储介质
CN110579466A (zh) * 2018-06-11 2019-12-17 中国农业机械化科学研究院 一种激光诱导击穿光谱筛选方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001201399A (ja) * 2000-01-21 2001-07-27 Yokogawa Electric Corp 分光分析器の動作異常判定方法および動作異常判定機能付き分光分析器
CN103018177A (zh) * 2012-12-06 2013-04-03 江苏易谱恒科技有限公司 基于随机采样一致集的谱图异常样本点检测方法
CN103456011A (zh) * 2013-09-02 2013-12-18 杭州电子科技大学 一种利用互补信息的改进型高光谱rx异常检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001201399A (ja) * 2000-01-21 2001-07-27 Yokogawa Electric Corp 分光分析器の動作異常判定方法および動作異常判定機能付き分光分析器
CN103018177A (zh) * 2012-12-06 2013-04-03 江苏易谱恒科技有限公司 基于随机采样一致集的谱图异常样本点检测方法
CN103456011A (zh) * 2013-09-02 2013-12-18 杭州电子科技大学 一种利用互补信息的改进型高光谱rx异常检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘杰 等: "恒星光谱参数自动测量中不同模板匹配度量方法比较", 《光谱学与光谱分析》 *
张其可 等: "用于近红外校正模型的训练样本选择", 《传感技术学报》 *
杜培军 等: "利用流形学习进行高光谱遥感影像的降维与特征提取", 《武汉大学学报·信息科学版》 *
杜培军 等: "基于光谱特征的高光谱遥感影像检索", 《光谱学与光谱分析》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106500840A (zh) * 2016-10-20 2017-03-15 无锡创想分析仪器有限公司 一种全谱式直读光谱仪的异常光谱剔除方法
CN106500840B (zh) * 2016-10-20 2018-08-14 无锡创想分析仪器有限公司 一种全谱式直读光谱仪的异常光谱剔除方法
CN109459409A (zh) * 2017-09-06 2019-03-12 盐城工学院 一种基于knn的近红外异常光谱识别方法
CN107958395A (zh) * 2017-12-13 2018-04-24 美林数据技术股份有限公司 一种电力系统异常用户的识别方法
CN107958395B (zh) * 2017-12-13 2021-11-26 美林数据技术股份有限公司 一种电力系统异常用户的识别方法
CN110579466A (zh) * 2018-06-11 2019-12-17 中国农业机械化科学研究院 一种激光诱导击穿光谱筛选方法
CN110579466B (zh) * 2018-06-11 2020-12-18 中国农业机械化科学研究院 一种激光诱导击穿光谱筛选方法
CN110175114A (zh) * 2019-04-19 2019-08-27 深圳壹账通智能科技有限公司 测试终端、app与摄像头兼容性测试方法及存储介质

Also Published As

Publication number Publication date
CN104062008B (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
CN104062008A (zh) 一种考虑整体度量的实测光谱曲线中异常光谱的剔除方法
CN104063710B (zh) 基于支持向量机模型的实测光谱曲线中异常光谱剔除方法
CN109190272B (zh) 基于弹性波和机器学习的混凝土结构缺陷检测方法
CN104268883A (zh) 一种基于边缘检测的时频谱曲线提取方法
KR20160130209A (ko) 칼만 필터를 기반으로 하는 용량 예측 방법, 시스템 및 컴퓨터 장치
CN103776480A (zh) 基于多次移动平均的微小故障检测方法和装置
CN103983584A (zh) 一种内陆二类水体叶绿素a浓度的反演方法及装置
JP2015528569A5 (zh)
CN102689230A (zh) 基于条件随机场模型的刀具磨损状态监测方法
CN103033481A (zh) 基于fft的激光分析仪二次谐波滤波方法
CN106560697A (zh) 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法
CN104655583A (zh) 一种基于傅里叶红外光谱的煤质快速识别方法
CN103698687A (zh) 集成电路中硬件木马检测的信号处理方法及其系统
CN103956756A (zh) 一种电力系统低频振荡模态辨识方法
CN105091732A (zh) 一种变压器绕组变形的检测方法及系统
CN102507676A (zh) 基于多重自组织神经网络的电子鼻在线漂移补偿方法
CN102072767A (zh) 基于波长相似性共识回归红外光谱定量分析方法和装置
CN108955901A (zh) 一种红外测温方法、系统及终端设备
CN113128797A (zh) 业务指标异常监测方法及装置
CN115728259A (zh) 一种多组分气体分析方法
CN106841070B (zh) 一种白酒真伪鉴定方法及装置
CN114780358A (zh) 异常操作行为的检测方法和检测装置
CN111639763B (zh) 一种液压油污染度的检测模型训练方法、检测方法及装置
CN103853817B (zh) 基于gis的海量统计数据的空间奇异点发掘方法
CN116309788A (zh) 一种3d点云铁路接触线横截面积检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160413