CN106770007B - 一种支持向量机模型的近红外光谱特征波长选择方法 - Google Patents
一种支持向量机模型的近红外光谱特征波长选择方法 Download PDFInfo
- Publication number
- CN106770007B CN106770007B CN201611073856.7A CN201611073856A CN106770007B CN 106770007 B CN106770007 B CN 106770007B CN 201611073856 A CN201611073856 A CN 201611073856A CN 106770007 B CN106770007 B CN 106770007B
- Authority
- CN
- China
- Prior art keywords
- wavelength
- sample
- selection
- wavelength points
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 16
- 238000010187 selection method Methods 0.000 title abstract description 5
- 238000000034 method Methods 0.000 claims abstract description 34
- 230000003595 spectral effect Effects 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 4
- 230000000704 physical effect Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
一种支持向量机模型的近红外光谱特征波长选择方法,波长选择过程以光谱信息原始样本映射到核函数空间的分布情况为指导,核心是通过波长选择使原始样本映射到核函数空间后具有较大的支持向量边界,较小的分布半径R及较大的样本空间距离,从而使原始样本经过核空间映射后具有较高的可识别度。该方法原理简单,易于实现,容易得到区分度较高的模型。此外,该方法波长选择基于结构风险最小化原则进行,并且选择过程只依据训练样本集进行,能够保证波长选择后模型的泛化能力。
Description
技术领域
本发明涉及一种针对最小二乘支持向量机模型的近红外光谱特征波长选择方法,属于光谱分析技术领域。
背景技术
近红外光谱分析具有快速、成本低、无损等特点,已成为物性分析领域的重要工具。近红外光谱样本往往包含几百甚至上千个波长点,这些波长点包含很多冗余或噪声信息。若采用全谱建模,会增加建模的复杂性,且由于冗余或噪声信息的引入,易降低模型精度。为此,对近红外光谱的建模波长点进行优化,从中选择具有代表性的特征波长点是提高光谱模型鲁棒性和精度的重要手段。
最小二乘支持向量机(Least Squares SupportVector Machine,LSSVM)具有较强的非线性映射能力,其以结构风险最小化为目标构建模型,具有较好的泛化能力,同时,LSSVM的参数通过求解线性方程组获得,容易获得全局最优参数,所以,LSSVM在光谱建模领域得到了广泛的应用。目前,针对LSSVM的光谱波长选择方法主要可分为三类:一类是根据波长之间的相关性选择相关性最低的波长点组合进行建模,核心是消除波长点的冗余(如连续投影映射),该方法只考虑波长之间的特征无关性,容易引入噪声波长;第二类是考虑光谱波长与被测信息的相关度,选择相关度较大的波长进行建模(如相关系数法),该方法只考虑特征波长与被测信息的相关度,容易引入较多的冗余波长;另一类通过智能搜索算法(如遗传算法,粒子群算法等)选择波长,这些方法的搜索过程易受初始参数的影响,搜索过程易陷入局部极值,较难获得全局最优的波长组合。
发明内容
本发明的目的是提供一种针对最小二乘支持向量机模型的光谱特征波长选择方法,对光谱模型进行简化,提高模型的精度及泛化能力。
为解决上述问题,本发明采用的技术方案为一种针对最小二乘支持向量机模型的光谱特征波长选择方法,该方法包括以下步骤:
S1:对近红外光谱样本信息进行预处理,去除噪声因素的影响;
S2:对近红外光谱样本信息中所有的波长点进行顺序编号,令S={被选择波长点集合},wi(i=1,…,NS)为编号为i的波长点对应的权重系数,NS为集合S中元素数;
S3:确定辅助参数C及标准差σ,被选择波长点集合S的初始值S1设为包含所有波长点,同时将所有波长点的权重系数wi(i=1,…,NS)初始值置为1;
S4:令性能指标J1=0,S1=S,S2=Φ,Φ为空集合;
S5:随机从集合S1中选择一个波长点并记为i同时添加到集合S2中,同时将波长点i从集合S1中移除,利用S2中波长点集合建立LSSVM模型,获得建模参数α及核函数矩阵K,其中,α通过求解方程组(1)获得,K通过(2)计算;x,y分别为近红外光谱的样本信息及相应的物性信息,n为样本个数。
S6:计算J2=‖ω‖2R/D,其中,R为原始样本映射到核空间后超球体的半径;D为核函数空间样本的平均距离;指标J2综合考虑了支持向量边界及原始样本映射到核函数空间的分布半径及样本映射到核函数空间后的空间距离,若原始样本经过映射后具有支持向量边界M(较大的支持向量边界M或较小的‖ω‖)、分布半径R(R值较小)、样本间距D(D值较大),则原始样本经过核空间映射后具有相应的可识别度。‖ω‖2、R、D分别采用下式计算:
(a)‖ω‖2=αTKα,其中,α为对应的拉格朗日乘子矩阵,K为核函数矩阵,αT为拉格朗日乘子的转置矩阵;
(b);R=max{dij},i,j=1,…,n,n取正整数;
(c);D=1/n2∑dij,其中,dij=2(1-K(xi,xj));
S7:若J2>J1,则将S5中增加的波长点i对应的权重系数wi减小δ,否则,若J2<J1,则将S5中增加的波长点i对应的权重系数wi增加2δ;
S8:令J1=J2;
S9:若S1非空,转到S5添加下一个波长点,否则转S10;
S10:从集合S中删除wi(i=1,…,NS)小于或等于0的波长点;
S11:若集合S中包含的波长点数量小于或等于预设的建模所需最小波长点数量Nmin,则结束波长选择过程,否则判断波长权重系数w是否达到稳定状态,若达到稳定状态,则结束波长选择过程,否则,转到S4对集合S中的波长进一步筛选。
与现有技术相比较,本发明方法具有如下有益效果。
(1)上述波长选择过程以优化样本映射到核函数空间的分布为核心,通过波长筛选增强了样本映射到核空间后的差异性和可辨识性,容易得到区分度较高的模型,从而提高最小二乘支持向量机建模精度。
(2)上述波长点选择过程依据模型结构风险最小化思想进行,并且选择过程只依赖于训练集样本,能够保证波长选择后模型的泛化能力。
附图说明
图1为波长选择的具体过程图。
图2为按本发明方法选择的波长点。
图3为本发明选择波长后LSSVM预测结果。
图4为本方法实施流程图。
具体实施方式
以下以柴油十六烷值近红外光谱波长选择为例进行细述。
步骤1:对柴油十六烷值近红外光谱样本信息进行求导、归一化等预处理,弱化噪声因素影响;
步骤2:对所有波长点进行顺序编号,令S={被选择波长点集合},wi为编号为i的波长点对应的权重系数,NS为集合S中元素数;
步骤3:确定参数C=1000,δ=0.1及σ=20,S={全部波长点},wi=1(i=1,…,NS),由于柴油十六烷值近红外光谱中包含401个波长点,所以NS初始值为401,令Nmin=30,NLmax=50;
步骤4:令性能指标J1=0,S1=S,S2=Φ(Φ为空集合);
步骤5:随机从集合S1中选择一个波长点(记为i)添加到集合S2中,同时将波长点i从集合S1中移除;
步骤6:利用S2中波长点集合建立LSSVM模型,获得建模参数α及核函数矩阵K,
步骤7:计算J2=‖ω‖2R/D;
步骤8:若J2>J1,则将步骤5中增加的波长点i对应的权重系数修正为wi=max{0,wi-δ},否则,若J2<J1,则将步骤5中增加的波长点对应的权重系数修正为wi=min{1,wi+2δ};
步骤9:令J1=J2;
步骤10:若S1≠Φ,转步骤5;
步骤11:从集合S中删除wi小于等于0的波长点;
步骤12:Nt=集合S中元素数量,若Nt≤Nmin,转步骤16;
步骤13:若Nt≤NS,,令NS=Nt,NL=0,转步骤15,否则,NL=NL+1;
步骤14:若NL<NLmax,转步骤15,否则转步骤16;
步骤15:转步骤4重新对S中剩余波长进行筛选;
步骤16:波长选择过程结束。
上述波长选择的具体过程如图1所示,按上述方法选择的波长点如图2所示,依据上述方法选择波长后LSSVM预测结果如图3所示。
Claims (1)
1.一种支持向量机模型的光谱特征波长选择方法,其特征在于:该方法包括以下步骤:
S1:对近红外光谱样本信息进行预处理,去除噪声因素的影响;
S2:对近红外光谱样本信息中所有的波长点进行顺序编号,令S={被选择波长点集合},wi(i=1,…,NS)为编号为i的波长点对应的权重系数,NS为集合S中元素数;
S3:确定辅助参数C及标准差σ,被选择波长点集合S的初始值S1设为包含所有波长点,同时将所有波长点的权重系数wi初始值置为1,i=1,…,NS;
S4:令性能指标J1=0,S1=S,S2=Φ,Φ为空集合;
S5:随机从集合S1中选择一个波长点并记为i同时添加到集合S2中,同时将波长点i从集合S1中移除,利用S2中波长点集合建立LSSVM模型,获得建模参数α及核函数矩阵K,其中,α通过求解方程组(1)获得,K通过(2)计算;x,y分别为近红外光谱的样本信息及相应的物性信息,n为样本个数;
S6:计算J2=‖ω‖2R/D,其中,R为原始样本映射到核空间后超球体的半径;D为核函数空间样本的平均距离;指标J2综合考虑了支持向量边界及原始样本映射到核函数空间的分布半径及样本映射到核函数空间后的空间距离,若原始样本经过映射后具有支持向量边界M、分布半径R、样本间距D,则原始样本经过核空间映射后具有相应的可识别度;‖ω‖2、R、D分别采用下式计算:
(a)‖ω‖2=αTKα,其中,α为对应的拉格朗日乘子矩阵,K为核函数矩阵,αT为拉格朗日乘子的转置矩阵;
(b)R=max{dij},i,j=1,…,n,n取正整数;
(c)D=1/n2∑dij,其中,dij=2(1-K(xi,xj));
S7:若J2>J1,则将S5中增加的波长点i对应的权重系数wi减小δ,否则,若J2<J1,则将S5中增加的波长点i对应的权重系数wi增加2δ;
S8:令J1=J2;
S9:若S1非空,转到S5添加下一个波长点,否则转S10;
S10:从集合S中删除wi小于或等于0的波长点;
S11:若集合S中包含的波长点数量小于或等于预设的建模所需最小波长点数量Nmin,则结束波长选择过程,否则判断波长权重系数w是否达到稳定状态,若达到稳定状态,则结束波长选择过程,否则,转到S4对集合S中的波长进一步筛选。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611073856.7A CN106770007B (zh) | 2016-11-29 | 2016-11-29 | 一种支持向量机模型的近红外光谱特征波长选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611073856.7A CN106770007B (zh) | 2016-11-29 | 2016-11-29 | 一种支持向量机模型的近红外光谱特征波长选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106770007A CN106770007A (zh) | 2017-05-31 |
CN106770007B true CN106770007B (zh) | 2019-06-21 |
Family
ID=58898438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611073856.7A Expired - Fee Related CN106770007B (zh) | 2016-11-29 | 2016-11-29 | 一种支持向量机模型的近红外光谱特征波长选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106770007B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108681697B (zh) * | 2018-04-28 | 2021-03-23 | 北京农业质量标准与检测技术研究中心 | 特征选择方法及装置 |
CN112444500B (zh) * | 2020-11-11 | 2022-06-24 | 东北大学秦皇岛分校 | 一种基于光谱的阿尔茨海默症智能检测装置 |
CN113222959B (zh) * | 2021-05-26 | 2022-04-15 | 马翔 | 一种基于高光谱图像卷积神经网络的鲜枣虫眼检测方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120302892A1 (en) * | 2005-07-25 | 2012-11-29 | Niyom Lue | Portable optical fiber probe-based spectroscopic scanner for rapid cancer diagnosis |
WO2008049175A1 (en) * | 2006-10-24 | 2008-05-02 | Katholieke Universiteit Leuven | High discriminating power biomarker diagnosing |
CN102305772A (zh) * | 2011-07-29 | 2012-01-04 | 江苏大学 | 基于遗传核偏最小二乘法的近红外光谱特征波长筛选方法 |
CN102799895B (zh) * | 2012-06-26 | 2015-09-30 | 鸿博股份有限公司 | 基于最小二乘支持向量机的胶印油墨配色方法 |
CN103293118A (zh) * | 2013-05-11 | 2013-09-11 | 江南大学 | 一种基于近红外光谱分析技术的潲水油鉴别方法 |
CN104819955B (zh) * | 2015-05-15 | 2017-06-16 | 华润三九医药股份有限公司 | 基于粒子群最小二乘支持向量机算法检测川芎方法及应用 |
CN106127330A (zh) * | 2016-06-18 | 2016-11-16 | 上海大学 | 基于最小二乘支持向量机的脉动风速预测方法 |
CN105962950A (zh) * | 2016-07-07 | 2016-09-28 | 哈尔滨工业大学 | 基于最小二乘支持向量机的近红外脑功能信号提取方法 |
CN105938099A (zh) * | 2016-07-07 | 2016-09-14 | 四川大学 | 一种基于激光诱导击穿光谱的岩性判别方法及系统 |
-
2016
- 2016-11-29 CN CN201611073856.7A patent/CN106770007B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN106770007A (zh) | 2017-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108596108B (zh) | 基于三元组语义关系学习的航拍遥感图像变化检测方法 | |
CN108647738B (zh) | 基于多指数的全球尺度遥感影像水体智能提取方法 | |
CN108090456A (zh) | 一种车道线识别方法及装置 | |
CN106997380A (zh) | 基于dcgan深度网络的成像光谱图像安全检索方法 | |
Wang et al. | Fast subpixel mapping algorithms for subpixel resolution change detection | |
CN111680176A (zh) | 基于注意力与双向特征融合的遥感图像检索方法及系统 | |
CN110322453A (zh) | 基于位置注意力和辅助网络的3d点云语义分割方法 | |
CN106770007B (zh) | 一种支持向量机模型的近红外光谱特征波长选择方法 | |
CN111291779B (zh) | 一种车辆信息识别方法、系统、存储器及处理器 | |
CN111680579B (zh) | 一种自适应权重多视角度量学习的遥感图像分类方法 | |
CN105654122B (zh) | 基于核函数匹配的空间金字塔物体识别方法 | |
CN104732534B (zh) | 一种图像中显著目标的抠取方法及系统 | |
CN111860359B (zh) | 一种基于改进随机森林算法的点云分类方法 | |
CN107563296B (zh) | 基岩海岸岸线的提取方法及系统 | |
CN116012722A (zh) | 一种遥感影像场景分类方法 | |
CN116883873A (zh) | 一种面向空地应用的红外小目标检测方法 | |
CN115457258A (zh) | 一种基于图像增强算法与改进YOLOv5的雾天船舶检测方法 | |
Al-Ghrairi et al. | Classification of satellite images based on color features using remote sensing | |
Wang et al. | Edge enhanced channel attention-based graph convolution network for scene classification of complex landscapes | |
CN110987751B (zh) | 一种致密储层三维空间孔喉定量分级评价方法 | |
CN107644230A (zh) | 一种遥感图像对象的空间关系建模方法 | |
CN116797786A (zh) | 基于极值偏移深度学习的机载激光雷达单木分割方法 | |
Zhang et al. | Point clouds classification of large scenes based on blueprint separation convolutional neural network | |
CN114463175B (zh) | 基于深度卷积神经网络的火星图像超分辨方法 | |
Sahithi et al. | Comparison of support vector machine, artificial neural networks and spectral angle mapper classifiers on fused hyperspectral data for improved LULC classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190621 Termination date: 20201129 |