CN109270022B - 一种近红外光谱模型的波段选择方法及模型构建方法 - Google Patents
一种近红外光谱模型的波段选择方法及模型构建方法 Download PDFInfo
- Publication number
- CN109270022B CN109270022B CN201811073952.0A CN201811073952A CN109270022B CN 109270022 B CN109270022 B CN 109270022B CN 201811073952 A CN201811073952 A CN 201811073952A CN 109270022 B CN109270022 B CN 109270022B
- Authority
- CN
- China
- Prior art keywords
- infrared spectrum
- mean
- sample
- value
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010187 selection method Methods 0.000 title claims abstract description 63
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 50
- 238000010276 construction Methods 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000001228 spectrum Methods 0.000 claims abstract description 17
- 238000002835 absorbance Methods 0.000 claims abstract description 15
- 238000012937 correction Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 9
- 230000031700 light absorption Effects 0.000 claims abstract description 8
- 230000008859 change Effects 0.000 claims abstract description 7
- 238000012795 verification Methods 0.000 claims description 9
- 238000010200 validation analysis Methods 0.000 claims description 3
- 240000008042 Zea mays Species 0.000 description 23
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 23
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 22
- 235000005822 corn Nutrition 0.000 description 22
- 239000000126 substance Substances 0.000 description 13
- 102000004169 proteins and genes Human genes 0.000 description 9
- 108090000623 proteins and genes Proteins 0.000 description 9
- 229920002472 Starch Polymers 0.000 description 7
- 235000019698 starch Nutrition 0.000 description 7
- 239000008107 starch Substances 0.000 description 7
- TVMXDCGIABBOFY-UHFFFAOYSA-N octane Chemical compound CCCCCCCC TVMXDCGIABBOFY-UHFFFAOYSA-N 0.000 description 5
- 238000004445 quantitative analysis Methods 0.000 description 5
- 238000000342 Monte Carlo simulation Methods 0.000 description 4
- 239000003921 oil Substances 0.000 description 4
- 235000019198 oils Nutrition 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 239000002285 corn oil Substances 0.000 description 3
- 235000005687 corn oil Nutrition 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 239000004519 grease Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 229920002261 Corn starch Polymers 0.000 description 1
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012569 chemometric method Methods 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 235000018102 proteins Nutrition 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种近红外光谱模型的波段选择方法及模型构建方法。其中,近红外光谱模型的波段选择方法,基于吸光度浓度变化率来对校正样品集中所有样品进行波段选择;其过程为:预先设定校正样品集中共有n个样品,每个样品光谱中共有N个变量,对于校正样品集所有样品来说,每个变量则有n个吸光值和n个浓度值;其中,N和n均为大于1的正整数;依次计算每个变量下相邻样品的吸光值差值和浓度差值的比值V,最终在每个变量下得到(n‑1)个比值V,再计算所有比值V的平均值Vmean;对于校正样品集中样品光谱的N个变量,得到N个Vmean值,将N个变量按照其Vmean值进行排序;按照Vmean值由大变小的顺序依次选择出相应变量,进而选择出近红外光谱模型的波段。
Description
技术领域
本发明属于近红外光谱建模领域,尤其涉及一种近红外光谱模型的波段选择方法及模型构建方法。
背景技术
近红外光谱(Near Infrared,NIR)是介于可见光(Vis)和中红外(MIR)之间的电磁辐射波,美国材料检测协会(ASTM)将近红外光谱区定义为780-2526nm的区域,是人们在吸收光谱中发现的第一个非可见光区,在制药、医学诊断、食品和农产品的质量控制,天文学以及治疗医学等领域都有应用。
近红外光谱定量分析是一种二级分析方法,其分析过程为:
使用近红外光谱仪器测定样品近红外光谱;采用标准参考方法测定样品中特定成分的浓度或性质参考值;然后将测定的光谱数据和浓度或性质参考值进行预处理,选择合适的化学计量学方法,选择合适的波段,将样品光谱信息和一级参考值进行关联,优化并建立校正模型。
利用校正模型对未知含量或性质参考值的样品基于近红外光谱数据进行预测,以测定未知待测样品的浓度或性质参考值。根据预测结果评价模型的预测能力和有效性。
根据光谱与待测属性值之间的关系,建立模型所使用过的波段选择方法不断更新。常用的波段选择方法包括前向间隔偏最小二乘法(forward interval partial leastsquares,FiPLS)、反向间隔偏最小二乘法(backward interval partial least squares,BiPLS),相关系数法(correlation coefficient,CC)和无信息变量消除算法(uninformative variable elimination,UVE)等。
但是常用的波段选择方法存在以下缺陷:
(1)不能够充分反应物质的化学信息;
(2)不一定同时适用于多种物质多种参数的NIR定量分析;
(3)建模变量的个数较多,模型复杂,而且计算量大,不利于现场快速及过程在线检测。
发明内容
为了解决现有技术的不足,本发明的第一目的是提供一种近红外光谱模型的波段选择方法,其更能够反应物质的化学信息且能够广泛的用于多种物质多种参数的近红外光谱模型定量分析,有效减少用于近红外光谱模型的变量,减轻计算量,同时与部分常规波段选择方法比较,提高了近红外光谱模型的预测能力。
本发明的一种近红外光谱模型的波段选择方法,基于吸光度浓度变化率来对校正样品集中所有样品进行波段选择;其具体过程为:
预先设定校正样品集中共有n个样品,每个样品光谱中共有N个变量,对于校正样品集所有样品来说,每个变量则有n个吸光值和n个浓度值;其中,N和n均为大于1的正整数;
依次计算每个变量下相邻样品的吸光值差值和浓度差值的比值V,最终在每个变量下得到(n-1)个比值V,再计算所有比值V的平均值Vmean;
对于校正样品集中样品光谱的N个变量来说,得到N个Vmean值,将N个变量按照其Vmean值进行排序;
按照Vmean值由大变小的顺序依次选择出相应变量,进而选择出近红外光谱模型的波段。
其中,Vmean值越大,则代表吸光值因浓度变化所产生的响应越大。
本发明的第二目的是提供一种近红外光谱模型构建方法。
本发明的一种近红外光谱模型构建方法,包括:
采用上述所述的近红外光谱模型的波段选择方法选择出近红外光谱模型的波段;
从Vmean值最大的变量开始建模,随后按照Vmean值由大变小的顺序,采取依次增加一个变量的方法,开始建立近红外光谱模型。
进一步的,该方法还包括:利用验证样品集中的所有样品来验证近红外光谱模型预测值的准确性。
进一步的,验证样品集和校正样品集中样品均为同一种类的样品。
与现有技术相比,本发明的有益效果是:
(1)本发明同常规波段选择方法比较,提高了近红外光谱模型的预测能力。
(2)本发明丰富了近红外光谱模型的波段选择方法,给近红外光谱模型使用者提供一种可供选择的新方法,同时由于是根据物质的近红外光谱吸光度和浓度的关系建立的波段选择方法,某种程度上,该方法更能够反应物质的化学信息。
(3)本发明能够广泛的用于多种物质多种参数的近红外光谱定量分析,使得该波段选择方法具有广泛的推广性。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本发明计算得原料人血浆样品不同波数点下的Vmean;
图2为本发明波段选择法建立原料人血浆样品近红外光谱模型结果;
图3为本发明不同波段选择方法针对人血浆样品的近红外光谱模型建模结果;
图4(a)为本发明玉米样品的水分属性在不同波数点下的波段选择方法的Vmean;
图4(b)为本发明玉米样品的油脂属性在不同波数点下的波段选择方法的Vmean;
图4(c)为本发明玉米样品的蛋白质属性在不同波数点下的波段选择方法的Vmean;
图4(d)为本发明玉米样品的淀粉属性在不同波数点下的波段选择方法的Vmean;
图5(a)为本发明玉米样品水分属性在不同波数点下的波段选择方法建模预测结果;
图5(b)为本发明玉米样品油脂属性在不同波数点下的波段选择方法建模预测结果;
图5(c)为本发明玉米样品蛋白质属性在不同波数点下的波段选择方法建模预测结果;
图5(d)为本发明玉米样品淀粉属性在不同波数点下的波段选择方法建模预测结果;
图6(a)为本发明玉米样品水分属性在不同波段选择方法的建模预测结果;
图6(b)为本发明玉米样品油脂属性在不同波段选择方法的建模预测结果;
图6(c)为本发明玉米样品蛋白质属性在不同波段选择方法的建模预测结果;
图6(d)为本发明玉米样品淀粉属性在不同波段选择方法的建模预测结果;
图7为本发明汽油样品在不同波数点下的波段选择方法的Vmean;
图8为本发明汽油样品在不同波数点下的波段选择方法建模预测结果;
图9为本发明汽油样品在不同波段选择方法的建模预测结果;
图10为本发明的一种近红外光谱模型的波段选择方法流程图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
正如背景技术所介绍的,现有技术中存在(1)不能够充分反应物质的化学信息;(2)不适用同时于多种物质多种参数的近红外光谱模型定量分析;(3)建模变量的个数较多,模型复杂,而且计算量大,不利于现场快速及过程在线检测的不足,为了解决如上的技术问题,本申请提出了一种近红外光谱模型的波段选择方法。
本发明的一种近红外光谱模型的波段选择方法,是基于“吸光度浓度变化率”而进行的波段选择,因此本申请的该方法也定义为:ratio of absorbance to concentration,RATC。
NIR,Near Infrared,近红外光谱。
如图10所示,本发明的一种近红外光谱模型的波段选择方法,基于吸光度浓度变化率来对校正样品集中所有样品进行波段选择;其具体过程为:
步骤1:预先设定校正样品集中共有n个样品,每个样品光谱中共有N个变量,对于校正样品集所有样品来说,每个变量则有n个吸光值和n个浓度值;其中,N和n均为大于1的正整数;
步骤2:依次计算每个变量下相邻样品的吸光值差值和浓度差值的比值V,最终在每个变量下得到(n-1)个比值V,再计算所有比值V的平均值Vmean;
其中,Vi=|(Ai-Ai+1)|/(Ci-Ci+1); (1)
Vmean=(V1+V2+V3+V4+......Vn-1)/(n-1) (2)
其中,Ai表示第i个样品的吸光值,Ai+1表示第i+1样品的吸光值,Ci表示第i个样品的浓度值,Ci+1表示第i+1个样品的浓度值。
V1表示第1个样品与其相邻的第2个样品的吸光值差值和浓度差值的比值;
V2表示第2个样品与其相邻的第3个样品的吸光值差值和浓度差值的比值;
V3表示第3个样品与其相邻的第4个样品的吸光值差值和浓度差值的比值;
V4表示第4个样品与其相邻的第5个样品的吸光值差值和浓度差值的比值;
Vn-1表示第n-1个样品与其相邻的第n个样品的吸光值差值和浓度差值的比值。
步骤3:对于校正样品集中样品光谱的N个变量来说,得到N个Vmean值,将N个变量按照其Vmean值进行排序;
步骤4:按照Vmean值由大变小的顺序依次选择出相应变量,进而选择出近红外光谱模型的波段。
其中,Vmean值越大,则代表吸光值因浓度变化所产生的响应越大。
本发明还提供了一种近红外光谱模型构建方法。
本发明的一种近红外光谱模型构建方法,包括:
采用如图10所示的近红外光谱模型的波段选择方法选择出近红外光谱模型的波段;
从Vmean值最大的变量开始建模,随后按照Vmean值由大变小的顺序,采取依次增加一个变量的方法,开始建立近红外光谱模型。
另外,该方法还包括:利用验证样品集中的所有样品来验证近红外光谱模型预测值的准确性。
其中,验证样品集和校正样品集中样品均为同一种类的样品。
例如:校正样品集有20个样品,其浓度值分别为C1,C2,…,C20。近红外光谱模型构建方法如下表所示:
下面提供一个实施例,该实施例的数据包括玉米光谱和汽油光谱。本实施例对数据中玉米的水分,蛋白质,油脂和淀粉以及汽油的辛烷值进行NIR建模,通过将发明提出的波段选择方法与传统波段选择方法进行对比,判断本发明的优良性和实用性。
1.近红外建模样品集划分
方法的验证样品包括三种:原料人血浆样品20份,NIR建模属性为总蛋白含量;玉米样品80份,NIR建模属性为水分,蛋白质,油脂和淀粉;汽油样品60份,NIR建模属性为辛烷值。对三种样品进行校正集和验证集的划分结果如表1,全部满足验证集的参数值范围在校正集之内,同时对于不同样品的不同属性的校正集和验证集来说,其平均值和标准偏差值也比较接近,满足NIR建模校正集和验证集的划分要求。
表1不同样品不同属性的校正集验证集数据统计结果
2.原料人血浆样品NIR建模结果
2.1本发明的波段选择方法
如图1所示,利用Vmean值对原料人血浆样品进行波段选择,所有NIR模型结果见图2,最小的RMSEP(Root-Mean-Square Error of Prediction,预测均方根误差)值为0.495,且此时所涉及的变量如表2所示,大部分都分布在6200-6400cm-1,分析此处的特征吸收峰信息,可能此处反应的是N-H的一级倍频。
表2得到最小RMSEP值(0.495)所涉及的建模变量点
波数(cm<sup>-1</sup>) | 波数(cm<sup>-1</sup>) | 波数(cm<sup>-1</sup>) | 波数(cm<sup>-1</sup>) | 波数(cm<sup>-1</sup>) |
6363.940 | 6360.083 | 6321.514 | 6294.515 | 6267.517 |
6367.797 | 6387.082 | 6317.657 | 6414.080 | 6425.651 |
6371.654 | 6390.938 | 6313.800 | 6417.937 | 6263.660 |
6356.226 | 6340.798 | 6402.509 | 6290.658 | 6259.803 |
6375.511 | 6336.941 | 6309.943 | 6286.801 | 7208.608 |
6352.369 | 6329.228 | 6406.366 | 6282.944 | 6255.946 |
6348.512 | 6333.084 | 6306.086 | 6421.794 | 6429.508 |
6379.368 | 6398.652 | 6302.229 | 6279.087 | 6252.089 |
6383.225 | 6394.795 | 6410.223 | 6275.230 | 7204.751 |
6344.655 | 6325.371 | 6298.372 | 6271.374 | 6433.365 |
2.2传统波段选择方法和本发明的波段选择方法对比
由上可得,对于本发明的波段选择方法来说,最小的RMSEP值为0.495。为了考察该方法的预测能力高低,将其同其他变量选择方法(FiPLS,BiPLS,CC,UVE)进行对比,如图3所示。对于FiPLS和BiPLS方法来说,变量间隔设置从100到600(全波数的一半),步长设置为100。对于CC方法来说,样品光谱和含量的相关系数范围为0.0483-0.8121,所以相关系数设置为从0.1到0.8,步长为0.1。对于UVE方法来说,蒙特卡罗模拟次数和样品比率会影响NIR建模,所有将蒙特卡罗模拟数设置为100到500,步长为100,其样品比率设置为从0.5到0.9,步长为0.1,所有的循环运算的RMSEP值都记录下,并找出每种参数设置下的最小RMSEP值。从图3中可明显看出,同其他变量选择方法相比,RATC得到了最小的RMSEP值。综上所述,对于原料人血浆样品的总蛋白定量来说,RATC方法是一种有效的变量选择方法。
3.玉米样品NIR建模结果
3.1本发明的波段选择方法
利用本发明的波段选择方法处理玉米样品的四种属性,不同属性下的Vmean值如图4(a)-图4(d)所示,基本较高的Vmean值集中在2000-2500nm,这显示此波段可能包含丰富的数据信息。随后根据Vmean值依次选择波段进行建模,基于本发明的波段选择方法的建模结果如图5(a)-图5(d)所示。对于玉米的水分NIR模型来说,最小的RMSEP值为0.009,涉及变量454个;对于玉米的油脂NIR模型来说,最小的RMSEP值为0.043,涉及变量135个;对于玉米的蛋白质NIR模型来说,最小的RMSEP值为0.076,涉及变量298个;对于玉米的淀粉NIR模型来说,最小的RMSEP值为0.128,涉及变量664个。
3.2传统波段选择方法和RATC方法对比
将本发明的波段选择方法与传统变量选择方法进行对比,结果见图6(a)-图6(d)。对于FiPLS和BiPLS方法来说,变量间隔设置从100到350(全波数的一半),步长设置为50。对于CC方法来说,四种属性将分别设置运算参数。玉米水分的样品光谱和含量的相关系数范围为0.400-0.660,所以相关系数设置为从0.40到0.65,步长为0.01;玉米油脂的样品光谱和含量的相关系数范围为0.0889-0.2092,所以相关系数设置为从0.08到0.20,步长为0.01;玉米蛋白质的样品光谱和含量的相关系数范围为0.1772-0.2782,所以相关系数设置为从0.17到0.27,步长为0.01;玉米淀粉的样品光谱和含量的相关系数范围为0.1133-0.2028,所以相关系数设置为从0.11到0.20,步长为0.01;对于UVE方法来说,蒙特卡罗模拟数设置为100到500,步长为100,其样品比率设置为从0.5到0.9,步长为0.1,所有的循环运算的RMSEP值都记录下,并找出每种参数设置下的最小RMSEP值。
根据实验结果可得,除了玉米油脂建模中,基于本发明的波段选择的建模结果与CC方法的结果相同。图6的其他结果显示,同其他变量选择方法相比,RATC方法建立的模型得到了最小的RMSEP值。综上所述,对于玉米样品的水分,油脂,蛋白质和淀粉定量来说,本发明的波段选择方法是一种有效的变量选择方法。4.汽油样品NIR建模结果
4.1本发明的波段选择方法
利用本发明的波段选择方法建立汽油辛烷值的NIR模型,所有的Vmean值如图7所示,较高的Vmean值大部分集中在1600-1700nm,根据Vmean值选择变量的建模结果如图8所示,最小的RMSEP值为0.166,涉及建模变量233个。
4.2传统波段选择方法和本发明的波段选择方法对比
将本发明的波段选择与传统变量选择方法进行对比,结果见图9。对于FiPLS和BiPLS方法来说,变量间隔设置为100和200(全波数的一半)。对于CC方法来说,汽油辛烷值的样品光谱和含量的相关系数范围为-0.8914-0.4890,所以相关系数设置为从0到0.89,步长为0.01。对于UVE方法来说,蒙特卡罗模拟数设置为100到500,步长为100,其样品比率设置为从0.5到0.9,步长为0.1,所有的循环运算的RMSEP值都记录下,并找出每种参数设置下的最小RMSEP值。
根据实验结果可得,除了CC方法的RMSEP值比本发明的波段选择方法的低(仅仅低13.86%),图9的其他结果显示,同其他变量选择方法相比,基于本发明的波段选择方法而建立的模型得到了最小的RMSEP值。综上所述,对于汽油辛烷值的NIR建模定量来说,本发明的波段选择方法是一种有效的变量选择方法。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (4)
1.一种近红外光谱模型的波段选择方法,其特征在于,基于吸光度浓度变化率来对校正样品集中所有样品进行波段选择;其具体过程为:
预先设定校正样品集中共有n个样品,每个样品光谱中共有N个变量,对于校正样品集所有样品来说,每个变量则有n个吸光值和n个浓度值;其中,N和n均为大于1的正整数;
依次计算每个变量下相邻样品的吸光值差值和浓度差值的比值V,最终在每个变量下得到n-1个比值V,再计算所有比值V的平均值Vmean;
对于校正样品集中样品光谱的N个变量来说,得到N个Vmean值,将N个变量按照其Vmean值进行排序;
按照Vmean值由大变小的顺序依次选择出相应变量,进而选择出近红外光谱模型的波段。
2.一种近红外光谱模型构建方法,其特征在于,包括:
采用如权利要求1所述的近红外光谱模型的波段选择方法选择出近红外光谱模型的波段;
从Vmean值最大的变量开始建模,随后按照Vmean值由大变小的顺序,采取依次增加一个变量的方法,开始建立近红外光谱模型。
3.如权利要求2所述的一种近红外光谱模型构建方法,其特征在于,该方法还包括:利用验证样品集中的所有样品来验证近红外光谱模型预测值的准确性。
4.如权利要求3所述的一种近红外光谱模型构建方法,其特征在于,验证样品集和校正样品集中样品均为同一种类的样品。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811073952.0A CN109270022B (zh) | 2018-09-14 | 2018-09-14 | 一种近红外光谱模型的波段选择方法及模型构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811073952.0A CN109270022B (zh) | 2018-09-14 | 2018-09-14 | 一种近红外光谱模型的波段选择方法及模型构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109270022A CN109270022A (zh) | 2019-01-25 |
CN109270022B true CN109270022B (zh) | 2020-03-10 |
Family
ID=65188265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811073952.0A Active CN109270022B (zh) | 2018-09-14 | 2018-09-14 | 一种近红外光谱模型的波段选择方法及模型构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109270022B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109827922B (zh) * | 2019-03-20 | 2021-08-13 | 深圳市艾科尔特检测有限公司 | 受铜离子污染水中硝酸盐氮测定时铜离子干扰的校正方法 |
CN111579521B (zh) * | 2020-05-06 | 2021-10-15 | 中国科学院沈阳自动化研究所 | 一种基于数据选择的太赫兹压缩成像优化方法及系统 |
CN114184577B (zh) * | 2021-11-30 | 2023-08-22 | 中国科学院西北高原生物研究所 | 一种近红外定量检测模型的参数选取方法和定量检测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4560275A (en) * | 1980-04-08 | 1985-12-24 | California Institute Of Technology | Portable instant display and analysis reflectance spectrometer |
CN101583862A (zh) * | 2007-01-12 | 2009-11-18 | 奥林巴斯株式会社 | 波长确定方法以及分析装置 |
KR101580894B1 (ko) * | 2014-06-16 | 2016-01-11 | 동양하이테크산업주식회사 | 다파장 분석법을 이용한 cod 측정 방법 |
CN105891229A (zh) * | 2014-09-05 | 2016-08-24 | 熊菊莲 | 确定水果外表进行光谱图像分析检测所用特征波长的方法 |
CN106153561A (zh) * | 2016-06-21 | 2016-11-23 | 中南大学 | 基于波长筛选的紫外可见光谱多金属离子检测方法 |
CN106644983A (zh) * | 2016-12-28 | 2017-05-10 | 浙江大学 | 一种基于pls‑vip‑aco算法的光谱波长选择方法 |
-
2018
- 2018-09-14 CN CN201811073952.0A patent/CN109270022B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4560275A (en) * | 1980-04-08 | 1985-12-24 | California Institute Of Technology | Portable instant display and analysis reflectance spectrometer |
CN101583862A (zh) * | 2007-01-12 | 2009-11-18 | 奥林巴斯株式会社 | 波长确定方法以及分析装置 |
KR101580894B1 (ko) * | 2014-06-16 | 2016-01-11 | 동양하이테크산업주식회사 | 다파장 분석법을 이용한 cod 측정 방법 |
CN105891229A (zh) * | 2014-09-05 | 2016-08-24 | 熊菊莲 | 确定水果外表进行光谱图像分析检测所用特征波长的方法 |
CN106153561A (zh) * | 2016-06-21 | 2016-11-23 | 中南大学 | 基于波长筛选的紫外可见光谱多金属离子检测方法 |
CN106644983A (zh) * | 2016-12-28 | 2017-05-10 | 浙江大学 | 一种基于pls‑vip‑aco算法的光谱波长选择方法 |
Non-Patent Citations (2)
Title |
---|
POSITIVE PEAK IDENTIFICATION IN LIQUID CHROMATOGRAPHY USING ABSORBANCE RATIOING WITH A VARIABLE-WAVELENGTH SPECTROPHOTOMETRIC DETECTOR;ROY YOST 等;《Journal cf Chromatography》;19771231;第134卷;第73-82页 * |
高光谱估算土壤有机质含量的波长变量筛选方法;于雷 等;《农业工程学报》;20160630;第32卷(第13期);第95-102页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109270022A (zh) | 2019-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sampaio et al. | Identification of rice flour types with near-infrared spectroscopy associated with PLS-DA and SVM methods | |
CN109270022B (zh) | 一种近红外光谱模型的波段选择方法及模型构建方法 | |
Liang et al. | A new multivariate calibration model transfer method of near-infrared spectral analysis | |
Li et al. | Application of long-wave near infrared hyperspectral imaging for measurement of soluble solid content (SSC) in pear | |
Cozzolino | Foodomics and infrared spectroscopy: from compounds to functionality | |
Chen et al. | Determination of protein, total carbohydrates and crude fat contents of foxtail millet using effective wavelengths in NIR spectroscopy | |
Ranzan et al. | Wheat flour characterization using NIR and spectral filter based on Ant Colony Optimization | |
Chen et al. | FT-NIR spectroscopy and Whittaker smoother applied to joint analysis of duel-components for corn | |
Guo et al. | Rapid quantitative analysis of adulterated rice with partial least squares regression using hyperspectral imaging system | |
Lin et al. | Improvements of the Vis-NIRS model in the prediction of soil organic matter content using spectral pretreatments, sample selection, and wavelength optimization | |
Che et al. | Application of visible/near‐infrared spectroscopy in the prediction of azodicarbonamide in wheat flour | |
CN108169165B (zh) | 基于太赫兹光谱和图像信息融合的麦芽糖混合物定量分析方法 | |
Cao | Calibration optimization and efficiency in near infrared spectroscopy | |
CN106018331B (zh) | 多通道光谱系统的稳定性评价方法及预处理优化方法 | |
CN102590129A (zh) | 近红外检测花生中氨基酸含量的方法 | |
CN112285056B (zh) | 一种用于光谱样品个性化校正集选择及建模方法 | |
Oliveri et al. | Data analysis and chemometrics | |
Ferrão et al. | Horizontal attenuated total reflection applied to simultaneous determination of ash and protein contents in commercial wheat flour | |
Mikola et al. | Quantitative determination of macro components and classification of some cultivated mushrooms using near‐infrared spectroscopy | |
Wang et al. | Application of near-infrared spectroscopy for screening the potato flour content in Chinese steamed bread | |
Tomar et al. | Development of NIR spectroscopy based prediction models for nutritional profiling of pearl millet (Pennisetum glaucum (L.)) R. Br: A chemometrics approach | |
CN102854151B (zh) | 一种光谱分析中样品集划分的化学计量学方法 | |
Cozzolino et al. | The use of correlation, association and regression to analyse processes and products | |
Chen et al. | FT-MIR modelling enhancement for the quantitative determination of haemoglobin in human blood by combined optimization of grid-search LSSVR algorithm with different pre-processing modes | |
Tian et al. | Application of NIR spectral Standardization based on principal component score evaluation in wheat Flour Crude Protein model Sharing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |