CN105899937A - 识别物质的存在 - Google Patents
识别物质的存在 Download PDFInfo
- Publication number
- CN105899937A CN105899937A CN201480058596.9A CN201480058596A CN105899937A CN 105899937 A CN105899937 A CN 105899937A CN 201480058596 A CN201480058596 A CN 201480058596A CN 105899937 A CN105899937 A CN 105899937A
- Authority
- CN
- China
- Prior art keywords
- data
- checking
- sample
- residue
- amendment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000126 substance Substances 0.000 title claims abstract description 121
- 238000000034 method Methods 0.000 claims abstract description 188
- 230000008569 process Effects 0.000 claims abstract description 66
- 230000003595 spectral effect Effects 0.000 claims abstract description 58
- 238000001228 spectrum Methods 0.000 claims description 328
- 238000004611 spectroscopical analysis Methods 0.000 claims description 136
- 239000002019 doping agent Substances 0.000 claims description 120
- 239000000956 alloy Substances 0.000 claims description 96
- 229910045601 alloy Inorganic materials 0.000 claims description 96
- 230000008859 change Effects 0.000 claims description 63
- 239000000463 material Substances 0.000 claims description 56
- 230000000694 effects Effects 0.000 claims description 37
- 108090000623 proteins and genes Proteins 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 230000008439 repair process Effects 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 abstract description 6
- 239000000523 sample Substances 0.000 description 286
- 238000005516 engineering process Methods 0.000 description 22
- 235000013351 cheese Nutrition 0.000 description 15
- 238000012360 testing method Methods 0.000 description 13
- 239000000203 mixture Substances 0.000 description 11
- 230000006872 improvement Effects 0.000 description 10
- 230000009182 swimming Effects 0.000 description 9
- 238000001914 filtration Methods 0.000 description 5
- 238000004497 NIR spectroscopy Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000004566 IR spectroscopy Methods 0.000 description 3
- 238000000151 deposition Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000004615 ingredient Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 235000013355 food flavoring agent Nutrition 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000000227 grinding Methods 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 229910000714 At alloy Inorganic materials 0.000 description 1
- 102000014171 Milk Proteins Human genes 0.000 description 1
- 108010011756 Milk Proteins Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 235000021239 milk protein Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000010909 process residue Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/27—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration
- G01N21/274—Calibration, base line adjustment, drift correction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/02—Food
- G01N33/04—Dairy products
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1293—Using chemometrical methods resolving multicomponent spectra
Landscapes
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
一种用于识别样品中的至少一种掺杂物物质的存在的方法。该方法包括:接收一组样品光谱数据、一组参考光谱数据、多组验证光谱数据以及所述至少一种掺杂物物质的一组掺杂物物质光谱数据,每组验证光谱数据用于一个相应的验证实例。从这些光谱数据,确定代表将在样品光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的残数数据,并且确定代表将在样品光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的样品残数数据。对于每个验证实例,还确定对应的两个残数数据组。该方法然后包括在样品残数数据、修改的样品残数数据、验证残数数据以及修改的验证残数数据之中执行至少一个比较;以及根据所述至少一个比较来确定在所述样品中所述至少一种掺杂物物质的存在的可能性值;以及输出所述可能性值。
Description
本发明涉及识别物质的存在。具体地,本发明涉及识别样品中的至少一种掺杂物物质。
众所周知,在许多情况下,可以从一种材料的光谱(光学光谱、质谱或其他类型的光谱)识别该材料。经常的情况是,多种材料的混合物的光谱是个体材料的光谱的线性组合,以允许通过将混合物的光谱匹配到已知材料的光谱的线性组合来确定该混合物的定量构成。数学上,通过将材料光谱与从已知光谱中选择的实验组合之间的数值差异最简化、选择最佳拟合作为代表混合物的可能构成来实现此匹配。
在此类型的工作中最通常使用的数值差异量度是欧几里得范数,且此匹配过程经常被称为最小二乘法拟合。
还众所周知的是,由于多种原因,名义上相同的材料的光谱可以稍微不同。最根本的原因是,被假定为相同材料的样品实际上在构成或物理形态上可能稍微不同,而且这可能添加有系统测量差异——与测量仪器中的理想性能的偏差(诸如,基线漂移和分辨率效应)——以及伴随所有测量的不可避免的随机噪声。
名义上相同的材料的光谱之间的系统差异经常具有不同的光谱特性。因此可能是,可以通过考虑任何差光谱的形状来显著精化不同的标准。实现这的一种通常方式是通过主成分分析(PCA)。此众所周知的算法可以检查光谱差异(通常与平均光谱的差异),以发现在多于一个差光谱中出现的数据中的相关变化的形态。结果是,被称为递减显著性的因子的一系列光谱形态以合适的组合描述差异的多种光谱特性。
在较低显著性水平处,这些因子混合到随机噪声中且仅考虑最显著因子且将其余因子一起归并到噪声之列(残数(residue))是权宜之计。注意到,个体因子可能不可辨别地与差异的主要来源直接有关,因为这些因子最有可能是这样的来源的组合。
现今一个特定问题是,能够确定提供销售的材料是否实际上是有意购买的材料,或者是否或许是有意购买的材料但是添加有一些掺杂物。通常向材料添加掺杂物以减少成本和增加其销售的可能性。
对于特定类型的物质或样品,通常将有许多已知的潜在掺杂物,这些掺杂物可以这样的方式使用且掺杂物对购买者不是立即显而易见的。
当然可能通过耗时且昂贵的湿法化学分析技术来确定购买的产品中包含这样的掺杂物,但是期望的是可以在样品上使用以确定样品是“良好”无掺杂材料还是具有添加有掺杂物物质的材料的快速且简单且优选地非侵入性/非破坏性分析技术。
本发明旨在解决这样的需要。
对这特别感兴趣的一个领域是食品原料领域。可以考虑奶酪作为一个实例。有可能的是,可以通过添加例如非牛奶蛋白质来以比真正配料更低的费用使奶酪增量(bulkout)从而对奶酪掺杂。同时,将理解,奶酪的含量可以有显著变化,因此任何分析技术都需要能够提醒用户样品中很可能存在掺杂物物质,同时通过分析方法允许其中可能存在有正常变化的奶酪仍将被认为是奶酪。
另一个实例可以是磨制调料,磨制调料可以可能地通过另一种精细磨制材料(诸如,砖灰)增量。
虽然原理上下文讨论的技术可以与上文提到的许多不同类型的光谱数据一起使用,但是在目前情况下对光学光谱学技术特别感兴趣且,例如,红外光谱学是一种可以用于获得用于在本技术中使用的必要光谱的特定技术。
根据本发明的第一方面,提供了一种用于识别样品中的至少一种掺杂物物质的存在的方法,包括如下步骤:
接收针对一个样品所获取的一组样品光谱数据,
接收一组参考光谱数据,
接收多组验证光谱数据,每组用于一个相应的验证实例,
接收所述至少一种掺杂物物质的一组掺杂物物质光谱数据;
确定代表将在样品光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的样品残数数据;
确定代表将在样品光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的样品残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的验证残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的验证残数数据;
在样品残数数据、修改的样品残数数据、验证残数数据以及修改的验证残数数据之中执行至少一个比较;
根据所述至少一个比较确定在所述样品中所述至少一种掺杂物物质的存在的可能性值;以及
输出所述可能性值。
这允许识别样品中的掺杂物物质的存在,其中在样品的特性中以及所产生的光谱数据中可能有某一相当大的变化,而这不指示掺杂物物质的存在。
如果样品不含有掺杂物物质,则参考光谱数据代表被预期成与该样品名义上相同的物质。
验证光谱数据不同于参考光谱数据,但是如果样品不含有掺杂物物质,则验证光谱数据仍代表被预期成与该样品名义上相同的物质。
人们可以考虑存在多类物质。在这样的情况下,参考光谱数据和验证光谱数据可以被选择成代表与样品的种类相同的物质。
一类物质的一个实例可以是奶酪。因此,如果样品是奶酪,则参考光谱数据和验证光谱数据可以被选择成代表奶酪。根据情况,种类可以被选择成较少。因此,如果样品是一种特定类型的奶酪,则这可以是所述种类,且参考光谱数据和验证光谱数据可以被选择成代表那种类型的奶酪。
该方法可以包括根据样品决定待被使用的物质的种类以及选择参考光谱数据和验证光谱数据以便代表该类物质的步骤。
样品残数数据、修改的样品残数数据、验证残数数据以及修改的验证残数数据中的每个可以包括一个相应的残留光谱。
样品残数数据、修改的样品残数数据、验证残数数据以及修改的验证残数数据可以包括一个相应的标量值。
该标量值可以包括一个相应的残留光谱的均方根。
执行至少一个比较的步骤可以包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个验证实例的验证残数数据;
iv)每个验证实例的修改的验证残数数据。
可以确定不止一个度量的值。
一个相应的残留光谱的均方根可以被选择为一个度量。这可以被确定而不首先确定光谱本身,因为它是最小二乘法拟合过程的一个固有部分/输出。在此应用中与均方根略微不同的另一个可能的度量是残留光谱的标准偏差。
其他度量通常会需要将残留光谱的确定作为第一步骤。
其他可能的度量包括:
残留光谱的峰值-峰值幅度与均方根值的比率,
残留光谱中的游程(run)的数目,其中一个游程是全都位于零的同一侧的数据的连续片段,
每个游程的绝对区域,
游程的均方根长度。
执行至少一个比较的步骤可以包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个验证实例的验证残数数据;
iv)每个验证实例的修改的验证残数数据;
b)确定以下各项的度量的最大值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据,
c)确定以下各项的度量的平均值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据,
d)确定以下各项的度量的标准偏差值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据。
执行至少一个比较的步骤可以包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个验证实例的验证残数数据;
iv)每个验证实例的修改的验证残数数据;
b)确定以下各项的度量的最大值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据,以及
c)在一方面样品残数数据和修改的样品残数中的至少一个的度量的值与另一方面验证残数数据和修改的验证残数数据中的至少一个的所确定的度量的最大值之间执行至少一个比较。
执行至少一个比较的步骤可以包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个验证实例的验证残数数据;
iv)每个验证实例的修改的验证残数数据。
b)确定以下各项的度量的平均值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据,
c)确定以下各项的度量的标准偏差值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据,
以及
d)在一方面样品残数数据和修改的样品残数中的至少一个的度量的值与另一方面以下各项中的一个之间执行至少一个比较:
i)在b)中确定的验证残数数据的平均值加上预定数目(n)倍的在c)中计算出的验证残数数据的标准偏差;以及
ii)在b)中确定的修改的验证残数数据的平均值加上预定数目(n)倍的在c)中计算出的修改的验证残数数据的标准偏差。
执行至少一个比较的步骤可以包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个验证实例的验证残数数据;
iv)每个验证实例的修改的验证残数数据,
b)计算出样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异,
c)对于每个验证实例,计算出验证残数数据的度量的值与修改的验证残数数据的度量的值之间的差异,
d)在所有验证实例中,确定验证残数数据的度量的值与修改的验证残数数据的度量的值之间的平均差异,
e)在所有验证实例中,确定验证残数数据的度量的值与修改的验证残数数据的度量的值之间的标准偏差,
f)对在c)中计算出的样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异和在d)中确定的平均值加上预定数目(n)倍的在e)中计算出的标准偏差进行比较。
预定数目(n)可以被选择为3。
此比较例示了与应当不含有掺杂物的验证实例所看到的改进比较,考虑可能的掺杂物光谱使对样品的拟合改进的程度。如果样品的改进小于验证实例的平均值,则这指示该掺杂物不存在。如果该改进显著大于该平均值,则这提供一个存在所述掺杂物的指示。
优选地,执行至少一个比较的步骤包括执行不止一个比较。在计算出度量的值的情况下,这些可以被用在多个比较中。
在执行不止一个比较的情况下,可以对每个比较的结果评分。确定可能性值的步骤可以包括对分值求和。
该评分过程可以如下:
如果样品的度量的值超过验证实例的度量的平均值+n倍标准偏差,其中n被选择成等于3或更大,则分值=2。
如果样品的度量的值超过验证实例的所确定的最大度量,则分值=1。
其他情况分值=0。
该方法可以包括另一个步骤:估计样品中检测到的掺杂物的浓度。这可以是基于在拟合过程中使用的基于幅度的拟合系数的大小实现的。
该方法可以包括另一个步骤:确定关于样品残数数据的度量的值与修改的样品残数数据之间的改变的显著性值,该显著性值被计算为关于样品残数数据的度量的值与修改的样品残数数据之间的差异除以6倍的所有验证实例的验证残数数据的度量的所确定的标准偏差。
该方法可以包括另一个步骤:
i)当确定关于样品残数数据的度量的所确定的值大于验证残数数据的平均值加上3倍的验证残数数据的标准偏差时;以及
ii)当确定关于修改的样品残数数据的度量的所确定的值大于所确定的修改的验证残数数据的平均值加上3倍的修改的验证残数数据的标准偏差时,
输出样品很可能包括一种不同于所述至少一种掺杂物的掺杂物的指示。
样品残数数据可以包括将在样品光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的一个相应的残留光谱的均方根。
修改的样品残数数据可以包括将在样品光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的一个相应的残留光谱的均方根。
验证残数数据可以包括将在相应的验证光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的一个相应的残留光谱的均方根。
修改的验证残数数据可以包括将在相应的验证光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的一个相应的残留光谱的均方根。
在样品残数数据、修改的样品残数数据、验证残数数据以及修改的验证残数数据之中执行至少一个比较的步骤可以包括比较至少一对相应的均方根值。
该方法可以包括:
接收多种掺杂物物质的一组掺杂物物质光谱数据,
确定代表将在样品光谱数据、参考光谱数据和每组掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的相应的修改的样品残数数据,以及
对每个验证实例,确定代表将在相应的实例的验证光谱数据、参考光谱数据和每组掺杂物物质光谱数据之间执行最小二乘法拟合之后剩余的残数的相应的修改的验证残数数据。
在这样的情况下,执行至少一个比较的步骤可以包括关于每种掺杂物物质执行至少一个比较;以及根据所述至少一个比较来确定在所述样品中每种掺杂物物质的存在的可能性值。
该方法可以包括:
接收多种掺杂物物质的一组掺杂物物质光谱数据,
确定代表将在样品光谱数据、参考光谱数据和多组掺杂物物质光谱数据的至少一个选定的组合之间执行最小二乘法拟合过程之后剩余的残数的相应的修改的样品残数数据,以及
对于每个验证实例,确定代表将在相应的实例的验证光谱数据、参考光谱数据和多组掺杂物物质光谱数据的至少一个选定的组合之间执行最小二乘法拟合之后剩余的残数的相应的修改的验证残数数据。
在这样的情况下,执行至少一个比较的步骤可以包括:
关于掺杂物物质的每个选定的组合执行至少一个比较;以及
根据所述至少一个比较来确定在所述样品中掺杂物物质的每个选定的组合的存在的可能性值。
多组验证光谱数据中的至少一组可以是基于使用光谱仪从一种验证实例物质所获取的光谱。
这导致基于实例物质的验证残数数据。
具有合适特性和可变性的实例物质可能难于得到,且因此具有用于确定验证数据的替代方法是有用的。
在验证残数数据包括一个残数光谱的情况下,该方法可以包括通过以下步骤创建附加验证残数光谱的步骤:
计算一个验证实例的验证残数光谱的离散小波变换;
将该变换的至少一部分逐点(point by point)乘以具有单位标准偏差的正态分布的随机数字序列,以提供一个修改的变换;
对修改的变换执行该离散小波变换的逆变换,以产生一个能用作附加验证残数光谱的光谱。
该过程可以以不同的随机数字序列和/或不同的验证残数数据被重复,以产生另一附加验证残数光谱。
该附加验证残数光谱或每个附加验证残数光谱可以被用来确定附加验证残数数据。在上文所描述的过程中,此数据可以被用作或以相同的方式用作验证残数数据。该附加验证残数数据代表将在一个相应的随机化验证光谱和参考光谱数据之间执行最小二乘法拟合之后剩余的残数。
在一个替代实施方式中,用来创建一个附加验证残数光谱的过程可以被用来通过对一个初始组的验证光谱数据而不是一个残留光谱操作而创建附加验证光谱数据。在这样的情况下,然后通过对附加组的验证光谱数据进一步操作来创建一个附加验证残数光谱。
该方法可以包括如下步骤:确定代表将在相应的随机化验证光谱、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的附加验证残数数据。
执行至少一个比较的步骤可以包括在样品残数数据、修改的样品残数数据、验证残数数据、修改的验证残数数据、附加验证残数数据、以及修改的附加验证残数数据之中执行至少一个比较。
可以如上文描述的,关于验证残数数据和修改的验证残数数据确定和使用附加验证残数数据的度量和修改的附加验证残数数据的度量。
在上文使用表达“每个实例的验证残数数据”的情况下,这可以包括附加验证残数数据。在上文使用“每个实例的修改的验证残数数据”的情况下,这可以包括附加修改的验证残数数据。
将考虑掺杂物物质时所看到的任何改进与一个随机结果比较绘是有用的。为了便于此,该方法可以包括生成至少一个随机更改的样品残数光谱。
在样品残数数据包括一个残留光谱的情况下,该方法可以包括通过以下步骤生成至少一个随机更改的样品残数光谱的步骤:
计算该样品残数数据的离散小波变换;
将该变换的至少一部分逐点乘以具有单位标准偏差的正态分布的随机数字序列,以提供一个修改的变换;
对该修改的变换执行该离散小波变换操作的逆变换,以产生能用作一个随机更改的样品残数光谱的光谱。
可以以不同的随机数字序列重复该过程,以产生另一随机更改的样品残数光谱。
该随机更改的样品残数光谱或每个随机更改的样品残数光谱可以被用来确定随机更改的样品残数数据。在上文所描述的过程中,这可以被用作或以相同的方式被用作验证残数数据。随机更改的样品残数数据代表将在一个相应的随机化光谱和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数。
此外,该方法可以包括如下步骤:确定代表将在相应的随机化光谱、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的随机更改的样品残数数据。
执行至少一个比较的步骤可以包括在样品残数数据、修改的样品残数数据、验证残数数据、修改的验证残数数据、随机更改的样品残数数据以及修改的随机更改的样品残数数据以及在存在的情况下的附加验证残数数据和修改的附加验证残数数据之中执行至少一个比较。
可以如上文描述的,关于验证残数数据和修改的验证残数数据确定和使用随机更改的样品残数数据的度量和修改的随机更改的样品残数数据的度量。
随机更改的样品残数数据和修改的随机更改的样品残数数据可以被认为是一种特殊类型的验证残数数据。
执行至少一个比较的步骤可以包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个随机化光谱的随机更改的样品残数数据;
iv)每个随机化光谱的修改的随机更改的样品残数数据;
且可选地
v)每个验证实例的验证残数数据;
vi)每个验证实例的修改的验证残数数据。
执行至少一个比较的步骤可以包括:
a)对于每个随机化光谱,计算出随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的差异;
以及,以下各项中的至少一个:
b)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的平均差异,
c)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的差异的标准偏差,
d)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的最大差异。
执行至少一个比较的步骤可以包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个随机化光谱的随机更改的样品残数数据;
iv)每个随机化光谱的修改的随机更改的样品残数数据;
b)计算出样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异,
c)对于每个随机化光谱,计算出随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的差异,
d)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的平均差异,
e)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的标准偏差,
f)对在c)中计算出的样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异和在d)中确定的平均值加上预定数目(n)倍的在e)中计算出的标准偏差进行比较。
执行至少一个比较的步骤可以包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个随机化光谱的随机更改的样品残数数据;
iv)每个随机化光谱的修改的随机更改的样品残数数据;
b)计算出样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异,
c)对于每个随机化光谱,计算出随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的差异,
d)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的最大差异,
e)对在c)中计算出的样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异和在d)中确定的最大差异进行比较。
可以通过直接执行相应的最小二乘法拟合过程来执行确定样品残数数据的步骤、确定修改的样品残数数据的步骤、确定验证残数数据的步骤、确定修改的验证残数数据的步骤。
然而,这在计算上非常密集。因此一种不同的方法是优选的。
因此,该方法可以包括如下步骤:
开发验证组数据的主成分分析模型,以产生代表一组参考光谱数据的一组主因子;
将所述主因子从样品光谱数据凸现(project out),以留下样品残数数据;
将所述主因子从验证光谱数据凸现,以留下验证残数数据,每组验证光谱数据用于一个相应的验证实例;
将所述主因子从所述至少一种掺杂物物质的掺杂物物质光谱数据凸现,以留下掺杂物残数数据;
将样品残数数据与掺杂物残数数据进行最小二乘法拟合,以生成修改的样品残数数据;
将验证残数数据与掺杂物残数数据进行最小二乘法拟合,以生成修改的验证残数数据。
在存在不同掺杂物物质的多组光谱数据的情况下,在最小二乘法拟合过程中可以使用相应的物质的掺杂物残数数据的组合,以生成适当的修改的样品残数数据和修改的验证残数数据。
该方法可以包括如下步骤:在确定残数数据之前,对样品光谱数据、参考光谱数据和验证光谱数据进行预处理。
在该方法包括开发校准组数据的主成分分析模型的情况下,可以在开发主成分分析模型的步骤之前预处理校准组数据。
预处理可以包括以下各项中的任何一个或任何组合:
确保光谱具有相同的开始波数/波长和结束波数/波长,
以及相同的数据间隔,
数字滤波,
加权,
基线抑制,
不希望的效应的凸现。
使不希望的效应凸现的步骤可以包括从不希望的效应的光谱产生标准正交组的因子光谱,且从样品、验证实例和掺杂物物质的光谱数据减去每个因子的缩放量。
不希望的效应可以包括一个或多个基线效应、从验证实例的光谱计算出的一个平均光谱。
在该方法中使用的光谱数据可以是使用许多不同形式的光谱分析获取的。红外光谱学例如近红外光谱学且特别是近红外漫反射光谱学是一种特别合适的光谱分析形式。
根据本发明的第二方面,提供了一种用于识别样品中的至少一种掺杂物物质的存在的方法,该方法包括如下步骤:
接收针对一个样品所获取的一组样品光谱数据,
接收多组校准光谱数据,以用于在生成一组参考光谱数据中使用,每组校准光谱数据用于一个相应的验证实例,
接收多组验证光谱数据,每组用于一个相应的验证实例,
接收所述至少一种掺杂物物质的一组掺杂物物质光谱数据;
开发校准组数据的主成分分析模型,以产生代表一组参考光谱数据的一组主因子;
将所述主因子从样品光谱数据凸现,以留下样品残数数据;
将所述主因子从每组验证光谱数据凸现,以留下每组验证实例的验证残数数据;
将所述主因子从所述至少一种掺杂物物质的掺杂物物质光谱数据凸现,以留下掺杂物残数数据;
将样品残数数据与掺杂物残数数据进行最小二乘法拟合,以生成修改的样品残数数据,该修改的样品残数数据代表在主成分分析模型中考虑掺杂物光谱数据的效应;
将验证残数数据与掺杂物残数数据进行最小二乘法拟合,以生成修改的验证残数数据,该修改的验证残数数据代表在主成分分析模型中考虑掺杂物光谱数据的效应,
在样品残数数据、修改的样品残数数据、验证残数数据和修改的验证残数数据之中执行至少一个比较;
根据所述至少一个比较来确定在所述样品中所述至少一种掺杂物物质的存在的可能性值;以及
输出所述可能性值。
根据本发明的第三方面,提供了一种光谱仪,该光谱仪包括一个分析模块,该分析模块被布置用于使用如上文所限定的方法来识别样品中的至少一种掺杂物物质的存在。
根据本发明的第四方面,提供了一种光谱仪,该光谱仪被布置用于识别样品中的至少一种掺杂物物质的存在,
该光谱仪具有被进行如下布置的装置:
获取一个样品的一组样品光谱数据,
确定或接收一组参考光谱数据,
获取或接收多组验证光谱数据,每组用于一个相应的验证实例,
获取或接收所述至少一种掺杂物物质的一组掺杂物物质光谱数据;
确定代表将在样品光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的样品残数数据,
确定代表将在样品光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的样品残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的验证残数数据;
对于每个验证实例,确定将代表在相应的实例的验证光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的验证残数数据;
在样品残数数据、修改的样品残数数据、验证残数数据以及修改的验证残数数据之中执行至少一个比较;
根据所述至少一个比较来确定在所述样品中所述至少一种掺杂物物质的存在的可能性值;以及
输出所述可能性值。
根据本发明的第五方面,提供了一种计算机,该计算机被布置成受到软件的控制,以用于处理光谱数据,从而识别样品中的至少一种掺杂物物质的存在,
该计算机被布置以:
接收一个样品的一组样品光谱数据,
确定或接收一组参考光谱数据,
接收多组验证光谱数据,每组验证光谱数据用于一个相应的验证实例,
接收所述至少一种掺杂物物质的一组掺杂物物质光谱数据;
确定代表将在样品光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的样品残数数据,
确定代表将在样品光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的样品残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的验证残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的验证残数数据;
在样品残数数据、修改的样品残数数据、验证残数数据以及修改的验证残数数据之中执行至少一个比较;
根据所述至少一个比较来确定在所述样品中所述至少一种掺杂物物质的存在的可能性值;以及
输出所述可能性值。
根据本发明的第六方面,提供了一种计算机,该计算机被布置成受到软件的控制,以用于根据上文限定的任何方法处理光谱数据,从而识别样品中的至少一种掺杂物物质的存在。
根据本发明的第七方面,提供了一种计算机程序,该计算机程序包括代码部分,当所述代码部分被加载在计算机上且在计算机上运行时导致该计算机执行如下步骤:
接收一个样品的一组样品光谱数据,
确定或接收一组参考光谱数据,
接收多组验证光谱数据,每组验证光谱数据用于一个相应的验证实例,
接收所述至少一种掺杂物物质的一组掺杂物物质光谱数据;
确定代表将在样品光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的样品残数数据,
确定代表将在样品光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的样品残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的验证残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的验证残数数据;
在样品残数数据、修改的样品残数数据、验证残数数据以及修改的验证残数数据之中执行至少一个比较;
根据所述至少一个比较来确定在所述样品中所述至少一种掺杂物物质的存在的可能性值;以及
输出所述可能性值。
根据本发明的第八方面,提供了一种计算机程序,该计算机程序包括代码部分,当所述代码部分被加载在计算机上且在计算机上运行时导致该计算机执行上文所限定的任何方法的步骤。
还可以存在一种计算机程序产品,该计算机程序产品包括承载本发明的第七方面或第八方面的程序的机器可读数据载体。
注意,在上文本发明的第一方面之后解释的子特征与本发明的剩余方面的子特征同等相关,且可以通过措辞上的任何必要改变而全部被重新书写,未这样做仅是为了简要起见。
上文限定的每种方法可以包括一种使用(优选地光学)光谱学数据来识别样品中的至少一种掺杂物物质的存在的方法。
上文限定的每种方法可以包括一种处理(优选地光学)光谱学数据以提供样品中的至少一种掺杂物物质的存在的可能性的指示的方法。
根据本发明的第九方面,提供了一种用于由初始光谱生成随机化光谱以用于在光谱分析中使用的方法,该方法包括如下步骤:
计算该初始光谱的离散小波变换;
将该变换的至少一部分逐点乘以具有单位标准偏差的正态分布的随机数字序列,以提供一个修改的变换;
对该修改的变换执行该离散小波变换操作的逆变换,以产生可用作一个随机更改的光谱的光谱。
可以以不同的随机数字序列重复该过程,以产生另一随机更改的光谱。
该初始光谱可以是一个残数光谱。该初始光谱可以是一个样品光谱。该初始光谱可以是一个验证光谱。
在有限的初始光谱可用的情况下和/或在期望研究光谱中的可能预期由于物理效应和变化而引起出现的随机变化的效应的情况下,这样的光谱会是有用的。应实现比直接使原始光谱随机化更真实的结果。
现在将参考附图仅以实施例的方式描述本发明的实施方案,其中:
图1是布置用于识别样品中的至少一种掺杂物物质的存在的光谱仪的示意图;
图2是以高度示意性形式示出本技术的原理的流程图;以及
图3是示出在本技术的一个特定实施方式中执行的步骤的流程图。
本设备和技术被布置用于识别样品中的至少一种掺杂物物质的存在。该设备和技术分析样品的光谱数据,连同其它物质的光谱数据(所述其他物质名义上与该样品相同,假定该样品未被掺杂),以及已知掺杂物的光谱。
随着分析每个样品或当分析每个样品时必须清楚获取每个样品的样品光谱。
另一方面,可以在一次性采集操作或周期性采集操作中至少部分地获取剩余的光谱数据,或替代地可以每次要对样品进行分析时获取剩余的光谱数据。
如引言中所提及的,本技术可以用于通过不同类型的光谱学分析来识别至少一种掺杂物物质的存在。因此,例如,可以使用光学光谱学技术或质谱学技术或任何其他合适的光谱学技术来获取初始光谱数据,其中所产生的光谱将指示一种特定物质。
目前,对基于光学光谱的技术特别感兴趣。红外光谱学是基于光学光谱的技术中的一种,且对漫反射近红外光谱学特别感兴趣,这是由于漫反射近红外光谱学适合于在识别食品原料样品中可能存在的掺杂物物质中使用,这是当前特别感兴趣的领域。
因此,将就依赖使用红外光谱学的系统和技术书写本说明书的剩余部分,但是将理解,本技术不限于使用此类型的光谱学。此外,下文描述中的大部分实际上对于可以用于获取光谱数据的任何以及所有类型的光谱学将是通用的。
图1示意性地示出用于从样品2获得光谱的光谱仪1。光谱仪1包括主体部分3、分析模块4和输出装置5。
将理解,在一些情况下,分析模块4和/或输出装置5(诸如,屏幕或打印机)可以与该光谱仪分立提供。
分析模块4通常将包括计算机,该计算机可以用在形成本技术的一部分的分析步骤和确定步骤(下文将更详细地描述的)中。当这样的计算机被适当地编程时,其可以体现本发明。类似地,当该光谱仪的分析模块被适当地编程之后,该分析模块也可以体现本发明。
本发明还可以被体现在计算机程序中,计算机程序可以被承载在物理数据载体上,诸如CD、DVD、硬盘驱动器、闪存驱动器或类似的机器可读数据载体。
图2以高度示意性形式示出当在本发明的实施方案中执行本技术时实施的基本总体过程。
在步骤201中,获得一个样品的光谱数据、一个参考光谱的光谱数据、一组验证实例的光谱数据以及多种掺杂物物质的光谱数据。在每种情况下,此光谱数据可以至少以使用光谱仪1获取的至少一个光谱开始。当然,在每种情况下,获得的样品的光谱数据、参考材料的光谱数据、验证实例的光谱数据和掺杂物的光谱数据将代表相应的物质。
在步骤202中,在样品光谱数据和参考光谱数据之间执行拟合,然而在步骤203中,在每组验证光谱数据和参考光谱数据之间执行拟合。因此,在有v个不同的验证实例的情况下,步骤203被执行v次。
在步骤204中,在一方面样品光谱数据与另一方面参考光谱数据以及掺杂物光谱数据之间执行拟合。因此,这里的想法是要看看如果考虑了特定掺杂物的光谱,是否会导致更好的拟合。换言之,问及的问题是特定掺杂物实际上是否存在于样品中。
在步骤205中,在一方面特定验证实例的验证光谱数据与另一方面参考光谱数据以及掺杂物光谱数据之间执行拟合。此外,在有v个验证实例的情况下,此过程被执行v次。
在步骤206中,可以对在步骤202到步骤205中的每个步骤中执行的拟合的结果之间做出比较。具体而言,可能的是,测量在步骤204中通过包括考虑掺杂物做出的针对样品的拟合中的改进是否大于/显著大于当将验证光谱数据拟合到参考光谱数据和对应的掺杂物光谱数据时所看到的改进。如将理解的,这起到核查当考虑此特定掺杂物时看到的针对样品的拟合中的任何改进是真实的改进还是细微的/偶然的改进的作用。下文将进一步详细限定此比较过程。
在已经关于特定掺杂物执行此比较过程之后,对于其他掺杂物物质且实际上掺杂物物质的组合可以重复步骤204和步骤205。
理论上,对在诸如此过程中可以考虑的不同掺杂物和掺杂物组合的数目没有限制。然而,将理解,在将要执行的数据处理量方面存在将要考虑的实际考虑因素。因此,例如,考虑在任何一个样品中存在多达三种掺杂物的组合是实际的,且因此关于将样品数据以及验证数据拟合至参考外加多达三种不同的掺杂物物质来执行步骤204和步骤205。
样品光谱数据不言而喻是与样品有关的光谱数据。另一方面,参考光谱数据是代表与样品的类型相同的类型的良好物质或干净物质的光谱数据。实际上可以通过处理与待被测试的样品的类型名义上相同的类型的许多示例物质的光谱来获得参考光谱。
类似地,验证光谱数据每个都与从与样品名义上相同的物质取得的光谱数据有关。
给出一个具体实例,如果在样品是奶酪的情况下使用当前技术,则参考光谱数据将是对应于无掺杂奶酪的至少一个实例的光谱数据,且多组验证光谱数据每个都将与其他无掺杂奶酪样品有关。
另一方面,当然,掺杂物光谱数据将与已知用作添加到奶酪的掺杂物的物质有关。
将理解,关于许多不同物质或不同种类的物质,可以使用本技术。在每种情况下,重要的是,获得关于与待被研究的样品的物质名义上相同或与待被研究的样品的物质处于名义上相同种类的物质的“良好”实例或“干净”实例的参考光谱数据和验证光谱数据,且类似地获得掺杂物光谱数据,所述掺杂物是已知的或被怀疑可以被用来掺杂一种类型的物质,其中样品是所述类型物质的一个实例。
应注意,图2中所描述的过程是支持本技术的一般化概念性过程。本技术的实际实施方式可以遵循图2中示出的相同的步骤,但是情况未必如此。
具体而言,在本技术的当前优选的实施方式中,进行一系列稍微不同的、与图2中示出的步骤具有相同的概念性结果但是执行的实际处理步骤不同的步骤。
图3是示出在本技术的特定实施方式中采取的一系列步骤的流程图。
在步骤301中,获得光谱。如上文所提及的,这些光谱可以全都是通过用于分析受测试的样品的光谱仪1获得的,或这些光谱中的一些可以是分立地/较早地获得的。此第一步骤301的一个重要部分是收集一致的数字光谱。优选地,在非常类似的条件下测量它们。收集的光谱包括:
a)受测试的样品的光谱;
b)已知的无掺杂材料的比较光谱——这样的光谱应代表所有预期的样品变化;
c)可能的掺杂物的光谱;
d)已知的不希望的效应(例如,基线和水蒸气吸收)的光谱——典型的基线可以是通过多项式曲线模拟的。
注意,所有光谱都需要是兼容的。就是说,它们应具有相同的开始波数/波长和结束波数/波长以及相同的数据间隔。这可以在一个共同范围内缩短/内插光谱来实现,或在一个共同范围内缩短/内插光谱以实际上限制当前过程所考虑的光谱的范围。就实用性而言,应在相同条件下测量光谱以避免引入不必要的不一致。出于混合物分析的目的,光谱被假定为可相加;可能需要对数转换或其他转换以实现此。
可以根据使用者做出的选择以相同的方式预处理所有光谱。
因此,在步骤302中,可以可选地对光谱进行滤波。注意,应对所有光谱使用相同的数字滤波器。包括平滑(低通滤波器)以减少高分辨率噪声、微分(高通滤波器)以减少基线效应、或组合(带通滤波器)的可能的滤波会是最好的选择。另外,可以使用陷波滤波以减少周期性噪声(例如,条纹)。可以使用傅里叶变换滤波器以修整响应。可以使用离散小波滤波器以减少已知问题区域。
在步骤303中,作为另一种形式的预处理,光谱可以被加权。此外,应同样地处理所有光谱,使得如果存在任何加权,则所有光谱都应乘以相同的加权光谱。可以根据光谱区的预期的可靠性将加权分级。低信噪比区将被给定低加权。低加权还将被给定到无关变量区(例如,水蒸气吸收)。可以从重复光谱或光谱能量生产量的一般考虑来估计信噪比。在当前实施方式中,加权从未被允许归零而是在一个非常低的值处被截短。如果期望的话并且当期望时,这允许通过除以加权光谱来重建未加权光谱。
在步骤302中的任何这样的可选滤波和/或步骤303中的加权之后,在步骤304中,使已知的不希望的效应从数据光谱凸现。换句话说,从上文在步骤301的描述中在a)到c)处列出的光谱中的每个凸现。在本实施方式中,凸现已知的不希望的效应的步骤包括使用奇异值分解或类似方法由不希望的效应的预处理光谱(d)产生一组标准正交的因子光谱。然后,从所有剩余的光谱(即,上文a)到c)标注的光谱)减去每个因子的缩放量。通过被处理的光谱和相应的因子的标量积给出该缩放。
注意,可能有利的是,包括上文列表中的比较光谱(b)的平均作为不希望的效应,且从所有数据光谱a)到c)减去比较光谱(b)的平均。这可以帮助稍后的数值稳定性,因为它意味着仅关于光谱中的差异而不是整个值执行稍后的过程。
注意,此凸现过程相当于一群组不希望的光谱与剩余的光谱的最小二乘法拟合,且减去该拟合。还将可能使该过程延迟,且替代地将在下文更详细解释的校准组模型中包括不希望的光谱。
在步骤305中,关于步骤301提到的比较光谱(b)被分成校准组和验证组。此分组在一定程度上是任意的,因为比较光谱中的每个被选择来代表与将在适当的时候被考虑的样品名义上相同的无掺杂物质。在本技术中需要许多这样的实例以起到校准组的作用,从而允许生成参考光谱数据。此外,需要许多比较光谱作为验证实例,以核查当考虑掺杂物时拟合中的任何改进是否是如上文概括地讨论的真实效应。从比较光谱选择校准组和验证组可以由使用者执行或由系统随机选择。由系统随机选择是优选的,因为它将避免通过使用者选择可能引入的任何效应。
在步骤306中,开发校准组的主成分分析(PCA)模型。可以使用奇异值分解(SVD)或非线性迭代局部最小二乘法(NIPALS)算法实现PCA模型的产生。可以通过核查奇异值(本征值)或模型残数来确定将要在该模型中使用的因子的数目。存在可以被使用的多种已确立的测试,诸如,马林诺夫斯基的指标函数或F测试。还可以从验证组中的残数确定因子的数目,因为这些因子被逐渐凸现。对于低数目的校准光谱,可能需要全部因子。在此情况下,该方法变为相当于最小二乘法拟合。当情况并非如此而是预期该过程将变得较为噪声化(noisier)时,仍可以使用最小二乘法拟合。
一旦已知PCA模型的主因子,这些主因子可以被用来处理样品光谱和验证组。因此,在步骤307中,使主因子从验证组光谱中的每个和样品光谱凸现。在每种情况下剩余的是来自对校准模型拟合的残留光谱结合不希望的效应的光谱=样品残数数据和验证残数数据。
在此阶段,样品的残留光谱和验证组中的每个实例的残留光谱可以被考虑。
在步骤308中,开发残留光谱的统计度量,稍后可以在比较过程中使用所述统计度量。当决定使用什么度量时,重要的是记住最初感兴趣的是样品光谱是否异常,即,很可能由包括掺杂物材料的样品造成。在某种程度上,这可以通过将样品的残留光谱与验证光谱的残留部分比较来实现。
对于应用到验证残数数据的任何度量,因为有多个验证实例且因此有多个验证残留光谱/数据,计算度量的平均值及其标准偏差是可能的。良好的经验法则是,如果样品光谱的度量位于平均值+/-3倍(验证数据的)标准偏差的范围之外,则样品光谱是异常的。+/-3倍标准偏差的值是第一选择但是在一定程度上是任意的。因此,在一些情况下,大量的标准偏差可以被选择作为一个测量标准。这在有有限数目的验证实例的情况下可能特别相关。
每个残留光谱的均方根(rms)被容易地计算出且用作简易的统计度量。注意,可以计算此度量而实际上不计算残留光谱,因为它是最小二乘法过程的一个固有部分。在此应用中另一个与均方根细微不同的可能的度量是残留光谱的标准偏差。其他度量将需要首先计算出残留光谱。
在本实施方式中,每个残留光谱的均方根值的使用是优选形式的度量。然而,可以使用其他度量。例如,残数的峰值-峰值幅度与其均方根值的比率将指示残留部分中的可能的结构。此外,残数中的游程的数目指示可能的结构。残留光谱通常具有接近于零的平均值。一个游程是全都位于零的同一侧的光谱数据的连续片段。具有结构的数据倾向于比随机数据具有更少的游程。在每个游程下的绝对区域的和还可以示出结构的存在。游程的均方根长度还可以示出结构的存在。因此,在其他实施方式中可以选择这些其他度量。
直到此阶段,在该过程中并没有试图看看在拟合中包括掺杂物光谱是否将导致改进且因此导致指示在样品中可能存在掺杂物物质。这是该过程的下一个阶段。
在步骤309中,使PCA模型的主因子从掺杂物光谱凸现。然后,在步骤310中,步骤309的掺杂物残数数据被拟合到在步骤307中获得的样品残数数据和验证残数数据。
这的结果给出
1)修改的样品残数数据,其是考虑了掺杂物光谱的效应的样品的残数数据;以及
2)修改的验证残数数据,其是考虑了掺杂物光谱的每个验证实例的残数数据。
此过程导致的所产生的修改的样品残数数据和修改的验证残数数据基本上相当于如果在PCA模型中包含掺杂物光谱将导出的修改的样品残数数据和修改的验证残数数据。然而,在309中分立地使主因子从掺杂物光谱凸现且之后分别在掺杂物残数数据和样品残数数据之间以及在掺杂物残数数据和验证残数数据之间执行最小二乘法拟合在计算上更有效率。
注意,可能存在相当大量的将要考虑的掺杂物物质(和光谱)并且还存在相当大量的将要考虑的验证实例。此外,在本技术中,考虑掺杂物物质的组合,且因此在步骤310的拟合过程中还必须考虑掺杂物残数数据的组合。因此,可以存在在执行步骤310时需要的重要处理。在步骤310中拒绝具有负拟合系数的任何实验,因为掺杂物被添加到材料而不是被减去。此外,还可以拒绝具有比使用者选择的阈值小的拟合系数的任何实验。
在步骤311中,可以开发修改的残留光谱的统计度量。在此将使用相同的度量,如上文关于步骤308所讨论的。然而,在此阶段正在进行的是,在考虑了包括掺杂物光谱的效应的情况下,确定修改的样品残数数据和修改的验证残数数据的那些度量。因此,在此阶段,我们具有样品残数数据、每个验证实例的验证残数数据、修改的样品残数数据(考虑了掺杂物光谱的效应)以及每个验证样品的修改的验证残数数据(考虑了掺杂物光谱的效应)。
在步骤312中,可以比较这四种类型的残数数据中的每个的度量以帮助确定样品中是否存在相关掺杂物物质。具体而言,我们希望确定在拟合中在发现的通过将掺杂物包括在拟合中的改进(残数的大小的减少)是否显著。如何将它与随机结果比较?如何将它与验证实例的结果比较?
因此,作为一个可以被执行的示例比较,可以将样品残数数据的度量和修改的样品残数数据的度量之间的值的差异与修改的验证残数数据和验证残数数据之间的对应的差异比较。具体而言,可以计算出验证残数数据中的平均差异,且可以计算出验证残数数据的差异中的标准偏差,且可以将样品残数数据中的差异与此平均加上三倍的该标准偏差比较。如果样品残数数据的度量中的改变大于该平均加上三倍的验证残数数据的标准偏差,则这发出可能存在有关的掺杂物的信号。
在步骤313中,可以对考虑中的掺杂物存在于样品中的可能性排名。对于度量中的每个差异,可以识别三个分值:
2如果度量超过平均值+3倍标准偏差
1如果度量超过观察到的最大验证值
0其他情况
可以结合这样的分值以给出可能性方面的排名。这些可以被给出诸如被检测到、很可能被检测到、可能被检测到、不大可能被检测到以及未检测到的标注。
在步骤314中,可以计算出并且报告附加统计。因此,例如,可以指示任何度量中的改变的显著性。这可以基于样品残数数据和与整组验证实例中的验证残数数据中的标准偏差的六倍进行比较的修改的样品残数数据之间的度量中的改变计算出。
另外,可以指示未知掺杂物的存在。如果样品残数数据的度量的值和修改的样品残数数据的度量的值超过平均值加上整个验证组中的验证残数数据的度量的标准偏差的三倍,则样品中很可能存在未知掺杂物且这将被指示。
在步骤315中,向使用者报告关于识别的掺杂物的结果。这可能受到使用者确定的掺杂物浓度的最小值和/或应被考虑的掺杂物可能性的影响。
对于超过任何这样的设定极限的任何以及所有掺杂物物质,可以报告以下各项——掺杂物——确定的可能性——估计的每个掺杂物的浓度——估计的浓度检测极限——修改的样品残数数据的度量的值。
在步骤316中,多种光谱可以被计算出且被输出用于检验。所有光谱将被呈现出经滤波但是未加权。光谱输出可以包括样品光谱、忽略掺杂物的残留样品光谱(即,样品残数数据)、如果有任何报告的话(结合的)掺杂物光谱、在掺杂物被拟合的情况下的残留样品光谱(即,修改的样品残数数据)。
在步骤317中,可以给出与数据最佳拟合的掺杂物的报告,即,给出修改的样品残数数据的度量的最低值连同估计的此掺杂物实际存在的可能性的报告。这可以在存在可以拟合的多种掺杂物的情况下或在不存在超过使用者的最小阈值设置的掺杂物的情况下被输出。在步骤317中,在与验证数据比较,样品数据并非很好,而且已知的掺杂物光谱没有导出这些掺杂物中的一个的存在的肯定确定的情况下,也可以有关于未知掺杂物的可能存在的报告。
在上文关于图3所描述的过程然后还对掺杂物光谱与样品数据的拟合和掺杂物光谱与验证数据的拟合进行比较的一个开发中,还考虑掺杂物光谱与随机化样品光谱的拟合的效应。
这是因为在引入掺杂物拟合以测试样品残留光谱度量中的减少时,有用的是知道与随机结果比较时该效应是否显著。测试此的一种方式是将掺杂物拟合至一系列准随机样品残留光谱。可惜,甚至当对所有合理的光谱因子做出解释时,样品残留光谱很少显现为随机。需要的是一个具有相当类似的特征和分辨率分布但原本是随机的光谱。
因此,在本技术中,可以创建这样的光谱。
用于创建这样的光谱的方法是采取在步骤307中计算出的样品残数光谱,且适当地处理该样品残数光谱。对此样品残数光谱进行操作,以计算样品残数光谱的离散小波变换。所产生的变换的至少一部分逐点乘以具有单位标准偏差的正态分布的随机数字序列。该变换的非常低的频率部分可以被单独剩下(即,未乘以随机数字),以使得光谱中的非常缓慢改变的效应保持不受影响。然后对该结果执行逆变换,以恢复在某种程度上类似外观的但是其细节随机不同的光谱。
这可以以不同的随机数字序列重复。
一旦生成多个这样的随机化样品残数光谱,就可以以与验证残数数据类似的方式使用它们。因此可以计算出随机化样品残数数据的度量,且该随机化样品残数数据可以与掺杂物残数数据进行最小二乘法拟合,以给出修改的随机化样品残数数据。一旦这样的附加残数数据存在,就可以在比较包括掺杂物的效应的效应中使用它。具体而言,可以对通过考虑掺杂物发现的实际样品数据中的拟合中的改进与对于随机化数据出现的拟合中的改进进行比较。
显然,如果随机化数据中的拟合中的改进等于或大于发现的真实数据的拟合中的改进,则可以忽略真实数据的任何效应。
有时可能存在可用于产生校准组光谱和验证组光谱的相对低数目的验证/校准实例。在这样的情况下,可获得许多不同的可能性。
一种方式是使用与上文刚刚描述的相同的方法通过一个或多个真实的残留光谱产生合成准随机残留光谱。因此,在这样的情况下,将采取验证实例中的一个的残留光谱以及通过以下方式生成的准随机合成残留光谱:通过对初始残留光谱执行离散小波变换,将该变换的至少一部分逐点乘以具有单位标准偏差的正态分布的随机数字序列,且然后执行逆变换。
另一个可能方案是接受存在相对低数目的验证数据,且增加执行比较时考虑的标准偏差的倍数个数。因此,替代上文提及的平均值加上三倍的标准偏差,可以选择使用平均值加上n倍的标准偏差,其中n大于3且是可用验证实例的数目的函数。因此,n可以被选择成例如4或5。
一个替代方案是使用交叉验证,例如“留一法”。在这样的情况下,留下一个比较光谱,由剩余的光谱建立一个模型,且计算出该留下的一个的残留光谱。对每个比较光谱重复此过程导致与比较光谱一样多的验证残留光谱,以创建一样多的模型为代价。用于样品光谱残留的模型是由所有比较光谱建立的全模型。注意,每次留下不止一个光谱也是可能的。
此外,生成准随机光谱的步骤可以是通过以下方式实现的:在使主因子凸现之后挑选具有最大残数的验证实例,且使此验证实例光谱经受离散小波变换,将变换的结果逐点乘以具有单位标准偏差的正态分布的随机数字序列,然后执行逆变换,以恢复在某种程度上类似外观的光谱。所产生的光谱然后可以被用作附加验证光谱,且经受使主因子凸现的相同过程等等。
将认识到,在上文所描述的过程中实际上可以做出多种不同比较,且可以在确定样品中是否存在特定掺杂物的决定过程中使用多种不同的度量。此外,如从上文将清楚的是,任何这样的决定过程的一个特别重要的部分对样品数据的效应和包括考虑掺杂物光谱的验证数据的效应进行比较。
在申请人的当前优选的评分系统中,选择残留光谱的均方根作为度量。如上文所提及的,这具有的优点是,残留光谱的均方根值自然由所执行的拟合过程产生,且因此可以使用此度量而不必首先计算出残留光谱本身。这可以帮助处理。作为替代,可以使用标准偏差。在稍后阶段,可以计算出感兴趣的残留光谱,这可用于其他目的或例如用于向使用者报告。然而,可以特别有利的是,在确定可能存在哪些掺杂物以及掺杂物的组合的确定过程中做出的所有比较的所有示例中不必计算出残留光谱。
申请人的当前优选的评分系统如下。这是一种用于对特定掺杂物混合物存在的可能性评分的系统,且涉及以下度量的使用:
a)样品残留光谱(包括掺杂物)的均方根,即修改的样品残数数据;
b)样品残留光谱(排除掺杂物)的均方根,即样品残数数据;
c)a)和b)的差异;
d)样品中每种混合物掺杂物的估计浓度;
e)每个验证实例的每个验证残留光谱(包括掺杂物)的均方根,即修改的验证残数数据;
f)每个验证实例的验证残留光谱(排除掺杂物)的均方根,即验证残数数据;
g)每个验证样品的e)和f)的差异;
h)每个验证样品中每种混合物掺杂物的估计浓度;
i)每个准随机光谱的每个准随机合成样品残留光谱(排除掺杂物对比包括掺杂物)的均方根差,即均方根(随机化样品残数数据)-均方根(修改的随机化样品残数数据);
测量e)到h)适用于多个验证光谱,且因此具有一个平均值、一个最大观察值以及一个标准偏差σ,导致平均值+3σ的极限值(极限值>最大值)。类似地,测量i)适用于多个准随机样品残留光谱,且因此具有一个平均值、最大值以及在相同基础上计算出的极限值。用这些度量,当前采用的可能性评分算法是:
如果对于所有掺杂物混合物成分,
a)<最大值e)且
b)>极限值f)且
c)>极限值g)且
c)>极限值i)且
d)>极限值h)
则 可能性被检测到
否则,如果对于所有掺杂物混合物成分
c)>极限值g)且
c)>极限值i)且
d)>极限值h)
则 可能性是很可能的
否则,如果a)>=最大值e)
则可能性是可能的
否则,如果对于所有掺杂物混合物成分
a)<最大值e)且
b)<最大值f)且
c)<最大值g)且
c)<最大值i)且
d)<最大值h)
则 可能性未被检测到
否则 可能性是不大可能。
对于库中的每个掺杂物和每个允许的掺杂物组合(当前被限于多达3个掺杂物的组合)重复这样的评分。
此评分方法学可以与一个不同的度量一起使用,也许最清楚的是使用标准偏差代替均方根,但也可以是其他度量。
当然可以使用不同的评分方法学,且例如如果需要,则可以使用许多倍标准偏差而不是3倍来确定极限值。
Claims (25)
1.一种用于识别样品中的至少一种掺杂物物质的存在的方法,包括如下步骤:
接收针对一个样品所获取的一组样品光谱数据,
接收一组参考光谱数据,
接收多组验证光谱数据,每组验证光谱数据用于一个相应的验证实例,
接收所述至少一种掺杂物物质的一组掺杂物物质光谱数据;
确定代表将在所述样品光谱数据和所述参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的样品残数数据;
确定代表将在所述样品光谱数据、所述参考光谱数据和所述掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的样品残数数据;
对于每个验证实例,确定代表将在相应实例的验证光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的验证残数数据;
对于每个验证实例,确定代表将在相应实例的验证光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的验证残数数据;
在所述样品残数数据、所述修改的样品残数数据、所述验证残数数据以及所述修改的验证残数数据之中执行至少一个比较;
根据所述至少一个比较来确定所述样品中的所述至少一种掺杂物物质的存在的可能性值;以及
输出所述可能性值。
2.根据权利要求1所述的方法,其中执行至少一个比较的步骤包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个验证实例的验证残数数据;
iv)每个验证实例的修改的验证残数数据。
3.根据权利要求2所述的方法,其中选择一个相应的残留光谱的均方根作为度量。
4.根据任一项前述权利要求所述的方法,其中执行至少一个比较的步骤包括,
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个验证实例的验证残数数据;
iv)每个验证实例的修改的验证残数数据;
b)确定以下各项的度量的最大值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据,
c)确定以下各项的度量的平均值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据,
d)确定以下各项的度量的标准偏差值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据。
5.根据任一项前述权利要求所述的方法,其中执行至少一个比较的步骤包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个验证实例的验证残数数据;
iv)每个验证实例的修改的验证残数数据;
b)确定以下各项的度量的最大值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据,以及
c)在一方面样品残数数据和修改的样品残数中的至少一个的度量的值与另一方面验证残数数据和修改的验证残数数据中的至少一个的所确定的度量的最大值之间执行至少一个比较。
6.根据任一项前述权利要求所述的方法,其中执行至少一个比较的步骤包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个验证实例的验证残数数据;
iv)每个验证实例的修改的验证残数数据,
b)确定以下各项的度量的平均值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据,
c)确定以下各项的度量的标准偏差值:
i)所有验证实例的验证残数数据;
ii)所有验证实例的修改的验证残数数据,
以及
d)在一方面样品残数数据和修改的样品残数中的至少一个的度量的值与另一方面以下各项中的至少一个之间执行至少一个比较:
i)在b)中所确定的验证残数数据的平均值加上预定数目(n)倍的在c)中计算出的验证残数数据的标准偏差;以及
ii)在b)中所确定的修改的验证残数数据的平均值加上预定数目(n)倍的在c)中计算出的修改的验证残数数据的标准偏差。
7.根据任一项前述权利要求所述的方法,其中执行至少一个比较的步骤包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个验证实例的验证残数数据;
iv)每个验证实例的修改的验证残数数据。
b)计算出样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异,
c)对于每个验证样品,计算出验证残数数据的度量的值与修改的验证残数数据的度量的值之间的差异,
d)确定所有验证实例的验证残数数据的度量的值与修改的验证残数数据的度量的值之间的平均差异,
e)确定所有验证实例的验证残数数据的度量的值与修改的验证残数数据的度量的值之间的标准偏差,
f)将在c)中计算出的样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异和在d)中确定的平均值加上预定数目(n)倍的在e)中计算出的标准偏差进行比较。
8.根据任一项前述权利要求所述的方法,包括另一个步骤:
i)当确定关于样品残数数据的度量的所确定的值大于验证残数数据的平均值加上3倍的验证残数数据的标准偏差时;以及
ii)当确定关于修改的样品残数数据的度量的所确定的值大于所确定的修改的验证残数数据的平均值加上3倍的修改的验证残数数据的标准偏差时,
输出样品很可能包括一种不同于所述至少一种掺杂物的掺杂物的指示。
9.根据任一项前述权利要求所述的方法,包括如下步骤:
接收多种掺杂物物质的一组掺杂物物质光谱数据,
确定代表将在样品光谱数据、参考光谱数据和每组掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的相应的修改的样品残数数据,以及
对于每个验证样品,确定代表将在相应的实例的验证光谱数据、参考光谱数据和每组掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的相应的修改的验证残数数据,其中
执行至少一个比较的步骤包括关于每种掺杂物物质执行至少一个比较;以及
基于所述至少一个比较来确定在所述样品中每种掺杂物物质的存在的可能性值。
10.根据任一项前述权利要求所述的方法,包括如下步骤:
接收多种掺杂物物质的一组掺杂物物质光谱数据,
确定代表将在样品光谱数据、参考光谱数据和多组掺杂物物质光谱数据的至少一个选定的组合之间执行最小二乘法拟合过程之后剩余的残数的相应的修改的样品残数数据,以及
对于每个验证实例,确定代表将在相应的实例的验证光谱数据、参考光谱数据和多组掺杂物物质光谱数据的至少一个选定的组合之间执行最小二乘法拟合之后剩余的残数的相应的修改的验证残数数据,其中
执行至少一个比较的步骤包括关于掺杂物物质的每个选定的组合执行至少一个比较;以及
根据所述至少一个比较来确定在所述样品中掺杂物物质的每个选定的组合的存在的可能性值。
11.根据任一项前述权利要求所述的方法,验证残数数据包括一个残留光谱,且该方法包括通过以下步骤创建一个附加验证残数光谱的步骤:
计算一个验证实例的验证残数光谱的离散小波变换;
将该变换的至少一部分逐点乘以具有单位标准偏差的正态分布的随机数字序列,以提供一个修改的变换;
对该修改的变换执行该离散小波变换的逆变换,以产生一个能用作一个附加验证残数光谱的光谱。
12.根据任一项前述权利要求所述的方法,其中样品残数数据包括一个残留光谱,且该方法包括通过以下步骤生成至少一个随机更改的样品残数光谱的步骤:
计算该样品残数数据的离散小波变换;
将该变换的至少一部分逐点乘以具有单位标准偏差的正态分布的随机数字序列,以提供一个修改的变换;
对该修改的变换执行该离散小波变换操作的逆变换,以产生能用作一个随机更改的样品残数光谱的光谱。
13.根据权利要求12所述的方法,其中该方法包括确定修改的随机更改的样品残数数据的步骤,所述修改的随机更改的样品残数数据代表将在相应的随机化光谱、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合之后剩余的残数。
14.根据权利要求13所述的方法,其中执行至少一个比较的步骤包括在样品残数数据、修改的样品残数数据、验证残数数据、修改的验证残数数据、随机更改的样品残数数据和修改的随机更改的样品残数数据、以及在存在的情况下的附加验证残数数据和修改的附加验证残数数据之中执行至少一个比较。
15.根据权利要求14所述的方法,其中执行至少一个比较的步骤包括
a)对于每个随机化光谱,计算出随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的差异;
以及,以下各项中的至少一个:
b)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的平均差异,
c)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的差异的标准偏差,
d)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的最大差异。
16.根据权利要求15所述的方法,其中执行至少一个比较的步骤包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个随机化光谱的随机更改的样品残数数据;
iv)每个随机化光谱的修改的随机更改的样品残数数据;
b)计算出样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异,
c)对于每个随机化光谱,计算出随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的差异,
d)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的平均差异,
e)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的标准偏差,
f)对在c)中计算出的样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异和在d)中确定的平均加上预定数目(n)倍的在e)中计算出的标准偏差进行比较。
17.根据权利要求15或权利要求16所述的方法,其中执行至少一个比较的步骤包括:
a)确定关于以下各项的度量的值:
i)样品残数数据;
ii)修改的样品残数数据;
iii)每个随机化光谱的随机更改的样品残数数据;
iv)每个随机化光谱的修改的随机更改的样品残数数据;
b)计算出样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异,
c)对于每个随机化光谱,计算出随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的差异,
d)在所有数据组中确定随机更改的样品残数数据的度量的值与修改的随机更改的样品残数数据的度量的值之间的最大差异,
e)对在c)中计算出的样品残数数据的度量的值与修改的样品残数数据的度量的值之间的差异和在d)中确定的最大差异进行比较。
18.根据任一项前述权利要求所述的方法,其中能够通过直接执行相应的最小二乘法拟合过程来执行确定样品残数数据的步骤、确定修改的样品残数数据的步骤、确定验证残数数据的步骤、确定修改的验证残数数据的步骤。
19.根据权利要求1到17中的任一项所述的方法,包括如下步骤:
开发校准组数据的主成分分析模型,以产生代表一组参考光谱数据的一组主因子;
将所述主因子从样品光谱数据凸现,以留下样品残数数据;
将所述主因子从验证光谱数据凸现,以留下验证残数数据,每组验证光谱数据用于一个相应的验证实例;
将所述主因子从所述至少一种掺杂物物质的掺杂物物质光谱数据凸现,以留下掺杂物残数数据;
将样品残数数据与掺杂物残数数据进行最小二乘法拟合,以生成修改的样品残数数据;
将验证残数数据与掺杂物残数数据进行最小二乘法拟合,以生成修改的验证残数数据。
20.根据权利要求19所述的方法,其中存在不同掺杂物物质的多组光谱数据,且在最小二乘法拟合过程中使用相应的物质的掺杂物残数数据的组合,以生成适当的修改的样品残数数据和修改的验证残数数据。
21.一种用于识别样品中的至少一种掺杂物物质的存在的方法,该方法包括如下步骤:
接收针对一个样品所获取的一组样品光谱数据,
接收多组校准光谱数据以在生成一组参考光谱数据中使用,每组校准光谱数据用于一个相应的校准实例,
接收多组验证光谱数据,每组验证光谱数据用于一个相应的验证实例,
接收所述至少一种掺杂物物质的一组掺杂物物质光谱数据;
开发校准组数据的主成分分析模型,以产生代表一组参考光谱数据的一组主因子;
将所述主因子从样品光谱数据凸现,以留下样品残数数据;
将所述主因子从每组验证光谱数据凸现,以留下每组验证实例的验证残数数据;
将所述主因子从所述至少一种掺杂物物质的掺杂物物质光谱数据凸现,以留下掺杂物残数数据;
将样品残数数据与掺杂物残数数据进行最小二乘法拟合,以生成修改的样品残数数据,该修改的样品残数数据代表在主成分分析模型中考虑掺杂物光谱数据的效应;
将验证残数数据与掺杂物残数数据进行最小二乘法拟合,以生成修改的验证残数数据,该修改的验证残数数据代表在主成分分析模型中考虑掺杂物光谱数据的效应,
在样品残数数据、修改的样品残数数据、验证残数数据和修改的验证残数数据之中执行至少一个比较;
根据所述至少一个比较确定在所述样品中所述至少一种掺杂物物质的存在的可能性值;以及
输出所述可能性值。
22.一种光谱仪,该光谱仪包括一个分析模块,该分析模块被布置用于使用如任一项前述权利要求中所要求保护的方法来识别样品中的至少一种掺杂物物质的存在。
23.一种光谱仪,该光谱仪被布置用于识别样品中的至少一种掺杂物物质的存在,
该光谱仪具有被进行如下布置的装置:
获取一个样品的一组样品光谱数据,
确定或接收一组参考光谱数据,
获取或接收多组验证光谱数据,每组验证光谱数据用于一个相应的验证实例,
获取或接收所述至少一种掺杂物物质的一组掺杂物物质光谱数据;
确定代表将在样品光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的样品残数数据,
确定代表将在样品光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的样品残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的验证残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的验证残数数据;
在样品残数数据、修改的样品残数数据、验证残数数据以及修改的验证残数数据之中执行至少一个比较;
根据所述至少一个比较确定在所述样品中所述至少一种掺杂物物质的存在的可能性值;以及
输出所述可能性值。
24.一种计算机,该计算机被布置成受到软件的控制,以用于处理光谱数据,从而识别样品中的至少一种掺杂物物质的存在,该计算机被布置成:
接收一个样品的一组样品光谱数据,
确定或接收一组参考光谱数据,
接收多组验证光谱数据,每组验证光谱数据用于一个相应的验证实例,
接收所述至少一种掺杂物物质的一组掺杂物物质光谱数据;
确定代表将在样品光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的样品残数数据,
确定代表将在样品光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的样品残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据和参考光谱数据之间执行最小二乘法拟合过程之后剩余的残数的验证残数数据;
对于每个验证实例,确定代表将在相应的实例的验证光谱数据、参考光谱数据和掺杂物物质光谱数据之间执行最小二乘法拟合过程之后剩余的残数的修改的验证残数数据;
在样品残数数据、修改的样品残数数据、验证残数数据以及修改的验证残数数据之中执行至少一个比较;
根据所述至少一个比较来确定在所述样品中所述至少一种掺杂物物质的存在的可能性值;以及
输出所述可能性值。
25.一种计算机程序,该计算机程序包括代码部分,当所述代码部分被加载在计算机上且在计算机上运行时导致该计算机执行根据权利要求1到21中的任一项所述方法的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1315195.6 | 2013-08-23 | ||
GB201315195A GB201315195D0 (en) | 2013-08-23 | 2013-08-23 | Identifying presence of substances |
PCT/GB2014/000291 WO2015025114A1 (en) | 2013-08-23 | 2014-07-25 | Identifying presence of substances |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105899937A true CN105899937A (zh) | 2016-08-24 |
CN105899937B CN105899937B (zh) | 2018-12-25 |
Family
ID=49355914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480058596.9A Active CN105899937B (zh) | 2013-08-23 | 2014-07-25 | 识别物质的存在 |
Country Status (6)
Country | Link |
---|---|
US (2) | US10337990B2 (zh) |
EP (1) | EP3036525B1 (zh) |
CN (1) | CN105899937B (zh) |
DK (1) | DK3036525T3 (zh) |
GB (1) | GB201315195D0 (zh) |
WO (1) | WO2015025114A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112858192A (zh) * | 2021-01-11 | 2021-05-28 | 中科谱光(郑州)应用科学技术研究院有限公司 | 一种基于艾草高光谱数据的质量分级算法 |
CN113324971A (zh) * | 2021-05-14 | 2021-08-31 | 重庆大学 | 一种基于低通滤波的自适应拉曼光谱基线校正方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201315195D0 (en) | 2013-08-23 | 2013-10-09 | Perkinelmer Uk Ltd | Identifying presence of substances |
CA3091796A1 (en) * | 2018-02-19 | 2019-08-22 | Cerno Bioscience Llc | Reliable and automatic mass spectral analysis |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1838107A (zh) * | 2005-03-24 | 2006-09-27 | F·霍夫曼-拉·罗奇股份有限公司 | 处理系列波谱尤其是nmr波谱的方法 |
CN101010567A (zh) * | 2004-07-27 | 2007-08-01 | 乌拉帝米尔·阿列克桑德罗维奇·祖布科夫 | 用于产生独立多元校准模型的方法 |
CN101473201A (zh) * | 2006-06-16 | 2009-07-01 | 瑞尼斯豪公司 | 光谱分析方法 |
EP2525213A1 (en) * | 2011-05-16 | 2012-11-21 | Renishaw plc | Spectroscopic apparatus and methods for determining components present in a sample |
US20130096883A1 (en) * | 2011-10-17 | 2013-04-18 | Michael S. Bradley | Multi-Component Regression/Multi-Component Analysis of Time Series Files |
WO2013109728A1 (en) * | 2010-03-09 | 2013-07-25 | Mks Instruments, Inc. | Method and apparatus for siloxane measurements in a biogas |
CN104364624A (zh) * | 2012-05-31 | 2015-02-18 | 理查德·杰克逊 | 用于确定混合物谱中的谱成分存在的系统和方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5781284A (en) * | 1996-04-24 | 1998-07-14 | Infante; David A. | System for detecting impurities contained in a fluid medium |
US6748334B1 (en) * | 1999-12-06 | 2004-06-08 | Jorge E. Perez | Specialty gas analysis system |
US9001335B2 (en) * | 2005-09-30 | 2015-04-07 | Mks Instruments Inc. | Method and apparatus for siloxane measurements in a biogas |
US8296106B2 (en) * | 2010-02-25 | 2012-10-23 | Goodrich Corporation | Apparatus, method and computer-readable storage medium for processing a signal in a spectrometer system |
US10684172B2 (en) * | 2010-08-30 | 2020-06-16 | Keith Carron | Spectroscopic assays and tagging |
GB2513343A (en) * | 2013-04-23 | 2014-10-29 | Univ Singapore | Methods related to instrument-independent measurements for quantitative analysis of fiber-optic Raman spectroscopy |
AU2013323430B2 (en) * | 2012-09-26 | 2017-12-21 | Malvern Panalytical Inc. | Multi-sensor analysis of complex geologic materials |
GB201315195D0 (en) | 2013-08-23 | 2013-10-09 | Perkinelmer Uk Ltd | Identifying presence of substances |
-
2013
- 2013-08-23 GB GB201315195A patent/GB201315195D0/en not_active Ceased
-
2014
- 2014-07-25 US US14/913,782 patent/US10337990B2/en active Active
- 2014-07-25 EP EP14744889.8A patent/EP3036525B1/en active Active
- 2014-07-25 WO PCT/GB2014/000291 patent/WO2015025114A1/en active Application Filing
- 2014-07-25 CN CN201480058596.9A patent/CN105899937B/zh active Active
- 2014-07-25 DK DK14744889.8T patent/DK3036525T3/en active
-
2019
- 2019-05-13 US US16/410,480 patent/US10578550B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101010567A (zh) * | 2004-07-27 | 2007-08-01 | 乌拉帝米尔·阿列克桑德罗维奇·祖布科夫 | 用于产生独立多元校准模型的方法 |
CN1838107A (zh) * | 2005-03-24 | 2006-09-27 | F·霍夫曼-拉·罗奇股份有限公司 | 处理系列波谱尤其是nmr波谱的方法 |
CN101473201A (zh) * | 2006-06-16 | 2009-07-01 | 瑞尼斯豪公司 | 光谱分析方法 |
WO2013109728A1 (en) * | 2010-03-09 | 2013-07-25 | Mks Instruments, Inc. | Method and apparatus for siloxane measurements in a biogas |
EP2525213A1 (en) * | 2011-05-16 | 2012-11-21 | Renishaw plc | Spectroscopic apparatus and methods for determining components present in a sample |
US20130096883A1 (en) * | 2011-10-17 | 2013-04-18 | Michael S. Bradley | Multi-Component Regression/Multi-Component Analysis of Time Series Files |
CN104364624A (zh) * | 2012-05-31 | 2015-02-18 | 理查德·杰克逊 | 用于确定混合物谱中的谱成分存在的系统和方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112858192A (zh) * | 2021-01-11 | 2021-05-28 | 中科谱光(郑州)应用科学技术研究院有限公司 | 一种基于艾草高光谱数据的质量分级算法 |
CN113324971A (zh) * | 2021-05-14 | 2021-08-31 | 重庆大学 | 一种基于低通滤波的自适应拉曼光谱基线校正方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3036525A1 (en) | 2016-06-29 |
US10337990B2 (en) | 2019-07-02 |
US20190265161A1 (en) | 2019-08-29 |
US10578550B2 (en) | 2020-03-03 |
WO2015025114A1 (en) | 2015-02-26 |
EP3036525B1 (en) | 2017-11-22 |
US20160209324A1 (en) | 2016-07-21 |
DK3036525T3 (en) | 2017-12-11 |
CN105899937B (zh) | 2018-12-25 |
GB201315195D0 (en) | 2013-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Strong | Biased richness and evenness relationships within Shannon–Wiener index values | |
Shi et al. | Development of a national VNIR soil-spectral library for soil classification and prediction of organic matter concentrations | |
CN104870955B (zh) | 光谱学装置和方法 | |
Rivera et al. | On the semi-automatic retrieval of biophysical parameters based on spectral index optimization | |
CN104020127B (zh) | 一种利用近红外光谱快速测量烟叶中无机元素的方法 | |
JP6089345B2 (ja) | 時および/または空間系列ファイルの多成分回帰/多成分分析 | |
US20160216244A1 (en) | Method and electronic nose for comparing odors | |
CN105899937A (zh) | 识别物质的存在 | |
Tan et al. | Analysis of different hyperspectral variables for diagnosing leaf nitrogen accumulation in wheat | |
CN103534578A (zh) | 确定样本中存在的成分的光谱装置以及方法 | |
CN101881727A (zh) | 一种基于吸收光谱图重构的多组分气体浓度定量分析方法 | |
CN103913432A (zh) | 基于粒子群算法的近红外光谱波长选择方法 | |
CN111351757B (zh) | 用于预测食用油样品的油掺杂的定量量度的方法和系统 | |
CN112129741A (zh) | 绝缘油老化分析方法、装置、计算机设备和存储介质 | |
EP2859313B1 (en) | System and method for determining the presence of spectral components in the spectra of mixture | |
CN113466143B (zh) | 土壤养分反演方法、装置、设备及介质 | |
CN106990056A (zh) | 一种土壤全氮光谱估算模型校正样本集构建方法 | |
CN106770005B (zh) | 一种用于近红外光谱分析的校正集和验证集的划分方法 | |
CN117874609A (zh) | 快速鉴别天然产物是否为特定产地的通用快速方法 | |
CN103868882A (zh) | 测定沥青中各组分含量的方法 | |
Sem | Interpretability of selected variables and performance comparison of variable selection methods in a polyethylene and polypropylene NIR classification task | |
EP1877945A2 (en) | Method for classification of carbon nanotues and other materials | |
CN113449804B (zh) | 血液类别的确定方法及相关设备 | |
Kampers et al. | Disentangling stochastic signals superposed on short localized oscillations | |
CN110632024B (zh) | 一种基于红外光谱的定量分析方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |