CN112513616A - 用于根据电磁光谱信息表征物理样本中成分的方法和设备 - Google Patents
用于根据电磁光谱信息表征物理样本中成分的方法和设备 Download PDFInfo
- Publication number
- CN112513616A CN112513616A CN201980049966.5A CN201980049966A CN112513616A CN 112513616 A CN112513616 A CN 112513616A CN 201980049966 A CN201980049966 A CN 201980049966A CN 112513616 A CN112513616 A CN 112513616A
- Authority
- CN
- China
- Prior art keywords
- spectral
- feature space
- sample
- information
- spectral lines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 264
- 238000000034 method Methods 0.000 title claims abstract description 122
- 238000001228 spectrum Methods 0.000 claims abstract description 46
- 239000000203 mixture Substances 0.000 claims abstract description 42
- 238000002536 laser-induced breakdown spectroscopy Methods 0.000 claims abstract description 34
- 239000000126 substance Substances 0.000 claims abstract description 18
- 230000000875 corresponding effect Effects 0.000 claims description 45
- 238000011002 quantification Methods 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 24
- 238000000354 decomposition reaction Methods 0.000 claims description 23
- 230000000694 effects Effects 0.000 claims description 20
- 238000013139 quantization Methods 0.000 claims description 20
- 229910052729 chemical element Inorganic materials 0.000 claims description 17
- 238000004611 spectroscopical analysis Methods 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000015556 catabolic process Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 150000002500 ions Chemical class 0.000 claims description 11
- 230000002452 interceptive effect Effects 0.000 claims description 7
- 230000002596 correlated effect Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 230000001939 inductive effect Effects 0.000 claims description 2
- 230000008707 rearrangement Effects 0.000 claims description 2
- 238000003860 storage Methods 0.000 claims description 2
- 230000006835 compression Effects 0.000 claims 1
- 238000007906 compression Methods 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 claims 1
- 238000013459 approach Methods 0.000 abstract description 12
- 238000010801 machine learning Methods 0.000 abstract description 11
- 239000000523 sample Substances 0.000 description 126
- 229910052744 lithium Inorganic materials 0.000 description 27
- 229910052700 potassium Inorganic materials 0.000 description 27
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 26
- 229910052731 fluorine Inorganic materials 0.000 description 20
- 230000008569 process Effects 0.000 description 15
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 14
- 239000010453 quartz Substances 0.000 description 12
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 12
- 230000003287 optical effect Effects 0.000 description 11
- 238000000295 emission spectrum Methods 0.000 description 8
- 229910052500 inorganic mineral Inorganic materials 0.000 description 8
- 229910052742 iron Inorganic materials 0.000 description 8
- 239000011707 mineral Substances 0.000 description 8
- 235000010755 mineral Nutrition 0.000 description 8
- 238000001637 plasma atomic emission spectroscopy Methods 0.000 description 8
- ZXOKVTWPEIAYAB-UHFFFAOYSA-N dioxido(oxo)tungsten Chemical compound [O-][W]([O-])=O ZXOKVTWPEIAYAB-UHFFFAOYSA-N 0.000 description 7
- 210000003462 vein Anatomy 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 239000013078 crystal Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 229910052721 tungsten Inorganic materials 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 229910052708 sodium Inorganic materials 0.000 description 4
- 239000011734 sodium Substances 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 4
- 239000010937 tungsten Substances 0.000 description 4
- 241000282412 Homo Species 0.000 description 3
- HEHRHMRHPUNLIR-UHFFFAOYSA-N aluminum;hydroxy-[hydroxy(oxo)silyl]oxy-oxosilane;lithium Chemical compound [Li].[Al].O[Si](=O)O[Si](O)=O.O[Si](=O)O[Si](O)=O HEHRHMRHPUNLIR-UHFFFAOYSA-N 0.000 description 3
- CNLWCVNCHLKFHK-UHFFFAOYSA-N aluminum;lithium;dioxido(oxo)silane Chemical compound [Li+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O CNLWCVNCHLKFHK-UHFFFAOYSA-N 0.000 description 3
- 150000001793 charged compounds Chemical class 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 229910052710 silicon Inorganic materials 0.000 description 3
- 229910052642 spodumene Inorganic materials 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 229910052782 aluminium Inorganic materials 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000005283 ground state Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000000608 laser ablation Methods 0.000 description 2
- 229910052749 magnesium Inorganic materials 0.000 description 2
- 238000002620 method output Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000010238 partial least squares regression Methods 0.000 description 2
- 229910052670 petalite Inorganic materials 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 229910052701 rubidium Inorganic materials 0.000 description 2
- 239000010703 silicon Substances 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000010936 titanium Substances 0.000 description 2
- 239000011573 trace mineral Substances 0.000 description 2
- 235000013619 trace mineral Nutrition 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- OQCFWECOQNPQCG-UHFFFAOYSA-N 1,3,4,8-tetrahydropyrimido[4,5-c]oxazin-7-one Chemical compound C1CONC2=C1C=NC(=O)N2 OQCFWECOQNPQCG-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000005457 Black-body radiation Effects 0.000 description 1
- 240000008609 Gloriosa superba Species 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 240000005578 Rivina humilis Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 238000001675 atomic spectrum Methods 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- KWLMIXQRALPRBC-UHFFFAOYSA-L hectorite Chemical compound [Li+].[OH-].[OH-].[Na+].[Mg+2].O1[Si]2([O-])O[Si]1([O-])O[Si]([O-])(O1)O[Si]1([O-])O2 KWLMIXQRALPRBC-UHFFFAOYSA-L 0.000 description 1
- 229910000271 hectorite Inorganic materials 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000000752 ionisation method Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229910001760 lithium mineral Inorganic materials 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 229910001092 metal group alloy Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 239000003058 plasma substitute Substances 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- WYROLENTHWJFLR-ACLDMZEESA-N queuine Chemical compound C1=2C(=O)NC(N)=NC=2NC=C1CN[C@H]1C=C[C@H](O)[C@@H]1O WYROLENTHWJFLR-ACLDMZEESA-N 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- IGLNJRXAVVLDKE-UHFFFAOYSA-N rubidium atom Chemical compound [Rb] IGLNJRXAVVLDKE-UHFFFAOYSA-N 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- -1 small molecule ion Chemical class 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000003245 working effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/71—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited
- G01N21/718—Laser microanalysis, i.e. with formation of sample plasma
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J3/00—Spectrometry; Spectrophotometry; Monochromators; Measuring colours
- G01J3/28—Investigating the spectrum
- G01J3/443—Emission spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/27—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration
- G01N21/272—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration for following a reaction, e.g. for determining photometrically a reaction rate (photometric cinetic analysis)
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Plasma & Fusion (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Optics & Photonics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Engineering & Computer Science (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明涉及机器学习领域,特别是用于分析高分辨率或超分辨率光谱数据的机器学习,分析所述数据通常包括分析高度复杂的样本/物质的混合物和/或具有低分辨率的数据,例如激光诱导击穿光谱技术(LIBS)。本发明的一个目的是一种用于根据样本的电磁光谱信息表征这种样本中的一种或多种成分的计算自学习方法,所述方法通过以下方式改变与现有技术方法相关联的范例:仅使用亚光光谱信息,即获得所述光谱信息的分辨率,并由此能够从这种光谱信息提取光谱线—从而确定光谱线位置,因此避免与基于像素的方法相关联的所有不确定性。本发明的又一目的是一种被配置来实现这种方法的计算设备。
Description
技术领域
本发明涉及机器学习领域,特别是用于分析高分辨率或超分辨率光谱数据的机器学习,分析所述数据通常包括分析高度复杂的样本/物质的混合物,例如激光诱导击穿光谱技术(LIBS)。本文公开的方法属于可解释人工智能类别。
背景技术
等离子体发射光谱技术(特别是激光诱导击穿光谱技术(LIBS))是高分辨率且高度解析的技术。等离子体发射光谱技术的全部潜力通过解译在分子击穿电离过程期间获取的发射线的动态信息结构来提供,其中每种不同的成分具有不同的等离子体发射动态。此动态'指纹'包含关于存在于物理样本中的化学元素和/或其同位素、分子和/或其构象、状态和结构的所有信息。等离子体发射(例如LIBS)通常用于分析自然存在的或人造的复杂样本/物质的混合物。
如果仪器具有无限的光学分辨率并且仅存在量子不确定性,那么化学元素和分子的识别将是简单的操作,因为每种元素的发射线都是得到良好表征,并且与认证数据库(例如NIST原子光谱线数据库)的直接匹配将足以评估物理样本。然而,从物理样本获得的光谱信息是光物理现象的复杂叠加和卷积的结果。这对任何复杂样本的光谱中的光谱信息造成多尺度干扰。
等离子体发射光谱系统(例如LIBS)解析光谱信息的能力(即光学光谱分辨率)是有限的,其受在光谱系统中使用的CCD中像素的数量和布置限制。这个事实使得不可能验证光谱线不包括每种元素的假设。
在更复杂的样本中,因为不同的化学元素在非常靠近的波长处呈现光谱线,使用光学光谱分辨率的方法不能够输出准确的识别或量化结果。例如,锂(Li)光谱线会被错误识别为:i)铁(Fe I)(610.329nm和670.74nm);或ii)钨(W)(670.8202nm);或iii)钛(Ti):(610.35nm和670.76nm)。光学分辨率下的谱线匹配算法很可能无法识别元素。这对于等离子体发射光谱技术来说是非常显著的限制,因为许多元素具有显著数量的重叠带区,原因是它们具有增加数量的会干扰其他元素的线。
现有等离子体发射光谱系统(特别是LIBS系统)已经准备好在光谱带之间的低干扰下识别和量化物理样本中的元素。这些系统通过以下方式来最小化等离子体物理效应(诸如多普勒和斯塔克展宽):降低压力或使用气调,或操纵激光能量/脉冲以使信号强度最大化并且使潜在热力学平衡下的光谱带不确定性最小化。所有元素识别和量化都在基于像素的信号中直接进行,这在所评估样本极其复杂(例如矿物或生物样本)的情况下是显著的缺点。对LIBS系统实施基于像素的方法得到的成功是有限的,因为卷积光谱带的使用不允许通过光谱线确定性地识别存在于物理样本中的成分。在此过程期间,引入了不必要的干扰和不确定性,从而将基于像素的方法约束到概率性的识别、分类和量化。
EP1967846公开了一种基于匹配算法对未知化合物混合物的光谱进行分类或量化的方法。然而,EP1967846仅在分析纯化学品或纯化学品的混合物方面的表现是准确的,所述纯化学品或纯化学药品的混合物在光学分辨率内具有无干扰的连续光谱信号,从而允许与纯化学品或化学品的混合物的拉曼光谱数据库进行匹配。复杂样本(诸如生物样本)表现出如此之多的多尺度干扰,以致于光谱特征无法与组成直接相关。
此外,现有方法识别、量化和预测物理样本的组成的能力仍然取决于人类专家的先前知识(Hahn和Omenetto,2010年)。因此,量化模型的开发高度依赖于为光谱线识别提供正确的环境(Cousin等人,2011年)。从这个意义上说,本领域已知两种主要的机器学习方法,具体地是化学计量和神经网络/深度学习。
化学计量是提供预测潜在变量的方法的标准途径。此方法无法应用于复杂样本,仅限于具有更简单组成的样本或具有低组成可变性的接近纯的化学品(诸如药品)或样本。例如,化学计量模型(诸如偏最小二乘(PLS))不能够正确地量化包含锂的矿石中的锂含量,因为化学计量技术未正确地对正确的等离子体发射信息以及光谱线之间的干扰进行建模。
支持向量机器、神经网络/深度学习方法提供输入与输出之间的确定性非线性映射。
所有这些方法都不能够找到组成、光谱带及其干扰模式之间的正确的协方差。这是由于所有元素之间的叠加的且多尺度的干扰以及等离子体发射的所有物理现象。数据如此庞大且详细,以致于找到可预测组成的正确网络架构是极其低效的机器学习过程。这些是全局模型,并且随着新数据的收集,需要创建新的全局模型。
此外,这些现有方法并不提供确定给定样本是否可预测的方式;并且这些现有方法在检测异常值方面存在显著的困难。
缺少此特性是在关键领域(诸如其中必须进行故障安全操作的医药或危险工业应用)中的机器学习(ML)方法的主要障碍。
对于等离子体诱导光谱信息处理(诸如激光诱导等离子体光谱技术(LIBS))来说,当前的机器学习对其在以下方面的全部理论潜力呈现一系列显著的限制:i)测量和识别化学元素及其同位素;ii)测量分子结构和组成;iii)遵循等离子体加强的化学反应;iv)识别、表征和量化材料、其分子构象和化学元素组成;v)通过等离子体指纹法识别和量化生物材料;vi)分析在不同的压力或温度下处于不同状态(固体、液体或气体)的同一样本;以及vii)处理在不同的压力和温度下的测量结果。
此外,当前的机器学习技术(诸如SVM和ANN)通常依赖于黑箱途径。尽管取得了积极的结果,但是这些方法并未提供对结果的可解释解译以用于允许人类控制和与之交互的互操作性、解译和交互,使得要对算法的结果和内部运作两者进行调试并且要根据人类知识和推理来验证和策展预测结果。这对等离子体发射光谱技术来说是严重的限制,其中诊断发射线波长及其强度如何干扰和有助于识别、分类和量化对于正确的物理建模并准确预示新的且未知的数据以及创建在许多应用领域中都支持此水平技术的固化且得到科学验证的数据库是至关重要的。
本发明包括一种机器学习方法和系统,其实时地并且在使用点/护理点处提供高度复杂的样本中的分析准确度度性组成预测,从而克服此类已知方法。
发明内容
因此,本发明的一个目的是一种用于根据物理样本的电磁光谱信息表征这种物理样本中的一种或多种成分的方法,每种成分由化学元素和/或其同位素、分子和/或其构象或状态中的一者或其组合组成,所述方法包括以下步骤:
·获得对应于所述物理样本的电磁光谱信息、优选地包括一个或多个电磁光谱的分辨率,
·在对应于所述光谱信息的所述光谱分辨率是亚光光谱分辨率的情况下,从所述电磁光谱信息提取一条或多条光谱线,
·将所述光谱线投影到确定性特征空间的样本点中,这种确定性特征空间由多维向量空间组成,所述多维向量空间包括具有预先确定的向量基的多条光谱线,这种具有预先确定的向量基的多条光谱线:
ο存储在数据库中并且已经通过亚光光谱分辨率提取获得,并且
ο对应于多种已知成分,
其中所述多维向量空间的每个维度都是所述电磁光谱信息所对应于的所述物理样本中的所述一种或多种成分的预测特征,这种预测特征提供对所述物理样本中的一种或多种成分的量的确定、分类和/或识别。
本文公开的方法使用亚光光谱数据来以提高的准确度提取光谱线,使用此信息作为特征变量来对物理样本中的一种或多种成分进行识别和/或量化。因此,与根据基于像素的技术的现有技术相比,存在两个主要优点:i)对准确限定的光谱线的访问允许将所观察到的光谱线确定性地分配到它们的期望理论波长和跃迁概率,描述于Kramida等人,2018年;ii)提取动态击穿分子离子发射线(即,动态等离子体发射分析)提供关于分子结构的信息,从而允许高度准确的成分识别、分类和量化。代替提供必须使用大数据数据库进行训练的全局模型,所提出的方法在确定性特征空间中的现有数据中搜索提供足够的解译(可解释的模型)并且准确地识别、分类和量化成分的光谱线和样本。借助于通过可解释的接口提供用于识别和量化成分的光谱线的贡献,所述方法还允许人类理解模型(可解释的人工智能)。通过为量子力学数学原子和分子模型提供质量数据,这种贡献可进一步用于理解等离子体发射动态和击穿。通过提供人类可解译的信息,动态等离子体发射分析进一步为开发新的且先进的仪器提供有价值的信息。所述样本点可被描述为特征空间中的特定样本电磁光谱的坐标。
所述方法可根据现有数据或新添加的数据自学习,并且可在进行任何预测之前关于预测能力进行自诊断。通过使用自监督模型构造的理论知识,所述方法还包括自教授应使用什么光谱线进行解译的能力。在不存在等离子体诱导大数据数据库的情况下,自主不断学习和与人类解译交互的能力对于复杂可变性领域(诸如地质、医药和生物技术)中的应用是极其必要的。
因此,本发明的方法通过仅使用亚光光谱信息(即,在低于光谱仪系统的光学分辨率下提取光谱线)来改变与现有技术方法相关联的范例。这是可能的,因为像素密度高于光学分辨率,并且入射在电荷耦合装置(CCD)传感器上的光谱线通过线性CCD的连续像素而展宽。因此,根据这种光谱信息确定光谱线位置减轻与基于像素的方法相关联的不确定性。光谱线中的这种超低波长误差允许准确提供成分信息,从而允许对它或它们进行识别、分类和量化并且根据电磁光谱确定化学结构。此外,光谱线确定中的极低误差将对元素或小分子离子发射的识别转变为确定性过程,这与先前基于像素的方法中的概率性过程不同。
如权利要求1所述的方法使用所有所述化学元素和/或其同位素、分子和/或其构象或状态的多条光谱线作为变量向量基,根据所述变量向量基,等离子体发射信息数据库扩展成包含潜在热力学平衡下的所有可能光谱的矩阵形式,或扩展成包含多个样本的所有时间依赖性等离子体发射光谱的张量格式。这些矩阵或张量用于产生多维向量空间,即所述确定性特征空间,其表示所有现有光谱线的特征空间域中的一个或多个物理样本特征。所有先前已知的光谱线存储在数据库中,对应于针对多种成分提取的光谱线。
所确定的预测特征提供关于样本成分的信息,所述样本由从中获得电磁光谱信息的物理样本组成,这种所获得的信息由关于存在于物理样本中的一种或多种成分的量、分类或识别的信息组成。
如上文所指示,成分可由化学元素和/或其同位素、分子和/或其构象或原子态、壳层和构型中的一者或其组合组成,从而包括但不限于如以各种构象或状态存在的纯元素、分子或物质、金属合金及其组合的实例,此类成分存在并由此形成物理样本的整体或部分。
向量基由已知概念组成,并且可限定为产生特征空间的线性无关的标准正交向量。对分子的构象的提及表示原子在分子中的特定排列,而状态表示单独原子的电子云的特定排列。确定性特征空间表示特征,在本案例中表示光谱线,从而允许产生相同输出。光谱线可由发射线组成。
本发明的方法是一种水平技术,其适用于最需要最低程度破坏性和最低程度侵入性应用的领域,诸如:医疗保健、动物护理、生物技术、制药、食品和农业、原材料和矿物、微米和纳米技术、分子生物、内陆安全和军事、化学和纳米工程材料。它不需要在实验室中制备物理样本。本发明方法的光谱信息优选地通过能够进行等离子体诱导的技术(即激光诱导等离子体光谱技术(LIBS))获得。
本发明的方法提供自学习,因此提供根据数据进行的非监督学习,以及根据数据进行的内隐自动监督学习,即自教授。
本发明的又一个目的是一种用于表征物理样本中的一种或多种成分的具有自学习能力的计算设备,每种成分由化学元素和/或其同位素、分子和/或其构象或状态中的一者或其组合组成,其中所述计算设备被配置来实现所描述实施方案中的任一个中的本发明的方法,所述计算设备优选地还包括能够在物理样本中诱导等离子体状态的光谱装置,所述光谱信息从所述光谱装置获得,所述光谱装置优选地由LIBS装置组成。所述设备可包括等离子体诱导光谱装置,并且被配置来控制这种光谱装置。
此外,本发明的又一个目的是一种非暂时性存储介质,其包括可执行以实施所描述实施方案中的任一个中的本发明的方法的程序指令。
附图说明
图1呈现从激光烧蚀到潜在热力学平衡下的离子发射的典型动态LIBS信号,以及亚光光谱线提取,其中以矩阵格式存储对应的数据。
图2介绍亚光光谱线提取中的干扰的影响,对光谱带去卷积的方式,以及对光谱线进行解析和提取的方式。它还介绍专有光谱线(9)和干扰性光谱线(11)的概念。
图3示出从确定性全局特征空间(12)构建确定性局部特征空间(15)的方式的具体实施方案,具体是其中分析由成分(13)组成的三个样本的实施方案。可确定专有光谱线(9)和干扰性光谱线(11),并将其用作局部确定性特征向量来构建确定性局部特征空间(15)。确定性全局特征空间(12)的不同区域表示多个样本的特定专有光谱线(9)和干扰性光谱线(11)的组合。由不同成分(13)组成的样本簇提供成分的光谱线指纹,所述指纹有可能与这些谱线组合成全局特征空间(即所述局部确定性特征空间(12))的子空间。
图4是成分量化过程(22)的视觉解释,其中从未知物理样本提取的光谱线被投影到确定性全局特征空间(12)的样本点(16)中。
图5是未知物理样本的分类和识别过程的视觉演示,其中从未知物理样本提取的光谱线被投影到确定性全局特征空间(12)的样本点(25)中。
图6呈现用于使用以下各项从多个LIBS物理样本获得确定性全局特征空间(12)的不同方法,其中对应的时间进程光谱线以张量L(28)形式存储:i)在LTE下提取的光谱线(29);ii)展开的张量L的分层多块(30);iii)张量L的Tucker 3D分解(31);以及iv)张量L的PARAFAC分解(32)。
图7呈现用于对未知物理样本等离子体发射光谱进行预测的主要步骤:i)确定光谱分辨率(33)、光谱线数据库(39)和去卷积参数(39);ii)去卷积(40)和专有/干扰光谱线提取(42);以及iii)确定性特征空间构造(45),以及对未知物理样本进行量化、分类和识别(48)。
图8呈现来自Bejanca矿的钨锰铁矿矿石(51)的LIBS表征。钨锰铁矿矿物(黑矿石)(52)包封在石英(53)中。
图9呈现来自Gelfa-Portugal的锂矿石(54)的LIBS表征,其中锂矿脉(55)由石英(55)包围。
图10呈现狗血和猫血中Na、K、Fe和Mg的量化。
图11呈现锂辉石(59)和透锂长石(60)结构中的锂矿石晶体的等离子体发射光谱。
具体实施方式
在本发明的方法的发明方面,所述还包括以下步骤:
·在所述确定性特征空间内选择对应于已知成分量的最少量的相邻样本点,使得所投影样本点使与所述对应的最少量的相邻点的协方差最大化,
·根据所述最小量的相邻点选择专有光谱线、干扰光谱线和独特光谱线,从而得到所述相邻样本点内的局部特征空间,以及
·通过考虑将要量化的所述物理样本的投影到所选择相邻样本点的协方差特征空间中的光谱线来关联来自所述局部特征空间的所述已知成分,来预测来自将要量化的所述物理样本的所述成分的量化。
因此,在将所提取的来自物理样本的光谱线投影到确定性特征空间中之后,所述计算方法确定对应的最少量的相邻点,即存在于数据库中的使对应于已知成分的协方差最大化的样本。所述方法还包括创建局部特征空间,即确定性特征空间的子空间,其仅由产生此局部多维向量空间的最少量的相邻点的专有光谱线、干扰光谱线和独特光谱线作为变量组成。所述方法包括确定:i)专有光谱线—如仅属于特定离子元素或分子的那些光谱线;ii)干扰光谱线—叠加且不能用亚光提取解析的光谱线;以及iii)独特光谱线—仅属于特定成分等离子体动态的光谱线。当与基于像素的方法相比时,对专有光谱线、干扰光谱线和独特光谱线的选择也是显著的演变,在基于像素的方法中,因为这些方法的特征空间不是确定性的,所以选择示不可行的。此后,通过确定使光谱特征与特定成分的量之间的协方差最大化的方向来执行特定成分的量化。所述所选择的相邻样本点可被描述为维持局部模型生成的协方差的在多维特征空间中的欧几里德短距离内的所选择样本。
在本发明的方法的另一个发明方面,所述方法还包括以下步骤:
·通过确定所投影样本点是否在所述确定性特征空间的预先确定的区域内,在所述确定性特征空间内选择最少量的相邻样本点,使得此类相邻样本点属于特定类别,这种区域由非线性逻辑边界界定,以及
·针对定界在所述区域内部的所述最少量的相邻样本点,选择专有光谱线、干扰光谱线和独特光谱线以得到局部特征空间,从而在所述相邻样本点和所述样本点内提供匹配。
因此,这种方法高效地使得能够对存在于物理样本中的成分进行分类和/或识别,其中如果所投影光谱线在确定性特征空间的预先确定的区域内部(由非线性逻辑边界(即限定特定成分类别的边界)界定),则所述物理样本被称为属于已知特定物理样本(指代成分)类别。进一步通过将相邻样本点和所述样本点的专有光谱线、干扰光谱线和独特光谱线进行匹配来执行成分、化学元素和/或其同位素、分子和/或其构象或状态的识别,所述独特光谱线是在其他成分中不可观察到的光谱线。
此外并且在包括如权利要求4所述的另外的特征(以便确定上文提及的非线性逻辑边界)的实施方案中,所述方法通过以下方式来在确定性特征空间中搜索两个或更多个不同类别的样本之间的边界:确定使逻辑函数的误差最小化的搜索方向,并且确定局部地限定逻辑边界的类别样本,即所述极端支持辨别样本(维持样本之间的逻辑辨别边界的样本)。通过递归地应用此方法,针对特定类别确定所述非线性逻辑边界。所述搜索方向提供在特征空间中的方向搜索。
在如权利要求5所述的本发明的方法的另一实施方案下,一旦预先确定了类别,就可更直接执行识别和量化,因为类别专有光谱线、干扰光谱线和独特光谱线是已知的。任选地并且在如权利要求6所述的另一实施方案下,还确定化学结构。非贡献等离子体效应可由散射、展宽、连续背景组成。相关线可由包含量化效应的线组成。匹配指数可被描述为相似度指标。
本发明的方法的另一个发明方面在于:其中所提及的电磁光谱信息是根据等离子体诱导光谱方法、优选地激光诱导击穿光谱技术(LIBS)获得的。
任选地,在上文描述的具体实施方案中,所提及的电磁光谱信息包括在特定时间流逝内随时间的光谱信息变化,所述等离子体诱导光谱方法在这种时间流逝内已经对物理样本产生影响。
因此,结合获得在时间流逝期间的整个时间内的光谱信息包包括等离子体诱导光谱方法使得能够进一步表征物理样本。等离子体诱导光谱方法(诸如激光诱导等离子体光谱技术)在等离子体相期间提供分子击穿,导致化学键在特定电离能下的特性分子结构离解,从而提供关于样本成分的化学结构的信息。
实际上,在所提及的电磁光谱信息中将包括与时间中的若干瞬间相对应的若干电磁光谱,从而使得能够更好/更深入地了解成分量、分类或识别,例如无需借助若干技术和实验室准备即可更好地确定成分的构象或状态。
在本发明的方法的实施方案中,所提及的随时间的变化是离散的,电磁光谱信息由此包括多个电磁光谱,每个光谱对应于所提及的时间流逝中的瞬间,由此针对所述多个光谱中的每个光谱提取光谱线,从而针对每个光谱产生一条或多条光谱线。
在本发明的方法的另一个方面中,所提及的确定性特征空间是通过分层多块技术或张量分解获得的,因此所述方法是用于将特征空间融合成单个超集的方法。
在本发明的方法的一个方面,在所述特征空间内选择最少量的相邻样本点还包括如权利要求11所述的步骤。
在本发明的方法的另一方面,所述方法还包括如权利要求12所述的另外的步骤。
在本发明的计算设备的优选实施方案中,所述计算设备包括光谱装置,这种光谱装置优选地由从其获得所述光谱信息的LIBS装置组成,所述计算设备进一步被配置来在预先确定的时间流逝期间从所述光谱装置获得光谱信息,并由此获得由对应于所述预先确定的时间流逝中的若干瞬间的多个电磁光谱组成的光谱信息,所述等离子体诱导光谱装置在这种时间流逝期间已经对所述物理样本产生影响。
实施方案
结合附图,本发明的技术内容和详细描述在下文根据优选实施方案进行描述,而不用于限制其执行范围。本发明所要求保护的权利要求涵盖根据所附权利要求做出的任何所有等效变化和修改。
本文档描述一种用于根据物理样本的电磁光谱信息表征这种物理样本中的一种或多种成分的方法。所谓成分,意图意指化学元素和/或其同位素、分子和/或其构象或状态中的一者或其组合。
在本文描述的本发明中,通过等离子体发射光谱技术来获取物理样本的电磁光谱信息。在优选实施方案中,使用LIBS作为等离子体发射光谱技术。针对以下一组给定数据记录对物理样本Si取得的所述电磁光谱信息:激光能量和脉冲函数、波长;大气组成、压力和温度。
图1呈现典型LIBS信号,其涵盖以下阶段:激光烧蚀、等离子体膨胀与分子击穿和电离、等离子体冷却和电子衰变(1);以及在潜在热力学平衡(LTE)下的离子原子发射(2)。
对于每个样本Si,沿时间(t)在不同波长(λ)下记录光谱强度,将其以矩阵格式存储为Li(λ,t)。当记录多个物理样本S LIBS光谱时,以三向张量格式L(S,λ,t)存储这些光谱强度。
大多数现有LIBS系统仅使用延迟的信息,以获得最小黑体辐射、最小多普勒和斯塔克展宽,并且仅记录在LTE下的测量结果。在这种情况下,对于多个物理样本,每个样本由向量xi(即在不同波长下记录的光谱)和X(S,λ)(即在LTE下记录的光谱)表示。
本发明引入亚光光谱线提取的特征,其中,在像素位置(3)处记载的光谱带拟合到足以提取强度最大值处的光谱线波长(4)的点扩散函数。因此,将结果记录为多个样本的亚光光谱线X(S,λ)(4),从而显著减小在使用基于像素的值时所观察到的复杂样本分析中的波长误差。
参考图2来解释亚光光谱线提取中的干扰的影响,以及将光谱线存储为变量的方式。在本文公开的发明中,考虑光学部件(7)(狭缝、光栅和像素大小/密度)、多普勒和斯塔克展宽的影响来对光谱带去卷积(6)。详细地,如果去卷积光谱带的概率干扰(8)低于针对原子光谱线数据库优化的给定阈值,则解析光谱线。如果解析的频带和对应的光谱线仅属于特定元素,则它们被认为是专有光谱线(9)。未解析或非专有光谱线(10)被认为是干扰性光谱线(11)。将所提取的线存储为专有的和干扰性的,并且限定X(S,λ)或L(S,λ,t)的λ尺寸。
图3演示到确定性全局特征空间(12)的不同区域中的X(S,λ)或L(S,λ,t)表征,所述不同区域表示多个样本的专有光谱线和干扰性光谱线的不同组合。由不同成分(13)组成的样本簇显示出不同的专有光谱线(9)和干扰性光谱线(11),从而产生独特光谱线(14),即成分的光谱'指纹'。
根据全局的专有光谱线、独特光谱线和干扰性光谱线,使用相邻样本点类别来构造全局特征空间(12)的子空间,即所述局部确定性特征空间(15),其中成分的光谱'指纹'。例如,由化学元素A、D、E和F组成的成分(14)将位于确定性全局特征空间(12)的特定位置处。
局部确定性特征空间(15)的创建是本发明的关键特征概念之一。局部确定性特征空间(15)的细节允许对在表征物理样本时要使用的正确的相关光谱线信息进行搜索、自学习和自监督。例如,由元素A、D、E和F组成的成分(14)将位于全局特征空间的特定位置处。A、D、E和F的主要光谱特征周围的光谱线中的变化是由于以下原因:i)这些元素可借以形成分子基础的分子重排/结构和组合;ii)由相同元素的不同分子组合组成的非均质材料;iii)将增加或减少来自纯离子元素的预期线并且在击穿期间呈现瞬态分子离子的不同分子构型和结构的等离子体分子击穿动态;iv)基体效应,其中每条光谱线的强度通过在等离子体中吸收和传播能量而受影响;以及v)压力和温度的峰展宽效应。
除了识别存在于物理样本中的成分之外,本文公开的方法还能够量化同一所述物理样本中的成分。图4中针对特征空间(12)的给定区域解释成分量化过程,所述给定区域表征具有成分元素A、D、E和F的物理样本的化学元素光谱线(14)。
由先前元素组成的任何特定分子结构提供不同的动态和LTE等离子体击穿光谱线指纹,其中强度进一步受激光功率函数、基体效应、压力和温度(在本文档中,将所有这些称为‘测量环境’)影响。为了量化在给定测量环境内排列成特定分子结构的化学元素的特定组合,应使光谱线、其强度和对应的干扰与成分的浓度关联。此外,应使用特定元素的专有或干扰光谱线并且在分子或复杂成分的情况下应使用独特光谱线进行量化。
使用图4所描绘的实例,化学元素A、D、E和F的分子组合占据确定性全局特征空间(12)的特定区域。在此假设下,使用A、D、E和F的专有和干扰光谱线构造局部确定性特征空间(15),并且通过分析未知样本(16)与其样本点邻域、给定光谱线及其强度之间的关系来进行量化。
为了量化局部特征空间内部的元素A,所提出的方法搜索特征空间中使与元素A浓度关联的未知样本点(16)与最少量相邻点之间的协方差最大化的方向,以便找到统计上一致的协方差方向(17),也就是说,给定已知样本光谱带的数据库和对应元素浓度,有可能找到可维持未知样本中的A的量化的样本(最少量相邻样本点)。
如果未知样本(16)在置信区间限制(20)内部,则可进行浓度预测。可将任何未知物理样本的可预测性评估为与协方差方向(17)的误差距离(19)。当未知样本点(16)在置信区间(20)外部(18)时,所述方法输出无法预测准确的成分量化。
图4呈现本发明的另一关键原理:使量化准确性最大化的对相邻样本和光谱线信息的选择。一旦找到协方差方向,所述方法就通过进行样本选择和光谱信息的正交过滤(21)(与期望预测正交的过滤效应)两者来进一步优化与量化相关的相邻样本点和光谱线的最小数量。此类操作允许去除不对成分A进行量化的等离子体发射信息,从而允许人工解译(22)。例如,在构型A、D、E和F下,A的量化由A的两条专有线的正贡献(23)、A的一条独特的‘基于环境的’线的正贡献(23)以及干扰线AF的负贡献(23)给出。本领域中受过训练的人类观察者应理解:正在使用正确的信息进行量化,因为A贡献是非负的,并且对F的干扰随着A浓度的增加而降低AF线的强度。不预期A专有线的负贡献。然而,如果观察到统计上有效的关系,则人类可通过仅分析最少量相邻样本光谱信息来进一步研究等离子体击穿过程期间的原因。
图5呈现分类和识别方法的视觉演示。通过非线性分类器(即非线性逻辑边界(24))在全局确定性特征空间(12)中进行样本分类。一旦未知样本点(25)在包含于非线性逻辑边界(24)内的类别内部,则通过极端支持辨别样本(26)所支持的局部逻辑回归得到属于特定成分类别的概率。一旦属于特定类别的概率高于阈值,则通过以下方式来实现识别过程:将未知物理样本的提取光谱线与特定类别的对应相邻点进行匹配(27),从而识别成分、分子结构或状态两者。
图6呈现用于全局特征空间构造的不同方法的说明。等离子体发射是动态的,并且对于特定构型,以张量格式L(S,λ,t)存储。在一种实现方式中,在LTE下的等离子体发射数据(29)中,仅使用LTE下的信息X(S,λ)通过使与给定特定成分的协方差最大化的基变换(例如SVD、傅里叶、小波、曲波)来构建特征空间
在另一种实现方式(30)中,通过分层多块特征空间信息融合来合并动态信息。使用一系列时间步处的不同的光谱线来使每个块X1、X2、X3…Xn(S,λ.)与成分浓度或样本分类的协方差最大化,以便将每个块特征空间的信息融合到合并等离子体发射动态的单个全局确定性特征空间中。
在其他实现方式中,通过张量分解方法合并动态信息。在Tucker 3D方法(31)中,通过Tucker3D技术来分解张量L(S,λ,t):
L(S,λ,t)=∑R∑Q∑(P)Gr,q,p·Ai,p·Bj,q·Ck,r+ES,λ,t
其中,A(S,P)、B(λ,Q)和C(t,R)是正交的,并且可独立分析,并且可与G(r,q,p)组合以通过样本关系A(S,P)→G(R,Q,P)→B(λ,Q)、C(t,R)得到确定性全局特征空间从而保留所有动态光谱信息。
在第二方法中,通过PARAFAC方法来分解张量L(S,λ,t):
L(S,λ,t)=ξr,r,r·Ai,r*Bj,r*Ck,r+Ei,j,k
其中,A(I,P)、B(J,Q)和C(K,R)是非正交的,并且ζ(r,r,r)是相关联的本征值。通过使用一组相关的本征值维度ζ(r,r,r),可使用A(S,R)、B(λ,R)和C(t,R)构造全局特征空间,如在先前技术中一样。对于所有以上构造确定性特征空间构造,量化、分类和识别是等同的。
提供了本发明的基本和高级关键概念,现在参考附图为权利要求提供详细支持,现在使用算法和结果来提供详细支持。
图7呈现用于实现量化、分类和识别的主要工作流程。提供了新的未知等离子体发射光谱X(λ,t)或X(λ)(33),所述过程开始于通过确定像素强度的局部最大值来获得光谱峰(34)。对于这些峰(34),使用每个局部最大值的相邻像素进行高斯拟合。使用不重叠的峰(p<10-12)通过对应的半极大处全宽度(FWHM)确定均值光谱分辨率。
光学分辨率确定:i)可使用的光谱线数据库;以及ii)用于在亚光分辨率下从物理光谱提取光谱线的最佳去卷积参数。光谱线数据库根源在于特定光学分辨率,因为这些是使用利用提升的Richardson-Lucy算法微调的去卷积参数得到的。本发明与针对给定固定光谱分辨率的现有光谱线数据库协作,从而确定确定性特征空间(12,46)和构成人工智能知识库的样本点。所述数据库存储:I)多种成分在LTE下的光谱线或动态等离子体发射的光谱线;ii)对应的成分浓度;iii)成分化学结构和命名;以及iv)成分分类。
因此,一旦记录了未知的物理样本等离子体发射光谱,第一步骤就是通过以下方式确定光学分辨率(33-37):
i.通过确定局部最大值来获得光谱带峰(33);
ii.对每个峰执行高斯函数拟合(34);
iii.确定独立光谱线(p<10-12)的FWHM;
iv.将均值FWHM确定为光谱分辨率(36);以及
v.鉴于所述光谱分辨率:a)确定应使用什么光谱线数据库来构建特征空间和知识库;以及b)Richardson-Lucy迭代和提升步骤的数量。
第二步骤包括提取光谱发射线(波长和强度)(43)。
可使用等离子体发射光谱的去卷积来最小化峰展宽的影响,以便减轻以下各项的影响:i)自然展宽;ii)热效应;iii)多普勒效应;以及iv)碰撞展宽;使得可在亚光分辨率下准确地提取光谱线。
这些效应(以高斯(G)线型和洛伦兹(L)线型为主)的卷积产生给定的特征福格特分布线型:
其中:
对于给定的数据库,高斯方差(σ)和洛伦兹比例因子(γ)是预先确定的,并且卷积进行平衡以校正峰展宽在动态等离子体发射测量结果中的影响。
去卷积之后,通过以下方式获得未知光谱线:
i.确定每个光谱带的局部最大值(34);
ii.通过对每个光谱带进行高斯拟合以提取拟合的平均波长(λ)来提取亚光光谱线;
然后,通过以下步骤确定专有和干扰光谱线(42):
1.在所记录的未知样本线之间:如果通过平均测试给出的邻近去卷积光谱带的干扰p值低于阈值(例如,p<0.05),则将光谱线的波长和强度存储为样本专有的;另一方面,如果发生干扰,则存储其平均波长和强度。针对每条所提取线,存储波长、强度和分辨率(FWHM),其中:i)LTE作为波长/强度向量λ=[λ1,λ2,…λn|FWHM];以及ii)动态等离子体发射X(λ,t|FWHM);然后,
2.在所提取光谱线之间,通过在对应的FWHM区间内针对每个λi或Xi寻找直接对应性来确定λ或X(λ,t|FWHM)和数据库光谱线。如果存在直接对应性,则可将向量λ=[λ1,λ2,…λn]和X(λ,t)使用λ=[λ1,λ2,…λn|λ空]和X(λ,t|λ空)直接投影到确定性特征空间中,其中λ空在不存在的光谱线处为空。如果找到新的独立光谱线,则将新的线(λ新)添加到数据库,其中先前的成分样本取空值。
参考构造确定性特征空间的过程(44-46)。此操作的第一步骤是将数据库光谱线组织到专有光谱线、干扰光谱线和独特光谱线中(44)。将成分专有光谱线直接分派为确定性特征空间变量,而通过使用例如λ1、λ2、λ3→λint的均值波长将干扰线折叠到相同的特征空间变量中。使用与未知样本相同的标准进行波长干扰折叠,并且此操作的最终结果是可使用在给定光谱分辨率下提取的光谱线的定义来构造确定性特征空间,即LTE下的λ=[λ1,λ2,λ3…λn]或动态等离子体X(λ,t),其中λ=[λ1,t1,λ2t1,λ3t1,…,λ4t2,λ5t2,λ6t2…λn](45)。此操作为构造确定性特征空间和对应的自学习人工智能知识库提供预处理数据。
先前步骤(33-45)中的任一个确保数据库中光谱线数据的正确提取和组织,其中光谱线由现在可被认为是确定性变量的专有光谱线和干扰光谱线组成。这是因为专有光谱线直接提供存在于等离子体中的特定离子元素的确定性识别,并且等离子体发射动态中的专有线和序列是关于分子击穿的确定性信息,其提供关于样本成分的分子结构的信息。此外,干扰光谱线提供关于成分量化的信息,因为光谱干扰强度与等离子体中的成分的浓度有关。
确定性特征空间T(12)由使与物理样本成分Y的协方差最大化的向量基限定。成分(Y)是针对每个对应物理样本的成分浓度所提供的矩阵。可考虑特殊组成情况,诸如:i)纯元素;ii)纯分子;iii)元素和分子混合物;以及iv)复杂样本(例如地质和生物样本)。此外,特定成分组成组合情况提供允许其分类Y→I的独特光谱指纹,其中I存储每种类别的概率。
考虑样本光谱线X(S,λ)或L(S,λ,t)及其对应组成Y的数据库。两者可以基W和C分别变换(例如核、导数、傅里叶、小波、曲波)成特征空间F和K,使得F和K的局部潜在方差T和U之间的协方差最大化:
f(w,c)=argmax(ttu)
其中:f=twt;并且k=uct并且受制于:wtw=1并且ctc=1。通过应用拉格朗日乘子法来解决优化问题,将其恢复为:
KtF=WΣCt
这是KtF的奇异值分解,其中w=W[1,],c=C[1,],且相关联的协方差为Σ[1,]。可进一步得出结论:FtKKFtw=ρw并且KtFFtKc=ρc。因此,w和c是Cov(F,K)=Cov(K,F)的特征本征向量,以潜在空间ttu表示,其中w和c产生协方差几何的特征尺寸。此类奇异值分解提供用于寻找矩阵的本征向量和本征值。
由于等离子体发射光谱线携带关于成分组成的直接信息,因此预期在X(S,λ)或L(S,λ,t)→F和Y→K的理想变换之后,F和K携带相同的信息,即t=u,因此最大化f(w,c)=argmax(ttu)。这意味着光谱信息和组成共享共同的特征本征结构或几何。
为了研究ttu的几何,本征向量的标准正交基w和c是必要的,使得针对每个局部F,可得到其局部特征维度和几何。这通过F和K的降阶来实现:
Fi+1=Fi-tiwi t
Ki+1=Ki-uici t
其中,ti=Fiwi,ui=Kici,并且wi=wi/||wi||,ci=ci/||ci||。
直到F或K的最大秩为止的循环降阶允许通过解译ti、wi及其与针对每个本征向量所捕获的协方差Σ有关的对应重要性来确定协方差的几何及其复杂性,其中连续降阶组成确定性特征空间,T=[ti|T]且U=[ui|U]。如果假设f(w,c)=argmax(ttu)的最优最大化,那么:
Fi+1=Fi-tipi t
Ki+1=Ki-uiqi t
其中p和q由以下方程确定:pi=Fi tti(ti tti)-1以及qi=Ki tti(ti tti)-1。可建立K与F之间的最优线性关系:F=Kβpls+e,其中:βpls=W(PtW)-1Q,是偏最小二乘回归系数。
因此,确定性特征空间T对于K和F两者来说等同的,并且因此,通过将任何新的光谱信息投影到T中,可建立与组成的接直对应性。图6例示针对以下获得T的方式:i)LTE下的等离子体发射,其中将数据库光谱信息X(S,λ)直接变换成F(29);ii)将动态L(S,λ,t)展开成X(S,λt)并将其变换成F(30);iii)使动态L(S,λ,t)经受Tuker3D分解(31),并且将A(S,R)变换成F;以及iv)使动态L(S,λ,t)经受Parafac分解(32),并且将A(S,R)变换成F。
这种方法解决寻找以下确定性特征空间T的问题,所述确定性特征空间T在F与K之间保持相同的本征结构或几何,其中t≈u,将X(S,λ)、A(S,R)看作输入。通过X(S,λ)或A(S,R)的标准正交基分解(例如奇异值分解、傅里叶、小波、曲波)执行初始化。也可以使用非正交分解,一旦分解后,就通过奇异值分解来强制执行基的正交化。步骤1启动F和K的n个随机群体。当不使用特定基向量时,Fi=0或Ki=0。步骤2确定Fi和Ki的每个组合之间的协方差。在步骤3中,使用提供t'u的最适值的Fi和Ki对来执行下一代Fi和Ki的交叉。重复步骤2和3允许使Fi和Ki的群体稳定。在步骤5中,将所有向量基级联到空间F和K中。在这些空间空间中,仅提供ttu~ttt的降阶被认为具有ttu一致性,并且被认为在光谱线与组成之间具有确定性对应性。这些分别是最终确定性特征空间F和组成空间K。
这种方法在基变换成F和K的整个过程中提高光谱(X(S,λ)或L(S,λ,t))与成分数据Y之间的信息的一致性。当F=WfΣf Cf t=TfCf t并且K=WkΣk Ck t=UkCk t时,F和K具有相似的本征结构,因此通过本征结构中的相似性强制执行f(w,c)=argmax(Tf tUk)。处理复杂多维本征结构时的另一个重要度量是度量特征空间复杂性的方式。如果考虑具有指数衰减Σ=Σr+(Σ1-Σr)e-ki的光谱信息的本征结构的几何,其中r是秩本征值并且k是指数衰减,则数据集的复杂性(ξ)可限定为:ξ=npc/(k·r)。本发明的以下方法旨在降低全局本征结构的复杂性,使得可使用较低秩的数据来执行自学习的预测,并且提供可进行人工解译和针对现有人类知识进行认证的信息。
参考图4中的步骤(46-47)以作为进行以下操作的主要里程碑:针对给定的未知样本点进行协方差定向搜索,在确定性特征空间(12)中提供局部相邻样本点,使得找到构造局部确定性特征空间(15、45)以及对应的量化、分类和识别(48)所必需的光谱信息。
这种方法提供对未知样本光谱的协变样本点相邻样本点的搜索,所述协变样本点相邻样本点被投影到已知特征空间F的潜变量中。它开始于围绕所投影的未知Tu以半径r限定搜索圆。在此圆内,所述方法限定具有搜索体积v的方向d的数量n。通过以下各项评估搜索方向适合度:已知样本点的预测误差、Tu的可预测性以及降阶的数量npc。所述搜索体积是沿着搜索方向的搜索体积。
i.已知样本点的预测误差(ei):已知预测误差是已知样本点在F与K之间的协方差一致性的度量,如果是这样的话,则已知信息中存在执行预测的一致性;
ii.Tu的可预测性:如果所投影的Tu在协方差置信区间内,则它意指未知样本属于相同的协方差样本点群组,具有相同的F和K的本征结构和对应性T和U,因此使用过去的知识进行预测是可能的。
iii.降阶次数(npc_max):较低的降阶次数使用较少维度提供协方差信息,也就是说,关于T与U之间的已知样本点协变的信息汇集到提供局部群组一致性的特定特征中。
这种方法可分为2个不同的步骤:
步骤1.通过对每个搜索体积内部的样本点执行偏最小二乘回归并且评估预测误差(ei)、可预测性(p)和npc,找到最佳搜索方向。如果搜索方向不满足所有这些标准,则重组最佳结果(例如进化方法)以优化新的搜索方向,直到找到合适方向为止。
步骤2.通过对方向样本点进行进化搜索(例如单纯形)来最小化协方差方向上的样本的数量,直到建立匹配预测误差(ei)、可预测性(p)和npc的已知样本点的稳定群体,来最小化搜索体积。标准。
参考图7中的程序47-49。在选择最佳相邻样本点之后,仅考虑对应样本点等离子体发射光谱的专有光谱线和干扰光谱线来构建局部确定性特征空间(47)。通过以下方式获得确定性局部特征空间:将前面描述的程序应用到对应的局部X(Sl,λl)或L(Sl,λl,t)以将其变量变换为局部确定性的Fl和Kl,其秩明显低于原始确定性特征空间且其协方差结构更简单。
尽管F和K变换以及相邻样本点选择显著减少组成不相关的信息的量,但是由于散射和非线性等离子体发射效应(诸如烧蚀过程和等离子体屏蔽),仍然存在组成不相关的信息。这些仅影响线发射强度,并且在理论上难以针对这些影响得到信号校正,因此采用了正交过滤。图4(22)示出挑选最小数量的相邻样本点和变量如何允许降低原始数据的复杂性,通过组合样本和变量,原始数据集X1至X4减缩为一个优化的数据集X。
可通过去除与组成信息正交的系统变化来进一步优化光谱信息,使得:
F=TPt+ToPt o
K=TQt+UoQt o
其中T是使协方差最大化的共享F与K之间的共同信息的潜在变量。To和Uo是正交信息;即,To⊥K并且Uo⊥F。
在此阶段,预期正确的特征空间变换导致并且样本邻域导致ToPt o→0并且F=TPt。
理想地,UoQt o也应为零。具有分析级质量的任何量化都不应具有与其对应的光谱信息正交的任何系统变化。当UoQt o显著时,这意指自学习系统不能得到适当的训练以提供准确的预测,因为原始训练信息存在系统误差或未包含在光谱中的信息。在适当条件下,ToPt o→0且UoQt o→0,并且T≈U且不需要降阶,这意味着信息在光谱与组成之间直接相关。
然而,在许多情况下,ToPt o仍然是显著的,这意指特征变换步骤在仅隔离系统组成信息方面并不完全有效。这些情况通过以下方式来校正:对F和K中的信息进行正交过滤,诸如Fcoor=F–ToPt o并且Kcoor=K-UoQt o,从而产生通过可能的人类交互和解译两者执行量化的局部模型。
关于对确定性特征空间中的样本进行分类和识别的过程,请参考图5,所述过程通过以下步骤计算整个特征空间中的类别之间的非线性逻辑边界:
·确定两种类别之间的给定边界的支持辨别样本(26);
·赋予每个类别布尔值以代替组成(Y);
·执行先前描述的方法以确定局部线性逻辑多变量线性模型;
·沿着边界重复所述过程(i至iii),并且将连续模型存储为非线性逻辑边界,并且通过以下方式预测未知样本的分类:
ο如果到特征空间中的投影在特定类别边界内部,则将其分类为属于对应的分类;
ο如果投影位于两个或更多个类别的边界内(即,在支持辨别样本(26)之间),则使用相邻支持样本点来构建局部逻辑模型以确定类别概率。
关于执行成分(诸如元素以及分子离子和分子结构)的识别,同样参考图5。元素离子通过匹配专有光谱线或通过特定环境的光谱线强度的秩匹配来直接识别。分子及其结构预测通过针对分子在样本分类结果的相似环境下的纯光谱进行秩匹配来执行。秩匹配有两个主要步骤:i)对于边界类别环境内部的每个分子,按光谱线的强度对其进行排名,并且如先前所描述确定对应的专有光谱线和干扰光谱线;以及ii)针对相等或相似的秩距离对未知样本进行搜索:搜索光谱中是否存在特定分子的所有光谱线,如果为真,则:a)如果发现专有光谱线,则识别所述分子和对应结构;并且如果不是这种情况,则b)确定未知样本与已知分子之间的秩距离。这种方法输出特定未知样本的所有阳性识别,以及与不完全匹配的秩距离。
所提出的方法的另一个优点是人工解译。参考图4(22),其中人类专家可解译自学习系统为何在包含A、D、E和F元素的分子的环境下选择专有光谱线、基于环境的专有光谱线和干扰光谱线来量化A元素。在某些情况下,诸如对于痕量元素,可找到共线性量化,并且应根据样本的环境仔细解译存在于量化中的专有线,因为使用元素之间的共线性信息具有假阳性/阴性量化的风险。为了正确地诊断,用户可访问局部确定性特征空间,并且验证所选择相邻样本点的可预测性以作为基于环境的共线性一致性的度量。用户可固化自学习量化和分类的另一种方式是比较模型系数相对于原子光谱发射线的相关性(Kramida等人,2018年)。每种元素最强烈的发射线通常是具有较高跃迁概率的发射线,并且到基态的跃迁应存在于显著的强度下。此外,基态跃迁通常是专有发射线。用户还可使用等离子体发射模拟理论模型来使用萨哈电离平衡公式和波尔兹曼分布针对对应于已知相邻样本中的浓度的离子丰度分布对离子群体进行估计,以进一步固化并且降低假阳性和阴性的可能性。
人类用户可通过表1中呈现的指标进一步访问特征空间的分析和诊断,以用于访问:
i.由遵循这种协方差模式的样本点的数量对局部方向的统计表示;
ii.潜在可变比率,其用于诊断方向复杂性和代表性
iii.复杂性衰减率:方差或协方差本征向量沿着正交降阶衰减的速率:
iv.复杂性:通过表征维度数量、衰减率和样本点的数量给出的给定数据集的几何复杂性:
v.PRESS:预测残留误差平方和;
vi.特征空间和组成空间的共线性;
vii.模型方差:模型预测中所使用的方差的量;
viii.预测方差:预测K方差或量化/分类信息
ix.光谱不相关信息:不对给定的组成或分类信息进行量化或分类的信息
x.组成无关信息:组成数据中未包含在光谱中的信息;以及
xi.F与K信息之间的可解释协方差。
人类还可解译以下信息:
i.潜在空间基P:直接对与K的协方差有贡献的光谱线和相对重要性,即成分及其浓度;
ii.潜在空间基Q:与光谱信息直接相关的组成或分类信息,即光谱线波长和强度;
iii.潜在空间基Po:与组成信息无关且因此应作进一步研究以进行识别的的光谱线;
iv.潜在空间基Qo:未反映在光谱信息中且因此用户可设计进一步研究以了解产生此类影响的原因的组成;
v.潜在空间坐标To:应执行量化以使得自学习系统可提供预测的样本群组簇。
vi.潜在空间坐标Uo:发现不具有光谱信息的样本群组(诸如,仅具有痕量元素的样本),以提供有关如何改进物理测量的信息。
借助于所提供的所有信息,人类可理解自动化自学习系统是否正确运行,以及解译复杂的光谱信息。
实施例
A.元素识别和量化
通过对以下真实矿石的两个案例研究呈现LIBS矿物和元素识别:i)来自Bejanca矿(葡萄牙,Vouzela-Viseu)的钨锰铁矿;ii)来自Gelfa(葡萄牙,Gelfa)的锂。图8呈现来自Bejanca矿的典型的包含钨锰铁矿的矿石(51)。钨锰铁矿矿物(黑色)封闭在石英中。钨锰铁矿由铁和钨组成。来自铁和钨的专有峰位于200nm与400nm之间(52)。两种元素在这些波长中具有显著的光谱线,因此需要高分辨率光谱仪和亚光光谱线提取来对其进行解析和识别。53中是包围钨锰铁矿的石英的LIBS光谱。石英主要是硅,但是它示出一些铁含量。在石英矿物中未发现钨。石英和钨锰铁矿两者均展现出显著不同的光谱指纹,这使得很容易使用LIBS光谱技术对其进行分类和辨别。
图9呈现来自葡萄牙Gelfa的锂矿石的LIBS表征(54)。在此实施例中,锂矿脉由石英包围。锂矿脉的LIBS光谱在锂带610.20nm处展现出极高的发射(55),这是来自锂的专有光谱线。相同的峰存在于周围的石英中,但是由于在显微镜下可能观察到的流体夹杂物,其强度低得多。本文公开的发明允许成功地识别锂矿脉中的锂的存在,从而在矿脉与周围的石英之间进行辨别。
参考表2,其呈现锂矿石的锂量化基准。使LIBS锂量化以锂光谱线强度为基准,并且研究锂浓度。610.20nm被证明与锂浓度保持统计学上相关的关系。结果显示无法正确地预测较低锂浓度的校准模型中的高方差。使用全光谱干扰可提高准确性。开发多变量偏最小二乘模型。尽管减小了偏差和方差,但是PLS模型仍然高估了低浓度锂矿物(见表1)。结果表明:LIBS光谱线强度与元素浓度的对应性是高度非线性且多尺度的现象,因为线性模型不能够提供LIBS光谱技术中的分析质量偏差对方差量化。
盲测给出明显证据:在620nm处的线强度下获得的线性模型和多变量PLS模型低估矿脉中的锂含量,并过度高估周围石英中的锂含量(见表2)。本发明中所提出的方法能够正确地估计石英中的锂的量,其被示出为低于1%(表2)。
此外,表3中呈现使用本发明的方法对以下元素进行的盲测预测:Al、Si、Li、Fe、Na、K和Rb。可观察到,在标准化浓度(%)范围内,相关性非常显著,并且预测误差非常小。
图10所例示的另一个实施方案中呈现狗血(57)和猫血(58)(作为复杂生物样本的参考)中的Na、K、Fe和Mg的识别和量化,重点在于等离子体诱导光谱技术在兽医和人类保健中的应用。
图11所呈现的另一个实施方案中是锂辉石(LiAlSi2O6)(59)和透锂长石(LiAlSi4O8)(60)的识别。这些锂晶体在它们的组成上具有相同的元素,因此共享Li、Al、Si和O的主要离子光谱线。不同的晶体结构在等离子体形成期间产生每种晶体的专有光谱线,这在图11中由圆圈呈现。这些光谱线用于识别矿物或矿石样本中的晶体的类型,并且可用于对进行矿物纯度进行量化和分类。
如本领域技术人员将清楚的,本发明不应限于本文描述的实施方案,并且保持在本发明的范围内的多种改变是可能的。
当然,上文所示出的优选实施方案可以不同的可能形式进行组合,在此避免了重复所有这样的组合。
表1.对特征空间的人类交互诊断
表2.锂矿石中锂的量化。
表3.地质标准盲样中铝、硅、铁、钠、钾和铷的量化。
参考文献
Kramida,A.,Ralchenko,Yu.,Reader,J.and NIST ASD Team(2018).NIST AtomicSpectra Database(version 5.5.6),[Online].Available:https://physics.nist.gov/asd[Tue May 29 2018].National Institute of Standards and Technology,Gaithersburg,MD.
D.W.Hahn and Omenetto N.Laser-induced breakdown spectroscopy(libs),part i:review of basic diagnostics and plasma-particle interactions:still-challenging issues within the analytical plasma community.Appl Spectrosc.,64(12):335--66,2010.
A.Cousin,O.Forni,S.Maurice,O.Gasnault,C.Fabre,V.Sautterd,R.C.Wiense,and J.Mazoyera.Feasibility of generating a usefullaser-induced breakdownspectroscopy plasma on rocks at high pressure:preliminary study for a Venusmission.Spectrochim.Acta Part B,59:987-999,2011.
Claims (15)
1.一种用于根据物理样本的电磁光谱信息表征这种物理样本中的一种或多种成分的方法,每种成分由化学元素和/或其同位素、分子和/或其构象或状态中的一者或其组合组成,所述方法包括以下步骤:
●获得对应于所述物理样本的电磁光谱信息、优选地包括一个或多个电磁光谱的分辨率,
●在对应于所述光谱信息的所述光谱分辨率是亚光光谱分辨率的情况下,从所述电磁光谱信息提取一条或多条光谱线,
●将所述光谱线投影到确定性特征空间的样本点中,这种确定性特征空间由多维向量空间组成,所述多维向量空间包括具有预先确定的向量基的多条光谱线,这种具有预先确定的向量基的多条光谱线:
○存储在数据库中并且已经通过亚光光谱分辨率提取获得,并且
○对应于多种已知成分,
其中所述多维向量空间的每个维度都是所述电磁光谱信息所对应于的所述物理样本中的所述一种或多种成分的预测特征,这种预测特征提供对所述物理样本中的一种或多种成分的量的确定、分类和/或识别。
2.根据前一权利要求所述的方法,其中所述方法还包括以下步骤:
●在所述确定性特征空间内选择对应于已知成分量的最少量的相邻样本点,使得所投影样本点使与所述对应的最少量的相邻点的协方差最大化,
●根据所述最小量的相邻点选择专有光谱线、干扰光谱线和独特光谱线,从而得到所述相邻样本点内的局部特征空间,以及
●通过考虑将要量化的所述物理样本的投影到所选择相邻样本点的协方差特征空间中的光谱线来关联来自所述局部特征空间的所述已知成分,来预测来自将要量化的所述物理样本的所述成分的量化。
3.根据前述权利要求中任一项所述的方法,其中所述方法还包括以下步骤:
●通过确定所投影样本点是否在所述确定性特征空间的预先确定的区域内,在所述确定性特征空间内选择最少量的相邻样本点,使得此类相邻样本点属于特定类别,这种区域由非线性逻辑边界界定,以及
●针对定界在所述区域内部的所述最少量的相邻样本点,选择专有光谱线、干扰光谱线和独特光谱线以得到局部特征空间,从而在所述相邻样本点和所述样本点内提供匹配。
4.根据前一权利要求所述的方法,其中所提及的非线性逻辑边界是根据以下方式得到的:
●使用成分的能从所述数据库获得的所有现有光谱线作为变量来将所述确定性特征空间声明为矩阵;
●对所述先前矩阵执行分解,这种分解使得其提供搜索并且使所述成分的协方差最大化,从而确定产生所述确定性特征空间的多维向量空间,优选地以下中的一者:奇异值分解、傅里叶、小波或曲波变换;
●将光谱信息投影到所述多维向量基、即所述确定性特征空间的样本点中;
●在所述确定性特征空间中限定多个搜索方向;
●限定包含在所述特征空间内的多个定向搜索体积,每个定向搜索体积被限定为所述特征空间的包括所述所投影样本点的区域,所述区域沿着搜索方向延伸搜索长度,其中所述搜索方向由逻辑函数限定;
●使用对应于所选择方向的所选择定向搜索体积内的所投影样本点作为所选择的最小量的相邻样本点来选择对应预测模型具有对将要分类的成分的分类或识别的最大可预测性的所述搜索方向;
●确定与所述预测模型的距离并且限定维持所述非线性逻辑边界的支持辨别样本;
●确定极端支持辨别样本,并使用对应于所选择方向的所选择定向搜索体积内的所投影样本点作为所选择的最小量的相邻样本点来选择对应预测模型具有对将要分类的成分的分类或识别的最大可预测性的所述搜索方向;
●递归地执行所述先前操作,直到针对特定类别确定全部所述非线性逻辑边界为止。
5.根据权利要求3至4中任一项所述的方法,其中在所述光谱分辨率是亚光光谱分辨率并且所述样本点在所述非线性逻辑边界内部的情况下,进一步根据以下方式获得所述样本中的成分的量化:
●在特定分类的条件下,通过确定专有光谱线、干扰光谱线和独特光谱线来获得相关线;
●使用由所述确定性特征空间给出的所述特定分类的所述专有光谱线、所述干扰光谱线和所述独特光谱线组编成局部特征空间,所述局部特征空间由所述确定性特征空间的子空间组成;
●验证所述样本点是否具有预先确定的相关光谱带,即所述专有光谱线、所述干扰光谱线和所述独特光谱线;
●如果所述样本点具有所述专有光谱线、所述干扰光谱线和所述独特光谱线,则使用所述相邻样本点作为对使用非贡献等离子体效应的正交过滤进行量化的局部多变量模型的支持,从而使协方差本征向量最小化,直到获得所述子空间的一组相关的相邻样本点和光谱线为止;
●使用所述预先确定的局部多变量建模来执行所述物理样本的成分的量化。
6.根据权利要求3至4中任一项所述的方法,其中在所述光谱分辨率是亚光光谱分辨率并且所述样本点在所述非线性逻辑边界内部的情况下,进一步根据以下方式获得所述物理样本中的成分的量化:
●在特定分类的条件下,通过确定专有光谱线、干扰光谱线和独特光谱线来获得相关线;
●使用由所述确定性特征空间给出的所述特定分类的所提及的专有光谱线、干扰光谱线和独特光谱线组编成局部特征空间,这种局部特征空间由所述全局特征空间的子空间组成;
●验证所述样本点是否具有预先确定的局部特征空间光谱带;
●通过特定元素及其对应的离子/同位素的专有光谱线来对其进行识别;
●通过将所述物理样本的特定分子及其构象或离子的专有光谱线、干扰光谱线和独特光谱线与来自所获得的所述成分光谱线数据库的预先确定的特定光谱线进行匹配,来识别所述特定分子及其构象或离子;
●通过鉴于所述局部特征空间的所述相邻样本点与所获得的所述数据库进行匹配,来识别等离子体击穿期间的特定离子重排,即特定化学结构、构象/状态和/或成分由于来自所述物理样本的等离子体内部的化学反应导致的特性;
●基于所述样本点邻域的专有光谱线、干扰光谱线和独特光谱线的线强度数量级,提供匹配指数;
●如果存在匹配,则提供隐含在所述物理样本中的至少一种化学结构。
7.根据前述权利要求中任一项所述的方法,其中所提及的电磁光谱信息是根据等离子体诱导光谱方法、优选地激光诱导击穿光谱技术(LIBS)获得的。
8.根据前一权利要求所述的方法,其中所提及的电磁光谱信息包括在一定时间流逝内的随时间的光谱信息变化,所述等离子体诱导光谱方法在这种时间流逝期间已经对所述物理样本产生影响。
9.根据前一权利要求所述的方法,其中所提及的随时间的变化是离散的,所述电磁光谱信息因此包括多个电磁光谱,每个光谱对应于所提及的时间流逝中的瞬间,由此针对所述多个光谱中的每个光谱提取光谱线,从而针对每个光谱产生一条或多条光谱线。
10.根据权利要求2和8或9所述的方法,其中所提及的确定性特征空间是通过分层多块技术或张量分解获得的。
11.根据权利要求2至10中任一项所述的方法,其中在所述特征空间内选择所述最少量的相邻样本点还包括:
●使用成分的在所述数据库中能获得的所有现有光谱线作为变量来将所述确定性特征空间声明为已知物理样本的矩阵;
●对所述先前矩阵执行分解,这种分解使得其提供搜索并且使所述成分的协方差最大化,从而确定产生所述确定性特征空间的多维向量空间;
●将光谱信息投影到所述多维向量空间、即所述确定性特征空间的样本点中;
●在所述确定性特征空间中限定多个搜索方向;
●限定包含在所述特征空间内的多个定向搜索体积,每个定向搜索体积被限定为所述特征空间的包括所述所投影样本点的区域,所述区域沿着搜索方向延伸搜索长度;
●针对每个所述搜索方向和对应搜索体积计算多个对应的预测模型,特别地,此类预测模型对应于样本之间的协方差的最大化和成分量化;
●使用对应于所选择方向的所选择定向搜索体积内的所投影样本点作为所选择的最小量的相邻样本点来选择对应预测模型具有对将要量化的成分的量化的最大可预测性的所述搜索方向;
并且,优选地:
●在所述光谱信息由单个电磁光谱组成的情况下,所述分解通过以下各项中的一者获得:
○奇异值分解、傅里叶、小波、曲波变换,
●和/或在所述光谱信息由多个电磁光谱组成的情况下,所提及的矩阵由张量或n展开矩阵组成,并且所述分解通过以下各项中的一者获得:
○tucker3D、PARAFAC或通过分层多块时间进程分解展开所述张量,●并且继分解之后,使用以下各项执行信息压缩:
○对通过所述张量分解、诸如Tucker3d或Parafac给出的时间光谱空间的奇异值分解、傅里叶、小波、曲波变换,以压缩所述确定性特征空间。
12.根据权利要求2至11中任一项所述的方法,其中所述方法还包括以下步骤:
●确定与选择用于成分量化、分类或识别的所述最少量的相邻样本点相关联的预测误差分布;
●鉴于所述物理样本的所投影光谱线,通过确定对应于选择用于成分量化、分类或识别的所述最少量的相邻样本点的协方差内的误差距离,根据所述预测误差分布获得p值;以及
●使用所计算的p值作为对所述物理样本的给定化学元素及其同位素、分子及其构象/状态和/或成分的量化、分类或识别的可预测性的度量,
由此确定所述物理样本中的所述电磁光谱所对应于的所述一种或多种成分的确定的量化或分类的可预测性。
13.一种用于表征物理样本中的一种或多种成分的具有自学习能力的计算设备,每种成分由化学元素和/或其同位素、分子和/或其构象或状态中的一者或其组合组成,其中所述计算设备被配置来实现如权利要求1至12中任一项所述的方法,所述计算设备优选地还包括能够在物理样本中诱导等离子体状态的光谱装置,所述光谱信息从所述光谱装置获得,所述光谱装置优选地由LIBS装置组成。
14.根据前一权利要求所述的计算设备,其中所述计算设备包括光谱装置,这种光谱装置优选地由从其获得所述光谱信息的LIBS装置组成,所述计算设备进一步被配置来在预先确定的时间流逝期间从所述光谱装置获得光谱信息,并由此获得由对应于所述预先确定的时间流逝中的若干瞬间的多个电磁光谱组成的光谱信息,所述等离子体诱导光谱装置在这种时间流逝期间已经对所述物理样本产生影响。
15.一种非暂时性存储介质,其包括可执行以实施如权利要求1至12中任一项所述的方法的程序指令。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PT110894 | 2018-07-31 | ||
PT11089418 | 2018-07-31 | ||
EP18187384.5 | 2018-08-03 | ||
EP18187384.5A EP3605062A1 (en) | 2018-07-31 | 2018-08-03 | A method and apparatus for characterisation of constituents in a physical sample from electromagnetic spectral information |
PCT/IB2019/056535 WO2020026165A1 (en) | 2018-07-31 | 2019-07-31 | A method and apparatus for characterisation of constituents in a physical sample from electromagnetic spectral information |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112513616A true CN112513616A (zh) | 2021-03-16 |
CN112513616B CN112513616B (zh) | 2024-06-25 |
Family
ID=63449171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980049966.5A Active CN112513616B (zh) | 2018-07-31 | 2019-07-31 | 用于根据电磁光谱信息表征物理样本中成分的方法和设备 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11692940B2 (zh) |
EP (2) | EP3605062A1 (zh) |
CN (1) | CN112513616B (zh) |
CA (1) | CA3108238A1 (zh) |
WO (1) | WO2020026165A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113315628A (zh) * | 2021-04-09 | 2021-08-27 | 中国科学院信息工程研究所 | 密钥封装方法、装置、设备及存储介质 |
TWI790793B (zh) * | 2021-10-28 | 2023-01-21 | 中國鋼鐵股份有限公司 | 液體樣品之鋰元素的檢測方法 |
CN117213631A (zh) * | 2023-09-26 | 2023-12-12 | 无锡创想分析仪器有限公司 | 一种光谱仪运行监测方法及系统 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220241891A1 (en) * | 2019-02-14 | 2022-08-04 | 6684327 Canada Inc. | Artificial intelligence-based robotized smart laser ablating systems for multi-dimensional objects |
US20210172800A1 (en) * | 2019-12-10 | 2021-06-10 | Perkinelmer Health Sciences Canada, Inc. | Systems and Methods for Analyzing Unknown Sample Compositions Using a Prediction Model Based On Optical Emission Spectra |
US20220101276A1 (en) * | 2020-09-30 | 2022-03-31 | X Development Llc | Techniques for predicting the spectra of materials using molecular metadata |
CN113177919B (zh) * | 2021-04-28 | 2022-08-05 | 成都艾立本科技有限公司 | Libs与深度学习结合的岩性分类及主量元素含量检测方法 |
GB2614237B (en) * | 2021-12-17 | 2024-04-10 | Thermo Fisher Scient Bremen Gmbh | Method of analysing a spectral peak using a neural network |
CN117332258B (zh) * | 2023-12-01 | 2024-01-30 | 奥谱天成(成都)信息科技有限公司 | 基于多尺度洛伦兹的近红外吸收峰识别方法、系统、介质 |
CN117949436B (zh) * | 2024-03-26 | 2024-06-25 | 宝鸡核力材料科技有限公司 | 应用于钛合金熔炼下的金属元素成分检测方法及系统 |
CN118364435B (zh) * | 2024-05-07 | 2024-08-16 | 浙江华电器材检测研究院有限公司 | 一种基于机器学习的谱线数据波动矫正方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1967846A1 (en) * | 2007-03-05 | 2008-09-10 | National University of Ireland Galway | En ensemble method and apparatus for classifying materials and quantifying the composition of mixtures |
US20130195327A1 (en) * | 2012-01-30 | 2013-08-01 | Canon Kabushiki Kaisha | Noise reduction processing method and apparatus for a biological tissue image |
CN105224961A (zh) * | 2015-11-04 | 2016-01-06 | 中国电子科技集团公司第四十一研究所 | 一种高识别度的红外光谱特征提取与匹配方法 |
US20160349174A1 (en) * | 2015-06-01 | 2016-12-01 | Ingrain, Inc. | Combined Vibrational Spectroscopy And Laser Induced Breakdown Spectroscopy For Improved Mineralogical And Geochemical Characterization Of Petroleum Source Or Reservoir Rocks |
CN107305187A (zh) * | 2016-04-18 | 2017-10-31 | 核工业北京地质研究院 | 一种基于激光诱导击穿光谱和线性判别的矿物识别方法 |
CN107677640A (zh) * | 2017-09-29 | 2018-02-09 | 吉林大学 | 一种基于激光诱导击穿光谱的塑料样品元素识别方法 |
WO2018060967A1 (en) * | 2016-09-29 | 2018-04-05 | Inesc Tec - Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciência | Big data self-learning methodology for the accurate quantification and classification of spectral information under complex varlability and multi-scale interference |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105352918B (zh) * | 2015-11-13 | 2018-05-04 | 湖南大学 | 基于svr的激光直接金属沉积过程元素浓度实时监控方法及装置 |
-
2018
- 2018-08-03 EP EP18187384.5A patent/EP3605062A1/en not_active Withdrawn
-
2019
- 2019-07-31 CA CA3108238A patent/CA3108238A1/en active Pending
- 2019-07-31 WO PCT/IB2019/056535 patent/WO2020026165A1/en unknown
- 2019-07-31 US US17/259,937 patent/US11692940B2/en active Active
- 2019-07-31 CN CN201980049966.5A patent/CN112513616B/zh active Active
- 2019-07-31 EP EP19766100.2A patent/EP3794332B1/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1967846A1 (en) * | 2007-03-05 | 2008-09-10 | National University of Ireland Galway | En ensemble method and apparatus for classifying materials and quantifying the composition of mixtures |
US20130195327A1 (en) * | 2012-01-30 | 2013-08-01 | Canon Kabushiki Kaisha | Noise reduction processing method and apparatus for a biological tissue image |
US20160349174A1 (en) * | 2015-06-01 | 2016-12-01 | Ingrain, Inc. | Combined Vibrational Spectroscopy And Laser Induced Breakdown Spectroscopy For Improved Mineralogical And Geochemical Characterization Of Petroleum Source Or Reservoir Rocks |
CN105224961A (zh) * | 2015-11-04 | 2016-01-06 | 中国电子科技集团公司第四十一研究所 | 一种高识别度的红外光谱特征提取与匹配方法 |
CN107305187A (zh) * | 2016-04-18 | 2017-10-31 | 核工业北京地质研究院 | 一种基于激光诱导击穿光谱和线性判别的矿物识别方法 |
WO2018060967A1 (en) * | 2016-09-29 | 2018-04-05 | Inesc Tec - Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciência | Big data self-learning methodology for the accurate quantification and classification of spectral information under complex varlability and multi-scale interference |
CN107677640A (zh) * | 2017-09-29 | 2018-02-09 | 吉林大学 | 一种基于激光诱导击穿光谱的塑料样品元素识别方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113315628A (zh) * | 2021-04-09 | 2021-08-27 | 中国科学院信息工程研究所 | 密钥封装方法、装置、设备及存储介质 |
CN113315628B (zh) * | 2021-04-09 | 2022-12-16 | 中国科学院信息工程研究所 | 密钥封装方法、装置、设备及存储介质 |
TWI790793B (zh) * | 2021-10-28 | 2023-01-21 | 中國鋼鐵股份有限公司 | 液體樣品之鋰元素的檢測方法 |
CN117213631A (zh) * | 2023-09-26 | 2023-12-12 | 无锡创想分析仪器有限公司 | 一种光谱仪运行监测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112513616B (zh) | 2024-06-25 |
EP3794332B1 (en) | 2023-03-08 |
WO2020026165A1 (en) | 2020-02-06 |
US20210270744A1 (en) | 2021-09-02 |
EP3794332A1 (en) | 2021-03-24 |
US11692940B2 (en) | 2023-07-04 |
CA3108238A1 (en) | 2020-02-06 |
EP3605062A1 (en) | 2020-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112513616B (zh) | 用于根据电磁光谱信息表征物理样本中成分的方法和设备 | |
Pořízka et al. | On the utilization of principal component analysis in laser-induced breakdown spectroscopy data analysis, a review | |
Gewali et al. | Machine learning based hyperspectral image analysis: a survey | |
Morais et al. | Comparing unfolded and two-dimensional discriminant analysis and support vector machines for classification of EEM data | |
Muehlethaler et al. | Discrimination and classification of FTIR spectra of red, blue and green spray paints using a multivariate statistical approach | |
CN111989747A (zh) | 用于预测样品中的成分的定量的分光光度法和装置 | |
Yousefi et al. | Comparison assessment of low rank sparse-PCA based-clustering/classification for automatic mineral identification in long wave infrared hyperspectral imagery | |
Díez‐Pastor et al. | Machine learning algorithms applied to R aman spectra for the identification of variscite originating from the mining complex of G avà | |
Berman et al. | A comparison between three sparse unmixing algorithms using a large library of shortwave infrared mineral spectra | |
Wu et al. | Super-resolution land-cover mapping based on the selective endmember spectral mixture model in hyperspectral imagery | |
Jinadasa et al. | Deep learning approach for Raman spectroscopy | |
Thompson et al. | Automating X-ray fluorescence analysis for rapid astrobiology surveys | |
Orts Gómez et al. | Hyperspectral image classification using Isomap with SMACOF | |
Képeš et al. | Interpreting convolutional neural network classifiers applied to laser-induced breakdown optical emission spectra | |
Cochrane et al. | A fast classification scheme in Raman spectroscopy for the identification of mineral mixtures using a large database with correlated predictors | |
Féraud et al. | Two data pre-processing workflows to facilitate the discovery of biomarkers by 2D NMR metabolomics | |
Nouri et al. | Processing of Hyperion data set for detection of indicative minerals using a hybrid method in Dost-Bayli, Iran | |
Wongravee et al. | Chemometrics as a green analytical tool | |
Courty et al. | Perturbo: a new classification algorithm based on the spectrum perturbations of the laplace-beltrami operator | |
US10176407B1 (en) | Nonlinear sparse representation-based classification for foveated analysis of spectral data with distortions | |
Nouri et al. | Improvement of the MVC-NMF problem using particle swarm optimization for mineralogical unmixing of noisy hyperspectral data | |
US12099013B2 (en) | Calibration method of a spectroscopy device comprising a plurality of sensors and of transfer of spectral information obtained from at least two calibrated spectroscopy devices | |
Patel et al. | Quantitative analysis of mixed pixels in hyperspectral image using fractal dimension technique | |
Taskin et al. | A scalable unsupervised feature selection with orthogonal graph representation for hyperspectral images | |
Duarte et al. | Non-homogeneous hidden Markov chain models for wavelet-based hyperspectral image processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |