CN117043585A - 用于化合物的基于拉曼光谱的鉴定的方法和系统 - Google Patents
用于化合物的基于拉曼光谱的鉴定的方法和系统 Download PDFInfo
- Publication number
- CN117043585A CN117043585A CN202280019130.2A CN202280019130A CN117043585A CN 117043585 A CN117043585 A CN 117043585A CN 202280019130 A CN202280019130 A CN 202280019130A CN 117043585 A CN117043585 A CN 117043585A
- Authority
- CN
- China
- Prior art keywords
- raman
- raman spectrum
- simulated
- barcode
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001237 Raman spectrum Methods 0.000 title claims abstract description 320
- 150000001875 compounds Chemical class 0.000 title claims abstract description 183
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000001069 Raman spectroscopy Methods 0.000 claims abstract description 191
- 238000005259 measurement Methods 0.000 claims abstract description 45
- 238000004422 calculation algorithm Methods 0.000 claims description 25
- 238000003775 Density Functional Theory Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000005094 computer simulation Methods 0.000 abstract description 6
- 230000003595 spectral effect Effects 0.000 description 21
- 238000001228 spectrum Methods 0.000 description 20
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 15
- 238000010586 diagram Methods 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- XDTMQSROBMDMFD-UHFFFAOYSA-N Cyclohexane Chemical compound C1CCCCC1 XDTMQSROBMDMFD-UHFFFAOYSA-N 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 3
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- YBYIRNPNPLQARY-UHFFFAOYSA-N 1H-indene Chemical compound C1=CC=C2CC=CC2=C1 YBYIRNPNPLQARY-UHFFFAOYSA-N 0.000 description 2
- 239000007993 MOPS buffer Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000004057 DFT-B3LYP calculation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005284 basis set Methods 0.000 description 1
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 231100000027 toxicology Toxicity 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J3/00—Spectrometry; Spectrophotometry; Monochromators; Measuring colours
- G01J3/28—Investigating the spectrum
- G01J3/44—Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N2021/6417—Spectrofluorimetric devices
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Spectrometry And Color Measurement (AREA)
Abstract
本发明公开了一种基于拉曼光谱仪测量和计算机仿真的模拟拉曼光谱来鉴定化合物的方法和系统。在各种实施方案中,未知化合物的拉曼条形码可从通过对所述未知化合物执行拉曼光谱仪测量而获得的拉曼光谱生成。然后,可将所述拉曼条形码与已知化合物的参考计算机仿真的模拟拉曼条形码的库进行比较,并可基于比较来确定所述未知化合物的特性。
Description
相关申请的交叉应用
本申请要求2021年3月4日提交的美国临时专利申请序列号63/156,846的优先权权益,通过引用整体将其并入本文。
技术领域
本申请涉及使用化合物的拉曼光谱且更具体地通过将化合物的所测量拉曼光谱与计算机仿真的模拟拉曼光谱的参考库进行比较来对化合物进行分类及鉴定。
背景技术
拉曼光谱术是一种光谱测量技术,其中入射到样品上的光是非弹性散射的,即散射光的频率与入射光的频率不同。频率的变化(或等效地能量的变化)是由于光与样品的化学键的低能量模式的相互作用。样品的拉曼光谱可从散射光确定,且可用于对样品进行鉴定和分类。
发明内容
以下总结了本公开的各种实施例以提供对所讨论技术的基本理解。该总结不是对本公开的所有预期特征的广泛概述,并且既不旨在识别本公开的所有实施例的关键或重要元件,也不旨在描绘本公开的任何或所有实施例的范围。其唯一目的是以总结形式呈现本公开的一个或多个实施例的一些概念,作为稍后呈现的更详细描述的导引。
本公开的各种实施例公开了一种方法,该方法包括:获得未知化合物的拉曼光谱,该拉曼光谱提取自对该未知化合物的拉曼光谱仪测量。在各种实施例中,该方法进一步包括:将获得的拉曼光谱与包含在模拟拉曼光谱库中的多个模拟拉曼光谱的参考模拟拉曼光谱进行比较。在各种实施例中,每个模拟拉曼光谱经由对已知化合物的量子力学计算来生成。该方法进一步包括:基于获得的拉曼光谱与参考模拟拉曼光谱的比较,对该未知化合物的特性进行鉴定。
本公开的各种实施例公开了一种系统,该系统包括:存储指令的非暂时性存储器和一个或多个硬件处理器,该一个或多个硬件处理器耦接至非暂时性存储器且被配置为从非暂时性存储器读取该指令以使系统执行操作。在各种实施例中,该操作包括:获得未知化合物的拉曼光谱,该拉曼光谱提取自对该未知化合物的拉曼光谱仪测量。在各种实施例中,该操作进一步包括:将获得的拉曼光谱与包含在模拟拉曼光谱库中的多个模拟拉曼光谱的参考模拟拉曼光谱进行比较。在各种实施例中,每个模拟拉曼光谱经由对已知化合物的量子力学计算来生成。该操作进一步包括:基于获得的拉曼光谱与参考模拟拉曼光谱的比较,对该未知化合物的特性进行鉴定。
本公开的各方面公开了一种非暂时性计算机可读介质(CRM),其上存储有可执行以使得执行操作的计算机可读指令。在各种实施例中,该操作包括:获得未知化合物的拉曼光谱,该拉曼光谱提取自对该未知化合物的拉曼光谱仪测量。在各种实施例中,该操作进一步包括:将获得的拉曼光谱与包含在模拟拉曼光谱库中的多个模拟拉曼光谱的参考模拟拉曼光谱进行比较。在各种实施例中,每个模拟拉曼光谱经由对已知化合物的量子力学计算来生成。该操作进一步包括:基于获得的拉曼光谱与参考模拟拉曼光谱的比较,对该未知化合物的特性进行鉴定。
在结合附图审查本公开的具体示例性实施例的以下描述时,本公开的其他方面、特征和实施例对于本领域普通技术人员将变得显而易见。尽管可以相对于下面的某些实施例和附图对本公开的特征进行讨论,但是本公开的所有实施例都可以包括本文讨论的一个或多个有利特征。换言之,尽管可以因具有某些有利特征而对一个或多个实施例进行讨论,但也可根据本文讨论的本公开的各种实施例使用该特征中的一个或多个特征。以类似的方式,尽管可以在下文中作为装置、系统、介质或方法实施例而对示例性实施例进行讨论,但是应当理解,该示例性实施例可以在各种装置、系统、介质和方法中实现。
附图说明
为了更完整地理解本文所公开的原理及其优点,现参考以下结合附图的描述,其中:
图1是根据各种实施例的基于拉曼光谱的化合物分类系统的框图。
图2示出了根据各种实施例的基于化合物的所测量拉曼光谱与计算机仿真的模拟拉曼光谱的比较来鉴定化合物的示例性图表。
图3示出了根据各种实施例的基于对化合物的计算机仿真的模拟拉曼条形码的比较来鉴定化合物的示例性图表。
图4示出了根据各种实施例的基于化合物的所测量拉曼条形码与化合物的参考计算机仿真的模拟拉曼条形码库的比较来鉴定化合物的示例性图表。
图5示出了根据各种实施例的示例性网格,其说明基于化合物的所测量拉曼条形码与化合物的参考计算机仿真的模拟拉曼条形码库的比较来确定化合物的相似性。
图6是根据各种实施例的方法的流程图,该方法用于基于化合物的所测量拉曼条形码与化合物的参考计算机仿真的模拟拉曼条形码库的比较来鉴定未知化合物。
图7是根据各种实施例的计算机系统的框图。
应当理解,附图不一定是按比例绘制的,图中的对象也不一定是相对于彼此按比例绘制的。附图是旨在清楚理解本文所公开的设备、系统和方法的各种实施例的示意图。在可能的情况下,将在整个附图中使用相同的附图编号来指代相同或相似的部分。此外,应当理解,附图并非旨在以任何方式限制本教导的范围。
具体实施方式
未知化合物可以基于其拉曼光谱进行鉴定和分类,拉曼光谱可以使用拉曼光谱学技术来测量,其中分析从未知化合物散射的光以提取拉曼光谱。为了鉴定/分类未知化合物,可以将经由拉曼光谱仪测量获得的未知化合物的拉曼光谱与包括各种化合物的所测量拉曼光谱的参考拉曼光谱库进行比较,并且当比较生成匹配时,未知化合物可以被鉴定/分类(例如,使用分类算法)。例如,未知化合物的所测量拉曼光谱的峰可以与候选化合物的所测量拉曼光谱(存储在参考拉曼光谱库中)的峰进行比较,并且当所测量拉曼光谱的峰的至少预定部分与候选化合物的拉曼光谱的峰位于相同或基本上相同的波数时,未知化合物可以被鉴定为与候选化合物相同的化合物。术语“所测量拉曼光谱”被理解为是指使用光谱仪器(诸如拉曼光谱仪)通过实验获得的拉曼光谱。
然而,开发化合物的稳健的参考拉曼光谱库(即,可用作参考光谱的所测量拉曼光谱的库)在技术上可能具有挑战性。例如,使用仪器诸如光谱仪来建立参考拉曼光谱库的实验测量可能会受到多个因素的影响,诸如但不限于仪器检测器噪声、仪器之间的可变性、仪器配置(例如,雷射功率,雷射频率等)、样品容器干扰等,这可能会导致光谱质量和特征外观方面的差异,并使构建稳健可靠的库的工作复杂化。此外,这些因素可能使得难以将其他分子或化合物的光谱附加到现有库中,且也使得难以在仪器或光谱仪之间转换分类方法或算法。此外,应用于所测量拉曼光谱的基线去除技术也可能会去除真实信号,从而导致可用信息的丢失。例如,应用于所测量拉曼光谱以消除噪声或背景的技术也可能将多个但接近的峰平滑成单个峰,从而导致有价值的信号信息丢失。此外,有毒或有害分子或化合物的拉曼光谱测量也可能成本高昂且具有挑战性,因为除其他因素外,还需要实验保障。因此,需要有助于开发稳健的拉曼光谱库的方法和系统,当使用该库来鉴定和分类未知化合物时,人们可以用来解决参考(所测量)拉曼光谱库的上述缺点。
本公开的各种实施例公开了计算机仿真生成的化合物的参考拉曼光谱库,即模拟或计算的拉曼光谱(例如,与所测量拉曼光谱相反)。使用该计算机仿真的模拟拉曼光谱来例如鉴定未知化合物或分子可能具有若干优点。例如,计算机仿真的模拟拉曼光谱不受样品或仪器/光谱仪可变性的影响。例如,计算机仿真的模拟拉曼光谱不包含由于样品污染而在所测量拉曼光谱中出现的假峰。也就是说,对于相同的化合物,计算机仿真的模拟拉曼光谱是相同的,前提是使用相同的计算方法来计算拉曼光谱(例如,因此,与包含给定化合物的多个拉曼光谱复本的所测量拉曼光谱库相比,库中仅包含该相同化合物的单个拉曼光谱就足够了)。此外,在生成计算机仿真的模拟拉曼光谱时,不存在与测量有毒物质的拉曼光谱相关的操作挑战和成本。
图1是根据各种实施例的基于拉曼光谱的化合物分类系统100的框图。在各种实施例中,仪器诸如拉曼光谱仪102可用于获得化合物的拉曼光谱测量104。在各种情况下,拉曼光谱仪102可以向样品(例如分子、化合物等)发射光并检测在与样品的低能量振动、旋转等模式相互作用后散射的光。样品的拉曼光谱显示根据散射光频率与入射光频率之间的差异的散射光的强度。因为强度和频率变化可能视样品的化学成分而定,所以在多种情况下,不同分子、化合物等的拉曼光谱测量104可能彼此不同,且因此可用于对分子、化合物等进行鉴定和分类。
在各种实施例中,基于拉曼光谱的化合物分类系统100还可以包括拉曼光谱计算器106,该拉曼光谱计算器被配置为基于除了其他方面之外的分子、化合物等的材料和/或化学结构来计算或仿真该分子、化合物的模拟拉曼光谱108。也就是说,在化合物的材料和/或化学结构的条件下,拉曼光谱计算器106可以被配置为生成该化合物的计算机仿真的模拟拉曼光谱。在各种情况下,拉曼光谱计算器106可以包括计算节点,该计算节点包括耦接至处理器的存储器,该处理器被配置为控制计算节点的操作。在各种情况下,处理器可以为或可以包括一种或多种中央处理单元、多核处理器、微处理器、微控制器、数字信号处理器、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、图形处理单元(GPU)和/或其他等。计算节点可以实现为独立子系统、添加到计算装置的板和/或虚拟机。
在各种实施例中,拉曼光谱计算器106可以包括模块,该模块被设计成或被配置为如上所述基于除了其他方面之外的分子、化合物等的材料和/或化学结构来计算或仿真该分子、化合物的模拟拉曼光谱108。在各种情况下,该模块可以具有执行量子力学计算的能力,例如但不限于密度泛函理论(DFT)计算以计算模拟即计算机仿真的拉曼光谱108。例如,此类模块可以是或可以包括Gaussian,Inc.的Gaussian软件系列(例如Gaussian09、Gaussian 16等)中的任何一个系列。在各种情况下,Gaussian软件可以将化合物的3D结构作为输入并且执行DFT计算(例如,使用6-31G(d)基组的B3LYP密度泛函方法)以生成计算机仿真的模拟拉曼光谱108。在各种情况下,包含3D结构的输入文件可由Avogardo化学建模软件的Gaussian软件扩展生成,该化学建模软件可导入化学物质的3D结构并输出可用作Gaussian 09输入的输入文件。
在各种实施例中,基于拉曼光谱的化合物分类系统100还可以包括拉曼条形码生成器110,该拉曼条形码生成器被配置为接收拉曼光谱测量104,生成光谱测量的拉曼条形码。在各种情况下,拉曼条形码生成器110可以包括光谱测量预处理器112,该光谱测量预处理器被配置为从拉曼光谱仪102接收拉曼光谱测量104并且预处理拉曼光谱测量104以执行基线校正,该基线校正包括但不限于平滑光谱(例如,去除高频噪声)、去除高斯噪声、荧光背景、宇宙峰、实验假影等。
在各种实施例中,拉曼条形码生成器110可以被配置为将拉曼光谱测量104与模拟拉曼光谱108进行比较(例如,在生成相应拉曼光谱的拉曼条形码之前)。例如,拉曼条形码生成器110可以包括视情况选用的光谱比较模块114,该光谱比较模块被配置为接收来自光谱测量预处理器112的预处理的拉曼光谱测量和来自拉曼光谱计算器106的计算机仿真的模拟拉曼光谱108以比较其峰(例如,以确定对应于所测量拉曼光谱(例如,来自104)和模拟拉曼光谱108的化合物是否匹配)。在各种情况下,比较预处理的拉曼光谱测量和计算机仿真的模拟拉曼光谱108的峰可以包括:检查以确定光谱中一个光谱的至少大量峰是否也以相同或基本上相似的波数位置存在于另一光谱中(例如,在光谱之间的波数偏移(如果有的话)被校正之后)。换言之,比较预处理的拉曼光谱测量和计算机仿真的模拟拉曼光谱108的峰可以包括:检查以确定是否预处理的拉曼光谱测量和计算机仿真的模拟拉曼光谱108的至少大量峰的波数位置对齐(例如,在光谱之间的波数偏移(如果有的话)被校正之后)。在各种情况下,该峰可以是强度超过阈值强度水平的峰。在各种情况下,比较预处理的拉曼光谱测量和计算机仿真的模拟拉曼光谱108的峰可以包括:检查以确定对齐的峰(即,来自预处理的拉曼光谱测量和计算机仿真的模拟拉曼光谱108的峰位于相同或基本上相似的波数位置或在该波数位置对齐)是否具有至少基本上相同的强度。在各种情况下,如果峰位于(例如,在光谱之间的波数偏移(如果有的话)被校正之后)在彼此的约0.5%、约1%、约3%、约5%、约10%(包括其间的值和子范围)内,则峰可以被理解为彼此“对齐”或位于“相同或基本上相同的”波数位置。
在各种情况下,在如上所述比较所测量光谱和模拟光谱的峰之前,光谱比较模块114可以对一个或两个光谱应用缩放算法以校正它们之间的任何波数偏移。在各种情况下,缩放算法可以应用于预处理的拉曼光谱测量和/或计算机仿真的模拟拉曼光谱108。缩放算法可以是基于对一些其他参考化合物执行的测量得出的算法。例如,缩放算法可以包括或者可以是从对化合物茚执行的测量得出的线性缩放算法。该线性缩放算法的实例可以表示为ν测量/ν计算=1.0-0.00002520νcalc,其中ν测量和ν计算是所测量的波数和计算的波数。在各种情况下,缩放算法还可以包括优化函数或方法(例如,Nedler-Mead方法、模式搜索、仿真退火等)以导出用于缩放算法或缩放算法的较佳拟合参数。
图2显示了所测量拉曼光谱与计算机仿真的模拟光谱的比较的示例性图表,其中包括环己烷(C6H12)的示例性所测量光谱和计算机仿真的模拟光谱。图2描绘了根据各种实施例的示例性图200,其示出基于化合物的所测量拉曼光谱和计算机仿真的模拟拉曼光谱的比较来鉴定未知化合物,在这种情况下为环己烷。在各种情况下,可以测量和处理未知化合物的拉曼光谱以获得该未知化合物的预处理的所测量拉曼光谱210。然后可以将预处理的所测量拉曼光谱210与一个或多个计算机仿真的模拟拉曼光谱(例如,来自各种化合物的计算机仿真的模拟拉曼光谱库)进行比较,以鉴定匹配的计算机仿真的模拟拉曼光谱220。例如,参考图2,可以将预处理的所测量拉曼光谱210与计算机仿真的模拟拉曼光谱库进行比较,直到确定预处理的所测量拉曼光谱210与存储在计算机仿真的模拟拉曼光谱库中的环己烷的计算机仿真的模拟拉曼光谱220匹配,之后与所测量拉曼光谱对应的未知化合物可以被鉴定为环己烷。在各种情况下,确定预处理的所测量拉曼光谱210与计算机仿真的模拟拉曼光谱220匹配可以基于两个光谱的峰,该峰存在于相同或基本上相同的波数位置处或在该波数位置处对齐。例如,当光谱的至少预定数量的峰位于相同或基本上相同的波数位置时(例如,在光谱之间的波数偏移(如果有的话)被校正之后,如上文所讨论的),两个光谱210、220可以被确定为匹配。在各种情况下,这些峰可以是强度超过阈值强度水平的峰。
在各种情况下,多变量数据分析(MVDA)技术可用于比较预处理的所测量拉曼光谱210和计算机仿真的模拟拉曼光谱220以用于分类目的(例如,相对于后者对前者进行分类)。MDVA技术的实例包括PCA(主成分分析)和PLSD(偏最小二乘判别)技术,它们用于对具有大量变量和大量样本的数据进行分析。在各种情况下,诸如PCA、PLSD等的MDVA技术可以应用于沿所测量拉曼光谱的大量数据点(例如,约3,000,在约1,000至约5,000的范围内等(包括其间的值和子范围)),以将数据点投影到比该大量数据点的初始数据集的维度空间具有更少维度的维度空间中。在这种情况下,拉曼光谱然后可以基于投影数据点在具有较少维度的维度空间中的分组进行分类。
在各种实施例中,通过比较预处理的所测量拉曼光谱210和计算机仿真的模拟拉曼光谱的原始光谱向量的相似性,可以将预处理的所测量拉曼光谱210与计算机仿真的模拟拉曼光谱库中的计算机仿真的模拟光谱进行比较。例如,可以使用距离度量来测量相似度,以计算向量空间中向量之间的“距离”。该度量的一个实例是欧几里得度量,并且可以计算预处理的所测量拉曼光谱210和计算机仿真的模拟光谱的原始光谱向量的欧几里得距离和/或协方差,以量化前者与后者之间的相似性程度。
在各种实施例中,拉曼条形码生成器110可以被配置为转换由光谱测量预处理器112预处理的拉曼光谱测量和来自拉曼光谱计算器106的计算机仿真的模拟拉曼光谱108中之一者或两者的峰,以将所述光谱的峰转换为拉曼条形码。例如,拉曼条形码生成器110可以包括峰-条形码转换器模块116,该模块被配置为接收拉曼光谱并鉴定拉曼光谱的峰,然后生成拉曼条形码,其中条表示或对应于该峰且位于相同或基本上相同的波数位置。在各种情况下,拉曼条形码生成器110可以包括峰检测算法,例如但不限于EigenvectorResearch,Inc的算法peakfind,以检测拉曼光谱中峰的存在并鉴定峰的波数位置。拉曼条形码生成器110然后可以生成拉曼条形码并在拉曼条形码中将对应于峰(例如,并且在条形码中表示峰)的条放置在波数位置处。在各种情况下,峰的波数位置可以被理解为指峰尖端的波数位置,即对应于峰的最高强度的波数位置,或者如果峰具有更圆的尖端,则为峰的圆形尖端部分的中心。在各种情况下,拉曼条形码生成器110可以包括额外的峰检测算法,例如F.Scholkmann等人在标题为“An Efficient Algorithm for Automatic PeakDetection in Noisy Periodic and Quasi-Periodic Signals”(2012年8月3日)的文献中讨论的彼等算法,该文献全文以引用方式并入本文。
在各种实施例中,当(例如,并且在某些情况下仅当)峰的强度超过预定的峰强度阈值时,拉曼光谱中如此鉴定的峰(例如,通过峰检测算法)可以包括在拉曼条形码中,即由拉曼条形码中的条表示。在各种情况下,峰强度阈值可能与拉曼光谱的一个或多个峰的强度有关。例如,峰强度阈值可以是拉曼光谱的最高峰的一部分,或者可以是拉曼光谱中由峰检测算法检测到的一些或所有峰的平均值。
图3显示了在各种实施例中鉴定拉曼光谱中的峰以及基于鉴定的峰生成拉曼条形码的示例性图表300。尽管本文中关于峰鉴定和拉曼条形码生成的讨论是指环己烷的计算机仿真的模拟拉曼光谱310,但在各种情况下,该讨论同样适用于所测量拉曼光谱。在各种情况下,可以计算或模拟(例如,或测量和预处理)拉曼光谱,并且拉曼光谱310可以具有通过峰检测算法检测到的多个峰。然后可以鉴定一些峰(例如,具有超过峰强度阈值的强度的彼等峰)或所有峰的波数位置,并且可以生成330拉曼条形码320,其中条位于鉴定的波数位置。如上所述,峰的波数位置可以对应于峰的尖端或最高强度值的波数位置或与其相同,或者如果峰的尖端是圆形的,则为峰的圆形尖端部分的中心。
在各种实施例中,作为比较拉曼光谱以鉴定对应于拉曼光谱的化合物的特性(例如,如图2中关于所测量拉曼光谱和计算机仿真的模拟拉曼光谱所示)的替代或补充,可以比较拉曼光谱的拉曼条形码以用于鉴定目的,或确定化合物之间的相似性程度。图3显示了比较环己烷320和异丙醇(IPA)350的计算机仿真的模拟拉曼条形码的示例性图表,它们是从上面讨论的相应计算机仿真的模拟拉曼光谱310和340转换而来的(例如,使用峰-拉曼条形码生成器110的条形码转换器模块116)。在各种情况下,比较可以包括确定两个拉曼条形码320、350之间的条形码重叠水平360。在各种情况下,当比较两个拉曼条形码(例如,诸如320和350)时,条形码重叠水平360可能与两个拉曼条形码320、350中在相同或基本上相同波数位置处存在的条的数量有关(例如,条形码重叠水平360可以通过将该数量除以拉曼条形码320、350两者中的条的总数量来计算)。在各种情况下,当第一条和第二条(例如,在波数轴上)在彼此的约0.5%、约1%、约3%、约5%、约10%(包括其间的值和子范围)内时,第一拉曼条形码中的第一条和第二拉曼条形码中的第二条被理解为在“相同或基本上相同波数位置”处。在各种情况下,两个拉曼条形码的条形码重叠水平可以被视为与拉曼条形码对应的化合物之间的相似性的量度。例如,当条形码重叠水平超过条形码重叠阈值时,可以认为或确定两种化合物是匹配的。在各种实施例中,回到图1,结果(诸如条形码重叠水平360)可以由拉曼条形码生成器110作为输出124来提供,以呈现在基于拉曼光谱的化合物分类系统100的显示器122中。
在各种实施例中,计算机仿真的模拟拉曼光谱和/或从其转换的拉曼条形码可以存储在模拟拉曼光谱库中。例如,基于拉曼光谱的化合物分类系统100可以包括数据库118,该数据库被配置为存储模拟拉曼光谱108和/或计算机仿真的模拟拉曼光谱(例如,诸如环己烷320和异丙醇(IPA)350的计算机仿真的模拟拉曼条形码,如图3所示)。也就是说,在各种情况下,可以通过以下来构建计算机仿真的模拟拉曼光谱库:计算各种化合物的拉曼光谱(例如,通过执行量子力学DFT计算)、将该拉曼光谱转换成拉曼条形码并将计算机仿真的模拟拉曼条形码120存储在数据库118中作为模拟拉曼光谱库。在各种情况下,计算机仿真的模拟拉曼光谱库也可能包含计算的拉曼光谱。在各种情况下,当通过以下鉴定未知化合物时,模拟拉曼光谱库或数据库118可用作参考:测量未知化合物的拉曼光谱、将所测量拉曼光谱转换为拉曼条形码并将所测量拉曼光谱的该拉曼条形码与计算机仿真的模拟拉曼光谱库或数据库118进行比较,如下面关于图4更详细讨论的。在各种实施例中,模拟拉曼光谱库或数据库118可能不包含所测量拉曼光谱或对应于所测量拉曼光谱的拉曼条形码。换言之,计算机仿真的模拟拉曼光谱库或数据库118可以通过计算或模拟拉曼光谱和/或拉曼条形码并将其存储在库中来生成,即,该库可以仅包含计算机仿真的模拟拉曼光谱或条形码。
图4示出了根据各种实施例的基于未知化合物的所测量拉曼条形码与化合物的计算机仿真的参考模拟拉曼条形码库的比较来鉴定未知化合物的示例性图表400。在各种实施例中,为了使用拉曼光谱确定未知化合物的特性,可以最初使用拉曼光谱仪测量未知化合物的拉曼光谱。此外,可以对所测量光谱进行预处理以去除各种噪声、背景、实验假影等,并获得平滑或预处理的拉曼光谱410。在各种情况下,所测量拉曼光谱410然后可以被转换为所测量拉曼条形码(例如,使用图1的拉曼条形码生成器110的峰-条形码转换器模块116),如上文参考图3所讨论的。
在获得所测量拉曼条形码之后,在各种情况下,可以将所测量拉曼条形码与存储在模拟拉曼光谱库(例如,存储在图1的数据库118中)中的一个或多个计算机仿真的模拟拉曼条形码进行比较。例如,可以迭代地搜索数据库118的存储的计算机仿真的模拟拉曼条形码,并针对每个计算机仿真的模拟拉曼条形码计算该计算机仿真的或模拟拉曼条形码与所测量拉曼条形码之间的条形码重叠水平430。在各种情况下,多种化合物的计算的条形码重叠水平460可能低于条形码重叠阈值450,并且在这种情况下,未知化合物可能被确定为与多种化合物中的任何一种不匹配(即,在化学结构等方面不相同或甚至不相似)。
然而,在各种情况下,未知化合物的所测量拉曼条形码与(已知或参考)化合物的计算机仿真的模拟拉曼条形码之间的条形码重叠水平440可能超过条形码重叠阈值450,并且在这种情况下,未知化合物可以被认为或被确定为匹配,即与计算机仿真的模拟拉曼条形码的已知化合物相同(例如,或至少相似)。在各种情况下,可能存在多于一个计算机仿真的模拟拉曼条形码,其与所测量拉曼条形码的条形码重叠水平超过条形码重叠阈值450。在这种情况下,未知化合物可以被确定为或被认为与对应于最高条形码重叠水平的化合物匹配(例如,并且该未知化合物可以被认为与对应于多于一个计算机仿真的模拟拉曼条形码的其余模拟拉曼条形码的化合物相似)。
在各种实施例中,两个拉曼条形码的条形码重叠水平可以被认为是对应于拉曼条形码的化合物之间的相似性的量度(例如,当两种化合物都是先前已知时)。图5显示了根据各种实施例的示例性网格500,其示出了基于测试化合物510的所测量拉曼条形码与参考化合物520的计算机仿真的参考模拟拉曼条形码库的比较(如上所述并通过条形码重叠水平530进行量化)来确定“测试”化合物510与参考化合物520的相似性。在各种情况下,网格500显示测试化合物510的所测量拉曼条形码与参考化合物520的计算机仿真的模拟拉曼条形码之间的条形码重叠水平的热图,表明每对测试化合物与参考化合物之间的匹配程度。测试化合物510的所测量拉曼条形码通过以下生成:首先对测试化合物510执行拉曼光谱仪测量以获得测试化合物510的拉曼光谱,然后将获得的或所测量的实验拉曼光谱转换为拉曼条形码,而参考化合物520的计算机仿真的模拟拉曼条形码(模拟或计算的拉曼条形码)通过以下生成:使用量子力学DFT计算参考化合物520的计算机仿真的模拟拉曼光谱,然后将其转换为拉曼条形码。关注对应于2-(N-吗啉基)乙磺酸(MES)的列(作为非限制性示例性图表),网格或热图500显示针对测试化合物MES与参考化合物3-(N-吗啉基)丙磺酸(MOPS)之间的条形码重叠水平的高强度(>75%),表明这两种化合物之间具有高度相似性,而MES和IPA的条形码重叠水平较低,表明这两种化合物是基本上不同的。在各种实施例中,网格或热图500还可用于校准条形码重叠阈值,高于该阈值的两种化合物可被认为或被确定为相同(例如,当比较未知化合物的拉曼条形码与已知化合物的参考拉曼条形码时)。例如,两种不同的化合物MES和MOPS可以具有>75%的条形码重叠水平,用于确定两种化合物是否相同的条形码重叠阈值可以设置为高于>75%。
图6是根据各种实施例的方法的流程图,该方法用于基于化合物的所测量拉曼条形码与化合物的参考计算机仿真的模拟拉曼条形码库的比较来鉴定未知化合物。在各种实施例中,可以使用图1中描述的基于拉曼光谱的化合物分类系统100来实现方法600。
步骤610包括:获得未知化合物的拉曼光谱,该拉曼光谱提取自对该未知化合物的拉曼光谱仪测量。
步骤620包括:将获得的拉曼光谱与包含在模拟拉曼光谱库中的多个模拟拉曼光谱的参考模拟拉曼光谱进行比较。在各种情况下,每个模拟拉曼光谱可经由对已知化合物的量子力学计算来生成。
步骤630包括:基于获得的拉曼光谱与参考模拟拉曼光谱的比较,对未知化合物的特性进行鉴定。
在各种实施例中,方法600进一步包括:至少部分地基于拉曼光谱的峰的强度水平来生成对应于拉曼光谱的该峰的拉曼条形码。在各种实施例中,比较包括:将生成的拉曼条形码与参考模拟拉曼条形码进行比较,该参考模拟拉曼条形码对应于多个模拟拉曼光谱的参考模拟拉曼光谱。
在各种实施例中,模拟拉曼光谱库不包括实验性拉曼光谱,该实验性拉曼光谱通过对化合物执行拉曼光谱仪测量来获得。在各种实施例中,比较包括:将缩放算法应用于生成的拉曼条形码和/或参考拉曼条形码以校正生成的拉曼条形码和/或参考拉曼条形码之间的波数偏移。
在各种实施例中,鉴定包括:当生成的拉曼条形码与参考模拟拉曼条形码之间的条形码重叠水平超过条形码重叠阈值时,确定未知化合物与从其计算参考模拟拉曼光谱的化合物匹配。在各种实施例中,条形码重叠水平指示位于生成的拉曼条形码的第一波数位置和参考模拟拉曼条形码的第二波数位置的条数,该第一波数位置与该第二波数位置至少基本上彼此相同。
在各种实施例中,量子力学计算是基于密度泛函理论(DFT)。在各种实施例中,生成包括:当该峰的该强度水平中的一峰的强度水平超过峰强度阈值时,将对应于该峰的条包括在该条形码中。在各种实施例中,峰强度阈值为该峰的强度水平的平均值。在各种实施例中,生成包括:至少部分地基于拉曼光谱的该峰的波数位置来生成对应于该拉曼光谱的该峰的拉曼条形码。
图7是根据各种实施例的计算机系统的框图。计算机系统700可以是以上图1中描述的基于拉曼光谱的化合物分类系统100的一种实施方式的实例。在一个或多个实例中,计算机系统700可以包括总线702或用于传送信息的其他通信机制,以及与总线702耦接用于处理信息的处理器704。在各种实施例中,计算机系统700还可以包括存储器,该存储器可以是随机存取存储器(RAM)706或其他动态存储,其耦接至总线702用于确定要由处理器704执行的指令。存储器还可用于在执行要由处理器704执行的指令期间存储暂时变量(temporary variable)或其他中间信息。在各种实施例中,计算机系统700可以进一步包括:只读存储器(ROM)708或耦接至总线702的其他静态存储装置,用于存储用于处理器704的静态信息和指令。可以提供诸如磁盘或光盘的存储装置710并将其耦接至总线702以用于存储信息和指令。
在各种实施例中,计算机系统700可以经由总线702耦接至显示器712,诸如阴极射线管(CRT)或液晶显示器(LCD),用于向计算机用户显示信息。包括字母数字键和其他键的输入设备714可以耦接至总线702,用于将信息和命令选择传送到处理器704。另一种类型的用户输入设备是光标控件716,诸如鼠标、操纵杆、轨迹球、手势输入设备、基于注视的输入设备或光标箭头键,用于将方向信息和命令选择传送到处理器704以及用于控制显示器712上的光标移动。该输入设备714通常在两个轴上具有两个自由度,第一轴(例如,x)和第二轴(例如,y),这允许装置指定平面中的位置。然而,应当理解,允许三维(例如,x、y和z)光标移动的输入设备714也在本文中被考虑。
与本教导的某些实施方式一致,结果可以由计算机系统700响应于处理器704执行包含在RAM 706中的一个或多个指令的一个或多个序列来提供。该指令可以从另一个计算机可读介质或计算机可读存储介质(例如存储装置710)读入RAM 706。执行RAM 706中包含的指令的序列可以使处理器704执行本文描述的方法。或者,可以使用固线式电路代替软件指令或与软件指令结合来实现本教导。因此,本教导的实现不限于硬件电路和软件的任何特定组合。
如本文所用,术语“计算机可读介质”(例如,数据存储、数据存储器、存储装置、数据存储装置等)或“计算机可读存储介质”是指参与向处理器704提供指令以供执行的任何介质。该介质可以采取多种形式,包括但不限于非挥发性介质、挥发性介质和传输介质。非挥发性介质的实例可以包括但不限于光盘、固态碟、磁盘,诸如存储装置710。挥发性介质的实例可以包括但不限于易失存储器,诸如RAM 706。传输介质的实例可以包括但不限于同轴电缆、铜线和光纤,包括构成总线702的线。
计算机可读介质的常见形式包括例如软磁盘、软盘、硬盘、磁带或任何其他磁性介质、CD-ROM、任何其他光学介质、穿孔卡、纸带、任何其他具有孔样式的物理介质、RAM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒式磁带,或计算机可以读取的任何其他有形介质。
除了计算机可读介质之外,指令或数据可以作为信号提供在包含在通信装置或系统中的传输介质上,以将一个或多个指令的序列提供给计算机系统700的处理器704以供执行。例如,通信装置可以包括具有指示指令和数据的信号的收发器。该指令和数据被配置为使一个或多个处理器实现本公开中概述的功能。数据通信传输连接的代表性实例可以包括但不限于电话调制解调器连接、广域网(WAN)、局域网(LAN)、红外数据连接、NFC连接、光学通信连接等。
应当理解,本文描述的方法、流程图、附图和随附的公开内容可以使用计算机系统700作为独立装置或在共享计算机处理资源的分布式网络(诸如云计算网络)上来实现。
取决于应用,本文描述的方法可以通过各种方式来实现。例如,该方法可以在硬件、固件、软件或其任何组合中实现。对于硬件实施,处理单元可以在以下中实施:一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可程序化逻辑设备(PLD)、场域可程序门阵列(FPGA)、处理器、控制器、微控制器、微处理器、电子装置、设计用于执行本文所述功能的其他电子单元或其组合。
在各种实施例中,本教导的方法可以被实现为固件和/或软件程序和以诸如C、C++、Python等常规程序语言编写的应用程序。如果被实现为固件和/或软件,则本文描述的实施例可以在其中存储有程序以使计算机执行上述方法的非暂时性计算机可读介质上实现。应当理解,本文描述的各种引擎可以在计算机系统上提供,诸如计算机系统700,其中处理器704将执行由该引擎提供的分析和确定,受制于存储器组件RAM 706、ROM 708或存储装置710中任一者或其组合提供的指令,以及经由输入设备714提供的用户输入。
虽然本教导结合各种实施例进行描述,但并非旨在将本教导限制于该实施例。相反,如本领域技术人员所理解的,本教导涵盖各种替代、修改和等同形式。
例如,上述流程图和框图示出了各种方法和系统实施例的可能性实施方式的架构、功能和/或操作。流程图或框图中的每个框可以表示模块、部分、功能、操作或步骤的一部分或它们的组合。在实施例的各种替代实施方式中,框中描述的一个或多个功能可以不按图中描述的顺序发生。例如,在各种情况下,连续示出的两个框可以基本上同时执行。在其他情况下,可以以相反的顺序执行该框。此外,在各种情况下,可以添加一个或多个框以替换或补充流程图或框图中的一个或多个其他框。
因此,在描述各种实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤顺序。然而,在该方法或过程不依赖于本文所述的特定步骤顺序的范围内,该方法或过程不应限于所描述的特定步骤顺序,并且本领域普通技术人员可以容易地理解,顺序可以改变并且仍然保持在各种实施例的精神和范围内。
此外,在提及组件列表(例如,组件a、b、c)的情况下,该提及旨在包括单独列出的任何一个组件、少于所有列出的组件的任何组合和/或所有列出的组件的组合。说明书中的部分划分仅是为了便于查看,并非限制所讨论组件的任何组合。
除非另外定义,否则结合本教导使用的科学和技术术语应具有本领域普通技术人员通常所理解的含义。此外,除非上下文另有要求,否则单数术语应包括复数且复数术语应包括单数。通常,与本文所述的化学、生物化学、分子生物学、药理学和毒理学相关的命名法和技术为本领域熟知且常用的那些。
如本文所用,“基本上”是指足以达到预期目的。因此,术语“基本上”允许相对于绝对或完美状态、尺寸、测量、结果等的微小、不显著的变化,如本领域普通技术人员所期望的,但不会明显影响整体性能。当用于数值或可表示为数值的参数或特性时,“基本上”是指百分之十以内。
如本文所用,关于数值或可以表示为数值的参数或特性,术语“约”是指在数值的百分之十以内。例如,“约50”意指45到55范围内的值,包括45到55。
术语“多个(ones)”意指多于一个。
如本文所用,术语“多个”可以是2、3、4、5、6、7、8、9、10或以上。
如本文所用,术语“一组”是指一个或多个。例如,一组项目包括一个或多个项目。
如本文所用,短语“中的至少一者”在与项目列表一起使用时表示可以使用所列项目中的一者或多者的不同组合,并且可能仅需要列表中的项目之一。项目可以是特定的对象、事物、步骤、操作、过程或类别。换言之,“中的至少一者”意指可以使用列表中的项目或项目数量的任意组合,但可能不需要列表中的所有项目。例如但不限于,“项目A、项目B或项目C中的至少一者”意指:项目A;项目A和项目B;项目B;项目A、项目B和项目C;项目B和项目C;或项目A和项目C。在各种情况下,“项目A、项目B或项目C中的至少一者”意指但不限于:两个项目A、一个项目B和十个项目C;四个项目B和七个项目C;或其他一些合适的组合。
实施例的详述
实施例1:一种方法,其包括:获得未知化合物的拉曼光谱,该拉曼光谱提取自对该未知化合物的拉曼光谱仪测量;将获得的拉曼光谱与包含在模拟拉曼光谱库中的多个模拟拉曼光谱的参考模拟拉曼光谱进行比较,每个模拟拉曼光谱经由对已知化合物的量子力学计算来生成;以及基于该获得的拉曼光谱与该参考模拟拉曼光谱的比较,对该未知化合物的特性进行鉴定。
实施例2:根据实施例1所述的方法,其中该模拟拉曼光谱库不包括实验性拉曼光谱,该实验性拉曼光谱通过对化合物执行拉曼光谱仪测量来获得。
实施例3:根据实施例1或2所述的方法,其进一步包括:至少部分地基于该拉曼光谱的峰的强度水平来生成对应于该拉曼光谱的该峰的拉曼条形码。
实施例4:根据实施例3所述的方法,其中该比较包括:将生成的拉曼条形码与参考模拟拉曼条形码进行比较,该参考模拟拉曼条形码对应于该多个模拟拉曼光谱的该参考模拟拉曼光谱。
实施例5:根据实施例1至4中任一项所述的方法,其中该比较包括:将缩放算法应用于该获得的拉曼光谱和/或该参考模拟拉曼光谱,以校正该获得的拉曼光谱和/或该参考模拟拉曼光谱之间的波数偏移。
实施例6:根据实施例4所述的方法,其中该鉴定包括:当该生成的拉曼条形码与该参考模拟拉曼条形码之间的条形码重叠水平超过条形码重叠阈值时,确定该未知化合物与从其计算该参考模拟拉曼光谱的化合物匹配。
实施例7:根据实施例6所述的方法,其中该条形码重叠水平指示位于该生成的拉曼条形码的第一波数位置且位于该参考模拟拉曼条形码的第二波数位置的条数,该第一波数位置与该第二波数位置至少基本上彼此相同。
实施例8:根据实施例1至7中任一项所述的方法,其中该量子力学计算是基于密度泛函理论(DFT)。
实施例9:根据实施例3所述的方法,其中该生成包括:当该峰中的一峰的强度水平超过峰强度阈值时,将对应于该峰的条包括在该拉曼条形码中。
实施例10:根据实施例9所述的方法,其中该峰强度阈值为该峰的强度水平的平均值。
实施例11:根据实施例3所述的方法,其中该生成包括:至少部分地基于该拉曼光谱的该峰的波数位置来生成对应于该拉曼光谱的该峰的该拉曼条形码。
实施例12:一种系统,其包含:存储指令的非暂时性存储器;以及一个或多个硬件处理器,其耦接至非暂时性存储器且被配置为从该非暂时性存储器读取指令以使系统执行包括以下的操作:获得未知化合物的拉曼光谱,该拉曼光谱提取自对该未知化合物的拉曼光谱仪测量;将获得的拉曼光谱与包含在模拟拉曼光谱库中的多个模拟拉曼光谱的参考模拟拉曼光谱进行比较,每个模拟拉曼光谱经由对已知化合物的量子力学计算来生成;以及基于该获得的拉曼光谱与该参考模拟拉曼光谱的比较,对该未知化合物的特性进行鉴定。
实施例13:根据实施例12所述的系统,其中该模拟拉曼光谱库不包括实验性拉曼光谱,该实验性拉曼光谱通过对化合物执行拉曼光谱仪测量来获得。
实施例14:根据实施例12或13所述的系统,其中该操作进一步包括:至少部分地基于该拉曼光谱的峰的强度水平来生成对应于该拉曼光谱的该峰的拉曼条形码。
实施例15:根据实施例14所述的系统,其中该比较包括:将该生成的拉曼条形码与参考模拟拉曼条形码进行比较,该参考模拟拉曼条形码对应于该多个模拟拉曼光谱的该参考模拟拉曼光谱。
实施例16:根据实施例12至15中任一项所述的系统,其中该比较包括:将缩放算法应用于该获得的拉曼光谱和/或该参考模拟拉曼光谱,以校正该获得的拉曼光谱和/或该参考模拟拉曼光谱之间的波数偏移。
实施例17:根据实施例15所述的系统,其中该鉴定包括:当该生成的拉曼条形码与该参考模拟拉曼条形码之间的条形码重叠水平超过条形码重叠阈值时,确定该未知化合物与从其计算该参考模拟拉曼光谱的化合物匹配。
实施例18:根据实施例17所述的系统,其中该条形码重叠水平指示位于该生成的拉曼条形码的第一波数位置且位于该参考模拟拉曼条形码的第二波数位置的条数,该第一波数位置与该第二波数位置至少基本上彼此相同。
实施例19:根据实施例12至18中任一项所述的系统,其中该量子力学计算是基于密度泛函理论(DFT)。
实施例20:根据实施例14所述的系统,其中该生成包括:当该峰中的一峰的强度水平超过峰强度阈值时,将对应于该峰的条包括在该条形码中。
实施例21:根据实施例20所述的系统,其中该峰强度阈值为该峰的强度水平的平均值。
实施例22:根据实施例14所述的系统,其中该生成包括:至少部分地基于该拉曼光谱的该峰的波数位置来生成对应于该拉曼光谱的该峰的该拉曼条形码。
实施例23:一种非暂时性计算机可读介质(CRM),其上存储有可执行以使得执行操作的计算机可读指令,该操作包括:获得未知化合物的拉曼光谱,该拉曼光谱提取自对该未知化合物的拉曼光谱仪测量;将获得的拉曼光谱与包含在模拟拉曼光谱库中的多个模拟拉曼光谱的参考模拟拉曼光谱进行比较,每个模拟拉曼光谱经由对已知化合物的量子力学计算来生成;以及基于该获得的拉曼光谱与该参考模拟拉曼光谱的比较,对该未知化合物的特性进行鉴定。
实施例24:根据实施例23所述的非暂时性CRM,其中该模拟拉曼光谱库不包括实验性拉曼光谱,该实验性拉曼光谱通过对化合物执行拉曼光谱仪测量来获得。
实施例25:根据实施例23或24所述的非暂时性CRM,其中该操作进一步包括:至少部分地基于该拉曼光谱的峰的强度水平来生成对应于该拉曼光谱的该峰的拉曼条形码。
实施例26:根据实施例25所述的非暂时性CRM,其中该比较包括:将该生成的拉曼条形码与参考模拟拉曼条形码进行比较,该参考模拟拉曼条形码对应于该多个模拟拉曼光谱的该参考模拟拉曼光谱。
实施例27:根据实施例23至26中任一项所述的非暂时性CRM,其中该比较包括:将缩放算法应用于该获得的拉曼光谱和/或该参考模拟拉曼光谱,以校正该获得的拉曼光谱和/或该参考模拟拉曼光谱之间的波数偏移。
实施例28:根据实施例26所述的非暂时性CRM,其中该鉴定包括:当该生成的拉曼条形码与该参考模拟拉曼条形码之间的条形码重叠水平超过条形码重叠阈值时,确定该未知化合物与从其计算该参考模拟拉曼光谱的化合物匹配。
实施例29:根据实施例28所述的非暂时性CRM,其中该条形码重叠水平指示位于该生成的拉曼条形码的第一波数位置且位于该参考模拟拉曼条形码的第二波数位置的条数,该第一波数位置与该第二波数位置至少基本上彼此相同。
实施例30:根据实施例23至29中任一项所述的非暂时性CRM,其中该量子力学计算是基于密度泛函理论(DFT)。
实施例31:根据实施例25所述的非暂时性CRM,其中该生成包括:当该峰中的一峰的强度水平超过峰强度阈值时,将对应于该峰的条包括在该条形码中。
实施例33:根据实施例31所述的非暂时性CRM,其中该峰强度阈值为该峰的强度水平的平均值。
实施例33:根据实施例25所述的非暂时性CRM,其中该生成包括:至少部分地基于该拉曼光谱的该峰的波数位置来生成对应于该拉曼光谱的该峰的该拉曼条形码。
Claims (33)
1.一种方法,其包括:
获得未知化合物的拉曼光谱,所述拉曼光谱提取自对所述未知化合物的拉曼光谱仪测量;
将获得的拉曼光谱与包含在模拟拉曼光谱库中的多个模拟拉曼光谱的参考模拟拉曼光谱进行比较,每个模拟拉曼光谱经由对已知化合物的量子力学计算来生成;以及
基于所述获得的拉曼光谱与所述参考模拟拉曼光谱的比较,对所述未知化合物的特性进行鉴定。
2.根据权利要求1所述的方法,其中所述模拟拉曼光谱库不包括实验性拉曼光谱,所述实验性拉曼光谱通过对化合物执行拉曼光谱仪测量来获得。
3.根据权利要求1所述的方法,其进一步包括:至少部分地基于所述拉曼光谱的峰的强度水平来生成对应于所述拉曼光谱的所述峰的拉曼条形码。
4.根据权利要求3所述的方法,其中所述比较包括:将生成的拉曼条形码与参考模拟拉曼条形码进行比较,所述参考模拟拉曼条形码对应于所述多个模拟拉曼光谱的所述参考模拟拉曼光谱。
5.根据权利要求1所述的方法,其中所述比较包括:将缩放算法应用于所述获得的拉曼光谱和/或所述参考模拟拉曼光谱,以校正所述获得的拉曼光谱和/或所述参考模拟拉曼光谱之间的波数偏移。
6.根据权利要求4所述的方法,其中所述鉴定包括:当所述生成的拉曼条形码与所述参考模拟拉曼条形码之间的条形码重叠水平超过条形码重叠阈值时,确定所述未知化合物与从其计算所述参考模拟拉曼光谱的化合物匹配。
7.根据权利要求6所述的方法,其中所述条形码重叠水平指示位于所述生成的拉曼条形码的第一波数位置且位于所述参考模拟拉曼条形码的第二波数位置的条的数量,所述第一波数位置与所述第二波数位置至少基本上彼此相同。
8.根据权利要求1所述的方法,其中所述量子力学计算基于密度泛函理论(DFT)。
9.根据权利要求3所述的方法,其中所述生成包括:当所述峰的强度水平超过峰强度阈值时,将对应于峰中的所述峰的条包括在所述拉曼条形码中。
10.根据权利要求9所述的方法,其中所述峰强度阈值为所述峰的所述强度水平的平均值。
11.根据权利要求3所述的方法,其中所述生成包括:至少部分地基于所述拉曼光谱的所述峰的波数位置来生成对应于所述拉曼光谱的所述峰的所述拉曼条形码。
12.一种系统,其包括:
非暂时性存储器,其存储指令;以及
一个或多个硬件处理器,其耦接至所述非暂时性存储器且被配置为从所述非暂时性存储器读取所述指令以使所述系统执行包括以下的操作:
获得未知化合物的拉曼光谱,所述拉曼光谱提取自对所述未知化合物的拉曼光谱仪测量;
将获得的拉曼光谱与包含在模拟拉曼光谱库中的多个模拟拉曼光谱的参考模拟拉曼光谱进行比较,每个模拟拉曼光谱经由对已知化合物的量子力学计算来生成;以及
基于所述获得的拉曼光谱与所述参考模拟拉曼光谱的比较,对所述未知化合物的特性进行鉴定。
13.根据权利要求12所述的系统,其中所述模拟拉曼光谱库不包括实验性拉曼光谱,所述实验性拉曼光谱通过对化合物执行拉曼光谱仪测量来获得。
14.根据权利要求12所述的系统,其中所述操作进一步包括:至少部分地基于所述拉曼光谱的峰的强度水平来生成对应于所述拉曼光谱的所述多个峰的拉曼条形码。
15.根据权利要求14所述的系统,其中所述比较包括:将生成的拉曼条形码与参考模拟拉曼条形码进行比较,所述参考模拟拉曼条形码对应于所述多个模拟拉曼光谱的所述参考模拟拉曼光谱。
16.根据权利要求12所述的系统,其中所述比较包括:将缩放算法应用于所述获得的拉曼光谱和/或所述参考模拟拉曼光谱,以校正所述获得的拉曼光谱和/或所述参考模拟拉曼光谱之间的波数偏移。
17.根据权利要求15所述的系统,其中所述鉴定包括:当所述生成的拉曼条形码与所述参考模拟拉曼条形码之间的条形码重叠水平超过条形码重叠阈值时,确定所述未知化合物与从其计算所述参考模拟拉曼光谱的化合物匹配。
18.根据权利要求17所述的系统,其中所述条形码重叠水平指示位于所述生成的拉曼条形码的第一波数位置且位于所述参考模拟拉曼条形码的第二波数位置的条的数量,所述第一波数位置与所述第二波数位置至少基本上彼此相同。
19.根据权利要求12所述的系统,其中所述量子力学计算基于密度泛函理论(DFT)。
20.根据权利要求14所述的系统,其中所述生成包括:当所述峰的强度水平超过峰强度阈值时,将对应于峰中的所述峰的条包括在所述条形码中。
21.根据权利要求20所述的系统,其中所述峰强度阈值为所述峰的所述强度水平的平均值。
22.根据权利要求14所述的系统,其中所述生成包括:至少部分地基于所述拉曼光谱的所述峰的波数位置来生成对应于所述拉曼光谱的所述峰的所述拉曼条形码。
23.一种非暂时性计算机可读介质(CRM),其上储存有可执行以使得执行操作的计算机可读指令,所述操作包括:
获得未知化合物的拉曼光谱,所述拉曼光谱提取自对所述未知化合物的拉曼光谱仪测量;
将获得的拉曼光谱与包含在模拟拉曼光谱库中的多个模拟拉曼光谱的参考模拟拉曼光谱进行比较,每个模拟拉曼光谱经由对已知化合物的量子力学计算来生成;以及
基于所述获得的拉曼光谱与所述参考模拟拉曼光谱的比较,对所述未知化合物的特性进行鉴定。
24.根据权利要求23所述的非暂时性CRM,其中所述模拟拉曼光谱库不包括实验性拉曼光谱,所述实验性拉曼光谱通过对化合物执行拉曼光谱仪测量来获得。
25.根据权利要求23所述的非暂时性CRM,其中所述操作进一步包括:至少部分地基于所述拉曼光谱的峰的强度水平来生成对应于所述拉曼光谱的所述峰的拉曼条形码。
26.根据权利要求25所述的非暂时性CRM,其中所述比较包括:将生成的拉曼条形码与参考模拟拉曼条形码进行比较,所述参考模拟拉曼条形码对应于所述多个模拟拉曼光谱的所述参考模拟拉曼光谱。
27.根据权利要求23所述的非暂时性CRM,其中所述比较包括:将缩放算法应用于所述获得的拉曼光谱和/或所述参考模拟拉曼光谱,以校正所述获得的拉曼光谱和/或所述参考模拟拉曼光谱之间的波数偏移。
28.根据权利要求26所述的非暂时性CRM,其中所述鉴定包括:当所述生成的拉曼条形码与所述参考模拟拉曼条形码之间的条形码重叠水平超过条形码重叠阈值时,确定所述未知化合物与从其计算所述参考模拟拉曼光谱的化合物匹配。
29.根据权利要求28所述的非暂时性CRM,其中所述条形码重叠水平指示位于所述生成的拉曼条形码的第一波数位置且位于所述参考模拟拉曼条形码的第二波数位置的条的数量,所述第一波数位置与所述第二波数位置至少基本上彼此相同。
30.根据权利要求23所述的非暂时性CRM,其中所述量子力学计算基于密度泛函理论(DFT)。
31.根据权利要求25所述的非暂时性CRM,其中所述生成包括:当峰的强度水平超过峰强度阈值时,将对应于峰中的所述峰的条包括在所述条形码中。
32.根据权利要求31所述的非暂时性CRM,其中所述峰强度阈值为所述峰的所述强度水平的平均值。
33.根据权利要求25所述的非暂时性CRM,其中所述生成包括:至少部分地基于所述拉曼光谱的所述峰的波数位置来生成对应于所述拉曼光谱的所述峰的所述拉曼条形码。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163156846P | 2021-03-04 | 2021-03-04 | |
US63/156,846 | 2021-03-04 | ||
PCT/US2022/070949 WO2022187843A1 (en) | 2021-03-04 | 2022-03-03 | Methods and systems for raman spectra-based identification of chemical compounds |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117043585A true CN117043585A (zh) | 2023-11-10 |
Family
ID=80820253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280019130.2A Pending CN117043585A (zh) | 2021-03-04 | 2022-03-03 | 用于化合物的基于拉曼光谱的鉴定的方法和系统 |
Country Status (13)
Country | Link |
---|---|
US (1) | US20240011910A1 (zh) |
EP (1) | EP4302077A1 (zh) |
JP (1) | JP2024512309A (zh) |
KR (1) | KR20230150301A (zh) |
CN (1) | CN117043585A (zh) |
AR (1) | AR125499A1 (zh) |
AU (1) | AU2022231184A1 (zh) |
BR (1) | BR112023017779A2 (zh) |
CA (1) | CA3211796A1 (zh) |
IL (1) | IL305192A (zh) |
MX (1) | MX2023010185A (zh) |
TW (1) | TW202242356A (zh) |
WO (1) | WO2022187843A1 (zh) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6178964B2 (ja) * | 2013-04-23 | 2017-08-16 | ナノフォトン株式会社 | ラマンスペクトルデータベースの構築方法 |
-
2022
- 2022-03-03 KR KR1020237029676A patent/KR20230150301A/ko unknown
- 2022-03-03 AU AU2022231184A patent/AU2022231184A1/en active Pending
- 2022-03-03 IL IL305192A patent/IL305192A/en unknown
- 2022-03-03 JP JP2023553298A patent/JP2024512309A/ja active Pending
- 2022-03-03 EP EP22711847.8A patent/EP4302077A1/en active Pending
- 2022-03-03 MX MX2023010185A patent/MX2023010185A/es unknown
- 2022-03-03 BR BR112023017779A patent/BR112023017779A2/pt unknown
- 2022-03-03 WO PCT/US2022/070949 patent/WO2022187843A1/en active Application Filing
- 2022-03-03 CN CN202280019130.2A patent/CN117043585A/zh active Pending
- 2022-03-03 CA CA3211796A patent/CA3211796A1/en active Pending
- 2022-03-04 TW TW111107877A patent/TW202242356A/zh unknown
- 2022-03-04 AR ARP220100500A patent/AR125499A1/es unknown
-
2023
- 2023-08-10 US US18/447,809 patent/US20240011910A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20230150301A (ko) | 2023-10-30 |
AU2022231184A1 (en) | 2023-08-17 |
WO2022187843A1 (en) | 2022-09-09 |
CA3211796A1 (en) | 2022-09-09 |
TW202242356A (zh) | 2022-11-01 |
IL305192A (en) | 2023-10-01 |
EP4302077A1 (en) | 2024-01-10 |
JP2024512309A (ja) | 2024-03-19 |
AR125499A1 (es) | 2023-07-26 |
US20240011910A1 (en) | 2024-01-11 |
BR112023017779A2 (pt) | 2023-10-03 |
MX2023010185A (es) | 2023-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108629365B (zh) | 分析数据解析装置以及分析数据解析方法 | |
JP6089345B2 (ja) | 時および/または空間系列ファイルの多成分回帰/多成分分析 | |
CN111751318A (zh) | 使用光谱测量进行织物验证 | |
CN112129741B (zh) | 绝缘油老化分析方法、装置、计算机设备和存储介质 | |
US11550823B2 (en) | Preprocessing for a classification algorithm | |
WO2018134952A1 (ja) | 分析データ解析方法および分析データ解析装置 | |
Kuhn | Predictive modeling with R and the caret Package | |
US8831316B2 (en) | Point source detection | |
Salvatore et al. | Classification methods of multiway arrays as a basic tool for food PDO authentication | |
JP6748085B2 (ja) | 干渉検出および着目ピークのデコンボルーション | |
Cseresnyes et al. | Hessian‐based quantitative image analysis of host‐pathogen confrontation assays | |
Zhang et al. | A Fast and Adaptive Method for Determining $ K_ {1} $, $ K_ {2} $, and $ K_ {3} $ in the Tensor Decomposition-Based Anomaly Detection Algorithm | |
CN116858789A (zh) | 食品安全检测系统及其方法 | |
JP7482782B2 (ja) | 配列に基づくタンパク質の構造と特性の決定 | |
TWI493168B (zh) | 分析質譜的方法、電腦程式及系統 | |
US20200279148A1 (en) | Material structure analysis method and material structure analyzer | |
CN117043585A (zh) | 用于化合物的基于拉曼光谱的鉴定的方法和系统 | |
CN107067034B (zh) | 一种快速识别红外光谱数据分类的方法及系统 | |
EP3561718A1 (en) | Method for identifying raman spectrogram, and electronic device | |
CN106485286B (zh) | 一种基于局部敏感判别的矩阵分类模型 | |
Iravani et al. | An Interpretable Deep Learning Approach for Biomarker Detection in LC-MS Proteomics Data | |
CN113971747B (zh) | 拉曼光谱数据处理方法、装置、设备与可读存储介质 | |
EP4022268A1 (en) | Spectroscopic apparatus and methods for determining components present in a sample | |
US20180137270A1 (en) | Method and apparatus for non-intrusive program tracing for embedded computing systems | |
EP4125050A1 (en) | Utilizing prediction thresholds to facilitate spectroscopic classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40103586 Country of ref document: HK |