CN107407629B - 优化的光谱匹配和显示 - Google Patents

优化的光谱匹配和显示 Download PDF

Info

Publication number
CN107407629B
CN107407629B CN201680013762.2A CN201680013762A CN107407629B CN 107407629 B CN107407629 B CN 107407629B CN 201680013762 A CN201680013762 A CN 201680013762A CN 107407629 B CN107407629 B CN 107407629B
Authority
CN
China
Prior art keywords
correction
spectrum
value
values
similarity score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680013762.2A
Other languages
English (en)
Other versions
CN107407629A (zh
Inventor
K·奈德伟德
T·阿布什尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
John Wiley & Sons
Original Assignee
Bioradiation Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bioradiation Laboratory Co ltd filed Critical Bioradiation Laboratory Co ltd
Publication of CN107407629A publication Critical patent/CN107407629A/zh
Application granted granted Critical
Publication of CN107407629B publication Critical patent/CN107407629B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/203Drawing of straight lines or curves
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/55Specular reflectivity
    • G01N21/552Attenuated total reflection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/121Correction signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/127Calibration; base line adjustment; drift compensation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Abstract

提供了用于识别最优光谱匹配并潜在地显示所比较光谱的系统、方法、和装置。可以将样本物质的样本光谱与参考光谱进行比较从而识别匹配,由此确定所述样本物质是什么的可能性。可以对所述样本光谱和/或所述参考光谱使用(多个)校正参数。可以将所述(多个)校正参数的(多个)初始值应用于所述样本光谱和/或参考光谱,并且可以确定相似度得分。可以对所述(多个)校正参数的(多个)值进行更新和迭代改进从而提供满足收敛准则的最优相似度得分。可以向用户输出与具有高于阈值的最优相似度得分的所述参考物质有关的数据,例如所述参考光谱可以覆盖所述样本光谱。用户可以然后最终确定哪种参考物质与所述参与样本相对应。

Description

优化的光谱匹配和显示
相关申请的交叉引用
本申请要求于2015年3月5日提交的题为“Optimized Spectral Matching AndDisplay(优化的光谱匹配和显示)”的美国临时申请号62/128,813的优先权并且是所述申请的PCT申请,所述美国临时申请的全部内容出于所有目的通过引用结合在此。
技术领域
本披露涉及光谱分析,并且更具体地涉及分析光谱以确定匹配的物质。
发明背景
科学家通常想要确定样本内的物质。一种确定物质的方式是对物质执行光谱分析从而获得样本光谱。然后,我们可以对样本光谱进行分析从而识别与特定物质相对应的光谱的各方面。作为这种分析的一部分,可以将样本光谱与已知物质的参考光谱进行比较。
一个问题是存在某种程度上彼此相似的许多参考光谱。多种技术可以使用计算机化分析来量化样本光谱与参考光谱之间的相似度,以方便比较。然而,物质的样本光谱可能并不总是准确地反映同一物质的参考光谱。例如,可能存在基线移位,或者这两种光谱可能是使用不同技术获得的。因而,这两种光谱的差别不是由于它们属于不同物质,而可能是由于如何获得光谱的实验条件。
为了解决这些问题,我们通常对样本光谱执行某种校正。然而,现在进行的校正通常不足以识别正确的物质。
在此所描述的实施例可以解决这些以及其他问题。
发明内容
实施例可以提供用于识别最优光谱匹配并潜在地显示被比较的光谱(例如,采取更加智能可理解的可视化)的系统、方法、和装置。可以将样本物质的样本光谱与多个参考光谱进行比较从而识别匹配,从而确定所述样本物质中的至少一部分是什么的可能性。可以对所述样本光谱和/或参考光谱使用(多个)校正参数。可以将所述(多个)校正参数的(多个)初始值应用于所述样本光谱和/或参考光谱,并且可以确定相似度得分。可以对所述(多个)校正参数的(多个)值进行更新和迭代改进从而提供满足一种或多种收敛准则的最优相似度得分。可以向用户输出与具有高于阈值的最优相似度得分的参考物质有关的数据,例如所述参考光谱可以覆盖所述样本光谱。用户可以然后最终确定哪种参考物质与所述参与样本相对应。
其他实施例涉及与在此描述的方法相关联的系统、便携式消费者设备以及计算机可读介质。
可以参考以下详细说明和附图来获得对本发明的实施例的性质和优点的更好理解。
附图说明
图1根据本发明的实施例展示了用于获得光谱并确定匹配光谱的系统100。
图2是用于通过对光谱进行比较来识别与样本物质匹配的参考物质的方法200的流程图。
图3A是具有匹配得分87.6%的2-糠醛的原始结果。图3B根据本发明的实施例示出了具有匹配得分96.2%的2-糠醛的经迭代优化的限幅校正和显示结果。图3C根据本发明的实施例示出了具有匹配得分97.6%的2-糠醛的经迭代优化的校正和显示结果。
图4A是具有匹配得分87.8%的苯甲醚的原始结果。图4B根据本发明的实施例示出了具有匹配得分95.4%的苯甲醚的经迭代优化的限幅校正和显示结果。图4C根据本发明的实施例示出了具有匹配得分97.6%的苯甲醚的经迭代优化的校正和显示结果。
图5A示出了根据本发明的实施例的具有HQV 79.8%的异丁酸睾酮的原始结果。图5B示出了根据本发明的实施例的具有HQV 90.4%的异丁酸睾酮的经迭代优化的ATR校正结果。图5C示出了根据本发明的实施例的具有HQV 97.0%的异丁酸睾酮的经迭代优化的校正和显示结果。
图6A示出了具有HQV 57.9%的3,4,3',4'-联苯四羧酸3,4:3',4'-二酐的原始结果。图6B示出了根据本发明的实施例的具有HQV 83.7%的3,4,3',4'-联苯四羧酸3,4:3',4'-二酐的基线校正结果。图6C示出了根据本发明的实施例的具有HQV 89.4%的3,4,3',4'-联苯四羧酸3,4:3',4'-二酐的经迭代优化的校正和显示结果。
图7A示出了根据本发明的实施例的具有HQV 79.3%的阿巴林样本的原始结果。图7B示出了根据本发明的实施例的具有HQV 98.3%的阿巴林样本的经迭代优化的结果。
图8展示了可以与根据本发明的实施例的系统和方法一起使用的示例性计算机系统10的框图。
术语
样本的“光谱(spectrum)”对应于数据点集合,其中,每个数据点包括至少两个值。第一值对应于光谱的区别性特性,比如质量或频率。所述特性的区别之处在于:在光谱中基于所述特性的值对粒子进行区分。第二值对应于从具有所述特性的第一值的样本测量的粒子数量。例如,数据点可以提供具有特定质荷比(有时还称为“质量”)的离子数量。
“相似度得分(similarity score)”或命中质量值(hit quality value,HQV)指表明出两种光谱的相似程度的数值。
术语“最优(optimal)”指被确定为在数值上比一个或多个其他值更好的任何值。例如,最优值不一定是最佳可能值,但可以简单地满足标准(例如,代价函数离之前值的变化在容差内)。因而,最优方案可以是并非为那个最佳可能方案的方案,而可以简单地是根据标准比另一种方案更好的方案。这种最优方案涵盖了‘近似最优’方案。
具体实施方式
提供了允许在迭代过程中将样本光谱(例如,被定义为一系列X-Y数据点)与另一光谱进行比较的系统、装置、和方法。所述迭代过程可以对一种光谱的X-Y数据点或对另一光谱应用一次或多次校正。在每次迭代时可以调整校正中的一个或多个参数,从而找到给出光谱之间的最佳匹配的(多个)参数,例如,如由可以针对给定迭代为这两种光谱的匹配指定相对数值的评分算法所定义的。因而,所述一个或多个参数的值可以被迭代地优化。
一旦已经确定了用于(多次)校正的(多个)参数(如评分算法所定义的那样给出了一种光谱与另一经校正光谱的最佳匹配),可以将使用给出了最佳匹配的所述(多个)参数的所述(多次)校正应用于合适的光谱。可以借助对应的参数对两种光谱都进行校正。可以视觉地显示获得(多次)校正之后的光谱,例如通过以重叠、堆叠、或偏移的方式图示地绘制曲线。
在光谱分析应用中,实施例可以允许用户识别参考数据库内的最优光谱匹配并以对人眼更加可辨别的方式对比较结果进行可视化。可以使用各种类型的光谱分析。示例光谱学技术包括红外(近IR、中IR、远IR)、拉曼、质谱分析法(MS)、色谱分析法、核磁共振(NMR)、电子自旋共振(ESR)、X射线衍射(XRD)、X射线荧光(XRF)、荧光、紫外-可见光(UV-Vis)、和太赫兹(THz)。
可以使用各种校正。示例校正包括:限幅校正、水平移位校正、衰减全反射IR(ATR-IR)校正、竖直偏移校正、和基线校正。可以应用这些校正来优化光谱曲线之间的匹配。所述校正可以彼此结合地应用。还可以应用在此未提及的附加校正。
I.系统
可以采取任何合适的方式(可以随光谱学技术不同而不同)获得测试样本和参考样本的光谱。对光谱的分析可以使用任何合适的计算机(逻辑)系统,例如通用计算机到专用电路。下面对示例系统加以描述。
图1根据本发明的实施例展示了用于获得光谱并确定匹配光谱的系统100。如所示的,系统100包括样本保持器110内的样本105(例如,溶剂、类固醇、或工业材料,如油漆或染料)。样本105可以具有其光谱可被获得的任何类型的物质(例如,有机化合物和无机化合物),并且可以包括混合物。
由检测器120检测来自样本的物理特征115(比如各种波长的光强度)。在一些实施例中,光源(未示出)可以发射波长范围内的光(例如,红外光),并且检测器120可以检测被透射穿过样本的光的强度。在其他实施例中,可以使用其他设备,例如,质谱仪的其他部件。在这种情况下,检测器120可以包括除检测器以外的其他部件,例如用于制备(例如,样本的电离分子和控制分子)的部件。
可以将检测到的信号125从检测器120发送至逻辑系统130。检测到的信号125可以包括与各波长处的强度峰值相对应的电信号。因而,信号125可以用来创造样本105的样本光谱。在一个实施例中,模数转换器可以将模拟信号转换成数字形式,以便由逻辑系统130处理。模数转换器可以在检测器120内或逻辑系统130中,或者两者之间。来自信号125的数据可以存储在本地存储器135或外部存储设备145中。
逻辑系统130可以是,或者可以包括,计算机系统、ASIC、微处理器等。其还可以包括或者与显示器(例如,监视器、LED显示器等)和用户输入设备(例如,鼠标、键盘、按钮等)相耦合。逻辑系统130和其他部件可以是独立的或网络连接的计算机系统的一部分,或者它们可以直接附接于或者并入任何检测设备中。逻辑系统130还可以包括在处理器150中执行并且可以实现在此所描述的方法的优化软件。
对于IR光谱分析,样本105通常是液体或气体形式。产生的光谱可以是曲线。样本保持器可以是管子,并且样本可以行进穿过所述管子。光源可以位于特定位置,其中,检测器位于管子的相反侧。在各实施例中,光源可以提供光的光谱,其中,可以对检测到的信号进行去卷积(例如,使用傅里叶变换)来确定任何一个波长处的强度,或者光源可以转动经过一次应用一个的波长。可以使用其他配置,例如采用ATR-IR。
一旦获得了样本光谱,处理器150就可以将所述样本光谱与参考光谱数据库140中所存储的任何数量的参考光谱进行比较。参考光谱数据库140可以包括各种数量的参考光谱(例如,250,000),并且可以将所述参考光谱的全部或一部分与样本光谱进行比较。参考光谱数据库140可以包括可能属于不同类型的光谱,比如透射IR和ATR-IR。
II.优化校正值
通常,将利用校正参数的预定值对样本光谱仅校正一次。这种校正是在与参考数据库中的参考光谱进行任何比较之前提前完成的。然后将把这一个经校正样本光谱与参考光谱进行比较从而找到匹配的光谱。由于校正是在任何比较之前完成的,所以校正值可能不是最优的。并且,校正值对于每次比较而言将是固定的,这可能会造成对一些参考光谱的较差匹配。相应地,提前确定校正值是对什么校正值较好的最佳猜测,但最终,提前校正可能并不对所使用的所有参考光谱都非常准确。进一步,根据美国试验与材料学会(ASTM)的标准用于仅校正样本光谱,这会进一步限制一次校正的适用性。
相反,实施例能够优化所述(多个)校正值从而获得经优化相似度得分,所述经优化相似度得分提供了这两种光谱的更准确比较。可以使用校正参数的默认值,但校正值将是动态的并且它们可以迭代地变化从而提供最优相似度得分。校正参数的最优值对于每对光谱可以不同。例如,可以对于一个参考光谱相对于另一参考光谱以不同的方式校正样本光谱。为了确定最优值,可以在这两种光谱之间进行许多比较,每次比较针对不同的校正值集合。
以这种方式,可以确定用于每对光谱的最优校正,从而提供任意两种光谱的最优相似度得分。并且,计算机系统可以自动地判定哪些参考光谱与样本光谱最接近。由于相似度得分用于确定最优方式,对于最相似的参考光谱的识别可以更加准确。可以显示给定的一对光谱的最终经校正光谱以及最相似光谱,以供用户直观地检查相似度。
III.方法
图2是用于通过对光谱进行比较来识别与样本物质匹配的参考物质的方法200的流程图。方法200的全部或一部分可以由计算机系统执行。计算机系统可以附接至可获得样本光谱的检测器,可以是所述检测器的一部分,或者可以另外与所述检测器通信。例如,可以使用系统100的全部或部分执行方法200。
在框201,接收样本物质的样本光谱。可以从检测器接收所述样本光谱。所述样本光谱具有区别性特性的多个区别性值中的每一个区别性值的强度值。所述区别性特性可以对应于作为光谱的基础的任何物理特性。例如,质量、波长、或频率是区别性特性的示例。所述样本光谱可以作为一系列X-Y数据点被接收,例如针每个点的强度值是指定值。
可以针对多种参考物质中的每一种执行框202至209。每种参考物质可以具有相应的参考光谱,例如,存储在数据库中。对于每种不同的参考光谱,可以在不同的处理器或线程上并行执行框202至209的操作。
在框202,对于对应的参考物质,针对所述对应的参考物质从数据库检索参考光谱。所述参考光谱具有区别性特性的多个区别性值中的每一个区别性值的强度值。所述样本光谱和所述参考光谱会具有比用于比较的所述多个更加有差异的值。所检索到的参考光谱可以是列表中的下一光谱。
在框203,为一个或多个校正参数初始地选择一个或多个校正值。在以下章节中提供了校正参数的示例。在一些实施例中,可以仅使用一个校正参数的一个校正值。在其他实施例中,可以使用多个校正值,每个校正值针对不同的校正参数。在各实施例中,至少一些初始值可以被选定以不提供对特定参数的校正或者可以被基于之前的经验选定。
可以针对多次迭代中的每次迭代执行框204至208。迭代的次数可以取决于一种或多种收敛准则。当满足所述一种或多种收敛准则时,迭代循环可以终止。
在框204,将所述一个或多个校正参数的所述一个或多个校正值应用于所述样本光谱和所述参考光谱中的至少一项。在一些实施例中,可以将所有的校正值应用于样本光谱。在其他实施例中,可以将所有的校正值应用于参考光谱。在又另一实施例中,可以将校正值中的一些应用于样本光谱并且可以将其他校正值应用于参考光谱。一方面,一个校正值仅可以应用于一种光谱。
在应用校正值以后,可以获得经校正的样本光谱和/或经校正的参考光谱。一些校正值可以被同时应用,例如用于ATR-IR转换。一个或其他校正值可以独立于其他校正值地应用。可以顺序地或并行地应用所述校正值,条件是它们所需的任何校正值被一起应用。
在框205,计算所述样本光谱与所述参考光谱之间由于应用所述一个或多个校正值而产生的相似度得分。例如,相似度得分可以是经校正样本光谱与参考光谱之间的、样本光谱与经校正参考光谱之间的、或经校正样本光谱与经校正参考光谱之间的。
可以基于每个区别性值处的强度值之差来确定相似度得分。这些差可以被单独地或共同地视为这两种光谱之间的距离。可以使用各种技术来确定这两种光谱之间的总距离。例如,可以使用欧几里德距离或一阶导数欧几里德距离。可以将相似度得分规范化成位于0与100或任何两个其他数字之间。
在框206,判定相似度得分是否满足一种或多种收敛准则。收敛准则可以涉及一个或多个之前迭代的相似度得分与当前迭代的相似度得分的比较。例如,一旦相似度得分在指定次数的迭代(例如,两次或三次)内改变不大于指定的量,则对校正值的优化可以被视为收敛的。
在框207,当相似度得分满足所述一种或多种收敛准则时,将当前相似度得分标识为与所述一个或多个校正参数的一个或多个经优化值相对应的经优化相似度得分。经优化值对应于用来获得经优化相似度得分的校正值。
在框208,当相似度得分不满足所述一种或多种收敛准则时,更新所述一个或多个校正值以用于执行另一次迭代。可以采用各种方式更新所述一个或多个校正值。例如,可以在其他校正值固定的情况下改变每个校正值从而确定最优值,如下面更加详细描述的。相应地,所述一个或多个校正参数的最优值可以是顺序地确定的,并且可以在保持任何之前的校正参数恒定在之前所确定的最优值的同时确定下一校正参数的最优值。在其他实施例中,可以同时更新校正值的全部或一部分。
在框209,将经优化相似度得分与阈值进行比较,从而判定参考样本是否是样本物质的潜在匹配。可以采用各种方式来指定阈值。例如,阈值可以对应于最高的N个经优化相似度得分(或最高的X%),并且因此可以在针对参考物质确定了所有经优化相似度得分之后执行框209。最高的N个或最高的X%可以涵盖一等级的经优化相似度得分。作为另一示例,所述阈值可以是经优化相似度得分的绝对值。
在框210,输出与参考物质中具有高于阈值的经优化相似度得分的一种或多种参考物质有关的数据。所述数据可以是各种形式。作为示例,所述数据可以包括相应的参考物质中的每种参考物质的标识符。所述数据可以包括经优化相似度得分本身。所述数据可以包括参考光谱(可以是经过校正的),其中的每个参考光谱都可以结合样本光谱来显示。在各实施例中,通过使用所述一个或多个校正参数的所述一个或多个经优化值以重叠、堆叠、或偏移的方式绘制样本光谱和第一参考光谱的曲线,可以输出所述数据。
相应地,实施例可以执行光谱数据的匹配(例如,曲线)。实施例还可以用来匹配所有类型的曲线,例如将一个公司的历史股票价格图表与另一公司的进行比较。为了完成匹配,在迭代过程中,可以将(被定义为一系列X-Y数据点的)曲线与另一曲线进行比较。
IV.校正类型
可以使用各种校正参数。多个校正参数可以具有相同的校正类型(例如,用于ATR-IR校正)并因此总是被一起应用。其他校正参数可以被独立地应用。一些校正参数将仅应用于特定的光谱,例如,样本光谱或参考光谱,同时其他校正参数可以应用于两者中的任何一种(例如,基线校正可以应用于两者中的任何一种)。并且,一些校正最多仅可以应用于一种光谱,例如限幅校正、ATR-IR校正、以及竖直偏移通常将仅应用于一种光谱。
如果未使用校正参数,可以将值设为零或其他不提供校正的值。特定的校正还可以简单地不被应用。校正可以被应用于样本光谱或者正与样本光谱进行比较的参考光谱。在应用任何校正之后确定相似度得分。
A.限幅校正
根据ASTM的“Standard Guide for Use of Spectral Searching by CurveMatching Algorithms with Data Recorded Using Mid-Infrared Spectroscopy(用于使用通过曲线匹配算法利用使用中红外光谱分析所记录数据进行的光谱搜索的标准指南)”E2310-04(2009)第5.1.1节,针对为保证参考光谱曲线的Y值以及未知询问光谱曲线的Y值具有弯曲相同范围的数据预处理,执行规范化:“光谱规范化补偿了用来生成库中的参考光谱的样本量(浓度或路径长度、或两者)与未知物的量的差异。”所述段落进一步陈述了:“如果针对规范化选择的范围仅具有光谱中的一个或多个强带和几个中强度带,光谱的范围必须被重新选定或者光谱将由光谱中的强带主导并且HQI(命中质量指标)将对识别特定的化合物所必需的较弱酶解图谱带不敏感。”之后,在第7.4节,指南中说到对光谱的规范化在区分相似光谱方面起关键作用。
对光谱进行规范化以使未知样本的光谱曲线与已知参考化合物的光谱匹配的工业标准实践不总是产生最优结果。如ASTM指南所解释的,如果被比较的这两种光谱中最大峰值的强度不具有完全相同的Y轴强度,搜索算法会使较小带模糊。为了克服这个问题,ASTM推荐将一个或多个最大峰值从搜索排除,但这种方式有两个缺点:第一,排除最大波峰导致其对命中质量值(相似度得分的示例)的贡献变成零,这是不期望的。第二,如果光谱曲线中存在若干大峰值,决定应该排除哪个会变得困难(如果手动完成的话)。
在一些实施例中,限幅校正参数可以自动地限幅(多个)最大峰值,同时保留其对命中质量值的贡献。询问光谱曲线可以被称为曲线Q,同时库(参考)光谱曲线可以被称为曲线L。限幅校正参数指定了任意峰值对命中质量值的最大贡献。例如,如果特定区别性值处的强度值高于限幅值,则对命中质量值的计算将使用限幅值代替实际强度值。
在实施例的预先处理步骤中,可以从光谱中的所有强度值减去光谱中的最小强度值。然后可以用光谱中的最大强度值除以强度值来缩放产生的强度值。这些操作的结果是具有在从0到1范围内的强度值的光谱。如果被执行,这个预处理步骤被应用于曲线Q和L两者。
通过使光谱内位于C以上的所有强度值被截断至限幅值C来实现限幅校正。可以逐渐地调整限幅值C,例如采取方法200的迭代或采取子迭代在其他校正参数固定的情况下确定最优C。可以在为最佳可能HQV找到C的每次限幅操作之后确立命中质量值(HQV)。可以使用众所周知的搜索算法中的任何一种来确定HQV值,比如欧几里得距离或一阶导数欧几里德距离。在各实施例中,可以在改变曲线Q的同时保持曲线L恒定的情况下或在改变曲线L同时保持曲线Q恒定的情况下重复所述过程。可能必须限幅或者在曲线Q中或者在曲线L中的峰值从而接收最佳HQV。
在一些实施例中,通过使用二进制算法找到最优C。可以使用最小允许C1/3(或其他值),因为较小的限幅值会导致发现没有意义的光谱匹配。可以计算以下C值的HQV:1、3-1/4、3-1/2、3-3/4、和3-1。如果使用了任何其他校正参数,其值可以保持恒定在例如之前确定的最优值。最佳HQV情况下C的值被用作以下二进制近似算法的起始点。
前述的和接下来的C值限定了被切割成两半的区间。计算这两个半区间中的每个的中点的HVQ。更好的HQV值定义了有待用作下一切割步骤的区间的半区间。重复所述过程,直到区间变得非常小(例如,10-7),这对应于收敛准则的示例。如果产生的C值非常接近最小允许值1/3,可以假定限幅优化已经失败。产生的最优C值定义了曲线的将对HQV没有贡献(除非发现C恰好是1)的限幅区域。
作为方法200的框208的一部分,可以执行这个产生的最优C值。可以采用这种方式更新校正参数中的每一个,例如同时保持其他校正参数固定。其他校正参数可以被保持固定在前一次迭代中所确定的值。方法200中的每次迭代可以涉及以这种方式确定(多个)校正参数的(多个)新值。
B.水平移位校正
由于在仪器上采集光谱的方式的差别,Q和L可能未完美地水平对齐,即使Q和L是从完全一样的物质采集的。可以使用以下方程来确定经校正的区别性值:υcorr=υ+H,其中,水平移位参数H对区别性参数υ(例如,波长)进行移位,从而使得X-Y数据点具有新X值。在一些实施方式中,水平移位参数H可以在从-3到3cm-1范围内。实施例可以用上文针对限幅参数所描述的二进制算法确定校正参数H的最优值。假定最佳HQV情况下H的值以最佳地描述水平移位。
C.ATR-IR校正
可以通过透射经过样本的IR辐射的量(透射IR)或者通过在被反射离开样本时衰减的IR辐射的量(衰减全反射IR、或ATR-IR)测量红外(IR)光谱。因而,存在两种不同类型的光谱。一种类型产生透射IR光谱,例如,使用傅里叶变换红外光谱(FTIR),并且这种类型产生ATR-IR光谱。所述光谱稍微不同,并因此不能直接互相比较。例如,峰值稍微不同,强度稍微不同,并且在X轴上存在移位。但是,在进行校正之后,可以比较来自这两种类型的光谱。允许这两种类型的光谱之间的比较允许搜索更大的参考光谱集合以找到匹配。ATR-IR目前生产更便宜,并且因此现在存在更多的ATR-IR光谱。以往,存在更多的透射IR数据,并因此经常执行ATR-IR样本光谱到透射IR光谱的转换。
然而,选择用于转换的良好的校正值是不容易的。通过优化HQV来确定用于转换的最优校正参数可以提供良好的校正值。以这种方式,可以对每一对光谱进行单独转换。
更详细地,在比较ATR-IR和透射IR光谱时发生Y轴吸收的取决于波长的变化,但常用的数学校正函数允许使ATR-IR光谱与透射IR光谱可比较,从而使得可以使用传统光谱曲线匹配算法。因此,在把ATR-IR光谱与透射IR光谱进行比较时或反之亦然,产生的HQV将较差,直到应用校正函数将一个转换成另一个。存在若干种考虑了各种参数(比如,渗透深度、晶体和样本的折射率、以及入射角度)的用于转换的方法。
不幸的是,在进行搜索时,这些参数可可能不是可用的。一种合理地工作良好的量化方法是使用以下转换函数:IC=I·(1+(υ-υ0)/υ0),其中,IC是经校正强度,I是原始强度,υ是数据点的波数,并且υ0是光谱中第一数据点的波数,这是第一数据点的第一区别性值的示例。经验已经表明需要通过引入峰值强度偏移F:IC=I·(1+F·(υ-υ0)/υ0)来修改上述转换函数。
F的合理值表现得位于2/3与3/2之间。这个范围以外的任何值可以指示存在可能导致不正确指定的光谱的问题。如上所述,实施例可以找到最优因数F,例如使用二进制算法。假定最佳HQV情况下F的值以描述最佳ATR-IR校正。
除了峰值强度移位以外,实施例还可以使用朝较低波数的水平移位,所述水平移位并非恒定但取决于最大峰值强度。对X轴移位的改进校正可以考虑这一点。峰值越高,它移位地越多。不幸的是,对光谱中所有峰值的彻底确定需要光谱去卷积,并且完成这一点的必需处理时间使其难以在光谱搜索过程中被使用,在光谱数据搜索中潜在地将要比较成千上万的光谱。一种更简单的方式确定了峰值集群,所述峰值集群被与其他集群充分地分开以让强度值落在集群之间的某个阈值以下。
实施例可以使用最小强度阈值4%。每个集群内的最大强度阈值hc可以用于通过以下方式对这个集群内的所有强度值进行X轴校正:υcorr=υ+H·hc。作为示例,ATR校正过程中应用的水平移位参数H可以在0至10cm-1范围内。在一些实施方式中,具有低于最小强度阈值的强度值的光谱区域不水平地移位。
如果使用上述水平移位参数H进行ATR-IR校正,则将不执行第IV.B节中所述的水平移位。进一步,H的一个值可以用于所有集群。实际水平移位随着集群变化之处在于,每个集群内的(变化的)最大强度值hc用来判定要将这个集群移位多少。
除了上文所述经参数F校正的强度变化以外,存在可能导致较高峰值中最高者在Q和L之间不同的非偏振效应。为了弥补这些变化,以下方程引入了偏振调整参数P并且被应用于位于光谱的最大强度的指定部分(例如,50%)以上的所有强度值:IC=0.5+(I-0.5)·(1-(1-P)·hc),其中,hc是每个集群内的最大强度值。假定P的示例值在1/3与1之间。实施例可以在二进制优化过程中确定参数P,如进一步描述的。假定最佳HQV情况下P的值以最佳地描述非-偏振效应。基于P针对区别性值的集群减小高于指定量的强度值,其中,所述减小与所述集群的最大强度成比例。可以独立地优化参数F、H、和P,例如,正如其他校正的参数一样。
D.竖直移位校正
与Q和L之间的潜在水平移位类似,Q和L的基线可能不是完美对齐的。这种效果可能是由例如基线中的小的朝下的毛刺或抖动造成的。在以下方程中IC=I+V,通过竖直偏移校正强度。因而,所有的强度将被移位固定的量。作为示例,竖直偏移参数V可以在从-0.07到0.07(-7到7%)范围内。实施例可以将因数V应用于二进制算法,如上所述。可以假定最佳HQV情况下V的值以最佳地描述竖直偏移。竖直偏移参数V可以结合ATR-IR转换校正使用。
E.基线校正
良好的基线会对使用欧几里得算法或欧几里得相关算法来确定HQV的任何光谱比较是重要的。通常,不容易准确地确定基线应该在哪里,尤其是当较大的峰值几乎不让光谱回落至其自然基线时。基线校正可以固定基线中的倾斜,而竖直偏移可以动态地竖直地移动光谱直到实现最佳HQV。在一些实施方式中,基线校正是静态(一次性,是或否)操作,同时竖直偏移是被动态优化的。
一些实施例可以对Q和L两者应用基线校正,运行上文所提及的所有计算来以下述组合产生四个不同HQV值:Q对L、Q(基线经校正)对L、Q对L(基线经校正)、以及Q(基线经校正)对L(基线经校正)。假定来自这四个选项的最佳HQV值以最佳地描述(多种)必要的基线校正。基线校正本身是试图找到基线中的点并通过线将其连接的自动算法。然后将光谱中的强度值减去所述线中的强度值以产生经校正光谱。可以使用任何合适的自动基线校正算法,如本领域技术人员将了解的,例如,如以下文献中所描述的:Lan等人,2007年10月10日,中国光学快报(Chinese Optics Letters),第5卷第10篇,“对红外光谱的自动基线校正(Automatic baseline correction of infrared spectra)”;以及Yu等人,2013年,关于信号处理、模式识别和应用(SPPRA)的IASTED国际会议(IASTED International Conferenceon Signal Processing,Pattern Recognition and Applications(SPPRA)),“A NewApproach For Spectra Baseline Correction Using Sparse Representation(用于使用稀疏表示进行光谱基线校正的新方法)”,所述文献通过引用结合在此。
在其他实施例中,可以与其他校正参数用一样的方式确定基线校正,例如通过在保持其他校正参数固定的同时确定内循环中的最优值。内循环结束时的校正参数则可以用来确定与外循环中的前一HQV值进行比较的HQV。
例如,实施例可以应用以下形状的线性基线校正函数:IC=I-B·(υ0-υ)/(υ10)或IC=I-B·(υ-υ1)/(υ10),其中,υ1是光谱中最后一个数据点的波数,并且B是经迭代优化的基线调整因数。可以假定光谱中的最大强度值是1。第一个函数使基线固定从左向右朝下倾斜,同时后者朝向倾斜。可以通过应用如上所述的同一二进制算法确定这两个函数中的哪一个工作地最好。最佳结果HQV情况下B的值被视为用于最适当地描述基线。经验表明B的合理值位于0与0.2之间。可以使用各种其他函数,比如线性函数、多项式函数、手动点确定、或自动点确定。
V.更新校正值以用于下一次迭代
可以将校正参数组合以产生校正值集合。例如,可以将五个单独的经迭代优化的校正C、H、F、P、和V组合以产生描述为了提供最佳可能的HQV对曲线Q的必需预处理的值集合。实施例可以进一步包括B(或在此未提及的其他参数),或包括更少的参数。
如上文所提及的,实施例可以首先使用默认值确定初始相似度得分。例如,可以针对C、H、F、P、和V的默认值(1、0、1、1、和0)计算HQV。然后,可以更新校正值从而获得达到已更新相似度得分的新的校正值集合,可以将所述已更新相似度得分与之前的相似度得分(第一次迭代初始的)进行比较。如果所述已更新相似度得分比之前的相似度得分更好,则可以接受所述已更新相似度得分。可以重复所述步骤直到之前的与已更新的HQV之差变得最小(例如,10-7)。这些步骤可以是外循环的一部分。
可以采用各种方式确定已更新的校正值集合。在一些实施例中,可以同时更新所有的校正值,并且可以在不计算任何中间相似度得分的情况下计算已更新相似度得分。在其他实施例中,可以通过内循环单独地优化集合中的每个校正参数,其中,确定中间相似度得分为对特定校正参数的优化的一部分被。针对外循环对整个集合的更新可以是在对校正参数中的每个校正参数的单独优化结束时获得的最优校正值,如在下一节中所描述的。在又另一实施例中,校正参数的子集可以被一起更新(例如,用于ATR校正的参数)并且与所述子集以外的另一校正参数分开。
A.循环通过每个校正参数
如上文所提及的,对校正参数集合的更新可以涉及对每个校正参数的单独优化。因而,在确定初始相似度得分以后,可以改变第一校正参数从而确定最优值,至少在给定其他校正参数的默认值的情况下最优。作为确定最优值的一部分,可以针对第一校正参数的各个值计算相似度得分,并且可以确定最优相似度得分,例如使用上文所述的二进制算法。一旦确定了第一校正参数的最优值,就可以确定第二校正参数的最优值,例如使用之前针对第一校正参数确定的最优值。
相应地,可以采用以下方式确定第一校正参数的最优值。对于多次子迭代中的每次子迭代,可以在所述第一校正参数的多个校正值中的每个校正值处计算样本光谱与参考光谱之间由于应用校正值集合(即,针对所有校正参数的集合)而产生的相似度得分。因而,可以使用多个校正值集合,其中,集合的差异仅在于对于第一校正参数具有不同的值。可以识别所述校正值集合处的最高相似度得分。可以判定所述最高相似度得分是否满足一个或多个其他收敛准则。当所述最高相似度得分满足所述一个或多个其他收敛准则时,可以将第一校正参数的值标识为第一校正参数的最优值。当所述最高相似度得分不满足所述一个或多个其他收敛准则时,可以基于与所述最高相似度得分相对应的校正值集合确定用于下一次子迭代的新校正值。
例如,如果方法开始于限幅校正,实施例可以调整限幅参数直到HQV最佳。这种调整可以在子迭代中完成,可以针对每个校正参数在内循环中执行所述子迭代。并且然后,过程可以前进至下一参数,例如对于ATR校正参数。所以现在,过程可以调整第一ATR校正参数直到匹配再次变得最佳。过程可以前进以对所有不同的校正参数做到这一点,直到获得的完整的已更新集合。这可以标志外循环的一次迭代的结束。
然后可以针对已更新集合确定相似度得分(例如,作为最后一个校正参数的最优值的相似度得分)。在获得校正参数的已更新集合之后,可以通过使用从外循环的之前迭代获得的其他校正参数的最优值优化限幅校正来执行外循环的下一次迭代。可以与得到收敛所必需的一样多次数地执行此循环的迭代,例如,相似度得分从一次迭代到另一次迭代不明显地变化。因而,我们可以获得给定的一对光谱(即,一个特定询问光谱、和一个特定的库光谱)的最终最佳相似度得分。
B.确定一个校正参数的最优值
如上文所提及的,在内循环中可以一次一个校正参数地完成校正参数的最优值的确定。这种优化可以使用二进制搜索算法。例如,实施例可以在开始时选择校正参数的五个不同值并针对这些值计算所有的HQV。这两个最佳顺序HQV可以被确定并用来定义用于进一步研究的校正参数的区间。
可以将新的更小的区间分割成两半,其中,在中间有新的校正值,并且在区间的1/4和3/4有两个其他新的值。可以针对校正参数的这三个值确定相似度得分。可以再次确定这两个最佳顺序HQV,并且可以再次将区间分割成两半,直到最终的HQV不改善超过指定的收敛准则(例如,1e-7)。可以采用同样的方式优化其他参数。
C.相似度得分(HQV)
可以采用各种方式来确定相似度得分。例如,相似度得分可以被确定为这两种光谱之间的距离,其中,相应的强度值(即,在同一区别性值时)之差用来确定所述差。因而,这两种光谱中的每一种可以被定义为N个数据点,并且可以确定这些点之间的距离。
一种技术是欧几里得距离算法。为了确定所述距离,一个实施例计算每两个强度值之积。例如,如果存在询问Q和参考R,则可以确定每个QI和RI值的积(例如,将两个相应值中的每一个相乘)。将积加起来以获得这些乘法的总和。因而,以这种方式可以确定两条光谱曲线Q·R的点积(是范数之积)。询问的第一光谱的均方范数||Q||2将是QI值平方之和。并且,参考光谱的均方范数||R||2将是RI值平方之和。距离则可以被计算为
Figure GDA0002399720760000181
通过除以任意一个范数对结果进行规范化,例如,
Figure GDA0002399720760000182
对于这个距离,零是完美匹配,并且一意味着完全不匹配。可以将这个零到1的范围转换成其他范围,例如零到100范围或零到99范围。
VI.显示最高匹配光谱
如针对方法200所描述的,可以针对每一对光谱(例如,样本光谱与库中的每个参考光谱)获得经优化的校正值。还可以针对每一对获得相似度得分。因而,我们可以获得每个库光谱的经优化HQV。可以向研究者提供最高的HQV,例如最高的10个或10%。
除了最高的N个匹配(或最高的N%匹配)的列表之外,实施例可以向用户提供关于什么被校正的视觉反馈。作为示例,可以通过示出没有基线校正的原始光谱、以及基线经校正的光谱来描述基线校正。或者,可以通过显示水平线来表示限幅校正,所述水平线示出了哪里的峰值被限幅。
(任何校正之后)这两种光谱可以一起显示。所计算的参数C、H、F、P、以及V,以及关于(多个基线校正的决策可以用来修改曲线Q和L,从而使得用户获得关于确切地什么数据被反馈给光谱比较算法的最佳可能反馈。在大多数情况下,良好的HQV还将导致视觉上匹配的光谱曲线。
如果光谱比较算法是欧几里得或欧几里得相关,可以根据两种光谱的欧几里得范数来缩放曲线Q。光谱S的欧几里得范数被定义为
Figure GDA0002399720760000183
曲线Q可以乘以(缩放)SL/SQ,从而显得正是像比较算法“看见”输入数据。这种最终缩放可以在应用任何校正参数之前或之后完成。以这种方式,可以采用合适的方式显示光谱从而将其彼此视觉地进行比较。
应用校正参数的顺序可以改变。在一个实施例中,校正参数的顺序可以是基线第一,ATR校正其次,限幅校正,紧跟着是竖直偏移。
VII.示例
以下是使用预定校正值和经优化校正值的示例光谱比较。如从所述示例可见,对人眼存在显著差别。
A.限幅校正
对于限幅校正,比较同一物质的两种光谱。例如,将2-糠醛的两种光谱彼此进行比较。同样,将苯甲醚的两种光谱彼此进行比较。因而,以下示例展示了经迭代优化的限幅校正和相应的显示。
图3A是具有匹配得分87.6%的2-糠醛的原始结果。图3A示出了2-糠醛(实线)的探求光谱310与同一化合物的参考光谱305(虚线)相比的结果显示。使用用于确定相似度得分的相关算法以及行业标准规范化,获得87.6%的HQV。如我们可见的,除了最高峰值以外,许多峰值的高度不同。进一步,对于探求光谱310,从最高峰值的衰退通常更快。
图3B根据本发明的实施例示出了具有匹配得分96.2%的2-糠醛的经迭代优化的限幅校正和显示结果。图3B示出了2-糠醛(实线)的探求光谱320与同一化合物的参考光谱315(虚线)相比的结果显示。仅使用经迭代优化的限幅校正,获得96.2%的HQV。
虚线325表达执行光谱限幅处的竖直位置,即限幅参数的最优值被确定为什么。只将光谱的位于虚线325上方的那些部分从搜索省略。(多个)最大峰值的最高部分仍然被搜索算法考虑。如我们可见的,探求光谱330的峰值中的大部分的高度与参考光谱315相称,除了其值已经被限幅的最高峰值以外。
通常,人们将去除特定的峰值。因而,整个峰值将被排除搜索。对于限幅,与排除整个峰值相反,在确定最优校正参数和相似度得分时仅忽略峰值中的最高者。进一步的虚线325朝向底部,峰值中越来越多的最高部分被排除。在确定相似度得分时,高于水平线的任何强度值将被设置回水平线处的值,即被限幅。
图3C根据本发明的实施例示出了具有匹配得分97.6%的2-糠醛的经迭代优化的校正和显示结果。图3C示出了2-糠醛(实线)的调查光谱340与同一化合物的参考光谱335(虚线)相比的结果显示。使用C、H(第IV.B节)、和V的经迭代优化的校正,获得97.6%的HQV。虚线345表达了进行光谱限幅处的竖直位置。
图4A是具有匹配得分87.8%的苯甲醚的原始结果。图4A示出了苯甲醚(实线)的探求光谱410与同一化合物的参考光谱405(虚线)相比的结果显示。使用相关算法和行业标准规范化,获得87.8%的HQV。如我们可见的,除了最高峰值以外,许多峰值的高度不同。进一步,对于探求光谱410,从最高峰值的衰退通常更快。
图4B根据本发明的实施例示出了具有匹配得分95.4%的苯甲醚的经迭代优化的限幅校正和显示结果。图4B示出了苯甲醚(实线)的探求光谱420与同一化合物的参考光谱415(虚线)相比的结果显示。使用经迭代优化的限幅校正,获得95.4%的HQV。虚线425表达了进行光谱限幅处的竖直位置。如我们可见的,探求光谱420的峰值中的大部分的高度与参考光谱415相称,除了其值已经被限幅的峰值以外。
图4C根据本发明的实施例示出了具有匹配得分97.6%的苯甲醚的经迭代优化的校正和显示结果。图4C示出了苯甲醚(实线)的探求光谱440与同一化合物的参考光谱435(虚线)相比的结果显示。使用C、H(第IV.B节)、和V的经迭代优化的校正,获得97.6%的HQV。虚线445表达了进行光谱限幅处的竖直位置。
B.ATR校正
以下示例展示了经迭代优化的ATR-IR校正和相应的显示。
图5A示出了根据本发明的实施例的具有HQV 79.8%的异丁酸睾酮的原始结果。图5A示出了异丁酸睾酮(实线)的探求光谱510与同一化合物的参考光谱505(红色)相比的结果显示。使用相关算法和行业标准规范化,获得79.8%的HQV。因而,匹配一开始非常差。
图5B示出了根据本发明的实施例的具有HQV 90.4%的异丁酸睾酮的经迭代优化的ATR校正结果。图5B示出了异丁酸睾酮(实线)的探求光谱520与同一化合物的参考光谱515(红色)相比的结果显示。仅使用经迭代优化的ATR-IR校正,获得90.4%的HQV。因而,匹配得到显著地改善,虽然我们仍然能看见这两种光谱之间显著差别。
图5C示出了根据本发明的实施例的具有HQV 97.0%的异丁酸睾酮的经迭代优化的校正和显示结果。图5C示出了异丁酸睾酮(实线)的探求光谱540与同一化合物的参考光谱535(红色)相比的结果显示。使用C、F、H(第IV.C节)、P、和V的经迭代优化的校正,获得97.0%的HQV。虚线545表达了进行光谱限幅处的竖直位置。由于所有的经迭代优化的校正,匹配动态地改进。
C.基线校正
以下示例展示了经迭代优化的基线校正和相应的显示。基线校正被应用于或者询问光谱、参考光谱、两者、或都不,以产生四种情况。对于这些情况中的每种情况,迭代地优化参数。最终使用具有最佳HQV的情况。
图6A示出了具有HQV57.9%的3,4,3',4'-联苯四羧酸3,4:3',4'-二酐的原始结果。图6A示出了3,4,3',4'-联苯四羧酸3,4:3',4'-二酐(实线)的探求光谱610与同一化合物的参考光谱605(红色)相比的结果显示。使用相关算法和行业标准规范化,获得57.9%的HQV。如我们可见的,匹配非常差。具体地,由于基线误差,左侧的区域具有明显比参考光谱605更高的探求光谱610。这种差别将可能不会识别这两种光谱之间的可能匹配。
图6B示出了根据本发明的实施例的具有HQV 83.7%的3,4,3',4'-联苯四羧酸3,4:3',4'-二酐的基线校正结果。将基线校正应用于询问光谱。图6B示出了3,4,3',4'-联苯四羧酸3,4:3',4'-二酐(实线)的探求光谱620与同一化合物的参考光谱615(红色)相比的结果显示。仅使用基线校正,获得83.7%的HQV。如我们可见的,基线误差动态地减小。
图6C示出了根据本发明的实施例的具有HQV 89.4%的3,4,3',4'-联苯四羧酸3,4:3',4'-二酐的经迭代优化的校正和显示结果。图6C示出了3,4,3',4'-联苯四羧酸3,4:3',4'-二酐(实线)的探求光谱640与同一化合物的参考光谱635(红色)相比的结果显示。使用C、H(第IV.B节)、和V的经迭代优化的校正,并使用应用于询问光谱的基线校正,获得89.4%的HQV。虚线645表达了进行光谱限幅处的竖直位置。伴随所有的经迭代优化的校正,这两种光谱明显地匹配。
D.阿巴林
以下示例展示了对于阿巴林的经迭代优化的校正和相应的显示。结果显示了,将对原始结果识别不正确的匹配,同时对经迭代优化的校正识别了正确的匹配。
图7A示出了根据本发明的实施例的具有HQV 79.3%的阿巴林样本的原始结果。对于与阿巴林参考光谱的比较,获得了79.3%的HQV。HQV的79.3%低于其他物质的第50个结果,这低于光谱学家将识别为潜在匹配的。因而,使用原始结果将得到对参考物质的非正确识别。
图7B示出了根据本发明的实施例的具有HQV 98.3%的阿巴林样本的经迭代优化的结果。由于限幅校正、水平移位、和竖直偏移的经优化值,与阿巴林参考光谱的比较提供了98.3%HQV,这是结果列表中的第一匹配。因而,获得了对物质的正确识别。在本示例中,用于所述校正的经优化值如下:(1)询问光谱的最高44.0%被限幅;(2)询问光谱被水平地偏移-10.5cm-1;以及(3)询问光谱被竖直地偏移1.2%。
VIII.计算机系统
本文中所提及的计算机系统中的任何计算机系统可以利用任何适当数量的子系统。在图8中,在计算机系统10中示出了这种子系统的示例。在一些实施例中,计算机系统包括单个计算机装置,其中,子系统可以是计算机装置的部件。在其他实施例中,计算机系统可以包括具有内部部件的多个计算机装置,每一个计算机装置是子系统。计算机系统可以包括台式和膝上计算机、平板、移动电话和其他移动设备。
图8中所示出的子系统经由系统总线75互连。示出了如打印机74、键盘78、(多个)存储设备79、耦合至显示适配器82的监视器76等附加子系统。可以通过本领域中已知的任何数量的如输入/输出(I/O)端口77(例如,USB、
Figure GDA0002399720760000221
)等装置来将耦合至I/O控制器71的外围设备和输入/输出(I/O)设备连接至计算机系统。例如,I/O端口77或外部接口81(例如,以太网、Wi-Fi等)可以用于将计算机系统10连接至如互联网等广域网、鼠标输入设备或扫描仪。经由系统总线75的互连允许中央处理器73与每一个子系统通信并控制对来自系统存储器72或(多个)存储设备79(例如,如硬盘驱动器或光盘等固定盘)的指令的执行、以及子系统之间信息的交换。系统存储器72和/或(多个)存储设备79可以对计算机可读介质进行具体化。另一子系统在数据采集设备85,比如照相机、麦克风、加速度计等。在此所提及的数据中的任何数据可以从一个部件输出到另一个部件并且可以输出至用户。
计算机系统可以包括多个相同的部件或子系统,例如,通过外部接口81或通过内部接口连接在一起。在一些实施例中,计算机系统、子系统或装置可以通过网络通信。在这种实例中,一个计算机可以被考虑为客户端,并且另一个计算机可以被考虑为服务器,其中,每一者可以是相同计算机系统的一部分。客户端和服务器中的每一者可以包括多个系统、子系统或部件。
应当理解的是,可以采用控制逻辑的形式使用硬件(例如,专用集成电路或场可编程门阵列)和/或使用具有模块化或集成的通常可编程的处理器的计算机软件来实现本发明的实施例中的任何实施例。如在本文中所使用的,处理器包括同一集成芯片上的单核处理器、多核处理器,或者单个电路板上或网络连接的多个处理单元。基于在此所提供的公开和教导,本领域的普通技术人员将了解和认识到使用硬件和硬件与软件的组合来实现本发明的其他方式和/或方法。
可以使用如例如Java、C、C++、C#、Objective-C、Swift等任何适当的计算机语言或者如使用例如常规或面向对象的技术的Perl或Python等脚本语言来将在本申请中描述的软件部件或功能中的任一者实现为将由处理器执行的软件代码。软件代码可以存储为用于进行存储和/或传输的计算机可读介质上的一系列指令或命令,合适的介质包括:随机存取存储器(RAM)、只读存储器(ROM)、磁介质(比如,硬盘驱动器或软盘)、或光学介质(比如,致密盘(CD)或DVD(数字通用盘)、闪存等)。计算机可读介质可以是这种存储或传输设备的任何组合。
还可以使用被适配用于经由符合各种协议的有线网络、光网络、和/或无线网络(包括互联网)来进行传输的载波信号来对这种程序进行编码和传输。如此,可以使用利用这种程序来编码的数字信号来创建根据本发明的实施例的计算机可读介质。利用程序代码来编码的计算机可读介质可以利用兼容设备封装,或者从其他设备单独提供(例如,经互联网下载)。任何这种计算机可读介质可以驻留在单个计算机产品(例如,硬盘驱动器、CD、或整个计算机系统)上或内,并且可以存在于系统或网络内的不同计算机产品上或内。计算机系统可以包括监视器、打印机、或者用于向用户提供在此所提及的结果中的任何结果的其他合适的显示器。
可以使用包括了可以被配置用于执行这些步骤的一个或多个处理器的计算机系统来完全或部分地执行在此所描述的方法中的任何方法。由此,实施例可以涉及被配置用于可能使用执行对应步骤或对应步骤组的不同部件来执行在此所描述的方法中的任何方法的步骤的计算机系统。尽管被呈现为编号的步骤,但是可以在同一时间或采用不同的顺序来执行本文中的方法的步骤。此外,这些步骤的部分可以与来自其他方法的其他步骤的部分一起使用。而且,步骤的全部或部分可以是可选的。此外,可以使用模块、电路或者用于执行这些步骤的其他装置来执行这些方法中的任何方法的步骤中的任何步骤。
在不脱离本发明的实施例的精神和范围的情况下,可以采用任何适当的方式来组合特定实施例的特定详情。然而,本发明的其他实施例可以涉及与每一个单独方面、或这些单独方面的特定组合相关的特定实施例。
已经为了说明和描述的目的呈现了对本发明的示例实施例的上述描述。不应认为是穷举式的或者将本发明限制为所描述的精确形式,考虑到上面的教导可以做出许多修改和变更。
除非明确指示有相反的意思,对“一(a)”、“一个(an)”或“所述(the)”的叙述意指“一个或多个”。除非明确指示有相反的意思,对“或”的使用意指“包括性的或”而不是“不包括性的或”。
此处所提及的所有专利、专利申请、出版物和描述出于所有目的通过引用以其全部内容结合在此。不承认任何内容为现有技术。

Claims (21)

1.一种用于通过对光谱进行比较来识别与样本物质匹配的参考物质的方法,所述方法包括由计算机系统执行以下各项:
接收所述样本物质的样本光谱,所述样本光谱具有区别性特性的多个区别性值中的每一个区别性值的强度值;
针对多种参考物质中的每一种:
从数据库中检索相应参考物质的参考光谱,所述参考光谱具有所述区别性特性的所述多个区别性值的强度值;
初始地选择一个或多个校正参数的一个或多个校正值;
针对多次迭代中的每次迭代:
将所述一个或多个校正参数的所述一个或多个校正值应用于所述样本光谱和所述参考光谱中的至少一项;
计算所述样本光谱与所述参考光谱之间由于应用所述一个或多个校正值而产生的相似度得分;
判定所述相似度得分是否满足一种或多种收敛准则;
当所述相似度得分满足所述一种或多种收敛准则时,将所述相似度得分标识为与所述一个或多个校正参数的一个或多个经优化值相对应的经优化相似度得分;
当所述相似度得分不满足所述一种或多种收敛准则时,更新所述一个或多个校正值以用于执行另一次迭代;
将所述经优化相似度得分与阈值进行比较,从而判定所述参考物质是否是所述样本物质的潜在匹配;以及
输出与所述多种参考物质中具有高于所述阈值的经优化相似度得分的一种或多种参考物质有关的数据。
2.如权利要求1所述的方法,其中,所述一个或多个校正参数是多个校正参数,从而提供多个校正值,并且其中,更新所述多个校正值以用于执行另一次迭代包括:
针对所述多个校正参数中的每个校正参数:
确定所述校正参数的最优值,同时保持其他校正值固定,其中,所述最优值基于对所述相似度得分进行优化;以及
更新所述多个校正值为具有所述最优值。
3.如权利要求2所述的方法,其中,所述多个校正参数的所述最优值是顺序地确定的,并且其中,下一校正参数的所述最优值是在保持任何之前的校正参数恒定在之前所确定的最优值的同时确定的。
4.如权利要求2所述的方法,其中,所述多个校正参数包括第一校正参数,并且其中,确定所述第一校正参数的所述最优值包括:
针对多次子迭代中的每次子迭代:
在所述第一校正参数的多个校正值中的每个校正值处计算所述样本光谱与所述参考光谱之间由于应用所述校正值集合而引起的所述相似度得分;
识别所述校正值集合处的最高相似度得分;
判定所述最高相似度得分是否满足一个或多个其他收敛准则;
当所述最高相似度得分满足所述一个或多个其他收敛准则时,将所述第一校正参数的值标识为所述第一校正参数的所述最优值;
当所述最高相似度得分不满足所述一个或多个其他收敛准则时,基于与所述最高相似度得分相对应的所述校正值集合确定用于下一次子迭代的新校正值。
5.如权利要求1所述的方法,其中,所述一个或多个校正参数包括限幅参数,所述限幅参数指定了有待在计算所述相似度得分时使用的所述样本光谱或所述参考光谱之一的任意区别性值处的最大强度值。
6.如权利要求1所述的方法,其中,所述一个或多个校正参数包括以下各项中的至少一项:水平移位校正和竖直偏移校正。
7.如权利要求1所述的方法,其中,所述一个或多个校正参数包括多个转换校正参数,所述多个转换校正参数用于将透射IR光谱转换成衰减全反射IR光谱或将衰减全反射IR光谱转换成透射IR光谱。
8.如权利要求7所述的方法,其中,所述多个转换校正参数包括偏振调整参数P,所述偏振调整参数P减小区别性值集群的高于指定量的强度值,其中,所述区别性值集群的所述强度值被减小了与所述区别性值集群的最大强度成比例的因数。
9.如权利要求8所述的方法,其中,所述偏振调整参数P用来使用IC=0.5+(I-0.5)·(1-(1-P)·hc)对特定区别性值处的强度I进行校正,其中,IC是经校正强度,并且hc是在包括所述特定区别性值的集群内的最大强度值。
10.如权利要求7所述的方法,其中,所述多个转换校正参数包括水平移位参数H,使用υcorr=υ+H·hc将所述水平移位参数H应用于区别性值υ,其中,υcorr是经校正的区别性值,并且其中,hc是在包括所述区别性值的集群内的最大强度值。
11.如权利要求7所述的方法,其中,所述多个转换校正参数包括峰值强度移位F,使用方程IC=I·(1+F·(υ-υ0)/υ0)将所述峰值强度移位F应用于具体区别性值υ处的强度I,其中,IC是经校正强度,并且υ0是所述多个转换校正参数所应用于的光谱中的第一数据点的第一区别性值。
12.如权利要求1所述的方法,进一步包括:
针对所述多种参考物质中的第一参考物质的第一参考光谱:
在所述多次迭代之前,对所述样本光谱与所述第一参考光谱中的至少一项进行基线校正。
13.如权利要求12所述的方法,进一步包括:
确定第一参考光谱的与以下四个选项对应的四个相应的经优化相似度得分:将所述基线校正仅应用于所述样本光谱、仅应用于所述第一参考光谱、应用于所述样本光谱和所述第一参考光谱两者、以及不将所述基线校正应用于所述样本光谱或所述第一参考光谱;以及
使用所述四个相应的经优化相似度得分中的最高者作为所述第一参考光谱的所述经优化相似度得分。
14.如权利要求1所述的方法,其中,所述阈值是以下各项之一:所述相似度得分的绝对数以及等级。
15.如权利要求1所述的方法,其中,输出与所述参考物质中的所述一种或多种有关的所述数据包括:
使用所述一个或多个校正参数的所述一个或多个经优化值以重叠、堆叠、或偏移的方式来绘制所述样本光谱和第一参考光谱的曲线。
16.如权利要求1所述的方法,其中,所述区别性特性是波长。
17.一种计算机产品,包括存储有多条指令的计算机可读介质,所述指令用于控制计算机系统执行以上方法中的任何一种方法的操作。
18.一种系统,包括:
如权利要求17所述的计算机产品;以及
一个或多个处理器,用于执行存储在所述计算机可读介质上的指令。
19.一种系统,包括用于执行权利要求1-16所述的方法中的任何一种方法的装置。
20.一种系统,被配置用于执行权利要求1-16所述的方法中的任何一种方法。
21.一种系统,包括分别执行权利要求1-16所述的方法中的任何一种方法的步骤的模块。
CN201680013762.2A 2015-03-05 2016-03-03 优化的光谱匹配和显示 Active CN107407629B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562128813P 2015-03-05 2015-03-05
US62/128,813 2015-03-05
PCT/US2016/020715 WO2016141198A1 (en) 2015-03-05 2016-03-03 Optimized spectral matching and display

Publications (2)

Publication Number Publication Date
CN107407629A CN107407629A (zh) 2017-11-28
CN107407629B true CN107407629B (zh) 2020-09-01

Family

ID=56848624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680013762.2A Active CN107407629B (zh) 2015-03-05 2016-03-03 优化的光谱匹配和显示

Country Status (5)

Country Link
US (1) US10152519B2 (zh)
EP (1) EP3265780B1 (zh)
CN (1) CN107407629B (zh)
HK (1) HK1243767A1 (zh)
WO (1) WO2016141198A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107076664A (zh) * 2014-08-20 2017-08-18 国家健康与医学研究院 用于校正红外吸收光谱的方法
DE112019000581T5 (de) * 2018-02-26 2020-12-17 Leco Corporation Verfahren zum Einstufen von Bibliothekstreffern in der Massenspektrometrie
CN108918427B (zh) * 2018-06-06 2021-07-30 北京云端光科技术有限公司 物质检测的方法、装置、存储介质及电子设备
CN109238991A (zh) * 2018-11-14 2019-01-18 中国科学院合肥物质科学研究院 一种高光谱大视场成像光谱仪光谱弯曲校正方法
ES2927136T3 (es) 2019-06-24 2022-11-02 Evonik Operations Gmbh Método para predecir un pienso y/o la materia prima para piensos
AR119230A1 (es) 2019-06-24 2021-12-01 Evonik Operations Gmbh Procedimiento para predecir un pienso y/o una materia prima de pienso
CN113030007B (zh) * 2021-02-10 2023-04-18 河南中烟工业有限责任公司 基于相似度学习算法快速检验烟用香精质量稳定性的方法
CN113673409A (zh) * 2021-08-16 2021-11-19 点靓纳谱(上海)生物医药科技有限公司 一种用于光谱分析的自动收敛光谱校正方法及装置
CN117095771B (zh) * 2023-10-18 2024-02-06 昆山尚瑞智能科技有限公司 一种高精度光谱测量数据优化处理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04364490A (ja) * 1991-06-11 1992-12-16 Siemens Asahi Medeitetsuku Kk Nmrスペクトルの基線補正装置
US20070061091A1 (en) * 2004-03-29 2007-03-15 Robert Schweitzer Method for identifying components of a mixture via spectral analysis
CN1961220A (zh) * 2004-05-03 2007-05-09 核材料总公司 校正两参数谱的方法
EP2284518A1 (de) * 2009-07-31 2011-02-16 Endress+Hauser Conducta Gesellschaft für Mess- und Regeltechnik mbH+Co. KG Verfahren zur Bestimmung eines Parameters, insbesondere des chemischen Sauerstoffbedarfs (CSB), des organischen Gesamtkohlenstoffgehalts (TOC) oder der Konzentration eines oder mehrerer Inhaltsstoffe, einer Flüssigkeitsprobe
US20130096883A1 (en) * 2011-10-17 2013-04-18 Michael S. Bradley Multi-Component Regression/Multi-Component Analysis of Time Series Files
CN103534578A (zh) * 2011-05-16 2014-01-22 瑞尼斯豪公司 确定样本中存在的成分的光谱装置以及方法
EP2757955A1 (en) * 2011-09-20 2014-07-30 GE Healthcare UK Limited Methods of spatial normalization of positron emission tomography images

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6816605B2 (en) * 1999-10-08 2004-11-09 Lumidigm, Inc. Methods and systems for biometric identification of individuals using linear optical spectroscopy
US7973936B2 (en) * 2001-01-30 2011-07-05 Board Of Trustees Of Michigan State University Control system and apparatus for use with ultra-fast laser
AU2005269345B2 (en) * 2004-07-27 2010-08-26 Nativis, Inc. System and method for collecting, storing, processing, transmitting and presenting very low amplitude signals
EP2629094A1 (en) * 2007-01-24 2013-08-21 Carnegie Mellon University Optical biosensors
US7698098B2 (en) * 2008-02-18 2010-04-13 Thermo Electron Scientific Instruments Llc Efficient spectral matching, particularly for multicomponent spectra
CA3097861A1 (en) * 2011-01-21 2012-07-26 Labrador Diagnostics Llc Systems and methods for sample use maximization
EP2895970B1 (en) * 2012-09-14 2018-11-07 InteraXon Inc. Systems and methods for collecting, analyzing, and sharing bio-signal and non-bio-signal data

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04364490A (ja) * 1991-06-11 1992-12-16 Siemens Asahi Medeitetsuku Kk Nmrスペクトルの基線補正装置
US20070061091A1 (en) * 2004-03-29 2007-03-15 Robert Schweitzer Method for identifying components of a mixture via spectral analysis
CN1961220A (zh) * 2004-05-03 2007-05-09 核材料总公司 校正两参数谱的方法
EP2284518A1 (de) * 2009-07-31 2011-02-16 Endress+Hauser Conducta Gesellschaft für Mess- und Regeltechnik mbH+Co. KG Verfahren zur Bestimmung eines Parameters, insbesondere des chemischen Sauerstoffbedarfs (CSB), des organischen Gesamtkohlenstoffgehalts (TOC) oder der Konzentration eines oder mehrerer Inhaltsstoffe, einer Flüssigkeitsprobe
CN103534578A (zh) * 2011-05-16 2014-01-22 瑞尼斯豪公司 确定样本中存在的成分的光谱装置以及方法
EP2757955A1 (en) * 2011-09-20 2014-07-30 GE Healthcare UK Limited Methods of spatial normalization of positron emission tomography images
US20130096883A1 (en) * 2011-10-17 2013-04-18 Michael S. Bradley Multi-Component Regression/Multi-Component Analysis of Time Series Files

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Multivariate Instrument Standardization;Yongdong Wang等;《Anal. Chem.》;19911231;第63卷;全文 *
分子光谱自动检索算法、策略与应用进展;褚小立等;《分析化学( FENXI HUAXUE) 评述与进展》;20140930;第42卷(第9期);全文 *
脐橙品质近红外光谱分析模型传递方法的研究;胡润文;《中国优秀硕士学位论文全文数据库 农业科技辑》;20120515(第5期);全文 *

Also Published As

Publication number Publication date
EP3265780A4 (en) 2018-08-22
US10152519B2 (en) 2018-12-11
CN107407629A (zh) 2017-11-28
HK1243767A1 (zh) 2018-07-20
EP3265780B1 (en) 2019-11-06
US20160259792A1 (en) 2016-09-08
WO2016141198A1 (en) 2016-09-09
EP3265780A1 (en) 2018-01-10

Similar Documents

Publication Publication Date Title
CN107407629B (zh) 优化的光谱匹配和显示
Gerretzen et al. Boosting model performance and interpretation by entangling preprocessing selection and variable selection
CN103534578B (zh) 确定样本中存在的成分的光谱装置以及方法
EP3066435B1 (en) Texture analysis of a coated surface using pivot-normalization
Boulet et al. Pretreatments by means of orthogonal projections
WO2018025361A1 (ja) 分析データ処理方法及び分析データ処理装置
EP2705338B1 (en) Estimation of background radiation in spectral data by polynomial fitting
WO2016035626A1 (ja) 分光定量方法、分光定量装置及びプログラム
Liland et al. ROSA—a fast extension of partial least squares regression for multiblock data analysis
Salvatore et al. Classification methods of multiway arrays as a basic tool for food PDO authentication
US11726034B2 (en) IR spectra matching methods
Roger et al. A review of orthogonal projections for calibration
Pierce et al. Pixel-level data analysis methods for comprehensive two-dimensional chromatography
Jiang et al. Classification of Chinese soybean paste by fourier transform near-infrared (FT-NIR) spectroscopy and different supervised pattern recognition
WO2018103541A1 (zh) 用于去除溶剂干扰的拉曼光谱检测方法和电子设备
CN107389592A (zh) 一种复杂样品光谱信号选择性集成预处理建模方法
Diaz et al. Domain invariant covariate selection (Di-CovSel) for selecting generalized features across domains
Livanos et al. Deconvolution of petroleum mixtures using mid-FTIR analysis and non-negative matrix factorization
Li et al. An improved ensemble model for the quantitative analysis of infrared spectra
US20220252516A1 (en) Spectroscopic apparatus and methods for determining components present in a sample
CN110632024B (zh) 一种基于红外光谱的定量分析方法、装置、设备以及存储介质
Chen et al. Supervised clustering of variables
Andrey Bogomolov et al. Software for interactive curve resolution using SIMPLISMA
CN113674814B (zh) 一种光谱定量分析模型的构建方法及装置
CN104502305B (zh) 基于小波变换的近红外光谱有用信息分辨方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1243767

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210111

Address after: new jersey

Patentee after: John Wiley & Sons

Address before: California, USA

Patentee before: Bioradiation Laboratory Co.,Ltd.

TR01 Transfer of patent right