CN110084262B - 用于光谱量化的减少的误报识别 - Google Patents

用于光谱量化的减少的误报识别 Download PDF

Info

Publication number
CN110084262B
CN110084262B CN201910063878.2A CN201910063878A CN110084262B CN 110084262 B CN110084262 B CN 110084262B CN 201910063878 A CN201910063878 A CN 201910063878A CN 110084262 B CN110084262 B CN 110084262B
Authority
CN
China
Prior art keywords
model
unknown sample
spectral
quantization
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910063878.2A
Other languages
English (en)
Other versions
CN110084262A (zh
Inventor
熊章民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Viavi Solutions Inc
Original Assignee
Viavi Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Viavi Solutions Inc filed Critical Viavi Solutions Inc
Priority to CN202210770629.9A priority Critical patent/CN115293233A/zh
Publication of CN110084262A publication Critical patent/CN110084262A/zh
Application granted granted Critical
Publication of CN110084262B publication Critical patent/CN110084262B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/255Details, e.g. use of specially adapted sources, lighting or optical systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/27Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N2021/1748Comparative step being essential in the method
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Image Analysis (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开涉及用于光谱量化的减少的误报识别。设备可以接收识别对未知样本执行的光谱测量的结果的信息。设备可以基于可配置参数确定用于量化模型的决策边界,使得量化模型的第一多个训练集样本在决策边界内,并且量化模型的第二多个训练集样本不在决策边界内。设备可以确定对未知样本执行的光谱测量相对于决策边界的距离度量。设备可以确定量化模型的第二多个训练集样本相对于决策边界的多个距离度量。设备可以提供指示对未知样本执行的光谱测量是否对应于量化模型的信息。

Description

用于光谱量化的减少的误报识别
背景
原料识别可用于药物产品的质量控制。例如,可以对医用材料执行原料识别,以确定医用材料的组成成分是否对应于与医用材料相关联的包装标签。类似地,可以执行原料量化以确定特定样本中特定组分的浓度。例如,可以执行原料量化以确定药物中活性成分的浓度。与其他化学计量技术相比,光谱法可以有助于以减少的准备和数据采集时间进行原料的无损识别和/或量化。
概述
根据一些可能的实施方式,设备可以包括通信地耦合到一个或更多个处理器的一个或更多个存储器。一个或更多个存储器和一个或更多个处理器可以被配置为接收识别对未知样本执行的光谱测量的结果的信息。一个或更多个存储器和一个或更多个处理器可以被配置为基于可配置参数来确定用于量化模型的决策边界,使得量化模型的第一多个训练集样本在决策边界内,并且量化模型的第二多个训练集样本不在决策边界内。一个或更多个存储器和一个或更多个处理器可以被配置为确定对未知样本执行的光谱测量相对于决策边界的距离度量。一个或更多个存储器和一个或更多个处理器可以被配置为确定量化模型的第二多个训练集样本相对于决策边界的多个距离度量。一个或更多个存储器和一个或更多个处理器可以被配置为基于光谱测量的距离度量和第二多个训练集样本的多个距离度量来确定对未知样本执行的光谱测量是否对应于量化模型。一个或更多个存储器和一个或更多个处理器可以被配置为提供指示对未知样本执行的光谱测量是否对应于量化模型的信息。
根据一些可能的实施方式,非临时计算机可读介质可以存储一个或更多个指令。当由一个或更多个处理器执行时,一个或更多个指令可以使一个或更多个处理器获得与特定类型的感兴趣的材料相关的量化模型。量化模型可以被配置用于确定特定类型的感兴趣的材料的样本中的特定组分的浓度。当由一个或更多个处理器执行时,一个或更多个指令可以使一个或更多个处理器接收识别对未知样本执行的特定光谱测量的结果的信息。当由一个或更多个处理器执行时,一个或更多个指令可以使一个或更多个处理器将量化模型的训练集样本的其他光谱测量聚集到用于量化模型的单个类别中。当由一个或更多个处理器执行时,一个或更多个指令可以使一个或更多个处理器将训练集样本的其他光谱测量细分为第一组和第二组。第一组其他光谱测量可以在决策边界内。第二组其他光谱测量可以不在决策边界内。当由一个或更多个处理器执行时,一个或更多个指令可以使一个或更多个处理器确定对未知样本执行的特定光谱测量的度量相对于第二组其他光谱测量的相应的度量满足阈值。当由一个或更多个处理器执行时,一个或更多个指令可以使一个或更多个处理器提供指示未知样本不是特定类型的感兴趣的材料的信息。
根据一些可能的实施方式,方法可以包括由设备接收识别对未知样本执行的近红外(NIR)光谱测量的结果的信息。方法可以包括由设备确定用于量化模型的决策边界,其中,决策边界将量化模型的单个类别划分为在决策边界内的量化模型的第一多个训练集样本以及不在决策边界内的量化模型的第二多个训练集样本。方法可以包括由设备确定对未知样本执行的NIR光谱测量的特定距离度量相对于第二多个训练集样本的其他距离度量满足阈值。方法可以包括基于确定对未知样本执行的NIR光谱测量的特定距离度量相对于第二多个训练集样本的其他距离度量满足阈值,由设备提供指示对未知样本执行的NIR光谱测量不对应于量化模型的信息。
1)一种设备,包括:
一个或更多个存储器;以及
一个或更多个处理器,所述一个或更多个处理器通信地耦合到所述一个或更多个存储器,所述一个或更多个处理器:
接收识别对未知样本执行的光谱测量的结果的信息;
基于可配置参数确定用于量化模型的决策边界,使得所述量化模型的第一多个训练集样本在所述决策边界内,并且所述量化模型的第二多个训练集样本不在所述决策边界内;
确定对所述未知样本执行的所述光谱测量相对于所述决策边界的距离度量;
确定所述量化模型的所述第二多个训练集样本相对于所述决策边界的多个距离度量;
基于用于所述光谱测量的所述距离度量和用于所述第二多个训练集样本的所述多个距离度量,确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型;以及
提供指示对所述未知样本执行的所述光谱测量是否对应于所述量化模型的信息。
2)根据1)所述的设备,其中,所述一个或更多个处理器当确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型时:
确定所述光谱测量不对应于所述量化模型;以及
其中,所述一个或更多个处理器当提供指示对所述未知样本执行的所述光谱测量是否对应于所述量化模型的信息时:
提供指示所述光谱测量不对应于所述量化模型的信息。
3)根据1)所述的设备,其中,所述一个或更多个处理器当确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型时:
确定所述光谱测量对应于所述量化模型;以及
其中,所述一个或更多个处理器当提供指示对所述未知样本执行的所述光谱测量是否对应于所述量化模型的信息时:
提供指示所述光谱测量对应于所述量化模型的信息。
4)根据1)所述的设备,其中,所述一个或更多个处理器当确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型时:
确定所述距离度量相对于所述多个距离度量的统计度量;以及
基于所述统计度量确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型。
5)根据4)所述的设备,其中,所述统计度量是对数正态标准偏差;并且
其中,所述一个或更多个处理器当基于所述统计度量确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型时:
确定所述对数正态标准偏差满足阈值;以及
基于确定所述对数正态标准偏差满足所述阈值,确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型。
6)根据1)所述的设备,其中,所述量化模型与单类支持向量机(SC-SVM)分类器相关联。
7)根据1)所述的设备,其中,所述一个或更多个处理器还:
接收与所述第一多个训练集样本和所述第二多个训练集样本相关的多个光谱测量;
基于所述多个光谱测量确定所述量化模型;
基于对多个验证集样本的另一多个光谱测量来验证所述量化模型;
存储所述量化模型;并且
其中,所述一个或更多个处理器当确定所述决策边界时:
从储存器获得所述量化模型;以及
在从储存器获得所述量化模型之后,确定所述决策边界。
8)一种存储指令的非临时计算机可读介质,所述指令包括:
一个或更多个指令,所述一个或更多个指令当由一个或更多个处理器执行时使所述一个或更多个处理器:
获得与特定类型的感兴趣的材料相关的量化模型,所述量化模型被配置用于确定所述特定类型的感兴趣的材料的样本中的特定组分的浓度;
接收识别对未知样本执行的特定光谱测量的结果的信息;
将所述量化模型的训练集样本的其他光谱测量聚集到用于所述量化模型的单个类别中;
将所述训练集样本的所述其他光谱测量细分为第一组和第二组,
所述其他光谱测量的所述第一组在决策边界内,
所述其他光谱测量的所述第二组不在所述决策边界内;
确定对所述未知样本执行的所述特定光谱测量的度量相对于所述其他光谱测量的所述第二组的对应的度量满足阈值;以及
提供指示所述未知样本不是所述特定类型的感兴趣的材料的信息。
9)根据8)所述的非临时计算机可读介质,其中,所述未知样本是与所述特定类型的感兴趣的材料不同类型的材料。
10)根据8)所述的非临时计算机可读介质,其中,所述未知样本是所述特定类型的感兴趣的材料,并且是不正确地获得的测量。
11)根据8)所述的非临时计算机可读介质,其中,所述度量和所述对应的度量是决策值。
12)根据8)所述的非临时计算机可读介质,其中,所述阈值是所述度量相对于所述对应的度量的平均值的阈值数量的标准偏差。
13)根据8)所述的非临时计算机可读介质,其中,所述度量和所述对应的度量是使用单类支持向量机技术来确定的。
14)根据8)所述的非临时计算机可读介质,其中,所述量化模型是局部模型,
其中,所述一个或更多个指令当由所述一个或更多个处理器执行时还使所述一个或更多个处理器:
使用与所述特定类型的感兴趣的材料相关的全局模型,执行与所述未知样本的所述特定光谱测量相关的第一测定;
基于所述第一测定的特定结果并使用原位局部建模技术来生成所述局部模型;并且
其中,使所述一个或更多个处理器获得所述量化模型的所述一个或更多个指令使所述一个或更多个处理器:
基于生成所述局部模型来获得所述量化模型。
15)一种方法,包括:
由设备接收识别对未知样本执行的近红外(NIR)光谱测量的结果的信息;
由所述设备确定用于量化模型的决策边界,
其中,所述决策边界将所述量化模型的单个类别划分为在所述决策边界内的所述量化模型的第一多个训练集样本以及不在所述决策边界内的所述量化模型的第二多个训练集样本;
由所述设备确定对所述未知样本执行的所述NIR光谱测量的特定距离度量相对于所述第二多个训练集样本的其他距离度量满足阈值;以及
基于确定对所述未知样本执行的所述NIR光谱测量的所述特定距离度量相对于所述第二多个训练集样本的所述其他距离度量满足所述阈值,由所述设备提供指示对所述未知样本执行的所述NIR光谱测量不对应于所述量化模型的信息。
16)根据15)所述的方法,还包括:
基于使用分类模型的所述NIR光谱测量并基于确定对所述未知样本执行的所述特定距离度量相对于所述第二多个训练集样本的所述其他距离度量满足所述阈值,确定所述未知样本的类型;以及
提供识别所述未知样本的类型的信息。
17)根据15)所述的方法,还包括:
基于内核函数确定所述决策边界。
18)根据17)所述的方法,其中,所述内核函数是以下项中的至少一个:
径向基函数,
多项式函数,
线性函数,或
指数函数。
19)根据15)所述的方法,其中,所述阈值大于以下项中的至少一个:
1个标准偏差,
2个标准偏差,或
3个标准偏差。
20)根据15)所述的方法,其中,所述第一多个训练集样本和所述第二多个训练集样本与组分的一组浓度相关联,并且
其中,所述组分的一组浓度中的所述组分的每个浓度与所述第一多个训练集样本和所述第二多个训练集样本的阈值数量的训练集样本相关联。
附图说明
图1A和图1B是本文中所述的示例实施方式的概况的图;
图2是本文中所述的系统和/或方法可以在其中被实现的示例环境的图;
图3是图2的一个或更多个设备的示例组件的图;
图4是用于生成用于光谱量化的量化模型的示例过程的流程图;
图5是与图4中所示的示例过程相关的示例实施方式的图;
图6是用于在光谱量化期间避免误报(false positive)识别的示例过程的流程图;以及
图7A和图7B是与图6中所示的示例过程有关的示例实施方式的图。
详细描述
示例实施方式的以下详细描述参考了附图。不同附图中的相同参考数字可以标识相同或类似的元素。
原料识别(RMID)是用于识别特定样本的组分(例如,成分)以用于识别、验证等的技术。例如,RMID可用于验证药物材料中的成分是否对应于标签上确定的成分集。类似地,原料量化是用于对特定样本执行量化分析的技术,例如确定特定样本中特定组分材料的浓度。光谱仪(spectrometer)可用于对样本(例如,药物材料)执行光谱法,以确定样本的组分、样本的组分的浓度等。光谱仪可确定样本的一组测量,并可提供一组测量以用于光谱测定。光谱分类技术(例如,分类器)可以有助于基于样本的一组测量确定样本的组分或样本的组分的浓度。
然而,一些要进行光谱量化的未知样本实际上不被包括在量化模型被配置为量化的材料的类别中。例如,对于被训练来确定鱼肉的样本中的特定类型的蛋白质的浓度的量化模型,用户可能无意地提供了牛肉的样本用于量化。在该情况下,控制设备可以对牛肉的样本执行光谱量化,并且可以提供该牛肉的样本作为具有特定浓度的特定类型的蛋白质的识别。然而,由于牛肉和鱼肉及其蛋白质的光谱特征之间的差异,识别可能不准确,并且可以被称为误报识别。
作为另一示例,量化模型可以被训练以量化不同类型的糖(例如,葡萄糖、果糖、半乳糖等)和在未知样本中的相对浓度。然而,光谱仪和控制设备的用户可能无意中试图基于不正确地使用光谱仪执行测量来对糖的未知样本进行分类。例如,用户可能在离未知样本不正确的距离处、在不同于校准条件——在其下执行光谱法以训练量化模型——的环境条件下、和/或类似的情况下操作光谱仪,导致不正确地获得的测量。在该情况下,当未知样本实际上包括第二浓度下的第二类型的糖时,控制设备可以接收对于未知样本的不准确光谱,导致未知样本作为具有第一浓度下的第一类型的糖的误报识别。
本文中所述的一些实施方式可以使用单类支持向量机(SC-SVM)技术来减少光谱量化中的误报识别的可能性。例如,接收未知样本的光谱测量的控制设备可以确定未知样本的光谱测量是否对应于光谱模型被配置为量化的材料的类别。在一些实施方式中,控制设备可以确定未知样本不与光谱模型被配置为量化的材料的类别相关联,并且可以提供指示未知样本不与该材料的类别相关联的信息,从而避免未知样本的误报识别。可替代地,基于确定未知样本与光谱模型被配置为量化的材料的类别相关联,控制设备可以分析未知样本的光谱以提供例如对浓度、分类等的光谱测定。此外,控制设备可以利用置信度度量(诸如概率估计、决策值等)来滤除误报识别。
以这种方式,光谱法的准确度相对于在不识别潜在误差样本(例如,与光谱模型未被配置的材料的类别相关联的样本或光谱测量被不正确地获得的样本)和/或没有置信度度量的情况下执行的光谱法而得到提高。此外,当基于已知光谱样本的训练集生成量化模型时,可以使用材料是否与光谱模型被配置的类别相关联的测定。例如,控制设备可以确定训练集的样本不是对应于训练集的其余部分的类型(例如,基于导致错误样本被引入训练集的人为误差),并且可以确定在生成量化模型时不包括关于该样本的数据。以这种方式,控制设备提高了用于光谱法的量化模型的准确度。
图1A和图1B是本文中所述的示例实施方式100的概况的图。如图1A所示,示例实施方式100可以包括控制设备和光谱仪。
如图1A中进一步示出的,控制设备可以使光谱仪对训练集和验证集(例如,用于分类模型的训练和验证的已知样本集)执行一组光谱测量。训练集和验证集可以被选择以包括要为其训练量化模型的组分的阈值数量的样本。组分可以出现在其中并可用于训练量化模型的材料可以被称为感兴趣的材料。在该情况下,训练集和验证集可以包括例如,表示感兴趣的材料的第一浓度的第一组样本、表示感兴趣的材料的第二浓度的第二组样本等,以使得能够训练量化模型来识别未知样本中感兴趣的材料的浓度。
如图1A中进一步示出的,光谱仪可以基于从控制设备接收到指令,对训练集和验证集执行一组光谱测量。例如,光谱仪可以确定关于训练集和验证集的每个样本的光谱,以使得控制设备能够生成一组类别,以用于将未知样本分类为用于量化模型的感兴趣的材料之一。
光谱仪可以向控制设备提供一组光谱测量。控制设备可以使用特定的测定技术并基于该组光谱测量来生成量化模型。例如,控制设备可以使用支持向量机(SVM)技术(例如,用于信息测定的机器学习技术)——诸如单类SVM(SC-SVM)技术——来生成量化模型。量化模型可以包括与将特定光谱分配给感兴趣的材料的特定浓度的组分(例如,感兴趣的材料中的特定浓度水平的组分)相关联的信息。以这种方式,控制设备可以基于将未知样本的光谱分配给对应于特定浓度的量化模型的浓度的特定类别来提供识别未知样本中的组分的浓度的信息。
如图1B所示,控制设备可以(例如,从储存器、从生成量化模型的另一控制设备等)接收量化模型。控制设备可以使光谱仪对未知样本(例如,要对其执行分类或量化的未知样本)执行一组光谱测量。光谱仪可以基于从控制设备接收到指令来执行一组光谱测量。例如,光谱仪可以确定未知样本的光谱。光谱仪可以向控制设备提供一组光谱测量。控制设备可以试图基于量化模型量化未知样本(例如,将未知样本分类到与未知样本中的特定组分的特定浓度或特定量相关联的特定类别中)。例如,控制设备可以尝试确定未知样本(例如,药丸的样本)内布洛芬的特定浓度、未知样本(例如,糖基产品的样本)内葡萄糖的单位的特定量等。
关于图1B,控制设备可以尝试确定未知样本是否对应于量化模型。例如,控制设备可以确定对应于未知样本属于感兴趣的材料(例如,以对于其使用训练集和验证集配置量化模型的一组浓度中的任何浓度)的可能性的置信度度量。作为示例,对于被配置为识别布洛芬药丸的样本内布洛芬的浓度的量化模型,控制设备可以确定未知样本是否是布洛芬药丸(而不是另一类型的药丸,例如对乙酰氨基酚药丸、乙酰水杨酸药丸等)。作为另一示例,对于被配置为识别鱼肉中的盐的浓度的量化模型,控制设备可以确定未知样本是否是鱼肉(而不是鸡肉、牛肉、猪肉等)。
在该情况下,基于控制设备确定置信度度量(诸如概率估计、支持向量机的决策值输出等)满足阈值(例如,如本文中所述的标准偏差阈值),控制设备可以确定未知样本不是感兴趣的材料(例如,这可以对应于未知样本是不同的材料、未知样本的光谱测量被错误地执行等)。在该情况下,控制设备可以报告未知样本不能够使用量化模型被准确地量化,从而降低未知样本经受未知样本属于感兴趣的材料中的特定浓度的组分的误报识别的可能性。
以这种方式,基于降低报告未知样本作为感兴趣的材料中的特定浓度的组分的误报识别的可能性,控制设备相对于其他量化模型以提高的准确度实现了对于未知样本的光谱法。
如上所指示,图1A和图1B仅作为示例被提供。其它示例是可能的,并且可以不同于关于图1A和图1B描述的示例。
图2是本文中所述的系统和/或方法可以在其中被实现的示例环境200的图。如图2所示,环境200可以包括控制设备210、光谱仪220和网络230。环境200的设备可经由有线连接、无线连接或有线连接和无线连接的组合来互连。
控制设备210包括能够存储、处理和/或路由与光谱量化相关联的信息的一个或更多个设备。例如,控制设备210可以包括服务器、计算机、可穿戴设备、云计算设备、和/或基于训练集的一组测量生成量化模型、基于验证集的一组测量验证量化模型和/或利用量化模型来基于未知集的一组测量执行光谱量化的类似设备。在一些实施方式中,如本文中所述,控制设备210可以利用机器学习技术来确定未知样本的光谱测量是否将被分类为不对应于用于量化模型的感兴趣的材料。在一些实施方式中,控制设备210可以与特定光谱仪220相关联。在一些实施方式中,控制设备210可以与多个光谱仪220相关联。在一些实施方式中,控制设备210可以从环境200中的另一设备(例如光谱仪220)接收信息和/或向环境200中的另一设备(例如光谱仪220)传输信息。
光谱仪220包括能够对样本执行光谱测量的一个或更多个设备。例如,光谱仪220可以包括执行光谱法(例如,振动光谱法,诸如近红外(NIR)光谱仪、中红外光谱法(mid-IR)、拉曼(Raman)光谱法等)的光谱仪设备。在一些实施方式中,光谱仪220可以被结合到可穿戴设备中,例如可穿戴光谱仪和/或类似设备。在一些实施方式中,光谱仪220可以从环境200中的另一设备(例如控制设备210)接收信息和/或向环境200中的另一设备(例如控制设备210)传输信息。
网络230可包括一个或更多个有线网络和/或无线网络。例如,网络230可包括蜂窝网络(例如,长期演进(LTE)网络、3G网络、码分多址(CDMA)网络等)、公共陆地移动网络(PLMN)、局域网(LAN)、广域网(WAN)、城域网(MAN)、电话网络(例如,公共交换电话网络(PSTN))、专用网络、自组织网络、内联网、互联网、基于光纤的网络、云计算网络等、和/或这些或其它类型的网络的组合。
图2中显示的设备和网络的数量和布置作为示例被提供。实际上,与图2中显示的那些设备和/或网络相比,可以有附加的设备和/或网络、更少的设备和/或网络、不同的设备和/或网络、或不同地布置的设备和/或网络。此外,图2中显示的两个或更多个设备可在单个设备内实现,或图2中显示的单个设备可被实现为多个分布式设备。例如,尽管控制设备210和光谱仪220在本文中被描述为两个独立的设备,但是控制设备210和光谱仪220可以在单个设备内实现。另外或可替代地,环境200的一组设备(例如,一个或更多个设备)可以执行被描述为由环境200的另一组设备执行的一个或更多个功能。
图3是设备300的示例组件的图。设备300可以对应于控制设备210和/或光谱仪220。在一些实施方式中,控制设备210和/或光谱仪220可以包括一个或更多个设备300和/或设备300的一个或更多个组件。如图3所示,设备300可包括总线310、处理器320、存储器330、存储组件340、输入组件350、输出组件360、以及通信接口370。
总线310包括允许在设备300的组件当中通信的组件。处理器320在硬件、固件、或硬件和软件的组合中实现。处理器320是中央处理单元(CPU)、图形处理单元(GPU)、加速处理单元(APU)、微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、或另一类型的处理组件。在一些实施方式中,处理器320包括能够被编程以执行功能的一个或更多个处理器。存储器330包括随机存取存储器(RAM)、只读存储器(ROM)、和/或存储信息和/或指令以用于由处理器320使用的另一类型的动态或静态存储设备(例如,闪存、磁存储器、和/或光学存储器)。
存储组件340存储与设备300的操作和使用相关的信息和/或软件。例如,存储组件340可以包括硬盘(例如,磁盘、光盘、磁光盘、和/或固态盘)、压缩光盘(CD)、数字通用盘(DVD)、软盘、盒式磁带(cartridge)、磁带、和/或另一类型的非临时计算机可读介质连同相应的驱动器。
输入组件350包括允许设备300例如经由用户输入(例如,触摸屏显示器、键盘、小键盘、鼠标、按钮、开关、和/或麦克风)来接收信息的组件。另外或可替代地,输入组件350可以包括用于感测信息的传感器(例如,全球定位系统(GPS)组件、加速度计、陀螺仪、和/或致动器)。输出组件360包括提供来自设备300的输出信息的组件(例如,显示器、扬声器、和/或一个或更多个发光二极管(LED))。
通信接口370包括使设备300能够例如经由有线连接、无线连接、或有线和无线连接的组合与其它设备通信的类似收发机组件(例如,收发机和/或单独的接收机和发射机)。通信接口370可以允许设备300从另一设备接收信息和/或将信息提供给另一设备。例如,通信接口370可以包括以太网接口、光学接口、同轴接口、红外接口、射频(RF)接口、通用串行总线(USB)接口、无线局域网络接口、蜂窝网络接口等。
设备300可以执行本文中所述的一个或更多个过程。设备300可以基于处理器320执行由非临时计算机可读介质(例如存储器330和/或存储组件340)存储的软件指令来执行这些过程。计算机可读介质在本文中被定义为非临时存储器设备。存储器设备包括单个物理存储设备内的存储器空间或遍布于多个物理存储设备的存储器空间。
软件指令可以经由通信接口370从另一计算机可读介质或从另一设备被读取到存储器330和/或存储组件340中。存储在存储器330和/或存储组件340中的软件指令当被执行时可使处理器320执行本文中所述的一个或更多个过程。另外或可替代地,硬连线电路可代替软件指令或与软件指令组合来使用以执行本文中所述的一个或更多个过程。因此,本文中所述的实施方式不限于硬件电路和软件的任何特定组合。
图3中显示的组件的数量和布置作为示例被提供。实际上,与图3中显示的那些组件相比,设备300可以包括附加的组件、更少的组件、不同的组件、或不同地布置的组件。另外或可替代地,设备300的一组组件(例如,一个或更多个组件)可以执行被描述为由设备300的另一组组件执行的一个或更多个功能。
图4是用于生成用于光谱量化的量化模型的示例过程400的流程图。在一些实施方式中,图4的一个或更多个过程框可以由控制设备210执行。在一些实施方式中,图4的一个或更多个过程框可以由另一设备或与控制设备210分离的或者包括控制设备210的设备组(诸如光谱仪220)执行。
如图4所示,过程400可包括使一组光谱测量针对训练集和/或验证集而被执行(框410)。例如,控制设备210可以(例如,使用处理器320、通信接口370等)使光谱仪220对样本的训练集和/或验证集执行一组光谱测量,以确定对于训练集和/或验证集的每个样本的光谱。训练集可以指具有一组浓度的组分的一种或更多种已知材料的样本集,其用于生成该组分的量化模型。类似地,验证集可以指具有一组浓度的组分的一种或更多种已知材料的样本集,其用于验证量化模型的准确性。例如,训练集和/或验证集可以包括一组不同浓度下的特定材料的一个或更多个版本(例如,由不同制造商制造以控制制造差异的一个或更多个版本)。
在一些实施方式中,训练集和/或验证集可以基于对其要使用量化模型来执行光谱量化的预期的一组感兴趣的材料集被选择。例如,当预期对药物材料执行光谱量化以确定药物材料的特定组分的浓度时,训练集和/或验证集可以包括针对特定组分的存在而被测试的一组药物材料中的一组不同可能浓度下的特定组分的样本集。
在一些实施方式中,训练集和/或验证集可以被选择以包括针对材料的每个浓度的特定数量的样本。例如,训练集和/或验证集可以被选择以包括特定浓度的多个样本(例如,5个样本、10个样本、15个样本、50个样本等)。以这种方式,控制设备210可以被提供有与特定类型的材料相关联的阈值数量的光谱,从而有助于生成和/或验证用于量化模型的类别(例如,对应于特定浓度的组分的一组样本),未知样本可以被准确地分配给该类别(例如,基于未知样本具有特定浓度的组分)。
在一些实施方式中,控制设备210可以使多个光谱仪220执行一组光谱测量以应对一个或更多个物理条件。例如,控制设备210可以使第一光谱仪220和第二光谱仪220使用NIR光谱法来执行一组振动光谱测量。另外或可替代地,控制设备210可以使一组光谱测量在多个时间、在多个位置、在多个不同的实验室条件等被执行。以这种方式,控制设备210减少了由于相对于使一组光谱测量由单个光谱仪220执行的物理条件而导致的光谱测量不准确的可能性。
以这种方式,控制设备210使一组光谱测量对训练集和/或验证集执行。
如图4中进一步示出的,过程400可包括接收识别一组光谱测量的结果的信息(框420)。例如,控制设备210可以(例如,使用处理器320、通信接口370等)接收识别该组光谱测量的结果的信息。在一些实施方式中,控制设备210可以接收识别对应于训练集和/或验证集的样本的一组光谱的信息。例如,控制设备210可以接收识别在光谱仪220对训练集执行光谱法时观察到的特定光谱的信息。在一些实施方式中,控制设备210可以同时接收识别训练集样本和验证集样本的光谱的信息。在一些实施方式中,控制设备210可以接收识别关于训练集样本的光谱的信息,可以生成量化模型,并且可以在生成量化模型之后接收识别验证集样本的光谱的信息,以便能够测试量化模型。
在一些实施方式中,控制设备210可以从多个光谱仪220接收识别一组光谱测量的结果的信息。例如,控制设备210可以通过接收由多个光谱仪220执行的、在多个不同时间执行的、在多个不同位置处等执行的光谱测量来控制物理条件(例如多个光谱仪220之间的差异、实验室条件中的潜在差异等)。
在一些实施方式中,控制设备210可以从生成量化模型的利用中移除一个或更多个光谱。例如,控制设备210可以执行光谱量化并且可以确定光谱不对应于量化模型被配置为量化的材料的类型,并且可以确定对应于光谱的样本无意地是不感兴趣的材料(例如,基于正确地执行光谱法中的人为误差、识别训练集的光谱的信息中的误差等)。在该情况下,控制设备210可以确定从训练集中移除该光谱。以这种方式,控制设备210可以通过减少使用关于训练集或验证集的不正确或不准确信息生成量化模型的可能性来提高量化模型的准确性。
以这种方式,控制设备210接收识别一组光谱测量的结果的信息。
如图4中进一步示出的,过程400可以包括基于识别一组光谱测量的结果的信息生成量化模型(框430)。例如,控制设备210可以基于识别一组光谱测量的结果的信息来(例如,使用处理器320、存储器330、存储组件340等)生成与SVM分类器技术相关联的量化模型。
SVM可以指执行模式识别并使用置信度度量以进行量化的监督学习模型。在一些实施方式中,当使用SVM技术生成量化模型时,控制设备210可以利用特定类型的内核函数来确定两个或更多个输入(例如,光谱)的类似性。例如,控制设备210可以利用径向基函数(RBF)(例如,称为SVM-rbf)类型的内核函数,其可以被表示为对于光谱x和y的k(x,y)=exp(-||x-y||^2);线性函数(例如,当用于多阶段测定技术时,称为SVM-线性和称为层次(hier)-SVM线性)类型的内核函数,其可以被表示为k(x,y)=<x·y>;S形函数(sigmoidfunction)类型的内核函数;多项式函数类型的内核函数;指数函数类型的内核函数;和/或类似的函数。在一些实施方式中,控制设备210可以使用单类SVM(SC-SVM)分类器技术来生成量化模型。例如,控制设备210可以聚集对应于训练集中的组分的多个浓度的多个类别以生成表示量化模型的单个类别。在该情况下,如本文中所述,控制设备210可以利用置信度度量来确定未知样本是量化模型被配置为分析的类型的可能性。
在一些实施方式中,控制设备210可以针对SVM利用特定类型的置信度度量,诸如基于概率值的SVM(例如,基于确定样本是(可能的浓度的)一组类别中的类别的成员的概率的测定)、基于决策值的SVM(例如,利用决策函数投票给一组类别中的类别作为样本是其成员的类别的测定)等。例如,在利用基于决策值的SVM的量化模型的使用期间,控制设备210可以基于未知样本的光谱的测绘来确定未知样本是否位于组成类别的边界内(例如,未知样本的组分的特定量或浓度),并且可以基于未知样本是否位于组成类别的边界内来将样本分配给类别。以这种方式,控制设备210可以确定是否将未知光谱分配给特定类别以进行量化。
尽管本文中所述的一些实施方式是以一组特定的机器学习技术的方式来描述的,但是其他技术也可能用于确定关于未知光谱的信息,例如材料的分类等等。
在一些实施方式中,控制设备210可以从一组量化技术中选择要用于生成量化模型的特定分类器。例如,控制设备210可以生成对应于多个分类器的多个量化模型,并且可以测试多个量化模型,例如通过确定每个模型的可传递性(例如,基于在第一光谱仪220上执行的光谱测量生成的量化模型当应用于在第二光谱仪220上执行的光谱测量时准确的程度)、大规模测定的准确度(例如,量化模型可被用于同时确定满足阈值的一定量的样本的浓度的准确度)等等。在该情况下,控制设备210可以基于确定分类器相对于其他分类器与优越的可转移性和/或大规模测定的准确度相关联来选择分类器,诸如SVM分类器(例如,层次-SVM线性分类器、SC-SVM分类器等)。
在一些实施方式中,控制设备210可以基于识别训练集的样本的信息来生成量化模型。例如,控制设备210可以利用识别由训练集的样本表示的材料的类型或浓度的信息来识别具有材料的类型或浓度的光谱的类别。在一些实施方式中,当生成量化模型时,控制设备210可以训练量化模型。例如,控制设备210可以使用一组光谱测量的一部分(例如,与训练集相关的测量)来训练量化模型。另外或可替代地,控制设备210可以执行量化模型的评估。例如,控制设备210可以利用该组光谱测量的另一部分(例如,验证集)验证量化模型(例如,针对预测强度)。
在一些实施方式中,控制设备210可以使用多阶段测定技术来验证量化模型。例如,对于基于原位(in-situ)局部建模的量化,控制设备210可以确定量化模型当与一个或更多个局部量化模型相关联地被利用时是准确的。以这种方式,控制设备210确保在提供量化模型以用于例如由控制设备210、由与其他光谱仪220相关联的其他控制设备210等利用之前以阈值准确度生成量化模型。
在一些实施方式中,控制设备210可以在生成量化模型之后向与其他光谱仪220相关联的其他控制设备210提供量化模型。例如,第一控制设备210可以生成量化模型,并且可以将量化模型提供给第二控制设备210用于利用。在该情况下,对于基于原位局部建模的量化,第二控制设备210可以存储量化模型(例如,全局量化模型),并且可以利用量化模型来生成一个或更多个原位局部量化模型,用于确定未知集的一个或更多个样本中的材料的组分的浓度。另外或可替代地,控制设备210可以存储量化模型以用于由控制设备210在执行量化、在生成一个或更多个局部量化模型(例如,对于基于原位局部建模的量化)等时利用。以这种方式,控制设备210提供用于在未知样本的光谱量化中利用的量化模型。
以这种方式,控制设备210基于识别一组光谱测量的结果的信息生成量化模型。
虽然图4示出了过程400的示例框,但在一些实施方式中,与图4中描绘的那些框相比,过程400可以包括附加的框、更少的框、不同的框或不同地布置的框。另外或可替代地,过程400的两个或更多个框可并行地被执行。
图5是与图4中所示的示例过程400相关的示例实施方式500的图。图5示出了生成量化模型的示例。
如图5中由参考数字505示出的,控制设备210-1向光谱仪220-1传输信息,以指导光谱仪220-1对训练集和验证集510执行一组光谱测量。假设训练集和验证集510包括第一组训练样本(例如,其测量用于训练量化模型)和第二组验证样本(例如,其测量用于验证量化模型的准确性)。如由参考数字515示出的,光谱仪220-1基于接收到指令来执行一组光谱测量。如由参考数字520示出的,控制设备210-1接收关于训练样本的第一组光谱和关于验证样本的第二组光谱。在该情况下,训练样本和验证样本可以包括用于量化的感兴趣的材料组中的组分的多个浓度的样本。例如,控制设备210-1可以接收与生成全局模型(例如,全局分类模型或量化模型)相关的光谱,以使用全局模型和原位局部建模技术(用于生成局部模型,例如局部分类模型或量化模型)来识别肉的类型,以及量化该类型的肉中的特定蛋白质的浓度。在该情况下,控制设备210-1可以被配置成生成多个局部量化模型(例如,用于确定使用原位局部建模识别的第一类型的肉中的特定蛋白质的浓度的第一量化模型、用于确定使用原位局部建模识别的第二类型的肉中的特定蛋白质的浓度的第二量化模型等)。假设控制设备210-1存储识别训练集和验证集510的每个样本的信息。
关于图5,假设控制设备210-1已被选择以利用层次-SVM线性分类器来生成分类模型,并利用SC-SVM分类器来生成多个量化模型。如由参考数字525所示,控制设备210-1使用层次-SVM线性分类器和第一组光谱训练全局分类模型,并使用层次-SVM线性分类器和第二组光谱验证全局分类模型。此外,控制设备210-1训练并验证多个局部量化模型(例如,对应于全局分类模型的每个类别和/或基于全局分类模型生成的局部分类模型的每个类别的局部量化模型)。假设控制设备210-1确定量化模型满足验证阈值(例如,具有超过验证阈值的准确度)。如由参考数字530示出的,控制设备210-1将量化模型提供给控制设备210-2(例如,以用于在对由光谱仪220-2执行的光谱测量执行量化时利用)并提供给控制设备210-3(例如,以用于在对由光谱仪220-3执行的光谱测量执行量化时利用)。
如上所指示,图5仅作为示例被提供。其它示例是可能的,并且可以不同于关于图5描述的示例。
以这种方式,控制设备210有助于基于选择的分类技术(例如,基于模型可传递性、大规模量化的准确度等所选择的技术)的量化模型的生成和量化模型的分配以供与一个或更多个光谱仪220相关联的一个或更多个其他控制设备210利用。
图6是用于在原料量化期间避免误报识别的示例过程600的流程图。在一些实施方式中,图6的一个或更多个过程框可由控制设备210执行。在一些实施方式中,图6的一个或更多个过程框可由另一设备或与控制设备210分离的或者包括控制设备210的设备组(诸如光谱仪220)执行。
如图6所示,过程600可以包括接收识别对未知样本执行的一组光谱测量的结果的信息(框610)。例如,控制设备210可以(例如,使用处理器320、通信接口370等)接收识别对未知样本执行的一组NIR光谱测量的结果的信息。在一些实施方式中,控制设备210可以接收识别对(例如,多个样本的)未知集的一组光谱测量的结果的信息。未知集可以包括要对其执行测定(例如,光谱量化)的一组样本(例如,未知样本)。例如,控制设备210可以使光谱仪220对该组未知样本执行一组光谱测量,并且可以接收识别对应于该组未知样本的一组光谱的信息。
在一些实施方式中,控制设备210可以从多个光谱仪220接收识别结果的信息。例如,控制设备210可以使多个光谱仪220对未知集(例如,相同的样本集)执行一组光谱测量,并且可以接收识别对应于未知集的样本的一组光谱的信息。另外或可替代地,控制设备210可以接收识别在多个时间、在多个位置等执行的一组光谱测量的结果的信息,并且可以基于在多个时间、在多个位置等执行的一组光谱测量(例如,基于平均该组光谱测量或基于另一技术)对特定样本进行量化。以这种方式,控制设备210可以应对可能影响该组光谱测量的结果的物理条件。
另外或可替代地,控制设备210可以使第一光谱仪220对未知集的第一部分执行一组光谱测量的第一部分,并且可以使第二光谱仪220对未知集的第二部分执行该组光谱测量的第二部分。以这种方式,相对于使所有光谱测量都由单个光谱仪220执行,控制设备210可以减少一定量的时间来执行一组光谱测量。
以这种方式,控制设备210接收识别对未知样本执行的一组光谱测量的结果的信息。
如图6中进一步所示,过程600可以包括确定未知样本是否对应于量化模型(框620)。例如,控制设备210可以尝试(例如,使用处理器320、存储器330、存储组件340等)确定未知样本是否是量化模型被配置为量化的材料和/或包括材料中量化模型被配置为量化的组分。
在一些实施方式中,控制设备210可以使用SC-SVM分类器技术来确定未知光谱是否对应于量化模型。例如,控制设备210可以确定可配置参数值nu以用于使用SC-SVM技术。参数值可以对应于被确定在SC-SVM技术的决策边界内的训练集样本与被确定不在决策边界内的训练集样本的比率。在一些实施方式中,控制设备210可以基于参数值来确定决策边界。在一些实施方式中,控制设备210可以使用交叉验证过程来设置多个可能的决策边界,并且可以(例如经由平均)组合使用多个可能的决策边界的结果来确定未知光谱是否对应于量化模型。
在一些实施方式中,基于设置决策边界以满足参数值(例如,对于0.5的参数值,设置决策值使得训练集的一半测量位于决策边界内,并且训练集的一半测量位于决策边界外部),控制设备210可以确定决策值,该决策值可以对应于从测量到决策边界的距离度量。例如,控制设备210可以确定未知样本的光谱在一组轴上的位置,并且可以确定该位置和决策边界的最近点之间的距离。尽管本文中所述的一些实施方式是根据图或一组轴来描述的,但是本文中所述的实施方式可以在不使用图或一组轴的情况下确定,例如使用与未知光谱相关的数据的另一表示。
在一些实施方式中,控制设备210可以确定用于未知光谱的决策值。例如,控制设备210可以确定从未知光谱到决策边界的距离。在一些实施方式中,控制设备210可以确定用于位于决策边界外部的、其他测量的决策值。在该情况下,控制设备210可以确定统计度量,以表示未知光谱的决策值相对于决策边界外部的其他测量的决策值的标准偏差的数量。例如,控制设备210可以基于对数正态分布确定对数正态标准偏差,并且可以确定标准偏差是否满足阈值(例如,1个标准偏差、2个标准偏差、3个标准偏差等)。在该情况下,基于未知样本的光谱的测量相对于决策边界外部的其他测量大于相对于决策边界的标准偏差的阈值数量(例如,相对于决策边界的3个标准偏差),控制设备210可以确定未知样本不对应于量化模型(框620-否)。可替代地,基于测量小于相对于决策边界的阈值量标准偏差,控制设备210可以确定未知样本确实对应于量化模型(框620-是)。尽管本文中按照特定统计技术和/或标准偏差的特定阈值数量进行了描述,但是也可以使用其他统计技术和/或阈值。
以这种方式,控制设备210能够识别未知光谱与量化模型相差阈值量,而无需使用与未知样本类似的样本(例如,也与感兴趣的材料的训练集样本相差阈值量)来训练量化模型。另外,控制设备210减少了要收集用于生成量化模型的样本量,从而相对于获得、存储和处理其他样本以确保准确识别与感兴趣材料和/或其浓度相差阈值量的样本,减少了成本、时间和计算资源利用率(例如,处理资源和存储器资源)。
以这种方式,控制设备210确定未知样本是否对应于量化模型。
如图6中进一步示出的,基于确定未知样本对应于量化模型(框620-是),过程600可以包括基于一组光谱测量的结果执行一个或更多个光谱测定(框630)。例如,控制设备210可以基于一组光谱测量的结果来(例如,使用处理器320、存储器330、存储组件340等)执行一个或更多个光谱测定。在一些实施方式中,控制设备210可以将未知样本分配给特定类别(例如,表示感兴趣的材料中的组分的一组浓度中的特定浓度)。
在一些实施方式中,控制设备210可以基于置信度度量来分配特定样本。例如,控制设备210可以基于量化模型确定特定光谱与量化模型的每个类别(例如,每个候选浓度)相关联的概率。在该情况下,控制设备210可以基于类别的特定概率超过与类别相关联的其他概率而将未知样本分配给该类别(例如,特定浓度)。以这种方式,控制设备210确定与样本相关联的感兴趣的材料中的组分的浓度,从而量化样本。
在一些实施方式中,为了执行原位局部建模,例如对于具有大于阈值数量的类别的量化模型,控制设备210可以基于第一测定生成局部量化模型。局部量化模型可以指基于与第一测定相关联的置信度度量使用SVM测定技术(例如SVM-rbf、SVM-线性等的内核函数;基于概率值的SVM、基于决策值的SVM等;和/或类似技术)生成的原位量化模型。
在一些实施方式中,控制设备210可以基于使用全局分类模型执行第一测定来生成局部量化模型。例如,当控制设备210被用于确定未知样本中的组分的浓度,并且多个未知样本与用于确定组分的浓度的不同量化模型相关联时,控制设备210可以利用第一测定来选择类别的子集作为用于未知样本的局部类别,并且可以生成与用于未知样本的局部类别相关联的局部量化模型。以这种方式,控制设备210利用层次测定和量化模型来改进光谱分类。在该情况下,控制设备210可以基于确定未知样本相对于局部量化模型的其他测量的子集的距离度量来确定未知样本是否对应于该局部量化模型。
作为示例,当执行原料识别以确定植物材料中特定化学物的浓度时,其中植物材料与多个量化模型相关联(例如,与植物是在室内还是室外、在冬季还是夏季生长等相关),控制设备210可以执行一组分类测定以识别特定量化模型。在该情况下,控制设备210可以基于执行一组测定来确定植物在冬季室内生长,并且可以选择与在冬季室内生长的植物相关的量化模型以用于确定特定化学物的浓度。基于选择量化模型,控制设备210可以确定未知样本对应于量化模型,并且可以使用量化模型量化未知样本。
在一些实施方式中,控制设备210可能无法使用量化模型量化未知样本。例如,基于一个或更多个决策值或其他置信度度量未能满足阈值,控制设备210可以确定未知样本不能够使用量化模型被准确地量化(框630-A)。可替代地,控制设备210可以基于一个或更多个决策值或其他置信度度量满足阈值而成功量化未知样本(框630-B)。
以这种方式,控制设备210基于一组光谱测量的结果执行一个或更多个光谱测定。
如图6中进一步示出的,基于确定未知样本不对应于量化模型(框620-否),或者基于执行一个或更多个光谱测定时的测定失败(框630-A),过程600可以包括提供指示未知样本不对应于量化模型的输出(框640)。例如,控制设备210可以例如经由用户接口来(例如,使用处理器320、存储器330、存储组件340、通信接口370等)提供指示未知样本不对应于量化模型的信息。在一些实施方式中,控制设备210可以提供与识别未知样本相关联的信息。例如,基于尝试量化特定植物中的特定化学物的量,并且确定未知样本不是该特定植物(而是另一植物,例如基于人为误差),控制设备210可以提供识别另一植物的信息。在一些实施方式中,基于确定未知样本不对应于量化模型,控制设备210可以获得另一量化模型,并且可以使用另一量化模型以识别未知样本。
以这种方式,控制设备210减少了基于对未知样本的误报识别提供不正确信息的可能性,并且通过提供信息以辅助确定未知样本例如是另一种植物而不是特定植物来使技术人员能够进行误差校正。
以该方式,控制设备210提供指示未知样本不对应于量化模型的输出。
如图6中进一步示出的,基于当执行一个或更多个光谱测定时的分类成功(框630-B),过程600可以包括提供识别与未知样本相关的分类的信息(框650)。例如,控制设备210可以(例如,使用处理器320、存储器330、存储组件340、通信接口370等)提供识别与未知样本相关的量化的信息。在一些实施方式中,控制设备210可以提供识别用于未知样本的特定类别的信息。例如,控制设备210可以提供指示与未知样本相关联的特定光谱被确定为与对应于感兴趣的材料中的组分的特定浓度的特定类别相关联的信息,从而识别未知样本。
在一些实施方式中,控制设备210可以提供指示与将未知样本分配给特定类别相关联的置信度度量的信息。例如,控制设备210可以提供识别未知样本与特定类别相关联的概率的信息等。以该方式,控制设备210提供指示特定光谱被准确地分配给特定类别的可能性的信息。
在一些实施方式中,控制设备210可以基于执行一组分类来提供量化。例如,基于识别与未知样本的类别相关的局部量化模型,控制设备210可以提供识别未知样本中的物质的浓度的信息。在一些实施方式中,控制设备210可以基于执行一组量化来更新量化模型。例如,控制设备210可以基于将未知样本的量化确定为感兴趣的材料中的组分的特定浓度来生成包括作为训练集的样本的未知样本的新的量化模型。
以这种方式,控制设备210提供识别未知样本的信息。
虽然图6示出了过程600的示例框,但在一些实施方式中,与图6中描绘的那些框相比,过程600可包括附加的框、更少的框、不同的框或不同地布置的框。另外或可替代地,过程600的两个或更多个框可并行地被执行。
图7A和图7B是与图6中所示的示例过程600相关联的预测成功率相关的示例实施方式700的图。图7A和图7B示出了使用基于层次支持向量机(层次-SVM线性)的技术的原料识别的示例结果。
如图7A中由参考数字705所示,控制设备210可以使光谱仪220执行一组光谱测量。例如,控制设备210可以提供指令,以使光谱仪220获得未知样本的光谱,从而确定未知样本中的组分的浓度。如由参考数字710和参考数字715示出的,光谱仪220可以接收未知样本,并且可以对未知样本执行一组光谱测量。如由参考数字720示出的,控制设备210可以基于光谱仪220对未知样本执行一组光谱测量而接收未知样本的光谱。
如图7B所示,控制设备210可以使用量化模型725来执行光谱量化。量化模型725包括基于参数值nu确定的单个类别730,使得单个类别730的决策边界产生决策边界内的训练集的样本与不在决策边界内的训练集的样本的阈值比率。在该情况下,量化模型725可以与对应于训练集的样本中的组分的多个不同浓度的多个子类别相关联。如由参考数字735和740示出的,基于样本到决策边界的距离的标准偏差值(例如,σ=3.2)满足阈值(例如,3),确定未知样本的光谱不对应于量化模型。如由参考数字745所示,控制设备210向客户端设备750提供输出,指示未知样本不对应于量化模型,而不是提供未知样本作为感兴趣的材料中的特定浓度的组分的误报识别。
如上所指示,图7A和图7B仅作为示例被提供。其它示例是可能的,并且可以不同于关于图7A和图7B描述的示例。
以这种方式,控制设备210基于避免未知样本作为量化模型被训练来量化的感兴趣的材料中特定浓度的组分的误报识别来降低了提供光谱法的不准确结果的可能性。
前述公开提供了说明和描述,但并不旨在穷举或将实施方式限制到所公开的精确形式。根据以上公开,修改和变化是可能的或者可以从实施方式的实践中获得。
本文中结合阈值描述了一些实施方式。如本文中所使用的,满足阈值可以指值大于阈值、多于阈值、高于阈值、大于或等于阈值、小于阈值、少于阈值、低于阈值、小于或等于阈值、等于阈值等。
将明显的是,本文中所述的系统和/方法可在硬件、固件或硬件和软件的组合的不同形式中实现。用于实现这些系统和/或方法的实际专用控制硬件或软件代码不是实施方式的限制。因此,在本文中描述系统和/或方法的操作和行为而不参考特定的软件代码,理解的是软件和硬件可以被设计成基于本文中的描述来实现系统和/或方法。
尽管在权利要求中陈述和/或在说明书中公开了特征的特定组合,但是这些组合并不旨在限制可能的实施方式的公开内容。事实上,这些特征中的许多可以以权利要求中未具体陈述和/或说明书中未公开的方式组合。尽管所附的每个从属权利要求可以直接从属于仅仅一个权利要求,但是可能的实施方式的公开内容包括与权利要求集中的每个其他权利要求相结合的每个从属权利要求。
本文中使用的任何元素、动作或指令都不应当被解释为关键或必要的,除非明确这样描述。另外,如本文中所使用的,冠词“一(a)”和“一(an)”旨在包括一个或更多个项目,并且可以与“一个或更多个(one or more)”互换使用。此外,如本文中所使用的,术语“集(set)”旨在包括一个或更多个项目(例如,相关项目、不相关项目、相关项目和不相关项目的组合等),并且可以与“一个或更多个”互换使用。在意指仅一个项目的情况下,使用术语“一个(one)”或类似的语言。另外,如本文中所使用的,术语“具有(has)”、“具有(have)”、“具有(having)”、和/或类似词语旨在是开放式的术语。此外,除非另有明确地说明,否则短语“基于”旨在表示“至少部分基于”。

Claims (20)

1.一种用于光谱量化的减少的误报识别的设备,包括:
一个或更多个存储器;以及
一个或更多个处理器,所述一个或更多个处理器通信地耦合到所述一个或更多个存储器,所述一个或更多个处理器:
接收识别对未知样本执行的光谱测量的结果的信息;
针对量化模型并基于可配置参数,确定决策边界,所述决策边界将所述量化模型的单个类别划分为在所述决策边界内的所述量化模型的第一多个训练集样本和不在所述决策边界内的所述量化模型的第二多个训练集样本;
确定对所述未知样本执行的所述光谱测量相对于所述决策边界的距离度量;
确定所述量化模型的所述第二多个训练集样本相对于所述决策边界的多个距离度量;
基于用于所述光谱测量的所述距离度量和用于所述第二多个训练集样本的所述多个距离度量,确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型;以及
提供指示对所述未知样本执行的所述光谱测量是否对应于所述量化模型的信息。
2.根据权利要求1所述的设备,其中,所述一个或更多个处理器当确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型时:
确定所述光谱测量不对应于所述量化模型;以及
其中,所述一个或更多个处理器当提供指示对所述未知样本执行的所述光谱测量是否对应于所述量化模型的信息时提供指示所述光谱测量不对应于所述量化模型的信息。
3.根据权利要求1所述的设备,其中,所述一个或更多个处理器当确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型时:
确定所述光谱测量对应于所述量化模型;以及
其中,所述一个或更多个处理器当提供指示对所述未知样本执行的所述光谱测量是否对应于所述量化模型的信息时提供指示所述光谱测量对应于所述量化模型的信息。
4.根据权利要求1所述的设备,其中,所述一个或更多个处理器当确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型时:
确定所述距离度量相对于所述多个距离度量的统计度量;以及
基于所述统计度量确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型。
5.根据权利要求4所述的设备,其中,所述统计度量是对数正态标准偏差;并且
其中,所述一个或更多个处理器当基于所述统计度量确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型时:
确定所述对数正态标准偏差满足阈值;以及
基于确定所述对数正态标准偏差满足所述阈值,确定对所述未知样本执行的所述光谱测量是否对应于所述量化模型。
6.根据权利要求1所述的设备,其中,所述量化模型与单类支持向量机(SC-SVM)分类器相关联。
7.根据权利要求1所述的设备,其中,所述一个或更多个处理器还:
接收与所述第一多个训练集样本和所述第二多个训练集样本相关的多个光谱测量;
基于所述多个光谱测量确定所述量化模型;
基于对多个验证集样本的另一多个光谱测量来验证所述量化模型;
存储所述量化模型;并且
其中,所述一个或更多个处理器当确定所述决策边界时:
从储存器获得所述量化模型;以及
在从储存器获得所述量化模型之后,确定所述决策边界。
8.一种存储指令的非临时计算机可读介质,所述指令包括:
一个或更多个指令,所述一个或更多个指令当由一个或更多个处理器执行时使所述一个或更多个处理器:
获得与特定类型的感兴趣的材料相关的量化模型,所述量化模型被配置用于确定所述特定类型的感兴趣的材料的样本中的特定组分的浓度;
接收识别对未知样本执行的特定光谱测量的结果的信息;
将所述量化模型的训练集样本的其他光谱测量聚集到所述量化模型的单个类别中;
将所述训练集样本的所述其他光谱测量细分为第一组和第二组,所述其他光谱测量的所述第一组在所述量化模型的决策边界内,并且所述其他光谱测量的所述第二组不在所述量化模型的所述决策边界内;
确定对所述未知样本执行的所述特定光谱测量的度量相对于所述其他光谱测量的所述第二组的对应的度量满足阈值;以及
提供指示所述未知样本不是所述特定类型的感兴趣的材料的信息。
9.根据权利要求8所述的非临时计算机可读介质,其中,所述未知样本是与所述特定类型的感兴趣的材料不同类型的材料。
10.根据权利要求8所述的非临时计算机可读介质,其中,所述未知样本是所述特定类型的感兴趣的材料,并且对于所述未知样本,光谱测量是不正确地获得的测量。
11.根据权利要求8所述的非临时计算机可读介质,其中,所述度量和所述对应的度量是决策值。
12.根据权利要求8所述的非临时计算机可读介质,其中,所述阈值是所述度量相对于所述对应的度量的平均值的阈值数量的标准偏差。
13.根据权利要求8所述的非临时计算机可读介质,其中,所述度量和所述对应的度量是使用单类支持向量机技术来确定的。
14.根据权利要求8所述的非临时计算机可读介质,其中,所述量化模型是局部模型,
其中,所述一个或更多个指令当由所述一个或更多个处理器执行时还使所述一个或更多个处理器:
使用与所述特定类型的感兴趣的材料相关的全局模型,执行与所述未知样本的所述特定光谱测量相关的第一测定;
基于所述第一测定的特定结果并使用原位局部建模技术来生成所述局部模型;并且
其中,使所述一个或更多个处理器获得所述量化模型的所述一个或更多个指令使所述一个或更多个处理器基于生成所述局部模型来获得所述量化模型。
15.一种用于光谱量化的减少的误报识别的方法,包括:
由设备接收识别对未知样本执行的近红外NIR光谱测量的结果的信息;
由所述设备确定用于量化模型的决策边界,其中,所述决策边界将所述量化模型的单个类别划分为在所述决策边界内的所述量化模型的第一多个训练集样本以及不在所述决策边界内的所述量化模型的第二多个训练集样本;
由所述设备确定对所述未知样本执行的所述NIR光谱测量的特定距离度量相对于所述第二多个训练集样本的其他距离度量满足阈值;以及
基于确定对所述未知样本执行的所述NIR光谱测量的所述特定距离度量相对于所述第二多个训练集样本的所述其他距离度量满足所述阈值,由所述设备提供指示对所述未知样本执行的所述NIR光谱测量不对应于所述量化模型的信息。
16.根据权利要求15所述的方法,还包括:
基于使用分类模型的所述NIR光谱测量并基于确定对所述未知样本执行的所述特定距离度量相对于所述第二多个训练集样本的所述其他距离度量满足所述阈值,确定所述未知样本的类型;以及
提供识别所述未知样本的类型的信息。
17.根据权利要求15所述的方法,还包括:
基于内核函数确定所述决策边界。
18.根据权利要求17所述的方法,其中,所述内核函数是以下项中的至少一个:
径向基函数,
多项式函数,
线性函数,或
指数函数。
19.根据权利要求15所述的方法,其中,所述阈值大于以下项中的至少一个:
1个标准偏差,
2个标准偏差,或
3个标准偏差。
20.根据权利要求15所述的方法,其中,所述第一多个训练集样本和所述第二多个训练集样本与组分的一组浓度相关联,并且
其中,所述组分的一组浓度中的所述组分的每个浓度与所述第一多个训练集样本和所述第二多个训练集样本的阈值数量的训练集样本相关联。
CN201910063878.2A 2018-01-26 2019-01-23 用于光谱量化的减少的误报识别 Active CN110084262B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210770629.9A CN115293233A (zh) 2018-01-26 2019-01-23 用于光谱量化的减少的误报识别

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862622641P 2018-01-26 2018-01-26
US62/622,641 2018-01-26
US16/034,901 US11009452B2 (en) 2018-01-26 2018-07-13 Reduced false positive identification for spectroscopic quantification
US16/034,901 2018-07-13

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210770629.9A Division CN115293233A (zh) 2018-01-26 2019-01-23 用于光谱量化的减少的误报识别

Publications (2)

Publication Number Publication Date
CN110084262A CN110084262A (zh) 2019-08-02
CN110084262B true CN110084262B (zh) 2022-07-05

Family

ID=65003247

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202210770629.9A Pending CN115293233A (zh) 2018-01-26 2019-01-23 用于光谱量化的减少的误报识别
CN201910063878.2A Active CN110084262B (zh) 2018-01-26 2019-01-23 用于光谱量化的减少的误报识别

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202210770629.9A Pending CN115293233A (zh) 2018-01-26 2019-01-23 用于光谱量化的减少的误报识别

Country Status (8)

Country Link
US (3) US11009452B2 (zh)
EP (1) EP3517931A1 (zh)
JP (2) JP7242311B2 (zh)
KR (2) KR102461384B1 (zh)
CN (2) CN115293233A (zh)
CA (1) CA3029739A1 (zh)
MX (2) MX2022005667A (zh)
TW (2) TWI759577B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11656174B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Outlier detection for spectroscopic classification
US11009452B2 (en) 2018-01-26 2021-05-18 Viavi Solutions Inc. Reduced false positive identification for spectroscopic quantification
US10810408B2 (en) 2018-01-26 2020-10-20 Viavi Solutions Inc. Reduced false positive identification for spectroscopic classification
JP7226230B2 (ja) * 2019-09-27 2023-02-21 豊田合成株式会社 熱抵抗予測方法及び特性検査機
JP7353940B2 (ja) * 2019-11-26 2023-10-02 株式会社日立製作所 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム
JP7436745B2 (ja) 2021-02-26 2024-02-22 株式会社日立製作所 材料検査支援装置、方法およびプログラム
US20230038984A1 (en) * 2021-07-30 2023-02-09 Viavi Solutions Inc. Utilizing prediction thresholds to facilitate spectroscopic classification
WO2023126996A1 (ja) * 2021-12-27 2023-07-06 日本たばこ産業株式会社 植物が含有する所定の成分の量を予測する方法、システム及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101504363A (zh) * 2009-03-18 2009-08-12 哈尔滨商业大学 一种基于近红外光谱分析的食用油脂酸价检测方法
CN106483083A (zh) * 2015-08-26 2017-03-08 唯亚威通讯技术有限公司 使用光谱学的识别
CN107561024A (zh) * 2017-07-17 2018-01-09 核工业北京地质研究院 一种适用于盐湖富铀水体的高光谱遥感识别方法

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2566543B1 (fr) 1984-06-20 1988-02-26 Commissariat Energie Atomique Dispositif optique a rendement de collection eleve et cytofluorimetre en faisant application
JP2922110B2 (ja) * 1994-02-22 1999-07-19 株式会社エヌ・ティ・ティ・データ 物品同定システム
US7133710B2 (en) 2002-03-08 2006-11-07 Sensys Medical, Inc. Compact apparatus for noninvasive measurement of glucose through near-infrared spectroscopy
US6785638B2 (en) 2001-08-06 2004-08-31 Timbre Technologies, Inc. Method and system of dynamic learning through a regression-based library generation process
US7376456B2 (en) 2002-08-05 2008-05-20 Infraredx, Inc. Near-infrared spectroscopic analysis of blood vessel walls
US7218395B2 (en) 2003-04-16 2007-05-15 Optopo Inc. Rapid pharmaceutical identification and verification system
US7514268B2 (en) * 2003-11-24 2009-04-07 The Boeing Company Method for identifying contaminants
WO2006056024A1 (en) 2004-11-29 2006-06-01 Scientific Analytics Systems Pty Ltd Modelling a phenomenon that has spectral data
EP1902356A4 (en) 2005-06-09 2009-08-19 Chemimage Corp CRIMINOLOGICAL INTEGRATED SEARCH TECHNOLOGY
US20070148697A1 (en) * 2005-12-27 2007-06-28 Boston Scientific Scimed, Inc. Methods and system for high throughput screening of polymer materials for medical devices
JP5297207B2 (ja) * 2006-03-10 2013-09-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スペクトル分析を介したdnaパターンの同定方法及びシステム
US20110237446A1 (en) 2006-06-09 2011-09-29 Chemlmage Corporation Detection of Pathogenic Microorganisms Using Fused Raman, SWIR and LIBS Sensor Data
US7990532B2 (en) 2007-01-16 2011-08-02 Chemimage Corporation Method and apparatus for multimodal detection
EP1992939A1 (en) 2007-05-16 2008-11-19 National University of Ireland, Galway A kernel-based method and apparatus for classifying materials or chemicals and for quantifying the properties of materials or chemicals in mixtures using spectroscopic data.
WO2009082418A2 (en) 2007-10-12 2009-07-02 Real-Time Analyzers, Inc. Method and apparatus for determining properties of fuels
CN102171551B (zh) 2009-12-25 2013-08-21 古河电气工业株式会社 检体识别分取装置及检体识别分取方法
US8859969B2 (en) * 2012-03-27 2014-10-14 Innovative Science Tools, Inc. Optical analyzer for identification of materials using reflectance spectroscopy
NL2009015C2 (en) 2012-04-10 2013-10-15 Biosparq B V Method for classification of a sample on the basis of spectral data, method for creating a database and method for using this database, and corresponding computer program, data storage medium and system.
CN103364359A (zh) 2012-04-11 2013-10-23 天士力制药集团股份有限公司 Simca模式识别法在近红外光谱识别大黄药材中的应用
US20130311136A1 (en) 2012-05-18 2013-11-21 Mustard Tree Instruments, Llc Rule-Based Sample Verification and Chemical Monitoring Methodology
TWI629464B (zh) * 2013-03-21 2018-07-11 唯亞威方案公司 用於識別一海產樣本之方法及裝置與用於判定一海產樣本之鮮度之方法
AU2014318499B2 (en) 2013-09-16 2019-05-16 Biodesix, Inc Classifier generation method using combination of mini-classifiers with regularization and uses thereof
WO2015080001A1 (ja) * 2013-11-27 2015-06-04 大日本印刷株式会社 培地情報登録システム、コロニー検出装置、プログラム及び衛生管理システム
CN106164890A (zh) 2013-12-02 2016-11-23 丘贝斯有限责任公司 用于消除非结构化文本中的特征的歧义的方法
EP3201812B1 (en) * 2014-10-02 2021-02-17 Biodesix, Inc. Predictive test for aggressiveness or indolence of prostate cancer from mass spectrometry of blood-based sample
JP6547275B2 (ja) 2014-10-29 2019-07-24 株式会社リコー 情報処理システム、情報処理装置、情報処理方法、及びプログラム
US9824434B2 (en) * 2015-08-18 2017-11-21 Industrial Technology Research Institute System and method for object recognition
EP3405896A4 (en) 2016-01-22 2019-09-25 Otraces Inc. SYSTEMS AND METHODS FOR ENHANCING DIAGNOSIS OF DISEASE
CA3019979A1 (en) 2016-04-04 2017-10-12 Boehringer Ingelheim Rcv Gmbh & Co Kg Real time monitoring of product purification
EP3258285B1 (en) 2016-06-14 2020-10-21 Bruker BioSpin GmbH Method for predicting chemical shift values of nmr spin systems in a sample of a fluid class, in particular in a sample of a biofluid
US10936921B2 (en) * 2017-06-15 2021-03-02 Spynsite Llc Machine learning and/or image processing for spectral object classification
US11656174B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Outlier detection for spectroscopic classification
US10810408B2 (en) 2018-01-26 2020-10-20 Viavi Solutions Inc. Reduced false positive identification for spectroscopic classification
US11009452B2 (en) 2018-01-26 2021-05-18 Viavi Solutions Inc. Reduced false positive identification for spectroscopic quantification

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101504363A (zh) * 2009-03-18 2009-08-12 哈尔滨商业大学 一种基于近红外光谱分析的食用油脂酸价检测方法
CN106483083A (zh) * 2015-08-26 2017-03-08 唯亚威通讯技术有限公司 使用光谱学的识别
CN107561024A (zh) * 2017-07-17 2018-01-09 核工业北京地质研究院 一种适用于盐湖富铀水体的高光谱遥感识别方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Combination of One-Class Support Vector Machines for Classification with Reject Option;Blaise Hanczar等;《Springer-Verlag Berlin Heidelberg 2014》;20141231;第547-562页 *
Estimate of standard deviation for a log-transformed variable using arithmetic means and standard deviations;hui Quan等;《Wiley》;20030819;参见全文 *
LAN SUN等.Pharmaceutical Raw Material Identification Using Miniature Near-Infrared (MicroNIR) Spectroscopy and Supervised Pattern Recognition Using Support Vector Machine.《Applied Spectroscopy》.2016,(第5期), *
Outlier Analysis;Charu C. Aggarwal;《Springer》;20170101;参见全文 *
Pharmaceutical Raw Material Identification Using Miniature Near-Infrared (MicroNIR) Spectroscopy and Supervised Pattern Recognition Using Support Vector Machine;LAN SUN等;《Applied Spectroscopy》;20160330(第5期);第816-825页 *

Also Published As

Publication number Publication date
KR20220149498A (ko) 2022-11-08
US20210215597A1 (en) 2021-07-15
US20190234866A1 (en) 2019-08-01
EP3517931A1 (en) 2019-07-31
TW201935316A (zh) 2019-09-01
JP2019148583A (ja) 2019-09-05
US11775616B2 (en) 2023-10-03
US11009452B2 (en) 2021-05-18
TWI784887B (zh) 2022-11-21
TW202223750A (zh) 2022-06-16
MX2019000496A (es) 2019-07-29
CN115293233A (zh) 2022-11-04
US20230385383A1 (en) 2023-11-30
MX2022005667A (es) 2022-06-16
CA3029739A1 (en) 2019-07-26
JP2023041065A (ja) 2023-03-23
KR20190091219A (ko) 2019-08-05
TWI759577B (zh) 2022-04-01
CN110084262A (zh) 2019-08-02
KR102461384B1 (ko) 2022-11-01
JP7242311B2 (ja) 2023-03-20

Similar Documents

Publication Publication Date Title
CN110084262B (zh) 用于光谱量化的减少的误报识别
CN110084261B (zh) 用于光谱分类的减少的误报识别
CN106483083B (zh) 使用光谱学的识别
US11719628B2 (en) Cross-validation based calibration of a spectroscopic model
US11656174B2 (en) Outlier detection for spectroscopic classification
EP4033419A1 (en) Outlier detection for spectroscopic classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40005115

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant