CN110084261A - 用于光谱分类的减少的误报识别 - Google Patents

用于光谱分类的减少的误报识别 Download PDF

Info

Publication number
CN110084261A
CN110084261A CN201910054785.3A CN201910054785A CN110084261A CN 110084261 A CN110084261 A CN 110084261A CN 201910054785 A CN201910054785 A CN 201910054785A CN 110084261 A CN110084261 A CN 110084261A
Authority
CN
China
Prior art keywords
classification
disaggregated model
measurement
unknown sample
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910054785.3A
Other languages
English (en)
Other versions
CN110084261B (zh
Inventor
熊章民
克里斯多佛·G·佩德森
马克·K·范贡藤
孙岚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Only Yahweh Communication Technology Co Ltd
Viavi Solutions Inc
Original Assignee
Only Yahweh Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Only Yahweh Communication Technology Co Ltd filed Critical Only Yahweh Communication Technology Co Ltd
Priority to CN202111346296.9A priority Critical patent/CN113989603A/zh
Publication of CN110084261A publication Critical patent/CN110084261A/zh
Application granted granted Critical
Publication of CN110084261B publication Critical patent/CN110084261B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/02Details
    • G01J3/10Arrangements of light sources specially adapted for spectrometry or colorimetry
    • G01J3/108Arrangements of light sources specially adapted for spectrometry or colorimetry for measurement in the infrared range
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/251Colorimeters; Construction thereof
    • G01N21/253Colorimeters; Construction thereof for batch operation, i.e. multisample apparatus
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本公开涉及用于光谱分类的减少的误报识别。设备可以接收识别已知样本的训练集和已知样本的验证集的一组光谱测量的结果的信息。设备可以基于识别一组光谱测量的结果的信息生成分类模型,其中,分类模型包括与用于光谱测定的感兴趣的材料相关的至少一个类别,并且其中,分类模型包括与至少一种不感兴趣的材料或基线光谱测量中的至少一个相关的不匹配类别。设备可以接收识别未知样本的特定光谱测量的特定结果的信息。设备可以使用分类模型确定未知样本是否被包括在不匹配类别中。设备可以提供指示未知样本是否被包括在不匹配类别中的输出。

Description

用于光谱分类的减少的误报识别
背景
原料识别可用于药物产品的质量控制。例如,可以对医用材料执行原料识别,以确定医用材料的组成成分是否对应于与医用材料相关联的包装标签。类似地,可以执行原料量化以确定特定样本中特定化学物的浓度。与其他化学计量技术相比,光谱法可以有助于以减少的准备和数据采集时间进行原料的无损识别和/或量化。
概述
根据一些可能的实施方式,设备可以包括一个或更多个存储器和通信地耦合到一个或更多个存储器的一个或更多个处理器。设备可以接收识别已知样本的训练集和已知样本的验证集的一组光谱测量的结果的信息。设备可以基于识别一组光谱测量的结果的信息生成分类模型,其中,分类模型包括与用于光谱测定(spectroscopic determination)的感兴趣的材料相关的至少一个类别,并且其中,分类模型包括与至少一种不感兴趣的材料或基线光谱测量中的至少一个相关的不匹配类别(no-match class)。设备可以接收识别未知样本的特定光谱测量的特定结果的信息。设备可以使用分类模型确定未知样本是否被包括在不匹配类别中。设备可以提供指示未知样本是否被包括在不匹配类别中的输出。
根据一些可能的实施方式,非临时计算机可读介质可以存储一个或更多个指令,该一个或更多个指令当由一个或更多个处理器执行时使一个或更多个处理器接收识别对未知样本执行的光谱测量的结果的信息。当由一个或更多个处理器执行时,一个或更多个指令可使一个或更多个处理器聚集分类模型的多个类别以生成聚集的分类模型。当由一个或更多个处理器执行时,一个或更多个指令可以使一个或更多个处理器使用聚集的分类模型确定光谱测量被准确地执行。当由一个或更多个处理器执行时,一个或更多个指令可以使一个或更多个处理器基于确定光谱测量被准确地执行并使用分类模型来确定未知样本不被包括在分类模型的不匹配类别中,其中,不匹配类别与不感兴趣的材料或基线光谱测量相关。当由一个或更多个处理器执行时,一个或更多个指令可以使一个或更多个处理器基于确定未知样本不被包括在不匹配类别中而执行未知样本的光谱分类。当由一个或更多个处理器执行时,一个或更多个指令可使一个或更多个处理器基于执行未知样本的光谱分类来提供识别未知样本的信息。
根据一些可能的实施方式,方法可以包括通过设备获得一组光谱测量的结果。方法可以包括由设备基于一组光谱测量的结果生成基于支持向量机(SVM)的分类模型,分类模型包括对应于用于分类的多种感兴趣的材料的多个类别,其中,一组光谱测量包括多种感兴趣的材料的样本的阈值数量的测量,其中,分类模型包括不对应于用于分类的多种感兴趣的材料的特定类别,并且其中,一组光谱测量包括小于阈值数量的与特定类别相关的样本的测量。方法可以包括由设备使用分类模型将特定样本的特定光谱测量分类到特定类别。方法可以包括由设备基于对特定光谱测量的分类来提供指示特定样本被分配给特定类别的信息。
1)一种设备,包括:
一个或更多个存储器;以及
一个或更多个处理器,所述一个或更多个处理器通信地耦合到所述一个或更多个存储器,所述一个或更多个处理器用于:
接收识别已知样本的训练集和已知样本的验证集的一组光谱测量的结果的信息;
基于识别所述一组光谱测量的结果的所述信息生成分类模型,所述分类模型包括与用于光谱测定的感兴趣的材料相关的至少一个类别,所述分类模型包括与至少一种不感兴趣的材料或基线光谱测量中的至少一个相关的不匹配类别;
接收识别未知样本的特定光谱测量的特定结果的信息;
使用所述分类模型确定所述未知样本是否被包括在所述不匹配类别中;以及
提供指示所述未知样本是否被包括在所述不匹配类别中的输出。
2)根据1)所述的设备,其中,所述一个或更多个处理器当确定所述未知样本是否被包括在所述不匹配类别中时:
基于所述分类模型确定所述未知样本被包括在所述不匹配类别中;以及
其中,所述一个或更多个处理器当提供指示所述未知样本是否被包括在所述不匹配类别中的输出时:
提供指示所述未知样本被包括在所述不匹配类别中的输出。
3)根据1)所述的设备,其中,所述一个或更多个处理器当确定所述未知样本是否被包括在所述不匹配类别中时用于:
基于所述分类模型确定所述未知样本不被包括在所述不匹配类别中;
使用所述分类模型并基于确定所述未知样本不被包括在所述不匹配类别中来确定所述未知样本的分类;以及
其中,所述一个或更多个处理器当提供指示所述未知样本是否被包括在所述不匹配类别中的输出时用于:
提供识别所述未知样本的分类的输出。
4)根据1)所述的设备,其中,所述一个或更多个处理器当接收识别所述一组光谱测量的结果的所述信息时用于:
接收识别一组基线光谱测量的信息;以及
其中,所述一个或更多个处理器当生成所述分类模型时用于:
基于所述一组基线光谱测量训练所述分类模型的所述不匹配类别。
5)根据4)所述的设备,其中,所述一组基线光谱测量与以下中的至少一个相关联:
使用不正确的测量距离执行的测量,
使用不正确的测量背景执行的测量,
使用不正确的测量照明执行的测量,或
在不存在样本的情况下执行的测量。
6)根据1)所述的设备,其中,所述一个或更多个处理器当接收识别所述一组光谱测量的结果的所述信息时用于:
接收识别所述至少一种不感兴趣的材料的信息;以及
其中,所述一个或更多个处理器当生成所述分类模型时用于:
基于识别所述至少一种不感兴趣的材料的所述信息,训练所述分类模型的所述不匹配类别。
7)根据1)所述的设备,其中,所述一个或更多个处理器当使用所述分类模型确定所述未知样本是否被包括在所述不匹配类别中时:
使用基于支持向量机的置信度度量来确定所述未知样本是否被包括在所述不匹配类别中。
8)根据7)所述的设备,其中,所述置信度度量是以下中的至少一个:
概率估计,或
决策值。
9)根据1)所述的设备,其中,所述分类模型是第一分类模型;以及其中,所述一个或更多个处理器当确定所述未知样本是否被包括在所述不匹配类别中时:
使用所述第一分类模型执行第一分类,以针对所述特定光谱测量识别所述第一分类模型的一组局部类别;
基于所述一组局部类别生成第二分类模型,所述第二分类模型包括所述不匹配类别;以及
执行第二分类以确定所述未知样本是否被包括在所述不匹配类别中。
10)一种存储指令的非临时计算机可读介质,所述指令包括:
一个或更多个指令,所述一个或更多个指令当由一个或更多个处理器执行时使所述一个或更多个处理器执行以下动作:
接收识别对未知样本执行的光谱测量的结果的信息;
聚集分类模型的多个类别以生成聚集的分类模型;
使用所述聚集的分类模型确定所述光谱测量被准确地执行;
基于确定所述光谱测量被准确地执行并且使用所述分类模型,确定所述未知样本不被包括在所述分类模型的不匹配类别中,所述不匹配类别与不感兴趣的材料或基线光谱测量相关;
基于确定所述未知样本不被包括在所述不匹配类别中,执行所述未知样本的光谱分类;以及
基于执行所述未知样本的所述光谱分类,提供识别所述未知样本的信息。
11)根据10)所述的非临时计算机可读介质,其中,使所述一个或更多个处理器确定所述未知样本不被包括在所述不匹配类别中的所述一个或更多个指令使所述一个或更多个处理器:
基于与所述分类模型相关联的置信度度量满足阈值,确定所述未知样本不被包括在所述不匹配类别中。
12)根据11)所述的非临时计算机可读介质,其中,所述一个或更多个指令当由所述一个或更多个处理器执行时还使所述一个或更多个处理器:
基于使用一对所有技术或全对技术将所述分类模型划分成多个子模型来确定所述置信度度量。
13)根据11)所述的非临时计算机可读介质,其中,所述分类模型包括大于阈值数量的类别;以及
其中,使所述一个或更多个处理器执行所述光谱分类的所述一个或更多个指令使所述一个或更多个处理器:
基于所述分类模型执行所述未知样本的第一光谱分类;
基于执行所述第一光谱分类,使用所述分类模型的类别子集生成另一分类模型;
基于所述另一分类模型确定所述未知样本不被包括在所述不匹配类别中;以及
执行第二分类以识别所述未知样本。
14)一种方法,包括:
由设备获得一组光谱测量的结果;
由所述设备基于所述一组光谱测量的结果生成基于支持向量机(SVM)的分类模型,所述分类模型包括对应于用于分类的多个感兴趣的材料的多个类别,所述一组光谱测量包括所述多个感兴趣的材料的样本的阈值数量的测量,所述分类模型包括不对应于用于分类的所述多个感兴趣的材料的特定类别,所述一组光谱测量包括与所述特定类别相关的样本的小于所述阈值数量的测量;
由所述设备使用所述分类模型将特定样本的特定光谱测量分类到所述特定类别;以及
由所述设备基于对所述特定光谱测量分类来提供指示所述特定样本被分配给所述特定类别的信息。
15)根据14)所述的方法,其中,对所述特定光谱测量分类包括:
将所述分类模型划分为多个子模型,所述多个子模型中的每个子模型对应于所述分类模型的对应类别和所述分类模型的每个其他类别之间的比较;
确定对应于所述多个子模型的多个决策值;以及
基于所述多个决策值为所述特定样本选择所述特定类别。
16)根据14)所述的方法,其中,对所述特定光谱测量分类包括:
将所述分类模型划分为多个子模型,所述多个子模型对应于所述分类模型的每个类别之间的比较;
确定对应于所述多个子模型的多个决策值;以及
基于所述多个决策值为所述特定样本选择所述特定类别。
17)根据14)所述的方法,其中,对所述特定光谱测量分类包括:
使用径向基函数类型的内核函数或线性内核类型的内核函数来对所述特定光谱测量进行分类。
18)根据14)所述的方法,其中,所述一组光谱测量包括基线光谱测量和不感兴趣的材料的光谱测量;以及
其中,所述基线光谱测量和所述不感兴趣的材料的光谱测量被分类到所述特定类别中。
19)根据14)所述的方法,其中,对所述特定光谱测量分类包括:
使用基于所述分类模型生成的原位局部分类模型对所述特定光谱测量进行分类。
20)根据14)所述的方法,其中,对所述特定光谱测量分类包括:
将所述分类模型的类别聚集成单个类别;以及
基于所述单个类别对所述特定光谱测量进行分类。
附图说明
图1A和图1B是本文中所述的示例实施方式的概况的图;
图2是本文中所述的系统和/或方法可以在其中被实现的示例环境的图;
图3是图2的一个或更多个设备的示例组件的图;
图4是用于生成用于光谱分类的分类模型的示例过程的流程图;
图5是与图4中所示的示例过程相关的示例实施方式的图;
图6是用于在光谱分类期间避免误报(false positive)识别的示例过程的流程图;以及
图7A和图7B是与图6中所示的示例过程有关的示例实施方式的图。
详细描述
示例实施方式的以下详细描述参考了附图。不同附图中的相同参考数字可以标识相同或类似的元素。
原料识别(RMID)是用于识别特定样本的组分(例如,成分)以用于识别、验证等的技术。例如,RMID可用于验证药物材料中的成分是否对应于标签上确定的成分集。类似地,原料量化是用于对特定样本执行量化分析的技术,例如确定特定样本中特定材料的浓度。光谱仪(spectrometer)可用于对样本(例如,药物材料)执行光谱法,以确定样本的组分、样本的组分的浓度等。光谱仪可确定样本的一组测量,并可提供一组测量以用于光谱测定。光谱分类技术(例如,分类器)可以有助于基于样本的一组测量确定样本的组分。
然而,一些要进行光谱分类的未知样本实际上不被包括在分类模型被配置为分类的类别中。例如,对于被训练用来区分鱼的类型的分类模型,用户可能会无意中提供牛肉用于分类。在该情况下,控制设备可以执行特定材料的光谱分类,并且可以提供特定材料作为特定类型的鱼的误报识别,这将是不准确的。
作为另一示例,分类模型可以被训练来分类糖的类型(例如,葡萄糖、果糖、半乳糖等),并量化未知样本中每种类型的糖的各自浓度。然而,光谱仪和控制设备的用户可能无意中试图基于不正确地使用光谱仪执行测量来对糖的未知样本进行分类。例如,用户可能在离未知样本不正确的距离处、在不同于校准条件的环境条件下、和/或类似的情况下操作光谱仪,在该校准条件下执行光谱法以训练分类模型。在该情况下,当未知样本实际上是第二浓度下的第二类型的糖时,控制设备可能接收到对于未知样本的不准确光谱,导致未知样本作为第一浓度下的第一类型的糖的误报识别。
本文中描述的一些实施方式可以利用用于分类模型的不匹配类别来减少对于光谱法的误报识别。例如,接收未知样本的光谱测量的控制设备可以确定是否将未知样本分配给不匹配类别。在一些实施方式中,控制设备可以确定未知样本将被分配给不匹配类别,并且可以提供指示未知样本被分配给不匹配类别的信息,从而避免对未知样本的误报识别。可替代地,基于确定未知样本不被分配给不匹配类别,控制设备可以分析未知样本的光谱以提供例如对分类、浓度等的光谱测定。此外,控制设备可以利用置信度度量(诸如概率估计、决策值等)来滤除误报识别。
以这种方式,光谱法的准确度相对于在不使用不匹配类别和/或置信度度量情况下执行的光谱法而得到提高。另外,当基于已知光谱样本的训练集生成分类模型时,可以使用不匹配类别。例如,控制设备可以确定训练集的样本不是对应于训练集的其余部分的类型(例如,基于导致错误样本被引入训练集的人为误差),并且可以确定在生成分类模型时不包括关于样本的数据。以这种方式,控制设备提高了用于光谱法的分类模型的准确性。
图1A和图1B是本文中所述的示例实施方式100的概况的图。如图1A所示,示例实施方式100可以包括控制设备和光谱仪。
如图1A中进一步示出的,控制设备可以使光谱仪对训练集和验证集(例如,用于分类模型的训练和验证的已知样本集)执行一组光谱测量。训练集和验证集可以被选择以包括用于分类模型的每个类别的阈值数量的样本。分类模型的类别可以指共享一种或更多种共同特征的类似材料的分组,例如(在药物背景下的)乳糖材料、果糖材料、对乙酰氨基酚材料、布洛芬(ibuprophen)材料、阿司匹林材料等。用于训练分类模型的以及对于其要使用分类模型执行原料识别的材料可以被称为感兴趣的材料。
如图1A中进一步示出的,光谱仪可以基于从控制设备接收到指令,对训练集和验证集执行一组光谱测量。例如,光谱仪可以确定关于训练集和验证集的每个样本的光谱,以使得控制设备能够生成一组类别,以用于将未知样本分类为用于分类模型的感兴趣的材料之一。
光谱仪可以向控制设备提供一组光谱测量。控制设备可以使用特定的测定技术并基于该组光谱测量来生成分类模型。例如,控制设备可以使用支持向量机(SVM)技术(例如,用于信息测定的机器学习技术)生成全局分类模型。全局分类模型可以包括与将特定光谱分配给特定类别的感兴趣的材料相关联的信息,并且可以包括与识别与特定类别相关联的感兴趣的材料的类型相关联的信息。以该方式,控制设备可以基于将未知样本的光谱分配给特定类别来提供识别未知样本的材料的类型的信息。
在一些实施方式中,控制设备可以接收与对于不匹配类别的样本相关的光谱。例如,控制设备可以接收被确定为与感兴趣的材料的光谱类似的光谱、与可能与感兴趣的材料(例如在视觉上、化学上等)混淆的材料相关的光谱、与光谱仪的不正确操作相关的光谱(例如,在没有样本的情况下执行测量的光谱、在样本和光谱仪的光学器件之间的不正确距离处执行测量的光谱等等)、和/或类似光谱。不是感兴趣的材料以及可被包含在不匹配类别中的材料可以被称为干扰(nuisance)材料或不感兴趣的材料。在该情况下,控制设备可以生成用于分类模型的不匹配类别,并且可以基于被包括在验证集中的干扰材料的光谱使用不匹配类别来验证误报识别避免。另外或可替代地,在分类模型的使用期间,控制设备可以接收识别干扰材料的信息,并且可以更新分类模型以能够避免误报识别(例如,将干扰材料识别为感兴趣的材料之一)。
如图1B所示,控制设备可以(例如,从储存器、从生成分类模型的另一控制设备等)接收分类模型。控制设备可以使光谱仪对未知样本(例如,要对其执行分类或量化的未知样本)执行一组光谱测量。光谱仪可以基于从控制设备接收到指令来执行一组光谱测量。例如,光谱仪可以确定关于未知样本的光谱。光谱仪可以向控制设备提供一组光谱测量。控制设备可以试图基于分类模型例如使用多阶段分类技术来对未知样本进行分类。
关于图1B,控制设备可以试图使用分类模型来确定未知样本是否在不匹配类别中。例如,控制设备可以确定对应于未知样本属于不匹配类别的可能性的置信度度量。在该情况下,基于控制设备确定置信度度量(例如概率估计、支持向量机的决策值输出等)满足阈值,控制设备可以将未知样本分配给不匹配类别。在该情况下,控制设备可以报告未知样本不能够使用分类模型被准确地分类,从而降低未知样本经受未知样本属于感兴趣的材料的类别的误报识别的可能性。
在一些实施方式中,基于未知样本不属于不匹配类别的第一测定,控制设备可以试图使用原位(in-situ)局部建模来执行未知集的特定样本的测定。例如,控制设备可以确定与特定样本和全局分类模型相关联的一组置信度度量。在该情况下,控制设备可以基于一个或更多个相应的置信度度量来选择全局分类模型的类别的子集,并且可以基于该组类别来生成局部分类模型。局部分类模型可以是使用SVM技术和类别的子集生成的原位分类模型。基于生成原位分类模型,控制设备可以试图基于局部分类模型对未知样本进行分类。在该情况下,基于与局部分类模型相关联的一个或更多个置信度度量满足阈值,控制设备可以确定未知样本确实属于不匹配类别,并且可以报告未知样本不能够使用分类模型被分类。可替代地,控制设备可以确定未知样本不属于不匹配类别,并且可以报告与未知样本相关的分类。
以这种方式,基于减少报告未知样本作为感兴趣的材料的误报识别的可能性,控制设备相对于其他分类模型以提高的准确度实现了对于未知样本的光谱法。
如上所指示,图1A和图1B仅作为示例被提供。其它示例是可能的,并且可以不同于关于图1A和图1B描述的示例。
图2是本文中所述的系统和/或方法可以在其中被实现的示例环境200的图。如图2所示,环境200可以包括控制设备210、光谱仪220和网络230。环境200的设备可经由有线连接、无线连接或有线连接和无线连接的组合来互连。
控制设备210可以包括能够存储、处理和/或路由与光谱分类相关联的信息的一个或更多个设备。例如,控制设备210可以包括服务器、计算机、可穿戴设备、云计算设备、和/或基于训练集的一组测量生成分类模型、基于验证集的一组测量验证分类模型和/或利用分类模型来基于未知集的一组测量执行光谱分类的类似设备。在一些实施方式中,如本文中所述,控制设备210可以利用机器学习技术来确定未知样本的光谱测量是否将被分类到不匹配类别中,以减少误报识别的可能性。在一些实施方式中,控制设备210可以与特定光谱仪220相关联。在一些实施方式中,控制设备210可以与多个光谱仪220相关联。在一些实施方式中,控制设备210可以从环境200中的另一设备(例如光谱仪220)接收信息和/或向环境200中的另一设备(例如光谱仪220)传输信息。
光谱仪220可以包括能够对样本执行光谱测量的一个或更多个设备。例如,光谱仪220可以包括执行光谱法(例如,振动光谱法,诸如近红外(NIR)光谱仪、中红外光谱法(mid-IR)、拉曼(Raman)光谱法等)的光谱仪设备。在一些实施方式中,光谱仪220可以被结合到可穿戴设备中,例如可穿戴光谱仪和/或类似设备。在一些实施方式中,光谱仪220可以从环境200中的另一设备(例如控制设备210)接收信息和/或向环境200中的另一设备(例如控制设备210)传输信息。
网络230可包括一个或更多个有线网络和/或无线网络。例如,网络230可包括蜂窝网络(例如,长期演进(LTE)网络、3G网络、码分多址(CDMA)网络等)、公共陆地移动网络(PLMN)、局域网(LAN)、广域网(WAN)、城域网(MAN)、电话网络(例如,公共交换电话网络(PSTN))、专用网络、自组织网络、内联网、互联网、基于光纤的网络、云计算网络等、和/或这些或其它类型的网络的组合。
图2中显示的设备和网络的数量和布置作为示例被提供。实际上,与图2中显示的那些设备和/或网络相比,可以有附加的设备和/或网络、更少的设备和/或网络、不同的设备和/或网络、或不同地布置的设备和/或网络。此外,图2中显示的两个或更多个设备可在单个设备内实现,或图2中显示的单个设备可被实现为多个分布式设备。例如,尽管控制设备210和光谱仪220在本文中被描述为两个独立的设备,但是控制设备210和光谱仪220可以在单个设备内实现。另外或可替代地,环境200的一组设备(例如,一个或更多个设备)可以执行被描述为由环境200的另一组设备执行的一个或更多个功能。
图3是设备300的示例组件的图。设备300可以对应于控制设备210和/或光谱仪220。在一些实施方式中,控制设备210和/或光谱仪220可以包括一个或更多个设备300和/或设备300的一个或更多个组件。如图3所示,设备300可包括总线310、处理器320、存储器330、存储组件340、输入组件350、输出组件360、以及通信接口370。
总线310包括允许在设备300的组件当中通信的组件。处理器320在硬件、固件、或硬件和软件的组合中实现。处理器320是中央处理单元(CPU)、图形处理单元(GPU)、加速处理单元(APU)、微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、或其它类型的处理组件。在一些实施方式中,处理器320包括能够被编程以执行功能的一个或更多个处理器。存储器330包括随机存取存储器(RAM)、只读存储器(ROM)、和/或存储信息和/或指令以用于由处理器320使用的另一类型的动态或静态存储设备(例如,闪存、磁存储器、和/或光学存储器)。
存储组件340存储与设备300的操作和使用相关的信息和/或软件。例如,存储组件340可以包括硬盘(例如,磁盘、光盘、磁光盘、和/或固态盘)、压缩光盘(CD)、数字通用盘(DVD)、软盘、盒式磁带(cartridge)、磁带、和/或另一类型的非临时计算机可读介质连同相应的驱动器。
输入组件350包括允许设备300例如经由用户输入(例如,触摸屏显示器、键盘、小键盘、鼠标、按钮、开关、和/或麦克风)来接收信息的组件。另外或可替代地,输入组件350可以包括用于感测信息的传感器(例如,全球定位系统(GPS)组件、加速度计、陀螺仪、和/或致动器)。输出组件360包括提供来自设备300的输出信息的组件(例如,显示器、扬声器、和/或一个或更多个发光二极管(LED))。
通信接口370包括使设备300能够例如经由有线连接、无线连接、或有线和无线连接的组合与其它设备通信的类似收发机组件(例如,收发机和/或单独的接收机和发射机)。通信接口370可以允许设备300从另一设备接收信息和/或将信息提供给另一设备。例如,通信接口370可以包括以太网接口、光学接口、同轴接口、红外接口、射频(RF)接口、通用串行总线(USB)接口、无线局域网络接口、蜂窝网络接口等。
设备300可以执行本文中所述的一个或更多个过程。设备300可以基于处理器320执行由非临时计算机可读介质(例如存储器330和/或存储组件340)存储的软件指令来执行这些过程。计算机可读介质在本文中被定义为非临时存储器设备。存储器设备包括单个物理存储设备内的存储器空间或遍布于多个物理存储设备的存储器空间。
软件指令可以经由通信接口370从另一计算机可读介质或从另一设备被读取到存储器330和/或存储组件340中。存储在存储器330和/或存储组件340中的软件指令当被执行时可使处理器320执行本文中所述的一个或更多个过程。另外或可替代地,硬连线电路可代替软件指令或与软件指令组合来使用以执行本文中所述的一个或更多个过程。因此,本文中所述的实施方式不限于硬件电路和软件的任何特定组合。
图3中显示的组件的数量和布置作为示例被提供。实际上,与图3中显示的那些组件相比,设备300可以包括附加的组件、更少的组件、不同的组件、或不同地布置的组件。另外或可替代地,设备300的一组组件(例如,一个或更多个组件)可以执行被描述为由设备300的另一组组件执行的一个或更多个功能。
图4是用于生成用于光谱分类的分类模型的示例过程400的流程图。在一些实施方式中,图4的一个或更多个过程框可以由控制设备210执行。在一些实施方式中,图4的一个或更多个过程框可以由另一设备或与控制设备210分离的或者包括控制设备210的设备组(诸如光谱仪220)执行。
如图4所示,过程400可包括使一组光谱测量针对训练集和/或验证集而被执行(框410)。例如,控制设备210可以(例如,使用处理器320、通信接口370等)使光谱仪220对样本的训练集和/或验证集执行一组光谱测量,以确定对于训练集和/或验证集的每个样本的光谱。训练集可以指一种或更多种已知材料的样本集,其用于生成分类模型。类似地,验证集可以指一种或更多种已知材料的样本集,其用于验证分类模型的准确性。例如,训练集和/或验证集可以包括一组材料的一个或更多个版本(例如,由不同制造商制造以控制制造差异的一个或更多个版本)。
在一些实施方式中,训练集和/或验证集可以基于预期的一组感兴趣的材料来被选择,对于该预期的一组感兴趣的材料将使用分类模型来执行光谱分类。例如,当预期对药物材料执行光谱量化以确定药物材料的特定组分的存在时,训练集和/或验证集可以包括在一组不同可能浓度下的活性药物成分(API)、赋形剂(excipient)等的样本集。
在一些实施方式中,训练集和/或验证集可以被选择以包括每种类型的材料的特定数量的样本。例如,训练集和/或验证集可以被选择以包括特定材料的多个样本(例如,5个样本、10个样本、15个样本、50个样本等)和/或其浓度。在一些实施方式中,样本的数量可以小于阈值。例如,可以基于10个样本的50个光谱(例如,光谱扫描)、3个样本的15个光谱等生成同质(homogeneous)有机化合物的类别。类似地,对于异质(heterogeneous)有机化合物,可以基于例如来自20个样本的100个光谱、来自10个样本的50个光谱等生成类别。类似地,可以基于来自40个样本的400个光谱、来自20个样本的200个光谱等生成生物或农业材料的类别。在一些实施方式中,用于干扰材料的不匹配类别的样本和/或光谱的数量可以与同一种类型的材料(例如,同质有机化合物、异质有机化合物、生物或农业材料等)的非不匹配类别(non-no-match class)的相同或减少数量的样本和/或光谱相关联。以这种方式,控制设备210可以被提供有与特定类型材料相关联的阈值数量的光谱,从而便于对分类模型(例如,全局分类模型、局部分类模型等)或量化模型的类别的生成和/或验证,未知样本可以被准确地分配给该类别,该量化模型可以被用来量化分配给与量化模型相关联的类别的光谱。
在一些实施方式中,将被分配给不匹配类别的材料的一个或更多个样本可以被包括在训练集和/或验证集中。例如,光谱仪220可以提供第一材料的测量,该第一材料与待使用量化模型量化的第二材料类似的光谱相关联。以这种方式,控制设备210可以使用机器学习来训练误报识别的避免。在一些实施方式中,控制设备210可以基于接收到的信息选择用于不匹配类别的材料。例如,控制设备210可以接收识别具有与要为其生成分类模型的特定浓度的感兴趣的材料类似的光谱、外观等的干扰材料的信息。另外或可替代地,控制设备210可以执行机器学习技术以自动识别特定感兴趣的材料的干扰材料。例如,控制设备210可以使用机器学习来执行模式识别,以识别与感兴趣的材料的光谱类似的干扰材料的光谱,以识别视觉上看上去与感兴趣的材料类似的干扰材料、和/或诸如此类。
在一些实施方式中,控制设备210可以使基线光谱测量被执行以识别不匹配类别的光谱。例如,控制设备210可以使光谱测量在没有样本存在、背景不正确、照明不正确、和/或诸如此类的情况下执行作为基线光谱测量,以确保不正确的光谱测量被分类为不匹配类别,而不是被分类为特定感兴趣的材料。在该情况下,控制设备210可以自动控制光谱仪220、使用用户界面提供信息以指导光谱仪220的用户执行不正确的测量等。另外或可替代地,控制设备210可以接收指示特定光谱测量被错误执行以使得能够生成不匹配类别的信息。
在一些实施方式中,控制设备210可以使多个光谱仪220执行一组光谱测量以应对一个或更多个物理条件。例如,控制设备210可以使第一光谱仪220和第二光谱仪220使用NIR光谱法来执行一组振动光谱测量。另外或可替代地,控制设备210可以使一组光谱测量在多个时间、在多个位置、在多个不同的实验室条件等被执行。以这种方式,控制设备210减少了光谱测量不准确的可能性,这是作为相对于使一组光谱测量由单个光谱仪220执行的物理条件的结果。
如图4中进一步示出的,过程400可包括接收识别一组光谱测量的结果的信息(框420)。例如,控制设备210可以(例如,使用处理器320、通信接口370等)接收识别该组光谱测量的结果的信息。在一些实施方式中,控制设备210可以接收识别对应于训练集和/或验证集的样本的一组光谱的信息。例如,控制设备210可以接收识别在光谱仪220对训练集执行光谱法时观察到的特定光谱的信息。在一些实施方式中,控制设备210可以同时接收识别训练集和验证集的光谱的信息。在一些实施方式中,控制设备210可以接收识别训练集的光谱的信息,可以生成分类模型,并且可以在生成分类模型之后接收识别验证集的光谱的信息,以能够测试分类模型。在一些实施方式中,控制设备210可以接收作为一组光谱测量的结果的其他信息,例如指示测量被不准确地执行以生成不匹配类别的信息。另外或可替代地,控制设备210可以接收与识别能量吸收、能量辐射、能量散射等相关联的信息。
在一些实施方式中,控制设备210可以从多个光谱仪220接收识别一组光谱测量的结果的信息。例如,控制设备210可以通过接收由多个光谱仪220执行的、在多个不同时间执行的、在多个不同位置处等执行的光谱测量来控制物理条件(例如多个光谱仪220之间的差异、实验室条件中的潜在差异等)。
在一些实施方式中,控制设备210可以从生成分类模型的利用中移除一个或更多个光谱。例如,控制设备210可以执行光谱分类,并且可以将光谱分类到不匹配类别中,并且可以确定对应于该光谱的样本无意地是干扰材料或不感兴趣的材料(例如,基于正确执行光谱法中的人为误差、识别训练集的光谱的信息中的误差等),并且可以确定从训练集中移除该光谱。以该方式,控制设备210可以通过减少使用关于训练集或验证集的不正确或不准确信息生成分类模型的可能性来提高分类模型的准确性。
如图4中进一步示出的,过程400可以包括基于识别一组光谱测量的结果的信息生成分类模型(框430)。例如,控制设备210可以基于识别一组光谱测量的结果的信息(例如,使用处理器320、存储器330、存储组件340等)生成与主组分分析(PCA)-SVM分类器技术相关联的全局分类模型(例如,用于原位局部建模技术)。
在一些实施方式中,控制设备210可以执行一组测定来生成全局分类模型。例如,控制设备210可以生成用于全局分类模型的一组类别,并且可以基于使用SVM技术将由一组光谱测量的结果识别的一组光谱分配到局部类别中。在一些实施方式中,在使用全局分类模型期间,控制设备210使用与全局分类模型相关的置信度度量来识别对应于未知光谱的局部类别的阈值量,基于局部类别生成局部分类模型,并且基于局部分类模型来确定未知光谱的身份。在该情况下,可以生成用于局部分类模型的不匹配类别(例如,从全局分类模型原位生成的局部分类模型可以包括不匹配类别)。以这种方式,通过使用具有第一分类和第二分类的原位局部建模,控制设备210能够对大量类别(例如,大于阈值,诸如大于50个类别、大于100个类别、大于200个类别、大于1000个类别等)进行分类。在一些实施方式中,控制设备210可以生成用于分类未知光谱的另一类型的分类模型和/或使用另一种类型的分类器用于分类模型。
SVM可以指执行模式识别并使用置信度度量以进行分类的监督学习模型。在一些实施方式中,当使用SVM技术生成全局分类模型时,控制设备210可以利用特定类型的内核函数来确定两个或更多个输入(例如,光谱)的类似性。例如,控制设备210可以利用径向基函数(RBF)(例如,称为SVM-rbf)类型的内核函数,其可以被表示为对于光谱x和y的k(x,y)=exp(-||x-y||^2);线性函数(例如,当用于多阶段测定技术时,称为SVM-线性和层次(hier)-SVM-线性)类型的内核函数,其可以被表示为k(x,y)=<x·y>;S形函数(sigmoidfunction)类型的内核函数;多项式函数类型的内核函数;指数函数类型的内核函数;和/或类似的函数。
在一些实施方式中,控制设备210可以针对SVM利用特定类型的置信度度量,诸如基于概率值的SVM(例如,基于确定样本是一组类别中的类别的成员的概率的测定)、基于决策值的SVM(例如,利用决策函数投票给一组类别中的类别作为样本是其成员的类别的测定)等。例如,在利用基于决策值的SVM的分类模型的使用期间,控制设备210可以基于未知样本的光谱的测绘来确定未知样本是否位于组成类别的边界内,并且可以基于未知样本是否位于组成类别的边界内来将样本分配给类别。以这种方式,控制设备210可以确定是否将未知光谱分配给特定类别、分配给不匹配类别等。
在一些实施方式中,控制设备210可以利用特定类别比较技术来确定决策值。例如,控制设备210可以利用一对所有(one-versus-all)技术(有时称为一对所有其他技术),其中分类模型被分成一组子模型,每个子模型基于一类别与分类模型的每个其他类别的比较,并且决策值基于每个子模型来确定。另外或可替代地,控制设备210可以利用全对(all-pair)技术,其中分类模型被划分成每个可能的类别对以形成子模型,从子模型确定决策值。
尽管本文中所述的一些实施方式是以一组特定的机器学习技术的方式来描述的,但是其他技术也可能用于确定关于未知光谱的信息,例如材料的分类等等。
在一些实施方式中,控制设备210可以从一组分类技术中选择要用于生成全局分类模型的特定分类器。例如,控制设备210可以生成对应于多个分类器的多个分类模型,并且可以测试多个分类模型,例如通过确定每个模型的可传递性(例如,基于在第一光谱仪220上执行的光谱测量生成的分类模型当应用于在第二光谱仪220上执行的光谱测量时准确的程度)、大规模测定的准确度(例如,分类模型可被用于同时对满足阈值的一定量的样本分类的准确度)等等。在该情况下,控制设备210可以基于确定分类器相对于其他分类器与优越的可转移性和/或大规模测定的准确度相关联来选择分类器,诸如SVM分类器(例如,层次-SVM-线性)。
在一些实施方式中,控制设备210可以基于识别训练集的样本的信息来生成分类模型。例如,控制设备210可以利用识别由训练集的样本表示的材料的类型或浓度的信息来识别具有材料的类型或浓度的光谱的类别。在一些实施方式中,当生成分类模型时,控制设备210可以训练分类模型。例如,控制设备210可以使用一组光谱测量的一部分(例如,与训练集相关的测量)来训练模型。另外或可替代地,控制设备210可以执行分类模型的评估。例如,控制设备210可以利用该组光谱测量的另一部分(例如,验证集)验证分类模型(例如,针对预测强度)。
在一些实施方式中,控制设备210可以使用多阶段测定技术来验证分类模型。例如,对于基于原位局部建模的分类,控制设备210可以确定全局分类模型当与一个或更多个局部分类模型相关联地被利用时是准确的。以该方式,控制设备210确保在提供分类模型以用于例如由控制设备210、由与其他光谱仪220相关联的其他控制设备210等利用之前以阈值准确度生成分类模型。
在一些实施方式中,控制设备210可以在生成分类模型之后向与其他光谱仪220相关联的其他控制设备210提供分类模型。例如,第一控制设备210可以生成分类模型,并且可以将分类模型提供给第二控制设备210用于利用。在该情况下,对于基于原位局部建模的分类,第二控制设备210可以存储分类模型(例如,全局分类模型),并且可以利用分类模型来生成一个或更多个原位局部分类模型,以用于对未知集的一个或更多个样本进行分类。另外或可替代地,控制设备210可以存储分类模型用于由控制设备210在执行分类、在生成一个或更多个局部分类模型(例如,用于基于原位局部建模的分类)、和/或类似情况时利用。以该方式,控制设备210提供分类模型用于在未知样本的光谱分类时利用。
虽然图4示出了过程400的示例框,但在一些实施方式中,与图4中描绘的那些框相比,过程400可以包括附加的框、更少的框、不同的框或不同地布置的框。另外或可替代地,过程400的两个或更多个框可并行地被执行。
图5是与图4中所示的示例过程400相关的示例实施方式500的图。图5示出了生成用于量化的具有误报识别的分类模型的示例。
如图5所示,控制设备210-1向光谱仪220-1传输信息,以指导光谱仪220-1对训练集和验证集510执行一组光谱测量。假设训练集和验证集510包括第一组训练样本(例如,其测量用于训练分类模型)和第二组验证样本(例如,其测量用于验证分类模型的准确性)。如由参考数字515示出的,光谱仪220-1基于接收到指令来执行一组光谱测量。如由参考数字520示出的,控制设备210-1接收对于训练样本的第一组光谱和验证样本的第二组光谱。在该情况下,验证样本可以包括用于分类的多种感兴趣的材料的样本以及用于训练分类模型的不匹配类别以避免误报识别的一种或更多种干扰材料或不正确测量的一个或更多个样本。假设控制设备210-1存储识别训练集和验证集510的每个样本的信息。
关于图5,假设控制设备210-1已经选择利用层次-SVM-线性分类器来生成分类模型(例如,基于针对一个或更多个其他分类器测试层次-SVM-线性分类器),该分类模型可以是原位局部建模类型的分类模型。如由参考数字525示出的,控制设备210-1使用层次-SVM-线性分类器和第一组光谱训练分类模型,并使用层次-SVM-线性分类器和第二组光谱验证分类模型。控制设备210-1可以使用第一组光谱的子集来训练分类模型以识别干扰材料,并且使用第二组光谱的子集来验证分类模型在识别干扰材料中的准确性,从而生成分类模型的不匹配类别。
假设控制设备210-1确定分类模型满足验证阈值(例如,具有超过验证阈值的准确度)。如参考数字530示出的,控制设备210-1将分类模型提供给控制设备210-2(例如,以用于在对由光谱仪220-2执行的光谱测量执行分类时利用)并提供给控制设备210-3(例如,以用于在对由光谱仪220-3执行的光谱测量执行分类时利用)。
如上所指示,图5仅作为示例被提供。其它示例是可能的,并且可以不同于关于图5描述的示例。
以这种方式,控制设备210有助于基于选择的分类技术(例如,基于模型可传递性、大规模分类的准确度等所选择的技术)的分类模型的生成和分类模型的分配以供与一个或更多个光谱仪220相关联的一个或更多个其他控制设备210利用。另外,控制设备210通过包括干扰材料的光谱测量以避免误报识别来提高分类模型的准确度。
图6是用于在原料识别期间避免误报识别的示例过程600的流程图。在一些实施方式中,图6的一个或更多个过程框可由控制设备210执行。在一些实施方式中,图6的一个或更多个过程框可由另一设备或与控制设备210分离的或者包括控制设备210的设备组(诸如光谱仪220)执行。
如图6所示,过程600可以包括接收识别对未知样本执行的一组光谱测量的结果的信息(框610)。例如,控制设备210可以(例如,使用处理器320、通信接口370等)接收识别对未知样本执行的一组光谱测量的结果的信息。在一些实施方式中,控制设备210可以接收识别对(例如,多个样本的)未知集的一组光谱测量的结果的信息。未知集可以包括要对其执行测定(例如,光谱分类)的一组样本(例如,未知样本)。例如,控制设备210可以使光谱仪220对该组未知样本执行一组光谱测量,并且可以接收识别对应于该组未知样本的一组光谱的信息。
在一些实施方式中,控制设备210可以从多个光谱仪220接收识别结果的信息。例如,控制设备210可以使多个光谱仪220对未知集(例如,相同的样本集)执行一组光谱测量,并且可以接收识别对应于未知集的样本的一组光谱的信息。另外或可替代地,控制设备210可以接收识别在多个时间、在多个位置等执行的一组光谱测量的结果的信息,并且可以基于在多个时间、在多个位置等执行的一组光谱测量(例如,基于平均该组光谱测量或基于另一技术)对特定样本进行分类和/或量化。以该方式,控制设备210可以应对可能影响该组光谱测量的结果的物理条件。
另外或可替代地,控制设备210可以使第一光谱仪220对未知集的第一部分执行一组光谱测量的第一部分,并且可以使第二光谱仪220对未知集的第二部分执行该组光谱测量的第二部分。以该方式,相对于使所有光谱测量都由单个光谱仪220执行,控制设备210可以减少一定量的时间来执行一组光谱测量。
如图6中进一步示出的,过程600可以包括确定一组光谱测量是否被准确地执行(框620)。例如,控制设备210可以(例如,使用处理器320、存储器330、存储组件340等)确定该组光谱测量是否被准确地执行。在一些实施方式中,控制设备210可以确定未知样本的光谱测量是否在(例如,在光谱仪220的光学组件和样本之间、在光谱仪220的光学组件和样本的背景之间等的)校准的距离处执行。另外或可替代地,控制设备210可以确定未知样本的光谱测量是否在校准的温度下、在校准的压力下、在校准的湿度下、使用校准的背景、使用校准的光谱仪、和/或类似条件下执行。
对于校准条件(诸如校准的距离、校准的温度、校准的压力、校准的湿度、校准的背景等)的校准的值可以包括模型在其处被训练和/或验证的值。例如,控制设备210可以从光谱仪220接收测量数据,其识别测量条件(诸如温度、未知样本和光谱仪220的光学组件之间的距离等)的值,并且控制设备210可以验证模型是使用与在阈值量的值内的对于校准条件的校准的值相关联的训练集和/或验证集来训练的。
另外或可替代地,控制设备210可以使用单类SVM(SC-SVM)分类器技术来执行健全性(sanity)检查,以确定未知光谱是否与被正确执行的测量相关联。例如,控制设备210可以聚集分类模型中的多个类别,以形成具有单个类别的聚集分类模型,并且使用具有决策值的SVM分类器来确定未知样本是否是离群(outlier)样本。在该情况下,当未知样本是离群样本时,控制设备210可以确定该组光谱测量没有被准确地执行,并且可以使一组光谱测量被再次执行,并且可以接收识别另一组光谱测量的另一组结果(框620-否)。以该方式,控制设备210能够识别与分类模型相差阈值量的未知光谱,而无需使用与未知样本类似的样本(例如,也与感兴趣的材料的训练集样本相差阈值量)来训练分类模型。另外,控制设备210减少了要收集用于生成分类模型的样本量,从而相对于获取、存储和处理与感兴趣的材料相差阈值量的干扰材料的其他样本,减少了成本、时间和计算资源利用率(例如,处理资源和存储器资源)。
此外,相对于在不确定测量条件是否匹配校准条件的情况下执行光谱法,控制设备210降低了光谱法的不准确结果(例如,不准确的量化、不准确的测定等)的可能性。另外,基于在尝试对未知样本进行分类之前确定对未知样本的测量被正确地执行,相对于尝试执行由于不正确的测量而失败的光谱法以及执行光谱法的另一次尝试,控制设备210减少了计算资源的利用。
如图6中进一步示出的,基于确定一组光谱测量被准确地执行(框620-是),过程600可以包括基于该组光谱测量的结果确定未知样本是否被包括在不匹配类别中(框630)。例如,控制设备210可以尝试(例如,使用处理器320、存储器330、存储组件340等)确定未知样本是否将被分类为不匹配类别(例如,不感兴趣的材料或干扰材料)。在一些实施方式中,控制设备210可以对未知样本进行分类,以确定未知样本是否被包括在不匹配类别中。例如,控制设备210可以对模型使用SVM-rbf内核函数或SVM-线性内核函数来确定用于将未知样本分类为不匹配类别的决策值。基于该决策值满足阈值决策值,控制设备210可以确定未知样本属于不匹配类别(例如,未知样本被确定为干扰材料,光谱被确定为与基线光谱测量相关联,诸如使用不正确的测量距离执行的测量、使用不正确的测量背景执行的测量、使用不正确的测量照明执行的测量、不存在样本的情况下执行的测量等)。以这种方式,控制设备210确定用于光谱法的分类模型没有被校准用于特定未知样本的光谱,并且避免了特定未知样本的误报识别。可替代地,控制设备210可以确定未知样本不属于不匹配类别。
如图6中进一步示出的,基于确定未知样本被包括在不匹配类别中(框630-是),过程600可以包括提供指示未知样本被包括在不匹配类别中的输出(框640)。例如,控制设备210可以例如经由用户接口(例如,使用处理器320、存储器330、存储组件340、通信接口370等)提供指示未知样本被包括在不匹配类别中的信息。在一些实施方式中,控制设备210可以提供与识别未知样本相关联的信息。例如,基于尝试量化特定植物中的特定化学物的量,并且确定未知样本不是该特定植物(而是另一植物,例如基于人为误差),控制设备210可以提供识别另一植物的信息。在一些实施方式中,控制设备210可以获得另一分类模型,并且可以使用另一分类模型以基于将未知光谱分配给分类模型的不匹配类别来识别未知样本。
以这种方式,控制设备210减少了基于对未知样本的误报识别提供不正确信息的可能性,并且通过提供信息以辅助确定未知样本是另一种植物而不是特定植物来使技术人员能够进行误差校正。
如图6中进一步示出的,基于确定未知样本不被包括在不匹配类别中(框630-否),过程600可以包括基于一组光谱测量的结果执行一个或更多个光谱测定(框650)。例如,控制设备210可以基于一组光谱测量的结果(例如使用处理器320、存储器330、存储组件340等)执行一个或更多个光谱测定。在一些实施方式中,控制设备210可以将未知样本分配给全局分类模型的一组类别中的特定类别,以执行第一测定。例如,控制设备210可以基于全局分类模型确定与特定样本相关联的特定光谱对应于局部类别的材料(例如,纤维素材料、乳糖材料、咖啡因材料等)。
在一些实施方式中,控制设备210可以基于置信度度量来分配特定样本。例如,控制设备210可以基于全局分类模型来确定特定光谱与全局分类模型的每个类别相关联的概率。在该情况下,控制设备210可以基于对于特定局部类别的特定概率超过与其他非局部类别相关联的其他概率,来将未知样本分配给该特定局部类别。以这种方式,控制设备210确定与样本相关联的材料的类型,从而识别样本。在一些实施方式中,控制设备210可以确定未知样本不满足与任何类别相关联的阈值,并且不满足与不匹配类别相关联的阈值。在该情况下,控制设备210可以提供输出,该输出指示未知样本不被包括在任何类别中,并且不能以对应于与不匹配类别相关联的阈值的置信度水平分配给不匹配类别。
在一些实施方式中,为了执行原位局部建模,例如对于具有大于阈值量的类别的分类模型,控制设备210可以基于第一测定生成局部分类模型。局部分类模型可以指基于与第一测定相关联的置信度度量使用SVM测定技术(例如SVM-rbf、SVM-线性等的内核函数;基于概率值的SVM、基于决策值的SVM等;和/或类似技术)生成的原位分类模型。在一些实施方式中,控制设备210可以生成多个局部分类模型。
在一些实施方式中,控制设备210可以基于使用全局分类模型执行第一测定来生成局部量化模型。例如,当控制设备210被用于确定未知样本中的物质的浓度,并且多个未知样本与用于确定物质的浓度的不同量化模型相关联时,控制设备210可以利用第一测定来选择类别的子集作为用于未知样本的局部类别,并且可以基于第一测定的结果来选择用于未知样本的量化模型。以这种方式,控制设备210利用层次测定和量化模型来改进光谱分类。
在一些实施方式中,控制设备210可以基于结果和局部分类模型来执行第二测定。例如,控制设备210可以基于局部分类模型和特定光谱将未知样本分类为全局分类模型的感兴趣的材料之一。在一些实施方式中,控制设备210可以确定与特定光谱和局部分类模型相关联的一组置信度度量。例如,控制设备210可以确定特定光谱与局部分类模型的每个类别相关联的概率,并且可以将特定光谱(例如,与特定光谱相关联的未知样本)分配给比局部分类模型的其他类别具有更高概率的类别。以这种方式,控制设备210识别未知样本。在一些实施方式中,控制设备210可以确定局部分类模型的不匹配类别,并且可以将特定光谱分配给局部分类模型的不匹配类别。在一些实施方式中,控制设备210可以确定未知样本未能满足分类模型的类别的阈值置信度度量,并且可以确定对于未知样本的分类失败。以这种方式,基于使用阈值置信度度量,控制设备210减少未知样本的误报识别的可能性。
在一些实施方式中,控制设备210可以在执行第一测定之后(和/或在执行第二测定之后)执行量化。例如,控制设备210可以基于执行一个或更多个测定来选择局部量化模型,并且可以基于选择局部量化模型来执行与特定样本相关的量化。作为示例,当执行原料识别以确定植物材料中特定化学物的浓度时,其中植物材料与多个量化模型相关联(例如,与植物是在室内还是室外、在冬季还是夏季生长等相关),控制设备210可以执行一组测定以识别特定量化模型。在该情况下,控制设备210可以基于执行一组测定来确定植物在冬季室内生长,并且可以选择与在冬季室内生长的植物相关的量化模型以用于确定特定化学物的浓度。
如图6中进一步示出的,基于当执行一个或更多个光谱分类时的分类失败(框650-A),过程600可以包括提供指示分类失败的输出,以及选择性地更新分类模型的类别(框660)。例如,控制设备210可以(例如,使用处理器320、存储器330、存储组件340、通信接口370等)提供指示分类失败的信息。例如,基于确定与分类相关联的置信度水平不满足阈值置信度水平,控制设备210可以提供指示分类失败的输出,从而降低误报测定的可能性。另外或可替代地,基于确定置信度水平不满足阈值,控制设备210可以选择性地更新分类模型的类别以用于执行分类。例如,控制设备210可以获得(例如,诸如来自操作员、数据库等的)识别样本的附加信息,并且可以确定样本属于标记的类别。在该情况下,控制设备210可以更新标记的类别,以实现改进的后续光谱分类。另外或可替代地,控制设备210可以获得指示样本不属于标记的类别的信息。在该情况下,控制设备210可以更新不匹配类别,以实现改进的后续不匹配分类。以这种方式,控制设备210针对光谱分类使迭代模型增强成为可能。
如图6中进一步示出的,基于执行一个或更多个光谱分类时的分类成功(框650-B),过程600可以包括提供识别与未知样本相关的分类的信息(框670)。例如,控制设备210可以(例如,使用处理器320、存储器330、存储组件340、通信接口370等)提供识别与未知样本相关的分类的信息。在一些实施方式中,控制设备210可以提供识别用于未知样本的特定类别的信息。例如,控制设备210可以提供指示与未知样本相关联的特定光谱被确定为与特定类别相关联的信息,从而识别未知样本。
在一些实施方式中,控制设备210可以提供指示与将未知样本分配给特定类别相关联的置信度度量的信息。例如,控制设备210可以提供识别未知样本与特定类别等相关联的概率的信息。以该方式,控制设备210提供指示特定光谱被准确地分配给特定类别的可能性的信息。
在一些实施方式中,控制设备210可以基于执行一组分类来提供量化。例如,基于识别与未知样本的类别相关的局部量化模型,控制设备210可以提供识别未知样本中的物质的浓度的信息。在一些实施方式中,控制设备210可以基于执行一组分类来更新分类模型。例如,控制设备210可以基于确定未知样本作为感兴趣的材料、干扰材料、和/或类似材料的分类,生成包括未知样本作为训练集的样本的新分类模型。
虽然图6示出了过程600的示例框,但在一些实施方式中,与图6中描绘的那些框相比,过程600可包括附加的框、更少的框、不同的框或不同地布置的框。另外或可替代地,过程600的两个或更多个框可并行地被执行。
图7A和图7B是与图6中所示的示例过程600相关联的预测成功率相关的示例实施方式700的图。图7A和图7B示出了使用基于层次支持向量机(层次-SVM线性)的技术的原料识别的示例结果。
如图7A中由参考数字705所示,控制设备210可以使光谱仪220执行一组光谱测量。例如,控制设备210可以提供指令,以使光谱仪220获得未知样本的光谱,从而确定未知样本作为分类模型被训练来识别的一组感兴趣的材料中的特定感兴趣的材料的分类。如由参考数字710和参考数字715示出的,光谱仪220可以接收未知样本,并且可以对未知样本执行一组光谱测量。如由参考数字720示出的,控制设备210可以接收基于光谱仪220对未知样本执行一组光谱测量的未知样本的光谱。
如图7B所示,控制设备210可以使用分类模型725来执行光谱分类。分类模型725包括针对训练集的一组光谱识别的一组类别730。例如,分类模型725包括潜在感兴趣的材料的类别730-1至730-6和干扰材料(例如,类似的材料;类似的光谱;不正确获得的光谱,例如不正确的照明光谱、不正确的距离光谱、不正确的背景光谱等;和/或类似物)的不匹配类别730-7。
如图7B中由参考数字735和740进一步示出的,未知样本的光谱被分配给不匹配类别,并且未知样本被识别为干扰材料(例如,不匹配类别的成员)。例如,控制设备210可以使用原位局部建模技术来基于全局模型(例如,分类模型725)生成局部模型,并且可以基于局部模型来确定未知样本是否是干扰材料。在一些实施方式中,控制设备210可以执行原位阈值技术以确定未知样本是否是干扰材料。例如,客户端设备750可以自验证或交叉验证与未知样本的第一最可能类别和/或样本的亚军(runner up)类别(例如,第二最可能类别)相关联的决策值,并且可以使用该决策值来设置用于预测阈值的上限和下限。在一些实施方式中,客户端设备750可以利用多个局部建模策略。例如,客户端设备750可以利用第一建模技术来确定获胜者(winner)类别,并且利用第二建模技术来确定置信度度量。在一些实施方式中,客户端设备750可以利用单类SVM(SC-SVM)技术来确定未知样本是否是干扰材料。如由参考数字745示出的,控制设备210向客户端设备750提供指示未知样本是干扰材料的输出,而不是提供未知样本作为感兴趣的材料中的特定浓度的感兴趣材料的误报识别。
如上所指示,图7A和图7B仅作为示例被提供。其它示例是可能的,并且可以不同于关于图7A和图7B描述的示例。
以这种方式,控制设备210基于避免未知样本作为分类模型被训练来识别的特定感兴趣的材料的误报识别来降低了提供光谱法的不准确结果的可能性。
前述公开提供了说明和描述,但并不旨在穷举或将实施方式限制到所公开的精确形式。根据以上公开,修改和变化是可能的或者可以从实施方式的实践中获得。
本文中结合阈值描述了一些实施方式。如本文中所使用的,满足阈值可以指值大于阈值、多于阈值、高于阈值、大于或等于阈值、小于阈值、少于阈值、低于阈值、小于或等于阈值、等于阈值等。
将明显的是,本文中所述的系统和/方法可在硬件、固件或固件和软件的组合的不同形式中实现。用于实现这些系统和/或方法的实际专用控制硬件或软件代码不是实施方式的限制。因此,在本文中描述系统和/或方法的操作和行为而不参考特定的软件代码,应理解,软件和硬件可以被设计成基于本文中的描述来实现系统和/或方法。
尽管在权利要求中陈述和/或在说明书中公开了特征的特定组合,但是这些组合并不旨在限制可能的实施方式的公开内容。事实上,这些特征中的许多可以以权利要求中未具体陈述和/或说明书中未公开的方式组合。尽管所附的每个从属权利要求可以直接从属于仅仅一个权利要求,但是可能的实施方式的公开内容包括与权利要求集中的每个其他权利要求相结合的每个从属权利要求。
本文中使用的任何元素、动作或指令都不应当被解释为关键或必要的,除非明确这样描述。另外,如本文中所使用的,冠词“一(a)”和“一(an)”旨在包括一个或更多个项目,并且可以与“一个或更多个(one or more)”互换使用。此外,如本文中所使用的,术语“集(set)”旨在包括一个或更多个项目(例如,相关项目、不相关项目、相关项目和不相关项目的组合等),并且可以与“一个或更多个”互换使用。在意指仅一个项目的情况下,使用术语“一个(one)”或类似的语言。另外,如本文中所使用的,术语“具有(has)”、“具有(have)”、“具有(having)”、和/或类似词语旨在是开放式的术语。此外,除非另有明确地说明,否则短语“基于”旨在表示“至少部分基于”。

Claims (20)

1.一种设备,包括:
一个或更多个存储器;以及
一个或更多个处理器,所述一个或更多个处理器通信地耦合到所述一个或更多个存储器,所述一个或更多个处理器:
接收识别已知样本的训练集和已知样本的验证集的一组光谱测量的结果的信息;
基于识别所述一组光谱测量的结果的所述信息生成分类模型,所述分类模型包括与用于光谱测定的感兴趣的材料相关的至少一个类别,所述分类模型包括与至少一种不感兴趣的材料或基线光谱测量中的至少一个相关的不匹配类别;
接收识别未知样本的特定光谱测量的特定结果的信息;
使用所述分类模型确定所述未知样本是否被包括在所述不匹配类别中;以及
提供指示所述未知样本是否被包括在所述不匹配类别中的输出。
2.根据权利要求1所述的设备,其中,所述一个或更多个处理器当确定所述未知样本是否被包括在所述不匹配类别中时:
基于所述分类模型确定所述未知样本被包括在所述不匹配类别中;以及
其中,所述一个或更多个处理器当提供指示所述未知样本是否被包括在所述不匹配类别中的输出时提供指示所述未知样本被包括在所述不匹配类别中的输出。
3.根据权利要求1所述的设备,其中,所述一个或更多个处理器当确定所述未知样本是否被包括在所述不匹配类别中时:
基于所述分类模型确定所述未知样本不被包括在所述不匹配类别中;
使用所述分类模型并基于确定所述未知样本不被包括在所述不匹配类别中来确定所述未知样本的分类;以及
其中,所述一个或更多个处理器当提供指示所述未知样本是否被包括在所述不匹配类别中的输出时提供识别所述未知样本的分类的输出。
4.根据权利要求1所述的设备,其中,所述一个或更多个处理器当接收识别所述一组光谱测量的结果的所述信息时:
接收识别一组基线光谱测量的信息;以及
其中,所述一个或更多个处理器当生成所述分类模型时:
基于所述一组基线光谱测量来训练所述分类模型的所述不匹配类别。
5.根据权利要求4所述的设备,其中,所述一组基线光谱测量与以下中的至少一个相关联:
使用不正确的测量距离执行的测量,
使用不正确的测量背景执行的测量,
使用不正确的测量照明执行的测量,或
在不存在样本的情况下执行的测量。
6.根据权利要求1所述的设备,其中,所述一个或更多个处理器当接收识别所述一组光谱测量的结果的所述信息时:
接收识别所述至少一种不感兴趣的材料的信息;以及
其中,所述一个或更多个处理器当生成所述分类模型时:
基于识别所述至少一种不感兴趣的材料的所述信息,训练所述分类模型的所述不匹配类别。
7.根据权利要求1所述的设备,其中,所述一个或更多个处理器当使用所述分类模型确定所述未知样本是否被包括在所述不匹配类别中时:
使用基于支持向量机的置信度度量来确定所述未知样本是否被包括在所述不匹配类别中。
8.根据权利要求7所述的设备,其中,所述置信度度量是以下中的至少一个:
概率估计,或
决策值。
9.根据权利要求1所述的设备,其中,所述分类模型是第一分类模型;以及
其中,所述一个或更多个处理器当确定所述未知样本是否被包括在所述不匹配类别中时:
使用所述第一分类模型执行第一分类,以针对所述特定光谱测量识别所述第一分类模型的一组局部类别;
基于所述一组局部类别生成第二分类模型,所述第二分类模型包括所述不匹配类别;以及
执行第二分类以确定所述未知样本是否被包括在所述不匹配类别中。
10.一种存储指令的非临时计算机可读介质,所述指令包括:
一个或更多个指令,所述一个或更多个指令当由一个或更多个处理器执行时使所述一个或更多个处理器执行以下动作:
接收识别对未知样本执行的光谱测量的结果的信息;
聚集分类模型的多个类别以生成聚集的分类模型;
使用所述聚集的分类模型确定所述光谱测量被准确地执行;
基于确定所述光谱测量被准确地执行并且使用所述分类模型,确定所述未知样本不被包括在所述分类模型的不匹配类别中,所述不匹配类别与不感兴趣的材料或基线光谱测量相关;
基于确定所述未知样本不被包括在所述不匹配类别中,执行所述未知样本的光谱分类;以及
基于执行所述未知样本的所述光谱分类,提供识别所述未知样本的信息。
11.根据权利要求10所述的非临时计算机可读介质,其中,使所述一个或更多个处理器确定所述未知样本不被包括在所述不匹配类别中的所述一个或更多个指令使所述一个或更多个处理器:
基于与所述分类模型相关联的置信度度量满足阈值,确定所述未知样本不被包括在所述不匹配类别中。
12.根据权利要求11所述的非临时计算机可读介质,其中,所述一个或更多个指令当由所述一个或更多个处理器执行时还使所述一个或更多个处理器:
基于使用一对所有技术或全对技术将所述分类模型划分成多个子模型来确定所述置信度度量。
13.根据权利要求11所述的非临时计算机可读介质,其中,所述分类模型包括大于阈值数量的类别;以及
其中,使所述一个或更多个处理器执行所述光谱分类的所述一个或更多个指令使所述一个或更多个处理器:
基于所述分类模型执行所述未知样本的第一光谱分类;
基于执行所述第一光谱分类,使用所述分类模型的类别子集生成另一分类模型;
基于所述另一分类模型确定所述未知样本不被包括在所述不匹配类别中;以及
执行第二分类以识别所述未知样本。
14.一种方法,包括:
由设备获得一组光谱测量的结果;
由所述设备基于所述一组光谱测量的结果生成基于支持向量机(SVM)的分类模型,所述分类模型包括对应于用于分类的多个感兴趣的材料的多个类别,所述一组光谱测量包括所述多个感兴趣的材料的样本的阈值数量的测量,所述分类模型包括不对应于用于分类的所述多个感兴趣的材料的特定类别,所述一组光谱测量包括与所述特定类别相关的样本的小于所述阈值数量的测量;
由所述设备使用所述分类模型将特定样本的特定光谱测量分类到所述特定类别;以及
由所述设备基于对所述特定光谱测量分类来提供指示所述特定样本被分配给所述特定类别的信息。
15.根据权利要求14所述的方法,其中,对所述特定光谱测量分类包括:
将所述分类模型划分为多个子模型,所述多个子模型中的每个子模型对应于所述分类模型的对应类别和所述分类模型的每个其他类别之间的比较;
确定对应于所述多个子模型的多个决策值;以及
基于所述多个决策值为所述特定样本选择所述特定类别。
16.根据权利要求14所述的方法,其中,对所述特定光谱测量分类包括:
将所述分类模型划分为多个子模型,所述多个子模型对应于所述分类模型的每个类别之间的比较;
确定对应于所述多个子模型的多个决策值;以及
基于所述多个决策值为所述特定样本选择所述特定类别。
17.根据权利要求14所述的方法,其中,对所述特定光谱测量分类包括:
使用径向基函数类型的内核函数或线性内核类型的内核函数来对所述特定光谱测量进行分类。
18.根据权利要求14所述的方法,其中,所述一组光谱测量包括基线光谱测量和不感兴趣的材料的光谱测量;以及
其中,所述基线光谱测量和所述不感兴趣的材料的光谱测量被分类到所述特定类别中。
19.根据权利要求14所述的方法,其中,对所述特定光谱测量分类包括:
使用基于所述分类模型生成的原位局部分类模型对所述特定光谱测量进行分类。
20.根据权利要求14所述的方法,其中,对所述特定光谱测量分类包括:
将所述分类模型的类别聚集成单个类别;以及
基于所述单个类别对所述特定光谱测量进行分类。
CN201910054785.3A 2018-01-26 2019-01-21 用于光谱分类的减少的误报识别 Active CN110084261B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111346296.9A CN113989603A (zh) 2018-01-26 2019-01-21 用于光谱分类的减少的误报识别

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862622637P 2018-01-26 2018-01-26
US62/622,637 2018-01-26
US16/130,732 US10810408B2 (en) 2018-01-26 2018-09-13 Reduced false positive identification for spectroscopic classification
US16/130,732 2018-09-13

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202111346296.9A Division CN113989603A (zh) 2018-01-26 2019-01-21 用于光谱分类的减少的误报识别

Publications (2)

Publication Number Publication Date
CN110084261A true CN110084261A (zh) 2019-08-02
CN110084261B CN110084261B (zh) 2021-11-02

Family

ID=64949198

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202111346296.9A Pending CN113989603A (zh) 2018-01-26 2019-01-21 用于光谱分类的减少的误报识别
CN201910054785.3A Active CN110084261B (zh) 2018-01-26 2019-01-21 用于光谱分类的减少的误报识别

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202111346296.9A Pending CN113989603A (zh) 2018-01-26 2019-01-21 用于光谱分类的减少的误报识别

Country Status (8)

Country Link
US (3) US10810408B2 (zh)
EP (2) EP3518147A1 (zh)
JP (3) JP6942741B2 (zh)
KR (3) KR102338904B1 (zh)
CN (2) CN113989603A (zh)
CA (1) CA3029507A1 (zh)
MX (2) MX2022008349A (zh)
TW (3) TWI776010B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113008160A (zh) * 2020-02-24 2021-06-22 长江存储科技有限责任公司 用于半导体芯片表面形貌计量的系统和方法
CN114692719A (zh) * 2022-02-24 2022-07-01 电子科技大学 一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法
US11562919B2 (en) 2020-02-24 2023-01-24 Yangtze Memory Technologies Co., Ltd. Systems and methods for semiconductor chip surface topography metrology
US11796307B2 (en) 2020-02-24 2023-10-24 Yangtze Memory Technologies Co., Ltd. Systems and methods for semiconductor chip surface topography metrology

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11009452B2 (en) 2018-01-26 2021-05-18 Viavi Solutions Inc. Reduced false positive identification for spectroscopic quantification
US10810408B2 (en) 2018-01-26 2020-10-20 Viavi Solutions Inc. Reduced false positive identification for spectroscopic classification
US11656174B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Outlier detection for spectroscopic classification
US11223638B2 (en) * 2018-12-27 2022-01-11 Rapid7, Inc. Stable network user account classifier
JP6856103B2 (ja) * 2019-09-30 2021-04-07 株式会社三洋物産 遊技機
JP7353940B2 (ja) * 2019-11-26 2023-10-02 株式会社日立製作所 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム
JP7418200B2 (ja) 2019-12-19 2024-01-19 キヤノン株式会社 識別装置、処理装置、処理方法、およびプログラム
JP7361594B2 (ja) * 2019-12-19 2023-10-16 キヤノン株式会社 識別装置、処理装置、処理方法、およびプログラム
CN113093967A (zh) * 2020-01-08 2021-07-09 富泰华工业(深圳)有限公司 数据生成方法、装置、计算机装置及存储介质
US11727089B2 (en) * 2020-09-08 2023-08-15 Nasdaq, Inc. Modular machine learning systems and methods
EP4033419A1 (en) * 2021-01-20 2022-07-27 Viavi Solutions Inc. Outlier detection for spectroscopic classification
TWI760206B (zh) * 2021-05-04 2022-04-01 行政院農業委員會農業藥物毒物試驗所 基於光譜圖辨識提供風險值的光學量測方法、光學量測系統、伺服端電腦裝置與客戶端電腦裝置
US20230038984A1 (en) * 2021-07-30 2023-02-09 Viavi Solutions Inc. Utilizing prediction thresholds to facilitate spectroscopic classification

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2566543B1 (fr) 1984-06-20 1988-02-26 Commissariat Energie Atomique Dispositif optique a rendement de collection eleve et cytofluorimetre en faisant application
JP2922110B2 (ja) 1994-02-22 1999-07-19 株式会社エヌ・ティ・ティ・データ 物品同定システム
US6785638B2 (en) * 2001-08-06 2004-08-31 Timbre Technologies, Inc. Method and system of dynamic learning through a regression-based library generation process
US20070192035A1 (en) * 2005-06-09 2007-08-16 Chem Image Corporation Forensic integrated search technology
CN100421615C (zh) 2002-03-08 2008-10-01 三西斯医学股份有限公司 通过近红外光谱对葡萄糖进行非侵入测量的小型装置
US7376456B2 (en) 2002-08-05 2008-05-20 Infraredx, Inc. Near-infrared spectroscopic analysis of blood vessel walls
US7218395B2 (en) * 2003-04-16 2007-05-15 Optopo Inc. Rapid pharmaceutical identification and verification system
US20090018804A1 (en) * 2004-11-29 2009-01-15 Scientific Analytics Systems Pty Ltd. Modelling a Phenomenon that has Spectral Data
CN101401101B (zh) 2006-03-10 2014-06-04 皇家飞利浦电子股份有限公司 用于通过谱分析鉴定dna模式的方法和系统
US20110237446A1 (en) * 2006-06-09 2011-09-29 Chemlmage Corporation Detection of Pathogenic Microorganisms Using Fused Raman, SWIR and LIBS Sensor Data
US7990532B2 (en) * 2007-01-16 2011-08-02 Chemimage Corporation Method and apparatus for multimodal detection
EP1992939A1 (en) * 2007-05-16 2008-11-19 National University of Ireland, Galway A kernel-based method and apparatus for classifying materials or chemicals and for quantifying the properties of materials or chemicals in mixtures using spectroscopic data.
US8781757B2 (en) * 2007-10-12 2014-07-15 Real-Time Analyzers, Inc. Method and apparatus for determining properties of fuels
CN101504363A (zh) 2009-03-18 2009-08-12 哈尔滨商业大学 一种基于近红外光谱分析的食用油脂酸价检测方法
WO2011077765A1 (ja) 2009-12-25 2011-06-30 古河電気工業株式会社 検体識別分取装置および検体識別分取方法
US8859969B2 (en) 2012-03-27 2014-10-14 Innovative Science Tools, Inc. Optical analyzer for identification of materials using reflectance spectroscopy
EP2648133A1 (fr) * 2012-04-04 2013-10-09 Biomerieux Identification de microorganismes par spectrometrie et classification structurée
NL2009015C2 (en) * 2012-04-10 2013-10-15 Biosparq B V Method for classification of a sample on the basis of spectral data, method for creating a database and method for using this database, and corresponding computer program, data storage medium and system.
CN103364359A (zh) 2012-04-11 2013-10-23 天士力制药集团股份有限公司 Simca模式识别法在近红外光谱识别大黄药材中的应用
US10043264B2 (en) * 2012-04-19 2018-08-07 Applied Materials Israel Ltd. Integration of automatic and manual defect classification
US20130311136A1 (en) * 2012-05-18 2013-11-21 Mustard Tree Instruments, Llc Rule-Based Sample Verification and Chemical Monitoring Methodology
CN107884340B (zh) 2013-03-21 2022-04-01 唯亚威通讯技术有限公司 海产品的光谱法表征
CA2924320A1 (en) * 2013-09-16 2015-03-19 Biodesix, Inc. Classifier generation method using combination of mini-classifiers with regularization and uses thereof
WO2015080001A1 (ja) 2013-11-27 2015-06-04 大日本印刷株式会社 培地情報登録システム、コロニー検出装置、プログラム及び衛生管理システム
KR20160124742A (ko) * 2013-12-02 2016-10-28 큐베이스 엘엘씨 비정형 텍스트내의 특징들의 중의성을 해소하는 방법
WO2016054031A1 (en) 2014-10-02 2016-04-07 Biodesix, Inc. Predictive test for aggressiveness or indolence of prostate cancer from mass spectrometry of blood-based sample
JP6547275B2 (ja) * 2014-10-29 2019-07-24 株式会社リコー 情報処理システム、情報処理装置、情報処理方法、及びプログラム
US9824434B2 (en) 2015-08-18 2017-11-21 Industrial Technology Research Institute System and method for object recognition
EP3136270B1 (en) * 2015-08-26 2021-02-24 Viavi Solutions Inc. Raw material identification using spectroscopy
US11694802B2 (en) 2016-01-22 2023-07-04 Otraces Inc. Systems and methods for improving diseases diagnosis
WO2017174580A1 (en) 2016-04-04 2017-10-12 Boehringer Ingelheim Rcv Gmbh & Co Kg Real time monitoring of product purification
EP3258285B1 (en) 2016-06-14 2020-10-21 Bruker BioSpin GmbH Method for predicting chemical shift values of nmr spin systems in a sample of a fluid class, in particular in a sample of a biofluid
US10444213B2 (en) * 2016-08-25 2019-10-15 Viavi Solutions Inc. Spectroscopic classification of conformance with dietary restrictions
US10936921B2 (en) 2017-06-15 2021-03-02 Spynsite Llc Machine learning and/or image processing for spectral object classification
CN107561024B (zh) 2017-07-17 2020-03-17 核工业北京地质研究院 一种适用于盐湖富铀水体的高光谱遥感识别方法
US10810408B2 (en) 2018-01-26 2020-10-20 Viavi Solutions Inc. Reduced false positive identification for spectroscopic classification
US11009452B2 (en) 2018-01-26 2021-05-18 Viavi Solutions Inc. Reduced false positive identification for spectroscopic quantification
US11656174B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Outlier detection for spectroscopic classification

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113008160A (zh) * 2020-02-24 2021-06-22 长江存储科技有限责任公司 用于半导体芯片表面形貌计量的系统和方法
US11562919B2 (en) 2020-02-24 2023-01-24 Yangtze Memory Technologies Co., Ltd. Systems and methods for semiconductor chip surface topography metrology
US11796307B2 (en) 2020-02-24 2023-10-24 Yangtze Memory Technologies Co., Ltd. Systems and methods for semiconductor chip surface topography metrology
CN114692719A (zh) * 2022-02-24 2022-07-01 电子科技大学 一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法
CN114692719B (zh) * 2022-02-24 2023-04-07 电子科技大学 一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法

Also Published As

Publication number Publication date
US20230273122A1 (en) 2023-08-31
TWI810013B (zh) 2023-07-21
JP7238056B2 (ja) 2023-03-13
TW201933261A (zh) 2019-08-16
US11656175B2 (en) 2023-05-23
TW202244826A (zh) 2022-11-16
CN110084261B (zh) 2021-11-02
US10810408B2 (en) 2020-10-20
MX2022008349A (es) 2022-08-08
KR102569560B1 (ko) 2023-08-22
JP2021192051A (ja) 2021-12-16
KR20210153579A (ko) 2021-12-17
JP2023088913A (ja) 2023-06-27
JP2019179023A (ja) 2019-10-17
MX2019000411A (es) 2019-09-10
KR20230124871A (ko) 2023-08-28
TW202343352A (zh) 2023-11-01
KR20190091205A (ko) 2019-08-05
US20190236333A1 (en) 2019-08-01
KR102338904B1 (ko) 2021-12-13
TWI776010B (zh) 2022-09-01
EP3518147A1 (en) 2019-07-31
CA3029507A1 (en) 2019-07-26
JP6942741B2 (ja) 2021-09-29
US20210034838A1 (en) 2021-02-04
CN113989603A (zh) 2022-01-28
EP4206653A1 (en) 2023-07-05

Similar Documents

Publication Publication Date Title
CN110084261A (zh) 用于光谱分类的减少的误报识别
CN110084262A (zh) 用于光谱量化的减少的误报识别
US11719628B2 (en) Cross-validation based calibration of a spectroscopic model
CN106483083A (zh) 使用光谱学的识别
EP4033419A1 (en) Outlier detection for spectroscopic classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40005112

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant