CN106483083B - 使用光谱学的识别 - Google Patents

使用光谱学的识别 Download PDF

Info

Publication number
CN106483083B
CN106483083B CN201610739767.5A CN201610739767A CN106483083B CN 106483083 B CN106483083 B CN 106483083B CN 201610739767 A CN201610739767 A CN 201610739767A CN 106483083 B CN106483083 B CN 106483083B
Authority
CN
China
Prior art keywords
classification
classification model
sample
control device
global
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610739767.5A
Other languages
English (en)
Other versions
CN106483083A (zh
Inventor
熊章民
克里斯多佛·G·佩德森
邹鹏
孙岚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Viavi Solutions Inc
Original Assignee
Viavi Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Viavi Solutions Inc filed Critical Viavi Solutions Inc
Priority to CN202010301988.0A priority Critical patent/CN111398195A/zh
Publication of CN106483083A publication Critical patent/CN106483083A/zh
Application granted granted Critical
Publication of CN106483083B publication Critical patent/CN106483083B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/3103Atomic absorption analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/40Measuring the intensity of spectral lines by determining density of a photograph of the spectrum; Spectrography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N35/00Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor
    • G01N35/00584Control arrangements for automatic analysers
    • G01N35/00722Communications; Identification
    • G01N35/00871Communications between instruments or with remote terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J2003/283Investigating the spectrum computer-interfaced
    • G01J2003/2836Programming unit, i.e. source and date processing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

本申请公开了使用光谱学的识别。设备可接收识别未知样品的光谱测量的结果的信息。设备可基于光谱测量的结果和全局分类模型来执行未知样品的第一分类。设备可基于第一分类来生成局部分类模型。设备可基于光谱测量的结果和局部分类模型来执行未知样品的第二分类。设备可基于执行第二分类来提供识别与未知样品相关的类别的信息。

Description

使用光谱学的识别
背景
原材料识别可用于药物产品的质量控制。例如,可对医学化合物执行原材料识别以确定医学化合物的组成成分是否相应于与医学化合物相关的包装标签。光谱学可利用相对于其它化学技术的减少的制备和数据获取时间来便于非破坏性原材料识别。
概述
根据一些可能的实现方式,设备可包括一个或多个处理器。一个或多个处理器可接收识别未知样品的光谱测量的结果的信息。一个或多个处理器可基于光谱测量的结果和全局分类模型来执行未知样品的第一分类。全局分类模型可利用支持向量机(SVM)分类器技术。全局分类模型可包括类别的全局组。一个或多个处理器可基于第一分类来生成局部分类模型。局部分类模型可利用SVM分类器技术。局部分类模型可包括类别的全局组的类别的子集。一个或多个处理器可基于光谱测量的结果和局部分类模型来执行未知样品的第二分类。一个或多个处理器可基于执行第二分类来提供识别类别的子集中的与未知样品相关的类别的信息。
根据一些可能的实现方式,计算机可读介质可存储指令,指令当由一个或多个处理器执行时可使一个或多个处理器接收识别未知组的一组光谱测量的结果的信息。未知组可包括一组未知样品。一个或多个指令当由一个或多个处理器执行时可使一个或多个处理器基于该组光谱测量的结果和全局分类模型来执行该组未知样品的第一分类。全局分类模型可利用支持向量机(SVM)线性分类器技术。一个或多个指令当由一个或多个处理器执行时可使一个或多个处理器基于第一分类来生成对于该组未知样品的一组局部分类模型。该组局部分类模型可利用SVM线性分类器技术。一个或多个指令当由一个或多个处理器执行时可使一个或多个处理器基于该组光谱测量的结果和该组局部分类模型来执行该组未知样品的第二分类。一个或多个指令当由一个或多个处理器执行时可使一个或多个处理器基于执行第二分类来提供识别该组未知样品的分类的信息。
根据一些可能的实现方式,方法可包括由设备接收识别由第一分光计执行的未知样品的光谱测量的结果的信息。该方法可包括基于光谱测量的结果和全局分类模型由设备来执行未知样品的第一分类。全局分类模型可通过利用支持向量机(SVM)分类器技术和由第二分光计执行的一组光谱测量来生成。该方法可包括基于第一分类由设备来生成局部分类模型。局部分类模型可利用SVM分类器技术。局部分类模型可包括全局分类模型的一组类别中的类别的子集。该方法可包括基于光谱测量的结果和局部分类模型由设备来执行未知样品的第二分类。该方法可包括基于执行第二分类由设备来提供识别类别的子集中的与未知样品相关的类别的信息。
(1)本申请涉及一种设备,包括:
一个或多个处理器,其用于:
接收识别未知样品的光谱测量的结果的信息;
基于光谱测量的结果和全局分类模型来执行未知样品的第一分类,
基于第一分类来生成局部分类模型,
基于光谱测量的结果和局部分类模型来执行未知样品的第二分类;以及
基于执行第二分类来提供识别与未知样品相关的类别的信息。
(2)如(1)所述的设备,其中一个或多个处理器还用于:
确定与全局分类模型的一组类别相关的一组相应的概率,
一组相应的概率中的特定概率指示未知样品与一组类别中的特定类别相关的可能性,
基于一组相应的概率来选择一组类别的子集;以及
其中一个或多个处理器在生成局部分类模型时用于:
基于一组类别的子集来生成局部分类模型。
(3)如(1)所述的设备,其中一个或多个处理器还用于:
执行自动按比例缩放预处理过程;以及
基于执行自动按比例缩放预处理过程来执行第一分类或第二分类中的至少一个。
(4)如(1)所述的设备,其中一个或多个处理器还用于:
接收来自与第一分光计相关的控制设备的全局分类模型,
全局分类模型由控制设备使用由第一分光计执行的一个或多个光谱测量来生成;
使光谱测量将由第二分光计执行,
第二分光计不同于第一分光计;以及
其中一个或多个处理器在执行未知样品的第一分类时用于:
基于使用由第一分光计执行的一个或多个光谱测量生成的全局分类模型并基于由第二分光计执行的光谱测量的结果来执行未知样品的第一分类。
(5)如(1)所述的设备,其中全局分类模型的一组类别相应于一组化合物,且类别被包括在该一组类别中;以及
其中一个或多个处理器在提供识别类别的信息时用于:
提供识别一组化合物中的相应于类别的化合物的信息。
(6)如(1)所述的设备,其中一个或多个处理器在执行第二分类时用于:
确定与未知样品相关的光谱与类别相关,
光谱由执行光谱测量的结果识别;以及
其中一个或多个处理器在提供识别类别的信息时用于:
基于确定与未知样品相关的光谱与类别相关来提供识别类别的信息。
(7)如(1)所述的设备,其中支持向量机(SVM)分类器技术用于生成全局分类模型或局部分类模型中的至少一个;以及
其中SVM分类器技术与下列项中的至少一个相关:
径向基函数类型的核函数,
线性函数类型的核函数,
S型函数类型的核函数,
多项式函数类型的核函数,或
指数函数类型的核函数。
(8)如(1)所述的设备,其中一个或多个处理器在执行第二分类时用于:
基于下列项中的至少一个将未知样品分配到类别:
概率值,或
决策值。
(9)本申请提供了一种存储指令的计算机可读介质,该指令包括:
当由一个或多个处理器执行时可使一个或多个处理器执行下列操作的一个或多个指令:
接收识别未知组的一组光谱测量的结果的信息,
该未知组包括多个未知样品;
基于一组光谱测量的结果和全局分类模型来执行多个未知样品的第一分类,
该全局分类模型利用支持向量机(SVM)线性分类器技术,
基于第一分类来生成用于多个未知样品的一组局部分类模型,
该一组局部分类模型利用SVM线性分类器技术;
基于所述一组光谱测量的所述结果和所述一组局部分类模型来执行所述多个未知样品的第二分类;以及
基于执行所述第二分类来提供识别所述多个未知样品的分类的信息。
(10)如(9)所述的计算机可读介质,其中全局分类模型基于由第一分光计执行的一个或多个光谱测量来生成;以及
其中使一个或多个处理器接收识别一组光谱测量的结果的信息的一个或多个指令使一个或多个处理器:
从第二分光计接收识别一组光谱测量的结果的信息,
第二分光计不同于第一分光计;以及
其中使一个或多个处理器执行第一分类的一个或多个指令使一个或多个处理器:
使用从第二分光计接收的一组光谱测量的结果和基于由第一分光计执行的一个或多个光谱测量而生成的全局分类模型来执行第一分类。
(11)如(9)所述的计算机可读介质,其中使一个或多个处理器接收识别一组光谱测量的结果的信息的一个或多个指令使一个或多个处理器:
接收相应于多个未知样品的多个光谱;以及
其中使一个或多个处理器执行第一分类的一个或多个指令使一个或多个处理器:
将多个光谱分配到全局分类模型的一个或多个类别,
全局分类模型的一个或多个类别相应于一种或多种化合物。
12.如权利要求11所述的计算机可读介质,其中所述一个或多个指令当由所述一个或多个处理器执行时还使所述一个或多个处理器:
确定用于一个或多个类别的一个或多个置信度度量和多个光谱的特定光谱,
一个或多个置信度度量中的一个置信度度量指示特定光谱与一个或多个类别中的相应于该置信度度量的特性类别相关的可能性;
基于一个或多个置信度度量将特定光谱分配到特定类别;以及
其中使一个或多个处理器生成一组局部分类模型的一个或多个指令使一个或多个处理器:
基于一个或多个置信度度量来选择一个或多个类别的子集;以及
基于一个或多个类别的子集来生成一组局部分类模型的特定局部分类模型。
(13)如(9)所述的计算机可读介质,其中使一个或多个处理器接收识别一组光谱测量的结果的信息的一个或多个指令使一个或多个处理器:
接收相应于多个未知样品的多个光谱;以及
其中使一个或多个处理器执行第二分类的一个或多个指令使一个或多个处理器:
将多个光谱分配到一组局部分类模型的一个或多个类别,
一组局部分类模型的一个或多个类别相应于一种或多种化合物;以及
其中使一个或多个处理器提供识别多个未知样品的分类的一个或多个指令还:
基于将多个光谱分配到一个或多个类别来提供指示多个光谱中的与多个未知样品中的一个未知样品相关的光谱被分配到的一个或多个类别中的一个类别的信息。
(14)如(9)所述的计算机可读介质,其中使一个或多个处理器执行第二分类的一个或多个指令使一个或多个处理器:
确定与一组局部分类模型中的特定局部分类模型和多个未知样品中的特定未知样品相关的一组决策值,
决策值相应于特定局部分类模型的一组类别中的一个类别;以及
基于一组决策值将特定未知样品分配到一组类别中的该类别。
(15)本申请涉及一种方法,包括:
由设备接收识别由第一分光计执行的未知样品的光谱测量的结果的信息;
基于光谱测量的结果和全局分类模型由设备来执行未知样品的第一分类,
全局分类模型利用支持向量机(SVM)分类器技术和由第二分光计执行的一组光谱测量来生成;
基于第一分类由设备来生成局部分类模型,
局部分类模型利用SVM分类器技术,
局部分类模型包括全局分类模型的一组类别中的类别的子集;
基于光谱测量的结果和局部分类模型由设备来执行未知样品的第二分类;以及
基于执行第二分类由设备来提供识别类别的子集中的与未知样品相关的类别的信息。
(16)如(15)所述的方法,其中与SVM分类器技术相关的核函数包括下列项中的至少一个:
径向基函数类型的核函数,
线性函数类型的核函数,
S型函数类型的核函数,
多项式函数类型的核函数,或
指数函数类型的核函数。
(17)如(15)所述的方法,其中执行第二分类包括:
基于下列项中的至少一个将未知样品分配到类别的子集:
与类别相关的概率值,或
与类别相关的决策值。
(18)如(15)所述的方法,其中第一分光计不同于第二分光计。
(19)如(15)所述的方法,还包括:
从与第二分光计相关的控制设备接收全局分类模型;
经由数据结构存储全局分类模型;以及
其中执行第一分类包括:
从数据结构得到全局分类模型;以及
使用全局分类模型执行第一分类。
(20)如(15)所述的方法,还包括:
提供识别与第二分类相关的置信度度量的信息,
置信度度量表示未知样品利用其被分配到类别的置信度的量度。
附图的简要说明
图1A和1B是本文所描述的示例实现方式的概观的图示;
图2是在其中本文所描述的系统和/或方法可被实现方式的示例环境的图示;
图3是图2的一个或多个设备的示例部件的图示;
图4是用于基于支持向量机分类器来生成用于原材料识别的全局分类模型的示例过程的流程图;
图5是与图4中所示的示例过程有关的示例实现方式的图示;
图6是用于使用多级分类技术来执行原材料识别的示例过程的流程图;以及
图7A和7B是关于与图6中所示的示例过程相关的预测成功率的示例实现方式的图示。
详细描述
示例实现方式的以下详细描述参考所附附图。在不同附图中的相同参考数字可识别相同或相似的元件。
原材料识别(RMID)是用于识别特定样品的组分(例如,成分)以用于识别、验证等的技术。例如,RMID可用于验证在药物化合物中的成分相应于在标签上标识的一组成分。分光计可用于对样品(例如,药物化合物)执行光谱学以确定样品的组分。分光计可确定样品的一组测量并可提供该组测量以用于分类。化学计量分类技术(例如,分类器)可基于样品的该组测量来便于样品的组分的确定。然而,相对于其它技术,一些化学计量分类技术可与差的可转移性、用于执行大规模分类的不足的粒度等相关。本文所述的实现方式可利用层次式支持向量机分类器以便于RMID。以这种方式,相对于其它RMID技术,分光计的控制设备有助于提高的分类准确度。
图1A和1B是本文所描述的示例实现方式100的概观的图。如图1A所示,示例实现方式100可包括第一控制设备和第一分光计。第一控制设备可使第一分光计对训练组(例如,用于训练分类模型的一组已知样品)执行一组光谱测量。训练组可被选择为包括对于每个类别的分类模型的阈值数量的样品。分类模型的类别可以涉及共享共有的一个或多个特征的一组类似的化合物,例如(在制药学背景中)乳糖化合物、果糖化合物、醋氨酚化合物、异丁苯丙酸化合物、阿斯匹林化合物等。
如进一步在图1A中所示的,第一分光计可基于从第一控制设备接收指令而对训练组执行一组光谱测量。例如,第一分光计可确定对于训练组的每个样品的光谱。第一分光计可向第一控制设备提供该组光谱测量。第一控制设备可使用特定的分类技术并基于该组光谱测量来生成全局分类模型。例如,第一控制设备可使用支持向量机(SVM)技术(例如,用于信息分类的机器学习技术)来生成全局分类模型。全局分类模型可包括与将特定光谱分配到特定类别相关的信息,并可包括与识别和特定类别相关的化合物的类型相关的信息。以这种方式,控制设备可提供基于将未知样品的光谱分配到特定类别来识别未知样品的化合物的类型的信息。全局分类模型可经由数据结构被存储,被提供到一个或多个其它控制设备,等等。
如图1B所示,第二控制设备可接收全局分类模型(例如,来自第一控制设备),并可经由数据结构存储全局分类模型。第二控制设备可使第二分光计对未知组(例如,对其将执行RMID的一组未知样品)执行一组光谱测量。第二分光计可基于从第二控制设备接收指令而执行该组光谱测量。例如,第二分光计可确定对于未知组的每个样品的光谱。第二分光计可向第二控制设备提供该组光谱测量。第二控制设备可基于全局分类模型使用多级分类技术来对未知组执行RMID。
关于图1B,第二控制设备可使用全局分类模型来执行未知组的特定样品的第一分类。第二控制设备可确定与特定样品和全局分类模型相关的一组置信度度量。置信度度量可以涉及与将特定样品分配到特定类别相关的置信度。例如,第二控制设备可确定与特定样品和全局分类模块的每个类别相关的置信度度量。第二控制设备可基于一个或多个相应的置信度度量来选择全局分类模型的类别的子集,并可基于该类别的集来生成局部分类模型。局部分类模型可以涉及使用SVM技术和类别的子集所生成的原位分类模型。第二控制设备可基于局部分类模型来执行第二分类以将特定样品分配到特定类别。以这种方式,第二控制设备以相对于其它分类模型和/或单极分类技术提高的准确度来对未知组的特定样品执行RMID。第二控制设备可对未知组的每个样品执行第一分类和第二分类以识别未知组的每个样品。在另一例子中,第一控制设备可基于由第一分光计执行的光谱学使用全局分类模型和局部分类模型来将特定样品分类。
图2是在其中本文所描述的系统和/或方法可被实现的示例环境200的图示。如图2所示,环境200可包括控制设备210、分光计220和网络230。可经由有线连接、无线连接或有线和无线连接的组合来使环境200的设备互连。
控制设备210可包括能够存储、处理和/或按规定路线发送与RMID相关的信息的一个或多个设备。例如,控制设备210可包括服务器、计算机、穿戴式设备、云计算设备等等,其基于分类器和训练组的一组测量来生成模型并利用该模型来基于未知组的一组测量执行RMID。在一些实现方式中,控制设备210可与特定的分光计220相关。在一些实现方式中,控制设备210可与多个分光计220相关。在一些实现方式中,控制设备210可从环境200中的另一设备(例如,分光计220)接收信息和/或将信息发送到环境200中的另一设备(例如,分光计220)。
分光计220可包括能够对样品执行光谱测量的一个或多个设备。例如,分光计220可包括执行光谱学(例如,振动光谱学,诸如近红外(NIR)分光计、中红外光谱学(中IR)、拉曼光谱学等)的分光计设备。在一些实现方式中,分光计220可合并到穿戴式设备中,诸如穿戴式分光计等。在一些实现方式中,分光计220可从环境200中的另一设备(诸如,控制设备210)接收信息和/或将信息发送到环境200中的另一设备(诸如,控制设备210)。
网络230可包括一个或多个有线和/或无线网络。例如,网络230可包括蜂窝网络(例如,长期演进(LTE)网络、3G网络、码分多址(CDMA)网络等)、公共陆地移动网络(PLMN)、局域网(LAN)、广域网(WAN)、城域网(MAN)、电话网络(例如,公共交换电话网络(PSTN))、专用网络、自组织网络、内联网、互联网、基于光纤的网络、云计算网络等和/或这些和其它类型的网络的组合。
在图2中所示的设备和网络的数量和布置作为例子被提供。实际上,与图2中所示的那些设备和/或网络相比,可以有额外的设备和/或网络、更少的设备和/或网络、不同的设备和/或网络或不同地布置的设备和/或网络。此外,图2中所示的两个或更多个设备可在单个设备内实现,或图2中所示的单个设备可被实现为多个分布式设备。例如,虽然控制设备210和分光计220在本文中被描述为两个分离的设备,但控制设备210和分光计220可在单个设备内实现。另外或可选地,环境200的一组设备(例如,一个或多个设备)可执行被描述为由环境200的另一组设备执行的一个或多个功能。
图3是设备300的示例部件的图示。设备300可相应于控制设备210和/或分光计220。在一些实现方式中,控制设备210和/或分光计220可包括一个或多个设备300和/或设备300的一个或多个部件。如图3所示,设备300可包括总线310、处理器320、存储器330、存储部件340、输入部件350、输出部件360和通信接口370。
总线310可包括允许在设备300的部件中的通信的部件。处理器320在硬件、固件或硬件和软件的组合中实现。处理器320可包括处理器(例如,中央处理单元(CPU)、图形处理单元(GPU)、加速处理单元(APU)等)、微处理器和/或解释和/或执行指令的任何处理部件(例如,现场可编程门阵列(FPGA)、专用集成电路(ASIC)等)。在一些实现方式中,处理器320可包括能够被编程为执行功能的一个或多个处理器。存储器330可包括随机存取存储器(RAM)、只读存储器(ROM)和/或存储信息和/或指令以供处理器320使用的另一类型的动态或静态存储设备(例如,闪存存储器、磁性存储器、光学存储器等)。
存储部件340可存储与设备300的操作和使用有关的信息和/或软件。例如,存储部件340可包括硬盘(例如,磁盘、光学盘、磁光盘、固态磁盘等)、光盘(CD)、数字通用盘(DVD)、软盘、磁带盒、磁带和/或另一类型的计算机可读介质连同相应的驱动器。
输入部件350可包括允许设备300诸如经由用户输入(例如,触摸屏显示器、键盘、小键盘、鼠标、按钮、开关、麦克风等)接收信息的部件。另外或可选地,输入部件350可包括用于感测信息的传感器(例如,全球定位系统(GPS)部件、加速计、陀螺仪、致动器等)。输出部件360可包括从设备300提供输出信息的部件(例如,显示器、扬声器、一个或多个发光二极管(LED)等)。
通信接口370可包括使设备300能够诸如经由有线连接、无线连接或有线和无线连接的组合与其它设备通信的像收发器的部件(例如,收发器、分开的接收器和发射器等)。通信接口370可允许设备300从另一设备接收信息和/或向另一设备提供信息。例如,通信接口370可包括以太网接口、光学接口、同轴接口、红外接口、射频(RF)接口、通用串行总线(USB)接口、Wi-Fi接口、蜂窝网络接口等。
设备300可执行在本文中所述的一个或多个过程。设备300可响应于处理器320执行由计算机可读介质(诸如存储器330和/或存储部件340)存储的软件指令而执行这些过程。计算机可读介质在本文中被定义为非临时性存储器设备。存储器设备包括在单个物理存储设备内的存储空间或遍布多个物理存储设备的存储空间。
软件指令可从另一计算机可读介质或从另一设备经由通信接口370被读取到存储器330和/或存储部件340内。当被执行时,存储在存储器330和/或存储部件340中的软件指令可使处理器320执行本文中所述的一个或多个过程。另外或可选地,可代替或结合软件指令来使用硬连线电路以执行本文所述的一个或多个过程。因此,本文所述的实现方式不限于硬件电路和软件的任何特定的组合。
图3所示的部件的数量和布置作为例子被提供。实际上,与图3所示的那些部件相比,设备300可包括额外的部件、更少的部件、不同的部件或不同地布置的部件。另外或可选地,环境300的一组部件(例如,一个或多个部件)可执行被描述为由设备300的另一组部件执行的一个或多个功能。
图4是用于基于支持向量机分类器来生成用于原材料识别的全局分类模型的示例过程400的流程图。在一些实现中,图4的一个或多个过程块可由控制设备210执行。在一些实现方式中,图4的一个或多个过程块可由与控制设备210分离或包括控制设备210的另一设备或一组设备(诸如分光计220)执行。
如图4所示,过程400可包括使一组光谱测量对训练组执行(块410)。例如,控制设备210可使分光计220对样品的训练组执行一组光谱测量以确定对于训练组的每个样品的光谱。训练组可以指一个或多个已知化合物的一组样品,其可用于生成全局分类模型。例如,训练组可包括一组化合物的一个或多个型式(例如,由不同的制造商制造以控制制造差异的一个或多个型式)。在一些实现方式中,可基于将对其执行RMID的预期组的化合物来选择训练组。例如,当预期对药物化合物执行RMID时,训练组可包括活性药物成分(API)、赋形剂等的一组样品。在一些实现方式中,训练组可被选择以包括对于每种类型的化合物的特定数量的样品。例如,训练组可被选择以包括特定化合物的多个样品(例如,5个样品、10个样品、15个样品、50个样品等)。以这种方式,控制器210可以被提供有与特定类型的化合物相关的阈值数量的光谱,从而便于能够向其准确分配未知样品的分类模型(例如,全局分类模型、局部分类模型等)的类别的生成。
在一些实现方式中,控制设备210可使多个分光计220执行该组光谱测量以考虑到一个或多个物理条件。例如,控制设备210可使第一分光计220和第二分光计220使用NIR光谱学执行一组振动光谱测量。另外或可选地,控制设备210可使该组光谱测量在多个时间处、在多个位置上、在多个不同的实验室条件下等被执行。以这种方式,控制设备210减小了光谱测量是不准确的可能性,作为相对于使该组光谱测量由单个分光计220执行的物理条件的结果。
如进一步在图4中所示的,过程400可包括接收识别该组光谱测量的结果的信息(块420)。例如,控制设备210可接收识别该组光谱测量的结果的信息。在一些实现方式中,控制设备210可接收识别相应于训练组的样品的一组光谱的信息。例如,控制设备210可接收识别当分光计220对训练组执行光谱学时观察到的特定光谱的信息。另外或可选地,控制设备210可接收其它信息作为该组光谱测量的结果。例如,控制设备210可接收与识别能量的吸收、能量的发射、能量的散射等相关的信息。
在一些实现方式中,控制设备210可从多个分光计220接收识别该组光谱测量的结果的信息。例如,控制设备210可通过接收由多个分光计220执行的、在多个不同的时间处执行的、在多个不同的位置处执行等的光谱测量来控制物理条件,诸如在多个分光计220之间的差异、在实验室条件中的潜在差异等。
如进一步在图4中所示的,过程400可包括基于识别该组光谱测量的结果的信息来生成与特定的分类器相关的全局分类模型(块430)。例如,控制设备210可基于识别该组光谱测量的结果的信息来生成与SVM分类器技术相关的全局分类模型。在一些实现方式中,控制设备210可执行一组分类以生成全局分类模型。例如,控制设备210可基于使用SVM技术来将由该组光谱测量的结果所识别的一组光谱分配到一组类别内。
SVM可以指执行用于分类的模式识别的监督的学习模型。在一些实现方式中,当使用SVM技术生成全局分类模型时,控制设备210可利用特定类型的核函数。例如,控制设备210可利用径向基函数(RBF)(例如,被称为SVM-rbf)类型的核函数、线性函数(例如,当用于多级分类技术时被称为SVM线性并被称为hier-SVM线性)类型的核函数、S型函数类型的核函数、多项式函数类型的核函数、指数函数类型的核函数等。在一些实现方式中,控制设备210可利用特定类型的SVM,诸如基于概率值的SVM(例如,基于确定样品是一组类别中的类别的成员的概率的分类)、基于决策值的SVM(例如,利用决策函数来投票赞成一组类别中的类别作为样品是其成员的类别的分类)等。
在一些实现方式中,控制设备210可选择用于从一组分类技术生成全局分类模型的特定分类器。例如,控制设备210可生成相应于多个分类器的多个分类模型,并可诸如通过确定每个模型的可转移性(例如,基于在第一分光计220上执行的光谱测量而生成的分类模型在应用于在第二分光计220上执行的光谱测量时是准确的程度)、大规模分类准确度(例如,分类模型可用于同时对满足阈值的一些样品分类时的准确度)等来测试多个分类模型。在这种情况下,控制设备210可基于确定SVM分类器与相对于其它分类器的更好的可移动性和/或大规模分类准确度相关来选择SVM分类器(例如,hier-SVM线性)。
在一些实现方式中,控制设备210可基于识别训练组的样品的信息来生成全局分类模型。例如,控制设备210可利用识别由训练组的样品所代表的化合物的类型的信息来识别具有化合物的类型的光谱的类别。在一些实现方式中,当生成全局分类模型时,控制设备210可训练全局分类模型。例如,控制设备210可使用该组光谱测量的一部分训练该模型。另外或可选地,控制设备210可执行全局分类模型的评估。例如,控制设备210可利用该组光谱测量的另一部分来验证全局分类模型(例如,针对预测强度)。在一些实现方式中,控制设备210可使用多级分类技术来验证全局分类模型。例如,当关于一个或多个局部分类模型被利用时,控制设备210可确定全局分类模型是准确的,如关于图6在本文所述的。以这种方式,控制设备210在提供全局分类模型以用于由与其它分光计220相关的其它控制设备210利用之前确保具有阈值准确度的全局分类模型被生成。
在一些实现方式中,控制设备210可在生成全局分类模型之后向与其它分光计220相关的其它控制设备210提供全局分类模型。例如,第一控制设备210可生成全局分类模型,并可向第二控制设备210提供全局分类模型以用于利用。在这种情况下,第二控制设备210可存储全局分类模型,并可在生成一个或多个局部分类模型并对未知组的一个或多个样品分类时利用全局分类模型,如在本文关于图6所述的。另外或可选地,控制设备210可存储全局分类模型以用于由控制设备210在生成一个或多个局部分类模型并对一个或多个样品分类时利用。以这种方式,控制设备210提供全局分类模型用于在未知样品的RMID中利用。
虽然图4示出过程400的示例块,在一些实现方式中,与在图4中描绘的那些块相比,过程400可包括额外的块、更少的块、不同的块或不同地布置的块。另外或可选地,过程400的两个或更多个块可并行地被执行。
图5是与图4所示的示例过程400有关的示例实现方式500的图。图5示出基于支持向量机分类器来生成用于原材料识别的全局分类模型的例子。
如图5所示,控制设备210-1将信息传输到分光计220-1以指示分光计220-1对训练组510执行一组光谱测量。假设训练组510包括第一组训练样品(例如,对其的测量用于训练全局分类模型)和第二组验证样品(例如,对其的测量用于验证全局分类模型的准确度)。如由参考数字515所示的,分光计220-1基于接收到指令来对训练组执行该组光谱测量。如由参考数字520所示的,控制设备210-1接收用于训练样品的第一组光谱和用于验证样品的第二组光谱。假设控制设备210-1存储识别训练组510的每个样品的信息。
关于图5,假设控制设备210-1已经选择利用用于生成全局分类模型的hier-SVM线性分类器(例如,基于对照一个或多个其它分类器来测试hier-SVM线性分类器)。如由参考数字525所示的,控制设备210-1使用hier-SVM线性分类器和第一组光谱来训练全局分类模型,并使用hier-SVM线性分类器和第二组光谱来验证全局分类模型。假设控制设备210-1确定全局分类模型满足验证阈值(例如,具有超过验证阈值的准确度)。如由参考数字530所示的,控制设备210-1向控制设备210-2(例如,用于在对由分光计220-2执行的光谱测量执行RMID时利用)和向控制设备210-3(例如,用于在对由分光计220-3执行的光谱测量执行RMID时利用)提供全局分类模型。
如上所指示的,图5仅作为例子被提供。其它例子是可能的并可不同于关于图5所述的内容。
以这种方式,控制设备210促进基于所选择的分类技术(例如,基于模型可转移性、大规模分类准确度等而选择)的全局分类模型的生成以及全局分类模型的分配用于由与一个或多个分光计220相关的一个或多个其它控制设备210利用。而且,相对于在将执行RMID的每个控制设备210上生成全局分类模型,控制设备210降低了成本和时间要求。
图6是用于使用多级分类技术来执行原材料识别的示例过程600的流程图。在一些实现方式中,图6的一个或多个过程块可由控制设备210执行。在一些实现方式中,图6的一个或多个过程块可由与控制设备210分离或包括控制设备210的另一设备或一组设备(诸如分光计220)执行。
如图6所示,过程600可包括接收识别对未知组执行的一组光谱测量的结果的信息(块610)。例如,控制设备210可接收识别由分光计220对未知组执行的该组光谱测量的结果的信息。未知组可包括将对其执行RMID的一组样品(例如,未知样品)。例如,控制设备210可使分光计220对该组样品执行该组光谱测量,并可接收识别相应于该组样品的一组光谱的信息。在一些实现方式中,控制设备210可接收识别来自多个分光计220的结果的信息。例如,控制设备210可使多个分光计220对未知组(例如,相同的样品组)执行该组光谱测量,并可接收识别相应于未知组的样品的一组光谱的信息。另外或可选地,控制设备210可接收识别在多个时间处、在多个位置上等执行的一组光谱测量的结果的信息,并可基于在多个时间处、在多个位置上等执行的该组光谱测量(例如,基于将该组光谱测量平均或基于另一技术)来对特定样品进行分类。以这种方式,控制设备210可考虑到可影响该组光谱测量的结果的物理条件。
另外或可选地,控制设备210可使第一分光计220对未知组的第一部分执行该组光谱测量的第一部分,并可使第二分光计220对未知组的第二部分执行该组光谱测量的第二部分。以这种方式,相对于使所有光谱测量由单个分光计220执行,控制设备210可减小执行该组光谱测量的时间量。
如进一步在图6中示出的,过程600可包括基于该组光谱测量的结果和全局分类模型来执行第一分类(块620)。例如,控制设备210可基于所述结果和全局分类模型来执行第一分类。在一些实现方式中,控制设备210可接收全局分类模型用于在执行第一分类时利用。例如,第一控制设备210可生成全局分类模型(例如,使用SVM线性分类器并基于对训练组执行的一组光谱测量,如关于图4在本文所述的),并可向第二控制设备210提供全局分类模型以用于执行未知组的第一分类。另外或可选地,控制设备210可生成全局分类模型(例如,使用SVM线性分类器并基于对训练组执行的一组光谱测量,如关于图4在本文所述的),并可利用该全局分类模型来用于执行未知组的第一分类。
在一些实现方式中,控制设备210在执行第一分类时可将未知组的特定样本分配到全局分类模型的一组类别中的特定类别。例如,控制设备210可基于全局分类模型来确定与特定样品相关的特定光谱相应于一类化合物(例如,纤维素化合物、乳糖化合物、咖啡因化合物等),并可将特定样品分配到特定类别。在一些实现方式中,控制设备210可基于置信度度量来分配特定样品。例如,控制设备210可基于全局分类模型来确定特定光谱与全局分类模型的每个类别相关的概率。在这种情况下,控制设备210可基于对于特定类别的特定概率超过与其它类别相关的概率来将该特定样品分配到该特定类别。以这种方式,控制设备210确定与样品相关的一种类型的化合物,从而识别样品。
另外或可选地,控制设备210可确定与第一分类相关的另一置信度度量。例如,当控制设备210在执行第一分类时将特定样品分配到特定的类别时,控制设备210可确定在特定样品与特定类别相关的概率(例如,被称为最大概率)与特定样品与下一最可能的特定类别相关的概率(例如,被称为第二最大概率)之间的差异。以这种方式,控制设备210确定与将特定样品分配到特定类别而不是下一最可能的类别相关的置信度。当最大概率和第二最大概率都是相对高和相对类似的(例如,最大概率是48%而第二最大概率是47%,而不是最大概率是48%而第二最大概率是4%)时,控制设备210通过提供在最大概率和第二最大概率之间的差异来提供分配准确度的更好指示。换句话说,在最大概率是48%而第二最大概率是47%的第一情况下,对最可能的类别的分配准确度相对低于在最大概率是48%而第二最大概率是4%的第二情况中,虽然最大概率对于这两种情况是相同的。提供在最大概率和第二最大概率之间的差异的度量可区分开这两种情况。
如进一步在图6中所示的,过程600可包括基于第一分类来生成局部分类模型(块630)。例如,控制设备210可基于第一分类来生成局部分类模型。局部分类模型可以涉及使用SVM分类技术(例如,SVM-rbf、SVM线性等;基于概率值的SVM、基于决策值的SVM等;或类似技术)基于与第一分类相关的置信度度量而生成的原位分类模型。例如,当基于全局分类模型对样本的光谱确定一组置信度度量时,控制设备210可基于光谱与全局分类模型的每个类别相关的相应概率来选择全局分类模型的类别的子集。在这种情况下,控制设备210可使用SVM分类技术并基于类别的选定子集来生成局部分类模型。
在一些实现方式中,可执行按比例缩放预处理过程。例如,为了生成局部分类模型,控制设备210可对于与选择用于局部分类模型的全局分类模型的类别的子集相关的光谱执行自动按比例缩放预处理过程。在一些实现方式中,可为使用全局分类模型的诸如第一分类的另一分类执行自动按比例缩放预处理过程。在一些实现方式中,可执行另一类型的预处理过程,诸如定中心过程、转换等。
在一些实现方式中,类别的子集可包括与最高相应的置信度度量相关的阈值数量的类别。例如,控制设备210可基于全局分类模型的十个类别比全局分类模型的其它类别与更高的相应概率(样品的光谱与其相关)相关来选择该十个类别,并可基于这十个类别来生成局部模型。在一些实现方式中,控制设备210可基于满足阈值的类别的子集来选择类别的子集。例如,控制设备210可选择与满足阈值的概率相关的每个类别。另外或可选地,控制设备210可选择每个均满足阈值的阈值数量的类别。例如,控制设备210可选择高达十个类别,假定这十个类别每个满足最小阈值概率。另外或可选地,控制设备210可选择另一数量的类别(例如,两个类别、五个类别、二十个类别等)。
在一些实现方式中,控制设备210可生成多个局部分类模型。例如,控制设备210可生成对于未知组的第一样品的第一光谱的第一局部分类模型和对于未知组的第二样品的第二光谱的第二局部分类模型。以这种方式,控制设备210可通过使用多个局部分类模型同时对多个未知样品操作来便于多个未知样品的同时分类。
在一些实现方式中,控制设备210可基于使用全局分类模型执行第一分类来生成量化模型。例如,当控制设备210用于确定在未知样品中的物质的浓度且多个未知样品与用于确定物质的浓度的不同量化模型相关时,控制设备210可利用第一分类来选择未知样品的类别,并可选择与未知样品的类别相关的局部量化模型。以这种方式,控制设备210利用层次分类和量化模型来提高原材料识别和/或其量化。
如进一步在图6中所示的,过程600可包括基于该组光谱测量的结果和局部分类模型来执行第二分类(块640)。例如,控制设备210可基于结果和局部分类模型来执行第二分类。在一些实现方式中,控制设备210可对特定光谱执行第二分类。例如,控制设备210可基于局部分类模型将特定光谱分配到特定类别。在一些实现方式中,控制设备210可确定与特定光谱和局部分类模型相关的一组置信度度量。例如,控制设备210可确定特定光谱与局部分类模型的每个类别相关的概率,并可将特定光谱(例如,与特定光谱相关的特定样品)分配到具有比局部分类模型的其它类别更高概率的类别。以这种方式,控制设备210识别未知组的样品。
另外或可选地,控制设备210可确定与特定光谱和局部分类模型相关的另一置信度度量。例如,当控制设备210在执行第二分类时将特定样品分配到特定类别时,控制设备210可确定在特定样品与特定类别相关的概率(例如,最大概率)与特定样品与下一最可能的类别相关的概率(例如,第二最大概率)之间的差异。以这种方式,控制设备210在基于局部分类模型执行第二分类时确定与将特定样本分配到特定类别而不是下一最可能的类别相关的置信度。
在一些实现方式中,控制设备210可执行多个第二分类。例如,控制设备210可基于第一局部分类模型来执行与第一样品相关的第一光谱的第二分类,并可基于第二局部分类模型来执行与第二样品相关的第二光谱的另一第二分类。以这种方式,控制设备210便于未知组的多个样品的同时分类。在一些实现方式中,控制设备210可从第二分类省略在未知组中的样品的一部分。例如,当控制设备210确定用于基于全局分类模型将特定样品分配到特定类别的置信度度量且置信度度量满足阈值时,控制设备210可从第二分类省略特定样品。以这种方式,控制设备210可相对于对未知组的所有样品执行第二分类而减小资源利用率。
在一些实现方式中,控制设备210可在执行第一分类之后(和/或在执行第二分类之后)执行量化。例如,控制设备210可基于执行一个或多个分类来选择局部量化模型,并可基于选择局部量化模型来执行与特定样品有关的量化。作为例子,当执行原材料识别以确定在植物体中的特定化学物质的浓度时,其中植物体与多个量化模型相关(例如,与植物是否在户内或户外、在冬天或在夏天等生长有关),控制设备210可执行一组分类以识别特定的量化模型。在这种情况下,控制设备210可基于执行一组分类来确定植物在冬天在户内生长,并可选择与植物在冬天在户内生长有关的量化模型以用于确定特定化学物质的浓度。
如进一步在图6中示出的,过程600可包括基于执行第二分类来提供识别未知组的分类的信息(块650)。例如,控制设备210可基于执行第二分类来提供识别未知组的样品的分类的信息。在一些实现方式中,控制设备210可提供识别特定样品的特定类别的信息。例如,控制设备210可提供指示与特定样品相关的特定光谱被确定为与特定类别相关的信息,从而识别样品。在一些实现方式中,控制设备210可提供指示与将特定样品分配到特定类别相关的置信度度量的信息。例如,控制设备210可提供识别特定样品与特定类别相关的概率、在特定样品的最大概率与第二最大概率之间的差异等的信息。以这种方式,控制设备210提供指示特定光谱被准确地分配到特定类别的可能性。
在一些实现方式中,控制设备210提供识别用于多个样品的类别的信息。例如,控制设备210可提供指示未知组的第一样品与第一类别相关而未知组的第二样品与第二类别相关的信息。以这种方式,控制设备210提供多个样品的同时识别。
在一些实现方式中,控制设备210可基于执行一组分类和量化来提供量化。例如,基于识别出局部量化模型,控制设备210可提供识别在未知样品中的物质的浓度的信息,对于未知样品利用一组分类来选择用于确定物质的浓度的量化模型。
在一些实现方式中,控制设备210可提供与样品的类别有关的输出。例如,控制设备210可基于将未知样品分类成第一组类别和第二组类别之一来提供与用于未知样品的分类有关的二元输出(例如,是/否输出),对于该未知样品第一组类别相应于第一二元输出(例如,是)而第二组类别相应于第二二元输出(例如,否)。作为例子,对于第一组类别(例如,犹太认证的肉(Kosher Meat),其可包括合犹太认证的牛前腰肉部位的牛排(BeefStrip Steak)、犹太认证的牛肋排、犹太认证的鸡腿、犹太认证的鸡胸等)和第二组类别(例如,非犹太认证的肉,其可包括非犹太认证的牛肋排、非犹太认证的猪肉、非犹太认证的鸡翅等),控制设备210可基于将未知样品分类为第一组类别或第二组类别的特定类别来提供犹太认证或非犹太认证的输出。作为另一例子,控制设备210可利用与被分类为清真或非清真的食物有关的一组类别,并可提供指示样品是否相应于清真类别或非清真类别的输出(即,从其得到样品的动物是否以清真方式被宰杀,而不考虑是否满足清真分类的其它标准,例如宗教证明、在宰杀期间的祈祷等)。以这种方式,当特定类别的识别对控制设备210的用户(即,试图确定一块肉是否是犹太认证的而不是试图确定肉的类型的人)不重要时,控制设备210可以以与提供特定类别的识别有关的准确度的较大可能性提供分类。
虽然图6示出过程600的示例块,但与在图6中描绘的那些块相比,在一些实现方式中,过程600可包括额外的块、更少的块、不同的块或不同地布置的块。另外或可选地,过程600的两个或更多个块可并行地被执行。
图7A和7B是与和图6所示的示例过程600相关的预测成功率有关的示例实现700的图。图7A和7B示出使用基于层次式支持向量机(hier-SVM线性)的技术的原材料识别的示例结果。
如在图7A中且由参考数字710所示的,为未知组提供一组置信度度量。对于未知组的每个样品,控制设备210确定样品与全局分类模型的每个类别相关的概率。对于未知组的每个样品,最大概率与第二最大(下一最大)概率比较。如由参考数字712所示的,未知组的最大概率范围从大约5%到大约20%。如由参考数字714所示的,未知组的第二最大概率范围从大约0%到大约5%。如由参考数字716所示的,突出显示了控制设备210基于全局分类模型不正确地分类的未知组的样品(例如,在未知组中的2645个样品中的84个样品不正确地被分类)。
如在图7A中且由参考数字720所示的,为未知组提供一组置信度度量。对于未知组的每个样品,控制设备210确定样品与相应的全局分类模型的每个类别相关的概率。对于未知组的每个样品,最大概率与第二最大(下一最大)概率比较。如由参考数字722所示的,未知组的最大概率范围从大约50%到大约98%。如由参考数字724所示的,未知组的第二最大概率范围从大约2%到大约45%。而且,对于除了一个样品(对于其概率差异大约是8%,且然而对于其正确的分类被执行)以外的未知组的每个样品,在最大概率和第二最大概率之间的概率差异大于大约0.33(33%)。基于执行一组分类,控制设备210将未知组的所有成员正确地分类。
关于图7B,当在分类模型(例如,全局分类模型、局部分类模型等)的每个类别中的样品的数量未能满足阈值时,控制设备210在将未知组的样品分配给类别时可确定减小的置信度度量和相关预测准确度。如由参考数字730所示的,当在每个类别中的样品的数量不满足阈值时,控制设备210在对未知组基于全局分类模型执行第一分类并基于一组局部分类模型(例如,基于概率的SVM分类器局部分类模型)执行第二分类之后将4451个样品中的128个样品错误地分类。如由参考数字740所示的,当控制设备210基于全局分类模型执行另一第一分类并基于另一组局部分类模型(例如,基于决策值的SVM分类器局部分类模型)执行另一第二分类时,控制设备210将4451个样品中的1个样品错误地分类。以这种方式,控制设备210利用基于决策值的SVM分类器来相对于基于概率的SVM分类器提高分类准确度。
如上面指示的,图7A和7B仅作为例子被提供。其它例子是可能的并可不同于关于图7A和7B所述的内容。
以这种方式,控制设备210利用全局分类模型和基于全局分类模型生成的局部分类模型来执行RMID。
前述公开提供了说明和描述,但并不旨在是无遗漏的或将实现限制到所公开的精确形式。修改和变化按照上述公开是可能的或可从实现方式的实施被获取。
在本文结合阈值来描述这样的实现方式。如在本文使用的,满足阈值可以指值大于阈值、多于阈值、高于阈值、大于或等于阈值、小于阈值、少于阈值、低于阈值、小于或等于阈值、等于阈值等。
将明显的是,可以在不同形式的硬件、固件或硬件和软件的组合中实现本文所述的系统和/或方法。用于实现这些系统和/或方法的实际专用控制硬件或软件代码不是限制实现方式。因此,系统和/或方法的操作和行为在本文被描述而不参考特定的软件代码——应理解,软件和硬件可被设计成基于本文的描述来实现系统和/或方法。
即使在权利要求中详述和/或在说明书中公开了特征的特定组合,但这些组合也不意欲限制可能的实现的公开。事实上,可以用未特别在权利要求中详述和/或在说明书中公开的方式来组合这些特征中的很多。虽然所列出的每个从属权利要求可直接从属于仅仅一个权利要求,但可能的实现的公开包括每个从属权利要求与权利要求组中的每个其它权利要求组合。
在本文使用的元件、行动或指令不应被解释为关键的或必要的,除非明确地这样描述。此外,如在本文使用的,冠词“一(a)”和“一(an)”意欲包括一个或多个项,并可与“一个或多个”可互换地使用。此外,如在本文使用的,术语“组”意欲包括一个或多个项(例如,相关项、不相关项、相关项和不相关项的组合等),并可与“一个或多个”可互换地使用。在只有一个项被预期的场合,使用术语“一个”或类似的语言。此外,如在本文使用的,术语“具有(has)”、“具有(have)”、“具有(having)”等被规定为开放式术语。此外,短语“基于”意欲意指“至少部分地基于”,除非明确地规定相反的情况。

Claims (14)

1.一种样品识别设备,包括:
用于从另外设备接收全局分类模型的装置,
所述全局分类模型由所述另外设备利用支持向量机分类器技术且基于光谱测量来生成并且被分配至多个设备;
所述多个设备包括所述样品识别设备,以及
所述全局分类模型包括一组类别;
用于接收识别未知样品的光谱测量的结果的信息的装置;
用于基于所述光谱测量的结果和所述全局分类模型来执行所述未知样品的第一分类的装置;
用于利用支持向量机分类器技术且基于所述第一分类来生成局部分类模型的装置;
所述局部分类模型包括所述一组类别的子集;
用于基于所述光谱测量的结果和所述局部分类模型来执行所述未知样品的第二分类的装置;以及
用于基于执行所述第二分类来提供识别与所述未知样品相关的类别的信息的装置。
2.如权利要求1所述的样品识别设备,还包括:
用于确定与所述一组类别相关的一组相应的概率的装置,
所述一组相应的概率中的特定概率指示所述未知样品与所述一组类别中的特定类别相关的可能性;以及
用于基于所述一组相应的概率来选择所述一组类别的所述子集的装置;以及
其中用于生成所述局部分类模型的所述装置包括:
用于基于所述一组类别的所述子集来生成所述局部分类模型的装置。
3.如权利要求1所述的样品识别设备,还包括:
用于执行自动按比例缩放预处理过程的装置;以及
用于基于执行所述自动按比例缩放预处理过程来执行所述第一分类或所述第二分类中的至少一个的装置。
4.如权利要求1所述的样品识别设备,
其中所述另外设备是与第一分光计相关的控制设备;
其中所述全局分类模型使用由所述第一分光计执行的一个或多个光谱测量来生成;
其中所述样品识别设备还包括:
用于使所述光谱测量由第二分光计执行的装置,
所述第二分光计不同于所述第一分光计;以及
其中用于执行所述未知样品的所述第一分类的所述装置包括:
用于基于使用由所述第一分光计执行的所述一个或多个光谱测量生成的所述全局分类模型并基于由所述第二分光计执行的光谱测量的结果来执行所述未知样品的所述第一分类的装置。
5.如权利要求1所述的样品识别设备,其中所述全局分类模型的一组类别相应于一组化合物,且所述类别被包括在所述一组类别中;以及
其中用于提供识别所述类别的信息的所述装置包括:
用于提供识别所述一组化合物中的相应于所述类别的化合物的信息的装置。
6.如权利要求1所述的样品识别设备,其中用于执行所述第二分类的所述装置包括:
用于确定与所述未知样品相关的光谱与所述类别相关的装置,
所述光谱由执行所述光谱测量的结果识别;以及
其中用于提供识别所述类别的信息的所述装置包括:
用于基于确定与所述未知样品相关的光谱与所述类别相关来提供识别所述类别的信息的装置。
7.如权利要求1所述的样品识别设备,
其中所述支持向量机分类器技术与下列项中的至少一个相关:
径向基函数类型的核函数,
线性函数类型的核函数,
S型函数类型的核函数,
多项式函数类型的核函数,或
指数函数类型的核函数。
8.如权利要求1所述的样品识别设备,其中用于执行所述第二分类的所述装置包括:
用于基于下列项中的至少一个将所述未知样品分配到所述类别的装置:
概率值,或
决策值。
9.一种样品识别方法,包括:
由样品识别设备从另外设备接收全局分类模型,
所述全局分类模型由所述另外设备生成并且被分配至多个设备;
所述多个设备包括所述样品识别设备,以及
所述全局分类模型包括一组类别;
由所述样品识别设备接收识别由第一分光计执行的未知样品的光谱测量的结果的信息;
基于所述光谱测量的所述结果和所述全局分类模型由所述样品识别设备执行所述未知样品的第一分类,
所述全局分类模型利用支持向量机分类器技术和由与所述另外设备相关的第二分光计执行的一组光谱测量来生成;
基于所述第一分类由所述样品识别设备生成局部分类模型,
所述局部分类模型利用支持向量机分类器技术,以及
所述局部分类模型包括所述全局分类模型的所述一组类别中的类别的子集;
基于所述光谱测量的所述结果和所述局部分类模型由所述样品识别设备执行所述未知样品的第二分类;以及
基于执行所述第二分类由所述样品识别设备提供识别类别的所述子集中的与所述未知样品相关的类别的信息。
10.如权利要求9所述的样品识别方法,其中与所述支持向量机分类器技术相关的核函数包括下列项中的至少一个:
径向基函数类型的核函数,
线性函数类型的核函数,
S型函数类型的核函数,
多项式函数类型的核函数,或
指数函数类型的核函数。
11.如权利要求9所述的样品识别方法,其中执行所述第二分类包括:
基于下列项中的至少一个将所述未知样品分配到类别的所述子集的所述类别:
与所述类别相关的概率值,或
与所述类别相关的决策值。
12.如权利要求9所述的样品识别方法,其中所述第一分光计不同于所述第二分光计。
13.如权利要求9所述的样品识别方法,还包括:
经由数据结构存储所述全局分类模型,
其中执行所述第一分类包括:
从所述数据结构得到所述全局分类模型;以及
使用所述全局分类模型执行所述第一分类。
14.如权利要求9所述的样品识别方法,还包括:
提供识别与所述第二分类相关的置信度度量的信息,
所述置信度度量表示所述未知样品被分配到所述类别的置信度的量度。
CN201610739767.5A 2015-08-26 2016-08-26 使用光谱学的识别 Active CN106483083B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010301988.0A CN111398195A (zh) 2015-08-26 2016-08-26 使用光谱学的识别

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562210198P 2015-08-26 2015-08-26
US62/210,198 2015-08-26

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202010301988.0A Division CN111398195A (zh) 2015-08-26 2016-08-26 使用光谱学的识别

Publications (2)

Publication Number Publication Date
CN106483083A CN106483083A (zh) 2017-03-08
CN106483083B true CN106483083B (zh) 2020-05-05

Family

ID=56802297

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010301988.0A Pending CN111398195A (zh) 2015-08-26 2016-08-26 使用光谱学的识别
CN201610739767.5A Active CN106483083B (zh) 2015-08-26 2016-08-26 使用光谱学的识别

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010301988.0A Pending CN111398195A (zh) 2015-08-26 2016-08-26 使用光谱学的识别

Country Status (7)

Country Link
US (3) US10309894B2 (zh)
EP (2) EP3822977A1 (zh)
JP (2) JP6605415B2 (zh)
KR (2) KR102288707B1 (zh)
CN (2) CN111398195A (zh)
CA (1) CA2940320A1 (zh)
IL (2) IL247474B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6605415B2 (ja) 2015-08-26 2019-11-13 ヴァイアヴィ・ソリューションズ・インコーポレイテッド 分光法を用いる識別
US9810673B1 (en) * 2016-04-19 2017-11-07 James Ehleringer Cannabis cultivation test
US10984334B2 (en) * 2017-05-04 2021-04-20 Viavi Solutions Inc. Endpoint detection in manufacturing process by near infrared spectroscopy and machine learning techniques
US10551366B2 (en) * 2017-05-12 2020-02-04 Becton, Dickinson And Company System and method for drug classification using multiple physical parameters
US10810408B2 (en) * 2018-01-26 2020-10-20 Viavi Solutions Inc. Reduced false positive identification for spectroscopic classification
US11009452B2 (en) * 2018-01-26 2021-05-18 Viavi Solutions Inc. Reduced false positive identification for spectroscopic quantification
US11656174B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Outlier detection for spectroscopic classification
JP7273844B2 (ja) * 2018-04-05 2023-05-15 イーエニエーエスセー テック - インスティチュート デ エンゲンハリア デ システマス エ コンピュータドレス テクノロジア エ シエンシア 試料からの成分の定量化値を予測する分光測光方法及び装置
US11137331B2 (en) 2018-08-21 2021-10-05 Viavi Solutions Inc. Multispectral sensor based alert condition detector
EP4018280A4 (en) * 2019-08-20 2023-06-28 Tata Consultancy Services Limited System and method for just in time characterization of raw materials
CN112629659A (zh) * 2019-10-08 2021-04-09 中强光电股份有限公司 用于训练用于不同的光谱仪的管线的自动化模型训练装置和自动化模型训练方法
JP7353940B2 (ja) * 2019-11-26 2023-10-02 株式会社日立製作所 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム
CN111488929B (zh) * 2020-04-09 2023-08-29 深圳数联天下智能科技有限公司 识别布料类别的方法、装置、计算设备及计算机存储介质
WO2023052608A1 (en) 2021-10-01 2023-04-06 Trinamix Gmbh Multi single detector application specific spectrometer

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101135639A (zh) * 2007-09-27 2008-03-05 中国人民解放军空军工程大学 基于支持向量机校正模型的混合气体组分浓度红外光谱分析方法
CN103258239A (zh) * 2012-02-19 2013-08-21 国际商业机器公司 分类可靠性预测方法和装置
CN103425991A (zh) * 2012-05-15 2013-12-04 富士通株式会社 对视频中的目标进行分类的方法和装置
CN103903012A (zh) * 2014-04-09 2014-07-02 西安电子科技大学 基于面向对象和支持向量机的极化sar数据分类方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3818197A (en) * 1970-07-16 1974-06-18 Baird Atomic Inc Computerized spectrometer system
US7617163B2 (en) * 1998-05-01 2009-11-10 Health Discovery Corporation Kernels and kernel methods for spectral data
US8190551B2 (en) * 2005-10-13 2012-05-29 Baylor University Classification of fabrics by near-infrared spectroscopy
EP1992939A1 (en) * 2007-05-16 2008-11-19 National University of Ireland, Galway A kernel-based method and apparatus for classifying materials or chemicals and for quantifying the properties of materials or chemicals in mixtures using spectroscopic data.
JP5104877B2 (ja) 2007-12-18 2012-12-19 富士通株式会社 二クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび二クラス分類予測モデルの作成装置
WO2010030718A2 (en) * 2008-09-11 2010-03-18 Varian Semiconductor Equipment Associates, Inc. Technique for monitoring and controlling a plasma process with an ion mobility spectrometer
JP2011094982A (ja) * 2009-10-27 2011-05-12 Sharp Corp ネットワークシステム、精度管理方法、成分分析装置、および管理サーバ
CN103003814A (zh) * 2010-05-14 2013-03-27 数据逻辑Adc公司 使用大型数据库进行对象识别的系统及方法
JP2014514572A (ja) 2011-04-29 2014-06-19 キャンサー・プリヴェンション・アンド・キュア,リミテッド 分類システムおよびそのキットを使用した肺疾患の同定および診断方法
US9031897B2 (en) 2012-03-23 2015-05-12 Nuance Communications, Inc. Techniques for evaluation, building and/or retraining of a classification model
EP2648133A1 (fr) * 2012-04-04 2013-10-09 Biomerieux Identification de microorganismes par spectrometrie et classification structurée
NL2009015C2 (en) 2012-04-10 2013-10-15 Biosparq B V Method for classification of a sample on the basis of spectral data, method for creating a database and method for using this database, and corresponding computer program, data storage medium and system.
US10043264B2 (en) * 2012-04-19 2018-08-07 Applied Materials Israel Ltd. Integration of automatic and manual defect classification
US9684870B2 (en) * 2013-01-02 2017-06-20 Qualcomm Incorporated Methods and systems of using boosted decision stumps and joint feature selection and culling algorithms for the efficient classification of mobile device behaviors
WO2014136327A1 (ja) 2013-03-06 2014-09-12 楽天株式会社 画像処理システム、画像処理方法、および画像処理プログラム
CN103488874B (zh) * 2013-09-01 2016-09-14 西北大学 一种结合激光诱导击穿光谱对钢铁材料的分类方法
JP6605415B2 (ja) 2015-08-26 2019-11-13 ヴァイアヴィ・ソリューションズ・インコーポレイテッド 分光法を用いる識別

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101135639A (zh) * 2007-09-27 2008-03-05 中国人民解放军空军工程大学 基于支持向量机校正模型的混合气体组分浓度红外光谱分析方法
CN103258239A (zh) * 2012-02-19 2013-08-21 国际商业机器公司 分类可靠性预测方法和装置
CN103425991A (zh) * 2012-05-15 2013-12-04 富士通株式会社 对视频中的目标进行分类的方法和装置
CN103903012A (zh) * 2014-04-09 2014-07-02 西安电子科技大学 基于面向对象和支持向量机的极化sar数据分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Combination of support vector machines (SVM) and near-infrared (NIR) imaging spectroscopy for the detection of meat and bone meal (MBM) in compound feeds;J.A.Fernandez Pierna等;《Journal of Chemometrics》;20041231(第18期);第341-349页 *

Also Published As

Publication number Publication date
IL247474A0 (en) 2016-12-29
IL285838A (en) 2021-09-30
EP3136270A1 (en) 2017-03-01
IL285838B2 (en) 2023-12-01
JP2018185328A (ja) 2018-11-22
EP3822977A1 (en) 2021-05-19
JP2017049246A (ja) 2017-03-09
CN106483083A (zh) 2017-03-08
KR20210098916A (ko) 2021-08-11
US11680893B2 (en) 2023-06-20
JP7132772B2 (ja) 2022-09-07
KR20170026228A (ko) 2017-03-08
KR102417232B1 (ko) 2022-07-05
US20190257746A1 (en) 2019-08-22
IL247474B (en) 2021-09-30
EP3136270B1 (en) 2021-02-24
IL285838B1 (en) 2023-08-01
US20230288322A1 (en) 2023-09-14
JP6605415B2 (ja) 2019-11-13
US20170059480A1 (en) 2017-03-02
KR102288707B1 (ko) 2021-08-10
US10309894B2 (en) 2019-06-04
CN111398195A (zh) 2020-07-10
CA2940320A1 (en) 2017-02-26

Similar Documents

Publication Publication Date Title
CN106483083B (zh) 使用光谱学的识别
JP7238056B2 (ja) 誤検知を減少させた分光学的分類のための識別
US11775616B2 (en) Reduced false positive identification for spectroscopic quantification
JP2021121929A (ja) 食事制限の遵守に関する分光学的分類
EP4033419A1 (en) Outlier detection for spectroscopic classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1232956

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant