KR20230124871A - 분광 분류를 위한 감소된 거짓 양성 식별 - Google Patents

분광 분류를 위한 감소된 거짓 양성 식별 Download PDF

Info

Publication number
KR20230124871A
KR20230124871A KR1020230107648A KR20230107648A KR20230124871A KR 20230124871 A KR20230124871 A KR 20230124871A KR 1020230107648 A KR1020230107648 A KR 1020230107648A KR 20230107648 A KR20230107648 A KR 20230107648A KR 20230124871 A KR20230124871 A KR 20230124871A
Authority
KR
South Korea
Prior art keywords
classification model
class
unknown sample
classification
sample
Prior art date
Application number
KR1020230107648A
Other languages
English (en)
Inventor
챵멩 슝
크리스토퍼 지. 피더슨
건튼 마크 케이. 본
란 쑨
Original Assignee
비아비 솔루션즈 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 비아비 솔루션즈 아이엔씨. filed Critical 비아비 솔루션즈 아이엔씨.
Publication of KR20230124871A publication Critical patent/KR20230124871A/ko

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/02Details
    • G01J3/10Arrangements of light sources specially adapted for spectrometry or colorimetry
    • G01J3/108Arrangements of light sources specially adapted for spectrometry or colorimetry for measurement in the infrared range
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/251Colorimeters; Construction thereof
    • G01N21/253Colorimeters; Construction thereof for batch operation, i.e. multisample apparatus
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

디바이스는 알려진 샘플의 트레이닝 세트 및 알려진 샘플의 검증 세트의 분광 측정의 세트의 결과를 식별한 정보를 수신할 수 있다. 디바이스는 분광 측정의 세트의 결과를 식별한 정보에 기초하여 분류 모델을 생성할 수 있으며, 여기에서 분류 모델은 분광 결정을 위한 관심 재료에 관한 적어도 하나의 클래스를 포함하며, 여기에서 상기 분류 모델은 관심이 없는 적어도 하나의 재료 또는 베이스라인 분광 측정 중 적어도 하나에 관한 불-일치 클래스를 포함한다. 디바이스는 알려지지 않은 샘플의 특정한 분광 측정의 특정한 결과를 식별한 정보를 수신할 수 있다. 디바이스는 분류 모델을 사용하여 알려지지 않은 샘플이 불-일치 클래스에 포함되는지를 결정할 수 있다. 디바이스는 알려지지 않은 샘플이 불-일치 클래스에 포함되는지를 나타내는 출력을 제공할 수 있다.

Description

분광 분류를 위한 감소된 거짓 양성 식별{REDUCED FALSE POSITIVE IDENTIFICATION FOR SPECTROSCOPIC CLASSIFICATION}
원료 식별은 의약품의 품질-제어를 위해 이용될 수 있다. 예를 들면, 원료 식별은 의료 재료의 구성요소 성분이 의료 재료와 연관된 패키징 라벨에 대응하는지를 결정하기 위해 의료 재료에 대해 수행될 수 있다. 유사하게는, 원료 수량화가 특정한 샘플에서 특정한 화학 물질의 농도를 결정하기 위해 수행될 수 있다. 분광법은 다른 계량화학 기술에 대해 감소된 준비 및 데이터 획득 시간을 가진 비-파괴적 원료 식별 및/또는 수량화를 가능하게 할 수 있다.
가능한 제1 구현예에 따르면, 디바이스는 하나 이상의 메모리 및 상기 하나 이상의 메모리에 통신 가능하게 결합된, 하나 이상의 프로세서를 포함할 수 있다. 상기 디바이스는 알려진 샘플의 트레이닝 세트 및 알려진 샘플의 검증 세트의 분광 측정의 세트의 결과를 식별하는 정보를 수신할 수 있다. 상기 디바이스는 상기 분광 측정의 세트의 결과를 식별하는 정보에 기초하여 분류 모델을 생성할 수 있으며, 상기 분류 모델은 분광 결정을 위해 관심 재료에 관한 적어도 하나의 클래스를 포함하고, 상기 분류 모델은 관심없는 적어도 하나의 재료 또는 베이스라인 분광 측정 중 적어도 하나에 관한 불-일치(no-match) 클래스를 포함한다. 상기 디바이스는 알려지지 않은 샘플의 특정한 분광 측정의 특정한 결과를 식별하는 정보를 수신할 수 있다. 상기 디바이스는 상기 분류 모델을 사용하여 상기 알려지지 않은 샘플이 불-일치 클래스에 포함되는지를 결정할 수 있다. 상기 디바이스는 상기 알려지지 않은 샘플이 불-일치 클래스에 포함되는지를 나타내는 출력을 제공할 수 있다.
보다 구체적으로, 추가의 실시형태에 있어서, 상기 하나 이상의 프로세서는, 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되는지를 결정할 때, 상기 분류 모델에 기초하여 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함됨을 결정하며; 상기 하나 이상의 프로세서는, 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되는지를 나타내는 출력을 제공할 때, 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함됨을 나타내는 출력을 제공한다. 또한, 추가의 실시형태에 있어서, 상기 하나 이상의 프로세서는, 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되는지를 결정할 때, 상기 분류 모델에 기초하여 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되지 않는다고 결정하고; 상기 분류 모델을 사용하여 그리고 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되지 않는다고 결정하는 것에 기초하여 상기 알려지지 않은 샘플의 분류를 결정하며; 그리고 상기 하나 이상의 프로세서는, 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되는지를 나타내는 출력을 제공할 때, 상기 알려지지 않은 샘플의 분류를 식별하는 출력을 제공한다. 또한, 추가의 실시형태에 있어서, 상기 하나 이상의 프로세서는, 상기 분광 측정의 세트의 결과를 식별한 정보를 수신할 때, 베이스라인 분광 측정의 세트를 식별한 정보를 수신하며; 그리고 상기 하나 이상의 프로세서는, 상기 분류 모델을 생성할 때, 상기 베이스라인 분광 측정의 세트에 기초하여 상기 분류 모델에 대한 상기 불-일치 클래스를 트레이닝한다. 또한, 추가의 실시형태에 있어서, 상기 베이스라인 분광 측정의 세트는, 잘못된 측정 거리를 사용하여 수행된 측정, 잘못된 측정 배경을 사용하여 수행된 측정, 잘못된 측정 조명을 사용하여 수행된 측정, 또는 존재하는 샘플 없이 수행된 측정 중 적어도 하나와 연관된다. 상기 하나 이상의 프로세서는, 상기 분광 측정의 세트의 결과를 식별한 정보를 수신할 때, 관심이 없는 적어도 하나의 재료를 식별한 정보를 수신하며; 상기 하나 이상의 프로세서는, 상기 분류 모델을 생성할 때, 상기 관심이 없는 적어도 하나의 재료를 식별한 정보에 기초하여 상기 분류 모델에 대한 불-일치 클래스를 트레이닝한다. 또한, 추가의 실시형태에 있어서, 상기 하나 이상의 프로세서는, 상기 분류 모델을 사용하여 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되는지를 결정할 때, 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되는지를 결정하기 위해 지지 벡터 기계 기반 신뢰성 메트릭을 사용한다. 상기 신뢰성 메트릭은, 확률 추정치, 또는 판단 값 중 적어도 하나이다. 상기 분류 모델은 제1 분류 모델이며; 상기 하나 이상의 프로세서는, 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되는지를 결정할 때, 상기 제1 분류 모델을 사용하여, 상기 특정한 분광 측정을 위해, 상기 제1 분류 모델의, 국소 클래스의 세트를 식별하기 위해 제1 분류를 수행하고; 상기 국소 클래스의 세트에 기초하여 제2 분류 모델을 생성하되, 상기 제2 분류 모델이 상기 불-일치 클래스를 포함하며; 그리고 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되는지를 결정하기 위해 제2 분류를 수행한다.
가능한 제2 구현예에 따르면, 비-일시적 컴퓨터-판독 가능한 매체는 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금 알려지지 않은 샘플에 대해 수행된 분광 측정의 결과를 식별하는 정보를 수신하게 하는 하나 이상의 명령어를 저장할 수 있다. 상기 하나 이상의 명령어는, 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금 종합 분류 모델을 생성하기 위해 분류 모델의 복수의 클래스를 종합하게 할 수 있다. 상기 하나 이상의 명령어는, 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금 상기 분광 측정이 상기 종합 분류 모델을 사용하여 정확하게 수행됨을 결정하게 할 수 있다. 상기 하나 이상의 명령어는, 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금, 상기 분광 측정이 정확하게 수행됨을 결정하는 것에 기초하여 그리고 상기 분류 모델을 사용하여, 알려지지 않은 샘플이 상기 분류 모델의 불-일치 클래스에 포함되지 않음을 결정하게 할 수 있으며, 상기 불-일치 클래스는 관심없는 재료 또는 베이스라인 분광 측정에 관련된다. 상기 하나 이상의 명령어는, 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금, 상기 알려지지 않은 샘플이 불-일치 클래스에 포함되지 않음을 결정하는 것에 기초하여, 상기 알려지지 않은 샘플의 분광 분류를 수행하게 할 수 있다. 상기 하나 이상의 명령어는, 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금 상기 알려지지 않은 샘플의 분광 분류를 수행하는 것에 기초하여 상기 알려지지 않은 샘플을 식별하는 정보를 제공하게 할 수 있다.
보다 구체적으로, 추가의 실시형태에 있어서, 상기 하나 이상의 프로세서가 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되지 않음을 결정하게 하는 상기 하나 이상의 명령어는, 상기 하나 이상의 프로세서로 하여금, 임계치를 만족하는 상기 분류 모델과 연관된 신뢰성 메트릭에 기초하여 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되지 않음을 결정하게 한다. 상기 하나 이상의 명령어는, 상기 하나 이상의 프로세서에 의해 실행될 때, 또한 상기 하나 이상의 프로세서로 하여금, 1-대-전체 기술 또는 전체-쌍 기술을 사용하여 상기 분류 모델을 복수의 서브-모델로 분할하는 것에 기초하여 상기 신뢰성 메트릭을 결정하게 한다. 또한, 추가의 실시형태에 있어서, 상기 분류 모델은 임계 수량보다 큰 클래스를 포함하며; 상기 하나 이상의 프로세서가 상기 분광 분류를 수행하게 하는 상기 하나 이상의 명령어는, 상기 하나 이상의 프로세서로 하여금, 상기 분류 모델에 기초하여 상기 알려지지 않은 샘플의 제1 분광 분류를 수행하게 하고; 상기 제1 분광 분류를 수행하는 것에 기초하여 상기 분류 모델의 클래스의 서브세트를 사용하여 또 다른 분류 모델을 생성하게 하고; 상기 다른 분류 모델에 기초하여 상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함되지 않는다고 결정하게 하며; 그리고 상기 알려지지 않은 샘플을 식별하기 위해 제2 분류를 수행하게 한다.
가능한 제3 구현예에 따르면, 방법은, 디바이스에 의해, 분광 측정의 세트의 결과를 획득하는 것을 포함할 수 있다. 상기 방법은, 상기 디바이스에 의해, 상기 분광 측정의 세트의 결과에 기초하여 지지 벡터 기계(SVM)-기반 분류 모델을 생성하는 것을 포함할 수 있으며, 상기 분류 모델은 분류를 위한 복수의 관심 재료에 대응하는 복수의 클래스를 포함하고, 상기 분광 측정의 세트는 상기 복수의 관심 재료의 샘플의 임계 수량의 측정을 포함하고, 상기 분류 모델은 분류를 위한 상기 복수의 관심 재료에 대응하지 않는 특정한 클래스를 포함하며, 상기 분광 측정의 세트는 특정한 클래스에 관한 샘플의 임계 수량 미만의 측정을 포함한다. 상기 방법은, 상기 디바이스에 의해, 분류 모델을 사용하여 특정한 샘플의 특정한 분광 측정을 상기 특정한 클래스로 분류하는 것을 포함할 수 있다. 상기 방법은, 상기 디바이스에 의해, 상기 특정한 샘플이 상기 특정한 분광 측정을 분류하는 것에 기초하여 상기 특정한 클래스에 할당됨을 나타내는 정보를 제공하는 것을 포함할 수 있다.
보다 구체적으로, 추가의 실시형태에 있어서, 상기 특정한 분광 측정을 분류하는 단계는, 상기 분류 모델을 복수의 서브-모델로 분할하는 단계로서, 상기 복수의 서브-모델의, 각각의 서브-모델은 상기 분류 모델의 대응하는 클래스와 상기 분류 모델의 각각의 다른 클래스 사이에서의 비교에 대응하는, 상기 분할하는 단계; 상기 복수의 서브-모델에 대응하는 복수의 판단 값을 결정하는 단계; 및 상기 복수의 판단 값에 기초하여 상기 특정한 샘플에 대한 특정한 클래스를 선택하는 단계를 포함한다. 또한, 추가의 실시형태에 있어서, 상기 특정한 분광 측정을 분류하는 단계는, 상기 분류 모델을 복수의 서브-모델로 분할하는 단계로서, 상기 복수의 서브-모델은 상기 분류 모델의 각각의 클래스 사이에서의 비교에 대응하는, 상기 분할하는 단계; 상기 복수의 서브-모델에 대응하는 복수의 판단 값을 결정하는 단계; 및 상기 복수의 판단 값에 기초하여 상기 특정한 샘플에 대한 특정한 클래스를 선택하는 단계를 포함한다. 상기 특정한 분광 측정을 분류하는 단계는, 방사 기저 함수 형의 커널 함수 또는 선형 커널 형의 커널 함수를 사용하여 상기 특정한 분광 측정을 분류하는 단계를 포함한다. 상기 분광 측정의 세트는 베이스라인 분광 측정 및 관심 없는 재료 분광 측정을 포함하며; 상기 베이스라인 분광 측정 및 상기 관심없는 재료 분광 측정은 상기 특정한 클래스로 분류된다. 상기 특정한 분광 측정을 분류하는 단계는, 상기 분류 모델에 기초하여 생성된 현장 국소 분류 모델을 사용하여 상기 특정한 분광 측정을 분류하는 단계를 포함한다. 상기 특정한 분광 측정을 분류하는 단계는, 상기 분류 모델의 클래스를 단일 클래스로 종합하는 단계; 및 상기 단일 클래스에 기초하여 상기 특정한 분광 측정을 분류하는 단계를 포함한다.
도 1a 및 도 1b는 여기에서 설명된 예시적인 구현의 개요의 다이어그램;
도 2는 여기에서 설명된 시스템 및/또는 방법이 구현될 수 있는 예시적인 환경의 다이어그램;
도 3은 도 2의 하나 이상의 디바이스의 예시적인 구성요소의 다이어그램;
도 4는 분광 분류를 위한 분류 모델을 생성하기 위한 예시적인 프로세스의 흐름도;
도 5는 도 4에서 도시된 예시적인 프로세스에 관한 예시적인 구현예의 다이어그램;
도 6은 분광 분류 동안 거짓 양성 식별의 회피를 위한 예시적인 프로세스의 흐름도; 및
도 7a 및 도 7b는 도 6에 도시된 예시적인 프로세스에 관한 예시적인 구현예의 다이어그램.
예시적인 구현예에 대한 다음의 상세한 설명은 수반되는 도면을 참조한다. 상이한 도면에서 동일한 참조 부호는 동일한 또는 유사한 요소를 식별할 수 있다.
원료 식별(RMID)은 식별, 확인 등을 위해 특정한 샘플의 구성요소(예로서, 성분)를 식별하기 위해 이용된 기술이다. 예를 들면, RMID는 제약 재료에서의 성분이 라벨에 대해 식별된 성분의 세트에 대응함을 확인하기 위해 이용될 수 있다. 유사하게는, 원료 수량화는, 특정한 샘플에서 특정한 재료의 농도를 결정하는 것과 같은, 특정한 샘플에 대한 양적 분석을 수행하기 위해 이용된 기술이다. 분광기는 샘플의 구성요소, 샘플의 구성요소의 농도 등을 결정하기 위해 샘플(예로서, 제약 재료)에 대해 분광법을 수행하기 위해 이용될 수 있다. 분광기는 샘플의 측정의 세트를 결정할 수 있으며 분광 결정을 위한 측정의 세트를 제공할 수 있다. 분광 분류 기술(예로서, 분류기)은 샘플의 측정의 세트에 기초하여 샘플의 구성요소의 결정을 가능하게 할 수 있다.
그러나, 분광 분류의 대상이 될, 몇몇 알려지지 않은 샘플은, 분류 모델이 분류하도록 구성되는 클래스에 실제로 포함되지 않는다. 예를 들면, 어류의 유형을 구별하기 위해 트레이닝된 분류 모델에 대해, 사용자는 의도치 않게 분류를 위해 소고기를 제공할 수 있다. 이 경우에, 제어 디바이스는 특정한 재료의 분광 분류를 수행할 수 있고, 특정한 유형의 어류로서 특정한 재료의 거짓 양성 식별을 제공할 수 있으며, 이것은 부정확할 것이다.
또 다른 예로서, 분류 모델은 당의 유형(예로서, 포도당, 과당, 갈락토오스 등)을 분류하고 알려지지 않은 샘플에서 각각의 유형의 당의 각각의 농도를 수량화하도록 트레이닝될 수 있다. 그러나, 분광기 및 제어 디바이스의 사용자는 측정을 수행하기 위해 분광기를 틀리게 사용하는 것에 기초하여 의도치 않게 당의 알려지지 않은 샘플을 분류하려고 시도할 수 있다. 예를 들면, 사용자는 분광법이 분류 모델 등을 트레이닝하기 위해 수행된 교정 조건과 상이한 환경 조건에서, 알려지지 않은 샘플로부터 잘못된 거리에서 분광기를 동작시킬 수 있다. 이 경우에, 제어 디바이스는, 알려지지 않은 샘플이 실제로 제2 농도에서 제2 유형의 당일 때, 제1 농도에서 제1 유형의 당으로서 알려지지 않은 샘플의 거짓 양성 식별을 야기하는 알려지지 않은 샘플에 대한 부정확한 스펙트럼을 수신할 수 있다.
여기에서 설명된, 몇몇 구현은 분광법에 대한 거짓 양성 식별을 감소시키기 위해 분류 모델에 대한 불-일치 클래스를 이용할 수 있다. 예를 들면, 알려지지 않은 샘플의 분광 측정을 수신하는 제어 디바이스는 불-일치 클래스에 알려지지 않은 샘플을 할당할지를 결정할 수 있다. 몇몇 구현예에서, 제어 디바이스는 알려지지 않은 샘플이 불-일치 클래스에 할당됨을 결정할 수 있으며 알려지지 않은 샘플이 불-일치 클래스에 할당됨을 나타내는 정보를 제공할 수 있고, 그에 의해 알려지지 않은 샘플의 거짓 양성 식별을 회피한다. 대안적으로, 알려지지 않은 샘플이 불-일치 클래스에 할당되지 않음을 결정하는 것에 기초하여, 제어 디바이스는 분류, 농도 등과 같은, 분광 결정을 제공하기 위해 알려지지 않은 샘플의 스펙트럼을 분석할 수 있다. 더욱이, 제어 디바이스는, 거짓 양성 식별을 걸러내기 위해 확률 추정치, 판단 값 등과 같은, 신뢰성 메트릭을 이용할 수 있다.
이러한 방식으로, 분광법의 정확성은 불-일치 클래스 및/또는 신뢰성 메트릭의 사용 없이 수행된 분광법에 대하여 개선된다. 게다가, 불-일치 클래스는 알려진 분광 샘플의 트레이닝 세트에 기초하여 분류 모델을 생성할 때 사용될 수 있다. 예를 들면, 제어 디바이스는 트레이닝 세트의 샘플이, 트레이닝 세트의 나머지에 대응하는 유형이 아님을 결정할 수 있으며(예로서, 트레이닝 세트로 도입되는 잘못된 샘플을 야기하는 인적 오류에 기초하여), 분류 모델을 생성할 때 샘플에 관한 데이터를 포함하지 않는 것으로 결정할 수 있다. 이러한 방식으로, 제어 디바이스는 분광법에 대한 분류 모델의 정확성을 개선한다.
도 1a 및 도 1b는 여기에서 설명된 예시적인 구현예(100)의 개요를 다이어그램이다. 도 1a에 도시된 바와 같이, 예시적인 구현예(100)는 제어 디바이스 및 분광기를 포함할 수 있다.
도 1a에서 추가로 도시되는 바와 같이, 제어 디바이스는 분광기가 트레이닝 세트 및 검증 세트(예로서, 분류 모델의 트레이닝 및 검증을 위해 이용된 알려진 샘플의 세트)에 대한 분광 측정의 세트를 수행하게 할 수 있다. 트레이닝 세트 및 검증 세트는 분류 모델의 각각의 클래스에 대한 샘플의 임계 수량을 포함하기 위해 선택될 수 있다. 분류 모델의 클래스는 (제약 맥락에서) 젖당 재료, 과당 재료, 아세트아미노펜 재료, 이부프로펜 재료, 아스피린 재료 등과 같은, 하나 이상의 특성을 공동으로 공유하는 유사한 재료의 그룹핑을 나타낼 수 있다. 분류 모델을 트레이닝하기 위해 사용되고, 원료 식별이 분류 모델을 사용하여 수행될 재료는 관심 재료로 지칭될 수 있다.
도 1a에서 추가로 도시되는 바와 같이, 분광기는 제어 디바이스로부터 명령어를 수신하는 것에 기초하여 트레이닝 세트 및 검증 세트에 대해 분광 측정의 세트를 수행할 수 있다. 예를 들면, 분광기는 제어 디바이스가 분류 모델에 대한 관심 재료 중 하나로서 알려지지 않은 샘플을 분류하기 위한 클래스의 세트를 생성할 수 있게 하기 위해 트레이닝 세트 및 검증 세트의 각각의 샘플에 대한 스펙트럼을 결정할 수 있다.
분광기는 분광 측정의 세트를 제어 디바이스로 제공할 수 있다. 제어 디바이스는 특정한 결정 기술을 사용하여 및 분광 측정의 세트에 기초하여 분류 모델을 생성할 수 있다. 예를 들면, 제어 디바이스는 지지 벡터 기계(SVM) 기술(예로서, 정보 결정을 위한 기계 학습 기술)을 사용하여 전역적 분류 모델을 생성할 수 있다. 전역적 분류 모델은 관심 재료의 특정한 클래스에 특정한 스펙트럼을 할당하는 것과 연관된 정보를 포함할 수 있으며, 특정한 클래스와 연관되는 관심 재료의 유형을 식별하는 것과 연관된 정보를 포함할 수 있다. 이러한 방식으로, 제어 디바이스는 특정한 클래스에 알려지지 않은 샘플의 스펙트럼을 할당하는 것에 기초하여 알려지지 않은 샘플의 재료의 유형을 식별하는 정보를 제공할 수 있다.
몇몇 구현예에서, 제어 디바이스는 불-일치 클래스를 위한 샘플에 관한 스펙트럼을 수신할 수 있다. 예를 들면, 제어 디바이스는 관심 재료의 스펙트럼과 유사한 것으로 결정된 스펙트럼, 관심 재료로 혼동될 수 있는(예로서, 시각적으로, 화학적으로 등) 재료에 관한 스펙트럼, 분광기의 잘못된 동작에 관한 스펙트럼(예로서, 샘플 없이 수행된 측정의 스펙트럼, 샘플과 분광기의 광학 사이에서의 잘못된 거리에서 수행된 측정의 스펙트럼 등) 등을 수신할 수 있다. 관심 재료가 아니며, 불-일치 클래스에 포함될 수 있는 재료는, 잡음(nuisance) 재료 또는 관심없는 재료로 지칭될 수 있다. 이 경우에, 제어 디바이스는 분류 모델을 위한 불-일치 클래스를 생성할 수 있으며, 검증 세트에 포함된 잡음 재료에 대한 스펙트럼에 기초하여 불-일치 클래스를 사용하여 거짓 양성 식별 회피를 검증할 수 있다. 부가적으로, 또는 대안적으로, 분류 모델의 사용 동안, 제어 디바이스는 잡음 재료를 식별하는 정보를 수신할 수 있으며, 거짓 양성 식별(예로서, 관심 재료 중 하나로서 잡음 재료의 식별)의 회피를 가능하게 하기 위해 분류 모델을 업데이트할 수 있다.
도 1b에 도시된 바와 같이, 제어 디바이스는 (예로서, 저장 장치로부터, 분류 모델을 생성한 또 다른 제어 디바이스로부터 등)분류 모델을 수신할 수 있다. 제어 디바이스는 분광기가 알려지지 않은 샘플(예로서, 분류 또는 수량화가 수행될 알려지지 않은 샘플)에 대해 분광 측정의 세트를 수행하게 할 수 있다. 분광기는 제어 디바이스로부터 명령어를 수신하는 것에 기초하여 분광 측정의 세트를 수행할 수 있다. 예를 들면, 분광기는 알려지지 않은 샘플에 대한 스펙트럼을 결정할 수 있다. 분광기는 분광 측정의 세트를 제어 디바이스로 제공할 수 있다. 제어 디바이스는 다중-스테이지 분류 기술을 사용하여서와 같은, 분류 모델에 기초하여 알려지지 않은 샘플을 분류하려고 시도할 수 있다.
도 1b와 관련하여, 제어 디바이스는 분류 모델을 사용하여 알려지지 않은 샘플이 불-일치 클래스에 있는지를 결정하려고 시도할 수 있다. 예를 들면, 제어 디바이스는 알려지지 않은 샘플이 불-일치 클래스에 속하는 가능성에 대응하는 신뢰성 메트릭을 결정할 수 있다. 이 경우에, 제어 디바이스가 확률 추정치, 지지 벡터 기계의 판단 값 출력 등과 같은, 신뢰성 메트릭이 임계치를 만족한다고 결정하는 것에 기초하여, 제어 디바이스는 불-일치 클래스에 알려지지 않은 샘플을 할당할 수 있다. 이 경우에, 제어 디바이스는 알려지지 않은 샘플이 분류 모델을 사용하여 정확하게 분류될 수 없음을 보고하며, 그에 의해 알려지지 않은 샘플이 관심 재료의 클래스에 속하는 것으로 알려지지 않은 샘플의 거짓 양성 식별의 대상이 되는 가능성을 감소시킬 수 있다.
몇몇 구현예에서, 알려지지 않은 샘플이 불-일치 클래스에 속하지 않는다는 제1 결정에 기초하여, 제어 디바이스는 현장(in-situ) 국소 모델링을 사용하여 알려지지 않은 세트의 특정한 샘플의 결정을 수행하려고 시도할 수 있다. 예를 들면, 제어 디바이스는 특정한 샘플 및 전역적 분류 모델과 연관된 신뢰성 메트릭의 세트를 결정할 수 있다. 이 경우에, 제어 디바이스는 하나 이상의 각각의 신뢰성 메트릭에 기초하여 전역적 분류 모델의 클래스의 서브세트를 선택할 수 있으며, 클래스의 세트에 기초하여 국소 분류 모델을 생성할 수 있다. 국소 분류 모델은 SVM 기술 및 클래스의 서브세트를 사용하여 생성되는 현장 분류 모델일 수 있다. 현장 분류 모델을 생성하는 것에 기초하여, 제어 디바이스는 국소 분류 모델에 기초하여 알려지지 않은 샘플을 분류하려고 시도할 수 있다. 이 경우에, 임계치를 만족하는 국소 분류 모델과 연관된 하나 이상의 신뢰성 메트릭에 기초하여, 제어 디바이스는 알려지지 않은 샘플이 불-일치 클래스에 속한다고 결정할 수 있으며, 알려지지 않은 샘플은 분류 모델을 사용하여 분류될 수 없다고 보고할 수 있다. 대안적으로, 제어 디바이스는 알려지지 않은 샘플이 불-일치 클래스에 속하지 않는다고 결정할 수 있으며, 알려지지 않은 샘플에 관한 분류를 보고할 수 있다.
이러한 방식으로, 제어 디바이스는 관심 재료인 것으로 알려지지 않은 샘플의 거짓 양성 식별을 보고하는 가능성을 감소시키는 것에 기초하여 다른 분류 모델에 관한 개선된 정확성을 가진 알려지지 않은 샘플에 대한 분광법을 가능하게 한다.
상기 표시된 바와 같이, 도 1a 및 도 1b는 단지 예로서 제공된다. 다른 예가 가능하며 도 1a 및 도 1b와 관련하여 설명된 것과 상이할 수 있다.
도 2는 여기에서 설명된 시스템 및/또는 방법이 구현될 수 있는 예시적인 환경(200)의 다이어그램이다. 도 2에 도시된 바와 같이, 환경(200)은 제어 디바이스(210), 분광기(220), 및 네트워크(230)를 포함할 수 있다. 환경(200)의 디바이스는 유선 연결, 무선 연결, 또는 유선 및 무선 연결의 조합을 통해 상호 연결할 수 있다.
제어 디바이스(210)는 분광 분류와 연관된 정보를 저장하고, 프로세싱하며, 및/또는 라우팅할 수 있는 하나 이상의 디바이스를 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 트레이닝 세트의 측정의 세트에 기초하여 분류 모델을 생성하고, 검증 세트의 측정의 세트에 기초하여 분류 모델을 검증하며, 및/또는 알려지지 않은 세트의 측정의 세트에 기초하여 분광 분류를 수행하기 위해 분류 모델을 이용하는 서버, 컴퓨터, 착용 가능한 디바이스, 클라우드 컴퓨팅 디바이스 등을 포함할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는, 여기에서 설명된 바와 같이, 알려지지 않은 샘플의 분광 측정이 거짓 양성 분류의 가능성을 감소시키기 위해 불-일치 클래스로 분류될지를 결정하기 위해 기계 학습 기술을 이용할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 특정한 분광기(220)와 연관될 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 다수의 분광기(220)와 연관될 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 분광기(220)와 같은, 환경(200)에서의 또 다른 디바이스로부터 정보를 수신하며 및/또는 그것으로 정보를 송신할 수 있다.
분광기(220)는 샘플에 대한 분광 측정을 수행할 수 있는 하나 이상의 디바이스를 포함할 수 있다. 예를 들면, 분광기(220)는 분광법(예로서, 근 적외선(NIR) 분광기와 같은 진동 분광법, 중-적외선 분광법(중-IR), 라만 분광법 등)을 수행하는 분광기 디바이스를 포함할 수 있다. 몇몇 구현예에서, 분광기(220)는 착용 가능한 분광기 등과 같은, 착용 가능한 디바이스로 통합될 수 있다. 몇몇 구현예에서, 분광기(220)는 제어 디바이스(210)와 같은, 환경(200)에서의 또 다른 디바이스로부터 정보를 수신하며 및/또는 그것으로 정보를 송신할 수 있다.
네트워크(230)는 하나 이상의 유선 및/또는 무선 네트워크를 포함할 수 있다. 예를 들면, 네트워크(230)는 셀룰러 네트워크(예로서, 장기 진화(LTE) 네트워크, 3G 네트워크, 코드 분할 다중 액세스(CDMA) 네트워크 등), 공중 육상 이동 네트워크(PLMN), 근거리 네트워크(LAN), 광역 네트워크(WAN), 대도시 영역 네트워크(MAN), 전화 네트워크(예로서, 공중 스위칭 전화 네트워크(PSTN)), 사설 네트워크, 애드 혹 네트워크, 인트라넷, 인터넷, 파이버 옵틱-기반 네트워크, 클라우드 컴퓨팅 네트워크 등, 및/또는 이들 또는 다른 유형의 네트워크의 조합을 포함할 수 있다.
도 2에 도시된 디바이스 및 네트워크의 수 및 배열이 예로서 제공된다. 실제로, 도 2에 도시된 것보다 부가적인 디바이스 및/또는 네트워크, 보다 적은 디바이스 및/또는 네트워크, 상이한 디바이스 및/또는 네트워크, 또는 상이하게 배열된 디바이스 및/또는 네트워크가 있을 수 있다. 더욱이, 도 2에 도시된 둘 이상의 디바이스는 단일 디바이스 내에 구현될 수 있거나, 또는 도 2에 도시된 단일 디바이스는 다수의, 분배된 디바이스로서 구현될 수 있다. 예를 들면, 제어 디바이스(210) 및 분광기(220)가 여기에서, 두 개의 별개의 디바이스인 것으로서 설명되지만, 제어 디바이스(210) 및 분광기(220)는 단일 디바이스 내에 구현될 수 있다. 부가적으로, 또는 대안적으로, 환경(200)의 디바이스(예로서, 하나 이상의 디바이스)의 세트는 환경(200)의 디바이스의 또 다른 세트에 의해 수행되는 것으로서 설명된 하나 이상의 기능을 수행할 수 있다.
도 3은 디바이스(300)의 예시적인 구성요소의 다이어그램이다. 디바이스(300)는 제어 디바이스(210) 및/또는 분광기(220)에 대응할 수 있다. 몇몇 구현예에서, 제어 디바이스(210) 및/또는 분광기(220)는 하나 이상의 디바이스(300) 및/또는 디바이스(300)의 하나 이상의 구성요소를 포함할 수 있다. 도 3에 도시된 바와 같이, 디바이스(300)는 버스(310), 프로세서(320), 메모리(330), 저장 구성요소(340), 입력 구성요소(350), 출력 구성요소(360), 및 통신 인터페이스(370)를 포함할 수 있다.
버스(310)는 디바이스(300)의 구성요소 간에 통신을 허용하는 구성요소를 포함한다. 프로세서(320)는 하드웨어, 펌웨어, 또는 하드웨어와 소프트웨어의 조합으로 구현된다. 프로세서(320)는 중앙 프로세싱 유닛(CPU), 그래픽스 프로세싱 유닛(GPU), 가속화 프로세싱 유닛(APU), 마이크로프로세서, 마이크로제어기, 디지털 신호 프로세서(DSP), 필드-프로그램 가능한 게이트 어레이(FPGA), 애플리케이션-특정 집적 회로(ASIC), 또는 또 다른 유형의 프로세싱 구성요소이다. 몇몇 구현예에서, 프로세서(320)는 기능을 수행하도록 프로그램될 수 있는 하나 이상의 프로세서를 포함한다. 메모리(330)는 프로세서(320)에 의한 사용을 위해 정보 및/또는 명령어를 저장하는 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 및/또는 또 다른 유형의 동적 또는 정적 저장 디바이스(예로서, 플래시 메모리, 자기 메모리, 및/또는 광학 메모리)를 포함한다.
저장 구성요소(340)는 디바이스(300)의 동작 및 사용에 관련된 정보 및/또는 소프트웨어를 저장한다. 예를 들면, 저장 구성요소(340)는, 대응하는 드라이브와 함께, 하드 디스크(예로서, 자기 디스크, 광학 디스크, 자기-광학 디스크, 및/또는 고체 상태 디스크), 컴팩트 디스크(CD), 디지털 다목적 디스크(DVD), 플로피 디스크, 카트리지, 자기 테이프, 및/또는 또 다른 유형의 비-일시적 컴퓨터-판독 가능한 매체를 포함할 수 있다.
입력 구성요소(350)는 사용자 입력(예로서, 터치 스크린 디스플레이, 키보드, 키패드, 마우스, 버튼, 스위치, 및/또는 마이크로폰)을 통해서와 같은, 디바이스(300)가 정보를 수신하도록 허용하는 구성요소를 포함한다. 부가적으로, 또는 대안적으로, 입력 구성요소(350)는 정보를 감지하기 위한 센서(예로서, 전역적 위치 결정 시스템(GPS) 구성요소, 가속도계, 자이로스코프, 및/또는 작동기)를 포함할 수 있다. 출력 구성요소(360)는 디바이스(300)로부터 출력 정보를 제공하는 구성요소(예로서, 디스플레이, 스피커, 및/또는 하나 이상의 발광 다이오드(LED))를 포함한다.
통신 인터페이스(370)는 디바이스(300)가 유선 연결, 무선 연결, 또는 유선 및 무선 연결의 조합을 통해서와 같은, 다른 디바이스와 통신할 수 있게 하는 트랜시버-형 구성요소(예로서, 트랜시버 및/또는 별개의 수신기 및 송신기)를 포함한다. 통신 인터페이스(370)는 디바이스(300)가 또 다른 디바이스로부터 정보를 수신하며 및/또는 또 다른 디바이스로 정보를 제공하도록 허용할 수 있다. 예를 들면, 통신 인터페이스(370)는 이더넷 인터페이스, 광학 인터페이스, 동축 인터페이스, 적외선 인터페이스, 라디오 주파수(RF) 인터페이스, 범용 직렬 버스(USB) 인터페이스, 무선 근거리 네트워크 인터페이스, 셀룰러 네트워크 인터페이스 등을 포함할 수 있다.
디바이스(300)는 여기에서 설명된 하나 이상의 프로세스를 수행할 수 있다. 디바이스(300)는 메모리(330) 및/또는 저장 구성요소(340)와 같은, 비-일시적 컴퓨터-판독 가능한 매체에 의해 저장된 소프트웨어 명령어를 실행하는 프로세서(320)에 기초하여 이들 프로세스를 수행할 수 있다. 컴퓨터-판독 가능한 매체는 여기에서 비-일시적 메모리 디바이스로서 정의된다. 메모리 디바이스는 단일 물리 저장 디바이스 내에서의 메모리 공간 또는 다수의 물리적 저장 디바이스에 걸쳐 확산된 메모리 공간을 포함한다.
소프트웨어 명령어는 통신 인터페이스(370)를 통해 또 다른 디바이스로부터 또는 또 다른 컴퓨터-판독 가능한 매체로부터 메모리(330) 및/또는 저장 구성요소(340)로 판독될 수 있다. 실행될 때, 메모리(330) 및/또는 저장 구성요소(340)에 저장된 소프트웨어 명령어는 프로세서(320)가 여기에서 설명된 하나 이상의 프로세스를 수행하게 할 수 있다. 부가적으로, 또는 대안적으로, 하드와이어드 회로는 여기에서 설명된 하나 이상의 프로세스를 수행하기 위해 소프트웨어 명령어 대신에 또는 그것과 조합하여 사용될 수 있다. 따라서, 여기에서 설명된 구현은 하드웨어 회로 및 소프트웨어의 임의의 특정한 조합에 제한되지 않는다.
도 3에 도시된 구성요소의 수 및 배열은 예로서 제공된다. 실제로, 디바이스(300)는 도 3에 도시된 것보다 부가적인 구성요소, 보다 적은 구성요소, 상이한 구성요소, 또는 상이하게 배열된 구성요소를 포함할 수 있다. 부가적으로, 또는 대안적으로, 디바이스(300)의 구성요소(예로서, 하나 이상의 구성요소)의 세트는 디바이스(300)의 구성요소의 또 다른 세트에 의해 수행되는 것으로서 설명된 하나 이상의 기능을 수행할 수 있다.
도 4는 분광 분류를 위한 분류 모델을 생성하기 위한 예시적인 프로세스(400)의 흐름도이다. 몇몇 구현예에서, 도 4의 하나 이상의 프로세스 블록은 제어 디바이스(210)에 의해 수행될 수 있다. 몇몇 구현예에서, 도 4의 하나 이상의 프로세스 블록은 또 다른 디바이스 또는 분광기(220)와 같은, 제어 디바이스(210)로부터 분리된 또는 이를 포함한 디바이스의 그룹에 의해 수행될 수 있다.
도 4에 도시된 바와 같이, 프로세스(400)는 분광 측정의 세트가 트레이닝 세트 및/또는 검증 세트에 대해 수행되게 하는 것(블록 410)을 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 (예로서, 프로세서(320), 통신 인터페이스(370) 등을 사용하여) 분광기(220)가 트레이닝 세트 및/또는 검증 세트의 각각의 샘플에 대한 스펙트럼을 결정하도록 샘플의 트레이닝 세트 및/또는 검증 세트에 대한 분광 측정의 세트를 수행하게 할 수 있다. 트레이닝 세트는, 분류 모델을 생성하기 위해 이용되는, 하나 이상의 알려진 재료의 샘플의 세트를 나타낼 수 있다. 유사하게는, 검증 세트는 분류 모델의 정확성을 검증하기 위해 이용되는, 하나 이상의 알려진 재료의 샘플의 세트를 나타낼 수 있다. 예를 들면, 트레이닝 세트 및/또는 검증 세트는 재료의 세트의 하나 이상의 버전(예로서, 제조 차이에 대해 제어하기 위해 상이한 제조사에 의해 제조된 하나 이상의 버전)을 포함할 수 있다.
몇몇 구현예에서, 트레이닝 세트 및/또는 검증 세트는 분류 모델을 사용하여 분광 분류가 수행될 관심 재료의 예상 세트에 기초하여 선택될 수 있다. 예를 들면, 분광 수량화가 제약 재료의 특정한 구성요소의 존재를 결정하기 위해 제약 재료에 대해 수행될 것으로 예상될 때, 트레이닝 세트 및/또는 검증 세트는 상이한 가능한 농도의 세트에서 활성 제약 성분(API), 부형제 등의 샘플의 세트를 포함할 수 있다.
몇몇 구현예에서, 트레이닝 세트 및/또는 검증 세트는 각각의 유형의 재료에 대해 특정한 수량의 샘플을 포함하도록 선택될 수 있다. 예를 들면, 트레이닝 세트 및/또는 검증 세트는 특정한 재료 및/또는 농도의 다수의 샘플(예로서, 5개 샘플, 10개 샘플, 15개 샘플, 50개 샘플 등)을 포함하도록 선택될 수 있다. 몇몇 구현예에서, 샘플의 수량은 임계치 미만일 수 있다. 예를 들면, 동종의 유기 화합물에 대한 클래스는 10개 샘플의 50개 스펙트럼(예로서, 분광 스캔), 3개 샘플의 15개 스펙트럼 등에 기초하여 생성될 수 있다. 유사하게는, 동종의 유기 화합물에 대해, 클래스는, 예를 들면, 20개 샘플로부터의 100개 스펙트럼, 10개 샘플로부터의 50개 스펙트럼 등에 기초하여 생성될 수 있다. 유사하게는, 생체 또는 농업 재료에 대한 클래스는 40개 샘플로부터의 400개 스펙트럼, 20개 샘플로부터의 200개 스펙트럼 등에 기초하여 생성될 수 있다. 몇몇 구현예에서, 잡음 재료에 대한 불-일치 클래스를 위해 사용되는 샘플 및/또는 스펙트럼의 수량은 동일한 유형의 재료(예로서, 동종의 유기 화합물, 이종 유기 화합물, 생체 또는 농업 재료 등)에 대한 비-불-일치 클래스로서 샘플 및/또는 스펙트럼의 동일한 또는 감소된 수량과 연관될 수 있다. 이러한 방식으로, 제어 디바이스(210)는 특정한 유형의 재료와 연관된 스펙트럼의 임계 수량을 제공받으며, 그에 의해 알려지지 않은 샘플이 정확하게 할당될 수 있는 분류 모델(예로서, 전역적 분류 모델, 국소 분류 모델 등) 또는 수량화 모델과 연관된 클래스에 할당된 스펙트럼을 수량화하기 위해 사용될 수 있는 수량화 모델에 대해, 클래스의 생성 및/또는 검증을 가능하게 할 수 있다.
몇몇 구현예에서, 불-일치 클래스에 할당될 재료의 하나 이상의 샘플은 트레이닝 세트 및/또는 검증 세트에 포함될 수 있다. 예를 들면, 분광기(220)는 수량화 모델을 사용하여 수량화될 제2 재료로 유사한 스펙트럼과 연관되는 제1 재료의 측정치를 제공할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 거짓 양성 식별의 회피를 트레이닝하기 위해 기계 학습을 사용할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 수신된 정보에 기초하여 불-일치 클래스에 대한 재료를 선택할 수 있다. 예를 들면, 제어 디바이스(210)는 분류 모델이 생성될 관심 재료의 특정한 농도에 대해 유사한 스펙트럼, 외형 등을 가진 잡음 재료를 식별하는 정보를 수신할 수 있다. 부가적으로, 또는 대안적으로, 제어 디바이스(210)는 특정한 관심 재료에 대해 잡음 재료를 자동으로 식별하기 위해 기계 학습 기술을 수행할 수 있다. 예를 들면, 제어 디바이스(210)는 관심 재료의 스펙트럼과 유사한 잡음 재료의 스펙트럼을 식별하도록, 관심 재료와 시각적으로 유사하게 보이는 잡음 재료를 식별하도록 패턴 인식을 수행하기 위해 기계 학습을 사용할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 베이스라인 분광 측정이 불-일치 클래스에 대한 스펙트럼을 식별하기 위해 수행되게 할 수 있다. 예를 들면, 제어 디바이스(210)는 분광 측정으로 하여금, 잘못된 분광 측정이 특정한 관심 재료로서 분류되기보다는 불-일치 클래스로서 분류됨을 보장하기 위해 베이스라인 분광 측정으로서 존재하는 샘플 없이, 잘못된 배경을 갖고, 잘못된 조명 등을 갖고 수행되게 할 수 있다. 이 경우에, 제어 디바이스(210)는 분광기(220)를 자동으로 제어하고, 잘못된 측정을 수행하도록 분광기(220)의 사용자에게 명령어하기 위해 사용자 인터페이스를 사용하여 정보를 제공하는 등을 할 수 있다. 부가적으로, 또는 대안적으로, 제어 디바이스(210)는 불-일치 클래스의 생성을 가능하게 하기 위해 특정한 분광 측정이 틀리게 수행되었음을 나타내는 정보를 수신할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 다수의 분광기(220)가 하나 이상의 물리적 조건을 감안하도록 분광 측정의 세트를 수행하게 할 수 있다. 예를 들면, 제어 디바이스(210)는 제1 분광기(220) 및 제2 분광기(220)가 NIR 분광법을 사용하여 진동 분광 측정의 세트를 수행하게 할 수 있다. 부가적으로, 또는 대안적으로, 제어 디바이스(210)는 분광 측정의 세트가, 다수 회, 다수의 위치에서, 다수의 상이한 실험실 조건하 등에서 수행되게 할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 분광 측정의 세트가 단일 분광기(220)에 의해 수행되게 하는 것에 대하여 물리적 조건의 결과로서 분광 측정이 부정확한 가능성을 감소시킨다.
도 4에 추가로 도시되는 바와 같이, 프로세스(400)는 분광 측정의 세트의 결과를 식별하는 정보를 수신하는 것을 포함할 수 있다(블록 420). 예를 들면, 제어 디바이스(210)는 (예로서, 프로세서(320), 통신 인터페이스(370) 등을 사용하여) 분광 측정의 세트의 결과를 식별하는 정보를 수신할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 트레이닝 세트 및/또는 검증 세트의 샘플에 대응하는 스펙트럼의 세트를 식별하는 정보를 수신할 수 있다. 예를 들면, 제어 디바이스(210)는 분광기(220)가 트레이닝 세트에 대해 분광법을 수행할 때 관찰되는, 특정한 스펙트럼을 식별하는 정보를 수신할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 동시에 트레이닝 세트 및 검증 세트에 대한 스펙트럼을 식별하는 정보를 수신할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 트레이닝 세트에 대한 스펙트럼을 식별하는 정보를 수신할 수 있고, 분류 모델을 생성할 수 있으며, 분류 모델의 검사를 가능하게 하기 위해 분류 모델을 생성한 후 검증 세트에 대한 스펙트럼을 식별하는 정보를 수신할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 불-일치 클래스를 생성하기 위해 측정이 부정확하게 수행됨을 나타내는 정보와 같은, 분광 측정의 세트의 결과로서 다른 정보를 수신할 수 있다. 부가적으로, 또는 대안적으로, 제어 디바이스(210)는 에너지의 흡수, 에너지의 방출, 에너지의 산란 등을 식별하는 것과 연관된 정보를 수신할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 다수의 분광기(220)로부터 분광 측정의 세트의 결과를 식별하는 정보를 수신할 수 있다. 예를 들면, 제어 디바이스(210)는, 다수의 분광기(220)에 의해 수행되고, 다수의 상이한 시간에서 수행되고, 다수의 상이한 위치에서 수행되는 분광 측정을 수신함으로써, 다수의 분광기(220) 사이에서의 차이, 실험실 조건에서의 잠재적인 차이 등과 같은, 물리적 조건에 대해 제어할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 분류 모델을 생성할 때 이용으로부터 하나 이상의 스펙트럼을 제거할 수 있다. 예를 들면, 제어 디바이스(210)는 분광 분류를 수행할 수 있고, 스펙트럼을 불-일치 클래스로 분류할 수 있으며, 스펙트럼에 대응하는 샘플이 의도치 않게 잡음 재료 또는 관심없는 재료였음을 결정할 수 있으며(예로서, 정확하게 수행한 분광법에서의 인적 오류, 트레이닝 세트의 스펙트럼을 식별하는 정보에서의 오류 등에 기초하여), 트레이닝 세트로부터 스펙트럼을 제거하도록 결정할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 분류 모델이 트레이닝 세트 또는 검증 세트에 대한 잘못된 또는 부정확한 정보를 사용하여 생성되는 가능성을 감소시킴으로써 분류 모델의 정확성을 개선할 수 있다.
도 4에서 추가로 도시되는 바와 같이, 프로세스(400)는 분광 측정의 세트의 결과를 식별하는 정보에 기초하여 분류 모델을 생성하는 것(블록 430)을 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 (예로서, 프로세서(320), 메모리(330), 저장 구성요소(340) 등을 사용하여) 분광 측정의 세트의 결과를 식별하는 정보에 기초하여 (예로서, 현장 국소 모델링 기술에서의 사용을 위한) 주요 성분 분석(PCA)-SVM 분류기 기술과 연관된 전역적 분류 모델을 생성할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 전역적 분류 모델을 생성하기 위해 결정의 세트를 수행할 수 있다. 예를 들면, 제어 디바이스(210)는 전역적 분류 모델에 대한 클래스의 세트를 생성할 수 있으며, 분광 측정의 세트의 결과에 의해 식별된 스펙트럼의 세트를, SVM 기술을 사용하는 것에 기초하여 국소 클래스로 할당할 수 있다. 몇몇 구현예에서, 전역적 분류 모델의 사용 동안, 제어 디바이스(210)는 전역적 분류 모델에 관한 신뢰성 메트릭을 사용하여 알려지지 않은 스펙트럼에 대응하는 국소 클래스의 임계 수량을 식별하고, 국소 클래스에 기초하여 국소 분류 모델을 생성하며, 국소 분류 모델에 기초하여 알려지지 않은 스펙트럼의 아이덴티티를 결정한다. 이 경우에, 불-일치 클래스는 국소 분류 모델에 대해 생성될 수 있다(예로서, 전역적 분류 모델로부터 현장에서 생성된 국소 분류 모델은 불-일치 클래스를 포함할 수 있다). 이러한 방식으로, 제1 분류 및 제2 분류를 가진 현장 국소 모델링을 사용함으로써, 제어 디바이스(210)는 다량의 클래스(예로서, 50개 클래스 이상, 100개 클래스 이상, 200개 클래스 이상, 1000개 클래스 이상 등과 같은, 임계치 이상)에 대한 분류를 가능하게 한다. 몇몇 구현예에서, 제어 디바이스(210)는 알려지지 않은 스펙트럼을 분류하기 위해 또 다른 유형의 분류 모델을 생성하며 및/또는 분류 모델에 대한 또 다른 유형의 분류기를 사용할 수 있다.
SVM은 패턴 인식을 수행하고 분류를 위해 신뢰성 메트릭을 사용하는 지도식 학습 모델을 나타낼 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 SVM 기술을 사용하여 전역적 분류 모델을 생성할 때 둘 이상의 입력(예로서, 스펙트럼)의 유사성을 결정하기 위해 특정한 유형의 커널 함수를 이용할 수 있다. 예를 들면, 제어 디바이스(210)는 스펙트럼 x 및 y에 대해 k(x,y) = exp(-||x-y||^2)로서 표현될 수 있는, 방사 기저 함수(RBF)(예로서, SVM-rbf로 불림) 형의 커널 함수; k(x,y) = 〈xㆍy〉로서 표현될 수 있는, 선형 함수(예로서, SVM-선형으로 불리며 다중-스테이지 결정 기술에 대해 이용될 때 hier-SVM-선형으로 불림) 형의 커널 함수; 시그모이드(sigmoid) 함수 형의 커널 함수; 다항식 함수 형의 커널 함수; 지수 함수 형의 커널 함수; 등을 이용할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 확률 값 기반 SVM(예로서, 샘플이 클래스의 세트 중 하나의 클래스의 멤버인 확률을 결정하는 것에 기초한 결정), 판단 값 기반 SVM(예로서, 샘플의 클래스가 멤버인 것으로서, 클래스의 세트의, 하나의 클래스에 대해 투표하기 위해 판단 함수를 이용한 결정) 등과 같은, SVM에 대해 특정한 유형의 신뢰성 메트릭을 이용할 수 있다. 예를 들면, 판단 값 기반 SVM을 가진 분류 모델의 사용 동안, 제어 디바이스(210)는 알려지지 않은 샘플이 알려지지 않은 샘플의 스펙트럼의 플로팅에 기초하여 구성 클래스의 경계 내에 위치되는지를 결정할 수 있으며, 알려지지 않은 샘플이 구성 클래스의 경계 내에 위치되는지에 기초하여 클래스에 샘플을 할당할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 알려지지 않은 스펙트럼을 특정한 클래스에, 불-일치 클래스 등에 할당할지를 결정할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 판단 값을 결정하기 위해 특정한 클래스 비교 기술을 이용할 수 있다. 예를 들면, 제어 디바이스(210)는 1-대-전체 기술(때때로 1-대-전체 다른 기술로 불림)을 이용할 수 있으며, 여기에서 분류 모델은 서브-모델의 그룹으로 분할되며 각각의 서브-모델은 분류 모델의 각각의 다른 클래스와 비교된 클래스에 기초하며, 판단 값은 각각의 서브-모델에 기초하여 결정된다. 부가적으로, 또는 대안적으로, 제어 디바이스(210)는 전체-쌍 기술을 이용할 수 있으며, 여기에서 분류 모델은 판단 값을 결정할 서브-모델을 형성하기 위해 각각의 가능한 쌍의 클래스로 분할된다.
여기에서 설명된 몇몇 구현은 특정한 세트의 기계 학습 기술에 대하여 설명되지만, 재료의 분류 등과 같은, 알려지지 않은 스펙트럼에 대한 정보를 결정하기 위해 다른 기술이 가능하다.
몇몇 구현예에서, 제어 디바이스(210)는 분류 기술의 세트로부터 전역적 분류 모델을 생성하기 위해 이용될 특정한 분류기를 선택할 수 있다. 예를 들면, 제어 디바이스(210)는 다수의 분류기에 대응하는 다수의 분류 모델을 생성할 수 있으며, 각각의 모델의 양도성(예로서, 제2 분광기(220)에 대해 수행된 분광 측정에 적용될 때 제1 분광기(220)에 대해 수행된 분광 측정에 기초하여 생성된 분류 모델이 정확한 정도), 대규모 결정 정확성(예로서, 분류 모델이 임계치를 만족하는 샘플의 수량을 동시에 분류하기 위해 이용될 수 있는 정확성) 등을 결정함으로써와 같은, 다수의 분류 모델을 검사할 수 있다. 이 경우에, 제어 디바이스(210)는 분류기가 다른 분류기에 대해 우수한 양도성 및/또는 대규모 결정 정확성과 연관된다고 결정하는 것에 기초하여, SVM 분류기(예로서, hier-SVM-선형)와 같은, 분류기를 선택할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 트레이닝 세트의 샘플을 식별하는 정보에 기초하여 분류 모델을 생성할 수 있다. 예를 들면, 제어 디바이스(210)는 재료의 유형 또는 농도를 갖고 스펙트럼의 클래스를 식별하기 위해 트레이닝 세트의 샘플에 의해 표현된 재료의 유형 또는 농도를 식별하는 정보를 이용할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 분류 모델을 생성할 때 분류 모델을 트레이닝할 수 있다. 예를 들면, 제어 디바이스(210)는 모델이 분광 측정의 세트의 일 부분(예로서, 트레이닝 세트에 관한 측정)을 사용하여 트레이닝되게 할 수 있다. 부가적으로, 또는 대안적으로, 제어 디바이스(210)는 분류 모델의 평가를 수행할 수 있다. 예를 들면, 제어 디바이스(210)는 분광 측정의 세트의 또 다른 부분(예로서, 검증 세트)을 이용하여 (예로서, 예측 강도에 대해) 분류 모델을 검증할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 다중-스테이지 결정 기술을 사용하여 분류 모델을 검증할 수 있다. 예를 들면, 현장 국소 모델링 기반 분류에 대해, 제어 디바이스(210)는 하나 이상의 국소 분류 모델과 관련하여 이용될 때 전역적 분류 모델이 정확하다고 결정할 수 있다. 이러한 방식으로, 제어 디바이스(210)는, 제어 디바이스(210)에 의해, 다른 분광기(220)와 연관된 다른 제어 디바이스(210) 등에 의해서와 같은, 이용을 위한 분류 모델을 제공하기 전에 분류 모델이 임계 정확성을 갖고 생성됨을 보장한다.
몇몇 구현예에서, 제어 디바이스(210)는 분류 모델을 생성한 후 다른 분광기(220)와 연관된 다른 제어 디바이스(210)로 분류 모델을 제공할 수 있다. 예를 들면, 제1 제어 디바이스(210)는 분류 모델을 생성할 수 있으며 이용을 위해 제2 제어 디바이스(210)로 분류 모델을 제공할 수 있다. 이 경우에, 현장 국소 모델링 기반 분류에 대해, 제2 제어 디바이스(210)는 분류 모델(예로서, 전역적 분류 모델)을 저장할 수 있으며, 알려지지 않은 세트의 하나 이상의 샘플을 분류하기 위해 하나 이상의 현장 국소 분류 모델을 생성하는데 분류 모델을 이용할 수 있다. 부가적으로, 또는 대안적으로, 제어 디바이스(210)는 분류를 수행할 때, 하나 이상의 국소 분류 모델을 생성할 때(예로서, 현장 국소 모델링 기반 분류를 위한) 제어 디바이스(210)에 의한 이용을 위해 분류 모델을 저장할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 알려지지 않은 샘플의 분광 분류에서의 이용을 위해 분류 모델을 제공한다.
도 4는 프로세스(400)의 예시적인 블록을 도시하지만, 몇몇 구현예에서, 프로세스(400)는 도 4에 묘사된 것보다 부가적인 블록, 보다 적은 블록, 상이한 블록, 또는 상이하게 배열된 블록을 포함할 수 있다. 부가적으로, 또는 대안적으로, 프로세스(400)의 블록 중 둘 이상이 병렬로 수행될 수 있다.
도 5는 도 4에 도시된 예시적인 프로세스(400)에 관한 예시적인 구현예(500)의 다이어그램이다. 도 5는 수량화를 위한 거짓 양성 식별을 가진 분류 모델을 생성하는 예를 도시한다.
도 5에 도시된 바와 같이, 제어 디바이스(210-1)는 트레이닝 세트 및 검증 세트(510)에 대한 분광 측정의 세트를 수행하도록 분광기(220-1)에 명령어하기 위해 정보를 분광기(220-1)로 송신한다. 트레이닝 세트 및 검증 세트(510)는 제1 세트의 트레이닝 샘플(예로서, 분류 모델을 트레이닝하기 위해 이용되는 측정) 및 제2 세트의 검증 샘플(예로서, 분류 모델의 정확성을 검증하기 위해 이용되는 측정)을 포함한다고 가정하자. 참조 부호 515에 의해 도시된 바와 같이, 분광기(220-1)는 명령어를 수신하는 것에 기초하여 분광 측정의 세트를 수행한다. 참조 부호 520에 의해 도시된 바와 같이, 제어 디바이스(210-1)는 트레이닝 샘플에 대한 제1 세트의 스펙트럼 및 검증 샘플에 대한 제2 세트의 스펙트럼을 수신한다. 이 경우에, 검증 샘플은 거짓 양성 식별을 피하기 위해 분류를 위한 다수의 관심 재료의 샘플 및 분류 모델에 대한 불-일치 클래스를 트레이닝하기 위한 하나 이상의 잡음 재료 또는 잘못된 측정의 하나 이상의 샘플을 포함할 수 있다. 제어 디바이스(210-1)는 트레이닝 세트 및 검증 세트(510)의 각각의 샘플을 식별하는 정보를 저장한다고 가정하자.
도 5와 관련하여, 제어 디바이스(210-1)는 현장 국소 모델링 유형의 분류 모델일 수 있는, 분류 모델을 생성하기 위해 hier-SVM-선형 분류기를 이용하도록 선택되었다고 가정하자(예로서, 하나 이상의 다른 분류기에 대해 hier-SVM-선형 분류기를 검사하는 것에 기초하여). 참조 부호 525에 의해 도시된 바와 같이, 제어 디바이스(210-1)는 hier-SVM-선형 분류기 및 제1 세트의 스펙트럼을 사용하여 분류 모델을 트레이닝하며 hier-SVM-선형 분류기 및 제2 세트의 스펙트럼을 사용하여 분류 모델을 확인한다. 제어 디바이스(210-1)는 잡음 재료를 식별하도록 분류 모델을 트레이닝하기 위해 제1 세트의 스펙트럼의 서브세트, 및 잡음 재료를 식별할 때 분류 모델의 정확성을 검증하기 위해 제2 세트의 스펙트럼의 서브세트를 사용하여 분류 모델에 대한 불-일치 클래스를 생성할 수 있다.
제어 디바이스(210-1)는 분류 모델이 검증 임계치를 만족한다고(예로서, 검증 임계치를 초과하는 정확성을 갖는다고) 결정한다고 가정하자. 참조 부호 530에 의해 도시된 바와 같이, 제어 디바이스(210-1)는 분류 모델을 제어 디바이스(210-2)(예로서, 분광기(220-2)에 의해 수행된 분광 측정에 대한 분류를 수행할 때 이용을 위해)로 및 제어 디바이스(210-3)(예로서, 분광기(220-3)에 의해 수행된 분광 측정에 대한 분류를 수행할 때 이용을 위해)로 제공한다.
상기 표시된 바와 같이, 도 5는 단지 예로서 제공된다. 다른 예가 가능하며 도 5에 관하여 설명된 것과 상이할 수 있다.
이러한 방식으로, 제어 디바이스(210)는 선택된 분류 기술(예로서, 모델 양도성, 대규모 분류 정확성 등에 기초하여 선택된)에 기초한 분류 모델의 생성 및 하나 이상의 분광기(220)와 연관된 하나 이상의 다른 제어 디바이스(210)에 의한 이용을 위한 분류 모델의 분배를 가능하게 한다. 게다가, 제어 디바이스(210)는 거짓 양성 식별을 피하기 위해 잡음 재료의 분광 측정을 포함함으로써 분류 모델의 정확성을 개선한다.
도 6은 원료 식별 동안 거짓 양성 식별의 회피를 위한 예시적인 프로세스(600)의 흐름도이다. 몇몇 구현예에서, 도 6의 하나 이상의 프로세스 블록은 제어 디바이스(210)에 의해 수행될 수 있다. 몇몇 구현예에서, 도 6의 하나 이상의 프로세스 블록은 또 다른 디바이스 또는 분광기(220)와 같은 제어 디바이스(210)로부터 분리된 또는 이를 포함한 디바이스의 그룹에 의해 수행될 수 있다.
도 6에 도시된 바와 같이, 프로세스(600)는 알려지지 않은 샘플에 대해 수행된 분광 측정의 세트의 결과를 식별하는 정보를 수신하는 것(블록 610)을 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 (예로서, 프로세서(320), 통신 인터페이스(370) 등을 사용하여) 알려지지 않은 샘플에 대해 수행된 분광 측정의 세트의 결과를 식별하는 정보를 수신할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 알려지지 않은 세트에 대한 분광 측정의 세트의(예로서, 다수의 샘플의) 결과를 식별하는 정보를 수신할 수 있다. 알려지지 않은 세트는 결정(예로서, 분광 분류)이 수행될 샘플(예로서, 알려지지 않은 샘플)의 세트를 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 분광기(220)가 알려지지 않은 샘플의 세트에 대해 분광 측정의 세트를 수행하게 할 수 있으며, 알려지지 않은 샘플의 세트에 대응하는 스펙트럼의 세트를 식별하는 정보를 수신할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 다수의 분광기(220)로부터 결과를 식별하는 정보를 수신할 수 있다. 예를 들면, 제어 디바이스(210)는 다수의 분광기(220)가 알려지지 않은 세트(예로서, 동일한 세트의 샘플)에 대해 분광 측정의 세트를 수행하게 할 수 있으며, 알려지지 않은 세트의 샘플에 대응하는 스펙트럼의 세트를 식별하는 정보를 수신할 수 있다. 부가적으로, 또는 대안적으로, 제어 디바이스(210)는 다수 회, 다수의 위치 등에서 수행된 분광 측정의 세트의 결과를 식별하는 정보를 수신할 수 있으며, 다수 회, 다수의 위치 등에서 수행된 분광 측정의 세트에 기초하여(예로서, 분광 측정의 세트를 평균화하는 것에 기초하여 또는 또 다른 기술에 기초하여) 특정한 샘플을 분류하고 및/또는 수량화할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 분광 측정의 세트의 결과에 영향을 줄 수 있는 물리적 조건을 감안할 수 있다.
부가적으로, 또는 대안적으로, 제어 디바이스(210)는 제1 분광기(220)가 알려지지 않은 세트의 제1 부분에 대해 분광 측정의 세트의 제1 부분을 수행하게 할 수 있으며 제2 분광기(220)가 알려지지 않은 세트의 제2 부분에 대해 분광 측정의 세트의 제2 부분을 수행하게 할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 분광 측정 모두가 단일 분광기(220)에 의해 수행되게 하는 것에 대해 분광 측정의 세트를 수행하기 위한 시간 양을 감소시킬 수 있다.
도 6에서 추가도 도시되는 바와 같이, 프로세스(600)는 분광 측정의 세트가 정확하게 수행되는지를 결정하는 것(블록 620)을 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 (예로서, 프로세서(320), 메모리(330), 저장 구성요소(340) 등을 사용하여) 분광 측정의 세트가 정확하게 수행되는지를 결정할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 알려지지 않은 샘플의 분광 측정이 교정된 거리에서(예로서, 분광기(220)의 광학 구성요소와 샘플 사이, 분광기(220)의 광학 구성요소와 샘플에 대한 배경 사이 등) 수행되었는지를 결정할 수 있다. 부가적으로, 또는 대안적으로, 제어 디바이스(210)는 알려지지 않은 샘플의 분광 측정이 교정된 온도에서, 교정된 압력에서, 교정된 습도에서, 교정된 배경을 사용하여, 교정된 분광기 등을 사용하여 수행되었는지를 결정할 수 있다.
교정된 거리, 교정된 온도, 교정된 압력, 교정된 습도, 교정된 배경 등과 같은, 교정 조건에 대한 교정된 값은 모델이 트레이닝되고 및/또는 검증된 값을 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 온도, 알려지지 않은 샘플과 분광기(220)의 광학 구성요소 사이에서의 거리 등과 같은 측정 조건에 대한 값을 식별하는 측정 데이터를 분광기(220)로부터 수신할 수 있으며, 제어 디바이스(210)는 모델이 값의 임계량 내에서 교정 조건에 대한 교정 값과 연관된 트레이닝 세트 및/또는 검증 세트를 사용하여 트레이닝되었음을 검증할 수 있다.
부가적으로, 또는 대안적으로, 제어 디바이스(210)는 알려지지 않은 스펙트럼이 정확하게 수행된 측정과 연관되는지를 결정하기 위해 단일 클래스 SVM(SC-SVM) 분류기 기술을 사용하여 온전성 검사(sanity check)를 수행할 수 있다. 예를 들면, 제어 디바이스(210)는 단일 클래스를 갖고 종합 분류 모델을 형성하기 위해 분류 모델에서 다수의 클래스를 종합하며 알려지지 않은 샘플이 이상치 샘플인지를 결정하기 위해 판단 값을 갖고 SVM 분류기를 사용할 수 있다. 이 경우에, 알려지지 않은 샘플이 이상치 샘플일 때, 제어 디바이스(210)는 분광 측정의 세트가 정확하게 수행되지 않음을 결정할 수 있고, 분광 측정의 세트가 다시 수행되게 할 수 있으며, 분광 측정의 또 다른 세트를 식별하는 또 다른 세트의 결과를 수신할 수 있다(블록 620 - 아니오). 이러한 방식으로, 제어 디바이스(210)는 알려지지 않은 샘플과 유사한(예로서, 또한 임계 양만큼 관심 재료의 트레이닝 세트 샘플과 상이한) 샘플을 사용하여 트레이닝된 분류 모델을 갖지 않고 임계 양만큼 분류 모델과 상이한 알려지지 않은 스펙트럼의 식별을 가능하게 한다. 게다가, 제어 디바이스(210)는 분류 모델을 생성하기 위해 수집될 샘플의 양을 감소시키며, 그에 의해 임계 양만큼 관심 재료와 상이한 잡음 재료에 대한 다른 샘플을 획득하고, 저장하며, 프로세싱하는 것에 대해 비용, 시간, 및 계산 리소스 이용(예로서, 프로세싱 리소스 및 메모리 리소스)을 감소시킨다.
더욱이, 제어 디바이스(210)는 측정 조건이 교정 조건에 매칭되는지를 결정하지 않고 분광법을 수행하는 것에 대해 분광법의 부정확한 결과(예로서, 부정확한 수량화, 부정확한 결정 등)의 가능성을 감소시킨다. 게다가, 알려지지 않은 샘플의 측정이 알려지지 않은 샘플을 분류하려고 시도하기 전에 정확하게 수행되었음을 결정하는 것에 기초하여, 제어 디바이스(210)는 분광법을 수행하려고 시도하는 것, 잘못된 측정의 결과로서 실패하는 것, 및 분광법에서 또 다른 시도를 수행하는 것에 대해 계산 리소스의 이용을 감소시킨다.
도 6에서 추가로 도시되는 바와 같이, 분광 측정의 세트가 정확하게 수행됨을 결정하는 것에 기초하여(블록 620 - 예), 프로세스(600)는 분광 측정의 세트의 결과에 기초하여 알려지지 않은 샘플이 불-일치 클래스에 포함되는지를 결정하는 것(블록 630)을 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 (예로서, 프로세서(320), 메모리(330), 저장 구성요소(340) 등을 사용하여) 알려지지 않은 샘플이 불-일치 클래스(예로서, 관심없는 재료 또는 잡음 재료)로 분류되는지를 결정하려고 시도할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 알려지지 않은 샘플이 불-일치 클래스에 포함되는지를 결정하기 위해 알려지지 않은 샘플을 분류할 수 있다. 예를 들면, 제어 디바이스(210)는 알려지지 않은 샘플을 불-일치 클래스로 분류하기 위한 판단 값을 결정하기 위해 모델에 대해 SVM-rbf 커널 함수 또는 SVM-선형 커널 함수를 사용할 수 있다. 임계 판단 값을 만족하는 판단 값에 기초하여, 제어 디바이스(210)는 알려지지 않은 샘플이 불-일치 클래스에 속한다고 결정할 수 있다(예로서, 알려지지 않은 샘플은 잡음 재료인 것으로 결정되고, 스펙트럼은, 잘못된 측정 거리를 사용하여 수행된 측정, 잘못된 측정 배경을 사용하여 수행된 측정, 잘못된 측정 조명을 사용하여 수행된 측정, 존재하는 샘플 없이 수행된 측정 등과 같은, 베이스라인 분광 측정과 연관되는 것으로 결정된다). 이러한 방식으로, 제어 디바이스(210)는 분광법을 위한 분류 모델이 특정한 알려지지 않은 샘플의 스펙트럼과 함께 사용하기 위해 교정되지 않는다고 결정하며, 특정한 알려지지 않은 샘플의 거짓 양성 식별을 회피한다. 대안적으로, 제어 디바이스(210)는 알려지지 않은 샘플이 불-일치 클래스에 속하지 않는다고 결정할 수 있다.
도 6에서 추가로 도시되는 바와 같이, 알려지지 않은 샘플이 불-일치 클래스에 포함된다고 결정하는 것에 기초하여(블록 630 - 예), 프로세스(600)는 알려지지 않은 샘플이 불-일치 클래스에 포함됨을 나타내는 출력을 제공하는 것(블록 640)을 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 (예로서, 프로세서(320), 메모리(330), 저장 구성요소(340), 통신 인터페이스(370) 등을 사용하여) 알려지지 않은 샘플이 불-일치 클래스에 포함됨을 나타내는 정보를, 사용자 인터페이스를 통해서와 같이, 제공할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 알려지지 않은 샘플을 식별하는 것과 연관된 정보를 제공할 수 있다. 예를 들면, 특정한 식물에서 특정한 화학 물질의 양을 수량화하려고 시도하며, 알려지지 않은 샘플이 특정한 식물(그러나, 대신에 인적 오류에 기초하여서와 같이, 또 다른 식물)이 아님을 결정하는 것에 기초하여, 제어 디바이스(210)는 다른 식물을 식별하는 정보를 제공할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 또 다른 분류 모델을 획득할 수 있으며, 분류 모델의 불-일치 클래스에 알려지지 않은 스펙트럼을 할당하는 것에 기초하여 알려지지 않은 샘플을 식별하기 위해 다른 분류 모델을 사용할 수 있다.
이러한 방식으로, 제어 디바이스(210)는 알려지지 않은 샘플의 거짓 양성 식별에 기초하여 잘못된 정보를 제공하는 가능성을 감소시키며, 알려지지 않은 샘플이 특정한 식물보다는 다른 식물임을 결정하도록 돕기 위해 정보를 제공함으로써 기술자에 의한 에러 정정을 가능하게 한다.
도 6에서 추가로 도시되는 바와 같이, 알려지지 않은 샘플이 불-일치 클래스에 포함되지 않음을 결정하는 것에 기초하여(블록 630 - 아니오), 프로세스(600)는 분광 측정의 세트의 결과에 기초하여 하나 이상의 분광 결정을 수행하는 것(블록 650)을 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 (예로서, 프로세서(320), 메모리(330), 저장 구성요소(340) 등을 사용하여) 분광 측정의 세트의 결과에 기초하여 하나 이상의 분광 결정을 수행할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 제1 결정을 수행하기 위해, 전역적 분류 모델의 클래스의 세트 중, 특정한 클래스에 알려지지 않은 샘플을 할당할 수 있다. 예를 들면, 제어 디바이스(210)는 전역적 분류 모델에 기초하여 특정한 샘플과 연관된 특정한 스펙트럼이 재료(예로서, 셀룰로스 재료, 젖당 재료, 카페인 재료 등)의 국소 클래스에 대응한다고 결정할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 신뢰성 메트릭에 기초하여 특정한 샘플을 할당할 수 있다. 예를 들면, 제어 디바이스(210)는, 전역적 분류 모델에 기초하여, 특정한 스펙트럼이 전역적 분류 모델의 각각의 클래스와 연관되는 확률을 결정할 수 있다. 이 경우에, 제어 디바이스(210)는 다른, 비-국소 클래스와 연관된 다른 확률을 초과하는 특정한 국소 클래스에 대한 특정한 확률에 기초하여 특정한 국소 클래스로 알려지지 않은 샘플을 할당할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 샘플이 연관되는 재료의 유형을 결정하며, 그에 의해, 샘플을 식별한다. 몇몇 구현예에서, 제어 디바이스(210)는 알려지지 않은 샘플이 임의의 클래스와 연관된 임계치를 만족하지 않으며 불-일치 클래스와 연관된 임계치를 만족하지 않는다고 결정할 수 있다. 이 경우에, 제어 디바이스(210)는 알려지지 않은 샘플이 클래스 중 임의의 것에 포함되지 않으며 불-일치 클래스와 연관된 임계치에 대응하는 신뢰성 레벨을 가진 불-일치 클래스에 할당될 수 없음을 나타내는 출력을 제공할 수 있다.
몇몇 구현예에서, 클래스의 임계 수량보다 큰 클래스 모델에 대해서와 같은, 현장 국소 모델링을 수행하기 위해, 제어 디바이스(210)는 제1 결정에 기초하여 국소 분류 모델을 생성할 수 있다. 국소 분류 모델은 제1 결정과 연관된 신뢰성 메트릭에 기초하여 SVM 결정 기술(예로서, SVM-rbf, SVM-선형 등 커널 함수; 확률 값 기반 SVM, 판단 값 기반 SVM 등; 등)을 사용하여 생성된 현장 분류 모델을 나타낼 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 다수의 국소 분류 모델을 생성할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 전역적 분류 모델을 사용하여 제1 결정을 수행하는 것에 기초하여 국소 수량화 모델을 생성할 수 있다. 예를 들면, 제어 디바이스(210)가 알려지지 않은 샘플에서 물질의 농도를 결정하기 위해 이용되며, 다수의 알려지지 않은 샘플이 물질의 농도를 결정하기 위한 상이한 수량화 모델과 연관될 때, 제어 디바이스(210)는 알려지지 않은 샘플에 대한 국소 클래스로서 클래스의 서브세트를 선택하기 위해 제1 결정을 이용할 수 있으며, 제1 결정의 결과에 기초하여 알려지지 않은 샘플에 대한 수량화 모델을 선택할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 분광 분류를 개선하기 위해 계층적 결정 및 수량화 모델을 이용한다.
몇몇 구현예에서, 제어 디바이스(210)는 결과 및 국소 분류 모델에 기초하여 제2 결정을 수행할 수 있다. 예를 들면, 제어 디바이스(210)는 국소 분류 모델 및 특정한 스펙트럼에 기초하여 전역적 분류 모델에 대한 관심 재료 중 하나로서 알려지지 않은 샘플을 분류할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 특정한 스펙트럼 및 국소 분류 모델과 연관된 신뢰성 메트릭의 세트를 결정할 수 있다. 예를 들면, 제어 디바이스(210)는 특정한 스펙트럼이 국소 분류 모델의 각각의 클래스와 연관되는 확률을 결정할 수 있으며, 국소 분류 모델의 다른 클래스보다 높은 확률을 가진 클래스로 특정한 스펙트럼(예로서, 특정한 스펙트럼과 연관된 알려지지 않은 샘플)을 할당할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 알려지지 않은 샘플을 식별한다. 몇몇 구현예에서, 제어 디바이스(210)는 국소 분류 모델에 대한 불-일치 클래스를 결정할 수 있으며, 국소 분류 모델에 대한 불-일치 클래스에 특정한 스펙트럼을 할당할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 알려지지 않은 샘플이 분류 모델의 클래스에 대한 임계 신뢰성 메트릭을 만족하는데 실패함을 결정할 수 있으며, 알려지지 않은 샘플에 대한 분류 실패를 결정할 수 있다. 이러한 방식으로, 임계 신뢰성 메트릭을 사용하는 것에 기초하여, 제어 디바이스(210)는 알려지지 않은 샘플의 거짓 양성 식별의 가능성을 감소시킨다.
몇몇 구현예에서, 제어 디바이스(210)는 제1 결정을 수행한 후(및/또는 제2 결정을 수행한 후) 수량화를 수행할 수 있다. 예를 들면, 제어 디바이스(210)는 하나 이상의 결정을 수행하는 것에 기초하여 국소 수량화 모델을 선택할 수 있으며, 국소 수량화 모델을 선택하는 것에 기초하여 특정한 샘플에 관한 수량화를 수행할 수 있다. 예로서, 식물 재료에서 특정한 화학 물질의 농도를 결정하기 위해 원료 식별을 수행할 때(여기에서, 식물 재료는 다수의 수량화 모델과 연관된다)(예로서, 식물이 실내에서 또는 옥외에서, 겨울에 또는 여름 등에서 자라게 되는지에 관한), 제어 디바이스(210)는 특정한 수량화 모델을 식별하기 위해 결정의 세트를 수행할 수 있다. 이 경우에, 제어 디바이스(210)는 결정의 세트를 수행하는 것에 기초하여 식물이 겨울에 실내에서 자라게 된다고 결정할 수 있으며, 특정한 화학 물질의 농도를 결정하기 위해 겨울에 실내에서 자라게 되는 식물에 관한 수량화 모델을 선택할 수 있다.
도 6에서 추가로 도시되는 바와 같이, 하나 이상의 분광 분류를 수행할 때 분류 실패에 기초하여(블록 650 - A), 프로세스(600)는 분류 실패를 나타내는 출력을 제공하는 것, 및 선택적으로 분류 모델의 클래스를 업데이트하는 것(블록 660)을 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 (예로서, 프로세서(320), 메모리(330), 저장 구성요소(340), 통신 인터페이스(370) 등을 사용하여) 분류 실패를 나타내는 정보를 제공할 수 있다. 예를 들면, 분류와 연관된 신뢰성 레벨이 임계 신뢰성 레벨을 만족하지 않는다고 결정하는 것에 기초하여, 제어 디바이스(210)는 분류 실패를 나타내는 출력을 제공하며, 그에 의해 거짓-양성 결정의 가능성을 감소시킬 수 있다. 부가적으로, 또는 대안적으로, 신뢰성 레벨이 임계치를 만족하지 않는다고 결정하는 것에 기초하여, 제어 디바이스(210)는 분류를 수행하기 위한 분류 모델의 클래스를 선택적으로 업데이트할 수 있다. 예를 들면, 제어 디바이스(210)는 (예로서, 조작자, 데이터베이스 등으로부터와 같이) 샘플을 식별하는 부가적인 정보를 획득할 수 있으며, 샘플이 라벨링된 클래스에 속한다고 결정할 수 있다. 이 경우에, 제어 디바이스(210)는 개선된 후속 분광 분류를 가능하게 하기 위해 라벨링된 클래스를 업데이트할 수 있다. 부가적으로, 또는 대안적으로, 제어 디바이스(210)는 샘플이 라벨링된 클래스에 속하지 않음을 나타내는 정보를 획득할 수 있다. 이 경우에, 제어 디바이스(210)는 개선된 후속 불-일치 분류를 가능하게 하기 위해 불-일치 클래스를 업데이트할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 분광 분류에 대한 반복적 모델 강화를 가능하게 한다.
도 6에서 추가로 도시되는 바와 같이, 하나 이상의 분광 분류를 수행할 때 분류 성공에 기초하여(블록 650 - B), 프로세스(600)는 알려지지 않은 샘플에 관한 분류를 식별하는 정보를 제공하는 것(블록 670)을 포함할 수 있다. 예를 들면, 제어 디바이스(210)는 (예로서, 프로세서(320), 메모리(330), 저장 구성요소(340), 통신 인터페이스(370) 등을 사용하여) 알려지지 않은 샘플에 관한 분류를 식별하는 정보를 제공할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 알려지지 않은 샘플에 대한 특정한 클래스를 식별하는 정보를 제공할 수 있다. 예를 들면, 제어 디바이스(210)는 알려지지 않은 샘플과 연관된 특정한 스펙트럼이 특정한 클래스와 연관되는 것으로 결정됨을 나타내는 정보를 제공하며, 그에 의해 알려지지 않은 샘플을 식별할 수 있다.
몇몇 구현예에서, 제어 디바이스(210)는 특정한 클래스에 알려지지 않은 샘플을 할당하는 것과 연관된 신뢰성 메트릭을 나타내는 정보를 제공할 수 있다. 예를 들면, 제어 디바이스(210)는 알려지지 않은 샘플이 특정한 클래스 등과 연관되는 확률을 식별하는 정보를 제공할 수 있다. 이러한 방식으로, 제어 디바이스(210)는 특정한 스펙트럼이 특정한 클래스에 정확하게 할당된 가능성을 나타내는 정보를 제공한다.
몇몇 구현예에서, 제어 디바이스(210)는 분류의 세트를 수행하는 것에 기초하여 수량화를 제공할 수 있다. 예를 들면, 알려지지 않은 샘플의 클래스에 관한 국소 수량화 모델을 식별하는 것에 기초하여, 제어 디바이스(210)는 알려지지 않은 샘플에서 물질의 농도를 식별하는 정보를 제공할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 분류의 세트를 수행하는 것에 기초하여 분류 모델을 업데이트할 수 있다. 예를 들면, 제어 디바이스(210)는 관심 재료로서, 잡음 재료 등으로서 알려지지 않은 샘플의 분류를 결정하는 것에 기초하여 트레이닝 세트의 샘플로서 알려지지 않은 샘플을 포함한 새로운 분류 모델을 생성할 수 있다.
도 6은 프로세스(600)의 예시적인 블록을 도시하지만, 몇몇 구현예에서, 프로세스(600)는 도 6에 묘사된 것보다 부가적인 블록, 보다 적은 블록, 상이한 블록, 또는 상이하게 배열된 블록을 포함할 수 있다. 부가적으로, 또는 대안적으로, 프로세스(600)의 블록 중 둘 이상은 병렬로 수행될 수 있다.
도 7a 및 도 7b는 도 6에 도시된 예시적인 프로세스(600)와 연관된 예측 성공률에 관한 예시적인 구현예(700)의 다이어그램이다. 도 7a 및 도 7b는 계층적 지지 벡터 기계(hier-SVM-선형) 기반 기술을 사용하여 원료 식별의 예시적인 결과를 도시한다.
도 7a에 도시된 바와 같이, 및 참조 부호 705에 의해, 제어 디바이스(210)는 분광기(220)가 분광 측정의 세트를 수행하게 할 수 있다. 예를 들면, 제어 디바이스(210)는 분광기(220)로 하여금 분류 모델이 식별하기 위해 트레이닝되는 관심 재료의 세트 중 특정한 관심 재료로서 알려지지 않은 샘플의 분류를 결정하기 위해 알려지지 않은 샘플에 대한 스펙트럼을 획득하게 하기 위한 명령어를 제공할 수 있다. 참조 부호 710 및 참조 부호 715에 의해 도시된 바와 같이, 분광기(220)는 알려지지 않은 샘플을 수신할 수 있으며 알려지지 않은 샘플에 대한 분광 측정의 세트를 수행할 수 있다. 참조 부호 720에 의해 도시된 바와 같이, 제어 디바이스(210)는 알려지지 않은 샘플에 대한 분광 측정의 세트를 수행하는 알려지지 않은 샘플 기반 분광기(220)에 대한 스펙트럼을 수신할 수 있다.
도 7b에 도시된 바와 같이, 제어 디바이스(210)는 분광 분류를 수행하기 위해 분류 모델(725)을 사용할 수 있다. 분류 모델(725)은 트레이닝 세트의 스펙트럼의 세트에 대해 식별된 클래스(730)의 세트를 포함한다. 예를 들면, 분류 모델(725)은 잠재적인 관심 재료의 클래스(730-1 내지 730-6) 및 잡음 재료(예로서, 유사한 재료; 유사한 스펙트럼; 잘못된 조명 스펙트럼, 잘못된 거리 스펙트럼, 잘못된 배경 스펙트럼 등과 같은, 틀리게 획득된 스펙트럼 등)의 불-일치 클래스(730-7)를 포함한다.
도 7b에서 추가로 도시되는 바와 같이, 및 참조 부호 735 및 740에 의해, 알려지지 않은 샘플의 스펙트럼은 불-일치 클래스에 할당되며, 알려지지 않은 샘플은 잡음 재료(예로서, 불-일치 클래스의 멤버)로서 식별된다. 예를 들면, 제어 디바이스(210)는 전역적 모델(예로서, 분류 모델(725))에 기초하여 국소 모델을 생성하기 위해 현장 국소 모델링 기술을 사용할 수 있으며, 국소 모델에 기초하여 알려지지 않은 샘플이 잡음 재료인지를 결정할 수 있다. 몇몇 구현예에서, 제어 디바이스(210)는 알려지지 않은 샘플이 잡음 재료인지를 결정하기 위해 현장 임계화 기술을 수행할 수 있다. 예를 들면, 클라이언트 디바이스(210)는 알려지지 않은 샘플의 제1 가장 가능성 있는 클래스 및/또는 샘플의 차점자 클래스(예로서, 두 번째로 가능성이 높은 클래스)와 연관된 판단 값을 자체-검증하거나 또는 교차-검증할 수 있으며, 예측 임계치에 대한 상한 및 하한을 설정하기 위해 판단 값을 사용할 수 있다. 몇몇 구현예에서, 클라이언트 디바이스(210)는 다수의 국소 모델링 전략을 이용할 수 있다. 예를 들면, 클라이언트 디바이스(210)는 승리자 클래스를 결정하기 위해 제1 모델링 기술을 및 신뢰성 메트릭을 결정하기 위해 제2 모델링 기술을 이용할 수 있다. 몇몇 구현예에서, 클라이언트 디바이스(210)는 알려지지 않은 샘플이 잡음 재료인지를 결정하기 위해 단일 클래스 SVM(SC-SVM) 기술을 이용할 수 있다. 참조 부호 745에 의해 도시된 바와 같이, 제어 디바이스(210)는 관심 재료 중 하나의 특정한 농도로서 알려지지 않은 샘플의 거짓 양성 식별을 제공하기보다는, 알려지지 않은 샘플이 잡음 재료임을 나타내는 출력을 클라이언트 디바이스(750)로 제공한다.
상기 표시된 바와 같이, 도 7a 및 도 7b는 단지 예로서 제공된다. 다른 예가 가능하며 도 7a 및 도 7b에 관하여 설명된 것과 상이할 수 있다.
이러한 방식으로, 제어 디바이스(210)는 식별하기 위해 분류 모델이 트레이닝되는 특정한 관심 재료인 것으로서 알려지지 않은 샘플의 거짓 양성 식별을 회피하는 것에 기초하여 분광법의 부정확한 결과를 제공하는 가능성을 감소시킨다.
앞서 말한 개시는 예시 및 설명을 제공하지만, 철저하거나 또는 개시된 정확한 형태로 구현을 제한하도록 의도되지 않는다. 수정 및 변화가 상기 개시를 고려하여 가능하거나 또는 구현의 실시로부터 획득될 수 있다.
몇몇 구현이 임계치와 관련되어 여기에서 설명된다. 여기에서 사용된 바와 같이, 임계치를 만족하는 것은 임계치보다 큰, 임계치보다 많은, 임계치보다 높은, 임계치보다 크거나 같은, 임계치보다 적은, 임계치보다 작은, 임계치보다 낮은, 임계치보다 작거나 같은, 임계치와 같은 값을 나타낼 수 있다.
여기에서 설명된, 시스템 및/또는 방법은 하드웨어, 펌웨어, 또는 하드웨어와 소프트웨어의 조합의 상이한 형태로 구현될 수 있다는 것이 명백할 것이다. 이들 시스템 및/또는 방법을 구현하기 위해 사용된 실제의 특수화된 제어 하드웨어 또는 소프트웨어 코드는 구현을 제한하지 않는다. 따라서, 시스템 및/또는 방법의 동작 및 거동은 특정 소프트웨어 코드에 대한 참조 없이 여기에서 설명된다 - 소프트웨어 및 하드웨어는 여기에서의 설명에 기초하여 시스템 및/또는 방법을 구현하도록 설계될 수 있다는 것이 이해될 것이다.
특징의 특정한 조합이 청구항에서 나열되며 및/또는 명세서에서 개시되지만, 이들 조합은 가능한 구현의 개시를 제한하도록 의도되지 않는다. 실제로, 많은 이들 특징은 구체적으로 청구항에서 나열되고 및/또는 명세서에서 개시되지 않은 방식으로 조합될 수 있다. 이하에서 열거된 각각의 종속 청구항은 단지 하나의 청구항에 직접 의존할 수 있지만, 가능한 구현의 개시는 청구항 세트에서의 모든 다른 청구항과 조합하여 각각의 종속 청구항을 포함한다.
여기에서 사용된 어떤 요소, 동작, 또는 명령어도 이와 같이 명시적으로 설명되지 않는다면 중요한 또는 필수적인 것으로 해석되지 않아야 한다. 또한, 여기에서 사용된 바와 같이, 단수 표현은 하나 이상의 아이템을 포함하도록 의도되며, "하나 이상"과 상호 교환 가능하게 사용될 수 있다. 더욱이, 여기에서 사용된 바와 같이, 용어 "세트"는 하나 이상의 아이템(예로서, 관련 아이템, 관련되지 않은 아이템, 관련된 아이템과 관련되지 않은 아이템의 조합 등)을 포함하도록 의도되며, "하나 이상"과 상호 교환 가능하게 사용될 수 있다. 단지 하나의 아이템만이 의도되는 경우에, 용어 "하나" 또는 유사한 언어가 사용된다. 또한, 여기에서 사용된 바와 같이, 용어 "갖다", "가지다", "갖는" 등은 제약을 두지 않은 용어인 것으로 의도된다. 뿐만 아니라, 구절 "~에 기초한"은 달리 명확하게 서술되지 않는다면, "~에 적어도 부분적으로 기초하는"을 의미하도록 의도된다.

Claims (7)

  1. 방법으로서,
    디바이스에 의해, 종합 분류 모델을 사용하여 알려지지 않은 샘플이, 이상치 샘플인지를 결정하는 단계;
    상기 알려지지 않은 샘플이 상기 이상치 샘플인지를 결정하는 것에 기초하여, 상기 디바이스에 의해, 하나 이상의 분광 측정이 정확하게 수행되지 않음을 결정하는 단계; 및
    상기 하나 이상의 분광 측정이 정확하게 수행되지 않음을 결정하는 것에 기초하여, 상기 디바이스에 의해, 하나 이상의 동작을 하게 하는 단계를 포함하는 방법.
  2. 제1항에 있어서, 상기 하나 이상의 동작을 하게 하는 단계는,
    상기 하나 이상의 분광 측정이 정확하게 수행되지 않음을 결정하는 것에 기초하여, 분광 측정의 다른 세트를 식별하는 다른 세트의 결과를 수신하는 단계를 포함하는, 방법.
  3. 제1항에 있어서,
    상기 하나 이상의 동작을 하게 하는 것에 기초하여, 상기 종합 분류 모델과 임계 양만큼 상이한 알려지지 않은 스펙트럼을 식별하는 단계를 더 포함하는, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    하나 이상의 상이한 분광 측정이 정확하게 수행됨을 결정하는 단계; 및
    상기 하나 이상의 상이한 분광 측정이 정확하게 수행됨을 결정하는 것에 기초하여, 상기 알려지지 않은 샘플이 상기 종합 분류 모델의 불-일치 클래스에 포함되는지 여부를 분류하는 단계를 더 포함하는 방법.
  5. 제4항에 있어서,
    상기 알려지지 않은 샘플이 상기 불-일치 클래스에 포함됨을 나타내는 출력을 제공하는 단계를 더 포함하는, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    현장(in-situ) 임계화 기술을 수행할 때, 상기 알려지지 않은 샘플이 잡음 또는 비정형(atypical) 재료인지 여부를 결정하는 단계를 더 포함하는 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    알려지지 않은 샘플의 제1 클래스 및/또는 상기 알려지지 않은 샘플의 제2 클래스와 관련된 판단 값을 교차-검증하는 단계; 및
    상기 판단 값을 사용하여 예측 임계치에 대한 상한 및 하한을 설정하는 단계를 포함하는, 방법.
KR1020230107648A 2018-01-26 2023-08-17 분광 분류를 위한 감소된 거짓 양성 식별 KR20230124871A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862622637P 2018-01-26 2018-01-26
US62/622,637 2018-01-26
US16/130,732 US10810408B2 (en) 2018-01-26 2018-09-13 Reduced false positive identification for spectroscopic classification
US16/130,732 2018-09-13
KR1020210174941A KR102569560B1 (ko) 2018-01-26 2021-12-08 분광 분류를 위한 감소된 거짓 양성 식별

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020210174941A Division KR102569560B1 (ko) 2018-01-26 2021-12-08 분광 분류를 위한 감소된 거짓 양성 식별

Publications (1)

Publication Number Publication Date
KR20230124871A true KR20230124871A (ko) 2023-08-28

Family

ID=64949198

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020190008936A KR102338904B1 (ko) 2018-01-26 2019-01-23 분광 분류를 위한 감소된 거짓 양성 식별
KR1020210174941A KR102569560B1 (ko) 2018-01-26 2021-12-08 분광 분류를 위한 감소된 거짓 양성 식별
KR1020230107648A KR20230124871A (ko) 2018-01-26 2023-08-17 분광 분류를 위한 감소된 거짓 양성 식별

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020190008936A KR102338904B1 (ko) 2018-01-26 2019-01-23 분광 분류를 위한 감소된 거짓 양성 식별
KR1020210174941A KR102569560B1 (ko) 2018-01-26 2021-12-08 분광 분류를 위한 감소된 거짓 양성 식별

Country Status (8)

Country Link
US (3) US10810408B2 (ko)
EP (2) EP3518147A1 (ko)
JP (3) JP6942741B2 (ko)
KR (3) KR102338904B1 (ko)
CN (2) CN113989603A (ko)
CA (1) CA3029507A1 (ko)
MX (2) MX2022008349A (ko)
TW (3) TWI776010B (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11009452B2 (en) 2018-01-26 2021-05-18 Viavi Solutions Inc. Reduced false positive identification for spectroscopic quantification
US10810408B2 (en) 2018-01-26 2020-10-20 Viavi Solutions Inc. Reduced false positive identification for spectroscopic classification
US11656174B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Outlier detection for spectroscopic classification
US11223638B2 (en) * 2018-12-27 2022-01-11 Rapid7, Inc. Stable network user account classifier
JP6856103B2 (ja) * 2019-09-30 2021-04-07 株式会社三洋物産 遊技機
JP7353940B2 (ja) * 2019-11-26 2023-10-02 株式会社日立製作所 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム
JP7418200B2 (ja) 2019-12-19 2024-01-19 キヤノン株式会社 識別装置、処理装置、処理方法、およびプログラム
JP7361594B2 (ja) * 2019-12-19 2023-10-16 キヤノン株式会社 識別装置、処理装置、処理方法、およびプログラム
CN113093967A (zh) * 2020-01-08 2021-07-09 富泰华工业(深圳)有限公司 数据生成方法、装置、计算机装置及存储介质
CN111406198B (zh) 2020-02-24 2021-02-19 长江存储科技有限责任公司 用于半导体芯片表面形貌计量的系统和方法
CN111356896B (zh) 2020-02-24 2021-01-12 长江存储科技有限责任公司 用于半导体芯片表面形貌计量的系统和方法
WO2021168611A1 (en) * 2020-02-24 2021-09-02 Yangtze Memory Technologies Co., Ltd. Systems and methods for semiconductor chip surface topography metrology
US11727089B2 (en) * 2020-09-08 2023-08-15 Nasdaq, Inc. Modular machine learning systems and methods
EP4033419A1 (en) * 2021-01-20 2022-07-27 Viavi Solutions Inc. Outlier detection for spectroscopic classification
TWI760206B (zh) * 2021-05-04 2022-04-01 行政院農業委員會農業藥物毒物試驗所 基於光譜圖辨識提供風險值的光學量測方法、光學量測系統、伺服端電腦裝置與客戶端電腦裝置
US20230038984A1 (en) * 2021-07-30 2023-02-09 Viavi Solutions Inc. Utilizing prediction thresholds to facilitate spectroscopic classification
CN114692719B (zh) * 2022-02-24 2023-04-07 电子科技大学 一种基于svm-Tradboost模型迁移的XRF小样本元素分类方法

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2566543B1 (fr) 1984-06-20 1988-02-26 Commissariat Energie Atomique Dispositif optique a rendement de collection eleve et cytofluorimetre en faisant application
JP2922110B2 (ja) 1994-02-22 1999-07-19 株式会社エヌ・ティ・ティ・データ 物品同定システム
US6785638B2 (en) * 2001-08-06 2004-08-31 Timbre Technologies, Inc. Method and system of dynamic learning through a regression-based library generation process
US20070192035A1 (en) * 2005-06-09 2007-08-16 Chem Image Corporation Forensic integrated search technology
CN100421615C (zh) 2002-03-08 2008-10-01 三西斯医学股份有限公司 通过近红外光谱对葡萄糖进行非侵入测量的小型装置
US7376456B2 (en) 2002-08-05 2008-05-20 Infraredx, Inc. Near-infrared spectroscopic analysis of blood vessel walls
US7218395B2 (en) * 2003-04-16 2007-05-15 Optopo Inc. Rapid pharmaceutical identification and verification system
US20090018804A1 (en) * 2004-11-29 2009-01-15 Scientific Analytics Systems Pty Ltd. Modelling a Phenomenon that has Spectral Data
CN101401101B (zh) 2006-03-10 2014-06-04 皇家飞利浦电子股份有限公司 用于通过谱分析鉴定dna模式的方法和系统
US20110237446A1 (en) * 2006-06-09 2011-09-29 Chemlmage Corporation Detection of Pathogenic Microorganisms Using Fused Raman, SWIR and LIBS Sensor Data
US7990532B2 (en) * 2007-01-16 2011-08-02 Chemimage Corporation Method and apparatus for multimodal detection
EP1992939A1 (en) * 2007-05-16 2008-11-19 National University of Ireland, Galway A kernel-based method and apparatus for classifying materials or chemicals and for quantifying the properties of materials or chemicals in mixtures using spectroscopic data.
US8781757B2 (en) * 2007-10-12 2014-07-15 Real-Time Analyzers, Inc. Method and apparatus for determining properties of fuels
CN101504363A (zh) 2009-03-18 2009-08-12 哈尔滨商业大学 一种基于近红外光谱分析的食用油脂酸价检测方法
WO2011077765A1 (ja) 2009-12-25 2011-06-30 古河電気工業株式会社 検体識別分取装置および検体識別分取方法
US8859969B2 (en) 2012-03-27 2014-10-14 Innovative Science Tools, Inc. Optical analyzer for identification of materials using reflectance spectroscopy
EP2648133A1 (fr) * 2012-04-04 2013-10-09 Biomerieux Identification de microorganismes par spectrometrie et classification structurée
NL2009015C2 (en) * 2012-04-10 2013-10-15 Biosparq B V Method for classification of a sample on the basis of spectral data, method for creating a database and method for using this database, and corresponding computer program, data storage medium and system.
CN103364359A (zh) 2012-04-11 2013-10-23 天士力制药集团股份有限公司 Simca模式识别法在近红外光谱识别大黄药材中的应用
US10043264B2 (en) * 2012-04-19 2018-08-07 Applied Materials Israel Ltd. Integration of automatic and manual defect classification
US20130311136A1 (en) * 2012-05-18 2013-11-21 Mustard Tree Instruments, Llc Rule-Based Sample Verification and Chemical Monitoring Methodology
CN107884340B (zh) 2013-03-21 2022-04-01 唯亚威通讯技术有限公司 海产品的光谱法表征
CA2924320A1 (en) * 2013-09-16 2015-03-19 Biodesix, Inc. Classifier generation method using combination of mini-classifiers with regularization and uses thereof
WO2015080001A1 (ja) 2013-11-27 2015-06-04 大日本印刷株式会社 培地情報登録システム、コロニー検出装置、プログラム及び衛生管理システム
KR20160124742A (ko) * 2013-12-02 2016-10-28 큐베이스 엘엘씨 비정형 텍스트내의 특징들의 중의성을 해소하는 방법
WO2016054031A1 (en) 2014-10-02 2016-04-07 Biodesix, Inc. Predictive test for aggressiveness or indolence of prostate cancer from mass spectrometry of blood-based sample
JP6547275B2 (ja) * 2014-10-29 2019-07-24 株式会社リコー 情報処理システム、情報処理装置、情報処理方法、及びプログラム
US9824434B2 (en) 2015-08-18 2017-11-21 Industrial Technology Research Institute System and method for object recognition
EP3136270B1 (en) * 2015-08-26 2021-02-24 Viavi Solutions Inc. Raw material identification using spectroscopy
US11694802B2 (en) 2016-01-22 2023-07-04 Otraces Inc. Systems and methods for improving diseases diagnosis
WO2017174580A1 (en) 2016-04-04 2017-10-12 Boehringer Ingelheim Rcv Gmbh & Co Kg Real time monitoring of product purification
EP3258285B1 (en) 2016-06-14 2020-10-21 Bruker BioSpin GmbH Method for predicting chemical shift values of nmr spin systems in a sample of a fluid class, in particular in a sample of a biofluid
US10444213B2 (en) * 2016-08-25 2019-10-15 Viavi Solutions Inc. Spectroscopic classification of conformance with dietary restrictions
US10936921B2 (en) 2017-06-15 2021-03-02 Spynsite Llc Machine learning and/or image processing for spectral object classification
CN107561024B (zh) 2017-07-17 2020-03-17 核工业北京地质研究院 一种适用于盐湖富铀水体的高光谱遥感识别方法
US10810408B2 (en) 2018-01-26 2020-10-20 Viavi Solutions Inc. Reduced false positive identification for spectroscopic classification
US11009452B2 (en) 2018-01-26 2021-05-18 Viavi Solutions Inc. Reduced false positive identification for spectroscopic quantification
US11656174B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Outlier detection for spectroscopic classification

Also Published As

Publication number Publication date
US20230273122A1 (en) 2023-08-31
TWI810013B (zh) 2023-07-21
JP7238056B2 (ja) 2023-03-13
TW201933261A (zh) 2019-08-16
US11656175B2 (en) 2023-05-23
TW202244826A (zh) 2022-11-16
CN110084261B (zh) 2021-11-02
US10810408B2 (en) 2020-10-20
MX2022008349A (es) 2022-08-08
KR102569560B1 (ko) 2023-08-22
JP2021192051A (ja) 2021-12-16
KR20210153579A (ko) 2021-12-17
JP2023088913A (ja) 2023-06-27
JP2019179023A (ja) 2019-10-17
MX2019000411A (es) 2019-09-10
TW202343352A (zh) 2023-11-01
KR20190091205A (ko) 2019-08-05
US20190236333A1 (en) 2019-08-01
KR102338904B1 (ko) 2021-12-13
TWI776010B (zh) 2022-09-01
EP3518147A1 (en) 2019-07-31
CA3029507A1 (en) 2019-07-26
CN110084261A (zh) 2019-08-02
JP6942741B2 (ja) 2021-09-29
US20210034838A1 (en) 2021-02-04
CN113989603A (zh) 2022-01-28
EP4206653A1 (en) 2023-07-05

Similar Documents

Publication Publication Date Title
KR102569560B1 (ko) 분광 분류를 위한 감소된 거짓 양성 식별
KR102461384B1 (ko) 분광 정량화를 위한 감소된 오긍정 식별
CN106483083B (zh) 使用光谱学的识别
US20230273121A1 (en) Outlier detection for spectroscopic classification
EP4033419A1 (en) Outlier detection for spectroscopic classification

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal