KR20210151184A - 샘플 분류를 위한 방법 및 시스템 - Google Patents

샘플 분류를 위한 방법 및 시스템 Download PDF

Info

Publication number
KR20210151184A
KR20210151184A KR1020217036810A KR20217036810A KR20210151184A KR 20210151184 A KR20210151184 A KR 20210151184A KR 1020217036810 A KR1020217036810 A KR 1020217036810A KR 20217036810 A KR20217036810 A KR 20217036810A KR 20210151184 A KR20210151184 A KR 20210151184A
Authority
KR
South Korea
Prior art keywords
sample
data
measurement
groups
group
Prior art date
Application number
KR1020217036810A
Other languages
English (en)
Inventor
야이르 그로프
드미트리스 도센코
미리트 카갈리츠키
나탈리 탈
나다브 요란
하가이 알론
Original Assignee
시큐리티 매터스 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시큐리티 매터스 엘티디. filed Critical 시큐리티 매터스 엘티디.
Publication of KR20210151184A publication Critical patent/KR20210151184A/ko

Links

Images

Classifications

    • G01N33/389
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/44Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/20Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
    • G01N23/207Diffractometry using detectors, e.g. using a probe in a central position and one or more displaceable detectors in circumferential positions
    • G01N23/2076Diffractometry using detectors, e.g. using a probe in a central position and one or more displaceable detectors in circumferential positions for spectrometry, i.e. using an analysing crystal, e.g. for measuring X-ray fluorescence spectrum of a sample with wavelength-dispersion, i.e. WDXFS
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/22Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material
    • G01N23/223Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material by irradiating the sample with X-rays or gamma-rays and by measuring X-ray fluorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/38Concrete; ceramics; glass; bricks
    • G01N33/381Concrete; ceramics; glass; bricks precious stones; pearls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06K9/6218
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2223/00Investigating materials by wave or particle radiation
    • G01N2223/07Investigating materials by wave or particle radiation secondary emission
    • G01N2223/076X-ray fluorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2223/00Investigating materials by wave or particle radiation
    • G01N2223/30Accessories, mechanical or electrical features
    • G01N2223/304Accessories, mechanical or electrical features electric circuits, signal processing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2223/00Investigating materials by wave or particle radiation
    • G01N2223/30Accessories, mechanical or electrical features
    • G01N2223/305Accessories, mechanical or electrical features computer simulations
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2223/00Investigating materials by wave or particle radiation
    • G01N2223/60Specific applications or type of materials
    • G01N2223/616Specific applications or type of materials earth materials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/14Classification; Matching by matching peak patterns

Abstract

관심 샘플의 모델-기반 분석 및 샘플 분류 관리를 위한 방법 및 시스템이 제공된다. 스펙트럼 선 형상을 갖는 미리 결정된 함수에 기초한 각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, 상이한 샘플이 관련된 M 개의 미리 결정된 그룹의 M 개의 고유 벡터를 나타내는 데이터, 및 M 개의 그룹에 대한 공통 가중치 벡터를 나타내는 데이터를 포함하는 미리 결정된 모델링 데이터가 제공된다. 데이터 프로세서는 상기 데이터를 이용하고, 상기 미리 결정된 모델링 데이터를 사용하여 관심 샘플의 측정된 기준 스펙트럼에 모델-기반 처리를 적용하고, 상기 M 개의 미리 결정된 그룹 중 하나에 대한 상기 특정 관심 샘플의 관계를 나타내는 분류 데이터를 생성하도록 작동한다.

Description

샘플 분류를 위한 방법 및 시스템
본 발명은 샘플 측정의 모델링 및 모델-기반 분석 및 샘플 분류 분야에 관한 것이다.
발명자들은 다양한 산업, 특히 다이아몬드와 같은 광물, 보석과 같은 대상물(object)의 제조 및 유통을 다루는 산업에서, 공통 또는 유사한 특성을 가진 대상물/샘플의 특정 그룹과 관련하여 관심의 대상물/샘플을 식별/분류할 필요가 있을 수 있음을 발견하였다. 이들은 개체 발생 영역의 하나 이상의 구조적 매개변수 및/또는 개체 발생 영역의 지리적 위치가 포함될 수 있다.
본 발명자들은 또한 동일한 그룹(즉, 미리 정의된 그룹 관련 또는 그룹 고유 특성을 갖는 그룹)과 관련된 대상물이 대상물의 스펙트럼에 의해 하나 이상의 다른 그룹과 구별되는 방식으로 분류될 수 있음을 발견하였다. 예를 들어, 그러한 스펙트럼 데이터는 X선 또는 감마선 방사선에 대한 대상물/샘플의 X선 형광(XRF) 응답을 나타낼 수 있다.
따라서, 본 발명의 기술은 측정된 스펙트럼 데이터를 기반으로 관심 샘플을 관련 그룹으로 분류하는 데 사용할 신규 모델 데이터의 생성을 가능하게 하는 신규 모델링 기법을 제공한다. 즉, 본 발명은 측정된 스펙트럼/스펙트럼들에 기초하여 다수의 미리 정의된 그룹 중 하나에 관심 샘플을 연관시키기 위한 특정의 새로운 모델-기반 접근 방식을 제공한다.
따라서, 본 발명의 하나의 광범위한 양태에 따르면, 미리 결정된 상이한 특성을 갖는 2개 또는 그 초과의 상이한 그룹에 관한 기준 샘플에 관한 특정 기준 스펙트럼 데이터의 분석, 및 모델링 데이터(modeled data)의 생성을 포함하는, 관심 샘플의 모델-기반 분석(model-based analysis)을 위한 방법이 제공된다. 더 구체적으로, 상기 방법은:
미리 결정된 상이한 특성을 갖는, M 개의 그룹과 관련된 복수의 N 개의 기준 샘플에 수행된 K 개의 측정 방식의 스펙트럼 측정을 나타내는 기준 데이터를 제공하는, 단계로서, 상기 기준 데이터는 복수의 (NxK) 측정된 기준 스펙트럼을 포함하는 원시 측정 데이터(raw measured data)를 포함하고 상기 M 개의 그룹 중 각각의 그룹에 대한 기준 샘플 각각의 대응을 나타내는 데이터를 포함하는, 단계;
상기 복수의 (NxK) 측정된 기준 스펙트럼을 처리하여 상기 K 개의 측정 방식에 각각 대응하는 K 개의 모델을 결정하는 단계로서, 상기 모델은 스펙트럼 선 형상을 갖고 각각의 측정 방식과 관련된 미리 결정된 함수(function)에 기초하는, 단계;
각각의 측정 방식에 대응하는 N 개의 측정된 기준 스펙트럼 각각에 상기 K 개의 모델 각각을 피팅(fitting)하고, 기준 샘플 각각에 대해, 상기 K 개의 측정 방식에 대한 샘플의 기준 스펙트럼의 벡터 표현(vector representation)을 생성하여, 각각의 성분 벡터에 의해 상기 기준 샘플 각각을 나타내는, 단계;
상기 M 개의 그룹들 각각에 대한 각각의 샘플의 대응을 나타내는 상기 데이터를 이용하고, 각각의 그룹에 대해, 상기 그룹에 관련된 샘플들의 성분들의 벡터를 분석하고, 상기 그룹의 고유 벡터(characteristic vector)를 나타내는 데이터를 결정하는, 단계; 및
기준 샘플의 성분 벡터와 그룹의 고유 벡터 사이의 거리 함수에 기초하여, 기준 샘플의 모든 성분 벡터를 각각의 그룹과 연관시키기 위한 조합 가능성을 최대화하는 거리 함수의 가중치 매개변수를 결정하여, 상기 거리 함수의 상기 가중치 매개변수의 공통 벡터를 제공하는, 단계;
각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, 상기 그룹의 고유 벡터를 나타내는 데이터, 및 M 개의 그룹에 대한 공통 가중치 벡터를 나타내는 데이터를 포함하는 모델링 데이터를 저장하여, 상기 모델링 데이터를 이용하여 관심 샘플의 원시 측정된 기준 스펙트럼의 모델-기반 분석에 의해, 상기 M 개의 그룹들 중 하나의 그룹에 관련되도록 관심 샘플을 분류하도록 하는 단계를 포함한다.
하나 이상의 측정 방식을 사용하여 수행된 상기 샘플의 원시 측정된 기준 스펙트럼로부터 관심 샘플(소위 "알 수 없는 샘플(unknown sample)")의 분류는:
상기 관심 샘플의 원시 측정된 기준 스펙트럼에 기초하여, K 개의 측정 방식하에서 각각의 관심 샘플의 K 개의 측정된 스펙트럼에 대응하는 K 개의 데이터 피스(data piece)가 결정되고,
상기 K 개의 데이터 피스에 모델-기반 분석이 적용되고,
상기 모델-기반 분석은:
저장된 K 개의 모델을 사용하고, 상기 저장된 K 개의 모델들 중 각각의 하나에 대한 관심 샘플에 상기 K 개의 측정된 스펙트럼 각각을 피팅하고, K 개의 측정된 스펙트럼 각각에 대한 최상의 피팅(fitting) 상태를 기초로 하여, 상기 K 개의 측정 방식 모두의 샘플의 조합된 벡터 표현을 생성하고;
상기 그룹의 고유 벡터 각각에 대한 상기 샘플의 조합된 벡터 표현의 거리를 결정하도록 상기 공통 가중치 벡터를 상기 거리 함수에 적용하고 상기 결정된 거리가 최소인 그룹을 상기 샘플과 연관된시키는 것을 포함한다.
일반적으로, 본 발명의 기술은 적절한 모델링 데이터의 생성을 제공할 뿐만 아니라 미지의 샘플을 적절하게 분류하는 것을 제공한다. 그러나 바람직하게는 둘 또는 그 초과의 상이한 측정 방식이 사용된다. 측정 방식/조건은 하나 이상의 매개변수에서 서로 상이할 수 있다. 일부 실시예에서, 이러한 매개변수는 1차 방사선 세기, 1차 방사선에서 광자의 에너지 분포 다음 중 하나 이상을 포함할 수 있다(이는 1차 방사선을 방출하는 튜브의 전류 및 전압 및/또는 방사선 방출 소스(source)에서의 필터에 의해 설정될 수 있다). 추가로 또는 대안적으로, 1차 방사선 신호의 시준, 조사 지점의 크기, 방사선 응답 신호의 필터링, 방사선 소스의 기하학적 구성, 샘플의 표면 및 방사선 소스 및/또는 방사선 검출기의 상대적 배향 및 수용(예를 들면, 샘플의 표면, 방사선 소스, 및 검출기 사이의 각도 및 거리) 중 하나 이상의 변형이 상이한 측정 방식으로 이용될 수 있으며, 스펙트럼의 측정에 영향을 미칠 수 있고 상이한 측정 조건을 생성하도록 변화될 수 있다. 더욱이, 측정되는 일부 스펙트럼 또는 모든 스펙트럼에 대해, 상기 샘플은 하나 이상의 축선 주위로 회전될 수 있어 다양한 샘플 배향 동안 샘플로부터 방출된 방사선 부분의 계수가 단일 스펙트럼에 수집될 수 있다.
측정 방식별로 생성된 모델은 스펙트럼 선 형상의 미리 결정된 함수를 기반으로 하는 혼합 모델로 구성되며, 특정 피스와이즈(piecewise)(또는 하이브리드) 함수는 피스와이즈 선형 또는 피스와이즈 다항식 함수이다. 스펙트럼 선 형태를 갖는 이러한 함수는 로렌츠(Lorentzian), 가우스(Gaussian), 및/또는 보이드(Voigt) 함수를 포함할 수 있다.
그룹의 고유 벡터는 동일한 그룹의 기준 샘플을 나타내는 성분의 벡터에 있는 성분의 평균값을 포함한다. 거리 함수는 평균 값 및 표준 편차와 연관되어 성분 벡터에서 성분값의 확산량을 기술한다.
K 개의 모델을 결정하기 위한 복수의 (NxK) 측정된 기준 스펙트럼의 처리는 다음과 같이 수행될 수 있다:
i번째 측정 방식(i=1, ..., K)에 대응하는 N 개의 기준 샘플의 i번째 복수의 측정된 기준 스펙트럼 각각에 대해, 평균 측정된 기준 스펙트럼이 결정되고; 그리고
스펙트럼 선 형상을 갖는 미리 결정된 함수에 따라 각각의 i번째 평균 측정된 기준 스펙트럼에 미리 결정된 변환을 적용하여 i번째 측정 방식에 대응하는 각각의 i번째 모델을 획득하고, 이에 의해 K 개의 측정 방식에 대한 K 개의 모델을 획득한다.
본 발명의 다른 광범위한 양태에 따르면, 샘플에 대한 측정을 모델링하기 위한 데이터 분석 시스템을 제공한다. 시스템에는 측정 시스템(예: X선 또는 감마선 방사선에 대한 샘플의 X선 형광(XRF) 응답 측정용)과 측정된 기준 데이터를 기반으로, 관심 샘플의 추가 분류를 가능하게 하는 모델링 데이터를 결정하도록 구성되고 그리고 작동 가능한 제어부를 포함한다. 보다 구체적으로, 측정 시스템은 K 개의 측정 방식하에서 미리 결정된 상이한 특성의 M 개의 그룹과 관련된 복수의 N 개의 기준 샘플에 대한 스펙트럼 측정을 수행하고 상기 M 개의 그룹과 관련된 복수의 (NxK) 측정된 기준 스펙트럼을 포함하는 측정된 기준 데이터를 생성하도록 구성되고 그리고 작동 가능하다. 상기 제어 시스템은:
상기 복수의 (NxK) 측정된 기준 스펙트럼을 처리하고 상기 K 개의 측정 방식에 각각 대응하는 K 개의 모델을 결정하도록 구성되고 그리고 작동 가능하고 상기 모델은 스펙트럼 선 형상을 갖는 미리 결정된 함수에 기초하고 각각의 측정 방식과 관련되는, 모델 생성 모듈;
상기 K 개의 모델 각각에 대해, 각각의 측정 방식에 대응하는 N 개의 측정된 기준 스펙트럼 각각으로 상기 모델을 피팅하고; 기준 샘플 각각에 대해, 상기 K 개의 측정 방식에 대한 샘플의 기준 스펙트럼의 벡터 표현을 생성하여, 각각의 성분 벡터에 의해 기준 샘플 각각을 나타내는 단계를 수행하도록 구성되고 그리고 작동 가능한, 피팅 모듈;
상기 M 개의 그룹의 각각의 하나에 대한 기준 샘플 각각의 대응을 나타내는 데이터를 이용하고, 각각의 그룹에 대해, 상기 그룹에 관련된 샘플의 성분 벡터를 분석하고, 상기 그룹의 고유 벡터를 나타내는 데이터를 결정하도록 구성되고 그리고 작동 가능한, 그룹 특성화 모듈;
상기 기준 샘플의 성분 벡터와 상기 그룹의 고유 벡터 사이의 거리 함수에 기초하여, 상기 기준 샘플의 성분 벡터들 모두를 각각의 그룹과 관련시키기 위한 조합 가능성을 최대화하는 거리 함수의 가중치 매개변수를 결정하여 상기 거리 함수의 가중치 매개변수의 공통 벡터를 제공하는, 가중치 모듈; 및
상기 모델링 데이터가 각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, 상기 그룹의 고유 벡터를 나타내는 데이터, 및 M 개의 그룹에 대한 공통 가중치 벡터를 나타내는 데이터를 포함하는, 저장될 상기 모델링 데이터를 생성하도록 구성되고 그리고 작동 가능한 출력 유틸리티를 포함한다.
본 발명은 더욱 광범위한 양태에서 샘플 분류 시스템을 제공하며, 샘플 분류 시스템은:
K 개의 측정 방식하에서 샘플에 대한 스펙트럼 측정을 수행하고, 각각의 측정 샘플에 대해, K 개의 측정 방식에 대응하는 측정된 스펙트럼을 나타내는 K 개의 측정 데이터 피스를 포함하는 측정된 기준 스펙트럼를 생성하도록 구성되고 그리고 작동 가능한, 측정 시스템;
관심 샘플의 측정된 기준 스펙트럼를 수신하기 위해 상기 측정 시스템과 통신하도록 구성되고 그리고 작동 가능하고, 스펙트럼 라인 형상을 갖는 미리 결정된 함수에 기초하여 각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, 상이한 샘플이 관련하는 M 개의 미리 결정된 그룹의 M 개의 고유 벡터를 나타내는 데이터, 및 M 개의 그룹에 대한 공통 가중치 벡터를 나타내는 데이터를 포함하는 미리 결정된 모델링 데이터를 저장하는 메모리와 통신하도록 구성되고 그리고 작동 가능한 제어 시스템으로서, 상기 미리 결정된 모델링 데이터를 사용하여 관심 샘플의 수신된 측정된 기준 스펙트럼에 모델-기반 처리를 적용하고 상기 M 개의 미리 결정된 그룹 중 하나에 상기 특정 관심 샘플의 관계를 나타내는 분류 데이터를 생성하도록 구성되고 그리고 작동 가능한 데이터 프로세서를 포함하는, 제어 시스템을 포함한다.
일부 실시예에서, 제어 시스템은:
상기 K 개의 측정된 스펙트럼 각각에 대해, 상기 측정된 스펙트럼을 상기 각각의 모델에 피팅하고 K 개의 최상의 피트 상태 스펙트럼을 얻고 상기 K 개의 측정 방식 모두에 대해 관심 샘플의 조합된 벡터 표시를 생성하도록 상기 K 개의 최상의 피트 상태 스펙트럼을 사용하는 것을 수행하도록 구성되고 그리고 작동 가능한, 피팅 모듈; 및
상기 공통 가중치 벡터로 미리 결정된 거리 함수를 이용하고 상기 M 개 그룹의 상기 M 개의 고유 벡터 각각에 상기 관심 샘플의 조합된 벡터 표시의 거리를 결정하고,상기 관심 샘플에 상기 결정된 거리가 최소인 그룹을 연관시키도록 구성되고 그리고 작동 가능한 분류기 모듈을 포함한다.
일부 실시예에서, 제어 시스템은 상기 M 개의 그룹에 관련된 복수의 N 개의 기준 샘플에 수행되는 상기 K 개의 측정 방식에 대한 스펙트럼 기준 측정치에 대응하는 상기 측정된 기준 스펙트럼를 기초로 하여, 상기 미리 결정된 모델링 데이터를 결정하도록 더 구성되고 그리고 작동 가능하고, 상기 스펙트럼 기준 데이터는 복수의 (NxK) 측정된 기준 스펙트럼을 포함하고 상기 M 개의 그룹 중 각각의 하나의 그룹에 대한 상기 기준 샘플 각각의 대응을 나타내는 데이터를 포함한다. 상기 제어 시스템은:
상기 복수의 (NxK) 측정된 기준 스펙트럼을 처리하고 상기 K 개의 측정 방식에 대응하는 K 개의 모델을 결정하도록 구성되고 그리고 작동 가능한, 모델 생성 모듈, 상기 K 개의 모듈 각각에 대해, 상기 모델을 상기 각각의 측정 방식에 대응하는 상기 N 개의 측정된 기준 스펙트럼 각각과 피팅하고, 기준 샘플 각각에 대해, 상기 K 개의 측정 방식에 대한 상기 샘플의 기준 스펙트럼의 벡터 표시를 생성하도록 구성되고 그리고 작동 가능하여 각각의 성분 벡터에 의한 상기 기준 샘플 각각을 나타내는, 피팅 모듈;
상기 M 개의 그룹들 중 각각의 하나의 그룹에 상기 기준 샘플 각각의 대응을 표시하는 데이터를 이용하고, 각각의 그룹에 대해, 상기 그룹에 관련하는 샘플의 성분 벡터를 분석하고 상기 그룹의 고유 벡터를 나타내는 데이터를 결정하도록 구성되고 그리고 작동 가능한, 그룹 특성화 모듈; 및
상기 기준 샘플의 성분 벡터와 상기 그룹의 고유 벡터 사이의 거리 함수를 기초로 하여, 상기 기준 샘플의 성분 벡터 모두를 각각의 그룹과 연관시키기 위한 조합 가능성을 최대화하는 미리 결정된 거리 함수의 가중치 매개변수를 결정하도록 구성되고 그리고 작동 가능하여, 상기 거리 함수의 상기 가중치 매개변수의 상기 공통 벡터를 제공하는, 가중 모듈을 포함한다.
본 발명의 또 다른 광범위한 양태에 따라, 샘플 분류를 관리하는 데 사용하기 위한 제어 시스템을 제공한다. 상기 제어 시스템은 관심 샘플의 측정된 기준 스펙트럼를 수신하기 위해 측정 데이터 제공기와 통신하도록 구성되고 그리고 작동 가능하며, 스펙트럼 라인 형상을 갖는 미리 결정된 함수를 기초로 하여 각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, 상이한 샘플이 관련하는 M 개의 미리 결정된 그룹의 M 개의 고유 벡터를 나타내는 데이터, 및 M 개의 그룹에 대한 공통 가중치 벡터를 나타내는 데이터를 포함하는 미리 결정된 모델링 데이터를 저장하는 메모리와 통신하도록 구성되고 그리고 작동 가능하다. 제어 시스템은 상기 미리 결정된 모델링 데이터를 사용하여 관심 샘플의 수신된 측정된 기준 스펙트럼에 모델-기반 처리를 적용하고, 상기 M 개의 미리 결정된 그룹 중 하나에 대한 상기 특정 관심 샘플과의 관계를 나타내는 분류 데이터를 생성하도록 구성되고 그리고 작동 가능하다.
본 명세서에 개시된 요지를 더 잘 이해하고 그것이 실제로 어떻게 수행될 수 있는지를 예시하기 위해, 실시예는 이제 첨부 도면을 참조하여 비제한적인 예로서 설명될 것이다.
도 1은 샘플을 분류하기 위한 모델링 데이터의 생성을 위한 본 발명의 데이터 분석 시스템의 블록도이고,
도 2a는 모델링 데이터의 생성에 사용되는 기준 스펙트럼 데이터를 예시하는 블록도이고,
도 2b는 샘플의 성분 표현의 벡터로 변환된 샘플의 스펙트럼 데이터를 예시하는 블록도이고,
도 3은 기준 스펙트럼 데이터를 사용하고 모델링 데이터를 생성하여 사용하기 위한 본 발명의 방법을 예시하는 흐름도이고,
도 4는 본 발명의 방법에 의해 생성된 모델링 데이터를 사용하여 샘플의 원시 측정된 기준 스펙트럼의 모델-기반 처리에 의해 샘플을 분류하기 위한 본 발명의 방법의 흐름도이고,
도 5는 분류되지 않은 샘플을 클러스터링하기 위한 본 발명의 방법의 주요 단계의 흐름도이다.
본 발명은 유사/관련 샘플의 특징적인 그룹과 관련된/연관된 샘플의 측정된 스펙트럼에 기초하여 샘플을 분류하기 위한 새로운 접근 방식을 제공한다. 위에서 설명한 바와 같이, 광물, 보석(특히 다이아몬드)과 같은 일부 유형의 샘플/대상은 특정 그룹과의 연관성/관계로 식별해야 한다. 그룹은 샘플 생성 영역의 하나 이상의 구조적 매개변수 및/또는 샘플 생성 영역의 지리적 위치로 설명할 수 있다. 동일한 그룹(즉, 미리 정의된 그룹 관련 및 그룹 고유 특성을 갖는 그룹)과 관련된 샘플은 하나 이상의 다른 그룹의 샘플/스펙트럼과 구별되는 방식으로 스펙트럼 데이터를 기반으로 분류될 수 있다.
본 발명은 샘플의 원시 측정된 기준 스펙트럼를 기반으로 관심 샘플을 관련 그룹으로 분류하는 데 사용할 신규 모델링 데이터를 생성하기 위한 신규 기술을 제공한다.
샘플을 분류하기 위해 추가로 사용될 모델링 데이터의 생성을 위한 본 발명의 데이터 분석 시스템(10)을 블록도에 의해 도시하는 도 1을 참조한다. 상기 시스템(10)은 측정 데이터 제공기(12)와의 데이터 통신을 위해 구성된 제어 시스템이다. 상기 제어 시스템(10)은 일반적으로 컴퓨터 시스템이며, 측정 데이터 제공기의 부분이 되거나/통합될 수 있거나, 또는 임의의 공지된 적절한 통신 기술 및 데이터 프로토콜을 이용하여, 예를 들어 클라우드 컴퓨팅 기술을 사용하여 통신 네트워크를 통해 상기 측정 데이터 제공기와 통신할 수 있다. 원격 엔티티들 사이의 데이터 통신 네트워크 및 프로토콜의 구성 및 작동은 자체적으로 주지되고 본 발명의 일 부분을 형성하지 않고 이에 따라 상세하게 설명될 필요가 없다.
측정 데이터 제공기는 비제한적인 본 예에 도시된 바와 같이 측정 시스템 자체(14)에 의해 구성될 수 있거나, 임의의 공지된 적절한 통신 기술을 사용하여 측정 시스템과 데이터 통신하는 별도의 저장 장치일 수 있다. 이 특정 예에 도시된 바와 같이, 측정 시스템(14)은 방사선 소스(14A), 방사선 검출기(14B), 제어기(14C), 및 샘플 지지 유닛(14D)을 포함한다.
구체적으로 나타내지는 않았지만 측정 시스템은 측정 절차를 관리하기 위한 다양한 다른 유닛 및 하드웨어/소프트웨어 유틸리티를 포함할 수도 있으며, 이는 본 발명의 일부를 형성하지 않으므로 다음을 제외하고는 구체적으로 설명할 필요가 없으며, 본 발명의 목적을 위해, 모델링 데이터의 생성에 필요한 측정 데이터는, 각각의 샘플에 대해, 서로 다른 측정 조건/방식에서 얻은 미리 결정된 수 K(K≥1) 측정된 스펙트럼을 포함한다. 일반적으로 단일 측정 방식(K=1)을 사용한 측정은 모델링 데이터 생성에 충분할 수 있다. 그러나 스펙트럼 측정 및 다양한 형상과 기하학의 체적 샘플을 처리할 때 서로 다른 측정 방식에 해당하는 다중 스펙트럼을 제공하는 것이 바람직하다.
일부 실시예에서, 표면 및/또는 부피 내에 다양한 표시가 있을 수 있는 보석, 특히 다이아몬드에 대한 측정에 적합한 스펙트럼 데이터는 X-선 또는 감마-선 방사선에 대한 샘플의 X-선 형광(XRF) 반응을 나타낼 수 있다. 따라서, 방사선 소스(14A)는 1차 여기 방사선에 의해 샘플을 조사하여 샘플로부터 2차 X-선 형광(X-ray Fluorescence; XRF) 응답의 방출을 유도하도록 구성된 X선 또는 감마선 방사선 소스일 수 있으며, 방사선 검출기(14B)는 X선 형광(XRF)의 검출 및 검출된 방사선을 나타내는 측정된 기준 스펙트럼의 생성을 위해 구성된다. 이러한 측정 시스템은 예를 들어 WO16157185호, WO17175219호, WO18051353호에 기술되어 있으며, 모두 본 출원의 양수인에게 양도되고 참조로서 여기에 포함된다.
다른 측정 방식을 설정하는 매개변수/조건은 다음 중 하나 이상을 포함할 수 있다: 1차 방사선의 매개변수(예를 들어, 1차 방사선에서 세기, 시준, 스폿 크기, 1차 방사선에서 광자의 에너지 분포); 검출될 제 2 방사선의 필터링 매개변수/조건뿐만 아니라 예를 들어 하나 이상의 축선을 중심으로 샘플의 지지 유닛(14D)의 회전에 의해 달성되는 방사선 소스 및/또는 검출기에 대한 샘플의 배향(다양한 샘플 배향으로부터의 계수가 단일 스펙트럼 내에 수집되도록). 따라서, 지지 유닛(14D)이 측정 평면 내의 위치를 조정하고 뿐만 아니라 방사선 소스 및/또는 검출기에 대해 측정 평면의 위치를 조정하기 위해 하나 이상의 드라이버와 관련될 수 있다는 것이 이해되어야 한다. 또한, 방사선 소스(14A)는 소스의 작동 매개변수(예를 들어, 1차 방사선을 방출하는 관의 전류 및/또는 전압, 및/또는 필터)를 조정/변경하기 위한 하나 이상의 드라이버와 연관될 수 있고뿐만 아니라 검출기(14B)는 방사선 검출기의 입력에서 필터를 작동/변동시키기 위한 필터링 어셈블리와 연관될 수 있다. 추가적으로, 방사선 소스 및 검출기의 기하학적 특성은 시스템 성능을 개선/최적화하기 위해 가변/조정 가능할 수 있다. 이러한 기하학적 특성은 X선 소스로부터 샘플의 미리 결정된 표면 영역까지의 거리; 이 표면 영역에서 검출기(검출 평면)까지의 거리; 조사 채널의 각도 방향(X선 소스(1차 빔 전파 축선)에서 전파하는 1차 X선 빔과 샘플 표면 사이의 각도); 및 수집/검출 채널의 각도 방향(샘플(2차 빔 축선)에서 검출기와 샘플 표면을 향하는 2차 X선 방사선 사이의 각도) 하나 이상을 포함할 수 있다.
따라서, 시스템 제어기(14C)는 K 개의 측정 방식 각각을 정의하고 그에 따라 각각의 샘플에 대한 측정 세션을 작동하기 위해 측정 시스템의 요소의 상기 예시된 매개변수/조건 중 임의의 것을 변경/조정하도록 구성되고 그리고 작동 가능하다.
모델링 데이터를 생성하는 동안, 스펙트럼 측정은 소위 "기준 샘플(reference samples)"에 대해 수행되므로 도면에서 측정 데이터를 "기준 데이터(reference data)"라고 한다. 기준 샘플은 특정 그룹과의 연관성이 공지된 샘플이다.
따라서, 측정 시스템(12)은 스펙트럼 측정을 N 개의 기준 샘플에 적용하도록 작동하며, 각각의 샘플은 K 개의 상이한 측정 방식으로 측정된다. 이 N 개의 기준 샘플은 M 개의 그룹과 관련된 샘플을 포함하며, 각각의 g번째 그룹(g=1,...,M)은 미리 결정된 서로 다른(그룹 고유/관련) 특성을 갖는다. 따라서, 일반적으로, 제 1 그룹(G1)은 n1개의 샘플을 포함하고 제 2 그룹(G2)은 n2개의 샘플을 포함하며 M번째 그룹(GM)은 nM 개의 샘플을 포함하며, 여기서,
Figure pct00001
제어 시스템(10)에 입력(액세스)되는 기준 데이터(측정 시스템 또는 저장 장치로부터 직접)는 (NxK) 측정 데이터 피스를 포함한다, 즉:
Figure pct00002
.
각각의 데이터 피스는 기준 샘플(RS)의 스펙트럼 응답을 나타낸다/해당된다. 따라서 도 2a에 도시된 바와 같이, 표준 측정 데이터에는 다음이 포함된다:
그룹(G1)에 대해:
Figure pct00003
그룹(G2)에 대해,
Figure pct00004
그룹(Gm)에 대해,
Figure pct00005
여기에서 인덱스는 다음과 같다는 것을 이해해야 합니다:
Figure pct00006
, 여기서 위 첨자 인덱스 i는 i번째 측정 방식(i=1,...,K)에 해당하고 아래 첨자 인덱스 n 및 g는 g번째 그룹의 n번째 샘플에 해당한다. 따라서 예를 들어
Figure pct00007
는 측정 방식 2에 따라 측정된 그룹 4의 샘플 3의 기준 스펙트럼을 나타낸다.
분류되어야 하는 공지되지 않은 관심 샘플에 대해 유사한 측정이 수행된다는 것을 이해해야 하며 아래에서 더 설명될 것이다. 따라서, 이러한 미지의 샘플의 경우, 측정된 기준 스펙트럼는 모델링 데이터 생성에 사용되는 다른 측정 방식에 해당하는 K 개의 스펙트럼을 포함한다.
전술한 바와 같이, 제어 시스템(10)은 데이터 입력 및 출력 유틸리티(16, 18); 메모리(20); 및 데이터 프로세서(22)를 포함하는 컴퓨터 시스템으로서 구성된다. 데이터 프로세서는 모델 생성 모듈(22A), 피팅 모듈(22B), 그룹 특성화 모듈(22C), 및 가중 모듈(22D)을 포함한다. 수신되는 기준 스펙트럼 데이터는 일반적으로 메모리(20)에 저장되고, 그 후 프로세서(22)에 의해 사용되어 모델링 데이터를 생성한다.
모델 생성 모듈(22A)은 (NxK) 측정된 기준 스펙트럼을 처리하고 K 개의 측정 방식 각각에 대한 모델, 즉 샘플의 스펙트럼 응답을 설명하는 K 개의 모델을 결정하도록 사전 프로그래밍된다. 이 모델은 스펙트럼 선 형상을 갖고 각각의 측정 방식과 관련된 미리 결정된 함수를 기반으로 한다. 스펙트럼 선 형상의 이러한 미리 결정된 함수는 예를 들어 로렌츠 함수, 가우스 함수 또는 보이그 함수를 포함할 수 있으며, 그의 매개변수는 라인 위치, 최대 높이 및 폭(또는 절반 폭)을 포함한다. 아래에서 더 설명되는 바와 같이, 모델은 스펙트럼 라인 모양의 미리 결정된 함수 및 특정 피스와이즈 선형 함수를 포함할 수 있다. 모델 생성 프로세스는 도 3을 참조하여 아래에서 더 구체적으로 설명된다.
피팅 모듈(22B)은 반복적인 피팅 절차에서 각각의 측정된 기준 스펙트럼을 대응하는 측정 방식의 모델과 비교하도록 구성된다. 피팅 동안 모델 매개변수는 최적 피팅 조건을 통해 최적화되고 각 기준 스펙트럼에 대한 벡터 표현이 결정된다. 다시 말해서, 각각의 기준 샘플은 각각의 성분 벡터로 표현된다. 이러한 성분 벡터 표현은 모든 K 개의 측정 방식에 대해 결합된 표현이라는 것을 이해해야 하며 아래에서 더 구체적으로 설명되며, 이것은 샘플의 표현이다.
그룹 특성화 모듈(22C)은 그룹의 고유 벡터를 결정하도록 작동한다. 이를 위해, 모듈은 M 개의 그룹 각각에 대한 기준 샘플 각각의 대응을 나타내는 데이터에 기초하여 샘플 성분의 벡터를 분석한다.
가중 모듈(22D)은 기준 샘플의 성분의 모든 벡터를 그들 각각의 그룹과 연관시키기 위한 결합 가능성의 최대값에 대응하는 성분 벡터의 가중치 매개변수를 결정하도록 구성된다. 이에 의해, 공통 가중치 벡터가 결정된다(모든 그룹에 공통).
그렇게 결정된 데이터는 (i) 각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, (ii) 그룹의 고유 벡터를 나타내는 데이터, 및 (ii) 모든 그룹에 대한 공통 가중치 벡터를 나타내는 데이터를 포함하는 모델링 데이터를 형성한다.
이제 위에서 설명된 바와 같이 획득될 수 있고 M 개의 그룹과 관련된 N 개의 기준 샘플에 대한 K 개의 측정 방식으로 얻어진 기준 스펙트럼을 포함하는, 측정된 기준 데이터로부터 모델링 데이터를 발생/생성하기 위한 본 발명의 방법의 흐름도(100)를 예시하는 도 3을 참조한다. 일반적으로 동일한 샘플과 동일한 측정 방식으로 하나 초과의 스펙트럼을 얻을 수 있다는 점에 유의해야 한다.
따라서, 기준 측정 데이터가 제공되고(단계 102) 측정 시스템 또는 별도의 저장 장치(즉, 측정 데이터 제공기)에서 액세스될 수 있다. 선택적으로, 측정된 스펙트럼의 일부 전처리가 수행될 수 있다. 이것은 각각의 스펙트럼에서 모델링 및/또는 분류가 진행될 관심 영역(들)을 정의하고 및/또는 스펙트럼에서 배경 노이즈 및/또는 아티팩트 신호(artifact signal)를 식별하고 제거하는 것을 목표로 할 수 있다. 선택된 관심 영역은 일반적으로 스펙트럼이 측정되는 측정 조건의 영향을 받을 수 있다. 노이즈 및 아티팩트 신호는 예를 들어, 결정질 물질로 이루어진 샘플의 경우 샘플의 결정질 구조로 인한 X선 회절 피크를 포함할 수 있다. 또한, XRF 스펙트럼의 경우, 이러한 아티팩트 신호에는 방사선 소스, 검출기 또는 샘플 주변(샘플 자체가 아님)에서 발견되는 재료에서 비롯된 피크와 다른 프로세스에서 누적 피크 및 배경 수 또는 신호 발생이 포함될 수 있다. 노이즈 및/또는 아티팩트 신호를 제거하기 위해 스펙트럼을 처리할 목적으로, 임의의 공지된 적절한 기술, 예를 들어 본 출원의 양수인에게 양도되고 본원에 인용에 의해 포함된 전술한 WO16157185호에 기재된 방법이 사용될 수 있다.
따라서, 모델링 데이터 생성을 위해 처리될 기준 측정된 스펙트럼은 사전 처리된 스펙트럼일 수 있을 뿐만 아니라 샘플 관련 스펙트럼 또는 샘플에서 미리 정의된 관심 영역의 스펙트럼일 수 있다. 이러한 사전 처리되거나 참조되지 않은 스펙트럼 데이터는 이제 기준 스펙트럼을 획득하는 데 사용된 K 개의 측정 방식에 대응하는 K 개의 모델을 생성하기 위해 처리 및 분석된다(단계 104). 이를 위해, 각 측정 방식에 대해, 평균화된 스펙트럼을 얻고, 즉, 동일한 측정 방식에 해당하는 기준 스펙트럼에 대해 이러한 모든 스펙트럼을 합산하고 샘플 수로 나누어 평균화된다. 보다 구체적으로, 각각의 i번째 측정 방식(i=1,....K)에 대해:
Figure pct00008
여기서,
Figure pct00009
는 측정 방식에 대응하는 합 스펙트럼이다:
Figure pct00010
따라서 이러한 평균 스펙트럼 K가 결정된다. 각각의 그룹의 평균 스펙트럼은 스펙트럼 선 형상(예: 가우스) 및 배경 함수 AF(예: 피스와이즈 선형 함수 또는 피스와이즈 다항식 함수)를 갖는 미리 결정된 기본 함수(BF)에 따른 변환(T)을 평균 스펙트럼에 적용하여 해당 모델(소위 "혼합 모델")을 생성하기 위해 추가로 처리된다. 보다 구체적으로, 각각의 i번째 측정 방식에 대해:
Figure pct00011
예를 들면, 이러한 변환의 결과는
Figure pct00012
이고,
여기서 AF=B(x)는 배경 함수이고 BF=P(x)는 기본 함수이고, 상기 기본 함수는 일반적으로 메인 함수의 영역의 간격(x)에서 상이한 피크를 갖는 하위 함수(예: 가우스)의 형태이고, 함수의 영역이고 인덱스 j는 기본 함수의 j번째 하위 함수(특정 가우스 /피크를 가짐)에 해당한다.
따라서, K 개의 측정 방식에 대한 K 개의 혼합 모델이 각각 결정된다(단계 104):
Figure pct00013
본 발명의 목적을 위해, 스펙트럼 측정 데이터가 고려되는 경우, 모델은 피크 함수 및 배경 기능을 갖도록 선택된다. 피크 함수는 해당 평균 스펙트럼의 피크를 나타내며 일반적으로 샘플 내의 재료 및 요소와 관련되지만 샘플 내의 다양한 기타 현상 및 프로세스, 샘플 근처(예: 샘플 컵에서), 방사선 소스 또는 검출기에 관련된다. 예를 들어, 이물질에 해당할 수 있는 아티팩트 피크가 방사선 소스에 미리 설정된다.
특정한 비제한적인 실시예에서, 측정된 스펙트럼은 X선 스펙트럼이고 인공물 피크는 콤프턴(Compton) 피크, 레일리(Rayleigh) 피크, 파일업(pileup peak) 피크, 제동복사(Bremsstrahlung) 뿐만 아니라 다른 프로세스에서 유래하는 피크를 포함할 수 있다. 배경 함수는 해당 평균 스펙트럼의 배경을 나타낸다.
따라서, 특정 i번째 측정 조건/방식에서 측정된 평균 스펙트럼에 해당하는 스펙트럼 모델은 다음과 같은 형식일 수 있다:
Figure pct00014
여기서 B(x)는 (입력 광자의) 에너지(x)에 대한 카운트 또는 초당 계수율(counts per second; CPS)에 대한 배경 기여를 나타내는 배경 함수이고; PJ(x)는 광자 에너지(x)의 카운트 또는 CPS에 대한 피크의 기여도를 나타내는 피크 함수이다.
피크 함수는 매개변수 세트로 정의될 수 있다. 실시예에서, 피크 함수는 높이(
Figure pct00015
), 너비(
Figure pct00016
), 및 중심 위치(
Figure pct00017
)와 같은 피크의 매개변수(공간적 특징)에 의해 결정되는 가우스 함수
Figure pct00018
이다.
다른 실시예에서, 피크 함수는 로렌츠 함수이다. 실시예에서 배경 함수 B(x)는 피스와이즈 다항식 함수로 정의된 스플라인이다. 실시예에서, 배경 함수는 지수 다항식이다.
그렇게 결정된 K 개의 모델은 각각의 기준 스펙트럼에 대해 대응하는 성분 벡터를 결정하는 데 사용된다(단계 106). 이는 가장 적합한 조건이 얻어질 때까지 선택된 모델 매개변수(들)의 값(예:
Figure pct00019
, 대부분 기준 스펙트럼의 피크에 해당하는 피크 높이) 이 변화하는 동안, i번째 측정 방식에 해당하는 g번째 그룹의 n번째 샘플의 각각의 기준 스펙트럼
Figure pct00020
를 각각의 i번째 모델에 피팅하여 수행된다. 이에 의해, 특정 측정 방식의 특정 샘플의 기준 스펙트럼에 대응하는 매개변수 세트가 획득된다. 특정 샘플에 해당하는 모든 K 개의 매개변수 세트는 기준 샘플당 단일 매개변수 벡터를 생성하기 위해 조합된다. 이것은 샘플에 적용된 모든 측정 방식에 대한 기준 샘플과 관련된/대표하는 매개변수의 "조합된(combined)" 벡터임을 이해해야 한다.
보다 구체적으로, 피팅은 모델 스펙트럼의 피크의 매개변수를 측정된 스펙트럼으로 조정하여 수행된다. 이를 위해, 피크 함수의 매개변수 중 하나 이상이 선택되고 측정된 기준 스펙트럼과 모델 간의 일치가 얻어지도록 설정된다. 이것은 모델(주어진 측정 조건의)과 피크 함수의 선택된 매개변수에 의해 결정되고 또한 이러한 매개변수에서 불확실성에 의존할 수 있는 측정된 스펙트럼 사이의 거리 측정을 최소화하도록 선택된 매개변수를 설정하여 수행할 수 있다.
선택한 매개변수가 피크 함수의 높이인 실시예에서, 모델과 측정된 스펙트럼(둘 다 동일한 측정 조건에 해당) 사이의 거리는 다음과 같이 정의된다:
Figure pct00021
여기서: yr은 에너지 r의 스펙트럼에서 측정된 값이고; Tr은 동일한 에너지에서 모델(변환 함수)의 해당 값이고;
Figure pct00022
은 측정값의 불확실성(측정 유형에 따라 다름)이고; Tr(모델)의 값은 최적의 조건에 의해 최적화된다. 카운트 또는 초당 카운트로 측정된 피크 높이에 대해, 불확실성은
Figure pct00023
이다.
실시예에서, 피팅은 예를 들어 비선형 최소화에 의해 반복적으로 수행된다. 설정된 피크 함수 Pj(모델(T)에 포함됨)의 하나 이상의 매개변수는 특정 샘플에서 특정 측정 방식으로 취한 스펙트럼에 해당하는 매개변수 벡터의 성분 j로 정의된다. 샘플(s)에 해당하는 성분 벡터는 샘플(s)에 해당하는 모든 스펙트럼의 모든 매개변수/성분을 조합하고 K 개의 서로 다른 측정 조건 및 성분의 단일 결합 벡터에 대한 배경을 특성화하는 매개변수에서 취하여 얻어진다.
실시예에서, 모델의 피크를 나타내는 피크 함수는 가우스 함수이고 샘플의 스펙트럼을 모델에 맞게 설정하는 매개변수는 가우스 hj의 높이이다. 따라서 n번째 샘플에 해당하는 성분의 벡터는 다음과 같은 형식이 된다:
Figure pct00024
여기서 각각의 매개변수/성분 세트(hp, hf, 및 hq)는 상이한 측정 조건 하에서 측정된 스펙트럼에 대응할 수 있고, bl은 배경 매개변수이다.
따라서, N 개의 측정된 기준 샘플을 나타내는 N 개의 성분 벡터(
Figure pct00025
)가 획득된다(단계 106). 이것은 또한 그룹에 대한 기준 샘플과 관련하여 샘플의 성분 표현의 벡터로 변환된 샘플의 스펙트럼 데이터를 보여주는 도 2b에 예시되어 있다.
이렇게 얻은 샘플 관련 성분 벡터 및 그룹에 대한 기준 샘플의 연관에 대한 알려진 데이터는 각각의 그룹에 대한 고유 벡터(CV), 즉 M 개의 그룹에 대한 M 개의 고유 벡터(
Figure pct00026
)를 결정하는데 사용된다(단계 108). 이를 위해 각각의 샘플이 그룹(샘플 클러스터)에 속할 가능성을 추정하는 표현식을 얻기 위해 성분 벡터를 처리한다. 이 추정은 다음과 같이 수행될 수 있다.
분류된 기준 샘플(g번째 그룹에 속함)에 해당하는 성분 벡터의 각각의 성분 j에 대해, 그룹 평균(
Figure pct00027
) 및 그룹 표준 편차(
Figure pct00028
)가 평가된다. 평균 및 표준 편차는 성분 벡터에서 성분값의 확산 정도를 설명하는 거리 함수를 정의한다. 전술한 바와 같이, 그룹의 고유 벡터는 동일한 그룹의 기준 샘플을 나타내는 성분의 벡터에서 성분의 평균값을 포함한다. 거리 함수는 평균값 및 표준 편차와 연관되며, 이는 각각의 분류된 샘플이 각각의 그룹에 속할 가능성(
Figure pct00029
)에 대한 제 1 값을 계산하는 데 사용된다. 이것은 성분별 방식으로 수행될 수 있으며, 여기서 가능성은 g-번째 그룹에 속하는 성분 벡터의 각 성분(샘플(s)과 관련됨)의 확률(
Figure pct00030
)의 곱으로 정의된다.:
Figure pct00031
.
확률(
Figure pct00032
)은 평균(
Figure pct00033
) 및 표준 편차(
Figure pct00034
)에 의존하고 초기에 1로 설정된 음이 아닌 가중치(
Figure pct00035
)에도 의존할 수 있다.
실시예에서 확률은 다음과 같이 정의될 수 있다:
Figure pct00036
그 다음, 모든 그룹에 대한 공통 가중치 벡터가 결정된다(단계 110). 이를 위해 거리 함수의 가중치 매개변수(
Figure pct00037
)는 기준 샘플의 모든 성분 벡터를 각각의 그룹과 연관시키기 위한 결합 가능성을 최대화하는 조건에 따라 결정된다. 이것은 기준 샘플의 성분 벡터와 그룹의 고유 벡터 사이의 거리 함수를 기반으로 결정된다.
보다 구체적으로, 가중치(
Figure pct00038
)에 대한 최적화된(최종) 값은 분류된 샘플을 그룹으로 올바르게 분류하기 위해 확률(Pcorr)을 최적화함으로써 얻어진다. 올바른 분류에 대한 확률은 그룹에 속하는 샘플의 확률에 대한 그룹의 모든 샘플에 대한 제품의 모든 그룹에 대한 제품으로 표현될 수 있다.
Figure pct00039
여기서 샘플(s)이 그룹(g)에 속할 확률은 정규화 가능성으로 정의된다.
Figure pct00040
즉, 가중치의 값은 Pcorr의 값이 최대가 되도록 설정된다. 최적화 프로세스는 모든 비선형 최적화 방법(예: 레벤버그 마퀴드(Levenberg-Marquardt), BFGS, GRG, 진화 방법)으로 수행될 수 있다.
앞서 설명한 바와 같이 가중치(
Figure pct00041
)의 벡터는 K 개의 측정 방식에 대응하는 K 개의 모델 및 그룹의 M 개의 고유 벡터(
Figure pct00042
)와 함께 알 수 없는/분류되지 않은 관심 샘플에 대해 사용되도록 모델링 데이터로서 저장된다.
이와 관련하여, 분류되지 않은 샘플을 분류된 샘플의 그룹과 연관시키기 위한 본 발명의 예시적인 방법의 흐름도(200)를 도시하는 도 4를 지금부터 참조한다.
이를 위해, K 개의 측정 방식에 대응하는 관심 샘플의 원시 측정된 기준 스펙트럼가 제공된다(단계 202). 이러한 측정 데이터는 측정 시스템(14)을 사용하여 전술한 바와 같이 획득될 수 있다. 측정 데이터는 측정 시스템 또는 별도의 저장 장치(일반적으로, 측정 데이터 제공기(12))로부터 직접 제공될 수 있다. 측정 데이터에는 각각 K 개의 측정 방식(
Figure pct00043
)에서 관심 샘플의 K 개의 측정된 스펙트럼에 해당하는 K 개의 데이터 피스가 포함된다.
측정 데이터는 전술한 모델링 데이터를 이용하여 모델-기반의 분석/가공을 거친다. 보다 구체적으로, K 개의 측정된 스펙트럼으로부터 각각의 i번째 측정된 스펙트럼(
Figure pct00044
)은 최적의 적합 조건이 얻어질 때까지 저장된 K 개의 모델의 각각의 i번째 모델에 적합하고, K 개의 측정된 스펙트럼에 대한 이들 최적 적합 조건의 매개변수는 모든 K 개의 측정 방식에 대한 샘플의 조합된 벡터 표현(CVR)을 생성하는 데 사용된다(단계 204). 그런 다음, 이 조합된 벡터 표현(CVR)은 그룹의 고유 벡터(
Figure pct00045
)에 대한 맞춤을 겪어서 그룹 관련 최대 가능성을 결정한다(단계 206). 보다 구체적으로, 샘플의 조합된 벡터 표현(CVR)에 대해, 각각의 그룹에 속하는 가능성(
Figure pct00046
)(가중치에 대한 최종 값 사용)이 결정되고, 가능성이 최대인 그룹은 샘플의 관련/연관 그룹으로 선택된다(단계 208). 이를 위해 위에서 설명한 공통 가중치 벡터와 거리 함수를 사용하여 샘플의 조합된 벡터 표현과 그룹의 고유 벡터 각각까지의 거리를 결정하고 결정된 거리인 최소인 그룹과 샘플을 연관시킨다.
모델(모델 스펙트럼)을 사용하면 차원수(dimensionality)를 줄일 수 있다는 점을 이해해야 한다. 실제로, 원시 데이터(측정된 스펙트럼)에는 약 2000개의 스펙트럼 채널에서 초당 카운트 또는 카운트들이 포함되며, 각각은 (입력 광자의) 에너지 대역에 해당한다. 모델에서, 특정 피크에 속하는 이러한 모든 채널은 함께 그룹화되어 훨씬 적은 수의 피크로 종료된다(각각 예를 들어 가우스 함수로 설명됨). 매개변수의 수를 크게 줄임으로써 연산 능력, 시간 등의 자원을 절감할 수 있다. 또한, 모델-기반 접근 방식은 노이즈 감소를 제공한다. 채널의 카운트(h)의 노이즈는(
Figure pct00047
)이므로, 여러 채널의 카운트를 취하면 신호 대 노이즈 비율이 증가될 것이다.
본 발명은 또한 샘플 간의 대응 또는 상호 관계에 관한 사전 지식 없이, 샘플을 클러스터링, 즉 샘플을 그룹 또는 클러스터로 분류하는 새로운 기술을 제공한다. 이 기술에서는 그룹/클러스터에 대한 "알려진(known)" 기준 샘플의 연결을 사용하여 준비된 모델링 데이터가 없다. 샘플은 샘플에서 방출되는 전자기 신호의 하나 이상의 스펙트럼을 연구하여 분류된다. 이것은 예를 들어 X선 또는 감마선 방사선에 대한 샘플의 X선 형광 반응일 수 있다.
이와 관련하여, 샘플을 클러스터링하기 위한 본 발명의 방법의 흐름도(300)를 예시하는 도 5를 참조한다. 각각의 샘플로부터의 하나 이상의 스펙트럼을 포함하는 샘플의 측정 데이터가 제공되며, 위에서 전술된 모델링 및 분류 기술과 유사하게, 샘플당 측정 데이터는 K 개의 상이한 측정 조건/방식하에 측정된 K 개의 스펙트럼을 포함한다(단계 302). 따라서 N 개의 샘플에 대한 측정 데이터에는 (NxK)개의 스펙트럼이 포함된다.
Figure pct00048
선택적으로, 위에서 설명된 기술과 유사하게, 측정된 스펙트럼은 각 스펙트럼에서 클러스터링이 진행될 관심 영역을 정의하고 스펙트럼에서 배경 노이즈 및/또는 아티팩트 신호를 식별 및 제거하도록 처리된다.
측정 데이터는 위에서 설명된 기술과 유사하게 평균 스펙트럼을 결정하기 위해 처리된다(단계 304). 이를 위해 하나 이상의 합 스펙트럼(sum spectra)이 동일한 측정 방식 대 샘플로부터 도달하는 유입 광자의 측정된 주파수(에너지)의 카운트들(검출기에서의 광자 카운트) 또는 초당 카운트들(CPS)의 합에 각각 대응하여 결정된다.
평균 스펙트럼은 도 1 내지 도 3을 참조하여 위에서 설명된 방식으로 K 개의 측정 방식(단계 306)에 대응하는 모델을 생성하는 데 사용된다. 각각의 측정된 스펙트럼은 해당 모델(즉, 동일한 측정 체계의 스펙트럼 모델)에 맞게 조정되고 각각의 샘플에 대해, 성분 벡터가 결정된다(위에서 설명한 기술과 유사)(단계 308).
이러한 성분 벡터는 샘플을 그룹으로 반복적으로 분류하는 데 사용된다(단계 310). 분류는 클러스터링 알고리즘을 사용하여 수행될 수 있다. 일 실시예에서, 클러스터링은 중심 기반 클러스터링 알고리즘에 의해 구현될 수 있다. 보다 구체적으로, 세트 샘플은 그룹으로 분할되며, 여기서 M 개의 그룹은 샘플에 관한 일부 사전 지식(예: 샘플은 공지된 수의 소스에서 유래할 수 있음)을 기초하여 또는 무작위로 결정된다. 샘플을 그룹에 할당하는 것은 무작위로 수행될 수 있다. 각각의 샘플 클러스터의 중심은 클러스터의 샘플과 관련된 성분 벡터의 각각의 성분 평균을 평가하여 결정된다. 평균의 벡터는 클러스터의 중심으로 정의된다.
특정 실시예에서, 클러스터링은 클러스터링이 반복적으로 진행되는 K-평균 유형 알고리즘에 의해 수행된다. 각각의 반복에서 매개변수의 각각의 벡터와 각각의 중심까지의 거리가 평가된다. 그룹(
Figure pct00049
)의 중심으로부터 벡터(
Figure pct00050
)의 거리는 유클리드 거리 또는 정규화된 유클리드 거리로 정의될 수 있으며, 여기서 예를 들어 각각의 성분의 거리는 성분의 그룹 표준 편차에 의해 정규화된다.
Figure pct00051
성분 벡터는 해당 클러스터(즉, 중심까지)까지의 거리가 가장 짧은 경우 다른 클러스터에 재할당될 수 있다. 벡터 사이의 거리는 유클리드 거리로 정의될 수 있다. 또한, 계층적 클러스터링, 밀도 기반 클러스터링 등과 같은 다른 클러스터링 방법이 사용될 수 있다. 따라서, 본 발명은 샘플을 관련/유사 샘플로 분류/연관하도록 샘플의 측정된 특정 데이터의 모델-기반 분석을 위한 신규 기술뿐만 아니라 모델링 데이터 생성을 위한 새로운 기술을 제공한다. 본 발명의 기술은 샘플/대상을 클러스터링/그룹화하는 것을 다루는 다양한 적용에 사용될 수 있다. 데이터 분석 시스템은 스펙트럼 측정 시스템 또는 별도의 제어 시스템과 통합될 수 있고, 데이처 분석 프로세스는 소위 "온-라인(on-line)" 또는 오프 라인 모드에 수행될 수 있다.

Claims (20)

  1. 관심 샘플의 모델-기반 분석(model-based analysis)을 위한 방법으로서,
    미리 결정된 상이한 특성을 갖는, M 개의 그룹과 관련된 복수의 N 개의 기준 샘플에 수행된 K 개의 측정 방식의 스펙트럼 측정을 나타내는 기준 데이터를 제공하는 단계로서, 상기 기준 데이터는 복수의 (NxK) 측정된 기준 스펙트럼을 포함하는 원시 측정 데이터(raw measured data)를 포함하고 상기 M 개의 그룹 중 각각의 그룹에 대한 기준 샘플 각각의 대응을 나타내는 데이터를 포함하는, 단계;
    상기 복수의 (NxK) 측정된 기준 스펙트럼을 처리하여 상기 K 개의 측정 방식에 각각 대응하는 K 개의 모델을 결정하는 단계로서, 상기 모델은 스펙트럼 선 형상을 갖고 각각의 측정 방식과 관련된 미리 결정된 함수(function)에 기초하는, 단계;
    각각의 측정 방식에 대응하는 N 개의 측정된 기준 스펙트럼 각각에 상기 K 개의 모델 각각을 피팅(fitting)하고, 기준 샘플 각각에 대해, 상기 K 개의 측정 방식에 대한 샘플의 기준 스펙트럼의 벡터 표현(vector representation)을 생성함으로써, 각각의 성분 벡터에 의해 상기 기준 샘플 각각을 나타내는, 단계;
    상기 M 개의 그룹들 중 각각의 하나에 대한 각각의 샘플의 대응을 나타내는 상기 데이터를 이용하고, 각각의 그룹에 대해, 상기 그룹에 관련된 샘플들의 성분들의 벡터를 분석하고, 상기 그룹의 고유 벡터(characteristic vector)를 나타내는 데이터를 결정하는, 단계;
    기준 샘플의 성분 벡터와 그룹의 고유 벡터 사이의 거리 함수에 기초하여, 기준 샘플의 모든 성분 백터를 그의 각각의 그룹과 연관시키기 위한 조합 가능성을 최대화하는 거리 함수의 가중치 매개변수를 결정하여, 상기 거리 함수의 상기 가중치 매개변수의 공통 벡터를 제공하는, 단계;
    각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, 상기 그룹의 고유 벡터를 나타내는 데이터, 및 M 개의 그룹에 대한 공통 가중치 벡터를 나타내는 데이터를 포함하는 모델링 데이터(modeled data)를 저장함으로써, 상기 모델링 데이터를 이용하여 관심 샘플의 원시 측정된 기준 스펙트럼의 모델-기반 분석에 의해, 상기 M 개의 그룹들 중 하나의 그룹에 관련되도록 관심 샘플을 분류하도록 하는 단계를 포함하는, 방법.
  2. 제 1 항에 있어서,
    상기 관심 샘플을 분류하는 단계를 수행하는 단계를 더 포함하고,
    상기 수행 단계는:
    상기 관심 샘플의 원시 측정된 기준 스펙트럼에 기초하여, K 개의 측정 방식하에서 각각의 관심 샘플의 K 개의 측정된 스펙트럼에 대응하는 K 개의 데이터 피스(data piece)를 결정하는, 단계,
    상기 K 개의 데이터 피스에 모델-기반 분석을 적용하는 단계를 포함하고,
    상기 적용하는 단계는:
    저장된 K 개의 모델을 사용하고, 상기 저장된 K 개의 모델들 중 각각의 하나에 대한 관심 샘플에 상기 K 개의 측정된 스펙트럼 각각을 피팅하고, K 개의 측정된 스펙트럼 각각에 대한 최상의 피트 상태를 기초로 하여, 상기 K 개의 측정 방식 모두의 샘플의 조합된 벡터 표현을 생성하는 것을 포함하는 단계;
    상기 그룹의 고유 벡터 각각에 대한 상기 샘플의 조합된 벡터 표현의 거리를 결정하도록 상기 공통 가중치 벡터를 상기 거리 함수에 적용하고, 상기 결정된 거리가 최소인 그룹을 상기 샘플과 관련시키는 단계를 포함하는, 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 측정 방식의 K 개의 수는 적어도 2인, 방법.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 모델은 상기 스펙트럼 선 형상의 미리 결정된 함수와 특정 피스와이즈(piecewise) 다항식 함수에 기초하여 혼합 모델로서 구성되는, 방법.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 거리 함수는 통계 함수인, 방법.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 그룹의 고유 벡터는 동일한 그룹의 기준 샘플을 나타내는 성분 벡터 내의 성분의 평균값을 포함하는, 방법.
  7. 제 6 항에 있어서,
    상기 거리 함수는 벡터의 성분의 평균값 및 표준편차와 연관되어, 성분 벡터 내의 성분의 값의 확산량을 기술하는, 방법.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    상기 K 개의 모델을 결정하기 위해 상기 복수의 (NxK) 측정된 기준 스펙트럼을 처리하는 단계는:
    i번째 측정 방식에 대응하는 N 개의 기준 샘플의 i번째 복수의 측정된 기준 스펙트럼 각각에 대해, 평균 측정된 기준 스펙트럼을 결정하는 단계; 및
    각각의 i번째 평균 측정된 기준 스펙트럼에 스펙트럼 선 형상을 갖는 상기 미리 결정된 함수에 따라 미리 결정된 변환을 적용하여, i번째 측정 방식에 대응하는 각각의 i번째 모델을 획득하고, 이에 의해 K 개의 측정 방식에 대한 K 개의 모델을 획득하는 단계를 포함하는, 방법.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 미리 결정된 함수는 가우스 함수를 포함하는, 방법.
  10. 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
    상기 샘플이 광물, 정밀석(precision stone), 다이아몬드 유형 중 적어도 하나인, 방법.
  11. 제 10 항에 있어서,
    상기 M 개의 그룹의 미리 결정된 상이한 특성은: 샘플 생성 영역(sample origination)의 하나 이상의 구조적 매개변수, 및 샘플 생성 영역의 지리적 위치 중 하나 이상을 포함하는, 방법.
  12. 제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
    상기 샘플의 측정된 스펙트럼 데이터는 X선 또는 감마선 방사선에 대한 샘플의 X선 형광(XRF) 응답을 나타내는, 방법.
  13. 샘플에 대한 측정을 모델링하기 위한 데이터 분석 시스템으로서,
    K 개의 측정 방식하에서, 미리 결정된 상이한 특성의 M 개의 그룹과 관련된 복수의 N 개의 기준 샘플에 대한 스펙트럼 측정을 수행하고, 상기 M 개의 그룹과 관련된 복수의 (NxK) 측정된 기준 스펙트럼을 포함하는 측정된 기준 데이터를 생성하도록 구성되고 그리고 작동 가능한 측정 시스템;
    상기 측정된 기준 데이터에 기초하여, 관심 샘플의 추가 분류를 가능하게 하는 모델링 데이터를 결정하도록 구성되고 그리고 작동 가능한 제어 시스템을 포함하고,
    상기 제어 시스템은:
    상기 복수의 (NxK) 측정된 기준 스펙트럼을 처리하고 상기 K 개의 측정 방식에 각각 대응하는 K 개의 모델을 결정하도록 구성되고 그리고 작동 가능하고, 상기 모델은 스펙트럼 선 형상을 갖고 각각의 측정 방식과 관련되는 미리 결정된 함수에 기초하는, 모델 생성 모듈;
    상기 K 개의 모델 각각에 대해, 각각의 측정 방식에 대응하는 N 개의 측정된 기준 스펙트럼 각각으로 상기 모델을 피팅하고; 기준 샘플 각각에 대해, 상기 K 개의 측정 방식에 대한 샘플의 기준 스펙트럼의 벡터 표현을 생성하여, 각각의 성분 벡터에 의해 기준 샘플 각각을 나타내는 단계를 수행하도록 구성되고 그리고 작동 가능한, 피팅 모듈;
    상기 M 개의 그룹의 각각의 하나에 대한 기준 샘플 각각의 대응을 나타내는 데이터를 이용하고, 각각의 그룹에 대해, 상기 그룹에 관련된 샘플의 성분 벡터를 분석하고, 상기 그룹의 고유 벡터를 나타내는 데이터를 결정하도록 구성되고 그리고 작동 가능한, 그룹 특성화 모듈; 및
    상기 기준 샘플의 성분 벡터와 상기 그룹의 고유 벡터 사이의 거리 함수에 기초하여, 상기 기준 샘플의 성분 벡터들 모두를 그들의 각각의 그룹과 관련시키기 위한 조합 가능성을 최대화하는 거리 함수의 가중치 매개변수를 결정하여 상기 거리 함수의 가중치 매개변수의 공통 벡터를 제공하도록 구성되고 그리고 작동 가능한, 가중치 모듈; 및
    상기 모델링 데이터가: 각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, 상기 그룹의 고유 벡터를 나타내는 데이터, 및 M 개의 그룹에 대한 공통 가중치 벡터를 나타내는 데이터를 포함하는, 저장될 상기 모델링 데이터를 생성하도록 구성되고 그리고 작동 가능한 출력 유틸리티(output utility)를 포함하는, 시스템.
  14. 샘플 분류 시스템으로서,
    K 개의 측정 방식하에서 샘플에 대한 스펙트럼 측정을 수행하고, 각각의 측정 샘플에 대해, K 개의 측정 방식 각각에 대응하는 측정된 스펙트럼을 나타내는 K 개의 측정 데이터 피스를 포함하는 측정된 기준 스펙트럼를 생성하도록 구성되고 그리고 작동 가능한, 측정 시스템;
    관심 샘플의 측정된 기준 스펙트럼를 수신하기 위해 상기 측정 시스템과 통신하도록 구성되고 그리고 작동 가능하고, 스펙트럼 라인 형상을 갖는 미리 결정된 함수에 기초하여 각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, 상이한 샘플이 관련하는 M 개의 미리 결정된 그룹의 M 개의 고유 벡터를 나타내는 데이터, 및 M 개의 그룹에 대한 공통 가중치 벡터를 나타내는 데이터를 포함하는 미리 결정된 모델링 데이터를 저장하는 메모리와 통신하도록 구성되고 그리고 작동 가능한 제어 시스템으로서, 상기 미리 결정된 모델링 데이터를 사용하여 관심 샘플의 수신된 측정된 기준 스펙트럼에 모델-기반 처리를 적용하고 상기 M 개의 미리 결정된 그룹 중 하나에 상기 특정 관심 샘플의 관계를 나타내는 분류 데이터를 생성하도록 구성되고 그리고 작동 가능한 데이터 프로세서를 포함하는, 제어 시스템을 포함하는, 시스템.
  15. 제 14 항에 있어서,
    상기 제어 시스템은:
    상기 K 개의 측정된 스펙트럼 각각에 대해, 상기 측정된 스펙트럼을 상기 각각의 모델에 피팅하고 K 개의 최상의 피트 상태 스펙트럼을 얻고; 그리고 상기 K 개의 최상의 피트 상태 스펙트럼을 이용하여 상기 K 개의 측정 방식 모두에 대해 관심 샘플의 조합된 벡터 표현을 생성하는 것을 수행하도록 구성되고 그리고 작동 가능한, 피팅 모듈;
    상기 공통 가중치 벡터로 미리 결정된 거리 함수를 이용하고, 상기 M 개의 그룹의 상기 M 개의 고유 벡터 각각에 관심 샘플의 상기 조합된 벡터 표현의 거리를 결정하고, 결정된 거리가 최소인 그룹을 상기 관심 샘플과 관련시키도록 구성되고 그리고 작동 가능한, 분류기 모듈을 포함하는, 시스템.
  16. 제 14 항 또는 제 15 항에 있어서,
    상기 제어 시스템은 상기 M 개의 그룹과 관련된 복수의 N 개의 기준 샘플에 수행되는 상기 K 개의 측정 방식에 대한 스펙트럼 기준 측정치에 대응하는 상기 측정된 기준 스펙트럼에 기초하여, 상기 미리 결정된 모델링 데이터를 결정하도록 추가로 구성되고 그리고 작동 가능하고, 상기 스펙트럼 기준 데이터는 복수의 (NxK) 측정된 기준 스펙트럼을 포함하고, 상기 M 개의 그룹의 각각의 하나에 상기 기준 샘플 각각의 대응을 나타내는 데이터를 포함하고,
    상기 제어 시스템은:
    상기 복수의 (NxK) 측정된 기준 스펙트럼을 처리하고 상기 K 개의 측정 방식에 대응하는 K 개의 모델을 결정하도록 구성되고 그리고 작동 가능한, 모델 생성 모듈;
    상기 K 개의 모델 각각에 대해, 상기 각각의 측정 방식에 대응하는 상기 N 개의 측정된 기준 스펙트럼의 각각과 상기 모델을 피팅하고; 기준 샘플 각각에 대해, 상기 K 개의 측정 방식에 대한 상기 샘플의 기준 스펙트럼의 벡터 표현을 생성하여, 상기 각각의 성분 벡터에 의해 상기 기준 샘플 각각을 나타내는 것을 수행하도록 구성되고 그리고 작동 가능한, 피팅 모듈;
    상기 M 개의 그룹의 각각의 하나에 상기 기준 샘플 각각의 대응을 나타내는 데이터를 이용하고, 각각의 그룹에 대해, 상기 그룹과 관련된 샘플의 성분 벡터를 분석하고, 상기 그룹의 고유 벡터를 나타내는 그룹을 결정하도록 구성되고 그리고 작동 가능한, 그룹 특성화 모듈; 및
    상기 그룹의 고유 벡터 및 상기 기준 샘플의 성분 벡터들 사이의 거리 함수에 기초하여, 상기 기준 샘플의 성분 벡터 모두를 이들의 각각의 그룹과 관련하기 위한 조합 가능성을 최대화하는 미리 결정된 거리 함수의 가중치 매개변수를 결정하도록 구성되고 그리고 작동 가능한, 가중치 모듈을 포함하는, 시스템.
  17. 샘플 분류를 관리하는 데 사용하기 위한 제어 시스템으로서,
    상기 제어 시스템은 측정 데이터 제공기(provider)와 통신하여 관심 샘플의 측정된 기준 스펙트럼를 수신하도록 구성되고 그리고 작동 가능하며, 스펙트럼 라인 형상을 갖는 미리 결정된 함수를 기초로 하여 각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, 상이한 샘플이 관련하는 M 개의 미리 결정된 그룹의 M 개의 고유 벡터를 나타내는 데이터, 및 M 개의 그룹을 위한 공통 가중치 벡터를 나타내는 데이터를 포함하는 미리 결정된 모델링 데이터를 저장하는 메모리와 통신하도록 구성되고 그리고 작동 가능하고, 상기 제어 시스템은 상기 미리 결정된 모델링 데이터를 사용하여 관심 샘플의 수신된 측정된 기준 스펙트럼에 모델-기반 처리를 적용하고, 상기 M 개의 미리 결정된 그룹들 중 하나의 그룹으로 상기 특정 관심 샘플의 관계를 나타내는 분류 데이터를 생성하도록 구성되고 그리고 작동 가능한, 제어 시스템.
  18. 제 17 항에 있어서,
    상기 K 개의 측정된 스펙트럼 각각에 대해, 상기 측정된 스펙트럼을 상기 각각의 모델에 피팅하고, K 개의 최상의 피트 상태 스펙트럼을 얻고; 그리고 상기 K 개의 최상의 피트 상태 스펙트럼을 사용하여 상기 K 개의 측정 방식 모두에 대해 관심 샘플의 조합된 벡터 표시를 생성하는 것을 수행하도록 구성되고 그리고 작동 가능한, 피팅 모듈; 및
    상기 공통 가중치 벡터로 미리 결정된 거리 함수를 이용하고, 상기 M 개 그룹의 상기 M 개의 고유 벡터 각각에 상기 관심 샘플의 조합된 벡터 표시의 거리를 결정하고, 상기 관심 샘플에 상기 결정된 거리가 최소인 그룹을 연관시키도록 구성되고 그리고 작동 가능한 분류기 모듈을 포함하는, 제어 시스템.
  19. 제 17 항 또는 제 18 항에 있어서,
    상기 M 개의 그룹에 관련된 복수의 N 개의 기준 샘플에 수행되는 상기 K 개의 측정 방식에 대한 스펙트럼 기준 측정에 대응하는 상기 측정된 기준 스펙트럼를 기초로 하여, 상기 미리 결정된 모델링 데이터를 결정하도록 추가로 구성되고 그리고 작동 가능하고, 상기 스펙트럼 기준 데이터는 복수의 (NxK) 측정된 기준 스펙트럼을 포함하고, 상기 M 개의 그룹 중 각각의 하나의 그룹에 대한 상기 기준 샘플 각각의 대응을 나타내는 데이터를 포함하고,
    상기 제어 시스템은:
    상기 복수의 (NxK) 측정된 기준 스펙트럼을 처리하고 상기 K 개의 측정 방식에 대응하는 K 개의 모델을 결정하도록 구성되고 그리고 작동 가능한, 모델 생성 모듈;
    상기 K 개의 모듈 각각에 대해, 상기 모델을 상기 각각의 측정 방식에 대응하는 상기 N 개의 측정된 기준 스펙트럼 각각과 피팅하고; 그리고 기준 샘플 각각에 대해, 상기 K 개의 측정 방식에 대한 상기 샘플의 기준 스펙트럼의 벡터 표시를 생성하여, 각각의 성분 벡터에 의한 상기 기준 샘플 각각을 나타내도록 구성되고 그리고 작동 가능한, 피팅 모듈;
    상기 M 개의 그룹들 중 각각의 하나의 그룹에 상기 기준 샘플 각각의 대응을 표시하는 데이터를 이용하고, 각각의 그룹에 대해, 상기 그룹에 관련하는 샘플의 성분 벡터를 분석하고, 상기 그룹의 고유 벡터를 나타내는 데이터를 결정하도록 구성되고 그리고 작동 가능한, 그룹 특성화 모듈; 및
    상기 기준 샘플의 성분 벡터와 상기 그룹의 고유 벡터 사이의 거리 함수를 기초로 하여, 상기 기준 샘플의 성분 벡터 모두를 그의 각각의 그룹과 연관시키기 위한 조합 가능성을 최대화하는 미리 결정된 거리 함수의 가중치 매개변수를 결정하도록 구성되고 그리고 작동 가능하여, 상기 거리 함수의 상기 가중치 매개변수의 상기 공통 벡터를 제공하는, 가중 모듈을 포함하는, 제어 시스템.
  20. 관심 샘플의 모델-기반 분석을 위한 제어 시스템으로서,
    미리 결정된 상이한 특성을 갖는 M 개의 그룹과 관련된 복수의 N 개의 기준 샘플에 대해 수행된 K 개의 측정 방식의 스펙트럼 측정을 나타내는 기준 데이터를 수신하도록 구성되고 그리고 작동 가능한 데이터 입력 유틸리티로서, 상기 기준 데이터는 복수의 (NxK) 측정된 기준 스펙트럼을 포함하는 원시 측정 데이터를 포함하고 상기 M 개의 그룹 중 각각의 하나에 대한 각각의 기준 샘플의 대응을 나타내는 데이터를 포함하는, 데이터 입력 유틸리티;
    상기 K 개의 측정 방식에 각각 대응하는 K 개의 모델을 결정하기 위해 상기 복수의 (NxK) 측정된 기준 스펙트럼을 처리하도록 구성되고 그리고 작동 가능한 모델 생성 모듈로서, 상기 모델은 스펙트럼 선 형상을 갖는 미리 결정된 함수에 기초하고, 각각의 측정 방식에 관련되는, 모델 생성 모듈;
    각각의 측정 방식에 대응하는 N 개의 측정된 기준 스펙트럼 각각으로 상기 K 개의 모델의 각각의 피팅을 수행하고, 기준 샘플 각각에 대해, 상기 K 개의 측정 방식에 대한 샘플의 기준 스펙트럼의 벡터 표현을 생성하도록 구성되고 그리고 작동 가능하여, 상기 각각의 성분 벡터에 의해 상기 기준 샘플 각각을 나타내는, 피팅 모듈;
    상기 M 개의 그룹들 각각에 대한 샘플들 각각의 대응을 나타내는 상기 데이터를 이용하고, 각각의 그룹에 대해, 상기 그룹과 관련된 상기 샘플들의 성분들의 벡터들을 분석하고, 상기 그룹의 고유 벡터를 나타내는 데이터를 결정하도록 구성되고 그리고 작동 가능한, 그룹 특성화 모듈; 및
    상기 기준 샘플의 성분 벡터와 상기 그룹의 고유 벡터 사이의 거리 함수에 기초하여, 상기 기준 샘플의 성분 벡터 모두를 각각의 그룹과 연관시키기 위한 조합 가능성을 최대화하는 거리 함수의 가중치 매개변수를 결정하도록 구성되고 그리고 작동 가능하여 상기 거리 함수의 상기 가중치 매개변수의 상기 공통 벡터를 제공하는, 가중 모듈;
    각각의 K 개의 측정 방식에 대한 K 개의 모델을 나타내는 데이터, 상기 그룹의 고유 벡터를 나타내는 데이터, 및 상기 M 개의 그룹에 대한 공통 가중치 벡터를 나타내는 벡터를 포함하는 모델링 데이터를 저장하기 위한, 저장 유틸리티, 및
    상기 모델링 데이터를 이용하여 관심 샘플의 원시 측정된 기준 스펙트럼의 모델-기반 분석에 의해, 상기 M 개의 그룹들 중 하나에 관련된 관심 샘플을 분석하도록 구성되고 그리고 작동 가능한, 분류기 모듈을 포함하는, 시스템.
KR1020217036810A 2019-04-15 2020-04-05 샘플 분류를 위한 방법 및 시스템 KR20210151184A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962833956P 2019-04-15 2019-04-15
US62/833,956 2019-04-15
PCT/IL2020/050409 WO2020212969A1 (en) 2019-04-15 2020-04-05 Method and system for classification of samples

Publications (1)

Publication Number Publication Date
KR20210151184A true KR20210151184A (ko) 2021-12-13

Family

ID=72837097

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217036810A KR20210151184A (ko) 2019-04-15 2020-04-05 샘플 분류를 위한 방법 및 시스템

Country Status (8)

Country Link
US (1) US20220317069A1 (ko)
EP (1) EP3956811A4 (ko)
JP (1) JP2022529624A (ko)
KR (1) KR20210151184A (ko)
AU (1) AU2020259413A1 (ko)
CA (1) CA3136899A1 (ko)
IL (1) IL287180A (ko)
WO (1) WO2020212969A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023236540A1 (zh) * 2023-01-17 2023-12-14 山东大学 矿石成分分析设备及方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6266390B1 (en) 1998-09-21 2001-07-24 Spectramet, Llc High speed materials sorting using x-ray fluorescence
US6140643A (en) * 1999-03-09 2000-10-31 Exxonmobil Upstream Research Company Method for identification of unknown substances
EP1969353A1 (en) 2005-12-12 2008-09-17 Platform Development&Investment Ltd. Assessment of diamond color
WO2011159269A1 (en) * 2010-06-17 2011-12-22 Spectramet, Llc Sorting pieces of material based on optical and x - ray photon emissions
WO2013119604A1 (en) * 2012-02-07 2013-08-15 Materialytics, LLC Methods and systems for analyzing samples
NL2009015C2 (en) * 2012-04-10 2013-10-15 Biosparq B V Method for classification of a sample on the basis of spectral data, method for creating a database and method for using this database, and corresponding computer program, data storage medium and system.
WO2016157185A1 (en) 2015-04-02 2016-10-06 Soreq Nuclear Research Center System and method for reading x-ray-fluorescence marking
WO2017153726A1 (en) * 2016-03-07 2017-09-14 Micromass Uk Limited Spectrometric analysis
KR102204124B1 (ko) 2016-04-04 2021-01-19 소레크 뉴클리어 리서치 센터 전자 시스템의 xrf 마킹 및 xrf 마크 판독 방법 및 시스템
CN109997031B (zh) 2016-09-19 2022-05-10 索雷克核研究中心 用于检测材料的x射线荧光系统和方法以及控制系统
DE102017217543B4 (de) * 2017-10-02 2020-01-09 Siemens Healthcare Gmbh Verfahren und System zur Klassifikation von Materialien mittels maschinellen Lernens

Also Published As

Publication number Publication date
EP3956811A4 (en) 2023-01-11
EP3956811A1 (en) 2022-02-23
CA3136899A1 (en) 2020-10-22
JP2022529624A (ja) 2022-06-23
IL287180A (en) 2021-12-01
WO2020212969A1 (en) 2020-10-22
AU2020259413A1 (en) 2021-11-04
US20220317069A1 (en) 2022-10-06

Similar Documents

Publication Publication Date Title
Carvalho et al. Higgs pair production: choosing benchmarks with cluster analysis
CN104380088B (zh) 对sem-eds数据集中的未知物的聚类分析
TWI639824B (zh) 用於自動及手動缺陷分類之整合的方法、設備及非暫態電腦可讀取儲存媒介
Gallicchio et al. Quark and gluon jet substructure
Cooper et al. Measuring galaxy environments with deep redshift surveys
Soubiran et al. Vertical distribution of Galactic disk stars-I. Kinematics and metallicity
CN103959426B (zh) 用于通过质谱术识别微生物的方法
Tinker et al. Halo histories versus Galaxy properties at z= 0–I. The quenching of star formation
JP6355137B2 (ja) 信号分析装置、信号分析方法及びコンピュータプログラム
Yan et al. Mock catalogs for the DEEP2 redshift survey
KR20210151184A (ko) 샘플 분류를 위한 방법 및 시스템
Diago-Mosquera et al. Tuning selection impact on Kriging-aided in-building path loss modeling
Butter et al. Classification of Fermi-LAT blazars with Bayesian neural networks
CN106383135B (zh) 基于全反射x射线荧光光谱的元素定量分析方法和系统
JP6839885B1 (ja) ピーク形状を最適化するためのシステムおよび方法
Nguyen et al. Performance measurement for interactive multi-objective evolutionary algorithms
JP7425473B2 (ja) 閾値算出装置、閾値算出方法および測定装置
Denysiuk et al. A new hybrid evolutionary multiobjective algorithm guided by descent directions
JP6949034B2 (ja) 信号分析装置、信号分析方法、コンピュータプログラム、測定装置及び測定方法
Sutton et al. Target detection from distributed passive sensors: Semi-labeled data quantization
KR101890494B1 (ko) 태양 양성자입자 예측방법
CN113553776B (zh) 一种电磁辐射数据监控分析方法及系统
CN112710625B (zh) 一种粒料和粉料状固体聚合物性质快速检测方法
Mantz et al. Erratum: Weighing the giants–V. Galaxy cluster scaling relations
JP6226471B2 (ja) 構造精密化装置、方法およびプログラム