KR102172914B1 - 라만 스펙트럼 식별 고속 탐색 방법 및 장치 - Google Patents

라만 스펙트럼 식별 고속 탐색 방법 및 장치 Download PDF

Info

Publication number
KR102172914B1
KR102172914B1 KR1020190067294A KR20190067294A KR102172914B1 KR 102172914 B1 KR102172914 B1 KR 102172914B1 KR 1020190067294 A KR1020190067294 A KR 1020190067294A KR 20190067294 A KR20190067294 A KR 20190067294A KR 102172914 B1 KR102172914 B1 KR 102172914B1
Authority
KR
South Korea
Prior art keywords
spectrum
cluster
distance
search
input
Prior art date
Application number
KR1020190067294A
Other languages
English (en)
Inventor
박준규
이수웅
윤지영
최승환
Original Assignee
한국생산기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생산기술연구원 filed Critical 한국생산기술연구원
Priority to KR1020190067294A priority Critical patent/KR102172914B1/ko
Application granted granted Critical
Publication of KR102172914B1 publication Critical patent/KR102172914B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/44Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

본 발명의 일 실시 예는 다단의 단계를 수행하여 계층 클러스터 트리 기반 검색을 수행하므로, 라만 스펙트럼에 대한 검색 속도가 현저히 증가되는 라만 스펙트럼 식별 고속 탐색 방법 및 장치를 제공한다. 본 발명의 실시 예에 따른 라만 스펙트럼 식별 고속 탐색 방법은 사전에 각각의 화학 시료에 대한 라만 스펙트럼을 측정하여 라이브러리 스펙트럼을 수집하는 제1단계; 라이브러리 스펙트럼의 해상도를 조절하고 잡음을 제거하는 제2단계; 주성분 분석을 이용하여 복수 개인 라이브러리 스펙트럼에 대한 행렬의 차원을 축소시켜 제1주성분 스펙트럼의 데이터와 제2주성분 스펙트럼의 데이터를 획득하는 제3단계; 라이브러리 스펙트럼, 제1주성분 스펙트럼, 및 제2주성분 스펙트럼 각각을 복수 개의 클러스터 중 선택되는 어느 하나의 클러스터에 할당하여 계층 클러스터 트리를 구축하여 라이브러리 데이터베이스를 생성하는 제4단계; 적어도 하나 이상의 화학 시료를 포함하는 측정대상에 대해 라만 분광법을 수행하여 입력 스펙트럼을 수집하는 제5단계; 입력 스펙트럼과 가장 근접한 라이브러리 스펙트럼을 선택하기 위해 계층 클러스터 트리에 대한 검색을 수행하는 제6단계; 및 측정대상에 포함되는 화학 물질을 도출하는 제7단계;를 포함한다.

Description

라만 스펙트럼 식별 고속 탐색 방법 및 장치 {FAST SEARCHING METHOD AND APPARATUS FOR RAMAN SPECTRUM IDENTIFICATION}
본 발명은 라만 스펙트럼 식별 고속 탐색 방법 및 장치에 관한 것으로, 더욱 상세하게는, 다단의 단계를 수행하여 계층 클러스터 트리 기반 검색을 수행하므로, 라만 스펙트럼에 대한 검색 속도가 현저히 증가되는 라만 스펙트럼 식별 고속 탐색 방법 및 장치에 관한 것이다.
물질에 단파장의 가시 광선이나 자외선을 조사하면 분자 진동 중 분극률의 변화를 일으키기 때문에 입사광은 파장의 변화를 받아 산란되며, 이 산란 강도를 파장 변화에 대해 표시하여 라만 스펙트럼이 획득되며, 이와 같은 라만 스펙트럼은 물질 고유의 것이 때문에 화학 물질의 분석에 이용되고 있다.
최근에는, 라만 스펙트럼을 이용하여, 측정된 화학물질을 라만 데이터베이스에 비교하여 식별할 수 있는 고속 검색 방법에 대한 요구가 커지고 있다. 그리고, 하드웨어의 비약적인 발전에 따라 연산 속도 역시 빨라지고 있다. 다만, 현장에서는 분광 장비의 소형화, Stand-alone에 대한 요구도 진행되고 있다.
또한, 현장에서는 사용자의 안전을 위해, 폭약과 같은 고위험물질을 빠른 시간 내에 정확하게 판별하는 것이 요구되고 있다.
대한민국 공개특허 제 10-2018-0051239호(발명의 명칭: 라만분광법에 의한 블랙플라스틱 선별을 위한 전처리기반 지능분류 방법)에서는, 라만분광법에 의한 블랙플라스틱 선별을 위한 전처리기반 지능분류 방법으로서, (1) 라만 분광장비를 이용하여 블랙 플라스틱 재질별(PET, PP, PS) 스펙트럼 데이터가 획득되는 단계; (2) 주성분 분석법(PCA) 알고리 즘을 통해 상기 단계 (1)을 통해 획득된 블랙 플라스틱 재질별 스펙트럼 데이터가 전처리되는 단계; (3) 상기 단계 (2)를 통해 전처리된 데이터가 SVM(Support Vector Machine) 패턴 분류기에 입력되고, 상기 SVM 패턴 분류기가 상기 블랙 플라스틱 재질별 화학적 특성에 대해 학습하는 단계; 및 (4) 임의로 입력되는 블랙 플라스틱에 대해, 상기 단계 (1) 내지 단계 (3)을 통해 학습된 SVM 패턴 분류기를 이용하여, 상기 입력된 블랙 플라스틱들이 재질별 화학적 특성에 기반 하여 분류되는 단계를 포함하는 라만분광법에 의한 블랙플라스틱 선별을 위한 전처리기반 지능분류 방법이 개시되어 있다.
대한민국 공개특허 제 10-2018-0051239호
상기와 같은 요구에 의한 본 발명의 목적은, 라만 스펙트럼을 이용하여 측정된 화학물질을 라만 데이터베이스에 비교하여 식별하는 경우, 고속 탐색이 가능하도록 하는 것이다.
그리고, 상기와 같이 라만 스펙트럼에 대한 고속 탐색을 수행하더라도, 결과 값의 정확도가 증대되도록 하는 것이다.
본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기와 같은 목적을 달성하기 위한 본 발명의 구성은, 사전에 각각의 화학 시료에 대한 라만 스펙트럼을 측정하여 라이브러리 스펙트럼을 수집하는 제1단계; 상기 라이브러리 스펙트럼의 해상도를 조절하고 잡음을 제거하는 제2단계; 주성분 분석을 이용하여 복수 개인 상기 라이브러리 스펙트럼에 대한 행렬의 차원을 축소시켜 제1주성분 스펙트럼의 데이터와 제2주성분 스펙트럼의 데이터를 획득하는 제3단계; 상기 라이브러리 스펙트럼, 제1주성분 스펙트럼, 및 제2주성분 스펙트럼 각각을 복수 개의 클러스터 중 선택되는 어느 하나의 클러스터에 할당하여 계층 클러스터 트리를 구축하여 라이브러리 데이터베이스를 생성하는 제4단계; 적어도 하나 이상의 화학 시료를 포함하는 측정대상에 대해 라만 분광법을 수행하여 입력 스펙트럼을 수집하는 제5단계; 상기 입력 스펙트럼과 가장 근접한 상기 라이브러리 스펙트럼을 선택하기 위해 상기 계층 클러스터 트리에 대한 검색을 수행하는 제6단계; 및 상기 측정대상에 포함되는 화학 물질을 도출하는 제7단계;를 포함한다.
상기와 같은 목적을 달성하기 위한 본 발명의 구성은, 적어도 하나 이상의 화학 시료를 포함하는 측정대상에 대해 라만 분광법을 수행하여 적어도 하나 이상의 라만 스펙트럼을 포함하는 입력 스펙트럼을 수집하는 신호취득부; 상기 신호취득부와 연결되고, 상기 입력 스펙트럼의 해상도를 조절하고 잡음을 제거하는 전처리부; 상기 전처리부와 연결되고, 입력 스펙트럼을 행렬 변환시키는 데이터 변환부; 상기 데이터 변환부와 연결되고, 상기 입력 스펙트럼과 가장 근접한 상기 라이브러리 스펙트럼을 선택하기 위해 계층 클러스터 트리에 대한 검색을 수행하는 검색부; 및 상기 검색부와 연결되고, 상기 측정대상에 포함되는 화학 물질을 도출하여 디스플레이 화면에 표시하는 출력부;를 포함한다.
상기와 같은 구성에 따른 본 발명의 효과는, 파일럿 테스트를 포함한 다단의 단계로서 계층 클러스터 트리 기반 검색을 수행하므로, 라만 스펙트럼에 대한 검색 속도가 현저히 증가된다는 것이다.
그리고, 본 발명의 효과는, 조기 탐색 종료 방법인 삼각 부등식과 PDS 방법 등을 이용하여 대다수의 데이터를 제외하면서 검색을 수행할 수 있으므로, 검색 속도가 증가됨과 동시에 검색 정확도가 향상된다는 것이다.
본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.
도 1은 본 발명의 일 실시 예에 따른 라만 스펙트럼 식별 고속 탐색 방법의 제3단계에 대한 순서도이다.
도 2 와 도 3은 각각 본 발명의 일 실시 예에 따른 라만 스펙트럼 식별 고속 탐색 방법의 일부 단계에 대한 순서도이다.
도 4는 본 발명의 일 실시 예에 따른 라만 스펙트럼 식별 고속 탐색 장치의 구성도이다.
이하에서는 첨부한 도면을 참조하여 본 발명을 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시 예로 한정되는 것은 아니다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결(접속, 접촉, 결합)"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 부재를 사이에 두고 "간접적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 구비할 수 있다는 것을 의미한다.
본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하 첨부된 도면을 참고하여 본 발명에 대하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시 예에 따른 라만 스펙트럼 식별 고속 탐색 방법의 제3단계에 대한 순서도이고, 도 2 와 도 3은 각각 본 발명의 일 실시 예에 따른 라만 스펙트럼 식별 고속 탐색 방법의 일부 단계에 대한 순서도이다.
도 1 내지 도 3에서 보는 바와 같이, 본 발명의 고속 탐색 방법에서, 먼저, 제1단계에서, 사전에 각각의 화학 시료에 대한 라만 스펙트럼을 측정하여 라이브러리 스펙트럼을 수집할 수 있다(S100). 그리고, 제2단계에서, 라이브러리 스펙트럼의 해상도를 조절하고 잡음을 제거할 수 있다. 라이브러리 스펙트럼에 대한 이와 같은 조절과 제거는 종래 기술에 의해 수행되며 상세한 설명은 생략하기로 한다. 그리고, 하기의 입력 스펙트럼에 대해서도, 입력 스펙트럼의 해상도를 조절하고 잡음을 제거할 수 있다.
제3단계에서, 주성분 분석을 이용하여 복수 개인 라이브러리 스펙트럼에 대한 행렬의 차원을 축소시켜 제1주성분 스펙트럼의 데이터와 제2주성분 스펙트럼의 데이터를 획득할 수 있다. 복수 개인 라이브러리 스펙트럼은 수천 개 이상의 라만 스펙트럼으로 형성될 수 있으며, 우선 고려되는 데이터는 일차원 벡터일 수 있다. 즉, 전체의 라이브러리 스펙트럼에 대해 검색을 수행하는 경우 거리 계산에 수천 개 이상의 데이터가 필요하기 때문에 고속 검색에 부적합할 수 있다. 따라서, 따라서 주성분 분석 방법을 이용하여, 데이터의 변별력과, 특징은 그대로 유지하며 차원을 축소하는 과정을 수행할 수 있다. 여기서, 유사성의 정도를 거리로 표현할 수 있다. 상관도와 수식적으로 유사하며, 라이브러리 스펙트럼과 입력 스펙트럼의 대조에 이용될 수 있다. 이하, 하기에서 상세히 설명하도록 한다. 제3단계는, 제3-1단계 내지 제3-4단계를 포함하여 수행될 수 있다.
제3-1단계에서, M개의 화학물질에 대한 N개의 라이브러리 스펙트럼에 대해 NxN의 상관관계 행렬을 형성할 수 있다.(S310) 즉, NxM(구체적인 실시 예로써 3,300x14,085일 수 있다. 이는 하기의 [실험 예]에 반영되는 것이며, 이에 한정되는 것은 아니다)의 라이브러리 스펙트럼 행렬 Y에 대해 아래의 [수학식 1]과 같이 NxN의 상관관계 행렬(Correlation Matrix 혹은 공분산 행렬) R을 구성할 수 있다.
[수학식 1]
Figure 112019058306770-pat00001
여기서, R은 상관관계 행렬이고, Y는 NxM의 라이브러리 스펙트럼 행렬이다.
제3-2단계에서, 상관관계 행렬 R의 고유값(EigenValue)과 고유벡터(EigenVector)를 구하여 큰 값에서부터 작은 값의 순서대로 내림차순 정렬시키고 상관관계 행렬 R을 재구성할 수 있다.(S320) 상관관계 행렬 R의 재구성은, 아래의 [수학식 2]와 같이 내림차순 된 고유값 행렬 A과 고유벡터 행렬 V의 곱으로 수행될 수 있다.
[수학식 2]
Figure 112019058306770-pat00002
여기서, R은 상관관계 행렬이고, A는 내림차순 된 고유값 행렬이다. 구체적으로, 상기의 [수학식 2]에서 행렬 A는 대각 성분이 (λ1, λ2,??, λN)이고 (λ1≥ λ2≥ ?? ≥λN)을 만족하는 NxN고유값 행렬을 나타낼 수 있다. 그리고 행렬 V는 고유벡터 계수 vij(i와 j는 1 내지 N의 자연수)를 갖는 NxN고유벡터 행렬일 수 있다.
제3-3단계에서, 재구성된 상관관계 행렬의 라이브러리 스펙트럼 각각에 대한 PCA(Principal Component Analysis) 선형 변환을 수행할 수 있다.(S330) 구체적으로, NxM의 라이브러리 스펙트럼 행렬 데이터를 새로운 N개의 좌표축을 갖는 공간의 점으로 바꾸기 위해 아래의 [수학식 3]을 이용하여 각각의 스펙트럼에 대한 PCA 선형 변환을 수행할 수 있다.
[수학식 3]
Figure 112019058306770-pat00003
[수학식 3]에서, 행렬 Y는 원래 좌표 (y1, y2, ??.., yN), 행렬 W는 새로운 좌표 (w1, w2, ??.., wN)으로 이루어질 수 있다. 새로운 좌표 w1는 첫 번째 주성분(PC) 축 방향으로 모든 라이브러리 스펙트럼의 가장 큰 분산 값을 갖도록 선택할 수 있다.
두 번째 주성분은 첫 번째 축에 직교(Orthogonal)하는 축을 따라 가장 큰 분산 값을 가질 수 있다. 따라서, 다음의 주성분에 의해 표현되는 분산은 계속해서 감소될 수 있다. PCA 선형 변환에 의해 만들어진 주성분들(PCs)은 서로 비상관 관계에 있고 서로 직교할 수 있다. 또한, 차수가 증가함에 따라 주성분에 포함된 데이터의 정보량은 감소할 수 있다. (즉, 앞 차수에 데이터의 정보량이 밀집되어 있음으로, 적당한 정도에서 차수의 선택을 멈추도록 설정할 수 있다. 실험에서는 1부터 40차, 즉, 40개의 데이터를 선택하였고, 고유 값이 큰 순일 수 있다. 이에 대해서는 [실험 예]에서 상세히 설명하기로 한다.)
제3-4단계에서, PCA 선형 변환에 의해 생성된 행렬인 변환행렬의 좌표의 차수를 감소시켜 제1주성분 스펙트럼의 데이터 또는 제2주성분 스펙트럼의 데이터를 획득할 수 있다.(S340) 먼저, 새로운 좌표 (w1, w2, ??.., wN)에서 정보량의 집중도를 알아보고 데이터 차수를 감소시키기 위해 아래의 [수학식 4]를 이용할 수 있다.
여기서, 아래의 [수학식 4]에서 Energy(K)값이 1에 가장 근사하게 형성되도록 변환행렬의 좌표 수를 결정함으로써 변환행렬의 좌표의 차수를 감소시켜 제2주성분 스펙트럼의 데이터를 획득할 수 있다.
[수학식 4]
Figure 112019058306770-pat00004
여기서, K는 변환행렬의 좌표 수이고, w는 변환행렬의 좌표 값이며, N은 고유값의 수이며, λ는 고유값이다. 상기의 [수학식 4]에서 Energy(K)는 모든 고유값 성분 (λ1, λ2,??, λN)의 합에서 처음부터 K개의 새로운 좌표 (w1, w2, ??.., wK) 성분의 합이 차지하는 비율로 표시될 수 있다. 이 때, Energy(K) 의 값이 거의 1에 근사하는 K를 찾아(ex. [실험 예]에서 K=40) 주성분을 선택할 수 있다. PCA 변환 후 K개인 라이브러리 스펙트럼 사이의 거리 계산은 PCA 변환 전 N개의 라이브러리 스펙트럼 사이의 거리 계산과 동일한 결과를 가지며 계산량은 더 줄기 때문에 빠른 검색이 가능할 수 있다.
[수학식 4]에 근거하여, 선택된 변환 행렬 VT(vij, i=1, ??.., K. and j=1, ??.., N.)을 획득할 수 있다. 라이브러리 스펙트럼 데이터로부터 변환 행렬을 획득하고, 공분산행렬(행렬 R)을 획득하기 위해 평균값 역시 얻을 수 있다. 이 두 정보는 라이브러리 스펙트럼 신호의 데이터를 변환시켜주는 중요한 정보일 수 있다. 라이브러리 스펙트럼 신호의 데이터가 입력되는 경우, 평균값을 빼주고, 변환 행렬을 곱하여 1xK차원의 특징 변환이 된 신호를 획득할 수 있다.
그리고, 제3-4단계에서, 변환행렬의 좌표 수를 제2주성분 스펙트럼의 데이터 획득에 이용된 변환행렬의 좌표 수 보다 더 작은 수로 결정함으로써, 변환행렬의 좌표의 차수를 감소시켜 제1주성분 스펙트럼의 데이터를 획득할 수 있다. 특히, 제1주성분 스펙트럼 데이터는 하기에 기재된 제6-1단계의 파일럿 테스트에 이용될 수 있다. 본 발명의 고속 검색 방법에서는, 계층 구조에서 선형 변환된 10개 내외의 데이터로 먼저 검색을 수행하여 조기에 입력 스펙트럼에 대한 분석을 완료함으로써, 라만 스펙트럼을 식별하는 고속 탐색이 구현될 수 있다. 이에 대해서는 하기에 상세히 설명하기로 한다.
제4단계에서, 라이브러리 스펙트럼, 제1주성분 스펙트럼, 및 제2주성분 스펙트럼 각각을 복수 개의 클러스터 중 선택되는 어느 하나의 클러스터에 할당하여 계층 클러스터 트리를 구축하여 라이브러리 데이터베이스를 생성할 수 있다.(S410) 계층 클러스터링은, 라이브러리 스펙트럼 데이터를 유사성에 근거하여 그룹화하는 것으로, 각각의 라이브러리 스펙트럼 데이터를 P개의 클러스터에 할당하여 이진 클러스터 트리를 구축할 수 있다. 이 과정은 입력 스펙트럼 데이터의 신원을 찾는 실시간 처리에 속하지 않으므로, 데이터의 전체 차수(N개)를 사용하여 강인한 이진 클러스터 트리를 구축할 수 있다.
제4단계는, 제4-1단계 내지 제4-4단계를 포함하여 수행될 수 있다. 먼저, 제4-1단계에서, 클러스터의 집합인 기본클러스터군에 포함되는 기본클러스터 각각에 라이브러리 스펙트럼을 할당하여 그룹화를 수행하고, 기본클러스터의 중심 개체와 나머지 개체 간 거리를 측정할 수 있다. (S420)
계층 클러스터 분석을 수행하기 위해 먼저 개체 사이의 유사성을 측정할 수 있다. 유사성 측정(Similarity Measures)은 라이브러리 스펙트럼 데이터 집합의 모든 개체 쌍 사이의 거리를 계산할 수 있다. m개의 개체로 구성된 데이터 세트의 경우, 데이터 세트에 m * (m-1)/2 쌍이 있을 수 있다.
데이터 집합 개체 사이의 근접 거리가 계산되면 다음으로 Matlab의 linkage함수를 사용하여, 개체를 클러스터로 그룹화할 수 있다.(S430) linkage 함수는 생성된 거리 정보를 가져와서 서로 가까이 있는 개체 쌍을 두 개체로 구성된 이진 클러스터로 링크할 수 있다. 그런 다음 원본 데이터인 라이브러리 스펙트럼 데이터 집합의 모든 개체가 계층 트리(Hierarchical Tree)에 함께 링크 될 때까지 새로 형성된 클러스터를 다른 개체에 연결하여 더 큰 클러스터를 작성할 수 있다.(S440) 이진 클러스터 계층 트리를 작성한 후에는 matlab의 cluster 함수를 사용하여 데이터를 P개의 클러스터로 나누어 할당할 수 있다. 그 후, 각각의 클러스터의 중심이 되는 개체를 찾아 클러스터의 중심과 클러스터 내의 모든 개체 사이의 거리를 구할 수 있다.
제4-2단계에서, 클러스터의 집합인 제1추가클러스터군에 포함되는 제1추가클러스터 각각에 제1주성분 스펙트럼을 할당하여 그룹화를 수행하고, 제1추가클러스터의 중심 개체와 나머지 개체 간 거리를 측정할 수 있다. 그리고, 제4-3단계에서, 클러스터의 집합인 제2추가클러스터군에 포함되는 제2추가클러스터 각각에 제2주성분 스펙트럼을 할당하여 그룹화를 수행하고, 제2추가클러스터의 중심 개체와 나머지 개체 간 거리를 측정할 수 있다.
제4-2단계와 제4-3단계에서는 제안한 트리 검색 방법을 위해, 전체 차수의 데이터와 추가로 PCA J차(제1주성분 스펙트럼), PCA K차(제2주성분 스펙트럼)의 데이터에 각각에 대한 거리 계산을 수행할 수 있다.(여기서, J<K이다. 구체적인 일 실시예로써, J는 10, K는 40일 수 있으나, [실험 예]와 같이 실험적인 것으로써 이에 한정되는 것은 아니다.)
제4-2단계와 제4-3단계에서의 거리 측정 방식은 제4-1단계의 거리 측정 방식과 동일할 수 있다. 여기서, 기본클러스터의 중심 개체와 그 인덱스는 전체 차수에 라이브러리 스펙트럼 데이터에 기반하여 구한 후, 제1추가클러스터와 제2추가클러스터의 거리 측정에 적용할 수 있다.
제4-4단계에서, 제4-1단계 내지 제4-3단계에서 획득된 각각의 거리에 대한 정보를 저장할 수 있다.(S450) 구체적으로, 각각의 클러스터의 중심에서 가장 가까운 거리에 있는 개체와 가장 먼 거리에 있는 개체에 대한 인덱스와 거리 값 정보를 저장할 수 있다. 여기서 각각의 클러스터의 중심은 각각의 클러스터 내 모든 개체의 평균에서 가장 가까운 위치에 있는 실제 개체가 존재하는 위치가 각각의 클러스터의 실제 중심 위치가 될 수 있다.
제5단계에서, 적어도 하나 이상의 화학 시료를 포함하는 측정대상에 대해 라만 분광법을 수행하여 입력 스펙트럼을 수집할 수 있다. 제5단계는 기존의 라만 분광기에 의해 수행될 수 있다.(S500)
제6단계에서, 입력 스펙트럼과 가장 근접한 라이브러리 스펙트럼을 선택하기 위해 계층 클러스터 트리에 대한 검색을 수행할 수 있다. 여기서, 제6단계는, 제6-1단계 내지 제6-3단계를 포함하여 수행될 수 있다. 구체적으로, 본 발명의 고속 탐색 방법에서는 총 3단계의 계층 클러스터 트리 검색을 수행할 수 있다. 먼저, PCA J차 데이터인 제1추가클러스터의 데이터를 이용하여 파일럿 테스트를 수행한 후 최소 거리 스펙트럼(제1검색스펙트럼)을 찾고(제6-1단계), 다음으로 파일럿 테스트(제6-1단계)에 찾은 제1검색스펙트럼을 기준으로 PCA K차 데이터인 제2추가클러스터의 데이터를 이용한 계층 클러스터 트리 검색을 수행하며(제6-2단계), 마지막으로, 전체 라이브러리 스펙트럼 데이터를 기준으로 계층 클러스터 트리 검색(제6-3단계)을 수행할 수 있다.
구체적으로, 제6단계는, 제1추가클러스터의 개체 중 입력 스펙트럼과 최소 거리를 형성하는 스펙트럼인 제1검색스펙트럼을 도출하는 제6-1단계(S610), 제6-1단계가 종료되는 경우, 제1검색스펙트럼의 인덱스를 기준으로 제2추가클러스터의 개체 중 입력 스펙트럼과 최소 거리를 형성하는 스펙트럼인 제2검색스펙트럼을 도출하는 제6-2단계(S620), 및 제6-2단계가 종료되는 경우, 제1검색스펙트럼의 인덱스를 기준으로 기본클러스터의 개체 중 입력 스펙트럼과 최소 거리를 형성하는 스펙트럼인 제3검색스펙트럼을 도출하는 제6-3단계(S630),를 포함한다.
각각의 단계에서는 입력 스펙트럼 데이터와 가장 가까운 스펙트럼을 선정하기 위해, 이전 단계에서 획득한 최소 거리 데이터(제1검색스펙트럼의 데이터 또는 제2검색스펙트럼의 데이터)의 인덱스를 기준으로 더 가까운 데이터를 찾기 위한 계층 클러스터 트리 검색을 수행할 수 있다. 그리고, 계층 클러스터 트리 검색에 있어서 탐색의 조기 종료 조건으로는 삼각 부등식과 PDS 방법을 적용할 수 있다.
제6-1단계에서, 제1추가클러스터의 개체 중 입력 스펙트럼과 최소 거리를 형성하는 스펙트럼인 제1검색스펙트럼을 도출할 수 있다. 구체적으로, 제6-1단계는, 제1추가클러스터 중에서 아래의 [수학식 5]에 의한 조건을 충족하는 클러스터를 검색에서 제외시키는 제1추가클러스터 선별 단계를 포함할 수 있다.
[수학식 5]
dcenter - dmax > dmin 2
여기서, dmin 2는 입력 스펙트럼과 가장 가까운 제1추가클러스터의 중심 간 거리의 제곱 값, dcenter는 입력 스펙트럼과 제1추가클러스터의 중심 간 거리, dmax는 제1추가클러스터 내 제1추가클러스터의 중심에서 가장 먼 거리에 있는 개체로부터 입력 스펙트럼까지의 거리,이다.
또한, 제6-1단계는, 제1추가클러스터 선별 단계에 의해 선별된 제1추가클러스터 내부에서, 입력 스펙트럼과 선별된 제1추가클러스터 내 각각의 스펙트럼 간 거리의 제곱 값의 누적 합이 dmin 2보다 큰 경우, 입력 스펙트럼과 선별된 제1추가클러스터 내 각각의 스펙트럼 간 거리 측정을 종료하는 종료 단계를 더 포함할 수 있다.
그리고, 제6-1단계는, 입력 스펙트럼과 선별된 제1추가클러스터 내 소정의 스펙트럼 간 거리의 제곱 값이 dmin 2보다 작은 경우, 소정의 스펙트럼과 입력 스펙트럼 간 거리의 제곱 값을 dmin 2으로 변경하고, 이와 같은 과정을 선별된 제1추가클러스터 전체에 대해 수행하여, 최종적인 dmin 2을 가지는 스펙트럼을 제1검색스펙트럼으로 도출하는 도출 단계를 더 포함할 수 있다.
이에 따라, 상기와 같은 파일럿 테스트를 선 수행함으로써, 계층 구조에서 선형 변환된 10개 내외의 데이터로 먼저 검색을 수행하여 조기에 입력 스펙트럼에 대한 분석을 완료할 수 있다.
제6-2단계에서, 제2추가클러스터의 개체 중 입력 스펙트럼과 최소 거리를 형성하는 스펙트럼인 제2검색스펙트럼을 도출할 수 있다. 구체적으로, 제2추가클러스터가 아래의 [수학식 5]에 의한 조건을 충족하는 경우 제2추가클러스터를 검색에서 제외시키는 제2추가클러스터 선별 단계를 포함할 수 있다.
[수학식 5]
dcenter - dmax > dmin 2
여기서, dmin 2는 입력 스펙트럼과 가장 가까운 제2추가클러스터의 중심 간 거리의 제곱 값, dcenter는 입력 스펙트럼과 제2추가클러스터의 중심 간 거리, dmax는 제2추가클러스터 내 제2추가클러스터의 중심에서 가장 먼 거리에 있는 개체로부터 입력 스펙트럼까지의 거리,이다.
또한, 제6-2단계는, 제2추가클러스터 선별 단계에 의한 선별된 제2추가클러스터 내부에서, 입력 스펙트럼과 선별된 제2추가클러스터 내 각각의 스펙트럼 간 거리의 제곱 값의 누적 합이 dmin 2보다 큰 경우, 입력 스펙트럼과 선별된 제2추가클러스터 내 각각의 스펙트럼 간 거리 측정을 종료하는 종료 단계를 더 포함할 수 있다.
그리고, 제6-2단계는, 입력 스펙트럼과 선별된 제2추가클러스터 내 소정의 스펙트럼 간 거리의 제곱 값이 dmin 2보다 작은 경우, 소정의 스펙트럼과 입력 스펙트럼 간 거리의 제곱 값을 dmin 2로 변경하고, 이와 같은 과정을 선별된 제2추가클러스터 전체에 대해 수행하여, 최종적인 dmin 2을 가지는 스펙트럼을 제2검색스펙트럼으로 도출하는 도출 단계를 더 포함할 수 있다.
제6-3단계에서, 기본클러스터의 개체 중 입력 스펙트럼과 최소 거리를 형성하는 스펙트럼인 제3스펙트럼을 도출할 수 있다. 구체적으로, 제6-3단계는, 기본클러스터가 아래의 [수학식 5]에 의한 조건을 충족하는 경우 기본클러스터를 검색에서 제외시키는 기본클러스터 선별 단계를 포함할 수 있다.
[수학식 5]
dcenter - dmax > dmin 2
여기서, dmin 2는 입력 스펙트럼과 가장 가까운 기본클러스터의 중심 간 거리의 제곱 값, dcenter는 입력 스펙트럼과 기본클러스터의 중심 간 거리, dmax는 기본클러스터 내 기본클러스터의 중심에서 가장 먼 거리에 있는 개체로부터 입력 스펙트럼까지의 거리,이다.
또한, 제6-3단계는, 기본클러스터 선별 단계에 의한 선별된 기본클러스터 내부에서, 입력 스펙트럼과 선별된 기본클러스터 내 각각의 스펙트럼 간 거리의 제곱 값의 누적 합이 dmin 2보다 큰 경우, 입력 스펙트럼과 선별된 기본클러스터 내 각각의 스펙트럼 간 거리 측정을 종료하는 종료 단계를 더 포함할 수 있다.
그리고, 제6-3단계는, 입력 스펙트럼과 선별된 기본클러스터 내 소정의 스펙트럼 간 거리의 제곱 값이 dmin 2보다 작은 경우, 소정의 스펙트럼과 입력 스펙트럼 간 거리의 제곱 값을 dmin 2으로 변경하고, 이와 같은 과정을 선별된 기본클러스터 전체에 대해 수행하여, 최종적인 dmin 2을 가지는 스펙트럼을 제3 검색스펙트럼으로 도출할 수 있다.
상기와 같이, 계층 클러스터 트리 검색의 모든 단계(제6-1단계 내지 제6-3단계)에서는 공통되는 탐색 알고리즘을 수행할 수 있다. 그리고, 제6-1단계의 가장 빠른 고속 검색을 통해 제1검색스펙트럼이 도출되면, 결과 값으로 제1검색스펙트럼을 도출하고, 다음으로 제1검색스펙트럼의 인덱스를 기준으로 제6-2단계의 고속 검색을 통해 제2검색스펙트럼이 결과 값으로 도출될 수 있다. 그리고, 제6-2단계가 종료되어 제2검색스펙트럼이 도출되지 않는 경우, 마지막으로, 제2검색스펙트럼의 인덱스를 기준으로 제6-3단계의 고속 검색을 통해 제3검색스펙트럼이 결과 값으로 도출될 수 있다. 이와 같이, 다단의 과정을 거쳐 입력 스펙트럼에 일치하는 라이브러리 스펙트럼이 검출되도록 하므로, 라만 스펙트럼에 대해 정확하고 신속한 검색이 가능하도록 할 수 있다.
제6-1단계 내지 제6-3단계 각각에서 수행되는 탐색 알고리즘의 상세한 사항은 하기와 같다. 먼저, 입력 스펙트럼 x와 라이브러리 스펙트럼의 데이터 중 가장 가까운 후보 스펙트럼 yj를 찾기 위해 입력 스펙트럼으로부터 P개의 클러스터 중심과의 거리를 계산할 수 있다. 입력 스펙트럼으로부터 가장 가까운 클러스터 중심까지의 거리의 제곱 값을 dmin 2으로 할수 있다. 가장 가까운 거리에 있는 클러스터 내부에 입력 스펙트럼과 가장 유사한 후보가 있을 가능성이 높으므로, 가장 가까운 클러스터에서부터 검색을 시작할 수 있다. 또한, 입력 스펙트럼과 클러스터 중심의 거리 dcenter와 클러스터 중심에서 가장 먼 거리에 있는 개체의 거리 dmax의 차가 dmin 2보다 크다면 아래의 [수학식 5]의 삼각 부등식에 의하여 후보에서 제외할 수 있다.
[수학식 5]
dcenter - dmax > dmin 2
상기와 같은 삼각 부등식을 통과한 클러스터는 클러스터 내부에서 검색을 수행할 수 있다. 이 때, PDS 방법을 적용하여, 임의의 스펙트럼의 거리 제곱 누적 합이 dmin 2보다 크면, 거리 계산을 종료할 수 있다. 마지막으로 d2(x, yj)< dmin 2이면 d2(x, yj)를 dmin 2으로 놓고 클러스터에 대한 반복 루프를 마쳐 최종적으로 입력 스펙트럼과 가장 가까운 스펙트럼을 도출할 수 있다.
상기와 같은 파일럿 테스트(제6-1단계)에서 입력 스펙트럼과 가장 가까운 후보 스펙트럼의 인덱스를 찾았다면, 해당 인덱스의 기반에서 전체 차수를 이용하여 dmax 와 dmin 2를 구할 수 있다. 다음 단계(제6-2단계)에서는, PCA K차 데이터인 제2추가클러스터의 데이터를 이용하여 입력 스펙트럼과 각각의 클러스터 중심의 거리 dcenter를 구하고, 가까운 거리 순으로 삼각 부등식인 [수학식 5]을 이용하여 검사할 수 있다. 이 경우, PCA K차 데이터인 제2추가클러스터의 데이터를 이용한 dcenter값이 전체 차수를 사용한 dmax 와 dmin 2의 합 보다 월등히 크다면, 해당 클러스터를 검사할 필요가 없게 될 수 있다. 마지막 단계(제6-3단계)에서는, 이전 두 단계를 통해 얻은 최소 거리 스펙트럼(제2검색스펙트럼)을 기준으로 전체 라이브러리 스펙트럼 데이터를 사용하여 클러스터 검사와 내부 클러스터 검사를 수행할 수 있다.
제7단계에서, 측정대상에 포함되는 화학 물질을 도출할 수 있다. 상기와 같이 도출된 최종 검색스펙트럼인 제3검색스펙트럼에 대한 화학 물질은 입력 스펙트럼에 대한 화학 물질과 동일하므로, 입력 스펙트럼의 신호를 입력하여 화학 물질의 종류를 파악할 수 있다.(S700)
본 발명의 고속 검색 방법에서 제안하는 계층 클러스터 트리 기반 검색 알고리즘은 파일럿 테스트(제6-1단계)를 통해 대다수의 클러스터 후보군을 제외할 수 있다는 장점이 있을 수 있다. 각각의 단계에서 상기된 [수학식 5]의 삼각 부등식에 의해 dmin 2보다 큰 값을 갖는 클러스터의 많은 개체 들이 거리 계산 없이 후보에서 제외되므로 계산량을 줄일 수 있고, PDS 방법을 도입하여 입력 스펙트럼의 벡터와 라이브러리 스펙트럼의 벡터 간 거리 제곱 누적 합이 dmin 2값 보다 크면 거리 계산이 종료되므로, 더욱 빠른 검색이 가능할 수 있다. 마지막 단계에서는 데이터의 모든 차원을 사용하여, 보다 면밀한 검사를 수행하기 때문에 실험 데이터가 잡음이 많은 경우 전체 탐색 결과와 항상 동일한 결과를 보일 수 있다.
도 4는 본 발명의 일 실시 예에 따른 라만 스펙트럼 식별 고속 탐색 장치의 구성도이다. 도 4에서 바와 같이, 본 발명의 고속 탐색 장치는, 적어도 하나 이상의 화학 시료를 포함하는 측정대상에 대해 라만 분광법을 수행하여 적어도 하나 이상의 라만 스펙트럼을 포함하는 입력 스펙트럼을 수집하는 신호취득부(100); 신호취득부(100)와 연결되고, 입력 스펙트럼의 해상도를 조절하고 잡음을 제거하는 전처리부(200); 전처리부(200)와 연결되고, 입력 스펙트럼을 행렬 변환시키는 데이터 변환부(300); 데이터 변화부(300)와 연결되고, 입력 스펙트럼과 가장 근접한 라이브러리 스펙트럼을 선택하기 위해 계층 클러스터 트리에 대한 검색을 수행하는 검색부(400); 및 검색부(400)와 연결되고, 측정대상에 포함되는 화학 물질을 도출하여 디스플레이 화면에 표시하는 출력부(500);를 포함한다. 본 발명의 고속 탐색 장치에 포함되는 각각의 구성의 기능에 대한 설명은 상기된 본 발명의 고속 탐색 방법에서 대응되는 단계에 대한 설명과 동일할 수 있다.
이하, 본 발명의 고속 탐색 방법을 이용한 실험 예에 대해 설명하기로 한다.
[실험 예]
라이브러리 스펙트럼 데이터를 화학물질 총 14,085개의 라만 스펙트럼으로 구성했다. 그리고, 본 발명의 고속 탐색 방법의 성능 비교 실험을 위해 라이브러리 스펙트럼 데이터로부터 균일한 간격으로 샘플링하고 약 25 dB(SNR)의 잡음을 추가하여 2,817개의 라만 스펙트럼 테스트 데이터를 생성하였다. 본 발명의 고속 탐색 방법에 대한 성능 평가 기준으로 실행시간을 사용하면 프로세서의 속도에 따라 정확한 비교가 불가능할 수 있다. 따라서 본 발명의 고속 탐색 방법의 성능 평가 기준으로 곱셈 연산, 덧셈 연산 및 총 연산 횟수를 사용하여 객관적인 성능 평가가 이루어지도록 하였다. 본 발명의 고속 탐색 방법과 기존 알고리즘의 성능 분석을 위해, 테스트 데이터 2,817개에 대한 각 방법의 평균 연산 횟수를 (표 1)에 나타내었다. ()안의 숫자는 데이터 수를 의미할 수 있다.
(표1)
Figure 112019058306770-pat00005
(표 1)에서 보는 바와 같이, Full Search+PDS는 Full Search와 비교하여 80.97%의 성능 향상 결과를 보였으며, 이를 통해 PDS를 결합하는 방법이 유효함을 확인하였다. 또한, 차원축소를 위해 PCA를 적용하는 것이 유효한 방법임을 확인 할 수 있었다. Full Search+PDS 방법에 비해, PCA + PDS 방법을 적용한 결과 약 91.90%의 성능 향상을 달성할 수 있었다.
다음으로, 본 발명의 고속 탐색 방법에서 제안하는 계층 트리 구조와 파일럿 테스트를 적용한 결과를 살펴보면, 기존의 PCA+PDS 방법에 계층 트리구조를 적용한 결과 약 76.08%의 성능 향상을 얻을 수 있었다. 이는 계층 클러스터 트리 (Hierarchical Cluster Tree) 검색 알고리즘이 입력 스펙트럼과 가장 가까운 클러스터에서부터 검색을 시작하여 후보가 될 수 없는 많은 클러스터를 계산에서 제외하여 효과적으로 연산량을 줄이고 계산 시간을 줄여주는 것임을 확인 할 수 있다.
마지막으로, 특히, 계층 클러스터 트리 구조에 파일럿 테스트를 적용(Hierachical Tree(3300)+PCA(40)+PDS)한 결과 약 41.69%의 성능 향상을 이뤄냈음을 확인할 수 있다. 즉, 본 발명의 고속 탐색 방법에서 선 수행되는 파일럿 테스트를 통해, 계층 구조에서 선형 변환된 10개 내외의 데이터로 먼저 검색을 수행함으로써, 탐색 시간을 현저히 감소시킬 수 있었으며, 이에 따라 본 발명의 고속 탐색 방법이 구현됨을 확인하였다.
본 발명의 고속 탐색 방법을 이용한 실험에서는, 총 14,085개의 라이브러리 스펙트럼을 사용하였는데, 각 데이터의 신원을 찾는데 있어 필요한 정보의 크기는 서로 다를 것임이 자명하다. 실험 결과에 따르면, PCA 10차원을 이용했음에도 완벽하게 신원을 찾을 수 있는 데이터들이 존재하였고, 파일럿 테스트를 통해 기존의 검색 방법보다 현저하게 성능이 개선될 수 있고, 제안한 방법이 고속 검색에 적합함을 확인하였다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100 : 신호취득부
200 : 전처리부
300 : 데이터 변환부
400 : 검색부
500 : 출력부

Claims (16)

  1. 사전에 각각의 화학 시료에 대한 라만 스펙트럼을 측정하여 라이브러리 스펙트럼을 수집하는 제1단계;
    상기 라이브러리 스펙트럼의 해상도를 조절하고 잡음을 제거하는 제2단계;
    주성분 분석을 이용하여 복수 개인 상기 라이브러리 스펙트럼에 대한 행렬의 차원을 축소시켜 제1주성분 스펙트럼의 데이터와 제2주성분 스펙트럼의 데이터를 획득하는 제3단계;
    상기 라이브러리 스펙트럼, 제1주성분 스펙트럼, 및 제2주성분 스펙트럼 각각을 복수 개의 클러스터 중 선택되는 어느 하나의 클러스터에 할당하여 계층 클러스터 트리를 구축하여 라이브러리 데이터베이스를 생성하는 제4단계;
    적어도 하나 이상의 화학 시료를 포함하는 측정대상에 대해 라만 분광법을 수행하여 입력 스펙트럼을 수집하는 제5단계;
    상기 입력 스펙트럼과 가장 근접한 상기 라이브러리 스펙트럼을 선택하기 위해 상기 계층 클러스터 트리에 대한 검색을 수행하는 제6단계; 및
    상기 측정대상에 포함되는 화학 물질을 도출하는 제7단계;를 포함하고,
    상기 제3단계는, M개의 화학물질에 대한 N개의 상기 라이브러리 스펙트럼에 대해 NxN의 상관관계 행렬을 형성하는 제3-1단계, 상기 상관관계 행렬의 고유값과 고유벡터를 구하여 내림차순 정렬시키고 상기 상관관계 행렬을 재구성하는 제3-2단계, 재구성된 상기 상관관계 행렬의 상기 라이브러리 스펙트럼 각각에 대한 PCA(Principal Component Analysis) 선형 변환을 수행하는 제3-3단계, 및 상기 PCA 선형 변환에 의해 생성된 행렬인 변환행렬의 좌표의 차수를 감소시켜 상기 제1주성분 스펙트럼의 데이터 또는 상기 제2주성분 스펙트럼의 데이터를 획득하는 제3-4단계를 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
  2. 삭제
  3. 청구항 1에 있어서,
    상기 제3-4단계에서,
    아래의 식에서 Energy(K)값이 1에 가장 근사하게 형성되도록 변환행렬의 좌표 수를 결정함으로써 변환행렬의 좌표의 차수를 감소시켜 상기 제2주성분 스펙트럼의 데이터를 획득하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
    Figure 112020077541965-pat00006

    여기서, K는 변환행렬의 좌표 수이고, w는 변환행렬의 좌표 값이며, N은 상기 고유값의 수이며, λ는 상기 고유값이다.
  4. 청구항 3에 있어서,
    상기 제3-4단계에서, 변환행렬의 좌표 수를 상기 제2주성분 스펙트럼의 데이터 획득에 이용된 변환행렬의 좌표 수 보다 더 작은 수로 결정함으로써, 변환행렬의 좌표의 차수를 감소시켜 상기 제1주성분 스펙트럼의 데이터를 획득하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
  5. 청구항 4에 있어서,
    상기 제4단계는,
    클러스터의 집합인 기본클러스터군에 포함되는 기본클러스터 각각에 상기 라이브러리 스펙트럼을 할당하여 그룹화를 수행하고, 상기 기본클러스터의 중심 개체와 나머지 개체 간 거리를 측정하는 제4-1단계,
    클러스터의 집합인 제1추가클러스터군에 포함되는 제1추가클러스터 각각에 상기 제1주성분 스펙트럼을 할당하여 그룹화를 수행하고, 상기 제1추가클러스터의 중심 개체와 나머지 개체 간 거리를 측정하는 제4-2단계,
    클러스터의 집합인 제2추가클러스터군에 포함되는 제2추가클러스터 각각에 상기 제2주성분 스펙트럼을 할당하여 그룹화를 수행하고, 상기 제2추가클러스터의 중심 개체와 나머지 개체 간 거리를 측정하는 제4-3단계, 및
    상기 제4-1단계 내지 상기 제4-3단계에서 획득된 각각의 거리에 대한 정보를 저장하는 제4-4단계,를 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
  6. 청구항 5에 있어서,
    상기 제6단계는,
    상기 제1추가클러스터의 개체 중 상기 입력 스펙트럼과 최소 거리를 형성하는 스펙트럼인 제1검색스펙트럼을 도출하는 제6-1단계,
    상기 제6-1단계가 종료되는 경우, 상기 제1검색스펙트럼의 인덱스를 기준으로 상기 제2추가클러스터의 개체 중 상기 입력 스펙트럼과 최소 거리를 형성하는 스펙트럼인 제2검색스펙트럼을 도출하는 제6-2단계, 및
    상기 제6-2단계가 종료되는 경우, 상기 제2검색스펙트럼의 인덱스를 기준으로 기본클러스터의 개체 중 상기 입력 스펙트럼과 최소 거리를 형성하는 스펙트럼인 제3검색스펙트럼을 도출하는 제6-3단계,를 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
  7. 청구항 6에 있어서,
    상기 제6-1단계는, 상기 제1추가클러스터 중에서 아래의 식에 의한 조건을 충족하는 클러스터를 검색에서 제외시키는 제1추가클러스터 선별 단계를 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
    dcenter - dmax > dmin 2
    여기서, dmin 2는 상기 입력 스펙트럼과 가장 가까운 상기 제1추가클러스터의 중심 간 거리의 제곱 값, dcenter는 상기 입력 스펙트럼과 상기 제1추가클러스터의 중심 간 거리, dmax는 상기 제1추가클러스터 내 상기 제1추가클러스터의 중심에서 가장 먼 거리에 있는 개체로부터 상기 입력 스펙트럼까지의 거리,이다.
  8. 청구항 7에 있어서,
    상기 제6-1단계는, 상기 제1추가클러스터 선별 단계에 의해 선별된 제1추가클러스터 내부에서, 상기 입력 스펙트럼과 상기 선별된 제1추가클러스터 내 각각의 스펙트럼 간 거리의 제곱 값의 누적 합이 dmin 2보다 큰 경우, 상기 입력 스펙트럼과 상기 선별된 제1추가클러스터 내 각각의 스펙트럼 간 거리 측정을 종료하는 종료 단계를 더 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
  9. 청구항 8에 있어서,
    상기 제6-1단계는, 상기 입력 스펙트럼과 상기 선별된 제1추가클러스터 내 소정의 스펙트럼 간 거리의 제곱 값이 dmin 2보다 작은 경우, 상기 소정의 스펙트럼과 상기 입력 스펙트럼 간 거리의 제곱 값을 dmin 2으로 변경하고, 이와 같은 과정을 상기 선별된 제1추가클러스터 전체에 대해 수행하여, 최종적인 dmin 2을 가지는 스펙트럼을 제1검색스펙트럼으로 도출하는 도출 단계를 더 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
  10. 청구항 6에 있어서,
    상기 제6-2단계는, 상기 제2추가클러스터가 아래의 식에 의한 조건을 충족하는 경우 상기 제2추가클러스터를 검색에서 제외시키는 제2추가클러스터 선별 단계를 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
    dcenter - dmax > dmin 2
    여기서, dmin 2는 상기 입력 스펙트럼과 가장 가까운 상기 제2추가클러스터의 중심 간 거리의 제곱 값, dcenter는 상기 입력 스펙트럼과 상기 제2추가클러스터의 중심 간 거리, dmax는 상기 제2추가클러스터 내 상기 제2추가클러스터의 중심에서 가장 먼 거리에 있는 개체로부터 상기 입력 스펙트럼까지의 거리,이다.
  11. 청구항 10에 있어서,
    상기 제6-2단계는, 상기 제2추가클러스터 선별 단계에 의한 선별된 제2추가클러스터 내부에서, 상기 입력 스펙트럼과 상기 선별된 제2추가클러스터 내 각각의 스펙트럼 간 거리의 제곱 값의 누적 합이 dmin 2보다 큰 경우, 상기 입력 스펙트럼과 상기 선별된 제2추가클러스터 내 각각의 스펙트럼 간 거리 측정을 종료하는 종료 단계를 더 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
  12. 청구항 11에 있어서,
    상기 제6-2단계는, 상기 입력 스펙트럼과 상기 선별된 제2추가클러스터 내 소정의 스펙트럼 간 거리의 제곱 값이 dmin 2보다 작은 경우, 상기 소정의 스펙트럼과 상기 입력 스펙트럼 간 거리의 제곱 값을 dmin 2으로 변경하고, 이와 같은 과정을 상기 선별된 제2추가클러스터 전체에 대해 수행하여, 최종적인 dmin 2을 가지는 스펙트럼을 제2검색스펙트럼으로 도출하는 도출 단계를 더 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
  13. 청구항 6에 있어서,
    상기 제6-3단계는, 상기 기본클러스터가 아래의 식에 의한 조건을 충족하는 경우 상기 기본클러스터를 검색에서 제외시키는 기본클러스터 선별 단계를 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
    dcenter - dmax > dmin 2
    여기서, dmin 2는 상기 입력 스펙트럼과 가장 가까운 상기 기본클러스터의 중심 간 거리의 제곱 값, dcenter는 상기 입력 스펙트럼과 상기 기본클러스터의 중심 간 거리, dmax는 상기 기본클러스터 내 상기 기본클러스터의 중심에서 가장 먼 거리에 있는 개체로부터 상기 입력 스펙트럼까지의 거리,이다.
  14. 청구항 13에 있어서,
    상기 제6-3단계는, 상기 기본클러스터 선별 단계에 의한 선별된 기본클러스터 내부에서, 상기 입력 스펙트럼과 상기 선별된 기본클러스터 내 각각의 스펙트럼 간 거리의 제곱 값의 누적 합이 dmin 2보다 큰 경우, 상기 입력 스펙트럼과 상기 선별된 기본클러스터 내 각각의 스펙트럼 간 거리 측정을 종료하는 종료 단계를 더 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
  15. 청구항 14에 있어서,
    상기 제6-3단계는, 상기 입력 스펙트럼과 상기 선별된 기본클러스터 내 소정의 스펙트럼 간 거리의 제곱 값이 dmin 2보다 작은 경우, 상기 소정의 스펙트럼과 상기 입력 스펙트럼 간 거리의 제곱 값을 dmin 2으로 변경하고, 이와 같은 과정을 상기 선별된 기본클러스터 전체에 대해 수행하여, 최종적인 dmin 2을 가지는 스펙트럼을 제3검색스펙트럼으로 도출하는 도출 단계를 더 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 방법.
  16. 청구항 1의 라만 스펙트럼 식별 고속 탐색 방법을 수행하기 위한 라만 스펙트럼 식별 고속 탐색 장치에 있어서,
    적어도 하나 이상의 화학 시료를 포함하는 측정대상에 대해 라만 분광법을 수행하여 적어도 하나 이상의 라만 스펙트럼을 포함하는 입력 스펙트럼을 수집하는 신호취득부;
    상기 신호취득부와 연결되고, 상기 입력 스펙트럼의 해상도를 조절하고 잡음을 제거하는 전처리부;
    상기 전처리부와 연결되고, 입력 스펙트럼을 행렬 변환시키는 데이터 변환부;
    상기 데이터 변환부와 연결되고, 상기 입력 스펙트럼과 가장 근접한 상기 라이브러리 스펙트럼을 선택하기 위해 계층 클러스터 트리에 대한 검색을 수행하는 검색부; 및
    상기 검색부와 연결되고, 상기 측정대상에 포함되는 화학 물질을 도출하여 디스플레이 화면에 표시하는 출력부;를 포함하는 것을 특징으로 하는 라만 스펙트럼 식별 고속 탐색 장치.
KR1020190067294A 2019-06-07 2019-06-07 라만 스펙트럼 식별 고속 탐색 방법 및 장치 KR102172914B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190067294A KR102172914B1 (ko) 2019-06-07 2019-06-07 라만 스펙트럼 식별 고속 탐색 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190067294A KR102172914B1 (ko) 2019-06-07 2019-06-07 라만 스펙트럼 식별 고속 탐색 방법 및 장치

Publications (1)

Publication Number Publication Date
KR102172914B1 true KR102172914B1 (ko) 2020-11-03

Family

ID=73197826

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190067294A KR102172914B1 (ko) 2019-06-07 2019-06-07 라만 스펙트럼 식별 고속 탐색 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102172914B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113640277A (zh) * 2021-08-26 2021-11-12 中国工程物理研究院化工材料研究所 一种基于化学计量学的共晶炸药结构快速鉴定方法
KR102423057B1 (ko) * 2021-06-01 2022-07-20 (주)우림아이씨티 대상 물건의 재질 검출 방법
CN117191716A (zh) * 2023-11-03 2023-12-08 广东铂铭瑞智能科技有限公司 基于人工智能的磁性印刷品质量实时检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003511687A (ja) * 1999-10-14 2003-03-25 シーエムイー テレメトリクス インコーポレーテッド 波長較正の最適化方法
JP2013527913A (ja) * 2010-03-29 2013-07-04 ガルデルマ・リサーチ・アンド・デヴェロップメント ファジークラスタリングアルゴリズムと癌腫組織へのその応用
KR20160113899A (ko) * 2015-03-23 2016-10-04 국방과학연구소 분광장비를 이용하는 영상처리장치 및 그의 제어방법
JP2016224031A (ja) * 2015-04-22 2016-12-28 ザ・ボーイング・カンパニーThe Boeing Company フォービエイテッド圧縮投影を用いたハイパースペクトルデミキシング
JP2017502296A (ja) * 2013-12-27 2017-01-19 同方威視技術股▲分▼有限公司 珠玉宝石鑑定方法及び機器
KR20180051239A (ko) 2016-11-08 2018-05-16 수원대학교산학협력단 라만분광법에 의한 블랙플라스틱 선별을 위한 전처리기반 지능분류 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003511687A (ja) * 1999-10-14 2003-03-25 シーエムイー テレメトリクス インコーポレーテッド 波長較正の最適化方法
JP2013527913A (ja) * 2010-03-29 2013-07-04 ガルデルマ・リサーチ・アンド・デヴェロップメント ファジークラスタリングアルゴリズムと癌腫組織へのその応用
JP2017502296A (ja) * 2013-12-27 2017-01-19 同方威視技術股▲分▼有限公司 珠玉宝石鑑定方法及び機器
KR20160113899A (ko) * 2015-03-23 2016-10-04 국방과학연구소 분광장비를 이용하는 영상처리장치 및 그의 제어방법
JP2016224031A (ja) * 2015-04-22 2016-12-28 ザ・ボーイング・カンパニーThe Boeing Company フォービエイテッド圧縮投影を用いたハイパースペクトルデミキシング
KR20180051239A (ko) 2016-11-08 2018-05-16 수원대학교산학협력단 라만분광법에 의한 블랙플라스틱 선별을 위한 전처리기반 지능분류 방법

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102423057B1 (ko) * 2021-06-01 2022-07-20 (주)우림아이씨티 대상 물건의 재질 검출 방법
CN113640277A (zh) * 2021-08-26 2021-11-12 中国工程物理研究院化工材料研究所 一种基于化学计量学的共晶炸药结构快速鉴定方法
CN113640277B (zh) * 2021-08-26 2023-08-22 中国工程物理研究院化工材料研究所 一种基于化学计量学的共晶炸药结构快速鉴定方法
CN117191716A (zh) * 2023-11-03 2023-12-08 广东铂铭瑞智能科技有限公司 基于人工智能的磁性印刷品质量实时检测方法
CN117191716B (zh) * 2023-11-03 2024-01-09 广东铂铭瑞智能科技有限公司 基于人工智能的磁性印刷品质量实时检测方法

Similar Documents

Publication Publication Date Title
McFee et al. Analyzing Song Structure with Spectral Clustering.
KR102172914B1 (ko) 라만 스펙트럼 식별 고속 탐색 방법 및 장치
RU2012152447A (ru) Выполняемый в окне статистический анализ для обнаружения аномалий в наборах геофизических данных
US20190179874A1 (en) Analysis data processing method and analysis data processing device
US11550823B2 (en) Preprocessing for a classification algorithm
CN111898637A (zh) 一种基于ReliefF-DDC特征选择算法
Chelvan et al. A comparative analysis of feature selection stability measures
JPWO2009060722A1 (ja) 類似画像検索装置
CN111105041A (zh) 一种用于智慧数据碰撞的机器学习方法及装置
Solano et al. Radiolarian classification decision support using supervised and unsupervised learning approaches
Momtaz et al. Estimating the photometric redshifts of galaxies and QSOs using regression techniques in machine learning
Polsterer et al. Uncertain photometric redshifts
Devi et al. Similarity measurement in recent biased time series databases using different clustering methods
Johnpaul et al. Representational primitives using trend based global features for time series classification
US20240011910A1 (en) Methods and systems for raman spectra-based identification of chemical compounds
CN111178180A (zh) 基于改进型蚁群算法的高光谱影像特征选择方法及装置
Dumitrache et al. Churn prepaid customers classified by HyperOpt techniques
Priyadarshini et al. Developing a Deep Learning Heart Stroke Prediction Model Using Combination of Fixed Row Initial Centroid Method with Navie Bayes and Decision Tree Classifiers
Kalpana et al. A New Hybrid Framework for Filter based Feature Selection using Information Gain and Symmetric Uncertainty
US11898963B2 (en) Identifying 3D objects
Ma et al. Exploring discriminative features in Mueller matrix images for electrospinning classification
Perevoznikov et al. A way to increase the prediction quality for the large set of molecular graphs by using the k-NN classifier
Pineau et al. Statistical identification of 2XMMi sources
JP2016080402A (ja) 学習装置、学習方法及びプログラム
Li et al. Multiple sparse spaces network pruning via a joint similarity criterion

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant