KR20230150301A - 화합물의 라만 스펙트럼-기반 식별을 위한 방법 및 시스템 - Google Patents

화합물의 라만 스펙트럼-기반 식별을 위한 방법 및 시스템 Download PDF

Info

Publication number
KR20230150301A
KR20230150301A KR1020237029676A KR20237029676A KR20230150301A KR 20230150301 A KR20230150301 A KR 20230150301A KR 1020237029676 A KR1020237029676 A KR 1020237029676A KR 20237029676 A KR20237029676 A KR 20237029676A KR 20230150301 A KR20230150301 A KR 20230150301A
Authority
KR
South Korea
Prior art keywords
raman
raman spectrum
barcode
simulated
spectrum
Prior art date
Application number
KR1020237029676A
Other languages
English (en)
Inventor
앤드류 제임스 마이어
라파엘 피쉬
브렌던 리드 후앙
Original Assignee
제넨테크, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 제넨테크, 인크. filed Critical 제넨테크, 인크.
Publication of KR20230150301A publication Critical patent/KR20230150301A/ko

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/44Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N2021/6417Spectrofluorimetric devices

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Spectrometry And Color Measurement (AREA)

Abstract

화합물의 라만 스펙트럼-기반 식별을 위한 방법 및 시스템
라만 분광 측정 및 인-실리코(in-silico) 시뮬레이션 라만 스펙트럼에 기초하여 화합물을 식별하기 위한 방법 및 시스템이 개시된다. 다양한 실시예에서, 미지 화합물의 라만 바코드는 미지 화합물에 대한 라만 분광 측정을 수행함으로써 획득된 라만 스펙트럼으로부터 생성될 수 있다. 그런 다음 라만 바코드는 공지된 화합물의 참조 인-실리코 시뮬레이션 라만 바코드의 라이브러리와 비교될 수 있으며, 미지 화합물의 정체가 이 비교에 기초하여 결정될 수 있다.

Description

화합물의 라만 스펙트럼-기반 식별을 위한 방법 및 시스템
관련 출원에 대한 상호 참조
본 출원은 2021년 3월 4일에 출원된 미국 가특허 출원 일련 번호 63/156,846호에 대한 우선권을 주장하며, 그 전체 내용이 참조로 여기에 포함된다.
기술분야
본 출원은 화합물의 라만 스펙트럼을 사용한 화합물의 분류 및 식별에 관한 것으로, 특히 화합물의 측정된 라만 스펙트럼을 인-실리코(in-silico) 시뮬레이션 라만 스펙트럼의 참조 라이브러리와 비교함으로써 이루어진다.
라만 분광법은 샘플에 입사하는 빛이 비탄성적으로 산란되는 스펙트럼 측정 기술로서, 즉, 산란광의 주파수와 입사광의 주파수가 다르다. 주파수의 변화, 즉 에너지의 변화는 샘플의 화학 결합의 낮은 에너지 모드와 빛의 상호 작용 때문이다. 샘플의 라만 스펙트럼은 산란광으로부터 결정될 수 있으며 샘플을 식별하고 분류하는 데 사용할 수 있다.
다음은 논의된 기술의 기본적인 이해를 제공하기 위해 본 개시의 다양한 실시예를 요약한다. 이러한 간단한 설명은 본 발명의 모든 고려된 특징의 광범위한 개요가 아니며, 본 발명의 모든 실시예의 주요 또는 중요한 요소를 식별하거나 본 발명의 일부 또는 모든 실시예의 범위를 기술하려는 의도가 아니다. 그것의 유일한 목적은 나중에 제시되는 더 상세한 설명에 대한 전주곡으로서 요약된 형태로 본 발명의 하나 이상의 실시예의 일부 개념을 제시하는 것이다.
본 개시내용의 다양한 실시예는 미지 화합물의 라만 분광 측정으로부터 추출된 미지 화합물의 라만 스펙트럼을 획득하는 단계를 포함하는 방법을 개시한다. 다양한 실시예에서, 방법은 획득된 라만 스펙트럼을 시뮬레이션 라만 스펙트럼 라이브러리에 포함된 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼과 비교하는 단계를 추가로 포함한다. 다양한 실시예에서, 각각의 시뮬레이션 라만 스펙트럼은 공지된 화합물의 양자역학적 연산을 통해 생성된다. 상기 방법은 획득된 라만 스펙트럼과 참조 시뮬레이션 라만 스펙트럼의 비교에 기초하여 미지 화합물의 정체를 식별하는 단계를 추가로 포함한다.
본 개시내용의 다양한 실시예는 명령어를 저장하는 비일시적 메모리와, 상기 비일시적 메모리에 결합되어, 시스템으로 하여금 동작들을 수행하게 하는 명령어들을 비일시적 메모리로부터 판독하도록 구성되는, 하나 이상의 하드웨어 프로세서를 포함하는 시스템을 개시한다. 다양한 실시예에서, 상기 동작들은: 미지 화합물의 라만 분광 측정으로부터 추출된, 미지 화합물의 라만 스펙트럼을 획득하는 것을 포함한다. 다양한 실시예에서, 상기 동작들은 획득된 라만 스펙트럼을, 시뮬레이션 라만 스펙트럼 라이브러리에 포함된 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼과 비교하는 것을 추가로 포함한다. 다양한 실시예에서, 각각의 시뮬레이션 라만 스펙트럼은 공지된 화합물의 양자역학적 연산을 통해 생성된다. 상기 동작들은 획득된 라만 스펙트럼과 참조 시뮬레이션 라만 스펙트럼의 비교에 기초하여 미지 화합물의 정체를 식별하는 것을 추가로 포함한다.
본 발명의 다양한 양태는 동작들을 수행시키도록 실행가능한 컴퓨터 판독가능 명령어를 저장한 비일시적 컴퓨터 판독가능 매체(CRM)를 개시한다. 다양한 실시예에서, 상기 동작들은 미지 화합물의 라만 분광 측정으로부터 추출된, 미지 화합물의 라만 스펙트럼을 획득하는 것을 포함한다. 다양한 실시예에서, 상기 동작들은 획득된 라만 스펙트럼을 시뮬레이션 라만 스펙트럼 라이브러리에 포함된 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼과 비교하는 것을 추가로 포함한다. 다양한 실시예에서, 각각의 시뮬레이션 라만 스펙트럼은 공지된 화합물의 양자역학적 연산을 통해 생성된다. 상기 동작들은 획득된 라만 스펙트럼과 참조 시뮬레이션 라만 스펙트럼의 비교에 기초하여 미지 화합물의 정체를 식별하는 것을 추가로 포함한다.
본 발명의 다른 양태, 특징 및 실시예는 첨부된 도면과 함께 본 발명의 특정한 예시적인 실시예에 대한 다음의 설명을 검토할 때 당업자에게 명백해질 것이다. 본 발명의 특징이 아래의 특정 실시예 및 도면과 관련하여 논의될 수 있지만, 본 발명의 모든 실시예는 여기에서 논의되는 유리한 특징 중 하나 이상을 포함할 수 있다. 다시 말해, 하나 이상의 실시예가 특정한 유리한 특징을 갖는 것으로 논의될 수 있지만, 이러한 특징 중 하나 이상이 여기서 논의된 개시 내용의 다양한 실시예에 따라 사용될 수도 있다. 유사한 방식으로, 예시적인 실시예가 장치, 시스템, 매체 또는 방법 실시예로서 아래에서 논의될 수 있지만, 이러한 예시적인 실시예는 다양한 장치, 시스템, 매체 및 방법으로 구현될 수 있음을 이해해야 한다.
본 명세서에 개시된 원리 및 그 장점의 보다 완전한 이해를 위해, 이제 첨부된 도면과 함께 취해진 다음의 설명을 참조한다:
도 1은 다양한 실시예에 따른 라만 스펙트럼 기반 화합물 분류 시스템의 블록도이다.
도 2는 다양한 실시예에 따라 화합물의 측정된 라만 스펙트럼과 인-실리코 시뮬레이션 라만 스펙트럼의 비교에 기초한 화합물의 식별의 예시적인 예시를 도시한다.
도 3은 다양한 실시예에 따라 화합물의 인-실리코 시뮬레이션 라만 바코드의 비교에 기초한 화합물의 식별의 예시적인 예시를 도시한다.
도 4는 다양한 실시예에 따라 화합물의 측정된 라만 바코드와 화합물의 참조 인-실리코 시뮬레이션 라만 바코드의 라이브러리의 비교에 기초한 화합물 식별의 예시적인 예시를 도시한다.
도 5는 다양한 실시예에 따라 화합물의 측정된 라만 바코드와 화합물의 참조 인-실리코 시뮬레이션 라만 바코드 라이브러리의 비교에 기초하여 화합물의 유사성의 결정을 예시하는 예시적인 그리드를 도시한다.
도 6은 다양한 실시예에 따라 화합물의 측정된 라만 바코드와 화합물의 참조 인-실리코 시뮬레이션 라만 바코드 라이브러리의 비교에 기초하여 미지 화합물을 식별하기 위한 방법의 흐름도이다.
도 7은 다양한 실시예에 따른 컴퓨터 시스템의 블록도이다.
도면은 반드시 축척대로 그려지지 않으며, 도면의 물체는 서로에 대해 반드시 축척대로 그려지지 않는다는 것을 이해해야 한다. 도면은 본 명세서에 개시된 장치, 시스템 및 방법의 다양한 실시예에 대한 명확성과 이해를 제공하기 위한 묘사이다. 가능하면 동일하거나 유사한 부품을 나타내기 위해 도면 전체에서 동일한 참조 번호가 사용된다. 더욱이, 도면은 어떤 식으로든 본 교시의 범위를 제한하려는 의도가 아님을 이해해야 한다.
미지 화합물은 미지 화합물로부터 산란된 광을 분석하여 라만 스펙트럼을 추출하는 라만 분광계 기술을 사용하여 측정할 수 있는 라만 스펙트럼에 기초하여 식별 및 분류할 수 있다. 미지 화합물을 식별/분류하기 위해, 라만 분광 측정을 통해 획득된 미지 화합물의 라만 스펙트럼을 다양한 화합물의 측정된 라만 스펙트럼을 포함하는 참조 라만 스펙트럼 라이브러리와 비교할 수 있으며, 미지 화합물은 비교 결과 일치가 나올 때 식별/분류된다(예: 분류 알고리즘 사용). 예를 들어, 측정된 미지 화합물의 라만 스펙트럼 피크와 참조 라만 스펙트럼 라이브러리에 저장된 후보 화합물의 측정 라만 스펙트럼 피크를 비교할 수 있고, 측정된 라만 스펙트럼의 피크 중 적어도 미리 결정된 부분이 후보 화합물의 라만 스펙트럼의 피크와 동일하거나 실질적으로 동일한 파수에 위치할 때 후보 화합물이 동일한 화합물인 것으로 식별될 수 있다. "측정된 라만 스펙트럼"이라는 용어는 라만 분광계와 같은 분광 기기를 사용하여 실험적으로 획득된 라만 스펙트럼을 지칭하는 것으로 이해된다.
그러나 화합물의 참조 라만 스펙트럼의 강력한 라이브러리(즉, 참조 스펙트럼으로 사용될 수 있는 측정된 라만 스펙트럼의 라이브러리)를 개발하는 것은 기술적으로 어려울 수 있다. 예를 들어, 분광계와 같은 기기를 사용하여 참조 라만 스펙트럼 라이브러리를 구축하기 위한 실험적 측정은 기기 검출기 노이즈, 기기 간 변동성, 기기 구성(예: 레이저 출력, 레이저 주파수 등), 샘플 용기 간섭 등과 같은, 그러나 이에 제한되지 않는, 요인들에 의해 영향받을 수 있으며, 이는 스펙트럼 품질 및 특징부 모양에 변화를 일으킬 수 있고, 신뢰할 수 있고 강력한 라이브러리를 구축하려는 노력을 복잡하게 만들 수 있다. 또한, 이러한 요인으로 인해 추가 분자 또는 화합물의 스펙트럼을 기존 라이브러리에 추가하는 것이 어려울 수 있고, 분류 방법 또는 알고리즘을 한 기기 또는 분광계에서 다른 기기 또는 분광계로 변환하는 것이 어려울 수 있다. 또한 측정된 라만 스펙트럼에 적용되는 기준선 제거 기술이 실제 신호를 제거하여 사용 가능한 정보가 손실될 수도 있다. 예를 들어 노이즈 또는 배경을 평활화하기 위해 측정된 라만 스펙트럼에 적용되는 기술은 여러 개면서도 가까운 피크들을 단일 피크로 만들 수 있으므로 귀중한 신호 정보가 손실될 수 있다. 또한 독성 또는 유해 분자 또는 화합물의 라만 스펙트럼 측정은 무엇보다도 실험적 보호 장치가 필요하기 때문에 비용이 많이 들고 까다로울 수 있다. 이와 같이, 이러한 라이브러리를 이용하여 미지 화합물을 식별 및 분류할 때 참조(측정된) 라만 스펙트럼 라이브러리의 앞서 언급한 단점을 해결하는 데 사용할 수 있는 강력한 라만 스펙트럼 라이브러리의 개발을 용이하게 하는 방법 및 시스템이 필요하다.
본 개시내용의 다양한 실시예는 인-실리코 생성되는 화합물의 참조 라만 스펙트럼, 즉 시뮬레이션되거나 연산된 라만 스펙트럼(예를 들어, 측정된 라만 스펙트럼과 반대)의 라이브러리를 개시한다. 예를 들어 미지 화합물이나 분자를 식별하기 위해 이러한 인-실리코 시뮬레이션 라만 스펙트럼을 사용하면 몇 가지 이점이 있을 수 있다. 예를 들어, 인-실리코 시뮬레이션 라만 스펙트럼은 샘플 또는 기기/분광계 변동성으로 인해 어려움을 겪지 않는다. 예를 들어, 인-실리코 시뮬레이션 라만 스펙트럼에는 샘플 오염으로 인해 측정된 라만 스펙트럼에 나타나는 잘못된 피크가 포함되지 않는다. 즉, 인-실리코 시뮬레이션 라만 스펙트럼은 동일한 연산 방법이 라만 스펙트럼을 연산하는 데 사용되는 경우, 동일한 화합물에 대해 동일하다(가령, 그리고 이와 같이, 동일한 화합물에 대해 여러 라만 스펙트럼 복제본을 포함하는 측정된 라만 스펙트럼 라이브러리와 달리, 라이브러리가 주어진 화합물에 대해 단일 라만 스펙트럼만을 갖는 것으로 충분함). 또한 독성 물질의 라만 스펙트럼 측정과 관련된 운영상의 문제 및 비용은 인-실리코 시뮬레이션 라만 스펙트럼을 생성할 때 발생하지 않는다.
도 1은 다양한 실시예에 따른 라만 스펙트럼 기반 화합물 분류 시스템(100)의 블록도이다. 다양한 실시예에서, 라만 분광계(102)와 같은 기기는 화합물의 라만 스펙트럼 측정치(104)를 획득하기 위해 사용될 수 있다. 다양한 경우에, 라만 분광계(102)는 샘플(예를 들어, 분자, 화합물 등)을 향해 빛을 방출하고, 샘플의 저-에너지 진동, 회전 등 모드와 상호 작용한 후에 산란되는 빛을 검출할 수 있다. 샘플의 라만 스펙트럼은 산란광과 입사광의 주파수 차이의 함수로서 산란광의 강도를 보여준다. 강도 및 주파수 변화는 샘플의 화학 성분에 의존할 수 있기 때문에, 다양한 경우에, 상이한 분자, 화합물 등의 라만 스펙트럼 측정(104)은 서로 상이할 수 있으며, 이에 따라 분자, 화합물, 등의 식별 및 분류에 사용될 수 있다.
다양한 실시예에서, 라만 스펙트럼 기반 화합물 분류 시스템(100)은 또한, 분자, 화합물 등의 시뮬레이션 라만 스펙트럼(108)을, 가령, 무엇보다도, 그 재료 및/또는 화학적 구조에 기초하여, 연산하거나 시뮬레이션하도록 구성된 라만 스펙트럼 계산기(106)를 포함할 수 있다. 즉, 화합물의 재료 및/또는 화학 구조가 제공된 경우, 라만 스펙트럼 계산기(106)는 화합물의 인-실리코 시뮬레이션 라만 스펙트럼을 생성하도록 구성될 수 있다. 다양한 경우에, 라만 스펙트럼 계산기(106)는 컴퓨팅 노드의 동작을 제어하도록 구성된 프로세서에 결합된 메모리를 포함하는 컴퓨팅 노드를 포함할 수 있다. 다양한 경우에, 프로세서는 하나 이상의 중앙 처리 장치, 멀티 코어 프로세서, 마이크로프로세서, 마이크로컨트롤러, 디지털 신호 프로세서, FPGA(field programmable gate arrays), ASIC(application specific integrated circuits), 그래픽 처리 장치(GPU) 및/또는 등이거나 이를 포함할 수 있다. 컴퓨팅 노드는 독립형 서브시스템, 컴퓨팅 장치에 추가된 보드, 및/또는 가상 머신으로 구현될 수 있다.
다양한 실시예에서, 라만 스펙트럼 계산기(106)는, 앞서 언급한 바와 같이, 분자, 화합물 등의 시뮬레이션 라만 스펙트럼(108)을, 가령, 무엇보다도, 그 재료 및/또는 화학적 구조에 기초하여, 계산하거나 시뮬레이션하도록 설계 또는 구성된 모듈을 포함할 수 있다. 다양한 경우에, 이러한 모듈은 시뮬레이션, 즉, 인-실리코 라만 스펙트럼(108)을 연산하기 위해 밀도-범함수 이론(DFT) 연산과 같은, 그러나 이에 제한되지 않는, 양자역학 연산을 수행할 수 있는 능력을 가질 수 있다. 예를 들어, 이러한 모듈들은 Gaussian, Inc.의 Gaussian 소프트웨어 시리즈(예: Gaussian09, Gaussian 16 등) 중 임의의 것이거나 이를 포함할 수 있다. 다양한 경우에, Gaussian 소프트웨어는 화합물의 3D 구조를 입력으로 사용하고, DFT 연산(예: 6-31G(d) 기본 세트가 있는 B3LYP의 밀도 기능 방법)을 수행하여 인-실리코 시뮬레이션 라만 스펙트럼(108)을 생성한다. 다양한 경우에 3D 구조를 포함하는 입력 파일은 화학 물질의 3D 구조를 가져오는, 그리고 Gaussian 09의 입력으로 사용할 수 있는 입력 파일을 출력하는 Avogardo 화학 모델링 소프트웨어의 가우시안 소프트웨어 확장에 의해 생성될 수 있다.
다양한 실시예에서, 라만 스펙트럼 기반 화합물 분류 시스템(100)은 또한 라만 스펙트럼 측정값(104)을 수신하여 스펙트럼 측정값의 라만 바코드를 생성하도록 구성된 라만 바코드 생성기(110)를 포함할 수 있다. 다양한 경우에, 라만 바코드 생성기(110)는, 스펙트럼 평활화(예: 고주파 노이즈 제거), 가우시안 노이즈 제거, 형광 배경, 우주 스파이크, 실험 아티팩트, 등을 포함하지만 이에 제한되지 않는, 기준선 교정을 수행하도록 라만 분광계(102)로부터 라만 스펙트럼 측정치(104)를 수신하고 라만 스펙트럼 측정치(104)를 전처리하도록 구성된 스펙트럼 측정 전처리기(112)를 포함할 수 있다.
다양한 실시예에서, 라만 바코드 생성기(110)는 (예를 들어, 각각의 라만 스펙트럼의 라만 바코드를 생성하기 전에) 라만 스펙트럼 측정치(104)를 시뮬레이션 라만 스펙트럼(108)과 비교하도록 구성될 수 있다. 예를 들어, 라만 바코드 생성기(110)는 스펙트럼 측정 전처리기(112)로부터 전처리된 라만 스펙트럼 측정을, 그리고 라만 스펙트럼 계산기(106)로부터 인-실리코 시뮬레이션 라만 스펙트럼(108)을 수신하도록 구성된 선택적 스펙트럼 비교 모듈(114)을 포함할 수 있어서, 피크들을 비교할 수 있다(예를 들어, (가령, 104로부터의) 측정된 라만 스펙트럼에 대응하는 화합물과 시뮬레이션 라만 스펙트럼(108)이 일치하는지를 결정할 수 있다). 다양한 경우에, 전처리된 라만 스펙트럼 측정치와 인-실리코 시뮬레이션 라만 스펙트럼(108)의 피크를 비교하는 것은, (예를 들어, 스펙트럼들 사이의 파수 오프셋이, 있는 경우, 수정된 후) 스펙트럼들 중 하나의 피크들 중 적어도 상당한 수의 피크가 동일하거나 실질적으로 유사한 파수 위치에서 다른 스펙트럼에도 존재하는지 여부를 결정하기 위해 체크하는 것을 포함할 수 있다. 즉, 전처리된 라만 스펙트럼 측정의 피크와 인-실리코 시뮬레이션 라만 스펙트럼(108)의 피크를 비교하는 것은, (예를 들어, 스펙트럼들 사이의 파수 오프셋이, 있는 경우, 수정된 후) 전처리된 라만 스펙트럼 측정치 및 인-실리코 시뮬레이션 라만 스펙트럼(108)의 피크들 중 적어도 상당한 수의 파수 위치가 졍렬되는지 여부를 결정하기 위해 체크하는 것을 포함할 수 있다. 다양한 경우에, 상기 피크들은 임계 강도 레벨을 초과하는 강도를 갖는 피크일 수 있다. 다양한 경우에, 전처리된 라만 스펙트럼 측정치와 인-실리코 시뮬레이션 라만 스펙트럼(108)의 피크를 비교하는 것은 정렬된 피크(즉, 동일하거나 실질적으로 유사한 파수 위치에 위치하거나 정렬된 전처리된 라만 스펙트럼 측정치 및 인-실리코 시뮬레이션 라만 스펙트럼(108)으로부터의 피크들)가 적어도 실질적으로 동일한 강도를 갖는지 여부를 결정하기 위해 체크하는 것을 포함할 수 있다. 다양한 경우에, (가령, 스펙트럼들간 파수 오프셋이, 있다면, 교정된 후) 피크가 약 0.5%, 약 1%, 약 3%, 약 5%, 약 10% 내에 위치한다면(그 사이의 값과 하위 범위 포함), 피크가 서로 "정렬"된다 또는 "동일하거나 실질적으로 동일한" 파수 위치에 위치한다고 이해될 수 있다.
다양한 경우에, 전술한 바와 같이 측정된 스펙트럼과 시뮬레이션 스펙트럼의 피크를 비교하기 전에, 스펙트럼 비교 모듈(114)은 그 사이의 임의의 파수 오프셋을 보정하기 위해 스케일링 알고리즘을 하나 또는 둘 모두의 스펙트럼에 적용할 수 있다. 다양한 경우에, 스케일링 알고리즘은 전처리된 라만 스펙트럼 측정 및/또는 인-실리코 시뮬레이션 라만 스펙트럼(108)에 적용될 수 있다. 스케일링 알고리즘은 일부 다른 참조 화합물에 대해 수행된 측정에 기초하여 도출된 알고리즘일 수 있다. 예를 들어, 스케일링 알고리즘은 화합물 인덴에 대해 수행된 측정으로부터 유도된 선형 스케일링 방정식을 포함하거나 선형 스케일링 방정식일 수 있다. 이러한 선형 스케일링 방정식의 예는 νmeascalc=1.0-0.00002520νcalc를 읽을 수 있으며, 여기서 νmeas 및 νcalc는 측정 및 계산된 파수이다. 다양한 경우에, 스케일링 알고리즘은 또한 스케일링 알고리즘 또는 스케일링 방정식에 더 적합한 파라미터를 도출하기 위한 최적화 기능 또는 기법(예를 들어, Nedler-Mead 방법, 패턴 검색, 시뮬레이션 어닐링 등)을 포함할 수 있다.
측정된 라만 스펙트럼과 인-실리코 시뮬레이션 스펙트럼의 비교의 예시적인 도해가 도 2에 도시되어 있고, 이는 시클로헥산(C6H12)의 측정 및 인-실리코 시뮬레이션 스펙트럼의 예를 포함한다. 도 2는 다양한 실시예에 따라 화합물의 측정된 라만 스펙트럼과 인-실리코 시뮬레이션 라만 스펙트럼의 비교에 기초하여 미지 화합물, 이 경우에는 시클로헥산의 식별을 예시하는 예시적인 플롯(200)을 도시한다. 다양한 경우에, 미지 화합물의 라만 스펙트럼을 측정하고 처리하여 그 미지 화합물의 전처리된 측정 라만 스펙트럼(210)을 얻을 수 있다. 전처리된 측정 라만 스펙트럼(210)은 매칭 인-실리코 시뮬레이션 라만 스펙트럼(220)을 식별하기 위해 하나 이상의 인-실리코 시뮬레이션 라만 스펙트럼(예를 들어, 다양한 화합물의 인-실리코 시뮬레이션 라만 스펙트럼의 라이브러리로부터)과 비교될 수 있다. 예를 들어, 도 2를 참조하면, 전처리된 측정 라만 스펙트럼(210)은 전처리된 측정 라만 스펙트럼(210)이 인-실리코 시뮬레이션 라만 스펙트럼의 라이브러리에 저장된 시클로헥산의 인-실리코 시뮬레이션 라만 스펙트럼(220)과 일치하는 것으로 결정될 때까지 인-실리코 시뮬레이션 라만 스펙트럼의 라이브러리와 비교될 수 있고, 이 후, 측정 라만 스펙트럼에 대응하는 미지 화학물이 시클로헥산으로 식별될 수 있다. 경우에, 전처리된 측정 라만 스펙트럼(210)과 인-실리코 시뮬레이션 라만 스펙트럼(220)의 일치 결정은 동일하거나 실질적으로 동일한 파수 위치에서 존재하거나 정렬된 두 스펙트럼의 피크를 기반으로 할 수 있다. 예를 들어, 2개의 스펙트럼(210, 220)은 스펙트럼의 피크의 적어도 미리 결정된 수가 동일한 또는 실질적으로 동일한 파수 위치에 위치할 때(예를 들어, 스펙트럼들 간의 파수 오프셋이, 존재한다면, 앞서 논의한 바와 같이 보정된 후), 일치한다고 결정될 수 있다. 다양한 경우에, 이들 피크는 임계 강도 레벨을 초과하는 강도를 갖는 피크일 수 있다.
다양한 경우에, 다변량 데이터 분석(MVDA) 기술은 분류 목적을 위해 전처리된 측정 라만 스펙트럼(210)과 인-실리코 시뮬레이션 라만 스펙트럼(220)을 비교하여, 예를 들어, 후자 대비 전자를 분류하는 데 사용될 수 있다. MVDA 기술의 예로는 PCA(주성분 분석) 및 PLSD(부분 최소 제곱 판별) 기술이 있으며, 이들은 변수와 샘플 수가 많은 데이터에 대한 분석을 수행하는 데 사용된다. 다양한 경우에, PCA, PLSD, 등과 같은 MDVA 기술은 많은 수의 데이터포인트의 초기 데이터세트의 경우보다 적은 차원의 차원 공간에 데이터 포인트들을 투영하도록 측정 라만 스펙트럼을 따라 많은 수의 데이터 포인트(가령, 약 1,000 내지 약 5,000 까지 범위의, 약 3,000, 등, 해당 값 및 사이의 하위 범위를 포함)에 적용될 수 있다. 이러한 경우 라만 스펙트럼은 더 적은 차원의 차원 공간에서 투영된 데이터 포인트들의 그룹화를 기반으로 분류될 수 있다.
다양한 실시예에서, 전처리된 측정 라만 스펙트럼(210)은 전처리된 측정 라만 스펙트럼(210) 및 인-실리코 시뮬레이션 라만 스펙트럼의 원시 스펙트럼 벡터의 유사성을 비교함으로써 인-실리코 시뮬레이션 라만 스펙트럼의 라이브러리 내 인-실리코 시뮬레이션 스펙트럼과 비교될 수 있다. 예를 들어, 벡터 공간 내 벡터 간의 "거리"를 계산하기 위해 거리 메트릭을 사용하여 유사성을 측정할 수 있다. 이러한 메트릭의 예는 유클리드 메트릭이고, 전처리된 측정 라만 스펙트럼(210)과 인-실리코 시뮬레이션 스펙트럼의 원시 스펙트럼 벡터들의 유클리드 거리 및/또는 공분산은 전자와 후자 간 유사성의 레벨을 정량화하도록 계산될 수 있다.
다양한 실시예에서, 라만 바코드 생성기(110)는 라만 스펙트럼 계산기(106)로부터 스펙트럼 측정 전처리기(112)에 의해 전처리된 라만 스펙트럼 측정치 및 인-실리코 시뮬레이션 라만 스펙트럼(108) 중 하나 또는 둘 모두의 피크를 변환하여, 상기 스펙트럼의 피크들을 라만 바코드로 변환하도록 구성될 수 있다. 예를 들어, 라만 바코드 생성기(110)는 라만 스펙트럼을 수신하고 라만 스펙트럼의 피크를 식별한 다음, 피크를 나타내거나 이에 대응하는, 그리고 동일하거나 실질적으로 동일한 파수 위치에 위치하는, 바를 갖는 라만 바코드를 생성하도록 구성된 피크-바코드 변환기 모듈(116)을 포함할 수 있다. 다양한 경우에, 라만 바코드 생성기(110)는 라만 스펙트럼에서 피크의 존재를 검출하고 파수 위치를 식별하기 위해 Eigenvector Research, Inc에 의한 알고리즘 피크 찾기와 같은, 그러나 이에 제한되지 않는, 피크 검출 알고리즘을 포함할 수 있다. 이어서, 라만 바코드 생성기(110)는 라만 바코드를 생성하고, 피크에 대응하는(예를 들어, 그리고 바코드의 피크를 나타내는) 라만 바코드의 파수 위치에 바를 배치할 수 있다. 다양한 경우에, 피크의 파수 위치는 피크의 팁의 파수 위치, 즉 피크의 가장 높은 강도에 해당하는 파수 위치를 지칭하는 것으로 이해될 수 있고, 또는, 피크가 보다 둥근 팁을 갖는 경우, 피크의 둥근 팁 부분의 중심을 지칭하는 것으로 이해될 수 있다. 다양한 경우에, 라만 바코드 생성기(110)는 2012년 8월 3일자, "An Efficient Algorithm for Automatic Peak Detection in Noisy Periodic and Quasi-Periodic Signals"라는 제목의 F. Scholkmann, 등의 문서에서 논의된 것과 같은, 추가적인 피크 검출 알고리즘을 포함할 수 있다고, 그 전체 내용이 참조로 본 명세서에 포함된다.
다양한 실시예에서, (예를 들어, 피크 검출 알고리즘에 의해) 라만 스펙트럼에서 이와 같이 식별된 피크는, 피크 강도가 사전 결정된 피크 강도 임계값을 초과하는 경우에(예를 들어, 그리고 일부 경우에만) 라만 바코드에 포함될 수 있다. 즉, 라만 바코드의 바에 의해 표현될 수 있다. 다양한 경우에, 피크 강도 임계값은 라만 스펙트럼의 피크들 중 하나 이상의 강도와 관련될 수 있다. 예를 들어, 피크 강도 임계값은 라만 스펙트럼의 가장 높은 피크의 일부일 수 있거나 라만 스펙트럼에서 피크 검출 알고리즘에 의해 검출된 피크들 일부 또는 전부의 평균일 수 있다.
도 3은 다양한 실시예에서, 라만 스펙트럼에서 피크의 식별, 및 식별된 피크에 기초한 라만 바코드의 생성의 예시적인 도해(300)를 도시한다. 피크의 식별 및 라만 바코드의 생성과 관련된 본원의 논의가 시클로헥산의 인-실리코 시뮬레이션 라만 스펙트럼(310)을 언급하지만, 다양한 경우에, 논의는 측정된 라만 스펙트럼에 동일하게 적용된다. 다양한 경우에, 라만 스펙트럼은 연산되거나 시뮬레이션될 수 있고(예를 들어, 측정되고 전처리될 수 있고) 라만 스펙트럼(310)은 피크 검출 알고리즘에 의해 검출되는 다중 피크를 가질 수 있다. 그 후 일부 피크(예를 들어, 강도가 피크 강도 임계값을 초과하는 피크) 또는 모든 피크의 파수 위치가 식별될 수 있고, 라만 바코드(320)가 식별된 파수 위치에 위치한 바를 사용하여 생성(330)될 수 있다. 위에서 언급한 바와 같이, 피크의 파수 위치는 피크의 팁 또는 최고 강도 값의 파수 위치에 해당하거나 같을 수 있으며, 또는, 피크의 팁이 둥근 경우 피크의 둥근 팁 부분의 중심에 해당할 수 있다.
다양한 실시예에서, 라만 스펙트럼에 상응하는 화합물의 정체를 식별하기 위해 라만 스펙트럼을 비교하는 것 대신에 또는 그에 더하여(예를 들어, 측정 및 인-실리코 시뮬레이션 라만 스펙트럼에 대해 도 2에 도시된 바와 같이), 라만 스펙트럼의 라만 바코드는 식별 목적으로 또는 화합물 간의 유사성 레벨을 결정하기 위해 비교될 수 있다. 도 3은 시클로헥산(320)과 이소프로필 알코올(IPA)(350)의 인-실리코 시뮬레이션 라만 바코드를 비교한 예를 보여주며, 이들은 (가령, 라만 바코드 생성기(110)의 피크-바코드 변환기 모듈(116)을 이용하여) 앞서 논의한 각각의 인-실리코 시뮬레이션 라만 스펙트럼(310, 340)으로부터 변환된다. 다양한 경우에, 비교는 2개의 라만 바코드(320, 350) 사이의 바코드 오버랩 레벨(360)을 결정하는 것을 포함할 수 있다. 다양한 경우에, 2개의 라만 바코드(예를 들어, 320 및 350)를 비교할 때, 바코드 오버랩 레벨(360)은 두 라만 바코드(320, 350)의 동일한 또는 실질적으로 동일한 파수 위치에 존재하는 바의 수에 관련될 수 있다(가령, 바코드 오버랩 레벨(360)은 해당 수치를 두 라만 바코드(320, 350) 내 바의 총 개수로 나눔으로써 컴퓨팅될 수 있다). 다양한 경우에, 제1 라만 바코드의 제1 바와 제2 라만 바코드의 제2 바는 제1 및 제2 바가 (예를 들어, 파수 축 상에서) 서로의 약 0.5%, 약 1%, 약 3%, 약 5%, 약 10% 내에 있을 때(해당 값 및 그 사이의 하위 범위 포함), "동일하거나 실질적으로 동일한 파수 위치"에 있는 것으로 이해된다. 다양한 경우에, 2개의 라만 바코드의 바코드 오버랩 레벨은 라만 바코드에 대응하는 화합물 사이의 유사성의 척도로서 고려될 수 있다. 예를 들어, 바코드 오버랩 레벨이 바코드 오버랩 임계값을 초과할 때 두 가지 화합물이 일치하는 것으로 간주되거나 결정될 수 있다. 다양한 실시예에서, 도 1로 돌아가서, 바코드 오버랩 레벨(360)과 같은 결과는 라만 스펙트럼 기반 화합물 분류 시스템(100)의 디스플레이(122)에 제시될 라만 바코드 생성기(110)에 의해 출력(124)으로서 제공될 수 있다.
다양한 실시예에서, 인-실리코 시뮬레이션 라만 스펙트럼 및/또는 그로부터 변환된 라만 바코드는 시뮬레이션 라만 스펙트럼 라이브러리에 저장될 수 있다. 예를 들어, 라만 스펙트럼 기반 화합물 분류 시스템(100)은 시뮬레이션 라만 스펙트럼(108) 및/또는 인-실리코 시뮬레이션 라만 스펙트럼(예를 들어, 도 3에 도시되는 시클로헥산(320) 및 이소프로필 알코올(IPA)(350)의 인-실리코 시뮬레이션 라만 바코드와 같은)을 저장하도록 구성되는 데이터베이스(118)를 포함할 수 있다. 즉, 다양한 경우에, 인-실리코 시뮬레이션 라만 스펙트럼 라이브러리는 다양한 화합물의 라만 스펙트럼을 연산하고(예: 양자역학적 DFT 계산을 수행하여), 이러한 라만 스펙트럼을 라만 바코드로 변환하며, 인-실리코 시뮬레이션 라만 바코드(120)를 데이터베이스(118)에 시뮬레이션 라만 스펙트럼 라이브러리로 저장함으로써, 구축될 수 있다. 다양한 경우에, 인-실리코 시뮬레이션 라만 스펙트럼 라이브러리에는 연산된 라만 스펙트럼도 포함될 수 있다. 다양한 경우에, 시뮬레이션 라만 스펙트럼 라이브러리 또는 데이터베이스(118)는 도 4를 참조하여 아래에서 더 상세히 논의되는 바와 같이, 라만 스펙트럼을 측정하고, 측정된 라만 스펙트럼을 라만 바코드로 변환하고, 측정된 라만 스펙트럼의 이들 라만 바코드를 인-실리코 시뮬레이션 라만 스펙트럼 라이브러리 또는 데이터베이스(118)와 비교함으로써, 미지 화합물을 식별할 때 참조 라이브러리로 사용될 수 있다. 다양한 실시예에서, 시뮬레이션 라만 스펙트럼 라이브러리 또는 데이터베이스(118)는 측정된 라만 스펙트럼 또는 측정된 라만 스펙트럼에 대응하는 라만 바코드를 포함하지 않을 수 있다. 즉, 인-실리코 시뮬레이션 라만 스펙트럼 라이브러리 또는 데이터베이스(118)는 라만 스펙트럼 및/또는 라만 바코드를 연산 또는 시뮬레이트함으로써, 그리고 이를 라이브러리에 저장함으로써 생성될 수 있다. 즉, 라이브러리는 인-실리코 시뮬레이션 라만 스펙트럼 또는 바코드만을 포함할 수 있다.
도 4는 다양한 실시예에 따라, 화합물의 참조 인-실리코 시뮬레이션 라만 바코드의 라이브러리에 대한, 미지 화합물의 측정된 라만 바코드의 비교에 기초하여 미지 화합물의 식별의 예시 도해(400)를 도시한다. 다양한 실시예에서, 라만 분광법을 사용하여 미지 화합물의 정체를 결정하기 위해, 미지 화합물의 라만 스펙트럼은 초기에 라만 분광계를 사용하여 측정될 수 있다. 또한, 측정된 스펙트럼은 다양한 노이즈, 배경, 실험 아티팩트 등을 제거하기 위해 전처리될 수 있고, 평활화되거나 전처리된 라만 스펙트럼(410)을 얻을 수 있다. 다양한 경우에, 측정된 라만 스펙트럼(410)은 그 후, 도 3을 참조하여 전술한 바와 같이 (예를 들어, 도 1의 라만 바코드 생성기(110)의 피크-바코드 변환기 모듈(116)를 사용하여) 측정된 라만 바코드오버랩 변환될 수 있다.
측정된 라만 바코드를 얻을 때, 다양한 경우에, 측정된 라만 바코드는 시뮬레이션 라만 스펙트럼 라이브러리에 저장된(예를 들어, 도 1의 데이터베이스(118)에 저장된) 하나 이상의 인-실리코 시뮬레이션 라만 바코드와 비교될 수 있다. 예를 들어, 데이터베이스(118)의 저장된 인-실리코 시뮬레이션 라만 바코드를 통해 반복적으로 검색하고, 각각의 인-실리코 시뮬레이션 라만 바코드에 대해, 그 인-실리코 또는 시뮬레이션 라만 바코드와 측정된 라만 바코드 사이의 바코드 오버랩 레벨(430)을 계산할 수 있다. 다양한 경우에, 다수의 화합물의 연산된 바코드 오버랩(460)의 계산된 레벨은 바코드 오버랩 임계치(450)보다 낮을 수 있고, 이러한 경우에, 미지 화합물은 여러 화합물 중 어느 것과도 일치하지 않는 것으로(즉, 동일하지 않거나, 또는 심지어 화학 구조 등에서 유사하지도 않음) 결정될 수 있다.
그러나 다양한 경우에, 미지 화합물의 측정된 라만 바코드와 (공지된 또는 참조) 화합물의 인-실리코 시뮬레이션 라만 바코드 사이의 바코드 오버랩 레벨(440)이 바코드 오버랩 임계값(450)을 초과할 수 있고, 이러한 경우에, 미지 화합물은 인-실리코 시뮬레이션 라만 바코드의 공지 화합물과 일치하는 것으로, 즉, 동일한 것으로(예를 들어, 또는 적어도 유사한) 것으로 간주되거나 결정될 수 있다. 다양한 경우에, 바코드 오버랩 임계치(450)를 초과하는 측정된 라만 바코드와 바코드 오버랩 레벨을 갖는 인-실리코 시뮬레이션 라만 바코드가 하나보다 많을 수 있다. 이러한 경우, 미지 화합물은 최고 바코드 오버랩 레벨에 대응하는 화합물에 일치하는 것으로 결정되거나 간주될 수 있다(예를 들어, 그리고, 하나보다 많은 인-실리코 시뮬레이션 라만 바코드의 나머지 부분에 해당하는 화합물과 유사한 것으로 간주될 수 있다).
다양한 실시예에서, 2개의 라만 바코드의 바코드 오버랩 레벨은 라만 바코드에 대응하는 화합물 사이의 유사성의 척도로서 고려될 수 있다(예를 들어, 두 화합물이 이전에 공지된 경우). 도 5는 다양한 실시예에 따라 참조 화합물(520)의 참조 인-실리코 시뮬레이션 라만 바코드의 라이브러리에 대한 테스트 화합물(510)의 측정된 라만 바코드의, 위에서 논의되고 바코드 오버랩 레벨(530)에 의해 정량화된, 비교에 기초하여 참조 화합물(520)에 대한 "테스트" 화합물(510)의 유사성의 결정을 예시하는 예시적인 그리드(500)를 도시한다. 다양한 경우에, 그리드(500)는 테스트 화합물(510)의 측정된 라만 바코드와, 참조 화합물(520)의 인-실리코 시뮬레이션 라만 바코드 사이의 바코드 오버랩 레벨의 열 지도를 보여주며, 이는 테스트 화합물과 참조 화합물 각 쌍 간의 일치 레벨을 나타낸다. 테스트 화합물(510)의 측정된 라만 바코드는 먼저 테스트 화합물(510)의 라만 분광 측정을 수행하여 테스트 화합물(510)의 라만 스펙트럼을 획득된 다음, 획득 또는 측정된 실험 라만 스펙트럼을 라만 바코드로 변환함으로써 생성되며, 이때, 참조 화합물(520) 시뮬레이션 또는 계산 라만 바코드의 인-실리코 시뮬레이션 라만 바코드는 양자역학적 DFT 연산을 사용하여 참조 화합물(520)의 인-실리코 시뮬레이션 라만 스펙트럼을 계산함으로써 생성되며, 이후 라만 바코드로 변환된다. 비제한적 예시로서 2-(N-모폴리노)에탄설폰산(MES)에 해당하는 컬럼에 초점을 맞추면, 그리드 또는 열 지도(500)는 테스트 화합물 MES 및 참조 화합물 3-(N-모르폴리노)프로판술폰산 (MOPS) 사이의 바코드 오버랩 레벨에 대해 높은 강도(>75%)를 나타내서, 두 화합물 간의 높은 레벨의 유사성을 나타내는 반면, MES 및 IPA의 경우 바코드 오버랩 레벨이 낮아 두 화합물이 실질적으로 구별됨을 나타낸다. 다양한 실시예에서, 그리드 또는 히트 맵(500)은 또한 2개의 화합물이 동일하다고 간주되거나 결정될 수 있는(예를 들어, 공지 화합물의 참조 라만 바코드에 대한 미지 화합물의 라만 바코드를 비교할 때) 바코드 오버랩 임계치를 교정하는 데 사용될 수 있다. 예를 들어, 두 개의 서로 다른 화합물 MES 및 MOPS는 >75%의 바코드 오버랩 레벨을 가질 수 있으며, 두 화합물이 동일한지 여부를 결정하기 위한 바코드 오버랩 임계치는 >75%보다 높게 설정될 수 있다.
도 6은 다양한 실시예에 따라, 화합물의 참조 인-실리코 시뮬레이션 라만 바코드의 라이브러리에 대한 화합물의 측정된 라만 바코드의 비교에 기초하여 미지 화합물을 식별하기 위한 방법의 흐름도이다. 다양한 실시예에서, 프로세스(600)는 도 1에 설명된 라만 스펙트럼 기반 화합물 분류 시스템(100)을 사용하여 구현될 수 있다.
단계(610)는 미지 화합물의 라만 분광 측정으로부터 추출된 미지 화합물의 라만 스펙트럼을 획득하는 것을 포함한다.
단계(620)는 획득된 라만 스펙트럼을, 시뮬레이션 라만 스펙트럼 라이브러리에 포함된 복수의 시뮬레이션 라만 스펙트럼 중 참조 시뮬레이션 라만 스펙트럼과 비교하는 것을 포함한다. 다양한 경우에, 각각의 시뮬레이션 라만 스펙트럼은 공지된 화합물의 양자역학적 연산을 통해 생성될 수 있다.
단계(630)는 참조 시뮬레이션 라만 스펙트럼에 대한 획득된 라만 스펙트럼의 비교에 기초하여 미지 화합물의 정체를 식별하는 것을 포함한다.
다양한 실시예에서, 프로세스(600)는 라만 스펙트럼의 피크의 강도 레벨에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크에 대응하는 라만 바코드를 생성하는 단계를 추가로 포함한다. 다양한 실시예에서, 비교는 생성된 라만 바코드를 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼에 대응하는 참조 시뮬레이션 라만 바코드와 비교하는 것을 포함한다.
다양한 실시예에서, 시뮬레이션 라만 스펙트럼 라이브러리는 화합물에 대한 라만 분광 측정을 수행함으로써 획득된 실험적 라만 스펙트럼을 제외한다. 다양한 실시예에서, 비교는 생성된 라만 바코드 및/또는 참조 라만 바코드에 스케일링 알고리즘을 적용하여, 생성된 라만 바코드 및/또는 참조 라만 바코드 사이의 파수 오프셋을 보정하는 것을 포함한다.
다양한 실시예에서, 식별하는 단계는 생성된 라만 바코드와 참조 시뮬레이션 라만 바코드 사이의 바코드 오버랩 레벨이 바코드 오버랩 임계치를 초과할 때 미지 화합물이 참조 시뮬레이션 라만 스펙트럼이 연산되는 화합물과 일치한다고 결정하는 것을 포함한다. 다양한 실시예에서, 바코드 오버랩 레벨은 생성된 라만 바코드의 제1 파수 위치 및 참조 시뮬레이션 라만 바코드의 제2 파수 위치에 위치된 바의 수를 나타내고, 제1 파수 위치 및 제2 파수 위치는 적어도 실질적으로 서로 동등하다.
다양한 실시예에서, 양자역학적 연산은 밀도-범함수 이론(DFT)에 기초한다. 다양한 실시예에서, 생성하는 단계는 피크들의 강도 레벨들 중 피크의 하나의 강도 레벨이 피크 강도 임계치를 초과할 때 피크들 중 하나의 피크에 대응하는 바코드에 바를 포함하는 것을 포함한다. 다양한 실시예에서, 피크 강도 임계치는 피크들의 강도 레벨의 평균이다. 다양한 실시예에서, 생성하는 단계는 라만 스펙트럼의 피크의 파수 위치에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크에 대응하는 라만 바코드를 생성하는 것을 포함한다.
도 7은 다양한 실시예에 따른 컴퓨터 시스템의 블록도이다. 컴퓨터 시스템(700)은 도 1에서 상술한 라만 스펙트럼 기반 화합물 분류 시스템(100)에 대한 하나의 구현의 예일 수 있다. 하나 이상의 예에서, 컴퓨터 시스템(700)은 정보를 전달하기 위한 버스(702) 또는 다른 통신 메커니즘과, 정보를 처리하기 위해 버스(702)와 연결된 프로세서(704)를 포함할 수 있다. 다양한 실시예에서, 컴퓨터 시스템(700)은 프로세서(704)에 의해 실행될 명령어를 결정하기 위해 버스(702)에 결합된, RAM(random-access memory)(706) 또는 다른 동적 저장 장치일 수 있는, 메모리를 또한 포함할 수 있다. 메모리가 프로세서(704)에 의해 실행될 명령어의 실행 동안 임시 변수 또는 다른 중간 정보를 저장하는 데에도 사용될 수 있다. 다양한 실시예에서, 컴퓨터 시스템(700)은 프로세서(704)를 위한 명령어 및 정적 정보를 저장하기 위해 버스(702)에 결합된 판독 전용 메모리(ROM)(708) 또는 다른 정적 저장 장치를 추가로 포함할 수 있다. 자기 디스크 또는 광 디스크와 같은 저장 장치(710)가 제공될 수 있고 정보 및 명령어를 저장하기 위해 버스(702)에 결합될 수 있다.
다양한 실시예에서, 컴퓨터 시스템(700)은 컴퓨터 사용자에게 정보를 표시하기 위해 버스(702)를 통해 음극선관(CRT) 또는 액정 디스플레이(LCD)와 같은 디스플레이(712)에 결합될 수 있다. 영숫자 및 기타 키를 포함하는 입력 장치(714)가, 프로세서(704)에 정보 및 명령 선택을 전달하기 위해 버스(702)에 결합될 수 있다. 다른 유형의 사용자 입력 장치는 마우스, 조이스틱, 트랙볼, 제스처 입력 장치, 시선 기반 입력 장치 또는 커서 방향 키(프로세서(704)에 방향 정보 및 명령 선택을 통신하고 디스플레이(712) 상의 커서 움직임을 제어하기 위함)와 같은, 커서 제어부(716)이다. 입력 장치(714)는 통상적으로, 장치로 하여금 한 평면 내 위치들을 명시할 수 있게 하는, 2개의 축, 즉, 제1 축(예: x) 및 제2 축(예: y)으로 2개의 자유도를 가진다. 그러나, 여기서는 3차원(예를 들어, x, y 및 z) 커서 이동을 허용하는 입력 장치(714)도 본 명세서에서 고려된다는 것을 이해해야 한다.
본 교시의 특정 구현에 따라, 프로세서(704)가 RAM(706)에 포함된 하나 이상의 명령어의 하나 이상의 시퀀스를 실행하는 데 응답하여, 결과가 컴퓨터 시스템(700)에 의해 제공될 수 있다. 이러한 명령어는 다른 컴퓨터 판독 가능 매체 또는 저장 장치(710)와 같은 컴퓨터 판독 가능 저장 매체로부터 RAM(706)으로 판독될 수 있다. RAM(706)에 포함된 명령어 시퀀스의 실행은 프로세서(704)가 본 명세서에 설명된 프로세스를 수행하게 할 수 있다. 대안적으로, 본 교시를 구현하기 위해 소프트웨어 명령어 대신에 또는 소프트웨어 명령어와 조합하여 유선 회로가 사용될 수 있다. 따라서, 본 교시의 구현은 하드웨어 회로와 소프트웨어의 특정 조합으로 제한되지 않는다.
본 명세서에서 사용되는 용어 "컴퓨터 판독 가능 매체"(예를 들어, 데이터 스토어, 데이터 저장소, 저장 장치, 데이터 저장 장치 등) 또는 "컴퓨터 판독 가능 저장 매체"는 실행을 위해 프로세서(704)에 명령어를 제공하는데 참여하는 임의의 매체를 지칭한다. 이러한 매체는 비휘발성 매체, 휘발성 매체 및 전송 매체를 포함하지만 이에 제한되지 않는 다양한 형태를 취할 수 있다. 비휘발성 매체의 예는 저장 장치(710)와 같은 광학, 고체 상태, 자기 디스크를 포함할 수 있지만 이에 제한되지 않는다. 휘발성 매체의 예는 RAM(706)과 같은 동적 메모리를 포함할 수 있지만 이에 제한되지 않는다. 전송 매체의 예는 버스(702)를 포함하는 와이어를 포함하여, 동축 케이블, 구리 와이어 및 광섬유를 포함할 수 있지만 이에 제한되지 않는다.
컴퓨터 판독 가능 매체의 일반적인 형태는 예를 들어 플로피 디스크, 플렉시블 디스크, 하드 디스크, 자기 테이프 또는 기타 자기 매체, CD-ROM, 기타 광학 매체, 펀치 카드, 종이 테이프, 구멍 패턴이 있는 다른 물리적 매체, RAM, PROM 및 EPROM, FLASH-EPROM, 기타 메모리 칩 또는 카트리지 또는 컴퓨터가 읽을 수 있는 기타 유형적 매체를 포함한다.
컴퓨터 판독 가능 매체에 더하여, 명령어 또는 데이터는 실행을 위해 컴퓨터 시스템(700)의 프로세서(704)에 하나 이상의 명령어의 시퀀스를 제공하도록 통신 장치 또는 시스템에 포함된 전송 매체 상의 신호로서 제공될 수 있다. 예를 들어, 통신 장치는 명령어 및 데이터를 나타내는 신호들을 갖는 송수신기를 포함할 수 있다. 명령어 및 데이터는 하나 이상의 프로세서가 본 명세서에 개시된 기능을 구현하게 하도록 구성된다. 데이터 통신 전송 연결의 대표적인 예는 전화 모뎀 연결, WAN(Wide Area Network), LAN(Local Area Network), 적외선 데이터 연결, NFC 연결, 광통신 연결 등을 포함할 수 있지만 이에 제한되지 않는다.
본 명세서에 기술된 방법론, 순서도, 다이어그램, 및 수반되는 개시는 컴퓨터 시스템(700)을 독립형 장치로서, 또는 클라우드 컴퓨팅 네트워크와 같은 공유 컴퓨터 처리 리소스의 분산 네트워크 상에서, 구현될 수 있음을 이해해야 한다.
본 명세서에 기술된 방법론은 애플리케이션에 따라 다양한 수단에 의해 구현될 수 있다. 예를 들어, 이러한 방법론은 하드웨어, 펌웨어, 소프트웨어 또는 이들의 임의의 조합으로 구현될 수 있다. 하드웨어 구현의 경우, 처리 유닛은 하나 이상의 ASIC(application specific integrated circuit), DSP(digital signal processor), DSPD(digital signal processing device), PLD(programmable logic device), FPGA(field programmable gate arrays), 프로세서, 컨트롤러, 마이크로컨트롤러, 마이크로프로세서, 전자 장치, 여기에 설명된 기능을 수행하도록 설계된 기타 전자 장치, 또는 이들의 조합 내에서 구현될 수 있다.
다양한 실시예에서, 본 교시의 방법은 C, C++, Python 등과 같은 종래의 프로그래밍 언어로 작성된 펌웨어 및/또는 소프트웨어 프로그램 및 애플리케이션으로 구현될 수 있다. 펌웨어 및/또는 소프트웨어로 구현되는 경우, 본 명세서에 기술된 실시예는 컴퓨터로 하여금 전술한 방법을 수행하게 하기 위한 프로그램이 저장된 비일시적 컴퓨터 판독 가능 매체 상에서 구현될 수 있다. 여기에 설명된 다양한 엔진은 컴퓨터 시스템(700)과 같은 컴퓨터 시스템 상에 제공될 수 있으며, 이에 따라 프로세서(704)는 메모리 구성 요소 RAM(706), ROM(708) 또는 저장 장치(710) 및 입력 장치(714)를 통해 제공되는 사용자 입력 중 어느 하나 또는 이들의 조합에 의해 제공되는 명령어에 영향받는, 이러한 엔진에 의해 제공되는 분석 및 결정을 실행할 수 있을 것이다.
본 교시가 다양한 실시예와 관련하여 설명되지만, 본 교시가 그러한 실시예로 제한되는 것으로 의도되지 않는다. 반대로, 본 교시 내용은 당업자가 이해할 수 있는 바와 같이 다양한 대안, 수정 및 등가물을 포함한다.
예를 들어, 전술한 흐름도 및 블록도는 다양한 방법 및 시스템 실시예의 가능한 구현의 아키텍처, 기능 및/또는 동작을 예시한다. 흐름도 또는 블록도의 각 블록은 모듈, 세그먼트, 기능, 동작 또는 단계의 일부 또는 이들의 조합을 나타낼 수 있다. 실시예의 다양한 대안적 구현에서, 블록에 언급된 기능 또는 기능들은 도면에 언급된 순서와 다르게 발생할 수 있다. 예를 들어, 다양한 경우에, 연속적으로 표시된 두 개의 블록이 실질적으로 동시에 실행될 수 있다. 다른 경우에는 블록들이 역순으로 수행될 수 있다. 또한, 다양한 경우에, 흐름도 또는 블록도에서 하나 이상의 다른 블록을 대체하거나 보완하기 위해 하나 이상의 블록이 추가될 수 있다.
따라서, 다양한 실시예를 설명함에 있어서, 명세서는 방법 및/또는 프로세스를 특정 단계의 시퀀스로 제시하고 있을 수 있다. 그러나, 방법 또는 프로세스가 여기에 제시된 특정 단계 순서에 의존하지 않는 한, 방법 또는 프로세스는 설명된 단계의 특정 순서에 제한되지 않아야 하며, 당업자는 시퀀스는 변경될 수 있으며 여전히 다양한 실시예의 사상 및 범위 내에서 유지된다.
또한, 요소들의 목록(예를 들어, 요소 a, b, c)을 참조할 때, 이러한 참조는 나열된 요소들 중 임의의 하나 자체, 나열된 것 모두보다 적은 것들의 임의의 조합, 및/또는 나열된 모든 요소의 조합을 포함하는 것을 의도한다. 명세서의 섹션 구분은 검토를 쉽게 하기 위한 것이며 논의된 요소의 조합을 제한하지 않는다.
달리 정의되지 않는 한, 본 명세서에 기술된 본 교시와 관련하여 사용되는 과학 및 기술 용어는 당업자에 의해 일반적으로 이해되는 의미를 가질 것이다. 또한, 문맥상 달리 요구되지 않는 한, 단수 용어는 복수를 포함하고 복수 용어는 단수를 포함한다. 일반적으로, 본원에 기술된 화학, 생화학, 분자 생물학, 약리학 및 독성학과 관련하여 사용되는 명명법 및 기술은 당업계에서 잘 알려져 있고 통상적으로 사용되는 것이다.
본원에서 사용되는 "실질적으로"는 의도된 목적을 위해 작업하기에 충분함을 의미한다. 따라서 "실질적으로"라는 용어는 해당 분야의 통상의 기술자가 예상할 수 있는 절대적인 또는 완벽한 상태, 치수, 측정, 결과 등으로부터의 사소하고 미미한 변화를 허용하지만 전체 성능에 눈에 띄게 영향을 미치지는 않는다. 수치 또는 수치로 표현될 수 있는 파라미터 또는 특성과 관련하여 사용될 때 "실질적으로"는 10% 이내를 의미한다.
본원에서 사용되는 수치 또는 수치로 표현될 수 있는 파라미터 또는 특성에 대해 사용되는 "약"이라는 용어는 수치의 10% 이내를 의미한다. 예를 들어, "약 50"은 45에서 55까지의 범위에 있는 값을 의미한다.
용어 "것들"(ones)은 하나 이상을 의미한다.
본원에서 사용되는 용어 "복수"는 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 그 이상이 될 수 있다.
본원에서 사용되는 "세트"라는 용어는 하나 이상을 의미한다. 예를 들어 품목 세트에는 하나 이상의 품목이 포함된다.
본 명세서에서 사용되는 바와 같이, 품목 목록과 함께 사용될 때 "~ 중 적어도 하나"라는 문구는 나열된 품목들 중 하나 이상의 상이한 조합이 사용될 수 있고 목록에 있는 품목 중 하나만 필요할 수 있음을 의미한다. 품목은 특정 개체, 사물, 단계, 작업, 프로세스 또는 범주일 수 있다. 즉, "~ 중 적어도 하나"는 임의의 조합의 품목의 또는 개수의 품목이 목록에서 사용될 수 있지만 목록의 모든 품목이 필수적인 것은 아님을 의미한다. 예를 들어, 제한 없이 "품목 A, 품목 B 또는 품목 C 중 적어도 하나"는 품목 A; 품목 A 및 품목 B; 품목 B; 품목 A, 품목 B 및 품목 C; 품목 B 및 품목 C; 또는 품목 A 및 C를 의미한다. 다양한 경우에 "품목 A, 품목 B 또는 품목 C 중 적어도 하나"는 품목 A 2개, 품목 B 중 1개 및 품목 C 10개; 품목 B의 4개 및 품목 C의 7개; 또는 다른 적절한 조합을 의미하지만 이에 국한되지 않는다.
실시예의 인용
실시예 1: 방법으로서: 미지 화합물의 라만 분광 측정으로부터 추출된 미지 화합물의 라만 스펙트럼을 획득하는 단계; 획득된 라만 스펙트럼을 시뮬레이션 라만 스펙트럼 라이브러리에 포함된 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼과 비교하는 단계 - 각각의 시뮬레이션 라만 스펙트럼은 공지된 화합물의 양자역학적 연산을 통해 생성됨; 그리고 획득된 라만 스펙트럼과 참조 시뮬레이션 라만 스펙트럼의 비교에 기초하여 상기 미지 화합물의 정체를 식별하는 단계를 포함하는, 방법.
실시예 2: 실시예 1에 있어서, 상기 시뮬레이션 라만 스펙트럼 라이브러리는 화합물에 대한 라만 분광 측정을 수행함으로써 획득된 실험적 라만 스펙트럼을 제외하는, 방법.
실시예 3: 실시예 1 또는 2에 있어서, 라만 스펙트럼의 피크의 강도 레벨에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크에 대응하는 라만 바코드를 생성하는 단계를 추가로 포함하는, 방법.
실시예 4: 실시예 3에 있어서, 상기 비교하는 단계는 생성된 라만 바코드를 상기 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼에 대응하는 참조 시뮬레이션 라만 바코드와 비교하는 것을 포함하는, 방법.
실시예 5: 실시예 1 내지 4 중 어느 하나에 있어서, 상기 비교하는 단계는 획득된 라만 스펙트럼 및/또는 참조 시뮬레이션 라만 스펙트럼 사이의 파수 오프셋을 보정하기 위해 획득된 라만 스펙트럼 및/또는 참조 시뮬레이션 라만 스펙트럼에 스케일링 알고리즘을 적용하는 것을 포함하는, 방법.
실시예 6: 실시예 4에 있어서, 상기 식별하는 단계는 생성된 라만 바코드와 참조 시뮬레이션 라만 바코드 사이의 바코드 오버랩 레벨이 바코드 오버랩 임계치를 초과할 때 미지 화합물이 참조 시뮬레이션 라만 스펙트럼이 연산된 화합물과 일치함을 결정하는 것을 포함하는, 방법.
실시예 7: 실시예 6에 있어서, 상기 바코드 오버랩 레벨은 상기 생성된 라만 바코드의 제1 파수 위치와 상기 참조 시뮬레이션 라만 바코드의 제2 파수 위치에 위치한 바의 개수를 나타내고, 상기 제1 파수 위치 및 상기 제2 파수 위치는 서로 적어도 실질적으로 동일한, 방법.
실시예 8: 실시예 1 내지 7 중 어느 하나에 있어서, 상기 양자역학적 연산은 밀도-범함수이론(DFT)에 기초하는, 방법.
실시예 9: 실시예 3에 있어서, 상기 생성하는 단계는, 피크들 중 하나의 피크의 강도 레벨이 피크 강도 임계치를 초과할 때, 상기 하나의 피크에 대응하는 바를 라만 바코드에 포함시키는 것을 포함하는, 방법.
실시예 10: 실시예 9에 있어서, 상기 피크 강도 임계치는 피크들의 강도 레벨의 평균인, 방법.
실시예 11: 실시예 3에 있어서, 상기 생성하는 단계는 상기 라만 스펙트럼의 피크들의 파수 위치에 적어도 부분적으로 기초하여 상기 라만 스펙트럼의 피크들에 대응하는 라만 바코드를 생성하는 것을 포함하는, 방법.
실시예 12: 시스템으로서: 명령어를 저장하는 비일시적 메모리; 그리고 상기 비일시적 메모리에 결합되고, 상기 시스템으로 하여금 동작들을 수행하게 하도록 상기 비일시적 메모리로부터 상기 명령어를 판독하도록 구성된 하나 이상의 하드웨어 프로세서를 포함하며, 상기 동작들은: 미지 화합물의 라만 분광 측정으로부터 추출된 미지 화합물의 라만 스펙트럼을 획득하는 것; 획득된 라만 스펙트럼을 시뮬레이션 라만 스펙트럼 라이브러리에 포함된 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼과 비교하는 것 - 각각의 시뮬레이션 라만 스펙트럼은 공지된 화합물의 양자역학적 연산을 통해 생성됨; 그리고 획득된 라만 스펙트럼과 참조 시뮬레이션 라만 스펙트럼의 비교에 기초하여 상기 미지 화합물의 정체를 식별하는 것을 포함하는, 시스템.
실시예 13: 실시예 12에 있어서, 상기 시뮬레이션 라만 스펙트럼 라이브러리는 화합물에 대한 라만 분광 측정을 수행하여 획득된 실험적 라만 스펙트럼을 제외하는, 시스템.
실시예 14: 실시예 12 또는 13에 있어서, 상기 동작들은, 라만 스펙트럼의 피크의 강도 레벨에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크에 대응하는 라만 바코드를 생성하는 것을 추가로 포함하는, 시스템.
실시예 15: 실시예 14에 있어서, 상기 비교하는 것은, 생성된 라만 바코드를, 상기 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼에 대응하는 참조 시뮬레이션 라만 바코드와 비교하는 것을 포함하는, 시스템.
실시예 16: 실시예 12 내지 15 중 어느 하나에 있어서, 상기 비교하는 것은, 획득된 라만 스펙트럼 및/또는 참조 시뮬레이션 라만 스펙트럼 사이의 파수 오프셋을 보정하기 위해 획득된 라만 스펙트럼 및/또는 참조 시뮬레이션 라만 스펙트럼에 스케일링 알고리즘을 적용하는 것을 포함하는, 시스템.
실시예 17: 실시예 15에 있어서, 상기 식별하는 것은, 생성된 라만 바코드와 참조 시뮬레이션 라만 바코드 사이의 바코드 오버랩 레벨이 바코드 오버랩 임계치를 초과할 때 미지 화합물이 참조 시뮬레이션 라만 스펙트럼이 연산된 화합물과 일치함을 결정하는 것을 포함하는, 시스템.
실시예 18: 실시예 17에 있어서, 상기 바코드 오버랩 레벨은 상기 생성된 라만 바코드의 제1 파수 위치와 상기 참조 시뮬레이션 라만 바코드의 제2 파수 위치에 위치한 바의 개수를 나타내고, 상기 제1 파수 위치 및 상기 제2 파수 위치는 서로 적어도 실질적으로 동일한, 시스템.
실시예 19: 실시예 12 내지 18 중 어느 하나에 있어서, 상기 양자역학적 연산은 밀도-범함수이론(DFT)에 기초하는, 시스템.
실시예 20: 실시예 14에 있어서, 상기 생성하는 것은, 피크들 중 하나의 피크의 강도 레벨이 피크 강도 임계치를 초과할 때, 상기 하나의 피크에 대응하는 바를 바코드에 포함시키는 것을 포함하는, 시스템.
실시예 21: 실시예 20에 있어서, 상기 피크 강도 임계치는 피크들의 강도 레벨의 평균인, 시스템.
실시예 22: 실시예 14 내지 21 중 어느 하나에 있어서, 상기 생성하는 것은, 라만 스펙트럼의 피크들의 파수 위치에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크들에 대응하는 라만 바코드를 생성하는 것을 포함하는, 시스템.
실시예 23: 동작들을 수행시키도록 실행가능한 컴퓨터 판독가능 명령어들을 저장한 비일시적 컴퓨터 판독 가능 매체(CRM)로서, 상기 동작들은: 미지 화합물의 라만 분광 측정으로부터 추출된 미지 화합물의 라만 스펙트럼을 획득하는 것; 획득된 라만 스펙트럼을 시뮬레이션 라만 스펙트럼 라이브러리에 포함된 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼과 비교하는 것 - 각각의 시뮬레이션 라만 스펙트럼은 공지된 화합물의 양자역학적 연산을 통해 생성됨; 그리고 획득된 라만 스펙트럼과 참조 시뮬레이션 라만 스펙트럼의 비교에 기초하여 상기 미지 화합물의 정체를 식별하는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
실시예 24: 실시예 23에 있어서, 상기 시뮬레이션 라만 스펙트럼 라이브러리는 화합물에 대한 라만 분광 측정을 수행하여 획득된 실험적 라만 스펙트럼을 제외하는, 비일시적 컴퓨터 판독 가능 매체.
실시예 25: 실시예 23 또는 24에 있어서, 상기 동작들은, 라만 스펙트럼의 피크의 강도 레벨에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크에 대응하는 라만 바코드를 생성하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독 가능 매체.
실시예 26: 실시예 25에 있어서, 상기 비교하는 것은, 생성된 라만 바코드를, 상기 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼에 대응하는 참조 시뮬레이션 라만 바코드와 비교하는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
실시예 27: 실시예 23 내지 26 중 어느 하나에 있어서, 상기 비교하는 것은, 획득된 라만 스펙트럼 및/또는 참조 시뮬레이션 라만 스펙트럼 사이의 파수 오프셋을 보정하기 위해 획득된 라만 스펙트럼 및/또는 참조 시뮬레이션 라만 스펙트럼에 스케일링 알고리즘을 적용하는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
실시예 28: 실시예 26에 있어서, 상기 식별하는 것은, 생성된 라만 바코드와 참조 시뮬레이션 라만 바코드 사이의 바코드 오버랩 레벨이 바코드 오버랩 임계치를 초과할 때 미지 화합물이 참조 시뮬레이션 라만 스펙트럼이 연산된 화합물과 일치함을 결정하는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
실시예 29: 실시예 28에 있어서, 상기 바코드 오버랩 레벨은 상기 생성된 라만 바코드의 제1 파수 위치와 상기 참조 시뮬레이션 라만 바코드의 제2 파수 위치에 위치한 바의 개수를 나타내고, 상기 제1 파수 위치 및 상기 제2 파수 위치는 서로 적어도 실질적으로 동일한, 비일시적 컴퓨터 판독 가능 매체.
실시예 30: 실시예 23 내지 29 중 어느 하나에 있어서, 상기 양자역학적 연산은 밀도-범함수이론(DFT)에 기초하는, 비일시적 컴퓨터 판독 가능 매체.
실시예 31: 실시예 25에 있어서, 상기 생성하는 것은, 피크들 중 하나의 피크의 강도 레벨이 피크 강도 임계치를 초과할 때, 상기 하나의 피크에 대응하는 바를 바코드 내에 포함시키는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
실시예 33: 실시예 31에 있어서, 상기 피크 강도 임계치는 피크들의 강도 레벨의 평균인, 비일시적 컴퓨터 판독 가능 매체.
실시예 33: 실시예 25에 있어서, 상기 생성하는 것은, 라만 스펙트럼의 피크들의 파수 위치에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크들에 대응하는 라만 바코드를 생성하는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.

Claims (33)

  1. 방법으로서:
    미지 화합물의 라만 분광 측정으로부터 추출된 미지 화합물의 라만 스펙트럼을 획득하는 단계;
    획득된 라만 스펙트럼을 시뮬레이션 라만 스펙트럼 라이브러리에 포함된 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼과 비교하는 단계 - 각각의 시뮬레이션 라만 스펙트럼은 공지된 화합물의 양자역학적 연산을 통해 생성됨; 그리고
    상기 획득된 라만 스펙트럼과 상기 참조 시뮬레이션 라만 스펙트럼의 비교에 기초하여 상기 미지 화합물의 정체를 식별하는 단계
    를 포함하는, 방법.
  2. 제1항에 있어서, 상기 시뮬레이션 라만 스펙트럼 라이브러리는 화합물에 대한 라만 분광 측정을 수행함으로써 획득된 실험적 라만 스펙트럼을 제외하는, 방법.
  3. 제1항에 있어서, 라만 스펙트럼의 피크의 강도 레벨에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크에 대응하는 라만 바코드를 생성하는 단계를 추가로 포함하는, 방법.
  4. 제3항에 있어서, 상기 비교하는 단계는 생성된 라만 바코드를 상기 복수의 시뮬레이션 라만 스펙트럼의 상기 참조 시뮬레이션 라만 스펙트럼에 대응하는 참조 시뮬레이션 라만 바코드와 비교하는 것을 포함하는, 방법.
  5. 제1항에 있어서, 상기 비교하는 단계는 상기 획득된 라만 스펙트럼 및/또는 참조 시뮬레이션 라만 스펙트럼 사이의 파수 오프셋을 보정하기 위해 상기 획득된 라만 스펙트럼 및/또는 상기 참조 시뮬레이션 라만 스펙트럼에 스케일링 알고리즘을 적용하는 것을 포함하는, 방법.
  6. 제4항에 있어서, 상기 식별하는 단계는 상기 생성된 라만 바코드와 참조 시뮬레이션 라만 바코드 사이의 바코드 오버랩 레벨이 바코드 오버랩 임계치를 초과할 때 미지 화합물이 참조 시뮬레이션 라만 스펙트럼이 연산된 화합물과 일치함을 결정하는 것을 포함하는, 방법.
  7. 제6항에 있어서, 상기 바코드 오버랩 레벨은 상기 생성된 라만 바코드의 제1 파수 위치와 상기 참조 시뮬레이션 라만 바코드의 제2 파수 위치에 위치한 바의 개수를 나타내고, 상기 제1 파수 위치 및 상기 제2 파수 위치는 서로 적어도 실질적으로 동일한, 방법.
  8. 제1항에 있어서, 상기 양자역학적 연산은 밀도-범함수이론(DFT)에 기초하는, 방법.
  9. 제3항에 있어서, 상기 생성하는 단계는, 피크들 중 하나의 피크의 강도 레벨이 피크 강도 임계치를 초과할 때, 상기 하나의 피크에 대응하는 바를 라만 바코드에 포함시키는 것을 포함하는, 방법.
  10. 제9항에 있어서, 상기 피크 강도 임계치는 피크들의 강도 레벨의 평균인, 방법.
  11. 제3항에 있어서, 상기 생성하는 단계는 상기 라만 스펙트럼의 피크들의 파수 위치에 적어도 부분적으로 기초하여 상기 라만 스펙트럼의 피크들에 대응하는 라만 바코드를 생성하는 것을 포함하는, 방법.
  12. 시스템으로서:
    명령어를 저장하는 비일시적 메모리; 그리고
    상기 비일시적 메모리에 결합되고, 상기 비일시적 메모리로부터 상기 명령어를 판독하여 상기 시스템으로 하여금 동작들을 수행하게 하도록 구성된 하나 이상의 하드웨어 프로세서
    를 포함하며, 상기 동작들은:
    미지 화합물의 라만 분광 측정으로부터 추출된 미지 화합물의 라만 스펙트럼을 획득하는 것;
    상기 획득된 라만 스펙트럼을 시뮬레이션 라만 스펙트럼 라이브러리에 포함된 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼과 비교하는 것 - 각각의 시뮬레이션 라만 스펙트럼은 공지된 화합물의 양자역학적 연산을 통해 생성됨; 그리고
    상기 획득된 라만 스펙트럼과 상기 참조 시뮬레이션 라만 스펙트럼의 비교에 기초하여 상기 미지 화합물의 정체를 식별하는 것
    을 포함하는, 시스템.
  13. 제12항에 있어서, 상기 시뮬레이션 라만 스펙트럼 라이브러리는 화합물에 대한 라만 분광 측정을 수행하여 획득된 실험적 라만 스펙트럼을 제외하는, 시스템.
  14. 제12항에 있어서, 상기 동작들은, 라만 스펙트럼의 피크의 강도 레벨에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크에 대응하는 라만 바코드를 생성하는 것을 추가로 포함하는, 시스템.
  15. 제14항에 있어서, 상기 비교하는 것은, 상기 생성된 라만 바코드를, 상기 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼에 대응하는 참조 시뮬레이션 라만 바코드와 비교하는 것을 포함하는, 시스템.
  16. 제12항에 있어서, 상기 비교하는 것은, 상기 획득된 라만 스펙트럼 및/또는 참조 시뮬레이션 라만 스펙트럼 사이의 파수 오프셋을 보정하기 위해 상기 획득된 라만 스펙트럼 및/또는 상기 참조 시뮬레이션 라만 스펙트럼에 스케일링 알고리즘을 적용하는 것을 포함하는, 시스템.
  17. 제15항에 있어서, 상기 식별하는 것은, 상기 생성된 라만 바코드와 참조 시뮬레이션 라만 바코드 사이의 바코드 오버랩 레벨이 바코드 오버랩 임계치를 초과할 때 미지 화합물이 참조 시뮬레이션 라만 스펙트럼이 연산된 화합물과 일치함을 결정하는 것을 포함하는, 시스템.
  18. 제17항에 있어서, 상기 바코드 오버랩 레벨은 상기 생성된 라만 바코드의 제1 파수 위치와 상기 참조 시뮬레이션 라만 바코드의 제2 파수 위치에 위치한 바의 개수를 나타내고, 상기 제1 파수 위치 및 상기 제2 파수 위치는 서로 적어도 실질적으로 동일한, 시스템.
  19. 제12항에 있어서, 상기 양자역학적 연산은 밀도-범함수이론(DFT)에 기초하는, 시스템.
  20. 제14항에 있어서, 상기 생성하는 것은, 피크들 중 하나의 피크의 강도 레벨이 피크 강도 임계치를 초과할 때, 상기 하나의 피크에 대응하는 바를 라만 바코드에 포함시키는 것을 포함하는, 시스템.
  21. 제20항에 있어서, 상기 피크 강도 임계치는 피크들의 강도 레벨의 평균인, 시스템.
  22. 제14항에 있어서, 상기 생성하는 것은, 라만 스펙트럼의 피크들의 파수 위치에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크들에 대응하는 라만 바코드를 생성하는 것을 포함하는, 시스템.
  23. 동작들을 수행시키도록 실행가능한 컴퓨터 판독 가능 명령어들을 저장한 비일시적 컴퓨터 판독 가능 매체(CRM)로서, 상기 동작들은:
    미지 화합물의 라만 분광 측정으로부터 추출된 미지 화합물의 라만 스펙트럼을 획득하는 것;
    획득된 라만 스펙트럼을 시뮬레이션 라만 스펙트럼 라이브러리에 포함된 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼과 비교하는 것 - 각각의 시뮬레이션 라만 스펙트럼은 공지된 화합물의 양자역학적 연산을 통해 생성됨; 그리고
    상기 획득된 라만 스펙트럼과 참조 시뮬레이션 라만 스펙트럼의 비교에 기초하여 상기 미지 화합물의 정체를 식별하는 것
    을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  24. 제23항에 있어서, 상기 시뮬레이션 라만 스펙트럼 라이브러리는 화합물에 대한 라만 분광 측정을 수행하여 획득된 실험적 라만 스펙트럼을 제외하는, 비일시적 컴퓨터 판독 가능 매체.
  25. 제23항에 있어서, 상기 동작들은, 라만 스펙트럼의 피크의 강도 레벨에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크에 대응하는 라만 바코드를 생성하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  26. 제25항에 있어서, 상기 비교하는 것은, 상기 생성된 라만 바코드를, 상기 복수의 시뮬레이션 라만 스펙트럼의 참조 시뮬레이션 라만 스펙트럼에 대응하는 참조 시뮬레이션 라만 바코드와 비교하는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  27. 제23항에 있어서, 상기 비교하는 것은, 상기 획득된 라만 스펙트럼 및/또는 참조 시뮬레이션 라만 스펙트럼 사이의 파수 오프셋을 보정하기 위해 상기 획득된 라만 스펙트럼 및/또는 상기 참조 시뮬레이션 라만 스펙트럼에 스케일링 알고리즘을 적용하는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  28. 제26항에 있어서, 상기 식별하는 것은, 상기 생성된 라만 바코드와 참조 시뮬레이션 라만 바코드 사이의 바코드 오버랩 레벨이 바코드 오버랩 임계치를 초과할 때 미지 화합물이 참조 시뮬레이션 라만 스펙트럼이 연산된 화합물과 일치함을 결정하는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  29. 제28항에 있어서, 상기 바코드 오버랩 레벨은 상기 생성된 라만 바코드의 제1 파수 위치와 상기 참조 시뮬레이션 라만 바코드의 제2 파수 위치에 위치한 바의 개수를 나타내고, 상기 제1 파수 위치 및 상기 제2 파수 위치는 서로 적어도 실질적으로 동일한, 비일시적 컴퓨터 판독 가능 매체.
  30. 제23항에 있어서, 상기 양자역학적 연산은 밀도-범함수이론(DFT)에 기초하는, 비일시적 컴퓨터 판독 가능 매체.
  31. 제25항에 있어서, 상기 생성하는 것은, 피크들 중 하나의 피크의 강도 레벨이 피크 강도 임계치를 초과할 때, 상기 하나의 피크에 대응하는 바를 라만 바코드에 포함시키는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  32. 제31항에 있어서, 상기 피크 강도 임계치는 피크들의 강도 레벨의 평균인, 비일시적 컴퓨터 판독 가능 매체.
  33. 제25항에 있어서, 상기 생성하는 것은, 라만 스펙트럼의 피크들의 파수 위치에 적어도 부분적으로 기초하여 라만 스펙트럼의 피크들에 대응하는 라만 바코드를 생성하는 것을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
KR1020237029676A 2021-03-04 2022-03-03 화합물의 라만 스펙트럼-기반 식별을 위한 방법 및 시스템 KR20230150301A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163156846P 2021-03-04 2021-03-04
US63/156,846 2021-03-04
PCT/US2022/070949 WO2022187843A1 (en) 2021-03-04 2022-03-03 Methods and systems for raman spectra-based identification of chemical compounds

Publications (1)

Publication Number Publication Date
KR20230150301A true KR20230150301A (ko) 2023-10-30

Family

ID=80820253

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237029676A KR20230150301A (ko) 2021-03-04 2022-03-03 화합물의 라만 스펙트럼-기반 식별을 위한 방법 및 시스템

Country Status (13)

Country Link
US (1) US20240011910A1 (ko)
EP (1) EP4302077A1 (ko)
JP (1) JP2024512309A (ko)
KR (1) KR20230150301A (ko)
CN (1) CN117043585A (ko)
AR (1) AR125499A1 (ko)
AU (1) AU2022231184A1 (ko)
BR (1) BR112023017779A2 (ko)
CA (1) CA3211796A1 (ko)
IL (1) IL305192A (ko)
MX (1) MX2023010185A (ko)
TW (1) TW202242356A (ko)
WO (1) WO2022187843A1 (ko)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6178964B2 (ja) * 2013-04-23 2017-08-16 ナノフォトン株式会社 ラマンスペクトルデータベースの構築方法

Also Published As

Publication number Publication date
JP2024512309A (ja) 2024-03-19
MX2023010185A (es) 2023-09-07
CA3211796A1 (en) 2022-09-09
WO2022187843A1 (en) 2022-09-09
IL305192A (en) 2023-10-01
AU2022231184A1 (en) 2023-08-17
US20240011910A1 (en) 2024-01-11
BR112023017779A2 (pt) 2023-10-03
EP4302077A1 (en) 2024-01-10
CN117043585A (zh) 2023-11-10
AR125499A1 (es) 2023-07-26
TW202242356A (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
US11493447B2 (en) Method for removing background from spectrogram, method of identifying substances through Raman spectrogram, and electronic apparatus
JP6089345B2 (ja) 時および/または空間系列ファイルの多成分回帰/多成分分析
US9070091B2 (en) Method for extracting critical dimension of semiconductor nanostructure
WO2015136586A1 (ja) 要因分析装置、要因分析方法および要因分析プログラム
WO2022105062A1 (zh) 用于光学量测的方法、系统、计算设备和存储介质
EP3588060A1 (en) Cross-validation based calibration of a spectroscopic model
US20170090891A1 (en) Method and device for assisting with code optimisation and parallelisation
WO2018096683A1 (ja) 要因分析方法、要因分析装置および要因分析プログラム
Kuhn Predictive modeling with R and the caret Package
Liland et al. ROSA—a fast extension of partial least squares regression for multiblock data analysis
Cseresnyes et al. Hessian‐based quantitative image analysis of host‐pathogen confrontation assays
KR102172914B1 (ko) 라만 스펙트럼 식별 고속 탐색 방법 및 장치
US9400868B2 (en) Method computer program and system to analyze mass spectra
Roux et al. An efficient parallel global optimization strategy based on Kriging properties suitable for material parameters identification
JP6662637B2 (ja) 情報処理システム、情報処理方法およびプログラムを記憶する記録媒体
US20200279148A1 (en) Material structure analysis method and material structure analyzer
KR20230150301A (ko) 화합물의 라만 스펙트럼-기반 식별을 위한 방법 및 시스템
JP6500698B2 (ja) 組み合わせ計算によるイベント駆動ソフトウェアのイベント・シーケンス構築
US10948417B2 (en) Method for identifying Raman spectrogram and electronic apparatus
CN106485286B (zh) 一种基于局部敏感判别的矩阵分类模型
CN109145887B (zh) 一种基于光谱潜变量混淆判别的阈值分析方法
Yatskou et al. Simulation modelling and machine learning platform for processing fluorescence spectroscopy data
EP4022268A1 (en) Spectroscopic apparatus and methods for determining components present in a sample
WO2018042752A1 (ja) 信号分析装置、信号分析方法、コンピュータプログラム、測定装置及び測定方法
Bai et al. Statistical test of structured continuous trees based on discordance matrix