KR102564473B1 - 천연물에 대한 lc-ms/ms 스펙트럼 데이터를 분석하는 방법 - Google Patents

천연물에 대한 lc-ms/ms 스펙트럼 데이터를 분석하는 방법 Download PDF

Info

Publication number
KR102564473B1
KR102564473B1 KR1020180010484A KR20180010484A KR102564473B1 KR 102564473 B1 KR102564473 B1 KR 102564473B1 KR 1020180010484 A KR1020180010484 A KR 1020180010484A KR 20180010484 A KR20180010484 A KR 20180010484A KR 102564473 B1 KR102564473 B1 KR 102564473B1
Authority
KR
South Korea
Prior art keywords
information
natural product
spectral data
spectrum
natural
Prior art date
Application number
KR1020180010484A
Other languages
English (en)
Other versions
KR20190091668A (ko
Inventor
박태윤
김양수
권윤경
임형택
송춘자
장봉조
박재현
노경태
이상원
신기범
유환
명유찬
서명원
Original Assignee
주식회사 켐에쎈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 켐에쎈 filed Critical 주식회사 켐에쎈
Priority to KR1020180010484A priority Critical patent/KR102564473B1/ko
Publication of KR20190091668A publication Critical patent/KR20190091668A/ko
Application granted granted Critical
Publication of KR102564473B1 publication Critical patent/KR102564473B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8651Recording, data aquisition, archiving and storage
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8679Target compound analysis, i.e. whereby a limited number of peaks is analysed
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8696Details of Software

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

본 발명은 LC-MS/MS 방법에 의한 230,000개 이상의 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 데이터를 포함하는 천연물 정보가 저장되어 있는 데이터베이스와 사용자로부터 입력받은 LC-MS/MS 스펙트럼 데이터, 천연물 관련 텍스트 등의 천연물 검색 정보를 검색 조건으로 하여 상기 데이터베이스를 검색하여 입력받은 천연물 검색 정보에 대응되는 천연물 정보를 사용자에게 제공하는 서버를 포함하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법에 관한 것이다.

Description

천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법{METHOD FOR ANALYSING LC-MS/MS DATA OF NATURE PRODUCTS}
본 발명은 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법에 관한 것으로, 더욱 상세하게는, LC-MS/MS 방법에 의한 230,000개 이상의 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 데이터를 포함하는 천연물 정보가 저장되어 있는 데이터베이스와 사용자로부터 입력받은 LC-MS/MS 스펙트럼 데이터, 천연물 관련 텍스트 등의 천연물 검색 정보를 검색 조건으로 하여 상기 데이터베이스를 검색하여 입력받은 천연물 검색 정보에 대응되는 천연물 정보를 사용자에게 제공하는 서버를 포함하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법에 관한 것이다.
액체 크로마토그래피/질량분석기(LC/MS)은 액체 크로마토그래피와 질량 스펙트럼을 이용한 질량분석기를 연결한 것으로서, 최근 질량분석기의 검출 특징을 가진 액체 크로마토그래피의 분리 기법은 강력한 분석 도구로서 활용되고 있다. 상기 액체 크로마토그래피/질량분석기(LC/MS)에서 액체 크로마토그래피(LC)는 시료 성분을 분리한 후 질량분석기(MS)로 시료를 도입하며, 질량분석기는 전하값을 띤 이온들을 생성하고 검출한다. LC/MS 데이터는 시료성분의 분자량, 구조적인 정보 등을 통해 정성적인 정보와 기존 검출 방식이 제공하고 있는 정량적인 정보를 얻는데 사용되고 있다.
LC/MS는 넓은 유기화합물 분석의 효율적인 분석도구로 활용될 수 있다. 기체 크로마토그래피/질량분석기(GC/MS)는 약 900만 성분 정도의 제한적인 유기성분만을 분석할 수 있으나, 분석하려는 시료에 충격을 작게 가하면서 열을 가하지 않는 LC/MS 분석법은 대부분의 유기화합물 분석에 적용될 수 있다. LC/MS는 작은 분자량을 가진 유기 화합물에서 거대 분자량의 단백질에 이르기까지 다양한 유기화합물 분석이 가능하다. 또한 LC-MS/MS는 LC/MS가 업그레이드 된 것으로 두 회사의 MS를 함께 사용함으로써 보다 정밀한 측정이 가능하도록 한 것이다.
한편, 현재까지 천연물에 대한 컴파운드 정보 또는 LC-MS/MS 스펙트럼 데이터는 필요에 따라 매번 실험에 의해서 얻어진 값들에 의존하고 있어, 종래의 방법 또는 시스템으로는 하나의 천연물에 대한 정보을 얻는데 실험에 의해서 얻어져야 하므로 많은 노력과 시간이 필요하기에 시간 소모적이고 비효율적이라는 문제점을 가지고 있었다.
이와 같은 실정에 따라 실시간으로 사용자에게 천연물의 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 제공할 수 있는 방법 또는 시스템의 필요성이 증대되고 있다.
다음으로 본 발명의 기술이 속하는 분야에 존재하는 선행기술로서, 공개특허공보 10-2008-0009326(공개일: 2008.01.28.)은 질량분석 데이터 해석장치 및 프로그램에 관한 기술이 기재되어 있고, 공개특허공보 특2002-0032211(공개일: 2002.05.03.)은 천연물 자원, 정보, 생리 활성 검색 은행을 이용한 전자상거래 시스템에 관한 기술이 기재되어 있으며, 공개특허공보 10-2014-0108669(공개일: 2014.09.12.)는 질량 분광 분석법을 사용하여 샘플 분석하는 시스템에 관한 기술이 기재되어 있다. 상기 선행기술들은 질량분석 결과를 해석하거나 또는 천연물 정보에 관한 검색이 가능한 시스템에 관한 기술이 기재되어 있으나, 천연물에 대한 LC-MS/MS 스펙트럼 파일, 관련 텍스트, 천연물의 일반적인 이름 중 하나 이상을 포함하는 천연물 검색 정보를 입력받으면, 이를 기반으로 데이터베이스의 정보와 비교/검색하여 해당 천연물에 대한 LC-MS/MS 스펙트럼 정보 및 컴파운드 정보를 제공하는 시스템은 기재되어 있지 않다.
이와 같은 실정에 따라 본 발명은 천연물에 대한 LC-MS/MS 스펙트럼 데이터 또는 천연물 관련 텍스트를 포함하는 천연물 검색 정보를 입력받고, 입력받은 천연물 검색 정보를 검색 조건으로 하여 데이터베이스의 정보와 매칭하여 해당 천연물에 대한 LC-MS/MS 스펙트럼 정보 및 컴파운드 정보를 제공하는 새로운 천연물 정보 검색 기능을 지원하는 방법을 제시하고자 한다.
본 발명의 상기된 과제를 해결하기 위해 창작된 것으로, 사용자의 편의를 제공하는 GUI를 통해 LC-MS/MS 스펙트럼 데이터 입력 또는 천연물 관련 텍스트 입력을 통한 데이터베이스 매칭 알고리즘에 기반한 천연물 정보 검색 기능을 지원하는 방법을 제공하는 것을 그 목적으로 한다.
본 발명의 일 실시예에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법은, 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법은, 서버에 접근 할 수 있는 클라이언트에 사용자가 로그인하는 제1단계; 검색하고자 하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터 또는 천연물 관련 텍스트 중 적어도 하나 이상을 포함하는 천연물 검색 정보를 입력하는 제2단계; 상기 제2단계에서 입력된 천연물 검색 정보를 클라이언트에서 서버로 전송하는 제3단계; 상기 서버가 상기 제3단계에서 전송된 천연물 검색 정보를 검색 조건으로 하여 정보 검색 모듈을 통해 천연물에 대한 컴파운드 정보(Compound Information) 및 LC-MS/MS 스펙트럼 정보(Spectrum Information)를 포함하는 천연물 정보가 저장되어 있는 데이터베이스를 검색하여 상기 천연물 검색 정보와 일치하는 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 추출하는 제4단계; 상기 제4단계에서 추출된 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 클라이언트로 전송하는 제5단계; 및 상기 제5단계에서 클라이언트로 전송된 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 클라이언트 화면에 디스플레이하는 제6단계;를 포함하는 것을 특징으로 한다.
또한, 일 실시예로서, 상기 LC-MS/MS 스펙트럼 데이터는, LC-MS/MS 스펙트럼 파일이거나, C-MS/MS 스펙트럼의 어미이온질량(Parent Ion Mass), 피크(Peak) 및 첨가물(Adduct)을 포함하는 텍스트인 것을 특징으로 한다.
또한, 일 실시예로서, 상기 천연물 관련 텍스트는, 화학명(Chemical name), 화학식(Formula), InchI(The IUPAC International Chemical Identifier), SMILES(Simplified Molecular Input Line Entry Specification) 중 적어도 하나 이상을 포함하는 것을 특징으로 한다.
또한, 일 실시예로서, 상기 컴파운드 정보(Compound Information)는, 컴파운드 이름(Compound Name), 컴파운드 ID(Compound ID), 화학식(Formula), 화학명(Chemical name), 분자량(Molecular Weight), InchI(The IUPAC International Chemical Identifier), SMILES(Simplified Molecular Input Line Entry Specification), CAS RN(Chemical Abstracts Service Registry Number) 중 적어도 하나 이상을 포함하는 것을 특징으로 한다.
또한, 일 실시예로서, 상기 LC-MS/MS 스펙트럼 정보(Spectrum Information)는, 분석 장비 타입(Instrument Type), 충돌 에너지(Collision Energy), 첨가물(Adduct), 피크 데이터(Peak Data), 메타 데이터(Metadata) 중 적어도 하나 이상을 포함하는 것을 특징으로 한다.
또한, 일 실시예로서, 상기 메타 데이터(Metadata)는, 질량 스펙트럼 타입(MS Type), 스캔 순서(Scans), 머무름 시간(Retention Time), 전하(Charge), 베이스 피크(Base Peak), 파편화 방법(Fragmentation Method) 중 적어도 하나 이상을 포함하는 것을 특징으로 한다.
또한, 본 발명의 또 다른 일 실시예로서, 프로그램으로 기록하고 컴퓨터로 읽을 수 있는 저장 매체는, 상기와 같은 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법을 컴퓨터에서 실행시키기 위한 프로그램으로 기록하고 컴퓨터로 읽을 수 있는 저장 매체인 것을 특징으로 한다.
본 발명은 사용자의 편의를 제공하는 GUI(Graphical user interface)를 통해 검색하고자 하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터 또는 천연물 관련 텍스트를 포함하는 천연물 검색 정보를 입력받고, 입력받은 천연물 검색 정보를 검색 조건으로 하여 데이터베이스 매칭 알고리즘에 따른 천연물 정보 검색 기능을 지원할 수 있는 효과가 있다.
더욱 상세하게는, 천연물에 대한 LC-MS/MS 스펙트럼 데이터로서, GUI상에 LC-MS/MS 스펙트럼 파일(MGF, mzml 등)를 입력하거나, 텍스트로 이루어진 스펙트럼 데이터를 어미이온질량(Parent Ion Mass), 피크(Peak) 및 첨가물(Adduct)로 나누어 입력하면, 입력된 LC-MS/MS 스펙트럼 데이터와 자체 데이터베이스 내 230,000개 이상의 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 데이터를 포함하는 천연물 정보를 비교하여 매칭되는 천연물에 대한 LC-MS/MS 스펙트럼 정보 및 컴파운드 정보를 사용자에게 제공할 수 있다.
또한, 천연물 관련 텍스트로서, 천연물의 화학명(Chemical name), 화학식(Formula), InchI(The IUPAC International Chemical Identifier), SMILES(Simplified Molecular Input Line Entry Specification) 중 적어도 하나 이상을 입력하면, 입력된 LC-MS/MS 스펙트럼 데이터와 자체 데이터베이스 내 230,000개 이상의 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 데이터를 포함하는 천연물 정보를 비교하여 매칭되는 천연물에 대한 LC-MS/MS 스펙트럼 정보 및 컴파운드 정보를 사용자에게 제공할 수 있다.
따라서 본 발명은 세계적으로 수요가 확대되는 천연물 자원에 대한 분석에 드는 비용과 시간을 절감해 줄 뿐만 아니라 나고야 의정서 발효에 따라 예상되는 국부 유출을 방지하기 위한 대체물 연구에 소요되는 시간과 비용 또한 절감해 줄 수 있어 관련 산업의 연구개발 활동에 지대한 도움을 줄 수 있으며, 연구의 중심인 학(學)계 및 관(官)계 등 그 값을 필요로 하는 모든 곳에 합당한 정보를 제공하여 그 활동을 보다 원활히 수행 할 수 있게 해주는 효과를 발현할 수 있다 하겠다.
도 1은 본 발명의 일 실시예에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법에 대해 설명하기 위한 흐름도이다.
도 2는 본 발명의 또 다른 일 실시예에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템(100)의 구성에 대해 설명하기 위한 블록도이다.
도 3은 본 발명의 일 실시예에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템의 GUI에 대해 나타낸 예시도이다.
도 4 및 도 5은 본 발명의 일 실시예에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템에서 검색 조건으로서 천연물 관련 텍스트를 입력하여 검색을 수행한 결과를 나타낸 예시도이다.
도 6은 본 발명의 일 실시예에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템에서 검색 조건으로서 LC-MS/MS 스펙트럼 데이터를 입력하여 검색을 수행한 결과를 나타낸 예시도이다.
이하, 첨부된 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 본 발명에 따른 본 발명에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법의 바람직한 실시예를 상세히 설명하도록 한다.
본 발명의 각 도면에 있어서, 구조물들의 사이즈나 치수는 본 발명의 명확성을 기하기 위하여 실제보다 확대하거나 축소하여 도시한 것이고, 특징적 구성이 드러나도록 공지의 구성들은 생략하여 도시하였으므로 도면으로 한정하지는 아니한다.
본 발명의 바람직한 실시예에 대한 원리를 상세하게 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
본 발명은 LC-MS/MS 방법에 의한 230,000개 이상의 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 데이터를 포함하는 천연물 정보가 저장되어 있는 데이터베이스와 사용자로부터 입력받은 LC-MS/MS 스펙트럼 데이터, 천연물 관련 텍스트 등의 천연물 검색 정보를 검색 조건으로 하여 상기 데이터베이스를 검색하여 입력받은 천연물 검색 정보에 대응되는 천연물 정보를 사용자에게 제공하는 서버를 포함하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법에 관한 것이다.
도 1은 본 발명의 일 실시예에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법에 대해 설명하기 위한 흐름도이다.
이에 도시되어 있는 바와 같이, 본 발명에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법은, 서버(120)에 접근 할 수 있는 클라이언트(110)에 사용자가 로그인하는 제1단계; 검색하고자 하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터 또는 천연물 관련 텍스트 중 적어도 하나 이상을 포함하는 천연물 검색 정보를 입력하는 제2단계; 상기 제2단계에서 입력된 천연물 검색 정보를 클라이언트(110)가 서버(120)로 전송하는 제3단계; 상기 서버(120)가 상기 제3단계에서 전송된 천연물 검색 정보를 검색 조건으로 하여 정보 검색 모듈(123)을 통해 230,000개 이상의 천연물에 대한 컴파운드 정보(Compound Information) 및 LC-MS/MS 스펙트럼 정보(Spectrum Information)를 포함하는 천연물 정보가 저장되어 있는 데이터베이스(122)를 검색하여 상기 천연물 검색 정보와 일치하는 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 추출하는 제4단계; 상기 제4단계에서 추출된 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 클라이언트(110)로 전송하는 제5단계; 및 상기 제5단계에서 클라이언트(110)로 전송된 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 클라이언트(110)화면에 디스플레이하는 제6단계;를 포함한다.
상기와 같이 검색 조건으로 사용되는 상기 LC-MS/MS 스펙트럼 데이터는 LC-MS/MS 스펙트럼 파일이거나, C-MS/MS 스펙트럼의 어미이온질량(Parent Ion Mass), 피크(Peak) 및 첨가물(Adduct)을 포함하는 텍스트이고, 또한 상기 천연물 관련 텍스트는 천연물의 화학명(Chemical name), 화학식(Formula), InchI(The IUPAC International Chemical Identifier), SMILES(Simplified Molecular Input Line Entry Specification) 중 적어도 하나 이상을 포함하는 것이다.
또한, 상기 컴파운드 정보(Compound Information)는 컴파운드 이름(Compound Name), 컴파운드 ID(Compound ID), 화학식(Formula), 화학명(Chemical name), 분자량(Molecular Weight), InchI(The IUPAC International Chemical Identifier), SMILES(Simplified Molecular Input Line Entry Specification), CAS RN(Chemical Abstracts Service Registry Number) 중 적어도 하나 이상을 포함한다.
또한, 상기 LC-MS/MS 스펙트럼 정보(Spectrum Information)는 분석 장비 타입(Instrument Type), 충돌 에너지(Collision Energy), 첨가물(Adduct), 피크 데이터(Peak Data), 메타 데이터(Metadata) 중 적어도 하나 이상을 포함한다.
또한, 상기 메타 데이터(Metadata)는, 질량 스펙트럼 타입(MS Type), 스캔 순서(Scans), 머무름 시간(Retention Time), 전하(Charge), 베이스 피크(Base Peak), 파편화 방법(Fragmentation Method) 중 적어도 하나 이상을 포함한다.
한편, 또 다른 일 실시예로서 본 발명은 상기와 같은 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법을 컴퓨터에서 실행시키기 위한 프로그램으로 기록하고 컴퓨터로 읽을 수 있는 저장 매체를 포함한다.
또한, 도 2는 본 발명의 또 다른 일 실시예에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템(100)의 구성에 대해 설명하기 위한 블록도이다.
도 2에 도시되어 있는 바와 같이, 본 발명에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템(100)은 클라이언트(110) 및 서버(120)를 포함하여 구성되며, 상기 클라이언트(110)는 사용자로부터 검색하고자 하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터 또는 천연물 관련 텍스트 중 적어도 하나 이상을 포함하는 천연물 검색 정보를 입력받고, 입력받은 천연물 검색 정보를 서버로 전송하며, 천연물 검색 정보와 일치하는 천연물에 대한 컴파운드 정보(Compound Information) 및 LC-MS/MS 스펙트럼 정보(Spectrum Information)를 서버(120)로부터 전송받아 화면에 디스플레이한다.
또한, 상기 서버(120)는 상기 클라이언트(110)로부터 천연물 검색 정보를 전송받고, 천연물 검색 정보를 검색 조건으로 하여 정보 검색 모듈(123)을 통해 230,000개 이상의 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 포함하는 천연물 정보가 저장되어 있는 데이터베이스(122)를 검색하여 상기 천연물 검색 정보와 일치하는 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 추출하고, 추출된 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 상기 클라이언트로 전송한다.
또한, 본 발명인 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템(100)에서 상기 서버(120)는 웹어플리케이션 서버(121), 천연물의 LC-MS/MS 스펙트럼 정보를 가지고 있는 테이블과 천연물 컴파운드 정보를 가지고 있는 테이블을 포함하는 관계형 데이터베이스(122) 및 천연물 검색 정보를 검색 조건으로 하여 데이터베이스(122)의 정보와 비교/검색하여 천연물 검색 정보와 일치하는 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 추출하는 정보 검색 모듈(123)을 포함하여 구성된다.
실제 사용자가 천연물 정보를 조회하기 위해 사용하는 프로그램인 클라이언트(110)는 미리 정의된 네트워크 프로토콜을 구현하고 있어서, 상기 서버(120)를 통해 원하는 천연물에 대한 정보 검색이 가능하다.
상기 서버(120) 구조는 클라이언트(110)에서 접근할 수 있도록 웹어플리케이션 서버(121)가 외부로 노출되어 있다. 웹어플리케이션이 서버자원을 이용해서 서버(120) 내부에서 사용자 로그인, 천연물 정보 검색 같은 기능을 처리한 다음 결과를 클라이언트(110)로 전송한다.
도 3은 본 발명의 일 실시예에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템의 GUI에 대해 나타낸 예시도이다.
도 3에 도시되어 있는 바와 같이, 본 발명에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템은 검색 조건으로서, GUI(Graphical user interface)를 통해 사용자로부터 LC-MS/MS 스펙트럼 데이터 또는 천연물 관련 텍스트를 입력받는다.
도 3 상에서의 Text Search는 천연물 관련 텍스트를 입력하여 검색을 수행하는 것이고, MS/MS Spectrum Match Search는 LC-MS/MS 스펙트럼 데이터를 입력하여 검색하는 것이다.
더욱 상세하게는, 상기와 같이 검색 조건으로 사용되는 상기 LC-MS/MS 스펙트럼 데이터는 LC-MS/MS 스펙트럼 파일이거나, LC-MS/MS 스펙트럼의 어미이온질량(Parent Ion Mass), 피크(Peak) 및 첨가물(Adduct)을 포함하는 텍스트이다.
또한, 또 다른 검색 조건으로 사용되는 상기 천연물 관련 텍스트는 천연물의 화학명(Chemical name), 화학식(Formula), InchI(The IUPAC International Chemical Identifier), SMILES(Simplified Molecular Input Line Entry Specification) 중 적어도 하나 이상을 포함한다.
도 4 및 도 5은 본 발명의 일 실시예에 따른 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템에서 검색 조건으로서 천연물 관련 텍스트를 입력하여 검색을 수행한 결과를 나타낸 예시도이고, 도 6은 검색 조건으로서 LC-MS/MS 스펙트럼 데이터를 입력하여 검색을 수행한 결과를 나타낸 예시도이다.
도 4 내지 도 6에 도시된 바와 같이, 본 발명의 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템은 LC-MS/MS 스펙트럼 데이터 또는 천연물 관련 텍스트를 입력받으면, 이를 기반으로 데이터베이스로부터 상기 검색 조건에 해당하는 천연물에 대한 컴파운드 정보(Compound Information) 및 LC-MS/MS 스펙트럼 정보(Spectrum Information)(도면상에는 Spectra Information으로 기재됨)를 추출하여 클라이언트를 통해 사용자에게 디스플레이한다.
이때, 상기 컴파운드 정보(Compound Information)는 컴파운드 이름(Compound Name), 컴파운드 ID(Compound ID), 화학식(Formula), 화학명(Chemical name), 분자량(Molecular Weight), InchI(The IUPAC International Chemical Identifier), SMILES(Simplified Molecular Input Line Entry Specification), CAS RN(Chemical Abstracts Service Registry Number) 중 적어도 하나 이상을 포함한다.
또한, 상기 LC-MS/MS 스펙트럼 정보(Spectrum Information)는 분석 장비 타입(Instrument Type), 충돌 에너지(Collision Energy), 첨가물(Adduct), 피크 데이터(Peak Data), 메타 데이터(Metadata) 중 적어도 하나 이상을 포함한다.
또한, 상기 메타 데이터(Metadata)는, 질량 스펙트럼 타입(MS Type), 스캔 순서(Scans), 머무름 시간(Retention Time), 전하(Charge), 베이스 피크(Base Peak), 파편화 방법(Fragmentation Method) 중 적어도 하나 이상을 포함한다.
이상으로 본 발명은 첨부된 도면에 도시된 실시예를 참조하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술에 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 것을 이해할 것이다. 따라서 본 발명의 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.
100 : 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 시스템
110 : 클라이언트
120 : 서버
121 : 웹어플리케이션 서버
122 : 데이터베이스
123 : 정보 검색 모듈

Claims (7)

  1. 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법에 있어서,
    서버에 접근 할 수 있는 클라이언트에 사용자가 로그인하는 제1단계;
    검색하고자 하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터 또는 천연물 관련 텍스트 중 적어도 하나 이상을 포함하는 천연물 검색 정보를 입력하는 제2단계;
    상기 제2단계에서 입력된 천연물 검색 정보를 클라이언트에서 서버로 전송하는 제3단계;
    상기 서버가 상기 제3단계에서 전송된 천연물 검색 정보를 검색 조건으로 하여 정보 검색 모듈을 통해 천연물에 대한 컴파운드 정보(Compound Information) 및 LC-MS/MS 스펙트럼 정보(Spectrum Information)를 포함하는 천연물 정보가 저장되어 있는 데이터베이스를 검색하여 상기 천연물 검색 정보와 일치하는 천연물에 대한 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 추출하는 제4단계;
    상기 제4단계에서 추출된 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 클라이언트로 전송하는 제5단계; 및
    상기 제5단계에서 클라이언트로 전송된 컴파운드 정보 및 LC-MS/MS 스펙트럼 정보를 클라이언트 화면에 디스플레이하는 제6단계;를 포함하며,
    상기 LC-MS/MS 스펙트럼 데이터는,
    LC-MS/MS 스펙트럼 파일이거나, LC-MS/MS 스펙트럼의 어미이온질량(Parent Ion Mass), 피크(Peak) 및 첨가물(Adduct)을 포함하는 텍스트인 것을 특징으로 하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 천연물 관련 텍스트는,
    화학명(Chemical name), 화학식(Formula), InchI(The IUPAC International Chemical Identifier), SMILES(Simplified Molecular Input Line Entry Specification) 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법.
  4. 제1항에 있어서,
    상기 컴파운드 정보(Compound Information)는,
    컴파운드 이름(Compound Name), 컴파운드 ID(Compound ID), 화학식(Formula), 화학명(Chemical name), 분자량(Molecular Weight), InchI(The IUPAC International Chemical Identifier), SMILES(Simplified Molecular Input Line Entry Specification), CAS RN(Chemical Abstracts Service Registry Number) 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법.
  5. 제1항에 있어서,
    상기 LC-MS/MS 스펙트럼 정보(Spectrum Information)는,
    분석 장비 타입(Instrument Type), 충돌 에너지(Collision Energy), 첨가물(Adduct), 피크 데이터(Peak Data), 메타 데이터(Metadata) 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법.
  6. 제5항에 있어서,
    상기 메타 데이터(Metadata)는,
    질량 스펙트럼 타입(MS Type), 스캔 순서(Scans), 머무름 시간(Retention Time), 전하(Charge), 베이스 피크(Base Peak), 파편화 방법(Fragmentation Method) 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법.
  7. 제1항, 제3항 내지 제6항 중 어느 한 항에 의한 천연물에 대한 LC-MS/MS 스펙트럼 데이터를 분석하는 방법을 컴퓨터에서 실행시키기 위한 프로그램으로 기록하고 컴퓨터로 읽을 수 있는 저장 매체.
KR1020180010484A 2018-01-29 2018-01-29 천연물에 대한 lc-ms/ms 스펙트럼 데이터를 분석하는 방법 KR102564473B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180010484A KR102564473B1 (ko) 2018-01-29 2018-01-29 천연물에 대한 lc-ms/ms 스펙트럼 데이터를 분석하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180010484A KR102564473B1 (ko) 2018-01-29 2018-01-29 천연물에 대한 lc-ms/ms 스펙트럼 데이터를 분석하는 방법

Publications (2)

Publication Number Publication Date
KR20190091668A KR20190091668A (ko) 2019-08-07
KR102564473B1 true KR102564473B1 (ko) 2023-08-07

Family

ID=67621287

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180010484A KR102564473B1 (ko) 2018-01-29 2018-01-29 천연물에 대한 lc-ms/ms 스펙트럼 데이터를 분석하는 방법

Country Status (1)

Country Link
KR (1) KR102564473B1 (ko)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978804A (en) 1996-04-11 1999-11-02 Dietzman; Gregg R. Natural products information system
US20030037045A1 (en) 2001-05-21 2003-02-20 Ian Melhado Distributed computing environment for recognition of proteomics spectra
US20030213902A1 (en) 2002-04-01 2003-11-20 Jeol Ltd. Method and apparatus for analyzing mass spectrum
US20090192719A1 (en) 2008-01-25 2009-07-30 Kincaid Robert H Exploratory visualization of protein complexes by molecular weight
US20090221436A1 (en) 2000-11-17 2009-09-03 Slanetz Alfred E Process for determining target function and identifying drug leads
US20150148242A1 (en) 2012-06-05 2015-05-28 Mcmaster University Screening method and systems utilizing mass spectral fragmentation patterns
CN105095448A (zh) 2015-07-24 2015-11-25 浙江大远智慧制药工程技术有限公司 一种适用于天然产物质谱数据解析的数据库构建方法
US20170107557A1 (en) 2015-06-25 2017-04-20 Ascus Biosciences, Inc. Methods, apparatuses, and systems for microorganism strain analysis of complex heterogeneous communities, predicting and identifying functional relationships and interactions thereof, and selecting and synthesizing microbial ensembles based thereon
WO2017100917A1 (en) 2015-12-14 2017-06-22 Mcmaster University A natural product and genetic data analysis and discovery system, method and computational platform therefor
US20170227545A1 (en) 2014-06-10 2017-08-10 The Board Of Trustees Of The University Of Illinois Reactivity-based screening for natural product discovery

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101375672B1 (ko) * 2011-10-27 2014-03-20 주식회사 켐에쎈 화합물의 물성을 예측하는 방법 및 화합물의 물성을 예측하는 시스템

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978804A (en) 1996-04-11 1999-11-02 Dietzman; Gregg R. Natural products information system
US20090221436A1 (en) 2000-11-17 2009-09-03 Slanetz Alfred E Process for determining target function and identifying drug leads
US20030037045A1 (en) 2001-05-21 2003-02-20 Ian Melhado Distributed computing environment for recognition of proteomics spectra
US20030213902A1 (en) 2002-04-01 2003-11-20 Jeol Ltd. Method and apparatus for analyzing mass spectrum
US20090192719A1 (en) 2008-01-25 2009-07-30 Kincaid Robert H Exploratory visualization of protein complexes by molecular weight
US20150148242A1 (en) 2012-06-05 2015-05-28 Mcmaster University Screening method and systems utilizing mass spectral fragmentation patterns
US20170227545A1 (en) 2014-06-10 2017-08-10 The Board Of Trustees Of The University Of Illinois Reactivity-based screening for natural product discovery
US20170107557A1 (en) 2015-06-25 2017-04-20 Ascus Biosciences, Inc. Methods, apparatuses, and systems for microorganism strain analysis of complex heterogeneous communities, predicting and identifying functional relationships and interactions thereof, and selecting and synthesizing microbial ensembles based thereon
CN105095448A (zh) 2015-07-24 2015-11-25 浙江大远智慧制药工程技术有限公司 一种适用于天然产物质谱数据解析的数据库构建方法
WO2017100917A1 (en) 2015-12-14 2017-06-22 Mcmaster University A natural product and genetic data analysis and discovery system, method and computational platform therefor

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CREMIN Peadar A, et al., "High-Throughput Analysis of Natural Product Compound Libraries by Parallel LC-MS Evaporative Light Scattering Detection", pp 5492-5500, Analytical Chemistry, Vol.74, No.21 1부*
SARGENT Mike, et al., "Guide to achieving reliable quantitative LC-MS measurements", RSC Analytical Methods Committee(2013) 1부.*

Also Published As

Publication number Publication date
KR20190091668A (ko) 2019-08-07

Similar Documents

Publication Publication Date Title
McEachran et al. Identifying known unknowns using the US EPA’s CompTox Chemistry Dashboard
Shishkova et al. Now, more than ever, proteomics needs better chromatography
Carapito et al. MSDA, a proteomics software suite for in‐depth M ass S pectrometry D ata A nalysis using grid computing
Muth et al. XTandem Parser: an open‐source library to parse and analyse X! Tandem MS/MS search results
Samokhin et al. Evaluation of mass spectral library search algorithms implemented in commercial software
Dyrlund et al. MS D ata M iner: A web‐based software tool to analyze, compare, and share mass spectrometry protein identifications
Alon et al. How enhanced molecular ions in Cold EI improve compound identification by the NIST library
CN102663060B (zh) 一种识别被篡改网页的方法及装置
KR101888860B1 (ko) 로그 생성기 및 그를 포함하는 빅 데이터 분석 전처리 시스템
JPWO2019240289A1 (ja) 化合物の構造を同定するための方法およびシステム
CN105808605B (zh) 一种搜索日志合并方法和系统
GB2410609A (en) Spectral axis transform for reference library searching
KR102564473B1 (ko) 천연물에 대한 lc-ms/ms 스펙트럼 데이터를 분석하는 방법
KR102538144B1 (ko) 천연물에 대한 lc-ms/ms 스펙트럼 데이터를 분석하는 시스템
CN102831174B (zh) 结构化信息快速检索方法及系统
Meng et al. LipidMiner: a software for automated identification and quantification of lipids from multiple liquid chromatography-mass spectrometry data files
Kilgour et al. Appropriate degree of trust: deriving confidence metrics for automatic peak assignment in high-resolution mass spectrometry
Rosnack et al. Screening solution using the software platform UNIFI: an integrated workflow by waters
Laganà et al. High-resolution mass spectrometry in food and environmental analysis
JP6384469B2 (ja) 情報処理装置、情報処理システム、制御方法、及びプログラム
Hu et al. The Bridge between Screening and Assessment: Establishment and Application of Online Screening Platform for Food Risk Substances
JPWO2020080376A1 (ja) 事例検索方法および事例検索システム
CN111225079A (zh) 恶意软件作者地理位置定位方法、设备、存储介质及装置
JP2016070789A (ja) 質量分析データ処理装置
US9996621B2 (en) System and method for retrieving internet pages using page partitions

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant