KR102013913B1 - O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 - Google Patents

O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 Download PDF

Info

Publication number
KR102013913B1
KR102013913B1 KR1020170124401A KR20170124401A KR102013913B1 KR 102013913 B1 KR102013913 B1 KR 102013913B1 KR 1020170124401 A KR1020170124401 A KR 1020170124401A KR 20170124401 A KR20170124401 A KR 20170124401A KR 102013913 B1 KR102013913 B1 KR 102013913B1
Authority
KR
South Korea
Prior art keywords
linked
glycopeptide
spectrum
database
present
Prior art date
Application number
KR1020170124401A
Other languages
English (en)
Other versions
KR20190035325A (ko
Inventor
박건욱
유종신
김진영
이주연
이현경
Original Assignee
한국기초과학지원연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국기초과학지원연구원 filed Critical 한국기초과학지원연구원
Priority to KR1020170124401A priority Critical patent/KR102013913B1/ko
Priority to PCT/KR2017/014856 priority patent/WO2019066147A1/ko
Priority to US16/078,333 priority patent/US11181531B2/en
Publication of KR20190035325A publication Critical patent/KR20190035325A/ko
Application granted granted Critical
Publication of KR102013913B1 publication Critical patent/KR102013913B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2400/00Assays, e.g. immunoassays or enzyme assays, involving carbohydrates
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2560/00Chemical aspects of mass spectrometric analysis of biological material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Biochemistry (AREA)
  • Bioethics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Microbiology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

본 발명은 고분해능 질량 스펙트럼의 결과를 이용한 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법에 관한 것이다. 구체적으로, 본 발명에 따른 생물정보처리 분석 방법은 다양한 종류의 시료에 포함된 종래에 공지되지 않은 당쇄를 갖는 O-연결형 당펩티드의 양적 변화를 효율적이고 정확하게 분석할 수 있고, 고분해능 질량 분석기를 이용함으로써, 시료로부터 암 등을 포함하는 질병의 마커를 발견하여 예측 또는 진단하거나 당단백질 의약품의 O-연결형 당펩티드의 구조를 분석하는데 유용하게 사용될 수 있다.

Description

O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법{BIOINFORMATICS PLATFORM FOR HIGH-THROUGHPUT IDENTIFICATION AND QUANTIFICATION OF O-GLYCOPEPTIDE}
본 발명은 고분해능 질량 스펙트럼의 결과를 이용한 O-연결형 당펩티드의 동정 및 상대적 정량을 위한 생물정보처리 분석 방법에 관한 것이다.
인간의 혈액은 수많은 단백질들의 혼합체이며, 이중 50% 이상이 당단백질이다. 그러나, 당단백질은 당의 다양성과 복잡성때문에 단백체 분석에 비해 정성분석 또는 정량분석이 어렵다. 최근 고분해능 질량분석기의 도입으로 당이나 당단백질의 분석이 빠른 속도로 발전하고 있으나, 이와 같은 방법으로 분석된 결과를 이용하여 당단백질을 동정 및 정량할 수 있는 생물정보처리 기술이 미약하다.
단백질의 당화는 N-연결형과 O-연결형 당화로 구분된다. N-연결형의 당화는 소포체(ER)에서 일어나는 반면, O-연결형의 당화는 ER, 골지체 또는 세포질에서 일어난다. O-연결형 당화는 비-뮤신 타입(non-mucin type)과 뮤신 타입(mucin type)으로 분류되며, 포유류에서 발생하는 O-연결형 당화는 주로 뮤신 타입이다. 뮤신 타입의 당화는 주로 N-아세틸갈락토사민(GalNAc)이 세린 또는 트레오닌에 결합함으로써 시작되며, 돌리콜(dolichol)과 같은 전구체(precursor)의 도움 없이 바로 효소에 의해 일어나기 때문에 복잡하다. 또한, 뮤신 타입의 O-연결형 당단백질은 세포질이나 핵에서 주로 발견된다. 다만, O-연결형 당화는 N-연결형 당화에 비해 상대적으로 연구가 적어 아직까지 많이 알려져 있지 않다.
전체 당단백질 중에서 12%의 당단백질이 O-연결형을 포함하고 있고, 그중에서 10%는 N-연결형과 O-연결형을 모두 포함한다. 따라서, O-연결형 당펩티드는 N-연결형 당펩티드와 일반 펩티드의 영향에 의해 상대적으로 낮은 감도를 나타냄으로써 분석이 어렵다.
O-연결형 당펩티드를 정성 및 정량분석하는데 사용된 종래의 방법은 다음과 같은 한계가 있다. 첫째, O-연결형 당펩티드의 일반적인 기본 구조는 알려져 있으나, O-연결형 당펩티드가 매우 다양한 형태로 존재하기 때문에 새로운 O-연결형 당펩티드의 조성을 미리 알 수 없다. 따라서, 완전한 O-연결형 당펩티드에 대한 데이터베이스를 만드는데 어려움이 있다. 둘째, 동물에서는 O-연결형 당펩티드의 뮤신 타입이 가장 많이 발견되는데, 이는 상기 서술한 바와 같이 N-아세틸갈락토사민이 세린 또는 트레오닌의 산소원자에 결합하면서 시작된다. 그러나, 단백질을 구성하는 아미노산 서열에서 세린 및 트레오닌은 발견 빈도가 높아 분석하고자 하는 O-연결형 당펩티드에도 두개 이상의 O-연결형 당질화 사이트가 존재할 수 있다.
한편, 현재 질량 스펙트럼 또는 탄뎀 질량 스펙트럼을 이용하여 O-연결형 당펩티드를 검색하는 소프트웨어로는 SimGlycan(Arun Apte, Ningombam Sanjib Meitei, et al ., Bioinformatics in Glycomics: Glycan Characterization with Mass Spectrometric Data Using SimGlycan™, Springer Protocols, 2009, 269-281), Byonic(Bern, M. et al ., Current Protocols in Bioinformatics; Wiley: New York, 2012, Chapter 13, Unit 13.20)과 같은 상업용 소프트웨어가 있다. 뿐만 아니라, 프리웨어 소프트웨어로는 GlycoMID(Yanlin Zhang et al ., Identification of Glycopeptides with Multiple Hydroxylysine O-Glycosylation Sites by Tandem Mass Spectrometry, Journal of proteome research, 2015, 14, 5099-5108), SweetNET(Waqas Nasir et al ., SweetNET: A Bioinformatics Workflow for Glycopeptide MS/MS Spectral Analysis, Journal of proteome research, 2016, 15, 2826-2840), GPQuest(Shadi Toghi Eshghi et al ., Classification of Tandem Mass Spectra for Identification of N- and O-linked Glycopeptides, Scientific Reports, 2016, DOI: 10.1038/srep37189), GlycResoft(Evan Maxwell et al ., GlycReSoft: A Software Package for Automated Recognition of Glycans from LC/MS Data, PLOS one, 2012.7.9. e45474.), 및 Protein Prospector(Robert J. Chalkley et al ., Use of a glycosylation site database to improve glycopeptide identification from complex mixtures, Analytical and Bioanalytical Chemistry, 2017, 409, 2, pp.571-577) 등의 프로그램이 아카데미 버전으로 개발되어 사용되고 있다.
그러나, 상기와 같은 프로그램들은 데이터베이스 내에 존재하는 당쇄 사이트 또는 당쇄 구조만 검색할 수 있다는 점에서 O-연결형 당펩티드 데이터베이스에 존재하지 않는 새로운 당쇄는 확인할 수 없다. 또한, 상기 프로그램들은 한번에 정성 및 정량분석을 동시에 수행할 수 없고, 고분해능 질량 분석기의 다양한 조각화 스펙트럼을 지원하지 않는 문제가 있다.
이에, 본 발명자들은 상기 문제를 해결하고, 질량 스펙트럼의 결과로부터 일반 펩티드나 N-연결형 당펩티드에 비해 상대적으로 감도(또는 농도)가 낮은 O-연결형 당펩티드를 효율적이고 정확하게 동정 및 정량할 수 있는 분석 방법을 완성하였다. 구체적으로, 일반적으로 잘 알려진 11종류의 O-연결형 당쇄구조(Essentials of Glycobiology, Second Edition: 1) HexNAc, 2) HexNAc-Neu5Ac, 3) 2HexNAc, 4) 2HexNAc-Neu5Ac, 5) 3HexNAc, 6) HexNAc-Hex, 7) HexNAc-Hex-Neu5Ac, 8) HexNAc-Hex-2Neu5Ac, 9) 2HexNAc-Hex, 10) 2HexNAc-2Hex, 11) 3HexNAc-1Hex)와 Uniprot 데이터베이스에 공지된 O-연결형 당쇄 위치를 데이터베이스에 저장하고, 저장된 O-연결형 당펩티드들의 이론적인 동위원소 분포를 모델링한 결과를 추가 데이터베이스화하였다. 한편, 탄뎀 질량 스펙트럼(MS/MS) 또는 질량 스펙트럼(MS)에서 수득된 당펩티드의 동위원소 분포를 상기 데이터베이스와 비교하거나 새로운 O-패밀리 검색(O-family search) 방법을 이용하여 당쇄 사이트나 구조에 제한없이 O-연결형 당펩티드를 정확히 동정하고, 이온 크로마토그램(ion chromatograms)을 이용하여 TIQ(top three isotope quantitation)을 계산함으로써 별다른 표지과정 없이 정량분석할 수 있음을 확인함으로써, 본 발명을 완성하였다.
본 발명의 목적은 질량 스펙트럼의 결과로부터 일반 펩티드에 비해 상대적으로 감도(또는 농도)가 낮은 O-연결형 당펩티드를 효율적으로 정확하게 동정 및 정량분석하기 위한 생물정보처리 분석 방법을 제공하는 것이다.
상기 목적을 달성하기 위해, 본 발명은 1) 시료 내 당단백질을 가수분해하여 수득된 폴리펩티드를 고분해능 질량분석기로 분석하여 질량 스펙트럼을 얻는 단계; 2) 상기 단계 1)에서 얻은 질량 스펙트럼 결과를 MS 및 탄뎀 스펙트럼(MS/MS)으로 변환하는 단계; 3) 상기 단계 2)에서 변환된 HCD-MS/MS 개별 스펙트럼 피크의 질량 대 전하비(m/z)가 126.05, 129.06, 138.06, 144.06, 145.05, 147.07, 163.06, 168.07, 186.08, 204.08, 274.09, 292.10, 350.15, 366.14, 454.16, 528.19 및 657.24로 구성된 피크(Oxonium ion peaks)를 이용하여 각 탄뎀 스펙트럼에서 M-스코어를 계산하는 단계; 4) 상기 단계 3)에서 계산된 M-스코어 분포도에서 가우시안 피팅 방법을 사용하여 당펩티드와 펩티드를 분리하는 값을 결정하고 당펩티드 스펙트럼을 선택하는 단계; 5) 상기 단계 4)에서 선택된 당펩티드 스펙트럼에서 O-연결형 및 N-연결형 분류 요소(O/N sorting factor)를 이용하여 O-연결형 당펩티드 스펙트럼을 선택하는 단계; 6) 상기 단계 5)에서 선택된 O-연결형 당펩티드 스펙트럼의 MS에서 동위원소 분포를 얻고, 이를 데이터베이스와 비교하여 계산된 S-스코어를 이용하여 데이터베이스에 존재하는 O-연결형 당펩티드를 결정하는 단계; 7) 상기 단계 6)에서 결정된 데이터베이스에 존재하는 O-연결형 당펩티드로부터 탄뎀 스펙트럼에서의 Y-스코어를 이용하여 데이터베이스에 존재하는 O-연결형 당펩티드를 평가하는 단계; 8) 상기 단계 7)에서 평가된 데이터베이스에 존재하는 O-연결형 당펩티드에 대하여 P-스코어를 계산하여 O-연결형 당 사이트를 결정하고, 평가된 데이터베이스에 존재하는 O-연결형 당펩티드의 정량분석을 수행하는 단계; 9) 상기 단계 8)에서 정량분석된 데이터베이스에 존재하는 O-연결형 당펩티드를 근거로(root/seed) O-패밀리 서치 방법을 이용하여 데이터베이스에 존재하지 않는 O-연결형 당펩티드를 선별하는 단계; 10) 상기 단계 9)에서 선별된 데이터베이스에 존재하지 않는 O-연결형 당펩티드로부터 탄뎀 스펙트럼의 Y-스코어를 이용하여 데이터베이스에 존재하지 않는 O-연결형 당펩티드를 평가하는 단계; 11) 상기 단계 10)에서 평가된 데이터베이스에 존재하지 않는 O-연결형 당펩티드에 대하여 P-스코어를 계산하여 O-연결형 당 사이트를 결정하고, 평가된 데이터베이스에 존재하지 않는 O-연결형 당펩티드에 대하여 정량분석을 수행하는 단계를 포함하는 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법을 제공한다.
본 발명에 따른 생물정보처리 분석 방법은 다양한 종류의 시료에 포함된 종래에 공지되지 않은 당쇄를 갖는 O-연결형 당펩티드의 양적 변화를 효율적이고 정확하게 분석할 수 있고, 고분해능 질량 분석기를 이용함으로써, 시료로부터 암 등을 포함하는 질병의 마커를 발견하여 예측 또는 진단하거나 당단백질 의약품의 O-연결형 당펩티드의 구조를 분석하는데 유용하게 사용될 수 있다.
도 1은 분석 시료로부터 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법을 도식화한 순서도이다.
도 2는 표준 당단백질을 이용한 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 중 단계 3)에서 일반 펩티드와 당펩티드의 M-스코어 분포도를 나타내는 도면이다.
도 3은 표준 당단백질을 이용한 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 중 단계 4)에서 선택된 당펩티드를 단계 5)에서 N-연결형 및 O-연결형 당펩티드로 O-연결형 및 N-연결형 분류 요소로 분류한 결과를 나타내는 도면이다.
도 4는 표준 당단백질을 이용한 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 중 단계 7)에서의 Y-스코어 분포도를 나타내는 도면이다.
도 5a는 표준 당단백질을 이용한 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 중 단계 10)에서의 O-패밀리 서치 방법을 도식화한 도면이다.
도 5b는 표준 당단백질을 이용한 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 중 단계 10)에서의 O-패밀리 서치 방법 중 스펙트럼 유사도의 예시를 나타내는 도면이다.
도 6은 표준 당단백질을 이용한 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 중 단계 11)에서의 Y-스코어 분포도를 나타내는 도면이다.
도 7a는 표준 당단백질을 이용한 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법의 결과에 따라 선별된 O-연결형 당펩티드인 T(HexNAc-Hex)PLPPT(HexNAc-Hex)SAHGNVAEGETKPDPDVTER의 대표적인 EThcD 스펙트럼을 나타내는 도면이다.
도 7b는 표준 당단백질을 이용한 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법의 결과에 따라 선별된 O-연결형 당펩티드인 T(2HexNAc-2Hex)PLPPTSAHGNVAEGETKPDPDVTER의 대표적인 EThcD 스펙트럼을 나타내는 도면이다.
도 8은 실시예에서 인간 혈청 시료를 이용하여 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석을 3회 반복한 결과를 나타내는 도면이다.
도 9a는 실시예에서 인간 혈청 시료를 이용하여 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 중, 당단백질의 정성분석 결과를 벤다이어그램으로 나타낸 도면이다.
도 9b는 실시예에서 인간 혈청 시료를 이용하여 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 중, O-연결형 당펩티드의 정성분석 결과를 벤다이어그램으로 나타낸 도면이다.
도 10은 실시예에서 인간 혈청 시료를 이용하여 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 중, O-연결형 당펩티드의 정량분석 결과를 히트 맵으로 나타낸 도면이다.
도 11a는 실시예에서 인간 혈청 시료를 이용하여 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법의 결과에 따라 선별된 O-연결형 당펩티드인 TPLPPTSAHGNVAEGETKPDPDVTER(HexNAc-Hex-Neu5Ac)(서열번호 2)의 대표적인 HCD(high energy collision dissociation), CID(collision-induced dissociation) 및 ETD(electron transfer dissociation) 스펙트럼을 나타내는 도면이다.
도 11b는 실시예에서 표준 당단백질을 이용하여 본 발명에 따른 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법의 결과에 따라 선별된 O-연결형 당펩티드인 T(HexNAc-Hex-Neu5Ac)PLPPTSAHGNVAEGETKPDPDVTER의 대표적인 HCD, CID 및 EThcD(electron-transfer/higher-energy collision dissociation) 스펙트럼을 나타내는 도면이다.
이하, 본 발명을 상세히 설명한다.
본 발명은 1) 시료 내 당단백질을 가수분해하여 수득된 폴리펩티드를 고분해능 질량분석기로 분석하여 질량 스펙트럼을 얻는 단계; 2) 상기 단계 1)에서 얻은 질량 스펙트럼 결과를 MS 및 탄뎀 스펙트럼(MS/MS)으로 변환하는 단계; 3) 상기 단계 2)에서 변환된 HCD-MS/MS 개별 스펙트럼 피크의 질량 대 전하비(m/z)가 126.05, 129.06, 138.06, 144.06, 145.05, 147.07, 163.06, 168.07, 186.08, 204.08, 274.09, 292.10, 350.15, 366.14, 454.16, 528.19 및 657.24로 구성된 피크(Oxonium ion peaks)를 이용하여 각 탄뎀 스펙트럼에서 M-스코어를 계산하는 단계; 4) 상기 단계 3)에서 계산된 M-스코어 분포도에서 가우시안 피팅 방법을 사용하여 당펩티드와 펩티드를 분리하는 값을 결정하고 당펩티드 스펙트럼을 선택하는 단계; 5) 상기 단계 4)에서 선택된 당펩티드 스펙트럼에서 O-연결형 및 N-연결형 분류 요소(O/N sorting factor)를 이용하여 O-연결형 당펩티드 스펙트럼을 선택하는 단계; 6) 상기 단계 5)에서 선택된 O-연결형 당펩티드 스펙트럼의 MS에서 동위원소 분포를 얻고, 이를 데이터베이스와 비교하여 계산된 S-스코어를 이용하여 데이터베이스에 존재하는 O-연결형 당펩티드를 결정하는 단계; 7) 상기 단계 6)에서 결정된 데이터베이스에 존재하는 O-연결형 당펩티드로부터 탄뎀 스펙트럼에서의 Y-스코어를 이용하여 데이터베이스에 존재하는 O-연결형 당펩티드를 평가하는 단계; 8) 상기 단계 7)에서 평가된 데이터베이스에 존재하는 O-연결형 당펩티드에 대하여 P-스코어를 계산하여 O-연결형 당 사이트를 결정하고, 평가된 데이터베이스에 존재하는 O-연결형 당펩티드의 정량분석을 수행하는 단계; 9) 상기 단계 8)에서 정량분석된 데이터베이스에 존재하는 O-연결형 당펩티드를 근거로(root/seed) O-패밀리 서치 방법을 이용하여 데이터베이스에 존재하지 않는 O-연결형 당펩티드를 선별하는 단계; 10) 상기 단계 9)에서 선별된 데이터베이스에 존재하지 않는 O-연결형 당펩티드로부터 탄뎀 스펙트럼의 Y-스코어를 이용하여 데이터베이스에 존재하지 않는 O-연결형 당펩티드를 평가하는 단계; 11) 상기 단계 10)에서 평가된 데이터베이스에 존재하지 않는 O-연결형 당펩티드에 대하여 P-스코어를 계산하여 O-연결형 당 사이트를 결정하고, 평가된 데이터베이스에 존재하지 않는 O-연결형 당펩티드에 대하여 정량분석을 수행하는 단계를 포함하는 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법을 제공한다.
본 명세서에 사용된 용어, "가수분해"는 당단백질로부터 당만을 분리하는 과정을 의미한다. 상기 가수분해 통상의 기술분야에 잘 알려진 방법이라면 어떠한 방법을 사용하여 수행될 수 있다. 특히, 상기 가수분해는 가수분해 효소를 사용하여 수행될 수 있고, 이는 구체적으로, 트립신(trypsin), 아르기닌 C(Arg-C), 아스파르트산 N(Asp-N), 글루탐산 C(Glu-C), 라이신 C(Lys-C), 키모트립신(chymotrypsin) 및 프로테나아제 K(proteinase K)로 구성된 군으로부터 선택된 효소로 수행될 수 있다.
본 명세서에 사용된 용어, "탄뎀 스펙트럼(MS/MS)"은 전체 질량 스펙트럼(MS) 중에서 관심있는 이온 또는 상대적으로 감도가 높은 이온들을 선택하여 분석한 스펙트럼을 의미한다. 상기 탄뎀 스펙트럼의 질량을 분석하여 탄뎀 질량분석을 수행할 수 있다. 탄뎀 스펙트럼을 이용하여 결정된 데이터베이스에 존재하는 O-연결형 당펩티드를 근거로(root/seed) O-패밀리 서치 방법을 이용하여 데이터베이스에 존재하지 않는 O-연결형 당펩티드를 선별할 수 있다. 상기 탄뎀 스펙트럼은 CID 또는 HCD-MS/MS 스펙트럼일 수 있다.
본 발명에 따른 분석 방법은 일반 펩티드에 비해 복잡하고, 다양성이 높으며 시료 내에 낮은 농도로 존재하는 O-연결형 당펩티드를 효율적으로 정성 및 정량분석하기 위해 질량분석기를 이용할 수 있다. 상기 질량분석기로부터 수득된 결과를 M-스코어, S-스코어, Y-스코어 및 P-스코어를 이용하여 O-연결형 당펩티드를 동정하고, 동정된 당펩티드의 정량분석을 수행할 수 있다. 상기 질량분석기는 10,000 이상의 질량 분해능을 갖고, 50 ppm 이하의 질량 정확도를 가질 수 있다. 구체적으로, 상기 질량분석기는 Orbitrap Fusion Lumos, Orbitrap Elite 또는 Q Exactive일 수 있다.
상기 M-스코어는 일반 펩티드 스펙트럼 및 당펩티드 스펙트럼을 효율적으로 분류할 수 있다. 상기 M-스코어는 하기 수학식 1에 의해 계산될 수 있다:
[수학식 1]
Figure 112017094101917-pat00001
(N은 확인할 수 있는 당피크 수,
n은 확인한 당피크 수,
Imi는 매치된 i번째 피크 강도,
Imax는 스펙트럼에서 염기 피크의 강도, 및
C는 상수 값).
상기 방법에 따라 당단백질 표준시료(hemopexin)의 HCD-MS/MS 스펙트라로부터 M-스코어 분포도를 나타낼 수 있다(도 2). 상기 분포도는 가우시안 피팅을 자동으로 적용함으로써 일반 펩티드 및 당펩티드를 분류할 수 있다.
본 발명에 따른 분석 방법에서, 단계 5)는 단계 4)에서 M-스코어 분포도를 이용하여 선택된 당펩티드 스펙트럼에서 O-연결형 및 N-연결형 분류 요소(O/N sorting factor)(GlcNac/GalNAc)가 4.0 이하인 O-연결형 당펩티드 스펙트럼을 결정할 수 있다(도 3). 이때, O-연결형 및 N-연결형 분류 요소는 하기 수학식 5에 의해 계산될 수 있다:
[수학식 5]
Figure 112017094101917-pat00002
본 발명에 따른 분석 방법에서, S-스코어는 단계 6)에서 당펩티드 스펙트럼의 MS에서 동위원소 분포를 얻고, 이를 이론적인 데이터베이스와 비교하여 당펩티드를 동정하는데 사용될 수 있고, 이는 하기 수학식 2에 의해 계산될 수 있다:
[수학식 2]
Figure 112017094101917-pat00003
(X1은 이론적인 동위원소 피크들 중 n번째 피크의 질량,
Y1은 실험적인 동위원소 피크들 중 n번째 피크의 질량,
X2는 이론적인 동위원소 피크들 중 n번째 피크의 상대적인 강도,
Y2는 실험적인 동위원소 피크들 중 n번째 피크의 상대적인 강도,
C1 및 C2는 상수값).
상기 S-스코어를 계산할 때 동위원소의 질량 분포가 유클리드 거리 및 강도 분포를 피어슨 상관 분석을 이용하여 유사도를 측정할 수 있다. 또한, 상기 단계 6)에서 당단백질로부터 당펩티드의 이론적인 동위원소 분포를 이용하여 데이터베이스를 구축한 다음, 이를 O-연결형 당펩티드의 동정 및 정량 분석에 이용할 수 있다. 상기 용어, "동위원소(isotopic)"는 원자 번호는 같으나 원자량이 다른 화학원소를 의미한다.
본 발명에 따른 분석 방법에서, 상기 단계 7) 및 10)에서 Y-스코어를 이용하여 평가된 O-연결형 당펩티드 후보 또는 O-연결형 당펩티드(도 4)는 O-패밀리 서치 방법을 이용하여 이론적으로 나타낼 수 있는 당펩티드 단편화의 정도를 탄뎀 스펙트럼(CID 또는 HCD)에서 Y-스코어로 계산 및 평가할 수 있다(도 7). 이때, 상기 Y-스코어는 하기 수학식 3에 의해 계산될 수 있고, 이는 HCDmatch 및 CIDmatch의 합으로 나타낼 수 있다:
[수학식 3]
Figure 112017094101917-pat00004
(Imax는 스펙트럼에서 염기 피크의 강도,
Imi는 매치된 i번째 피크 강도,
Isi는 스펙트럼에서 i번째 피크 강도, 및
C1 및 C2는 상수값).
본 발명에 따른 분석 방법에서, 상기 단계 8) 또는 11)의 P-스코어는 이론적으로 나타날 수 있는 당펩티드의 펩티드 단편화 정도를 탄뎀 스펙트럼(ETD/EThcD)에서 확인 및 평가할 수 있다. 상기 P-스코어는 당화된 사이트 위치를 지정하는데 사용될 수 있고, 이는 하기 수학식 4에 의해 계산될 수 있다:
[수학식 4]
Figure 112017094101917-pat00005
(N: 확인할 수 있는 당펩티드에서 펩티드 단편화(c,z 이온) 수,
n: 확인 한 당펩티드의 펩티드 단편화 수
Imax는 스펙트럼에서 염기 피크의 강도, 및
Imi는 매치된 i번째 피크 강도).
상기 방법에서, 단계 8) 또는 11)의 정량분석은 MS의 스펙트라에서 S-스코어를 이용할 수 있고, 이는 MS의 스펙트라에서 선택된 당펩티드의 강도를 나타내는 동위원소 피크 중에 이론적으로 가장 강도가 강한 것부터 3개 피크의 강도를 합쳐서 나타낼 수 있다.
본 발명에 따른 분석 방법에서, 단계 9)의 탄뎀 스펙트럼을 이용하여 결정된 데이터베이스에 존재하는 O-연결형 당펩티드를 근거로(root/seed) O-패밀리 서치 방법을 이용하여 데이터베이스에 존재하지 않는 O-연결형 당펩티드를 선별할 수 있다(도 5a). 이때, 상기 선별은 하기 수학식 6에 의해 계산될 수 있고, 이때, 스펙트럼 유사도(spectral similarity, SS)는 유사한 스펙트럼을 찾기 위해 사용될 수 있고, 그 값은 0.9 이상일 수 있다(도 5b):
[수학식 6]
Figure 112017094101917-pat00006
(SS: 서로 다른 두 개의 탄뎀 질량분석 스펙트럼 피크와 질량의 유사도,
Si: (x,y) 매트릭스이며, x는 n번째의 상대적인 피크 강도, y는 n번째의 피크의 질량, 및
S'i: (x',y') 매트릭스이며, x'은 n번째의 상대적인 피크 강도, y'은 n번재의 피크의 질량)
본 발명자들은 표준 당단백질 시료(hemopexin)의 당펩티드를 고분해능 질량분석기인 Orbitrap으로 수득한 HCD, CID 및 EThcD(electron-transfer/higher-energy collision dissociation) 스펙트럼을 이용하여 본 발명의 방법에서 O-패밀리 서치 방법을 적용하기 전인 단계 8)까지 수행한 결과를 하기 표 1에 나타내었다(표 1).
Figure 112017094101917-pat00007
이때, 본 발명들은 표준 당단백질 시료(hemopexin)의 Y-스코어 분포도를 이용하여 정성분석된 데이터베이스에 존재하는 O-연결형 당펩티드의 정량분석을 수행하였고, 이때 정량분석은 각각의 당펩티드의 이온 크로마토그램(ion chromatograms)의 3 포인트 TIQ 값의 합으로 계산하였다. TIQ를 계산하기 위한 각 포인트(data point)는 가장 강도가 강한 피크를 기준으로 3개 동위원소의 피크 강도를 합한 값으로 나타내었다.
또한, 본 발명에 따른 방법에서 단계 9)의 O-패밀리 서치 방법을 이용하여 데이터베이스에 존재하지 않는 O-연결형 당펩티드를 선별하였다(도 5a 및 5b). 상기 선별된 데이터베이스에 존재하지 않는 O-연결형 당펩티드는 Y-스코어 분포를 이용하여 상기와 같이 동정 및 정량 분석을 수행하였고(도 6), 그 결과를 표 2에 나타내었다(표 2).
Figure 112017094101917-pat00008
상기 결과는 참조 문헌[Miloslav Sanda, et al ., Increased sialylation of site specific O-glycoforms of hemopexin in liver disease. Clin Proteom, 2016, 13:24]과 유사한 정성 및 정량 분포를 나타내었다. 표준 당단백질 시료(hemopexin)을 이용하여 분석한 결과, 분자량이 같은 O-연결형 당펩티드인 TPLPPTSAHGNVAEGETKPDPDVTER(2HexNAc-2Hex)(서열번호 1)가 서로 다른 O-당질화 사이트에 다른 형태로 당쇄가 결합된 A) T(HexNAc-Hex)PLPPT(HexNAc-Hex)SAHGNVAEGETKPDPDVTER 또는 B) T(2HexNAc-2Hex)PLPPTSAHGNVAEGETKPDPDVTER 형태임을 확인하였다(도 7).
결론적으로, 상기로부터 본 발명에 따른 방법은 표준 당단백질 시료에서 정확한 O-연결형 당펩티드를 동정하고, 이의 정량분석을 수행하는데 사용될 수 있음을 알 수 있다. 이와 같은 방법은 바이오시밀러를 포함하는 당단백질 분석과 관련된 다양한 연구에 응용 및 적용할 수 있다.
이하, 본 발명을 하기 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명이 이들에 의해 제한되는 것은 아니다.
실시예 1. 인간 혈청 시료의 제조
인간 혈청 시료는 시그마 알더리치로부터 구입하였다. 구입한 혈청 시료에 트립신을 첨가하여 37℃의 온도하에서 하룻밤 동안(overnight) 가수분해시켰다. 가수분해된 시료를 ZIC®-HILIC 컬럼을 사용하여 농축하여 준비하였다.
실시예 2. O-연결형 당펩티드의 정성 및 정량 분석
실시예 1에서 준비된 시료 내에 포함되는 폴리펩티드를 고분해능 질량분석기인 Orbitrap Fusion lumos(Orbitrap Fusion™)에 연결하여 LC/ESI-MS/MS 분석을 수행하였다. 상기 분석은 재현성 있는 결과를 검정하기 위해 3회 반복 수행하였다. 질량분석 결과 파일(RAW)을 프리웨어 프로그램인 RAWConverter v1.1(The Scripps Research Institute, 미국)을 이용하여 ms1(MS), ms2(MS/MS) 파일로 변환하였다. O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법을 이용하여 각 질량 분석 결과에서 O-연결형 당펩티드들의 동정 및 정량 분석을 수행하고, 그 결과를 도 8 내지 11에 나타내었다.
도 8에 나타낸 바와 같이, 본 발명에 따른 방법을 이용하여 인간 혈청 시료를 이용하여 3회 반복한 O-연결형 당펩티드의 정성 분석 결과를 확인하였다(도 8). 또한, 도 9에 나타난 바와 같이, 분석된 당단백질(도 9a) 또는 O-연결형 당펩티드(도 9b)에 대한 결과를 벤다이어그램으로 확인하였다, 또한, 도 10에 나타낸 바와 같이, 본 발명에 따른 방법을 이용하여 인간 혈청 시료를 이용하여 3회 반복한 O-연결형 당펩티드의 정량 분석 결과를 히트맵으로 확인하였다(도 10). 나아가, 도 11에 나타난 바와 같이, 본 발명에 따른 방법을 이용하여 분석된 인간 혈청 시료의 대표적인 O-연결형 당펩티드가 표준 단백질 시료의 대표적인 O-연결형 당펩티드인 T(HexNAc-Hex-Neu5Ac)PLPPTSAHGNVAEGETKPDPDVTER와 HCD, CID 및 ETD 스펙트럼이 유사함을 확인하였다(도 11a 및 11b).
<110> Korea Basic Science Institute <120> BIOINFORMATICS PLATFORM FOR HIGH-THROUGHPUT IDENTIFICATION AND QUANTIFICATION OF O-GLYCOPEPTIDE <130> 2017P-08-002 <160> 2 <170> KoPatentIn 3.0 <210> 1 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> O-linked glycopeptide <220> <221> MISC_FEATURE <222> (1) <223> glycosylated with 2HexNAc-2Hex at any amino acid <400> 1 Thr Pro Leu Pro Pro Thr Ser Ala His Gly Asn Val Ala Glu Gly Glu 1 5 10 15 Thr Lys Pro Asp Pro Asp Val Thr Glu Arg 20 25 <210> 2 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> O-linked glycopeptide <220> <221> MISC_FEATURE <222> (1) <223> glycosylated with HexNAc-Hex-Neu5Ac at any amino acid <400> 2 Thr Pro Leu Pro Pro Thr Ser Ala His Gly Asn Val Ala Glu Gly Glu 1 5 10 15 Thr Lys Pro Asp Pro Asp Val Thr Glu Arg 20 25

Claims (14)

1) 시료 내 당단백질을 가수분해하여 수득된 폴리펩티드를 고분해능 질량분석기로 분석하여 질량 스펙트럼을 얻는 단계;
2) 상기 단계 1)에서 얻은 질량 스펙트럼 결과를 MS 및 탄뎀 스펙트럼(MS/MS)으로 변환하는 단계;
3) 상기 단계 2)에서 변환된 HCD-MS/MS 개별 스펙트럼 피크의 질량 대 전하비(m/z)가 126.05, 129.06, 138.06, 144.06, 145.05, 147.07, 163.06, 168.07, 186.08, 204.08, 274.09, 292.10, 350.15, 366.14, 454.16, 528.19 및 657.24로 구성된 피크(Oxonium ion peaks)를 이용하여 각 탄뎀 스펙트럼에서 M-스코어를 계산하는 단계;
4) 상기 단계 3)에서 계산된 M-스코어 분포도에서 가우시안 피팅 방법을 사용하여 당펩티드와 펩티드를 분리하는 값을 결정하고 당펩티드 스펙트럼을 선택하는 단계;
5) 상기 단계 4)에서 선택된 당펩티드 스펙트럼에서 O-연결형 및 N-연결형 분류 요소(O/N sorting factor)를 이용하여 O-연결형 당펩티드 스펙트럼을 선택하는 단계;
6) 상기 단계 5)에서 선택된 O-연결형 당펩티드 스펙트럼의 MS에서 동위원소 분포를 얻고, 이를 데이터베이스와 비교하여 계산된 S-스코어를 이용하여 데이터베이스에 존재하는 O-연결형 당펩티드를 결정하는 단계;
7) 상기 단계 6)에서 결정된 데이터베이스에 존재하는 O-연결형 당펩티드로부터 탄뎀 스펙트럼에서의 Y-스코어를 이용하여 데이터베이스에 존재하는 O-연결형 당펩티드를 평가하는 단계;
8) 상기 단계 7)에서 평가된 데이터베이스에 존재하는 O-연결형 당펩티드에 대하여 P-스코어를 계산하여 O-연결형 당 사이트를 결정하고, 평가된 데이터베이스에 존재하는 O-연결형 당펩티드의 정량분석을 수행하는 단계;
9) 상기 단계 8)에서 정량 분석된 데이터베이스에 존재하는 O-연결형 당펩티드의 스펙트럼과 데이터베이스에 존재하지 않는 당펩티드의 스펙트럼으로부터 하기 수학식 6에 의해 유사도를 계산하여 데이터베이스에 존재하지 않는 O-연결형 당펩티드를 선별하는 단계;
[수학식 6]
Figure 112019037190802-pat00028

(SS: 서로 다른 두 개의 탄뎀 질량분석 스펙트럼 피크와 질량의 유사도,
Si: (x,y) 매트릭스이며, x는 n번째의 상대적인 피크 강도, y는 n번째의 피크의 질량, 및
S'i: (x',y') 매트릭스이며, x'은 n번째의 상대적인 피크 강도, y'은 n번재의 피크의 질량);
10) 상기 단계 9)에서 선별된 데이터베이스에 존재하지 않는 O-연결형 당펩티드로부터 탄뎀 스펙트럼의 Y-스코어를 이용하여 데이터베이스에 존재하지 않는 O-연결형 당펩티드를 평가하는 단계;
11) 상기 단계 10)에서 평가된 데이터베이스에 존재하지 않는 O-연결형 당펩티드에 대하여 P-스코어를 계산하여 O-연결형 당 사이트를 결정하고, 평가된 데이터베이스에 존재하지 않는 O-연결형 당펩티드에 대하여 정량분석을 수행하는 단계를 포함하는 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법.
제1항에 있어서, 상기 단계 3)의 탄뎀 스펙트럼이 CID 또는 HCD-MS/MS 스펙트럼이고, M-스코어가 하기 수학식 1에 의해 계산되는, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법:
[수학식 1]
Figure 112017094101917-pat00009

(N은 확인할 수 있는 당피크 수,
n은 확인한 당피크 수,
Imi는 매치된 i번째 피크 강도,
Imax는 스펙트럼에서 염기 피크의 강도, 및
C는 상수 값).
제1항에 있어서, S-스코어가 하기 수학식 2에 의해 계산되는, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법:
[수학식 2]
Figure 112017094101917-pat00010

(X1은 이론적인 동위원소 피크들 중 n번째 피크의 질량,
Y1은 실험적인 동위원소 피크들 중 n번째 피크의 질량,
X2는 이론적인 동위원소 피크들 중 n번째 피크의 상대적인 강도,
Y2는 실험적인 동위원소 피크들 중 n번째 피크의 상대적인 강도,
C1 및 C2는 상수값).
제3항에 있어서, S-스코어를 계산할 때 동위원소의 질량 분포가 유클리드 거리 및 강도 분포를 피어슨 상관 분석을 이용하여 유사도를 측정하는, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법.
제1항에 있어서, 상기 단계 6)에서 당단백질로부터 당펩티드의 이론적인 동위원소 분포를 이용하여 데이터베이스를 구축한 다음, O-연결형 당펩티드의 동정 및 정량 분석에 이용하는, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법.
제1항에 있어서, 상기 단계 7) 또는 10)의 탄뎀 스펙트럼이 CID 또는 HCD-MS/MS 스펙트럼이고, Y-스코어가 하기 수학식 3에 의해 계산되는, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법:
[수학식 3]
Figure 112017094101917-pat00011

(Imax는 스펙트럼에서 염기 피크의 강도,
Imi는 매치된 i번째 피크 강도,
Isi는 스펙트럼에서 i번째 피크 강도, 및
C1 및 C2는 상수값).
제1항에 있어서, 상기 단계 8) 또는 11)의 탄뎀 스펙트럼이 CID 또는 HCD-MS/MS 스펙트럼이고, P-스코어가 하기 수학식 4에 의해 계산되는, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법:
[수학식 4]
Figure 112017094101917-pat00012

(N: 확인할 수 있는 당펩티드에서 펩티드 단편화(c,z 이온) 수,
n: 확인 한 당펩티드의 펩티드 단편화 수
Imax는 스펙트럼에서 염기 피크의 강도, 및
Imi는 매치된 i번째 피크 강도).
삭제
삭제
제1항에 있어서, 상기 가수분해가 트립신(trypsin), 아르기닌 C(Arg-C), 아스파르트산 N(Asp-N), 글루탐산 C(Glu-C), 라이신 C(Lys-C), 키모트립신(chymotrypsin) 및 프로테나아제 K(proteinase K)로 구성된 군으로부터 선택된 효소로 수행되는, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법.
제1항에 있어서, 상기 질량분석기가 10,000 이상의 질량 분해능을 갖고, 50 ppm 이하의 질량 정확도를 갖는, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법.
제1항에 있어서, 상기 질량분석기가 Orbitrap Fusion Lumos, Orbitrap Elite 또는 Q Exactive인, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법.
제1항에 있어서, 상기 단계 8) 또는 11)에서 정량 분석이 MS의 스펙트라에서 S-스코어를 이용하는, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법.
제1항에 있어서, 상기 단계 8) 또는 11)에서 정량 분석이 MS의 스펙트라에서 선택된 당펩티드의 강도를 나타내는 동위원소 피크 중에 이론적으로 가장 강도가 강한 것부터 3개 피크의 강도를 합쳐서 나타내는, O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법.
KR1020170124401A 2017-09-26 2017-09-26 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법 KR102013913B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020170124401A KR102013913B1 (ko) 2017-09-26 2017-09-26 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법
PCT/KR2017/014856 WO2019066147A1 (ko) 2017-09-26 2017-12-15 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법
US16/078,333 US11181531B2 (en) 2017-09-26 2017-12-15 Bioinformatics platform for high-throughput identification and quantification of O-glycopeptide

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170124401A KR102013913B1 (ko) 2017-09-26 2017-09-26 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법

Publications (2)

Publication Number Publication Date
KR20190035325A KR20190035325A (ko) 2019-04-03
KR102013913B1 true KR102013913B1 (ko) 2019-10-21

Family

ID=65902795

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170124401A KR102013913B1 (ko) 2017-09-26 2017-09-26 O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법

Country Status (3)

Country Link
US (1) US11181531B2 (ko)
KR (1) KR102013913B1 (ko)
WO (1) WO2019066147A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110456348B (zh) * 2019-08-19 2020-08-25 中国石油大学(华东) 多视向sar海浪谱数据融合的海浪截断波长补偿方法
WO2023277230A1 (ko) * 2021-06-28 2023-01-05 주식회사 셀키 당펩티드를 동정하기 위하여 인공지능 기반의 워크플로우를 추천하는 전자 장치 및 그 동작 방법
KR102447238B1 (ko) * 2022-03-15 2022-09-27 주식회사 셀키 N-연결형 및 o-연결형 당펩티드 통합 분석 방법 및 분석장치
CN115166123A (zh) * 2022-07-13 2022-10-11 汉诺生物科技(苏州)有限公司 一种异常n-羟乙酰神经氨酸的位点特异性分析方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101341591B1 (ko) 2012-09-27 2013-12-16 한국기초과학지원연구원 N―연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007109292A2 (en) 2006-03-21 2007-09-27 Wisconsin Alumni Research Foundation Ionizable isotopic labeling reagents for relative quantification by mass spectrometry
WO2010120946A1 (en) 2009-04-14 2010-10-21 Institute For Systems Biology Improvements in mass spectrum-based identification and quantitation of proteins and peptides
KR101311412B1 (ko) * 2011-05-04 2013-09-25 한국기초과학지원연구원 당 동정을 위한 새로운 생물정보처리 분석 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101341591B1 (ko) 2012-09-27 2013-12-16 한국기초과학지원연구원 N―연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Mass Spectrometry, (2017.02.24), Vol. 6, pp 1-5.
Scientific Reports, 2016, Vol. 6, pp 1-8.

Also Published As

Publication number Publication date
US11181531B2 (en) 2021-11-23
WO2019066147A1 (ko) 2019-04-04
US20200408774A1 (en) 2020-12-31
KR20190035325A (ko) 2019-04-03

Similar Documents

Publication Publication Date Title
Rozanova et al. Quantitative mass spectrometry-based proteomics: an overview
KR102013913B1 (ko) O-연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법
Angel et al. Mass spectrometry-based proteomics: existing capabilities and future directions
CN107077592B (zh) 高分辨率气相色谱-质谱数据与单位分辨率参考数据库的改进谱图匹配的高质量精确度滤波
Brönstrup Absolute quantification strategies in proteomics based on mass spectrometry
KR101341591B1 (ko) N―연결형 당펩티드의 동정 및 정량을 위한 생물정보처리 분석 방법
Vlahou et al. Proteomic approaches in the search for disease biomarkers
EP1941280A2 (en) Methods for the development of a biomolecule assay
JP2009540319A (ja) 質量分析バイオマーカーアッセイ
Ozohanics et al. GlycoMiner: a new software tool to elucidate glycopeptide composition
JP5468073B2 (ja) タンパク質の定量方法
Stevenson et al. Evolution of seed allergen quantification–from antibodies to mass spectrometry
KR101070247B1 (ko) 프로테오믹스기법을 이용한 임신중독 특이 표지 단백질 및 진단방법
IL270972B2 (en) Methods for the absolute quantification of polypeptides that are in small quantities with the help of spectrometry
EP1887351A1 (en) Screening method for specific protein in proteome comprehensive analysis
KR20220012383A (ko) 펩타이드 특성 학습 기반 액체 크로마토그래프 질량 분석에서 펩타이드 생성이온의 스펙트럼 양상을 예측하는 시스템
KR101992395B1 (ko) 질량분석을 이용한 당화 단백질 및 최종당화산물의 동정을 위한 새로운 생물정보처리 분석 방법
Hall et al. Isotope-differentiated binding energy shift tags (IDBEST™) for improved targeted biomarker discovery and validation
Palmblad et al. A novel mass spectrometry cluster for high-throughput quantitative proteomics
CN107576733A (zh) 一种基于糖蛋白非糖肽的质谱多反应监测定量糖蛋白方法
Mena et al. Next generation instruments and methods for proteomics
JP7156207B2 (ja) 糖ペプチド解析装置
Lippold et al. GLYCOPROTEOMICS DATA ANALYSIS WORKFLOW FOR MAXIMIZED GLYCOPEPTIDE IDENTIFICATION AND RELIABLE QUANTIFICATION
Wu et al. A computational approach for the identification of site-specific protein glycosylations through ion-trap mass spectrometry
Wu et al. Mass spectrometry for biomarker development

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant