KR100984253B1 - 아미노산 서열 변화 예측방법 및 시스템 - Google Patents

아미노산 서열 변화 예측방법 및 시스템 Download PDF

Info

Publication number
KR100984253B1
KR100984253B1 KR1020080014176A KR20080014176A KR100984253B1 KR 100984253 B1 KR100984253 B1 KR 100984253B1 KR 1020080014176 A KR1020080014176 A KR 1020080014176A KR 20080014176 A KR20080014176 A KR 20080014176A KR 100984253 B1 KR100984253 B1 KR 100984253B1
Authority
KR
South Korea
Prior art keywords
peptide
information
amino acid
acid sequence
mass
Prior art date
Application number
KR1020080014176A
Other languages
English (en)
Other versions
KR20080076852A (ko
Inventor
박진영
홍석주
김종민
유윤석
Original Assignee
씨비에스바이오사이언스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 씨비에스바이오사이언스 주식회사 filed Critical 씨비에스바이오사이언스 주식회사
Publication of KR20080076852A publication Critical patent/KR20080076852A/ko
Application granted granted Critical
Publication of KR100984253B1 publication Critical patent/KR100984253B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Food Science & Technology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

본 발명은 단백질의 아미노산 서열 변화 예측방법 및 시스템에 관한 것으로, 더욱 상세하게는 단백질 조각의 질량정보 및 단백질 서열 정보를 이용하여 상기 단백질 내에 아미노산 서열 변화 가능성이 있는 위치를 예측함으로써 사용자가 신속하고 합리적인 결정을 할 수 있도록 도와주는 방법 및 시스템에 관한 것이다. 이를 위해, 본 발명은 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보를 획득하는 단계; 상기 획득된 정보들을 이용하여 상기 펩타이드 내에서 아미노산 서열변화 가능성이 있는 영역을 표시하는 단계; 상기 영역 내에서 적어도 하나의 아미노산 서열을 변경하여 얻어진 수정된 펩타이드 서열 정보와 이미 알려진 펩타이드 단편들의 질량 정보를 저장하고 있는 데이터베이스와의 비교하여 매칭되는 수정된 펩타이드 서열 정보를 획득하는 단계; 및 상기 수정된 펩타이드 서열 정보를 이용하여, 상기 펩타이드 서열 내에서 아미노산 서열변화 가능성이 가장 높은 위치를 표시하는 단계;를 포함하는 것을 특징으로 하는 아미노산 서열변화 예측 방법을 제공한다.
알고리즘, 단백질, 펩타이드, 이온화, 단편화, 아미노산 서열 예측

Description

아미노산 서열 변화 예측방법 및 시스템{Method and system for guessing variations in amino acid sequences}
본 발명은 단백질의 아미노산 서열 변화 예측방법 및 시스템에 관한 것으로, 더욱 상세하게는 단백질 조각의 질량정보 및 단백질 서열 정보를 이용하여 상기 단백질 내에 아미노산 서열 변화 가능성이 있는 위치를 예측함으로써 사용자가 신속하고 합리적인 결정을 할 수 있도록 도와주는 방법 및 시스템에 관한 것이다.
단백질을 동정하는 방법들로는 단백질분해효소들로 가수분해한 후 얻어진 펩타이드 단편들을 분석하여 동정하는 '상향식' 단백질분석법(Bottom up Proteomics)과 한 단백질로부터 가수분해단계 없이 직접 질량분석하여 동정하는 '하향식' 단백질분석법(Top down Proteomics)이 사용되고 있다. 기존에는 질량분석기(mass spectrometer)의 성능의 한계로 상향식 단백질분석법이 주로 사용되어 왔으나, 최근에는 고 분해능 질량분석기 등의 개발로 하향식 단백질분석법이 일부 사용되고 있다.
한편, 단백질은 생성된 후 그 서열이 변화(PTM; post-translational modification)할 수 있는 가능성을 항상 가지고 있다. 질량분석기에 의해 아미노 산 서열을 밝혀내었을 경우, 원본 단백질의 질량과 측정된 실제 질량이 차이가 난다면, 아미노산 서열의 변화를 예상할 수 있다. 이러한 경우에는, 아미노산 서열의 변화 위치와 변화된 아미노산의 개수가 문제가 된다. 어떤 위치의 아미노산 서열이 변화되었으며, 몇 군데에서 몇 개나 변화되었는지를 추측하는 것은 경우의 수가 너무나도 많고 사람이 이를 계산하기는 무척 어렵다. 예를 들어, 13개의 아미노산 서열 중 질량 차이에 의한 아미노산 변화가 4개가 일어났다고 가정하면, 경우의 수는 조건에 따라 수십만 가지 이상 될 수 있기 때문에 사람의 힘으로 이를 계산하는 것은 거의 불가능이라 할 수 있다.
이에, 최근 개발된 프로사이트PTM(ProSightPTM) () 은 완전한(즉, 가수분해되지 않은) 단백질 이온들의 하향식 단편화로부터의 질량분석 데이터를 이용하여 단백질을 동정 및 특성분석하기 위한 웹 애플리케이션(web application)으로서, 리트리버(Retriever)가 싱글 프로테인 모드(Single Protein Mode)와 상호작용하여 질량 불일치(mass discrepancies)를 설명하여 동정된 단백질의 특성을 분석할 수 있도록 하는 것이다(문헌 [Richard D. LeDuc et al., Prosight PTM: an integrated environment for protein identification and characterization by top-down mass spectrometry, Nucleic Acids Research, 2004, Vol. 32, Web Server Issue DOI: 10.1093/nar/gkh447] 참조). 그러나 프로사이트 PTM의 싱글 프로테인 모드는 돌연변이가 일어난 아미노산의 위치와 종류를 자동으로 예측하여 주는 기능은 없으며, 단지 펩타이드의 질량값 PKL(Peak List) 파일을 이용한 단편들의 단편화 정도만 제공하는 문제점이 있다.
지금까지 질량과 관련하여 데이터베이스(database)를 이용한 아미노산 서열 변화 예측 방법이나 시스템은 개발된 예를 찾을 수 없으며, 상기 예측 방법 및 시스템의 필요성이 제기되어 왔다.
상기 문제점을 해결하기 위해, 본 발명은 모든 경우의 수를 미리 예측하여둔 펩타이트 단편 계산 데이터베이스와 연동하여 단백질과 질량의 관계를 적절히 예측하여 아미노산 서열 변화 가능성이 있는 위치를 제공하는 아미노산 서열 변화 예측방법 및 시스템을 제공하는데 그 목적이 있다.
또한, 상기 문제점을 해결하기 위해, 본 발명은 아미노산 서열 변화 가능성 정도에 따라 차등 점수를 부여하여 나열해줌으로써, 사용자가 가장 합리적인 방향으로 판단할 수 있도록 도와주는 아미노산 서열 변화 예측방법 및 시스템을 제공하는데 그 목적이 있다.
상기 목적을 달성하기 위해, 본 발명은 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보를 획득하는 단계; 상기 획득된 정보들을 이용하여 상기 펩타이드 내에서 아미노산 서열변화 가능성이 있는 영역을 표시하는 단계; 상기 영역 내에서 적어도 하나의 아미노산 서열을 변경하여 얻어진 수정된 펩타이드 서열 정보와 이미 알려진 펩타이드 단편들의 질량 정보를 저장하고 있는 데이터베이스와의 비교하여 매칭되는 수정된 펩타이드 서열 정보를 획득하는 단계; 및 상기 수정된 펩타이드 서열 정보를 이용하여, 상기 펩타이드 서열 내에서 아미노산 서열변화 가능성이 가장 높은 위치를 표시하는 단계;를 포함하는 것을 특징으로 하는 아미노산 서열변화 예측 방법을 제공한다.
상기 아미노산 서열변화 예측 방법은 상기 펩타이드 서열 정보 및 상기 펩타이드 분자량 정보를 이용하여 계산된 이론적으로 가능한 모든 펩타이드 단편들에 대한 질량 정보와 상기 획득된 펩타이드 단편 질량 정보를 비교하여 매칭을 허용할 수 있는 범위를 의미하는 단편화 오차 범위를 획득하는 단계를 더 포함하는 것을 특징으로 한다.
상기 획득된 펩타이드 단편 질량 정보와 상기 계산된 질량 정보의 차이가 상기 단편화 오차 범위 이내인 경우 매칭으로 판단하며, 상기 아미노산 서열변화 가능성이 있는 영역은 매칭되지 않는 영역을 의미하는 것을 특징으로 한다.
상기 아미노산 서열변화 예측 방법은 아미노산 서열변화 예상 개수 정보를 입력받는 단계를 더 포함하는 것을 특징으로 한다.
상기 수정된 펩타이드 서열 정보는 상기 아미노산 서열변화 가능성이 있는 영역 내에서 상기 아미노산 서열변화 예상 개수의 아미노산 서열을 변경하여 획득되는 것을 특징으로 한다.
상기 아미노산 서열변화 가능성이 가장 높은 위치를 표시하는 단계는 상기 수정된 펩타이드 서열의 단편화된 질량 정보와 상기 펩타이드 서열 정보 및 상기 펩타이드 분자량 정보를 이용하여 계산된 이론적으로 가능한 모든 펩타이드 단편들에 대한 질량 정보를 비교하여 매칭된 펩타이드 단편 개수 정보를 획득하는 단계; 및 상기 매칭된 펩타이드 단편 개수 정보를 이용하는 특정한 함수를 통해 얻어진 스코어에 따라 상기 펩타이드 서열 내에서 아미노산 서열변화 가능성이 가장 높은 위치를 표시하는 단계;를 포함하는 것을 특징으로 한다.
상기 데이터베이스는 유전자의 돌연변이에 의한 아미노산의 서열변화에 의한 단편조각들의 조합과 이들의 질량 값을 저장하거나 또는 PTM(post-translational modification) 규칙에 의한 펩타이드 단편들의 조합과 PTM 규칙에 의하지 않은 아미노산 서열의 모든 조합과 각 조합의 질량 값을 저장하는 것을 특징으로 한다.
상기 아미노산 서열변화 예측 방법은 상기 아미노산 서열변화 가능성이 가장 높은 위치와 함께 상기 펩타이드 단편들의 단편화된 위치를 나타내는 펩타이드 단편화 맵을 표시하는 것을 특징으로 한다.
또한, 상기 목적을 달성하기 위해, 본 발명은 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보를 이용하여 상기 펩타이드 내에서 아미노산 서열변화 가능성이 있는 영역을 표시하는 단편화 예측 모듈; 이미 알려진 펩타이드 단편들의 질량 정보를 저장하고 있는 펩타이드 단편 계산 데이터베이스; 및 상기 펩타이드 내에서 아미노산 서열변화 가능성이 가장 높은 위치를 표시하기 위해, 상기 영역 내에서 적어도 하나의 아미노산 서열을 변경하여 얻어진 수정된 펩타이드 서열 정보와 상기 펩타이드 단편 계산 데이터베이스를 비교하여 매칭되는 수정된 펩타이드 서열 정보를 획득하는 데이터베이스 매칭 모듈;을 포함하는 것을 특징으로 하는 아미노산 서열변화 예측 시스템 장치를 제공한다.
상기 단편화 예측 모듈은 상기 매칭되는 수정된 펩타이드 서열의 펩타이드 단편 질량 정보와 상기 펩타이드 서열 정보 및 상기 펩타이드 분자량 정보를 이용하여 계산된 이론적으로 가능한 모든 펩타이드 단편들에 대한 질량 정보를 비교하여 매칭되는 펩타이드 단편 개수 정보를 획득하고, 상기 매칭되는 펩타이드 단편 개수 정보를 이용하는 특정한 함수를 통해 스코어를 계산하는 것을 특징으로 한다.
또한, 상기 목적을 달성하기 위해, 본 발명은 상술한 아미노산 서열변화 예측방법들 중 적어도 어느 하나의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록매체를 제공한다.
본 발명에 따른 아미노산 서열 변화 예측방법 및 시스템은 질량분석기와 연동하여 PTM이 일어난 아미노산 서열을 시스템 성능에 따라 수초에서 1분 이내의 매우 빠른 시간 내에 높은 신뢰도로 예측함으로써, 아미노산 서열을 예측하는데 있어서 많은 시간과 노력을 절감할 수 있는 효과가 있다.
본 발명에서 사용되는 용어는 가능한 한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우는 해당되는 발명의 상세한 설명 부분에서 그 의미를 기재하였으므로 단순한 용어의 명칭이 아닌 용어가 가지는 의미로 본 발명을 파악하여야 한다.
이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 설명하지만, 본 발명이 상기 실시 예들에 의해 제한되거나 한정되는 것은 아니며, 다양하게 변형되거나 본 발명의 기술적 사상을 포함하는 실시는 모두 본 발명의 범주에 포함된다고 해야 할 것이다.
도 1은 본 발명의 일실시예에 따른 아미노산 서열변화 예측 시스템에 관한 블록도이다. 도 1을 참조하면, 아미노산 서열변화 예측 시스템(100)은 단편화 예측 모듈(110) 및/또는 데이터베이스 매칭모듈(120), 입력부(130), 표시부(140)를 포함한다. 또한, 상기 아미노산 서열변화 예측 시스템(100)은 적어도 하나의 펩타이드 단편 계산 데이터베이스(200)를 포함한다.
상기 단편화 예측 모듈(110)은 질량분석기에서 얻어진 단백질 조각의 질량값을 읽어들여 펩타이드를 단편화하고, 특정한 함수를 이용하여 아미노산 서열 변화 가능성 정도에 대한 스코어(score)를 계산하여 높은 순서대로 나열해주는 모듈이다.
상기 데이터베이스 매칭 모듈(120)은 단편화 예측 모듈(110)과 연동하여 기지(旣知)의 펩타이드 서열로부터 새롭게 유추될 수 있는 아미노산의 종류와 위치(서열)을 판단하는 모듈이다.
상기 데이터베이스 매칭 모듈(120)은 단편화 예측 모듈(110)과 연동하여 기지(旣知)의 펩타이드 서열과 BLASTP(basic local alignment search tool for protein) 결과 가장 유사한 형태의 단백질 결과를 참조하여 판단하는 단계를 추가로 포함하는것이 더욱 바람직하다.
상기 펩타이드 단편 계산 데이터베이스(200)는 유전자 돌연변이에 의한 펩타이드 단편들의 조합과 질량값이 계산되어 저장되어 있는 데이터베이스이다.
본 발명에 따른 아미노산 서열변화 예측 시스템(100)은 단편화 예측 모듈(110) 및/또는 데이터베이스 매칭모듈(120)과 적어도 하나의 펩타이드 단편 계산 데이터베이스(200)를 이용하여 아미노산 서열 변화 가능성이 있는 위치를 표시부(140)에 표시하고, 변화 가능성이 있는 아미노산 서열들 중 가장 가능성이 높은 아미노산 서열을 출력한다.
물론, 이를 위해 표시부(140)는 OLED 패널, LCD 패널 등으로 구성되며, 이 표시부(140)에 디스플레이된 화면예를 보여주는 도면이 도 3내지 도 6에 도시된다. 본 발명의 일실시예에서는 표시부(140)가 아미노산 서열변화 예측 시스템(100) 내에 구성되는 것으로 설명하였으나, 이에 한정되는 것은 아니며, 가령 별도의 모니터를 이용하는 것도 가능함을 당업자라면 이해할 것이다.
입력부(130)는 키보드, 마우스 등이 될 수 있다. 따라서, 사용자는 이 입력부(130)를 이용하여 도 3에 도시된 바와 같이, 펩타이드 서열, 펩타이드 MW, PKL 리스트의 폴더를 선택하거나, 허용 범위, 단편화 허용범위 등의 임의 숫자 또는 문자를 입력할 수 있다. 도 3은 본 발명의 일실시예에 따른 아미노산 서열변화 예측하기 위해, 펩타이드 서열, 펩타이드 MW, PKL 리스트를 입력하는 화면예를 도시하는 도면이며, 이에 대하여는 후술하기로 한다.
이하에서 본 발명에 따른 아미노산 서열변화 예측방법을 구체적으로 기술한다.
도 2는 본 발명의 일실시예에 따른 아미노산 서열변화 예측방법의 흐름도이다. 도 2를 참조하면, 본 발명에 따른 아미노산 서열변화 예측방법에서, 먼저 펩타이드 또는 단백질(이하 '펩타이드'라 한다) 서열 정보, 질량분석기(300)에서 얻어진 펩타이드 단편 질량 정보를 입력한다(S210). 본 발명은 또한 상기 펩타이드 서열 정보 및 펩타이드 단편 질량정보와 함께 펩타이드 분자량(MW, molecular weight) 정보를 함께 입력하는 것을 포함한다.
상기 펩타이드 서열 정보 및 펩타이드 단편 질량정보는 파일 형태(PKL 파일, SQ 파일)로 입력될 수 있다. 실험 방법에 따라 단편화된 위치가 다를 수 있으며, 단편화된 위치에 따라 c-이온/z-이온 PKL 파일, b-이온/y-이온 PKL 파일로 구별하여 입력될 수 있다. 상기 펩타이드 서열 정보를 입력하면, 상기 펩타이드 서열의 이론적인 단백질 질량 값, 서열 길이 등이 자동으로 계산될 수 있다.
그 다음에 단편화 오차 범위를 입력한다(S220). 단편화 오차 범위란 질량분석기(300)에서 얻어진 펩타이드 단편 질량과 펩타이드 서열 정보 및/또는 펩타이드 분자량 정보를 이용하여 이론적으로 가능한 모든 단편들에 대한 질량 정보를 비교할 때, 허용될 수 있는 오차 범위를 의미한다. 즉, 질량분석기(300)에서 얻어진 펩타이드 단편 질량과 이론적으로 가능한 모든 단편들에 대한 질량 값의 차이가 상기 단편화 오차 범위 이내라면, 질량분석기(300)에서 얻어진 펩타이드 단편과 펩타이드 단편 계산 데이터베이스(200)에 저장되어 있는 기지의 펩타이드 단편이 서로 매 칭되는 것으로 판단한다. 상기 단편화 오차범위(fragment tolerance)는 디폴트(default)값으로 25 ppm, 통상적으로는 50 ppm 등의 수치를 임의로 입력할 수 있다.
그 다음에, 상기와 같이 단편화 오차 범위를 입력하고 단편화 예측 모듈(110)을 실행하면, 단편화 예측 모듈(110)은 펩타이드 단편화 맵(fragment map) 및 아미노산 서열변화 가능성이 있는 영역을 표시한다. 상기 펩타이드 단편화 맵은 도표 형태로 나타낼 수 있다. 구체적으로 단편화 예측 모듈(110)은 입력된 펩타이드 서열에서 생성될 수 있는 모든 펩타이드 단편에 대한 이론적인 질량을 계산하고, 상기 이론적인 질량과 실험을 통해 얻어진 펩타이드 단편의 질량을 비교하여 매칭되는 부분을 도표 형태로 나타낸다.
펩타이드를 자르면 N-말단 단편(c-이온 또는 b-이온)과 C-말단 단편(z-이온 또는 y-이온)으로 나뉘는데, 단편화 예측 모듈(110)을 이용하여 상기 펩타이드 단편들의 질량을 비교한 결과, 펩타이드 서열 중의 일부가 해석되지 않는 영역이 발생하는데, 이 영역이 아미노산 서열변화 가능성이 있는 영역이다. 예를 들면, c-이온/z-이온으로 나뉘는 경우, 아미노산 서열변화 가능성이 있는 영역은 c-이온 단편을 표시한 영역과 z-이온 단편을 표시한 영역이 서로 겹쳐지지 않는 영역을 의미한다.
본 발명은 또한 이론적인 펩타이드 단편 질량과 질량분석기를 통해 얻은 펩타이드 단편 질량 사이의 비교 데이터를 생성하고, 이를 표시하는 것을 포함한다.
만일 아미노산 서열변화 가능성이 없는 경우(S240), 상기 그 결과를 출력하 고(S270), 만일 아미노산 서열변화 가능성이 있는 경우(S240), 가장 가능성이 높은 아미노산 서열변화의 위치 및 종류를 예측하기 위해, 아미노산 서열 변화 예상 개수 및 오차 범위를 입력한다(S250).
그 다음에, 특정한 함수를 이용한 스코어 계산을 통해, 아미노산 서열 변화 가능성이 가장 높은 아미노산 서열을 출력한다(S260). 이때, 데이터베이스 매칭 모듈(120)은 아미노산 서열변화 가능성이 있는 영역에서 아미노산 서열 변화 예상 개수에 해당되는 만큼의 아미노산을 변화시켜 얻어진 수정된 펩타이드 서열과 펩타이드 단편 계산 데이터베이스(200)에 저장된 기지의 펩타이드 서열의 이론적인 질량값과 실험값의 매칭을 통해 질량 값의 차이를 계산하여 우선 순위를 결정한다.
단편화 예측 모듈은(110)은 매칭이 이루어지는 수정된 펩타이드 서열에 대한 펩타이드 단편 질량과 펩타이드 서열 정보 및/또는 펩타이드 분자량 정보를 이용하여 얻어질 수 있는 이론적으로 가능한 모든 단편들에 대한 질량을 비교하여 매칭되는 펩타이드 단편 개수들을 획득하고, 상기 매칭되는 펩타이드 단편 개수를 이용하는 특정한 함수를 통한 스코어를 계산하여, 가장 가능성이 높은 아미노산 서열을 출력한다. 구체적으로 상기 단편화 예측 모듈(110)은 스코어 계산을 통해 아미노산 서열변화 가능성이 가장 높은 서열 및/또는 위치를 표시한다. 이때, 치환된 서열로 계산하여 매칭된 이온(예를 들면, c-이온, z-이온 등)의 수 등을 표시할 수 있다.
이때, 아미노산 서열변화 가능성이 가장 높은 서열 및/또는 위치는 아래의 수학식1 또는 수학식2로 표현되는 함수에 의해 계산되는 스코어를 참조하여 나열해주는 것이 바람직하다, 상기 수학식들은 예시적인 것이며, 본 발명은 상기 수학식 들에 한정되지 않고, 아미노산 서열변화 가능성이 가장 높은 서열 및/또는 위치를 알려줄 수 있는 다른 수학식들(함수들)을 이용하는 것을 포함한다. 상기 스코어는 실험을 통해 얻어진 펩타이드 단편 질량과 이론적인 질량을 비교하여 매칭되는 펩타이드 단편 개수(예를 들면, c-이온 개수, z-이온 개수, c-z이온 개수 등)를 이용하여 계산된다.
스코어 = {1 / (아미노산 서열 길이 - 이중으로 단편화된 개수) x 0.4} x {총 단편화 개수 / (아미노산 서열 길이 - 1) x 0.2} x {(1 / 단편화 오차범위) x 0.99} x (작은 단편화 개수 / 큰 단편화 개수) x {(1 / 이론적 질량값과 실험적 질량값 차이의 절대값) x 0.97} x 104
여기서, 두 단편화 개수의 곱은 0이 아니고, 이론적 질량 값과 실험적 질량 값 차이는 0이 아니다.
Figure 112008011635996-pat00001
여기서, x = mean = 1/111.1 x 2 x Ma x 2 이고, f는 입력 단편화 이온들의 개수이며, n은 매칭되는 단편화 이온들의 개수이고, Ma는 질량 정확도(Mass Accuracy) 즉, 실험에 의한 오차 허용범위를 나타낸다.
본 발명에 있어서, PTM 규칙은 인산화(phosphorylation), 아세틸화(acetylation), 메틸화(methylation), 피루보일기로의 전환(conversion to pyruvoyl group), 하이퓨신(hypusine), 포밀화(formylation), 디프타미드(diphthamide), 지질(미리스테이트(myristate), 팔미테이트(palmitate), 파네실(farnesyl), 제라닐-제라닐(geranyl-geranyl), GPI-앵커(GPI-anchor)), 셀레노시스테인(selenocysteine), 최초 메티오닌 절단(initial methionine cleavage) 및 신호 펩타이드(signal peptides)를 포함한다. 본 발명의 펩타이드 단편 계산 데이터베이스에서, PTM 규칙은 유니모드(UNIMOD)(http://www.unimod.org)의 데이터에 기초한 것이다. 또한, 본 발명의 펩타이드 단편 계산 데이터베이스(200)에는 아미노산의 임의의 조합에 따른 질량값들이 저장되어 있다.
도 3은 본 발명의 일실시예에 따른 아미노산 서열변화 예측하기 위해, 펩타이드 서열, 펩타이든 MW, PKL 리스트를 입력하는 방법을 나타내는 도면이다. 도 3을 참조하면, 먼저 92개의 아미노산으로 이루어지는 펩타이드 서열(301)과, 펩타이드 MW(307) 및 질량분석기에서 얻어진 펩타이드 단편 질량값(PKL 리스트)(302)을 입력한다. 이때, 상기 펩타이드 서열의 이론적인 단백질 질량 값(304), 서열 길이(303), 이론값과 실험값의 질량 차이(307) 등이 자동으로 계산될 수 있다. 그리고 단편화 오차 범위(305)를 입력하고, 단편화 예측 모듈(110)을 실행하면 펩타이드 단편화 맵 및 아미노산 서열변화 가능성이 있는 영역이 표시된다.
도 4는 본 발명의 일실시예에 따른 단편화 예측모듈에 의해 표시된 펩타이드 단편화 맵 및 아미노산 서열변화 가능성이 있는 영역을 도시한다. 펩타이드 단편화 맵은 도표 형태로 표현될 수 있는데, 도 4에서는 펩타이드 서열 및 꺽쇄(401, 402, 403, 404)로 표현된다. 위쪽 꺽쇄(도 4에서 "┓"로 표시됨)(401, 402)는 N-말단 조각이 매칭되는 위치를 나타내고, 아래쪽 꺽쇄(도 4에서 "┗"로 표시됨)(403, 404)는 C-말단 조각이 매칭되는 위치를 나타낸다. 양쪽 꺽쇄(도 6에서 도면부호 605로 표시됨)는 N-말단 조각 및 C-말단 조각 모두 매칭되는 위치를 나타낸다.
즉, 도면부호 401은 MHHHH 펩타이드 단편이 매칭되는 것을 나타내고, 도면부호 402는 MHHHHHHQI 펩타이드 단편이 매칭되는 것을 나타내며, 도면부호 403은 SHPQF 펩타이드 단편이 매칭되는 것을 나타내고, 도면부호 404는 RGGSAWSHPQF 펩타이드 단편이 매칭되는 것을 나타낸다.
한 종류의 단백질을 임의로 단편화 시켰으므로, 이론적으로는 N-말단 조각과 C-말단조각이 모두 매칭되는 위치들만 나타나는 것이 원칙이나, 돌연변이 등의 원인에 의해 아미노산 서열에 변화가 발생하는 경우 도 4와 같이 N-말단 조각들과 C-말단 조각들이 모두 매칭되는 위치들이 나타나지 않으며, N-말단 조각들과 C-말단 조각들이 커버하지 못하는 영역(405)이 발생한다. 이 영역이 아미노산 서열 변화 가능성이 있는 영역(405)이다. 도 4에서는 복수의 삼각형으로 상기 영역(405)을 표현한다.
또한 이론적인 펩타이드 단편 질량과 질량분석기를 통해 얻은 펩타이드 단편 질량 사이의 비교 데이터(406)가 생성될 수 있다. 그 다음에 데이터베이스 매칭 모듈(120)을 통해 아미노산 서열 변화 가능성이 가장 높은 서열을 출력한다.
도 5는 본 발명의 일실시예에 따른 아미노산 서열 변화 가능성이 가장 높은 서열을 출력하기 위해, 아미노산 변화 예상 개수를 입력하는 과정을 도시한다. 도 5를 참조하면, 사용자는 아미노산 서열변화 가능성이 있는 영역에 대한 정보를 이용하여 임으로 아미노산 변화 예상 개수(501)를 입력한다. 이때, 사용자는 단편화 오차 범위(502)를 입력할 수 있다. 데이터베이스 매칭 모듈(120)은 상기 입력 값을 이용하여 아미노산 서열 변화 가능성이 가장 높은 서열을 출력한다.
도 6은 본 발명의 일실시예에 따른 아미노산 서열 변화 가능성이 가장 높은 서열을 도시한다. 도 6을 참조하면, 데이터베이스 매칭 모듈(120)은 아미노산 서열변화 가능성이 있는 영역에서 아미노산 서열 변화 예상 개수(501)(도 5 및 도 6에서는 "1"로 표시됨)에 해당되는 만큼의 아미노산을 변화시켜 가면서 펩타이드 단편 계산 데이터베이스(200)에 저장된 기지의 단백질 서열과 BLASTP(basic local alignment search tool for protein)를 통해 가장 유사한 형태의 단백질을 판단한다. 그 다음에 단편화 예측 모듈은(110)은 상기 판단 결과에 대한 스코어 계산을 통해 가장 가능성이 높은 아미노산 서열변화 위치(601)를 출력한다. 이때, 치환된 서열로 계산하여 매칭된 이온, 예를 들면, c-이온의 수(602)(도 6에서는 "28개"로 표시됨), z-이온의 수(603)(도 6에서는 "29개"로 표시됨), c-z이온의 수(604)(도 6에서 "14개"로 표시됨) 등을 표시된다. 상기 스코어 계산 시, c-이온의 수(602), z-이온의 수(603), c-z이온의 수(604)를 이용하며, 상기 스코어는 숫자로 표시될 수 있다.
이상과 같이 본 발명에서는 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기 의 실시 예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
따라서, 본 발명의 사상은 설명된 실시 예에 국한되어 정해져서는 아니되며, 후술하는 특허청구 범위뿐 아니라 이 특허청구 범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
도 1은 본 발명의 일실시예에 따른 아미노산 서열변화 예측 시스템에 관한 블록도.
도 2는 본 발명의 일실시예에 따른 아미노산 서열변화 예측방법의 흐름도.
도 3은 본 발명의 일실시예에 따른 아미노산 서열변화 예측하기 위해, 펩타이드 서열, 펩타이드 MW, PKL 리스트를 입력하는 방법을 도시하는 도면.
도 4는 본 발명의 일실시예에 따른 단편화 예측모듈에 의해 표시된 펩타이드 단편화 맵 및 아미노산 서열변화 가능성이 있는 영역을 도시하는 도면.
도 5는 본 발명의 일실시예에 따른 아미노산 서열 변화 가능성이 가장 높은 서열을 출력하기 위해, 아미노산 변화 예상 개수를 입력하는 과정을 나타내는 도면.
도 6은 본 발명의 일실시예에 따른 아미노산 서열 변화 가능성이 가장 높은 서열을 나타내는 도면.
<도면의 주요부분에 대한 부호의 설명>
100 : 아미노산 서열변화 예측 시스템
110 : 단편화 예측 모듈
120 : 데이터베이스 매칭 모듈
200 : 펩타이드 단편 계산 데이터베이스

Claims (14)

  1. 단편화 예측 모듈이, 펩타이드에 대하여 질량 분석기에 의해 분석된 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보를 입력부에 의해 입력받는 단계;
    상기 단편화 예측 모듈이, 입력부에 의해, 상기 입력된 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보와 펩타이드 단편 계산 데이터베이스에 저장되어 있는 이론적 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보의 매칭 범위를 제한하기 위한 소정의 설정값인 단편화 허용 오차 범위를 입력받는 단계(상기 펩타이드 단편 계산 데이터베이스는 PTM(post-translational modification) 규칙에 의한 펩타이드 단편들의 조합과 PTM 규칙에 의하지 않은 아미노산 서열의 모든 조합과 각 조합의 질량 정보를 포함함);
    상기 단편화 예측 모듈이, 상기 입력된 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보와 상기 이론적 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보를 비교하는 단계;
    비교 결과, 상기 단편화 예측 모듈이, 상기 입력된 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보와 상기 이론적 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보의 일치하지 않는 아미노산 서열들을 상기 펩타이드 내에서 아미노산 서열 변화 가능성이 있는 영역을 표시부에 표시하는 단계;
    상기 단편화 예측 모듈이, 상기 입력부에 의해 상기 아미노산 서열 변화 가능성이 있는 영역 내의 아미노산 변화 예상 개수 및 상기 입력된 펩타이드 단편 질량 정보에 대한 허용 오차를 나타내는 허용 오차 범위를 입력받는 단계; 및
    데이터베이스 매칭 모듈이, 상기 아미노산 변화 예상 개수를 이용하여 상기 오차 범위 내에서 아래의 수학식 1 또는 수학식 2에 의해 스코어를 계산함으로써 상기 아미노산 서열 변화 가능성이 있는 영역 내에서 아미노산 서열 변화 가능성이 가장 높은 서열을 상기 표시부에 표시하는 단계
    를 포함하는 아미노산 서열 변화 예측 방법.
    [수학식 1]
    스코어 = {1 / (아미노산 서열 길이 - 이중으로 단편화된 개수) x 0.4} x {총 단편화 개수 / (아미노산 서열 길이 - 1) x 0.2} x {(1 / 단편화 오차범위) x 0.99} x (작은 단편화 개수 / 큰 단편화 개수) x {(1 / 이론적 질량값과 실험적 질량값 차이의 절대값) x 0.97} x 104 (여기서, 두 단편화 개수의 곱은 0이 아니고, 이론적 질량값과 실험적 질량값 차이는 0이 아니다.)
    [수학식 2]
    Figure 112010010567464-pat00010
    (여기서, x = mean = 1/111.1 x 2 x Ma x 2 이고, f는 입력 단편화 이온들의 개수이며, n은 매칭되는 단편화 이온들의 개수이고, Ma는 질량 정확도(Mass Accuracy),즉 실험에 의한 오차 허용범위를 나타낸다.)
  2. 제 1 항에 있어서,
    상기 펩타이드 단편 질량은 상기 펩타이드의 절단되는 N-말단 단편(c-이온 또는 b-이온) 또는 C-말단 단편(z-이온 또는 y-이온)의 질량이고,
    상기 c-이온 단편/z-이온 단편 또는 b-이온/y-이온 단편으로 나뉘는 경우, 상기 아미노산 서열변화 가능성이 있는 영역은 상기 c-이온 단편 또는 b-이온을 표시한 영역과 상기 z-이온 단편 또는 y-이온 단편을 표시한 영역이 서로 겹쳐지지 않는 영역을 의미하는 아미노산 서열 변화 예측 방법.
  3. 제 2 항에 있어서,
    상기 단편화 예측 모듈이, 상기 획득된 펩타이드 단편 질량 정보와 상기 계산된 질량 정보의 차이가 상기 단편화 오차범위 이내인 경우 매칭으로 표시하고,
    상기 획득된 펩타이드 단편 질량 정보와 상기 계산된 질량 정보와의 매칭 되지 않는 영역은 아미노산 서열변화 가능성이 있는 영역으로 표시하는 아미노산 서열 변화 예측 방법.
  4. 제 1 항에 있어서,
    상기 아미노산 서열 변화 가능성이 가장 높은 서열을 표시하는 단계는, 상기 아미노산 서열변화 가능성이 가장 높은 서열과 함께 상기 펩타이드 단편들의 단편화된 위치를 나타내는 펩타이드 단편화 맵을 표시하는 아미노산 서열변화 예측 방법.
  5. 펩타이드에 대하여 질량 분석기에 의해 분석된 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보를 입력하는 입력부;
    PTM(post-translational modification) 규칙에 의한 펩타이드 단편들의 조합과 PTM 규칙에 의하지 않은 아미노산 서열의 모든 조합과 각 조합의 질량이 저장되고, 상기 펩타이드의 이론적 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보를 저장하고 있는 펩타이드 단편 계산 데이터베이스;
    상기 입력부에 의해 입력된 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보와 상기 이론적 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보의 매칭 범위를 제한하기 위한 소정의 설정값인 단편화 허용 오차 범위를 입력받고,
    상기 입력된 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보와 상기 이론적 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보를 비교하며,
    비교 결과, 상기 단편화 예측 모듈이 상기 입력된 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보와 상기 이론적 펩타이드 단편 질량 정보, 펩타이드 서열 정보 및 펩타이드 분자량(MW) 정보의 일치하지 않는 아미노산 서열들을 상기 펩타이드 내에서 아미노산 서열 변화 가능성이 있는 영역으로 표시부에 표시하고,
    상기 단편화 예측 모듈이, 상기 입력부에 의해 상기 아미노산 서열 변화 가능성이 있는 영역 내의 아미노산 변화 예상 개수 및 상기 입력된 펩타이드 단편 질량 정보에 대한 허용 오차를 나타내는 허용 오차 범위를 입력받는 단편화 예측 모듈; 및
    상기 아미노산 변화 예상 개수를 이용하여 상기 오차 범위 내에서 아래의 수학식 1 또는 수학식 2에 의해 스코어를 계산함으로써 상기 아미노산 서열 변화 가능성이 있는 영역내에서 아미노산 서열 변화 가능성이 가장 높은 서열을 상기 표시부에 표시하는 데이터베이스 매칭 모듈
    을 포함하는 아미노산 서열 변화 예측 시스템 장치.
    [수학식 1]
    스코어 = {1 / (아미노산 서열 길이 - 이중으로 단편화된 개수) x 0.4} x {총 단편화 개수 / (아미노산 서열 길이 - 1) x 0.2} x {(1 / 단편화 오차범위) x 0.99} x (작은 단편화 개수 / 큰 단편화 개수) x {(1 / 이론적 질량값과 실험적 질량값 차이의 절대값) x 0.97} x 104 (여기서, 두 단편화 개수의 곱은 0이 아니고, 이론적 질량값과 실험적 질량값 차이는 0이 아니다.)
    [수학식 2]
    Figure 112010010567464-pat00011
    (여기서, x = mean = 1/111.1 x 2 x Ma x 2 이고, f는 입력 단편화 이온들의 개수이며, n은 매칭되는 단편화 이온들의 개수이고, Ma는 질량 정확도(Mass Accuracy),즉 실험에 의한 오차 허용범위를 나타낸다.)
  6. 제 5 항에 있어서,
    상기 펩타이드 단편 질량은 상기 펩타이드의 절단되는 N-말단 단편(c-이온 또는 b-이온) 또는 C-말단 단편(z-이온 또는 y-이온)의 질량이고,
    상기 c-이온 단편/z-이온 단편 또는 b-이온/y-이온 단편으로 나뉘는 경우, 상기 아미노산 서열변화 가능성이 있는 영역은 상기 c-이온 단편 또는 b-이온을 표시한 영역과 상기 z-이온 단편 또는 y-이온 단편을 표시한 영역이 서로 겹쳐지지 않는 영역을 의미하는 아미노산 서열 변화 예측 시스템 장치.
  7. 제 5 항에 있어서,
    상기 단편화 예측 모듈이, 상기 획득된 펩타이드 단편 질량 정보와 상기 계산된 질량 정보의 차이가 상기 단편화 오차범위 이내인 경우 매칭으로 표시하고,
    상기 획득된 펩타이드 단편 질량 정보와 상기 계산된 질량 정보와의 매칭 되지 않는 영역은 아미노산 서열변화 가능성이 있는 영역으로 표시하는 이 영역의 아미노산 서열 변화 예측 시스템 장치.
  8. 제 5 항에 있어서,
    상기 표시부는, 상기 아미노산 서열변화 가능성이 가장 높은 서열과 함께 상기 펩타이드 단편들의 단편화된 위치를 나타내는 펩타이드 단편화 맵을 표시하는 아미노산 서열변화 예측 시스템 장치.
  9. 제 1 항 내지 제 4 항 중 어느 한 항에 따른 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록매체.
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
KR1020080014176A 2007-02-16 2008-02-15 아미노산 서열 변화 예측방법 및 시스템 KR100984253B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20070016699 2007-02-16
KR1020070016699 2007-02-16

Publications (2)

Publication Number Publication Date
KR20080076852A KR20080076852A (ko) 2008-08-20
KR100984253B1 true KR100984253B1 (ko) 2010-09-30

Family

ID=39879914

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080014176A KR100984253B1 (ko) 2007-02-16 2008-02-15 아미노산 서열 변화 예측방법 및 시스템

Country Status (1)

Country Link
KR (1) KR100984253B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101265187B1 (ko) 2011-05-09 2013-05-27 서울시립대학교 산학협력단 이중 질량 분석기를 통한 고속 다중―무제한 변이 탐색 방법 및 장치
KR20180022549A (ko) 2016-08-23 2018-03-06 한국과학기술원 확률 그래프 모델을 이용한 아미노산 또는 핵산 변이의 기능적 영향 및 유해성 예측 장치 및 이의 예측 방법
KR102547970B1 (ko) 2022-12-28 2023-06-26 주식회사 네오젠티씨 질량분석 데이터의 정제 및 데이터베이스화를 위한 방법 및 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030074773A (ko) * 2001-02-01 2003-09-19 싸이퍼젠 바이오시스템즈, 인코포레이티드 탠덤 질량 분광계에 의한 단백질 확인, 특성화 및 서열결정을 위한 개선된 방법
KR100531207B1 (ko) 2005-06-04 2005-11-29 씨비에스소프트주식회사 단백질 동정시스템
KR20060036322A (ko) * 2004-10-25 2006-04-28 김상태 아미노산 서열 분석 장치 및 방법
KR20070017676A (ko) * 2005-08-08 2007-02-13 한국기초과학지원연구원 변형된 폴리펩티드(Modifiedpolypeptide)의 서열 및 변형 정보를 분석하는방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030074773A (ko) * 2001-02-01 2003-09-19 싸이퍼젠 바이오시스템즈, 인코포레이티드 탠덤 질량 분광계에 의한 단백질 확인, 특성화 및 서열결정을 위한 개선된 방법
KR20060036322A (ko) * 2004-10-25 2006-04-28 김상태 아미노산 서열 분석 장치 및 방법
KR100531207B1 (ko) 2005-06-04 2005-11-29 씨비에스소프트주식회사 단백질 동정시스템
KR20070017676A (ko) * 2005-08-08 2007-02-13 한국기초과학지원연구원 변형된 폴리펩티드(Modifiedpolypeptide)의 서열 및 변형 정보를 분석하는방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101265187B1 (ko) 2011-05-09 2013-05-27 서울시립대학교 산학협력단 이중 질량 분석기를 통한 고속 다중―무제한 변이 탐색 방법 및 장치
KR20180022549A (ko) 2016-08-23 2018-03-06 한국과학기술원 확률 그래프 모델을 이용한 아미노산 또는 핵산 변이의 기능적 영향 및 유해성 예측 장치 및 이의 예측 방법
KR102547970B1 (ko) 2022-12-28 2023-06-26 주식회사 네오젠티씨 질량분석 데이터의 정제 및 데이터베이스화를 위한 방법 및 장치

Also Published As

Publication number Publication date
KR20080076852A (ko) 2008-08-20

Similar Documents

Publication Publication Date Title
Perdigão et al. Unexpected features of the dark proteome
Wang et al. Comprehensive evaluation of de novo transcriptome assembly programs and their effects on differential gene expression analysis
de Brevern et al. Bayesian probabilistic approach for predicting backbone structures in terms of protein blocks
Margolin et al. The mechanisms of microtubule catastrophe and rescue: implications from analysis of a dimer-scale computational model
Schüler et al. Evolution of protein domain repeats in Metazoa
Castellana et al. Proteogenomics to discover the full coding content of genomes: a computational perspective
Frank et al. Peptide sequence tags for fast database search in mass-spectrometry
Alves et al. Advancement in protein inference from shotgun proteomics using peptide detectability
CN107103205A (zh) 一种基于蛋白质质谱数据注释真核生物基因组的生物信息学方法
Weatheritt et al. The identification of short linear motif-mediated interfaces within the human interactome
Panchenko Finding weak similarities between proteins by sequence profile comparison
Kalev et al. HHfrag: HMM-based fragment detection using HHpred
KR100984253B1 (ko) 아미노산 서열 변화 예측방법 및 시스템
Matthiesen et al. SIR: Deterministic protein inference from peptides assigned to MS data
Helmy et al. Mass spectrum sequential subtraction speeds up searching large peptide MS/MS spectra datasets against large nucleotide databases for proteogenomics
Mallik et al. Topology and oligomerization of mono-and oligomeric proteins regulate their half-lives in the cell
Chalkley When target–decoy false discovery rate estimations are inaccurate and how to spot instances
Hiller et al. JVirGel 2.0: computational prediction of proteomes separated via two-dimensional gel electrophoresis under consideration of membrane and secreted proteins
Laslett et al. BRUCE: a program for the detection of transfer‐messenger RNA genes in nucleotide sequences
KR101743254B1 (ko) 확률 그래프 모델을 이용한 단백질의 중요부위 예측장치 및 이의 예측방법
Zhu et al. PEP_scaffolder: using (homologous) proteins to scaffold genomes
Thrift et al. Graph-pMHC: graph neural network approach to MHC class II peptide presentation and antibody immunogenicity
Khenoussi et al. SIBIS: a Bayesian model for inconsistent protein sequence estimation
Erhard et al. Detecting outlier peptides in quantitative high-throughput mass spectrometry data
Sikdar et al. Improving protein identification from tandem mass spectrometry data by one-step methods and integrating data from other platforms

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130923

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150126

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150921

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160920

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170920

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180920

Year of fee payment: 9