KR20020092377A - 단백질간 상호작용 예측방법 - Google Patents

단백질간 상호작용 예측방법 Download PDF

Info

Publication number
KR20020092377A
KR20020092377A KR1020027011612A KR20027011612A KR20020092377A KR 20020092377 A KR20020092377 A KR 20020092377A KR 1020027011612 A KR1020027011612 A KR 1020027011612A KR 20027011612 A KR20027011612 A KR 20027011612A KR 20020092377 A KR20020092377 A KR 20020092377A
Authority
KR
South Korea
Prior art keywords
protein
polypeptide
amino acid
oligopeptide
acid sequence
Prior art date
Application number
KR1020027011612A
Other languages
English (en)
Inventor
히로푸미 도이
아츄시 스즈키
Original Assignee
후지쯔 가부시끼가이샤
다이이찌 세이야꾸 가부시기가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤, 다이이찌 세이야꾸 가부시기가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20020092377A publication Critical patent/KR20020092377A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/107General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Peptides Or Proteins (AREA)

Abstract

(1)단백질 A의 아미노산배열을 특정 길이의 올리고펩타이드(oligopeptide)로 분해하고, (2)상기 올리고펩타이드를 갖는 단백질 C 또는 상기 올리고펩타이드와 상동의 올리고펩타이드를 갖는 단백질 D를 단백질 데이터 베이스에서 검색하고, (3)상기 단백질 A와 검출된 단백질 C 또는 D와의 사이에서 로컬 얼라인먼트(local alignment)를 실행하고, (4)로컬 얼라인먼트의 결과 및 단백질 데이터베이스로부터 아미노산의 빈도 혹은 올리고펩타이드의 빈도로부터 계산된 수치를 지표로 하는 방법에 의해 검색된 단백질 C 또는 D가 단백질 A와 상호작용을 갖는 단백질 B임을 예측하는 것을 특징으로 하는 단백질간 상호작용의 예측방법, 당해 예측 프로그램을 담지하는 기록매체, 당해 기록매체를 담지하는 예측장치 및 이들에 의해 얻어진 단백질에 관한 것이다.

Description

단백질간 상호작용 예측방법 {Method of anticipating interaction between proteins}
많은 단백질은 다른 단백질 또는 같은 단백질과 상호작용을 하면서 그 기능을 다하고 있다. 그 단백질간의 상호작용을 명확하게 하는 것은 의약품의 개발 및 농업에서의 품종개량 등에 있어서 중요하다. 특히, 병원 미생물을 포함하여 다양한 생물의 유전체(genome) 해석 및 cDNA 해석에 있어 많은 발전이 이루어지고, 새롭게 발견된 기능이 알려지지 않은 유전자와 그것에 의하여 암호화된 단백질의 수가 급속히 증가하고 있다. 단백질간 상호작용에 관한 해명이 이루어지면, 이들 기능이 알려지지 않은 단백질의 기능예측이 가능해질 것이다.
단백질간의 상호작용을 해명하는 목적에서 어떤 단백질에 관하여 그것과 상호작용하는 단백질의 검색에 사용된 종래의 방법으로는 투-하이브리드법(two-hybrid)(Field, S. The two-hybrid system to detect protein-proteininteraction. METHODS: A Companion to Meth. Enzymol., 5, 116-124, 1993)이 주로 알려져 있다. 그러나, 투-하이브리드법(two-hybrid)은 탐색적 실험수단이어서 조작이 번잡하고 시간이 걸리기 때문에 얻을 수 있는 단백질의 수는 의외로 적다. 또한, 이 방법은 실험결과가 사용하는 cDNA 라이브러리(library)에 의존적이라는 결점이 있다. 즉, 어떤 단백질에 관하여 그것과 상호작용하는 단백질의 유전자배열이 사용하는 cDNA 라이브러리에 포함되어 있지 않을 위험을 동반하는 것이다.
한편, 유전체 해석 및 cDNA 해석에 기초한 단백질 데이터베이스(data base)가 충실해짐에 따라 세포 내의 복합체를 직접 MALDI-TOF 매스 스펙트럼에 걸어, 그 아미노산 배열의 단편정보를 단백질 데이터베이스에서 검색하는 방법도 사용되고 있다(Yates, JR 3rd, J. Mass. Spectrom, 33, 1-19, 1998; Hunphery-Smith, I., et al., Electrophoresis, 18, 1217-1242; Kaufmann, R., 1995, J. Biotecnol., 41, 155-175, 1997). 그러나, 이 방법에는 복합체(complex)의 구성 단백질의 정보는 얻을 수 있지만, 단백질간의 상호작용에 관한 정보는 얻을 수 없기 때문에, 어느 단백질과 어느 단백질이 상호작용하고 있는가에 대해서는 실험적으로 확인할 필요가 있다.
본 발명은 단백질간 상호작용의 예측에 관한 것으로, 그를 위한 방법과 장치와 당해 방법 및 당해 장치에 의해 얻어진 단백질에 관한 것이다.
도 1은 (a)는 베로독소 2 유래의 아미노 말단으로부터의 20 잔기를, (b)와 (c)는 각각 당해 20잔기로 된 아미노산 배열을 기초로 프로그램 상에서 배열정보로서 분해시켜 얻은 아미노산 길이 5개와 6개로 된 올리고펩타이드(oligopeptide)를 나타낸다.
도 2는 베로독소 2 유래의 아미노 말단으로부터의 13 잔기의 배열을 기초로 프로그램 상에서 배열정보로서 분해시켜 얻어진 아미노산 길이 5개의 올리고펩타이드와 당해 올리고펩타이드의 아미노산 배열을 갖는 인간 단백질을 나타낸다.
도 3은 베로독소 2와 인간의 베타아드레날린 수용체 키나아제 2(ARK 2)가 공유하고 있는 올리고펩타이드를 로컬 얼라인먼트에 의해 얻은 결과를 나타낸다.
도 4의 (a)는 대장균 유전체에 있어서의 각 아미노산의 빈도를, (b)는 조성비율을 나타낸 것이다.
도 5는 수단의 구성을 나타낸 도면이다.
도 6은 베로독소 2 유래의 올리고펩타이드이고, 인간의 세포사에 관계하는 단백질이 존재하는 올리고펩타이드의 아미노산 배열과 당해 아미노산 배열을 갖는 인간 세포사에 관계하는 단백질을 나타낸 것이다.
도 7은 베로독소 2(VT Ⅱ)와 Bcl-2가 공유하고 있는 올리고펩타이드를 로컬 얼라인먼트(local alignmemt)에 의해 확인한 결과를 나타낸 것이다.
도 8은 베로독소 2(VT Ⅱ)와 Bcl-xL이 공유하고 있는 올리고펩타이드를 로컬 얼라인먼트에 의해 확인한 결과를 나타낸 것이다.
도 9는 베로독소 2(VT Ⅱ)와 MCL-1이 공유하고 있는 올리고펩타이드를 로컬 얼라인먼트에 의해 확인한 결과를 나타낸 것이다.
도 10은 베로독소 1(VT Ⅰ)과 Bcl-2(a) 또는 Bcl-xL(b)이 공유하고 있는 올리고펩타이드를 로컬 얼라인먼트에 의해 얻은 결과를 나타낸 것이다.
도 11은 베로독소 1(VT Ⅰ)과 Bcl-2는 상호작용하지 않으며[(b)의 좌도], 베로독소 2(VT Ⅱ)와 Bcl-2는 상호작용한다는 것[(a) 및 (b)의 우도]을 HepG2 세포 및 B10 세포를 이용하여 실험적으로 확인한 결과를 나타내는 전기영동도이다. 도면에서 Bcl-2 IPs 및 VT Ⅱ IPs는, 각각 항 Bcl-2 항체 및 항 VT Ⅱ항체를 이용하여 면역침강시킨 것을 나타낸다. (a)의 좌도는 항 Bcl-2 항체를 이용하여 웨스턴 블롯(western blot)한 것(Bcl-2 WB), (a)의 우도는 항 VT Ⅱ 항체를 이용하여 웨스턴 블롯(VT Ⅱ WB)한 것이다. 또한, (b)는 B10 세포에 베로독소 1(VT Ⅰ)(좌도) 또는 베로독소 2(VT Ⅱ)(우도)를 작용시키고 각각 항 VT Ⅰ항체 및 항 VT Ⅱ항체를 적용시킴으로써, 세포 내의 어느 부분에서 이들 단백질이 검출되는가를 확인한 결과를 나타낸 전기영동도이다.
도 12는, 베로독소 2(VT Ⅱ)와 Bcl-2와의 로컬 얼라인먼트가 어떤 위치에서 대응하고 있는가를 나타낸 것이다.
도 13은 Bcl-xL의 입체구조 상에서 베로독소 2(VT Ⅱ)와 부분배열이 상동인 부분을 와이어 모델로 나타낸 것이다.
도 14는 호몰로지 모델링한 베로독소 2의 입체구조 상에서 Bcl-xL과 부분 아미노산 배열이 상동인 부분을 와이어 모델로 나타낸 것이다.
도 15는 베로독소 2(VT Ⅱ)와 Bcl-2가 공유하고 있는 올리고펩타이드인 NWGRI에 대하여 농도 의존적으로 VT Ⅱ에 의한 세포사 유도가 억제되는 것을 나타낸 그래프이다.
도 16은 인간의 헬퍼 T 세포 표면 단백질 CD 4와 HIV 1 바이러스 표면 단백질 fp120이 공유하고 있는 올리고펩타이드를 로컬 얼라인먼트에 의해 확인한 결과를 나타낸 도면이다. (a)는 CD 4와 gp120이 공유하는 올리고펩타이드를 나타낸 것이다. (b)는 CD 4와 gp120에서 국지적으로 상동성이 높은 영역의 아미노산 배열을 나타낸 것이다.
도 17은 선충의 세포사 관련 단백질인 CED-4와 CED-4에 결합하는 MAC-1 단백질이 공유하고 있는 올리고펩타이드를 로컬 얼라인먼트에 의해 확인한 결과를 나타낸 것이다.
도 18은 아밀로이드 전구 단백질(amyloid precursor protein: APP)과 이를 절단하는 효소인 BASE가 공유하고 있는 올리고펩타이드를 로컬 얼라인먼트에 의해확인한 결과를 나타낸 것이다.
도 19는 퓨린 전구 단백질(furin-pre)과 폰 빌레브란트 인자(von Willebrand factor) 전구 단백질(VWF-pre)이 공유하고 있는 올리고펩타이드를 로컬 얼라인먼트에 의해 확인한 결과를 나타낸 도면이다. (a)는 양 단백질이 공유하고 있는 올리고펩타이드를, (b)는 양 단백질에서 국소적으로 상동성이 높은 영역의 아미노산 배열을 나타낸 것이다.
도 20은, 아밀로이드 전구 단백질(APP)과 이의 작동에 관여하는 것으로 여겨지고 있는 단백질 PC7가 공유하고 있는 올리고펩타이드를 로컬 얼라인먼트에 의해 확인한 결과를 나타낸 도면이다. 도면에서 "="는 절단부위로 예측될 수 있는 부분을 나타내는 것이다.
*부호의 간단한 설명*
a. 입력수단
b. 올리고펩타이드 분해/기억수단
c. 기억수단
d. 검색/기억수단
e. 로컬 얼라인먼트 실행/기억수단
f. 빈도계산/기억표시수단
g. 순위 매김/기억표시수단
h. 위치표시수단
i. 입체구조 계산/기억표시수단
j. 단백질 분류/기억수단
k. 순차입력수단
l. 기억수단
m. 키보드
n. 제어수단
o. 출력수단
본 발명의 한 태양은, 특정 단백질 혹은 폴리펩타이드(polypeptide)(A)와 상호작용하는 단백질 혹은 폴리펩타이드(B)를 예측하는 방법에 있어서, (1)A의 아미노산 배열을 특정 길이를 갖는 다수 개의 올리고펩타이드(oligopeptide)에 배열정보로서 분해하고, (2)상기 각 올리고펩타이드의 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(C) 또는 상기 올리고펩타이드의 아미노산배열과 상동인 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(D)를 단백질 혹은 폴리펩타이드의 아미노산 배열에 관한 데이터베이스(data base)에서 검색하고, (3)상기 A와 검출된 C 또는 D와의 사이에 아미노산 배열에 관한 로컬 얼라인먼트(local alignment)를 실행하고, (4)로컬 얼라인먼트의 결과 및 단백질 혹은 폴리펩타이드의 아미노산 배열의 데이터베이스에 있어서 아미노산의 빈도 및/또는 올리고펩타이드의 빈도로부터 계산된 수치를 지표로 하여 검출된 C 및/또는 D를 A와 상호작용하는 단백질 혹은 폴리펩타이드(B)라고 평가하는 것을 특징으로 하는 단백질간 상호작용의 예측방법에 관한 것이다.
본 발명의 한 태양은 상기 예측방법에 있어서 올리고펩타이드의 아미노산 배열의 길이가 아미노산 4∼15개의 예측방법일 수 있다.
또한, 본 발명의 한 태양은, 특정 단백질 혹은 폴리펩타이드(A)와 상호작용하는 단백질 혹은 폴리펩타이드(B)를 예측하는 방법을 실시하는 프로그램을 담지하는 기록매체에 있어서, 적어도 아래의 (a)부터 (f)의 수단을 구비하는 것을 특징으로 하는 단백질간 상호작용의 예측 프로그램을 담지하는 기록매체에 관한 것이다;
(a) A의 아미노산 배열정보를 입력하고 기억하는 수단과,
(b) 이 정보를 특정 길이를 갖는 다수 개의 올리고펩타이드에 배열정보로서 분해하는 수단과, 그 결과를 배열정보로 기억하는 수단과,
(c) 입력된 단백질 데이터베이스를 기억하는 수단과,
(d) 당해 기억된 단백질 데이터베이스에 액세스(access)하여, 상기 올리고펩타이드의 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(C) 또는 상기 올리고펩타이드의 아미노산 배열과 상동인 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(D)를 검출하는 수단과, 그 검출결과를 기억·계산하는 수단과,
(e) 상기 A와 검출된 C 또는 D와의 사이에 로컬 얼라인먼트를 수행하는 수단과, 그 결과를 기억·계산하는 수단과,
(f) 상기 로컬 얼라인먼트의 결과치 및 단백질 데이터베이스로부터 아미노산의 빈도/또는 올리고펩타이드의 빈도의 결과치를 얻어 그 결과치로부터 단백질간 상호작용의 예측을 위한 지표를 제시하는 수단과, 그 결과를 기억하여 표시하고, A와 상호작용하는 B를 검출하는 수단.
본 발명의 한 태양은, 상기 (a)∼(f)의 수단을 담지하는 기록매체에 아래의 (g)∼(l)의 수단 중에서 선택된 적어도 하나의 수단을 구비하는 기록매체에 관한 것이다;
(g) 검출된 B가 다수인 경우, 로컬 얼라인먼트의 결과치 및 단백질 데이터베이스에 있어서 아미노산의 빈도 및/또는 올리고펩타이드의 빈도의 결과치로부터 계산된 지표에 기초하여 당해 검출된 복수 개의 B 사이의 단백질간 상호작용의 강도에 순위를 매기는 수단과, 그 결과를 기억·표시하는 수단,
(h) 로컬 얼라인먼트에 의해 상기 A와 상기 검출된 B와의 사이에 아미노산 부분배열간에 대하여 얼라인먼트시킨 경우, 당해 A와 당해 B의 아미노산 배열의 전체 길이를 표시하고, 얼라인먼트시킨 부분배열이 전체길이 상에서 어느 부분에 위치하는가를 표시하는 수단,
(i) 상기 A 혹은 상기 검출된 B의 입체구조가 알려져 있는 경우 또는 호몰로지 모델링(homology modeling)에 의해서 입체구조 모델이 작성된 경우, 그 입체구조모델을 계산하고 그 입체구조 상에서 로컬 얼라인먼트에 의해 당해 A와 당해 B와의 사이에서 얼라인먼트시킨 아미노산 부분배열의 구조를 표시하는 수단,
(j) 검색범위를 좁히기 위해서 단백질 데이터베이스 내의 단백질을 분류하고 기억하는 수단,
(k) 단백질 데이터베이스 내의 각 단백질을 상기 A로서 순차적으로 입력하는 수단,
(l) 유전체(genome) 데이터베이스를 기억하는 수단.
본 발명의 한 태양은 상기의 기록매체가 담지하는 수단을 구비한 단백질간 상호작용의 예측장치에 관한 것이다.
본 발명의 한 태양은 상기의 예측방법 혹은 상기의 예측장치에 의해 특정 단백질 혹은 폴리펩타이드(A)와 상호작용하는 것으로 예측된 단백질 혹은 폴리펩타이드(B)를 얻고, 계속하여 실험적으로 A와 B와의 사이에 상호작용이 존재하는 것을 확인하는 방법에 의하는 상호작용을 갖는 단백질 혹은 폴리펩타이드의 특정방법에 관한 것이다.
또한, 본 발명의 한 태양은 이러한 특정방법에 의해 특정된 단백질 또는 폴리펩타이드일 수 있다.
본 발명의 한 태양은 상기의 예측방법 또는 상기의 예측장치를 이용함으로써, 특정 단백질 또는 폴리펩타이드(A)와 당해 A와 상호작용하는 것으로 예측된 단백질 또는 폴리펩타이드(B)와의 단백질간 상호작용을 조정하는 기능을 갖는 화합물을 선별하는 방법에 관한 것이다.
또한, 본 발명의 한 태양은 이러한 선별방법에 의해 얻어진 신규화합물 및 얻어진 화합물의 정보를 기초로 신약설계(drug design)하여 얻을 수 있는 A와 B와의 단백질간 상호작용을 조정하는 기능을 갖는 신규화합물에 관한 것이다.
본 발명의 한 태양은, 본 발명에 의해 얻어진 베로독소 2(VT Ⅱ)와 Bcl-2와의 상호작용을 조정하는 기능을 가지며 서열목록 1에 나타낸 아미노산 배열을 갖는 올리고펩타이드 또는 당해 올리고펩타이드의 아미노산 배열과 상동인 아미노산배열을 갖는 올리고펩타이드로서 VT Ⅱ와 Bcl-2와의 상호작용을 조정하는 기능을 갖는 올리고펩타이드, 또는 이들의 올리고펩타이드의 어느 한 쪽을 포함하는 폴리펩타이드로서 VT Ⅱ와 Bcl-2와의 상호작용을 조정하는 기능을 갖는 폴리펩타이드이다.
또한, 본 발명의 한 태양은, 서열목록 1에 표시한 아미노산 배열을 갖는 올리고펩타이드를 함유하는 항세포사제일 수 있다.
본 발명의 한 태양은, 상기 올리고펩타이드 및/또는 상기 폴리펩타이드를 이용하며, VT Ⅱ와 Bcl-2와의 상호작용을 조정하는 기능을 갖는 화합물의 선별방법에 관한 것이다.
본 발명의 한 태양은 상기 예측방법 또는 상기의 예측장치를 이용하는 것을특징으로 하고, 특정의 단백질 혹은 폴리펩타이드(A)와 당해 A와 상호작용하는 것으로 예측된 단백질 혹은 폴리펩타이드(B)와의 단백질간의 상호작용에 관계하는 올리고펩타이드를 암호화하는 올리고뉴클레오티드(oligonucleotide) 배열의 결정방법이다.
본 발명의 한 태양은, 상기의 예측방법 또는 상기 예측장치에 의해 얻어진 단백질간 상호작용이 있다고 예측된 인간 유래 단백질의 조합군이다. 그리고, 본 발명의 한 태양은 그 조합군 중에서 질병에 관여할 가능성이 있는 기지의 단백질 정보를 기초로 하여 선택하는, 질병에 관여하는 단백질간 상호작용을 갖는 단백질 조성의 선택방법에 관한 것이다. 더욱이, 본 발명의 한 태양은 이러한 방법에 의해 얻어진 질병에 관여하는 단백질간에 상호작용이 존재하는 단백질 조합군이다.
본 발명의 한 태양은, 상기의 과정을 거쳐 얻어진 질병에 관여하는 단백질간의 상호작용을 갖는 단백질의 조합군으로부터 선택된 특정 조성 및 /또는 2개의 단백질간 상호작용을 조정하는 화합물을 선별하는 방법이다. 또한, 본 발명의 한 태양은 상기의 상호작용을 조정하는 화합물의 선별방법을 통하여 얻어진 화합물이다.
본 발명의 한 태양은, 상기의 예측방법 또는 상기 예측장치를 이용하고 특정의 단백질과 그 단백질을 절단하는 효소와의 단백질간 상호작용을 예측함으로써, 단백질의 작동(processing) 부위를 예측하는 방법에 관한 것이다.
또한, 본 발명의 한 태양은, 상기 단백질의 작동부위 예측방법에 의해 얻어진 단백질 작동부위 및/또는 당해 작동 부위와 상동인 부분배열을 포함하는 것으로 예측된 아미노산 배열을 갖는 폴리펩타이드이다.
이하, 본 발명의 사상, 방법, 당해 방법에 관한 프로그램을 담지하는 기록매체, 그 기능을 발휘하는 장치 및 당해 방법과 당해 장치에 의해 얻어진 단백질 혹은 폴리펩타이드에 대해서, 발명의 실시의 형태를 더욱 상세하게 설명한다. 이하의 상세한 설명은 설명을 위한 예시에 지나지 않으며 본 발명을 한정하는 것은 아니다.
또한, 본 명세서에서 사용되고 있는 기술적, 과학적 용어는 별도로 정의하지 않는 한 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 일반적으로 이해될 수 있는 의미를 갖는다. 본 명세서에는 당업자에게 이미 알려져 있는 다양한 방법이 참조되어 있다. 그러한 인용된 공지의 방법을 개시하는 간행물 등의 자료는 이를 인용하였으며, 본 명세서에서 이들 내용에 대해서 완전히 기재하지는 않았다.
본 발명의 한 태양인 단백질간 상호작용 예측방법은 아래와 같은 사상에 입각하고 있는 것이다. 즉, 단백질은 20종류의 아미노산 잔기의 배열에 의해 구성되어 있지만 그 배열이 임의적인 것은 아니다. 따라서, 임의의 생물종에 있어서 단백질의 부분배열인 올리고펩타이드가 생명활동에 있어서 어떠한 역할을 차지하는가가 고려될 수 있다.
예를 들어, 어느 효소의 일부분인 올리고펩타이드는 기질을 인식하는 역할을 담당하고 있다고 생각된다. 또한, 특정 단백질에는 다른 단백질과 상호작용하는 데에 있어서 중요한 역할을 하는 올리고펩타이드가 존재한다고 생각할 수 있다. 이러한 특정 단백질의 기능 혹은 상호작용은 올리고펩타이드 수준에서부터 고찰하는 것이 필요한 것이다. 더욱이, 올리고펩타이드의 빈도라는 관점에서 보면, 하나의 생물에 있어서 그 생물의 유전체에 의해 암호화되는 전 단백질에서 특정 올리고펩타이드가 출현하는 빈도는 균일하지 않다. 다양한 단백질에 높은 빈도로 출현하는 올리고펩타이드도 드물게 밖에 출현하지 않는 올리고펩타이드도 있는 것이다. 이 중 낮은 빈도로 출현하는 올리고펩타이드는 개개의 단백질에 특이적으로 존재하는 올리고펩타이드일 가능성이 높고, 그 단백질의 특성 및 기능을 결정하고 있다고 생각할 수 있다.
한편, 단백질이 상호작용한다고 하는 것은, 생명활동을 영위하는 과정에서 상호작용하는 단백질 사이의 협동이 이루어져 하나의 기능이 수행되는 것이다. 하나의 기능에 대하여 그 역할을 다하기 위한 하나의 올리고펩타이드가 대응하고 있다고 가정하면, 상호작용하는 두 단백질은 같은 올리고펩타이드 또는 상동인 올리고펩타이드를 공유하고 있는 것이 된다. 또한, 공유하고 있는 올리고펩타이드 이외의 부분에 있어서도 두 단백질은 상동의 배열구조를 갖는 부분이 있는 것으로 여겨진다.
두 단백질의 상동성을 해석하기 위한 유사성 검색법의 한 방법으로서, 양 단백질의 1차 배열을 늘어놓은(얼라인먼트; alignment) 후 이를 비교하는 방법이 알려져 있다(金久 實, 유전체 정보에의 초대, 공립출판주식회사, 93-104, 1996). 이 배열 얼라인먼트는 글로벌 얼라인먼트와 로컬 얼라인먼트로 구별되며, 글로벌 얼라인먼트는 배열전체를 늘어놓는 것이고 로컬 얼라인먼트는 유사성이 높은 부분을 각각의 배열로부터 취출하여 국소적으로 배열하는 것이다. 어느 얼라인먼트에 의해서도, 비교하는 두 개의 혹은 그 이상의 배열의 관계가 가능한 한 명확하게 밝혀지도록 배열하는 것을 원칙으로 한다. 이러한 배열방법에는 배열의 길이에 의존하는 많은 조합이 존재한다. 이 조합의 최적화를 계산하는 방법으로 다이내믹 프로그래밍법(dynamic programming)이 있다. 다이내믹 프로그래밍법의 원리에 기초한 Smith-Waterman 법(Smith, TF and Waterman, MS, J. Mol. Bop; 147, 195-197, 1981)에 의해 배열의 조합의 최적화에 관한 평가함수를 얻고, 그 값인 호몰로지 스코어(homology score; 이하, 간단히 스코어라 한다)에 의해 두 단백질의 상동성을 평가할 수 있다. 비교한 단백질간에서 스코어가 높을수록 이들 단백질은 상동성이 높다고 평가할 수 있다. 로컬 얼라인먼트의 경우, 다이내믹 프로그래밍에 의해 배열의 조성을 탐색할 때에는 스코어에 역치를 설정하여 부분배열의 조성을 최적화시킴으로써 로컬 얼라인먼트가 이루어진다(예를 들어, Gotoh, O., Patter matching of biological sequences with limited storage, Comput. Appl. Biosci. 3, 17-20, 1987). 이러한 로컬 얼라인먼트를 이용함으로써, 두 단백질간 공유되어 있는 올리고펩타이드 이외의 부분에 있어서의 상동인 구조도 검색할 수 있다.
단백질간의 상호작용은 진화의 과정에서 보존되어 온 것일 것이다. 후술하는 대장균의 베로독소와 Bcl-2의 예는 종은 초월하여 하나의 기능이 단백질간의 상호작용이라는 것에 의해 보존되고 있으며 또한 보존되어 왔기 때문에 구조상 유사한 아미노산 배열이 존재하는 것으로 간주된다. 또한, 후술하는 아밀로이드 전구 단백질이나 폰 빌레브란트 인자[Von Willebrand Factor(VWF)] 전구 단백질의 작동과정에서도, 단백질 분해라는 기능이 단백질간 상호작용에 의해 보존되고 있으며,구조상으로도 유사한 아미노산 배열이 존재하고 있는 것으로 추정할 수 있다.
상기의 사상에 기초하여 창출된 단백질간 상호작용 예측방법에 의하면, 계산기 상에서 예측된 결과에 기초하고 분자생물학의 열거주의에 의해 알려진 사실의 축적으로부터 얻어진 생명현상과는 다른 종합적 작용상호관계를 기초로 하여, 종래는 독특한 것으로 밖에 알려져 있지 않았던 기능의 네트워크 등도 예상 가능하게 되어, 새로운 생명현상의 추출이 가능하게 되었다.
더욱이, 하나의 생물 내에서 뿐만 아니라 두 생물 간, 예를 들어 사람과 병원 미생물과의 사이에서의 단백질의 상호작용의 예측이 가능하게 되어 지금까지 알려져 있지 않았던 병원성의 해명에도 도움이 되게 되었다.
구체적으로는, 상기 단백질간 상호작용 예측방법의 태양의 하나는 유전체 해석 및 cDNA 해석에 의해 얻어진 기능이 알려지지 않은 단백질에 관하여 또는 기능이 알려진 단백질에 관하여, 그것이 상호작용하는 상대 단백질을 단백질 데이터베이스 등으로부터 추출하고 예측하는 방법으로서, 예를 들면 이하의 단계(1)부터 (4)를 그 구성요건으로 하고 있는 것이다.
단계(1)은 특정 단백질 또는 폴리펩타이드의 아미노산 배열을 일정 길이를 갖는 다수 개의 올리고펩타이드에 배열정보로서 분해하는 단계, 단계(2)는 그 올리고펩타이드를 공유하는 단백질 혹은 폴리펩타이드를 찾는 단계, 단계(3)은 이들 단백질간의 부분구조의 상동성을 로컬 얼라인먼트에 의해 평가하는 단계, 단계(4)는 공유되어 있는 올리고펩타이드를 출현빈도를 이용하여 평가하는 단계이다.
이하, 각 단계에 관하여 상세히 설명한다.
단계(1):
유전체 해석 및 cDNA 해석에 의해 얻어진 기능이 알려지지 않은 단백질 혹은 폴리펩타이드, 또는 기능이 알려진 단백질 혹은 폴리펩타이드 등의 어느 특정 단백질 혹은 폴리펩타이드(A)에 관하여, 그 아미노산 배열을 아미노 말단으로부터 카르복실기 말단까지 순차적으로 아미노산 1 잔기씩 옮겨가면서 올리고펩타이드로 분해하고 이를 배열정보화 한다.
예를 들어 도 1은, 대장균 O157:H7의 베로독소2(VT Ⅱ)의 아미노 말단으로부터 최초 20 잔기분[도 1의 (a)]에 대하여 아미노산 길이 5개의 올리고펩타이드에 배열정보로서 분해한 것[도 1의 (b)]이다. 이하, 아미노산 및 올리고펩타이드는 아미노산을 1문자 표기하는 것으로 한다.
단계(1)을 실시하는 경우, 배열정보로서 분해한 올리고펩타이드의 아미노산 길이는 4∼15개, 바람직하게는 4∼8개가 적당하다. 실시예 2에 나타난 바와 같이 올리고펩타이드의 길이가 길수록 그 올리고펩타이드의 특이성은 높아진다.
단계(2):
이 단계에서는 단계(1)에서 분해하여 얻어진 올리고펩타이드의 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(C)를, 또는 그 올리고펩타이드와 상동인 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(D)를, 단백질 혹은 폴리펩타이드의 아미노산 배열 데이터베이스에서 검색한다. 검색된 단백질 혹은 폴리펩타이드 C 또는 D는 이용한 올리고펩타이드에 비하여 무수히 많이 존재하는 경우도 있고, 단지1개일 경우도 있다.
예를 들면, 도 2는 대장균 O157:H7의 베로독소2(VT Ⅱ)의 아미노 말단으로부터 최초 13 잔기분을 이용하여 분해된 9종류의 아미노산 길이 5개의 올리고펩타이드에 관하여, 그 올리고펩타이드를 갖는 단백질을 단백질 데이터베이스 SWISS-PROT version 35 중에서 검색한 결과를 나타낸다. 베로독소 2는 사람에게 식중독이나 신장장해를 유발시키기 때문에, 상호작용하는 상대 단백질로서 조사하는 대상이 되는 것은 인간 단백질이다. 즉, 도 2에 두 번째로 기재된 올리고펩타이드 KCILF를 갖는 인간 단백질인 β아드레날린 수용체 키나아제 2[BETA-ADRENERGIC RECEPTOR KINASE 2(ARK2 HUMAN)]가 검색결과로서 얻어질 수 있다.
단계(3):
상기 A와 단계(2)에서의 검색을 통해 얻어진 C 또는 D 사이에 로컬 얼라인먼트를 실행한다.
예를 들면, 도 3은 베로독소 2(VT Ⅱ)와 β아드레날린 수용체 키나아제 2(ARK2)와의 로컬 얼라인먼트의 결과를 도시하고 있다.
단계(4):
단계(3)의 로컬 얼라인먼트의 결과로부터, 상기 A와 검출된 C 및/또는 D와의 사이에 부분배열의 상동성이 있으면, C 및/또는 D는 A와 상호작용하는 단백질 또는 폴리펩타이드 B인 것으로 예측한다. 더욱이 A와 검출된 C 및/또는 D가 공유하는올리고펩타이드에 관하여, 단백질 데이터베이스로부터 아미노산의 빈도 및/또는 올리고펩타이드의 빈도를 계산하고, 이 올리고펩타이드의 단백질 데이터베이스 중에서 또는 A 혹은 검출된 C 및/또는 D를 갖는 생물의 유전체 중에서 각각의 특이성을 평가하여, 특이성이 높으면 C 및/또는 D는 A와 상호작용하는 단백질 혹은 폴리펩타이드 B라는 예측은 보다 높은 확실도를 갖는 것으로 평가하는 것이다.
예를 들면, 상기 올리고펩타이드 KCILF는 도 4에 도시되어 있는 대장균 유전체로 암호화된 전 단백질 중의 아미노산 빈도[도 4의 (a)]를 이용하여 계산된 조성비[도 4의 (b)]로부터, 그 특이성의 지표는 1284.86×10-6으로 계산되므로 그 특이성이 높은 것이다. 덧붙여서, 대장균 유전체 중에서 특이성이 낮은 것으로 계산된 아미노산 배열 길이가 5개의 올리고펩타이드는 LLLLL이고, 그 특이성의 지표는 136344.34×10-10이다. 또한, 가장 특이성이 높은 아미노산 배열 길이가 5개의 올리고펩타이드는 CCCCC이고, 그 특이성의 지표는 2.208×10-10이지만, 이 올리고펩타이드는 대장균 유전체 중에는 존재하지 않는다. 따라서, 베로독소 2와 β아드레날린 수용체 키나아제 2가 상호작용한다고 하는 예측은, 특이성의 지표치로부터 확실도가 높은 것으로 평가될 수 있다.
단백질간의 상호작용을 재확인하기 위해서는, 얻어진 상호작용하는 단백질의 정보를 기초로 그 유전자를 클로닝(cloning)하여 발현시켜, 실험적으로 확인할 수 있다. 예를 들면, 실시예에 후술하는 바와 같이 상기 예측방법 혹은 예측방법의 프로그램을 담지한 예측장치에 의해 상호작용하는 것으로 예측된 VT Ⅱ와 Bcl-2의상호작용은, Bcl-2를 발현시킨 세포와 발현되지 않은 세포를 사용하여 이들을 VT Ⅱ로 처리한 후 항 Bcl-2 항체 및 항 VTⅡ항체를 사용하여 공면역침강시킴으로써, 실험적으로 확인할 수 있다. 더욱이, 예를 들면 상호작용부위인 것으로 예측된 올리고펩타이드의 아미노산배열에 변이 등을 공지의 방법에 의해 도입하고, 상호작용할 수 없게 되는 것을 확인하는 과정을 통하여, 당해 올리고펩타이드가 중요한 상호작용부위임을 특정하는 것도 가능하다. 실험적인 상호작용의 확인방법은, 상기 방법에 한정되는 것이 아니며, 당업자의 기술범위 내에서 적용 가능한 것으로 알려져 있다면 어느 방법이나 사용할 수 있다.
또한, 상호작용 부위인 것으로 예측된 올리고펩타이드가, 단백질간 상호작용을 저해하고 당해 단백질의 기능 및 작용을 억제하는 것을 확인하면, 이와 같은 올리고펩타이드는 당해 단백질의 작용 억제제로서 이용할 수 있다. 예를 들면, 후술하는 실시예와 같이 VT Ⅱ와 Bcl-2의 상호작용부위인 것으로 예측된 올리고펩타이드 NWGRI는 VT Ⅱ에 의한 세포사를 억제하고 이는 항세포사제로서 이용할 수 있다. 이와 같은 저분자화합물은 의약품 및 시약 등으로서도 이용 가능하다.
다음으로, 상기 단백질간 상호작용을 예측하는 방법의 프로그램을 담지하는 기록매체 및 장치에 대하여 설명한다. 상기 기록매체 및 장치는, 예를 들면 도 5에 구성 예를 도시한 바와 같이, 적어도 아래의 (a)부터 (f)의 수단을 구비하는 것이다.
입력수단(a):
유전체 해석이나 cDNA 해석에 의해 얻어진 기능이 알려지지 않은 단백질 혹은 폴리펩타이드, 또는 기능이 알려져 있는 단백질 혹은 폴리펩타이드 등의 어느 특정 단백질 혹은 폴리펩타이드(A)의 아미노산 배열정보를 입력하기 위한 수단.
올리고펩타이드 분해/기억수단(b):
입력수단(a)에 의해 입력된 아미노산 배열정보를 아미노 말단에서부터 카르복실기 말단으로 순차적으로 하나의 아미노산 잔기씩 옮겨가면서, 특정 길이를 갖는 다수 개의 올리고펩타이드에 배열정보로서 분해하는 수단과, 그 결과를 기억하는 수단.
기억수단(c):
단백질 혹은 폴리펩타이드에 관하여 입력된 데이터베이스를 기억하는 수단.
검색/기억수단(d):
기억수단(c)에 기억된 단백질 혹은 폴리펩타이드에 관한 데이터베이스에 액세스하여, 상기 올리고펩타이드의 아미노산 배열을 갖는 단백질 혹은 펩타이드(C) 또는 상기 올리고펩타이드의 아미노산 배열과 상동인 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(D)를 검색하는 수단과 그 결과를 기억하는 수단.
로컬 얼라인먼트 실행/기억수단(e):
상기 A와 검출된 C 및/또는 D의 사이에 로컬 얼라인먼트를 실행하는 수단과, 그 결과를 기억하는 수단.
빈도계산/기억표시수단(f):
상기 로컬 얼라인먼트의 결과 및 단백질 혹은 폴리펩타이드의 데이터베이스로부터 아미노산의 빈도 및/혹은 올리고펩타이드의 빈도계산을 수행한 결과로부터, 단백질간 상호작용의 예측을 위한 지표를 계산하는 수단과, 그 결과를 기억하고 표시하는 수단.
더욱이, 상기 단백질간 상호작용 예측프로그램에 있어서는, 아래의 (g)∼(l)의 수단을 적절히 조합하여 구비하도록 하는 것도 가능하다.
순위 매김/기억표시수단(g):
검출된 B가 복수인 경우에 이들 B 사이에서의, 로컬 얼라인먼트 결과 및 단백질 데이터베이스로부터 아미노산의 빈도 및/또는 올리고펩타이드의 빈도를 계산하여 얻은 결과를 지표로 하여, 순위 매김을 수행하는 기능과, 그 결과를 기억·표시하는 기능을 갖는 수단.
위치표시수단(h):
A와 검출된 B와의 사이에 아미노산 부분배열 간에 얼라인먼트시킨 경우, A와 B의 아미노산 배열의 전체길이를 표시하고, 얼라인먼트시킨 부분이 전체 길이 상에서 어느 부분에 위치하는가를 표시하는 수단.
입체구조계산/기억표시수단(i):
A 혹은 검출된 B의 입체구조가 알려져 있거나 호몰로지 모델링으로 입체구조 모델이 작성된 경우, 그 입체구조 모델을 계산하고 그 입체구조 상에 A와 B와의 사이에 얼라인먼트시킨 아미노산 부분배열의 구조를 표시하는 수단.
단백질 분류/기억수단(j):
검색범위를 제한하기 위하여 단백질 혹은 폴리펩타이드의 데이터베이스 중에서 단백질 혹은 폴리펩타이드를 생물, 기능 및/또는 유래에 의해 분류하고, 기억하는 기능을 갖는 수단.
순차입력수단(k):
단백질 혹은 폴리펩타이드의 데이터베이스 중의 각 단백질 혹은 폴리펩타이드를 A로 순차적으로 입력하는 수단.
기억수단(l):
유전체 데이터베이스를 기억하는 기능을 갖는 수단.
이상의 수단은, 적당한 기록매체에 담지되어 사용에 제공된다.
또한, 사용의 한 태양으로서 이들 수단이 프로그램으로서 선택적으로 장치 내 기록매체에 담지시킨 장치로서 제공될 수도 있다. 당해 단백질간 상호작용을 예측하는 장치는, 아래와 같이 작동한다(도 5 참조).
입력수단(a)에 의해 입력된 기능이 알려지지 않은 단백질 혹은 폴리펩타이드 또는 기능이 알려진 단백질 혹은 폴리펩타이드 등의 어느 특정 단백질 혹은 폴리펩타이드(A)는 올리고펩타이드 분해/기억수단(b)에 의해, 그 아미노산 배열정보가 특정 길이를 갖는 다수 개의 올리고펩타이드로 분해된 후 이들 올리고펩타이드들은 기억된다. 이 때, 당해 A의 입력은 바라는 바에 따라, 단백질 혹은 폴리펩타이드에 관하여 입력된 데이터베이스를 기억하는 수단(c)으로부터, 순차입력수단(k)을 통해 순차적으로 입력된다. 상기 기억된 올리고펩타이드의 아미노산 배열에 관하여, 수단(c)에 대하여 검색/기억수단(d)에 의해 검색이 이루어지고, 당해 올리고펩타이드의 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(C) 또는 당해 올리고펩타이드의 아미노산 배열과 상동인 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(D)가 검색되어 기억된다. 검색 시에는 단백질 분류/기억수단(j)에 의해, 데이터베이스 중의 단백질 혹은 폴리펩타이드를 분류하고 검색범위를 한정하여, 그 범위 내에서만 검색하는 것도 가능하다. 상기 A와 검색된 C 또는 D에 관하여 로컬 얼라인먼트 실행/기억수단(e)에 의해 로컬 얼라인먼트가 실행되고 그 결과가 기억된다. 다음으로, 빈도계산/기억표시수단(f)에 의해, 수단(c)에 기억된 데이터베이스로부터 아미노산의 빈도 및/또는 올리고펩타이드의 빈도의 계산이 이루어지고 그 결과와 상기 얻어진 로컬 얼라인먼트의 결과로부터 단백질간 상호작용의예측을 위한 지표가 계산되어 기억된다. 그리고, 얻어진 상기 A와 상호작용하는 것으로 예측된 단백질 혹은 폴리펩타이드 C 또는 D 및 이들의 단백질간에서 공유되어 있는 올리고펩타이드의 아미노산 배열, 당해 올리고펩타이드의 빈도 및 단백질간 상호작용 예측을 위한 지표 등이 장치의 화면에 표시된다. 표시된 결과로부터, 단백질간 상호작용 예측을 위한 지표에 기초하여 상기 A와 상호작용을 갖는 단백질 혹은 폴리펩타이드(B)를 얻을 수 있다. 또한, 상기 B에 관하여, 수단(c)에 기억된 단백질의 기능 정보 또는 바라는 바에 따라서 구비된 유전체 데이터베이스를 기억하는 수단(1)로부터의 유전자 정보 등이 표시될 수 있다. 검출된 B가 다수인 경우에는, 순위 매김/기억표시수단(g)에 의해 이들 B의 사이에 상기 A와 상호작용하는 특이성이 높은 순서로 순위가 매겨질 수 있다. 또한, 검출된 B와 상기 A와의 사이에 얼라인먼트시킨 아미노산의 부분배열이 당해 A와 당해 B의 전체 아미노산의 어느 부분에 위치하고 있는가를 위치표시수단(h)에 의해 표시할 수도 있다. 더욱이, 입체구조계산/기억표시수단(i)에 의해, 당해 A와 당해 B의 입체구조를 나타내고 A와 B와의 사이에 얼라인먼트시킨 부분도 표시할 수 있다. 또한, 이들 수단(a)∼(l)이외에도, 그 장치는 도 5에도 예시된 것과 같이 키보드(m), 및 제어수단(n), 출력수단(o) 등을 구비한 것일 수 있다.
상기 단백질간 상호작용의 예측방법 또는 상기 예측장치는 또한, 특정 단백질 혹은 폴리펩타이드(A)와 단백질 혹은 폴리펩타이드(B)와의 단백질간 상호작용을 조정하는 신규화합물을 선별하는 방법으로 사용될 수 있다. 상기 단백질 혹은 폴리펩타이드(A)와 단백질 혹은 폴리펩타이드(B)와의 단백질간 상호작용을 조정하는신규화합물을 선별하는 방법은 중점을 둔 올리고펩타이드의 아미노산 배열의 정보를 기초로 행해진다. 선택된 올리고펩타이드의 아미노산 배열 혹은 그와 상동인 올리고펩타이드의 아미노산 배열 또는 그 아미노산 배열 혹은 상동인 아미노산 배열을 함유한 폴리펩타이드는, 그것이 A와 B와의 단백질간 상호작용에 의해 조정기능을 발휘할 가능성이 있다. 예를 들면 A에 대해서 수용체(receptor) 기능을 갖는 B가 존재하는 경우에는, 상기 수법에 의해 선별된 올리고펩타이드는 A와 B의 단백질간 상호작용에 대하여 길항성을 가질 가능성이 높다. 또는, 예를 들면 A가 B와의 상호작용에 의해 활성화되는 경우에는 상기 수법에 의해 선별된 올리고펩타이드는 길항제(agonist)로서의 기능을 가질 가능성이 높다.
구체적으로는 하기 실시예에서 상술하는 바와 같이, 본 발명에 의해 상호작용하는 것으로 예측되고 또한 실험적으로 그 상호작용이 확인된 VT Ⅱ와 Bcl-2가 공유하는 서열목록 1에 기재된 올리고펩타이드 NWGRI는, VT Ⅱ와 Bcl-2와의 상호작용에 의한 복합체 형성을 저해하고 더욱이 VT Ⅱ에 의한 세포사 유도를 억제한다는 것 또한 실험적으로 확인되었다. 이로부터, NWGRI 올리고펩타이드는 VT Ⅱ에 의한 세포사 유도가 관계하는 질병을 조절하는 약제로서, 예를 들어 VT Ⅱ를 갖는 대장균 O157로 인하여 발생하는 질병의 치료약, 보다 구체적으로는 항세포사제로서 사용할 수 있는 가능성이 있다는 것을 알 수 있다. 또한, 당해 아미노산 배열과 상동인 아미노산 배열을 갖는 올리고펩타이드에 있어서, VT Ⅱ와 Bcl-2와의 상호작용을 조정하는 기능을 갖는 올리고펩타이드 또는 당해 아미노산 배열 혹은 당해 아미노산 배열과 상동인 아미노산 배열을 함유하는 폴리펩타이드로서, VT Ⅱ와 Bcl-2와의 상호작용을 조정하는 기능을 갖는 폴리펩타이드도 VT Ⅱ에 의한 세포사 유도가 관계하는 질병을 조절하는 약제로서 사용할 수 있다. 더욱이, 이들 올리고펩타이드 및 폴리펩타이드를 이용하여 VT Ⅱ와 Bcl-2와의 상호작용을 조정하는 기능을 갖는 신규화합물을, 신약설계(drug design) 또는 공지의 스크리닝(screening)법을 적용하는 것에 의해 얻을 수도 있다.
이와 같이 본 발명의 하나의 태양인 상기 선별방법에 의해 얻어진 올리고펩타이드의 정보를 기초로 하여 신약 설계된 신규화합물은 특정의 단백질 혹은 폴리펩타이드(A)와 단백질 혹은 폴리펩타이드(B)와의 단백질간 상호작용을 조정하는 기능을 갖는다. 즉, 자체 공지의 신약설계 수법에 의한 상기 선별방법을 통해 얻어진 올리고펩타이드의 유도체 및 당해 올리고펩타이드와 상동인 구조를 갖는 저분자 화합물이, 상기 A와 상기 B와의 단백질간 상호작용을 예측하는 방법에 의해 구축되는 것이다.
또한, 상기 예측방법은 특정의 단백질 혹은 폴리펩타이드(A)와 단백질 혹은 폴리펩타디드(B)와의 단백질간 상호작용에 관련된 올리고펩타이드를 암호화하는 올리고뉴클레오티드의 배열을 결정하는 방법으로서도 더없이 유용하고, 그 정보를 기초로 치환, 결실, 부가, 삽입 혹은 유도변이 등의 자체공지의 방법을 응용함으로써 유용한 올리고뉴클레오티드를 얻는 것이 가능하게 된다. 상술한 과정을 통하여 얻어진 올리고뉴클레오티드는 상기 A와 상기 B와의 단백질간 상호작용을 유전자 레벨에서 조절하기 위한 화합물을 얻기 위하여 사용할 수 있다. 예를 들면, 단백질간 상호작용을 억제하기 위한 안티센스 올리고뉴클레오티드(antisenseoligonucleotide) 등의 구축에 이용할 수 있으며, 또한 얻어진 올리고뉴클레오티드는 단백질간 상호작용이 관계하고 있는 질병에 있어서, 그 진단에 사용되는 것도 가능하다.
또한, 본 발명의 한 태양은, 단백질간 상호작용의 예측방법 혹은 예측장치에 의해 얻어진 단백질간 상호작용이 존재하는 것으로 예측된 인간 유래 단백질의 조합군일 수 있다. 당해 단백질 조합군은 카탈로그화 및 데이터베이스화하여 제공할 수 있다. 이러한 단백질간 상호작용을 갖는 단백질의 조합군으로부터, 질병에 관여할 가능성이 있는 기지의 단백질 정보를 기초로 질병에 관여하는 단백질간 상호작용이 존재하는 것을 선별하는 방법을 통하여, 질병에 관여하는 단백질간 상호작용을 갖는 단백질의 조합군을 얻을 수 있다. 이들을 카탈로그화 및 데이터베이스화시켜 제공될 수 있다. 이들 단백질의 조합은 질병을 치료 또는 예방하기 위한 약제로서, 혹은 약제를 얻기 위한 수단으로서 유용하다. 예를 들어 얻어진 단백질의 조합을 이용하여, 두 단백질간의 상호작용을 조정할 수 있는 화합물을 공지의 스크리닝 방법을 이용하여 탐색하는 것도 가능하다.
단백질간 상호작용을 갖는 두 단백질의 조합에서도, 특히 한 쪽의 단백질이 단백질 작동 기능을 갖는 효소이고 다른 한 쪽이 단백질을 절단하는 경우, 상기 단백질간 상호작용의 예측방법 또는 예측장치에 의해 그 절단된 단백질의 프로세싱 부위의 예측을 수행할 수 있다.
구체예로서 하기 실시예에 나타낸 바와 같이, 아밀로이드 전구 단백질과 그 작동에 관계하는 효소와의 상호작용 및 폰 빌레브란트 인자 전구 단백질과 그 작동관여하는 퓨린(furin)과의 상호작용을 예측하는 것이 가능하다. 즉, 상기 단백질간 상호작용의 예측방법 또는 예측장치는 전구 단백질이 절단되어 성숙 단백질로서 기능하는 경우에 있어서의 절단부위의 예측을 가능하게 한다. 이와 같이, 단백질간 상호작용을 예측할 수 있게 됨에 따라, 종래 알려져 있지 않았던 질병에 관여하는 단백질 작동 기능을 갖는 효소 및 당해 효소에 의해 절단된 단백질을 얻는 것이 가능하게 된다.
본 발명의 이점, 특징 및 가능한 적용범위에 대해서는 예시적인 실시형태를 참조하여 아래에 더욱 상세하게 기재하지만, 본 발명이 아래의 예에 의해 한정되는 것은 아니다. 또한, 본 실시예에 있어서는 단백질 데이터베이스로 SWISS-PROT version 35를 사용하였지만, 이외의 다른 단백질 데이터베이스 등을 사용할 수도 있다.
실시예 1
도 1은 단계(1)의 실시예로서, 대장균 O157:H7의 베로독소 2(VT Ⅱ)의 아미노 말단에서부터 최초의 20잔기분[도 1의 (a)]에 대하여 아미노산 배열 길이가 5개인 올리고펩타이드(oligopeptide)로 분해한 것[도 1의 (b)]이다. 또한, 도 1의 (c)는 베로독소 2(VT Ⅱ)의 아미노 말단으로부터 최초의 20 잔기분을 아미노산 배열 길이가 6개인 올리고펩타이드로 분해한 것이다.
실시예 2
상기 단백질간 상호작용 예측방법에 관한 단계(4)에 있어서, 단백질 혹은 폴리펩타이드(polypeptide)간 상호작용의 예측을 위한 지표로서, 단백질 혹은 폴리펩타이드의 데이터베이스로 중의 아미노산의 빈도 및 올리고펩타이드의 빈도를 통하여 계산된 수치를 이용한다. 여기서는 그 실험예로서, 도 4에 도시되어 있는 대장균 유전체로 암호화된 전 단백질 중에서의 아미노산 빈도로부터 계산된 올리고펩타이드의 특이성을 얻는다. 20 종류의 아미노산의 대장균 유전체로 암호화된 전 단백질 중에서의 출현빈도[도 4의 (a)]로부터, 각 아미노산 ai의 조성비율 Ai는 도 4의 (b)와 같게 된다.
이제, 특이성을 구하고자 하는 올리고펩타이드가 a1a2a3a4a5인 경우, 이 올리고펩타이드의 특이성은 A1×A2×A3×A4×A5로 계산된다. 예를 들면, 올리고펩타이드가 KCILF인 경우에는 4.406610×1.1706087×6.004305×10.639652×3.898962×10-10으로 계산된다. 또한, 올리고펩타이드 LLLLL의 특이성은 136344.34×10-10, 올리고펩타이드 CCCCC의 특이성은 2.20×10-10으로 계산된다.
이 실시예에 있어서 특이성은 숫자가 작을수록 그 특이성이 높다. 아미노산 배열 길이가 5개인 올리고펩타이드 중에서 가장 특이성이 높은 것은 올리고펩타이드 CCCCC이고, 이 올리고펩타이드는 대장균 유전체로 암호화된 전단백질 중에서는 출현하지 않는다. 이와 반대로 가장 특이성이 낮은 것은 올리고펩타이드 LLLLL이다.
단계(1)에서, 단백질 혹은 폴리펩타이드(A)를 올리고펩타이드로 분해한 경우, 올리고펩타이드의 길이가 길수록 그 올리고펩타이드의 특이성은 높아진다.
실시예 3
상기 단백질간 상호작용 예측방법의 단계(4)에 있어서, 단백질 또는 폴리펩타이드간 상호작용을 예측하기 위한 지표로서 로컬 얼라인먼트(local alignmnet)의 결과를 이용하지만, 여기서는 그 실시예로서 Gotoh의 방법(Gotoh, O., Pattern matching of biological sequences with limited storage, Comput. Appl. Biosci. 3,17-20, 1987)에 의한 부분배열의 얼라인먼트의 스코어(score)를 사용한 경우를 든다. 또한, 아래의 본 실시예에서는 스코어가 25.0 이상인 경우에는 단백질 혹은 폴리펩타이드(A)와 단백질 혹은 폴리펩타이드(B)와의 사이에 아미노산 부분배열이 얼라인먼트된 것으로(상동인 것으로) 되었다.
단백질 혹은 폴리펩타이드(A)와 단백질 혹은 폴리펩타이드(B)와의 사이에서, m개의 아미노산 부분배열이 얼라인먼트시켜 그들의 스코어는 Si(1≤i≤m)로, B의 아미노산 배열의 길이는 LB로 한다. 이러한 로컬 얼라인먼트의 결과로부터 계산된 A와 B의 사이에서의 상호작용의 예측을 위한 지표는 sum(Si)/LB로 정의한다. 이 지표는 높을수록 상호작용이 강한 것으로 평가된다.
실시예4 : VTⅡ와 Bcl-2와의 상호작용 예측
대장균 O157:H7의 베로독소 2(VT Ⅱ)는 사람에게 식중독이나 신장장해를 유발시키지만, 그 작용 기작은 잘 알려져 있지 않다(Sandvig, K., et al., Exp. Med. Biol. 412, 225-232, 1997; Paton, JC., and Pateon, AW., Clin. Microbiol. Rev. 11, 450-479, 1998). 또한, 이 단백질은 독성을 갖는 단백질이기 때문에, 세포사에 관계하는 사람의 단백질은 이 단백질과 상호작용하는 단백질일 것으로 예상될 수 있다. 따라서, 이 단백질과 상호작용할 수 있는 사람의 단백질을 단백질 데이터베이스 SWISS-PROT version 35 중에서, 그 검색범위를 세포사에 관계하는 사람의 단백질로 제한하여 검색하고, 이들이 실제로 상호작용하고 있는가를 확인하는 예를 아래에 나타낸다.
베로독소 2의 아미노산 배열 길이 5개인 올리고펩타이드로서 세포사에 관계하는 사람의 단백질과 공유되는 것은, 도 6의 검색결과가 나타내는 바와 같이 SWISS-PROT version 35에 있어서는 LCLLL, QRVAA, EFSGN, NWGRI의 4개이다.(도 6에서는 사람의 단백질은 SWISS-PROT version 35의 단백질 ID로 표시하고 있다.) 이들 올리고펩타이드의 특이성을 도 4에 나타낸 대장균 유전체로 암호화된 전 단백질 중에서의 아미노산 빈도를 이용하여 계산하면, LCLLL의 특이성은 15001.03×10-10이고, 또한 QRVAA, EFSGN, NWGRI에 있어서 각각의 특이성은 15584.55×10-10, 3801.65×10-10, 1479.85×10-10이 된다. 따라서, 이들 4개의 올리고펩타이드 중에서 가장 특이성이 높은 것은 NWGRI임을 알 수 있다.
올리고펩타이드 NWGRI는 베로독소 2와 Bcl-2, Bcl-xL, MCL-1의 3개의 사람 단백질과의 사이에서 공유되어 있다. 베로독소 2(VT Ⅱ)와 Bcl-2, Bcl-xL, MCL-1에서 로컬 얼라인먼트를 실행하였더니, 그 결과는 각각 도 7, 8, 9와 같이 나타났으며, 부분적으로 아미노산 배열 상에서 상동성을 갖는 것을 알 수 있었다. 그래서, 실시예 3과 같이 로컬 얼라인먼트 스코어의 합계치를 각 단백질의 길이로 나눈 지표를 계산하면,
Bcl-2 : (30.0+27.0+25.0)/239=0.343
Bcl-xL : (30.0+29.0+27.0)/233=0.369
MCL-1 : (34.0+30.0+28.0+26.0)/350=0.337
이 된다.
이들 3개의 단백질 중에서 Bcl-2와 Bcl-xL은 동족을 구성하고 있기 때문에, Bcl-2 및 Bcl-xL과 MCL-1과의 사이에서 어느 편이 베로독소와 상호작용이 용이한가에 대하여 판단한 결과, 상기 방법에서는 이러한 로컬 얼라인먼트로부터 계산된 지표를 기초로 Bcl-2 및 Bcl-xL인 것으로 판명되었다.
대장균 O157:H7의 베로독소에는 베로독소 2 외에도 베로독소 1(VT Ⅰ)이 동형(isoform)으로서 존재한다. 베로독소 1의 독성은 베로독소 2에 비해 약하여 베로독소 2의 50분의 1 정도이다(Tesh, VL., et al., 1993, Infect. Immun. 61,3392-3402). 단백질 데이터베이스 SWISS-PROT version 35에 있어서, 베로독소 1과 아미노산 길이가 5개인 올리고펩타이드를 공유하는 세포사에 관계하는 사람의 단백질은 P2X1_HUMAN이고, 그 공유된 올리고펩타이드는 SSTLG이다. 그러나, 이 올리고펩타이드 SSTLG의 특이성은 도 4에 도시된 대장균 유전체로 암호화된 전단백질 중에서의 아미노산 빈도를 이용하여 계산하면, 14385.63×10-10이고 NWGRI와 비교해 특이성은 약 10배 낮다.
또한, 베로독소 1에 있어서 베로독소 2의 아미노산 배열길이가 5개인 올리고펩타이드 NWGRI에 대응하는 올리고펩타이드는 NWGRL이지만, 이의 특이성은 도 4로부터 2622.30×10-10이고 NWGRI에 비해 낮다. Bcl-2 및 Bcl-xL도 아미노산 배열길이 4개인 올리고펩타이드 NWGR을 베로독소 1과 공유하고 있지만, NWGRI와 NWGRL의 특이성을 비교해 보면 Bcl-2 및 Bcl-xL은 베로독소 1보다도 베로독소 2에 강하게 상호작용하는 것으로 예측된다. 또한, 베로독소 1과 Bcl-2 또는 Bcl-xL과의 로컬 얼라인먼트의 결과(도 10)로부터 계산된 지표도 각각 (27.0×26.0)/239=0.222, 26.0/233=0.112(NWGR 부분 이외의 상동인 아미노산 부분배열은 없다)이 되어, 베로독소 1과 Bcl-1 또는 Bcl-xL과의 상호작용은 베로독소 2와 Bcl-1 또는 Bcl-xL과의 상호작용보다도 상당히 약한 것으로 판단된다.
실시예 5 : VTⅡ와 Bcl-2와의 상호작용예측의 실험적 확인
실시예 4에서 베로독소 2와 사람의 Bcl-2 또는 Bcl-xL이 상호작용한다고 하는 예측은 확실도가 높은 것으로 평가되었다. 이러한 예측결과를 기초로 베로독소 2와 Bcl-2가 실제로 상호작용하는 것인가를 실험적으로 확인하였다(도 11의 (a) 및 도 11의 (b) 우도]. 실험적으로는 사람의 간장암세포(본래 Bcl-2 유전자를 발현하지 않는다) HepG2 및 그 세포에 Bcl-2 발현벡터를 도입하여 Bcl-2를 발현하도록 한 세포 B10에 관하여, 베로독소 2(VT Ⅱ)를 작용시켜, 항 Bcl-2항체(Bcl-2 IPs) 및 항 VT Ⅱ항체(VT Ⅱ IPs)를 이용하여 자체공지의 방법으로 공면역침강을 수행하였다.
도 11의 (a) 좌도는 공면역침강 후의 항 Bcl-2항체를 사용하여 웨스턴 블롯(western blot) 분석한 결과이고, 도 11의 (a) 우도는 항 VT Ⅱ항체를 이용하여 웨스턴 블롯 분석한 결과이다. 이들 도면으로부터 B10 세포에 있어서 VT Ⅱ와 Bcl-2와의 복합체가 공면역침강하고 있는 것, 즉 이들 2개의 단백질이 상호작용하고 있는 것을 확인할 수 있었다. 또한, B10 세포에 베로독소 1(VT Ⅰ) 혹은 베로독소 2(VT Ⅱ)를 작용시킴으로써, 세포 내의 어떤 부분(fraction)으로부터 이들 단백질이 검출되는가를 항 VTⅠ항체 및 항 VTⅡ항체를 이용하여 확인하였다. 세포사에는 미토콘드리아에 있는 Bcl-2가 매우 중요한 역할을 하고 있지만, 베로독소 2(VT Ⅱ)는 미토콘드리아 단편에서도 검출된다[도 11의 (b) 좌도].
한편, 베로독소 1은 미토콘드리아 Bcl-2과는 강한 상호작용을 나타내지 않는데, 이는 미토콘드리아 단편으로부터 이 단백질이 검출되지 않는 것으로부터 실험적으로도 증명되었다. 도 11의 (b) 좌도에 그 결과를 나타내었다.
실시예6
베로독소 2(VT Ⅱ)와 Bcl-2의 아미노산 배열의 전체 길이를 나타내고, 얼라인먼트시킨 부분의 배열이 전체 길이 상에서 어느 부분에 위치하는가를 표시한 실시예를 도 12에 나타내었다.
실시예 7
Bcl-xL의 입체구조는 알려져 있고, 단백질 입체구조 데이터베이스 PDB에 그 구조가 등록되어 있다. 이 구조를 기초로 Bcl-xL의 입체구조 상에서 베로독소 2와 부분 아미노산배열이 상동인 부분을 도 8의 로컬 얼라인먼트의 결과에 기초하여 도 13에 굵은 선으로 나타내었다.
실시예 8
베로독소 2는 현재까지 리보솜 RNA의 일부를 절단함으로써 단백질 합성을 정지시켜, 그 독성을 발휘하는 것으로 생각되어 왔다. 리보솜 RNA의 일부를 절단하는 리신(ricin)이라고 하는 단백질의 입체구조가 단백질 입체구조 데이터베이스 PDB에 등록되어 있어서, 그 구조를 기초로 베로독소 2의 호몰로지 모델링을 실행하여 모델 입체구조 상에서 Bcl-xL과 상동인 아미노산 부분배열의 구조를 도 8의 로컬 얼라인먼트의 결과에 기초하여 도14에 굵은 선으로 나타내었다.
실시예 9 : VTⅡ에 의한 세포사 유도의 NWGRI에 의한 제어
다음으로, 실시예 4에서 발견된 VT Ⅱ와 Bcl-2가 공유하고 있는 올리고펩타이드인 NWGRI가 VT Ⅱ와 Bcl-2와의 상호작용을 조정할 수 있는 것을 실험적으로 확인하였다. 우선, 실시예 5에서 사용한 Bcl-2를 발현하는 B10 세포의 추출물과, 비오틴화한 VT Ⅱ와의 복합체 형성을 NWGRI 올리고펩타이드의 존재하에서 수행한 후, 파-웨스턴 블롯법(Far-Western blotting analysis)을 이용하여 해석하였다. NWGRI 올리고펩타이드는 농도의존적으로 VT Ⅱ와 Bcl-2와의 복합체 형성을 저해하였다. 또한, B10세포를 NWGRI 올리고펩타이드 0, 10, 50, 100uM로 전처리하고, 10ng/mL의 VT Ⅱ와 함께 24시간 처리한 후 아폽토시스(apoptosis)에 의한 세포사 유도를 측정하였다. 합계 약 5000개의 핵을 Hoechst 3342/PI(Propidium iodide)법으로 염색하고, 그 중에서 아폽토시스를 일으킨 핵의 비율을 도 15에 나타내었다. 도시된 바와 같이, VT Ⅱ 단독처리한 경우에는 약 85%의 세포가 아폽토시스에 의한 세포사를 일으키는 데 반하여, NWGRI 올리고펩타이드로 전처리한 경우에는 NWGRI 올리고펩타이드에 농도 의존적으로 세포사의 유도가 억제되었다. 이로부터, VT Ⅱ와 Bcl-2가 공유하고 있는 올리고펩타이드인 NWGRI는 VT Ⅱ와 Bcl-2와의 상호작용을 억제하여 그들에 의한 복합체 형성을 저해하고, 그 결과 VT Ⅱ에 의한 세포사 유도를 억제하는 것이 확인되었다.
실시예 10 : CD 4/gp 120 HIV 1
사람 에이즈 바이러스 HIV 1은 헬퍼 T세포에 감염한다. 이 때 바이러스 표면의 단백질 gp 120이 헬퍼 T세포의 표면 단백질 CD 4에 결합하는 것이 이 세포에의 감염의 제 1단계로서 중요한 단계인 것으로 알려져 있다. 본 실시예에서는, gp 120과 CD 4의 결합이 상기 예측방법으로 예측될 수 있는가를 확인하였다. 단백질 CD 4의 아미노산 배열을 길이 5개인 올리고펩타이드로 분해하고, 차례차례 CD 4 유래 올리고펩타이드의 아미노산 배열을 갖는 단백질을 단백질 데이터베이스 중에서 검색하면, SLWDQ라는 올리고펩타이드를 공유하는 단백질로서 gp 120이 추출된다[도 16의 (a)]. 올리고펩타이드 SLWDQ는, SWISS-PROT version 35 중에서 사람의 단백질로서는 단백질 CD 4에만 존재하는 것으로서, 사람의 단백질 중에서는 빈도가 1이어서 그 특이성이 대단히 높다. 또한, 이 올리고펩타이드 이외에도 국소적으로 상동성이 높은 영역이 존재한다[도 16의 (b)]. CD 4측에서 gp 120과 결합할 때에, 이 올리고펩타이드 SLWDQ의 N 말단 바로 인근의 아미노산 잔기인 아르기닌(Arg) 및 67-SFLTKGP-73이 중요한 역할을 하고 있는 것으로 알려져 있다(Kwong, PD. et al., Nature, Vol. 398, 648-659, 1998). 따라서, gp 120과 CD 4의 결합은 알려져 있지 않았던 것으로서 상기의 예측방법에 의해 예측할 수 있었다.
실시예 11 : CED-4/MAC-1
선충(Caenorhabditis elegans: C. elegans)는 전 유전체 정보가 규명된 최초의 다세포 생물이다. 이 C. elegans에 대한 하나의 실시예를 여기에 나타냈다. 단백질 CED-4는 프로그램 세포사의 제어에 중심적인 역할을 한다. MAC-1은 CED-4에 결합하고, 세포사를 억제하는 단백질로 알려져 있다(Wr et al., Development, vol. 126, 9, 2021-2031, 1999). 따라서, MAC-1과 CED-4의 결합은 이미 알려져 있지만, 본 발명의 검증을 위하여 이들 두 개의 단백질간에서의 올리고펩타이드의 공유성을 조사하였다. 그 결과, MAC-1과 CED-4는 길이 5개인 올리고펩타이드 FPSVE를 공유하는 것을 판명함으로써, 본 발명이 검증되었다. C. elegans 유전체 중에서 아미노산의 빈도로부터 계산된 이 올리고펩타이드의 지수는 5.436이다. 또한, 도 17에 도시한 바와 같이, 두 단백질간에는 상동인 부분영역이 많은 데 이는 이들 단백질간의 결합성을 강하게 시사하는 것이다(위쪽의 배열이 CED-4, 아래쪽의 배열이 MAC-1).
실시예12 : APP/BASE
APP(amyloid precursor protein: 아밀로이드 전구 단백질)는 알츠하이머병의 원인 단백질의 하나이고, 이 단백질이 두 부분에서 절단됨으로써 알츠하이머병의 원인이 되는 아밀로이드가 생성된다. 이 두 부분의 절단부위 중에서, 아미노 말단 측을 절단하는 효소(BASE: bata secretase)가 최근 발견되었다(VASSAR dt al., Science, 286(5440), 735-741, 1999). BASE에 의한 APP의 절단은 이들 두 개의 단백질간에 상호작용이 존재하는 것을 의미한다. 그래서, 본 발명의 검증을 위하여 두 단백질 APP와 BASE에 대하여 올리고펩타이드의 공유성을 조사하였다. APP와 BASE는 상동성이 높은 아미노산 5개인 올리고펩타이드 WYFDV와 WYYEV를 공유하고 있다. 올리고펩타이드 WYFEV는, SWISS-PROT version 35 중에서 인간 단백질로서는 단백질 APP에만 존재하는 것이고, 또한 WYYEV를 갖는 인간 단백질은 등록되어 있지 않기 때문에 두 단백질 모두 특이성이 대단히 높다. 이 결과에 의해, 본 발명이 검증되었다. 도 18에 두 단백질간 상동인 부분영역을 도시한다(위쪽의 배열이 APP, 아래쪽의 배열이 BASE).
실시예 13 : 퓨린과 폰 빌레브란트 인자
퓨린은 세포 내 세린 프로테아제이고, 폰 빌데브란트 인자(VWF), 알부민, 보체 C3 등의 분비계의 경로(Pathway)에 관계하고 있다. 여기서는 실시예로서 퓨린과 VWF와의 상호작용의 예를 든다. VWF는 퓨린에 의해 전구 단백질로부터 절단되어 성숙 단백질로서 기능하게 된다. 퓨린에 의한 VWF 전구 단백질의 절단에는, 이들 두 개의 단백질간의 상호작용이 필요하다. 또한, 퓨린 자신도 퓨린의 전구 단백질이 절단됨으로써 성숙 단백질이 되어 프로테아제로서 기능하게 되는 것이다. 따라서, 본 발명의 검증을 위하여, 퓨린 전구 단백질과 VWF 전구 단백질간의 올리고펩타이드의 공유성을 조사하였다. 두 단백질은 올리고펩타이드 HCPPG를, 퓨린 전구 단백질에서는 613-617의 위치에, VWF 전구 단백질에서는 1176-1180의 위치에 가지고 있다[도 19의 (a)]. 어느 위치나 성숙 단백질의 영역 내인 것이다. 올리고펩타이드 HCPPF는 SWISS-RPOT version 35에서 인간 단백질로서는 퓨린 전구 단백질 및 VWF 전구 단백질에만 공유되어 있는 것으로서, 빈도의 관점에서 그 특이성을 평가할 때 대단히 높다. VWF 전구 단백질은 퓨린에 의해 아미노산 잔기의 위치 상 763과 764의 사이 부분이 절단된다. 퓨린 전구 단백질과 VWF 전구 단백질의 사이에 로컬 얼라인먼트를 실행한 결과, 퓨린에 의한 VWF 전구 단백질의 절단위치의 인접영역은, 퓨린 전구 단백질과 상동성이 높은 부분영역인 것을 알 수 있었다[도 19의 (b)]. 즉, 활성부분 모티프(motif)로부터 신규단백질이 프로테아제라는 것을 알 수 있을 뿐만 아니라, 상대 단백질 나아가서는 상대 단백질에서의 절단위치의 예측을 가능하게 하는 것이다.
실시예14 : APP와 PC7
APP 알파는 아밀로이드 전구 단백질(amyloid precursor protein: APP)이 아밀로이드를 생성하는 2 부분의 절단부위는 다른 장소에서 절단되어 생성되는 펩타이드이다. PC7(proprotein convertase subtilisin/kexin type 7)이 APP 알파를 생성하기 위한 절단에 관여하는 것이 최근 발견되었다(Lopez-Perez E et al., J. Neurochem., vol. 73, 5, 2056-2062, 1999). 그래서, 두 단백질 APP와 PC7에 대해서 올리고펩타이드의 공유성을 조사하였더니, APP와 C7은 상동성이 높은 길이 6개인 올리고펩타이드 DSDPSG와 DSDPNG를 공유하고 있었다. 올리고펩타이드 DSDPSG는 SWISS-PROT version 35 중에서 사람의 단백질로서는 단백질 APP에만 존재하는 것이며, 또한 DSDPNG를 갖는 사람의 단백질은 미등록이어서, 두 올리고펩타이드는 특이성이 매우 높은 것이다. 이 결과에 의해, 본 발명이 검증되었다. 도 20에 APP의 687-KLVFFAEDVGS-6978의 K와 L의 사이가 APP 알파를 생성하기 위한 절단부위이고, 이와 상동인 부분배열(359-RMPFYAEECAS-369)이 PC7에 존재하는 것을 나타내었다. 즉, 본 실시예는 단백질의 절단에 관여하는 단백질을 본 발명에 따라 예측하는 것이 가능하다는 것을 보여주는 것이다.
이상 상세하게 설명한 바와 같이, 본 발명에 의하면 유전체 해석 및 cDNA 해석에 의해 얻어진 기능이 알려지지 않은 단백질 또는 기능이 알려진 단백질이 상호작용하는 상대 단백질에 대해서, 단백질 데이터베이스를 이용한 예측이 가능하게되었다. 즉, 최근 발달해 온 유전체 해석 및 cDNA 해석에 기초한 단백질 데이터베이스를 이용하여, 유전체 정보를 판명한 하나의 생물에서 단백질간의 상호작용의 예측을 계산기상으로 수행할 수 있게 되었다. 계산기상에서의 예측을 가능하게 하기 위해서, 투-하이브리드(two-hybrid)법과 같이 사용하는 cDNA 라이브러리에 결과가 의존하는 불확실성이 높은 수법을 사용하지 않고도, 계산기상에서의 예측에 기초하여 상호작용하는 것으로 예측된 단백질에 관한 정보를 간편하게 얻을 수 있다. 이러한 예측이 가능하게 됨에 따라, 상호작용에 관여하는 올리고펩타이드의 배열이 용이하게 추정될 수 있고, 이러한 정보에 기초하여 신규한 단백질간의 상호작용의 조정기능을 갖는 화합물의 신약설계(drug design)도 가능하게 되었다. 본 발명에 의해 단백질간 상호작용을 해명하기 위한 실험의 효율성이 매우 향상되어, 생화학, 분자생물학, 의약품개발, 농업, 생물공학 등의 각종 분야에서 폭 넓게 이용될 수 있게 되었다. 특히 의약품 개발에 있어서는, 지금까지 알려져 있지 않았던 질병의 메커니즘을 예측하는 것이 가능하게 되어 새로운 의약품이 탄생할 가능성을 부여하게 되었다.

Claims (30)

  1. 특정의 단백질 혹은 폴리펩타이드(A)와 상호작용하는 단백질 혹은 폴리펩타이드(B)를 예측하는 방법에 있어서,
    (1) A의 아미노산 배열을 특정 길이를 갖는 다수 개의 올리고펩타이드에 배열정보로서 분해하고,
    (2) 상기 각 올리고펩타이드의 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(C), 또는 상기 올리고펩타이드의 아미노산 배열과 상동인 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(D)를 단백질 혹은 폴리펩타이드의 아미노산 배열의 데이터베이스에서 검색하고,
    (3) 상기 A와 검출된 C 또는 D와의 사이에서 아미노산 배열에 대한 로컬 얼라인먼트(local alignment)를 실행하고,
    (4) 로컬 얼라인먼트의 결과 및 단백질 혹은 폴리펩타이드의 아미노산 배열의 데이터베이스에 있어서 아미노산의 빈도 또는 올리고펩타이드의 빈도로부터 계산된 수치를 지표로 하여, 검출된 C 또는 D를 A와 상호작용하는 단백질 혹은 폴리펩타이드(B)인 것으로 예측하는 것을 특징으로 하는 단백질간 상호작용의 예측방법.
  2. 제 1항에 있어서, 상기 올리고펩타이드의 아미노산 배열의 길이가 아미노산 4∼15개인 것을 특징으로 하는 단백질간 상호작용의 예측방법.
  3. 특정 단백질 혹은 폴리펩타이드(A)와 상호작용하는 단백질 혹은 폴리펩타이드(B)를 예측하는 방법에 관한 프로그램을 담지하는 기록매체에 있어서, 적어도 아래의 (a)부터 (f)의 수단을 구비하는 것을 특징으로 하는 단백질간 상호작용의 예측 프로그램을 담지하는 기록매체;
    (a) A의 아미노산 배열정보를 입력하고 기억하는 수단과,
    (b) 이 정보를 특정 길이의 다수 개의 올리고펩타이드에 배열정보로서 분해하는 수단과, 그 결과를 배열정보로 기억하는 수단과,
    (c) 입력된 단백질 데이터 베이스를 기억하는 수단과,
    (d) 당해 기억된 단백질 데이터베이스에 액세스(access)하여, 상기 올리고펩타이드의 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(C), 또는 상기 올리고펩타이드의 아미노산 배열과 상동인 아미노산 배열을 갖는 단백질 혹은 폴리펩타이드(D)를 검출하는 수단과, 그 검출결과를 기억, 계산하는 수단과,
    (e) 상기 A와 검출된 C 또는 D와의 사이에서 로컬 얼라인먼트를 수행하는 수단과, 그 결과를 기억·계산하는 수단과,
    (f) 상기 로컬 얼라인먼트의 결과치 및 단백질 데이터베이스에 있어서의 아미노산의 빈도 또는 올리고펩타이드의 빈도의 결과치를 얻고, 그 결과치로부터 단백질간 상호작용을 예측하기 위한 지표를 제시하는 수단과, 그 결과를 기억하고 표시함으로써 A와 상호작용하는 B를 검출하는 수단.
  4. 제 3항에 있어서, 적어도 아래의 수단을 더 포함하는 것을 특징으로 하는 단백질간 상호작용의 예측 프로그램을 담지하는 기록매체;
    (g) 검출된 B가 다수인 경우, 로컬 얼라인먼트의 결과치 및 단백질 데이터베이스에 있어서 아미노산의 빈도 또는 올리고펩타이드의 빈도의 결과치로부터 계산된 지표에 기초하여 당해 검출된 다수 개의 B 중에서 단백질간 상호작용의 강도의 순위 매김을 수행하는 수단과, 그 결과를 기억, 표시하는 수단.
  5. 제 3항 또는 제 4항에 있어서, 적어도 아래의 수단을 더 포함하는 것을 특징으로 하는 단백질간 상호작용의 예측 프로그램을 담지하는 기록매체;
    (h) 로컬 얼라인먼트 기법에 의해 상기 A와 상기 검출된 B와의 사이에서 아미노산 부분배열간에 얼라인먼트하는 경우, 당해 A와 당해 B의 아미노산 배열의 전체 길이를 표시하고, 얼라인먼트된 부분배열이 전체 길이 상에서 어느 부분에 위치하는가를 표시하는 수단.
  6. 제 3항 내지 제 5항의 어느 한 항에 있어서, 적어도 아래의 수단을 더 포함하는 것을 특징으로 하는 단백질간 상호작용의 예측 프로그램을 담지하는 기록매체;
    (i) 상기 A 또는 상기 검출된 B의 입체구조가 알려져 있는 경우, 또는 호몰로지 모델링을 통해 입체구조 모델이 작성된 경우, 그 입체구조 모델을 계산하고, 그 입체구조 상에서 로컬 얼라인먼트에 의해 당해 A와 당해 B의 사이에 얼라인먼트시킨 아미노산 부분배열의 구조를 표시하는 수단.
  7. 제 3항 내지 제 6항의 어느 한 항에 있어서, 적어도 아래의 수단을 더 포함하는 것을 특징으로 하는 단백질간 상호작용의 예측 프로그램을 담지하는 기록매체;
    (j) 검색범위를 제한하기 위하여 단백질 데이터베이스 중에서 단백질을 분류하고, 기억하는 기능을 갖는 수단.
  8. 제 3항 내지 제 7항의 어느 한 항에 있어서, 적어도 아래의 수단을 더 포함하는 것을 특징으로 하는 단백질간 상호작용의 예측 프로그램을 담지하는 기록매체;
    (k) 단백질 데이터베이스의 각 단백질을 상기 A로서 순차적으로 입력하는 수단.
  9. 제 3항 내지 제 8항의 어느 한 항에 있어서, 적어도 아래의 수단을 더 포함하는 것을 특징으로 하는 단백질간 상호작용의 예측 프로그램을 담지하는 기록매체;
    (l) 유전체 데이터베이스를 기억하는 수단.
  10. 제 3항 내지 제 9항의 어느 한 항에 기재된 기록매체가 담지하는 수단을 구비한 단백질간 상호작용의 예측장치.
  11. 제 1항 또는 제 2항에 기재된 예측방법에 의해 특정 단백질 혹은 폴리펩타이드(A)와 상호작용하는 것으로 예측된 단백질 혹은 폴리펩타이드(B)를 얻고, 실험적으로 A와 B와의 사이에 상호작용이 존재하는 것을 확인하는 것을 특징으로 하는 상호작용을 갖는 단백질 혹은 폴리펩타이드의 특정방법.
  12. 제 10항에 기재된 예측장치에 의해 특정 단백질 혹은 폴리펩타이드(A)와 상호작용하는 것으로 예측된 단백질 혹은 폴리펩타이드(B)를 얻고, 실험적으로 A와 B와의 사이에 상호작용이 존재하는 것을 확인하는 것을 특징으로 하는 상호작용을 갖는 단백질 혹은 폴리펩타이드의 특정방법.
  13. 제 11항 또는 제 12항에 기재된 상호작용을 갖는 단백질 혹은 폴리펩타이드의 특정방법에 의해 특정된 단백질 혹은 폴리펩타이드.
  14. 제 1항 또는 제 2항에 기재된 예측방법을 이용하는, 특정 단백질 혹은 폴리펩타이드(A)와 단백질 혹은 폴리펩타이드(B)와의 단백질간 상호작용을 조정하는 화합물의 선별방법.
  15. 제 10항에 기재된 예측장치를 이용하는, 특정 단백질 혹은 폴리펩타이드(A)와 단백질 혹은 폴리펩타이드(B)와의 단백질간 상호작용을 조정하는 화합물의 선별방법.
  16. 제 14항 또는 제 15항에 기재된 선별방법에 의해 얻어진 신규화합물.
  17. 제 14항 또는 제 15항에 기재된 선별방법에 의해 얻어진 화합물 정보를 기초로 신약설계(drug design)하여 얻어지며, 특정 단백질 혹은 폴리펩타이드(A)와 단백질 혹은 폴리펩타이드(B)와의 단백질간 상호작용을 조정하는 기능을 갖는 신규화합물.
  18. 베로독소 2(VT Ⅱ)와 Bcl-2와의 상호작용을 조정하는 기능을 가지며, 서열목록 1에 나타낸 아미노산 배열을 갖는 올리고펩타이드.
  19. 서열목록 1에 나타낸 아미노산 배열을 갖는 올리고펩타이드를 함유하는 항세포사제.
  20. 제 18항에 기재된 올리고펩타이드의 아미노산 배열과 상동인 아미노산 배열을 갖는 올리고펩타이드에 있어서, VT Ⅱ와 Bcl-2와의 상호작용을 조정하는 기능을 갖는 올리고펩타이드.
  21. 제 18항 또는 제 20항에 기재된 올리고펩타이드의 아미노산 배열을 포함한 폴리펩타이드에 있어서, VT Ⅱ와 Bcl-2와의 상호작용을 조정하는 기능을 갖는 폴리펩타이드.
  22. 제 18항 또는 제 20항에 기재된 올리고펩타이드 또는 제 21항에 기재된 폴리펩타이드를 이용하는, VT Ⅱ와 Bcl-2와의 상호작용을 조정하는 기능을 갖는 화합물의 선별방법.
  23. 제 1항 또는 제 2항에 기재된 예측방법 또는 제 10항에 기재된 예측장치를 이용하는, 특정 단백질 혹은 폴리펩타이드(A)와 단백질 혹은 폴리펩타이드(B)와의 단백질간 상호작용에 관계하는 올리고펩타이드를 암호화하는 올리고뉴클레오티드 배열의 결정방법.
  24. 제 1항 또는 제 2항에 기재된 예측방법 또는 제 10항에 기재된 예측장치에 의해 얻어지며, 단백질간 상호작용이 존재하는 것으로 예측된 인간 유래 단백질의 조합군.
  25. 제 24항에 기재된 단백질 조합군으로부터, 질병에 관여할 가능성이 있는 기지의 단백질 정보를 기초로 하여 선택하는 것을 특징으로 하는 질병에 관여하는 단백질간 상호작용을 갖는 단백질의 조합군의 선택방법.
  26. 제 25항에 기재된 선택방법에 의해 선택된 질병에 관여하는 단백질간 상호작용을 갖는 단백질의 조합군.
  27. 제 26항에 기재된 조합군으로부터 선택된 특정 조합 또는 두 단백질의 상호작용을 조정하는 화합물을 선별하는 방법.
  28. 제 27항에 기재된 방법에 의해 얻어진 화합물.
  29. 제 1항 또는 제 2항에 기재된 예측방법 또는 제 10항에 기재된 예측장치를 이용하여 특정 단백질과 그 단백질을 절단하는 효소와의 단백질간 상호작용을 예측함으로써, 단백질의 작동부위를 예측하는 방법.
  30. 제 29항에 기재된 방법에 의해 얻어진 단백질 작동 부위 또는 당해 작동부위와 상동인 부분배열을 함유하는 것으로 예측된 아미노산 배열을 갖는 폴리펩타이드.
KR1020027011612A 2000-03-10 2001-03-09 단백질간 상호작용 예측방법 KR20020092377A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000072485 2000-03-10
JPJP-P-2000-00072485 2000-03-10
PCT/JP2001/001846 WO2001067299A1 (fr) 2000-03-10 2001-03-09 Procede servant a prevoir une interaction entre proteines

Publications (1)

Publication Number Publication Date
KR20020092377A true KR20020092377A (ko) 2002-12-11

Family

ID=18590885

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027011612A KR20020092377A (ko) 2000-03-10 2001-03-09 단백질간 상호작용 예측방법

Country Status (12)

Country Link
US (2) US20040121398A1 (ko)
EP (1) EP1271351A4 (ko)
JP (1) JP3588605B2 (ko)
KR (1) KR20020092377A (ko)
CN (2) CN1332976C (ko)
AU (3) AU2001241075B2 (ko)
CA (1) CA2402606A1 (ko)
EA (1) EA004002B1 (ko)
HK (1) HK1054446A1 (ko)
IL (1) IL151661A0 (ko)
NO (1) NO20024251L (ko)
WO (1) WO2001067299A1 (ko)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020028925A (ko) * 2002-01-08 2002-04-17 신환철 신약 개발을 위한 새로운 분자 설계방법
AU2003221052A1 (en) * 2002-03-29 2003-10-27 Celestar Lexico-Sciences, Inc. c-Jun PHOSPHORYLATION INHIBITORS
JP2003330934A (ja) * 2002-05-10 2003-11-21 Celestar Lexico-Sciences Inc 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体
JPWO2004002532A1 (ja) * 2002-06-28 2005-10-27 第一製薬株式会社 Mkk7活性化阻害剤
JPWO2004019983A1 (ja) * 2002-08-30 2006-01-19 第一製薬株式会社 糖代謝関連遺伝子の転写因子の分解方法、分解阻害方法および分解阻害剤
EP1607101A4 (en) * 2003-02-24 2007-10-24 Daiichi Seiyaku Co INHIBITOR OF DEGRADATION OF PROTEIN INTERACTING WITH HEPATITIS B VIRUS PROTEIN X
WO2004113523A1 (ja) * 2003-06-18 2004-12-29 Celestar Lexico-Sciences, Inc. Granzyme BとGolgin-160との相互作用阻害剤
WO2005051425A1 (ja) * 2003-11-26 2005-06-09 Daiichi Pharmaceutical Co., Ltd. プロカスパーゼ1活性化阻害剤
JPWO2005052150A1 (ja) * 2003-11-28 2007-12-06 第一製薬株式会社 インスリン遺伝子の転写調節方法
EP1840215A4 (en) * 2004-12-28 2008-03-26 Daiichi Seiyaku Co PROCESS FOR INHIBITING TELOMERASE ACTIVITY AND INHIBITOR
KR100853786B1 (ko) * 2006-07-12 2008-08-22 한국기초과학지원연구원 단백질 동정을 위한 단백질 데이터베이스의 재구성방법 및이를 이용한 단백질 동정 방법
JP4841396B2 (ja) 2006-10-18 2011-12-21 Necソフト株式会社 塩基配列の同定装置、核酸分子の二次構造取得装置、塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体
EP2000935A3 (en) * 2007-05-10 2012-07-18 F. Hoffmann-La Roche AG Method of processing protein peptide data and system
GB2455102A (en) * 2007-11-28 2009-06-03 Cambridge Entpr Ltd Protein Aggregation Prediction Systems
KR20110058789A (ko) * 2008-08-08 2011-06-01 유니버시티 오브 조지아 리서치 파운데이션 인코퍼레이티드 체액으로 분비될 수 있는 단백질을 예측하기 위한 방법 및 시스템
US20100217532A1 (en) * 2009-02-25 2010-08-26 University Of Delaware Systems and methods for identifying structurally or functionally significant amino acid sequences
CN102268485A (zh) * 2010-06-04 2011-12-07 上海聚类生物科技有限公司 一种利用文本挖掘进行病毒及人类蛋白相互作用的方法
WO2013165262A1 (en) * 2012-04-30 2013-11-07 Auckland Uniservices Limited Peptides, constructs and uses therefor
US20140180660A1 (en) * 2012-12-14 2014-06-26 Life Technologies Holdings Pte Limited Methods and systems for in silico design
CN106496301B (zh) * 2016-11-30 2020-06-23 吉林大学 一种Keap1 Kelch区多位点分子对接筛选食源性抗氧化寡肽的方法
CN107977548B (zh) * 2017-12-05 2020-04-07 东软集团股份有限公司 预测蛋白质间相互作用的方法、装置、介质及电子设备
EP3561703B1 (de) * 2018-04-25 2021-01-20 Bayer AG Identifizieren der paarung von variablen domänen aus leichten und schweren ketten von antikörpern
CN109801672A (zh) * 2018-11-16 2019-05-24 天津大学 多元互信息和残基结合能量蛋白质间相互作用预测方法
CN114181915B (zh) * 2021-08-30 2024-01-26 首都医科大学附属北京口腔医院 基于kdm2b序列合成的生物活性多肽在间充质干细胞神经分化和再生修复中的应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5789201A (en) * 1996-02-23 1998-08-04 Cocensys, Inc. Genes coding for bcl-y a bcl-2 homologue
JP3476310B2 (ja) * 1996-08-01 2003-12-10 富士通株式会社 蛋白質データベース・システム並びに蛋白質の名前および機能の表示方法
US5858669A (en) * 1996-09-13 1999-01-12 The Trustees Of Columbia University In The City Of New York Beclin, a novel bcl-2 interacting gene near BRCA1 on chromosome 17q21 and methods of use

Also Published As

Publication number Publication date
CA2402606A1 (en) 2001-09-13
EP1271351A1 (en) 2003-01-02
IL151661A0 (en) 2003-04-10
NO20024251D0 (no) 2002-09-06
CN1332976C (zh) 2007-08-22
AU2001241075B2 (en) 2006-08-10
AU4107501A (en) 2001-09-17
WO2001067299A1 (fr) 2001-09-13
CN1416549A (zh) 2003-05-07
JP3588605B2 (ja) 2004-11-17
US20040121398A1 (en) 2004-06-24
CN1660890A (zh) 2005-08-31
NO20024251L (no) 2002-11-05
EP1271351A4 (en) 2004-08-11
EA004002B1 (ru) 2003-12-25
HK1054446A1 (zh) 2003-11-28
EA200200961A1 (ru) 2003-02-27
US20060069519A1 (en) 2006-03-30
AU2006235817A1 (en) 2006-11-30

Similar Documents

Publication Publication Date Title
KR20020092377A (ko) 단백질간 상호작용 예측방법
Brister et al. OGlcNAcylation and phosphorylation have opposing structural effects in tau: phosphothreonine induces particular conformational order
Kasuya et al. Three-dimensional structure analysis of PROSITE patterns
Saunders et al. The role of apolipoprotein E in Alzheimer’s disease: pharmacogenomic target selection
JP2007137887A (ja) 独立下部構造分析を実行するためのコンピュータ・システムの操作方法
Kasperkiewicz et al. Design of a selective substrate and activity based probe for human neutrophil serine protease 4
Wollenhaupt et al. F2X-universal and F2X-entry: structurally diverse compound libraries for crystallographic fragment screening
Thusberg et al. Bioinformatic analysis of protein structure–function relationships: case study of leukocyte elastase (ELA2) missense mutations
Franco et al. Overlapping binding sites for trypsin and papain on a Kunitz‐type proteinase inhibitor from Prosopis juliflora
Heyne et al. Climbing Up and Down Binding Landscapes through Deep Mutational Scanning of Three Homologous Protein–Protein Complexes
Pozzi et al. Loop electrostatics asymmetry modulates the preexisting conformational equilibrium in thrombin
Ragan et al. Analysis of Mutually Exclusive Alternatively Spliced Serpin-1 Isoforms and Identification of Serpin-1 Proteinase Complexes in Manduca sexta Hemolymph [S]
Demon et al. Caspase substrates: easily caught in deep waters?
Huttinger et al. Deep mutational scanning of the plasminogen activator inhibitor-1 functional landscape
Lee et al. An analysis approach to identify specific functional sites in orthologous proteins using sequence and structural information: application to neuroserpin reveals regions that differentially regulate inhibitory activity
Desai et al. Heterogeneous distribution of genetic mutations in myosin binding protein-C paralogs
US20020120405A1 (en) Protein data analysis
Blackshear et al. Tandem CCCH zinc finger proteins in mRNA binding
JP2004203880A (ja) 蛋白質相互作用予測方法及び該予測プログラムを担持した記録媒体
Contreras-Moreira et al. Structural context of exons in protein domains: implications for protein modelling and design
Escobedo et al. Ghost interactions: revealing missing protein-ligand interactions using AlphaFold predictions
Falgarone Development and application of a new computational approach for prediction of amyloidogenicity in proteins
Wierbowski Protein Interaction Network Based Approaches to Characterize Protein Function, Molecularly Profile Genetic Variants, and Investigate Mechanisms Linked to Viral-host Pathology in SARS-CoV-2
Chon et al. A conserved electrostatic membrane‐binding surface in synaptotagmin‐like proteins revealed using molecular phylogenetic analysis and homology modeling
Kliche Exploring conditional motif-based protein interactions in health and disease

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application