KR101252649B1

KR101252649B1 - 암 관련 단백질 도메인을 발굴하는 방법

Info

Publication number: KR101252649B1
Application number: KR1020110010118A
Authority: KR
Inventors: 김학용; 이윤경; 유제운; 구자을; 박별나; 유재수; 박준호
Original assignee: 충북대학교 산학협력단
Priority date: 2011-02-01
Filing date: 2011-02-01
Publication date: 2013-04-09
Also published as: KR20120089034A

Abstract

본 발명은 암 관련 단백질 도메인을 발굴하는 방법에 관한 것으로서, 암 관련 단백질들을 단백질-단백질 상호작용 네트워크 및 질병-질병 상호작용 네트워크를 통해 얻고, 이렇게 얻어진 단백질들을 도메인 분석 과정을 거쳐 암 관련 핵심 단백질 도메인을 찾는 방법에 관한 것이다. 본 발명의 방법에 의하면, 짧은 시간안에 저비용으로 암에 관련된 단백질 도메인들을 대량으로 발굴할 수 있다. 또한, 본 발명의 방법에 의해 발굴된 암 관련 단백질 도메인들은 암의 성장을 억제하는 데 필요한 정보를 제공함으로써 암 치료방법 및 암 치료 선도물질 개발에 매우 유용하게 이용될 수 있다.

Description

암 관련 단백질 도메인을 발굴하는 방법{Method for Identifying Cancer Related Protein Domains}

본 발명은 암 관련 단백질 도메인을 발굴하는 방법에 관한 것으로서, 보다 상세하게는, 암 관련 단백질들을 단백질-단백질 상호작용 네트워크 및 질병-질병 상호작용 네트워크를 통해 얻고, 이렇게 얻어진 단백질들을 도메인 분석 과정을 거쳐 암 관련 핵심 단백질 도메인을 찾는 방법에 관한 것이다.

인간 질병에 관여하는 단백질들은 질병의 병리학적 기작 및 임상학적 실제를 이해하는데 중요한 요소이다. 전통적인 방법인 한 질병에 관여하는 단백질과의 연결고리를 분석하는 제한된 연구를 통해서 질병 사이의 복잡한 상관관계를 분석하고 이해하는 것은 한계가 있다. 네트워크의 구조적 및 기능적 분석방법과 질병관련 네트워크와의 결합을 통해서 복잡한 인간 질병체계를 이해하고자 한다면 시스템수준에서 질병을 이해하는 새로운 통찰력을 도출할 수 있을 것이다. 지난 수십 년 동안, 의학적 임상학적 접근방법은 질병과 한 두 개의 단백질 사이의 상관관계를 분석함으로써 질병을 이해하고자 하였다. 최근에 하나의 질병을 분석하기 보다는 질병 사이의 상관관계를 보여주는 질병 네트워크의 구조와 양상을 분석하고자 하는 새로운 접근방법이 제안되었다. 최근에 인간 질병과 유전자 사이에 상관관계를 규명하는 연구 결과가 보고되었는데, 하나의 유전 질환은 다양한 유전자와 연결되어 있고 이들 유전자는 또 다른 질환과 연결되어 결국 비슷한 질병들이 연결고리를 형성하고 있음을 밝혔다. 비록 유전 질환일지라도 표현형으로 나타나는 것은 단백질이다. 다시 말해 유전자가 병인의 근원은 되지만 실제 질환의 발생, 작용 기작 등은 표현형인 단백질에 의해서 좌우된다. 병의 원인을 규명하는 것은 유전자로부터 접근하는 것이 바람직하지만 질병의 확산, 질병과의 상관관계 등을 이해하는 데는 단백질을 분석하는 것이 바람직하다. 특히, 단백질 분자는 각각 서로 다른 분자를 인지할 수 있고, 적절한 상황에서 서로 결합하여 공동으로 기능을 수행한다. 따라서 복잡한 질병과의 상관관계의 분석은 단백질 네트워크를 분석하는 것이 필수적이라 하겠다.

본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.

본 발명자들은 암 치료에 중요한 타깃이 될 수 있는 단백질 도메인을 생물정보학적 접근 방식을 통해 대량으로 발굴하는 방법을 개발하기 위해 예의 연구 노력하였다. 그 결과, 암에 관련된 단백질들의 데이터베이스로부터 암 관련 단백질 상호작용 네트워크를 도출하고, 단백질 상호작용 네트워크로부터 암 관련 질병 네트워크를 구축하여 이 질병 네트워크의 분석을 통해 암과 관련된 질병 단백체를 대량으로 발굴한 후, 질병 단백체들의 도메인을 분석함으로써 암 치료에 중요한 타깃이 될 수 있는 핵심 도메인들을 대량으로 발굴하는데 성공하여 본 발명을 완성하였다.

따라서, 본 발명의 목적은 암 관련 단백질 도메인을 대량으로 발굴하는 방법을 제공하는 것에 있다.

본 발명의 목적 및 장점은 하기의 발명의 상세한 설명, 청구의 범위 및 도면에 의해 보다 명확하게 된다.

본 발명의 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 암 관련 단백질 도메인을 발굴하는 방법을 제공한다: (a) 암 관련 단백질 데이터베이스를 구축하는 단계; (b) 상기 단계 (a)에서 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 단계; (c) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환하는 단계; (d) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크 및 상기 단계 (c)에서 얻은 암 관련 질병 네트워크로부터 암 관련 질병 단백체를 발굴하는 단계; (e) 상기 단계 (d)에서 발굴한 암 관련 질병 단백체들의 공통 도메인을 분석하는 단계; 및 (f) 상기 단계 (e)에서 분석한 공통 도메인 분석 결과를 기초로 암 관련 질병 단백체의 핵심 도메인을 선별하는 단계.

본 발명의 바람직한 구현예에 의하면, 상기 단계 (a)의 암 관련 단백질 데이터베이스의 구축은 OMIM (Online Mendelian Inheritance In Man) 데이터베이스를 이용하여 행한다.

본 발명의 다른 바람직한 구현예에 의하면, 상기 단계 (b)에서 암 관련 질병 단백체의 발굴은 HPRD (Human Protein Reference Database) 데이터베이스를 이용하여 행한다.

본 발명의 또 다른 바람직한 구현예에 의하면, 상기 단계 (e)의 공통 도메인의 분석은 Pfam 데이터베이스를 이용하여 행한다.

본 발명의 또 다른 바람직한 구현예에 의하면, 상기 단계 (d)에서 상기 암 관련 질병 단백체의 발굴은 암과 암 관련 단백질과의 상관관계를 보여주는 암-단백질 이분할 그래프를 도출하여 행한다.

이하에서 본 발명의 방법을 각 단계별로 나누어 상세히 설명한다.

(a) 암 관련 단백질 데이터베이스를 구축하는 단계

본 발명의 방법에서 첫 번째 단계는 암에 관련된 단백질 데이터베이스를 구축하는 단계이다. 암에 관련된 단백질 데이터베이스는 암에 관련된 유전자와 단백질을 데이터베이스화하여 제공하는 기존의 데이터베이스를 이용하여 구축할 수 있다. 예를 들어, OMIM (Online Mendelian Inheritance In Man)의 데이터 베이스를 이용하여 암에 관련된 단백질 데이터베이스 구축이 가능하다.

(b) 상기 단계 (a)에서 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 단계

본 발명의 방법에서 암 관련 단백질 상호작용 네트워크를 구축하는 과정은 상기 단계 (a)를 통해 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 행한다.

본 발명에서 용어 "단백질 상호작용 데이터베이스"는 단백질-단백질 상호 작용에 관한 데이터베이스로서, 특정의 단백질과 상호작용하는 단백질들에 대한 정보를 검색할 수 있는 데이터베이스를 의미한다. 이러한 단백질 상호작용 데이터베이스에 상기 암 관련 단백질 데이터베이스를 구성하는 각각의 단백질을 입력하여 이 단백질들과 상호작용이 가능한 모든 단백질들을 검색하고, 이에 대한 정보를 얻어 단백질 상호작용 네트워크를 구축한다.

본 명세서에서 사용되는 용어 "단백질 상호작용 네트워크"는 노드(단백질)와 링크(단백질 상호작용)를 결합시켜 구성한 것으로서, 예를 들어, 특정 단백질이 다른 단백질과 결합하는 경우 특정의 값(예: 1)을 부여하고, 특정 단백질이 다른 단백질과 전혀 결합하지 않는 경우 값을 0을 부여하여 구축할 수 있다.

본 발명의 방법에서 사용할 수 있는 단백질 상호작용 데이터베이스는 상기 단계 (a)에서와 마찬가지로 기존의 구축된 데이터베이스를 이용할 수 있는데, 예를 들어 HPRD (Human Protein Reference Database)에서 제공하는 데이터베이스가 있다.

본 발명의 방법에서 특징적인 기술 구성 중 하나는, 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 과정에서, 단백질 상호작용 데이터베이스에서 제공되는 데이터베이스를 정제하는 과정을 거치는 바, 이 정제과정은 데이터베이스의 단백질들 중에서 세포내에서 실질적으로 상호작용이 가능한 단백질들만을 선별하는 과정이다. 실질적으로 상호작용이 가능한 단백질들을 선별한다는 것은 세포내에서 동일한 세포소기관내, 예컨대 미토콘드리아에 존재하는 단백질들 사이는 실질적으로 상호작용이 일어날 가능성이 매우 큰 반면, 다른 세포소기관 예를 들어, 미토콘드리아와 핵질내에 각각 존재하는 단백질들은 실질적으로 상호작용이 일어날 가능성이 매우 낮으므로, 이렇게 단백질들의 세포내에서 존재하는 위치에 따라 상호작용이 일어날 가능성이 현저히 낮은 단백질들은 제외하는 과정을 거친다는 의미이다.

본 발명의 방법에서 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 과정에서 실질적으로 상호작용이 가능한 단백질들을 선별하는 정제 과정을 거치면 구축되는 암 관련 단백질 상호작용 네트워크의 정확도를 크게 향상시킬 수 있는 이점이 있다.

(c) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환하는 단계

상기 단계 (b)에서 구축된 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환한다. 암 관련 질병 네트워크로의 전환 방법은 단백질 질병 정보가 담겨진 기존의 구축된 데이터베이스를 이용할 수 있는데, 예를 들어, 암 관련 단백질 상호작용 네트워크에 포함된 단백질들의 질병정보를 OMIM (Online Mendelian Inheritance in Man)으로부터 확보하여 암 관련 단백질 상호작용 네트워크에서 질병명으로 치환함으로서 암 관련 질병 네트워크를 구축할 수 있다.

종래의 방법에서는 단백질 상호작용 네트워크로부터 직접 질병유전자를 발굴하였었는데, 이 경우 정확도를 위한 별도의 정제작업이 요구되나, 본 발명의 방법에서는 암 관련 단백질 상호작용 네트워크를 직접 질병 단백질로 전환하여 암 관련 질병 네트워크를 구축함으로써 별도의 정제작업 없이 정확도를 확보할 수 있게 된다. 왜냐하면, 암 질병에 관여하지 않는 단백질들은 단백질 상호작용 네트워크를 질병 네트워크로 전환하는 동안 자동적으로 제거되기 때문이다.

(d) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크 및 상기 단계 (c)에서 얻은 암 관련 질병 네트워크로부터 암 관련 질병 단백체를 발굴하는 단계

다음 단계로서, 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크와 상기 단계 (c)에서 얻은 암 관련 질병 네트워크를 이용하여 암 관련 질병 단백체를 발굴한다. 본 명세서에서 용어 "암 관련 질병 단백체"란 암에 관련된 단백질을 통칭하는 의미의 용어로서, 암 질병의 발생에서 매우 중요한 역할을 할 것으로 기대되는 단백질이다.

바람직하게는, 상기 암 관련 질병 단백체의 발굴은 암과 암 관련 단백질과의 상관관계를 보여주는 암-단백질 이분할 그래프를 도출하여 행한다. 본 명세서에서 사용되는 용어 "암-단백질 이분할 그래프"란 암과 암에 관련된 단백질들을 연결하여 만든 그래프로서, 암 질병에 어떠한 단백질들이 관여되어 있는 지를 시각적으로 용이하게 판별할 수 있도록 제작한 그래프이다. 이 암-단백질 이분할 그래프는 다음과 같이 작성한다. 즉, 질병 네트워크로부터 암 질병명을 얻고, 단백질 상호작용 네트워크로부터 암에 관여하는 단백질명을 얻어 이분할 그래프를 만든다. 이 암-단백질 이분할 그래프를 이용하면 암에 관여하는 단백질을 가시적으로 추출할 수 있어 대량으로 단시간에 암 관련 단백체 추출이 가능한 장점이 있다.

(e) 상기 단계 (d)에서 발굴한 암 관련 질병 단백체들의 공통 도메인을 분석하는 단계

상기 단계 (d)에서 암의 질병 단백체로 얻어진 단백질들의 공통 도메인을 분석한다. 상기 공통 도메인을 분석하는 방법은 단백질들의 도메인(domain)과 패밀리(family) 정보를 담고 있는 기존의 구축된 데이터베이스를 이용하여 행할 수 있으며, 예를 들어, Pfam 24.0 버전(Oct, 2009) 데이터베이스를 이용하여 도메인 정보를 추출할 수 있다.

본 명세서에서 사용된 용어 "공통 도메인"이란 암 관련 질병 단백체들에서 나타나는 단백질 도메인 중에서 두 개 이상의 단백질에 공통적으로 나타나는 도메인을 의미한다. 이러한 공통도메인을 선별하는 이점은, 하나의 공통 도메인을 공략함으로서 최소 두 개 이상의 단백질을 제어할 수 있는 장점이 있기 때문이다. 예를 들어, 암 관련 단백질 60개 중에서 Pkinase_Tyr라는 도메인을 가지고 있는 단백질은 10 개인데, 만약 이 Pkinase_Tyr 도메인을 공략한다면 10 개의 단백질을 동시에 제어할 수 있게 되어, 그 효율성을 극대화 할 수 있다.

(f) 상기 단계 (e)에서 분석한 공통 도메인 분석 결과를 기초로 암 관련 질병 단백체의 핵심 도메인을 선별하는 단계.

상기 단계 (e)에서 분석된 공통 도메인의 분석 결과를 토대로 핵심 도메인을 선별한다. 본 명세서에서 사용되는 용어 "핵심 도메인"이란 암의 성장과 진행에 있어서 중요한 역할을 할 것으로 기대되는 도메인으로서, 암의 성장과 진행과정을 효과적으로 제어할 수 있는 타깃이 될 수 있는 도메인을 의미한다. 예를 들어, 핵심 도메인은 공통 도메인을 가지고 있으면서 세포 주기, 세포 성장, 또는 세포 증식에 관여하는 단백질들이 가지는 도메인만을 의미한다.

본 발명의 방법은 암을 죽이는 대신 암의 성장이나 진행을 억제하는 "핵심 도메인"의 선별에 초점을 맞춘다. 왜냐하면 암은 강압적으로 억제하면 억제할수록 다른 변이가 일어나면서 더 큰 악성 특성을 나타내기 때문이다. 또 다른 이유로는 지금까지 종래의 암 치료제 또는 억제제는 암 세포뿐만 아니라 정상 세포도 함께 제거하거나 죽이는 등의 부작용 문제를 가지고 있었고, 또한, 전술한 "공통 도메인"을 억제하는 경우, 인체에서 매우 중요한 기능을 수행하는 단백질이 만약 상기 공통 도메인을 가지고 있다면 암의 제어뿐만 아니라 정상 세포의 기능도 저해할 수 있다. 따라서, 이러한 문제점을 피하기 위해서 본 발명은 암의 성장과 진행에만 관여하는 단백질의 핵심 도메인만을 추출하고 선택적으로 제어함으로서 암의 성장과 진행을 제어하는데 초점을 맞춘다. 물론 "핵심 도메인"의 억제에 의해 정상 세포의 성장도 억제되겠지만 암이 진행되는 시점에서 인체의 세포는 대부분 성장이 멈춘 상태이기 때문에 심각한 부작용은 나타나지 않는다. 이러한 이유로 본 발명의 방법은 "공통 도메인"으로부터 다시 "핵심 도메인"을 추출한다. 공통 도에인에서 핵심 도메인의 추출은 세포주기, 세포성장, 세포증식에 관여하는 도메인을 추출하여 행한다. 이들 핵심 도메인을 포함하는 단백질을 KEGG 경로에 입력하였을 때 세포증식이나 세포 사멸 경로로 집중되는 것을 볼 수 있다[도면 4]. 따라서, 본 발명에서 발굴된 핵심도메인을 제어하면 세포 증식을 제어할 수 있을 것으로 기대된다.

상술한 바와 같이, 본 발명은 암 관련 단백질 도메인을 발굴하는 방법에 관한 것이다. 본 발명의 방법에 의하면, 짧은 시간 안에 저비용으로 암에 관련된 단백질 도메인들을 대량으로 발굴하는 것이 가능하다. 본 발명의 방법에 의해 발굴된 암 관련 단백질 도메인들은 암의 성장을 억제하는 데 필요한 정보, 치료방법 및 치료 선도물질 개발에 유용한 정보를 제공할 수 있다.

도 1은 본 발명 방법의 전체 흐름도를 보여주는 도면이다.
도 2는 암과 관련된 단백질들의 상호작용 네트워크를 보여주는 도면이다.
도 3은 암 관련 질병 네트워크를 보여주는 도면이다.
도 4는 성장 관련 암세포 경로 상에서 단백질과 도메인 위치 정보를 파악하는 도면이다.

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.

실시예

실시예 1: 암 관련 단백질 데이터 베이스의 구축

암에 관련된 단백질들의 리스트(list)를 추출하여 암 관련 단백질 데이터 베이스를 구축하였다. 암 관련 단백질 209개를 OMIM (Online Mendelian Inheritance in Man) 데이터베이스로부터 얻었고, 이를 아래 [표 1]에 요약하여 나타내었다.

번호	단백질명	번호	단백질명	번호	단백질명	번호	단백질명
1	ABL1	56	FACL6	111	MSR1	166	RB1CC1
2	ACVR1B	57	FCGR2B	112	MUTYH	167	RBBP8
3	AF10	58	FGFR2	113	MXI1	168	RECQL3
4	AF1Q	59	FGFR3	114	MYC	169	RET
5	APC	60	FGFR4	115	NBS1	170	RNASEL
6	AR	61	FH	116	NCOA4	171	RNF6
7	ARHGEF12	62	FLCN	117	NF1	172	RRAS2
8	ARL11	63	FLT3	118	NF2	173	RUNX1
9	ARMET	64	FLT4	119	NME1	174	SDHB
10	ARNT	65	FOXO1A	120	NPM1	175	SDHC
11	ASPCR1	66	FSHR	121	NQO1	176	SDHD
12	ATBF1	67	GATA1	122	NRAS	177	SH2D1A
13	ATM	68	GMPS	123	NTRK1	178	SLC22A1L
14	AXIN1	69	GNAI2	124	NUMA1	179	SMARCB1
15	AXIN2	70	GNAS	125	NUP214	180	SMOH
16	BARD1	71	GOLGA5	126	ODC1	181	SRC
17	BAX	72	GPC3	127	OGG1	182	SSX1
18	BCL10	73	GRAF	128	OPCML	183	SSX2
19	BCL2	74	HMGA2	129	P2RX7	184	STAT5B
20	BCL7A	75	HOXD4	130	PAX3	185	STK11
21	BCL8	76	HRAS	131	PAX7	186	SUFU
22	BCR	77	HRPT2	132	PCM1	187	TAL1
23	BMPR1A	78	IGF2R	133	PDGFB	188	TAL2
24	BRAF	79	IL1B	134	PDGFRA	189	TCF1
25	BRCA1	80	IL1RN	135	PDGFRB	190	TCRA
26	BRCA2	81	ING1	136	PDGFRL	191	TFE3
27	BRIP1	82	IRF1	137	PHB	192	TGFBR2
28	BUB1	83	IRF4	138	PIK3CA	193	THRA
29	BUB1B	84	KDR	139	PLA2G2A	194	TIF1G
30	CALM	85	KIT	140	PLAG1	195	TNFRSF10B
31	CASP10	86	KLF6	141	PML	196	TNFRSF6
32	CASP8	87	KRAS2	142	PMS1	197	TP53
33	CBFB	88	LGI1	143	PMS2	198	TRC8
34	CCND1	89	LHCGR	144	PMX2B	199	TRIM24
35	CDH1	90	LIG4	145	POU6F2	200	TSG101
36	CDK4	91	LPP	146	PPARG	201	TSHR
37	CDKN2A	92	LZTS1	147	PPM1D	202	VHL
38	CEBPA	93	MAD1L1	148	PPP2R1B	203	WHSC1L1
39	CHEK2	94	MADH4	149	PRCC	204	WT1
40	CHIC2	95	MALT1	150	PRKAR1A	205	WWOX
41	COL4A6	96	MAML2	151	PRKCA	206	XRCC3
42	CSF1R	97	MAP3K8	152	PRKN	207	ZNF145
43	CSMF	98	MCC	153	PTCH	208	ZNF198
44	CTNNB1	99	MDM2	154	PTCH2	209	ZNFN1A1
45	DCC	100	MECT1	155	PTEN
46	DDIT3	101	MEN1	156	PTHR1
47	DLC1	102	MET	157	PTPN11
48	DMBT1	103	MINPP1	158	PTPN12
49	EGFR	104	MKL1	159	PTPRJ
50	ELAC2	105	MLH1	160	RAD51A
51	EP300	106	MLH3	161	RAD54B
52	EPHB2	107	MN1	162	RAD54L
53	ERBB2	108	MSH2	163	RAP1GDS1
54	EWSR1	109	MSH3	164	RASA1
55	EXT1	110	MSH6	165	RB1

실시예 2: 암 관련 단백질 상호작용 네트워크의 구축

상기 표 1에서 나타난 암 관련 단백질과 HPRD(Human Protein Reference Database)에서 얻은 단백질 상호작용 데이터베이스를 활용하여 암 관련 단백질 상호작용 네트워크를 구축하였다. 단백질-단백질 상호작용 데이터베이스는 HPRD (Human Protein Reference Database)로부터 얻어[14], 암 관련 단백질 상호작용 네트워크를 구축하였고, InterViewer 프로그램으로 이를 시각화하였다(도 2 및 도 3 참조).

실시예 3 : 암 관련 질병 네트워크의 구축

암 관련 단백질 상호작용 네트워크에 포함된 단백질들의 질병정보를 OMIM (Online Mendelian Inheritance in Man)으로부터 확보하여 질병명으로 치환함으로서 암 관련 질병 네트워크를 구축하였다. 즉, 네트워크를 구성하는 단백질을 질병명으로 전환하였는데, 만약 단백질 중에서 다수의 질병과 관련이 있으면 하나의 단백질이 다수의 질병 노드로 전환되며 단백질 중에서 질병과 관련이 없는 단백질은 전환과정에서 제거된다. 이 과정을 통해서 암 관련 질병 네트워크를 구축하였다.

실시예 4 : 암 관련 질병 단백체의 발굴

상기 실시예 2 및 실시예 3에서 얻은 암 관련 단백질 상호작용 네트워크 및 질병 네트워크로부터 암 관련 질병 단백체를 발굴하였다. 발굴한 암 관련 질병 단백체의 리스트는 아래 표 2에 나타내었다.

번호	단백질명	번호	단백질명	번호	단백질명
1	APC	21	EWSR1	41	PDGFB
2	AR	22	FLT4	42	PDGFRA
3	ATM	23	GNAI2	43	PDGFRB
4	AXIN2	24	GNAS	44	PIK3CA
5	BAX	25	HRAS	45	PMS2
6	BCL10	26	IRF1	46	PPARG
7	BRAF	27	KIT	47	PRKAR1A
8	BRCA1	28	KLF6	48	PTEN
9	BRCA2	29	LHCGR	49	PTPN11
10	BRIP1	30	MET	50	RASA1
11	CASP10	31	MLH1	51	RB1
12	CASP8	32	MLH3	52	RET
13	CCND1	33	MSH2	53	RUNX1
14	CDH1	34	MSH6	54	STAT5B
15	CDKN2A	35	MUTYH	55	STK11
16	CHEK2	36	MXI1	56	TCF1
17	CTNNB1	37	NF1	57	TGFBR2
18	EGFR	38	NF2	58	TP53
19	EP300	39	NQO1	59	TSHR
20	ERBB2	40	NTRK1	60	WT1

실시예 5 : 질병 단백체의 공통 도메인 분석

Pfam 데이터베이스를 이용하여 공통도메인을 분석하였다. "공통 도메인"이란 암 관련 질병 단백체들에서 나타나는 단백질 도메인 중에서 두 개 이상의 단백질에 공통적으로 나타나는 도메인을 의미한다. 공통도메인의 분석결과는 아래 [표 3]에 나타내었다.

번호	단백질	도메인
1	APC	APC_15aa;APC_basic;APC_crr;Arm;EB1_binding;SAMP;
2	AR	Androgen_recep;Hormone_recep;zf-C4;
3	ATM	FAT;FATC;PI3_PI4_kinase;TAN;
4	BRAF	C1_1;Pkinase_Tyr;RBD;
5	CASP10	DED;Peptidase_C14;
6	CASP8	DED;Peptidase_C14;
7	CHEK2	FHA;Pkinase;
8	CTNNB1	Arm;
9	EGFR	Furin-like;Pkinase_Tyr;Recep_L_domain;
10	ERBB2	Furin-like;Pkinase_Tyr;Recep_L_domain;
11	FLT4	Pkinase_Tyr;
12	GNAI2	G-alpha;
13	GNAS	G-alpha;
14	KIT	ig;Pkinase_Tyr;
15	KLF6	zf-C2H2;
16	LHCGR	7tm_1;
17	MET	Pkinase_Tyr;PSI;Sema;TIG;
18	MLH1	DNA_mis_repair;HATPase_c;
19	MLH3	DNA_mis_repair;HATPase_c;MutL_C;
20	MSH2	MutS_I;MutS_II;MutS_III;MutS_IV;MutS_V;
21	MSH6	MutS_I;MutS_II;MutS_III;MutS_IV;MutS_V;PWWP;
22	NF1	RasGAP;
23	NTRK1	Pkinase_Tyr;
24	PDGFRA	Pkinase_Tyr;
25	PDGFRB	ig;Pkinase_Tyr;
26	PIK3CA	PI3_PI4_kinase;PI3K_C2;PI3K_p85B;PI3K_rbd;PI3Ka;
27	PMS2	DNA_mis_repair;HATPase_c;MutL_C;
28	PPARG	Hormone_recep;zf-C4;
29	PTPN11	SH2;Y_phosphatase;
30	RASA1	C2;PH;RasGAP;SH2;SH3_1;
31	RET	Cadherin;Pkinase_Tyr;
32	STAT5B	SH2;STAT_alpha;STAT_bind;STAT_int;
33	STK11	Pkinase;
34	TGFBR2	ecTbetaR2;Pkinase;
35	TSHR	7tm_1;
36	WT1	WT1;zf-C2H2;

실시예 6 : 핵심 도메인의 선별

상기 실시예 5에서 추출된 공통 도메인의 분석 결과를 바탕으로 암의 치료 방법 및 치료제 개발에 유용한 핵심 도메인을 선별하였다. "핵심 도메인"이란 암의 성장과 진행에 있어서 중요한 역할을 할 것으로 기대되는 도메인으로서, 암의 성장과 진행과정을 효과적으로 제어할 수 있는 타깃이 될 수 있는 도메인을 의미한다. 예를 들어, 핵심 도메인은 상기의 공통 도메인을 가지고 있으면서 세포 주기, 세포 성장, 또는 세포 증식에 관여하는 단백질들만이 가지고 있는 도메인을 의미한다. 핵심 도메인의 리스트는 하기 [표 4]에 나타내었다.

단백질	핵심 도메인
APC	Arm
AR	zf-C4
ATM	PI3_PI4_kinase
CHEK2	Pkinase
STK11	Pkinase
WT1	zf-C2H2

실시예 7 : 암관련 단백체 도메인 발굴시 생물정보학적 접근 방법의 유용성

본 발명자들은 생물정보학적 접근 방법을 이용하여 암관련 단백질 도메인을 확보하고 도메인 기반 암세포 성장을 제어하는 관계를 규명하였다. 즉, OMIM (Online Medelian Inheritance In Man) 데이터베이스로부터 암 관련 단백질 209개를 확보한 다음, 단백질 상호작용 네트워크를 구축하고 네트워크에 포함된 단백질을 관련 질병으로 전환하여 질병 네트워크를 구축한 다음, 이를 바탕으로 질병단백체를 발굴하였다. 질병단백체 도메인 정보를 pfam으로부터 확보하여 암 성장 네트워크 위에 위치시킴으로서 암 성장을 제어할 수 있는 방법을 제시하였다. 이러한 생물정보학적 접근 방법을 통해 제공되는 암 제어 관련 도메인 정보는 분자수준에서 선도화합물에 대한 실마리를 제공할 수 있을 것이고, 또는 몇몇 소량의 화합물을 기반으로 암 성장을 제어할 수 있는 기능성 건강음료 개발에 정보를 제공할 수 있을 것이다.

이상으로 본 발명의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.

Claims

다음의 단계를 포함하는 암 관련 단백질 도메인을 발굴하는 방법:
(a) 암 관련 단백질 데이터베이스를 구축하는 단계;
(b) 상기 단계 (a)에서 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 단계;
(c) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환하는 단계;
(d) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크 및 상기 단계 (c)에서 얻은 암 관련 질병 네트워크로부터 암 관련 질병 단백체를 발굴하는 단계;
(e) 상기 단계 (d)에서 발굴한 암 관련 질병 단백체들의 공통 도메인을 분석하는 단계로서, 상기 공통 도메인의 분석은 Pfam 데이터베이스를 이용하여 행하는 단계; 및
(f) 상기 단계 (e)에서 분석한 공통 도메인 분석 결과를 기초로 암 관련 질병 단백체의 핵심 도메인을 선별하는 단계.
제 1 항에 있어서, 상기 단계 (a)의 암 관련 단백질 데이터베이스의 구축은 OMIM (Online Mendelian Inheritance In Man) 데이터베이스를 이용하여 행하는 것을 특징으로 하는 방법.
제 1 항에 있어서, 상기 단계 (b)에서 암 관련 질병 단백체의 발굴은 HPRD (Human Protein Reference Database) 데이터베이스를 이용하여 행하는 것을 특징으로 하는 방법.
삭제
제 1 항에 있어서, 상기 단계 (d)에서 상기 암 관련 질병 단백체의 발굴은 암과 암 관련 단백질과의 상관관계를 보여주는 암-단백질 이분할 그래프를 도출하여 행하는 것을 특징으로 하는 방법.