KR101252649B1 - 암 관련 단백질 도메인을 발굴하는 방법 - Google Patents
암 관련 단백질 도메인을 발굴하는 방법 Download PDFInfo
- Publication number
- KR101252649B1 KR101252649B1 KR1020110010118A KR20110010118A KR101252649B1 KR 101252649 B1 KR101252649 B1 KR 101252649B1 KR 1020110010118 A KR1020110010118 A KR 1020110010118A KR 20110010118 A KR20110010118 A KR 20110010118A KR 101252649 B1 KR101252649 B1 KR 101252649B1
- Authority
- KR
- South Korea
- Prior art keywords
- cancer
- protein
- proteins
- database
- disease
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본 발명은 암 관련 단백질 도메인을 발굴하는 방법에 관한 것으로서, 암 관련 단백질들을 단백질-단백질 상호작용 네트워크 및 질병-질병 상호작용 네트워크를 통해 얻고, 이렇게 얻어진 단백질들을 도메인 분석 과정을 거쳐 암 관련 핵심 단백질 도메인을 찾는 방법에 관한 것이다. 본 발명의 방법에 의하면, 짧은 시간안에 저비용으로 암에 관련된 단백질 도메인들을 대량으로 발굴할 수 있다. 또한, 본 발명의 방법에 의해 발굴된 암 관련 단백질 도메인들은 암의 성장을 억제하는 데 필요한 정보를 제공함으로써 암 치료방법 및 암 치료 선도물질 개발에 매우 유용하게 이용될 수 있다.
Description
본 발명은 암 관련 단백질 도메인을 발굴하는 방법에 관한 것으로서, 보다 상세하게는, 암 관련 단백질들을 단백질-단백질 상호작용 네트워크 및 질병-질병 상호작용 네트워크를 통해 얻고, 이렇게 얻어진 단백질들을 도메인 분석 과정을 거쳐 암 관련 핵심 단백질 도메인을 찾는 방법에 관한 것이다.
인간 질병에 관여하는 단백질들은 질병의 병리학적 기작 및 임상학적 실제를 이해하는데 중요한 요소이다. 전통적인 방법인 한 질병에 관여하는 단백질과의 연결고리를 분석하는 제한된 연구를 통해서 질병 사이의 복잡한 상관관계를 분석하고 이해하는 것은 한계가 있다. 네트워크의 구조적 및 기능적 분석방법과 질병관련 네트워크와의 결합을 통해서 복잡한 인간 질병체계를 이해하고자 한다면 시스템수준에서 질병을 이해하는 새로운 통찰력을 도출할 수 있을 것이다. 지난 수십 년 동안, 의학적 임상학적 접근방법은 질병과 한 두 개의 단백질 사이의 상관관계를 분석함으로써 질병을 이해하고자 하였다. 최근에 하나의 질병을 분석하기 보다는 질병 사이의 상관관계를 보여주는 질병 네트워크의 구조와 양상을 분석하고자 하는 새로운 접근방법이 제안되었다. 최근에 인간 질병과 유전자 사이에 상관관계를 규명하는 연구 결과가 보고되었는데, 하나의 유전 질환은 다양한 유전자와 연결되어 있고 이들 유전자는 또 다른 질환과 연결되어 결국 비슷한 질병들이 연결고리를 형성하고 있음을 밝혔다. 비록 유전 질환일지라도 표현형으로 나타나는 것은 단백질이다. 다시 말해 유전자가 병인의 근원은 되지만 실제 질환의 발생, 작용 기작 등은 표현형인 단백질에 의해서 좌우된다. 병의 원인을 규명하는 것은 유전자로부터 접근하는 것이 바람직하지만 질병의 확산, 질병과의 상관관계 등을 이해하는 데는 단백질을 분석하는 것이 바람직하다. 특히, 단백질 분자는 각각 서로 다른 분자를 인지할 수 있고, 적절한 상황에서 서로 결합하여 공동으로 기능을 수행한다. 따라서 복잡한 질병과의 상관관계의 분석은 단백질 네트워크를 분석하는 것이 필수적이라 하겠다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 암 치료에 중요한 타깃이 될 수 있는 단백질 도메인을 생물정보학적 접근 방식을 통해 대량으로 발굴하는 방법을 개발하기 위해 예의 연구 노력하였다. 그 결과, 암에 관련된 단백질들의 데이터베이스로부터 암 관련 단백질 상호작용 네트워크를 도출하고, 단백질 상호작용 네트워크로부터 암 관련 질병 네트워크를 구축하여 이 질병 네트워크의 분석을 통해 암과 관련된 질병 단백체를 대량으로 발굴한 후, 질병 단백체들의 도메인을 분석함으로써 암 치료에 중요한 타깃이 될 수 있는 핵심 도메인들을 대량으로 발굴하는데 성공하여 본 발명을 완성하였다.
따라서, 본 발명의 목적은 암 관련 단백질 도메인을 대량으로 발굴하는 방법을 제공하는 것에 있다.
본 발명의 목적 및 장점은 하기의 발명의 상세한 설명, 청구의 범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 암 관련 단백질 도메인을 발굴하는 방법을 제공한다: (a) 암 관련 단백질 데이터베이스를 구축하는 단계; (b) 상기 단계 (a)에서 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 단계; (c) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환하는 단계; (d) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크 및 상기 단계 (c)에서 얻은 암 관련 질병 네트워크로부터 암 관련 질병 단백체를 발굴하는 단계; (e) 상기 단계 (d)에서 발굴한 암 관련 질병 단백체들의 공통 도메인을 분석하는 단계; 및 (f) 상기 단계 (e)에서 분석한 공통 도메인 분석 결과를 기초로 암 관련 질병 단백체의 핵심 도메인을 선별하는 단계.
본 발명의 바람직한 구현예에 의하면, 상기 단계 (a)의 암 관련 단백질 데이터베이스의 구축은 OMIM (Online Mendelian Inheritance In Man) 데이터베이스를 이용하여 행한다.
본 발명의 다른 바람직한 구현예에 의하면, 상기 단계 (b)에서 암 관련 질병 단백체의 발굴은 HPRD (Human Protein Reference Database) 데이터베이스를 이용하여 행한다.
본 발명의 또 다른 바람직한 구현예에 의하면, 상기 단계 (e)의 공통 도메인의 분석은 Pfam 데이터베이스를 이용하여 행한다.
본 발명의 또 다른 바람직한 구현예에 의하면, 상기 단계 (d)에서 상기 암 관련 질병 단백체의 발굴은 암과 암 관련 단백질과의 상관관계를 보여주는 암-단백질 이분할 그래프를 도출하여 행한다.
이하에서 본 발명의 방법을 각 단계별로 나누어 상세히 설명한다.
(a) 암 관련 단백질 데이터베이스를 구축하는 단계
본 발명의 방법에서 첫 번째 단계는 암에 관련된 단백질 데이터베이스를 구축하는 단계이다. 암에 관련된 단백질 데이터베이스는 암에 관련된 유전자와 단백질을 데이터베이스화하여 제공하는 기존의 데이터베이스를 이용하여 구축할 수 있다. 예를 들어, OMIM (Online Mendelian Inheritance In Man)의 데이터 베이스를 이용하여 암에 관련된 단백질 데이터베이스 구축이 가능하다.
(b) 상기 단계 (a)에서 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 단계
본 발명의 방법에서 암 관련 단백질 상호작용 네트워크를 구축하는 과정은 상기 단계 (a)를 통해 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 행한다.
본 발명에서 용어 "단백질 상호작용 데이터베이스"는 단백질-단백질 상호 작용에 관한 데이터베이스로서, 특정의 단백질과 상호작용하는 단백질들에 대한 정보를 검색할 수 있는 데이터베이스를 의미한다. 이러한 단백질 상호작용 데이터베이스에 상기 암 관련 단백질 데이터베이스를 구성하는 각각의 단백질을 입력하여 이 단백질들과 상호작용이 가능한 모든 단백질들을 검색하고, 이에 대한 정보를 얻어 단백질 상호작용 네트워크를 구축한다.
본 명세서에서 사용되는 용어 "단백질 상호작용 네트워크"는 노드(단백질)와 링크(단백질 상호작용)를 결합시켜 구성한 것으로서, 예를 들어, 특정 단백질이 다른 단백질과 결합하는 경우 특정의 값(예: 1)을 부여하고, 특정 단백질이 다른 단백질과 전혀 결합하지 않는 경우 값을 0을 부여하여 구축할 수 있다.
본 발명의 방법에서 사용할 수 있는 단백질 상호작용 데이터베이스는 상기 단계 (a)에서와 마찬가지로 기존의 구축된 데이터베이스를 이용할 수 있는데, 예를 들어 HPRD (Human Protein Reference Database)에서 제공하는 데이터베이스가 있다.
본 발명의 방법에서 특징적인 기술 구성 중 하나는, 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 과정에서, 단백질 상호작용 데이터베이스에서 제공되는 데이터베이스를 정제하는 과정을 거치는 바, 이 정제과정은 데이터베이스의 단백질들 중에서 세포내에서 실질적으로 상호작용이 가능한 단백질들만을 선별하는 과정이다. 실질적으로 상호작용이 가능한 단백질들을 선별한다는 것은 세포내에서 동일한 세포소기관내, 예컨대 미토콘드리아에 존재하는 단백질들 사이는 실질적으로 상호작용이 일어날 가능성이 매우 큰 반면, 다른 세포소기관 예를 들어, 미토콘드리아와 핵질내에 각각 존재하는 단백질들은 실질적으로 상호작용이 일어날 가능성이 매우 낮으므로, 이렇게 단백질들의 세포내에서 존재하는 위치에 따라 상호작용이 일어날 가능성이 현저히 낮은 단백질들은 제외하는 과정을 거친다는 의미이다.
본 발명의 방법에서 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 과정에서 실질적으로 상호작용이 가능한 단백질들을 선별하는 정제 과정을 거치면 구축되는 암 관련 단백질 상호작용 네트워크의 정확도를 크게 향상시킬 수 있는 이점이 있다.
(c) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환하는 단계
상기 단계 (b)에서 구축된 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환한다. 암 관련 질병 네트워크로의 전환 방법은 단백질 질병 정보가 담겨진 기존의 구축된 데이터베이스를 이용할 수 있는데, 예를 들어, 암 관련 단백질 상호작용 네트워크에 포함된 단백질들의 질병정보를 OMIM (Online Mendelian Inheritance in Man)으로부터 확보하여 암 관련 단백질 상호작용 네트워크에서 질병명으로 치환함으로서 암 관련 질병 네트워크를 구축할 수 있다.
종래의 방법에서는 단백질 상호작용 네트워크로부터 직접 질병유전자를 발굴하였었는데, 이 경우 정확도를 위한 별도의 정제작업이 요구되나, 본 발명의 방법에서는 암 관련 단백질 상호작용 네트워크를 직접 질병 단백질로 전환하여 암 관련 질병 네트워크를 구축함으로써 별도의 정제작업 없이 정확도를 확보할 수 있게 된다. 왜냐하면, 암 질병에 관여하지 않는 단백질들은 단백질 상호작용 네트워크를 질병 네트워크로 전환하는 동안 자동적으로 제거되기 때문이다.
(d) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크 및 상기 단계 (c)에서 얻은 암 관련 질병 네트워크로부터 암 관련 질병 단백체를 발굴하는 단계
다음 단계로서, 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크와 상기 단계 (c)에서 얻은 암 관련 질병 네트워크를 이용하여 암 관련 질병 단백체를 발굴한다. 본 명세서에서 용어 "암 관련 질병 단백체"란 암에 관련된 단백질을 통칭하는 의미의 용어로서, 암 질병의 발생에서 매우 중요한 역할을 할 것으로 기대되는 단백질이다.
바람직하게는, 상기 암 관련 질병 단백체의 발굴은 암과 암 관련 단백질과의 상관관계를 보여주는 암-단백질 이분할 그래프를 도출하여 행한다. 본 명세서에서 사용되는 용어 "암-단백질 이분할 그래프"란 암과 암에 관련된 단백질들을 연결하여 만든 그래프로서, 암 질병에 어떠한 단백질들이 관여되어 있는 지를 시각적으로 용이하게 판별할 수 있도록 제작한 그래프이다. 이 암-단백질 이분할 그래프는 다음과 같이 작성한다. 즉, 질병 네트워크로부터 암 질병명을 얻고, 단백질 상호작용 네트워크로부터 암에 관여하는 단백질명을 얻어 이분할 그래프를 만든다. 이 암-단백질 이분할 그래프를 이용하면 암에 관여하는 단백질을 가시적으로 추출할 수 있어 대량으로 단시간에 암 관련 단백체 추출이 가능한 장점이 있다.
(e) 상기 단계 (d)에서 발굴한 암 관련 질병 단백체들의 공통 도메인을 분석하는 단계
상기 단계 (d)에서 암의 질병 단백체로 얻어진 단백질들의 공통 도메인을 분석한다. 상기 공통 도메인을 분석하는 방법은 단백질들의 도메인(domain)과 패밀리(family) 정보를 담고 있는 기존의 구축된 데이터베이스를 이용하여 행할 수 있으며, 예를 들어, Pfam 24.0 버전(Oct, 2009) 데이터베이스를 이용하여 도메인 정보를 추출할 수 있다.
본 명세서에서 사용된 용어 "공통 도메인"이란 암 관련 질병 단백체들에서 나타나는 단백질 도메인 중에서 두 개 이상의 단백질에 공통적으로 나타나는 도메인을 의미한다. 이러한 공통도메인을 선별하는 이점은, 하나의 공통 도메인을 공략함으로서 최소 두 개 이상의 단백질을 제어할 수 있는 장점이 있기 때문이다. 예를 들어, 암 관련 단백질 60개 중에서 Pkinase_Tyr라는 도메인을 가지고 있는 단백질은 10 개인데, 만약 이 Pkinase_Tyr 도메인을 공략한다면 10 개의 단백질을 동시에 제어할 수 있게 되어, 그 효율성을 극대화 할 수 있다.
(f) 상기 단계 (e)에서 분석한 공통 도메인 분석 결과를 기초로 암 관련 질병 단백체의 핵심 도메인을 선별하는 단계.
상기 단계 (e)에서 분석된 공통 도메인의 분석 결과를 토대로 핵심 도메인을 선별한다. 본 명세서에서 사용되는 용어 "핵심 도메인"이란 암의 성장과 진행에 있어서 중요한 역할을 할 것으로 기대되는 도메인으로서, 암의 성장과 진행과정을 효과적으로 제어할 수 있는 타깃이 될 수 있는 도메인을 의미한다. 예를 들어, 핵심 도메인은 공통 도메인을 가지고 있으면서 세포 주기, 세포 성장, 또는 세포 증식에 관여하는 단백질들이 가지는 도메인만을 의미한다.
본 발명의 방법은 암을 죽이는 대신 암의 성장이나 진행을 억제하는 "핵심 도메인"의 선별에 초점을 맞춘다. 왜냐하면 암은 강압적으로 억제하면 억제할수록 다른 변이가 일어나면서 더 큰 악성 특성을 나타내기 때문이다. 또 다른 이유로는 지금까지 종래의 암 치료제 또는 억제제는 암 세포뿐만 아니라 정상 세포도 함께 제거하거나 죽이는 등의 부작용 문제를 가지고 있었고, 또한, 전술한 "공통 도메인"을 억제하는 경우, 인체에서 매우 중요한 기능을 수행하는 단백질이 만약 상기 공통 도메인을 가지고 있다면 암의 제어뿐만 아니라 정상 세포의 기능도 저해할 수 있다. 따라서, 이러한 문제점을 피하기 위해서 본 발명은 암의 성장과 진행에만 관여하는 단백질의 핵심 도메인만을 추출하고 선택적으로 제어함으로서 암의 성장과 진행을 제어하는데 초점을 맞춘다. 물론 "핵심 도메인"의 억제에 의해 정상 세포의 성장도 억제되겠지만 암이 진행되는 시점에서 인체의 세포는 대부분 성장이 멈춘 상태이기 때문에 심각한 부작용은 나타나지 않는다. 이러한 이유로 본 발명의 방법은 "공통 도메인"으로부터 다시 "핵심 도메인"을 추출한다. 공통 도에인에서 핵심 도메인의 추출은 세포주기, 세포성장, 세포증식에 관여하는 도메인을 추출하여 행한다. 이들 핵심 도메인을 포함하는 단백질을 KEGG 경로에 입력하였을 때 세포증식이나 세포 사멸 경로로 집중되는 것을 볼 수 있다[도면 4]. 따라서, 본 발명에서 발굴된 핵심도메인을 제어하면 세포 증식을 제어할 수 있을 것으로 기대된다.
상술한 바와 같이, 본 발명은 암 관련 단백질 도메인을 발굴하는 방법에 관한 것이다. 본 발명의 방법에 의하면, 짧은 시간 안에 저비용으로 암에 관련된 단백질 도메인들을 대량으로 발굴하는 것이 가능하다. 본 발명의 방법에 의해 발굴된 암 관련 단백질 도메인들은 암의 성장을 억제하는 데 필요한 정보, 치료방법 및 치료 선도물질 개발에 유용한 정보를 제공할 수 있다.
도 1은 본 발명 방법의 전체 흐름도를 보여주는 도면이다.
도 2는 암과 관련된 단백질들의 상호작용 네트워크를 보여주는 도면이다.
도 3은 암 관련 질병 네트워크를 보여주는 도면이다.
도 4는 성장 관련 암세포 경로 상에서 단백질과 도메인 위치 정보를 파악하는 도면이다.
도 2는 암과 관련된 단백질들의 상호작용 네트워크를 보여주는 도면이다.
도 3은 암 관련 질병 네트워크를 보여주는 도면이다.
도 4는 성장 관련 암세포 경로 상에서 단백질과 도메인 위치 정보를 파악하는 도면이다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
실시예
실시예 1: 암 관련 단백질 데이터 베이스의 구축
암에 관련된 단백질들의 리스트(list)를 추출하여 암 관련 단백질 데이터 베이스를 구축하였다. 암 관련 단백질 209개를 OMIM (Online Mendelian Inheritance in Man) 데이터베이스로부터 얻었고, 이를 아래 [표 1]에 요약하여 나타내었다.
번호 | 단백질명 | 번호 | 단백질명 | 번호 | 단백질명 | 번호 | 단백질명 |
1 | ABL1 | 56 | FACL6 | 111 | MSR1 | 166 | RB1CC1 |
2 | ACVR1B | 57 | FCGR2B | 112 | MUTYH | 167 | RBBP8 |
3 | AF10 | 58 | FGFR2 | 113 | MXI1 | 168 | RECQL3 |
4 | AF1Q | 59 | FGFR3 | 114 | MYC | 169 | RET |
5 | APC | 60 | FGFR4 | 115 | NBS1 | 170 | RNASEL |
6 | AR | 61 | FH | 116 | NCOA4 | 171 | RNF6 |
7 | ARHGEF12 | 62 | FLCN | 117 | NF1 | 172 | RRAS2 |
8 | ARL11 | 63 | FLT3 | 118 | NF2 | 173 | RUNX1 |
9 | ARMET | 64 | FLT4 | 119 | NME1 | 174 | SDHB |
10 | ARNT | 65 | FOXO1A | 120 | NPM1 | 175 | SDHC |
11 | ASPCR1 | 66 | FSHR | 121 | NQO1 | 176 | SDHD |
12 | ATBF1 | 67 | GATA1 | 122 | NRAS | 177 | SH2D1A |
13 | ATM | 68 | GMPS | 123 | NTRK1 | 178 | SLC22A1L |
14 | AXIN1 | 69 | GNAI2 | 124 | NUMA1 | 179 | SMARCB1 |
15 | AXIN2 | 70 | GNAS | 125 | NUP214 | 180 | SMOH |
16 | BARD1 | 71 | GOLGA5 | 126 | ODC1 | 181 | SRC |
17 | BAX | 72 | GPC3 | 127 | OGG1 | 182 | SSX1 |
18 | BCL10 | 73 | GRAF | 128 | OPCML | 183 | SSX2 |
19 | BCL2 | 74 | HMGA2 | 129 | P2RX7 | 184 | STAT5B |
20 | BCL7A | 75 | HOXD4 | 130 | PAX3 | 185 | STK11 |
21 | BCL8 | 76 | HRAS | 131 | PAX7 | 186 | SUFU |
22 | BCR | 77 | HRPT2 | 132 | PCM1 | 187 | TAL1 |
23 | BMPR1A | 78 | IGF2R | 133 | PDGFB | 188 | TAL2 |
24 | BRAF | 79 | IL1B | 134 | PDGFRA | 189 | TCF1 |
25 | BRCA1 | 80 | IL1RN | 135 | PDGFRB | 190 | TCRA |
26 | BRCA2 | 81 | ING1 | 136 | PDGFRL | 191 | TFE3 |
27 | BRIP1 | 82 | IRF1 | 137 | PHB | 192 | TGFBR2 |
28 | BUB1 | 83 | IRF4 | 138 | PIK3CA | 193 | THRA |
29 | BUB1B | 84 | KDR | 139 | PLA2G2A | 194 | TIF1G |
30 | CALM | 85 | KIT | 140 | PLAG1 | 195 | TNFRSF10B |
31 | CASP10 | 86 | KLF6 | 141 | PML | 196 | TNFRSF6 |
32 | CASP8 | 87 | KRAS2 | 142 | PMS1 | 197 | TP53 |
33 | CBFB | 88 | LGI1 | 143 | PMS2 | 198 | TRC8 |
34 | CCND1 | 89 | LHCGR | 144 | PMX2B | 199 | TRIM24 |
35 | CDH1 | 90 | LIG4 | 145 | POU6F2 | 200 | TSG101 |
36 | CDK4 | 91 | LPP | 146 | PPARG | 201 | TSHR |
37 | CDKN2A | 92 | LZTS1 | 147 | PPM1D | 202 | VHL |
38 | CEBPA | 93 | MAD1L1 | 148 | PPP2R1B | 203 | WHSC1L1 |
39 | CHEK2 | 94 | MADH4 | 149 | PRCC | 204 | WT1 |
40 | CHIC2 | 95 | MALT1 | 150 | PRKAR1A | 205 | WWOX |
41 | COL4A6 | 96 | MAML2 | 151 | PRKCA | 206 | XRCC3 |
42 | CSF1R | 97 | MAP3K8 | 152 | PRKN | 207 | ZNF145 |
43 | CSMF | 98 | MCC | 153 | PTCH | 208 | ZNF198 |
44 | CTNNB1 | 99 | MDM2 | 154 | PTCH2 | 209 | ZNFN1A1 |
45 | DCC | 100 | MECT1 | 155 | PTEN | ||
46 | DDIT3 | 101 | MEN1 | 156 | PTHR1 | ||
47 | DLC1 | 102 | MET | 157 | PTPN11 | ||
48 | DMBT1 | 103 | MINPP1 | 158 | PTPN12 | ||
49 | EGFR | 104 | MKL1 | 159 | PTPRJ | ||
50 | ELAC2 | 105 | MLH1 | 160 | RAD51A | ||
51 | EP300 | 106 | MLH3 | 161 | RAD54B | ||
52 | EPHB2 | 107 | MN1 | 162 | RAD54L | ||
53 | ERBB2 | 108 | MSH2 | 163 | RAP1GDS1 | ||
54 | EWSR1 | 109 | MSH3 | 164 | RASA1 | ||
55 | EXT1 | 110 | MSH6 | 165 | RB1 |
실시예 2: 암 관련 단백질 상호작용 네트워크의 구축
상기 표 1에서 나타난 암 관련 단백질과 HPRD(Human Protein Reference Database)에서 얻은 단백질 상호작용 데이터베이스를 활용하여 암 관련 단백질 상호작용 네트워크를 구축하였다. 단백질-단백질 상호작용 데이터베이스는 HPRD (Human Protein Reference Database)로부터 얻어[14], 암 관련 단백질 상호작용 네트워크를 구축하였고, InterViewer 프로그램으로 이를 시각화하였다(도 2 및 도 3 참조).
실시예 3 : 암 관련 질병 네트워크의 구축
암 관련 단백질 상호작용 네트워크에 포함된 단백질들의 질병정보를 OMIM (Online Mendelian Inheritance in Man)으로부터 확보하여 질병명으로 치환함으로서 암 관련 질병 네트워크를 구축하였다. 즉, 네트워크를 구성하는 단백질을 질병명으로 전환하였는데, 만약 단백질 중에서 다수의 질병과 관련이 있으면 하나의 단백질이 다수의 질병 노드로 전환되며 단백질 중에서 질병과 관련이 없는 단백질은 전환과정에서 제거된다. 이 과정을 통해서 암 관련 질병 네트워크를 구축하였다.
실시예 4 : 암 관련 질병 단백체의 발굴
상기 실시예 2 및 실시예 3에서 얻은 암 관련 단백질 상호작용 네트워크 및 질병 네트워크로부터 암 관련 질병 단백체를 발굴하였다. 발굴한 암 관련 질병 단백체의 리스트는 아래 표 2에 나타내었다.
번호 | 단백질명 | 번호 | 단백질명 | 번호 | 단백질명 |
1 | APC | 21 | EWSR1 | 41 | PDGFB |
2 | AR | 22 | FLT4 | 42 | PDGFRA |
3 | ATM | 23 | GNAI2 | 43 | PDGFRB |
4 | AXIN2 | 24 | GNAS | 44 | PIK3CA |
5 | BAX | 25 | HRAS | 45 | PMS2 |
6 | BCL10 | 26 | IRF1 | 46 | PPARG |
7 | BRAF | 27 | KIT | 47 | PRKAR1A |
8 | BRCA1 | 28 | KLF6 | 48 | PTEN |
9 | BRCA2 | 29 | LHCGR | 49 | PTPN11 |
10 | BRIP1 | 30 | MET | 50 | RASA1 |
11 | CASP10 | 31 | MLH1 | 51 | RB1 |
12 | CASP8 | 32 | MLH3 | 52 | RET |
13 | CCND1 | 33 | MSH2 | 53 | RUNX1 |
14 | CDH1 | 34 | MSH6 | 54 | STAT5B |
15 | CDKN2A | 35 | MUTYH | 55 | STK11 |
16 | CHEK2 | 36 | MXI1 | 56 | TCF1 |
17 | CTNNB1 | 37 | NF1 | 57 | TGFBR2 |
18 | EGFR | 38 | NF2 | 58 | TP53 |
19 | EP300 | 39 | NQO1 | 59 | TSHR |
20 | ERBB2 | 40 | NTRK1 | 60 | WT1 |
실시예
5 : 질병
단백체의
공통 도메인 분석
Pfam 데이터베이스를 이용하여 공통도메인을 분석하였다. "공통 도메인"이란 암 관련 질병 단백체들에서 나타나는 단백질 도메인 중에서 두 개 이상의 단백질에 공통적으로 나타나는 도메인을 의미한다. 공통도메인의 분석결과는 아래 [표 3]에 나타내었다.
번호 | 단백질 | 도메인 |
1 | APC | APC_15aa;APC_basic;APC_crr;Arm;EB1_binding;SAMP; |
2 | AR | Androgen_recep;Hormone_recep;zf-C4; |
3 | ATM | FAT;FATC;PI3_PI4_kinase;TAN; |
4 | BRAF | C1_1;Pkinase_Tyr;RBD; |
5 | CASP10 | DED;Peptidase_C14; |
6 | CASP8 | DED;Peptidase_C14; |
7 | CHEK2 | FHA;Pkinase; |
8 | CTNNB1 | Arm; |
9 | EGFR | Furin-like;Pkinase_Tyr;Recep_L_domain; |
10 | ERBB2 | Furin-like;Pkinase_Tyr;Recep_L_domain; |
11 | FLT4 | Pkinase_Tyr; |
12 | GNAI2 | G-alpha; |
13 | GNAS | G-alpha; |
14 | KIT | ig;Pkinase_Tyr; |
15 | KLF6 | zf-C2H2; |
16 | LHCGR | 7tm_1; |
17 | MET | Pkinase_Tyr;PSI;Sema;TIG; |
18 | MLH1 | DNA_mis_repair;HATPase_c; |
19 | MLH3 | DNA_mis_repair;HATPase_c;MutL_C; |
20 | MSH2 | MutS_I;MutS_II;MutS_III;MutS_IV;MutS_V; |
21 | MSH6 | MutS_I;MutS_II;MutS_III;MutS_IV;MutS_V;PWWP; |
22 | NF1 | RasGAP; |
23 | NTRK1 | Pkinase_Tyr; |
24 | PDGFRA | Pkinase_Tyr; |
25 | PDGFRB | ig;Pkinase_Tyr; |
26 | PIK3CA | PI3_PI4_kinase;PI3K_C2;PI3K_p85B;PI3K_rbd;PI3Ka; |
27 | PMS2 | DNA_mis_repair;HATPase_c;MutL_C; |
28 | PPARG | Hormone_recep;zf-C4; |
29 | PTPN11 | SH2;Y_phosphatase; |
30 | RASA1 | C2;PH;RasGAP;SH2;SH3_1; |
31 | RET | Cadherin;Pkinase_Tyr; |
32 | STAT5B | SH2;STAT_alpha;STAT_bind;STAT_int; |
33 | STK11 | Pkinase; |
34 | TGFBR2 | ecTbetaR2;Pkinase; |
35 | TSHR | 7tm_1; |
36 | WT1 | WT1;zf-C2H2; |
실시예
6 : 핵심 도메인의 선별
상기 실시예 5에서 추출된 공통 도메인의 분석 결과를 바탕으로 암의 치료 방법 및 치료제 개발에 유용한 핵심 도메인을 선별하였다. "핵심 도메인"이란 암의 성장과 진행에 있어서 중요한 역할을 할 것으로 기대되는 도메인으로서, 암의 성장과 진행과정을 효과적으로 제어할 수 있는 타깃이 될 수 있는 도메인을 의미한다. 예를 들어, 핵심 도메인은 상기의 공통 도메인을 가지고 있으면서 세포 주기, 세포 성장, 또는 세포 증식에 관여하는 단백질들만이 가지고 있는 도메인을 의미한다. 핵심 도메인의 리스트는 하기 [표 4]에 나타내었다.
단백질 | 핵심 도메인 |
APC | Arm |
AR | zf-C4 |
ATM | PI3_PI4_kinase |
CHEK2 | Pkinase |
STK11 | Pkinase |
WT1 | zf-C2H2 |
실시예 7 : 암관련 단백체 도메인 발굴시 생물정보학적 접근 방법의 유용성
본 발명자들은 생물정보학적 접근 방법을 이용하여 암관련 단백질 도메인을 확보하고 도메인 기반 암세포 성장을 제어하는 관계를 규명하였다. 즉, OMIM (Online Medelian Inheritance In Man) 데이터베이스로부터 암 관련 단백질 209개를 확보한 다음, 단백질 상호작용 네트워크를 구축하고 네트워크에 포함된 단백질을 관련 질병으로 전환하여 질병 네트워크를 구축한 다음, 이를 바탕으로 질병단백체를 발굴하였다. 질병단백체 도메인 정보를 pfam으로부터 확보하여 암 성장 네트워크 위에 위치시킴으로서 암 성장을 제어할 수 있는 방법을 제시하였다. 이러한 생물정보학적 접근 방법을 통해 제공되는 암 제어 관련 도메인 정보는 분자수준에서 선도화합물에 대한 실마리를 제공할 수 있을 것이고, 또는 몇몇 소량의 화합물을 기반으로 암 성장을 제어할 수 있는 기능성 건강음료 개발에 정보를 제공할 수 있을 것이다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.
Claims (5)
- 다음의 단계를 포함하는 암 관련 단백질 도메인을 발굴하는 방법:
(a) 암 관련 단백질 데이터베이스를 구축하는 단계;
(b) 상기 단계 (a)에서 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 단계;
(c) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환하는 단계;
(d) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크 및 상기 단계 (c)에서 얻은 암 관련 질병 네트워크로부터 암 관련 질병 단백체를 발굴하는 단계;
(e) 상기 단계 (d)에서 발굴한 암 관련 질병 단백체들의 공통 도메인을 분석하는 단계로서, 상기 공통 도메인의 분석은 Pfam 데이터베이스를 이용하여 행하는 단계; 및
(f) 상기 단계 (e)에서 분석한 공통 도메인 분석 결과를 기초로 암 관련 질병 단백체의 핵심 도메인을 선별하는 단계.
- 제 1 항에 있어서, 상기 단계 (a)의 암 관련 단백질 데이터베이스의 구축은 OMIM (Online Mendelian Inheritance In Man) 데이터베이스를 이용하여 행하는 것을 특징으로 하는 방법.
- 제 1 항에 있어서, 상기 단계 (b)에서 암 관련 질병 단백체의 발굴은 HPRD (Human Protein Reference Database) 데이터베이스를 이용하여 행하는 것을 특징으로 하는 방법.
- 삭제
- 제 1 항에 있어서, 상기 단계 (d)에서 상기 암 관련 질병 단백체의 발굴은 암과 암 관련 단백질과의 상관관계를 보여주는 암-단백질 이분할 그래프를 도출하여 행하는 것을 특징으로 하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110010118A KR101252649B1 (ko) | 2011-02-01 | 2011-02-01 | 암 관련 단백질 도메인을 발굴하는 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110010118A KR101252649B1 (ko) | 2011-02-01 | 2011-02-01 | 암 관련 단백질 도메인을 발굴하는 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120089034A KR20120089034A (ko) | 2012-08-09 |
KR101252649B1 true KR101252649B1 (ko) | 2013-04-09 |
Family
ID=46874010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110010118A KR101252649B1 (ko) | 2011-02-01 | 2011-02-01 | 암 관련 단백질 도메인을 발굴하는 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101252649B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956413A (zh) * | 2016-04-27 | 2016-09-21 | 王�忠 | 识别生物分子网络中关键模块或关键节点的方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101853916B1 (ko) * | 2016-04-05 | 2018-06-20 | 연세대학교 산학협력단 | 단백질 도메인의 생물경로 특이성 판단 방법, 및 이를 이용한 질병 유전자 발굴 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100118644A (ko) * | 2009-04-29 | 2010-11-08 | 충북대학교 산학협력단 | 질병네트워크로부터 질병단백체를 발굴하는 방법 |
-
2011
- 2011-02-01 KR KR1020110010118A patent/KR101252649B1/ko not_active IP Right Cessation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100118644A (ko) * | 2009-04-29 | 2010-11-08 | 충북대학교 산학협력단 | 질병네트워크로부터 질병단백체를 발굴하는 방법 |
Non-Patent Citations (2)
Title |
---|
이윤경 외 4명, ‘아토피관련 질병 네트워크로부터 질병단백체 발굴’, 한국콘텐츠학회논문지, Vo.4, No.9, 2009* |
이윤경 외 4명, '아토피관련 질병 네트워크로부터 질병단백체 발굴', 한국콘텐츠학회논문지, Vo.4, No.9, 2009 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956413A (zh) * | 2016-04-27 | 2016-09-21 | 王�忠 | 识别生物分子网络中关键模块或关键节点的方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20120089034A (ko) | 2012-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11519039B2 (en) | Methods for computer processing sequence reads to detect molecular residual disease | |
US11788144B2 (en) | Methods of identifying and treating a person having a predisposition to or afflicted with a cardiometabolic disease | |
CN111321140B (zh) | 一种基于单样本的肿瘤突变负荷检测方法和装置 | |
US20200069818A1 (en) | Crispr/cas9-based compositions and methods for treating cancer | |
US20180371453A1 (en) | Low-frequency mutations enrichment sequencing method for free target dna in plasma | |
CN110904235A (zh) | 检测肿瘤靶向药物相关基因突变的基因panel、方法、应用和试剂盒 | |
Kim et al. | Analysis of chromosomal changes in serous ovarian carcinoma using high‐resolution array comparative genomic hybridization: Potential predictive markers of chemoresistant disease | |
CN107475370A (zh) | 用于肺癌诊断的基因群和试剂盒及诊断方法 | |
CN109427412A (zh) | 用于检测肿瘤突变负荷的序列组合和其设计方法 | |
US11384382B2 (en) | Methods of attaching adapters to sample nucleic acids | |
US20240006022A1 (en) | Methods and systems for detecting insertions and deletions | |
Palande et al. | Detection of gene mutations and gene–gene fusions in circulating cell‐free DNA of glioblastoma patients: an avenue for clinically relevant diagnostic analysis | |
US20220036972A1 (en) | A noise measure for copy number analysis on targeted panel sequencing data | |
Bale et al. | Genomic characterization of recurrent high-grade astroblastoma | |
Ball et al. | Circulating tumor DNA as a marker of therapeutic response in patients with renal cell carcinoma: a pilot study | |
KR101252649B1 (ko) | 암 관련 단백질 도메인을 발굴하는 방법 | |
Mossanen et al. | Genomic features of muscle-invasive bladder cancer arising after prostate radiotherapy | |
Guan et al. | Individualized drug screening based on next generation sequencing and patient derived xenograft model for pancreatic cancer with bone metastasis | |
EP3778924A1 (en) | Molecular predictors of patient response to radiotherapy treatment | |
CN114574576B (zh) | 胆汁cfDNA在胆囊转移性癌症诊疗中的用途 | |
CN109136371B (zh) | 一种放疗疗效和毒性反应相关基因组合、检测探针库以及检测试剂盒 | |
Shimoda et al. | Development of two 410-cancer-gene panel tests for solid tumors and liquid biopsy based on genome data of 5,143 Japanese cancer patients | |
WO2023160574A1 (en) | Methods for detecting homologous recombination deficiency in cancer patients | |
US20240096469A1 (en) | Methods of predicting responses to disease treatments | |
Difilippo | Decoding Genetic Enigmas in Sarcoma |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |