KR101252649B1 - 암 관련 단백질 도메인을 발굴하는 방법 - Google Patents

암 관련 단백질 도메인을 발굴하는 방법 Download PDF

Info

Publication number
KR101252649B1
KR101252649B1 KR1020110010118A KR20110010118A KR101252649B1 KR 101252649 B1 KR101252649 B1 KR 101252649B1 KR 1020110010118 A KR1020110010118 A KR 1020110010118A KR 20110010118 A KR20110010118 A KR 20110010118A KR 101252649 B1 KR101252649 B1 KR 101252649B1
Authority
KR
South Korea
Prior art keywords
cancer
protein
proteins
database
disease
Prior art date
Application number
KR1020110010118A
Other languages
English (en)
Other versions
KR20120089034A (ko
Inventor
김학용
이윤경
유제운
구자을
박별나
유재수
박준호
Original Assignee
충북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 충북대학교 산학협력단 filed Critical 충북대학교 산학협력단
Priority to KR1020110010118A priority Critical patent/KR101252649B1/ko
Publication of KR20120089034A publication Critical patent/KR20120089034A/ko
Application granted granted Critical
Publication of KR101252649B1 publication Critical patent/KR101252649B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 암 관련 단백질 도메인을 발굴하는 방법에 관한 것으로서, 암 관련 단백질들을 단백질-단백질 상호작용 네트워크 및 질병-질병 상호작용 네트워크를 통해 얻고, 이렇게 얻어진 단백질들을 도메인 분석 과정을 거쳐 암 관련 핵심 단백질 도메인을 찾는 방법에 관한 것이다. 본 발명의 방법에 의하면, 짧은 시간안에 저비용으로 암에 관련된 단백질 도메인들을 대량으로 발굴할 수 있다. 또한, 본 발명의 방법에 의해 발굴된 암 관련 단백질 도메인들은 암의 성장을 억제하는 데 필요한 정보를 제공함으로써 암 치료방법 및 암 치료 선도물질 개발에 매우 유용하게 이용될 수 있다.

Description

암 관련 단백질 도메인을 발굴하는 방법{Method for Identifying Cancer Related Protein Domains}
본 발명은 암 관련 단백질 도메인을 발굴하는 방법에 관한 것으로서, 보다 상세하게는, 암 관련 단백질들을 단백질-단백질 상호작용 네트워크 및 질병-질병 상호작용 네트워크를 통해 얻고, 이렇게 얻어진 단백질들을 도메인 분석 과정을 거쳐 암 관련 핵심 단백질 도메인을 찾는 방법에 관한 것이다.
인간 질병에 관여하는 단백질들은 질병의 병리학적 기작 및 임상학적 실제를 이해하는데 중요한 요소이다. 전통적인 방법인 한 질병에 관여하는 단백질과의 연결고리를 분석하는 제한된 연구를 통해서 질병 사이의 복잡한 상관관계를 분석하고 이해하는 것은 한계가 있다. 네트워크의 구조적 및 기능적 분석방법과 질병관련 네트워크와의 결합을 통해서 복잡한 인간 질병체계를 이해하고자 한다면 시스템수준에서 질병을 이해하는 새로운 통찰력을 도출할 수 있을 것이다. 지난 수십 년 동안, 의학적 임상학적 접근방법은 질병과 한 두 개의 단백질 사이의 상관관계를 분석함으로써 질병을 이해하고자 하였다. 최근에 하나의 질병을 분석하기 보다는 질병 사이의 상관관계를 보여주는 질병 네트워크의 구조와 양상을 분석하고자 하는 새로운 접근방법이 제안되었다. 최근에 인간 질병과 유전자 사이에 상관관계를 규명하는 연구 결과가 보고되었는데, 하나의 유전 질환은 다양한 유전자와 연결되어 있고 이들 유전자는 또 다른 질환과 연결되어 결국 비슷한 질병들이 연결고리를 형성하고 있음을 밝혔다. 비록 유전 질환일지라도 표현형으로 나타나는 것은 단백질이다. 다시 말해 유전자가 병인의 근원은 되지만 실제 질환의 발생, 작용 기작 등은 표현형인 단백질에 의해서 좌우된다. 병의 원인을 규명하는 것은 유전자로부터 접근하는 것이 바람직하지만 질병의 확산, 질병과의 상관관계 등을 이해하는 데는 단백질을 분석하는 것이 바람직하다. 특히, 단백질 분자는 각각 서로 다른 분자를 인지할 수 있고, 적절한 상황에서 서로 결합하여 공동으로 기능을 수행한다. 따라서 복잡한 질병과의 상관관계의 분석은 단백질 네트워크를 분석하는 것이 필수적이라 하겠다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 암 치료에 중요한 타깃이 될 수 있는 단백질 도메인을 생물정보학적 접근 방식을 통해 대량으로 발굴하는 방법을 개발하기 위해 예의 연구 노력하였다. 그 결과, 암에 관련된 단백질들의 데이터베이스로부터 암 관련 단백질 상호작용 네트워크를 도출하고, 단백질 상호작용 네트워크로부터 암 관련 질병 네트워크를 구축하여 이 질병 네트워크의 분석을 통해 암과 관련된 질병 단백체를 대량으로 발굴한 후, 질병 단백체들의 도메인을 분석함으로써 암 치료에 중요한 타깃이 될 수 있는 핵심 도메인들을 대량으로 발굴하는데 성공하여 본 발명을 완성하였다.
따라서, 본 발명의 목적은 암 관련 단백질 도메인을 대량으로 발굴하는 방법을 제공하는 것에 있다.
본 발명의 목적 및 장점은 하기의 발명의 상세한 설명, 청구의 범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 암 관련 단백질 도메인을 발굴하는 방법을 제공한다: (a) 암 관련 단백질 데이터베이스를 구축하는 단계; (b) 상기 단계 (a)에서 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 단계; (c) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환하는 단계; (d) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크 및 상기 단계 (c)에서 얻은 암 관련 질병 네트워크로부터 암 관련 질병 단백체를 발굴하는 단계; (e) 상기 단계 (d)에서 발굴한 암 관련 질병 단백체들의 공통 도메인을 분석하는 단계; 및 (f) 상기 단계 (e)에서 분석한 공통 도메인 분석 결과를 기초로 암 관련 질병 단백체의 핵심 도메인을 선별하는 단계.
본 발명의 바람직한 구현예에 의하면, 상기 단계 (a)의 암 관련 단백질 데이터베이스의 구축은 OMIM (Online Mendelian Inheritance In Man) 데이터베이스를 이용하여 행한다.
본 발명의 다른 바람직한 구현예에 의하면, 상기 단계 (b)에서 암 관련 질병 단백체의 발굴은 HPRD (Human Protein Reference Database) 데이터베이스를 이용하여 행한다.
본 발명의 또 다른 바람직한 구현예에 의하면, 상기 단계 (e)의 공통 도메인의 분석은 Pfam 데이터베이스를 이용하여 행한다.
본 발명의 또 다른 바람직한 구현예에 의하면, 상기 단계 (d)에서 상기 암 관련 질병 단백체의 발굴은 암과 암 관련 단백질과의 상관관계를 보여주는 암-단백질 이분할 그래프를 도출하여 행한다.
이하에서 본 발명의 방법을 각 단계별로 나누어 상세히 설명한다.
(a) 암 관련 단백질 데이터베이스를 구축하는 단계
본 발명의 방법에서 첫 번째 단계는 암에 관련된 단백질 데이터베이스를 구축하는 단계이다. 암에 관련된 단백질 데이터베이스는 암에 관련된 유전자와 단백질을 데이터베이스화하여 제공하는 기존의 데이터베이스를 이용하여 구축할 수 있다. 예를 들어, OMIM (Online Mendelian Inheritance In Man)의 데이터 베이스를 이용하여 암에 관련된 단백질 데이터베이스 구축이 가능하다.
(b) 상기 단계 (a)에서 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 단계
본 발명의 방법에서 암 관련 단백질 상호작용 네트워크를 구축하는 과정은 상기 단계 (a)를 통해 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 행한다.
본 발명에서 용어 "단백질 상호작용 데이터베이스"는 단백질-단백질 상호 작용에 관한 데이터베이스로서, 특정의 단백질과 상호작용하는 단백질들에 대한 정보를 검색할 수 있는 데이터베이스를 의미한다. 이러한 단백질 상호작용 데이터베이스에 상기 암 관련 단백질 데이터베이스를 구성하는 각각의 단백질을 입력하여 이 단백질들과 상호작용이 가능한 모든 단백질들을 검색하고, 이에 대한 정보를 얻어 단백질 상호작용 네트워크를 구축한다.
본 명세서에서 사용되는 용어 "단백질 상호작용 네트워크"는 노드(단백질)와 링크(단백질 상호작용)를 결합시켜 구성한 것으로서, 예를 들어, 특정 단백질이 다른 단백질과 결합하는 경우 특정의 값(예: 1)을 부여하고, 특정 단백질이 다른 단백질과 전혀 결합하지 않는 경우 값을 0을 부여하여 구축할 수 있다.
본 발명의 방법에서 사용할 수 있는 단백질 상호작용 데이터베이스는 상기 단계 (a)에서와 마찬가지로 기존의 구축된 데이터베이스를 이용할 수 있는데, 예를 들어 HPRD (Human Protein Reference Database)에서 제공하는 데이터베이스가 있다.
본 발명의 방법에서 특징적인 기술 구성 중 하나는, 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 과정에서, 단백질 상호작용 데이터베이스에서 제공되는 데이터베이스를 정제하는 과정을 거치는 바, 이 정제과정은 데이터베이스의 단백질들 중에서 세포내에서 실질적으로 상호작용이 가능한 단백질들만을 선별하는 과정이다. 실질적으로 상호작용이 가능한 단백질들을 선별한다는 것은 세포내에서 동일한 세포소기관내, 예컨대 미토콘드리아에 존재하는 단백질들 사이는 실질적으로 상호작용이 일어날 가능성이 매우 큰 반면, 다른 세포소기관 예를 들어, 미토콘드리아와 핵질내에 각각 존재하는 단백질들은 실질적으로 상호작용이 일어날 가능성이 매우 낮으므로, 이렇게 단백질들의 세포내에서 존재하는 위치에 따라 상호작용이 일어날 가능성이 현저히 낮은 단백질들은 제외하는 과정을 거친다는 의미이다.
본 발명의 방법에서 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 과정에서 실질적으로 상호작용이 가능한 단백질들을 선별하는 정제 과정을 거치면 구축되는 암 관련 단백질 상호작용 네트워크의 정확도를 크게 향상시킬 수 있는 이점이 있다.
(c) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환하는 단계
상기 단계 (b)에서 구축된 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환한다. 암 관련 질병 네트워크로의 전환 방법은 단백질 질병 정보가 담겨진 기존의 구축된 데이터베이스를 이용할 수 있는데, 예를 들어, 암 관련 단백질 상호작용 네트워크에 포함된 단백질들의 질병정보를 OMIM (Online Mendelian Inheritance in Man)으로부터 확보하여 암 관련 단백질 상호작용 네트워크에서 질병명으로 치환함으로서 암 관련 질병 네트워크를 구축할 수 있다.
종래의 방법에서는 단백질 상호작용 네트워크로부터 직접 질병유전자를 발굴하였었는데, 이 경우 정확도를 위한 별도의 정제작업이 요구되나, 본 발명의 방법에서는 암 관련 단백질 상호작용 네트워크를 직접 질병 단백질로 전환하여 암 관련 질병 네트워크를 구축함으로써 별도의 정제작업 없이 정확도를 확보할 수 있게 된다. 왜냐하면, 암 질병에 관여하지 않는 단백질들은 단백질 상호작용 네트워크를 질병 네트워크로 전환하는 동안 자동적으로 제거되기 때문이다.
(d) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크 및 상기 단계 (c)에서 얻은 암 관련 질병 네트워크로부터 암 관련 질병 단백체를 발굴하는 단계
다음 단계로서, 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크와 상기 단계 (c)에서 얻은 암 관련 질병 네트워크를 이용하여 암 관련 질병 단백체를 발굴한다. 본 명세서에서 용어 "암 관련 질병 단백체"란 암에 관련된 단백질을 통칭하는 의미의 용어로서, 암 질병의 발생에서 매우 중요한 역할을 할 것으로 기대되는 단백질이다.
바람직하게는, 상기 암 관련 질병 단백체의 발굴은 암과 암 관련 단백질과의 상관관계를 보여주는 암-단백질 이분할 그래프를 도출하여 행한다. 본 명세서에서 사용되는 용어 "암-단백질 이분할 그래프"란 암과 암에 관련된 단백질들을 연결하여 만든 그래프로서, 암 질병에 어떠한 단백질들이 관여되어 있는 지를 시각적으로 용이하게 판별할 수 있도록 제작한 그래프이다. 이 암-단백질 이분할 그래프는 다음과 같이 작성한다. 즉, 질병 네트워크로부터 암 질병명을 얻고, 단백질 상호작용 네트워크로부터 암에 관여하는 단백질명을 얻어 이분할 그래프를 만든다. 이 암-단백질 이분할 그래프를 이용하면 암에 관여하는 단백질을 가시적으로 추출할 수 있어 대량으로 단시간에 암 관련 단백체 추출이 가능한 장점이 있다.
(e) 상기 단계 (d)에서 발굴한 암 관련 질병 단백체들의 공통 도메인을 분석하는 단계
상기 단계 (d)에서 암의 질병 단백체로 얻어진 단백질들의 공통 도메인을 분석한다. 상기 공통 도메인을 분석하는 방법은 단백질들의 도메인(domain)과 패밀리(family) 정보를 담고 있는 기존의 구축된 데이터베이스를 이용하여 행할 수 있으며, 예를 들어, Pfam 24.0 버전(Oct, 2009) 데이터베이스를 이용하여 도메인 정보를 추출할 수 있다.
본 명세서에서 사용된 용어 "공통 도메인"이란 암 관련 질병 단백체들에서 나타나는 단백질 도메인 중에서 두 개 이상의 단백질에 공통적으로 나타나는 도메인을 의미한다. 이러한 공통도메인을 선별하는 이점은, 하나의 공통 도메인을 공략함으로서 최소 두 개 이상의 단백질을 제어할 수 있는 장점이 있기 때문이다. 예를 들어, 암 관련 단백질 60개 중에서 Pkinase_Tyr라는 도메인을 가지고 있는 단백질은 10 개인데, 만약 이 Pkinase_Tyr 도메인을 공략한다면 10 개의 단백질을 동시에 제어할 수 있게 되어, 그 효율성을 극대화 할 수 있다.
(f) 상기 단계 (e)에서 분석한 공통 도메인 분석 결과를 기초로 암 관련 질병 단백체의 핵심 도메인을 선별하는 단계.
상기 단계 (e)에서 분석된 공통 도메인의 분석 결과를 토대로 핵심 도메인을 선별한다. 본 명세서에서 사용되는 용어 "핵심 도메인"이란 암의 성장과 진행에 있어서 중요한 역할을 할 것으로 기대되는 도메인으로서, 암의 성장과 진행과정을 효과적으로 제어할 수 있는 타깃이 될 수 있는 도메인을 의미한다. 예를 들어, 핵심 도메인은 공통 도메인을 가지고 있으면서 세포 주기, 세포 성장, 또는 세포 증식에 관여하는 단백질들이 가지는 도메인만을 의미한다.
본 발명의 방법은 암을 죽이는 대신 암의 성장이나 진행을 억제하는 "핵심 도메인"의 선별에 초점을 맞춘다. 왜냐하면 암은 강압적으로 억제하면 억제할수록 다른 변이가 일어나면서 더 큰 악성 특성을 나타내기 때문이다. 또 다른 이유로는 지금까지 종래의 암 치료제 또는 억제제는 암 세포뿐만 아니라 정상 세포도 함께 제거하거나 죽이는 등의 부작용 문제를 가지고 있었고, 또한, 전술한 "공통 도메인"을 억제하는 경우, 인체에서 매우 중요한 기능을 수행하는 단백질이 만약 상기 공통 도메인을 가지고 있다면 암의 제어뿐만 아니라 정상 세포의 기능도 저해할 수 있다. 따라서, 이러한 문제점을 피하기 위해서 본 발명은 암의 성장과 진행에만 관여하는 단백질의 핵심 도메인만을 추출하고 선택적으로 제어함으로서 암의 성장과 진행을 제어하는데 초점을 맞춘다. 물론 "핵심 도메인"의 억제에 의해 정상 세포의 성장도 억제되겠지만 암이 진행되는 시점에서 인체의 세포는 대부분 성장이 멈춘 상태이기 때문에 심각한 부작용은 나타나지 않는다. 이러한 이유로 본 발명의 방법은 "공통 도메인"으로부터 다시 "핵심 도메인"을 추출한다. 공통 도에인에서 핵심 도메인의 추출은 세포주기, 세포성장, 세포증식에 관여하는 도메인을 추출하여 행한다. 이들 핵심 도메인을 포함하는 단백질을 KEGG 경로에 입력하였을 때 세포증식이나 세포 사멸 경로로 집중되는 것을 볼 수 있다[도면 4]. 따라서, 본 발명에서 발굴된 핵심도메인을 제어하면 세포 증식을 제어할 수 있을 것으로 기대된다.
상술한 바와 같이, 본 발명은 암 관련 단백질 도메인을 발굴하는 방법에 관한 것이다. 본 발명의 방법에 의하면, 짧은 시간 안에 저비용으로 암에 관련된 단백질 도메인들을 대량으로 발굴하는 것이 가능하다. 본 발명의 방법에 의해 발굴된 암 관련 단백질 도메인들은 암의 성장을 억제하는 데 필요한 정보, 치료방법 및 치료 선도물질 개발에 유용한 정보를 제공할 수 있다.
도 1은 본 발명 방법의 전체 흐름도를 보여주는 도면이다.
도 2는 암과 관련된 단백질들의 상호작용 네트워크를 보여주는 도면이다.
도 3은 암 관련 질병 네트워크를 보여주는 도면이다.
도 4는 성장 관련 암세포 경로 상에서 단백질과 도메인 위치 정보를 파악하는 도면이다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
실시예
실시예 1: 암 관련 단백질 데이터 베이스의 구축
암에 관련된 단백질들의 리스트(list)를 추출하여 암 관련 단백질 데이터 베이스를 구축하였다. 암 관련 단백질 209개를 OMIM (Online Mendelian Inheritance in Man) 데이터베이스로부터 얻었고, 이를 아래 [표 1]에 요약하여 나타내었다.
번호 단백질명 번호 단백질명 번호 단백질명 번호 단백질명
1 ABL1 56 FACL6 111 MSR1 166 RB1CC1
2 ACVR1B 57 FCGR2B 112 MUTYH 167 RBBP8
3 AF10 58 FGFR2 113 MXI1 168 RECQL3
4 AF1Q 59 FGFR3 114 MYC 169 RET
5 APC 60 FGFR4 115 NBS1 170 RNASEL
6 AR 61 FH 116 NCOA4 171 RNF6
7 ARHGEF12 62 FLCN 117 NF1 172 RRAS2
8 ARL11 63 FLT3 118 NF2 173 RUNX1
9 ARMET 64 FLT4 119 NME1 174 SDHB
10 ARNT 65 FOXO1A 120 NPM1 175 SDHC
11 ASPCR1 66 FSHR 121 NQO1 176 SDHD
12 ATBF1 67 GATA1 122 NRAS 177 SH2D1A
13 ATM 68 GMPS 123 NTRK1 178 SLC22A1L
14 AXIN1 69 GNAI2 124 NUMA1 179 SMARCB1
15 AXIN2 70 GNAS 125 NUP214 180 SMOH
16 BARD1 71 GOLGA5 126 ODC1 181 SRC
17 BAX 72 GPC3 127 OGG1 182 SSX1
18 BCL10 73 GRAF 128 OPCML 183 SSX2
19 BCL2 74 HMGA2 129 P2RX7 184 STAT5B
20 BCL7A 75 HOXD4 130 PAX3 185 STK11
21 BCL8 76 HRAS 131 PAX7 186 SUFU
22 BCR 77 HRPT2 132 PCM1 187 TAL1
23 BMPR1A 78 IGF2R 133 PDGFB 188 TAL2
24 BRAF 79 IL1B 134 PDGFRA 189 TCF1
25 BRCA1 80 IL1RN 135 PDGFRB 190 TCRA
26 BRCA2 81 ING1 136 PDGFRL 191 TFE3
27 BRIP1 82 IRF1 137 PHB 192 TGFBR2
28 BUB1 83 IRF4 138 PIK3CA 193 THRA
29 BUB1B 84 KDR 139 PLA2G2A 194 TIF1G
30 CALM 85 KIT 140 PLAG1 195 TNFRSF10B
31 CASP10 86 KLF6 141 PML 196 TNFRSF6
32 CASP8 87 KRAS2 142 PMS1 197 TP53
33 CBFB 88 LGI1 143 PMS2 198 TRC8
34 CCND1 89 LHCGR 144 PMX2B 199 TRIM24
35 CDH1 90 LIG4 145 POU6F2 200 TSG101
36 CDK4 91 LPP 146 PPARG 201 TSHR
37 CDKN2A 92 LZTS1 147 PPM1D 202 VHL
38 CEBPA 93 MAD1L1 148 PPP2R1B 203 WHSC1L1
39 CHEK2 94 MADH4 149 PRCC 204 WT1
40 CHIC2 95 MALT1 150 PRKAR1A 205 WWOX
41 COL4A6 96 MAML2 151 PRKCA 206 XRCC3
42 CSF1R 97 MAP3K8 152 PRKN 207 ZNF145
43 CSMF 98 MCC 153 PTCH 208 ZNF198
44 CTNNB1 99 MDM2 154 PTCH2 209 ZNFN1A1
45 DCC 100 MECT1 155 PTEN
46 DDIT3 101 MEN1 156 PTHR1
47 DLC1 102 MET 157 PTPN11
48 DMBT1 103 MINPP1 158 PTPN12
49 EGFR 104 MKL1 159 PTPRJ
50 ELAC2 105 MLH1 160 RAD51A
51 EP300 106 MLH3 161 RAD54B
52 EPHB2 107 MN1 162 RAD54L
53 ERBB2 108 MSH2 163 RAP1GDS1
54 EWSR1 109 MSH3 164 RASA1
55 EXT1 110 MSH6 165 RB1
실시예 2: 암 관련 단백질 상호작용 네트워크의 구축
상기 표 1에서 나타난 암 관련 단백질과 HPRD(Human Protein Reference Database)에서 얻은 단백질 상호작용 데이터베이스를 활용하여 암 관련 단백질 상호작용 네트워크를 구축하였다. 단백질-단백질 상호작용 데이터베이스는 HPRD (Human Protein Reference Database)로부터 얻어[14], 암 관련 단백질 상호작용 네트워크를 구축하였고, InterViewer 프로그램으로 이를 시각화하였다(도 2 및 도 3 참조).
실시예 3 : 암 관련 질병 네트워크의 구축
암 관련 단백질 상호작용 네트워크에 포함된 단백질들의 질병정보를 OMIM (Online Mendelian Inheritance in Man)으로부터 확보하여 질병명으로 치환함으로서 암 관련 질병 네트워크를 구축하였다. 즉, 네트워크를 구성하는 단백질을 질병명으로 전환하였는데, 만약 단백질 중에서 다수의 질병과 관련이 있으면 하나의 단백질이 다수의 질병 노드로 전환되며 단백질 중에서 질병과 관련이 없는 단백질은 전환과정에서 제거된다. 이 과정을 통해서 암 관련 질병 네트워크를 구축하였다.
실시예 4 : 암 관련 질병 단백체의 발굴
상기 실시예 2 및 실시예 3에서 얻은 암 관련 단백질 상호작용 네트워크 및 질병 네트워크로부터 암 관련 질병 단백체를 발굴하였다. 발굴한 암 관련 질병 단백체의 리스트는 아래 표 2에 나타내었다.
번호 단백질명 번호 단백질명 번호 단백질명
1 APC 21 EWSR1 41 PDGFB
2 AR 22 FLT4 42 PDGFRA
3 ATM 23 GNAI2 43 PDGFRB
4 AXIN2 24 GNAS 44 PIK3CA
5 BAX 25 HRAS 45 PMS2
6 BCL10 26 IRF1 46 PPARG
7 BRAF 27 KIT 47 PRKAR1A
8 BRCA1 28 KLF6 48 PTEN
9 BRCA2 29 LHCGR 49 PTPN11
10 BRIP1 30 MET 50 RASA1
11 CASP10 31 MLH1 51 RB1
12 CASP8 32 MLH3 52 RET
13 CCND1 33 MSH2 53 RUNX1
14 CDH1 34 MSH6 54 STAT5B
15 CDKN2A 35 MUTYH 55 STK11
16 CHEK2 36 MXI1 56 TCF1
17 CTNNB1 37 NF1 57 TGFBR2
18 EGFR 38 NF2 58 TP53
19 EP300 39 NQO1 59 TSHR
20 ERBB2 40 NTRK1 60 WT1
실시예 5 : 질병 단백체의 공통 도메인 분석
Pfam 데이터베이스를 이용하여 공통도메인을 분석하였다. "공통 도메인"이란 암 관련 질병 단백체들에서 나타나는 단백질 도메인 중에서 두 개 이상의 단백질에 공통적으로 나타나는 도메인을 의미한다. 공통도메인의 분석결과는 아래 [표 3]에 나타내었다.
번호 단백질 도메인
1 APC APC_15aa;APC_basic;APC_crr;Arm;EB1_binding;SAMP;
2 AR Androgen_recep;Hormone_recep;zf-C4;
3 ATM FAT;FATC;PI3_PI4_kinase;TAN;
4 BRAF C1_1;Pkinase_Tyr;RBD;
5 CASP10 DED;Peptidase_C14;
6 CASP8 DED;Peptidase_C14;
7 CHEK2 FHA;Pkinase;
8 CTNNB1 Arm;
9 EGFR Furin-like;Pkinase_Tyr;Recep_L_domain;
10 ERBB2 Furin-like;Pkinase_Tyr;Recep_L_domain;
11 FLT4 Pkinase_Tyr;
12 GNAI2 G-alpha;
13 GNAS G-alpha;
14 KIT ig;Pkinase_Tyr;
15 KLF6 zf-C2H2;
16 LHCGR 7tm_1;
17 MET Pkinase_Tyr;PSI;Sema;TIG;
18 MLH1 DNA_mis_repair;HATPase_c;
19 MLH3 DNA_mis_repair;HATPase_c;MutL_C;
20 MSH2 MutS_I;MutS_II;MutS_III;MutS_IV;MutS_V;
21 MSH6 MutS_I;MutS_II;MutS_III;MutS_IV;MutS_V;PWWP;
22 NF1 RasGAP;
23 NTRK1 Pkinase_Tyr;
24 PDGFRA Pkinase_Tyr;
25 PDGFRB ig;Pkinase_Tyr;
26 PIK3CA PI3_PI4_kinase;PI3K_C2;PI3K_p85B;PI3K_rbd;PI3Ka;
27 PMS2 DNA_mis_repair;HATPase_c;MutL_C;
28 PPARG Hormone_recep;zf-C4;
29 PTPN11 SH2;Y_phosphatase;
30 RASA1 C2;PH;RasGAP;SH2;SH3_1;
31 RET Cadherin;Pkinase_Tyr;
32 STAT5B SH2;STAT_alpha;STAT_bind;STAT_int;
33 STK11 Pkinase;
34 TGFBR2 ecTbetaR2;Pkinase;
35 TSHR 7tm_1;
36 WT1 WT1;zf-C2H2;
실시예 6 : 핵심 도메인의 선별
상기 실시예 5에서 추출된 공통 도메인의 분석 결과를 바탕으로 암의 치료 방법 및 치료제 개발에 유용한 핵심 도메인을 선별하였다. "핵심 도메인"이란 암의 성장과 진행에 있어서 중요한 역할을 할 것으로 기대되는 도메인으로서, 암의 성장과 진행과정을 효과적으로 제어할 수 있는 타깃이 될 수 있는 도메인을 의미한다. 예를 들어, 핵심 도메인은 상기의 공통 도메인을 가지고 있으면서 세포 주기, 세포 성장, 또는 세포 증식에 관여하는 단백질들만이 가지고 있는 도메인을 의미한다. 핵심 도메인의 리스트는 하기 [표 4]에 나타내었다.
단백질 핵심 도메인
APC Arm
AR zf-C4
ATM PI3_PI4_kinase
CHEK2 Pkinase
STK11 Pkinase
WT1 zf-C2H2
실시예 7 : 암관련 단백체 도메인 발굴시 생물정보학적 접근 방법의 유용성
본 발명자들은 생물정보학적 접근 방법을 이용하여 암관련 단백질 도메인을 확보하고 도메인 기반 암세포 성장을 제어하는 관계를 규명하였다. 즉, OMIM (Online Medelian Inheritance In Man) 데이터베이스로부터 암 관련 단백질 209개를 확보한 다음, 단백질 상호작용 네트워크를 구축하고 네트워크에 포함된 단백질을 관련 질병으로 전환하여 질병 네트워크를 구축한 다음, 이를 바탕으로 질병단백체를 발굴하였다. 질병단백체 도메인 정보를 pfam으로부터 확보하여 암 성장 네트워크 위에 위치시킴으로서 암 성장을 제어할 수 있는 방법을 제시하였다. 이러한 생물정보학적 접근 방법을 통해 제공되는 암 제어 관련 도메인 정보는 분자수준에서 선도화합물에 대한 실마리를 제공할 수 있을 것이고, 또는 몇몇 소량의 화합물을 기반으로 암 성장을 제어할 수 있는 기능성 건강음료 개발에 정보를 제공할 수 있을 것이다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.

Claims (5)

  1. 다음의 단계를 포함하는 암 관련 단백질 도메인을 발굴하는 방법:
    (a) 암 관련 단백질 데이터베이스를 구축하는 단계;
    (b) 상기 단계 (a)에서 얻은 암 관련 단백질 데이터베이스를 단백질 상호작용 데이터베이스를 통해 전환하여 암 관련 단백질 상호작용 네트워크를 구축하는 단계;
    (c) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크를 암 관련 질병 네트워크로 전환하는 단계;
    (d) 상기 단계 (b)에서 얻은 암 관련 단백질 상호작용 네트워크 및 상기 단계 (c)에서 얻은 암 관련 질병 네트워크로부터 암 관련 질병 단백체를 발굴하는 단계;
    (e) 상기 단계 (d)에서 발굴한 암 관련 질병 단백체들의 공통 도메인을 분석하는 단계로서, 상기 공통 도메인의 분석은 Pfam 데이터베이스를 이용하여 행하는 단계; 및
    (f) 상기 단계 (e)에서 분석한 공통 도메인 분석 결과를 기초로 암 관련 질병 단백체의 핵심 도메인을 선별하는 단계.
  2. 제 1 항에 있어서, 상기 단계 (a)의 암 관련 단백질 데이터베이스의 구축은 OMIM (Online Mendelian Inheritance In Man) 데이터베이스를 이용하여 행하는 것을 특징으로 하는 방법.
  3. 제 1 항에 있어서, 상기 단계 (b)에서 암 관련 질병 단백체의 발굴은 HPRD (Human Protein Reference Database) 데이터베이스를 이용하여 행하는 것을 특징으로 하는 방법.
  4. 삭제
  5. 제 1 항에 있어서, 상기 단계 (d)에서 상기 암 관련 질병 단백체의 발굴은 암과 암 관련 단백질과의 상관관계를 보여주는 암-단백질 이분할 그래프를 도출하여 행하는 것을 특징으로 하는 방법.
KR1020110010118A 2011-02-01 2011-02-01 암 관련 단백질 도메인을 발굴하는 방법 KR101252649B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110010118A KR101252649B1 (ko) 2011-02-01 2011-02-01 암 관련 단백질 도메인을 발굴하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110010118A KR101252649B1 (ko) 2011-02-01 2011-02-01 암 관련 단백질 도메인을 발굴하는 방법

Publications (2)

Publication Number Publication Date
KR20120089034A KR20120089034A (ko) 2012-08-09
KR101252649B1 true KR101252649B1 (ko) 2013-04-09

Family

ID=46874010

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110010118A KR101252649B1 (ko) 2011-02-01 2011-02-01 암 관련 단백질 도메인을 발굴하는 방법

Country Status (1)

Country Link
KR (1) KR101252649B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956413A (zh) * 2016-04-27 2016-09-21 王�忠 识别生物分子网络中关键模块或关键节点的方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101853916B1 (ko) * 2016-04-05 2018-06-20 연세대학교 산학협력단 단백질 도메인의 생물경로 특이성 판단 방법, 및 이를 이용한 질병 유전자 발굴 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100118644A (ko) * 2009-04-29 2010-11-08 충북대학교 산학협력단 질병네트워크로부터 질병단백체를 발굴하는 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100118644A (ko) * 2009-04-29 2010-11-08 충북대학교 산학협력단 질병네트워크로부터 질병단백체를 발굴하는 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
이윤경 외 4명, ‘아토피관련 질병 네트워크로부터 질병단백체 발굴’, 한국콘텐츠학회논문지, Vo.4, No.9, 2009*
이윤경 외 4명, '아토피관련 질병 네트워크로부터 질병단백체 발굴', 한국콘텐츠학회논문지, Vo.4, No.9, 2009 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956413A (zh) * 2016-04-27 2016-09-21 王�忠 识别生物分子网络中关键模块或关键节点的方法

Also Published As

Publication number Publication date
KR20120089034A (ko) 2012-08-09

Similar Documents

Publication Publication Date Title
US11519039B2 (en) Methods for computer processing sequence reads to detect molecular residual disease
US11788144B2 (en) Methods of identifying and treating a person having a predisposition to or afflicted with a cardiometabolic disease
CN111321140B (zh) 一种基于单样本的肿瘤突变负荷检测方法和装置
US20200069818A1 (en) Crispr/cas9-based compositions and methods for treating cancer
US20180371453A1 (en) Low-frequency mutations enrichment sequencing method for free target dna in plasma
CN110904235A (zh) 检测肿瘤靶向药物相关基因突变的基因panel、方法、应用和试剂盒
Kim et al. Analysis of chromosomal changes in serous ovarian carcinoma using high‐resolution array comparative genomic hybridization: Potential predictive markers of chemoresistant disease
CN107475370A (zh) 用于肺癌诊断的基因群和试剂盒及诊断方法
CN109427412A (zh) 用于检测肿瘤突变负荷的序列组合和其设计方法
US11384382B2 (en) Methods of attaching adapters to sample nucleic acids
US20240006022A1 (en) Methods and systems for detecting insertions and deletions
Palande et al. Detection of gene mutations and gene–gene fusions in circulating cell‐free DNA of glioblastoma patients: an avenue for clinically relevant diagnostic analysis
US20220036972A1 (en) A noise measure for copy number analysis on targeted panel sequencing data
Bale et al. Genomic characterization of recurrent high-grade astroblastoma
Ball et al. Circulating tumor DNA as a marker of therapeutic response in patients with renal cell carcinoma: a pilot study
KR101252649B1 (ko) 암 관련 단백질 도메인을 발굴하는 방법
Mossanen et al. Genomic features of muscle-invasive bladder cancer arising after prostate radiotherapy
Guan et al. Individualized drug screening based on next generation sequencing and patient derived xenograft model for pancreatic cancer with bone metastasis
EP3778924A1 (en) Molecular predictors of patient response to radiotherapy treatment
CN114574576B (zh) 胆汁cfDNA在胆囊转移性癌症诊疗中的用途
CN109136371B (zh) 一种放疗疗效和毒性反应相关基因组合、检测探针库以及检测试剂盒
Shimoda et al. Development of two 410-cancer-gene panel tests for solid tumors and liquid biopsy based on genome data of 5,143 Japanese cancer patients
WO2023160574A1 (en) Methods for detecting homologous recombination deficiency in cancer patients
US20240096469A1 (en) Methods of predicting responses to disease treatments
Difilippo Decoding Genetic Enigmas in Sarcoma

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee