KR20170048227A - 암 환자의 유전체 염기서열 변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템 - Google Patents

암 환자의 유전체 염기서열 변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템 Download PDF

Info

Publication number
KR20170048227A
KR20170048227A KR1020160140346A KR20160140346A KR20170048227A KR 20170048227 A KR20170048227 A KR 20170048227A KR 1020160140346 A KR1020160140346 A KR 1020160140346A KR 20160140346 A KR20160140346 A KR 20160140346A KR 20170048227 A KR20170048227 A KR 20170048227A
Authority
KR
South Korea
Prior art keywords
gene
cancer
survival
mutation
information
Prior art date
Application number
KR1020160140346A
Other languages
English (en)
Other versions
KR101949286B1 (ko
Inventor
김주한
Original Assignee
주식회사 싸이퍼롬
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 싸이퍼롬 filed Critical 주식회사 싸이퍼롬
Priority to US15/771,288 priority Critical patent/US20180312928A1/en
Priority to PCT/KR2016/012108 priority patent/WO2017074036A2/ko
Priority to JP2018542073A priority patent/JP6681475B2/ja
Publication of KR20170048227A publication Critical patent/KR20170048227A/ko
Application granted granted Critical
Publication of KR101949286B1 publication Critical patent/KR101949286B1/ko

Links

Images

Classifications

    • G06F19/22
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G06F19/18
    • G06F19/28
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Public Health (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)

Abstract

본 발명은 암 유전체 염기서열 변이와 환자 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템에 관한 것으로, 보다 구체적으로 암 유전체 염기서열 변이 중 합성암생존 (Synthetic Cancer Survival) 유전자의 변이 정보를 이용한 맞춤형 항암 치료 약물 선택 방법 및 시스템에 관한 것이다. 본 발명의 암 유전체 돌연변이와 환자 생존 정보, 또는 암세포나 조직의 침윤 또는 전이 능력 평가를 이용한 맞춤형 항암 치료 방법 및 시스템은 암 유전체 염기서열 변이와 암 생존 및 전이 정보로부터 도출한 합성암생존 유전자 쌍의 변이 분석을 통하여 개인별로 치료 효과 및 예후가 좋은 항암 치료 약물을 효과적으로 선택할 수 있는 기술로서 신뢰도가 높으며, 신속하고 간단하게 관련 정보를 제공할 수 있다.

Description

암 환자의 유전체 염기서열 변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템 {Method and system for tailored anti-cancer therapy based on the information of genomic sequence variant and survival of cancer patient}
본 발명은 암 환자의 유전체 염기서열 변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템에 관한 것으로, 보다 구체적으로 암 환자의 유전체 염기서열 변이 중 합성암생존 (Synthetic Cancer Survival) 유전자의 변이 정보를 이용한 맞춤형 항암 치료 약물 선택 방법 및 시스템에 관한 것이다.
생명공학 기술의 발전으로 인해 현재는 인간의 전 유전체 염기서열(whole genome sequence)을 분석하여 개개인의 질병을 예측하고 맞춤형 질병 예방 및 치료 방법을 제공하는 단계까지 도달하였다.
유전체학의 급속한 발전으로 암의 병인론으로 유전체의 불안정성과 누적된 변형이 정설로 정립되었으며, 유전체의 고속대용량 분석 및 정보처리 신기술의 급속한 발전으로 선진국에서는 실제 임상적용이 빠르게 실현되고 있다.
한편, 원발성 종양이 있는 암환자의 치료에 있어서 중요한 부분 중 하나는 정확한 예후(prognosis)의 예측이며, 이러한 예후는 나이, 병리학적 소견 등 일반적인 임상 변인에 기초하여 판단될 뿐만 아니라, 최근에는 유전체학적 변이나 증폭과 같은 분자적 변인들에 기초하여 판단되고 있다. 대표적으로 ER, PR, HER2의 단백질 발현 수준이 유방암의 중요한 예후 인자로 확인되었으며, 이는 실제 치료에도 적용되고 있다. 또한, 최근 난소암의 분자적 프로파일을 이용한 예후 예측한 연구가 소개되었으며, 이 연구에서는 유방암의 예후 인자로 알려져 있던 BRCA1 유전자와 BRCA2 유전자에 존재하는 돌연변이의 여부에 따라 해당 환자군의 예후가 서로 다름을 보고하였다. 이 연구는 임상적 변인 외에 분자적 프로파일로도 암환자의 예후를 측정할 수 있음을 확인한 초기 연구 중 하나이며, 분자 유전체학적 지표가 다양한 암종에 다양한 방식으로 활용 가능함을 시사한 연구다.
최근, 다양한 암유전체 분석 데이터와 그 분석결과 등이 TCGA (The Cancer Genome Atlas), ICGC (International Cancer Genome Consortium) 등의 사업을 통해 발표되었고 관련 논문들도 다수 발표되었다. 현재 대부분의 주요 암종에 대해 유전체, 전사체, 후성유전체 등의 프로파일 분석 데이터가 발표되었으며, 암의 원인 유전자 찾기, 암의 분자적 분류를 돕는 생물학적 지표 (biomarker) 찾기, 예후 인자 찾기, 치료 반응 지표 찾기, 암 조직과 암 유전체 변이의 이질성 (heterogeneity) 등에 관한 다양한 내용들이 포함되었다.
현재까지 발표된 대부분의 연구들은 개별 유전자의 특성과 역할에 대한 연구에 초점이 맞추어져 있으며, 암의 치료 표적이나 예후 지표와 관련된 연구들 역시 개별 유전자와 단일 암종에 대한 한정적 연구가 대부분이다. 그러나 이렇게 확인된 원인 유전자들이 직접적으로 치료표적이나 신약개발에 적용하기는 그리 쉽지 않으며, 암의 복잡성과 이질성(heterogeneity)으로 인해 단일 생물학적 지표 중심의 암 연구 결과는 개인차를 반영한 개인 맞춤의학(personalized medicine)적 적용이 쉽지 않아 실제 임상 적용에서 다양한 한계를 보인다.
따라서 현재의 단일 생물학적 지표를 이용한 암 연구의 한계를 극복하기 위해서는 개인별 유전체 염기서열 변이의 종합적 분석 정보를 직접 활용한 데이터 기반의 맞춤형 항암 치료 약물 선택 방법론에 기반한 개인 맞춤형 암 진단 및 치료 방법론 개발의 필요성이 강하게 제기된다.
본 발명은 상기와 같은 점을 감안하여 안출된 것으로, 암 환자의 유전체 돌연변이 정보와 생존 정보를 활용하여 암종별 합성암생존 유전자 쌍을 도출한 후, 개인 암 환자의 유전체 염기서열 변이 정보 분석을 통해 하나 이상의 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자를 선정하고, 상기 선정된 하나 이상의 변이 유전자와 쌍을 이루어 합성암생존 유전자 쌍을 구성하는 하나 이상의 대응 유전자를 억제할 수 있는 하나 이상의 후보 약물을 선택함으로써, 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법 및 시스템을 제공하고자 한다.
한 양태에서 본 발명은 암 환자의 유전체 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍에 속하는 하나 이상의 유전자의 염기서열 변이 정보를 결정하는 단계; 및 상기 염기서열 변이 정보로부터 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자와 쌍을 이루는 하나 이상의 대응 유전자를 억제하는 하나 이상의 후보 약물을 선정하는 단계를 포함하는, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법을 제공한다.
다른 양태에서 본 발명은 암 환자에 대해 적용대상이 되는 항암 치료 약물 및 상기 약물이 억제할 수 있는 유전자와 관련된 정보 검색 또는 추출이 가능한 데이터베이스; 상기 데이터베이스에 접근 가능한 통신부; 암 유전체 염기서열 분석부; 약물 선택 정보 제공부; 및 표시부를 포함하며, 상기 암 유전체 염기서열 분석부는 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자를 선정하는 변이 유전자 선정부 및 상기 하나 이상의 변이 유전자에 대해 해당 변이 유전자와 쌍을 이루어 합성암생존 유전자 쌍을 구성하는 하나 이상의 대응 유전자를 선정하는 대응 유전자 선정부를 포함하고, 상기 약물 선택 정보 제공부는 상기 하나 이상의 대응 유전자를 억제하는 항암 치료 약물 선택 정보를 제공하는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택 시스템을 제공한다.
또 다른 양태에서 본 발명은 암 환자의 유전체 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍을 선별하는 단계; 및 상기 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자와 쌍을 이루는 하나 이상의 대응 유전자를 억제하는 하나 이상의 후보 약물을 선별하는 단계를 포함하는 동작을 수행하는 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체를 제공한다.
또 다른 양태에서 본 발명은 암 환자 유전체의 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍에 속하는 하나 이상의 유전자의 수를 산출하는 단계;를 포함하는, 암 환자의 예후 예측을 위한 정보를 제공하는 방법을 제공한다.
또 다른 양태에서 본 발명은 암 환자에 대해 적용대상이 되는 항암 치료 약물 및 상기 약물이 억제할 수 있는 유전자와 관련된 정보 검색 또는 추출이 가능한 데이터베이스; 상기 데이터베이스에 접근 가능한 통신부; 암 유전체 염기서열 분석부; 약물 선택 정보 제공부; 및 표시부를 포함하며, 상기 암 유전체 염기서열 분석부는 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자를 선정하는 변이 유전자쌍 선정부 및 상기 하나 이상의 변이 유전자에 대해 해당 변이 유전자와 쌍을 이루어 합성암생존 유전자 쌍을 구성하는 하나 이상의 대응 유전자를 선정하는 대응 유전자 선정부를 포함하고, 상기 약물 선택 정보 제공부는 상기 암 환자의 합성암생존 유전자 쌍의 개수를 증가시키는 약물 선택 정보를 제공하는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택 시스템을 제공한다.
또 다른 양태에서 본 발명은 암 환자의 유전체 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍을 선별하는 단계; 및 상기 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자와 쌍을 이루는 하나 이상의 대응 유전자를 억제하는 하나 이상의 후보 약물 중에서 합성암생존 유전자 쌍의 개수를 증가시키는 후보 약물을 선별하는 단계를 포함하는 동작을 수행하는 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체를 제공한다.
본 발명에 따른 암 환자의 유전체 돌연변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템은 암 환자의 유전체 돌연변이 정보와 생존 정보로부터 도출한 합성암생존 유전자 쌍의 염기서열 변이 분석을 통하여 개인별로 치료 효과 및 예후가 좋은 항암 치료 약물을 선택할 수 있는 기술로서 신뢰도가 높으며 신속하고 간단하게 관련 정보를 제공할 수 있다.
본 발명에 따른 방법 및 시스템을 이용할 경우, 합성암생존을 유발하는 유전자 쌍에 속하는 하나 이상의 변이 유전자를 선정하고, 해당 변이 유전자와 쌍을 이루어 합성암생존 유전자 쌍을 구성하는 하나 이상의 대응 유전자의 선정을 통해, 상기 대응 유전자를 억제하는 하나 이상의 항암 치료 약물을 선택함으로써, 여러 개의 비교 대상 약물 중에서 개인별 맞춤형 항암제 선택이 가능하며, 약물의 효과 또는 부작용 위험률 등을 사전에 예측함으로써 개인에 적용되는 항암제 간의 우선순위, 최적조합, 또는 사용 여부를 결정할 수 있다. 또한, 합성암생존 유전자 쌍에 속하는 변이 유전자의 조합 중, 특정 암종별로 해당 암종에서 다수의 환자에서 발견되는 하나 이상의 변이 유전자의 조합을 선정하여, 개별 환자의 유전체 염기서열 분석결과와는 독립적으로, 일반적으로 해당 암종의 다수의 환자에서 치료 효과 및 예후가 좋을 것으로 예측되는 하나 이상의 항암 치료 약물의 조합을 선택하여 각 암종별로 특화된 복합항암요법(combination chemotherapy)의 개발 및 임상적용에 활용할 수 있는 기술로서 신뢰도가 높으며 신속하고 간단하게 관련 정보를 제공할 수 있다.
또한, 본 발명에 따른 방법 및 시스템은 합성암생존 유전자 쌍의 개인별 염기서열 변이의 빈도 및 분포 분석을 통해 암의 예후를 예측하는데 사용될 수 있으며, 합성암생존 유전자 쌍과 체세포 돌연변이의 개인별 염기서열 변이의 빈도 및 분포 분석을 통해 암의 예후를 예측하는데 사용될 수 있다. 또한, 합성암생존 유전자 쌍과 체세포 돌연변이의 개인별 염기서열 변이의 빈도 및 분포 분석을 통해 약물 치료 반응성을 예측하는 데에도 효과적으로 사용될 수 있다.
도 1은 피부흑색종 환자에서 발견된 합성암생존 유전자 쌍의 하나인 DNAH2와 XIRP2 유전자 쌍의 일 예를 들어, 해당 일 합성암생존 유전자 쌍에 속하는 두 유전자 모두가 심한 (낮은) 유전자 손상 점수를 보이는 경우(빨간선), 두 유전자 중 한 개만 심한 유전자 손상 점수를 보이는 두 가지 경우(노랑선과 파란선) 및 두 유전자 모두가 심한 유전자 손상 점수를 보이지 않는 경우(녹색선)의 생존 분석 곡선을 나타낸 도이다.
도 2는 합성암생존 유전자 쌍을 구성하는 유전자의 네트워크를 나타낸 도이다 (폐선암 (LUAD, 빨간선), 피부흑색종 (SKCM, 노란선), 폐편평상피암 (LUSC, 파란선), HNSC (두경부편평상피암, 갈색선), KIRP(Kidney Renal Clear Cell Carcinoma, 보라선)).
도 3은 폐선암 환자군에서 발견되는 합성암생존 유전자 쌍으로 구성된 폐선암 합성암생존 네트워크를 배경으로, 한 명의 폐선암 환자의 체세포 돌연변이를 겹쳐 그린 도이다. 회색으로 그려진 폐선암 합성암생존 네트워크에서 하나의 노드는 폐선암의 합성암생존 유전자 쌍에 속하는 하나의 유전자를 의미하고, 연결선은 한 쌍의 합성암생존 유전자 쌍을 연결한다. 노란색 노드와 빨간색 노드는 해당 폐선암 환자에서 유전자 손상 점수가 낮은 체세포 돌연변이를 보이는 유전자를 나타내며, 이중 빨간색 노드는 연결선으로 연결된 대응 노드와 함께 합성암생존 유전자 쌍을 구성한 노드를 의미한다. 노란색 노드는 연결선으로 연결된 대응 노드 중 낮은 유전자 손상 점수를 갖는 유전자가 존재하지 않아서 합성암생존 유전자 쌍을 구성하지 않는 노드를 의미한다.
도 4는 폐선암의 일례를 들어, 폐선암 환자에서 낮은 유전자 손상 점수를 보이는 체세포 돌연변이의 발생 빈도를 유전자 별로 예시하여 막대 그래프로 나타낸 도이다. TP53와 TTN 유전자가 가장 흔히 유전자 손상 체세포 돌연변이를 보임이 예시되었다.
도 5는 폐선암의 일례를 들어, 폐선암 환자에서 합성암생존 유전자 쌍을 이루는 유전자들이 각각 몇 개의 합성암생존 유전자 쌍에 참여하는지를 해당 참여 빈도에 따라 누적 막대그래프로 나타낸 도이다. 예시된 빨간 색 꺾은 선 그래프는 해당 유전자가 몇 개의 합성암생존 유전자 쌍에 참여하여 발견되는지, 그 빈도를 예시한 도이다. 폐선암의 경우 XIRP2와 RYR3가 가장 흔히 합성암생존 유전자 쌍을 구성함이 예시되었다.
도 6은 341명의 폐선암 환자를 대상으로, 합성암생존 유전자 쌍을 하나도 갖고 있지 않은 149명, 1개 이상 내지 10개 미만을 가지고 있는 122명, 및 10개 이상을 가지고 있는 70명으로 총 세 군으로 나누어 Cox proportional hazard model을 적용한 생존 분석을 수행한 도이다. 도 6의 하단에 있는 세 개의 생존분석 그래프는 341명의 폐선암 환자를 합성암생존 유전자 쌍의 보유 수에 따라 총 세 군으로 나눈 후, 각각의 아군을 체세포 돌연변이 개수의 많고 적음에 따라 반분하여 체세포 돌연변이 부담이 더 높은 74명, 61명, 35명의 생존곡선은 빨간색으로, 체세포 돌연변이 부담이 더 낮은 75명, 61명, 35명의 생존곡선은 하늘 색으로 나타낸 도이다.
도 7은 181명의 피부흑색종 환자를 대상으로, 합성암생존 유전자 쌍을 하나도 갖고 있지 않은 88명, 1개 이상 내지 5개 미만을 가지고 있는 47명, 및 5개 이상 가지고 있는 46명으로 총 세 군으로 나누어 Cox proportional hazard model을 적용한 생존분석을 수행한 도이다. 도 7의 하단에 있는 세 개의 생존분석 그래프는 181명의 피부흑색종 환자를 합성암생존 유전자 쌍의 보유 수에 따라 총 세 군으로 나눈 후, 각각의 아군을 체세포 돌연변이 개수의 많고 적음에 따라 반분하여 체세포 돌연변이 부담이 더 높은 44명, 23명, 23명의 생존곡선은 빨간색으로, 체세포 돌연변이 더 낮은 44명, 24명, 23명의 생존곡선은 하늘색으로 나타낸 도이다.
도 8은 폐선암 환자와 피부흑색종 환자에서 체세포 돌연변이 부담과 합성암생존 부담의 상관관계를 로그-로그 관계로 나타낸 도이다.
도 9는 5개의 폐암 세포주, A (□), B (○), C (△), D (+), 및 E (x)의 유전체 염기서열 분석으로 수득한 체세포 돌연변이 부담과 합성암생존 부담의 상관관계를 나타낸 도이다.
도 10은 Matrigel invasion assay 방법을 사용하여 5개의 폐암 세포주, A (□), B (○), C (△), D (+), 및 E (x)의 Matrigel 침윤능력 또는 전이능력을 3회의 실험으로 동정한 결과를 막대그래프로 나타낸 도이다. 도 10의 하단에 나열된 3행의 촬영 사진은 상기 5개의 폐암 세포주에 대한 3번의 Matrigel invasion assay 결과를 촬영하여 나타낸 도이다.
본 발명은 종래 공지된 합성치사(synthetic lethality)의 개념에서 벗어나, 특정 환자에서 특정 두 개의 유전자 중, 해당 두 유전자의 기능이 모두 손상될 경우에만 해당 환자의 생존률이 높고, 해당 두 유전자 모두의 기능이 정상이거나, 해당 두 유전자 중 어느 하나의 기능이 손상된 경우에도 환자의 생존률이 낮은 조합의 형태인 “합성암생존(Synthetic Cancer Survival, SCS)”의 개념에 근거한 것으로, 이를 이용하여 암에서의 유전자 상호작용의 분석, 맞춤형 항암 치료 약물 선택 및 암 환자의 예후를 예측하는데 활용할 수 있는 새로운 방법을 제공하고자 한다.
한 양태에서 본 발명은 암 환자의 유전체 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍에 속하는 하나 이상의 유전자의 염기서열 변이 정보를 결정하는 단계; 및 상기 염기서열 변이 정보로부터 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자와 쌍을 이루는 하나 이상의 대응 유전자를 억제하는 하나 이상의 후보 약물을 선정하는 단계를 포함하는, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법을 제공한다.
본 발명에서 사용된 용어, “염기서열 또는 뉴클레오타이드 서열 (base sequence or nucleotide sequence)”이란 핵산 DNA 또는 RNA 구성의 기본단위인 뉴클레오타이드의 구성성분 중 하나인 염기들을 순서대로 나열한 순서 배열이다.
본 발명에서 사용된 용어, “염기서열 변이 정보”는 핵산 염기서열이 비교대상인 참조 염기서열과 서열상의 차이를 보이는 경우 그 차이를 보이는 부분을 의미하는 것으로, 유전자의 엑손을 구성하는 염기의 치환, 부가 또는 결실에 관한 정보를 의미한다. 이러한 염기의 치환, 부가, 또는 결실은 여러 가지 원인에 의해 발생할 수 있으며, 예를 들면 염색체의 돌연변이, 절단, 결실, 중복, 역위 및/또는 전좌를 포함하는 구조적 차이에 의할 수 있다.
상기 참조 염기서열 또는 참조 유전체 (Reference base (or nucleotide) sequence or Reference genome)란 염기서열 비교 시에 기준이 되는 염기서열로 참조 염기서열 혹은 표준 염기서열이라 한다.
본 발명에서 사용되는 암 유전체 염기서열 정보는 공지된 염기서열분석법을 이용하여 결정될 수 있으며, 또한 상용화된 서비스를 제공하는 BGI (Beijing Genome Institute), Knome, Macrogen, DNALink 등의 서비스를 이용할 수 있고, 이에 제한되지 않는다.
본 발명에서 암 유전체 염기서열에 존재하는 유전자 염기서열 변이 정보는 다양한 방법을 이용하여 추출될 수 있으며, 참조군, 예를 들면 HG19의 유전체 염기서열과의 서열 비교 프로그램, 예를 들어, ANNOVAR (Wang et al., Nucleic Acids Research, 2010; 38(16): e164), SVA (Sequence Variant Analyzer) (Ge et al., Bioinformatics. 2011; 27(14): 1998-2000), BreakDancer (Chen et al., Nat Methods. 2009 Sep; 6(9):677-81) 등을 이용한 염기서열 비교 분석을 통해 수득될 수 있다.
상기 유전자 염기서열 변이 정보는 컴퓨터 시스템을 통하여 접수/수득될 수 있으며, 이런 측면에서 본 발명의 방법은 유전자 변이 정보를 컴퓨터 시스템으로 접수하는 단계를 추가로 포함할 수 있다. 본 발명에서 사용되는 컴퓨터 시스템은 암 환자에 대해 적용대상이 되는 항암 치료 약물 및 상기 약물이 억제할 수 있는 유전자와 관련된 정보 검색 또는 추출이 가능한 데이터베이스를 포함하는 하나 이상의 데이터베이스를 포함하거나 데이터베이스에 접근 가능하다.
본 발명에서 사용된 용어, “합성암생존 (Synthetic Cancer Survival, SCS)”은 암 세포 또는 암 조직에 포함된 두 개 이상의 변이 유전자의 조합이 해당 암 환자의 생존률 향상을 유발하는 현상으로, 이들 두 개 이상의 변이 유전자 중 개별 변이 유전자 각각은 해당 암 환자의 생존률 향상을 유발하지 않지만, 이들 두 개 이상의 변이 유전자의 조합이 해당 암 환자의 생존률 향상을 유발하는 경우, 그 현상을 합성암생존이라 한다. 본 발명에서 사용된 용어, 합성암생존은 합성암생존을 유발하는 두 개 이상의 변이 유전자의 조합이 반드시 한 개의 암세포 내에서 발생한 경우만을 지칭하는 것은 아니다. 이러한 두 개 이상의 변이 유전자의 조합이 서로 다른 암세포일지라도 동일한 암조직 내의 서로 다른 암세포에서 각각 발생하여 조합을 이룬 경우에도 이를 합성암생존이라 한다. 본 발명의 일 실시예에서는 암 환자의 유전체 돌연변이와 생존 정보를 이용한 암환자 생존 분석을 통해 합성암생존 유전자를 선정하였으며, 본 발명의 다른 일 실시예에서는 암 세포주 또는 암 조직에서의 유전체 돌연변이 분석 및, 상기 암 세포주 또는 암 조직에서의 침윤능 또는 전이능 동정을 통해 합성암생존 유전자를 선정하였다.
본 발명에서 사용된 용어, “합성암생존 유전자 쌍(SCS pair of genes)”은 암 세포 또는 암 조직에 포함된 두 개 이상의 변이 유전자의 조합이 해당 암 환자의 생존률 향상을 유발하는 유전자 쌍으로, 이들 두 개 이상의 변이 유전자 중 개별 변이 유전자 각각은 해당 암 환자의 생존률 향상을 유발하지 않지만, 이들 두 개 이상의 변이 유전자의 조합이 해당 암 환자의 생존률 향상을 유발하는 경우, 그 유전자 쌍을 합성암생존 유전자 쌍이라 한다. 본 발명에서 사용된 용어 합성암생존 유전자 쌍은 합성암생존을 유발하는 유전자 쌍이 반드시 한 개의 암세포 내에서 발생한 경우만을 지칭하는 것은 아니며 서로 다른 암세포일지라도 동일한 암조직 내의 서로 다른 암세포에서 각각 발생하여 조합을 이룬 유전자 쌍도 합성암생존 유전자 쌍이라 한다. 이때 합성암생존 유전자 쌍에 속하는 두 개의 유전자 중 두 개 모두가 낮은 유전자 손상 점수를 갖는 변이 유전자이면 해당 두 유전자는 합성암생존 유전자 쌍을 구성한 것으로 정의한다. 또한, 합성암생존 유전자 쌍에 속하는 두 개의 유전자 중 하나는 낮은 유전자 손상 점수를 갖는 변이 유전자이고 다른 하나는 유전자 손상 점수가 낮지 않은 대응 유전자이면 해당 대응 유전자를 억제하는 약물로 해당 대응 유전자를 억제하면 해당 암 환자의 생존률을 높일 것으로 예측할 수 있다. 본 발명의 일 실시예에서는 암 유전체 돌연변이와 환자 생존 정보를 이용한 생존 분석을 통해 합성암생존 유전자 쌍을 선정하였으며, 그 구체적인 예를 표 2에 나타내었고, 본 발명의 범위가 이에 제한되지 않는다.
보다 구체적으로, 본 발명의 일 실시예에서는 암 환자의 유전체 돌연변이와 생존 정보를 이용한 암환자 생존 분석을 통해 합성암생존 유전자 쌍을 선정하였으나, 상기 합성암생존 유전자 쌍은 암 환자에서 직접 수득한 암세포나 암조직만을 사용하여 수득하는 것뿐만 아니라, in vitro 상에서 암세포주 실험이나 암조직 실험을 통해서도 수득 가능하다. 이 경우 암 환자의 생존 정보에 대응되는 암세포의 전이 또는 침윤 능력을 기준으로 전이 또는 침윤 능력이 낮을수록 대응되는 생존률이 높을 것으로 추정할 수 있고, 전이 또는 침윤 능력이 높을수록 경우 대응되는 생존률이 낮을 것으로 추정할 수 있다. 즉, 본 발병에 의한 합성암생존 유전자 쌍은 환자 군의 임상 정보뿐 아니라 세포, 조직, 또는 동물 실험 등을 통해서도 수득할 수 있다. 특히 세포, 조직, 또는 동물 실험의 경우, 자연 발생적인 유전체 염기서열 변이뿐 아니라 돌연변이 유발(mutagenesis), 약물이나 RNA 간섭 현상 등을 통한 유전자 발현의 억제 실험을 통해서 특정 유전자의 기능 손상 상황을 실험적으로 구현할 수 있으므로, 실제 임상에서 관찰 가능한 암 환자의 유전체 염기서열 변이 보다 더 다양한 염기서열 변이를 인위적으로 유발하거나 이에 해당하는 유전자 기능 억제를 다양하게 실험하여, 더 다양한 합성암생존 유전자 쌍을 수득할 수 있다.
이와 같이 암 환자의 생존 정보 및 자연발생적인 유전체 염기서열 변이뿐 아니라 인위적으로 돌연변이를 유발한 염기서열 변이나 유전자 발현의 억제 등의 방법을 통해 암 세포, 조직 또는 동물 실험에서 전이 또는 침윤 능력 동정을 통해서 수득한 합성암생존 유전자 쌍도 본 발명의 범위에 속하는 것이다.
본 발명에서 사용된 용어 합성암생존은 “합성치사 (Synthetic Lethality)”와는 서로 차별되는 개념이다. 합성치사는 두 개 이상의 유전자의 염기서열 변이의 조합이 세포 사망을 유발하는 현상으로, 이들 두 개 이상의 유전자의 염기서열 변이 중 개별 유전자의 염기서열 변이 각각은 세포 사망을 유발하지 않는 생존 가능한 염기서열 변이(viable mutation/variant)이지만, 이들 두 개 이상의 유전자의 생존 가능한 염기서열 변이의 조합이 세포 사망을 유발하는 경우 그 현상을 합성치사라 한다.
상기 합성치사는 두 개 이상의 유전자의 염기서열 변이의 조합이 세포 사망을 유발하는 현상으로, 암 질환에 적용하면, 두 개 이상의 유전자의 염기서열 변이의 조합이 암 세포의 사망을 유발하는 현상을 지칭한다. 암 질환의 경우, 암 세포 사망이 해당 암 환자의 생존률에 다소간의 영향을 미칠 수는 있으나, 그 영향 정도는 제한적이며, 암 전이가 암세포 사망보다 암 환자의 생존률에 더 큰 영향을 미치는 것으로 알려져있다. 또한, 합성치사의 평가 지표는 세포 사망이고 암 환자의 생존률은 아니며, 본 발명의 합성암생존은 암세포를 사망에 이르게 하는 합성치사와는 달리 암의 유전체 변이가 암세포의 성장능력이나 전이능력 등 암 해당 암 환자에 미치는 위해 능력의 저하를 유발하여 해당 암 환자의 생존에 향상을 가져오는 현상을 지칭하는 개념으로, 본 발명에서 개시하고 있는 합성암생존과 종래 공지된 합성치사는 차별화되는 개념이다.
또한, 두 개 이상의 유전자의 염기서열 변이의 조합이 세포 사망을 유발하는 기존에 공지된 합성치사 현상의 경우, 해당 암세포는 사망하게 되는 것이므로 실험실(in vitro)에서 관찰할 수는 있으나, 실제 환자의 암조직에서는 발견되기 어렵다는 특징이 있다. 반면에 합성암생존은 실제 환자의 암조직에서 발견되는 두 개 이상의 유전자의 염기서열 변이의 조합에 따라 발생하는 현상이므로 종래 공지된 합성치사와는 차별화되는 개념이다.
보다 구체적으로 본 발명의 실시예 1 내지 실시예 3에 예시된 바와 같이, 본 발명자는 실제 다양한 암종의 조직 및 암 세포주에서 다수의 합성암생존 유전자 쌍을 발견하였으며, 상기 암 조직 및 암 세포주가 세포 사망에 이르지 않고 살아 있음을 확인하였다. 이러한 결과로부터 앞서 개시한 바와 같이, 본 발명에서 개시하고 있는 암 환자의 생존에 관한 개념인 합성암생존과 세포 사망에 관한 개념인 합성치사는 차별화되는 개념임을 확인할 수 있다.
또한, 본 발명의 실시예 4 및 실시예 5에 예시된 바와 같이, 본 발명자는 합성암생존 부담 (Synthetic Cancer Survival Burden)에 대한 개념을 제시하며, 합성암생존 유전자 쌍을 더 많이 가진 환자일수록 암 생존률이 좋아지는 양의 선형상관관계를 확인하였다. 반면 합성치사 개념에서는 이와 같은 선형상관관계가 논의된 바 없으며, 합성치사 개념에서는 한 쌍의 합성치사 유전자 쌍의 손상만으로도 해당 세포가 비가역적으로 사망하는 것으로 정의된다. 그러므로 두 쌍, 또는 세 쌍, 또는 그 이상의 합성치사 유전자 쌍이 더 발견된다고 하여 더 많거나 크거나 강한 사망을 유발한다는 개념은 유효하지 않다. 따라서 '합성치사 부담(Synthetic Lethality Burden)'과 같은 개념은 성립하지 않거나 입증된 바 없다. 합성암생존 부담의 신개념에서 확인할 수 있듯이 합성암생존과 합성치사는 차별화되는 개념이다.
본 발명에서, 변이 유전자와 대응 유전자는, 기능상실변이(Loss of Function Variant)의 보유 여부를 기준으로 산출될 수 있다. 상기 기능상실변이에는 nonsense mutation, frameshift insertion and deletion, nonstop mutation and splice site mutation이 포함될 수 있으며, 이에 제한되지 않는다.
보다 구체적으로, 변이 유전자와 대응 유전자는, 각 해당 유전자가 보유한 유전자 염기서열 변이 점수에 의해 결정될 수 있다.
본 발명에서 사용된 용어 “유전자 염기서열 변이 점수”란 유전체 염기서열 변이가 단백질을 코딩하는 유전자의 엑손 부위에서 발견되었을 때, 이러한 개별 변이가 해당 유전자가 코딩하는 단백질의 아미노산 서열 변이 (치환, 부가 또는 결실) 또는 전사 조절 변이 등을 초래하여, 해당 단백질의 구조 및/또는 기능에 유의한 변화 혹은 손상을 유발하는 정도를 수치화한 점수를 말하며, 상기 유전자 염기서열 변이 점수는 유전체 염기서열 상에서 아미노산의 진화론적 보존 정도, 변형된 아미노산의 물리적 특성에 따른 해당 단백질의 구조나 기능의 변화에 미치는 정도 등을 고려하여 산출할 수 있다.
본 발명에 의한 유전자 손상 점수 산출 방법에 사용되는 유전자 염기서열 변이 점수를 산출하는 것은 당업계에 공지된 방법을 이용하여 수행될 수 있다. 예를 들면, SIFT (Sorting Intolerant From Tolerant, Pauline C et al., Genome Res. 2001 May; 11(5): 863-874; Pauline C et al., Genome Res. 2002 March; 12(3): 436-446; Jing Hul et al., Genome Biol. 2012; 13(2): R9), PolyPhen, PolyPhen-2 (Polymorphism Phenotyping, Ramensky V et al., Nucleic Acids Res. 2002 September 1; 30(17): 3894-3900; Adzhubei IA et al., Nat Methods 7(4):248-249 (2010)), MAPP (Eric A. et al., Multivariate Analysis of Protein Polymorphism, Genome Res. 2005;15:978-986), Logre (Log R Pfam E-value, Clifford R.J et al., Bioinformatics 2004;20:1006-1014), Mutation Assessor (Reva B et al., Genome Biol. 2007;8:R232, http://mutationassessor.org/), Condel (Gonzalez-Perez A et al.,The American Journal of Human Genetics 2011;88:440-449, http://bg.upf.edu/fannsdb/), GERP (Cooper et al., Genomic Evolutionary Rate Profiling, Genome Res. 2005;15:901-913, http://mendel.stanford.edu/SidowLab/downloads/gerp/), CADD (Combined Annotation-Dependent Depletion, http://cadd.gs.washington.edu/), MutationTaster, MutationTaster2 (Schwarz et al., MutationTaster2: mutation prediction for the deep-sequencing age. Nature Methods 2014;11:361-362, http://www.mutationtaster.org/), PROVEAN (Choi et al., PLoS One. 2012;7(10):e46688), PMuit (Ferrer-Costa et al., Proteins 2004;57(4):811-819, http://mmb.pcb.ub.es/PMut/), CEO (Combinatorial Entropy Optimization, Reva et al., Genome Biol 2007;8(11):R232), SNPeffect (Reumers et al., Bioinformatics. 2006;22(17):2183-2185, http://snpeffect.vib.be), fathmm (Shihab et al., Functional Analysis through Hidden Markov Models, Hum Mutat 2013;34:57-65, http://fathmm.biocompute.org.uk/), MSRV (Jiang, R. et al. Sequence-based prioritization of nonsynonymous single-nucleotide polymorphisms for the study of disease mutations. Am J Hum Genet 2007;81:346-360, http://msms.usc.edu/msrv/), Align-GVGD (Tavtigian, Sean V., et al. Comprehensive statistical study of 452 BRCA1 missense substitutions with classification of eight recurrent substitutions as neutral. Journal of medical genetics 2006:295-305., http://agvgd.hci.utah.edu/), DANN (Quang, Daniel, Yifei Chen, and Xiaohui Xie. DANN: a deep learning approach for annotating the pathogenicity of genetic variants. Bioinformatics 2014: btu703., https://cbcl.ics.uci.edu/public_data/DANN/), Eigen (Ionita-Laza, Iuliana, et al. A spectral approach integrating functional genomic annotations for coding and noncoding variants. Nature genetics (2016):214-220., http://www.columbia.edu/~ii2135/eigen.html), KGGSeq (Li MX, Gui HS, Kwan JS, Bao SY, Sham PC. A comprehensive framework for prioritizing variants in exome sequencing studies of Mendelian diseases.Nucleic Acids Res. 2012 Apr;40(7):e53., http://grass.cgs.hku.hk/limx/kggseq/), LRT (Chun, Sung, and Justin C. Fay. Identification of deleterious mutations within three human genomes. Genome Res. 2009:1553-1561., http://www.genetics.wustl.edu/jflab/lrt_query.html), MetaLR (Dong, Chengliang, et al. Comparison and integration of deleteriousness prediction methods for nonsynonymous SNVs in whole exome sequencing studies. Human molecular genetics 2015;24(8):2125-2137), MetaSVM (Dong, Chengliang, et al. Comparison and integration of deleteriousness prediction methods for nonsynonymous SNVs in whole exome sequencing studies. Human molecular genetics 2015;24(8):2125-2137), MutPred (Mort, Matthew, et al. MutPred Splice: machine learning-based prediction of exonic variants that disrupt splicing. Genome Biology 2014;(15)1:1, http://www.mutdb.org/mutpredsplice/about.htm), PANTHER (Mi, Huaiyu, et al. The PANTHER database of protein families, subfamilies, functions and pathways. Nucleic Acids Research 2005;(33)suppl 1:D284-D288., http://www.pantherdb.org/tools/csnpScoreForm.jsp), Parepro (Tian, Jian, et al. Predicting the phenotypic effects of non-synonymous single nucleotide polymorphisms based on support vector machines. BMC bioinformatics 2007; 8.1, http://www.mobioinfor.cn/parepro/contact.htm), phastCons (Siepel, Adam, et al. Evolutionarily conserved elements in vertebrate, insect, worm, and yeast genomes. Genome Res. 2005;915)8:1034-1050, http://compgen.cshl.edu/phast/), PhD-SNP (Capriotti, E., Calabrese, R., Casadio, R. Predicting the insurgence of human genetic diseases associated to single point protein mutations with support vector machines and evolutionary information. Bioinformatics 2006;22:2729-2734., http://snps.biofold.org/phd-snp/), phyloP (Pollard, Katherine S., et al. Detection of nonneutral substitution rates on mammalian phylogenies._Genome Res. 2010;(20)1:110-121., http://compgen.cshl.edu/phast/background.php), PON-P (Niroula, Abhishek, Siddhaling Urolagin, and Mauno Vihinen. PON-P2: prediction method for fast and reliable identification of harmful variants. PLoS One 2015;(10)2:e0117380., http://structure.bmc.lu.se/PON-P2/), SiPhy (Garber, Manuel, et al. Identifying novel constrained elements by exploiting biased substitution patterns. Bioinformatics 2009;(25)12:i54-i62, http://portals.broadinstitute.org/genome_bio/siphy/documentation.html), SNAP (Bromberg,Y. and Rost,B. SNAP: predict effect of non-synonymous polymorphisms on function. Nucleic Acids Res. 2007;35:3823-3835,w http://www.rostlab.org/services/SNAP), SNPs&GO (Remo Calabrese, Emidio Capriotti, Piero Fariselli, Pier Luigi Martelli, and Rita Casadio. Functional annotations improve the predictive score of human disease-related mutations in proteins. Human Mutatation 2009;30:1237- 1244, http://snps.biofold.org/snps-and-go/), VEP (McLaren W, Pritchard B, Rios D, Chen Y, Flicek P and Cunningham F. Deriving the consequences of genomic variants with the Ensembl API and SNP Effect Predictor. Bioinformatics 2010;26:2069-70 http://www.ensembl.org/info/docs/tools/vep/), VEST (Carter H, Douville C, Stenson P, Cooper D, Karchin R Identifying Mendelian disease genes with the Variant Effect Scoring Tool BMC Genomics 2013;14(Suppl 3):S3), SNAP2 (Yana Bromberg, Guy Yachdav, and Burkhard Rost. SNAP predicts effect of mutations on protein function. Bioinformatics 2008;24:2397-2398, http://www.rostlab.org/services/SNAP), CAROL (Lopes MC, Joyce C, Ritchie GR, John SL, Cunningham F et al. A combined functional annotation score for non-synonymous variants, http://www.sanger.ac.uk/science/tools/carol), PaPI (Limongelli, Ivan, Simone Marini, and Riccardo Bellazzi. PaPI: pseudo amino acid composition to score human protein-coding variants. BMC bioinformatics 2015;(16)1:1, http://papi.unipv.it/), Grantham (Grantham, R. Amino acid difference formula to help explain protein evolution. Science 1974;(185)4154:862-864, https://ionreporter.thermofisher.com/ionreporter/help/GUID-D9DFB21C-652D-4F95-8132-A0C442F65399.html), SInBaD (Lehmann, Kjong-Van, and Ting Chen. Exploring functional variant discovery in non-coding regions with SInBaD. Nucleic Acids Research 2013;(41)1:e7-e7, http://tingchenlab.cmb.usc.edu/sinbad/), VAAST (Hu, Hao, et al. VAAST 2.0: Improved variant classification and disease_]gene identification using a conservation_]controlled amino acid substitution matrix. Genetic epidemiology 2013;(37)6:622-634, http://www.yandell-lab.org/software/vaast.html), REVEL (Ioannidis, Nilah M., et al. REVEL: an Ensemble Method for Predicting the Pathogenicity of Rare Missense Variants._AGHG 2016, https://sites.google.com/site/revelgenomics/), CHASM (Carter H, Chen S, Isik L, Tyekucheva S, Velculescu VE, Kinzler KW, Vogelstein B, Karchin R Cancer-specific high-throughput annotation of somatic mutations: computational prediction of driver missense mutations Cancer Res 2009;69(16):6660-7, http://www.cravat.us), mCluster (Yue P, Forrest WF, Kaminker JS, Lohr S, Zhang Z, Cavet G: Inferring the functional effects of mutation through clusters of mutations in homologous proteins. Human mutation. 2010;31(3):264-271. 10.1002/humu.21194.), nsSNPAnayzer (Lei Bao, Mi Zhou, and Yan Cui nsSNPAnalyzer: identifying disease-associated nonsynonymous single nucleotide polymorphisms. Nucleic Acids Res 2005;33:480-482, http://snpanalyzer.uthsc.edu/), SAAPpred (Nouf S Al-Numair and Andrew C R Martin. The SAAP pipeline and database: tools to analyze the impact and predict the pathogenicity of mutations. BMC Genomics 2013;14(3):1-11, www.bioinf.org.uk/saap/dap/), HanSa (Acharya V. and Nagarajaram H.A. Hansa An automated method for discriminating disease and neutral human nsSNPs. Human Mutation 2012;2:332-337, hansa.cdfd.org.in:8080/), CanPredict (Kaminker,J.S. et al. CanPredict: a computational tool for predicting cancer-associated missense mutations. Nucleic Acids Res., 2007;35:595:598, http://pgws.nci.nih.gov/cgi-bin/GeneViewer.cgi_), FIS (Boris Reva, Yevgeniy Antipin, and Chris Sander. Predicting the functional impact of protein mutations: Application to cancer genomics. Nucleic Acids Res 2011;39:e118-e118.), BONGO (Cheng T.M.K., Lu Y-E, Vendruscolo M., Lio P., Blundell T.L. Prediction by graph theoretic measures of structural effects in proteins arising from non-synonymous single nucleotide polymorphisms. PLoS Comp Biology 2008;(4)7:e1000135, http:// www.bongo.cl.cam.ac.uk/Bongo2/Bongo.htm) 등과 같은 알고리즘을 각 해당 유전자가 보유한 유전자 염기서열 변이에 적용하여 유전자 염기서열 변이 정보에서 유전자 염기서열 변이 점수를 산출할 수 있으며, 이에 제한되지 않는다. 예를 들어, SIFT 점수를 이용하여 유전자 염기서열 변이 점수를 부여할 때, SIFT 점수 0.7점 이상의 변이는 해당 유전자의 기능에 의미 있는 변화를 유발하지 않는다는 가정을 적용하여, 0.7점 이상의 변이를 변이가 존재하지 않은 것으로 환산하는 등의 필터링 과정이 적용될 수 있으며, 이러한 변형은 본 발명의 범위에 속하는 것이다. 예를 들어, SIFT 점수를 이용하여 유전자 염기서열 변이 점수를 부여할 때, 해당 SIFT 점수를 임의의 함수를 통해 변형(transform)한 값을 산출하여 적용한 점수도 본 발명의 범위에 속하는 것이다.
상술된 알고리즘들의 목적은 각각의 유전자 염기서열 변이가 해당 단백질의 발현 또는 기능에 얼마나 영향을 미치고, 이 영향이 단백질에 얼마나 손상을 주게 되는지, 혹은 별다른 영향이 없는지 등을 가려내기 위함이다. 이들은 기본적으로 개별 유전자 염기서열 변이가 초래할 해당 유전자가 코딩하는 단백질의 아미노산 서열 및 관련 변화를 판단함으로써 해당 단백질의 발현, 구조 및/또는 기능에 미칠 영향을 판단한다는 점에서 공통점이 있다.
본 발명에 따른 일 구현예에서는 개별 유전자 염기서열 변이 점수를 산출하기 위하여, SIFT (Sorting Intolerant From Tolerant) 알고리즘을 이용하였다. SIFT 알고리즘의 경우, 예를 들면, VCF (Variant Call Format) 형식 파일로 유전자 염기서열 변이 정보를 입력받아, 각각의 유전자 염기서열 변이가 해당 유전자를 손상시키는 정도를 점수화한다. SIFT 알고리즘의 경우 산출 점수가 0에 가까울수록 해당 유전자가 코딩하는 단백질의 손상이 심해서 해당 기능이 손상됐을 것으로 판단하고, 1에 가까울수록 해당 유전자가 코딩하는 단백질이 정상 기능을 유지하고 있을 것으로 판단한다.
또 다른 알고리즘인 PolyPhen-2의 경우, 산출 점수가 높을수록 해당 유전자가 코딩하는 단백질의 기능적 손상 정도가 큰 것으로 판단한다.
최근에는 SIFT, Polyphen2, MAPP, Logre, Mutation Assessor를 서로 비교하고 종합하여 Condel 알고리즘을 제시한 연구(Gonzalez-Peerez, A. & Lopez-Bigas, N. Improving the assessment of the outcome of nonsynonymous SNVs with a consensus deleteriousness score, Condel. The American Journal of Human Genetics, 2011;88(4):440-449)가 발표되었으며, 상기 연구에서는 단백질에 손상을 주는 유전자 염기서열 변이 및 영향이 적은 유전자 염기서열 변이와 관련하여 공지된 데이터의 집합인 HumVar와 HumDiv(Adzhubei, IAet al., A method and server for predicting damaging missense mutations. Nature Methods, 2010;7(4):248-249)를 사용하여 상기 다섯 개의 알고리즘을 비교하였다. 그 결과, HumVar의 97.9%의 단백질 손상을 일으키는 유전자 염기서열 변이와 97.3%의 영향이 적은 유전자 염기서열 변이가 상기 다섯 개의 알고리즘 중 최소 세 개의 알고리즘에서 동일하게 감지되었으며, HumDiv의 99.7%의 단백질 손상을 일으키는 유전자 염기서열 변이와 98.8%의 영향이 적은 유전자 염기서열 변이가 상기 다섯 개의 알고리즘 중 최소 세 개의 알고리즘에서 동일하게 감지되었다. 또한, 상기 HumDiv와 HumVar에 대하여 상기 다섯 개의 알고리즘과 각 알고리즘을 통합하여 계산한 결과들의 정확도를 나타내는 ROC (Reciever Operating Curve) 곡선을 그려본 결과, 상당히 높은 수준(69%~88.2%)에서 AUC(Area Under the Reciever Operating Curve)의 일치도를 보이는 것을 확인하였다. 즉 상술한 다양한 알고리즘들은 그 산출 방법은 달라도 산출된 유전자 염기서열 변이 점수들은 서로 유의하게 상관된 것이다. 따라서 상술한 알고리즘들 또는 알고리즘들을 응용한 방법을 적용하여 유전자 염기서열 변이 점수를 산출하는 서로 다른 알고리즘의 종류에 상관없이 본 발명의 범위에 속하는 것이다. 유전자 염기서열 변이가 단백질을 코딩하는 유전자의 엑손 부위에 발생할 경우, 단백질의 발현, 구조 및/또는 기능에 직접적인 영향을 미칠 수 있다. 따라서 상기 유전자 염기서열 변이 정보를 단백질 기능 손상 정도와 관련시킬 수 있다. 이런 측면에서 본 발명의 방법은 유전자 염기서열 변이 점수를 기반으로 “유전자 손상 점수”를 산출하는 개념을 포함한다. 보다 구체적으로, 변이 유전자와 대응 유전자는 상술한 알고리즘을 각 해당 유전자가 보유한 유전자 염기서열 변이에 적용하여 산출된 유전자 염기서열 변이 점수로부터 산출되는 유전자 손상 점수에 의해 결정될 수 있다.
본 발명에 있어서, 변이 유전자와 대응 유전자는, 각 해당 유전자가 보유한 유전자 염기서열 변이가 두 개 이상인 경우, 각 유전자 염기서열 변이 점수들의 평균값으로 산출되는 유전자 손상 점수에 의해 결정될 수 있다.
본 발명에서 사용된 용어 “유전자 손상 점수(Gene Deleteriousness Score, GDS)”란 하나의 단백질을 코딩하는 유전자 부위에 두 개 이상의 유의한 염기서열 변이가 발견되어, 하나의 단백질이 두 개 이상의 유전자 염기서열 변이 점수를 갖게 되는 경우, 상기 유전자 염기서열 변이 점수를 종합하여 계산된 점수를 말하며, 만약 단백질을 코딩하는 유전자 부위에 유의한 염기서열 변이가 한 개인 경우에는 유전자 손상 점수를 해당 유전자 염기서열 변이 점수와 동일하게 산출할 수 있다. 이때, 단백질을 코딩하는 유전자 염기서열 변이가 두 개 이상인 경우, 유전자 손상 점수는 각 변이 별로 계산된 유전자 염기서열 변이 점수들의 평균값으로 계산되며, 이러한 평균값은 예를 들면 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 또는 중심경향도(measures of central tendency), 단순 곱 또는 가중곱, 또는 상기 산출값들의 함수 연산으로 계산될 수 있으나, 이에 제한되지 않는다.
본 발명에 따른 일 구현예에서는 하기 수학식 1에 의해 유전자 손상 점수를 산출하였으며, 하기 수학식 1은 다양한 변형이 가능하므로, 이에 제한되지 않는다.
Figure pat00001
상기 수학식 1에서 Sg는 유전자 g가 코딩하는 단백질의 유전자 손상점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상 염기서열 변이의 수, vii 번째 분석대상 염기서열 변이의 상기 염기서열 변이 점수이며, p는 0이 아닌 실수이다.
상기 수학식 1에서 상기 p의 값이 1일 때는 산술평균, 상기 p의 값이 -1일 때는 조화평균이 되며, 상기 p의 값이 0에 가까워지는 극한의 경우에는 기하평균이 된다.
본 발명에 따른 또 다른 일 구현예에서는 하기 수학식 2에 의해 유전자 손상 점수를 산출하였다.
Figure pat00002
상기 수학식 2에서 Sg는 유전자 g가 코딩하는 단백질의 유전자 손상점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상인 염기서열 변이의 수, vii 번째 분석대상 염기서열 변이의 상기 유전자 염기서열 변이 점수이며, wi는 상기 i 번째 염기서열 변이의 상기 유전자 염기서열 변이 점수 vi에 부여되는 가중치이다.
모든 가중치 wi가 같은 값을 갖는 경우 상기 유전자 손상점수 Sg는 상기 유전자 염기서열 변이 점수 vi의 기하평균값이 된다. 상기 가중치는 해당 단백질의 종류, 해당 단백질의 약동학적 또는 약력학적 분류, 해당 약물 효소 단백질의 약동학적 파라미터, 인구 집단 또는 인종별 분포를 고려하여 부여될 수 있다.
본 발명에 따른 염기서열 변이 점수 및 유전자 손상점수는 대한민국특허출원번호 10-2014-0107916, PCT 국제출원번호 PCT/KR2014/007685에 개시되며, 이 개시내용은 그 전체가 참조로서 본 원에 포함된다.
본 발명에 따른 방법은 상기 합성암생존 유전자 쌍 정보를 이용하여 상기 암 환자에 대해 적용되는 약물 간의 우선순위를 결정하는 단계; 또는 상기 합성암생존 유전자 쌍 정보를 이용하여 상기 암 환자에 적용되는 약물의 사용 여부를 결정하는 단계를 추가로 포함할 수 있다.
본 발명에 따른 방법은 추가적으로 암종별로 유의한 생물학적 마커를 기준으로 두 개 이상의 아군으로 구분한 후, 각 아군에서의 유전체 돌연변이와 환자 생존 정보를 이용한 생존 분석을 통해 합성암생존 유전자 쌍을 선정할 수 있다.
상기 생물학적 마커는 암과 관련된 진단, 치료 및 예후에 관여하는 것으로 당업계에 알려진 공지된 마커를 모두 포함하는 개념이다. 예를 들어, 대장암의 진단, 치료 및 예후에 중요한 생물학적 마커로 알려진 MSI(Microsatellite instability)를 비롯하여 각 암종 별로 공지된 마커를 제한 없이 이용할 수 있다.
본 발명에 있어서, 후보 약물의 선정은 상기 암 환자 유전체의 염기서열 정보로부터 선별된 합성암생존 유전자 쌍에 속하는 하나 이상의 대응 유전자와 쌍을 이루는 하나 이상의 변이 유전자의 개수를 산출하여, 그 산출된 개수를 기준으로 후보 약물의 우선순위 또는 조합을 결정하는 단계에 의해 수행될 수 있다.
다른 양태에서 본 발명은 암 환자에 대해 적용대상이 되는 항암 치료 약물 및 상기 약물이 억제할 수 있는 유전자와 관련된 정보 검색 또는 추출이 가능한 데이터베이스; 상기 데이터베이스에 접근 가능한 통신부; 암 유전체 염기서열 분석부; 약물 선택 정보 제공부; 및 표시부를 포함하며, 상기 암 유전체 염기서열 분석부는 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자를 선정하는 변이 유전자 선정부 및 상기 하나 이상의 변이 유전자에 대해 해당 변이 유전자와 쌍을 이루어 합성암생존 유전자 쌍을 구성하는 하나 이상의 대응 유전자를 선정하는 대응 유전자 선정부를 포함하고, 상기 약물 선택 정보 제공부는 상기 하나 이상의 대응 유전자를 억제하는 항암 치료 약물 선택 정보를 제공하는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택 시스템을 제공한다.
본 발명에 따른 시스템은 암 환자에 대해 적용대상이 되는 항암 치료 약물 및 상기 약물이 억제할 수 있는 유전자와 관련된 정보 검색 또는 추출이 가능한 데이터베이스에 접근하여 관련 정보를 추출하고, 이에 따라 상기 맞춤형 약물 선택 정보를 사용자에게 제공하는 사용자 인터페이스를 추가로 포함할 수 있다.
본 발명에 따른 시스템에서 상기 데이터베이스 또는 그 접근 정보를 포함하는 서버, 산출된 정보 및 이와 연결된 사용자 인터페이스 장치는 서로 연계되어 사용될 수 있다.
본 발명에 따른 시스템에서 사용자 인터페이스 또는 단말은 서버로부터 암 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택 처리를 요청, 결과 수신 및/또는 저장할 수 있으며, 스마트 폰, PC(Personal Computer), 태블릿 PC, 개인 휴대 정보 단말기(Personal Digital Assistant, PDA), 웹 패드 등과 같이 메모리 수단을 구비하고 마이크로프로세서를 탑재하여 연산 능력을 갖춘 이동 통신 기능을 구비한 단말기로 구성될 수 있다.
본 발명에 따른 시스템에서 서버는 데이터베이스에 대한 접근을 제공하는 수단으로, 통신부를 통해 사용자 인터페이스 또는 단말)과 연결되어 각종 정보를 교환할 수 있도록 구성된다. 여기서, 통신부는 동일한 하드웨어에서의 통신은 물론, 구내 정보 통신망(local area network, LAN), 도시권 통신망(metropolitan area network, MAN), 광역 통신망(wide area network, WAN), 인터넷, 2G, 3G, 4G 이동 통신망, 와이파이(Wi-Fi), 와이브로(Wibro) 등을 포함할 수 있으며, 통신 방식도 유선, 무선을 가리지 않으며 어떠한 통신 방식이라도 상관없다. 데이터베이스 또한 서버에 직접 설치된 것뿐 아니라 목적에 따라 인터넷 등을 통해 접근 가능한 다양한 생명과학 데이터베이스에 연결될 수 있다.
본 발명에 따른 방법은 하드웨어, 펌웨어, 또는 소프트웨어 또는 이들의 조합으로 구현될 수 있다. 소프트웨어로 구현되는 경우 저장매체는 컴퓨터와 같은 장치에 의해 판독 가능한 형태의 저장 또는 전달하는 임의의 매체를 포함한다. 예를 들면 컴퓨터 판독 가능한 매체는 ROM(read only memory); RAM(random access memory); 자기디스크 저장 매체; 광저장 매체; 플래쉬 메모리 장치 및 기타 전기적, 광학적 또는 음향적 신호 전달 매체 등을 포함한다.
이러한 양태에서 본 발명은 암 환자의 유전체 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍을 선별하는 단계; 및 상기 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자와 쌍을 이루는 하나 이상의 대응 유전자를 억제하는 하나 이상의 후보 약물을 선별하는 단계를 포함하는 동작을 수행하는 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체를 제공한다.
본 발명에 따른 암 환자의 유전체 돌연변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템은 암 환자의 유전체 돌연변이 정보와 생존 정보로부터 도출한 합성암생존 유전자 쌍의 염기서열 변이 분석을 통하여 개인별로 치료 효과 및 예후가 좋은 항암 치료 약물을 선택할 수 있는 기술로서 신뢰도가 높으며 신속하고 간단하게 관련 정보를 제공할 수 있다.
본 발명에 따른 방법 및 시스템을 이용할 경우, 합성암생존을 유발하는 유전자 쌍에 속하는 하나 이상의 변이 유전자를 선정하고, 해당 변이 유전자와 쌍을 이루어 합성암생존 유전자 쌍을 구성하는 하나 이상의 대응 유전자의 선정을 통해, 상기 대응 유전자를 억제하는 하나 이상의 항암 치료 약물을 선택함으로써, 여러 개의 비교 대상 약물 중에서 개인별 맞춤형 항암제 선택이 가능하며, 약물의 효과 또는 부작용 위험률 등을 사전에 예측함으로써 개인에 적용되는 항암제 간의 우선순위, 최적조합, 또는 사용여부를 결정할 수 있다. 또한, 합성암생존 유전자 쌍에 속하는 변이 유전자의 조합 중, 특정 암종별로 해당 암종에서 다수의 환자에서 발견되는 하나 이상의 변이 유전자의 조합을 선정하여, 개별 환자의 유전체 염기서열 분석결과와는 독립적으로, 일반적으로 해당 암종의 다수의 환자에서 치료 효과 및 예후가 좋을 것으로 예측되는 하나 이상의 항암 치료 약물의 조합을 선택하여 각 암종별로 특화된 복합항암요법(combination chemotherapy)의 개발 및 임상적용에 활용할 수 있는 기술로서 신뢰도가 높으며 신속하고 간단하게 관련 정보를 제공할 수 있다.
또한, 본 발명에 따른 방법 및 시스템은 합성암생존 유전자 쌍의 개인별 염기서열 변이의 빈도 및 분포 분석을 통해 암의 예후를 예측하는데 사용될 수 있으며, 합성암생존 유전자 쌍과 체세포 돌연변이의 개인별 염기서열 변이의 빈도 및 분포 분석을 통해 암의 예후를 예측하는데 사용될 수 있다. 또한, 합성암생존 유전자 쌍과 체세포 돌연변이의 개인별 염기서열 변이의 빈도 및 분포 분석을 통해 약물 치료 반응성을 예측하는 데에도 효과적으로 사용될 수 있다.
또 다른 양태에서 본 발명은 암 환자 유전체의 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍에 속하는 하나 이상의 유전자의 수를 산출하는 단계;를 포함하는, 암 환자의 예후 예측을 위한 정보를 제공하는 방법을 제공한다.
상기 방법은 상기 암 환자 유전체의 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍에 속하는 하나 이상의 유전자의 수 및 체세포 돌연변이 유전자의 수를 산출하는 단계를 포함할 수 있다.
본 발명의 일 실시예에서는 합성암생존 유전자 쌍을 많이 가질수록 암환자의 생존률이 통계학적으로 유의하게 높아짐을 확인하였는바, 암환자의 유전체 분석을 통해 암환자의 합성암생존 유전자 쌍의 개수로 표현되는 합성암생존 부담을 확인함으로써 해당 암환자의 생존 예후를 효과적으로 예측할 수 있다.
또 다른 양태에서 본 발명은 암 환자에 대해 적용대상이 되는 항암 치료 약물 및 상기 약물이 억제할 수 있는 유전자와 관련된 정보 검색 또는 추출이 가능한 데이터베이스; 상기 데이터베이스에 접근 가능한 통신부; 암 유전체 염기서열 분석부; 약물 선택 정보 제공부; 및 표시부를 포함하며, 상기 암 유전체 염기서열 분석부는 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자를 선정하는 변이 유전자쌍 선정부 및 상기 하나 이상의 변이 유전자에 대해 해당 변이 유전자와 쌍을 이루어 합성암생존 유전자 쌍을 구성하는 하나 이상의 대응 유전자를 선정하는 대응 유전자 선정부를 포함하고, 상기 약물 선택 정보 제공부는 상기 암 환자의 합성암생존 유전자 쌍의 개수를 증가시키는 약물 선택 정보를 제공하는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택 시스템을 제공한다.
본 발명의 일 실시예에서는 맞춤형 약물 선택 방법을 적용하여 선택한 약물을 환자에게 처치한 경우 해당 약물에 대한 치료반응 역시 해당 약물이 차단하는 유전자에 의해 증가하는 합성암생존 유전자 쌍의 개수 분석을 통해 예측할 수 있음을 확인하였으며, 보다 구체적으로, 해당 처치 약물이 해당 환자의 합성암생존 유전자 쌍의 개수를 늘리는 정도에 따라 해당 치료반응을 예측할 수 있고, 역으로 해당 치료반응 향상이 큰 약물로 맞춤 치료 약물을 선택할 수 있음을 확인하였다.
또 다른 양태에서 본 발명은 암 환자의 유전체 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍을 선별하는 단계; 및 상기 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자와 쌍을 이루는 하나 이상의 대응 유전자를 억제하는 하나 이상의 후보 약물 중에서 합성암생존 유전자 쌍의 개수를 증가시키는 후보 약물을 선별하는 단계를 포함하는 동작을 수행하는 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체를 제공한다.
본 발명에서 이용되는 컴퓨터 판독 가능한 매체에 대해서는 이미 상술하였으므로, 과도한 중복을 피하기 위하여 그 기재를 생략한다.
이하 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.
실시예 1. 암종별 합성암생존 유전자 쌍의 검출 및 이를 이용한 맞춤형 약물선택 방법
1-1. 대상 데이터 선정
분석을 위한 데이터를 TCGA 데이터 포탈에서 2015년 3월 4일을 기준으로 내려받았다. 상기 데이터는 5618명의 level2 체세포 돌연변이 (somatic mutation) 데이터와 6838명의 level2 임상 데이터를 포함하고 있다. 상기 level2 체세포 돌연변이 데이터는 maf (mutation annotation format) 형식으로 저장되어있다. 분석을 위해서 돌연변이 위치와 돌연변이 분류가 적용되었다. 돌연변이들은 ‘Missense mutation', 'Nonsense mutation', 'Frameshift indel', 'In frame indel', 'splice site mutation; Silent mutation', 'Intron', 'UTR' 및 'Intergenic' 등으로 분류되어 있다. 상기 level2 임상 데이터는 암종에 따른 다양한 임상 변인들을 포함하고 있으며, 실제적으로 Cox proportional hazard model에 사용된 변인들은 전문적인 병리학자에 의해 검토되었다.
1-2. 데이터 처리 및 분석 데이터 구성
먼저, 임상 데이터 중 Cox proportional hazard model을 위한 정보가 없는 환자들의 데이터를 제외하였다. 다음으로 다른 악성 종양을 가지고 있거나 전이가 발생한 환자, 방사선 치료, pharmaco, ablation adjuvant 치료가 있는 환자들을 확인한 후, 상기 요인들이 환자 예후의 강한 교란변인인 점을 고려하여 해당 환자들의 데이터를 제거하였다. 또한, 돌연변이 데이터가 없는 환자들의 데이터를 제외하였다. 보다 구체적으로, 돌연변이 데이터는 먼저 synonymous 돌연변이들을 제외한 후, HGNC symbol이 없는 유전자로 데이터에 'Unknown'으로 표기된 유전자들을 제외하였다. 마지막으로 임상정보가 없는 환자들의 데이터를 제외하였으며, 최종적으로 4,844명의 환자들의 데이터를 이용하여 이후 분석에 사용하였다.
데이터 처리 결과, 20개의 암종에서 4,884명의 임상 데이터와 체세포 돌연변이 데이터를 수득하였다. 이렇게 얻어진 데이터는 두 가지 데이터 유형을 모두 가지고 있고, Cox proportional hazard model에 필요한 모든 임상변인 데이터를 가지고 있어 이후 분석에 사용하였다.
1-3. 유전자 손상 점수
본 실시예에서는 유전자의 유해 정도를 정량화하기 위해서 유전자 손상 점수(Gene Deleteriousness Score, GDS)를 정의하였다. 유전자 손상 점수는 해당 유전자의 돌연변이 개수와 종류를 고려하여 계산되며, 0점에서 1점 사이의 값을 갖도록 정의되었다. 유전자 손상 점수는 더 작은 점수일수록 해당 유전자의 기능적 구조적 손상이 더 심하다는 의미로 정의되었다. 예를 들어, 만약 어떤 유전자가 nonsense mutation, frameshift insertion and deletion, nonstop mutation and splice site mutation과 같은 기능상실변이(Loss of Function (LoF) Variant)를 가지고 있다면 해당 유전자의 유전자 손상 점수는 0점으로 정하였다. 만약 어떤 유전자가 LoF 변이를 가지지 않는다면 해당 유전자의 유전자 손상 점수는 해당 유전자에 있는 모든 non-synonymous 돌연변이들 중 SIFT 점수가 0.7 이하인 돌연변이들의 SIFT 점수의 기하평균으로 정하였다. 이때 분모가 0이 되는 경우를 피하기 위해 SIFT 점수가 0점이라면 이를 10e-8점으로 대체하였다. 상기 SIFT 점수 0.7의 필터링 기준은 본 실시예의 경우에 적용된 임의적인 필터링 기준이며 분석의 목적에 따라 다양한 필터링 기준을 적용할 수 있다. 또한, 분모가 0이 되는 것을 피하기 위해 부여한 10e-8점의 변이 점수도 본 실시예의 경우에 적용된 임의적인 기준이며 분석의 목적에 따라 다양한 기준을 적용할 수 있다. 본 실시예에서 유전자 손상 점수를 산출하기 위해 사용된 SIFT 알고리즘(하기 수학식 3 참조) 또한 본 실시예의 경우에 적용된 임의적인 알고리즘이며 분석의 목적에 따라 다양한 알고리즘을 적용할 수 있다.
Figure pat00003
1-4. 유전자 손상 점수의 분포와 분석 역치의 설정
상기 실시예 1-2에서 분류한 분석 데이터를 토대로, 각각의 암종에서 최소 하나이상의 non-synonymous mutation을 가지는 모든 유전자들의 유전자 손상점수를 계산하였다. non-synonymous mutation을 하나도 갖지 않은 유전자에는 1점의 유전자 손상 점수를 부여하였다.
그 결과 암세포에서 다수의 체세포 돌연변이가 발생하긴 하지만, 전체 유전자에서 체세포 돌연변이가 발생하는 것은 흔한 현상이 아니므로 대부분의 유전자의 유전자 손상점수는 1점임을 확인할 수 있었다. 1점 외에는 체세포 돌연변이를 보이는 다수의 유전자의 유전자 손상점수가 0점에 분포하였다. 본 실시예에서는 유전자 손상 점수 0.3점을 기준(분석 역치)으로 중등도 이상의 유전자 기능 손상이 일어난 유전자와 그렇지 않은 유전자의 두 군으로 나누어 이후 분석에 사용하였다.
1-5. 암종별 합성암생존 유전자 쌍의 검출과 암종별 합성암생존 유전자 네트워크 구축
암 환자의 유전체 데이터에서 합성암생존 (SCS, Synthetic Cancer Survival) 현상을 검출하기 위해 Cox proportional hazard model을 사용한 생존분석을 시행하였다. Cox proportional hazard model은 임상 변인들의 교란작용을 보정할 수 있다. 각각의 암종 별 환자군을 모든 유전자 쌍에 대해 4군으로 나누었다; 두 유전자 모두의 유전자 손상 점수가 0.3 이하인 쌍손상군, 두 유전자 중 한 개의 유전자의 유전자 손상 점수만이 0.3 이하이고 다른 하나는 그렇지 않은 두 개의 외손상군, 및 두 유전자 모두의 유전자 손상 점수가 0.3보다 큰 비손상군.
흔히 사용되는 최대우도(maximum likelihood) 기반의 Cox proportional hazard model의 경우 환자사망 사건이 0회인 경우에 '수렴 (convergence)' 문제가 발생하므로 본 실시예에서는 이를 피하기 위하여 penalized likelihood를 이용한 Cox proportional hazard model을 사용하였다. 생존분석은 R Statistical Package 버전 3.2.0의 'coxphf' 패키지를 이용하여 진행하였다. 또한, 각각의 암종별로 임상변수들의 교란작용을 보정하기 위하여 Cox 모형에 추가되었다. 나이나 성별과 같은 일반적인 임상 변인들과 병리학전문의가 검토하고 이전 연구에서 사용된 임상 변인들을 추가하였다.
도 1에 피부흑색종 환자군을 DNAH2 유전자와 XIRP2 유전자 쌍의 체세포 돌연변이 상태에 따라 한 개의 쌍손상군, 두 개의 외손상군 및 한 개의 비손상군 등 총 4 군으로 나누어 각각의 생존곡선을 예시하였다. 이때 4군의 생존곡선과 함께 생존분석 결과를 표기하였다. 도 1에 나타낸 바와 같이, DNAH2 유전자와 XIRP2 유전자는 서로 합성암생존 유전자 쌍의 관계에 있음을 알 수 있다. 즉, DNAH2와 XIRP2 쌍에서, DNAH2만 유전자 손상 점수가 낮거나 (파란 선) XIRP2만 유전자 손상 점수가 낮은 (노란 선) 외손상군의 경우, 두 유전자 모두 유전자 손상 점수가 낮지 않은 비손상군(녹색 선)과 비교하였을 때 암 생존률에서 유의한 차이를 보이지 않으나, DNAH2와 XIRP2의 유전자 손상 점수가 모두 낮은 쌍손상군은 나머지 세 군 모두에 비해 통계학적으로 유의하게 암 환자의 생존률이 높음(p < 0.05, HR > 1.0)을 확인할 수 있었다. 그러므로 피부흑색종에서 체세포 돌연변이를 보이는 DNAH2 유전자와 XIRP2 유전자 쌍은 앞서 정의한 피부흑색종의 합성암생존 유전자 쌍의 판단 기준에 부합함을 확인하였다.
또한, 도 2에 다섯 가지 암종(폐선암, 피부흑색종, 폐편평상피암, 두경부편평상피암, 신장세포암)에서 각 암종별로 수득한 합성암생존 유전자 쌍으로 구성된 합성암생존 유전자 네트워크를 예시하였다. 폐선암(LUAD) 합성암생존 유전자 쌍은 빨간 연결선으로, 피부흑색종(SKCM) 합성암생존 유전자 쌍은 노란 연결선으로, 폐편평상피암(LUSC) 합성암생존 유전자 쌍은 파란 연결선으로, 두경부편평상피암(HNSC) 합성암생존 유전자 쌍은 갈색 연결선으로, 신장세포암(KIRP) 합성암생존 유전자 쌍은 보라색 연결선으로 표기하였다. 도 2에 나타낸 바와 같이, 각 암종별로 다양한 합성암생존(SCS) 유전자 쌍이 존재함을 확인할 수 있으며, 이에 대한 구체적인 설명은 하기 실시예 2에 개시하였다.
본 실시예에서는 실제 암 환자의 암 유전체 변이 정보의 분석을 통해 다양한 합성암생존 유전자 쌍을 수득하였으나, 이는 응용 가능한 다양한 방법 중 하나의 방법일 뿐 해당 방법만으로 제한되지 않는다. 예를 들어, 세포주 또는 동물 실험 환경에서 다양한 방식으로 유전자 변이를 유발하여, 실제 암 환자에서는 관찰되기 어려운 변이 유전자들의 분석을 통해 합성암생존 유전자 쌍을 수득하고, 합성암생존 유전자 네트워크를 구성할 수 있다. 특히 실시예 5 및 도 9 내지 도 10에 예시된 바와 같이 Invasion Assay를 포함한 암세포 전이 능력을 동정하기 위한 다양한 실험방법 들을 사용하여 합성암생존 유전자 쌍을 수득할 수 있다.
1-6. 암종별 합성암생존 유전자 쌍의 분석을 이용한 맞춤형 약물 선택 방법
본 발명에 의한 암 환자의 유전체 돌연변이와 생존 분석 방법 및 시스템을 통해 암종별 합성암생존 유전자 쌍을 효과적이고 효율적으로 찾고, 이를 이용하여 맞춤형 약물 선택을 수행하기 위한 방법을 설명하기 위해 다음과 같은 실험을 수행하였다.
도 3에 한 폐선암 환자의 체세포 돌연변이의 분포를 합성암생존 유전자 쌍의 네트워크에 겹쳐서 도시하였다. 도 3의 노드와 연결선은 폐선암 유전체 시퀀싱 데이터를 분석해서 획득한 합성암생존 유전자 쌍의 네트워크를 의미한다. 이때 노드는 각각의 유전자를 의미하고, 연결선으로 연결된 한 쌍의 유전자는 폐선암의 합성암생존 유전자 쌍임을 의미한다. 빨간색으로 칠해진 유전자 노드는 해당 암환자에서 대응되는 유전자와 함께 합성암생존 유전자 쌍을 이루어 체세포 돌연변이가 발견되는 유전자를 의미한다. 노란색으로 칠해진 유전자 노드는 해당 유전자는 낮은 유전자 손상점수를 보이는 체세포 돌연변이를 가진 유전자이지만, 해당 유전자와 쌍을 이루어 합성암생존 유전자 쌍을 이루는 유전자 중에서는 낮은 유전자 손상점수를 보이는 체세포 돌연변이를 가진 대응 유전자가 하나도 발견되지 않아서 합성암생존 유전자 쌍을 이루지 못한 유전자를 의미한다. 회색으로 칠해진 유전자 노드는 해당 암환자에서 낮은 유전자 손상점수를 보이는 체세포 돌연변이가 발견되지 않는 유전자를 의미한다.
그러므로 도 3은 회색으로 칠해진 유전자 중에서 합성암생존 유전자 네트워크 정보를 고려하여 선정한 하나 이상의 유전자를 해당 유전자에 대한 하나 이상의 차단제로 억제하면 다른 유전자와 어떻게 몇 개의 합성암생존 유전자 쌍을 이루는지 알 수 있는 방법을 예시한다. 예를 들어, 도 3에 예시된 폐선암 환자의 암세포에 XIRP2 차단제를 처리하면 RYR2, LPA, FAT4 등의 유전자와 여러 개의 합성암생존 유전자 쌍을 이루게 되어 해당 폐선암 환자의 생존률을 향상시킬 수 있을 것임을 예측할 수 있다. 또한, 상기 폐선암 환자의 암세포에 RYR3를 차단해도 여러 개의 유전자와 합성암생존 유전자 쌍을 이룰 수 있음을 알 수 있는데, RYR3의 경우 Dandrolene 등의 칼슘채널 차단제로 차단할 수 있다. 최근에는 항체 신약의 개발을 통해 특정 유전자를 차단하는 것이 가능하므로 본 발명에 의한 합성유전자 쌍의 분석을 통해 새로운 신약 개발의 표적 유전자를 선별하는 것도 가능하다. 일 연구(Zhang et al., Proc Natl Acad Sci U S A. 2011 Aug 16; 108(33): 13653-13658.)에 의하면 RYR3를 억제하는 micro-RNA miR-367의 결합부위의 단일염기다형성에 따라 난소암의 예후가 다름을 밝힌 바 있으며, 이와 같은 소견이 본 발명의 결과물인 합성암생존 유전자 쌍의 주요 참여 유전자인 RYR3 차단효과에 의한 것인지는 아직 분명치 않으나 본 발명의 결과물인 합성암생존 유전체 상의 관계를 통해 예후의 차이를 보였을 학술적 개연성은 높을 것으로 추정할 수 있다. 신약의 개발은 그 효과성뿐 아니라 부작용과 같은 안전성도 함께 고려하여 개발해야 할 것이지만, 본 실시예는 암 환자 유전체 정보의 차세대 시퀀싱 데이터 분석을 통해 본 발명에서 규명한 합성암생존 유전자 쌍의 특성을 활용하여 암환자의 맞춤형 약물의 선택 및 개발에 유용한 정보를 제공할 수 있음을 보여준다.
실시예 2. 암종별 합성암생존 유전자 쌍의 분포 및 예후 예측
상기 실시예 1에 제시한 바와 같이 합성 암생존 유전자 분석을 수행한 결과, 5개의 암종에서 436개의 합성암생존 유전자 쌍을 선정하였으며, 그 결과를 표 1에 나타내었다 (p < 0.05, HR >1). 본 실시예에서 사용된 합성암생존 유전자 쌍의 선별 기준은 엄격하게 적용되었다. 합성암생존 유전자 쌍을 검출하기 위한 다양한 조건의 조합이 가능함은 명확하지만, 실시예 1에 예시한 바와 같이 쌍손상군과 비손상군의 비교에서도 통계적으로 유의한 차이를 보이고, 쌍손상군과 두 개의 외손상군 각각의 비교에서도 통계적으로 유의한 차이를 보이는 반면, 비손상군과 두 개의 외손상군 사이의 세 번의 비교에서는 통계적으로 유의한 차이를 보이지 않는 엄격한 판단기준을 적용하여 암종별 합성암생존 유전자 쌍을 선정하였다.
Tumor Type Num. of SCS pairs Clinical variables used in cox model
LUAD 287 Age, Gender, Pathologic T/N stage
SKCM 137 Age, Pathologic T/N stage, Marginal status, ER/PR/HER2 status
LUSC 6 Age, Grade, Clinical Stage
HNSC 5 Age, Gender, Pathologic T/N stage, vascular/lymphovascular invasion status, Anatomic neoplasm subdivision
KIRP 1 Age, Gender, Karnofsky score
Total 436
표 1에 나타낸 바와 같이, 폐선암(Lung adenocarcinoma, LUAC) 및 피부흑색종 (Skin cutaneous melanoma, SKCM)에서 특히 많은 수의 합성암생존 유전자 쌍을 선별하였으며, 본 실시예에서 선정한 436개의 합성암생존 유전자 쌍은, 보다 구체적으로는 281개의 유전자로 구성되어 있으며, 가장 많은 합성암생존 유전자 쌍에 속하는 유전자는 XIRP2와 RYR3 등이었다.
본 실시예의 판단 기준을 적용하여 다섯 개의 암종별로 수득한 436개의 합성암생존 유전자 쌍의 목록을 표 2에 나타내었다.
본 실시예의 판단 기준을 적용하여 암종별로 수득한 436개의 합성암생존 유전자 쌍
암종 합성암생존 유전자 쌍
HNSC CDKN2A PRKDC
HNSC COL11A1 CSMD3
HNSC CSMD3 NSD1
HNSC HLA-B NOTCH1
HNSC MUC16 ZNF99
KIRP MUC16 TTN
LUAD A2ML1 ASPM
LUAD A2ML1 C6
LUAD A2ML1 FAM5C
LUAD A2ML1 GRIN2B
LUAD A2ML1 PAPPA2
LUAD A2ML1 UNC13C
LUAD A2ML1 XIRP2
LUAD A2ML1 ZEB1
LUAD ABCA6 FLG
LUAD ABCA6 ZFHX4
LUAD ABCB5 C1orf173
LUAD ABCB5 C7orf58
LUAD ABCB5 DUSP27
LUAD ABCB5 TTN
LUAD ACACA PIK3C2B
LUAD ACACA ZFHX4
LUAD ADCY10 CARD8
LUAD ADCY10 CSMD3
LUAD ADCY10 XIRP2
LUAD AFF2 DST
LUAD AFF2 SPTA1
LUAD AKAP6 C6
LUAD AKAP6 KCNB2
LUAD AKAP6 MYO3B
LUAD AKAP6 RYR2
LUAD AKAP6 RYR3
LUAD AKAP6 SMARCA4
LUAD AKAP6 THSD7A
LUAD AKAP6 TNN
LUAD AKAP6 XIRP2
LUAD AKAP6 ZEB1
LUAD AMER1 GRIN2B
LUAD AMER1 XIRP2
LUAD ASPM RYR3
LUAD ASPM SCN10A
LUAD ASPM XIRP2
LUAD ATP2B3 KIF21B
LUAD ATP2B3 RYR3
LUAD C12orf63 MUC16
LUAD C18orf34 PAPPA2
LUAD C1orf173 ROS1
LUAD C6 KCNB2
LUAD C6 MUC2
LUAD C6 SLC1A3
LUAD C6 THSD7A
LUAD C6 TNN
LUAD C6 UNC13C
LUAD C6 XIRP2
LUAD C7orf58 HCN1
LUAD C7orf58 MYOM2
LUAD C7orf58 ROS1
LUAD C7orf58 XIRP2
LUAD CACNA1E FAT4
LUAD CACNA1E FOLH1
LUAD CACNA1E GRM7
LUAD CACNA1E KIF21B
LUAD CACNA1E LILRA1
LUAD CACNA1E SLC12A1
LUAD CACNA1E SMARCA4
LUAD CACNA1E ZNF99
LUAD CARD8 CSMD3
LUAD CCDC178 PAPPA2
LUAD CDH23 PSG8
LUAD CDH23 ZFHX4
LUAD CDH7 GPR158
LUAD CENPE PAPPA2
LUAD CENPE PCDHAC2
LUAD CENPE XIRP2
LUAD CENPE ZNF804A
LUAD CENPF RYR3
LUAD CENPF XIRP2
LUAD CHD8 COL11A1
LUAD CMYA5 XIRP2
LUAD CNKSR2 RYR2
LUAD CNTN5 COL7A1
LUAD CNTNAP2 HYDIN
LUAD COL11A1 FER1L6
LUAD COL11A1 FRAS1
LUAD COL11A1 ITPR2
LUAD COL11A1 KLK1
LUAD COL11A1 TSHZ3
LUAD COL4A4 RYR3
LUAD COL4A5 PCDHGC5
LUAD COL7A1 TNN
LUAD COL7A1 XIRP2
LUAD CPED1 CSMD1
LUAD CPED1 DUSP27
LUAD CPED1 HCN1
LUAD CPED1 MYOM2
LUAD CPED1 ROS1
LUAD CPED1 SYNE1
LUAD CPED1 TNXB
LUAD CPS1 DCHS2
LUAD CPS1 GRM7
LUAD CPS1 HCN1
LUAD CPS1 LRRIQ1
LUAD CPS1 PCDHAC2
LUAD CPS1 RYR2
LUAD CPS1 SYNE1
LUAD CPS1 UNC13C
LUAD CREBBP RYR3
LUAD CREBBP TNN
LUAD CSMD1 FCGBP
LUAD CSMD1 GRM7
LUAD CSMD1 MYOM2
LUAD CSMD1 OR2W3
LUAD CSMD1 PDE3A
LUAD CSMD1 PLXNA2
LUAD CSMD1 SALL1
LUAD CSMD1 THSD7A
LUAD CSMD1 TRPA1
LUAD CSMD3 DYSF
LUAD CSMD3 ITGAV
LUAD CSMD3 MYO7A
LUAD CSMD3 SCN3A
LUAD CYP11B2 XIRP2
LUAD DCDC1 FAM5C
LUAD DCDC1 XIRP2
LUAD DCDC5 FAM5C
LUAD DCHS2 RYR3
LUAD DMXL1 RYR3
LUAD DSCAM KCNB2
LUAD DSCAM RYR2
LUAD DSCAM UNC13C
LUAD DSCAML1 USH2A
LUAD DST NID2
LUAD DUSP27 FAT4
LUAD DUSP27 GRIN2B
LUAD DUSP27 HTR1E
LUAD DUSP27 PEG3
LUAD DUSP27 RYR3
LUAD DYSF KMT2A
LUAD EGFLAM RYR2
LUAD F8 FAT4
LUAD F8 KRAS
LUAD FAM123B GRIN2B
LUAD FAM47B RYR3
LUAD FAM47B TNN
LUAD FAM47C GRM1
LUAD FAM47C MYO18B
LUAD FAM47C TUBA3C
LUAD FAM47C ZNF804A
LUAD FAM5C FAT4
LUAD FAM5C KIF21B
LUAD FAM5C OR2W3
LUAD FAM5C SCN9A
LUAD FAM5C SMARCA4
LUAD FAM5C SYNE1
LUAD FAM5C TNN
LUAD FAM5C ZEB1
LUAD FAT1 FLG
LUAD FAT2 RYR3
LUAD FAT3 FOLH1
LUAD FAT3 KIF21B
LUAD FAT3 OR5AS1
LUAD FAT4 GRM1
LUAD FAT4 HCN1
LUAD FAT4 NLGN4X
LUAD FAT4 PDZRN3
LUAD FAT4 RYR3
LUAD FAT4 XIRP2
LUAD FAT4 ZNF804A
LUAD FCGBP TTN
LUAD FOLH1 HCN1
LUAD FOLH1 UNC13C
LUAD FOLH1 UNC79
LUAD FOLH1 XIRP2
LUAD FOLH1 ZNF804A
LUAD GRIN2B KCNB2
LUAD GRIN2B MYO18B
LUAD GRIN2B PRKCB
LUAD GRIN2B ROS1
LUAD GRIN2B ZNF804A
LUAD GRM1 OR2G2
LUAD GRM7 HCN1
LUAD GRM7 RYR3
LUAD GRM7 TTN
LUAD GRM7 ZNF804A
LUAD HCN1 MYO18B
LUAD HCN1 PTPRB
LUAD HCN1 RYR3
LUAD HCN1 SYNE1
LUAD HCN1 XIRP2
LUAD HCN1 ZEB1
LUAD HFM1 RYR2
LUAD HTR1E TNN
LUAD HTR1E UNC13C
LUAD INSRR MUC16
LUAD ITPR2 TSHZ3
LUAD KCNB2 MYO3B
LUAD KCNB2 SLC1A3
LUAD KCNB2 TNN
LUAD KCNB2 UNC13C
LUAD KCNB2 XIRP2
LUAD KCNH7 XIRP2
LUAD KIF21B MUC2
LUAD KIF21B PAPPA2
LUAD KIF21B PLXNA2
LUAD KIF5A XIRP2
LUAD KLK1 RYR2
LUAD KLK1 TSHZ3
LUAD LAMA1 LPA
LUAD LAMA1 RYR3
LUAD LAMA1 XIRP2
LUAD LILRA1 NBPF10
LUAD LPA MYO18B
LUAD LPA PDZRN3
LUAD LPA PTPRB
LUAD LPA RYR3
LUAD LPA SLC12A1
LUAD LPA TNN
LUAD LRBA MYOM2
LUAD LRRIQ1 RYR3
LUAD LRRIQ1 TNN
LUAD LRRIQ1 ZEB1
LUAD LRRIQ3 ZNF804A
LUAD LTBP1 OTOGL
LUAD MLL2 XIRP2
LUAD MMRN1 MYO18B
LUAD MMRN1 PDZRN3
LUAD MMRN1 XIRP2
LUAD MUC2 PCDH11X
LUAD MUC2 XIRP2
LUAD MYO18B PHF14
LUAD MYO18B RYR3
LUAD MYO3B PEG3
LUAD MYO3B SLC1A3
LUAD MYO3B UNC13C
LUAD MYO7A RYR2
LUAD MYOM2 PAPPA2
LUAD MYOM2 PCDHAC2
LUAD MYOM2 RYR2
LUAD MYOM2 ZNF804A
LUAD MYT1L RYR3
LUAD MYT1L TNN
LUAD MYT1L TRPA1
LUAD MYT1L UNC79
LUAD MYT1L XIRP2
LUAD NBPF10 RYR2
LUAD NBPF10 RYR3
LUAD NBPF10 TTN
LUAD NOL4 TTN
LUAD NOL4 XIRP2
LUAD OR2T33 TTN
LUAD OR2W3 PDE3A
LUAD OR4A15 ZNF536
LUAD OR5D13 RYR3
LUAD PAPPA2 SLC1A3
LUAD PAPPA2 UNC13C
LUAD PCDHAC2 PDE3A
LUAD PCDHAC2 SCN9A
LUAD PCDHAC2 SLC26A7
LUAD PDE3A ZNF804A
LUAD PDZRN3 RYR2
LUAD PDZRN3 RYR3
LUAD PDZRN3 TNN
LUAD PEG3 SYCP2
LUAD PHACTR1 SLC6A18
LUAD RIMS2 USH1C
LUAD ROBO4 RYR3
LUAD ROS1 XIRP2
LUAD RYR2 THSD7A
LUAD RYR2 XIRP2
LUAD RYR3 SLC1A3
LUAD RYR3 SMARCA4
LUAD RYR3 UNC13C
LUAD SCN10A SYNE1
LUAD SCN10A XIRP2
LUAD SLC6A18 TCF20
LUAD SLC6A18 UHRF1BP1L
LUAD SMARCA4 XIRP2
LUAD SMARCA4 ZNF804A
LUAD SPTA1 TNRC6A
LUAD SVEP1 TNN
LUAD SVEP1 ZNF99
LUAD SYNE1 XIRP2
LUAD TCF20 ZFHX4
LUAD TIAM1 USH2A
LUAD TNN UNC13C
LUAD TNN YLPM1
LUAD TNRC6A ZFHX4
LUAD TRPA1 XIRP2
LUAD TUBA3C XIRP2
LUAD UNC13C XIRP2
LUAD XIRP2 ZNF99
LUAD YLPM1 ZEB1
LUAD ZNF804A ZNF99
LUSC CDH10 FAM135B
LUSC CSMD3 PCDHAC2
LUSC CSMD3 PEG3
LUSC CSMD3 TTN
LUSC LRP1B SCN1A
LUSC PCDHAC2 TP53
SKCM ABCA4 BPTF
SKCM ADAM28 PDE1A
SKCM ADAMTSL1 FAT3
SKCM ADAMTSL3 TP53
SKCM ADD2 ARMC4
SKCM ANK3 CDH6
SKCM ANK3 LAMA1
SKCM ANKRD30B MYH1
SKCM ARID2 FREM1
SKCM ASPM CLCN1
SKCM ASPM MLL3
SKCM ASPM MYH6
SKCM ASTN1 COL4A2
SKCM ASTN1 FREM1
SKCM ASTN1 GHR
SKCM ASTN1 ODZ1
SKCM ASTN1 TENM1
SKCM ASTN1 ZAN
SKCM ATP1A3 FAT3
SKCM ATP1A3 GRID2
SKCM ATP1A3 SCN5A
SKCM BCLAF1 FLG
SKCM BCLAF1 LRRC4C
SKCM BCLAF1 NBEA
SKCM BCLAF1 UGT2A3
SKCM BRAF GALNT14
SKCM BRAF MYO5B
SKCM BRAF NOTCH4
SKCM BRAF TNN
SKCM C12orf51 UNC13C
SKCM C7orf58 PAPPA2
SKCM CACNA1C CCDC88C
SKCM CACNA1C NBEA
SKCM CACNA1C PREX2
SKCM CACNA1C RIMBP2
SKCM CACNA1C SCN7A
SKCM CACNA1E NES
SKCM CATSPERB CDH6
SKCM CATSPERB COL4A4
SKCM CCDC88C COL5A3
SKCM CDH6 FLG
SKCM CDH6 RYR1
SKCM CDH6 TRPC4
SKCM CDHR2 KCNB2
SKCM CES1 PREX2
SKCM CLCN1 KMT2C
SKCM CLCN1 MLL3
SKCM CLCN1 SYNE1
SKCM CNTN5 PROL1
SKCM COL21A1 FLG
SKCM COL21A1 PROL1
SKCM COL21A1 SACS
SKCM COL2A1 UGT2A3
SKCM COL4A4 YLPM1
SKCM COL5A3 DSCAM
SKCM COL5A3 GRID2
SKCM COL5A3 KIF4B
SKCM COL5A3 PTPRN2
SKCM COL7A1 NBEA
SKCM CPED1 PAPPA2
SKCM DAB1 ST6GAL2
SKCM DNAH5 KCNQ5
SKCM DNAH8 GHR
SKCM DPYD OR2G3
SKCM DSCAM MED12L
SKCM DUSP27 SPAG17
SKCM ENAM FLG
SKCM ENAM PXDNL
SKCM FAM5C KDR
SKCM FAM5C XIRP2
SKCM FAT3 GRM7
SKCM FAT3 MAGEC1
SKCM FAT3 NBEA
SKCM FLG GRID2
SKCM FLG KIAA2022
SKCM FLG LCT
SKCM FLG MYH2
SKCM FLG NES
SKCM FLG PCDHA9
SKCM FLG PREX2
SKCM FREM1 PDE1A
SKCM FRY MYH2
SKCM GFRAL PEG3
SKCM GHR PAPPA2
SKCM GHR TPTE
SKCM GK2 KCNB2
SKCM GK2 MYH4
SKCM GPR98 SLC14A2
SKCM GRID2 PDE1A
SKCM GRID2 SERPINI2
SKCM GRIK3 MYH7
SKCM GRM7 PCDHA9
SKCM HECTD4 UNC13C
SKCM HSPG2 RIMBP2
SKCM HYDIN KIAA2022
SKCM HYDIN TP53
SKCM KIF4B PTPRN2
SKCM KRT1 PAPPA2
SKCM LAMA1 NPAP1
SKCM LCT MYO18B
SKCM LCT RYR1
SKCM LCT SACS
SKCM LCT SCN10A
SKCM LRP1B SACS
SKCM LRRC4C OR2G3
SKCM LRRC7 PDE1A
SKCM MLL3 TRHDE
SKCM MROH2B TRPV5
SKCM MYH7 UGT2A3
SKCM NES PEG3
SKCM NES PTPRB
SKCM NES SPHKAP
SKCM NLRP5 PAPPA2
SKCM NRAS SCN5A
SKCM OR1N2 XIRP2
SKCM OR2G3 PXDNL
SKCM OR4K2 TP53
SKCM OR51B5 RYR1
SKCM OTOGL PEG3
SKCM OTOGL RGPD4
SKCM PADI3 PKHD1L1
SKCM PAPPA2 PEG3
SKCM PCDHA9 PPP1R3A
SKCM PCLO UGT2A3
SKCM PDE1A TEX15
SKCM PDE1C PREX2
SKCM PDZD2 SPEN
SKCM PREX2 UGT2A3
SKCM PTCHD2 PTPRT
SKCM PXDNL TRHDE
SKCM PXDNL ZAN
SKCM PXDNL ZFPM2
SKCM RIMBP2 SCN10A
SKCM SACS SCN5A
SKCM SHANK2 TP53
SKCM SI SLC15A2
SKCM UGT2A3 USH2A
합성암생존 유전자 쌍에 속하는 두 개의 유전자 중 두 개 모두가 낮은 유전자 손상 점수를 갖는 변이유전자이면 해당 두 유전자는 합성암생존 유전자 쌍을 구성한 것으로 정의한다. 합성암생존 유전자 쌍에 속하는 두 개의 유전자 중 하나는 낮은 유전자 손상 점수를 갖는 변이 유전자이고 다른 하나는 유전자 손상 점수가 낮지 않은 대응 유전자이면 해당 대응 유전자를 억제하는 약물을 이용하면 해당 암 환자의 생존률을 높일 것으로 예측할 수 있다.
도 2에 상기 표 2에 개시한 합성암생존 유전자 쌍으로 구성된 유전자 네트워크를 다중 그래프로 예시하였다. 이때 각각의 노드는 유전자이고, 서로 연결선으로 연결된 유전자 쌍은 합성암생존 유전자 쌍을 의미한다.
또한, 도 4에 폐선암 환자군에서 유전자 손상 점수가 0.3점 이하인 변이 유전자의 빈도를 바그래프로 도시하였으며, 도 5에 폐선암에서 검출된 합성암생존 유전자 쌍에 속하는 변이 유전자가 폐선암 환자에서 발견되는 빈도를 도시하였다.
도 4 및 도 5에 개시된 바와 같이, 많은 환자에서 XIRP2와 RYR3 유전자가 합성암생존 유전자 쌍을 구성하고 있음을 알 수 있다. 반면 TTN 유전자의 경우, TTN 유전자의 유전자 손상 점수가 낮은 환자의 수는 많았으나, TTN 유전자가 합성암생존 유전자 쌍을 이루는 환자의 수는 상대적으로 적음을 알 수 있다. 즉 기존의 연구는 암 유전자의 체세포 돌연변이 빈도를 중심으로 이루어져 왔으나, 단순히 개별 유전자의 돌연변이 분석만으로는 암 환자의 예후 및 치료 반응 예측이 쉽지 않으며, 본 발명과 같이 유전자 쌍의 분석 및 유전자 네트워크의 분석이 암 환자의 예후 및 치료 반응 예측에 크게 기여할 수 있음을 시사한다.
실시예 3. 암종별 합성암생존 부담을 이용한 암 생존 및 예후 예측
암 환자의 합성암생존 유전자 쌍의 개수가 암 환자의 예후와 생존률에 미치는 영향을 분석하였다. 그 일례로 341명의 폐선암 환자(LUAD)와 181명의 피부흑색종 환자(SKCM)에서의 결과를 도 6 및 도 7에 각각 나타내었다.
먼저, 341명의 폐선암 환자를 합성암생존 유전자 쌍을 하나도 갖고 있지 않은 149명, 1개 이상 내지 10개 미만을 가지고 있는 122명, 및 10개 이상을 가지고 있는 70명으로 총 세 군으로 나누어 Cox proportional hazard model을 적용한 생존 분석을 수행하였다. 그 결과 도 6에 나타낸 바와 같이, 합성암생존 유전자 쌍을 가장 많이 가진(10개 이상을 가지고 있는) 70명의 생존률이 가장 높고, 1개 이상 내지 10개 미만을 가지고 있는 122명의 생존률이 중간값을 가지며, 합성암생존 유전자 쌍을 하나도 갖고 있지 않은 149명의 생존률이 가장 낮은 것을 확인하였으며, 이를 통해, 합성암생존 유전자 쌍을 많이 가질수록 폐선암 환자의 생존률이 통계학적으로 유의하게 높음을 확인할 수 있었다.
다음으로, 181명의 피부흑색종 환자를 합성암생존 유전자 쌍을 하나도 갖고 있지 않은 88명, 1개 이상 내지 5개 미만을 가지고 있는 47명, 및 5개 이상 가지고 있는 46명으로 총 세 군으로 나누어 Cox proportional hazard model을 적용한 생존분석을 수행하였다. 그 결과 도 7에 나타낸 바와 같이, 합성암생존 유전자 쌍을 많이 가질수록 피부흑색종 환자의 생존률이 통계학적으로 유의하게 높음을 확인할 수 있었다.
이상의 실험을 통해, 암환자의 유전체 분석을 통해 암환자의 합성암생존 유전자 쌍의 개수로 표현되는 합성암생존 부담을 확인함으로써 해당 암환자의 생존 예후를 효과적으로 예측할 수 있음을 확인하였다.
실시예 4. 암종별 합성암생존 부담과 체세포 돌연변이 부담을 이용한 암 생존 및 예후 예측
상기 실시예 3에서 개시한 암환자에서 발견되는 합성암생존 유전자 쌍의 개수를 활용한 암 생존률의 분석은 의학적으로 매우 중요한 의미를 가진다. 현재 일반적으로는 암세포의 non-synonymous 체세포 돌연변이가 많을수록 암환자의 예후가 나쁜 것으로 알려져 있는데 이와는 다른 분석 결과이기 때문이다.
보다 구체적으로, 합성 암생존 유전자 쌍의 개수와 non-synonymous 체세포 돌연변이의 빈도를 로그-로그 그래프로 나타내었다(도 8). 도 8에 나타낸 바와 같이, 합성 암생존 유전자 쌍의 개수는 폐선암과 피부흑색종 모두에서 non-synonymous 체세포 돌연변이의 빈도와 정비례한다. 그러므로 체세포 돌연변이가 많을수록 예후가 나쁘다고 생각되는 현재의 일반적인 견해에 따르면 체세포 돌연변이 부담에 정비례하는 암생존 유전자 쌍의 개수가 많을수록 예후가 나쁘게 나타날 가능성은 높다고 판단할 수 있다. 그러나 실시예 3의 결과는 합성암생존 유전자 쌍의 개수가 많을수록 예후가 좋음을 보여준다. 즉, 실시예 3에 개시한 바와 같이 합성암생존 유전자 쌍의 개수가 많은 환자의 경우 체세포 돌연변이도 함께 늘어날 가능성이 높지만, 체세포 돌연변이의 특수한 형태인 합성암생존 유전자 쌍의 변이가 더 많이 늘어나면 오히려 예후가 좋을 수 있음을 알 수 있다.
이러한 암종별 합성암생존 부담과 체세포 돌연변이 부담의 암환자 예후에 미치는 영향의 역상관 관계는 도 6 및 도 7의 하단에 표기된 각 군별 생존분석 그래프에서 명확히 확인할 수 있다. 보다 구체적으로, 도 6의 하단에 있는 세 개의 생존분석 그래프는 341명의 폐선암 환자를 합성암생존 유전자 쌍의 보유 수에 따라 세 군으로 나누어 생존 분석을 수행한 결과, 세 군 모두에서 빨간색으로 표기된 체세포 돌연변이 부담이 더 높은 환자(각각 74명, 61명, 35명)가 하늘색으로 표기된 체세포 돌연변이 부담이 더 낮은 환자(각각 75명, 61명, 35명)보다 통계적으로 유의하게 나쁜 예후를 보임을 제시한다.
또한, 도 7의 하단에 있는 세 개의 생존분석 그래프는 181명의 피부흑색종 환자를 합성암생존 유전자 쌍의 보유 수에 따라 세 군으로 나누어 생존 분석을 수행한 결과, 세 군 모두에서 빨간색으로 표기된 체세포 돌연변이 부담이 더 높은 환자 (각각 44명, 23명, 23명)가 하늘색으로 표기된 체세포 돌연변이 부담이 더 낮은 환자 (각각 44명, 24명, 23명)보다 통계적으로 유의하게 나쁜 예후를 보임을 제시한다.
상기 결과를 통해, 합성암생존 유전자 쌍의 개수가 보정된다면 체세포 돌연변이 수가 많을수록 예후가 나쁘다는 기존의 학설과 일치함을 알 수 있다. 역으로 도 6 및 도 7에 개시된 분석 결과를 통해 체세포 돌연변이 개수가 많은 경우에도 그 돌연변이 개수를 보정하면 합성암생존 유전자 쌍 부담이 중요한 암 예후 예측 인자임을 알 수 있다.
종합적으로 본 발명에서 제시하고 있는 합성암생존 유전자 쌍의 분석은 기존에 알려진 체세포 돌연변이 분석과 차별화되는 개념이다. 즉, 체세포 돌연변이 부담이 동일하다면 합성암생존 부담이 클수록 해당 암 환자의 예후가 좋고, 합성암생존 부담이 동일하다면 체세포 돌연변이 부담이 적을수록 해당 암환자의 예후가 좋다고 예측하는 것이 가능하다. 이러한 현상을 함수화함으로써 암 환자의 예후를 예측하기 위해서 암 유전체 분석을 통해 획득 가능한 합성암생존 부담과 체세포 돌연변이 부담 정보를 제공할 수 있다.
또한 상기 실시예 1에서 개시한 바와 같이, 암환자의 맞춤형 약물 선택 방법을 적용하여 선택한 약물을 환자에게 처치한 경우 해당 약물에 대한 치료반응 역시 해당 약물이 차단하는 유전자에 의해 증가하는 합성암생존 유전자 쌍의 개수 분석을 통해 예측할 수 있음을 알 수 있다. 즉, 해당 처치 약물이 해당 환자의 합성암생존 유전자 쌍의 개수를 늘리는 정도에 따라 해당 치료반응을 예측할 수 있고, 역으로 해당 치료반응 향상이 큰 약물로 맞춤 치료 약물을 선택할 수 있다.
실시예 5. 암종별 합성암생존 부담과 체세포 돌연변이 부담을 이용한 암세포의 전이능력 예측
암 환자는 암으로 사망하기 보다 암의 전이로 사망한다. 암 조직 자체는 제거하거나 방사선치료 등의 국소 치료법으로 통제할 수 있으나, 전이암의 처치는 매우 어렵고 전이한 암세포가 다양한 위해를 유발하기 때문이다. 즉, 본 발명의 결과물인 합성암생존 유전자 쌍이 많아질수록 암의 예후가 좋아지는 것은 합성 암생존 유전자 쌍이 해당 암세포의 전이능력을 저하시키는 것과 유관할 것으로 추정할 수 있다. 현재 암세포의 전이능력을 동정하는 방법 중의 하나로 세포침윤검사(cell invasion assay)가 있다. 일례로 코닝사에서 제공하는 Matrigel invasion assay 방법은 Engelbreth-Holm-Swarm (EHS) 생쥐 육종 세포가 분비하는 젤라틴 형태의 단백질 혼합물로서 암세포가 이 Matrigel을 얼마나 파고드는 능력을 가졌는가를 정량적으로 평가할 수 있는 실험 방법을 제공한다.
본 발명의 결과로 얻어진 합성암생존 유전자 쌍의 암전이에 미치는 영향을 분석하기 위해 폐암 세포주 5개(A, B, C, D, E)에서 Whole exome sequencing(WXS)과 Matrigel invasion assay를 진행하였다. 실험은 두 차례 수행하여 검증하였으며, 첫 실험의 Matrigel의 최종 농도는 300ug/ml, 배양시간은 24 시간, 사용 세포 수는 웰 당 약 75000개로 수행하였고, 두 번째 실험의 Matrigel의 최종 농도는 300ug/ml, 배양시간은 42 시간, 사용 세포 수는 웰 당 약 75000개를 실험조건으로 사용하여 두 번 반복 실험하였다. 실험은 총 3회 수행되었다. WXS은 illnumina HiSeq 2000 System을 사용하고 Hg19 버전의 Human Reference Genome을 사용하였다.
도 9는 상기 5개 세포주의 체세포 돌연변이 부담과 합성암생존 부담의 분포를 예시한다. 도 9는 실시예 4에서 설명한 바와 같이 합성암생존 유전자 쌍의 개수가 체세포 돌연변이 개수와 정비례하여 증가함을 보여준다. 도 10은 Matrigel invasion assay의 결과인 각 세포주 별 Matrigel 침윤능력 (invasiveness) 또는 전이능력을 바그래프로 보여준다. 즉 필드당 침윤한 세포수가 많을수록 해당 암세포주의 침윤능력 또는 전이능력이 큰 것이며 이는 암전이 능력이 큰 것을 의미한다. 그러므로 C, B, D, E, A 세포준 순으로 암전이 능력이 큰 것으로 판단할 수 있다.
도 9에 나타난 체세포 돌연변이 부담과 합성암생존 부담의 분포를 활용하면, 체세포 돌연변이 부담이 400개를 조금 넘는 D과 A의 비교에서 합성암생존 부담이 더 큰 A의 암전이 능력이 더 낮을 것으로 예측되며, 이는 도 10의 막대그래프에서 예측대로 확인된다. 또한, 체세포 돌연변이 부담이 460개 전후인 B과 E의 비교에서 합성암생존 부담이 더 큰 E의 암전이 능력이 더 낮을 것으로 예측되며, 이는 도 10의 막대그래프에서 예측대로 확인된다. 또한, 합성암생존 부담 37개인 B과 A의 비교에서 체세포 돌연변이 부담이 더 큰 B의 암전이 능력이 더 높을 것으로 예측되며, 이는 도 10의 막대그래프에서 예측대로 확인된다. 그러므로 본 발명의 결과물인 합성암생존 유전자 쌍의 분석을 통하여 암세포의 전이능력을 평가할 수 있음이 확인되었다. 본 실시예에서는 암 세포 또는 조직의 침윤능력 또는 전이능력의 동정을 위해 암 세포주의 Matrigel 세포침윤검사를 수행하였지만 이로서 제한되는 것은 아니다. 예를 들어 암 세포 또는 조직의 침윤능력 또는 전이능력을 평가하기 위해 면역능력이 통제된 실험동물에 암 세포 또는 조직을 이식하여 보다 직접적으로 암 세포 또는 조직의 침윤능력 또는 전이 능력을 동정하는 방법이 가능하며, 이와 같은 다양한 암 세포 또는 조직의 침윤능력 또는 전이능력의 동정을 통해 합성암생존 유전자 쌍을 발견하고 합성암생존 현상을 활용한 맞춤형 약물 선택 방법은 본 발명의 범위에 속하는 것이다.
실시예 6. 생물학적 마커를 활용하여 암의 세부군 분류에 따른 합성암생존 유전자 쌍 분석의 유용성
본 실시예는 분석 대상 암종을 특정 생물학적 마커를 활용하여 세부 군으로 나눈 후 합성암생존 유전자 쌍을 검출하고, 맞춤형 약물 선택 및 예후를 예측하는 방법을 예시한다. 즉, 본 실시예는 상기 실시예 1 내지 4에서 예시된 암종별 합성암생존 분석에 있어서, 기존의 임상적, 병리학적 암 분류체계뿐 아니라, 주요 진단, 치료 및 예후 관련 생물학적 마커에 따른 세부 군으로 나누어 더욱 정밀한 합성암생존 분석을 수행하는 것이 가능하며, 이러한 생물학적 마커를 활용한 세부군 별 합성암생존 분석이 본 발명의 범위에 속함을 예시한다.
일례로 MSI(Microsatellite instability)는 대장암의 진단, 치료 및 예후에 매우 중요한 생물학적 마커로 알려져 있다. 본 실시예는 대장암에서 MSI의 상태에 따라 환자 군을 나누어 합성암생존 분석을 수행하는 것이 앞서 개시한 실시예 1 내지 실시예 4에 해당하는 합성암생존 분석의 결과를 도출할 수 있을 뿐 아니라 더욱 유용하고 안정된 정밀 분석결과를 얻을 수 있음을 예시한다.
대장암 (COAD) 데이터는 미국 NCI GDC (National Cancer Institute Genomic Data Commons) 데이터 포탈에서 2016년 7월 11일 기준, TCGA 데이터 포탈 2016년 3월 21일 기준으로 내려받았다. 상기 데이터 중 NCI GDC 데이터는 433명의 체세포 돌연변이(somatic mutation) 데이터를 포함하며, TCGA 데이터는 458명의 MSI (Microsatellite instability) 데이터와 459명의 임상데이터를 포함하고 있다. 상기 체세포 돌연변이 데이터는 VCF (Variant Call Format) 파일형식이며, 인간표준유전체 GRCh38 표준으로 정렬하였고 MuTect2로 변이를 결정하였다. 상기 level2 임상데이터는 다양한 임상 변인을 포함하고 있으며, Cox proportional hazard model에 사용되는 변인은 병리학자가 선별하였다. 상기 MSI 데이터는 각 환자별로 MSI의 상태에 따라 'MSS', 'MSI-L', 'MSI-H'로 분류되어 있으며 본 실시예에서는 MSI-L와 MSI-H 군을 MSI 양성군, MSS 군을 MSI 음성군으로 구분하여 분석하였다.
Cox proportional hazard model 적용에 필요한 정보가 없는 환자, 다른 악성 종양양성, 혹은 전이 양성, 방사선 치료, 약물, ablation adjuvant 치료 환자들의 데이터를 제외하였다. 그리고 체세포 돌연변이 데이터와 MSI 데이터가 없는 환자들을 제외하였다. VAT(Variant Annotation Tool)로 변이의 주석을 붙이고 synonymous 변이를 제외한 후, HGNC symbol이 없는 유전자의 데이터를 제외하였다. 마지막으로 임상정보와 MSI 데이터가 없는 환자들의 데이터를 제외하였다. 최종적으로 427명의 대장암 환자가 분석에 사용되었다.
먼저, 전체 427명의 대장암 환자를 전체를 대상으로 실시예 1 내지 2에 예시된 방법으로 합성암생존 유전자 쌍을 찾으려 하였으나, 단 한 개의 유의한 합성암생존 유전자 쌍도 찾아지지 않았다. 대장암의 경우 MSI 상태에 따라 체세포 돌연변이의 수 및 예후가 다르므로, MSI 양성군 151명과 음성군 276명으로 구분하였다. MSI 상태에 따라 대장암 환자를 두 군으로 나누어 MSI 양성군(MSI-L & MSI-H)에서 14개의 유의한 합성암생존 유전자 쌍을 검출하였다(p < 0.05, HR >1). 그러나 체세포 돌연변이 부담이 낮은 MSI 음성군에서는 유의한 합성암생존 유전자 쌍이 하나도 발견되지 않았다. MSI 양성군에서 검출한 대장암의 합성암생존 유전자 쌍을 표 3에 나타내었다.
본 실시예의 판단 기준을 적용하여 대장암의 MSI 양성 군에서 수득한 14개의 합성암생존 유전자 쌍
Gene A Gene B
BRAF COL6A3
PTPRS
SYNE1
OBSCN KMT2B
PCLO
PIK3CA
PIK3CA DCHS1
HMCN1
DNAH1 DYNC2H1
SPEG
COL6A3 MYO7A
DYNC2H1 KIAA1109
HMCN1 PCSK5
SYNE1 PCDH10
표 3에 나타낸 바와 같이, 14개의 합성암생존 유전자 쌍은 17개의 유전자로 구성되어 있으며, 세포의 motor activity나 nucleoside/nucleotide binding과 관련되었다. 특히, MSI 군에서 OBSCN 유전자와 PIK3CA 유전자가 서로 합성압생존 유전자 쌍을 이루는 것을 확인하였다. 즉, OBSCN과 PIK3CA 쌍에서, OBSCN만 유전자 손상 점수가 낮거나 PIK3CA만 유전자 손상 점수가 낮은 외손상군 두 군은 두 유전자 모두 유전자 손상 점수가 낮지 않은 비손상군과 비교하였을 때 암 생존률에서 유의한 차이를 보이지 않으나, OBSCN와 PIK3CA의 유전자 손상 점수가 낮은 쌍손상군은 나머지 세 군 모두에 비해 통계학적으로 유의하게 암 환자의 생존률이 높음(p < 0.05, HR > 1.0)을 확인할 수 있었다. 그러므로 대장암에서 체세포 돌연변이를 보이는 OBSCN 유전자와 PIK3CA 유전자 쌍은 앞서 정의한 대장암의 합성암생존 유전자 쌍의 판단 기준에 부합함을 확인하였다.
다음으로, 실시예 3에서와 마찬가지로 합성암생존 유전자 쌍의 개수가 암 환자의 예후와 생존률에 미치는 영향을 분석하였다. 그 결과를 표 4에 나타내었다.
Alive Death Total
SCS pair = 0 288 57 345
SCS pair > 0 82 0 82
Total 370 57 427
표 4에 나타낸 바와 같이, 427명의 대장암 환자를 합성암생존 유전자 쌍을 하나도 갖지 않은 345명, 1개 이상 가진 82명의 두 군으로 나누어 Cox proportional hazard model을 적용한 생존분석을 수행한 결과, 합성암생존 유전자 쌍을 가진 82명의 생존률이 통계학적으로 유의하게 높음을 확인할 수 있었다 (p < 0.0005, HR > 1.0). 이를 통해 암환자의 합성암생존 유전자 쌍의 개수로 표현되는 합성암생존 부담 확인을 통해 해당 암환자의 생존 예후를 예측할 수 있음을 알 수 있었다.
상기한 바와 같이, 동일한 데이터에서 MSI 상태를 구분하지 않고 전체 대장암 환자를 대상으로 수행한 분석에서 합성암생존 유전자 쌍이 하나도 발견되지 않은 것과 비교하여 이상의 결과는 매우 중요한 의학적 의미를 갖는다. 일반적으로 전체 대장암 환자를 사용한 경우처럼 더 많은 수의 환자를 대상으로 통계 분석을 수행하는 경우 유의한 결과가 검출될 확률이 높은 것으로 알려져 있다. 그러나 본 실시예는 생물학적 마커를 기준으로 구분한 좀더 동질적인 군에서 합성암생존 분석을 수행하는 것이 더 정밀한 결과를 제공할 수 있음을 예시한다. 예들 들어 유방암은 ER (Estrogen Receptor), PR (Progesteron Receptor) 등 호르몬 수용체 발현 여부에 따라 진단, 치료, 예후에 중대한 영향을 미치므로 임상적 세부군을 나누어 판단한다. 그러므로, 본 실시예는 최신의 생물학적 마커에 따라 동일 암종도 다양한 세부 군으로 나누어 합성암생존 분석을 수행하는 것이 유용하고도 효과적임을 예시하며, 이러한 방법이 본 발명의 범위에 속함을 예시한다.

Claims (23)

  1. 암 환자의 유전체 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍에 속하는 하나 이상의 유전자의 염기서열 변이 정보를 결정하는 단계; 및
    상기 염기서열 변이 정보로부터 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자와 쌍을 이루는 하나 이상의 대응 유전자를 억제하는 하나 이상의 후보 약물을 선정하는 단계를 포함하는,
    암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  2. 제 1 항에 있어서,
    상기 유전자 염기서열 변이 정보는 유전자의 엑손(exon)을 구성하는 염기의 치환, 부가 또는 결실인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  3. 제 2 항에 있어서,
    상기 염기의 치환, 부가 또는 결실은 염색체의 절단, 결실, 중복, 역위 또는 전좌를 포함하는 구조적 이상에 의한 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  4. 제 1 항에 있어서,
    상기 유전자 염기서열 변이 정보는 참조군의 유전체 염기서열과의 비교 분석을 통해 수득되는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  5. 제 1 항에 있어서,
    상기 변이 유전자와 상기 대응 유전자는, 기능상실변이(Loss of Function (LoF) Variant)의 보유 여부를 기준으로 산출되는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  6. 제 1 항에 있어서,
    상기 변이 유전자와 상기 대응 유전자는, 각 해당 유전자가 보유한 유전자 염기서열 변이 점수에 의해 결정되는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  7. 제 1 항에 있어서,
    상기 변이 유전자와 상기 대응 유전자는, SIFT (Sorting Intolerant From Tolerant), PolyPhen, PolyPhen-2 (Polymorphism Phenotyping), MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam E-value), Mutation Assessor, Condel, GERP (Genomic Evolutionary Rate Profiling), CADD (Combined Annotation-Dependent Depletion), MutationTaster, MutationTaster2, PROVEAN, PMuit, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, MSRV (Multiple Selection Rule Voting), Align-GVGD, DANN, Eigen, KGGSeq, LRT (Likelihood Ratio Test), MetaLR, MetaSVM, MutPred, PANTHER, Parepro, phastCons, PhD-SNP, phyloP, PON-P, PON-P2, SiPhy, SNAP, SNPs&GO, VEP (Variant Effect Predictor), VEST (Variant Effect Scoring Tool), SNAP2, CAROL, PaPI, Grantham, SInBaD, VAAST, REVEL, CHASM (Cancer-specific High-throughput Annotation of Somatic Mutations), mCluster, nsSNPAnayzer, SAAPpred, HanSa, CanPredict, FIS 및 BONGO(Bonds ON Graphs)로 이루어진 군에서 선택된 하나 이상의 알고리즘을 각 해당 유전자가 보유한 유전자 염기서열 변이에 적용하여 산출된 하나 이상의 유전자 염기서열 변이 점수로부터 산출되는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  8. 제 1 항에 있어서,
    상기 변이 유전자와 상기 대응 유전자는, SIFT (Sorting Intolerant From Tolerant), PolyPhen, PolyPhen-2 (Polymorphism Phenotyping), MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam E-value), Mutation Assessor, Condel, GERP (Genomic Evolutionary Rate Profiling), CADD (Combined Annotation-Dependent Depletion), MutationTaster, MutationTaster2, PROVEAN, PMuit, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, MSRV (Multiple Selection Rule Voting), Align-GVGD, DANN, Eigen, KGGSeq, LRT (Likelihood Ratio Test), MetaLR, MetaSVM, MutPred, PANTHER, Parepro, phastCons, PhD-SNP, phyloP, PON-P, PON-P2, SiPhy, SNAP, SNPs&GO, VEP (Variant Effect Predictor), VEST (Variant Effect Scoring Tool), SNAP2, CAROL, PaPI, Grantham, SInBaD, VAAST, REVEL, CHASM (Cancer-specific High-throughput Annotation of Somatic Mutations), mCluster, nsSNPAnayzer, SAAPpred, HanSa, CanPredict, FIS 및 BONGO(Bonds ON Graphs)로 이루어진 군에서 선택된 하나 이상의 알고리즘을 각 해당 유전자가 보유한 유전자 염기서열 변이에 적용하여 산출된 하나 이상의 유전자 염기서열 변이 점수로부터 산출되는 유전자 손상 점수에 의해 결정되는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  9. 제 1 항에 있어서,
    상기 변이 유전자와 상기 대응 유전자는, 각 해당 유전자가 보유한 유전자 염기서열 변이가 두 개 이상인 경우, 각 유전자 염기서열 변이 점수들의 평균값으로 산출되는 유전자 손상 점수에 의해 결정되는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  10. 제 9 항에 있어서,
    상기 평균값은 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 헤론 평균, 역조화평균, 평균제곱근편차, 센트로이드 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 및 가중 곱으로 이루어진 군으로부터 선택된 하나 이상에 의해 계산되는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  11. 제 8 항에 있어서,
    상기 유전자 손상 점수는 하기 수학식 1에 의해 산출되는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
    [수학식 1]
    Figure pat00004

    상기 수학식 1에서 Sg는 유전자 g가 코딩하는 단백질의 유전자 손상점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상 염기서열 변이의 수, vii 번째 분석대상 염기서열 변이의 상기 염기서열 변이 점수이며, p는 0이 아닌 실수임.
  12. 제 8 항에 있어서,
    상기 유전자 손상 점수는 하기 수학식 2에 의해 산출되는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
    [수학식 2]
    Figure pat00005

    상기 수학식 2에서 Sg는 유전자 g가 코딩하는 단백질의 유전자 손상점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상인 염기서열 변이의 수, vii 번째 분석대상 염기서열 변이의 상기 유전자 염기서열 변이 점수이며, wi는 상기 i 번째 염기서열 변이의 상기 유전자 염기서열 변이 점수 vi에 부여되는 가중치임.
  13. 제 1 항에 있어서,
    상기 합성암생존 유전자 쌍은 암 세포주 또는 암 조직에 포함된 두 개 이상의 변이 유전자의 조합이 해당 암 환자의 생존률 향상을 유발하는 유전자 쌍을 의미하는 것으로, 상기 두 개 이상의 변이 유전자 중 개별 변이 유전자 각각은 해당 암 환자의 생존률 향상을 유발하지 않지만, 상기 두 개 이상의 변이 유전자의 조합이 해당 암 환자의 생존률 향상을 유발하는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  14. 제 1 항에 있어서,
    상기 합성암생존 유전자 쌍 정보를 이용하여 상기 암 환자에 대해 적용되는 약물 간의 우선순위를 결정하는 단계; 또는
    상기 합성암생존 유전자 쌍 정보를 이용하여 상기 암 환자에 적용되는 약물의 사용 여부를 결정하는 단계를 추가로 포함하는, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  15. 제 1 항에 있어서,
    상기 염기서열 변이 정보 결정 대상인 하나 이상의 유전자가 속하는 합성암생존 유전자 쌍의 선정은,
    암 환자의 유전체 돌연변이와 생존 정보를 이용한 암환자 생존 분석을 수행하는 단계; 또는
    암 세포주 또는 암 조직에서의 유전체 돌연변이 분석 및, 상기 암 세포주 또는 암 조직에서의 침윤능 또는 전이능 동정을 수행하는 단계;를 통해 이루어지는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  16. 제 15 항에 있어서,
    상기 암환자 생존 분석은 생물학적 마커를 기준으로 두 개 이상의 아군으로 구분한 후, 각 아군에서의 유전체 돌연변이와 환자 생존 정보를 이용하는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  17. 제 1 항에 있어서,
    상기 후보 약물의 선정은
    상기 암 환자 유전체의 염기서열 정보로부터 선별된 합성암생존 유전자 쌍에 속하는 하나 이상의 대응 유전자와 쌍을 이루는 하나 이상의 변이 유전자의 개수를 산출하여, 그 산출된 개수를 기준으로 후보 약물의 우선순위 또는 조합을 결정하는 단계에 의한 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택을 위한 정보를 제공하는 방법.
  18. 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택 시스템에 있어서,
    상기 시스템은 암 환자에 대해 적용대상이 되는 항암 치료 약물 및 상기 약물이 억제할 수 있는 유전자와 관련된 정보 검색 또는 추출이 가능한 데이터베이스;
    상기 데이터베이스에 접근 가능한 통신부;
    암 유전체 염기서열 분석부;
    약물 선택 정보 제공부; 및 표시부를 포함하며,
    상기 암 유전체 염기서열 분석부는 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자를 선정하는 변이 유전자 선정부 및 상기 하나 이상의 변이 유전자에 대해 해당 변이 유전자와 쌍을 이루어 합성암생존 유전자 쌍을 구성하는 하나 이상의 대응 유전자를 선정하는 대응 유전자 선정부를 포함하고,
    상기 약물 선택 정보 제공부는 상기 하나 이상의 대응 유전자를 억제하는 항암 치료 약물 선택 정보를 제공하는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택 시스템
  19. 하기 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체:
    암 환자의 유전체 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍을 선별하는 단계; 및
    상기 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자와 쌍을 이루는 하나 이상의 대응 유전자를 억제하는 하나 이상의 후보 약물을 선별하는 단계를 포함하는 동작을 수행하는 프로세서.
  20. 암 환자 유전체의 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍에 속하는 하나 이상의 유전자의 수를 산출하는 단계;를 포함하는, 암 환자의 예후 예측을 위한 정보를 제공하는 방법.
  21. 제 20 항에 있어서,
    상기 방법은 상기 암 환자 유전체의 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍에 속하는 하나 이상의 유전자의 수 및 체세포 돌연변이 유전자의 수를 산출하는 단계;를 포함하는, 암 환자의 예후 예측을 위한 정보를 제공하는 방법.
  22. 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택 시스템에 있어서,
    상기 시스템은 암 환자에 대해 적용대상이 되는 항암 치료 약물 및 상기 약물이 억제할 수 있는 유전자와 관련된 정보 검색 또는 추출이 가능한 데이터베이스;
    상기 데이터베이스에 접근 가능한 통신부;
    암 유전체 염기서열 분석부;
    약물 선택 정보 제공부; 및 표시부를 포함하며,
    상기 암 유전체 염기서열 분석부는 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자를 선정하는 변이 유전자쌍 선정부 및 상기 하나 이상의 변이 유전자에 대해 해당 변이 유전자와 쌍을 이루어 합성암생존 유전자 쌍을 구성하는 하나 이상의 대응 유전자를 선정하는 대응 유전자 선정부를 포함하고,
    상기 약물 선택 정보 제공부는 상기 암 환자의 합성암생존 유전자 쌍의 개수를 증가시키는 약물 선택 정보를 제공하는 것인, 암 환자의 유전체 염기서열 변이를 이용한 맞춤형 항암 치료 약물 선택 시스템.
  23. 하기 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체:
    암 환자의 유전체 염기서열 정보로부터 합성암생존 (Synthetic Cancer Survival) 유전자 쌍을 선별하는 단계; 및
    상기 합성암생존 유전자 쌍에 속하는 하나 이상의 변이 유전자와 쌍을 이루는 하나 이상의 대응 유전자를 억제하는 하나 이상의 후보 약물 중에서 합성암생존 유전자 쌍의 개수를 증가시키는 후보 약물을 선별하는 단계를 포함하는 동작을 수행하는 프로세서.
KR1020160140346A 2015-10-26 2016-10-26 암 환자의 유전체 염기서열 변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템 KR101949286B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US15/771,288 US20180312928A1 (en) 2015-10-26 2016-10-26 Method and system for selecting customized drug using genomic nucleotide sequence variation information and survival information of cancer patient
PCT/KR2016/012108 WO2017074036A2 (ko) 2015-10-26 2016-10-26 암 환자의 유전체 염기서열 변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템
JP2018542073A JP6681475B2 (ja) 2015-10-26 2016-10-26 がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020150148717 2015-10-26
KR20150148717 2015-10-26

Publications (2)

Publication Number Publication Date
KR20170048227A true KR20170048227A (ko) 2017-05-08
KR101949286B1 KR101949286B1 (ko) 2019-02-18

Family

ID=60163763

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160140346A KR101949286B1 (ko) 2015-10-26 2016-10-26 암 환자의 유전체 염기서열 변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템

Country Status (5)

Country Link
US (1) US20180312928A1 (ko)
EP (1) EP3396573A4 (ko)
JP (1) JP6681475B2 (ko)
KR (1) KR101949286B1 (ko)
CN (1) CN108475300B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112852961A (zh) * 2021-01-08 2021-05-28 上海市胸科医院 肺腺癌铁死亡敏感性标志物adcy10及其应用

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113228190A (zh) * 2018-12-23 2021-08-06 豪夫迈·罗氏有限公司 基于预测的肿瘤突变负荷的肿瘤分类
US20200222538A1 (en) * 2019-01-15 2020-07-16 International Business Machines Corporation Automated techniques for identifying optimal combinations of drugs
CN111816253A (zh) * 2020-06-16 2020-10-23 荣联科技集团股份有限公司 一种基因检测解读方法及装置
JPWO2022075420A1 (ko) * 2020-10-07 2022-04-14
CN113836931B (zh) * 2021-11-24 2022-03-08 慧算医疗科技(上海)有限公司 基于领域本体的癌症用药知识库构建方法、系统及终端
CN117373534B (zh) * 2023-10-17 2024-04-30 中山大学孙逸仙纪念医院 一种三阴型乳腺癌预后风险评估系统
CN117809741A (zh) * 2024-03-01 2024-04-02 浙江大学 一种基于分子进化选择压预测癌症特征基因的方法与装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150021476A (ko) * 2013-08-19 2015-03-02 서울대학교산학협력단 약물 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 약물 선택 방법 및 시스템

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1393776A1 (en) * 2002-08-14 2004-03-03 Erasmus University Medical Center Rotterdam Use of genes identified to be involved in tumor development for the development of anti-cancer drugs and diagnosis of cancer
WO2008021183A2 (en) * 2006-08-10 2008-02-21 Millennium Pharmaceuticals, Inc. For the identification, assessment, and treatment of patients with cancer therapy
MX2009013646A (es) * 2007-06-15 2010-03-30 Univ South Florida Metodos de diagnostico y tratamiento del cancer.
WO2015160975A2 (en) * 2014-04-16 2015-10-22 Infinity Pharmaceuticals, Inc. Combination therapies
CN104732116B (zh) * 2015-03-13 2017-11-28 西安交通大学 一种基于生物网络的癌症驱动基因的筛选方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150021476A (ko) * 2013-08-19 2015-03-02 서울대학교산학협력단 약물 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 약물 선택 방법 및 시스템

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
L. Jerby-Arnon 외 11인, "Predicting Cancer-Specific Vulnerability via Data-Driven Detection of Synthetic Lethality", Cell 158, pp.1199-1209, 2014.08.28.* *
X. Wang 외 3인, "Widespread genetic epistasis among cancer genes", Nature Communications, 2014.11.19.* *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112852961A (zh) * 2021-01-08 2021-05-28 上海市胸科医院 肺腺癌铁死亡敏感性标志物adcy10及其应用
CN112852961B (zh) * 2021-01-08 2022-09-13 上海市胸科医院 肺腺癌铁死亡敏感性标志物adcy10及其应用

Also Published As

Publication number Publication date
JP6681475B2 (ja) 2020-04-15
KR101949286B1 (ko) 2019-02-18
EP3396573A4 (en) 2019-08-28
EP3396573A2 (en) 2018-10-31
US20180312928A1 (en) 2018-11-01
CN108475300A (zh) 2018-08-31
CN108475300B (zh) 2024-01-23
JP2019503016A (ja) 2019-01-31

Similar Documents

Publication Publication Date Title
KR101949286B1 (ko) 암 환자의 유전체 염기서열 변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템
Halldorsson et al. The sequences of 150,119 genomes in the UK Biobank
JP6854272B2 (ja) 遺伝子の変異の非侵襲的な評価のための方法および処理
JP7368483B2 (ja) 相同組換え欠損を推定するための統合された機械学習フレームワーク
US11164655B2 (en) Systems and methods for predicting homologous recombination deficiency status of a specimen
Jordan et al. Human allelic variation: perspective from protein function, structure, and evolution
KR20190026837A (ko) 무세포 핵산의 프래그멘톰 프로파일링을 위한 방법
US20190065670A1 (en) Predicting disease burden from genome variants
JP2022544604A (ja) がん検体において細胞経路調節不全を検出するためのシステム及び方法
JP2021040655A (ja) 無細胞核酸の多重解像度分析のための方法
TW202039860A (zh) 游離dna末端特徵
Almeida et al. Chromosomal copy number variation analysis by next generation sequencing confirms ploidy stability in Trypanosoma brucei subspecies
CN115087745A (zh) 无细胞样品中的双末端dna片段类型及其用途
Luebker et al. Comparing the genomes of cutaneous melanoma tumors to commercially available cell lines
KR102188376B1 (ko) 암 유전체 염기서열 변이, 전사체 발현 및 환자 생존 정보를 이용한 맞춤형 항암 치료 방법 및 시스템
WO2017074036A2 (ko) 암 환자의 유전체 염기서열 변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템
Chen et al. Gamete simulation improves polygenic transmission disequilibrium analysis
Santana dos Santos et al. Value of the loss of heterozygosity to BRCA1 variant classification

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant