KR101984611B1 - 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 방법 및 시스템 - Google Patents
약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 방법 및 시스템 Download PDFInfo
- Publication number
- KR101984611B1 KR101984611B1 KR1020180124550A KR20180124550A KR101984611B1 KR 101984611 B1 KR101984611 B1 KR 101984611B1 KR 1020180124550 A KR1020180124550 A KR 1020180124550A KR 20180124550 A KR20180124550 A KR 20180124550A KR 101984611 B1 KR101984611 B1 KR 101984611B1
- Authority
- KR
- South Korea
- Prior art keywords
- drug
- gene
- information
- functional
- gene expression
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Microbiology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 암을 포함하는 질병 관련 특이 유전자 변이 지문 (Genetic Variation Fingerprints)을 기능정보를 가진 하플로타입으로 변형 후 약물의 분자 프로파일의 결합분석에 의해 약물의 반응성을 신뢰성 있게 예측할 수 있는 새로운 학습모델인 약물 적응증 및 반응 예측 시스템 및 방법인 GBLscan(Genetic biomarker Labeling Scan)에 관한 것으로, 본 발명은 수집된 학습정보로부터 유전체에 포함된 유전정보에 대한 약물을 구성하는 구성정보의 반응성 상관관계를 선형 희귀 및 딥러닝 기계학습에 의해 학습하는 학습모듈과; 분석정보를 수신하여 상기 분석정보에 포함된 유전체에 대한 약물의 반응성 예측결과를 산출하는 예측모듈과; 상기 학습모듈에 의해 학습된 반응성 예측알고리즘을 저장하는 저장모듈을 포함하여 구성되고: 상기 학습정보는, 생체 외 세포주 및 생체 내 임상연구에 대한 약물의 반응성 정보이다. 이와 같은 본 발명에 의하면, 본 발명에서는 임상시험으로부터 수집되는 유전체에 대한 약물의 반응성 결과들로부터, 약리 효과가 밝혀지지 않은 유전체와 약물의 반응성 정도를 예측할 수 있는 효과가 있다.
Description
본 발명은 암약물반응성 및 유전자발현정보 및 복제수변이(CNV)를 이용한 기능 정보를 포함하는 하플로타입(haplotype) 바이오마커를 예측하여, 암 약물 반응성을 신뢰성 있게 예측 및 약 레이블링을 할 수 있게 하는 새로운 학습 모델인 GBLscan (Cancer Biomarker Labeling Scan)에 관한 것이다.
최근에 차세대시퀀싱 (NGS, next generation sequencing) 기술의 혁신으로 복잡하고 다양한 암을 이해하는데 많은 발전이 이루어졌다. 또한, 국제적인 컨소시엄의 노력으로 이러한 암 종의 체세포 돌연변이에 대한 카탈로그뿐만 아니라 총체적인 암 유발 돌연변이(driver mutation) 데이터베이스도 개발 및 발표되었다[선행기술문헌 001, 002 및 003 참조].
이러한 국제적인 컨소시엄 연구 성과로 인해서 개별 종양의 특정 유전체 지문(genomic fingerprint)에 대한 암 맞춤치료에 대한기대 또한 급속도로 커지게 되었다.
그러나 현재 암 환자 및 제약업계를 포함한 의료계의 모든 이해 관계자들에게 임상에서 승인되고 사용되는 새로운 맞춤 암 치료제는 여전히 충분하지 않은 실정이다[선행기술문헌 004 참조]. 따라서, 유전체정보와 항암제의 반응 사이의 개인 맞춤을 위한 연관성을 예측하기 위한 효율적이고 체계적인 접근이 필요하게 되었다.
그리고 암 세포주 및 약물 독성 데이터의 분자 프로파일링 데이터를 통합하기 위해 여러 가지 협력 컨소시엄이 이루어졌다[www.lincsproject.org, 선행기술문헌 005 및 006 참조]. 이러한 컨소시엄은 항암제 독성 및 개인에 특화된 맞춤 약물을 예측할 수 있는 유전체 바이오마커 (biomarker)를 밝히는 것이 가장 중요한 목표이다.
암에서의 약물 독성을 위한 세포주 유전체 DB중에서 GDSC (GDSC, Genomics of Drug Sensitivity in Cancer)는 공개적으로 이용 가능한 데이터베이스의 한 예이다. 특히, GDSC는 265개의 항암 화합물에 대하여 1,070 개의 인간 암세포의 약물 독성 정보를 실험적으로 측정한 공용 데이터베이스이다[선행기술문헌 006 참조].
여기서 사용된 GDSC의 세포주 프로젝트는 다음의 사이트에서 공개되었다 (CCLP: COSMIC Cell Lines Project, http://cancer.sanger.ac.uk/cell_lines). 이러한 공용 자원은 유전체 기반 정밀 암 치료제 실현에 큰 도움이 될것으로 기대된다.
그러나 이러한 데이터베이스의 잠재적인 가치에도 불구하고 높은 차원의 데이터와 복잡성으로 인해 통합 분석에는 많은 기술적인 문제가 존재한다. 따라서, 항암 약물 독성에서 분자 바이오마커를 체계적으로 규명하기 위한 많은 계산방법이 개발되었지만[선행기술문헌 005, 007, 008, 009, 010, 011, 012, 013 참조], 이러한 노력에도 불구하고 약물 독성은 특정 세포주 및 주어진 유전자 변이 세트에 제한되는데, 이는 모든 사람의 유전정보는 모두 다르고, 공통적인 변이는 전체에서 일부분이기 때문이다.
정보 기술의 최근 발전으로 앞에서 언급한 복잡한 문제를 해결하기 위해 점점 더 많이 사용되는 방법이 딥러닝 모델(deep learning model) 또는 심층학습 모델이라 부른다[선행기술문헌 014 참조]. 딥러닝 학습 방법은 대량의 고차원 원시 데이터로부터 심층 기계 학습을 하는 기술의 한 분야이다[선행기술문헌 015 참조].
최근까지는 학습을 하기에 계산 양의 한계로 직접적으로 많은 제한이 있었지만[선행기술문헌 016 참조]. 그러나 방법론적 개선과 병렬 컴퓨팅에 의한 강력한 기계를 사용하면서 수천 개의 숨겨진 유닛을 포함하는 다양한 레이어로 딥러닝 학습 모델을 교육할 수 있게 되었다[선행기술문헌 017, 018, 019, 020 참조].
한편, 약리적, 유전체, 전사체 및 후성유전체 데이터와 그들의 약물반응성 데이터와 같은 여러 유형의 구조 정보를 조작할 수 있기 때문에 최소한의 지침으로 약물-표적 상호 작용 예측에 적합하게 되었다[선행기술문헌 014 참조].
제약 업계는 신약 개발을 위해 이러한 유형의 데이터를 활용하는 딥러닝 학습에 많은 기대감을 보여주기 시작했다[선행기술문헌 021 참조]. 최근에는 약물 개발에서 인공 지능을 사용하여 몇 가지 유망한 결과가 입증되었고[선행기술문헌 022, 023, 024, 025 참조], 약물-표적 프로파일 및 다른 전통적인 기계 학습 모델에 비해 우수한 예측 정확도를 갖는 약물 재사용(drug repositioning)도 가능해졌다[선행기술문헌 026 및 027 참조]. 그러나 대다수의 접근방법은 오히려 개념 증명에 그쳤고, 딥러닝 학습을 통한 약물 발견의 생산 가능 솔루션은 부족한 현실이다[선행기술문헌 028 참조].
현재 PubChem(pubchem.ncbi.nlm.nih.gov)은 미국 NCBI(국립기술정보센터)에서 운영하고 있고, 약 1억개 화합물(compounds), 2억 개의 물질(substances) 및 바이오에세이(bioassay)정보를 보유하고 있다(en.wikipedia.org/wiki/PubChem).
또한, 이러한 화합물(compound)은 약리적 작용기(pharmacophore descriptor)로 표현하는 많은 방법들이 존재한다[선행기술문헌 029, 030, 031, 032 및 033 참조]. 그 중에서 파델(PaDELL) 방법은 약물에서 1,875 (1D 및 2D 1,444개, 그리고 3D 431개) 특징(feature) 및 12개의 지문(전체 약 16,092 비트)으로 표현할 수 있다[선행기술문헌 029 참조].
그리고 유전체에서 변이는 다양한 특징들을 추출할 수 있다. 특히, 질병원인 변이를 추출하는 종래의 방법 및 툴 들은 선행기술문헌 034 내지 056에 개시된 바 있다.
따라서, 종래기술은 개별적으로 QSAR(Quantitative structureactivity relationship), 약물 세포독성 데이터를 사용한 약물개발, 딥러닝 (Deep Learning)기반 전장유전체(whole genome sequencing)의 발현조절, 구조적 변이 등이 독립적으로 적용되어 활용되었다.
그러나 본 발명에서는 약물(drugs)-세포(cell lines)-독성(IC50) 데이터에 이종 특성정보(유전체정보, QSAR정보 및 발현정보)를 통합한 AI 딥러닝 방법인 CDRscan(Cancer drug response scanning)은 예측 정확도가 이전 컴퓨터 모델링 접근법과 비교하여 현저히 향상되었고, 특히, 버추얼 약물(drugs) vs. 버추얼 세포(cell lines) 혹은 표적단백질의 상호작용 모델을 제안한 바 있다.
여기서, 2개의 다른 이종 특성 버추얼 정보는 첫 번째가 약물인 경우, 파델(PaDELL) 방법 혹은 선행기술문헌 029 내지 033에 개시된 방법 들이 적용될 수 있다.
그리고 두 번째는 전장 유전체(혹은 표적 단백질)의 지문(Genomic fingerprint, or a set of mutation features)에 대한 문헌방법[선행기술문헌 034 내지 056 참조]으로 설명이 될 수 있고, 가장 표준적인 딥러닝 방법은 선행기술문헌 057에 개시된 바와 같다.
따라서 본 방법은 정확한 약물반응 예측모델 및 약물 재사용/재배치(drug repositioning), 화학 물질의 스크리닝 및 새로운 항암제 후보 발굴 및 환자 맞춤형 항암제 선택을 위한 임상의사결정지원시스템(Clinical decision supporting system) 에 사용될 수 있다.
그리고 최근에 재사용/재배치 (drug repositioning)관련 암약물반응스켄(CDRscan) 논문이 본사에 의하여 출판이 되었다[선행기술문헌 058 참조].
즉, 유전자발현 및 시스템적 통계적인 방식으로 주어진 약물 및 표적유전자 약 그리고 표적 후보유전자들의 발현정보 및 바이오마커 정보를 활용한 약물반응성 연구가 최근에 발표되었다.
본 논문에서는 바이오마커 자체에 대한 연구는 없었지만, 알려진 유전자 바이오마커 및 발현정보를 활용하여 주요표적에 대한 주요 약물 몇 개에 대하여 저해 능력(inhibition)을 CCLE(Cancer Cell Line Encyclopedia), CTRP(Cancer Therapeutics Response Portal, Broad) 및 일부 GDSC를 활용하여 예측(CARE)하고 검증하는 결과를 보여주었다[선행기술문헌 059 참조].
또한, eQTL (expression and Quantitative Trait Loci), 즉 발현과 유전체 변이간의 질병 혹은 표현형 연관관계에 대한 주요 연구가 많이 발표되었다[선행기술문헌 060 참조]. 그리고, pQTL (protein and Quantitative Trait Loci), 즉 단백질 생성과 유전체 변이간의 질병 혹은 표현형 연관관계에 대한 주요 연구 역시 많이 발표되었다[선행기술문헌 061 참조].
그러나 cQTL (Copy Number Variation and Quantitative Trait Loci), 즉 약물반응성 및 유전자 복제수 증가 혹은 감소 변이인 CNV(copy number variation)와 유전체 변이간의 약물반응 혹은 약물 표현형 연관관계에 대한 연구는 아직까지 발표된 적이 없다.
따라서, 본 GBLscan(genetic biomarker label scan)방법에서는 (a) eQTL (expression and Quantitative Trait Loci), 즉 발현과 유전체 변이간의 질병 혹은 표현형 연관관계, (b) cQTL (Copy Number Variation and Quantitative Trait Loci), 즉 유전자 복제 수 변이(copy amplification) 및 감소 (copy deletion)과의 연관관계는 아직 참고문헌이 존재하지 않는다.
본 발명에서 약물타입(DrugClass)에 대한 정의는 약물 표적들의 타입(type) 및 약물의 관능기적 유사한 기능 타입, 혹은, 약물이 영향을 주는 범주의 유전자그룹, 약물 패스웨이(drug pathway) 혹은 약물 시그널링 패스웨이(drug signaling pathway), 등은 모두 하나의 통칭 약물타입(DrugClass)로 설명을 한다. 또한, 기능하플로타입은 일반적으로 사용하는 하플로타입인 유전자에서 페이싱(phasing)이 된 여러개의 로커스 (locus)들에 대한 반수체(haplotype)과 달리, 본 발명에서는 인간유전체 버전인 Dec. 2013 (GRCh38/hg38): Genome Reference Consortium Human 38 (GCA_000001405.15), https://www.ncbi.nlm.nih.gov/assembly/GCF_000001405.26 를 기반으로 차세대 시퀀싱 리드(read) 데이터를 정렬을 하게 되면, 각 유전자 로커스에서 지노타입 형태로 정보가 읽히게 된다. 이러한 지노타입형태는 1:homo, 2:hetero 혹은 3: alt home형태로 표현 되는데, 그러한 지노타입의 모음을 상대 하프로타입 이라고 할 수 있다. 그리고, 특정 로커스의 단일 혹은 조합으로 구성된 상대 하플로타입이 특정 유전자의 발현과 연관이 있다면 이것을 기능하프로타입 이라고 본 발명에서 정의한다.
한편, 아래 첨부된 비 특허 선행기술 문헌을 주요 내용별로 구분하면, 비특허문헌,
(001 - 004)은 유전체 정보와 항암제의 반응 사이의 연관성 논문이고;
(005 - 013)은 암 유전체 약물독성 및 COSMIC 세포주 프로젝트 문헌이며;
(014 - 018)은 딥러닝 심층학습 모델의 약리학 및 유전체관련 논문이고;
(019 - 028)은 딥러닝 심층학습 모델의 신약 개발에 사용된 논문이고;
(029 - 056)은 약물 및 변이를 특징(feature)으로 표현하는 방법 및 논문이고;
(057 - 058)은 딥러닝 방법론 및 알고리즘에 대한 논문이고;
(059)은 약물 재창출 혹은 약물반응성 예측 논문이고,
(060 - 061)은 eQTL 및 pQTL 방법론 및 알고리즘에 대한 논문이다.
(001) Forbes, S. A., et al. COSMIC: somatic cancer genetics at high-resolution. Nucleic Acids Research. 45, 777-783 (2017).
(002) Lawrence, M. S., et al. Discovery and saturation analysis of cancer genes across 21 tumour types. Nature. 505, 495-501 (2014).
(003) Stratton, M.R., Campbell, P.J. & Futreal, P.A. The cancer genome. Nature 458, 719-724 (2009).
(004) Williams SP, & McDermott U. The pursuit of therapeutic biomarkers with high-throughput cancer cell drug screens. Cell Chemical Biology. 24, 1066-1074 (2017).
(005) Barretina, J, et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature. 483, 603-7 (2012).
(006) Yang, W., et al. Genomics of Drug Sensitivity in Cancer (GDSC): a resource for therapeutic biomarker discovery in cancer cells. Nucleic Acids Research. 41, 955-961 (2013).
(007) Basu, A., et al. An interactive resource to identify cancer genetic and lineage dependencies targeted by small molecules. Cell. 154, 1151-1161 (2013).
(008) Iorio, F., et al. (2016). A Landscape of pharmacogenomic interactions in cancer. Cell. 166, 740-754 (2016).
(009) Garnett, M. J., Edelman, E. J., Heidorn, S. J., Greenman, C. D., Dastur, A., Lau, K. W., Greninger, P., Thompson, I. R., Luo, X. & Soares, J. Systematic identification of genomic markers of drug sensitivity in cancer cells. Nature. 483, 570-575 (2012).
(010) Menden, M.P., Iorio, F., Ballester, P.J., Saez-Rodriguez, J., Garnett, M., McDermott, U., & Benes, C.H. Machine learning prediction of cancer cell sensitivity to drugs based on genomic and chemical properties. PLoS ONE. 8. e61318 (2013).
(011) Rubio-Perez, C., Tamborero, D., Schroeder, M., Antolin, A., Deu-Pons, J., Perez-Llamas, C., Mestres, J., Gonzalez-Perez, A., & Lopez-Bigas, N. In silico prescription of anticancer drugs to cohorts of 28 tumor types reveals targeting opportunities. Cancer Cell. 27, 382-396 (2015).
(012) Seashore-Ludlow, B., et al. Harnessing connectivity in a large-scale small-molecule sensitivity dataset. Cancer Discovery. 5, 1210-1223 (2015).
(013) Yadav, B., et al. Quantitative scoring of differential drug sensitivity for individually optimized anticancer therapies. Scientific Reports. 4 (2015).
(014) Vanhaelen, Q., et al.. Design of efficient computational workflows for in silico drug repurposing. Drug Discovery Today. 22, 210-222 (2017).
(015) Mamoshina, P., Vieira, A., Putin, E. & Zhavoronkov, A. Applications of deep learning in biomedicine. Molecular Pharmaceutics. 13, 1445-1454 (2016).
(016) Ramsundar, B., Kearnes, S., Riley, P., Webster, D., Konerding, D. & Pande, V. Massively multitask networks for drug discovery. arXiv:1502.02072 (2015).
(017) Dahl, G. E., Jaitly, N. & Salakhutdinov, R. Multi-task neural networks for QSAR predictions. arXiv:1406.1231 (2014).
(018) Nantasenamat C, Isarankura-Na-Ayudhya C, Naenna T, Prachayasittikul V. "A practical overview of quantitative structure-activity relationship". Excli J. 8: 7488(2009).
(019) Ebuka, D Quantitative structureactivity relationship study on potent anticancer compounds against MOLT-4 and P388 leukemia cell lines, Journal of Advanced Research, 10.1016(2016)
(020) Yuan, Y., et al. DeepGene: an advanced cancer type classifier based on deep learning and somatic point mutations. BMC Bioinformatics. 17, 243-256 (2016).
(021) Smalley, E. AI-powered drug discovery captures pharma interest. Nature Biotechnology. 35, 604-605 (2017).)
(022) Baskin, I.I., Winkler, D. & Tetko, I.V. A renaissance of neural networks in drug discovery. Expert Opinion on Drug Discovery. 11, 785-95 (2016).
(023) Gonczarek, A., Tomczak, J.M., Zareba, S., Kaczmar, J. Dabrowski, P. & Walczak, MJ. Learning deep architectures for interaction prediction in structure-based virtual screening. NIPS, 30, (2016).
(024) Pereira, J. C., Caffarena, E. R., & Dos Santos, C. N. Boosting docking-based virtual screening with deep learning. Journal of Chemical Information and Modeling. 56, 2495-2506 (2016).
(025) Unterthiner, T, Mayr, A, Klambauer, G, Steijaert, M, Wegner, J.K., Ceulemans, H, & Hochreiter, S. Deep learning as an opportunity in virtual screening. NIPS, 27, (2014).
(026) Wen M., Zhang Z., Niu S., Sha H., Yang R., Lu H., & Yun Y. Deep-learning-based drug-target interaction prediction. Journal of Proteome Research. 16, 1401-1409 (2017).
(027) Aliper A, Plis S, Artemov A, Ulloa A, Mamoshina P, & Zhavoronkov A. Deep learning applications for predicting pharmacological properties of drugs and drug repurposing using transcriptomic data. Molecular Pharmaceutics. 13, 2524-2530 (2016).
(028) Ching, T., et al. Opportunities and obstacles for deep learning in biology and medicine. bioRxiv. doi: http://dx.doi.org/10.1101/142760 (2017).
(029) Yap CW. PaDEL-Descriptor: An open source software to calculate molecular descriptors and fingerprints. Journal of Computational Chemistry. 32, 1466-1474(2011)
(030) Schneider, G.; Clement-Chomienne, O.; Hilfiger, L.; Schneider, P.;Kirsch, S.; Bohm, H-J. and Neihart, W. Virtual Screening for Bioactive Molecules by Evolutionary De Novo Design Angew. Chem. Int. Ed., 39, 4130-4133(2000)
(031) Schneider, G.; Lee, M-L.; Stal, M. and Schneider, P. De novo design of molecular architectures by evolutionary assembly of drug-derived building blocks J. Comp-Aid. Mol. Des., 14, 487-494(2000)
(032) Pearlman, S. R. and Smith, K. M. Novel Software Tools for Chemical Diversity, Perspectives in Drug Discovery and Design, 9/10/11: 339-353,(1998).
(033) Burden, F. R. Molecular identification number for substructure searches, J. Chem. Inf. Comput. Sci. 29 , 225-7(1989).
(034) SIFT: Kumar, Prateek, Steven Henikoff, and Pauline C. Ng. "Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm." Nature protocols 4.7: 1073-1081(2009).
(035) Polyphen-2 : I. A. Adzhubei, S. Schmidt, L. Peshkin et al., method and server for predicting damaging missense mutations,Nature Methods, vol. 7, no. 4, pp. 248249, 2010
(036) LRT S. Chun and J. C. Fay, of deleterious mutations within three human genomes,Genome Research, vol. 19, no. 9, pp. 15531561, 2009.
(037) Polyphen-2 HDIV n HDVAR Score: Yunos, R. I. M., Ab Mutalib, N. S., Khor, S. S., Saidin, S., Nadzir, N. M., Razak, Z. A., & Jamal, R. (2016). Characterisation of genomic alterations in proximal and distal colorectal cancer patients (No. e2109v1). PeerJ Preprints.
(038) MutationAccessor1: Reva, B., Antipin, Y., & Sander, C. (2011). Predicting the functional impact of protein mutations: application to cancer genomics. Nucleic acids research, 39(17), e118-e118.
(039) MutationAccessor2: Gnad, F., Baucom, A., Mukhyala, K., Manning, G., & Zhang, Z.. Assessment of computational methods for predicting the effects of missense mutations in human cancers. BMC genomics, 14(3), S7(2013).
(040) MUTATIONTASTER: Dong, C., Wei, P., Jian, X., Gibbs, R., Boerwinkle, E., Wang, K., & Liu, X. Comparison and integration of deleteriousness prediction methods for nonsynonymous SNVs in whole exome sequencing studies. Human molecular genetics, 24(8), 2125-2137(2014).
(041) MutationAccessor and Mutation Taster: Oishi, Maho, et al. "Comprehensive Molecular Diagnosis of a Large Cohort of Japanese Retinitis Pigmentosa and Usher Syndrome Patients by Next-Generation SequencingDiagnosis of RP and Usher Syndrome Patients by NGS." Investigative ophthalmology & visual science 55.11 (2014): 7369-7375.
(042) PhyloP46way_placental and PhyloP46way_vertebrate: Pollard, Katherine S., et al. "Detection of nonneutral substitution rates on mammalian phylogenies." Genome research 20.1: 110-121(2010).
(043) GERP++_RS Score: Davydov, E. V., Goode, D. L., Sirota, M., Cooper, G. M., Sidow, A., & Batzoglou, S.. Identifying a high fraction of the human genome to be under selective constraint using GERP++. PLoS computational biology, 6(12), e1001025(2010).
(044) B62 Score: Tsuda, H., Kurosumi, M., Umemura, S., Yamamoto, S., Kobayashi, T., & Osamura, R. Y. HER2 testing on core needle biopsy specimens from primary breast cancers: interobserver reproducibility and concordance with surgically resected specimens. BMC cancer, 10(1), 534(2010).
(045) Siphy : Garber, Manuel, et al. "Identifying novel constrained elements by exploiting biased substitution patterns." Bioinformatics 25.12: i54-i62(2009).
(046) CHASM : H. Carter, J. Samayoa, R. H. Hruban, and R. Karchin, of driver mutations in pancreatic cancer using cancerspecific high-throughput annotation of somatic mutations (CHASM),Cancer Biology & Therapy, vol. 10, no. 6, pp. 582587(2010).
(047) Dendrix: F. Vandin, E. Upfal, and B. J. Raphael, novo discovery of mutated driver pathways in cancer,Genome Research, vol. 22, no. 2, pp. 375385(2012).
(048) MutsigCV: M. S. Lawrence, P. Stojanov, P. Polak et al., heterogeneity in cancer and the search for new cancer-associated genes,Nature, vol. 499, no. 7457, pp. 214218. [68] M. Kanehisa and S. Goto, kyoto encyclopedia(2013)
(049) FATHMM: Shihab, Hashem A., et al. "Predicting the functional, molecular, and phenotypic consequences of amino acid substitutions using hidden Markov models." Human mutation 34.1: 57-65(2013).
(050) VEST3_score: Carter, Hannah, et al. "Identifying Mendelian disease genes with the variant effect scoring tool." BMC genomics 14.3: S3(2013).
(051) MetaSVM: Nono, Djotsa, et al. "Computational Prediction of Genetic Drivers in Cancer." eLS (2016).
(052) MetaLR : Dong, Chengliang, et al. "Comparison and integration of deleteriousness prediction methods for nonsynonymous SNVs in whole exome sequencing studies." Human molecular genetics 24.8: 2125-2137(2014).
(053) CADD: Kircher, Martin, et al. "A general framework for estimating the relative pathogenicity of human genetic variants." Nature genetics 46.3: 310-315(2014).
(054) CADD 2 : Velde, K. Joeri, et al. "Evaluation of CADD scores in curated mismatch repair gene variants yields a model for clinical validation and prioritization." Human mutation 36.7: 712-719(2014).
(055) CADD 3: Mather, Cheryl A., et al. "CADD score has limited clinical validity for the identification of pathogenic variants in non-coding regions in a hereditary cancer panel." Genetics in medicine: official journal of the American College of Medical Genetics (2016).
(056) ParsSNP: Kumar, Runjun D., S. Joshua Swamidass, and Ron Bose. "Unsupervised detection of cancer driver mutations with parsimony-guided learning." Nature genetics 48.10: 1288-1294(2016).
(057) Deep Learning: Yann Lecun, Y., Bengio, Y. & Hinton, G. Nature. 521, 436-444 (2015)
(058) Cancer Drug Response Profile scan (CDRscan): A Deep Learning Model That Predicts Drug Effectiveness from Cancer Genomic Signature: Yoosup Chang, Scientific Report,. 8857 (2018)
(059) Genome-scale signatures of gene interaction from compound screens predict clinical efficacy of targeted cancer therapies. Peng Jiang, et al., Cell Systems, 6,1-12 (2018)
(060) eQTL: Maud Fagny, et al., PNAS, E7841-E7850 (2017)
(061) pQTL: Jerome Carayol, et al., Nat Commun., 8:2084 (2017)
본 발명은 상기와 같은 종래의 문제점을 해결하기 위하여 안출된 것으로, 본 발명은 전술한 바와 같은 기술배경 및 사회적 요구에 따라, 암 약물의 반응성을 반응 대상 유전체의 유전특성 및 지문을 기능성 정보를 가진 하플로타입으로 변환하여 높은 정밀도의 약물 적응증 및 민감성 예측 시스템을 제공하기 위한 것으로, 본 발명의 구체적인 목적은, 공지된 비-임상용 세포주 유전체, 그것 들의 유전자 발현정보 및 유전자 복제수변이, 그리고 생체내 약물반응과 관련을 양적형질위치(QTL: quantitative trait loci)들의 모음(기능성 하플로타입) 정보기반 선형 회귀 모델링 및 딥러닝 기계학습을 신뢰성 있게 예측할 수 있는 예측 시스템을 제공하기 위한 것이다.
그리고 본 발명에서는 본 발명에 의한 GBLscan방법에 의해 유전자 RNA발현 및 복제수변이(CNV)와 상관관계가 높은 양적 형질 위치 (QTL)들을 수집하여 기능정보를 가진 다중변이기반 하플로타입을 생성하고 약물 민감성 및 반응성을 효과적으로 필터링하는 가상임상(In Silico Clinical Trial)을 위한 약물 반응성을 예측하는 방법을 제공하기 위한 것이다.
상기한 바와 같은 목적을 달성하기 위한 본 발명의 특징에 따르면, 본 발명은 검사 대상 양적형질 위치(QTL)들의 위치 모음 생성하는 단계와; 기능 하플로타입(FRH)과 약물반응 상관관계 계산하는 단계와; 그리고, 기능 하플로타입기반 약물반응 예측모델 생성하는 단계로 구성된다.
우선, 양적형질 위치 (QTL)들의 위치 모음 생성하기 위한 제1단계에서는; 기능 연관 하플로타입(FRH)과 약물반응성 상관관계 계산을 수행하기 위하여, (A) 약 1,000개의 세포주에서 약 4백만 변이와 약 20,000 유전자 발현 상관관계를 계산하고, 그리고, (B) 약물(265개)과 1,000개 셀라인 유전체의 각 20,000여개 유전자발현 및 유전자 복제수변이 들과의 상관관계 계산한다.
이때, (A)단계 및 (B)단계는 공통 변수로 유전자 발현 및 유전자 복제수변이들을 모두 포함하는데, 이러한 공통변수인 유전자발현 정보를 활용하여 약물반응에 영향을 주는, 다중 혹은 단일변이와 연관을 가진 변이를 수집한다. 이것을 양적형질 위치 (QTL)들의 위치 모음이라고 한다.
그리고 유전체통합 DB에서 각 세포주 유전체에서 단일 및 다중변이정보를 수집하여 기능 하플로타입을 만들고 동일 세포주에서 약물반응성 정보와 함께 추출하고, 이러한 기능 하플로타입 들을 기능 하플로타입, FRH(Functionally relevant haplotope)으로 정의하고, FRH를 해시넘버 (hash number)로 표현 한다.
그리고 제2단계에서는, 기능하플로타입(FRH)과 약물반응 상관관계 계산하기 위하여, 하플로타입(FRH)를 해시넘버(hash number)로 변한하고, 변환된 해시넘버를 사용하여 약물반응성정보와 조합 상관관계 테스트(Pairwise Pearson Test)를 수행하고, 이를 모든 암 종에서 위의 작업을 반복 한다.
기능하플로타입기반 약물반응 예측모델 생성하는 제3단계에서는, 특정 암에서 약물타입 기반 약물반응 예측모델 생성관련 과정을 다음과 같이 수행한다.
(1) 기능연관 하플로타입과 특정 암 및 특정 약물타입와 관련된 각 약물과 상관관계를 계산하고, (2) 기능하플로타입 및 약물반응성 상관관계 메트릭스에서 X축 및 Y축의 상관관계 정보를 클러스터링을 하며, (3) 각 예측모델에서 유의성(p-value)이 높은 것을 수집하여 모델에 상호작용 기능을 모델에 적용하여 선형 회귀 모델을 계산한다, 그리고, 마지막으로 (4) NGS 데이터를 입력으로 하여 약물반응성과 연관을 가진 기능하플로타입를 계산하고 선형 회귀 모델을 사용하여 약물반응성을 예측한다.
그리고 본 발명은, 전술한 바와 같은 기능 하플로타입 정보를 활용하여 약물반응성 예측 모델을 계산하기 위해, 검사 대상 유전체로부터 수집된 염기서열에서 다수의 변이들을 활용하여 기능 하플로타입 들을 계산하는 단계와: 선형 회귀 모델의 해를 계산하는 단계와; 이러한 해를 이용하여 암약물 중에 민감성이 높은 암 약물을 선별하는 시스템을 포함한다.
한편, 본 발명의 다양한 실시예 중 일 실시예를 설명하면, 본 발명은 (A) 약물반응에 영향을 미치는 변이들에 대한 양적형질위치(QTL)들의 위치모음을 산출하는 단계와; (B) 상기 양적형질위치(QTL)에 포함된 변이에 대한 기능하플로타입을 생성하는 단계와; (C) 상기 기능하플로타입을 기반으로 변이와 약물반응 상관관계 계산하는 단계; 그리고 (D) 상기 기능하플로타입을 기반으로 약물반응성을 예측하는 단계를 포함하여 수행될 수 있다.
이때, 상기 제(A)단계의 양적형질위치(QTL)들의 위치모음을 산출은, (A1) 복수의 세포주로부터 변이들과 유전자 RNA 발현의 상관관계를 도출하는 단계와; (A2) 약물들과 복수의 셀라인 유전체에 포함된 유전자 RNA발현 및 유전자 복제수변이(CNV)들과의 상관관계 도출하는 단계와; (A3) 상기 제(A1)단계 및 제(A2)단계에서 공통 적으로 상관관계에 영향을 미치는 유전자 RNA 발현 또는 유전자 복제수변이에 대한 유전자 발현 정보를 산출하는 단계; 그리고 (A4) 상기 유전자 발현정보에 관여된 단일 또는 다중 변이를 산출하여, 약물반응에 영향을 미치는 변이들에 대한 양적형질위치(QTL)를 산출하는 단계를 포함하여 수행되는 양적형질위치(QTL)들의 위치모음 생성 단계를 포함하여 수행될 수 있다.
그리고 상기 제(B)단계의 기능하플로타입의 생성은, 유전체통합DB로부터 양적형질위치(QTL)에 포함된 단일 또는 다중변이에 대한 하플로타입을 약물반응성과 함께 추출하여 생성될 수도 있다.
또한, 상기 기능하플로타입은, 유전자 RNA발현(Exp)과 약물반응성과의 상관관계 정보와; 유전자 다중변이(loci)와 약물반응성과의 상관관계 정보를 포함하여 구성될 수도 있다.
한편, 상기 기능하플로타입은, 유전자 복제수변이(CNV)와 약물반응성과의 상관관계 정보와; 유전자 다중변이(loci)와 약물반응성과의 상관관계 정보를 포함하여 구성될 수도 있다.
여기서 상기 유전자 다중변이(loci)는, 양적형질위치(QTL)기반으로 선별된 로커스(locus)들의 모음일 수도 있다.
그리고 상기 유전체통합DB는, 지노타입(Genotype)으로 구성된 셀라인(Cell Lines) 통합 DB일 수도 있다.
또한, 상기 약물 반응성은, ln Ic50 값으로 표현될 수도 있다.
그리고 상기 유전자 RNA발현은, 과발현(over-expression), 변화없음(normal) 및 저발현(under-exprfession)으로 구분될 수도 있다.
또한, 상기 복제수변이(CNV)는, 증폭(amplification), 변화없음(normal) 및 감소(deletion)로 구분될 수도 있다.
한편, 상기 제(C)단계의 상관관계 계산은, (C1) 유전자 다중변이(loci)와 연관된 유전자 RNA발현(Exp)를 판별하는 단계와; (C2) 상기 기능하플로타입으로부터 상기 유전자 RNA발현(Exp)에 대한 약물반응성을 산출하여 상기 유전자 다중변이(loci)에 대한 약물반응성을 판별하는 단계; 그리고 (C3) 상기 기능하플로타입에 포함된 유전자 다중변이(loci)와 약물반응성과의 상관관계 정보로부터 산출된 약물반응성과 상기 제(C2)단계에서 판별된 약물반응성을 비교하여 검증하는 단계를 포함하여 수행될 수도 있다.
그리고 상기 제(C1)단계의 연관은, 상기 유전자 다중변이(loci)가 포함된 세포주 및 상기 세포주에 포함된 유전자 RNA발현(Exp)정보를 판별함에 의해 수행될 수도 있다.
또한, 상기 제(D)단계의 약물반응성을 예측은, 유전자 RNA발현 차이에 대한 약물반응의 차이가 과발현보다 저발현이 큰 경우, 유전자 RNA의 저발현이 약물반응에 민감한 것으로 판단하고; 유전자 RNA발현 차이에 대한 약물반응의 차이가 과발현보다 저발현이 작은 경우, 유전자 RNA의 과발현이 약물반응에 민감한 것으로 판단할 수도 있다.
그리고 상기 제(D)단계의 약물반응성을 예측은, 과발현 집단의 유전자 RNA발현 차이에 대한 약물반응 절대값 민감도 최고치의 차이값이 저발현 집단의 유전자 RNA발현 차이에 대한 약물반응 절대값 민감도 최고치의 차이값보다 크면, 유전자 RNA의 과발현이 유전자 다중변이(loci)타입과 연관된 것으로 판별하고; 과발현 집단의 유전자 RNA발현 차이에 대한 약물반응 절대값 민감도 최고치의 차이값이 저발현 집단의 유전자 RNA발현 차이에 대한 약물반응 절대값 민감도 최고치의 차이값보다 작으면, 유전자 RNA의 저발현이 유전자 다중변이(loci)타입과 연관된 것으로 판별할 수도 있다.
한편, 상기 기능하플로타입은, 해시넘버 (hash number)로 표현될 수도 있다.
그리고 상기 기능하플로타입과 약물반응의 상관관계는, 해시넘버를 이용하여, 약물반응성정보와 조합상관관계 테스트(Pairwise Pearson Test)를 수행함에 의해 산출될 수도 있다.
한편, 본 발명은 전술한 바와 같은 방법으로 기능하플로타입을 생성하는 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 시스템을 포함한다.
이때, 상기 기능하플로타입은, 약물에 대한 반응성 진단, 약물에 대한 환자군을 선별하는 동반진단을 위한 바이오마커 발굴, 약물표적발굴 또는 약물에 대한 가상임상에 사용될 수도 있다.
위에서 살핀 바와 같은 본 발명에 의한 가상임상을 위한 암약물반응성, 연계된 유전자발현정보 및 복제수 변이를 이용한 기능 하플로타이핑 시스템 및 방법에서는 다음과 같은 효과를 기대할 수 있다.
즉, 본 발명에서는 체내(in vivo), 체외(in vitro) 혹은 유전정보에 대한 알려진 약물의 반응성 결과들로부터, 약리 효과가 밝혀지지 않은 약물의 반응성 정도를 예측할 수 있는 효과가 있다.
또한, 본 발명은 유전체의 변이정보에 대한 약물을 구성하는 약리 관능기의 반응성 상관관계를 도출할 수 있으므로, 분석대상인 유전체의 변이 및 약물의 약리 관능기를 추출하면, 해당 유전체에 대한 약물의 반응성 정도를 신뢰성 있게 예측할 수 있는 효과가 있다.
그리고 본 발명은 유전체의 변이 특성정보에 대한 약물타입의 반응성 상관관계를 도출할 수 있으므로, 분석대상인 유전체의 변이에 대한 특성정보 및 약물타입정보를 알면, 해당 유전체에 대한 약물의 반응성 정도를 신뢰성 있게 예측할 수 있는 효과가 있다.
이를 통해 본 발명은, 미지의 고분자화합물(약물 개발 대상 물질)의 특정 유전체를 포함하는 세포주 혹은 인체에 대한 반응성을 임상시험 전에 예측할 수 있으므로, 신약 개발에 따른 시간 및 비용을 현저하게 줄일 수 있는 효과가 있으며, 이미 개발된 약물에 대하여도, 임상에서 밝혀진 유전체 이외의 다른 유전체에 대한 반응성 정도를 미리 예측할 수 있으므로 기존 약물에 대한 다른 용도의 발견 및 부작용 발견에 대한 연구 비용 및 시간을 현저히 줄여주는 효과가 있다.
도 1은 본 발명에 의한 약물반응예측을 위한 양적 형질 위치(QTL), 유전복제수변이 및 RNA발현예를 도시한 예시도.
도 2는 본 발명에 의한 유전적 바이오마커를 활용한 약물반응성 계산 스키마를 도시한 예시도.
도 3은 본 발명에 의한 유방암의 유전적 바이오마커와 약물반응성의 관계를 도시한 예시도.
도 4는 본 발명에 의한 NGS입력과 약물반응 및 RNA발현 네트워크를 도시한 예시도.
도 5는 본 발명에 의한 세포주 약물반응 값(IC50)과 기능하플로타입의 상관관계를 도시한 예시도.
도 6은 본 발명에 의한 양적형질 위치(QTL)와 약물반응 상관관계를 도시한 예시도.
도 7은 본 발명에 의한 변이, RNA발현, 유전자복제수변이 및 약물반응 네트워크를 도시한 예시도.
도 8은 본 발명에 의한 변이와 상관관계 세포주, 암, 약물반응, RNA발현 및 CNV증폭 예를 도시한 예시도.
도 9는 본 발명에 의한 기능하플로타입과 약물반응성 상관관계 계산 스키마를 도시한 예시도.
도 10은 본 발명에 의한 기능하플로타입와 약물반응성 네트워크를 도시한 예시도.
도 11은 본 발명에 의한 기능하플로타입과 유전자발현 및 유전자복제수변이 예를 도시한 예시도.
도 12는 본 발명에 의한 기능하플로타입 정의를 도시한 예시도.
도 13은 본 발명에 의한 FRH 방법과 유전자 발현과 약물 반응성 예측 예를 도시한 예시도.
도 14는 본 발명에 의한 FRH의 일 예시로 평균 IC50 값의 차이가 1.0인 실시예를 도시한 예시도.
도 15는 본 발명에 의한 FRH의 일 예시로 평균 IC50 값의 차이가 1.5인 실시예를 도시한 예시도.
도 16은 본 발명에 의한 기능하플로타입과 유전자발현 실시 예를 도시한 예시도.
도 17은 본 발명에 의한 특정 암 약물타입기반 약물반응 예측모델 생성예를 도시한 예시도.
도 18은 본 발명에 의한 기능하플로타입과 약물반응성 연관관계 R^2를 도시한 예시도.
도 19는 도 18에 도시된 예에서, Afatinib 약물과 FRH 상관관계가 높은 FRH의 실시예를 도시한 예시도.
도 20은 도 18에 도시된 예에서, Afatinib 약물과 FRH 상관관계가 높은 FRH를 사용한 예측 모델의 일 실시예를 도시한 예시도.
도 21은 본 발명에 의한 FRH를 사용한 혈액암의 약물반응성 예측의 일 실시예를 도시한 예시도.
도 22는 본 발명에 의한 FRH를 사용한 활용가능 시스템의 일 예를 도시한 예시도.
도 23은 본 발명에 의한 FRH 바이오마커를 이용하여 암 및 약물 동반진단 칩을 제작하는 방법의 일 예를 도시한 예시도.
도 2는 본 발명에 의한 유전적 바이오마커를 활용한 약물반응성 계산 스키마를 도시한 예시도.
도 3은 본 발명에 의한 유방암의 유전적 바이오마커와 약물반응성의 관계를 도시한 예시도.
도 4는 본 발명에 의한 NGS입력과 약물반응 및 RNA발현 네트워크를 도시한 예시도.
도 5는 본 발명에 의한 세포주 약물반응 값(IC50)과 기능하플로타입의 상관관계를 도시한 예시도.
도 6은 본 발명에 의한 양적형질 위치(QTL)와 약물반응 상관관계를 도시한 예시도.
도 7은 본 발명에 의한 변이, RNA발현, 유전자복제수변이 및 약물반응 네트워크를 도시한 예시도.
도 8은 본 발명에 의한 변이와 상관관계 세포주, 암, 약물반응, RNA발현 및 CNV증폭 예를 도시한 예시도.
도 9는 본 발명에 의한 기능하플로타입과 약물반응성 상관관계 계산 스키마를 도시한 예시도.
도 10은 본 발명에 의한 기능하플로타입와 약물반응성 네트워크를 도시한 예시도.
도 11은 본 발명에 의한 기능하플로타입과 유전자발현 및 유전자복제수변이 예를 도시한 예시도.
도 12는 본 발명에 의한 기능하플로타입 정의를 도시한 예시도.
도 13은 본 발명에 의한 FRH 방법과 유전자 발현과 약물 반응성 예측 예를 도시한 예시도.
도 14는 본 발명에 의한 FRH의 일 예시로 평균 IC50 값의 차이가 1.0인 실시예를 도시한 예시도.
도 15는 본 발명에 의한 FRH의 일 예시로 평균 IC50 값의 차이가 1.5인 실시예를 도시한 예시도.
도 16은 본 발명에 의한 기능하플로타입과 유전자발현 실시 예를 도시한 예시도.
도 17은 본 발명에 의한 특정 암 약물타입기반 약물반응 예측모델 생성예를 도시한 예시도.
도 18은 본 발명에 의한 기능하플로타입과 약물반응성 연관관계 R^2를 도시한 예시도.
도 19는 도 18에 도시된 예에서, Afatinib 약물과 FRH 상관관계가 높은 FRH의 실시예를 도시한 예시도.
도 20은 도 18에 도시된 예에서, Afatinib 약물과 FRH 상관관계가 높은 FRH를 사용한 예측 모델의 일 실시예를 도시한 예시도.
도 21은 본 발명에 의한 FRH를 사용한 혈액암의 약물반응성 예측의 일 실시예를 도시한 예시도.
도 22는 본 발명에 의한 FRH를 사용한 활용가능 시스템의 일 예를 도시한 예시도.
도 23은 본 발명에 의한 FRH 바이오마커를 이용하여 암 및 약물 동반진단 칩을 제작하는 방법의 일 예를 도시한 예시도.
이하에서는 첨부된 도면을 참조하여 본 발명의 구체적인 실시예에 의한 가상임상을 위한 암약물반응성, 연계된 유전자발현정보 및 복제수 변이를 이용한 기능 하플로타이핑 시스템 및 방법을 살펴보기로 한다.
설명에 앞서 먼저, 본 발명의 효과, 특징 및 이를 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예에서 명확해진다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 발명의 실시 예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이며, 후술되는 용어들은 본 발명의 실시 예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명에 의한 약물반응예측을 위한 양적 형질 위치(QTL), 유전복제수변이 및 RNA발현예를 도시한 예시도이고, 도 2는 본 발명에 의한 유전적 바이오마커를 활용한 약물반응성 계산 스키마를 도시한 예시도이며, 도 3은 본 발명에 의한 유방암의 유전적 바이오마커와 약물반응성의 관계를 도시한 예시도이고, 도 4는 본 발명에 의한 NGS입력과 약물반응 및 RNA발현 네트워크를 도시한 예시도이며, 도 5는 본 발명에 의한 세포주 약물반응 값(IC50)과 기능하플로타입의 상관관계를 도시한 예시도이고, 도 6은 본 발명에 의한 양적형질 위치(QTL)와 약물반응 상관관계를 도시한 예시도이며, 도 7은 본 발명에 의한 변이, RNA발현, 유전자복제수변이 및 약물반응 네트워크를 도시한 예시도이고, 도 8은 본 발명에 의한 변이와 상관관계 세포주, 암, 약물반응, RNA발현 및 CNV증폭 예를 도시한 예시도이며, 도 9는 본 발명에 의한 기능하플로타입과 약물반응성 상관관계 계산 스키마를 도시한 예시도이고, 도 10은 본 발명에 의한 기능하플로타입와 약물반응성 네트워크를 도시한 예시도이며, 도 11은 본 발명에 의한 기능하플로타입과 유전자발현 및 유전자복제수변이 예를 도시한 예시도이고, 도 12는 본 발명에 의한 기능하플로타입 정의를 도시한 예시도이며, 도 13은 본 발명에 의한 FRH 방법과 유전자 발현과 약물 반응성 예측 예를 도시한 예시도이고, 도 14는 본 발명에 의한 FRH의 일 예시로 평균 IC50 값의 차이가 1.0인 실시예를 도시한 예시도이며, 도 15는 본 발명에 의한 FRH의 일 예시로 평균 IC50 값의 차이가 1.5인 실시예를 도시한 예시도이고, 도 16은 본 발명에 의한 기능하플로타입과 유전자발현 실시 예를 도시한 예시도이며, 도 17은 본 발명에 의한 특정 암 약물타입기반 약물반응 예측모델 생성예를 도시한 예시도이고, 도 18은 본 발명에 의한 기능하플로타입과 약물반응성 연관관계 R^2를 도시한 예시도이며, 도 19는 도 18에 도시된 예에서, Afatinib 약물과 FRH 상관관계가 높은 FRH의 실시예를 도시한 예시도이고, 도 20은 도 18에 도시된 예에서, Afatinib 약물과 FRH 상관관계가 높은 FRH를 사용한 예측 모델의 일 실시예를 도시한 예시도이며, 도 21은 본 발명에 의한 FRH를 사용한 혈액암의 약물반응성 예측의 일 실시예를 도시한 예시도이고, 도 22는 본 발명에 의한 FRH를 사용한 활용가능 시스템의 일 예를 도시한 예시도이다.
본 발명은 기본적으로, (A) 암 환자에게서 임상적으로 추출하기 어려운 유전자 RNA 발현정보 및 복제수변이 정보를 양적형질 위치(QTL)를 선행 계산하고, (B) 비임상 세포주 DB(GDSC 및 CCLE)와 같은 공용 데이터를 이용하여 유전자 RNA 발현정보 및 복제수변이 정보와 약물반응성 상관관계 실험 정보를 확보한 후, 상기 제(A)단계 및 제(B)단계를 통합하여 양적형질 위치(QTL)와 암약물반응 상관성을 계산하여 예측모델을 생성한다.
그리고 암 환자에게서 획득될 수 있는 유전체 정보를 기반으로 기능정보를 포함한 하플로타입을 계산하여 암환자의 약물반응성정보를 예측한다.
도 1에는 약물반응예측을 위한 양적 형질 위치(QTL), 유전복제수변이 및 RNA발현 예가 도시되어 있다. 즉, ①의 eQTL 실험 예문에서는, 변이와 발현의 직접(cis) 및 간접(trans)방식에 의해 조절되는 것이 나타나있고, ②의 Drug-Gene Expression은 약물과 RNA 발현의 상관관계를 보여준다. 그리고 ③의 Drug Cell viabillity는 약물의 농도와 세포의 활성관계를 보여주고, ④의 Drug-CNV는 약물의 농도와 유전자 복제수 변이(CNV)와의 상관관계를 보여준다. 그리고 ⑤의 Expression-CNV는 유전자 발현과 복제수 변이(CNV)와 상관관계를 보여준다.
즉, 도 1은 약물의 농도와 RNA 발현 및 유전자복제수변이(CNV)가 서로 상관관계를 가지고 있다는 것을 보여주고, 또한, 많은 경우에 RNA발현 및 유전자복제수변이(CNV)는 그것의 원인이 되는 단일 및 다중 변이와의 상관관계가 있음을 보여준다.
도 2에는 유전적 바이오마커를 활용한 약물반응성 계산 스키마에 있어, 대부분의 알려진 활성 약물이 약물에 민감한 군과 약물에 저항성을 주는 군으로 나누어지고, 이때, 민감성 및 저항성은 유전적 바이오마커와 밀접하게 연결되어 있다.
여기서, 유전적 바이오마커는 생식 및 체세포 변이, 드라이버변이, 복제수변이, 기능 하플로타입 변이, 후성 변이인 methylation 및 유전자 발현 등으로 구성된다.
그리고 도 3에는 유방암의 유전적 바이오마커와 약물반응성의 관계의 일예가 도시되어 있다. 유전적바이오마커들의 메커니즘을 나타내는 A) 계략도에서 Her2 유전자가 과발현되어 있을 때, 세포표면 수용체를 표적으로 하는 약물인 tratuzumab와 세포 내부의 cytoplasm에서의 길항제를 표적으로 하는 lapatinib 및 두 개의 바이오마커 PI3CA와 PTEN의 위치가 나타나 있다. B) 그래프에는 tratuzumab 및 lapatinib의 경우 wild type과 PI3CA가 변이를 가진 경우와, PTEN까지 기능을 못하는 경우에 대하여 약물반응성이 계산된 결과가 나타나 있고, 약물타입 메카니즘에서 약물표적의 위치에 따라 바이오마커의 변이가 1개 및 2개에 대한 약물반응성이 달라짐이 도시되어 있다.
한편, 도 4에는 NGS 입력과 약물반응 및 RNA발현 네트워크의 일 예가 도시되어 있다.
NGS 입력과 약물반응 및 RNA발현 네트워크의 기본 구조는, A) NGS 입력데이터로부터 선행으로 계산된 양적형질 위치(QTL)기반 유전자 RNA 과발현/저발현 및 유전자 복제수 변이의 증폭/감소를 예측하고, B) 비임상(in vitro) 공용 약물 반응성 데이터와 유전자발현 데이터와 상관관계 정보를 이용하여, C) 임상(in vivo)에서 양적형질 위치(QTL)기반 약물반응을 예측한다.
본 발명은 A) 양적형질 위치(QTL) 정보를 확보하고, B) 유전자 RNA 발현정보와 약물반응성 실험데이터를 라이브러리(DB)화하고, C) 약물반응성을 예측하는 과정으로 설명될 수 있다. 이는 일반적으로 환자에 대하여 B) 단계의 약물반응정보 및 유전자발현 정보를 짧은 시간에 확보하기가 어럽거나 일부는 거의 불가하기 때문이다.
따라서, 도 1 내지 도 4는 환자로부터는 유전체정보 및 RNA발현정보 기반 양적형질 위치(QTL) 정보와 관련을 가진 단일 및 다중 변이정보를 확보하고, 공용 약물반응성 정보인 비임상(in vitro) 세포주 실험 정보와 연결을 만들고, 임상(in vivo)에서 환자에게 적용하는 방식이다.
도 5는 세포주 약물반응 값(IC50)과 기능하플로타입의 상관관계 예시도로, 도 5에는 최종적으로 세포주들과 약물반응성 정보 및 기능하플로타입의 상관관계를 Pearson 상관관계로 계산하는 예가 도시되어 있다. 도 5에서는 265개 약물을 18(Dn)개 약물타입로 분류하여 적용을 하고, 기능하플로타입은 12개 암종(Cancer N)에 대하여 각 세포주 유전체에서 양적형질 위치(QTL) 정보기반으로 이미 약물반응과 관련을 가지고 있는 변이들의 조합(다중변이)들을 해시 수(hash number)로 바꾸어서, Pearson 상관관계를 구하는 형태의 계략도를 보여준다.
그리고 도 6은 양적형질 위치(QTL)와 약물반응 상관관계 예시도도를 보여 주고 있다. ①은 eQTL, ②는 cQTL, ③은 dQTL, ④는 유전자 RNA 발현과 유전자복제수변이의 상관관계, ⑤는 약물농도와 유전자 RNA발현, ⑥은 약물농도와 유전자복제수변이와의 상관관계를 보여준다.
본 발명에서 ① eQTL 및 ② cQTL이 사용되고, ③ 내지 ⑥은 결과물로서 혹은 상관관계가 있는 상태를 보여준다.
도 7은 변이, RNA발현, 유전자복제수변이 및 약물반응의 네트워크 구조를 나타내는 예시도로, 도 6에 도시된 내용을 서로 간의 연관성 관점으로 네트워킹을 만든 계략도이고, 지노타입(단일 변이), 하플로타입(조합 및 다중변이) 및 약물반응과의 조건식들의 관계를 보여준다.
본 발명에서 기능하플로타입은 단일변이 및 다중변이를 모두를 통칭한다.
그리고 각 변이들은 모두 양적형질 위치(QTL)의 방법에 의하여, 유전자 RNA 발현과 유전자복제수변이의 상관관계가 p-value < 10^5 이하로 정하여 수집된다.
한편, 도 8에는 변이와 상관관계 세포주, 암, 약물반응, RNA 발현 및 CNV 증폭의 예가 도시되어 있다. 이때, 상호 연관된 변이와 세포주, 암, 약물반응, RNA 발현 및 CNV 증폭의 예는 최종적으로 선별된 양적형질 위치(QTL)기반 약물반응성-변이-RNA발현-CNV가 하나의 객체로서 묶여 있다.
또한, 변이(지노타입)은 염색체의 위치, 변이 타입, 아미노산변이, 바이오마커로서의 활용 유무정보 등과도 연결될 수 있다.
한편, 도 9에 도시된 기능하플로타입과 약물반응성 상관관계 계산 스키마에 의하면, 본 발명은 크게 제1단계 및 제2단계로 구성된다.
제1단계는 양적형질 위치(QTL)들의 위치 모음을 생성하는 단계이고, 제2단계는 기능하플로타입과 약물반응 상관관계 계산하는 단계이다.
구체적으로, 제1단계는 1) 변이(전체 4백만)와 유전자들(20,000)의 발현 상관관계 계산하는 단계와, 2) 약물(265개)과 셀라인 유전체(1,000개)의 유전자발현과(각 20,000 여개)의 상관관계 계산하는 단계와, 3) 1) 및 2)에서 다중 혹은 단일변이와 연관을 가진 유전자발현 패턴이 같은 것을 수집하는 단계 및 4) 유전체통합DB에서 하플로타입(단일 및 다중변이)을 약물반응성과 함께 추출하는 단계를 포함하여 수행된다.
그리고 제2단계는 5) 이와 같은 하플로타입을 기능과 연관관계 하플로타입인 기능하플로타입(FRH)으로 정의하고, FRH를 해시넘버 (hash number)로 표현하는 단계 및 6) 해시넘버와 약물반응성 조합 상관관계 테스트(Pairwise Pearson Test)를 계산하는 단계를 포함하여 수행되고, 이들 과정을 모든 암 종에서 반복 수행한다.
또한, 도 10에는 기능하플로타입과 약물반응성의 네트워크가 도시된 것으로, 도 9에 도시된 기능 하플로타이핑 방법을 구현하기 위한 시스템을 나타낸다.
즉, QTL방법에 의한 단일 혹은 다중변이와 유전자 RNA발현 및 약물 반응데이터의 관계 및 Genotype으로 구성된 Cell Lines(c1~c-N) 통합 DB에서 다중변이를 추출하여 기능하플로타입을 추출하는 과정이 도시되어 있다.
그리고 도 11의 기능하플로타입과 유전자 RNA 발현 및 유전자복제수변이 예시도에는, 기능적인 관점에서 도 9의 과정을 구체적으로 설명을 한다.
즉, A)는 약물반응성 정보와 유전자 RNA발현의 관계를 최종결과물인 다중면이(loci)와 Exp으로 표현되고, 약물반응성 정보와 유전자복제수변이(CNV)의 관계를 loci와 CNV로 표현됨을 나타내고 있다.
그리고 B)는 이에 대한 상세 스키마로, 약물의 경우 Ln Ic50의 경우 '-2'는 민감성을 나타내고, '0'은 중간 민감성을 나타내며, '2'는 약물내성을 나타낸다.
한편, 다중변이(loci)는 양적형질 위치(QTL)기반으로 선별된 locus들의 모음으로 설명되고, loci는 다양한 타입인 loci-1, loci-2, ... loci-N으로 표현이 되며, 각 loci 타입은 전체 집단에서의 빈도(frequency)를 가지게 된다.
그리고 각각의 빈도 군에서 평균 약물반응성 정보인 ln IC50값(X, Y, …Z)이 산출된다.
한편, 유전자 RNA발현의 경우는 3가지 다른 발현 패턴을 가지는데, 이는 과발현(over-expression), 변화없음(normal), 및 저발현(under-exprfession)형식으로 표현이 될 수 있고, loci 타입과 같은 방식으로 각 타입에서 빈도(frequency)가 그룹화가 될 수 있고, 각 그룹에서의 평균 Ln IC50값(X', Y', …Z')이 산출된다.
그리고 같은 방식으로 복제수변이인 CNV의 경우도 증폭(amplification), 변화없음(normal) 및 감소(deletion)로 구분되고, 각 빈도(frequency) 군(group)에서 평균 약물반응성 정보인 ln IC50값(X", Y", …Z")이 산출된다.
또한, loci, gene-exp, gene-CNV 모두 다 빈도값이 가중치형태로 0~1의 스케일로 표현될 수 있다.
따라서, B)는 loci와 Exp, loci와 CNV에 가중치가 곱해진 것으로 설명될 수 있다.
도 12는 기능 하플로타입 정의를 나타내는 것으로, 본 발명에서 상대 기능 하플로타입(relative-Haplotype)이라 함은, 기능하플로타입(FRH)과 eQTL에서 유의성을 주는 locus들의 조합(Loci)으로서 기능적으로 연관된 하플로타입 관계를 말한다.
여기서, 기능하플로타입은 게놈 어셈블버전인 Dec. 2013 (GRCh38/hg38): Genome Reference Consortium Human 38 (GCA_000001405.15), https://www.ncbi.nlm.nih.gov/assembly/GCF_000001405.26 참고(reference)서열을 기준으로 개별 세포주 및 개인이 다른 다형성정보(allele)를 가진 형태로 정의된다. 그리고 FRH(Exp | IC50)는 유전자 발현차이에 대한 약물반응 절대값 민감도 차이(Normal 대 Over 혹은 Under)를 나타내고, FRH(Loci | IC50)는 세포주 들에 대한 기능적으로 연관된 하플로타입에 대응된 약물반응 절대값 민감도 차이를 말한다.
따라서, 약물반응값과 유전자 RNA발현의 관계와, Loci의 특정 타입과 같은 패턴의 유전자 RNA발현을 연결을 지을 수 있고, 일 예로, 도 12에서, [2]의 loci-3과 [1]Exp-over와 연결되어 있음을 보여준다.
즉, loci-3은 RNA발현이 over가 되는 것과 QTL관계에 있고, RNA발현이 over가 되어 있을 때 약물반응성 값은 loci-3의 약물발현성 값과 같은 것으로 예측할 수 있다.
또한, [3]에 도시된 바와 같이, FRH(Exp | IC50)은 변화없음(normal)에서의 약물반응성값과 비교하여 절대값 약물반응성 차이가 큰 값(max)를 나타내고, FRH(Loci | IC50)는 다양한 하플로타입에서의 약물반응 변화없음(normal)에서의 약물반응성 값과 비교하여 절대값 약물반응성 차이가 가장 큰 값(max)를 나타낸다.
한편, 도 13에는 FRH 방법과 유전자 발현과 약물 반응성을 예측한 예를 통하여, 도 12에 정의된 하플로타입을 좀 더 구체적으로 설명을 할 수 있다.
즉, 도 13의 [1] 및 [2]은 유전자 발현차이에 대한 약물반응 절대값 민감도 max 차이(Normal 대 Over 혹은 Under)를 각각 나타내고, [3]은 세포주 들에 대한 기능적으로 연관된 하플로타입에 대응된 약물반응 절대값 민감도 max 차이를 나타내며, [4]는 발현 차이에 대한 약물반응의 차이가 저발현 보다 더 크면 s=1, 그리고, 그 반대면 s=0이라 정의하는 것을 나타낸다. 따라서, s=1은 과발현이 약물반응에 민감하다는 것이고, S=0은 저발현이 약물반응이 민감하다는 것을 의미한다.
그리고 [5]는 [1] 및 [2]에서 정의한 ds^over가 ds^under보다 크면 m=1, 그렇지 않으면 m=0이라 정의하는 것을 나타내고, m=1이면 특정 loci타입이 유전자의 경우 과발현을 의미하고, m=0일 경우 유전자의 저발현이 특정 loci타입와 연관됨을 의미한다.
한편, 도 14는 FRH의 한 예시로 평균 IC50 값의 차이가 '1.0'인 예의 데이터를 표로 보여준다. 여기서, 평균 약물반응성(LN IC50)이 1인 경우 높은 양성 상관관계를 보인다 (pval <2.812*10^-7).
그리고, 도 15는 FRH의 한 예시로 평균 IC50 값의 차이가 '1.5'인 예의 데이터를 표로 보여준다. 여기서, 평균 약물반응성(LN IC50)이 1.5인 경우 훨씬 높은 음성 상관관계를 보인다 (pval <7.191*10^-7).
또한, 도 16에는 기능적으로 연관된 하플로타입과 유전자발현 실시예가 도시되어 있다.
이 실시예의 경우, 혈액암(blood)의 경우, FRH이 4개의 타입을 포함하는 것을 보여준다. 이때, 변이(locus위치)는 1: Ref Homo, 2: Hetero, 3: Alt Homo의 3개의 다른 지노타입(genotype)으로 설명이 된다.
그리고 첫 번째 컬럼의 혈액암(blood)에서 2개의 locus의 조합으로 표현하면, 각 타입의 빈도(frequency)는 두 번째 컬럼, '12'는 1명, '21'은 1명, '11'은 2명 그리고 '22'는 153명으로 다수를 보여준다.
또한, Afatinib 약물에 대하여 '11'의 경우 유전자발현은 과발현(2.404)이고, 약물반응성(LN IC50)은 -1.21, 즉 Afatinib 약물에 대하여 민감성이 있다는 것을 보여준다. 이 예시의 내용을 요약하면, 2개의 locus를 조합으로 하는 FRH는 '11' 타입에서 EGFR 유전자가 과발현되고, 그것이 원인이 되어서 약물반응성이 민감하다. 따라서, FRH는 '11' 타입을 가지는 세포주 및 환자는 Afatinib약물에 민감하다고 예측할 수 있다.
그리고 도 17에는 특정 암 약물타입기반 약물반응 예측모델 생성 방법이 도시되어 있다. 이에 도시된 바와 같이, 특정 암 약물타입기반 약물반응 예측모델은 1) 기능연관 하플로타입(FRH)과 특정암의 특정약물 패스웨이(Drug Pathway)와 관련된 각 약물과의 상관관계를 계산하고, 2) FRH 및 약물반응성 상관관계로 구성되는 메트릭스 X축 및 Y축의 상관관계 정보를 클러스터링을 하고, 3) 예측모델에서 유의성(p-value)이 높은 것을 수집하여, 이들의 상호작용 기능을 모델에 적용하고, 4) NGS 데이터를 입력으로 하여 약물반응성과 연관을 가진 FRH를 계산하여 약물반응성을 예측한다.
한편, 도 18에 도시된 기능하플로타입과 약물반응성 연관관계 R^2는 도 17의 예측모델 생성 방법의 2)상관관계 정보의 클러스터링 과정의 일 예를 설명한다. 여기서, 암 타입은 혈액암이고, Y: EGFR pathway 9 drugs, X: FRH 하플로타입 그리고 각 pixel은 약물반응값과 FRH의 Pearson 상관관계를 나타내고, 여기서 *는 유의성(pval<0.05)을 나타내고, **는 유의성(pval<0.01)을 나타낸다.
또한, 파랑색은 양성으로의 상관관계를 보여주고, 주황색은 음성으로의 상관관계을 보여준다.
그리고 도 19는 도 18의 예에서, Afatinib 약물과 FRH 상관관계가 높은 FRH의 예를 보여준다. 특히, 4개 FRH(LAMC2_2, JPH1_2, PRKCB_3, CML_1)와 약물반응성 상관관계를 결과를 나타내고 있다.
한편, 도 20은 도 18의 예에서, Afatinib 약물과 FRH 상관관계가 높은 FRH를 사용한 예측 모델의 일 예로, 도 17의 예측모델 생성 방법의 3) 상호작용 기능을 모델에 적용한 일 예를 설명한다. 특히, p-val<0.01이하인 FRH 21개는 상호작용 텀(term)으로 넣고, 선형 회귀(Leaner Regression)모델을 적용한 예시이다. 이 경우는 Pearson 상관관계가 0.89이다.
또한, 도 21은 혈액암 환자 1명 유전체의 기능하플로타입을 가지고 다양한 약물(AP-24534, PAC-1, Obatoclax Mesylate, Bleomycin 등)에 대한 예측된 IC50(real)값들을 보여준다. 이 결과 어떤 약물은 높은 민감도가 예측된 반면, 어떤 약물은 높은 저항성이 예측된 것으로 나타난다. 그리고 실제값(IC50(real))의 민감도와 기능하플로타입 군의 평균 IC50(ave)값 사이에 일치성이 있음을 보여준다.
또한, 도 22에 도시된 바와 같이, 본 발명에 의한 차세대시퀀싱데이터 기반의 개인별 기능하플로타입들이 수집되면 다양한 영역에서 활용이 가능하다. 즉, 가상임상시험 및 실제임상시험, 신약표적발굴, 질병 약물 민감도 진단, 및 동반진단 바이오마커 발굴 시스템 등에 활용가능하다.
한편, 도23은 암타입(CancerClass) 의 약물타입(DrugClass)에 다양한 약물의 동반진단 바이오마커를 활용한 칩 제작 방법에 대한 설명이다. 단계1에서 특정하는 특정 암타입 및 특정 약물타입에 해당한는 각 바이오마커들을 대상으로 진단칩을 만들거나 혹은 전체 암타입 및 약물타입을 모두 하나의 칩을 제작하고, 환자로부터 약물타입 혹은 암타입, 혹은 두가지 전부와 관련된 FRH 마커에 대하여 도18의 실시예 (혈액암의 약물타입 중의 하나인 EGFR pathway) 약물반응과 연관이 높은 한 세트의 FRH 및 특정암에 연관성이 높은 전체 FRH를 사용하여 도20의 Linear Regression 예측모델을 생성하는 형식으로 약물반응성을 예측 할 수 있다. 따라서, 본 특허에서 정리한 12개 암타입(CancerClass) 및 18개 약물타입(DrugClass)에 특이한 FRH 바이오마커들을 이용하여 다양한 암 및 암약물 동반진단 칩을 도 23처럼 제작하여 활용 할 수 있다.
최종적으로, 본 발명을 요약하면, 본 발명은 기능 하플로타입 정보를 활용하여 약물반응성 예측 모델을 계산하기 위해, 검사 대상 유전체로부터 수집된 염기서열에서 다수의 변이들을 활용하여 기능 하플로타입 들을 계산하는 단계와: 기능 하플로타입과 약물반응성 정보간의 선형 회귀 모델의 해를 계산하는 단계와; 이러한 해를 이용하여 효과적으로 암 약물 중에 민감성이 높은 암 약물을 필터링하는 가상임상(In Silico Clinical Trial)을 위한 약물 반응성 예측 방법에 관한 것이다.
용어의 설명
본 발명에서 약물타입(DrugClass)에 대한 정의는 약물 표적들의 타입(type) 및 약물의 관능기적 유사한 기능 타입, 혹은, 약물이 영향을 주는 범주의 유전자그룹, 약물 패스웨이(drug pathway) 혹은 약물 시그널링 패스웨이(drug signaling pathway), 등은 모두 하나의 통칭 약물타입(DrugClass)로 설명 하는 용어이다. FRH는 기능하프로타입(functionally related relative haplotype)을 나타내는 용어이고, eQTL은 발현에 대한 양적형질위치 (expression quantitative trait loci)을 나타내는 용어이며, FRH(Exp|IC50)는 과/저(over/under) 발현된 군집에 대한 IC50의 평균값을 나타내는 용어이고, FRH(CNV|IC50)는 증폭/삭제(amplification/deletion) 군집에 대한 IC50의 평균값을 나타내는 용어이며, FRH(loci|IC50)는 주어딘 loci타입 군집에 대한 IC50의 평균값을 나타내는 용어이고, GDSC는 Genomics of Drug Sensitivity in Cancer을 나타내는 용어이며, CCLP는 COSMIC Cell Lines Project을 나타내는 용어로 웹페이지 http://cancer.sanger.ac.uk/cell_lines로부터 확인할 수 있고, CNV는 복제수변이(Copy number variation)을 나타내는 용어이며, GBLscan는 암동반진단마커 스켄(Cancer Biomarker Labeling Scan)을 나타내는 용어이고, ISCT는 가상임상(In Silico Clinical Trial)을 나타내는 용어이다.
본 발명의 권리는 위에서 설명된 실시예에 한정되지 않고 청구범위에 기재된 바에 의해 정의되며, 본 발명의 분야에서 통상의 지식을 가진 자가 청구범위에 기재된 권리범위 내에서 다양한 변형과 개작을 할 수 있다는 것은 자명하다.
본 발명은 암을 포함하는 질병 관련 특이 유전자 변이 지문 (Genetic Variation Fingerprints)과 약물의 분자 약리관능기의 결합분석에 의해 약물의 반응성을 신뢰성 있게 예측할 수 있는 새로운 선형 회귀 모델인 약물 적응증 및 반응 예측 시스템 및 방법인 GBLscan (Genetic Biomarker Scan)에 관한 것으로, 본 발명에 의하면, 본 발명에서는 체외 및 체내 임상시험으로부터 수집되는 유전체에 대한 약물의 반응성 결과들로부터, 약리 효과가 밝혀지지 않은 유전체와 약물의 반응성 정도를 예측할 수 있는 효과가 있다.
Claims (21)
- (A) 약물반응에 영향을 미치는 변이들에 대한 양적형질위치(QTL)들의 위치모음을 산출하는 단계와;
(B) 상기 양적형질위치(QTL)에 포함된 변이에 대한 기능하플로타입을 생성하는 단계와;
(C) 상기 기능하플로타입을 기반으로 변이와 약물반응 상관관계 계산하는 단계; 그리고
(D) 상기 기능하플로타입을 기반으로 약물반응성을 예측하는 단계를 포함하여 수행되고:
상기 제(B)단계의 기능하플로타입의 생성은,
유전체통합DB로부터 양적형질위치(QTL)에 포함된 단일 또는 다중변이에 대한 하플로타입을 약물반응성과 함께 추출하여 생성됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 1 항에 있어서,
상기 제(A)단계의 양적형질위치(QTL)들의 위치모음을 산출은,
(A1) 복수의 세포주로부터 변이들과 유전자 RNA 발현의 상관관계를 도출하는 단계와;
(A2) 약물들과 복수의 셀라인 유전체에 포함된 유전자 RNA발현 및 유전자 복제수변이(CNV)들과의 상관관계 도출하는 단계와;
(A3) 상기 제(A1)단계 및 제(A2)단계에서 공통 적으로 상관관계에 영향을 미치는 유전자 RNA 발현 또는 유전자 복제수변이에 대한 유전자 발현 정보를 산출하는 단계; 그리고
(A4) 상기 유전자 발현정보에 관여된 단일 또는 다중 변이를 산출하여, 약물반응에 영향을 미치는 변이들에 대한 양적형질위치(QTL)를 산출하는 단계를 포함하여 수행되는 양적형질위치(QTL)들의 위치모음 생성 단계를 포함하여 수행됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 삭제
- 제 1 항에 있어서,
상기 기능하플로타입은,
유전자 RNA발현(Exp)과 약물반응성과의 상관관계 정보와;
유전자 다중변이(loci)와 약물반응성과의 상관관계 정보를 포함하여 구성됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 1 항에 있어서,
상기 기능하플로타입은,
유전자 복제수변이(CNV)와 약물반응성과의 상관관계 정보와;
유전자 다중변이(loci)와 약물반응성과의 상관관계 정보를 포함하여 구성됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 4 항 또는 제5항에 있어서,
상기 유전자 다중변이(loci)는,
양적형질위치(QTL)기반으로 선별된 로커스(locus)들의 모음임을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 6 항에 있어서,
상기 유전체통합DB는,
지노타입(Genotype)으로 구성된 셀라인(Cell Lines) 통합 DB임을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 6 항에 있어서,
상기 약물 반응성은,
ln Ic50 값으로 표현됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 4 항에 있어서,
상기 유전자 RNA발현은,
과발현(over-expression), 변화없음(normal) 및 저발현(under-exprfession)으로 구분됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 5 항에 있어서,
상기 복제수변이(CNV)는,
증폭(amplification), 변화없음(normal) 및 감소(deletion)로 구분됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 2 항에 있어서,
상기 제(C)단계의 상관관계 계산은,
(C1) 유전자 다중변이(loci)와 연관된 유전자 RNA발현(Exp)를 판별하는 단계와;
(C2) 상기 기능하플로타입으로부터 상기 유전자 RNA발현(Exp)에 대한 약물반응성을 산출하여 상기 유전자 다중변이(loci)에 대한 약물반응성을 판별하는 단계; 그리고
(C3) 상기 기능하플로타입에 포함된 유전자 다중변이(loci)와 약물반응성과의 상관관계 정보로부터 산출된 약물반응성과 상기 제(C2)단계에서 판별된 약물반응성을 비교하여 검증하는 단계를 포함하여 수행됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 11 항에 있어서,
상기 제(C1)단계의 연관은,
상기 유전자 다중변이(loci)가 포함된 세포주 및 상기 세포주에 포함된 유전자 RNA발현(Exp)정보를 판별함에 의해 수행됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 11 항에 있어서,
상기 제(D)단계의 약물반응성을 예측은,
유전자 RNA발현 차이에 대한 약물반응의 차이가 과발현보다 저발현이 큰 경우, 유전자 RNA의 저발현이 약물반응에 민감한 것으로 판단하고;
유전자 RNA발현 차이에 대한 약물반응의 차이가 과발현보다 저발현이 작은 경우, 유전자 RNA의 과발현이 약물반응에 민감한 것으로 판단함을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 11 항에 있어서,
상기 제(D)단계의 약물반응성을 예측은,
과발현 집단의 유전자 RNA발현 차이에 대한 약물반응 절대값 민감도 최고치의 차이값이 저발현 집단의 유전자 RNA발현 차이에 대한 약물반응 절대값 민감도 최고치의 차이값보다 크면, 유전자 RNA의 과발현이 유전자 다중변이(loci)타입과 연관된 것으로 판별하고;
과발현 집단의 유전자 RNA발현 차이에 대한 약물반응 절대값 민감도 최고치의 차이값이 저발현 집단의 유전자 RNA발현 차이에 대한 약물반응 절대값 민감도 최고치의 차이값보다 작으면, 유전자 RNA의 저발현이 유전자 다중변이(loci)타입과 연관된 것으로 판별함을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 11 항에 있어서,
상기 기능하플로타입은,
해시넘버 (hash number)로 표현됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 15 항에 있어서,
상기 기능하플로타입과 약물반응의 상관관계는,
해시넘버를 이용하여, 약물반응성정보와 조합상관관계 테스트(Pairwise Pearson Test)를 수행함에 의해 산출됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수변이를 이용한 기능하플로타이핑 방법.
- 제 1 항, 제 2 항 또는 제 4 항 내지 제 16 항 중 어느 한 항에 의한 방법으로 기능하플로타입을 생성하는 것을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 시스템.
- 제 17 항에 있어서,
상기 기능하플로타입은,
약물에 대한 반응성 진단에 사용됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 시스템.
- 제 17 항에 있어서,
상기 기능하플로타입은,
약물에 대한 환자군을 선별하는 동반진단을 위한 바이오마커 발굴에 사용됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 시스템.
- 제 17 항에 있어서,
상기 기능하플로타입은,
약물표적발굴에 사용됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 시스템.
- 제 17 항에 있어서,
상기 기능하플로타입은,
약물에 대한 가상임상에 사용됨을 특징으로 하는 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180124550A KR101984611B1 (ko) | 2018-10-18 | 2018-10-18 | 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180124550A KR101984611B1 (ko) | 2018-10-18 | 2018-10-18 | 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 방법 및 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101984611B1 true KR101984611B1 (ko) | 2019-05-31 |
Family
ID=66656889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180124550A KR101984611B1 (ko) | 2018-10-18 | 2018-10-18 | 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101984611B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110310703A (zh) * | 2019-06-25 | 2019-10-08 | 中国人民解放军军事科学院军事医学研究院 | 药物的预测方法、装置及计算机设备 |
WO2021071181A1 (ko) * | 2019-10-07 | 2021-04-15 | 한국과학기술원 | 면역항암제에 대한 저항성을 예측하는 방법 및 분석장치 |
WO2021256907A1 (ko) * | 2020-06-19 | 2021-12-23 | (주)신테카바이오 | Egfr 저해제의 동반진단 바이오마커 |
-
2018
- 2018-10-18 KR KR1020180124550A patent/KR101984611B1/ko active IP Right Grant
Non-Patent Citations (63)
Title |
---|
(001) Forbes, S. A., et al. COSMIC: somatic cancer genetics at high-resolution. Nucleic Acids Research. 45, 777-783 (2017). |
(002) Lawrence, M. S., et al. Discovery and saturation analysis of cancer genes across 21 tumour types. Nature. 505, 495-501 (2014). |
(003) Stratton, M.R., Campbell, P.J. & Futreal, P.A. The cancer genome. Nature 458, 719-724 (2009). |
(004) Williams SP, & McDermott U. The pursuit of therapeutic biomarkers with high-throughput cancer cell drug screens. Cell Chemical Biology. 24, 1066-1074 (2017). |
(005) Barretina, J, et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature. 483, 603-7 (2012). |
(006) Yang, W., et al. Genomics of Drug Sensitivity in Cancer (GDSC): a resource for therapeutic biomarker discovery in cancer cells. Nucleic Acids Research. 41, 955-961 (2013). |
(007) Basu, A., et al. An interactive resource to identify cancer genetic and lineage dependencies targeted by small molecules. Cell. 154, 1151-1161 (2013). |
(008) Iorio, F., et al. (2016). A Landscape of pharmacogenomic interactions in cancer. Cell. 166, 740-754 (2016). |
(009) Garnett, M. J., Edelman, E. J., Heidorn, S. J., Greenman, C. D., Dastur, A., Lau, K. W., Greninger, P., Thompson, I. R., Luo, X. & Soares, J. Systematic identification of genomic markers of drug sensitivity in cancer cells. Nature. 483, 570-575 (2012). |
(010) Menden, M.P., Iorio, F., Ballester, P.J., Saez-Rodriguez, J., Garnett, M., McDermott, U., & Benes, C.H. Machine learning prediction of cancer cell sensitivity to drugs based on genomic and chemical properties. PLoS ONE. 8. e61318 (2013). |
(011) Rubio-Perez, C., Tamborero, D., Schroeder, M., Antolin, A., Deu-Pons, J., Perez-Llamas, C., Mestres, J., Gonzalez-Perez, A., & Lopez-Bigas, N. In silico prescription of anticancer drugs to cohorts of 28 tumor types reveals targeting opportunities. Cancer Cell. 27, 382-396 (2015). |
(012) Seashore-Ludlow, B., et al. Harnessing connectivity in a large-scale small-molecule sensitivity dataset. Cancer Discovery. 5, 1210-1223 (2015). |
(013) Yadav, B., et al. Quantitative scoring of differential drug sensitivity for individually optimized anticancer therapies. Scientific Reports. 4 (2015). |
(014) Vanhaelen, Q., et al.. Design of efficient computational workflows for in silico drug repurposing. Drug Discovery Today. 22, 210-222 (2017). |
(015) Mamoshina, P., Vieira, A., Putin, E. & Zhavoronkov, A. Applications of deep learning in biomedicine. Molecular Pharmaceutics. 13, 1445-1454 (2016). |
(016) Ramsundar, B., Kearnes, S., Riley, P., Webster, D., Konerding, D. & Pande, V. Massively multitask networks for drug discovery. arXiv:1502.02072 (2015). |
(017) Dahl, G. E., Jaitly, N. & Salakhutdinov, R. Multi-task neural networks for QSAR predictions. arXiv:1406.1231 (2014). |
(018) Nantasenamat C, Isarankura-Na-Ayudhya C, Naenna T, Prachayasittikul V. "A practical overview of quantitative structure-activity relationship". Excli J. 8: 7488(2009). |
(019) Ebuka, D Quantitative structureactivity relationship study on potent anticancer compounds against MOLT-4 and P388 leukemia cell lines, Journal of Advanced Research, 10.1016(2016) |
(020) Yuan, Y., et al. DeepGene: an advanced cancer type classifier based on deep learning and somatic point mutations. BMC Bioinformatics. 17, 243-256 (2016). |
(021) Smalley, E. AI-powered drug discovery captures pharma interest. Nature Biotechnology. 35, 604-605 (2017).) |
(022) Baskin, I.I., Winkler, D. & Tetko, I.V. A renaissance of neural networks in drug discovery. Expert Opinion on Drug Discovery. 11, 785-95 (2016). |
(023) Gonczarek, A., Tomczak, J.M., Zareba, S., Kaczmar, J. Dabrowski, P. & Walczak, MJ. Learning deep architectures for interaction prediction in structure-based virtual screening. NIPS, 30, (2016). |
(024) Pereira, J. C., Caffarena, E. R., & Dos Santos, C. N. Boosting docking-based virtual screening with deep learning. Journal of Chemical Information and Modeling. 56, 2495-2506 (2016). |
(025) Unterthiner, T, Mayr, A, Klambauer, G, Steijaert, M, Wegner, J.K., Ceulemans, H, & Hochreiter, S. Deep learning as an opportunity in virtual screening. NIPS, 27, (2014). |
(026) Wen M., Zhang Z., Niu S., Sha H., Yang R., Lu H., & Yun Y. Deep-learning-based drug-target interaction prediction. Journal of Proteome Research. 16, 1401-1409 (2017). |
(027) Aliper A, Plis S, Artemov A, Ulloa A, Mamoshina P, & Zhavoronkov A. Deep learning applications for predicting pharmacological properties of drugs and drug repurposing using transcriptomic data. Molecular Pharmaceutics. 13, 2524-2530 (2016). |
(028) Ching, T., et al. Opportunities and obstacles for deep learning in biology and medicine. bioRxiv. doi: http://dx.doi.org/10.1101/142760 (2017). |
(029) Yap CW. PaDEL-Descriptor: An open source software to calculate molecular descriptors and fingerprints. Journal of Computational Chemistry. 32, 1466-1474(2011) |
(030) Schneider, G.; Clement-Chomienne, O.; Hilfiger, L.; Schneider, P.;Kirsch, S.; Bohm, H-J. and Neihart, W. Virtual Screening for Bioactive Molecules by Evolutionary De Novo Design Angew. Chem. Int. Ed., 39, 4130-4133(2000) |
(031) Schneider, G.; Lee, M-L.; Stal, M. and Schneider, P. De novo design of molecular architectures by evolutionary assembly of drug-derived building blocks J. Comp-Aid. Mol. Des., 14, 487-494(2000) |
(032) Pearlman, S. R. and Smith, K. M. Novel Software Tools for Chemical Diversity, Perspectives in Drug Discovery and Design, 9/10/11: 339-353,(1998). |
(033) Burden, F. R. Molecular identification number for substructure searches, J. Chem. Inf. Comput. Sci. 29 , 225-7(1989). |
(034) SIFT: Kumar, Prateek, Steven Henikoff, and Pauline C. Ng. "Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm." Nature protocols 4.7: 1073-1081(2009). |
(035) Polyphen-2 : I. A. Adzhubei, S. Schmidt, L. Peshkin et al., method and server for predicting damaging missense mutations,Nature Methods, vol. 7, no. 4, pp. 248249, 2010 |
(036) LRT S. Chun and J. C. Fay, of deleterious mutations within three human genomes,Genome Research, vol. 19, no. 9, pp. 15531561, 2009. |
(037) Polyphen-2 HDIV n HDVAR Score: Yunos, R. I. M., Ab Mutalib, N. S., Khor, S. S., Saidin, S., Nadzir, N. M., Razak, Z. A., & Jamal, R. (2016). Characterisation of genomic alterations in proximal and distal colorectal cancer patients (No. e2109v1). PeerJ Preprints. |
(038) MutationAccessor1: Reva, B., Antipin, Y., & Sander, C. (2011). Predicting the functional impact of protein mutations: application to cancer genomics. Nucleic acids research, 39(17), e118-e118. |
(039) MutationAccessor2: Gnad, F., Baucom, A., Mukhyala, K., Manning, G., & Zhang, Z.. Assessment of computational methods for predicting the effects of missense mutations in human cancers. BMC genomics, 14(3), S7(2013). |
(040) MUTATIONTASTER: Dong, C., Wei, P., Jian, X., Gibbs, R., Boerwinkle, E., Wang, K., & Liu, X. Comparison and integration of deleteriousness prediction methods for nonsynonymous SNVs in whole exome sequencing studies. Human molecular genetics, 24(8), 2125-2137(2014). |
(041) MutationAccessor and Mutation Taster: Oishi, Maho, et al. "Comprehensive Molecular Diagnosis of a Large Cohort of Japanese Retinitis Pigmentosa and Usher Syndrome Patients by Next-Generation SequencingDiagnosis of RP and Usher Syndrome Patients by NGS." Investigative ophthalmology & visual science 55.11 (2014): 7369-7375. |
(042) PhyloP46way_placental and PhyloP46way_vertebrate: Pollard, Katherine S., et al. "Detection of nonneutral substitution rates on mammalian phylogenies." Genome research 20.1: 110-121(2010). |
(043) GERP++_RS Score: Davydov, E. V., Goode, D. L., Sirota, M., Cooper, G. M., Sidow, A., & Batzoglou, S.. Identifying a high fraction of the human genome to be under selective constraint using GERP++. PLoS computational biology, 6(12), e1001025(2010). |
(044) B62 Score: Tsuda, H., Kurosumi, M., Umemura, S., Yamamoto, S., Kobayashi, T., & Osamura, R. Y. HER2 testing on core needle biopsy specimens from primary breast cancers: interobserver reproducibility and concordance with surgically resected specimens. BMC cancer, 10(1), 534(2010). |
(045) Siphy : Garber, Manuel, et al. "Identifying novel constrained elements by exploiting biased substitution patterns." Bioinformatics 25.12: i54-i62(2009). |
(046) CHASM : H. Carter, J. Samayoa, R. H. Hruban, and R. Karchin, of driver mutations in pancreatic cancer using cancerspecific high-throughput annotation of somatic mutations (CHASM),Cancer Biology & Therapy, vol. 10, no. 6, pp. 582587(2010). |
(047) Dendrix: F. Vandin, E. Upfal, and B. J. Raphael, novo discovery of mutated driver pathways in cancer,Genome Research, vol. 22, no. 2, pp. 375385(2012). |
(048) MutsigCV: M. S. Lawrence, P. Stojanov, P. Polak et al., heterogeneity in cancer and the search for new cancer-associated genes,Nature, vol. 499, no. 7457, pp. 214218. [68] M. Kanehisa and S. Goto, kyoto encyclopedia(2013) |
(049) FATHMM: Shihab, Hashem A., et al. "Predicting the functional, molecular, and phenotypic consequences of amino acid substitutions using hidden Markov models." Human mutation 34.1: 57-65(2013). |
(050) VEST3_score: Carter, Hannah, et al. "Identifying Mendelian disease genes with the variant effect scoring tool." BMC genomics 14.3: S3(2013). |
(051) MetaSVM: Nono, Djotsa, et al. "Computational Prediction of Genetic Drivers in Cancer." eLS (2016). |
(052) MetaLR : Dong, Chengliang, et al. "Comparison and integration of deleteriousness prediction methods for nonsynonymous SNVs in whole exome sequencing studies." Human molecular genetics 24.8: 2125-2137(2014). |
(053) CADD: Kircher, Martin, et al. "A general framework for estimating the relative pathogenicity of human genetic variants." Nature genetics 46.3: 310-315(2014). |
(054) CADD 2 : Velde, K. Joeri, et al. "Evaluation of CADD scores in curated mismatch repair gene variants yields a model for clinical validation and prioritization." Human mutation 36.7: 712-719(2014). |
(055) CADD 3: Mather, Cheryl A., et al. "CADD score has limited clinical validity for the identification of pathogenic variants in non-coding regions in a hereditary cancer panel." Genetics in medicine: official journal of the American College of Medical Genetics (2016). |
(056) ParsSNP: Kumar, Runjun D., S. Joshua Swamidass, and Ron Bose. "Unsupervised detection of cancer driver mutations with parsimony-guided learning." Nature genetics 48.10: 1288-1294(2016). |
(057) Deep Learning: Yann Lecun, Y., Bengio, Y. & Hinton, G. Nature. 521, 436-444 (2015) |
(058) Cancer Drug Response Profile scan (CDRscan): A Deep Learning Model That Predicts Drug Effectiveness from Cancer Genomic Signature: Yoosup Chang, Scientific Report,. 8857 (2018) |
(059) Genome-scale signatures of gene interaction from compound screens predict clinical efficacy of targeted cancer therapies. Peng Jiang, et al., Cell Systems, 6,1-12 (2018) |
(060) eQTL: Maud Fagny, et al., PNAS, E7841-E7850 (2017) |
(061) pQTL: Jerome Carayol, et al., Nat Commun., 8:2084 (2017) |
E. R. Gamazon 외 3인, "Copy number polymorphisms and anticancer pharmacogenomics", Genome Biology 2011, 12:R46, 2014. 1부.* * |
H.G.Olsen 외, "Genetic support for a quantitative trait nucleotide in the ABCG2 gene affecting milk composition of dairy cattle", BMC Genetics, 2007, 8:32, 2007.06.21. * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110310703A (zh) * | 2019-06-25 | 2019-10-08 | 中国人民解放军军事科学院军事医学研究院 | 药物的预测方法、装置及计算机设备 |
CN110310703B (zh) * | 2019-06-25 | 2021-09-07 | 中国人民解放军军事科学院军事医学研究院 | 药物的预测方法、装置及计算机设备 |
WO2021071181A1 (ko) * | 2019-10-07 | 2021-04-15 | 한국과학기술원 | 면역항암제에 대한 저항성을 예측하는 방법 및 분석장치 |
WO2021256907A1 (ko) * | 2020-06-19 | 2021-12-23 | (주)신테카바이오 | Egfr 저해제의 동반진단 바이오마커 |
KR20210157144A (ko) * | 2020-06-19 | 2021-12-28 | (주)신테카바이오 | 약물 민감도 판단을 위한 유전자 검출 방법 및 진단용 조성물 |
KR102406696B1 (ko) * | 2020-06-19 | 2022-06-08 | (주)신테카바이오 | 약물 민감도 판단을 위한 유전자 검출 방법 및 진단용 조성물 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101953762B1 (ko) | 이종 특성정보 병합 데이터 기반 인공지능 딥러닝 모델을 이용한 약물 적응증 및 반응 예측 시스템 및 방법 | |
Issa et al. | Machine and deep learning approaches for cancer drug repurposing | |
Dressler et al. | Comparative assessment of genes driving cancer and somatic evolution in non-cancer tissues: an update of the Network of Cancer Genes (NCG) resource | |
Fortin et al. | Reconstructing A/B compartments as revealed by Hi-C using long-range correlations in epigenetic data | |
Kristensen et al. | Principles and methods of integrative genomic analyses in cancer | |
Jayawardana et al. | Determination of prognosis in metastatic melanoma through integration of clinico‐pathologic, mutation, mRNA, microRNA, and protein information | |
KR101984611B1 (ko) | 약물반응성, 유전자발현정보 및 복제수 변이를 이용한 기능하플로타이핑 방법 및 시스템 | |
CN113168886A (zh) | 用于使用神经网络进行种系和体细胞变体调用的系统和方法 | |
KR20210103452A (ko) | 혈액암 약물 반응성 판단을 위한 바이오 마커 조성물, 바이오 마커 조성물을 이용한 혈액암 약물 반응성 판단 방법 및 혈액암 약물 반응성 판단을 위한 바이오 마커 조성물 검출용 진단칩 | |
Zhou et al. | ENTPRISE: an algorithm for predicting human disease-associated amino acid substitutions from sequence entropy and predicted protein structures | |
JP5930266B2 (ja) | 遺伝子絞り込み装置、遺伝子絞り込み方法、及びコンピュータプログラム | |
US11614434B2 (en) | Genetic information analysis platform oncobox | |
Pandey et al. | Identification of potential driver mutations in glioblastoma using machine learning | |
Zhang et al. | Identification of a survival-related signature for sarcoma patients through integrated transcriptomic and proteomic profiling analyses | |
Özkan et al. | The computational approach to variant interpretation: principles, results, and applicability | |
Chen et al. | A deep learning approach to identify association of disease–gene using information of disease symptoms and protein sequences | |
Melge et al. | In silico modeling of FDA-approved drugs for discovery of anti-cancer agents: a drug-repurposing approach | |
Chen et al. | Identification and validation of novel gene markers of osteoporosis by weighted co expression analysis | |
Chang et al. | Maximizing biomarker discovery by minimizing gene signatures | |
Panei et al. | Identifying small-molecules binding sites in RNA conformational ensembles with SHAMAN | |
Hauschild et al. | Protein–protein interaction data, their quality, and major public databases | |
Su et al. | Transcriptome-wide association study identifies new susceptibility genes and pathways for spondyloarthritis | |
Afroz et al. | Multi-omics data integration and drug screening of AML cancer using Generative Adversarial Network | |
Liu et al. | Differentially expressed mutant genes reveal potential prognostic markers for lung adenocarcinoma | |
Liu et al. | Time-to-event supervised genetic algorithm enables induction chemotherapy decision making for nasopharyngeal carcinoma |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |