KR102518091B1 - 상동 재조합 결핍 정보를 제공하는 방법 - Google Patents
상동 재조합 결핍 정보를 제공하는 방법 Download PDFInfo
- Publication number
- KR102518091B1 KR102518091B1 KR1020220115630A KR20220115630A KR102518091B1 KR 102518091 B1 KR102518091 B1 KR 102518091B1 KR 1020220115630 A KR1020220115630 A KR 1020220115630A KR 20220115630 A KR20220115630 A KR 20220115630A KR 102518091 B1 KR102518091 B1 KR 102518091B1
- Authority
- KR
- South Korea
- Prior art keywords
- classified
- mutations
- mutation
- homologous recombination
- harmful
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000006801 homologous recombination Effects 0.000 title claims abstract description 27
- 238000002744 homologous recombination Methods 0.000 title claims abstract description 27
- 230000007812 deficiency Effects 0.000 title claims abstract description 25
- 230000035772 mutation Effects 0.000 claims abstract description 87
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 claims description 42
- 108090000623 proteins and genes Proteins 0.000 claims description 30
- 230000001717 pathogenic effect Effects 0.000 claims description 15
- 108020004414 DNA Proteins 0.000 claims description 11
- 230000002939 deleterious effect Effects 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 8
- 102000000872 ATM Human genes 0.000 claims description 3
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 claims description 3
- 101700002522 BARD1 Proteins 0.000 claims description 3
- 108700020463 BRCA1 Proteins 0.000 claims description 3
- 102000036365 BRCA1 Human genes 0.000 claims description 3
- 101150072950 BRCA1 gene Proteins 0.000 claims description 3
- 102100028048 BRCA1-associated RING domain protein 1 Human genes 0.000 claims description 3
- 108700020462 BRCA2 Proteins 0.000 claims description 3
- 102000052609 BRCA2 Human genes 0.000 claims description 3
- 101150008921 Brca2 gene Proteins 0.000 claims description 3
- 102100038111 Cyclin-dependent kinase 12 Human genes 0.000 claims description 3
- 102100033934 DNA repair protein RAD51 homolog 2 Human genes 0.000 claims description 3
- 102100034484 DNA repair protein RAD51 homolog 3 Human genes 0.000 claims description 3
- 102100034483 DNA repair protein RAD51 homolog 4 Human genes 0.000 claims description 3
- 108700026162 Fanconi Anemia Complementation Group L protein Proteins 0.000 claims description 3
- 102000052930 Fanconi Anemia Complementation Group L protein Human genes 0.000 claims description 3
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 claims description 3
- 102000016627 Fanconi Anemia Complementation Group N protein Human genes 0.000 claims description 3
- 102100034553 Fanconi anemia group J protein Human genes 0.000 claims description 3
- 101000884345 Homo sapiens Cyclin-dependent kinase 12 Proteins 0.000 claims description 3
- 101001132271 Homo sapiens DNA repair protein RAD51 homolog 3 Proteins 0.000 claims description 3
- 101001132266 Homo sapiens DNA repair protein RAD51 homolog 4 Proteins 0.000 claims description 3
- 101100119754 Homo sapiens FANCL gene Proteins 0.000 claims description 3
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 claims description 3
- 101000777293 Homo sapiens Serine/threonine-protein kinase Chk1 Proteins 0.000 claims description 3
- 101000777277 Homo sapiens Serine/threonine-protein kinase Chk2 Proteins 0.000 claims description 3
- 108020004485 Nonsense Codon Proteins 0.000 claims description 3
- 101710018890 RAD51B Proteins 0.000 claims description 3
- 102100031081 Serine/threonine-protein kinase Chk1 Human genes 0.000 claims description 3
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 claims description 3
- 231100000221 frame shift mutation induction Toxicity 0.000 claims description 3
- 230000037433 frameshift Effects 0.000 claims description 3
- 230000037434 nonsense mutation Effects 0.000 claims description 3
- 230000008685 targeting Effects 0.000 claims description 3
- 101000712511 Homo sapiens DNA repair and recombination protein RAD54-like Proteins 0.000 claims description 2
- 102100023931 Transcriptional regulator ATRX Human genes 0.000 claims description 2
- 239000012661 PARP inhibitor Substances 0.000 abstract description 9
- 229940121906 Poly ADP ribose polymerase inhibitor Drugs 0.000 abstract description 9
- 230000000694 effects Effects 0.000 abstract description 4
- 206010028980 Neoplasm Diseases 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 16
- 230000007918 pathogenicity Effects 0.000 description 16
- 201000011510 cancer Diseases 0.000 description 15
- 210000004027 cell Anatomy 0.000 description 10
- 238000011282 treatment Methods 0.000 description 9
- 108700028369 Alleles Proteins 0.000 description 8
- 238000007481 next generation sequencing Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 208000031448 Genomic Instability Diseases 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 206010033128 Ovarian cancer Diseases 0.000 description 4
- 206010061535 Ovarian neoplasm Diseases 0.000 description 4
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 206010064571 Gene mutation Diseases 0.000 description 3
- 102100023712 Poly [ADP-ribose] polymerase 1 Human genes 0.000 description 3
- 206010060862 Prostate cancer Diseases 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 101710179684 Poly [ADP-ribose] polymerase Proteins 0.000 description 2
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- PCRZONNRANOQPA-ZVSDKSQSSA-N (2r,3e,5e,7e,9e)-3,7-dimethyl-9-(2,6,6-trimethylcyclohex-2-en-1-ylidene)nona-3,5,7-triene-1,2-diol Chemical compound OC[C@H](O)C(/C)=C/C=C/C(/C)=C/C=C1/C(C)=CCCC1(C)C PCRZONNRANOQPA-ZVSDKSQSSA-N 0.000 description 1
- 101000741396 Chlamydia muridarum (strain MoPn / Nigg) Probable oxidoreductase TC_0900 Proteins 0.000 description 1
- 101000741399 Chlamydia pneumoniae Probable oxidoreductase CPn_0761/CP_1111/CPj0761/CpB0789 Proteins 0.000 description 1
- 101000741400 Chlamydia trachomatis (strain D/UW-3/Cx) Probable oxidoreductase CT_610 Proteins 0.000 description 1
- 102000011724 DNA Repair Enzymes Human genes 0.000 description 1
- 108010076525 DNA Repair Enzymes Proteins 0.000 description 1
- 230000009946 DNA mutation Effects 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102100029671 E3 ubiquitin-protein ligase TRIM8 Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 101000795300 Homo sapiens E3 ubiquitin-protein ligase TRIM8 Proteins 0.000 description 1
- 101001113440 Homo sapiens Poly [ADP-ribose] polymerase 2 Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 108010064218 Poly (ADP-Ribose) Polymerase-1 Proteins 0.000 description 1
- 102100023652 Poly [ADP-ribose] polymerase 2 Human genes 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 101150092145 RAD54L gene Proteins 0.000 description 1
- 201000000582 Retinoblastoma Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 231100000315 carcinogenic Toxicity 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- PCHKPVIQAHNQLW-CQSZACIVSA-N niraparib Chemical compound N1=C2C(C(=O)N)=CC=CC2=CN1C(C=C1)=CC=C1[C@@H]1CCCNC1 PCHKPVIQAHNQLW-CQSZACIVSA-N 0.000 description 1
- 229950011068 niraparib Drugs 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- FAQDUNYVKQKNLD-UHFFFAOYSA-N olaparib Chemical compound FC1=CC=C(CC2=C3[CH]C=CC=C3C(=O)N=N2)C=C1C(=O)N(CC1)CCN1C(=O)C1CC1 FAQDUNYVKQKNLD-UHFFFAOYSA-N 0.000 description 1
- 229960000572 olaparib Drugs 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 201000001514 prostate carcinoma Diseases 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- HMABYWSNWIZPAG-UHFFFAOYSA-N rucaparib Chemical compound C1=CC(CNC)=CC=C1C(N1)=C2CCNC(=O)C3=C2C1=CC(F)=C3 HMABYWSNWIZPAG-UHFFFAOYSA-N 0.000 description 1
- 229950004707 rucaparib Drugs 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/165—Mathematical modelling, e.g. logarithm, ratio
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Pathology (AREA)
- Evolutionary Computation (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 상동 재조합 결핍 (Homologous Recombination Deficiency, HRD) 정보를 제공하는 방법에 관한 것이다. 본 발명에 따르면, 종래 PARP 저해제의 적용 대상으로 분류되지 않던 미분류 돌연변이들에 대해 추가적인 분석 및 분석 결과의 조합을 통해 유해 변이로 추가 분류하여 PARP 억제제에 의한 치료 대상을 확장할 수 있는 효과가 있다.
Description
본 발명은 상동 재조합 결핍 정보를 제공하는 방법에 관한 것이다.
암은 인류의 건강을 위협하는 대표적인 질병으로서 산업화된 국가에서 단일 질병으로는 가장 대표적인 사망 원인이다. 암의 발생원인은 아직도 규명되지 않고 있으나 내적 요인인 유전적 요소와 외적 요인인 암 발생 유발요소로 작용되는 발암화학물질, 계속적인 염증과 손상, 암 유발 바이러스 감염의 복합적 요소가 작용하는 것으로 간주된다. 유전적 요소에 대해서는 동물실험상 많은 입증이 있으나 인간의 암에 대한 작용 여부는 망막아세포종이나 가족적 대장 이종증 등 일부를 제외하고는 확실한 증거가 없으며, 오히려 외적 요인인 환경적 요소와 구별하기 어려운 실정이다.
DNA가 손상된 정상세포의 경우 상동 재결합을 통해 복구된다. 이 때 관여하는 유전자는 14개로 알려져 있으며, 이를 상동 재결합 복구(Homologous Recombination Repair, HRR) 유전자라고 한다. HRR 유전자에 발생한 유해 변이(deleterious mutation)는 상동 재결합 복구 시스템을 저해하여 유전체 불안정으로 이어진다. 특히. 난소암, 전립선암, 유방암에서 약 50%의 환자가 HRR 유전자의 유해 변이를 갖거나 유전체 불안정이 관찰되는 것으로 알려져 있다.
한편, PARP 효소는 항암제로 손상된 종양세포의 DNA 회복을 도와 항암 효과를 낮추는 역할을 한다. 암세포 내에서 PARP 활성이 증가되기 때문에 암세포의 생존 메커니즘과도 관련이 깊다. 이로 인해 PARP 저해제는 암세포의 DNA 회복을 억제하고 방사선 등과 같은 암치료의 효과를 증진시킨다. PARP 계열 치료제는 이미 시장에 신약으로 출시됐지만 적응증 확장을 위한 후속 연구가 활발하다. 현재까지는 아스트라제네카의 올라파립(olaparib)을 비롯해 테사로의 니라파립(niraparib), 클로비스 온콜로지의 루카파립(rucaparib) 등이 난소암 치료제로 활용되고 있는데, 상동 재조합 복구가 저해된 상태인 상동 재조합 결핍(Homologous Recombination Deficiency, HRD)의 양성 여부는 PARP 저해제를 적용할 수 있는 대상을 선별하는 주요 지표이지만, ClinVar 데이터베이스에서 입증되지 않거나 불확실한 변이에 대하여 병원성을 명확하게 예측하고자 하는 필요성이 지속적으로 요구되어 왔다.
본 발명의 일 양상은 a) 대상 시료에서 세포 유리 핵산(cell-free DNA)을 추출하여 상동 재조합 복구 (Homologous Recombination Repair, HRR) 유전자를 표적으로 페어-엔드 리드 시퀀스(paired-end read sequence)를 수득하는 단계; b) 상기 a) 단계에서 수득한 결과로부터 HRR 유전자의 변이 중 Base Quality(BQ)가 40 이상이고 Mapping Quality(MQ)가 50 이상인 변이를 선별하는 단계; c) 상기 b) 단계에서 선별된 변이 중 ClinVar 데이터베이스의 임상적 중요성을 기준으로 미분류된 돌연변이에 대해 MetaRNN, BayesDEL 및 EVE 분석을 수행하여 유해 변이를 분류하는 단계; 및 d) 상기 c) 단계에서 유해 변이로 분류되는 경우 상동 재조합 결핍(Homologous Recombination Deficiency, HRD) 양성으로 분류하는 단계를 포함하는 상동 재조합 결핍 정보를 제공하는 방법을 제공하는 것을 목적으로 한다.
본 발명의 다른 양상은 상동 재조합 결핍 정보를 제공하는 방법을 실행시키기 위한 프로그램이 기록되어 있는 컴퓨터에서 판독 가능한 기록 매체를 제공하는 것을 목적으로 한다.
본 발명의 일 양상은 a) 대상 시료에서 세포 유리 핵산(cell-free DNA)을 추출하여 상동 재조합 복구 (Homologous Recombination Repair, HRR) 유전자를 표적으로 페어-엔드 리드 시퀀스(paired-end read sequence)를 수득하는 단계; b) 상기 a) 단계에서 수득한 결과로부터 HRR 유전자의 변이 중 Base Quality(BQ)가 40 이상이고 Mapping Quality(MQ)가 50 이상인 변이를 선별하는 단계; c) 상기 b) 단계에서 선별된 변이 중 ClinVar 데이터베이스의 임상적 중요성을 기준으로 미분류된 돌연변이에 대해 MetaRNN, BayesDEL 및 EVE 분석을 수행하여 유해 변이를 분류하는 단계; 및 d) 상기 c) 단계에서 유해 변이로 분류되는 경우 상동 재조합 결핍(Homologous Recombination Deficiency, HRD) 양성으로 분류하는 단계를 포함하는 상동 재조합 결핍 정보를 제공하는 방법을 제공한다.
암환자의 혈액에서는 원발암 유래의 종양 유전체(circulating tumor DNA, ctDNA)와 세포유리 유전체(cell-free DNA, cfDNA)가 함께 순환하고 있는데, 특히, 상기 유전체의 양은 암환자에서 정상 대조군보다 많고, 항암치료 전후로 차이가 있으며, 치료 후 암이 재발하는 경우에는 ctDNA의 양이 증가하는 것으로 알려져 있다.
한편, 일반적으로 정상세포의 경우 DNA가 손상되었을 때 상동 재조합을 기작을 통해 복구된다. 이때 관여하는 유전자는 14개로 알려져 있으며, 이는 상동 재결합 복구(Homologous Recombination Repair, HRR) 유전자로서, ATM, BRCA1, BRCA2, BARD1, BRIP1, CDK12, CHEK1, CHEK2, FANCL, PALB2, RAD51B, RAD51C, RAD51D 및 RAD54L 유전자가 이에 해당한다. 한편, HRR 유전자에 발생한 유해 변이(deleterious mutation)는 상동 재조합 복구 시스템을 파괴하여 유전체의 불안정을 유발하게 되는데, 이러한 유해 변이 또는 이로 인한 유전체의 불안정은 난소암, 전립선암, 유방암 환자의 약 50%에서 관찰된다. 따라서, 상동 재조합 결핍의 양성 여부는 상기 암 환자에게 효과적인 치료제로 사용될 수 있는 PARP 억제제 처리를 결정하는 주요 지표일 수 있으며, 이러한 상동 재조합 결핍 여부를 확인하는 검사는 난소암, 유방암, 전립선 암종에서 임상적 효용성이 입증된 바 있다. 상동 재조합 복구 유전자 변이의 확인은 현재까지 ClinVar 데이터베이스를 주로 활용하여 판단하였으나, 이를 통해서도 입증되지 않거나 불확실한 변이가 다수 존재하였으며, 본 발명자들은 HRR 유전자 변이의 병원성 예측 알고리즘을 연구하는 과정에서 유해 변이를 분류하는 다양한 단계를 조합하여 본 발명의 상동 재조합 결핍 정보를 제공하는 방법에 대한 발명을 완성하였다.
본 명세서에서 사용되는 용어, "상동 재조합 복구 (Homologous Recombination Repair, HRR)"는 손상된 DNA가 대립 유전자를 기반으로 복구되는 기작을 의미한다.
본 명세서에서 사용되는 용어, "상동 재조합 결핍(Homologous Recombination Deficiency, HRD)"은 상동 재조합 복구가 저해된 상태를 의미한다.
본 명세서에서 사용되는 용어, "유해 변이(Deleterious mutation)"는 당해 유전자로부터 발현된 단백질의 고유한 기능의 소실을 유발하는 유전자 변이를 의미한다.
본 명세서에서 사용되는 용어, "유전체 불안정(Genomic instability)"은 세포 분열 과정에서 DNA 돌연변이 발생 경향이 늘어나는 현상을 의미한다.
본 명세서에서 사용되는 용어, "PARP 억제제(PARP inhibitor)"는 암세포의 DNA 복구 효소인 PARP1과 PARP2의 작용을 억제함으로써 암세포의 사멸을 유도하는 약물을 의미한다.
본 발명의 일 구체예에 따르면, 본 발명의 상동 재조합 결핍 정보를 제공하는 방법은 먼저 a) 대상 시료에서 세포 유리 핵산(cell-free DNA)을 추출하여 상동 재조합 복구 (Homologous Recombination Repair, HRR) 유전자를 표적으로 페어-엔드 리드 시퀀스(Paired-end read sequence)를 수득하는 단계를 수행한다.
본 명세서에서 사용되는 용어, "시료(sample)"는 페어-엔드 시퀀스(paired-end sequence)를 얻을 수 있는 조직, 세포, 전혈, 혈청, 혈장, 타액, 객담, 뇌척수액 또는 뇨와 같은 시료 등을 포함하나, 이에 제한되지 않으며, 구체적으로는 혈청, 혈장일 수 있다.
본 명세서에서 사용되는 용어, "세포 유리 핵산(cell-free DNA)" 또는 "cfDNA"는 세포의 외부(예를 들어, 체액)에서 발견되는 핵산의 단편을 의미하는 것으로, 상기 채액은 혈류, 뇌척수액, 타액 또는 소변을 포함하지만, 이에 제한되지 않는다. 상기 cfDNA는 대상으로부터(예를 들어, 대상의 세포로부터) 유래될 수 있거나, 대상 이외의 공급원으로부터(예를 들어, 바이러스 감염으로부터) 유래될 수 있다.
본 명세서에서 사용되는 용어, "페어-엔드 리드 시퀀스(Paired-end read sequence)"는 서로의 대략적인 거리를 알고 있는, 목적하는 유전자의 양 말단 (페어-엔드)에서부터 복제한 서열들로서 정방향 및 역방향으로 시퀀싱(sequencing)한 결과로서의 시퀀스를 의미한다. 페어-엔드 시퀀싱은 당업계에 공지된 방법으로 수행될 수 있으며, 바람직하게는 차세대 염기서열 분석기법(NGS)을 통해 수득될 수 있다. 상기 NGS는 대규모 병렬 서열분석(massive parallel sequencing) 또는 2세대 서열분석(second-generation sequencing)과 상호 교환적으로 사용되는 것일 수 있다. 상기 NGS는 대량의 단편의 핵산을 동시다발적으로 서열을 분석하는 기법으로서, 칩(chip) 기반 그리고 중합효소 연쇄 반응 (polymerase chain reaction: PCR) 기반 쌍 말단(paired end) 형식으로 전장 유전체를 조각 내고, 상기 조각을 혼성화 반응(hybridization)에 기초하여 초고속으로 서열 분석을 수행하는 것일 수 있다. 상기 NGS는 예를 들면, 454 플랫폼(Roche), GS FLX 티타늄, Illumina MiSeq, Illumina HiSeq, Illumina HiSeq 2500, Illumina Genome Analyzer, Solexa platform, SOLiD System(Applied Biosystems), Ion Proton(Life Technologies), Complete Genomics, Helicos Biosciences Heliscope, Pacific Biosciences의 단일 분자 실시간(SMRT??) 기술, 또는 이들의 조합에 의해 수행되는 것일 수 있다. 차세대 염기서열 분석기법의 구체적인 방법은 Metzker, M. (2010) Nature Biotechnology Reviews 11:31-46]에 기재되어 있으며, 상기 문헌은 본 명세서에 참조로서 삽입된다.
본 발명의 일 구체예에 따르면, 상기 a) 단계의 상동 재조합 복구 유전자는 ATM, BRCA1, BRCA2, BARD1, BRIP1, CDK12, CHEK1, CHEK2, FANCL, PALB2, RAD51B, RAD51C, RAD51D 및 RAD54L 중 어느 하나 이상일 수 있으며, 바람직하게는 상기 14개의 유전자 중 5개 이상, 더욱 바람직하게는 8개 이상, 가장 바람직하게는 상기 14개 유전자 전부를 표적으로 할 수 있다.
이후, 본 발명의 방법은 b) 상기 a) 단계에서 수득한 결과로부터 HRR 유전자의 변이 중 Base Quality(BQ)가 40 이상이고 Mapping Quality(MQ)가 50 이상인 변이를 선별하는 단계를 수행하게 된다.
본 단계에서 Base Quality는 표적 유전자의 염기서열이 잘못 읽혀졌을 가능성을 나타내는 정도를 의미하며, Mapping Quality는 상기 Base Quality에 의존적으로 인간 유전체 서열과 일치하는 정도를 의미하는 것으로, Base Quality 스코어는 당업계에 공지된 염기서열 분석장치의 정확성을 평가할 때 가장 많이 사용되는 기준인 Phred 방법에 의해 산출될 수 있고, Mapping Quality는 레퍼런스가 있는 서열에 시퀀스 리드를 맵핑 하기 위한 소프트웨어인 BWA(Burrows-Wheeler Aligner) MEM 방법에 의해 산출될 수 있다.
상기 방법에 의해 도출된, Base Quality가 40 이상이고, Mapping Quality가 50 이상인 변이는 본 발명에 따른 HRR 유전자의 염기 서열이가 정확하게 읽혀졌을 확률이 99.99%이며, 리드(Read)가 인간 유전체에 99.999% 정확하게 매핑 되었음을 의미한다.
다음으로, 본 발명의 방법은 c) 상기 b) 단계에서 선별된 변이 중 ClinVar 데이터베이스의 임상적 중요성을 기준으로 미분류된 돌연변이에 대해 MetaRNN, BayesDEL, 및 EVE 분석을 수행하여 유해 변이를 분류하는 단계를 수행한다.
본 단계에서 사용되는 분석 알고리즘은 3종으로, MetaRNN은 예측가능한 모든 인간 유전좌위에서 발생할 수 있는 대립유전자형에 대해 16개의 기능성 예측 점수 (SIFT, Polyphen2_HDIV, Polyphen2_HVAR, MutationAssessor, PROVEAN, VEST4, M-CAP, REVEL, MutPred, MVP, PrimateAI, DEOGEN2, CADD, fathmm-XF, Eigen and GenoCanyon), 8개의 진화적 보존 정도를 기반으로 하는 알고리즘의 예측 점수 (GERP, phyloP100way_vertebrate, phyloP30way_mammalian, phyloP17way_primate, phastCons100way_vertebrate, phastCons30way_mammalian, phastCons17way_primate, SiPhy), 그리고 정상인에서의 대립유전자 빈도에 기반한 확률 정보 (1000 Genomes Project, ExAC, gnomAD exome, and gnomAD genome)에 기반하여 산출되었다. EVE는 인간을 제외한 생물에서의 아미노산 치환의 발생 빈도를 기반으로 변이가 병원성일 확률을 계산한다. BayesDel은 나이브 베이지안 (nave Bayesian) 방식에 기반한다. 인간 유전체 내에서 발생 가능한 모든 단일 염기 및 짧은 삽입 (insertion), 삭제 (deletion)에 대한 알려진 병원성 및 비병원성 변이 정보를 학습하여 점수화한다. 세 가지 알고리즘 모두 독립성을 보장한다.
본 발명의 일 구체예에 따르면, 본 발명의 방법은 상기 c) 단계 이후, c-1) 상기 b) 단계에서 선별된 변이 중 ClinVar 데이터베이스의 임상적 중요성을 기준으로 병원성(pathogenic) 또는 유사-병원성(likely-pathogenic)으로 분류되는 경우 유해 변이로 분류하는 단계; 및 c-2) 상기 b) 단계에서 선별된 변이 중 넌센스 변이(non-sense mutation) 또는 프레임쉬프트 변이(frameshift mutation)로 분류되는 경우 유해 변이로 분류하는 단계를 더 추가하여 수행할 수 있다.
상기 c), c-1) 및 c-2) 단계는 모두 b) 단계에서 선별된 변이 중에서 유해 변이를 분류하는 단계이다.
ClinVar는 유전적 변이와 인간의 표현형(phenotype)과의 관계에 대한 데이터를 수집하여 보관하는 데이터베이스로서, 환자 샘플에서 발견된 돌연변이와 그 임상적 특징 등에 대한 데이터를 사용자로부터 제공받아 데이터를 갱신 및 유지하고 있으며, 임상적 중요성(clinical significance)도 함께 제공되어 실제적인 유전변이를 이용한 연구에 도움이 될 수 있는 정보를 제공하고 있다.
도 1은 본 발명의 일 구체예에 따른 상동 재조합 결핍 정보를 제공하는 방법의 흐름도를 나타낸 도면으로, 상기 ClinVar 데이터베이스의 임상적 중요성의 기준은 양성/유사 양성(benign/likely benign), 불확실(uncertain/conflict) 및 병원성/유사 병원성(pathogenic/likely pathogenic)으로 분류될 수 있다. 상기 b) 단계에서 선별된 HRR 유전자 변이가 양성/유사 양성으로 분류되는 경우 이는 유해 변이가 아닌 것으로 판단할 수 있고, 상기 병원성/유사 병원성으로 분류될 경우 유해 변이로 바로 분류될 수 있다. 또한, 상기 b) 단계에서 선별된 변이 중 넌센스 변이 또는 프레임쉬프트 변이와 같이 유전자의 절단(truncation)에 해당하는 경우 유해 변이로 분류될 수 있다. 한편, b) 단계에서 선별된 변이 중 ClinVar 데이터베이스의 임상적 중요성을 기준으로 미분류된 돌연변이는 불확실(uncertain/conflict)을 의미하는데, 이는 종래 기술로는 유해 변이로 분류되는 것이 아니어서 PARP 억제제 치료 대상으로 분류되지 않았다. 그러나, 본 발명에서는 상기 미분류 돌연변이들에 대해 MetaRNN, BayesDEL 및 EVE 알고리즘 분석 결과를 조합하여 유해 변이로 추가 분류할 수 있으며, 이로 인하여 PARP 억제제에 의한 치료 대상을 확장할 수 있다.
하기 표 1은 HRR 유전자 변이 중 예측 가능한 변이 대립 유전자 수를 나타낸 것이다. 14개 HRR 유전자의 SNV 및 INDEL 중 281,254개의 대립 유전자에 대해 유해 변이 여부의 예측이 가능한데, ClinVar를 기준으로 전체 변이 93.6%에 대해 예측이 가능하다.
ClinVar Clinical Significance |
All ClinVar
allele counts |
Predictable
allele counts |
Benign | 388 | 291 |
Benign/Likely_benign | 270 | 83 |
Likely_benign | 6,732 | 232 |
Pathogenic | 8,394 | 1,990 |
Pathogenic/Likely_pathogenic | 594 | 268 |
Likely_pathogenic | 543 | 178 |
Uncertain_significance | 20,328 | 19,136 |
Conflicting_interpretations_of_pathogenicity | 1,925 | 1,527 |
Conflicting_interpretations_of_pathogenicity/_risk_factor | 1 | 1 |
not_provided | 1,973 | 1,579 |
Not annotated | 255,969 | 255,969 |
Annotated allele | 297,117 | 281,254 |
하기 표 2는 MetaRNN, BayesDEL 및 EVE 알고리즘 별로 HRR 병원성(pathogenicity) 예측이 가능한 변이를 나타낸 것이다. 또한, 도 2는 각 알고리즘의 조합을 통해 HRR 병원성 예측이 가능한 변이의 수를 나타낸 것이다. 구체적으로, 표 2와 도 2는 변이의 병원성과 관련된 증거(evidence)가 전혀 없는 변이를 제외하고, ClinVar를 기준으로 pathogenic이나, benign으로 분류되지 않은 변이 중 각 알고리즘에서 병원성 여부를 예측할 수 있는 변이의 수를 나타내며, 이러한 변이는 알고리즘 도입 전 모두 VUS (Variant of Unknown Significance) 로 분류되어 해당 변이를 가진 환자는 HRD가 없음으로 분류한 것이다. 이는 병원성 예측 점수를 통해 91%의 ClinVar 미분류 변이에 대해 예측이 가능함을 의미한다.
algorithm | deleterious | tolerant | Unclassified/non-predictable | # Genes |
ClinVar | 9,521 | 7,385 | 24,057 | 14 |
MetaRNN | 7,444 | 15,293 | 18,226 | 14 |
BayesDel | 11,523 | 13,485 | 15,955 | 14 |
EVE | 3,479 | 3,996 | 33,381 | 4 |
한편, 도 3은 ClinVar 데이터베이스의 임상적 중요성을 기준으로 HRR 병원성 스코어의 분포를 나타낸 것이다. 구체적으로, 도 3은 개발된 병원성 예측 점수가 기존 ClinVar 데이터베이스의 임상적 중요성 분류에 대해 어떤 분포를 갖는가를 나타낸다. 후술되는 실험예에서 표 3의 정확도가 ClinVar 데이터베이스의 임상적 중요성을 기준으로 병원성 여부가 확인된 변이에 대한 정확도를 나타냈다면, 도3은 그 외 미분류 변이에 대한 병원성 예측점수의 분표를 보여줌으로써 미분류 종류에 따른 병원성 예측점수의 heterogeneity를 나타낸다.
본 발명의 일 구체예에 따르면, 상기 c) 단계는 MetaRNN, BayesDEL 및 EVE 분석을 통하여 산출된 점수를 합한 값이 양수인 경우 의심되는 유해 변이(suspected deleterious mutation)로, 0 또는 음수인 경우 기타 변이(other mutation)으로 분류하는 단계를 더 포함할 수 있다.
또한, 본 발명의 일 구체예에 따르면, 상기 c) 단계는 MetaRNN, BayesDEL 및 EVE 분석을 통하여 유해 변이로 분류되는 경우 +1, 내성(tolerance)으로 분류되는 경우 -1의 값을 부여할 수 있다.
마지막으로, 본 발명은 d) 상기 c), c-1) 및 c-2) 단계 중 어느 하나의 단계로부터 유해 변이로 분류되는 경우 상동 재조합 결핍 양성으로 분류하는 단계를 수행하게 된다. 즉, c) 단계의 결과만으로도 상동 재조합 결핍의 양성을 분류할 수 있으며, c), c-1) 및 c-2)의 결과의 조합에 의해서도 상동 재조합 결핍의 양성을 분류할 수 있다.
본 발명의 다른 양상은 상동 재조합 결핍 정보를 제공하는 방법을 실행시키기 위한 프로그램이 기록되어 있는 컴퓨터에서 판독 가능한 기록 매체를 제공한다.
상기 방법은 다양한 컴퓨터 수단을 통하여 판독 가능한 소프트웨어 형태로 구현되어 컴퓨터로 판독 가능한 기록매체에 기록될 수 있다. 여기서, 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록매체에 기록되는 프로그램 명령은 상기에 따른 방법을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 해당 분야의 통상의 기술자에게 공지되어 사용 가능한 것일 수도 있다.
예를 들어, 상기 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CDROM(Compact Disk Read Only Memory), DVD(Digital Video Disk)와 같은 광 기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 및 롬(ROM), 램(RAM, Random Access Memory), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 이러한 하드웨어 장치는 상기에 따른 방법의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
본 명세서에서 설명하는 주제의 구현물들은 하나 이상의 컴퓨터 프로그램 제품, 즉, 상기 방법에 따른 장치의 동작을 제어하기 위하여 혹은 이것에 의한 실행을 위하여 유형의 프로그램 저장매체 상에 인코딩된 컴퓨터 프로그램 명령에 관한 하나 이상의 모듈로서 구현될 수 있다. 컴퓨터로 판독 가능한 매체는 기계로 판독 가능한 저장 장치, 기계로 판독 가능한 저장 기판, 메모리 장치, 기계로 판독 가능한 전파형 신호에 영향을 미치는 물질의 조성물 혹은 이들 중 하나 이상의 조합일 수 있다.
상기 방법에 따른 장치에 탑재되고 상기 방법을 실행하는 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 어플리케이션, 스크립트 혹은 코드로도 알려져 있음)은 컴파일 되거나 해석된 언어나 선험적 혹은 절차적 언어를 포함하는 프로그래밍 언어의 어떠한 형태로도 작성될 수 있으며, 독립형 프로그램이나 모듈, 컴포넌트, 서브루틴 혹은 컴퓨터 환경에서 사용하기에 적합한 다른 유닛을 포함하여 어떠한 형태로도 전개될 수 있다. 컴퓨터 프로그램은 파일 시스템의 파일에 반드시 대응하는 것은 아니다. 프로그램은 요청된 프로그램에 제공되는 단일 파일 내에, 혹은 다중의 상호 작용하는 파일(예를 들어, 하나 이상의 모듈, 하위 프로그램 혹은 코드의 일부를 저장하는 파일) 내에, 혹은 다른 프로그램이나 데이터를 보유하는 파일의 일부(예를 들어, 마크업 언어 문서 내에 저장되는 하나 이상의 스크립트) 내에 저장될 수 있다. 컴퓨터 프로그램은 하나의 사이트에 위치하거나 복수의 사이트에 걸쳐서 분산되어 통신 네트워크에 의해 상호 접속된 다중 컴퓨터나 하나의 컴퓨터 상에서 실행되도록 전개될 수 있다.
본 발명의 일 실시예에 따른 상동 재조합 결핍 정보를 제공하는 방법은 종래 PARP 저해제의 적용대상으로 분류되지 않던 미분류 돌연변이들에 대해 추가적인 분석 및 분석 결과를 조합하여 유해 변이로 추가 분류하여 PARP 억제제에 의한 치료 대상을 확장할 수 있는 효과가 있다.
도 1은 본 발명의 상동 재조합 결핍 정보를 제공하는 방법의 흐름도를 나타낸 도면이다.
도 2는 43종의 알고리즘과 ClinVar 결과의 조합을 통해 HRR 병원성 예측이 가능한 변이의 수를 나타낸 그림이다.
도 3은 ClinVar 데이터베이스의 임상적 중요성을 기준으로 한 분류 별 HRR 병원성 스코어 분포를 나타낸 그래프이다.
도 4는 43종의 알고리즘에 의해 HRR 유전자를 대상으로 하여 유해 변이를 예측한 결과를 나타낸 그래프이다.
도 2는 43종의 알고리즘과 ClinVar 결과의 조합을 통해 HRR 병원성 예측이 가능한 변이의 수를 나타낸 그림이다.
도 3은 ClinVar 데이터베이스의 임상적 중요성을 기준으로 한 분류 별 HRR 병원성 스코어 분포를 나타낸 그래프이다.
도 4는 43종의 알고리즘에 의해 HRR 유전자를 대상으로 하여 유해 변이를 예측한 결과를 나타낸 그래프이다.
이하 하나 이상의 구체예를 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 하나 이상의 구체예를 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실험예: 3종의 알고리즘 조합에 의한 HRR 대상 유해 변이 예측 성능 비교
본 발명의 상동 재조합 결핍 정보를 제공하기 위한 방법으로 MetaRNN, BayesDEL, 및 EVE 3종의 알고리즘을 이용하여 유해 변이를 예측, 분류하였다.
도 4 및 표 3에서 보는 바와 같이, 3종의 알고리즘에 대하여 각각의 스코어와 본 발명의 상동 재조합 결핍 정보를 제공하기 위한 HRR 병원성 스코어를 기준으로 한 예측 결과와 pathogenic과 benign 으로 분류된 ClinVar 데이터베이스 임상적 중요성 기준을 비교하여 표 3 및 도 4와 같이 정확도 (Accuracy), 민감도 (Sensitivity), 특이도 (Specificity), 정밀도 (Precision) 및 재현율 (Recall)을 계산하였다. 그 결과, HRR 병원성 스코어 pathogenicity score에 의한 예측 변이 수가 3,042025개로 가장 많았고 정확도는 94.6%, 민감도 97.7% 및 재현율 97.7%로 다른 알고리즘들 보다 높은 성능을 보임을 확인할 수 있었다.
variable | EVE | MetaRNN | BayesDel | HRR pathogenicity score |
# of Alleles Pathogenic or benign |
322 | 879 | 3,022 | *3,025 |
Accuracy | 87.7% | 89.0% | 93.6% | 94.6% |
Sensitivity | 78.3% | 82.4% | 95.1% | 97.7% |
Specificity | 97.1% | 95.5% | 92.2% | 91.5% |
Precision | 97.3% | 91.3% | 98.3% | 97.9% |
Recall | 78.3% | 82.4% | 95.1% | 97.7% |
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
Claims (8)
- a) 대상 시료에서 세포 유리 핵산(cell-free DNA)을 추출하여 상동 재조합 복구 (Homologous Recombination Repair, HRR) 유전자를 표적으로 페어-엔드 리드 시퀀스(paired-end read sequence)를 수득하는 단계;
b) 상기 a) 단계에서 수득한 결과로부터 HRR 유전자의 변이 중 Base Quality(BQ)가 40 이상이고 Mapping Quality(MQ)가 50 이상인 변이를 선별하는 단계;
c) 상기 b) 단계에서 선별된 변이 중 ClinVar 데이터베이스의 임상적 중요성을 기준으로 미분류된 돌연변이에 대해 MetaRNN, BayesDEL 및 EVE 분석을 수행하여 유해 변이를 분류하는 단계; 및
d) 상기 c) 단계에서 유해 변이로 분류되는 경우 상동 재조합 결핍(Homologous Recombination Deficiency, HRD) 양성으로 분류하는 단계를 포함하는 상동 재조합 결핍 정보를 제공하는 방법으로
상기 c) 단계는 MetaRNN, BayesDEL 및 EVE 분석을 통하여 산출된 점수를 합한 값이 양수인 경우 의심되는 유해 변이(suspected deleterious mutation)로, 0 또는 음수인 경우 기타 변이(other mutation)으로 분류하는 단계를 더 포함하는 것인 방법.
- 제1항에 있어서,
상기 c) 단계 이후, c-1) 상기 b) 단계에서 선별된 변이 중 ClinVar 데이터베이스의 임상적 중요성을 기준으로 병원성(pathogenic) 또는 유사-병원성(likely-pathogenic)으로 분류되는 경우 유해 변이로 분류하는 단계; 및 c-2) 상기 b) 단계에서 선별된 변이 중 넌센스 변이(non-sense mutation) 또는 프레임쉬프트 변이(frameshift mutation)로 분류되는 경우 유해 변이로 분류하는 단계를 더 추가하는 것인 방법.
- 제1항에 있어서,
상기 d) 단계는 상기 c), c-1) 및 c-2) 단계 중 어느 하나의 단계로부터 유해 변이로 분류되는 경우 상동 재조합 결핍 양성으로 분류하는 단계를 포함하는 것인 방법.
- 제1항에 있어서,
상기 a) 단계의 상동 재조합 복구 유전자는 ATM, BRCA1, BRCA2, BARD1, BRIP1, CDK12, CHEK1, CHEK2, FANCL, PALB2, RAD51B, RAD51C, RAD51D 및 RAD54L 중 어느 하나 이상인 것인 방법.
- 삭제
- 제1항에 있어서,
상기 c) 단계는 MetaRNN, BayesDEL 및 EVE 분석을 통하여 유해 변이로 분류되는 경우 +1, 내성(tolerance)으로 분류되는 경우 -1의 값을 부여하는 것인 방법.
- 제1항에 있어서,
상기 방법은 상동 재조합 결핍 정보를 제공하는 장치에 의해 수행되는 것인 방법.
- 제1항 내지 제4항 및 제6항 내지 제7항 중의 어느 한 항 방법을 실행시키기 위한 프로그램이 기록되어 있는 컴퓨터에서 판독 가능한 기록 매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220085799 | 2022-07-12 | ||
KR20220085799 | 2022-07-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102518091B1 true KR102518091B1 (ko) | 2023-04-06 |
Family
ID=85918407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220115630A KR102518091B1 (ko) | 2022-07-12 | 2022-09-14 | 상동 재조합 결핍 정보를 제공하는 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102518091B1 (ko) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112397144A (zh) * | 2020-10-29 | 2021-02-23 | 无锡臻和生物科技有限公司 | 检测基因突变及表达量的方法及装置 |
KR20210052356A (ko) * | 2019-10-30 | 2021-05-10 | (재)록원바이오융합연구재단 | Parp 저해제에 대한 반응성 결정방법 |
KR20210066634A (ko) | 2019-11-28 | 2021-06-07 | 의료법인 성광의료재단 | Parp1 저해제 내성 암의 진단를 위한 조성물, 키트 및 방법 |
-
2022
- 2022-09-14 KR KR1020220115630A patent/KR102518091B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210052356A (ko) * | 2019-10-30 | 2021-05-10 | (재)록원바이오융합연구재단 | Parp 저해제에 대한 반응성 결정방법 |
KR20210066634A (ko) | 2019-11-28 | 2021-06-07 | 의료법인 성광의료재단 | Parp1 저해제 내성 암의 진단를 위한 조성물, 키트 및 방법 |
CN112397144A (zh) * | 2020-10-29 | 2021-02-23 | 无锡臻和生物科技有限公司 | 检测基因突变及表达量的方法及装置 |
Non-Patent Citations (2)
Title |
---|
Ailith Ewing 등, Clinical Cancer Research, 27, 페이지3201-3214, 2021.* * |
Chang Li 등, Preprint from bioRxiv, 2021년10월21일.* * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Steele et al. | Undifferentiated sarcomas develop through distinct evolutionary pathways | |
Roy et al. | Loss of chromatin-remodeling proteins and/or CDKN2A associates with metastasis of pancreatic neuroendocrine tumors and reduced patient survival times | |
Lang et al. | Extended molecular profiling improves stratification and prediction of survival after resection of colorectal liver metastases | |
Sausen et al. | Clinical implications of genomic alterations in the tumour and circulation of pancreatic cancer patients | |
Pan et al. | The molecular landscape of Asian breast cancers reveals clinically relevant population-specific differences | |
Schweiger et al. | Genome-wide massively parallel sequencing of formaldehyde fixed-paraffin embedded (FFPE) tumor tissues for copy-number-and mutation-analysis | |
Rospo et al. | Evolving neoantigen profiles in colorectal cancers with DNA repair defects | |
Asiedu et al. | Pathways impacted by genomic alterations in pulmonary carcinoid tumors | |
US20190318807A1 (en) | Systems and methods for ultra-fast identification and abundance estimates of microorganisms using a kmer-depth based approach and privacy-preserving protocols | |
JP2020511966A (ja) | エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法 | |
EP3739061A1 (en) | Methylation pattern analysis of haplotypes in tissues in dna mixture | |
Soultati et al. | How should clinicians address intratumour heterogeneity in clear cell renal cell carcinoma? | |
Delicat-Loembet et al. | No evidence for ape Plasmodium infections in humans in Gabon | |
US12106825B2 (en) | Computational modeling of loss of function based on allelic frequency | |
Steiert et al. | A critical spotlight on the paradigms of FFPE-DNA sequencing | |
Olmedillas‐López et al. | Liquid biopsy by NGS: differential presence of exons (DPE) in cell‐free DNA reveals different patterns in metastatic and nonmetastatic colorectal cancer | |
Wünnemann et al. | Multimodal CRISPR perturbations of GWAS loci associated with coronary artery disease in vascular endothelial cells | |
WO2023034955A1 (en) | Machine learning-based systems and methods for predicting liver cancer recurrence in liver transplant patients | |
Dalin et al. | Massive parallel sequencing questions the pathogenic role of missense variants in dilated cardiomyopathy | |
Mossanen et al. | Genomic features of muscle-invasive bladder cancer arising after prostate radiotherapy | |
KR102547885B1 (ko) | 암 연관 유전자 및 상동 재조합 복구 유전자의 비표적영역 염기서열 복제수 변이에 기반한 유전체 상흔 예측 정보를 제공하는 방법 | |
Yaegashi et al. | Frequent post-operative monitoring of colorectal cancer using individualised ctDNA validated by multiregional molecular profiling | |
Widman et al. | Ultrasensitive plasma-based monitoring of tumor burden using machine-learning-guided signal enrichment | |
Cheng et al. | Semiconductor-based DNA sequencing of histone modification states | |
KR102518091B1 (ko) | 상동 재조합 결핍 정보를 제공하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |