CN117286217A - 用于检测dna样品中基因组拷贝变化的方法 - Google Patents
用于检测dna样品中基因组拷贝变化的方法 Download PDFInfo
- Publication number
- CN117286217A CN117286217A CN202310805405.1A CN202310805405A CN117286217A CN 117286217 A CN117286217 A CN 117286217A CN 202310805405 A CN202310805405 A CN 202310805405A CN 117286217 A CN117286217 A CN 117286217A
- Authority
- CN
- China
- Prior art keywords
- dna
- sample
- region
- nucleotides
- adaptors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 210
- 239000000523 sample Substances 0.000 claims abstract description 643
- 239000000203 mixture Substances 0.000 claims abstract description 44
- 239000002773 nucleotide Substances 0.000 claims description 311
- 125000003729 nucleotide group Chemical group 0.000 claims description 311
- 239000012634 fragment Substances 0.000 claims description 176
- 238000012163 sequencing technique Methods 0.000 claims description 78
- 108090000623 proteins and genes Proteins 0.000 claims description 64
- 238000012360 testing method Methods 0.000 claims description 61
- 230000003321 amplification Effects 0.000 claims description 57
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 57
- 238000012252 genetic analysis Methods 0.000 claims description 52
- 230000002068 genetic effect Effects 0.000 claims description 46
- 102000040430 polynucleotide Human genes 0.000 claims description 43
- 108091033319 polynucleotide Proteins 0.000 claims description 43
- 239000002157 polynucleotide Substances 0.000 claims description 43
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 39
- 230000004536 DNA copy number loss Effects 0.000 claims description 30
- 201000010099 disease Diseases 0.000 claims description 27
- 208000037051 Chromosomal Instability Diseases 0.000 claims description 18
- 230000035945 sensitivity Effects 0.000 claims description 17
- 230000008685 targeting Effects 0.000 claims description 13
- 230000002759 chromosomal effect Effects 0.000 claims description 12
- 239000013610 patient sample Substances 0.000 claims description 12
- 238000012408 PCR amplification Methods 0.000 claims description 10
- 239000003298 DNA probe Substances 0.000 claims description 5
- 210000003917 human chromosome Anatomy 0.000 claims description 4
- 208000031448 Genomic Instability Diseases 0.000 claims description 3
- 230000035772 mutation Effects 0.000 abstract description 26
- 230000037430 deletion Effects 0.000 abstract description 22
- 238000012217 deletion Methods 0.000 abstract description 22
- 210000004369 blood Anatomy 0.000 abstract description 16
- 239000008280 blood Substances 0.000 abstract description 16
- 239000012472 biological sample Substances 0.000 abstract description 13
- 230000005945 translocation Effects 0.000 abstract description 7
- 230000001413 cellular effect Effects 0.000 abstract description 6
- 230000007614 genetic variation Effects 0.000 abstract description 5
- 108020004414 DNA Proteins 0.000 description 502
- 108091028043 Nucleic acid sequence Proteins 0.000 description 75
- 206010028980 Neoplasm Diseases 0.000 description 56
- 238000004458 analytical method Methods 0.000 description 52
- 108091092356 cellular DNA Proteins 0.000 description 47
- 210000004027 cell Anatomy 0.000 description 43
- 238000003556 assay Methods 0.000 description 42
- 108091034117 Oligonucleotide Proteins 0.000 description 35
- 241000700605 Viruses Species 0.000 description 35
- 210000001519 tissue Anatomy 0.000 description 33
- 201000011510 cancer Diseases 0.000 description 28
- -1 ATR Proteins 0.000 description 25
- 150000007523 nucleic acids Chemical group 0.000 description 22
- 108700028369 Alleles Proteins 0.000 description 21
- 208000026350 Inborn Genetic disease Diseases 0.000 description 21
- 208000016361 genetic disease Diseases 0.000 description 21
- 230000003902 lesion Effects 0.000 description 21
- 238000012544 monitoring process Methods 0.000 description 21
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 17
- 210000000349 chromosome Anatomy 0.000 description 17
- 238000001514 detection method Methods 0.000 description 15
- 238000011282 treatment Methods 0.000 description 15
- 238000009396 hybridization Methods 0.000 description 14
- 102000039446 nucleic acids Human genes 0.000 description 14
- 108020004707 nucleic acids Proteins 0.000 description 14
- 230000008439 repair process Effects 0.000 description 14
- 102000004190 Enzymes Human genes 0.000 description 13
- 108090000790 Enzymes Proteins 0.000 description 13
- 238000001574 biopsy Methods 0.000 description 13
- 230000008859 change Effects 0.000 description 13
- 208000035475 disorder Diseases 0.000 description 12
- 238000013467 fragmentation Methods 0.000 description 12
- 238000006062 fragmentation reaction Methods 0.000 description 12
- 238000001712 DNA sequencing Methods 0.000 description 10
- 108060002716 Exonuclease Proteins 0.000 description 10
- 102000013165 exonuclease Human genes 0.000 description 10
- 230000004927 fusion Effects 0.000 description 10
- 102000012410 DNA Ligases Human genes 0.000 description 9
- 108010061982 DNA Ligases Proteins 0.000 description 9
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 9
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 9
- 238000003776 cleavage reaction Methods 0.000 description 9
- 230000002255 enzymatic effect Effects 0.000 description 9
- 238000005259 measurement Methods 0.000 description 9
- 210000002381 plasma Anatomy 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 238000003753 real-time PCR Methods 0.000 description 9
- 230000007017 scission Effects 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 101150029129 AR gene Proteins 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 7
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 7
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 7
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 7
- 206010060862 Prostate cancer Diseases 0.000 description 7
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 230000001605 fetal effect Effects 0.000 description 7
- 238000010606 normalization Methods 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 7
- 244000052769 pathogen Species 0.000 description 7
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 6
- 102000002804 Ataxia Telangiectasia Mutated Proteins Human genes 0.000 description 6
- 108700020463 BRCA1 Proteins 0.000 description 6
- 102000036365 BRCA1 Human genes 0.000 description 6
- 206010068051 Chimerism Diseases 0.000 description 6
- 206010039491 Sarcoma Diseases 0.000 description 6
- 238000004873 anchoring Methods 0.000 description 6
- 238000007622 bioinformatic analysis Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 208000032839 leukemia Diseases 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 230000001717 pathogenic effect Effects 0.000 description 6
- 239000013074 reference sample Substances 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000010008 shearing Methods 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 102000052609 BRCA2 Human genes 0.000 description 5
- 108700020462 BRCA2 Proteins 0.000 description 5
- 101150008921 Brca2 gene Proteins 0.000 description 5
- 108091092878 Microsatellite Proteins 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 101710163270 Nuclease Proteins 0.000 description 5
- 101150080074 TP53 gene Proteins 0.000 description 5
- 230000027455 binding Effects 0.000 description 5
- 238000003766 bioinformatics method Methods 0.000 description 5
- 238000002651 drug therapy Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000003205 genotyping method Methods 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 108700025694 p53 Genes Proteins 0.000 description 5
- 230000008707 rearrangement Effects 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 108091035707 Consensus sequence Proteins 0.000 description 4
- CMSMOCZEIVJLDB-UHFFFAOYSA-N Cyclophosphamide Chemical compound ClCCN(CCCl)P1(=O)NCCCO1 CMSMOCZEIVJLDB-UHFFFAOYSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 206010061192 Haemorrhagic fever Diseases 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 4
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 4
- 208000036878 aneuploidy Diseases 0.000 description 4
- 231100001075 aneuploidy Toxicity 0.000 description 4
- 239000013060 biological fluid Substances 0.000 description 4
- 238000007385 chemical modification Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000011331 genomic analysis Methods 0.000 description 4
- 208000006454 hepatitis Diseases 0.000 description 4
- 231100000283 hepatitis Toxicity 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 238000000527 sonication Methods 0.000 description 4
- 208000011580 syndromic disease Diseases 0.000 description 4
- WYWHKKSPHMUBEB-UHFFFAOYSA-N tioguanine Chemical compound N1C(N)=NC(=S)C2=C1N=CN2 WYWHKKSPHMUBEB-UHFFFAOYSA-N 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 102100033350 ATP-dependent translocase ABCB1 Human genes 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- 102100029363 Cytochrome P450 2C19 Human genes 0.000 description 3
- 102100021704 Cytochrome P450 2D6 Human genes 0.000 description 3
- 102100039205 Cytochrome P450 3A4 Human genes 0.000 description 3
- 102100039208 Cytochrome P450 3A5 Human genes 0.000 description 3
- 230000004544 DNA amplification Effects 0.000 description 3
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 3
- 102100022334 Dihydropyrimidine dehydrogenase [NADP(+)] Human genes 0.000 description 3
- 102000009095 Fanconi Anemia Complementation Group A protein Human genes 0.000 description 3
- 108010087740 Fanconi Anemia Complementation Group A protein Proteins 0.000 description 3
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 3
- OVBPIULPVIDEAO-LBPRGKRZSA-N Folic acid Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 3
- 108091092584 GDNA Proteins 0.000 description 3
- 102000007648 Glutathione S-Transferase pi Human genes 0.000 description 3
- 108010007355 Glutathione S-Transferase pi Proteins 0.000 description 3
- 102100039999 Histone deacetylase 2 Human genes 0.000 description 3
- 101000919361 Homo sapiens Cytochrome P450 2C19 Proteins 0.000 description 3
- 101000896586 Homo sapiens Cytochrome P450 2D6 Proteins 0.000 description 3
- 101000745711 Homo sapiens Cytochrome P450 3A4 Proteins 0.000 description 3
- 101000745710 Homo sapiens Cytochrome P450 3A5 Proteins 0.000 description 3
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 description 3
- 101001035011 Homo sapiens Histone deacetylase 2 Proteins 0.000 description 3
- 101000973778 Homo sapiens NAD(P)H dehydrogenase [quinone] 1 Proteins 0.000 description 3
- 101000777277 Homo sapiens Serine/threonine-protein kinase Chk2 Proteins 0.000 description 3
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 3
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 3
- 102100029684 Methylenetetrahydrofolate reductase Human genes 0.000 description 3
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 3
- 102100022365 NAD(P)H dehydrogenase [quinone] 1 Human genes 0.000 description 3
- 208000003019 Neurofibromatosis 1 Diseases 0.000 description 3
- 108010085793 Neurofibromin 1 Proteins 0.000 description 3
- 102000007530 Neurofibromin 1 Human genes 0.000 description 3
- 239000012661 PARP inhibitor Substances 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- 229940121906 Poly ADP ribose polymerase inhibitor Drugs 0.000 description 3
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 3
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 3
- 102100022807 Potassium voltage-gated channel subfamily H member 2 Human genes 0.000 description 3
- 102100029753 Reduced folate transporter Human genes 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 description 3
- FOCVUCIESVLUNU-UHFFFAOYSA-N Thiotepa Chemical compound C1CN1P(N1CC1)(=S)N1CC1 FOCVUCIESVLUNU-UHFFFAOYSA-N 0.000 description 3
- 229930003316 Vitamin D Natural products 0.000 description 3
- QYSXJUFSXHHAJI-XFEUOLMDSA-N Vitamin D3 Natural products C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C/C=C1\C[C@@H](O)CCC1=C QYSXJUFSXHHAJI-XFEUOLMDSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 210000004381 amniotic fluid Anatomy 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 238000011319 anticancer therapy Methods 0.000 description 3
- 239000002246 antineoplastic agent Substances 0.000 description 3
- 229940041181 antineoplastic drug Drugs 0.000 description 3
- 210000001742 aqueous humor Anatomy 0.000 description 3
- 239000000090 biomarker Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 150000001768 cations Chemical class 0.000 description 3
- 230000001364 causal effect Effects 0.000 description 3
- 230000006037 cell lysis Effects 0.000 description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 3
- 229960004630 chlorambucil Drugs 0.000 description 3
- JCKYGMPEJWAADB-UHFFFAOYSA-N chlorambucil Chemical compound OC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 JCKYGMPEJWAADB-UHFFFAOYSA-N 0.000 description 3
- 229960004397 cyclophosphamide Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 229960002949 fluorouracil Drugs 0.000 description 3
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 3
- 206010022000 influenza Diseases 0.000 description 3
- 210000002751 lymph Anatomy 0.000 description 3
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 3
- 229960000485 methotrexate Drugs 0.000 description 3
- 229960001156 mitoxantrone Drugs 0.000 description 3
- KKZJGLLVHKMTCM-UHFFFAOYSA-N mitoxantrone Chemical compound O=C1C2=C(O)C=CC(O)=C2C(=O)C2=C1C(NCCNCCO)=CC=C2NCCNCCO KKZJGLLVHKMTCM-UHFFFAOYSA-N 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 210000005259 peripheral blood Anatomy 0.000 description 3
- 239000011886 peripheral blood Substances 0.000 description 3
- 238000006116 polymerization reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 210000002307 prostate Anatomy 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 210000003296 saliva Anatomy 0.000 description 3
- 210000000582 semen Anatomy 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 210000004243 sweat Anatomy 0.000 description 3
- 229960001196 thiotepa Drugs 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 241001529453 unidentified herpesvirus Species 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- 235000019166 vitamin D Nutrition 0.000 description 3
- 239000011710 vitamin D Substances 0.000 description 3
- 150000003710 vitamin D derivatives Chemical class 0.000 description 3
- 229940046008 vitamin d Drugs 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- UOELMDIOCSFSEN-FVZZCGLESA-N 7-Dehydrositosterol Chemical compound C1([C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)C=C[C@H](C)C(C)C)=CC=C1C[C@@H](O)CCC1=C.C1[C@@H](O)CCC2(C)C(CC[C@@]3([C@@H]([C@H](C)C=C[C@H](C)C(C)C)CC[C@H]33)C)C3=CC=C21 UOELMDIOCSFSEN-FVZZCGLESA-N 0.000 description 2
- 101150023956 ALK gene Proteins 0.000 description 2
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 2
- 241001092084 Agrimonia Species 0.000 description 2
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 2
- 102100034042 Alcohol dehydrogenase 1C Human genes 0.000 description 2
- 102100040069 Aldehyde dehydrogenase 1A1 Human genes 0.000 description 2
- 108091023043 Alu Element Proteins 0.000 description 2
- 102100030988 Angiotensin-converting enzyme Human genes 0.000 description 2
- 108090000448 Aryl Hydrocarbon Receptors Proteins 0.000 description 2
- 102100026792 Aryl hydrocarbon receptor Human genes 0.000 description 2
- 101150065175 Atm gene Proteins 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 2
- 102100040794 Beta-1 adrenergic receptor Human genes 0.000 description 2
- 102100039705 Beta-2 adrenergic receptor Human genes 0.000 description 2
- 102000006734 Beta-Globulins Human genes 0.000 description 2
- 108010087504 Beta-Globulins Proteins 0.000 description 2
- 241000713704 Bovine immunodeficiency virus Species 0.000 description 2
- 235000003351 Brassica cretica Nutrition 0.000 description 2
- 235000003343 Brassica rupestris Nutrition 0.000 description 2
- 241000219193 Brassicaceae Species 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 241000713756 Caprine arthritis encephalitis virus Species 0.000 description 2
- 201000009030 Carcinoma Diseases 0.000 description 2
- 102000006378 Catechol O-methyltransferase Human genes 0.000 description 2
- 108020002739 Catechol O-methyltransferase Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 2
- 102000002237 Cytochrome P-450 CYP2A6 Human genes 0.000 description 2
- 108010000080 Cytochrome P-450 CYP2A6 Proteins 0.000 description 2
- 102100038739 Cytochrome P450 2B6 Human genes 0.000 description 2
- 102100029358 Cytochrome P450 2C9 Human genes 0.000 description 2
- 102100031461 Cytochrome P450 2J2 Human genes 0.000 description 2
- 102100020756 D(2) dopamine receptor Human genes 0.000 description 2
- 108010092160 Dactinomycin Proteins 0.000 description 2
- 201000010374 Down Syndrome Diseases 0.000 description 2
- AOJJSUZBOXZQNB-TZSSRYMLSA-N Doxorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1 AOJJSUZBOXZQNB-TZSSRYMLSA-N 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- 241000713730 Equine infectious anemia virus Species 0.000 description 2
- 208000006168 Ewing Sarcoma Diseases 0.000 description 2
- 108091008794 FGF receptors Proteins 0.000 description 2
- 102000016627 Fanconi Anemia Complementation Group N protein Human genes 0.000 description 2
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 description 2
- 102100034553 Fanconi anemia group J protein Human genes 0.000 description 2
- 241000713800 Feline immunodeficiency virus Species 0.000 description 2
- 241000711950 Filoviridae Species 0.000 description 2
- 108090000652 Flap endonucleases Proteins 0.000 description 2
- 102000004150 Flap endonucleases Human genes 0.000 description 2
- 241000223218 Fusarium Species 0.000 description 2
- 208000032087 Hereditary Leber Optic Atrophy Diseases 0.000 description 2
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 2
- 101000780463 Homo sapiens Alcohol dehydrogenase 1C Proteins 0.000 description 2
- 101000890570 Homo sapiens Aldehyde dehydrogenase 1A1 Proteins 0.000 description 2
- 101000892264 Homo sapiens Beta-1 adrenergic receptor Proteins 0.000 description 2
- 101000959437 Homo sapiens Beta-2 adrenergic receptor Proteins 0.000 description 2
- 101000957383 Homo sapiens Cytochrome P450 2B6 Proteins 0.000 description 2
- 101000919359 Homo sapiens Cytochrome P450 2C9 Proteins 0.000 description 2
- 101000941723 Homo sapiens Cytochrome P450 2J2 Proteins 0.000 description 2
- 101000931901 Homo sapiens D(2) dopamine receptor Proteins 0.000 description 2
- 101000902632 Homo sapiens Dihydropyrimidine dehydrogenase [NADP(+)] Proteins 0.000 description 2
- 101000587058 Homo sapiens Methylenetetrahydrofolate reductase Proteins 0.000 description 2
- 101001047090 Homo sapiens Potassium voltage-gated channel subfamily H member 2 Proteins 0.000 description 2
- 101001135385 Homo sapiens Prostacyclin synthase Proteins 0.000 description 2
- 101000694017 Homo sapiens Sodium channel protein type 5 subunit alpha Proteins 0.000 description 2
- 101000836291 Homo sapiens Solute carrier organic anion transporter family member 1B1 Proteins 0.000 description 2
- 102000004286 Hydroxymethylglutaryl CoA Reductases Human genes 0.000 description 2
- 108090000895 Hydroxymethylglutaryl CoA Reductases Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 201000000639 Leber hereditary optic neuropathy Diseases 0.000 description 2
- 241000712899 Lymphocytic choriomeningitis mammarenavirus Species 0.000 description 2
- 102100033342 Lysosomal acid glucosylceramidase Human genes 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 108010047230 Member 1 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- 241000235395 Mucor Species 0.000 description 2
- 208000034578 Multiple myelomas Diseases 0.000 description 2
- 101100015391 Mus musculus Ralgds gene Proteins 0.000 description 2
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 2
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 2
- 208000014767 Myeloproliferative disease Diseases 0.000 description 2
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 2
- 102100037600 P2Y purinoceptor 1 Human genes 0.000 description 2
- 102100026171 P2Y purinoceptor 12 Human genes 0.000 description 2
- 201000009928 Patau syndrome Diseases 0.000 description 2
- ZRWPUFFVAOMMNM-UHFFFAOYSA-N Patulin Chemical compound OC1OCC=C2OC(=O)C=C12 ZRWPUFFVAOMMNM-UHFFFAOYSA-N 0.000 description 2
- 108090000882 Peptidyl-Dipeptidase A Proteins 0.000 description 2
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 2
- 102100033075 Prostacyclin synthase Human genes 0.000 description 2
- 108010028935 Purinergic P2Y1 Receptors Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 201000000582 Retinoblastoma Diseases 0.000 description 2
- 108091006778 SLC19A1 Proteins 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 102100027198 Sodium channel protein type 5 subunit alpha Human genes 0.000 description 2
- 102100027233 Solute carrier organic anion transporter family member 1B1 Human genes 0.000 description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 description 2
- NKANXQFJJICGDU-QPLCGJKRSA-N Tamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 NKANXQFJJICGDU-QPLCGJKRSA-N 0.000 description 2
- 208000024770 Thyroid neoplasm Diseases 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 208000037280 Trisomy Diseases 0.000 description 2
- 206010044686 Trisomy 13 Diseases 0.000 description 2
- 208000006284 Trisomy 13 Syndrome Diseases 0.000 description 2
- 241000700647 Variola virus Species 0.000 description 2
- 241000711975 Vesicular stomatitis virus Species 0.000 description 2
- RJURFGZVJUQBHK-UHFFFAOYSA-N actinomycin D Natural products CC1OC(=O)C(C(C)C)N(C)C(=O)CN(C)C(=O)C2CCCN2C(=O)C(C(C)C)NC(=O)C1NC(=O)C1=C(N)C(=O)C(C)=C2OC(C(C)=CC=C3C(=O)NC4C(=O)NC(C(N5CCCC5C(=O)N(C)CC(=O)N(C)C(C(C)C)C(=O)OC4C)=O)C(C)C)=C3N=C21 RJURFGZVJUQBHK-UHFFFAOYSA-N 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000002738 chelating agent Substances 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 230000008711 chromosomal rearrangement Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000013068 control sample Substances 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 102000038379 digestive enzymes Human genes 0.000 description 2
- 108091007734 digestive enzymes Proteins 0.000 description 2
- 206010014599 encephalitis Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 229960000304 folic acid Drugs 0.000 description 2
- 235000019152 folic acid Nutrition 0.000 description 2
- 239000011724 folic acid Substances 0.000 description 2
- CHPZKNULDCNCBW-UHFFFAOYSA-N gallium nitrate Chemical compound [Ga+3].[O-][N+]([O-])=O.[O-][N+]([O-])=O.[O-][N+]([O-])=O CHPZKNULDCNCBW-UHFFFAOYSA-N 0.000 description 2
- 206010017758 gastric cancer Diseases 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 229960001101 ifosfamide Drugs 0.000 description 2
- HOMGKSMUEGBAAB-UHFFFAOYSA-N ifosfamide Chemical compound ClCCNP1(=O)OCCCN1CCCl HOMGKSMUEGBAAB-UHFFFAOYSA-N 0.000 description 2
- 239000002955 immunomodulating agent Substances 0.000 description 2
- 229940121354 immunomodulator Drugs 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000011528 liquid biopsy Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 229960001428 mercaptopurine Drugs 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229960004857 mitomycin Drugs 0.000 description 2
- 235000010460 mustard Nutrition 0.000 description 2
- 229960005419 nitrogen Drugs 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 2
- 201000008968 osteosarcoma Diseases 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 229960004622 raloxifene Drugs 0.000 description 2
- GZUITABIAKMVPG-UHFFFAOYSA-N raloxifene Chemical compound C1=CC(O)=CC=C1C1=C(C(=O)C=2C=CC(OCCN3CCCCC3)=CC=2)C2=CC=C(O)C=C2S1 GZUITABIAKMVPG-UHFFFAOYSA-N 0.000 description 2
- 201000011549 stomach cancer Diseases 0.000 description 2
- 230000009044 synergistic interaction Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 201000002510 thyroid cancer Diseases 0.000 description 2
- 229960003087 tioguanine Drugs 0.000 description 2
- 208000009999 tuberous sclerosis Diseases 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 150000003722 vitamin derivatives Chemical class 0.000 description 2
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 1
- DENYZIUJOTUUNY-MRXNPFEDSA-N (2R)-14-fluoro-2-methyl-6,9,10,19-tetrazapentacyclo[14.2.1.02,6.08,18.012,17]nonadeca-1(18),8,12(17),13,15-pentaen-11-one Chemical compound FC=1C=C2C=3C=4C(CN5[C@@](C4NC3C1)(CCC5)C)=NNC2=O DENYZIUJOTUUNY-MRXNPFEDSA-N 0.000 description 1
- VXAGJYXIHQKJIP-REOHCLBHSA-N (2S)-2-azido-3-hydroxypropanoic acid Chemical compound [N+](=[N-])=N[C@@H](CO)C(=O)O VXAGJYXIHQKJIP-REOHCLBHSA-N 0.000 description 1
- CGMTUJFWROPELF-YPAAEMCBSA-N (3E,5S)-5-[(2S)-butan-2-yl]-3-(1-hydroxyethylidene)pyrrolidine-2,4-dione Chemical compound CC[C@H](C)[C@@H]1NC(=O)\C(=C(/C)O)C1=O CGMTUJFWROPELF-YPAAEMCBSA-N 0.000 description 1
- XRBSKUSTLXISAB-XVVDYKMHSA-N (5r,6r,7r,8r)-8-hydroxy-7-(hydroxymethyl)-5-(3,4,5-trimethoxyphenyl)-5,6,7,8-tetrahydrobenzo[f][1,3]benzodioxole-6-carboxylic acid Chemical compound COC1=C(OC)C(OC)=CC([C@@H]2C3=CC=4OCOC=4C=C3[C@H](O)[C@@H](CO)[C@@H]2C(O)=O)=C1 XRBSKUSTLXISAB-XVVDYKMHSA-N 0.000 description 1
- XRBSKUSTLXISAB-UHFFFAOYSA-N (7R,7'R,8R,8'R)-form-Podophyllic acid Natural products COC1=C(OC)C(OC)=CC(C2C3=CC=4OCOC=4C=C3C(O)C(CO)C2C(O)=O)=C1 XRBSKUSTLXISAB-UHFFFAOYSA-N 0.000 description 1
- IEXUMDBQLIVNHZ-YOUGDJEHSA-N (8s,11r,13r,14s,17s)-11-[4-(dimethylamino)phenyl]-17-hydroxy-17-(3-hydroxypropyl)-13-methyl-1,2,6,7,8,11,12,14,15,16-decahydrocyclopenta[a]phenanthren-3-one Chemical compound C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(O)CCCO)[C@@]2(C)C1 IEXUMDBQLIVNHZ-YOUGDJEHSA-N 0.000 description 1
- FDKXTQMXEQVLRF-ZHACJKMWSA-N (E)-dacarbazine Chemical compound CN(C)\N=N\c1[nH]cnc1C(N)=O FDKXTQMXEQVLRF-ZHACJKMWSA-N 0.000 description 1
- LKJPYSCBVHEWIU-KRWDZBQOSA-N (R)-bicalutamide Chemical compound C([C@@](O)(C)C(=O)NC=1C=C(C(C#N)=CC=1)C(F)(F)F)S(=O)(=O)C1=CC=C(F)C=C1 LKJPYSCBVHEWIU-KRWDZBQOSA-N 0.000 description 1
- CDKIEBFIMCSCBB-UHFFFAOYSA-N 1-(6,7-dimethoxy-3,4-dihydro-1h-isoquinolin-2-yl)-3-(1-methyl-2-phenylpyrrolo[2,3-b]pyridin-3-yl)prop-2-en-1-one;hydrochloride Chemical compound Cl.C1C=2C=C(OC)C(OC)=CC=2CCN1C(=O)C=CC(C1=CC=CN=C1N1C)=C1C1=CC=CC=C1 CDKIEBFIMCSCBB-UHFFFAOYSA-N 0.000 description 1
- HDCUSMZVZWLDRZ-UHFFFAOYSA-N 1-benzyl-2-methylhydrazine Chemical compound CNNCC1=CC=CC=C1 HDCUSMZVZWLDRZ-UHFFFAOYSA-N 0.000 description 1
- 102100026205 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase gamma-1 Human genes 0.000 description 1
- CTLOSZHDGZLOQE-UHFFFAOYSA-N 14-methoxy-9-[(4-methylpiperazin-1-yl)methyl]-9,19-diazapentacyclo[10.7.0.02,6.07,11.013,18]nonadeca-1(12),2(6),7(11),13(18),14,16-hexaene-8,10-dione Chemical compound O=C1C2=C3C=4C(OC)=CC=CC=4NC3=C3CCCC3=C2C(=O)N1CN1CCN(C)CC1 CTLOSZHDGZLOQE-UHFFFAOYSA-N 0.000 description 1
- BTOTXLJHDSNXMW-POYBYMJQSA-N 2,3-dideoxyuridine Chemical compound O1[C@H](CO)CC[C@@H]1N1C(=O)NC(=O)C=C1 BTOTXLJHDSNXMW-POYBYMJQSA-N 0.000 description 1
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 1
- CTRPRMNBTVRDFH-UHFFFAOYSA-N 2-n-methyl-1,3,5-triazine-2,4,6-triamine Chemical compound CNC1=NC(N)=NC(N)=N1 CTRPRMNBTVRDFH-UHFFFAOYSA-N 0.000 description 1
- NDMPLJNOPCLANR-UHFFFAOYSA-N 3,4-dihydroxy-15-(4-hydroxy-18-methoxycarbonyl-5,18-seco-ibogamin-18-yl)-16-methoxy-1-methyl-6,7-didehydro-aspidospermidine-3-carboxylic acid methyl ester Natural products C1C(CC)(O)CC(CC2(C(=O)OC)C=3C(=CC4=C(C56C(C(C(O)C7(CC)C=CCN(C67)CC5)(O)C(=O)OC)N4C)C=3)OC)CN1CCC1=C2NC2=CC=CC=C12 NDMPLJNOPCLANR-UHFFFAOYSA-N 0.000 description 1
- GSCPDZHWVNUUFI-UHFFFAOYSA-N 3-aminobenzamide Chemical compound NC(=O)C1=CC=CC(N)=C1 GSCPDZHWVNUUFI-UHFFFAOYSA-N 0.000 description 1
- AOJJSUZBOXZQNB-VTZDEGQISA-N 4'-epidoxorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@@H](O)[C@H](C)O1 AOJJSUZBOXZQNB-VTZDEGQISA-N 0.000 description 1
- DODQJNMQWMSYGS-QPLCGJKRSA-N 4-[(z)-1-[4-[2-(dimethylamino)ethoxy]phenyl]-1-phenylbut-1-en-2-yl]phenol Chemical compound C=1C=C(O)C=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 DODQJNMQWMSYGS-QPLCGJKRSA-N 0.000 description 1
- TVZGACDUOSZQKY-LBPRGKRZSA-N 4-aminofolic acid Chemical compound C1=NC2=NC(N)=NC(N)=C2N=C1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 TVZGACDUOSZQKY-LBPRGKRZSA-N 0.000 description 1
- 208000026817 47,XYY syndrome Diseases 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- IDPUKCWIGUEADI-UHFFFAOYSA-N 5-[bis(2-chloroethyl)amino]uracil Chemical compound ClCCN(CCCl)C1=CNC(=O)NC1=O IDPUKCWIGUEADI-UHFFFAOYSA-N 0.000 description 1
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- WYXSYVWAUAUWLD-SHUUEZRQSA-N 6-azauridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=N1 WYXSYVWAUAUWLD-SHUUEZRQSA-N 0.000 description 1
- VVIAGPKUTFNRDU-UHFFFAOYSA-N 6S-folinic acid Natural products C1NC=2NC(N)=NC(=O)C=2N(C=O)C1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 VVIAGPKUTFNRDU-UHFFFAOYSA-N 0.000 description 1
- ZGXJTSGNIOSYLO-UHFFFAOYSA-N 88755TAZ87 Chemical compound NCC(=O)CCC(O)=O ZGXJTSGNIOSYLO-UHFFFAOYSA-N 0.000 description 1
- 102100038776 ADP-ribosylation factor-related protein 1 Human genes 0.000 description 1
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 1
- 101150037123 APOE gene Proteins 0.000 description 1
- 102100034580 AT-rich interactive domain-containing protein 1A Human genes 0.000 description 1
- 102100028161 ATP-binding cassette sub-family C member 2 Human genes 0.000 description 1
- 102100028163 ATP-binding cassette sub-family C member 4 Human genes 0.000 description 1
- 102100024643 ATP-binding cassette sub-family D member 1 Human genes 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 102100035886 Adenine DNA glycosylase Human genes 0.000 description 1
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 1
- 102100024439 Adhesion G protein-coupled receptor A2 Human genes 0.000 description 1
- 201000011452 Adrenoleukodystrophy Diseases 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- CEIZFXOZIQNICU-UHFFFAOYSA-N Alternaria alternata Crofton-weed toxin Natural products CCC(C)C1NC(=O)C(C(C)=O)=C1O CEIZFXOZIQNICU-UHFFFAOYSA-N 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 229930183010 Amphotericin Natural products 0.000 description 1
- QGGFZZLFKABGNL-UHFFFAOYSA-N Amphotericin A Natural products OC1C(N)C(O)C(C)OC1OC1C=CC=CC=CC=CCCC=CC=CC(C)C(O)C(C)C(C)OC(=O)CC(O)CC(O)CCC(O)C(O)CC(O)CC(O)(CC(O)C2C(O)=O)OC2C1 QGGFZZLFKABGNL-UHFFFAOYSA-N 0.000 description 1
- 208000009575 Angelman syndrome Diseases 0.000 description 1
- 206010002383 Angina Pectoris Diseases 0.000 description 1
- 201000003076 Angiosarcoma Diseases 0.000 description 1
- 244000105975 Antidesma platyphyllum Species 0.000 description 1
- 102100029470 Apolipoprotein E Human genes 0.000 description 1
- 102100021569 Apoptosis regulator Bcl-2 Human genes 0.000 description 1
- 102000001381 Arachidonate 5-Lipoxygenase Human genes 0.000 description 1
- 108010093579 Arachidonate 5-lipoxygenase Proteins 0.000 description 1
- 241000712891 Arenavirus Species 0.000 description 1
- 102100029361 Aromatase Human genes 0.000 description 1
- 108010078554 Aromatase Proteins 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 102000004000 Aurora Kinase A Human genes 0.000 description 1
- 108090000461 Aurora Kinase A Proteins 0.000 description 1
- 102100032306 Aurora kinase B Human genes 0.000 description 1
- 208000010061 Autosomal Dominant Polycystic Kidney Diseases 0.000 description 1
- NOWKCMXCCJGMRR-UHFFFAOYSA-N Aziridine Chemical compound C1CN1 NOWKCMXCCJGMRR-UHFFFAOYSA-N 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 102100021631 B-cell lymphoma 6 protein Human genes 0.000 description 1
- 108091012583 BCL2 Proteins 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010004146 Basal cell carcinoma Diseases 0.000 description 1
- 102100023932 Bcl-2-like protein 2 Human genes 0.000 description 1
- 102100021334 Bcl-2-related protein A1 Human genes 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 102100022595 Broad substrate specificity ATP-binding cassette transporter ABCG2 Human genes 0.000 description 1
- COVZYZSDYWQREU-UHFFFAOYSA-N Busulfan Chemical compound CS(=O)(=O)OCCCCOS(C)(=O)=O COVZYZSDYWQREU-UHFFFAOYSA-N 0.000 description 1
- 101710098191 C-4 methylsterol oxidase ERG25 Proteins 0.000 description 1
- 102100034808 CCAAT/enhancer-binding protein alpha Human genes 0.000 description 1
- 102100036364 Cadherin-2 Human genes 0.000 description 1
- 102100029761 Cadherin-5 Human genes 0.000 description 1
- 101100029886 Caenorhabditis elegans lov-1 gene Proteins 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- GAGWJHPBXLXJQN-UORFTKCHSA-N Capecitabine Chemical compound C1=C(F)C(NC(=O)OCCCCC)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](C)O1 GAGWJHPBXLXJQN-UORFTKCHSA-N 0.000 description 1
- GAGWJHPBXLXJQN-UHFFFAOYSA-N Capecitabine Natural products C1=C(F)C(NC(=O)OCCCCC)=NC(=O)N1C1C(O)C(O)C(C)O1 GAGWJHPBXLXJQN-UHFFFAOYSA-N 0.000 description 1
- AOCCBINRVIKJHY-UHFFFAOYSA-N Carmofur Chemical compound CCCCCCNC(=O)N1C=C(F)C(=O)NC1=O AOCCBINRVIKJHY-UHFFFAOYSA-N 0.000 description 1
- DLGOEMSEDOSKAD-UHFFFAOYSA-N Carmustine Chemical compound ClCCNC(=O)N(N=O)CCCl DLGOEMSEDOSKAD-UHFFFAOYSA-N 0.000 description 1
- 102100024965 Caspase recruitment domain-containing protein 11 Human genes 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- 102100037182 Cation-independent mannose-6-phosphate receptor Human genes 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 description 1
- 108091007854 Cdh1/Fizzy-related Proteins 0.000 description 1
- 102000038594 Cdh1/Fizzy-related Human genes 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- JWBOIMRXGHLCPP-UHFFFAOYSA-N Chloditan Chemical compound C=1C=CC=C(Cl)C=1C(C(Cl)Cl)C1=CC=C(Cl)C=C1 JWBOIMRXGHLCPP-UHFFFAOYSA-N 0.000 description 1
- 108010062745 Chloride Channels Proteins 0.000 description 1
- 102000011045 Chloride Channels Human genes 0.000 description 1
- 208000005243 Chondrosarcoma Diseases 0.000 description 1
- 201000009047 Chordoma Diseases 0.000 description 1
- 208000006332 Choriocarcinoma Diseases 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 241000222290 Cladosporium Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 102100037529 Coagulation factor V Human genes 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 241000223203 Coccidioides Species 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 108010043471 Core Binding Factor Alpha 2 Subunit Proteins 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 201000003075 Crimean-Congo hemorrhagic fever Diseases 0.000 description 1
- 102100029375 Crk-like protein Human genes 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- 108010058546 Cyclin D1 Proteins 0.000 description 1
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 1
- 108010025468 Cyclin-Dependent Kinase 6 Proteins 0.000 description 1
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 1
- 102000009503 Cyclin-Dependent Kinase Inhibitor p18 Human genes 0.000 description 1
- 108010009367 Cyclin-Dependent Kinase Inhibitor p18 Proteins 0.000 description 1
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 1
- 102100026804 Cyclin-dependent kinase 6 Human genes 0.000 description 1
- 102100024456 Cyclin-dependent kinase 8 Human genes 0.000 description 1
- PMATZTZNYRCHOR-CGLBZJNRSA-N Cyclosporin A Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O PMATZTZNYRCHOR-CGLBZJNRSA-N 0.000 description 1
- 108010036949 Cyclosporine Proteins 0.000 description 1
- 108010076010 Cystathionine beta-lyase Proteins 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 108010000561 Cytochrome P-450 CYP2C8 Proteins 0.000 description 1
- 102100027417 Cytochrome P450 1B1 Human genes 0.000 description 1
- 102100029359 Cytochrome P450 2C8 Human genes 0.000 description 1
- 102100038497 Cytokine receptor-like factor 2 Human genes 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 description 1
- 230000009946 DNA mutation Effects 0.000 description 1
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 1
- 102100024607 DNA topoisomerase 1 Human genes 0.000 description 1
- 102100037799 DNA-binding protein Ikaros Human genes 0.000 description 1
- 102100022204 DNA-dependent protein kinase catalytic subunit Human genes 0.000 description 1
- 102100022283 Delta-1-pyrroline-5-carboxylate dehydrogenase, mitochondrial Human genes 0.000 description 1
- 241000725619 Dengue virus Species 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 101100226017 Dictyostelium discoideum repD gene Proteins 0.000 description 1
- LTMHDMANZUZIPE-AMTYYWEZSA-N Digoxin Natural products O([C@H]1[C@H](C)O[C@H](O[C@@H]2C[C@@H]3[C@@](C)([C@@H]4[C@H]([C@]5(O)[C@](C)([C@H](O)C4)[C@H](C4=CC(=O)OC4)CC5)CC3)CC2)C[C@@H]1O)[C@H]1O[C@H](C)[C@@H](O[C@H]2O[C@@H](C)[C@H](O)[C@@H](O)C2)[C@@H](O)C1 LTMHDMANZUZIPE-AMTYYWEZSA-N 0.000 description 1
- 108010066455 Dihydrouracil Dehydrogenase (NADP) Proteins 0.000 description 1
- 102100031480 Dual specificity mitogen-activated protein kinase kinase 1 Human genes 0.000 description 1
- 102100023266 Dual specificity mitogen-activated protein kinase kinase 2 Human genes 0.000 description 1
- 102100023274 Dual specificity mitogen-activated protein kinase kinase 4 Human genes 0.000 description 1
- 241001520695 Duvenhage lyssavirus Species 0.000 description 1
- 102100035813 E3 ubiquitin-protein ligase CBL Human genes 0.000 description 1
- 102000012199 E3 ubiquitin-protein ligase Mdm2 Human genes 0.000 description 1
- 108050002772 E3 ubiquitin-protein ligase Mdm2 Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101150016325 EPHA3 gene Proteins 0.000 description 1
- 101150105460 ERCC2 gene Proteins 0.000 description 1
- 102100039563 ETS translocation variant 1 Human genes 0.000 description 1
- 102100039578 ETS translocation variant 4 Human genes 0.000 description 1
- 102100039577 ETS translocation variant 5 Human genes 0.000 description 1
- 241000710945 Eastern equine encephalitis virus Species 0.000 description 1
- 201000011001 Ebola Hemorrhagic Fever Diseases 0.000 description 1
- 208000030820 Ebola disease Diseases 0.000 description 1
- 201000006360 Edwards syndrome Diseases 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 201000009051 Embryonal Carcinoma Diseases 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 102100021771 Endoplasmic reticulum mannosyl-oligosaccharide 1,2-alpha-mannosidase Human genes 0.000 description 1
- SAMRUMKYXPVKPA-VFKOLLTISA-N Enocitabine Chemical compound O=C1N=C(NC(=O)CCCCCCCCCCCCCCCCCCCCC)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 SAMRUMKYXPVKPA-VFKOLLTISA-N 0.000 description 1
- 206010014950 Eosinophilia Diseases 0.000 description 1
- 206010014967 Ependymoma Diseases 0.000 description 1
- 108010055323 EphB4 Receptor Proteins 0.000 description 1
- 101150025643 Epha5 gene Proteins 0.000 description 1
- 241001455610 Ephemerovirus Species 0.000 description 1
- 102100030324 Ephrin type-A receptor 3 Human genes 0.000 description 1
- 102100021605 Ephrin type-A receptor 5 Human genes 0.000 description 1
- 102100021604 Ephrin type-A receptor 6 Human genes 0.000 description 1
- 102100021606 Ephrin type-A receptor 7 Human genes 0.000 description 1
- 102100030779 Ephrin type-B receptor 1 Human genes 0.000 description 1
- 102100031983 Ephrin type-B receptor 4 Human genes 0.000 description 1
- 102100031984 Ephrin type-B receptor 6 Human genes 0.000 description 1
- HTIJFSOGRVMCQR-UHFFFAOYSA-N Epirubicin Natural products COc1cccc2C(=O)c3c(O)c4CC(O)(CC(OC5CC(N)C(=O)C(C)O5)c4c(O)c3C(=O)c12)C(=O)CO HTIJFSOGRVMCQR-UHFFFAOYSA-N 0.000 description 1
- 102100025403 Epoxide hydrolase 1 Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 102100031690 Erythroid transcription factor Human genes 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 229930189413 Esperamicin Natural products 0.000 description 1
- 208000032027 Essential Thrombocythemia Diseases 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- 102100029951 Estrogen receptor beta Human genes 0.000 description 1
- 241000579695 European bat 1 lyssavirus Species 0.000 description 1
- 241000579698 European bat 2 lyssavirus Species 0.000 description 1
- HKVAMNSJSFKALM-GKUWKFKPSA-N Everolimus Chemical compound C1C[C@@H](OCCO)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 HKVAMNSJSFKALM-GKUWKFKPSA-N 0.000 description 1
- 101710105178 F-box/WD repeat-containing protein 7 Proteins 0.000 description 1
- 102100028138 F-box/WD repeat-containing protein 7 Human genes 0.000 description 1
- 108010014172 Factor V Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102000044168 Fibroblast Growth Factor Receptor Human genes 0.000 description 1
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 description 1
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 description 1
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 1
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 1
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 description 1
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 description 1
- 102100027844 Fibroblast growth factor receptor 4 Human genes 0.000 description 1
- 102100032596 Fibrocystin Human genes 0.000 description 1
- 201000008808 Fibrosarcoma Diseases 0.000 description 1
- 241000710781 Flaviviridae Species 0.000 description 1
- MPJKWIXIYCLVCU-UHFFFAOYSA-N Folinic acid Natural products NC1=NC2=C(N(C=O)C(CNc3ccc(cc3)C(=O)NC(CCC(=O)O)CC(=O)O)CN2)C(=O)N1 MPJKWIXIYCLVCU-UHFFFAOYSA-N 0.000 description 1
- 102100027579 Forkhead box protein P4 Human genes 0.000 description 1
- 208000001914 Fragile X syndrome Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 102100024165 G1/S-specific cyclin-D1 Human genes 0.000 description 1
- 102100024185 G1/S-specific cyclin-D2 Human genes 0.000 description 1
- 102100037859 G1/S-specific cyclin-D3 Human genes 0.000 description 1
- 102100037858 G1/S-specific cyclin-E1 Human genes 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 102100030708 GTPase KRas Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 101001077417 Gallus gallus Potassium voltage-gated channel subfamily H member 6 Proteins 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 102100035184 General transcription and DNA repair factor IIH helicase subunit XPD Human genes 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- BLCLNMBMMGCOAS-URPVMXJPSA-N Goserelin Chemical compound C([C@@H](C(=O)N[C@H](COC(C)(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(=O)NNC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 BLCLNMBMMGCOAS-URPVMXJPSA-N 0.000 description 1
- 108010069236 Goserelin Proteins 0.000 description 1
- 102100025334 Guanine nucleotide-binding protein G(q) subunit alpha Human genes 0.000 description 1
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 1
- 102100036738 Guanine nucleotide-binding protein subunit alpha-11 Human genes 0.000 description 1
- 102100040735 Guanylate cyclase soluble subunit alpha-2 Human genes 0.000 description 1
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 description 1
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 description 1
- 102100028971 HLA class I histocompatibility antigen, C alpha chain Human genes 0.000 description 1
- 108010075704 HLA-A Antigens Proteins 0.000 description 1
- 108010058607 HLA-B Antigens Proteins 0.000 description 1
- 108010052199 HLA-C Antigens Proteins 0.000 description 1
- 108010010378 HLA-DP Antigens Proteins 0.000 description 1
- 102000015789 HLA-DP Antigens Human genes 0.000 description 1
- 108010062347 HLA-DQ Antigens Proteins 0.000 description 1
- 108010058597 HLA-DR Antigens Proteins 0.000 description 1
- 102000006354 HLA-DR Antigens Human genes 0.000 description 1
- 102100031561 Hamartin Human genes 0.000 description 1
- 241000150562 Hantaan orthohantavirus Species 0.000 description 1
- 102100034051 Heat shock protein HSP 90-alpha Human genes 0.000 description 1
- 208000001258 Hemangiosarcoma Diseases 0.000 description 1
- 208000032982 Hemorrhagic Fever with Renal Syndrome Diseases 0.000 description 1
- 241000893570 Hendra henipavirus Species 0.000 description 1
- 208000005331 Hepatitis D Diseases 0.000 description 1
- 208000037262 Hepatitis delta Diseases 0.000 description 1
- 208000007514 Herpes zoster Diseases 0.000 description 1
- 102000016871 Hexosaminidase A Human genes 0.000 description 1
- 108010053317 Hexosaminidase A Proteins 0.000 description 1
- 102100035108 High affinity nerve growth factor receptor Human genes 0.000 description 1
- 102100022103 Histone-lysine N-methyltransferase 2A Human genes 0.000 description 1
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 description 1
- 102100039489 Histone-lysine N-methyltransferase, H3 lysine-79 specific Human genes 0.000 description 1
- 241000228402 Histoplasma Species 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 102100039541 Homeobox protein Hox-A3 Human genes 0.000 description 1
- 102100027893 Homeobox protein Nkx-2.1 Human genes 0.000 description 1
- 101000691599 Homo sapiens 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase gamma-1 Proteins 0.000 description 1
- 101000809413 Homo sapiens ADP-ribosylation factor-related protein 1 Proteins 0.000 description 1
- 101000779641 Homo sapiens ALK tyrosine kinase receptor Proteins 0.000 description 1
- 101000924266 Homo sapiens AT-rich interactive domain-containing protein 1A Proteins 0.000 description 1
- 101000986629 Homo sapiens ATP-binding cassette sub-family C member 4 Proteins 0.000 description 1
- 101001017818 Homo sapiens ATP-dependent translocase ABCB1 Proteins 0.000 description 1
- 101000614701 Homo sapiens ATP-sensitive inward rectifier potassium channel 11 Proteins 0.000 description 1
- 101001000351 Homo sapiens Adenine DNA glycosylase Proteins 0.000 description 1
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 1
- 101000833358 Homo sapiens Adhesion G protein-coupled receptor A2 Proteins 0.000 description 1
- 101000780453 Homo sapiens All-trans-retinol dehydrogenase [NAD(+)] ADH1B Proteins 0.000 description 1
- 101000798306 Homo sapiens Aurora kinase B Proteins 0.000 description 1
- 101000971234 Homo sapiens B-cell lymphoma 6 protein Proteins 0.000 description 1
- 101000904691 Homo sapiens Bcl-2-like protein 2 Proteins 0.000 description 1
- 101000894929 Homo sapiens Bcl-2-related protein A1 Proteins 0.000 description 1
- 101000945515 Homo sapiens CCAAT/enhancer-binding protein alpha Proteins 0.000 description 1
- 101000714537 Homo sapiens Cadherin-2 Proteins 0.000 description 1
- 101000899459 Homo sapiens Cadherin-20 Proteins 0.000 description 1
- 101000794587 Homo sapiens Cadherin-5 Proteins 0.000 description 1
- 101000761179 Homo sapiens Caspase recruitment domain-containing protein 11 Proteins 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101001028831 Homo sapiens Cation-independent mannose-6-phosphate receptor Proteins 0.000 description 1
- 101000919315 Homo sapiens Crk-like protein Proteins 0.000 description 1
- 101000980937 Homo sapiens Cyclin-dependent kinase 8 Proteins 0.000 description 1
- 101000725164 Homo sapiens Cytochrome P450 1B1 Proteins 0.000 description 1
- 101000956427 Homo sapiens Cytokine receptor-like factor 2 Proteins 0.000 description 1
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 description 1
- 101000830681 Homo sapiens DNA topoisomerase 1 Proteins 0.000 description 1
- 101000599038 Homo sapiens DNA-binding protein Ikaros Proteins 0.000 description 1
- 101000619536 Homo sapiens DNA-dependent protein kinase catalytic subunit Proteins 0.000 description 1
- 101000755868 Homo sapiens Delta-1-pyrroline-5-carboxylate dehydrogenase, mitochondrial Proteins 0.000 description 1
- 101001115395 Homo sapiens Dual specificity mitogen-activated protein kinase kinase 4 Proteins 0.000 description 1
- 101000813729 Homo sapiens ETS translocation variant 1 Proteins 0.000 description 1
- 101000813747 Homo sapiens ETS translocation variant 4 Proteins 0.000 description 1
- 101000813745 Homo sapiens ETS translocation variant 5 Proteins 0.000 description 1
- 101000615944 Homo sapiens Endoplasmic reticulum mannosyl-oligosaccharide 1,2-alpha-mannosidase Proteins 0.000 description 1
- 101000967216 Homo sapiens Eosinophil cationic protein Proteins 0.000 description 1
- 101000898696 Homo sapiens Ephrin type-A receptor 6 Proteins 0.000 description 1
- 101000898708 Homo sapiens Ephrin type-A receptor 7 Proteins 0.000 description 1
- 101001064150 Homo sapiens Ephrin type-B receptor 1 Proteins 0.000 description 1
- 101001064451 Homo sapiens Ephrin type-B receptor 6 Proteins 0.000 description 1
- 101001077852 Homo sapiens Epoxide hydrolase 1 Proteins 0.000 description 1
- 101001066268 Homo sapiens Erythroid transcription factor Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101001010910 Homo sapiens Estrogen receptor beta Proteins 0.000 description 1
- 101000917134 Homo sapiens Fibroblast growth factor receptor 4 Proteins 0.000 description 1
- 101000730595 Homo sapiens Fibrocystin Proteins 0.000 description 1
- 101000861403 Homo sapiens Forkhead box protein P4 Proteins 0.000 description 1
- 101000980741 Homo sapiens G1/S-specific cyclin-D2 Proteins 0.000 description 1
- 101000738559 Homo sapiens G1/S-specific cyclin-D3 Proteins 0.000 description 1
- 101000738568 Homo sapiens G1/S-specific cyclin-E1 Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101000857888 Homo sapiens Guanine nucleotide-binding protein G(q) subunit alpha Proteins 0.000 description 1
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 1
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 1
- 101001072407 Homo sapiens Guanine nucleotide-binding protein subunit alpha-11 Proteins 0.000 description 1
- 101001038749 Homo sapiens Guanylate cyclase soluble subunit alpha-2 Proteins 0.000 description 1
- 101000795643 Homo sapiens Hamartin Proteins 0.000 description 1
- 101001016865 Homo sapiens Heat shock protein HSP 90-alpha Proteins 0.000 description 1
- 101000596894 Homo sapiens High affinity nerve growth factor receptor Proteins 0.000 description 1
- 101001045846 Homo sapiens Histone-lysine N-methyltransferase 2A Proteins 0.000 description 1
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 1
- 101000963360 Homo sapiens Histone-lysine N-methyltransferase, H3 lysine-79 specific Proteins 0.000 description 1
- 101000962622 Homo sapiens Homeobox protein Hox-A3 Proteins 0.000 description 1
- 101000632178 Homo sapiens Homeobox protein Nkx-2.1 Proteins 0.000 description 1
- 101100508538 Homo sapiens IKBKE gene Proteins 0.000 description 1
- 101001056180 Homo sapiens Induced myeloid leukemia cell differentiation protein Mcl-1 Proteins 0.000 description 1
- 101001056794 Homo sapiens Inosine triphosphate pyrophosphatase Proteins 0.000 description 1
- 101001077600 Homo sapiens Insulin receptor substrate 2 Proteins 0.000 description 1
- 101001034652 Homo sapiens Insulin-like growth factor 1 receptor Proteins 0.000 description 1
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 101000917858 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-A Proteins 0.000 description 1
- 101001051093 Homo sapiens Low-density lipoprotein receptor Proteins 0.000 description 1
- 101000984620 Homo sapiens Low-density lipoprotein receptor-related protein 1B Proteins 0.000 description 1
- 101001043562 Homo sapiens Low-density lipoprotein receptor-related protein 2 Proteins 0.000 description 1
- 101000582631 Homo sapiens Menin Proteins 0.000 description 1
- 101000954986 Homo sapiens Merlin Proteins 0.000 description 1
- 101000653374 Homo sapiens Methylcytosine dioxygenase TET2 Proteins 0.000 description 1
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 1
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 1
- 101001109719 Homo sapiens Nucleophosmin Proteins 0.000 description 1
- 101000807596 Homo sapiens Orotidine 5'-phosphate decarboxylase Proteins 0.000 description 1
- 101001120086 Homo sapiens P2Y purinoceptor 12 Proteins 0.000 description 1
- 101000601724 Homo sapiens Paired box protein Pax-5 Proteins 0.000 description 1
- 101001120056 Homo sapiens Phosphatidylinositol 3-kinase regulatory subunit alpha Proteins 0.000 description 1
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 1
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 1
- 101000620009 Homo sapiens Polyunsaturated fatty acid 5-lipoxygenase Proteins 0.000 description 1
- 101000808592 Homo sapiens Probable ubiquitin carboxyl-terminal hydrolase FAF-X Proteins 0.000 description 1
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 1
- 101000585703 Homo sapiens Protein L-Myc Proteins 0.000 description 1
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 description 1
- 101000602015 Homo sapiens Protocadherin gamma-B4 Proteins 0.000 description 1
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 1
- 101000798015 Homo sapiens RAC-beta serine/threonine-protein kinase Proteins 0.000 description 1
- 101000798007 Homo sapiens RAC-gamma serine/threonine-protein kinase Proteins 0.000 description 1
- 101000712530 Homo sapiens RAF proto-oncogene serine/threonine-protein kinase Proteins 0.000 description 1
- 101100087590 Homo sapiens RICTOR gene Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000932478 Homo sapiens Receptor-type tyrosine-protein kinase FLT3 Proteins 0.000 description 1
- 101000606537 Homo sapiens Receptor-type tyrosine-protein phosphatase delta Proteins 0.000 description 1
- 101000727836 Homo sapiens Reduced folate transporter Proteins 0.000 description 1
- 101000742859 Homo sapiens Retinoblastoma-associated protein Proteins 0.000 description 1
- 101001112293 Homo sapiens Retinoic acid receptor alpha Proteins 0.000 description 1
- 101000927796 Homo sapiens Rho guanine nucleotide exchange factor 7 Proteins 0.000 description 1
- 101000771237 Homo sapiens Serine/threonine-protein kinase A-Raf Proteins 0.000 description 1
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 1
- 101000777293 Homo sapiens Serine/threonine-protein kinase Chk1 Proteins 0.000 description 1
- 101000987315 Homo sapiens Serine/threonine-protein kinase PAK 3 Proteins 0.000 description 1
- 101000628562 Homo sapiens Serine/threonine-protein kinase STK11 Proteins 0.000 description 1
- 101000826399 Homo sapiens Sulfotransferase 1A1 Proteins 0.000 description 1
- 101000713600 Homo sapiens T-box transcription factor TBX22 Proteins 0.000 description 1
- 101000799388 Homo sapiens Thiopurine S-methyltransferase Proteins 0.000 description 1
- 101000799466 Homo sapiens Thrombopoietin receptor Proteins 0.000 description 1
- 101000702545 Homo sapiens Transcription activator BRG1 Proteins 0.000 description 1
- 101000813738 Homo sapiens Transcription factor ETV6 Proteins 0.000 description 1
- 101000664703 Homo sapiens Transcription factor SOX-10 Proteins 0.000 description 1
- 101000687905 Homo sapiens Transcription factor SOX-2 Proteins 0.000 description 1
- 101001010792 Homo sapiens Transcriptional regulator ERG Proteins 0.000 description 1
- 101000638154 Homo sapiens Transmembrane protease serine 2 Proteins 0.000 description 1
- 101000795659 Homo sapiens Tuberin Proteins 0.000 description 1
- 101000648507 Homo sapiens Tumor necrosis factor receptor superfamily member 14 Proteins 0.000 description 1
- 101000823316 Homo sapiens Tyrosine-protein kinase ABL1 Proteins 0.000 description 1
- 101000823271 Homo sapiens Tyrosine-protein kinase ABL2 Proteins 0.000 description 1
- 101000997835 Homo sapiens Tyrosine-protein kinase JAK1 Proteins 0.000 description 1
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 1
- 101000934996 Homo sapiens Tyrosine-protein kinase JAK3 Proteins 0.000 description 1
- 101001087416 Homo sapiens Tyrosine-protein phosphatase non-receptor type 11 Proteins 0.000 description 1
- 101000851018 Homo sapiens Vascular endothelial growth factor receptor 1 Proteins 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 1
- 241001502974 Human gammaherpesvirus 8 Species 0.000 description 1
- 241000701027 Human herpesvirus 6 Species 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- VSNHCAURESNICA-UHFFFAOYSA-N Hydroxyurea Chemical compound NC(=O)NO VSNHCAURESNICA-UHFFFAOYSA-N 0.000 description 1
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- FDGQSTZJBFJUBT-UHFFFAOYSA-N Hypoxanthine Natural products O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 1
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 1
- XDXDZDZNSLXDNA-TZNDIEGXSA-N Idarubicin Chemical compound C1[C@H](N)[C@H](O)[C@H](C)O[C@H]1O[C@@H]1C2=C(O)C(C(=O)C3=CC=CC=C3C3=O)=C3C(O)=C2C[C@@](O)(C(C)=O)C1 XDXDZDZNSLXDNA-TZNDIEGXSA-N 0.000 description 1
- XDXDZDZNSLXDNA-UHFFFAOYSA-N Idarubicin Natural products C1C(N)C(O)C(C)OC1OC1C2=C(O)C(C(=O)C3=CC=CC=C3C3=O)=C3C(O)=C2CC(O)(C(C)=O)C1 XDXDZDZNSLXDNA-UHFFFAOYSA-N 0.000 description 1
- 102100026539 Induced myeloid leukemia cell differentiation protein Mcl-1 Human genes 0.000 description 1
- 201000003803 Inflammatory myofibroblastic tumor Diseases 0.000 description 1
- 206010067917 Inflammatory myofibroblastic tumour Diseases 0.000 description 1
- 208000002979 Influenza in Birds Diseases 0.000 description 1
- 102100027004 Inhibin beta A chain Human genes 0.000 description 1
- 102100021857 Inhibitor of nuclear factor kappa-B kinase subunit epsilon Human genes 0.000 description 1
- 102100025458 Inosine triphosphate pyrophosphatase Human genes 0.000 description 1
- 102100025092 Insulin receptor substrate 2 Human genes 0.000 description 1
- 102100039688 Insulin-like growth factor 1 receptor Human genes 0.000 description 1
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 1
- 102000017792 KCNJ11 Human genes 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- JLERVPBPJHKRBJ-UHFFFAOYSA-N LY 117018 Chemical compound C1=CC(O)=CC=C1C1=C(C(=O)C=2C=CC(OCCN3CCCC3)=CC=2)C2=CC=C(O)C=C2S1 JLERVPBPJHKRBJ-UHFFFAOYSA-N 0.000 description 1
- 206010023927 Lassa fever Diseases 0.000 description 1
- 208000018142 Leiomyosarcoma Diseases 0.000 description 1
- 229920001491 Lentinan Polymers 0.000 description 1
- 208000009625 Lesch-Nyhan syndrome Diseases 0.000 description 1
- 108010000817 Leuprolide Proteins 0.000 description 1
- GQYIWUVLTXOXAJ-UHFFFAOYSA-N Lomustine Chemical compound ClCCN(N=O)C(=O)NC1CCCCC1 GQYIWUVLTXOXAJ-UHFFFAOYSA-N 0.000 description 1
- 102100029193 Low affinity immunoglobulin gamma Fc region receptor III-A Human genes 0.000 description 1
- 102100027121 Low-density lipoprotein receptor-related protein 1B Human genes 0.000 description 1
- 102100021922 Low-density lipoprotein receptor-related protein 2 Human genes 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010025219 Lymphangioma Diseases 0.000 description 1
- 108010068342 MAP Kinase Kinase 1 Proteins 0.000 description 1
- 108010068353 MAP Kinase Kinase 2 Proteins 0.000 description 1
- 102000017274 MDM4 Human genes 0.000 description 1
- 108050005300 MDM4 Proteins 0.000 description 1
- 102000046961 MRE11 Homologue Human genes 0.000 description 1
- 108700019589 MRE11 Homologue Proteins 0.000 description 1
- 108700012912 MYCN Proteins 0.000 description 1
- 101150022024 MYCN gene Proteins 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 1
- 208000000932 Marburg Virus Disease Diseases 0.000 description 1
- 201000011013 Marburg hemorrhagic fever Diseases 0.000 description 1
- 208000007054 Medullary Carcinoma Diseases 0.000 description 1
- 208000000172 Medulloblastoma Diseases 0.000 description 1
- 229920000877 Melamine resin Polymers 0.000 description 1
- 108010007013 Melanocyte-Stimulating Hormones Proteins 0.000 description 1
- 108010049137 Member 1 Subfamily D ATP Binding Cassette Transporter Proteins 0.000 description 1
- 108010090306 Member 2 Subfamily G ATP Binding Cassette Transporter Proteins 0.000 description 1
- 102100030550 Menin Human genes 0.000 description 1
- 102100037106 Merlin Human genes 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- 102100030803 Methylcytosine dioxygenase TET2 Human genes 0.000 description 1
- 108010030837 Methylenetetrahydrofolate Reductase (NADPH2) Proteins 0.000 description 1
- 108010050345 Microphthalmia-Associated Transcription Factor Proteins 0.000 description 1
- 102100030157 Microphthalmia-associated transcription factor Human genes 0.000 description 1
- 241001480037 Microsporum Species 0.000 description 1
- VFKZTMPDYBFSTM-KVTDHHQDSA-N Mitobronitol Chemical compound BrC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CBr VFKZTMPDYBFSTM-KVTDHHQDSA-N 0.000 description 1
- 229930192392 Mitomycin Natural products 0.000 description 1
- 241000725171 Mokola lyssavirus Species 0.000 description 1
- 102100025751 Mothers against decapentaplegic homolog 2 Human genes 0.000 description 1
- 101710143123 Mothers against decapentaplegic homolog 2 Proteins 0.000 description 1
- 102100025748 Mothers against decapentaplegic homolog 3 Human genes 0.000 description 1
- 101710143111 Mothers against decapentaplegic homolog 3 Proteins 0.000 description 1
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 1
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 1
- 208000003445 Mouth Neoplasms Diseases 0.000 description 1
- 101150097381 Mtor gene Proteins 0.000 description 1
- 108010066419 Multidrug Resistance-Associated Protein 2 Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100013186 Mus musculus Fmr1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 102000013609 MutL Protein Homolog 1 Human genes 0.000 description 1
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 206010028561 Myeloid metaplasia Diseases 0.000 description 1
- 206010068871 Myotonic dystrophy Diseases 0.000 description 1
- 108700026495 N-Myc Proto-Oncogene Proteins 0.000 description 1
- ZDZOTLJHXYCWBA-VCVYQWHSSA-N N-debenzoyl-N-(tert-butoxycarbonyl)-10-deacetyltaxol Chemical compound O([C@H]1[C@H]2[C@@](C([C@H](O)C3=C(C)[C@@H](OC(=O)[C@H](O)[C@@H](NC(=O)OC(C)(C)C)C=4C=CC=CC=4)C[C@]1(O)C3(C)C)=O)(C)[C@@H](O)C[C@H]1OC[C@]12OC(=O)C)C(=O)C1=CC=CC=C1 ZDZOTLJHXYCWBA-VCVYQWHSSA-N 0.000 description 1
- 102100030124 N-myc proto-oncogene protein Human genes 0.000 description 1
- 102100029166 NT-3 growth factor receptor Human genes 0.000 description 1
- UFWIBTONFRDIAS-UHFFFAOYSA-N Naphthalene Chemical compound C1=CC=CC2=CC=CC=C21 UFWIBTONFRDIAS-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 208000005890 Neuroma Diseases 0.000 description 1
- 108090000770 Neuropilin-2 Proteins 0.000 description 1
- 241000526636 Nipah henipavirus Species 0.000 description 1
- 102000001759 Notch1 Receptor Human genes 0.000 description 1
- 108010029755 Notch1 Receptor Proteins 0.000 description 1
- 102100022678 Nucleophosmin Human genes 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 201000010133 Oligodendroglioma Diseases 0.000 description 1
- 229930187135 Olivomycin Natural products 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 1
- 229930012538 Paclitaxel Natural products 0.000 description 1
- 102100037504 Paired box protein Pax-5 Human genes 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- SHGAZHPCJJPHSC-UHFFFAOYSA-N Panrexin Chemical compound OC(=O)C=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-UHFFFAOYSA-N 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 241000711504 Paramyxoviridae Species 0.000 description 1
- 108010065129 Patched-1 Receptor Proteins 0.000 description 1
- 102000012850 Patched-1 Receptor Human genes 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- 201000011252 Phenylketonuria Diseases 0.000 description 1
- 102100026169 Phosphatidylinositol 3-kinase regulatory subunit alpha Human genes 0.000 description 1
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 1
- 208000007641 Pinealoma Diseases 0.000 description 1
- KMSKQZKKOZQFFG-HSUXVGOQSA-N Pirarubicin Chemical compound O([C@H]1[C@@H](N)C[C@@H](O[C@H]1C)O[C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1CCCCO1 KMSKQZKKOZQFFG-HSUXVGOQSA-N 0.000 description 1
- 206010035148 Plague Diseases 0.000 description 1
- 108010051742 Platelet-Derived Growth Factor beta Receptor Proteins 0.000 description 1
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 1
- 102100026547 Platelet-derived growth factor receptor beta Human genes 0.000 description 1
- 241000233870 Pneumocystis Species 0.000 description 1
- 102100022364 Polyunsaturated fatty acid 5-lipoxygenase Human genes 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 201000010769 Prader-Willi syndrome Diseases 0.000 description 1
- 102100027467 Pro-opiomelanocortin Human genes 0.000 description 1
- 102100038603 Probable ubiquitin carboxyl-terminal hydrolase FAF-X Human genes 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 1
- 102100036197 Prosaposin Human genes 0.000 description 1
- 101710152403 Prosaposin Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100030128 Protein L-Myc Human genes 0.000 description 1
- 102100034433 Protein kinase C-binding protein NELL2 Human genes 0.000 description 1
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 description 1
- 102100037554 Protocadherin gamma-B4 Human genes 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 108010014270 Purinergic P2Y12 Receptors Proteins 0.000 description 1
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 1
- 102100032315 RAC-beta serine/threonine-protein kinase Human genes 0.000 description 1
- 102100032314 RAC-gamma serine/threonine-protein kinase Human genes 0.000 description 1
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 102000004229 RNA-binding protein EWS Human genes 0.000 description 1
- 108090000740 RNA-binding protein EWS Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 102000046941 Rapamycin-Insensitive Companion of mTOR Human genes 0.000 description 1
- 108700019586 Rapamycin-Insensitive Companion of mTOR Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 102100029986 Receptor tyrosine-protein kinase erbB-3 Human genes 0.000 description 1
- 101710100969 Receptor tyrosine-protein kinase erbB-3 Proteins 0.000 description 1
- 102100029981 Receptor tyrosine-protein kinase erbB-4 Human genes 0.000 description 1
- 101710100963 Receptor tyrosine-protein kinase erbB-4 Proteins 0.000 description 1
- 102100020718 Receptor-type tyrosine-protein kinase FLT3 Human genes 0.000 description 1
- 102100039666 Receptor-type tyrosine-protein phosphatase delta Human genes 0.000 description 1
- 108010029031 Regulatory-Associated Protein of mTOR Proteins 0.000 description 1
- 102100040969 Regulatory-associated protein of mTOR Human genes 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 102100038042 Retinoblastoma-associated protein Human genes 0.000 description 1
- 102100023606 Retinoic acid receptor alpha Human genes 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000713124 Rift Valley fever virus Species 0.000 description 1
- 241000702670 Rotavirus Species 0.000 description 1
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 1
- 108091006735 SLC22A2 Proteins 0.000 description 1
- 108091006730 SLCO1B3 Proteins 0.000 description 1
- 108700028341 SMARCB1 Proteins 0.000 description 1
- 101150008214 SMARCB1 gene Proteins 0.000 description 1
- 102000001332 SRC Human genes 0.000 description 1
- 108060006706 SRC Proteins 0.000 description 1
- 102100025746 SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily B member 1 Human genes 0.000 description 1
- 208000004337 Salivary Gland Neoplasms Diseases 0.000 description 1
- 206010061934 Salivary gland cancer Diseases 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 201000010208 Seminoma Diseases 0.000 description 1
- 102100029437 Serine/threonine-protein kinase A-Raf Human genes 0.000 description 1
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 1
- 102100031081 Serine/threonine-protein kinase Chk1 Human genes 0.000 description 1
- 102100027911 Serine/threonine-protein kinase PAK 3 Human genes 0.000 description 1
- 102100026715 Serine/threonine-protein kinase STK11 Human genes 0.000 description 1
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 208000001203 Smallpox Diseases 0.000 description 1
- 102000013380 Smoothened Receptor Human genes 0.000 description 1
- 101710090597 Smoothened homolog Proteins 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 102100032417 Solute carrier family 22 member 2 Human genes 0.000 description 1
- 102100027239 Solute carrier organic anion transporter family member 1B3 Human genes 0.000 description 1
- 241001149962 Sporothrix Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102100023986 Sulfotransferase 1A1 Human genes 0.000 description 1
- 108090001033 Sulfotransferases Proteins 0.000 description 1
- 102000004896 Sulfotransferases Human genes 0.000 description 1
- 102100032891 Superoxide dismutase [Mn], mitochondrial Human genes 0.000 description 1
- 201000008736 Systemic mastocytosis Diseases 0.000 description 1
- 102100036839 T-box transcription factor TBX22 Human genes 0.000 description 1
- 102100033455 TGF-beta receptor type-2 Human genes 0.000 description 1
- QJJXYPPXXYFBGM-LFZNUXCKSA-N Tacrolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1\C=C(/C)[C@@H]1[C@H](C)[C@@H](O)CC(=O)[C@H](CC=C)/C=C(C)/C[C@H](C)C[C@H](OC)[C@H]([C@H](C[C@H]2C)OC)O[C@@]2(O)C(=O)C(=O)N2CCCC[C@H]2C(=O)O1 QJJXYPPXXYFBGM-LFZNUXCKSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- NAVMQTYZDKMPEU-UHFFFAOYSA-N Targretin Chemical compound CC1=CC(C(CCC2(C)C)(C)C)=C2C=C1C(=C)C1=CC=C(C(O)=O)C=C1 NAVMQTYZDKMPEU-UHFFFAOYSA-N 0.000 description 1
- 229940123237 Taxane Drugs 0.000 description 1
- CGMTUJFWROPELF-UHFFFAOYSA-N Tenuazonic acid Natural products CCC(C)C1NC(=O)C(=C(C)/O)C1=O CGMTUJFWROPELF-UHFFFAOYSA-N 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- MUMGGOZAMZWBJJ-DYKIIFRCSA-N Testosterone Natural products O=C1CC[C@]2(C)[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 MUMGGOZAMZWBJJ-DYKIIFRCSA-N 0.000 description 1
- 102100034162 Thiopurine S-methyltransferase Human genes 0.000 description 1
- 102100034196 Thrombopoietin receptor Human genes 0.000 description 1
- 208000033781 Thyroid carcinoma Diseases 0.000 description 1
- 241000130764 Tinea Species 0.000 description 1
- 208000035317 Total hypoxanthine-guanine phosphoribosyl transferase deficiency Diseases 0.000 description 1
- 102100031027 Transcription activator BRG1 Human genes 0.000 description 1
- 102100039580 Transcription factor ETV6 Human genes 0.000 description 1
- 102100038808 Transcription factor SOX-10 Human genes 0.000 description 1
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 1
- 108010082684 Transforming Growth Factor-beta Type II Receptor Proteins 0.000 description 1
- 208000032109 Transient ischaemic attack Diseases 0.000 description 1
- 102100031989 Transmembrane protease serine 2 Human genes 0.000 description 1
- 208000030886 Traumatic Brain injury Diseases 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 241000223238 Trichophyton Species 0.000 description 1
- FYAMXEPQQLNQDM-UHFFFAOYSA-N Tris(1-aziridinyl)phosphine oxide Chemical compound C1CN1P(N1CC1)(=O)N1CC1 FYAMXEPQQLNQDM-UHFFFAOYSA-N 0.000 description 1
- 208000007159 Trisomy 18 Syndrome Diseases 0.000 description 1
- 206010044688 Trisomy 21 Diseases 0.000 description 1
- 206010053871 Trisomy 8 Diseases 0.000 description 1
- 102100031638 Tuberin Human genes 0.000 description 1
- 208000026911 Tuberous sclerosis complex Diseases 0.000 description 1
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 description 1
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 1
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 1
- 102100022596 Tyrosine-protein kinase ABL1 Human genes 0.000 description 1
- 102100022651 Tyrosine-protein kinase ABL2 Human genes 0.000 description 1
- 102100033438 Tyrosine-protein kinase JAK1 Human genes 0.000 description 1
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 1
- 102100025387 Tyrosine-protein kinase JAK3 Human genes 0.000 description 1
- 102100033019 Tyrosine-protein phosphatase non-receptor type 11 Human genes 0.000 description 1
- 102100029152 UDP-glucuronosyltransferase 1A1 Human genes 0.000 description 1
- 101710205316 UDP-glucuronosyltransferase 1A1 Proteins 0.000 description 1
- 102100030434 Ubiquitin-protein ligase E3A Human genes 0.000 description 1
- 101710188886 Ubiquitin-protein ligase E3A Proteins 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 241000870995 Variola Species 0.000 description 1
- 108010053100 Vascular Endothelial Growth Factor Receptor-3 Proteins 0.000 description 1
- 102100033178 Vascular endothelial growth factor receptor 1 Human genes 0.000 description 1
- 102100033179 Vascular endothelial growth factor receptor 3 Human genes 0.000 description 1
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 1
- 201000009693 Venezuelan hemorrhagic fever Diseases 0.000 description 1
- 241000607265 Vibrio vulnificus Species 0.000 description 1
- JXLYSJRDGCGARV-WWYNWVTFSA-N Vinblastine Natural products O=C(O[C@H]1[C@](O)(C(=O)OC)[C@@H]2N(C)c3c(cc(c(OC)c3)[C@]3(C(=O)OC)c4[nH]c5c(c4CCN4C[C@](O)(CC)C[C@H](C3)C4)cccc5)[C@@]32[C@H]2[C@@]1(CC)C=CCN2CC3)C JXLYSJRDGCGARV-WWYNWVTFSA-N 0.000 description 1
- 208000010094 Visna Diseases 0.000 description 1
- 108010053752 Voltage-Gated Sodium Channels Proteins 0.000 description 1
- 102000016913 Voltage-Gated Sodium Channels Human genes 0.000 description 1
- 241000710886 West Nile virus Species 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- 208000006254 Wolf-Hirschhorn Syndrome Diseases 0.000 description 1
- 108700029631 X-Linked Genes Proteins 0.000 description 1
- 206010056894 XYY syndrome Diseases 0.000 description 1
- 108700031763 Xeroderma Pigmentosum Group D Proteins 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 229930188522 aclacinomycin Natural products 0.000 description 1
- USZYSDMBJDPRIF-SVEJIMAYSA-N aclacinomycin A Chemical compound O([C@H]1[C@@H](O)C[C@@H](O[C@H]1C)O[C@H]1[C@H](C[C@@H](O[C@H]1C)O[C@H]1C[C@]([C@@H](C2=CC=3C(=O)C4=CC=CC(O)=C4C(=O)C=3C(O)=C21)C(=O)OC)(O)CC)N(C)C)[C@H]1CCC(=O)[C@H](C)O1 USZYSDMBJDPRIF-SVEJIMAYSA-N 0.000 description 1
- 229960004176 aclarubicin Drugs 0.000 description 1
- 208000017733 acquired polycythemia vera Diseases 0.000 description 1
- 229930183665 actinomycin Natural products 0.000 description 1
- RJURFGZVJUQBHK-IIXSONLDSA-N actinomycin D Chemical compound C[C@H]1OC(=O)[C@H](C(C)C)N(C)C(=O)CN(C)C(=O)[C@@H]2CCCN2C(=O)[C@@H](C(C)C)NC(=O)[C@H]1NC(=O)C1=C(N)C(=O)C(C)=C2OC(C(C)=CC=C3C(=O)N[C@@H]4C(=O)N[C@@H](C(N5CCC[C@H]5C(=O)N(C)CC(=O)N(C)[C@@H](C(C)C)C(=O)O[C@@H]4C)=O)C(C)C)=C3N=C21 RJURFGZVJUQBHK-IIXSONLDSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000012082 adaptor molecule Substances 0.000 description 1
- 201000005188 adrenal gland cancer Diseases 0.000 description 1
- 208000024447 adrenal gland neoplasm Diseases 0.000 description 1
- 229940045714 alkyl sulfonate alkylating agent Drugs 0.000 description 1
- 150000008052 alkyl sulfonates Chemical class 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical class OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 229960003437 aminoglutethimide Drugs 0.000 description 1
- ROBVIMPUHSLWNV-UHFFFAOYSA-N aminoglutethimide Chemical compound C=1C=C(N)C=CC=1C1(CC)CCC(=O)NC1=O ROBVIMPUHSLWNV-UHFFFAOYSA-N 0.000 description 1
- 229960002749 aminolevulinic acid Drugs 0.000 description 1
- 229960003896 aminopterin Drugs 0.000 description 1
- 229940009444 amphotericin Drugs 0.000 description 1
- APKFDSVGJQXUKY-INPOYWNPSA-N amphotericin B Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-INPOYWNPSA-N 0.000 description 1
- 229960001220 amsacrine Drugs 0.000 description 1
- XCPGHVQEEXUHNC-UHFFFAOYSA-N amsacrine Chemical compound COC1=CC(NS(C)(=O)=O)=CC=C1NC1=C(C=CC=C2)C2=NC2=CC=CC=C12 XCPGHVQEEXUHNC-UHFFFAOYSA-N 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- 239000003098 androgen Substances 0.000 description 1
- 229940030486 androgens Drugs 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000002280 anti-androgenic effect Effects 0.000 description 1
- 229940124650 anti-cancer therapies Drugs 0.000 description 1
- 229940046836 anti-estrogen Drugs 0.000 description 1
- 230000001833 anti-estrogenic effect Effects 0.000 description 1
- 230000000340 anti-metabolite Effects 0.000 description 1
- 239000000051 antiandrogen Substances 0.000 description 1
- 229940030495 antiandrogen sex hormone and modulator of the genital system Drugs 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000013059 antihormonal agent Substances 0.000 description 1
- 229940100197 antimetabolite Drugs 0.000 description 1
- 239000002256 antimetabolite Substances 0.000 description 1
- 229940045687 antimetabolites folic acid analogs Drugs 0.000 description 1
- 229940045719 antineoplastic alkylating agent nitrosoureas Drugs 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 208000021780 appendiceal neoplasm Diseases 0.000 description 1
- 150000008209 arabinosides Chemical class 0.000 description 1
- 238000000889 atomisation Methods 0.000 description 1
- 206010064097 avian influenza Diseases 0.000 description 1
- 229960002756 azacitidine Drugs 0.000 description 1
- BHKICZDKIIDMNR-UHFFFAOYSA-L azane;cyclobutane-1,1-dicarboxylate;platinum(4+) Chemical compound N.N.[Pt+4].[O-]C(=O)C1(C([O-])=O)CCC1 BHKICZDKIIDMNR-UHFFFAOYSA-L 0.000 description 1
- 150000001541 aziridines Chemical class 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 208000005980 beta thalassemia Diseases 0.000 description 1
- 229960000997 bicalutamide Drugs 0.000 description 1
- 201000009036 biliary tract cancer Diseases 0.000 description 1
- 208000020790 biliary tract neoplasm Diseases 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 201000001531 bladder carcinoma Diseases 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 201000000220 brain stem cancer Diseases 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 208000003362 bronchogenic carcinoma Diseases 0.000 description 1
- 229960002092 busulfan Drugs 0.000 description 1
- KVUAALJSMIVURS-ZEDZUCNESA-L calcium folinate Chemical compound [Ca+2].C1NC=2NC(N)=NC(=O)C=2N(C=O)C1CNC1=CC=C(C(=O)N[C@@H](CCC([O-])=O)C([O-])=O)C=C1 KVUAALJSMIVURS-ZEDZUCNESA-L 0.000 description 1
- 229930195731 calicheamicin Natural products 0.000 description 1
- HXCHCVDVKSCDHU-LULTVBGHSA-N calicheamicin Chemical compound C1[C@H](OC)[C@@H](NCC)CO[C@H]1O[C@H]1[C@H](O[C@@H]2C\3=C(NC(=O)OC)C(=O)C[C@](C/3=C/CSSSC)(O)C#C\C=C/C#C2)O[C@H](C)[C@@H](NO[C@@H]2O[C@H](C)[C@@H](SC(=O)C=3C(=C(OC)C(O[C@H]4[C@@H]([C@H](OC)[C@@H](O)[C@H](C)O4)O)=C(I)C=3C)OC)[C@@H](O)C2)[C@@H]1O HXCHCVDVKSCDHU-LULTVBGHSA-N 0.000 description 1
- 229960004117 capecitabine Drugs 0.000 description 1
- 229960004562 carboplatin Drugs 0.000 description 1
- 208000002458 carcinoid tumor Diseases 0.000 description 1
- 229930188550 carminomycin Natural products 0.000 description 1
- XREUEWVEMYWFFA-CSKJXFQVSA-N carminomycin Chemical compound C1[C@H](N)[C@H](O)[C@H](C)O[C@H]1O[C@@H]1C2=C(O)C(C(=O)C3=C(O)C=CC=C3C3=O)=C3C(O)=C2C[C@@](O)(C(C)=O)C1 XREUEWVEMYWFFA-CSKJXFQVSA-N 0.000 description 1
- XREUEWVEMYWFFA-UHFFFAOYSA-N carminomycin I Natural products C1C(N)C(O)C(C)OC1OC1C2=C(O)C(C(=O)C3=C(O)C=CC=C3C3=O)=C3C(O)=C2CC(O)(C(C)=O)C1 XREUEWVEMYWFFA-UHFFFAOYSA-N 0.000 description 1
- 229960003261 carmofur Drugs 0.000 description 1
- 229960005243 carmustine Drugs 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 229950001725 carubicin Drugs 0.000 description 1
- 201000007455 central nervous system cancer Diseases 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- HWGQMRYQVZSGDQ-HZPDHXFCSA-N chembl3137320 Chemical compound CN1N=CN=C1[C@H]([C@H](N1)C=2C=CC(F)=CC=2)C2=NNC(=O)C3=C2C1=CC(F)=C3 HWGQMRYQVZSGDQ-HZPDHXFCSA-N 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- RMXVHZFHSKRNJN-UHFFFAOYSA-N chlorourea Chemical compound NC(=O)NCl RMXVHZFHSKRNJN-UHFFFAOYSA-N 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- ZYVSOIYQKUDENJ-WKSBCEQHSA-N chromomycin A3 Chemical compound O([C@@H]1C[C@@H](O[C@H](C)[C@@H]1OC(C)=O)OC=1C=C2C=C3C[C@H]([C@@H](C(=O)C3=C(O)C2=C(O)C=1C)O[C@@H]1O[C@H](C)[C@@H](O)[C@H](O[C@@H]2O[C@H](C)[C@@H](O)[C@H](O[C@@H]3O[C@@H](C)[C@H](OC(C)=O)[C@@](C)(O)C3)C2)C1)[C@H](OC)C(=O)[C@@H](O)[C@@H](C)O)[C@@H]1C[C@@H](O)[C@@H](OC)[C@@H](C)O1 ZYVSOIYQKUDENJ-WKSBCEQHSA-N 0.000 description 1
- 208000021668 chronic eosinophilic leukemia Diseases 0.000 description 1
- 229960001265 ciclosporin Drugs 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- DQLATGHUWYMOKM-UHFFFAOYSA-L cisplatin Chemical compound N[Pt](N)(Cl)Cl DQLATGHUWYMOKM-UHFFFAOYSA-L 0.000 description 1
- 229960004316 cisplatin Drugs 0.000 description 1
- 229940105778 coagulation factor viii Drugs 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 229930182912 cyclosporin Natural products 0.000 description 1
- 229960000684 cytarabine Drugs 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229960003901 dacarbazine Drugs 0.000 description 1
- 229960000640 dactinomycin Drugs 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 108010017271 denileukin diftitox Proteins 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- LTMHDMANZUZIPE-PUGKRICDSA-N digoxin Chemical compound C1[C@H](O)[C@H](O)[C@@H](C)O[C@H]1O[C@@H]1[C@@H](C)O[C@@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3C[C@@H]4[C@]([C@@H]5[C@H]([C@]6(CC[C@@H]([C@@]6(C)[C@H](O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)C[C@@H]2O)C)C[C@@H]1O LTMHDMANZUZIPE-PUGKRICDSA-N 0.000 description 1
- 229960005156 digoxin Drugs 0.000 description 1
- LTMHDMANZUZIPE-UHFFFAOYSA-N digoxine Natural products C1C(O)C(O)C(C)OC1OC1C(C)OC(OC2C(OC(OC3CC4C(C5C(C6(CCC(C6(C)C(O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)CC2O)C)CC1O LTMHDMANZUZIPE-UHFFFAOYSA-N 0.000 description 1
- 239000003534 dna topoisomerase inhibitor Substances 0.000 description 1
- 229960003668 docetaxel Drugs 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 229960004679 doxorubicin Drugs 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 210000001198 duodenum Anatomy 0.000 description 1
- VLCYCQAOQCDTCN-UHFFFAOYSA-N eflornithine Chemical compound NCCCC(N)(C(F)F)C(O)=O VLCYCQAOQCDTCN-UHFFFAOYSA-N 0.000 description 1
- 210000003278 egg shell Anatomy 0.000 description 1
- 101150068690 eml4 gene Proteins 0.000 description 1
- 230000002357 endometrial effect Effects 0.000 description 1
- 230000002616 endonucleolytic effect Effects 0.000 description 1
- 230000003511 endothelial effect Effects 0.000 description 1
- 229950011487 enocitabine Drugs 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 229960001904 epirubicin Drugs 0.000 description 1
- 208000037828 epithelial carcinoma Diseases 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 229960001842 estramustine Drugs 0.000 description 1
- FRPJXPJMRWBBIH-RBRWEJTLSA-N estramustine Chemical compound ClCCN(CCCl)C(=O)OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 FRPJXPJMRWBBIH-RBRWEJTLSA-N 0.000 description 1
- 239000000328 estrogen antagonist Substances 0.000 description 1
- QSRLNKCNOLVZIR-KRWDZBQOSA-N ethyl (2s)-2-[[2-[4-[bis(2-chloroethyl)amino]phenyl]acetyl]amino]-4-methylsulfanylbutanoate Chemical compound CCOC(=O)[C@H](CCSC)NC(=O)CC1=CC=C(N(CCCl)CCCl)C=C1 QSRLNKCNOLVZIR-KRWDZBQOSA-N 0.000 description 1
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 description 1
- VJJPUSNTGOMMGY-MRVIYFEKSA-N etoposide Chemical compound COC1=C(O)C(OC)=CC([C@@H]2C3=CC=4OCOC=4C=C3[C@@H](O[C@H]3[C@@H]([C@@H](O)[C@@H]4O[C@H](C)OC[C@H]4O3)O)[C@@H]3[C@@H]2C(OC3)=O)=C1 VJJPUSNTGOMMGY-MRVIYFEKSA-N 0.000 description 1
- 229960005167 everolimus Drugs 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000001036 exonucleolytic effect Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 208000004313 familial eosinophilia Diseases 0.000 description 1
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 102000052178 fibroblast growth factor receptor activity proteins Human genes 0.000 description 1
- ODKNJVUHOIMIIZ-RRKCRQDMSA-N floxuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 ODKNJVUHOIMIIZ-RRKCRQDMSA-N 0.000 description 1
- 229960000390 fludarabine Drugs 0.000 description 1
- GIUYCYHIANZCFB-FJFJXFQQSA-N fludarabine phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O GIUYCYHIANZCFB-FJFJXFQQSA-N 0.000 description 1
- 229960002074 flutamide Drugs 0.000 description 1
- MKXKFYHWDHIYRV-UHFFFAOYSA-N flutamide Chemical compound CC(C)C(=O)NC1=CC=C([N+]([O-])=O)C(C(F)(F)F)=C1 MKXKFYHWDHIYRV-UHFFFAOYSA-N 0.000 description 1
- 150000002224 folic acids Chemical class 0.000 description 1
- 235000008191 folinic acid Nutrition 0.000 description 1
- 239000011672 folinic acid Substances 0.000 description 1
- 201000003444 follicular lymphoma Diseases 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- YAKWPXVTIGTRJH-UHFFFAOYSA-N fotemustine Chemical compound CCOP(=O)(OCC)C(C)NC(=O)N(CCCl)N=O YAKWPXVTIGTRJH-UHFFFAOYSA-N 0.000 description 1
- 229960004783 fotemustine Drugs 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 229940044658 gallium nitrate Drugs 0.000 description 1
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 229910052732 germanium Inorganic materials 0.000 description 1
- GNPVGFCGXDBREM-UHFFFAOYSA-N germanium atom Chemical compound [Ge] GNPVGFCGXDBREM-UHFFFAOYSA-N 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 229960002913 goserelin Drugs 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 235000009424 haa Nutrition 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 201000002222 hemangioblastoma Diseases 0.000 description 1
- 230000002489 hematologic effect Effects 0.000 description 1
- 208000029570 hepatitis D virus infection Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 229960001330 hydroxycarbamide Drugs 0.000 description 1
- 229960005236 ibandronic acid Drugs 0.000 description 1
- 229960000908 idarubicin Drugs 0.000 description 1
- 210000003405 ileum Anatomy 0.000 description 1
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Substances C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 1
- 229960002751 imiquimod Drugs 0.000 description 1
- DOUYETYNHWVLEO-UHFFFAOYSA-N imiquimod Chemical compound C1=CC=CC2=C3N(CC(C)C)C=NC3=C(N)N=C21 DOUYETYNHWVLEO-UHFFFAOYSA-N 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 108010019691 inhibin beta A subunit Proteins 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- UWKQSNNFCGGAFS-XIFFEERXSA-N irinotecan Chemical compound C1=C2C(CC)=C3CN(C(C4=C([C@@](C(=O)OC4)(O)CC)C=4)=O)C=4C3=NC2=CC=C1OC(=O)N(CC1)CCC1N1CCCCC1 UWKQSNNFCGGAFS-XIFFEERXSA-N 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- GKWPCEFFIHSJOE-UHFFFAOYSA-N laquinimod Chemical compound OC=1C2=C(Cl)C=CC=C2N(C)C(=O)C=1C(=O)N(CC)C1=CC=CC=C1 GKWPCEFFIHSJOE-UHFFFAOYSA-N 0.000 description 1
- 229960004577 laquinimod Drugs 0.000 description 1
- 201000010260 leiomyoma Diseases 0.000 description 1
- 229940115286 lentinan Drugs 0.000 description 1
- 229960001691 leucovorin Drugs 0.000 description 1
- GFIJNRVAKGFPGQ-LIJARHBVSA-N leuprolide Chemical compound CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)CC1=CC=C(O)C=C1 GFIJNRVAKGFPGQ-LIJARHBVSA-N 0.000 description 1
- 229960004338 leuprorelin Drugs 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 206010024627 liposarcoma Diseases 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 229960002247 lomustine Drugs 0.000 description 1
- 201000006903 long QT syndrome 3 Diseases 0.000 description 1
- 229960003538 lonidamine Drugs 0.000 description 1
- WDRYRZXSPDWGEB-UHFFFAOYSA-N lonidamine Chemical compound C12=CC=CC=C2C(C(=O)O)=NN1CC1=CC=C(Cl)C=C1Cl WDRYRZXSPDWGEB-UHFFFAOYSA-N 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 208000015534 lymphangioendothelioma Diseases 0.000 description 1
- 208000012804 lymphangiosarcoma Diseases 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- HAVFFEMDLROBGI-UHFFFAOYSA-N m8926c7ilx Chemical compound C1CC(O)CCN1CC1=CC=C(OC=2C3=C(C(NN=C33)=O)C=CC=2)C3=C1 HAVFFEMDLROBGI-UHFFFAOYSA-N 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- MQXVYODZCMMZEM-ZYUZMQFOSA-N mannomustine Chemical compound ClCCNC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CNCCCl MQXVYODZCMMZEM-ZYUZMQFOSA-N 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 229960002868 mechlorethamine hydrochloride Drugs 0.000 description 1
- QZIQJVCYUQZDIR-UHFFFAOYSA-N mechlorethamine hydrochloride Chemical compound Cl.ClCCN(C)CCCl QZIQJVCYUQZDIR-UHFFFAOYSA-N 0.000 description 1
- 208000023356 medullary thyroid gland carcinoma Diseases 0.000 description 1
- JDSHMPZPIAZGSV-UHFFFAOYSA-N melamine Chemical compound NC1=NC(N)=NC(N)=N1 JDSHMPZPIAZGSV-UHFFFAOYSA-N 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 229960001924 melphalan Drugs 0.000 description 1
- SGDBTWWWUNNDEQ-LBPRGKRZSA-N melphalan Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N(CCCl)CCCl)C=C1 SGDBTWWWUNNDEQ-LBPRGKRZSA-N 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 206010027191 meningioma Diseases 0.000 description 1
- HPNSFSBZBAHARI-UHFFFAOYSA-N micophenolic acid Natural products OC1=C(CC=C(C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-UHFFFAOYSA-N 0.000 description 1
- 238000003801 milling Methods 0.000 description 1
- 229960005485 mitobronitol Drugs 0.000 description 1
- 229960003539 mitoguazone Drugs 0.000 description 1
- MXWHMTNPTTVWDM-NXOFHUPFSA-N mitoguazone Chemical compound NC(N)=N\N=C(/C)\C=N\N=C(N)N MXWHMTNPTTVWDM-NXOFHUPFSA-N 0.000 description 1
- VFKZTMPDYBFSTM-GUCUJZIJSA-N mitolactol Chemical compound BrC[C@H](O)[C@@H](O)[C@@H](O)[C@H](O)CBr VFKZTMPDYBFSTM-GUCUJZIJSA-N 0.000 description 1
- 229950010913 mitolactol Drugs 0.000 description 1
- 229960000350 mitotane Drugs 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 208000005871 monkeypox Diseases 0.000 description 1
- 101150071637 mre11 gene Proteins 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 229960000951 mycophenolic acid Drugs 0.000 description 1
- HPNSFSBZBAHARI-RUDMXATFSA-N mycophenolic acid Chemical compound OC1=C(C\C=C(/C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-RUDMXATFSA-N 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 208000001611 myxosarcoma Diseases 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 239000006199 nebulizer Substances 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 201000002120 neuroendocrine carcinoma Diseases 0.000 description 1
- XWXYUMMDTVBTOU-UHFFFAOYSA-N nilutamide Chemical compound O=C1C(C)(C)NC(=O)N1C1=CC=C([N+]([O-])=O)C(C(F)(F)F)=C1 XWXYUMMDTVBTOU-UHFFFAOYSA-N 0.000 description 1
- 229960002653 nilutamide Drugs 0.000 description 1
- 229960001420 nimustine Drugs 0.000 description 1
- VFEDRRNHLBGPNN-UHFFFAOYSA-N nimustine Chemical compound CC1=NC=C(CNC(=O)N(CCCl)N=O)C(N)=N1 VFEDRRNHLBGPNN-UHFFFAOYSA-N 0.000 description 1
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 1
- FDLYAMZZIXQODN-UHFFFAOYSA-N olaparib Chemical compound FC1=CC=C(CC=2C3=CC=CC=C3C(=O)NN=2)C=C1C(=O)N(CC1)CCN1C(=O)C1CC1 FDLYAMZZIXQODN-UHFFFAOYSA-N 0.000 description 1
- CZDBNBLGZNWKMC-MWQNXGTOSA-N olivomycin Chemical compound O([C@@H]1C[C@@H](O[C@H](C)[C@@H]1O)OC=1C=C2C=C3C[C@H]([C@@H](C(=O)C3=C(O)C2=C(O)C=1)O[C@H]1O[C@@H](C)[C@H](O)[C@@H](OC2O[C@@H](C)[C@H](O)[C@@H](O)C2)C1)[C@H](OC)C(=O)[C@@H](O)[C@@H](C)O)[C@H]1C[C@H](O)[C@H](OC)[C@H](C)O1 CZDBNBLGZNWKMC-MWQNXGTOSA-N 0.000 description 1
- 229950005848 olivomycin Drugs 0.000 description 1
- 229950011093 onapristone Drugs 0.000 description 1
- 229940100027 ontak Drugs 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 229960001592 paclitaxel Drugs 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 229940096763 panretin Drugs 0.000 description 1
- 208000004019 papillary adenocarcinoma Diseases 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 208000029255 peripheral nervous system cancer Diseases 0.000 description 1
- 238000002205 phenol-chloroform extraction Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- KASDHRXLYQOAKZ-ZPSXYTITSA-N pimecrolimus Chemical compound C/C([C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@]2(O)O[C@@H]([C@H](C[C@H]2C)OC)[C@@H](OC)C[C@@H](C)C/C(C)=C/[C@H](C(C[C@H](O)[C@H]1C)=O)CC)=C\[C@@H]1CC[C@@H](Cl)[C@H](OC)C1 KASDHRXLYQOAKZ-ZPSXYTITSA-N 0.000 description 1
- 229960005330 pimecrolimus Drugs 0.000 description 1
- NUKCGLDCWQXYOQ-UHFFFAOYSA-N piposulfan Chemical compound CS(=O)(=O)OCCC(=O)N1CCN(C(=O)CCOS(C)(=O)=O)CC1 NUKCGLDCWQXYOQ-UHFFFAOYSA-N 0.000 description 1
- 229950001100 piposulfan Drugs 0.000 description 1
- 229960001221 pirarubicin Drugs 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 150000003057 platinum Chemical class 0.000 description 1
- 201000008519 polycystic kidney disease 1 Diseases 0.000 description 1
- 208000037244 polycythemia vera Diseases 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 1
- 229960004618 prednisone Drugs 0.000 description 1
- 238000009598 prenatal testing Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 210000005084 renal tissue Anatomy 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000013432 robust analysis Methods 0.000 description 1
- VHXNKPBCCMUMSW-FQEVSTJZSA-N rubitecan Chemical compound C1=CC([N+]([O-])=O)=C2C=C(CN3C4=CC5=C(C3=O)COC(=O)[C@]5(O)CC)C4=NC2=C1 VHXNKPBCCMUMSW-FQEVSTJZSA-N 0.000 description 1
- HMABYWSNWIZPAG-UHFFFAOYSA-N rucaparib Chemical compound C1=CC(CNC)=CC=C1C(N1)=C2CCNC(=O)C3=C2C1=CC(F)=C3 HMABYWSNWIZPAG-UHFFFAOYSA-N 0.000 description 1
- FCCGJTKEKXUBFZ-UHFFFAOYSA-N rucaparib phosphate Chemical compound OP(O)(O)=O.C1=CC(CNC)=CC=C1C(N1)=C2CCNC(=O)C3=C2C1=CC(F)=C3 FCCGJTKEKXUBFZ-UHFFFAOYSA-N 0.000 description 1
- 201000008407 sebaceous adenocarcinoma Diseases 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 208000000649 small cell carcinoma Diseases 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 201000002314 small intestine cancer Diseases 0.000 description 1
- VBDRTGFACFYFCT-UHFFFAOYSA-M sodium;hydroxy-[(1r)-1-hydroxy-3-[methyl(pentyl)amino]-1-phosphonopropyl]phosphinate;hydrate Chemical compound O.[Na+].CCCCCN(C)CCC(O)(P(O)(O)=O)P(O)([O-])=O VBDRTGFACFYFCT-UHFFFAOYSA-M 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 229930185156 spinosyn Natural products 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 229960001052 streptozocin Drugs 0.000 description 1
- ZSJLQEPLLKMAKR-GKHCUFPYSA-N streptozocin Chemical compound O=NN(C)C(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O ZSJLQEPLLKMAKR-GKHCUFPYSA-N 0.000 description 1
- 108010045815 superoxide dismutase 2 Proteins 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 201000010965 sweat gland carcinoma Diseases 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 206010042863 synovial sarcoma Diseases 0.000 description 1
- 229960001967 tacrolimus Drugs 0.000 description 1
- QJJXYPPXXYFBGM-SHYZHZOCSA-N tacrolimus Natural products CO[C@H]1C[C@H](CC[C@@H]1O)C=C(C)[C@H]2OC(=O)[C@H]3CCCCN3C(=O)C(=O)[C@@]4(O)O[C@@H]([C@H](C[C@H]4C)OC)[C@@H](C[C@H](C)CC(=C[C@@H](CC=C)C(=O)C[C@H](O)[C@H]2C)C)OC QJJXYPPXXYFBGM-SHYZHZOCSA-N 0.000 description 1
- 229960001603 tamoxifen Drugs 0.000 description 1
- 229940099419 targretin Drugs 0.000 description 1
- RCINICONZNJXQF-MZXODVADSA-N taxol Chemical compound O([C@@H]1[C@@]2(C[C@@H](C(C)=C(C2(C)C)[C@H](C([C@]2(C)[C@@H](O)C[C@H]3OC[C@]3([C@H]21)OC(C)=O)=O)OC(=O)C)OC(=O)[C@H](O)[C@@H](NC(=O)C=1C=CC=CC=1)C=1C=CC=CC=1)O)C(=O)C1=CC=CC=C1 RCINICONZNJXQF-MZXODVADSA-N 0.000 description 1
- NRUKOCRGYNPUPR-QBPJDGROSA-N teniposide Chemical compound COC1=C(O)C(OC)=CC([C@@H]2C3=CC=4OCOC=4C=C3[C@@H](O[C@H]3[C@@H]([C@@H](O)[C@@H]4O[C@@H](OC[C@H]4O3)C=3SC=CC=3)O)[C@@H]3[C@@H]2C(OC3)=O)=C1 NRUKOCRGYNPUPR-QBPJDGROSA-N 0.000 description 1
- 229960001278 teniposide Drugs 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 229960003604 testosterone Drugs 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 208000013077 thyroid gland carcinoma Diseases 0.000 description 1
- 229940044693 topoisomerase inhibitor Drugs 0.000 description 1
- 229960005026 toremifene Drugs 0.000 description 1
- XFCLJVABOIYOMF-QPLCGJKRSA-N toremifene Chemical compound C1=CC(OCCN(C)C)=CC=C1C(\C=1C=CC=CC=1)=C(\CCCl)C1=CC=CC=C1 XFCLJVABOIYOMF-QPLCGJKRSA-N 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 201000010875 transient cerebral ischemia Diseases 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 230000009529 traumatic brain injury Effects 0.000 description 1
- 229960001670 trilostane Drugs 0.000 description 1
- KVJXBPDAXMEYOA-CXANFOAXSA-N trilostane Chemical compound OC1=C(C#N)C[C@]2(C)[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CC[C@@]32O[C@@H]31 KVJXBPDAXMEYOA-CXANFOAXSA-N 0.000 description 1
- NOYPYLRCIDNJJB-UHFFFAOYSA-N trimetrexate Chemical compound COC1=C(OC)C(OC)=CC(NCC=2C(=C3C(N)=NC(N)=NC3=CC=2)C)=C1 NOYPYLRCIDNJJB-UHFFFAOYSA-N 0.000 description 1
- 229960001099 trimetrexate Drugs 0.000 description 1
- 206010053884 trisomy 18 Diseases 0.000 description 1
- 208000026485 trisomy X Diseases 0.000 description 1
- 208000034298 trisomy chromosome 8 Diseases 0.000 description 1
- 108010064892 trkC Receptor Proteins 0.000 description 1
- 229960001005 tuberculin Drugs 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229960001055 uracil mustard Drugs 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 208000010570 urinary bladder carcinoma Diseases 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- JNAHVYVRKWKWKQ-CYBMUJFWSA-N veliparib Chemical compound N=1C2=CC=CC(C(N)=O)=C2NC=1[C@@]1(C)CCCN1 JNAHVYVRKWKWKQ-CYBMUJFWSA-N 0.000 description 1
- 229950011257 veliparib Drugs 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 229960003048 vinblastine Drugs 0.000 description 1
- JXLYSJRDGCGARV-XQKSVPLYSA-N vincaleukoblastine Chemical compound C([C@@H](C[C@]1(C(=O)OC)C=2C(=CC3=C([C@]45[C@H]([C@@]([C@H](OC(C)=O)[C@]6(CC)C=CCN([C@H]56)CC4)(O)C(=O)OC)N3C)C=2)OC)C[C@@](C2)(O)CC)N2CCC2=C1NC1=CC=CC=C21 JXLYSJRDGCGARV-XQKSVPLYSA-N 0.000 description 1
- 229960004528 vincristine Drugs 0.000 description 1
- OGWKCGZFUXNPDA-XQKSVPLYSA-N vincristine Chemical compound C([N@]1C[C@@H](C[C@]2(C(=O)OC)C=3C(=CC4=C([C@]56[C@H]([C@@]([C@H](OC(C)=O)[C@]7(CC)C=CCN([C@H]67)CC5)(O)C(=O)OC)N4C=O)C=3)OC)C[C@@](C1)(O)CC)CC1=C2NC2=CC=CC=C12 OGWKCGZFUXNPDA-XQKSVPLYSA-N 0.000 description 1
- OGWKCGZFUXNPDA-UHFFFAOYSA-N vincristine Natural products C1C(CC)(O)CC(CC2(C(=O)OC)C=3C(=CC4=C(C56C(C(C(OC(C)=O)C7(CC)C=CCN(C67)CC5)(O)C(=O)OC)N4C=O)C=3)OC)CN1CCC1=C2NC2=CC=CC=C12 OGWKCGZFUXNPDA-UHFFFAOYSA-N 0.000 description 1
- 229960004355 vindesine Drugs 0.000 description 1
- UGGWPQSBPIFKDZ-KOTLKJBCSA-N vindesine Chemical compound C([C@@H](C[C@]1(C(=O)OC)C=2C(=CC3=C([C@]45[C@H]([C@@]([C@H](O)[C@]6(CC)C=CCN([C@H]56)CC4)(O)C(N)=O)N3C)C=2)OC)C[C@@](C2)(O)CC)N2CCC2=C1N=C1[C]2C=CC=C1 UGGWPQSBPIFKDZ-KOTLKJBCSA-N 0.000 description 1
- GBABOYUKABKIAF-GHYRFKGUSA-N vinorelbine Chemical compound C1N(CC=2C3=CC=CC=C3NC=22)CC(CC)=C[C@H]1C[C@]2(C(=O)OC)C1=CC([C@]23[C@H]([C@]([C@H](OC(C)=O)[C@]4(CC)C=CCN([C@H]34)CC2)(O)C(=O)OC)N2C)=C2C=C1OC GBABOYUKABKIAF-GHYRFKGUSA-N 0.000 description 1
- 229960002066 vinorelbine Drugs 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 102000009310 vitamin D receptors Human genes 0.000 description 1
- 108050000156 vitamin D receptors Proteins 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229960000641 zorubicin Drugs 0.000 description 1
- FBTUMDXHSRTGRV-ALTNURHMSA-N zorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(\C)=N\NC(=O)C=1C=CC=CC=1)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1 FBTUMDXHSRTGRV-ALTNURHMSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6851—Quantitative amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2523/00—Reactions characterised by treatment of reaction samples
- C12Q2523/30—Characterised by physical treatment
- C12Q2523/301—Sonication
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/191—Modifications characterised by incorporating an adaptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/16—Assays for determining copy number or wherein the copy number is of special importance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2545/00—Reactions characterised by their quantitative nature
- C12Q2545/10—Reactions characterised by their quantitative nature the purpose being quantitative analysis
- C12Q2545/114—Reactions characterised by their quantitative nature the purpose being quantitative analysis involving a quantitation step
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/159—Microreactors, e.g. emulsion PCR or sequencing, droplet PCR, microcapsules, i.e. non-liquid containers with a range of different permeability's for different reaction components
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2570/00—Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/70—Mechanisms involved in disease identification
- G01N2800/7023—(Hyper)proliferation
- G01N2800/7028—Cancer
Abstract
本发明包括可用于检测细胞基因组DNA或无细胞DNA(cfDNA)的样品内的突变、SNP、易位、倒位、缺失、拷贝数变化或其他遗传变异的组合物和方法。在一些实施方案中,本发明的组合物和方法提供了极高水平的分辨率,其特别可用于检测来自生物样品(例如血液)的总cfDNA的一小部分中的拷贝数变异。
Description
相关申请的引用
本申请是申请号为201780059053.2的中国专利申请的分案申请,并且要求2016年8月25日提交的美国临时专利申请号62/379,593和2017年4月4日提交的美国临时专利申请号62/481,538的优先权,将其各自通过引用以其全文并入本文。
关于序列表的声明
与本申请相关的序列表以文本格式代替纸质副本提供,并且特此通过引用并入本说明书中。包含序列表的文本文件的名称是CLFK_005_02WO_ST25。该文本文件为2,238KB,创建于2017年8月24日并通过EFS-Web以电子方式提交。
技术领域
本发明总体上涉及用于生物样品例如直接组织活检或外周血的定量遗传分析的组合物和方法。特别地,本发明涉及用于检测生物样品的靶特异性拷贝数变化以及遗传表征和分析的方法。
发明背景
越来越明显的是,大多数(如果不是全部)最常见的人类癌症是人类基因组疾病。认为体细胞突变在个体的一生中会积累,其中一些体细胞突变会增加携带它们的细胞发展成肿瘤的可能性。由于积累的突变事件的错误组合,癌症前期生长失去了约束(这种约束能遏制不受控制的增殖)并且产生的细胞团块成为癌症。导致癌症所必需的且足以导致癌症的突变群通常统称为“驱动突变”。最近的密集分子分析中出现的主题之一是曾经被认为是一种单一的组织特异性疾病的癌症实际上是一组相关疾病,其中每种疾病都有独特的分子病理学。人类基因组计划为癌症的全基因组分析奠定了基础。
基因拷贝数变化是生物多样性的基本驱动因素。在进化的背景下,基因的重复和功能的分化是物种多样性的公认驱动因素。在人类疾病的背景下,体细胞内的基因丢失和基因扩增是诸如癌症的患病组织的标志。某些治疗剂特异性地作用于具有这些基因组增加和/或丢失突变的细胞,然而,这些拷贝数变异的鉴定是困难的,因为这些突变通常仅存在于患病细胞或癌细胞的DNA中而在身体的其他细胞中不存在。虽然患病组织或细胞是突变DNA的主要来源,但通过活检获取DNA是侵入性的、有风险的并且通常是不可能的。观察到垂死的肿瘤或癌细胞将其小片DNA(称为无细胞DNA或循环DNA)释放至血流中,这允许开发能够用侵入性较小的技术诸如血液样品进行的基因测试。然而,从样品中分离无细胞DNA只能获得少量DNA,并且只有总DNA的一部分携带与所述疾病相关的突变。例如,在癌症基因组学的背景下,诊断上明显的肿瘤突变通常仅以显著小于50%的低等位基因频率发现。这与常规SNP基因分型形成对比,常规SNP基因分型中的等位基因频率通常为约100%、50%或0%。
因此,需要能够检测特定靶基因座中的基因拷贝数变化的基因组技术。
发明内容
检测cfDNA中罕见突变的方法先前已在国际PCT公开号WO 2016/028316中描述。然而,这些技术仍然缺乏在极低等位基因频率下检测最罕见拷贝数丢失的必需灵敏度。本文提供了用于检测靶特异性拷贝数变化的组合物和方法,其适用于若干样品类型,包括直接组织活检、外周血以及特别是cfDNA。本文所述的组合物和方法的灵敏度足以检测出只存在于总DNA的一小部分中的拷贝数变化。
本发明尤其包括可用于检测细胞基因组DNA(例如,来自组织活检样品)或cfDNA(例如,来自血液样品)的样品内的突变、SNP、易位、倒位、缺失、拷贝数变化或其他遗传变异的组合物和方法。特别地,本发明的组合物和方法提供了极高水平的分辨率,其特别可用于检测来自生物样品(例如血液)的总cfDNA的一小部分中的拷贝数变异。
具体的实施方案涉及用于对来自测试样品的DNA靶区域进行遗传分析的方法,其包括:(a)生成包含多个DNA文库片段的基因组DNA文库,其中所述DNA文库片段中的每一个包含来自所述测试样品的基因组DNA片段和衔接子;(b)使所述基因组DNA文库与特异性地结合DNA靶区域的多个捕获探针接触,从而在所述捕获探针与包含所述DNA靶区域的DNA文库片段之间形成复合物;以及(c)对包含所述DNA靶区域的基因组DNA片段进行定量遗传分析;其中所述衔接子是包含扩增区、样品标签区和锚定区的DNA多核苷酸;其中所述扩增区包含能够充当PCR扩增的引物识别位点的多核苷酸序列;其中所述样品标签包含编码所述独特文库DNA片段的特征且编码所述测试样品的特征的多核苷酸序列;其中所述锚定区包含编码所述测试样品的特征的多核苷酸序列,并且其中所述锚定区能够附接至所述基因组DNA片段;并且其中进行所述遗传分析以检测指示疾病状态的遗传变化。
在一些实施方案中,所述指示疾病状态的遗传变化选自单核苷酸变异(SNV)、长度小于40个核苷酸的插入、长度小于40个核苷酸的DNA区域的缺失和/或拷贝数变化。在具体实施方案中,所述指示疾病状态的遗传变化是拷贝数变化。在一些实施方案中,所述测试样品是组织活检。在各种实施方案中,所述组织活检取自肿瘤或怀疑为肿瘤的组织。在某些实施方案中,所述基因组DNA是无细胞DNA(cfDNA)或细胞DNA。在具体实施方案中,所述基因组DNA是从所述测试样品分离的cfDNA;并且其中所述测试样品是选自由以下组成的组的生物样品:羊水、血液、血浆、血清、精液、淋巴液、脑脊液、眼内液、尿液、唾液、粪便、粘液和汗液。
在某些实施方案中,由以下步骤获得所述基因组DNA片段,其包括:(i)从所述测试样品分离细胞DNA;以及(ii)使所述细胞DNA片段化以获得所述基因组DNA片段。在具体实施方案中,步骤(ii)是通过使所述细胞DNA与至少一种消化酶接触来进行的。在一些实施方案中,步骤(ii)是通过对所述细胞DNA施加机械应力来进行的。在某些实施方案中,通过超声处理所述细胞DNA来施加所述机械应力。
在具体实施方案中,所述样品标签还包含有助于鉴定独特基因组DNA片段的独特分子标识符(UMI)。
在一些实施方案中,所述扩增区的长度在10与50个核苷酸之间。在具体实施方案中,所述扩增区的长度在20与30个核苷酸之间。在某些实施方案中,所述扩增区的长度为25个核苷酸。
在一些实施方案中,所述样品标签的长度在5与50个核苷酸之间。在具体实施方案中,所述样品标签的长度在5与15个核苷酸之间。在某些实施方案中,所述样品标签的长度为8个核苷酸。在一些实施方案中,UMI倍增器与所述样品标签区相邻或包含在所述样品标签区内。
在某些实施方案中,所述UMI倍增器的长度在1与5个核苷酸之间。在具体实施方案中,所述UMI倍增器的长度为3个核苷酸,并且包含64个可能的核苷酸序列中的一个。
在一些实施方案中,所述锚定区的长度在1与50个核苷酸之间。在具体实施方案中,所述锚定区的长度在5与25个核苷酸之间。在某些实施方案中,所述锚定区的长度为10个核苷酸。
本发明的具体实施方案涉及以下方法,其中生成包含多个DNA文库片段的基因组DNA文库的步骤(a)包括将所述基因组DNA片段附接至多个衔接子。在某些实施方案中,在将所述基因组DNA片段与多个衔接子附接之前,对所述基因组DNA片段进行末端修复。在具体实施方案中,所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列。
在某些实施方案中,所述多个衔接子中的每个衔接子的样品标签区包含在2与1,000个核苷酸序列之间的一个核苷酸序列。在具体实施方案中,所述多个衔接子中的每个衔接子的样品标签区包含在50与500个核苷酸序列之间的一个核苷酸序列。在各种实施方案中,所述多个衔接子中的每个衔接子的样品标签区包含在100与400个核苷酸序列之间的一个核苷酸序列。在一些实施方案中,所述多个衔接子的每个衔接子的样品标签区包含在200与300个核苷酸序列之间的一个核苷酸序列。在某些实施方案中,所述多个衔接子中的每个衔接子的样品标签区的长度为8个核苷酸。在一些实施方案中,所述核苷酸序列中的每个序列与240个核苷酸序列中的任何其他序列相隔的汉明距离为至少二。
在具体实施方案中,所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器。在一些实施方案中,所述多个衔接子中的每一个包含与所述样品标签区相邻的UMI倍增器。在某些实施方案中,所述多个衔接子中的每个衔接子的所述UMI倍增器的长度在1与5个核苷酸之间。在一些实施方案中,所述多个衔接子中的每个衔接子的所述UMI倍增器的长度为三个核苷酸。
在具体实施方案中,所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个,并且给定序列中的每个样品区仅与给定序列的四个锚定区中的一个配对。
在一些实施方案中,所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列;所述多个衔接子中的每个衔接子的样品标签区的长度为8个核苷酸;每个样品标签的核苷酸序列与所述多个衔接子的样品标签的任何其他核苷酸序列相隔的汉明距离为至少二;所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器;所述多个衔接子中的每个衔接子的所述UMI倍增器的长度为三个核苷酸;并且每个可能的核苷酸序列的UMI倍增器与所述多个衔接子的每个样品标签区配对;所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个;并且给定序列的每个样品区仅与给定序列的四个锚定区中的一个配对。
本发明的具体实施方案涉及一种方法,其中将基因组DNA片段与多个衔接子附接的步骤包括:(i)将包含锚定区的至少一部分的寡核苷酸附接至每个基因组DNA片段,其中包含锚定区的至少一部分的寡核苷酸是DNA双链体,所述DNA双链体包含与配偶体链双链化的5’磷酸化附接链,其中所述配偶体链通过在其3’端的化学修饰而被阻止附接,并且其中所述附接链附接至所述基因组DNA片段;(ii)使与包含所述锚定区的至少一部分的寡核苷酸附接的基因组DNA片段与编码所述多个衔接子中的每个衔接子核苷酸序列的全长衔接子序列的DNA寡核苷酸接触;以及(iii)在适合于DNA连接的条件下,使所述基因组DNA片段和编码所述全长衔接子序列的DNA寡核苷酸与T4多核苷酸激酶、Taq DNA连接酶和全长Bst聚合酶接触;从而将所述多个衔接子附接至所述基因组DNA片段。在一些实施方案中,所述基因组DNA片段是cfDNA。在某些实施方案中,分析DNA靶区域的拷贝数变化。
在具体实施方案中,对包含所述DNA靶区域的基因组DNA片段进行定量遗传分析的步骤(c)包括对在所述捕获探针与包含所述DNA靶区域的DNA文库片段之间形成的复合物进行纯化。在某些实施方案中,步骤(c)包括对在捕获探针与包含DNA靶区域的DNA文库片段之间形成的复合物进行纯化,从而预形成包含来自所述基因组DNA文库的目标区域的DNA文库片段的引物延伸和/或扩增。在一些实施方案中,步骤(c)包括对在捕获探针与包含DNA靶区域的DNA文库片段之间形成的复合物进行纯化,从而预形成包含来自所述基因组DNA文库的目标区域的DNA文库片段的引物延伸和扩增。在某些实施方案中,步骤(c)包括对所述包含DNA靶区域的DNA文库片段进行DNA测序,以生成多个测序读段。
在一些实施方案中,本发明涉及一种方法,其中所述基因组分析包括测定目标DNA区域中的拷贝数变化,并且其中步骤(c)对所述包含DNA靶区域的基因组DNA片段进行定量遗传分析包括测定源自所述测试样品的基因组DNA文库中存在的目标区域的拷贝数,以及将其与源自参考样品的基因组DNA文库中存在的目标区域的拷贝数进行比较,其中所述参考样品包含已知拷贝数目的DNA靶区域。
在一些实施方案中,测定所述目标区域中的拷贝数包括对包含DNA靶区域的DNA文库片段进行DNA测序,以生成多个测序读段,其中每个测序读段包含独特分子标识元件(UMIE)。在一些实施方案中,所述UMIE包含来自所述衔接子和至少一部分所述基因组DNA序列的测序信息。在一些实施方案中,包含相同UMIE的测序读段被鉴定为独特基因组序列(UGS)。
在一些实施方案中,测定所述拷贝数的方法还包括针对与所述基因组DNA文库接触的所述捕获探针中的每一个测定原始基因组深度(RGD)。在一些实施方案中,测定RGD包括测定与一组样品重复中的每个捕获探针序列相关联的UGS的平均数目。在一些实施方案中,与高度可变数目的UGS相关联的捕获探针被鉴定为噪声探针并且从进一步的计算中去除。在一些实施方案中,测定RGD还包括计算样品的RGD,其包括计算所述样品中针对所有捕获探针的所有RGD的数值平均值。在一些实施方案中,在计算样品的RGD中不包括针对噪声探针的RGD值。
在一些实施方案中,通过将针对每个捕获探针的RGD转换成探针特异性归一化读段计数将实验组中所有样品中针对捕获探针的RGD归一化,其包括(i)使样品中的每个捕获探针RGD乘以归一化常数,其中所述归一化常数包括任何实数;以及(ii)使(i)的乘积除以对于相应样品计算的RGD;或(iii)使(i)的乘积除以从探针子集计算的平均RGD。在一些实施方案中,所述探针子集是对照探针组。
在一些实施方案中,将所述探针特异性归一化读段计数转换成拷贝数值,其包括(i)在源自女性的样品中使针对常染色体和/或X连锁区的探针的探针特异性归一化读段计数乘以2;(ii)在源自男性的样品中使针对Y连锁和/或X连锁区的探针的探针特异性归一化读段计数乘以1;(iii)对实验中的所有样品的(i)和/或(ii)的乘积取平均值;以及(iv)使(i)和/或(ii)的乘积除以(iii)的平均值。在一些实施方案中,对于针对靶向特异性基因的所有探针的近似拷贝数值取平均值。
在一些实施方案中,本发明涉及一种用于高灵敏地检测拷贝数增加和拷贝数丢失的方法,其包括(i)测定针对捕获探针的RGD;(ii)通过将针对所述捕获探针的RGD转换成探针特异性归一化读段计数,对实验组中所有样品中针对捕获探针的RGD进行归一化;(iii)计算针对每个探针特异性归一化读段计数的近似拷贝数值;(iv)对于针对靶向特异性基因的所有探针的近似拷贝数值取平均值。
在一些实施方案中,本发明涉及一种用于测量染色体稳定性的方法,其包括(i)设计和验证一种或多种染色体稳定性探针的组,其中所述染色体稳定性探针均匀分布在人染色体上;(ii)使用所述一种或多种染色体稳定性探针对患者样品进行靶向测序;(iii)针对每种染色体探针测定近似拷贝数值;(iv)测定患者样品的基因组表型,其中所述患者样品中针对一种或多种染色体探针的拷贝数值的波动表明基因组不稳定性。
在一些实施方案中,本发明涉及治疗有需要的受试者中的癌症的方法,其中所述受试者已根据权利要求62所述的方法被鉴定为具有去稳定化的基因组,其中治疗所述癌症的所述方法包括给予药学有效量的PARP抑制剂。
在一些实施方案中,本发明涉及一种方法,其中所述基因组分析包括测定目标DNA区域中的拷贝数变化,并且其中步骤(c)对所述包含DNA靶区域的基因组DNA片段进行定量遗传分析包括测定源自所述测试样品的基因组DNA文库中存在的目标区域的拷贝数,以及将其与源自参考样品的基因组DNA文库中存在的目标区域的拷贝数进行比较,其中所述参考样品包含已知拷贝数目的DNA靶区域。在一些实施方案中,所述目标区域是基因或所述基因的一部分。在具体实施方案中,所述基因与疾病有关。在某些实施方案中,所述疾病是癌症。在各种实施方案中,所述基因是BRCA2、ATM、BRCA1、BRIP1、CHEK2、FANCA、HDAC2和/或PALB2。
具体实施方案涉及包含多个DNA文库片段的基因组DNA文库,其中所述DNA文库片段中的每一个包含衔接子和基因组DNA片段;其中所述衔接子是包含扩增区、样品标签区和锚定区的DNA多核苷酸;其中所述扩增区包含能够充当PCR扩增的引物识别位点的多核苷酸序列;其中所述样品标签包含编码所述独特文库DNA片段的特征且编码所述测试样品的特征的多核苷酸序列;并且其中所述锚定区包含编码所述测试样品的特征的多核苷酸序列,并且其中所述锚定区能够附接至所述基因组DNA片段。在一些实施方案中,所述样品标签还包含独特分子标识符(UMI),其中UMI有助于鉴定独特基因组DNA片段。在具体实施方案中,所述扩增区的长度在10与50个核苷酸之间。在具体实施方案中,所述扩增区的长度为25个核苷酸。在具体实施方案中,所述样品标签的长度在5与50个核苷酸之间。在某些实施方案中,所述样品标签的长度为8个核苷酸。在一些实施方案中,UMI倍增器与所述样品标签区相邻或包含在所述样品标签区内。在具体实施方案中,所述UMI倍增器的长度在1与5个核苷酸之间。在某些实施方案中,所述锚定区的长度在1与50个核苷酸之间。在一些实施方案中,所述锚定区的长度为10个核苷酸。在具体实施方案中,所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列。在一些实施方案中,所述样品标签中的每个核苷酸序列与所述样品的核苷酸序列中的任何其他序列相隔的汉明距离为至少二。在某些实施方案中,所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器。在具体实施方案中,所述多个衔接子中的每一个包含与所述样品标签区相邻的UMI倍增器。在一些实施方案中,所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个,并且其中给定序列中的每个样品区仅与给定序列的四个锚定区中的一个配对。在一些实施方案中,所述基因组DNA片段是cfDNA。
在某些实施方案中,所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列;所述多个衔接子中的每个衔接子的样品标签区的长度为8个核苷酸,所述多个衔接子中的每个衔接子的样品标签区包含核苷酸序列,所述核苷酸序列与所述多个衔接子的样品标签的任何其他核苷酸序列相隔的汉明距离为至少二,所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器,所述多个衔接子中的每个衔接子的所述UMI倍增器的长度为三个核苷酸,并且每个可能的核苷酸序列的UMI倍增器与所述多个衔接子的每个样品标签区配对,所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个,并且给定序列的每个样品区仅与给定序列的四个锚定区中的一个配对。在一些实施方案中,所述基因组DNA片段是cfDNA。
某些实施方案涉及多个基因组DNA文库,其包含多于一个本文所述的基因组文库。在一些实施方案中,属于所述多个基因组DNA文库的基因组DNA文库的样品标签区的核酸序列不同于属于所述多个基因组DNA文库的其他基因组DNA文库的样品标签区的核酸序列。在具体实施方案中,属于所述多个基因组DNA文库的基因组DNA文库的扩增区的核酸序列与属于多个基因组DNA文库的其他基因组DNA文库的扩增区的核酸序列相同。
某些实施方案涉及一种用于无细胞DNA(cfDNA)的DNA靶区域的遗传分析的方法,其包括:(a)生成如本文所述的DNA文库;(b)使cfDNA文库与特异性地结合DNA靶区域的多个捕获探针接触,从而在所述捕获探针与包含所述DNA靶区域的DNA文库片段之间形成复合物;并且(c)对包含所述DNA靶区域的cfDNA片段进行定量遗传分析;从而对所述DNA靶区域进行遗传分析。
某些实施方案涉及一种预测、诊断或监测受试者中遗传疾病的方法,其包括:(a)从所述受试者获得测试样品;(b)从所述测试样品分离基因组DNA;(c)生成包含多个DNA文库片段的DNA文库,其中所述DNA文库片段中的每一个包含来自所述测试样品的基因组DNA片段和衔接子;(d)使cfDNA文库与特异性地结合DNA靶区域的多个捕获探针接触,从而在所述捕获探针与包含所述DNA靶区域的DNA文库片段之间形成复合物;以及(e)对cfDNA克隆文库中与所述遗传疾病相关的一个或多个靶基因座进行定量遗传分析,其中所述一个或多个靶基因座中的一个或多个遗传病变的鉴定或检测是对于所述遗传疾病的进展的预后、诊断或监测。在具体实施方案中,所述定量遗传分析包括DNA测序以生成多个测序读段。
具体实施方案涉及用于生成基因组DNA文库的编码独特基因组DNA片段的特征和测试样品的特征的衔接子组,其中所述衔接子组中的每个衔接子是包含扩增区、样品标签区和锚定区的DNA多核苷酸;其中所述扩增区包含能够充当PCR扩增的引物识别位点的多核苷酸序列;其中所述样品标签包含编码所述独特文库DNA片段的特征且编码所述测试样品的特征的多核苷酸序列;并且其中所述锚定区包含编码所述测试样品的特征的多核苷酸序列,并且其中所述锚定区能够附接至所述基因组DNA片段。在一些实施方案中,所述样品标签还包含独特分子标识符(UMI),其中UMI有助于鉴定独特基因组DNA片段。在各种实施方案中,所述扩增区的长度在10与50个核苷酸之间。在某些实施方案中,所述扩增区的长度为25个核苷酸。在具体实施方案中,所述样品标签的长度在5与50个核苷酸之间。在一些实施方案中,所述样品标签的长度为8个核苷酸。在具体实施方案中,UMI倍增器与所述样品标签区相邻或包含在所述样品标签区内。在一些实施方案中,所述UMI倍增器的长度在1与5个核苷酸之间。在具体实施方案中,所述锚定区的长度在1与50个核苷酸之间。在一些实施方案中,所述锚定区的长度为10个核苷酸。在某些实施方案中,所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列。
在一些实施方案中,所述样品标签中的每个核苷酸序列与所述衔接子组的样品标签中的任何其他核苷酸序列相隔的汉明距离为至少二。在各种实施方案中,所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器。在具体实施方案中,所述多个衔接子中的每一个包含与所述样品标签区相邻的UMI倍增器。
在一些实施方案中,所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个,并且其中给定序列中的每个样品区仅与给定序列的四个锚定区中的一个配对。如权利要求75所述的衔接子组,其中所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列;其中每个衔接子的样品标签区的长度为8个核苷酸;其中所述样品标签的每个核苷酸序列与所述衔接子组的样品标签的任何其他核苷酸序列相隔的汉明距离为至少二,其中所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器,其中所述多个衔接子中的每个衔接子的所述UMI倍增器的长度为三个核苷酸,其中所述UMI倍增器包含64个可能的核苷酸序列中的一个,并且其中所述64个可能的核苷酸序列中每一个的UMI倍增器与所述多个衔接子的每个样品标签区配对,其中所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个;并且其中给定序列的每个样品区仅与给定序列的四个锚定区中的一个配对。
附图说明
图1示出了拷贝数丢失(CNL)测定的框架。每个基因(行)显示出特征性的独特读段值,此处用阴影表示。每个样品(列)都在同一组基因中被询问。
图2示出了展示CNL测定信号的驱动器的图。
图3示出了展示对无细胞DNA(cfDNA)进行的说明性CNL测定的步骤的图。
图4A至图4E示出了说明性第一代衔接子(图4A和图4B)和本发明的衔接子(图4C至图4E)的图。图4A示出了第一代衔接子设计。图4B示出了在第一代衔接子中,存在249个可能的序列标签的集合,长度为5个核苷酸(nt)的每个序列标签附接至单个锚定序列。图4C示出了第二代衔接子的图。图4D示出了应用于单个样品的说明性衔接子组,其由四组8mer标签序列组成,其中每组具有60个成员。每组60个标签特定针对四个锚定序列中的一个。图4E示出了47nt衔接子的说明性DNA序列。
图5A至图5B示出了展示在样品标签内移动UMI倍增器的位置可以增加独特样品标签的数目的图。
图6A和图6B示出了展示针对CNL测定构建基因组文库的过程的图。图6A示出了10nt锚定序列附接至基因组片段的3'端的步骤。图6B示出了将全长基因组衔接子退火至初始锚定序列的步骤。
图7显示了到CNL文库中的DNA输入。示出了琼脂糖凝胶图像,其中标记物的大小(bp)在左侧示出。
图8A至图8C示出了通过CNL分析测定的八个样品中测量的基因拷贝的常规盒须图。
图9A至图9B示出了Log10 P值图,其将片段化基因组样品的CNL测量中的与正常值的显著偏差定量化。顶部的SNP百分比示出了存在于ΔATM和ΔBRCA2样品中的罕见杂合SNP的低等位基因频率。
图10A至图10B示出了Log10 P值图,其将掺有片段化基因组DNA的cfDNA样品的CNL测量中的与正常值的显著偏差定量化。顶部的SNP百分比示出了存在于ΔATM和ΔBRCA2样品中的罕见杂合SNP的低等位基因频率。
图11A至图11D示出了靶向杂交捕获平台。图11A示出了通过添加衔接子序列将cfDNA转化成基因组文库,所述衔接子序列为每个基因组克隆提供通用的单引物PCR扩增序列、样品多路复用标签和独特分子标识符。图11B示出了与靶特异性捕获探针杂交的变性扩增基因组和引物延伸。图11C示出了不对称配对端测序的示意图。图11D示出了来自典型靶向捕获序列运行的377,711,020个Illumina NextSeq读段的映射统计。98.5%的读段映射至其预期靶标。在去重复后,20.40%的读段(77,053,048)源自独特基因组克隆。
图12A至图12H示出了来自池1-3的衔接子寡核苷酸的序列。
图13A至图13H示出了来自池4-6的衔接子寡核苷酸的序列。
图14A至图14I示出了来自池7-9的衔接子寡核苷酸的序列。
图15A至图15H示出了来自池10-12的衔接子寡核苷酸的序列。
图16A至图16H示出了来自池13-15的衔接子寡核苷酸的序列。
图17A至图18H示出了来自池16-18的衔接子寡核苷酸的序列。
图18A至图18H示出了来自池19-21的衔接子寡核苷酸的序列。
图19A至图19H示出了来自池22-24的衔接子寡核苷酸的序列。
图20A至图20H示出了来自池25-27的衔接子寡核苷酸的序列。
图21A至图21H示出了来自池28-30的衔接子寡核苷酸的序列。
图22A至图22H示出了来自池31-32的衔接子寡核苷酸的序列。
图23A至图23C示出了TP53基因的靶向测序。图23A示出了捕获探针的BedFile展示。图23B示出了在0到8000个独特读段的范围内的每个基础位置处的覆盖深度。图23C示出了已知TP53剪接变体的UCSC基因模型展示。较厚的矩形区域代表TP53编码的蛋白质的氨基酸编码区。
图24A至图24C示出了16个样品中针对单个探针TP53r10_1的原始和归一化的独特读段密度。图24A示出了对于16个独立样品在通过“去重复”去除冗余读段之后通过探针TP53r10_1所得的原始独特读段捕获数目。图24B示出了对于所有16个样品的2596个捕获探针的独特读段的总体平均值。图24C示出了16个样品中的归一化独特读段深度(计算如下:[来自探针TP53r10_1的样品n独特读段×常数÷来自样品n的总体平均独特读段/探针])。
图25示出了任何给定TP53探针内所有16个样品的归一化独特读段计数的一般一致性,尽管探针之间有显著平均深度变化。所有16个样品的归一化独特读段计数显示为紧密间隔的条形图的“柱”;示出了靶向TP53的所有45个探针的结果。用箭头突出显示两个表现出“噪声”计数行为的探针。来自此类探针的计数通常在随后的拷贝数分析中显示为异常值。
图26展示了2596个探针的广泛组的归一化逐探针独特读段计数的样品间一致性。示出了来自三个代表性样品的散点图。每个点代表不同的探针。x轴是16个样品中每个探针的归一化平均独特读段深度。y轴是对于三个不同单独样品的每个探针的归一化独特读段深度。一致的逐探针独特读段计数支持染色体拷贝变异的定量分析。
图27A至图27C展示了来自健康女性和男性供体和来自晚期前列腺癌症患者的cfDNA的拷贝数分析。图27A示出了来自健康女性供体的cfDNA的分析。x轴是靶向来自所有22个常染色体的区域的一系列对照探针、靶向X连锁AR基因的一系列探针以及靶向TP53基因的编码区的一系列探针。Y轴示出了每个探针的计算倍性。通过将观察到的独特读段计数针对一系列已知倍性的对照样品进行归一化,计算每个探针的近似值([样品_Z的探针_Y的独特读段计数]×2÷[多个对照样品的探针_Y的平均独特读段计数])。图27B展示了X连锁AR基因在健康男性中显示出单倍体拷贝数。图27C展示了来自晚期前列腺癌症患者的cfDNA的拷贝数分析,并示出了对照探针中非常明显的非整倍性、AR基因扩增和TP53基因丢失的证据。
图28示出了相对于对照样品,前列腺患者cfDNA文库的全基因组非整倍性分析。示出了通过染色体分类的239个对照探针中的每一个的近似倍性。患者2号染色体探针显示一致的拷贝丢失,并且大多数5号染色体探针显示拷贝增加。对于许多但非全部的患者对照探针,观察到近似倍性的显著偏差。
图29示出了拷贝数丢失检测的分析验证。将来自永生化系NA02718(单等位基因ΔATM)和来自NA09596(单等位基因ΔBRCA2)的基因组DNA以16%掺入来自NA12878的“黄金标准”基因组DNA中,产生相当于8%双等位基因缺失低等位基因频率。在靶向测序和CNV分析之后,对两个靶基因的逐探针倍性取平均值。示出了两个未受干扰的对照基因BRIP1和HDAC2用于比较。
具体实施方式
A.概述
本发明尤其包括可用于检测细胞基因组DNA(例如,来自组织活检样品)或cfDNA(例如,来自血液样品)的样品内的突变、SNP、易位、倒位、缺失、拷贝数变化或其他遗传变异的组合物和方法。本发明的组合物和方法特别适用于以精确的分辨率检测来自生物样品(例如血液)的cfDNA中非常难以检测的拷贝数变异。特别地,本发明的一些实施方案涉及一种用于通过以下方式检测来自测试样品的DNA靶区域的拷贝数的方法:通过生成由附接至衔接子的基因组DNA片段构成的基因组DNA文库、用多个捕获探针捕获DNA靶区域、分离包含所述DNA靶区域的DNA文库片段以及对所述DNA靶区域进行定量遗传分析,从而测定DNA靶区域的拷贝数。本文所述的衔接子允许鉴定正在测序的单独DNA片段,以及所述样品或基因组DNA来源的特征。
本发明部分地考虑适用于几种样品类型的用于检测靶特异性拷贝数变化的组合物和方法,其包括但不限于直接组织活检和外周血。在癌症基因组学,并且特别在用于分析实体瘤的无细胞DNA(cfDNA)测定的上下文中,肿瘤DNA的量通常是整个DNA的非常小的部分。此外,在基因组DNA测定并且特别在拷贝数变化可能仅存在于来自样品的总基因组DNA的一部分中的基因组DNA测定(例如cfDNA测定)中,难以检测出拷贝数丢失。例如,从癌症患者中提取的大多数无细胞DNA将源自正常来源并具有二倍体拷贝数(除了男性受试者中的X连锁基因)。在癌症患者中,源自肿瘤的DNA的部分通常具有低等位基因频率,例如这样的患者,其中从血浆中提取的循环DNA的2%源自肿瘤。肿瘤抑制基因(例如,乳腺癌中的BRCA1)的一个拷贝的丢失意味着缺乏可检测的基因组片段的低等位基因频率为1%。在这种情况下,改造的拷贝数丢失测定必须能够区分100个拷贝(正常)与99个拷贝(杂合基因丢失)。因此,具体的实施方案考虑到本发明的方法和组合物允许以足够的分辨率检测拷贝数变化,以在低等位基因频率下即使在cfDNA的情况下也能检测拷贝数变化。
为了达到这种区分水平,本发明提供了新型样品衔接子设计。本发明的衔接子被设计成包含对成功的拷贝数丢失测定性能而言至关重要的特征,其包括(i)跨衔接子的均匀的性能;(ii)大量独特分子标识符(UMI);(iii)高效附接;以及(iv)样品多路复用的适应性。例如,本发明的衔接子提供以下项:
跨衔接子的均匀的性能:生物信息学分析通常会研究样品内探针性能和样品间探针性能。因此,预期跨样品的衔接子池之间的任何性能波动将负面地影响CNL分析所需的检测细微变化的能力。在本发明中,这种性能均匀性通过具有全部在每个样品标签池中得以表示的多个锚定标签和增加用于鉴定基因组片段的独特样品标签序列的一个UMI倍增器来实现,在所述多个锚定标签中固定的样品标签区(用于鉴定样品和基因组片段)被随机选择用于每个池。
大量独特分子标识符(UMI):虽然从分子生物学的角度来看,衔接子必须在功能上等效,但它们必须具有能加强对独特基因组片段的鉴定的大量独特序列标签(≥10,000)。在本文背景中,“加强”意味着每个基因组克隆片段具有特定的一对片段化位点,其对应于基因组序列中双链DNA被切割的位置。该切割位点用于区分独特基因组克隆,因为每个克隆可能具有不同的切割位点。然而,在具有数千个独立克隆的文库中,独特衍生的片段通常具有完全相同的切割位点。共用相同切割位点的基因组克隆(即片段)可以相对于源自相同样品的其他克隆序列而被分类为独特的或冗余的。通过附接能引入高度多样性的序列标签的衔接子,共用相同切割位点的不同基因组克隆更可能被鉴定为独特的。在该系统中,UMI是通过样品标签区与UMI倍增器的组合产生的。UMI和所述切割位点的组合产生了独特分子标识符元件(UMIE),其有助于将序列读段分类为冗余读段或独特读段。具体实施方案考虑到UMI倍增器可以包含更长或更短的序列来增加或降低整体UMI复杂性。
高效附接:衔接子必须高效附接至基因组片段。在大多数肿瘤学应用中,可用的细胞DNA或cfDNA的量是有限的,因此这些基因组片段向基因组文库克隆的转化必须是高效的。为了实现这一点,在本发明的一些方面,本文所述的衔接子系统将约25%至约50%或更多的基因组输入片段转化到基因组文库克隆中。
样品多路复用的适应性:通常,必须有不同衔接子组的池,其中组中的每个独特衔接子附接至不同的样品。同时,所述衔接子组中的每个成员必须具有与所述组中的所有其他成员基本上相同的行为(从序列计数的角度)。为了实现这一点,在一些实施方案中,样品标签区在任何其他可能的样品标签组合之间的汉明距离为2,从而减少了读段被错误地分配至错误样品的机会。在一些实施方案中,每组衔接子被分成与特定锚定区配对的池,从而允许进一步降低样品解复用中出错的可能性。例如,在汉明距离为2的8mer标签中,可能序列的总数为16,384。
在具体实施方案中,提供了预先指定的衔接子寡核苷酸池。这种预先指定的池用于表示单个样品。也就是说,X个衔接子寡核苷酸(在上面给出的例子中为16,384个衔接子寡核苷酸)的每个池中的每个衔接子序列与用于鉴定其他样品的每个其他池中的每个衔接子序列不同。本领域技术人员将认识到对于衔接子寡核苷酸可能的不同预先指定的池的数目将取决于样品标签和/或UMI倍增器的长度。
因此,在某些实施方案中,衔接子包含序列,即样品标签和相邻和/或所包含的UMI倍增器,其代表或鉴定样品并且独特地鉴定基因片段。这与本领域中使用的当前系统形成鲜明对比,所述系统使用随机生成的标签来鉴定所述序列,并使用单独的条形码或测序仪索引以允许多路复用。
用于检测从样品获得的DNA内的靶特异性拷贝数变化的说明性实施方案示于图3中。当图3由cfDNA生成DNA文库时,该说明性程序可以与来自其他来源的DNA(例如片段化的细胞DNA)一起使用。如图3所示,收集cfDNA(上图)。接下来,通过将本发明的基因组文库衔接子(灰色圆圈)与基因组DNA缀合,由cfDNA生成基因组文库。用识别感兴趣的基因组区域的捕获探针(黑色圆圈)捕获基因组DNA片段。对目标基因组DNA进行测序,并进行数据分析以对目标基因组DNA进行拷贝丢失分析和/或表征。
除非特别相反地指出,否则本发明的具体实施方案的实践将采用本领域技术范围内的化学、生物化学、有机化学、分子生物学、微生物学、重组DNA技术、遗传学、免疫学和细胞生物学的常规方法,为了说明的目的下文中描述了其中许多方法。此类技术在文献中得到充分解释。参见例如,Sambrook,等人,Molecular Cloning:A Laboratory Manual(第3版,2001);Sambrook,等人,Molecular Cloning:A Laboratory Manual(第2版,1989);Maniatis等人,Molecular Cloning:A Laboratory Manual(1982);Ausubel等人,CurrentProtocols in Molecular Biology(John Wiley和Sons,2008年7月更新);ShortProtocols in Molecular Biology:A Compendium of Methods from Current Protocolsin Molecular Biology,Greene Pub.Associates and Wiley-Interscience;Glover,DNACloning:A Practical Approach,第I和II卷(IRL Press,Oxford,1985);Anand,Techniques for the Analysis ofComplex Genomes,(Academic Press,New York,1992);Transcription and Translation(B.Hames和S.Higgins编,1984);Perbal,A PracticalGuide to Molecular Cloning(1984);以及Harlow和Lane,Antibodies,(Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.,1998)。
B.定义
除非另外定义,本文所用的全部技术术语和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同意义.尽管在发明的实施和测试中可以使用任何相似于或等效于本文中所述那些的方法和材料,本文描述了组合物、方法和材料的优选实施方案。出于本发明的目的,以下术语定义如下。
冠词“一个”、“一种”和“所述”在本文中用于指代该冠词的一个或多于一个(即至少一个)语法对象。举例来说,“一种元件”意指一种元件或多于一种元件。
替代方案(例如,“或”)的使用应理解为意指替代方案中的一个、两个或任何组合。
术语“和/或”应理解为意指替代方案中的一个或两个。
如本文所用,术语“约”或“近似”是指与参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度相比变化多达15%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度。在一个实施方案中,术语“约”或“近似”是指在参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度周围±15%、±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%或±1%的数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度范围。
在整个说明书中,除非上下文另有要求,否则词语“包含”(“comprise”、“comprises”和“comprising”)应被理解为暗示包含所述步骤或元件或步骤或元件的组但不排除任何其他步骤或元件或步骤或元件的组。在具体实施方案中,术语“包括”、“具有”、“含有”和“包含”同义使用。
“由……组成”意味着包括并限于短语“由……组成”之后的任何内容。因此,短语“由……组成”表示所列出的元件是必需的或强制性的,并且不存在其他元件。
“基本上由……组成”意味着包括在该短语之后列出的任何元件,并且限于不干扰或有助于本公开中针对所列元件指定的活动或行动的其他元件。因此,短语“基本上由……组成”表示所列元件是必需的或强制性的,但是没有其他元件是任选的且可以存在或可以不存在,这取决于它们是否影响所列元件的活动或行动。
在本说明书中引用“一个实施方案”、“实施方案”、“具体实施方案”、“相关实施方案”,“某个实施方案”、“附加的实施方案”或“另外的实施方案”或其组合意味着结合该实施方案描述的特定特征、结构或特性被包括在本发明的至少一个实施方案中。因此,在整个说明书中各个地方出现的前述短语不一定都指的是相同的实施方案。此外,具体特征、结构或特性可以在一个或多个实施方案中以任何合适的方式组合。
如本文所用,术语“分离的”意指这样的物质,所述物质大体上或基本上不含在它的天然状态下通常伴随它的组分。在具体实施方案中,术语“获得的”或“衍生的”与“分离的”同义使用。
如本文所用,术语“DNA”是指脱氧核糖核酸。在各种实施方案中,术语DNA指基因组DNA、重组DNA、合成DNA或cDNA。在一个实施方案中,DNA是指基因组DNA或cDNA。在具体实施方案中,DNA包含“靶区域”。本文考虑的DNA文库包括由RNA(例如RNA表达文库)构建的基因组DNA文库和cDNA文库。在各种实施方案中,DNA文库包含一个或多个附加的DNA序列和/或标签。
术语“靶基因座”和“DNA靶区域”在本文中可互换使用,并且是指DNA序列内的目标区域。在各种实施方案中,在靶基因座上进行靶向遗传分析。在具体实施方案中,DNA靶区域是与以下相关的基因区域:具体遗传状态、遗传病症、遗传疾病;胎检;遗传嵌合、亲子鉴定;预测对药物治疗的反应;诊断或监测医疗病症;微生物组分析;病原体筛查;或器官移植监测。在另外的实施方案中,DNA靶区域是与特定人染色体(如特定的常染色体或X连锁染色体)或其区域(例如,独特染色体区域)相关的DNA序列。
如本文所用,术语“循环DNA”、“循环无细胞DNA”和“无细胞DNA”通常可互换使用并且是指这样的DNA,它是细胞外DNA、已从细胞中排出的DNA或已从坏死或凋亡细胞中释放的DNA。该术语通常与“细胞基因组DNA”或“细胞DNA”形成对比,后者在本文中可互换使用,并且是指这样的基因组DNA(即核酸酶),它包含在细胞内并且只有通过裂解或以其他方式破坏细胞的完整性才可用于分子生物学技术,如本文所述的那些技术。
本文所用的“受试者”、“个体”或“患者”包括表现出可用本文考虑的组合物检测或鉴定的病症症状的任何动物。合适的受试者包括实验室动物(如小鼠、大鼠、兔子或豚鼠)、农场动物(如马、牛、羊、猪)和家畜或宠物(如猫或狗)。在具体实施方案中,受试者是哺乳动物。在某些实施方案中,受试者是非人灵长类动物,并且在优选的实施方案中,受试者是人。
如本文所用,术语“配对的”当关于两个不同多核苷酸序列或包含不同多核苷酸序列的DNA区域使用时,意味着两个不同多核苷酸序列或包含不同多核苷酸序列的DNA区域存在于相同的多核苷酸上。例如,如果DNA的特定样品标签区被称为与DNA的特定扩增区配对,则意味着所述样品标签区和扩增标签存在于相同的DNA多核苷酸分子上。
C.拷贝数分析方法
在各种实施方案中,提供了用于DNA靶区域DNA的拷贝数分析的方法。在某些实施方案中,通过生成各自含有基因组DNA片段和衔接子的DNA文库片段的基因组DNA文库、分离含有DNA靶区域的DNA文库片段以及对DNA靶区域进行定量遗传分析来进行拷贝数分析。“定量遗传分析”意指通过任何分子生物学技术进行的分析,所述技术能够量化DNA(例如,基因、基因座、目标靶区域等)的变化,包括但不限于DNA突变、SNP、易位、缺失和拷贝数变异(CNV)。在某些实施方案中,定量遗传分析通过测序例如新一代测序进行。
新一代DNA测序(NGS)非常适合两种诊断应用。首先是大规模的DNA序列测定。在目前的情况下,这种能力使得能够搜索罕见的、可操作的变体,所述变体指导有效的治疗决策。第二种是对基因拷贝数计数。数百万个独立序列的输出使得能够在全基因组范围内精确测量基因拷贝数。从母体血液样品进行胎儿三体性的非侵入性产前检测的出现证明了这种能力。RNAseq(即使用NGS进行基因表达分析的技术)是另一个例子,但输入是RNA(cDNA)而不是基因组DNA。Samorodnitsky等人J Mol Diagn.2015年1月;17(1):64-75等人描述了当前捕获方法的比较。
本发明将NGS计数能力扩展到靶向杂交捕获方法的领域。本文描述的方法至少部分地因为它们具有以下四个品质而对拷贝数变异的检测有效:
(a)本方法区分独特克隆与冗余克隆。扩增的基因组DNA文库片段的NGS测序产生多个单独NGS读段,每个读段包含与特定人基因组序列连接的衔接子编码的序列信息。这些元件定义了每个克隆的特征。因为通过PCR扩增捕获的基因组区域,所以在随后的NGS分析中多次遇到相同的克隆并不罕见。源自单个克隆和捕获过程的读段组被称为“冗余读段”。基于由独特分子标识元件(UMIE)提供的测序信息,两个或更多个冗余读段被鉴定为冗余读段。UMIE是指来自衔接子标签的序列信息和基因组DNA序列的起点的组合。包含相同UMIE的两个或更多个读段被鉴定为冗余读段。冗余读段被分组在一起,并且从冗余读段的家族组装单个代表性共有序列。该共有序列被称为“独特读段”或“独特基因组序列”(UGS)。每个独特读段代表来自原始DNA样本的单独克隆。鉴定和分组冗余克隆家族以及生成代表该家族的单个独特读段的过程被定义为“去重复”。用于创建基因组文库的衔接子具有非常深的独特样品标签信息库(每个衔接子具有15,360个密码)。当与每个捕获的基因组克隆的精确映射坐标(其相对于捕获探针可以跨越>100个不同位置)一起应用时,在基因组文库中生成并随后通过靶特异性捕获探针检索的每个独特克隆具有与包含相同捕获环境的所有其他独特克隆区分开来的极高可能性。区分独特克隆与冗余克隆的能力是本文所述方法的核心。
(b)用于创建基因组文库的衔接子在不产生衔接子之间拷贝数计数的可变性的情 况下允许样品多路复用。拷贝数测定的中心基础是同时分析已全部在单个测序运行中处理的样品组。这允许将阳性和阴性对照与临床样品一起包括在内。先前衔接子设计迭代的主要问题引起相同对照样品中基因拷贝计数的微妙变化,从而实际上设置信噪比不确定性阈值,其在基于血液的实体肿瘤基因分型测定中太高而不具有临床应用性。本发明克服了这个问题并且显著降低了信噪比阈值,使得在≤2%低等位基因频率时能检测到单拷贝基因丢失。这种改进的信号识别使得本发明的方法在循环肿瘤DNA测定中具有显著的临床实用性。
(c)本文使用的专有靶向杂交捕获方法必须在所有靶标上产生高度统一的“中靶” 读段覆盖。依赖于对独特基因组片段计数以估计拷贝数的方法(如本文所述的方法)在遇到所有可能的独特片段方面必须实现接近饱和。接近饱和只能通过过采样来实现,也就是说,收集超过最终遇到的独特读段数量的测序读段。为了实用性、可扩展性和经济性,靶向杂交捕获文库中的独特读段必须显示出足够的均匀性,使得<10倍中靶读段过采样,并且优选<4倍中靶读段过采样将捕获靶基因座处>90%的独特中靶读段。
(d)靶向杂交捕获方法(参见美国专利公开号2014-0274731)必须具有高中靶捕获 率。为了实用性、可扩展性和经济性,换言之是为了成为本公开相对于本领域其他技术的区别性特征,所述方法必须实现>90%、优选>95%的中靶读段。由于中靶映射率超过95%,对于中靶读段的4至10倍过采样的要求和对于整体过采样的要求是相同的。
在一些实施方案中,样品中存在的DNA靶区域的拷贝数通过定量遗传分析确定。在一些实施方案中,通过比较样品中存在的DNA靶区域的拷贝量并将其与具有已知拷贝数的一个或多个样品中存在的DNA靶区域的量进行比较来确定DNA靶区域的拷贝数。
具体实施方案考虑到本文所述的组合物和方法特别适用于检测基因组DNA样品中的拷贝数变化,其中样品中总基因组DNA的仅一部分具有拷贝数变化。例如,样品例如无细胞DNA的样品中可能存在显著的肿瘤突变,所述肿瘤突变以显著小于50%(例如,在0.1%至>20%的范围内)的低等位基因频率存在,这与常规SNP基因分型(其中等位基因频率通常为约100%、50%或0%)不同。本领域技术人员将认识到,本发明的组合物和方法还可用于检测其他类型的突变,包括单核苷酸变异(SNV)、短(例如,少于40个碱基对(bp))插入和缺失(indel)、和基因组重排,其包括致癌基因融合。
在某些实施方案中,本文描述的本发明的组合物和/或方法可用于、能够、适合于和/或能检测、鉴定、观察和/或揭示一个或多个DNA靶区域的拷贝数变化,所述一个或多个DNA靶区域存在于少于约20%、少于约19%、少于约18%、少于约17%、少于约16%、少于约15%、少于约14%、少于约13%、少于约12%、少于约11%、少于约10%、少于约9%、少于约8%、少于约7%、少于约6%、少于约5%、少于约4%、少于约3%、少于约2%、少于约1%、少于约0.5%、少于约0.2%或少于约0.1%的来自样品的总基因组DNA中。在一些实施方案中,本发明的方法可用于、能够、适合于和/或能检测、鉴定、观察和/或揭示一个或多个DNA靶区域的拷贝数变化,所述一个或多个DNA靶区域存在于在约0.01%至约100%、约0.01%至约50%和或约0.1%至约20%的来自样品的总基因组DNA中。
具体实施方案由图1中所示的概念框架表示。在图1中,每个基因由一行表示,并且每个患者样品表示为一列。在任何给定的基因组DNA样品中,对于每个单独基因计数的片段的数目将具有一些可变性,并且对于任何给定的目标DNA区域(例如基因),拷贝数的扰动被检测为相对于针对其他样品中DNA靶区域的归一化计数的显著片段计数偏差。这种测定要求样品内的逐基因片段计数特征是可再现的,并且还要求逐样品计数特征具有高度可比性。两种测定要求都需要优异的信噪比计数鉴别。
一些实施方案考虑到有助于增加信噪比的测定元件是基因组输入、探针数目和测序深度,如图2所示。
在具体实施方案中,用于cfDNA遗传分析的方法包括:生成和扩增cfDNA文库、测定cfDNA文库中基因组当量的数目;并对一个或多个基因组靶基因座进行定量遗传分析。
具体实施方案考虑到本文所述的任何方法和组合物可有效地用于使用基因组DNA(例如细胞或cfDNA)来有效地分析、检测、诊断和/或监测遗传状态、遗传病症、遗传疾病、遗传嵌合、胎儿诊断、亲子鉴定、微生物组分析、病原体筛查以及器官移植监测,其中样品中总基因组DNA的全部或仅部分具有目标特征,例如遗传病变、突变、单核苷酸变异(SNV)。在一些实施方案中,目标特征是与疾病或病症相关的遗传特征。例如,样品例如cfDNA的样品中可能存在显著的肿瘤突变,所述肿瘤突变以明显小于50%(例如,在0.1%至>20%的范围内)的低等位基因频率存在,这与常规SNP基因分型(其中等位基因频率通常为约100%、50%或0%)不同。
在某些实施方案中,本文描述的本发明的组合物和/或方法可用于、能够、适合于和/或能检测、鉴定、观察和/或揭示一个或多个DNA靶区域的遗传病变,所述一个或多个DNA靶区域存在于少于约20%、少于约19%、少于约18%、少于约17%、少于约16%、少于约15%、少于约14%、少于约13%、少于约12%、少于约11%、少于约10%、少于约9%、少于约8%、少于约7%、少于约6%、少于约5%、少于约4%、少于约3%、少于约2%、少于约1%、少于约0.5%、少于约0.2%或少于约0.1%的来自样品的总基因组DNA中。在一些实施方案中,本发明的方法可用于、能够、适合于和/或能检测、鉴定、观察和/或揭示一个或多个DNA靶区域的遗传病变,所述一个或多个DNA靶区域存在于在约0.01%至约100%、约0.01%至约50%和或约0.1%至约20%的来自样品的总基因组DNA中。
1.生成DNA文库
在具体实施方案中,本文考虑的遗传分析方法包括生成DNA文库,包括用一种或多种末端修复酶处理cfDNA或片段化的细胞基因组DNA以生成末端修复的DNA,并将一个或多个衔接子附接至末端修复的DNA的各端以生成DNA文库。基因组DNA
在具体实施方案中,本文考虑的方法和组合物被设计为使用基因组DNA作为分析物来有效地分析、检测、诊断和/或监测拷贝数变化。在某些实施方案中,通过从测试样品(例如生物样品如组织活检)获得的基因组DNA生成基因组DNA文库来进行拷贝数分析。在某些实施方案中,基因组DNA是循环或无细胞DNA。在一些实施方案中,基因组DNA是细胞基因组DNA。
在某些实施方案中,基因组DNA是从组织样品或取自组织的活检获得,所述组织包括但不限于骨髓、食道、胃、十二指肠、直肠、结肠、回肠、胰腺、肺、肝、前列腺、脑、神经、脑膜组织、肾组织、子宫内膜组织、宫颈组织、乳房、淋巴结、肌肉和皮肤。在某些实施方案中,组织样品是肿瘤或疑似肿瘤的活检。在具体实施方案中,肿瘤是癌性的或怀疑是癌性的。在具体实施方案中,组织样品包括癌细胞或怀疑具有癌性的细胞。
从细胞或从由细胞构成的生物组织中纯化基因组DNA的方法是本领域公知的,并且技术人员将根据组织和获得组织的条件识别最佳程序或商业试剂盒。一些实施方案考虑到从组织中纯化细胞DNA将需要细胞破碎或细胞裂解以暴露其中的细胞DNA,例如通过化学和物理方法,如混合、研磨或超声处理组织样品;通过添加也用于细胞裂解的洗涤剂或表面活性剂去除膜脂质,任选例如通过添加蛋白酶去除蛋白质;去除RNA,例如通过添加RNase;以及例如从在细胞裂解步骤中使用的洗涤剂、蛋白质、盐和试剂中纯化DNA。DNA纯化可以通过例如采用乙醇或异丙醇的沉淀进行;通过苯酚-氯仿萃取进行。
在具体实施方案中,从组织和/或细胞获得的细胞DNA在获得、生成、制备、形成和/或产生如本文所述的基因组DNA文库之前和或期间被片段化。本领域技术人员将理解存在几种适合于DNA片段化的技术,并且本领域技术人员能够识别和鉴定适合于为了生成用于DNA测序(其包括但不限于新一代测序)的基因组DNA文库的目的片段化细胞DNA的技术。某些实施方案考虑到通过包括但不限于物理片段化、酶促片段化和化学剪切的方法可以将细胞DNA片段化成对于生成文库而言合适的和/或足够的长度的片段。
物理片段化可包括但不限于声学剪切、超声处理和流体动力学剪切。在一些实施方案中,细胞DNA通过物理片段化进行片段化。在具体实施方案中,通过声学剪切或超声处理将细胞DNA片段化。具体实施方案考虑到声学剪切和超声处理是用于剪切细胞DNA的常用物理方法。仪器(Woburn,MA)是一种用于将DNA破坏为100bp-5kb bp的声学装置。Covaris还制造管(gTubes),它将样品处理为6-20kb以用于Mate-Pair文库。/>(Denville,NJ)是一种用于剪切染色质、DNA和破坏组织的超声装置。可以将少量DNA剪切至150个碱基-1kb长度。来自Digilab(Marlborough,MA)的Hydroshear利用水动力来剪切DNA。雾化器(Life Tech,Grand Island,NY)也可用于使用压缩空气雾化液体,从而在几秒钟内将DNA剪切成100个碱基-3kb片段。雾化成本低,但该过程可导致原始样品中损失约30%的细胞DNA。在某些实施方案中,细胞DNA通过超声处理片段化。
酶促片段化可以包括但不限于用限制性内切核酸酶(例如DNase I)处理或用非特异性核酸酶处理。在一些实施方案中,细胞DNA通过酶促片段化进行片段化。在具体实施方案中,通过用限制性内切核酸酶处理将细胞DNA片段化。在一些实施方案中,通过用非特异性核酸酶处理将细胞DNA片段化。在某些实施方案中,通过用转座酶处理将细胞DNA片段化。某些实施方案考虑到将细胞DNA剪切成小片的酶促方法包括DNAse I、麦芽糖结合蛋白(MBP)-T7 Endo I和非特异性核酸酶创伤弧菌(Vvn)New England Biolabs(Ipswich,MA)片段化酶的组合以及Nextera标记技术(Illumina,San Diego,CA)。非特异性核酸酶和T7Endo的组合协同作用以产生非特异性切口和反切口,从而生成从切口位点解离8个核苷酸或更少核苷酸的片段。标记使用转座酶来同时将衔接子片段化并插入双链DNA上。
化学片段化可包括用热和二价金属阳离子处理。在一些实施方案中,基因组DNA通过化学片段化进行片段化。具体实施方案考虑到化学剪切更常用于长RNA片段而不是基因组DNA的分解。化学片段化通常通过用二价金属阳离子(镁或锌)热消化DNA来进行。可以通过增加或减少孵育时间来调节DNA片段的长度。
在具体实施方案中,本文考虑的方法和组合物被设计为使用无细胞DNA(cfDNA)作为分析物来有效地分析、检测、诊断和/或监测拷贝数变化。cfDNA的大小分布范围为约150bp至约180bp片段。cfDNA的片段化可能是核酸内切和/或核酸外切活性的结果,并且呈现出对cfDNA的准确、可靠和稳健的分析的强大挑战。分析cfDNA的另一个挑战是它在血流中的半衰期短,约15分钟。不希望受任何特定理论的约束,本发明部分地考虑到cfDNA的分析类似于“液体活检”并且是当前生物过程的实时快照。
此外,由于cfDNA不存在于细胞内,并且可以从包括但不限于生物流体和粪便样品的许多合适的来源获得,因此不受困扰新一代测序分析的现有限制(如直接获取被分析的组织)。
作为在具体实施方案中从中分离cfDNA的合适来源的生物流体的说明性例子包括但不限于羊水、血液、血浆、血清、精液、淋巴液、脑脊液、眼内液、尿液、唾液、粘液和汗液。在具体实施方案中,生物流体是血液或血浆。
在某些实施方案中,市售的试剂盒和技术人员已知的其他方法可用于直接从受试者的生物流体或从先前获得的和任选稳定的生物样品例如通过冷冻和/或添加包括但不限于EDTA、EGTA或对二价阳离子有特异性的其他螯合剂的酶螯合剂来分离cfDNA。
(a)生成末端修复的cfDNA
在具体实施方案中,生成基因组DNA文库包括分离的cfDNA或片段化细胞DNA的末端修复。片段化的cfDNA或细胞DNA由末端修复酶处理以生成具有平端、5'-突出端或3'-突出端的末端修复的cfDNA。在一些实施方案中,例如末端修复酶可以产生。在一些实施方案中,末端修复的cfDNA或细胞DNA含有平端。在一些实施方案中,末端修复的细胞DNA或cfDNA被处理成含有平端。在一些实施方案中,末端修复的cfDNA或细胞DNA的平端被进一步修饰以含有单个碱基对突出端。在一些实施方案中,含有平端的末端修复的cfDNA或细胞DNA可被进一步处理以含有腺嘌呤(A)/胸腺嘧啶(T)突出端。在一些实施方案中,含有平端的末端修复的cfDNA或细胞DNA可被进一步处理以含有作为单碱基对突出端的腺嘌呤(A)/胸腺嘧啶(T)突出端。在一些实施方案中,末端修复的cfDNA或细胞DNA具有非模板化的3'突出端。在一些实施方案中,末端修复的cfDNA或细胞DNA被处理以含有3'突出端。在一些实施方案中,末端修复的cfDNA或细胞DNA用末端转移酶(TdT)处理以含有3'突出端。在一些实施方案中,可以通过TdT添加G尾部。在一些实施方案中,使用通过任何已知的限制酶(例如用酶Sau3A等)的部分消化,将末端修复的cfDNA或细胞DNA处理成含有突出端。
(b)将衔接子分子附接至末端修复的cfDNA
在具体实施方案中,生成cfDNA文库包括将一个或多个衔接子附接至末端修复的cfDNA的各端。本发明部分地考虑了衔接子模块,其被设计为在cfDNA文库中容纳大量基因组当量。衔接子模块被配置成测量cfDNA文库中存在的基因组当量的数目,并且通过扩展被配置成测量用于鉴定序列突变的测序测定的灵敏度。
如本文所用,术语“衔接子”和“衔接子模块”可互换使用,并且是指包含至少三种元件的多核苷酸:扩增区、样品标签区和锚定区。在具体实施方案中,衔接子包含扩增区、样品标签区和锚定区。在一些实施方案中,衔接子还包含独特分子标识符(UMI)。在具体实施方案中,衔接子包含一个或多个扩增区、一个或多个样品标签区、一个或多个UMI和/或一个或多个锚定区。在一些实施方案中,衔接子以从5’到3’的顺序包含扩增区、样品标签区、UMI和锚定区。在具体实施方案中,衔接子以从5’到3’的顺序包含扩增区、样品标签区、UMI和锚定区。在某些实施方案中,UMI被包含在样品标签区内,并且衔接子以从5’到3’的顺序包含扩增区、整合的样品标签/UMI区和锚定区。
如本文所用,术语“扩增区”是指衔接子分子的元件,其包含能够充当PCR扩增的引物识别位点的多核苷酸序列。在具体实施方案中,衔接子包含扩增区,其包含用于基因组DNA文库的单引物扩增的一个或多个引物识别序列。在一些实施方案中,扩增区包含基因组DNA文库的单引物扩增的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个引物识别序列。
在一些实施方案中,扩增区的长度在约5与50个核苷酸之间、10与45个核苷酸之间、15与40个核苷酸之间或20与30个核苷酸之间。在一些实施方案中,扩增区为10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、约18个核苷酸、19个核苷酸、20个核苷酸、21个核苷酸、22个核苷酸、23个核苷酸、24个核苷酸、25个核苷酸、26个核苷酸、27个核苷酸、28个核苷酸、29个核苷酸、30个核苷酸、31个核苷酸、32个核苷酸、33个核苷酸、34个核苷酸、35个核苷酸、36个核苷酸、37个核苷酸、38个核苷酸、39个核苷酸或40个核苷酸或更多。在具体实施方案中,所述扩增区的长度为25个核苷酸。
如本文所用,术语“样品标签”或“样品标签区”可互换使用,并且是指衔接子的元件,所述元件包含独特地鉴定特定DNA片段以及衍生出它的样品的多核苷酸序列。
在某些实施方案中,样品标签区的长度在3与50个核苷酸之间、3与25个核苷酸之间或5与15个核苷酸之间。在一些实施方案中,样品标签区的长度为3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、约11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸或更多。
在某些实施方案中,衔接子包含UMI倍增器,其中UMI倍增器的长度为至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10个核苷酸。
在某些实施方案中,UMI倍增器的每个核苷酸位置可以包含腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶中的任何一种。因此,在一些实施方案中,包含n个核苷酸的UMI倍增器可以包含n4个可能的核苷酸序列中的任何一种。在一些实施方案中,UMI倍增器的长度为一个核苷酸并且包含四个可能序列中的一个。在一些实施方案中,UMI倍增器的长度为两个核苷酸并且包含十六个可能序列中的一个。在一些实施方案中,UMI倍增器的长度为三个核苷酸并且包含64个可能序列中的一个。在一些实施方案中,UMI倍增器的长度为四个核苷酸并且包含256个可能序列中的一个。在一些实施方案中,UMI倍增器的长度为五个核苷酸并且包含1,024个可能序列中的一个。在一些实施方案中,UMI倍增器的长度为六个核苷酸并且包含4,096个可能序列中的一个。在一些实施方案中,UMI倍增器的长度为七个核苷酸并且包含16,384个可能序列中的一个。在一些实施方案中,UMI倍增器的长度为八个核苷酸并且包含65,5336个可能序列中的一个。在一些实施方案中,UMI倍增器的长度为九个核苷酸并且包含262,144个可能序列中的一个。在一些实施方案中,UMI倍增器的长度为十个或更多个核苷酸并且包含1,048,576或更多个可能序列中的一个。
在具体实施方案中,衔接子包含UMI倍增器,其中UMI倍增器与样品标签区相邻或包含在样品标签区内(图5A)。与样品标签相邻或包含在样品标签内的UMI倍增器的说明性例子在图5B中示出。在图5B中,示出了8-mer样品标签区,其具有相邻的UMI倍增器(顶部和底部行)或并入样品标签内的UMI倍增器(中间7行)。在一些实施方案中,该衔接子包含长度为八个核苷酸的样品标签和长度为三个核苷酸的UMI倍增器,并且包含64个可能序列中的一个,并且其中UMI倍增器与样品标签区相邻或包含在样品标签区内。在一些实施方案中,相同的过程将全长衔接子附接至基因组片段的另一端。
在具体实施方案中,衔接子模块包含一个或多个锚定序列。如本文所用,“锚定区”和“锚定序列”可互换使用,并且是指与配偶体寡核苷酸杂交的核苷酸序列。在一些实施方案中,锚定区包含以下三个特性:(1)每个锚定序列是两个或更多个锚定序列的家族的一部分,所述锚定序列共同表示延伸内每个位点处的四个可能的DNA碱基中的每一个;这一特征(平衡的碱基表示)可用于在具体实施方案中校准测序读段中的正确碱基调用;(2)每个锚定序列仅由四个可能碱基中的两个组成,并且这两个碱基被特别选择为相同数目的A+C或相同数目的G+T;仅由两个碱基形成的锚定序列降低了锚定序列参与二级结构形成的可能性,这将阻碍正常的衔接子功能;以及(3)因为每个锚定序列由相同数目的A+C或G+T组成,所以每个锚定序列与四个一组中的每个其他锚定序列具有大致相同的解链温度和双链体稳定性。
在一些实施方案中,锚定序列的长度在1与50个核苷酸之间。在一些实施方案中,锚定序列的长度在4与40个核苷酸之间。在某些实施方案中,所述锚定区的长度在5与25个核苷酸之间。在具体实施方案中,锚定区的长度为至少4个核苷酸、至少6个核苷酸、至少8个核苷酸、至少10个核苷酸、至少12个核苷酸、至少14个核苷酸或至少16个核苷酸。在具体实施方案中,所述锚定区的长度为10个核苷酸。
在具体实施方案中,附接步骤包括将衔接子模块附接/连接至末端修复的cfDNA或细胞DNA以生成“标记的”基因组DNA文库。在一些实施方案中,使用单个衔接子模块。在一些实施方案中,使用两个、三个、四个或五个衔接子模块。在一些实施方案中,将具有相同序列的衔接子模块附接至片段化的末端修复的DNA的各端。
在一些实施方案中,将多个衔接子种类附接至末端修复的细胞或无细胞基因组DNA片段。多个衔接子中的每一个可以包含用于cfDNA或细胞DNA文库的扩增的一个或多个扩增区、用于cfDNA或细胞基因组DNA片段的鉴定和单独样品的鉴定的一个或多个样品标签区以及用于DNA测序的一个或多个序列。
在一些实施方案中,将多个衔接子种类附接至样品的末端修复的细胞或无细胞基因组DNA片段,并且所述多个衔接子全部包含具有相同核苷酸序列的扩增区。
在某些实施方案中,来自样品的基因组DNA与包含样品标签序列的多个衔接子附接,所述样品标签序列全部不同于附接至来自其他样品的基因组DNA片段的衔接子中的样品标签区的其他序列。
在具体实施方案中,多个衔接子种类附接至来自样品的末端修复的细胞或无细胞基因组DNA片段,并且所述多个衔接子全部包含含有以下的一个或多个样品标签区:在2与10,000个核苷酸序列之间的一个核苷酸序列、在5与5,000个核苷酸序列之间的一个核苷酸序列、在25与1,000个核苷酸序列之间的一个核苷酸序列、在50与500个核苷酸序列之间的一个核苷酸序列、在100与400个核苷酸序列之间的一个核苷酸序列或在200与300个核苷酸序列之间的一个核苷酸序列。在一些实施方案中,每个衔接子的样品标签区的长度为8个核苷酸,并且所述多个衔接子中的每个样品标签区包含240个核苷酸序列中的一个。
在某些实施方案中,将多个衔接子种类附接至来自样品的末端修复的细胞或无细胞基因组DNA片段,并且所述多个衔接子的样品标签区包含汉明距离彼此相差1、2、3、4或大于4的核苷酸序列。在具体实施方案中,所述汉明距离为2。
在具体实施方案中,附接至样品的基因组DNA片段的多个衔接子的样品标签区的长度为8个核苷酸,并且包含汉明距离彼此相差2的240个核苷酸序列中的一个。
在某些实施方案中,样品标签区用于鉴定单独基因组DNA片段以及用于鉴定单独样品,即基因组文库来源。例如,当附接至样品的多个衔接子的样品标签具有240个可能序列中的一个时,每个样品被鉴定为具有240个可能标签中的一个,并且每个样品接收一组240个标签,这些标签与任何其他样品相隔的汉明距离为二(意味着需要两个碱基变化来将一种标签更改为另一种)。这些相同的标签用于枚举克隆多样性,因此它们也充当序列标签,即用于鉴定基因组DNA片段。为了进一步增加可能序列标签的多样性,可以添加UMI倍增器。例如,可以将UMI倍增器添加至包含由3个碱基的64种可能组合组成的3个核苷酸的衔接子区域。另外,多个衔接子可以包含多于一个锚定序列。例如,多个衔接子可以含有同时使用的4个不同的锚定序列。在样品解复用期间也可以使用这些锚定序列来减少错误。
图4示出了第一代衔接子(图4A和图4B)与本发明的衔接子(图4C至图4E)之间的说明性比较。图4A和图4B示出了第一代衔接子的例子,其长度为40nt并且由离散的PCR扩增序列、序列标签和样品标签组成。这里,样品由固定序列(序列标签)鉴定,所述固定序列存在于用于从样品生成DNA文库的所有衔接子上。通过单独且不同的序列(序列标签)鉴定单独基因组片段。图4C至图4E示出了来自本发明的衔接子的说明性例子。显示的说明性衔接子的长度为47个核苷酸,并且序列标签与样品标签组合。存在附加的3nt序列,即UMI倍增器,其由3个碱基的64种可能组合组成。10nt锚定序列是四个不同的相异序列中的一个。
因此,在说明性例子(参见图4C至图4E)中,与单个样品组合使用的衔接子组包含240个样品标签序列,其可以被分成四组样品标签序列,每组包含60种标签(每种核苷酸为一组:A、C、T和G)。因此,每组60个标签针对四个锚定序列中的一个是特异性的。总的来说,每个样品可以有240种可能样品标签配置的一个池。具体地,在这种情况下,240个样品标签序列被分成四组60个序列,其中每组涉及特定的锚定区。因此,样品ID不仅涉及来自八个核苷酸样品标签的序列信息,还涉及相关的锚定序列信息。此外,读段内序列的位置是固定的,因此样品标签和锚定序列必须在测序读段内具有固定位置,以通过包含过滤器以供下游考虑。此外,包含UMI倍增器将序列标签多样性从240增加至240×64=15,360种可能的序列标签。
本文考虑的一个或多个衔接子的附接可以通过本领域普通技术人员已知的方法进行。在具体实施方案中,将本文考虑的一个或多个衔接子附接至包含平端的末端修复的cfDNA。在某些实施方案中,将本文考虑的一个或多个衔接子附接至末端修复的cfDNA,所述cfDNA包含适合于所用附接方法的互补端。在某些实施方案中,将本文考虑的一个或多个衔接子附接至包含3'突出端的末端修复的cfDNA。
在一些实施方案中,将基因组DNA片段附接至多个衔接子包括将末端修复的cfDNA或细胞DNA片段附接至含有至少一部分锚定区的寡核苷酸的步骤。在一些实施方案中,寡核苷酸含有整个锚定区。在具体实施方案中,寡核苷酸是包含与配偶体链双链化的5’磷酸化附接链的DNA双链体,其中所述配偶体链通过在其3’端的化学修饰而被阻止附接,并且其中所述附接链附接至所述基因组DNA片段。在某些实施方案中,与至少一部分锚定区附接的DNA片段随后与编码全长衔接子序列的DNA寡核苷酸退火。在具体实施方案中,将一种或多种多核苷酸激酶、一种或多种DNA连接酶和/或一种或多种DNA聚合酶添加至编码全长衔接子序列的基因组DNA片段和DNA寡核苷酸中。在一些实施方案中,多核苷酸激酶是T4多核苷酸激酶。在一些实施方案中,DNA连接酶是Taq DNA连接酶。在某些实施方案中,DNA聚合酶是Taq聚合酶。在具体实施方案中,DNA聚合酶是全长Bst聚合酶。
图6示出了将多个衔接子附接至修复的DNA片段的3’端的说明性方法。在第一步中,将锚定序列附接至基因组片段的3’端。在该步骤中,锚部分是DNA双链体,其中十个核苷酸5’磷酸化的“附接链”与在其3’端通过化学修饰被阻止附接的八个核苷酸“配偶体链”双链化。锚双链体在磷酸化/封闭端是平端的,因此可以附接至平端的基因组片段。在下一步骤中,将编码完整衔接子序列的寡核苷酸池退火至初始锚定序列。T4多核苷酸激酶、TaqDNA连接酶和全长Bst聚合酶的组合作用如对于顶部链所示经由连接附接该寡核苷酸,并通过DNA聚合在底部链上延伸初始锚定序列以完成全长衔接子序列。可以使用相同的过程将全长衔接子附接至基因组片段的5'端。
2.DNA文库扩增
在具体实施方案中,本文考虑的遗传分析方法包括基因组DNA文库(例如细胞DNA文库或cfDNA文库)的扩增,以生成DNA克隆文库或DNA克隆的文库,例如cfDNA克隆文库或cfDNA克隆的文库,或者细胞DNA克隆文库或细胞DNA克隆的文库。DNA文库的每个分子包含附接至末端修复的DNA片段的各端的衔接子,并且每个衔接子包含一个或多个扩增区。在一些实施方案中,将不同的衔接子附接至末端修复的cfDNA的不同端。在具体实施方案中,将不同的衔接子附接至末端修复的细胞DNA的不同端。
在一些实施方案中,将相同的衔接子附接至DNA片段的两端。相同的衔接子附接至末端修复的DNA的两端允许采用单个引物序列的PCR扩增。在具体实施方案中,衔接子附接的cfDNA文库的一部分将使用采用单个引物序列驱动扩增的标准PCR技术进行扩增。在一个实施方案中,单个引物序列为约25个核苷酸,任选地在标准离子强度条件下预计Tm≥55℃。
在具体实施方案中,皮克的初始基因组DNA文库(例如细胞DNA文库或cfDNA文库)被扩增成微克的DNA克隆,这意味着10,000倍的扩增。扩增产物的量可以使用本领域已知的方法测量,例如在Qubit 2.0或Nanodrop仪器上定量来测量。
3.测定基因组当量的数目
在各种实施方案中,基因组DNA的遗传分析方法包括测定DNA克隆文库中基因组当量的数目。如本文所用,术语“基因组当量”是指每个文库中基因组拷贝的数目。本文考虑的组合物和方法遇到的重要挑战是达到足够的测定灵敏度以检测和分析罕见的遗传突变或遗传序列的差异。为了在逐样品基础上确定测定灵敏度值,通过测量测序文库中存在的基因组当量的数目来测量每个样品中存在的不同和有区别的序列的数目。为了建立灵敏度,必须测量每个样品文库的基因组当量的数目。
基因组当量的数目可以在进行测序后通过qPCR测定或通过使用基于生物信息学的计数来测定。在临床样品的工艺流程中,基因组当量的qPCR测量用作DNA文库(例如cfDNA文库或基因组DNA文库)的QC步骤。该步骤在序列分析之前建立了对测定灵敏度的期望值,并且允许从分析中排除样品,条件是该样品相应的DNA克隆文库缺乏所需的基因组当量深度。最终,基于生物信息学的基因组当量计数也用于鉴定每个给定DNA克隆文库的基因组当量,并因此鉴定测定灵敏度和假阴性估计。
经验qPCR测定和统计计数测定应该具有良好的相关性。在测序未能揭示DNA克隆文库中的序列深度的情况下,可能需要重新处理DNA克隆文库和/或附加的测序。
在一个实施方案中,使用定量PCR(qPCR)测定来测定细胞DNA或cfDNA克隆文库中的基因组当量。在具体实施方案中,使用已知浓度的标准文库来构建标准曲线,并且将来自qPCR测定的测量值拟合至得到的标准曲线,并且从所述拟合推导出基因组当量的值。本发明人已发现包括一个与基因组中的共同序列特异性地杂交的引物(例如重复序列)和另一个结合衔接子中引物结合位点的引物的“基于重复”的qPCR测定与仅使用衔接子特异性引物(存在于cfDNA克隆的两端)的方法相比,测量到的基因组当量增加8倍。通过基于重复的测定测量的基因组当量的数目提供了更一致的文库间性能以及在测序运行中基因组当量的qPCR估计与生物信息学计数的标签当量之间更好的比对。
适用于本文考虑的基于重复的基因组当量测定的重复的说明性例子包括但不限于:短散布核元件(SINE),例如Alu重复;长散布核元件(LINE),例如LINE1、LINE2、LINE3;微卫星重复元件,例如短串联重复(STR),简单序列重复(SSR);以及哺乳动物广泛散布重复(MIR)。
在一个实施方案中,所述重复是Alu重复。
4.定量遗传分析
在各种实施方案中,用于基因组DNA(例如基因组细胞或cfDNA)的遗传分析的方法包括DNA文库克隆的一个或多个靶基因座的定量遗传分析。定量遗传分析包括以下步骤中的一个或多个或全部:捕获包含靶基因座的DNA克隆;捕获的靶向基因座的扩增;对扩增的捕获靶向基因座进行测序;以及生成的序列读段的生物信息学分析。如本文所用,术语“DNA文库克隆”是指DNA文库片段,其中衔接子和基因组DNA片段的组合产生独特DNA序列(例如,可以区别于另一个DNA文库克隆的DNA序列)。
(a)捕获靶基因座
本发明部分地考虑了捕获探针模块,其被设计为保持较大探针的效率和可靠性,但最小化包含较小DNA片段的基因组DNA文库(例如cfDNA克隆文库)中的无信息序列生成。如本文所用的“捕获探针”或“捕获探针模块”可互换使用,并且是指包含捕获探针序列和尾序列的多核苷酸。在具体实施方案中,捕获探针模块序列或其部分充当一个或多个测序引物的引物结合位点。
在具体实施方案中,捕获探针模块包含捕获探针。如本文所用,“捕获探针”是指能够与特异性DNA靶区域杂交的区域。在一些实施方案中,捕获探针与由细胞DNA构建的基因组DNA文库一起使用。在具体实施方案中,捕获探针与由cfDNA构建的基因组DNA文库一起使用。因为cfDNA的平均大小为约150至约170bp并且是高度片段化的,所以某些实施方案所涉及的本文考虑的组合物和方法包括使用高密度和相对短的捕获探针来询问目标DNA靶区域。在一些实施方案中,捕获探针能够与以均匀密度分布在所有染色体区段上的DNA靶区域杂交。一组这样的捕获探针在本文中称为“染色体稳定性探针”。染色体稳定性探针用于询问全基因组范围的拷贝数变异,以提供染色体拷贝数(例如,染色体倍性)的全基因组测量。
使用高密度捕获探针的一个特别关注点是通常使用特定的“序列规则”设计捕获探针。例如,在设计捕获探针时通常排除冗余序列的区域或显示出极端碱基组成偏差的区域。然而,本发明人已经发现捕获探针设计规则缺乏灵活性基本上不影响探针性能。相反,严格根据位置约束选择的捕获探针提供中靶序列信息;显示出极少的脱靶和不可映射的读段捕获;并且产生统一的、有用的中靶读段,只有少数例外。此外,紧密探针间距的高冗余度大大补偿了偶尔性能较差的捕获探针。
在具体实施方案中,靶区域被多个捕获探针靶向,其中任何两个或更多个捕获探针被设计为与靶区域在彼此10个核苷酸内、在彼此15个核苷酸内、在彼此20苷酸内、在彼此25个核苷酸内、在彼此30个核苷酸内、在彼此35个核苷酸内、在彼此40个核苷酸内、在彼此45个核苷酸内或在彼此50个核苷酸或更多个核苷酸内以及在所有中间的核苷酸长度内结合。
在一个实施方案中、捕获探针为约25个核苷酸、约26个核苷酸、约27个核苷酸、约28个核苷酸、约29个核苷酸、约30个核苷酸、约31个核苷酸、约32个核苷酸、约33个核苷酸、约34个核苷酸、约35个核苷酸、约36个核苷酸、约37个核苷酸、约38个核苷酸、约39个核苷酸、约40个核苷酸、约41个核苷酸、约42个核苷酸、约43个核苷酸、约44个核苷酸或约45个核苷酸。
在一个实施方案中,捕获探针为约100个核苷酸、约200个核苷酸、约300个核苷酸、约400个核苷酸或约100个核苷酸。在另一个实施方案中,捕获探针为约100个核苷酸至约500个核苷酸、约200个核苷酸至约500个核苷酸、约300个核苷酸至约500个核苷酸或约400个核苷酸至约500个核苷酸或其任何中间范围。
在具体实施方案中,捕获探针为60个核苷酸。在另一种实施方案中,捕获探针基本上小于60个核苷酸,但与靶向相同DNA靶区域的60个核苷酸捕获探针相比,可比较地、相当地或更好地杂交。在某个实施方案中,捕获探针为40个核苷酸。
在某些实施方案中,捕获探针模块包含尾序列。如本文所用,术语“尾序列”是指捕获探针模块的5'端的多核苷酸,它在具体实施方案中可充当引物结合位点。在具体实施方案中,测序引物结合尾区中的引物结合位点。
在具体实施方案中,尾序列为约5至约100个核苷酸、约10至约100个核苷酸、约5至约75个核苷酸、约5至约50个核苷酸、约5至约25个核苷酸或约5至约20个核苷酸。在某些实施方案中,第三区域为约10至约50个核苷酸、约15至约40个核苷酸、约20至约30个核苷酸或约20个核苷酸或任何中间数目的核苷酸。
在具体实施方案中,尾序列为约30个核苷酸、约31个核苷酸、约32个核苷酸、约33个核苷酸、约34个核苷酸、约35个核苷酸、约36个核苷酸、约37个核苷酸、约38个核苷酸、约39个核苷酸或约40个核苷酸。
在各种实施方案中,捕获探针模块包含结合对的特定成员,使得能够分离和/或纯化与捕获探针杂交的标记和/或扩增的基因组DNA文库(例如,细胞或cfDNA文库)的一个或多个捕获片段。在具体实施方案中,捕获探针模块与生物素或另一种合适的半抗原(例如二硝基苯酚、地高辛)缀合。
在各种实施方案中,捕获探针模块与标记的和任选扩增的DNA文库杂交以形成复合物。在一些实施方案中,多功能捕获探针模块基本上与DNA文库中的特异性基因组靶区域杂交。
杂交(“Hybridization”或“hybridizing”)条件可以包括任何反应条件,其中两个核苷酸序列形成稳定的复合物;例如,标记的DNA文库和捕获探针模块形成稳定的标记DNA文库-捕获探针模块复合物。这种反应条件是本领域公知的,并且本领域技术人员将理解,这样的条件可以适当地并且在本发明的范围内改变,例如,较短长度的捕获探针的情况下降低退火温度。当捕获探针复合物的第二区域显示出与标记的DNA文库的区域100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、85%、80%、75%或70%序列同一性、同源性或互补性时,可发生大量杂交。
在具体实施方案中,捕获探针为约40个核苷酸,并且最佳退火温度为约44℃至约47℃。
在某些实施方案中,本文考虑的方法包括分离标记的cfDNA文库-捕获探针模块复合物。在具体实施方案中,用于分离DNA复合物的方法是本领域技术人员公知的,并且本领域技术人员认为合适的任何方法都可以与本发明的方法一起使用(Ausubel等人,CurrentProtocols in Molecular Biology,2007-2012)。在具体实施方案中,使用生物素-链霉亲和素分离技术分离复合物。
在具体实施方案中,考虑从分离的标记DNA文库片段-捕获探针模块复合物中去除单链3'-端。在某些实施方案中,所述方法包括3'-5'外切核酸酶酶促处理分离的标记DNA文库-多功能捕获探针模块复合物以去除单链3'端。
在某些其他实施方案中,所述方法包括利用分离的标记DNA文库片段作为模板,进行多功能捕获探针的5'-3′DNA聚合酶延伸。
在某些其他实施方案中,所述方法包括通过5’FLAP内切核酸酶、DNA聚合和通过DNA连接酶的切口闭合的协同作用产生杂交捕获探针分离的标记DNA靶分子,例如标记的cfDNA靶分子或标记的细胞DNA靶分子。
多种酶可用于分离的标记DNA文库-多功能捕获探针模块复合物的3'-5'外切核酸酶酶促处理。在具体实施方案中可以使用的显示出3'-5'外切核酸酶酶活性的合适酶的说明性例子包括但不限于:T4或外切核酸酶I、III、V(还参见,Shevelev IV,Hübscher U.,NatRev Mol Cell Biol.3(5):364-76(2002))。在具体实施方案中,包含3'-5'外切核酸酶活性的酶是T4聚合酶。在具体实施方案中,可以使用显示出3'-5'外切核酸酶酶活性并且能够进行引物模板延伸的酶,其包括例如T4或外切核酸酶I、III、V(同上)。
在一些实施方案中,本文考虑的方法包括对上文和本文其他地方讨论的经3'-5'外切核酸酶酶促处理的复合物进行测序和/或PCR。在具体实施方案中,复制捕获探针分子的尾部以生成杂交核酸分子。在一个实施方案中,生成的杂交核酸分子包含能够与捕获探针模块和捕获探针模块尾序列的互补体杂交的靶区域。
在特定的实施方案中,遗传分析包括a)将一个或多个捕获探针模块与多个基因组DNA文库克隆中的一个或多个靶基因座杂交,以形成一个或多个捕获探针模块-DNA文库克隆复合物;b)从a)分离一个或多个捕获探针模块-DNA文库克隆复合物;c)酶促处理来自步骤b)的一个或多个分离的捕获探针模块-DNA文库克隆复合物;d)对来自c)的经酶促处理的复合物进行PCR,其中复制捕获探针分子的尾部以生成扩增的杂交核酸分子,其中扩增的杂交核酸分子包含能够与捕获探针和捕获探针模块尾序列的互补体杂交的靶基因组基因座中的靶序列;以及e)对来自d)的经扩增的杂交核酸分子进行定量遗传分析。
在具体实施方案中,考虑了用于测定特异性靶基因座的拷贝数的方法,其包括:a)将一个或多个捕获探针模块与多个DNA文库克隆中的一个或多个靶基因座杂交,以形成一个或多个捕获探针模块-DNA文库克隆复合物;b)从a)分离一个或多个捕获探针模块-DNA文库克隆复合物;c)酶促处理来自步骤b)的一个或多个分离的捕获探针模块-DNA文库克隆复合物;d)对来自c)的经酶促处理的复合物进行PCR,其中复制捕获探针分子的尾部以生成扩增的杂交核酸分子,其中扩增的杂交核酸分子包含能够与捕获探针和捕获探针模块尾序列的互补体杂交的靶基因组基因座中的靶序列;e)对d)中的经扩增的杂交核酸分子进行PCR扩增;以及f)量化e)中的PCR反应,其中量化允许测定特异性靶区域的拷贝数。
在一个实施方案中,步骤c)的酶促处理包括使用具有3'-5'外切核酸酶活性的酶对来自b)的一个或多个捕获探针模块-DNA文库克隆复合物进行3'-5'外切核酸酶酶促处理,以去除单链3'端;通过5’FLAP内切核酸酶、DNA聚合和通过DNA连接酶的切口闭合的协同作用产生一个或多个杂交捕获探针模块-cfDNA文库克隆分子;或使用复合物中分离的DNA克隆作为模板进行捕获探针的5'-3’DNA聚合酶延伸。
在一个实施方案中,步骤c)的酶促处理包括使用复合物中分离的DNA克隆作为模板进行捕获探针的5'-3'DNA聚合酶延伸。
在具体实施方案中,PCR可以使用本领域技术人员公知的任何标准PCR反应条件进行。在某些实施方案中,e)中的PCR反应使用两个PCR引物。在一个实施方案中,e)中的PCR反应使用第一PCR引物,其与靶基因座内的重复杂交。在具体实施方案中,e)中的PCR反应使用第二PCR引物,其与靶基因座/尾连接处的杂交核酸分子杂交。在某些实施方案中,e)中的PCR反应使用与靶基因座杂交的第一PCR引物和与靶基因座/尾连接处的扩增的杂交核酸分子杂交的第二PCR引物。在具体实施方案中,第二引物与靶基因座/尾连接杂交,使得引物的至少一个或多个核苷酸与靶基因座杂交,并且引物的至少一个或多个核苷酸与尾序列杂交。
在某些实施方案中,对从步骤e)获得的扩增的杂交核酸分子进行测序,并将序列水平地比对,即彼此比对但不与参考序列比对。在具体实施方案中,步骤a)至e)用一个或多个捕获探针模块重复一次或多次。捕获探针模块可以相同或不同,并且被设计为靶向靶基因座的cfDNA链。在一些实施方案中,当捕获探针不同时,它们在标记的cfDNA克隆文库中的靶基因座内的重叠或相邻靶序列处杂交。在一个实施方案中,使用高密度捕获探针策略,其中多个捕获探针与靶基因座杂交,并且其中所述多个捕获探针中的每一个在与标记的DNA克隆文库中的靶基因座杂交的任何其他捕获探针的约5、10、15、20、25、30、35、40、45、50、100、200bp或更多长度内(包括所有中间距离)与靶基因座杂交。
在一些实施方案中,所述方法可以使用每个靶基因座的两个捕获探针模块进行,其中一个与靶区域上游的“Watson”链(非编码或模板链)杂交,并且一个与靶区域下游的“Crick”链(编码或非模板链)杂交。
在具体实施方案中,本文考虑的方法可以进一步用任何数目的捕获探针模块进行多次,例如每个靶基因座的2、3、4、5、6、7、8、9或10个或更多个捕获探针模块,任何数目的所述捕获探针模块以任意组合与Watson或Crick链杂交。在一些实施方案中,获得的序列可以彼此比对以鉴定许多差异中的任何差异。
在某些实施方案中,使用一个或多个捕获探针模块询问多个靶基因座,例如在单个反应中询问100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、10000、50000、100000、500000个或更多个。
(b)测序
在具体实施方案中,定量遗传分析包括如本文其他地方所述对多个杂交核酸分子进行测序,以生成足够的测序深度以获得多个独特测序读段。术语“独特读段”或“独特基因组序列”(UGS)在本文中可互换使用,并通过将单独冗余读段分组为“家族”来鉴定。冗余读段是如下序列读段,其共用相同的UMIE(例如,在基因组序列内共用相同的读段密码和相同DNA序列起始位置)并且源自单个附接事件,因此是彼此的经扩增衍生的“同胞”。代表冗余读段家族的单个共有序列作为独特读段或UGS继续使用。每个独特读段或UGS被视为独特附接事件。对应于特定捕获探针的独特读段的总和被称为针对该特定捕获探针的“原始基因组深度”(RGD)。每个捕获探针产生一组独特读段,它通过分组为家族从总读段计算得出。然后将给定样品的独特读段(例如,样品的原始基因组深度)计算为在逐探针的基础上观察到的所有独特读段的平均值。独特读段是重要的,因为每个独特读段必须源自独特基因组DNA克隆。每个独特读段代表基因组DNA的单倍体当量的输入和分析。独特读段的总和是分析的单倍体基因组的总和。反过来,分析的基因组数目限定了测序测定的灵敏度。作为非限制性例子,如果平均独特读段计数是100个基因组当量,那么该特定测定具有能够检测100个中的一个突变读段或1%的灵敏度。任何低于此的观察结果都是不可靠的。
从用于计算样品平均值的数据组排除存在明显拷贝数变化的情况(例如,噪声探针的例子)。在本文中,“噪声探针”是指在大的相同样品组中捕获高度可变数目的独特读段(例如,12-16个样品重复中的高度可变数目的独特读段)的探针。在一些实施方案中,与样品的独特读段的平均数目相比,与噪声探针相关的独特读段的数目增加了50%或更多。在一些实施方案中,与样品的独特读段的平均数目相比,与噪声探针相关的独特读段的数目减少了50%或更多。在一些实施方案中,在特定分析中使用的约2%至约4%的探针被鉴定为噪声探针,并且从计算中排除以测定给定样品的独特读段的平均数目。
在一些实施方案中,测序读段被鉴定为“中靶读段”或“脱靶读段”。中靶读段具有基因组DNA序列,其位于用于产生基因组文库的捕获探针附近。在一些实施方案中,其中每个基因组序列与特异性捕获探针物理连接并且其中基因组区段和捕获探针的序列均被确定为统一的信息片段,中靶读段被定义为起始坐标位于相应捕获探针的3’端的400bp内且更通常位于200bp内的任何基因组序列。脱靶读段被定义为具有如下基因组序列,所述基因组序列相对于捕获探针在≥500个碱基对(并且更通常映射至完全不同的染色体)的位置处与参考基因组比对。
在具体实施方案中,定量遗传分析包括源自多个样品的杂交核酸分子的多重测序。
在各种实施方案中,定量遗传分析包括获得一个或多个或多个标记的DNA文库克隆,每个克隆包含第一DNA序列和第二DNA序列,其中第一DNA序列包含靶向基因座中的序列且第二DNA序列包含捕获探针序列;在一个或多个克隆上进行配对端测序反应并获得一个或多个测序读段或在所述一个或多个克隆上进行测序反应,其中获得大于约100、200、300、400、500个或更多个核苷酸的单个长测序读段,其中所述读段足以鉴定第一DNA序列和第二DNA序列;以及根据测序读段的探针序列对一个或多个克隆的测序读段进行排序或聚类。
(c)生物信息学分析
在各种实施方案中,定量遗传分析还包括测序读段的生物信息学分析。生物信息学分析排除了在没有用于测序的化合物或方法的情况下进行的任何纯粹的心理分析。在某些实施方案中,生物信息学分析包括但不限于:序列比对;基因组当量分析;单核苷酸变异(SNV)分析;基因拷贝数变异(CNV)分析;测量染色体拷贝数;以及检测遗传病变。在具体实施方案中,生物信息学分析可用于量化cfDNA克隆文库中分析的基因组当量数目;检测靶基因座的遗传状态;检测靶基因座中的遗传病变;以及测量靶基因座内的拷贝数波动。
可以在序列读段与一种或多种人参考DNA序列之间进行序列比对。在具体实施方案中,测序比对可用于检测靶基因座中的遗传病变,包括但不限于检测核苷酸转换或颠换、核苷酸插入或缺失、基因组重排、拷贝数变化或基因融合。检测作为因果或预后指标的遗传病变可用于诊断、预后、治疗和/或监测特定遗传病症或疾病。
本文还考虑了用于序列比对分析的方法,其可以在不需要与参考序列比对的情况下进行,这在本文中称为水平序列分析。可以对通过本文考虑的方法或任何其他方法生成的任何序列进行这种分析。在具体实施方案中,序列分析包括对通过本文考虑的方法获得的读段进行序列比对。
在一个实施方案中,在进行测序之后,使用基于生物信息学的计数来测定cfDNA克隆文库中的基因组当量。每个测序读段与特定捕获探针相关,并且分配至每个捕获探针的读段的集合被解析成组。在一组中,读段集在基因组序列内共用相同的读段密码和相同的DNA序列起始位置。这些单独读段被分组为“家族”,并且代表该家族的单个共有序列作为“独特读段”继续使用。构成家族的所有单独读段都源自单个附接事件,因此,它们是彼此的扩增衍生的“同胞”。每个独特读段被认为是独特的附接事件,并且独特读段的总和被认为等于所分析的基因组当量的数目。
随着独特克隆的数目接近可能的序列组合的总数,概率规定相同的密码和起始位点组合将通过独立事件创建,并且这些独立事件将不适当地分组在单个家族中。最终结果将是低估了所分析的基因组当量,并且罕见突变读段可能作为测序错误被丢弃,因为它们与具有相同标识符的野生型读段重叠。
在具体实施方案中,为了提供cfDNA克隆文库的准确分析,分析的基因组当量数目是可能的独特克隆数目的约1/10、约1/12、约1/14、约1/16、约1/18、约1/20、约1/25或更少。应该理解,以上概述的程序仅仅是说明性的而非限制性的。
在一些实施方案中,可能需要增加待分析的基因组当量的数目。为了增加基因组当量的深度,考虑了至少两种解决方案。第一种解决方案是每个样品使用多于一个衔接子组。通过组合衔接子,可以成倍地扩大可能克隆的总数,从而扩大基因组输入的舒适极限。第二种解决方案是将读段密码扩大1、2、3、4或5个或更多个碱基。与每个其他读段密码相差至少2个碱基的可能读段密码的数目以4(n-1)放大,其中n是读段密码内的碱基数目。因此,在非限制性例子中,如果读段密码是5个核苷酸且4(5-1)=256;因此,对于每个附加的碱基,包含附加的碱基将可用的库扩大了四倍。
在一个实施方案中,定量遗传分析包括测序读段的生物信息学分析以鉴定罕见的单核苷酸变异(SNV)。
新一代测序的固有错误率为约0.02-0.02%,这意味着从1/200到1/500的碱基调用不正确。为了检测在低于此频率发生的变异和其他突变,例如以1/1000的序列的频率,有必要使用分子注释策略。作为非限制性例子,使用靶向序列捕获技术分析5000个独特分子将生成(在>50,000个读段的充分测序深度下)5000个独特读段的集合,其中每个独特读段属于全部具有相同读段密码的读段“家族”。在家族中发生的SNV是成为罕见变异的候选者。当在多于一个家族中观察到相同的变异时,它是成为在起始样品中存在的罕见变异的非常强大的候选者。相反,在家族中偶尔发生的变异可能是测序错误,并且在一个且仅一个家族中发生的变异是罕见的或者是离体发生的碱基改变(例如,DNA碱基的氧化或PCR引入的错误)的结果。
在一个实施方案中,检测SNV的方法包括根据测定所需的目标灵敏度引入10倍多的基因组输入(基因组或基因组当量)。在一个非限制性例子中,如果所需的灵敏度是2%(2/100),那么实验靶标是2000个基因组的输入。
在具体实施方案中,测序数据的生物信息学分析用于检测或鉴定与以下相关的SNV:遗传状态、病症或疾病,遗传嵌合,胎检,亲子鉴定,预测对药物治疗的反应,诊断或监测医疗病症,微生物组分析,病原体筛查以及监测器官移植。
在各种实施方案中,提供了用于拷贝数测定分析的方法,包括获得一个或多个或多个克隆,每个克隆包含第一DNA序列和第二DNA序列,其中第一DNA序列包含靶向基因座中的序列且第二DNA序列包含捕获探针序列。在相关的实施方案中,在一个或多个克隆上进行配对端测序反应,并获得一个或多个测序读段。在另一个实施方案中,在一个或多个克隆上进行测序反应,其中获得大于约100个核苷酸的单个长测序读段,其中所述读段足以鉴定第一DNA序列和第二DNA序列。可以根据测序读段的探针序列对一个或多个克隆的测序读段进行排序或聚类。
拷贝数分析包括但不限于检查在给定基因组DNA样品中发生的特定基因或突变的拷贝数的分析,并且还可以包括定量测定给定基因的拷贝数或给定样品中的序列差异。在具体实施方案中,拷贝数分析用于检测或鉴定与以下相关的基因扩增:遗传状态、病症或疾病,胎检,遗传嵌合,亲子鉴定,预测对药物治疗的反应,诊断或监测疫疗病症,微生物组分析,病原体筛查,以及监测器官移植。
在一些实施方案中,拷贝数分析用于测量染色体不稳定性。在这样的实施方案中,使用包含染色体稳定性探针的捕获探针组来测定所有染色体组中均匀密度下的拷贝数变异。对每个染色体稳定性探针进行拷贝数分析,然后将染色体稳定性探针根据其染色体靶标进行排序。这允许基因组中拷贝数丢失或增加的可视化,并且可以充当染色体稳定性的量度。
在具体实施方案中,测序数据的生物信息学分析用于检测或鉴定靶基因座中的一个或多个序列或遗传病变,包括但不限于检测核苷酸转换或颠换、核苷酸插入或缺失、基因组重排、拷贝数变化或基因融合。检测作为因果或预后指标的遗传病变可用于诊断、预后、治疗和/或监测特定遗传病症或疾病。在一个实施方案中,遗传病变与以下相关:遗传状态、病症或疾病,胎检,遗传嵌合,亲子鉴定,预测对药物治疗的反应,诊断或监测医疗病症,微生物组分析,病原体筛查和监测器官移植。
D.定量CNL测定的临床应用
在各种实施方案中,本发明考虑了通过检测目标区域中的突变、SNP、易位、倒位、缺失、拷贝数变化或其他基因变异来检测、鉴定、预测、诊断或监测受试者中的病症或疾病的方法。
E.定量遗传分析的临床应用
在各种实施方案中,本发明考虑了检测、识别、预测、诊断或监测受试者中的病症或疾病的方法。
在具体实施方案中,检测、鉴定、预测、诊断或监测受试者中的遗传状态、病症或疾病的方法包括对DNA克隆文库中的一个或多个靶基因座进行定量遗传分析,以检测或鉴定一个或多个靶基因座处的序列变化。在一些实施方案中,所述变化是拷贝数变化。
在一个实施方案中,检测、鉴定、预测、诊断或监测遗传状态、病症或疾病的方法包括从受试者的生物样品分离或获得细胞DNA或cfDNA;用一种或多种末端修复酶处理细胞DNA或cfDNA以生成末端修复的DNA;将一个或多个衔接子附接至末端修复的DNA的各端以生成基因组DNA文库;扩增DNA文库以生成DNA克隆文库;测定DNA克隆文库中的基因组当量数目;以及对DNA克隆文库中的一个或多个靶基因座进行定量遗传分析,以检测或鉴定序列的变化,例如一个或多个靶基因座处的SNP、易位、倒位、缺失或拷贝数变化。
在具体实施方案中,检测、鉴定、预测、诊断或监测遗传状态或遗传病症或疾病(其选自由以下组成的组:遗传疾病;遗传嵌合;胎检;亲子鉴定;亲子鉴定;预测对药物治疗的反应;诊断或监测医疗病症;微生物组分析;病原体筛查;和器官移植监测)的方法包括从受试者的生物样品分离或获得基因组DNA;用一种或多种末端修复酶处理DNA以生成末端修复的DNA;将一个或多个衔接子附接至末端修复的DNA的各端以生成基因组DNA文库;扩增基因组DNA文库以生成DNA克隆文库;测定DNA克隆文库中的基因组当量数目;以及对DNA克隆文库中的一个或多个靶基因座进行定量遗传分析,以检测或鉴定一个或多个靶基因座处的序列中的核苷酸转换或颠换、核苷酸插入或缺失、基因组重排、拷贝数变化或基因融合。
可用本文考虑的组合物和方法检测、鉴定、预测、诊断或监测的遗传疾病的说明性例子包括但不限于癌症、阿尔茨海默病(APOE1)、腓骨肌萎缩症、Leber遗传性视神经病变(LHON)、Angelman综合征(UBE3A,泛素-蛋白连接酶E3A)、Prader-Willi综合征(15号染色体中的区域)、β-地中海贫血(HBB,β-球蛋白)、戈谢病(I型)(GBA,葡糖脑苷脂酶)、囊性纤维化(CFTR上皮氯通道)、镰状细胞病(HBB,β-球蛋白)、泰-萨克斯病(HEXA,己糖胺酶A)、苯丙酮尿症(PAH,苯丙氨酸水解酶)、家族性高胆固醇血症(LDLR,低密度脂蛋白受体)、成人多囊肾病(PKD1,多囊蛋白)、亨廷顿病(HDD,亨廷顿蛋白)、I型神经纤维瘤病(NF1,NF1肿瘤抑制基因)、肌强直性营养不良(DM,薏仁米)、结节性硬化症(TSC1,马铃薯球蛋白)、软骨发育不全(FGFR3,成纤维细胞生长因子受体)、脆性X综合征(FMR1,RNA结合蛋白)、杜氏肌肉营养不良(DMD,肌萎缩蛋白)、A型血友病(F8C,凝血因子VIII)、Lesch-Nyhan综合征(HPRT1,次黄嘌呤鸟嘌呤核糖基转移酶1)和肾上腺脑白质营养不良(ABCD1)。
可用本文考虑的组合物和方法检测、鉴定、预测、诊断或监测的癌症的说明性例子包括但不限于:B细胞癌、例如多发性骨髓瘤、黑色素瘤、乳腺癌、肺癌(如非小细胞肺癌或NSCLC)、支气管癌症、结直肠癌、前列腺癌、胰腺癌、胃癌、卵巢癌、尿膀胱癌、脑或中枢神经系统癌症、外周神经系统癌症、食道癌、宫颈癌、子宫或子宫内膜癌、口腔癌或咽癌、肝癌、肾癌、睾丸癌、胆道癌、小肠或阑尾癌、唾液腺癌、甲状腺癌、肾上腺癌、骨肉瘤、软骨肉瘤、血液组织癌、腺癌、炎性肌纤维母细胞瘤、胃肠道间质瘤(GIST)、结肠癌、多发性骨髓瘤(MM)、骨髓增生异常综合征(MDS)、骨髓增殖性疾病(MPD)、急性淋巴细胞白血病(ALL)、急性粒细胞白血病(AML)、慢性粒细胞白血病(CML)、慢性淋巴细胞白血病(CLL)、真性红细胞增多症、霍奇金淋巴瘤、非霍奇金淋巴瘤(NHL)、软组织肉瘤、纤维肉瘤、粘液肉瘤、脂肪肉瘤、骨肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、淋巴管肉瘤、淋巴管内皮肉瘤、滑膜瘤、间皮瘤、尤文氏肉瘤、平滑肌肉瘤、横纹肌肉瘤、鳞状细胞癌、基底细胞癌、腺癌、汗腺癌、皮脂腺癌、乳头状癌、乳头状腺癌、髓样癌、支气管癌、肾细胞癌、肝细胞瘤、胆管癌、绒毛膜癌、精原细胞瘤、胚胎性癌、维尔姆斯瘤、膀胱癌、上皮癌、神经胶质瘤、星形细胞瘤、成神经管细胞瘤、颅咽管瘤、室管膜瘤、松果体瘤、血管母细胞瘤、听神经瘤、少突神经胶质瘤、脑膜瘤、神经母细胞瘤、视网膜母细胞瘤、滤泡性淋巴瘤、弥漫性大B细胞淋巴瘤、套细胞淋巴瘤、肝细胞癌、甲状腺癌、胃癌、头颈癌、小细胞癌、原发性血小板增多症、不明原因的髓样化生、嗜酸性粒细胞增多症、系统性肥大细胞增生症、熟悉嗜酸性粒细胞增多症、慢性嗜酸性粒细胞白血病、神经内分泌癌、类癌肿瘤等。
在一个实施方案中,遗传病变是在Cosmic数据库中注释的病变(病变和序列数据可在线获得,并且可从Cosmic网站的Cancer Gene Census部分下载)或在癌症基因组图谱中注释的病变(病变和序列数据可在线获得,并且可从The Cancer Genome Atlas网站下载)。
具有可采用本文考虑的组合物和方法检测、鉴定、预测、诊断或监测的与癌症相关的一种或多种遗传病变的基因的说明性例子包括但不限于ABCB1、ABCC2、ABCC4、ABCG2、ABL1、ABL2、AKT1、AKT2、AKT3、ALDH4A1、ALK、APC、AR、ARAF、ARFRP1、ARID1A、ATM、ATR、AURKA、AURKB、BCL2、BCL2A1、BCL2L1、BCL2L2、BCL6、BRAF、BRCA1、BRCA2、Clorf144、CARD11、CBL、CCND1、CCND2、CCND3、CCNE1、CDH1、CDH2、CDH20、CDH5、CDK4、CDK6、CDK8、CDKN2A、CDKN2B、CDKN2C、CEBPA、CHEK1、CHEK2、CRKL、CRLF2、CTNNB1、CYP1B1、CYP2C19、CYP2C8、CYP2D6、CYP3A4、CYP3A5、DNMT3A、DOT1L、DPYD、EGFR、EPHA3、EPHA5、EPHA6、EPHA7、EPHB1、EPHB4、EPHB6、EPHX1、ERBB2、ERBB3、ERBB4、ERCC2、ERG、ESR1、ESR2、ETV1、ETV4、ETV5、ETV6、EWSR1、EZH2、FANCA、FBXW7、FCGR3A、FGFR1、FGFR2、FGFR3、FGFR4、FLT1、FLT3、FLT4、FOXP4、GATA1、GNA11、GNAQ、GNAS、GPR124、GSTP1、GUCY1A2、HOXA3、HRAS、HSP90AA1、IDH1、IDH2、IGF1R、IGF2R、IKBKE、IKZF1、INHBA、IRS2、ITPA、JAK1、JAK2、JAK3、JUN、KDR、KIT、KRAS、LRP1B、LRP2、LTK、MAN1B1、MAP2K1、MAP2K2、MAP2K4、MCL1、MDM2、MDM4、MEN1、MET、MITF、MLH1、MLL、MPL、MRE11A、MSH2、MSH6、MTHFR、MTOR、MUTYH、MYC、MYCL1、MYCN、NF1、NF2、NKX2-1、NOTCH1、NPM1、NQO1、NRAS、NRP2、NTRK1、NTRK3、PAK3、PAX5、PDGFRA、PDGFRB、PIK3CA、PIK3R1、PKHD1、PLCG1、PRKDC、PTCH1、PTEN、PTPN11、PTPRD、RAF1、RARA、RB1、RET、RICTOR、RPTOR、RUNX1、SLC19A1、SLC22A2、SLCO1B3、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SMO、SOD2、SOX10、SOX2、SRC、STK11、SULT1A1、TBX22、TET2、TGFBR2、TMPRSS2、TNFRSF14、TOP1、TP53、TPMT、TSC1、TSC2、TYMS、UGT1A1、UMPS、USP9X、VHL和WT1。
在具体实施方案中,遗传病变包括核苷酸转换或颠换、核苷酸插入或缺失、基因组重排、拷贝数变化或基因融合。
在一个实施方案中,遗传病变是基因融合,其将ALK基因的3'编码区与另一基因融合。
在一个实施方案中,遗传病变是基因融合,其将ALK基因的3'编码区与EML4基因融合。
可以用本文考虑的组合物和方法检测、鉴定、预测、诊断或监测的适合于胎检的病症的说明性例子包括但不限于:唐氏综合征(21三体)、爱德华氏综合征(18三体)、Patau综合征(13三体)、克氏综合征(XXY)、Triple X综合征、XYY综合征、8三体、16三体、特纳综合征(XO)、罗伯逊易位、迪乔治综合征和Wolf-Hirschhorn综合征。
可以用本文考虑的组合物和方法检测、鉴定、预测、诊断或监测的适合于亲子鉴定的等位基因的说明性例子包括但不限于以下中的16种或更多种:D20S1082、D6S474、D12ATA63、D22S1045、D10S1248、D1S1677、D11S4463、D4S2364、D9S1122、D2S1776、D10S1425、D3S3053、D5S2500、D1S1627、D3S4529、D2S441、D17S974、D6S1017、D4S2408、D9S2157、秞原蛋白、D17S1301、D1GATA113、D18S853、D20S482和D14S1434。
可以用本文考虑的组合物和方法检测、鉴定、预测、诊断或监测的适合于预测药物治疗反应的基因的说明性例子包括但不限于以下基因中的一种或多种:ABCB1(ATP结合盒、亚家族B(MDR/TAP)、成员1)、ACE(血管紧张素I转化酶)、ADH1A(醇脱氢酶1A(I类)、α多肽)、ADH1B(醇脱氢酶IB(I类)、β多肽),ADH1C(醇脱氢酶1C(I类)、γ多肽),ADRB1(肾上腺素能,β-1-,受体),ADRB2(肾上腺素能,β-2-,受体,表面)、AHR(芳基碳氢化合物受体)、ALDH1A1(醛脱氢酶1家族,成员A1)、ALOX5(花生四烯酸5-脂氧合酶)、BRCA1(乳腺癌1,早发)、COMT(儿茶酚-O-甲基转移酶)、CYP2A6(细胞色素P450,家族2,亚家族A,多肽6)、CYP2B6(细胞色素P450,家族2,亚家族B,多肽6)、CYP2C9(细胞色素P450,家族2,亚家族C,多肽9)、CYP2C19(细胞色素P450,家族2,亚家族C,多肽19)、CYP2D6(细胞色素P450,家族2,亚家族D,多肽6)、CYP2J2(细胞色素P450,家族2,亚家族J,多肽2)、CYP3A4(细胞色素P450,家族3,亚家族A,多肽4)、CYP3A5(细胞色素P450,家族3,亚家族A,多肽5)、DPYD(二氢嘧啶脱氢酶)、DRD2(多巴胺受体D2)、F5(凝血因子V)、GSTP1(谷胱甘肽S-转移酶pi)、HMGCR(3-羟基-3-甲基戊二酰基-辅酶A还原酶)、KCNH2(钾电压门控通道,亚家族H(eag相关),成员2)、KCNJ11(钾内向整流通道,亚家族J,成员11)、MTHFR(5,10-亚甲基四氢叶酸还原酶(NADPH))、NQO1(NAD(P)H脱氢酶,醌1)、P2RY1(嘌呤能受体P2Y,G蛋白偶联,1)、P2RY12(嘌呤能受体P2Y,G蛋白偶联,12)、PTGIS(前列腺素I2(前列环素)合酶)、SCN5A(钠通道,电压门控,V型,α(长QT综合征3))、SLC19A1(溶质载体家族19(叶酸转运蛋白),成员1)、SLCO1B1(溶质载体有机阴离子转运蛋白家族,成员1B1)、SULT1A1(磺基转移酶家族,细胞溶质,1A,偏选苯酚,成员1)、TPMT(硫嘌呤S-甲基转移酶)、TYMS(胸苷酸合成酶)、UGT1A1(UDP葡糖醛酸基转移酶1家族,多肽A1)、VDR(维生素D(1,25-二羟基维生素D3)受体)、VKORC1(维生素K环氧化物还原酶复合物,亚基1)。
可用本文考虑的组合物和方法检测、鉴定、预测、诊断或监测的医学病症的说明性例子包括但不限于:中风、短暂性脑缺血发作、创伤性脑损伤、心脏病、心脏病发作、心绞痛、动脉粥样硬化和高血压。
可用本文考虑的组合物和方法筛查的病原体的说明性例子包括但不限于:细菌、真菌和病毒。
可用本文考虑的组合物和方法筛查的细菌物种的说明性例子包括但不限于:分枝杆菌属物种、肺炎球菌属物种、埃希氏菌属物种、弯曲菌属物种、棒状杆菌属物种、梭菌属物种、链球菌属物种、葡萄球菌属物种、假单胞菌属物种、志贺氏菌属物种、密螺旋体属物种或沙门氏菌属物种。
可用本文考虑的组合物和方法筛查的真菌物种的说明性例子包括但不限于:曲霉属物种、芽生菌属物种、假丝酵母属物种、球孢子虫属物种、隐球菌属物种、肤癣菌、癣属物种、毛癣菌属物种、小孢子癣菌属物种、镰刀菌属物种、组织胞浆菌属物种、毛霉亚门(Mucoromycotina)物种、肺孢子虫属物种、孢子丝菌属物种、突脐蠕孢属物种或枝孢属物种。
可用本文考虑的组合物和方法筛查的病毒的说明性例子包括但不限于:甲型流感(如H1N1、H1N2、H3N2和H5N1(禽流感))、乙型流感、丙型流感病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、丁型肝炎病毒、戊型肝炎病毒、轮状病毒、诺瓦克病毒组的任何病毒、肠道腺病毒、细小病毒、登革热病毒、猴痘、单链病毒、狂犬病毒等狂犬病病毒、拉各斯蝙蝠病毒、Mokola病毒、Duvenhage病毒、欧洲蝙蝠病毒1和2以及澳大利亚蝙蝠病毒、Ephemerovirus、水泡病毒属、水泡性口炎病毒(VSV)、疱疹病毒(如单纯疱疹病毒1型和2型、水痘带状疱疹、巨细胞病毒、Epstein-Bar病毒(EBV)、人类疱疹病毒(HHV)、人类疱疹病毒6型和8型)、莫洛尼鼠白血病病毒(M-MuLV)、莫洛尼鼠肉瘤病毒(MoMSV)、Harvey鼠肉瘤病毒(HaMuSV)、鼠乳腺瘤病毒(MuMTV)、长臂猿白血病病毒(GaLV)、猫白血病病毒(FLV)、泡沫病毒属、Friend鼠白血病病毒、鼠干细胞病毒(MSCV)和Rous肉瘤病毒(RSV)、HIV(人类免疫缺陷病毒;包括HIV 1型和HIV 2型)、visna-maedi病毒(VMV)病毒、山羊关节炎-脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)和猿猴免疫缺陷病毒(SIV)、乳头瘤病毒、鼠γ疱疹病毒、沙粒病毒(如阿根廷出血热病毒、玻利维亚出血热病毒、萨比亚相关出血热病毒、委内瑞拉出血热病毒、拉沙热病毒)、马丘波病毒、淋巴细胞性脉络丛脑膜炎病毒(LCMV)、Bunyaviridiae如克里米亚-刚果出血热病毒、汉坦病毒、引起伴有肾综合征的出血热的病毒、裂谷热病毒、包括埃博拉出血热和马尔堡出血热的丝状病毒科(丝状病毒)、包括Kaysanur Forest疾病病毒的黄病毒科、鄂木斯克出血热病毒、引起森林脑炎的病毒和副粘病毒科(如Hendra病毒和Nipah病毒)、大天花和小天花(天花)、甲病毒(如委内瑞拉马脑炎病毒、东部马脑炎病毒、西部马脑炎病毒)、SARS相关冠状病毒(SARS-CoV)、西尼罗河病毒和引起脑炎的任何病毒。
可以用本文考虑的组合物和方法检测、鉴定、预测、诊断或监测的适合于监测移植接受者中器官移植的基因的说明性例子包括但不限于以下基因中的一种或多种:HLA-A、HLA-B、HLA-C、HLA-DR、HLA-DP和HLA-DQ。
在具体实施方案中,生物信息学分析用于量化cfDNA克隆文库中分析的基因组当量的数目;检测靶基因座中的遗传变异;检测靶基因座内的突变;检测靶基因座内的遗传融合;或测量靶基因座内的拷贝数波动。
F.伴随诊断
在各种实施方案中,提供了遗传疾病的伴随诊断,其包括:从受试者的生物样品分离或获得基因组DNA;用一种或多种末端修复酶处理DNA以生成末端修复的DNA;将一个或多个衔接子附接至末端修复的DNA的各端以生成DNA文库;扩增DNA文库以生成DNA克隆文库;测定DNA克隆文库中的基因组当量的数目;以及对DNA克隆文库中与遗传疾病相关的一种或多种生物标志物进行定量遗传分析,其中检测到或未检测到一种或多种生物标志物中的至少一种表明所述受试者是否应该对该遗传疾病进行治疗。在一些实施方案中,DNA是cfDNA。在具体实施方案中,DNA是细胞DNA。
如本文所用,术语“伴随诊断”是指与特定抗癌疗法相关的诊断测试。在具体实施方案中,诊断方法包括检测与生物样品相关的生物标志物中的遗传病变,从而允许快速鉴定患者应该或不应该用抗癌疗法治疗。
抗癌疗法包括但不限于手术、放疗、化疗、抗癌药物和免疫调节剂。
抗癌药物的说明性例子包括但不限于:烷化剂如噻替哌和环磷酰胺(CYTOXANTM);烷基磺酸盐如白消安、英丙舒凡和哌泊舒凡;氮丙啶类如benzodopa、卡波醌、meturedopa和uredopa;乙烯亚胺和methylamelamine,包括六甲蜜胺,三乙烯三聚氰胺、三乙烯磷酰胺、三乙烯硫代磷酰胺和trimethylolomelamine resume;氮芥如苯丁酸氮芥、萘氮芥、氯磷酰胺、雌莫司汀、异环磷酰胺、氮芥、盐酸甲氧氮芥、美法仑、新恩比兴、苯芥胆甾醇、泼尼氮芥、曲洛磷胺、乌拉莫司汀;亚硝基脲如卡莫司汀、氯脲霉素、福莫司汀、洛莫司汀、尼莫司汀、雷莫司汀;抗生素如aclacinomysin、放线菌素、authramycin、重氮丝氨酸、博来霉素、cactinomycin、卡里奇霉素、carabicin、洋红霉素、嗜癌菌素、色霉素、更生霉素、道诺霉素、地托比星、6-二氮-5-氧-L-正亮氨酸、阿霉素及其聚乙二醇化制剂、表柔比星、依索比星、伊达比星、麻西罗霉素、丝裂霉素、霉酚酸、诺加霉素、橄榄霉素、培洛霉素、potfiromycin、嘌呤霉素、三铁阿霉素、罗多比星、链黑菌素、链脲霉素、杀结核菌素、乌苯美司、新制癌菌素、佐柔比星;抗代谢物如甲氨蝶呤和5-氟尿嘧啶(5-FU);叶酸类似物如二甲叶酸、甲氨蝶呤、蝶罗呤、三甲曲沙;嘌呤类似物如氟达拉滨、6-巯嘌呤、硫咪嘌呤、硫鸟嘌呤;嘧啶类似物如安西他滨、阿扎胞苷、6-氮尿苷、卡莫氟、阿糖胞苷、双脱氧尿苷、去氧氟尿苷、依诺他滨、氟尿苷、5-FU;雄激素如卡普睾酮、屈他雄酮丙酸酯、环硫雄醇、美雄烷、睾内酯;抗肾上腺,如氨鲁米特、米托坦、曲洛司坦;叶酸补充剂如亚叶酸;醋葡醛内酯;醛磷酰胺糖苷;氨基乙酰丙酸;安吖啶;bestrabucil;比生群;edatraxate;defofamine;地美可辛;亚丝醌;elformithine;依利醋铵;依托格鲁;硝酸镓;羟基脲;香菇多糖;氯尼达明;米托胍腙;米托蒽醌;莫哌达醇;硝基可润;喷司他丁;苯来美特;吡柔比星;podophyllinic acid;2-乙基酰肼;甲基苄肼;雷佐生;西佐喃;锗螺胺;细交链孢菌酮酸;三亚胺醌;2,2',2”-三氯三乙胺;乌拉坦;长春地辛;达卡巴嗪;甘露醇氮芥;二溴甘露醇;二溴卫矛醇;哌泊溴烷;gacytosine;阿拉伯糖苷(“Ara-C”);环磷酰胺;噻替哌;紫杉烷,例如紫杉醇(/>Bristol-Myers Squibb Oncology,Princeton,N.J.)和多西紫杉醇(/>Rhne-Poulenc Rorer,Antony,France);苯丁酸氮芥;吉西他滨;6-硫鸟嘌呤;巯嘌呤;甲氨蝶呤;铂类似物如顺铂和卡铂;长春碱;铂;依托泊苷(VP-16);异环磷酰胺;丝裂霉素C;米托蒽醌;长春新碱;长春瑞滨;诺维本;米托蒽醌;替尼泊苷;氨基蝶呤;希罗达;伊班膦酸钠;CPT-11;拓扑异构酶抑制剂RFS 2000;二氟甲基鸟氨酸(DMFO);视黄酸衍生物,如TargretinTM(蓓萨罗丁)、PanretinTM(阿利维a酸);ONTAKTM(地尼白介素);esperamicins;卡培他滨;以及上述的任何药学上可接受的盐、酸或衍生物。该定义还包括用于调节或抑制激素对癌症的作用的抗-激素剂如抗雌激素,包括例如它莫昔芬、雷洛昔芬、芳香化酶抑制4(5)-咪唑、4-羟基三苯氧胺、曲沃昔芬、keoxifene、LY117018、奥那司酮和托瑞米芬(Fareston);和抗雄激素如氟他胺、尼鲁米特、比卡鲁胺、亮丙瑞林和戈舍瑞林;以及上述的任何药学上可接受的盐、酸或衍生物。
免疫调节剂的说明性例子包括但不限于:环孢菌素、他克莫司、曲培莫司、吡美莫司、西罗莫司、依罗莫司、拉氟莫司、拉喹莫德和咪喹莫特以及其类似物、衍生物、盐、离子和复合物。
在一些实施方案中,抗癌药物可包括聚ADP核糖聚合酶(PARP)抑制剂。PARP抑制剂的说明性例子包括但不限于奥拉帕尼(AZD-2281)、卢卡帕利(AG014699或PF-01367338)、尼雷帕利(MK-4827)、他佐帕利(BMN-673)、维利帕利(ABT-888)、CEP 9722、E7016、BGB-290、3-氨基苯甲酰胺。
本申请还涉及以下实施方案:
实施方案1.一种用于对来自测试样品的DNA靶区域进行遗传分析的方法,其包括:
(a)生成包含多个DNA文库片段的基因组DNA文库,其中所述DNA文库片段中的每一个包含来自所述测试样品的基因组DNA片段和衔接子;
(b)使所述基因组DNA文库与特异性地结合DNA靶区域的多个捕获探针接触,从而在所述捕获探针与包含所述DNA靶区域的所述DNA文库片段之间形成复合物;以及
(c)对包含所述DNA靶区域的基因组DNA片段进行定量遗传分析;
其中所述衔接子是包含扩增区、样品标签区和锚定区的DNA多核苷酸;
其中所述扩增区包含能够充当PCR扩增的引物识别位点的多核苷酸序列;
其中所述样品标签包含编码所述独特文库DNA片段的特征且编码所述测试样品的特征的多核苷酸序列;
其中所述锚定区包含编码所述测试样品的特征的多核苷酸序列,并且其中所述锚定区能够附接至所述基因组DNA片段;并且
其中进行所述遗传分析以检测指示疾病状态的遗传变化。
实施方案2.如实施方案1所述的方法,其中所述指示疾病状态的遗传变化选自单核苷酸变异(SNV)、长度小于40个核苷酸的插入、长度小于40个核苷酸的DNA区域的缺失和/或拷贝数变化。
实施方案3.如实施方案1所述的方法,其中所述指示疾病状态的遗传变化是拷贝数变化。
实施方案4.如实施方案1-3中任一项所述的方法,其中所述测试样品是组织活检。
实施方案5.如实施方案4所述的方法,其中所述组织活检取自肿瘤或怀疑为肿瘤的组织。
实施方案6.如实施方案1-3中任一项所述的方法,其中所述基因组DNA是无细胞DNA(cfDNA)或细胞DNA。
实施方案7.如实施方案6所述的方法,其中所述基因组DNA是从所述测试样品分离的cfDNA;并且其中所述测试样品是选自由以下组成的组的生物样品:羊水、血液、血浆、血清、精液、淋巴液、脑脊液、眼内液、尿液、唾液、粪便、粘液和汗液。
实施方案8.如实施方案1-5中任一项所述的方法,其中通过包括以下的步骤获得所述基因组DNA片段:
(i)从所述测试样品分离细胞DNA;
(ii)使所述细胞DNA片段化以获得所述基因组DNA片段。
实施方案9.如实施方案8所述的方法,其中步骤(ii)是通过使所述细胞DNA与至少一种消化酶接触来进行的。
实施方案10.如实施方案8所述的方法,其中步骤(ii)是通过对所述细胞DNA施加机械应力来进行的。
实施方案11.如实施方案10所述的方法,其中通过超声处理所述细胞DNA来施加所述机械应力。
实施方案12.如前述实施方案中任一项所述的方法,其中所述样品标签还包含有助于鉴定独特基因组DNA片段的独特分子标识符(UMI)。
实施方案13.如前述实施方案中任一项所述的方法,其中所述扩增区的长度在10与50个核苷酸之间。
实施方案14.如前述实施方案中任一项所述的方法,其中所述扩增区的长度在20与30个核苷酸之间。
实施方案15.如前述实施方案中任一项所述的方法,其中所述扩增区的长度为25个核苷酸。
实施方案16.如前述实施方案中任一项所述的方法,其中所述样品标签的长度在5与50个核苷酸之间。
实施方案17.如实施方案16所述的方法,其中所述样品标签的长度在5与15个核苷酸之间。
实施方案18.如实施方案16所述的方法,其中所述样品标签的长度为8个核苷酸。
实施方案19.如实施方案12-18中任一项所述的方法,其中所述UMI倍增器与所述样品标签区相邻或包含在所述样品标签区内。
实施方案20.如实施方案19所述的方法,其中所述UMI倍增器的长度在1与5个核苷酸之间。
实施方案21.如实施方案19所述的方法,其中所述UMI倍增器的长度为3个核苷酸,并且包含64个可能的核苷酸序列中的一个。
实施方案22.如前述实施方案中任一项所述的方法,其中所述锚定区的长度在1与50个核苷酸之间。
实施方案23.如实施方案22所述的方法,其中所述锚定区的长度在5与25个核苷酸之间。
实施方案24.如实施方案22或23所述的方法,其中所述锚定区的长度为10个核苷酸。
实施方案25.如前述实施方案中任一项所述的方法,其中步骤(a)包括将所述基因组DNA片段附接至多个衔接子。
实施方案26.如实施方案25所述的方法,其中在将所述基因组DNA片段与多个衔接子附接之前,对所述基因组DNA片段进行末端修复。
实施方案27.如实施方案25所述的方法,其中所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列。
实施方案28.如实施方案26或27所述的方法,其中所述多个衔接子中的每个衔接子的样品标签区包含在2与1,000个核苷酸序列之间的一个核苷酸序列。
实施方案29.如实施方案28所述的方法,其中所述多个衔接子中的每个衔接子的样品标签区包含在50与500个核苷酸序列之间的一个核苷酸序列。
实施方案30.如实施方案28所述的方法,其中所述多个衔接子中的每个衔接子的样品标签区包含在100与400个核苷酸序列之间的一个核苷酸序列。
实施方案31.如实施方案28所述的方法,其中所述多个衔接子中的每个衔接子的样品标签区包含在200与300个核苷酸序列之间的一个核苷酸序列。
实施方案32.如实施方案28所述的方法,其中所述多个衔接子中的每个衔接子的样品标签区的长度为8个核苷酸。
实施方案33.如实施方案28-32中任一项所述的方法,其中所述核苷酸序列中的每个序列与240个核苷酸序列的任何其他序列相隔的汉明距离为至少二。
实施方案34.如实施方案26-33中任一项所述的方法,其中所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器。
实施方案35.如实施方案26-34中任一项所述的方法,其中所述多个衔接子中的每一个包含与所述样品标签区相邻的UMI倍增器。
实施方案36.如实施方案34或35所述的方法,其中所述多个衔接子中的每个衔接子的所述UMI倍增器的长度在1与5个核苷酸之间。
实施方案37.如实施方案36所述的方法,其中所述多个衔接子中的每个衔接子的所述UMI倍增器的长度为三个核苷酸。
实施方案38.如实施方案26-37所述的方法,其中所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个,并且其中给定序列中的每个样品区仅与给定序列的四个锚定区中的一个配对。
实施方案39.如实施方案25或26所述的方法,其中所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列;
其中所述多个衔接子中的每个衔接子的样品标签区的长度为8个核苷酸,其中每个样品标签的核苷酸序列与所述多个衔接子的样品标签的任何其他核苷酸序列相隔的汉明距离为至少二,
其中所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器,其中所述多个衔接子中的每个衔接子的所述UMI倍增器的长度为三个核苷酸,并且其中每个可能的核苷酸序列的UMI倍增器与所述多个衔接子的每个样品标签区配对,
其中所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个,并且其中给定序列中的每个样品区仅与给定序列的四个锚定区中的一个配对。
实施方案40.如实施方案25-39中任一项所述的方法,其中将所述基因组DNA片段与多个衔接子附接的步骤包括:
(i)将包含锚定区的至少一部分的寡核苷酸附接至每个基因组DNA片段,其中所述包含锚定区的至少一部分的寡核苷酸是DNA双链体,所述DNA双链体包含与配偶体链双链化的5’磷酸化附接链,其中所述配偶体链通过在其3’端的化学修饰而被阻止附接,并且其中所述附接链附接至所述基因组DNA片段;
(ii)使与包含所述锚定区的至少一部分的寡核苷酸附接的基因组DNA片段与编码所述多个衔接子中的每个衔接子核苷酸序列的全长衔接子序列的DNA寡核苷酸接触;并且
(iii)在适合于DNA连接的条件下,使所述基因组DNA片段和编码所述全长衔接子序列的DNA寡核苷酸与T4多核苷酸激酶、Taq DNA连接酶和全长Bst聚合酶接触;
从而将所述多个衔接子附接至所述基因组DNA片段。
实施方案41.如实施方案25-40中任一项所述的方法,其中所述基因组DNA片段是cfDNA。
实施方案42.如实施方案25-41中任一项所述的方法,其中分析所述DNA靶区域的拷贝数变化。
实施方案43.如前述实施方案中任一项所述的方法,其中步骤(c)包括对所述捕获探针与包含所述DNA靶区域的所述DNA文库片段之间形成的复合物进行纯化。
实施方案44.如前述实施方案中任一项所述的方法,其中步骤(c)包括对在所述捕获探针与包含所述DNA靶区域的所述DNA文库片段之间形成的复合物进行纯化,从而预形成包含来自所述基因组DNA文库的目标区域的DNA文库片段的引物延伸和/或扩增。
实施方案45.如前述实施方案中任一项所述的方法,其中步骤(c)包括对在所述捕获探针与包含所述DNA靶区域的所述DNA文库片段之间形成的复合物进行纯化,从而预形成包含来自所述基因组DNA文库的目标区域的所述DNA文库片段的引物延伸和扩增。
实施方案46.如前述实施方案中任一项所述的方法,其中步骤(c)包括对包含所述DNA靶区域的所述DNA文库片段进行DNA测序,以生成多个测序读段。
实施方案47.如前述实施方案中任一项所述的方法,其中其中基因组分析包括测定目标DNA区域中的拷贝数变化,并且其中步骤(c)包括:
(i).测定源自所述测试样品的基因组DNA文库中存在的目标区域的拷贝数,并且
(ii).将步骤(i)中测定的拷贝数与源自参考样品的基因组DNA文库中存在的目标区域的拷贝数进行比较,其中所述参考样品包含已知拷贝数目的所述DNA靶区域。
实施方案48.如实施方案47所述的方法,其中测定所述目标区域中的拷贝数包括对包含所述DNA靶区域的所述DNA文库片段进行DNA测序,以生成多个测序读段,其中每个测序读段包含独特分子标识元件(UMIE)。
实施方案49.如实施方案48所述的方法,其中所述UMIE包含来自所述衔接子和至少一部分所述基因组DNA序列的测序信息。
实施方案50.如实施方案49所述的方法,其中包含相同UMIE的测序读段被鉴定为独特基因组序列(UGS)。
实施方案51.如实施方案47-50中任一项所述的方法,其还包括针对与所述基因组DNA文库接触的所述捕获探针中的每一个测定原始基因组深度(RGD)。
实施方案52.如实施方案51所述的方法,其中测定所述RGD包括测定与一组样品重复中的每个捕获探针序列相关联的UGS的平均数目。
实施方案53.如实施方案52所述的方法,其中与高度可变数目的UGS相关联的捕获探针被鉴定为噪声探针并且从进一步的计算中去除。
实施方案54.如实施方案52所述的方法,其还包括计算样品的RGD,其包括计算所述样品中针对所有捕获探针的所有RGD的数值平均值。
实施方案55.如实施方案52所述的方法,其中在计算样品的RGD中不包括针对噪声探针的RGD值。
实施方案56.如实施方案51-55中任一项所述的方法,其中通过将针对每个捕获探针的RGD转换成探针特异性归一化读段计数将实验组中所有样品中针对所述捕获探针的RGD归一化,其包括
(i)使样品中的每个捕获探针RGD乘以归一化常数,其中所述归一化常数包括任何实数;以及
(ii)使(i)的乘积除以针对相应样品计算的RGD;或
(iii)使(i)的乘积除以从探针子集计算的平均RGD。
实施方案57.如实施方案56所述的方法,其中所述探针子集是对照探针组。
实施方案58.如实施方案57所述的方法,其中将所述探针特异性归一化读段计数转换成拷贝数值,其包括
(i)在源自女性的样品中使针对常染色体和/或X连锁区的探针的探针特异性归一化读段计数乘以2;
(ii)在源自男性的样品中使针对Y连锁和/或X连锁区的探针的探针特异性归一化读段计数乘以1;
(iii)对实验中的所有样品的(i)和/或(ii)的乘积取平均值;并且
(iv)使(i)和/或(ii)的乘积除以(iii)的平均值。
实施方案59.如实施方案58所述的方法,其中对于针对靶向特异性基因的所有探针的近似拷贝数值取平均值。
实施方案60.一种用于高灵敏地检测拷贝数增加和拷贝数丢失的方法,其包括:
(i).测定针对捕获探针的RGD;
(ii).通过将针对所述捕获探针的RGD转换成探针特异性归一化读段计数,对实验组中所有样品中针对所述捕获探针的RGD进行归一化;
(iii).计算每个探针特异性归一化读段计数的近似拷贝数值;并且
(iv).对于针对靶向特异性基因的所有探针的近似拷贝数值取平均值。
实施方案61.一种用于测量染色体稳定性的方法,其包括:
(i).设计和验证一种或多种染色体稳定性探针的组,其中所述染色体稳定性探针均匀分布在人染色体上;
(ii).使用所述一种或多种染色体稳定性探针对患者样品进行靶向测序;
(iii).针对每种染色体探针测定近似拷贝数值;
(iv).测定患者样品的基因组表型,其中所述患者样品中针对一种或多种染色体探针的拷贝数值的波动表明基因组不稳定性。
实施方案62.一种治疗有需要的受试者中的癌症的方法,其中所述受试者已根据实施方案61所述的方法被鉴定为具有去稳定化的基因组,其中治疗所述癌症的所述方法包括给予药学有效量的PARP抑制剂。
实施方案63.如前述实施方案中任一项所述的方法,其中所述目标区域是基因或所述基因的一部分。
实施方案64.如实施方案63所述的方法,其中所述基因与疾病有关。
实施方案65.如实施方案64所述的方法,其中所述疾病是癌症。
实施方案66.如实施方案63所述的方法,其中所述基因是BRCA2、ATM、BRCA1、BRIP1、CHEK2、FANCA、HDAC2和/或PALB2。
实施方案67.一种包含多个DNA文库片段的基因组DNA文库,其中所述DNA文库片段中的每一个包含衔接子和基因组DNA片段,
其中所述衔接子是包含扩增区、样品标签区和锚定区的DNA多核苷酸;
其中所述扩增区包含能够充当PCR扩增的引物识别位点的多核苷酸序列;
其中所述样品标签包含编码所述独特文库DNA片段的特征且编码所述测试样品的特征的多核苷酸序列;并且
其中所述锚定区包含编码所述测试样品的特征的多核苷酸序列,并且其中所述锚定区能够附接至所述基因组DNA片段。
实施方案68.如实施方案67所述的基因组DNA文库,其中所述样品标签还包含独特分子标识符(UMI),其中所述UMI有助于鉴定独特基因组DNA片段。
实施方案69.如实施方案67或68所述的基因组DNA文库,其中所述扩增区的长度在10与50个核苷酸之间。
实施方案70.如实施方案69所述的基因组DNA文库,其中所述扩增区的长度为25个核苷酸。
实施方案71.如前述实施方案中任一项所述的基因组DNA文库,其中所述样品标签的长度在5与50个核苷酸之间。
实施方案72.如实施方案71所述的基因组DNA文库,其中所述样品标签的长度为8个核苷酸。
实施方案73.如实施方案67-72中任一项所述的基因组DNA文库,其中所述UMI倍增器与所述样品标签区相邻或包含在所述样品标签区内。
实施方案74.如实施方案73所述的基因组DNA文库,其中所述UMI倍增器的长度在1与5个核苷酸之间。
实施方案75.如前述实施方案中任一项所述的基因组DNA文库,其中所述锚定区的长度在1与50个核苷酸之间。
实施方案76.如实施方案75所述的基因组DNA文库,其中所述锚定区的长度为10个核苷酸。
实施方案77.如实施方案67-76中任一项所述的基因组DNA文库,其中所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列。
实施方案78.如实施方案67-77中任一项所述的基因组DNA文库,其中所述样品标签的每个核苷酸序列与所述样品的核苷酸序列的任何其他序列相隔的汉明距离为至少二。
实施方案79.如实施方案67-78中任一项所述的基因组DNA文库,其中所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器。
实施方案80.如实施方案67-78中任一项所述的基因组DNA文库,其中所述多个衔接子中的每一个包含与所述样品标签区相邻的UMI倍增器。
实施方案81.如实施方案67-78中任一项所述的基因组DNA文库,其中所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个,并且其中给定序列中的每个样品区仅与给定序列的四个锚定区中的一个配对。
实施方案82.如实施方案67所述的基因组DNA文库,其中所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列;
其中所述多个衔接子中每个衔接子的样品标签区的长度为8个核苷酸,其中所述多个衔接子中每个衔接子的样品标签区包含核苷酸序列,所述核苷酸序列与所述多个衔接子的样品标签的任何其他核苷酸序列相隔的汉明距离为至少二;
其中所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器,其中所述多个衔接子中的每个衔接子的所述UMI倍增器的长度为三个核苷酸,并且其中每个可能的核苷酸序列的UMI倍增器与所述多个衔接子的每个样品标签区配对;
其中所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个;并且
其中给定序列的每个样品区仅与给定序列的四个锚定区中的一个配对。
实施方案83.如实施方案67-82中任一项所述的基因组DNA文库,其中所述基因组DNA片段是cfDNA。
实施方案84.多个基因组DNA文库,其包含多于一个根据实施方案67-83中任一项所述的基因组文库。
实施方案85.如实施方案84所述的多个基因组DNA文库,其中属于所述多个基因组DNA文库的基因组DNA文库的样品标签区的核酸序列不同于属于所述多个基因组DNA文库的其他基因组DNA文库的样品标签区的核酸序列。
实施方案86.如实施方案84或85所述的多个基因组DNA文库,其中属于所述多个基因组DNA文库的基因组DNA文库的扩增区的核酸序列与属于多个基因组DNA文库的其他基因组DNA文库的扩增区的核酸序列相同。
实施方案87.一种用于无细胞DNA(cfDNA)的DNA靶区域的遗传分析的方法,其包括:
(a)生成如实施方案67-86中任一项所述的DNA文库;
(b)使所述cfDNA文库与特异性地结合DNA靶区域的多个捕获探针接触,从而在所述捕获探针与包含所述DNA靶区域的DNA文库片段之间形成复合物;以及
(c)对包含所述DNA靶区域的cfDNA片段进行定量遗传分析;
从而进行所述DNA靶区域的遗传分析。
实施方案88.一种预测、诊断或监测受试者中的遗传疾病的方法,其包括:
(a)从所述受试者获得测试样品;
(b)从所述测试样品分离基因组DNA;
(c)生成包含多个DNA文库片段的DNA文库,其中所述DNA文库片段中的每一个包含来自所述测试样品的基因组DNA片段和衔接子;
(d)使所述cfDNA文库与特异性地结合DNA靶区域的多个捕获探针接触,从而在所述捕获探针与包含所述DNA靶区域的DNA文库片段之间形成复合物;以及
(e)对cfDNA克隆文库中与所述遗传疾病相关的一个或多个靶基因座进行定量遗传分析,其中所述一个或多个靶基因座中的一个或多个遗传病变的鉴定或检测是对于所述遗传疾病的进展的预后、诊断或监测。
实施方案89.如实施方案87或88所述的方法,其中所述定量遗传分析包括DNA测序以生成多个测序读段。
实施方案90.一组用于生成基因组DNA文库的编码独特基因组DNA片段的特征和测试样品的特征的衔接子,其中所述衔接子组中的每个衔接子是包含扩增区、样品标签区和锚定区的DNA多核苷酸;
其中所述扩增区包含能够充当PCR扩增的引物识别位点的多核苷酸序列;
其中所述样品标签包含编码所述独特文库DNA片段的特征且编码所述测试样品的特征的多核苷酸序列;并且
其中所述锚定区包含编码所述测试样品的特征的多核苷酸序列,并且其中所述锚定区能够附接至所述基因组DNA片段。
实施方案91.如实施方案90所述的衔接子组,其中所述样品标签还包含独特分子标识符(UMI),其中所述UMI有助于鉴定独特基因组DNA片段。
实施方案92.如实施方案90或91所述的衔接子组,其中所述扩增区的长度在10与50个核苷酸之间。
实施方案93.如实施方案90-92中任一项所述的衔接子组,其中所述扩增区的长度为25个核苷酸。
实施方案94.如前述实施方案中任一项所述的衔接子组,其中所述样品标签的长度在5与50个核苷酸之间。
实施方案95.如实施方案94所述的衔接子组,其中所述样品标签的长度为8个核苷酸。
实施方案96.如实施方案90-95中任一项所述的衔接子组,其中所述UMI倍增器与所述样品标签区相邻或包含在所述样品标签区内。
实施方案97.如实施方案96所述的衔接子组,其中所述UMI倍增器的长度在1与5个核苷酸之间。
实施方案98.如实施方案90-97所述的衔接子组,其中所述锚定区的长度在1与50个核苷酸之间。
实施方案99.如实施方案98所述的衔接子组,其中所述锚定区的长度为10个核苷酸。
实施方案100.如实施方案90-99中任一项所述的衔接子组,其中所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列。
实施方案101.如实施方案100所述的衔接子组,其中所述样品标签的每个核苷酸序列与所述衔接子组的样品标签的任何其他核苷酸序列相隔的汉明距离为至少二。
实施方案102.如实施方案90-101中任一项所述的衔接子组,其中所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器。
实施方案103.如实施方案90-101中任一项所述的衔接子组,其中所述多个衔接子中的每一个包含与所述样品标签区相邻的UMI倍增器。
实施方案104.如实施方案103所述的衔接子组,其中所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个,并且其中给定序列中的每个样品区仅与给定序列的四个锚定区中的一个配对。
实施方案105.如实施方案90-104中任一项所述的衔接子组,其中所述多个衔接子中的每个衔接子的扩增区包含相同的核苷酸序列;
其中每个衔接子的样品标签区的长度为8个核苷酸,其中所述样品标签的每个核苷酸序列与所述衔接子组的样品标签的任何其他核苷酸序列相隔的汉明距离为至少二;
其中所述多个衔接子中的每一个包含与所述样品标签区相邻或包含在所述样品标签区内的UMI倍增器,其中所述多个衔接子中的每个衔接子的所述UMI倍增器的长度为三个核苷酸,其中所述UMI倍增器包含64个可能的核苷酸序列中的一个,并且其中所述64个可能的核苷酸序列中的每一个的UMI倍增器与所述多个衔接子的每个样品标签区配对;
其中所述多个衔接子中的每个衔接子的锚定标签区包含四个核苷酸序列中的一个;并且
其中给定序列的每个样品区仅与给定序列的四个锚定区中的一个配对。
本说明书中引用的所有出版物、专利申请和授权专利均通过引用并入本文,如同每个单独的出版物、专利申请或授权专利被特别且单独地指出通过引用并入。特别地,国际PCT公开号WO 2016/028316的全部内容通过引用特别并入。
尽管为了清楚理解的目的已经通过说明和例子的方式详细地描述了前述发明,但是根据本发明的教导,本领域普通技术人员将容易明白,可以在不脱离所附权利要求的精神或范围的情况下对其进行某些改变和修改。仅通过说明的方式而不是通过限制的方式,提供以下实施例。本领域技术人员将容易地认识到各种非关键参数,它们可以被改变或修改以产生基本类似的结果。
实施例
实施例1:含有片段化基因组DNA的混合物的样品的拷贝数分析
生成片段化的基因组DNA的精细混合物,其含有源自掺入片段化野生型人gDNA样品中的ΔATM或ΔBRCA2永生化人样品的DNA。这种样品类型的优点是可以小心控制化合物,并且样品可用性是基本上无限制的。
从健康志愿者捐献的全血样品中纯化野生型人类女性基因组DNA。从Coriell储存库获得从具有覆盖整个ATM基因(NA09596,ΔATM)的杂合缺失的永生化细胞分离的基因组DNA和带有BRCA2(NA02718,ΔBRCA2)杂合缺失的单独样品。重要的是,这些样品显示在其余基因组中具有正常的倍性。ΔATM样品源自男性供体,因此在X连锁AR基因的拷贝数方面也是半合子的。无细胞DNA(cfDNA)获自女性或男性来源的健康供体血浆样品。对于文库构建,使用Covaris仪器在200bp的设置下对基因组DNA进行超声处理,然后使用“双侧”DNA珠粒纯化进一步选择大小。文库输入DNA样品显示在图7中。
将片段化和cfDNA样品的适当组合混合至确定的百分比,进行末端修复并转化为基因组文库。将约500ng的每个文库组合在八个样品的组中,并与含有2304个DNA探针的拷贝数丢失(CNL)前列腺探针池杂交。在样品处理之后,在Illumina NextSeq NGS仪器上对每组8个样品进行测序,深度为约4.8亿个过滤读段;这相当于6000万个读段/样品。约95%的读段具有合理的样品ID标签并与人参考基因组进行比对,其中约98%映射至预期的靶基因座。总体测序深度被测量为每个探针每个输入基因组的读段数目(计算如下:靶读段(6千万)除以平均基因组深度(2500),再除以探针计数(2400)),其为每个探针每个基因组约10个读段。拷贝数损失分析的图形表示如图1所示。拷贝数扰动用箭头突出显示。(样品1,5%男性DNA在女性DNA中;样品2,5%ΔATM DNA(男性)在女性DNA中;样品3,5%ΔBRCA2 DNA(女性)在女性DNA中;样品4,纯女性DNA)。
CNL调用者鉴定冗余读段并将它们压缩成单个共有读段,然后将其在每个探针位置量化。该信息进一步压缩为逐基因拷贝数平均值。最后,统计显著性被分配至每个CNL测量中检测到的偏差;这以图形方式显示为统计显著性的log10P值。
图8示出了片段化和混合的基因组文库中AR(图8B)和ATM(图8C)基因的拷贝数测定的盒须图。由于ΔATM样品是男性,AR基因(X连锁,半合子)和ATM基因都表现出CNL行为。正如预期的那样,测量的拷贝变异的量级是适度的。图9B所示的统计分析表明观察到的拷贝波动是统计学上显著的。此外,在预测显示出均匀拷贝特征的剩余基因中观察到非常小的显著波动。这些值与针对各种基因组混合物预测的频率相关性良好。图10示出了在主要为cfDNA的样品中也容易观察到统计学上显著的拷贝波动,在所述样品中少量掺加来自异性的cfDNA或少量添加片段化gDNA。这些值与针对各种基因组混合物预测的频率相关性良好。用片段化的gDNA和用cfDNA观察到的结果是可比较的,从而证明了测定的完整性并且表明完整性将转化为临床样品。
这些数据证明了测定系统检测出基因拷贝数的细微变化低至2%的低等位基因频率的能力。虽然所展示的实施例的重点在于拷贝数丢失,但该技术同样适用于拷贝数增加的检测,包括通过染色体臂复制和焦点扩增发生的基因拷贝的增加。该测定法还保留了检测其他类型基因组变异的能力,包括SNV、indel和基因融合(染色体重排)。重要的是,这些数据表明所述方法可以应用于源自血浆的基因组DNA,也可以应用于源自其他来源(例如组织和其他身体来源)的基因组DNA。
实施例2:来自健康供体和癌症患者的cfDNA的拷贝数分析
以下实施例说明了在基因组文库构建和杂交后处理过程中添加的分子特征用于生成拷贝数分析的方式。使用Qiagen Circulating Nucleic Acids Extraction试剂盒(Qiagen,Hilden,Germany)从十六名健康供体和一名去势抗性前列腺癌症患者的血浆中提取DNA。使用Qubit荧光计(Thermo Fisher,Waltham,MA)和相应的hsDNA定量试剂盒量化双链DNA的产量。使用凝胶电泳在2%琼脂糖凝胶上进行大小分析,其中PCR标志物作为大小标准(New England Biolabs,Ipswich,MA)。取决于来自样品的cfDNA的产量,约40-100ng的cfDNA用于文库构建。
文库构建的基本特征如图11A至图11C所示。首先将cfDNA去磷酸化,然后在两步过程中将其修复成平端。然后将由磷酸化的连接链和惰性配偶体链组成的短的10nt锚定序列与cfDNA连接。用于产生一组四个锚定序列的八种寡核苷酸显示在表1中。
表1:连接锚定寡核苷酸
/>
*[3-d(A,C,G,或T)-Q]表示其中羟基位于核糖环的2'位置的修饰碱基
**/5Phos/表示5’磷酸基团化学加成至5’碱基位置
通过添加退火至锚定序列的全长衔接子序列完成衔接子结构。图12至图22中示出了三十二组衔接子序列,每组由240个成员构成。这些衔接子附接至cfDNA,并通过多核苷酸激酶、DNA聚合酶和DNA连接酶的协同作用延伸,以生成基因组文库。作为测序前质量控制步骤,通过qPCR对所得基因组文库的覆盖深度进行量化。然后扩增基因组文库并与靶向特异性基因的探针组杂交(图11B)。杂交后,使用探针的引物延伸来复制捕获的基因组序列和附接的衔接子中编码的信息(图11C)。使用标准新一代分析软件的后测序分析的一个例子显示在图11D中。该分析在包含32个样品(28个癌症患者样品和4个野生型对照)的测序运行中进行,并且其显示了测序读段的总体分布。
本文描述的靶向杂交捕获平台的核心特征是它提供多种类型的基因组信息。捕获探针的一个基本功能是在高覆盖深度的靶区域提供突变检测。该功能由捕获探针的序列背景、密度和放置决定,并采用TP53基因示于图23中(TP53探针序列示于下表2中)。同样重要的是,靶向杂交捕获平台测定在未检测到显著突变的区域中生成了相等覆盖深度的读出。这些数据对医生和患者至关重要,因为他们在未检测到有害突变的情况下增加了统计显著性。
表2:TP53探针
/>
捕获探针与捕获的基因组序列的连接(图11C)也有助于测量每个探针位置处的基因组深度。测量了与所述实验中使用的每个捕获探针相关的独特读段的数目(图24)。图24中所示的数据源自测序运行,其中分析了16个健康供体cfDNA样品。计算了在TP53基因中的一个探针位置处的每个样品中遇到的独特读段的深度(原始独特读段计数示于图24A中)。每个样品包含独特的文库深度,如独特读段的广泛的样品间分布所反映的。还计算了所述实验中所有2596个捕获探针的独特读段深度的总体平均值(图24B)。值得注意的是,通过对所有探针测量的总体独特读段深度将在图24C中显示的单个探针位点处观察到的读段深度进行归一化,揭示了归一化独特读段的均匀密度。这些数据表明,选择用于分析的特定探针的捕获性能在样品间是均匀的,并且与每个单独文库的基因组深度成正比。
将相同的归一化功能应用于图23中所示的45个TP53特异性探针(归一化数据示于图25中)。而图23示出了所有探针对TP53编码区的测序深度的总贡献,图25示出了由每个单独探针检索的归一化深度。对于任何给定的探针,由每个单独探针检索的归一化深度通常在样品间是一致的,但是当将一个探针与另一个探针进行比较时则有些变化。几个因素决定了探针之间观察到的后归一化捕获深度的差异,最重要的是探针相对于彼此的位置以及探针与基因组重复区域的接近程度。并非所有探针都显示出均匀的捕获行为;捕获性能不一致的两个探针在图25中用箭头突出显示。然而,这些数据表明这种探针是罕见的且易于鉴定。因此,它们可以从下游拷贝数分析中排除。
图25中通过45TP53靶向探针显示出的均匀的捕获性能是本文描述的靶向杂交捕获平台的一般特征。在图26中,对于在该实验中分析的所有16个正常cfDNA文库,计算一组2596个捕获探针中的每个探针的平均捕获深度。然后使用散点图分析将平均值与三个代表性样品单独比较。每个点代表不同的探针并且它在图上的位置是x轴上的平均值与y轴上的单独样品的比较。大多数探针的紧对角线分布反映了大多数探针的高度相关的独特读段捕获性能(对于全部三个图,R2相关性≥0.95)。重要的是,逐探针测序深度的一致性支持在拷贝数测量中使用靶向杂交捕获平台。
关于拷贝数,探针数据的最直接的处理是进一步将在常染色体中发生的调整的基因组深度值针对二倍体平均值“2”进行归一化。对于X连锁基因座在女性中发生的探针值也是如此。对于正常男性中的X连锁和Y连锁区域,平均拷贝值适当地设置为“1”。将该数值转换应用于一组染色体对照探针(靶向选择所有22个常染色体上的基因座的239个探针,表3)、靶向X连锁的AR基因的一组199个探针以及45个上文详细考虑的TP53特异性探针(图27A和图27B)。每个点代表单独探针的值。除了不常见的“噪声”探针外,预计区域中的绝大多数单独探针计数为二倍体所具有的值,即约“2”。健康男性中的AR基因的探针波动,平均值接近预期的“1”。
表3:染色体对照探针
/>
/>
/>
/>
/>
/>
值得注意的是,当使用健康样品作为归一化对照对从去势抗性前列腺癌症患者的血浆级分收集的cfDNA应用相同分析时,出现了三个突出特征(图27C)。首先,所有对照探针都显示出有噪声的计数行为。其次,所有AR探针的计数从正常值“1”显著升高至约“5”的放大值。在晚期前列腺癌症患者中始终观察到AR基因的扩增。第三,TP53探针计数越紧密聚集,其平均值与“2”的预期值相比更接近“1”。这可能反映了源自肿瘤组织的循环DNA部分中拷贝数丢失导致的TP53的一个或两个等位基因的失活。
这些数据表明本发明方法包括三个重要的核型分析方面。即,本文描述的方法检测广义的染色体非整倍性、特异性的靶向基因的拷贝增加和相同特异性的靶向基因中的拷贝丢失。这些结果进一步表明,本文描述的方法和平台可以指导精确疗法的使用,因为所有这三种基因组异常在癌症中经常发生。
测量了相对于健康对照(褐色点)的去势抗性前列腺癌症患者样品(蓝点)的广义染色体非整倍性(图28)。在该分析中,该实验中使用的所有239个对照探针的近似倍性是根据它们的染色体靶标排序的。对于一些染色体(例如,1号染色体和22号染色体),在患者与对照样品之间观察到类似的倍性值“2”。在其他情况下,观察到两个样品之间的偏差。由这些实验提供的关于总体基因组倍性的信息程度受所用对照探针的数量和密度的限制。然而,这些数据表明,以均匀密度覆盖所有染色体区段的更密集的探针组可以结合本发明的附加的独特特征使用。此类分析将提供染色体拷贝数的更高分辨率的全基因组测量。
这些数据进一步突出了本发明作为精确治疗指南的能力。例如,在同源重组修复中具有基因组缺陷的肿瘤通常表现出高度不稳定的染色体倍性,并且具有这种肿瘤的患者是PARP酶复合物抑制剂的良好候选者(参见Popova等人,Genome Biol.2009;10(11):R128)。与寻求对肿瘤进行基因分型的大多数测序测定不同,本文所述的测定使用测序来检测作为肿瘤表型的去稳定的染色体倍性,即使驱动该表型的因果突变仍然隐藏于靶向分析之外。
检测从实体瘤脱落的DNA中基因缺失的能力尤其重要。肿瘤抑制基因的突变和缺失是癌症基因组中的常见事件;此外,具有肿瘤抑制基因的种系缺失的个体在以后的生活中特别容易患上癌症。液体活检拷贝数丢失(CNL)测定的诊断价值与其灵敏度成正比。为了确定本文所述发明的检测下限,将实施例1中描述的永生化细胞系系统地稀释成“瓶中基因组”参考细胞系NA12878。一种细胞系具有ATM的单拷贝缺失(单等位基因丢失),另一细胞系具有BRCA2的单拷贝缺失。该实验包括四个纯NA12878的对照样品和八个含有16%的每个单等位基因缺失细胞系的掺杂样品(图29)。出于报告目的,这对应于双等位基因丢失的8%低等位基因频率。靶向特异性基因的所有探针和两个附加的未缺失的对照基因的平均值示于图29中。ATM和BRCA2的拷贝丢失仅限于掺加样品。对数据的附加计算处理揭示了低至2%低等位基因频率的双等位基因缺失的确信拷贝丢失调用。该灵敏度表明,本发明不需要专门考虑以在标准的基于血液的基因分型测定中常规地包括拷贝丢失调用。
这些数据证明了使用探针特异性基因组捕获数据来分析拷贝数,包括靶基因组基因座的拷贝数增加和拷贝数丢失。另外,本文所述的发明已显示具有检测单核苷酸变异、插入和单个核苷酸至数千个碱基对范围的缺失以及由异常突变过程的染色体重排产生的基因融合的灵敏能力(参见PCT公开号WO 2016/028316;和美国专利公开号2014-0274731)。所有这些突变过程都可以促进正常组织向肿瘤性癌症的转化,并且随着精确疗法的不断出现,对这些患病基因组特征的准确诊断将成为精准医学日益不可或缺的特征。
Claims (10)
1.用于从包含DNA片段的测试样品产生DNA文库的多种组合物,其中所述多种组合物包含一组衔接子,每种衔接子包含:
(i)扩增区,
(ii)样品标签区,和
(iii)锚定区;
其中所述的一组衔接子的每种衔接子的样品标签区包含多核苷酸序列,其中所述多核苷酸序列识别所述测试样品,并且其中所述多核苷酸序列识别独特DNA文库片段。
2.如权利要求1所述的多种组合物,其中所述的一组衔接子的每种衔接子包含选自独特样品标签区池的样品标签区,其中在所述独特样品标签区池的所有样品标签区中,包含所述样品标签区内的至少三个核苷酸的任何连续序列不是保守的。
3.如权利要求1所述的多种组合物,其中所述的一组衔接子的每种衔接子包含选自独特样品标签区池的样品标签区,其中所述独特样品标签区池选自多个池,并且其中所述池对所述测试样品是独特的。
4.包含多个DNA文库片段的DNA文库,其中所述DNA文库由测试样品产生,其中所述DNA文库片段各自包含衔接子和DNA片段,
其中所述衔接子选自一组衔接子并且包含:
(i)扩增区,
(ii)样品标签区,和
(iii)锚定区;
其中所述样品标签区包含多核苷酸序列,其中所述多核苷酸序列识别所述测试样品,并且其中所述多核苷酸序列识别独特DNA文库片段。
5.一组衔接子,其独特地识别包含DNA片段的测试样品,其中所述的一组衔接子的每种衔接子包含:
(i)扩增区,
(ii)样品标签区,和
(iii)锚定区;
其中所述样品标签区包含多核苷酸序列,其中所述多核苷酸序列识别所述测试样品,并且其中所述多核苷酸序列识别所述测试样品的独特DNA片段。
6.一种用于对来自包含多个DNA片段的测试样品的DNA靶区域进行遗传分析的方法,所述方法包括:
(a)通过使所述测试样品与一组衔接子接触来产生包含多个DNA文库片段的DNA文库,所述一组衔接子包含独特样品标签区池,其中所述DNA文库片段各自包含来自所述测试样品的DNA片段和衔接子,其中所述的一组衔接子的每种衔接子包含:
(i)扩增区;
(ii)包含多核苷酸序列的样品标签区,其中所述多核苷酸序列识别所述测试样品,并且其中所述多核苷酸序列识别独特DNA文库片段;和
(iii)锚定区;
以及
(b)对包含所述DNA靶区域的DNA文库片段进行定量遗传分析以检测指示疾病状态的遗传变化。
7.如权利要求6所述的方法,包括使所述DNA文库与特异性结合所述DNA靶区域的多个捕获探针接触,从而在所述捕获探针和包含所述DNA靶区域的DNA文库片段之间形成复合物。
8.一种用于对来自测试样品的DNA靶区域进行遗传分析的方法,其包括:
(a)生成包含多个DNA文库片段的基因组DNA文库,其中所述DNA文库片段中的每一个包含来自所述测试样品的基因组DNA片段和衔接子;
(b)使所述基因组DNA文库与特异性地结合DNA靶区域的多个捕获探针接触,从而在所述捕获探针与包含所述DNA靶区域的所述DNA文库片段之间形成复合物;以及
(c)对包含所述DNA靶区域的基因组DNA片段进行定量遗传分析;
其中所述衔接子是包含扩增区、样品标签区和锚定区的DNA多核苷酸;
其中所述扩增区包含能够充当PCR扩增的引物识别位点的多核苷酸序列;
其中所述样品标签包含编码所述独特文库DNA片段的特征且编码所述测试样品的特征的多核苷酸序列;
其中所述锚定区包含编码所述测试样品的特征的多核苷酸序列,并且其中所述锚定区能够附接至所述基因组DNA片段;并且
其中进行所述遗传分析以检测指示疾病状态的遗传变化。
9.一种用于高灵敏地检测拷贝数增加和拷贝数丢失的方法,其包括:
(i).测定针对捕获探针的RGD;
(ii).通过将针对所述捕获探针的RGD转换成探针特异性归一化读段计数,对实验组中所有样品中针对所述捕获探针的RGD进行归一化;
(iii).计算每个探针特异性归一化读段计数的近似拷贝数值;并且
(iv).对于针对靶向特异性基因的所有探针的近似拷贝数值取平均值。
10.一种用于测量染色体稳定性的方法,其包括:
(i).设计和验证一种或多种染色体稳定性探针的组,其中所述染色体稳定性探针均匀分布在人染色体上;
(ii).使用所述一种或多种染色体稳定性探针对患者样品进行靶向测序;
(iii).针对每种染色体探针测定近似拷贝数值;
(iv).测定患者样品的基因组表型,其中所述患者样品中针对一种或多种染色体探针的拷贝数值的波动表明基因组不稳定性。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662379593P | 2016-08-25 | 2016-08-25 | |
US62/379,593 | 2016-08-25 | ||
US201762481538P | 2017-04-04 | 2017-04-04 | |
US62/481,538 | 2017-04-04 | ||
CN201780059053.2A CN109804080B (zh) | 2016-08-25 | 2017-08-24 | 用于检测dna样品中基因组拷贝变化的方法 |
PCT/US2017/048434 WO2018039463A1 (en) | 2016-08-25 | 2017-08-24 | Methods for the detection of genomic copy changes in dna samples |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780059053.2A Division CN109804080B (zh) | 2016-08-25 | 2017-08-24 | 用于检测dna样品中基因组拷贝变化的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117286217A true CN117286217A (zh) | 2023-12-26 |
Family
ID=61245331
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780059053.2A Active CN109804080B (zh) | 2016-08-25 | 2017-08-24 | 用于检测dna样品中基因组拷贝变化的方法 |
CN202310805405.1A Pending CN117286217A (zh) | 2016-08-25 | 2017-08-24 | 用于检测dna样品中基因组拷贝变化的方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780059053.2A Active CN109804080B (zh) | 2016-08-25 | 2017-08-24 | 用于检测dna样品中基因组拷贝变化的方法 |
Country Status (12)
Country | Link |
---|---|
US (2) | US11319594B2 (zh) |
EP (1) | EP3504347A4 (zh) |
JP (3) | JP7217224B2 (zh) |
KR (2) | KR20230035431A (zh) |
CN (2) | CN109804080B (zh) |
AU (1) | AU2017315769B2 (zh) |
BR (1) | BR112019003704A2 (zh) |
CA (1) | CA3034649A1 (zh) |
MX (1) | MX2019002093A (zh) |
RU (1) | RU2019108294A (zh) |
SG (1) | SG11201901371XA (zh) |
WO (1) | WO2018039463A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6913089B2 (ja) | 2015-11-11 | 2021-08-04 | レゾリューション バイオサイエンス, インコーポレイテッド | Dnaライブラリーの高効率構築 |
RU2019108294A (ru) * | 2016-08-25 | 2020-09-25 | Резолюшн Байосайенс, Инк. | Способы обнаружения изменений количества геномных копий в образцах днк |
JP2021514663A (ja) * | 2018-03-08 | 2021-06-17 | セント・ジョーンズ・ユニバーシティSt. Johns University | 循環性血清無細胞dnaバイオマーカー及び方法 |
AU2019351130A1 (en) | 2018-09-27 | 2021-04-08 | Grail, Llc | Methylation markers and targeted methylation probe panel |
CN111118610A (zh) * | 2018-10-31 | 2020-05-08 | 深圳华大基因股份有限公司 | 用于基因突变高深度测序的基因芯片及其制备方法和应用 |
CN112930407A (zh) * | 2018-11-02 | 2021-06-08 | 加利福尼亚大学董事会 | 使用非人类核酸诊断和治疗癌症的方法 |
KR102452413B1 (ko) * | 2019-08-19 | 2022-10-11 | 주식회사 지씨지놈 | 핵산 단편간 거리 정보를 이용한 염색체 이상 검출 방법 |
US20230178182A1 (en) * | 2019-08-19 | 2023-06-08 | Green Cross Genome Corporation | Method for detecting chromosomal abnormality by using information about distance between nucleic acid fragments |
KR102184277B1 (ko) * | 2020-01-16 | 2020-11-30 | 성균관대학교산학협력단 | 초음파 진단 및 dna 검사 일체형 ai 자가 건강 관리 장치 및 이를 이용한 원격 의료 진단 방법 |
US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
CN113496760B (zh) * | 2020-04-01 | 2024-01-12 | 深圳华大基因科技服务有限公司 | 基于第三代测序的多倍体基因组组装方法和装置 |
CN113113085B (zh) * | 2021-03-15 | 2022-08-19 | 杭州杰毅生物技术有限公司 | 基于智能宏基因组测序数据肿瘤检测的分析系统及方法 |
GB202108237D0 (en) * | 2021-06-09 | 2021-07-21 | Univ London | Cancer methods |
CN114649094B (zh) * | 2022-03-30 | 2022-11-15 | 广东省人民医院 | 一种基于核磁共振的乳腺癌多参数临床决策辅助装置 |
CA3230267A1 (en) | 2022-08-04 | 2024-02-08 | Nam Hoon Hur | Battery pack |
Family Cites Families (105)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5591582A (en) | 1985-07-23 | 1997-01-07 | The Board Of Rijks Universiteit Leiden | Methods for detecting activated RAS oncogenes |
US5888731A (en) | 1995-08-30 | 1999-03-30 | Visible Genetics Inc. | Method for identification of mutations using ligation of multiple oligonucleotide probes |
CA2268368A1 (en) | 1997-08-28 | 1999-03-11 | The Perkin-Elmer Corporation | Improved detection of mutations in nucleic acids by chemical cleavage |
US6480791B1 (en) | 1998-10-28 | 2002-11-12 | Michael P. Strathmann | Parallel methods for genomic analysis |
US6812341B1 (en) | 2001-05-11 | 2004-11-02 | Ambion, Inc. | High efficiency mRNA isolation methods and compositions |
AU2002365028A1 (en) | 2001-07-17 | 2003-06-30 | Stratagene | Methods for detection of a target nucleic acid using multi-subunit probes |
AU2002322518A1 (en) | 2001-08-31 | 2003-03-18 | Rosetta Inpharmactis Llc | Methods for preparing nucleic acid samples |
US7361821B2 (en) | 2002-09-20 | 2008-04-22 | Intel Corporation | Controlled alignment of nanobarcodes encoding specific information for scanning probe microscopy (SPM) reading |
AU2003284420A1 (en) | 2002-12-11 | 2004-06-30 | Keio University | Method of constructing assigned molecule and library comprising the same and method of using the same |
TW200506052A (en) | 2003-05-07 | 2005-02-16 | Takara Bio Inc | Method of analyzing DNA region |
US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
EP2476761A3 (en) | 2005-07-07 | 2012-10-17 | Athlomics Pty Ltd | Polynucleotide marker genes and their expression, for diagnosis of endotoxemia |
GB0522310D0 (en) | 2005-11-01 | 2005-12-07 | Solexa Ltd | Methods of preparing libraries of template polynucleotides |
EP1989318B1 (en) | 2006-01-06 | 2014-07-30 | Agilent Technologies, Inc. | Reaction buffer composition for nucleic acid replication with packed dna polymerases |
US7537897B2 (en) | 2006-01-23 | 2009-05-26 | Population Genetics Technologies, Ltd. | Molecular counting |
US8383338B2 (en) | 2006-04-24 | 2013-02-26 | Roche Nimblegen, Inc. | Methods and systems for uniform enrichment of genomic regions |
US7754429B2 (en) | 2006-10-06 | 2010-07-13 | Illumina Cambridge Limited | Method for pair-wise sequencing a plurity of target polynucleotides |
EP2076609A1 (en) | 2006-10-10 | 2009-07-08 | Illumina Inc. | Compositions and methods for representational selection of nucleic acids fro complex mixtures using hybridization |
US20100112590A1 (en) | 2007-07-23 | 2010-05-06 | The Chinese University Of Hong Kong | Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment |
US8067164B2 (en) | 2007-08-12 | 2011-11-29 | Integrated Dna Technologies, Inc. | Microarray system with improved sequence specificity |
US9388457B2 (en) | 2007-09-14 | 2016-07-12 | Affymetrix, Inc. | Locus specific amplification using array probes |
EP2227563B1 (en) | 2007-12-05 | 2012-06-06 | Complete Genomics, Inc. | Efficient base determination in sequencing reactions |
WO2009091798A1 (en) | 2008-01-16 | 2009-07-23 | Helicos Biosciences Corporation | Quantitative genetic analysis |
US8202691B2 (en) | 2008-01-25 | 2012-06-19 | Illumina, Inc. | Uniform fragmentation of DNA using binding proteins |
US8383345B2 (en) | 2008-09-12 | 2013-02-26 | University Of Washington | Sequence tag directed subassembly of short sequencing reads into long sequencing reads |
WO2010038042A1 (en) | 2008-10-02 | 2010-04-08 | Illumina Cambridge Ltd. | Nucleic acid sample enrichment for sequencing applications |
WO2010068856A1 (en) | 2008-12-11 | 2010-06-17 | Trustees Of Boston University | Isolation of rna |
CN103952482A (zh) | 2009-04-02 | 2014-07-30 | 弗卢伊蒂格姆公司 | 用于对目标核酸进行条形码化的多引物扩增方法 |
WO2010127186A1 (en) | 2009-04-30 | 2010-11-04 | Prognosys Biosciences, Inc. | Nucleic acid constructs and methods of use |
US20110003301A1 (en) | 2009-05-08 | 2011-01-06 | Life Technologies Corporation | Methods for detecting genetic variations in dna samples |
ES2595055T3 (es) | 2009-08-25 | 2016-12-27 | Illumina, Inc. | Métodos para seleccionar y amplificar polinucleótidos |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
US9315857B2 (en) | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
US10388403B2 (en) | 2010-01-19 | 2019-08-20 | Verinata Health, Inc. | Analyzing copy number variation in the detection of cancer |
US10378064B1 (en) | 2010-04-16 | 2019-08-13 | Chronix Biomedical | Analyzing circulating nucleic acids to identify a biomarker representative of cancer presented by a patient population |
US9677118B2 (en) | 2014-04-21 | 2017-06-13 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US8828688B2 (en) | 2010-05-27 | 2014-09-09 | Affymetrix, Inc. | Multiplex amplification methods |
US20110319290A1 (en) | 2010-06-08 | 2011-12-29 | Nugen Technologies, Inc. | Methods and Compositions for Multiplex Sequencing |
EP2426217A1 (en) | 2010-09-03 | 2012-03-07 | Centre National de la Recherche Scientifique (CNRS) | Analytical methods for cell free nucleic acids and applications |
EP3572528A1 (en) | 2010-09-24 | 2019-11-27 | The Board of Trustees of the Leland Stanford Junior University | Direct capture, amplification and sequencing of target dna using immobilized primers |
KR102040307B1 (ko) | 2010-11-30 | 2019-11-27 | 더 차이니즈 유니버시티 오브 홍콩 | 암과 연관된 유전적 또는 분자적 이상들의 검출 |
AU2011352070A1 (en) | 2010-12-30 | 2013-07-18 | Foundation Medicine, Inc. | Optimization of multigene analysis of tumor samples |
AU2011358564B9 (en) | 2011-02-09 | 2017-07-13 | Natera, Inc | Methods for non-invasive prenatal ploidy calling |
WO2012129363A2 (en) | 2011-03-24 | 2012-09-27 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
HUE050032T2 (hu) | 2011-04-12 | 2020-11-30 | Verinata Health Inc | Genomfrakciók feloldása polimorfizmus-szám alkalmazásával |
EP3246416A1 (en) | 2011-04-15 | 2017-11-22 | The Johns Hopkins University | Safe sequencing system |
WO2013056178A2 (en) | 2011-10-14 | 2013-04-18 | Foundation Medicine, Inc. | Novel estrogen receptor mutations and uses thereof |
CN103103624B (zh) | 2011-11-15 | 2014-12-31 | 深圳华大基因科技服务有限公司 | 高通量测序文库的构建方法及其应用 |
US10227587B2 (en) | 2012-01-10 | 2019-03-12 | Berry Genomics Co., Ltd. | Method for constructing a plasma DNA sequencing library |
US9892230B2 (en) | 2012-03-08 | 2018-02-13 | The Chinese University Of Hong Kong | Size-based analysis of fetal or tumor DNA fraction in plasma |
ES2828661T3 (es) | 2012-03-20 | 2021-05-27 | Univ Washington Through Its Center For Commercialization | Métodos para reducir la tasa de error de la secuenciación de ADN masiva en paralelo mediante el uso de la secuenciación de secuencia consenso bicatenaria |
US20130288915A1 (en) | 2012-04-27 | 2013-10-31 | Htg Molecular Diagnostics, Inc. | Compositions and methods for alk molecular testing |
WO2013181170A1 (en) | 2012-05-31 | 2013-12-05 | Board Of Regents, The University Of Texas System | Method for accurate sequencing of dna |
AU2013286635B2 (en) | 2012-07-03 | 2018-11-08 | Foundation Medicine, Inc. | Tm-enhanced blocking oligonucleotides and baits for improved target enrichment and reduced off-target selection |
WO2014020502A2 (en) | 2012-07-31 | 2014-02-06 | Novartis Ag | Markers associated with human double minute 2 inhibitors |
WO2014022830A2 (en) | 2012-08-03 | 2014-02-06 | Foundation Medicine, Inc. | Human papilloma virus as predictor of cancer prognosis |
US10876152B2 (en) | 2012-09-04 | 2020-12-29 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
KR102028375B1 (ko) | 2012-09-04 | 2019-10-04 | 가던트 헬쓰, 인크. | 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법 |
CA2886605A1 (en) | 2012-09-28 | 2014-04-03 | Cepheid | Two-primer pcr for microrna multiplex assay |
EP2904534B1 (en) * | 2012-10-04 | 2021-12-15 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US10482994B2 (en) * | 2012-10-04 | 2019-11-19 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US20150291953A1 (en) | 2012-11-02 | 2015-10-15 | Enzymatics Inc. | Methods and kits for nucleic acid sample preparation for sequencing |
CA2890207A1 (en) | 2012-11-05 | 2014-05-08 | Foundation Medicine, Inc. | Novel ntrk1 fusion molecules and uses thereof |
US9932576B2 (en) | 2012-12-10 | 2018-04-03 | Resolution Bioscience, Inc. | Methods for targeted genomic analysis |
EP2931922B1 (en) | 2012-12-14 | 2018-10-17 | Chronix Biomedical | Personalized biomarkers for cancer |
US11158425B2 (en) | 2013-01-05 | 2021-10-26 | Foundation Medicine, Inc. | System and method for managing genomic information |
WO2014116881A1 (en) | 2013-01-23 | 2014-07-31 | Reproductive Genetics And Technology Solutions, Llc | Compositions and methods for genetic analysis of embryos |
WO2014122288A1 (en) | 2013-02-08 | 2014-08-14 | Qiagen Gmbh | Method for separating dna by size |
ES2946689T3 (es) | 2013-03-15 | 2023-07-24 | Univ Leland Stanford Junior | Identificación y uso de marcadores tumorales de ácido nucleico circulante |
US10017807B2 (en) | 2013-03-15 | 2018-07-10 | Verinata Health, Inc. | Generating cell-free DNA libraries directly from blood |
EP2994847A4 (en) | 2013-05-10 | 2017-04-19 | Foundation Medicine, Inc. | Analysis of genetic variants |
US20150072344A1 (en) | 2013-09-10 | 2015-03-12 | Imdaptive Incorporated | Barcoded Universal Marker Indicator (BUMI) Tags |
US10851414B2 (en) | 2013-10-18 | 2020-12-01 | Good Start Genetics, Inc. | Methods for determining carrier status |
WO2015073711A1 (en) | 2013-11-13 | 2015-05-21 | Nugen Technologies, Inc. | Compositions and methods for identification of a duplicate sequencing read |
CN103668471B (zh) | 2013-12-19 | 2015-09-30 | 上海交通大学 | 一种构建dna高通量测序文库的方法及其配套试剂盒 |
AU2014369841B2 (en) | 2013-12-28 | 2019-01-24 | Guardant Health, Inc. | Methods and systems for detecting genetic variants |
JP6723929B2 (ja) | 2014-01-31 | 2020-07-15 | スウィフト バイオサイエンシズ, インク.Swift Biosciences, Inc. | Dna基質を処理するための改善された方法 |
WO2015134552A1 (en) | 2014-03-03 | 2015-09-11 | Swift Biosciences, Inc. | Enhanced adaptor ligation |
US10975371B2 (en) * | 2014-04-29 | 2021-04-13 | Illumina, Inc. | Nucleic acid sequence analysis from single cells |
KR20170026383A (ko) | 2014-06-26 | 2017-03-08 | 10엑스 제노믹스, 인크. | 핵산 서열의 분석 |
CN107075581B (zh) | 2014-08-06 | 2022-03-18 | 纽亘技术公司 | 由靶向测序进行数字测量 |
US20160053301A1 (en) | 2014-08-22 | 2016-02-25 | Clearfork Bioscience, Inc. | Methods for quantitative genetic analysis of cell free dna |
CA2957657A1 (en) * | 2014-08-22 | 2016-02-25 | Resolution Bioscience, Inc. | Methods for quantitative genetic analysis of cell free dna |
CN106661636A (zh) | 2014-09-05 | 2017-05-10 | 凯杰有限公司 | 衔接子连接的扩增子的制备 |
ES2925014T3 (es) | 2014-09-12 | 2022-10-13 | Univ Leland Stanford Junior | Identificación y uso de ácidos nucleicos circulantes |
US9890375B2 (en) | 2014-09-12 | 2018-02-13 | Bgi Shenzhen Co., Limited | Isolated oligonucleotide and use thereof in nucleic acid sequencing |
CA2967447A1 (en) | 2014-12-05 | 2016-06-09 | Foundation Medicine, Inc. | Multigene analysis of tumor samples |
MA40939A (fr) | 2014-12-12 | 2017-10-18 | Verinata Health Inc | Utilisation de la taille de fragments d'adn acellulaire pour déterminer les variations du nombre de copies |
EP3766986B1 (en) | 2014-12-31 | 2022-06-01 | Guardant Health, Inc. | Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results |
PT3256605T (pt) | 2015-02-10 | 2022-03-17 | Univ Hong Kong Chinese | Deteção de mutações para rastreio de cancro e análise fetal |
TWI730973B (zh) | 2015-07-23 | 2021-06-21 | 香港中文大學 | 游離dna(cell-free dna)之片段化模式分析 |
CN108474040B (zh) | 2015-10-09 | 2023-05-16 | 夸登特健康公司 | 使用无细胞dna的基于群体的治疗推荐 |
EP3359695B1 (en) | 2015-10-10 | 2020-04-15 | Guardant Health, Inc. | Methods and applications of gene fusion detection in cell-free dna analysis |
JP6913089B2 (ja) | 2015-11-11 | 2021-08-04 | レゾリューション バイオサイエンス, インコーポレイテッド | Dnaライブラリーの高効率構築 |
US10095831B2 (en) | 2016-02-03 | 2018-10-09 | Verinata Health, Inc. | Using cell-free DNA fragment size to determine copy number variations |
MX2018010362A (es) | 2016-02-29 | 2019-03-28 | Found Medicine Inc | Metodos y sistemas para evaluar carga mutacional de tumores. |
WO2017214557A1 (en) | 2016-06-10 | 2017-12-14 | Counsyl, Inc. | Nucleic acid sequencing adapters and uses thereof |
RU2019108294A (ru) | 2016-08-25 | 2020-09-25 | Резолюшн Байосайенс, Инк. | Способы обнаружения изменений количества геномных копий в образцах днк |
CA3027919C (en) | 2016-09-30 | 2023-02-28 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
US9850523B1 (en) | 2016-09-30 | 2017-12-26 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
IL266654B2 (en) | 2016-11-17 | 2024-03-01 | Lgc Clinical Diagnostics Inc | Methods for preparing reference material for DNA and controls |
EP3551769A4 (en) | 2016-12-09 | 2020-10-28 | Boreal Genomics, Inc. | LINKED LIGATURE |
CA3057163A1 (en) | 2017-04-14 | 2018-10-18 | Guardant Health, Inc. | Methods of attaching adapters to sample nucleic acids |
JP2022513124A (ja) | 2018-11-21 | 2022-02-07 | アヴィダ バイオメッド, インコーポレイテッド | 標的化された核酸ライブラリー形成のための方法 |
-
2017
- 2017-08-24 RU RU2019108294A patent/RU2019108294A/ru not_active Application Discontinuation
- 2017-08-24 KR KR1020237006718A patent/KR20230035431A/ko not_active Application Discontinuation
- 2017-08-24 KR KR1020197008555A patent/KR102505122B1/ko active IP Right Grant
- 2017-08-24 JP JP2019511456A patent/JP7217224B2/ja active Active
- 2017-08-24 SG SG11201901371XA patent/SG11201901371XA/en unknown
- 2017-08-24 EP EP17844424.6A patent/EP3504347A4/en active Pending
- 2017-08-24 CN CN201780059053.2A patent/CN109804080B/zh active Active
- 2017-08-24 AU AU2017315769A patent/AU2017315769B2/en active Active
- 2017-08-24 CA CA3034649A patent/CA3034649A1/en active Pending
- 2017-08-24 BR BR112019003704A patent/BR112019003704A2/pt unknown
- 2017-08-24 WO PCT/US2017/048434 patent/WO2018039463A1/en unknown
- 2017-08-24 MX MX2019002093A patent/MX2019002093A/es unknown
- 2017-08-24 CN CN202310805405.1A patent/CN117286217A/zh active Pending
- 2017-08-24 US US15/685,834 patent/US11319594B2/en active Active
-
2021
- 2021-11-05 JP JP2021180899A patent/JP7304393B2/ja active Active
-
2022
- 2022-01-27 US US17/586,143 patent/US20220325353A1/en active Pending
-
2023
- 2023-03-20 JP JP2023044421A patent/JP2023078336A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3504347A1 (en) | 2019-07-03 |
SG11201901371XA (en) | 2019-03-28 |
AU2017315769A1 (en) | 2019-03-21 |
JP2019526257A (ja) | 2019-09-19 |
RU2019108294A (ru) | 2020-09-25 |
JP7217224B2 (ja) | 2023-02-02 |
WO2018039463A1 (en) | 2018-03-01 |
CA3034649A1 (en) | 2018-03-01 |
JP7304393B2 (ja) | 2023-07-06 |
KR102505122B1 (ko) | 2023-03-08 |
EP3504347A4 (en) | 2020-04-29 |
JP2023078336A (ja) | 2023-06-06 |
JP2022023213A (ja) | 2022-02-07 |
US20220325353A1 (en) | 2022-10-13 |
CN109804080A (zh) | 2019-05-24 |
CN109804080B (zh) | 2023-07-21 |
BR112019003704A2 (pt) | 2019-05-28 |
AU2017315769B2 (en) | 2024-02-01 |
KR20190041510A (ko) | 2019-04-22 |
KR20230035431A (ko) | 2023-03-13 |
US11319594B2 (en) | 2022-05-03 |
US20180163272A1 (en) | 2018-06-14 |
MX2019002093A (es) | 2019-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109804080B (zh) | 用于检测dna样品中基因组拷贝变化的方法 | |
JP7318054B2 (ja) | Dnaライブラリーの高効率構築 | |
JP6709778B2 (ja) | 無細胞DNA(cfDNA)の定量的遺伝子解析のための方法 | |
US20220073906A1 (en) | Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis | |
JP7441584B6 (ja) | 無細胞DNA(cfDNA)の定量的遺伝子解析のための方法 | |
KR20240004397A (ko) | 다중 라이브러리의 동시 유전자 분석을 위한 조성물 및 방법 | |
NZ791679A (en) | Methods for the detection of genomic copy changes in dna samples |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |