JP2024513236A - 複雑なゲノム領域を解析するための方法およびシステム - Google Patents
複雑なゲノム領域を解析するための方法およびシステム Download PDFInfo
- Publication number
- JP2024513236A JP2024513236A JP2023561289A JP2023561289A JP2024513236A JP 2024513236 A JP2024513236 A JP 2024513236A JP 2023561289 A JP2023561289 A JP 2023561289A JP 2023561289 A JP2023561289 A JP 2023561289A JP 2024513236 A JP2024513236 A JP 2024513236A
- Authority
- JP
- Japan
- Prior art keywords
- nucleotide sequence
- interest
- crispr
- cases
- genomic region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 277
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 260
- 108091033409 CRISPR Proteins 0.000 claims abstract description 185
- 108010042407 Endonucleases Proteins 0.000 claims abstract description 170
- 238000012163 sequencing technique Methods 0.000 claims abstract description 114
- 238000007671 third-generation sequencing Methods 0.000 claims abstract description 48
- 230000002068 genetic effect Effects 0.000 claims abstract description 34
- 108020004414 DNA Proteins 0.000 claims abstract description 33
- 238000003205 genotyping method Methods 0.000 claims abstract description 29
- 238000012916 structural analysis Methods 0.000 claims abstract description 23
- 102000004533 Endonucleases Human genes 0.000 claims abstract description 21
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract 32
- 239000002773 nucleotide Substances 0.000 claims description 188
- 125000003729 nucleotide group Chemical group 0.000 claims description 188
- 108010001237 Cytochrome P-450 CYP2D6 Proteins 0.000 claims description 154
- 102100021704 Cytochrome P450 2D6 Human genes 0.000 claims description 151
- 102100031780 Endonuclease Human genes 0.000 claims description 149
- 239000012634 fragment Substances 0.000 claims description 123
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 84
- 230000003321 amplification Effects 0.000 claims description 82
- 108090000623 proteins and genes Proteins 0.000 claims description 82
- 230000000295 complement effect Effects 0.000 claims description 73
- 108060002716 Exonuclease Proteins 0.000 claims description 59
- 102000013165 exonuclease Human genes 0.000 claims description 59
- 238000003752 polymerase chain reaction Methods 0.000 claims description 50
- 230000015654 memory Effects 0.000 claims description 45
- 101000896576 Homo sapiens Putative cytochrome P450 2D7 Proteins 0.000 claims description 44
- 102100021702 Putative cytochrome P450 2D7 Human genes 0.000 claims description 44
- 239000012472 biological sample Substances 0.000 claims description 41
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 34
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 33
- 108091008109 Pseudogenes Proteins 0.000 claims description 33
- 102000057361 Pseudogenes Human genes 0.000 claims description 33
- 239000000523 sample Substances 0.000 claims description 32
- 239000003814 drug Substances 0.000 claims description 29
- 239000012530 fluid Substances 0.000 claims description 28
- 230000007614 genetic variation Effects 0.000 claims description 28
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 25
- 210000004369 blood Anatomy 0.000 claims description 24
- 239000008280 blood Substances 0.000 claims description 24
- 238000006073 displacement reaction Methods 0.000 claims description 24
- 238000007834 ligase chain reaction Methods 0.000 claims description 24
- 238000011144 upstream manufacturing Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 23
- 108700004991 Cas12a Proteins 0.000 claims description 22
- 150000007523 nucleic acids Chemical group 0.000 claims description 22
- 238000011282 treatment Methods 0.000 claims description 22
- 238000003780 insertion Methods 0.000 claims description 18
- 230000037431 insertion Effects 0.000 claims description 18
- 101150069031 CSN2 gene Proteins 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 101150055601 cops2 gene Proteins 0.000 claims description 17
- 229940124597 therapeutic agent Drugs 0.000 claims description 17
- 101150074775 Csf1 gene Proteins 0.000 claims description 15
- 230000035772 mutation Effects 0.000 claims description 15
- 210000001519 tissue Anatomy 0.000 claims description 15
- 238000007397 LAMP assay Methods 0.000 claims description 14
- 230000003247 decreasing effect Effects 0.000 claims description 14
- 238000007672 fourth generation sequencing Methods 0.000 claims description 14
- 230000003252 repetitive effect Effects 0.000 claims description 14
- 230000004544 DNA amplification Effects 0.000 claims description 13
- 108060004795 Methyltransferase Proteins 0.000 claims description 12
- 230000001419 dependent effect Effects 0.000 claims description 12
- 210000002381 plasma Anatomy 0.000 claims description 12
- 238000005096 rolling process Methods 0.000 claims description 12
- 210000003296 saliva Anatomy 0.000 claims description 12
- 206010003445 Ascites Diseases 0.000 claims description 11
- 206010036790 Productive cough Diseases 0.000 claims description 11
- 210000004381 amniotic fluid Anatomy 0.000 claims description 11
- 210000001124 body fluid Anatomy 0.000 claims description 11
- 239000010839 body fluid Substances 0.000 claims description 11
- 210000001185 bone marrow Anatomy 0.000 claims description 11
- 230000000762 glandular Effects 0.000 claims description 11
- 210000004251 human milk Anatomy 0.000 claims description 11
- 235000020256 human milk Nutrition 0.000 claims description 11
- 238000011901 isothermal amplification Methods 0.000 claims description 11
- 210000002751 lymph Anatomy 0.000 claims description 11
- 210000004910 pleural fluid Anatomy 0.000 claims description 11
- 108091008146 restriction endonucleases Proteins 0.000 claims description 11
- 230000028327 secretion Effects 0.000 claims description 11
- 210000000582 semen Anatomy 0.000 claims description 11
- 210000002966 serum Anatomy 0.000 claims description 11
- 239000007787 solid Substances 0.000 claims description 11
- 210000003802 sputum Anatomy 0.000 claims description 11
- 208000024794 sputum Diseases 0.000 claims description 11
- 210000004243 sweat Anatomy 0.000 claims description 11
- 210000002700 urine Anatomy 0.000 claims description 11
- 238000001976 enzyme digestion Methods 0.000 claims description 10
- 108010052305 exodeoxyribonuclease III Proteins 0.000 claims description 9
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 claims description 8
- 108010046914 Exodeoxyribonuclease V Proteins 0.000 claims description 8
- 102100029075 Exonuclease 1 Human genes 0.000 claims description 8
- 102000019236 Exonuclease V Human genes 0.000 claims description 8
- 108010086271 exodeoxyribonuclease II Proteins 0.000 claims description 8
- 230000002829 reductive effect Effects 0.000 claims description 8
- 230000029087 digestion Effects 0.000 claims description 6
- 210000001742 aqueous humor Anatomy 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 238000013467 fragmentation Methods 0.000 claims description 4
- 238000006062 fragmentation reaction Methods 0.000 claims description 4
- 238000010008 shearing Methods 0.000 claims description 4
- 108091081548 Palindromic sequence Proteins 0.000 claims description 3
- 108700028369 Alleles Proteins 0.000 description 42
- 238000013459 approach Methods 0.000 description 30
- 238000003860 storage Methods 0.000 description 30
- 102000004169 proteins and genes Human genes 0.000 description 27
- 238000004458 analytical method Methods 0.000 description 25
- 229920001184 polypeptide Polymers 0.000 description 22
- 108090000765 processed proteins & peptides Proteins 0.000 description 22
- 102000004196 processed proteins & peptides Human genes 0.000 description 22
- 238000013461 design Methods 0.000 description 20
- 230000000670 limiting effect Effects 0.000 description 19
- 101150010738 CYP2D6 gene Proteins 0.000 description 16
- 238000003776 cleavage reaction Methods 0.000 description 16
- 108091092584 GDNA Proteins 0.000 description 15
- 230000008685 targeting Effects 0.000 description 15
- 230000007017 scission Effects 0.000 description 14
- 108091027544 Subgenomic mRNA Proteins 0.000 description 13
- 238000012217 deletion Methods 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 210000004027 cell Anatomy 0.000 description 12
- 238000004891 communication Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 12
- 238000007481 next generation sequencing Methods 0.000 description 12
- 229940079593 drug Drugs 0.000 description 11
- 102000054766 genetic haplotypes Human genes 0.000 description 11
- 108091079001 CRISPR RNA Proteins 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 238000003556 assay Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 9
- 238000002955 isolation Methods 0.000 description 9
- 102000039446 nucleic acids Human genes 0.000 description 9
- 108020004707 nucleic acids Proteins 0.000 description 9
- 108091093088 Amplicon Proteins 0.000 description 8
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 8
- 230000018109 developmental process Effects 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 8
- 238000010200 validation analysis Methods 0.000 description 8
- 238000010453 CRISPR/Cas method Methods 0.000 description 7
- 238000005520 cutting process Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 210000003608 fece Anatomy 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 101710163270 Nuclease Proteins 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 238000012300 Sequence Analysis Methods 0.000 description 5
- 108091028113 Trans-activating crRNA Proteins 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 241000270322 Lepidosauria Species 0.000 description 4
- 101710137500 T7 RNA polymerase Proteins 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 239000011543 agarose gel Substances 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000002974 pharmacogenomic effect Effects 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 108010026925 Cytochrome P-450 CYP2C19 Proteins 0.000 description 3
- 108010000561 Cytochrome P-450 CYP2C8 Proteins 0.000 description 3
- 108010000543 Cytochrome P-450 CYP2C9 Proteins 0.000 description 3
- 102100029368 Cytochrome P450 2C18 Human genes 0.000 description 3
- 102100029363 Cytochrome P450 2C19 Human genes 0.000 description 3
- 102100029358 Cytochrome P450 2C9 Human genes 0.000 description 3
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 101000919360 Homo sapiens Cytochrome P450 2C18 Proteins 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- -1 but not limited to Proteins 0.000 description 3
- 238000010804 cDNA synthesis Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 230000030609 dephosphorylation Effects 0.000 description 3
- 238000006209 dephosphorylation reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000002405 diagnostic procedure Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 238000012252 genetic analysis Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000012925 reference material Substances 0.000 description 3
- 238000010839 reverse transcription Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 2
- 241000270722 Crocodylidae Species 0.000 description 2
- 102100029359 Cytochrome P450 2C8 Human genes 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 241000238557 Decapoda Species 0.000 description 2
- 241000701959 Escherichia virus Lambda Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 150000003838 adenosines Chemical class 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 235000019688 fish Nutrition 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000004545 gene duplication Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 235000020938 metabolic status Nutrition 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 230000009438 off-target cleavage Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 229940126585 therapeutic drug Drugs 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012070 whole genome sequencing analysis Methods 0.000 description 2
- 241000269350 Anura Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000269420 Bufonidae Species 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 101100008049 Caenorhabditis elegans cut-5 gene Proteins 0.000 description 1
- 241000269333 Caudata Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 241000272194 Ciconiiformes Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 1
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 description 1
- 108700039964 Duplicate Genes Proteins 0.000 description 1
- 241000701867 Enterobacteria phage T7 Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 229940127450 Opioid Agonists Drugs 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- 241000282405 Pongo abelii Species 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000269622 Salamandridae Species 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- 241001415849 Strigiformes Species 0.000 description 1
- 241000271567 Struthioniformes Species 0.000 description 1
- 101000708607 Subterranean clover stunt virus (strain F) Para-Rep C6 Proteins 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 241000270666 Testudines Species 0.000 description 1
- 241000270708 Testudinidae Species 0.000 description 1
- 241000269959 Xiphias gladius Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000007844 allele-specific PCR Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 239000000935 antidepressant agent Substances 0.000 description 1
- 229940005513 antidepressants Drugs 0.000 description 1
- 239000002249 anxiolytic agent Substances 0.000 description 1
- 230000000949 anxiolytic effect Effects 0.000 description 1
- 229940005530 anxiolytics Drugs 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000011948 assay development Methods 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 239000003560 cancer drug Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 241001233037 catfish Species 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010240 hepatic drug metabolism Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 239000000955 prescription drug Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000007420 reactivation Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 1
- 235000021335 sword fish Nutrition 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1137—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
- C12Q1/683—Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y104/00—Oxidoreductases acting on the CH-NH2 group of donors (1.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
複雑なゲノム領域を解析(例えば、配列決定、遺伝子型決定、構造解析)するための改善された方法が本明細書に提示される。一部の場合では、方法は、目的のゲノム領域をゲノムDNAから切り出すための、CRISPR関連エンドヌクレアーゼおよび外側のガイドRNAの対および内側のガイドRNAの対の使用を伴う。方法は、目的の遺伝子領域を配列決定するための、ロングリードシーケンシングの使用をさらに伴う。一部の場合では、方法は、無増幅である。
Description
相互参照
本出願は、その全体が参照により本明細書に組み込まれる2021年4月6日出願の米国仮出願第63/171,387号の利益を主張するものである。
本出願は、その全体が参照により本明細書に組み込まれる2021年4月6日出願の米国仮出願第63/171,387号の利益を主張するものである。
配列表
本出願は、ASCIIフォーマットで電子的に提出されており、その全体が参照により本明細書に組み込まれる、配列表を含む。前記ASCIIコピーは、2022年4月5日に作成されたもので、名称は57312-702_601_SL.txt、サイズは109,652バイトである。
本出願は、ASCIIフォーマットで電子的に提出されており、その全体が参照により本明細書に組み込まれる、配列表を含む。前記ASCIIコピーは、2022年4月5日に作成されたもので、名称は57312-702_601_SL.txt、サイズは109,652バイトである。
背景
遺伝的変異は薬物適用に対する応答に影響を及ぼす可能性があるので、薬理遺伝学(PGx)は個別化された薬物応答の決定を可能にする精密医療の構成要素である。PGxの利益としては、費用および薬物有害反応(SADR)のリスクの低減、ならびに薬効の改善が挙げられる。現在多数のPGx遺伝子が試験されているが、シトクロムP450 2D6(CYP2D6)の診断的価値が極めて大きく、これは、全薬物の25%に至るまでがCYP2D6によって活性化または代謝されるからである。これらの薬物としては、がん薬物、オピオイドアゴニスト、ならびに、いくつかの抗うつ薬および抗不安薬剤が挙げられる。CYP2D6酵素はCYP2D6遺伝子によってコードされ、遺伝的変異により酵素機能の低下または完全な喪失が引き起こされる可能性がある。CYP2D6は肝臓において主に発現され、肝臓での薬物代謝およびクリアランスの主要な一因である。CYP2D6の遺伝的変異を正しく診断することに伴う問題はSADRが発生するリスクに直接影響を及ぼし得る。NIH Clinical Pharmacogenetics Implementation Consortium(CPIC)は現在、CYP2D6の臨床試験を支持するエビデンスに関連する58種の薬物をリストアップしており、それにより、CYP2D6は上位遺伝子のうちの1つになっている。米国だけでCYP2D6の試験は2019年には$522Mの市場であり、年間の成長率は6~8%であると推定される。
遺伝的変異は薬物適用に対する応答に影響を及ぼす可能性があるので、薬理遺伝学(PGx)は個別化された薬物応答の決定を可能にする精密医療の構成要素である。PGxの利益としては、費用および薬物有害反応(SADR)のリスクの低減、ならびに薬効の改善が挙げられる。現在多数のPGx遺伝子が試験されているが、シトクロムP450 2D6(CYP2D6)の診断的価値が極めて大きく、これは、全薬物の25%に至るまでがCYP2D6によって活性化または代謝されるからである。これらの薬物としては、がん薬物、オピオイドアゴニスト、ならびに、いくつかの抗うつ薬および抗不安薬剤が挙げられる。CYP2D6酵素はCYP2D6遺伝子によってコードされ、遺伝的変異により酵素機能の低下または完全な喪失が引き起こされる可能性がある。CYP2D6は肝臓において主に発現され、肝臓での薬物代謝およびクリアランスの主要な一因である。CYP2D6の遺伝的変異を正しく診断することに伴う問題はSADRが発生するリスクに直接影響を及ぼし得る。NIH Clinical Pharmacogenetics Implementation Consortium(CPIC)は現在、CYP2D6の臨床試験を支持するエビデンスに関連する58種の薬物をリストアップしており、それにより、CYP2D6は上位遺伝子のうちの1つになっている。米国だけでCYP2D6の試験は2019年には$522Mの市場であり、年間の成長率は6~8%であると推定される。
現時点で、CYP2D6に関して、高頻度のコピー数変異を含め、100を超える薬理遺伝学的な関連性のある変更(*スター対立遺伝子ハプロタイプとも称される)が記載されている。さらに、近接する高度に相同な(94%同一まで)偽遺伝子(CYP2D7およびCYP2D8)との遺伝子融合物およびハイブリッドにより変異体コーリングが複雑になる。米国では、約13%の人がCYP2D6構造変異体を有し、これらの変異体は、当該遺伝子に関連する全ての変異のうちの7%を表す。これらの特色により、現行の試験プラットフォームを用いた遺伝子解析が複雑になり、希少なまたは複雑なハプロタイプの多くが正確に解析されない。多くのグループによる研究により、現在使用されている市販の遺伝子型決定プラットフォームでは、CYP2D6の誤った特徴付けが生じやすいことが実証されている。これにより、間違った割り当てが導かれ、その結果、間違った投薬が推奨される。遺伝子の配列決定も、ショートリードに基づく場合(NGS)または鋳型の長さに基づく場合(サンガーシーケンシング)に同様に妨害される。構造全体をより精密に決定するために標的化増幅、コピー数解析、および長距離PCRを組み合わせる多数の方法が開発されているが、これらの方法は、複雑なワークフロー、時間要件、および全体的な費用に起因して、常套的な臨床試験には適さない。
概要
複雑なゲノム領域を正確にかつ費用効果を大きく解析するための改善された方法およびシステムに対して満たされていない必要性が存在する。本開示は、この満たされていない必要性に合致する。
複雑なゲノム領域を正確にかつ費用効果を大きく解析するための改善された方法およびシステムに対して満たされていない必要性が存在する。本開示は、この満たされていない必要性に合致する。
本開示の一態様では、目的のゲノム領域を解析(例えば、配列決定、遺伝子型決定、構造解析)する方法であって、a)目的のゲノム領域を含むゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeat)(CRISPR)関連エンドヌクレアーゼおよび外側のガイドRNA(gRNA)の対と接触させるステップであって、それにより、目的のゲノム領域を含む第1の切り出された断片を生成する、ステップと、b)第1の切り出された断片をCRISPR関連エンドヌクレアーゼおよび内側のgRNAの対と接触させるステップであって、それにより、目的のゲノム領域を含む第2の切り出された断片を生成する、ステップと、c)第2の切り出された断片内に含有される目的のゲノム領域を解析するステップとを含む、方法が提供される。一部の場合では、a)のCRISPR関連エンドヌクレアーゼおよび外側のgRNAの対が、第1の切り出された断片の5’末端および3’末端と会合し、それをブロックする。一部の場合では、方法は、b)の前に、a)の産物を1種または複数種のエキソヌクレアーゼと接触させるステップであって、その結果、バックグラウンドゲノムDNAが消化され、第1の切り出された断片は消化されない、ステップをさらに含む。一部の場合では、1種または複数種のエキソヌクレアーゼは、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII、およびこれらの任意の組合せからなる群より選択される。一部の場合では、外側のgRNAの対は、第1の外側のgRNAと第2の外側のgRNAとを含む。一部の場合では、第1の外側のgRNAは、ゲノムDNAに存在する第1のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、第2の外側のgRNAは、ゲノムDNAに存在する第2のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、第1のヌクレオチド配列と第2のヌクレオチド配列は異なる。一部の場合では、第1のヌクレオチド配列と第2のヌクレオチド配列は、目的のゲノム領域に隣接する。一部の場合では、第1のヌクレオチド配列、第2のヌクレオチド配列、またはその両方は、ゲノムDNA内の、目的のゲノム領域から最大約100キロベース長のところに存在する。一部の場合では、内側のgRNAの対は、第1の内側のgRNAと第2の内側のgRNAとを含む。一部の場合では、第1の内側のgRNAは、ゲノムDNAに存在する第3のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、第2の内側のgRNAは、ゲノムDNAに存在する第4のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、第3のヌクレオチド配列と第4のヌクレオチド配列は異なる。一部の場合では、第3のヌクレオチド配列と第4のヌクレオチド配列は、目的のゲノム領域に隣接する。一部の場合では、第3のヌクレオチド配列および第4のヌクレオチド配列は、ゲノムDNA上の、第1のヌクレオチド配列および第2のヌクレオチド配列よりも目的のゲノム領域に近い塩基長のところに存在する。一部の場合では、第2の切り出された断片は、第1の切り出された断片よりも短い塩基長である。一部の場合では、解析するステップは、第2の切り出された断片内に含有される目的のゲノム領域を配列決定することを含む。一部の場合では、ゲノムDNAは、約10μgまたはそれよりも多い量で提供される。一部の場合では、解析するステップは、第2の切り出された断片内に含有される目的のゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、第2の切り出された断片内に含有される目的のゲノム領域についての構造解析を実施することを含む。一部の場合では、方法は、b)の前に、第1の切り出された断片を単離するステップをさらに含む。一部の場合では、方法は、c)の前に、第2の切り出された断片を単離するステップをさらに含む。一部の場合では、方法は、DNA増幅を伴わない。一部の場合では、方法は、c)の前に、第2の切り出された断片の5’末端、3’末端、またはその両方に1つまたは複数のアダプターを付着させるステップをさらに含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1 CRISPR関連エンドヌクレアーゼまたはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAをa)の前に制限酵素消化に供さない。一部の場合では、目的のゲノム領域は、複雑なゲノム領域である。一部の場合では、複雑なゲノム領域は、目的の遺伝子および1つまたは複数のその偽遺伝子を含む。一部の場合では、1つまたは複数の偽遺伝子は、目的の遺伝子に対して少なくとも75%の配列同一性を有するヌクレオチド配列を含む。一部の場合では、複雑なゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、高度に多型の遺伝子座である。一部の場合では、第1の切り出された断片の長さは、少なくとも約0.06キロベースである。一部の場合では、第1の切り出された断片の長さは、最大約200キロベースである。一部の場合では、第2の切り出された断片の長さは、少なくとも約0.02キロベースである。一部の場合では、第2の切り出された断片の長さが、最大約199.98キロベースである。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法(ramification amplification method)のいずれも伴わない。一部の場合では、ゲノムDNAは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物(glandular secretion)、眼内液(ocular fluid)、母乳)または固形組織試料を含む。一部の場合では、生体試料は、診断用試料である。一部の場合では、目的のゲノム領域は、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座である。一部の場合では、解析するステップは、CYP2D6の1つまたは複数の遺伝的変異を同定することを含む。一部の場合では、方法は、遺伝的変異に基づいて、対象がCYP2D6機能の低下、喪失、または増大を有すると同定するステップをさらに含む。一部の場合では、方法は、同定するステップに基づいて、対象に対して処置または代替処置を推奨するステップをさらに含む。一部の場合では、対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、対象に対して代替処置を推奨する。一部の場合では、方法は、同定するステップに基づいて、対象に対して治療薬のある投薬量を推奨するステップをさらに含む。一部の場合では、対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、治療薬の投薬量を変更する。一部の場合では、外側のgRNAの対、内側のgRNAの対、またはその両方は、配列番号1~418のいずれか1つから選択される。
別の態様では、目的のゲノム領域を解析するためのキットであって、a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;b)i)ゲノムDNA内の目的のゲノム領域の上流に存在する第1のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1の外側のgRNAと、ii)ゲノムDNA内の目的のゲノム領域の下流に存在する第2のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2の外側のgRNAとを含む、外側のgRNAの対;c)iii)ゲノムDNA内の目的のゲノム領域の上流に存在する第3のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1の内側のgRNAと、iv)ゲノムDNA内の目的のゲノム領域の下流に存在する第4のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2の内側のgRNAとを含む、内側のgRNAの対、を含み、第3のヌクレオチド配列および第4のヌクレオチド配列が、ゲノムDNA上の、第1のヌクレオチド配列および第2のヌクレオチド配列よりも目的のゲノム領域に近い塩基長のところに存在する、キットが提供される。一部の場合では、キットは、1種または複数種のエキソヌクレアーゼをさらに含む。一部の場合では、1種または複数種のエキソヌクレアーゼは、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII、およびこれらの任意の組合せからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。一部の場合では、目的のゲノム領域は、CYP2D6、CYP2D7、およびCYP2D8を含むゲノム遺伝子座である。一部の場合では、第1の外側のガイドRNA、第1の内側のガイドRNA、またはその両方は、配列番号3~12、17~26、68~77、82~214、および344~418のいずれか1つのヌクレオチド配列を含む。一部の場合では、第2の外側のガイドRNA、第2の内側のガイドRNA、またはその両方は、配列番号1、2、13~16、27~67、78~81、および215~343のいずれか1つのヌクレオチド配列を含む。一部の場合では、キットは、入れ子状CRISPR反応にキットを使用するための指示をさらに含む。一部の場合では、キットは、目的のゲノム領域をゲノムDNAから切り出すためにキットを使用するための指示をさらに含む。
一態様では、目的のゲノム領域を解析する方法であって、(a)目的のゲノム領域を含むゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeat)(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、それにより、切り出された目的のゲノム領域を生成する、ステップと、(b)目的のゲノム領域を含むゲノムDNAを単離するステップと、(c)切り出された目的のゲノム領域を解析するステップとを含み、DNA増幅を伴わない、方法が提供される。一部の場合では、解析するステップは、切り出された目的のゲノム領域を配列決定することを含む。一部の場合では、解析するステップは、切り出された目的のゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、切り出された目的の領域についての構造解析を実施することを含む。一部の場合では、(b)の単離するステップは(a)の接触させるステップの前に実施される。一部の場合では、(b)の単離するステップは(a)の接触させるステップの後に実施される。一部の場合では、2つまたはそれよりも多くのgRNAは、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、異なるヌクレオチド配列は目的のゲノム領域に隣接する。一部の場合では、CRISPR関連エンドヌクレアーゼにより、目的のゲノム領域が、目的のゲノム領域に隣接するゲノム部位において切断される。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対して(a)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAを(a)の前に制限酵素消化に供さない。一部の場合では、目的のゲノム領域は複雑なゲノム領域である。一部の場合では、複雑なゲノム領域は、遺伝子および1つまたは複数のその偽遺伝子を含む。一部の場合では、1つまたは複数の偽遺伝子は、遺伝子に対して少なくとも75%の配列同一性を有するヌクレオチド配列を含む。一部の場合では、複雑なゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、高度に多型の遺伝子座である。一部の場合では、切り出された目的のゲノム領域の長さは少なくとも10キロベースである。一部の場合では、切り出された目的のゲノム領域の長さは最大250キロベースである。一部の場合では、単離するステップは、高分子量DNAを単離することを含む。一部の場合では、高分子量DNAの長さは少なくとも50キロベースである。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に1つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、a)の前に、ゲノムDNAを脱リン酸化するステップをさらに含む。一部の場合では、脱リン酸化するステップは、ゲノムDNAをホスファターゼで処理することを含む。一部の場合では、ホスファターゼはエビアルカリホスファターゼである。一部の場合では、方法は、脱リン酸化するステップの後に、ゲノムDNAをターミナルトランスフェラーゼ(TdT)で処理することをさらに含む。一部の場合では、方法は、切り出された目的のゲノム領域の末端にテールを付加する(end-tailing)ステップをさらに含む。一部の場合では、末端にテールを付加するステップは、切り出された目的のゲノム領域の遊離の3’末端に1つまたは複数のアデノシンヌクレオチドを付加することを含む。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法(ramification amplification method)のいずれも伴わない。一部の場合では、ゲノムDNAは、生体試料で提供される。一部の場合では、ゲノムDNAは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物(glandular secretion)、眼内液(ocular fluid)、母乳)または固形組織試料を含む。一部の場合では、生体試料は、診断用試料である。
別の態様では、長さが少なくとも10キロベースである目的の複雑なゲノム領域を解析する方法であって、(a)目的の複雑なゲノム領域を含むゲノムDNAを提供するステップと、(b)目的の複雑なゲノム領域を含む高分子量DNAを単離するステップと、(c)目的の複雑なゲノム領域を切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、2つまたはそれよりも多くのgRNAが、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、目的の複雑なゲノム領域に隣接するステップと、(d)目的の複雑なゲノム領域を解析するステップとを含み、DNA増幅を伴わない、方法が提供される。一部の場合では、解析するステップは、目的の複雑なゲノム領域を配列決定することを含む。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、目的のゲノム領域の構造解析を実施することを含む。一部の場合では、(b)の単離するステップは(c)の接触させるステップの前に実施される。一部の場合では、(b)の単離するステップは(c)の接触させるステップの後に実施される。一部の場合では、高分子量DNAの長さは少なくとも10キロベースである。一部の場合では、目的の複雑なゲノム領域は、標的遺伝子および1つまたは複数のその偽遺伝子を含む。一部の場合では、1つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも75%の配列同一性を有する。一部の場合では、目的の複雑なゲノム領域は、CYP2D6、CYP2D7、およびCYP2D8を含む。一部の場合では、目的の複雑なゲノム領域は、CYP2C8、CYP2C9、CYP2C18、およびCYP2C19を含む。一部の場合では、目的の複雑なゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的の複雑なゲノム領域は、高度に多型の遺伝子座である。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対して、a)の前に断片化も消化も行わない。一部の場合では、ゲノムDNAをa)の前に制限酵素消化に供さない。一部の場合では、目的の複雑なゲノム領域の長さは最大250キロベースである。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に1つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法(ramification amplification method)のいずれも伴わない。一部の場合では、ゲノムDNAは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物、眼内液、母乳)または固形組織試料である。一部の場合では、生体試料は、診断用試料である。
別の態様では、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を解析する方法であって、(a)当該遺伝子座を含むゲノムDNAを提供するステップと、(b)当該遺伝子座をゲノムDNAから切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、2つまたはそれよりも多くのgRNAが、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座に隣接する、ステップと、(c)当該遺伝子座を解析するステップとを含む方法が提供される。一部の場合では、解析するステップは、当該遺伝子座を配列決定することを含む。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、解析するステップは、当該遺伝子座を遺伝子型決定することを含む。一部の場合では、解析するステップは、当該遺伝子座の構造解析を実施することを含む。一部の場合では、方法は、c)の前に、当該遺伝子座を含む高分子量DNAを単離することをさらに含む。一部の場合では、高分子量DNAの長さは少なくとも10キロベースである。一部の場合では、2つまたはそれよりも多くのgRNAは配列番号1~418からなる群より選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも40キロベースである。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAをa)の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された遺伝子座の一方の末端または両方の末端に1つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、DNA増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法(ramification amplification method)のいずれも伴わない。一部の場合では、ゲノムDNAは、生体試料で提供されるまたは得られる。一部の場合では、ゲノムDNAは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物(glandular secretion)、眼内液(ocular fluid)、母乳)または固形組織試料を含む。一部の場合では、生体試料は、診断用試料である。
さらに別の態様では、対象におけるCYP2D6の遺伝的変異を同定する方法であって、(a)対象から得たゲノムDNAを含む生体試料を提供するステップと、(b)CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップと、(c)当該遺伝子座のロングリードシーケンシングを実施するステップと、(d)対象のCYP2D6の1つまたは複数の遺伝的変異を同定するステップとを含む方法が提供される。一部の場合では、方法は、遺伝的変異に基づいて、対象がCYP2D6機能の低下、喪失、または増大を有すると同定するステップをさらに含む。一部の場合では、方法は、同定するステップに基づいて、対象に対して処置または代替処置を推奨するステップをさらに含む。一部の場合では、方法は、対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、対象に対して代替処置を推奨するステップをさらに含む。一部の場合では、方法は、同定するステップに基づいて、対象に対して治療薬のある投薬量を推奨するステップをさらに含む。一部の場合では、対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、方法は、治療薬の投薬量を変更するステップをさらに含む。一部の場合では、方法は、c)の前に、当該遺伝子座を含む高分子量DNAを単離することをさらに含む。一部の場合では、高分子量DNAの長さは少なくとも40キロベースである。一部の場合では、2つまたはそれよりも多くのgRNAは、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列は、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座に隣接する。一部の場合では、2つまたはそれよりも多くのgRNAは配列番号1~418からなる群より選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも40キロベースである。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対して(a)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAを(a)の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に1つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、DNA増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法(ramification amplification method)のいずれも伴わない。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物、眼内液、母乳)または固形組織試料である。
さらに別の態様では、(a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;(b)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1のガイドRNA(gRNA);ならびに(c)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2のガイドRNA(gRNA)を含む組成物が提供される。一部の場合では、第1のガイドRNAは、配列番号1、2、または13~16からなる群より選択されるヌクレオチド配列を含む。一部の場合では、第2のガイドRNAは、配列番号3~12または17~26からなる群より選択されるヌクレオチド配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。
さらに別の態様では、CYP2D6を遺伝子型決定するためのキットであって、(a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;(b)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1のガイドRNA(gRNA);ならびに(c)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2のガイドRNA(gRNA)を含むキットが提供される。一部の場合では、第1のガイドRNAは、配列番号1、2、または13~16からなる群より選択されるヌクレオチド配列を含む。一部の場合では、第2のガイドRNAは、配列番号3~12または17~26からなる群より選択されるヌクレオチド配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。
さらに別の態様では、目的の複雑なゲノム領域を解析するためのシステムであって、(a)(i)目的の複雑なゲノム領域を含むゲノムDNAから高分子量DNAを単離するステップと、(ii)目的の複雑なゲノム領域を切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、2つまたはそれよりも多くのgRNAが、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、目的の複雑なゲノム領域に隣接するステップと、(iii)目的の複雑なゲノム領域を解析して、データを生成するステップとを含み、DNA増幅を伴わない、方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;ならびに(b)少なくとも1つのメモリ位置に作動可能に(operably)カップリングしたコンピュータプロセッサであって、データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。一部の場合では、出力はレポートである。一部の場合では、出力は、目的の複雑なゲノム領域の遺伝子型である。一部の場合では、出力は、目的の複雑なゲノム領域の遺伝子配列である。一部の場合では、出力は、目的の複雑なゲノム領域の構造解析である。一部の場合では、解析するステップは、目的の複雑なゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域の構造解析を実施することを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域を配列決定することを含む。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、(i)の単離するステップを(ii)の接触させるステップの前に実施する。一部の場合では、(i)の単離するステップを(ii)の接触させるステップの後に実施する。一部の場合では、高分子量DNAの長さは少なくとも10キロベースである。一部の場合では、目的の複雑なゲノム領域は、標的遺伝子および1つまたは複数のその偽遺伝子を含む。一部の場合では、1つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも75%の配列同一性を有する。一部の場合では、目的の複雑なゲノム領域は、CYP2D6、CYP2D7、およびCYP2D8を含む。一部の場合では、目的の複雑なゲノム領域は、CYP2C8、CYP2C9、CYP2C18、およびCYP2C19を含む。一部の場合では、目的の複雑なゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的の複雑なゲノム領域は、高度に多型の遺伝子座である。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAをa)の前に制限酵素消化に供さない。一部の場合では、目的の複雑なゲノム領域の長さは最大250キロベースである。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に1つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法(ramification amplification method)のいずれも伴わない。一部の場合では、ゲノムDNAは、生体試料で提供されるまたは得られる。一部の場合では、ゲノムDNAは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物(glandular secretion)、眼内液(ocular fluid)、母乳)または固形組織試料を含む。一部の場合では、生体試料は、診断用試料である。
さらに別の態様では、対象のCYP2D6の遺伝的変異を同定するためのシステムであって、(a)(ii)CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を切り出すために、対象から得たゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップと、(iii)当該遺伝子座のロングリードシーケンシングを実施して、配列決定データを生成するステップとを含む方法により生成された配列決定データを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;ならびに(b)少なくとも1つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、配列決定データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。一部の場合では、出力はレポートである。一部の場合では、出力は、CYP2D6の遺伝的変異を同定するものである。一部の場合では、出力は、CYP2D6の機能の低下、喪失、または増大を同定するものである。一部の場合では、レポートは、遺伝的変異に基づいて、対象に対して処置を推奨するものである。一部の場合では、レポートは、遺伝的変異に基づいて、対象に対して治療薬のある投薬量を推奨するものである。一部の場合では、レポートは、遺伝的変異に基づいて、治療薬の投薬量を変更することを推奨するものである。一部の場合では、治療薬は、CYP2D6によって活性化または代謝される治療薬である。一部の場合では、方法は、(ii)の前に、当該遺伝子座を含む高分子量DNAを単離するステップをさらに含む。一部の場合では、高分子量DNAの長さは少なくとも40キロベースである。一部の場合では、2つまたはそれよりも多くのgRNAは、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列は、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座に隣接する。一部の場合では、2つまたはそれよりも多くのgRNAは配列番号1~26からなる群より選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも40キロベースである。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対して(a)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAを(a)の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に1つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、DNA増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法(ramification amplification method)のいずれも伴わない。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物(glandular secretion)、眼内液(ocular fluid)、母乳)または固形組織試料を含む。
別の態様では、目的のゲノム領域を解析するためのシステムであって、(a)(i)目的のゲノム領域を含むゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび外側のガイドRNA(gRNA)の対と接触させるステップであって、それにより、目的のゲノム領域を含む第1の切り出された断片を生成する、ステップと、(ii)第1の切り出された断片をCRISPR関連エンドヌクレアーゼおよび内側のgRNAの対と接触させるステップであって、それにより、目的のゲノム領域を含む第2の切り出された断片を生成する、ステップと、(iii)第2の切り出された断片内に含有される目的のゲノム領域を解析するステップとを含む方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;ならびに(b)少なくとも1つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。一部の場合では、出力はレポートである。一部の場合では、出力は目的のゲノム領域の遺伝子型である。一部の場合では、出力は、目的のゲノム領域の遺伝子配列である。一部の場合では、出力は、目的のゲノム領域の構造解析である。一部の場合では、解析するステップは、目的のゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、目的のゲノム領域の構造解析を実施することを含む。一部の場合では、解析するステップは、目的のゲノム領域を配列決定することを含む。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、(i)のCRISPR関連エンドヌクレアーゼおよび外側のgRNAの対が、第1の切り出された断片の5’末端および3’末端と会合し、それをブロックする。一部の場合では、方法は、(ii)の前に、(i)の産物を1種または複数種のエキソヌクレアーゼと接触させるステップであって、その結果、バックグラウンドゲノムDNAが消化され、第1の切り出された断片は消化されない、ステップをさらに含む。一部の場合では、1種または複数種のエキソヌクレアーゼは、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII、およびこれらの任意の組合せからなる群より選択される。一部の場合では、外側のgRNAの対は、第1の外側のgRNAと第2の外側のgRNAとを含む。一部の場合では、第1の外側のgRNAは、ゲノムDNAに存在する第1のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、第2の外側のgRNAは、ゲノムDNAに存在する第2のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、第1のヌクレオチド配列と第2のヌクレオチド配列は異なる。一部の場合では、第1のヌクレオチド配列と第2のヌクレオチド配列は、目的のゲノム領域に隣接する。一部の場合では、第1のヌクレオチド配列、第2のヌクレオチド配列、またはその両方は、ゲノムDNA内の、目的のゲノム領域から最大約100キロベース長のところに存在する。。一部の場合では、内側のgRNAの対は、第1の内側のgRNAと第2の内側のgRNAとを含む。一部の場合では、第1の内側のgRNAは、ゲノムDNAに存在する第3のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、第2の内側のgRNAは、ゲノムDNAに存在する第4のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、第3のヌクレオチド配列と第4のヌクレオチド配列は異なる。一部の場合では、第3のヌクレオチド配列と第4のヌクレオチド配列は、目的のゲノム領域に隣接する。一部の場合では、第3のヌクレオチド配列および第4のヌクレオチド配列は、ゲノムDNA上の、第1のヌクレオチド配列および第2のヌクレオチド配列よりも目的のゲノム領域に近い塩基長のところに存在する。一部の場合では、第2の切り出された断片は、第1の切り出された断片よりも短い塩基長である。一部の場合では、解析するステップは、第2の切り出された断片内に含有される目的のゲノム領域を配列決定することを含む。一部の場合では、ゲノムDNAは、約10μgまたはそれよりも多い量で提供される。一部の場合では、解析するステップは、第2の切り出された断片内に含有される目的のゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、第2の切り出された断片内に含有される目的のゲノム領域についての構造解析を実施することを含む。一部の場合では、方法は、(ii)の前に、第1の切り出された断片を単離するステップをさらに含む。一部の場合では、方法は、(iii)の前に、第2の切り出された断片を単離するステップをさらに含む。一部の場合では、方法は、DNA増幅を伴わない。一部の場合では、方法は、(iii)の前に、第2の切り出された断片の5’末端、3’末端、またはその両方に1つまたは複数のアダプターを付着させるステップをさらに含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラス1 CRISPR関連エンドヌクレアーゼまたはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群より選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群より選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対して(i)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAを(i)の前に制限酵素消化に供さない。一部の場合では、目的のゲノム領域は、複雑なゲノム領域である。一部の場合では、複雑なゲノム領域は、目的の遺伝子および1つまたは複数のその偽遺伝子を含む。一部の場合では、1つまたは複数の偽遺伝子は、目的の遺伝子に対して少なくとも75%の配列同一性を有するヌクレオチド配列を含む。一部の場合では、複雑なゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、高度に多型の遺伝子座である。一部の場合では、第1の切り出された断片の長さは、少なくとも約0.06キロベースである。一部の場合では、第1の切り出された断片の長さは、最大約200キロベースである。一部の場合では、第2の切り出された断片の長さは、少なくとも約0.02キロベースである。一部の場合では、第2の切り出された断片の長さが、最大約199.98キロベースである。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法(ramification amplification method)のいずれも伴わない。一部の場合では、ゲノムDNAは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物(glandular secretion)、眼内液(ocular fluid)、母乳)または固形組織試料を含む。一部の場合では、生体試料は、診断用試料である。一部の場合では、目的のゲノム領域は、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座である。一部の場合では、解析するステップは、CYP2D6の1つまたは複数の遺伝的変異を同定することを含む。一部の場合では、出力は、遺伝的変異に基づいた、対象がCYP2D6機能の低下、喪失、または増大を有することの同定を含む。一部の場合では、出力は、同定に基づいた、対象に対する処置または代替処置の推奨を含む。一部の場合では、対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、出力は、対象に対する代替処置の推奨をさらに含む。一部の場合では、出力は、同定に基づいた、対象に対する治療薬のある投薬量の推奨をさらに提供するものである。一部の場合では、対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、出力は、治療薬の投薬量を変更するための推奨をさらに含む。一部の場合では、外側のgRNAの対、内側のgRNAの対、またはその両方は、配列番号1~418のいずれか1つから選択されるgRNAを含む。
参照による組込み
本明細書において言及されている全ての刊行物、特許および特許出願は、個々の刊行物、特許、または特許出願が、具体的にかつ個々に参照により組み込まれることが示されたものと同じく参照により本明細書に組み込まれる。
本明細書において言及されている全ての刊行物、特許および特許出願は、個々の刊行物、特許、または特許出願が、具体的にかつ個々に参照により組み込まれることが示されたものと同じく参照により本明細書に組み込まれる。
本開示の新規の特色は、添付の特許請求の範囲において詳細に記載されている。本開示の原理が利用される例示的な実施形態が記載されている以下の詳細な説明および付属図を参照することにより、本開示の特色および利点のよりよい理解が得られよう。
詳細な説明
目的のゲノム領域(ROI)(例えば、ゲノムDNA由来)を解析するための方法が本明細書に開示される。目的の領域は、例えば、複雑な(例えば、高度に複雑な)ゲノム領域であり得る。複雑なゲノム領域は、例えば、高度に多型の領域、標的遺伝子および標的遺伝子に対して高い配列相同性を有する1つまたは複数の偽遺伝子を含む領域、1つまたは複数の反復エレメント、1つまたは複数の逆位、1つまたは複数の挿入、1つまたは複数の重複、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾンを含む領域などを含み得る。本明細書に提示される方法は、一般に、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのガイドRNA(gRNA)を使用して目的の領域をゲノムDNAから切り出すことを伴う。
目的のゲノム領域(ROI)(例えば、ゲノムDNA由来)を解析するための方法が本明細書に開示される。目的の領域は、例えば、複雑な(例えば、高度に複雑な)ゲノム領域であり得る。複雑なゲノム領域は、例えば、高度に多型の領域、標的遺伝子および標的遺伝子に対して高い配列相同性を有する1つまたは複数の偽遺伝子を含む領域、1つまたは複数の反復エレメント、1つまたは複数の逆位、1つまたは複数の挿入、1つまたは複数の重複、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾンを含む領域などを含み得る。本明細書に提示される方法は、一般に、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのガイドRNA(gRNA)を使用して目的の領域をゲノムDNAから切り出すことを伴う。
一態様では、本開示は、複雑な目的のゲノム領域を富化し、解析するための入れ子状富化手法を提供する。入れ子状富化手法は、一般に、CRISPR関連エンドヌクレアーゼを外側のgRNAの対(例えば、第1の外側のgRNAと第2の外側のgRNA)および/または内側のgRNAの対(例えば、第1の内側のgRNAと第2の内側のgRNA)と組み合わせて使用することを伴う。方法は、CRISPR関連エンドヌクレアーゼおよび外側のgRNAの対を使用して目的のゲノム領域を含有するゲノムDNAから断片を切り出して、目的のゲノム領域を含む第1の切り出された断片を生成することを伴う。方法は、CRISPR関連エンドヌクレアーゼおよび内側のgRNAの対を使用して第1の切り出された断片からより小さな断片を切り出して、目的のゲノム領域を含む第2の切り出された断片を生成することをさらに含む。一部の場合では、方法は、1種または複数種のエキソヌクレアーゼを用いてバックグラウンドDNAを消化することをさらに伴う。
本明細書に提示される方法は、目的のゲノム領域(例えば、第2の断片上に位置する)を解析すること(例えば、例えばロングリードシーケンシング法によって配列決定することによって、遺伝子型決定することによって、構造解析を実施することによって)をさらに含む。CYP2D6遺伝子座(例えば、標的遺伝子であるCYP2D6、ならびに偽遺伝子であるCYP2D7およびCYP2D8を含む)を解析する方法が本明細書にさらに提示される。有利に、一部の実施形態では、方法は、DNA増幅の使用を伴わない(例えば、無増幅)。方法により、複雑な(例えば、高度に複雑な)ゲノム領域の配列決定の正確度を改善する(例えば、配列決定の誤り率を低下させる)ことができ(例えば、伝統的な方法と比較して)、かつ/または、複雑な(例えば、高度に複雑な)ゲノム領域の配列決定のための時間を短縮することができ(例えば、伝統的な方法と比較して)、かつ/または、複雑なゲノム(例えば、高度に複雑な)領域(例えば、伝統的な方法と比較して)の配列決定の費用を低減することができる。さらに、本明細書に提示される方法により、標準的なCRISPRに基づく手法よりも高度な出発材料(例えば、より高度な量のゲノムDNA)を使用することが可能になり得る。本明細書に提示される方法を実施するためのシステム、ならびに、目的のゲノム領域(例えば、CYP2D6遺伝子座(例えば、CYP2D6遺伝子座をゲノムDNAから切り出すための))を切り出すCRISPR関連エンドヌクレアーゼおよび2種またはそれよりも多くのgRNAを含む組成物およびキットがさらに本明細書に提示される。
本明細書および添付の特許請求の範囲において使用される場合、単数形「1つの(a)」、「1つの(an)」、および「その(the)」は、文脈により明確に別段の規定がなされない限り、複数の指示対象を包含する。特許請求の範囲はいかなる必要に応じた要素も排除されるように起草され得ることにも留意する。したがって、この記述は、特許請求の範囲の要素の列挙に関連して、例えば「単に(solely)」、「のみ(only)」などの排他的な用語の使用、または、「否定的な」限定の使用の前提としての機能を果たすものとする。
ある特定の範囲または数は、本明細書では、「約」という用語が先行する数値で提示される。「約」という用語は、本明細書では、この用語が指す数のプラスまたはマイナス1%、2%、3%、4%、または5%を意味するように使用される。本明細書で使用される場合、「対象」および「個体」という用語は互換的に使用され、哺乳動物(例えば、ヒトまたは非ヒト動物)を含めた任意の動物であり得る。
本明細書で使用される場合、「CYP2D6」という用語は、CYP2D6遺伝子または任意のその構造変異体または単一遺伝子コピー変異体を指し得る。CYP2D6の構造変異体は、遺伝子融合物、近接する高度に相同な偽遺伝子(例えば、CYP2D7およびCYP2D8)とのハイブリッド、コピー数変異(CNV)、遺伝子重複および増殖(multiplication)、タンデムリピート、および再配列を含み得る。CYP2D6構造変異体の1つの例は、CYP2D6のエクソン9にCYP2D7由来配列が存在することである(「エクソン9変換」と称される)。単一遺伝子コピー変異体は、一塩基多型(SNP)またはヌクレオチドの挿入もしくは欠失(インデル)を包含し得る。CYP2D6の対立遺伝子は、これだけに限定されないが、*1、*1xN、*2、*2xN、*2A、*2AxN、*35、*35xN、*9、*9xN、*10、*10xN、*17、*17xN、*29、*29xN、*36-*10、*36-*10xN、*36xN-*10、*36xN-*10xN、*41、*41xN、*3、*3xN、*4、*4xN、*4N、*5、*6、*6xN、*36、および*36xNのいずれか1つを含めた構造変異体または単一遺伝子コピー変異体であり得る。一部の場合では、CYP2D6の各対立遺伝子は、異なる構造変異体または単一遺伝子コピー変異体である。一部の場合では、CYP2D6の各対立遺伝子は同一である。
「CYP2D6遺伝子座」という用語は、本明細書で使用される場合、CYP2D6遺伝子、ならびに高度に相同な偽遺伝子であるCYP2D7およびCYP2D8を含むゲノム領域を指す。ヒトでは、CYP2D6遺伝子座は22番染色体上に見いだされる。一部の実施形態では、本明細書に提示される方法は、CYP2D6遺伝子座(例えば、CYP2D6遺伝子、ならびに高度に相同な偽遺伝子であるCYP2D7およびCYP2D8を含む)の一部分または全体を解析すること(例えば、配列決定すること、遺伝子型決定すること、構造解析を実施すること)を伴う。一部の実施形態では、本明細書に提示される方法は、CYP2D6遺伝子座(例えば、CYP2D6遺伝子、ならびに高度に相同な偽遺伝子であるCYP2D7およびCYP2D8を含む)の一部分または全体をゲノムDNAから切り出すこと(例えば、CRISPR関連エンドヌクレアーゼおよびCYP2D6遺伝子座に隣接するゲノム配列を標的とする2つまたはそれよりも多くのgRNAを使用することによって)を伴う。
本明細書で使用される場合、「CRISPR/Casヌクレアーゼ系」という用語は、ガイドRNA(gRNA)とCRISPR関連エンドヌクレアーゼ(Casタンパク質)とを含む複合体を指す。「CRISPR」という用語は、クラスター化された規則的な配置の短い回文配列リピートおよびその関連する系を指し得る。CRISPR/Casヌクレアーゼ系は、クラス1またはクラス2 CRISPR/Casヌクレアーゼ系であり得る。CRISPR/Casヌクレアーゼ系は、I型、II型、III型、IV型、V型、またはVI型CRISPR/Casヌクレアーゼ系であり得る。gRNAは、Casタンパク質と相互作用して、Casタンパク質のヌクレアーゼ活性を標的配列に方向付けることができる。標的配列は、「プロトスペーサー」および「プロトスペーサー隣接モチーフ」(PAM)を含み得、どちらのドメインもCasに媒介される活性(例えば、切断)に必要であり得る。gRNAは、プロトスペーサーの逆の鎖上の結合部位と対合(またはそれとハイブリダイズ)して、Casを標的配列に方向付ける。PAM部位は、Casタンパク質によって認識される短い配列を指し得、一部の場合では、Casタンパク質活性に必要であり得る。
本明細書で使用される場合、「Cas」または「Casタンパク質」という用語は、エンドヌクレアーゼ活性を有するCRISPR/Cas系のタンパク質またはCRISPR/Cas系に由来するタンパク質を指す。一部の場合では、CRISPR関連エンドヌクレアーゼは、本明細書で使用される場合、Casタンパク質である。Casタンパク質は、天然に存在するCasタンパク質、天然に存在しないCasタンパク質、またはそれらの断片であり得る。一部の場合では、Casタンパク質は、天然に存在するCasタンパク質の変異体(例えば、天然に存在するCasタンパク質と比べて1つまたは複数のアミノ酸置換、挿入、欠失などを有する)である。一部の場合では、Casタンパク質はクラスI Casタンパク質であり、非限定的な例として、Cas3、Cas8a、Cas5、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Cas10、Csx11、Csx10、およびCsf1が挙げられる。一部の場合では、Casタンパク質はクラスII Casタンパク質であり、非限定的な例として、Cas9、Csn2、Cas4、Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c(C2c3)、Cas13a(C2c2)、Cas13b、Cas13c、およびCas13dが挙げられる。一部の場合では、Casタンパク質はCas9である。一部の場合では、Casタンパク質はCas12aである。
「ガイドRNA」または「gRNA」という用語は、本明細書では互換的に使用され、一般に、Casタンパク質に結合し、Casタンパク質の標的ポリヌクレオチド(例えば、DNA)内の特定の位置へのターゲティングを補助することができるRNA分子(または集合的にRNA分子の群)を指す。ガイドRNAは、CRISPR RNA(crRNA)セグメント、および、必要に応じて、トランス活性化crRNA(tracrRNA)セグメントを含み得る。「crRNA」という用語は、本明細書で使用される場合、ポリヌクレオチド標的化ガイド配列、ステム配列、および必要に応じて5’突出配列を含むRNA分子またはその一部を指し得る。crRNAは結合部位に結合することができる。「tracrRNA」という用語は、本明細書で使用される場合、タンパク質結合セグメント(例えば、タンパク質結合セグメントは、CRISPR関連タンパク質、例えばCas9と相互作用することが可能である)を含むRNA分子またはその一部を指し得る。「ガイドRNA」という用語は、単一ガイドRNA(sgRNA)を指し得、ここで、crRNAセグメントと必要に応じたtracrRNAセグメントは同じRNA分子内に位置する。「ガイドRNA」という用語は、集合的に、2つまたはそれよりも多くのRNA分子の群も指し得、ここで、crRNAとtracrRNAは別々のRNA分子内に位置する。
「ロングリードシーケンシング」という用語(「第3世代シーケンシング」とも称される)は、本明細書で使用される場合、一般に、第2世代シーケンシングよりも実質的に長いシーケンシングリード(>10,000bp)を生成することが可能な任意の配列決定法を指す。一部の実施形態では、本明細書に提示される方法は、ロングリードシーケンシングの使用(例えば、目的の複雑なゲノム領域を遺伝子型決定するため)を伴う。ロングリードシーケンシング系の非限定的な例としては、Pacific Biosciences、Oxford Nanopore Technology、Quantapore、Stratos、およびHelicosによって開発されたものが挙げられる。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング(SMRT)(例えば、Pacific Biosciencesによって開発されたもの)である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング(例えば、Oxford Nanopore Technologyによって開発されたMinION、GridION、およびPromethION)である。一部の場合では、ロングリードシーケンシングは、現在開発中であるか、または今後開発されるあらゆるロングリードシーケンシング法または系(例えば、第3世代シーケンシング法または系)を包含する。
「核酸増幅」という用語は、本明細書で使用される場合、一般に、単一の核酸分子から標的核酸(例えば、DNA)の多数のコピーを生成する任意の方法を指す。標的核酸は、DNAの場合もあり(例えば、DNA増幅)、RNAの場合もある(例えば、RNA増幅)。核酸増幅は、ポリメラーゼ連鎖反応(PCR)およびありとあらゆるその変形形態または改変、ならびに、例えば、これだけに限定されないが、ループ媒介性等温増幅(LAMP)、核酸配列に基づく増幅(NASBA)、鎖置換増幅(SDA)、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、および分岐増幅法(RAM)などの代替的な型の核酸増幅法を含む。本開示の種々の態様では、本明細書に提示される方法は、核酸(例えば、DNA)増幅の使用を伴わない(例えば、無増幅)。
本開示の方法
本明細書の開示は、一般に、目的のゲノム領域(例えば、複雑な目的のゲノム領域)を富化し、解析(例えば、配列決定、遺伝子型決定、構造解析)するための入れ子状富化手法を提供する。種々の態様では、方法は、目的のゲノム領域(例えば、複雑な目的のゲノム領域)を含むゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび外側のガイドRNA(gRNA)の対と接触させるステップであって、それにより、目的のゲノム領域を含む第1の切り出された断片を生成する、ステップを含む。種々の態様では、方法は、第1の切り出された断片をCRISPR関連エンドヌクレアーゼおよび内側のgRNAの対と接触させるステップであって、それにより、目的のゲノム領域を含む第2の(例えば、より小さな)切り出された断片を生成する、ステップをさらに含む。種々の態様では、方法は、目的のゲノム領域(例えば、第2の切り出された断片内に存在する)を解析(例えば、配列決定、遺伝子型決定、構造解析)するステップをさらに含む。
種々の態様では、方法は、目的のゲノム領域(例えば、複雑な目的のゲノム領域)を含むゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび外側のガイドRNA(gRNA)の対と接触させるステップを伴う。外側のgRNAの対は、第1の外側のgRNAと第2の外側のgRNAとを含み得る。
第1の外側のgRNAと第2の外側のgRNAは、ゲノムDNA内に存在するヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一般に、第1の外側のgRNAと第2の外側のgRNAは、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的である。第1の外側のgRNA配列と第2の外側のgRNA配列は、それらが、目的のゲノム領域に隣接するヌクレオチド配列と実質的に相補的になるように選択される。例えば、第1の外側のgRNAは目的のゲノム領域の上流のヌクレオチド配列と実質的に相補的であり得、第2の外側のgRNAは目的のゲノム領域の下流のヌクレオチド配列と実質的に相補的であり得る、またはその逆であり得る。一般に、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよび外側のgRNAの対と接触させるステップにより、目的のゲノム領域(例えば、複雑な目的のゲノム領域)を含有するゲノムDNAの断片(例えば、第1の切り出された断片)が切り出される。
第1の外側のgRNAと第2の外側のgRNAは、目的のゲノム領域から最大約30キロベースの塩基長(例えば、上流および/または下流)のところにあるヌクレオチド配列(例えば、ゲノムDNA内に存在する)と実質的に相補的であり得る。例えば、第1の外側のgRNAと第2の外側のgRNAは、目的のゲノム領域から少なくとも約5キロベース、少なくとも約10キロベース、少なくとも約15キロベース、少なくとも約20キロベース、少なくとも約25キロベース、またはそれよりも長い塩基長(例えば、上流および/または下流)のところにあるヌクレオチド配列(例えば、ゲノムDNA内に存在する)と実質的に相補的であり得る。
理論に束縛されることを望むものではないが、第1の断片が切り出された後、CRISPR関連エンドヌクレアーゼおよび外側のgRNAの対は第1の切り出された断片の5’末端および3’末端と会合したまま、それをブロックすると考えられる。有利なことに、この特色を使用して、バックグラウンドゲノムDNAを除去することができる。好ましい一実施形態では、第1の切り出された断片(および残りのゲノムDNA)を1種または複数種のエキソヌクレアーゼと接触させる。1種または複数種のエキソヌクレアーゼにより、バックグラウンドDNAを消化することが可能であるが、一方、ブロックされた断片はインタクトなまま残される。1種または複数種のエキソヌクレアーゼは、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII、およびこれらの任意の組合せからなる群より選択することができる。
種々の態様では、方法は、第1の切り出された断片(例えば、目的のゲノム領域を含有する)を、CRISPR関連エンドヌクレアーゼおよび内側のgRNAの対と接触させるステップをさらに含む。一部の場合では、接触させるステップを、本明細書に記載の通り、第1の切り出された断片(および残りのゲノムDNA)を1種または複数種のエキソヌクレアーゼと接触させた後に行う。内側のgRNAの対は、第1の内側のgRNAと第2の内側のgRNAとを含み得る。
第1の内側のgRNAと第2の内側のgRNAは、第1の切り出された断片(例えば、本明細書に記載の通り、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよび外側のgRNAの対と接触させるステップによって生成される)内に存在するヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一般に、第1の内側のgRNAと第2の内側のgRNAは、第1の切り出された断片(例えば、本明細書に記載の通り、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよび外側のgRNAの対と接触させるステップによって生成される)に存在する異なるヌクレオチド配列と実質的に相補的である。第1の内側のgRNA配列と第2の内側のgRNA配列は、それらが、目的のゲノム領域に隣接するヌクレオチド配列と実質的に相補的になるように選択される。例えば、第1の内側のgRNAは目的のゲノム領域の上流のヌクレオチド配列と実質的に相補的であり得、第2の内側のgRNAは目的のゲノム領域の下流のヌクレオチド配列と実質的に相補的であり得る、またはその逆であり得る。一般に、目的のゲノム領域を含有する第1の切り出された断片(例えば、本明細書に記載の通り、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよび外側のgRNAの対と接触させるステップによって生成される)をCRISPR関連エンドヌクレアーゼおよび内側のgRNAの対と接触させることにより、目的のゲノム領域を含有する第2の断片(例えば、第2の切り出された断片)が切り出される。
第1の内側のgRNAと第2の内側のgRNAは、目的のゲノム領域から約0.06キロベースから約200キロベースまでの塩基長(例えば、上流および/または下流)のところにあるヌクレオチド配列(例えば、第1の切り出された断片内に存在する)と実質的に相補的であり得る。一般に、内側のgRNAの対は、入れ子状であり、したがって、外側のgRNAの対よりも目的のゲノム領域に近い塩基長のところにあるヌクレオチド配列と実質的に相補的である。言い換えると、内側のgRNAの対を本明細書に記載のCRISPR関連エンドヌクレアーゼと併せて使用すると、それにより、第1の切り出された断片からより小さな断片(例えば、第2の切り出された断片)が切り出される。第2の切り出された断片は、目的のゲノム領域(例えば、その全体)を含むことが好ましい。
種々の態様では、方法は、目的のゲノム領域を含むゲノムDNAを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムDNAを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムDNAを富化させることを伴う。一部の実施形態では、高分子量ゲノムDNAは、少なくとも約10キロベースの長さである。例えば、高分子量ゲノムDNAは、少なくとも約10キロベースの長さ、少なくとも約15キロベースの長さ、少なくとも約20キロベースの長さ、少なくとも約30キロベースの長さ、少なくとも約35キロベースの長さ、少なくとも約40キロベースの長さ、少なくとも約45キロベースの長さ、少なくとも約50キロベースの長さ、少なくとも約55キロベースの長さ、少なくとも約60キロベースの長さ、少なくとも約65キロベースの長さ、少なくとも約70キロベースの長さ、少なくとも約75キロベースの長さ、少なくとも約80キロベースの長さ、少なくとも約85キロベースの長さ、少なくとも約90キロベースの長さ、少なくとも約95キロベースの長さである、またはそれよりも長い。一部の実施形態では、高分子量ゲノムDNAを単離するステップにより、インタクトな目的のゲノム領域全体が試料中に含有されることを確実にする。一部の実施形態では、高分子量ゲノムDNAの単離および/または富化を、第1のCRISPR反応の前(例えば、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよび外側のgRNAの対と接触させる前)に実施する。一部の実施形態では、高分子量ゲノムDNAの単離および/または富化を、第1のCRISPR反応を実施した後(例えば、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよび外側のgRNAの対と接触させた後)に実施する。
種々の態様では、方法は、高分子量ゲノムDNAを単離するための任意の方法を伴う。高分子量ゲノムDNAを単離するための方法の非限定的な例としては、NucleoBond(登録商標)Genomic DNA and RNA purification system(Takara Bio製)、およびNanobind CBB Big DNA kit(Circulomics製)が挙げられる。
一部の態様では、目的のゲノム領域を含むゲノムDNAを単離するステップを、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよびガイドRNAと接触させるステップの前に実施することができる。他の態様では、目的のゲノム領域を含むゲノムDNAを単離するステップを、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよびガイドRNAと接触させるステップの後(例えば、目的のゲノム領域をゲノムDNAから切り出された後)に実施することができる。
種々の態様では、方法に使用するゲノムDNAの出発量は、CRISPRに基づく手法において一般に使用されるものよりも多い。一部の場合では、本明細書に提示されるいずれかの方法において使用されるゲノムDNAの出発量は、少なくとも約1μg(例えば、少なくとも約5μg、少なくとも約10μg、少なくとも約20μg、少なくとも約50μg、少なくとも約100μg、少なくとも約500μg、またはそれよりも多い)である。
種々の態様では、目的のゲノム領域は複雑なゲノム領域または高度に複雑なゲノム領域である。一部の場合では、目的のゲノム領域は高度に多型のゲノム領域である。一部の場合では、目的のゲノム領域は多数の反復エレメントまたは領域を含有する。一部の場合では、目的のゲノム領域は、1つまたは複数の標的遺伝子、および標的遺伝子に対して高い配列同一性を有する(例えば、標的遺伝子に対して少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれよりも高い配列同一性を有する)1つまたは複数の追加的な遺伝子を含有する。一部の場合では、目的のゲノム領域は、1つまたは複数の標的遺伝子、および標的遺伝子に対して高い配列同一性を有する(例えば、標的遺伝子に対して少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれよりも高い配列同一性を有する)1つまたは複数の偽遺伝子を含有する。一部の場合では、目的のゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、伝統的な方法によって(例えば、ショートリードシーケンシング法によって)正確に解析することが一般に難しいまたは難易度が高いゲノム領域である。
一部の場合では、目的の複雑なゲノム領域は、少なくとも約10キロベースの長さである。例えば、目的のゲノム領域は、少なくとも約10キロベースの長さ、少なくとも約15キロベースの長さ、少なくとも約20キロベースの長さ、少なくとも約25キロベースの長さ、少なくとも約30キロベースの長さ、少なくとも約35キロベースの長さ、少なくとも約40キロベースの長さ、少なくとも約45キロベースの長さ、少なくとも約50キロベースの長さ、少なくとも約55キロベースの長さ、少なくとも約60キロベースの長さ、少なくとも約65キロベースの長さ、少なくとも約70キロベースの長さ、少なくとも約75キロベースの長さ、少なくとも約80キロベースの長さ、少なくとも約85キロベースの長さ、少なくとも約90キロベースの長さ、少なくとも約95キロベースの長さ、少なくとも約100キロベースの長さ、少なくとも約110キロベースの長さ、少なくとも約120キロベースの長さ、少なくとも約130キロベースの長さ、少なくとも約140キロベースの長さ、少なくとも約150キロベースの長さ、少なくとも約160キロベースの長さ、少なくとも約170キロベースの長さ、少なくとも約180キロベースの長さ、少なくとも約190キロベースの長さ、少なくとも約200キロベースの長さ、少なくとも約210キロベースの長さ、少なくとも約220キロベースの長さ、少なくとも約230キロベースの長さ、少なくとも約240キロベースの長さ、または少なくとも約250キロベースの長さであり得る。一部の態様では、目的のゲノム領域は、約10キロベースの長さよりも長い。一部の態様では、目的のゲノム領域は、約250キロベースの長さよりも短い。
CRISPR関連エンドヌクレアーゼは、本明細書に記載の任意のCRISPR関連エンドヌクレアーゼであり得る。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラスIまたはクラスII CRISPR関連エンドヌクレアーゼである。Cas I CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10およびCsf1が挙げられる。クラスII CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13cおよびCas13dが挙げられる。一部の場合では、CRISPR関連エンドヌクレアーゼはCasタンパク質またはポリペプチドである。一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas12aタンパク質またはポリペプチドである。
一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas9タンパク質またはポリペプチドである。一部の場合では、Cas9タンパク質またはポリペプチドは、細菌種Streptococcus pyogenesに由来する。一部の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と同一のアミノ酸配列を有する。他の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と比べて改変されたアミノ酸配列を有する。一部の場合では、Cas9タンパク質またはポリペプチドは1つまたは複数の突然変異(例えば、野生型Cas9タンパク質またはポリペプチドと比べて)を有する。一部の場合では、1つまたは複数の突然変異は置換、欠失、または挿入である。Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%の配列同一性を有するアミノ酸配列を有し得る。例えば、Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有し得る。一部の場合では、Cas9変異体は、野生型S.pyogenes Cas9と比べて1つまたは複数の点突然変異を含み得る。例えば、Cas9変異体は、野生型S.pyogenes Cas9と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される点突然変異を含み得る。
種々の態様では、方法は、gRNA(例えば、外側のgRNAの対および/または内側のgRNAの対)の使用を伴う。gRNAは、CRISPR RNA(crRNA)または単一ガイドRNA(sgRNA)であり得る。一部の実施形態では、gRNAは、標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、gRNAは、標的ヌクレオチド配列に結合し、CRISPR複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、gRNA(例えば、内側のgRNA、外側のgRNA)のそれぞれが異なる標的ヌクレオチド配列に結合する。一部の実施形態では、gRNAのうちの少なくとも1つが目的のゲノム領域の上流の領域と相補的または実質的に相補的であり、gRNAのうちの少なくとも1つが目的のゲノム領域の下流の領域と相補的または実質的に相補的である。例えば、外側のgRNAのうちの少なくとも一方が目的のゲノム領域の上流の領域と相補的または実質的に相補的であり、外側のgRNAのうちの少なくとも一方が目的のゲノム領域の下流の領域と相補的または実質的に相補的である。同様に、内側のgRNAのうちの少なくとも一方が目的のゲノム領域の上流の領域と相補的または実質的に相補的であり、内側のgRNAのうちの少なくとも一方が目的のゲノム領域の下流の領域と相補的または実質的に相補的である。一部の実施形態では、gRNA対(例えば、内側のgRNAの対、外側のgRNAの対)は、目的のゲノム領域に隣接する標的配列に結合する。一般に、gRNAは、それぞれが目的のゲノム領域の外側のゲノム配列を標的とするように設計され、したがって、接触させること(例えば、CRISPR関連エンドヌクレアーゼおよび外側のgRNAの対または内側のgRNAの対と)により、目的のゲノム領域の全体が切り出される。
種々の態様では、方法は、目的のゲノム領域を解析するステップをさらに含む。一部の場合では、解析するステップは、目的のゲノム領域を遺伝子型決定することを含む。遺伝子型決定は、目的のゲノム領域の遺伝学的構成の差異を、目的のゲノム領域の配列を調査するための1つまたは複数のアッセイを使用すること、そして一部の場合では配列と別の配列(例えば、参照配列)と比較することによって同定するプロセスを含み得る。遺伝子型決定は、これだけに限定されないが、DNA配列決定、制限断片長多型同定(RFLPI)、ランダム増幅多型検出(RAPD)、増幅断片長多型検出(AFLPD)、ポリメラーゼ連鎖反応(PCR)、対立遺伝子特異的オリゴヌクレオチド(ASO)プローブ、およびDNAマイクロアレイまたはビーズへのハイブリダイゼーションを含めた任意の公知の方法によって実施することができる。一部の場合では、解析するステップは、目的のゲノム領域についての構造解析を実施することを含む。
一部の場合では、解析するステップは、目的のゲノム領域を配列決定することを含む。一部の場合では、配列決定は、ロングリードシーケンシング法(例えば、第3世代シーケンシング法)である。ロングリードシーケンシング法は、ショートリードシーケンシング法(例えば、第2世代シーケンシング法)よりも実質的に長いシーケンシングリードを生成することが可能な任意の配列決定法であってよい。一部の場合では、ロングリードシーケンシング法は、少なくとも10,000キロベースのシーケンシングリードを生成することが可能なシーケンシング法である。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング(例えば、SMRTシーケンシング、Pacific Biosciences)である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング(例えば、Oxford Nanopore Technologiesにより開発されたMinION、GridION、およびPromethION)である。一部の態様では、配列決定の前に、方法は、目的のゲノム領域の末端にアダプター(例えば、配列決定アダプター)をライゲーションするステップをさらに伴う。方法は、一部の場合では、末端にテールを付加するステップ、脱リン酸化ステップなどを含めた、配列決定適用に適した任意の他の加工処理法を伴い得る。
種々の態様では、本明細書に提示される方法は、無増幅である(例えば、核酸増幅(例えば、DNA増幅)ステップを伴わない)。一部の場合では、本明細書に提示される方法は、ポリメラーゼ連鎖反応(PCR)を伴わない。一部の場合では、本明細書に提示される方法は、等温増幅を伴わない。一部の場合では、本明細書に提示される方法は、ループ媒介性等温増幅(LAMP)、核酸配列に基づく増幅(NASBA)、鎖置換増幅(SDA)、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、および分岐増幅法(RAM)のいずれの1つも伴わない。核酸増幅技法により、多くの場合、配列決定鋳型に誤りが導入される。有利に、本明細書に提示される方法では、配列決定鋳型に誤りが導入される可能性がある核酸増幅法の使用を回避する。
種々の態様では、方法は、ゲノムDNAの断片化も、せん断も、消化も伴わない。一部の場合では、方法は、ゲノムDNAを、例えば制限酵素で消化することを伴わない。言い換えれば、方法は、せん断も消化も断片化も行われていないゲノムDNAに対して直接実施される。他の場合では、方法は、エキソヌクレアーゼを用いた消化を伴う(例えば、本明細書に記載の通り、バックグラウンドゲノムDNAを除去するために例えば、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよび外側のgRNAの対と接触させた後に)。
種々の態様では、複雑なゲノム領域は、標的遺伝子、および標的遺伝子に対して高い配列同一性を有する1つまたは複数の偽遺伝子を含む。一部の場合では、1つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも約75%(例えば、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の配列同一性を有し得る。特定の一態様では、遺伝子座は、標的遺伝子であるCYP2D6、ならびに偽遺伝子であるCYP2D7およびCYP2D8を含む。
種々の態様では、複雑なゲノム領域は、標的遺伝子、および標的遺伝子に対して高い配列同一性を有する1つまたは複数の追加的な遺伝子を含む。一部の場合では、1つまたは複数の追加的な遺伝子は、標的遺伝子に対して少なくとも約75%(例えば、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の配列同一性を有し得る。特定の一態様では、遺伝子座は、遺伝子CYP2C8、CYP2C9、CYP2C18、およびCYP2C19を含む。一部の場合では、遺伝子座は、一般に、伝統的な方法によって(例えば、ショートリードシーケンシング法によって)正確に配列決定することが難しいまたはその難易度が高いものである。
種々の態様では、複雑なゲノム領域は、高度に多型の遺伝子座である。種々の態様では、複雑なゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。
一部の場合では、目的の複雑なゲノム領域は、少なくとも約10キロベースの長さである。例えば、目的のゲノム領域は、少なくとも約10キロベースの長さ、少なくとも約15キロベースの長さ、少なくとも約20キロベースの長さ、少なくとも約25キロベースの長さ、少なくとも約30キロベースの長さ、少なくとも約35キロベースの長さ、少なくとも約40キロベースの長さ、少なくとも約45キロベースの長さ、少なくとも約50キロベースの長さ、少なくとも約55キロベースの長さ、少なくとも約60キロベースの長さ、少なくとも約65キロベースの長さ、少なくとも約70キロベースの長さ、少なくとも約75キロベースの長さ、少なくとも約80キロベースの長さ、少なくとも約85キロベースの長さ、少なくとも約90キロベースの長さ、少なくとも約95キロベースの長さ、少なくとも約100キロベースの長さ、少なくとも約110キロベースの長さ、少なくとも約120キロベースの長さ、少なくとも約130キロベースの長さ、少なくとも約140キロベースの長さ、少なくとも約150キロベースの長さ、少なくとも約160キロベースの長さ、少なくとも約170キロベースの長さ、少なくとも約180キロベースの長さ、少なくとも約190キロベースの長さ、少なくとも約200キロベースの長さ、少なくとも約210キロベースの長さ、少なくとも約220キロベースの長さ、少なくとも約230キロベースの長さ、少なくとも約240キロベースの長さ、または少なくとも約250キロベースの長さであり得る。一部の態様では、目的のゲノム領域は、約10キロベースの長さよりも長い。一部の態様では、目的のゲノム領域は、約250キロベースの長さよりも短い。
一部の場合では、gRNAのうちの少なくとも1つ(例えば、第1の外側のgRNA、第2の外側のgRNA、第1の内側のgRNA、および第2の内側のgRNAのうちの少なくとも1つ)は、以下の表1に提示される任意のヌクレオチド配列(例えば、配列番号1~418)によるヌクレオチド配列を含む。一部の場合では、gRNAのうちの少なくとも1つ(例えば、第1の外側のgRNA、第2の外側のgRNA、第1の内側のgRNA、および第2の内側のgRNAのうちの少なくとも1つ)は、以下の表1に提示される任意のヌクレオチド配列(例えば、配列番号1~418)に対して少なくとも約90%(例えば、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の配列同一性を有するヌクレオチド配列を含む。一部の実施形態では、gRNAの対に関して、第1のgRNAを、ゲノムDNA上に存在するCYP2D6の上流のヌクレオチド配列と相補的または実質的に相補的になるように選択し、第2のgRNAを、ゲノムDNA上に存在するCYP2D8の下流のヌクレオチド配列と相補的または実質的に相補的になるように選択する。表1に、本開示において使用することができる(例えば、CYP2D6遺伝子座の全体を含有するゲノムDNAの断片を切り出すために)gRNAの非限定的な一覧を、CYP2D6遺伝子座に対する位置(例えば、CYP2D6の上流またはCYP2D8の下流)と共に提示する。一部の場合では、第1のgRNAは、配列番号1、2、13~16、27~67、78~81、および215~343のいずれか1つのヌクレオチド配列、または配列番号1、2、13~16、27~67、78~81、および215~343のいずれか1つに対して少なくとも90%の配列同一性(例えば、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)を有するヌクレオチド配列を含む。一部の場合では、第2のgRNAは、配列番号3~12、17~26、68~77、82~214、344~418のいずれか1つのヌクレオチド配列、または配列番号3~12、17~26、68~77、82~214、および344~418のいずれか1つに対して少なくとも90%の配列同一性(例えば、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)を有するヌクレオチド配列を含む。一部の場合では、gRNAのうちの少なくとも1つはcrRNAである。一部の場合では、gRNAのうちの少なくとも1つはsgRNAである。
表1. ガイドRNA配列
表1. ガイドRNA配列
種々の態様では、方法は、CYP2D6の1つまたは複数の遺伝的変異を同定することをさらに含む。一部の場合では、遺伝的変異は、CYP2D6における薬理遺伝学的に関連性のある変異である(例えば、スター対立遺伝子ハプロタイプ)。一部の場合では、遺伝的変異は、CYP2D6の構造変異である。一部の場合では、遺伝的変異に基づいて、対象を、CYP2D6機能の低下または喪失を有すると同定する。一部の場合では、対象を、CYP2D6機能の増大または獲得を有すると同定する。
種々の態様では、方法は、同定するステップに基づいて、対象に対して処置を推奨するステップをさらに含む。種々の態様では、方法は、同定するステップに基づいて、対象を処置するステップをさらに含む。種々の態様では、方法は、同定するステップに基づいて、代替処置を推奨するステップを伴う。種々の態様では、方法は、同定するステップに基づいて、薬物のある投薬量を推奨するステップを伴う。種々の態様では、方法は、対象に投与される薬物(例えば、CYP2D6によって活性化または代謝される)の投薬量を変更するステップ(または投薬量の変更を推奨するステップ)を伴う。一部の場合では、薬物(または治療薬)は、CYP2D6によって活性化または代謝される薬物である。
組成物およびキット
一態様では、(a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;(b)(i)ゲノムDNA内の目的のゲノム領域の上流に存在する第1のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1の外側のgRNAと、(ii)ゲノムDNA内の前記目的のゲノム領域の下流に存在する第2のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2の外側のgRNAとを含む外側のgRNAの対;(c)(iii)ゲノムDNA内の前記目的のゲノム領域の上流に存在する第3のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1の内側のgRNAと、(iv)ゲノムDNA内の前記目的のゲノム領域の下流に存在する第4のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2の内側のgRNAとを含む内側のgRNAの対、を含む組成物およびキットであって、第3のヌクレオチド配列および第4のヌクレオチド配列が、ゲノムDNA上の、第1のヌクレオチド配列および第2のヌクレオチド配列よりも目的のゲノム領域に近い塩基長のところに存在する、組成物およびキットが本明細書に提示される。
一部の場合では、組成物および/またはキットは、エキソヌクレアーゼをさらに含む。エキソヌクレアーゼは、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、およびエキソヌクレアーゼVIIIからなる群より選択することができる。
CRISPR関連エンドヌクレアーゼは、本明細書に記載の任意のCRISPR関連エンドヌクレアーゼであり得る。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラスIまたはクラスII CRISPR関連エンドヌクレアーゼである。Cas I CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10およびCsf1が挙げられる。クラスII CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13cおよびCas13dが挙げられる。一部の場合では、CRISPR関連エンドヌクレアーゼはCasタンパク質またはポリペプチドである。一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas12aタンパク質またはポリペプチドである。
一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas9タンパク質またはポリペプチドである。一部の場合では、Cas9タンパク質またはポリペプチドは、細菌種Streptococcus pyogenesに由来する。一部の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と同一のアミノ酸配列を有する。他の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と比べて改変されたアミノ酸配列を有する。一部の場合では、Cas9タンパク質またはポリペプチドは1つまたは複数の突然変異(例えば、野生型Cas9タンパク質またはポリペプチドと比べて)を有する。一部の場合では、1つまたは複数の突然変異は置換、欠失、または挿入である。Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%の配列同一性を有するアミノ酸配列を有し得る。例えば、Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有し得る。一部の場合では、Cas9変異体は、野生型S.pyogenes Cas9と比べて1つまたは複数の点突然変異を含み得る。例えば、Cas9変異体は、野生型S.pyogenes Cas9と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される点突然変異を含み得る。
一部の場合では、目的のゲノム領域は、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座である。一部の場合では、gRNAのうちの少なくとも1つ(例えば、第1の内側のgRNA、第2の内側のgRNA、第1の外側のgRNA、および第2の外側のgRNAのうちの少なくとも1つ)は、表1に提示されるいずれかのヌクレオチド配列(例えば、配列番号1~418)によるヌクレオチド配列を含む。一部の場合では、gRNAのうちの少なくとも1つ(例えば、第1の内側のgRNA、第2の内側のgRNA、第1の外側のgRNA、および第2の外側のgRNAのうちの少なくとも1つ)は、表1に提示されるいずれかのヌクレオチド配列(例えば、配列番号1~418)に対して少なくとも約90%(例えば、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の配列同一性を有するヌクレオチド配列を含む。一部の場合では、gRNAのうちの少なくとも1つは、crRNAである。一部の場合では、gRNAのうちの少なくとも1つは、sgRNAである。一部の場合では、第1の外側のガイドRNA、第1の内側のガイドRNA、またはその両方は、配列番号3~12、17~26、68~77、82~214、および344~418のいずれか1つのヌクレオチド配列を含む。一部の場合では、第2の外側のガイドRNA、第2の内側のガイドRNA、またはその両方は、配列番号1、2、13~16、27~67、78~81、および215~343のいずれか1つのヌクレオチド配列を含む。
一部の態様では、キットは、本明細書に提示されるいずれかの方法にキットを使用するための指示をさらに含む。一部の場合では、キットは、入れ子状CRISPR反応(例えば、本明細書に記載の通り)にキットを使用するための指示をさらに含む。一部の場合では、キットは、目的のゲノム領域をゲノムDNAから切り出すための方法(例えば、本明細書に記載の通り)にキットを使用するための指示をさらに含む。一部の場合では、キットは、CYP2D6遺伝子座をゲノムDNAから切り出すための方法(例えば、本明細書に記載の通り)にキットを使用するための指示をさらに含む。
対象および生体試料
対象は、遺伝子解析のための生体試料を提供することができる。生体試料は、対象によって生成された任意の物質であってよい。一般に、生体試料は、対象から取得された任意の組織または対象によって生成された任意の物質である。生体試料は、例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物、眼内液、母乳などの体液であり得る。生体試料は、細胞および/または固形組織(例えば、頬組織(例えば、頬スワブから)、糞便、皮膚、毛髪、器官組織など)であり得る。一部の場合では、生体試料は、固形腫瘍または固形腫瘍の生検材料である。一部の場合では、生体試料は、ホルマリン固定された、パラフィン包埋(FFPE)組織試料である。生体試料は、ゲノムDNAを含む任意の生体試料であってよい。
生体試料を対象から引き出すことができる。対象は、哺乳動物、爬虫類、両生類、トリ、または魚であり得る。哺乳動物は、ヒト、類人猿、オランウータン、サル、チンパンジー、ウシ、ブタ、ウマ、齧歯類、鳥類、爬虫類、イヌ、ネコ、または他の動物であり得る。爬虫類は、トカゲ、ヘビ、ワニ、海カメ(turtle)、クロコダイル、および陸カメ(tortoise)であり得る。両生類は、ヒキガエル、カエル、イモリ、およびサンショウウオであり得る。トリの例としては、これだけに限定されないが、アヒル、ガチョウ、ペンギン、ダチョウ、およびフクロウが挙げられる。魚の例としては、これだけに限定されないが、ナマズ、ウナギ、サメ、およびメカジキが挙げられる。対象はヒトであることが好ましい。対象は疾患または状態を有し得る。対象に治療薬を処方することができる。治療薬は、CYP2D6によって活性化および/または代謝される治療薬であり得る。
本開示のシステム
本明細書に提示される方法を実施するためのシステムが本明細書にさらに提示される。一態様では、(a)本明細書に記載の任意の方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;および(b)少なくとも1つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。
種々の態様では、出力はレポートである。種々の態様では、出力は、目的の複雑なゲノム領域の遺伝子型である。種々の態様では、出力は、目的の複雑なゲノム領域の遺伝子配列である。種々の態様では、出力は、目的の複雑なゲノム領域の構造解析である。種々の態様では、解析するステップは、目的の複雑なゲノム領域を遺伝子型決定することを含む。種々の態様では、解析するステップは、目的の複雑なゲノム領域の構造解析を実施することを含む。種々の態様では、解析するステップは、目的の複雑なゲノム領域を配列決定することを含む。
種々の態様では、出力は、CYP2D6の遺伝的変異を同定するものである。種々の態様では、出力は、CYP2D6の機能の低下、喪失、または増大を同定するものである。種々の態様では、レポートは、遺伝的変異に基づいて、対象に対して処置を推奨するものである。種々の態様では、レポートは、遺伝的変異に基づいて、対象に対して治療薬のある投薬量を推奨するものである。種々の態様では、レポートは、遺伝的変異に基づいて、治療薬の投薬量を変更することを推奨するものである。一部の場合では、治療薬は、CYP2D6によって活性化または代謝される治療薬である。
本開示は、本明細書に記載の方法を実施するための、コンピュータに基づくシステムをさらに提供する。一部の態様では、システムを、本明細書に提示される方法によって生成されたデータを解析するために使用することができる。システムは、1つまたは複数のクライアントコンポーネントを含み得る。1つまたは複数のクライアントコンポーネントは、ユーザーインタフェースを含み得る。システムは、1つまたは複数のサーバーコンポーネントを含み得る。サーバーコンポーネントは、1つまたは複数のメモリ位置を含み得る。1つまたは複数のメモリ位置は、データ入力を受け取るように構成することができる。データ入力は、配列決定データを含み得る。配列決定データは、対象由来の核酸試料(例えば、ゲノムDNA)から生成することができる。本開示のシステムでの使用に適した配列決定データの非限定的な例は記載されている。システムは、1つまたは複数のコンピュータプロセッサをさらに含み得る。1つまたは複数のコンピュータプロセッサを1つまたは複数のメモリ位置に作動可能にカップリングすることができる。1つまたは複数のコンピュータプロセッサを、スクリーン上に表示するための出力を生成するようにプログラムすることができる。出力は1つまたは複数のレポートを含み得る。
本明細書に記載のシステムは、1つまたは複数のクライアントコンポーネントを含み得る。1つまたは複数のクライアントコンポーネントは、1つまたは複数のソフトウェアコンポーネント、1つまたは複数のハードウェアコンポーネント、またはこれらの組合せを含み得る。1つまたは複数のクライアントコンポーネントは、1つまたは複数のサーバーコンポーネントを通じて1つまたは複数のサービスにアクセス可能である。1つまたは複数のクライアントコンポーネントによりネットワークを通じて1つまたは複数のサービスにアクセス可能である。ネットワークは、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信したイントラネットおよび/もしくはエクストラネットであり得る。ネットワークは、一部の場合では、電気通信および/またはデータネットワークである。ネットワークは1つまたは複数のコンピュータサーバーを含んでよく、それにより、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる。ネットワークは、一部の場合では、コンピュータシステムの補助により、ピアツーピアネットワークをインプリメントすることができ、それにより、コンピュータシステムとカップリングしたデバイスをクライアントまたはサーバーとして機能させることを可能にすることができる。
システムは、1つまたは複数のメモリ位置(例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ)、電子記憶装置(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース(例えば、ネットワークアダプター)、ならびに、キャッシュ、他のメモリ、データ記憶および/または電子ディスプレイアダプターなどの周辺機器を含み得る。メモリ、記憶装置、インターフェースおよび周辺機器は、マザーボードなどの通信バスを通じてCPUと通信する。記憶装置は、データを記憶させるためのデータ記憶装置(またはデータリポジトリ)であり得る。一実施例では、1つまたは複数のメモリ位置に受け取った配列決定データを記憶させることができる。
システムは、1つまたは複数のコンピュータプロセッサを含み得る。1つまたは複数のコンピュータプロセッサは、例えば、記憶されたデータにアクセスするために、1つまたは複数のメモリ位置に作動可能にカップリングすることができる。1つまたは複数のコンピュータプロセッサは、機械により実行可能なコードをインプリメントして、本明細書に記載の方法を実施することが可能である。
機械により実行可能なまたは機械により可読のコードは、ソフトウェアの形式で提供することができる。使用中、コードをプロセッサによって実行することができる。一部の場合では、コードを記憶装置から検索し、プロセッサからすぐにアクセスできるようにメモリに記憶させることができる。一部の状況では、電子記憶装置を除外することができ、機械により実行可能な命令をメモリに記憶させる。
コードは、プリコンパイルし、コードの実行のために適合させたプロセッサを有する機械で使用するために構成することもでき、実行時間中にコンパイルすることもでき、実行時間中に解釈実行することもできる。コードは、コードをプリコンパイル様式で、都度コンパイル様式で、または解釈実行様式で実行することが可能になるように選択することができるプログラミング言語で供給することができる。
コンピュータシステムなどの本明細書に提示されるシステムおよび方法の態様は、プログラミングで具体化することができる。当該技術の種々の態様は、一般には機械(もしくはプロセッサ)により実行可能なコードおよび/または機械可読媒体の1種で実施または具体化される関連データの形式の「製品」または「製造品」と考えることができる。機械により実行可能なコードは、メモリ(例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶させることができる。「記憶」型媒体は、コンピュータ、プロセッサなど、または関連するそのモジュールの有形メモリ、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどのいずれかまたは全てを含み得、これらにより、ソフトウェアプログラミングのために任意の時点で非一時的記憶を提供することができる。ソフトウェアの全部または一部は、時々、インターネットまたは種々の他の電気通信ネットワークを通じて通信することができる。そのような通信により、例えば、ソフトウェアを1つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサに、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにローディングすることが可能になる。したがって、ソフトウェアエレメントを担持することができる別の型の媒体として、ローカルデバイス間の物理的なインターフェースを横断して、有線および光通信線ネットワークを通じて、および種々のエアリンクを通じて使用されるものなどの光波、電波および電磁波が挙げられる。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理的要素もまた、ソフトウェアを担持する媒体とみなすことができる。本明細書で使用される場合、非一時的に制限される場合を除き、有形「記憶」媒体、コンピュータまたは機械「可読媒体」などの用語は、プロセッサに実行のための命令をもたらすことに関与する任意の媒体を指す。
したがって、コンピュータで実行可能なコードなどの機械可読媒体は、これだけに限定されないが、有形記憶媒体、搬送波媒体または物理的伝送媒体を含めた多くの形態をとり得る。非揮発性記憶媒体としては、例えば、光学または磁気ディスク、例えば、例えば図に示されているデータベースなどをインプリメントするために使用することができる任意のコンピュータ(複数可)のストレージデバイスのいずれかなどが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、同軸ケーブル;コンピュータシステム内のバスを含むワイヤを含めた銅線および光ファイバーが挙げられる。搬送波伝送媒体は、無線周波数(RF)および赤外(IR)データ通信中に生じるものなどの、電気シグナルもしくは電磁気シグナル、または音波もしくは光波の形態をとり得る。したがって、コンピュータ可読媒体の一般形態としては、例えば、フロッピー(登録商標)ディスク、フレシキブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH(登録商標)-EPROM、任意の他のメモリチップまたはカートリッジ、データもしくは命令を伝達する搬送波、そのような搬送波を輸送するケーブルもしくはリンク、またはコンピュータによりプログラミングコードおよび/またはデータを読み取ることが可能な任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、1つまたは複数の命令の1つまたは複数のシーケンスをプロセッサに実行のために伝えることに関与し得る。
本明細書に開示されるシステムは、1つまたは複数の電子ディスプレイを含み得る、またはそれと通信し得る。電子ディスプレイは、コンピュータシステムの一部であってもよく、コンピュータシステムに直接またはネットワークを通じてカップリングしていてもよい。コンピュータシステムは、本明細書に開示される種々の特色および機能性を提供するためのユーザーインタフェース(UI)を含み得る。UIの例としては、限定することなく、グラフィカルユーザーインターフェース(GUI)およびウェブに基づくユーザーインタフェースが挙げられる。UIにより、ユーザーがそれによって本明細書に記載の方法およびシステムを利用することができる相互作用ツールをもたらすことができる。例として、本発明で構想されるUIは、健康管理実践者がそれによって遺伝学的試験を注文し、試験される遺伝学的変異体の一覧をカスタマイズし、レポートを受け取り、閲覧することができる、ウェブに基づくツールであり得る。
本明細書に開示される方法は、生物医学的データベース、ゲノムデータベース、生物医学的レポート、疾患レポート、症例対照解析、および1つもしくは複数のデータベースからのデータおよび/もしくは情報に基づいた希少な変異体発見解析、1つもしくは複数のアッセイ、1つもしくは複数のデータもしくは結果、1つもしくは複数のアッセイに基づくもしくはそれから引き出される1つもしくは複数の出力、1つもしくは複数のデータもしくは結果に基づくもしくはそれから引き出される1つもしくは複数の出力、またはこれらの組合せを含み得る。
本明細書に記載の通り、1つまたは複数のコンピュータプロセッサにより、機械により実行可能なコードをインプリメントして本開示の方法を実施することができる。機械により実行可能なコードは、任意の数のオープンソースまたはクローズドソースソフトウェアを含み得る。機械により実行可能なコードをインプリメントして、データ入力を解析することができる。データ入力は、1つまたは複数の配列決定反応により生成された配列決定データであり得る。コンピュータプロセッサを少なくとも1つのメモリ位置に作動可能にカップリングすることができる。コンピュータプロセッサにより、少なくとも1つのメモリ位置からデータ(例えば、配列決定データ)にアクセスすることができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、配列決定データを参照配列にマッピングすることができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、配列決定データから遺伝学的変異体の存在または非存在を決定することができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、スクリーン上に表示するための出力(例えば、レポート)を生成することができる。
機械により実行可能なコードは、1つまたは複数のアルゴリズムを含み得る。1つまたは複数のアルゴリズムを使用して本開示の方法をインプリメントすることができる。
本開示のシステムは、1つまたは複数のコンピュータシステムを含み得る。図16は、例えば、データを受け取ること、および前記データに基づいて出力を生成することなど、本開示の方法をインプリメントするようにプログラムされたまたは他のやり方で構成されたコンピュータシステム(本明細書では「システム」とも)1601を示す。システム1601は、シングルコアプロセッサもしくはマルチコアプロセッサであってもよく、並行処理のための複数のプロセッサであってもよい中央処理装置(CPU、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも)1605を含む。システム1601はまた、メモリ1610(例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ)、電子記憶装置1615(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース1620(例えば、ネットワークアダプター)、ならびにキャッシュ、他のメモリ、データ記憶および/または電子ディスプレイアダプターなどの周辺機器1625を含む。メモリ1610、記憶装置1615、インターフェース1620および周辺機器1625は、CPU 1605とマザーボードなどの通信バス(実線)を通じて通信する。記憶装置1615は、データを記憶させるためのデータ記憶装置(またはデータリポジトリ)であり得る。システム1601はコンピュータネットワーク(「ネットワーク」)1630に通信インターフェース1620の補助により作動可能に(operatively)カップリングしている。ネットワーク1630は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信するイントラネットおよび/もしくはエクストラネットであり得る。ネットワーク1630は、一部の場合では、電気通信および/またはデータネットワークである。ネットワーク1630は1つまたは複数のコンピュータサーバーを含んでよく、それにより、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる。ネットワーク1630は、一部の場合では、システム1601の補助により、ピアツーピアネットワークをインプリメントすることが可能であり、それにより、システム1601とカップリングしたデバイスをクライアントまたはサーバーとして機能させることを可能にすることができる。
システム1601は処理システム1640と通信する。処理システム1640は、例えば、配列決定データを参照配列にマッピングすることまたは分類を遺伝学的変異体に割り当てることなど、本明細書に開示される方法をインプリメントするように構成することができる。処理システム1640は、システム1601とネットワーク1630を通じて、または直接(例えば、有線、無線)接続によって通信させることができる。処理システム1640は、核酸配列解析などの解析のために構成され得る。
本明細書に記載の方法およびシステムは、システム1601の電子記憶位置、例えば、メモリ1610または電子記憶装置1615などに記憶された機械(またはコンピュータプロセッサ)実行可能なコード(またはソフトウェア)によってインプリメントすることができる。使用中、コードをプロセッサ1605によって実行することができる。一部の実施例では、コードを記憶装置1615から検索し、プロセッサ1605からすぐにアクセスできるようにメモリ1610に記憶させることができる。一部の状況では、電子記憶装置1615を除外することができ、機械により実行可能な命令をメモリ1610に記憶させる。
コードは、プリコンパイルし、コードの実行のために適合させたプロセッサを有する機械で使用するために構成することもでき、実行時間中にコンパイルすることもでき、実行時間中に解釈実行することもできる。コードは、コードをプリコンパイル様式で、都度コンパイル様式で、または解釈実行様式で実行することが可能になるように選択することができるプログラミング言語で供給することができる。
本明細書に提示されるシステムおよび方法の態様は、プログラミングで具体化することができる。当該技術の種々の態様は、一般には機械(もしくはプロセッサ)により実行可能なコードおよび/または機械可読媒体の1種で実施もしくは具体化される関連データの形式で「製品」または「製造品」と考えることができる。機械により実行可能なコードは、メモリ(例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶させることができる。「記憶」型媒体は、コンピュータ、プロセッサなど、または関連するそのモジュールの有形メモリ、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどのいずれかまたは全てを含み得、これらにより、ソフトウェアプログラミングのために任意の時点で非一時的記憶を提供することができる。ソフトウェアの全部または一部は、時々、インターネットまたは種々の他の電気通信ネットワークを通じて通信することができる。そのような通信により、例えば、ソフトウェアを1つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサに、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにローディングすることが可能になる。したがって、ソフトウェアエレメントを担持することができる別の型の媒体として、ローカルデバイス間の物理的なインターフェースを横断して、有線および光通信線ネットワークを通じて、および種々のエアリンクを通じて使用されるものなどの光波、電波および電磁波が挙げられる。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理的要素もまた、ソフトウェアを担持する媒体とみなすことができる。本明細書で使用される場合、非一時的に制限される場合を除き、有形「記憶」媒体、コンピュータまたは機械「可読媒体」などの用語は、プロセッサに実行のための命令をもたらすことに関与する任意の媒体を指す。
したがって、コンピュータで実行可能なコードなどの機械可読媒体は、これだけに限定されないが、有形記憶媒体、搬送波媒体または物理的伝送媒体を含めた多くの形態をとり得る。非揮発性記憶媒体としては、例えば、光学または磁気ディスク、例えば、例えばデータベースなどをインプリメントするために使用することができる任意のコンピュータ(複数可)のストレージデバイスのいずれかなどが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、同軸ケーブル;コンピュータシステム内のバスを含むワイヤを含めた銅線および光ファイバーが挙げられる。搬送波伝送媒体は、無線周波数(RF)および赤外(IR)データ通信中に生じるものなどの、電気シグナルもしくは電磁気シグナル、または音波もしくは光波の形態をとり得る。したがって、コンピュータ可読媒体の一般形態としては、例えば、フロッピー(登録商標)ディスク、フレシキブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH(登録商標)-EPROM、任意の他のメモリチップまたはカートリッジ、データもしくは命令を伝達する搬送波、そのような搬送波を輸送するケーブルもしくはリンク、またはコンピュータによりプログラミングコードおよび/またはデータを読み取ることが可能な任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、1つまたは複数の命令の1つまたは複数のシーケンスをプロセッサに実行のために伝えることに関与し得る。
コンピュータシステム1601は、ユーザーインタフェース(UI)を含む電子ディスプレイを含み得る、またはそれと通信し得る。UIの例としては、限定することなく、グラフィカルユーザーインターフェース(GUI)およびウェブに基づくユーザーインタフェースが挙げられる。
一部の実施形態では、システム1601は、視覚的情報をユーザーに提供するためのディスプレイを含む。一部の実施形態では、ディスプレイはブラウン管(CRT)である。一部の実施形態では、ディスプレイは液晶ディスプレイ(LCD)である。さらなる実施形態では、ディスプレイは薄膜トランジスタ液晶ディスプレイ(TFT-LCD)である。一部の実施形態では、ディスプレイは有機発光ダイオード(OLED)ディスプレイである。種々のさらなる実施形態では、OLEDディスプレイはパッシブマトリックスOLED(PMOLED)またはアクティブマトリックスOLED(AMOLED)ディスプレイである。一部の実施形態では、ディスプレイはプラズマディスプレイである。他の実施形態では、ディスプレイはビデオプロジェクターである。さらに別の実施形態では、ディスプレイは本明細書に開示されるものなどのデバイスの組合せである。ディスプレイは、1つまたは複数の生物医学的レポートが本明細書に記載の方法によって生成されたらそれをエンドユーザーに提供することができるものである。
一部の実施形態では、システム1601は、ユーザーから情報を受け取る入力デバイスを含む。一部の実施形態では、入力デバイスはキーボードである。一部の実施形態では、入力デバイスは、非限定的な例として、マウス、トラックボール、トラックパッド、ジョイスティック、ゲームコントローラ、またはスタイラスを含めたポインティングデバイスである。一部の実施形態では、入力デバイスはタッチスクリーンまたはマルチタッチスクリーンである。他の実施形態では、入力デバイスは、音声または他の音入力を捕捉するためのマイクロホンである。他の実施形態では、入力デバイスは、動きまたは視覚的入力を捕捉するためのビデオカメラである。さらに別の実施形態では、入力デバイスは、本明細書に開示されるものなどのデバイスの組合せである。
システム1601は、1つまたは複数のデータベースを含んでもよく、それと作動可能にカップリングすることもできる。データベースは、ゲノムデータベース、プロテオミクスデータベース、薬理ゲノミクスデータベース、生物医学的データベース、および科学的データベースを含み得る。データベースは公的に利用可能なデータベースであり得る。その代わりにまたはそれに加えて、データベースは所有権のあるデータベースを含み得る。データベースは市販のデータベースであり得る。データベースとしては、これだけに限定されないが、MendelDB、PharmGKB、Varimed、Regulome、curated BreakSeq junctions、Online Mendelian Inheritance in Man(OMIM)、Human Genome Mutation Database(HGMD)、NCBI dbSNP、NCBI RefSeq、GENCODE、GO(gene ontology)、およびKyoto Encyclopedia of Genes and Genomes(KEGG)が挙げられる。
データを、データのユーザーと同じ国を含む地理的な位置で生成し、かつ/またはそこから伝送することができる。データを、例えば、1つの国の地理的な位置で生成し、かつ/またはそこから伝送することができ、データのユーザーは異なる国に存在していてよい。一部の場合では、本開示のシステムによってアクセスしたデータを複数の地理的な位置のうちの1カ所からユーザーに伝送することができる。データを、例えば、ネットワーク、安全なネットワーク、安全でないネットワーク、インターネット、またはイントラネットにより、複数の地理的な位置の間で行き来するように伝送することができる。
以下の実施例は、本開示の種々の実施形態を例示する目的で提示され、本開示をどのようにも限定することを意図するものではない。本実施例は、本明細書に記載の方法と共に、現在の代表的な好ましい実施形態であり、例示であり、本開示の実施形態の範囲を限定することを意図するものではない。特許請求の範囲によって定義される本開示の主旨に包含される実施例における変化および他の使用が当業者には想起されよう。
(実施例1)
CYP2D6および臨床試験
CYP2D6遺伝子構造:CYP2D6は、小さな遺伝子(4382bp)であり、9つのエクソンを有する。しかし、この高度に多型の遺伝子座の遺伝子解析は、図1に示されている通り、高度に類似した非機能性のCYP2D7およびCYP2D8偽遺伝子が遺伝子座内に存在することに起因して難しい。CYP2D6とCYP2D7の類似性および大きなリピート領域の存在により、遺伝子欠失および遺伝子重複だけでなく、3’CYP2D7と5’CYP2D6または3’CYP2D6と5’CYP2D7のいずれかを含有する複雑な遺伝子ハイブリッドも生じている。現在、これらの構造変異の存在を検出するために多数の試験アッセイが求められている。
現行の試験用プラットフォーム:CYP2D6を解析するための一般的な方法の1つは、長距離の対立遺伝子特異的PCR産物の配列解析によるものである。簡単に述べると、対立遺伝子特異的プライマーを使用して、標的化される領域を増幅する。PCR産物において見いだされる一塩基変異体(SNV)はその対立遺伝子のハプロタイプを表す。対立遺伝子特異的アンプリコンは、重複した遺伝子コピーならびにCYP2D6-2D7およびCYP2D7-2D6ハイブリッド遺伝子からも生じ得る。つい最近、CYP2D6ハプロタイプをより正確に特徴付けるために、単一分子リアルタイム(SMRT)シーケンシングまたはナノポアシーケンシングなどのロングリードシーケンシング技術も使用されている;しかし、CYP2D6のロングリードシーケンシングのためのライブラリー生成が依然として限定されている。配列決定のためのCYP2D6鋳型を生成するために現在使用されているXL-PCR反応は、生成することができる産物のサイズに限界があり、プライマー特異的であり、また、複雑なハイブリッドまたは多くの公知のCNVは、その変異が以前に特徴付けられており、目的の試料中に存在することが分かっている場合を除いて捕捉されない。
要約すると、CYP2D6は、全ての処方薬の約25%の代謝に直接関与する高度に多型の遺伝子である。コピー数の変化を含めたこの遺伝子の遺伝的変異は、患者の薬物代謝状態に直接影響を及ぼし得る。コピー数を含む正確な遺伝子型は極めて重要であり、現行の方法体系ではこの遺伝子領域の複雑さを十分にアッセイすることができない。
CRISPR/Cas9技術および部位特異的アダプターライゲーションをロングリードシーケンシングと組み合わせて利用して、CYP2D6解析のための診断品質の方法体系を開発するための方法が本明細書で提唱される。この手法では、単一の、試料にとらわれないCRISPR切断ステップを利用して、ロングリードシーケンシングのためのCYP2D6遺伝子座全体を単離する。この方法体系により、一塩基多型(SNP)およびCNVの両方を正確に検出すること、ならびに、可能性のある最も正確な、フェージングされたCYP2D6遺伝子型および代謝型(metabolizer)の状態を割り当てることが可能になる。
in vitroおよびin vivoのどちらにおいても、CRISPR技術を使用して、目的のゲノム領域(ROI)を標的とし、それを切り出すことができる。簡単に述べると、CRISPR-C関連タンパク質9(Cas9)が、合成的に生成された標的特異的ガイドRNA(sgRNA)と複合体を形成すると、ガイドRNAの標的特異的配列に対して相補性を有する配列において二本鎖カットが創出される。ROIの両末端の配列を標的とするようにsgRNAを設計することにより、CRISPR-Cas9を使用して、数メガベースの長さに至るまでであり得るDNAを切り出すことができる。
ロングリードシーケンシング:ショートリード次世代シーケンシング(NGS)の開発によりヒト遺伝学が改革されたが、限界が十分に認識されている。単離されたHMW DNA断片のロングリードシーケンシングでは、フェージング情報を得ること、小さな構造変異を同定すること、および、タンデムリピートを含めた、ゲノムの高度に複雑な領域をより良好にアセンブルすることが可能になるので、最近注目を浴びている。DNA断片を標的特異的に単離するためのCRISPR技術の使用により、ロングリードシーケンシングのためにゲノムの関連性のある領域を標的とするための革新的かつ優れた手法がもたらされる。
GeT-RMコホート:CYP2D6遺伝子構造を系統的に特徴付けるための主要な取り組みの一部として、アッセイ開発、検証、品質管理および技能試験のためのよく特徴付けられた参照材料の最先端のセットを確立するためにCYP2D6遺伝子型決定データが提供された。この取り組みは、Genetic Testing Reference Materials Coordination Program(GeT-RM) at the Centers for Disease Control and Prevention-based Genetic Testing Reference Material Coordination Program, the Coriell Institute for Medical Research、ならびに他のPGxコミュニティメンバーとの共同研究で行われた。この研究の一部として、複雑な構造配置および/または希少なCYP2D6遺伝子型を含有するいくつかの試料に対してPharmacoscan(商標)に基づくCYP2D6遺伝子型決定を提供した。このデータをXL-PCRに基づくNGS解析と併せて使用して、これらの試料について現行の解析方法体系で可能な最も正確な遺伝子型を決定した。全ての細胞株およびコンセンサス遺伝子型決定に関する情報およびアノテーションデータにより、提唱された新しい配列決定および解析手法の検証の基礎が築かれる。
研究設計および方法
目的1(方法の開発):(a)後の、ゲノムヒトDNA(例えば、血液試料)におけるサイズ解析(例えば、ゲル)のためのCYP2D6-D7ゲノム遺伝子座を含有する高分子量DNAセグメントを創出するための特定のCRISPR/Cas9方法体系の最適化。(b)標的化される領域の単離/富化および配列決定のためのXL-ライブラリーの生成。(c)CYP2D6-D7ゲノム遺伝子座のゲノム変異体の長い鋳型の配列決定のためのNGS手法の確立(例えば、PacBio、MinION)。提唱されたワークフローの概略が図2に示されている。
HMW DNAの単離:ROI(CYP2D6およびCYP2D7)の通常の長さは28~35kbである。下流の解析のためにROI全体がインタクトであることを確実にするために、NucleoBond(登録商標)Genomic DNA and RNA purification systemを使用してプロトコールを開発して高分子量gDNA(最大70kb)を単離した。改変プロトコールにより、他の方法体系を用いた場合に観察される10kb~50kbの範囲と比較して、50kbを超える分子量のgDNAを抽出することが可能になる(図3)。
高度に特異的なsgRNAの設計および検証:CYP2D6遺伝子座の複雑で高度に多型の性質に起因して、従来のPCRおよびアレイに基づく技術では、CNV解析およびSNP解析の両方を実施するために多数のアッセイが必要である。CYP2D6遺伝子のみを標的とするCRISPR Cas9手法では、D6/D7ハイブリッド対立遺伝子またはCYP2D6重複事象などの構造変異を含有する対立遺伝子を捕捉することができない。この限定を克服するために、CYP2D6およびCYP2D7の両方を包含する領域に隣接する独特の配列を同定した。これらの独特の領域を標的とするsgRNAを設計することにより、1つのCRISPR/Cas9切断反応を実施して、CYP2D6/CYP2D7領域全体を単離した(図4A)。
sgRNAの特異性および有効性を確認するために、標的化されるsgRNA結合部位を含有するXL-PCR産物をgDNAから生成した。XL-PCR産物を、Cas9と一緒に、sgRNAは伴わずにインキュベートしたか(図4B、試料A)、またはCas9および異なるsgRNAと一緒にインキュベートした(図4B、試料BおよびC)。Cas9およびsgRNAと一緒にインキュベートした全てのPCR産物が切断されて、予測されたサイズのDNA断片が生じたが、異なるsgRNAにより異なる程度の切断効率が示された。
ゲノムDNA内のCYP2D6-CYP2D7遺伝子座のカット:sgRNAは、オフターゲット認識部位を含有し得るgDNAに高い効率および特異性で結合しなければならない。CRISPRのカット効率および特異性を調べるために、ゲノムDNAをCas9と一緒に、sgRNAは伴わずにインキュベートしたか(陰性対照)、または、Cas9ならびにCYP2D6の5’およびCYP2D7の3’をカットする2種のsgRNAのプールと一緒にインキュベートした。予測される切断部位それぞれに隣接するプライマーを用いてPCR反応を実施した。sgRNAが正しい結合部位に結合し、切断が起こった場合、PCR産物の減少が予想される。実際に、これが観察される(図5A、図5B)。sgRNA結合部位の内側のプライマーを使用したCYP2D6遺伝子座に対するPCRも実施して、CYP2D6遺伝子内でCas9媒介性オフターゲット切断が起こるかどうかを決定した。CYP2D6内のオフターゲット切断のエビデンスは認められなかった(図5A、図5B)。
要約すると、XL-PCRおよびゲノムDNAの調査により、Cas9-sgRNA複合体により、標的化されたCYP2D6-CYP2D7遺伝子座の両側が高い効率でカットされ、遺伝子座内の著しいオフターゲット活性は伴わないことが実証された。切断により予測された28kbの断片が創出され、これを、富化後、下流のロングリードNGSのために利用することができる。
(実施例2)
CRISPR/Cas9方法体系のさらなる最適化
CRISPR/Cas9方法体系のさらなる最適化
他のsgRNAおよびCas酵素を開発し、試験した。上記の通り試験するsgRNAを同定および設計するために標準のソフトウェアを使用する。目的は、ROIにおいて高い効率および特異性で切断を行うsgRNAを得ることである。より短いDNA断片が選好されるが、それでもなお、ROI全体が含有される。より短い断片には、配列決定および処理費用が低減するという利益があり得る。CRISPR Cas12a酵素を用いた同じ領域の切断も試みる。Cas12aエンドヌクレアーゼは、Cas9と同様に機能するが、異なるPAM配列要件(TTTV)を有し、切断後に5’付着突出を生じさせる。対照的に、Cas9では平滑末端が生じる。これは後のステップで重要である。
(実施例3)
ゲノムDNA内のCYP2D6-CYP2D7遺伝子座の富化
ゲノムDNA内のCYP2D6-CYP2D7遺伝子座の富化
概念実証として、上記のCYP2D6の5’およびCYP2D7の3’の切断部位を標的とするCas9-sgRNAを用いてgDNA5μgをカットした。切断されたDNAをBluePippen(Sage Science)機器で、1~50kbの範囲のサイズ選択を可能にする0.75%アガロースゲルカセットを使用して泳動した。溶出した試料が所望のCYP2D6-CYP2D7遺伝子座を含有することを、PCRを使用して確認した。このゲルに基づく手法では、HMW試料の単離が可能になるが、一方で、時間(Blue Pippenの実行当たり約10~12時間)、試料数が限られること(実行当たり4~5試料)、材料が著しく減少すること/回収が不良であること、および試料当たりの費用が高いこと(約$50.00)を含めたいくつかの欠点が存在する。
これらの限定を克服するために、標的を富化させるためのいくつかの手法を試験する。これにより、様々な方法の長所と短所を同定すること、およびさらなる臨床試験開発のための最も適切な手法を最終的に同定することが可能になる。これは、臨床診断検査開発のための典型的な手法である。以下のロングリードシーケンシングの考察は、Oxford Nanopore(ONT)シーケンシングを指すが、プロトコールはいずれも、PacBioシーケンシング要件に合うようにわずかな改変で適合させることができる。
方法1:標的の無増幅富化
DNAの調製:この無増幅ライブラリー調製法は、DNA試料の脱リン酸化および3’末端キャップ形成、その後、CRISPR処理および部位特異的ONTアダプターライゲーションを伴う。第1のステップにおいて、gDNAを、DNA断片の5’末端からリン酸基を除去するエビアルカリホスファターゼ、および、単一のチミジンジデオキシヌクレオチドを3’末端に付加するターミナルトランスフェラーゼで処理する。このステップにより、gDNA末端をライゲーション不能にすることが確実になる。次いで、DNAをCRISPR Cas9:gRNA複合体で処理し、その結果、平滑末端化した約28~35kbのCYP2D6/CYP2D7断片が生じる(詳細については前の段落を参照されたい)。この後、DNAポリメラーゼを用いてアデノシンヌクレオチドをDNAの遊離の3’末端(例えば、ddTTPでキャップ形成されていない末端)に付加する「Aテール付加」ステップを行う。最後に、チミジン突出を有するONTアダプターをDNAに付加する。CRISPR-Cas9による切断によって生じたDNA末端は相補的な3’突出および5’リン酸基を有する唯一の末端であるので、このDNA末端のみがアダプターにライゲーションする。
配列決定:得られたライブラリーをONT機器で直接配列決定する。この方法によって生成されたDNAライブラリーの量ではONTシーケンシングの難易度が高いことが判明した場合、これは、試料を配列決定の前に多重化することによって、および/または入力gDNAの量を増加させることによって克服することができる。さらに、試料をエキソヌクレアーゼで処理し(ONTアダプターはエキソヌクレアーゼIIIおよびラムダエキソヌクレアーゼに対して抵抗性である)、その結果、全てのバックグラウンドDNAの分解をもたらすことにより、バックグラウンドを低減することができる。
方法2:in vitro転写を使用した富化
理論的根拠:前の手法で十分なDNAを生成することができなかった場合、またはバックグラウンドDNAが過剰に存在する場合、in vitro転写(IVT)による標的化増幅という代替手法を評価する。IVTにはPCRに対する利点がいくつかある。(1)転写により誤りが伝播する可能性がより低い。(2)転写により、最長距離PCR産物のサイズよりも長い20~30kbもの長さのRNA分子を産生させることができる。
DNAの調製:CRISPRによる切断後、DNAをエキソヌクレアーゼで処理して付着末端を生成し、T7プロモーターおよびCYP26-CYP2D7遺伝子座の付着末端に相補的な突出を含有する二本鎖DNA断片を標的断片とライゲーションする。DNAポリメラーゼおよびDNAリガーゼを使用してギャップを埋め、あらゆるニックをふさぐ。ファージT7 RNAポリメラーゼにより約20kbもの長さの転写物を産生させることができる。プロモーターは約28kbの遺伝子座の両末端にライゲーションするので、遺伝子座の末端のプロモーターからT7 RNAポリメラーゼによって産生される最長転写物は、領域全体を網羅するのに十分に長くなり得る。しかし、T7産物の大部分は一般には4kb未満の長さである。最近発見されたSyn5シアノファージRNAポリメラーゼは、30kbもの長さの転写物を産生することができる。Syn5プロモーターをT7プロモーターと一緒に試験する。
in vitro転写:T7 RNAポリメラーゼおよびSyn5 RNAポリメラーゼを用いてIVTを実施する。前者の酵素は市販されているが、後者の酵素は本発明者らの研究室で発現させ、精製したものである。長いRNA転写物を産生させるために最適化された市販のT7 RNAポリメラーゼIVTキットがいくつか存在する。以前の研究により、ヒトゲノムにランダムに挿入されたT7プロモーター配列によりIVTの間に5kbよりも大きなRNA転写物がかなりの分率で産生されることが示されている。全RNA収量、大きな転写物(>15kb)の割合および誤り率が、いずれのポリメラーゼおよびIVT法がより優れた選択肢であるかの決定において重要な因子である。広範囲の長さのRNA転写物が産生される可能性があるので、SPRIビーズを使用して最も大きな転写物を選択することができる。RNAをONT機器で直接配列決定する。
方法3:in vitro転写のためのプロモーターの多部位への導入
理論的根拠:上記の手法が不十分である場合、T7またはSyn5プロモーターを標的化される領域にわたって多数の部位に挿入する。この手法の潜在的な問題は、遺伝子座の断片化により、変異体をCYP2D7またはCYP2D6に一義的に割り当てること(遺伝子と偽遺伝子は約94%の配列同一性を共有するため)、およびフェージング情報を引き出すことの難易度が高くなることである。この限定を克服するために、多数の付着挿入部位を使用して重複する断片を生成する。
プロモーターの導入:CRISPRによる切断は、遺伝子座内のROIに隣接する部位および規則正しく間隔のあいた(約10kb)離れた部位において起こる。切断はそれぞれ異なる標的部位のセットを用いる2つの別々の反応で行われ、したがって、配列決定後に、得られた重複する断片を使用してリードを繋ぎ合わせることができる。エキソヌクレアーゼ処理、プロモーターを含有するアダプターのライゲーション、IVT、およびcDNA合成は上に記載されている。プロモーターを含有するアダプターは、プロモーターのすぐ下流に短い固定された配列を含有する。cDNA合成を実施した際にはこの固定された配列に対する相補性を有するプライマーが逆転写(RT)に使用される。IVTによって産生されたRNAが2つの挿入部位間の長さにわたる場合、この配列に特異的なRTプライマーにより同じ領域にわたるcDNA分子が選択される。
潜在的な代替法:必要であれば、各IVT産物の始めに固定された配列を使用する長距離PCRを数サイクル使用して、挿入部位にわたるcDNA分子を選択的に増幅することができる。
潜在的な代替法:ONTによるRNAの配列決定には、大量のRNAが必要である。必要であれば、転写開始から遠い部位(15~20kb)にアニーリングするプライマーを用いてcDNA合成を実施して、長い転写物を選択する。相当な割合のシーケンシングリードが標的遺伝子座にマッピングされない場合、アダプターの非標的部位とのライゲーションの防止を試みる。CRISPR処理前のgDNAの脱リン酸化、およびgDNAの末端にいわゆる「ダンベル」アダプターでキャップ形成することが2つの可能性のある選択肢である。
(実施例4)
変異体の長い鋳型配列決定のためのNGS手法の確立
変異体の長い鋳型配列決定のためのNGS手法の確立
方法:現在のところ、潜在的な診断検査の開発に適用できる主要な市販のプラットフォームが2つ存在する。PacBioは、ロングリードシーケンシングのための最初の最も優れた技術であるが、付随する費用が甚大である。つい最近、費用効果が大きな潜在的に実行可能なプラットフォームとしてナノポアシーケンシング技術が登場した。Oxford Nanopore(ONT)はプラットフォームとして、スループット、費用および正確度に関して成熟を続けている。したがって、これらの利点を鑑みて、ONTに焦点が当てられている。それにもかかわらず、提唱された方法体系および方法は、主にプラットフォームによらず、現行の2つのまたは今後のロングリードプラットフォームのいずれにも合うように改変することができる。配列決定実行をOxford Nanopore MinIONで実施することができる。
目的2(検証):(a)ロングリード配列アラインメントのための現行のソフトウェアおよびプラットフォームを使用して配列解析を実施して、変異体コーリング、CNV解析およびフェージングを実施する。(b)CYP2D6-D7ロングリード配列解析結果を配列/コピー数変異と比較し、コンセンサス遺伝子型決定およびアノテーションの結果をGet-RMプロジェクトからの結果と共に特徴付けて、性能特性およびさらなる診断検査開発に向けたガイダンスを推定する。各方法の実現性を、時間対効果および費用対効果、必要なステップの最小化ならびに結果の質に関して試験し、比較する。包括的な目的は、CYP2D6遺伝子全体の単離、富化、および配列決定に最も適した方法を選択することである。
検証のための試料の選択:試料調製法が開発されたら、既知の遺伝子型およびハプロタイプを有する追加的な試料の拡張セットを解析する。拡張データセットに対してプラットフォームを評価するために、重複、ハイブリッド、選択された欠失、および複雑な再配列などの複雑な構造を有する試料を含める。試料は、GeT-RMプロジェクト(上の「The GeT-RMコホート」を参照されたい)から選択される。これらの細胞株およびデータにより、新規のロングリード配列データを現行の絶対的基準と対照して評価することが可能になるので、独特のリソースがもたらされる。この提唱のために、これらの細胞株のサブセットは、LCL細胞株から取得された。細胞株リポジトリ由来のおよび既存の共同研究による他の関連性のある変異体およびハプロタイプを特徴付けるための追加的な試料を得る。追加的な試料を用いて方法体系をさらに検証するために、全ゲノム配列決定を含め、広範囲にわたって特徴付けられているNIST Coriellコホート由来の追加的な細胞株を利用する。さらに、全血および唾液を含めた、典型的な診断用検体を代表する追加的な試料型を取得する。重複、欠失、ハイブリッドおよびタンデム配置を表す全部で48の細胞株をこの目的での配列決定のために選択する。解析を2連で、合計96の配列決定された試料について行う。
変異体コーリング、CNVコーリング、およびフェージング:ロングリードONTデータのために特別に開発されたソフトウェアパッケージを使用する。Clairは、変異体の型、接合性、代替対立遺伝子および挿入/欠失の長さを予測するためのマルチタスク5層畳み込みニューラルネットワークモデルであるClairvoyanteに対する最新のアップデートである。最近開発された追加的なパッケージはMegalodonである。Megalodonの機能性は、情報量の多いニューラルネットワーク塩基コーリングを参照配列に繋げることに重点が置かれている。Nanopore技術の性能特性が最近Bowdenらによって標準の参照試料を使用した全ゲノム配列決定について評価された。82×カバレッジでのコンセンサス正確度は99.9%であったが、データからはこのプラットフォームの現行の限定もいくつか示されている。提唱されているのはほんの小さな標的化される領域を配列決定することであるので、また、領域を極めて深く配列決定する能力を考慮すると、現行の解析プラットフォームにより、標的化される配列の十分に正確なデータが生じることが予想される。今後のソフトウェア開発もモニタリングし、新しい方法が利用可能になり次第、それを利用する。
コンセンサスデータとの比較:データをGeT-RMコンセンサス結果(全てのプラットフォームからの結果、ならびに専門家チームによる変異体の精査に基づく)と比較する。ハプロタイプコーリングSNPおよびCNVについての一致を決定し、ハイブリッドハプロタイプの配列の特色を同定する能力を評価し、代謝型の状態を決定するための一致を測定する。次に、追加的な変異体をGeT-RMプロジェクトからの遺伝子型決定データと比較する。データをフェージング情報(例えば、決定されたハプロタイプ)と併せて解析して、フェージングされた遺伝子型決定データが結果と一致するかどうかを決定する。なぜなら、これにより、非帰属フェージング情報がもたらされるからである。最後に、配列決定単独で同定される任意の追加的な変異体を同定する。CYP2D6とその偽遺伝子の間の配列類似性に関する探索的配列比較も実施する。
予測される問題:問題の1つは、配列決定プラットフォームの全体的な正確度に関する。最初の手法は、極めて深く配列決定することである。この手法により、非系統的な配列決定の誤りを決定することは可能になるはずであるが、プラットフォームの技術的制約に起因する固有の誤りを決定することはより難しい。CYP2D6参照試料のコンセンサスデータとの比較により、この影響を推定することが可能になる。さらに、ONTプラットフォームおよび改善された配列解析方法に関するさらなるベンチマーク試験により、ロングリードデータについての配列アノテーションが増大することが予測される。
今後の方向:薬理遺伝学においては、CYP2D6は最も広く試験されている遺伝子の1つとして突出しているが、一方で、現行の試験技術を使用した解析の技術的難易度が高い。最終目的は、不完全であり誤りを生じやすい現行のプラットフォームから置き換えることが可能な統一的な臨床試験法を開発することである。本出願は、CRISPRに基づく配列標的化、革新的な断片富化およびロングリードシーケンシングが実行可能な手法であることの概念実証としての機能を果たす。
(実施例5)
解析のための特定のゲノム遺伝子座の標的化
この手法では、PCRまたはオリゴヌクレオチドハイブリダイゼーションなどの伝統的な方法と比較して、目的の領域(ROI)のみの標的化されたカットを行うためにCRISPR/CAS9系と遺伝子座特異的ガイドRNAを使用する。富化領域選択およびsgRNA設計の新規の手法により、高度に類似した偽遺伝子および反復領域を含む遺伝子座全体を捕捉することが可能になる。そのような領域の例が図1に示されている。
現行の問題
反復領域(例えば、REP6など)を含み、近接する偽遺伝子と高い配列類似性を共有するCYP2D6などの高度に多型の遺伝子に対する一般的なDNA抽出方法体系および配列決定手法には多くの欠点がある。これらの問題としては、PCRにより導入される誤り、PCRで捕捉可能なサイズの限定、オフターゲットアレイハイブリダイゼーション、多数のアッセイが必要なこと(例えば、配列決定+qPCRを用いたCNV解析)、オフターゲットアラインメント、変異体フェージングの欠如ならびに金銭的負担および時間的負担が大きいことが挙げられる。図6では、NGSにより配列決定された伝統的に調製されたライブラリー6例のIGVアラインメントが強調されている。これらのライブラリー(A~F)はCYP2D6長距離PCR(XL-PCR)アンプリコンから生成された。アンプリコンを、NGS解析の前に断片化(100~300bp)、アダプターライゲーション、およびPCR増幅に供した。この手法にはいくつかの限定がある。第1に、CYP2D6について示されている通り、各試料中のCYP2D6遺伝子を増幅するために、CYP2D6のコピー数の状態およびハイブリッド対立遺伝子が存在するか否かがXL-PCRの前に分かっていなければならない。正常な対立遺伝子、重複対立遺伝子、欠失対立遺伝子およびハイブリッド対立遺伝子それぞれに対して特異的なプライマーを使用しなければならない。これにはNGSの前に追加的なコピー数アッセイを実施する必要がある。さらに、XL-PCR増幅時間は一般には標的アンプリコンの長さ1kb当たり0.5~1時間である。
ショートリード配列データの解析は、フェージング能力の低下によっても妨害され、また、高度に類似した偽遺伝子または相同な領域(例えば、図1に示されている通り、CYP2D6と94%類似したCYP2D7偽遺伝子)とのオフターゲットアラインメントを起こしやすい。さらに、同じ遺伝子の異なるハプロタイプは、偽遺伝子との類似性のレベルが異なり得、変異体を正しくアラインメントすることができない。
PCRフリーライブラリーには、従来のPCRに基づく手法と比べて著しい利益がある。PCRフリーライブラリーではPCR由来の配列の誤りが導入される潜在性が取り除かれ、最大PCR産物サイズの現行の限定が克服される。XL-PCR反応時間が除かれ、これは著しい時間の短縮を表し、また、この手法ではヘテロ接合性変異体フェージングおよびコピー数変異(CNV)の検出が可能になる。
sgRNAの設計
上記の通り、CYP2D6遺伝子座の複雑で高度に多型の性質に起因して、従来のPCRおよびアレイに基づく技術では、CNV解析およびSNP解析の両方のために多数のアッセイを実施する必要がある。抽出および試料の取扱いの間のDNAせん断に起因して、富化のためのインタクトな標的領域の量を最大にするために、目的の遺伝子を捕捉するために直感的に最小の可能性のあるCRISPR/Cas9標的領域を選択する。しかし、CYP2D6遺伝子のみを標的とするCRISPR/Cas9手法では、検出される対立遺伝子の少なくとも20%を構成する、D6/D7ハイブリッド対立遺伝子またはCYP2D6重複事象などの構造変異を含有する対立遺伝子を捕捉することができない。妥当なガイドRNA設計のための高度に複雑な要件の例が図7A~7Cに示されている。
第1の設計の限定は、Cas9複合体をROIにターゲティングするためのRNAをCYP2D6遺伝子自体の近くに設計することができないことである。これには、2つの主要な理由がある。第1の理由は、CYP2D6に隣接するCYP2D7と同一ではない独特の配列の部位が限定されていることである。そのような独特の配列の部位は、十分に機能せず重要なプロモーター領域の変異を捕捉することができない反復領域を含有する。第2の理由は、CYP2D6 CNVまたはD6/D7もしくはD7/D6ハイブリッド対立遺伝子が存在する場合、追加的なカットが生じ、正確なCNV解析および配列アラインメントができなくなることである(図7A)。CYP2D7およびCYP2D8の付近をカットする手法の同様の限定がそれぞれ図7Bおよび図7Cに示されている。
これらの限定を克服するために、CYP2D6、CYP2D7およびCYP2D8のいずれも包含する領域に隣接する、それでもなお長距離配列解析のための妥当なサイズのカット断片を生成する独特の配列を同定した。これらの独特の領域を標的とするsgRNAを設計することにより、1つのCRISPR/Cas9切断反応を実施して、CYP2D6/CYP2D7/CYP2D8領域全体を単離する(図8)。さらに、下流の適用に応じて、設計は、sgRNAがROIの5’末端を標的とするものであるのかまたは3’末端を標的するものであるのかに応じて正しい鎖(+または-)を標的とするものでなければならない。試験されるsgRNA配列の非限定的な例を以下の表2に示す。CYP2D6は-鎖にコードされるが、ガイドRNAの位置(上流または下流)は+鎖に対して参照される。染色体上の位置が低い配列はさらに上流であるとみなされ、染色体上の位置が高い配列は下流であるとみなされる。
表2. ガイドRNA配列
表2. ガイドRNA配列
sgRNAの性能解析および検証
sgRNAの特異性および有効性を確認するために、標的化されるsgRNA結合部位を含有するXL-PCR産物をgDNAから生成した。XL-PCR産物を、Cas9+sgRNAなし(もしくはオフターゲットsgRNA)またはCas9+目的のsgRNAと一緒にインキュベートした。図9Aは、多数の反応時点における2つの異なるsgRNA(T_1およびT_2)のカット効率を示す代表的なアガロースゲルを示す。Cas9およびsgRNAと一緒にインキュベートした全てのPCR産物が切断されて、予測されたサイズのDNA断片が生じたが、異なるsgRNAでは異なる程度の切断効率が示された。
XL-PCRアンプリコンの切断効率の決定後、ゲノムDNAに対する切断効率を解析した。これは、特異的なsgRNAを用いたCas媒介性カットを実施し、次いで、カットされたDNAに対して定量的PCR反応を実施することによって行った。予測されるsgRNA標的カット部位の両側に対してプライマーを設計した。Cas9反応または未カット対照のいずれかからの総ゲノムDNA100ngに対してPCR反応を実行した。DNAが妥当な部位で切断された場合、未カット対照試料(例えば、オフターゲット領域に対するsgRNAを使用したCas9反応)で生成されるPCR産物の量と比較してPCR産物の減少が観察される。図9Bおよび図9Cに示されている通り、この手法を使用して、sgRNAによりゲノムDNA内の所望のROIを標的化することができたかどうかを決定し、そのカットの効率を決定した。CYP2D6遺伝子全体のXL-PCRにより、カットと未カット対照の間に差異は示されなかった。これにより、反応にわたってカット部位において観察されたPCR産物の量の減少がDNAのランダムなカットに起因するのではなく、これらの特定の領域の標的化Cas9媒介性カットに起因することが示される。
高分子量(HMW)DNAの単離
長いセグメント(≧50kb)の高分子量ゲノム(HMW)DNAの単離により、PCR増幅を伴わずに配列決定ライブラリーを生成することが可能になる。図10に示されている通り、HMW DNAを所内でリンパ芽球細胞(18959および19213)からNanobind CCB Dig DNA kit(Circulomics、Madison Wi)を使用して抽出した。抽出されたDNAを2%アガロースゲルに泳動し、サイズをラムダHINDIIIラダー(上のバンド、23.1kb)、ラムダDNA(48.5kb)、およびCorriel Instituteから取得した以前に抽出されたゲノムDNA(代替の方法体系によって抽出されたもの)と比較した。所内で抽出したDNAのサイズは他の方法体系によって抽出されたDNAよりも有意に大きく(例としてCoriell gDNA 18996)、大多数の実行が48.5kbのラムダDNAを上回った。高分子量DNAのさらなる富化をShort Read Eliminator Kit(Circulomics、Madison Wi)を用いて行った。
CRISPR/Cas9富化およびライブラリー調製
上記のsgRNAを用いたCRISPR/Cas9富化をNanopore Cas媒介性プロトコール(VNR_9084_v109_revK_04Dec2018)の改変バージョンを使用して実施した。プロセスに使用するsgRNAの体積および濃度の改変を行って最適な結果を達成した(具体的にはsgRNA当たり33.3μlのsgRNA(3μM))。アンプリコンを使用し、ライゲーションプロトコール(SQK-LSK109)によってアダプターをライゲーションし、配列決定のための調製されたライブラリーにMinION配列決定プラットフォーム(Oxford Nanopore、UK)を実行し、データ解析を実施した。
概念実証
CYP2D6-CYP2D7-CYP2D8領域全体(chr22:42,122,115-42,161,317)を富化させるsgRNAを利用した配列決定により、3つの重要な事柄が確認される:(1)このsgRNA設計により標的領域全体が首尾よく捕捉されること、(2)この戦略によりROI全体をオフターゲットリードと比べて有意に富化させることが可能になること、および(3)この方法によりROI全体(約40kb)を首尾よくロングリード配列決定する能力がもたらされること。
図11Aに示されている通り、ゲノム全体で、標的化されるROIを含有する22番染色体(chr22)についてのみ著しい配列富化が観察された。他の全てのゲノム領域では最小のカバレッジが示された。chr22のさらなる解析により、ROIを含有する領域のみが富化され、>10×カバレッジを有することが見いだされた(図11B)。全部で、chr22にマッピングされた176リードのうち121リードがROIとアラインメントされる全長リードであった(68.75%)。全ての22番染色体リードについてのリード当たりの平均正確度および同一性が図11Bに示されている。
実行アラインメントおよび時間
アラインメントされたリード長のメジアンは約39.35kb(図12A)であり、これにより、標的設計サイズの配列決定およびアラインメントが上首尾であったことが示される。注目すべきことに、アラインメントされたリードの全てがminIONでの配列決定の最初の2.5時間のうちに捕捉された(図12B)。これにより、本明細書に記載の方法を使用した配列決定時間を標準のロングリードシーケンシング実行時間よりも著しく短縮することができることが示される。これにはターンアラウンドタイムおよび機器のスループットの結果の両方に関して大きな価値がある。
IGV解析
配列データアラインメントのさらなるIGV解析により、シーケンスリードが正しいゲノム位置(chr22:42,122,115-42,161,317)にアラインメントされ、ROI全体にわたって均一な深さおよびカバレッジを有することが示された。図13は、標的CYP2D6領域にアラインメントされる121の38.5kbのリードのIGVアラインメントを示す。この手法の特異性をさらに精査するために、逆のDNA鎖(+または-)の標的領域におけるsgRNA富化を実施し、配列データアラインメントを元の鎖設計でのsgRNA富化と比較した。図14に示されている通り、sgRNA鎖標的に応じてCYP2D6-CYP2D7-CYP2D8領域(chr22:42,122,115-42,161,317-図の上部のアラインメントに示されている)または隣接領域(図の下部のアラインメントに示されている)のいずれかのROIにおいて100%の配列富化が生じた。設計に応じて隣接するオフターゲット領域との重複は観察されなかった。これにより、この手法の2つの極めて重要な点が実証される:(1)本発明者らの設計ROI内で著しいオフターゲットカットは生じないこと、および(2)富化手法によりROIの著しいせん断は導かれないこと。
図15は、複数の複雑な構造配置についてのsgRNA特異性を示すSashimiプロットを示す。このプロットは、4つの配列決定実行についてアラインメントされた領域を示す。実行からの配列データは、目的の領域(ROI)(chr22:42,122,115-41,161,320)が捕捉されるように設計されたsgRNAを使用したものであり、4つの異なる構造的事象:(1)1つの対立遺伝子におけるCYP2D6の欠失;(2)1つの対立遺伝子におけるCYP2D6とのタンデムなハイブリッド対立遺伝子;(3)1つの対立遺伝子における重複事象;ならびに(4)1つの対立遺伝子におけるCYP2D6の欠失および第2の対立遺伝子におけるCYP2D6の重複、を含む。このデータは、上流にCYP2D6様またはCYP2D7様領域を有するもの、および下流にCYP2D6様またはCYP2D7様領域を有するものを含めたCYP2D6 CNVまたはD6/D7またはD7/D6ハイブリッド対立遺伝子を含む組換えの全ての配向についてROIの構造的変異の富化が上首尾であったことを表すものである。存在する構造的変異にかかわらずCYP2D6の上流の領域とCYP2D8の下流の領域の間でオフターゲットのカットは生じず、これにより、図7に記載されている設計の限界が克服され、図8に記載されている手法が確認された。
(実施例6)
目的のゲノム領域を富化させるための入れ子状CRISPR-Cas9法
目的のゲノム領域を富化させるための入れ子状CRISPR-Cas9法
本実施例では、入れ子状CRISPR-Cas9手法を使用して、(例えば、複雑な)目的のゲノム領域を富化させる。この手法には、(1)目的の領域に対する富化の特異性の増大;および(2)ROIの全体的な富化を増大させるための入力DNA材料の容量の増大を含め、現行の手法に勝る多くの利点がある。図17に、本明細書に記載の入れ子状富化を実施するための概略図の例を提示する。
本実施例では、下流での使用のために望まれる量のゲノムDNAを使用してCRISPR-Cas9反応を実施する。ガイドRNAの外側のセットを、標的とする目的の領域(例えば、CYP2D6遺伝子座)の最大30kb下流および上流になるように設計する。Cas9-ガイドRNA複合体により目的のゲノム領域がゲノムDNAからカットされ、目的の領域を含有する切り出されたDNA断片の末端がブロックされる。次いで、エキソヌクレアーゼ消化を実施し、保護されていないDNA(例えば、目的の領域を含有しないDNA)を消化する。目的のゲノム領域を含有するDNA断片の末端はエキソヌクレアーゼ消化から保護されるので(例えば、結合したCas9-ガイドRNA複合体に起因する立体的な障害によって)、目的の領域を含有する切り出されたDNA断片はインタクトなまま残される。このステップにより、目的の領域の追加的な富化が可能になり、それにより、特異性、およびCasに基づく富化プロトコールの間に一般に使用されるよりも多くの量のゲノムDNA(例えば、>10μg)を使用できる能力が増大する。
エキソヌクレアーゼ消化の実施後、富化された大きな消化されなかった断片を、ロングリードシーケンシングに適したサイズの所望の目的の領域を標的とするガイドRNAの内側のセットを使用するCRISPR-Cas9反応に使用する。このステップにより、第1の富化プロトコールにさらなる特異性が付加され、下流のライブラリー生成のための目的の領域の末端が増える。
入れ子状CRISPR-Cas9手法の効率が、2つの代表的なsgRNAのセットについて図18に示されている。図18に示されている通り、内側のgRNAカット部位の10kb上流(セット1)または20kb上流(セット2)のいずれかに位置する2つの代表的な外側のgRNAのセットを使用して最初の富化を実施した。未カット試料には外側のgRNA富化を行わなかった。次いで、同じ内側のgRNAのセットをセット1、セット2、および未カット試料に使用し、ライブラリーを上記の通り調製した。図18に示されている通り、未カットに対して観察された倍数富化(fold enrichment)は、セット2についてはおよそ1.7倍、セット1についてはおよそ3.4倍であった。
本開示の好ましい実施形態が本明細書において示され、記載されているが、そのような実施形態が単に例として提供されていることは当業者には明白であろう。当業者は、本開示から逸脱することなく多数の変形、変化および置換をすぐに思いつくであろう。本明細書に記載の本開示の実施形態に対する種々の代替を本開示の実施形態の実施に使用することができることが理解されるべきである。以下の請求項により本開示の範囲が規定されること、ならびに、それにより、これらの請求項の範囲内に入る方法および構造およびそれらの均等物が包含されることが意図されている。
Claims (134)
- 目的のゲノム領域を解析(例えば、配列決定、遺伝子型決定、構造解析)する方法であって、
a)前記目的のゲノム領域を含むゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび外側のガイドRNA(gRNA)の対と接触させるステップであって、それにより、前記目的のゲノム領域を含む第1の切り出された断片を生成する、ステップと、
b)前記第1の切り出された断片を、CRISPR関連エンドヌクレアーゼおよび内側のgRNAの対と接触させるステップであって、それにより、前記目的のゲノム領域を含む第2の切り出された断片を生成する、ステップと、
c)前記第2の切り出された断片内に含有される前記目的のゲノム領域を解析するステップと
を含む、方法。 - a)の前記CRISPR関連エンドヌクレアーゼおよび前記外側のgRNAの対が前記第1の切り出された断片の5’末端および3’末端と会合し、それをブロックする、請求項1に記載の方法。
- b)の前に、a)の産物を1種または複数種のエキソヌクレアーゼと接触させるステップであって、その結果、バックグラウンドゲノムDNAが消化され、前記第1の切り出された断片は消化されない、ステップをさらに含む、請求項2に記載の方法。
- 前記1種または複数種のエキソヌクレアーゼが、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII、およびこれらの任意の組合せからなる群より選択される、前記請求項のいずれか一項に記載の方法。
- 前記外側のgRNAの対が、第1の外側のgRNAと第2の外側のgRNAとを含む、前記請求項のいずれか一項に記載の方法。
- 前記第1の外側のgRNAが、前記ゲノムDNA内に存在する第1のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記第2の外側のgRNAが、前記ゲノムDNA内に存在する第2のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む、請求項5に記載の方法。
- 前記第1のヌクレオチド配列と前記第2のヌクレオチド配列が、異なる、請求項6に記載の方法。
- 前記第1のヌクレオチド配列と前記第2のヌクレオチド配列が、前記目的のゲノム領域に隣接する、請求項7に記載の方法。
- 前記第1のヌクレオチド配列、前記第2のヌクレオチド配列、またはその両方が、前記ゲノムDNA内の、前記目的のゲノム領域から最大約100キロベース長のところに存在する、請求項8に記載の方法。
- 前記内側のgRNAの対が、第1の内側のgRNAと第2の内側のgRNAとを含む、前記請求項のいずれか一項に記載の方法。
- 前記第1の内側のgRNAが、前記ゲノムDNA内に存在する第3のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記第2の内側のgRNAが、前記ゲノムDNA内に存在する第4のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む、請求項10に記載の方法。
- 前記第3のヌクレオチド配列と前記第4のヌクレオチド配列が、異なる、請求項11に記載の方法。
- 前記第3のヌクレオチド配列と前記第4のヌクレオチド配列が、前記目的のゲノム領域に隣接する、請求項12に記載の方法。
- 前記第3のヌクレオチド配列および前記第4のヌクレオチド配列が、前記ゲノムDNA上の、前記第1のヌクレオチド配列および前記第2のヌクレオチド配列よりも前記目的のゲノム領域に近い塩基長のところに存在する、請求項6から9までまたは11から13までのいずれか一項に記載の方法。
- 前記第2の切り出された断片の塩基長が、前記第1の切り出された断片よりも短い、前記請求項のいずれか一項に記載の方法。
- 前記解析するステップが、前記第2の切り出された断片内に含有される前記目的のゲノム領域を配列決定することを含む、請求項1に記載の方法。
- 前記ゲノムDNAが、約10μgまたはそれよりも多い量で提供される、前記請求項のいずれか一項に記載の方法。
- 前記解析するステップが、前記第2の切り出された断片内に含有される前記目的のゲノム領域を遺伝子型決定することを含む、前記請求項のいずれか一項に記載の方法。
- 前記解析するステップが、前記第2の切り出された断片内に含有される前記目的のゲノム領域についての構造解析を実施することを含む、前記請求項のいずれか一項に記載の方法。
- b)の前に、前記第1の切り出された断片を単離するステップをさらに含む、前記請求項のいずれか一項に記載の方法。
- c)の前に、前記第2の切り出された断片を単離するステップをさらに含む、前記請求項のいずれか一項に記載の方法。
- DNA増幅を伴わない、前記請求項のいずれか一項に記載の方法。
- c)の前に、前記第2の切り出された断片の5’末端、3’末端、またはその両方に1つまたは複数のアダプターを付着させるステップをさらに含む、前記請求項のいずれか一項に記載の方法。
- 前記CRISPR関連エンドヌクレアーゼが、クラス1 CRISPR関連エンドヌクレアーゼまたはクラス2 CRISPR関連エンドヌクレアーゼである、前記請求項のいずれか一項に記載の方法。
- 前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10およびCsf1からなる群より選択される、請求項24に記載の方法。
- 前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13cおよびCas13dからなる群より選択される、請求項24に記載の方法。
- 前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、前記請求項のいずれか一項に記載の方法。
- 前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、前記請求項のいずれか一項に記載の方法。
- 前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項28に記載の方法。
- 前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む、請求項28または29に記載の方法。
- 前記ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない、前記請求項のいずれか一項に記載の方法。
- 前記ゲノムDNAをa)の前に制限酵素消化に供さない、前記請求項のいずれか一項に記載の方法。
- 前記目的のゲノム領域が、複雑なゲノム領域である、前記請求項のいずれか一項に記載の方法。
- 前記複雑なゲノム領域が、目的の遺伝子および1つまたは複数のその偽遺伝子を含む、請求項33に記載の方法。
- 前記1つまたは複数の偽遺伝子が、前記目的の遺伝子に対して少なくとも75%の配列同一性を有するヌクレオチド配列を含む、請求項34に記載の方法。
- 前記複雑なゲノム領域が、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む、請求項33のいずれか一項に記載の方法。
- 前記目的のゲノム領域が、高度に多型の遺伝子座である、前記請求項のいずれか一項に記載の方法。
- 前記第1の切り出された断片の長さが、少なくとも約0.06キロベースである、前記請求項のいずれか一項に記載の方法。
- 前記第1の切り出された断片の長さが、最大約200キロベースである、前記請求項のいずれか一項に記載の方法。
- 前記第2の切り出された断片の長さが、少なくとも約0.02キロベースである、前記請求項のいずれか一項に記載の方法。
- 前記第2の切り出された断片の長さが、最大約199.98キロベースである、前記請求項のいずれか一項に記載の方法。
- 前記配列決定することが、ロングリードシーケンシングを含む、前記請求項のいずれか一項に記載の方法。
- 前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項42に記載の方法。
- 前記方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない、前記請求項のいずれか一項に記載の方法。
- 多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項44に記載の方法。
- 前記ゲノムDNAが、生体試料で提供されるまたは得られる、前記請求項のいずれか一項に記載の方法。
- 前記生体試料が、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物、眼内液、母乳)または固形組織試料を含む、請求項46に記載の方法。
- 前記生体試料が、診断用試料である、請求項47に記載の方法。
- 前記目的のゲノム領域が、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座である、前記請求項のいずれか一項に記載の方法。
- 前記解析するステップが、CYP2D6の1つまたは複数の遺伝的変異を同定することを含む、請求項49に記載の方法。
- 前記遺伝的変異に基づいて、対象がCYP2D6機能の低下、喪失、または増大を有すると同定するステップをさらに含む、請求項50に記載の方法。
- 前記同定するステップに基づいて、前記対象に対して処置または代替処置を推奨するステップをさらに含む、請求項51に記載の方法。
- 前記対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、前記対象に対して代替処置を推奨する、請求項51に記載の方法。
- 前記同定するステップに基づいて、前記対象に対して治療薬のある投薬量を推奨するステップをさらに含む、請求項51に記載の方法。
- 前記対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、治療薬の投薬量を変更する、請求項51に記載の方法。
- 前記外側のgRNAの対、前記内側のgRNAの対、またはその両方が、配列番号1~418のいずれか1つから選択されるgRNAを含む、前記請求項のいずれか一項に記載の方法。
- 目的のゲノム領域を解析するためのキットであって、
a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;
b)
i)ゲノムDNA内の前記目的のゲノム領域の上流に存在する第1のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1の外側のgRNAと、
ii)ゲノムDNA内の前記目的のゲノム領域の下流に存在する第2のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2の外側のgRNAと
を含む外側のgRNAの対
c)
iii)ゲノムDNA内の前記目的のゲノム領域の上流に存在する第3のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1の内側のgRNAと、
iv)ゲノムDNA内の前記目的のゲノム領域の下流に存在する第4のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2の内側のgRNAと
を含む内側のgRNAの対
を含み、前記第3のヌクレオチド配列および前記第4のヌクレオチド配列が、前記ゲノムDNA上の、前記第1のヌクレオチド配列および前記第2のヌクレオチド配列よりも前記目的のゲノム領域に近い塩基長のところに存在する、
キット。 - 1種または複数種のエキソヌクレアーゼをさらに含む、請求項57に記載のキット。
- 前記1種または複数種のエキソヌクレアーゼが、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII、およびこれらの任意の組合せからなる群より選択される、請求項58に記載のキット。
- 前記CRISPR関連エンドヌクレアーゼが、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである、請求項57から59までのいずれか一項に記載のキット。
- 前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10およびCsf1からなる群より選択される、請求項60に記載のキット。
- 前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13cおよびCas13dからなる群より選択される、請求項60に記載のキット。
- 前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、請求項57から62までのいずれか一項に記載のキット。
- 前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、請求項57から63までのいずれか一項に記載のキット。
- 前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項64に記載のキット。
- 前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む、請求項64または65に記載のキット。
- 前記目的のゲノム領域が、CYP2D6、CYP2D7、およびCYP2D8を含むゲノム遺伝子座である、請求項57から66までのいずれか一項に記載のキット。
- 前記第1の外側のガイドRNA、前記第1の内側のガイドRNA、またはその両方が、配列番号3~12、17~26、68~77、82~214、および344~418のいずれか1つのヌクレオチド配列を含む、請求項67に記載のキット。
- 前記第2の外側のガイドRNA、前記第2の内側のガイドRNA、またはその両方が、配列番号1、2、13~16、27~67、78~81、および215~343のいずれか1つのヌクレオチド配列を含む、請求項67または68に記載のキット。
- 入れ子状CRISPR反応に前記キットを使用するための指示をさらに含む、請求項57から69までのいずれか一項に記載のキット。
- 前記目的のゲノム領域をゲノムDNAから切り出すために前記キットを使用するための指示をさらに含む、請求項57から70までのいずれか一項に記載のキット。
- 目的のゲノム領域を解析するためのシステムであって、
(a)
(i)前記目的のゲノム領域を含むゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび外側のガイドRNA(gRNA)の対と接触させるステップであって、それにより、前記目的のゲノム領域を含む第1の切り出された断片を生成する、ステップと、
(ii)前記第1の切り出された断片を、CRISPR関連エンドヌクレアーゼおよび内側のgRNAの対と接触させるステップであって、それにより、前記目的のゲノム領域を含む第2の切り出された断片を生成する、ステップと、
(iii)前記第2の切り出された断片内に含有される前記目的のゲノム領域を解析するステップと
を含む方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;ならびに、
(b)前記少なくとも1つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、前記データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサ
を含むシステム。 - 前記出力が、レポートである、請求項72に記載のシステム。
- 前記出力が、前記目的のゲノム領域の遺伝子型である、請求項72または73に記載のシステム。
- 前記出力が、前記目的のゲノム領域の遺伝子配列である、請求項72または73に記載のシステム。
- 前記出力が、前記目的のゲノム領域の構造解析である、請求項72または73に記載のシステム。
- 前記解析するステップが、前記目的のゲノム領域を遺伝子型決定することを含む、請求項72から76までのいずれか一項に記載のシステム。
- 前記解析するステップが、前記目的のゲノム領域の構造解析を実施することを含む、請求項72から77までのいずれか一項に記載のシステム。
- 前記解析するステップが、前記目的のゲノム領域を配列決定することを含む、請求項72から78までのいずれか一項に記載のシステム。
- 前記配列決定することが、ロングリードシーケンシングを含む、請求項79に記載のシステム。
- 前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項80に記載のシステム。
- (i)の前記CRISPR関連エンドヌクレアーゼおよび前記外側のgRNAの対が、前記第1の切り出された断片の5’末端および3’末端と会合し、それをブロックする、請求項72から81までのいずれか一項に記載のシステム。
- (ii)の前に、(i)の産物を1種または複数種のエキソヌクレアーゼと接触させるステップであって、その結果、バックグラウンドゲノムDNAが消化され、前記第1の切り出された断片は消化されない、ステップをさらに含む、請求項82に記載のシステム。
- 前記1種または複数種のエキソヌクレアーゼが、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII、およびこれらの任意の組合せからなる群より選択される、請求項72から83までのいずれか一項に記載のシステム。
- 前記外側のgRNAの対が、第1の外側のgRNAと第2の外側のgRNAとを含む、請求項72から84までのいずれか一項に記載のシステム。
- 前記第1の外側のgRNAが、前記ゲノムDNA内に存在する第1のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記第2の外側のgRNAが、前記ゲノムDNA内に存在する第2のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む、請求項85に記載のシステム。
- 前記第1のヌクレオチド配列と前記第2のヌクレオチド配列が、異なる、請求項86に記載のシステム。
- 前記第1のヌクレオチド配列と前記第2のヌクレオチド配列が、前記目的のゲノム領域に隣接する、請求項87に記載のシステム。
- 前記第1のヌクレオチド配列、前記第2のヌクレオチド配列、またはその両方が、前記ゲノムDNA内の、前記目的のゲノム領域から最大約100キロベース長のところに存在する、請求項88に記載のシステム。
- 前記内側のgRNAの対が、第1の内側のgRNAと第2の内側のgRNAとを含む、請求項72から89までのいずれか一項に記載のシステム。
- 前記第1の内側のgRNAが、前記ゲノムDNA内に存在する第3のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記第2の内側のgRNAが、前記ゲノムDNA内に存在する第4のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む、請求項90に記載のシステム。
- 前記第3のヌクレオチド配列と前記第4のヌクレオチド配列が、異なる、請求項91に記載のシステム。
- 前記第3のヌクレオチド配列と前記第4のヌクレオチド配列が、前記目的のゲノム領域に隣接する、請求項92に記載のシステム。
- 前記第3のヌクレオチド配列および前記第4のヌクレオチド配列が、前記ゲノムDNA上の、前記第1のヌクレオチド配列および前記第2のヌクレオチド配列よりも前記目的のゲノム領域に近い塩基長のところに存在する、請求項91から93までのいずれか一項に記載のシステム。
- 前記第2の切り出された断片の塩基長が、前記第1の切り出された断片よりも短い、請求項72から94までのいずれか一項に記載のシステム。
- 前記解析するステップが、前記第2の切り出された断片内に含有される前記目的のゲノム領域を配列決定することを含む、請求項72から95までのいずれか一項に記載のシステム。
- 前記ゲノムDNAが、約10μgまたはそれよりも多い量で提供される、請求項72から96までのいずれか一項に記載のシステム。
- 前記解析するステップが、前記第2の切り出された断片内に含有される前記目的のゲノム領域を遺伝子型決定することを含む、請求項72から97までのいずれか一項に記載のシステム。
- 前記解析するステップが、前記第2の切り出された断片内に含有される前記目的のゲノム領域についての構造解析を実施することを含む、請求項72から98までのいずれか一項に記載のシステム。
- (ii)の前に、前記第1の切り出された断片を単離するステップをさらに含む、請求項72から99までのいずれか一項に記載のシステム。
- (iii)の前に、前記第2の切り出された断片を単離するステップをさらに含む、請求項72から100までのいずれか一項に記載のシステム。
- 前記方法が、DNA増幅を伴わない、請求項72から101までのいずれか一項に記載のシステム。
- (iii)の前に、前記第2の切り出された断片の5’末端、3’末端、またはその両方に1つまたは複数のアダプターを付着させるステップをさらに含む、請求項72から102までのいずれか一項に記載のシステム。
- 前記CRISPR関連エンドヌクレアーゼが、クラス1 CRISPR関連エンドヌクレアーゼまたはクラス2 CRISPR関連エンドヌクレアーゼである、請求項72から103までのいずれか一項に記載のシステム。
- 前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10およびCsf1からなる群より選択される、請求項104に記載のシステム。
- 前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13cおよびCas13dからなる群より選択される、請求項104に記載のシステム。
- 前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、請求項72から106までのいずれか一項に記載のシステム。
- 前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、請求項72から107までのいずれか一項に記載のシステム。
- 前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項108に記載のシステム。
- 前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694AおよびM698Aからなる群より選択される1つまたは複数の点突然変異を含む、請求項108または109に記載のシステム。
- 前記ゲノムDNAに対して(i)の前に断片化も消化もせん断も行わない、請求項72から110までのいずれか一項に記載のシステム。
- 前記ゲノムDNAを(i)の前に制限酵素消化に供さない、請求項72から111までのいずれか一項に記載のシステム。
- 前記目的のゲノム領域が、複雑なゲノム領域である、請求項72から112までのいずれか一項に記載のシステム。
- 前記複雑なゲノム領域が、目的の遺伝子および1つまたは複数のその偽遺伝子を含む、請求項113に記載のシステム。
- 前記1つまたは複数の偽遺伝子が、前記目的の遺伝子に対して少なくとも75%の配列同一性を有するヌクレオチド配列を含む、請求項114に記載のシステム。
- 前記複雑なゲノム領域が、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む、請求項113に記載のシステム。
- 前記目的のゲノム領域が、高度に多型の遺伝子座である、請求項72から116までのいずれか一項に記載のシステム。
- 前記第1の切り出された断片の長さが、少なくとも約0.06キロベースである、請求項72から117までのいずれか一項に記載のシステム。
- 前記第1の切り出された断片の長さが、最大約200キロベースである、請求項72から118までのいずれか一項に記載のシステム。
- 前記第2の切り出された断片の長さが、少なくとも約0.02キロベースである、請求項72から119までのいずれか一項に記載のシステム。
- 前記第2の切り出された断片の長さが、最大約199.98キロベースである、請求項72から120までのいずれか一項に記載のシステム。
- 前記方法が、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない、請求項72から121までのいずれか一項に記載のシステム。
- 前記方法が、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項122に記載のシステム。
- 前記ゲノムDNAが、生体試料で提供されるまたは得られる、請求項72から123までのいずれか一項に記載のシステム。
- 前記生体試料が、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物、眼内液、母乳)または固形組織試料を含む、請求項124に記載のシステム。
- 前記生体試料が、診断用試料である、請求項124に記載のシステム。
- 前記目的のゲノム領域が、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座である、請求項72から126までのいずれか一項に記載のシステム。
- 前記解析するステップが、CYP2D6の1つまたは複数の遺伝的変異を同定することを含む、請求項127に記載のシステム。
- 前記出力が、前記遺伝的変異に基づいた、対象がCYP2D6機能の低下、喪失、または増大を有することの同定を含む、請求項128に記載のシステム。
- 前記出力が、前記同定に基づいた前記対象に対する処置または代替処置の推奨を含む、請求項129に記載のシステム。
- 前記対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、前記出力が、前記対象に対する代替処置の推奨をさらに含む、請求項129に記載のシステム。
- 前記出力が、前記同定に基づいた前記対象に対する治療薬のある投薬量の推奨をさらに提供するものである、請求項129に記載のシステム。
- 前記対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、前記出力が、治療薬の投薬量を変更するための推奨をさらに含む、請求項129に記載のシステム。
- 前記外側のgRNAの対、前記内側のgRNAの対、またはその両方が、配列番号1~418のいずれか1つから選択されるgRNAを含む、請求項72から133までのいずれか一項に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163171387P | 2021-04-06 | 2021-04-06 | |
US63/171,387 | 2021-04-06 | ||
PCT/US2022/023483 WO2022216711A1 (en) | 2021-04-06 | 2022-04-05 | Methods and systems for analyzing complex genomic regions |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024513236A true JP2024513236A (ja) | 2024-03-22 |
Family
ID=83545695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023561289A Pending JP2024513236A (ja) | 2021-04-06 | 2022-04-05 | 複雑なゲノム領域を解析するための方法およびシステム |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240209442A1 (ja) |
EP (1) | EP4320266A1 (ja) |
JP (1) | JP2024513236A (ja) |
CN (1) | CN117441026A (ja) |
AU (1) | AU2022255315A1 (ja) |
CA (1) | CA3216210A1 (ja) |
WO (1) | WO2022216711A1 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8688385B2 (en) * | 2003-02-20 | 2014-04-01 | Mayo Foundation For Medical Education And Research | Methods for selecting initial doses of psychotropic medications based on a CYP2D6 genotype |
US20200157599A9 (en) * | 2017-06-13 | 2020-05-21 | Genetics Research, Llc, D/B/A Zs Genetics, Inc. | Negative-positive enrichment for nucleic acid detection |
EP4041915A4 (en) * | 2019-10-07 | 2023-10-18 | RPRD Diagnostics, LLC | METHODS AND SYSTEMS FOR ANALYZING COMPLEX GENOMIC REGIONS |
WO2021252867A2 (en) * | 2020-06-12 | 2021-12-16 | Qiagen Sciences, Llc | Methods of enriching for target nucelic acid molecules and uses thereof |
-
2022
- 2022-04-05 AU AU2022255315A patent/AU2022255315A1/en active Pending
- 2022-04-05 WO PCT/US2022/023483 patent/WO2022216711A1/en active Application Filing
- 2022-04-05 CN CN202280040654.XA patent/CN117441026A/zh active Pending
- 2022-04-05 US US18/554,174 patent/US20240209442A1/en active Pending
- 2022-04-05 JP JP2023561289A patent/JP2024513236A/ja active Pending
- 2022-04-05 CA CA3216210A patent/CA3216210A1/en active Pending
- 2022-04-05 EP EP22785301.7A patent/EP4320266A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4320266A1 (en) | 2024-02-14 |
AU2022255315A1 (en) | 2023-10-05 |
CA3216210A1 (en) | 2022-10-13 |
US20240209442A1 (en) | 2024-06-27 |
WO2022216711A1 (en) | 2022-10-13 |
CN117441026A (zh) | 2024-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11932910B2 (en) | Combinatorial DNA screening | |
US11492656B2 (en) | Haplotype resolved genome sequencing | |
KR102665592B1 (ko) | 유전적 변이의 비침습 평가를 위한 방법 및 프로세스 | |
US9411937B2 (en) | Detecting and classifying copy number variation | |
KR20190117529A (ko) | 이종 분자 길이를 가진 고유 분자 인덱스 세트의 생성 및 오류 수정 방법 및 시스템 | |
US11041200B2 (en) | Systems and methods for next generation sequencing uniform probe design | |
KR20220061271A (ko) | 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법 | |
JP2014534507A (ja) | 遺伝的変異の非侵襲的評価のための方法およびプロセス | |
Wieben et al. | Amplification-free long-read sequencing of TCF4 expanded trinucleotide repeats in Fuchs Endothelial Corneal Dystrophy | |
US20240233871A9 (en) | Methods for the non-invasive detection and monitoring of therapeutic nucleic acid constructs | |
US20240011073A1 (en) | Methods and systems for analyzing complex genomic regions | |
JP2024513236A (ja) | 複雑なゲノム領域を解析するための方法およびシステム | |
US20230235320A1 (en) | Methods and compositions for analyzing nucleic acid | |
Auzanneau et al. | Feasibility of high-throughput sequencing in clinical routine cancer care: lessons from the cancer pilot project of the France Genomic Medicine 2025 plan | |
Amr et al. | Targeted Hybrid Capture for Inherited Disease Panels | |
WO2024118500A2 (en) | Methods for detecting and treating ovarian cancer | |
Salinas | The utility of long read sequencing for the discovery of genomic retroviral insertions and for hybrid genome assembly |