JP2024518095A - 核酸シーケンシングのためのライブラリーを作製する方法 - Google Patents
核酸シーケンシングのためのライブラリーを作製する方法 Download PDFInfo
- Publication number
- JP2024518095A JP2024518095A JP2023570212A JP2023570212A JP2024518095A JP 2024518095 A JP2024518095 A JP 2024518095A JP 2023570212 A JP2023570212 A JP 2023570212A JP 2023570212 A JP2023570212 A JP 2023570212A JP 2024518095 A JP2024518095 A JP 2024518095A
- Authority
- JP
- Japan
- Prior art keywords
- dna
- target
- protein
- sample
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 276
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 258
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 258
- 238000000034 method Methods 0.000 title claims abstract description 221
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 107
- 108020004414 DNA Proteins 0.000 claims abstract description 399
- 102000053602 DNA Human genes 0.000 claims abstract description 155
- 230000027455 binding Effects 0.000 claims abstract description 95
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 88
- 108010020764 Transposases Proteins 0.000 claims abstract description 81
- 102000008579 Transposases Human genes 0.000 claims abstract description 81
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 79
- 239000000203 mixture Substances 0.000 claims abstract description 75
- 102000007474 Multiprotein Complexes Human genes 0.000 claims abstract description 72
- 108010085220 Multiprotein Complexes Proteins 0.000 claims abstract description 72
- 230000004568 DNA-binding Effects 0.000 claims abstract description 56
- 239000000523 sample Substances 0.000 claims description 232
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 192
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 131
- 230000003321 amplification Effects 0.000 claims description 129
- 125000003729 nucleotide group Chemical group 0.000 claims description 96
- 239000002773 nucleotide Substances 0.000 claims description 93
- 239000012634 fragment Substances 0.000 claims description 90
- 235000018102 proteins Nutrition 0.000 claims description 78
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 62
- 238000006243 chemical reaction Methods 0.000 claims description 55
- 108020001507 fusion proteins Proteins 0.000 claims description 54
- 102000037865 fusion proteins Human genes 0.000 claims description 53
- 238000003752 polymerase chain reaction Methods 0.000 claims description 46
- 239000011541 reaction mixture Substances 0.000 claims description 46
- 210000001519 tissue Anatomy 0.000 claims description 33
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 30
- 108020005004 Guide RNA Proteins 0.000 claims description 28
- 108010012306 Tn5 transposase Proteins 0.000 claims description 26
- 239000012472 biological sample Substances 0.000 claims description 25
- 230000035772 mutation Effects 0.000 claims description 25
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 22
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 22
- 201000010099 disease Diseases 0.000 claims description 21
- 102100031780 Endonuclease Human genes 0.000 claims description 20
- 108010042407 Endonucleases Proteins 0.000 claims description 20
- 239000000126 substance Substances 0.000 claims description 20
- 101710163270 Nuclease Proteins 0.000 claims description 19
- 238000010459 TALEN Methods 0.000 claims description 17
- 230000002950 deficient Effects 0.000 claims description 17
- 210000002966 serum Anatomy 0.000 claims description 15
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 14
- 238000005516 engineering process Methods 0.000 claims description 14
- 210000002381 plasma Anatomy 0.000 claims description 14
- 102000004190 Enzymes Human genes 0.000 claims description 13
- 108090000790 Enzymes Proteins 0.000 claims description 13
- 230000004547 gene signature Effects 0.000 claims description 13
- 235000004252 protein component Nutrition 0.000 claims description 13
- 108010088141 Argonaute Proteins Proteins 0.000 claims description 12
- 102000008682 Argonaute Proteins Human genes 0.000 claims description 12
- 238000006073 displacement reaction Methods 0.000 claims description 12
- 230000002068 genetic effect Effects 0.000 claims description 12
- 239000013612 plasmid Substances 0.000 claims description 12
- 206010028980 Neoplasm Diseases 0.000 claims description 11
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 11
- 208000026350 Inborn Genetic disease Diseases 0.000 claims description 10
- 238000011529 RT qPCR Methods 0.000 claims description 10
- 208000016361 genetic disease Diseases 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 10
- 210000001124 body fluid Anatomy 0.000 claims description 9
- 201000011510 cancer Diseases 0.000 claims description 9
- 238000007397 LAMP assay Methods 0.000 claims description 8
- 108060004795 Methyltransferase Proteins 0.000 claims description 8
- 206010036790 Productive cough Diseases 0.000 claims description 8
- 102000018120 Recombinases Human genes 0.000 claims description 8
- 108010091086 Recombinases Proteins 0.000 claims description 8
- 230000007613 environmental effect Effects 0.000 claims description 8
- 230000001404 mediated effect Effects 0.000 claims description 8
- 238000003753 real-time PCR Methods 0.000 claims description 8
- 210000003802 sputum Anatomy 0.000 claims description 8
- 208000024794 sputum Diseases 0.000 claims description 8
- 108020000946 Bacterial DNA Proteins 0.000 claims description 7
- 108020000949 Fungal DNA Proteins 0.000 claims description 7
- 108020005196 Mitochondrial DNA Proteins 0.000 claims description 7
- 108020003633 Protozoan DNA Proteins 0.000 claims description 7
- 108020005202 Viral DNA Proteins 0.000 claims description 7
- 239000007850 fluorescent dye Substances 0.000 claims description 7
- 238000003780 insertion Methods 0.000 claims description 7
- 230000037431 insertion Effects 0.000 claims description 7
- 244000052769 pathogen Species 0.000 claims description 7
- 230000001717 pathogenic effect Effects 0.000 claims description 7
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 6
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 6
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 6
- 230000003115 biocidal effect Effects 0.000 claims description 6
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 6
- 210000000416 exudates and transudate Anatomy 0.000 claims description 6
- 238000006467 substitution reaction Methods 0.000 claims description 6
- 238000013518 transcription Methods 0.000 claims description 6
- 230000035897 transcription Effects 0.000 claims description 6
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 claims description 5
- 201000003883 Cystic fibrosis Diseases 0.000 claims description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 5
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 5
- 235000004279 alanine Nutrition 0.000 claims description 5
- XMQFTWRPUQYINF-UHFFFAOYSA-N bensulfuron-methyl Chemical compound COC(=O)C1=CC=CC=C1CS(=O)(=O)NC(=O)NC1=NC(OC)=CC(OC)=N1 XMQFTWRPUQYINF-UHFFFAOYSA-N 0.000 claims description 5
- 210000005259 peripheral blood Anatomy 0.000 claims description 5
- 239000011886 peripheral blood Substances 0.000 claims description 5
- 240000007019 Oxalis corniculata Species 0.000 claims description 4
- 125000000129 anionic group Chemical group 0.000 claims description 4
- 210000001165 lymph node Anatomy 0.000 claims description 4
- 230000007935 neutral effect Effects 0.000 claims description 4
- 230000010076 replication Effects 0.000 claims description 4
- 230000000241 respiratory effect Effects 0.000 claims description 4
- 238000005096 rolling process Methods 0.000 claims description 4
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 claims description 3
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 claims description 3
- 208000001914 Fragile X syndrome Diseases 0.000 claims description 3
- 208000027472 Galactosemias Diseases 0.000 claims description 3
- 208000018565 Hemochromatosis Diseases 0.000 claims description 3
- 208000031220 Hemophilia Diseases 0.000 claims description 3
- 208000009292 Hemophilia A Diseases 0.000 claims description 3
- 208000023105 Huntington disease Diseases 0.000 claims description 3
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 claims description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 claims description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 3
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 claims description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 3
- 239000004472 Lysine Substances 0.000 claims description 3
- 208000003221 Lysosomal acid lipase deficiency Diseases 0.000 claims description 3
- 208000001826 Marfan syndrome Diseases 0.000 claims description 3
- 208000002678 Mucopolysaccharidoses Diseases 0.000 claims description 3
- 208000003019 Neurofibromatosis 1 Diseases 0.000 claims description 3
- 201000011252 Phenylketonuria Diseases 0.000 claims description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 3
- 208000022292 Tay-Sachs disease Diseases 0.000 claims description 3
- 208000002903 Thalassemia Diseases 0.000 claims description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 3
- 239000004473 Threonine Substances 0.000 claims description 3
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 claims description 3
- 125000002091 cationic group Chemical group 0.000 claims description 3
- 201000001386 familial hypercholesterolemia Diseases 0.000 claims description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 3
- 150000002333 glycines Chemical class 0.000 claims description 3
- 208000007345 glycogen storage disease Diseases 0.000 claims description 3
- 208000009601 hereditary spherocytosis Diseases 0.000 claims description 3
- 238000011901 isothermal amplification Methods 0.000 claims description 3
- 206010028093 mucopolysaccharidosis Diseases 0.000 claims description 3
- 208000030761 polycystic kidney disease Diseases 0.000 claims description 3
- 208000007056 sickle cell anemia Diseases 0.000 claims description 3
- 230000005945 translocation Effects 0.000 claims description 3
- 239000013615 primer Substances 0.000 description 86
- 125000005647 linker group Chemical group 0.000 description 85
- 238000001514 detection method Methods 0.000 description 74
- 210000004027 cell Anatomy 0.000 description 53
- 230000000295 complement effect Effects 0.000 description 49
- 238000004458 analytical method Methods 0.000 description 43
- 108091033409 CRISPR Proteins 0.000 description 38
- 239000000047 product Substances 0.000 description 35
- 108091027544 Subgenomic mRNA Proteins 0.000 description 34
- 102000004196 processed proteins & peptides Human genes 0.000 description 34
- 102000040430 polynucleotide Human genes 0.000 description 33
- 108091033319 polynucleotide Proteins 0.000 description 33
- 239000002157 polynucleotide Substances 0.000 description 33
- 229920001184 polypeptide Polymers 0.000 description 31
- 238000002360 preparation method Methods 0.000 description 30
- 102100034343 Integrase Human genes 0.000 description 29
- 235000001014 amino acid Nutrition 0.000 description 27
- 239000012139 lysis buffer Substances 0.000 description 26
- 150000001413 amino acids Chemical class 0.000 description 25
- 241000894007 species Species 0.000 description 23
- 230000009089 cytolysis Effects 0.000 description 22
- 210000004369 blood Anatomy 0.000 description 21
- 239000008280 blood Substances 0.000 description 21
- -1 physical Chemical class 0.000 description 21
- 241000282414 Homo sapiens Species 0.000 description 20
- 230000000694 effects Effects 0.000 description 20
- 238000009396 hybridization Methods 0.000 description 20
- 230000000670 limiting effect Effects 0.000 description 20
- 239000000178 monomer Substances 0.000 description 20
- 108091034117 Oligonucleotide Proteins 0.000 description 18
- 241000700605 Viruses Species 0.000 description 17
- 239000013592 cell lysate Substances 0.000 description 17
- 210000004899 c-terminal region Anatomy 0.000 description 16
- 238000011534 incubation Methods 0.000 description 16
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 241001138501 Salmonella enterica Species 0.000 description 13
- 239000003153 chemical reaction reagent Substances 0.000 description 13
- 239000012530 fluid Substances 0.000 description 13
- 238000001574 biopsy Methods 0.000 description 12
- 229940088598 enzyme Drugs 0.000 description 12
- 238000010362 genome editing Methods 0.000 description 12
- 108091092584 GDNA Proteins 0.000 description 11
- 150000001875 compounds Chemical class 0.000 description 11
- 239000003599 detergent Substances 0.000 description 11
- 239000000975 dye Substances 0.000 description 11
- 235000000346 sugar Nutrition 0.000 description 11
- 239000003550 marker Substances 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 229920000642 polymer Polymers 0.000 description 10
- 238000012408 PCR amplification Methods 0.000 description 9
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 9
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 9
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 9
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 9
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 9
- 238000011002 quantification Methods 0.000 description 9
- 230000002441 reversible effect Effects 0.000 description 9
- 150000003839 salts Chemical class 0.000 description 9
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 9
- 108091093037 Peptide nucleic acid Proteins 0.000 description 8
- 238000007792 addition Methods 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 125000000623 heterocyclic group Chemical group 0.000 description 8
- 239000002987 primer (paints) Substances 0.000 description 8
- 230000035945 sensitivity Effects 0.000 description 8
- 125000006850 spacer group Chemical group 0.000 description 8
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 7
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 7
- 150000002500 ions Chemical class 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 239000002777 nucleoside Substances 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 7
- 239000007787 solid Substances 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 230000008685 targeting Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 6
- 125000000217 alkyl group Chemical group 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 239000000090 biomarker Substances 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 230000006037 cell lysis Effects 0.000 description 6
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 6
- 238000013467 fragmentation Methods 0.000 description 6
- 238000006062 fragmentation reaction Methods 0.000 description 6
- 239000000499 gel Substances 0.000 description 6
- 238000007481 next generation sequencing Methods 0.000 description 6
- 210000003296 saliva Anatomy 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 229930024421 Adenine Natural products 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 5
- 230000004544 DNA amplification Effects 0.000 description 5
- 238000001712 DNA sequencing Methods 0.000 description 5
- 239000004471 Glycine Substances 0.000 description 5
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 5
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 5
- 241000700584 Simplexvirus Species 0.000 description 5
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 5
- 229960000643 adenine Drugs 0.000 description 5
- 150000001408 amides Chemical group 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 229940104302 cytosine Drugs 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 150000002243 furanoses Chemical group 0.000 description 5
- 230000017730 intein-mediated protein splicing Effects 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 150000003833 nucleoside derivatives Chemical class 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 210000002700 urine Anatomy 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 241000700721 Hepatitis B virus Species 0.000 description 4
- 241000701806 Human papillomavirus Species 0.000 description 4
- 241000700560 Molluscum contagiosum virus Species 0.000 description 4
- 102000007079 Peptide Fragments Human genes 0.000 description 4
- 108010033276 Peptide Fragments Proteins 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 238000002835 absorbance Methods 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000002738 chelating agent Substances 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 239000000539 dimer Substances 0.000 description 4
- 230000002550 fecal effect Effects 0.000 description 4
- 238000002875 fluorescence polarization Methods 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000007834 ligase chain reaction Methods 0.000 description 4
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 238000002493 microarray Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 108010068698 spleen exonuclease Proteins 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 241000701161 unidentified adenovirus Species 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 239000011701 zinc Substances 0.000 description 4
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 108091029499 Group II intron Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 3
- 241000223960 Plasmodium falciparum Species 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000223104 Trypanosoma Species 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 125000004429 atom Chemical group 0.000 description 3
- 239000013060 biological fluid Substances 0.000 description 3
- 239000010839 body fluid Substances 0.000 description 3
- 210000001185 bone marrow Anatomy 0.000 description 3
- 150000001768 cations Chemical class 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 210000004748 cultured cell Anatomy 0.000 description 3
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 229940043264 dodecyl sulfate Drugs 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000007672 fourth generation sequencing Methods 0.000 description 3
- 230000007062 hydrolysis Effects 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 230000000415 inactivating effect Effects 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 239000000138 intercalating agent Substances 0.000 description 3
- 238000009830 intercalation Methods 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 150000002632 lipids Chemical group 0.000 description 3
- 235000018977 lysine Nutrition 0.000 description 3
- 238000007403 mPCR Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000002844 melting Methods 0.000 description 3
- 230000008018 melting Effects 0.000 description 3
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 3
- 239000002105 nanoparticle Substances 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 244000045947 parasite Species 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 150000004713 phosphodiesters Chemical class 0.000 description 3
- 125000004437 phosphorous atom Chemical group 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 238000010791 quenching Methods 0.000 description 3
- 230000000171 quenching effect Effects 0.000 description 3
- 238000011897 real-time detection Methods 0.000 description 3
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 3
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 150000003573 thiols Chemical class 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 241001529453 unidentified herpesvirus Species 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 229910052725 zinc Inorganic materials 0.000 description 3
- ALBODLTZUXKBGZ-JUUVMNCLSA-N (2s)-2-amino-3-phenylpropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound NCCCC[C@H](N)C(O)=O.OC(=O)[C@@H](N)CC1=CC=CC=C1 ALBODLTZUXKBGZ-JUUVMNCLSA-N 0.000 description 2
- UFSCXDAOCAIFOG-UHFFFAOYSA-N 1,10-dihydropyrimido[5,4-b][1,4]benzothiazin-2-one Chemical compound S1C2=CC=CC=C2N=C2C1=CNC(=O)N2 UFSCXDAOCAIFOG-UHFFFAOYSA-N 0.000 description 2
- WJFKNYWRSNBZNX-UHFFFAOYSA-N 10H-phenothiazine Chemical compound C1=CC=C2NC3=CC=CC=C3SC2=C1 WJFKNYWRSNBZNX-UHFFFAOYSA-N 0.000 description 2
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- UJOBWOGCFQCDNV-UHFFFAOYSA-N 9H-carbazole Chemical compound C1=CC=C2C3=CC=CC=C3NC2=C1 UJOBWOGCFQCDNV-UHFFFAOYSA-N 0.000 description 2
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 241000024188 Andala Species 0.000 description 2
- 241000701802 Aviadenovirus Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000621124 Bovine papular stomatitis virus Species 0.000 description 2
- 241000606153 Chlamydia trachomatis Species 0.000 description 2
- 241000700626 Cowpox virus Species 0.000 description 2
- 201000007336 Cryptococcosis Diseases 0.000 description 2
- 241000221204 Cryptococcus neoformans Species 0.000 description 2
- 239000003155 DNA primer Substances 0.000 description 2
- 241000450599 DNA viruses Species 0.000 description 2
- 208000001490 Dengue Diseases 0.000 description 2
- 206010012310 Dengue fever Diseases 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 241000702463 Geminiviridae Species 0.000 description 2
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 2
- 241000711549 Hepacivirus C Species 0.000 description 2
- 241000228404 Histoplasma capsulatum Species 0.000 description 2
- 241000046923 Human bocavirus Species 0.000 description 2
- 241001502974 Human gammaherpesvirus 8 Species 0.000 description 2
- 241000702617 Human parvovirus B19 Species 0.000 description 2
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 2
- 108010061833 Integrases Proteins 0.000 description 2
- 241000701244 Mastadenovirus Species 0.000 description 2
- 208000024556 Mendelian disease Diseases 0.000 description 2
- 241000700627 Monkeypox virus Species 0.000 description 2
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 2
- 241001336717 Nanoviridae Species 0.000 description 2
- 241000588650 Neisseria meningitidis Species 0.000 description 2
- 241000244206 Nematoda Species 0.000 description 2
- 241000700635 Orf virus Species 0.000 description 2
- 108090000284 Pepsin A Proteins 0.000 description 2
- 102000057297 Pepsin A Human genes 0.000 description 2
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 2
- 241000701253 Phycodnaviridae Species 0.000 description 2
- 241000223810 Plasmodium vivax Species 0.000 description 2
- 241001505332 Polyomavirus sp. Species 0.000 description 2
- 241000125945 Protoparvovirus Species 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 208000035977 Rare disease Diseases 0.000 description 2
- 108091030145 Retron msr RNA Proteins 0.000 description 2
- 108010052160 Site-specific recombinase Proteins 0.000 description 2
- 241000193998 Streptococcus pneumoniae Species 0.000 description 2
- 241000404000 Tanapox virus Species 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 2
- 241000223997 Toxoplasma gondii Species 0.000 description 2
- 108091028113 Trans-activating crRNA Proteins 0.000 description 2
- 241000223105 Trypanosoma brucei Species 0.000 description 2
- 241000223109 Trypanosoma cruzi Species 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- 241000700647 Variola virus Species 0.000 description 2
- 241000710886 West Nile virus Species 0.000 description 2
- 241001536558 Yaba monkey tumor virus Species 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 125000000304 alkynyl group Chemical group 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000000941 bile Anatomy 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- NXVYSVARUKNFNF-UHFFFAOYSA-N bis(2,5-dioxopyrrolidin-1-yl) 2,3-dihydroxybutanedioate Chemical compound O=C1CCC(=O)N1OC(=O)C(O)C(O)C(=O)ON1C(=O)CCC1=O NXVYSVARUKNFNF-UHFFFAOYSA-N 0.000 description 2
- LNQHREYHFRFJAU-UHFFFAOYSA-N bis(2,5-dioxopyrrolidin-1-yl) pentanedioate Chemical compound O=C1CCC(=O)N1OC(=O)CCCC(=O)ON1C(=O)CCC1=O LNQHREYHFRFJAU-UHFFFAOYSA-N 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 239000010836 blood and blood product Substances 0.000 description 2
- 229940125691 blood product Drugs 0.000 description 2
- 238000005251 capillar electrophoresis Methods 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 150000001721 carbon Chemical group 0.000 description 2
- 239000008004 cell lysis buffer Substances 0.000 description 2
- 229940038705 chlamydia trachomatis Drugs 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- 125000000753 cycloalkyl group Chemical group 0.000 description 2
- 230000015961 delipidation Effects 0.000 description 2
- 208000025729 dengue disease Diseases 0.000 description 2
- 102000038379 digestive enzymes Human genes 0.000 description 2
- 108091007734 digestive enzymes Proteins 0.000 description 2
- ZWIBGKZDAWNIFC-UHFFFAOYSA-N disuccinimidyl suberate Chemical compound O=C1CCC(=O)N1OC(=O)CCCCCCC(=O)ON1C(=O)CCC1=O ZWIBGKZDAWNIFC-UHFFFAOYSA-N 0.000 description 2
- MOTZDAYCYVMXPC-UHFFFAOYSA-N dodecyl hydrogen sulfate Chemical compound CCCCCCCCCCCCOS(O)(=O)=O MOTZDAYCYVMXPC-UHFFFAOYSA-N 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 2
- 229960005542 ethidium bromide Drugs 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- 125000001475 halogen functional group Chemical group 0.000 description 2
- 244000000013 helminth Species 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 238000007855 methylation-specific PCR Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 239000002751 oligonucleotide probe Substances 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 229940111202 pepsin Drugs 0.000 description 2
- 229950000688 phenothiazine Drugs 0.000 description 2
- 150000002991 phenoxazines Chemical class 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 150000008299 phosphorodiamidates Chemical class 0.000 description 2
- 206010035114 pityriasis rosea Diseases 0.000 description 2
- XJMOSONTPMZWPB-UHFFFAOYSA-M propidium iodide Chemical compound [I-].[I-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CCC[N+](C)(CC)CC)=C1C1=CC=CC=C1 XJMOSONTPMZWPB-UHFFFAOYSA-M 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 238000002271 resection Methods 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 238000012340 reverse transcriptase PCR Methods 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 210000000582 semen Anatomy 0.000 description 2
- 235000004400 serine Nutrition 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 210000001179 synovial fluid Anatomy 0.000 description 2
- 210000001138 tear Anatomy 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 235000008521 threonine Nutrition 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 241000712461 unidentified influenza virus Species 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- AGGWFDNPHKLBBV-YUMQZZPRSA-N (2s)-2-[[(2s)-2-amino-3-methylbutanoyl]amino]-5-(carbamoylamino)pentanoic acid Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=O AGGWFDNPHKLBBV-YUMQZZPRSA-N 0.000 description 1
- KUHSEZKIEJYEHN-BXRBKJIMSA-N (2s)-2-amino-3-hydroxypropanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.OC[C@H](N)C(O)=O KUHSEZKIEJYEHN-BXRBKJIMSA-N 0.000 description 1
- PTFYZDMJTFMPQW-UHFFFAOYSA-N 1,10-dihydropyrimido[5,4-b][1,4]benzoxazin-2-one Chemical compound O1C2=CC=CC=C2N=C2C1=CNC(=O)N2 PTFYZDMJTFMPQW-UHFFFAOYSA-N 0.000 description 1
- FPKVOQKZMBDBKP-UHFFFAOYSA-N 1-[4-[(2,5-dioxopyrrol-1-yl)methyl]cyclohexanecarbonyl]oxy-2,5-dioxopyrrolidine-3-sulfonic acid Chemical group O=C1C(S(=O)(=O)O)CC(=O)N1OC(=O)C1CCC(CN2C(C=CC2=O)=O)CC1 FPKVOQKZMBDBKP-UHFFFAOYSA-N 0.000 description 1
- TZMSYXZUNZXBOL-UHFFFAOYSA-N 10H-phenoxazine Chemical compound C1=CC=C2NC3=CC=CC=C3OC2=C1 TZMSYXZUNZXBOL-UHFFFAOYSA-N 0.000 description 1
- UHUHBFMZVCOEOV-UHFFFAOYSA-N 1h-imidazo[4,5-c]pyridin-4-amine Chemical compound NC1=NC=CC2=C1N=CN2 UHUHBFMZVCOEOV-UHFFFAOYSA-N 0.000 description 1
- IVCGJOSPVGENCT-UHFFFAOYSA-N 1h-pyrrolo[2,3-f]quinoline Chemical compound N1=CC=CC2=C(NC=C3)C3=CC=C21 IVCGJOSPVGENCT-UHFFFAOYSA-N 0.000 description 1
- WKMPTBDYDNUJLF-UHFFFAOYSA-N 2-fluoroadenine Chemical compound NC1=NC(F)=NC2=C1N=CN2 WKMPTBDYDNUJLF-UHFFFAOYSA-N 0.000 description 1
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 1
- JWBWJOKTZVXSRT-DWQAGKKUSA-N 5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]-2-aminopentanoic acid Chemical compound N1C(=O)N[C@@H]2[C@H](CCCC(N)C(O)=O)SC[C@@H]21 JWBWJOKTZVXSRT-DWQAGKKUSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- KXBCLNRMQPRVTP-UHFFFAOYSA-N 6-amino-1,5-dihydroimidazo[4,5-c]pyridin-4-one Chemical compound O=C1NC(N)=CC2=C1N=CN2 KXBCLNRMQPRVTP-UHFFFAOYSA-N 0.000 description 1
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 1
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 1
- HRYKDUPGBWLLHO-UHFFFAOYSA-N 8-azaadenine Chemical compound NC1=NC=NC2=NNN=C12 HRYKDUPGBWLLHO-UHFFFAOYSA-N 0.000 description 1
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical compound NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 description 1
- 229960005508 8-azaguanine Drugs 0.000 description 1
- 241001430193 Absiella dolichum Species 0.000 description 1
- 241000700606 Acanthocephala Species 0.000 description 1
- 241000203022 Acholeplasma laidlawii Species 0.000 description 1
- 241001600124 Acidovorax avenae Species 0.000 description 1
- 241000606748 Actinobacillus pleuropneumoniae Species 0.000 description 1
- 241000948980 Actinobacillus succinogenes Species 0.000 description 1
- 241000606731 Actinobacillus suis Species 0.000 description 1
- 241001147825 Actinomyces sp. Species 0.000 description 1
- 208000000230 African Trypanosomiasis Diseases 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 208000008710 Amebic Dysentery Diseases 0.000 description 1
- 206010001935 American trypanosomiasis Diseases 0.000 description 1
- 241001621924 Aminomonas paucivorans Species 0.000 description 1
- 206010001986 Amoebic dysentery Diseases 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 206010053555 Arthritis bacterial Diseases 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 241001443586 Atadenovirus Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 102100032481 B-cell CLL/lymphoma 9 protein Human genes 0.000 description 1
- 241000223838 Babesia bovis Species 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 241000193399 Bacillus smithii Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 241001148536 Bacteroides sp. Species 0.000 description 1
- 241000228405 Blastomyces dermatitidis Species 0.000 description 1
- 241000120506 Bluetongue virus Species 0.000 description 1
- 241000589969 Borreliella burgdorferi Species 0.000 description 1
- 241000589171 Bradyrhizobium sp. Species 0.000 description 1
- 241000193417 Brevibacillus laterosporus Species 0.000 description 1
- 241000589567 Brucella abortus Species 0.000 description 1
- 125000006519 CCH3 Chemical group 0.000 description 1
- 241001678559 COVID-19 virus Species 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 101100167280 Caenorhabditis elegans cin-4 gene Proteins 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 241000589877 Campylobacter coli Species 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241000589986 Campylobacter lari Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 241000327159 Candidatus Puniceispirillum Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241001660259 Cereus <cactus> Species 0.000 description 1
- 241000242722 Cestoda Species 0.000 description 1
- 241000283153 Cetacea Species 0.000 description 1
- 208000024699 Chagas disease Diseases 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 1
- 241000193468 Clostridium perfringens Species 0.000 description 1
- 241000223205 Coccidioides immitis Species 0.000 description 1
- 208000003495 Coccidiosis Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- KQLDDLUWUFBQHP-UHFFFAOYSA-N Cordycepin Natural products C1=NC=2C(N)=NC=NC=2N1C1OCC(CO)C1O KQLDDLUWUFBQHP-UHFFFAOYSA-N 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241001517050 Corynebacterium accolens Species 0.000 description 1
- 241000158496 Corynebacterium matruchotii Species 0.000 description 1
- 241001125840 Coryphaenidae Species 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 201000003808 Cystic echinococcosis Diseases 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 241001595867 Dinoroseobacter shibae Species 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000244170 Echinococcus granulosus Species 0.000 description 1
- 241000223932 Eimeria tenella Species 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000360593 Erythroides Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000714165 Feline leukemia virus Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000968725 Gammaproteobacteria bacterium Species 0.000 description 1
- 208000005577 Gastroenteritis Diseases 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 241000224466 Giardia Species 0.000 description 1
- 241001468096 Gluconacetobacter diazotrophicus Species 0.000 description 1
- 108091093094 Glycol nucleic acid Proteins 0.000 description 1
- 241000282575 Gorilla Species 0.000 description 1
- 201000005569 Gout Diseases 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 241000606766 Haemophilus parainfluenzae Species 0.000 description 1
- 241000819598 Haemophilus sputorum Species 0.000 description 1
- 241000543133 Helicobacter canadensis Species 0.000 description 1
- 241000590014 Helicobacter cinaedi Species 0.000 description 1
- 241000590006 Helicobacter mustelae Species 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 241000224421 Heterolobosea Species 0.000 description 1
- 102100030307 Homeobox protein Hox-A13 Human genes 0.000 description 1
- 102100039545 Homeobox protein Hox-D11 Human genes 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101000798495 Homo sapiens B-cell CLL/lymphoma 9 protein Proteins 0.000 description 1
- 101000918311 Homo sapiens Exostosin-1 Proteins 0.000 description 1
- 101000962591 Homo sapiens Homeobox protein Hox-D11 Proteins 0.000 description 1
- 101001053270 Homo sapiens Insulin gene enhancer protein ISL-2 Proteins 0.000 description 1
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 108010042653 IgA receptor Proteins 0.000 description 1
- 241000411974 Ilyobacter polytropus Species 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 208000004575 Infectious Arthritis Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 102100024390 Insulin gene enhancer protein ISL-2 Human genes 0.000 description 1
- 102000012330 Integrases Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 206010023076 Isosporiasis Diseases 0.000 description 1
- 241000589014 Kingella kingae Species 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- 241000218492 Lactobacillus crispatus Species 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 241000589242 Legionella pneumophila Species 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- 241000186780 Listeria ivanovii Species 0.000 description 1
- 241000186779 Listeria monocytogenes Species 0.000 description 1
- 241000712899 Lymphocytic choriomeningitis mammarenavirus Species 0.000 description 1
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000712079 Measles morbillivirus Species 0.000 description 1
- 241000002163 Mesapamea fractilinea Species 0.000 description 1
- 241000520674 Mesocestoides corti Species 0.000 description 1
- RJQXTJLFIWVMTO-TYNCELHUSA-N Methicillin Chemical compound COC1=CC=CC(OC)=C1C(=O)N[C@@H]1C(=O)N2[C@@H](C(O)=O)C(C)(C)S[C@@H]21 RJQXTJLFIWVMTO-TYNCELHUSA-N 0.000 description 1
- 241000945786 Methylocystis sp. Species 0.000 description 1
- 241000589351 Methylosinus trichosporium Species 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 241000203732 Mobiluncus mulieris Species 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 241000714177 Murine leukemia virus Species 0.000 description 1
- 241000711408 Murine respirovirus Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 208000023178 Musculoskeletal disease Diseases 0.000 description 1
- 241000186362 Mycobacterium leprae Species 0.000 description 1
- 241000204028 Mycoplasma arginini Species 0.000 description 1
- 241000202956 Mycoplasma arthritidis Species 0.000 description 1
- 241000202938 Mycoplasma hyorhinis Species 0.000 description 1
- 241000202894 Mycoplasma orale Species 0.000 description 1
- 241000202889 Mycoplasma salivarium Species 0.000 description 1
- 241000169176 Natronobacterium gregoryi Species 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000109432 Neisseria bacilliformis Species 0.000 description 1
- 241000588654 Neisseria cinerea Species 0.000 description 1
- 241000588651 Neisseria flavescens Species 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- 241000588649 Neisseria lactamica Species 0.000 description 1
- 241001440871 Neisseria sp. Species 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 241000143395 Nitrosomonas sp. Species 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 241000243985 Onchocerca volvulus Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 241001386755 Parvibaculum lavamentivorans Species 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000801571 Phascolarctobacterium succinatutens Species 0.000 description 1
- ZYFVNVRFVHJEIU-UHFFFAOYSA-N PicoGreen Chemical compound CN(C)CCCN(CCCN(C)C)C1=CC(=CC2=[N+](C3=CC=CC=C3S2)C)C2=CC=CC=C2N1C1=CC=CC=C1 ZYFVNVRFVHJEIU-UHFFFAOYSA-N 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 101710178069 Probable outer membrane protein PmpA Proteins 0.000 description 1
- 102100034014 Prolyl 3-hydroxylase 3 Human genes 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 206010037075 Protozoal infections Diseases 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 241001135508 Ralstonia syzygii Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 241000702263 Reovirus sp. Species 0.000 description 1
- 241000725643 Respiratory syncytial virus Species 0.000 description 1
- 108020003564 Retroelements Proteins 0.000 description 1
- 241000190950 Rhodopseudomonas palustris Species 0.000 description 1
- 241001478306 Rhodovulum sp. Species 0.000 description 1
- 241000710799 Rubella virus Species 0.000 description 1
- 241000282849 Ruminantia Species 0.000 description 1
- 229910020008 S(O) Inorganic materials 0.000 description 1
- CGNLCCVKSWNSDG-UHFFFAOYSA-N SYBR Green I Chemical compound CN(C)CCCN(CCC)C1=CC(C=C2N(C3=CC=CC=C3S2)C)=C2C=CC=CC2=[N+]1C1=CC=CC=C1 CGNLCCVKSWNSDG-UHFFFAOYSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000242678 Schistosoma Species 0.000 description 1
- 241000242677 Schistosoma japonicum Species 0.000 description 1
- 241000242680 Schistosoma mansoni Species 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- 206010040102 Seroma Diseases 0.000 description 1
- 241000863011 Simonsiella Species 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241001135759 Sphingomonas sp. Species 0.000 description 1
- 241000439819 Sporolactobacillus vineae Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 241001134656 Staphylococcus lugdunensis Species 0.000 description 1
- 241000193985 Streptococcus agalactiae Species 0.000 description 1
- 244000057717 Streptococcus lactis Species 0.000 description 1
- 235000014897 Streptococcus lactis Nutrition 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 241001037423 Subdoligranulum sp. Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 208000000389 T-cell leukemia Diseases 0.000 description 1
- 208000028530 T-cell lymphoblastic leukemia/lymphoma Diseases 0.000 description 1
- 241001672171 Taenia hydatigena Species 0.000 description 1
- 241000244154 Taenia ovis Species 0.000 description 1
- 241000244159 Taenia saginata Species 0.000 description 1
- 241000223777 Theileria Species 0.000 description 1
- 241001313699 Thermosynechococcus elongatus Species 0.000 description 1
- 108091046915 Threose nucleic acid Proteins 0.000 description 1
- 241000694894 Tistrella mobilis Species 0.000 description 1
- 108010010574 Tn3 resolvase Proteins 0.000 description 1
- MZZINWWGSYUHGU-UHFFFAOYSA-J ToTo-1 Chemical compound [I-].[I-].[I-].[I-].C12=CC=CC=C2C(C=C2N(C3=CC=CC=C3S2)C)=CC=[N+]1CCC[N+](C)(C)CCC[N+](C)(C)CCC[N+](C1=CC=CC=C11)=CC=C1C=C1N(C)C2=CC=CC=C2S1 MZZINWWGSYUHGU-UHFFFAOYSA-J 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 241000223996 Toxoplasma Species 0.000 description 1
- 201000005485 Toxoplasmosis Diseases 0.000 description 1
- 241000283907 Tragelaphus oryx Species 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 241000869417 Trematodes Species 0.000 description 1
- 241000589884 Treponema pallidum Species 0.000 description 1
- 241000589906 Treponema sp. Species 0.000 description 1
- 241000243777 Trichinella spiralis Species 0.000 description 1
- 241000224526 Trichomonas Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 102220483600 Troponin I, cardiac muscle_E54V_mutation Human genes 0.000 description 1
- 102220483626 Troponin I, cardiac muscle_M56A_mutation Human genes 0.000 description 1
- 241001447269 Verminephrobacter eiseniae Species 0.000 description 1
- 241000711975 Vesicular stomatitis virus Species 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 241000607618 Vibrio harveyi Species 0.000 description 1
- 241001416177 Vicugna pacos Species 0.000 description 1
- 208000000260 Warts Diseases 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 241000710772 Yellow fever virus Species 0.000 description 1
- ULHRKLSNHXXJLO-UHFFFAOYSA-L Yo-Pro-1 Chemical class [I-].[I-].C1=CC=C2C(C=C3N(C4=CC=CC=C4O3)C)=CC=[N+](CCC[N+](C)(C)C)C2=C1 ULHRKLSNHXXJLO-UHFFFAOYSA-L 0.000 description 1
- GRRMZXFOOGQMFA-UHFFFAOYSA-J YoYo-1 Chemical compound [I-].[I-].[I-].[I-].C12=CC=CC=C2C(C=C2N(C3=CC=CC=C3O2)C)=CC=[N+]1CCC[N+](C)(C)CCC[N+](C)(C)CCC[N+](C1=CC=CC=C11)=CC=C1C=C1N(C)C2=CC=CC=C2O1 GRRMZXFOOGQMFA-UHFFFAOYSA-J 0.000 description 1
- 241000193453 [Clostridium] cellulolyticum Species 0.000 description 1
- NOXMCJDDSWCSIE-DAGMQNCNSA-N [[(2R,3S,4R,5R)-5-(2-amino-4-oxo-3H-pyrrolo[2,3-d]pyrimidin-7-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O NOXMCJDDSWCSIE-DAGMQNCNSA-N 0.000 description 1
- 206010000269 abscess Diseases 0.000 description 1
- 238000011481 absorbance measurement Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- DPKHZNPWBDQZCN-UHFFFAOYSA-N acridine orange free base Chemical compound C1=CC(N(C)C)=CC2=NC3=CC(N(C)C)=CC=C3C=C21 DPKHZNPWBDQZCN-UHFFFAOYSA-N 0.000 description 1
- 208000012873 acute gastroenteritis Diseases 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 125000002947 alkylene group Chemical group 0.000 description 1
- 238000003016 alphascreen Methods 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 210000003001 amoeba Anatomy 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 210000000436 anus Anatomy 0.000 description 1
- 210000001742 aqueous humor Anatomy 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000003710 aryl alkyl group Chemical group 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 238000007846 asymmetric PCR Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000001363 autoimmune Effects 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 201000008680 babesiosis Diseases 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- DZBUGLKDJFMEHC-UHFFFAOYSA-N benzoquinolinylidene Natural products C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 125000002619 bicyclic group Chemical group 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 229940056450 brucella abortus Drugs 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000003679 cervix uteri Anatomy 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- YTRQFSDWAXHJCC-UHFFFAOYSA-N chloroform;phenol Chemical compound ClC(Cl)Cl.OC1=CC=CC=C1 YTRQFSDWAXHJCC-UHFFFAOYSA-N 0.000 description 1
- 229940099352 cholate Drugs 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- BHQCQFFYRZLCQQ-OELDTZBJSA-N cholic acid Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)[C@@H](O)C1 BHQCQFFYRZLCQQ-OELDTZBJSA-N 0.000 description 1
- 210000004252 chorionic villi Anatomy 0.000 description 1
- 229960002173 citrulline Drugs 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- OFEZSBMBBKLLBJ-BAJZRUMYSA-N cordycepin Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)C[C@H]1O OFEZSBMBBKLLBJ-BAJZRUMYSA-N 0.000 description 1
- OFEZSBMBBKLLBJ-UHFFFAOYSA-N cordycepine Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)CC1O OFEZSBMBBKLLBJ-UHFFFAOYSA-N 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 229940009976 deoxycholate Drugs 0.000 description 1
- KXGVEGMKQFWNSR-LLQZFEROSA-N deoxycholic acid Chemical compound C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)[C@@H](O)C1 KXGVEGMKQFWNSR-LLQZFEROSA-N 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 208000001848 dysentery Diseases 0.000 description 1
- 108010063460 elongation factor T Proteins 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 230000000925 erythroid effect Effects 0.000 description 1
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 210000005002 female reproductive tract Anatomy 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 210000004700 fetal blood Anatomy 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 244000053095 fungal pathogen Species 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 108700026078 glutathione trisulfide Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 230000005283 ground state Effects 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 229940045808 haemophilus influenzae type b Drugs 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- 125000004446 heteroarylalkyl group Chemical group 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 108010021685 homeobox protein HOXA13 Proteins 0.000 description 1
- 238000007849 hot-start PCR Methods 0.000 description 1
- 208000029080 human African trypanosomiasis Diseases 0.000 description 1
- 235000020256 human milk Nutrition 0.000 description 1
- 210000004251 human milk Anatomy 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 239000000815 hypotonic solution Substances 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000007850 in situ PCR Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 208000037797 influenza A Diseases 0.000 description 1
- 208000037798 influenza B Diseases 0.000 description 1
- 208000037799 influenza C Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007852 inverse PCR Methods 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 229940115932 legionella pneumophila Drugs 0.000 description 1
- YFVGRULMIQXYNE-UHFFFAOYSA-M lithium;dodecyl sulfate Chemical compound [Li+].CCCCCCCCCCCCOS([O-])(=O)=O YFVGRULMIQXYNE-UHFFFAOYSA-M 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 150000002669 lysines Chemical class 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 125000005439 maleimidyl group Chemical group C1(C=CC(N1*)=O)=O 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 229960003085 meticillin Drugs 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 244000000010 microbial pathogen Species 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 208000012268 mitochondrial disease Diseases 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 208000017445 musculoskeletal system disease Diseases 0.000 description 1
- 210000002850 nasal mucosa Anatomy 0.000 description 1
- 229920005615 natural polymer Polymers 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 229920002113 octoxynol Polymers 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 201000008482 osteoarthritis Diseases 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- 210000003899 penis Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 210000003800 pharynx Anatomy 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 210000004908 prostatic fluid Anatomy 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 244000079416 protozoan pathogen Species 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- RXTQGIIIYVEHBN-UHFFFAOYSA-N pyrimido[4,5-b]indol-2-one Chemical compound C1=CC=CC2=NC3=NC(=O)N=CC3=C21 RXTQGIIIYVEHBN-UHFFFAOYSA-N 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- SRBUGYKMBLUTIS-UHFFFAOYSA-N pyrrolo[2,3-d]pyrimidin-2-one Chemical compound O=C1N=CC2=CC=NC2=N1 SRBUGYKMBLUTIS-UHFFFAOYSA-N 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 239000000700 radioactive tracer Substances 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 208000017443 reproductive system disease Diseases 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229940016590 sarkosyl Drugs 0.000 description 1
- 108700004121 sarkosyl Proteins 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 201000001223 septic arthritis Diseases 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 208000017520 skin disease Diseases 0.000 description 1
- 201000010153 skin papilloma Diseases 0.000 description 1
- 201000002612 sleeping sickness Diseases 0.000 description 1
- KSAVQLQVUXSOCR-UHFFFAOYSA-M sodium lauroyl sarcosinate Chemical compound [Na+].CCCCCCCCCCCC(=O)N(C)CC([O-])=O KSAVQLQVUXSOCR-UHFFFAOYSA-M 0.000 description 1
- VUFNRPJNRFOTGK-UHFFFAOYSA-M sodium;1-[4-[(2,5-dioxopyrrol-1-yl)methyl]cyclohexanecarbonyl]oxy-2,5-dioxopyrrolidine-3-sulfonate Chemical compound [Na+].O=C1C(S(=O)(=O)[O-])CC(=O)N1OC(=O)C1CCC(CN2C(C=CC2=O)=O)CC1 VUFNRPJNRFOTGK-UHFFFAOYSA-M 0.000 description 1
- 239000011343 solid material Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- IIACRCGMVDHOTQ-UHFFFAOYSA-N sulfamic acid Chemical group NS(O)(=O)=O IIACRCGMVDHOTQ-UHFFFAOYSA-N 0.000 description 1
- 150000003456 sulfonamides Chemical group 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 150000003457 sulfones Chemical group 0.000 description 1
- 150000003462 sulfoxides Chemical class 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- RAHZWNYVWXNFOC-UHFFFAOYSA-N sulfur dioxide Inorganic materials O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 238000004809 thin layer chromatography Methods 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- ATGUDZODTABURZ-UHFFFAOYSA-N thiolan-2-ylideneazanium;chloride Chemical compound Cl.N=C1CCCS1 ATGUDZODTABURZ-UHFFFAOYSA-N 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 238000007862 touchdown PCR Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000013819 transposition, DNA-mediated Effects 0.000 description 1
- 229940096911 trichinella spiralis Drugs 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- 210000003708 urethra Anatomy 0.000 description 1
- 210000001215 vagina Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 229940051021 yellow-fever virus Drugs 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本明細書に開示されるものには、核酸シーケンシングのためのライブラリー生成において使用するのに適した方法、組成物、及びキットが含まれる。一部の実施形態では、複数のタンパク質複合体が提供される。各タンパク質複合体は、トランスポソームと、標的二本鎖DNA(dsDNA)上のユーザーが選択した結合部位に特異的に結合することができるプログラム可能なDNA結合ユニットとを含むことができる。複数のタンパク質複合体の各々に対する結合部位は、互いに異なることができる。トランスポソームは、トランスポゼース、第1のアダプター、及び第2のアダプターを含むことができる。第1のアダプター、第2のアダプター、又はその両方は、シーケンシングアダプターであり得る。【選択図】 図3
Description
関連出願
本出願は、2021年5月14日に出願された米国仮特許出願第63/189,032号、及び2021年9月13日に出願された米国仮特許出願第63/243,443号の35U.S.C.§119(e)に基づく利益を主張し、これらの関連出願の内容は、すべての目的のためにその全体が参照により本明細書に組み込まれる。
配列表への言及
本出願は、電子フォーマットによる配列表とともに提出される。配列表は、2022年5月12日に作製された68EB_317326_WO_Sequence_Listingという名称のファイルとして提供され、サイズは56.0キロバイトである。配列表の電子フォーマットにおける情報は、その全体が参照により本明細書に組み込まれる。
背景
分野
本開示は、一般的に、分子生物学の分野に関し、例えば、カスタマイズされた遺伝子座特異的シーケンシングライブラリーを生成するために核酸をタグ付けすることに関する。
本出願は、2021年5月14日に出願された米国仮特許出願第63/189,032号、及び2021年9月13日に出願された米国仮特許出願第63/243,443号の35U.S.C.§119(e)に基づく利益を主張し、これらの関連出願の内容は、すべての目的のためにその全体が参照により本明細書に組み込まれる。
配列表への言及
本出願は、電子フォーマットによる配列表とともに提出される。配列表は、2022年5月12日に作製された68EB_317326_WO_Sequence_Listingという名称のファイルとして提供され、サイズは56.0キロバイトである。配列表の電子フォーマットにおける情報は、その全体が参照により本明細書に組み込まれる。
背景
分野
本開示は、一般的に、分子生物学の分野に関し、例えば、カスタマイズされた遺伝子座特異的シーケンシングライブラリーを生成するために核酸をタグ付けすることに関する。
関連技術の説明
核酸をシーケンシングするための従来のライブラリー調製方法は、作製するのに数時間を要し得、このプロセスは、ランダムに作製されるライブラリーを生成する。これらのライブラリーがランダムである理由は、核酸(物理的、酵素的、及び化学的断片化法を含む)を断片化するために使用される方法がランダムに核酸を断片化するからである。したがって、DNAシーケンシングのアウトプットは制御することができない。現在、標的化されたシーケンシングに使用されている2つの方法がある。第1のものは、アンプリコンシーケンシングである。この方法は、DNA増幅を介して目的とする領域を増幅するためにプライマーを使用することに依存する。この追加の増幅ステップは、標準的なライブラリー調製方法にさらなるコスト、時間、及び資源を追加する。第2の標的化されたシーケンシング方法は、標的捕捉である。この方法は、特定の核酸標的にハイブリダイズし得るようにプローブ又はプローブのプールを使用することに依存する。プローブのその標的へのハイブリダイゼーション及びこれらの標的の単離は、数日を要し得る時間のかかるプロセスである。さらに、この方法において使用されるプローブは、合成するのに費用がかかる。カスタマイズされた遺伝子座特異的ライブラリー調製のための組成物、方法、システム、及びキットが必要である。迅速な標的化されたシーケンシング(したがって、迅速なシーケンシングに基づく診断、例えば、2時間未満)を可能にする方法、組成物、キット、及びシステム、並びに適切な治療アプローチの同時診断及び決定を提供することができるセラノスティックス(theranostics)に対する必要性がある。
核酸をシーケンシングするための従来のライブラリー調製方法は、作製するのに数時間を要し得、このプロセスは、ランダムに作製されるライブラリーを生成する。これらのライブラリーがランダムである理由は、核酸(物理的、酵素的、及び化学的断片化法を含む)を断片化するために使用される方法がランダムに核酸を断片化するからである。したがって、DNAシーケンシングのアウトプットは制御することができない。現在、標的化されたシーケンシングに使用されている2つの方法がある。第1のものは、アンプリコンシーケンシングである。この方法は、DNA増幅を介して目的とする領域を増幅するためにプライマーを使用することに依存する。この追加の増幅ステップは、標準的なライブラリー調製方法にさらなるコスト、時間、及び資源を追加する。第2の標的化されたシーケンシング方法は、標的捕捉である。この方法は、特定の核酸標的にハイブリダイズし得るようにプローブ又はプローブのプールを使用することに依存する。プローブのその標的へのハイブリダイゼーション及びこれらの標的の単離は、数日を要し得る時間のかかるプロセスである。さらに、この方法において使用されるプローブは、合成するのに費用がかかる。カスタマイズされた遺伝子座特異的ライブラリー調製のための組成物、方法、システム、及びキットが必要である。迅速な標的化されたシーケンシング(したがって、迅速なシーケンシングに基づく診断、例えば、2時間未満)を可能にする方法、組成物、キット、及びシステム、並びに適切な治療アプローチの同時診断及び決定を提供することができるセラノスティックス(theranostics)に対する必要性がある。
概要
本明細書に開示されるものには、組成物が含まれる。一部の実施形態では、組成物は、複数のタンパク質複合体を含む。一部の実施形態では、複数のタンパク質複合体の各々は、トランスポソームと、標的二本鎖DNA(dsDNA)上の結合部位に特異的に結合することができるプログラム可能なDNA結合ユニットとを含む。一部の実施形態では、トランスポソームは、トランスポゼース、第1のアダプター及び第2のアダプターを含む。一部の実施形態では、複数のタンパク質複合体の各々に対する結合部位は、互いに異なる。
本明細書に開示されるものには、組成物が含まれる。一部の実施形態では、組成物は、複数のタンパク質複合体を含む。一部の実施形態では、複数のタンパク質複合体の各々は、トランスポソームと、標的二本鎖DNA(dsDNA)上の結合部位に特異的に結合することができるプログラム可能なDNA結合ユニットとを含む。一部の実施形態では、トランスポソームは、トランスポゼース、第1のアダプター及び第2のアダプターを含む。一部の実施形態では、複数のタンパク質複合体の各々に対する結合部位は、互いに異なる。
一部の実施形態では、複数のタンパク質複合体のうちの少なくとも2つは、同じトランスポソームを含む。一部の実施形態では、複数のタンパク質複合体のすべては、同じトランスポソームを含む。一部の実施形態では、複数のタンパク質複合体のすべては、同じトランスポゼースを含む。一部の実施形態では、同じトランスポソーム内の第1のアダプターと第2のアダプターは同じである。一部の実施形態では、異なるトランスポソームにおける第1のアダプター、第2のアダプター、又はその両方は異なる。一部の実施形態では、第1のアダプター、第2のアダプター、又はその両方は、dsDNA又はRNA/DNA二重鎖である。一部の実施形態では、アダプターは、長さが約3~200塩基対である。一部の実施形態では、第1のアダプター、第2のアダプター、又はその両方は、シーケンシングアダプターである。一部の実施形態では、シーケンシングアダプターは、P5又はP7プライマー配列を含む。
一部の実施形態では、複数のタンパク質複合体のうちの少なくとも2つの結合部位は、同じ標的dsDNA上にある。一部の実施形態では、複数のタンパク質複合体のうちの少なくとも2つの結合部位は、同じ標的dsDNA上で約1~50000ヌクレオチド離れている。一部の実施形態では、複数のタンパク質複合体の一対の結合部位間の距離は、複数のタンパク質複合体の別の一対の結合部位間の距離と実質的に同じである。一部の実施形態では、複数のタンパク質複合体の一対の結合部位間の距離は、複数のタンパク質複合体の別の一対の結合部位間の距離と異なる。一部の実施形態では、複数のタンパク質複合体のうちの少なくとも2つの結合部位は、標的dsDNAの異なる鎖上にある。一部の実施形態では、複数のタンパク質複合体のうちの少なくとも2つは、異なる標的dsDNAに特異的に結合することができる。
一部の実施形態では、複数のタンパク質複合体は、約2~5000の標的dsDNAに特異的に結合することができる。一部の実施形態では、トランスポゼースは、Tn5トランスポゼース、Tn7トランスポゼース、マリナーTc1様トランスポゼース、Himar1C9トランスポゼース、又はスリーピングビューティトランスポゼースである。一部の実施形態では、トランスポゼースは、高活性トランスポゼースである。一部の実施形態では、プログラム可能なDNA結合ユニットは、ヌクレアーゼ欠損CRISPR関連タンパク質(dCASタンパク質)と、標的dsDNAの結合部位に特異的に結合することができるガイドRNA(gRNA)とを含む。一部の実施形態では、トランスポソームは、トランスポゼース及びdCASタンパク質を連結するリンカーを介して、プログラム可能なDNA結合ユニットと結び付けられている。一部の実施形態では、リンカーは、ペプチドリンカー、化学リンカー、又はその両方を含む。一部の実施形態では、トランスポゼースは、dCASタンパク質を含む融合タンパク質中に存在する。一部の実施形態では、dCASタンパク質は、dCAS9、dCAS12、dCAS13、dCAS14、又はSpRY dCASである。一部の実施形態では、dCAS13タンパク質は、dCAS13a、dCAS13b、dCAS13c、又はdCAS13dである。
一部の実施形態では、プログラム可能なDNA結合ユニットは、標的dsDNA上の結合部位に特異的に結合することができるタンパク質構成成分を含む。一部の実施形態では、タンパク質構成成分は、エンドヌクレアーゼ欠損ジンクフィンガーヌクレアーゼ(ZFN)、エンドヌクレアーゼ欠損転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、アルゴノートタンパク質、エンドヌクレアーゼ欠損メガヌクレアーゼ、リコンビナーゼ、又はそれらの組み合わせを含む。一部の実施形態では、トランスポソームは、トランスポゼースとタンパク質構成成分を接続するリンカーを介して、プログラム可能なDNA結合ユニットと結び付けられている。一部の実施形態では、リンカーは、ペプチドリンカー、化学リンカー、又はその両方を含む。一部の実施形態では、ペプチドリンカーは、複数のグリシン、セリン、スレオニン、アラニン、リジン、グルタミン、又はそれらの組み合わせを含む。一部の実施形態では、ペプチドリンカーは、GSリンカーを含む。一部の実施形態では、ペプチドリンカーは、XTENリンカーである。一部の実施形態では、タンパク質構成成分は、トランスポゼースを含む融合タンパク質中に存在する。
本明細書に開示されるものには、反応混合物が含まれる。一部の実施形態では、反応混合物は、本明細書に開示される組成物及び1種以上の標的dsDNAを含むことが疑われる試料核酸を含む。反応混合物は、DNAポリメラーゼ、dNTP、又はそれらの組み合わせを含むことができる。一部の実施形態では、アダプターは、標的dsDNA又はその断片に共有結合的に付着される。反応混合物は、複数のdsDNA断片を含むことができ、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含む。一部の実施形態では、試料核酸は、真核生物DNA、細菌DNA、ウイルスDNA、真菌DNA、原生動物DNA、又はそれらの組み合わせを含む。一部の実施形態では、標的dsDNAは、ゲノムDNA、ミトコンドリアDNA、プラスミドDNA、又はそれらの組み合わせである。一部の実施形態では、試料核酸は、生物学的試料、臨床試料、環境試料、又はそれらの組み合わせ由来である。一部の実施形態では、生物学的試料は、便、痰、末梢血、血漿、血清、リンパ節、呼吸組織、滲出液、体液、又はそれらの組み合わせを含む。
本明細書に開示されるものには、核酸をタグ付けする方法が含まれる。一部の実施形態では、本方法は、本明細書に開示される組成物を、複数の標的dsDNAを含むことが疑われる試料と接触させて反応混合物を形成することと、反応混合物をインキュベートして複数のdsDNA断片を生成することであって、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含むこととを含む。
本明細書に開示されるものには、核酸をタグ付けする方法が含まれる。一部の実施形態では、本方法は、本明細書に開示される組成物を、複数の標的dsDNAを含むことが疑われる試料と接触させて反応混合物を形成することと、反応混合物をインキュベートして複数のdsDNA断片を生成することであって、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含むこととを含む。
本明細書に開示されるものには、シーケンシングライブラリーを生成する方法が含まれる。一部の実施形態では、本方法は、本明細書に開示される組成物を、複数の標的dsDNAを含むことが疑われる試料と接触させて、反応混合物を形成することを含む。本方法は、反応混合物をインキュベートして複数のdsDNA断片を生成することであって、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含むことを含むことができる。本方法は、dsDNA断片の末端でアダプターに結合することができるプライマーを用いて、複数のdsDNA断片を増幅して、シーケンシングライブラリーを生成することを含むことができる。
一部の実施形態では、プライマーの各々は、約5~80ヌクレオチドの長さである。一部の実施形態では、プライマーを用いて複数のdsDNA断片を増幅することは、ポリメラーゼ連鎖反応(PCR)を用いて行われる。一部の実施形態では、PCRは、ループ媒介等温増幅(LAMP)、ヘリカーゼ依存性増幅(HDA)、組換えポリメラーゼ増幅(RPA)、鎖置換増幅(SDA)、核酸配列ベース増幅(NASBA)、転写媒介増幅(TMA)、ニッキング酵素増幅反応(NEAR)、ローリングサークル増幅(RCA)、多置換増幅(MDA)、分岐化(RAM)、環状ヘリカーゼ依存性増幅(cHDA)、単一プライマー等温増幅(SPIA)、RNA技術のシグナル媒介増幅(SMART)、自己持続配列複製(3SR)、ゲノム指数増幅反応(GEAR)、又は等温多置換増幅(IMDA)である。一部の実施形態では、PCRは、リアルタイムPCR又は定量的リアルタイムPCR(QRT-PCR)である。一部の実施形態では、試料は、真核生物DNA、細菌DNA、ウイルスDNA、真菌DNA、原生動物DNA、又はそれらの組み合わせを含む。
一部の実施形態では、複数の標的dsDNAは、ゲノムDNA、ミトコンドリアDNA、プラスミドDNA、又はそれらの組み合わせを含む。一部の実施形態では、試料は、生物学的試料、臨床試料、環境試料、又はそれらの組み合わせであるか又はそれに由来する。一部の実施形態では、複数の標的dsDNAは、少なくとも2つの異なる生物由来のDNAを含む。一部の実施形態では、複数の標的dsDNAは、少なくとも2つの異なる遺伝子由来のDNAを含む。本方法は、逆転写酵素を用いて複数の標的RNAから複数の標的dsDNAを生成することを含むことができる。一部の実施形態では、複数の標的dsDNAは、逆転写酵素を用いて標的RNAから生成された標的dsDNAを含む。
一部の実施形態では、複数の標的dsDNAは、目的とする遺伝子シグネチャ(gene signature)を含む。一部の実施形態では、目的とする遺伝子シグネチャは、1つ以上の目的とする突然変異を含む。一部の実施形態では、目的とする1つ以上の突然変異は、点突然変異、逆位、欠失、挿入、転座、複製、コピー数変異、又はそれらの組み合わせを含む。一部の実施形態では、目的とする1つ以上の突然変異は、ヌクレオチド置換、欠失、挿入、又はそれらの組み合わせを含む。一部の実施形態では、目的とする遺伝子シグネチャは、標的dsDNAが由来する生物の抗生物質耐性又は抗生物質感受性を示す(indicative)。一部の実施形態では、目的とする遺伝子シグネチャは、標的dsDNAが由来する生物のがん状態を示す。一部の実施形態では、目的とする遺伝子シグネチャは、標的dsDNAが由来する生物の遺伝的疾患の状態を示す。一部の実施形態では、遺伝子疾患は単一遺伝子疾患(single-gene disorders)である。一部の実施形態では、遺伝子疾患は、嚢胞性線維症、ハンチントン病、鎌状赤血球貧血、血友病、デュシェンヌ型筋ジストロフィー、サラセミア、脆弱X症候群、家族性高コレステロール血症、多嚢胞性腎疾患、神経線維腫症I型、遺伝性球状赤血球症、マルファン症候群、テイ-サックス病、フェニルケトン尿症、ムコ多糖症、リソソーム(ライソゾーム)酸性リパーゼ欠損症、グリコーゲン貯蔵疾患、ガラクトース血症、又はヘモクロマトーシスである。
一部の実施形態では、複数の標的dsDNAを複数のタンパク質複合体対と接触させることは、約25℃~約80℃で行われる。一部の実施形態では、反応混合物をインキュベートすることは、反応混合物を約37℃~約55℃でインキュベートすることを含む。一部の実施形態では、複数のタンパク質複合体対及び複数の標的dsDNAは、約2:1~約2,000:1の分子比で反応混合物中に存在する。一部の実施形態では、複数のタンパク質複合体対及び複数の標的dsDNAは、約2:1~約200:1の分子比で反応混合物中に存在する。
本方法は、複数のdsDNA断片のうちの1つ以上の一方又は両方の末端を標識することを含むことができる。本方法は、複数のdsDNA断片のうちの1つ以上の2つの末端を異なるように標識することを含むことができる。一部の実施形態では、標識は、アニオン標識、カチオン標識、中性標識、電気化学標識、タンパク質標識、蛍光標識、磁性標識、又はそれらの組み合わせによる標識を含む。本方法は、標識されたdsDNA断片を濃縮すること、標識されたdsDNA断片を捕捉すること、標識されたdsDNA断片を単離すること、及び/又は標識されたdsDNA断片を視覚化することを含むことができる。
詳細な説明
以下の詳細な説明において、その一部を形成する添付図面に言及する。図面においては、文脈上別段の指示がない限り、同様の記号は、典型的には、同様の構成成分を識別する。詳細な説明、図面、及び特許請求の範囲に記載される例示的な実施形態は、限定されるものではない。本明細書に提示される主題の精神又は範囲から逸脱することなく、他の実施形態を利用することができ、他の変更を行うことができる。本開示の態様は、本明細書に一般的に記載され、図面に例示されるように、多種多様な異なる形態で配置、置換、結合、分離、及び設計することができ、これらのすべては、本明細書中で明示的に企図され、本明細書中の開示の一部を構成することができることは容易に理解される。
すべての特許、公開された特許出願、他の刊行物、及びGenBank、並びに本明細書に言及される他のデータベースからの配列は、関連する技術に関して、それらの全体が参照により本明細書に組み込まれる。
本明細書に開示されるものには、組成物が含まれる。一部の実施形態では、組成物は、複数のタンパク質複合体を含む。一部の実施形態では、複数のタンパク質複合体の各々は、トランスポソームと、標的二本鎖DNA(dsDNA)上の結合部位に特異的に結合することができるプログラム可能なDNA結合ユニットとを含む。一部の実施形態では、トランスポソームは、トランスポゼース、第1のアダプター及び第2のアダプターを含む。一部の実施形態では、複数のタンパク質複合体の各々に対する結合部位は、互いに異なる。
以下の詳細な説明において、その一部を形成する添付図面に言及する。図面においては、文脈上別段の指示がない限り、同様の記号は、典型的には、同様の構成成分を識別する。詳細な説明、図面、及び特許請求の範囲に記載される例示的な実施形態は、限定されるものではない。本明細書に提示される主題の精神又は範囲から逸脱することなく、他の実施形態を利用することができ、他の変更を行うことができる。本開示の態様は、本明細書に一般的に記載され、図面に例示されるように、多種多様な異なる形態で配置、置換、結合、分離、及び設計することができ、これらのすべては、本明細書中で明示的に企図され、本明細書中の開示の一部を構成することができることは容易に理解される。
すべての特許、公開された特許出願、他の刊行物、及びGenBank、並びに本明細書に言及される他のデータベースからの配列は、関連する技術に関して、それらの全体が参照により本明細書に組み込まれる。
本明細書に開示されるものには、組成物が含まれる。一部の実施形態では、組成物は、複数のタンパク質複合体を含む。一部の実施形態では、複数のタンパク質複合体の各々は、トランスポソームと、標的二本鎖DNA(dsDNA)上の結合部位に特異的に結合することができるプログラム可能なDNA結合ユニットとを含む。一部の実施形態では、トランスポソームは、トランスポゼース、第1のアダプター及び第2のアダプターを含む。一部の実施形態では、複数のタンパク質複合体の各々に対する結合部位は、互いに異なる。
本明細書に開示されるものには、反応混合物が含まれる。一部の実施形態では、反応混合物は、本明細書に開示される組成物及び1種以上の標的dsDNAを含むことが疑われる試料核酸を含む。反応混合物は、DNAポリメラーゼ、dNTP、又はそれらの組み合わせを含むことができる。一部の実施形態では、アダプターは、標的dsDNA又はその断片に共有結合的に付着される。反応混合物は、複数のdsDNA断片を含むことができ、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含む。一部の実施形態では、試料核酸は、真核生物DNA、細菌DNA、ウイルスDNA、真菌DNA、原生動物DNA、又はそれらの組み合わせを含む。一部の実施形態では、標的dsDNAは、ゲノムDNA、ミトコンドリアDNA、プラスミドDNA、又はそれらの組み合わせである。一部の実施形態では、試料核酸は、生物学的試料、臨床試料、環境試料、又はそれらの組み合わせからのものである。一部の実施形態では、生物学的試料は、便、痰、末梢血、血漿、血清、リンパ節、呼吸組織、滲出液、体液、又はそれらの組み合わせを含む。
本明細書に開示されるものには、核酸をタグ付けする方法が含まれる。一部の実施形態では、本方法は、本明細書に開示される組成物を、複数の標的dsDNAを含むことが疑われる試料と接触させて反応混合物を形成することと、反応混合物をインキュベートして複数のdsDNA断片を生成することであって、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含むこととを含む。
本明細書に開示されるものには、核酸をタグ付けする方法が含まれる。一部の実施形態では、本方法は、本明細書に開示される組成物を、複数の標的dsDNAを含むことが疑われる試料と接触させて反応混合物を形成することと、反応混合物をインキュベートして複数のdsDNA断片を生成することであって、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含むこととを含む。
本明細書に開示されるものには、シーケンシングライブラリーを生成する方法が含まれる。一部の実施形態では、本方法は、本明細書に開示される組成物を、複数の標的二本鎖DNA(dsDNA)を含むことが疑われる試料と接触させて、反応混合物を形成することを含む。本方法は、反応混合物をインキュベートして複数のdsDNA断片を生成することであって、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含むことを含むことができる。本方法は、dsDNA断片の末端でアダプターに結合することができるプライマーを用いて、複数のdsDNA断片を増幅して、シーケンシングライブラリーを生成することを含むことができる。
定義
別段の定義がない限り、本明細書において使用される技術用語及び科学用語は、本開示が属する当業者によって一般的に理解されるものと同じ意味を有する。例えば、Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, NY 1994); Sambrook et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press (Cold Spring Harbor, NY 1989)を参照されたい。本開示の目的のために、以下の用語を以下に定義する。
別段の定義がない限り、本明細書において使用される技術用語及び科学用語は、本開示が属する当業者によって一般的に理解されるものと同じ意味を有する。例えば、Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, NY 1994); Sambrook et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press (Cold Spring Harbor, NY 1989)を参照されたい。本開示の目的のために、以下の用語を以下に定義する。
本明細書で使用される場合、用語「アダプター」とは、結び付けられている核酸の増幅又はシーケンシングを容易にすることができる配列を意味することができる。結び付けられている核酸は、標的核酸を含むことができる。結び付けられている核酸は、空間標識、標的標識、試料標識、インデックス化標識、又はバーコード配列(例えば、分子標識)のうちの1種以上を含み得る。アダプターは、直鎖状であり得る。アダプターは、プレアデニル化アダプターであり得る。アダプターは、二本鎖でも一本鎖であり得る。1つ以上のアダプターは、核酸の5’末端又は3’末端に位置することができる。アダプターが5’末端及び3’末端に公知の配列を含む場合、公知の配列は同一又は異なる配列であり得る。ポリヌクレオチドの5’末端及び/又は3’末端に位置するアダプターは、表面上に固定化された1つ以上のオリゴヌクレオチドにハイブリダイズすることができる。アダプターは、一部の実施形態では、ユニバーサル配列を含むことができる。ユニバーサル配列は、2つ以上の核酸分子に共通のヌクレオチド配列の領域であり得る。2つ以上の核酸分子はまた、異なる配列の領域を有することができる。したがって、例えば、5’アダプターは、同一及び/又はユニバーサル核酸配列を含み得、3’アダプターは、同一及び/又はユニバーサル配列を含み得る。複数の核酸分子の異なるメンバーに存在し得るユニバーサル配列は、ユニバーサル配列に相補的な単一のユニバーサルプライマーを使用して、複数の異なる配列の複製又は増幅を可能にすることができる。同様に、核酸分子群の異なるメンバーに存在し得る少なくとも1つ、2つ(例えば、1対)又は複数のユニバーサル配列は、ユニバーサル配列に相補的である少なくとも1つ、2つ(例えば、1対)又は複数の単一ユニバーサルプライマーを使用して、複数の異なる配列の複製又は増幅を可能にすることができる。したがって、ユニバーサルプライマーは、このようなユニバーサル配列にハイブリダイズし得る配列を含む。標的核酸配列を有する分子は、異なる標的核酸配列の一方又は両方の末端にアダプター(例えば、非標的核酸配列)を付着させるように修飾され得る。標的核酸に付着した1つ以上のユニバーサルプライマーは、ユニバーサルプライマーのハイブリダイゼーションのための部位を提供することができる。標的核酸に付着した1つ以上のユニバーサルプライマーは、互いに同一であるか又は異なるものであり得る。
本明細書中使用される場合、用語「結び付けられている」又は「と結び付けられている」とは、2つ以上の種がある時点で共存しているものとして同定可能であることを意味することができる。結び付きとは、2つ以上の種が同様の容器内にあるか又はその内にあったことを意味し得る。結び付きは、インフォマティクス上の結び付きであり得る。例えば、2つ以上の種に関するデジタル情報を保存することができ、1つ以上の種がある時点で共存していたことを決定するために使用することができる。結び付きはまた、物理的結び付きであり得る。一部の実施形態では、2つ以上の結び付けられている種は、互いに又は共通の固体若しくは半固体表面に「係留」、「付着」、又は「固定」されている。結び付きとは、標識をビーズなどの固体又は半固体支持体に付着させるための共有結合又は非共有結合手段を指すことができる。結び付きは、標的と標識の間の共有結合であり得る。結び付きは、2つの分子(標的分子及び標識など)間のハイブリダイゼーションを含み得る。
本明細書で使用される場合、用語「相補的」とは、2つのヌクレオチド間の正確な対形成の能力を指すことができる。例えば、核酸の所定の位置にあるヌクレオチドが、他の核酸のヌクレオチドと水素結合し得る場合、2つの核酸は、その位置で互いに相補的であるとみなされる。2つの一本鎖核酸分子間の相補性は、ヌクレオチドの一部のみが結合する「部分的」であり得るか、又は一本鎖分子間に全体の相補性が存在する場合に完全であり得る。第1のヌクレオチド配列は、第1のヌクレオチド配列が第2のヌクレオチド配列に相補的である場合、第2の配列の「相補体」であると言うことができる。第1のヌクレオチド配列が第2の配列の逆(すなわち、ヌクレオチドの順序が逆である)の配列と相補的である場合、第1のヌクレオチド配列は、第2の配列の「逆相補体」であると言うことができる。本明細書で使用される場合、「相補的」配列は、配列の「相補体」又は「逆相補体」を指すことができる。分子が別の分子とハイブリダイズすることができる場合、それはハイブリダイズしている分子に対して相補的であり得るか、又は部分的に相補的であり得ることが本開示から理解される。
本明細書で使用される場合、用語「標識」又は「標識(複数)」とは、試料内で標的と結び付けられている核酸コードを指すことができる。標識は、例えば、核酸標識であり得る。標識は、完全に又は部分的に増幅可能な標識であり得る。標識は、完全に又は部分的に連続した標識であり得る。標識は、明らかなように同定可能である天然核酸の一部であり得る。標識は、公知の配列であり得る。標識は、核酸配列の接合部、例えば、天然配列及び非天然配列の接合部を含むことができる。本明細書で使用される場合、用語「標識」は、用語「インデックス」、「タグ」、又は「標識タグ」と互換的に使用することができる。標識は情報を伝達することができる。例えば、様々な実施形態では、標識を使用して、試料の同一性、試料の供給源、細胞の同一性、及び/又は標的を決定することができる。
本明細書で使用される場合、用語「核酸」は、ポリヌクレオチド配列、又はその断片を指す。核酸は、ヌクレオチドを含み得る。核酸は、細胞に対して外因性又は内因性であり得る。核酸は、無細胞環境中に存在し得る。核酸は、遺伝子又はその断片であり得る。核酸は、DNAであり得る。核酸は、RNAであり得る。核酸は、1種以上の類似体(例えば、改変された骨格、糖、又は核酸塩基)を含み得る。類似体の一部の非限定的な例としては、5-ブロモウラシル、ペプチド核酸、キセノ核酸、モルホリノース、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コルジセピン、7-デアザ-GTP、フルオロフォア(例えば、糖に連結されたローダミン又はフルオレセイン)、チオール含有ヌクレオチド、ビオチン連結ヌクレオチド、蛍光塩基類似体、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、プソイドウリジン、ジヒドロウリジン、クエオシン、及びウヨシンが挙げられる。「核酸」、「ポリヌクレオチド」、「標的ポリヌクレオチド」、及び「標的核酸」は、互換的に使用することができる。
核酸は、1種以上の修飾(例えば、塩基修飾、骨格修飾)を含み、新規又は増強された特徴(例えば、改良された安定性)を核酸に提供することができる。核酸は、核酸親和性タグを含むことができる。ヌクレオシドは塩基と糖の組み合わせであり得る。ヌクレオシドの塩基部分は複素環塩基であり得る。このような複素環塩基の最も一般的な2種類はプリンとピリミジンである。ヌクレオチドは、ヌクレオシドの糖部分に共有結合的に連結したリン酸基をさらに含むヌクレオシドであり得る。ペントフラノシル糖を含むそれらのヌクレオシドでは、リン酸基は糖の2’、3’、又は5’ヒドロキシル部分に連結することができる。核酸を形成する際に、リン酸基は、隣接するヌクレオシドを互いに共有結合的に連結させて、直鎖状高分子化合物を形成することができる。次に、この直鎖状高分子化合物のそれぞれの末端をさらに接続して環状化合物を形成することができるが、一般的に直鎖状化合物が適している。さらに、直鎖状化合物は、内部ヌクレオチド塩基相補性を有し得、したがって、完全に又は部分的に二本鎖の化合物を生成するように折り畳まれ得る。核酸内では、リン酸基は、一般的に、核酸のヌクレオシド間骨格の形成と称され得る。連結又は骨格は、3’から5’のホスホジエステル連結であり得る。
核酸は、修飾された骨格及び/又は修飾されたヌクレオシド間連結を含むことができる。修飾された骨格には、骨格中にリン原子を保持するもの、及び骨格中にリン原子を有しないものが含まれ得る。そこにリン原子を含有する適切な修飾された核酸骨格には、例えば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、メチル及び他のアルキルホスホネート、例えば、3’-アルキレンホスホネート、5’-アルキレンホスホネート、キラルホスホネート、ホスフィネート、ホスホロアミデート、例えば、3’-アミノホスホロアミデート及びアミノアルキルホスホロアミデート、ホスホロジアミデート、チオノホスホロアミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、セレノホスフェート、及び正常な3’-5’連結を有するボラノホスフェート、2’-5’連結した類似体、及び1種以上のヌクレオチド間連結が3’から3’、5’から5’、又は2’から2’連結である逆極性を有するものが含まれ得る。
核酸は、短鎖アルキル又はシクロアルキルヌクレオシド間連結、混合ヘテロ原子及びアルキル又はシクロアルキルヌクレオシド間連結、又は1つ以上の短鎖ヘテロ原子若しくは複素環ヌクレオシド間連結によって形成されるポリヌクレオチド骨格を含むことができる。これらは、モルホリノ連結(ヌクレオシドの糖部分から部分的に形成される);シロキサン骨格;スルフィド、スルホキシド及びスルホン骨格;ホルムアセチル及びチオホルムアセチル骨格;メチレンホルムアセチル及びチオホルムアセチル骨格;リボアセチル骨格;アルキレン含有骨格;スルファメート骨格;メチレンイミノ及びメチレンヒドラジノ骨格;スルホネート及びスルホンアミド骨格;アミド骨格;並びに混合N、O、S及びCH2構成成分部分を有する他のものを有するものを含むことができる。
核酸は、核酸模倣物(mimetic)を含むことができる。用語「模倣物」は、フラノース環のみ、又はフラノース環とヌクレオチド間連結の両方が非フラノース基で置換されているポリヌクレオチドを含むことを意図することができ、フラノース環のみの置換はまた糖代替物と称することができる。複素環塩基部分又は修飾された複素環塩基部分は、適切な標的核酸とのハイブリダイゼーションのために維持することができる。1つのこのような核酸はペプチド核酸(PNA)であり得る。PNAでは、ポリヌクレオチドの糖骨格は、アミド含有骨格、特にアミノエチルグリシン骨格で置換することができる。ヌクレオチドは保持され得、直接的又は間接的に骨格のアミド部分のアザ窒素原子に結合される。PNA化合物の骨格は、PNAにアミド含有骨格を与える2種以上の連結アミノエチルグリシンユニットを含むことができる。複素環塩基部分は、骨格のアミド部分のアザ窒素原子に直接的又は間接的に結合することができる。
核酸は、モルホリノ骨格構造を含むことができる。例えば、核酸は、リボース環の代わりに6員モルホリノ環を含むことができる。これらの実施形態の一部では、ホスホロジアミデート又は他の非ホスホジエステルヌクレオシド間連結は、ホスホジエステル連結を置換することができる。
核酸は、モルホリノ骨格構造を含むことができる。例えば、核酸は、リボース環の代わりに6員モルホリノ環を含むことができる。これらの実施形態の一部では、ホスホロジアミデート又は他の非ホスホジエステルヌクレオシド間連結は、ホスホジエステル連結を置換することができる。
核酸は、モルホリノ環に付着した複素環塩基を有する連結モルホリノユニット(例えば、モルホリノ核酸)を含むことができる。連結基は、モルホリノ核酸中のモルホリノ単量体ユニットを連結することができる。非イオン性モルホリノベースのオリゴマー化合物は、細胞タンパク質との望ましくない相互作用をより少なくすることができる。モルホリノベースのポリヌクレオチドは、核酸の非イオン性模倣物であり得る。モルホリノクラス内の様々な化合物は、異なる連結基を用いて接続することができる。ポリヌクレオチド模倣物のさらなるクラスは、シクロヘキセニル核酸(CeNA)と称され得る。核酸分子中に通常存在するフラノース環は、シクロヘキセニル環で置換することができる。CeNA DMT保護されたホスホロアミダイト単量体を調製し、ホスホロアミダイト化学を用いたオリゴマー化合物合成に使用することができる。核酸鎖へのCeNA単量体の取り込みは、DNA/RNAハイブリッドの安定性を増加させることができる。CeNAオリゴアデニル酸は、天然複合体と同様の安定性を有する核酸相補体と複合体を形成することができる。さらなる修飾には、2’-ヒドロキシル基が糖環の4’炭素原子に連結し、それによって2’-C,4’-C-オキシメチレン連結を形成し、それによって二環糖部分を形成するロックド核酸(LNA)が含まれ得る。連結は、2’酸素原子及び4’炭素原子を架橋するメチレン(-CH2)基であり得、nは1又は2である。LNA及びLNA類似体は、相補的核酸との非常に高い二重鎖熱安定性(Tm=+3~+10℃)、3’-エキソヌクレアーゼ分解への安定性、及び良好な溶解性を示すことができる。
核酸はまた、核酸塩基(しばしば単に「塩基」と呼ばれる)修飾又は置換を含み得る。本明細書で使用される場合、「未修飾」又は「天然」核酸塩基は、プリン塩基(例えば、アデニン(A)及びグアニン(G))、並びにピリミジン塩基(例えば、チミン(T)、シトシン(C)及びウラシル(U))を含むことができる。修飾された核酸塩基は、他の合成及び天然の核酸塩基、例えば、5-メチルシトシン(5-me-C)、5-ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、2-アミノアデニン、アデニン及びグアニンの6-メチル及び他のアルキル誘導体、アデニン及びグアニンの2-プロピル及び他のアルキル誘導体、2-チオウラシル、2-チオチミン及び2-チオシトシン、5-ハロウラシル及びシトシン、5-プロピニル(-C=C-CH3)ウラシル及びシトシン及びピリミジン塩基の他のアルキニル誘導体、6-アゾウラシル、シトシン及びチミン、5-ウラシル(プソイドウラシル)、4-チオウラシル、8-ハロ、8-アミノ、8-チオール、8-チオアルキル、8-ヒドロキシル及び他の8-置換アデニン及びグアニン、5-ハロ、特に5-ブロモ、5-トリフルオロメチル及び他の5-置換ウラシル及びシトシン、7-メチルグアニン及び7-メチルアデニン、2-F-アデニン、2-アミノアデニン、8-アザグアニン及び8-アザアデニン、7-デアザグアニン及び7-デアザアデニン及び3-デアザグアニン及び3-デアザアデニンを含み得る。修飾された核酸塩基は、三環ピリミジン、例えば、フェノキサジンシチジン(1H-ピリミド(5,4-b)(1,4)ベンゾキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド(5,4-b)(1,4)ベンゾチアジン-2(3H)-オン)、G-クランプ、例えば、置換フェノキサジンシチジン(例えば、9-(2-アミノエトキシ)-H-ピリミド(5,4-(b)(1,4)ベンゾキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド(5,4-b)(1,4)ベンゾチアジン-2(3H)-オン)、G-クランプ、例えば、置換フェノキサジンシチジン(例えば、9-(2-アミノエトキシ)-H-ピリミド(5,4-(b)(1,4)ベンゾキサジン-2(3H)-オン)、カルバゾールシチジン(2H-ピリミド(4,5-b)インドール-2-オン)、ピリドインドールシチジン(H-ピリド(3’,2’:4,5)ピロロ[2,3-d]ピリミジン-2-オン)を含み得る。
本明細書で使用される場合、用語「標的」とは、目的とする核酸(例えば、標的dsDNA)を指すことができる。一部の実施形態では、標的は、アダプター及び/又はバーコードと結び付けられ得る。開示された方法、デバイス、及びシステムによる分析に適した例示的な標的としては、オリゴヌクレオチド、DNA、RNA、mRNA、マイクロRNA、tRNAなどが挙げられる。標的は一本鎖又は二本鎖であり得る。一部の実施形態では、標的は、タンパク質、ペプチド、又はポリペプチドであり得る。一部の実施形態では、標的は脂質である。本明細書で使用される場合、「標的」は、「種」と互換的に使用することができる。
本明細書で使用される場合、用語「逆転写酵素」とは、逆転写酵素活性(すなわち、RNA鋳型からのDNAの合成を触媒する)を有する一群の酵素を指すことができる。一般的に、このような酵素は、限定されないが、レトロウイルス逆転写酵素、レトロトランスポゾン逆転写酵素、レトロプラスミド逆転写酵素、レトロン逆転写酵素、細菌逆転写酵素、グループIIイントロン由来逆転写酵素、及びそれらの突然変異体、バリアント又は誘導体を含む。非レトロウイルス逆転写酵素には、非LTRレトロトランスポゾン逆転写酵素、レトロプラスミド逆転写酵素、レトロン逆転写酵素、及びグループIIイントロン逆転写酵素が含まれる。グループIIイントロン逆転写酵素の例としては、ラクトコッカス・ラクチス(Lactococcus lactis)LI.LtrBイントロン逆転写酵素、サーモシネココッカス・エロンガツス(Thermosynechococcus elongatus)TeI4cイントロン逆転写酵素、又はゲオバチルス・ステアロサーモフィルス(Geobacillus stearothermophilus)GsI-IICイントロン逆転写酵素が挙げられる。他のクラスの逆転写酵素は、多くのクラスの非レトロウイルス逆転写酵素(すなわち、とりわけレトロン、グループIIイントロン、及び多様性生成レトロエレメント)を含むことができる。
本明細書で使用される場合、用語「核酸を単離する」とは、1種以上の細胞構成成分からの核酸の精製を指すことができる。当業者は、そこから「核酸を単離する」ために処理された試料が、核酸以外の構成成分及び不純物を含み得ることを理解する。単離された核酸を含む試料は、当該技術分野において公知である任意の許容される方法を用いて検体から調製することができる。例えば、細胞は、公知の溶解剤を用いて溶解することができ、核酸は、他の細胞構成成分から精製することができ、又は部分的に精製することができる。DNA及びRNA抽出のための適切な試薬及びプロトコールは、例えば、それぞれ米国特許出願公開第2010/0009351号、及び米国特許出願公開第2009/0131650号に見出すことができる(各々は、その全体が参照により本明細書に組み込まれる)。
本明細書で使用される場合、「鋳型」とは、少なくとも1つの標的ヌクレオチド配列を含むポリヌクレオチドの全部又は一部を指すことができる。
本明細書で使用される場合、「鋳型」とは、少なくとも1つの標的ヌクレオチド配列を含むポリヌクレオチドの全部又は一部を指すことができる。
本明細書で使用される場合、「プライマー」とは、核酸鎖伸長反応を開始するのに役立つことができるポリヌクレオチドを指すことができる。プライマーの長さは、例えば、約5~約100ヌクレオチド、約10~約50ヌクレオチド、約15~約40ヌクレオチド、又は約20~約30ヌクレオチドの範囲で変動し得る。プライマーの長さは、約10ヌクレオチド、約20ヌクレオチド、約25ヌクレオチド、約30ヌクレオチド、約35ヌクレオチド、約40ヌクレオチド、約50ヌクレオチド、約75ヌクレオチド、約100ヌクレオチド、又はこれらの値の任意の2つの間の範囲であり得る。一部の実施形態では、プライマーは、10~約50ヌクレオチド、すなわち、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50又はそれ以上のヌクレオチドの長さを有する。一部の実施形態では、プライマーは18~32ヌクレオチドの長さを有する。
本明細書で使用される場合、「プローブ」とは、ハイブリダイゼーションを可能にする条件下で、核酸中の標的配列に(例えば、特異的に)ハイブリダイズすることができ、それによって標的配列又は増幅された核酸の検出を可能にするポリヌクレオチドを指すことができる。プローブの「標的」とは、一般的に、標準的な水素結合(すなわち、塩基対形成)によってプローブオリゴマーの少なくとも一部に特異的にハイブリダイズする、増幅された核酸配列内の配列又はそのサブセットを指す。プローブは、標的特異的配列、及びプローブの三次元立体構造に寄与する他の配列を含み得る。配列は、プローブオリゴマーの適切なハイブリダイゼーション条件において、プローブの標的特異的配列と完全には相補的でない標的配列への安定なハイブリダイゼーションを可能にする場合、「十分に相補的」である。プローブの長さは、例えば、約5~約100ヌクレオチド、約10~約50ヌクレオチド、約15~約40ヌクレオチド、又は約20~約30ヌクレオチドの範囲で変動し得る。プローブの長さは、約10ヌクレオチド、約20ヌクレオチド、約25ヌクレオチド、約30ヌクレオチド、約35ヌクレオチド、約40ヌクレオチド、約50ヌクレオチド、約100ヌクレオチド、又はこれらの値の任意の2つの間の範囲であり得る。一部の実施形態では、プローブは、10~約50ヌクレオチドの長さを有する。例えば、プライマー及びプローブは、少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50又はそれ以上のヌクレオチドであり得る。一部の実施形態では、プローブは、非配列特異的であり得る。
好ましくは、プライマー及び/又はプローブは、8~45ヌクレオチドの長さであり得る。例えば、プライマー及びプローブは、長さが少なくとも8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、又はそれ以上のヌクレオチドであり得る。プライマー及びプローブは、5’末端又は3’末端、又はその両方にさらなるヌクレオチドを含有するように修飾することができる。当業者は、増幅プライマーの3’末端に対するさらなる塩基(必ずしもプローブではない)が、一般的に、鋳型配列に対して相補的であることを理解する。プライマー及びプローブ配列はまた、5’末端又は3’末端のヌクレオチドを除去するために修飾することができる。当業者は、増幅用に機能するために、プライマー又はプローブは、本明細書に開示されるように、最小の長さ及びアニーリング温度であることを理解する。
プライマー及びプローブは、融解温度(Tm)未満の温度であるアニーリング温度でそれらの標的に結合することができる。本明細書で使用される場合、「Tm」及び「融解温度」は、二本鎖ポリヌクレオチド分子の集団の50%が一本鎖に解離するようになる温度を指す交換可能な用語である。ポリヌクレオチドのTmを計算するための式は、当該技術分野において周知である。例えば、Tmは、以下の式:Tm=69.3+0.41×(G+C)%-6-50/L(式中、Lはヌクレオチド中のプローブの長さである)によって計算することができる。ハイブリッドポリヌクレオチドのTmはまた、1M塩中のハイブリダイゼーションアッセイから採用された式を用いて推定することができ、PCRプライマーについてのTmの計算に一般的に使用される:[(A+Tの数)×2℃+(G+Cの数)×4℃]。例えば、C. R. Newton et al. PCR, 2nd ed., Springer-Verlag (New York: 1997), p.24(その全体が参照により本明細書に組み込まれる)を参照されたい。他のより洗練されたコンピュータ計算は、Tmの計算のために構造的及び配列特性を考慮に入れた当該技術分野に存在する。オリゴヌクレオチドの融解温度は、オリゴヌクレオチドプライマー又はプローブと結合配列との間の相補性、及び塩の条件に依存し得る。一部の実施形態では、本明細書に提供されるオリゴヌクレオチドプライマー又はプローブは、50mMのKCl、10mMのTris-HCl緩衝液中では約90℃未満のTmを有し、例えば、約89℃、88、87、86、85、84、83、82、81、80 79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、50、49、48、47、46、45、44、43、42、41、40、39℃、又はそれ未満であり、列挙された値の任意の2つの間の範囲が含まれる。
一部の実施形態では、本明細書に開示されるプライマー、例えば増幅プライマーは、例えば、フォワードプライマー及びリバースプライマー(第1の増幅プライマー及び第2の増幅プライマー)を含む増幅プライマー対として提供することができる。好ましくは、フォワードプライマー及びリバースプライマーは、10℃を超えて異ならず、例えば、10℃未満、9℃未満、8℃未満、7℃未満、6℃未満、5℃未満、4℃未満、3℃未満、2℃未満、又は1℃未満で異なるTmを有する。
プライマー配列及びプローブ配列は、オリゴヌクレオチドが標的核酸配列に特異的にハイブリダイズするのに十分な相補性を含有することを条件として、オリゴヌクレオチド配列内に(標的配列に対して)ヌクレオチド置換を有することによって修飾することができる。このようにして、少なくとも1、2、3、4、又は最大約5ヌクレオチドを置換することができる。本明細書で使用される場合、用語「相補的」とは、2つのポリヌクレオチド鎖の領域間、又は同じポリヌクレオチド鎖の2つの領域間の配列相補性を指すことができる。ポリヌクレオチドの第1の領域は、2つの領域が反平行に配置される場合、第1の領域の少なくとも1つのヌクレオチドが第2の領域の塩基と塩基対形成することができる場合に、同一又は異なるポリヌクレオチドの第2の領域に相補的である。したがって、2つの相補的なポリヌクレオチドがすべてのヌクレオチド位置で塩基対形成する必要はない。「十分に相補的」とは、第2のポリヌクレオチドと100%又は「十分に」相補的であり、したがって、すべてのヌクレオチド位置で塩基対形成する第1のポリヌクレオチドを指すことができる。また、「部分的に相補的」とは、100%相補的ではなく(例えば、90%、又は80%、又は70%相補的である)、1つ以上のヌクレオチド位置にミスマッチしたヌクレオチドを含有する第1のポリヌクレオチドを指すことができる。一部の実施形態では、オリゴヌクレオチドは、ユニバーサル塩基を含む。
本明細書で使用される場合、用語「十分に相補的」とは、一連の相補的塩基間の水素結合によって別の塩基配列にハイブリダイズすることができる連続する核酸塩基配列を指すことができる。相補的塩基配列は、標準的な塩基対形成(例えば、G:C、A:T又はA:U)を用いることによってオリゴマー配列の各位置で相補的であり得るか、又は相補的ではない(非塩基性の位置を含む)が、全体の相補的塩基配列が適切なハイブリダイゼーション条件下で別の塩基配列と特異的にハイブリダイズすることができる1つ以上の残基を含有し得る。隣接塩基は、オリゴマーがハイブリダイズすることを意図する配列と少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%、又は100%相補的であり得る。実質的に相補的な配列は、参照配列と比較して、100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、75、70若しくはそれ以下、又はその間の任意の数の同一性のパーセンテージの範囲の配列を指すことができる。当業者は、塩基配列組成に基づいて予測することができる適切なハイブリダイゼーション条件を容易に選択することができるか、又は習慣的な試験(例えば、Green and Sambrook, Molecular Cloning, A Laboratory Manual, 4th ed. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 2012)を参照されたい)を用いて決定することができる。
本明細書で使用される場合、用語「多重PCR」とは、1種の単一の標的、又は2種以上の異なる標的を単一の反応容器(例えば、チューブ)内で増幅することを可能にする反応に1を超えるプライマーセットが含まれるPCRのタイプを指す。多重PCRは、例えば、リアルタイムPCRであり得る。
本明細書で使用される場合、用語「多重PCR」とは、1種の単一の標的、又は2種以上の異なる標的を単一の反応容器(例えば、チューブ)内で増幅することを可能にする反応に1を超えるプライマーセットが含まれるPCRのタイプを指す。多重PCRは、例えば、リアルタイムPCRであり得る。
本明細書に開示されるものには、迅速な標的化されたシーケンシング(したがって、迅速なシーケンシングに基づく診断、例えば、2時間未満)を可能にする方法、組成物、キット、及びシステム、並びに適切な治療アプローチの同時診断及び決定を必要とするセラノスティックスが含まれる。一部の実施形態では、迅速な標的化されたシーケンシングアプローチの適用は、迅速な病原体診断、迅速ながん診断、稀な疾患診断(例えば、嚢胞性線維症)を含むことができる。
本明細書に開示されるものには、ゲノム編集ツール(例えば、Casタンパク質、亜鉛フィンガーヌクレアーゼ(ZFN)、転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、及びアルゴノートタンパク質)を用いてDNA及びRNAシーケンシングのためのカスタマイズされた遺伝子座特異的ライブラリーを作製し、ユーザー定義された遺伝子座で核酸を切断するための酵素(例えば、トランスポゼース)を誘導する方法が含まれる。この酵素(例えば、トランスポゼース)は、シーケンシング、例えば、次世代又は第3世代のシーケンシング技術(限定されないが、Illumina、PacBio、Roche、Thermo Fisher、及びOxford Nanoporeによるシーケンシング技術を含む)によるシーケンシングのためのアダプターをこれらの部位に付加することができる。
核酸をシーケンシングするための従来のライブラリー調製方法は、作製するのに数時間を要し得、このプロセスは、ランダムに作製されるライブラリーを生成する(図1)。これらのライブラリーがランダムである理由は、核酸(物理的、酵素的、及び化学的断片化法を含む)を断片化するために使用される方法がランダムに核酸を断片化するからであり、その結果、DNAシーケンシングのアウトプットを制御することができない。
核酸をシーケンシングするための従来のライブラリー調製方法は、作製するのに数時間を要し得、このプロセスは、ランダムに作製されるライブラリーを生成する(図1)。これらのライブラリーがランダムである理由は、核酸(物理的、酵素的、及び化学的断片化法を含む)を断片化するために使用される方法がランダムに核酸を断片化するからであり、その結果、DNAシーケンシングのアウトプットを制御することができない。
ゲノム中の特定の遺伝子座を研究することに関心がある場合、これらの遺伝子座について十分な配列情報が得られることを期待して、何百万もの塩基のシーケンシングが必要となる。これらのデータがすべて獲得されたら、目的とする遺伝子座に関する情報を抽出するために、バイオインフォマティクス手法を用いなければならない。このプロセスは、調製され、シーケンシングされたDNAの大部分が、目的とするこれらの領域に関連性がないため、バイオインフォマティクス的及び計算学的に集約的なものになり得る。さらに、ライブラリー調製プロセスがランダムであるため、これらの領域に十分な情報(カバレッジ)が存在しないリスクがある。この場合、これらの領域が十分にカバーされることを期待して、時間と資源の両方を浪費して、別のライブラリーを作製し、再度シーケンシングしなければならない。
カスタマイズされた遺伝子座特異的ライブラリー調製(CLLP)方法を用いてシーケンシングするための本明細書に開示される迅速な標的化されたライブラリー調製方法は、従来のライブラリー調製方法を用いてライブラリーを作製するのに必要な数時間の代わりに、作製するのにわずか数分かかる迅速なプロセスである。さらに、本明細書に開示されるCLLP法によって作製されたライブラリーはランダムではない。一部の実施形態では、選択された遺伝子座のみがシーケンシングされ、他のすべては無視することができ、費用対効果、時間及び資源の節約、及び精度を提供する。さらに、目的とする領域をシーケンシングすることによってのみ、標準的な方法と比較して、必要なバイオインフォマティクス資源及び分析は最小限に留まる。本明細書に開示されるカスタマイズされた遺伝子座特異的ライブラリー調製(CLLP)方法は、診断及び/又はセラノスティックスのための迅速で安価な方法としてのDNAシーケンシングの使用を可能にする。
CLLPの一部の実施形態では、ゲノム編集ツール及びトランスポゼース(例えば、高活性トランスポゼース)は、標的化された断片化を達成するために使用される。ユーザーが定義したDNAの二本鎖切断又はRNAの一本鎖切断を可能にする任意のゲノム編集ツールを用いることができる。これらのツールには、限定されないが、CASタンパク質、ZFN、TALEN、アルゴノートタンパク質、又はそれらの任意の組み合わせが含まれる。一部の実施形態では、ゲノム編集ツールは、正確に選択することができるゲノムの特定の領域に核酸の断片化を制御及び指示するために使用される。ゲノム編集ツールによってなされる切断は、シーケンシングアダプターのためのプライミング部位として使用することができる。これは、順に、シーケンシングされるゲノムの領域に大きな偏りをもたらす。本明細書に開示されるプログラム可能な断片化プロセスは、標的化されたシーケンシングに導くことができる。さらに、この方法は、任意のシーケンシング技術(限定されないが、Illumina、PacBio、Oxford Nanopore、Roche及びThermo Fisherのシーケンシング技術を含む)で使用することができる。図5A~図5Fは、本明細書に開示されるカスタマイズされた遺伝子座特異的ライブラリー調製(CLLP)の非限定的であり例示的な実施形態を示す。
一部の実施形態では、タグメンテーションは、高活性トランスポゼースを利用するDNAシーケンシングのためのライブラリーを作製することを含む。タグメンテーションは、二本鎖DNAを切断し、切断部位にDNAアダプターを貼り付けるトランスポゾンを使用する(図2)。タグメンテーションは、ライブラリーを標準的なライブラリー調製方法よりもかなり少ない時間で作製する非常に速いプロセスである。しかしながら、トランスポゾンはゲノムをランダムに偏りなく切断する。
一部の実施形態では、ライブラリーの調製速度を向上させるために、本明細書に開示される方法は、ゲノム編集ツールに連結されたトランスポゾンを使用する。例えば、dCAS9タンパク質は、ゲノム編集ツールとして使用することができる。dCAS9タンパク質は、ゲノム中の特定の領域にプログラム可能なガイドRNAに結合することができる。dCAS9はCAS9タンパク質の一種であり、CAS9タンパク質のヌクレアーゼ活性は失われるが、標的特異性は保持されるように突然変異されている。dCAS9がその標的に結合すると、CAS9タンパク質に付着しているトランスポゼースがDNAを切断し、その切断部位アダプターに付着して配列を決定する。最終結果は、シーケンシングの準備が整った標的化DNA断片であり、標的化ライブラリー調製プロセスを数時間ではなく数分に短縮する(図3)。
本開示の方法、組成物、キット及びシステムが可能にする非限定的な利点には、結果に至るまでの迅速な時間;先行技術よりも少ない実験室、バイオインフォマティクス及び計算資源の使用;希少及び低頻度のバリアントの迅速な検出及び定量化を可能にすること;全ゲノムシーケンシングよりも多くの試料を分析し得ることができること;複数のカスタマイズ可能な標的数を同時に検出することができる迅速な診断ツールとして使用できること;より簡単であり容易なデータ分析;並びにそれらの任意の組み合わせが含まれる。
本開示の方法、組成物、キット及びシステムが可能にする非限定的な利点には、結果に至るまでの迅速な時間;先行技術よりも少ない実験室、バイオインフォマティクス及び計算資源の使用;希少及び低頻度のバリアントの迅速な検出及び定量化を可能にすること;全ゲノムシーケンシングよりも多くの試料を分析し得ることができること;複数のカスタマイズ可能な標的数を同時に検出することができる迅速な診断ツールとして使用できること;より簡単であり容易なデータ分析;並びにそれらの任意の組み合わせが含まれる。
現在、標的化されたシーケンシングに使用されている2つの方法がある。第1のものは、アンプリコンシーケンシングである。この方法は、DNA増幅を介して目的とする領域を増幅するためにプライマーを使用することに依存する。この追加の増幅ステップは、標準的なライブラリー調製方法にさらなるコスト、時間、及び資源を追加する。第2の標的化されたシーケンシング方法は、標的捕捉である。この方法は、特定の核酸標的にハイブリダイズすることができるようにプローブ、又はプローブのプールを使用することに依存する。プローブのその標的へのハイブリダイゼーション及びこれらの標的の単離は、数日を要し得る時間のかかるプロセスである。さらに、この方法において使用されるプローブは、合成するのに高価である。
一部の実施形態では、dCAS9タンパク質に連結された高活性トランスポゼースTn5を使用することができる。dCAS9は、CAS9タンパク質の触媒死滅型であり、CAS9タンパク質のヌクレアーゼ活性は失われるが、プログラム可能なDNA結合活性は保持するように突然変異される。dCAS9タンパク質のN末端は、リンカー(例えば、X-TEN)、SNAPタグ又はCLIPタグを介してTn5トランスポゼースのC末端に付着される。両方のタンパク質を付着させるには、多くの異なる方法を用いることができるが。TN5トランスポゼースは、シーケンシング技術プラットフォームに特異的であるシーケンシングアダプターがロードされる。dCas9タンパク質には、ユーザーが定義した遺伝子座に特異的であるガイドRNA(sgRNA)が付着する。各々dCAS9タンパク質に結合した複数のsgRNAと、各々異なる遺伝子座を標的とする複数のsgRNAを用いて、複数の遺伝子座を選択する。
sgRNAに付着するdCAS9がsgRNA配列に相補的である分子を見つけると、付着したTn5トランスポゼースは特定の部位でDNAを切断し、その切断部位アダプターに付着して配列を決定することができる。最終結果は、シーケンシングの準備が整った標的化DNA断片であり、標的化されたライブラリー調製プロセスを数時間ではなく数分に短縮する(図3)。
sgRNAに付着するdCAS9がsgRNA配列に相補的である分子を見つけると、付着したTn5トランスポゼースは特定の部位でDNAを切断し、その切断部位アダプターに付着して配列を決定することができる。最終結果は、シーケンシングの準備が整った標的化DNA断片であり、標的化されたライブラリー調製プロセスを数時間ではなく数分に短縮する(図3)。
一部の実施形態では、Tn5トランスポゼースでない高活性トランスポゼースは、マリナーTc1様トランスポゾン、Himar1C9トランスポゼース、スリーピングビューティトランスポゼース、Tn7トランスポゾン、又はそれらの組み合わせであり得る。一部の実施形態では、dCas9タンパク質の代替物を、プログラム可能なDNA結合活性のために使用することができる。例えば、FOK1ヌクレアーゼに結合していない亜鉛フィンガーの使用を用いることができる。同様に、FOK1ヌクレアーゼをもたないTALEN分子を用いることもできる。一部の実施形態では、配列特異的プライマーと組み合わせたリコンビナーゼの使用は、プログラム可能なDNA結合分子として使用することができる。一部の実施形態では、遺伝子座特異的ライブラリーを作製するための代替の方法は、トランスポゼースの支援なしに、ゲノム編集ツール(例えば、Casタンパク質、亜鉛フィンガーヌクレアーゼ(ZFN)、転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、アルゴノートタンパク質)のみを使用することによって行うことができる。これは、遺伝子座特異的なシーケンシングライブラリーを作製するためにさらに使用することができる核酸(図4)のプログラム可能な断片化法をもたらす。
ゲノムの特定の領域を標的とするプログラム可能なツールとしてのゲノム編集ツールの使用、及びシーケンシングライブラリーを作製するのに必要なアダプターを切断及び貼り付けるためのトランスポゼースの使用が、本明細書に開示される。
ゲノムの特定の領域を標的とするプログラム可能なツールとしてのゲノム編集ツールの使用、及びシーケンシングライブラリーを作製するのに必要なアダプターを切断及び貼り付けるためのトランスポゼースの使用が、本明細書に開示される。
一部の実施形態は、病原体/疾患の原因(遺伝子突然変異)を同定し、同時に抗生物質に対する感受性を同定するように構成された疾患パネル(例えば、敗血症パネル)を提供する。一部の実施形態では、がんパネルは、がん細胞における複数の突然変異の同定を含むことができる。一部の実施形態では、稀な疾患パネルは、遺伝子疾患(例えば、嚢胞性線維症)に導くことができる突然変異と関連している特定の遺伝子座のシーケンシングを含むことができる。
以下の特許出願公開の各々は、その全体が参照により本明細書に組み込まれる:国際公開第2016028843A2号及び国際公開第2018175872A1号、米国特許出願公開第20190144920号、及びカナダ特許出願公開第3026206号。
以下の特許出願公開の各々は、その全体が参照により本明細書に組み込まれる:国際公開第2016028843A2号及び国際公開第2018175872A1号、米国特許出願公開第20190144920号、及びカナダ特許出願公開第3026206号。
本明細書に開示されるものには、組成物が含まれる。一部の実施形態では、組成物は、複数のタンパク質複合体を含む。一部の実施形態では、複数のタンパク質複合体の各々は、トランスポソームと、標的dsDNA上の結合部位に特異的に結合することができるプログラム可能なDNA結合ユニットとを含む。一部の実施形態では、トランスポソームは、トランスポゼース、第1のアダプター、及び第2のアダプターを含む。一部の実施形態では、複数のタンパク質複合体の各々に対する結合部位は、互いに異なる。
本明細書に開示されるものには、反応混合物が含まれる。一部の実施形態では、反応混合物は、本明細書に開示される組成物及び1種以上の標的dsDNAを含むことが疑われる試料核酸を含む。反応混合物は、DNAポリメラーゼ、dNTP、又はそれらの組み合わせを含むことができる。アダプターは、標的dsDNA又はその断片に共有結合的に付着され得る。反応混合物は、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含む複数のdsDNA断片を含むことができる。
本明細書に開示されるものには、核酸をタグ付けする方法が含まれる。一部の実施形態では、本方法は、本明細書に開示された組成物を、複数の標的dsDNAを含むことが疑われる試料と接触させて、反応混合物を形成することと、反応混合物をインキュベートして、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含む複数のdsDNA断片を生成することとを含む。
本明細書に開示されるものには、核酸をタグ付けする方法が含まれる。一部の実施形態では、本方法は、本明細書に開示された組成物を、複数の標的dsDNAを含むことが疑われる試料と接触させて、反応混合物を形成することと、反応混合物をインキュベートして、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含む複数のdsDNA断片を生成することとを含む。
本明細書に開示されるものには、シーケンシングライブラリーを生成する方法が含まれる。一部の実施形態では、本方法は、本明細書に開示される組成物を、複数の標的dsDNAを含むことが疑われる試料と接触させて、反応混合物を形成することを含む。本方法は、反応混合物をインキュベートして、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含む複数のdsDNA断片を生成することを含むことができる。複数の標的dsDNAを複数のタンパク質複合体対と接触させることは、約25~約85℃(例えば、約25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃、又はこれらの値の任意の2つの間の数値若しくは範囲)で行うことができる。反応混合物をインキュベートすることは、約37~約55℃(例えば、約37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、又はこれらの値の任意の2つの間の数値若しくは範囲)で反応混合物をインキュベートすることを含むことができる。
複数のタンパク質複合体対及び複数の標的dsDNAは、約2:1~約2000:1(例えば、2:1、2.5:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、21:1、22:1、23:1、24:1、25:1、26:1、27:1、28:1、29:1、30:1、31:1、32:1、33:1、34:1、35:1、36:1、37:1、38:1、39:1、40:1、41:1、42:1、43:1、44:1、45:1、46:1、47:1、48:1、49:1、50:1、51:1、52:1、53:1、54:1、55:1、56:1、57:1、58:1、59:1、60:1、61:1、62:1、63:1、64:1、65:1、66:1、67:1、68:1、69:1、70:1、71:1、72:1、73:1、74:1、75:1、76:1、77:1、78:1、79:1、80:1、81:1、82:1、83:1、84:1、85:1、86:1、87:1、88:1、89:1、90:1、91:1、92:1、93:1、94:1、95:1、96:1、97:1、98:1、99:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1、2000:1、又はこれらの値の任意の2つの間の数値若しくは範囲)の分子比で反応混合物中に存在することができる。一部の実施形態では、複数のタンパク質複合体対及び複数の標的dsDNAは、約2:1~約200:1(例えば、2:1、2.5:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、21:1、22:1、23:1、24:1、25:1、26:1、27:1、28:1、29:1、30:1、31:1、32:1、33:1、34:1、35:1、36:1、37:1、38:1、39:1、40:1、41:1、42:1、43:1、44:1、45:1、46:1、47:1、48:1、49:1、50:1、51:1、52:1、53:1、54:1、55:1、56:1、57:1、58:1、59:1、60:1、61:1、62:1、63:1、64:1、65:1、66:1、67:1、68:1、69:1、70:1、71:1、72:1、73:1、74:1、75:1、76:1、77:1、78:1、79:1、80:1、81:1、82:1、83:1、84:1、85:1、86:1、87:1、88:1、89:1、90:1、91:1、92:1、93:1、94:1、95:1、96:1、97:1、98:1、99:1、100:1、200:1、又はこれらの値の任意の2つの間の数値若しくは範囲)の分子比で反応混合物中に存在する。
複数のタンパク質複合体のうちの少なくとも2つの結合部位は、同じ標的dsDNA上にあり得る。複数のタンパク質複合体のうちの少なくとも2つの結合部位は、同じ標的dsDNA上で約1~50000ヌクレオチド離れていることができる。一部の実施形態では、複数のタンパク質複合体のうちの少なくとも2つの結合部位は、同じ標的dsDNA上に1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000ヌクレオチド若しくはほぼこれらの数値、又はこれらの値の任意の2つの間の数値若しくは範囲で離れていることができる。一部の実施形態では、複数のタンパク質複合体のうちの少なくとも2つの結合部位は、同じ標的dsDNA上に少なくとも若しくは多くとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、又は100000ヌクレオチド離れていることができる。複数のタンパク質複合体の一対の結合部位間の距離は、複数のタンパク質複合体の別の一対の結合部位間の距離と実質的に同じであり得る。複数のタンパク質複合体の一対の結合部位間の距離は、複数のタンパク質複合体の別の一対の結合部位間の距離と異なることができる。複数のタンパク質複合体のうちの少なくとも2つの結合部位は、標的dsDNAの異なる鎖上にあり得る。複数のタンパク質複合体のうちの少なくとも2つは、異なる標的dsDNAに特異的に結合することができる。複数のタンパク質複合体は、約2~5000の標的dsDNAに特異的に結合することができる。一部の実施形態では、複数のタンパク質複合体は、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、110、120、128、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3250、3500、3750、4000、4250、4500、4750、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000、又はこれらの値の任意の2つの間の数値若しくは範囲の標的dsDNAに特異的に結合することができる。
トランスポソーム
一部の実施形態では、トランスポソームは、トランスポゼース、第1のアダプター、及び第2のアダプターを含む。複数のタンパク質複合体のうちの少なくとも2つは、同じトランスポソームを含むことができる。複数のタンパク質複合体はすべて、同じトランスポソームを含むことができる。複数のタンパク質複合体はすべて、同じトランスポゼースを含むことができる。トランスポゼースは、Tn5トランスポゼース、Tn7トランスポゼース、マリナーTc1様トランスポゼース、Himar1C9トランスポゼース、又はスリーピングビューティトランスポゼースであり得る。トランスポゼースは、高活性トランスポゼースであり得る。
一部の実施形態では、トランスポソームは、トランスポゼース、第1のアダプター、及び第2のアダプターを含む。複数のタンパク質複合体のうちの少なくとも2つは、同じトランスポソームを含むことができる。複数のタンパク質複合体はすべて、同じトランスポソームを含むことができる。複数のタンパク質複合体はすべて、同じトランスポゼースを含むことができる。トランスポゼースは、Tn5トランスポゼース、Tn7トランスポゼース、マリナーTc1様トランスポゼース、Himar1C9トランスポゼース、又はスリーピングビューティトランスポゼースであり得る。トランスポゼースは、高活性トランスポゼースであり得る。
トランスポゼースは、Tn5、Tn7、MuA、又はビブリオ・ハーベリ(Vibrio harveyi)トランスポゼース、又はそれらの活性突然変異体であり得る。一部の実施形態では、トランスポゼースは、Tn5トランスポゼース又はその突然変異体である。一部の実施形態では、Tn5トランスポゼースは、高活性Tn5トランスポゼース、又はその活性突然変異体である。一部の実施形態では、Tn5トランスポゼースは、参照により本明細書に組み込まれる国際公開第2015/160895号に記載されるようなTn5トランスポゼースである。一部の実施形態では、Tn5トランスポゼースは、野生型Tn5トランスポゼースに対して54、56、372、212、214、251、及び338位に突然変異を有する高活性Tn5である。一部の実施形態では、Tn5トランスポゼースは、野生型Tn5トランスポゼースに対して以下の突然変異:E54K、M56A、L372P、K212R、P214R、G251R、及びA338Vを有する高活性Tn5である。一部の実施形態では、Tn5トランスポゼースは融合タンパク質である。一部の実施形態では、Tn5トランスポゼース融合タンパク質は、融合伸長因子Ts(Tsf)タグを含む。一部の実施形態では、Tn5トランスポゼースは、野生型配列に対してアミノ酸54、56、及び372に突然変異を含む高活性Tn5トトランスポゼースである。一部の実施形態では、高活性Tn5トランスポゼースは融合タンパク質である。一部の実施形態では、認識部位は、Tn5型トランスポゼース認識部位である。
トランスポゼースは、単一のタンパク質を含み得るか、又は複数のタンパク質サブユニットを含み得る。トランスポゼースは、トランスポゾン末端又はトランスポゾン末端配列と機能的複合体を形成することができる酵素であり得る。一部の実施形態では、トランスポゼース複合体は、第1の単量体及び第2の単量体を含むトランスポゼース(例えば、Tn5トランスポゼース)二量体を含む。一部の実施形態では、トランスポソーム複合体は、2分子のトランスポゼースの二量体を含む。
トランスポゼース及び/又はトランスポソームは、実施形態に依存して変動し得る。トランスポゼースは、Tn5トランスポゼースを含むことができる。トランスポゼースは、Tnトランスポゼース(例えば、Tn3、Tn5、Tn7、Tn10、Tn552、Tn903)、MuAトランスポゼース、Vibharトランスポゼース(例えば、ビブリオ・ハーベリ由来)、Ac-Ds、Ascot-1、Bs1、Cin4、Copia、En/Spm、Fエレメント、hobo、Hsmar1、Hsmar2、IN(HIV)、IS1、IS2、IS3、IS4、IS5、IS6、IS10、IS21、IS30、IS50、IS51、IS150、IS256、IS407、IS427、IS630、IS903、IS911、IS982、IS1031、ISL2、L1、マリナー、Pエレメント、Tam3、Tc1、Tc3、Tel、THE-1、Tn/O、TnA、Tn3、Tn5、Tn7、Tn10、Tn552、Tn903、Tol1、Tol2、Tn10、Ty1、任意の原核生物トランスポゼース、又は上記に列挙したものに関連する及び/若しくはそれらに由来する任意のトランスポゼースであり得る。一部の実施形態では、親トランスポゼースに関連する及び/又はそれに由来するトランスポゼースは、親トランスポゼースの対応するペプチド断片と少なくとも約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、又は約99%のアミノ酸配列相同性を有するペプチド断片を含むことができる。ペプチド断片は、長さが少なくとも約10、約15、約20、約25、約30、約35、約40、約45、約50、約60、約70、約80、約90、約100、約150、約200、約250、約300、約400、又は約500のアミノ酸であり得る。例えば、Tn5由来のトランスポゼースは、長さが50アミノ酸であり、親Tn5トランスポゼース中の対応する断片に約80%相同であるペプチド断片を含むことができる。場合によっては、挿入は、1つ以上のカチオンの付加によって促進及び/又は誘発され得る。カチオンは、例えば、Ca2+、Mg2+及びMn2+などの二価カチオンであり得る。
アダプター
同じトランスポソーム内の第1のアダプター及び第2のアダプターは同じであり得る。第1のアダプター、第2のアダプター、又はその両方は、異なるトランスポソーム中で異なることができる。第1のアダプター、第2のアダプター、又はその両方は、dsDNA又はRNA/DNA二重鎖であり得る。アダプターは、長さが約3~200塩基対(例えば、長さが約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、150、200、又はこれらの値の任意の2つの間の数値若しくは範囲のヌクレオチド)であり得る。一部の実施形態では、アダプターは、長さが3~500塩基対(例えば、長さが約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、150、200、300、500、又はこれらの値の任意の2つの間の数値若しくは範囲のヌクレオチド)であり得る。第1のアダプター、第2のアダプター、又はその両方は、シーケンシングアダプターであり得る。シーケンシングアダプターは、所定のシーケンシングプロトコールにおいて採用される1種以上の構成成分、例えば、シーケンシングプラットフォームアダプター構築物、インデックス化ドメイン、クラスター化ドメインなどを含むことができる。シーケンシングアダプターは、P5又はP7プライマー配列を含むことができる。一部の実施形態では、第1のアダプター及び/又は第2のアダプターは、バーコード(例えば、確率バーコード)を含む。一部の実施形態では、第1のアダプター及び/又は第2のアダプターは、ユニバーサル配列を含む。一部の実施形態では、第1のアダプター及び/又は第2のアダプターは、一本鎖部分及び/又は二本鎖部分を含む。一部の実施形態では、アダプターは、トランスポゼースに結合するトランスポゾン末端配列を含む。トランスポゾン末端配列は二本鎖であり得る。一部の実施形態では、トランスポゾン末端配列はモザイク末端(ME)配列である。特定の実施形態では、トランスポゾン末端はモザイク末端、又はトランスポゾン末端の高活性型である。アダプター配列は、2つのトランスポゾン末端配列のうちの1つに付着することができる。したがって、一部の実施形態では、第1のアダプタートランスポゾン末端配列はME配列であり、第2のアダプター末端配列はME’配列である。
同じトランスポソーム内の第1のアダプター及び第2のアダプターは同じであり得る。第1のアダプター、第2のアダプター、又はその両方は、異なるトランスポソーム中で異なることができる。第1のアダプター、第2のアダプター、又はその両方は、dsDNA又はRNA/DNA二重鎖であり得る。アダプターは、長さが約3~200塩基対(例えば、長さが約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、150、200、又はこれらの値の任意の2つの間の数値若しくは範囲のヌクレオチド)であり得る。一部の実施形態では、アダプターは、長さが3~500塩基対(例えば、長さが約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、150、200、300、500、又はこれらの値の任意の2つの間の数値若しくは範囲のヌクレオチド)であり得る。第1のアダプター、第2のアダプター、又はその両方は、シーケンシングアダプターであり得る。シーケンシングアダプターは、所定のシーケンシングプロトコールにおいて採用される1種以上の構成成分、例えば、シーケンシングプラットフォームアダプター構築物、インデックス化ドメイン、クラスター化ドメインなどを含むことができる。シーケンシングアダプターは、P5又はP7プライマー配列を含むことができる。一部の実施形態では、第1のアダプター及び/又は第2のアダプターは、バーコード(例えば、確率バーコード)を含む。一部の実施形態では、第1のアダプター及び/又は第2のアダプターは、ユニバーサル配列を含む。一部の実施形態では、第1のアダプター及び/又は第2のアダプターは、一本鎖部分及び/又は二本鎖部分を含む。一部の実施形態では、アダプターは、トランスポゼースに結合するトランスポゾン末端配列を含む。トランスポゾン末端配列は二本鎖であり得る。一部の実施形態では、トランスポゾン末端配列はモザイク末端(ME)配列である。特定の実施形態では、トランスポゾン末端はモザイク末端、又はトランスポゾン末端の高活性型である。アダプター配列は、2つのトランスポゾン末端配列のうちの1つに付着することができる。したがって、一部の実施形態では、第1のアダプタートランスポゾン末端配列はME配列であり、第2のアダプター末端配列はME’配列である。
第1のアダプター及び/又は第2のアダプターは、修飾されるか又はそうでなければ天然に存在しない1種以上のヌクレオチド(又はその類似体)を含むことができる。例えば、第1のアダプター及び/又は第2のアダプターは、1種以上のヌクレオチド類似体(例えば、LNA、FANA、2’-O-Me RNA、2’-フルオロRNAなど)、連結修飾(例えば、ホスホロチオエート、3’-3’及び5’-5’逆連結)、5’及び/又は3’末端修飾(例えば、5’及び/又は3’アミノ、ビオチン、DIG、リン酸塩、チオール、色素、消光剤など)、1種以上の蛍光標識されたヌクレオチド、又は所望の機能性を提供する任意の他の特徴を含むことができる。
第1のアダプター及び/又は第2のアダプターは、シーケンシングプラットフォームアダプター構築物の全部又は構成成分を含むことができる。「シーケンシングプラットフォームアダプター構築物」とは、Illumina(登録商標)(例えば、HiSeq(商標)、MiSeq(商標)及び/又はGenome Analyzer(商標)シーケンシングシステム);Ion Torrent(商標)(例えば、Ion PGM(商標)及び/又はIon Proton(商標)シーケンシングシステム);Pacific Biosciences(例えば、PACBIO RS IIシーケンシングシステム);Life Technologies(商標)(例えば、SOLiDシーケンシングシステム);Roche(例えば、454GS FLX+及び/又はGS Juniorシーケンシングシステム);又は目的とする任意の他のシーケンシングプラットフォームによって提供されるシーケンシングプラットフォームなどの、目的とするシーケンシングプラットフォームによって利用される核酸ドメイン(例えば、シーケンシングプラットフォームアダプター核酸配列)の少なくとも一部を含む核酸構築物を意味する。第1のアダプター及び/又は第2のアダプターは、表面に付着したシーケンシングプラットフォームオリゴヌクレオチド(例えば、Illumina(登録商標)シーケンシングシステムにおいてフローセルの表面に付着したP5又はP7オリゴヌクレオチド)に特異的に結合するドメイン(例えば、「捕捉部位」又は「捕捉配列」);シーケンシングプライマー結合ドメイン(例えば、Illumina(登録商標)プラットフォームのリード1又はリード2プライマーが結合し得るドメイン);バーコードドメイン(例えば、特定のバーコード又は「タグ」で所与の試料からのすべての分子をマーキングすることによって試料の多重化を可能にするためにシーケンシングされる核酸の試料源を固有に同定するドメイン);バーコードシーケンシングプライマー結合ドメイン(バーコードをシーケンシングするために使用されるプライマーが結合するドメイン);分子同定ドメイン(例えば、4、6、又は他の数のヌクレオチドのランダム化されたタグなどの分子インデックスタグ)であって、固有のタグがシーケンシングされる事例の数に基づいて発現レベルを決定するために、目的とする分子を固有にマーキングするためのもの;又はこのようなドメインの任意の組み合わせから選択される1種以上の核酸ドメインを含むことができる。一部の実施形態では、バーコードドメイン(例えば、試料インデックスタグ)及び分子同定ドメイン(例えば、分子インデックスタグ)は、同じ核酸に含まれ得る。
シーケンシングプラットフォームアダプタードメインは、第1のアダプター及び/又は第2のアダプターに存在する場合、目的とするシーケンシングプラットフォームに適した任意の長さ及び配列の1種以上の核酸ドメインを含むことができる。核酸ドメインは、目的とするシーケンシングプラットフォームによって採用されるポリヌクレオチド(例えば、オリゴヌクレオチド)が、例えば、核酸ドメインに隣接するcDNA挿入物の合成による固相増幅及び/又はシーケンシングのために、核酸ドメインに特異的に結合することを可能にする長さ及び配列を有し得る。例示的な核酸ドメインは、Illumina(登録商標)ベースのシーケンシングプラットフォーム上で採用されるP5、P7、リード1プライマー及びリード2プライマードメインを含む。他の例示的な核酸ドメインは、Ion Torrent(商標)ベースのシーケンシングプラットフォーム上で採用されるAアダプター及びP1アダプタードメインを含む。
目的とするシーケンシングプラットフォーム上でのシーケンシングに有用な核酸ドメインのヌクレオチド配列は、経時的に変動及び/又は変化し得る。アダプター配列は、典型的には、シーケンシングプラットフォームの製造者によって提供される(例えば、シーケンシングシステムとともに提供される技術文書及び/又は製造者のウェブサイトで利用可能である)。このような情報に基づいて、本明細書に提供されるアダプターの配列は、目的とするプラットフォーム上の標的dsDNAのシーケンシングを可能にする構成において、1種以上の核酸ドメインのすべて又は一部を含むように設計することができる。
第1のアダプター及び/又は第2のアダプターは、Ion Torrent(商標)シーケンシングプラットフォーム(例えば、Ion PGM(商標)及び/又はIon Proton(商標)シーケンシングシステム)の構成成分を含むことができる。第1のアダプター及び/又は第2のアダプターは、P1アダプター、Aアダプター、Ion Xpress(商標)バーコードアダプター、Ion P1アダプター、及び/又はIon Xpress(商標)バーコードXアダプターを含むことができる。
第1のアダプター及び/又は第2のアダプターは、ヘアピンを含むことができる。第1のアダプター及び/又は第2のアダプターは、SMRTbell(商標)技術ライブラリーを生成するように構成することができる。本明細書に提供される方法は、二本鎖断片の末端にライゲートされたヘアピンアダプターをもたらし、末端に中心の二本鎖部分及び一本鎖ヘアピンループを有する環状鋳型分子を生成することができる(Pacific Biosciences(登録商標)のSMRTbell(商標)を参照されたい)。SMRTBELL(登録商標)鋳型などの環状鋳型を調製及び使用するための方法は、例えば、「クローナルシーケンシングのためのDNAのエラーフリー増幅」と題する米国特許第8,003,330号、及び「核酸試料調製のための方法及び組成物」と題する米国特許出願公開第2009/0280538号に記載され、全開示は、すべての目的のために参照により本明細書に組み込まれる。
第1のアダプター及び/又は第2のアダプターは、ONT機器(例えば、SmidgION、MinION、GridION、PromethION)上のタグ付き核酸の下流での使用のために構成することができる。図6は、ONT迅速シーケンシングキット、タグメンテーションベースの迅速シーケンシングキットを示す非限定的であり例示的な実施形態を示す。第1のアダプター及び/又は第2のアダプターは、(i)スペーサー;(ii)モータータンパク質の活性部位がスペーサーによって占められる、スペーサー上でストールしたモータータンパク質;及び/又は(iii)ブロッキング部分が、モータータンパク質がスペーサーから移動するのを妨げる、アダプターに結合したブロッキング部分を含むことができる。第1のアダプター及び/又は第2のアダプターは、ヘアピンループアダプターを含むことができる。ヘアピンループアダプターは、一本のポリヌクレオチド鎖を含むアダプターであり得、ポリヌクレオチド鎖の末端は互いにハイブリダイズすることができるか、又は互いにハイブリダイズされ、ポリヌクレオチドの中央部分はループを形成する。適切なヘアピンループアダプターは、当該技術分野において公知である方法を使用して設計することができる。第1のアダプター及び/又は第2のアダプターは、直鎖状アダプターを含むことができる。第1のアダプター及び/又は第2のアダプターは、Yアダプターであり得る。Yアダプターは、典型的には、ポリヌクレオチドアダプターである。Yアダプターは、典型的には、二本鎖であり、(a)一端において、2本の鎖が互いにハイブリダイズする領域、及び(b)他端において、2本の鎖が相補的でない領域を含む。鎖の非相補的部分は、典型的には突出部を形成する。Yアダプター内に非相補的領域が存在すると、2本の鎖は、典型的には、二本鎖部分とは異なり互いにハイブリダイズしないため、アダプターのY形状が得られる。Yアダプターの2つの一本鎖部分は、同じ長さであり得るか又は異なる長さであり得る。モータータンパク質は、Yアダプターなどのアダプターの突出部に結合することができる。一部の実施形態では、モータータンパク質は、二本鎖領域に結合し得る。一部の実施形態では、モータータンパク質は、アダプターの一本鎖領域及び/又は二本鎖領域に結合し得る。一部の実施形態では、第1のモータータンパク質は、このようなアダプターの一本鎖領域に結合することができ、第2のモータータンパク質は、アダプターの二本鎖領域に結合することができる。第1のアダプター及び/又は第2のアダプターは、ナノ細孔シーケンシング反応を促進するさらなる結合した構成成分、例えば、結合酵素(例えば、ヘリカーゼ、ポリメラーゼ、又は他のモータータンパク質)、膜結合部分(例えば、コレステロール)などを含むことができる。典型的には、モータータンパク質は、ヘリカーゼ、ポリメラーゼ、エキソヌクレアーゼ、トポイソメラーゼ、又はそれらのバリアントである。一部の実施形態では、ポリヌクレオチドアダプターのスペーサー上のモータータンパク質は、(スペーサーの末端を通過すること以外の)モータータンパク質がスペーサーから離れることを防止するように修飾される。モータータンパク質は、任意の適切な方法で適合させることができる。図7A~図7Hは、Oxford Nanoporeからのものなどの既存のシーケンシングプラットフォームにおいて使用するためのシーケンシングライブラリーを生成するためのゲノム編集タグメンテーション(GET)の非限定的であり例示的な実施形態を示す。
本明細書に提供されるアダプター(例えば、第1のアダプター及び/又は第2のアダプター)は、バーコード、例えば、確率バーコードを含むことができ、1種以上の標識を含むことができる。例えば、Fu et al., Proc Natl Acad Sci U.S.A., 2011 May 31,108(22):9026-31;米国特許出願公開第2011/0160078号; Fan et al., Science, 2015, 347(6222):1258367;米国特許出願公開第2015/0299784号;国際公開第2015/031691号には、確率バーコーディングなどのバーコーディングが記載されており、これらの各々の内容は、任意の支持若しくは補足情報又は材料を含み、その全体が参照により本明細書に組み込まれる。一部の実施形態では、本明細書に開示されるバーコードは、標的を確率的に標識(例えば、バーコード、タグ)するために使用され得るポリヌクレオチド配列であり得る確率バーコードであり得る。確率バーコードの異なるバーコード配列の数と、標識されるべき標的のうちのいずれかの出現の数との比が、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1若しくはほぼこれらの数値、又はこれらの値の任意の2つの間の数値若しくは範囲であり得る場合、バーコードは確率バーコードと称することができる。標的は、同一又はほぼ同一の配列を有するmRNA分子を含むmRNA種であり得る。確率バーコードの異なるバーコード配列の数と、標識されるべき標的のうちのいずれかの出現の数との比が少なくとも若しくは多くとも1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1である場合、バーコードは確率バーコードと称することができる。確率バーコードのバーコード配列を分子標識と称することができる。
アダプター及び/又はバーコードは、1種以上のユニバーサル標識を含むことができる。一部の実施形態では、1種以上のユニバーサル標識は、すべてのバーコード及び/又はアダプターに対して同じであり得る。一部の実施形態では、ユニバーサル標識は、シーケンシングプライマーにハイブリダイズすることができる核酸配列を含むことができる。シーケンシングプライマーは、ユニバーサル標識を含むバーコードをシーケンシングするために使用することができる。シーケンシングプライマー(例えば、ユニバーサルシーケンシングプライマー)は、ハイスループットシーケンシングプラットフォームと関連するシーケンシングプライマーを含むことができる。一部の実施形態では、ユニバーサル標識は、PCRプライマーにハイブリダイズすることができる核酸配列を含むことができる。一部の実施形態では、ユニバーサル標識は、シーケンシングプライマー及びPCRプライマーにハイブリダイズすることができる核酸配列を含むことができる。シーケンシング又はPCRプライマーにハイブリダイズすることができるユニバーサル標識の核酸配列は、プライマー結合部位と称することができる。ユニバーサル標識は、バーコードの転写を開始するために使用することができる配列を含むことができる。ユニバーサル標識は、バーコード又はバーコード内の領域の伸長に使用できる配列を含むことができる。ユニバーサル標識は、長さが、1、2、3、4、5、10、15、20、25、30、35、40、45、50若しくはほぼこれらの数値、又はこれらの値の任意の2つの間の数値若しくは範囲のヌクレオチドであり得る。例えば、ユニバーサル標識は、少なくとも約10ヌクレオチドを含むことができる。ユニバーサル標識は、長さが少なくとも若しくは多くとも1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、又は300ヌクレオチドであり得る。
バーコード、例えば、確率バーコードは、1種以上の標識を含むことができる。例示的な標識には、ユニバーサル標識、細胞標識、バーコード配列(例えば、分子標識)、試料標識、プレート標識、空間標識、及び/又はプレ空間標識を含むことができる。バーコードは、ユニバーサル標識、寸法標識、空間標識、細胞標識、及び/又は分子標識を含むことができる。バーコード中の異なる標識(限定されないが、ユニバーサル標識、寸法標識、空間標識、細胞標識、及び分子標識を含む)の順序は、変動し得る。例えば、ユニバーサル標識は5’最大標識であり得、分子標識は3’最大標識であり得る。空間標識、寸法標識、及び細胞標識は、任意の順序であり得る。一部の実施形態では、ユニバーサル標識、空間標識、寸法標識、細胞標識、及び分子標識は、任意の順序である。一部の実施形態では、バーコードの標識(例えば、ユニバーサル標識、寸法標識、空間標識、細胞標識、及びバーコード配列)は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、若しくは20又はそれ以上のヌクレオチドによって分離され得る。
標識、例えば、細胞標識は、定義された長さ、例えば、各々7つのヌクレオチド(いくつかのハミングエラー訂正コードにおいて使用されるビットの数に等しい)の固有の核酸サブ配列のセットを含み得、エラー訂正能力を提供するように設計され得る。7つのヌクレオチド配列を含むエラー訂正サブ配列のセットは、セット中の配列の任意の対になった組み合わせが、定義された「遺伝子距離」(又はミスマッチ塩基の数)を示すように設計することができ、例えば、エラー訂正サブ配列のセットは、3つのヌクレオチドの遺伝子距離を示すように設計することができる。この場合、標識された標的核酸分子(以下により十分に記載される)についての配列データのセットにおけるエラー訂正配列の総説は、増幅又はシーケンシングエラーを検出又は訂正することを可能にすることができる。一部の実施形態では、エラー訂正コードを作製するために使用される核酸サブ配列の長さは変動することができ、例えば、1、2、3、4、5、6、7、8、9、10、15、20、30、31、40、50若しくはほぼこれらの数値、又はこれらの値の任意の2つの間の数値若しくは範囲のヌクレオチドの長さであり得る。一部の実施形態では、他の長さの核酸サブ配列は、エラー訂正コードを作製するために使用することができる。
CRISPR関連タンパク質
プログラム可能なDNA結合ユニットは、ヌクレアーゼ欠損CRISPR関連タンパク質(dCASタンパク質)と、標的dsDNAの結合部位に特異的に結合することができるガイドRNA(gRNA)とを含むことができる。dCASタンパク質は、dCAS9、dCAS12、dCAS13、dCAS14、又はSpRY dCASであり得る。dCAS13タンパク質は、dCAS13a、dCAS13b、dCAS13c、又はdCAS13dであり得る。
プログラム可能なDNA結合ユニットは、ヌクレアーゼ欠損CRISPR関連タンパク質(dCASタンパク質)と、標的dsDNAの結合部位に特異的に結合することができるガイドRNA(gRNA)とを含むことができる。dCASタンパク質は、dCAS9、dCAS12、dCAS13、dCAS14、又はSpRY dCASであり得る。dCAS13タンパク質は、dCAS13a、dCAS13b、dCAS13c、又はdCAS13dであり得る。
一部の実施形態では、Cas9タンパク質は、不活性な(例えば、不活性化された)DNA切断ドメインを有する。ヌクレアーゼで不活性化されたCas9タンパク質は、互換的に「dCas9」タンパク質(ヌクレアーゼ死滅型Cas9の場合)と称することができる。不活性なDNA切断ドメインを有するCas9タンパク質(又はその断片)を生成する方法は公知である(例えば、各々の全内容が参照により本明細書に組み込まれるJinek et al., Science.337:816-821(2012); Qi et al., (2013) Cell.28; 152(5): 1173-83を参照されたい)。例えば、Cas9のDNA切断ドメインは、2つのサブドメインであるHNHヌクレアーゼサブドメイン及びRuvC1サブドメインを含むことが公知である。HNHサブドメインは、gRNAに相補的である鎖を切断するが、RuvClサブドメインは非相補的な鎖を切断する。これらのサブドメイン内の突然変異は、Cas9のヌクレアーゼ活性を沈黙させることができる。例えば、突然変異D10A及びH840Aは、S.ピオゲネス(S. pyogenes)Cas9のヌクレアーゼ活性を完全に不活性化する(Jinek et al., and Qi et al.)。
プログラム可能なDNA結合ユニットは、ガイドRNAになおも結合することができる適切なヌクレアーゼ欠損Casタンパク質を含むことができる。プログラム可能なDNA結合ユニットは、クラス2タイプII Casタンパク質を含むことができる。クラス2タイプII Casタンパク質は、野生型の対応物と比較して突然変異したCasタンパク質であり得る。突然変異したCasタンパク質は、ヌクレアーゼ欠損であり得る。突然変異したCasタンパク質は、突然変異したCas9であり得る。突然変異したCas9は、Cas9D10Aであり得る。Cas9における突然変異の他の例としては、H820A、D839A、H840A、N863A、又はそれらの任意の組み合わせ、例えば、D10A/H820A、D10A、D10A/D839A/H840A、及びD10A/D839A/H840A/N863Aが挙げられる。本明細書に記載される突然変異は、SpCas9を参照しており、SpCas9以外のCRISPRタンパク質における類似の突然変異も含む。プログラム可能なDNA結合ユニットは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)Cas9(SpCas9)、スタフィロコッカス・アウレウス(Staphylococcus aureus)Cas9(SaCas9)、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、Cpf1、C2c1、C2c3、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、その誘導体、又はそれらの任意の組み合わせを含むことができる。様々な種のCas9分子を、本明細書に記載される方法及び組成物において使用することができる。S.ピオゲネス及びS.アウレウス(S. aureus)Cas9分子は、本明細書中の開示の大部分の主題であるが、本明細書に列挙される他の種のCas9タンパク質のCas9分子、それ由来のCas9分子、又はそれに基づくCas9分子を同様に使用することができる。これらには、例えば、アシドボラックス・アベナエ(Acidovorax avenae)、アクチノバチルス・プルウロニューモニエ(Actinobacillus pleuropneumoniae)、アクチノバチルス・スクシノゲネス(Actinobacillus succinogenes)、アクチノバチルス・スイス(Actinobacillus suis)、アクチノミセス属種(Actinomyces sp.)、シクリフィルス・デニトリフィカンス(cycliphilus denitrificans)、アミノモナス・パウシボランス(Aminomonas paucivorans)、バチルス・セレウス(Bacillus cereus)、バチルス・スミスイ(Bacillus smithii)、バチルス・チューリンゲンシス(Bacillus thuringiensis)、バクテロイデス属種(Bacteroides sp.)、ブラストピレルラ・マリーナ(Blastopirellula marina)、ブラディリゾビウム属種(Bradyrhizobium sp.)、ブレビバチルス・ラテロスポラス(Brevibacillus laterosporus)、カンピロバクター・コリ(Campylobacter coli)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、カンピロバクター・ラリ(Campylobacter lari)、カンジダトゥス・プニセイスピリラム(Candidatus Puniceispirillum)、クロストリジウム・セルロリティクム(Clostridium cellulolyticum)、クロストリジウム・パーフリンゲンス(Clostridium perfringens)、コリネバクテリウム・アコレンス(Corynebacterium accolens)、コリネバクテリウム・ジフテリア(Corynebacterium diphtheria)、コリネバクテリウム・マトゥルコティ(Corynebacterium matruchotii)、ディノロセオバクター・シバエ(Dinoroseobacter shibae)、ユーバクテリウム・ドリクム(Eubacterium dolichum)、ガンマプロテオバクテリウム(gamma proteobacterium)、グルコンアセトバクター・ジアゾトロフィカス(Gluconacetobacter diazotrophicus)、ヘモフィルス・パラインフルエンザ(Haemophilus parainfluenzae)、ヘモフィルス・スプトルム(Haemophilus sputorum)、ヘリコバクター・カナデンシス(Helicobacter canadensis)、ヘリコバクター・シナエディ(Helicobacter cinaedi)、ヘリコバクター・ムステラエ(Helicobacter mustelae)、イリオバクター・ポリトロパス(Ilyobacter polytropus)、キンゲラ・キンゲ(Kingella kingae)、ラクトバチルス・クリスパツス(Lactobacillus crispatus)、リステリア・イバノヴィ(Listeria ivanovii)、リステリア・モノサイトゲネス(Listeria monocytogenes)、リステリア・バクテリウム(Listeriaceae bacterium)、メチロシスティス属種(Methylocystis sp.)、メチロシヌス・トリコスポリウム(Methylosinus trichosporium)、モビルンカス・ムリエリス(Mobiluncus mulieris)、ナイセリア・バシリフォルミス(Neisseria bacilliformis)、ナイセリア・シネレア(Neisseria cinerea)、ナイセリア・フラベセンス(Neisseria flavescens)、ナイセリア・ラクタミカ(Neisseria lactamica)、ナイセリア・メニンギチジス(Neisseria meningitidis)、ナイセリア属種(Neisseria sp.)、ナイセリア・ワズウォルチイ(Neisseria wadsworthii)、ニトロソモナス属種(Nitrosomonas sp.)、パルビバクルム・ラヴァメンチボランス(Parvibaculum lavamentivorans)、パスツレラ・ムルトシダ(Pasteurella multocida)、ファスコラルクトバクテリウム・サクシナツテンス(Phascolarctobacterium succinatutens)、ラルストニア・シジギイ(Ralstonia syzygii)、ロドプシュードモナス・パルストリス(Rhodopseudomonas palustris)、ロドブルム属種(Rhodovulum sp.)、シモンシエラ・ムエレリ(Simonsiella muelleri)、スフィンゴモナス属種(Sphingomonas sp.)、スポロラクトバチルス・ヴィネエ(Sporolactobacillus vineae)、スタフィロコッカス・ルグドゥネンシス(Staphylococcus lugdunensis)、ストレプトコッカス属種(Streptococcus sp.)、スブドリグラヌラム属種(Subdoligranulum sp.)、チストレラ・モビリス(Tistrella mobilis)、トレポネーマ属種(Treponema sp.)、又はベルミネフロバクター・エイセニアエ(Verminephrobacter eiseniae)由来のCas9分子が含まれる。触媒的に不活性化する突然変異、及び上記突然変異体のヌクレアーゼ活性を評価する手段は、当業者に公知である。
プログラム可能なDNA結合ユニットは、ガイド分子を含むことができる。ガイドRNA分子(sgRNA)は、標的特異的なcrRNAと、Cas分子に結合するtracrRNAとの2つの別々の分子で構成され得る。一部の実施形態では、crRNA及びtracrRNAは、別個の分子として提供され、1つは機能的なsgRNAにするためにアニールしなければならない。本明細書で使用される場合、用語「ガイド配列」及び「ガイド分子」は、CRISPR-Casシステムとの関連で、選択された結合部位とハイブリダイズするために選択された結合部位と十分な相補性を有する任意のポリヌクレオチド配列、及び選択された結合部位へのプログラム可能なDNA結合ユニットの直接的な配列特異的結合を含む。gRNA分子は、gRNA分子/Cas9分子複合体の標的結合部位への特異的標的化又はホーミングを促進する核酸を指すことができる。gRNA分子は、単分子(単一RNA分子を有する)(例えば、キメラ)又はモジュラー(1を超える、典型的には2つの別々のRNA分子を含む)であり得る。本明細書に開示される方法を用いて作製されるガイド配列は、全長ガイド配列、切断型ガイド配列、全長sgRNA配列、切断型sgRNA配列、又はE+F sgRNA配列であり得る。一部の実施形態では、適切なアラインメントアルゴリズムを用いて最適に整列された場合、所与の結合部位に対するガイド配列の相補性の程度は、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%又はそれ以上である。ある特定の例示的な実施形態では、ガイド分子は、ガイド配列と結合部位の間にRNA二重鎖が形成するように、結合部位と少なくとも1つのミスマッチを有するように設計され得るガイド配列を含む。したがって、相補性の程度は好ましくは99%未満である。例えば、ガイド配列が24ヌクレオチドからなる場合、相補性の程度は、より具体的には約96%又はそれ未満である。特定の実施形態では、ガイド配列は、ガイド配列全体にわたる相補性の程度がさらに減少するように、2種以上の隣接するミスマッチヌクレオチドのストレッチを有するように設計される。例えば、ガイド配列が24ヌクレオチドからなる場合、相補性の程度は、2種以上のミスマッチヌクレオチドのストレッチが2、3、4、5、6又は7個のヌクレオチドなどを含むかどうかに依存して、より具体的には約96%又はそれ未満、より具体的には約92%又はそれ未満、より具体的には約88%又はそれ未満、より具体的には約84%又はそれ未満、より具体的には約80%又はそれ未満、より具体的には約76%又はそれ未満、より具体的には約72%又はそれ未満である。一部の実施形態では、1種以上のミスマッチヌクレオチドのストレッチを除き、適切なアラインメントアルゴリズムを用いて最適に整列された場合の相補性の程度は、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%又はそれ以上である。最適アラインメントは、配列を整列させるための任意の適切なアルゴリズムを使用して決定することができ、その非限定的な例には、Smith-Watermanアルゴリズム、Needleman-Wunschアルゴリズム、Burrows-Wheeler変換に基づくアルゴリズム(例えば、Burrows Wheeler Aligner)、Clustal W、Clustal X、Clustal Omega、BLAT、Novoalign(Novocraft Technologies;www.novocraft.comで入手可能)、ELAND(Illumina、San Diego、CA)、SOAP(soap.genomics.org.cnで入手可能)、及びMaq(maq.sourceforge.netで入手可能)が挙げられる。選択された結合部位へのプログラム可能なDNA結合ユニットの配列特異的結合を指示するガイド配列(核酸標的化ガイドRNA内)の能力は、任意の適切なアッセイによって評価され得る。一部の実施形態では、ガイド配列は、長さが10~50ntであるが、より具体的には約20~30nt、有利には約20nt、23~25nt又は24ntのRNA配列である。ガイド配列は、それが選択された結合部位にハイブリダイズすることを確実にするように選択することができる。
死滅型ガイド配列
プログラム可能なDNA結合ユニットは、CRISPR関連タンパク質(CASタンパク質)と、標的dsDNAの結合部位に特異的に結合することができるガイドRNA(gRNA)とを含むことができる。一部の実施形態では、ガイド配列は、CRISPR Cas複合体の形成を可能にし、結合部位への結合に成功し、一方で同時に、成功するヌクレアーゼ活性を許容しない様式で修飾される。このような修飾されたガイド配列は、「死滅型ガイド」又は「死滅型ガイド配列」と称される。これらの死滅型ガイド又は死滅型ガイド配列は、ヌクレアーゼ活性に関して触媒的に不活性であるか又は立体構造的に不活性であると考えることができる。プログラム可能なDNA結合ユニットは、機能的Casタンパク質及びガイドRNA(gRNA)又はcrRNAを含むことができ、gRNA又はcrRNAは、死滅型ガイド配列を含み、それにより、gRNAは、Casタンパク質が、非突然変異体Casタンパク質の検出可能な切断活性なしに選択された結合部位に向けられるように、選択された結合部位にハイブリダイズすることができる。CRISPR複合体の結合部位への配列特異的結合を指示する死滅型ガイド配列の能力は、任意の適切なアッセイによって評価され得る。死滅型ガイド配列は、典型的には、活性切断をもたらすそれぞれのガイド配列よりも短くすることができる。特定の実施形態では、死滅型ガイドは、同じ結合部位に向けられたそれぞれのガイドよりも5%、10%、20%、30%、40%、50%短い。
プログラム可能なDNA結合ユニットは、CRISPR関連タンパク質(CASタンパク質)と、標的dsDNAの結合部位に特異的に結合することができるガイドRNA(gRNA)とを含むことができる。一部の実施形態では、ガイド配列は、CRISPR Cas複合体の形成を可能にし、結合部位への結合に成功し、一方で同時に、成功するヌクレアーゼ活性を許容しない様式で修飾される。このような修飾されたガイド配列は、「死滅型ガイド」又は「死滅型ガイド配列」と称される。これらの死滅型ガイド又は死滅型ガイド配列は、ヌクレアーゼ活性に関して触媒的に不活性であるか又は立体構造的に不活性であると考えることができる。プログラム可能なDNA結合ユニットは、機能的Casタンパク質及びガイドRNA(gRNA)又はcrRNAを含むことができ、gRNA又はcrRNAは、死滅型ガイド配列を含み、それにより、gRNAは、Casタンパク質が、非突然変異体Casタンパク質の検出可能な切断活性なしに選択された結合部位に向けられるように、選択された結合部位にハイブリダイズすることができる。CRISPR複合体の結合部位への配列特異的結合を指示する死滅型ガイド配列の能力は、任意の適切なアッセイによって評価され得る。死滅型ガイド配列は、典型的には、活性切断をもたらすそれぞれのガイド配列よりも短くすることができる。特定の実施形態では、死滅型ガイドは、同じ結合部位に向けられたそれぞれのガイドよりも5%、10%、20%、30%、40%、50%短い。
タンパク質構成成分
プログラム可能なDNA結合ユニットは、標的dsDNA上の結合部位に特異的に結合することができるタンパク質構成成分を含むことができる。タンパク質構成成分は、エンドヌクレアーゼ欠損ジンクフィンガーヌクレアーゼ(ZFN)、エンドヌクレアーゼ欠損転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、アルゴノートタンパク質、エンドヌクレアーゼ欠損メガヌクレアーゼ、リコンビナーゼ、又はそれらの組み合わせを含むことができる。一部の実施形態では、プログラム可能なDNA結合ユニットは、ヌクレアーゼドメインを有さない。一部の実施形態では、プログラム可能なDNA結合ユニットは、1種以上の突然変異を介して触媒的に不活性にされたヌクレアーゼドメインを有する。触媒的に不活性化する突然変異及び上記突然変異体のヌクレアーゼ活性を評価する手段は、当業者に公知である。
プログラム可能なDNA結合ユニットは、標的dsDNA上の結合部位に特異的に結合することができるタンパク質構成成分を含むことができる。タンパク質構成成分は、エンドヌクレアーゼ欠損ジンクフィンガーヌクレアーゼ(ZFN)、エンドヌクレアーゼ欠損転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、アルゴノートタンパク質、エンドヌクレアーゼ欠損メガヌクレアーゼ、リコンビナーゼ、又はそれらの組み合わせを含むことができる。一部の実施形態では、プログラム可能なDNA結合ユニットは、ヌクレアーゼドメインを有さない。一部の実施形態では、プログラム可能なDNA結合ユニットは、1種以上の突然変異を介して触媒的に不活性にされたヌクレアーゼドメインを有する。触媒的に不活性化する突然変異及び上記突然変異体のヌクレアーゼ活性を評価する手段は、当業者に公知である。
転写アクチベーター様エフェクター(TALE)
プログラム可能なDNA結合ユニットは、エンドヌクレアーゼ欠損転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、その機能的断片、又はそのバリアントを含むことができる。転写アクチベーター様エフェクター(TALE)は、実質的に任意の所望のDNA配列に結合するように操作することができる。TALENシステムを使用する標的化の例示的な方法は、例えば、Cermak T. Doyle EL. Christian M. Wang L. Zhang Y. Schmidt C, et al. Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting. Nucleic Acids Res. 2011;39:e82; Zhang F. Cong L. Lodato S. Kosuri S. Church GM. Arlotta P Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription. Nat Biotechnol. 2011;29:149-153、米国特許第8,450,471号、米国特許第8,440,431号及び米国特許第8,440,432号に見出され得、すべては参照により具体的に組み込まれる。
プログラム可能なDNA結合ユニットは、エンドヌクレアーゼ欠損転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、その機能的断片、又はそのバリアントを含むことができる。転写アクチベーター様エフェクター(TALE)は、実質的に任意の所望のDNA配列に結合するように操作することができる。TALENシステムを使用する標的化の例示的な方法は、例えば、Cermak T. Doyle EL. Christian M. Wang L. Zhang Y. Schmidt C, et al. Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting. Nucleic Acids Res. 2011;39:e82; Zhang F. Cong L. Lodato S. Kosuri S. Church GM. Arlotta P Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription. Nat Biotechnol. 2011;29:149-153、米国特許第8,450,471号、米国特許第8,440,431号及び米国特許第8,440,432号に見出され得、すべては参照により具体的に組み込まれる。
プログラム可能なDNA結合ユニットは、TALEポリペプチドを含むことができる。TALEは、植物病原体キサントモナス(Xanthomonas)由来の転写因子であり、新しいDNA標的に結合するように容易に操作することができる。本明細書に提供される一部の実施形態では、TALEは、エンドヌクレアーゼの触媒ドメイン(例えば、Fokl)と連結していない。本明細書に提供される一部の実施形態では、プログラム可能なDNA結合ユニットは、エンドヌクレアーゼドメインが触媒的に不活性であるTALENを含むことができる。TALEポリペプチドは、高度に保存された単量体ポリペプチドのタンデム反復で構成される核酸結合ドメインを含み、長さは主に33、34又は35アミノ酸であり、主にアミノ酸位置12及び13において互いに異なる。本明細書で使用される場合、用語「ポリペプチド単量体」又は「TALE単量体」は、TALE核酸結合ドメイン内の高度に保存された反復ポリペプチド配列を指すために使用され、用語「反復可変二残基」又は「RVD」は、ポリペプチドモノマーの位置12及び13における高度に可変なアミノ酸を指すために使用される。TALE単量体は、そのRVD中のアミノ酸の同一性によって決定されるヌクレオチド結合親和性を有する。例えば、NIのRVDを有するポリペプチド単量体は、アデニン(A)に優先的に結合し、NGのRVDを有するポリペプチド単量体は、チミン(T)に優先的に結合し、HDのRVDを有するポリペプチド単量体は、シトシン(C)に優先的に結合し、NNのRVDを有するポリペプチド単量体は、アデニン(A)とグアニン(G)の両方に優先的に結合する。一部の実施形態では、IGのRVDを有するポリペプチド単量体は、Tに優先的に結合する。したがって、TALEの核酸結合ドメインにおけるポリペプチド単量体反復の数及び順序が、その核酸標的特異性を決定する。本明細書に提供されるなおさらなる実施形態では、NSのRVDを有するポリペプチド単量体は、すべての4つの塩基対を認識し、A、T、G又はCに結合し得る。TALEの構造及び機能は、例えば、Moscou et al., Science 326:1501 (2009); Boch et al., Science 326:1509-1512 (2009); Zhang et al., Nature Biotechnology 29: 149-153 (2011)にさらに記載され、各々は参照によりその全体が組み込まれる。プログラム可能なDNA結合ユニットは、特定の核酸配列を標的とするように設計されたポリペプチド単量体反復を含むことができる。
Zhang et al., Nature Biotechnology 29:149-153 (2011)に記載されるように、TALEポリペプチド結合効率は、天然に存在するTALEのDNA結合領域の直接的にN末端又はC末端である「キャッピング領域」からのアミノ酸配列を、操作されたTALE DNA結合領域のN末端又はC末端の位置で操作されたTALEに含めることによって増大させることができる。したがって、ある特定の実施形態では、本明細書に記載されるTALEポリペプチドは、N末端キャッピング領域及び/又はC末端キャッピング領域をさらに含む。
本明細書で使用される場合、N末端キャッピング領域の所定の「N末端」から「C末端」配向への、反復TALE単量体及びC末端キャッピング領域を含むDNA結合ドメインは、本明細書に提供されるTALE又はポリペプチドにおける異なるドメインの組織化のための構造的基礎を提供する。
N末端及び/又はC末端キャッピング領域全体は、DNA結合領域の結合活性を増強するために必要ではない。したがって、ある特定の実施形態では、N末端及び/又はC末端キャッピング領域の断片は、本明細書に記載されるTALEポリペプチドに含まれる。
本明細書で使用される場合、N末端キャッピング領域の所定の「N末端」から「C末端」配向への、反復TALE単量体及びC末端キャッピング領域を含むDNA結合ドメインは、本明細書に提供されるTALE又はポリペプチドにおける異なるドメインの組織化のための構造的基礎を提供する。
N末端及び/又はC末端キャッピング領域全体は、DNA結合領域の結合活性を増強するために必要ではない。したがって、ある特定の実施形態では、N末端及び/又はC末端キャッピング領域の断片は、本明細書に記載されるTALEポリペプチドに含まれる。
ある特定の実施形態では、本明細書に記載されるTALEポリペプチドは、N末端キャッピング領域の少なくとも10、20、30、40、50、54、60、70、80、87、90、94、100、102、110、117、120、130、140、147、150、160、170、180、190、200、210、220、230、240、250、260又は270個のアミノ酸を含んだN末端キャッピング領域断片を含む。ある特定の実施形態では、N末端キャッピング領域断片アミノ酸は、N末端キャッピング領域のC末端(DNA結合領域近位端)のものである。Zhang et al., Nature Biotechnology 29:149-153 (2011)に記載されるように、C末端240アミノ酸を含むN末端キャッピング領域断片は、全長キャッピング領域に等しい結合活性を増強し、一方、C末端147アミノ酸を含む断片は、全長キャッピング領域の有効性の80%を超えて保持し、C末端117アミノ酸を含む断片は、全長キャッピング領域の活性の50%を超えて保持する。
一部の実施形態では、本明細書に記載されるTALEポリペプチドは、C末端キャッピング領域の少なくとも6、10、20、30、37、40、50、60、68、70、80、90、100、110、120、127、130、140、150、155、160、170、180アミノ酸を含んだC末端キャッピング領域断片を含む。ある特定の実施形態では、C末端キャッピング領域断片アミノ酸は、C末端キャッピング領域のN末端(DNA結合領域近位端)のものである。Zhang et al., Nature Biotechnology 29: 149-153 (2011)に記載されるように、C末端68アミノ酸を含むC末端キャッピング領域断片は、全長キャッピング領域に等しい結合活性を増強し、一方、C末端20アミノ酸を含む断片は、全長キャッピング領域の有効性の50%を超える保持する。
ジンクフィンガー(ZF)タンパク質
プログラム可能なDNA結合ユニットは、Znフィンガー(ZF)ヌクレアーゼ、その機能的断片、又はそのバリアントを含むことができる。プログラム可能なDNA結合ユニットは、エンドヌクレアーゼ欠損ZFヌクレアーゼ、その機能的断片、又はそのバリアントを含み得、エンドヌクレアーゼのドメイン(例えば、Fokl)は、触媒的に不活性であるか又は存在しない。プログラム可能なDNA結合ユニットは、ZFタンパク質(ZFP)を含むことができる。ZFPは、選択される標的部位に結合するように操作することができる。例えば、Beerli et al. (2002) Nature Biotechnol. 20: 135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct Biol. 10:411-416; U.S. Pat. Nos. 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273;米国特許出願公開第2005/0064474号;米国特許出願公開第2007/0218528号;米国特許出願公開第2005/0267061号を参照されたい。ZFPは、所望のDNA結合部位を標的とするZFモジュールのアレイを含むことができる。ZFアレイの各フィンガーモジュールは、3つのDNA塩基を標的とすることができる。個々のジンクフィンガードメインのカスタマイズされたアレイをZFPにアセンブルさせることができる。
プログラム可能なDNA結合ユニットは、Znフィンガー(ZF)ヌクレアーゼ、その機能的断片、又はそのバリアントを含むことができる。プログラム可能なDNA結合ユニットは、エンドヌクレアーゼ欠損ZFヌクレアーゼ、その機能的断片、又はそのバリアントを含み得、エンドヌクレアーゼのドメイン(例えば、Fokl)は、触媒的に不活性であるか又は存在しない。プログラム可能なDNA結合ユニットは、ZFタンパク質(ZFP)を含むことができる。ZFPは、選択される標的部位に結合するように操作することができる。例えば、Beerli et al. (2002) Nature Biotechnol. 20: 135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct Biol. 10:411-416; U.S. Pat. Nos. 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273;米国特許出願公開第2005/0064474号;米国特許出願公開第2007/0218528号;米国特許出願公開第2005/0267061号を参照されたい。ZFPは、所望のDNA結合部位を標的とするZFモジュールのアレイを含むことができる。ZFアレイの各フィンガーモジュールは、3つのDNA塩基を標的とすることができる。個々のジンクフィンガードメインのカスタマイズされたアレイをZFPにアセンブルさせることができる。
メガヌクレアーゼ
プログラム可能なDNA結合ユニットは、エンドヌクレアーゼ欠損メガヌクレアーゼ、その機能的断片、又はそのバリアントであり得る。メガヌクレアーゼのDNA結合ドメインは、12~45bpの二本鎖DNA標的配列を有し得る。一部の実施形態では、メガヌクレアーゼは、各メガヌクレアーゼドメインが単量体上にある二量体酵素、又は単一のポリペプチド上に2つのドメインを含む単量体酵素のいずれかである。野生型メガヌクレアーゼだけでなく、様々なメガヌクレアーゼバリアントもまた、無数の固有の配列の組み合わせをカバーするためのタンパク質工学によって生成されている。一部の実施形態では、メガヌクレアーゼAの半部位及びタンパク質Bの半部位で構成される認識部位を有するキメラメガヌクレアーゼを使用することもできる。このようなキメラメガヌクレアーゼの具体例は、I-DmoI及びI-CreIのタンパク質ドメインを含む。メガヌクレアーゼの例には、LAGLIDADGファミリー由来のホーミングエンドヌクレアーゼが含まれる。「LAGLIDADGメガヌクレアーゼ」とは、Stoddard et al (Stoddard, 2005)に定義されるLAGLIDADGファミリー由来のホーミングエンドヌクレアーゼ、又は上記天然ホーミングエンドヌクレアーゼと少なくとも80%、85%、90%、95%、97.5%、99%若しくはそれ以上の同一性又は類似性を共有するポリペプチドを含む操作されたバリアントを指す。このような操作されたLAGLIDADGメガヌクレアーゼは、単量体又は二量体メガヌクレアーゼに由来し得る。二量体メガヌクレアーゼに由来する場合、このような操作されたLAGLIDADGメガヌクレアーゼは、一本鎖又は二量体エンドヌクレアーゼであり得る。メガヌクレアーゼは、当業者に周知である技術を用いてそれらの認識配列を修飾することによって、特定の配列を標的とすることができる。例えば、Epinat et al., 2003, Nuc. Acid Res., 31(l l):2952-62 and Stoddard, 2005, Quarterly Review of Biophysics, pp. 1-47を参照されたい。
プログラム可能なDNA結合ユニットは、エンドヌクレアーゼ欠損メガヌクレアーゼ、その機能的断片、又はそのバリアントであり得る。メガヌクレアーゼのDNA結合ドメインは、12~45bpの二本鎖DNA標的配列を有し得る。一部の実施形態では、メガヌクレアーゼは、各メガヌクレアーゼドメインが単量体上にある二量体酵素、又は単一のポリペプチド上に2つのドメインを含む単量体酵素のいずれかである。野生型メガヌクレアーゼだけでなく、様々なメガヌクレアーゼバリアントもまた、無数の固有の配列の組み合わせをカバーするためのタンパク質工学によって生成されている。一部の実施形態では、メガヌクレアーゼAの半部位及びタンパク質Bの半部位で構成される認識部位を有するキメラメガヌクレアーゼを使用することもできる。このようなキメラメガヌクレアーゼの具体例は、I-DmoI及びI-CreIのタンパク質ドメインを含む。メガヌクレアーゼの例には、LAGLIDADGファミリー由来のホーミングエンドヌクレアーゼが含まれる。「LAGLIDADGメガヌクレアーゼ」とは、Stoddard et al (Stoddard, 2005)に定義されるLAGLIDADGファミリー由来のホーミングエンドヌクレアーゼ、又は上記天然ホーミングエンドヌクレアーゼと少なくとも80%、85%、90%、95%、97.5%、99%若しくはそれ以上の同一性又は類似性を共有するポリペプチドを含む操作されたバリアントを指す。このような操作されたLAGLIDADGメガヌクレアーゼは、単量体又は二量体メガヌクレアーゼに由来し得る。二量体メガヌクレアーゼに由来する場合、このような操作されたLAGLIDADGメガヌクレアーゼは、一本鎖又は二量体エンドヌクレアーゼであり得る。メガヌクレアーゼは、当業者に周知である技術を用いてそれらの認識配列を修飾することによって、特定の配列を標的とすることができる。例えば、Epinat et al., 2003, Nuc. Acid Res., 31(l l):2952-62 and Stoddard, 2005, Quarterly Review of Biophysics, pp. 1-47を参照されたい。
LAGLIDADGメガヌクレアーゼは、I-SceI、I-ChuI、I-CreI、I-CsmI、PI-SceI、PI-TliI、PI-MtuI、I-CeuI、I-SceII、I-SceIII、HO、PI-CivI、PI-CtrI、PI-AaeI、PI-BsuI、PI-DhaI、PI-DraI、PI-MavI、PI-MchI、PI-MfuI、PI-MflI、PI-MgaI、PI-MgoI、PI-MinI、PI-MkaI、PI-MleI、PI-MmaI、PI-MshI、PI-MsmI、PI-MthI、PI-MtuI、PI-MxeI、PI-NpuI、PI-PfuI、PI-RmaI、PI-SpbI、PI-SspI、PI-FacI、PI-MjaI、PI-PhoI、PI-TagI、PI-Thyl、PI-TkoI、PI-TspI、若しくはI-MsoIであり得るか;又は、ホモ二量体、ヘテロ二量体若しくは単量体のいずれであっても、その機能的な突然変異体若しくはバリアントであり得る。一部の実施形態では、LAGLIDADGメガヌクレアーゼは、I-CreI誘導体である。一部の実施形態では、LAGLIDADGメガヌクレアーゼは、天然I-CreI LAGLIDADGメガヌクレアーゼと少なくとも80%の類似性を共有する。一部の実施形態では、LAGLIDADGメガヌクレアーゼは、天然I-CreI LAGLIDADGメガヌクレアーゼの残基1~152と少なくとも80%の類似性を共有する。一部の実施形態では、LAGLIDADGメガヌクレアーゼは、リンカーペプチドの有無にかかわらず、一緒に連結した天然I-CreI LAGLIDADGメガヌクレアーゼの残基1~152と少なくとも80%の類似性を共有する2つの単量体からなり得る。
アルゴノートタンパク質
一部の実施形態では、プログラム可能なDNA結合ユニットは、ヌクレアーゼ不活性アルゴノートを含む。一部の実施形態では、プログラム可能なDNA結合ユニットは、ナトロノバクテリウム・グレゴリ(Natronobacterium gregoryi)(NgAgo)由来のアルゴノートタンパク質、その機能的断片、又はそのバリアントを含む。NgAgoは、ssDNA誘導エンドヌクレアーゼである。NgAgoはおよそ24ヌクレオチドの5’リン酸化されたssDNA(gDNA)に結合して標的部位に到達し、gDNA部位でDNA二本鎖切断を起こす。一部の実施形態では、プログラム可能なDNA結合ユニットは、ヌクレアーゼ不活性NgAgo(dNgAgo)を含む。NgAgoの特徴付け及び使用は、Gao et al, Nat Biotechnol. Epub 2016 May 2. PubMed PMID: 27136078; Swarts et al, Nature. 507(7491) (2014):258-61; Swarts et al, Nucleic Acids Res. 43(10) (2015):5120-9に記載され、各々が参照により本明細書に組み込まれる。NgAgoベースのプログラム可能なDNA結合ユニットは、少なくとも1つのガイドDNAエレメント、又はガイドDNAエレメントをコードする核酸配列を含む核酸を含むことができ、結合部位のDNAと直接塩基対を介して、結合部位の特異的な標的化又は認識を達成することができる。アルゴノートタンパク質の原核生物相同体は公知であり、例えば、Makarova K., et al., "Prokaryotic homologs of Argonaute proteins are predicted to function as key components of a novel system of defense against mobile genetic elements", Biol. Direct. 2009 Aug. 25; 4:29. doi: 10.1186/1745-6150-4-29に記載され、参照により本明細書に組み込まれる。一部の実施形態では、プログラム可能なDNA結合ユニットは、マリニトガ・ピエゾフィラ(Marinitoga piezophila)アルゴノート(MpAgo)タンパク質、その機能的断片、又はそのバリアントである。
一部の実施形態では、プログラム可能なDNA結合ユニットは、ヌクレアーゼ不活性アルゴノートを含む。一部の実施形態では、プログラム可能なDNA結合ユニットは、ナトロノバクテリウム・グレゴリ(Natronobacterium gregoryi)(NgAgo)由来のアルゴノートタンパク質、その機能的断片、又はそのバリアントを含む。NgAgoは、ssDNA誘導エンドヌクレアーゼである。NgAgoはおよそ24ヌクレオチドの5’リン酸化されたssDNA(gDNA)に結合して標的部位に到達し、gDNA部位でDNA二本鎖切断を起こす。一部の実施形態では、プログラム可能なDNA結合ユニットは、ヌクレアーゼ不活性NgAgo(dNgAgo)を含む。NgAgoの特徴付け及び使用は、Gao et al, Nat Biotechnol. Epub 2016 May 2. PubMed PMID: 27136078; Swarts et al, Nature. 507(7491) (2014):258-61; Swarts et al, Nucleic Acids Res. 43(10) (2015):5120-9に記載され、各々が参照により本明細書に組み込まれる。NgAgoベースのプログラム可能なDNA結合ユニットは、少なくとも1つのガイドDNAエレメント、又はガイドDNAエレメントをコードする核酸配列を含む核酸を含むことができ、結合部位のDNAと直接塩基対を介して、結合部位の特異的な標的化又は認識を達成することができる。アルゴノートタンパク質の原核生物相同体は公知であり、例えば、Makarova K., et al., "Prokaryotic homologs of Argonaute proteins are predicted to function as key components of a novel system of defense against mobile genetic elements", Biol. Direct. 2009 Aug. 25; 4:29. doi: 10.1186/1745-6150-4-29に記載され、参照により本明細書に組み込まれる。一部の実施形態では、プログラム可能なDNA結合ユニットは、マリニトガ・ピエゾフィラ(Marinitoga piezophila)アルゴノート(MpAgo)タンパク質、その機能的断片、又はそのバリアントである。
リコンビナーゼ
一部の実施形態では、プログラム可能なDNA結合ユニットは、標的dsDNA上の結合部位に結合するように構成されたリコンビナーゼを含む。部位特異的リコンビナーゼは、当該技術分野において周知であり、一般的にインベルターゼ、リゾルベース、又はインテグラーゼと称され得る。部位特異的リコンビナーゼの非限定的な例としては、限定されないが、ラムダインテグラーゼ、Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、phiC31、Cin、Tn3レゾルベース、TndX、XerC、XerD、TnpX、Hjc、Gin、SpCCEl、及びParAが挙げられる。
一部の実施形態では、プログラム可能なDNA結合ユニットは、標的dsDNA上の結合部位に結合するように構成されたリコンビナーゼを含む。部位特異的リコンビナーゼは、当該技術分野において周知であり、一般的にインベルターゼ、リゾルベース、又はインテグラーゼと称され得る。部位特異的リコンビナーゼの非限定的な例としては、限定されないが、ラムダインテグラーゼ、Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、phiC31、Cin、Tn3レゾルベース、TndX、XerC、XerD、TnpX、Hjc、Gin、SpCCEl、及びParAが挙げられる。
リンカー
トランスポソームは、トランスポゼースとdCASタンパク質を接続するリンカーを介して、プログラム可能なDNA結合ユニットと結び付けられ得る。リンカーは、ペプチドリンカー、化学リンカー、又はその両方を含むことができる。トランスポゼースは、dCASタンパク質を含む融合タンパク質中に存在することができる。トランスポソームは、トランスポゼースとタンパク質構成成分を接続するリンカーを介して、プログラム可能なDNA結合ユニットと結び付けられ得る。ペプチドリンカーは、複数のグリシン、セリン、スレオニン、アラニン、リジン、グルタミン、又はそれらの組み合わせを含むことができる。ペプチドリンカーは、GSリンカーを含み得る。ペプチドリンカーは、XTENリンカーであり得る。タンパク質構成成分は、トランスポゼースを含む融合タンパク質中に存在することができる。本明細書で使用される用語「リンカー」とは、分子間又は分子の部分間の相互作用を促進する分子を指す。一部の実施形態では、リンカーは、ポリペプチドリンカーである。一部の実施形態では、リンカーは、化学リンカーである。「ペプチドリンカー」又は「ポリペプチドリンカー」という用語は、本明細書で使用される場合、ペプチド結合によって接続された2種以上のアミノ酸残基を含むペプチド又はポリペプチドを意味する。このようなペプチド又はポリペプチドリンカーは、当技術分野において周知である。リンカーは、天然に存在し及び/若しくは天然に存在しないペプチド又はポリペプチドを含むことができる。リンカーは、トランスポゼース及び/又はプログラム可能なDNA結合ユニットのC末端及び/又はN末端と結び付けられ得る。
リンカーは、化学リンカー又はペプチドリンカーであり得る。したがって、実施形態は、ペプチド結合を介して他の分子にコンジュゲートされたポリペプチド、及び化学的コンジュゲーションを介して他の分子にコンジュゲートされたポリペプチドに関する。
トランスポソームは、トランスポゼースとdCASタンパク質を接続するリンカーを介して、プログラム可能なDNA結合ユニットと結び付けられ得る。リンカーは、ペプチドリンカー、化学リンカー、又はその両方を含むことができる。トランスポゼースは、dCASタンパク質を含む融合タンパク質中に存在することができる。トランスポソームは、トランスポゼースとタンパク質構成成分を接続するリンカーを介して、プログラム可能なDNA結合ユニットと結び付けられ得る。ペプチドリンカーは、複数のグリシン、セリン、スレオニン、アラニン、リジン、グルタミン、又はそれらの組み合わせを含むことができる。ペプチドリンカーは、GSリンカーを含み得る。ペプチドリンカーは、XTENリンカーであり得る。タンパク質構成成分は、トランスポゼースを含む融合タンパク質中に存在することができる。本明細書で使用される用語「リンカー」とは、分子間又は分子の部分間の相互作用を促進する分子を指す。一部の実施形態では、リンカーは、ポリペプチドリンカーである。一部の実施形態では、リンカーは、化学リンカーである。「ペプチドリンカー」又は「ポリペプチドリンカー」という用語は、本明細書で使用される場合、ペプチド結合によって接続された2種以上のアミノ酸残基を含むペプチド又はポリペプチドを意味する。このようなペプチド又はポリペプチドリンカーは、当技術分野において周知である。リンカーは、天然に存在し及び/若しくは天然に存在しないペプチド又はポリペプチドを含むことができる。リンカーは、トランスポゼース及び/又はプログラム可能なDNA結合ユニットのC末端及び/又はN末端と結び付けられ得る。
リンカーは、化学リンカー又はペプチドリンカーであり得る。したがって、実施形態は、ペプチド結合を介して他の分子にコンジュゲートされたポリペプチド、及び化学的コンジュゲーションを介して他の分子にコンジュゲートされたポリペプチドに関する。
ある程度の柔軟性を有するペプチドリンカーを使用することができる。ペプチドリンカーは、適切なペプチドリンカーが、一般的に柔軟なペプチドをもたらす配列を有することを念頭に置いて、実質的に任意のアミノ酸配列を有することができる。グリシン及びアラニンなどの小さなアミノ酸の使用は、柔軟なペプチドを作製するのに使用されるものである。このような配列の作製は、当業者にとって習慣的である。
適切なリンカーは、容易に選択され得、任意の適切な長さを有するものであり得て、例えば、1アミノ酸(例えば、Gly)~50アミノ酸、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、又はこれらの値の任意の2つの間の数値若しくは範囲のアミノ酸である。
好ましいペプチドリンカー配列は、柔軟な伸長した立体構造を採用し、秩序だった二次構造を発生する傾向を示さない。ある特定の実施形態では、リンカーは、単量体、二量体、多量体又は高分子であり得る化学部分であり得る。好ましくは、リンカーはアミノ酸を含む。柔軟なリンカー中の典型的なアミノ酸には、Gly、Asn及びSerが含まれる。したがって、特定の実施形態では、リンカーは、Gly、Asn及びSerアミノ酸のうちの1種以上の組み合わせを含む。リンカー配列においては、Thr及びAlaなどの他の中性に近いアミノ酸も使用することができる。柔軟なリンカーの例としては、グリシンポリマー(G)n(配列番号32)、グリシン-セリンポリマー(例えば、(GS)n(配列番号33)、(GSGGS)n(配列番号34)、(G4S)n(配列番号35)及び(GGGS)n(配列番号36)が挙げられ、ここでnは少なくとも1の整数である。一部の実施形態では、nは、少なくとも、せいぜい、又は正確に1、2、3、4、5、6、7、8、9又は10(又はその中の任意の導出可能な範囲)である。グリシン-アラニンポリマー、アラニン-セリンポリマー、及び当技術分野において公知である他の柔軟なリンカー。グリシン及びグリシン-セリンポリマーを使用することができ、Gly及びSerはいずれも比較的構造化されておらず、したがって、構成成分間の中立的係留として働くことができる。グリシンポリマーを用いることができ、グリシンはアラニンよりもさらに著しく大きなファイ-プサイ空間にアクセスし、より長い側鎖を有する残基よりもはるかに低く制限される。例示的スペーサーは、限定されないが、GGSG(配列番号37)、GGSGG(配列番号38)、GSGSG(配列番号39)、GSGGG(配列番号40)、GGGSG(配列番号41)、GSSSG(配列番号42)などを含むアミノ酸配列を含むことができる。リンカー配列においては、Thr及びAlaなどの他の中性に近いアミノ酸も使用することができる。リンカー配列の長さは、融合タンパク質の機能又は活性に著しく影響することなく変動し得る(例えば、米国特許第6,087,329号を参照されたい)。一部の実施形態では、リンカーは、少なくとも、せいぜい、又は正確に4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、又は100アミノ酸残基(又はその中で導出可能な任意の範囲)であり得る。
一部の実施形態では、ポリペプチドリンカーは、XTENリンカーである。一部の実施形態では、リンカーは、XTENリンカー、又はXTENリンカーのバリエーション、例えば、SGSETPGTSESA(配列番号43)、SGSETPGTSESATPES(配列番号44)若しくはSGSETPGTSESATPEGGSGGS(配列番号45)である。XTENリンカーは、例えば、Schellenberger et al. (2009), Nature Biotechnology 27: 1186-1190に記載されており、その全内容は参照により本明細書に組み込まれる。
本明細書に提供される方法において使用するための適切なリンカーは、当業者に周知であり、限定されないが、直鎖若しくは分枝鎖炭素リンカー、複素環炭素リンカー、又はペプチドリンカーを含む。しかしながら、本明細書で使用される場合、リンカーはまた、共有結合(炭素-炭素結合又は炭素-ヘテロ原子結合)であり得る。特定の実施形態では、リンカーは、各タンパク質がその必要な機能的特性を保持することを確実にするのに十分な距離だけ、トランスポソーム及びプログラム可能なDNA結合ユニットを分離するために使用される。
リンカーを用いて、2つのタンパク質パートナーを融合させて融合タンパク質を形成することができる。「リンカー」は、2つの分子又は部分、例えば融合タンパク質の2つのドメインを連結する化学基又は分子であり得る。典型的には、リンカーは、2つの基、分子、ドメイン、又は他の部分の間に配置され(それに隣接する)、共有結合を介して各々に接続され、したがって、2つを接続する。一部の実施形態では、リンカーは、アミノ酸又は複数のアミノ酸(例えば、ペプチド又はタンパク質)である。一部の実施形態では、リンカーは、有機分子、基、ポリマー(例えば、非天然ポリマー、非ペプチドポリマー)、又は化学的部分である。一部の実施形態では、リンカーは、直接結合又は原子、例えば、酸素(O)又は硫黄(S)、ユニット、例えば、-NR-(Rは、水素又はアルキル、-C(O)-、-C(O)O-、-C(O)NH-、SO、SO2、-SO2NH-である)、又は原子の鎖、例えば、置換又は非置換アルキル、置換又は非置換アルケニル、置換又は非置換アルキニル、アリールアルキル、ヘテロアリールアルキルを含む。一部の実施形態では、原子の鎖中の1つ以上のメチレンは、O、S、S(O)、SO2、-SO2NH-、-NR-、-NR2、-C(O)-、-C(O)O-、-C(O)NH-、切断可能な連結基、置換又は非置換アリール、置換又は非置換ヘテロアリール、及び置換又は非置換ヘテロ環のうちの1種以上で置換され得る。また、リンカーの例には、化学部分及びコンジュゲート剤、例えば、スルホ-スクシンイミジル誘導体(スルホ-SMCC、スルホ-SMPB)、ジスクシンイミジルスベレート(DSS)、ジスクシンイミジルグルタル酸(DSG)及びジスクシンイミジル酒石酸(DST)が含まれ得る。リンカーの例は、CN(ここで、N=1~100炭素原子)などの直鎖状炭素鎖をさらに含む。一部の実施形態では、リンカーは、ジペプチドリンカー、例えば、バリン-シトルリン(val-cit)、フェニルアラニン-リジン(phe-lys)リンカー、又はマレイミドカプロン-バリン-シトルリン-p-アミノベンジルオキシカルボニル(vc)リンカーであり得る。一部の実施形態では、リンカーは、スルホスクシンイミジル-4-[N-マレイミドメチル]シクロヘキサン-1-カルボキシレート(smcc)である。スルホ-smccコンジュゲーションは、スルフヒドリル(チオール、-SH)と反応するマレイミド基を介して起こり、一方、そのスルホ-NHSエステルは、第1級アミン(リジン及びタンパク質又はペプチドN末端に見られる)に対して反応性である。さらに、リンカーはマレイミドカプロイル(me)であり得る。一部の実施形態では、共有連結は、Traut試薬の使用を介して達成され得る。
図8~10は、本明細書に提供されるタンパク質複合体の生成に使用するための、プラスミド構築物3XFlag-Cas9-Fl26-Tn5(配列番号1)、3XFlag-Cas9-xTen-Tn5(配列番号2)、及びpET-Tn5-xTen-dCas9(配列番号3)のそれぞれの非限定的であり例示的な概略図を示す。本明細書に開示されるタンパク質複合体、リンカー、プログラム可能なDNA結合ユニット、及び/又はトランスポゼースは、配列番号1~3にコードされるタンパク質複合体、リンカー、プログラム可能なDNA結合ユニット、及び/又はトランスポゼースと、少なくとも約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、又はこれらの値の任意の2つの間の数値若しくは範囲で同一であるヌクレオチド配列によってコードされ得る。
増幅
本方法は、dsDNA断片の末端でアダプターに結合することができるプライマーを用いて、複数のdsDNA断片を増幅することを含むことができる。増幅は、核酸増幅産物を生成することができる。核酸増幅産物は、ライブラリー(例えば、シーケンシングライブラリー)を含み得る。各プライマーは、長さが約5~80ヌクレオチド(例えば、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、又はこれらの値の任意の2つの間の数値若しくは範囲のヌクレオチド)であり得る。複数のdsDNA断片をプライマーで増幅することは、ポリメラーゼ連鎖反応(PCR)を用いて行うことができる。PCRは、ループ媒介等温増幅(LAMP)、ヘリカーゼ依存性増幅(HDA)、リコンビナーゼポリメラーゼ増幅(RPA)、鎖置換増幅(SDA)、核酸配列ベース増幅(NASBA)、転写媒介増幅(TMA)、ニッキング酵素増幅反応(NEAR)、ローリングサークル増幅(RCA)、多置換増幅(MDA)、分岐化(RAM)、環状ヘリカーゼ依存性増幅(cHDA)、単一プライマー等温増幅(SPIA)、RNA技術のシグナル媒介増幅(SMART)、自己持続配列複製(3SR)、ゲノム指数増幅反応(GEAR)、又は等温多置換増幅(IMDA)であり得る。PCRは、リアルタイムPCR又は定量的リアルタイムPCR(QRT-PCR)であり得る。
本方法は、dsDNA断片の末端でアダプターに結合することができるプライマーを用いて、複数のdsDNA断片を増幅することを含むことができる。増幅は、核酸増幅産物を生成することができる。核酸増幅産物は、ライブラリー(例えば、シーケンシングライブラリー)を含み得る。各プライマーは、長さが約5~80ヌクレオチド(例えば、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、又はこれらの値の任意の2つの間の数値若しくは範囲のヌクレオチド)であり得る。複数のdsDNA断片をプライマーで増幅することは、ポリメラーゼ連鎖反応(PCR)を用いて行うことができる。PCRは、ループ媒介等温増幅(LAMP)、ヘリカーゼ依存性増幅(HDA)、リコンビナーゼポリメラーゼ増幅(RPA)、鎖置換増幅(SDA)、核酸配列ベース増幅(NASBA)、転写媒介増幅(TMA)、ニッキング酵素増幅反応(NEAR)、ローリングサークル増幅(RCA)、多置換増幅(MDA)、分岐化(RAM)、環状ヘリカーゼ依存性増幅(cHDA)、単一プライマー等温増幅(SPIA)、RNA技術のシグナル媒介増幅(SMART)、自己持続配列複製(3SR)、ゲノム指数増幅反応(GEAR)、又は等温多置換増幅(IMDA)であり得る。PCRは、リアルタイムPCR又は定量的リアルタイムPCR(QRT-PCR)であり得る。
本明細書で使用される場合、核酸増幅は、配列特異的方法を使用して、標的核酸配列又はその相補体若しくはその断片の複数コピーを得るための任意の公知の手法を指すことができる。公知の増幅方法の例としては、限定されないが、ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応(LCR)、ループ媒介等温増幅(LAMP)、鎖置換増幅(SDA)(例えば、多置換増幅(MDA))、レプリカーゼ媒介増幅、免疫増幅、核酸配列ベース増幅(NASBA)、自己持続配列複製(3SR)、ローリングサークル増幅、及び転写媒介増幅(TMA)が挙げられる。一部の実施形態では、2種以上の上記核酸増幅方法を、例えば、連続的に行うことができる。
例えば、LCR増幅は、ハイブリダイゼーション、ライゲーション、及び変性の複数サイクルを用いることによって、標的及びその相補鎖を増幅するために、少なくとも4つの別々のオリゴヌクレオチドを使用する。SDAは、標的配列を含むヘミ修飾されたDNA二重鎖の一方の鎖にニックを入れ、続いて、一連のプライマー伸長及び鎖置換ステップにおける増幅を行う制限エンドヌクレアーゼの認識部位を含有するプライマーを用いることによって増幅する。
PCRは、核酸の増幅のための当該技術分野において周知である方法である。PCRは、標的配列に隣接する2種以上の伸長可能な配列特異的オリゴヌクレオチドプライマーを用いた標的配列の増幅を伴う。目的とする標的配列を含有する核酸は、プライマー、熱安定性DNAポリメラーゼ(例えば、Taqポリメラーゼ)及び種々のdNTPの存在下での熱サイクル(変性、アニーリング及び伸長)の複数ラウンドのプログラムに供され、標的配列の増幅がもたらされる。PCRは、DNA分子の定義された領域の相補鎖が熱安定性DNAポリメラーゼによって同時に合成される複数ラウンドのプライマー伸長反応を使用する。各サイクルの終わりに、新たに合成された各DNA分子は次のサイクルの鋳型として働く。これらの反応の反復ラウンド中に、新たに合成されたDNA鎖の数は指数関数的に増加し、そのため、20~30回の反応サイクル後、最初の鋳型DNAは数千倍又は百万倍複製される。
PCRは、増幅後処理に適した二本鎖増幅産物を生成することができる。所望であれば、増幅産物は、アガロースゲル電気泳動による可視化、プローブベースの比色検出を用いる酵素イムノアッセイフォーマット、蛍光発光技術、又は当業者に公知である他の検出手段によって検出することができる。
PCRは、増幅後処理に適した二本鎖増幅産物を生成することができる。所望であれば、増幅産物は、アガロースゲル電気泳動による可視化、プローブベースの比色検出を用いる酵素イムノアッセイフォーマット、蛍光発光技術、又は当業者に公知である他の検出手段によって検出することができる。
PCR法の例としては、限定されないが、リアルタイムPCR、エンドポイントPCR、増幅断片長多型PCR(AFLP-PCR)、Alu-PCR、非対称PCR、コロニーPCR、DD-PCR、縮退PCR、ホットスタートPCR、インサイチュPCR、インバースPCR、ロング-PCR、多重PCR、ネステッドPCR、PCR-ELISA、PCR-RFLP、PCR-一本鎖立体構造多型(PCR-SSCP)、定量的競合PCR(QC-PCR)、cDNA末端の迅速増幅-PCR(RACE-PCR)、多型DNAのランダム増幅-PCR(RAPD-PCR)、リアルタイムPCR、反復遺伝子外回文PCR(Rep-PCR)、逆転写酵素PCR(RT-PCR)、TAIL-PCR、タッチダウンPCR、及びVectorette PCRが挙げられる。
定量的リアルタイムポリメラーゼ連鎖反応(QRT-PCR)とも呼ばれるリアルタイムPCRは、所与の核酸分子の特定の部分を同時に定量及び増幅するために使用することができる。これは、特定の配列が試料中に存在するかどうか、及び存在する場合には、存在する配列のコピー数を決定するために使用することができる。用語「リアルタイム」とは、PCR中の定期的なモニタリングを指すことができる。ABI 7700及び7900HT配列検出システム(Applied Biosystems、Foster City、CA)などのある特定のシステムは、予め決定されているか又はユーザーが定義した点で、各熱サイクル中にモニタリングを行う。蛍光共鳴エネルギー移動(FRET)プローブを用いたPCRのリアルタイム分析は、サイクルからサイクルへの蛍光色素シグナル変化、好ましくは任意の内部制御シグナルを減じた蛍光色素シグナル変化を測定する。リアルタイム手法はPCRの一般的なパターンに従うが、核酸は増幅の各ラウンド後に定量される。定量化の方法の2つの例は、二本鎖DNAにインターカレートする蛍光色素(例えば、SYBRGreen)、及び相補的DNAとハイブリダイズした場合に蛍光を発する修飾されたDNAオリゴヌクレオチドプローブの使用である。インターカレーティング剤は、結合していない場合、比較的低い蛍光であり、二本鎖核酸への結合時は比較的高い蛍光を有する。したがって、インターカレーティング剤を使用して、核酸増幅反応中の二本鎖核酸の蓄積をモニタリングすることができる。本明細書に開示される実施形態において有用なこのような非特異的色素の例としては、SYBR Green I(Molecular Probes)、ヨウ化プロピジウム、臭化エチジウムなどのインターカレーティング剤が挙げられる。
標識
本明細書に記載される方法は、(例えば、検出可能な標識を用いて)複数のdsDNA断片のうちの1つ以上の一方又は両方の末端を標識することを含むことができる。本方法は、複数のdsDNA断片のうちの1つ以上の2つの末端を異なるように標識することを含むことができる。標識は、検出可能な標識(例えば、アニオン標識、カチオン標識、中性標識、電気化学標識、タンパク質標識、蛍光標識、磁性標識、又はそれらの組み合わせ)による標識を含むことができる。本方法は、標識されたdsDNA断片を濃縮すること、標識されたdsDNA断片を捕捉すること、標識されたdsDNA断片を単離すること、及び/又は標識されたdsDNA断片を可視化することを含むことができる。本方法は、検出可能な標識のモニタリング(例えば、化学的モニタリング)を含むことができる。
本明細書に記載される方法は、(例えば、検出可能な標識を用いて)複数のdsDNA断片のうちの1つ以上の一方又は両方の末端を標識することを含むことができる。本方法は、複数のdsDNA断片のうちの1つ以上の2つの末端を異なるように標識することを含むことができる。標識は、検出可能な標識(例えば、アニオン標識、カチオン標識、中性標識、電気化学標識、タンパク質標識、蛍光標識、磁性標識、又はそれらの組み合わせ)による標識を含むことができる。本方法は、標識されたdsDNA断片を濃縮すること、標識されたdsDNA断片を捕捉すること、標識されたdsDNA断片を単離すること、及び/又は標識されたdsDNA断片を可視化することを含むことができる。本方法は、検出可能な標識のモニタリング(例えば、化学的モニタリング)を含むことができる。
一部の実施形態では、検出可能な部分(例えば、検出可能な標識)は、光学部分、発光部分、電気化学的に活性な部分、ナノ粒子、又はそれらの組み合わせを含む。一部の実施形態では、発光部分は、化学発光部分、エレクトロルミネッセンス部分、フォトルミネッセンス部分、又はそれらの組み合わせを含む。一部の実施形態では、フォトルミネッセンス部分は、蛍光部分、リン光性部分、又はそれらの組み合わせを含む。一部の実施形態では、蛍光部分は、蛍光色素を含む。一部の実施形態では、ナノ粒子は、量子ドットを含む。一部の実施形態では、本方法は、検出可能な部分前駆体を検出可能な部分に変換するための反応を行うことを含む。一部の実施形態では、検出可能な部分前駆体を検出可能な部分に変換するための反応を行うことは、検出可能な部分前駆体を基質と接触させることを含む。一部のこのような実施形態では、検出可能な部分前駆体を基質と接触させると、2つの分子間の反応の検出可能な副産物が生じる。
増幅産物の検出及び定量化
本明細書に提供される方法のいくつかは、核酸増幅産物を生成するために、複数のdsDNA断片を増幅することを含む。本明細書に記載される方法は、核酸増幅産物、若しくはその産物を検出及び/又は定量することをさらに含み得る。増幅産物又はその産物は、例えば、本明細書に記載される任意の検出方法又は定量化方法を含む、任意の適切な検出及び/又は定量化方法によって検出及び/又は定量化することができる。検出及び/又は定量化方法の非限定的な例としては、分子ビーコン(例えば、リアルタイム、エンドポイント)、側方流動、蛍光共鳴エネルギー移動(FRET)、蛍光偏光(FP)、表面捕捉、5’から3’へのエキソヌクレアーゼ加水分解プローブ(例えば、TAQMAN)、インターカレーティング色素/結合色素、吸光度法(例えば、比色、濁度)、電気泳動(例えば、ゲル電気泳動、キャピラリー電気泳動)、質量分析、核酸シーケンシング、デジタル増幅、プライマー伸長方法(例えば、iPLEX(商標))、Affymetrixからの分子逆方向プローブ(MIP)技術、制限断片長多型(RFLP分析)、アレル特異的オリゴヌクレオチド(ASO)分析、メチル化特異的PCR(MSPCR)、パイロシークエンシング分析、アシクロプライム分析、リバースドットブロット、GeneChipマイクロアレイ、ダイナミックな対立遺伝子特異的ハイブリダイゼーション(DASH)、ペプチド核酸(PNA)及びロックド核酸(LNA)プローブ、アルファスクリーン、SNPストリーム、遺伝子ビット分析(GBA)、多重ミニシークエンシング、SNaPshot GOODアッセイ、マイクロアレイminiseq、アレイされるプライマー伸長(APEX)、マイクロアレイプライマー伸長、Tagアレイ、コードされたマイクロスフェア、鋳型指向性組込み(TDI)、比色分析オリゴヌクレオチドライゲーションアッセイ(OLA)、配列コード化OLA、マイクロアレイライゲーション、リガーゼ連鎖反応、パドロックプローブ、インベーダーアッセイ、少なくとも1つのプローブを用いるハイブリダイゼーション、少なくとも1つの蛍光標識されたプローブを用いるハイブリダイゼーション、クローニング及びシーケンシング、ハイブリダイゼーションプローブ及び定量的リアルタイムポリメラーゼ連鎖反応(QRT-PCR)の使用、ナノ細孔シーケンシング、チップ及びそれらの組み合わせが挙げられる。核酸増幅産物の検出は、リアルタイム検出方法(すなわち、生成物が増幅プロセス中に検出され及び/又は連続的にモニタリングされる)の使用、エンドポイント検出方法(すなわち、生成物が増幅プロセスを完了するか又は停止した後に検出される)の使用、又はその両方を含むことができる。核酸検出方法はまた、標的配列に直接取り込まれたか、又は標的に相補的な配列を含有するプローブに取り込まれた標識ヌクレオチドの使用を採用することができる。このような標識は、本質的に放射性及び/又は蛍光性であり得、本明細書において検討される任意の方法で解像することができる。一部の実施形態では、核酸増幅産物の定量化は、以下に記載される1種以上の検出方法を用いて達成される。検出方法は、シグナル強度の測定、及び/又は核酸増幅産物の定量化のための標準曲線及び/又はルックアップ表の生成(又は参照)とともに使用することができる。
本明細書に提供される方法のいくつかは、核酸増幅産物を生成するために、複数のdsDNA断片を増幅することを含む。本明細書に記載される方法は、核酸増幅産物、若しくはその産物を検出及び/又は定量することをさらに含み得る。増幅産物又はその産物は、例えば、本明細書に記載される任意の検出方法又は定量化方法を含む、任意の適切な検出及び/又は定量化方法によって検出及び/又は定量化することができる。検出及び/又は定量化方法の非限定的な例としては、分子ビーコン(例えば、リアルタイム、エンドポイント)、側方流動、蛍光共鳴エネルギー移動(FRET)、蛍光偏光(FP)、表面捕捉、5’から3’へのエキソヌクレアーゼ加水分解プローブ(例えば、TAQMAN)、インターカレーティング色素/結合色素、吸光度法(例えば、比色、濁度)、電気泳動(例えば、ゲル電気泳動、キャピラリー電気泳動)、質量分析、核酸シーケンシング、デジタル増幅、プライマー伸長方法(例えば、iPLEX(商標))、Affymetrixからの分子逆方向プローブ(MIP)技術、制限断片長多型(RFLP分析)、アレル特異的オリゴヌクレオチド(ASO)分析、メチル化特異的PCR(MSPCR)、パイロシークエンシング分析、アシクロプライム分析、リバースドットブロット、GeneChipマイクロアレイ、ダイナミックな対立遺伝子特異的ハイブリダイゼーション(DASH)、ペプチド核酸(PNA)及びロックド核酸(LNA)プローブ、アルファスクリーン、SNPストリーム、遺伝子ビット分析(GBA)、多重ミニシークエンシング、SNaPshot GOODアッセイ、マイクロアレイminiseq、アレイされるプライマー伸長(APEX)、マイクロアレイプライマー伸長、Tagアレイ、コードされたマイクロスフェア、鋳型指向性組込み(TDI)、比色分析オリゴヌクレオチドライゲーションアッセイ(OLA)、配列コード化OLA、マイクロアレイライゲーション、リガーゼ連鎖反応、パドロックプローブ、インベーダーアッセイ、少なくとも1つのプローブを用いるハイブリダイゼーション、少なくとも1つの蛍光標識されたプローブを用いるハイブリダイゼーション、クローニング及びシーケンシング、ハイブリダイゼーションプローブ及び定量的リアルタイムポリメラーゼ連鎖反応(QRT-PCR)の使用、ナノ細孔シーケンシング、チップ及びそれらの組み合わせが挙げられる。核酸増幅産物の検出は、リアルタイム検出方法(すなわち、生成物が増幅プロセス中に検出され及び/又は連続的にモニタリングされる)の使用、エンドポイント検出方法(すなわち、生成物が増幅プロセスを完了するか又は停止した後に検出される)の使用、又はその両方を含むことができる。核酸検出方法はまた、標的配列に直接取り込まれたか、又は標的に相補的な配列を含有するプローブに取り込まれた標識ヌクレオチドの使用を採用することができる。このような標識は、本質的に放射性及び/又は蛍光性であり得、本明細書において検討される任意の方法で解像することができる。一部の実施形態では、核酸増幅産物の定量化は、以下に記載される1種以上の検出方法を用いて達成される。検出方法は、シグナル強度の測定、及び/又は核酸増幅産物の定量化のための標準曲線及び/又はルックアップ表の生成(又は参照)とともに使用することができる。
核酸増幅産物の検出は、分子ビーコン技術の使用を含むことができる。分子ビーコンという用語は、一般的に、検出可能な分子を指し、分子の検出可能な特性は、ある特定の条件下で検出可能であり、それによって、分子が特異的であり情報的なシグナルとして機能することを可能にする。検出可能な特性の非限定的な例には、光学特性(例えば、蛍光)、電気特性、磁気特性、化学特性、及び公知のサイズの開口を通る時間又は速度が挙げられる。核酸分子を検出するための分子ビーコンは、例えば、一端にフルオロフォアを含み、反対端に消光色素を含有するヘアピン型オリゴヌクレオチドであり得る。ヘアピンのループは、標的配列に相補的なプローブ配列を含有し得、ステムは、プローブ配列のいずれか側に位置する相補的なアーム配列のアニーリングによって形成される。フルオロフォア及び消光分子は、各アームの両端で共有結合的に連結され得る。オリゴヌクレオチドがその相補的な標的にハイブリダイズするのを妨げる条件下、又は分子ビーコンが溶液中で遊離である場合、蛍光分子及び消光分子は互いに近接しており、FRETを妨げる。分子ビーコンが標的分子(例えば、核酸増幅産物)に遭遇した場合、ハイブリダイゼーションが起こり得、ループ構造が安定なより硬い立体構造に変換され、蛍光につながるフルオロフォア及び消光剤分子の分離を引き起こす。プローブの特異性のために、蛍光の生成は、一般的に、意図された増幅された産物の合成に独占的に起因する。一部の実施形態では、分子ビーコンプローブ配列は、標的核酸中の配列と同一又は相補的である増幅産物中の配列とハイブリダイズする。一部の実施形態では、分子ビーコンプローブ配列は、標的核酸中の配列と同一ではないか又は相補的でない増幅産物中の配列とハイブリダイズする(例えば、尾部増幅プライマー又はライゲーションにより増幅産物に付加された配列とハイブリダイズする)。分子ビーコンは、異なる着色フルオロフォア及び異なる標的配列を用いて合成することができ、同じ反応(例えば、多重反応)におけるいくつかの生成物の同時検出を可能にする。定量的増幅プロセスでは、分子ビーコンは増幅の各サイクル後に増幅された標的に特異的に結合することができ、ハイブリダイズしていない分子ビーコンは暗いため、増幅された産物の量を定量的に決定するためにプローブ-標的ハイブリッドを単離する必要はない。得られたシグナルは、増幅された産物の量に比例する。分子ビーコンを用いた検出は、リアルタイムで、又は終点検出方法として行うことができる。
核酸増幅産物の検出は、側方流動の使用を含むことができ、側方流動デバイスは、一般的に、毛細管力によって流体が流れる固相流体透過性流路を含むことができる。例示的なデバイスには、限定されないが、ディップスティックアッセイ及び種々の適切な被覆を有する薄層クロマトグラフィープレートが挙げられる。流路上に固定化されたものは、試料のための種々の結合試薬、試料及びシグナル生成システムのための結合パートナーを含む結合パートナー又はコンジュゲートである。検出は、例えば、酵素検出、ナノ粒子検出、比色検出、及び蛍光検出を含むいくつかの方法で達成することができる。
核酸増幅産物の検出は、2つの発色団:ドナー及びアクセプタ分子の間のエネルギー移動メカニズムであるFRETの使用を含むことができる。簡単に説明すると、ドナーフルオロフォア分子は、特定の励起波長で励起される。その後、基底状態に戻るときにドナー分子から放出される励起エネルギーは、長距離双極子-双極子相互作用を介してアクセプタ分子に移動され得る。アクセプタ分子の発光強度をモニターすることができ、ドナーとアクセプタの間の距離、ドナー発光スペクトルとアクセプタ吸収スペクトルとの重なり、及びドナー発光双極子モーメントとアクセプタ吸収双極子モーメントの配向の関数である。FRETは、例えば、分子ビーコンについて記載されるようなDNA-DNA相互作用において、分子動力学を定量するために有用であり得る。特定の生成物の生成をモニターするために、プローブは、一方の端にドナー分子、及び他方にアクセプタ分子で標識することができる。プローブ-標的ハイブリダイゼーションは、ドナー及びアクセプタの距離又は配向の変化をもたらし、FRET変化が観察される。
核酸増幅産物の検出は、一般的に、直線偏光によって励起された場合に蛍光標識された化合物が、その回転速度と反比例する偏光度を有する蛍光を発するという原理に基づくFPの使用を含む。したがって、例えば、蛍光標識を有するトレーサー-核酸コンジュゲートなどの分子を直線偏光で励起した場合、発光された光は、フルオロフォアが、光が吸収され発光される時間の間に回転するのを制限されるため、高度に偏光されたままである。遊離トレーサー化合物(すなわち、核酸に結合していない)が直線偏光によって励起された場合、その回転は、対応するトレーサー-核酸コンジュゲートよりもはるかに速く、分子はよりランダムに配向され、したがって、放出された光は脱分極される。したがって、蛍光偏光は、増幅反応において生成されたトレーサー-核酸コンジュゲートの量を測定するための定量的手段を提供する。
核酸増幅産物の検出は、特異的オリゴヌクレオチドを、高感度及び選択的なバイオセンサーを生成する表面に固定化することによって達成することができる表面捕捉の使用を含む。
核酸増幅産物の検出は、5’から3’へのエキソヌクレアーゼ加水分解プローブ(例えば、TAQMAN)の使用を含むことができる。例えば、TAQMANプローブは、定量的増幅法(例えば、定量的PCR)の特異性を増加させることができる加水分解プローブである。TAQMANプローブ原理は、1)相補的な標的配列へのハイブリダイゼーション中に二重標識プローブを切断するためのTaqポリメラーゼの5’から3’へのエキソヌクレアーゼ活性、及び2)フルオロフォアベースの検出に依存する。得られた蛍光シグナルは、増幅の指数関数的段階の間の増幅産物の蓄積を定量的に測定することを可能にする。
核酸増幅産物の検出は、特異的オリゴヌクレオチドを、高感度及び選択的なバイオセンサーを生成する表面に固定化することによって達成することができる表面捕捉の使用を含む。
核酸増幅産物の検出は、5’から3’へのエキソヌクレアーゼ加水分解プローブ(例えば、TAQMAN)の使用を含むことができる。例えば、TAQMANプローブは、定量的増幅法(例えば、定量的PCR)の特異性を増加させることができる加水分解プローブである。TAQMANプローブ原理は、1)相補的な標的配列へのハイブリダイゼーション中に二重標識プローブを切断するためのTaqポリメラーゼの5’から3’へのエキソヌクレアーゼ活性、及び2)フルオロフォアベースの検出に依存する。得られた蛍光シグナルは、増幅の指数関数的段階の間の増幅産物の蓄積を定量的に測定することを可能にする。
核酸増幅産物の検出は、インターカレーティング色素及び/又は結合色素、例えば、核酸を特異的に染色することができる色素の使用を含む。例えば、インターカレーティング色素は、DNA又はRNAに結合すると増強された蛍光を示す。色素の非限定的な例としては、SYTO(登録商標)82、アクリジンオレンジ、エチジウムブロマイド、ヘキスト色素、PicoGreen(登録商標)、ヨウ化プロピジウム、SYBR(登録商標)I(非対称シアニン色素)、SYBR(登録商標)II、TOTO(チアキソールオレンジ二量体)及びYOYO(オキサゾール黄色二量体)が挙げられる。
核酸増幅産物の検出は、吸光度法(例えば、比色法、濁度)の使用を含む。核酸の検出及び/又は定量は、例えば、吸光度(例えば、260nmにおけるUV吸光度測定)を濃度に直接変換することによって達成することができる。核酸の直接測定は、測定の経路長及び吸光係数を使用して、吸光度を濃度に関連付けるBeer Lambert法を使用して濃度に変換することができる。
核酸増幅産物の検出は、電気泳動(例えば、ゲル電気泳動、キャピラリー電気泳動)、質量分析、核酸シーケンシング、デジタル増幅(例えば、デジタルPCR)、又はそれらの任意の組み合わせの使用を含むことができる。
核酸増幅産物の検出は、電気泳動(例えば、ゲル電気泳動、キャピラリー電気泳動)、質量分析、核酸シーケンシング、デジタル増幅(例えば、デジタルPCR)、又はそれらの任意の組み合わせの使用を含むことができる。
目的とする遺伝子シグネチャ
複数の標的dsDNAは、目的とする遺伝子シグネチャ(例えば、バイオマーカーシグネチャ)を含み得る。目的とする遺伝子シグネチャは、目的とする1種以上の突然変異(例えば、バイオマーカー)を含み得る。目的とする1種以上の突然変異は、点突然変異、逆位、欠失、挿入、転座、重複、コピー数変動、又はそれらの組み合わせを含み得る。目的とする1種以上の突然変異は、ヌクレオチド置換、欠失、挿入、又はそれらの組み合わせを含み得る。目的とする遺伝子シグネチャは、標的dsDNAが由来する生物の抗生物質耐性又は抗生物質感受性を示すことができる。目的とする遺伝子シグネチャは、標的dsDNAが由来する生物のがん状態を示すことができる。目的とする遺伝子シグネチャは、標的dsDNAが由来する生物の遺伝子疾患の状態を示すことができる。遺伝子疾患は単一遺伝子障害であり得る。遺伝子疾患は、嚢胞性線維症、ハンチントン病、鎌状赤血球貧血、血友病、デュシェンヌ型筋ジストロフィー、サラセミア、脆弱X症候群、家族性高コレステロール血症、多嚢胞性腎疾患、神経線維腫症I型、遺伝性球状赤血球症、マルファン症候群、テイ-サックス病、フェニルケトン尿症、ムコ多糖症、リソソーム酸性リパーゼ欠損症、グリコーゲン貯蔵疾患、ガラクトース血症、又はヘモクロマトーシスであり得る。目的とする遺伝子シグネチャ(例えば、バイオマーカーシグネチャ)は、本明細書に提供される方法及び組成物を用いて検出することができる。診断的評価は、本明細書に提供される方法及び組成物を用いて行うことができる。
複数の標的dsDNAは、目的とする遺伝子シグネチャ(例えば、バイオマーカーシグネチャ)を含み得る。目的とする遺伝子シグネチャは、目的とする1種以上の突然変異(例えば、バイオマーカー)を含み得る。目的とする1種以上の突然変異は、点突然変異、逆位、欠失、挿入、転座、重複、コピー数変動、又はそれらの組み合わせを含み得る。目的とする1種以上の突然変異は、ヌクレオチド置換、欠失、挿入、又はそれらの組み合わせを含み得る。目的とする遺伝子シグネチャは、標的dsDNAが由来する生物の抗生物質耐性又は抗生物質感受性を示すことができる。目的とする遺伝子シグネチャは、標的dsDNAが由来する生物のがん状態を示すことができる。目的とする遺伝子シグネチャは、標的dsDNAが由来する生物の遺伝子疾患の状態を示すことができる。遺伝子疾患は単一遺伝子障害であり得る。遺伝子疾患は、嚢胞性線維症、ハンチントン病、鎌状赤血球貧血、血友病、デュシェンヌ型筋ジストロフィー、サラセミア、脆弱X症候群、家族性高コレステロール血症、多嚢胞性腎疾患、神経線維腫症I型、遺伝性球状赤血球症、マルファン症候群、テイ-サックス病、フェニルケトン尿症、ムコ多糖症、リソソーム酸性リパーゼ欠損症、グリコーゲン貯蔵疾患、ガラクトース血症、又はヘモクロマトーシスであり得る。目的とする遺伝子シグネチャ(例えば、バイオマーカーシグネチャ)は、本明細書に提供される方法及び組成物を用いて検出することができる。診断的評価は、本明細書に提供される方法及び組成物を用いて行うことができる。
診断評価は、本明細書に記載されるように、単独で又は他の評価若しくは因子と組み合わせて、バイオマーカーシグネチャ(例えば、目的とする遺伝子シグネチャ)に基づいて行われる。本明細書には、疾患若しくは状態を発症するリスクを評価し、上記疾患を予測し、上記疾患若しくは状態を診断し、上記疾患若しくは状態の進行又は退行をモニタリングし、或いは治療の有効性を評価し、又はバイオマーカーシグネチャ(例えば、目的とする遺伝子シグネチャ)に基づいて、上記疾患若しくは状態を改善又は治療することができる化合物を同定するための組成物及び方法が提供される。
疾患及び状態
本明細書に提供される方法は、種々の疾患又は状態と関連するバイオマーカーシグネチャ(例えば、目的とする遺伝子シグネチャ)に基づいて、種々の疾患又は状態に適用することができる。開示された組成物及び方法の対象となる目的とする遺伝子シグネチャを有する例示的な疾患又は状態としては、心血管疾患若しくは状態、腎臓と関連する疾患若しくは状態、出生前若しくは妊娠に関連した疾患若しくは状態、神経学的若しくは神経精神疾患若しくは状態、自己免疫若しくは免疫に関連した疾患若しくは状態、がん、感染性疾患若しくは状態、小児疾患、障害若しくは状態、ミトコンドリア障害、呼吸-消化管疾患若しくは状態、生殖系疾患若しくは状態、眼疾患若しくは状態、筋骨格疾患若しくは状態、又は皮膚疾患若しくは状態が挙げられる。
本明細書に提供される方法は、種々の疾患又は状態と関連するバイオマーカーシグネチャ(例えば、目的とする遺伝子シグネチャ)に基づいて、種々の疾患又は状態に適用することができる。開示された組成物及び方法の対象となる目的とする遺伝子シグネチャを有する例示的な疾患又は状態としては、心血管疾患若しくは状態、腎臓と関連する疾患若しくは状態、出生前若しくは妊娠に関連した疾患若しくは状態、神経学的若しくは神経精神疾患若しくは状態、自己免疫若しくは免疫に関連した疾患若しくは状態、がん、感染性疾患若しくは状態、小児疾患、障害若しくは状態、ミトコンドリア障害、呼吸-消化管疾患若しくは状態、生殖系疾患若しくは状態、眼疾患若しくは状態、筋骨格疾患若しくは状態、又は皮膚疾患若しくは状態が挙げられる。
試料
試料は、真核生物DNA、細菌DNA、ウイルスDNA、真菌DNA、原生動物DNA、又はそれらの組み合わせを含むことができる。複数の標的dsDNAは、ゲノムDNA、ミトコンドリアDNA、プラスミドDNA、又はそれらの組み合わせを含むことができる。試料は、生物学的試料、臨床試料、環境試料、若しくはそれらの組み合わせであり得るか又はそれに由来し得る。複数の標的dsDNAは、少なくとも2つの異なる生物由来のDNAを含むことができる。複数の標的dsDNAは、少なくとも2つの異なる遺伝子由来のDNAを含むことができる。本方法は、逆転写酵素を用いて複数の標的RNAから複数の標的dsDNAを生成することを含むことができる。複数の標的dsDNAは、逆転写酵素を用いて標的RNAから生成された標的dsDNAを含むことができる。試料核酸は、真核生物DNA、細菌DNA、ウイルスDNA、真菌DNA、原生動物DNA、又はそれらの組み合わせを含むことができる。標的dsDNAは、ゲノムDNA、ミトコンドリアDNA、プラスミドDNA、又はそれらの組み合わせであり得る。試料核酸は、生物学的試料、臨床試料、環境試料、又はそれらの組み合わせ由来であり得る。生物学的試料は、便、痰、末梢血、血漿、血清、リンパ節、呼吸組織、滲出液、体液、又はそれらの組み合わせを含むことができる。
試料は、真核生物DNA、細菌DNA、ウイルスDNA、真菌DNA、原生動物DNA、又はそれらの組み合わせを含むことができる。複数の標的dsDNAは、ゲノムDNA、ミトコンドリアDNA、プラスミドDNA、又はそれらの組み合わせを含むことができる。試料は、生物学的試料、臨床試料、環境試料、若しくはそれらの組み合わせであり得るか又はそれに由来し得る。複数の標的dsDNAは、少なくとも2つの異なる生物由来のDNAを含むことができる。複数の標的dsDNAは、少なくとも2つの異なる遺伝子由来のDNAを含むことができる。本方法は、逆転写酵素を用いて複数の標的RNAから複数の標的dsDNAを生成することを含むことができる。複数の標的dsDNAは、逆転写酵素を用いて標的RNAから生成された標的dsDNAを含むことができる。試料核酸は、真核生物DNA、細菌DNA、ウイルスDNA、真菌DNA、原生動物DNA、又はそれらの組み合わせを含むことができる。標的dsDNAは、ゲノムDNA、ミトコンドリアDNA、プラスミドDNA、又はそれらの組み合わせであり得る。試料核酸は、生物学的試料、臨床試料、環境試料、又はそれらの組み合わせ由来であり得る。生物学的試料は、便、痰、末梢血、血漿、血清、リンパ節、呼吸組織、滲出液、体液、又はそれらの組み合わせを含むことができる。
本明細書に記載される方法において利用される核酸は、任意の適切な生物学的試料から得ることができ、しばしば対象から得られる試料から単離される。対象は、限定されないが、ヒト、非ヒト動物、植物、細菌、真菌、ウイルス、又は原生生物を含む、任意の生きている生物又は生きていない生物であり得る。任意のヒト又は非ヒト動物を選択することができ、限定されないが、哺乳動物、爬虫類、鳥類、両生類、魚類、有蹄動物、反芻動物、ウシ(bovine)(例えば、ウシ(cattle))、ウマ(equine)(例えば、ウマ(horse))、ヤギ(caprine)及びヒツジ(ovine)(例えば、ヒツジ(sheep)、ヤギ(goat))、ブタ(swine)(例えば、ブタ(pig))、ラクダ(camelid)(例えば、ラクダ(camel)、ラマ、アルパカ)、サル、類人猿(例えば、ゴリラ、チンパンジー)、クマ(ursid)(例えば、クマ(bear))、家禽、イヌ、ネコ、マウス、ラット、魚、イルカ、クジラ及びサメが含まれる。対象は、男性又は女性であり得、対象は、任意の年齢(例えば、胚、胎児、乳児、小児、成人)であり得る。
試料又は試験試料は、対象若しくはその一部から単離されるか又は得られる任意の検体であり得る。検体の非限定的な例としては、対象由来の体液又は組織が挙げられ、限定されないが、血液又は血液生成物(例えば、血清、血漿など)、臍帯血、骨髄、絨毛、羊水、脳脊髄液、脊髄液、洗浄液(例えば、気管支肺胞、胃、腹腔、管、耳、関節鏡)、生検試料、セロセンチス試料、細胞(例えば、血液細胞)又はその一部(例えば、ミトコンドリア、核、抽出物など)、女性生殖器の洗浄液、尿、便、痰、唾液、鼻粘膜、前立腺液、洗浄液、精液、リンパ液、胆汁、涙、汗、母乳、乳房液、硬組織(例えば、肝臓、脾臓、腎臓、肺、又は卵巣)など、又はそれらの組み合わせが含まれる。血液という用語は、従来から定義されているように、全血、血液生成物又は血液の任意の画分、例えば、血清、血漿、バフィーコートなどを包含する。血液血漿とは、抗凝固剤で処理された血液の遠心分離から生じる全血の画分を指す。血液血清とは、血液試料が凝固した後に残った流体の水様部分を指す。体液又は組織の試料は、しばしば、病院又は診療所が一般的に守る標準的なプロトコールに従って採取される。血液については、適切な量の末梢血(例えば、3~40ミリリットル)がしばしば採取され、調製前又は調製後に標準的な手法に従って保存され得る。
試料又は試験試料は、芽胞、ウイルス、細胞、原核生物若しくは真核生物由来の核酸、又は任意の遊離核酸を含有する試料を含み得る。例えば、本明細書に記載される方法は、(例えば、溶解の必要なしに)芽胞の外側で核酸を検出するために使用され得る。試料は、上述の対象由来など、標的配列を含有することが疑われる任意の物質から単離することができる。一部の実施形態では、標的配列は、空気、植物、土壌、又は生物学的生物を含有することが疑われる他の物質中に存在する。
核酸は、当該技術分野において公知である方法によって、1種以上の供給源から誘導(例えば、単離、抽出、精製)することができる。任意の適切な方法は、生物学的試料から核酸を単離、抽出及び/又は精製するために使用することができ、その非限定的な例には、当該技術分野におけるDNA調製の方法、及び種々の市販される試薬又はキット、例えば、Qiagen’s QIAamp循環核酸キット、QiaAmp DNAミニキット又はQiaAmp DNA血液ミニキット(Qiagen、Hilden、Germany)、GenomicPrep(商標)血液DNA単離キット(Promega、Madison、Wis)、GFX(商標)ゲノム血液DNA精製キット(Amersham、Piscataway、N.J.)など、或いはそれらの組み合わせが挙げられる。
一部の実施形態では、細胞溶解手法が行われる。細胞溶解は、本明細書に提供される反応の開始前に行うことができる。細胞溶解手法及び試薬は当該技術分野において公知であり、一般的に、化学的溶解法(例えば、界面活性剤、低張液、酵素的手法など、又はそれらの組み合わせ)、物理的溶解法(例えば、加圧型細胞破壊、超音波処理など)、又は電解的溶解法によって行うことができる。適切な溶解手法を利用することができる。例えば、化学的方法は、一般的に、細胞を破壊し、細胞から核酸を抽出し、続いてカオトロピック塩で処理するために溶解剤を採用する。一部の実施形態では、細胞溶解は、界面活性剤(例えば、イオン性、非イオン性、陰イオン性、双性イオン性)の使用を含む。一部の実施形態では、細胞溶解は、イオン性界面活性剤(例えば、ドデシル硫酸ナトリウム(SDS)、ラウリル硫酸ナトリウム(SLS)、デオキシコール酸塩、コール酸塩、サルコシル)の使用を含む。凍結/解凍、続く粉砕、細胞圧搾の使用などの物理的方法も有用であり得る。高塩分溶解手法もまた用いることができる。例えば、アルカリ溶解手法を利用することができる。後者の手法は、従来、フェノール-クロロホルム溶液の使用を組み込んでおり、3つの溶液を伴う代替的なフェノール-クロロホルム不含手法を利用することができる。後者の手法では、1つの溶液は、15mM Tris、pH8.0;10mM EDTA及び100μg/ml RNase Aを含有することができ;第2の溶液は、0.2N NaOH及び1%SDSを含有することができ;第3の溶液は、例えば、3M KOAc、pH5.5を含有することができる。一部の実施形態では、細胞溶解緩衝液は、本明細書に記載される方法及び構成成分とともに使用される。
核酸は、核酸を含有する試料を処理することなく、本明細書に記載される方法を行うために提供され得る。例えば、一部の実施形態では、核酸は、以前の核酸精製なしに、本明細書に記載される増幅方法を行うために提供される。一部の実施形態では、標的配列は、(例えば、任意の核酸抽出、単離、精製及び/又は部分的精製ステップを行うことなく)試料から直接増幅される。一部の実施形態では、核酸は、核酸を含有する試料の処理後に、本明細書に記載される方法を行うために提供される。例えば、核酸は、試料から抽出、単離、精製、又は部分的に精製することができる。用語「単離された」とは、一般的に、その元の環境(例えば、それが天然に存在する場合の自然環境、又は外因性に発現される場合の宿主細胞)から取り出された核酸を指し、したがって、その元の環境からのヒトの介入(例えば、「ヒトの手による」)によって変更される。用語「単離された核酸」とは、対象(例えば、ヒト対象)から取り出された核酸を指すことができる。単離された核酸は、供給源試料中に存在する成分量よりも少ない非核酸成分(例えば、タンパク質、脂質、糖質)を提供することができる。単離された核酸を含む組成物は、非核酸成分を約50%~99%を超えて含まない場合がある。単離された核酸を含む組成物は、非核酸成分を約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は99%を超えて含まない場合がある。用語「精製された」とは、一般的に、核酸を精製手法に供する前に存在する非核酸成分の量よりも少ない非核酸成分(例えば、タンパク質、脂質、糖質)を含有する核酸を指す。精製された核酸を含む組成物は、他の非核酸成分を約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は99%を超えて含まない場合がある。
核酸は、核酸を修飾することなく、本明細書に記載される方法を行うために提供され得る。修飾には、例えば、変性、消化、ニッキング、巻き戻し、不均一配列の組込み及び/又はライゲーション、エピジェネティック修飾の付加、標識(例えば、32P、33P、125I若しくは35Sなどの放射性標識;アルカリホスファターゼなどの酵素標識;フルオレセインイソチオシアネート(FITC)などの蛍光標識;又はビオチン、アビジン、ジゴキシゲニン、抗原、ハプテン、蛍光色素などの他の標識)などの付加が含まれ得る。したがって、一部の実施形態では、未修飾核酸は増幅される。
試料中の標的核酸配列(一本鎖又は二本鎖DNA及び/又はRNA)を検出するための本開示の方法は、高程度の感度で標的核酸配列(例えば、DNA又はRNA)を検出することができる。一部の実施形態では、本開示の方法を使用して、複数のRNA/DNA(標的RNA/DNA及び複数の非標的RNA/DNAを含む)を含む試料中に存在する標的RNA/DNAを検出することができ、標的RNA/DNAは、1コピー以上/107個の非標的RNA/DNA(例えば、1コピー以上/106個の非標的RNA/DNA、1コピー以上/105個の非標的RNA/DNA、1コピー以上/104個の非標的RNA/DNA、1コピー以上/103個の非標的RNA/DNA、1コピー以上/102個の非標的RNA/DNA、1コピー以上/50個の非標的RNA/DNA、1コピー以上/20個の非標的RNA/DNA、1コピー以上/10個の非標的RNA/DNA、又は1コピー以上/5個の非標的RNA/DNA)で存在する。一部の実施形態では、本開示の方法を使用して、複数のRNA/DNA(標的RNA/DNA及び複数の非標的RNA/DNAを含む)を含む試料中に存在する標的RNA/DNAを検出することができ、標的RNA/DNAは、1コピー以上/1018個の非標的RNA/DNA(例えば、1コピー以上/1015個の非標的RNA/DNA、1コピー以上/1012個の非標的RNA/DNA、1コピー以上/109個の非標的RNA/DNA、1コピー以上/106個の非標的RNA/DNA、1コピー以上/105個の非標的RNA/DNA、1コピー以上/104個の非標的RNA/DNA、1コピー以上/103個の非標的RNA/DNA、1コピー以上/102個の非標的RNA/DNA、1コピー以上/50個の非標的RNA/DNA、1コピー以上/20個の非標的RNA/DNA、1コピー以上/10個の非標的RNA/DNA、又は1コピー以上/5個の非標的RNA/DNA)で存在する。本明細書で使用される場合、用語「RNA/DNA」及び「RNAs/DNAs」は、それらの通常の意味を与えられるものとし、DNA、若しくはRNA、又はDNAとRNAの組み合わせをも指すものとする。
一部の実施形態では、本開示の方法は、試料中に存在する標的RNA/DNAを検出することができ、標的RNA/DNAは、1コピー/107個の非標的RNA/DNA~1コピー/10個の非標的RNA/DNA(例えば、1コピー/107個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/103個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/104個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/105個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/106個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/10個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/103個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/104個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/105個の非標的RNA/DNA、1コピー/105個の非標的RNA/DNA~1コピー/10個の非標的RNA/DNA、1コピー/105個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/105個の非標的RNA/DNA~1コピー/103個の非標的RNA/DNA、又は1コピー/105個の非標的RNA/DNA~1コピー/104個の非標的RNA/DNA)で存在する。
一部の実施形態では、本開示の方法は、試料中に存在する標的RNA/DNAを検出することができ、標的RNA/DNAは、1コピー/1018個の非標的RNA/DNA~1コピー/10個の非標的RNA/DNA(例えば、1コピー/1018個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/1015個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/1012個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/109個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/103個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/104個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/105個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/106個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/10個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/103個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/104個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/105個の非標的RNA/DNA、1コピー/105個の非標的RNA/DNA~1コピー/10個の非標的RNA/DNA、1コピー/105個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/105個の非標的RNA/DNA~1コピー/103個の非標的RNA/DNA、又は1コピー/105個の非標的RNA/DNA~1コピー/104個の非標的RNA/DNA)で存在する。
一部の実施形態では、本開示の方法は、試料中に存在する標的RNA/DNAを検出することができ、標的RNA/DNAは、1コピー/107個の非標的RNA/DNA~1コピー/100個の非標的RNA/DNA(例えば、1コピー/107個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/103個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/104個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/105個の非標的RNA/DNA、1コピー/107個の非標的RNA/DNA~1コピー/106個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/100個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/103個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/104個の非標的RNA/DNA、1コピー/106個の非標的RNA/DNA~1コピー/105個の非標的RNA/DNA、1コピー/105個の非標的RNA/DNA~1コピー/100個の非標的RNA/DNA、1コピー/105個の非標的RNA/DNA~1コピー/102個の非標的RNA/DNA、1コピー/105個の非標的RNA/DNA~1コピー/103個の非標的RNA/DNA、又は1コピー/105個の非標的RNA/DNA~1コピー/104個の非標的RNA/DNA)で存在する。
一部の実施形態では、試料中の標的RNA/DNAを検出する主題の方法についての検出閾値は、10nM以下である。用語「検出閾値」は、検出が起こるために試料中に存在しなければならない最小量の標的RNA/DNAを記載するために本明細書で使用される。したがって、例示的な例として、検出閾値が10nMである場合、標的RNA/DNAが10nM以上の濃度で試料中に存在する場合には、シグナルを検出することができる。一部の実施形態では、本開示の方法は、5nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、1nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、0.5nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、0.1nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、0.05nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、0.01nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、0.005nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、0.001nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、0.0005nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、0.0001nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、0.00005nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、0.00001nM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、10pM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、1pM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、500fM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、250fM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、100fM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、50fM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、500aM(アトモル濃度)以下の検出閾値を有する。一部の実施形態では、本開示の方法は、250aM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、100aM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、50aM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、10aM以下の検出閾値を有する。一部の実施形態では、本開示の方法は、1aM以下の検出閾値を有する。
一部の実施形態では、検出閾値(主題の方法において標的RNA/DNAを検出するため)は、500fM~1nM(例えば、500fM~500pM、500fM~200pM、500fM~100pM、500fM~10pM、500fM~1pM、800fM~1nM、800fM~500pM、800fM~200pM、800fM~100pM、800fM~10pM、800fM~1pM、1pM~1nM、1pM~500pM、1pM~200pM、1pM~100pM、又は1pM~10pM)の範囲である(濃度は標的RNA/DNAが検出され得る標的RNA/DNAの閾値濃度を指す)。一部の実施形態では、本開示の方法は、800fM~100pMの範囲の検出閾値を有する。一部の実施形態では、本開示の方法は、1pM~10pMの範囲の検出閾値を有する。一部の実施形態では、本開示の方法は、10fM~500fM、例えば、10fM~50fM、50fM~100fM、100fM~250fM、又は250fM~500fMの範囲の検出閾値を有する。
一部の実施形態では、標的RNA/DNAが試料中で検出され得る最低濃度は、500fM~1nM(例えば、500fM~500pM、500fM~200pM、500fM~100pM、500fM~10pM、500fM~1pM、800fM~1nM、800fM~500pM、800fM~200pM、800fM~100pM、800fM~10pM、800fM~1pM、1pM~1nM、1pM~500pM、1pM~200pM、1pM~100pM、又は1pM~10pM)の範囲である。一部の実施形態では、標的RNA/DNAが試料中で検出され得る最低濃度は、800fM~100pMの範囲である。一部の実施形態では、標的RNA/DNAが試料中で検出され得る最低濃度は、1pM~10pMの範囲である。
一部の実施形態では、検出閾値(主題の方法において標的RNA/DNAを検出するため)は、1aM~1nM(例えば、1aM~500pM、1aM~200pM、1aM~100pM、1aM~10pM、1aM~1pM、100aM~1nM、100aM~500pM、100aM~200pM、100aM~100pM、100aM~10pM、100aM~1pM、250aM~1nM、250aM~500pM、250aM~200pM、250aM~100pM、250aM~10pM、250aM~1pM、500aM~1nM、500aM~500pM、500aM~200pM、500aM~100pM、500aM~10pM、500aM~1pM、750aM~1nM、750aM~500pM、750aM~200pM、750aM~100pM、750aM~10pM、750aM~1pM、1fM~1nM、1fM~500pM、1fM~200pM、1fM~100pM、1fM~10pM、1fM~1pM、500fM~500pM、500fM~200pM、500fM~100pM、500fM~10pM、500fM~1pM、800fM~1nM、800fM~500pM、800fM~200pM、800fM~100pM、800fM~10pM、800fM~1pM、1pM~1nM、1pM~500pM、1pM~200pM、1pM~100pM、又は1pM~10pM)の範囲である(濃度は標的RNA/DNAが検出され得る標的RNA/DNAの閾値濃度を指す)。一部の実施形態では、本開示の方法は、1aM~800aMの範囲の検出閾値を有する。一部の実施形態では、本開示の方法は、50aM~1pMの範囲の検出閾値を有する。一部の実施形態では、本開示の方法は、50aM~500fMの範囲の検出閾値を有する。
一部の実施形態では、標的RNA/DNAが試料中で検出され得る最低濃度は、1aM~1nM(例えば、1aM~500pM、1aM~200pM、1aM~100pM、1aM~10pM、1aM~1pM、100aM~1nM、100aM~500pM、100aM~200pM、100aM~100pM、100aM~10pM、100aM~1pM、250aM~1nM、250aM~500pM、250aM~200pM、250aM~100pM、250aM~10pM、250aM~1pM、500aM~1nM、500aM~500pM、500aM~200pM、500aM~100pM、500aM~10pM、500aM~1pM、750aM~1nM、750aM~500pM、750aM~200pM、750aM~100pM、750aM~10pM、750aM~1pM、1fM~1nM、1fM~500pM、1fM~200pM、1fM~100pM、1fM~10pM、1fM~1pM、500fM~500pM、500fM~200pM、500fM~100pM、500fM~10pM、500fM~1pM、800fM~1nM、800fM~500pM、800fM~200pM、800fM~100pM、800fM~10pM、800fM~1pM、1pM~1nM、1pM~500pM、1pM~200pM、1pM~100pM、又は1pM~10pM)の範囲である。一部の実施形態では、標的RNA/DNAが試料中で検出され得る最低濃度は、1aM~500pMの範囲である。一部の実施形態では、標的RNA/DNAが試料中で検出され得る最低濃度は、100aM~500pMの範囲である。
一部の実施形態では、開示される組成物又は方法は、アトモル濃度(aM)の検出感度を示す。一部の実施形態では、開示される組成物又は方法は、フェムトモル濃度(fM)の検出感度を示す。一部の実施形態では、開示される組成物又は方法は、ピコモル濃度(pM)の検出感度を示す。一部の実施形態では、開示される組成物又は方法は、ナノモル濃度(nM)の検出感度を示す。
一部の実施形態では、開示される組成物又は方法は、アトモル濃度(aM)の検出感度を示す。一部の実施形態では、開示される組成物又は方法は、フェムトモル濃度(fM)の検出感度を示す。一部の実施形態では、開示される組成物又は方法は、ピコモル濃度(pM)の検出感度を示す。一部の実施形態では、開示される組成物又は方法は、ナノモル濃度(nM)の検出感度を示す。
開示される試料は、試料核酸(例えば、複数の試料核酸)を含む。用語「複数」とは、本明細書において、2種以上を意味するために使用される。したがって、一部の実施形態では、試料は、2種以上(例えば、3種以上、5種以上、10種以上、20種以上、50種以上、100種以上、500種以上、1,000種以上、又は5,000種以上)の試料核酸(例えば、RNA)を含む。開示される方法は、試料中(例えば、RNAなどの核酸の複合混合物中)に存在する標的核酸を検出するための非常に感度の高い方法として用いることができる。一部の実施形態では、試料は、配列が互いに異なる5種以上のDNA(例えば、10種以上、20種以上、50種以上、100種以上、500種以上、1,000種以上、又は5,000種以上のRNA)を含む。一部の実施形態では、試料は、10種以上、20種以上、50種以上、100種以上、500種以上、103種以上、5×103種以上、104種以上、5×104種以上、105種以上、5×105種以上、106種以上、5×106種以上、又は107種以上のDNAを含む。一部の実施形態では、試料は、10~20種、20~50種、50~100種、100~500種、500~103種、103~5×103種、5×103~104種、104~5×104種、5×104~105種、105~5×105種、5×105~106種、106~5×106種、若しくは5×106~107種、又は107種以上のDNAを含む。一部の実施形態では、試料は、5~107種のRNA(例えば、配列が互いに異なる)(例えば、5~106種、5~105種、5~50,000種、5~30,000種、10~106種、10~105種、10~50,000種、10~30,000種、20~106種、20~105種、20~50,000種、又は20~30,000種のDNA)を含む。一部の実施形態では、試料は、配列が互いに異なる20種以上のRNAを含む。一部の実施形態では、試料は、細胞溶解物(例えば、真核細胞溶解物、哺乳動物細胞溶解物、ヒト細胞溶解物、原核生物細胞溶解物、植物細胞溶解物など)由来のRNAを含む。例えば、一部の実施形態では、試料は、真核細胞などの細胞、例えば、ヒト細胞などの哺乳動物細胞由来のDNAを含む。
用語「試料」は、本明細書で使用される場合、その通常の意味を与えられ、(例えば、標的DNA及び/又は標的RNAがRNA及び/又はDNAの集団中に存在するかどうかを決定するために)RNA及び/又はDNAを含む任意の試料を含まなければならない。試料は、任意の供給源に由来することができ、例えば、試料は、精製されたDNA及び/又はRNAの合成の組み合わせであり得;試料は、細胞溶解物、DNA/RNA濃縮細胞溶解物、又は細胞溶解物から単離及び/若しくは精製されたDNA/RNAであり得る。試料は、(例えば、診断の目的のために)患者由来であり得る。試料は、透過処理された細胞由来であり得る。試料は、架橋された細胞由来であり得る。試料は、組織切片中にあり得る。試料は、架橋し、続いて、脱脂及び調整して均一な屈折率を作製することによって調製された組織由来であり得る。
適切な試料には、限定されないが、唾液、血液、血清、血漿、尿、吸引物、及び生検試料が含まれる。試料は、患者由来であり得、生物学的起源の血液及び他の液体試料、固体組織試料、例えば、生検検体又はそれらに由来する組織培養物若しくは細胞、及びそれらの子孫を包含する。この定義はまた、例えば、試薬による処理、洗浄、又はがん細胞などのある特定の細胞集団についての濃縮などによって、それらの調達後に任意の方法で操作された試料を含む。この定義はまた、特定タイプの分子、例えば、RNAについて濃縮された試料を含む。用語「試料」は、生物学的試料、例えば、臨床試料、例えば、血液、血漿、血清、吸引物、脳脊髄液(CSF)を包含し、また、外科的切除によって得られた組織、生検によって得られた組織、培養細胞、細胞上清、細胞溶解物、組織試料、臓器、骨髄なども含む。「生物学的試料」は、それに由来する生物学的流体(例えば、がん性細胞、感染細胞など)、例えば、このような細胞から得られるRNAを含む試料(例えば、RNAを含む細胞溶解物又は他の細胞抽出物)を含む。
一部の実施形態では、試料の供給源は、疾患細胞、体液、組織、又は臓器である(又はその疑いがある)。一部の実施形態では、試料の供給源は、正常な(非疾患)細胞、体液、組織、又は臓器である。一部の実施形態では、試料の供給源は、病原体に感染した細胞、組織、又は臓器である(又はその疑いがある)。例えば、試料の供給源は、感染され得るか又は感染され得ない個体であり得、試料は、個体から採取される任意の生物学的試料(例えば、血液、唾液、生検、血漿、血清、気管支肺胞洗浄、痰、糞便試料、脳脊髄液、細針吸引物、スワブ試料(例えば、口腔スワブ、頸部スワブ、鼻スワブ)、間質液、滑液、鼻汁、涙、バフィーコート、粘膜試料、上皮細胞試料(例えば、上皮細胞剥離)など)であり得る。一部の実施形態では、試料は、無細胞液体試料である。一部の実施形態では、試料は、細胞を含むことができる液体試料である。病原体には、ウイルス、真菌、蠕虫、原虫、マラリア寄生虫、プラスモジウム(Plasmodium)寄生虫、トキソプラズマ(Toxoplasma)寄生虫、住血吸虫(Schistosoma)寄生虫などが含まれる。「蠕虫」には、回虫、心臓線虫、及び植物性線虫(ネマトーダ)、吸虫(テマトーダ)、アカントセファラ、並びに条虫(セストーダ)が含まれる。原虫感染症には、ジアルジア属種(Giardia spp.)、トリコモナス属種(Trichomonas spp.)、アフリカトリパノソーマ症、アメーバ赤痢、バベシア症、バランチジア赤痢、シャーガス病、コクシジウム症、マラリア及びトキソプラズマ症由来の感染が含まれる。寄生/原虫病原体などの病原体の例には、限定されないが、熱帯熱マラリア原虫(Plasmodium falciparum)、三日熱マラリア原虫(Plasmodium vivax)、トリパノソーマ・クルーズ(Trypanosoma cruzi)及びトキソプラズマ原虫(Toxoplasma gondii)が挙げられる。真菌病原体には、限定されないが、クリプトコッカス・ネオフォルマンス(Cryptococcus neoformans)、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、コクシジオイデス・イミティス(Coccidioides immitis)、ブラストミセス・デルマチチジス(Blastomyces dermatitidis)、クラミジア・トラコマチス(Chlamydia trachomatis)、及びカンジダ・アルビカンス(Candida albicans)が含まれる。病原性ウイルスには、例えば、免疫不全ウイルス(例えば、HIV);インフルエンザウイルス;デング;西ナイルウイルス;ヘルペスウイルス;黄熱ウイルス;C型肝炎ウイルス;A型肝炎ウイルス;B型肝炎ウイルス;パピローマウイルスなどが含まれる。病原性ウイルスには、DNAウイルス、例えば、パポバウイルス(例えば、ヒトパピローマウイルス(HPV)、ポリオーマウイルス);ヘパドナウイルス(例えば、B型肝炎ウイルス(HBV));ヘルペスウイルス(例えば、単純ヘルペスウイルス(HSV))、水痘帯状疱疹ウイルス(VZV)、エプスタイン・バーウイルス(EBV)、サイトメガロウイルス(CMV)、ヘルペスリンパ球向性ウイルス、バラ色粃糠疹(Pityriasis Rosea)、カポジ肉腫関連ヘルペスウイルス);アデノウイルス(例えば、アタデノウイルス、アビアデノウイルス、イクタデノウイルス、マストアデノウイルス、シアデノウイルス);ポックスウイルス(例えば、天然痘ウイルス、ワクシニアウイルス、牛痘ウイルス、サル痘ウイルス、オルフウイルス、仮性痘瘡ウイルス、ウシ丘疹性口内炎ウイルス;タナポックスウイルス、ヤバザル腫瘍ウイルス;伝染性軟属腫ウイルス(MCV));パルボウイルス(例えば、アデノ随伴ウイルス(AAV)、パルボウイルスB19、ヒトボカウイルス、ブファウイルス、ヒトパルブ4 G1);ジェミニウイルス科(Geminiviridae);ナノウイルス科(Nanoviridae);フィコドナウイルス科(Phycodnaviridae)などが含まれ得る。病原体には、例えば、DNAウイルス[例えば、パポバウイルス(例えば、ヒトパピローマウイルス(HPV)、ポリオーマウイルス);ヘパドナウイルス(例えば、B型肝炎ウイルス(HBV));ヘルペスウイルス(例えば、単純ヘルペスウイルス(HSV)、水痘帯状疱疹ウイルス(VZV)、エプスタイン・バーウイルス(EBV)、サイトメガロウイルス(CMV)、ヘルペスリンパ球向性ウイルス、バラ色粃糠疹、カポジ肉腫関連ヘルペスウイルス);アデノウイルス(例えば、アタデノウイルス、アビアデノウイルス、イクタデノウイルス、マストアデノウイルス、シアデノウイルス);ポックスウイルス(例えば、天然痘ウイルス、ワクシニアウイルス、牛痘ウイルス、サル痘ウイルス、オルフウイルス、仮性痘瘡ウイルス、ウシ丘疹性口内炎ウイルス;タナポックスウイルス、ヤバザル腫瘍ウイルス;伝染性軟属腫ウイルス(MCV));パルボウイルス(例えば、アデノ随伴ウイルス(AAV)、パルボウイルスB19、ヒトボカウイルス、ブファウイルス、ヒトパルブ4 G1);ジェミニウイルス科;ナノウイルス科;フィコドナウイルス科など]、ヒト型結核菌(Mycobacterium tuberculosis)、ストレプトコッカス・アガラクティエ(Streptococcus agalactiae)、メチシリン耐性黄色ブドウ球菌、レジオネラ・ニューモフィラ(Legionella pneumophila)、化膿連鎖球菌、大腸菌(Escherichia coli)、淋菌(Neisseria gonorrhoeae)、髄膜炎菌、肺炎球菌(Pneumococcus)、クリプトコッカス・ネオフォルマンス、ヒストプラズマ・カプスラタム、B型インフルエンザ菌(Hemophilus influenzae B)、梅毒トレポネーマ(Treponema pallidum)、ライム病スピロヘータ、緑膿菌(Pseudomonas aeruginosa)、らい菌(Mycobacterium leprae)、ブルセラ・アボルツス(Brucella abortus)、狂犬病ウイルス、インフルエンザウイルス、サイトメガロウイルス、単純ヘルペスウイルスI、単純ヘルペスウイルスII、ヒト血清パルボ様ウイルス、呼吸器合胞体ウイルス、水痘・帯状疱疹ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、麻疹ウイルス、アデノウイルス、ヒトT細胞白血病ウイルス、エプスタイン・バーウイルス、マウス白血病ウイルス、ムンプスウイルス、水疱性口内炎ウイルス、シンドビスウイルス、リンパ球性脈絡髄膜炎ウイルス、イボウイルス、青舌ウイルス、センダイウイルス、ネコ白血病ウイルス、レオウイルス、ポリオウイルス、シミアンウイルス40、マウス乳がんウイルス、デング熱ウイルス、風疹ウイルス、西ナイルウイルス、熱帯熱マラリア原虫、三日熱マラリア原虫、トキソプラズマ原虫、トリパノソーマ・ランゲリ(Trypanosoma rangeli)、トリパノソーマ・クルーズ、トリパノソーマ・ローデシエンス(Trypanosoma rhodesiense)、トリパノソーマ・ブルーセイ(Trypanosoma brucei)、マンソン住血吸虫(Schistosoma mansoni)、日本住血吸虫(Schistosoma japonicum)、バベシア・ボビス(Babesia bovis)、アイメリア・テネラ(Eimeria tenella)、回旋糸状虫(Onchocerca volvulus)、熱帯リーシュマニア(Leishmania tropica)、ヒト型結核菌、旋毛虫(Trichinella spiralis)、東沿岸熱タイレリア(Theileria parva)、胞状条虫(Taenia hydatigena)、タエニア・オビス(Taenia ovis)、無鉤条虫(Taenia saginata)、単包条虫(Echinococcus granulosus)、メソセストイデス・コルチ(Mesocestoides corti)、マイコプラズマ・アルスリティディス(Mycoplasma arthritidis)、M.ヒオルイニス(M. hyorhinis)、M.オラル(M. orale)、M.アルギニニ(M. arginini)、アコレプラズマ・レイドロウイ(Acholeplasma laidlawii)、M.サリバリウム(M. salivarium)、及びM.ニューモニエ(M. pneumoniae)が含まれ得る。病原性ウイルスは、SARS-CoV-2、A型インフルエンザ、B型インフルエンザ、及び/又はC型インフルエンザのうちの1つ以上を含むことができる。
試料は、生物学的試料、例えば、臨床試料であり得る。一部の実施形態では、試料は、生物学的供給源、例えば、膣、尿道、陰茎、肛門、咽喉、子宮頸部、発酵ブロス、細胞培養物などから採取される。試料は、例えば、糞便試料由来の流体及び細胞を含むことができる。生物学的試料は、(i)対象又は供給源から直接得られるように、又は(ii)前処理の後に、試料の特性を修飾するために使用することができる。したがって、試験試料は、使用前に、例えば、細胞又はウイルス粒子を破壊し、固体材料から液体を調製し、粘性流体を希釈し、液体をろ過し、液体を濃縮し、妨害成分を不活化し、試薬を添加し、核酸を精製することなどによって前処理することができる。したがって、本明細書で使用される「生物学的試料」には、臨床検体又は生物学的検体から抽出された核酸(DNA、RNA又は全核酸)が含まれる。試料調製はまた、分析用に試料を調製するために使用される緩衝液、塩、界面活性剤などを含有する溶液を使用することを含むことができる。一部の実施形態では、試料は、分子試験前に処理される。一部の実施形態では、試料は、直接分析され、試験前に前処理されない。試料は、例えば、糞便試料であり得る。一部の実施形態では、試料は、急性胃腸炎の臨床症状を有する患者由来の糞便試料である。
一部の実施形態では、試験されるべき試料は、本明細書に開示される方法を行う前に処理される。例えば、一部の実施形態では、試料は、本明細書に開示される方法を行う前に、単離、濃縮、又は種々の他の処理ステップに供することができる。例えば、一部の実施形態では、試料は、本明細書に開示されるように、試料をオリゴヌクレオチドと接触させる前に、試料から核酸を単離するために処理することができる。一部の実施形態では、本明細書に開示される方法は、試料をインビトロで培養することなく、試料に対して行われる。一部の実施形態では、本明細書に開示される方法は、試料を本明細書に開示されるオリゴヌクレオチドと接触させる前に、試料から核酸を単離することなく試料上で行われる。
試料は、1種以上の核酸(例えば、複数の核酸)を含むことができる。本明細書で使用される用語「複数」とは、2種以上を指すことができる。したがって、一部の実施形態では、試料は、2種以上(例えば、3種以上、5種以上、10種以上、20種以上、50種以上、100種以上、500種以上、1,000種以上、又は5,000種以上)の核酸(例えば、gDNA、mRNA)を含む。開示される方法は、試料中(例えば、gDNAなどの核酸の複合混合物中)に存在する標的核酸を検出するための非常に感度の高い方法として用いることができる。一部の実施形態では、試料は、配列が互いに異なる5種以上の核酸(例えば、10種以上、20種以上、50種以上、100種以上、500種以上、1,000種以上、又は5,000種以上のRNA)を含む。一部の実施形態では、試料は、10種以上、20種以上、50種以上、100種以上、500種以上、103種以上、5×103種以上、104種以上、5×104種以上、105種以上、5×105種以上、106種以上、5×106種以上、又は107種以上の核酸を含む。
一部の実施形態では、試料は、10~20種、20~50種、50~100種、100~500種、500~103種、103~5×103種、5×103~104種、104~5×104種、5×104~105種、105~5×105種、5×105~106種、106~5×106種、若しくは5×106~107種、又は107種以上の核酸を含む。一部の実施形態では、試料は、5~107種の核酸(例えば、配列が互いに異なる)(例えば、5~106種、5~105種、5~50,000種、5~30,000種、10~106種、10~105種、10~50,000種、10~30,000種、20~106種、20~105種、20~50,000種、若しくは20~30,000種の核酸、又はこれらの値の任意の2つの間の数値若しくは範囲)を含む。一部の実施形態では、試料は、配列が互いに異なる20種以上の核酸を含む。
試料は、(例えば、標的核酸が核酸集団中に存在するかどうかを決定するために)核酸を含む任意の試料であり得る。試料は、任意の供給源から誘導することができ、例えば、試料は、精製された核酸の合成の組み合わせであり得;試料は、細胞溶解物、DNA濃縮細胞溶解物、又は細胞溶解物から単離及び/若しくは精製された核酸であり得る。試料は、(例えば、診断の目的のために)患者由来であり得る。試料は、透過処理された細胞由来であり得る。試料は、架橋された細胞由来であり得る。試料は、組織切片中にあり得る。試料は、架橋し、続いて、脱脂及び調整して均一な屈折率を作製することによって調製された組織由来であり得る。
試料は、標的核酸及び複数の非標的核酸を含むことができる。一部の実施形態では、標的核酸は、1コピー/10個の非標的核酸、1コピー/20個の非標的核酸、1コピー/25個の非標的核酸、1コピー/50個の非標的核酸、1コピー/100個の非標的核酸、1コピー/500個の非標的核酸、1コピー/103個の非標的核酸、1コピー/5×103個の非標的核酸、1コピー/104個の非標的核酸、1コピー/5×104個の非標的核酸、1コピー/105個の非標的核酸、1コピー/5×105個の非標的核酸、1コピー/106個の非標的核酸、1コピー未満/106個の非標的核酸、又はこれらの値の任意の2つの間の数値若しくは範囲で試料中に存在する。一部の実施形態では、標的核酸は、1コピー/10個の非標的核酸~1コピー/20個の非標的核酸、1コピー/20個の非標的核酸~1コピー/50個の非標的核酸、1コピー/50個の非標的核酸~1コピー/100個の非標的核酸、1コピー/100個の非標的核酸~1コピー/500個の非標的核酸、1コピー/500個の非標的核酸~1コピー/103個の非標的核酸、1コピー/103個の非標的核酸~1コピー/5×103個の非標的核酸、1コピー/5×103個の非標的核酸~1コピー/104個の非標的核酸、1コピー/104個の非標的核酸~1コピー/105個の非標的核酸、1コピー/105個の非標的核酸~1コピー/106個の非標的核酸、若しくは1コピー/106個の非標的核酸~1コピー/107個の非標的核酸、又はこれらの値の任意の2つの間の数値若しくは範囲で試料中に存在する。
適切な試料には、限定されないが、唾液、血液、血清、血漿、尿、吸引物、及び生検試料が含まれる。したがって、患者に関する用語「試料」は、生物学的起源の血液及び他の液体試料、固体組織試料、例えば、生検検体又はそれらに由来する組織培養物若しくは細胞、及びそれらの子孫を包含する。この定義はまた、例えば、試薬による処理、洗浄、又はがん細胞などのある特定の細胞集団についての濃縮などによって、それらの調達後に任意の方法で操作された試料を含む。この定義はまた、特定のタイプの分子、例えば、核酸について濃縮された試料を含む。用語「試料」は、生物学的試料、例えば、臨床試料、例えば、血液、血漿、血清、吸引物、脳脊髄液(CSF)を包含し、また、外科的切除によって得られた組織、生検によって得られた組織、培養細胞、細胞上清、細胞溶解物、組織試料、臓器、骨髄なども含む。「生物学的試料」は、それに由来する生物学的流体(例えば、がん性細胞、感染細胞など)、例えば、このような細胞から得られる核酸を含む試料(例えば、核酸を含む細胞溶解物又は他の細胞抽出物)を含む。
本明細書に開示される方法において使用するための適切な試料には、植物、動物、細菌などの生物又はその一部から得られる任意の慣用的な生物学的試料が含まれる。特定の実施形態では、生物学的試料は、ヒト対象などの動物対象から得られる。生物学的試料は、限定されないが、とりわけ細菌、酵母、原生動物、及びアメーバなどの単細胞生物、多細胞生物を含む任意の生物から得られるか、排泄されるか、又は分泌される任意の固体又は流体の試料(植物又は動物など、健康な若しくは見かけ上健康なヒト対象、又は病原性細菌若しくはウイルスなどの病原性微生物による感染など、診断又は調査されるべき対象の状態若しくは疾患に罹患しているヒト患者由来の試料を含む)である。例えば、生物学的試料は、例えば、血液、血漿、血清、尿、糞便、痰、粘液、リンパ液、滑液、胆汁、腹水、胸水、漿液腫、唾液、脳脊髄液、房水若しくは硝子体液、又は任意の分泌液、浸出液、滲出液(例えば、膿瘍、又は感染若しくは炎症の任意の他の部位から得られる流体)、又は関節(例えば、関節リウマチ、変形性関節症、痛風又は敗血症性関節炎)から得られる流体、又は皮膚若しくは粘膜表面のスワブから得られる生物学的流体であり得る。
試料はまた、任意の臓器又は組織から得られた試料(生検又は剖検検体、例えば腫瘍生検を含む)であり得るか、又は細胞(初代細胞又は培養細胞のいずれか)又は任意の細胞、組織若しくは臓器によって馴化された培地を含むことができる。例示的な試料としては、限定されないが、細胞、細胞溶解物、血液スメア、細胞遠心分離調製物、細胞診スメア、体液(例えば、血液、血漿、血清、唾液、痰、尿、気管支肺胞洗浄、精液など)、組織生検(例えば、腫瘍生検)、細針吸引物、及び/又は組織切片(例えば、クライオスタット組織切片及び/又はパラフィン包埋組織切片)が挙げられる。他の例では、試料は循環腫瘍細胞(細胞表面マーカーによって同定することができる)を含む。特別な例では、試料は、直接的に使用され(例えば、新鮮又は凍結)、又は使用前に、例えば、固定(例えば、ホルマリンを使用)及び/又はワックス(例えば、ホルマリン固定パラフィン包埋(FFPE)組織試料など)に包埋することによって操作され得る。対象から組織を得る任意の方法を利用することができ、使用される方法の選択は、組織のタイプ、対象の年齢、又は開業医が利用できる手法などの様々な要因に依存することが理解される。このような試料を獲得するための標準的な技術は、当該技術分野において利用可能である。
試料は、水、土壌などの環境試料、又は工業表面若しくは医療表面などの表面であり得る。
本明細書に開示される実施形態の感度が増大するため、ある特定の例示的な実施形態では、アッセイ及び方法は、粗試料、又は検出されるべき標的分子が試料からさらに分画又は精製されていない試料上で行うことができる。
試料は、水、土壌などの環境試料、又は工業表面若しくは医療表面などの表面であり得る。
本明細書に開示される実施形態の感度が増大するため、ある特定の例示的な実施形態では、アッセイ及び方法は、粗試料、又は検出されるべき標的分子が試料からさらに分画又は精製されていない試料上で行うことができる。
細胞を溶解して標的分子(例えば、標的dsDNA)を遊離させることができる。細胞溶解は、例えば、化学的若しくは生化学的手段、浸透ショック、又は熱的溶解、機械的溶解、若しくは光学的溶解のいずれかの種々の手段によって達成することができる。細胞は、界面活性剤(例えば、SDS、ドデシル硫酸Li、Triton X-100、Tween-20、又はNP-40)、有機溶媒(例えば、メタノール又はアセトン)、若しくは消化酵素(例えば、プロテイナーゼK、ペプシン、又はトリプシン)、又はそれらの任意の組み合わせを含む細胞溶解緩衝液の添加によって溶解され得る。標的とバーコードとの結び付きを増加させるために、標的分子の拡散速度は、例えば、温度を低下させ、及び/又は溶解物の粘度を増加させることによって変化させることができる。
一部の実施形態では、試料は、ろ紙を用いて溶解され得る。ろ紙は、ろ紙の上部に溶解緩衝液を浸すことができる。ろ紙は、試料の溶解及び試料の標的の基質へのハイブリダイゼーションを容易にすることができる圧力で試料に適用することができる。
一部の実施形態では、試料は、ろ紙を用いて溶解され得る。ろ紙は、ろ紙の上部に溶解緩衝液を浸すことができる。ろ紙は、試料の溶解及び試料の標的の基質へのハイブリダイゼーションを容易にすることができる圧力で試料に適用することができる。
一部の実施形態では、溶解は、機械的溶解、熱溶解、光学的溶解、及び/又は化学的溶解によって行うことができる。化学的溶解には、プロテイナーゼK、ペプシン、及びトリプシンなどの消化酵素の使用が含まれ得る。溶解は、基質に溶解緩衝液を添加することによって行うことができる。溶解緩衝液はTris HClを含むことができる。溶解緩衝液は、少なくとも約0.01、0.05、0.1、0.5、若しくは1M又はそれ以上のTris HClを含むことができる。溶解緩衝液は、多くとも約0.01、0.05、0.1、0.5、若しくは1M又はそれ以上のTris HCLを含むことができる。溶解緩衝液は、約0.1MのTris HClを含むことができる。溶解緩衝液のpHは、低くとも約1、2、3、4、5、6、7、8、9、10、又はそれ以上であり得る。溶解緩衝液のpHは、高くとも約1、2、3、4、5、6、7、8、9、10、又はそれ以上であり得る。一部の実施形態では、溶解緩衝液のpHは約7.5である。溶解緩衝液は、塩(例えば、LiCl)を含むことができる。溶解緩衝液中の塩の濃度は、低くとも約0.1、0.5、若しくは1M又はそれ以上であり得る。溶解緩衝液中の塩の濃度は、高くとも約0.1、0.5、若しくは1M又はそれ以上であり得る。一部の実施形態では、溶解緩衝液中の塩の濃度は約0.5Mである。溶解緩衝液は、界面活性剤(例えば、SDS、ドデシル硫酸Li、triton X、tween、NP-40)を含むことができる。溶解緩衝液中の界面活性剤の濃度は、低くとも約0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、若しくは7%又はそれ以上であり得る。溶解緩衝液中の界面活性剤の濃度は、高くとも約0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、若しくは7%又はそれ以上であり得る。一部の実施形態では、溶解緩衝液中の界面活性剤の濃度は、約1%ドデシル硫酸Liである。溶解方法において使用する時間は、使用する界面活性剤の量によって異なることがある。一部の実施形態では、使用される界面活性剤が多いほど、溶解に必要な時間はより少なくなる。溶解緩衝液は、キレート化剤(例えば、EDTA、EGTA)を含むことができる。溶解緩衝液中のキレート剤の濃度は、低くとも約1、5、10、15、20、25、若しくは30mM又はそれ以上であり得る。溶解緩衝液中のキレート剤の濃度は、高くとも約1、5、10、15、20、25、若しくは30mM又はそれ以上であり得る。一部の実施形態では、溶解緩衝液中のキレート化剤の濃度は約10mMである。溶解緩衝液は還元試薬(例えば、ベータ-メルカプトエタノール、DTT)を含むことができる。溶解緩衝液中の還元試薬の濃度は、低くとも約1、5、10、15、若しくは20mM又はそれ以上であり得る。溶解緩衝液中の還元試薬の濃度は、高くとも約1、5、10、15、若しくは20mM又はそれ以上であり得る。一部の実施形態では、溶解緩衝液中の還元試薬の濃度は約5mMである。一部の実施形態では、溶解緩衝液は、約0.1MのTris HCl、約pH7.5、約0.5M LiCl、約1%ドデシル硫酸リチウム、約10mM EDTA、及び約5mM DTTを含むことができる。
溶解は、約4、10、15、20、25、又は30℃の温度で行うことができる。溶解は、約1、5、10、15、若しくは20分間又はそれ以上で行うことができる。溶解細胞は、少なくとも約100000個、200000個、300000個、400000個、500000個、600000個、若しくは700000個又はそれ以上の標的核酸分子を含むことができる。溶解細胞は、多くとも約100000個、200000個、300000個、400000個、500000個、600000個、若しくは700000個又はそれ以上の標的核酸分子を含むことができる。
キット
本明細書に記載されるキットは、複数のタンパク質複合体を含むことができる。一部の実施形態では、複数のタンパク質複合体の各々は、トランスポソームと、標的二本鎖DNA(dsDNA)上の結合部位に特異的に結合することができるプログラム可能なDNA結合ユニットとを含む。一部の実施形態では、トランスポソームは、トランスポゼース、第1のアダプター、及び第2のアダプターを含む。一部の実施形態では、複数のタンパク質複合体の各々に対する結合部位は互いに異なる。一部の実施形態では、キットは、核酸増幅産物についてリアルタイム検出活性を提供する少なくとも1つの成分を含む。リアルタイム検出活性は、分子ビーコンによって提供することができる。乾燥組成物は、逆転写酵素及び/又は逆転写プライマーを含むことができる。
キットは、例えば、本明細書に記載されるように、1種以上のポリメラーゼ及び1種以上のプライマー、並びに場合により1種以上の逆転写酵素及び/又は逆転写プライマーを含むことができる。1つの標的が増幅される場合、1対のプライマー(フォワード及びリバース)をキットに含めることができる。複数の標的配列が増幅される場合、複数のプライマー対をキットに含めることができる。キットは、対照ポリヌクレオチドを含むことができ、複数の標的配列が増幅される場合、複数の対照ポリヌクレオチドをキットに含めることができる。
本明細書に記載されるキットは、複数のタンパク質複合体を含むことができる。一部の実施形態では、複数のタンパク質複合体の各々は、トランスポソームと、標的二本鎖DNA(dsDNA)上の結合部位に特異的に結合することができるプログラム可能なDNA結合ユニットとを含む。一部の実施形態では、トランスポソームは、トランスポゼース、第1のアダプター、及び第2のアダプターを含む。一部の実施形態では、複数のタンパク質複合体の各々に対する結合部位は互いに異なる。一部の実施形態では、キットは、核酸増幅産物についてリアルタイム検出活性を提供する少なくとも1つの成分を含む。リアルタイム検出活性は、分子ビーコンによって提供することができる。乾燥組成物は、逆転写酵素及び/又は逆転写プライマーを含むことができる。
キットは、例えば、本明細書に記載されるように、1種以上のポリメラーゼ及び1種以上のプライマー、並びに場合により1種以上の逆転写酵素及び/又は逆転写プライマーを含むことができる。1つの標的が増幅される場合、1対のプライマー(フォワード及びリバース)をキットに含めることができる。複数の標的配列が増幅される場合、複数のプライマー対をキットに含めることができる。キットは、対照ポリヌクレオチドを含むことができ、複数の標的配列が増幅される場合、複数の対照ポリヌクレオチドをキットに含めることができる。
キットはまた、任意の数の別々の容器(vessel)、チャンバー、容器(container)、パケット、チューブ、バイアル、マイクロタイタープレートなどに1つ以上の成分を含むことができ、又は成分は、このような容器中で種々の組み合わせで組み合わせることができる。キットの成分は、例えば、1つ以上の容器中に存在することができる。一部の実施形態では、すべての構成要素は、1つの容器内に提供される。一部の実施形態では、酵素(例えば、ポリメラーゼ及び/又は逆転写酵素)は、プライマーから別々の容器内に提供することができる。成分は、例えば、凍結乾燥(lyophilized)、加熱乾燥、凍結乾燥(freeze dried)、又は安定な緩衝液中であり得る。一部の実施形態では、ポリメラーゼ及び/又は逆転写酵素は、凍結乾燥形態であるか、又は単一容器中で加熱乾燥形態であり、プライマーは、異なる容器中で凍結乾燥され、加熱乾燥され、凍結乾燥され、又は緩衝液中である。一部の実施形態では、ポリメラーゼ及び/又は逆転写酵素、及びプライマーは、凍結乾燥形態又は加熱乾燥形態で単一の容器内にある。
キットは、例えば、反応に使用されるdNTP、又は反応に使用される修飾ヌクレオチド、容器、キュベット若しくは他の容器、又は凍結乾燥若しくは加熱乾燥成分を再水和するための水又は緩衝液のバイアルをさらに含むことができる。使用される緩衝液は、例えば、ポリメラーゼとプライマーアニーリング活性の両方に適していることができる。
キットは、例えば、反応に使用されるdNTP、又は反応に使用される修飾ヌクレオチド、容器、キュベット若しくは他の容器、又は凍結乾燥若しくは加熱乾燥成分を再水和するための水又は緩衝液のバイアルをさらに含むことができる。使用される緩衝液は、例えば、ポリメラーゼとプライマーアニーリング活性の両方に適していることができる。
キットはまた、本明細書に記載される1つ以上の方法を行うための説明書、及び/又は本明細書に記載される1つ以上の構成要素の説明を含むことができる。指示及び/又は説明は、印刷形態であり得、キットインサートに含めることができる。キットはまた、このような指示又は説明を提供するインターネットロケーションの書面による説明を含むことができる。
キットは、検出方法に使用される試薬、例えば、FRETに使用される試薬、側方流動デバイス、ディップスティック、蛍光色素、コロイド金粒子、ラテックス粒子、分子ビーコン、又はポリスチレンビーズをさらに含むことができる。
本開示の図1、3、4、5A-5F及び7A-7Hは、BioRender.comを用いて作製された。
キットは、検出方法に使用される試薬、例えば、FRETに使用される試薬、側方流動デバイス、ディップスティック、蛍光色素、コロイド金粒子、ラテックス粒子、分子ビーコン、又はポリスチレンビーズをさらに含むことができる。
本開示の図1、3、4、5A-5F及び7A-7Hは、BioRender.comを用いて作製された。
上記で検討した実施形態の一部の態様は、以下の実施例においてさらに詳細に開示され、本開示の範囲を限定することを意図したものではない。
(実施例1)
融合タンパク質及びガイドRNA(sgRNA)の設計及び検証
融合タンパク質を生成するための4つの構築物を設計した:dCAS9-Fl26-Tn5、dCAS9-xTen-Tn5、Tn5-Fl26-dCas9、Tn5-xTen-dCas9(例えば、図8~図10を参照されたい)。これらの構築物は、Fl26リンカー又はxTenリンカーによって分離された融合タンパク質のN末端にdCas9又はTn5配列のいずれかを有する。プラスミド設計は、一部の実施形態では、"Chen, S.P. & Wang, H.H. (2019). An Engineered Cas-Transposon System for Programmable and Site-Directed DNA Transposition. The CRISPR Journal. Vol 2, Number 6. DOI: 10.1089/crispr.2019.0030 及びPicelli S., Bjorklund, A.K., Reinius, B., Sgasser, S., Wingerb, G., & Sandbert, R. (2014)"; 及び"Tn5 transposase and tagmentation procedures for massively scaled sequencing projects. Genome Research. 24:2033-2040. ISSN 1088-9051/14"に基づく。
(実施例1)
融合タンパク質及びガイドRNA(sgRNA)の設計及び検証
融合タンパク質を生成するための4つの構築物を設計した:dCAS9-Fl26-Tn5、dCAS9-xTen-Tn5、Tn5-Fl26-dCas9、Tn5-xTen-dCas9(例えば、図8~図10を参照されたい)。これらの構築物は、Fl26リンカー又はxTenリンカーによって分離された融合タンパク質のN末端にdCas9又はTn5配列のいずれかを有する。プラスミド設計は、一部の実施形態では、"Chen, S.P. & Wang, H.H. (2019). An Engineered Cas-Transposon System for Programmable and Site-Directed DNA Transposition. The CRISPR Journal. Vol 2, Number 6. DOI: 10.1089/crispr.2019.0030 及びPicelli S., Bjorklund, A.K., Reinius, B., Sgasser, S., Wingerb, G., & Sandbert, R. (2014)"; 及び"Tn5 transposase and tagmentation procedures for massively scaled sequencing projects. Genome Research. 24:2033-2040. ISSN 1088-9051/14"に基づく。
sgRNA設計
サルモネラ・エンテリカのInvA及びFliC遺伝子を標的とするsgRNAを設計した。サルモネラ・エンテリカ株ATCC 13311の配列を用いた。sgRNAは、統合DNA技術(IDT)からのツールを用いて設計された(表1)。InvA及びFliC遺伝子のsgRNAの相対的位置をそれぞれ図11及び図12に示す。
サルモネラ・エンテリカのInvA及びFliC遺伝子を標的とするsgRNAを設計した。サルモネラ・エンテリカ株ATCC 13311の配列を用いた。sgRNAは、統合DNA技術(IDT)からのツールを用いて設計された(表1)。InvA及びFliC遺伝子のsgRNAの相対的位置をそれぞれ図11及び図12に示す。
サルモネラ・エンテリカsgRNAの検証
sgRNAの特異性を検証するために、ゲノム試料をCas9により切断した。アダプターをCas9により切断されたDNAにライゲートし、PCR増幅断片をバイオアナライザーにより可視化した。
sgRNAの特異性を検証するために、ゲノム試料をCas9により切断した。アダプターをCas9により切断されたDNAにライゲートし、PCR増幅断片をバイオアナライザーにより可視化した。
図13及び表2は、gDNAの切断が予想されるサイズに特異的であったことを示しており(表2の「バイオアナライザー予測サイズ[bp]カラム」を「実測[bp]」カラムと比較する)、したがって、サルモネラ・エンテリカのためのガイドRNAが機能的であることを示す。
次に、ヒト遺伝子EXT1、BCL9、HOXA13、HOXD11、及びOLIG2を標的とするsgRNAを10の総sgRNAについて設計した(表3A~表3C)。sgRNAはGenScriptのツールを用いて設計された。
トランスポゼースTn5の検証
図14~図15は、Tn5が、PCR増幅のためのDNA断片に、設計されたアダプターA(5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’、配列番号27)及びアダプターB(5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’、配列番号28)をライゲートすることができることを示し、機能性を示す。最初に、Tn5を用いてS.エンテリカ由来のgDNAをカスタムアダプターで切断し、ペーストした。次に、標識断片をPCRにより増幅した。図14~図15のデータは、Tn5トランスポゼースがカスタムアダプターとともにロードされたことを示す。
図14~図15は、Tn5が、PCR増幅のためのDNA断片に、設計されたアダプターA(5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’、配列番号27)及びアダプターB(5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’、配列番号28)をライゲートすることができることを示し、機能性を示す。最初に、Tn5を用いてS.エンテリカ由来のgDNAをカスタムアダプターで切断し、ペーストした。次に、標識断片をPCRにより増幅した。図14~図15のデータは、Tn5トランスポゼースがカスタムアダプターとともにロードされたことを示す。
融合タンパク質の検証
dCAS9-Fl26-Tn5、dCAS9-xTen-Tn5、Tn5-Fl26-dCas9、Tn5-xTen-dCas9を組換え発現させ、次に精製した。一部の実施形態では、組換えタンパク質は、キチンカラム上の自己切断部分(インテイン)を用いて単離された。精製された融合タンパク質を、SDS-PAGEゲル上で予測されるサイズ及び純度について分析した(図16~図21)。
dCAS9-Fl26-Tn5のSDS-PAGE分析を図16に示す。試料は純度:>80%であることが観察された。一部の実施形態では、融合タンパク質はまた、インテインドメインを含み得る。図17のバイオアナライザー分析は、作製されたタンパク質の一部(44.91のピーク)が正しいサイズ(インテインを含まない)であることを示す。
dCAS9-xTen-Tn5のSDS-PAGE分析を図18に示す。試料は純度:>70%であることが観察された。一部の実施形態では、融合タンパク質はまた、インテインドメインを含み得、その結果、予想よりも大きいサイズとなる。図19のバイオアナライザー分析は、作製されたタンパク質の一部(44.62のピーク)が正しいサイズ(インテインを含まない)であることを示す。
図20は、組換え発現及び精製されたTn5-Fl26-dCas9のSDS-PAGE分析を示す。図21は、組換え発現及び精製されたTn5-xTen-dCas9のSDS-PAGE分析を示す。試料は純度:>65%であることが観察された。
dCAS9-Fl26-Tn5、dCAS9-xTen-Tn5、Tn5-Fl26-dCas9、Tn5-xTen-dCas9を組換え発現させ、次に精製した。一部の実施形態では、組換えタンパク質は、キチンカラム上の自己切断部分(インテイン)を用いて単離された。精製された融合タンパク質を、SDS-PAGEゲル上で予測されるサイズ及び純度について分析した(図16~図21)。
dCAS9-Fl26-Tn5のSDS-PAGE分析を図16に示す。試料は純度:>80%であることが観察された。一部の実施形態では、融合タンパク質はまた、インテインドメインを含み得る。図17のバイオアナライザー分析は、作製されたタンパク質の一部(44.91のピーク)が正しいサイズ(インテインを含まない)であることを示す。
dCAS9-xTen-Tn5のSDS-PAGE分析を図18に示す。試料は純度:>70%であることが観察された。一部の実施形態では、融合タンパク質はまた、インテインドメインを含み得、その結果、予想よりも大きいサイズとなる。図19のバイオアナライザー分析は、作製されたタンパク質の一部(44.62のピーク)が正しいサイズ(インテインを含まない)であることを示す。
図20は、組換え発現及び精製されたTn5-Fl26-dCas9のSDS-PAGE分析を示す。図21は、組換え発現及び精製されたTn5-xTen-dCas9のSDS-PAGE分析を示す。試料は純度:>65%であることが観察された。
機能性についての融合タンパク質の試験
Cas9-Fl26-Tn5及びdCas9-xTen-Tn5を機能性について試験した。プロトコールは、以下:(1)sgRNA及びアダプターを融合タンパク質(特に断りのない限り、使用したヒトsgRNA)にロードする、(2)誘導タグメンテーション、(3)クリーンアップ、(4)PCR増幅、(5)品質管理(QC)、及び(6)結果分析であった。
sgRNAとアダプターを融合タンパク質にロードする
融合タンパク質を1:1:2(1分子のdCas9-Tn5対1分子のsgRNA対2分子のアダプター)の比でロードした。混合物を24℃で30分間インキュベートした。
Cas9-Fl26-Tn5及びdCas9-xTen-Tn5を機能性について試験した。プロトコールは、以下:(1)sgRNA及びアダプターを融合タンパク質(特に断りのない限り、使用したヒトsgRNA)にロードする、(2)誘導タグメンテーション、(3)クリーンアップ、(4)PCR増幅、(5)品質管理(QC)、及び(6)結果分析であった。
sgRNAとアダプターを融合タンパク質にロードする
融合タンパク質を1:1:2(1分子のdCas9-Tn5対1分子のsgRNA対2分子のアダプター)の比でロードした。混合物を24℃で30分間インキュベートした。
誘導タグメンテーション
100mMのdCas9-Tn5(6.02 e10分子)及び500ngのヒトgDNA(1.52e5分子)を、gDNA対dCas9-Tn5の1~3.95e5の比で組み合わせた。混合物を37℃で60分間、及び55℃で60分間インキュベートして、タグ付けされた断片を生成した。いくつかのインキュベーション方法が試みられ、一部の実施形態では、dCas9は、25℃~42℃の範囲で機能することができる。Tn5は、37℃~60℃の範囲で機能することができる。PCR増幅プログラムを表5に示す。
100mMのdCas9-Tn5(6.02 e10分子)及び500ngのヒトgDNA(1.52e5分子)を、gDNA対dCas9-Tn5の1~3.95e5の比で組み合わせた。混合物を37℃で60分間、及び55℃で60分間インキュベートして、タグ付けされた断片を生成した。いくつかのインキュベーション方法が試みられ、一部の実施形態では、dCas9は、25℃~42℃の範囲で機能することができる。Tn5は、37℃~60℃の範囲で機能することができる。PCR増幅プログラムを表5に示す。
図22は、Cas9のみの対照反応に関するデータを示す。可視線は、Cas9消化後のDNAのテープステーション分析を示す。PCR増幅反応後の試料分析はシグナルを示さない。このデータは、Cas9自体がDNA断片の5’末端又は3’末端にアダプターを付加することができないことを示した。
図23~図24は、それぞれdCas9-Fl26-Tn5又はdCas9-xTen-Tn5によるアダプターの消化及びライゲーション後のPCR増幅の結果を示す。グラフの矢印は、PCR後の試料からのシグナルを指示する。PCR増幅が検出されたが、これは、両方の融合タンパク質(dCas9-Fl26-Tn5及びdCas9-xTen-Tn5)が、転位(例えば、DNA分子の5’末端及び3’末端にアダプター(アダプターB)を付加すること)を行うことできる場合にのみ可能である。
結果
結果は、Tn5がヒトgDNAにカスタムアダプターを付加することができることを示す。Cas9のみの対照は、このプロセスが増幅するためにTn5を必要とすることを示した。これらの結果は、dCas9に融合したTn5の機能性を示した。
結果
結果は、Tn5がヒトgDNAにカスタムアダプターを付加することができることを示す。Cas9のみの対照は、このプロセスが増幅するためにTn5を必要とすることを示した。これらの結果は、dCas9に融合したTn5の機能性を示した。
融合タンパク質対DNA比試験
次に、gDNA対Cas9-Tn5比に低下させる効果を試験した。DNA濃度は、Cas-Tn融合タンパク質濃度:100nM(dCas9-Tn5の194,071分子対DNAの1ゲノムコピー)、1nM(1,940:1)、100pM(194:1)、10pM(19.4:1)、1pM(1.94:1)を低下させながら一定に保った。結果を図25~図31に示す。図25は、dCas9-Tn5の194,071:1の比を用いた誘導タグメンテーション反応後のPCR増幅の結果を示し、PCR後の広いピークを示し、非特異的タグメンテーションを示す。dCas9-Tn5量の減少(図26~図31)は、PCR反応から検出可能なピークの生成をもたらし、これは、融合タンパク質対DNAの比を低下させることが、タグメンテーションに特異性を付加することを示す。
結果
結果は、Tn5がヒトgDNAにカスタムアダプターを付加することができたことを示す。Cas9のみの対照は、このプロセスがDNAを増幅するためにTn5を必要とすることを示した。Tn5は、機能的であることが示され、誘導転位の証拠があった。したがって、dCas9とTn5活性の両方を含む融合タンパク質の証拠がある。
S.エンテリカ上の融合タンパク質及びsgRNA
図38~図39は、dCas9-xTen-Tn5上のS.エンテリカsgRNAを使用する誘導タグメンテーションを示す。このデータは、sgRNAの付加が特異性を付加することを示す。図39は、sgRNAを伴わない誘導タグメンテーションがランダムであることを示す。図38は、sgRNAの付加が特異性を付与することを示す。
次に、gDNA対Cas9-Tn5比に低下させる効果を試験した。DNA濃度は、Cas-Tn融合タンパク質濃度:100nM(dCas9-Tn5の194,071分子対DNAの1ゲノムコピー)、1nM(1,940:1)、100pM(194:1)、10pM(19.4:1)、1pM(1.94:1)を低下させながら一定に保った。結果を図25~図31に示す。図25は、dCas9-Tn5の194,071:1の比を用いた誘導タグメンテーション反応後のPCR増幅の結果を示し、PCR後の広いピークを示し、非特異的タグメンテーションを示す。dCas9-Tn5量の減少(図26~図31)は、PCR反応から検出可能なピークの生成をもたらし、これは、融合タンパク質対DNAの比を低下させることが、タグメンテーションに特異性を付加することを示す。
結果
結果は、Tn5がヒトgDNAにカスタムアダプターを付加することができたことを示す。Cas9のみの対照は、このプロセスがDNAを増幅するためにTn5を必要とすることを示した。Tn5は、機能的であることが示され、誘導転位の証拠があった。したがって、dCas9とTn5活性の両方を含む融合タンパク質の証拠がある。
S.エンテリカ上の融合タンパク質及びsgRNA
図38~図39は、dCas9-xTen-Tn5上のS.エンテリカsgRNAを使用する誘導タグメンテーションを示す。このデータは、sgRNAの付加が特異性を付加することを示す。図39は、sgRNAを伴わない誘導タグメンテーションがランダムであることを示す。図38は、sgRNAの付加が特異性を付与することを示す。
(実施例2)
試料ライブラリーの調製
誘導タグメンテーションライブラリー
本明細書には、Illumina NextSeq上でシーケンシングするためのライブラリーを生成する方法及び組成物が記載される。
3つのライブラリーをライゲーションベースの方法(図37、図40、図42A~図42B)を用いて作製し、NEBNextシーケンシングアダプターを単一アダプター(例えば、Tn5単独又はdCas9-Tn5融合のいずれかを用いるアダプターB)を用いてタグメンテーションするステップ後に添加し、2つのライブラリーを誘導タグメンテーションベースの方法(図41、図43~図44)を用いて作製し、NGSに必要な配列は、アダプターA及びB上の誘導タグメンテーションステップに含まれた。すべてのライブラリーは、ヒトsgRNAを用いて調製された。誘導タグメンテーションには、dCas9-Fl26-Tn5融合タンパク質を用いた。これらの実験において、DNAは、長い又は短いインキュベーションプロトコール下で、dCas-Tn5とともにインキュベートされた。短いプロトコールでは、反応液を30℃で30分間インキュベートし、次に37℃で30分間インキュベートした。長いプロトコールでは、反応液を30℃で30分間インキュベートし、続いて38℃で60分間インキュベートし、次に55℃で60分間インキュベートした。
図32は、Tn5のみを用いた高度に多重化された単一プライマーDNA増幅を示す。バイオアナライザー分析は、PCRによる非特異的DNA増幅を示し、1つのプライマー(アダプターB)のみを用いてDNAを増幅し得ることを示す。
試料ライブラリーの調製
誘導タグメンテーションライブラリー
本明細書には、Illumina NextSeq上でシーケンシングするためのライブラリーを生成する方法及び組成物が記載される。
3つのライブラリーをライゲーションベースの方法(図37、図40、図42A~図42B)を用いて作製し、NEBNextシーケンシングアダプターを単一アダプター(例えば、Tn5単独又はdCas9-Tn5融合のいずれかを用いるアダプターB)を用いてタグメンテーションするステップ後に添加し、2つのライブラリーを誘導タグメンテーションベースの方法(図41、図43~図44)を用いて作製し、NGSに必要な配列は、アダプターA及びB上の誘導タグメンテーションステップに含まれた。すべてのライブラリーは、ヒトsgRNAを用いて調製された。誘導タグメンテーションには、dCas9-Fl26-Tn5融合タンパク質を用いた。これらの実験において、DNAは、長い又は短いインキュベーションプロトコール下で、dCas-Tn5とともにインキュベートされた。短いプロトコールでは、反応液を30℃で30分間インキュベートし、次に37℃で30分間インキュベートした。長いプロトコールでは、反応液を30℃で30分間インキュベートし、続いて38℃で60分間インキュベートし、次に55℃で60分間インキュベートした。
図32は、Tn5のみを用いた高度に多重化された単一プライマーDNA増幅を示す。バイオアナライザー分析は、PCRによる非特異的DNA増幅を示し、1つのプライマー(アダプターB)のみを用いてDNAを増幅し得ることを示す。
dCas9-Tn融合タンパク質を用いる高度に多重化された単一プライマーDNA増幅を支持する証拠は、図33(短いインキュベーションプロトコール)及び図34(より長いインキュベーションプロトコール)に示される。PCR増幅のバイオアナライザー分析は、1プライマー(アダプターB)のみを用いた数種のDNA断片の同時特異的増幅を示した。
カスタマイズされた遺伝子座特異的配列ライブラリー調製を支持する証拠は、図35(より長いインキュベーションプロトコール)及び図36(より短いインキュベーションプロトコール)に示される。バイオアナライザー分析は、シーケンシングライブラリーが作製されることを示す。Illuminaプラットフォームでのシーケンシングに必要なアダプターA及びBの付加は、誘導タグメンテーションを使用してシーケンシングライブラリーを作製し得ることを示す。
カスタマイズされた遺伝子座特異的配列ライブラリー調製を支持する証拠は、図35(より長いインキュベーションプロトコール)及び図36(より短いインキュベーションプロトコール)に示される。バイオアナライザー分析は、シーケンシングライブラリーが作製されることを示す。Illuminaプラットフォームでのシーケンシングに必要なアダプターA及びBの付加は、誘導タグメンテーションを使用してシーケンシングライブラリーを作製し得ることを示す。
前述の実施形態の少なくとも一部において、実施形態で使用される1種以上のエレメントは、そのような置換が技術的に実施可能でない場合を除き、別の実施形態で互換的に使用することができる。当業者であれば、請求された主題事項の範囲から逸脱することなく、上述の方法及び構造に対して、種々の他の省略、追加及び修飾を行うことができることが理解される。このような修飾及び変更はすべて、添付の特許請求の範囲によって定義されるように、主題の範囲内に入ることが意図される。
本明細書における実質的に任意の複数の用語及び/又は単数の用語の使用に関して、当業者は、文脈及び/又は用途に適切なように、複数から単数及び/又は単数から複数に翻訳することができる。種々の単数/複数の並べ替えは、明瞭化のために、本明細書に明示的に記載することができる。本明細書及び添付の特許請求の範囲で使用されるように、文脈が明確に別段の指示をしない限り、単数形「1つの(a)」、「1つの(an)」、及び「その(the)」は複数の指示対象を含む。本明細書における「又は」への任意の言及は、特に断らない限り、「及び/又は」を包含することを意図する。
一般的に、本明細書で使用される用語、特に添付の特許請求の範囲(例えば、添付の特許請求の範囲の本体)で使用される用語は、一般的に「開かれた」用語として意図されていることが、当業者によって理解される(例えば、用語「含んでいる」は、「限定されないが、含んでいる」として解釈されるべきであり、用語「有している」は、「少なくとも有する」として解釈されるべきであり、用語「含む」は、「限定されないが、含む」として解釈されるべきである)。さらに、導入された請求項の記載の特定の数が意図されている場合には、このような意図が請求項に明示的に記載され、このような記載がない限り、このような意図は存在しないことが、当業者によって理解される。例えば、理解を助けるために、以下の添付の特許請求の範囲は、請求項の記載を導入するための「少なくとも1つの」及び「1つ以上の」という導入用語の使用を含有し得る。しかしながら、このような語句の使用は、たとえ同じ請求項が「1つ以上の」又は「少なくとも1つの」の導入文、及び「1つの(a)」又は「1つの(an)」などの不定冠詞を含む場合であっても、不定冠詞「1つの(a)」又は「1つの(an)」による請求項の記載の導入が、このような導入された請求項の記載を含有する任意の特定の請求項を、このような記載を1つのみを含有する実施態様に限定することを意味すると解釈されるべきではなく(例えば、「1つの(a)」又は「1つの(an)」は、「少なくとも1つの」又は「1つ以上の」を意味すると解釈されるべきである);請求項の記載を導入するために使用される定冠詞の使用についても同様である。さらに、導入された請求項の特定の数の記載が明示的に記載されている場合であっても、当業者は、このような記載が、少なくとも記載された数を意味する(例えば、他の修飾語なしでの「2つの記載」のそのままの記載は、少なくとも2つの記載、又は2つ以上の記載を意味する)と解釈されるべきであることを認識する。さらに、「A、B、及びCなどのうちの少なくとも1つ」に類似する慣例が用いられる場合には、一般的に、このような構造は、当業者が該慣例を理解することが意図されるという意味で意図される(例えば、「A、B、及びCのうちの少なくとも1つを有するシステム」には、限定されないが、Aのみ、Bのみ、Cのみ、AとBの組み合わせ、AとCの組み合わせ、BとCの組み合わせ、及び/又はAとBとCの組み合わせなどを有するシステムが含まれる)。「A、B、又はCなどのうちの少なくとも1つ」に類似する慣例が使用される場合には、一般的に、このような構造は、当業者が該慣例を理解するという意味で意図される(例えば、「A、B、又はCのうちの少なくとも1つを有するシステム」には、限定されないが、Aのみ、Bのみ、Cのみ、AとBの組み合わせ、AとCの組み合わせ、BとCの組み合わせ、及び/又はAとBとCの組み合わせなどを有するシステムが含まれる)。明細書、特許請求の範囲又は図面のいずれにおいても、2つ以上の代替用語を提示する実質的に任意の分離語及び/又は語句は、用語の1つ、用語のいずれか又は両方の用語を含む可能性を考慮するように理解されるべきであることが、当業者によってさらに理解される。
さらに、本開示の特徴又は態様がマーカッシュ群という観点から記載されている場合、当業者は、本開示がまた、マーカッシュ群のメンバーの任意の個々のメンバー又はサブグループという観点からも記載されていることを認識する。
さらに、本開示の特徴又は態様がマーカッシュ群という観点から記載されている場合、当業者は、本開示がまた、マーカッシュ群のメンバーの任意の個々のメンバー又はサブグループという観点からも記載されていることを認識する。
当業者に理解されるように、例えば、書面による説明を提供するという観点から、任意の及びすべての目的のために、本明細書に開示されるすべての範囲はまた、その任意の及びすべての可能な部分的範囲、並びにその部分的範囲の組み合わせを包含する。任意の列挙された範囲は、同じ範囲が少なくとも等しい半分、3分の1、4分の1、5分の1、10分の1などに分けられることを十分に記載し、可能にするものとして容易に認識することができる。非限定的な例として、本明細書において検討される各範囲は、下部3分の1、中央部3分の1及び上部3分の1などに容易に分けることができる。また、当業者に理解されるように、「最大」、「少なくとも」、「より大きい」、「より小さい」などのすべての言語は、引用された数を含み、上記で検討した部分的範囲内に実質的に分けることができる範囲を指す。最後に、当業者に理解されるように、範囲は、各個々のメンバーを含む。したがって、例えば、1~3個の物品を有する群は、1、2、又は3個の物品を有する群を指す。同様に、1~5個の物品を有する群は、1、2、3、4、又は5個の物品を有する群を指すなどである。
本明細書には様々な態様及び実施形態が開示されているが、他の態様及び実施形態は当業者には明らかである。本明細書に開示される様々な態様及び実施形態は、例示の目的であり、限定することを意図しない。真の範囲及び精神は、続く特許請求の範囲によって示される。
Claims (70)
- 複数のタンパク質複合体を含む組成物であって、複数のタンパク質複合体の各々は、トランスポソームと、標的二本鎖DNA(dsDNA)上の結合部位に特異的に結合することができるプログラム可能なDNA結合ユニットとを含み、トランスポソームは、トランスポゼースと、第1のアダプターと、第2のアダプターとを含み、複数のタンパク質複合体の各々に対する結合部位は互いに異なる、前記組成物。
- 複数のタンパク質複合体のうちの少なくとも2つが、同じトランスポソームを含む、請求項1に記載の組成物。
- 複数のタンパク質複合体のすべてが同じトランスポソームを含む、請求項1に記載の組成物。
- 複数のタンパク質複合体のすべてが同じトランスポゼースを含む、請求項1~3のいずれか1項に記載の組成物。
- 同じトランスポソーム内の第1のアダプターと第2のアダプターとが同じである、請求項1~4のいずれか1項に記載の組成物。
- 異なるトランスポソーム内の第1のアダプター、第2のアダプター、又はその両方が異なる、請求項1~5のいずれか1項に記載の組成物。
- 第1のアダプター、第2のアダプター、又はその両方が、dsDNA又はRNA/DNA二重鎖である、請求項1~6のいずれか1項に記載の組成物。
- アダプターは、長さが約3~200塩基対である、請求項1~7のいずれか1項に記載の組成物。
- 第1のアダプター、第2のアダプター、又はその両方が、シーケンシングアダプターである、請求項1~8のいずれか1項に記載の組成物。
- シーケンシングアダプターがP5又はP7プライマー配列を含む、請求項9に記載の組成物。
- 複数のタンパク質複合体のうちの少なくとも2つの結合部位が同じ標的dsDNA上にある、請求項1~10のいずれか1項に記載の組成物。
- 複数のタンパク質複合体のうちの少なくとも2つの結合部位が、同じ標的dsDNA上で約1~50000ヌクレオチド離れている、請求項11に記載の組成物。
- 複数のタンパク質複合体の一対の結合部位間の距離が、複数のタンパク質複合体の別の一対の結合部位間の距離と実質的に同じである、請求項11に記載の組成物。
- 複数のタンパク質複合体の一対の結合部位間の距離が、複数のタンパク質複合体の別の一対の結合部位間の距離と異なる、請求項11に記載の組成物。
- 複数のタンパク質複合体のうちの少なくとも2つの結合部位が、標的dsDNAの異なる鎖上にある、請求項1~11のいずれか1項に記載の組成物。
- 複数のタンパク質複合体のうちの少なくとも2つが、異なる標的dsDNAに特異的に結合することができる、請求項1~15のいずれか1項に記載の組成物。
- 複数のタンパク質複合体が、約2~5000の標的dsDNAに特異的に結合することができる、請求項1~15のいずれか1項に記載の組成物。
- トランスポゼースが、Tn5トランスポゼース、Tn7トランスポゼース、マリナーTc1様トランスポゼース、Himar1C9トランスポゼース、又はスリーピングビューティトランスポゼースである、請求項1~17のいずれか1項に記載の組成物。
- トランスポゼースが高活性トランスポゼースである、請求項1~18のいずれか1項に記載の組成物。
- プログラム可能なDNA結合ユニットが、ヌクレアーゼ欠損CRISPR関連タンパク質(dCASタンパク質)と、標的dsDNAの結合部位に特異的に結合することができるガイドRNA(gRNA)とを含む、請求項1~19のいずれか1項に記載の組成物。
- トランスポソームが、トランスポゼースとdCASタンパク質とを接続するリンカーを介してプログラム可能なDNA結合ユニットと結び付けられている、請求項20に記載の組成物。
- リンカーが、ペプチドリンカー、化学リンカー、又はその両方を含む、請求項21に記載の組成物。
- トランスポゼースが、dCASタンパク質を含む融合タンパク質中に存在する、請求項20に記載の組成物。
- dCASタンパク質がdCAS9、dCAS12、dCAS13、dCAS14、又はSpRY dCASである、請求項20~23のいずれか1項に記載の組成物。
- dCAS13タンパク質がdCAS13a、dCAS13b、dCAS13c、又はdCAS13dである、請求項24に記載の組成物。
- プログラム可能なDNA結合ユニットが、標的dsDNA上の結合部位に特異的に結合することができるタンパク質構成成分を含み、タンパク質構成成分が、エンドヌクレアーゼ欠損ジンクフィンガーヌクレアーゼ(ZFN)、エンドヌクレアーゼ欠損転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、アルゴノートタンパク質、エンドヌクレアーゼ欠損メガヌクレアーゼ、リコンビナーゼ、又はそれらの組み合わせを含む、請求項1~19のいずれか1項に記載の組成物。
- トランスポソームが、トランスポゼースとタンパク質構成成分とを接続するリンカーを介してプログラム可能なDNA結合ユニットと結び付けられている、請求項26に記載の組成物。
- リンカーが、ペプチドリンカー、化学リンカー、又はその両方を含む、請求項27に記載の組成物。
- ペプチドリンカーが、複数のグリシン、セリン、スレオニン、アラニン、リジン、グルタミン、又はそれらの組み合わせを含む、請求項28に記載の組成物。
- ペプチドリンカーがGSリンカーを含む、請求項29に記載の組成物。
- ペプチドリンカーがXTENリンカーである、請求項28に記載の組成物。
- タンパク質構成成分が、トランスポゼースを含む融合タンパク質中に存在する、請求項26に記載の組成物。
- 請求項1~32のいずれか1項に記載の組成物と、
1種以上の標的dsDNAを含むことが疑われる試料核酸と
を含む反応混合物。 - DNAポリメラーゼ、dNTP、又はそれらの組み合わせをさらに含む、請求項33に記載の反応混合物。
- アダプターが標的dsDNA又はその断片に共有結合的に付着している、請求項33~34のいずれか1項に記載の反応混合物。
- 複数のdsDNA断片を含み、各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含む、請求項33~35のいずれか1項に記載の反応混合物。
- 試料核酸が、真核生物DNA、細菌DNA、ウイルスDNA、真菌DNA、原生動物DNA、又はそれらの組み合わせを含む、請求項33~36のいずれか1項に記載の反応混合物。
- 標的dsDNAが、ゲノムDNA、ミトコンドリアDNA、プラスミドDNA、又はそれらの組み合わせである、請求項33~37のいずれか1項に記載の反応混合物。
- 試料核酸が、生物学的試料、臨床試料、環境試料、又はそれらの組み合わせ由来である、請求項33~38のいずれか1項に記載の反応混合物。
- 生物学的試料が、便、痰、末梢血、血漿、血清、リンパ節、呼吸組織、滲出液、体液、又はそれらの組み合わせを含む、請求項39に記載の反応混合物。
- 核酸をタグ付けする方法であって、
請求項1~32のいずれか1項に記載の組成物を、複数の標的二本鎖DNA(dsDNA)を含むことが疑われる試料と接触させて、反応混合物を形成することと、
反応混合物をインキュベートして、複数のdsDNA断片であってその各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含む前記複数のdsDNA断片を生成すること
を含む方法。 - シーケンシングライブラリーを生成する方法であって、
請求項1~32のいずれか1項に記載の組成物を、複数の標的二本鎖DNA(dsDNA)を含むことが疑われる試料と接触させて、反応混合物を形成することと、
反応混合物をインキュベートして、複数のdsDNA断片であってその各々が、各末端にそれぞれ複数のタンパク質複合体のうちの1つの第1のアダプター及び第2のアダプターを含む前記複数のdsDNA断片を生成することと、
dsDNA断片の末端でアダプターに結合することができるプライマーを用いて、複数のdsDNA断片を増幅して、シーケンシングライブラリーを生成することと
を含む方法。 - プライマーの各々は、長さが約5~80ヌクレオチドである、請求項42に記載の方法。
- プライマーを用いて複数のdsDNA断片を増幅することが、ポリメラーゼ連鎖反応(PCR)を用いて行われる、請求項42~43のいずれか1項に記載の方法。
- PCRが、ループ媒介等温増幅(LAMP)、ヘリカーゼ依存性増幅(HDA)、組換えポリメラーゼ増幅(RPA)、鎖置換増幅(SDA)、核酸配列ベース増幅(NASBA)、転写媒介増幅(TMA)、ニッキング酵素増幅反応(NEAR)、ローリングサークル増幅(RCA)、多置換増幅(MDA)、分岐化(RAM)、環状ヘリカーゼ依存性増幅(cHDA)、単一プライマー等温増幅(SPIA)、RNA技術のシグナル媒介増幅(SMART)、自己持続配列複製(3SR)、ゲノム指数増幅反応(GEAR)、又は等温多置換増幅(IMDA)である、請求項44に記載の方法。
- PCRが、リアルタイムPCR又は定量的リアルタイムPCR(QRT-PCR)である、請求項44に記載の方法。
- 試料が、真核生物DNA、細菌DNA、ウイルスDNA、真菌DNA、原生動物DNA、又はそれらの組み合わせを含む、請求項41~46のいずれか1項に記載の方法。
- 複数の標的dsDNAが、ゲノムDNA、ミトコンドリアDNA、プラスミドDNA、又はそれらの組み合わせを含む、請求項41~47のいずれか1項に記載の方法。
- 試料が、生物学的試料、臨床試料、環境試料、若しくはそれらの組み合わせであるか又はそれに由来する、請求項41~48のいずれか1項に記載の方法。
- 複数の標的dsDNAが、少なくとも2つの異なる生物由来のDNAを含む、請求項41~49のいずれか1項に記載の方法。
- 複数の標的dsDNAが、少なくとも2つの異なる遺伝子由来のDNAを含む、請求項41~50のいずれか1項に記載の方法。
- 逆転写酵素を用いて複数の標的RNAから複数の標的dsDNAを生成することをさらに含む、請求項41~51のいずれか1項に記載の方法。
- 複数の標的dsDNAが、逆転写酵素を用いて標的RNAから生成された標的dsDNAを含む、請求項41~51のいずれか1項に記載の方法。
- 複数の標的dsDNAが、目的とする遺伝子シグネチャを含む、請求項41~53のいずれか1項に記載の方法。
- 目的とする遺伝子シグネチャが、目的とする1種以上の突然変異を含む、請求項54に記載の方法。
- 目的とする1種以上の突然変異が、点突然変異、逆位、欠失、挿入、転座、複製、コピー数変動、又はそれらの組み合わせを含む、請求項55に記載の方法。
- 目的とする1種以上の突然変異が、ヌクレオチド置換、欠失、挿入、又はそれらの組み合わせを含む、請求項55に記載の方法。
- 目的とする遺伝子シグネチャが、標的dsDNAが由来する生物の病原体同定、抗生物質耐性又は抗生物質感受性を示す、請求項54~57のいずれか1項に記載の方法。
- 目的とする遺伝子シグネチャが、標的dsDNAが由来する生物のがん状態を示す、請求項54~57のいずれか1項に記載の方法。
- 目的とする遺伝子シグネチャが、標的dsDNAが由来する生物の遺伝的疾患の状態を示す、請求項54~57のいずれか1項に記載の方法。
- 遺伝的疾患が単一遺伝子疾患である、請求項60に記載の方法。
- 遺伝子疾患が、嚢胞性線維症、ハンチントン病、鎌状赤血球貧血、血友病、デュシェンヌ型筋ジストロフィー、サラセミア、脆弱X症候群、家族性高コレステロール血症、多嚢胞性腎疾患、神経線維腫症I型、遺伝性球状赤血球症、マルファン症候群、テイ-サックス病、フェニルケトン尿症、ムコ多糖症、リソソーム酸性リパーゼ欠損症、グリコーゲン貯蔵疾患、ガラクトース血症、又はヘモクロマトーシスである、請求項60に記載の方法。
- 複数の標的dsDNAを複数のタンパク質複合体対と接触させることが、約25℃~約80℃で行われる、請求項41~62のいずれか1項に記載の方法。
- 反応混合物をインキュベートすることが、反応混合物を約37℃~約55℃でインキュベートすることを含む、請求項41~63のいずれか1項に記載の方法。
- 複数のタンパク質複合体対及び複数の標的dsDNAが、約2:1~約2,000:1の分子比で反応混合物中に存在する、請求項41~64のいずれか1項に記載の方法。
- 複数のタンパク質複合体対及び複数の標的dsDNAが、約2:1~約200:1の分子比で反応混合物中に存在する、請求項41~64のいずれか1項に記載の方法。
- 複数のdsDNA断片のうちの1つ以上の一方又は両方の末端を標識することをさらに含む、請求項41~66のいずれか1項に記載の方法。
- 複数のdsDNA断片のうちの1つ以上の2つの末端を異なるように標識することを含む、請求項41~66のいずれか1項に記載の方法。
- 標識が、アニオン標識、カチオン標識、中性標識、電気化学標識、タンパク質標識、蛍光標識、磁性標識、又はそれらの組み合わせによる標識を含む、請求項67~68のいずれか1項に記載の方法。
- 標識されたdsDNA断片を濃縮すること、標識されたdsDNA断片を捕捉すること、標識されたdsDNA断片を単離すること、及び/又は標識されたdsDNA断片を視覚化することをさらに含む、請求項67~69のいずれか1項に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163189032P | 2021-05-14 | 2021-05-14 | |
US63/189,032 | 2021-05-14 | ||
US202163243443P | 2021-09-13 | 2021-09-13 | |
US63/243,443 | 2021-09-13 | ||
PCT/US2022/029057 WO2022241158A1 (en) | 2021-05-14 | 2022-05-12 | Methods for making libraries for nucleic acid sequencing |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024518095A true JP2024518095A (ja) | 2024-04-24 |
Family
ID=84028513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023570212A Pending JP2024518095A (ja) | 2021-05-14 | 2022-05-12 | 核酸シーケンシングのためのライブラリーを作製する方法 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP4341390A1 (ja) |
JP (1) | JP2024518095A (ja) |
AU (1) | AU2022272723A1 (ja) |
CA (1) | CA3217365A1 (ja) |
WO (1) | WO2022241158A1 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3898958A1 (en) * | 2018-12-17 | 2021-10-27 | The Broad Institute, Inc. | Crispr-associated transposase systems and methods of use thereof |
WO2020243085A1 (en) * | 2019-05-24 | 2020-12-03 | The Trustees Of Columbia University In The City Of New York | Engineered cas-transposon system for programmable and site-directed dna transpositions |
WO2021041922A1 (en) * | 2019-08-30 | 2021-03-04 | The Broad Institute, Inc. | Crispr-associated mu transposase systems |
CA3178165A1 (en) * | 2020-06-18 | 2021-12-23 | The Broad Institute, Inc. | Crispr-associated transposase systems and methods of use thereof |
MX2023001676A (es) * | 2020-08-18 | 2023-03-17 | Illumina Inc | Transposicion dirigida especifica de secuencia y seleccion y clasificacion de acidos nucleicos. |
-
2022
- 2022-05-12 JP JP2023570212A patent/JP2024518095A/ja active Pending
- 2022-05-12 WO PCT/US2022/029057 patent/WO2022241158A1/en active Application Filing
- 2022-05-12 AU AU2022272723A patent/AU2022272723A1/en active Pending
- 2022-05-12 EP EP22808370.5A patent/EP4341390A1/en active Pending
- 2022-05-12 CA CA3217365A patent/CA3217365A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4341390A1 (en) | 2024-03-27 |
AU2022272723A9 (en) | 2023-12-07 |
AU2022272723A1 (en) | 2023-11-30 |
CA3217365A1 (en) | 2022-11-17 |
WO2022241158A1 (en) | 2022-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11608520B2 (en) | Spatial analysis to detect sequence variants | |
WO2022226057A1 (en) | Methods for assessing sample quality prior to spatial analysis using templated ligation | |
JP7100680B2 (ja) | ゲノム適用および治療適用のための、核酸分子のクローン複製および増幅のためのシステムおよび方法 | |
ES2921401T3 (es) | Método de enriquecimiento de ácidos nucleicos usando nucleasas específicas de sitio seguido de captura | |
JP4886298B2 (ja) | 核酸増幅 | |
US20120252686A1 (en) | Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction | |
ES2940071T3 (es) | Componentes y procedimientos de amplificación isotérmica | |
JP2007530051A (ja) | 標的分子を決定するためのライゲーション反応および増幅反応 | |
US11155857B2 (en) | Methods for measuring RNA translation rates | |
AU2019239619B2 (en) | Methods and compositions for recombinase-mediated selective cleavage of nucleic acids | |
US7820385B2 (en) | Method for retaining methylation pattern in globally amplified DNA | |
US20210254145A1 (en) | Methods for Attaching Cellular Constituents to a Matrix | |
JP6074036B2 (ja) | 拡大された基質範囲を有する新規のdnaポリメラーゼ | |
US20120088246A1 (en) | Real time pcr detection of single nucleotide polymorphisms | |
JP2024518095A (ja) | 核酸シーケンシングのためのライブラリーを作製する方法 | |
US6821733B2 (en) | Methods and compositions for detecting differences between nucleic acids | |
JP2024518094A (ja) | 多重非バイアス核酸増幅法 | |
JP5299964B2 (ja) | Dna3’末端の修飾基除去用酵素試薬 | |
WO2023220142A1 (en) | Methods and compositions for sequencing library preparation | |
WO2022256228A1 (en) | Method for producing a population of symmetrically barcoded transposomes | |
JP2008283891A (ja) | 二本鎖核酸の検出方法及びクローニング方法 |