CN111065746A - 用于用重组核酸酶选择性切割核酸的方法和组合物 - Google Patents
用于用重组核酸酶选择性切割核酸的方法和组合物 Download PDFInfo
- Publication number
- CN111065746A CN111065746A CN201980003318.6A CN201980003318A CN111065746A CN 111065746 A CN111065746 A CN 111065746A CN 201980003318 A CN201980003318 A CN 201980003318A CN 111065746 A CN111065746 A CN 111065746A
- Authority
- CN
- China
- Prior art keywords
- dna
- protein
- host
- binding
- binding domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 192
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 192
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 192
- 101710163270 Nuclease Proteins 0.000 title claims abstract description 133
- 238000000034 method Methods 0.000 title claims abstract description 86
- 239000000203 mixture Substances 0.000 title abstract description 12
- 238000003776 cleavage reaction Methods 0.000 title abstract description 10
- 230000007017 scission Effects 0.000 title abstract description 10
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims abstract description 61
- 101710096438 DNA-binding protein Proteins 0.000 claims abstract description 57
- 108091006090 chromatin-associated proteins Proteins 0.000 claims abstract description 30
- 108091029523 CpG island Proteins 0.000 claims abstract description 12
- 108020004414 DNA Proteins 0.000 claims description 200
- 230000027455 binding Effects 0.000 claims description 144
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 85
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 85
- 108010033040 Histones Proteins 0.000 claims description 83
- 239000000523 sample Substances 0.000 claims description 83
- 239000012634 fragment Substances 0.000 claims description 81
- 108090000623 proteins and genes Proteins 0.000 claims description 50
- 102000004169 proteins and genes Human genes 0.000 claims description 48
- 238000012163 sequencing technique Methods 0.000 claims description 47
- 239000003153 chemical reaction reagent Substances 0.000 claims description 31
- 238000002360 preparation method Methods 0.000 claims description 19
- 101710120037 Toxin CcdB Proteins 0.000 claims description 16
- 102000006947 Histones Human genes 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 14
- 210000004027 cell Anatomy 0.000 claims description 13
- 108010042407 Endonucleases Proteins 0.000 claims description 12
- 108010077544 Chromatin Proteins 0.000 claims description 10
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 claims description 10
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 claims description 10
- 210000003483 chromatin Anatomy 0.000 claims description 10
- 101000581507 Homo sapiens Methyl-CpG-binding domain protein 1 Proteins 0.000 claims description 7
- 101150083522 MECP2 gene Proteins 0.000 claims description 7
- 102100027383 Methyl-CpG-binding domain protein 1 Human genes 0.000 claims description 7
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 7
- 108700043128 MBD2 Proteins 0.000 claims description 6
- 239000011324 bead Substances 0.000 claims description 6
- 230000002441 reversible effect Effects 0.000 claims description 6
- 101000615492 Homo sapiens Methyl-CpG-binding domain protein 4 Proteins 0.000 claims description 5
- 102000003960 Ligases Human genes 0.000 claims description 5
- 108090000364 Ligases Proteins 0.000 claims description 5
- 102100021290 Methyl-CpG-binding domain protein 4 Human genes 0.000 claims description 5
- 102000007508 Retinoblastoma-Binding Protein 4 Human genes 0.000 claims description 5
- 108010071034 Retinoblastoma-Binding Protein 4 Proteins 0.000 claims description 5
- 239000003795 chemical substances by application Substances 0.000 claims description 5
- 108700020911 DNA-Binding Proteins Proteins 0.000 claims description 4
- 102100039869 Histone H2B type F-S Human genes 0.000 claims description 4
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 claims description 4
- 238000002523 gelfiltration Methods 0.000 claims description 3
- 239000007790 solid phase Substances 0.000 claims description 3
- 230000003612 virological effect Effects 0.000 claims description 3
- 102100031780 Endonuclease Human genes 0.000 claims 2
- 239000000758 substrate Substances 0.000 claims 1
- CTMZLDSMFCVUNX-VMIOUTBZSA-N cytidylyl-(3'->5')-guanosine Chemical class O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=C(C(N=C(N)N3)=O)N=C2)O)[C@@H](CO)O1 CTMZLDSMFCVUNX-VMIOUTBZSA-N 0.000 description 45
- 125000003729 nucleotide group Chemical group 0.000 description 25
- 239000002773 nucleotide Substances 0.000 description 24
- 244000052769 pathogen Species 0.000 description 19
- 230000001717 pathogenic effect Effects 0.000 description 16
- 150000001413 amino acids Chemical group 0.000 description 12
- 108090000765 processed proteins & peptides Proteins 0.000 description 12
- 102000004533 Endonucleases Human genes 0.000 description 10
- 229920001184 polypeptide Polymers 0.000 description 10
- 102000004196 processed proteins & peptides Human genes 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 8
- 241000206602 Eukaryota Species 0.000 description 7
- 230000003321 amplification Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 239000000499 gel Substances 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 108091029430 CpG site Proteins 0.000 description 6
- 229940024606 amino acid Drugs 0.000 description 6
- 102000040430 polynucleotide Human genes 0.000 description 6
- 108091033319 polynucleotide Proteins 0.000 description 6
- 239000002157 polynucleotide Substances 0.000 description 6
- 239000000872 buffer Substances 0.000 description 5
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 5
- -1 methyl CpG Chemical compound 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 102100022823 Histone RNA hairpin-binding protein Human genes 0.000 description 4
- 101000825762 Homo sapiens Histone RNA hairpin-binding protein Proteins 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 230000002583 anti-histone Effects 0.000 description 4
- 239000000539 dimer Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 230000011987 methylation Effects 0.000 description 4
- 238000007069 methylation reaction Methods 0.000 description 4
- 238000012175 pyrosequencing Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 3
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 3
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 238000007400 DNA extraction Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 3
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 3
- 239000000833 heterodimer Substances 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 230000001376 precipitating effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 230000030933 DNA methylation on cytosine Effects 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 239000000710 homodimer Substances 0.000 description 2
- 239000000017 hydrogel Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000010741 sumoylation Effects 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 102000001805 Bromodomains Human genes 0.000 description 1
- 108050009021 Bromodomains Proteins 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102000017589 Chromo domains Human genes 0.000 description 1
- 108050005811 Chromo domains Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 102000010719 DNA-(Apurinic or Apyrimidinic Site) Lyase Human genes 0.000 description 1
- 108010063362 DNA-(Apurinic or Apyrimidinic Site) Lyase Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 101710094010 Endonuclease II Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 101000889812 Enterobacteria phage T4 Endonuclease Proteins 0.000 description 1
- 101100450032 Gallus gallus H2AZ2 gene Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102100022846 Histone acetyltransferase KAT2B Human genes 0.000 description 1
- 102100025190 Histone-binding protein RBBP4 Human genes 0.000 description 1
- 101710181537 Histone-binding protein RBBP4 Proteins 0.000 description 1
- 102100029768 Histone-lysine N-methyltransferase SETD1A Human genes 0.000 description 1
- 102100028998 Histone-lysine N-methyltransferase SUV39H1 Human genes 0.000 description 1
- 102000009331 Homeodomain Proteins Human genes 0.000 description 1
- 108010048671 Homeodomain Proteins Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001047006 Homo sapiens Histone acetyltransferase KAT2B Proteins 0.000 description 1
- 101000865038 Homo sapiens Histone-lysine N-methyltransferase SETD1A Proteins 0.000 description 1
- 101000696705 Homo sapiens Histone-lysine N-methyltransferase SUV39H1 Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108010059724 Micrococcal Nuclease Proteins 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 101100338284 Nicotiana tabacum HIS2B gene Proteins 0.000 description 1
- 101100016305 Oryza sativa subsp. japonica H2B1 gene Proteins 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100016310 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) HTB1 gene Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- 241000205177 Thermoproteales Species 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 102000008710 YEATS Human genes 0.000 description 1
- 108050000586 YEATS Proteins 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 239000003570 air Substances 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000005576 amination reaction Methods 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 150000001491 aromatic compounds Chemical class 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000006329 citrullination Effects 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000006196 deacetylation Effects 0.000 description 1
- 238000003381 deacetylation reaction Methods 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000030609 dephosphorylation Effects 0.000 description 1
- 238000006209 dephosphorylation reaction Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000007159 enucleation Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 239000003349 gelling agent Substances 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 238000000504 luminescence detection Methods 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical class N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 210000005084 renal tissue Anatomy 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6804—Nucleic acid analysis using immunogens
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biomedical Technology (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Pathology (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本文提供的方法和组合物的一些实施方式涉及靶核酸的选择性切割。一些这样的实施方式包括用重组核酸酶选择性切割与DNA结合蛋白相关联或包含甲基化CpG岛的靶核酸。在一些实施方式中,DNA结合蛋白包括染色质蛋白。一些实施方式还包括通过选择性切割样品中的靶核酸,和从样品除去切割的靶核酸来富集样品中的非靶核酸。
Description
相关申请的交叉引用
本申请要求2018年3月19日提交、题为“METHODS AND COMPOSITIONS FORSELECTIVE CLEAVAGE OF NUCLEIC ACIDS WITH RECOMBINANT NUCLEASES”的美国临时专利申请号62/644697的优先权,其全部内容通过引用并入本文。
序列表的引用
本申请与电子格式的序列表一起提交。序列表作为创建于2019年3月13日、题为ILLINC407WOSEQLISTING的文件提供,其大小为约13Kb。序列表的电子格式的信息的全部内容通过引用并入本文。
技术领域
本文提供的方法和组合物的一些实施方式涉及靶核酸的选择性切割。一些这样的实施方式包括用重组核酸酶选择性切割与DNA结合蛋白相关联或包含甲基化CpG岛的靶核酸。在一些实施方式中,DNA结合蛋白包括染色质蛋白。一些实施方式还包括通过选择性切割样品中的靶核酸,和从样品除去切割的靶核酸来富集样品中的非靶核酸。
背景技术
下一代测序技术可用于快速且经济地确定基因组的整个序列。DNA和RNA测序可用于检测病原体和诊断传染病。
下一代测序的应用是执行无偏DNA测序,其中样品没有基于先前的序列知识而富集。没有富集,对患者样品进行测序可产生压倒性大多数的人序列和少数病原体序列,并且检测的灵敏度可太低而无法检测低水平病原体。
发明内容
一些实施方式包括选择性切割宿主DNA的方法:(a)获得包含宿主DNA的样品,其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG;和(b)通过使所述样品与重组蛋白接触来选择性切割所述宿主DNA,所述重组蛋白包含:选择性结合所述DNA结合蛋白或甲基化CpG的结合结构域,和具有切割DNA的活性的核酸酶结构域。在一些实施方式中,所述样品包含非宿主核酸。一些实施方式还包括(c)从非宿主核酸除去切割的宿主DNA。在一些实施方式中,所述非宿主核酸不与所述DNA结合蛋白结合。
在一些实施方式中,所述DNA结合蛋白包括染色质蛋白。在一些实施方式中,所述DNA结合蛋白包括组蛋白。在一些实施方式中,所述结合结构域选择性结合组蛋白。在一些实施方式中,所述组蛋白选自H1、H2A、H2B、H3和H4。在一些实施方式中,所述结合结构域包含RBBP4蛋白或其片段。
在一些实施方式中,所述非宿主核酸缺乏甲基化CpG。在一些实施方式中,所述结合结构域包含甲基-CpG结合结构域(MBD)。在一些实施方式中,所述结合结构域包含选自MECP2、MBD1、MBD2和MBD4的蛋白或其片段。在一些实施方式中,所述结合结构域包含MBD2蛋白或其片段。
一些实施方式包括选择性切割宿主DNA的方法,所述方法包括:(a)获得包含宿主DNA的样品,其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG;和(b)通过使所述样品与以下接触来选择性切割所述宿主DNA:选择性结合所述DNA结合蛋白或甲基化CpG的抗体或其片段,和重组蛋白,所述重组蛋白包含:选择性结合所述抗体或其片段的结合结构域,和具有切割DNA的活性的核酸酶结构域。在一些实施方式中,所述样品包含非宿主核酸。一些实施方式还包括(c)从非宿主核酸除去切割的宿主DNA。
在一些实施方式中,所述DNA结合蛋白包括染色质蛋白。在一些实施方式中,所述染色质蛋白包括组蛋白。在一些实施方式中,所述非宿主核酸不与染色质结合。在一些实施方式中,所述抗体或其片段选择性结合组蛋白。在一些实施方式中,所述组蛋白选自H1、H2A、H2B、H3和H4。
在一些实施方式中,所述非宿主核酸缺乏甲基化CpG。在一些实施方式中,所述抗体或其片段选择性结合包含甲基-CpG结合结构域(MBD)的蛋白。在一些实施方式中,所述包含MBD的蛋白是选自MECP2、MBD1、MBD2和MBD4的蛋白。在一些实施方式中,所述包含MBD的蛋白是MBD2蛋白或其片段。
在一些实施方式中,所述结合结构域包含选自蛋白G和蛋白A的蛋白或其片段。在一些实施方式中,所述核酸酶结构域包含非特异性核酸内切酶。在一些实施方式中,所述核酸酶结构域包含选自Fok I和Tev I的蛋白或其片段。在一些实施方式中,所述重组蛋白包含在所述结合结构域和所述核酸酶结构域之间的接头。
在一些实施方式中,所述宿主DNA是哺乳动物DNA。在一些实施方式中,所述宿主DNA是人DNA。在一些实施方式中,所述非宿主核酸选自真核核酸、原核核酸和病毒核酸。
在一些实施方式中,(c)包括选自以下的步骤:使所述非宿主核酸与基质结合,使所述非宿主核酸与捕获探针杂交,和进行凝胶过滤。在一些实施方式中,所述基质包括固相可逆固定化(SPRI)珠。
一些实施方式包括从样品中选择性切割宿主DNA的方法,所述方法包括:(a)获得包含宿主DNA的样品,其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG岛;(b)通过使所述样品与以下接触来选择性切割所述宿主DNA:(i)选择性结合所述DNA结合蛋白或甲基化CpG岛的抗体或其片段,和(ii)重组蛋白,所述重组蛋白包含:选择性结合所述抗体或其片段的结合结构域,和第一核酸酶结构域,和(iii)第二核酸酶结构域,其中所述第一核酸结构域和所述第二核酸酶结构域在一起具有切割DNA的活性。在一些实施方式中,所述样品包含非宿主核酸。一些实施方式还包括(c)从所述非宿主核酸除去切割的宿主DNA。
在一些实施方式中,第二重组蛋白包含所述第二核酸酶结构域和第二结合结构域,其中所述第二结合结构域选择性结合所述抗体或其片段、所述DNA结合蛋白或甲基化CpG岛。在一些实施方式中,所述DNA结合蛋白包括染色质蛋白。在一些实施方式中,所述染色质蛋白包括组蛋白。
一些实施方式包括制备核酸文库的方法,其包括:(a)根据权利要求1-34中任一项所述的方法在包含所述宿主DNA和非宿主核酸的样品中选择性切割宿主DNA,并从所述样品除去切割的宿主DNA;和(b)使所述非宿主核酸与文库制备试剂接触,从而制备核酸文库。在一些实施方式中,(a)是在(b)之前进行。在一些实施方式中,(a)是在(b)之后进行。在一些实施方式中,所述文库制备试剂选自转座子、测序引物和连接酶。
一些实施方式还包括对所述核酸文库进行测序。
一些实施方式包括重组蛋白,其包含:选择性结合DNA结合蛋白、甲基化CpG或抗体的结合结构域;和核酸酶结构域。
在一些实施方式中,所述DNA结合蛋白包括染色质蛋白。在一些实施方式中,所述染色质蛋白包括组蛋白。在一些实施方式中,所述结合结构域选择性结合组蛋白。在一些实施方式中,所述组蛋白选自H1、H2A、H2B、H3和H4。在一些实施方式中,所述结合结构域包含RBBP4蛋白或其片段。
在一些实施方式中,所述结合结构域包含甲基-CpG结合结构域(MBD)。在一些实施方式中,所述结合结构域包含选自MECP2、MBD1、MBD2和MBD4的蛋白或其片段。在一些实施方式中,所述结合结构域包含MBD2蛋白或其片段。
在一些实施方式中,所述结合结构域选择性结合抗体。在一些实施方式中,所述结合结构域包含选自蛋白G和蛋白A的蛋白或其片段。
在一些实施方式中,所述核酸酶结构域包含非特异性核酸内切酶。在一些实施方式中,所述核酸酶结构域包含选自Fok I和Tev I的蛋白或其片段。在一些实施方式中,所述重组蛋白包含在所述结合结构域和所述核酸酶结构域之间的接头。在一些实施方式中,所述核酸酶结构域与第二核酸酶结构域组合具有切割DNA的活性。
一些实施方式包括编码前述重组蛋白中任一种的核酸。
一些实施方式包括包含前述核酸的细胞。
一些实施方式包括用于选择性切割与DNA结合蛋白结合的宿主DNA或包含甲基化CpG的结合的宿主DNA的试剂盒,所述试剂盒包括:(a)权利要求40-52中任一项所述的重组蛋白;和(b)选自以下的试剂:选择性结合DNA结合蛋白或甲基化CpG的抗体,包含第二核酸酶结构域的第二重组蛋白,用于从非宿主DNA除去切割的宿主DNA的试剂,文库制备试剂,核酸测序试剂,和用于未切割核酸的捕获试剂。在一些实施方式中,所述DNA结合蛋白包括染色质蛋白。在一些实施方式中,所述染色质蛋白包含组蛋白。
附图说明
图1描绘了一个实施方式,其中将宿主DNA(10)包装到组蛋白复合物(20)中,而病原体DNA(30)没有包装在这样的复合物中。重组酶(40)与宿主组蛋白复合物结合,并切割宿主DNA,而使病原体DNA(30)完整。
图2描绘了一个实施方式,其中组蛋白核酸酶用于切割人样品中的人DNA,剩余的病原体核酸用于制备用于测序的文库。
图3描绘了一个实施方式,其中从人样品制备核酸文库,并且使用组蛋白核酸酶从文库切割人DNA。
图4描绘了具有核酸酶结构域(50)和组蛋白结合结构域(60)的重组蛋白的实施方式。
图5描绘了具有蛋白G抗体结合结构域(70)和核酸酶结构域(50)的重组蛋白的实施方式。蛋白G抗体结合结构域与抗组蛋白抗体(80)结合,所述抗组蛋白抗体与组蛋白结合。
图6描绘了一个实施方式,其中重组蛋白具有异二聚体核酸酶结构域和两个抗体结合结构域。两个抗体结合结构域各自结合不同种类的抗组蛋白抗体。
图7描绘了一个实施方式,其中重组蛋白具有蛋白G抗体结合结构域(70)和核酸酶结构域(50)。蛋白G结合结构域与抗5-甲基胞嘧啶抗体(90)结合,所述抗5-甲基胞嘧啶抗体(90)与5-甲基胞嘧啶(100)结合。
图8描述了一个实施方式,其中重组蛋白包含甲基-CpG结合结构域(110)和核酸酶结构域(50)。甲基-CpG结合结构域与甲基-CpG DNA(100)结合。
图9是加载有纯化的重组蛋白的考马斯蓝染色的聚丙烯酰胺凝胶的照片。泳道1加载有来自未用编码重组脱宿主(dehosting)蛋白的DNA转化的BL21 AI大肠杆菌的阴性对照。泳道2-4加载有在BL21AI大肠杆菌中分别从PGFkShHomol,MBmuFkShELD1和MBwtFkShKKR1 DNA构建体表达的纯化重组蛋白。
图10(左侧小图和右侧小图)是琼脂糖凝胶中溴化乙锭染色的核酸的照片。左侧小图的凝胶加载有组合或不组合纯化的重组甲基化CpG核酸酶(mCpGnuclease)的甲基-CpGDNA或非甲基-CpG DNA。右侧小图的凝胶加载有组合或不组合纯化的mCpGnuclease的甲基CpG DNA或非甲基CpG DNA,或阴性对照。
具体实施方式
本文提供的方法和组合物的一些实施方式涉及靶核酸例如宿主DNA的选择性切割。一些这样的实施方式包括用重组核酸酶选择性切割靶核酸,例如与DNA结合蛋白相关联或包含甲基化CpG岛的宿主DNA。如本文所用,与DNA结合蛋白相关联的核酸(例如宿主DNA)可以包括与DNA结合蛋白(例如染色质蛋白,例如组蛋白)结合的核酸。一些实施方式还包括通过选择性切割样品中的靶核酸,和从样品除去切割的靶核酸来富集样品中的非靶核酸。有利地,所提供的方法和组合物可用于从包含宿主DNA和非宿主核酸的多核苷酸样品极大地富集非宿主核酸,从而提高检测非宿主核酸的灵敏度,以及降低这样的检测的成本。
本文提供的方法和组合物的一些实施方式包括选择性降解宿主DNA的重组蛋白。在一些实施方式中,重组蛋白特异性靶向宿主DNA的特征,例如与宿主DNA相关联的蛋白,例如宿主DNA结合蛋白,例如染色质蛋白,例如组蛋白。在一些实施方式中,重组蛋白特异性地靶向宿主DNA的特征,例如化学特征,例如CpG甲基化,或将宿主DNA与非宿主核酸区分开的任何其他特征。本文提供的方法和组合物的实施方式可用于例如其中非宿主核酸在包含宿主DNA和非宿主核酸的多核苷酸样品中具有特别低的频率的应用中,例如病原体检测。
术语“多核苷酸”和“核酸”在本文可以互换使用,并且是指具有任何长度的核苷酸的聚合形式,即核糖核苷酸或脱氧核糖核苷酸。因此,该术语包括但不限于单链、双链或多链DNA或RNA,基因组DNA,cDNA,DNA-RNA杂合体,或包含嘌呤和嘧啶碱基的聚合物或其他天然的、化学或生化修饰的、非天然的或衍生的核苷酸碱基。
术语“结合”是指由于例如共价、静电、疏水和离子和/或氢键相互作用而在两个分子之间的直接关联。
重组蛋白
本文提供的方法和组合物的一些实施方式涉及具有选择性结合宿主DNA的结合结构域和具有切割DNA的活性的核酸酶结构域的重组蛋白。在一些实施方式中,宿主DNA与DNA结合蛋白相关联,和/或包含甲基化CpG。在一些实施方式中,DNA结合蛋白是染色质蛋白,例如组蛋白。在一些实施方式中,重组蛋白是结合结构域和核酸酶结构域的融合体。
在一些实施方式中,结合结构域可以选择性结合DNA结合蛋白、甲基化CpG或抗体。结合结构域可以将核酸酶结构域靶向至宿主DNA。在一些实施方式中,结合结构域选择性结合与非宿主核酸(例如病原体核酸)未相关联的宿主DNA的特征。
在一些实施方式中,结合结构域选择性结合染色质。染色质包含DNA和相关联的组蛋白和组蛋白蛋白。在一些实施方式中,结合结构域选择性结合人染色质。在一些实施方式中,结合结构域选择性结合真核染色质。在一些实施方式中,结合结构域是染色质结合结构域。在一些实施方式中,染色质结合结构域选择性结合染色质蛋白或核酸。
在一些实施方式中,结合结构域可以选择性结合组蛋白和/或组蛋白结合蛋白。组蛋白存在于真核细胞的细胞核中,也存在于某些古细菌中,即Thermoproteales和Euryarchaea,但不存在于细菌或病毒中。组蛋白通常遍及整个真核染色体DNA。真核生物属于真核生物(Eukaryota或Eukarya)界,可以是单细胞或多细胞生物。真核生物的实例是其细胞具有细胞核和包裹在膜内的其他细胞器的生物,人、动物、植物、真菌和原生动物。
在一些实施方式中,结合结构域选择性结合组蛋白和DNA。图1描绘了一个实施方式,其中重组蛋白(40)切割由组蛋白包装成组蛋白复合物(20)的宿主DNA(10),而使病原体DNA(30)完整。包含组蛋白结合结构域和核酸酶结构域的重组组蛋白核酸酶的实例描绘于图4中,其包含核酸酶结构域(50)和组蛋白结合结构域(60)。在一些实施方式中,组蛋白(histone或histone protein)可以包括组蛋白,例如H1、H2A、H2B、H3和H4。组蛋白结合结构域可以结合任何组蛋白或其任何变体、成员或等位基因变异。组蛋白可以包括H1、H2A、H2B、H3或H4,或其任何变体。组蛋白的一个实例是两个H2A-H2B二聚体的四聚体和H3-H4四聚体。组蛋白可以包含接头组蛋白:H1或H5。H1的亚家族变体包括H1F和H1H1。H2A的亚家族变体包括H2AF、H2A1和H2A2。H2B的亚家族变体包括H2BF、H2B1和H2B2J。H3的亚家族变体包括H3A1、H3A2和H3A3。H4的亚家族变体包括H41和H44。任何组蛋白的各个亚家族变体可以包括多个成员和/或等位基因变异。
在一些实施方式中,结合结构域包含组蛋白结合蛋白或其片段。在一些实施方式中,结合结构域包含组蛋白结合蛋白RBBP4(RBBP4)。在一些实施方式中,结合结构域包含RBBP4的片段。
在一些实施方式中,结合结构域或其片段衍生自真核生物。在一些实施方式中,结合结构域或其片段衍生自人。在一些实施方式中,结合结构域或其片段衍生自人以外的生物。在一些实施方式中,结合结构域是天然组蛋白结合蛋白或其片段。例如,组蛋白核酸酶的组蛋白结合结构域可以来自天然人蛋白质。在一些实施方式中,结合结构域是修饰或突变的组蛋白结合蛋白或其片段。
在一些实施方式中,组蛋白结合结构域可以包括与组蛋白特异性结合的蛋白结构域,例如染色域、Tudor、恶性脑肿瘤(MBT)、植物同源域(PHD)、溴域、SANT、YEATS,脯氨酸-色氨酸-色氨酸-脯氨酸(PWWP)、溴邻体同源性(BAH)、Akryin重复、WD40重复、ATRX-DNMT3A-DNMT3L(ADD)或zn-CW。在一些实施方式中,组蛋白结合结构域可以包括与来自以下蛋白的组蛋白特异性结合的结构域,例如HAT1、CBP/P300、PCAF/GCN5、TIP60、HB01(ScESAl、SpMSTl)、ScSAS3、ScSAS2(SpMST2)、ScRTTl09、SirT2(ScSir2)、SUV39H1、SUV39H2、G9a、ESET/SETDB1、EuHMTase/GLP、CLL8、SpClr4、MLL1、MLL2、MLL3、MLL4、MLL5、SET1A、SET1B、ASH1、Sc/Sp SET1、SET2(Sc/Sp SET2)、NSD1、SYMD2、DOT1、Sc/Sp DOT1、Pr-SET 7/8、SUV420H1、SUV420H2、SpSet 9、EZH2、RIZ1、LSD1/BHC110、JHDMla、JHDMlb、JHDM2a、JHDM2b、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、CARM1,PRMT4、PRMT5,Haspin,MSK1、MSK2、CKII、Mstl、Bmi/RmglA、RNF20/RNF40或ScFPR4或其组蛋白结合片段。在一些实施方式中,结合结构域可以衍生自与组蛋白修饰过程相关的蛋白质,例如组蛋白乙酰化、脱乙酰化、甲基化、脱甲基化、磷酸化、脱磷酸化、泛素化、脱泛素化、sumo化(sumoylation)、去sumo化、核糖基化、去核糖基化、瓜氨酸化、去瓜氨酸化、胺化或脱氨。在一些实施方式中,结合结构域与除组蛋白或与组蛋白相关的蛋白以外的DNA结合蛋白结合。
在一些实施方式中,结合结构域可以选择性结合包含甲基化CpG的DNA。在DNA的区域中发现了CG二核苷酸基序(“CpG位点”或“CG位点”),在该区域中沿其5'至3'方向的碱基的线性序列中的胞嘧啶核苷酸之后是鸟嘌呤核苷酸。CpG岛(或CG岛)是具有高频率CpG位点的区域。CpG是5'-C-磷酸酯-G-3'的简写,也就是说,胞嘧啶和鸟嘌呤被一个磷酸酯分开。CpG二核苷酸中的胞嘧啶可以被甲基化以形成5-甲基胞嘧啶。
胞嘧啶甲基化在整个人类基因组的许多CpG位点处发生。CG位点处的胞嘧啶甲基化也在其他真核生物的整个基因组中发生。例如,在哺乳动物中,CpG胞嘧啶的70%至80%可以被甲基化。在许多感兴趣的病原体(例如细菌和病毒)中,这种CpG甲基化不发生或显著低于人基因组中的CpG甲基化。因此,可以通过选择性切割CpG甲基化DNA来实现脱宿主(dehost)。在一些实施方式中,重组蛋白是核酸酶结构域和甲基-CpG结合结构域的融合体。在图8中示出了一个实例,其中重组蛋白包含甲基-CpG结合结构域(110)和核酸酶结构域(50)。甲基-CpG结合结构域结合甲基-CpG DNA(100)。结合结构域将重组蛋白靶向至CpG甲基化宿主DNA,使得相关联的核酸酶结构域可以对其进行切割。
在一些实施方式中,结合结构域包含与CpG岛或CpG位点结合的蛋白或其片段。在一些实施方式中,结合结构域包含与甲基化CpG岛结合的蛋白或其片段。在一些实施方式中,结合结构域包含甲基-CpG结合结构域(MBD)。MBD的一个实例是折叠成α/β三明治结构的约70个残基的多肽,所述三明治结构包含一层扭曲的β折叠,背后是在C末端由α1螺旋和发夹环形成的另一层。这些层都是两亲性的,α1螺旋和β折叠平行,疏水面彼此紧密堆积。β折叠包含两条较短的外链(βl和β4)夹在中间的两条较长的内链(β2和β3)。在一些实施方式中,结合结构域包含选自MECP2、MBD1、MBD2和MBD4的蛋白质或其片段。在一些实施方式中,结合结构域包含MBD2。在一些实施方式中,结合结构域包含MBD2的片段。在一些实施方式中,结合结构域包含MBD5、MBD6、SETDB1、SETDB2、TIP5/BAZ2A或BAZ2B或其片段。在一些实施方式中,结合结构域包含CpG甲基化或脱甲基化蛋白或其片段。
在一些实施方式中,结合结构域可以选择性结合抗体,所述抗体选择性结合宿主DNA的特征,例如DNA结合蛋白或甲基化CpG。在一些实施方式中,DNA结合蛋白是染色质蛋白,例如组蛋白。然后可以将核酸酶结构域靶向至抗体附近的DNA。在一些实施方式中,结合结构域可包含选择性结合抗体的抗体结合蛋白的结构域。在一些实施方式中,抗体结合结构域结合抗体的Fab或Fc区。在一些实施方式中,结合结构域包含选自蛋白G和蛋白A的蛋白质或其片段。在一些实施方式中,蛋白G或蛋白A或其片段来自链球菌。在一些实施方式中,蛋白G或蛋白A或其片段结合抗体的Fc区或Fc抗体片段。在一些实施方式中,抗体结合结构域是蛋白A/G或蛋白L或其片段。如将容易理解的,包含抗体的一些实施方式是模块化的,从而允许依赖于抗体靶向宿主DNA的不同特征。在图5中描绘了示例实施方式,其中重组蛋白包含蛋白G抗体结合结构域(70)和核酸酶结构域(50)。蛋白G抗体结合结构域结合与组蛋白结合的抗组蛋白抗体(80)。在图7中描绘了另一个示例实施方式,其中重组蛋白包含蛋白G抗体结合结构域(70)和核酸酶结构域(50)。蛋白G结合结构域结合与5-甲基胞嘧啶(100)结合的抗5-甲基胞嘧啶抗体(90)。一些这样的实施方式可以靶向甲基化DNA的区域以进行降解。
可以通过本领域已知的方法制备针对宿主DNA特征的抗体。抗体或免疫球蛋白的一个实例是约150kDa的大球形血浆蛋白。它可以包含例如四个多肽:连接以形成“Y”形分子的两个重链和两个轻链。在不同的抗体之间,“Y”的尖端的氨基酸序列可以有很大差异。该可变区包含例如110-130个氨基酸,可以赋予抗体用于结合抗原的特异性。可变区可以包含轻链和重链的末端。用蛋白酶处理抗体可以切割该区域,产生包含抗体的可变末端的Fab或抗原结合片段。在一些实施方式中,抗体包括IgM、IgG、Iga、IgD或IgE类抗体。在一些实施方式中,抗体是单克隆的。在一些实施方式中,单克隆抗体由杂交瘤细胞系产生。在一些实施方式中,抗体是多克隆的。
在一些实施方式中,结合结构域包含与宿主DNA的特征选择性结合的抗体片段。在一些实施方式中,结合结构域包含与特定DNA结合蛋白例如染色质蛋白选择性结合的抗体片段。在一些实施方式中,结合结构域包含抗组蛋白抗体的片段。在一些实施方式中,结合结构域包含抗甲基-CpG抗体的片段。在一些实施方式中,抗甲基CpG抗体包含抗5-甲基胞嘧啶抗体。
在一些实施方式中,重组蛋白可包含第二结合结构域。例如,重组蛋白可以包含甲基-CpG结合结构域和组蛋白结合结构域,两个甲基-CpG结合结构域或两个组蛋白结合结构域。在一些实施方式中,包含第二结合结构域改善了与宿主DNA结合的特异性。
在一些实施方式中,重组蛋白的核酸酶结构域可包括非特异性核酸酶。在一些实施方式中,核酸酶结构域是核酸内切酶或其片段。在一些实施方式中,核酸酶结构域是非特异性核酸内切酶或其片段。在一些实施方式中,核酸酶结构域是非特异性核酸外切酶或其片段。在一些实施方式中,核酸酶结构域是归巢核酸内切酶或其片段。在一些实施方式中,核酸酶结构域是限制性核酸内切酶或其片段。在一些实施方式中,核酸酶结构域是人蛋白质或其片段。在一些实施方式中,核酸酶结构域是真核蛋白或其片段。在一些实施方式中,核酸酶结构域是非真核蛋白或其片段。
在一些实施方式中,核酸酶结构域衍生自其中核酸酶结构域本身不具有其自身独特靶标的任何核酸酶。在一些实施方式中,当与其他蛋白质融合时,核酸酶结构域具有活性。非特异性核酸酶的实例包括Fok1和I-Tev1。在一些实施方式中,核酸酶结构域是Fok1或其片段。在一些实施方式中,核酸酶结构域是I-Tev1或其片段。在一些实施方式中,Fok1或I-Tev1或其片段是未突变的和/或野生型的。
表1列出了示例性Fok1变体及其多肽序列。在一些实施方式中,Fok1或其功能性片段包含具有与选自SEQ ID NO:01、SEQ ID NO:02、SEQ ID NO:03、SEQ ID NO:04、SEQ IDNO:05、SEQ ID NO:06、SEQ ID NO:07、SEQ ID NO:08、SEQ ID NO:09、SEQ ID NO:10和SEQID NO:11的多肽至少70%、80%、90%、95%或100%,或前述百分比中任意两个的范围内的百分比的同一性的多肽,或上述多肽中任一种的保守变化。在一些实施方式中,Fok1包括在SEQ ID NO:01-11中识别的任何多肽的二聚体。在一些实施方式中,使用一种或多种Fokl变体代替野生型Fokl增强了重组蛋白的核酸酶活性。在一些实施方式中,核酸酶结构域具有使其冷或热敏感的突变。
表1
在一些实施方式中,核酸酶结构域与第二核酸酶结构域组合具有切割DNA的活性。在一些实施方式中,核酸酶结构域是同型二聚体。在一些实施方式中,核酸酶结构域是异二聚体。例如,在一些实施方式中,可以通过使用分裂的、异二聚的核酸酶结构域(图6)来增加特异性。第二异二聚体亚基可以在核酸酶的初始结合后用作另一融合体(图6中所示)或单独添加(不融合至核酸酶结构域)。
在一些实施方式中,核酸酶结构域是脱氧核糖核酸酶I(DNase I)、RecBCD核酸酶、T7核酸内切酶、T4核酸内切酶IV、Bal 31核酸内切酶、核酸内切酶(内切I)、微球菌核酸酶、核酸内切酶II(内切VI、外切III)、神经孢子内切核酸酶、S1-核酸酶、P1-核酸酶、绿豆核酸酶I、Utilago核酸酶(Dnase I)、AP核酸内切酶或Endo R,或其片段。
在一些实施方式中,核酸酶结构域包含具有与选自SEQ ID NO:01-11的多肽至少70%、80%、90%、95%、99%或100%同一性的多肽,其功能性片段,或前述多肽中任一者的保守变异。在一些实施方式中,保守氨基酸变异可包括替代功能等价氨基酸的氨基酸置换。保守氨基酸变异导致所得肽的氨基酸序列的沉默变化。例如,具有相似极性的一个或多个氨基酸充当功能等同物,并导致肽的氨基酸序列内的沉默改变。电荷中性且用较小残基代替残基的置换也可被视为“保守置换”,即使残基位于不同的组中,例如,用较小的异亮氨酸置换苯丙氨酸。具有相似侧链的氨基酸残基家族已在本领域中定义。表2显示了多个保守氨基酸置换家族。
表2
家族 | 氨基酸 |
非极性 | Trp,Phe,Met,Leu,Ile,Val,Ala,Pro |
不带电极性 | Gly,Ser,Thr,Asn,Gln,Tyr,Cys |
酸性/带负电 | Asp,Glu |
碱性/正电荷 | Arg,Lys,His |
β支化 | Thr,Val,Ile |
影响链取向的残基 | Gly,Pro |
芳香族 | Trp,Tyr,Phe,His |
在一些实施方式中,重组蛋白包含在结合结构域和核酸酶结构域之间的接头。在一些实施方式中,接头直接连接结合结构域和核酸酶结构域。接头可以是柔性的或刚性的,长的或短的,天然的或合成的。表3列出了重组蛋白可在各种排列中包括的结合结构域、接头和核酸酶结构域的实例。
表3
在一些实施方式中,重组蛋白包含可检测标记。可检测标记的实例包括例如生物素、谷胱甘肽S-转移酶(GST)、聚组氨酸(HIS)和地高辛(digioxigenin)。
在一些实施方式中,蛋白质是纯化的或基本上纯化的。在一些实施方式中,使用可检测标记纯化或基本上纯化蛋白质。上述重组蛋白可以被称为“重组核酸酶”、“重组酶”、“工程化核酸酶”和“工程化酶”。本文提供的一些实施方式涉及编码上述任何重组蛋白的核酸。在一些实施方式中,核酸在载体内编码。在一些实施方式中,载体是克隆载体或表达载体。载体的实例包括人或动物病毒,例如牛痘病毒或腺病毒;昆虫病毒,例如杆状病毒;酵母载体;噬菌体载体(例如λ)以及质粒和粘粒DNA载体,以上仅举几例。在一些实施方式中,载体包含选择标志物。这样的标志物可以允许识别和/或选择掺入并表达该标志物编码的蛋白质的宿主细胞。在一些实施方式中,载体包含用于指导基因转录的启动子元件。本文提供的一些实施方式涉及包含上述核酸或重组蛋白的细胞。在一些实施方式中,核酸由细胞稳定表达。在一些实施方式中,核酸被整合到细胞的基因组中。在一些实施方式中,核酸是瞬时表达的。
宿主DNA的选择性切割
本文提供的一些实施方式涉及使用本文提供的重组蛋白选择性切割宿主DNA的方法。一些实施方式包括获得包含宿主DNA的样品,其中宿主DNA与DNA结合蛋白相关联或包含甲基化CpG。在一些实施方式中,DNA结合蛋白是染色质蛋白,例如组蛋白。样品可以与重组蛋白接触,从而选择性切割宿主DNA。一些实施方式包括用本文提供的重组蛋白和与宿主DNA的特征(例如DNA结合蛋白或甲基化CpG)选择性结合的抗体或其片段选择性切割宿主DNA。在一些这样的实施方式中,抗体结合宿主DNA的特征,重组蛋白结合抗体并切割宿主DNA。一些实施方式还包括使包含宿主DNA和非宿主核酸的多核苷酸样品脱宿主。一些这样的实施方式包括选择性切割宿主DNA,以及从非宿主核酸除去切割的宿主DNA。
在一些实施方式中,样品可以获自来自生物体或细胞培养物的细胞,流体,组织或器官,例如血液,血清,血浆,眼泪,唾液,粘液,尿液,乳液,精液,肌肉,心脏,肝脏,皮肤,肝脏,肾脏或脂肪组织。在一些实施方式中,样品可以来自细胞培养物。在一些实施方式中,样品是环境样品,例如土壤,水或空气样品。在一些实施方式中,样品是生物样品。在一些实施方式中,样品来自人。在一些实施方式中,样品来自非人真核生物。在一些实施方式中,样品来自动物。在一些实施方式中,样品来自植物。在一些实施方式中,样品来自真菌。在一些实施方式中,样品来自原生动物。在一些实施方式中,样品包含来自至少两种不同原核生物的核酸。在一些实施方式中,样品包含来自人和细菌生物体的核酸。在一些实施方式中,样品包含来自真核和原核生物的核酸。在一些实施方式中,样品包含来自至少两种不同的真核生物的核酸。在一些实施方式中,样品包含来自未知生物的核酸。
在一些实施方式中,样品包含例如小于10pg,小于9pg,小于8pg,小于7pg,小于6pg,小于5pg,小于4pg,小于3pg,小于2pg或小于1pg的非宿主核酸,或其值的任意范围。在一些实施方式中,样品含有例如10pg至1pg,9pg至1pg,8pg至1pg,7pg至1pg,6pg至1pg,5pg至1pg,4pg至1pg,3pg至1pg或2pg至1pg的非宿主核酸。
在一些实施方式中,宿主DNA与蛋白质例如染色质蛋白例如组蛋白结合。在一些实施方式中,宿主DNA包含表观遗传修饰,例如甲基化CpG。在一些实施方式中,宿主DNA是真核的,例如哺乳动物的,例如人的。在一些实施方式中,宿主DNA是非人DNA。宿主DNA可以包含双链DNA和/或单链DNA。在一些实施方式中,宿主DNA是染色质,非宿主核酸是非染色质核酸。在一些实施方式中,宿主DNA包含组蛋白或组蛋白。在一些实施方式中,宿主DNA的组蛋白选自H1、H2A、H2B、H3和H4。在一些实施方式中,重组蛋白的结合结构域选择性结合组蛋白。在一些实施方式中,重组蛋白的结合结构域包含RBBP4蛋白或其片段。
在一些实施方式中,非宿主核酸可包括未与可与宿主核酸相关联的DNA结合蛋白结合的核酸。在一些实施方式中,DNA结合蛋白是染色质蛋白,例如组蛋白。在一些实施方式中,非宿主核酸可包括缺乏甲基化CpG的核酸。在一些实施方式中,非宿主核酸不包含结合配偶体或未与由本文提供的重组蛋白的结合结构域选择性结合的结合配偶体结合。在一些实施方式中,非宿主核酸不包含结合配偶体或未与由抗体选择性结合的结合配偶体结合,所述抗体由本文提供的重组蛋白的结合结构域选择性结合。在一些实施方式中,非宿主核酸可包含真核、原核核酸或病毒核酸。在一些实施方式中,非宿主核酸是古细菌核酸(archaic nucleic acids)。非宿主核酸可以包括DNA和RNA。
一些实施方式包括从样品中提取宿主DNA。在一些这样的实施方式中,可以从样品中提取DNA,使得相关联的蛋白质,例如某些DNA结合蛋白,例如组蛋白,保持与所提取的DNA相关联。在一些实施方式中,保持某些DNA结合蛋白,例如与提取的DNA相关联的组蛋白,可以包括在DNA提取过程中排除蛋白酶,使用温和的洗涤步骤,使用配制为保持组蛋白完整的缓冲液,避免干扰DNA结合蛋白与DNA之间的非共价键的刺激性试剂和去污剂,或提取DNA而不沉淀DNA。在一些实施方式中,所述方法包括用蛋白酶抑制剂处理样品。
一些实施方式包括从非宿主核酸除去切割的宿主DNA。在一些这样的实施方式中,可以基于切割的宿主DNA片段和非宿主核酸的平均大小的差异,从非宿主核酸除去切割的宿主DNA。在一些实施方式中,从非宿主核酸除去切割的宿主DNA包括除去具有少于1000个碱基或碱基对的核酸。在一些实施方式中,从非宿主核酸除去切割的宿主DNA包括除去具有少于500个碱基或碱基对的核酸。在一些实施方式中,从非宿主核酸除去切割的宿主DNA包括除去具有少于400个碱基或碱基对的核酸。在一些实施方式中,从非宿主核酸除去切割的宿主DNA包括除去具有少于300个碱基或碱基对的核酸。在一些实施方式中,从非宿主核酸除去切割的宿主DNA包括除去具有少于200个碱基或碱基对的核酸。在一些实施方式中,从非宿主核酸除去切割的宿主DNA包括除去具有少于100个碱基或碱基对的核酸。在一些实施方式中,从非宿主核酸除去切割的宿主DNA包括除去具有少于2000个碱基或碱基对的核酸。
在一些实施方式中,从非宿主核酸除去切割的宿主DNA包括使非宿主核酸结合基质,使非宿主核酸与捕获探针杂交,或进行凝胶过滤。在一些实施方式中,基质包含固相可逆固定化(SPRI)珠。在一些实施方式中,基质包含固体基质,例如,磁珠、微量滴定板孔和柱表面。
本文提供的一些实施方式涉及从样品除去宿主DNA的方法,所述方法包括:(a)获得包含宿主DNA和非宿主核酸的样品;(b)通过使样品与以下接触来选择性切割宿主DNA:(i)选择性结合宿主DNA的抗体或其片段,和重组蛋白,所述重组蛋白包含:选择性结合抗体或其片段的结合结构域,和第一核酸酶结构域,和(ii)第二核酸酶结构域,其中第一和第二核酸酶结构域在一起具有切割DNA的活性;(c)从非宿主核酸除去切割的宿主DNA。在一些实施方式中,第一和第二核酸酶结构域形成二聚体。在一些实施方式中,第二重组蛋白包含第二核酸酶结构域和第二结合结构域,其中第二结合结构域选择性结合抗体或其片段,或选择性结合宿主DNA。
核酸文库的制备
本文提供的一些实施方式涉及制备核酸文库。在一些实施方式中,文库制备试剂可包括转座子、测序引物或连接酶。在一些实施方式中,核酸文库可以被测序。一些实施方式可以包括在包含宿主DNA和非宿主核酸的多核苷酸样品中选择性切割宿主DNA。可以从切割的宿主DNA除去非宿主核酸,并用于制备核酸文库。在图2中描绘了示例实施方式。在图2中,重组蛋白例如组蛋白核酸酶可用于在文库制备之前使样品脱宿主。例如,提供人样品;进行DNA提取,保持组蛋白相关联。将上述组蛋白核酸酶添加至提取的DNA。然后通过例如添加蛋白酶或沉淀DNA来除去蛋白质(包括组蛋白核酸酶);然后提取病原体核酸并通过例如SPRI或电泳和凝胶纯化从较短的切割的宿主DNA片段中分离病原体核酸;然后例如使用或技术(Illumina,Inc,San Diego,CA)制备测序文库,得到脱宿主测序文库,所述文库可以例如进行无偏测序以识别在初始人样品中的非宿主和/或病原体核酸。在另一个实施方式中,重组蛋白可以是甲基-CpG核酸酶。
在一些实施方式中,可以从包含宿主DNA和非宿主核酸的多核苷酸样品制备核酸文库,随后通过使用本文提供的重组蛋白选择性切割宿主DNA而从核酸文库除去宿主DNA。在图3中描绘了示例实施方式,其中重组蛋白例如组蛋白核酸酶可用于在文库制备后使样品脱宿主。例如,提供人样品;进行DNA提取,保持组蛋白相关联;测序文库是通过例如使用技术制备;然后将上述组蛋白核酸酶添加至文库;然后通过例如添加蛋白酶或沉淀DNA来除去蛋白质(包括组蛋白核酸酶);在组蛋白核酸酶处理后的某个时刻,通过例如SPRI或电泳和凝胶纯化从较短的切割的宿主DNA片段中提取并分离病原体核酸;这产生脱宿主测序文库,其可以例如进行无偏测序以识别初始人样品中的非宿主和/或病原体核酸。在另一个实施方式中,重组蛋白可以是甲基-CpG核酸酶。
可以将酶处理整合到修饰的lllumina文库样品制备工作流程中,以在测序前除去宿主DNA。可在制备测序文库之前使用核酸酶。例如,可以从人血浆中提取同时包含宿主和非宿主核酸例如病原体DNA的总DNA。在其中核酸酶识别DNA结合蛋白的组蛋白核酸酶或其他发明变体的情况下,提取条件确保任何宿主DNA保持与DNA结合蛋白相关联。将重组核酸酶和任何必要抗体添加到混合物中。消化后,所有蛋白质和任何其他非DNA分子均被除去,留下富集了来自病原体基因组的长片段的DNA。然后通过常见的大小选择方法(例如SPRI珠、电泳)提取这些长片段,留下短的、切割的宿主片段。然后通过标准文库样品制备方法处理DNA,例如通过末端修复和连接或转座子添加接头。
在一些实施方式中,所述方法产生包含例如至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的非宿主核酸,或其值的任意范围的样品或测序文库。在一些实施方式中,所述方法产生其中非宿主核酸占样品或测序文库中的核酸的例如50%至100%,60%至100%,70%至100%,80%至100%,90%至100%,或95%至100%的样品或测序文库。在一些实施方式中,所述方法产生富集非宿主核酸的样品或测序文库。在一些实施方式中,样品或测序文库相比于起始样品使非宿主核酸富集2×、3×、4×、5×、10×、20×、50×、100×、200×、500×、1000×、10,000×、或1,000,000×。
在一些实施方式中,文库可使用接头序列中的引物位点扩增,并使用接头序列中的测序引物位点测序。在一些实施方式中,接头序列可以包含识别核酸来源的索引。通过形成引物二聚体可以降低后续扩增步骤的效率。为了提高后续扩增步骤的效率,可以从连接产物除去未连接的单链接头。
在一些实施方式中,使用基于连接的文库制备方法(例如,Illumina TruSeq,Illumina,San Diego Calif)。基于连接的文库制备方法通常利用接头(例如,甲基化接头)设计,该设计可在初始连接步骤中引入索引序列,并且常用于制备用于单读测序、双末端测序和多重测序的样品。例如可以通过填充反应、核酸外切酶反应或其组合来末端修复核酸(例如片段化的核酸或无细胞DNA)。在一些实施方式中,然后可以将所得平末端修复核酸延伸单个核苷酸,其与接头/引物的3'端上的单个核苷酸突出端(overhang)互补。任何核苷酸均可用于延伸/突出端核苷酸。在一些实施方式中,核酸文库制备包括连接接头寡核苷酸。接头寡核苷酸通常与流动池锚互补,有时用于将核酸文库固定至固体支持物,例如流动池的内表面。在一些实施方式中,接头寡核苷酸包含标识符、一个或多个测序引物杂交位点(例如,与通用测序引物、单末端测序引物、配对末端测序引物、多重测序引物等互补的序列)或其组合(例如,接头/序列,接头/标识符,接头/标识符/序列)。
在一些实施方式中,使用基于转座子的文库制备方法(例如Epicentre,Madison,Wis.)。基于转座子的方法可以使用体外转座在单管反应中对DNA同时进行片段化和标记(通常允许引入平台特异性标签和任选的条形码),并制备测序仪即用型文库。
在一些实施方式中,核酸文库或其部分被扩增(例如通过基于PCR的方法扩增)。在一些实施方式中,测序方法包括扩增核酸文库。核酸文库可以在固定在固体支持物(例如流动池中的固体支持物)之前或之后扩增。核酸扩增包括通过产生模板和/或其互补的一个或多个拷贝来扩增或增加存在(例如在核酸文库中)的核酸模板和/或其互补物的数量的过程。扩增可以通过任何合适的方法进行。
本文提供的一些实施方式可包括对核酸进行测序。在一个实施方式中,用切割宿主DNA同时使病原体DNA完整的重组蛋白处理混合核酸的样品。病原体DNA用于制备DNA文库并进行测序。一种测序方法是合成测序(SBS)。在SBS中,监测核酸引物沿核酸模板(例如靶核酸或其扩增子)的延伸,以确定模板中的核苷酸的序列。作为基础的化学过程可以是聚合反应(例如,通过聚合酶催化)。在特定的基于聚合酶的SBS实施方式中,将荧光标记核苷酸以模板依赖性方式添加至引物(从而扩展引物),使得可以使用对添加至引物的核苷酸的顺序和类型的检测来确定模板的序列。
可以对一个或多个扩增的包封的核酸进行SBS或涉及以循环方式重复递送试剂的其他检测技术。例如,为了启动第一个SBS循环,可以使一个或多个经标记核苷酸,DNA聚合酶等流入/通过容纳一个或多个扩增的核酸分子的水凝胶珠。可以检测到引物延伸导致掺入经标记核苷酸的那些位点。任选地,核苷酸还可以包含一旦将核苷酸添加至引物则终止进一步的引物延伸的可逆终止性质。例如,可以将具有可逆终止子部分的核苷酸类似物添加至引物,使得后续延伸直到递送解封闭剂以除去该部分才发生。因此,对于使用可逆终止的实施方式,可以在检测之前或之后将解封闭剂递送至流动池。可以在各个递送步骤之间进行洗涤。然后可以重复该循环n次以将引物延伸n个核苷酸,从而检测长度为n的序列。
可以使用其他使用循环反应的测序程序,例如焦磷酸测序。焦磷酸测序检测在特定核苷酸被引入新生核酸链中时无机焦磷酸盐(PPi)的释放。在焦磷酸测序中,释放的PPi可以通过被ATP硫化酶立即转化为三磷酸腺苷(ATP)的方式进行检测,并且可以通过荧光素酶产生的光子来检测所产生的ATP的水平。因此,可以通过发光检测系统监测测序反应。焦测序过程不需要用于基于荧光的检测系统的激发辐射源。
一些实施方式可以使用涉及实时监测DNA聚合酶活性的方法。例如,可以通过带有荧光团的聚合酶和γ-磷酸酯标记的核苷酸之间的荧光共振能量转移(FRET)相互作用,或使用零模波导(ZMW)来检测核苷酸掺入。
一些SBS实施方式包括检测在将核苷酸掺入延伸产物后释放的质子。例如,基于对释放的质子的检测的测序可以使用电检测器和可商购的相关技术。这样的测序系统的实例是焦磷酸测序(例如来自Roche的子公司454Life Sciences的可商购平台),使用γ-磷酸酯标记的核苷酸的测序(例如来自Pacific Biosciences的可商购平台)和使用质子检测的测序(例如来自Life Technologies的子公司Ion Torrent的可商购平台)。
另一种有用的测序技术是纳米孔测序。在一些纳米孔实施方式中,靶核酸或从靶核酸除去的个体核苷酸穿过纳米孔。随着核酸或核苷酸穿过纳米孔,可以通过测量孔的电导率波动来识别每种核苷酸类型。
在分离核酸、扩增和测序的方法中,各种试剂可用于核酸分离和制备。这样的试剂可以包括例如溶菌酶、蛋白酶K、随机六聚体、聚合酶(例如Φ29DNA聚合酶、Taq聚合酶、Bsu聚合酶)、转座酶(例如Tn5)、引物(例如P5和P7接头序列)、连接酶、催化酶、脱氧核苷酸三磷酸、缓冲液或二价阳离子。
接头可包含测序引物位点、扩增引物位点和索引。如本文所用,“索引”可以包括可以用作分子标识符和/或条形码以标记核酸和/或识别核酸来源的核苷酸序列。在一些实施方式中,索引可用于识别单个核酸或核酸亚群。在一些实施方式中,可以在流动池装置上的水凝胶内制备核酸文库。
试剂盒
本文提供的一些实施方式涉及一种用于从包含宿主DNA和非宿主核酸的样品除去宿主DNA的试剂盒,所述试剂盒包括:(a)上述任何重组蛋白;(b)选自以下的试剂:选择性结合DNA结合蛋白或甲基化CpG的抗体,包含第二核酸酶结构域的第二重组蛋白,用于从非宿主除去切割的宿主DNA的试剂,文库制备试剂,和核酸测序试剂。在一些实施方式中,DNA结合蛋白是染色质蛋白,例如组蛋白。例如,试剂盒可包括重组组蛋白核酸酶和用于从非宿主DNA除去切割的宿主DNA的试剂,或甲基-CpG核酸酶和文库制备试剂。
如本文所用,术语“试剂”描述了用于与样品反应、相互作用、稀释或添加至样品的试剂或两种或更多种试剂的混合物。文库制备试剂和核酸测序试剂的实例包括用于核酸扩增反应的试剂,包括例如缓冲液、化学品、酶、模板核酸、核苷酸、标记、染料、核酸酶、随机六聚体、聚合酶(例如,Φ29DNA聚合酶、Taq聚合酶、Bsu聚合酶)、引物、催化酶、脱氧核苷酸三磷酸、缓冲液和二价阳离子。在一些实施方式中,文库制备试剂可包括转座酶,例如Tn5、接头序列或连接酶。用于从非宿主DNA除去切割的宿主DNA的试剂的实例包括缓冲液、乙醇、异丙醇、琼脂糖和其他胶凝剂。
实施例
实施例1—重组核酸酶
各自合成编码重组蛋白的基因,在大肠杆菌BL21 AI中表达,并纯化表达的蛋白。重组蛋白包括:(1)PGFkShHomol,其包含蛋白G结合结构域、Fok1核酸酶和同二聚体结合结构域;(2)MBwtFkShKKR1,其包含野生型MBD2结合结构域、Fok1核酸酶结构域和KKR异二聚体结构域;和(3)MBmuFkShELD1,其包含增强的突变体MBD2结合结构域、Fok1核酸酶结构域和ELD异二聚体结构域。Fok1核酸酶结构域包含SEQ ID NO:10的Sharkey突变。
图9显示了加载有纯化重组蛋白的考马斯蓝染色的聚丙烯酰胺凝胶。在图9中,泳道1是阴性对照,泳道2-4是纯化重组蛋白。凝胶中的条带证实表达了重组核酸酶。
合成、表达和纯化了包含来自MBD2的DNA结合结构域和来自Fokl Sharkey的核酸酶结构域的重组甲基化CpG核酸酶(mCpG核酸酶)。为了证明mCpG核酸酶与甲基化CpG DNA的选择性结合,将mCpG核酸酶与甲基化CpG DNA或非甲基化CpG DNA一起孵育,并将复合物在琼脂糖凝胶上解开。图10(左小图)显示了与非甲基化CpG DNA(-)一起孵育的mCpG核酸酶相比,与甲基化CpG DNA(+)一起孵育的mCpG核酸酶的带移。因此,mCpG核酸酶选择性结合甲基化CpG DNA。为了证明mCpG核酸酶对甲基化CpG DNA的核酸酶活性,将mCpG核酸酶与包含甲基化CpG DNA(+)或非甲基化CpG DNA(-)的超螺旋质粒DNA一起孵育,并将产物在琼脂糖凝胶上解开。图10(右小图)显示了mCpG核酸酶选择性消化了包含甲基化CpG DNA的超螺旋质粒DNA。
如本文所用,术语“包含”与“包括”、“含有”或“特征在于……”同义,并且是包括性的或开放性的,不排除另外的、未记载的要素或方法步骤。
以上描述公开了本发明的多种方法和材料。本发明容许方法和材料的改变,以及制造方法和设备的改变。通过考虑本文公开的本发明的该公开内容或实践,这样的改变对于本领域技术人员将变得显而易见。因此,无意将本发明限制于本文公开的特定实施方式,而是其涵盖了落入本发明的真实范围和精神内的所有改变和替代。
本文引用的所有参考文献,包括但不限于已公布和未公布的申请、专利和文献参考,均通过引用全文并入本文,并因此成为本说明书的一部分。对于通过引用并入的出版物和专利或专利申请与本说明书中包含的公开内容相矛盾的程度,本说明书旨在代替和/或优先于任何这样的相矛盾的内容。
Claims (65)
1.一种选择性切割宿主DNA的方法,其包括:
(a)获得包含宿主DNA的样品,其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG;和
(b)通过使所述样品与重组蛋白接触来选择性切割所述宿主DNA,所述重组蛋白包含:
选择性结合所述DNA结合蛋白或甲基化CpG的结合结构域,和
具有切割DNA的活性的核酸酶结构域。
2.根据权利要求1所述的方法,其中所述样品包含非宿主核酸。
3.根据权利要求2所述的方法,其还包括(c)从非宿主核酸除去切割的宿主DNA。
4.根据权利要求1-3中任一项所述的方法,其中所述非宿主核酸不与所述DNA结合蛋白结合。
5.根据权利要求1-4中任一项所述的方法,其中所述DNA结合蛋白包括染色质蛋白。
6.根据权利要求1-5中任一项所述的方法,其中所述DNA结合蛋白包括组蛋白。
7.根据权利要求1-6中任一项所述的方法,其中所述结合结构域选择性结合组蛋白。
8.根据权利要求7所述的方法,其中所述组蛋白选自H1、H2A、H2B、H3和H4。
9.根据权利要求8所述的方法,其中所述结合结构域包含RBBP4蛋白或其片段。
10.根据权利要求1-3中任一项所述的方法,其中非宿主核酸缺乏甲基化CpG。
11.根据权利要求10所述的方法,其中所述结合结构域包含甲基-CpG结合结构域(MBD)。
12.根据权利要求11所述的方法,其中所述结合结构域包含选自MECP2、MBD1、MBD2和MBD4的蛋白或其片段。
13.根据权利要求12所述的方法,其中所述结合结构域包含MBD2蛋白或其片段。
14.一种选择性切割宿主DNA的方法,所述方法包括:
(a)获得包含宿主DNA的样品,其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG;和
(b)通过使所述样品与以下接触来选择性切割所述宿主DNA:
选择性结合所述DNA结合蛋白或甲基化CpG的抗体或其片段,和
重组蛋白,所述重组蛋白包含:
选择性结合所述抗体或其片段的结合结构域,和
具有切割DNA的活性的核酸酶结构域。
15.根据权利要求14所述的方法,其中所述样品包含非宿主核酸。
16.根据权利要求15所述的方法,其还包括(c)从所述非宿主核酸除去切割的宿主DNA。
17.根据权利要求14-16中任一项所述的方法,其中所述DNA结合蛋白包括染色质蛋白。
18.根据权利要求17所述的方法,其中所述染色质蛋白包括组蛋白。
19.根据权利要求16-18中任一项所述的方法,其中所述非宿主核酸不与染色质结合。
20.根据权利要求14-19中任一项所述的方法,其中所述抗体或其片段选择性结合组蛋白。
21.根据权利要求20所述的方法,其中所述组蛋白选自H1、H2A、H2B、H3和H4。
22.根据权利要求14所述的方法,其中所述非宿主核酸缺乏甲基化CpG。
23.根据权利要求22所述的方法,其中所述抗体或其片段选择性结合包含甲基-CpG结合结构域(MBD)的蛋白。
24.根据权利要求23所述的方法,其中所述包含MBD的蛋白是选自MECP2、MBD1、MBD2和MBD4的蛋白。
25.根据权利要求24所述的方法,其中所述包含MBD的蛋白是MBD2蛋白或其片段。
26.根据权利要求14-25中任一项所述的方法,其中所述结合结构域包含选自蛋白G和蛋白A的蛋白或其片段。
27.根据权利要求1-26中任一项所述的方法,其中所述核酸酶结构域包含非特异性核酸内切酶。
28.根据权利要求1-27中任一项所述的方法,其中所述核酸酶结构域包含选自FokI和TevI的蛋白或其片段。
29.根据权利要求1-28中任一项所述的方法,其中所述重组蛋白包含在所述结合结构域和所述核酸酶结构域之间的接头。
30.根据权利要求1-29中任一项所述的方法,其中所述宿主DNA是哺乳动物DNA。
31.根据权利要求1至30中任一项所述的方法,其中所述宿主DNA是人DNA。
32.根据权利要求1-31中任一项所述的方法,其中所述非宿主核酸选自真核核酸、原核核酸和病毒核酸。
33.根据权利要求1-32中任一项所述的方法,其中(c)包括选自以下的步骤:使所述非宿主核酸与基质结合,使所述非宿主核酸与捕获探针杂交,和进行凝胶过滤。
34.根据权利要求33所述的方法,其中所述基质包括固相可逆固定化(SPRI)珠。
35.一种从样品中选择性切割宿主DNA的方法,所述方法包括:
(a)获得包含宿主DNA的样品,其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG岛;
(b)通过使所述样品与以下接触来选择性切割所述宿主DNA:
(i)选择性结合所述DNA结合蛋白或甲基化CpG岛的抗体或其片段,和
(ii)重组蛋白,所述重组蛋白包含:选择性结合所述抗体或其片段的结合结构域,和第一核酸酶结构域,和
(iii)第二核酸酶结构域,其中所述第一核酸结构域和所述第二核酸酶结构域在一起具有切割DNA的活性。
36.根据权利要求35所述的方法,其中所述样品包含非宿主核酸。
37.根据权利要求36所述的方法,其还包括(c)从所述非宿主核酸除去切割的宿主DNA。
38.根据权利要求35-37中任一项所述的方法,其中第二重组蛋白包含所述第二核酸酶结构域和第二结合结构域,其中所述第二结合结构域选择性结合所述抗体或其片段、所述DNA结合蛋白、或甲基化CpG岛。
39.根据权利要求35-38所述的方法,其中所述DNA结合蛋白包括染色质蛋白。
40.根据权利要求39所述的方法,其中所述染色质蛋白包括组蛋白。
41.一种制备核酸文库的方法,其包括:
(a)根据权利要求1-34中任一项所述的方法在包含宿主DNA和非宿主核酸的样品中选择性切割所述宿主DNA,并从所述样品除去切割的宿主DNA;和
(b)使所述非宿主核酸与文库制备试剂接触,从而制备核酸文库。
42.根据权利要求41所述的方法,其中(a)是在(b)之前进行。
43.根据权利要求41所述的方法,其中(a)是在(b)之后进行。
44.根据权利要求41所述的方法,其中所述文库制备试剂选自转座子、测序引物和连接酶。
45.根据权利要求41至44中任一项所述的方法,其还包括对所述核酸文库进行测序。
46.一种重组蛋白,其包含:
选择性结合DNA结合蛋白、甲基化CpG或抗体的结合结构域;和
核酸酶结构域。
47.根据权利要求46所述的重组蛋白,其中所述DNA结合蛋白包括染色质蛋白。
48.根据权利要求46所述的重组蛋白,其中所述染色质蛋白包括组蛋白。
49.根据权利要求46所述的重组蛋白,其中所述结合结构域选择性结合组蛋白。
50.根据权利要求49所述的重组蛋白,其中所述组蛋白选自H1、H2A、H2B、H3和H4。
51.根据权利要求46所述的重组蛋白,其中所述结合结构域包含RBBP4蛋白或其片段。
52.根据权利要求46所述的重组蛋白,其中所述结合结构域包含甲基-CpG结合结构域(MBD)。
53.根据权利要求52所述的重组蛋白,其中所述结合结构域包含选自MECP2、MBD1、MBD2和MBD4的蛋白或其片段。
54.根据权利要求53所述的重组蛋白,其中所述结合结构域包含MBD2蛋白或其片段。
55.根据权利要求46所述的重组蛋白,其中所述结合结构域选择性结合抗体。
56.根据权利要求46所述的重组蛋白,其中所述结合结构域包含选自蛋白G和蛋白A的蛋白或其片段。
57.根据权利要求46-56中任一项所述的重组蛋白,其中所述核酸酶结构域包含非特异性核酸内切酶。
58.根据权利要求57所述的重组蛋白,其中所述核酸酶结构域包含选自FokI和TevI的蛋白或其片段。
59.根据权利要求46-58中任一项所述的重组蛋白,其中所述重组蛋白包含在所述结合结构域和所述核酸酶结构域之间的接头。
60.根据权利要求46-59中任一项所述的重组蛋白,其中所述核酸酶结构域与第二核酸酶结构域组合具有切割DNA的活性。
61.一种核酸,其编码权利要求46-60中任一项所述的重组蛋白。
62.一种细胞,其包含权利要求61所述的核酸。
63.一种用于选择性切割与DNA结合蛋白结合的宿主DNA或包含甲基化CpG的结合的宿主DNA的试剂盒,所述试剂盒包括:
(a)权利要求46-60中任一项所述的重组蛋白;和
(b)选自以下的试剂:
选择性结合DNA结合蛋白或甲基化CpG的抗体,
包含第二核酸酶结构域的第二重组蛋白,
用于从非宿主DNA除去切割的宿主DNA的试剂,
文库制备试剂,
核酸测序试剂,和
用于未切割核酸的捕获试剂。
64.根据权利要求63所述的试剂盒,其中所述DNA结合蛋白包括染色质蛋白。
65.根据权利要求64所述的试剂盒,其中所述染色质蛋白包含组蛋白。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862644697P | 2018-03-19 | 2018-03-19 | |
US62/644,697 | 2018-03-19 | ||
PCT/US2019/022459 WO2019182891A1 (en) | 2018-03-19 | 2019-03-15 | Methods and compositions for selective cleavage of nucleic acids with recombinant nucleases |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111065746A true CN111065746A (zh) | 2020-04-24 |
Family
ID=65952190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980003318.6A Pending CN111065746A (zh) | 2018-03-19 | 2019-03-15 | 用于用重组核酸酶选择性切割核酸的方法和组合物 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11773427B2 (zh) |
EP (1) | EP3768856A1 (zh) |
CN (1) | CN111065746A (zh) |
AU (2) | AU2019239623B2 (zh) |
CA (1) | CA3067251C (zh) |
WO (1) | WO2019182891A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2020396889A1 (en) * | 2019-12-04 | 2021-09-30 | Illumina, Inc. | Preparation of DNA sequencing libraries for detection of DNA pathogens in plasma |
CN114277092B (zh) * | 2021-12-02 | 2023-03-24 | 江苏先声医疗器械有限公司 | 基于纳米孔测序平台的rna病毒宏转录组建库方法及应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070009937A1 (en) * | 2005-05-19 | 2007-01-11 | Laemmli Ulrich K | Mapping of proteins along chromatin by chromatin cleavage |
CN102648292A (zh) * | 2009-09-16 | 2012-08-22 | 塞昆纳姆股份有限公司 | 基于甲基化从母体样品中富集胎儿核酸的可用于无创性产前诊断的方法和组合物 |
US20170218349A1 (en) * | 2016-02-02 | 2017-08-03 | Sangamo Biosciences, Inc. | Compositions for linking dna-binding domains and cleavage domains |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6444421B1 (en) * | 1997-11-19 | 2002-09-03 | The United States Of America As Represented By The Department Of Health And Human Services | Methods for detecting intermolecular interactions in vivo and in vitro |
CN103958697B (zh) | 2011-06-27 | 2016-10-12 | 红外检测公司 | 从混合核酸样品分离靶核酸 |
EP3177718B1 (en) * | 2014-07-30 | 2022-03-16 | President and Fellows of Harvard College | Cas9 proteins including ligand-dependent inteins |
CA2971444A1 (en) | 2014-12-20 | 2016-06-23 | Arc Bio, Llc | Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins |
BR112017024747A2 (pt) | 2015-05-18 | 2018-11-13 | Karius Inc | composições e métodos para enriquecer populações de ácidos nucleicos |
-
2019
- 2019-03-15 WO PCT/US2019/022459 patent/WO2019182891A1/en unknown
- 2019-03-15 US US16/609,705 patent/US11773427B2/en active Active
- 2019-03-15 CA CA3067251A patent/CA3067251C/en active Active
- 2019-03-15 EP EP19714042.9A patent/EP3768856A1/en active Pending
- 2019-03-15 CN CN201980003318.6A patent/CN111065746A/zh active Pending
- 2019-03-15 AU AU2019239623A patent/AU2019239623B2/en active Active
-
2022
- 2022-05-02 AU AU2022202908A patent/AU2022202908A1/en active Pending
-
2023
- 2023-08-15 US US18/449,994 patent/US20240076717A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070009937A1 (en) * | 2005-05-19 | 2007-01-11 | Laemmli Ulrich K | Mapping of proteins along chromatin by chromatin cleavage |
CN102648292A (zh) * | 2009-09-16 | 2012-08-22 | 塞昆纳姆股份有限公司 | 基于甲基化从母体样品中富集胎儿核酸的可用于无创性产前诊断的方法和组合物 |
US20170218349A1 (en) * | 2016-02-02 | 2017-08-03 | Sangamo Biosciences, Inc. | Compositions for linking dna-binding domains and cleavage domains |
Non-Patent Citations (1)
Title |
---|
ALEXEY FOMENKOV: "Targeting DNA 5mCpG sites with chimeric endonucleases", 《ANALYTICAL BIOCHEMISTRY》, vol. 381, 2 July 2008 (2008-07-02), pages 135 - 141, XP023905057, DOI: 10.1016/j.ab.2008.06.035 * |
Also Published As
Publication number | Publication date |
---|---|
CA3067251A1 (en) | 2019-09-26 |
US20240076717A1 (en) | 2024-03-07 |
CA3067251C (en) | 2024-02-27 |
AU2019239623A1 (en) | 2020-01-16 |
AU2019239623B2 (en) | 2022-03-10 |
US11773427B2 (en) | 2023-10-03 |
AU2022202908A1 (en) | 2022-05-26 |
US20210324444A1 (en) | 2021-10-21 |
EP3768856A1 (en) | 2021-01-27 |
WO2019182891A1 (en) | 2019-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102796728B (zh) | 用于通过转座酶的dna片段化和标记的方法和组合物 | |
KR102339365B1 (ko) | 키메라 게놈 조작 분자 및 방법 | |
US9885074B2 (en) | Methods and transposon nucleic acids for generating a DNA library | |
US20240076717A1 (en) | Methods and compositions for selective cleavage of nucleic acids with recombinant nucleases | |
EP3211075B1 (en) | Recognition sequences for i-crei-derived meganucleases and uses thereof | |
CN108138364B (zh) | 一种核酸单链环状文库的构建方法和试剂 | |
WO2017087555A1 (en) | Method for controlled dna fragmentation | |
EA038500B1 (ru) | Термостабильные нуклеазы cas9 | |
US20230287477A1 (en) | Methods and compositions for recombinase-mediated selective cleavage of nucleic acids | |
US20070178482A1 (en) | Method for preparing single-stranded dna | |
US20080254516A1 (en) | Method of Isolating Nucleic Acid Targets | |
US20240026349A1 (en) | Next Generation Sequencing | |
US20220307009A1 (en) | Isolated nucleic acid binding domains | |
KR20230074207A (ko) | 카고 뉴클레오타이드 서열을 전위시키기 위한 시스템 및 방법 | |
KR20220084322A (ko) | 세포에서 하나 이상의 표적-특이적인 프로그램 가능한 뉴클레아제의 오프-타겟 활성을 프로파일링하는 진정한 편향되지 않은 시험관내 분석(abnoba-seq) | |
US20190078083A1 (en) | Method for controlled dna fragmentation | |
KR20230054457A (ko) | 카고 뉴클레오타이드 서열을 전위시키는 시스템 및 방법 | |
Chaudhuri | Recombinant DNA technology | |
CN110573627A (zh) | 用于产生目标核酸分子的方法和组合物 | |
CA3222937A1 (en) | Methods of nucleic acid sequencing using surface-bound primers | |
JP2008154557A (ja) | Dna断片の製造方法 | |
CN116949014A (zh) | UdgX-SSBE3蛋白及其捕获特定核酸的方法 | |
JP2024518095A (ja) | 核酸シーケンシングのためのライブラリーを作製する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |