CN107686842A - 一种靶多核苷酸编辑方法及其应用 - Google Patents
一种靶多核苷酸编辑方法及其应用 Download PDFInfo
- Publication number
- CN107686842A CN107686842A CN201610627960.XA CN201610627960A CN107686842A CN 107686842 A CN107686842 A CN 107686842A CN 201610627960 A CN201610627960 A CN 201610627960A CN 107686842 A CN107686842 A CN 107686842A
- Authority
- CN
- China
- Prior art keywords
- target polynucleotide
- dna
- target
- nucleic acid
- sgn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 79
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 79
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims abstract description 62
- 108020004414 DNA Proteins 0.000 claims abstract description 169
- 238000005520 cutting process Methods 0.000 claims abstract description 59
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 47
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 46
- 108010042407 Endonucleases Proteins 0.000 claims abstract description 28
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 26
- 230000000295 complement effect Effects 0.000 claims abstract description 26
- 230000007017 scission Effects 0.000 claims abstract description 26
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 19
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 19
- 101710163270 Nuclease Proteins 0.000 claims abstract description 17
- 230000006870 function Effects 0.000 claims abstract description 16
- 102000004533 Endonucleases Human genes 0.000 claims abstract description 10
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims abstract description 8
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 8
- 230000000692 anti-sense effect Effects 0.000 claims abstract description 8
- 102000007079 Peptide Fragments Human genes 0.000 claims abstract description 7
- 108010033276 Peptide Fragments Proteins 0.000 claims abstract description 7
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims abstract description 7
- 108020005187 Oligonucleotide Probes Proteins 0.000 claims description 40
- 239000002751 oligonucleotide probe Substances 0.000 claims description 40
- 239000002773 nucleotide Substances 0.000 claims description 37
- 125000003729 nucleotide group Chemical group 0.000 claims description 37
- 241000252212 Danio rerio Species 0.000 claims description 31
- 239000012634 fragment Substances 0.000 claims description 29
- 102000004190 Enzymes Human genes 0.000 claims description 21
- 108090000790 Enzymes Proteins 0.000 claims description 21
- 201000010099 disease Diseases 0.000 claims description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 18
- 239000000203 mixture Substances 0.000 claims description 14
- 150000001413 amino acids Chemical group 0.000 claims description 10
- 230000006798 recombination Effects 0.000 claims description 10
- 238000005215 recombination Methods 0.000 claims description 10
- 239000002253 acid Substances 0.000 claims description 8
- 230000029087 digestion Effects 0.000 claims description 8
- 239000000523 sample Substances 0.000 claims description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 6
- 241000218636 Thuja Species 0.000 claims description 6
- 238000002360 preparation method Methods 0.000 claims description 6
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 6
- 230000002068 genetic effect Effects 0.000 claims description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 4
- 108010025076 Holoenzymes Proteins 0.000 claims description 4
- 230000005587 bubbling Effects 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 4
- 241000196324 Embryophyta Species 0.000 claims description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 2
- 208000024827 Alzheimer disease Diseases 0.000 claims description 2
- 208000023275 Autoimmune disease Diseases 0.000 claims description 2
- 208000019838 Blood disease Diseases 0.000 claims description 2
- 108091029865 Exogenous DNA Proteins 0.000 claims description 2
- 239000004471 Glycine Substances 0.000 claims description 2
- 206010028980 Neoplasm Diseases 0.000 claims description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 2
- 238000010171 animal model Methods 0.000 claims description 2
- 208000006673 asthma Diseases 0.000 claims description 2
- 201000011510 cancer Diseases 0.000 claims description 2
- 206010012601 diabetes mellitus Diseases 0.000 claims description 2
- 208000019622 heart disease Diseases 0.000 claims description 2
- 208000014951 hematologic disease Diseases 0.000 claims description 2
- 208000018706 hematopoietic system disease Diseases 0.000 claims description 2
- 238000000184 acid digestion Methods 0.000 claims 1
- 230000001629 suppression Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 15
- 238000013461 design Methods 0.000 abstract description 10
- 102000053602 DNA Human genes 0.000 description 35
- 230000009182 swimming Effects 0.000 description 32
- 108091092584 GDNA Proteins 0.000 description 26
- 239000000047 product Substances 0.000 description 21
- 102100031780 Endonuclease Human genes 0.000 description 18
- 230000035772 mutation Effects 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 17
- 210000004027 cell Anatomy 0.000 description 16
- 238000012163 sequencing technique Methods 0.000 description 16
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- 238000012217 deletion Methods 0.000 description 14
- 230000037430 deletion Effects 0.000 description 14
- 238000010459 TALEN Methods 0.000 description 13
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 13
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 13
- 108700028369 Alleles Proteins 0.000 description 12
- 239000002585 base Substances 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 210000001161 mammalian embryo Anatomy 0.000 description 11
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 11
- 239000013615 primer Substances 0.000 description 11
- 239000000758 substrate Substances 0.000 description 10
- 238000000338 in vitro Methods 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 9
- 108091008146 restriction endonucleases Proteins 0.000 description 9
- 101150057020 znf703 gene Proteins 0.000 description 9
- 108010022037 Retinoic Acid 4-Hydroxylase Proteins 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 230000008685 targeting Effects 0.000 description 8
- 108020004682 Single-Stranded DNA Proteins 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 102000012211 Retinoic Acid 4-Hydroxylase Human genes 0.000 description 6
- 238000000520 microinjection Methods 0.000 description 6
- 102000004169 proteins and genes Human genes 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 239000000539 dimer Substances 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012175 pyrosequencing Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 239000000499 gel Substances 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000002777 nucleoside Substances 0.000 description 4
- 125000003835 nucleoside group Chemical group 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 238000010442 DNA editing Methods 0.000 description 3
- 101100540419 Danio rerio kdrl gene Proteins 0.000 description 3
- 239000007993 MOPS buffer Substances 0.000 description 3
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 239000007853 buffer solution Substances 0.000 description 3
- 230000004087 circulation Effects 0.000 description 3
- 210000002257 embryonic structure Anatomy 0.000 description 3
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 3
- 238000000799 fluorescence microscopy Methods 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 229910001629 magnesium chloride Inorganic materials 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 229910052725 zinc Inorganic materials 0.000 description 3
- 239000011701 zinc Substances 0.000 description 3
- 230000033616 DNA repair Effects 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 101001019057 Homo sapiens Homeobox protein Meis2 Proteins 0.000 description 2
- 239000012124 Opti-MEM Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 101150036160 cyp26b1 gene Proteins 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- IKHKJYWPWWBSFZ-UHFFFAOYSA-N 4-[[4-(diethylamino)phenyl]-(4-diethylazaniumylidenecyclohexa-2,5-dien-1-ylidene)methyl]benzene-1,3-disulfonate;hydron Chemical compound C1=CC(N(CC)CC)=CC=C1C(C=1C(=CC(=CC=1)S([O-])(=O)=O)S(O)(=O)=O)=C1C=CC(=[N+](CC)CC)C=C1 IKHKJYWPWWBSFZ-UHFFFAOYSA-N 0.000 description 1
- 208000004998 Abdominal Pain Diseases 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102000005869 Activating Transcription Factors Human genes 0.000 description 1
- 108010005254 Activating Transcription Factors Proteins 0.000 description 1
- 241000208340 Araliaceae Species 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000448255 Congiopodus peruvianus Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 230000005971 DNA damage repair Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 1
- 241000283070 Equus zebra Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108090000331 Firefly luciferases Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 102100034826 Homeobox protein Meis2 Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 239000013616 RNA primer Substances 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 1
- 102000016549 Vascular Endothelial Growth Factor Receptor-2 Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- JDZJVWAHZYIHFA-UHFFFAOYSA-N [Br].C1(=CC=CC=C1)O Chemical compound [Br].C1(=CC=CC=C1)O JDZJVWAHZYIHFA-UHFFFAOYSA-N 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000007233 catalytic pyrolysis Methods 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical group O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 206010013990 dysuria Diseases 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003198 gene knock in Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 239000000017 hydrogel Substances 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 230000009465 prokaryotic expression Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Abstract
本发明涉及一种靶多核苷酸编辑方法,具体步骤包括针对目标靶基因,设计一对DNA寡核苷酸单链,使其与靶基因的正义和反义链分别互补,分别产生能够被一类识别靶序列结构并具有切割活性的核酸酶识别的结构,通过所述的核酸酶切割靶基因组DNA,实现对基因组的编辑。其中,所述被一类识别靶序列结构并具有切割活性的核酸酶识别的结构为3'‑Flap结构,DNA寡核苷酸单链的3'末端不与靶基因互补;重组的结构识别核酸内切酶,包含结构识别功能域、DNA切割功能域、连接二者的肽段和核定位信号。
Description
技术领域
本发明属于分子生物学领域,涉及一种基因组编辑方法及其应用,具体而言涉及一种对基因组进行靶向切割的技术。
背景技术
DNA编辑在许多体外或体内的分子生物学实验中都是至关重要的。由于II型限制性内切酶(REases)对目标核苷酸精致而准确的切割,使得它们成为这些实验中不可或缺的工具。迄今为止,已有3700种II型REases已经被开发,但只有262种不同核酸序列能够被这些酶识别(S,et al.Proc Natl Acad Sci U S A 2007,104:10358-10363.)。因此,这些有限的序列限制了DNA编辑操作中的各种需求。为了克服此限制,已经开发了以下几种方法。第一种方法涉及对现有REases的氨基酸序列进行突变,如Not I突变体,用蛋白质结构信息学帮助增加DNA序列识别的特异性(Buchholz F.CurrOpin Biotech 2009,20:383-389.)。第二种方法涉及构建一种将靶向识别结构域与DNA切割结构域结合融合的新型IIS型酶(也称为非正统酶),如曾报道的Tst I和Bmr I(Chan S,et al.Nucleic Acids Res 2007,18,6238-6248.)。第三种方法涉及形成一种的新型核酸酶,其融合多个能识别不同DNA序列的限制性内切酶的切割结构域。例如,锌指核酸酶(ZFN)(Kim Y-G,et al.Proc Natl Acad Sci U S A 1996,93:1156-1160.)由一个DNA识别域和一个非特异性核酸内切酶构成。DNA识别域是由一系列锌指蛋白基序(zinc-fingers)串联组成从而形成锌指阵列(Zinc Finger Array,ZFA),并识别靶DNA序列;非特异性核酸内切酶如Fok Ⅰ切割结构域可以在靶位点切割DNA。ZFN已经成功地在多种生物和细胞中被用于敲除或敲入基因(Bibikova M,et al.Genetics 2002,161:1169-1175;Li H,et al.Nature2011,475:217-221;Straimer J,et al.Nat Methods 2012,9:993-998;Urnov FD,RebarEJ,et al.Nat Rev Genet 2010,11:636-646;Kim JS,et al.Nat Methods 2010,7:91)。然而,ZFN很难针对任何所需的DNA序列,因为它们偏好识别富含G碱基的共有序列,并且对识别靶DNA序列的“活性的”锌指阵列的鉴定成本很高(Isalan M.Nat Methods 2012,9:32-34.)。另一个例子是转录激活因子样效应物核酸酶(transcription activator-likeeffector nucleases,TALEN),它是将多种转录激活样(TAL)基序(Li L,et al.Mol Plant2013,6:1318-1330.)和FokⅠ切割结构域融合而成。每个TAL基序(Repeat)可以识别一个碱基核苷酸,因而,从理论上说,有多个基序组成的这种酶可以识别靶点中相应的任何序列,且使用一对TALENs已成功地敲除或敲入各种生物体和细胞的基因(Bloom K,et al.MolTher 2013,21:1889-1897;Christian M,et al.Genetics 2010,186:757-761;Sung YH,etal.Nat Biotechnol 2013,31:23-24;Tesson L,et al.Nat Biotechnol 2011,29:695-696.;Mussolino C,et al.Nucleic Acids Res 2011,39:9283-9293.)。但是,TALEN需要靶序列的5'末端有胸腺嘧啶核苷酸,其可被氨基末端隐性重复折叠(cryptic repeat fold)所识别(Mak AN,et al.Science 2012,335:716-719.)。第四种方法是RNA-指导的核酸内切酶(RNA-guided endonucleases,RGENs 如CRISPR–Cas系统),其用RNA替代了多肽进而识别目的序列,并将酶引导至切割靶点(Horvath P,Science 2010,327:167-170.)。至此,使用RGENs也成功对人类基因组进行了基因编辑(Cho SW,et al.Nat Biotechnol 2013,31:230-232.;Cong L,et al.Science 2013,339:819-823.;Mali P,et al.Science 2013,339:823-826.)。相比ZFN和TALEN,RGEN具有明显优势,它采用合成的短RNA分子代替了蛋白去识别序列。但是,RGEN靶点受限于需要具有能被Cas9识别的PAM序列(Mojica FJ,etal.Microbiology 2009,155:733-740.)。综上所述,DNA序列的特异性限制了人工核酸内切酶在DNA编辑中的应用。
因此,开发一种不依赖于DNA序列且可切割所需序列的新型核酸内切酶具有极强的应用价值。能够识别特异DNA结构的侧翼核酸内切酶1(FEN-1)为该需求提供了可能(Harrington JJ,et al.EMBO J 1994,13:1235-1246.)。在DNA复制和修复过程中,FEN-1参与了清除RNA引物或损伤DNA的过程(Kaiser MW,et al.J Biol Chem.1999,274:21387-21394.;Kao HI,et al.J Biol Chem.2002,277:14379-14389.)。新合成的DNA和移位区域与模板链配对碱基竞争,从而导致双侧翼结构(double-flap structure)的形成(ReynaldoLP,J Mol Biol 2000,297:511-520.)。双侧翼结构具有一个单独的未配对的3'核苷酸(3'flap)。AfuFEN-1在结合到3'flap后会催化裂解磷酸二酯键(Chapados BR,et al.Cell2004,116:39-50.)。此外,Fok I是IIS型限制性内切酶,其由一个N末端的DNA识别结构域和C末端切割结构域(Fn1)组成。Fok I的双向特性已用于新型特异性人工核酸内切酶的开发(Li L,et al.Proc Natl Acad Sci U S A 1992,89:4275-4279.),如ZFN或TALEN。
发明内容
因此,本发明中,申请人构建了由识别3'-Flap结构的FEN-1和切割DNA链的Fok I(Fn1)切割结构域所组成的结构指导的核酸内切酶(Structure-guided endonuclease,SGN)。3'-Flap结构由靶序列和人工引导DNA(guide DNA,gDNA)形成。根据结构引导识别,SGN可以切割任何所需的靶向DNA而不需要像type II REases、ZFN或TALEN那样改变核酸内切酶或肽单元(peptide units),或像RGEN中对RNA分子有应用限制。
本发明的目的之一是提供了一种靶多核苷酸编辑方法,其特征在于:设计一对寡核苷酸探针,使其与靶多核苷酸的正义链和反义链分别结合,分别产生能够被核酸酶识别的目标序列结构,所述核酸酶切割靶多核苷酸,实现对靶多核苷酸的编辑。
在本发明的某个实施例中,所述的靶多核苷酸编辑方法中,所述靶多核苷酸是RNA或DNA,优选是基因组DNA,所述的基因组优选是斑马鱼基因组、哺乳动物基因组、人类基因组、或植物基因组。
在本发明的某个实施例中,所述的靶多核苷酸编辑方法中,所述一对寡核苷酸探针是DNA,优选所述一对寡核苷酸探针与靶多核苷酸的结合位点间隔0-100bp,优选间隔为10-70bp、20-60bp、32-50bp或40bp。
在本发明的某个实施例中,所述的靶多核苷酸编辑方法中,所述寡核苷酸探针的长度为20nt以上,优选长度为20-50nt或25nt。
在本发明的某个实施例中,所述的靶多核苷酸编辑方法中,所述的目标序列结构为5'突出核酸结构、3'突出核酸结构、切刻核酸结构、侵入核酸结构、三链核酸结构、Y型核酸结构、3'-Flap结构以及由错配或缺失核酸引起的鼓泡核酸结构中的至少一种的识别功能域,优选3'-Flap结构,DNA寡核苷酸单链的3'-末端不与目标基因组DNA互补。
在一个具体实施例中,所述寡核苷酸探针的5'端对靶多核苷酸特异,优选与靶多核苷酸互补;寡核苷酸探针的3'端不与靶多核苷酸互补,优选3'末端1个以上、1-20个、1-10个、1-5个、1-4个、1-3个、2个或1个碱基不与靶多核苷酸互补。
在本发明的某个实施例中,所述的核酸酶是重组结构识别核酸内切酶(SGN),包含结构识别功能域、DNA切割功能域和连接二者的肽段;所述的结构识别功能域为能够识别结构为5'突出核酸结构、3'突出核酸结构、切刻核酸结构、侵入核酸结构、三链核酸结构、Y型核酸结构、3'-Flap结构以及由错配或缺失核酸引起的鼓泡核酸结构中的至少一种的识别功能域,优选选自TaqPol、TthPol、TaqExo、AfuFEN、PfuFEN、MjaFEN、MthFEN、E.coliMuts、Tthmuts和Taqmuts组成的组中任意一种酶的识别功能域或全酶片段;所述的切割功能域为IIS型核酸内切酶的切割功能域,优选Fok I的部分或全部肽段;所述的切割功能域还可选自TaqPol、TthPol、TaqExo、AfuFEN、PfuFEN、MjaFEN、MthFEN、E.coliMuts、Tthmuts和Taqmuts组成的组中任意一种酶的全酶片段的核酸内切酶结构域;所述的连接肽段为不影响结构识别与酶切功能的柔性肽段,优选甘氨酸或丝氨酸或其组合的串联组合。
在一个具体实施例中,所述的重组结构识别核酸内切酶含有核定位信号。
在一个具体实施例中,所述的重组结构识别核酸内切酶的氨基酸序列选自SEQ IDNo:1、SEQ ID No:2中任一个。
在另一个具体实施例中,所述的重组结构识别核酸内切酶的核酸序列选自SEQ IDNo:3、SEQ ID No:4、SEQ ID No:5中任一个。
在一个具体实施例中,所述基因组DNA是内源DNA或整合到基因组的外源DNA,优选所述靶多核苷酸编辑方法是在体实施的。
本发明的目的之二是提供一种寡核苷酸探针对,其特征在于该寡核苷酸探针对与靶多核苷酸的正义和反义链分别结合,分别产生能够被核酸酶识别的目标序列结构,所述目标序列结构能够被核酸酶识别,所述核酸酶切割靶多核苷酸,实现对靶多核苷酸的编辑。
在某个实施例中,所述一对寡核苷酸探针是DNA,优选与靶多核苷酸的结合位点间隔0-100bp,优选间隔为10-70bp、20-60bp、32-50bp或40bp。
在一个具体实施例中,一对寡核苷酸探针与靶多核苷酸的结合位点间隔bp长度优选为0bp、1bp、2bp、3bp、4bp、5bp、6bp、7bp、8bp、9bp、10bp、11bp、12bp、13bp、14bp、15bp、16bp、17bp、18bp、19bp、20bp、21bp、22bp、23bp、24bp、25bp、26bp、27bp、28bp、29bp、30bp、31bp、32bp、33bp、34bp、35bp、36bp、37bp、38bp、39bp、40bp、41bp、42bp、43v、44bp、45bp、46bp、47bp、48bp、49bp、50bp、51bp、52bp、53bp、54bp、55bp、56bp、57bp、58bp、59bp、60bp、61bp、62bp、63bp、64bp、65bp、66bp、67bp、68bp、69bp、70bp、71bp、72bp、73bp、74bp、75bp、76bp、77bp、78bp、79bp、80bp、81bp、82bp、83bp、84bp、85bp、86bp、87bp、88bp、89bp、90bp、91bp、92bp、93bp、94bp、95bp、96bp、97bp、98bp、99bp、100bp。
在某个实施例中,所述寡核苷酸探针的长度为20nt以上,优选长度为20-50nt或25nt。
在某个实施例中,所述寡核苷酸探针的5'端对靶多核苷酸特异,优选与靶多核苷酸互补;寡核苷酸探针的3'端不与靶多核苷酸互补,优选3'末端1个以上、1-20个、1-10个、1-5个、1-4个、1-3个、2个或1个碱基不与靶多核苷酸互补。
本发明还提供了用于靶多核苷酸编辑的系统,其特征在于所述系统包括本发明中所述的寡核苷酸探针对,优选包括本发明中所述的核酸酶。
本发明进一步提供了用于靶多核苷酸编辑的试剂盒,其特征在于所述试剂盒包括本发明中所述的寡核苷酸探针对,优选包括本发明中所述的核酸酶。
本发明的目的之三是提供了一种在靶多核苷酸中切割大片段的方法,其特征在于采用了本发明中所述的靶多核苷酸编辑方法。
在某个实施例中,一种在靶多核苷酸中切割大片段的方法中所述的大片段长度大于所述寡核苷酸探针对与靶多核苷酸的结合位点的间隔,优选所述的大片段长度大于所述间隔1-10000bp、1-3000bp、1-2000bp、1-1000bp、1-500bp、1-200bp或1-100bp。
本发明还提供了一种疾病细胞模型的制作方法,其特征在于采用了本发明中所述的靶多核苷酸编辑方法或施用了本发明中所述的寡核苷酸探针对或本发明中用于靶多核苷酸编辑的系统或本发明中用于靶多核苷酸编辑的试剂盒。
本发明还提供了一种疾病动物模型的制作方法,其特征在于采用了本发明中所述的靶多核苷酸编辑方法或施用了本发明中所述的寡核苷酸探针对或本发明中用于靶多核苷酸编辑的系统或本发明中用于靶多核苷酸编辑的试剂盒。
本发明还提供了一种植物突变体的制作方法,其特征在于采用了本发明中所述的靶多核苷酸编辑方法或施用了本发明中所述的寡核苷酸探针对或本发明中用于靶多核苷酸编辑的系统或本发明中用于靶多核苷酸编辑的试剂盒。
本发明的目的之四是提供了一种疾病治疗方法,其特征在于采用了本发明中所述的靶多核苷酸编辑方法或施用了本发明中所述的寡核苷酸探针对或本发明中用于靶多核苷酸编辑的系统或本发明中用于靶多核苷酸编辑的试剂盒。
在某个实施例中,所述的疾病选自遗传相关疾病或非遗传相关疾病,优选所述的遗传相关疾病选自癌症、自身免疫疾病、糖尿病、血液病、心脏病、抑郁症、阿尔茨海默病、哮喘和神经疾病中的任一种。
发明的有益效果
本发明的有益效果在于所建立一种基因组编辑方法,针对目标靶基因,通过设计一对DNA寡核苷酸单链,使其与目标基因的正义和反义链分别互补,分别产生能够被一类识别目标序列结构并具有切割活性的核酸酶识别的结构,通过所述的核酸酶切割目标基因组DNA,最终切除大片段DNA,实现对基因组目的序列的靶向切割并有益于目标蛋白功能的最大程度敲除。
SGN具有很多优势,首先在该系统中,可以较为容易地设计和合成的gDNA并根据需要调整其浓度;其次由SGN创建的大片段缺失突变的等位基因更可能产生无效的等位基因,而ZFN、TALEN、RGEN或新报道的NgAgo基因组编辑系统产生的突变是通过小的插入缺失造成的,该缺失仍然能够编码具有一些残留功能的截短蛋白质;另外在SGN系统中的gDNAs长度是可以调整的,以避免错误杂交。
附图说明
图1示出的是可用于体外实验的SGN编码序列和氨基酸序列的图。
图2示出的是pET28a(+)-SGN的质粒图谱图。
图3示出的是可用于体内斑马鱼显微注射中的携带有核定位信号的SGN编码序列和氨基酸序列(该蛋白质序列对应的编码序列是斑马鱼源化的密码子优化的)
图4示出的是携带有核定位信号的SGN编码序列和氨基酸序列(该蛋白质序列对应的编码序列是人源化的密码子优化的)
图5示出的是关于SGN能否切割靶DNA的体内和体外策略图。左图是体外实验,靶DNA用Cy5基团标记修饰。设计互补于靶DNA的gDNA,其3'末端有未配对的核苷酸以形成3'-Flap结构。SGN识别3'-Flap结构并切割靶DNA。切割的产物通过变性聚丙烯酰胺凝胶电泳(变性的-PAGE)和荧光成像进行分析。右图是使用的Tg(flk:eGFP)转基因斑马鱼或野生型斑马鱼胚胎研究SGN在体内的活性。设计一对gDNAs,其与靶转基因GFP或内源性基因的互补,且gDNA的3'末端有未配对的核苷酸以形成3'-Flap结构。将SGN的mRNA(含有细胞核定位信号编码序列)和一对识别目标基因的gDNAs显微注射入斑马鱼胚胎。所表达的SGN会识别3'-Flap结构并切割体内靶DNA。基因组DNA被消化并通过DNA修复途径被修复。为了检验该DNA编辑过程,进一步从斑马鱼胚胎中提取基因组DNA,然后进行GFP或内源性基因的目的序列的PCR扩增、克隆和测序,分析由SGN引起的突变。
图6示出的是关于SGN体外切割单链DNA的图。变性-PAGE示出由SGN切割产生的DNA产物。a-c:不同的单链靶DNA(S-1,S-2和S-3)与不同gDNA(gDNA-1、gDNA-2和gDNA-3)进行反应。泳道1:S加SGN;泳道2:S加gDNA;泳道3:S加gDNA和Fok I;泳道4:S加gDNA和FEN-1;泳道5:S加gDNA和SGN。NC:无酶对照组。泳道M:DNA标准品。序列图下的箭头示意的是根据切割产物大小的可能切割位点。
图7示出的是不同的未配对的3'核苷酸对SGN导致的DNA切割的效果。示意图(顶部)示出的是在单链DNA靶序列上gDNA的未配对3'核苷酸。实线箭头指示根据切割产物大小推测的可能切割位点。变性-PAGE结果(下部)显示了由SGN酶切的清晰切割产物,且在不同非配对类型的效率之间没有明显差异。(a)gDNA-1、gDNA-1-G、gDNA-1-T靶向S-1ssDNA;(b)gDNA-3、gDNA-3-G、gDNA-3-A靶向S-3ssDNA;(c)gDNA-4、gDNA-4-A、gDNA-4-T靶向S-4ssDNA;和(d)gDNA-5、gDNA-5-T、gDNA-5-G靶向S-5的ssDNA。
图8示出的是引导DNA(gDNA)的长度影响SGN切割DNA的图。序列下的实线箭头示意的是根据切割产物大小的可能切割位点,虚线箭头表示理论切割位点。变性-PAGE结果显示SGN切割后的产物。(a)gDNA-6-10nt、gDNA-6-15nt、gDNA-6-20nt、gDNA-6-25nt、gDNA-6-30nt、gDNA-6-35nt、gDNA-6-40nt、gDNA-6-45nt、gDNA-6-50nt、gDNA-6-55nt和gDNA-6-60nt分别靶向S-6ssDNA;(b)gDNA-7-10nt、gDNA-7-15nt、gDNA-7-20nt、gDNA-7-25nt、gDNA-7-30nt、gDNA-7-35nt、gDNA-7-40nt、gDNA-7-45nt、gDNA-7-50nt、gDNA-7-55nt和gDNA-7-60nt分别靶向S-7ssDNA。
图9示出的是关于SGN以二聚体形式发挥作用的实验结果图。DNA切割率和各种SGN浓度之间的关系。用各种浓度的SGN(0、0.127、0.25、0.37、0.50、0.62、1.00、2.00nM)切割固定浓度100nM的S-8。以切割速率(用单位之间t内产物P的产生确定)和对应的SGN浓度作图。图中进入平台期前的黑色实线方程式是y=2.9684x1.9255(y=速率,x=SGN浓度),黑色的圆点表示各个SGN浓度下的平均速率。
图10示出的是关于确定SGN切割位点的图。(a)确定切割位点方法的示意图。小圆代表生物素。大圆代表链霉亲和素磁珠。生物素连接的线代表靶DNA,gDNA中黑色部分代表gDNA的3'末端的错配碱基。(b)I为信号强度。图中显示“GGAAGTGAC”的测序信号。S-1(上)测序鉴定的切割位点为实线箭头所示。(c)图中显示“GCCCTTC”的测序信号。S-2(上)测序鉴定的切割位点为实线箭头所示。
图11示出的是体外SGN切割双链DNA的图。变性-PAGE凝胶显示由一对gDNA引导SGN切割的产物(标识*所示)。不同的靶dsDNAs(S-1/S-9(a)、S-3/S-10(b)、S-5/S-11(c))与由不同的引导DNAs(gDNA1/gDNA9(a)、gDNA3/gDNA10(b)、gDNA5/gDNA11(c))引导的SGN分别反应。泳道1:S加SGN和gDNAs;泳道2:S加SGN;泳道3:S加gDNAs;泳道M:DNA链。*:指示切割产物。
图12示出的是关于SGN编辑斑马鱼基因组内目标基因的图。箭头指示的是大片段缺失发生的位置。(a)上图示出靶向转基因斑马鱼报告基因GFP的gDNAs所在位置。下图显示的是突变分子#5-15(表2)的部分测序峰图。(b)上图示出靶向目标内源性znf703基因的gDNAs所在位置。下图显示的是被编辑形成的突变分子的部分测序峰图,其中754bp和其后的11bp被缺失。(c)上图示出靶向目标内源性cyp26b1基因的gDNAs所在位置。下图显示的是被编辑形成的突变分子的部分测序峰图,其中2610bp被缺失。
图13 SGN编辑内源性基因形成大片段缺失的假设机制。一个gDNA杂交到斑马鱼或人的基因组DNA的单链,以形成3'-Flap结构;与单链人工靶DNA的切割机理相同,SGN结合至识别位点后切割斑马鱼基因组DNA的单链;斑马鱼基因组DNA单链被切割后形成切刻或切口(nick)结构并被SGN识别;一旦SGN分子结合到切刻结构,斑马鱼基因组DNA会被连续地切割成另一个新的具有切刻结构的切割产物。这意味着一旦切割开始时,它会一直重复;被破坏的基因组DNA在体内最终通过DNA修复途径修复从而形成突变分子。
图14示出的是关于SGN切割具有缺刻结构的双链DNA形成大的缺失片段。a:dsDNA片段示意图。切刻内切酶Nt.BstNBI的识别位点用灰色标识,切割位点用箭头表示。b:SGN切割产物用2%琼脂糖凝胶分离。泳道1:没有SGN的缺刻dsDNA片段;泳道2:有SGN的缺刻dsDNA片段;泳道M:DL-500marker(500,400,300,200,150,100and 50bp);泳道3:没有SGN的dsDNA片段;泳道4:有SGN的dsDNA片段。*:指示大片段缺失的双链DNA。
具体实施方式
下面通过具体实施方式及实验数据对本发明作进一步的说明。尽管为了清楚的目的,在下文中使用了专用术语,但这些术语并不意味着定义或限制本发明的范围。
如本文中所使用,术语“多核苷酸”指代是核苷酸聚合成的链状化合物。
如本文中所使用,术语“靶多核苷酸”是指,任何一段欲加以改造或修复的目标核苷酸聚合成的链状化合物。靶多核苷酸附近的基因序列,允许外源序列在靶点处的整合,包括但不限于基因敲除(knock-out)、基因敲入(knock-in)。在具体实施方式中,靶多核苷酸是双链的DNA序列,包括,但不限于,细胞的染色体基因组中的DNA序列、细胞染色体基因组外的DNA序列(例如线粒体基因组)、质粒、病毒等的DNA序列。
“靶多核苷酸编辑”在某些具体实施例中指代是基因组编辑,包括由于核酸内切酶对靶基因的靶向切割导致细胞启动DNA损伤修复机制使得在没有外源供体DNA存在的情况下出现的靶基因的插入缺失突变,以及在外源供体存在的情况下外源供体靶向插入基因的基因组修饰。
“对靶多核苷酸特异”是指与靶多核苷酸结合,包括但不限于结合可以存在一定的错配率。
如本文中所使用,术语“寡核苷酸”指代是是一类只有60个以下碱基的短链核苷酸的总称(包括脱氧核糖核酸DNA或核糖核酸RNA内的核苷酸)。
如本文中所使用,术语“目标序列”指代是靶序列,在具体实施例中目标基因组和靶基因组是相同含义;类似地,在一些具体实施例中目标DNA和靶DNA是相同含义,其中在一些具体实施例中使用的底物DNA也指代靶DNA。
如本文中所使用,术语“核酸酶”指代是作用于水解核苷酸之间的磷酸二酯键的一种蛋白质。
引导DNA(guide DNA):指代是寡脱氧核糖核酸单链,亦被称作寡核苷酸探针,其中5'序列对靶多核苷酸链特异,3'端有至少1个核苷酸不与靶多核苷酸单链互补,或错配。
如本文中所使用,术语“3'-Flap结构”也称为“3'侧翼结构”,指代是由于引导DNA(gDNA)5'端与靶多核苷酸互补形成双链但3'端不与靶多核苷酸单链互补而在错配位置形成的一种特殊DNA结构。
下述实施例中的实验方法,如无特殊说明,均为常规方法。
具体实施例:
实施例1 重组结构识别核酸内切酶的构建和的表达
本发明中构建了重组结构识别核酸内切酶(Structure-guided endonuclease,SGN),该内切酶由识别3'-Flap结构的FEN-1和切割DNA链的Fok I(Fn1)切割结构域组成。其中,该序列由以下基因编码:C端是Fok I(196个氨基酸残基),中间连接是甘氨酸-丝氨酸重复序列,和FEN-1酶。将该序列插入原核表达载体pET28a(+)中,以形成pET28a(+)-SGN。SGN的编码序列和氨基酸序列见图1、图3-4中示出,pET28a(+)-SGN的质粒图谱见图2中示出。在pET28a(+)-SGN构建体中,SGN基因位于T7启动子的下游。
pET28a(+)-SGN用CaCl2热休克的方法转化到宿主细菌菌株Arctic Express中。首先,将细胞在37℃培养,然后在27℃环境下用IPTG(0.1mM)诱导16小时,进而表达SGN。收集经诱导细胞,用超声裂解并离心。将粗提取物用镍(Ni)亲和色谱柱纯化SGN。超速离心浓缩SGN,并用12%的十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)进行确认。获得的纯化SGN(序列见图1,其中氨基酸序列为SEQ ID No:1,核酸序列为SEQ ID No:3)用于实例中的体外实验。
申请人早先假设,一旦目标序列被FEN-1识别,SGN的Fn1结构域应能切割DNA链。用于验证SGN能否切割靶DNA的体内和体外策略见图5。在体外(图5,左图),靶DNA用Cy5基团标记修饰。设计互补于靶DNA的gDNA,其3'末端有未配对的核苷酸以形成3'-Flap结构。SGN(图1)识别3'-Flap结构并切割靶DNA。切割的产物通过变性聚丙烯酰胺凝胶电泳(变性的-PAGE)和荧光成像进行分析。
然后,使用的Tg(flk:eGFP)斑马鱼胚胎研究SGN在体内的活性(图5,右图)。设计一对gDNAs,其与靶基因GFP正反义链分别互补,且gDNA的3'末端有未配对的核苷酸以形成3'-Flap结构。将SGN的mRNA(含有细胞核定位信号编码序列,图3,其中核酸序列为SEQ ID No:4,氨基酸序列为核酸序列为SEQ ID No:2)和一对识别目标基因的gDNAs显微注射入斑马鱼胚胎。所表达的SGN会识别3'-Flap结构并切割体内靶DNA。基因组DNA被消化并通过DNA修复途径被修复。为了检验该DNA编辑过程,我们从斑马鱼胚胎中提取基因组DNA,然后进行GFP目的序列的PCR扩增、克隆和测序,分析由SGN引起的突变。也可以采用上述类似实验方法进行野生型斑马鱼胚胎内源基因的突变。
在进行人类细胞实验时,我们将有真核生物启动子驱动的SGN(含核定位信号,图4,核酸序列为SEQ ID No:5,氨基酸序列为核酸序列为SEQ ID No:2)表达质粒和一对识别目标基因的gDNAs转染人的细胞系。所表达的SGN会识别3'-Flap结构并切割体内靶DNA。基因组DNA被消化并通过DNA修复途径被修复。为了检验该DNA编辑过程,我们从人细胞系中提取基因组DNA,然后对目标基因组序列进行PCR扩增、克隆和测序,分析由SGN引起的突变。
实施例2 SGN体外切割单链DNA
为了测试设计SGN是否可以切割DNA链,我们将1ng SGN、10pmol底物单链DNA(ssDNA)(S-1)和10pmol gDNA-1在10-μL的反应体系中进行孵育(所有的ssDNA和DNA寡核苷酸gDNA的序列示于表1),10-μL的反应体系中还包括MOPS(10mM)、0.05%Tween-20、0.01%nonidet P-40和MgCl2(7.5mM)。其中,用荧光Cy5基团在S-1的5'末端进行标记。且在SGN加入之前,先将混合物在95℃下孵育5分钟,55℃下孵育10分钟。然后再加入SGN,37℃反应2小时。
所述的gDNA-1与S-1形成3'-Flap结构。将SGN加入到该混合物中进行反应,然后将混合物通过变性的-PAGE分离并通过荧光成像。具体步骤为,将反应得到的产物在变性条件下用PAGE进行分析。上样缓冲液含有90%甲酰胺、0.5%EDTA,0.1%二甲苯蓝,和0.1%溴酚蓝。上样前,将样品(20μL)孵育在沸水5分钟,然后在冰上冷却。然后将样品在室温上样到20%PAGE凝胶上,并在包含有尿素(8.7M)和Tris-硼酸盐(89mM)的缓冲液中运行。电泳在9.6V/cm运行2小时。电泳后,将凝胶浸渍在10%乙醇固定20分钟。凝胶由Tanon5200多荧光成像仪成像(上海,中国)。
理论上,只有经标记的目标链(完整)和5'端用荧光染料Cy5标记的S-1的切割产物应被明显检测到。如图6a的泳道5,通过gDNA-1导向作用,SGN切割底物S-1,产生较小分子量的条带,图中用“切割产物”表示。而仅含有S-1加SGN(图6a的泳道1)、S-1加gDNA-1(图6a的泳道2)、S-1加Fok I和gDNA-1(图6a的泳道3)、或S加FEN-1和gDNA-1(图6a的泳道4)的反应中没有发生切割现象。该结果表明,SGN可以识别3'-Flap结构并切割的目的序列DNA链。
表1.DNA寡核苷酸模板、gDNA和PCR引物的序列
实施例3 SGN切割活性不依赖于目标序列
为证明SGN是否有DNA序列的偏好性,采用具有不同序列的ssDNAs(S-2、S-3,序列见表1)作为SGN的底物进行反应。10-μL的反应体系和条件同前述以S-1为底物的反应。
结果表明,当通过gDNA-2或gDNA-3引导下,SGN可分别将S-2或S-3切割(见图6b和图6c的泳道5)。而仅含有S加SGN(图6b和图6c的泳道1)、S加gDNA(图6b和图6c的泳道2)、S加Fok I和gDNA(图6b和图6c的泳道3)、或S加FEN-1和gDNA(图6b和图6c的泳道4)的反应中没有发生切割现象。该结果表明,SGN切割活性不依赖于目标序列但识别3'-Flap结构。
为了证明gDNA中未配对3'核苷酸的重要性,本发明中测试了所有类型的非配对3'核苷酸,包括C-T、G-T、T-T、C-A、G-A、A-A、C-C和G-G。如图7所示,不同非配对类型之间的效率没有明显的差异。先前报道中(Kaiser MW,et al.J Biol Chem.1999,274:21387-21394.),古细菌FEN-1酶中所有四个天然碱基有大致相同的效率。本发明的结果与这一发现是一致的。然后,申请人测试了多个序列来揭示gDNA长度对切割效率的重要性,gDNA长度包括10、15、20、25、30、35、40、45、50、55、60个核苷酸(nt)。如图8所示,当gDNAs的长度超过20-nt时,SGN可以切割目标DNA。但当gDNAs的长度为10-nt或15-nt时,目标DNA没有发生裂解。根据对Fok I的结构的研究报道(Wah DA,et al.Proc Natl Acad Sci U S A 1998,95:10564-10569.),当Fok I与DNA结合时,切割结构域会结合在距离识别位点13bp的位置。这一结果表明,该蛋白需要底物DNA上有足够的构象空间进行折叠和反应。然而,如在图6上部中灰色箭头所示的,当gDNAs的长度为10-nt的或15-nt的,理论上的切割位点过于接近目标DNA的3'末端,在蛋白质折叠过程中所需的构象或许没有足够的空间。
实施例4 距离非配对3'末端核苷酸9-10nt处是SGN切割活性位点
已证明活性的Fok I是以二聚体形式发挥作用(Wah DA,et al.Proc Natl AcadSci U S A 1998,95:10564-10569.)。为了研究是否SGN也是以二聚体形式工作,申请人用SGN对DNA切割,进行动力学实验。实验前,标记底物S-8,方法为在5'端标记荧光染料FAM和在3'端加猝灭剂,然后与SGN和gDNA-8共同孵育。通过绘制相对于各种浓度SGN的速率(图9),发现当使用0.62nM SGN后反应速度达到平台期。但使用小于0.62nM SGN的速率/SGN浓度曲线方程式是y=2.9684x1.9255(y=速率,x=SGN浓度),其中R平方为0.9866。这些结果证明了反应初始速度与酶浓度并不成正比,从而表明了SGN-催化反应不是相对于SGN的浓度的一阶反应,这也暗示SGN是以二聚体发挥作用的。此外,SGN是负责识别的3'-Flap结构的FEN-1以及负责DNA切割的Fok I切割结构域(Fn1)二者的融合蛋白。如先前报道(Wah DA,etal.Proc Natl Acad Sci U S A 1998,95:10564-10569.),Fok I通过其切割结构域介导的二聚体切割靶DNA。Fok I工作模型中(Wah DA,et al.Proc Natl Acad Sci U S A 1998,95:10564-10569.),Fok I分子结合在识别位点并招募另一个Fok I分子,它通过Fn1域提供第二催化中心。第一Fok I分子的Fn1在结合特定DNA后被激活,摆动成为一个二聚体开放构象,然后切割。因此,申请人推断,SGN的二聚化是通过Fn1介导的。
为确定由SGN产生的切割位点的位置,申请人使用焦磷酸测序(Zhou G,etal.Anal Chem.2006,78:4482-4489.)对切割的链进行测序(图10a)。
使用便携式生物发光分析仪(日立有限公司,日本)进行焦磷酸测序(Zhou G,etal.Anal Chem.2006,78:4482-4489.)。用链霉亲和素包被的琼脂糖珠收集生物素化的反应产物。待沉淀和洗涤后,将纯化的dsDNAs在碱缓冲液中变性,得到ssDNAs。然后将固定化的生物素化的链与测序引物在90℃的条件下退火5分钟。55℃反应10分钟,作为测序模板。焦磷酸测序混合物含有Tris-HAC(0.1M,pH 7.7)、EDTA(2mM)、Mg(Ac)2(10mM)、0.1%BSA、DTT(1mM)、APS(2mM)、PVP(0.4g/L)、D-luciferin(0.4mM)、apyrase-Ⅶ(1.6U/mL)、外切Klenow片段(18U/mL)和萤火虫荧光素酶(1mM)。
靶序列(S-1和S-2)在5'末端用生物素修饰。底物DNAs与SGN孵育后,链霉素包被的琼脂糖珠被用于捕获生物素化的反应产物。然后将固定的生物素化的链与它的gDNA在85℃下退火5分钟,25℃下进行10分钟,然后用作测序模板。非配对的3'核苷酸不会发生延伸。因此,测序信号出现在切割位点(图10a)。如图10b所示,焦磷酸测序信号是GGAAGTGAC。结果表明,由SGN介导的S-1切割位点位于距离gDNA-6-20nt的3'末端核苷酸9nt的位置。针对S-2(图10c)的类似焦磷酸测序中,发现焦磷酸测序信号是GCCCTTC。由SGN介导的S-2切割位点位于距离gDNA-6-20nt的3'末端核苷酸10nt的位置。因此,该结果表明在切割位点距离gDNAs的3'端有9-10个核苷酸的间隔。
实施例5 SGN体外部分切割双链DNA(dsDNA)
既然SGN能够切割单链DNA且不依赖靶序列,而依赖由gDNA形成的3'-Flap的方式,因此SGN可具备在体外酶切双链DNA的能力。为证明SGN是否可以切割DNA,申请人进行了三个靶dsDNA的检测。
首先分别孵育包含5pmol S-1/S-9(S-1的互补链)或S-3/S-10(S-3的互补链)或S-5/S-11(S-5的互补链)的混合物以形成dsDNA,条件为95℃3分钟,然后从94℃1分钟开始以1℃/分钟的速率冷却到22℃保持1分钟。在这个过程中,互补链可以相互杂交,然后分别添加5pmol gDNA-1/gDNA-9或gDNA-3/gDNA-10或gDNA-5/gDNA-11,和10mM MOPS、0.05%Tween-20、0.01%nonidet P-40和7.5mM MgCl2至混合物中,37℃孵育10分钟。最后加入1ng SGN37℃孵育2小时。
结果如图11a、b、c中泳道1所示,在包含SGN、一对gDNAs和DNA底物(S)的反应中,观察到更小分子量的条带,用“*”标记。但在只包含S和SGN(11a、b、c中泳道2)或只包含S和gDNA(11a、b、c中泳道3)的反应中,没有发生切割。这些结果说明了由一对gDNAs引导的SGN可以在体外部分切割dsDNA。
实施例6 SGN体内对基因组DNA的编辑
为确定SGN是否具有基因组编辑的活性,申请人将1-nL含有200pg的SGN mRNA(含有核定位信号编码序列,图3)和一对gDNAs(各50pg,序列见表1)的溶液通过显微注射入1-细胞期的Tg(flk1:EGFP)斑马鱼胚胎。在转基因斑马鱼的基因组中编码GFP的双链DNA的正义链和反义链上,gDNAs被间隔放置分别形成3'-Flap结构(图12a,顶部)。
突变的GFP分子用如之前文献所述的方法检测(Dong Z et al.PLoS One 2011,6:e28897.)。简言之,根据说明书(南京尧顺禹,中国)的步骤,用10μL的B液孵育斑马鱼胚胎,之后从随机挑选的5个胚胎中制备斑马鱼基因组DNA模板(65℃反应30分钟,95℃反应10分钟,16℃反应1分钟)。然后将1.0μL裂解溶液作为模板,用引物GFP F1和GFP R1(表1)在20μL的PCR混合物体系中扩增GFP分子。PCR程序为:94℃2分钟,35个循环(94℃30秒,60℃30秒,72℃30秒),72℃进行10分钟。扩增子在pGEM-T中(Promega公司,USA)进行克隆。然后,随机选择48个阳性转化子,采用引物GFP F2和GFP R2(表1)以上面所述的方法进行PCR鉴定。接着,对阳性转化子中靶分子进行测序,以确定突变。
结果发现,当gDNA间隔0、8、18、32或50个bp,对从显微注射了gDNAs与SGN mRNA的斑马鱼胚胎中扩增出的基因组靶序列进行测序分析,分别揭示了2/48、0/47、3/46、18/44、12/47的突变比率(表2,表3)。结果表明,基因组中,SGN偏好于识别以32-50bp的间隔序列放置的gDNAs。
另一方面,用znf703和cyp26b1基因作为靶基因以验证SGN是否可以像ZFN或TALEN那样编辑内源基因。申请人分别向1-细胞期斑马鱼胚胎中显微注射了1-nL含有200pg的SGNmRNA(含有核定位信号编码序列)和一对gDNAs(各50pg,序列见表1)的溶液。用上述相似方法对突变的znf703和cyp26b1基因进行检测。简言之,1.0μL来自于5个胚胎的裂解溶液作为模板,分别用引物znf703F1和znf703R1、cyp26b1F和cyp26b1R(表1)在20μL的PCR混合物体系中扩增znf703和cyp26b1分子。PCR程序为:95℃3分钟,30个循环(95℃15秒,60℃15秒,72℃1分钟30秒),72℃进行10分钟。为增加cyp26b1扩增的特异性,采用了引物cyp26b1Fin和cyp26b1Rin(表1)进行了巢式PCR。znf703扩增子和cyp26b1巢式PCR的扩增子分别在pGEM-T中(Promega公司,USA)进行克隆。然后,随机选择96个转化子,采用T7和Sp6引物对(表1)进行PCR(94℃2min,30个循环(94℃30秒,54℃30秒,72℃3分钟10秒),72秒10分钟)。PCR产物稀释10倍后,分别用引物znf703 F和znf703 R、cyp26b1 Fin和cyp26b1 Rin(表1)再进行PCR检测,确定插入的片段是否来源于靶基因的突变等位基因。最后对阳性转化子靶分子进行测序鉴定突变基因型。
针对自znf703基因扩增出的等位基因片段的测序分析显示,gDNA-znf703-F和gDNA-znf703-R50引导下的SGN诱发了比例为1/96的等位基因突变(图12b、表2、表4)。发生基因组编辑的突变分子中754个核苷酸被移除,另外11个核苷酸也被删除(图12b,底部)。针对自cyp26b1基因扩增出的等位基因片段的测序分析表明,由gDNA-cyp26b1-F和gDNA-cyp26b1-R32引导的SGN引发了比例为3/29的突变(图12c、表2、表5),发生基因组编辑的突变分子中伴随有2610个核苷酸大片段缺失突变(图12c,底部)。结果表明,SGN可以以低效率编辑斑马鱼基因组的内源基因。
表2.斑马鱼基因组中的目标基因经SGN编辑后形成的突变等位基因
发生基因靶向突变的比率:#1(2/48)、#2(0/47)、#3(3/46);、#4(18/44)、#5(12/47);、#6(1/96)和#7(3/29)。
表3.eGFP(720bp)编码序列和突变序列
表4.znf703野生序列和经SGN编辑后形成的突变序列
表5cyp26b1野生序列和经SGN编辑后形成的突变序列
实施例7 SGN在细胞系对人类基因组的编辑
为测试SGN是否可对人基因组进行编辑,申请人利用完全培养基(包含高糖DMEM(Hyclone)、10%FBS(Hyclone)和各100U/mL的青霉素和链霉素(Hyclone))培养人293T细胞。将细胞均匀地培养在6孔板中,每孔2mL完全培养基。待细胞密度长至90%左右时进行细胞转染。首先,将1μg人密码子优化的SGN表达载体(pW1-SGN)、各500ng的识别人MEIS2基因gDNA(gDNA-MEIS2-F、gDNA-MEIS2-R,间隔32bp序列,表1),与250μL Opti-MEM(Gibco)培养基混匀室温放置5分钟。同时将10μL Lipo2000(Invitrogen)与250μL Opti-MEM(Gibco)培养基混匀室温放置5分钟。将转染载体与转染试剂共500μL混匀室温放置15分钟后,均匀添加到1个6孔板的孔中。转染后6小时,换液一次。转染后48小时,收集细胞,用与前述制备斑马鱼胚胎基因组DNA模板相同的试剂盒(南京尧顺禹,中国)制备细胞基因组DNA模板,使用引物对(MEIS2-F、MEIS2-R,表1)针对目标基因进行PCR扩增。PCR反应条件为95℃ 2分钟,30×(95℃1分钟,58℃ 1分钟,72℃ 45秒),最后72℃延伸10分钟。扩增完成后,按前述相同方法将扩增产物重组入pGEM-T载体(Promega,美国),转化产物涂板后第二天,每个平板挑选96个转化子,按前述同样方法进行PCR扩增,以鉴定插入产物是否含被编辑的基因组片段。将PCR产物条带大小明显小于野生型基因组片段的转化子送商业公司测序,结果有1/96的转化子发生了大片段缺失(表6)。
表6人MEIS2野生序列和经SGN编辑后形成的突变等位基因序列
实施例8 SGN在体内基因组编辑中的机制
已知通过ZFN、TALEN和RGEN创建的主要突变是引入小的缺失,但SGN却产生的是大片段的缺失。这里,申请人尝试说明这些大片段的缺失所依据的机制。如图13所示,1)一个gDNA杂交到斑马鱼或人的基因组DNA的单链,以形成3'-Flap结构;2)与单链人工靶DNA的切割机理相同,SGN结合至识别位点后切割斑马鱼基因组DNA的单链;3)斑马鱼或人基因组DNA单链被切割后形成有缺刻的结构;4)据报道(Hosfield DJ,et al.J Biol Chem.1998,273:27154-27161.),FEN-1识别缺刻结构。因为SGN由FEN-1和Fn1组成,申请人认为,SGN可以识别一个带切刻的结构;5)一种SGN分子结合至该带切刻的结构并切割的基因组DNA的单链。切割的产物还具有带切刻的结构。这意味着一旦切割开始时,它会一直重复;和6)被破坏的基因组DNA在体内通过DNA修复途径修复从而形成突变分子。
为了验证提出的机理的可能性,申请人测试了缺刻dsDNA作为底物的反应。首先,将50μL含有dsDNA(1μg)、10×NEB缓冲液3(5μL)和1μL Nt.BstNBI(New England Biolabs,英国)的混合物在37℃孵育3小时。之后,将10μL含有纯化的缺刻dsDNA(50ng,来自第一步骤)、MOPS(10mM)、0.05%Tween-20、0.01%nonidet P-40、MgCl2(7.5mM)和SGN(1ng)的混合物在37℃孵育2小时。最后,从第二步骤获得的切割产物用2%琼脂糖凝胶电泳进行分析。
用缺刻核酸内切酶消化400bp长的dsDNA形成单个链上均有切刻(图14a),其中缺刻核酸内切酶使用的是Nt.BstNBI,该酶的识别为点是“GAGTC”并切割后续4个碱基。如图14b的泳道2中所示,缺刻dsDNA和SGN共孵育的反应中,可以观察到小分子量的产物条带,相反,包含缺刻dsDNA但不包含SGN的反应(泳道1)中,没有观察到该结果。相似地,包含dsDNA但不包含SGN的反应(泳道3)中,包含dsDNA但包含SGN的反应(泳道4)中,均没有观察到小分子量的产物条带。
这些提供了一些初步的证明以支持我们猜测的大片段缺失机制。但是,更深入的机制需要一些可能的结构修饰以提高SGN系统的精度和效率来进一步揭示。
讨论:
在这里,我们设计了一种结构导向核酸酶,在靶DNA和gDNA之间形成的3'-Flap结构的基础上,该酶可以识别靶DNA,并通过Fn1二聚体切割靶基因。目前可用的核酸内切酶表现出对序列的偏好。而本申请中,采用结构导向方式识别和捕获靶DNA,可以设计出满足任何靶DNA适合的gDNAs,并使用SGN切割靶DNA。在该系统中,可以较为容易地设计和合成gDNA并调整其浓度,而在RGEN系统中设计gRNA相对较为困难。日前,关于NgAgo基因组编辑系统一项最新研究(Gao F,et al.Nat Biotechnol 2016.)也说明DNA引导的优势。此外,区别于ZFN、TALEN、RGEN或新报道的NgAgo基因组编辑系统产生的突变是通过小插入缺失造成的,SGN系统可以在斑马鱼基因组和人基因组中产生大片段缺失,因为在突变基因中一个小的插入缺失仍然能够编码具有一些残留功能的截短蛋白质,由ZFN、TALEN、RGEN或NgAgo诱导的小片段插入缺失突变等位基因并不总是无效的等位基因或敲除的等位基因。与此相反,由SGN创建的大片段缺失突变的等位基因更可能产生无效的等位基因。
SGN的基因组DNA编辑应用中还有些问题需要进一步研究得到解决。目前,SGN系统的效率不高,因此,我们没有从cyp26b1和znf703基因实验中观察到脱靶的情况。但根据SGN的工作机制,如果引导DNA(gDNA)与基因组DNA产生错误杂交,那会有脱靶现象。幸运的是,相比NgAgo中引导DNA只能是23nt、24nt、或25nt的情况,在SGN系统中的gDNAs长度是可以调整的,以避免错误杂交。其他潜在的问题是FEN-1可以针对某些天然存在的DNA的结构,它或许不仅会导致脱靶效应,而且还有细胞毒性。但事实上,申请人并没有在斑马鱼实验中观察到特定的细胞死亡现象。此外,与典型双链相比,产生dsDNAs中特定结构的挑战也是不容忽视的。目前本发明中方法的效率受限于gDNA和基因组中正确位点之间的相互作用,形成一个3'-Flap结构。其他策略,例如使用PNA或LNA探针作为引导DNA和可能的SGN结构修饰,应该可被用来改善和提高SGN的切割效率。
结论:
总之,在本发明中,申请人构建了由识别3'-Flap结构的FEN-1和切割DNA链的FokI(Fn1)切割结构域所组成的结构指导的内切酶(Structure-guided endonuclease,SGN)。基于靶序列和人工引导DNA(guide DNA,gDNA)形成的3'-Flap结构,SGN可以识别靶DNA,并通过其Fn1二聚体切割靶点。实验结果表明,SGN可体外切割靶DNA。另外使用斑马鱼胚胎和人细胞系作为孵育体系,本发明证明了SGN可编辑内源基因。通过结构引导识别,任何期望的靶DNA都可被构建的核酸内切酶SGN所切割,而不需要改变核酸内切酶或其多肽单元(如II型REases、ZFN和TALEN),或不受RNA分子使用的限制(如RGEN中)。它可以成为DNA编辑有用的替代工具。
以上,基于本发明的实施方式进行了说明,但本发明不限定于此,本领域的技术人员应该明白,在本发明的主旨的范围内能够以进行变形和变更的方式实施,这样的变形和变更的方式,理应属于本发明的保护范围。
Claims (23)
1.一种靶多核苷酸编辑方法,其特征在于:设计一对寡核苷酸探针,使其与靶多核苷酸的正义链和反义链分别结合,分别产生能够被核酸酶识别的目标序列结构,所述核酸酶切割靶多核苷酸,实现对靶多核苷酸的编辑。
2.如权利要求1所述的方法,其中,所述靶多核苷酸是RNA或DNA,优选基因组DNA,优选所述的基因组是斑马鱼基因组、哺乳动物基因组、人类基因组、或植物基因组。
3.如权利要求1或2所述的方法,其中,所述一对寡核苷酸探针是DNA,优选所述一对寡核苷酸探针与靶多核苷酸的结合位点间隔0-100bp,优选间隔为10-70bp、20-60bp、32-50bp或40bp。
4.如权利要求1至3任一项所述的方法,其中,所述寡核苷酸探针的长度为20nt以上,优选长度为20-50nt或25nt。
5.如权利要求1至4任一项所述的方法,其中,所述的目标序列结构为5'突出核酸结构、3'突出核酸结构、切刻核酸结构、侵入核酸结构、三链核酸结构、Y型核酸结构、3'-Flap结构以及由错配或缺失核酸引起的鼓泡核酸结构中的至少一种的识别功能域,优选3'-Flap结构,DNA寡核苷酸单链的3'-末端不与目标基因组DNA互补。
6.如权利要求5所述的方法,其中,所述寡核苷酸探针的5'端对靶多核苷酸特异,优选与靶多核苷酸互补;寡核苷酸探针的3'端不与靶多核苷酸互补,优选3'末端1个以上、1-20个、1-10个、1-5个、1-4个、1-3个、2个或1个碱基不与靶多核苷酸互补。
7.如权利要求1至6任一项所述的方法,其中,所述的核酸酶是重组结构识别核酸内切酶(SGN),包含结构识别功能域、DNA切割功能域和连接二者的肽段;所述的结构识别功能域为能够识别结构为5'突出核酸结构、3'突出核酸结构、切刻核酸结构、侵入核酸结构、三链核酸结构、Y型核酸结构、3'-Flap结构以及由错配或缺失核酸引起的鼓泡核酸结构中的至少一种的识别功能域,优选选自TaqPol、TthPol、TaqExo、AfuFEN、PfuFEN、MjaFEN、MthFEN、E.coliMuts、Tthmuts和Taqmuts组成的组中任意一种酶的识别功能域或全酶片段;所述的切割功能域为IIS型核酸内切酶的切割功能域,优选Fok I的部分或全部肽段;所述的切割功能域还可选自TaqPol、TthPol、TaqExo、AfuFEN、PfuFEN、MjaFEN、MthFEN、E.coliMuts、Tthmuts和Taqmuts组成的组中任意一种酶的全酶片段的核酸内切酶结构域;所述的连接肽段为不影响结构识别与酶切功能的柔性肽段,优选甘氨酸或丝氨酸或其组合的串联组合。
8.如权利要求7所述的方法,其中,所述的重组结构识别核酸内切酶含有核定位信号。
9.如权利要求7或8所述的方法,其中,所述的重组结构识别核酸内切酶的氨基酸序列选自SEQ ID No:1、SEQ ID No:2中任一个;所述重组结构识别核酸内切酶的核酸序列选自SEQ ID No:3、SEQ ID No:4、SEQ ID No:5中任一个。
10.权利要求1至9任一项所述的方法,其中,所述基因组DNA是内源DNA或整合到基因组的外源DNA,优选所述靶多核苷酸编辑方法是在体实施的。
11.一种寡核苷酸探针对,其特征在于该寡核苷酸探针对与靶多核苷酸的正义和反义链分别结合,分别产生能够被核酸酶识别的目标序列结构,所述目标序列结构能够被核酸酶识别,所述核酸酶切割靶多核苷酸,实现对靶多核苷酸的编辑。
12.如权利要求11所述的一种寡核苷酸探针对,其中,所述一对寡核苷酸探针是DNA,优选与靶多核苷酸的结合位点间隔0-100bp,优选间隔为10-70bp、20-60bp、32-50bp或40bp。
13.如权利要求11或12所述的一种寡核苷酸探针对,其中,所述寡核苷酸探针的长度为20nt以上,优选长度为20-50nt或25nt。
14.如权利要求1-13任一项所述的一种寡核苷酸探针对,其中,所述寡核苷酸探针的5'端对靶多核苷酸特异,优选与靶多核苷酸互补;寡核苷酸探针的3'端不与靶多核苷酸互补,优选3'末端1个以上、1-20个、1-10个、1-5个、1-4个、1-3个、2个或1个碱基不与靶多核苷酸互补。
15.用于靶多核苷酸编辑的系统,其特征在于所述系统包括权利要求1-14任一项中所述的寡核苷酸探针对,优选包括权利要求1-10任一项中所述的核酸酶。
16.用于靶多核苷酸编辑的试剂盒,其特征在于所述试剂盒包括权利要求1-14任一项中所述的寡核苷酸探针对,优选包括权利要求1-10任一项中所述的核酸酶。
17.一种在靶多核苷酸中切割大片段的方法,其特征在于采用了权利要求1-10任一项的靶多核苷酸编辑方法。
18.如权利要求17所述的方法,所述的大片段长度大于所述寡核苷酸探针对与靶多核苷酸的结合位点的间隔,优选所述的大片段长度大于所述间隔1-10000bp、1-3000bp、1-2000bp、1-1000bp、1-500bp、1-200bp或1-100bp。
19.一种疾病细胞模型的制作方法,其特征在于采用了权利要求1-10、17、18任一项的方法或施用了权利要求11-14任一项所述的寡核苷酸探针对或权利要求15所述的用于靶多核苷酸编辑的系统或权利要求16所述的用于靶多核苷酸编辑的试剂盒。
20.一种疾病动物模型的制作方法,其特征在于采用了权利要求1-10、17、18任一项的方法或施用了权利要求11-14任一项所述的寡核苷酸探针对或权利要求15所述的用于靶多核苷酸编辑的系统或权利要求16所述的用于靶多核苷酸编辑的试剂盒。
21.一种疾病治疗方法,其特征在于采用了权利要求1-10、17、18任一项的方法或施用了权利要求11-14任一项所述的寡核苷酸探针对或权利要求15所述的用于靶多核苷酸编辑的系统或权利要求16所述的用于靶多核苷酸编辑的试剂盒。
22.如权利要求21所述的疾病治疗方法,其中所述的疾病选自遗传相关疾病或非遗传相关疾病,优选所述的遗传相关疾病选自癌症、自身免疫疾病、糖尿病、血液病、心脏病、抑郁症、阿尔茨海默病、哮喘和神经疾病中的任一种。
23.一种植物突变体的制作方法,其特征在于采用了权利要求1-10、17、18任一项的方法或施用了权利要求11-14任一项所述的寡核苷酸探针对或权利要求15所述的用于靶多核苷酸编辑的系统或权利要求16所述的用于靶多核苷酸编辑的试剂盒。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610627960.XA CN107686842A (zh) | 2016-08-03 | 2016-08-03 | 一种靶多核苷酸编辑方法及其应用 |
PCT/CN2017/093903 WO2018024119A1 (zh) | 2016-08-03 | 2017-07-21 | 一种靶多核苷酸编辑方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610627960.XA CN107686842A (zh) | 2016-08-03 | 2016-08-03 | 一种靶多核苷酸编辑方法及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107686842A true CN107686842A (zh) | 2018-02-13 |
Family
ID=61073470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610627960.XA Pending CN107686842A (zh) | 2016-08-03 | 2016-08-03 | 一种靶多核苷酸编辑方法及其应用 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107686842A (zh) |
WO (1) | WO2018024119A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111172164A (zh) * | 2020-03-09 | 2020-05-19 | 中国药科大学 | 一种用于任意核酸编辑的组合物及方法 |
CN112639094A (zh) * | 2018-05-08 | 2021-04-09 | 深圳华大智造科技股份有限公司 | 用于准确且经济高效的测序、单体型分型和组装的基于单管珠粒的dna共条形码化 |
CN113913405A (zh) * | 2020-07-10 | 2022-01-11 | 中国科学院动物研究所 | 一种编辑核酸的系统及方法 |
CN113975398A (zh) * | 2021-11-09 | 2022-01-28 | 中国药科大学 | 一种用于治疗肝纤维化的药物递送载体组合物及其制备方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104745570A (zh) * | 2013-12-26 | 2015-07-01 | 周国华 | 一种对任意核酸实施靶向切割的方法 |
CN111172164A (zh) * | 2020-03-09 | 2020-05-19 | 中国药科大学 | 一种用于任意核酸编辑的组合物及方法 |
US20210324418A1 (en) * | 2018-11-21 | 2021-10-21 | Stridebio, Inc. | Recombinant viral vectors and nucleic acids for producing the same |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104531633A (zh) * | 2014-11-18 | 2015-04-22 | 李云英 | Cas9-scForkI融合蛋白及其应用 |
-
2016
- 2016-08-03 CN CN201610627960.XA patent/CN107686842A/zh active Pending
-
2017
- 2017-07-21 WO PCT/CN2017/093903 patent/WO2018024119A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104745570A (zh) * | 2013-12-26 | 2015-07-01 | 周国华 | 一种对任意核酸实施靶向切割的方法 |
US20210324418A1 (en) * | 2018-11-21 | 2021-10-21 | Stridebio, Inc. | Recombinant viral vectors and nucleic acids for producing the same |
CN111172164A (zh) * | 2020-03-09 | 2020-05-19 | 中国药科大学 | 一种用于任意核酸编辑的组合物及方法 |
Non-Patent Citations (1)
Title |
---|
SHU XU ET AL.,: "An alternative novel tool for DNA editing without target sequence limitation: the structure-guided nuclease", 《GENOME BIOL》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112639094A (zh) * | 2018-05-08 | 2021-04-09 | 深圳华大智造科技股份有限公司 | 用于准确且经济高效的测序、单体型分型和组装的基于单管珠粒的dna共条形码化 |
CN111172164A (zh) * | 2020-03-09 | 2020-05-19 | 中国药科大学 | 一种用于任意核酸编辑的组合物及方法 |
CN111172164B (zh) * | 2020-03-09 | 2022-11-15 | 中国药科大学 | 一种用于任意核酸编辑的组合物及方法 |
CN113913405A (zh) * | 2020-07-10 | 2022-01-11 | 中国科学院动物研究所 | 一种编辑核酸的系统及方法 |
CN113975398A (zh) * | 2021-11-09 | 2022-01-28 | 中国药科大学 | 一种用于治疗肝纤维化的药物递送载体组合物及其制备方法 |
CN113975398B (zh) * | 2021-11-09 | 2023-07-04 | 中国药科大学 | 一种用于治疗肝纤维化的药物递送载体组合物及其制备方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2018024119A1 (zh) | 2018-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DeWitt et al. | Genome editing via delivery of Cas9 ribonucleoprotein | |
US20200172935A1 (en) | Modified cpf1 mrna, modified guide rna, and uses thereof | |
CN105658794B (zh) | 核酸酶概况分析系统 | |
Blitz et al. | Biallelic genome modification in F0 Xenopus tropicalis embryos using the CRISPR/Cas system | |
ES2627552T3 (es) | Edición de genoma en ratas usando nucleasas con dedos de cinc | |
KR102254602B1 (ko) | Cas9 변이체 및 그의 용도 | |
Izsvák et al. | Short inverted-repeat transposable elements in teleost fish and implications for a mechanism of their amplification | |
US20170298450A1 (en) | Reconstruction of ancestral cells by enzymatic recording | |
Waaijers et al. | Engineering the Caenorhabditis elegans genome with CRISPR/Cas9 | |
US20170198268A1 (en) | Compositions and Methods for Site-Directed DNA Nicking and Cleaving | |
Wierson et al. | Expanding the CRISPR toolbox with ErCas12a in zebrafish and human cells | |
Zhou et al. | Generation of gene-edited sheep with a defined Booroola fecundity gene (FecBB) mutation in bone morphogenetic protein receptor type 1B (BMPR1B) via clustered regularly interspaced short palindromic repeat (CRISPR)/CRISPR-associated (Cas) 9 | |
KR20180043369A (ko) | 뉴클레아제 dsb의 완전한 호출 및 시퀀싱(find-seq) | |
CN107614680A (zh) | 利用重组核酸内切酶系统的最佳化基因编辑 | |
CN109310784A (zh) | 用于制备和使用指导核酸的方法和组合物 | |
JP2017519508A (ja) | シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE−Seq) | |
KR102151065B1 (ko) | 동물 배아의 염기 교정용 조성물 및 염기 교정 방법 | |
CN107686842A (zh) | 一种靶多核苷酸编辑方法及其应用 | |
CN105916983A (zh) | 用于高效且特异性靶向包含高度重复基序的dna序列的稀有切割核酸内切酶的设计 | |
Hoshijima et al. | Precise genome editing by homologous recombination | |
Hagmann et al. | Dramatic changes in the ratio of homologous recombination to nonhomologous DNA-end joining in oocytes and early embryos of Xenopus laevis | |
US20230049455A1 (en) | A cas9-pdbd base editor platform with improved targeting range and specificity | |
JP2023542976A (ja) | カーゴヌクレオチド配列を転位させるための系および方法 | |
Rahim et al. | Systematic review on the comparison of molecular gene editing tools | |
Beyert et al. | Nonhomologous DNA end joining of synthetic hairpin substrates in Xenopus laevis egg extracts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20240322 |