CN112941107A - 原核Argonaute蛋白的基因编辑应用 - Google Patents
原核Argonaute蛋白的基因编辑应用 Download PDFInfo
- Publication number
- CN112941107A CN112941107A CN202110365085.3A CN202110365085A CN112941107A CN 112941107 A CN112941107 A CN 112941107A CN 202110365085 A CN202110365085 A CN 202110365085A CN 112941107 A CN112941107 A CN 112941107A
- Authority
- CN
- China
- Prior art keywords
- sequence
- gene editing
- protein
- editing system
- pago
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108010088141 Argonaute Proteins Proteins 0.000 title claims abstract description 46
- 238000010362 genome editing Methods 0.000 title claims abstract description 43
- 102000008682 Argonaute Proteins Human genes 0.000 title claims abstract description 42
- 210000004027 cell Anatomy 0.000 claims abstract description 57
- 239000013598 vector Substances 0.000 claims abstract description 48
- 239000013604 expression vector Substances 0.000 claims abstract description 40
- 210000003527 eukaryotic cell Anatomy 0.000 claims abstract description 9
- 108090000623 proteins and genes Proteins 0.000 claims description 118
- 108020004414 DNA Proteins 0.000 claims description 85
- 102000053602 DNA Human genes 0.000 claims description 85
- 101710163270 Nuclease Proteins 0.000 claims description 24
- 230000000694 effects Effects 0.000 claims description 24
- 239000012634 fragment Substances 0.000 claims description 24
- 230000014509 gene expression Effects 0.000 claims description 24
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 22
- 230000004913 activation Effects 0.000 claims description 20
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 17
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 claims description 8
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 8
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 7
- 108700008625 Reporter Genes Proteins 0.000 claims description 6
- 238000011144 upstream manufacturing Methods 0.000 claims description 5
- 108700010070 Codon Usage Proteins 0.000 claims description 3
- 230000033228 biological regulation Effects 0.000 claims description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims 1
- 230000008685 targeting Effects 0.000 abstract description 23
- 241000894006 Bacteria Species 0.000 abstract description 16
- 108020005004 Guide RNA Proteins 0.000 abstract description 11
- 238000001514 detection method Methods 0.000 abstract description 6
- 230000009465 prokaryotic expression Effects 0.000 abstract description 6
- 230000015556 catabolic process Effects 0.000 abstract description 2
- 238000006731 degradation reaction Methods 0.000 abstract description 2
- 102000004169 proteins and genes Human genes 0.000 description 73
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 40
- 239000013612 plasmid Substances 0.000 description 34
- 101150064923 dapD gene Proteins 0.000 description 29
- 230000001580 bacterial effect Effects 0.000 description 27
- 230000006698 induction Effects 0.000 description 23
- 239000007788 liquid Substances 0.000 description 19
- 238000002474 experimental method Methods 0.000 description 15
- 230000003321 amplification Effects 0.000 description 14
- 238000003199 nucleic acid amplification method Methods 0.000 description 14
- 239000000047 product Substances 0.000 description 13
- 108700026244 Open Reading Frames Proteins 0.000 description 12
- 239000000243 solution Substances 0.000 description 12
- 108091033409 CRISPR Proteins 0.000 description 10
- 238000003776 cleavage reaction Methods 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 9
- 239000005090 green fluorescent protein Substances 0.000 description 8
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 8
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 7
- 238000000246 agarose gel electrophoresis Methods 0.000 description 7
- 238000012258 culturing Methods 0.000 description 7
- 210000004962 mammalian cell Anatomy 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 241000701867 Enterobacteria phage T7 Species 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 5
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 5
- 108091029865 Exogenous DNA Proteins 0.000 description 5
- 101150066002 GFP gene Proteins 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 230000006780 non-homologous end joining Effects 0.000 description 5
- 229920002401 polyacrylamide Polymers 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- 230000005782 double-strand break Effects 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 238000009630 liquid culture Methods 0.000 description 4
- 239000012160 loading buffer Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 4
- 239000002244 precipitate Substances 0.000 description 4
- 210000001236 prokaryotic cell Anatomy 0.000 description 4
- 229950010131 puromycin Drugs 0.000 description 4
- 108010054624 red fluorescent protein Proteins 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 3
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 description 3
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 3
- 239000002033 PVDF binder Substances 0.000 description 3
- 241000785681 Sander vitreus Species 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000007865 diluting Methods 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- 101100377299 Arabidopsis thaliana ZHD13 gene Proteins 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000193171 Clostridium butyricum Species 0.000 description 2
- 102100033195 DNA ligase 4 Human genes 0.000 description 2
- 101000927810 Homo sapiens DNA ligase 4 Proteins 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 241000169176 Natronobacterium gregoryi Species 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 239000006180 TBST buffer Substances 0.000 description 2
- 235000006732 Torreya nucifera Nutrition 0.000 description 2
- 244000111306 Torreya nucifera Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 238000009835 boiling Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 230000009545 invasion Effects 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000011259 mixed solution Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000004287 null lymphocyte Anatomy 0.000 description 2
- 230000009437 off-target effect Effects 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 230000035790 physiological processes and functions Effects 0.000 description 2
- 230000007505 plaque formation Effects 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 230000008263 repair mechanism Effects 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 239000013049 sediment Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000002525 ultrasonication Methods 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 101100002068 Bacillus subtilis (strain 168) araR gene Proteins 0.000 description 1
- 101710117545 C protein Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 241000208152 Geranium Species 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 239000012880 LB liquid culture medium Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 241000589596 Thermus Species 0.000 description 1
- 241000589499 Thermus thermophilus Species 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 101150044616 araC gene Proteins 0.000 description 1
- 101150050866 argD gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000002032 cellular defenses Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 101150009649 dapC gene Proteins 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 238000011502 immune monitoring Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229940126619 mouse monoclonal antibody Drugs 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- -1 salt ion Chemical class 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000003335 steric effect Effects 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 239000013595 supernatant sample Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明公开了一种原核Argonaute蛋白的基因编辑应用,通过构建源于细菌的Argonaute蛋白的原核表达载体,以及在转化宿主细胞后对该Argonaute蛋白的表达载体和共转化载体的降解的检测以及基因组位点的检测,发现了其具有被特异性转录本激活并靶向特定DNA靶序列的能力,并且在真核细胞中转录的导向RNA的参与下,实现了对基因组靶序列进行inDel频率为3%的基因编辑。实验结果表明原核Argonaute蛋白可以用于细胞内基因编辑工具的开发。
Description
技术领域
本发明属于基因工程技术领域,涉及原核Argonaute(pAgo)蛋白的核酸酶特性以及通过其实现细胞内基因编辑工具的开发。
背景技术
基因编辑技术通常使用的基因编辑工具包括ZFNs(Kim,Skowron,zybalski 1996;Bitinaite et al.1998)和TALENs(Cermak et al.2011),以及CRISPR/Cas9(Bikard etal.2012)。CRISPR/Cas9技术通过使用人工核酸酶对基因组DNA的目标位置引入双链断裂(Double strand breaks,DSBs),利用细胞自身的修复途径,例如非同源末端连接(non-homologous end joining,NHEJ),以及同源序列介导的同源重组(homologousrecombination,HR)来实现对目的基因序列的修改,能够比较精确的对生物体基因组特定目标基因位点进行修饰。但是CRISPR/Cas9技术也有一定缺陷,那就是对PAM序列的依赖(Garneau et al.2010)以及具有一定脱靶性(Zhang et al.2015)。对PAM序列的依赖使其在靶基因序列的选择上受到限制,脱靶性也造成了其在基因疾病治疗等领域应用时的潜在威胁。因此,开发出其他种类的基因编辑工具成为基因工程领域研究的重点。
原核Argonaute蛋白是细胞防御外源DNA入侵或者病毒感染的工具之一,具有降解外源DNA的能力,这一能力的发现始于荷兰瓦赫宁根大学的John van der Oost团队领衔发表的关于TtAgo作为一种以5'磷酸化的单链DNA(ssDNA)为导向序列的靶向切割互补的单链DNA序列的核酸酶(Swarts et al.2014)的研究报道。由于大多数原核Argonaute蛋白(pAgos)宿主菌的生存条件都较为极端,例如高热以及高盐,这就使得在宿主菌中研究其蛋白活性及其生理功能较为困难。
随着越来越多的关于古细菌、细菌的Argonaute蛋白与导向序列和靶序列在细胞外环境下共同孵育的实验的进行,证明了原核Argonaute蛋白的核酸切割活性。其中大多数原核Argonaute蛋白以DNA为酶作用底物(TtAgo(Swarts et al.2014)、PfAgo(Swarts etal.2015)、MpAgo(Doxzen and Doudna 2017;Kaya et al.2016)、MjAgo(Zander etal.2017)、CbAgo(Hegge et al.2019;Kuzmenko et al.2020)、RsAgo(Miyoshi etal.2016)),个别原核Argonaute蛋白也可以以RNA为酶作用底物(NgAgo(Qi et al.2016;Wuet al.2017)、RsAgo(Olovnikov et al.2013));不同原核Argonaute蛋白的导向序列也不完全相同,有些需要导向序列的DNA 5'磷酸化修饰(TtAgo(Swarts et al.2014)、PfAgo(Swarts et al.2015)、MjAgo(Zander et al.2017)、CbAgo(Hegge et al.2019)、NgAgo(Qiet al.2016)),有些需要识别5'羟基化的DNA导向序列(MpAgo(Kaya et al.2016))。
目前已成功解析了多种pAgos的蛋白单体以及其与导向序列和靶序列的复合体的晶体结构(Liu et al.2018;Yuan et al.2005;Wang et al.2008),获知了pAgos在与导向序列和靶序列结合的不同阶段的动态结构变化(Willkomm et al.2017);并且获得了成熟的细胞外孵育实验条件,其中包括不同种类pAgos的反应温度、导向序列的长度和所需要的5'端修饰以及靶序列长度、形式和GC含量,还包括二价金属离子的类型(Ca2+、Mn2+、Mg2+)以及盐离子(Na+)浓度等。通过对在宿主菌以及异源表达的大肠杆菌中表达的pAgos所结合的核苷酸位点进行分离测序分析,获知了其所结合的短DNA和RNA的来源及在宿主菌和大肠杆菌基因组(Kuzmenko et al.2020;Hegge et al.2019)中的位置,以及与宿主菌中存在的天然大质粒(natural mega-plasmid)和原核表达载体的匹配区(Swarts et al.2014;Kuzmenko et al.2020;Hegge et al.2019);并且结合CRISPR系统spacer序列获得的原理提出了不同于导向序列非依赖型的“切碎活性”(chopping activity)的新的pAgos获得导向序列的假设(Swarts et al.2017)。
尽管pAgos可以协同细胞内DSB修复机制,利用其自身核酸酶活性,帮助细胞抵御外源DNA的入侵(Kuzmenko et al.2020),该过程类似于CRISPR系统获得spacer序列的原理,是由于复制叉的停顿,复制叉大量积累,复制过程中产生大量的DSB,募集RecBCD蛋白复合体至DNA断裂处,由chi位点的下游向上游处进行切割,期间由RecBCD蛋白在DNA断裂处产生的短的DNA片段作为CbAgo的导向核苷酸,引发CbAgo在多拷贝遗传元件,例如质粒、转座子以及基因组的重复位点之间进行切割。
但目前已公开的pAgos大部分来源于嗜热菌,在细胞外切割实验中反应温度高于65℃,甚至达到85℃、98℃(Swarts et al.2014;Swarts et al.2015;Zander etal.2017),这样的温度条件下DNA双链呈解旋状态,实验结果无法完全反映其对双链DNA的作用。通过对嗜热菌来源的Argonaute蛋白在常温或低温下进行细胞外切割实验,已证实其无法满足被改造应用于哺乳动物细胞内基因组编辑的条件,例如,表现为低活性的切割和缺乏靶向性。而目前报道的其他来源的原核Argonaute蛋白,例如,源于丁酸梭菌(Clostridium butyricum)的Argonaute(CbAgo)蛋白以及源于格氏嗜盐碱杆菌(Natronobacterium gregoryi)的Argonaute(NgAgo)蛋白,其在更具代表性的生理条件(例如,37℃)下,并未获得在细胞内靶向切割DNA的结果。
发明内容
本发明的目的在于提供一种原核Argonaute蛋白的基因编辑应用。
为达到上述目的,本发明采用了以下技术方案:
一种基于pAgo的基因编辑系统,该基因编辑系统包括核酸酶表达载体,所述核酸酶表达载体包括通过启动子的调控实现表达的原核Argonaute蛋白基因序列,所述核酸酶表达载体表达的原核Argonaute蛋白具有被转录本激活并靶向该转录本对应DNA序列的核酸酶活性,例如,在原核Argonaute蛋白借助单链DNA片段结合其他共转载体转录形成的导向RNA后靶向切割真核细胞基因组DNA,或在原核细胞中外源性DNA的特异性转录本存在情况下靶向切割该外源性DNA及其他外源DNA(同样含有特异性启动子的载体DNA或噬菌体DNA)。
优选的,所述原核Argonaute蛋白基因序列选自NgAgo蛋白基因序列、TtAgo蛋白基因序列或选自根据目标宿主细胞(例如,哺乳动物细胞等真核细胞)的密码子偏好优化后的NgAgo、TtAgo蛋白基因序列(例如,hNgAgo蛋白基因序列)。
优选的,所述基因编辑系统还包括RNA导引激活序列表达载体,RNA导引激活序列表达载体包括通过启动子的调控实现作为所述转录本的RNA导引激活序列的表达的模板。
优选的,所述RNA导引激活序列选自目标宿主细胞基因组靶序列的同源序列,例如,导向RNA。
优选的,所述RNA导引激活序列的长度大于10nt,但是考虑到蛋白结合位阻效应和激活能力的实现,进一步优选为16~50nt。
优选的,所述启动子选自T7启动子、阿拉伯糖启动子、CMV启动子或U6类启动子(其中,T7启动子、阿拉伯糖启动子为特异性启动子)。
优选的,所述基因编辑系统还包括与RNA导引激活序列互补配对的单链DNA片段。
优选的,所述基因编辑系统中,核酸酶表达载体含量按物质的量计为单链DNA片段含量的3倍以内,从而使表达的原核Argonaute蛋白通过切碎活性得到足以用于耦联自身与RNA导引激活序列的单链DNA结合片段。
优选的,所述基因编辑系统还包括报告载体,所述报告载体包括用于表达报告基因(例如,红色荧光蛋白RFP等荧光蛋白基因)的表达盒,所述表达盒包括报告基因序列以及位于该序列上游的与目标宿主细胞基因组靶序列同源的序列。
优选的,所述基因编辑系统还包括用于进行同源重组修复的供体载体。
优选的,所述目标宿主细胞选自哺乳动物细胞等真核细胞,基因编辑系统采用转染试剂递送至细胞内,然后在细胞生理条件所允许范围内进行培养并表达原核Argonaute蛋白以及RNA导引激活序列。
本发明的有益效果体现在:
本发明发现了原核Argonaute蛋白具有被转录本激活并靶向特定DNA序列的能力,从而可以借助其核酸酶活性实现对诸如基因组靶序列所在位点进行切割,并且位点处无需PAM序列。实验结果表明原核Argonaute蛋白可以用于细胞内基因编辑工具的开发。
进一步的,借助大肠杆菌原核诱导表达系统(BL21/pET),将原核Argonaute蛋白的表达载体转化大肠杆菌BL21(DE3),经IPTG诱导,证明了TtAgo蛋白和NgAgo蛋白在大肠杆菌细胞内(37℃)具有特异性降解DNA的能力;在哺乳动物HEK 293T细胞中,通过共表达hNgAgo以及导向RNA,使得结合了小片段单链DNA的hNgAgo靶向基因组和报告载体中嵌入的相应基因靶序列并进行切割,通过高通量测序分析证明对基因组实现了靶向编辑。
附图说明
图1-1为表达载体pET28a-TtAgo(简称为pET28a-Tt)图谱。
图1-2为表达载体pET28a-NgAgo(简称pET28a-Ng)图谱。
图1-3为载体pUC57-delta dapD(简称pUC57-ΔdapD)图谱。
图1-4为载体pUC57-T7-delta dapD(简称pUC57-T7-ΔdapD)图谱。
图1-5为表达载体pcDNA3.1-CMV-hNgAgo(简称pcDNA3.1-CMV-hNg)图谱。
图1-6为表达载体pmsg-ALA gRNA(简称msgRNA-ALA)图谱。
图1-7为报告载体pPGR-AAVS1图谱。
图1-8为HEK 293T细胞中报告载体pPGR-AAVS1工作原理示意图。
图2-1为pET28a-TtAgo、pET28a-NgAgo在BL21(DE3)细胞中经IPTG诱导后质粒产量统计图。
图2-2为等体积来源于IPTG诱导不同时间、撤掉IPTG后继续培养以及未诱导的pET28a-TtAgo、pET28a-NgAgo质粒琼脂糖凝胶电泳图。
图2-3为pET28a-TtAgo、pET28a-NgAgo、pET28a转化后在LB+kan、LB+Kan+IPTG、LB、LB+IPTG培养板上的菌斑鉴定图。
图2-4为pET28a-TtAgo、pET28a-NgAgo的蛋白表达鉴定图。
图2-5为pET28a-pBAD-NgAgo、pET28a-pBAD-TtAgo转化后在LB+kan、LB+Kan+arabinose、LB、LB+arabinose培养板上的菌斑鉴定图。
图2-6为pET28a-LacP-TtAgo、pET28a-LacP-NgAgo、pET28a-rhaP-TtAgo、pET28a-rhaP-NgAgo转化后在LB+kan、LB+Kan+IPTG/LB+Kan+rha培养板上的菌斑鉴定图。
图2-7为pET28a-LacP-TtAgo、pET28a-LacP-NgAgo、pET28a-rhaP-NgAgo蛋白表达鉴定图。
图2-8为pET28a-NgAgo/pET28a-TtAgo与pUC57-ΔdapD/pUC57-T7-ΔdapD分别共同转化后在LB+Kan+Amp、LB+Kan+IPTG、LB+Amp+IPTG培养板上的菌斑鉴定图。
图2-9为pET28a-NgAgo与pUC57-ΔdapD/pUC57-T7-ΔdapD共同转化并经IPTG诱导4小时后pUC57骨架载体半定量琼脂糖凝胶电泳图(扩增引物dapD-F/R,扩增产物~200bp);其中,泳道1、3:pET28a-NgAgo+pUC57-ΔdapD(未诱导),泳道2、4:泳道1、3质粒+IPTG诱导4小时;泳道5、7:pET28a-NgAgo+pUC57-T7-ΔdapD(未诱导);泳道6、8:泳道5、7质粒+IPTG诱导4小时。
图2-10为在大肠杆菌中表达NgAgo和TtAgo后T7噬菌体噬菌斑(PFU)形成数目统计。
图2-11为NgAgo和TtAgo降解T7噬菌体基因组DNA(Marker为M1)以及PCR鉴定T7噬菌体基因组DNA(Marker为M2)的琼脂糖凝胶电泳图。
图2-12为pcDNA3.1-CMV-hNg、msgRNA-ALA和pPGR-AAVS1共转染HEK 293T细胞后基因组编辑结果统计,其中:靶序列的参考序列为ctgtcccctccaccccacag。
具体实施方式
以下结合附图和实施例对本发明作进一步的详细说明。所述实施例仅用于解释本发明,而非对本发明保护范围的限制。
本发明在实验室常用的工程菌,例如大肠杆菌BL21(DE3)中重新构建源于嗜热菌(Thermus thermophiles)HB27菌株的TtAgo蛋白和源于格氏嗜盐碱杆菌(Natronobacterium gregoryi)的NgAgo蛋白的表达系统,并利用这些原核Argonaute蛋白在细胞内的活性与对外源DNA(例如,质粒DNA等)入侵后产生的表型,研究原核Argonaute蛋白在体内的新的工作机制,以期将其改造并应用于原核细胞和真核细胞的基因编辑。
(一)TtAgo、NgAgo表达载体及其他相关工具载体构建
1.原核表达载体pET28a-TtAgo、pET28a-NgAgo构建
将人工合成的TtAgo基因(GenBank ID:AP008227)克隆于pUC57-simple载体中的EcoRV位点之间(由上海闪晶分子生物科技有限公司合成并克隆)。然后利用两端带有酶切位点的引物扩增TtAgo基因开放阅读框的序列并插入于原核表达载体pET28a(优宝生物,VT1207)的NdeI和HindIII之间,使得插入的TtAgo基因开放阅读框5’端含有Thrombin site位点以及用于蛋白检测的6×His-tag标签,并由IPTG诱导型T7启动子(T7 promoter,T7P)调控表达,经转化大肠杆菌DH5α感受态细胞(C1100,索莱宝)从而获得pET28a-TtAgo(图1-1)。其中,TtAgo基因开放阅读框如SEQ.ID.NO.1所示;扩增引物为:
NdeI-Tt-F:5’-ggaattcCATATGAACCACCTTGGAAAAACGGAAG-3’
HindIII-TAA-TtV685-R:5’-cccAAGCTTttaAACGAAGAAGAGCTTTTCCC-3’
参见图1-2,pET28a-NgAgo具有与pET28a-TtAgo相同的元件结构,仅是表达的目标蛋白不同,pET28a-NgAgo的相应质粒由山西大学张婷婷博士赠予,其中,NgAgo基因开放阅读框如SEQ.ID.NO.2所示。
pET28-TtAgo、pET28-NgAgo中还含有卡那霉素(Kanamycin,Kan)抗性基因(KanR)。
2.原核表达载体pET28a-pBAD-TtAgo、pET28a-pBAD-NgAgo构建
阿拉伯糖诱导型启动子(araBAD promoter,pBAD)及相关阿拉伯糖操纵子C蛋白编码序列(araC)克隆自pKD46载体((优宝生物,VT1692),扩增引物为:
BglII-araC-R:5’-caAGATCTCCCCGAAAAGTGCC-3’
XbaI-pBAD-R:5’-tgcTCTAGAGAATTCCCAAAAAA-3’
将扩增产物替代pET28a-TtAgo中原T7启动子序列以及乳糖操作子(lacoperator,LacO)序列,经转化大肠杆菌DH5α感受态细胞获得pET28a-pBAD-TtAgo;将扩增产物替代pET28a-NgAgo中原T7启动子序列以及LacO序列,经转化大肠杆菌DH5α感受态细胞获得pET28a-pBAD-NgAgo。
3.载体pUC57-ΔdapD、pUC57-T7-ΔdapD构建
以大肠杆菌BL21(DE3)(C1400,索莱宝)基因组DNA为模板,利用以下引物扩增200bp dapD序列(dapD-200):
XhoI-dapD-F:5’-aatCTCGAGCCGTATTAATGATAATCAGG-3’
HindIII-dapD-R:5’-aatAAGCTTCATATGCGCCGA-3’
将扩增产物(目的片段为dapD-200)克隆于实验室保存的pUC57-simple载体(P0088,淼灵平台)中的XhoI/HindIII位点之间,所得载体命名为pUC57-ΔdapD(图1-3)。
以pUC57-ΔdapD为模板,用引物HindIII-dapD-R和dapD-overlap-F扩增片段1A,用引物XhoI-T7P-dapD-F和dapD-T7P-overlap-R扩增片段2A,将片段1A和2A回收,以1:1的比例混合(总DNA量50~100ng),作为重叠PCR的模板,用引物XhoI-T7P-dapD-F和HindIII-dapD-R扩增出序列T7P-dapD(由T7启动子序列和上述dapD-200串联组成),用XhoI和HindIII对pUC57-ΔdapD载体和切胶回收后的重叠PCR产物酶切,然后经连接、转化,最终获得pUC57-T7-ΔdapD载体(图1-4)。
XhoI-T7P-dapD-F:5’-aatCTCGAGTAATACGACTCACTATAGGGCCGTATTAATGATAATCAGG-3’
dapD-T7P-overlap-R:5’-CCTGATTATCATTAATACGG-3’
dapD-overlap-F:5’-CCGTATTAATGATAATCAGG-3’
pUC57-ΔdapD、pUC57-T7-ΔdapD中还含有氨苄青霉素(Amp)抗性基因(AmpR)。
4.载体pcDNA3.1-CMV-hNgAgo、pmsg-ALA gRNA、pPGR-AAVS1构建
(1)pcDNA3.1-CMV-hNgAgo由华南师范大学任充华博士赠予(PMID:29584750),其是将密码子人源化的NgAgo基因(hNgAgo基因)开放阅读框替换实验室原有Cas9通用表达载体pcDNA3.1-NLS-SpCas9中的Cas9元件(由CMV启动子调控表达)而得到(参见图1-5)。
(2)pPGR-AAVS1的具体构建步骤如下:
2.1从载体pTLR repair vector(addgene:#64322)中扩增P2A-RFP-pA元件(其中,pA代表polyA,RFP代表RFP基因开放阅读框);扩增引物为:
P2A-RFP-pA-F(PstI):5’-AAGCTGCAGTAGACGCGTTGGCCACGAAC-3’
P2A-RFP-Pa-R(XhoI):5’-TAACTCGAGCCATAGAGCCCACCGCATCC-3’;
后续用PstI和XhoI酶切P2A-RFP-pA元件扩增产物用于pPGR-AAVS1组装;
从载体pB-CMV-DsRed-CAG-puro(AAVS1)-T2A-GFP(PMID:25725802)中扩增T2A-GFP元件(其中,GFP代表GFP基因开放阅读框);扩增引物为:
T2A-GFP-F(BglII):5’-TGGAGATCTGGCAGTGGAGAGGGCAGAGG-3’
T2A-GFP-R(PstI):5’-CTACTGCAGCTTGTACAGCTCGTCCATGC-3’;
2.2将AAVS1基因靶序列插入GFP基因开放阅读框中;
以扩增T2A-GFP元件所得产物为模板,利用引物T2A-GFP-F(BglII)和AAVS1-R(BamHI)扩增片段1B;利用引物AAVS1-F(HindIII)和T2A-GFP-R(PstI)扩增片段2B;将片段1B和2B回收后混合作为模板,用引物T2A-GFP-F(BglII)和T2A-GFP-R(PstI)扩增片段3B,在片段3B中AAVS1基因靶序列替换了以上T2A-GFP元件中GFP基因的部分序列。后续用BglII和PstI酶切片段3B用于pPGR-AAVS1组装。
AAVS1-R(BamHI):5’-CTGTGGGGTGGAGGGGACAGGGATCCGAAGAAGATGGTGCGCTCC-3’
AAVS1-F(HindIII):5’-CTGTCCCCTCCACCCCACAGTGGAAGCTTCACAAGCTGGAGTACAACTAC-3’;
2.3组装PCR扩增后元件(P2A-RFP-pA元件、片段3B)于骨架载体pB-CBh-puro中,得到载体pPGR-AAVS1,其中,所述骨架载体包括由CBh启动子(pCBh)调控的嘌呤霉素(puromycin)抗性基因(puroR)表达盒以及由T7启动子调控的AmpR表达盒。
载体pPGR-AAVS1(图1-7)中重组表达盒pCBh-PuroR-T2A-GFP(AAVS1target)-P2A-TagRFP-bGH polyA,是在原嘌呤霉素抗性基因表达盒的嘌呤霉素抗性基因开放阅读框后,由T2A剪切肽序列串联因插入了AAVS1基因靶序列而无法正常表达的绿色荧光蛋白GFP的基因序列(来自片段3B),在该基因序列后再由P2A剪切肽序列串联因整个开放阅读框移码造成转录提前终止而无法正常表达的红色荧光蛋白RFP的基因序列(来自P2A-RFP-pA元件),从而完成对原嘌呤霉素抗性基因表达盒的重组。若通过原核Argonaute蛋白的作用,所述靶序列处产生双链断裂(DSBs)并由哺乳动物细胞内NHEJ修复机制修复,那么修复过程中产生的碱基插入和缺失(InDels),会有三分之一概率恢复重组表达盒整个开放阅读框的转录及翻译,使得重组表达盒中的RFP基因序列正常表达红色荧光蛋白,实现对基因编辑细胞的标记(故RFP基因序列也称为TagRFP)。
(3)msgRNA-ALA是采用实验室前期构建的由U6启动子调控表达的短片段RNA(20nt)的表达载体(PMID:27941919)。所述短片段RNA的转录模板(AAVS1a sgRNA,参见图1-6)在msgRNA-ALA中为两段,之间通过LIG4 shRNA序列连接,而转录产物中LIG4 shRNA序列的对应部分在细胞内完成切割,从而形成所述短片段RNA。所述短片段RNA的转录模板可以根据哺乳动物细胞基因组目标基因编辑位点序列不同进行调整,并作为激活所述细胞内表达的原核Argonaute蛋白的靶向切割活性的元件。
(二)在大肠杆菌BL21(DE3)中表达TtAgo以及NgAgo的实验
1.pET28a-TtAgo、pET28a-NgAgo、pET28a经电转化BL21(DE3)感受态,挑取在LB+Kan培养板上生长的单克隆接种于LB+Kan液体培养基中培养至OD600约为0.5,然后将菌液一分为二,一份立即置于4℃冰箱保存,以停止细菌生长,待提取质粒(诱导前组);另一份加入终浓度为0.5mM的IPTG诱导3小时(诱导后组),诱导结束后测量菌液OD600值,并与诱导前组菌液一起提取质粒,并统计质粒产量(ng/OD600)。参见图2-1,经过IPTG诱导,pET28a-TtAgo、pET28a-NgAgo的质粒产量(ng/OD600)经过IPTG诱导3小时后显著降低;对照组空载体(pET28a)经过IPTG诱导3小时后,质粒产量显著增加。
2.同样将pET28a-TtAgo、pET28a-NgAgo经电转化BL21(DE3)感受态,挑取在LB+Kan培养板上生长的单克隆接种于LB+Kan液体培养基中培养至OD600约为0.5,然后将菌液一分为二,一份用终浓度为0.5mM的IPTG诱导(诱导组),一份不添加IPTG(未诱导组),诱导组分别取在37℃培养2小时、3小时和4小时的菌液提取质粒,未诱导组进行同样的操作。诱导组质粒产量(ng/OD600)会随着培养时间的增加而降低,未诱导组在培养期间质粒产量逐渐增加。参见图2-2,取等量的从等体积菌液中提取的质粒直接进行琼脂糖凝胶电泳检测,可以发现IPTG诱导下,质粒浓度随着培养时间的延长而减少。将IPTG诱导4小时后的菌液通过离心,水洗细胞沉淀并更换为新鲜的不含IPTG的LB+Kan液体培养基,继续培养2小时后取菌液提取质粒,同时对不添加IPTG持续培养5、6小时后的菌液提取质粒;在取等量的从等体积菌液中提取的质粒进行琼脂糖凝胶电泳检测后发现,IPTG诱导4小时后撤掉诱导剂(IPTG)并继续培养2小时并不能恢复质粒产量。
以上结果表明,在BL21(DE3)中经IPTG诱导噬菌体T7启动子调控表达TtAgo蛋白、NgAgo蛋白后,会导致蛋白自身表达载体(pET28a-TtAgo、pET28a-NgAgo)的丢失,并且IPTG诱导表达TtAgo以及NgAgo蛋白导致的质粒(表达载体)丢失是不可逆的。
3.菌斑实验:从LB+Kan培养板上生长的转化有pET28a-TtAgo、pET28a-NgAgo、pET28a的大肠杆菌BL21(DE3)中分别各挑取3个单克隆,接种于LB+Kan液体培养基中,培养至菌液OD600大约为0.5左右,将菌液稀释100倍,再以100倍稀释为梯度,倍比稀释至10-6。取5μL稀释后的菌悬液点在LB+Kan、LB+Kan+IPTG、LB、LB+IPTG培养板上,其中,IPTG终浓度为0.1mM。待培养板表面液滴吹干后,将培养板倒置于37℃恒温培养箱中培养20小时,观察菌斑形成。菌斑实验结果(图2-3)表明IPTG诱导表达TtAgo以及NgAgo蛋白对BL21(DE3)的生长无明显影响,即对BL21(DE3)的基因组DNA无作用。
4.蛋白鉴定:从LB+Kan培养板上生长的转化有表达载体pET28a-TtAgo、pET28a-NgAgo的大肠杆菌BL21(DE3)中分别各挑取1个单克隆,接种于LB+Kan液体培养基中,过夜培养至菌液饱和,第二天将饱和菌液以1:50的比例接种于10mL LB+Kan液体培养基中培养至菌液OD600至0.5左右时,在菌液中加入终浓度为0.5mM的IPTG,在37℃诱导4小时。诱导结束后离心收集菌体,并用灭菌水水洗菌体后,将菌体冻存于-80℃(待超声波破碎,提取蛋白)。将冷冻后的菌体重悬于400μL超声波破碎缓冲液(50mM Tris-HCl、150mM NaCl以及5%glycerol,pH 8.0)中,并加入终浓度为1mM的蛋白酶抑制剂(PMSF)。用手持超声波破碎仪(Hielscher,UP50H)配以5mm的探头,以60%的振幅,间歇0.5s进行菌体破碎,全程操作应置于冰上,以减少超声波破碎带来的热量造成的蛋白质降解。破碎至离心管中液体由混浊状态变得清亮即可。4℃离心10分钟,分离蛋白上清和沉淀,取40μL上清与10μL 5×SDS-PAGE上样缓冲液混合,并用30μL 5×SDS-PAGE上样缓冲液重悬沉淀,将混有上样缓冲液的蛋白上清样品和沉淀样品置于沸水中加热煮沸约10分钟,瞬时离心将管壁的液体离心至管底,置于4℃冰箱短期内保存,待上样检测。其中,5×SDS-PAGE上样缓冲液配方为:250mM Tris-HCl(pH 6.8)、10%(W/V)SDS、0.5%(W/V)BPB、50%(V/V)glycerol以及5%(V/V)2-ME。
将样品上样10%的聚丙烯酰胺变性胶(SDS-PAGE),经电泳、转膜及封闭后,一抗采用抗His标签鼠单克隆抗体(1:10000;Proteintech,Cat#66005-1-Ig),在水平摇床上室温孵育1.5小时,用TBST杂交清洗液清洗PVDF膜3次,每次10分钟。二抗采用羊抗鼠多克隆抗体(1:2000;CWBIO,Cat#CW0102S),在水平摇床上室温孵育1小时,同样用TBST杂交清洗液清洗PVDF膜3次,每次10分钟。然用镊子夹取PVDF膜边缘置于滤纸上,吸干膜表面水分。与ECL发光液混合,置于凝胶成像仪(MicroChemi,DNR)中曝光,检测目的蛋白条带。
参见图2-4,实验结果与TtAgo蛋白、NgAgo蛋白预期分子量一致,并且蛋白在上清和全菌中有高效表达,说明在37℃表达的TtAgo蛋白和NgAgo蛋白没有对细菌生长产生影响,即表达的蛋白对细胞没有毒性,未见蛋白以包含体的形式在沉淀中大量表达。
5.将表达载体pET28a-pBAD-NgAgo、pET28a-pBAD-TtAgo经阿拉伯糖诱导,菌斑实验结果表明同样可以导致蛋白自身表达载体的丢失(图2-5)。但是将T7启动子更换为乳糖启动子(LacP)以及鼠李糖启动子(rhaP)后,对于所得的相应表达载体(pET28a-LacP-TtAgo、pET28a-LacP-NgAgo以及pET28a-rhaP-TtAgo、pET28a-rhaP-NgAgo),尽管NgAgo及TtAgo蛋白在IPTG诱导或鼠李糖诱导后有表达(图2-7),但是并不降解蛋白自身表达载体(图2-6)。
以上结果表明,TtAgo以及NgAgo蛋白细胞内的核酸酶活性需要由特异性启动子(例如,T7启动子、pBAD)调控下表达的RNA激活。
6.以上实验中发现,TtAgo以及NgAgo蛋白只降低含有特异性启动子转录本的细胞中蛋白自身表达质粒产量,即具有启动子特异性识别并被特异性转录本激活核酸酶功能的特性,进一步将pET28a-TtAgo、pET28a-NgAgo分别与具有氨苄青霉素抗性的pUC57载体共转化,其中一个pUC57载体中只克隆有200bp的大肠杆菌dapD基因片段(XhoI/HindIII),即pUC57-ΔdapD;另一个pUC57载体中克隆有T7启动子序列以及相同的200bp大肠杆菌dapD基因片段(XhoI/HindIII),即pUC57-T7-ΔdapD,具体实验操作如下:将pUC57-ΔdapD和pUC57-T7-ΔdapD分别与pAgo表达质粒(pET28a-NgAgo或pET28a-TtAgo)共转化大肠杆菌BL21(DE3)感受态,挑取LB+Kan+Amp培养板上生长的单克隆接种于LB+Kan+Amp液体培养基中培养至菌液OD600约为0.5,将菌液一分为二,一份用终浓度为0.5mM的IPTG在37℃诱导4小时,一份不添加IPTG,在37℃持续培养4小时,分别提取质粒。以提取的混合质粒为模板,分别扩增载体上的dapD基因片段(采用经典PCR三步法扩增,每5个循环取出一管扩增产物,共25个循环),对混合质粒中以pUC57-simple为骨架的质粒进行半定量,扩增引物为:
dapD-F:5’-CCGTATTAATGATAATCAGG-3’
dapD-R:5’-CATATGCGCCGATGTTGACG-3’
对扩增产物直接进行琼脂糖凝胶电泳检测,可以发现IPTG诱导后pAgo表达质粒与pUC57-T7-ΔdapD共转化组的dapD基因片段的扩增产物浓度在循环数5、10、15时,明显低于pAgo表达质粒与pUC57-ΔdapD质粒共转化组,并且共转化pUC57-T7-ΔdapD组的扩增产物在相同循环数下,IPTG诱导后的扩增产物浓度也低于未诱导,说明IPTG诱导pAgo(NgAgo或TtAgo)的表达可以同时降低含有T7启动子的共转质粒(例如,pUC57-T7-ΔdapD)含量,对不含有T7启动子的共转质粒(例如,pUC57-ΔdapD)产量无影响(图2-9)。通过菌斑实验可得知,IPTG诱导表达的TtAgo以及NgAgo蛋白对BL21(DE3)的生长无明显影响,即对BL21(DE3)的基因组DNA无作用,对自身表达载体以及共转化的pUC57-T7-ΔdapD载体的菌斑形成有影响(图2-8)。
以上结果表明,pAgo表达质粒表达的TtAgo及NgAgo蛋白,可以在细胞内靶向含有特异性启动子(例如,噬菌体T7启动子)的共转载体,TtAgo以及NgAgo蛋白对特异性转录本的识别同样可以适用于共转载体。
7.将pET28a-TtAgo、pET28a-NgAgo分别转化大肠杆菌BL21(DE3)感受态细胞后,挑取转化有pET28a-TtAgo、pET28a-NgAgo的单克隆,以及未转化载体的BL21(DE3)单克隆,分别接种于LB+Kan以及LB液体培养基中,在37℃培养至菌液OD600为0.5左右,在pET28a-NgAgo、pET28a-TtAgo转化组菌液中加入终浓度为0.5mM的IPTG诱导TtAgo蛋白表达2小时,诱导2小时后再次测量菌液OD600值,取0.5OD(~2.5×108个细胞)细胞与100μL噬菌体储存液(phage stock)混匀,在37℃孵育30分钟后将所得噬菌体与BL21(DE3)细胞混合液加入4mL 0.8%的上层琼脂糖培养基中,混合均匀后侵倒于尚未凝固的LB培养板上,待上层凝固后,将培养板倒置于37℃培养箱中,大约4小时后可观察到噬菌斑的形成,对实验组(pET28a-TtAgo及pET28a-NgAgo转化组)和对照组(未转化载体,BL21(DE3)空细胞)进行噬菌斑计数及统计分析。结果显示(图2-10),与BL21(DE3)空细胞相比,TtAgo蛋白、NgAgo蛋白的表达可以极显著地降低噬菌斑的数目(约104个数量级),说明TtAgo蛋白和NgAgo蛋白对于外源入侵的T7噬菌体DNA有降解作用,破坏了T7噬菌体基因组DNA。通过对实验组以及对照组噬菌体基因组DNA的琼脂糖凝胶电泳检测可以发现,实验组噬菌体基因组DNA呈现弥散状态并且都为短片段,而对照组噬菌体基因组DNA为线性化的单一条带且大小也与目的条带大小一致;用引物扩增T7噬菌体基因组T7p17基因:
T7p17-F:5’-ATGGCTAAGAAGATTTTCAC-3’
T7p17-R:5’-TTAGAAGTCTCCGTCTTCGT-3’
T7p17-F/R特异性的在T7噬菌体侵染的BL21(DE3)空细胞中扩增出目的条带(~699bp),在T7噬菌体侵染的pET28a-TtAgo、pET28a-NgAgo转化组和未加T7噬菌体的BL21(DE3)空细胞中没有扩增出目的条带(图2-11)。
8.综合以上实验结果为基于原核Argonaute蛋白(pAgo蛋白)的基因编辑工具的开发提供了数据支持,具体说明如下。本发明将源于Natrono bacterium gregoryi的NgAgo蛋白以及源于Thermus thermophiles HB27菌株的TtAgo蛋白重新构建于实验室常见的大肠杆菌BL21(DE3)中,并进行原核表达;发现NgAgo蛋白以及TtAgo蛋白在37℃具有核酸酶活性,并且该活性是被特异性启动子的转录产物激活,所述特异性启动子包括驱动pAgo基因表达的噬菌体T7启动子等;T7启动子控制表达的pAgo基因转录本(RNA)能够激活已经翻译形成的pAgo蛋白的核酸酶活性,表现为可以降解pAgo蛋白的表达载体,导致质粒产量的下降或者细胞完全丢失质粒;与含有特异性启动子的另一载体共转化后,可以导致两个载体的丢失,相反的,若共转化载体不含有特异性启动子,即不会产生特异性启动子的转录本,那么在相同条件下,pAgo蛋白的表达只会使得pAgo蛋白表达载体产量下降而共转载体产量不受影响;噬菌体T7启动子表达的TtAgo蛋白和NgAgo蛋白通过降解T7噬菌体基因组DNA来保护宿主细菌不受噬菌体的侵染,表现为极显著地降低T7噬菌体形成的噬菌斑的数目;这些结果都与pAgo蛋白(例如,NgAgo、TtAgo)作为细菌与古细菌的防御系统的报道一致。也就是说,原核Argonaute蛋白具有被改造为新一代基因编辑工具的潜力。
(三)哺乳动物真核细胞转染实验
1.hNgAgo靶向编辑HEK 293T细胞AAVS1a基因位点的实验操作
1)通过对上述NgAgo蛋白依据目标编辑细胞的种属内密码子偏好性进行优化后得到hNgAgo基因开放阅读框(如SEQ.ID.NO.3所示),并获得hNgAgo蛋白表达载体。
2)实验分组
组I(外加DNA序列):将hNgAgo蛋白表达载体(pcDNA3.1-CMV-hNgAgo)、表达导向RNA的载体(pmsg-ALA gRNA)、与AAVS1基因靶序列互补配对的单链DNA(ssDNA)以及报告载体(pPGR-AAVS1)共转染HEK 293T细胞。转染HEK 293T细胞时,ssDNA:hNgAgo蛋白表达载体=1:3(ssDNA用量不建议小于此比例),ssDNA用量为100nM。
组II(无外加DNA序列):将pcDNA3.1-CMV-hNgAgo、pmsg-ALA gRNA以及pPGR-AAVS1共转染HEK 293T细胞。
3)转染步骤参照转染试剂Hieff(上海翊圣生物科技有限公司)的使用说明,转染48小时(培养条件:37℃,5%CO2)后在倒置显微镜下观察红色荧光细胞数目(代表了编辑效率)。
4)哺乳动物细胞基因组提取及靶序列编辑的检测
转染48小时后参照基因组提取试剂盒(Tiangen)操作说明提取细胞基因组;扩增基因组AAVS1a基因靶序列所在位点上下游各100bp的基因序列,扩增引物两端带有barcode序列用于后续高通量测序,扩增引物如下:
AAVS1a-F:5’-ACAGCATGTTTGCTGCCTCCAG-3’
AAVS1a-R:5’-CTAACAGGAGGTGGGGGTTAGA-3’
2.实验结果及分析
参见图1-8,由pcDNA3.1-CMV-hNgAgo利用其CMV启动子调控表达的hNgAgo蛋白(人源化的NgAgo蛋白),与由pmsg-ALA gRNA利用其U6启动子表达的导向RNA一起,靶向HEK293T细胞中人基因组AAVS1a基因位点同时靶向报告载体相应序列,其中,位点序列为ctgtcccctccaccccacag(位点仅具有靶序列,没有PAM序列)。报告载体pPGR-AAVS1中GFP基因序列被插入的靶序列打断,靶序列处发生DSB后通过非同源性末端连接(Non-homologousend joining,NHEJ)进行修复(假如提供供体载体,还可以进行同源重组修复,但考虑到同源重组修复效率较低,故未考虑供体载体)。修复后GFP基因序列中产生的碱基插入或缺失,可以作为产生DNA断裂的依据(若下游由P2A串联的完整的RFP基因序列恢复转录及翻译,则表达的红色荧光蛋白对此予以显示)。
各分组阳性率结果:参见图2-12,PCR扩增基因组AAVS1a基因位点上下游各100bp后,二代测序结果总读数为490764,删除频率低于0.001的结果,统计InDel频率。结果表明,组I中hNgAgo蛋白在导向RNA的作用下,靶向人基因组AAVS1a基因位点的InDels频率(即编辑效率)约为3%;组II中没有在位点附近位置检测到InDels。
对组I和组II结果差异进行分析:由于组II中没有提供单链DNA作为hNgAgo蛋白chopping的底物(通过chopping形成DNA短序列),而只有结合了足够多的仍与导向RNA互补配对的DNA短序列后,经导向RNA的激活,hNgAgo蛋白才会在靶序列附近进行切割。
(四)原核Argonaute蛋白在哺乳动物细胞内实现基因编辑的作用机制
本发明通过对前人对于Argonaute复合体(Ago Complex)的结构解析和结构转换以及一系列体外(in-vitro)DNA、基因组DNA切割实验的结果进行总结分析,同时根据在原核细胞和真核细胞中实验获得的结果,提出原核Argonaute蛋白(pAgo蛋白)在细胞生理状态下靶向切割外源DNA(载体DNA或者噬菌体DNA)和细胞基因组的工作原理:pAgo蛋白在细胞内表达后通过固有的切碎(chopping)功能对外源入侵的DNA或宿主菌基因组进行非特异性和低活性的切割,产生微量小片段单链DNA并结合在pAgo蛋白上,这些小片段单链DNA具有有限的导向作用(无靶向性),结合这些DNA的pAgo蛋白作为类似于哺乳生物免疫监测系统存在于细胞内(处于待激活状态),pAgo蛋白的核酸酶活性需要外源入侵基因表达的RNA来激活。而且这种激活依赖于pAgo蛋白结合的单链DNA与表达的RNA的配对。激活后的pAgo蛋白以结合的单链DNA为导向(靶向性提高),能够迅速高效降解外源入侵的DNA以及切割基因组上作为靶序列的同源序列。
总之,本发明利用原核Argonaute蛋白在原核细胞和真核细胞中都实现了其核酸酶活性,为其进一步在基因编辑中的应用奠定了基础。相较于大部分已报道的pAgos蛋白研究都是基于结构分析以及细胞外(in-vitro)DNA切割试验,本发明中的数据主要都来源于细胞内实验(蛋白质在体外环境和细胞中实际的工作环境是有很大差别的,DNA的存在方式也存在差异),突破了对于原核Argonaute蛋白作为核酸酶的功能活性的认知,实验结果(靶向切割活性及编辑效率)也更具有说服力。
<110> 西北农林科技大学
<120> 原核Argonaute蛋白的基因编辑应用
<160> 25
<210>1
<211> 2058
<212> DNA
<213> TtAgo
<400> 1
atgaaccacc ttggaaaaac ggaagtgttc ctaaaccgct tcgccctacg gcctctgaac 60
cccgaggagc tcaggccttg gcgcctcgag gtggttctgg accctcctcc ggggcgggag 120
gaggtgtatc cccttctcgc ccaggtggcc cgccgggcgg ggggcgtcac ggtgcgcatg 180
ggagacggcc tcgcctcctg gtcgccccct gaggtcctgg tcttggaggg caccttggcg 240
cggatggggc agacctacgc ctaccgcctc taccccaagg ggaggaggcc tctggacccc 300
aaggacccgg gggagcggag cgtgctttcg gccttggccc gaaggctcct tcaggagcgc 360
ctcaggcgcc tcgagggggt ctgggtggag gggcttgcgg tgtaccggag ggagcacgcc 420
cgggggcccg ggtggcgggt gcttgggggg gcggtcttgg acctttgggt ctccgactcg 480
ggggcgttcc tcctggaggt ggaccccgct taccggatcc tctgcgagat gtccctcgag 540
gcctggcttg cccaaggcca ccctctgccc aaacgggtcc ggaacgccta cgaccggcgc 600
acctgggagc ttctccggct gggagaggaa gaccccaagg agctccccct cccgggcggc 660
ttaagcctcc tggactacca cgcttccaag ggccgcctcc agggccggga aggggggcgg 720
gtggcctggg tggcggaccc aaaggatccg cgaaagccaa tcccccatct gacgggcctt 780
ttggtgcccg tccttaccct ggaagacctt catgaagagg agggaagcct ggccctctcc 840
ttgccttggg aagagcggcg tcgacggacc cgggagatcg ccagctggat cggccggcgc 900
ctggggctgg gcacacctga ggcggtgcgc gcccaggcgt accgcttgag catccccaag 960
ctcatgggca gaagagccgt gagcaagcct gcggacgccc tccgcgtggg gttttaccgg 1020
gcccaggaaa ccgccctggc cctcttgcgc ctggacgggg cccaaggatg gccggagttt 1080
ctccggcggg ccttgctccg ggcctttggg gcgagcgggg cttccctccg tttgcacacc 1140
ctccacgccc atccctccca aggcctggct ttccgcgagg cgctgcggaa ggccaaggag 1200
gagggggtcc aggccgtgct ggtcctcacc ccgcccatgg cctgggaaga ccgcaaccgc 1260
ctgaaggccc ttctcctcag ggaaggcctt cccagccaaa tcctcaacgt ccccctccgg 1320
gaggaggaac gccaccgctg ggagaacgcc ctcctgggcc tcctggccaa ggcggggctt 1380
caggtggtgg ccctgagcgg cgcctatccg gcggagcttg ccgtgggctt tgacgctggc 1440
ggaagggagt cctttcgctt cgggggcgcg gcctgcgccg tgggcgggga cggcggccac 1500
ctcctctgga ccctccccga ggcccaggcc ggggagcgga tcccccagga ggtggtctgg 1560
gacctcttgg aggagaccct ctgggccttc agacgcaagg cggggaggct tccttcccgg 1620
gtcctcctcc ttcgggacgg ccgtgtgccc caggacgagt tcgccctggc cttggaggcc 1680
cttgcccggg aaggcatagc ctacgacttg gtttcggtgc gcaagtcggg aggggggcgg 1740
gtctaccccg tgcaggggcg cctggcggac gggctttacg tccccttgga ggacaagacc 1800
tttcttctcc tcaccgtcca ccgggacttc cggggcacgc cccgacccct gaagctggtg 1860
cacgaggcgg gggacacgcc cctcgaggcc ctggcccacc agattttcca tctgacccgc 1920
ctctacccgg cgagcggttt cgccttcccc cggcttcccg ctccccttca cctggccgac 1980
cgcctggtga aggaggtggg ccggttgggg atccgtcacc tcaaggaggt ggaccgggaa 2040
aagctcttct tcgtttaa 2058
<210>2
<211> 2664
<212> DNA
<213> NgAgo
<400> 2
atgacagtga ttgacctcga ttcgaccacc accgcagacg aactgacatc gggacacacg 60
tacgacatct cagtcacgct caccggtgtc tacgataaca ccgacgagca gcatcctcgc 120
atgtctctcg cattcgagca ggacaacggc gagcggcgtt acattaccct gtggaagaac 180
acgacaccca aggatgtctt tacatacgac tacgccacgg gctcgacgta catcttcact 240
aacatcgact acgaagtgaa ggacggctac gagaatctga ctgcaacata ccagacgacc 300
gtcgagaacg ctaccgctca ggaagtcggg acgactgacg aggacgaaac gttcgcgggc 360
ggcgagccgc tcgaccatca cttggacgac gcgctcaatg agacgccaga cgacgcggag 420
acagagagcg actcaggcca tgtgatgacc tcgttcgcct cccgcgacca actccctgag 480
tggacgctgc atacgtatac gctaacagcc acagacggcg caaagacgga cacggagtac 540
gcgcgacgaa ccctcgcata cacggtacgg caggaactct ataccgacca tgatgcggct 600
ccggttgcaa ctgacgggct aatgcttctc acgccagagc cgctcggcga gaccccgctt 660
gacctcgatt gcggtgtccg ggtcgaggcg gacgagactc ggacactcga ttacaccacg 720
gccaaagacc ggttactcgc ccgcgaactc gtcgaagagg ggctcaaacg ctccctctgg 780
gatgactacc tcgttcgcgg catcgatgaa gtcctctcaa aggagcctgt gctgacttgc 840
gatgagttcg acctacatga gcggtatgac ctctctgtcg aagtcggtca cagtgggcgg 900
gcgtaccttc acatcaactt ccgccaccgg ttcgtaccga agctgacgct cgcagacatc 960
gatgatgaca acatctatcc tgggctccgg gtgaagacga cgtatcgccc ccggcgagga 1020
catatcgtct ggggtctgcg ggacgagtgc gccaccgact cgctcaacac gctgggaaac 1080
cagtccgtcg ttgcatacca ccgcaacaat cagacaccta ttaacactga cctcctcgac 1140
gctatcgagg ccgctgaccg gcgagtcgtc gaaacccgac gtcaagggca cggcgatgat 1200
gctgtctcat tcccccaaga actgcttgcg gtcgaaccga atacgcacca aattaagcag 1260
ttcgcctccg acggattcca ccaacaggcc cgctcaaaga cgcgtctctc ggcctcccgc 1320
tgcagcgaga aagcgcaagc gttcgccgag cggcttgacc cggtgcgtct caatgggtcc 1380
acggtagagt tctcctcgga gtttttcacc gggaacaacg agcagcaact gcgcctcctc 1440
tacgagaacg gtgagtcggt tctgacgttc cgcgacgggg cgcgtggtgc gcaccccgac 1500
gagacattct cgaaaggtat cgtcaatcca ccagagtcgt tcgaggtggc cgtagtactg 1560
cccgagcagc aggcagatac ctgcaaagcg cagtgggaca cgatggctga cctcctcaac 1620
caagctggcg cgccaccgac acggagcgag accgtccaat atgatgcgtt ctcctcgcca 1680
gagagcatca gcctcaatgt ggctggagcc atcgacccta gcgaggtaga cgcggcattc 1740
gtcgtactgc cgccggacca agaaggattc gcagacctcg ccagtccgac agagacgtac 1800
gacgagctga agaaggcgct tgccaacatg ggcatttaca gccagatggc gtacttcgac 1860
cggttccgcg acgcgaaaat attctatact cgtaacgtgg cactcgggct gctggcagcc 1920
gctggcggcg tcgcattcac aaccgaacat gcgatgcctg gggacgcaga tatgttcatt 1980
gggattgatg tctctcggag ctaccccgag gacggtgcca gcggccagat aaacattgcc 2040
gcgacggcga ccgccgtcta caaggatgga actatcctcg gccactcgtc cacccgaccg 2100
cagctcgggg agaaactaca gtcgacggat gttcgtgaca ttatgaagaa tgccatcctc 2160
ggctaccagc aggtgaccgg tgagtcgccg acccatatcg tcatccaccg tgatggcttc 2220
atgaacgaag acctcgaccc cgccacggaa ttcctcaacg aacaaggcgt cgagtacgac 2280
atcgtcgaaa tccgcaagca gccccagaca cgcctgctgg cagtctccga tgtgcagtac 2340
gatacgcctg tgaagagcat cgccgctatc aaccagaacg agccacgggc aacggtcgcc 2400
accttcggcg cacccgaata cttagcgaca cgcgatggag gcggccttcc ccgcccaatc 2460
caaattgaac gagtcgccgg cgaaaccgac atcgagacgc tcactcgcca agtctatctg 2520
ctctcccagt cgcatatcca ggtccataac tcgactgcgc gcctacccat caccaccgca 2580
tacgccgacc aggcaagtac tcacgcgacc aagggttacc tcgtccagac cggagcgttc 2640
gagtctaatg tcggattcct ttaa 2664
<210>3
<211> 2664
<212> DNA
<213> hNgAgo
<400> 3
atgacagtga tagatctgga ttcaacaaca accgcagacg agcttacgtc tggacatact 60
tatgatatca gcgtcactct taccggggtc tacgataaca ctgacgagca gcacccccgc 120
atgtcccttg ctttcgaaca agacaatggc gagcgacgct acataaccct ctggaagaac 180
acaactccca aggacgtctt cacttacgat tatgccacag gcagtacgta tattttcact 240
aatattgact acgaggtcaa ggacggttat gaaaacctta ccgccaccta ccaaacaacg 300
gttgaaaatg ctacagctca agaagtcggc accacggatg aagacgaaac atttgccggg 360
ggcgaaccat tggatcacca cctggatgat gcactgaacg agacccccga tgatgcggaa 420
acggaaagtg attcaggcca tgtaatgaca tcattcgcgt cacgcgatca gctgccggag 480
tggacattgc acacatacac tctcacggcc acggatgggg ctaaaacaga tacggaatac 540
gcgagaagaa ctctggctta cactgttcgg caagaacttt ataccgacca cgacgcagca 600
ccagtggcca ccgacggctt gatgcttctc actcctgagc ctctgggaga gacccctctt 660
gatcttgatt gtggcgtgcg cgttgaggct gacgagacaa ggacgttgga ttacacaacc 720
gcaaaagata gacttctcgc tcgggaactt gtggaggagg ggttgaaacg gtctctttgg 780
gacgattacc tcgtgagggg catagatgaa gtcctgtcaa aggagcccgt gttgacttgt 840
gatgagtttg acctgcacga gcgctatgac ctgtctgtcg aggttggtca ttctggccgg 900
gcttatcttc acattaactt ccgccaccgc ttcgtaccga agctcacgct tgcagacata 960
gatgacgaca acatttatcc ggggttgcgg gtgaaaacaa cctacagacc tcgccgaggc 1020
catatagtct ggggtctccg cgacgaatgt gcgaccgact cccttaatac tttgggtaat 1080
cagtcagtag tagcttatca ccgcaataac cagacaccaa tcaataccga ccttctcgat 1140
gctattgaag ccgcagaccg cagagtcgtc gaaacgcgca ggcaaggaca tggggatgac 1200
gccgtatcat tcccccagga gcttctcgca gtagaaccta atacacatca aataaagcag 1260
ttcgcctccg acgggtttca tcagcaggct aggtctaaga cccgactcag tgcatcaaga 1320
tgttcagaaa aagcacaagc atttgcggag cggcttgacc ctgtgcgatt gaacgggtct 1380
acggtggaat tctcttctga gttcttcacg gggaacaacg agcaacagct ccggttgttg 1440
tacgaaaacg gcgaatccgt gttgaccttt cgggatggtg ccaggggggc ccatcccgac 1500
gaaacattta gtaagggaat agtcaatcca ccagagtcat ttgaggtagc agtcgtgctg 1560
cctgaacagc aggctgacac atgtaaagcc cagtgggaca ctatggcaga cctcttgaat 1620
caggcgggcg ctcctcctac tcgatcagag acggttcaat atgatgcgtt ctcttctcct 1680
gaaagtattt ctctcaatgt agccggtgcg atagacccgt cagaagtcga tgcagcgttc 1740
gtcgttctgc cccctgatca ggagggtttc gctgatcttg cttctccaac cgaaacctat 1800
gacgaactga aaaaagcact tgcgaacatg ggcatttatt ctcaaatggc atacttcgat 1860
cgctttcggg acgctaagat tttctacacc aggaacgttg ccttgggttt gctggcagca 1920
gcgggcggcg tcgcttttac gacagaacac gcgatgcctg gagatgcgga catgtttatt 1980
ggaattgatg tgagccgaag ctatccggaa gatggggcgt caggtcagat taatatagcg 2040
gctaccgcga cggccgtcta taaggacggt acgatattgg gtcactcttc cacgaggcct 2100
caactcggag aaaagctcca atcaactgac gtcagagata taatgaagaa tgcgatattg 2160
ggctatcagc aagtgacggg tgaatcccct acccatattg ttatccatcg cgacggattt 2220
atgaacgaag atttggatcc cgcgactgag tttctcaacg aacagggtgt ggagtatgac 2280
attgtggaga ttaggaaaca accccaaaca cggctcttgg ccgtgtcaga cgtccagtac 2340
gatacgcctg tgaagtcaat tgcagccatc aatcagaacg aaccccgggc gaccgttgcg 2400
acctttggag ctccggagta tcttgcgact cgcgatggcg gagggttgcc gagaccgata 2460
cagatagaga gggtcgccgg cgaaacggat atagaaacgc tcacacgcca agtatacctt 2520
ctttctcaat ctcatatcca ggtgcacaac tcaacggctc gcttgcccat aacgacggca 2580
tacgctgacc aggcgtcaac gcatgcgacg aagggttatc tggtacaaac gggggcgttc 2640
gagagtaacg tcggtttttt gtaa 2664
<210>4
<211> 35
<212> DNA
<213> NdeI-Tt-F
<400> 4
ggaattccat atgaaccacc ttggaaaaac ggaag 35
<210>5
<211> 32
<212> DNA
<213> HindIII-TAA-TtV685-R
<400> 5
cccaagcttt taaacgaaga agagcttttc cc 32
<210>6
<211> 22
<212> DNA
<213> BglII-araC-R
<400> 6
caagatctcc ccgaaaagtg cc 22
<210>7
<211> 23
<212> DNA
<213> XbaI-pBAD-R
<400> 7
tgctctagag aattcccaaa aaa 23
<210>8
<211> 29
<212> DNA
<213> XhoI-dapD-F
<400> 8
aatctcgagc cgtattaatg ataatcagg 29
<210>9
<211> 21
<212> DNA
<213> HindIII-dapD-R
<400> 9
aataagcttc atatgcgccg a 21
<210>10
<211> 49
<212> DNA
<213> XhoI-T7P-dapD-F
<400> 10
aatctcgagt aatacgactc actatagggc cgtattaatg ataatcagg 49
<210>11
<211> 20
<212> DNA
<213> dapD-T7P-overlap-R
<400> 11
cctgattatc attaatacgg 20
<210>12
<211> 20
<212> DNA
<213> dapD-overlap-F
<400> 12
ccgtattaat gataatcagg 20
<210>13
<211> 29
<212> DNA
<213> P2A-RFP-pA-F(PstI)
<400> 13
aagctgcagt agacgcgttg gccacgaac 29
<210>14
<211> 29
<212> DNA
<213> P2A-RFP-Pa-R(XhoI)
<400> 14
taactcgagc catagagccc accgcatcc 29
<210>15
<211> 29
<212> DNA
<213> T2A-GFP-F(BglII)
<400> 15
tggagatctg gcagtggaga gggcagagg 29
<210>16
<211> 29
<212> DNA
<213> T2A-GFP-R(PstI)
<400> 16
ctactgcagc ttgtacagct cgtccatgc 29
<210>17
<211> 45
<212> DNA
<213> AAVS1-R(BamHI)
<400> 17
ctgtggggtg gaggggacag ggatccgaag aagatggtgc gctcc 45
<210>18
<211> 50
<212> DNA
<213> AAVS1-F(HindIII)
<400> 18
ctgtcccctc caccccacag tggaagcttc acaagctgga gtacaactac 50
<210>19
<211> 20
<212> DNA
<213> dapD-F
<400> 19
ccgtattaat gataatcagg 20
<210>20
<211> 20
<212> DNA
<213> dapD-R
<400> 20
catatgcgcc gatgttgacg 20
<210>21
<211> 20
<212> DNA
<213> T7p17-F
<400> 21
atggctaaga agattttcac 20
<210>22
<211> 20
<212> DNA
<213> T7p17-R
<400> 22
ttagaagtct ccgtcttcgt 20
<210>23
<211> 22
<212> DNA
<213> AAVS1a-F
<400> 23
acagcatgtt tgctgcctcc ag 22
<210>24
<211> 22
<212> DNA
<213> AAVS1a-R
<400> 24
ctaacaggag gtgggggtta ga 22
<210>25
<211> 20
<212> DNA
<213> AAVS1a基因位点
<400> 25
ctgtcccctc caccccacag 20
Claims (10)
1.一种基于pAgo的基因编辑系统,其特征在于:该基因编辑系统包括核酸酶表达载体,所述核酸酶表达载体包括通过启动子的调控实现表达的原核Argonaute蛋白基因序列,所述核酸酶表达载体表达的原核Argonaute蛋白具有被转录本激活并靶向该转录本对应DNA序列的核酸酶活性。
2.根据权利要求1所述一种基于pAgo的基因编辑系统,其特征在于:所述原核Argonaute蛋白基因序列选自NgAgo蛋白基因序列、TtAgo蛋白基因序列或选自根据目标宿主细胞的密码子偏好优化后的NgAgo、TtAgo蛋白基因序列。
3.根据权利要求1所述一种基于pAgo的基因编辑系统,其特征在于:所述基因编辑系统还包括RNA导引激活序列表达载体,RNA导引激活序列表达载体包括通过启动子的调控实现作为所述转录本的RNA导引激活序列的表达的模板。
4.根据权利要求3所述一种基于pAgo的基因编辑系统,其特征在于:所述RNA导引激活序列选自目标宿主细胞基因组靶序列的同源序列。
5.根据权利要求3所述一种基于pAgo的基因编辑系统,其特征在于:所述RNA导引激活序列的长度大于10nt。
6.根据权利要求3所述一种基于pAgo的基因编辑系统,其特征在于:所述核酸酶表达载体中,启动子选自T7启动子、阿拉伯糖启动子或CMV启动子;所述RNA导引激活序列表达载体中,启动子选自U6类启动子。
7.根据权利要求3所述一种基于pAgo的基因编辑系统,其特征在于:所述基因编辑系统还包括与RNA导引激活序列互补配对的单链DNA片段。
8.根据权利要求7所述一种基于pAgo的基因编辑系统,其特征在于:所述基因编辑系统中,核酸酶表达载体含量按物质的量计为单链DNA片段含量的3倍以内。
9.根据权利要求1所述一种基于pAgo的基因编辑系统,其特征在于:所述基因编辑系统还包括报告载体和/或用于进行同源重组修复的供体载体,所述报告载体包括报告基因表达盒,所述报告基因表达盒包括报告基因序列以及位于该序列上游的与目标宿主细胞基因组靶序列同源的序列。
10.根据权利要求2、4或9所述一种基于pAgo的基因编辑系统,其特征在于:所述目标宿主细胞选自真核细胞。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110365085.3A CN112941107B (zh) | 2021-04-01 | 2021-04-01 | 原核Argonaute蛋白的基因编辑应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110365085.3A CN112941107B (zh) | 2021-04-01 | 2021-04-01 | 原核Argonaute蛋白的基因编辑应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112941107A true CN112941107A (zh) | 2021-06-11 |
CN112941107B CN112941107B (zh) | 2024-01-23 |
Family
ID=76230614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110365085.3A Active CN112941107B (zh) | 2021-04-01 | 2021-04-01 | 原核Argonaute蛋白的基因编辑应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112941107B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114277109A (zh) * | 2021-10-21 | 2022-04-05 | 上海交通大学 | 基于常温原核Argonaute蛋白的核酸检测方法及其应用 |
CN115458063A (zh) * | 2022-09-22 | 2022-12-09 | 云舟生物科技(广州)股份有限公司 | 载体推荐方法、系统、计算机存储介质及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105483118A (zh) * | 2015-12-21 | 2016-04-13 | 浙江大学 | 以Argonaute核酸酶为核心的基因编辑技术 |
CN107805634A (zh) * | 2016-09-07 | 2018-03-16 | 北京大学 | 用于序列操纵的Argonaute‑核酸序列组分系统、方法以及组合物 |
US20190002868A1 (en) * | 2017-06-28 | 2019-01-03 | New England Biolabs, Inc. | In Vitro Cleavage of DNA Using Argonaute |
US20190284547A1 (en) * | 2018-03-16 | 2019-09-19 | Purdue Research Foundation | Ngago-based gene-editing method and the uses thereof |
US20190292537A1 (en) * | 2016-07-12 | 2019-09-26 | Wageningen Universiteit | Prokaryotic Argonaute Proteins and Uses Thereof |
CN111850051A (zh) * | 2020-07-06 | 2020-10-30 | 西北农林科技大学 | 双供体介导的基于药物/荧光协同筛选的双等位基因编辑系统 |
CN112538470A (zh) * | 2020-12-11 | 2021-03-23 | 湖北大学 | 一种原核生物来源的Argonaute蛋白及其应用 |
-
2021
- 2021-04-01 CN CN202110365085.3A patent/CN112941107B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105483118A (zh) * | 2015-12-21 | 2016-04-13 | 浙江大学 | 以Argonaute核酸酶为核心的基因编辑技术 |
US20190292537A1 (en) * | 2016-07-12 | 2019-09-26 | Wageningen Universiteit | Prokaryotic Argonaute Proteins and Uses Thereof |
CN107805634A (zh) * | 2016-09-07 | 2018-03-16 | 北京大学 | 用于序列操纵的Argonaute‑核酸序列组分系统、方法以及组合物 |
US20190002868A1 (en) * | 2017-06-28 | 2019-01-03 | New England Biolabs, Inc. | In Vitro Cleavage of DNA Using Argonaute |
US20190284547A1 (en) * | 2018-03-16 | 2019-09-19 | Purdue Research Foundation | Ngago-based gene-editing method and the uses thereof |
CN111850051A (zh) * | 2020-07-06 | 2020-10-30 | 西北农林科技大学 | 双供体介导的基于药物/荧光协同筛选的双等位基因编辑系统 |
CN112538470A (zh) * | 2020-12-11 | 2021-03-23 | 湖北大学 | 一种原核生物来源的Argonaute蛋白及其应用 |
Non-Patent Citations (3)
Title |
---|
JIANI XING ET AL.: ""Expression and Functional Analysis of the Argonaute Protein of Thermus thermophilus (TtAgo) in E. coli BL21(DE3)"", 《BIOMOLECULES》, vol. 11, pages 1 - 21 * |
JIANI XING ET AL.: ""Prokaryotic Argonaute Protein from Natronobacterium gregoryi Requires RNAs To Activate for DNA Interference In Vivo"", 《MBIO》, vol. 13, no. 2, pages 1 - 15 * |
KOK ZHI LEE ET AL.: ""NgAgo DNA endonuclease activity enhances homologous recombination in E. coli"", 《BIORXIV》, pages 1 - 26 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114277109A (zh) * | 2021-10-21 | 2022-04-05 | 上海交通大学 | 基于常温原核Argonaute蛋白的核酸检测方法及其应用 |
CN114277109B (zh) * | 2021-10-21 | 2023-12-26 | 上海交通大学 | 基于常温原核Argonaute蛋白的核酸检测方法及其应用 |
CN115458063A (zh) * | 2022-09-22 | 2022-12-09 | 云舟生物科技(广州)股份有限公司 | 载体推荐方法、系统、计算机存储介质及电子设备 |
CN115458063B (zh) * | 2022-09-22 | 2023-06-16 | 云舟生物科技(广州)股份有限公司 | 载体推荐方法、系统、计算机存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112941107B (zh) | 2024-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7088528B2 (ja) | 熱安定性cas9ヌクレアーゼ | |
AU2017377136B2 (en) | Thermostable Cas9 nucleases | |
KR101745863B1 (ko) | Crispr/cas9 시스템을 이용한 프로히비틴2 유전자 제거용 시발체 | |
EP3222728B1 (en) | Method for regulating gene expression using cas9 protein expressed from two vectors | |
KR101795999B1 (ko) | Crispr/cas9 시스템을 이용한 베타2-마이크로글로불린 유전자 제거용 시발체 | |
CN113811607A (zh) | CRISPR-Cas效应子多肽和其使用方法 | |
CA2983364A1 (en) | Compositions and methods for the treatment of nucleotide repeat expansion disorders | |
CN112941107B (zh) | 原核Argonaute蛋白的基因编辑应用 | |
CN109880851B (zh) | 用于富集CRISPR/Cas9介导的同源重组修复细胞的筛选报告载体及筛选方法 | |
EP4159853A1 (en) | Genome editing system and method | |
US20200339974A1 (en) | Cell labelling, tracking and retrieval | |
CN112899237A (zh) | Cdkn1a基因报告细胞系及其构建方法和应用 | |
CN106636154B (zh) | sgRNA筛选系统和方法 | |
WO2021093752A1 (zh) | Crispr家族蛋白与核酸的定点偶联方法及其偶联物和用途 | |
CN113302303A (zh) | 经修饰的丝状真菌宿主细胞 | |
CN113943690B (zh) | 魏氏柠檬酸杆菌tpiA基因敲除突变株及其应用 | |
RU2488633C1 (ru) | ЭКСПРЕССИОННЫЙ ПЛАЗМИДНЫЙ ВЕКТОР ДЛЯ ГЕТЕРОЛОГИЧНОЙ ЭКСПРЕССИИ РЕКОМБИНАНТНЫХ БЕЛКОВ, ВЫСОКОЧАСТОТНОЙ ИНТЕГРАЦИИ И УСИЛЕННОЙ АМПЛИФИКАЦИИ ЭКСПРЕССИОННОЙ КАССЕТЫ В КЛЕТКАХ МЛЕКОПИТАЮЩИХ, БИЦИСТРОННАЯ мРНК, СПОСОБ ПОЛУЧЕНИЯ СТАБИЛЬНЫХ ЛИНИЙ ПРОДУЦЕНТОВ РЕКОМБИНАНТНЫХ БЕЛКОВ С ИСПОЛЬЗОВАНИЕМ УКАЗАННОГО ВЕКТОРА, СПОСОБ ПОЛУЧЕНИЯ РЕКОМБИНАНТНЫХ БЕЛКОВ | |
CA3225082A1 (en) | Enzymes with ruvc domains | |
US11203760B2 (en) | Gene therapy DNA vector GDTT1.8NAS12 and the method for obtaining thereof | |
CN111004800B (zh) | 靶向HPV亚型16/18癌基因E6/E7的CRISPR/Cas9系统 | |
CN108486115B (zh) | 一种用于淡水螯虾细胞外源基因表达的转染方法及其应用 | |
WO2021249536A1 (zh) | 含barstar基因的工程菌及其在barnase基因克隆中的应用 | |
US20210308282A1 (en) | Gene therapy dna vectors based on vtvaf17 | |
Li et al. | Heterologous Expression of Fluorescent Protein Gene in E. Coli DH5α | |
CN117568369A (zh) | 一种快速筛选与诱饵rna结合的蛋白系统及方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |