CN117487778A - 一种全新的基于CRISPR-Cas12b的碱基编辑器的构建及其应用 - Google Patents
一种全新的基于CRISPR-Cas12b的碱基编辑器的构建及其应用 Download PDFInfo
- Publication number
- CN117487778A CN117487778A CN202311435035.3A CN202311435035A CN117487778A CN 117487778 A CN117487778 A CN 117487778A CN 202311435035 A CN202311435035 A CN 202311435035A CN 117487778 A CN117487778 A CN 117487778A
- Authority
- CN
- China
- Prior art keywords
- dbhcas12b
- ugi
- gene
- editing
- cda
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title abstract description 32
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 62
- 230000014509 gene expression Effects 0.000 claims abstract description 38
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 29
- 241000588724 Escherichia coli Species 0.000 claims abstract description 26
- 230000035772 mutation Effects 0.000 claims abstract description 18
- 235000018102 proteins Nutrition 0.000 claims description 26
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 21
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 16
- 108020001507 fusion proteins Proteins 0.000 claims description 16
- 102000037865 fusion proteins Human genes 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 16
- 210000004027 cell Anatomy 0.000 claims description 14
- 102100026846 Cytidine deaminase Human genes 0.000 claims description 12
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 12
- 244000063299 Bacillus subtilis Species 0.000 claims description 9
- 229940113491 Glycosylase inhibitor Drugs 0.000 claims description 8
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims description 8
- 229940035893 uracil Drugs 0.000 claims description 8
- 102000010970 Connexin Human genes 0.000 claims description 6
- 108050001175 Connexin Proteins 0.000 claims description 6
- 238000002818 protein evolution Methods 0.000 claims description 6
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 4
- 229960005305 adenosine Drugs 0.000 claims description 4
- 235000004279 alanine Nutrition 0.000 claims description 4
- 235000003704 aspartic acid Nutrition 0.000 claims description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 2
- 210000004899 c-terminal region Anatomy 0.000 claims description 2
- 235000013922 glutamic acid Nutrition 0.000 claims description 2
- 239000004220 glutamic acid Substances 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 6
- 239000013604 expression vector Substances 0.000 claims 3
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 claims 1
- 244000005700 microbiome Species 0.000 abstract description 5
- 238000010353 genetic engineering Methods 0.000 abstract description 4
- 230000000415 inactivating effect Effects 0.000 abstract description 2
- 238000012269 metabolic engineering Methods 0.000 abstract description 2
- 238000011065 in-situ storage Methods 0.000 abstract 1
- 239000013612 plasmid Substances 0.000 description 45
- 239000002585 base Substances 0.000 description 23
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 20
- 108091027544 Subgenomic mRNA Proteins 0.000 description 19
- 238000012163 sequencing technique Methods 0.000 description 19
- 238000012795 verification Methods 0.000 description 15
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 13
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 13
- 230000000694 effects Effects 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- 101100363550 Leptospira borgpetersenii serovar Hardjo-bovis (strain L550) rpsE2 gene Proteins 0.000 description 11
- 101150027173 rpsE gene Proteins 0.000 description 11
- 101100254826 Methanopyrus kandleri (strain AV19 / DSM 6324 / JCM 9639 / NBRC 100938) rps5 gene Proteins 0.000 description 10
- 208000031752 chronic bilirubin encephalopathy Diseases 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 9
- 230000005764 inhibitory process Effects 0.000 description 9
- 101150082821 sacA gene Proteins 0.000 description 9
- 101100095205 Lactococcus lactis subsp. lactis scrB gene Proteins 0.000 description 8
- 238000010362 genome editing Methods 0.000 description 8
- 238000012216 screening Methods 0.000 description 8
- 230000028327 secretion Effects 0.000 description 8
- 235000019877 cocoa butter equivalent Nutrition 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000012010 growth Effects 0.000 description 7
- 230000005026 transcription initiation Effects 0.000 description 7
- 230000010354 integration Effects 0.000 description 6
- 238000007852 inverse PCR Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 101150104204 pksC gene Proteins 0.000 description 6
- 229960000268 spectinomycin Drugs 0.000 description 6
- 101100162199 Aspergillus parasiticus (strain ATCC 56775 / NRRL 5862 / SRRC 143 / SU-1) aflC gene Proteins 0.000 description 5
- 101100029905 Bacillus subtilis (strain 168) pksE gene Proteins 0.000 description 5
- 101100029913 Bacillus subtilis (strain 168) pksG gene Proteins 0.000 description 5
- 101100029917 Bacillus subtilis (strain 168) pksL gene Proteins 0.000 description 5
- 238000010446 CRISPR interference Methods 0.000 description 5
- 101150078289 PKSA gene Proteins 0.000 description 5
- 238000012258 culturing Methods 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 238000011835 investigation Methods 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 5
- 108091005946 superfolder green fluorescent proteins Proteins 0.000 description 5
- 241000276408 Bacillus subtilis subsp. subtilis str. 168 Species 0.000 description 4
- 239000002028 Biomass Substances 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 4
- 240000005373 Panax quinquefolius Species 0.000 description 4
- 235000003140 Panax quinquefolius Nutrition 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 101100325906 Bacillus subtilis (strain 168) ganA gene Proteins 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- 101100111413 Thermoanaerobacter pseudethanolicus (strain ATCC 33223 / 39E) lacZ gene Proteins 0.000 description 3
- 101150009206 aprE gene Proteins 0.000 description 3
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000003209 gene knockout Methods 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 101150086432 lacA gene Proteins 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 101710192514 30S ribosomal protein S5 Proteins 0.000 description 2
- 101710107640 40S ribosomal protein S2 Proteins 0.000 description 2
- 102100037563 40S ribosomal protein S2 Human genes 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 108010090127 Periplasmic Proteins Proteins 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 102000048646 human APOBEC3A Human genes 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 2
- 210000001322 periplasm Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000012137 tryptone Substances 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- NOIIUHRQUVNIDD-UHFFFAOYSA-N 3-[[oxo(pyridin-4-yl)methyl]hydrazo]-N-(phenylmethyl)propanamide Chemical compound C=1C=CC=CC=1CNC(=O)CCNNC(=O)C1=CC=NC=C1 NOIIUHRQUVNIDD-UHFFFAOYSA-N 0.000 description 1
- BDDLHHRCDSJVKV-UHFFFAOYSA-N 7028-40-2 Chemical compound CC(O)=O.CC(O)=O.CC(O)=O.CC(O)=O BDDLHHRCDSJVKV-UHFFFAOYSA-N 0.000 description 1
- 241001063273 Alicyclobacillus acidiphilus Species 0.000 description 1
- 241000193412 Alicyclobacillus acidoterrestris Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000825009 Bacillus hisashii Species 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000186226 Corynebacterium glutamicum Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 101100533923 Listeria monocytogenes serotype 4b (strain F2365) spoVG1 gene Proteins 0.000 description 1
- 101100533926 Listeria monocytogenes serotype 4b (strain F2365) spoVG2 gene Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000017095 negative regulation of cell growth Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000000424 optical density measurement Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 101150091126 pksE gene Proteins 0.000 description 1
- 101150115152 pksG gene Proteins 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 101150005228 sigE gene Proteins 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 101150075675 tatC gene Proteins 0.000 description 1
- JDFUJAMTCCQARF-UHFFFAOYSA-N tatb Chemical compound NC1=C([N+]([O-])=O)C(N)=C([N+]([O-])=O)C(N)=C1[N+]([O-])=O JDFUJAMTCCQARF-UHFFFAOYSA-N 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明公开了一种全新的基于CRISPR‑Cas12b的碱基编辑器的构建及其应用,属于基因工程技术领域。本发明通过对BhCas12b进行失活突变,获得了失活版本的dBhCas12b。本发明基于dBhCas12b,在微生物中构建了具有拓展编辑窗口的碱基编辑器,编辑窗口在大肠杆菌中最高可达63nt,是目前微生物细胞中编辑窗口最宽的CBE系统。最终,本发明将该系统用于基因表达的多样化以及蛋白质的原位进化中,并且获得了一系列梯度表达的构建体以及高版本底盘细胞。本发明提供了一种超宽编辑窗口的新型BE系统,该系统能够在代谢工程、蛋白质工程以及基因工程的各个方面体现出巨大的应用价值。
Description
技术领域
本发明涉及一种全新的基于CRISPR-Cas12b的碱基编辑器的构建及其应用,属于基因工程技术领域。
背景技术
碱基编辑器(Base Editor,BE)作为CRISPR-Cas作为第三代基因编辑技术的应用,能够在不依赖于双联DNA断裂(DSBs)的情况下,通过脱氨酶的脱氨基作用能够直接诱导C到T或者A到G的转换,在动植物细胞中被广泛应用。
但是,目前的BE方案,在应用中存在编辑窗口短的问题,现存BE的编辑窗口大约为5~6nt(Highly efficient DSB-free base editing forstreptomycetes with CRISPR-BEST;MACBETH:Multiplex automated Corynebacterium glutamicum baseeditingmethod;Programmable editing of atarget base in genomicDNA withoutdouble-stranded DNA cleavage;Targeted nucleotide editing using hybridprokaryotic andvertebrate adaptive immune systems),这也就意味着,至多能产生2~3个氨基酸的突变。为了拓宽BE编辑窗口,Zong等(Efficient C-to-T base editing inplants using a fusion of nCas9 and human APOBEC3A)通过将人源APOBEC3A与Cas9结合,在植物中使得BE的编辑窗口从5nt拓展到了17nt。Banno等(Deaminase-mediatedmultiplex genome editing in Escherichia coli)在大肠杆菌中通过构建4个sgRNA,实现了对41个位点的同时编辑,但其BE窗口只有5nt。专利CN 116685684 A披露了将BhCas12b失活突变,在动物细胞内构建了BE系统。现有技术中尚无在微生物中构建具有拓宽的BE窗口的研究。
发明内容
为了解决上述技术问题,本发明构建了基于dBhCas12b的BE系统,这些系统在枯草芽孢杆菌Bacillussubtilis和大肠杆菌Escherichiacoli中均能工作并且具有扩展的编辑窗口,该系统能够在代谢工程、蛋白质工程以及基因工程的各个方面体现出巨大的应用价值。
本发明的第一个目的是提供一种融合蛋白,所述融合蛋白包括脱氨酶和Cas蛋白突变体dBhCas12b;所述脱氨酶位于所述Cas蛋白突变体dBhCas12b的N端;
所述dBhCas12b相较于原始序列,发生了包括以下位点的突变:第574位天冬氨酸、第828位谷氨酸E和第952位天冬氨酸突变为了丙氨酸A;所述原始序列的氨基酸序列如SEQID NO.3所示;
所述脱氨酶包括胞苷脱氨酶CDA或腺苷碱基编辑器ABE8e。
在本发明的一种实施方式中,所述胞苷脱氨酶CDA的氨基酸序列如SEQ ID NO.1所示。
在本发明的一种实施方式中,所述腺苷碱基编辑器ABE8e的氨基酸序列如SEQ IDNO.2所示。
在本发明的一种实施方式中,所述融合蛋白还包含了尿嘧啶糖基化酶抑制剂结构域UGI。
在本发明的一种实施方式中,所述尿嘧啶糖基化酶抑制剂结构域UGI位于所述Cas蛋白突变体dBhCas12b的C端。
在本发明的一种实施方式中,所述尿嘧啶糖基化酶抑制剂结构域UGI的氨基酸序列如SEQ ID NO.4所示。
在本发明的一种实施方式中,所述胞苷脱氨酶CDA通过连接蛋白1与Cas蛋白突变体dBhCas12b连接,Cas蛋白突变体dBhCas12b通过连接蛋白2与尿嘧啶糖基化酶抑制剂(UGI)结构域连接;所述CDA和dBhCas12b的连接蛋白1的氨基酸序列为(GSAASR)n;dBhCas12b和UGI的连接蛋白的氨基酸序列为(GPKKKRKVGT)n,其中n独立地为1-30的整数。
在一种实施方式终,所述CDA和dBhCas12b的连接蛋白1的氨基酸序列为GSAASR;dBhCas12b和UGI的连接蛋白2的氨基酸序列为GPKKKRKVGT。
本发明的第二个目的是提供一种编码上述融合蛋白的基因。
本发明的第三个目的是提供一种含有上述融合蛋白的质粒。
所述质粒的出发质粒包括但不限于质粒pAX01。
本发明的第四个目的是提供一种重组细胞,所述重组细胞含有上述融合蛋白的基因或上述质粒。
在本发明的一种实施方式中,所述重组细胞包括枯草芽孢杆菌或大肠杆菌。
在本发明的一种实施方式中,所述枯草芽孢杆菌包括B.subtilis 168。
在本发明的一种实施方式中,所述大肠杆菌包括E.coli JM109或E.coli BL21(DE3)。
本发明的第五个目的是提供所述融合蛋白,或所述基因,或所述质粒,或所述基重组细胞在基因表达和/或蛋白质进化中的应用。
在一种实施方式中,所述应用为将所述融合蛋白,或所述基因,或所述质粒,或所述基重组细胞用于RBS的突变,进而筛选具有高蛋白表达效果的RBS。
在一种实施方式中,所述应用为将所述融合蛋白,或所述基因,或所述质粒,或所述基重组细胞用于靶向目的蛋白,对蛋白质进行突变,进而筛选具有特定性能的蛋白质。
本发明的有益效果:
(1)碱基编辑元件CDA-dBhCas12b-UGI-UGI在枯草芽孢杆菌中的编辑窗口达到了19nt,碱基编辑元件ABE8e-dBhCas12b在枯草芽孢杆菌中的编辑窗口达到了14nt,分别是现有微生物碱基编辑器的3.8和2.33倍;
碱基编辑元件CDA-dBhCas12b-UGI在大肠杆菌中的编辑窗口达到了63nt,是现有微生物碱基编辑器的12.8倍。
(2)提供了碱基编辑元件在枯草芽孢杆菌多样化基因表达中的应用,以碱基编辑元件CDA-dBhCas12b-UGI-UGI进行RBS突变,构建得到了较对照提升68.1倍eGFP表达水平的突变体,实现了多样化基因表达。
(3)提供了碱基编辑元件在蛋白质进化中的应用,以碱基编辑器CDA-dBhCas12b-UGI进行TatABC的定向进化,得到了sfGFP荧光强度表达相较于野生型分泌能力提升6.49倍的突变体。
附图说明
图1:CRISPR-Cas12b在B.subtilis中敲除性能的考察,a:CRISPR-Cas12b的工作示意图;b:CRISPR-AaCas12b的质粒构建示意图;c:CRISPR-AaCas12b对sacA的敲除效率;d:CRISPR-BhCas12b的质粒构建示意图;e:CRISPR-BhCas12b对sacA的敲除效率;f:CRISPR-BhCas12b对aprE的敲除效率。
图2:影响BhCas12b核酸酶活性关键候选位点的确定,a:不同来源Cas12b一级序列比对;b:BhCas12b组织结构示意图;c:BhCas12b和sgRNA对接示意图;d:敲除sacA的探针质粒用于快速鉴定BhCas12b关键核酸酶活性位点的流程示意图;e-g:关键位点(D574,E828,D952)的逐一丙氨酸突变对sacA敲除效率的影响。
图3:CRISPR-dBhCas12b在B.subtilis中抑制基因表达的验证,a:CRISPR-dBhCas12b在B.subtilis中的构建示意图;b:CRISPR-dBhCas12b在表达或不表达时对宿主生物量的影响;c:CRISPR-dBhCas12b的表达对宿主产生总荧光强度的影响;d:CRISPR-dBhCas12b的表达对宿主产生单位荧光强度的影响。
图4:CRISPR-dBhCas12b在B.subtilis中抑制启动子转录起始的验证,a:CRISPR-dBhCas12b在B.subtilis中用于抑制启动子转录起始的构建示意图;b-g:通过单位荧光强度测定,反映CRISPR-dBhCas12b的表达对启动子转录起始活性的影响。
图5:B.subtilis中基于dBhCas12b的BE系统的构建及验证,a:基于dBhCas12b的不同CBE系统的构建;b:不同CBE系统对不同基因(pksA和pksC)编辑性能的考察;c:CBE-d对不同基因(pksE和pksG)编辑性能的考察;d:基于dBhCas12b的ABE系统的构建;e:ABE系统对sigE基因编辑性能的考察;图5b、5c中,5’端(左侧)前4个碱基为对应的PAM序列;浅色的T代表发生了C到T的突变。
图6:基于dBhCas12b的CBE系统在基因表达多样化上的应用,a:基于dBhCas12b的CBE系统在多样化表达元件RBS以及筛选高强度RBS的流程示意图;b:利用CBE系统多样化eGFP的RBS元件,进而筛选高强度表达eGFP的RBS突变体。
图7:基于dBhCas12b的CBE系统在E.coli中的构建及验证,a:CBE系统在E.coli中的构建以及突变体筛选流程示意图;b:CBE系统在E.coli中编辑rpsE基因不同位点的群体测序结果;c:氨苄青霉素平板上编辑rpsE不同位点的单克隆测序结果;d:壮观霉素平板上编辑rpsE不同位点的单克隆测序结果;e:不同rpsE突变体在100μg/ml的壮观霉素条件下的生长状况;f:不同rpsE突变体突变位点的鉴定结果。
图8:不同dCas蛋白构成的CBE系统在E.coli中编辑性能的考察,a:不同CBE系统基因靶点的选择;b:dBhCas12b构成的CBE系统在不同基因中编辑性能的考察;c:dFnCas12a构成的CBE系统在不同基因中编辑性能的考察;b:dSpCas9构成的CBE系统在不同基因中编辑性能的考察;b:不同dCas蛋白构成的CBE系统对E.coli生长的影响。
图9:基于dBhCas12b的CBE系统在E.coli中蛋白质进化的应用,a:TatABC基因复合体的组织结构示意图;b:用于筛选高活性TacABC突变体系统的构建及其流程示意图;c:不同TatABC突变体总的周质荧光水平;d:不同TatABC突变体的生物量;e:不同TatABC突变体产生的单位周质荧光水平;f:不同TatABC突变体在蓝光仪照射下荧光强度的直视图。
具体实施方式
以下实施例试剂购买自生工生物工程(上海)公司。
(一)培养基
LB培养基(g·L-1):胰蛋白胨(Tryptone)10;酵母提取物(Yeast extract)5;氯化钠(NaCl)10。
SPI培养基(g·L-1):配方参考文献:Construction and application of anefficient dual-base editing platform for Bacillus subtilis evolutionemployingprogrammable base conversion。
(二)B.subtilis168质粒转化方法
挑单菌落B.subtilis 168接种至2mL的SPI培养基中,37℃摇床培养12-14h;从培养物中取100μL,接种至5mL SPI培养基中,37℃摇床培养4-5h后开始测OD600。当OD600约为1.0时,移取200μL菌液转接至2mL的SPI培养基中,于37℃、100r·min-1摇床孵育1.5h;向管中加入20μL 100×EGTA(乙二醇双(α-氨基乙基醚)四乙酸)溶液,于37℃、100r·min-1摇床中培养10min后分装500μL每l.5mL离心管;向管中加入经过测序验证正确的质粒10μg,吹吸混匀放置于37℃、100r·min-1的摇床中培养2h;培养结束,吸取菌液约200μL均匀涂相应的选择性平板,37℃过夜培养12-14h。
(三)B.subtilis168基因组整合方法(以pAX-CDA-dBhCas12b-UGI-UGI为例)
首先,使用表2所述引物lacA-dCas9-F和lacA-dCas9-R去扩增目的基因CDA-dBhCas12b-UGI-UGI以及两侧的lacA整合位点的同源臂(上游同源臂800bp;下游同源臂691bp)和氯霉素抗性基因。然后,对目的片段进行纯化备用。根据上述方法制作B.subtilis感受态并将纯化好的片段转化进去,复苏培养2h。最后,将复苏好的菌液均匀涂布到氯霉素筛选LB平板上。生长起来的克隆被用作模板用于PCR目的片段来鉴定阳性克隆。
(四)单克隆编辑效率的测定
对于单克隆测序:在基因编辑完成后,将混合编辑溶液进行稀释并涂布到含相应抗生素平板上,以单克隆为模板进行PCR并将PCR产生进行测序,从而鉴定编辑效率。
(五)群体编辑效率的测定
对于群体测序:在基因编辑完成后,吸取编辑后的混合培养物作为模板,用定制的引物扩增突变的位置,并将混合产生用于测序,使用软件BEAT去分析测序产生的色谱图,从而给出编辑频率。
(六)周质蛋白的提取方法
1)将待处理的细胞在3500-4500rpm,4℃离心10min,弃上清,并用PBS清洗细胞1次;2)按1:40(v/v)加入40mM pH 9.0精氨酸溶液(HCl调pH),轻柔吹吸混匀后至于4℃冰浴30min(这一步细胞容易裂解,吹吸的剪切力过大或处理时间太长都会造成胞内蛋白释放,导致最终结果偏高);3)4500rpm 4℃离心10min,收集上清液,即为周质组分,用PBS重悬并洗涤沉淀部分(1-3次),即为胞内组分。
(七)本发明涉及的引物及序列、菌株、sgRNA序列
表1本发明所使用的引物及其核苷酸序列
/>
/>
/>
/>
表2本发明涉及的菌株
/>
/>
表3本发明涉及的sgRNA及其核苷酸序列
/>
/>
/>
实施例1 dBhCas12b的改造与验证
(1)不同来源的CRISPR-Cas12b在B.subtilis中基因编辑效率的考察
CRISPR-Cas12b的工作原理如图1a所示。
基因敲除质粒的构建
具体构建方法如下:首先,以AaCas12b(基因由安升达合成)、BhCas12b(基因由安升达合成)以及pHT-AIO-sacA(构建方法参考文献:Haoetal.Front.Bioeng.Biotechnol,2020,8:524676)作为模板,使用引物AaCas12b-F/AaCas12b-R、BhCas12b-F/BhCas12b-R、BhCas12b-b-F/BhCas12b-b-R以及AaCas12b-b-F/AaCas12b-b-R分别扩增AaCas12b基因、BhCas12b基因以及他们对应的骨架。通过核酸电泳凝胶确定扩增出片段以后,对其片段进行模板消化,约2~3小时(DpnI,Takara)。随后对消化的片段产物进行纯化(使用试剂盒:DNA片段纯化,康为世纪)以除去杂质。随后,使用ABclonal DNA重组试剂盒将片段两两组合,得到重组质粒:pHT-AaCas12b和pHT-BhCas12b。以pHT-AIO-sacA、pHT-AaCas12b和pHT-BhCas12b作为模板,使用引物sacAT-b-F/sacAT-b-R以及sacAT-F/sacAT-R分别扩增sacA同源臂的骨架以及sacA的同源臂,随后对其片段进行消化、纯化以及组装(方法同上),得到重组质粒pHT-AaCas12b-sacAT和pHT-BhCas12b-sacAT。最后,以AasgRNA(基因由安升达合成)、BhsgRNA(基因由安升达合成)、pHT-AaCas12b-sacAT和pHT-BhCas12b-sacAT为模板,使用引物AasgRNA-F/AasgRNA-R、BhsgRNA-F/BhsgRNA-R、AasgRNA-b-F/AasgRNA-b-R以及BhsgRNA-b-F/BhsgRNA-b-R分别扩增AasgRNA、BhsgRNA以及他们对应的骨架,随后将这些片段进行消化、纯化以及组装,得到最终的敲除质粒pHT-AaCas12b-AIO以及pHT-BhCas12b-AIO。
基因敲除效率验证
将构建好的敲除质粒(pHT-AaCas12b-AIO和pHT-BhCas12b-AIO)转化到B.subtilis 168中。将生长出的克隆分别挑至新鲜LB液体培养基中进行培养编辑12h。随后将培养好的培养物进行稀释(约105倍)并涂布到含有相应抗性的LB平板上。等到单克隆生长起来后,用对应的菌落PCR引物对敲除位置的两端进行扩增以确定敲除与否。
结果显示,以内源基因sacA为敲除对象时,CRISPR-AaCas12b的编辑效率仅为1/23(图1c),而CRISPR-BhCas12b的编辑效率高达18/18(图1e)。以内源基因aprE为敲除对象时,CRISPR-BhCas12b对aprE的敲除效率高达10/10(图1f)。
(2)dBhCas12b的设计与改造
BhCas12b候选关键活性位点的确认
分别将来源于Alicyclobacillus acidoterrestris、Alicyclobacillusacidiphilus、Bacillus hisashii的Cas12b的一级序列进行同源比对,比对结果如图2a所示。根据AacCas12b、AaCas12b、BhCas12b的结构区域图(参考文献:Liu,L.et al.C2c1-sgRNA complex structure reveals RNA-guided DNA cleavage mechanism.Mol.Cell65,310-322(2017);Strecker,J.et al.Engineering of CRISPR-Cas12b for human genomeediting.Nat.Commun.10,212(2019);Teng,F.et al.Repurposing CRISPR-Cas12b formammalian genome engineering.Cell Discov.4,63(2018).)以及AacCas12b的结晶结果(PDB:5WQE),我们将BhCas12b的不同结构域进行划分,其结构组织图如图2b所示。进一步将BhCas12b与sgRNA分子(GTTCTGTCTTTTGGTCAGGACAACCGTCTAGCTATAAGTGCTGCAGGGTGTGAGAAACTCCTATTGCTGGACGATGTCTCTTACGAGGCATTAGCACCATTTTCTATACACCGGGAGGCATTTTTTTT)进行对接,分子对接结果如图2c所示。
dBhCas12b的构建与基因敲除效率筛选验证
dBhCas12b筛选示意图如图2d所示。
以表2中引物D574A-F/D574A-R,以质粒pHT-BhCas12b-AIO为模板,反向PCR构建含有靶向sacA基因的质粒pHT-BhCas12b(D574A)-AIO;
以表2中引物E828A-F/E828A-R,以质粒pHT-BhCas12b(D574A)-AIO为模板,通过反向PCR,对BhCas12b(D574A)的上述位点(E828)进行突变为丙氨酸A,获得含有双组合突变体dBhCas12b(D574A/E828A)的质粒pHT-BhCas12b(D574A/E828A)-AIO;
以表2中引物D952A-F/D952A-R,以质粒pHT-BhCas12b(D574A/E828A)-AIO为模板,通过反向PCR,对BhCas12b(D574A/E828A)的上述位点(D952)进行突变为丙氨酸A,获得含有三组合突变体dBhCas12b(D574A/E828A/D952A)的质粒pHT-BhCas12b(D574A/E828A/D952A)-AIO。
将质粒pHT-BhCas12b(D574A)-AIO、pHT-BhCas12b(D574A/E828A)-AIO、pHT-BhCas12b(D574A/E828A/D952A)-AIO分别转化至枯草芽孢杆菌B.subtilis中,对sacA基因敲除效率进行验证,结果显示,dBhCas12b(D574A)敲除效率为13%(图2e);dBhCas12b(D574A,E828A)敲除效率为8.69%(图2f);dBhCas12b(D574A,E828A,D952A)敲除效率为0(图2g)。
(3)CRISPR-dBhCas12b对转录延伸的抑制
CRISPR-dBhCas12b对转录延伸的抑制流程图如图3a所示。
CRISPR-dBhCas12b表达菌株的构建
将获得的BhCas12b(D574A,E828A,D952A)突变体整合到B.subtilis的lacA位点,获得重组菌株BS1,其中BhCas12b(D574A,E828A,D952A)的表达受到木糖启动子调节;对于sgRNA整合载体的构建:以pUC57-sgRNA(金唯智合成)和pDGT-P43-GFP为模板,使用引物pDG-sgRNA-F/pDG-sgRNA-R以及pDG-sgRNA-b-F/pDG-sgRNA-b-R分别扩增sgRNA(Pveg启动子组成型表达)及其对应的骨架。随后对两个片段进行消化、纯化以及组装,最终生成重组整合质粒pDG-sgRNA。15条靶向eGFP的sgRNA被设计(sgRNA序列参考表4,G1-G15),并以反向PCR的方式,使用表2引物G1-F/G1-R、G2-F/G2-R、G3-F/G3-R、G4-F/G4-R、G5-F/G5-R、G6-F/G6-R、G7-F/G7-R、G8-F/G8-R、G9-F/G9-R、G10-F/G10-R、G11-F/G11-R、G12-F/G12-R、G13-F/G13-R、G14-F/G14-R以及G15-F/G15-R分别构建靶向eGFP的整合载体。随后将这些sgRNA表达盒扩增并分别整合到BS1菌株的amyE位点,从而生成15个含有CRISPRi的重组菌株BS2-BS16(图3a)。
eGFP表达质粒pB-P43-eGFP的构建(参考文献:Haoetal.Front.Bioeng.Biotechnol.,2020,8:524676)。将pB-P43-eGFP分别转化至BS2-BS16中,生成重组菌株BS2_eGFP-BS16_eGFP。
菌株发酵检测eGFP荧光强度
将重组菌株BS2_eGFP-BS16_eGFP进行划线,分别获得对应的单克隆。将获得的单克隆进行接种并过夜培养(约12h)。第二天,将对应的种子液以(OD600为0.05)转接到新鲜的LB培养基中(每个菌株接两份;一份不加木糖,另一份加入1%木糖用于诱导CRISPRi的表达)并在37℃、200rpm的条件下培养约24h。然后对不同的菌株进行eGFP荧光表达的测定。
结果显示,和不添加木糖的对照组相比,诱导CRISPR-dBhCas12b的表达可以显著提高B.subtilis的生物量(图3b)。木糖在B.subtilis生长的过程中扮演了两个角色,既可以作为诱导剂又可以作为碳源提高生物量,并且CRISPR-dBhCas12b的表达对可以进一步降低eGFP总荧光强度(图3c)以及显著降低eGFP单位荧光强度(图3d)。具体相对荧光强度如表4所示。
上述结果表明,BhCas12b(D574A,E828A,D952A)可以有效结合至目标基因,并抑制目标基因表达,表明基于dBhCas12b的CRISPRi能够成功用于靶向目标基因并对RNA聚合酶的转录延伸过程产生了阻碍。BE的构成需要一个只能靶向且不能切割DNA的失活版本的Cas蛋白(dCas)。
表4CRISPR-dBhCas12b对eGFP的抑制效果
(4)CRISPR-dBhCas12b对转录起始的抑制
CRISPR-dBhCas12b对转录起始的抑制示意图如图4a所示。选取6种启动子P43、PylbP、PrelA、PspoVG、PrpoB、PsigW作为靶标,考察CRISPR-dBhCas12b(D574A,E828A,D952A)对启动子转录起始的抑制效果。
含有不同启动子表达质粒的构建方法
以pB-P43-eGFP作为模板,使用表2的引物PylbP-F/PylbP-R;PrelA-F/PrelA-R;PspoVG-F/PspoVG-R;PrpoB-F/PrpoB-R;PsigW-F/PsigW-R对模板进行反向PCR,将PCR产物进行消化,纯化以及组装步骤,最终构建出不同启动子表达eGFP的表达质粒:pB-PylbP-eGFP、pB-PrelA-eGFP、pB-PspoVG-eGFP、pB-PsigW-eGFP以及pB-PrpoB-eGFP。
以pDG-sgRNA作为模板,使用反向PCR的方法,构建携带表3所示sgRNA:P43-1、P43-2、P43-3、P43-4、ylbP-1、ylbP-2、ylbP-3、ylbP-4、relA-1、relA-2、relA-3、relA-4、spoVG-1、spoVG-2、spoVG-3、spoVG-4、rpoB-1、rpoB-2、rpoB-3、sigW-1、sigW-2序列的表达盒,靶向6种不同启动子核心区,整合到BS1的amyE位点,获得重组菌株BS17-BS37,构建得到整合型CRISPRi系统。
将含有不同启动子表达eGFP的质粒分别转化至BS17-BS37,考察该系统抑制eGFP转录起始的效果(图4a)。经过对eGFP单位荧光的比较,CRISPR-dBhCas12b能够高效抑制不同启动子转录起始活性,抑制率区间为18%-99%(图4b-g)。
上述结果显示,BhCas12b(D574A,E828A,D952A)/sgRNA复合体可以有效结合至启动子的核心区从而抑制启动子的转录的起始过程,表明基于BhCas12b(D574A,E828A,D952A)的CRISPRi系统既能够从转录的起始抑制基因表达,又能从转录的延伸抑制基因的表达。为构建基于不同脱氨酶的BE系统提供了有效的基因靶点定位的功能。
实施例2 B.subtilis中胞嘧啶碱基编辑器(CBE)的设计与验证
基于dBhCas12b的CBE系统的结构如图5a所示。
dBhCas12b-CDA的构建(引物及序列参考表1):
以引物pAX-dBhCas12b-F/pAX-dBhCas12b-R和pAX-dBhCas12b-b-F/pAX-dBhCas12b-b-R将dBhCas12b克隆至pAX01载体的木糖启动子下游,构建得到pAX-dBhCas12b。使用引物pAX-cCDA-F/pAX-cCDA-R和pAX-cCDA-b-F/pAX-cCDA-b-R扩增CDA脱氨酶基因,并将其克隆至dBhCas12b的C端,获得整合载体pAX-dBhCas12b-CDA。
CDA-dBhCas12b、CDA-dBhCas12b-UGI、CDA-dBhCas12b-UGI-UGI的构建(引物及序列参考表1):
使用引物pAX-nCDA-F/pAX-nCDA-R和pAX-nCDA-b-F/pAX-nCDA-b-R,以pUC-CDA和pAX-dBhCas12b为模板,将CDA连接到dBhCas12b的N端,构建得到整合载体pAX-CDA-dBhCas12b。使用引物pAX-UGI-F/pAX-UGI-R和pAX-UGI-b-F/pAX-UGI-b-R,以pUC-UGI和pAX-CDA-dBhCas12b为模板,扩增UGI基因并将其克隆至CDA-dBhCas12b的C端,获得整合载体pAX-CDA-dBhCas12b-UGI。以pAX-CDA-dBhCas12b-UGI为模板继续添加一拷贝的UGI,获得载体质粒pAX-CDA-dBhCas12b-UGI-UGI。
基于不同dBhCas12b的CBE体系整合菌株的构建:
依照上述方法,将工程化的dBhCas12b与CDA进行不同位置的融合,获得了4种不同的CBE结构,其构成方式如图5a所示。将上述不同CBE整合至B.subtilis168,分别命名为BS38-BS41。
编辑性能验证:
1、靶标质粒的构建
以表1所示引物pksA-F/pksA-R,构建sgRNA表达盒,并连接至质粒pHYT上,测序验证后,获得pksA编辑靶标质粒,命名为pHY-pksA;
pksC、pksE、pksG的构建同上,区别在于,引物替换为pksC-F/pksC-R、pksE-F/pksE-R以及pksG-F/pksG-R,测序验证后,获得pksC、pksE、pksG编辑靶标质粒,分别命名为pHY-pksC、pHY-pksE以及pHY-pksG。
2、四种CBE系统编辑性能验证
将步骤1获得的质粒pHY-pksA以及pHY-pksC,分别转化至BS38-BS41,在37℃200rpm条件下,使用木糖诱导表达,并通过一代sanger测序,检测其pksA、pksC基因编辑性能。
将步骤1获得的质粒pHY-pksE以及pHY-pksG,转化至BS38-BS41,在37℃200rpm条件下,使用木糖诱导表达,并通过一代sanger测序,检测其pksE、pksG基因编辑性能。
结果显示,图5a中,构成方式d所示的CBE能够产生较好的编辑性能,其pksA、pksC编辑窗口高达16nt(图5b),其它构成方式的pksA、pksC编辑效率偏低,其中构成方式c所示的编辑窗口为16nt,但编辑效率仅为20%;构成方式a和b并没有检测到编辑效率。此外,通过pksE、pksG基因的进一步验证,结果也显示构成方式d可以使得pksE、pksG的基因编辑窗口达到19nt(图5c)。
实施例3:B.subtilis中腺嘌呤碱基编辑器ABE8e-dBhCas12b的设计与验证
腺嘌呤碱基编辑器ABE8e-dBhCas12b的结构如图5d所示。
具体方法同实施例2,区别在于,以引物ABE8e-F/ABE8e-R扩增ABE8e,将其与dBhCas12b的N端连接,构成ABE8e-dBhCas12b(图5d)。随后将ABE8e-dBhCas12b表达框(木糖诱导)整合至B.subtilis的lacA位点,形成重组菌株BS42(图5d)。以sigE作为验证基因,以表4所示sgRNA(sigE-E1、sigE-E2以及sigE-E3),构建靶标质粒pHY-sigE1、pHY-sigE2以及pHY-sigE3。
结果如图5e所示,由dBhCas12b构成的ABE系统在一个较宽的编辑窗口内(14nt,A6-A19)产生了较高的编辑效率(100%)。
实施例4:基于dBhCas12b的CBE在B.subtilis中多样化基因表达的应用
为了展示本研究开发的具有扩宽编辑窗口BE的优势,我们将CBE用于构建RBS+Spacer(RS)文库,从而多样化目的基因的表达。
首先,以上述重组菌株BS41为出发菌株,在质粒pB-P43-eGFP上构建一个定制RS序列G15(15个连续的G)用于表达eGFP,再将靶向RS的sgRNA整合到上述质粒中,形成一个完整的探针质粒pB-P43-eGFPsgRNA(图6a)。
将上述探针质粒转化至BS41中,验证其编辑RS序列从而调节基因表达的能力。
培养、诱导、检测具体条件方法
首先,将上述探针质粒转化至BS41中(转化方法参考前面提到的B.subitlis标准转化方法);将获得的单克隆挑到含有1%木糖的LB培养基中进行培养大约12h。此外,以野生型B.subtilis 168和不带有sgRNA的pB-P43-eGFP作为阴性对照进行试验。
确定荧光差异较大的个体并加以测序,最终筛选到较对照提升68.1倍eGFP表达水平的RS突变体(图6b),RS序列及荧光强度如表5所示。
表5不同RS突变产生的eGFP荧光强度
/>
实施例5:基于dBhCas12b的CBE在E.coli中的设计与验证
为了考察基于dBhCas12b的BE在不同宿主之间的普适性,选取E.coli BL21(DE3)作为宿主,以编码一种参与翻译的小核糖体亚基蛋白uS5的基因rpsE作为靶标基因进一步验证。
以按实施例2方法得到的载体pAX-CDA-dBhCas12b-UGI和载体pKD46为模板,将融合基因CDA-dBhCas12b-UGI克隆至载体pKD46中阿拉伯糖启动子(ParaBAD)下游并替换原来的基因,形成重组质粒pKD-ParaBAD-CDA-dBhCas12b-UGI。同时,使用引物pKD-Bhsg-F/pKD-Bhsg-R以及pKD-Bhsg-b-F/pKD-Bhsg-b-R将组成型表达的sgRNA表达盒(Pveg-sgRNA)克隆至质粒pKD-ParaBAD-CDA-dBhCas12b-UGI上(片段组装方式参考实施例1),最终形成一个all-in-one(AIO)质粒pKD-CDA-dBhCas12b-UGI。引物和相关序列参考表1和表2。
通过转化“AIO”质粒pKD-CDA-dBhCas12b-UGI、阿拉伯糖诱导编辑以及最终的单克隆或群体测序来鉴定突变频率,流程示意图如图7a所示。具体是:首先将编辑质粒pKD-CDA-dBhCas12b-UGI通过化学转化的方式(热激法)转化到大肠杆菌BL21(DE3)中;然后挑取大小合适的单克隆并将其转接到新鲜的LB培养基中大约培养3~4小时,随后在该体系中加入50%(g/ml)的阿拉伯糖诱导系统编辑约12h;最后,将编辑好的培养物分成两份:一份直接作为PCR模板使用定制的引物去扩增目标突变区,并将PCR产物进行测序(群体测序);另一份样品进行稀释(105倍),然后将稀释好的培养物均匀地涂布到含有氨苄抗生素的LB平板上,待克隆长出来后,随机挑取单克隆用作模板,使用定制的引物去扩增目标突变区,随后将PCR产物用于测序鉴定突变效率(单克隆测序)。在rpsE上选取4个位点(rpsE1、rpsE2、rpsE3和rpsE4)作为靶标,通过培养、诱导以及测序确定其群体编辑效率(参考上述群体测序描述),结果显示CBE在一个宽泛的编辑窗口内(42nt)实现了较高的编辑效率(编辑效率在3%~98%)(图7b)。
接下来,对CBE编辑性能在单克隆水平上进行评估,结果发现和群体测序结果类似(图7c)。rpsE编码一种参与翻译的小核糖体亚基蛋白uS5,对rpsE进行适当突变,能够获得天然抗壮观霉素的大肠杆菌。我们将编辑好的培养物涂布到含有壮观霉素的平板上,发现只有编辑了rpsE3和rpsE4的培养物能生长,随机挑取两个平板上的克隆各10个去进行测序。结果发现突变的趋势跟群体测序类似且最宽的编辑窗口高达63nt(图7d)。在这些平板上随机挑取单克隆用于在高浓度壮观霉素下生长状况的考察,结果发现这些克隆的生长情况和对照(E.coli BL21(DE3)空宿主)基本无异,这说明突变的这些克隆产生了对壮观霉素的抗性(图7e)。对这些克隆进行测序,最终获得了明确的突变位点(图7f)。
实施例6:不同dCas构成的CBE编辑性能的比较
为了比较不同Cas蛋白构成的CBE的编辑性能,选择了dBhCas12b、dFnCas12a(来源于Francisellanovicida U112)以及dSpCas9(来源于Streptococcus pyogenes)构建CBE。具体构建方法:使用引物dCas12a-F/dCas12a-R以及dCas12a-b-F/dCas12a-b-R,以pLCx-dFnCas12a和pKD-CDA-dBhCas12b-UGI为模板,分别扩增dFnCas12a以及对应的骨架,随后按照实施例1的方式将两个片段进行消化、纯化并组装,得到重组质粒pKD-CDA-dFnCas12a-UGI。同理,构建pKD-CDA-dSpCas9-UGI的过程与构建pKD-CDA-dFnCas12a-UGI相似。对于不同CBE,我们各选择了10个靶点来比较它们的编辑性能(图8a)。通过比较,我们发现基于dBhCas12b的CBE具备更宽的编辑窗口(42nt)且效率较高(编辑效率跨度2%~91%,图8b)。而基于dFnCas12a的CBE编辑效率低(大部分位点的编辑效率低于30%)且窗口窄(仅为C8-C10,约3nt,图8c);基于dSpCas9的CBE编辑效率高(大部分位点的编辑效率在60%-100%)且窗口窄(约7nt,图8d)。为了考察不同dCas构成的CBE对E.coli生长情况的影响,我们比较了相同时间下,dCas-CBE的表达对细胞生长的抑制实验。结果显示三种dCas蛋白构成的CBE对E.coli的生长均无明显抑制效应(图8e)。
实施例7:dBhCas12b-CBE在E.coli中蛋白质进化的应用
为了强调本研究构建的基于E.coli版本的新型BE(pKD-CDA-dBhCas12b-UGI)在蛋白质进化方面的应用,我们选择了TatABC作为进化对象以期提高E.coli自身对外源蛋白质的分泌能力。首先在TatABC上选取了共22个靶点(TatA选取10个靶点;TatB选取5个靶点;TatC选取7个靶点),从而构建得到一个迷你sgRNA文库用于进化TatABC(图9a)。具体构建流程:首先根据CHOPCHOP(http://chopchop.cbu.uib.no/)设计靶向TatABC相应的sgRNA序列;然后,使用引物表2的引物A1-F/A1-R、A2-F/A2-R、A3-F/A3-R、A4-F/A4-R、A5-F/A5-R、A6-F/A6-R、A7-F/A7-R、A8-F/A8-R、A9-F/A9-R、A10-F/A10-R、B1-F/B1-R、B2-F/B2-R、B3-F/B3-R、B4-F/B4-R、B5-F/B5-R、C1-F/C1-R、C2-F/C2-R、C3-F/C3-R、C4-F/C4-R、C5-F/C5-R、C6-F/C6-R以及C7-F/C7-R,以pKD-CDA-dBhCas12b-UGI-rpsE1sg为模板,构建靶向TatABC不同的sgRNA(sgRNA序列参考表4),并将上述质粒转化至大肠杆菌JM109中,以实施例5所述方法进行TatABC突变。随后再将sfGFP表达质粒转化至含有不同TatABC突变的大肠杆菌JM109中。通过图9b的流程,以上述周质蛋白的提取方法来检测sfGFP分泌表达量,筛选TatABC分泌能力增强的突变体。突变体及荧光强度如表6所示,通过以总分泌荧光强度(图9c),总OD(图9d)以及单位分泌荧光强度(图9e)进行筛选比较,最终筛选得到了一株相较于野生型分泌能力提升6.49倍的突变体。并且,通过将这些突变体在蓝光仪下照射同样能直观观察到最好的突变体C7-2的分泌sfGFP的能力是最强的(图9f)。
表6不同Tat突变体分泌sfGFP荧光强度
虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。
Claims (10)
1.一种融合蛋白,所述融合蛋白包括脱氨酶和Cas蛋白突变体dBhCas12b;
所述脱氨酶位于所述Cas蛋白突变体dBhCas12b的N端;
所述Cas蛋白突变体dBhCas12b相较于原始序列,发生了包括以下的突变:第574位天冬氨酸、第828位谷氨酸和第952位天冬氨酸突变为了丙氨酸A;所述原始序列的氨基酸序列如SEQ ID NO.3所示;
所述脱氨酶包括胞苷脱氨酶CDA或腺苷碱基编辑器ABE8e。
2.根据权利要求1所述的融合蛋白,其特征在于,所述胞苷脱氨酶CDA的氨基酸序列如SEQ ID NO.1所示;所述腺苷碱基编辑器ABE8e的氨基酸序列如SEQ ID NO.2所示。
3.根据权利要求1或2所述的融合蛋白,其特征在于,所述融合蛋白还包含了尿嘧啶糖基化酶抑制剂结构域UGI;所述尿嘧啶糖基化酶抑制剂结构域UGI的氨基酸序列如SEQ IDNO.4所示。
4.根据权利要求3所述的融合蛋白,其特征在于,所述尿嘧啶糖基化酶抑制剂结构域UGI位于所述Cas蛋白突变体dBhCas12b的C端。
5.根据权利要求3或4所述的融合蛋白,其特征在于,所述胞苷脱氨酶CDA通过连接蛋白1与Cas蛋白突变体dBhCas12b连接,Cas蛋白突变体dBhCas12b通过连接蛋白2与尿嘧啶糖基化酶抑制剂(UGI)结构域连接;
所述CDA和dBhCas12b的连接蛋白1的氨基酸序列为(GSAASR)n;dBhCas12b和UGI的连接蛋白的氨基酸序列为(GPKKKRKVGT)n,其中n独立地为1-30的整数。
6.编码权利要求1-5任一所述融合蛋白的基因。
7.含有权利要求6所述基因的表达载体。
8.含有权利要求6所述基因,或权利要求7所述表达载体的重组细胞。
9.根据权利要求8所述的重组细胞,其特征在于,所述重组细胞包括枯草芽孢杆菌或大肠杆菌。
10.权利要求1-5任一所述融合蛋白,或权利要求6所述基因,或权利要求7所述表达载体,或权利要求8或9所述重组细胞在基因表达和/或蛋白质进化中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311435035.3A CN117487778A (zh) | 2023-10-31 | 2023-10-31 | 一种全新的基于CRISPR-Cas12b的碱基编辑器的构建及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311435035.3A CN117487778A (zh) | 2023-10-31 | 2023-10-31 | 一种全新的基于CRISPR-Cas12b的碱基编辑器的构建及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117487778A true CN117487778A (zh) | 2024-02-02 |
Family
ID=89671935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311435035.3A Pending CN117487778A (zh) | 2023-10-31 | 2023-10-31 | 一种全新的基于CRISPR-Cas12b的碱基编辑器的构建及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117487778A (zh) |
-
2023
- 2023-10-31 CN CN202311435035.3A patent/CN117487778A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Highly efficient single base editing in Aspergillus niger with CRISPR/Cas9 cytidine deaminase fusion | |
Park et al. | Enhancing recombinant protein production with an Escherichia coli host strain lacking insertion sequences | |
US11866703B2 (en) | Method for knocking out N-myristoyltransferase (NMT) gene from Eimeria tenella | |
CN106755037A (zh) | 一种维吉尼亚链霉菌IBL14 type I‑B‑sv14型CAS基因编辑系统 | |
CN113136374A (zh) | 一种重组突变型Tn5转座酶的制备及应用 | |
CN115851664A (zh) | 一种I-B型CRISPR-Cascade-Cas3基因编辑系统及应用 | |
CN116286931B (zh) | 用于富养罗尔斯通氏菌快速基因编辑的双质粒系统及应用 | |
CN109852650B (zh) | 一种由茶碱调控的人工适体酶及应用 | |
CN117487778A (zh) | 一种全新的基于CRISPR-Cas12b的碱基编辑器的构建及其应用 | |
CN116463370A (zh) | 用于贝莱斯芽孢杆菌hck2孢子表面表达的三质粒基因组编辑系统及其构建与应用 | |
JP2023505234A (ja) | ヌクレアーゼを含む組成物及びその使用 | |
US20220403369A1 (en) | Use of cas9 protein from the bacterium pasteurella pneumotropica | |
CN116751763B (zh) | 一种Cpf1蛋白、V型基因编辑系统及应用 | |
JP7471395B2 (ja) | 大腸菌に基づく組換え株ならびにその構築方法および使用 | |
US20220389459A1 (en) | Selection marker free methods for modifying the genome of bacillus and compositions thereof | |
US20220002692A1 (en) | DNA cutting means based on Cas9 protein from biotechnologically significant bacterium Clostridium cellulolyticum | |
KR101970471B1 (ko) | Ctx 파지에 감염되고 콜레라 독소를 생산할 수 있는 비브리오 콜레라 균주 | |
EP0441361B1 (en) | Process for producing foreign protein in escherichia coli | |
Jie et al. | Co-expression of Cas9 and single-guided RNAs in Escherichia coli streamlines production of Cas9 ribonucleoproteins | |
US20220017896A1 (en) | Dna cutting means based on cas9 protein from defluviimonas sp. | |
OA20812A (en) | Use of CAS9 protein from the bacterium pasteurella pneumotropica. | |
JP2022546709A (ja) | 大腸菌に基づく組換え株ならびにその構築方法および使用 | |
OA20196A (en) | DNA-cutting agent. | |
CN118240822A (zh) | 一种单碱基基因编辑器pBE-C2A-T3及其制备方法和应用 | |
CN116732079A (zh) | 对异常球菌进行基因组编辑的方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |