CN111850096B - 一种基于n端编码序列改造调控蛋白质表达的方法 - Google Patents

一种基于n端编码序列改造调控蛋白质表达的方法 Download PDF

Info

Publication number
CN111850096B
CN111850096B CN202010742774.7A CN202010742774A CN111850096B CN 111850096 B CN111850096 B CN 111850096B CN 202010742774 A CN202010742774 A CN 202010742774A CN 111850096 B CN111850096 B CN 111850096B
Authority
CN
China
Prior art keywords
protein
sfgfp
value
coding region
nucleotide sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010742774.7A
Other languages
English (en)
Other versions
CN111850096A (zh
Inventor
刘松
徐奎栋
李江华
陈坚
周景文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN202010742774.7A priority Critical patent/CN111850096B/zh
Publication of CN111850096A publication Critical patent/CN111850096A/zh
Priority to PCT/CN2021/102986 priority patent/WO2022022197A1/zh
Application granted granted Critical
Publication of CN111850096B publication Critical patent/CN111850096B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2451Glucanases acting on alpha-1,6-glucosidic bonds
    • C12N9/2457Pullulanase (3.2.1.41)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01041Pullulanase (3.2.1.41)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Abstract

本发明公开了一种基于N端编码序列改造调控蛋白质表达的方法,属于基因工程及酶工程技术领域。本发明是以枯草芽孢杆菌为表达宿主,通过预测模型,评价N端编码区同义突变中,最有利于促进基因表达的核苷酸序列。通过结合超折叠绿色荧光蛋白(sfGFP)的NCS的前十个氨基酸同义突变文库,测定文库中蛋白的荧光强度,选择172个代表性样本并测序鉴定,使用统计学方法建立预测模型。通过该模型优化融合了BlgS信号肽的普鲁兰酶,可使普鲁兰酶胞外酶活提高至改造前的2.67倍以及降低48%,从而为N端基因的从头设计提供理性改造的方向,有利于简易地调控基因的表达。

Description

一种基于N端编码序列改造调控蛋白质表达的方法
技术领域
本发明涉及一种基于N端编码序列改造调控蛋白质表达的方法,属于基因工程及酶工程技术领域。
背景技术
基因的突变对于改变蛋白的性质具有非常重要的意义,通常通过突变,可以从中找到性质更好的突变序列,从而提高蛋白的应用价值。基因的同义突变就是常用的一种突变手段,基因的同义突变可实现表达量相差巨大。
目前常用的方法:是通过构建同义突变文库,并结合高通量筛选策略,以期找到最佳突变体。然而这种方法耗时耗力,并且专一性强,无法用于指导其他基因的设计。尽管有的研究通过发现,合成一系列的短肽,有利于广泛提高基因的表达,然而这种方法会对酶活产生影响,由于这些促表达的短肽,占据了信号肽的位置,从而不适合于需要添加信号肽的胞外蛋白。
现有用于改善基因表达量的方法,往往都是通过非翻译区(5’UTR)的优化,然而当5’UTR模块已经足够强时,难以继续优化并显著提高表达量。而关于N端编码区(NCS)的研究较少。因此,建立一种适用于广泛基因设计的NCS改造策略非常重要。
发明内容
本发明的方法是基于对代表性样本的生物信息学分析而建立的,通过此方法,可从头设计任意基因的N端前30位碱基的核苷酸序列,对其进行同义突变。本模型的实施方案中,是通过突变引物,改变任意基因的NCS核苷酸序列为目的核苷酸序列所完成。本发明通过优化NCS的核苷酸序列,可用于指导任意基因的设计,并不需要添加额外的氨基酸序列,对蛋白质的性质降到最低。可极大的提高目的基因的表达水平。
本发明提供了一种筛选编码高表达量蛋白的核苷酸序列的方法,测定GC3和ΔG的值,再应用下述方程式计算蛋白的相对表达量,即PsfGFP值:
PsfGFP=274497.657-108717.401×GC3+4886.529×ΔG。
在本发明的一种实施方式中,所述GC3为目的基因靠近ATG的N端编码区前9~10个氨基酸的同义密码子第三位碱基是GC的含量;所述ΔG为目的基因的任意启动子转录起始位点至N端编码区的第90~99bp区域间的mRNA二级结构的最小自由能。
在本发明的一种实施方式中,所述蛋白为能够在枯草芽孢杆菌中表达的任意蛋白。
在本发明的一种实施方式中,PsfGFP值与蛋白的实际表达量呈正相关。
在本发明的一种实施方式中,根据PsfGFP值筛选相应的核苷酸序列。
本发明提供了一种调控基因工程菌蛋白表达量的方法,选取目的蛋白N端编码区的长度为27~30个核苷酸,建立同义突变库;计算同义突变库中的基因的GC3和ΔG参数,根据方程计算每个核苷酸序列的相对表达量,选择具有所需表达量的核苷酸序列,将目的蛋白N端编码区进行相应突变,并将其转化到宿主细胞中;
所述方程为:PsfGFP=274497.657-108717.401×GC3+4886.529×ΔG。
在本发明的一种实施方式中,所述GC3为目的基因靠近ATG的N端编码区前9~10个氨基酸的同义密码子第三位碱基是GC的含量。
在本发明的一种实施方式中,所述ΔG为目的基因的任意启动子转录起始位点至N端编码区的第90~99bp区域间的mRNA二级结构的最小自由能;
在本发明的一种实施方式中,蛋白表达量需要上调的时候,选择突变库中的PsfGFP值处于前10%;蛋白表达量需要下调的时候,选择突变库中的PsfGFP值处于后10%。
在本发明的一种实施方式中,所述基因工程菌以枯草芽孢杆菌为宿主。
在本发明的一种实施方式中,所述蛋白为能够在枯草芽孢杆菌中表达的任意蛋白。
本发明提供了一种调控普鲁兰酶表达量的方法,将选取普鲁兰酶N端编码区前27~30个核苷酸,进行同义突变,构建突变体库,并计算PsfGFP值,根据PsfGFP值选择相应的同义突变序列;将目的蛋白的N端编码区进行相应突变,连接至表达载体,构建重组质粒。
在本发明的一种实施方式中,普鲁兰酶表达量需要上调的时候,选择突变库中的PsfGFP值处于前10%。
在本发明的一种实施方式中,普鲁兰酶表达量需要下调的时候,选择突变库中的PsfGFP值处于后10%。
在本发明的一种实施方式中,将重组质粒导入枯草芽孢杆菌,利用枯草芽孢杆菌生产蛋白。
在本发明的一种实施方式中,所述普鲁兰酶NCBI登录号为AMQ67157。
本发明还保护所述筛选编码高表达量蛋白的核苷酸序列的方法,或调控基因工程菌蛋白表达量的方法在调节目的蛋白表达量中的应用。
本发明还保护所述调控普鲁兰酶表达量的方法在调节普鲁兰酶中的应用。
本发明的有益效果:
本发明通过结合sfGFP、并对目的基因的N端编码区进行改造(同义突变),探究出了一条用于指导蛋白做出定向改造、从而提高或降低目的蛋白表达的公式PsfGFP=274497.657-108717.401×GC3+4886.529×ΔG。所算得的PsfGFP值与蛋白的实际表达量成正相关,根据此公式,计算出PsfGFP值即根据需要选择相应的同义突变序列。将其应用于改造融合了Bgls信号肽的核苷酸序列的普鲁兰酶N端,选择的同义突变序列可使胞外酶活上调2.67倍、以及下调48%。
附图说明
图1为sfGFP表达质粒P43-NMK-sfGFP图谱。
图2为sfGFP的NCS文库相对荧光强度情况图。
图3为172个样本的核苷酸序列指标和荧光值。
图4为改造前后相对荧光值分布图。
图5为融合BglS信号肽的普鲁兰酶表达质粒P43-NMK-Bgls图谱。
图6为BglS信号肽的5种NCS变体蛋白胶图。
图7为添加5种Bgls信号肽序列的普鲁兰酶的表达预测值与酶活测量值相关性图。
具体实施方式
1、培养基组成:
种子培养基(g/L):蛋白胨10,酵母提取物5,氯化钠5;
发酵培养基(g/L):将下列组分溶解在0.9L水中:蛋白胨12g,酵母提取物24g,甘油4mL。
各组分溶解后高压灭菌;冷却到60℃,再加100mL灭菌的0.17mol/L的KH2PO4、0.72mol/L的K2HPO4溶液(2.31g的KH2PO4和12.54g的K2HPO4溶在足量的水中,使终体积为100mL;0.22μm的滤膜过滤除菌);
2、培养方法:
种子培养:挑取工程菌单菌落接入种子培养基中,培养温度37℃,摇床转速200r/min,培养24h;
发酵培养:种子培养液按4%的接种量接入发酵培养基中,培养温度37℃,发酵24h
3、绿色荧光蛋白表达量及生物量测定
在96孔板中加入用PBS缓冲液(100mM和pH 7.2)稀释成合适浓度的发酵液,使用Cytation3细胞成像微孔板检测仪(美国伯腾仪器有限公司),绿色荧光激发波长:480nm,绿色荧光发射波长:520nm,细胞生长OD吸收波长:600nm。
一步克隆试剂盒购自南京诺唯赞生物科技有限公司。
4、SDS-PAGE电泳检测
胶浓度为10%的
Figure BDA0002607281890000031
SDS-PAGE胶被用于分析蛋白的表达水平,以MES或MOPS缓冲液为电泳缓冲液,上样量为10μL。电泳电压为150V。具体样品制备及电泳操作依照试剂盒说明书进行。以MES缓冲液进行电泳时,标准蛋白的分子量(kDa)分别为:188,98,62,49,38,28,17,14,6和3;而以MOPS缓冲液进行电泳时,标准蛋白的分子量(kDa)分别为:191,97,64,51,39,28,19,14
5、普鲁兰酶酶活测定方式
将1mL 1g/100mL普鲁兰多糖底物和0.9mL 100mM pH 4.5乙酸-乙酸钠缓冲液混合均匀,置于60℃水浴锅内预热10min,加入普鲁兰酶液0.1mL,反应10min后,加入3mL DNS显色液,然后于沸水浴中煮7min,置于冰水中终止显色反应,再加10mL去离子水,混匀,在540nm下测定吸光值。单位时间内生成1μmol还原糖的酶量定义为一个酶活力单位。
实施例1:构建NCS同义突变文库
将PLytr启动子(核苷酸序列如SEQ ID NO.1所示)使用引物Lytr-F/Lytr-R(核苷酸序列如SEQ ID NO.2和3所示)和Lytr-F-plasmid/Lytr-R-plasmid(核苷酸序列如SEQ IDNO.4和5所示)通过一步克隆试剂盒连接至P43NMK质粒,构建得到质粒P43NMK-Lytr;
采用相同的手段,将sfGFP荧光蛋白报告基因(核苷酸序列如SEQ ID NO.6所示)使用引物sfGFP-F/sfGFP-R(核苷酸序列如SEQ ID NO.7和8所示)和sfGFP-F-plasmid/sfGFP-R-plasmid(核苷酸序列如SEQ ID NO.9和10所示),通过一步克隆试剂盒融合至PLytr的下游,得到构建P43NMK-Lytr_sfGFP,如图1所示;
以P43NMK-Lytr_sfGFP为模板,使用简并引物sfGFP-F-NCS/sfGFP-R-NCS(核苷酸序列如SEQ ID NO.11和12所示),获得sfGFP的N端前30位碱基发生同义突变的重组质粒,这些重组质粒构成了同义突变文库,使得sfGFP前30个碱基发生改变,但其编码的氨基酸序列保持不变。
实施例2:NCS同义突变文库的表征
将实施例1中构建得到的发生同义突变的重组质粒分别转化至表达宿主枯草芽孢杆菌WB600中,将转化后的单克隆接种至含有200μL LB种子培养基的96浅孔板,培养8小时;
接着,按照4mL/100mL的接种量接种至含有800μL TB培养基的96深孔板,培养24小时得到发酵液;
然后将发酵液迅速置于冰上冷冻,离心后,去除上清,用PBS缓冲液(100mM、pH7.2)稀释至合适倍数后,通过Cytation3细胞成像微孔板检测仪(美国伯腾仪器有限公司)测定荧光值(激发光480,吸收光520)以及OD600。共表征了8598个单菌落,如图2。
实施例3:代表性样本的序列鉴定和发酵
实施例2中共表征8598个单克隆宿主细胞,定义荧光值/OD为相对荧光强度RFI,根据RFI值的高低,将单克隆细胞由高到低排序,每50个选择1个测序鉴定(即第1~50个菌株中选择一个,第51~100个菌株中选择一个,依此类推),共测序鉴定了172个单克隆。
将172个经测序鉴定后的单克隆,接种至含有20mL种子培养基的250mL摇瓶中,37℃、220rpm发酵8小时后至OD600大于4,按照4mL/100mL的比例接种到含有25mL发酵培养基的250mL摇瓶中,发酵24小时后,测定sfGFP的荧光值和OD600。每组实验设置3个平行。其结果如下图3。
实施例4:使用生物信息学工具对样本的核苷酸进行序列分析
使用CodonW、Nupack、RBS calculator创建11个不同的核苷酸序列指标以进行序列分析。
(1)使用CodonW计算GC、GC3、T3s、C3s、A3s、G3s、CAI、CBI、Fop
GC:目的基因的G+C含量;
GC3:同义密码子第三位碱基是GC的含量;
T3s、C3s、A3s、G3s:基因的N端前30位碱基发生同义突变后,第三个同义位置密码子分别是T、C、A、G的频率;
CAI:密码子偏好性;
CBI:密码子偏爱指数;
Fop:最佳密码子的频率(上述计算范围均是NCS突变的30个核苷酸序列)。
(2)使用Nupack计算ΔG
ΔG:最小自由能,其计算的范围包含转录起始位点至NCS下游的区域,在本实施例中选取ATG上游25个碱基处(PLytr启动子的转录起始位点)至ATG下游96碱基处;
(3)使用RBS calculator计算TIR
TIR:翻译起始率,范围同计算ΔG。
通过对172个样本中,以RFI作为因变量,11个核苷酸序列指标作为因变量进行分析,通过SPSS进行多元回归分析,方法采用逐步回归。
最终获得一条回归预测方程PsfGFP=274497.657-108717.401×GC3+4886.529×ΔG,见表1。并用以指导基因的NCS改造,在对NCS进行改造时,通过计算相应参数带入公式,即能根据算出的值,选择蛋白表达量高的同义突变序列。
表1多元回归分析
Figure BDA0002607281890000051
将实施例3中的172个样本的序列代入所述回归预测方程,计算出预测值,并与实施例3中测定的实际荧光值进行比较,进行相关性分析,如图4所示,序列的预测值和测量荧光值之间的皮尔逊系数可达0.675,相关非常强,说明所述的回归预测方程可以用来预测蛋白荧光值。
实施例5:使用预测方程指导信号肽BglS基因的NCS改造
(1)P43NMK-Lytr-BglS野生型的构建
将BglS信号肽(核苷酸序列如SEQ ID NO.13所示)融合在普鲁兰酶编码基因(核苷酸序列如SEQ ID NO.14所示)的N端,实现了普鲁兰酶的胞外表达。具体方式为利用实施例相同的一步克隆法,将BglS信号肽克隆至P43NMK-Lytr中的PLytr的下游,构建得到P43NMK-Lytr-BglS,如图5。
(2)P43NMK-Lytr-BglS同义突变质粒的构建
为了进一步的提高普鲁兰酶的胞外酶活,优化了靠近ATG的BglS的NCS区:将BglS的前十个氨基酸所有的同义突变组合方式穷举出来,共有131072种可能;按照实施例4的方程进行计算,计算131072条序列每一条序列的GC3和ΔG以及理论值PsfGFP,并根据预测值,选择包括野生型在内的5种Bgls变体:NCS+,NCS+’,NCS-wt,NCS-’,NCS-。
NCS+代表PsfGFP最大值变体;NCS+’代表PsfGFP的最大值与野生型之间的中间值变体;NCS-wt代表野生型;NCS-代表PsfGFP最小值变体,NCS-’代表介于PsfGFP的最小值与野生型之间的中间值变体,其具有连续降低的预测表达强度。
利用与步骤(1)相同的方法,信号肽Bgls变体NCS+(核苷酸序列如SEQ ID NO.15所示)、NCS+’(核苷酸序列如SEQ ID NO.16所示)、NCS-’(核苷酸序列如SEQ ID NO.17所示)、NCS-(核苷酸序列如SEQ ID NO.18所示),分别连接至克隆至P43NMK-Lytr中的PLytr的下游,分别得到含有BglS信号肽同义突变序列的质粒;再将得到的质粒转化至表达宿主枯草芽孢杆菌WB600中,将转化后的单克隆接种至含有20mL LB培养基的250mL摇瓶中,37℃220rpm发酵8小时后,使得OD600达到4以上,按照4mL/100mL的比例接种到含有25mL TB培养基的250mL摇瓶中,在37℃、250rpm发酵30小时后,测定普鲁兰酶的胞外酶活,结果如图7所示,发现其普鲁兰酶胞外酶活实现了预测的高中低5水平变化,并且与预测值有0.89的R2水平。
表2信号肽BglS的NCS突变体的预测及实际检测结果
Figure BDA0002607281890000061
Figure BDA0002607281890000071
虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。
SEQUENCE LISTING
<110> 江南大学
<120> 一种基于N端编码序列改造调控蛋白质表达的方法
<160> 18
<170> PatentIn version 3.3
<210> 1
<211> 320
<212> DNA
<213> 人工序列
<400> 1
ctaaccctac ataagtacct tcttttgttt caatgttact gtctggcgat acatcttcac 60
cttgactctt ttgactatta accccgcaac ccgaaagaag caatataaag aacagtaaag 120
caataaattt tttcattttt ttcacctcat tatattttat cgtcaaccta ttttatattt 180
taaagaaaaa ttaagaaaca atgaaacttt tttttataaa aaacgactat tttaggattt 240
cattcttgta ttaaatagag ttgtatttat tggaaattta actcataatg aaagtaattt 300
aaaggaggtg aaatgtacac 320
<210> 2
<211> 50
<212> DNA
<213> 人工序列
<400> 2
gggattttgg tcactaaccc tacataagta ccttcttttg tttcaatgtt 50
<210> 3
<211> 45
<212> DNA
<213> 人工序列
<400> 3
gataatctca gtgtacattt cacctccttt aaattacttt catta 45
<210> 4
<211> 36
<212> DNA
<213> 人工序列
<400> 4
aatgtacact gagattatca aaaaggatct tcacct 36
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<400> 5
tgaccaaaat cccttaacgt gagt 24
<210> 6
<211> 717
<212> DNA
<213> 人工序列
<400> 6
gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60
gacgtaaacg gccacaagtt cagcgtgaga ggcgagggcg agggcgatgc caccaatggc 120
aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180
gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcgc 240
cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcagtttc 300
aaggacgacg gcacatacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360
aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420
ctggagtaca acttcaacag ccacaacgtc tatatcacgg ccgacaagca gaagaacggc 480
atcaaggcca acttcaagat ccgccacaac gtggaggacg gcagcgtgca gctcgccgac 540
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600
ctgagcaccc agtccgtgct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660
ctggagttcg tgaccgccgc cgggatcact cacggcatgg acgagctgta caagtaa 717
<210> 7
<211> 27
<212> DNA
<213> 人工序列
<400> 7
tgtacacatg gtgagcaagg gcgagga 27
<210> 8
<211> 36
<212> DNA
<213> 人工序列
<400> 8
gataatctca ttacttgtac agctcgtcca tgccgt 36
<210> 9
<211> 45
<212> DNA
<213> 人工序列
<400> 9
ctgtacaagt aatgagatta tcaaaaagga tcttcaccta gatcc 45
<210> 10
<211> 45
<212> DNA
<213> 人工序列
<400> 10
ttgctcacca tgtgtacatt tcacctcctt taaattactt tcatt 45
<210> 11
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (30)..(30)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (36)..(36)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (39)..(39)
<223> n is a, c, g, or t
<400> 11
gtacacatgg tnagyaargg ngargarctn ttyacnggng tggtgcccat cct 53
<210> 12
<211> 73
<212> DNA
<213> 人工序列
<400> 12
atttcacctc ctttaaatta ctttcattat gagttaaatt tccaataaat acaactctat 60
ttaatacaag aat 73
<210> 13
<211> 84
<212> DNA
<213> 人工序列
<400> 13
atgccttatc tgaaacgagt gttgctgctt cttgtcactg gattgtttat gagtttgttt 60
gcagtcactg ctactgcctc agct 84
<210> 14
<211> 2172
<212> DNA
<213> 人工序列
<400> 14
gatgctgcta aaccagcagt ttctaacgct taccttgacg cttctaacca agttttagtt 60
aaattatctc aaccattaac attaggtgaa ggtgcttctg gtttcactgt acatgatgac 120
actgctaaca aagacatccc agtaacatct gtaaaagacg cttctttagg tcaagttgaa 180
tcaggtgtaa aaactgacct tgttactgtt actttaggcg aagatccaga tgtatctcac 240
actttatcta tccaaacaga cggttaccaa gctaaacaag taatcccacg taacgtactt 300
aactcttctc aatattacta ttctggtgat gatttaggaa acacatacac acaaaaagct 360
actactttca aagtttgggc tcctacatct actcaagtta acgtattgtt atacgattct 420
gctacaggta gcgttacaaa aatcgttcca atgacggctt caggtcacgg tgtttgggag 480
gctactgtta accaaaactt agaaaactgg tactacatgt acgaagtaac tggtcaaggt 540
tctacacgca ctgctgttga tccttacgct actgctatcg ctccaaacgg tacacgcggc 600
atgatcgtag atttagctaa aactgaccca gcaggttgga actctgataa acacattact 660
ccaaaaaaca ttgaagatga agttatctac gaaatgcacg tacgtgattt ctctatcgat 720
ccaaactcag gtatgaaaaa caaaggtaaa tacttagctc taactgaaaa aggcactaaa 780
ggtcctgata acgttaaaac aggtatcgac tctcttaagc aattaggtat tacacatgtt 840
caattaatgc cagttttcgc atctaactca gttgacgaaa ctgatccaac acaatacaac 900
tggggttacg acccacgtaa ctacgatgta ccagaaggtc aatatgcaac taacgctaac 960
ggtaacgcac gtattaaaga attcaaagaa atggttttat cactacaccg tgagcacatc 1020
ggtgttaaca tggacgttgt ttacaaccac acgttcgcta ctcaaatctc tgacttcgat 1080
aaaattgttc cagagtacta ttaccgcact gacgacgcag gtaactacac taacggttct 1140
ggtactggta acgaaattgc tgcagaacgt cctatggtgc aaaaattcat catcgatagc 1200
cttaaatact gggttaacga ataccacatt gacggcttcc gtttcgactt aatggcttta 1260
cttggtaaag acacaatgtc taaggctgct tctgagttac atgctatcaa cccaggtatt 1320
gctttatatg gcgaaccttg gactggtggt acaagcgctc ttcctgacga ccaactttta 1380
actaaaggtg cacaaaaagg catgggagta gctgtattca acgataacct tcgtaacgca 1440
ttagacggaa acgttttcga ttcttctgct caaggattcg caacaggagc tacaggtctg 1500
actgatgcta ttaaaaacgg agttgaagga tcaatcaacg atttcacttc ttctcctggc 1560
gaaacaatta actacgttac atcacacgat aactacactc tttgggacaa aatcgctttg 1620
tctaacccta acgactctga agcagatcgc atcaaaatgg atgagcttgc tcaagctgtt 1680
gttatgactt ctcaaggtgt acctttcatg caaggtggtg aagaaatgtt acgcactaaa 1740
ggtggtaacg ataacagcta taacgcgggt gatgctgtaa acgaattcga ctggtctcgt 1800
aaagctcaat accctgacgt tttcaactac tactcaggtt taatccacct tcgtcttgac 1860
catccagctt tccgtatgac aacagctaac gaaatcaact ctcaccttca attccttaac 1920
tcacctgaaa acacagtagc ttacgaactt actgaccacg taaacaaaga taaatggggt 1980
aacattatcg ttgtttacaa ccctaacaag actgtagcaa ctatcaactt accatctggt 2040
aaatgggcta tcaacgcaac tagcggtaaa gtaggtgaat ctacattagg tcaagctgaa 2100
ggatctgtac aagttcctgg tatttctatg atgatccttc accaagaagt ttctccagat 2160
cacggtaaaa aa 2172
<210> 15
<211> 84
<212> DNA
<213> 人工序列
<400> 15
ccttatctga aacgagtgtt gctgcttctt cttgtcactg gattgtttat gagtttgttt 60
gcagtcactg ctactgcctc agct 84
<210> 16
<211> 84
<212> DNA
<213> 人工序列
<400> 16
ccttatctga agcgtgtatt actactgctt cttgtcactg gattgtttat gagtttgttt 60
gcagtcactg ctactgcctc agct 84
<210> 17
<211> 84
<212> DNA
<213> 人工序列
<400> 17
ccatatctga agcgagtctt actgcttctg cttgtcactg gattgtttat gagtttgttt 60
gcagtcactg ctactgcctc agct 84
<210> 18
<211> 84
<212> DNA
<213> 人工序列
<400> 18
ccgtacctca agcgcgtctt gctgctgctg cttgtcactg gattgtttat gagtttgttt 60
gcagtcactg ctactgcctc agct 84

Claims (8)

1.一种筛选编码蛋白的核苷酸序列的方法,其特征在于,测定GC3和ΔG的值,再应用下述方程式计算蛋白的相对表达量,即PsfGFP值;PsfGFP值与蛋白的实际表达量成正相关:
PsfGFP=274497.657-108717.401×GC3+4886.529×ΔG;
所述GC3为目的基因靠近ATG的N端编码区前10个氨基酸的同义密码子第三位碱基是GC的含量;所述ΔG为目的基因的启动子转录起始位点至N端编码区的第96bp区域间的mRNA二级结构的最小自由能;
蛋白表达量需要上调的时候,选择突变库中的PsfGFP值处于前10%的核苷酸序列;
蛋白表达量需要下调的时候,选择突变库中的PsfGFP值处于后10%的核苷酸序列;
所述目的基因的启动子为PLytr;所述蛋白在枯草芽孢杆菌WB600中表达。
2.根据权利要求1所述的方法,其特征在于,所述蛋白为能够在枯草芽孢杆菌中表达的任意蛋白。
3.一种调控基因工程菌蛋白表达量的方法,其特征在于,取目的蛋白N端编码区前30个核苷酸,建立同义突变库;计算同义突变库中的基因的参数GC3和ΔG,根据方程计算每个核苷酸序列的相对表达量,选择具有所需表达量的核苷酸序列,将目的蛋白N端编码区进行相应突变,并将其转化到宿主细胞中;
所述方程为:PsfGFP=274497.657-108717.401×GC3+4886.529×ΔG;
所述GC3为目的基因靠近ATG的N端编码区前10个氨基酸的同义密码子第三位碱基是GC的含量;所述ΔG为目的基因的启动子转录起始位点至N端编码区的第96bp区域间的mRNA二级结构的最小自由能;
蛋白表达量需要上调的时候,选择突变库中的PsfGFP值处于前10%的核苷酸序列;
蛋白表达量需要下调的时候,选择突变库中的PsfGFP值处于后10%的核苷酸序列;
所述目的基因的启动子为PLytr;所述蛋白在枯草芽孢杆菌WB600中表达。
4.根据权利要求3所述的方法,其特征在于,所述蛋白为能够在枯草芽孢杆菌中表达的任意蛋白。
5.一种调控普鲁兰酶表达量的方法,其特征在于,选取普鲁兰酶N端编码区前30个核苷酸,进行同义突变,构建突变体库,并计算PsfGFP值,根据PsfGFP值选择相应的同义突变序列;将目的蛋白的N端编码区进行相应突变,连接至表达载体,构建重组质粒;
所述PsfGFP值与蛋白的实际表达量成正相关:
PsfGFP=274497.657-108717.401×GC3+4886.529×ΔG;
所述GC3为目的基因靠近ATG的N端编码区前10个氨基酸的同义密码子第三位碱基是GC的含量;所述ΔG为目的基因的PLytr启动子转录起始位点至N端编码区的第96bp区域间的mRNA二级结构的最小自由能;
普鲁兰酶表达量需要上调的时候,选择突变库中的PsfGFP值处于前10%的核苷酸序列;
普鲁兰酶表达量需要下调的时候,选择突变库中的PsfGFP值处于后10%的核苷酸序列;
所述蛋白在枯草芽孢杆菌WB600中表达。
6.根据权利要求5所述的方法,其特征在于,将重组质粒导入枯草芽孢杆菌,利用枯草芽孢杆菌生产蛋白。
7.根据权利要求5所述的方法,其特征在于,所述普鲁兰酶NCBI登录号为AMQ67157。
8.权利要求1~4任一所述方法在调节目的蛋白表达量中的应用。
CN202010742774.7A 2020-07-29 2020-07-29 一种基于n端编码序列改造调控蛋白质表达的方法 Active CN111850096B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010742774.7A CN111850096B (zh) 2020-07-29 2020-07-29 一种基于n端编码序列改造调控蛋白质表达的方法
PCT/CN2021/102986 WO2022022197A1 (zh) 2020-07-29 2021-06-29 一种基于n端编码序列改造调控蛋白质表达的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010742774.7A CN111850096B (zh) 2020-07-29 2020-07-29 一种基于n端编码序列改造调控蛋白质表达的方法

Publications (2)

Publication Number Publication Date
CN111850096A CN111850096A (zh) 2020-10-30
CN111850096B true CN111850096B (zh) 2022-02-01

Family

ID=72945069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010742774.7A Active CN111850096B (zh) 2020-07-29 2020-07-29 一种基于n端编码序列改造调控蛋白质表达的方法

Country Status (2)

Country Link
CN (1) CN111850096B (zh)
WO (1) WO2022022197A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111850096B (zh) * 2020-07-29 2022-02-01 江南大学 一种基于n端编码序列改造调控蛋白质表达的方法
CN113201052B (zh) * 2021-04-21 2023-06-27 华东理工大学 HarpinEa的高效可溶性表达及生产方法和应用
CN116072231B (zh) * 2022-10-17 2024-02-13 中国医学科学院病原生物学研究所 基于氨基酸序列的密码子优化设计mRNA疫苗的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104694452A (zh) * 2015-03-30 2015-06-10 中国科学院上海高等研究院 一种高产普鲁兰酶的重组枯草芽孢杆菌及其构建方法
CN106190934A (zh) * 2016-07-05 2016-12-07 江南大学 一种生产普鲁兰酶的重组枯草芽孢杆菌及其构建
CN106754833A (zh) * 2017-01-16 2017-05-31 广东溢多利生物科技股份有限公司 在枯草芽孢杆菌中高效表达普鲁兰酶的方法及重组枯草芽孢杆菌

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011087836A2 (en) * 2009-12-22 2011-07-21 Novozymes A/S Pullulanase variants and uses thereof
US8679790B2 (en) * 2010-01-05 2014-03-25 The Trustees Of The University Of Pennsylvania Leader sequence to boost gene expression
CN102676480B (zh) * 2012-06-08 2013-02-27 江南大学 一种应用自诱导培养基和双温度调控策略生产胞外普鲁兰酶的方法
EP3149176B1 (en) * 2014-05-30 2019-10-23 The Trustees of Columbia University in the City of New York Methods for altering polypeptide expression
CN111850096B (zh) * 2020-07-29 2022-02-01 江南大学 一种基于n端编码序列改造调控蛋白质表达的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104694452A (zh) * 2015-03-30 2015-06-10 中国科学院上海高等研究院 一种高产普鲁兰酶的重组枯草芽孢杆菌及其构建方法
CN106190934A (zh) * 2016-07-05 2016-12-07 江南大学 一种生产普鲁兰酶的重组枯草芽孢杆菌及其构建
CN106754833A (zh) * 2017-01-16 2017-05-31 广东溢多利生物科技股份有限公司 在枯草芽孢杆菌中高效表达普鲁兰酶的方法及重组枯草芽孢杆菌

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Causes and Effects of N-Terminal Codon Bias in Bacterial Genes;Daniel B. Goodman等;《science》;20130926;第1-5页 *
Rational Design of the N‑Terminal Coding Sequence for Regulating Enzyme Expression in Bacillus subtilis;Kuidong Xu等;《ACS Synth. Biol.》;20210119;第10卷;第265-276页 *
Synthetic N-terminal coding sequences for fine-tuning gene expression and metabolic engineering in Bacillus subtilis;Rongzhen Tian等;《Metabolic Engineering》;20190706;第55卷;第131-141页 *
谷氨酰胺转氨酶活化蛋白酶在大肠杆菌中的表达及性质研究;高慧等;《食品与发酵工业》;20200815;第46卷(第15期);第1-7页 *

Also Published As

Publication number Publication date
WO2022022197A1 (zh) 2022-02-03
CN111850096A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN111850096B (zh) 一种基于n端编码序列改造调控蛋白质表达的方法
JP5211559B2 (ja) 熱安定性を有する変異型ビリルビンオキシダーゼ
CN111826377B (zh) 促进普鲁兰酶胞外表达的信号肽
CN110628738B (zh) 提高葡萄糖氧化酶活性的方法、突变体及其应用
CN111850008B (zh) 促进蛋白胞外表达的信号肽
CN111004785A (zh) 一种酪氨酸酶蛋白序列及其在制备酪氨酸酶中的应用
CN112391396B (zh) 构建于大肠杆菌中的粪肠球菌群体感应基因开关系统及其表达载体、工程菌和应用
CN107236758B (zh) 一种共表达热激蛋白提高外源蛋白表达量的方法
CN111808177B (zh) 提高蛋白表达量的信号肽及其应用
CN110592084A (zh) 一种rhtA基因启动子改造的重组菌株及其构建方法与应用
CN114214308B (zh) 一种经半理性改造提升活性的腈水解酶突变体
CN110592131A (zh) 麦芽糖转录激活因子MalR的突变体文库构建筛选及其应用
CN113249240B (zh) 一种高产羟基酪醇的酿酒酵母及其构建方法
CN111254143B (zh) 具有优良胁迫耐受性的简单节杆菌工程菌株的构建方法、菌株及其应用
CN115029404A (zh) 用于lpp单基因敲除或突变的大肠杆菌高效分泌表达短肽类蛋白的发酵培养基及应用
CN107083394B (zh) 一种共表达核糖体蛋白提高外源蛋白表达量的方法
CN110804616A (zh) 一种密码子优化的葡萄糖氧化酶基因及其应用
CN113699174B (zh) 一种自诱导表达系统及其在促进基因表达中的应用
CN110591997A (zh) 一种提高木糖酸脱水酶活性的基因工程菌及其构建方法与应用
CN113652425A (zh) 一种增强启动子活性的方法及其应用
CN113736789B (zh) 一种n端序列元件在调控酿酒酵母蛋白表达中的应用
CN115261363B (zh) Apobec3a的rna脱氨酶活性测定方法及rna高活性的apobec3a变体
CN102952807B (zh) 多角体基因前180bp片段及其应用
CN115960920A (zh) 协氧蛋白FHb及其重组菌X33-pPICZαA-102C300C-FHb2和应用
CN114410496A (zh) 一种提高毕赤酵母外源蛋白产量的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant