CN114149954A - 利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法 - Google Patents

利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法 Download PDF

Info

Publication number
CN114149954A
CN114149954A CN202111454147.4A CN202111454147A CN114149954A CN 114149954 A CN114149954 A CN 114149954A CN 202111454147 A CN202111454147 A CN 202111454147A CN 114149954 A CN114149954 A CN 114149954A
Authority
CN
China
Prior art keywords
seq
gene
nucleotide sequence
protein
recombinant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111454147.4A
Other languages
English (en)
Other versions
CN114149954B (zh
Inventor
夏小霞
金清
潘芳
钱志刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202111454147.4A priority Critical patent/CN114149954B/zh
Publication of CN114149954A publication Critical patent/CN114149954A/zh
Application granted granted Critical
Publication of CN114149954B publication Critical patent/CN114149954B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43513Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
    • C07K14/43518Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • C07K14/43577Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from flies
    • C07K14/43581Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from flies from Drosophila
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Insects & Arthropods (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Wood Science & Technology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

一种利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法,分别将信号肽序列和重组蛛丝蛋白、类节肢弹性蛋白或类丝节肢弹性蛋白的编码基因连接到表达载体自身启动子序列之后,再将构建的重组表达载体转化到宿主谷氨酸棒状杆菌中,得到谷氨酸棒状杆菌重组菌。本发明通过基因工程改造原始谷氨酸棒状杆菌,提升类蛛丝蛋白的分泌水平,较原始菌株相比,提高2.5倍,并建立快速纯化方法,获得纯度高达93%的目的蛋白。

Description

利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快 速纯化的方法
技术领域
本发明涉及的是一种生物工程领域的技术,具体是一种利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法。
背景技术
蜘蛛牵引丝蛋白氨基酸序列和基因序列已被成功解析实现人工合成,并被导入到不同的宿主细胞中实现表达生产重组类蜘蛛丝蛋白。现有技术已能够在番茄、马铃薯、玉米等植物细胞,以及小鼠、山羊等哺乳动物细胞中实现不同类型重组蜘蛛丝蛋白的表达。但现有的蜘蛛牵引丝蛋白的表达水平比较低且生长周期长、生产成本高,难以实现大规模生产。因此,微生物表达以其培养条件简单,宿主生长快,表达周期短等优势,成为目前研究最多的蜘蛛丝蛋白的表达系统。然而,目前微生物表达的蛛丝蛋白大多滞留在宿主细胞内,需通过破碎细胞获得目的蛛丝蛋白。
发明内容
本发明针对现有技术存在的上述不足,提出一种利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法,进一步通过基因工程改造原始谷氨酸棒状杆菌,提升类蛛丝蛋白的分泌水平,较原始菌株相比,提高2.5倍,并建立快速纯化方法,获得纯度高达93%的目的蛋白。
本发明是通过以下技术方案实现的:
本发明涉及一种用于表达分泌重组蛛丝蛋白、类节肢弹性蛋白或类丝节肢弹性蛋白的重组谷氨酸棒状杆菌的实现方法,分别将信号肽序列和重组蛛丝蛋白、类节肢弹性蛋白或类丝节肢弹性蛋白的编码基因连接到表达载体自身启动子序列之后,再将构建的重组表达载体转化到宿主谷氨酸棒状杆菌中,得到谷氨酸棒状杆菌重组菌。
所述的重组蛛丝蛋白包括:具有金丝网蛛(Trichonephila clavipes)蜘蛛牵引丝蛋白单体核心氨基酸序列MaSpI和MaSpII的肽重复8、16、32和64次的蛋白,其中:单体核心氨基酸序列MaSpI和MaSpII如SEQ ID NO.1和SEQ ID NO.2所示。
所述的类节肢弹性蛋白是指:具有果蝇节肢弹性蛋白Resilin保守肽段氨基酸序列的肽重复16和32次的蛋白,其中:保守肽段氨基酸序列如SEQ ID NO.3所示。
所述的类丝节肢弹性蛋白是指:具有果蝇节肢弹性蛋白和蚕丝蛋白的共聚物的肽重复5次的蛋白,其中:共聚物的氨基酸序列如SEQ ID NO.4所示。
所述的信号肽序列包括:
①Sec分泌系统信号肽,其序列包括:cg1514、cg2196、cg2518、cg2195、cg2585、cg3186、cg3182、cg1109、cg0413、cg1087、cg1243、cg2868、cg3393、cg0470、cg2394、cg2402、cg0316;
②Tat分泌系统信号肽,其序列包括:cg0955、cg2485、TorA。
上述信号肽序列的核苷酸序列如SEQ ID NO.5-SEQ ID NO.24所示。
所述的表达载体为pXMJ19。
所述的宿主谷氨酸棒状杆菌RES167为公开的ATCC13032突变菌株(Tauch etal.,Curr Microbiol.,2002,45:362-367;Wehmeier etal.,Microbiology,2001,147,691–700)。
所述的实现方法,具体包括以下步骤:
步骤1)以谷氨酸棒状杆菌RES167基因组或大肠杆菌MG1655基因组为模板,通过PCR扩增或引物退火合成DNA片段的方法得到信号肽序列。
优选地,在信号肽基因氨基端插入一段核糖体识别序列(aaaggaggacacgca)以保证基因在谷氨酸棒状杆菌中的正确翻译。
优选地,为便于后续基因操作,信号肽序列核苷酸5`端和3`端分别引入酶切位点。
步骤2)将步骤1得到的信号肽序列分别与表达载体通过酶切位点相连,构建20种信号肽质粒pCGN
步骤3)选择性地将8、16、32、64次重复的重组蛛丝蛋白的编码基因、16、32次重复的类节肢弹性蛋白的编码基因或5次重复的类丝节肢弹性蛋白的编码基因中的任一一种,通过酶切位点与步骤2得到的任意一种信号肽质粒pCGN连接,得到目的蛋白表达质粒;
步骤4)将步骤3得到的目的蛋白表达质粒电转至谷氨酸棒状杆菌中,得到谷氨酸棒状杆菌重组菌。
本发明涉及一种用于提高重组蛛丝蛋白表达分泌的基因工程改造的谷氨酸棒状杆菌,得到的改造菌株与出发菌株相比,具有更高的重组蛛丝蛋白表达分泌能力。
所述的出发菌为谷氨酸棒状杆菌RES167。
所述的基因工程改造,包括:基因敲除和过表达,其具体通过以下任意一种方式实现:
a)敲除核苷酸序列组SEQ ID NO.25-NO.40中的任意一个;
b)同时敲除如SEQ ID NO.25所示的重组酶RecA编码基因recA和如SEQ ID NO.27所示的青霉素结合蛋白PBP1a编码基因pbp1a;
c)同时敲除如SEQ ID NO.27所示的青霉素结合蛋白PBP1a编码基因pbp1a和如SEQID NO.26所示的RNA聚合酶σ因子SigD蛋白编码基因sigD;
d)同时敲除如SEQ ID NO.27所示的青霉素结合蛋白PBP1a编码基因pbp1a和如SEQID NO.28所示的Ncgl1480基因;
e)过表达如核苷酸序列SEQ ID NO.33-NO.36、SEQ ID NO.41-NO.45所示的基因中的任一一个。
所述的敲除,涉及的核苷酸序列包括:重组酶RecA编码基因recA核苷酸序列如SEQID NO.25所示;RNA聚合酶σ因子SigD蛋白编码基因sigD核苷酸序列如SEQ ID NO.26所示;青霉素结合蛋白PBP1a编码基因pbp1a核苷酸序列如SEQ ID NO.27所示;核苷酸序列如SEQID NO.28所示的基因NCgl1480,核苷酸序列如SEQ ID NO.29所示的基因NCgl2375,核苷酸序列如SEQ ID NO.30所示的基因NCgl1289,核苷酸序列如SEQ ID NO.31所示的基因NCgl0535,核苷酸序列如SEQ ID NO.32所示的基因NCgl1756,核苷酸序列如SEQ ID NO.33所示的基因NCgl2316,核苷酸序列如SEQ ID NO.34所示的基因NCgl1383,核苷酸序列如SEQID NO.35所示的基因NCgl1095,核苷酸序列如SEQ ID NO.36所示的基因NCgl2717,核苷酸序列如SEQ ID NO.37所示的基因NCgl0550,核苷酸序列如SEQ ID NO.38所示的基因NCgl0291,核苷酸序列如SEQ ID NO.39所示的基因NCgl1748,核苷酸序列如SEQ ID NO.40所示的基因NCgl0841。
所述的过表达,涉及的核苷酸序列包括:核苷酸序列如SEQ ID NO.33所示的基因NCgl2316,核苷酸序列如SEQ ID NO.34所示的基因NCgl1383,核苷酸序列如SEQ ID NO.35所示的基因NCgl1095,核苷酸序列如SEQ ID NO.36所示的基因NCgl2717,核苷酸序列如SEQID NO.41所示的基因NCgl2356,核苷酸序列如SEQ ID NO.42所示的基因NCgl0891,核苷酸序列如SEQ ID NO.43所示的基因NCgl0546,核苷酸序列如SEQ ID NO.44所示的基因NCgl1382,核苷酸序列如SEQ ID NO.45所示的基因NCgl2716。
本发明涉及一种分泌至培养基中的重组蛛丝蛋白的纯化方法,包括以下步骤:
步骤①取高密度发酵结束后的发酵液,使用低温离心机7,024g,4℃,离心20min,收集上清;
步骤②取上述上清,利用1.32M HCl调节pH为4.0,室温搅拌2h;
步骤③取上述溶液进行离心,15,422g,4℃,离心10min,收集上清;
步骤④收集上述上清,加入终浓度为10%至25%(w/v)的饱和硫酸铵,室温搅拌1h;
步骤⑤取上述溶液进行离心,15,422g,4℃,离心10min,收集沉淀,将沉淀使用去离子水重悬,即为目的蛋白溶液。
上述用于克隆的大肠杆菌E.coliDH5α购于天根生化科技有限公司;用于基因扩增的E.coliMG1655菌株购于北京庄盟国际生物基因科技有限公司(www.zomanbio.com);用于蛛丝蛋白表达的质粒pXMJ19购于长沙艾碧维生物科技有限公司(www.honorgene.com);用于谷氨酸棒状杆菌基因敲除的质粒pK19mobsacB(ATCC87098)购于生物风公司(www.biofeng.com)。
所用限制性内切酶、DNA连接酶等分子生物学试剂从New England Biolabs公司(www.neb.com)购买。
技术效果
与现有技术相比,本发明分泌蛛丝蛋白水平高达2.2g/L,是目前分泌生产蛛丝蛋白的最高水平;无需复杂的色谱纯化,只需两步简单沉淀获得纯度高达93%的蛛丝蛋白,且该蛋白水溶性超越以往所有重组表达的蛛丝蛋白,达到660mg/ml。
附图说明
图1为用于类蛛丝蛋白、类节肢弹性蛋白、类丝节肢弹性蛋白分泌表达的质粒示意图;
图2为摇瓶培养重组谷氨酸棒状杆菌RES167所得培养液的电泳胶图,重组菌株带有分泌表达不同分子量蛛丝蛋白MaSpI/MaSpII的质粒,且所用信号肽为cg1514;
图3为摇瓶培养重组谷氨酸棒状杆菌RES167所得培养液的电泳胶图,重组菌株分别带有分泌表达类节肢弹性蛋白R16/R32和类丝节肢弹性蛋白(R4S4)5的质粒,且所用信号肽为cg1514;
图4为摇瓶培养重组谷氨酸棒状杆菌RES167所得培养液的电泳胶图,重组菌株分别带有以不同信号肽表达分泌蛛丝蛋白MaSpI16的质粒;Ctrl指含pCG2空白质粒的重组菌,M指蛋白Marker;
图5为敲除recA(A)及pbp1a(B)基因的PCR验证核酸胶图;
图6为经过基因工程改造的重组谷氨酸棒状杆菌在摇瓶培养条件下,与未改造的出发重组菌株(WT)相比目的蛋白相对分泌水平对比;
图7为重组菌RES167/pCG8、Δpbp1a/pCG8-I16cg和Δpbp1a/pCG8-I64cg在高密度发酵条件下,菌株生长曲线、考马斯亮蓝染色相对定量总蛋白分泌量/蛛丝蛋白分泌量/蛛丝蛋白分泌水平及胞外蛋白SDS-PAGE分析;
图8为重组菌Δpbp1a/pCG8-I16cg和Δpbp1a/pCG8-I64cg高密度发酵上清纯化过程中的SDS-PAGE检测结果,1,4代表发酵上清;2,5代表酸沉淀杂蛋白;3,6代表硫酸铵沉淀目标蛋白。
具体实施方式
实施例1
本实施例构建重组蛛丝蛋白8聚体、16聚体、32聚体和64聚体的基因序列,具体步骤如下:参考文献(TeuléF,CooperAR,Furin WA,Bittencourt D,Rech EL,Brooks A,LewisRV.Nat.Protoc.,2009,4(3):341-355.),采取“首尾相接”的策略,即使用NheI和SpeI两个同尾酶将MaSpI蛋白单体核苷酸序列进行拼接。由金唯智公司合成的上述单体基因片段的5`端添加有NdeI和NheI酶切位点,3`端添加有SpeI和XhoI位点。将合成的基因片段通过NdeI和XhoI位点连接构建于过渡质粒载体pET28a4,获得携带蛛丝蛋白单体核苷酸序列的质粒pET28a4-I1cg,通过NheI和SpeI两个同尾酶“首尾相接”的策略进一步构建2聚体、4聚体、8聚体、16聚体、32聚体和64聚体的目的基因质粒,分别为pET28a4-I2cg、pET28a4-I4cg、pET28a4-I8cg、pET28a4-I16cg、pET28a4-I32cg、pET28a4-I64cg,其中:MaSpII重组蛛丝蛋白8-64聚体基因序列的构建方法同上。
所述的过渡质粒载体pET28a4是指:在pET28a(+)表达载体(Novagen公司购买)的多克隆位点修饰添加BamHI限制性酶切位点,所用上下游引物为F28a4Ba和R28a4,序列如SEQ ID NO.46和SEQ ID NO.47所示,参考文献(Wei SP,Qian ZG,Hu CF,Pan F,Chen MT,Lee SY,Xia XX.Nat Chem Biol.2020Oct;16(10):1143-1148.)。
实施例2
本实施例构建蛛丝蛋白分泌表达载体步骤包括:
1)提取谷氨酸棒状杆菌RES167基因组DNA,以此为模板,通过引物Fcg1514Hi和Rcg1514Sa序列号如SEQ ID NO.48和SEQ ID NO.49所示,进行PCR反应,扩增得到序列如SEQID NO.5的信号肽cg1514,并在其5`和3`端分别引入HindIII和SalI位点。对信号肽序列与质粒pXMJ19利用HindIII和SalI进行双酶切,酶切片段经过纯化后利用T4 DNA连接酶连接,转化E.coli DH5α。挑取重组菌进行培养,提取质粒酶切验证,构建得到重组质粒pCG2。
2)对重组质粒pCG2与实施例1中构建的质粒pET28a4-I16cg利用NdeI和BamHI进行双酶切,分别获得质粒载体片段及重组蛛丝蛋白MaSpI16基因片段,酶切片段经纯化后通过T4 DNA连接酶连接,转化E.coli DH5α。挑取重组菌进行培养,提取质粒进行酶切验证,构建得到分泌表达质粒pCG2-I16cg,如图1所示。
MaSpI蛋白32聚体、64聚体,及MaSpII蛋白8聚体、16聚体、32聚体、64聚体蛋白分泌表达质粒构建方法同上。
本实施例进一步构建类节肢弹性蛋白分泌表达载体,步骤包括:
1)实验室已有研究(Hu X,XiaXX,Huang SC,Qian ZG.Biomacromolecules,2019,20(9):3283-3293.)构建含有类节肢弹性蛋白R16或R32基因的表达载体pET19b-R16/pET19b-R32,利用NdeI和XhoI对pET19b-R16或pET19b-R32以及质粒载体pET28a4进行双酶切,分别获得质粒载体片段及类节肢弹性蛋白基因片段,酶切片段经纯化后通过T4 DNA连接酶连接,转化E.coli DH5α。挑取重组菌进行培养,提取质粒进行酶切验证,构建得到过渡质粒pET28a4-R16或pET28a4-R32。
2)对重组质粒pCG2与上述构建的质粒pET28a4-R16或pET28a4-R32利用NdeI和BamHI进行双酶切,分别获得质粒载体片段及类节肢弹性蛋白R16或R32的基因片段,酶切片段经纯化后通过T4 DNA连接酶连接,转化E.coli DH5α。挑取重组菌进行培养,提取质粒进行酶切验证,构建得到分泌表达质粒pCG2-R16或pCG2-R32,如图1所示。
利用实验室已有研究(Huang SC,Qian ZG,Dan AH,Hu X,Zhou ML.ACSBiomater.Sci.Eng.,2017,3,1576-1585.)构建的含有类丝节肢弹性蛋白(R4S4)5基因的表达载体pR4S4-5构建得到分泌表达质粒pCG2-R4S4-5的方法同上。
本实施例进一步验证重组蛋白的表达分泌,将上述各重组蛋白表达质粒分别电转至谷氨酸棒状杆菌RES167,对各重组菌株进行蛋白表达分泌验证。将上述重组菌株接种至4mL BHI培养基(含有10mg/L氯霉素,50mg/L萘啶酮酸)中,30℃,220rpm振荡培养16h后,按1%接种量转接至20mL BHI培养基(含有10mg/L氯霉素,50mg/L萘啶酮酸)中,30℃,220rpm振荡培养至OD600≈4.0,加入IPTG至终浓度为1.0mM诱导6h,取发酵液上清进行SDS-PAGE分析,如图2和3所示。
实施例3
本实施例通过以下操作验证融合不同信号肽的分泌表达质粒pCGN-I16cg的构建及蛋白表达分泌水平:
所选信号肽序列如SEQ ID NO.6-21和23所示,并设计对应上下游引物,以谷氨酸棒状杆菌RES167基因组DNA为模板,进行PCR扩增获得信号肽序列,且在序列5`端和3`端分别引入HindIII和NdeI位点。各信号肽序列和pCG2-I16cg质粒利用HindIII和NdeI进行双酶切,酶切片段经纯化后通过T4 DNA连接酶连接,转化E.coli DH5α,其中:信号肽序列cg2195、cg3393通过引物退火方式获得各自DNA片段,并直接与pCG2-I16cg质粒HindIII和NdeI双酶切片段进行连接后转化E.coli DH5α。挑取重组菌进行培养,提取质粒酶切验证,构建得到融合不同信号肽的重组表达质粒pCGN-I16cg。
将上述表达质粒通过电转化的方法转入到谷氨酸棒状杆菌RES167,并对各重组菌株进行蛋白表达分泌验证。将上述重组菌株接种至4mL BHI培养基(含有10mg/L氯霉素,50mg/L萘啶酮酸)中,30℃,220rpm振荡培养16h后,按1%接种量转接至20mL BHI培养基(含有10mg/L氯霉素,50mg/L萘啶酮酸)中,30℃,220rpm振荡培养至OD600≈4.0,加入IPTG至终浓度为1.0mM诱导6h,取发酵液上清进行SDS-PAGE分析,结果如图4所示,本实施例结果表明使用信号肽cg2196的重组蛛丝蛋白表达分泌能力最佳,除了信号肽cg0316及2402外,其余所筛选的信号肽均可表达分泌重组蛛丝蛋白。
采用不融合蜘蛛牵引丝蛋白基因序列的重组菌株RES167/pCG2作为对照菌株。
实施例4
为进一步提高宿主菌株的表达分泌水平,本实施例以谷氨酸棒状杆菌RES167为出发菌株对其进行基因改造,分别对其基因组中重组酶RecA编码基因recA、RNA聚合酶σ因子SigD蛋白编码基因sigD、青霉素结合蛋白PBP1a编码基因pbp1a等,序列如SEQ ID NO.25-40所示的基因进行敲除或双敲除;另外分别对序列如SEQ ID NO.33-36及41-45所示的基因进行过表达。
本实施例以突变菌株ΔrecA菌株为例进行基因敲除,具体步骤包括:
步骤1)pK19-ΔrecA质粒的构建:用于基因改造的原始菌株是谷氨酸棒状杆菌RES167菌株,根据基因组recA基因序列如SEQ ID NO.25所示,设计两对引物,用于扩增基因组recA基因上游1000bp片段和下游1000bp片段,两对引物(recAup-F/R、recAdo-F/R)序列如SEQ ID NO.52-55所示。
以谷氨酸棒状杆菌RES167菌株基因组DNA为模板,利用上述两对引物分别进行PCR反应,获得recA基因上游片段和下游片段,同时为方便后续连接,引物末端要加上用于同源重组的20bp基因片段。将质粒pK19mobsacB利用SalI和BamHI进行双酶切,回收5705bp片段。将上述获得的三个片段使用In-Fusion HD Cloning Kit(Clontech Laboratories,Inc.,Mountain View,CA)进行同源重组,构建recA基因敲除所用质粒pK19-ΔrecA。
步骤2)将上述敲除质粒通过电转化导入谷氨酸棒状杆菌RES167菌株中,涂布于BHIS(含25mg/L卡那霉素)平板30℃下培养。挑取阳性克隆对点至BHI-Suc10(含25mg/L卡那霉素,10%蔗糖)平板和BHI(含25mg/L卡那霉素)平板上划线,30℃下培养。挑取在BHI-Suc10平板上呈现阴性,在BHI平板上呈现阳性的重组子至无抗BHI试管中并置于30℃,220rpm摇床中过夜培养。将无抗BHI试管中的菌液稀释为10-1、10-2、10-3、10-4、10-5稀释液,分别取200μL涂布于BHI-Suc10平板,30℃倒置培养24小时。以recAup-F和recAdo-R为引物,对从上述平板挑取的克隆进行PCR,筛选recA基因敲除成功的重组子,从而得到谷氨酸棒状杆菌ΔrecA宿主菌,如图5所示。
所述的序列号SEQ ID NO.26-40基因敲除菌株的构建均采用上述方法。
所述的BHIS培养基成分为:BHI 38.5g/L,山梨醇91g/L。
此外,本实施例以过表达glyVXY和Ncgl2316基因为例进行基因过表达处理,具体包括:
步骤1)质粒pTRC-gly2的构建:以文献(X.X.Xia,Z.G.Qian,C.S.Ki,Y.H.Park,D.L.Kaplan,S.Y.Lee.Proc.Natl.Acad.Sci.U.S.A.,107(2010)14059–14063)中所提到的pTetgly2为模板,设计引物pTetgly2-F/pTetgly2-R序列如SEQ ID NO.58和SEQ ID NO.59所示进行PCR反应。为方便后续分子操作在扩增产物3`端引入SalI酶切位点。将上述PCR产物利用SalI进行酶切,将质粒pTRCmob进行EcoRV-SalI双酶切,纯化产物并使用T4 DNA连接酶连接,转化E.coli DH5α,挑取重组菌进行培养,提取质粒酶切验证,构建得到pTRC-gly2过表达质粒。
步骤2)质粒pTRC2316的构建:将步骤1中构建所得pTRC-gly2质粒用EcoRV和SalI进行双酶切,琼脂糖凝胶回收6019bp基因片段;根据谷氨酸棒状杆菌RES167基因组NCgl2316基因序列如SEQ ID NO.33所示,设计一对引物over2316-F和over2316-R序列如SEQ ID NO.56-57所示,以谷氨酸棒状杆菌RES167基因组为模板扩增NCgl2316基因,并使扩增产物3`端携带SalI位点,利用SalI酶切并进行琼脂糖凝胶回收;将上述两个基因片段通过T4 DNA连接酶连接,转化E.coli DH5α。挑取重组菌进行培养,提取质粒酶切验证,构建得到过表达质粒pTRC2316。
步骤3)将上述过表达质粒通过电转化分别导入携带有蛛丝蛋白表达质粒的谷氨酸棒状杆菌RES167菌株中,涂布于BHIS(含有10mg/L氯霉素,50mg/L萘啶酮酸,25mg/L卡那霉素)平板,30℃下培养。挑取阳性克隆得到过表达重组菌WT/pTRC-gly2及WT/pTRC2316。
所述的序列号SEQ ID NO.34-36及41-45基因过表达菌株的构建均采用pTRC2316质粒的构建方法。
所述的包含过表达质粒pTRC-X(X代表过表达基因)的重组菌株培养时均需额外加入终浓度为25mg/L的卡那霉素。
实施例5
本实施例利用实施例4所构建的基因工程菌株,分别转入重组蛛丝蛋白MaSpI16和MaSpI64表达质粒,进行摇瓶发酵测试蛛丝蛋白分泌水平,具体包括:将质粒pCG8-I16cg或pCG8-I64cg(含cg2196信号肽)转入基因工程改造菌株,进行摇瓶发酵,分析蛋白表达分泌水平。将上述重组菌株接种至4mL BHI培养基(含有10mg/L氯霉素,50mg/L萘啶酮酸)中,30℃,220rpm振荡培养16h后,按1%接种量转接至20mL BHI培养基(含有10mg/L氯霉素,50mg/L萘啶酮酸)中,30℃,220rpm振荡培养至OD600≈4.0,加入IPTG至终浓度为1.0mM诱导6h,取发酵液上清进行SDS-PAGE分析,并利用ImageJ软件对蛛丝蛋白条带进行灰度分析,对各重组菌株的蛛丝蛋白相对表达分泌水平进行测定,结果如图6所示。
通过本实施例可见,敲除recA,pbp1a,sigD,Ncgl1480,Ncgl0535,Ncgl1095,Ncgl2717,所改造得到的ΔrecA,Δpbp1a,ΔsigD,ΔNcgl1480,ΔNcgl0535,ΔNcgl1095,ΔNcgl2717菌株,相比原始菌株(WT)对蛛丝蛋白MaSpI16和MaSpI64均有更优的表达分泌水平;过表达glyVXY,NCgl2356,NCgl0546,NCgl1382,NCgl2716,所得菌株相比原始菌株(WT)对蛛丝蛋白MaSpI16和MaSpI64均有更优的表达分泌水平。
实施例6
本实施例利用重组菌株Δpbp1a/pCG8-I16cg及Δpbp1a/pCG8-I64cg进行高密度发酵分泌生产重组蛛丝蛋白MaSpI16和MaSpI64,具体包括:
步骤1)从冷冻状态下将重组菌接种至新鲜的BHI培养基(含有10mg/L氯霉素,50mg/L萘啶酮酸)中,30℃,220rpm振荡培养16h,此为一级种子液。
步骤2)将一级种子液按照1%的接种量转接到200mL半合成培养基(含20g/L葡萄糖,10mg/L氯霉素,50mg/L萘啶酮酸)中,30℃,220rpm振荡培养至OD600≈28,此为二级种子液。
步骤3)将制备好的二级种子液接种至2L半合成培养基(含10mg/L氯霉素,50mg/L萘啶酮酸)中进行分批补料高密度发酵培养。具体步骤包括:将二级种子液按10%的接种量转接到无菌发酵罐中,设定发酵温度为30℃,pH为7.0,DO设定为30%(通过转速/溶氧联动进行控制)。随后发酵开始,定期取样进行OD600测定,待DO曲线出现急剧上升时表明培养基中葡萄糖耗尽,开始进行补料。待菌体生长至OD600≈60时,向发酵罐中加入IPTG至终浓度为1.0mM进行诱导,诱导15-18h结束培养。发酵结束后,发酵液于7,024g,4℃,离心20min,收集上清进行SDS-PAGE分析。菌体生长曲线、蛛丝蛋白分泌量和蛛丝蛋白分泌水平分析结果如图7所示。
采用转入空白质粒的重组菌株WT/pCG8作为对照菌株。
所述的半合成培养基主要成分包括:磷酸氢二钾3g/L,磷酸二氢钾1g/L,尿素2g/L,硫酸铵10g/L,硫酸镁2g/L,生物素0.2mg/L,硫铵素5mg/L,泛酸钙10mg/L,硫酸亚铁10mg/L,硫酸锰1mg/L,硫酸锌1mg/L,氯化钙10mg/L,酵母浸粉2g/L,酪蛋白氨基酸7g/L,葡萄糖20g/L。
所述的补料液为700g/L葡萄糖溶液。
上述任何用于菌体培养的器皿和培养基均在使用前进行过滤除菌或湿热灭菌。该实施例中所述的蛛丝蛋白分泌量是利用考马斯亮蓝染色估算所得,由于蛛丝蛋白中精氨酸和芳香族氨基酸氨基酸含量较低,使用该方法估算值会偏低,后续通过纯化目的蛋白,进一步准确计算分泌产量。
实施例7
本实施例阐明对谷氨酸棒状杆菌发酵生产得到的目的蛋白进行两步沉淀法纯化的方法及步骤,通过该方法可计算出目的蛋白的分泌量最高可达2.2g/L,能够得到的重组蛛丝蛋白纯度(电泳纯)可达到47-93%,且蛋白可溶于水,后续经过浓缩浓度可以达到400-600mg/mL。纯化过程中的SDS-PAGE检测结果如图8所示,具体步骤包括:
步骤1)取高密度发酵结束后的发酵液,使用低温离心机7,024g,4℃,离心20min,收集发酵液上清;
步骤2)取上述上清,利用1.32M HCl调节pH为4.0,室温搅拌2h;
步骤3)取上述溶液进行离心,15,422g,4℃,离心10min,收集上清;
步骤4)收集上述上清,加入终浓度为10%或25%(w/v)的饱和硫酸铵,室温搅拌1h;
步骤5)取上述溶液进行离心,15,422g,4℃,离心10min,收集沉淀,冷冻干燥称重计算蛋白质量及浓度,将沉淀使用去离子水重悬,即为目的蛋白溶液。
与现有技术相比,采用本方法实现重组蛛丝蛋白、类节肢弹性蛋白或类丝节肢弹性蛋白等序列高度重复蛋白在谷氨酸棒状杆菌中的表达分泌,通过对信号肽序列的筛选及谷氨酸棒状杆菌ATCC13032 RES167的宿主代谢改造,成功构建可以高效表达分泌重组蛛丝蛋白的表达载体及谷氨酸棒状杆菌重组菌,并建立高密度发酵工艺实现重组蛛丝蛋白的高效表达分泌,分泌产量最高达约2.2g/L。本发明采用的谷氨酸棒状杆菌表达分泌体系,使目的蛋白直接分泌到胞外,并实现两步沉淀法快速分离纯化得到可水溶的重组蛛丝蛋白,大大减化纯化流程及成本,为后续蜘蛛牵引丝蛋白的应用奠定基础。
综上,本发明通过筛选可用于目的蛋白分泌型表达的信号肽,系统改造谷氨酸棒状杆菌提升目的蛋白的表达分泌水平,在革兰氏阳性菌(谷氨酸棒状杆菌)中首次实现类蛛丝蛋白、类弹性蛋白、类丝弹性蛋白的分泌型表达,所得最优菌株分泌蛛丝蛋白的能力可达2.2g/L,是目前所有宿主分泌蛛丝蛋白的最高水平;由于蛛丝蛋白在分泌培养基中的含量高,因而可通过两步简单沉淀纯化方法获得纯度高达93%及水溶性高达660mg/mL的蛛丝蛋白。
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。
序列表
<110> 上海交通大学
<120> 利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法
<130> fxc728e
<141> 2021-12-01
<160> 59
<170> SIPOSequenceListing 1.0
<210> 1
<211> 31
<212> PRT
<213> 蜘蛛牵引丝蛋白(Trichonephila clavipes)
<400> 1
Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala
1 5 10 15
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
20 25 30
<210> 2
<211> 35
<212> PRT
<213> 蜘蛛牵引丝蛋白(Trichonephila clavipes)
<400> 2
Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly Pro Gly
1 5 10 15
Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Tyr Gly Pro
20 25 30
Gly Gln Gln
35
<210> 3
<211> 15
<212> PRT
<213> 节肢弹性蛋白(Drosophila melanogaster)
<400> 3
Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn
1 5 10 15
<210> 4
<211> 84
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly
1 5 10 15
Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
20 25 30
Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
35 40 45
Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Ala Gly Ala
50 55 60
Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala
65 70 75 80
Gly Ala Gly Ser
<210> 5
<211> 96
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 5
atgttaaaca gagtcagtcg tattgcaggc gcttctgcaa tcacactatg catcggctta 60
accacaatac taagccctac ttccactgca caaagc 96
<210> 6
<211> 81
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 6
atgcgtaaat tccgcaacac tgcaattgca ctagtttctg cagctgcaat caccttgggt 60
ggcgttaccg ctgctaccgc t 81
<210> 7
<211> 78
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 7
gtgcagggta tgaaacggaa gatggtcgca gcggcgctgg caacagcgct tctttttggg 60
gctgcacctg cgcacgct 78
<210> 8
<211> 81
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 8
atgcgttctt tccgtaccgc ggcagttgca ggccttactg cagttgcact ttccgtaggt 60
tccgccaccg tggcaactgc g 81
<210> 9
<211> 84
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 9
atgtctgtca caaacttccg tcggtttctt gctggcatag cggtcatcgc ggcgtgtgtt 60
gctgcgactc caacagctca ggca 84
<210> 10
<211> 111
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 10
atgtccgtat ttacacgagc tggcgaggca agccgtaagc tcgtcgccct tgtagtggct 60
cttgccaccg cggcagccct catggttgtt ggacaaggca ccgcacaagc t 111
<210> 11
<211> 129
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 11
atgcgcgaca ccgcatttcg ttccatcaag gctaaagctc aggctaagcg ccgttccctc 60
tggattgcag caggcgctgt cccaaccgca attgcgttga ctatgtccct ggcacctatg 120
gcttcggct 129
<210> 12
<211> 81
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 12
atgaagcttt cacaccgcat cgcagcaatg gcagcaaccg caggcatcac agtggcagca 60
ttcgcagcac ctgcttccgc a 81
<210> 13
<211> 87
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 13
atgaagcttc ttcgccgcat cgctgcacca gccatcgcgc tgggaattgc gatgtccacc 60
attgtcacgc catccaccgc aggcgct 87
<210> 14
<211> 87
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 14
atgaagactc gtcatcgggc cctctttgcg tgtatcgcgg cggtttcatt agtggcatct 60
cccggtcttg cacctactgc taacgcg 87
<210> 15
<211> 96
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 15
atgtcttctg cgtcatttac caccaaagca ctgtccgtac tcgcagcttt aacggctgcg 60
tctgccccct tagtggcggc gtcacctgca catgct 96
<210> 16
<211> 93
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 16
atgtctcgca tttctgcgcg cactctggca atcgcacttg ccggtgcaac cgcggccagc 60
ctggcagttg ttccagcagc aacagctaat cct 93
<210> 17
<211> 93
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 17
atgaacatct caaagctcgg actgaggatc gcggtcacag caacggcgac cacaacggcg 60
cttgccctcg gtggcacgca catggcagtt ggt 93
<210> 18
<211> 87
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 18
atgaacaagc ttgccacccg tgcgctcgtt gctctcacgg gatccgccat cgccatgacc 60
ggcctcaccg tagtctcggc taatgca 87
<210> 19
<211> 93
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 19
gtgcgtaaag gaatttcccg cgtcctctcg gtagcggttg ctagttcaat cggattcgga 60
actgtactga caggcaccgg catcgcagca gct 93
<210> 20
<211> 105
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 20
gtgggtaagc accgtcgcaa caattcaaac gcaactcgca aggctgtagc agcatctgca 60
gttgcgcttg gagcaaccgc agctatcgcc tccccagcac aggca 105
<210> 21
<211> 78
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 21
atgcgtttca agtcagttgc agctatcgca ctttccaccg caatgatcag gggtggaacc 60
gcaagcgttg ctaatgct 78
<210> 22
<211> 90
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 22
atgcaaataa accgccgagg cttcttaaaa gccaccacag gacttgccac tatcggcgct 60
gccagcatgt ttatgccaaa ggccaacgcc 90
<210> 23
<211> 87
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 23
atgccacagt taagcagacg ccagttcttg cagacaaccg ccgttactgc aggtctagcc 60
acttttgcgg gcacacctgc acgcgct 87
<210> 24
<211> 117
<212> DNA
<213> 信号肽序列(Artificial Sequence)
<400> 24
atgaacaata acgatctctt tcaggcatca cgtcggcgtt ttctggcaca actcggcggc 60
ttaaccgtcg ccgggatgct ggggccgtca ttgttaacgc cgcgacgtgc gactgcg 117
<210> 25
<211> 1131
<212> DNA
<213> 重组酶RecA编码基因(Artificial Sequence)
<400> 25
atggctccca agaagacagc aacaaaggca actgccgcca aggggaatga tcgtcagaag 60
gcacttgatg ccgcactagc cctgattgag aaggatttcg gtaaaggcgc tgtcatgcgt 120
ctgggtgatg agaatcgtcc gccaatccag accatctcat ctggtaacac cgcgattgat 180
attgccttgg gtatcggtgg attcccacgt ggtcgaatcg ttgaggtgta tggcccagaa 240
tcatcaggta aaaccaccgt tgcactgcac gcaattgcgc aggcacaaaa ggccggcggc 300
atcgctgcat tcattgacgc cgagcacgcg ttggatccag attatgctcg caagcttggt 360
gtagatactg atgcgcttct ggtttcgcag ccagacactg gtgagcaagc actagaaatc 420
gccgacatgc tggttcgttc cggcgcaatc gacatcatcg tgattgactc ggtggctgcg 480
ctgacaccaa aggctgaaat tgaaggcgaa atgggcgata gccacgttgg tcttcaggcc 540
cgcctcatga gccaggcgct tcgtaagatg acaggtgcgc tgtacaactc gggtaccacc 600
gcgatcttca ttaaccagct gcgtgaaaag atcggtgtga tgttcggttc cccagaaacc 660
accaccggtg gtaaggccct gaagttctac gcatctgttc gttgtgacat tcgacgaatc 720
cagactctga aggacggaca ggatgccatt ggtaaccgca cccgcttgaa ggtcgttaag 780
aacaaggtct ccccaccgtt caagatcgct gaattcgaca tcatgtacgg cgaaggcatc 840
tcccgtgaat cctccgtcat tgacttggca gtggacaacg gcattgtgaa gaagtcaggt 900
tcctggttca cctacgaggg cgaacagctt ggtcaaggta aggaaaaggt gcgtctttcc 960
ctcaaggaga accctgaact caccgatgag ctggaagata agatcttcaa gaagctggga 1020
gtaggcaagt acgctgcagc ctcagatgaa ctcaccgacg atccagtaga gctcgtgcct 1080
aacgttgact tcgatgatga agccgacacc gaagcagacg ctgaagacta a 1131
<210> 26
<211> 567
<212> DNA
<213> RNA聚合酶因子SigD蛋白编码基因(Artificial Sequence)
<400> 26
ttggctgata ctgagcgcga gctcgctgac ctggtaccgc aggcaacggc gggcgatcgt 60
cgggcattgc aaagaataat ggagattatt caccccattg ttttgcgtta tgctcgcgct 120
cgtattggag gtggacgcca gccaacggca gaagacgttg ctcaagaaat ctgcctggcg 180
gtagccacct ccattaggaa ctttgtcgac cagggtaggc cgttcatggc gtttgtctac 240
ggcattgcat ctaacaaggt cgcagatgct cacagggcga tgtcgaggga taaatcgact 300
cctattgagg aagtcccaga aacttcacca gatactttta cccccgaaga ctttgcgctg 360
gtcagcgatg gaagtaacag agttagggaa cttctcgatc tactgagtga aaaggcacgc 420
gacattctta tcttgagagt tatcgttggt ctttccgcag aagaaactgc agagatggtg 480
ggcagcaccc caggtgctgt acgagttgcc caacacaggg cactcacgac acttcgaagc 540
acacttgagc agcaggagaa caagtaa 567
<210> 27
<211> 2388
<212> DNA
<213> 青霉素结合蛋白PBP1a编码基因(Artificial Sequence)
<400> 27
gtgtccacca cgaattctct gacaaagctc gttgcatcta cagtcgccgc tggcgtcctt 60
ggtgcgctcg cacttgtgcc tttcgctagt ctttctggcg ttgcggttgc gcgtaccaat 120
gacacgatgc agaccaacct ttcagatctg acggatggtc gcgggccggg cgtcacgacg 180
attactgatt ccactgacca gccgattgct tatatttatg cgcagcggcg gtttgaggtt 240
gggggtgatc agatttctac gtcgatgaag gatgcgatcg tttcgattga ggatcgcagg 300
ttctatgagc atgatggtgt ggatttgcag ggctttggtc gtgcaatcct gacgaacctg 360
gctgcgggtg gcgtggagca gggtgcttcg acgattaacc agcagtatgt gaagaacttc 420
ttgctgttgg tggaagctga tgatgaggcg gagcaggctg ctgctgtgga aacctccatc 480
cctcgtaagc tccgtgagat gaagatggcg tctgatttgg aaaagacgtt gtcgaaggat 540
gagattctga ctcgttatct caacattgtt ccttttggta atggtgctta tggtgttgag 600
gctgcggcgc ggacgtattt cggtacgtcg gctgccgagt taaccattcc acagtctgcg 660
atgctcgcgg gcattgtgca gtcttcgtct tatctcaatc catacaccaa tcacgatgct 720
gtgtttgagc gtcgtaatac tgttttgggc gctatggctg atgctggcgc gatttcccca 780
gacgaggctt cggctttcca gcaggaacct ttgggtgtcc tggaaacccc gcaaggctta 840
tccaatggtt gtatcggcgc tggcgatcgt ggtttcttct gcgattacgc tctgcaatat 900
ctttctgagc agggaatcac ccaagatatg ctggcgaagg actcctacac catcaaattg 960
actttggatc cagatgttca ggatgcagcg cacaatgcgg tgtcctccca cgttgatcca 1020
accaccccag gtgtcgctga agttgtgaac gtcattgagc ctggcgagaa ctcccgcgat 1080
attttggcta ttacttcttc ccgcaactac ggccttgacc tggatgctgg tgaaacgatg 1140
ctgcctcagg caacgtcccg tgtgggtaat ggtgccggtt ccattttcaa gatctttacc 1200
gccgctgcag ccattcagca gggcgctggc ctagacacca tgttggatgt tccttctcga 1260
tatgaggtca agggcatggg ctccggcggt gccgcgaact gtcccgcaaa tacttactgc 1320
gtggaaaacg caggatccta cgcgcctcgc atgactctgc aggacgctct cgcgcagtcc 1380
cccaacactg cattcgttga aatgatcgag caggttggcg tggacaccgt tgtggatctt 1440
tcagtaaagc tgggcctgcg aagctacacc gatgaaggtt ccttcgacgg cgaaagctca 1500
atcgcggact acatgaagga caacaacctc ggttcttaca ctcttggacc taccgctgtt 1560
aaccctcttg aattgtccaa tgttgctgca accattgcat ccggtggcat gtggtgcgaa 1620
cccaatccca tcgccagcgt ccatgaccgt gaaggcaacg aagtctacat tgaccgccct 1680
gcatgtgagc gcgccatcga tgccgaaacg gcttcagctt tggccgtcgg catgagcaag 1740
gatacggtca gcggaactgc ggcctctgca gccagcatgt acggatggtc cttgccaacc 1800
gcagcgaaga ccggtaccac cgagtccaac cagtcctcag catttatggg cttcaacagc 1860
aactttgccg cagctccata catctacaat gacggcacct ccaccacccc actgtgcagc 1920
ggccccgtcc gccagtgcag cagcggtaac ctcttcggcg gtaacgaacc agctcaaaca 1980
tggtttaaca tggcaagcaa cgtccccgca gcttcgcaag gaacactgcc atccagcagc 2040
gattcattcc gcctcggcac ttccggcgaa ctcctcaacc aggttgtcgg ccaaagcgaa 2100
gcctccgctc gacgcaccct cgaagccaaa ggctacaagg tcaccacgcg ttcagtctcc 2160
ggcgccggca gcgcgcgcgg caccgtagtc agcgcaaccc ctcagggtgc agtgcttatc 2220
gacggtggaa ccgtcatttt ggacatctcc gacggcacaa gccctgcccc cgctgccacc 2280
aacaatgatg acagcgacga tggagacacc cctgctccat caacaaacaa ccgcggaaca 2340
accattgaag acgccatcaa tgacgccatc aaccagttct tccgctag 2388
<210> 28
<211> 1815
<212> DNA
<213> NCgl1480(Artificial Sequence)
<400> 28
ttgaccaggg cgttgattgc gcttgcagta agcggagctt tgcttagttc catgactccg 60
gcggtggcgc agccacagaa tccggatgac gcagccattg cacaggcaga ggaaaatgtt 120
tcggcgggcg atggggaagt cgcccgcctg gcaggatctt tgtccagcac tgacgcggaa 180
attaaccgcg tcgagctgga aatgggtgct ctgcgtgaag aagtgaacaa gtccctcgtg 240
gatttgcatg atgcgcaggc aatcgccgag caggcccgcc aagatgcact tgcagccaag 300
aaggatctcg atgattctca agcgcagatc gaagcagccc aagagcgcct tgatgagatt 360
tcacgtgcag cgtatcgcca aaacggaacc tccaaggggc tttcaggcat ctcgggcaat 420
ggaaattctg aagatgcgct agatcgtcag acttacctgc gaaccagtgc ggaaaagcag 480
caggcagctg ttgaagagct tgatcgcctc cgtacggaaa acgccaacaa ggaatcggtg 540
ttgcgccagg cccgcatcgt tgctgagcag cgtgaggcgg aagccgtcga aaagcaagtc 600
cagaccgagg ctgcaattgc cgcaaacagc gagcagctca atgtcttgac taacaatcgc 660
agtaccttgg ttgcccagcg tgatggggct gagcgcaact tggccatcgc tcgtgcgcag 720
gcggataatc tgcaaggtca gcgtgctgag tacgaggaat tccagcaggc agagcaggct 780
cgcatccagg cggaagcgga agctcaggct gctgcggagg agaagcgtcg tgccgatgag 840
gctgctgcac aggcagccgc tgaagctcaa gaagctgccc agcaagctca ggcggcggag 900
gaagcccaag ccgcgcaagc agctgagaca gcacaagccc aagccgcgca agctgcggaa 960
acccaagctg cacaagccgc gcaagctcag gcagaagcga atgatcgtgc cgccgcgcaa 1020
cagcgtgctg cagaggctca agcagcagcg gaacaggcgc aacgtgaggc tgacgctcag 1080
gcggccaacg atgcccaagc tcaggcactg cgtgaacagg cgctcaccgc agcctccatc 1140
gctgcggctg ctctaattgc ggcgagccag tccagccatg ccactactca aaatccttac 1200
ccaactgatg aagacgcgga tccgaccgat attgcggaca tccaaggccc aacgcagcca 1260
ggtacgggtg agtctggaga ttcccagagc aactccagcg acaacgattc cacaggcaac 1320
gattccacag gctctgactc ttcagattca gattcctccg gcaacgattc ttcagaggtt 1380
atttccggcg atcgttccgc tcagattgag actgtgattg cgcgcgccat gagccagttg 1440
ggtgtgcagt acgcatgggg tggcggtaac gctaatggcc caactctggg tatccgtgac 1500
ggtggcgtgg cggactctta cggcgattac aacaaggttg gcttcgactg ctctggactg 1560
accttgtatg cgtttgcggg tgtgggaatt tcacttcctc actacacggg ctaccagtac 1620
cagcacggca ccaaggtgtc gccttctgag atgcaacgtg gcgatctgat cttctatggt 1680
ccgggagcgt ctcagcacgt ggcaatttac ctcggtgatg gtcagatgat tgaggctccg 1740
aattcgggtt ctgtcgtgaa gatttctcct gttcgctgga gcggaatgac cgagagcgtg 1800
gtacgcctca tttag 1815
<210> 29
<211> 1332
<212> DNA
<213> NCgl2375(Artificial Sequence)
<400> 29
ttgaagcgtc ttactcgcat cgcatccatc agcatggcct ccatgctcgc cgccgcaagt 60
ctcgtcgcgt gctccggctc caccgacgag gaaggcgatg tttacttcct gaacttcaag 120
cctgaacagg acgtggcata ccaggaaatc gcaaaggcct acactgaaga gaccggcgtt 180
aaggtcaagg tcgttactgc cgcctccggc tcctatgagc agaccctcaa ggccgagatt 240
ggcaaggacg aagccccgac tctcttccag gtcaatggcc cagccggctt catcacttgg 300
caggactaca tggcagatat gtcggacacc gaggtagcta agcagctgac cgacgacatt 360
ccgccgctga ccaccgagga tggcgaggta cgtggcgttc cgttcgccgt cgagggcttc 420
ggcatcatct acaacgacga gatcttcgac aagtacatcg ccacgtccgg cgcaaagatc 480
aagtccacgg atgagatcac gagctaccag aagctcaagg aagtcgccga ggatatgcag 540
gcaaagaagg acgagctcgg tatcgaaggc gccttcgcct ccacctcgct gacatccggt 600
gaggactggc gttggcagac ccacctggcc aacgctccga tctggcagga gtaccaggac 660
aagggagtcg aggacaccaa cgagatcgag ttctcctaca acaaggagta caagaacctt 720
ttcgatctct accttgagaa ctccaccgta gaaaagtctc ttgcgccgtc taagacggtg 780
tctgattcca tggctgagtt cgcacagggc aaggccgcta tggttcagaa cggtaactgg 840
gcatggtccc agatttccga gacttctggc aacgtggtca aggaagacaa gatcaagttc 900
ctgcccatgt acatgggtct gccagatgaa gaaaagcacg gcatcaacgt cggtaccgag 960
aactatttgg gcgtgaactc tgaggcctcc gaggtcgacc agcaggccac caaggacttc 1020
gtggattggc tgtttacctc tgaagctggc aaggagcacg tggtgaagga ccttggcttc 1080
atcgcaccgt tcgaaagcta caccgctgag aacaccccga atgaccccct ttctgagcaa 1140
gtcgcggaag ctatcgctaa caaggatctg accacctacc cgtggaactt ccagtacttc 1200
ccgtcccagc agttcaagga tgacttcggc caggatctgt cgcagtacgc ctccggaaag 1260
ctgaagtggg aggacgtcgt caagcacttc aatgacaact gggctgctga gaaggaatcc 1320
aactggggct aa 1332
<210> 30
<211> 858
<212> DNA
<213> NCgl1289(Artificial Sequence)
<400> 30
ttgaaatatg aatttaataa tagattccga acgaaatcgg tgttagcgtc tgtgctgaaa 60
caatctaatc gcgtttcagg acacctacat gatcaggagc tctttttgtt aaacagagtc 120
agtcgtattg caggcgcttc tgcaatcaca ctatgcatcg gcttaaccac aatactaagc 180
cctacttcca ctgcacaaag cctcgaacag atcacccctt tacctgaatc tgcaatcgac 240
ctcaacgccg agattcacgt aaacacaagc gacatttcag ctgaacagat ccttggtgct 300
caagatgaaa tcacaactat gtacgattct catgacccct acgagtactt cgataccctc 360
accgacatcg aacagcgttc aataatagca gcgcttaaac gggatccgag ttcactccaa 420
caacgccaag aaacccgtct cgcggcacag tccgacccct acaaaattta catatcaggc 480
ctcgaaatgc tttcatgcat caatctagtt gatgttgtat catgcgggat tgcaaaccaa 540
gcagcaacca aagcaaataa tgaggctgtc gcacgatacc caggcgattc ccttcgcaac 600
ggcaaaggcg atgcatttcg gcattgctca tggaacgctc tgatgacgat acgaatcggg 660
agcaatggag ctgaaagaat tgcaacaaac cacgagacaa tcggggacgg tccggccgat 720
gaaaatgcaa tggacctatt caataatgca caaggccgac agatcggagc cggattcatt 780
aatagtaagg atgaaactag cgcgctcgcg atatgcgcgc tgtggacaaa tctcggtaga 840
ctaaaaactc taaaataa 858
<210> 31
<211> 750
<212> DNA
<213> NCgl0535(Artificial Sequence)
<400> 31
atggcgaaga attctcgaat ccgatacagc gcgtcaatca agcgtgccgc agctgcaatc 60
ctcaccgcag ctgctacctc agtcgcgttg atcgctgtgc cagcaactgc ttcagcacag 120
gacctcgcaa ccggcagctc ccagatccag actgatgctc gtgaaggtgc gtgggcaacc 180
cgcaacacca tccaagacca acttgcctcc attgggccag cagccctccc agtccgcgca 240
gcggtagaca atgccatcaa cggcatgttc ccaggacttg ttgatgaaaa ggttgcagca 300
gagcaggaag ctgcacgcgc agaagctgag cgcgaagcag cagctgcacg tgaagcagaa 360
gcagcccgcg tagccgcaga agaagccgca cgctttgacc gcggctcttg cccagcaatc 420
gctgatgtct gcgtggacat tgatggtgga cgtacctggc tgcaggaaaa cggtcaggtc 480
acctacggtg cagtcccagt ttcctccggc ggagttggcc aggaaacccc tcgcggaacg 540
ttctacatca accgcaaggt caaggatgaa atctcttacg agttcggtaa cgccccaatg 600
ccgtacgcca tgtacttcac ctacaacggc cacgcattcc accagggcaa tgttgcgact 660
acttccgctg gttgtgttcg cctaaacact caagatgcca tctactactt caacaacgtt 720
ggcatcggcg acatggtgta catctactaa 750
<210> 32
<211> 702
<212> DNA
<213> NCgl1756(Artificial Sequence)
<400> 32
atgttacgaa aaacagttac cggtggaatt gttgctctta ttgcgactgc cactctcatg 60
aattctgtct cttctgctga agaggtatcc ggagatgtct cagcagtaga tctcgcattt 120
gcagaattcg aacgtacaac tgcagaggac gtggccaatg gagtgccaga ggctatagct 180
aatgcagaaa aaatttccaa tttcactccg agcgaactag agggcttcaa gagtctttta 240
gctagtgatg cagtgctgag gtcggtctct ggagaagaaa ttctcccaga taatgttgaa 300
gtggttcaga cggacaacgt aggcgacgaa gatccaaatg tcatttctcc agcagcctgg 360
cagggttctg attatattga ggggtgttta acgaatactc tctacggaat tgaagtccta 420
aaggtttgta ctggtggaac ctactactcc aatgtaggaa tcgctacttc tgtcagcaat 480
cctcgcagtt acgtaaagta taacagtgct ccaggattgg cagtgacgac aagcaatcca 540
cgtggaggta tagagggtgg tcttgcggcc ttctatggtg atgttaacct tgttgctttt 600
ccaaatattc catgggtggg accaattagt tcttctgcag gaactcaccg cgttgtcgct 660
agatcatttc cgaattcagt ggtgcttaac gtctactact aa 702
<210> 33
<211> 1167
<212> DNA
<213> NCgl2316(Artificial Sequence)
<400> 33
atggaaatgt catacttcag ccatcaggac ccaaataatc cagagagtca catcaacttc 60
accatggcgc aaatggagat ccagcgctgg actttgctga tctcaaaccc agaggcggac 120
gctagcactc ttgtcatgga gttgaaaacc gtcacggggg aatccaagca ttttatcaac 180
caggctatta acgccatgtg ggctttaatg aagctgccca ttttaagagt ggtggtagaa 240
actcacttcc acgttcggat tccgtacctg gcccgcatta tgcaggcagt caagcaggct 300
aaaccggagt tgtgggatga gttggaccat cgcattgccg aaaagctgac accgcgcatt 360
gctggccagg cactgatgga agcctccgca cttgcagggc tgattactcg ctggatcaag 420
gaactggatc caaccttcac aggaaagaag cgtgggccaa aggggagtga tggcaccttg 480
actttccgcc acgtggacgg gcgtacgtac atcagtggaa atattgacgg tgtcaccggc 540
aagctgttcc aaaaagctct ggaaaaagtg aaacagaagg gcgaggacct cgcgcgggcc 600
ctggtcacct tcctggcggg gcggaccaaa gtgaaaatcg tcagcgcggt atacacgccc 660
ctggtgggtg gcgtgtcctg gattccgggg gtgggattcc tgagtcaaga ggagtcccgg 720
aagctgggta agactgcctc gaaggtcatt gacctggata cgatcgccac tcgtgtggaa 780
aatggctaca ccccaagtcc cgagctacgc ctttatgtga tggggcggga cggcacctgt 840
aggcatccgg gctgcacggt gtctgccgac aactgccaga tcgatcacgt gatcccgttc 900
ggtgagggtg ggttgactgt ggcctggaac ttgcagtgcc tctgcgcgca tcatcacaat 960
atgaagactg atgggcgcat ccaggcggcg attgattcca tgggtcgggt cgcctggatt 1020
gggccgtgca atcgcacagt ggtaaccgaa cctgtcggac cgttggcgca agagatgccc 1080
acggggcagt gggggcagac tctggaagca cggatggaga agacttttga aaagctccgc 1140
agttcactcg aggtattgga tgactaa 1167
<210> 34
<211> 1137
<212> DNA
<213> NCgl1383(Artificial Sequence)
<400> 34
atggccgcga cgttagatct tccagataca gatcccattg cctatgcaat gtttgcccac 60
tgtttcaccg gctcacggtt cacgccagcc gccgcgcgag tcagtaaaac actcgcagaa 120
tccggcgtcg cctgcctgcg tttcgatttc ccaggactga gccaatcaga aggtgacttc 180
tccaaaacca ccttcaactc caatgtggac gatatcgtgg cggcctcgca gtggttgacg 240
gaacactact ccgctccaca gttgctcatt ggacactcct tgggtggtgc agcatcactg 300
aaagctgcca ccaaaatctc ctgcctcaaa gcagtagcaa cgataggtgc accttttgat 360
cctgcgcacg cagtcctgca ctttgctgat cgcatatgtg atgtagatga tcaaggtgct 420
gtcactctgc agctcggagg ccgggatgtc accatttccc gcgaattcct cgaagacctt 480
gcagaggtca accccgaaga tcacctccgc aggctccgca aaccactgct tttactgcat 540
tcccccaccg accaaaccgt cggcgtggac aacgcgcagc tcatcttcag agtcactcgc 600
taccctaaat ccttgatgac tttggacaag gcagatcacc tgctcaccaa agatggcacc 660
gcacagcgtg cagcccggat catcgcgaac tgggtcgagc cctacctggt tccagaaaac 720
gtctgtgagg atcttccgga gtttgtcgcc gaagcctcaa ccatcaaagc cagcaaatac 780
ggcgcagcca tccgcaccgg tggtcacaat ttcatcaccg accgcgacaa atcccagggt 840
ggcaaaaacc tcggcttcac ccctacttcc ctgctggttt ccgcgcttgc tgctgcaaac 900
tctcaaacga tcaaacaagc agccatcgac aaccgcatca aaggccttga cgatgtcaaa 960
gtgacgatct cccaggaaca atcagccgac cacggccaga tcaaactccg ccgaaagatc 1020
tctttgatcg gcaacctcag cgatgctgac agtgcttcac ttcgggccgc atctaattcc 1080
tgctcgatta cccaactgct cgcgcaggga atcgtcatcg acgacgaggt gaactag 1137
<210> 35
<211> 459
<212> DNA
<213> NCgl1095(Artificial Sequence)
<400> 35
gtggttacac ccgttgatgg ttgggtggtg ggtcacagtt tagaaaaagt gacttcaaat 60
cacgtcgaaa agaaattgaa agtacttaag aaacatgtca cgctaggaga cgtgataatc 120
attgcaagcg ttgttttcct cctcgttggc gcaatgttgg cgaatgctgc cgctgcgctc 180
tttagtgcca gcgagccatt cggacgaatt tcctacctca ttggcctacc taacgaagac 240
gacttcgtgc cgtactcact acggttcgtg gcctttttcc cactgatgct ctccgcatcg 300
atggcagcat ccttcttcgg ggtgtgggca gtactaatca ttcctttcgg ttacttccca 360
tcactgatga tggttcataa gcacaacaag caggtacagc gaacctggga ttccgtcacc 420
gttgctgact tctacgagga ttccacccct ctggtctaa 459
<210> 36
<211> 696
<212> DNA
<213> NCgl2717(Artificial Sequence)
<400> 36
ttgtcaccag aggtagcaaa acataacgag gaactcgtcg aaaagcatgc tgctgcgttg 60
tatgacgcca gcgcgcaaga gatcctggaa tggacagccg agcacgcgcc gggcgctatt 120
gcagtgacct tgagcatgga aaacaccgtg ctggcggagc tggctgcgcg gcacctgccg 180
gaagctgatt tcctcttttt ggacaccggt taccacttca aggagaccct tgaagttgcc 240
cgtcaggtag atgagcgcta ttcccagaag cttgtcaccg cgctgccgat cctcaagcgc 300
acggagcagg attccattta tggtctcaac ctgtaccgca gcaacccagc ggcgtgctgc 360
cgaatgcgca aagttgaacc gctggcggcg tcgttaagcc catacgctgg ctggatcacc 420
ggcctgcgcc gcgctgatgg cccaacccgt gctcaagccc ctgcgctgag cttggatgcc 480
accggcaggc tcaagatttc tccaattatc acctggtcat tggaggaaac caacgagttc 540
attgcggaca acaacctcat cgatcaccca cttacccatc agggttatcc atcaattgga 600
tgcgaaacct gcacccttcc tgttgctgaa ggacaagacc ctagggccgg ccgttgggct 660
ggaaacgcca agacagaatg cggacttcac tcatga 696
<210> 37
<211> 1245
<212> DNA
<213> NCgl0550(Artificial Sequence)
<400> 37
atgcgcagac tcatcgcggt tagcttggcc gctctgttta tgttggcttc cactccagcg 60
acgagggcac aggaagtaga agctctcgct tgccccgagg tagcgatcgc cgatccttcc 120
tccgcagttt tagatgaaca cctttcgcag tcattatccc aagctcacca actagcaact 180
ggcgccggtg tgatggtggc agtcatcgac accggagtat ccctgcatcc acgtctgccc 240
cacttaattc ccggcggtga tttcgtgggc gcccaccaaa gccccgatgt gccaggtgaa 300
cttatcgatt gcgacggcca cggcaccatc gtcgccggaa tcatcgcctc ccaaggaaac 360
cccggcaccg gctggccata tgacggcagc tccgatcctt atatcggtgt cgccccagat 420
tccggaatca tctccattaa acaaaccagc tcatatgtgc gtactcgtga agattccaac 480
gtcggaacgc tgagcaccct ggcggaatcc atccaccgag ctctcgattc cggtgcccac 540
gtgatcaata tttccgtggt gtcctgtttg ccccaatcac ccgacgaggc cgcatcgttc 600
cagcctctga cggatgctct taacagagca gaacttcaag gggtgatagt ggtggcagca 660
gcaggaaacc tcgggcagga ttgtccagtt ggatctaccg tttatcctgc acattcagac 720
actgtgctct ctgtgtcggc acgttttgat tctcacacgc ttgcagaata ttccatgcct 780
ggcaaccaac aaatcctctc tgcaccaagc cacattcagg ctggtctatc accgcgtggc 840
gacggcttcg ccagccacat gatcaccacc gctggcgaaa gccccttcga gggcaccagt 900
tttgccgctc cagttgtcag cgccacagct gcactgcttc gccagcattt tccctttgcc 960
acaccctatg aaattcgtgc acgaatcttc aacagcatcg accctgcaag aggcgctatt 1020
gatccctacc tggcacttac tcaagaaatc tatcccacca ctcccctggt tcatgagatc 1080
gcactaagtg ttcccacgcc gccggatgat tctccacggg agcggggcat cctagttacc 1140
gcaatcattg ttgggttgct cgcagtgtta gctgtgctga tgggactacg ccgaattcat 1200
catcactcgg cctttcaaaa agctagctca agtgttatca cttaa 1245
<210> 38
<211> 1197
<212> DNA
<213> NCgl0291(Artificial Sequence)
<400> 38
ttgttgagcc ccagcctggt cgtcgatgcc gtcatcgtcc tcgttatggc attcgccctg 60
tggggtggtt ggcgtcaagg cgccttcacc tcgctgctgt ccaccgtcgg cgtcgtttct 120
ggcctggtag ttggcgcagc agcagctcca tttgtcatgg gtctcaccga ttccaccgcg 180
cttcgcttcc tcctggcgat cggcaccgtg gtgctgctgg ttggtttggg aaatctcatc 240
ggcgcccact tgggtgctgc gattagagac aacatcaaat tccgaagttc caggacctta 300
gattctgggc tcggcgccat tttccaagta ttggccacct tgatcgtggt gtggctcgtc 360
gcaattcccc tggccacagg cctccccgga actgtcgcca gcggaattag agactcccgc 420
atcctgggct ttgtagacaa atacaccccg caaggcctag ataccctgcc ctccaaaatc 480
gctgcgatgc tcagcgaatc cggcctccca ccactgattt cccccttcac cggcggatcc 540
tcggtggaag tggacgcccc cgaaatcaac gtcaccaacg ttgacctagt cgaagcaatg 600
cgcccgtccg tcatccacgt gatgggtgac gcccaagaat gcagccgccg actcatgggt 660
tctggctttg tggcatcccc cgactacgtt gtgaccaacg cccacgttgt tgcaggtacc 720
tccaccgtca gcctggatac catgatcgga acccgctccg cagaggtagt gttctacgac 780
ccgaacctgg acatcgcagt cctttacagc cctgacctcg gcttggatcc actgccgtgg 840
gcatccactc cgctagacac tggcgatgaa gcaatcgtca tgggattccc acagtccgga 900
cctttcaacg cctccccagc cagggtccgc gaacgcatca tgatcaccgg cagcaacatt 960
tacgccaacg gccagcacga acgcgaagcc tattcagtcc gcggatccat ccaatctgga 1020
aactccggcg gcccaatgac caacgaaatg ggtgaagtgg ttggtgttgt cttcggcgca 1080
gcgatcgacg gctccgatac cggttacgtt ctcactgccg aagaggtaca ggagcggatc 1140
ggcgacatca ccgcgctgac tcagcctgtc gatacgatgc agtgcgcggt ttcttag 1197
<210> 39
<211> 945
<212> DNA
<213> NCgl1748(Artificial Sequence)
<400> 39
atggggaact gggcagagat tactgatgaa atttctaaga tttaccaaga taatcagtac 60
aagattagac aaataaatga tgttgacgca gtaagcgata aacgtagaga agcgctacaa 120
gcactgtttg aacatactgg tcgaaatgta atcgtctatt attcagcgtg gttagaaaat 180
ggtcgacgat tttccgggca atctacggat ttttcggtaa atgatactga taaaaacagt 240
tttatgactg cgctccataa gttggatcag agtaaaggtc tcgatcttat cctccacact 300
ccgggtggag atgttgctgc gacagagtcg ttagtagatt acattcacgc actctttggt 360
caagatttca gagtcattgt cccccaactc gcaatgtcag caggaacaat gatcgcactt 420
tcgtccaaag agattgttat ggggaagcat tctagtcttg gccccattga tcctcagttt 480
aacggcctac cggcacacgg gttattggaa gaatttgagc aagcgaagaa agaggtctct 540
gagaatccgc agactgctca tatatggcag gtgatcttga ataaatacaa ccccacgatg 600
ttgggtgaag ctaaaaaagc tattcagtgg tccaactcga tggttaagca gtggcttgaa 660
aagggtatgt ttttagacga gcctgacaaa gaagaaaaag ccactcgcgc tatcaaagag 720
ctcgctgatc attccgttac tcttgcgcat aatcgacaca tttcggtcag taaagcactt 780
gagctgggat tgaatatcaa agaacttgag agcgatccaa agcttcaaga tttagttctt 840
actcttcacc acctgtccgt tattgctgcg caacgaggac cattaattaa gtttgtcgtc 900
aatcatgaca accgtggcac ttttctgcag gggcatgaaa actaa 945
<210> 40
<211> 1326
<212> DNA
<213> NCgl0841(Artificial Sequence)
<400> 40
atgacaaatc aattccccac aaacaacggt gagaacccgg accgtgcatc ggaaactcca 60
tcagaaacca actccttcga acatgtgcgt agttcatatc cgcagtgggg taacactgct 120
tccaatcaaa acccctatcc tggtgcgggc ttcggctctg aacaaaacac tcaacaagga 180
aatgagcaac aagctccagc ctggaccagt tgggataatc agcctctaag cacagatgta 240
aagccagcta aagaaaagcg aaaagttggc atcggaacgg cactcgcgtt aatgcttgtt 300
ggttctattg ctaccggtag cgttgtgggt gttgcagcaa cccagcttgg ttcggactct 360
tcaaccccag ttaatgctct tgagcagccc agcgtgcagc gcaccactaa tgctgaacca 420
ggttcagcgg aacaggttgc tgccgcagtt ttgccttctg tcgtctctat tcaggccatt 480
actaggacgt ctgcttctga gggctctgga tccattattt cctctgatgg ttacgtcatg 540
accaataatc acgtcgtggc aggcattgaa caatctggtg tgttagaagt aagtttctcc 600
gatggaacta cagcgcaagc tgattttatt gctggtgatc cttccacaga tattgctgtg 660
atcaagatta gggatgtgtc caaccttcca gttatgagct ttggagattc ggacgcatta 720
ggcgttggac aaagtgtgat ggctgttggt tctccactgg gtctgagctc cactgtgacc 780
accggtattg tgtcggccgt gaaccgtcct gtgcgagctt ctggtgatgg cggagagtcg 840
tccctcatcg atgctatcca gaccgatgct gcgatcaacc ctggtaactc tggtggtccg 900
ctggttgata tggatggcaa cctcattggc atgaattcgg taattgcatc gatttcgagc 960
accagcgatt ccgcaggttc cattggtctt ggtttttcta tcccatccaa ctttgccaag 1020
cgcgtggccg atcaattgat cagcaccggc caggtaactc agccgatgat cggtgtgcag 1080
gttggcactg acaactcagt gacaggcgct gtgattgcca gtgttcaaga tggtggaccg 1140
gccgcagatg ctggacttca gccaggcgat atcgtgacca agctcaatga tcgagttatt 1200
gatagcccag actccttgat cgctgctgtt cgttcgcatg attttggcga aaccgtcact 1260
ttaacaatta cacagccaga tacctcgcag agccgggagg tagaggttac tctgacgagt 1320
gagtag 1326
<210> 41
<211> 1554
<212> DNA
<213> NCgl2356(Artificial Sequence)
<400> 41
atgagcatca ccacacacgt ccaagcactc accacagcac tcaacgccat cgacaaccat 60
ttggccagca tgctcgacca tggtgtcacc ccagaccaat acaaggccat cgagcccgac 120
ctcatcgccc tagaacacac catcaaccac cacgccacca tcgccgccca aaccacagcc 180
ctcgccgaac gcaccaacgc cgcccacacc attggctcca cccacctcat cgactacctc 240
accaccacct tcggactatc caaagcacgc gcccaccacc gcatcaatct cgcccactcc 300
ctctacccca taccgaagcc aaaccctgga tctggcaacg gcggtaatgg tggcaatccc 360
gacggcggtc ctgatggtgg cgactcgggt gatgacgact ccggcgacga tgaccccgac 420
cccgaaccgg acaagcctga agacggcaaa cctgatggtg ataagcctcg tgggccacgg 480
atcagcgcgg aaaaacacgc catcatcacc gacgaactcg cccgcctcaa cccgaatacc 540
acacccagcg ccgaggagct acgcacccaa gccctgagtc aagcgatctg gcgcacccca 600
gaagacctcc gcacgtggct acgccaccac gtcaccaccg ccaataaaaa caaccccaac 660
cccatcaccg ccatgaaaag gcgctacctc gctgtaggta aacccgatgc cgacaacatg 720
gtccgcatca gcggcctcgt gcccgcagcc accgcagcac tgatcaccgc gaacaccgca 780
ccgttaacca aacgcggcaa cctcgtggat ctacccgcag cagaagatat gcgcacccgc 840
gggcaacgcc atgcggacgc gttgcatcac atcatggaga tctacaacca cggtattgtc 900
accccagctc gtggtggaac agccagcatc atcatctcca tgaccaccga tgatcttgat 960
gagatcaacc acggtgatca tggcgatggc agtctactta acaacctgta ccccaccaat 1020
acgggttact cattgaactt ggcggagatc atgaacctca tcgctgcgaa atacgacttc 1080
gctgtgctcc tcgatggtga gacggggcag ccgttgaacg tcaataggat gcagcgctca 1140
gcgaacctga ctcaacgcat cgcgttgttt gcttctgagt tggtgtgctc ggcacccaat 1200
tgtgacaggc cgcagttaga gtgcgaggtt catcatttag atccctggat gagaggtggg 1260
ctgaccaacc tggtcaatct cacgcatcag tgctttaatc accacccacg caacgatgat 1320
tccaggagtg gggtcaatgg taaagggttt atggaccgcg atcccgttac tggcagagta 1380
ggtcactact cagcaagtgg tgaggggccg gtgtttaacc ggtcggctgc tgctgatcgt 1440
tccggtggtg cgtgggccag acgtaagcat catggcccac caccggaacc gccgagcccg 1500
ccggatccac ctggtcctga gccggatcct ggtgatgagg gcagattgtt ctag 1554
<210> 42
<211> 1554
<212> DNA
<213> NCgl0891(Artificial Sequence)
<400> 42
atgagcatca ccacacacgt ccaagcactc accacagcac tcaacgccat cgacaaccat 60
ttggccagca tgcttgacca tggtgtcacc ccagaccaat acaaggccat cgagcccgac 120
ctcatcgccc tagaacacac catcaaccac cacgccacca tcgccgccca aaccaccgcc 180
ctcgccgaac gcaccaatgc tgcgcagtcg attggctcca cccacctcat cgactacctc 240
accaccacct tcggcctatc taaagcacgc gcccaccacc gcatcaatct cgcccactcc 300
ctctacccca taccgaagcc aaactctgga tctggcaacg gcggtaatgg tggcaatccc 360
gacggtggtc ctgatggtgg cgactcgggt gatgacgact ccggcgatga tgaccccgac 420
cccgaaccgg acaagcctga agacggcaaa cctgatagtg ataagccccg taggccacgg 480
atcagcgcgg aaaaacacgc catcatcacc gacgaactcg cccgcctcaa cccgaatacc 540
acacccagcg ccgaggaact gcgcaaccaa gccctgagtc aggcgatctg gcgcacccca 600
gaagacctcc gcacgtggct acgccaccag gtcaccaccg cgaacaaaaa caaccccaac 660
cccatcaccg ccatgaaaag gcgctacctc tcagtaggta aacccgatgc cgacaacatg 720
gtccgcatca gcggcctcgt gcccgcagcc accgcagcac tgatcaccgc gaacaccgca 780
ccgttaacca aacgcggcaa cctcgtggat ctaccagcag cagaagatat gcgcacccga 840
gggcaacgcc atgcggacgc gttgcatcac atcatggaga tctacaacca cggtattgtc 900
accccagctc gtggtggaac agccagcatc atcatctcca tgaccaccga tgatcttgac 960
gagatcaacc acgccaacag cagtggtgaa agtctgctta acaacctgta ccccaccaat 1020
acgggttact cattgaactt ggcggagatc atgaacctca tcgctgcgaa atacgacttc 1080
gctgtgctcc tcgatggtga gacggggcag ccgttgaacg tcaatcggat gcagcgctca 1140
gcgaacctga ctcaacgcat cgcgttgttt gcttctgagt tggtgtgctc ggcacccaat 1200
tgtgatcggc cgcagttaga gtgcgaggtt catcatttag atccctggat gagaggtggg 1260
ctgaccaacc tggtcaatct cacgcatcag tgctttaatc accacccacg caacgatgat 1320
tccaggagtg gggtcaatgg taaagggttt atggaccgcg atcctgctac tggaagagtg 1380
gggcactacc cagtgggtgg tgaggggccg gtgtttaacc ggtcggctgc tgctgatcgt 1440
tccggtggtg cgtgggcgag gcgtaagcat catggcccgc cacccacacc gccggacccg 1500
ccggatccgc ctggtcctga gccggatcct ggtgatgagg gcagattgtt ctag 1554
<210> 43
<211> 1260
<212> DNA
<213> NCgl0546(Artificial Sequence)
<400> 43
atggctgaag gcatgttgat gcccacgaca tcggcgcagg tgtcggggca taaatttctg 60
gtgcggcgca tcgaacatgg gttggtgatg ggcgatgtgc gcatgattca tgatccactt 120
ggtaggcgcc ggcgggcgtt ggtgtttggg gtggtggcgt gcgtgatgtt ggcggtggga 180
tcattggcgt tggctatttt tcgacccgcg aaggatccgg ccgatgcgcc gttgatccgc 240
tctgaatccg gcgcgctctt tgtgcagctg gatgggtcgg tgcatccggt ggctaatgtg 300
gcctcggctc ggttgattgt gggggagccg gtggatccgg tgaacgccag cgatgcgatc 360
atcgcgggca tgccgcgcgg agtgccggtg ggggttcctg atgcgccggg gcttttcagc 420
agcaccgaag aacccgagca agattggttt gtgtgccagg atgtcggcac tggggatcta 480
cacattacgg ttcctagggg cggactaggg cccaccctga ttgcggaagg aaatgggtgg 540
ctgggggcgt cgaaaagcga aaccggcgag gtcacctgga acctgattac cgcggacggg 600
cgccgcgaac tgccggcgtg gggcagcgaa catgggcgca ttatgcgccg ccacctgggg 660
atttccgagg acaccccgcg cgtatacctg accactgagc tgctcaacgc gatccccgag 720
cacgacgcgg tccgcttccc agccccgctg cccgagcttg tcgacgcctc cacccgcaac 780
tggttacggc tcgacggggc gctcgccgaa atcacgccgc tacagcgcgg gttgcttatc 840
gacgccggtt ccggtgtttt ccccgacccc accgcgcttc ttggtgtgca tgaagaaaca 900
gccaacacct tgacgctgcc cgagcaaaca gtttcttggc aagatctgga cggtggtttt 960
gcctgcgcgg atggtgaagg ccagatcggt ttcctggaaa ctctggaatc gggggtggcg 1020
ctatctggtg attccagggc gaaaagtttc agcacaaacg ctggtggggc agtgggcgtg 1080
gacagtggct ttggctacta tgtggtctct gattttgggc tgatgcaccc tgtttctact 1140
ggtgaatcga tggttgccct aggaatcact gacgtgcagg tcgtgccgtg gagcgtgctg 1200
cgattgttgc cgcagggaag tgaattagca aaagagacag cgctcgcgcc cacctattaa 1260
<210> 44
<211> 390
<212> DNA
<213> NCgl1382(Artificial Sequence)
<400> 44
gtggattttg agttgggtaa acgctgcccc tgcggaactg gccttaccta cggtgagtgc 60
tgctaccgct ttcactccgg cgaatgggtg gcccccaccg ctgaagcgct catgcgatct 120
cggttcaccg cctttgctgt tggaaattcc cagtaccttc ttgacacttg ggatccagaa 180
acccggccaa gcgaactcgg cctcgatatg ggaattgatt tctaccgcct cgacatcctc 240
gagaccaccg gcggtggacc cttcgattcc accggcaccg taaaattcca agccttctac 300
aaggggctcg cctccggcgt ccaagaagaa gactccacat tccgcaaggt caacggcgcg 360
tgggtctatt ccacaggaga tgtggactag 390
<210> 45
<211> 915
<212> DNA
<213> NCgl2716(Artificial Sequence)
<400> 45
atgaccacaa ccgttgcatc agtactatcc ccacacctta aagatcttga aaatgaatcc 60
atccacatcc tccgcgaggt agctggccag tttgataagg tcggcctgct gttttccggc 120
ggtaaggatt ccgtcgtggt gtacgagctt gcgcgccgcg ctttcgctcc agctaacgtg 180
ccttttgaat tgctgcacgt ggacaccggc cacaacttcc cagaggtttt ggaattccgc 240
gacaacctgg tggagcgcac cggcgcccgc ctgcgcgtag ctaaagtcca ggactggatc 300
gatcgcggtg acctgcagga acgcccagac ggcacccgca acccactgca gactgtccct 360
ttggtggaga ccatcgctga gcagggctac gacgcagtgc ttggtggcgc tcgccgcgat 420
gaggagcgtg cccgcgccaa ggagcgtgtg ttctctgtgc gtgactcctt cggtggttgg 480
gatccacgcc gtcagcgccc agagctgtgg accctctaca acggtggcca cctgccaggc 540
gaaaacatcc gtgttttccc aatctccaac tggactgaag ctgacatttg ggagtacatc 600
ggcgcccgtg gcatcgaact tccaccgatc tacttctccc acgaccgcga agttttcgag 660
cgcgacggca tgtggctgac cgcaggcgag tggggtggac caaagaaggg cgaggagatc 720
gtcaccaaga ctgtccgcta ccgcaccgtc ggcgatatgt cctgcaccgg tgctgtgctc 780
tccgaagccc gcaccattga cgatgtgatc gaagagatcg ccacctccac ccttaccgaa 840
cgtggcgcaa cccgcgccga tgaccgcctc agcgaatccg caatggaaga ccgcaagaag 900
gaaggctact tctga 915
<210> 46
<211> 23
<212> DNA
<213> 上游引物(Artificial Sequence)
<400> 46
gatccagccg gatctcagtg gtg 23
<210> 47
<211> 24
<212> DNA
<213> 下游引物(Artificial Sequence)
<400> 47
ctaacaaagc ccgaaaggaa gctg 24
<210> 48
<211> 46
<212> DNA
<213> 上游引物(Artificial Sequence)
<400> 48
caccaagctt aaaggaggac acgcatgtta aacagagtca gtcgta 46
<210> 49
<211> 37
<212> DNA
<213> 下游引物(Artificial Sequence)
<400> 49
ccatctgtcg accatatggc tttgtgcagt ggaagta 37
<210> 50
<211> 49
<212> DNA
<213> 上游引物(Artificial Sequence)
<400> 50
caccaagctt aaaggaggac acgcatgaac aataacgatc tctttcagg 49
<210> 51
<211> 32
<212> DNA
<213> 下游引物(Artificial Sequence)
<400> 51
ccatctgtcg accatatgcg cagtcgcacg tc 32
<210> 52
<211> 50
<212> DNA
<213> 上游引物(Artificial Sequence)
<400> 52
ttgcatgcct gcaggtcgac cattgaagtg gttcgttccg gtattcagtc 50
<210> 53
<211> 30
<212> DNA
<213> 下游引物(Artificial Sequence)
<400> 53
gcaccagttt taacaaagca gggacaatcc 30
<210> 54
<211> 58
<212> DNA
<213> 上游引物(Artificial Sequence)
<400> 54
tgctttgtta aaactggtgc ttttaattcc tcttagtttt attgacgttg atgtggac 58
<210> 55
<211> 50
<212> DNA
<213> 下游引物(Artificial Sequence)
<400> 55
aattcgagct cggtacccgg tatgccaatg gtgaatcgag agaatccttc 50
<210> 56
<211> 47
<212> DNA
<213> 上游引物(Artificial Sequence)
<400> 56
atcaaaggag gacacgcatg gaaatgtcat acttcagcca tcaggac 47
<210> 57
<211> 41
<212> DNA
<213> 下游引物(Artificial Sequence)
<400> 57
ccatctgtcg acttagtcat ccaatacctc gagtgaactg c 41
<210> 58
<211> 28
<212> DNA
<213> 上游引物(Artificial Sequence)
<400> 58
gccccatacg atataagttg taattctc 28
<210> 59
<211> 22
<212> DNA
<213> 下游引物(Artificial Sequence)
<400> 59
ttgaaggctc tcaagggcat cg 22

Claims (11)

1.一种用于表达分泌重组蛛丝蛋白、类节肢弹性蛋白或类丝节肢弹性蛋白的重组谷氨酸棒状杆菌的实现方法,其特征在于,分别将信号肽序列和重组蛛丝蛋白、类节肢弹性蛋白或类丝节肢弹性蛋白的编码基因连接到表达载体自身启动子序列之后,再将构建的重组表达载体转化到宿主谷氨酸棒状杆菌中,得到谷氨酸棒状杆菌重组菌;
所述的重组蛛丝蛋白包括:具有金丝网蛛(Trichonephila clavipes)蜘蛛牵引丝蛋白单体核心氨基酸序列MaSpI和MaSpII的肽重复8、16、32和64次的蛋白,其中:单体核心氨基酸序列MaSpI和MaSpII如SEQ ID NO.1和SEQ ID NO.2所示。
2.根据权利要求1所述的的实现方法,其特征是,所述的类节肢弹性蛋白是指:具有果蝇节肢弹性蛋白Resilin保守肽段氨基酸序列的肽重复16和32次的蛋白,其中:保守肽段氨基酸序列如SEQ ID NO.3所示。
3.根据权利要求1所述的的实现方法,其特征是,所述的类丝节肢弹性蛋白是指:具有果蝇节肢弹性蛋白和蚕丝蛋白的共聚物的肽重复5次的蛋白,其中:共聚物的氨基酸序列如SEQ ID NO.4所示。
4.根据权利要求1所述的的实现方法,其特征是,所述的信号肽序列包括:
①Sec分泌系统信号肽,其序列包括:cg1514、cg2196、cg2518、cg2195、cg2585、cg3186、cg3182、cg1109、cg0413、cg1087、cg1243、cg2868、cg3393、cg0470、cg2394、cg2402、cg0316;
②Tat分泌系统信号肽,其序列包括:cg0955、cg2485、TorA。
5.根据权利要求1~4中任一所述的实现方法,其特征是,具体包括以下步骤:
步骤1)以谷氨酸棒状杆菌RES167基因组或大肠杆菌MG1655基因组为模板,通过PCR扩增或引物退火合成DNA片段的方法得到信号肽序列;
步骤2)将步骤1得到的信号肽序列分别与表达载体通过酶切位点相连,构建20种信号肽质粒pCGN
步骤3)选择性地将8、16、32、64次重复的重组蛛丝蛋白的编码基因、16、32次重复的类节肢弹性蛋白的编码基因或5次重复的类丝节肢弹性蛋白的编码基因中的任一一种,通过酶切位点与步骤2得到的任意一种信号肽质粒pCGN连接,得到目的蛋白表达质粒;
步骤4)将步骤3得到的目的蛋白表达质粒电转至谷氨酸棒状杆菌中,得到谷氨酸棒状杆菌重组菌。
6.根据权利要求5所述的的实现方法,其特征是,在信号肽基因氨基端插入一段核糖体识别序列(aaaggaggacacgca)以保证基因在谷氨酸棒状杆菌中的正确翻译;并在信号肽序列核苷酸5`端和3`端分别引入酶切位点。
7.一种基于权利要求1~6中任一所述方法得到的用于提高重组蛛丝蛋白表达分泌的基因工程改造的谷氨酸棒状杆菌,其特征在于,基于谷氨酸棒状杆菌RES167改造得到;
所述的基因工程改造,包括:基因敲除和过表达。
8.根据权利要求7所述的谷氨酸棒状杆菌,其特征是,所述的基因工程改造,通过以下任意一种方式实现:
a)敲除核苷酸序列组SEQ ID NO.25-NO.40中的任意一个;
b)同时敲除如SEQ ID NO.25所示的重组酶RecA编码基因recA和如SEQ ID NO.27所示的青霉素结合蛋白PBP1a编码基因pbp1a;
c)同时敲除如SEQ ID NO.27所示的青霉素结合蛋白PBP1a编码基因pbp1a和如SEQ IDNO.26所示的RNA聚合酶σ因子SigD蛋白编码基因sigD;
d)敲除如SEQ ID NO.27所示的青霉素结合蛋白PBP1a编码基因pbp1a和如SEQ IDNO.28所示的Ncgl1480基因;
e)过表达如核苷酸序列SEQ ID NO.33-NO.36、SEQ ID NO.41-NO.45所示的基因中的任一一个。
9.根据权利要求8所述的谷氨酸棒状杆菌,其特征是,所述的敲除,涉及的核苷酸序列包括:重组酶RecA编码基因recA核苷酸序列如SEQ ID NO.25所示;RNA聚合酶σ因子SigD蛋白编码基因sigD核苷酸序列如SEQ ID NO.26所示;青霉素结合蛋白PBP1a编码基因pbp1a核苷酸序列如SEQ ID NO.27所示;核苷酸序列如SEQ ID NO.28所示的基因NCgl1480,核苷酸序列如SEQ ID NO.29所示的基因NCgl2375,核苷酸序列如SEQ ID NO.30所示的基因NCgl1289,核苷酸序列如SEQ ID NO.31所示的基因NCgl0535,核苷酸序列如SEQ ID NO.32所示的基因NCgl1756,核苷酸序列如SEQ ID NO.33所示的基因NCgl2316,核苷酸序列如SEQID NO.34所示的基因NCgl1383,核苷酸序列如SEQ ID NO.35所示的基因NCgl1095,核苷酸序列如SEQ ID NO.36所示的基因NCgl2717,核苷酸序列如SEQ ID NO.37所示的基因NCgl0550,核苷酸序列如SEQ ID NO.38所示的基因NCgl0291,核苷酸序列如SEQ ID NO.39所示的基因NCgl1748,核苷酸序列如SEQ ID NO.40所示的基因NCgl0841。
10.根据权利要求7所述的谷氨酸棒状杆菌,其特征是,所述的过表达,涉及的核苷酸序列包括:核苷酸序列如SEQ ID NO.33所示的基因NCgl2316,核苷酸序列如SEQ ID NO.34所示的基因NCgl1383,核苷酸序列如SEQ ID NO.35所示的基因NCgl1095,核苷酸序列如SEQID NO.36所示的基因NCgl2717,核苷酸序列如SEQ ID NO.41所示的基因NCgl2356,核苷酸序列如SEQ ID NO.42所示的基因NCgl0891,核苷酸序列如SEQ ID NO.43所示的基因NCgl0546,核苷酸序列如SEQ ID NO.44所示的基因NCgl1382,核苷酸序列如SEQ ID NO.45所示的基因NCgl2716。
11.一种分泌至培养基中的如权利要求7~10中任一所述重组蛛丝蛋白的纯化方法,其特征在于,包括以下步骤:
步骤①取高密度发酵结束后的发酵液,使用低温离心机7,024g,4℃,离心20min,收集上清;
步骤②取上述上清,利用1.32M HCl调节pH为4.0,室温搅拌2h;
步骤③取上述溶液进行离心,15,422g,4℃,离心10min,收集上清;
步骤④收集上述上清,加入终浓度为10%至25%(w/v)的饱和硫酸铵,室温搅拌1h;
步骤⑤取上述溶液进行离心,15,422g,4℃,离心10min,收集沉淀,将沉淀使用去离子水重悬,即为目的蛋白溶液。
CN202111454147.4A 2021-12-01 2021-12-01 利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法 Active CN114149954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111454147.4A CN114149954B (zh) 2021-12-01 2021-12-01 利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111454147.4A CN114149954B (zh) 2021-12-01 2021-12-01 利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法

Publications (2)

Publication Number Publication Date
CN114149954A true CN114149954A (zh) 2022-03-08
CN114149954B CN114149954B (zh) 2023-10-13

Family

ID=80455740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111454147.4A Active CN114149954B (zh) 2021-12-01 2021-12-01 利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法

Country Status (1)

Country Link
CN (1) CN114149954B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114644717A (zh) * 2022-04-15 2022-06-21 江苏农牧科技职业学院 一种重组人胰高糖素样肽-1及其构建方法和应用
CN116425848A (zh) * 2023-04-11 2023-07-14 北京新诚中科技术有限公司 重组嵌合蛛丝蛋白、生物蛋白纤维及其制备方法和应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1327049A (zh) * 1994-06-14 2001-12-19 味之素株式会社 产l-谷氨酸棒状细菌及生产l-谷氨酸的方法
CN1552854A (zh) * 2003-05-26 2004-12-08 清华大学 一种编码蛛丝蛋白的基因及其应用
WO2007013695A1 (ja) * 2005-07-29 2007-02-01 Nippon Shokubai Co., Ltd. 細菌にグリセリン資化能を付与する方法
CN101831762A (zh) * 2010-04-08 2010-09-15 苏州大学 虎纹捕鸟蛛丝/聚乳酸复合纤维多孔膜及其制备方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1327049A (zh) * 1994-06-14 2001-12-19 味之素株式会社 产l-谷氨酸棒状细菌及生产l-谷氨酸的方法
CN1552854A (zh) * 2003-05-26 2004-12-08 清华大学 一种编码蛛丝蛋白的基因及其应用
WO2007013695A1 (ja) * 2005-07-29 2007-02-01 Nippon Shokubai Co., Ltd. 細菌にグリセリン資化能を付与する方法
CN101831762A (zh) * 2010-04-08 2010-09-15 苏州大学 虎纹捕鸟蛛丝/聚乳酸复合纤维多孔膜及其制备方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
熊亚明;潘善培;陈敬;黄丹;关艺青;: "构建表达猪卵透明带抗原(pZP3α)的重组乳酸杆菌", 暨南大学学报(自然科学与医学版), no. 02 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114644717A (zh) * 2022-04-15 2022-06-21 江苏农牧科技职业学院 一种重组人胰高糖素样肽-1及其构建方法和应用
CN114644717B (zh) * 2022-04-15 2024-04-26 江苏农牧科技职业学院 一种重组人胰高糖素样肽-1及其构建方法和应用
CN116425848A (zh) * 2023-04-11 2023-07-14 北京新诚中科技术有限公司 重组嵌合蛛丝蛋白、生物蛋白纤维及其制备方法和应用
CN116425848B (zh) * 2023-04-11 2024-05-24 北京新诚中科技术有限公司 重组嵌合蛛丝蛋白、生物蛋白纤维及其制备方法和应用

Also Published As

Publication number Publication date
CN114149954B (zh) 2023-10-13

Similar Documents

Publication Publication Date Title
CN114149954B (zh) 利用谷氨酸棒状杆菌高效分泌生产类蛛丝、类弹性蛋白并快速纯化的方法
SG174313A1 (en) A polynucleotide and polypeptide sequence and methods thereof
CN112251458B (zh) 一种基于非同源末端连接机制的解脂耶氏酵母基因组整合的方法
CN110951667A (zh) 一株丰原素高产菌株lpb-18n及其选育和应用
CN114181321B (zh) 花鲈fgf6a、fgf6b以及fgf18重组蛋白及其制备方法和应用
CN116396397A (zh) 一种胶原蛋白短肽突变体融合蛋白及在制备乳铁蛋白肽中的应用
CN111019948B (zh) 一种丰原素合成代谢调控基因FenSr3及其应用
EP1185675B1 (en) Escherichia coli strain secreting human granulocyte colony stimulating factor (g-csf)
CN113249288B9 (zh) 一种表达glp-1类似物的重组菌及其应用
CN111117942A (zh) 一种产林可霉素的基因工程菌及其构建方法和应用
CN110684084A (zh) 一种猪圆环病毒3型(PCV-3)Cap蛋白病毒样颗粒的制备方法及应用
CN112608911B (zh) 一种rna聚合酶突变体及其应用
CN114262368A (zh) 一种重组Scl2类胶原蛋白及其可变速水凝胶的制备方法
CN113957028A (zh) 一种胞外蛋白酶失活的枯草芽孢杆菌及其构建方法与应用
CN112646044A (zh) TFF2-Fc融合蛋白及其高效表达生产方法
CN111808177A (zh) 提高蛋白表达量的信号肽及其应用
CN110591997A (zh) 一种提高木糖酸脱水酶活性的基因工程菌及其构建方法与应用
CN113292647B (zh) 一种igf-1的低成本制备方法及其应用
CN112062822B (zh) 一种碳分解代谢调控蛋白CcpA突变体I42A
CN110438058B (zh) 一种产l-色氨酸的重组菌株及其构建方法与应用
CN114350587B (zh) 一种基因重组串联表达利那洛肽的工程菌
CN113969258B (zh) 一种阿拉伯糖转化丰原素的枯草芽孢杆菌人工菌株构建方法
KR102488022B1 (ko) 재조합 실크 단백질 생산능이 향상된 재조합 미생물 및 이를 이용한 고분자량 재조합 실크 단백질의 생산 방법
CN110066821B (zh) 一种基于随机表达元件倍增方式构建随机蛋白表达文库的方法
CN112111441B (zh) 一株高产吩嗪-1-甲酰胺的基因工程菌株及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant