CN116964206A - 生产蛋白crm197的周质形式的方法 - Google Patents

生产蛋白crm197的周质形式的方法 Download PDF

Info

Publication number
CN116964206A
CN116964206A CN202280017425.6A CN202280017425A CN116964206A CN 116964206 A CN116964206 A CN 116964206A CN 202280017425 A CN202280017425 A CN 202280017425A CN 116964206 A CN116964206 A CN 116964206A
Authority
CN
China
Prior art keywords
seq
val
protein
ser
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280017425.6A
Other languages
English (en)
Inventor
M·达肯特
N·阿维兰热
S·休伯蒂
P·莱登特
C·罗德里格兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Korvik Europe
Axprice Biopharmaceutical Co
Original Assignee
Korvik Europe
Axprice Biopharmaceutical Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Korvik Europe, Axprice Biopharmaceutical Co filed Critical Korvik Europe
Publication of CN116964206A publication Critical patent/CN116964206A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/34Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/15Corynebacterium
    • C12R2001/16Corynebacterium diphtheriae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli

Abstract

本发明涉及用于生产SEQ ID NO:12的周质形式的方法,涉及编码SEQ ID NO:12和信号序列SEQ ID NO:2的表达载体,该表达载体使SEQ ID NO:12能够靶向周质空间,以及涉及用该表达载体转化的菌株。

Description

生产蛋白CRM197的周质形式的方法
本发明涉及一种用于生产蛋白CRM197的周质形式的方法、涉及编码蛋白CRM197和信号序列OmpC的表达载体,该表达载体使得能够将蛋白CRM197靶向周质空间,以及涉及用该表达载体转化的菌株。
重组蛋白CRM197、交叉反应材料或CRM可用作例如缀合疫苗中的载剂蛋白。缀合疫苗是一种将具有轻微免疫原性的抗原与具有免疫系统识别的T表位的“载剂”蛋白相组合的疫苗类型,以获得针对抗原的更强应答。
CRM197是白喉毒素的无毒突变蛋白。它被用作半抗原(如多糖)的载剂蛋白,以实现免疫原性应答。半抗原是抗原的组分之一,当与蛋白载剂组合时,半抗原赋予其足够的抗原性以产生体液免疫应答。
蛋白CRM197是白喉毒素的脱毒形式,其中52位甘氨酸被谷氨酸取代,消除了天然毒素的ADP-核糖基转移酶活性并使其无毒。蛋白CRM197包含具有535个氨基酸的单多肽链,分子量为58.4kDa。
CRM197基因最初在白喉杆菌(Corynebacterium diphtheriae)中克隆,白喉杆菌是引起白喉并含有天然毒素的病原菌。作为天然毒素,CRM197的分泌量非常少。因此,为了在其他细菌中生产CRM197蛋白,人们付出了巨大的努力。
如今,CRM197蛋白在几种缀合疫苗中用作载剂蛋白。例如,HibtiterTM是一种针对流感嗜血杆菌(Haemophius influenzae)b型的疫苗,于1990年获得FDA(美国食品和药物管理局)批准,是第一个使用蛋白CRM197作为载剂蛋白的缀合疫苗;半抗原是一种糖。
蛋白CRM197还具有HB-EGF(肝素结合表皮生长因子样生长因子)的结合位点,HB-EGF是EGF家族的成员。由于这种EGF受体在许多癌细胞中过表达,文献表明蛋白CRM197也可以用作靶向抗癌疗法的潜在药剂。
因此,对蛋白CRM197的工业生产的需求正在增加。
遗憾的是,在生产CRM197时,仍然很难在大肠杆菌BL21细菌的天然野生型菌株中实现CRM197蛋白的高且稳定的表达水平。通过在大肠杆菌中发酵,可以以相对高的水平生产蛋白CRM197的不溶形式,但是这种不溶形式的蛋白质中只有很小一部分可以转化为可溶形式。
从文献EP 3113800已知大肠杆菌的K12菌株中蛋白CRM197的生产。该文件涉及在大肠杆菌宿主细胞中生产重组蛋白CRM197的方法。在几个实施例中,该方法包括在适于重组蛋白CRM197表达的条件下,孵育具有减少的基因组的包含表达载体的大肠杆菌菌株,该表达载体包含编码蛋白CRM197的核酸序列,该核酸序列与表达控制序列可操作地连接。与大肠杆菌野生型菌株(例如BL21)中的生产相比,根据EP 3113800,在基因组减少的大肠杆菌宿主细胞中获得了CRM197产率的显著增加。
文献EP 3170837提供了通过周质表达生产细菌毒素的改进方法,该方法包括步骤a)使含有表达载体的细菌宿主细胞的培养物生长,其中特定信号肽序列连接至细菌毒素的序列,和b)诱导含有与细菌毒素连接的特定信号肽序列的多肽的表达,使得细菌毒素在周质中表达和分泌。
文献EP 2445930提供了一种生产蛋白CRM197和类似蛋白的方法,作为使用微生物白喉杆菌的替代方案。根据该文献中描述的程序,可以大量获得目的蛋白,用于基础研究和医学治疗应用。
文献EP 3444269描述了用于在鼠李糖分解代谢缺陷的大肠杆菌菌株中生产白喉毒素多肽的表达系统。该文献描述了包含鼠李糖诱导型启动子序列的表达系统和包含具有信号序列的第一部分和含有白喉毒素序列的第二部分的表达系统。
同时,文献WO 2011/126811 A2描述了在假单胞菌属(Pseudomonas)中生产重组蛋白的方法。
Philippe Goffin等人,Biotechnol.J.[生物技术杂志]2017,12,1700168,DOI10.1002/biot.201700168也表明,将微生物的生长与蛋白CRM197的生产解偶联可以促进蛋白CRM197的周质产生。
遗憾的是,尽管一些文献颂扬了其技术的优点,但目前市场上还没有无论工业生产规模如何都可以轻松利用并在工业上可获利的生产CRM197的方法。
因此,需要一种替代载体和由该载体转化的替代菌株,其能够实现可溶形式的蛋白CRM197的高且稳定的表达水平以及纯化蛋白CRM197的简单方法,使得蛋白CRM197可以在工业上使用和可以进入整个市场。
鉴于全球对蛋白CRM197的需求不断增长,生产这种蛋白的一个反复出现的问题是获得随时间推移稳定的高生产产率且尽可能简单,以实现进入整个市场可以承受的生产成本。
为了减少这些缺点和困难,本发明提供了表达系统,该表达系统能够实现高表达产率(该高表达产率随着时间的推移是稳定的)并且具有蛋白CRM197(SEQ ID NO:12)的合成速率和分泌速率之间的优化比率,以及使得SEQ ID NO:12能够被商业使用并可作为蛋白质/肽用于疫苗或靶向疗法的后续开发的纯化产率。
首先,发明人寻求在酵母中生产SEQ ID NO:12,这有利于下游纯化步骤;遗憾的是,这不起作用。
同样,发明人使用具有非常高拷贝水平或具有最佳启动子的质粒,以便能够在大肠杆菌中或其周质空间中大量合成SEQ ID NO:12。这不起作用。
经过各种初步步骤后,发明人得出结论,需要大肠杆菌的周质空间中的表达系统,但具有良好校准的水平,足够高以用于大规模使用,但不是太高以避免在大肠杆菌中聚集。
为此,在确定了上述众多问题后,发明人积极寻找最佳培养和生产条件,包括最佳遗传构建体(转录控制、翻译控制、周质靶向序列)。
更具体地,本发明提供了一种在革兰氏阴性原核生物中的表达载体,其具有以下特征:
(i)低拷贝数复制起点,低拷贝数由20个或更少的质粒拷贝数/细胞定义,
(ii)用外源诱导剂可诱导的启动子序列,
(iii)中等强度核糖体结合位点,该中等强度核糖体结合位点对应于被修饰以具有减少的核糖体结合的mRNA序列,
(iv)编码与全长SEQ ID NO:12具有至少95%同一性的蛋白的序列,
(v)编码信号肽的序列,该信号肽与SEQ ID NO:2具有至少95%序列同一性,该信号肽被排列以使SEQ ID NO:12能够靶向周质空间。
有利地,保留SEQ ID NO:12的位置52处的谷氨酸残基。用谷氨酸替代SEQ ID NO:12的位置52处的天然甘氨酸的突变提供了脱毒的SEQ ID NO:12肽。
特别有利地,可诱导的启动子序列在整个长度上与SEQ ID NO:5具有至少95%同一性,并且被T7噬菌体RNA聚合酶特异性识别。
有利地,中等强度核糖体结合位点由共有序列SEQ ID NO:6或由包含1或2或3或4或5个核苷酸的添加和/或缺失和/或点突变的共有序列SEQ ID NO:6定义,SEQ ID NO:6位于翻译起始位点的上游。
本发明还涉及大肠杆菌细菌的包含表达载体的转化菌株。大肠杆菌BL21 T7XB菌株已代表Xpress生物制品公司(Xpress Biologicals)于2020年12月23日在根特的BCCM“比利时微生物协调保藏中心(Belgian Co-ordinated Collections of Micro-organisms)”备案,编号为LMBP 12507。
大肠杆菌BL21 T7XB细菌的转化菌株(其具有的表达载体包含低拷贝数复制起点(由1个和20个之间质粒拷贝数/细胞定义)和中等强度核糖体结合位点(即具有经修饰的mRNA序列,使得核糖体结合减少))使得有可能获得SEQ ID NO:12的表达水平和分泌之间的非常好的比率,并确保高生产产率,同时随时间保持稳定。
优选地,大肠杆菌BL21细菌的菌株由λDE3原噬菌体的缺失定义,但以下除外:表达T7噬菌体RNA聚合酶所需的基因:大肠杆菌BL21(ΔDE3)或大肠杆菌BL21 T7XB。这种缺失的优点是不存在重新激活原噬菌体的风险,这为生产提供了极大的灵活性,没有交叉污染的风险,并且提供了高质粒稳定性。
本发明还涉及在周质空间中生产在其整个长度上与SEQ ID NO:12具有至少95%同一性的肽的方法,该方法包括:
(i)用能够在转化的大肠杆菌菌株的周质空间中表达SEQ ID NO:12的载体转化大肠杆菌菌株,该表达可由外源性药剂诱导,
(ii)在基本恒定的温度,例如37℃±1℃和恒定pH下,在转化的大肠杆菌菌株不合成SEQ ID NO:12的条件下培养转化的大肠杆菌菌株,
(iii)在该外源性药剂存在下且在降低的温度下持续预定时间段的诱导期以缓慢且受控的方式在周质空间中合成和分泌SEQ ID NO:12,有利地以减少毒性、代谢超负荷和/或分泌途径饱和,
(iv)任选地在诱导期后和冷却后,例如冷却至15℃±0.5℃,收获培养物,
(v)任选地收集周质空间中含有SEQ ID NO:12的培养的细菌,
(vi)任选地进行SEQ ID NO:12的周质提取,包括分离含有这些细菌的固体沉淀和含有周质空间的组分和SEQ ID NO:12的上清液,以及
(vii)任选地纯化蛋白SEQ ID NO:12。
因此,本发明提供了一种用于生产SEQ ID NO:12的方法,该方法被优化用于稳定和充分的表达,其中温度和pH在整个诱导期保持基本恒定,这简化了生产方法,最小化了错误的风险,并且还确保了生产成本方面的最佳产率。基本上恒定的温度是与转化的大肠杆菌菌株的最佳生长代谢相适应的温度。
优选地,大肠杆菌菌株是由以下定义的BL21菌株:λDE3原噬菌体缺失,但表达T7噬菌体RNA聚合酶所需的基因除外。
有利地,通过周质空间中的靶向信号肽提供在周质空间中生产在其整个长度上与SEQ ID NO:12具有至少95%同一性的肽,该信号肽与SEQ ID NO:2具有至少95%序列同一性。
优选地,降低的温度为23℃±0.5℃和/或诱导期的预定时间段在15小时和25小时之间,优选18小时和22小时之间,更优选约20小时,和/或诱导期的pH在6.8和7.5之间,优选在7.0和7.2之间。
优选地,通过开/关诱导系统进行由外源性药剂诱导的表达,外源性药剂是异丙基-β-D-1-硫代吡喃半乳糖苷。异丙基-β-D-1-硫代吡喃半乳糖苷也称为IPTG。
有利地,培养和诱导期不含抗生素,例如卡那霉素、氨苄青霉素、链霉素、氯霉素或四环素。
优选地,表达载体具有由20个或更少的质粒拷贝数/细胞定义的低拷贝数和/或具有中等强度的核糖体结合序列。
有利地,蛋白SEQ ID NO:12的纯化包括以下连续步骤:
(i)通过至少一个过滤步骤,优选两个过滤步骤,澄清来自周质提取的含有周质空间的组分和蛋白SEQ ID NO:12的上清液,并回收包含SEQ ID NO:12的滤液,任选地,
(ii)安排一系列色谱步骤,以回收待保留的级分中的SEQ ID NO:12以及待去除的一个或多个级分中的污染物,
(iii)任选地,去除残留的内毒素,以及
(iv)任选地,对待保留的包含SEQ ID NO:12的无内毒素级分进行灭菌。
有利地,周质提取是通过渗透压休克进行的周质提取。
优选地,周质提取包括以下步骤:
(i)将收集的细菌形成的沉淀悬浮在高渗溶液中以形成细菌的高渗悬浮液,
(ii)通过扩散环并借助转移管和第一泵将细菌的高渗悬浮液转移至第二混合容器中,
(iii)借助转移管和第二泵向所述混合容器内补料低渗溶液,从而对该第二混合容器内的高渗悬浮液中的细菌产生渗透压休克,该渗透压休克将周质空间的内容物释放到该第二混合容器的溶液中,
(iv)排出混合物,使得该第二容器中的细菌的悬浮液中的细菌的停留时间在10秒与1分钟之间,更优选地约30秒,并且使得该第二容器中的混合物的体积保持恒定,该排出是通过管和第三蠕动泵进行的。
优选地,该系列色谱步骤包括在阴离子交换树脂上的第一色谱和在疏水树脂上的第二色谱。
最后,本发明涉及一种选择信号肽以优化大肠杆菌细菌的周质空间中目的蛋白的生产的方法,其中:
-产生遗传构建体,其包含与SEQ ID NO:7具有至少95%序列同一性的鼠李糖诱导型启动子,该启动子控制与待测试信号肽一起排列的目的蛋白的表达,
-用该遗传构建体转化该大肠杆菌细菌,
-在不含鼠李糖的培养基中产生转化的大肠杆菌细菌的几个平行培养物,
-将转化的大肠杆菌细菌在确定浓度的鼠李糖存在下培养,以便获得目的蛋白表达的低诱导,并在另一确定浓度的鼠李糖存在下将转化的大肠杆菌细菌进行另外培养,以便获得目的蛋白表达的高诱导,以及,
-比较周质空间中目的蛋白的丰度,并且任选地,对选自由质粒丢失、细菌生物量减少、胞质聚集物或降解产物的形成和信号肽的部分切割组成的组的代谢的有害影响进行定量,以及,
-根据周质空间中目的蛋白的丰度,并且任选地,通过拒绝与过高的有害作用相关的信号肽来选择信号肽。
例如通过建立与信号肽和目的蛋白质配对相关的评分来定量对代谢的有害影响,其中考虑了几种有害影响,例如质粒损失、细菌生物量减少、胞质聚集物或降解产物的形成和信号肽的部分切割。在目的蛋白的周质表达的正常过程中,与该目的蛋白相关的信号肽在运输到周质空间的过程中被切割。因此,信号肽的部分切割可能会导致目的蛋白的功能发生不希望的变化。
本发明的其他特征、细节和优点将从下面给出的描述中显现出来,该描述是非限制性的并且参考附图。
图1显示了通过发酵生产蛋白SEQ ID NO:12的各个步骤。
图2显示了纯化蛋白SEQ ID NO:12的各个步骤。
图3显示了使用接种各种表达载体的大肠杆菌BL21(DE3)培养物在600nm处的光密度测量的蛋白SEQ ID NO:12的表达。质粒pD431:低质粒拷贝数,质粒pD451:高质粒拷贝数。MR:中等核糖体结合强度,SR:高核糖体结合强度。诱导类型:非诱导培养物(带有黑点的柱)、用IPTG诱导的培养物(带有垂直线的柱)或用乳糖自身诱导的培养物(带有水平线的柱)。右侧最后3个柱:相同诱导条件下的阳性对照。
将用表达载体pLM7-OC-CRM(图1中步骤I)转化的大肠杆菌BL21T7XB菌株在37℃±0.5℃恒温和恒定pH 7.0±0.2下培养。
更具体地,用表达载体pLM7-OC-CRM转化的大肠杆菌BL21菌株在37℃±0.5℃恒温下的培养(图1中的步骤II至IV),然后在23℃±0.5℃恒温和恒定pH 7.0±0.2下的诱导(图1中的步骤V)由3个连续的步骤组成:
(i)在摇瓶中预培养(图1中的步骤II),
(ii)在生物反应器中以“分批”模式生长(图1中的步骤III和IV),
(iii)在生物反应器中以“补料分批”模式生长(图1中的步骤III和IV)。
生物反应器例如是50L生物反应器,通过0.2μm除菌过滤器补料35LGYPSCI培养基、甘油和酵母提取物。
在生物反应器中以“补料分批”模式进行生长,供应氧气使得溶解氧的水平大于或等于30%饱和度,并且持续搅拌。
“分批”和“补料分批”培养都优选在消泡剂存在下进行。
一旦由载体pLM7-OC-CRM编码的SEQ ID NO:12的诱导表达以及SEQ ID NO:12在周质空间中的分泌完成,则在冷却至15℃±0.5℃后收获培养物(图1中的步骤VI和VII)。培养后通过离心收集周质空间中含有SEQ ID NO:12的细菌(图1中的步骤VII)。
关于SEQ ID NO:12的纯化,然后将由分离的细菌形成的细胞沉淀储存在低温下,例如-20℃,甚至更低(图2中的步骤VII)。然后将收集的细菌用作周质提取的基本材料(图2中的步骤VIII和IX,参见实例4)。如上所述纯化含有周质空间的组分和SEQ ID NO:12的澄清上清液(图2中的步骤X至XIV)。更具体地,该系列色谱步骤包括在阴离子交换树脂上的第一色谱(图2中的步骤XI)和在疏水树脂上的第二色谱(图2中的步骤XII)。
有利地,随后的过滤步骤是超滤步骤(图2中的步骤XIV)。超滤方法的第一步骤由以下组成:将SEQ ID NO:12浓缩至约4.5mg/mL,第二步骤由以下组成:用大10倍的体积的配制缓冲液(15mM磷酸盐缓冲液、5%蔗糖、pH 7.35)渗滤浓缩的滞留物。选择30kDa中空纤维是因为它对应于具有可以保留SEQ ID NO:12的最高“截止”值的纤维。
如果需要提高SEQ ID NO:12的纯度,则可以进行去除残留的内毒素的附加步骤(图2中的步骤XIII),更具体地在其外层中含有季铵基团的膜上。
说明性实例。
实例1.–表达载体的制备
为了选择能够被大肠杆菌进行周质表达的载体,将几个信号肽融合在鼠李糖诱导型载体内的SEQ ID NO:12的N末端。用这些不同的组合转化大肠杆菌BL21(DE3)后,针对不同鼠李糖浓度并因此针对不同诱导水平通过免疫印迹分析评估每个克隆中SEQ ID NO:12的表达。
考虑三个标准来选择SEQ ID NO:12-信号肽(CRM197-信号肽)的组合,然后在用IPTG诱导后测试其表达:(1)对应于SEQ ID NO:12并具有约58kDa表观分子量的条带的强度,(2)没有/低比例的SEQ ID NO:12仍具有信号肽(表观分子量约60kDa)表明分泌途径饱和,(3)不存在或很少存在聚集或降解产物(表观分子量大于97kDa或在14kDa和58kDa之间的条带)。
创建选择矩阵以选择信号肽-SEQ ID NO:12的组合,然后在用IPTG诱导后测试其表达。表1显示了得分的分配以及累积得分,累积得分通过将三个标准和三个诱导水平获得的得分相乘来计算。最高累积得分代表在不存在细胞质SEQ ID NO:12并且没有降解或聚集的情况下表达最大量的周质SEQ ID NO:12的构建体。
尽管除了11mM外,构建体TorT-SEQ ID NO:12的得分比其他变体高得多,但分泌过程中信号肽的切割在蛋白SEQ ID NO:12的N末端的起始处留下了另外的丙氨酸残基。产生的SEQ ID NO:12的同一性不是100%,这导致发明人放弃该变体。选择了两个候选物在IPTG诱导载体中进行筛选:SEQ ID NO:9-SEQ ID NO:12(OmpA-CRM197)和SEQ ID NO:2-SEQ IDNO:12(OmpC-CRM197)。
表1:用于选择信号肽组合-SEQ ID NO:12(CRM197)的矩阵
根据免疫印迹结果(蛋白质印迹)分配的得分(1-2-3):
·S1:标准1的得分:对应于SEQ ID NO:12的条带的强度。
·S2:标准2的得分:没有/低比例的蛋白质仍具有信号肽。
·S3:标准3的得分:不存在/很少存在聚集或降解产物。
将两种选定的肽-SEQ ID NO:12组合亚克隆到一系列IPTG诱导型载体中,其中评估i)复制起点(拷贝数),ii)核糖体结合位点的强度,iii)RNA聚合酶的类型、大肠杆菌BL21宿主的T5或BL21(DE3)菌株的T7噬菌体和iv)评估IPTG诱导剂的浓度。
图3显示,对于具有不同质粒拷贝数(<20和约500个拷贝)、核糖体结合强度(在mRNA序列修饰后的中等结合和强结合)和信号肽SEQ ID NO:2(OmpC)和SEQ ID NO:9(OmpA)的八个表达系统,用IPTG诱导4小时的培养物的OD600远低于那些未诱导的或用乳糖自身诱导的培养物。烧瓶中培养基在600nm处的光密度,OD600,通过分光光度法使用本领域技术人员熟知的用于测量光密度的标准方案来测量,并考虑对应于无细菌培养基的光密度的空白测量。发明人得出结论,太快且太广泛产生的SEQ ID NO:12是有毒的和/或其合成代表了细菌的显著代谢负荷,因此减慢了细菌生长。该结果证明了分离生物质产生和SEQ ID NO:12的表达阶段以及以足够慢且受控的方式诱导表达的重要性,以避免毒性、代谢超负荷和/或分泌途径饱和。此外,在这些条件下,特别是用IPTG高度诱导SEQ ID NO:12的表达,当使用信号肽OmpC时,与信号肽OmpA相比,细胞毒性低很多。
基于上面举例说明的和在微孔板中进行的培养中获得的比较结果,选择与大肠杆菌BL21(DE3)菌株相关的两个载体用于在5L生物反应器中进行的最终选择。生物反应器代表了工业规模生产的条件:BL21(DE3)/pD431-MR-OmpC-CRM197(也称为BL21(DE3)/pLM7-OC-CRM),其具有核苷酸序列SEQ ID NO:10和BL21(DE3)/pD451-SR-OmpC-CRM197(也称为BL21(DE3)/pHS7-OC-CRM),其具有核苷酸序列SEQ ID NO:11。第一表达系统包含确保SEQID NO:12缓慢表达的组分(低质粒拷贝数,中等核糖体结合),避免任何毒性、代谢超负荷和/或分泌途径饱和,而第二表达系统包含支持蛋白的快速表达的组分(高质粒拷贝数,强核糖体结合)。然而,考虑到质粒稳定性较低,选择了第二载体。
在代表工业条件的条件下比较两种表达系统(BL21(DE3)/pLM7-OC-CRM和BL21(DE3)/pHS7-OC-CRM)的表达水平。培养物在5L发酵罐中生长,其设计、使用和控制与工业生产发酵罐相同,特别是在级联、搅拌和通风方面。使用“补料分批”补料策略使培养物生长至高细胞密度。表2中总结了针对各种构建体和测试条件记录的表达水平和质粒稳定性。将SEQ ID NO:12的最高表达与高质粒稳定性相组合的条件(条件F05)涉及低质粒拷贝数、中等核糖体结合和23℃的诱导温度,这对应于一组能够缓慢和受控表达SEQ ID NO:12的因子。导致最低表达(条件F03)或最低质粒稳定性(条件F06)的条件涉及高质粒拷贝数和强核糖体结合,这是导致SEQ ID NO:12快速表达并导致毒性、代谢超负荷和/或分泌途径饱和的因子。
基于以上示例的比较结果,选择载体pLM7-OC-CRM用于生产SEQ ID NO:12,因为其足够高的表达水平和高质粒稳定性。
实例2.-含有表达载体的细菌菌株的制备
用含有与信号肽SEQ ID NO:2(OmpC)融合的SEQ ID NO:12的不同载体转化三种细菌菌株:
·大肠杆菌BL21,该菌株的特征是缺乏λDE3原噬菌体并使用T5细菌聚合酶,其转录效率与原噬菌体的T7聚合酶不匹配;
·大肠杆菌BL21(DE3),涉及基于λDE3原噬菌体的T7 RNA聚合酶的IPTG诱导;
·大肠杆菌BL21(ΔDE3)或大肠杆菌BL21 T7XB,该专有菌株的特征是原噬菌体序列缺失,但表达T7聚合酶所需的基因除外。
表3在质粒拷贝数、启动子类型(T5或T7)和核糖体结合强度(中等和高)方面比较了涉及三种测试菌株(大肠杆菌BL21、大肠杆菌BL21(DE3)和大肠杆菌BL21 T7XB)的不同表达系统,以及在微孔板培养期间获得的结果(OD600和SEQ ID NO:12的细胞质表达水平)。对于大肠杆菌BL21细菌(其特征在于T5细菌聚合酶的效率较低),细菌生长(OD600)在IPTG诱导过程中没有受到显著影响(或仅轻微影响),而通过免疫印迹分析评估的表达水平较低,除了由涉及高拷贝数和强核糖体结合的载体转化的菌株获得的表达水平。对于用低拷贝数和中等核糖体结合的质粒转化的大肠杆菌BL21(DE3)菌株,在IPTG诱导期间观察到对细菌生长无毒性和显著表达;所有其他构建体都受到毒性的影响和/或低表达。大肠杆菌BL21T7XB菌株获得的结果与大肠杆菌BL21(DE3)菌株获得的结果相似。
在代表工业条件的条件下,测定用含有与信号肽SEQ ID NO:2融合的SEQ ID NO:12的不同载体转化的三种细菌菌株(大肠杆菌BL21、大肠杆菌BL21(DE3)和大肠杆菌BL21T7XB)的表达水平和质粒稳定性。培养物在5L发酵罐中生长,其设计、使用和控制与工业生产发酵罐相同,特别是在级联、搅拌和通风方面。使用“补料分批”补料策略,培养物达到高细胞密度。表4总结了针对不同构建体记录的表达水平、质粒稳定性和测试条件。涉及大肠杆菌BL21菌株的四个构建体(其特征是T5细菌聚合酶的较低效率)具有1.02g/L和2.46g/L之间的高表达水平和高质粒稳定性(97%和100%之间),与质粒拷贝数和核糖体结合强度无关。对于大肠杆菌BL21(DE3)菌株,只有涉及低质粒拷贝数和中等核糖体结合的构建体才具有1.00g/L和3.10g/L之间的高表达水平和高质粒稳定性(94%和100%之间)。对于特征在于原噬菌体序列缺失(表达T7聚合酶所需的基因除外)的大肠杆菌BL21(T7XB)菌株,对于涉及低质粒拷贝数和中等核糖体结合的构建体,记录了高表达水平(1.62g/L)和高质粒稳定性(97%),而对于用涉及低质粒拷贝数和强核糖体结合的载体转化的菌株,观察到低表达水平(0.62g/L)和低质粒稳定性(23%)。
然而,选择第三大肠杆菌BL21 T7XB菌株(其特征在于原噬菌体序列缺失,但表达T7聚合酶所需的基因除外)来生产SEQ ID NO:12。发明人确定,使用基于T5细菌RNA聚合酶(大肠杆菌BL21)的表达系统控制表达有时会导致泄漏和鲁棒性降低,其次,大肠杆菌BL21(DE3)菌株中λDE3原噬菌体的存在代表裂解循环的潜在再激活,因此具有显著的工业风险。
实例3.-大肠杆菌中CRM197的周质表达。
载体pLM7-OC-CRM与大肠杆菌BL21 T7XB菌株组合提供了SEQ ID NO:12的最佳周质生产产率。CRM197的最佳周质生产取决于蛋白CRM197的表达水平、信号肽的性质和载体的质粒稳定性之间的正确平衡。表达水平过高可能导致不溶形式的蛋白CRM197在细胞质中大量生产,从而降低细胞活力,但不会引起显著的周质生产。
在本发明的一个示例性实施例中,以下步骤描述了在用质粒pLM7-OC-CRM转化的大肠杆菌BL21 T7XB菌株接种的发酵罐中培养期间用于生产SEQ ID NO:12的各种条件:
·使用的菌株:大肠杆菌BL21 T7XB/pLM7-OC-CRM(SEQ ID NO:10)。
·步骤1:在烧瓶中预培养
烧瓶体积:500ml至2L,接种OD600:0.005,培养基:YGP、卡那霉素:25mg/L,温度:37℃,搅拌:270rpm,培养时间:7小时+/-1小时。
·步骤2:“分批”模式培养
生物反应器体积:50L,培养基:含10g/L甘油和5g/L酵母抽提物的GYPSCI,温度:37℃,pH:7.0,在时间t=0小时开始用含有400g/L甘油和217.5g/L酵母提取物的GYPSCI培养基补料,在时间t=0和t=9小时30分钟之间补料速率从0到127g/h线性增加。
·步骤3:“补料分批”模式培养
在时间t=9小时30分钟开始用GYPSCI培养基补料,指数生长率为0.15h-1,温度:37℃,pH:7.0,在+/-10小时后当OD600=60+/-2时指数补料停止。
·步骤4:“补料分批”模式下的诱导期
使用0.1小时-1的指数生长速率持续6小时,然后恒定补料速率持续14小时,通过添加IPTG开始诱导以获得2mM的反应器浓度,温度:23℃,pH:7.0,诱导期总时间:20小时。
·步骤5:收集和离心步骤
步骤4(诱导期)在20小时后停止,温度降至15℃,将生物反应器的内容物转移至离心容器中,以7000rpm(9000-9500g)离心,收集细胞沉淀,转移至塑料袋中并将所述塑料袋储存在-20℃。
研究了改变各种培养参数(培养基中卡那霉素的存在、温度和pH)对诱导的影响,结果如表5所示。在发明人优化的条件下,卡那霉素的不存在并没有显著影响SEQ ID NO:12的表达水平或质粒稳定性(条件F01、F05和F13的比较)。诱导时施加的温度是对表达水平影响很小但对质粒稳定性没有影响的参数(条件F01和F02的比较)。pH是对表达水平有显著影响的参数,在较小程度上也对质粒稳定性有显著影响;pH 6.5不太有利,而pH 7.0对于这两个标准都是最佳的。不存在卡那霉素、诱导时温度从28℃降低至23℃以及在整个培养步骤中保持恒定的7.0的pH使得实现SEQ ID NO:12的良好生产产率。
实例4.-SEQ ID NO:12的周质提取
在各种培养和诱导步骤后,将由载体pLM7-OC-CRM(SEQ ID NO:10)转化的大肠杆菌BL21 T7XB细菌离心,并将细胞浆液冷冻在-20℃。周质提取首先将1350g细胞浆液在6℃+/-2℃下解冻15小时+/-5小时。将细胞浆液以2:1(v/w)的比例稀释在高渗溶液(50mMTris、5mM EDTA、20%蔗糖,pH 8.0)中,混合15分钟,并使用第一泵通过扩散环泵入混合器,流速是121ml/min。
然后通过用低渗溶液(5mM MgCl2)稀释混合器中包含的细胞悬浮液来进行细胞悬浮液的渗透压休克,其中用第二泵以低渗溶液的流速279ml/min和稀释比2.3:1(v/v)将低渗溶液泵入包含细胞悬浮液的混合器中。低渗溶液的温度在4℃至8℃之间。混合器中细胞悬浮液的体积为200ml,并且细胞悬浮液在混合器中的停留时间为30秒。第三泵以400ml/min的流速从混合器中提取细胞悬浮液,将细胞悬浮液收集在离心容器中,以维持混合器中200ml的恒定细胞悬浮液体积。1350g重量的细胞浆液产生约13.4升的经渗透压休克的细胞悬浮液。将经渗透压休克的细胞悬浮液以8000rpm离心20分钟(g=9379,K因子=3242)。除去沉淀并通过过滤使上清液澄清。实例5.-含有周质空间的组分和SEQ ID NO:12的上清液的澄清
渗透压休克(参见实例4)后离心细胞悬浮液所产生的上清液的澄清由两个连续的过滤步骤组成。对于第一过滤,将上清液以400ml/min的速率泵送通过筛孔尺寸为0.8-0.45μm并且面积为0.2m2的过滤器。然后将一次过滤的溶液以400ml/min的速率泵送通过筛孔尺寸为0.45-0.22μm并且面积为0.1m2的第二过滤器,从而提供含有澄清的周质提取物的溶液。
应当理解,本发明决不限于上述实施例,并且可以在不脱离所附权利要求的范围的情况下进行修改。
序列表
<110> 艾克斯普莱斯生物制药公司
欧洲科尔维克公司
<120> 生产蛋白CRM197的周质形式的方法
<130> P23116381WP
<160> 12
<170> PatentIn 3.5版
<210> 1
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 信号肽SEQ ID NO: 1的核苷酸序列(Ompc)
<220>
<221> misc_feature
<223> SEQ ID NO: 1(信号肽SEQ ID NO: 1 Ompc的核苷酸序列)
<400> 1
atgaaagtga aggttctgag cctgttggtc cctgccctgt tagttgccgg tgctgcaaac 60
gcagg 65
<210> 2
<211> 21
<212> PRT
<213> 人工序列
<220>
<221> misc_feature
<222> (1)..(21)
<223> SEQ ID NO: 2:信号肽OmpC的氨基酸序列
<400> 2
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala
20
<210> 3
<211> 1674
<212> ADN
<213> 人工序列
<220>
<223> SEQ ID NO: 3:蛋白CRM197的核苷酸序列,
包含信号肽SEQ ID NO: 1(Ompc)的核苷酸序列
<220>
<221> CDS
<222> (1)..(1674)
<223> SEQ ID NO: 3:蛋白CRM197的核苷酸序列,
包含信号肽SEQ ID NO: 1(Ompc)的核苷酸序列
<220>
<221> 信号肽
<222> (1)..(63)
<223> 信号肽SEQ ID NO: 1的核苷酸序列(Ompc)
<220>
<221> misc_feature
<222> (64)..(1674)
<223> 突变蛋白CRM197的核苷酸序列
<400> 3
atg aaa gtg aag gtt ctg agc ctg ttg gtc cct gcc ctg tta gtt gcc 48
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
ggt gct gca aac gca ggc gct gac gat gtt gtg gat agc agc aaa tct 96
Gly Ala Ala Asn Ala Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser
20 25 30
ttc gtt atg gaa aac ttc tct agc tat cac ggt acg aaa ccg ggt tac 144
Phe Val Met Glu Asn Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr
35 40 45
gtg gat agc att caa aag ggt att cag aag ccg aag tcc ggc acc cag 192
Val Asp Ser Ile Gln Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln
50 55 60
ggt aac tat gat gac gac tgg aaa gaa ttc tat agc acc gac aac aaa 240
Gly Asn Tyr Asp Asp Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys
65 70 75 80
tac gac gca gcc ggc tac agc gtg gac aac gaa aat ccg ctg agc ggt 288
Tyr Asp Ala Ala Gly Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly
85 90 95
aag gcc ggt ggc gtt gtt aaa gtc acg tac ccg ggt ctg acc aaa gtg 336
Lys Ala Gly Gly Val Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val
100 105 110
ctg gcg ttg aaa gtc gat aac gct gaa acg att aaa aaa gaa ctg ggt 384
Leu Ala Leu Lys Val Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly
115 120 125
ctg agc ctg acc gag ccg ctg atg gaa cag gtc ggt act gaa gaa ttc 432
Leu Ser Leu Thr Glu Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe
130 135 140
att aaa cgc ttt ggt gac ggt gca tct cgc gtg gtt ctg agc ctg ccg 480
Ile Lys Arg Phe Gly Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro
145 150 155 160
ttc gcc gag ggc tct agc agc gtt gag tac atc aac aac tgg gaa cag 528
Phe Ala Glu Gly Ser Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln
165 170 175
gcg aag gcc ttg tcc gtt gag ctg gaa atc aac ttt gaa acc cgt ggc 576
Ala Lys Ala Leu Ser Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly
180 185 190
aag cgc ggt caa gac gcg atg tat gag tac atg gcg caa gcg tgt gcg 624
Lys Arg Gly Gln Asp Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala
195 200 205
ggc aat cgt gta cgt cgt agc gtt ggc agc agc ctg tct tgc att aat 672
Gly Asn Arg Val Arg Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn
210 215 220
ctg gac tgg gac gtg att aga gat aag acc aag acg aag att gag agc 720
Leu Asp Trp Asp Val Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser
225 230 235 240
ctg aaa gaa cat ggc cca atc aag aat aag atg agc gag agc ccg aat 768
Leu Lys Glu His Gly Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn
245 250 255
aaa acg gtc agc gaa gag aaa gcg aaa cag tac ctg gaa gaa ttc cac 816
Lys Thr Val Ser Glu Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His
260 265 270
cag acc gca ctg gag cat cct gag ctg agc gag ctg aaa acc gtg act 864
Gln Thr Ala Leu Glu His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr
275 280 285
ggc acg aat cct gtt ttc gct ggt gcc aac tac gcc gca tgg gca gtt 912
Gly Thr Asn Pro Val Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val
290 295 300
aac gtt gcg caa gtg atc gat tcc gaa acg gct gat aat ctg gag aaa 960
Asn Val Ala Gln Val Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys
305 310 315 320
acc acc gcg gcc ctg tcg atc ttg ccg ggt att ggc agc gtg atg ggt 1008
Thr Thr Ala Ala Leu Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly
325 330 335
atc gcg gat ggc gca gtc cat cac aat acc gaa gaa atc gtt gcg cag 1056
Ile Ala Asp Gly Ala Val His His Asn Thr Glu Glu Ile Val Ala Gln
340 345 350
tct att gca ttg agc tcg tta atg gtc gcg caa gcg att ccg ctt gtc 1104
Ser Ile Ala Leu Ser Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val
355 360 365
ggc gaa ctg gtt gat atc ggt ttt gca gcg tac aac ttc gtc gag agc 1152
Gly Glu Leu Val Asp Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser
370 375 380
att atc aac ttg ttc caa gtt gtt cac aat agc tac aac cgt ccg gcc 1200
Ile Ile Asn Leu Phe Gln Val Val His Asn Ser Tyr Asn Arg Pro Ala
385 390 395 400
tat agc ccg ggt cac aag acc cag cca ttc ttg cac gac ggt tat gct 1248
Tyr Ser Pro Gly His Lys Thr Gln Pro Phe Leu His Asp Gly Tyr Ala
405 410 415
gtg agc tgg aac act gtc gag gat agc atc att cgt acc ggt ttc cag 1296
Val Ser Trp Asn Thr Val Glu Asp Ser Ile Ile Arg Thr Gly Phe Gln
420 425 430
ggt gag agc ggt cac gac atc aaa att act gcg gag aat acg ccg ctg 1344
Gly Glu Ser Gly His Asp Ile Lys Ile Thr Ala Glu Asn Thr Pro Leu
435 440 445
ccg atc gcg ggt gtg ctg ctg ccg acc atc ccg ggt aaa ctg gat gtc 1392
Pro Ile Ala Gly Val Leu Leu Pro Thr Ile Pro Gly Lys Leu Asp Val
450 455 460
aat aag tcc aag acg cat att tcc gtg aat ggt cgc aaa atc cgc atg 1440
Asn Lys Ser Lys Thr His Ile Ser Val Asn Gly Arg Lys Ile Arg Met
465 470 475 480
cgc tgt cgt gcg att gac ggc gat gtg acc ttt tgc cgt ccg aaa agc 1488
Arg Cys Arg Ala Ile Asp Gly Asp Val Thr Phe Cys Arg Pro Lys Ser
485 490 495
ccg gtc tac gtc ggc aac ggt gtg cac gca aat ctc cat gtt gcg ttt 1536
Pro Val Tyr Val Gly Asn Gly Val His Ala Asn Leu His Val Ala Phe
500 505 510
cat cgt tcg agc tcc gaa aag atc cac agc aat gaa atc tcc agc gat 1584
His Arg Ser Ser Ser Glu Lys Ile His Ser Asn Glu Ile Ser Ser Asp
515 520 525
agc att ggt gtt ctg ggc tat cag aaa acg gtc gac cac acc aag gtt 1632
Ser Ile Gly Val Leu Gly Tyr Gln Lys Thr Val Asp His Thr Lys Val
530 535 540
aat agc aag ctg tca ctg ttt ttt gag atc aag agc taa tga 1674
Asn Ser Lys Leu Ser Leu Phe Phe Glu Ile Lys Ser
545 550 555
<210> 4
<211> 556
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体:SEQ ID NO: 4:蛋白CRM197的氨基酸序列,
包含信号肽SEQ ID NO: 1(Ompc)的氨基酸序列
<400> 4
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser
20 25 30
Phe Val Met Glu Asn Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr
35 40 45
Val Asp Ser Ile Gln Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln
50 55 60
Gly Asn Tyr Asp Asp Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys
65 70 75 80
Tyr Asp Ala Ala Gly Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly
85 90 95
Lys Ala Gly Gly Val Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val
100 105 110
Leu Ala Leu Lys Val Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly
115 120 125
Leu Ser Leu Thr Glu Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe
130 135 140
Ile Lys Arg Phe Gly Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro
145 150 155 160
Phe Ala Glu Gly Ser Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln
165 170 175
Ala Lys Ala Leu Ser Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly
180 185 190
Lys Arg Gly Gln Asp Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala
195 200 205
Gly Asn Arg Val Arg Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn
210 215 220
Leu Asp Trp Asp Val Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser
225 230 235 240
Leu Lys Glu His Gly Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn
245 250 255
Lys Thr Val Ser Glu Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His
260 265 270
Gln Thr Ala Leu Glu His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr
275 280 285
Gly Thr Asn Pro Val Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val
290 295 300
Asn Val Ala Gln Val Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys
305 310 315 320
Thr Thr Ala Ala Leu Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly
325 330 335
Ile Ala Asp Gly Ala Val His His Asn Thr Glu Glu Ile Val Ala Gln
340 345 350
Ser Ile Ala Leu Ser Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val
355 360 365
Gly Glu Leu Val Asp Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser
370 375 380
Ile Ile Asn Leu Phe Gln Val Val His Asn Ser Tyr Asn Arg Pro Ala
385 390 395 400
Tyr Ser Pro Gly His Lys Thr Gln Pro Phe Leu His Asp Gly Tyr Ala
405 410 415
Val Ser Trp Asn Thr Val Glu Asp Ser Ile Ile Arg Thr Gly Phe Gln
420 425 430
Gly Glu Ser Gly His Asp Ile Lys Ile Thr Ala Glu Asn Thr Pro Leu
435 440 445
Pro Ile Ala Gly Val Leu Leu Pro Thr Ile Pro Gly Lys Leu Asp Val
450 455 460
Asn Lys Ser Lys Thr His Ile Ser Val Asn Gly Arg Lys Ile Arg Met
465 470 475 480
Arg Cys Arg Ala Ile Asp Gly Asp Val Thr Phe Cys Arg Pro Lys Ser
485 490 495
Pro Val Tyr Val Gly Asn Gly Val His Ala Asn Leu His Val Ala Phe
500 505 510
His Arg Ser Ser Ser Glu Lys Ile His Ser Asn Glu Ile Ser Ser Asp
515 520 525
Ser Ile Gly Val Leu Gly Tyr Gln Lys Thr Val Asp His Thr Lys Val
530 535 540
Asn Ser Lys Leu Ser Leu Phe Phe Glu Ile Lys Ser
545 550 555
<210> 5
<211> 42
<212> ADN
<213> 人工序列
<220>
<223> IPTG诱导型启动子序列(SEQ ID NO: 5)
<220>
<221> 启动子
<222> (1)..(42)
<223> IPTG诱导型启动子序列(SEQ ID NO: 5)
<400> 5
taatacgact cactataggg gaattgtgag cggataacaa tt 42
<210> 6
<211> 20
<212> ADN
<213> 人工序列
<220>
<223> SEQ ID NO: 6:表达载体的核糖体结合位点的共有序列
(中等强度核糖体结合位点,平均RBS)
<220>
<221> RBS
<222> (1)..(20)
<223> SEQ ID NO: 6:表达载体的核糖体结合位点的共有序列(中等强度核糖体结合位点,平均RBS)
<400> 6
aattaggtaa aaaataaaaa 20
<210> 7
<211> 114
<212> ADN
<213> 人工序列
<220>
<223> 鼠李糖诱导型启动子序列(SEQ ID NO: 7)
<220>
<221> 启动子
<222> (1)..(114)
<223> 鼠李糖诱导型启动子序列(SEQ ID NO: 7)
<400> 7
caccacaatt cagcaaattg tgaacatcat cacgttcatc tttccctggt tgccaatggc 60
ccattttcct gtcagtaacg agaaggtcgc gaattcaggc gctttttaga ctgg 114
<210> 8
<211> 63
<212> ADN
<213> 人工序列
<220>
<223> 信号肽OmpA的核苷酸序列(SEQ ID NO: 8)
<220>
<221> misc_feature
<222> (1)..(63)
<223> 信号肽OmpA的核苷酸序列(SEQ ID NO: 8)
<400> 8
atgaaaaaga cagctatcgc gattgcagtg gcactggctg gtttcgctac cgtagcgcag 60
gca 63
<210> 9
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 信号肽OmpA的氨基酸序列(SEQ ID NO: 9)
<220>
<221> 信号
<222> (1)..(21)
<223> 信号肽OmpA的氨基酸序列(SEQ ID NO: 9)
<400> 9
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala
20
<210> 10
<211> 5669
<212> ADN
<213> 人工序列
<220>
<223> SEQ ID NO: 10:构建体
BL21(DE3)/pD431-MR-OmpC-CRM197(也标记为BL21(DE3) /
pLM7-OC-CRM)的完整序列。SEQ ID NO: 10具有低拷贝数复制起点Ori_p15a,从
SEQ ID NO: 10的位置2441到位置3267。
<220>
<221> misc_feature
<222> (1)..(5669)
<223> SEQ ID NO: 10:构建体
BL21(DE3)/pD431-MR-OmpC-CRM197(也标记为BL21(DE3) /
pLM7-OC-CRM)的完整序列
<400> 10
ggttgaggtc tcacccccta gcataacccc ttggggcctc taaacgggtc ttgaggggtt 60
ttttgcccct gagacgcgtc aatcgagttc gtacctaagg gcgacacccc ctaattagcc 120
cgggcgaaag gcccagtctt tcgactgagc ctttcgtttt atttgatgcc tggcagttcc 180
ctactctcgc atggggagtc cccacactac catcggcgct acggcgtttc acttctgagt 240
tcggcatggg gtcaggtggg accaccgcgc tactgccgcc aggcaaacaa ggggtgttat 300
gagccatatt caggtataaa tgggctcgcg ataatgttca gaattggtta attggttgta 360
acactgaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 420
caataaccct gataaatgct tcaataatat tgaaaaagga agaatatgag ccatattcaa 480
cgggaaacgt cgaggccgcg attaaattcc aacatggatg ctgatttata tgggtataaa 540
tgggctcgcg ataatgtcgg gcaatcaggt gcgacaatct atcgcttgta tgggaagccc 600
gatgcgccag agttgtttct gaaacatggc aaaggtagcg ttgccaatga tgttacagat 660
gagatggtca gactaaactg gctgacggaa tttatgccac ttccgaccat caagcatttt 720
atccgtactc ctgatgatgc atggttactc accactgcga tccccggaaa aacagcgttc 780
caggtattag aagaatatcc tgattcaggt gaaaatattg ttgatgcgct ggcagtgttc 840
ctgcgccggt tgcactcgat tcctgtttgt aattgtcctt ttaacagcga tcgcgtattt 900
cgcctcgctc aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag tgattttgat 960
gacgagcgta atggctggcc tgttgaacaa gtctggaaag aaatgcataa acttttgcca 1020
ttctcaccgg attcagtcgt cactcatggt gatttctcac ttgataacct tatttttgac 1080
gaggggaaat taataggttg tattgatgtt ggacgagtcg gaatcgcaga ccgataccag 1140
gatcttgcca tcctatggaa ctgcctcggt gagttttctc cttcattaca gaaacggctt 1200
tttcaaaaat atggtattga taatcctgat atgaataaat tgcagtttca tttgatgctc 1260
gatgagtttt tctaagcggc gcgccatcga atggcgcaaa acctttcgcg gtatggcatg 1320
atagcgcccg gaagagagtc aattcagggt ggtgaatatg aaaccagtaa cgttatacga 1380
tgtcgcagag tatgccggtg tctcttatca gaccgtttcc cgcgtggtga accaggccag 1440
ccacgtttct gcgaaaacgc gggaaaaagt ggaagcggcg atggcggagc tgaattacat 1500
tcccaaccgc gtggcacaac aactggcggg caaacagtcg ttgctgattg gcgttgccac 1560
ctccagtctg gccctgcacg cgccgtcgca aattgtcgcg gcgattaaat ctcgcgccga 1620
tcaactgggt gccagcgtgg tggtgtcgat ggtagaacga agcggcgtcg aagcctgtaa 1680
agcggcggtg cacaatcttc tcgcgcaacg cgtcagtggg ctgatcatta actatccgct 1740
ggatgaccag gatgccattg ctgtggaagc tgcctgcact aatgttccgg cgttatttct 1800
tgatgtctct gaccagacac ccatcaacag tattattttc tcccatgagg acggtacgcg 1860
actgggcgtg gagcatctgg tcgcattggg tcaccagcaa atcgcgctgt tagcgggccc 1920
attaagttct gtctcggcgc gtctgcgtct ggctggctgg cataaatatc tcactcgcaa 1980
tcaaattcag ccgatagcgg aacgggaagg cgactggagt gccatgtccg gttttcaaca 2040
aaccatgcaa atgctgaatg agggcatcgt tcccactgcg atgctggttg ccaacgatca 2100
gatggcgctg ggcgcaatgc gcgccattac cgagtccggg ctgcgcgttg gtgcggatat 2160
ctcggtagtg ggatacgacg ataccgaaga tagctcatgt tatatcccgc cgttaaccac 2220
catcaaacag gattttcgcc tgctggggca aaccagcgtg gaccgcttgc tgcaactctc 2280
tcagggccag gcggtgaagg gcaatcagct gttgccagtc tcactggtga aaagaaaaac 2340
caccctggcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 2400
gctggcacga caggtttccc gactggaaag cgggcagtga ttaataagat gatcttcttg 2460
agatcgtttt ggtctgcgcg taatctcttg ctctgaaaac gaaaaaaccg ccttgcaggg 2520
cggtttttcg aaggttctct gagctaccaa ctctttgaac cgaggtaact ggcttggagg 2580
agcgcagtca ccaaaacttg tcctttcagt ttagccttaa ccggcgcatg acttcaagac 2640
taactcctct aaatcaatta ccagtggctg ctgccagtgg tgcttttgca tgtctttccg 2700
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcggactga acggggggtt 2760
cgtgcataca gtccagcttg gagcgaactg cctacccgga actgagtgtc aggcgtggaa 2820
tgagacaaac gcggccataa cagcggaatg acaccggtaa accgaaaggc aggaacagga 2880
gagcgcacga gggagccgcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 2940
cgccaccact gatttgagcg tcagatttcg tgatgcttgt caggggggcg gagcctatgg 3000
aaaaacggct ttgccgcggc cctctcactt ccctgttaag tatcttcctg gcatcttcca 3060
ggaaatctcc gccccgttcg taagccattt ccgctcgccg cagtcgaacg accgagcgta 3120
gcgagtcagt gagcgaggaa gcggaatata tcctgtatca catattctgc tgacgcaccg 3180
gtgcagcctt ttttctcctg ccacatgaag cacttcactg acaccctcat cagtgccaac 3240
atagtaagcc agtatacact ccgctagcgc tgaggtcccg cagccgaacg accgagcgca 3300
gcgagtcagt gagcgaggaa gcggaaggcg agagtaggga actgccaggc atcaaactaa 3360
gcagaaggcc cctgacggat ggcctttttg cgtttctaca aactctttct gtgttgtaaa 3420
acgacggcca gtcttaagct cgggccccct gggcggttct gataacgagt aatcgttaat 3480
ccgcaaataa cgtaaaaacc cgcttcggcg ggttttttta tggggggagt ttagggaaag 3540
agcatttgtc agaatattta agggcgcctg tcactttgct tgatatatga gaattattta 3600
accttataaa tgagaaaaaa gcaacgcact ttaaataaga tacgttgctt tttcgattga 3660
tgaacaccta taattaaact attcatctat tatttatgat tttttgtata tacaatattt 3720
ctagtttgtt aaagagaatt aagaaaataa atctcgaaaa taataaaggg aaaatcagtt 3780
tttgatatca aaattataca tgtcaacgat aatacaaaat ataatacaaa ctataagatg 3840
ttatcagtat ttattatgca tttagaataa attttgtgtc gcccttccgc gaaattaata 3900
cgactcacta taggggaatt gtgagcggat aacaattccc ctctagaaat aattttgttt 3960
aacttttaga gaccaaatta ggtaaaaaat aaaaaatgaa agtgaaggtt ctgagcctgt 4020
tggtccctgc cctgttagtt gccggtgctg caaacgcagg cgctgacgat gttgtggata 4080
gcagcaaatc tttcgttatg gaaaacttct ctagctatca cggtacgaaa ccgggttacg 4140
tggatagcat tcaaaagggt attcagaagc cgaagtccgg cacccagggt aactatgatg 4200
acgactggaa agaattctat agcaccgaca acaaatacga cgcagccggc tacagcgtgg 4260
acaacgaaaa tccgctgagc ggtaaggccg gtggcgttgt taaagtcacg tacccgggtc 4320
tgaccaaagt gctggcgttg aaagtcgata acgctgaaac gattaaaaaa gaactgggtc 4380
tgagcctgac cgagccgctg atggaacagg tcggtactga agaattcatt aaacgctttg 4440
gtgacggtgc atctcgcgtg gttctgagcc tgccgttcgc cgagggctct agcagcgttg 4500
agtacatcaa caactgggaa caggcgaagg ccttgtccgt tgagctggaa atcaactttg 4560
aaacccgtgg caagcgcggt caagacgcga tgtatgagta catggcgcaa gcgtgtgcgg 4620
gcaatcgtgt acgtcgtagc gttggcagca gcctgtcttg cattaatctg gactgggacg 4680
tgattagaga taagaccaag acgaagattg agagcctgaa agaacatggc ccaatcaaga 4740
ataagatgag cgagagcccg aataaaacgg tcagcgaaga gaaagcgaaa cagtacctgg 4800
aagaattcca ccagaccgca ctggagcatc ctgagctgag cgagctgaaa accgtgactg 4860
gcacgaatcc tgttttcgct ggtgccaact acgccgcatg ggcagttaac gttgcgcaag 4920
tgatcgattc cgaaacggct gataatctgg agaaaaccac cgcggccctg tcgatcttgc 4980
cgggtattgg cagcgtgatg ggtatcgcgg atggcgcagt ccatcacaat accgaagaaa 5040
tcgttgcgca gtctattgca ttgagctcgt taatggtcgc gcaagcgatt ccgcttgtcg 5100
gcgaactggt tgatatcggt tttgcagcgt acaacttcgt cgagagcatt atcaacttgt 5160
tccaagttgt tcacaatagc tacaaccgtc cggcctatag cccgggtcac aagacccagc 5220
cattcttgca cgacggttat gctgtgagct ggaacactgt cgaggatagc atcattcgta 5280
ccggtttcca gggtgagagc ggtcacgaca tcaaaattac tgcggagaat acgccgctgc 5340
cgatcgcggg tgtgctgctg ccgaccatcc cgggtaaact ggatgtcaat aagtccaaga 5400
cgcatatttc cgtgaatggt cgcaaaatcc gcatgcgctg tcgtgcgatt gacggcgatg 5460
tgaccttttg ccgtccgaaa agcccggtct acgtcggcaa cggtgtgcac gcaaatctcc 5520
atgttgcgtt tcatcgttcg agctccgaaa agatccacag caatgaaatc tccagcgata 5580
gcattggtgt tctgggctat cagaaaacgg tcgaccacac caaggttaat agcaagctgt 5640
cactgttttt tgagatcaag agctaatga 5669
<210> 11
<211> 5631
<212> ADN
<213> 人工序列
<220>
<223> SEQ ID NO: 11:构建体
BL21(DE3)/pD451-SR-OmpC-CRM197(也标记为
BL21(DE3)/pHS7-OC-CRM)的完整序列。SEQ ID NO: 11具有高拷贝数复制起点Ori_pUC,从
SEQ ID NO: 11的位置2500位到位置。
<220>
<221> misc_feature
<222> (1)..(5631)
<223> SEQ ID NO: 11:构建体
BL21(DE3)/pD451-SR-OmpC-CRM197(也标记为
BL21(DE3)/pHS7-OC-CRM)的完整序列
<400> 11
ggttgaggtc tcacccccta gcataacccc ttggggcctc taaacgggtc ttgaggggtt 60
ttttgcccct gagacgcgtc aatcgagttc gtacctaagg gcgacacccc ctaattagcc 120
cgggcgaaag gcccagtctt tcgactgagc ctttcgtttt atttgatgcc tggcagttcc 180
ctactctcgc atggggagtc cccacactac catcggcgct acggcgtttc acttctgagt 240
tcggcatggg gtcaggtggg accaccgcgc tactgccgcc aggcaaacaa ggggtgttat 300
gagccatatt caggtataaa tgggctcgcg ataatgttca gaattggtta attggttgta 360
acactgaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 420
caataaccct gataaatgct tcaataatat tgaaaaagga agaatatgag ccatattcaa 480
cgggaaacgt cgaggccgcg attaaattcc aacatggatg ctgatttata tgggtataaa 540
tgggctcgcg ataatgtcgg gcaatcaggt gcgacaatct atcgcttgta tgggaagccc 600
gatgcgccag agttgtttct gaaacatggc aaaggtagcg ttgccaatga tgttacagat 660
gagatggtca gactaaactg gctgacggaa tttatgccac ttccgaccat caagcatttt 720
atccgtactc ctgatgatgc atggttactc accactgcga tccccggaaa aacagcgttc 780
caggtattag aagaatatcc tgattcaggt gaaaatattg ttgatgcgct ggcagtgttc 840
ctgcgccggt tgcactcgat tcctgtttgt aattgtcctt ttaacagcga tcgcgtattt 900
cgcctcgctc aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag tgattttgat 960
gacgagcgta atggctggcc tgttgaacaa gtctggaaag aaatgcataa acttttgcca 1020
ttctcaccgg attcagtcgt cactcatggt gatttctcac ttgataacct tatttttgac 1080
gaggggaaat taataggttg tattgatgtt ggacgagtcg gaatcgcaga ccgataccag 1140
gatcttgcca tcctatggaa ctgcctcggt gagttttctc cttcattaca gaaacggctt 1200
tttcaaaaat atggtattga taatcctgat atgaataaat tgcagtttca tttgatgctc 1260
gatgagtttt tctaagcggc gcgccatcga atggcgcaaa acctttcgcg gtatggcatg 1320
atagcgcccg gaagagagtc aattcagggt ggtgaatatg aaaccagtaa cgttatacga 1380
tgtcgcagag tatgccggtg tctcttatca gaccgtttcc cgcgtggtga accaggccag 1440
ccacgtttct gcgaaaacgc gggaaaaagt ggaagcggcg atggcggagc tgaattacat 1500
tcccaaccgc gtggcacaac aactggcggg caaacagtcg ttgctgattg gcgttgccac 1560
ctccagtctg gccctgcacg cgccgtcgca aattgtcgcg gcgattaaat ctcgcgccga 1620
tcaactgggt gccagcgtgg tggtgtcgat ggtagaacga agcggcgtcg aagcctgtaa 1680
agcggcggtg cacaatcttc tcgcgcaacg cgtcagtggg ctgatcatta actatccgct 1740
ggatgaccag gatgccattg ctgtggaagc tgcctgcact aatgttccgg cgttatttct 1800
tgatgtctct gaccagacac ccatcaacag tattattttc tcccatgagg acggtacgcg 1860
actgggcgtg gagcatctgg tcgcattggg tcaccagcaa atcgcgctgt tagcgggccc 1920
attaagttct gtctcggcgc gtctgcgtct ggctggctgg cataaatatc tcactcgcaa 1980
tcaaattcag ccgatagcgg aacgggaagg cgactggagt gccatgtccg gttttcaaca 2040
aaccatgcaa atgctgaatg agggcatcgt tcccactgcg atgctggttg ccaacgatca 2100
gatggcgctg ggcgcaatgc gcgccattac cgagtccggg ctgcgcgttg gtgcggatat 2160
ctcggtagtg ggatacgacg ataccgaaga tagctcatgt tatatcccgc cgttaaccac 2220
catcaaacag gattttcgcc tgctggggca aaccagcgtg gaccgcttgc tgcaactctc 2280
tcagggccag gcggtgaagg gcaatcagct gttgccagtc tcactggtga aaagaaaaac 2340
caccctggcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 2400
gctggcacga caggtttccc gactggaaag cgggcagtga ctcatgacca aaatccctta 2460
acgtgagtta cgcgcgcgtc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 2520
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 2580
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 2640
ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta gttagcccac 2700
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 2760
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2820
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2880
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 2940
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 3000
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 3060
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 3120
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 3180
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 3240
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaaggcgag 3300
agtagggaac tgccaggcat caaactaagc agaaggcccc tgacggatgg cctttttgcg 3360
tttctacaaa ctctttctgt gttgtaaaac gacggccagt cttaagctcg ggccccctgg 3420
gcggttctga taacgagtaa tcgttaatcc gcaaataacg taaaaacccg cttcggcggg 3480
tttttttatg gggggagttt agggaaagag catttgtcag aatatttaag ggcgcctgtc 3540
actttgcttg atatatgaga attatttaac cttataaatg agaaaaaagc aacgcacttt 3600
aaataagata cgttgctttt tcgattgatg aacacctata attaaactat tcatctatta 3660
tttatgattt tttgtatata caatatttct agtttgttaa agagaattaa gaaaataaat 3720
ctcgaaaata ataaagggaa aatcagtttt tgatatcaaa attatacatg tcaacgataa 3780
tacaaaatat aatacaaact ataagatgtt atcagtattt attatgcatt tagaataaat 3840
tttgtgtcgc ccttccgcga aattaatacg actcactata ggggaattgt gagcggataa 3900
caattcccct ctagaaataa ttttgtttaa ctttttgaga ccttaaggag gtaaaaaatg 3960
aaagtgaagg ttctgagcct gttggtccct gccctgttag ttgccggtgc tgcaaacgca 4020
ggcgctgacg atgttgtgga tagcagcaaa tctttcgtta tggaaaactt ctctagctat 4080
cacggtacga aaccgggtta cgtggatagc attcaaaagg gtattcagaa gccgaagtcc 4140
ggcacccagg gtaactatga tgacgactgg aaagaattct atagcaccga caacaaatac 4200
gacgcagccg gctacagcgt ggacaacgaa aatccgctga gcggtaaggc cggtggcgtt 4260
gttaaagtca cgtacccggg tctgaccaaa gtgctggcgt tgaaagtcga taacgctgaa 4320
acgattaaaa aagaactggg tctgagcctg accgagccgc tgatggaaca ggtcggtact 4380
gaagaattca ttaaacgctt tggtgacggt gcatctcgcg tggttctgag cctgccgttc 4440
gccgagggct ctagcagcgt tgagtacatc aacaactggg aacaggcgaa ggccttgtcc 4500
gttgagctgg aaatcaactt tgaaacccgt ggcaagcgcg gtcaagacgc gatgtatgag 4560
tacatggcgc aagcgtgtgc gggcaatcgt gtacgtcgta gcgttggcag cagcctgtct 4620
tgcattaatc tggactggga cgtgattaga gataagacca agacgaagat tgagagcctg 4680
aaagaacatg gcccaatcaa gaataagatg agcgagagcc cgaataaaac ggtcagcgaa 4740
gagaaagcga aacagtacct ggaagaattc caccagaccg cactggagca tcctgagctg 4800
agcgagctga aaaccgtgac tggcacgaat cctgttttcg ctggtgccaa ctacgccgca 4860
tgggcagtta acgttgcgca agtgatcgat tccgaaacgg ctgataatct ggagaaaacc 4920
accgcggccc tgtcgatctt gccgggtatt ggcagcgtga tgggtatcgc ggatggcgca 4980
gtccatcaca ataccgaaga aatcgttgcg cagtctattg cattgagctc gttaatggtc 5040
gcgcaagcga ttccgcttgt cggcgaactg gttgatatcg gttttgcagc gtacaacttc 5100
gtcgagagca ttatcaactt gttccaagtt gttcacaata gctacaaccg tccggcctat 5160
agcccgggtc acaagaccca gccattcttg cacgacggtt atgctgtgag ctggaacact 5220
gtcgaggata gcatcattcg taccggtttc cagggtgaga gcggtcacga catcaaaatt 5280
actgcggaga atacgccgct gccgatcgcg ggtgtgctgc tgccgaccat cccgggtaaa 5340
ctggatgtca ataagtccaa gacgcatatt tccgtgaatg gtcgcaaaat ccgcatgcgc 5400
tgtcgtgcga ttgacggcga tgtgaccttt tgccgtccga aaagcccggt ctacgtcggc 5460
aacggtgtgc acgcaaatct ccatgttgcg tttcatcgtt cgagctccga aaagatccac 5520
agcaatgaaa tctccagcga tagcattggt gttctgggct atcagaaaac ggtcgaccac 5580
accaaggtta atagcaagct gtcactgttt tttgagatca agagctaatg a 5631
<210> 12
<211> 535
<212> PRT
<213> 人工序列
<220>
<221> misc_feature
<222> (1)..(535)
<223> SEQ ID NO: 12:成熟蛋白CRM197的氨基酸序列
(如果没有信号肽SEQ ID NO: 2)
<400> 12
Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1 5 10 15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
20 25 30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
35 40 45
Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
50 55 60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65 70 75 80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
85 90 95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
100 105 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
115 120 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
130 135 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145 150 155 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
165 170 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg Val Arg
180 185 190
Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn Leu Asp Trp Asp Val
195 200 205
Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu Lys Glu His Gly
210 215 220
Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn Lys Thr Val Ser Glu
225 230 235 240
Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His Gln Thr Ala Leu Glu
245 250 255
His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr Gly Thr Asn Pro Val
260 265 270
Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val Asn Val Ala Gln Val
275 280 285
Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys Thr Thr Ala Ala Leu
290 295 300
Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly Ile Ala Asp Gly Ala
305 310 315 320
Val His His Asn Thr Glu Glu Ile Val Ala Gln Ser Ile Ala Leu Ser
325 330 335
Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val Gly Glu Leu Val Asp
340 345 350
Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser Ile Ile Asn Leu Phe
355 360 365
Gln Val Val His Asn Ser Tyr Asn Arg Pro Ala Tyr Ser Pro Gly His
370 375 380
Lys Thr Gln Pro Phe Leu His Asp Gly Tyr Ala Val Ser Trp Asn Thr
385 390 395 400
Val Glu Asp Ser Ile Ile Arg Thr Gly Phe Gln Gly Glu Ser Gly His
405 410 415
Asp Ile Lys Ile Thr Ala Glu Asn Thr Pro Leu Pro Ile Ala Gly Val
420 425 430
Leu Leu Pro Thr Ile Pro Gly Lys Leu Asp Val Asn Lys Ser Lys Thr
435 440 445
His Ile Ser Val Asn Gly Arg Lys Ile Arg Met Arg Cys Arg Ala Ile
450 455 460
Asp Gly Asp Val Thr Phe Cys Arg Pro Lys Ser Pro Val Tyr Val Gly
465 470 475 480
Asn Gly Val His Ala Asn Leu His Val Ala Phe His Arg Ser Ser Ser
485 490 495
Glu Lys Ile His Ser Asn Glu Ile Ser Ser Asp Ser Ile Gly Val Leu
500 505 510
Gly Tyr Gln Lys Thr Val Asp His Thr Lys Val Asn Ser Lys Leu Ser
515 520 525
Leu Phe Phe Glu Ile Lys Ser
530 535

Claims (15)

1.一种表达载体,其在革兰氏阴性原核生物中,具有以下特征:
(i)低拷贝数复制起点,所述低拷贝数由20个或更少的质粒拷贝数/细胞定义,
(ii)用外源诱导剂可诱导的启动子序列,
(iii)中等强度核糖体结合位点,所述中等强度核糖体结合位点对应于被修饰以具有减少的核糖体结合的mRNA序列,
(iv)编码与全长SEQ ID NO:12具有至少95%同一性的蛋白的序列,
(v)编码与SEQ ID NO:2具有至少95%序列同一性的信号肽的序列,所述信号肽被排列以使得所述SEQ ID NO:12能够靶向周质空间。
2.如权利要求1所述的表达载体,其中保留SEQ ID NO:12的位置52处的谷氨酸残基。
3.如权利要求1或权利要求2所述的表达载体,其中所述可诱导的启动子序列在整个长度上与SEQ ID NO:5具有至少95%同一性,并且被T7噬菌体RNA聚合酶特异性识别。
4.如权利要求1至3中任一项所述的表达载体,其中所述中等强度核糖体结合位点由共有序列SEQ ID NO:6或由包含1或2或3或4或5个核苷酸的添加和/或缺失和/或点突变的共有序列SEQ ID NO:6定义,所述SEQ ID NO:6位于翻译起始位点的上游。
5.一种大肠杆菌细菌转化菌株,其包含如前述权利要求中任一项所述的表达载体。
6.如权利要求5所述的细菌转化菌株,其为由以下定义的大肠杆菌BL21菌株:λDE3原噬菌体缺失,但表达T7噬菌体RNA聚合酶所需的基因除外。
7.一种在周质空间中生产在其整个长度上与SEQ ID NO:12具有至少95%同一性的肽的方法,所述方法包括:
(i)用能够在大肠杆菌的周质空间中表达所述SEQ ID NO:12的载体转化所述大肠杆菌的菌株,所述表达可由外源性药剂诱导,
(ii)在基本恒定的温度,例如37℃+1℃和恒定pH下,在转化的大肠杆菌菌株不合成SEQID NO:12的条件下培养所述转化的大肠杆菌菌株,
(iii)在所述外源性药剂存在下且在降低的温度下持续预定时间段的诱导期以缓慢且受控的方式在周质空间中合成和分泌SEQ ID NO:12,
(iv)任选地在所述诱导期之后和冷却之后收获培养物,
(v)任选地收集所述周质空间中含有SEQ ID NO:12的培养的细菌,
(vi)任选地进行所述SEQ ID NO:12的周质提取,包括分离含有这些细菌的固体沉淀和含有所述周质空间的组分和SEQ ID NO:12的上清液,以及
(vii)任选地纯化所述蛋白SEQ ID NO:12。
8.如权利要求7所述的方法,其中所述大肠杆菌菌株为由以下定义的BL21菌株:λDE3原噬菌体缺失,但表达T7噬菌体RNA聚合酶所需的基因除外。
9.如权利要求7或权利要求8所述的方法,其中通过所述周质空间中的靶向信号肽提供在所述周质空间中生产在其整个长度上与SEQ ID NO:12具有至少95%同一性的肽,所述信号肽与SEQ ID NO:2具有至少95%序列同一性。
10.如权利要求7至9中任一项所述的方法,其中降低的温度为23℃+0.5℃和/或所述诱导期的预定时间段在15小时和25小时之间,优选18小时和22小时之间,更优选约20小时,和/或所述诱导期的pH在6.8和7.5之间,优选在7.0和7.2之间。
11.如权利要求7至10中任一项所述的方法,其中通过开/关诱导系统进行外源性药剂可诱导的表达,其中所述外源性药剂为异丙基-β-D-1-硫代吡喃半乳糖苷。
12.如权利要求7至11中任一项所述的方法,其中所述培养物和所述诱导期不含抗生素。
13.如权利要求7至12中任一项所述的方法,其中所述表达载体具有由20个或更少的质粒拷贝数/细胞定义的低拷贝数和/或具有中等强度的核糖体结合序列。
14.如权利要求7至13中任一项所述的方法,其中所述纯化所述蛋白SEQ ID NO:12的纯化包括以下连续步骤:
(i)通过至少一个过滤步骤,优选两个过滤步骤,澄清来自周质提取的含有周质空间的组分和所述蛋白的上清液,并回收包含SEQ ID NO:12的滤液,任选地,
(ii)安排一系列色谱步骤,以回收待保留的级分中的SEQ ID NO:12以及待去除的一个或多个级分中的污染物,
(iii)任选地,去除残留的内毒素,以及
(iv)任选地,对待保留的包含SEQ ID NO:12的无内毒素级分进行灭菌。
15.一种选择信号肽以优化大肠杆菌细菌的周质空间中目的蛋白的生产的方法,其中:
-产生遗传构建体,其包含与SEQ ID NO:7具有至少95%序列同一性的鼠李糖诱导型启动子,所述鼠李糖诱导型启动子控制与待测试的所述信号肽一起排列的所述目的蛋白的表达,
-所述大肠杆菌用所述遗传构建体转化,
-在不含鼠李糖的培养基中产生所述转化的大肠杆菌的几个平行培养物,
-将所述转化的大肠杆菌在确定浓度的鼠李糖存在下培养,以便获得所述目的蛋白的表达的低诱导,并在另一确定浓度的鼠李糖存在下将所述转化的大肠杆菌进行另外培养,以便获得所述目的蛋白的表达的高诱导,以及,
-比较周质空间中所述目的蛋白的丰度,并且任选地,对选自由质粒丢失、细菌生物量减少、胞质聚集物或降解产物的形成和所述信号肽的部分切割组成的组的代谢的有害影响进行定量,以及,
-根据周质空间中所述目的蛋白的丰度,任选地,通过拒绝与过高的有害作用相关的信号肽来选择所述信号肽。
CN202280017425.6A 2021-02-26 2022-02-28 生产蛋白crm197的周质形式的方法 Pending CN116964206A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
BEBE2021/5137 2021-02-26
BE20215137A BE1029145B1 (fr) 2021-02-26 2021-02-26 Methode de production d'une forme periplasmique de la proteine crm197
PCT/EP2022/054914 WO2022180265A2 (fr) 2021-02-26 2022-02-28 Methode de production d'une forme periplasmique de la proteine crm197

Publications (1)

Publication Number Publication Date
CN116964206A true CN116964206A (zh) 2023-10-27

Family

ID=74853484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280017425.6A Pending CN116964206A (zh) 2021-02-26 2022-02-28 生产蛋白crm197的周质形式的方法

Country Status (5)

Country Link
EP (1) EP4298224A2 (zh)
JP (1) JP2024507994A (zh)
CN (1) CN116964206A (zh)
BE (1) BE1029145B1 (zh)
WO (1) WO2022180265A2 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1398927B1 (it) 2009-06-25 2013-03-28 Consorzio Interuniversitario Per Lo Sviluppo Dei Sistemi A Grande Interfase Csgi Espressione batterica di un gene artificiale per la produzione di crm197 e derivati.
GB0917647D0 (en) 2009-10-08 2009-11-25 Glaxosmithkline Biolog Sa Expression system
KR20130072201A (ko) * 2010-03-30 2013-07-01 피페넥스 인크. 재조합 독소 단백질의 고수준 발현
US10479820B2 (en) * 2014-03-03 2019-11-19 Scarab Genomics, Llc Enhanced production of recombinant CRM197 in E. coli
EP3444269A1 (en) * 2017-08-17 2019-02-20 National Research Council of Canada Systems and methods for the production of diphtheria toxin polypeptides

Also Published As

Publication number Publication date
BE1029145A1 (fr) 2022-09-19
EP4298224A2 (fr) 2024-01-03
BE1029145B1 (fr) 2022-09-27
WO2022180265A3 (fr) 2022-10-20
JP2024507994A (ja) 2024-02-21
WO2022180265A2 (fr) 2022-09-01

Similar Documents

Publication Publication Date Title
JP3250968B2 (ja) オリゴペプチド反復単位を有する大ポリペプチド
EP0946711B1 (en) Improved expression vectors
CN105985968B (zh) 改进的广谱核酸内切酶及其工业生产方法
JPH10508203A (ja) ジスルフィド結合を有する異種ポリペプチドの細菌による産生方法
JP2004532634A (ja) タンパク質分泌のためのClyA溶血素の使用
AU2001297770A1 (en) Use of CLyA hemolysin for excretion of fusion proteins
WO2023045682A1 (zh) 一种提高多肽可溶性表达产量的方法
CA2687542C (en) Vector for expression of heterologous protein and methods for extracting recombinant protein and for purifying isolated recombinant insulin
CA2622710C (en) Hybrid portable origin of replication plasmids
CN116964206A (zh) 生产蛋白crm197的周质形式的方法
EP0828844B1 (en) Promoters for gene expression
WO2005123924A1 (en) Method for cell surface display of target proteins using fadl of e. coli
CN116102663A (zh) 一种猴痘病毒b6r抗原及其制备方法与应用
KR20210058840A (ko) 재조합 렉틴 단백질의 제조를 위한 개선된 방법
EP0076037B1 (en) Amplified expression of dna sequences
JP2023549432A (ja) 不能なラムノース代謝を有する宿主細胞において組み換えタンパク質を産生する方法、ならびにその発現ベクター、宿主細胞、および組み換えタンパク質
CN106434716B (zh) 一种优化的重组抗原多肽Aβ1-15-HSP60核苷酸序列及其高效制备方法
JP2004524845A (ja) ポリペプチドの製造方法
US20240050559A1 (en) Method of making virus-like particle
CN116240182A (zh) 荧光素酶信号肽的应用及含有荧光素酶信号肽的融合蛋白及其制备方法
CN116120467A (zh) 含有猴痘病毒e8l抗原的融合蛋白及其制备方法
KR100202958B1 (ko) 인슐린 융합단백질로부터 인슐린을 생산하는데 있어서 효소적 절단을 가능케하는 인슐린 융합단백질 유전자를 가진 발현벡터 및 이를 이용한 사람 인슐린의 제조방법
CN106834333B (zh) 一种能高效表达中性蛋白酶的质粒、其构建方法及其应用
EA045469B1 (ru) Улучшенный способ получения рекомбинантного белка лектина
CN116178570A (zh) 一种猴痘病毒a35r抗原及其制备方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination