CN117693587A - 具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞 - Google Patents

具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞 Download PDF

Info

Publication number
CN117693587A
CN117693587A CN202280051979.8A CN202280051979A CN117693587A CN 117693587 A CN117693587 A CN 117693587A CN 202280051979 A CN202280051979 A CN 202280051979A CN 117693587 A CN117693587 A CN 117693587A
Authority
CN
China
Prior art keywords
bacillus
amino acid
protein
seq
rema
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280051979.8A
Other languages
English (en)
Inventor
M·F·费勒
M·阿佩尔鲍姆
C·绍尔
S·耶内魏因
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF SE filed Critical BASF SE
Publication of CN117693587A publication Critical patent/CN117693587A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及一种用于提高生物化合物的生产的芽孢杆菌宿主细胞。具体地,本发明涉及一种在remA和/或remB基因中具有遗传修饰的芽孢杆菌宿主。本发明还涉及一种基于培养本发明的细菌宿主细胞来增加至少一种感兴趣的多肽的生产的方法。

Description

具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞
技术领域
本发明涉及一种用于提高生物化合物的生产的芽孢杆菌(Bacillus)宿主细胞。具体地,本发明涉及一种在remA和/或remB基因中具有遗传修饰的芽孢杆菌宿主。本发明还涉及一种基于培养本发明的细菌宿主细胞来增加至少一种感兴趣的化合物的生产的方法。
背景技术
芽孢杆菌属的微生物被广泛用作工业劳动力,用于生产有价值的化合物,如化学品、聚合物和蛋白,特别是蛋白,如洗涤和/或清洁活性酶或者用于饲料和食品应用的酶。这些有用物质的生物技术生产是通过这种芽孢杆菌的发酵和随后的产物纯化来进行的。芽孢杆菌能够将大量蛋白分泌至发酵液中。与细胞内生产相比,这允许简单的产品纯化过程,并且解释了芽孢杆菌在工业应用中的成功。
通过优化基因表达盒,已经实现了用芽孢杆菌生产生物化合物。已经开发了启动子如aprE基因启动子(EP1244794),PcryIIIA、PamyL和PamyQ启动子的组合(WO994379,US5955310,WO2005098016),或者驱动高水平表达的噬菌体启动子PSPO1(WO2015118126)。
同样,通过在转录物稳定元件的5’UTR内引入cryIIIA稳定元件(WO9943835),aprE基因的稳定元件(WO2016134213)以及cotG、SP82、gsiB、grpE和rib基因的稳定元件(WO2008140615),优化了所得转录物的mRNA稳定性以增加半衰期。
此外,已经实现了增加编码感兴趣的生物化合物的表达盒的拷贝数以增加产物产量。US20100248306公开了一种稳定质粒维持的方法,WO15055558稳定并增加细胞内的质粒拷贝数。已经成功应用了稳定细胞染色体内多个多核苷酸拷贝的整合的各种方法(US2003032186,US2008085535)。
对细菌生产宿主进行了遗传修饰,以去除不需要的宿主细胞蛋白,提高产品纯度(WO2003093453)并增强感兴趣的蛋白的表达(WO2003083125)。
用于生产生物化合物的芽孢杆菌宿主细胞的优化具有高度相关性,其中即使化合物产量的微小改进在大规模工业量中也是显著的。因此,本发明涉及具有增加的生物化合物生产能力的芽孢杆菌宿主细胞。
发明内容
在本发明的基础研究中发现,在remA和/或remB基因中具有遗传修饰的芽孢杆菌宿主细胞允许在所述宿主细胞中提高感兴趣的化合物的产量,特别所感兴趣的多肽,例如胞外酶。因此,本发明涉及一种修饰的芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌(Bacillus subtilis)细胞。
在另一优选的实施方案中,本发明的芽孢杆菌宿主细胞包含表达盒,用于生产感兴趣的化合物,优选感兴趣的多肽。因此,在另一实施方案中,本发明涉及一种生产感兴趣的化合物,优选感兴趣的多肽的方法,包括
a)提供修饰的芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,
b)在允许表达感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地从培养基分离感兴趣的化合物。
此外,本发明涉及一种改变的RemA或RemB蛋白,其用于产生改良的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白包含在SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的一个或多个非保守氨基酸取代(如本文所定义),IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在SEQ ID NO:21的氨基酸位置R18和/或P29,并且其中所述改变的RemB蛋白包含在SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的一个或多个非保守氨基酸取代(如本文所定义),IC值等于或大于3.0,优选地等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选SEQ ID NO:23的氨基酸位置G6、I19、S62、T67、L68和R71,最优选SEQ ID NO:23的氨基酸位置G6、T67、L68和R71。
附图说明
图1:所示RemA蛋白的多序列比对。对每个单一序列和共有序列都标明了蛋白序列编号。比对显示为10个位点的区块。与共有序列不同的氨基酸变化以粗体字母表示。
图2:所示RemB蛋白的多序列比对。对每个单一序列和共有序列都标明了蛋白序列编号。比对显示为10个位点的区块。与共有序列不同的氨基酸变化以粗体字母表示。
发明详述
应当理解,如在说明书和权利要求书中所用,“一个(a)”或“一个(an)”可以表示一个或多个,这取决于其使用的上下文。因此,例如,提到“一个细胞”可以表示可以使用至少一个细胞。
此外,应当理解,如本文所用的术语“至少一个”表示可以按照本发明使用该术语后面提到的一个或多个项目。例如,如果该术语表示应当使用至少一种进料溶液,这可以理解为一种进料溶液或一种以上的进料溶液,即两种、三种、四种、五种或任何其他数量的进料溶液。根据该术语所指的项目,技术人员理解该术语可能指的上限(如果有的话)。
如本文所用的术语“约”表示对于所述术语之后列举的任何数字,存在区间精度,在该区间内可以实现技术效果。因此,如本文提到的约优选是指精确数值或所述精确数值±20%左右的范围,优选±15%,更优选±10%,甚至更优选±5%。
如本文所用的术语“包含”不应当理解为限制意义。该术语表示可能存在比实际提到的项目更多的项目,例如,如果它是指包含某些步骤的方法,则不应当排除其他步骤的存在。然而,术语“包含”还涵盖仅存在所提到的项目的实施方案,即它在“由…组成”的意义上具有限制性含义。
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可互换使用,是指任何长度的聚合不分支形式的核苷酸,通常是脱氧核糖核苷酸。术语“多肽”和“蛋白”在本文中可互换使用,是指任何长度的聚合形式的氨基酸,通过肽键连接在一起。
术语“编码(coding for)”和“编码(encoding)”在本文中可互换使用。通常,这些术语是指多核苷酸(如基因、cDNA或mRNA)中特定核苷酸序列的特性,用作合成其他大分子的模板,如确定的氨基酸序列。因此,如果对应于该基因的mRNA的转录和翻译在细胞或其他生物系统中产生蛋白,则该基因编码蛋白。
为了本发明的目的,关于细胞或生物体的术语“修饰的”、“遗传修饰的”或“遗传修饰”(在本文中也称作“重组的”或“转基因的”)表示所述细胞或生物体含有异源多核苷酸,其获得自不同生物体或由人类通过基因技术产生。因此,修饰的细胞是非天然细胞。
术语“天然”(或野生型或内源)细胞或生物体以及“天然”(或野生型或内源)多核苷酸或多肽分别是指在自然界中发现的细胞或生物体以及在细胞中以其天然形式和遗传环境发现的所讨论的多核苷酸或多肽(即,没有任何人为干预)。
如本文所用的术语“改变的蛋白”是指已经由人通过基因技术修改的蛋白,可以由修饰的内源基因或外源基因(也称作对宿主细胞异源)编码,例如,插入宿主细胞的编码所述蛋白的外源基因,优选与编码未改变的蛋白的缺失或失活的内源基因一起。因此,改变的蛋白是非天然蛋白。
术语“无义突变”是在蛋白编码序列的编码区内导致终止密码子的点突变。
术语“错义突变”是在相应的氨基酸位置导致另一氨基酸的点突变。
术语“使基因失活”表示与对照细胞中的表达相比,基因的表达已有所降低。优选地,与对照细胞中的相应表达相比,本发明的细菌宿主细胞中基因的表达已降低至少40%,如至少50%、至少60%、至少70%、至少80%或至少90%。更优选地,所述表达已降低至少95%。最优选地,其已降低100%,即已完全消除。
本文提到的基因失活可以通过任何被认为合适的方法来实现。在一实施方案中,通过突变,即通过突变基因,使基因失活。优选地,所述突变是缺失,优选地,缺失所述基因。
如本文所用,“基因的缺失”是指整个编码序列的缺失,部分编码序列的缺失,或包括侧翼区在内的编码序列的缺失,最终结果是缺失的基因实际上是无功能的。简单地说,“缺失”定义为核苷酸或氨基酸序列的变化,其中一个或多个核苷酸或氨基酸残基分别被去除(即,不存在)。因此,缺失菌株比各自的野生型生物体具有更少的核苷酸或氨基酸。
术语“使蛋白失活”表示蛋白的氨基酸序列发生改变,与未改变的蛋白相比,蛋白在细胞中的功能已经降低。优选地,与未改变的蛋白的相应功能相比,本发明的细菌宿主细胞中蛋白的功能已降低至少10%,如至少40%、至少50%、至少60%、至少70%、至少80%或至少90%。更优选地,所述功能已降低至少95%。最优选地,功能已降低100%,即蛋白是完全无功能的。
如本文提到的“对照细胞”是不携带相应修饰的同一物种的对照细胞,优选其与宿主细胞的不同之处仅在于不携带相应修饰。因此,对照细胞是未修饰的细胞,如野生型细胞,即未修饰的野生型细胞,优选地衣芽孢杆菌细胞,其不携带相应修饰。优选地,对照细胞是地衣芽孢杆菌细胞,其与宿主细胞的不同之处仅在于不携带相应修饰。
宿主细胞
本发明涉及一种芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,优选改变的RemA蛋白。
例如,所述芽孢杆菌宿主细胞可以是嗜碱芽孢杆菌(Bacillus alcalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、蜡样芽孢杆菌(Bacillus cereus)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillusfirmus)、球芽孢杆菌(Bacillus globigii)、耐盐芽孢杆菌(Bacillus halodurans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、副地衣芽孢杆菌(Bacillus paralicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、甲醇芽孢杆菌(Bacillus methanolicus)、甲基营养型芽孢杆菌(Bacillus methylotrophicus)、摩加夫芽孢杆菌(Bacillus mojavensis)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)(嗜热脂肪芽孢杆菌(Bacillus stearothermophilus))、枯草芽孢杆菌、苏云金芽孢杆菌(Bacillusthuringiensis)或贝莱斯芽孢杆菌(Bacillus velezensis)。在一实施方案中,所述细菌宿主细胞是解淀粉芽孢杆菌、贝莱斯芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一实施方案中,所述细菌宿主细胞是地衣芽孢杆菌细胞、短小芽孢杆菌细胞或枯草芽孢杆菌细胞,在一特别优选的实施方案中是地衣芽孢杆菌细胞。
在一优选实施方案中,所述芽孢杆菌宿主细胞是枯草芽孢杆菌细胞。在这个实施方案中,所述芽孢杆菌宿主细胞优选选自解淀粉芽孢杆菌、贝莱斯芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、短小芽孢杆菌和嗜热脂肪芽孢杆菌,优选地,选自地衣芽孢杆菌和短小芽孢杆菌。
在一优选实施方案中,所述宿主细胞是地衣芽孢杆菌宿主细胞。例如,所述宿主细胞可以是地衣芽孢杆菌菌株ATCC14580的宿主细胞(与DSM13相同,参见Veith et al."Thecomplete genome sequence of Bacillus licheniformis DSM13,an organism withgreat industrial potential."J.Mol.Microbiol.Biotechnol.(2004)7:204-211)。
在另一优选实施方案中,所述宿主细胞是贝莱斯芽孢杆菌宿主细胞。例如,所述宿主细胞可以是贝莱斯芽孢杆菌菌株FZB42的宿主细胞。
在另一优选实施方案中,所述宿主细胞是解淀粉芽孢杆菌宿主细胞。例如,所述宿主细胞可以是解淀粉芽孢杆菌菌株XH7的宿主细胞。
在另一优选实施方案中,所述宿主细胞是短小芽孢杆菌宿主细胞。例如,所述宿主细胞可以是短小芽孢杆菌菌株DSM27的宿主细胞。
在另一优选实施方案中,所述宿主细胞是迟缓芽孢杆菌宿主细胞。例如,所述宿主细胞可以是迟缓芽孢杆菌菌株DSM9的宿主细胞。
在另一优选实施方案中,所述宿主细胞是嗜碱芽孢杆菌宿主细胞。例如,所述宿主细胞可以是嗜碱芽孢杆菌菌株ATCC27647的宿主细胞。
在另一优选实施方案中,所述宿主细胞是甲醇芽孢杆菌宿主细胞。例如,所述宿主细胞可以是甲醇芽孢杆菌菌株PB1(DSM16454)或甲醇芽孢杆菌菌株MGA3(ATCC53907)的宿主细胞。
本发明的芽孢杆菌宿主细胞应当是修饰的宿主细胞。具体地,所述芽孢杆菌宿主包含改变的RemA蛋白和/或改变的RemB蛋白,优选改变的RemA蛋白。因此,所述芽孢杆菌宿主包含天然RemA蛋白的变体,或者所述芽孢杆菌宿主包含天然RemB蛋白的变体,优选天然RemA蛋白的变体。特别优选的是芽孢杆菌宿主细胞包含在芽孢杆菌宿主细胞中具有降低的RemA功能的改变的RemA蛋白和/或在芽孢杆菌宿主细胞中具有降低的RemB功能的改变的RemB蛋白。优选的是芽孢杆菌宿主细胞,其包含在芽孢杆菌宿主细胞中具有失活的RemA功能的改变的RemA蛋白和/或在芽孢杆菌宿主细胞中具有失活的RemB功能的改变的RemB蛋白。因此,特别优选所述芽孢杆菌宿主细胞包含失活的RemA蛋白和/或失活的RemB蛋白,优选失活的RemA蛋白。优选地,RemA和/或RemB蛋白的改变是芽孢杆菌宿主细胞中RemA和/或RemB蛋白的失活。在这个特别优选的实施方案中,改变的RemA蛋白和/或改变的RemB蛋白仍然存在,但是RemA蛋白和/或RemB蛋白具有失活的功能,优选没有功能。
在不受理论束缚的情况下,本发明人认为,芽孢杆菌宿主细胞中RemA和/或RemA蛋白功能的降低导致由芽孢杆菌宿主细胞产生的感兴趣的化合物产量增加。因此,优选地,宿主包含改变的RemA蛋白,优选其中RemA蛋白的改变会导致RemA介导的转录激活的丧失。优选地,RemA蛋白的改变会导致RemA蛋白的DNA结合亲和力降低。进一步优选地,所述芽孢杆菌宿主包含改变的RemB蛋白,优选其中RemB蛋白的改变会导致RemB介导的转录激活的丧失。
在一实施方案,RemA蛋白的改变是由编码RemA蛋白的基因中的一个或多个点突变、插入或部分缺失引起的。优选地,RemA蛋白的改变是由编码RemA蛋白的基因中的一个或多个点突变引起的。优选地,编码RemA蛋白的基因中的一个或多个点突变选自错义突变、无义突变和移码突变。优选地,编码RemA蛋白的基因中的一个或多个点突变是一个或多个错义突变。优选地,remA基因中的一个或多个点突变导致芽孢杆菌宿主细胞中RemA蛋白的失活。
优选地,RemB蛋白的改变是由编码RemB蛋白的基因中的一个或多个点突变、插入或部分引起的。优选地,RemB蛋白的改变是由编码RemB蛋白的基因中的一个或多个点突变引起的。优选地,编码RemB蛋白的基因中的一个或多个点突变选自错义突变、无义突变和移码突变。优选地,编码RemB蛋白的基因中的一个或多个点突变是一个或多个错义突变。优选地,remB基因中的一个或多个点突变导致芽孢杆菌宿主细胞中RemB蛋白的失活。
优选地,编码RemA蛋白的基因中的一个或多个错义点突变位于编码RemA蛋白中保守氨基酸的位置。蛋白中的保守氨基酸位置也可以描述为IC值等于或大于2.0的位置。如本文所用的IC(信息量)值是计算值R_Sequence(l),如Schneider,T.D.;Stephens,R.M.Sequence Logos:A New Way to Display Consensus Sequences.Nucleic AcidsRes.1990,18(20),6097–6100所述,使用氨基酸序列的20种状态。优选地,编码RemA蛋白的基因中的一个或多个错义点突变位于编码SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置的位置,IC值等于或大于2.0,优选等于或大于2.5,更优选等于或大于3.0,或者甚至更优选等于或大于3.2,最优选等于或大于3.5。优选地,编码RemA蛋白的基因中的一个或多个错义点突变位于编码SEQ ID NO:21的保守氨基酸位置的位置,IC值等于或大于3.2,最优选等于或大于3.5。
优选地,编码RemA蛋白的基因中的一个或多个点突变导致RemA蛋白中的非保守氨基酸取代(如本文所定义,参见,例如,表7)。因此,优选改变的RemA蛋白包含一个或多个非保守氨基酸交换。优选改变的RemA蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemA蛋白的功能降低。优选改变的RemA蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemA蛋白的失活。优选地,编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于2.0,优选等于或大于2.5,更优选等于或大于3.0,或者甚至更优选等于或大于3.2,最优选等于或大于3.5。优选地,编码RemA蛋白的基因中的一个或多个错义点突变位于编码SEQ ID NO:21的保守氨基酸位置的位置,IC值等于或大于3.2,最优选等于或大于3.5。优选地,编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,优选如表7所示,优选失活取代,IC值等于或大于3.0,或者甚至更优选等于或大于3.2,最优选等于或大于3.5。
优选地,编码RemA蛋白的基因中的一个或多个点突变导致对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置上的非保守氨基酸取代,优选失活取代,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在选自对应于SEQ ID NO:21的R18和P29的氨基酸位置的一个或多个氨基酸位置。优选改变的RemA蛋白包含SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S中的至少一个。优选改变的RemA蛋白包含SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S。
术语“对应于氨基酸位置的氨基酸位置”,后面是某些氨基酸位置,以SEQ ID NO:21的编号或残基和编号表示,应当表示在提到特定RemA蛋白中的某些氨基酸位置时,如图1所示与SEQ ID NO:21进行序列比对,并且使用SEQ ID NO:21在某个氨基酸位置的氨基酸编号作为参考(即,根据SEQ ID NO:21的编号),例如,在SEQ ID NO:29(短小芽孢杆菌的RemA)中,SEQ ID NO:21(地衣芽孢杆菌的RemA)的M84对应于SEQ ID NO:29的I84。
优选地,改变的RemA蛋白包含与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。优选地,改变的RemA蛋白包含与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。
优选地,改变的RemA蛋白包含与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列以及一个或多个氨基酸取代,优选一个或多个非保守氨基酸取代,优选失活取代,在对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72、R76的氨基酸位置的一个或多个氨基酸位置,最优选在选自对应于SEQ ID NO:21的R18和P29的氨基酸位置的一个或多个,优选两个氨基酸位置。优选地,改变的RemA蛋白包含与SEQ ID NO:21具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列以及一个或多个非保守氨基酸取代,优选失活取代,在对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在选自对应于SEQ ID NO:21的R18和P29的氨基酸位置的一个或多个氨基酸位置。优选改变的RemA蛋白包含SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S中的至少一个。优选改变的RemA蛋白包含SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S。优选改变的RemA蛋白包含与SEQ ID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列,并且包含SEQ ID NO:21的氨基酸位置R18和P29上的取代R18W和P29S中的至少一个,优选两个。
优选地,编码RemB蛋白的基因中的一个或多个点突变导致非保守氨基酸取代(如本文所定义,参见,例如,表7)。因此,优选改变的RemB蛋白包含一个或多个非保守氨基酸交换。优选改变的RemB蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemB蛋白的功能降低。优选改变的RemB蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemB蛋白的失活。优选地,编码RemB蛋白的基因中的一个或多个点突变导致SEQID NO:23、25、29、35或39,优选SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于3.0,或者甚至更优选等于或大于3.2,最优选等于或大于3.5。优选地,编码RemB蛋白的基因中的一个或多个错义点突变位于编码SEQ ID NO:23的保守氨基酸位置的位置,IC值等于或大于3.2,最优选等于或大于3.5。优选地,编码RemB蛋白的基因中的一个或多个错义点突变位于编码SEQ ID NO:23的保守氨基酸位置的位置,IC值等于或大于3.2,最优选等于或大于3.5。优选地,编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选如表7所示,优选失活取代,IC值等于或大于3.0,或者甚至更优选等于或大于3.2′,最优选等于或大于3.5。
优选地,编码RemB蛋白的基因中的一个或多个错义点突变在编码RemB蛋白中的保守氨基酸的位置,优选在对应于SEQ ID NO:23的氨基酸位置4-71的一个或多个氨基酸位置,优选编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:23的H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。术语“对应于氨基酸位置的氨基酸位置”,后面是某些氨基酸位置,以SEQ IDNO:23的编号或残基和编号表示,应当表示在提到特定RemB蛋白中的某些氨基酸位置时,如图2所示与SEQ ID NO:23进行序列比对,并且使用SEQ ID NO:23在某个氨基酸位置的氨基酸编号作为参考(即,根据SEQ ID NO:23的编号),例如,在SEQ ID NO:31(短小芽孢杆菌的RemB)中,SEQ ID NO:23(地衣芽孢杆菌的RemB)的S80对应于SEQ ID NO:31的V84。
优选地,改变的RemB蛋白包含与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。优选地,RemB蛋白与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%,优选至少90%序列相同性。优选地,改变的RemB蛋白包含与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。
优选地,改变的RemB蛋白包含与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列以及一个或多个氨基酸取代,优选在编码RemB蛋白中保守氨基酸的位置上的一个或多个取代,优选在对应于SEQ ID NO:23、27、31、35或39,优选SEQID NO:23的氨基酸位置4-71的一个或多个氨基酸位置,优选RemB蛋白中的一个或多个取代是非保守氨基酸取代,优选失活取代,优选在对应于选自SEQ ID NO:23的H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。
优选地,改变的RemB蛋白包含与SEQ ID NO:23具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列以及在编码RemB蛋白中保守氨基酸的位置上的一个或多个取代,优选在对应于SEQ ID NO:23的氨基酸位置4-71的一个或多个氨基酸位置,优选非保守氨基酸取代,优选失活取代,优选在对应于选自SEQ ID NO:23的H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个位置。
通过修饰内源性remA和/或remB基因和/或通过引入编码改变的RemA和/或RemB蛋白的外源基因,可以在芽孢杆菌宿主细胞中获得改变的RemA蛋白和/或RemB蛋白。在后者的情况下,内源性remA和/或remB基因优选失活,优选缺失。编码改变的RemA蛋白和/或RemB蛋白的外源基因可以作为表达质粒存在于宿主细胞中,或者可以整合到宿主细胞的基因组DNA中。在后者的情况下,编码改变的RemA蛋白和/或RemB蛋白的外源基因的整合优选在编码RemA和/或RemB蛋白的内源基因的基因组位置,从而缺失内源性RemA和/或RemB蛋白。或者,在合适的启动子序列的控制下,编码改变的RemA蛋白和/或RemB蛋白的外源基因的整合在不同的基因组位置,如淀粉酶、蛋白酶aprE或果聚糖蔗糖酶sacB基因座。用于在芽孢杆菌宿主细胞中表达改变的RemA和/或RemB蛋白的适当启动子在本领域是众所周知的,并且在本文的其他地方有更详细的描述。优选地,包含改变的RemA蛋白和/或改变的RemB蛋白(其通过各自的编码序列新引入芽孢杆菌宿主细胞)的修饰的芽孢杆菌宿主细胞包含内源性RemA和/或RemB基因的缺失。因此,优选地,修饰的芽孢杆菌宿主细胞不包含编码内源性RemA和/或内源性RemB蛋白的功能基因。
引入芽孢杆菌宿主细胞的核酸构建体,其编码改变的RemA和/或RemB蛋白,可以包含编码衍生自相同或不同芽孢杆菌物种的RemA和/或RemB蛋白的核酸序列。优选地,引入芽孢杆菌宿主细胞的改变的RemA和/或RemB蛋白来自相同的芽孢杆菌物种,优选来自地衣芽孢杆菌。
因此,在一实施方案中,本发明涉及一种产生包含改变的RemA蛋白和/或改变的RemB蛋白的修饰的芽孢杆菌宿主细胞的方法。优选地,修饰的芽孢杆菌宿主细胞可以通过包括以下步骤的方法获得
a)提供芽孢杆菌细胞,优选地衣芽孢杆菌细胞,以及
b)通过修饰编码内源性RemA和/或内源性RemB蛋白的内源基因以编码如本文所述的改变的RemA和/或改变的RemB蛋白来修饰a)提供的芽孢杆菌细胞,从而获得修饰的芽孢杆菌宿主细胞。
在另一实施方案中,修饰的芽孢杆菌宿主细胞可以通过包括以下步骤的方法获得
a)提供芽孢杆菌细胞,优选地衣芽孢杆菌细胞,
b)通过引入核酸构建体来修饰a)提供的芽孢杆菌细胞,所述核酸构建体包含编码如本文所述的改变的RemA和/或改变的RemB蛋白的基因,优选衍生自天然地衣芽孢杆菌RemA和/或RemB蛋白,优选在合适的启动子序列的控制下,将其引入芽孢杆菌细胞,从而获得修饰的芽孢杆菌宿主细胞,以及
c)任选地失活,优选缺失编码内源性RemA和/或内源性RemB蛋白的内源基因。
本文还描述了芽孢杆菌宿主细胞还可以包含内源性remA基因的缺失或失活或者内源性remB基因的缺失或失活。因此,在一实施方案中,本发明是指芽孢杆菌宿主细胞,其包含内源性remA基因的缺失或失活以及内源性remB基因的缺失或失活。在另一实施方案中,芽孢杆菌宿主细胞包含如本文所述的改变的RemA蛋白以及内源性remB基因的缺失或失活。在另一实施方案中,芽孢杆菌宿主细胞包含如本文所述的改变的RemB蛋白以及内源性remA基因的缺失或失活。
在一实施方案中,芽孢杆菌宿主细胞用于生产如本文其他地方所述的感兴趣的化合物。感兴趣的化合物对宿主细胞可以是内源的或异源的。优选地,感兴趣的化合物是蛋白,优选酶。优选地,感兴趣的化合物对宿主细胞是异源的。优选地,感兴趣的化合物是蛋白,优选酶,对宿主细胞是异源的。
在一实施方案中,宿主细胞包含表达盒,用于产生感兴趣的化合物,优选感兴趣的多肽。在一实施方案中,感兴趣的多肽是酶,如选自淀粉酶、蛋白酶、脂肪酶、磷脂酶、甘露聚糖酶、植酸酶、木聚糖酶、乳糖酶、磷酸酶、葡糖淀粉酶、核酸酶、半乳糖苷酶、内切葡聚糖酶和纤维素酶的酶,优选蛋白酶和/或淀粉酶。
优选地,与不包含改变的RemA蛋白和/或改变的RemB蛋白的芽孢杆菌对照细胞相比,包含改变的RemA蛋白和/或改变的RemB蛋白的修饰的芽孢杆菌宿主细胞包含增加的感兴趣的化合物的生产。优选地,与不包含改变的RemA蛋白和/或改变的RemB蛋白的芽孢杆菌宿主细胞(优选地衣芽孢杆菌对照细胞)相比,包含改变的RemA蛋白和/或改变的RemB蛋白的修饰的芽孢杆菌宿主细胞(优选地衣芽孢杆菌宿主细胞)包含增加的感兴趣的蛋白(优选酶)的生产。
术语“增加”和“增强”在本文中可互换使用,在应用的意义上应当表示优选增加至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%。
术语“减少”和“降低”在本文中可互换使用,在应用的意义上应当表示优选降低至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或95%。在一些实施方案中,基因产物的水平或其活性降低100%。因此,活性被完全消除。这可以通过使基因失活来实现。
产生修饰的芽孢杆菌细胞和改变的蛋白的方法,例如,通过引入外来核酸、染色体基因缺失、取代、突变和失活,是本领域已知的。
将DNA引入宿主细胞,在一实施方案中为芽孢杆菌细胞,可以例如通过原生质体转化(参见,例如,Chang and Cohen,1979,Molecular General Genetics 168:111-115),通过使用感受态细胞(参见,例如,Young and Spizizen,1961,Journal of Bacteriology81:823-829,or Dubnau and Davidoff-Abelson,1971,Journal of Molecular Biology56:209-221),通过电穿孔(参见,例如,Shigekawa and Dower,1988,Biotechniques 6:742-751),或通过接合(参见,例如,Koehler and Thorne,1987,Journal of Bacteriology169:5271-5278)来实现。对于各种类型的宿主细胞,具体转化方案在本领域是已知的(参见,例如,关于大肠杆菌原生质体转化参见Hanahan,1983,J.Mol.Biol.166:557-580)。
基因失活可以通过同源重组实现,即进入的DNA分子包含与待失活的宿主细胞(例如芽孢杆菌)染色体上靶序列的5’和3’侧翼序列同源的序列。随后在同源重组的过程中,所述侧翼序列之间的序列被进入的DNA分子的同源序列取代,即该序列从染色体中缺失。同样,“基因整合”,即DNA序列,如带有或不带有选择标记的基因表达盒,可以通过同源重组整合到细菌宿主细胞的染色体中。因此。待整合的DNA序列两侧是与染色体上的5’和3’侧翼序列同源的DNA序列。根据本发明可以理解,基因整合也可以将基因整合和基因缺失结合在一个步骤中,即染色体上的DNA序列被进入的DNA序列取代以进行基因整合。
同源重组可以通过本领域已知的两种不同方法实现:
通过与环状质粒DNA的连续两轮同源重组(Campbell重组),例如基于众所周知的温度敏感质粒pE194(Nahrstedt et al.,Strain development in Bacilluslicheniformis:construction of biologically contained mutants deficient insporulation and DNA repair.J Biotechnol.2005 Sep 29;119(3):245-54)。
在选择标记的选择条件下,在非允许温度下培养,即阻断质粒复制的温度,通过与第一同源区的第一次同源重组(Campbell重组),实现含有进入的DNA分子的缺失质粒的整合,所述DNA分子包含与染色体上靶序列的5’和3’侧翼序列同源的序列。通过去除选择压力并在允许温度下培养来实现与第二同源区的第二次同源重组,即质粒复制发生,导致从染色体切除质粒。
或者,可以使用非复制性“自杀”质粒,通过在选择标记上选择来迫使整合。只有通过同源重组将质粒整合到基因组中的细胞能够在选择条件下生长。从染色体去除/切除质粒是通过第二次同源重组实现的,通过激活质粒上存在的反选择标记来迫使第二次同源重组。
同源重组的第二种方法是指同时发生的两个同源重组事件,也称作“双交叉”或“双同源重组”。进入的DNA序列是线性的,可以通过PCR、质粒DNA的线性化或染色体DNA的制备获得,这不可避免地导致片段化的线性DNA。WO0308125使用线性DNA构建体(线性化质粒或PCR片段),其包含选择标记,两侧是5’和3’同源区,用于通过双交叉同源重组进行基因组整合。众所周知,在选择标记旁边,额外的DNA,如基因表达盒,当两侧是所述同源区时,被整合到细菌宿主细胞的染色体中。
同源重组需要足够大小的与宿主细胞染色体上靶序列的5’和3’侧翼序列同源的DNA序列,因此应当含有足够数量的核酸,如100-1,500个碱基对,优选400-1,500个碱基对,最优选800-1,500个碱基对,其与相应的靶序列具有高度相同性,以提高同源重组的概率(Dubnau,1993,Genetic exchange and homologous recombination.In Bacillussubtilis and Other Gram-positive Bacteria,p.555-584.Edited by A.I.Sonenshein,J.A.Hoch&R.Losick,Washington DC,American Society for Microbiology;Michel andEhrlich,1984,The EMBO Journal,vol.3,pp.2879-2884)。
通过缺失/插入/取代的基因失活也可以通过CRISPR/Cas9基因组编辑技术来实现,其中CRISPR切割特性可以用于破坏几乎任何生物体基因组中的基因,并且具有前所未有的便利性(Mali P,et al(2013)Science.339(6121):819-823;Cong L,et al(2013)Science 339(6121))。最近很明显,提供修复模板,例如同源区,允许在几乎任何位点用几乎任何期望的序列编辑基因组,将CRISPR转化为强大的基因编辑工具(WO/2014/150624,WO/2014/204728)。
基于CRISPR的基因组编辑系统在革兰氏阳性生物体中的应用已得到了很好的描述,如基于芽孢杆菌的单质粒系统方法,即在单个大肠杆菌-芽孢杆菌穿梭质粒上包含Cas9内切核酸酶、gRNA(例如sgRNA或crRNA/tracrRNA)、修复同源序列(供体DNA)(Altenbuchner,(2016):Applied and environmental microbiology 82(17),5421-5427;Zhou,et al.(2019):International journal of biological macromolecules 122,329–337),或双质粒系统或将Cas9内切核酸酶整合到芽孢杆菌基因组中,如WO2020206202和WO2020206197所述。
除“定向”失活方法外,在本发明的范围内应当理解,通过应用诱变条件如将细胞暴露于UV辐射,或化学诱变化学品如NTG(N-甲基-N'-硝基-N-亚硝基胍)、EMS(甲基磺酸乙酯),结合筛选和/或选择期望的特性,例如降低的脂肪酶/酯酶活性,进行全细胞诱变是实现功能失活的一种众所周知的方法。
此外,可以通过基因沉默使基因失活。基因沉默可以通过引入所述细菌宿主细胞反义表达构建体来实现,所述构建体导致与基因mRNA互补的反义RNA,从而抑制所述基因的表达。或者,可以通过CRISPR-抑制机制阻断转录起始或转录延伸来抑制所述基因的表达(WO18009520)。
改变的RemA和RemB蛋白以及编码它们的核酸
在另一实施方案中,本发明涉及改变的RemA蛋白或改变的RemB蛋白以及编码如本文所述的改变的RemA蛋白或改变的RemB蛋白的核酸,优选涉及改变的RemA蛋白以及编码如本文所述的改变的RemA蛋白的核酸。优选地,改变的RemA蛋白是天然RemA蛋白的变体。优选地,改变的RemB蛋白是天然RemB蛋白的变体。优选地,改变的RemA蛋白和/或RemB蛋白在芽孢杆菌宿主细胞中的功能降低。优选地,RemA和/或RemB蛋白的改变导致芽孢杆菌宿主细胞中RemA和/或RemB蛋白的功能失活。因此,本发明是指RemA和/或RemB蛋白的变体,优选失活的RemA和/或失活的RemB蛋白。优选地,改变的RemA或RemB蛋白包含一个或多个氨基酸交换。优选地,改变的RemA或RemB蛋白包含一个或多个非保守氨基酸取代(优选如表7所示),优选在保守氨基酸位置。
优选地,编码RemA蛋白的基因中的一个或多个点突变在SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置,IC值等于或大于3.0,更优选等于或大于3.2,最优选等于或大于3.5。因此,本发明还涉及编码这种改变的RemA蛋白的核酸分子,其包含编码SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置的三联体中的一个或多个点突变,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5。
优选地,编码RemA蛋白的基因中的一个或多个点突变导致RemA蛋白中的非保守氨基酸取代(如本文所定义,参见,例如,表7))。因此,优选改变的RemA蛋白包含一个或多个非保守氨基酸交换。因此,优选改变的RemA蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemA蛋白的功能降低。优选改变的RemA蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemA蛋白的失活。优选地,编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于3.0,更优选等于或大于3.2,最优选等于或大于3.5。
优选地,编码RemA蛋白的基因中的一个或多个点突变导致对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置上的非保守氨基酸取代,优选失活取代,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在SEQ IDNO:21的氨基酸位置R18和/或P29。优选地,改变的RemA蛋白包含与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。优选地,改变的RemA蛋白包含与SEQ ID NO:21具有至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。
优选地,编码RemB蛋白的基因中的一个或多个错义点突变位于编码RemB蛋白中保守氨基酸的位置。优选地,编码RemB蛋白的基因中的一个或多个点突变在SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置,IC值等于或大于3.0,更优选等于或大于3.2,最优选等于或大于3.5。因此,本发明还涉及编码这种改变的RemB蛋白的核酸分子,其包含编码SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置的三联体中的一个或多个点突变,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5。
优选地,编码RemB蛋白的基因中的一个或多个点突变导致非保守氨基酸取代(如本文所定义)。因此,优选改变的RemB蛋白包含一个或多个非保守氨基酸交换。因此,优选改变的RemB蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemB蛋白的功能降低。优选改变的RemB蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemB蛋白的失活。优选地,编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5。优选地,编码RemB蛋白的基因中的一个或多个错义点突变在编码RemB蛋白中保守氨基酸的位置,优选在对应于SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的氨基酸位置4-71的一个或多个氨基酸位置,优选编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。优选地,RemB蛋白与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%,优选至少90%序列相同性。优选地,改变的RemB蛋白包含与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。优选地,改变的RemB蛋白包含与SEQ ID NO:23具有至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。
在另一实施方案中,本发明涉及编码如本文所述的改变的RemA和/或改变的RemB蛋白的核酸或核酸构建体。优选地,编码改变的RemA蛋白的核酸或核酸构建体包含:
(a)多核苷酸,其编码与SEQ ID NO:21、25、29、33或37具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性的氨基酸序列,优选SEQ ID NO:21、25、29、33或37,优选SEQID NO:21;
(b)多核苷酸,其与SEQ ID NO:20、24、28、32或36,优选SEQ ID NO:20具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性,
(c)多核苷酸,其在高严格性条件下与SEQ ID NO:20、24、28、32或36,优选SEQ IDNO:20中示出的多核苷酸的互补序列杂交,
(d)多核苷酸,其与SEQ ID NO:20、24、28、32或36,优选SEQ ID NO:20具有至少95%、但少于100%序列相同性,其中所述多核苷酸仅通过遗传密码的简并性而进一步不同于SEQ ID NO:20、24、28、32或36,优选SEQ ID NO:20,或者
(e)(a)、(b)、(c)或(d)的片段。
优选地,编码改变的RemB蛋白的核酸或核酸构建体包含:
(a)多核苷酸,其编码与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性的氨基酸序列;
(b)多核苷酸,其与SEQ ID NO:22、26、30、34或38,优选SEQ ID NO:22具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性,
(c)多核苷酸,其在高严格性条件下与SEQ ID NO:22、26、30、34或38,优选SEQ IDNO:22示出的多核苷酸的补体杂交,
(d)多核苷酸,其与SEQ ID NO:22、26、30、34或38,优选SEQ ID NO:22具有至少95%、但少于100%序列相同性,其中所述多核苷酸仅通过遗传密码的简并性而进一步不同于SEQ ID NO:22、26、30、34或38,优选SEQ ID NO:22,或者
(e)(a)、(b)、(c)或(d)的片段。
本文所述的改变的RemA蛋白是亲本RemA蛋白的变体。本文所述的改变的RemB蛋白是亲本RemB蛋白的变体。
亲本蛋白的变体可以具有与亲本序列的氨基酸序列具有一定百分比相同性的氨基酸序列。因此,亲本多肽的变体可以包含与亲本多肽的氨基酸序列至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但低于100%相同的氨基酸序列。因此,变体可以通过它们与亲本多肽相比时的序列相同性来定义。序列相同性通过提供为“%序列相同性”或“%相同性”。为了确定两个氨基酸序列之间的百分比相同性,在第一步中在这两个序列之间产生成对序列比对,其中将两个序列在它们的整个长度上比对(即,成对全局比对)。用实现Needleman和Wunsch算法(J.Mol.Biol.(1979)48,p.443-453)的程序产生比对,优选通过使用程序“NEEDLE”(The European Molecular Biology OpenSoftware Suite(EMBOSS)),用程序默认参数(gapopen=10.0,gapextend=0.5和matrix=EBLOSUM62)。用于本发明目的的优选比对是可以由其确定最高序列相同性的比对。
比对两个序列之后,在第二步中,应当从比对确定相同性值。因此,根据本发明,以下百分比相同性的计算适用:
%-相同性=(相同残基/在其完整长度上显示本发明的相应序列的比对区域的长度)*100。因此,与根据这个实施方案的两个氨基酸序列的比较相关的序列相同性是通过将相同残基的数量除以比对区域的长度来计算的,所述比对区域在其完整长度上显示本发明的相应序列。将这个值乘以100以给出“%-相同性”。
对于计算两个DNA序列的百分比相同性,与计算两个氨基酸序列的百分比相同性相同,具有一些规范。对于编码蛋白的DNA序列,应当在编码区的整个长度上进行成对比对,从起始密码子到终止密码子,不包括内含子。对于非蛋白编码DNA序列,应当在本发明序列的整个长度上进行成对比对,因此将本发明的完整序列与另一序列或另一序列之外的区域进行比较。此外,实现Needleman和Wunsch算法(J.Mol.Biol.(1979)48,p.443-453)的优选比对程序是“NEEDLE”(The European Molecular Biology Open Software Suite(EMBOSS)),用程序默认参数(gapopen=10.0,gapextend=0.5和matrix=EDNAFULL)。
对于核酸,也可以通过使用各自的严格性条件进行杂交来确定相似的序列。术语“高严格性条件”表示对于长度为至少100个核苷酸的探针,在42℃下于5X SSPE、0.3%SDS、200微克/ml剪切变性的鲑鱼精子DNA和50%甲酰胺中,按照标准Southern印迹程序进行预杂交和杂交12-24小时。最后使用2X SSC、0.2%SDS在65℃下洗涤载体材料三次,每次15分钟。术语“非常高严格性条件”表示对于长度为至少100个核苷酸的探针,在42℃下于5XSSPE、0.3%SDS、200微克/ml剪切变性的鲑鱼精子DNA和50%甲酰胺中,按照标准Southern印迹程序进行预杂交和杂交12-24小时。最后使用2X SSC、0.2%SDS在70℃下洗涤载体材料三次,每次15分钟。
在一实施方案中,变体多肽包含1-30、1-20、1-10或1-5个氨基酸取代,优选地,这类取代与酶的功能结构域无关。
变体可以通过它们与亲本多肽相比时的序列相似性来定义。序列相似性通常提供为“%序列相似性”或“%-相似性”。为了计算序列相似性,在第一步中必须如上所述生成序列比对。在第二步中,必须计算百分比-相似性,而百分比序列相似性考虑到定义的氨基酸集合具有相似的特性,例如,它们的大小,它们的疏水性,它们的电荷或其他特征。在这里,一个氨基酸与相似氨基酸的交换被称作“保守突变”。包含保守突变的多肽变体似乎对蛋白折叠的影响最小,导致某些多肽,优选酶,在与亲本多肽的多肽特性相比时,其特性基本上保持不变。
对于根据本发明确定%-相似性,适用以下内容,这也符合BLOSUM62矩阵(矩阵(Henikoff,J.G.;Proc.Natl.Acad.Sci.USA89,10915–10919(1992)),该矩阵式数据库搜索和序列比对中最常用的氨基酸取代矩阵之一。如果字母对的BLOSUM62取代矩阵的值为正,则氨基酸交换被定义为相似。表6示出了保守交换。
表6:
氨基酸A与氨基酸S相似
氨基酸D与氨基酸E;N相似
氨基酸E与氨基酸D;K;Q相似
氨基酸F与氨基酸W;Y相似
氨基酸H与氨基酸N;Y相似
氨基酸I与氨基酸L;M;V相似
氨基酸K与氨基酸E;Q;R相似
氨基酸L与氨基酸I;M;V相似
氨基酸M与氨基酸I;L;V相似
氨基酸N与氨基酸D;H;S相似
氨基酸Q与氨基酸E;K;R相似
氨基酸R与氨基酸K;Q相似
氨基酸S与氨基酸A;N;T相似
氨基酸T与氨基酸S相似
氨基酸V与氨基酸I;L;M相似
氨基酸W与氨基酸F;Y相似
氨基酸Y与氨基酸F;H;W相似。
保守氨基酸取代可能发生在功能蛋白如酶的多肽序列的全长序列上。在一实施方案中,这类突变与酶的功能结构域无关。在另一实施方案中,保守突变与酶的催化中心无关。
因此,根据本发明,以下百分比相似性的计算适用:
%-相似性=[(相同残基+相似残基)/在其完整长度上显示本发明的相应序列的比对区域的长度]*100。因此,与两个氨基酸序列的比较相关的序列相似性是通过将相同残基的数量加上相似残基的数量除以比对区域的长度来计算的,所述比对区域在其完整长度上显示本发明的相应序列。将这个值乘以100以给出“%-相似性”。
特别地,包含保守突变的变体多肽,其与全长多肽序列相比与相应的亲本序列至少m%相似,m是50和100之间的整数,优选50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98或99,预期具有基本上不变的多肽特性。在另一实施方案中,保守突变与酶的催化中心无关。在一实施方案中,变体多肽包含1-30、1-20、1-10或1-5个保守氨基酸取代,优选地,这类取代与酶的功能结构域无关。
同样,一个氨基酸与非相似氨基酸的交换被称作“非保守突变”。包含非保守突变的酶变体似乎对蛋白折叠有影响,导致某些酶特性与亲本酶的酶特性相比不同。因此,如果字母对的BLOSUM62取代矩阵的值为负,则氨基酸交换被定义为非保守的。表7示出了非保守交换。
表7:
氨基酸A与氨基酸D、E、F、H、I、K、L、M、N、P、Q、R、W、Y不相似
氨基酸C与氨基酸D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y不相似
氨基酸D与氨基酸A、C、F、G、H、I、K、L、M、P、R、T、V、W、Y不相似
氨基酸E与氨基酸A、C、F、G、I、L、M、P、T、V、W、Y不相似
氨基酸F与氨基酸A、C、D、E、G、H、K、N、P、Q、R、S、T、V不相似
氨基酸G与氨基酸C、D、E、F、H、I、K、L、M、P、Q、R、T、V、W、Y不相似
氨基酸H与氨基酸A、C、D、F、G、I、K、L、M、P、S、T、V、W不相似
氨基酸I与氨基酸A、C、D、E、G、H、K、N、P、Q、R、S、T、W、Y不相似
氨基酸K与氨基酸A、C、D、F、G、H、I、L、M、P、T、V、W、Y不相似
氨基酸L与氨基酸A、C、D、E、G、H、K、N、P、Q、R、S、T、W、Y不相似
氨基酸M与氨基酸A、C、D、E、G、H、K、N、P、R、S、T、W、Y不相似
氨基酸N与氨基酸A、C、F、I、L、M、P、V、W、Y不相似
氨基酸P与氨基酸A、C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W、Y不相似
氨基酸Q与氨基酸A、C、F、G、I、L、P、T、V、W、Y不相似
氨基酸R与氨基酸A、C、D、F、G、I、L、M、P、S、T、V、W、Y不相似
氨基酸S与氨基酸C、F、H、I、L、M、P、R、V、W、Y不相似
氨基酸T与氨基酸C、D、E、F、G、H、I、K、L、M、P、Q、R、W、Y不相似
氨基酸V与氨基酸C、D、E、F、G、H、K、N、P、Q、R、S、W、Y不相似
氨基酸W与氨基酸A、C、D、E、G、H、I、K、L、M、N、P、Q、R、S、T、V不相似
氨基酸Y与氨基酸A、C、D、E、G、I、K、L、M、N、P、Q、R、S、T、V不相似
生产感兴趣的化合物的方法
在另一实施方案中,本发明涉及一种生产感兴趣的化合物,优选感兴趣的多肽的方法。为了生产感兴趣的多肽,修饰的芽孢杆菌宿主细胞应当包含至少一个编码感兴趣的多肽的多核苷酸,其中所述多核苷酸与启动子可操作地连接。因此,宿主细胞应当包含至少一种感兴趣的多肽的表达盒。
因此,本发明涉及一种生产感兴趣的化合物,优选感兴趣的多肽的方法,包括
a)提供修饰的芽孢杆菌宿主细胞,其包含如本文所述的改变的RemA蛋白和/或改变的RemB蛋白,
b)在所述修饰的芽孢杆菌宿主细胞上引入感兴趣的化合物的表达盒,优选感兴趣的多肽,
b)在允许表达感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地,从培养基分离感兴趣的化合物。
优选地,用于生产感兴趣的化合物的方法的芽孢杆菌宿主细胞选自短小芽孢杆菌、贝莱斯芽孢杆菌、解淀粉芽孢杆菌、嗜碱芽孢杆菌、地衣芽孢杆菌、副地衣芽孢杆菌、迟缓芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、甲醇芽孢杆菌、嗜热脂肪地芽孢杆菌(嗜热脂肪芽孢杆菌)、摩加夫芽孢杆菌、球芽孢杆菌或枯草芽孢杆菌。例如,用于生产感兴趣的化合物的方法的芽孢杆菌宿主细胞属于物种短小芽孢杆菌、贝莱斯芽孢杆菌、解淀粉芽孢杆菌、地衣芽孢杆菌或枯草芽孢杆菌。在另一优选实施方案中,宿主细胞是枯草芽孢杆菌宿主细胞。例如,宿主细胞可以是枯草芽孢杆菌菌株NCIB 3610的宿主细胞。然而,在一实施方案中,用于生产感兴趣的化合物的方法的宿主细胞不是枯草芽孢杆菌宿主细胞。因此,对于生产感兴趣的化合物的方法,优选宿主细胞选自短小芽孢杆菌、贝莱斯芽孢杆菌、解淀粉芽孢杆菌、嗜碱芽孢杆菌、地衣芽孢杆菌、副地衣芽孢杆菌、迟缓芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、甲醇芽孢杆菌、嗜热脂肪地芽孢杆菌(嗜热脂肪芽孢杆菌)、摩加夫芽孢杆菌或球芽孢杆菌。优选用于生产感兴趣的化合物的方法的宿主细胞选自基短小芽孢杆菌、贝莱斯芽孢杆菌、解淀粉芽孢杆菌或地衣芽孢杆菌。
上面给出的关于本发明修饰的宿主细胞的解释和定义比照适用于本发明的方法。
如本文所用的术语“培养”是指至少在预定时间内使培养物中包含的修饰的宿主细胞保持存活和/或增殖。该术语涵盖接种后生长开始时的指数细胞生长阶段以及稳定生长阶段。培养条件应当允许表达,即产生感兴趣的多肽。这类条件可以由技术人员选择,无需赘述。实施例3描述了培养修饰的宿主细胞的示例性条件。在本发明的方法的一实施方案中,步骤b)中的培养作为补料分批培养进行。
如果应用,本发明的方法允许增加至少一种感兴趣的化合物,优选多肽的表达,即产生。优选地,与未修饰的对照细胞中的表达相比,表达增加。在一优选实施方案中,与对照细胞中的表达相比,至少一种感兴趣的多肽的表达增加至少10%、20%或至少40%,如至少50%,或至少80%。例如,与对照细胞相比,至少一种感兴趣的多肽的表达可以增加20%-100%,如40%-60%。此外,设想表达增加至少100%、150%、200%、250%或300%,如200%-300%。通常,可以通过确定宿主细胞和/或培养基中感兴趣的化合物的量来测量表达。
在一实施方案中,用于在芽孢杆菌宿主细胞中表达感兴趣的化合物的表达盒对芽孢杆菌宿主细胞是异源的。优选地,编码至少一种感兴趣的多肽的多核苷酸对芽孢杆菌宿主细胞是异源的。优选地,在一实施方案中,编码至少一种感兴趣的多肽的多核苷酸对细菌宿主细胞是异源的。在整个说明书中使用的术语“异源”(或外源或外来或重组或非天然)多肽或蛋白在本文中定义为非宿主细胞天然的多肽或蛋白。类似地,术语“异源”(或外源或外来或重组或非天然)多核苷酸是指非宿主细胞天然的多核苷酸。
在一实施方案中,所述至少一种编码感兴趣的多肽的多核苷酸存在于质粒上。术语“质粒”是指染色体外的环状DNA,即在宿主细胞中自主复制的载体。因此,质粒被理解为染色体外载体。
在一优选实施方案中,质粒的复制应当独立于细菌宿主细胞染色体的复制。对于自主复制,表达载体可以进一步包含复制起点,使载体能够在所述宿主细胞中自主复制。细菌的复制起点包括但不限于允许在大肠杆菌(E.coli)中复制的质粒pBR322、pUC19、pSC101、pACYC177和pACYC184的复制起点(Sambrook,J.and Russell,D.W.Molecularcloning.Alaboratory manual,3rd ed,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY.2001;Cohen,S.N.,Chang,A.C.Y.,Boyer,H.W.,&Helling,R.B.(1973).Construction of Biologically Functional Bacterial Plasmids InVitro.Proceedings of the National Academy of Sciences of the United States ofAmerica,70(11),3240–3244),以及允许在芽孢杆菌中复制的pUB110、pC194、pE194、pTB19、和pTA1060(Janniere,L.,Bruand,C.,and Ehrlich,S.D.(1990).Structurallystable Bacillus subtilis cloning vectors.Gene 87,53-6;Ehrlich,S.D.,Bruand,C.,Sozhamannan,S.,Dabert,P.,Gros,M.F.,Janniere,L.,and Gruss,A.(1991).Plasmidreplication and structural stability in Bacillus subtilis.Res.Microbiol.142,869-873),以及pE194(Dempsey,L.A.and Dubnau,D.A.(1989).Localization of thereplication origin of plasmid pE194.J.Bacteriol.171,2866-2869)。复制起点可以是具有突变的复制起点,使其功能在宿主细胞中对温度敏感。
质粒的拷贝数定义为在正常生长条件下每个细菌细胞或每个染色体的质粒平均数量。此外,有不同类型的复制起点,导致细菌宿主中的拷贝数不同。质粒复制子pBS72(登录号AY102630.1)和质粒pTB19及衍生物pTB51、pTB52在芽孢杆菌细胞内分别赋予6个拷贝和1-8个拷贝的低拷贝数,而质粒pE194(登录号V01278.1)和pUB110(登录号M19465.1)/pBC16(登录号U32369.1)分别赋予每个细胞14-20个拷贝的中低拷贝数和30-50个拷贝的中拷贝数。对质粒pE194进行了更详细的分析(Villafane,et al(1987):J.Bacteriol.169(10),4822-4829),描述的几种pE194–cop突变体在芽孢杆菌内具有85个拷贝至202个拷贝的高拷贝数。此外,质粒pE194对温度敏感,在高达37℃下具有稳定的拷贝数,但在43℃以上停止复制。此外,它存在一种称作pE194ts的pE194变体,在cop-repF区内有两个点突变(nt1235和nt 1431),导致更强烈的温度敏感性–在高达32℃下具有稳定拷贝数,但是在37℃下每个细胞只有1-2个拷贝。
在一实施方案中,载体含有一个或多个选择标记,其允许容易选择转化的细胞。选择标记是编码产物的基因,其提供杀生物剂抗性、重金属抗性、对营养缺陷型的原营养等。细菌选择标记包括但不限于来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或者赋予抗生素抗性的标记,如氨苄西林、卡纳霉素、红霉素、氯霉素或四环素抗性。此外,选择可以通过共转化来完成,例如,如WO91/09129所述,其中选择标记在单独的载体上。
在另一实施方案中,将所述至少一种编码感兴趣的多肽的多核苷酸稳定地整合到细菌染色体中。
启动子
所述至少一种编码感兴趣的多肽的多核苷酸应当与启动子可操作地连接。
如本文所用的术语“可操作地连接”是指启动子序列和编码感兴趣的多肽的多核苷酸之间的功能性连接,使得启动子序列能够启动编码感兴趣的多肽的多核苷酸(在本文中也称作感兴趣的基因)的转录。
“启动子”或“启动子序列”是位于基因上游的核苷酸序列,与基因位于同一条链上,使该基因能够转录。启动子之后是基因的转录起始位点。启动子被RNA聚合酶(连同任何所需的转录因子)识别,从而启动转录。启动子的功能片段或功能变体是可被RNA聚合酶识别并能够启动转录的核苷酸序列。
“活性启动子片段”、“活性启动子变体”、“功能性启动子片段”或“功能性启动子变体”描述了仍然具有启动子活性的启动子核苷酸序列的片段或变体。
启动子可以是“诱导物依赖性启动子”或“诱导物非依赖性启动子”,包含组成型启动子或受其他细胞调节因子控制的启动子。
本领域技术人员能够选择合适的启动子来表达第三丙氨酸消旋酶和感兴趣的多肽。例如,编码感兴趣的多肽的多核苷酸优选与“诱导物依赖性启动子”或“诱导物非依赖性启动子”可操作地连接。此外,编码第三丙氨酸消旋酶的多核苷酸优选与“诱导物非依赖性启动子”,如组成型启动子可操作地连接。
“诱导物依赖性启动子”在本文中理解为在发酵培养基中添加“诱导物分子”后,其活性增加,从而使启动子可操作地连接的基因能够转录的启动子。因此,对于诱导物依赖性启动子,诱导物分子的存在会通过信号转导触发与启动子可操作地连接的基因的表达增加。通过诱导物分子的存在激活之前的基因表达不需要不存在,而是也可以以低水平的基础基因表达存在,在添加诱导物分子后增加。“诱导物分子”是一种分子,其在发酵培养基中的存在能够通过增加与基因可操作地连接的诱导物依赖性启动子的活性来影响基因表达的增加。优选地,诱导物分子是碳水化合物或其类似物。在一实施方案中,诱导物分子是芽孢杆菌细胞的次级碳源。在碳水化合物混合物的存在下,细胞选择性地吸收为其提供最多能量和生长优势的碳源(主要碳源)。同时,它们抑制参与不太优选的碳源(次级碳源)的分解代谢和摄取的各种功能。通常,芽孢杆菌的主要碳源是葡萄糖,各种其他糖和糖衍生物被芽孢杆菌用作次级碳源。次级碳源包括例如甘露糖或乳糖,但不限于这些。
诱导物依赖性启动子的实例在下表中通过参考各自的操纵子给出:
/>
与此相反,不依赖于诱导物分子存在的启动子(在本文中称作“诱导物非依赖性启动子”)的活性是组成型活性的,或者可以增加,无论添加至发酵培养基中的诱导物分子是否存在。
组成型启动子不依赖其他细胞调节因子,转录起始依赖于σ因子A(sigA)。sigA依赖性启动子包含σ因子A特异性识别位点‘-35’-区和‘-10’-区。
优选地,“诱导物依赖性启动子”序列选自组成型启动子,其不限于启动子Pveg、PlepA、PserA、PymdA、Pfba及其具有不同基因表达强度的衍生物(Guiziou et al,(2016):Nucleic Acids Res.44(15),7495-7508),编码芽孢杆菌aprE基因的枯草杆菌蛋白酶的aprE启动子,噬菌体SPO1启动子P4、P5、P15(WO15118126),来自苏云金芽孢杆菌的cryIIIA启动子(WO9425612),来自解淀粉芽孢杆菌的amyQ启动子,来自地衣芽孢杆菌的amyL启动子和启动子变体(US5698415)及其组合,或者它们的活性片段或变体,优选aprE启动子序列。
WO9102792公开了碱性蛋白酶基因启动子的功能,用于在地衣芽孢杆菌中大规模生产枯草杆菌蛋白酶Carlsberg型蛋白酶及其在发酵过程中的生产。
编码枯草杆菌蛋白酶的短小芽孢杆菌基因aprE1和aprE2的启动子已用于在短小芽孢杆菌中表达重组蛋白酶和淀粉酶(T,Wiechert W.Microb CellFact.2014Mar24;13(1):46.)。特别地,与PaprE1-IV启动子变体(相对于起始ATG的nt-357)相比,包含相对于起始ATG的核苷酸nt-382的PaprE1-III启动子变体表现出非常高的生产力。
“aprE启动子”、“aprE型启动子”或“aprE启动子序列”是位于aprE基因上游的核苷酸序列(或者其部分或变体),即编码芽孢杆菌枯草杆菌蛋白酶Carlsberg蛋白酶的基因,与aprE基因位于同一条链上,使得aprE基因能够转录。术语“转录起始位点”或“转录的起始位点”应当理解为在基因序列5’端的转录起始的位置。在原核生物中,称作+1的第一个核苷酸一般为腺苷(A)或鸟苷(G)核苷酸。在这种情况下,术语“位点”和“信号”在本文中可互换使用。
进一步任选地,启动子包含5'UTR。这是-1启动子位置下游的转录但不翻译的区域。例如,这种非翻译区应当包含核糖体结合位点,以便在靶基因编码肽或多肽的情况下促进翻译。
WO9102792公开了碱性蛋白酶基因启动子的功能,用于在地衣芽孢杆菌中大规模生产枯草杆菌蛋白酶Carlsberg型蛋白酶。特别地,WO9102792描述了地衣芽孢杆菌编码枯草杆菌蛋白酶Carlsberg蛋白酶的aprE基因的5’区(图27),其包含功能性aprE基因启动子和包含核糖体结合位点的5’UTR(Shine Dalgarno序列)。
术语“转录起始位点”或“转录的起始位点”应当理解为在基因序列5’端的转录起始的位置。在原核生物中,称作+1的第一个核苷酸一般为腺苷(A)或鸟苷(G)核苷酸。在这种情况下,术语“位点”和“信号”在本文中可互换使用。
术语“表达”或“基因表达”是指一个特定基因或多个特定基因或特定核酸构建体的转录。术语“表达”或“基因表达”特别是指一个基因或多个基因或遗传构建体转录为结构RNA(例如,rRNA、tRNA)或mRNA,后者随后翻译或不翻译为蛋白。该过程包括DNA的转录和所得mRNA产物的加工。
进一步任选地,启动子包含5'UTR。这是-1启动子位置下游的转录但不翻译的区域。例如,这种非翻译区应当包含核糖体结合位点,以便在靶基因编码肽或多肽的情况下促进翻译。
关于5'UTR,本发明特别教导将本发明的启动子与包含一个或多个稳定元件的5'UTR组合。这样,可以加工由启动子区合成的mRNA以产生在转录本的5’端具有稳定序列的mRNA转录本。如Hue et al,1995,Journal of Bacteriology 177:3465-3471所述,优选在mRNA转录本5'端的这种稳定物序列增加它们的半衰期。合适的mRNA稳定元件如下所述
-WO08148575,优选WO08140615的SEQ ID NO.1-5,或这些序列中保持mRNA稳定功能的片段,以及
-WO08140615,优选苏云金芽孢杆菌CrylllA mRNA稳定序列或噬菌体SP82mRNA稳定序列,更优选根据WO08140615的SEQ ID NO.4或5的mRNA稳定序列,更优选根据WO08140615的SEQ ID NO.6的修饰的mRNA稳定序列,或者这些序列中保持mRNA稳定功能的片段。
优选的mRNA稳定元件选自aprE、grpE、cotG、SP82、RSBgsiB、CrylllA mRNA稳定元件,或根据这些序列中保持mRNA稳定功能的片段。优选的mRNA稳定元件是grpE mRNA稳定元件(对应于WO08148575的SEQ ID NO.2)。
5'UTR还优选包含位于启动子下游和核糖体结合位点(RBS)上游的修饰的rib前导序列。在本发明的背景下,rib前导序列在此定义为芽孢杆菌细胞(更优选枯草芽孢杆菌细胞)中核黄素生物合成基因(rib操纵子)上游的前导序列。在枯草芽孢杆菌中,包含参与核黄素生物合成的基因的rib操纵子包括ribG(ribD)、ribB(ribE)、ribA和ribH基因。枯草芽孢杆菌中来自rib启动子(Prib)的核黄素操纵子的转录由核糖开关控制,该核糖开关涉及一个近300个核苷酸的非翻译调节前导区(rib前导区),位于操纵子ribG中第一个基因的转录起始和翻译起始密码子之间的rib操纵子的5'-区域。WO2015/1181296,特别是第23-25页中描述了合适的rib前导序列,其援引加入本文。
对于工业发酵过程,可以对细菌宿主细胞进行遗传修饰以满足最高产品纯度和监管要求的需要。因此,在本发明的范围内使用芽孢杆菌生产宿主,其可以额外含有其他基因的修饰,例如,缺失或破坏,这些基因可能不利于感兴趣的多肽的生产、回收或应用。在一实施方案中,细菌宿主细胞是蛋白酶缺陷的细胞。细菌宿主细胞,例如,芽孢杆菌细胞,优选包含胞外蛋白酶基因的破坏或缺失,所述胞外蛋白酶基因包括但不限于aprE、mpr、vpr、bpr和/或epr。此外,优选细菌宿主细胞不产生孢子。此外,优选细菌宿主细胞,例如,芽孢杆菌细胞,包含参与孢子形成的基因的破坏或缺失。参与孢子形成的基因是本领域众所周知的(EP1391502),包括但不限于sigE、sigF、spoIIGA、spoIIE、sigG、spoIVCB、yqfD。在一优选实施方案中,使sigF基因缺失。此外,优选细菌宿主细胞,例如,芽孢杆菌细胞,包含参与表面活性素生物合成的基因之一的破坏或缺失,例如,srfA、srfB、srfC和/或srfD,参见,例如,美国专利第5,958,728号。还优选细菌宿主细胞包含参与聚谷氨酸生物合成的基因之一的破坏或缺失(US2016002591)。因此,使参与多聚γ-谷氨酸(pga)产生的至少一个基因失活(如缺失)。优选地,所述参与多聚γ-谷氨酸(pga)的至少一个基因是选自ywsC(pgsB)、ywtA(pgsC)、ywtB(pgsA)和ywtC(pgsE)的至少一个基因。优选地,所有上述基因,即ywsC(pgsB)、ywtA(pgsC)、ywtB(pgsA)和ywtC(pgsE)已失活(如缺失)。还可以破坏或缺失不利于感兴趣的多肽的生产、回收或应用的其他基因,包括但不限于amyE基因。
在一实施方案中,芽孢杆菌细胞包含选择标记。选择标记可以是抗生素抗性标记,如氨苄西林、卡纳霉素、红霉素、氯霉素或四环素,或者营养缺陷型抗性标记。
任选地,芽孢杆菌细胞可以包含如本文所述的反选择标记。在一优选实施方案中,反选择多肽是参与嘧啶代谢的多肽。因此,反选择多肽,如oroP、pyrE、pyrF、upp,在嘧啶代谢中使用中间体的氟化类似物,如5-氟-乳清酸酯或5-氟-尿苷。或者,毒素-抗毒素系统(TA)的毒素如mazEF、ccdAB可以用作芽孢杆菌中的功能性反选择多肽(参见Dong,H.,Zhang,D.Current development in genetic engineering strategies of Bacillusspecies.Microb Cell Fact 13,63(2014))。在一更优选的实施方案中,反选择多肽是胞嘧啶脱氨酶,如codBA系统提供(Kostner D,Rachinger M,Liebl W,EhrenreichA.Markerless deletion of putative alanine dehydrogenase genes in Bacilluslicheniformis using a codBA-based counterselectiontechnique.Microbiology.2017;163(11):1532-1539)。优选地,反选择剂是5-氟-胞嘧啶
感兴趣的化合物
本发明的宿主细胞应当进一步包含表达盒,用于产生感兴趣的化合物,优选感兴趣的多肽。
感兴趣的化合物可以是聚合物,优选透明质酸,优选如(WO2005098016)所述,或者聚谷氨酸,优选如EP2196534所述,或者可以是维生素,优选维生素B5,优选如WO2010018169所述,或者核黄素,优选如WO2017036903所述,或者可以是多肽,优选酶。
如本文所用的术语“感兴趣的多肽”是指打算在细菌宿主细胞中产生的任何蛋白、肽或其片段。因此,蛋白涵盖多肽、肽、其片段以及融合蛋白等。
优选地,感兴趣的化合物,优选感兴趣的多肽,由芽孢杆菌宿主细胞分泌。
优选地,感兴趣的多肽是酶,如胞外酶。胞外酶(或细胞外酶)是由宿主细胞分泌的酶。
在一特别优选的实施方案中,所述酶被分类为氧化还原酶(EC 1)、转移酶(EC 2)、水解酶(EC 3)、裂解酶(EC 4)、异构酶(EC 5)或连接酶(EC 6)。在一优选实施方案中,感兴趣的蛋白是适合用于洗涤剂、饲料和食品应用的酶。
最优选地,所述酶是水解酶(EC 3),优选糖苷酶(EC 3.2)或肽酶(EC 3.4)。特别优选的酶是选自淀粉酶(特别是α-淀粉酶(EC 3.2.1.1)、β-β淀粉酶(EC 3.2.1.2)、纤维素酶(EC 3.2.1.4)、内切-1,3-β-木聚糖酶木聚糖酶(EC 3.2.1.32)、内切-1,4-β-木聚糖酶(EC3.2.1.8)、乳糖酶(EC 3.2.1.108)、半乳糖苷酶(EC 3.2.1.23和EC 3.2.1.24)、甘露聚糖酶(EC 3.2.1.24和EC 3.2.1.25)、脂肪酶(EC 3.1.1.3)、植酸酶(EC 3.1.3.8)、核酸酶(EC3.1.11至EC 3.1.31)和蛋白酶(EC 3.4)的酶;特别是选自淀粉酶、蛋白酶、脂肪酶、甘露聚糖酶、植酸酶、木聚糖酶、磷酸酶、β-半乳糖苷酶、乳糖酶葡糖淀粉酶、核酸酶和纤维素酶的酶,优选淀粉酶、甘露聚糖酶、乳糖酶或蛋白酶,优选淀粉酶和蛋白酶。最优选的是丝氨酸蛋白酶(EC 3.4.21),优选枯草杆菌蛋白酶。
特别地,优选以下感兴趣的蛋白:
具有蛋白水解活性的酶称为“蛋白酶”或“肽酶”。蛋白酶是发挥“蛋白酶活性”或“蛋白水解活性”的活性蛋白。蛋白酶是EC 3.4类的成员。蛋白酶包括氨肽酶(EC 3.4.11)、二肽酶(EC 3.4.13)、二肽基-肽酶和三肽基-肽酶(EC 3.4.14)、肽基-二肽酶(EC 3.4.15)、丝氨酸型羧肽酶(EC 3.4.16)、金属羧肽酶(EC 3.4.17)、半胱氨酸型羧肽酶(EC 3.4.18)、ω肽酶(EC 3.4.19)、丝氨酸内肽酶(EC 3.4.21)、半胱氨酸内肽酶(EC 3.4.22)、天冬氨酸内肽酶(EC 3.4.23)、金属-内肽酶(EC 3.4.24)、苏氨酸内肽酶(EC 3.4.25)、催化机制未知的内肽酶(EC 3.4.99)。可商购的蛋白酶包括但不限于LavergyTMPro(BASF);DuralaseTM、DurazymTM、/>Ultra、/>Ultra、/> Ultra、/>Coro-/> Ultra、/>和/>(Novozymes A/S),以商品名Prime、Pura-fect/>Purafect/>Purafect/>Ex- 和/>(Dan-isco/DuPont)、AxapemTM(Gist-Brocases N.V.)出售的那些蛋白酶,迟缓芽孢杆菌碱性蛋白酶和来自Kao的KAP(嗜碱芽孢杆菌蛋白酶)。至少一种蛋白酶可以选自丝氨酸蛋白酶(EC3.4.21)。丝氨酸蛋白酶或丝氨酸肽酶(EC 3.4.21)的特征在于在催化活性位点具有丝氨酸,其在催化反应期间与底物形成共价加合物。丝氨酸蛋白酶可以选自胰凝乳蛋白酶(例如,EC 3.4.21.1)、弹性蛋白酶(例如,EC 3.4.21.36)、弹性蛋白酶(例如,EC 3.4.21.37或EC 3.4.21.71)、颗粒酶(例如,EC 3.4.21.78或EC 3.4.21.79)、激肽释放酶(例如,EC3.4.21.34、EC 3.4.21.35、EC 3.4.21.118或EC 3.4.21.119)、纤溶酶(例如,EC3.4.21.7)、胰蛋白酶(例如,EC 3.4.21.4)、凝血酶(例如,EC 3.4.21.5)和枯草杆菌蛋白酶(也称作枯草杆菌肽酶,例如,EC 3.4.21.62),后者在下文中也称作“枯草杆菌蛋白酶”。优选地,所述蛋白酶是迟缓芽孢杆菌碱性蛋白酶(BLAP)的蛋白酶变体,最优选包含取代R101E的BLAP(根据BPN的编号)。根据本发明的蛋白酶具有蛋白水解活性。确定蛋白水解活性的方法在文献中是众所周知的(参见例如Gupta et al.(2002),Appl.Microbiol.Bio-technol.60:381-395)。
因此,本发明涉及一种生产酶的方法,优选蛋白酶或淀粉酶,所述方法包括
a)提供修饰的芽孢杆菌宿主细胞,其包含如本文所述的改变的RemA蛋白和/或改变的RemB蛋白,
b)在所述修饰的芽孢杆菌宿主细胞上引入酶的表达盒,优选蛋白酶或淀粉酶,
b)在允许表达所述酶的条件下培养宿主细胞,以及
c)任选地从培养基分离所述酶。
优选的实施方案
1.一种修饰的芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌细胞。
2.实施方案1的修饰的芽孢杆菌宿主细胞,其中所述RemA蛋白的改变是由编码RemA蛋白的基因中的一个或多个点突变,优选一个或多个错义突变引起的,并且其中所述RemB蛋白的改变是由编码RemB蛋白的基因中的一个或多个点突变,优选一个或多个错义突变引起的。
3.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白和/或改变的RemB蛋白包含在保守氨基酸位置上的由一个或多个错义突变引起的一个或多个非保守突变。
4.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白优选包含在保守氨基酸位置上的一个或多个非保守突变,导致芽孢杆菌宿主细胞中RemA蛋白的失活。
5.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemB包含优选在保守氨基酸位置上的一个或多个非保守突变,导致芽孢杆菌宿主细胞中RemB蛋白的失活。
6.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中编码RemA蛋白的基因中的一个或多个错义点突变在编码RemA蛋白中保守氨基酸的位置,优选在对应于SEQ IDNO:21的氨基酸位置5-77的一个或多个氨基酸位置。
7.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在SEQ ID NO:21的氨基酸位置R18和/或P29。
8.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S中的至少一个。
9.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中编码RemB蛋白的基因中的一个或多个错义点突变在编码RemB蛋白中保守氨基酸的位置,优选在对应于SEQ IDNO:23的氨基酸位置4-71的一个或多个氨基酸位置。
10.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6,I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。
11.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述RemA和/或RemB蛋白的改变是RemA和/或RemB蛋白的失活。
12.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述宿主细胞属于物种嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、蜡样芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、球芽孢杆菌、耐盐芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、副地衣芽孢杆菌、巨大芽孢杆菌、甲醇芽孢杆菌、甲基营养型芽孢杆菌、摩加夫芽孢杆菌、短小芽孢杆菌、嗜热脂肪地芽孢杆菌(嗜热脂肪芽孢杆菌)、苏云金芽孢杆菌或贝莱斯芽孢杆菌,优选地衣芽孢杆菌。
13.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性,并且其中所述改变的RemB蛋白与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性。
14.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性,并且包含SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S中的至少一个,优选两个,优选其中所述改变的RemA蛋白与SEQ ID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性,并且包含SEQ ID NO:21的氨基酸位置R18和P29上的取代R18W和P29S中的至少一个,优选两个。
15.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含内源性remA和/或内源性remB基因的缺失或失活。
16.一种包含改变的RemA蛋白的修饰的芽孢杆菌宿主细胞,其中所述RemA蛋白的改变是由于编码RemA蛋白的基因中的一个或多个错义点突变,所述突变在编码RemA蛋白中保守氨基酸的位置,优选在对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌细胞,其中所述RemA蛋白的改变是RemA蛋白的失活,并且其中所述改变的RemA蛋白与SEQ ID NO:21、25、29、33或37,优选SEQ IDNO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性。
17.实施方案16的修饰的芽孢杆菌宿主细胞,其中所述修饰的芽孢杆菌宿主细胞中改变的RemA蛋白由引入芽孢杆菌宿主细胞的外源基因编码。
18.实施方案16或17中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含内源性remA基因的缺失或失活。
19.实施方案16-18中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含如本文所述的改变的RemB蛋白。
20.实施方案16-19中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含内源性remB基因的缺失或失活。
21.一种包含改变的RemB蛋白的修饰的芽孢杆菌宿主细胞,其中所述RemA蛋白的改变是由于编码RemA蛋白的基因中的一个或多个错义点突变,所述突变在编码RemB蛋白中保守氨基酸的位置,优选在对应于SEQ ID NO:23的氨基酸位置5-77的一个或多个氨基酸位置,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌细胞,其中所述RemB蛋白的改变是RemB蛋白的失活,并且其中所述RemA蛋白与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性。
22.实施方案21的修饰的芽孢杆菌宿主细胞,其中所述修饰的芽孢杆菌宿主细胞中改变的RemB蛋白由引入芽孢杆菌宿主细胞的外源基因编码。
23.实施方案21或22中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含内源性remB基因的缺失或失活。
24.实施方案21-23中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含如本文所述的改变的RemA蛋白。
25.实施方案21-24中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含内源性remA基因的缺失或失活。
26.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述修饰的芽孢杆菌宿主细胞是地衣芽孢杆菌宿主细胞。
27.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述宿主细胞包含表达盒,用于生产感兴趣的化合物,优选感兴趣的多肽。
28.实施方案27的修饰的芽孢杆菌宿主细胞,其中感兴趣的多肽是酶,如选自淀粉酶、蛋白酶、脂肪酶、磷脂酶、甘露聚糖酶、植酸酶、木聚糖酶、乳糖酶、磷酸酶、葡糖淀粉酶、核酸酶、半乳糖苷酶、内切葡聚糖酶和纤维素酶的酶,优选蛋白酶。
29.实施方案27或28中任一项的修饰的芽孢杆菌宿主细胞,其中与不包含改变的RemA蛋白和/或改变的RemB蛋白的芽孢杆菌对照细胞相比,所述修饰的芽孢杆菌宿主细胞包含增加的感兴趣的化合物产量。
30.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述修饰的芽孢杆菌宿主细胞包含如本文所述的改变的RemA蛋白和缺失的内源性RemB蛋白,或者其中所述修饰的芽孢杆菌宿主细胞包含如本文所述的改变的RemB蛋白和缺失的内源性RemA蛋白。
31.一种生产感兴趣的化合物,优选感兴趣的多肽的方法,包括
a)提供修饰的芽孢杆菌宿主细胞,其包含如本文所述的改变的RemA蛋白和/或改变的RemB蛋白,
b)在允许表达感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地从培养基分离感兴趣的化合物。
32.一种增加由芽孢杆菌细胞生产感兴趣的化合物,优选感兴趣的多肽的纯度的方法,包括
a)提供修饰的芽孢杆菌宿主细胞,其包含如本文所述的改变的RemA蛋白和/或改变的RemB蛋白,
b)在允许表达感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地从培养基分离感兴趣的化合物。
33.一种生产酶的方法,优选蛋白酶或淀粉酶,所述方法包括
a)提供修饰的芽孢杆菌宿主细胞,其包含如本文所述的改变的RemA蛋白和/或改变的RemB蛋白,优选地,其中所述的改变的RemA蛋白和/或改变的RemB蛋白包含在保守氨基酸位置上的一个或多个非保守氨基酸突变,优选失活突变。
b)在允许表达感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地从培养基分离感兴趣的化合物。
34.实施方案31-33中任一项的生产感兴趣的化合物的方法,其中所述芽孢杆菌宿主细胞选自嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、蜡样芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、球芽孢杆菌、耐盐芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、副地衣芽孢杆菌、巨大芽孢杆菌、甲醇芽孢杆菌、甲基营养型芽孢杆菌、摩加夫芽孢杆菌、短小芽孢杆菌、嗜热脂肪地芽孢杆菌(嗜热脂肪芽孢杆菌)、枯草芽孢杆菌、苏云金芽孢杆菌或贝莱斯芽孢杆菌,优选地衣芽孢杆菌。
35.一种改变的RemA或RemB蛋白,其中所述改变的RemA蛋白包含在SEQ ID NO:21的保守氨基酸位置上的一个或多个非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在SEQ ID NO:21的氨基酸位置R18和/或P29,并且其中所述改变的RemB蛋白包含在SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的一个或多个非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选SEQ ID NO:23的氨基酸位置G6、I19、S62、T67、L68和R71,最优选SEQ ID NO:23的氨基酸位置G6、T67、L68和R71。
36.实施方案35的改变的RemA蛋白和/或改变的RemB,其中在保守氨基酸位置上的非保守氨基酸取代是降低芽孢杆菌细胞中RemA蛋白和/或RemB蛋白功能的取代。
37.实施方案35或36中任一项的改变的RemA蛋白,其中所述改变的RemA蛋白与SEQID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%的序列相同性。
38.实施方案35或36中任一项的改变的RemB蛋白,其中所述改变的RemB蛋白与SEQID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%的序列相同性。
39.如本文所述的改变的RemA蛋白和/或改变的RemB蛋白在增加芽孢杆菌细胞产生感兴趣的化合物中的用途,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌细胞。
实施例
材料和方法
以下实施例仅用于说明本发明。对本领域技术人员显而易见的许多可能的变化也落在本发明的范围内。
除非另有说明,以下实验是通过应用如遗传工程和通过微生物培养发酵生产化合物中使用的标准设备、方法、化学品和生物化学品进行的。还参见Sambrook等人(Sambrook,J.and Russell,D.W.Molecular cloning.A laboratory manual,3rd ed,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY.2001)和Chmiel等人(Bioprocesstechnik 1.Einführung in die Bioverfahrenstechnik,Gustav FischerVerlag,Stuttgart,1991)。
电转感受态地衣芽孢杆菌细胞和电穿孔
通过电穿孔,如US5352604所述将DNA转化到地衣芽孢杆菌菌株中。电转感受态地衣芽孢杆菌细胞的制备和DNA的转化基本上如Brigidi等人(Brigidi,P.,Mateuzzi,D.(1991).Biotechnol.Techniques 5,5)所述进行,有以下修改:DNA转化后,将细胞在1mlLBSPG缓冲液中恢复并在37℃下温育60min(J.,1989,FEMS Microbio.Lett.,61:165-170),然后在选择性LB-琼脂平板上铺板。
为了克服地衣芽孢杆菌菌株的地衣芽孢杆菌特异性限制性修饰系统,如下所述从Ec#098细胞分离质粒DNA。
质粒分离
通过(Sambrook,J.and Russell,D.W.Molecular cloning.A laboratorymanual,3rd ed,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY.2001)中描述的标准分子生物学方法或碱性裂解方法(Birnboim,H.C.,Doly,J.(1979).NucleicAcids Res 7(6):1513-1523)从芽孢杆菌或大肠杆菌细胞分离质粒DNA。在细胞裂解之前,将芽孢杆菌细胞与在37C下用10mg/ml溶菌酶处理30min的大肠杆菌进行比较。
分子生物学方法和技术
分子生物学中的标准方法不限于芽孢杆菌和大肠杆菌微生物的培养、DNA的电穿孔、基因组和质粒DNA的分离、PCR反应、克隆技术,基本上如Sambrook和Rusell.(Sambrook,J.and Russell,D.W.Molecular cloning.A laboratory manual,3rd ed,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY.2001.)所述进行。
菌株
大肠杆菌菌株Ec#098
大肠杆菌菌株Ec#098是携带编码DNA-甲基转移酶的表达质粒pMDS003WO2019016051的大肠杆菌INV110菌株(Life technologies)。
地衣芽孢杆菌基因k.o菌株的产生
为了在如US5352604所述的地衣芽孢杆菌菌株及其衍生物中进行基因缺失,将缺失质粒转化到根据Chung的方法制备的感受态大肠杆菌菌株Ec#098中(Chung,C.T.,Niemela,S.L.,and Miller,R.H.(1989).One-step preparation of competentEscherichia coli:transformation and storage of bacterial cells in the same solution.Proc.Natl.Acad.Sci.U.S.A 86,2172-2175),然后在含有100μg/ml氨苄西林和30μg/ml氯霉素的LB-琼脂平板上于37℃下选择。从单个克隆中分离质粒DNA,并通过PCR分析来分析其正确性。分离的质粒DNA携带如WO2019016051所述的地衣芽孢杆菌的DNA甲基化模式,并且在转移到地衣芽孢杆菌中时免受降解。
aprE基因缺失菌株Bli#002
如上所述制备US5352604中所述的电转感受态的地衣芽孢杆菌细胞,用1μg分离自大肠杆菌Ec#098的pDel003 aprE基因缺失质粒转化,然后在30℃下涂布于含有5μg/ml红霉素的LB-琼脂平板上。
如下所述进行基因缺失过程:
使携带质粒的地衣芽孢杆菌细胞在具有5μg/ml红霉素的LB-琼脂平板上于45℃下生长,迫使缺失质粒通过Campbell重组整合到染色体中,pDel003的同源区之一与aprE基因的序列5’或3’同源。挑取克隆,在没有选择压力的LB-培养基中于45℃下培养6小时,然后在30℃下涂布于具有5μg/ml红霉素的LB-琼脂平板上。挑取单个克隆,用寡核苷酸SEQ ID 06和SEQ ID 07通过菌落-PCR分析aprE基因的成功缺失。挑取推定的缺失阳性单个克隆,在不含抗生素的LB培养基中于45℃下连续两次过夜培养以固化质粒,并且涂布在LB-琼脂平板上于30℃下过夜培养。将单克隆再次在具有5μg/ml红霉素的LB-琼脂平板上重新划线,并且通过菌落PCR分析aprE基因的成功缺失。分离出具有正确缺失的aprE基因的单个红霉素敏感克隆,命名为Bli#002。
amyB基因缺失菌株Bli#003
如上所述制备电转感受态的地衣芽孢杆菌Bli#002细胞,用1μg分离自大肠杆菌Ec#098的pDel004 amyB基因缺失质粒转化,然后在30℃下涂布于含有5μg/ml红霉素的LB-琼脂平板上。
如对aprE基因所述进行基因缺失过程。
用寡核苷酸SEQ ID 09和SEQ ID 10通过PCR分析amyB基因的缺失。将得到的具有缺失的aprE和缺失的amyB基因的地衣芽孢杆菌菌株命名为Bli#003。
sigF基因缺失菌株Bli#004
如上所述制备电转感受态的地衣芽孢杆菌Bli#003细胞,用1μg分离自大肠杆菌Ec#098的pDel005 sigF基因缺失质粒转化,然后在30℃下涂布于含有5μg/ml红霉素的LB-琼脂平板上。
如对aprE基因所述进行基因缺失过程。
用寡核苷酸SEQ ID 12和SEQ ID 13通过PCR分析sigF基因的缺失。将得到的具有缺失的aprE、缺失的amyB基因和缺失的sigF基因的地衣芽孢杆菌菌株命名为Bli#004。如所述(WO9703185)地衣芽孢杆菌菌株Bli#004不再能够产孢。
多聚γ谷氨酸合成基因缺失菌株Bli#008
如上所述制备电转感受态的地衣芽孢杆菌Bli#004细胞,用1μg分离自大肠杆菌Ec#098的pDel007 pga基因缺失质粒转化,然后在30℃下涂布于含有5μg/ml红霉素的LB-琼脂平板上。
如对aprE基因缺失所述进行基因缺失过程。
用寡核苷酸SEQ ID 15和SEQ ID 16通过PCR分析pga基因的缺失。将得到的具有缺失的aprE、缺失的amyB基因、缺失的sigF基因和缺失的pga基因簇的地衣芽孢杆菌菌株命名为Bli#008。
remA R18W P29S菌株Bli#030
如上所述制备电转感受态的地衣芽孢杆菌Bli#008细胞,用1μg分离自大肠杆菌Ec#098的pDel034 remA基因编辑质粒转化,然后在30℃下涂布于含有5μg/ml红霉素的LB-琼脂平板上。
如对aprE基因缺失所述进行基因缺失过程。
用ClaI限制性内切核酸酶进行限制性酶切割后,用寡核苷酸SEQ ID 18和SEQ ID19通过PCR分析remA基因的基因编辑。将得到的具有缺失的aprE、缺失的amyB基因、缺失的sigF基因、缺失的pga基因簇和突变的remA R18W P19S的地衣芽孢杆菌菌株命名为Bli#030。
质粒
pEC194RS-芽孢杆菌温度敏感缺失质粒
将质粒pE194(Villafane,et al(1987):J.Bacteriol.169(10),4822-4829)用具有侧翼PvuII位点的寡核苷酸SEQ ID 01和SEQ ID 02进行PCR扩增,用限制性内切核酸酶PvuII消化并连接至用限制性酶SmaI消化的载体pCE1中。pCE1是pUC18衍生物,其中氨苄西林抗性基因内的BsaI位点已通过沉默突变去除。将连接混合物转化到大肠杆菌DH10B细胞(Life technologies)中。将转化子涂布在含有100μg/ml氨苄西林的LB-琼脂平板上,在37C下培养过夜。从单个克隆中分离质粒DNA,并通过限制性消化分析其正确性。将得到的质粒命名为pEC194S。
从质粒pBSd141R(登录号:KY995200)(Radeck,J.,Mascher,T.2017;Sci.Rep.7:14134)PCR扩增II型组装mRFP盒,用寡核苷酸SEQ ID 03和SEQ ID 04,包含限制性位点BamHI的额外核苷酸。将PCR片段和pEC194S用限制性酶BamHI限制,然后连接并转化到大肠杆菌DH10B细胞(Life technologies)中。将转化子涂布在含有100μg/ml氨苄西林的LB-琼脂平板上,在37C下培养过夜。从单个克隆中分离质粒DNA,并通过限制性消化分析其正确性。得到的质粒pEC194RS携带mRFP盒,其开放阅读框与红霉素抗性基因的阅读框相反。
pDel003–aprE基因缺失质粒
地衣芽孢杆菌aprE基因的基因缺失质粒是用质粒pEC194RS和基因合成构建体SEQID 05构建的,基因合成构建体SEQ ID 05包含aprE基因的基因组区域5’和3’,侧翼是与pEC194RS相容的BsaI位点。如(Radeck et al.,2017)所述用限制性内切核酸酶BsaI进行II型组装,随后将反应混合物转化到大肠杆菌DH10B细胞(Life technologies)中。将转化子涂布在含有100μg/ml氨苄西林的LB-琼脂平板上,在37C下培养过夜。从单个克隆中分离质粒DNA,并通过限制性消化分析其正确性。将得到的aprE缺失质粒命名为pDel003。
pDel004–amyB基因缺失质粒
如对pDel003所述构建地衣芽孢杆菌amyB基因的基因缺失质粒,但是使用基因合成构建体SEQ ID 08,其包含amyB基因的基因组区域5’和3’,侧翼是与pEC194RS相容的BsaI位点。将得到的amyB缺失质粒命名为pDel004。
pDel005-sigF基因缺失质粒
如对pDel003所述构建地衣芽孢杆菌sigF基因(spoIIAC基因)的基因缺失质粒,但是使用基因合成构建体SEQ ID 11,其包含sigF基因的基因组区域5’和3’,侧翼是与pEC194RS相容的BsaI位点。将得到的sigF缺失质粒命名为pDel005。
pDel007–多聚γ-谷氨酸合成基因缺失质粒
如对pDel003所述构建用于缺失参与聚γ-谷氨酸(pga)产生的基因,即地衣芽孢杆菌的ywsC(pgsB)、ywtA(pgsC)、ywtB(pgsA)、ywtC(pgsE)的缺失质粒,但是使用基因合成构建体SEQ ID 14,其包含ywsC、ywtA(pgsC)、ywtB(pgsA)、ywtC(pgsE)基因侧翼的基因组区域5’和3’,侧翼是与pEC194RS相容的BsaI位点。将得到的pga缺失质粒命名为pDel007。
pDel034-remA功能缺失质粒
为了使RemA失活,地衣芽孢杆菌的野生型等位基因在其天然基因座上被remA基因的突变拷贝交换,导致表达具有组合功能缺失突变R18W和P29S的RemA(Winkelman,J.TKearns,D.B.(2009):Journal of bacteriology 191(12),S.3981–3991)。将具有5’和3’侧翼区域的侧翼是与pEC194RS相容的BsaI位点的remAR18W,P29S基因订购为基因合成构建体SEQ ID 17。如对pDel003所述构建基因编辑质粒。将得到的remA编辑质粒命名为pDel034。
实施例
实施例1:RemA和RemB内保守氨基酸位置的鉴定
感兴趣的蛋白序列中氨基酸的保守位置可以如下确定:
在第一步中,用感兴趣的序列和来自数据库的序列创建多序列比对,优选使用作用于UniRef30数据库(优选版本2020_06)的程序HHblits(优选版本3.3.0),使用默认参数。
HHblits是HH-套件(Steinegger M,Meier M,Mirdita M,H,Haunsberger S J,and/>J(2019)HH-suite3 for fast remote homology detectionand deep protein annotation,BMC Bioinformatics,473)的一部分,可以例如下载自https://github.com/soedinglab/hh-suite/。
数据库UniRef30(Mirdita M,von den Driesch L,Galiez C,Martin MJ,J,Steinegger M.Uniclust databases of clustered and deeply annotated proteinsequences and alignments.Nucleic Acids Res.2017Jan 4;45(D1):D170-D176.)可以例如下载自https://uniclust.mmseqs.com/。
为了便于对比对中的每个位置进行后续统计计算,还可以将得到的比对转化为FASTA格式。例如,可以用工具“reformat.pl”将A3M比对格式转化为FASTA格式,该工具也包括在HH-套件内,使用-r参数。
在第二步中,对于每个比对位置,信息含量(IC)值应当计算为值R_Sequence(l),如Schneider,T.D.;Stephens,R.M.Sequence Logos:A New Way to Display ConsensusSequences.Nucleic Acids Res.1990,18(20),6097–6100所述,使用氨基酸序列的20种状态。
保守位置被定义为具有2.0或更高的信息含量。
表1列出了参考RemA的查询序列(SEQ ID 21)在氨基酸位置的多序列比对(MAS)的IC值。
/>
/>
Pos.=位置
AA=氨基酸
IC=信息含量
C.=IC>2.0的保守氨基酸;用*(星号)标记
MAS.=多序列比对
表2列出了参考RemB查询序列(SEQ ID 23)在氨基酸位置的多序列比对(MAS)的IC值。
/>
/>
实施例2:地衣芽孢杆菌酶表达菌株的产生
如上所述将表3中所列的地衣芽孢杆菌菌株制备感受态。从枯草芽孢杆菌Bs#056菌株(WO2019016051)分离蛋白酶表达质粒pUK56(WO2019016051),以携带地衣芽孢杆菌特异性DNA甲基化模式。在所示菌株中转化质粒,并涂布在具有20μg/μl卡那霉素的LB-琼脂平板上。通过限制性消化分析单个克隆的质粒DNA正确性,并且通过将单个克隆转移到具有1%脱脂奶的LB-平板上以清除蛋白酶生成菌株的区域形成来评估功能酶的表达。得到的地衣芽孢杆菌表达菌株列于表1中。
表3:地衣芽孢杆菌表达菌株概述
地衣芽孢杆菌表达菌株 表达质粒 地衣芽孢杆菌菌株
BES#130 pUK56 Bli#008
BES#131 pUK56 Bli#030
实施例3:地衣芽孢杆菌蛋白酶表达菌株的培养
使用化学成分确定的发酵培养基在发酵过程中培养来自实施例2的地衣芽孢杆菌菌株。
在发酵过程中提供以下常量元素:
在发酵过程中提供以下微量元素:
用含有8g/l葡萄糖的培养基开始发酵。使用含有50%葡萄糖的溶液作为进料溶液。在发酵期间使用氨调整pH。在两个实验中,添加的化学成分确定的碳源总量保持在每升初始培养基200g以上。在有氧条件下进行发酵,持续时间超过70小时。
在发酵过程结束时,取出样品并通过光度法测定蛋白酶活性:通过使用琥珀酰-Ala-Ala-Pro-Phe-对硝基酰苯胺(Suc-AAPF-pNA,短AAPF;参见例如DelMar et al.(1979),Analytical Biochem 99,316-320)作为底物来测定蛋白水解活性。通过在30℃,pH8.6TRIS缓冲液中进行蛋白水解切割,将pNA从底物分子上切割下来,导致释放黄色的游离pNA,通过在OD405处测量进行定量。
通过将产物滴度除以每最终反应器体积添加的葡萄糖量来计算蛋白酶产量。将菌株BES#130的蛋白酶产量设定为100%,菌株BFS#131的蛋白酶产量相应地参考BES#130(表4)。与地衣芽孢杆菌表达菌株BES#130相比,具有突变的remA基因(导致包含突变R18W和P29S的改变的RemA蛋白)的地衣芽孢杆菌表达菌株BES#131的蛋白酶产量提高了10%。
表4地衣芽孢杆菌表达菌株的蛋白酶产量
地衣芽孢杆菌表达菌株 蛋白酶产量[%]
BES#130 100
BES#131 110
表5:不同生物体的RemA和RemB的基因名称、蛋白名称和序列
/>
/>
序列表
<110> 巴斯夫欧洲公司
<120> 具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞
<130> 210448WO01
<160> 39
<170> According Wipo Std 25
<210> 1
<211> 32
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of pE194
<400> 1
tatatacagc tggattcaca aaaaataggc ac 32
<210> 2
<211> 33
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of pE194
<400> 2
tatatacagc tggattatgt cttttgcgca gtc 33
<210> 3
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of functional mRFP
cassette
<400> 3
tatatggatc cgtaatcagg gtatcgaggc 30
<210> 4
<211> 31
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of functional mRFP
cassette
<400> 4
tatatggatc cctcattagg cgggctacta a 31
<210> 5
<211> 1027
<212> DNA
<213> Artificial sequence
<220>
<223> Homology region of the fusion of 5-prime and 3-prime
regions of aprE gene with flanking BsaI sites
<400> 5
ggtctcgacc cgaagttctt ttttaacata taggtaaaac aatacgaaaa aaggcgccaa 60
gtattgaaga attgcagcag ccgcggcatt tcccttttcg attgaagcaa aaaacgtata 120
ttgaacagta agcattccaa aaatggaaaa tactaaaatc gaacaaatat ctgttttttt 180
cttccatatc tgacacacat gttgaaaacc gtttttcatt gaaacatata acaagagaat 240
gactcccgat gccagaagcc tgacagagac aagcgagccg gcttcaaccg ctcccctttc 300
aaatatgtac tgtgcagcgc ttcccgataa tccccacaat gaagcccctg caagcaccat 360
caatacgcct ttcacatgag ctgatttcat atctttcacc cgtttctgta tgcgatatat 420
tgcatatttt aatagatgat cgacaaggcc gcaacctcct tcggcaaaaa atgatctcat 480
aaaataaatg aatagtattt tcataaaatg agctcaataa catattctaa caaatagcat 540
atagaaaaag ctagtgtttt tagcactagc tttttcttca ttctgatgaa ggttgttcaa 600
tattttgaat ccgttccatg atcgtcggat ggccgtattt aaaaatcttg acgagaaacg 660
gcgggtttgc ctcgctcagc ccggcttttg agagctcttg aaacgtcgaa accgctgcat 720
cgctgttttg cgtcagttca atcgcatact ggtcagcagc tttttcctga tgcctcgaaa 780
ctgcgttcgt aaatggagac gacgcgaaag agatgacccc catcagcatc agaagaagcg 840
gaagtgcggc tagatcggat tttcctgcaa tatgaaggct tcttccatag cggccgatga 900
tccgcttgta cagcttgtcg atcacataaa agacagcaag ggataaaagc agatacccgc 960
caagtcctat gtaaacatgc ttcatcacat agtgccccat ttcgtgcgcc atgatgctca 1020
ggagacc 1027
<210> 6
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of aprE genomic region
<400> 6
ccggttgtca ttgatccttt a 21
<210> 7
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of aprE genomic region
<400> 7
atcctcctgc aaaaaccgta t 21
<210> 8
<211> 1022
<212> DNA
<213> Artificial sequence
<220>
<223> Homology region of the fusion of 5-prime and 3-prime
regions of amyB gene with flanking BsaI sites
<400> 8
ggtctcgacc cacaaggctg tcaaacgaaa aagcgtatca ggagattaac gacacgcaag 60
aaatgatcga aaaaatcagc ggacacctgc ctgtacactt gcgtcctcca tacggcggga 120
tcaatgattc cgtccgctcg ctttccaatc tgaaggtttc attgtgggat gttgatccgg 180
aagattggaa gtacaaaaat aagcaaaaga ttgtcaatca tgtcatgagc catgcgggag 240
acggaaaaat cgtcttaatg cacgatattt atgcaacgtc cgcagatgct gctgaagaga 300
ttattaaaaa gctgaaagca aaaggctatc aattggtaac tgtatctcag cttgaagaag 360
tgaagaagca gagaggctat tgaataaatg agtagaaagc gccatatcgg cgcttttctt 420
ttggaagaaa atatagggaa aatggtattt gttaaaaatt cggaatattt atacaatatc 480
atatgtttca cattgaaagg ggaggagaat ctagaagagc agagaggacg gatttcctga 540
aggaaatccg tttttttatt ttgcccgtct tataaatttc tttgattaca ttttataatt 600
aattttaaca aagtgtcatc agccctcagg aaggacttgc tgacagtttg aatcgcatag 660
gtaaggcggg gatgaaatgg caacgttatc tgatgtagca aagaaagcaa atgtgtcgaa 720
aatgacggta tcgcgggtga tcaatcatcc tgagactgtg acggatgaat tgaaaaagct 780
tgttcattcc gcaatgaagg agctcaatta tataccgaac tatgcagcaa gagcgctcgt 840
tcaaaacaga acacaggtcg tcaagctgct catactggaa gaaatggata caacagaacc 900
ttattatatg aatctgttaa cgggaatcag ccgcgagctg gaccgtcatc attatgcttt 960
gcagcttgtc acaaggaaat ctctcaatat cggccagtgc gacggcatta tctcaggaga 1020
cc 1022
<210> 9
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of amyB genomic region
<400> 9
agaagcatga agggcatgcg ac 22
<210> 10
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of amyB genomic region
<400> 10
caacaacagg ctgtctgacg g 21
<210> 11
<211> 1022
<212> DNA
<213> Artificial sequence
<220>
<223> Homology region of the fusion of 5-prime and 3-prime
regions of sigF gene with flanking BsaI sites
<400> 11
ggtctcgacc caaaatcatt cgccttgagc aatcagagca gcgtgcactt gaaacgttgg 60
gggtggcgtc atgaaaaatg aaatgaacat tcagtttaca gcgctcagcc aaaatgaatc 120
gtttgcacgg gtgacagtcg ctgcttttat cgctcagctt gacccgacga tggatgaact 180
gaccgaaatt aaaacggtcg tatccgaagc ggtcacaaac gcgatcattc acggttatga 240
aaactcaggg cagggaaacg tatatatttc cgtcactctc gaggaccata ttgtctattt 300
aacgatccgc gacgaaggag tcggcatccc tgatcttgaa gaagcgcgcc agcccctgtt 360
cacgacaaag cctgaactcg agcggtcggg aatgggcttt acgatcatgg aaaatttcat 420
ggatgatatt tcgatcgact cctcacctga gatgggaacc acaatacact taacaaagca 480
cttatcaaaa agcaaagcgc tttgcaatta atgaggctgc tcatgttgca ggcagcctcg 540
gatgtccgat gaaaaaccgg acgctcttgg gagcgttccg gttttttttg tgtggtaatt 600
tatggtcttt tgcgcctttc tgaatgataa atgggatgta cttcatacta caactataac 660
catcatatag gaagtgaccc agatggaacg tcaagttttt atcagactcc gccaccggct 720
tgaggcagat ccggatgaat tgattttgct cggccatatc gcacaggtag cgggtgaccg 780
cggatacaaa gaaaagcttg aacggctgcc tatttatcag gtcagcaaag cggatcaaag 840
catggtggtg ctggacgtga tgaaggtgat tgaagctgta cataaatcgt ttcctgacct 900
tgatgtccaa accgtcggcg gttctgaaac catcgtggag atccaatatc cgaaaagggg 960
tctgtcgccc gtgcttttca tcgccgtctg gctgctcttg ttcgtcggtg cctcaggaga 1020
cc 1022
<210> 12
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of sigF genomic region
<400> 12
agcagctcgg cggagaaat 19
<210> 13
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of sigF genomic region
<400> 13
accttgcccg tcaccatttc g 21
<210> 14
<211> 1363
<212> DNA
<213> Artificial sequence
<220>
<223> Homology region of the fusion of 5-prime and 3-prime
regions of pga genes with flanking BsaI sites
<400> 14
ggtctcgacc cgaacactga aattttagac cgggctggga tatcgagaca tatatagggg 60
cgtttaatgg cgaatacagt aacaatgaga atagtaagaa aaattaaaaa tgttaaagtt 120
tgatgaatta tcattgaaaa aaattaatgg ctttttaaat cctaggattt taacctaaaa 180
tctgaagaaa taaggtggat cgaacgactc acaaaatatt tggatttgtc aatgaatccc 240
gctttatgct aaaagagatt ttcatttttt gatagatggt ctgattgtca taggacggat 300
ttgttttgaa gagggaacat tggtgacttt ttaacctgtt cgaaaagagc gaaaatacta 360
aaagaaaaga gacatcccgg ctgacagccc atttaaaggg gattgcggcc gggggaaaaa 420
agagatcctg aatccatcct tcaacctttc atctgaaata gggagaaaag tacaaaaatc 480
ataatgtcga attttgaaag cgcatactta aaacgctgac aaaaatctga taggaattaa 540
gaactttcga tttccaaaaa tatcaataaa aagataggca ttaatgactc gggcgaggtg 600
atctttgtca cggaaaattt cgtcgtcttc tgttacataa tgccgattgt gatttcatag 660
tgaaccctga tcccggttat aaaagacctg tgaaaagcgg ccggtttgaa agggaaacac 720
gacaattttc ttaaccggtc agtgtataaa gttttataga aaatcaggag gatatataca 780
tggttttggg gttcatgttt attgtattct tttgaaggga ataaaaactg acaaatttcg 840
actgaagcaa aatttgaaaa tgcatcacct taccaattcg ggatgggaac cgcacctcat 900
gttcatgacc tctttagaat atttcccttc atctttttaa tccgcgctta ggtgaaaaag 960
ctgatcatgc tgtgctgagc gtttcttctc gctatgacgc tgctgtacat gcaaaaaaag 1020
tcctttaaat atcccagttg aatgacgatg aaagaggaaa gaagaggagg aacagatcaa 1080
ttgataaaaa aagcggcaaa caaaaagttg gttttgtttt gtggaattgc ggtgctttgg 1140
atgtctttat ttttaacgaa tcataatgat gtacgcgccg atacgatcgg cgagaaaata 1200
gcggaaactg ccagacagct tgagggtgcg aaatacagct acggcggaga gaagccgaaa 1260
acggggtttg actcgtcagg ctttgtgcaa tatgtgtttc aatcgctcga tattacgctt 1320
ccgagaacgg taaaggaaca atcgactctt ggctcaggag acc 1363
<210> 15
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of pga genomic region
<400> 15
aaagccttct cctctctatt 20
<210> 16
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of pga genomic region
<400> 16
ttcttgaaaa agacaaggtc 20
<210> 17
<211> 794
<212> DNA
<213> Artificial sequence
<220>
<223> Homology regions of gene synthesis HomA + HomB remA R18W,
P29S
<400> 17
ggtggtctct acccaagtcg cactgtttgc agaccgttcg gatatcacgg aagaagtgac 60
gaggctgaaa agccatttcc gccagttccg cgatatttgc aaagcgggag gagccgcggg 120
gagaaagctc gatttcctcg tccaggagct caaccgtgaa gcgaacacga tcggttcaaa 180
agcgaatgat caccagatca caaaacatgt ggtcgaaatg aaaagctcta ttgaaaaaat 240
aaaagaacaa gtgcaaaata tagaatagcg attgtgcgta ttgtttacgg atgttctctg 300
caggttaaac tagagacgtc caagtacagg gggaacgtat aggatgacga ttaaactgat 360
caatatcggc tttggaaata tcatatccgc gaattggctg atctcgattg tgagtcctga 420
gtccgcatcg attaagcgga tgatccagga tgcccgcgac agaggcatgc ttatagatgc 480
tacatatgga agaagaaccc gtgcggttgt cattatggac agtgaccata tcatcttatc 540
tgccgtccag cctgagacag tagcacaaag gctttccgtt aaagaagaaa ttatggatga 600
agggcaggga taagagcttt atgaaagaaa gaggtttgtt aatcgttctc tccggccctt 660
ccggcgtcgg aaaaggaaca gtcaggcagg cgctgtttgc tcaggaggac acaaaatttg 720
aatattcgat ttcggtgacg acaagaaaac cgcgtcaagg cgaaagagac ggcgtcgact 780
ctcaagagac cacc 794
<210> 18
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of remA genomic region
<400> 18
tccaggttga ctggccgctg cttg 24
<210> 19
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of remA genomic region
<400> 19
tttcaattcg gcgaggctcg gagg 24
<210> 20
<211> 270
<212> DNA
<213> Bacillus licheniformis
<220>
<223> CDS of ylzA (remA), strain ATCC 14580
<400> 20
atgacgatta aactgatcaa tatcggcttt ggaaatatca tatccgcgaa tcggctgatc 60
tcgattgtga gtcctgagtc cgcgcctatt aagcggatga tccaggatgc cagagaccgc 120
ggcatgctta tagatgctac atatggaaga agaacccgtg cggttgtcat tatggacagt 180
gaccatatca tcttatctgc cgtccagcct gagacagtag cacaaaggct ttccgttaaa 240
gaagaaatta tggatgaagg gcagggataa 270
<210> 21
<211> 89
<212> PRT
<213> Bacillus licheniformis
<220>
<223> Protein of RemA, strain ATCC 14580
<400> 21
Met Thr Ile Lys Leu Ile Asn Ile Gly Phe Gly Asn Ile Ile Ser Ala
1 5 10 15
Asn Arg Leu Ile Ser Ile Val Ser Pro Glu Ser Ala Pro Ile Lys Arg
20 25 30
Met Ile Gln Asp Ala Arg Asp Arg Gly Met Leu Ile Asp Ala Thr Tyr
35 40 45
Gly Arg Arg Thr Arg Ala Val Val Ile Met Asp Ser Asp His Ile Ile
50 55 60
Leu Ser Ala Val Gln Pro Glu Thr Val Ala Gln Arg Leu Ser Val Lys
65 70 75 80
Glu Glu Ile Met Asp Glu Gly Gln Gly
85
<210> 22
<211> 243
<212> DNA
<213> Bacillus licheniformis
<220>
<223> CDS of yaaB (remB), strain ATCC 14580
<400> 22
ttgtatatcc acttaggtga cgattttgtc gtctcaacgc gtgaaattgt ggctattttt 60
gattacaagg caaagacatc gccgattgtt gaggagtttt taagcaagca aaaacagcgg 120
attgtctctt ctaacagcac gccgaagtca attgttgtca cattacaatc gatttatttt 180
tctcctttag cctcaggcac gttgaaaaaa cgggcgcaat ccaagccgga aatcgattca 240
taa 243
<210> 23
<211> 80
<212> PRT
<213> Bacillus licheniformis
<220>
<223> Protein of RemB, strain ATCC 14580
<400> 23
Met Tyr Ile His Leu Gly Asp Asp Phe Val Val Ser Thr Arg Glu Ile
1 5 10 15
Val Ala Ile Phe Asp Tyr Lys Ala Lys Thr Ser Pro Ile Val Glu Glu
20 25 30
Phe Leu Ser Lys Gln Lys Gln Arg Ile Val Ser Ser Asn Ser Thr Pro
35 40 45
Lys Ser Ile Val Val Thr Leu Gln Ser Ile Tyr Phe Ser Pro Leu Ala
50 55 60
Ser Gly Thr Leu Lys Lys Arg Ala Gln Ser Lys Pro Glu Ile Asp Ser
65 70 75 80
<210> 24
<211> 270
<212> DNA
<213> Bacillus subtilis
<220>
<223> CDS of ylzA (remA)
<400> 24
atgacgatta aactgattaa tatcggattt ggcaatatca tctccgccaa tcggatgatt 60
tcgattgtca gcccggagtc tgcgccaatc aaacggatga ttcaggatgc aagagaccgc 120
ggaatgctaa ttgacgctac atacggacga agaacccgtg cagttgtcgt catggatagt 180
gatcacatta tcttatctgc cgtccagcct gagacagttg cacacagact ttctgttaaa 240
gaagaaatta tggatgaagg gcaggggtaa 270
<210> 25
<211> 89
<212> PRT
<213> Bacillus subtilis
<220>
<223> Protein of RemA
<400> 25
Met Thr Ile Lys Leu Ile Asn Ile Gly Phe Gly Asn Ile Ile Ser Ala
1 5 10 15
Asn Arg Met Ile Ser Ile Val Ser Pro Glu Ser Ala Pro Ile Lys Arg
20 25 30
Met Ile Gln Asp Ala Arg Asp Arg Gly Met Leu Ile Asp Ala Thr Tyr
35 40 45
Gly Arg Arg Thr Arg Ala Val Val Val Met Asp Ser Asp His Ile Ile
50 55 60
Leu Ser Ala Val Gln Pro Glu Thr Val Ala His Arg Leu Ser Val Lys
65 70 75 80
Glu Glu Ile Met Asp Glu Gly Gln Gly
85
<210> 26
<211> 246
<212> DNA
<213> Bacillus subtilis
<220>
<223> CDS of yaaB (remB)
<400> 26
ttgtatattc atttaggtga tgactttgtg gtttcaacac gagatattgt cggcattttt 60
gactttaaag ccaacatgtc gcctattgtt gaagaatttc tgaaaaaaca gaaacacaag 120
gtggtgcctt ccgtaaacgg cacgcccaaa tctatcgtag tcacggttca gaatatatat 180
tactctccct tatcttccag cacattaaaa aaacgtgcgc aatttatgtt tgaaatagat 240
tcttag 246
<210> 27
<211> 81
<212> PRT
<213> Bacillus subtilis
<220>
<223> Protein of RemB
<400> 27
Met Tyr Ile His Leu Gly Asp Asp Phe Val Val Ser Thr Arg Asp Ile
1 5 10 15
Val Gly Ile Phe Asp Phe Lys Ala Asn Met Ser Pro Ile Val Glu Glu
20 25 30
Phe Leu Lys Lys Gln Lys His Lys Val Val Pro Ser Val Asn Gly Thr
35 40 45
Pro Lys Ser Ile Val Val Thr Val Gln Asn Ile Tyr Tyr Ser Pro Leu
50 55 60
Ser Ser Ser Thr Leu Lys Lys Arg Ala Gln Phe Met Phe Glu Ile Asp
65 70 75 80
Ser
<210> 28
<211> 270
<212> DNA
<213> Bacillus pumilus
<220>
<223> CDS of ylzA (remA)
<400> 28
atgaccataa agttgatcaa tatcggattt ggaaacatca tttcagcgaa tcggatgatt 60
tcgatcgtca gtccggaatc agcaccgatt aaacgaatga tacaagacgc aagagatcga 120
ggcatgctca tagatgctac ttacggaaga agaacccgtg ctgttgtcat tatggacagt 180
gaccatgtca tcttatctgc cgttcagcct gagactgtcg cgcaaagact ttctgtaaaa 240
gaagaaatca tagatgaagg gcaggggtaa 270
<210> 29
<211> 89
<212> PRT
<213> Bacillus pumilus
<220>
<223> Protein of RemA
<400> 29
Met Thr Ile Lys Leu Ile Asn Ile Gly Phe Gly Asn Ile Ile Ser Ala
1 5 10 15
Asn Arg Met Ile Ser Ile Val Ser Pro Glu Ser Ala Pro Ile Lys Arg
20 25 30
Met Ile Gln Asp Ala Arg Asp Arg Gly Met Leu Ile Asp Ala Thr Tyr
35 40 45
Gly Arg Arg Thr Arg Ala Val Val Ile Met Asp Ser Asp His Val Ile
50 55 60
Leu Ser Ala Val Gln Pro Glu Thr Val Ala Gln Arg Leu Ser Val Lys
65 70 75 80
Glu Glu Ile Ile Asp Glu Gly Gln Gly
85
<210> 30
<211> 255
<212> DNA
<213> Bacillus pumilus
<220>
<223> CDS of yaaB (remB)
<400> 30
gtgtgggtct tgtatattca tttaggtgat gattgtgttg tttctacacg agagattgtc 60
gcaattgttg attacaaaat gaggtcgtct tctgttgtag aagagtttct tcaaaaacaa 120
gaaggacaaa tcatttcgtt atcacaaggg acacccaaat ccatcgtcgt cacaactaaa 180
tctgtttatt actctcctct ttcctcaagc acgctcaaaa aacgtgcttc atttgtgatt 240
gaaattgaag tctaa 255
<210> 31
<211> 84
<212> PRT
<213> Bacillus pumilus
<220>
<223> Protein of RemB
<400> 31
Met Trp Val Leu Tyr Ile His Leu Gly Asp Asp Cys Val Val Ser Thr
1 5 10 15
Arg Glu Ile Val Ala Ile Val Asp Tyr Lys Met Arg Ser Ser Ser Val
20 25 30
Val Glu Glu Phe Leu Gln Lys Gln Glu Gly Gln Ile Ile Ser Leu Ser
35 40 45
Gln Gly Thr Pro Lys Ser Ile Val Val Thr Thr Lys Ser Val Tyr Tyr
50 55 60
Ser Pro Leu Ser Ser Ser Thr Leu Lys Lys Arg Ala Ser Phe Val Ile
65 70 75 80
Glu Ile Glu Val
<210> 32
<211> 270
<212> DNA
<213> Bacillus velezensis
<220>
<223> CDS of ylzA (remA)
<400> 32
atgacgatta aactgattaa tatcggattt ggcaatatca tctccgccaa tcggatgatt 60
tcgattgtca gcccggagtc tgcgccaata aagcgaatga tccaggatgc aagagaccgc 120
ggaatgctaa tagacgctac atacggacga agaacccgtg cagttgtcgt catggatagt 180
gatcacatta tcttatctgc cgtccagcct gagacagttg cacacagact ttctgtgaaa 240
gaagaaatta tggatgaagg gcaggggtaa 270
<210> 33
<211> 89
<212> PRT
<213> Bacillus velezensis
<220>
<223> Protein of RemA
<400> 33
Met Thr Ile Lys Leu Ile Asn Ile Gly Phe Gly Asn Ile Ile Ser Ala
1 5 10 15
Asn Arg Met Ile Ser Ile Val Ser Pro Glu Ser Ala Pro Ile Lys Arg
20 25 30
Met Ile Gln Asp Ala Arg Asp Arg Gly Met Leu Ile Asp Ala Thr Tyr
35 40 45
Gly Arg Arg Thr Arg Ala Val Val Val Met Asp Ser Asp His Ile Ile
50 55 60
Leu Ser Ala Val Gln Pro Glu Thr Val Ala His Arg Leu Ser Val Lys
65 70 75 80
Glu Glu Ile Met Asp Glu Gly Gln Gly
85
<210> 34
<211> 246
<212> DNA
<213> Bacillus velezensis
<220>
<223> CDS of yaaB (remB)
<400> 34
ttgtatattc atttaggtga cgactttgtc gtttcaacac gcgatatcgt cggcattttt 60
gactgcaagg tcaatgtatc gccgattgtt gaagaatttc tggacagaca gaaagaaaaa 120
gtagtgccgt ccgtaaacgg cacgccaaag tctatcgtag tcacgactga gaatatatat 180
tactctccct tatcttccgg cacactgaag aaacgtgcgc aatttatgtt agaaatagat 240
tcttag 246
<210> 35
<211> 81
<212> PRT
<213> Bacillus velezensis
<220>
<223> Protein of RemB
<400> 35
Met Tyr Ile His Leu Gly Asp Asp Phe Val Val Ser Thr Arg Asp Ile
1 5 10 15
Val Gly Ile Phe Asp Cys Lys Val Asn Val Ser Pro Ile Val Glu Glu
20 25 30
Phe Leu Asp Arg Gln Lys Glu Lys Val Val Pro Ser Val Asn Gly Thr
35 40 45
Pro Lys Ser Ile Val Val Thr Thr Glu Asn Ile Tyr Tyr Ser Pro Leu
50 55 60
Ser Ser Gly Thr Leu Lys Lys Arg Ala Gln Phe Met Leu Glu Ile Asp
65 70 75 80
Ser
<210> 36
<211> 270
<212> DNA
<213> Bacillus amyloliquefaciens
<220>
<223> CDS of ylzA (remA)
<400> 36
atgacgatta aactgattaa tatcggattt ggcaatatca tctccgccaa tcggatgatt 60
tcgattgtca gcccggagtc tgcgccaata aagcgaatga ttcaggatgc aagagaccgc 120
ggaatgctaa tagacgctac atacggacga agaacccgtg cagttgtcgt catggatagt 180
gatcacatta tcttatctgc cgtccagcct gagacagttg cacacagact ttctgtgaaa 240
ggagaaatta tggatgaagg gcaggggtaa 270
<210> 37
<211> 89
<212> PRT
<213> Bacillus amyloliquefaciens
<220>
<223> Protein of RemA
<400> 37
Met Thr Ile Lys Leu Ile Asn Ile Gly Phe Gly Asn Ile Ile Ser Ala
1 5 10 15
Asn Arg Met Ile Ser Ile Val Ser Pro Glu Ser Ala Pro Ile Lys Arg
20 25 30
Met Ile Gln Asp Ala Arg Asp Arg Gly Met Leu Ile Asp Ala Thr Tyr
35 40 45
Gly Arg Arg Thr Arg Ala Val Val Val Met Asp Ser Asp His Ile Ile
50 55 60
Leu Ser Ala Val Gln Pro Glu Thr Val Ala His Arg Leu Ser Val Lys
65 70 75 80
Gly Glu Ile Met Asp Glu Gly Gln Gly
85
<210> 38
<211> 246
<212> DNA
<213> Bacillus amyloliquefaciens
<220>
<223> CDS of yaaB (remB)
<400> 38
ttgtatattc atttaggtga cgactttgtc gtttcaacac gcgatatcgt cggcattttt 60
gactgcaagg tcaatgtatc gccgatcgtt gaagaatttc tggacagaca gaaagaaaaa 120
gtagtgccgt ccgtaaatgg cacaccaaag tctatcgtag tcacgactga gaatatatat 180
tactctccct tatcttccgg cacactgaag aaacgtgcgc aatttatgtt agaaatagat 240
tcttag 246
<210> 39
<211> 81
<212> PRT
<213> Bacillus amyloliquefaciens
<220>
<223> Protein of RemB
<400> 39
Met Tyr Ile His Leu Gly Asp Asp Phe Val Val Ser Thr Arg Asp Ile
1 5 10 15
Val Gly Ile Phe Asp Cys Lys Val Asn Val Ser Pro Ile Val Glu Glu
20 25 30
Phe Leu Asp Arg Gln Lys Glu Lys Val Val Pro Ser Val Asn Gly Thr
35 40 45
Pro Lys Ser Ile Val Val Thr Thr Glu Asn Ile Tyr Tyr Ser Pro Leu
50 55 60
Ser Ser Gly Thr Leu Lys Lys Arg Ala Gln Phe Met Leu Glu Ile Asp
65 70 75 80
Ser

Claims (18)

1.一种修饰的芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌(Bacillus subtilis)细胞。
2.权利要求1的修饰的芽孢杆菌宿主细胞,其中所述RemA蛋白的改变是由编码RemA蛋白的基因中的一个或多个点突变,优选一个或多个错义突变引起的,并且其中所述RemB蛋白的改变是由编码RemB蛋白的基因中的一个或多个点突变,优选一个或多个错义突变引起的。
3.权利要求2的修饰的芽孢杆菌宿主细胞,其中编码RemA蛋白的基因中的一个或多个错义点突变在编码RemA蛋白中保守氨基酸的位置,优选在对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置。
4.权利要求3的修饰的芽孢杆菌宿主细胞,其中编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,优选地,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在选自对应于SEQ ID NO:21的R18和P29的氨基酸位置的一个或多个氨基酸位置。
5.权利要求2的修饰的芽孢杆菌宿主细胞,其中编码RemB蛋白的基因中的一个或多个错义点突变在编码RemB蛋白中保守氨基酸的位置,优选在对应于SEQ ID NO:23的氨基酸位置4-71的一个或多个氨基酸位置。
6.权利要求5的修饰的芽孢杆菌宿主细胞,其中编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选地,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。
7.前述权利要求中任一项的修饰的芽孢杆菌宿主细胞,其中所述RemA和/或RemB蛋白的改变是RemA和/或RemB蛋白的失活。
8.前述权利要求中任一项的修饰的芽孢杆菌宿主细胞,其中所述宿主细胞属于物种嗜碱芽孢杆菌(Bacillus alcalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、蜡样芽孢杆菌(Bacillus cereus)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillus firmus)、球芽孢杆菌(Bacillus globigii)、耐盐芽孢杆菌(Bacillus halodurans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、副地衣芽孢杆菌(Bacillus paralicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、甲醇芽孢杆菌(Bacillus methanolicus)、甲基营养型芽孢杆菌(Bacillus methylotrophicus)、摩加夫芽孢杆菌(Bacillus mojavensis)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)(嗜热脂肪芽孢杆菌(Bacillusstearothermophilus))、苏云金芽孢杆菌(Bacillus thuringiensis)或贝莱斯芽孢杆菌(Bacillus velezensis),优选地衣芽孢杆菌。
9.前述权利要求中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少60%、但低于100%序列相同性,并且其中所述改变的RemB蛋白与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少60%、但低于100%序列相同性。
10.前述权利要求中任一项的修饰的芽孢杆菌宿主细胞,其中所述宿主细胞包含表达盒,用于生产感兴趣的化合物,优选感兴趣的多肽。
11.权利要求10的修饰的芽孢杆菌宿主细胞,其中感兴趣的多肽是酶,如选自淀粉酶、蛋白酶、脂肪酶、磷脂酶、甘露聚糖酶、植酸酶、木聚糖酶、乳糖酶、磷酸酶、葡糖淀粉酶、核酸酶、半乳糖苷酶、内切葡聚糖酶和纤维素酶的酶。
12.权利要求10或11的修饰的芽孢杆菌宿主细胞,其中与不包含改变的RemA蛋白和/或改变的RemB蛋白的芽孢杆菌对照细胞相比,所述修饰的芽孢杆菌宿主细胞包含增加的感兴趣的化合物产生。
13.一种生产感兴趣的化合物,优选感兴趣的多肽的方法,包括
a)提供修饰的芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,
b)在允许表达所述感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地从培养基分离所述感兴趣的化合物。
14.权利要求13的生产感兴趣的化合物的方法,其中所述芽孢杆菌宿主细胞选自短小芽孢杆菌、贝莱斯芽孢杆菌、解淀粉芽孢杆菌、嗜碱芽孢杆菌、地衣芽孢杆菌、副地衣芽孢杆菌、迟缓芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、甲醇芽孢杆菌、嗜热脂肪地芽孢杆菌(嗜热脂肪芽孢杆菌)、摩加夫芽孢杆菌、球芽孢杆菌和枯草芽孢杆菌,优选地衣芽孢杆菌。
15.一种改变的RemA蛋白,其中所述改变的RemA蛋白包含在SEQ ID NO:21的保守氨基酸位置上的一个或多个非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在SEQ ID NO:21的氨基酸位置R18和/或P29。
16.权利要求15的改变的RemA蛋白,其中所述改变的RemA蛋白与SEQ ID NO:21具有至少97%、至少98%、或至少99%、但少于100%序列相同性,但与SEQ ID NO:21具有少于100%序列相同性。
17.一种改变的RemB蛋白,其中所述改变的RemB蛋白包含在SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的一个或多个非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,最优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。
18.权利要求17的改变的RemB蛋白,其中所述改变的RemB蛋白与SEQ ID NO:23具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性。
CN202280051979.8A 2021-06-24 2022-06-24 具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞 Pending CN117693587A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21181347.2 2021-06-24
EP21181347 2021-06-24
PCT/EP2022/067442 WO2022269084A1 (en) 2021-06-24 2022-06-24 Improved bacillus host cell with altered rema/remb protein

Publications (1)

Publication Number Publication Date
CN117693587A true CN117693587A (zh) 2024-03-12

Family

ID=76971611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280051979.8A Pending CN117693587A (zh) 2021-06-24 2022-06-24 具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞

Country Status (4)

Country Link
EP (1) EP4359546A1 (zh)
CN (1) CN117693587A (zh)
BR (1) BR112023027016A2 (zh)
WO (1) WO2022269084A1 (zh)

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2144990T3 (es) 1989-08-25 2000-07-01 Henkel Of America Inc Enzima proteolitica alcalina y metodo de produccion.
DK639689D0 (da) 1989-12-18 1989-12-18 Novo Nordisk As Indfoering af dna i celler
CA2123496C (en) 1991-11-14 2004-02-03 Steen T. Jorgensen A bacillus promoter derived from a variant of a bacillus licheniforms x-amylase promoter
FR2704860B1 (fr) 1993-05-05 1995-07-13 Pasteur Institut Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire.
CN1190434A (zh) 1995-07-07 1998-08-12 诺沃挪第克公司 用不能形成芽孢的芽孢杆菌生产蛋白质的方法
US5958728A (en) 1996-11-18 1999-09-28 Novo Nordiskbiotech, Inc. Methods for producing polypeptides in mutants of bacillus cells
US5936547A (en) 1997-07-15 1999-08-10 Ameritech Corporation System and method for providing user-selected information to a paging-capable device
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
US6509185B1 (en) 2000-01-07 2003-01-21 Genencor International, Inc. Mutant aprE promotor
EP1297170B1 (en) 2000-06-23 2016-03-02 Novozymes A/S Method for stable chromosomal multi-copy integration of genes
WO2002097064A1 (fr) 2001-05-29 2002-12-05 Kao Corporation Micro-organismes hotes
WO2003008125A1 (de) 2001-07-19 2003-01-30 Ralph Meichtry Vorrichtung und verfahren zum entbeulen von blechteilen
AU2003228393A1 (en) 2002-03-29 2003-10-13 Genencor International, Inc. Ehanced protein expression in bacillus
DE60321901D1 (de) 2002-04-10 2008-08-14 Novozymes As Verbesserte bacillus-wirtszelle
EP1735455A2 (en) 2004-03-31 2006-12-27 Novozymes Biopolymer A/S Methods for producing hyaluronic acid in a bacillus cell
DK1805296T3 (da) 2004-10-22 2010-01-18 Novozymes As Stabil genomisk integrering af multipie polynukleotidkopier
EP2210898A1 (en) 2006-11-29 2010-07-28 Novozymes Inc. Bacillus Licheniformis chromosome
WO2008140615A2 (en) 2006-12-21 2008-11-20 Novozymes, Inc. Modified messenger rna stabilizing sequences for expressing genes in bacterial cells
DE102007021001A1 (de) 2007-05-04 2008-11-06 Ab Enzymes Gmbh Expressionssystem zur antibiotikafreien Produktion von Polypeptiden
WO2008148575A2 (en) 2007-06-07 2008-12-11 Dsm Ip Assets B.V. Increased production of a target product via stabilization of mrna
EP2196534B1 (en) 2007-09-20 2016-08-24 Kao Corporation A recombinant microorganism and method for producing poly-gamma-glutamic acid
FR2934810A1 (fr) 2008-08-11 2010-02-12 Imaje Sa Dispositif d'impression a jet d'encre a compensation de vitesse de jet
WO2014150624A1 (en) 2013-03-14 2014-09-25 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
EP3011032B1 (en) 2013-06-17 2019-10-16 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
WO2015055558A1 (en) 2013-10-17 2015-04-23 Dsm Ip Assets B.V. Protein expression system
DK3102669T3 (da) 2014-02-07 2019-08-19 Dsm Ip Assets Bv Forbedret bacillevært
WO2015181296A1 (de) 2014-05-30 2015-12-03 Mahle International Gmbh VORRICHTUNG UND VERFAHREN ZUM FASERSPRITZGIEßEN VON SPRITZGUSSTEILEN
CN107250365A (zh) 2015-02-19 2017-10-13 丹尼斯科美国公司 增强的蛋白质表达
CN107922464B (zh) 2015-08-28 2022-03-15 帝斯曼知识产权资产管理有限公司 经改进的维生素生产
KR20180069057A (ko) * 2015-10-30 2018-06-22 다니스코 유에스 인크. 향상된 단백질 발현 및 이의 방법
WO2018009520A1 (en) 2016-07-06 2018-01-11 Novozymes A/S Improving a microorganism by crispr-inhibition
US11066653B2 (en) 2017-07-21 2021-07-20 Basf Se Method of transforming bacterial cells
JP2022526414A (ja) 2019-04-05 2022-05-24 ダニスコ・ユーエス・インク 二重環状組換えDNAコンストラクトを使用するバチルス(Bacillus)のゲノムへのポリヌクレオチド組込みのための方法及びその組成物
JP2022526982A (ja) 2019-04-05 2022-05-27 ダニスコ・ユーエス・インク 線状組換えDNAコンストラクトを使用してバチルス(Bacillus)のゲノムにドナーDNA配列を組み込むための方法及びその組成物

Also Published As

Publication number Publication date
BR112023027016A2 (pt) 2024-03-12
WO2022269084A1 (en) 2022-12-29
EP4359546A1 (en) 2024-05-01

Similar Documents

Publication Publication Date Title
JP5170793B2 (ja) バチルスにおけるタンパク質発現の増大
US8293499B2 (en) Bacillus strain for increased protein production
US20110117598A1 (en) Enhanced Protein Production in Bacillus
EP2133416A1 (en) Recombinant microorganism
EP2152732B1 (en) A modified secretion system to increase expression of polypeptides in bacteria
CN117813316A (zh) 用于生产纯度更高的感兴趣的化合物的地衣芽孢杆菌宿主细胞
WO2023117970A1 (en) Method for improved production of intracellular proteins in bacillus
US20230272358A1 (en) Alanine racemase single deletion and transcomplementation
CN117693587A (zh) 具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞
US20220282234A1 (en) Compositions and methods for increased protein production in bacillus lichenformis
EP1141310B1 (en) Production of proteins in gram-positive microorganisms
CN116745422A (zh) 丙氨酸消旋酶双缺失和反式互补
EP4359424A1 (en) Improved bacillus production host
JP5847458B2 (ja) 改変rRNAオペロンを有する組換え微生物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication