CN101903519B

CN101903519B - 杆菌中增强的蛋白质生产

Info

Publication number: CN101903519B
Application number: CN2008801221220A
Authority: CN
Inventors: M·A·卡文; E·费拉里; S·D·鲍尔
Original assignee: Danisco USA Inc
Current assignee: Danisco USA Inc
Priority date: 2007-12-21
Filing date: 2008-12-19
Publication date: 2013-07-31
Anticipated expiration: 2028-12-19
Also published as: JP5629584B2; US20110117598A1; AU2008348270A1; RU2010130503A; WO2009094084A1; RU2515112C2; KR20100098652A; EP2235176B1; WO2009094084A9; DK2235176T3; EP2235176A1; JP2011507528A; CA2709804A1; US8512982B2; CN101903519A

Abstract

本发明涉及已经遗传改造以具有改变的表达和/或生产目的蛋白质能力的细胞。具体来讲，本发明涉及革兰氏阳性微生物的改良的宿主细胞，例如能够过表达ymaH的杆菌物种。本发明涵盖包含编码YmaH的多核苷酸序列的多核苷酸构建体和表达载体，以及包含这种构建体和表达载体的改良的宿主细胞。具体来说，本发明涉及用于在杆菌物种中增强目的蛋白(例如蛋白酶)的表达和生产的过表达YmaH的组合物和方法。

Description

杆菌中增强的蛋白质生产

技术领域

本发明涉及已经被遗传改造而具有改变的表达和/或生产目的蛋白质能力的细胞。具体来讲，本发明涉及革兰氏阳性微生物的修饰的宿主细胞，例如能够过表达ymaH的杆菌物种。本发明涵盖了包含编码YmaH的多核苷酸序列的多核苷酸构建体和表达载体，以及包含这些构建体和表达载体的经修饰的宿主细胞。特别是，本发明涉及用于在杆菌物种中增强目的蛋白(例如蛋白酶)的表达和生产的过表达ymaH的组合物和方法。

背景技术

遗传工程已经使得用作工业上生物反应器、细胞工厂和用于食品发酵的微生物的可以得到改进。特别地，杆菌物种生产和分泌大量有用的蛋白质和代谢产物(Zukowski，“Production of commercially valuableproducts，”出自：Doi和McGlouglin(编著)Biology of Bacilli：Applications to Industry，Butterworth-Heinemann，Stoneham.Mass pp 311-337[1992])。工业中最常用的杆菌物种是地衣芽孢杆菌(B.licheniformis)、解淀粉芽孢杆菌(B.amyloliquefaciens)和枯草芽孢杆菌(B.subtilis)。因为它们的GRAS(公认为是安全的)身份，这些杆菌物种的菌株是生产用于食品和药品工业的蛋白质的天然候选株。重要的产物酶包括α-淀粉酶、中性蛋白酶和碱性(或丝氨酸)蛋白酶。然而，尽管对在杆菌宿主细胞中蛋白质的生产的理解有了进步，仍然需要改进微生物表达和生产这些蛋白质的方法。

发明内容

本发明涉及已经过遗传改造以具有改变的表达和/或生产目的蛋白质能力的细胞。具体来讲，本发明涉及革兰氏阳性微生物的修饰的宿主细胞，例如能够过表达ymaH的杆菌物种。本发明涵盖包含编码YmaH的多核苷酸序列的多核苷酸构建体和表达载体，以及包含这种构建体和表达载体的经修饰的宿主细胞。具体来说，本发明涉及用于在杆菌物种中增强目的蛋白(例如蛋白酶)的表达和生产的过表达ymaH的组合物和方法。

在一个实施方式中，本发明提供了分离的嵌合多核苷酸，其包含限定了有效连接了编码YmaH蛋白质的多核苷酸的SigA启动子的多核苷酸序列。

在另一个实施方式中，本发明提供了分离的嵌合多核苷酸，其包含限定了有效连接编码YmaH蛋白质的多核苷酸的SigA启动子的多核苷酸序列，其中所述嵌合多核苷酸包含SEQ ID NO：2或SEQ ID NO：3。

在另一个实施方式中，本发明提供了包含多核苷酸构建体的载体，该构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸。

在另一个实施方式中，本发明提供了包含多核苷酸构建体的载体，该构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述多核苷酸构建体包含SEQ ID NO：1、2、3或13。

在另一个实施方式中，本发明提供了一种改良的杆菌细胞，该细胞包含含有一种多核苷酸构建体的载体，该构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述改良的细胞能够生产目的蛋白质。

在另一个实施方式中，本发明提供了改良的芽孢杆菌属宿主细胞，所述细胞选自由地衣芽孢杆菌，枯草芽孢杆菌，迟缓芽孢杆菌(B.lentus)，短芽孢杆菌(B.brevis)，嗜热脂肪芽孢杆菌(B.stearothermophilus)，嗜碱芽孢杆菌(B.alkalophilus)，解淀粉芽孢杆菌(B.amyloliquefaciens)，凝结芽孢杆菌(B.coagulans)，环状芽孢杆菌(B.circulans)，灿烂芽孢杆菌(B.lautus)，短小芽孢杆菌(B.pumilus)，苏云金芽孢杆菌(B.thuringiensis)，克劳氏芽孢杆菌(B.clausii)和巨大芽孢杆菌(B.megaterium)组成的组中，而且包含含有多核苷酸构建体的载体，所述构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述改良的细胞能够生产目的蛋白质。

在另一个实施方式中，本发明提供了改良的杆菌宿主细胞，所述细胞包含一种含有多核苷酸构建体的载体，所述构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述改良的细胞能够生产与所述改良的细胞同源或异源的目的蛋白质。

在另一个实施方式中，本发明提供了改良的杆菌宿主细胞，所述细胞包含一种含有多核苷酸构建体的载体，所述构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述改良的细胞能够生产目的蛋白质，并且其中aprE启动子驱动所述目的蛋白质的表达。

在另一个实施方式中，本发明提供了改良的杆菌宿主细胞，所述细胞包含一种含有多核苷酸构建体的载体，所述构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述改良的细胞能够生产选自淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶(cutinase)、纤维素酶、半纤维素酶、酯酶、过氧化物酶、过氧化氢酶、葡萄糖氧化酶、植酸酶、果胶酶、葡萄糖苷酶、异构酶、转移酶、激酶磷酸酶、半乳糖苷酶和壳多糖酶、激素、细胞因子、生长因子、受体、疫苗和抗体的目的蛋白质。

在另一个实施方式中，本发明提供了改良的杆菌细胞，所述细胞包含一种含有多核苷酸构建体的载体，所述构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述改良的细胞能够生产酶。

在另一个实施方式中，本发明提供了改良的杆菌细胞，所述细胞包含一种含有多核苷酸构建体的载体，所述构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述改良的细胞能够生产蛋白酶。

在另一个实施方式中，本发明提供了改良的杆菌细胞，所述细胞包含一种含有多核苷酸构建体的载体，所述构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述改良的细胞能够生产选自枯草杆菌蛋白酶168，枯草杆菌蛋白酶BPN′，枯草杆菌蛋白酶Carlsberg，迟缓芽孢杆菌的枯草杆菌蛋白酶，克劳氏芽孢杆菌的枯草杆菌蛋白酶，枯草杆菌蛋白酶DY，枯草杆菌蛋白酶147和枯草杆菌蛋白酶309中的至少一种枯草杆菌蛋白酶及其变体。

在另一个实施方式中，本发明提供了一种改良的产蛋白酶杆菌细胞，所述细胞能够过表达ymaH，其中所述改良的细胞包含在选自degU、degQ、degS、sco4、spoIIE、degQ和degR中的至少一个基因中的突变。

在另一个实施方式中，本发明提供了一种改良的产蛋白酶杆菌细胞，所述细胞能够过表达ymaH，其中所述改良的细胞包含deg(Hy)32突变。

在另一个实施方式中，本发明提供了一种改良的产蛋白酶枯草芽孢杆菌(Bacillus subtilis)，所述细胞能够过表达ymaH，其中所述改良的细胞包含在选自degU、degQ、degS、sco4、spoIIE、degQ和degR中的至少一个基因中的突变。

在另一个实施方式中，本发明提供了一种获得改良的杆菌细胞的方法，所述方法包括：用包含一种多核苷酸构建体的载体转化杆菌宿主细胞，所述构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述杆菌宿主细胞能够表达目的蛋白质；和在适宜表达目的蛋白质的生长条件下培养该改良的杆菌细胞。

在另一个实施方式中，本发明提供了一种获得改良的杆菌细胞的方法，所述方法包括：用包含一种多核苷酸构建体的载体转化杆菌宿主细胞，所述构建体存在于复制质粒上，并包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述杆菌宿主细胞能够表达目的蛋白质；和在适宜表达目的蛋白质的生长条件下生长该改良的杆菌细胞。

在另一个实施方式中，本发明提供了一种获得改良的杆菌细胞的方法，所述方法包括：用包含一种多核苷酸构建体的载体转化杆菌宿主细胞，所述构建体被整合到所述改良的细胞的基因组中，并包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述杆菌宿主细胞能够表达目的蛋白质；和在适宜表达目的蛋白质的生长条件下生长该改良的杆菌细胞。

在另一个实施方式中，本发明提供了一种获得改良的杆菌细胞的方法，所述方法包括：用包含一种多核苷酸构建体的载体转化杆菌宿主细胞，所述构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸，其中所述杆菌宿主细胞能够表达至少一种枯草杆菌蛋白酶；和在适宜表达所述枯草杆菌蛋白酶的生长条件下生长该改良的杆菌细胞。

在另一个实施方式中，本发明提供了一种在改良的杆菌细胞中生产目的蛋白质的方法，所述方法包括：培养能够过表达ymaH的所述改良的杆菌细胞，并在适宜表达目的蛋白质的生长条件下生长该改良的杆菌细胞。在一些实施方式中，该目的蛋白质是酶，例如枯草杆菌蛋白酶。在一些实施方式中，所述杆菌细胞是枯草芽孢杆菌细胞。

在另一个实施方式中，本发明提供了一种在改良的杆菌细胞中生产目的蛋白质的方法，所述方法包括：培养能够过表达ymaH的所述改良的杆菌细胞，在适宜表达目的蛋白质的生长条件下生长该改良的杆菌细胞，和回收该目的蛋白质。在一些实施方式中，该目的蛋白质是酶，例如枯草杆菌蛋白酶。在一些实施方式中，所述杆菌细胞是枯草芽孢杆菌细胞。

在另一个实施方式中，本发明提供了一种在早于对应的前体宿主细胞中产生目的蛋白质的时间在改良的杆菌细胞中生产目的蛋白质的方法，其中所述方法包括：培养能够过表达ymaH的所述改良的杆菌细胞，并在适宜表达目的蛋白质的生长条件下生长该改良的杆菌细胞。在一些实施方式中，该目的蛋白质是酶，例如枯草杆菌蛋白酶。在一些实施方式中，所述杆菌细胞是枯草芽孢杆菌细胞。

在另一个实施方式中，本发明提供了一种在改良的杆菌细胞中生产目的蛋白质的方法，其中aprE启动子驱动目的蛋白质的表达，所述方法包括：培养能够过表达ymaH的所述改良的杆菌细胞，在适宜表达目的蛋白质的生长条件下生长该改良的杆菌细胞。在一些实施方式中，该目的蛋白质是酶，例如枯草杆菌蛋白酶。在一些实施方式中，所述杆菌细胞是枯草芽孢杆菌细胞。

在另一个实施方式中，本发明提供了一种在杆菌物种中增强目的蛋白质表达的方法，其中所述方法包括用下述方法获得改良的杆菌细胞：该方法包括在杆菌亲本宿主细胞中过表达ymaH、在适宜的生长条件下生长得到的改良杆菌细胞、并使所述目的蛋白质在该改良的杆菌细胞中表达，其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白质在亲本宿主细胞中的表达相比得到了增强。在一些实施方式中，该目的蛋白质是酶，例如枯草杆菌蛋白酶。在一些实施方式中，所述杆菌细胞是枯草芽孢杆菌细胞。

在另一个实施方式中，本发明提供了一种在杆菌物种中增强目的蛋白质表达的方法，其中所述方法包括用下列方法获得改良的杆菌细胞：该方法包括在杆菌亲本宿主细胞中过表达ymaH、在适宜的生长条件下生长得到的改良杆菌细胞、并使所述目的蛋白质在该改良的杆菌细胞中表达，其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白质在亲本宿主细胞中的表达相比得到了增强，而且其中所述过表达包括用包含编码YmaH蛋白质的多核苷酸的多核苷酸构建体转化杆菌亲本宿主细胞，其中所述编码YmaH蛋白质的多核苷酸与sigA或sigH启动子多核苷酸序列有效连接。在一些实施方式中，该目的蛋白质是酶，例如枯草杆菌蛋白酶。在一些实施方式中，所述杆菌细胞是枯草芽孢杆菌细胞。

在另一个实施方式中，本发明提供了一种在杆菌物种中增强目的蛋白质表达的方法，其中所述方法包括用下列方法获得改良的杆菌细胞：该方法包括在杆菌亲本宿主细胞中过表达ymaH、在适宜的生长条件下生长得到的改良杆菌细胞、并使所述目的蛋白质在该改良的杆菌细胞中表达，其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白质在亲本宿主细胞中的表达相比得到了增强，而且其中所述过表达包括用包含选自SEQ ID NOS：1、2、3和13的序列的多核苷酸构建体转化杆菌宿主细胞。在一些实施方式中，该目的蛋白质是酶，例如枯草杆菌蛋白酶。在一些实施方式中，所述杆菌细胞是枯草芽孢杆菌细胞。

在另一个实施方式中，本发明提供了一种在杆菌物种中增强目的蛋白质表达的方法，其中所述方法包括用下列方法获得改良的杆菌细胞：该方法包括在杆菌宿主细胞中过表达ymaH、在适宜的生长条件下生长所述改良杆菌细胞、并使所述目的蛋白质在该改良的杆菌细胞中表达，其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白质在所述杆菌宿主细胞中的表达相比得到了增强，而且其中所述过表达包括用存在于质粒中或整合到该改良细胞基因组中、而且包括编码YmaH蛋白质的多核苷酸的多核苷酸构建体转化杆菌宿主细胞，其中所述编码YmaH蛋白质的多核苷酸与sigA或sigH启动子多核苷酸序列有效连接。在一些实施方式中，该目的蛋白质是酶，例如枯草杆菌蛋白酶。在一些实施方式中，所述杆菌细胞是枯草芽孢杆菌细胞。

在另一个实施方式中，本发明提供了一种在杆菌物种中增强目的蛋白质表达的方法，其中所述方法包括用下列方法获得改良的杆菌细胞：该方法包括在野生型杆菌宿主细胞中过表达ymaH、在适宜的生长条件下生长所述改良杆菌细胞、并使所述目的蛋白质在该改良的杆菌细胞中表达，其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白质在所述野生型杆菌宿主细胞中的表达相比得到了增强，而且其中所述过表达包括用包含编码YmaH蛋白质的多核苷酸的多核苷酸构建体转化野生型杆菌宿主细胞，其中所述编码YmaH蛋白质的多核苷酸与sigA或sigH启动子多核苷酸序列有效连接。在一些实施方式中，该目的蛋白质是酶，例如枯草杆菌蛋白酶。在一些实施方式中，所述杆菌细胞是枯草芽孢杆菌细胞。

在另一个实施方式中，本发明提供了一种在杆菌物种中增强目的蛋白质表达的方法，其中所述方法包括用下列方法获得改良的杆菌细胞：该方法包括在改变的杆菌宿主细胞中过表达ymaH、在适宜的生长条件下生长所述改良杆菌细胞、并使所述目的蛋白质在该改良的杆菌细胞中表达，其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白质在所述改变的宿主细胞中的表达相比得到了增强，而且其中所述过表达包括用包含编码YmaH蛋白质的多核苷酸的多核苷酸构建体转化改变的杆菌宿主细胞，其中所述编码YmaH蛋白质的多核苷酸与sigA或sigH启动子多核苷酸序列有效连接。在一些实施方式中，该目的蛋白质是酶，例如枯草杆菌蛋白酶。在一些实施方式中，所述杆菌细胞是枯草芽孢杆菌细胞。

附图说明

图1(A-E)图示了用于产生根据本发明一些实施方式的多核苷酸构建体的引物的定位。组B-E展示了分别用于产生构建体SigH、SigA1、SigA2和SigA3的引物的位置，该位置相对于组A中所图示枯草芽孢杆菌的miaA操纵子的杆菌染色体序列(枯草芽孢杆菌菌株168的1865428-1867019碱基对；NCBI登录号NC000964)。引物对P4-P5和P6-P7是融合引物，在其5’末端包含与要直接扩增的序列同源的碱基对“尾巴”，而且互相互补。融合引物的互补尾巴使扩增的Sigma A启动子DNA与扩增的YmaH编码DNA融合，以便得到包含与YmaH编码序列相邻的Sigma A启动子序列的嵌合多核苷酸，而删除大部分或全部miaA编码序列。

图2展示了枯草芽孢杆菌基因组的一部分多核苷酸序列，其包含限定sigA启动子至编码YmaH蛋白质的序列末端的序列。该序列在图1的组A中图解。标示出了编码miaA蛋白质的序列的开端，以粗体字母示出了完整的miaA编码序列；标示出了编码YmaH蛋白质的序列的开端，以下划线的粗体字母示出了完整的YmaH编码序列。

图3(A-B)组A示出了枯草杆菌蛋白酶的蛋白水解活性的图表，该枯草杆菌蛋白酶分别由杆菌对照宿主细胞(42pBS)和过表达ymaH的改良杆菌宿主细胞(42SigA1和42SigH)产生。组B示出了杆菌对照宿主细胞(41pBS)和过表达ymaH的改良杆菌宿主细胞(41SigH)产生的枯草杆菌蛋白酶活性。根据由于水解和释放对硝基苯胺(p-nitroanaline)导致的405nm光吸收的增加而测量蛋白质水解活性。酶活性水平是过表达ymaH对杆菌宿主细胞产生枯草杆菌蛋白酶的影响的指征。

图4示出了杆菌对照宿主细胞42pBS19和过表达ymaH的改良杆菌宿主细胞42SigH和42SigA1的枯草杆菌蛋白酶生产水平。

具体实施方式

除非另外指明，本发明的实施包括属于本领域技术的普遍用于分子生物学、微生物学、蛋白质纯化、蛋白质工程、蛋白质和DNA测序以及重组DNA领域的常规技术。这些技术为本领域技术人员所公知，并记载于许多标准文章和参考著作中。此处提及的所有专利、专利申请、文章和出版物，包括上文中和下文中的，都明确引入本申请作为参考。

除非另外定义，此处所用的所有技术和科学术语具有与本发明所属领域普通技术人员所一般理解的含义相同的含义。包括本文涉及的术语的各种科学词典为本领域技术人员所公知，而且能够得到。虽然与此处描述的方法和材料相似或等同的任何方法和材料均可用于本发明的实施或检测，还是描述了一些优选的方法和材料。因此，通过整体参考说明书而更加完全地描述下面定义的术语。应理解本发明不限于所描述的特定方法学、实验方案和试剂，因为本领域技术人员可以根据使用它们的背景而对其进行改变。

此处使用的单数术语“一个”、“一”和“所述”(“a”、“an”和“the”)包括其复数指代，除非另外清楚指明。除非另外说明，核酸以5′至3′的方向从左向右书写，而氨基酸序列以氨基端到羧基端的方向从左向右书写。

此处引用的包括其中公开的所有序列的所有专利、专利申请和其他出版物均通过明确引入本申请而作为参考，其程度相当于各个单独的出版物、专利或专利申请特别、单独地通过引入本申请而作为参考。在相关部分引用的所有文献均通过引入本文作为参考。然而，任何文献的引用都不应解释为承认其就是相对于本发明的现有技术。

数值范围包括限定范围的端点数值。预期通篇说明书中给定的每个上限值意欲包括每个较小的数值限制，相当于这样的较小数值限制明确记载于本文中。通篇说明书中给定的每个下限值意欲包括每个较大的数值限制，相当于这样的更大数值限制明确记载于本文中。整个说明书中每个数值范围包括落入该较宽数值范围的每个较窄数值范围，相当于这样的较窄数值范围全部明确记载于本文中。

此处提供的标题不是本发明的各个实施方式或方面的限制，该各个实施方式或方面可以通过整体参考说明书而获得。因此，如上所述，通过整体引用说明书而更加完全地描述下面定义的术语。

此处使用的术语“分离的”和“纯化的”指与其天然相关的至少一种成分分离的核酸或氨基酸(或其他成分)。

术语“嵌合多核苷酸”“嵌合多核苷酸构建体”和“异源核酸构建体”指包含部分不同基因的包括调节元件的多核苷酸。因此，在一些实施方式中，嵌合多核苷酸构建体包括与不是其天然启动子的启动子有效连接的蛋白质编码区。在一些实施方式中，嵌合多核苷酸指包括限定了启动子的多核苷酸序列的多核苷酸序列，该限定了启动子的多核苷酸序列有效连接到编码蛋白质的多核苷酸序列。在一些实施方式中，该启动子和该编码多核苷酸是邻接的。

在涉及启动子的上下文中的术语“限定”是指包含能够转录的启动子元件的多核苷酸序列。

此处使用的术语“启动子”是指其功能为驱动/影响下游基因的转录的核酸序列。通常，启动子与其中要表达基因的宿主细胞相容。启动子与其他转录和翻译调控核酸序列(也称为“控制序列”)对于表达给定基因是必需的。通常，转录和翻译调节序列包括但不限于，启动子序列，核糖体结合位点，转录起始和终止序列，翻译起始和终止序列，上游启动子元件的上游序列(UP元件)和增强子或激活子序列。在一些实施方式中，启动子还包括转录前导序列。

此处的术语“Sigma A启动子”和“SigA启动子”是指包含核心启动子序列的多核苷酸序列，该核心启动子序列包括直接被相应的σ^A因子识别的序列。SigA启动子包含在天然存在于miaA编码区域上游的序列中。

此处的术语“Sigma H启动子”和“SigH启动子”是指包含核心启动子序列的多核苷酸序列，该核心启动子序列包括直接被相应的σ^H因子识别的序列。SigH启动子包含在天然存在于ymaH编码区域上游的序列中(Britton等人J.Bacteriol.184：4881-4890[2002])。核心启动子包含如下启动子序列：该启动子序列包括被相应的σ因子直接识别的序列和位于被相应的σ因子直接识别的序列之间的间隔序列。

此处的术语“aprE启动子”是指在枯草芽孢杆菌中天然驱动枯草芽孢杆菌蛋白酶表达的多核苷酸启动子序列(Ferrari等人，J Bacteriol.170：289-295[1988])。在aprE启动子的语境中，此处的“aprE启动子”是指野生型的aprE启动子及其突变体。在一些实施方式中，所述aprE启动子包括用DegU，ScoC，AbrB和该启动子的任何其他调节子进行转录调节所必需的核苷酸序列，和/或aprE转录前导序列(Hambraeus等人，Microbiology 148：1795-1803[2002])。在一些备选的实施方式中，aprE启动子并非包括所有对由DegU，ScoC，AbrB和其他调节子进行的转录调控必需的核苷酸序列，和/或不包括aprE转录前导序列。

术语“调节片段”“调节序列”和“表达控制序列”是指与编码多肽链的氨基酸序列的DNA多核苷酸序列有效连接，以影响该编码氨基酸序列表达的DNA多核苷酸序列。该调节序列能够抑制、阻遏或促进该有效连接的编码氨基酸的多核苷酸序列的表达。在一些实施方式中，该调节序列包括与编码转录调节子YmaH的DNA序列有效连接的启动子。在一些实施方式中，该启动子是与该ymaH基因异源的(例如，该启动子是并非立即驱动YmaH蛋白质表达的启动子)。例如，在一些实施方式中，该启动子是有效连接到编码YmaH蛋白质的DNA的Sigma A启动子。在一些其他的实施方式中，该启动子是立即驱动YmaH蛋白质表达、并且有效连接到编码YmaH的DNA的启动子，与其在天然发生的宿主中的一样。

术语“多核苷酸”和“核酸”，在此可以互换使用，是指任何长度核苷酸的聚合物形式。这些术语包括但不限于，单链DNA，双链DNA，基因组DNA，cDNA，或包括嘌呤和嘧啶碱基的聚合物，或其他天然的、化学的、生化修饰的、非天然的或衍生的核苷酸碱基。多核苷酸的非限制性实例包括基因、基因片段、染色体片段、ESTs、外显子、内含子、mRNA、tRNA、rRNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、分离的任何序列的DNA、分离的任何序列的RNA、核酸探针和引物。应理解，由于遗传密码的简并性，可以制备许多编码给定蛋白质的核苷酸序列。

此处的术语“基因”是指在生产多肽链中涉及的染色体DNA片段，其可以包括也可以不包括编码区之前或之后的区域(例如5′未翻译序列(5′UTR)或前导序列和3′未翻译序列(3′UTR)或尾随序列，以及单个编码片段(外显子)之间的间插序列(内含子))。在一些实施方式中，基因编码商业上重要的工业蛋白质或肽，例如酶，包括但不限于蛋白酶、纤维素酶、诸如淀粉酶和葡糖淀粉酶的糖酶、纤维素酶、氧化酶、异构酶、转移酶、激酶、磷酸酶和酯酶。在一些其他的实施方式中，基因编码由其中出现miaA的操纵子(例如miaA或ymaH)所编码的蛋白质。然而，不应理解为本发明限于任何具体的酶或蛋白质。在一些其他的实施方式中，基因编码其他蛋白质或多肽，例如生长因子、细胞因子、配体、受体和抑制剂，以及疫苗和抗体。在一些实施方式中，目的基因是天然存在的基因，而在其他实施方式中，目的基因是突变的基因或合成的基因。

如此处所使用的，“合成的”是指由体外化学或酶促合成制备的多核苷酸分子。其包括但不限于用对于宿主微生物(诸如但不限于杆菌属物种)最优的密码子制备的变体核酸。

此处使用的术语“聚合酶链式反应(PCR)”是指如美国专利4,683,1954,683,202和4,965,188中记载的方法，其通过引入本申请作为参考，包括在基因组DNA混合物中提高靶序列片段浓度而无需克隆或纯化的方法。扩增靶序列的这种方法包括：引入大大过量的两个寡核苷酸引物至含有目的靶序列的DNA混合物中，然后在DNA聚合酶存在下进行精确顺序的热循环。这两个引物分别与双链靶序列中它们各自的链互补。为了完成扩增，将混合物变性，然后将引物退火至靶分子中它们的互补序列。退火之后，用聚合酶延伸该引物，以形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可以重复许多次(即，变性、退火和延伸构成一个“循环”；可以有许多个“循环”)，以得到高浓度的目的靶序列扩增片段。目的靶序列的扩增片段的长度决定于引物相互间的相对位置，因此，其长度是可控参数。由于该过程方面的重复，该方法被称作“聚合酶链式反应”(下面称为“PCR”)。因为靶序列的目的扩增片段成为混合物中的优势序列(指浓度方面)，因此被称为“PCR扩增的”。

此处使用的术语“扩增试剂”指除引物、核酸模版和扩增酶之外的那些扩增所需试剂(脱氧核糖核苷酸三磷酸盐、缓冲液等)。通常，扩增试剂与其他反应成分一起放入并包含于反应容器(试管、微孔等)中。

使用PCR，有可能扩增基因组DNA中单拷贝的特定靶序列至通过几种不同的方法学可检测的水平(例如，与标记的探针杂交；加入生物素化的引物，然后用亲和素-酶结合物检测；将³²P-标记的脱氧核苷酸三磷酸盐掺入扩增的片段中，例如dCTP或dATP)。除了基因组DNA，任何寡核苷酸或多核苷酸序列都能够用适宜的引物分子来扩增。特别地，用PCR方法本身所产生的扩增的片段本身就是后续PCR扩增的有效模板。

此处使用的术语“PCR产物”、“PCR片段”和“扩增产物”是指在PCR步骤变性、退火和延伸完成两轮或更多轮循环之后得到的化合物的混合物。这些术语包括扩增了一个或多个靶序列的一个或多个片段的情况。

此处使用的术语“限制性核酸内切酶”和“限制性酶”是指细菌的酶，其在特异性核苷酸序列处或附近切割双链DNA。

术语“重组”是指不是在宿主细胞中天然存在的多核苷酸或多肽。在一些实施方式中，重组分子包括以一种不是天然存在的方式连接到一起的两个或多个天然存在的序列。

核酸当与其他核酸序列处于功能关系中时，是“有效连接的”。例如，多核苷酸启动子当影响编码多肽的多核苷酸的转录时，为有效连接到编码多肽的多核苷酸。在一些其他的实施方式中，如果其处于能够促进翻译的位置时，核糖体结合位点为有效连接到编码序列。在一些实施方式中，“有效连接”意味着这些连接的多核苷酸序列是邻接的。通过在合宜的限制性酶切位点处连接达成结合。如果不存在这样的位点，则根据常规经验使用合成的寡核苷酸适配体或接头。

此处使用的“同源基因”是指来自不同但是通常相关物种、互相对应、而且彼此相同或非常相似的基因。该术语包含那些由物种形成(即，新物种的形成)而分离的基因(例如直向同源基因)，以及那些已经通过遗传复制而分离的基因(例如共生同源基因)。

如本文中使用的，“直向同源物”和“直向同源基因”指不同物种中从共同祖先基因(即，同源基因)通过物种形成进化成的基因。通常，直向同源物在进化过程中保留了相同的功能。直向同源物的鉴别可用于对新测序基因组中的基因功能进行可靠预测。

如本文中使用的，“旁系同源物”和“共生同源基因”指基因组内通过复制相关的基因。直向同源物在进化过程中保留了相同的功能，而旁系同源物则进化出新的功能，虽然一些功能通常是与原始功能相关的。共生同源基因的实例包括但不限于编码胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶和凝血酶的基因，它们都是丝氨酸蛋白酶，并同时存在于相同的物种内。

此处使用的“同源性”是指序列相似性或同一性，优选同一性。可以用本领域公知的标准技术测定同源性，(参见，例如Smith和Waterman，Adv.Appl.Math.，2：482[1981]；Needleman和Wunsch，J.Mol.Biol.，48：443[1970]；Pearson和Lipman，Proc.Natl.Acad.Sci.USA 85：2444[1988]；威斯康辛遗传软件包中的如GAP，BESTFIT，FASTA，和TFASTA等程序(遗传计算机组，威斯康辛州麦迪逊)；和Devereux等人，Nucl.AcidRes.，12：387-395[1984])。

此处使用的“同功序列”是其中基因的功能与来自优选的枯草芽孢杆菌菌株(即枯草芽孢杆菌168)中特定基因的功能基本相同的基因。并且，同功基因包括与枯草芽孢杆菌168基因的序列有至少约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％、约97％、约98％、约99％或约100％序列同一性的序列。或者，同功序列具有枯草芽孢杆菌168区域中存在基因的排比之介于70-100％之间的排比，和/或在与枯草芽孢杆菌168基因组比对的区域中具有至少5-10个基因。在另外的实施方式中，所述序列具有超过一个的上述性质。同功序列用已知的序列比对方法来测定。常用的比对方法是BLAST，虽然如上文和下文中所述，还有其他也可以用于比对序列的方法。

适用算法的一个例子是PILEUP。PILEUP使用累进的、配对的比对从一组相关的序列形成多个序列比对。也可以绘出表明用于形成比对的簇关系的树。PILEUP使用Feng和Doolittle(Feng和Doolittle，J.Mol.Evol.，35：351-360[1987])的累进比对方法的简化方法。该方法与Higgins和Sharp(Higgins和Sharp，CABIOS 5：151-153[1989])中所述的方法类似。可用的PILEUP参数包括3.00的缺省空位权重，0.10的缺省空位长度权重和加权的最终空位。

可用的算法的另一个例子是BLAST算法，由Altschul等所描述(Altschul等人，J.Mol.Biol.，215：403-410，[1990]；和Karlin等人，Proc.Natl.Acad.Sci.USA 90：5873-5787[1993])。特别有用的BLAST程序是WU-BLAST-2程序(参见Altschul等人，Meth.Enzymol.266：460-480[1996])。WU-BLAST-2使用几种研究参数，大部分设定为缺省值。可调的参数用下列数值设定：重叠跨距(overlap span)＝1，重叠分数(overlapfraction)＝0.125，字符阈值(word threshold)(T)＝11。HSP S和HSPS2参数是动态的值，由程序本身根据具体序列的组成和目的序列所针对搜索的具体数据库的组成建立。然而，这些值可以调节以增加敏感度。％氨基酸序列同一性值用匹配的相同残基数除以比对的区域中较长的序列的残基总数来测定。“较长”序列是在比对区域具有最多实际残基的序列(忽略为了最大化比对分值而由WU-Blast-2引入的空位)。

因此，“核酸序列同一性百分数”定义为候选序列中与此处公开的序列的核苷酸残基相同的核苷酸残基的百分比。优选的方法使用设定为缺省参数的WU-BLAST-2的BLASTN模块，分别将重叠跨距和重叠分数设定为1和0.125。

在一些实施方式中，比对包括在要比对的序列中引入空位。另外，对于比候选核酸序列含有更多或更少核苷酸的序列，应理解的是，与核苷酸的总数相比，同源性的百分数应基于同源核苷酸的数量来测定。所以，例如，如下所述比此处鉴定的序列短的序列的同源性应用该较短序列的核苷酸数量来测定。

此处使用的“多核苷酸构建体”“表达盒”和“表达载体”是指含有有效连接到适宜控制序列的DNA序列的DNA构建体，该控制序列能够影响DNA在适当宿主中的表达。这样的控制序列包括影响转录的启动子、控制该转录的可选操纵子序列、编码适当的mRNA核糖体结合位点的序列和控制转录和翻译终止的序列。通常，多核苷酸构建体包括有效连接到蛋白质编码区域的转录调节区域(例如启动子)。在一些实施方式中，多核苷酸构建体包括有效连接到是天然启动子的一个启动子的蛋白质编码区域(即，该启动子与在自然中发现的一样，与该编码序列邻接)。因此，例如，本发明的多核苷酸构建体包括sigH启动子和ymaH编码序列。在其他实施方式中，该多核苷酸构建体包括有效连接到不是天然的邻接启动子的启动子上的蛋白质编码区域(即，该多核苷酸构建体包括嵌合多核苷酸，其中在该构建体中相对于编码序列的启动子位置并未在自然中发现)。例如，sigA启动子有效连接到ymaH编码序列。在其他实施方式中，该多核苷酸构建体包括多于一个的启动子和多于一个的蛋白质编码区域(例如，该多核苷酸构建体包括多顺反子序列，该多顺反子序列包括多个启动子和编码区域，如一个操纵子中发现的那样)。在一些其他的实施方式中，多核苷酸构建体或表达盒包括选择性标记(例如抗生素抗性标记，例如编码氯霉素乙酰基转移酶的基因)，当适当的抗生素存在时，这些标记能使得在宿主细胞的基因组中的该多核苷酸构建体扩增。上述多核苷酸构建体能够合并入质粒、基因组、线粒体DNA、质体DNA、病毒或核酸片段中。在一些实施方式中，载体是质粒、噬菌体颗粒或简单的潜在的基因组插入物。在另外的一些实施方式中，一旦转化入合适的宿主中，载体独立于宿主基因组复制并发挥功能，或者，在一些备选的情况下，整合入基因组本身中。此处使用的“质粒”“表达质粒”“载体”经常可以互换使用，因为质粒是目前最常用的载体形式。然而，本发明意在包括那些行使同样功能、并且为本领域已知或将为本领域公知的表达载体的其他形式。“载体”包括克隆载体、表达载体、穿梭载体、质粒、噬菌体或病毒颗粒、DNA构建体、盒等。

此处使用的术语“质粒”是指用作克隆载体的环状双链(ds)DNA构建体，其在许多细菌和一些真核细胞中形成染色体外自主复制遗传元件。在一些实施方式中，质粒将整合入宿主细胞的基因组中。术语“质粒”包括能够通过同源重组整合入宿主细胞基因组中的多拷贝质粒。

此处使用的术语“转化的”和“稳定转化的”是指具有整合到其基因组中的非天然(异源的)多核苷酸序列的细胞，或包括保持至少两代或更多代的游离质粒的细胞。此处使用的术语“表达”是指转录多核苷酸，并将得到的转录物翻译以产生多肽的过程。该过程包括转录和翻译。

术语“过表达”此处是指含有编码多肽的序列的基因在改良的细胞中被人工表达，以产生所编码的多肽，该多肽的表达水平超过相同多肽在前体宿主细胞中的表达水平。因此，虽然该术语通常与基因连用，术语“过表达”也可以与蛋白质连用，来表示由于其编码基因的过表达导致的蛋白质水平的升高。在一些实施方式中，编码蛋白质的基因的过表达通过增加编码该蛋白质的基因的拷贝数来达到。在另外的实施方式中，编码蛋白质的基因的过表达通过以如此方式提高启动子区域和/或核糖体结合位点的结合强度，以提高编码该蛋白质的基因的转录和/或翻译来达到。在其他的实施方式中，过表达可以通过增加基因的拷贝数和提高启动子区域和/或核糖体结合位点的结合强度来达成。在一些实施方式中，编码蛋白质的基因的过表达是由于相应的编码多核苷酸的至少一个拷贝的表达，这些核苷酸存在于已经引入宿主细胞中的多拷贝质粒中。在其他实施方式中，编码蛋白质的基因的过表达是由于相应编码多核苷酸的两个或多个拷贝的表达，该多核苷酸整合入宿主细胞基因组中。

“宿主细胞”是指来自作为包括本发明的DNA的表达载体的宿主的细胞的适宜细胞。适宜的宿主细胞可以是天然存在的或野生型宿主细胞，或者可以是改变的宿主细胞。在一个实施方式中，该宿主细胞是革兰氏阳性微生物。在一些优选的实施方式中，该术语是指杆菌属的细胞。

此处使用的“杆菌细胞”包括本领域技术人员已知的所有成员，包括但不限于枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、B.halodurans、巨大芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌和苏云金芽孢杆菌。应承认，杆菌属还在持续进行分类学上的重新组织。所以，杆菌属包括那些已经重新分类的物种，包括但不限于例如嗜热脂肪芽孢杆菌(现在命名为Geobacillus stearothermophilus)等微生物。氧气存在下抵抗性的内生孢子被认为是杆菌属的定义性特征，虽然该特征也适用于现在命名的环脂芽孢杆菌(Alicyclobacillus)、兼性芽孢杆菌(Amphibacillus)、解硫胺素芽孢杆菌(Aneurinibacillus)、厌氧芽孢杆菌(Anoxybacillus)、短芽孢杆菌(Brevibacillus)、Filobacillus、薄壁芽孢杆菌(Gracilibacillus)、喜盐芽孢杆菌(Halobacillus)、类芽孢杆菌(Paenibacillus)、需盐芽孢杆菌(Salibacillus)、耐热芽孢杆菌(Thermobacillus)、Ureibacillus和枝芽孢杆菌(Virgibacillus)。

野生型宿主细胞是没有用重组方法遗传改变的宿主细胞。

当此处使用的术语“野生型”涉及基因或基因产物时，是指具有分离自天然存在来源的基因或基因产物的特征。通常，野生型基因是在种群中最常观察到的基因，因此被任意地命名为该基因的“正常”或“野生型”形式。此处使用的术语“野生型序列”和“野生型基因”可以互换使用，是指在宿主细胞中天然的或天然产生的序列。野生型序列可以编码同源的或异源的蛋白质。

此处使用的“改变的宿主细胞”“改变的细胞”和“改变的菌株”是指遗传工程化的宿主细胞(微生物)，其中目的蛋白质的表达和/或生产水平大于相同目的蛋白质在未改变或野生型宿主细胞在基本相同生长条件下生长时表达和/或生产的水平。在一些实施方式中，改变的宿主细胞是重组的产蛋白酶细胞。

“改良的细胞”和“改良的宿主细胞”是指已经遗传工程化以过表达编码YmaH蛋白质的基因的野生型或改变的宿主细胞。在一些实施方式中，改良的宿主细胞是重组的产蛋白酶细胞。在一些实施方式中，改良的宿主细胞能够以高于野生型或改变的亲本宿主细胞的水平表达和/或生产目的蛋白质。

“亲本”或“前体”细胞是指改良的宿主细胞所来自的细胞，亲本或前体细胞可以是野生型或改变的细胞。在一些实施方式中，改变的亲本细胞能够以高于未改变或野生型亲本/前体细胞的水平表达和/或生产目的蛋白质。

在将核酸序列引入细胞的语境中，术语“引入”是指适宜于将核酸序列转移入该细胞的任何方法。这样的引入方法包括但不限于原生质体融合、转染、转化、接合和转导(参见，例如Ferrari等人，“Genetics”出自Hardwood等人(编著)，Bacillus，Plenum Publishing Corp.，第57-72页，[1989])。

此处使用的术语“转化的”和“稳定转化的”是指具有整合到其基因组中的非天然(异源的)多核苷酸序列的细胞，或包括保持至少两代的作为游离质粒存在的异源多核苷酸序列的细胞。

此处使用的“转化DNA/多核苷酸”“转化序列”和“DNA/多核苷酸构建体”是指用于将序列引入宿主细胞或微生物的DNA。“转化DNA”是用于将序列引入宿主细胞或生物的DNA。该DNA可以通过PCR或任何其他适宜技术体外产生。在一些优选的实施方式中，转化DNA包括输入顺序(incoming sequence)，而在其他优选的实施方式中，进一步包含两侧有同源性盒的输入顺序。在又一个实施方式中，转化DNA包括加入到末端的其他非同源性序列(即填充序列或侧翼)。在一些实施方式中，末端被关闭，使得该转化DNA形成闭合的环，例如加入载体中。

此处使用的术语“编码可选择性标记的多核苷酸序列”是指能够在宿主细胞中表达的核苷酸序列，而且该可选择性标记的表达赋予含有该表达基因的细胞在存在相关选择性试剂时或缺乏基本营养物时生长的能力。

此处使用的术语“可选择性标记”是指能够在宿主细胞中表达的基因，其使得含有该载体的宿主容易选择出来。这样的可选择性标记的例子包括但不限于抗生素(例如卡那霉素、红霉素、放线菌素、氯霉素和四环素)。因此，术语“可选择性标记”是指提供宿主细胞已经摄取了目的DNA或一些其他反应已经发生的指征的基因。通常，可选择性标记是对宿主细胞赋予抗生素抗性或代谢优势的基因，以使含有该外源DNA的细胞能够从在转化中没有接受任何外源序列的细胞中区别出来。“居留可选择性标记”是位于转化的微生物基因组上的标记。居留可选择性标记编码的基因不同于在转化DNA构建体上的可选择性标记。

此处使用的术语“扩增”和“基因扩增”是指使特定的DNA序列不成比例地复制的方法，从而该扩增的基因以比原来在基因组存在的数量高的拷贝数存在。在一些实施方式中，在药物(例如可抑制酶的抑制剂)存在下通过生长对细胞的选择导致该药物存在时编码生长所需基因产物的内源性基因的扩增，或者通过编码该基因产物的外源性(即输入的)序列的扩增，或者两者兼备。在药物(例如可抑制酶的抑制剂)存在下通过生长对细胞的选择可以导致编码该药物存在时生长所需的基因产物的内源性基因的扩增，或者通过编码该基因产物的外源性(例如输入的)序列的扩增，或者两者兼备。

此处使用的术语“多肽”是指由通过肽键连接的氨基酸残基构成的化合物。在一些实施方式中，此处使用的术语“蛋白质”是术语“多肽”的同义词。在一些备选的实施方式中，是指两个或更多个多肽的复合物。因此，术语“蛋白质”和“多肽”可互换使用。

术语“YmaH蛋白质”与“Hfq蛋白质”可互换使用，是指增强目的蛋白质表达的蛋白质。在YmaH的语境中，“YmaH蛋白质”是指野生型YmaH蛋白质及其变体，包括直向同源物。

此处使用的“变体”是指来自前体蛋白质(例如枯草芽孢杆菌YmaH蛋白质)的蛋白质，通过加入一个或多个氨基酸至C末端或N末端或两端都加、在氨基酸序列的一个或多个不同位点处一个或多个氨基酸的取代、在蛋白质的某一端或两端、或者在氨基酸序列的一个或多个位点删除一个或多个氨基酸，和/或在氨基酸序列的一个或多个位点插入一个或多个氨基酸。“枯草芽孢杆菌YmaH蛋白质“是指如下所述修饰的枯草芽孢杆菌YmaH蛋白质。枯草芽孢杆菌YmaH蛋白质变体的制备优选通过修饰编码天然蛋白的DNA序列、该DNA序列向适宜宿主中的转化和该修饰的DNA序列的表达来达成，以形成该衍生的酶。本发明的变体枯草芽孢杆菌YmaH蛋白质包括与前体酶氨基酸序列相比含有氨基酸序列改变的肽，其中该变体枯草芽孢杆菌YmaH蛋白质保持了在枯草芽孢杆菌细胞中增强目的蛋白质生产的能力，其中YmaH蛋白是过表达的。变体的活性与前体分泌因子相比，可以是升高的或降低的。应理解本发明的变体可以来自编码枯草芽孢杆菌YmaH蛋白质变体的DNA片段，其中保持了表达的枯草芽孢杆菌YmaH蛋白质变体的功能活性。

“目的蛋白质”和“目的多肽”是指用宿主细胞生产的蛋白质/多肽。通常，目的蛋白质是具有商业意义的想要的蛋白质。目的蛋白质可以与宿主同源或异源。在一些实施方式中，目的蛋白质是分泌的多肽、特别是酶，包括但不限于淀粉酶、蛋白水解酶、溶细胞的酶、氧化还原酶和植物细胞壁降解的酶。在进一步的实施方式中，这些酶包括但不限于：淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶、纤维素酶、半纤维素酶、酯酶、过氧化物酶、过氧化氢酶、葡萄糖氧化酶、植酸酶、果胶酶、葡萄糖苷酶、异构酶、转移酶、半乳糖苷酶和壳多糖酶。在更进一步的实施方式中，表达的多肽是激素、细胞因子、生长因子、受体、疫苗、抗体等。这并不意味着本发明限于任何具体的蛋白质/多肽，在一些最优选的实施方式中，表达的目的蛋白质是蛋白酶。

此处使用的术语“异源蛋白质”是指不是在宿主细胞中天然存在的蛋白质或多肽。异源蛋白质的例子包括酶，例如，包括蛋白酶、纤维素酶、淀粉酶、其他糖酶和酯酶的水解酶，诸如消旋酶、差向异构酶、互变异构酶(tautomerase)或突变酶的异构酶；转移酶；激酶和磷酸酶。在一些实施方式中，这些蛋白质是有治疗意义的蛋白质或肽，包括但不限于生长因子、细胞因子、配体、受体和抑制剂，以及疫苗和抗体。在一些备选的实施方式中，蛋白质是商业上重要的工业蛋白质或肽(例如，蛋白酶、诸如淀粉酶和葡糖淀粉酶的糖酶、纤维素酶、氧化酶和酯酶)。在一些实施方式中，编码该蛋白质的基因是天然存在的基因，而在其他实施方式中，使用突变和/或合成的基因。在一些实施方式中，编码该蛋白质的基因是天然存在的基因，而在其他实施方式中，使用突变和/或合成的基因。

此处使用的术语“同源蛋白质”是指在宿主细胞中天然存在的蛋白质或多肽。本发明包括通过重组DNA技术生产同源蛋白质的宿主细胞。在备选的实施方式中，该同源蛋白质是其他生物(包括但不限于大肠杆菌(E.coli))生产的天然蛋白质。本发明包括通过重组DNA技术生产同源蛋白质的宿主细胞。本发明进一步包括宿主细胞，其具有编码天然存在的同源蛋白质(例如蛋白酶)的核酸的一个或多个删除，或一个或多个中断，并具有以重组形式再次引入(即在表达盒中引入)的编码该同源蛋白质的核酸。在其他实施方式中，宿主细胞生产同源蛋白质。

此处使用的术语“蛋白酶”和“蛋白水解活性”是指具有能够水解肽或具有肽键的底物的能力的蛋白质或肽。存在许多公知的方法来测量蛋白水解活性((Kalisz，“Microbial Proteinases”出自Fiechter(编著)，Advances in Biochemical Engineering/Biotechnology，[1988])。例如，蛋白水解活性可以通过比较实验来确定，该实验分析了生产的蛋白酶水解商业底物的能力。用于这种蛋白酶或蛋白水解活性分析的示例性底物包括但不限于，二甲基酪蛋白(Sigma C-9801)，牛胶原(Sigma C-9879)，牛弹性蛋白(Sigma E-1625)和牛角蛋白(ICN Biomedical 902111)。使用这些底物的比色法为本领域所公知，参见，例如WO 99/34011和美国专利No.6,376,450，其通过引入本申请作为参考。AAPF实验(参见，例如DelMar等人，Anal.Biochem.，99：316-320[1979])也可以用于测定成熟蛋白酶的生产。该实验测量当酶水解可溶性合成底物琥珀酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-对-硝基苯胺(sAAPF-pNA)时的对硝基苯胺释放率。用分光光度计在410nm处测量从水解反应中产生的黄色的产生率，其与活性酶浓度成比例比较。

此处使用的术语“活性”是指与特定蛋白质相关的生物活性，例如与蛋白酶相关的蛋白水解活性。生物活性是指本领域技术人员通常标志该蛋白质的任何活性。

术语“生产”当涉及目的蛋白质时，包括多肽生产的加工步骤，包括去除前区(pro region)，通常形成多肽的活性成熟形式，其已知在成熟过程中产生。在一些实施方式中，多肽的生产包括信号肽的去除，其已知会在蛋白质分泌过程中出现(参见，例如Wang等人，Biochemistry37：3165-3171(1998)和Power等人，Proc Natl Acad Sci USA 83：3096-3100[1986])。在一些实施方式中，表达的蛋白质被限制在其表达的细胞的细胞内环境中，而在其他实施方式中，表达的蛋白质分泌到细胞外环境中。因此，在一些实施方式中，目的蛋白质的生产包括蛋白质表达以及其分泌到细胞外基质的细胞过程。例如，蛋白酶的生产包括全长蛋白酶的两个加工步骤：1.信号肽的去除，已知会在蛋白质分泌过程中发生；和2.前区的去除，其形成酶的活性成熟形式，已知会在成熟过程中发生(Wang等人，Biochemistry 37：3165-3171(1998)；Power等人，Proc Natl Acad Sci USA83：3096-3100[1986])。

此处的术语“早期表达和/或早期生产”表示目的蛋白质的表达和/或生产在宿主细胞中发生的时间早于目的蛋白质通常在前体/亲本宿主中表达的时间。在一些实施方式中，目的蛋白质“早期表达和/或生产”在过表达YmaH的宿主中的发生早于没有过表达ymaH的宿主细胞。

此处使用的术语“增强”是指目的蛋白质的改善的生产。在优选的实施方式中，本发明提供目的蛋白质在改良宿主中增强的(即改善的)生产。在这些实施方式中，该“增强的”生产与未改良的野生型或改变的亲本宿主(例如野生型细胞，或不过表达转录激活子如YmaH的改变的细胞)生产的正常水平相比，得到了改善。

YmaH多肽和多核苷酸构建体

在一些实施方式中，本发明提供了包含启动子和编码YmaH蛋白质多核苷酸序列的多核苷酸构建体。枯草芽孢杆菌YmaH，也叫HFQ_BACSU，是RNA结合蛋白，是RNA结合蛋白的Hfq家族的一个成员(Sauter等人，Nucleic Acid Res 31：4091-4098，[2003])。YmaH蛋白质在枯草芽孢杆菌中由ymaH基因编码，该基因是大肠杆菌的hfq基因的直向同源基因(Silvaggi等人，J Bacteriol.187(19)：6641-6650，[2005])。YmaH是原核生物中大量且广泛存在的RNA结合蛋白，行使RNA代谢的基因多效性调节子的功能，在稳定一些转录物并降解其他转录物中需要该蛋白。YmaH优先结合到未组织的富含A/U的RNA序列，在序列和结构上都与真核生物中的Sm蛋白相似。还已知YmaH也结合称为核糖核酸调节物的小RNA分子，该分子调整RNA转录物的稳定性或翻译效率。

本发明提供用于过表达ymaH的方法和组合物，其增加已经改良为过表达ymaH的宿主细胞中目的蛋白的生产。另外，如本文所示，ymaH的过表达增强了杆菌宿主细胞中蛋白酶的生产。ymaH的过表达可以通过多种方法得到，包括增强编码YmaH的多核苷酸的转录和/或翻译。例如，在转录水平，ymaH的过表达可以通过在宿主细胞中增加编码ymaH的多核苷酸序列的数量来达到，和/或提高ymaH启动子的结合强度以提高相关RNA聚合酶的活性来达到。在翻译水平，ymaH的过表达可以通过突变核糖体结合位点(RBS)以提高核糖体与RBS的亲和性，进而增强翻译活性来达到。本领域技术人员可以知晓ymaH的过表达可以仅仅通过ymaH基因拷贝数量的升高来完成，或者联合其他对ymaH基因的可能修饰来达到ymaH的过表达。

本发明提供了能够过表达ymaH的包括多核苷酸构建体、载体和宿主细胞的组合物。本发明还提供了使用本发明的组合物过表达目的蛋白质的方法。本发明的多核苷酸构建体包括编码YmaH蛋白质的多核苷酸序列和SigA和/或SigH启动子。

在一个实施方式中，本发明通过增加编码ymaH的多核苷酸序列的数量来提供ymaH的过表达。因此，本发明提供包含有效连接到ymaH启动子的编码ymaH的多核苷酸序列的多核苷酸构建体。ymaH启动子可以是驱动ymaH表达的任何启动子(例如SigA和/或SigH启动子)，可以是在选择的宿主细胞中表现转录活性的任何核酸序列，包括突变体、截短的和杂合体启动子，而且可以从编码细胞外或细胞内多肽的基因得到，不论这些基因对于宿主细胞是同源的还是异源的。该启动子序列对于宿主细胞可以是天然的或外来的。

在一些实施方式中，启动子序列可以得自细菌。在一些实施方式中，启动子序列可以得自革兰氏阳性菌，例如芽孢杆菌属菌株(例如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽胞杆菌、巨大芽孢杆菌、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌)；或链霉菌属菌株(例如浅青紫链霉菌(Steptomyces lividans)或鼠灰链霉菌(Streptomycesmurinus))；或来自革兰氏阴性菌(例如大肠杆菌或假单胞菌属物种)。

ymaH的转录可以天然地由两个启动子驱动：SigA启动子，存在于miaA编码区上游，和SigH启动子，存在于枯草芽孢杆菌的miaA操纵子中紧靠着ymaH编码区的上游。在一些实施方式中，本发明提供多核苷酸构建体，包括编码YmaH的多核苷酸序列和SigA启动子(例如SEQ IDNOs：2和3)。SEQ ID NOs：2和3例证了其中ymaH编码区邻接于SigA启动子序列以提供嵌合多核苷酸构建体的实施方式。在一些优选的实施方式中，因此嵌合多核苷酸构建体包含天然存在时不与ymaH编码序列邻接的启动子序列。例如，SEQ ID NOS：2和3分别示例了嵌合构建体SigA和SigA2，均包含有效连接到编码ymaH的多核苷酸序列的SigA启动子。

GCGCCGAATTCTCATACCCTGAAAGGAAAGACAAGGGAAATTGTCGGCAATGAGCCGCTCGGCAGGTAGAAGGATGTTTACCGATGCAAAAAAAGGGCAAAATGGATAGGTGGTTGTCCATGTTGAATGCTATAATGGGGGAGATTTATAAAAGAGAGTGATACATATTGAATAATACGAAGCAGCCCCACACATATAGCAGGAAAACTCGAACTTTAATCGAAACTGTATGATATAGAGAATCAAGGAGGACGAAACATGAAACCGATTAATATTCAGGATCAGTTTTTGAATCAAATCCGGAAAGAAAATACGTATGTCACTGTTTTTTTGCTGAACGGCTTTCAGTTGCGGGGCCAGGTGAAAGGCTTTGATAACTTTACCGTATTGTTGGAATCGGAAGGTAAGCAGCAGCTTATATATAAACATGCGATCTCAACGTTTGCGCCGCAAAAAAACGTCCAGCTTGAACTCGAATAGATCAAAAAATGCCATGTCAAGACATGAGGAAAGGCTGTCGGGGGTTCCCGGCGGCCATTTTTAACATGAATCCACTTTTGCTCCAAGCTTTTTGTGTAAGCTGACCATGCCAAGGCACGGTCTTTTTTTATGAGGGATCCGGTGCC(SEQ ID NO：2)

GCGCCGAATTCTCATACCCTGAAAGGAAAGACAAGGGAAATTGTCGGCAATGAGCCGCTCGGCAGGTAGAAGGATGTTTACCGATGCAAAAAAAGGGCAAAATGGATAGGTGGTTGTCCATGTTGAATGCTATAATGGGGGAGATTTATAAAAGAGAGTGCTCGAACTTTAATCGAAACTGTATGATATAGAGAATCAAGGAGGACGAAACATGAAACCGATTAATATTCAGGATCAGTTTTTGAATCAAATCCGGAAAGAAAATACGTATGTCACTGTTTTTTTGCTGAACGGCTTTCAGTTGCGGGGCCAGGTGAAAGGCTTTGATAACTTTACCGTATTGTTGGAATCGGAAGGTAAGCAGCAGCTTATATATAAACATGCGATCTCAACGTTTGCGCCGCAAAAAAACGTCCAGCTTGAACTCGAATAGATCAAAAAATGCCATGTCAAGACATGAGGAAAGGCTGTCGGGGGTTCCCGGCGGCCATTTTTAACATGAATCCACTTTTGCTCCAAGCTTTTTGTGTAAGCTGACCATGCCAAGGCACGGTCTTTTTTTATGAGGGATCCGGTGCC(SEQ ID NO：3)

在另一个实施方式中，本发明提供了多核苷酸构建体，包括编码YmaH的多核苷酸序列和SigH启动子(例如SEQ ID NO：1的SigH构建体，如下所示)。SEQ ID NO：1还示例了包含天然与SigH启动子邻接的ymaH编码序列的多核苷酸构建体。

GGCACCGAATTCGACGTGGTTTCGCAACAAAATGCAGGTCACATGGTTCGATATGACACCGCCTGTTGATATGGAGCTGAAAAAAAAGGAAATTTTCACACATATAGCAGGAAAACTCGAACTTTAATCGAAACTGTATGATATAGAGAATCAAGGAGGACGAAACATGAAACCGATTAATATTCAGGATCAGTTTTTGAATCAAATCCGGAAAGAAAATACGTATGTCACTGTTTTTTTGCTGAACGGCTTTCAGTTGCGGGGCCAGGTGAAAGGCTTTGATAACTTTACCGTATTGTTGGAATCGGAAGGTAAGCAGCAGCTTATATATAAACATGCGATCTCAACGTTTGCGCCGCAAAAAAACGTCCAGCTTGAACTCGAATAGATCAAAAAATGCCATGTCAAGACATGAGGAAAGGCTGTCGGGGGTTCCCGGCGGCCATTTTTAACATGAATCCACTTTTGCTCCAAGCTTTTTGTGTAAGCTGACCATGCCAAGGCACGGTCTTTTTTTATGAGGGATCCGGAGCC(SEQ ID NO：1)

在又一个实施方式中，本发明提供了多核苷酸构建体，其包括编码YmaH的多核苷酸序列和SigA和SigH启动子(例如如下所示的SEQ IDNO：13的SigA3构建体)。

TCATACCCTGAAAGGAAAGACAAGGGAAATTGTCGGCAATGAGCCGCTCGGCAGGTAGAAGGATGTTTACCGATGCAAAAAAAGGGCAAAATGGATAGGTGGTTGTCCATGTTGAATGCTATAATGGGGGAGATTTATAAAAGAGAGTGATACATATTGAATAATACGAAGCAGCCCGTTGTCATTTTAGTCGGACCGACGGCAGTGGGGAAAACCAATTTAAGTATTCAGCTAGCCAAATCCTTAAACGCGGAAATTATCAGCGGAGATTCGATGCAGATTTATAAAGGGATGGATATTGGAACAGCTAAAATTACCGAACAGGAGATGGAGGGAGTGCCCCATCATCTGATTGACATTTTAGATCCCCAAGACTCTTTCTCTACTGCCGATTATCAAAGCTTAGTAAGAAATAAAATCAGCGAGATTGCAAATAGAGGAAAGCTTCCGATGATTGACGGCGGTACAGGGCTTTATATACAATCTGAGCTTTACGATTATACATTTACGGAAGAGGCAAATGATCCCGTGTTTCGAGAGAGCATGCAAATGGCTGCTGAGCGGGAAGGCGCTGACTTTCTTCATGCCAAACTTGCTGCAGCAGATCCCGAGGCAGCAGCTGCGATTCATCCGAATAATACAAGAAGAGTCATTCGCGCACTGGAAATTTTACATACGTCCGGAAAAACGATGTCCCAGCATTTGAAGGAACAAAAACGAGAACTTCTGTACAATGCAGTGTTAATTGGCCTGACAATGGATAGAGACACGCTTTACGAAAGAATTAATCAGCGGGTCGATTTGATGATGCAGTCAGGCCTTCTTCCGGAAGTGAAACGCTTATACGACAAGAACGTGAGAGACTGTCAATCAATACAGGCGATAGGCTATAAAGAGCTGTATGCATATTTTGACGGTTTTGTGACACTTTCCGATGCTGTCGAACAGCTAAAGCAGAACTCGAGGCGGTATGCGAAACGCCAGCTGACGTGGTTTCGCAACAAAATGCAGGTCACATGGTTCGATATGACACCGCCTGTTGATATGGAGCTGAAAAAAAAGGAAATTTTCACACATATAGCAGGAAAACTCGAACTTTAATCGAAACTGTATGATATAGAGAATCAAGGAGGACGAAACATGAAACCGATTAATATTCAGGATCAGTTTTTGAATCAAATCCGGAAAGAAAATACGTATGTCACTGTTTTTTTGCTGAACGGCTTTCAGTTGCGGGGCCAGGTGAAAGGCTTTGATAACTTTACCGTATTGTTGGAATCGGAAGGTAAGCAGCAGCTTATATATAAACATGCGATCTCAACGTTTGCGCCGCAAAAAAACGTCCAGCTTGAACTCGAATAGATCAAAAAATGCCATGTCAAGACATGAGGAAAGGCTGTCGGGGGTTCCCGGCGGCCATTTTTAACATGAATCCACTTTTGCTCCAAGCTTTTTGTGTAAGCTGACCATGCCAAGGCACGGTCTTTTTTTATGAG(SEQ ID NO：13)

指导ymaH基因表达的适宜启动子例子是来自枯草芽孢杆菌操纵子(包含编码miaA的基因)的SigA和SigH启动子，例如，在一个实施方式中，本发明提供了限定SigA启动子的多核苷酸序列(SEQ ID NO：14，如下所示)。

TCATACCCTGAAAGGAAAGACAAGGGAAATTGTCGGCAATGAGCCGCTCGGCAGGTAGAAGGATGTTTACCGATGCAAAAAAAGGGCAAAATGGATAGGTGGTTGTCCATGTTGAATGCTATAATGGGGGAGATTTATAAAAGAGAGTGATACATA(SEQ ID NO：14)

在另一个实施方式中，本发明提供了限定SigH启动子的多核苷酸序列(SEQ ID NO：16，如下所示)。

AAAGGAAATTTTCACACATATAGCAGGAAAACTCGAACTTTAATCGAAACTGTATGATATAGAGAATCAAGGAGGACGAAAC(SEQ ID NO：16)

能够用于表达ymaH基因的启动子的其他例子包括被σ^A因子识别的Sigma A启动子，其包括天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)的启动子、迟缓芽孢杆菌碱性蛋白酶基因(aprH)的启动子、地衣芽胞杆菌碱性蛋白酶基因(枯草杆菌蛋白酶Carlsberg基因)的启动子、枯草芽孢杆菌果聚糖蔗糖酶(levansucrase)基因(sacB)的启动子、枯草芽孢杆菌α-淀粉酶基因(amyE)的启动子、地衣芽胞杆菌α-淀粉酶基因(amyL)的启动子、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)的启动子和解淀粉芽孢杆菌α-淀粉酶基因(amyQ)的启动子。能够用于表达ymaH基因的启动子的例子包括被σ^H因子识别的Sigma H启动子，包括spo0A、spo0F、spoVG和citG(参见Helmann，J.D.和C.P.Moran.，2002，RNA polymerase and sigma factors，第289-312页，出自A.L.Sonenshein，J.A.Hoch和R.Losick(编著)，Bacillus subtilis and its closest relatives：from genes to cells，American Society for Microbiology，Washington，D.C.)。

在一些实施方式中，共有的SigA和/或SigH启动子可以用于本发明。共有启动子(consensus promoter)的构建可以通过定点诱变形成启动子来达成，该启动子更完全地符合针对枯草芽孢杆菌的无性“Sigma A型”启动子的“-10”和“-35”区域所建立的共有序列(Voskuil等人，Mol Microbiol17：271279[1995])。在其他实施方式中，共有启动子通过定点诱变形成启动子来达成，该启动子更完全地符合针对枯草芽孢杆菌的无性“Sigma H型”启动子的“-10”和“-35”区域所建立的共有序列(参见Helman和Moran，自Bacillus subtilis and its closest relatives，Ch.21，第289-312页；Sonenshein等人(2002 ASM Press，Washington，D.C.)。用于sigma A型启动子的“-35”区的共有序列是TTGaca，用于“-10”区的序列是tgnTATaat，用于sigma H型启动子的“-35”区的共有序列是RnAGGAwWW，用于“-10”区的序列是RnnGAAT。大写字母表示高度保守的位置；小写字母表示保守性较低的位置；缩写R可以是A或G，缩写W可以是A或T。共有启动子可以从能够在杆菌宿主细胞中发挥功能的任何启动子获得。

在一些实施方式中，包含SEQ ID NO：14的SigA启动子，限定为天然存在于miaA编码序列(SEQ ID NO：15，如下所示)上游的多核苷酸序列；而包含SEQ ID NO：16的SigH启动子，限定为天然存在于yamH编码序列(SEQ ID NO：17，如下所示)上游的多核苷酸序列。

TTGAATAATACGAAGCAGCCCGTTGTCATTTTAGTCGGACCGACGGCAGTGGGGAAAACCAATTTAAGTATTCAGCTAGCCAAATCCTTAAACGCGGAAATTATCAGCGGAGATTCGATGCAGATTTATAAAGGGATGGATATTGGAACAGCTAAAATTACCGAACAGGAGATGGAGGGAGTGCCCCATCATCTGATTGACATTTTAGATCCCCAAGACTCTTTCTCTACTGCCGATTATCAAAGCTTAGTAAGAAATAAAATCAGCGAGATTGCAAATAGAGGAAAGCTTCCGATGATTGACGGCGGTACAGGGCTTTATATACAATCTGAGCTTTACGATTATACATTTACGGAAGAGGCAAATGATCCCGTGTTTCGAGAGAGCATGCAAATGGCTGCTGAGCGGGAAGGCGCTGACTTTCTTCATGCCAAACTTGCTGCAGCAGATCCCGAGGCAGCAGCTGCGATTCATCCGAATAATACAAGAAGAGTCATTCGCGCACTGGAAATTTTACATACGTCCGGAAAAACGATGTCCCAGCATTTGAAGGAACAAAAACGAGAACTTCTGTACAATGCAGTGTTAATTGGCCTGACAATGGATAGAGACACGCTTTACGAAAGAATTAATCAGCGGGTCGATTTGATGATGCAGTCAGGCCTTCTTCCGGAAGTGAAACGCTTATACGACAAGAACGTGAGAGACTGTCAATCAATACAGGCGATAGGCTATAAAGAGCTGTATGCATATTTTGACGGTTTTGTGACACTTTCCGATGCTGTCGAACAGCTAAAGCAGAACTCGAGGCGGTATGCGAAACGCCAGCTGACGTGGTTTCGCAACAAAATGCAGGTCACATGGTTCGATATGACACCGCCTGTTGATATGGAGCTGAAAAAAAAGGAAATTTTCACACATATAGCAGGAAAACTCGAACTTTAA(SEQ ID NO：15)

ATGAAACCGATTAATATTCAGGATCAGTTTTTGAATCAAATCCGGAAAGAAAATACGTATGTCACTGTTTTTTTGCTGAACGGCTTTCAGTTGCGGGGCCAGGTGAAAGGCTTTGATAACTTTACCGTATTGTTGGAATCGGAAGGTAAGCAGCAGCTTATATATAAACATGCGATCTCAACGTTTGCGCCGCAAAAAAACGTCCAGCTTGAACTCGAATAG(SEQ ID NO：17)

本发明还涉及与相应野生型启动子活性相比已经突变为启动子活性提高的启动子序列，导致YmaH蛋白质的过表达。因此，可以理解限定SigA和SigH启动子的序列的变体可以用于本发明的构建体。用于在杆菌属物种中制备启动子变体的方法为本领域所公知(参见，例如Helmann等人，2002，RNA polymerase and sigma factors，第289-312页，出自A.L.Sonenshein，J.A.Hoch和R.Losick(编著)，Bacillus subtilis and its closestrelatives：from genes to cells，American Society for Microbiology，Washington，D.C.))。这并不意味着本发明限制为任何具体的启动子，因为本领域技术人员已知的任何适宜启动子都可以用于本发明。然而，在一些实施方式中，启动子是枯草芽孢杆菌sigH启动子，而在其他实施方式中，启动子是枯草芽孢杆菌sigA启动子。在进一步的实施方式中，sigH和sigA启动子用于实现YmaH蛋白质的过表达。

在一些实施方式中，本发明的多核苷酸构建体还包含必需的核糖体结合位点以保证ymaH RNA转录物的最优翻译。在一些实施方式中，上述多核苷酸构建体包含miaA基因的核糖体结合位点(RBS)序列(AAGAGAG；SEQ ID NO：21)，而在其他实施方式中，多核苷酸构建体包含ymaH基因的RBS序列(GGAGG；SEQ ID NO：22)。在另外的实施方式中，多核苷酸构建体包含miaA和ymaH基因的核糖体结合位点序列。在一些实施方式中，本发明提供了在ymaH编码序列上游具有启动子和核糖体结合位点序列的构建体。本发明并不限于此处公开的核糖体结合位点序列，因为还包括已经突变了来提高ymaH基因表达水平的任何适宜的核糖体结合位点序列。获得在杆菌中提高基因表达的突变核糖体结合序列的方法为本领域所公知。例如，Band和Henner通过修饰RBS以得到与16S rRNA更牢固的碱基配对，而成功地提高了干扰素在枯草芽孢杆菌中的表达水平(Band，L.和D.J.Henner，DNA 3：17-21[1984])。

枯草芽孢杆菌中天然产生的YmaH蛋白质是一个73个氨基酸的蛋白质(SEQ ID NO：4)，由一个219个碱基对(包括终止密码子是222)的多核苷酸(EMBL初级登录号Z99113；SEQ ID NO：17)编码。

MKPINIQDQFLNQIRKENTYVTVFLLNGFQLRGQVKGFDNFTVLLESEGKQQLIYKHAISTFAPQKNVQLELE(SEQ ID NO：4)

因此，在一些实施方式中，编码YmaH的多核苷酸构建体序列是发现于野生型枯草芽孢杆菌菌株168的基因组中的天然存在的多核苷酸序列(SEQ ID NO：4)。本发明还包括变体YmaH蛋白质，包括通过删除(即截短)、添加或取代在天然蛋白的一个或多个位点上的一个或多个氨基酸从野生型蛋白衍生来的变体YmaH蛋白质。这种删除、添加和取代的方法为本领域技术人员所公知。例如，多肽的氨基酸序列变体可以通过在编码天然目的蛋白质的克隆的DNA序列中突变来制备。诱变和核苷酸序列改变的方法为本领域所公知(参见，例如Kunkel(1985)Proc.Natl.Acad.Sci.USA 82：488492；Kunkel等人(1987)Methods Enzymol.154：367382；U.S.Pat.No.4,873,192；以及其中引用的参考文献，通过引入本申请作为参考)。在构建目的蛋白质的变体时，进行对编码该变体的核苷酸序列的修饰，从而变体继续具有所需的活性。技术人员能够理解，由于遗传密码的简并性，有多种修饰的多核苷酸都编码YmaH蛋白质。在本发明一些其他的实施方式中，提供了具有与SEQ ID NO：17的多核苷酸序列具有至少约70％序列同一性、至少约75％序列同一性、至少约80％序列同一性、至少约85％序列同一性、至少约90％序列同一性、至少约92％序列同一性、至少约95％序列同一性、至少约97％序列同一性、至少约98％序列同一性或至少约99％序列同一性的核苷酸序列的多核苷酸。

在其他实施方式中，本发明的多核苷酸构建体包括与枯草芽孢杆菌菌株168的YmaH编码序列类似的YmaH编码序列。该菌株的基因组，包含在一个4215kb的基因组中，已经被很好表征了(参见Kunst等人，Nature390：249-256[1997]；和Henner等人，Microbiol.Rev.，44：57-82[1980])。在一些实施方式中，本发明的多核苷酸构建体包括编码YmaH蛋白质的多核苷酸序列，该YmaH蛋白质与YmaH蛋白质的野生型形式的氨基酸序列具有至少约65％氨基酸序列同一性、至少约70％氨基酸序列同一性、至少约75％氨基酸序列同一性、至少约80％氨基酸序列同一性、至少约85％氨基酸序列同一性、至少约90％氨基酸序列同一性、至少约92％氨基酸序列同一性、至少约95％氨基酸序列同一性、至少约97％氨基酸序列同一性、至少约98％氨基酸序列同一性和至少约99％的氨基酸序列同一性，而且与野生型多肽(SEQ ID NO：4)相比具有相当的或改善的增强目的蛋白质在宿主细胞中生产的能力，而且保持了增强目的蛋白质在宿主细胞中的表达的能力。在另外的实施方式中，本发明提供了包含与野生型杆菌序列的基因SEQ ID NO：17同源、直向同源或共生同源，而且保持了增强目的蛋白质生产的能力的多核苷酸序列的多核苷酸构建体。

本发明还包括其中包含编码在结构和/或功能上相似而相关的YmaH蛋白质的编码序列的多核苷酸构建体。在一些实施方式中，这些蛋白质来自不同的属和/或种，包括生物纲间的差异(例如细菌蛋白和真菌蛋白)。在一些实施方式中，这些蛋白质来自不同的属和/或种。在另外的实施方式中，相关的蛋白质来自相同的种。实际上，本发明并不是意图限制为来自任何具体来源的相关蛋白。此外，术语“相关蛋白”包括三级结构同源物和一级序列同源物(例如本发明的YmaH)。例如，本发明包括下列同源物，其包括但不限于下列YmaH蛋白：例如来自大肠杆菌(HFQ_ECOLI)、Shighella flexneri(HFQ_SHIFL)、鼠伤寒沙门氏菌(Salmonellatyphimurium)(HFQ_SALTY)、小肠结肠炎耶尔森菌(Yersinia enterocolitica)(HFQ_YEREN)、鼠疫耶尔森氏杆菌(Yersinia pestis)(HFQ_YERPE)、胡萝卜软腐欧文氏菌(Erwinia carotovora)(HFQ_ERWCA)、流感嗜血菌(Haemophilus influenzae)(HFQ_HAEIN)、多杀巴斯德菌(Pasteurellamultocida)(HFQ_PASMU)、霍乱弧菌(Vibrio cholerae)(HFQ_VIBCH)、铜绿假单胞菌(Pseudomonas aeruginosa)(HFQ_PSEAE)、地毯草黄单胞菌(Xanthomonas axonopodis)(HFQ_XANAC)、野油菜黄单胞菌(Xanthomonas campestris)(HFQ_XANCP)、苛养木杆菌(Xylellafastidiosa)(GSQ_XYLFA)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)(HFQ_NEIMA)、青枯雷尔氏菌(Ralstonia solanacearum)(HFQ_RALSO)、根癌土壤杆菌(Agrobacterium tumefaciens)(HFQ_AGRTS)、马尔他布鲁杆菌(Brucella melitensis)(HFQ_BRUME)、百脉根根瘤菌(Rhizobium loti)(HFQ_RHILO)、茎瘤固氮根瘤菌(Azorhizobium caulinodans)(HFQ_AZOCA)、新月柄杆菌(Caulobacter crescentus)(HFQ_CAUCR)、Aquifex melitensis(HFQ_AQUAE)、海栖热袍菌(Thermotoga maritime)(HFQ_THEMA)、丙酮丁醇梭菌(Clostridium acetobutylicum)(HFQ_CLOAB)、产气荚膜梭菌(Clostridium perfringens)(HFQ_CLOPE)、Bacillus halodurans(HFQ_BACHD)，枯草芽孢杆菌(HFQ_BACSU)、腾冲嗜热杆菌(Thermoanaerobacter tengcongensis)(HFQ_THETN)、金黄色葡萄球菌(S.aureaus)(Q99UG9)和M.jannasci(Q58830)(Sauter等人，NucleicAcids Res.31：4091-4098[2003])的YmaH。

相关的(和衍生的)蛋白质包括变体YmaH蛋白质。在一些优选的实施方式中，变体蛋白质会有少数几个氨基酸残基不同于亲本蛋白质，变体蛋白质之间也会有少数几个氨基酸残基相互不同。不同的氨基酸残基数量可以是一个或多个，优选为约1、2、3、4、5、10、15、20、30、40、50或更多个氨基酸残基。在一些优选的实施方式中，变体间不同氨基酸的数量在约1至约10之间。在一些特别优选的实施方式中，相关蛋白和特别的变体蛋白包含至少约70％、约75％、约80％、约85％、约90％、约95％、约97％、约98％或约99％的氨基酸序列同一性。本领域已知几种方法适用于产生本发明的YmaH蛋白的变体，包括但不限于点饱和诱变、扫描诱变、插入诱变、随机诱变、定点诱变和定向进化，以及各种其他重组的方法。

野生型和突变蛋白质的表征通过任何适宜的方法进行，优选基于目的性质的评价进行。例如，预期可以使用能够增强目的蛋白质生产的YmaH蛋白质。

在某些实施方式中，本发明的重组多核苷酸包含可以是为YmaH蛋白质在所用的宿主细胞中表达而密码子优化的多核苷酸序列。由于本领域公知密码子使用表(列出了各个密码子在许多细胞中的使用，参见例如Nakamura等人，Nucl.Acids Res.，28：292[2000])或容易推导出，产生要表达的蛋白质的氨基酸序列的这种核酸很容易设计出来。在一些实施方式中，密码子优化的序列包括编码与SEQ ID NO：4有至少约70％同一性的YmaH蛋白质的多核苷酸。

ymaH载体

本发明提供了包含本发明的多核苷酸构建体的载体。将这些载体引入宿主细胞中以过表达YmaH蛋白质。

在一些实施方式中，多肽的过表达是由于相应的YmaH编码多核苷酸的一个或多个拷贝的表达，这些核苷酸存在于已经引入宿主细胞中的多拷贝/复制质粒中。因此，在一些实施方式中，本发明提供了包含整合到载体中的多核苷酸构建体的载体。在一些实施方式中，载体是多拷贝/复制质粒载体，其形成在宿主细胞中过表达YmaH的染色体外自主复制遗传成分。通常，载体是质粒载体，其携带能够使含有该质粒的宿主细胞易于选择的可选择性标记基因。在宿主细胞中自主复制的载体包括含有复制起点的载体，复制起点使该载体能够在杆菌细胞中自主复制。细菌复制起点的例子是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点，和允许在杆菌中复制的质粒pUB110、pC194、pE194、pTA1060和pAMβ1的复制起点。复制起点可以是具有使其功能在杆菌细胞中为温度敏感性的突变的复制起点(参见例如Ehrlich，Proceedings of the National Academy of Sciences USA 75：1433[1978])。

如上所述，在本发明的一些实施方式中，编码YmaH蛋白质的多核苷酸通过能够在宿主细胞中复制的表达载体被引入到宿主细胞中。本领域已知的适用于杆菌的适宜复制和整合质粒参见例如Harwood和Cutting(编著)，Molecular Biological Methods for Bacillus，John Wiley&Sons，[1990]，特别是第3章；适用于枯草芽孢杆菌的复制质粒包括列于第92页的那些。

在一些实施方式中，YmaH多肽的过表达是由于编码YmaH多核苷酸的表达而产生，其至少一个拷贝整合到宿主细胞基因组中。因此，在一些实施方式中，当载体引入宿主细胞中时，载体被整合如基因组中，并与其整合入的基因组一起复制。多拷贝的ymaH基因可以在几个位点整合入宿主细胞基因组中。或者，带有编码YmaH和可选择性标记(例如抗生素抗性标记，如编码氯霉素乙酰基转移酶的基因)的序列的可扩增表达盒可以通过单次交换事件整合到基因组中，然后通过用浓度升高的适宜抗生素(如氯霉素)激发转化的宿主细胞而扩增。

在其他实施方式中，本发明提供了整合到整合型载体中的多核苷酸构建体。在一些实施方式中，整合到整合型载体中的本发明多核苷酸构建体靶向杆菌宿主细胞的染色体序列，以形成包含稳定串联整合的多载体拷贝的改良的宿主细胞。整合到整合型载体中的多核苷酸构建体通常包含提供给细胞抗生素制剂抗性的可选择性标记基因，并使该整合入的ymaH构建体能够扩增。可以出现向单个位点的串联整合，也可以出现单拷贝和两个位点的整合。不论多核苷酸构建体是整合入载体中，还是在质粒DNA不存在的情况下使用，多核苷酸构建体都用于使用任何本领域已知的适宜方法转化宿主细胞。

涉及质粒构建体和质粒转化入细菌宿主细胞的将DNA引入至杆菌细胞的方法为本领域所公知。在一些实施方式中，将质粒从大肠杆菌中分离出来，随后转化入杆菌中。然而，使用诸如大肠杆菌的间插微生物并不是必需的，在一些实施方式中，DNA构建体或载体直接引入杆菌宿主中。

本领域技术人员很清楚将多核苷酸序列引入杆菌细胞的适宜方法(参见，例如Ferrari等人，“Genetics”自Harwood等人(编著)，Bacillus，Plenum Publishing Corp.[1989]，第57-72页；Saunders等人，J.Bacteriol.，157：718-726[1984]；Hoch等人，J.Bacteriol.，93：1925-1937[1967]；Mann等人，Current Microbiol.，13：131-135[1986]；和Holubova，Folia Microbiol.，30：97[1985]；Chang等人，Mol.Gen.Genet.，168：11-115[1979]；Vorobjeva等人，FEMS Microbiol.Lett.，7：261-263[1980]；Smith等人，Appl.Env.Microbiol.，51：634[1986]；Fisher等人，Arch.Microbiol.，139：213-217[1981]；和McDonald，J.Gen.Microbiol.，130：203[1984])。实际上，已知诸如转化的这类方法，包括原生质体转化和中板集合、转导和原生质体融合，并且这类方法适用于本发明。转化的方法特别优选用于将本发明提供的DNA构建体引入至宿主细胞中。

除了常用的方法，在一些实施方式中，宿主细胞被直接转化(即，在引入宿主细胞之前不使用中间细胞来扩增(或者以其它方式加工)DNA构建体)。DNA构建体向宿主细胞中的引入包括本领域已知的将DNA引入宿主细胞，而不插入到质粒或载体中的那些物理和化学方法。这些方法包括但不限于，电穿孔、裸DNA的插入或脂质体等。在另外的实施方式中，DNA构建体与质粒共转化，而不是插入到质粒中。在进一步的实施方式中，用本领域已知的方法从改变的杆菌菌株删除可选择性标记(参见Stahl等人，J.Bacteriol.，158：411-418[1984]；和Palmeros等人，Gene 247：255-264[2000])。

本领域已知的转化杆菌的方法包括诸如质粒标记挽救转化等方法，其包括携带有部分同源的固有质粒的感受态细胞对供体质粒的摄取(Contente等人，Plasmid 2：555-571[1979]；Haima等人，Mol.Gen.Genet.，223：185-191[1990]；Weinrauch等人，J.Bacteriol.，154：1077-1087[1983]；和Weinrauch等人，J.Bacteriol.，169：1205-1211[1987])。在该方法中，在模拟染色体转化的过程中，进入的供体质粒与固有的“辅助”质粒的同源区重组。

涉及用原生质体转化进行转化的其他方法为本领域所公知(参见，例如Chang和Cohen，Mol.Gen.Genet.，168：111-115[1979]；Vorobjeva等人，FEMS Microbiol.Lett.，7：261-263[1980]；Smith等人，Appl.Env.Microbiol.，51：634[1986]；Fisher等人，Arch.Microbiol.，139：213-217[1981]；McDonald[1984]J.Gen.Microbiol.，130：203[1984]；和Bakhiet等人，49：577[1985])。并且，Mann等人，(Mann等人，Curr.Microbiol.，13：131-135[1986])记载了杆菌原生质体的转化，Holubova(Holubova，Microbiol.，30：97[1985])记载了利用含DNA的脂质体将DNA引入原生质体的方法。在一些实施方式中，使用标记基因来指示目的基因是否存在于宿主细胞中。在一些实施方式中，包含在本发明的载体中的ymaH多核苷酸序列编码具有SEQ ID NO：4的YmaH蛋白质或其变体。

除了这些方法，在其他实施方式中，宿主细胞被直接转化。在“直接转化”中，在引入宿主(即杆菌)细胞之前，不使用中间细胞扩增或以其它方式加工修饰的多核苷酸。修饰的多核苷酸向宿主细胞中的引入包括本领域已知的将修饰的多核苷酸引入宿主细胞，而不插入到质粒或载体中的那些物理和化学方法。这样的方法包括但不限于利用感受态细胞，以及利用“人工方法”，例如氯化钙沉淀、电穿孔等将DNA引入细胞中。因此，本发明可以使用裸DNA、脂质体等。在另外的实施方式中，该修饰的多核苷酸与质粒共转化，而不插入到质粒中。在一些实施方式中，本发明提供含有有效连接到sigA启动子(例如SEQ ID NO：2和3)的编码YmaH蛋白质的多核苷酸的载体。在其他实施方式中，该载体含有有效连接到sigH启动子(例如SEQ ID NO：1)的编码YmaH的多核苷酸。在又一些实施方式中，载体包含多核苷酸构建体，该构建体包含YmaH编码序列、sigA启动子和sigH启动子(例如SEQ ID NO：13)。

在一些实施方式中，用非整合型载体过表达ymaH。在一些实施方式中，在其中一个或多个染色体基因已经得到修饰(例如degU)和/或从杆菌基因组中删除掉(例如nprE)的宿主细胞中过表达ymaH。在一些进一步的实施方式中，一个或多个天然的染色体区域已经得到修饰和/或已经从相应的野生型杆菌宿主基因组中删除掉。在一些优选的实施方式中，本发明提供用于提高至少一种目的蛋白质在杆菌中的表达和/或分泌的方法和组合物。

ymaH宿主细胞

本发明提供了已经遗传改造以过表达ymaH且具有增强的生产目的蛋白质能力的改良的宿主细胞。具体来讲，本发明涉及革兰氏阳性微生物的改良的宿主细胞，例如过表达ymaH的杆菌物种。在一些实施方式中，ymaH在野生型微生物中过表达，而在其他实施方式中，YmaH在改变的宿主细胞中过表达。在一些实施方式中，改变的宿主细胞能够以高于其野生型前体的水平生产目的蛋白质。在一些特别优选的实施方式中，YmaH在过度生产的经改变亲本宿主中的过表达进一步提高了生产目的蛋白质的水平。在一些实施方式中，在改变的亲本宿主中YmaH的过表达诱导了生产目的蛋白质的时间早于相应未改变亲本宿主中蛋白质的生产时间。用本文所述的本发明的载体和构建体得到宿主细胞中ymaH的过表达。因此，在一些实施方式中，本发明提供了改良的宿主细胞，该细胞通过用载体转化野生型或改变的宿主细胞来得到，该载体包含有效连接到sigA和/或sigH启动子的YmaH编码序列。特别地，本发明的改良的宿主细胞能够生产目的蛋白质，在一些实施方式中，该改良的宿主细胞包含编码YmaH(如SEQID NOS：1，2，3或13)的多核苷酸构建体。

在一些实施方式中，本发明提供了在宿主细胞中过表达ymaH以提高目的蛋白质产量的方法。目的蛋白质可以与宿主同源或异源。在一些实施方式中，目的蛋白质是分泌的多肽、特别是酶，包括但不限于淀粉分解酶、蛋白水解酶、溶细胞的酶、氧化还原酶和植物细胞壁降解的酶。在进一步的实施方式中，这些酶包括但不限于：淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶、纤维素酶、半纤维素酶、酯酶、过氧化物酶、过氧化氢酶、葡萄糖氧化酶、植酸酶、果胶酶、葡萄糖苷酶、异构酶、转移酶、激酶磷酸酶、半乳糖苷酶和壳多糖酶。在更进一步的实施方式中，目的蛋白质是激素、细胞因子、生长因子、受体、疫苗、抗体等。这并不意味着本发明限于任何具体的蛋白质，在一些实施方式中，目的蛋白质是蛋白酶。

在一些实施方式中，宿主细胞是杆菌属物种、链霉菌属物种、埃希氏菌属物种或曲霉菌属物种。在其他实施方式中，目的蛋白质是杆菌属的宿主细胞生产的蛋白酶(参见，例如美国专利No.5,264,366、美国专利No.4,760,025和RE 34,6060)。在一些实施方式中，目的杆菌菌株是嗜碱性的杆菌。已知许多种嗜碱性的杆菌菌株(参见，例如美国专利No.5,217,878；和Aunstrup等人，Proc IV IFS：Ferment.Tech.Today，299-305[1972])。特别感兴趣的另一类型的杆菌菌株是工业杆菌菌株的细胞。工业杆菌菌株的例子包括但不限于：地衣芽孢杆菌、迟缓芽孢杆菌、枯草芽孢杆菌、克劳氏芽孢杆菌和解淀粉芽孢杆菌。在另外的实施方式中，杆菌宿主菌株选自由地衣芽孢杆菌、枯草芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌、短小芽孢杆菌、苏云金芽孢杆菌和巨大芽孢杆菌以及杆菌属中的其他微生物组成的组中。在优选的实施方式中，使用枯草芽孢杆菌细胞。

在一些实施方式中，工业宿主菌株选自由杆菌属物种的非重组菌株、天然存在的杆菌菌株的突变体和重组的杆菌宿主菌株组成的组中。优选地，宿主菌株是重组的宿主菌株，其中编码目的多肽的多核苷酸已经预先引入到该宿主中。进一步优选的宿主菌株是枯草芽孢杆菌宿主菌株，特别优选的是重组的枯草芽孢杆菌宿主菌株。已知许多枯草芽孢杆菌菌株，其适于本发明(参见，例如1A6(ATCC 39085)，168(1A01)，SB19，W23，Ts85，B637，PB1753至PB1758，PB3360，JH642，1A243(ATCC 39，087)，ATCC 21332，ATCC 6051，MI113，DE100(ATCC 39，094)，GX4931，PBT 110，和PEP211菌株；Hoch等人，Genetics，73：215-228[1973]；美国专利No.4,450,235；美国专利No.4,302,544；EP 0134048)。枯草芽孢杆菌作为表达宿主的用途为本领域所公知(参见Palva等人，Gene，19：81-87[1982]；Fahnestock和Fischer，J.Bacteriol.，165：796-804[1986]；和Wang等人，Gene 69：39-47[1988])。

其中特别感兴趣的宿主细胞是生产工业蛋白酶的杆菌的细胞。利用这些菌株，再通过利用本发明提供的改良的杆菌菌株，高效率的蛋白酶生产被进一步增强。生产工业蛋白酶的杆菌菌株提供了特别优选的表达宿主。在一些实施方式中，这些菌株在本发明中的使用提供了蛋白酶产量的进一步增加。如上所述，有两大类型的蛋白酶通常被杆菌属分泌，称为中性的(或“金属蛋白酶”)和碱性的(或“丝氨酸”)蛋白酶。如上所述，枯草杆菌蛋白酶是用于本发明的优选的丝氨酸蛋白酶。已经鉴定出并测序了多种杆菌属枯草杆菌蛋白酶，例如枯草杆菌蛋白酶168、枯草杆菌蛋白酶BPN′、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶DY、枯草杆菌蛋白酶147、枯草杆菌蛋白酶309(参见，例如EP 414279 B；WO 89/06279；和Stahl等人，J.Bacteriol.，159：811-818[1984])、迟缓芽孢杆菌枯草杆菌蛋白酶和克劳氏芽孢杆菌枯草杆菌蛋白酶(J C van der Laan，G Gerritse，LJ Mulleners，R A van der Hoek和W J Quax，Appl Environ Microbiol.57：901-909[1991])。

在本发明的一些实施方式中，杆菌宿主菌株生产突变的(例如变体)蛋白酶。许多参考文献提供了变体蛋白酶的例子和参考(参见例如WO99/20770；WO 99/20726；WO 99/20769；WO 89/06279；RE 34,606；美国专利No.4,914,031；美国专利No.4,980,288；美国专利No.5,208,158；美国专利No.5,310,675；美国专利No.5,336,611；美国专利No.5,399,283；美国专利No.5,441,882；美国专利No.5,482,849；美国专利No.5,631,217；美国专利No.5,665,587；美国专利No.5,700,676；美国专利No.5,741,694；美国专利No.5,858,757；美国专利No.5,880,080；美国专利No.6,197,567；和美国专利No.6,218,165)。

在一些实施方式中，目的蛋白质在宿主细胞中的表达被aprE基因的aprE启动子驱动，枯草芽孢杆菌枯草杆菌蛋白酶从该基因天然转录。aprE基因被sigma A(σ^A)因子转录，其表达被几个调节子高度控制，例如：DegU/DegS，AbrB，Hpr和SinR(Valle和Ferrari(1989)自：Smith I，Slepecky RA，Setlow P(编著)Regulation of Procaryotic Development.American Society for Microbiology，Washington，DC第131-146页)，而且共有的Sigma A启动子已经鉴定为TGGGTCTTGACAAATATTATTCCATCTATTACAATAAATTCACAGA(SEQ ID NO：23；US 2003014846；Helman等人，1995，Nucleic Acid Research，Vol.24，第2351-2360页)。在一些实施方式中，宿主细胞包含本身是野生型aprE启动子TGGGTCTACTAAAATATTATTCCATCTATTACAATAAATTCACAGA(SEQ ID NO：24；美国专利申请公开No.20030148461)的aprE启动子。

在另外的实施方式中，宿主细胞对目的蛋白质的表达被枯草芽孢杆菌aprE启动子的突变体驱动。在一些实施方式中，本发明提供了杆菌宿主细胞，其含有有效连接到编码目的蛋白质的多核苷酸序列的突变aprE启动子。因此，本发明包括从突变aprE启动子表达目的蛋白质的宿主细胞。突变aprE启动子的一个例子是具有序列TGGGTC TTGACAAATATTATTCCATCTAT TACAAT AAATTCACAGA(SEQ ID NO：25)的突变的aprE启动子，其记载于美国专利申请公开No.20030148461中。此处引用的任何目的蛋白质(例如杆菌属枯草杆菌蛋白酶)都可以从aprE启动子转录。在一些实施方式中，本发明提供了改良的杆菌宿主细胞，该宿主细胞能够从aprE启动子表达目的蛋白质。在一些实施方式中，该改良的宿主细胞是能够由aprE启动子驱动表达蛋白酶的改良的枯草芽孢杆菌宿主细胞。在一些实施方式中，aprE启动子包括aprE启动子调节元件和/或aprE转录前导序列，而在其他实施方式中，aprE启动子不包括aprE启动子调节元件和/或aprE转录前导序列。

除了aprE启动子，本发明还包括由宿主细胞表达目的蛋白质的组合物和方法，其中编码目的蛋白质的基因的表达由适宜驱动目的基因转录的任何启动子驱动，只要该启动子包含aprE基因的转录前导序列。

在另一个实施方式中，杆菌宿主是在degU、degS、degR和/或degQ基因中至少一个中有突变或删除的杆菌属物种。优选该突变在degU基因中，更优选该突变是degU(Hy)32(参见，Msadek等人，J.Bacteriol.，172：824-834[1990]；和Olmos等人，Mol.Gen.Genet.，253：562-567[1997])。最优选的宿主菌株是带有degU(Hy)32突变的枯草芽孢杆菌。在进一步的实施方式中，杆菌宿主在scoC4(参见Caldwell等人，J.Bacteriol.，183：7329-7340[2001])和spoIIE(参见Arigoni等人，Mol.Microbiol.，31：1407-1415[1999])中包含突变或删除。在一些实施方式中，这些突变单独存在，而在其他实施方式中，存在这些突变的组合。在一些实施方式中，本发明的改良的杆菌获得自已经在一个或多个上述基因中包括突变的杆菌宿主菌株。在一些实施方式中，具有增强的生产目的蛋白质能力的改变的杆菌宿主选择为本发明的宿主细胞。在一些实施方式中，改变的杆菌宿主细胞具有增强的生产蛋白酶的能力。

培养方法

本发明提供了在改良的杆菌细胞中生产目的蛋白质的方法，该改良的杆菌细胞能够通过如下步骤过表达ymaH：培养能够生产目的蛋白质的该改良的细胞，和在对于表达该目的蛋白质适宜的生长条件下生长该细胞。在一些实施方式中，本发明的宿主细胞和改良的宿主细胞在常规培养基中培养。适宜的特定培养条件，例如温度、pH等为本领域技术人员所公知。另外的优选的培养条件为本领域技术人员所公知，并记载在各种参考出版物上。

在一些实施方式中，所述改良的宿主细胞生产的目的蛋白质被限制在宿主细胞的胞内环境中，而在其他实施方式中，宿主细胞生产的目的蛋白质被分泌到细胞外空间(即培养基中)。因此，在一些实施方式中，目的蛋白质可以用本领域已知的方法通过裂解宿主细胞并回收目的蛋白质，从表达其的细胞的内环境中回收。在其他实施方式中，改良的宿主细胞在适宜表达的条件下培养，并从细胞培养物中回收目的蛋白质。本发明过表达ymaH的改良宿主细胞生产的目的蛋白质被分泌到培养基中。在一些实施方式中，用常规程序从培养基中回收细胞生产的目的蛋白质(例如蛋白酶)，该常规程序包括但不限于，用离心或过滤从培养基中分离宿主细胞，用盐(例如硫酸铵)沉淀上清或滤出液中的蛋白质性质的成分、色谱纯化(例如离子交换、凝胶过滤、亲和层析等)。因此，任何适用于回收本发明的蛋白酶的方法都可以用于本发明。实际上，不应理解为本发明限于任何具体的纯化方法。

在一些实施方式中，其他重组的构件将编码目的蛋白质的异源或同源多核苷酸序列与编码促进可溶性蛋白纯化的多肽结构域的多核苷酸序列连接起来(Kroll DJ等人，DNA Cell Biol 12：441-53[1993])。这样的纯化促进结构域包括但不限于：金属螯合肽，例如组氨酸-色氨酸模块，允许在固定化的金属上纯化(Porath，Protein Expr Purif 3：263-281[1992])；蛋白A结构域，允许在固定的免疫球蛋白上纯化；和用于FLAGS延伸/亲和纯化系统中的结构域(Immunex公司，华盛顿西雅图)。在纯化结构域和上述异源蛋白质之间包括的可裂解接头序列(例如因子XA或肠激酶(加州圣地亚哥Invitrogen)也可以用于促进纯化。

在一些实施方式中，在允许目的蛋白质(例如蛋白酶)表达的条件下，本发明转化的宿主细胞培养于适宜的营养介质中，然后从培养物中回收得到的蛋白酶。用来培养细胞的培养基包括用于生长宿主细胞的任何常规培养基，例如基本培养基或含有合适添加剂的复合培养基。适宜的培养基可获自商品供应商或可根据公开的制剂配方(例如按美国典型培养物保藏中心的目录所述)制备。在一些实施方式中，宿主细胞在分批发酵、分批补料发酵或连续发酵的条件下培养。经典的分批发酵方法使用封闭的系统，其中培养基在开始发酵程序之前制备，培养基接种了所需的微生物，发酵发生时没有任何成分会后续添加到培养基中。在某些情况下，在分批发酵方法过程中，改变生长培养基的pH和氧气含量，但不改变碳源含量。分批发酵系统的代谢产物和细胞生物量不断改变，直至发酵结束。在分批发酵系统中，细胞通常会经过一个静态的迟滞期后发展到高度生长的对数期，最终会到达静止生长期，在静止生长期生长率减小或停止。如果不处理的话，静止生长期的细胞最终会死亡。一般意义上，对数期的细胞生产最多的蛋白。

对标准分批发酵系统的改变是“分批补料发酵”系统。在该系统中，营养物质(例如碳源、氮源、O₂和通常的其他营养素)仅仅当它们在培养基中的浓度落至阈值以下时才加入。当分解代谢产物阻遏倾向于抑制细胞的新陈代谢、而且想要在培养基中含有限定量的营养物时，可使用分批补料发酵系统。分批补料发酵系统中实际营养物质浓度的测量是基于可测量因素(例如pH、溶解氧和诸如CO₂等废气的分压)的改变而估计的。分批发酵和分批补料发酵为本领域常用而且公知。

连续发酵是一个开放的系统，其中限定的培养基被连续地加入到生物反应器中，同时等量的控制条件(conditioned)的培养基被取出进行加工处理。连续发酵通常保持培养物在恒定的高密度，其中细胞主要处于对数生长期。

连续发酵使其可以调节影响细胞生长和/或最终产物浓度的一个因素或任何数量的因素。例如，在一些实施方式中，诸如碳源和氮源的限制性营养物被保持在固定的比率，而所有其他参数可以调节。在其他系统中，许多影响生长的因素是连续变化的，而通过培养基浊度测量的细胞密度保持恒定。连续发酵系统致力于保持稳定状态的生长条件。因此，由于培养基的去除造成的细胞损失可以被发酵中的细胞生长率所平衡。为连续发酵过程调节营养物和生长因子的方法以及最大化产品形成率的技术为本领域技术人员所公知，可以用于根据本发明的方法生产目的蛋白质(例如蛋白酶).

如上所述，与相同蛋白质在相应的野生型或改变的亲本宿主细胞中的产量水平相比，宿主细胞的ymaH的过表达增强了目的蛋白质的产量水平。在本发明的一些实施方式中，杆菌宿主细胞中ymaH的过表达导致目的蛋白质的产量升高到其中不过表达ymaH的相应细胞中得到的水平之上。在一些实施方式中，本发明提供了过表达YmaH的野生型或重组的(改变的)的杆菌宿主细胞。在一些实施方式中，在相同的条件下生长时，与未改变的亲本/前体杆菌细胞相比，重组的杆菌宿主细胞是已经改变为生产较高水平的蛋白酶的细胞。

本发明还包括，在比前体宿主细胞所需时间更短的时间内，在过表达ymaH的改良细胞中生产目的蛋白质的方法。例如，本发明的改良的宿主细胞能够以比相应的未改良前体宿主细胞高的水平和早的时间生产目的蛋白质。因此，在一些实施方式中，本发明提供了生产目的蛋白质(例如蛋白酶)的方法，其生产水平比亲本宿主细胞的生产水平高，而且在前体宿主细胞达到其最大表达水平所需时间的大约六分之一的时间，生产目的蛋白质达到其最大表达水平。在其他实施方式中，改良的宿主细胞在前体宿主细胞达到其最大表达水平所需时间的约五分之一、约四分之一、约三分之一或约二分之一的时间生产目的蛋白质达到其最大表达水平。

产量/活性的测定

在一些实施方式中，本发明提供了在杆菌宿主细胞增强目的蛋白质表达的方法，该方法通过如下步骤进行：获得过表达ymaH的改良的杆菌宿主，将该改良的杆菌宿主在适宜的生长条件下生长，以及使该宿主细胞以与前体宿主细胞相比增强了的水平生产目的蛋白质。在一些实施方式中，该改良的杆菌细胞得自野生型杆菌细胞。在其他实施方式中，该改良的杆菌细胞得自改变的宿主细胞。宿主细胞的目的蛋白质产量水平可以测定为所生产的蛋白质的活性的函数。在一些实施方式中，增强目的蛋白质表达的方法使用改良的杆菌宿主细胞进行，该改良的杆菌宿主细胞已经用编码YmaH而且有效连接到sigA和/或sigH启动子的多核苷酸构建体转化。在一些实施方式中，上述多核苷酸构建体包含选自SEQ ID NOS：1，2，3和13的序列。在一些实施方式中，多核苷酸构建体存在于在杆菌细胞中复制的质粒上，而在其他实施方式中，多核苷酸构建体被整合到改良杆菌细胞的基因组中。如上所述，改良的杆菌细胞能够生产目的蛋白质，所述目的蛋白质包括但不限于淀粉分解酶、蛋白水解酶、溶细胞的酶、氧化还原酶和植物细胞壁降解酶的蛋白质。在进一步的实施方式中，这些酶包括但不限于：淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶、纤维素酶、半纤维素酶、酯酶、过氧化物酶、过氧化氢酶、葡萄糖氧化酶、植酸酶、果胶酶、葡萄糖苷酶、异构酶、转移酶、激酶磷酸酶、半乳糖苷酶和壳多糖酶。在其他实施方式中，目的蛋白质是激素、细胞因子、生长因子、受体、疫苗、抗体等。这并不意味着本发明限于任何具体的蛋白质，在一些特别优选的实施方式中，目的蛋白质是蛋白酶。

有本领域技术人员已知的各种检测方法用于进行本发明的宿主细胞生产的目的蛋白质活性的检测和测量。具体来说，可获得用于测量蛋白酶活性的检测方法，该检测方法基于酸可溶的肽从酪蛋白或血红蛋白的释放，测量为405nm处的吸光度，或用Folin法用比色法检测(参见，例如Bergmeyer等人，“Methods of Enzymatic Analysis”第5卷，Peptidases， Proteinases and their Inhibitors，Verlag Chemie，Weinheim[1984])。

一些其他的检测方法包括生色底物的溶解(参见，例如Ward，“Proteinases，”自Fogarty (编著)，Microbial Enzymes and Biotechnology，Applied Science，London，[1983]，第251-317页)。其他示例性检测方法包括但不限于，琥珀酰-Ala-Ala-Pro-Phe-对-硝基苯胺检测方法(SAAPFpNA)和2，4，6-三硝基苯磺酸钠盐检测方法(TNBS检测方法)。本领域技术人员已知的许多另外的参考文献提供了适宜的方法(参见，例如Wells等人，Nucleic Acids Res.11：7911-7925[1983]；Christianson等人，Anal.Biochem.，223：119-129[1994]；和Hsia等人，Anal Biochem.，242：221-227[1999])。不应理解为本发明限于任何具体的检测方法。

测定宿主细胞中目的蛋白质产量水平和检测表达的蛋白质的其他方式包括使用特异性针对该蛋白质的多克隆或单克隆抗体进行的免疫测定法。例子包括酶联免疫吸附试验(ELISA)，放射免疫测定(RIA)，荧光免疫分析(FIA)和荧光活化的细胞分选(FACS)。但是，本领域技术人员已知其他方法，也可用于评价本发明的蛋白质(参见，例如Hampton等人，Serological Methods，A Laboratory Manual，APS Press，St.Paul，MN[1990]；和Maddox等人，J.Exp.Med.，158：1211[1983])。在一些优选的实施方式中，本发明的宿主细胞中目的蛋白质的产量高于相应的野生型或改变的宿主细胞中的蛋白质产量。如本领域所公知，在适宜于表达和从细胞培养物中回收目的多肽的条件下保持和生长用本发明制备的杆菌细胞。不应理解为本发明限于任何具体的检测方法。

高于野生型或改变的亲本宿主细胞中相同蛋白酶的产量水平，本发明改良的宿主细胞中蛋白酶产量水平的增强的一种测度可以测定为活性比。活性比可以表示为过表达ymaH的宿主细胞产生的目的蛋白质的酶活性与没有过表达ymaH的相应宿主细胞产生的目的蛋白质的酶活性之比。等于或大于1的比例说明，与相同的目的蛋白质在不过表达YmaH的相应宿主细胞中生产的水平相比，过表达YmaH的宿主细胞生产的目的蛋白质是以相等或更高的水平生产的。例如，活性比1.5说明，在相同的条件下生长时，目的蛋白质在过表达ymaH的宿主细胞中的产量水平是相同目的蛋白质在没有过表达ymaH的相应宿主细胞中生产的产量水平的1.5倍(即，过表达ymaH的宿主细胞比没有过表达ymaH的相应宿主细胞多生产了50％的目的蛋白质)。在一些实施方式中，活性比是至少1、至少约1.05、至少约1.1、至少约1.2、至少约1.3、至少约1.4、至少约1.5、至少约1.6、至少约1.7、至少约1.8、至少约1.9或至少约2。在其他实施方式中，活性比为至少约2.1、至少约2.2、至少约2.3、至少约2.4、至少约2.5、至少约2.6、至少约2.7、至少约2.8、至少约2.9或至少约3。在又一些其他的实施方式中，活性比是至少约3.5、至少约4.0或至少约5。在一些实施方式中，希望活性比为1或更大。

或者，本发明的改良的宿主细胞的蛋白酶产量水平可以关联为高于亲本宿主细胞的产量水平的百分比增加。在本发明的方法中，改良的杆菌细胞优选比野生型或改变的亲本宿主细胞多生产至少约25％的多肽，更优选至少约50％、更优选至少约75％、更优选至少约100％、进一步优选至少约200％、最优选至少约300％、进一步最优选至少约400％的多肽。因此，在一些实施方式中，与不过表达ymaH的宿主细胞中相同目的蛋白质产量相比，过表达ymaH的宿主细胞中的目的蛋白质产量增加了至少约0.5％、约1.0％、约1.5％、约2.0％、约2.5％、约3.0％、约4.0％、约5.0％、约8.0％、约10％、约15％、约20％、约25％、约30％、约40％、约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约100％或更多。在其他实施方式中，与不过表达ymaH的宿主细胞中相同目的蛋白质产量相比，过表达ymaH的宿主细胞中的目的蛋白质产量增强了至少约110％、约120％、约130％、约140％、约150％、约160％、约170％、约180％、约190％和高达至少约200％，或更多。

为了进一步说明本发明及其优势，给出了下列具体实施例。应理解的是，这些实施例仅仅是为了进一步说明本发明而提供，而不应理解为以任何方式对其范围的限制。

实验

提供下面的实施例来说明和进一步阐释本发明某些优选的实施方式和方面，而不是为了作为本发明范围的限制。

在下面的实验公开中，使用了下列缩写：ppm(百万分之一)；M(摩尔每升)；mM(毫摩尔每升)；μM(微摩尔每升)；nM(纳摩尔每升)；mol(摩尔)；mmol(毫摩尔)；μmol(微摩尔)；nmol(纳摩尔)；gm(克)；mg(毫克)；μg(微克)；pg(皮克)；L(升)；ml和mL(毫升)；μl和μL(微升)；cm(厘米)；mm(毫米)；μm(微米)；nm(纳米)；U(单位)；V(伏特)；MW(分子量)；sec(秒)；min(s)(分钟)；h(s)和hr(s)(小时)；℃(摄氏度)；QS(足量)；ND(未做)；NA(不适用)；rpm(每分钟转数)；H₂O(水)；dH₂O(去离子水)；(HCl(盐酸)；aa(氨基酸)；bp(碱基对)；kb(千碱基对)；kD(千道尔顿)；cDNA(副本或互补DNA)；DNA(脱氧核糖核酸)；ssDNA(单链DNA)；dsDNA(双链DNA)；dNTP(脱氧核糖核苷酸三磷酸盐)；RNA(核糖核酸)；MgCl₂(氯化镁)；NaCl(氯化钠)；Cm(氯霉素)；w/v(重量体积比)；v/v(体积体积比)；g(重力)；OD(光密度)；Dulbecco’s磷酸盐缓冲溶液(DPBS)；OD₂₈₀(280nm处光密度)；OD₆₀₀(600nm处光密度)；A₄₀₅(405nm处的吸光度)；PAGE(聚丙烯酰胺凝胶电泳)；PBS(磷酸盐缓冲液[150mM NaCl，10mM磷酸钠缓冲剂，pH 7.2])；PBST(PBS+0.25％

-20)；PEG(聚乙二醇)；PCR(聚合酶链式反应)；SDS(十二烷基磺酸钠)；Tris(三羟甲基氨基甲烷)；HEPES(N-[2-羟乙基]哌嗪-N-[2-乙磺酸])；HBS(HEPES缓冲盐水)；SDS(十二烷基磺酸钠)；bME，BME和βME(β-巯基乙醇或2-巯基乙醇)；Tris-HCl(三羟甲基氨基甲烷-盐酸化物)；Tricine(N-[三-(羟甲基)-甲基]-甘氨酸)；DMSO(二甲基亚砜)；Taq(栖热水生菌DNA聚合酶)；Klenow(DNA聚合酶I大(Klenow)片段)；rpm(每分钟转数)；EGTA(乙二醇-双(β-氨基乙醚)N，N，N′，N′-四乙酸)；EDTA(乙二胺四乙酸)；bla(β-内酰胺酶或氨苄青霉素抗药性基因)；DNA2.0(DNA2.0，Menlo Park，CA)；OXOID(Oxoid，Basingstoke，Hampshire，UK)；Corning(Corning Life Sciences，Corning，NY)；ATCC(美国模式菌种收藏所，Rockville，MD)；Sequetech(Sequetech Corporation，Mountainview，CA)；Gibco/BRL(Gibco/BRL，Grand Island，NY)；Sigma(Sigma Chemical Co.，St.Louis，MO)；Pharmacia(Pharmacia Biotech，Pisacataway，NJ)；NCBI(国家生物技术信息中心)；Applied Biosystems(Applied Biosystems，Foster City，CA)；Clontech(CLONTECHLaboratories，Palo Alto，CA)；Operon Technologies(Operon Technologies，Inc.，Alameda，CA)；Bachem(Bachem Bioscience，Inc.，King of Prussia，PA)；Difco(Difco Laboratories，Detroit，MI)；GIBCO BRL或Gibco BRL(Life Technologies，Inc.，Gaithersburg，MD)；Millipore(Millipore，Billerica，MA)；Bio-Rad(Bio-Rad，Hercules，CA)；Invitrogen(Invitrogen Corp.，SanDiego，CA)；NEB(New England Biolabs，Beverly，MA)；Sigma(SigmaChemical Co.，St.Louis，MO)；Pierce(Pierce Biotechnology，Rockford，IL)；Takara(Takara Bio Inc.Otsu，Japan)；Roche(Hoffmann-La Roche，Basel，Switzerland)；EM Science(EM Science，Gibbstown，NJ)；Qiagen(Qiagen，Inc.，Valencia，CA)；Molecular Devices(Molecular Devices，Corp.，Sunnyvale，CA)；R&D Systems(R&D Systems，Minneapolis，MN)；Stratagene(Stratagene Cloning Systems，La Jolla，CA)；和Microsoft(Microsoft，Inc.，Redmond，WA)。

实施例1

SigA和SigH多核苷酸构建体的产生

产生多核苷酸构建体SigH、SigA1和SigA2，以在枯草芽孢杆菌宿主细胞中过表达ymaH。

PCR引物设计为与枯草芽孢杆菌基因组同源(图1A)，而且含有位于从引物的5’端开始的6个碱基对处的6碱基对的限制性酶切位点。引物设计为在构建体的上游和下游末端改造有唯一的限制性酶切位点。基因组序列(Kunst等人，Nature 390：249-256[1997])、基因定位和起始和终止密码子信息的初始来源来自NCBI数据库：完成的枯草芽孢杆菌亚种枯草芽孢杆菌菌株168，或来自本领域技术人员已知的SubtiList万维网服务器(Moser，I.1998.FEBS Lett.430(1-2)：28-36)。所考虑的序列报告为SEQ IDNO：13，对应于NCBI数据库中的1865428-18670191，ACC No NC000964。

SigH构建体(SEQ ID NO：1)生成为包含其中包括Sigma H启动子和相邻的编码YmaH蛋白质的序列的多核苷酸序列。Sigma H启动子天然位于编码miaA基因的多核苷酸序列中，接近该基因的3’末端，紧靠在ymaH基因的上游。使用下列引物扩增完整的Sigma H启动子和相邻的ymaH编码序列：正向引物P1：

GGCACCGAATTCGACGTGGTTTCGCAACAAAATGCAG(SEQ ID NO：5；位于SEQ ID NO：13的987至1011位)，其中在5’末端加入了EcoRI限制性酶切位点；和反向引物P2：GGCACCGGATCCCTCATAAAAAAAGACCGTGCCTTGG(SEQ ID NO：6，位于SEQ ID NO：13的1472至1496位)，具有加入的BamHI限制性酶切位点(图1B)。

用三步法产生SigA1和SigA2构建体：1)扩增枯草芽孢杆菌染色体DNA的单个片段；2)纯化和组合这些片段；和3)用PCR扩增组合的产物。

SigA1构建体(SEQ ID NO：2)用两套引物产生(图1C)。第一套引物：正向引物P3：GCGCCGAATTCTCATACCCTGAAAGGAAAGACAAGG(SEQ ID NO：7)，位于SEQ ID NO：13的5’末端；和反向引物P4：TTCGAGTTTTCCTGCTATATGTGTGGGGCTGCTTCGTATTATTCAATATG(SEQ ID NO：8)位于SEQ ID NO：13的bp 153至bp 177，用于扩增含有SigA启动子、核糖体结合位点、miaA基因的起始密码子和前几个密码子的第一片段。第二套引物，正向引物P5：

CATATTGAATAATACGAAGCAGCCCCACACATATAGCAGGAAAACTCGAA(SEQ ID NO：9)位于SEQ ID NO：13的bp 1071至bp 1095，反向引物P2(SEQ ID NO：6)，用来扩增含编码YmaH蛋白质的DNA序列的第二片段。反向引物P4和正向引物P5是融合引物，设计为含有互相互补的尾部，但是与要扩增的序列不同源，以消除插入的miaA编码序列。将这两个片段退火，得到的SigA构建体包含SigA启动子、核糖体结合位点和miaA基因的转录起始位点。用分别含有EcoRI和BamHI限制性酶切位点的正向引物P3(SEQ ID NO：7)和反向引物P2(SEQ ID NO：6)扩增SigA1构建体，并将其连接到复制质粒pBS19的多聚接头。pBS19的多核苷酸序列如下所示(SEQ ID NO：12)。pBS19质粒能够在大肠杆菌和枯草芽孢杆菌中复制，并携带氯霉素抗性选择标记基因。

GAATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTGGCGATCCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCCAGTCACGTAGCGATAGCGGAGTGTATACTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTGGAGCTGTAATATAAAAACCTTCTTCAACTAACGGGGCAGGTTAGTGACATTAGAAAACCGACTGTAAAAAGTACAGTCGGCATTATCTCATATTATAAAAGCCAGTCATTAGGCCTATCTGACAATTCCTGAATAGAGTTCATAAACAATCCTGCATGATAACCATCACAAACAGAATGATGTACCTGTAAAGATAGCGGTAAATATATTGAATTACCTTTATTAATGAATTTTCCTGCTGTAATAATGGGTAGAAGGTAATTACTATTATTATTGATATTTAAGTTAAACCCAGTAAATGAAGTCCATGGAATAATAGAAAGAGAAAAAGCATTTTCAGGTATAGGTGTTTTGGGAAACAATTTCCCCGAACCATTATATTTCTCTACATCAGAAAGGTATAAATCATAAAACTCTTTGAAGTCATTCTTTACAGGAGTCCAAATACCAGAGAATGTTTTAGATACACCATCAAAAATTGTATAAAGTGGCTCTAACTTATCCCAATAACCTAACTCTCCGTCGCTATTGTAACCAGTTCTAAAAGCTGTATTTGAGTTTATCACCCTTGTCACTAAGAAAATAAATGCAGGGTAAAATTTATATCCTTCTTGTTTTATGTTTCGGTATAAAACACTAATATCAATTTCTGTGGTTATACTAAAAGTCGTTTGTTGGTTCAAATAATGATTAAATATCTCTTTTCTCTTCCAATTGTCTAAATCAATTTTATTAAAGTTCATTTGATATGCCTCCTAAATTTTTATCTAAAGTGAATTTAGGAGGCTTACTTGTCTGCTTTCTTCATTAGAATCAATCCTTTTTTAAAAGTCAATATTACTGTAACATAAATATATATTTTAAAAATATCCCACTTTATCCAATTTTCGTTTGTTGAACTAATGGGTGCTTTAGTTGAAGAATAAAAGACCACATTAAAAAATGTGGTCTTTTGTGTTTTTTTAAAGGATTTGAGCGTAGCGAAAAATCCTTTTCTTTCTTATCTTGATAATAAGGGTAACTATTGCCGGTTGTCCATTCATGGCTGAACTCTGCTTCCTCTGTTGACATGACACACATCATCTCAATATCCGAATAGGGCCCATCAGTCTGACGACCAAGAGAGCCATAAACACCAATAGCCTTAACATCATCCCCATATTTATCCAATATTCGTTCCTTAATTTCATGAACAATCTTCATTCTTTCTTCTCTAGTCATTATTATTGGTCCATTCACTATTCTCATTCCCTTTTCAGATAATTTTAGATTTGCTTTTCTAAATAAGAATATTTGGAGAGCACCGTTCTTATTCAGCTATTAATAACTCGTCTTCCTAAGCATCCTTCAATCCTTTTAATAACAATTATAGCATCTAATCTTCAACAAACTGGCCCGTTTGTTGAACTACTCTTTAATAAAATAATTTTTCCGTTCCCAATTCCACATTGCAATAATAGAAAATCCATCTTCATCGGCTTTTTCGTCATCATCTGTATGAATCAAATCGCCTTCTTCTGTGTCATCAAGGTTTAATTTTTTATGTATTTCTTTTAACAAACCACCATAGGAGATTAACCTTTTACGGTGTAAACCTTCCTCCAAATCAGACAAACGTTTCAAATTCTTTTCTTCATCATCGGTCATAAAATCCGTATCCTTTACAGGATATTTTGCAGTTTCGTCAATTGCCGATTGTATATCCGATTTATATTTATTTTTCGGTCGAATCATTTGAACTTTTACATTTGGATCATAGTCTAATTTCATTGCCTTTTTCCAAAATTGAATCCATTGTTTTTGATTCACGTAGTTTTCTGTATTCTTAAAATAAGTTGGTTCCACACATACCAATACATGCATGTGCTGATTATAAGAATTATCTTTATTATTTATTGTCACTTCCGTTGCACGCATAAAACCAACAAGATTTTTATTAATTTTTTTATATTGCATCATTCGGCGAAATCCTTGAGCCATATCTGACAAACTCTTATTTAATTCTTCGCCATCATAAACATTTTTAACTGTTAATGTGAGAAACAACCAACGAACTGTTGGCTTTTGTTTAATAACTTCAGCAACAACCTTTTGTGACTGAATGCCATGTTTCATTGCTCTCCTCCAGTTGCACATTGGACAAAGCCTGGATTTACAAAACCACACTCGATACAACTTTCTTTCGCCTGTTTCACGATTTTGTTTATACTCTAATATTTCAGCACAATCTTTTACTCTTTCAGCCTTTTTAAATTCAAGAATATGCAGAAGTTCAAAGTAATCAACATTAGCGATTTTCTTTTCTCTCCATGGTCTCACTTTTCCACTTTTTGTCTTGTCCACTAAAACCCTTGATTTTTCATCTGAATAAATGCTACTATTAGGACACATAATATTAAAAGAAACCCCCATCTATTTAGTTATTTGTTTAGTCACTTATAACTTTAACAGATGGGGTTTTTCTGTGCAACCAATTTTAAGGGTTTTCAATACTTTAAAACACATACATACCAACACTTCAACGCACCTTTCAGCAACTAAAATAAAAATGACGTTATTTCTATATGTATCAAGATAAGAAAGAACAAGTTCAAAACCATCAAAAAAAGACACCTTTTCAGGTGCTTTTTTTATTTTATAAACTCATTCCCTGATCTCGACTTCGTTCTTTTTTTACCTCTCGGTTATGAGTTAGTTCAAATTCGTTCTTTTTAGGTTCTAAATCGTGTTTTTCTTGGAATTGTGCTGTTTTATCCTTTACCTTGTCTACAAACCCCTTAAAAACGTTTTTAAAGGCTTTTAAGCCGTCTGTACGTTCCTTAAG(SEQ ID NO：12)

用下列引物(图1D)以所述SigA1构建体的构建方法产生SigA2构建体(SEQ ID NO：3)。含有SigA启动子的第一片段用正向引物P3(SEQ IDNO：7)和反向融合引物P7扩增：CATACAGTTTCGATTAAAGTTCGAGCACTCTCTTTTATAAATCTCCCCCA(SEQ ID NO：11)位于SEQ ID NO：13的bp 125至bp 149。用正向融合引物P6扩增含编码YmaH蛋白质的DNA序列的第二片段：TGGGGGAGATTTATAAAAGAGAGTGCTCGAACTTTAATCGAAACTGTATG(SEQ ID NO：10)，位于SEQ ID NO：13的bp 1090至bp 1114，和反向引物P2(SEQ ID NO：6)。将这两个片段退火，得到的SigA2构建体包含SigA启动子、核糖体结合位点和ymaH基因的转录起始位点。

本发明还包括第四SigA构建体(SigA3；SEQ ID NO：13；图1E)，其通过扩增包括SigA启动子、编码MiaA蛋白质的区域、SigH YmaH启动子和编码YmaH蛋白质的区域的杆菌染色体DNA的miaA ymaH区域产生。

用正向引物

GCGCGCGAATTCAGGGAAATTGTCGGCAATGAGCCGCTCGGC(SEQ ID NO：18)和反向引物GCGCGCCATGGCTGATTCGTCTCAGTTCTGCTTCACTTTCA(SEQ ID NO：19)产生SigA3构建体。SEQ ID NO：13在该片段的5’末端放置了EcoRI限制性酶切位点，而SEQ ID NO：19在另一端放置了NcoI限制性酶切位点。这使得可以在pBN3载体中克隆该片段，报告为如下所示的SEQ ID NO：20。

GACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTTCAAGAATTAATTCTCATGTTTGACAGCTTATCATCGATAAGCTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCCGGGTACCGAGCTCGAATTCCTTAAGGAACGTACAGACGGCTTAAAAGCCTTTAAAAACGTTTTTAAGGGGTTTGTAGACAAGGTAAAGGATAAAACAGCACAATTCCAAGAAAAACACGATTTAGAACCTAAAAAGAACGAATTTGAACTAACTCATAACCGAGAGGTAAAAAAAGAACGAAGTCGAGATCAGGGAATGAGTTTATAAAATAAAAAAAGCACCTGAAAAGGTGTCTTTTTTTGATGGTTTTGAACTTGTTCTTTCTTATCTTGATACATATAGAAATAACGTCATTTTTATTTTAGTTGCTGAAAGGTGCGTTGAAGTGTTGGTATGTATGTGTTTTAAAGTATTGAAAACCCTTAAAATTGGTTGCACAGAAAAACCCCATCTGTTAAAGTTATAAGTGACTAAACAAATAACTAAATAGATGGGGGTTTCTTTTAATATTATGTGTCCTAATAGTAGCATTTATTCAGATGAAAAATCAAGGGTTTTAGTGGACAAGACAAAAAGTGGAAAAGTGAGACCATGGAGAGAAAAGAAAATCGCTAATGTTGATTACTTTGAACTTCTGCATATTCTTGAATTTAAAAAGGCTGAAAGAGTAAAAGATTGTGCTGAAATATTAGAGTATAAACAAAATCGTGAAACAGGCGAAAGAAAGTTGTATCGAGTGTGGTTTTGTAAATCCAGGCTTTGTCCAATGTGCAACTGGAGGAGAGCAATGAAACATGGCATTCAGTCACAAAAGGTTGTTGCTGAAGTTATTAAACAAAAGCCAACAGTTCGTTGGTTGTTTCTCACATTAACAGTTAAAAATGTTTATGATGGCGAAGAATTAAATAAGAGTTTGTCAGATATGGCTCAAGGATTTCGCCGAATGATGCAATATAAAAAAATTAATAAAAATCTTGTTGGTTTTATGCGTGCAACGGAAGTGACAATAAATAATAAAGATAATTCTTATAATCAGCACATGCATGTATTGGTATGTGTGGAACCAACTTATTTTAAGAATACAGAAAACTACGTGAATCAAAAACAATGGATTCAATTTTGGAAAAAGGCAATGAAATTAGACTATGATCCAAATGTAAAAGTTCAAATGATTCGACCGAAAAATAAATATAAATCGGATATACAATCGGCAATTGACGAAACTGCAAAATATCCTGTAAAGGATACGGATTTTATGACCGATGATGAAGAAAAGAATTTGAAACGTTTGTCTGATTTGGAGGAAGGTTTACACCGTAAAAGGTTAATCTCCTATGGTGGTTTGTTAAAAGAAATACATAAAAAATTAAACCTTGATGACACAGAAGAAGGCGATTTGATTCATACAGATGATGACGAAAAAGCCGATGAAGATGGATTTTCTATTATTGCAATGTGGAATTGGGAACGGAAAAATTATTTTATTAAAGAGTAGTTCAACAAACGGGCCAGTTTGTTGAAGATTAGATGCTATAATTGTTATTAAAAGGATTGAAGGATGCTTAGGAAGACGAGTTATTAATAGCTGAATAAGAACGGTGCTCTCCAAATATTCTTATTTAGAAAAGCAAATCTAAAATTATCTGAAAAGGGAATGAGAATAGTGAATGGACCAATAATAATGACTAGAGAAGAAAGAATGAAGATTGTTCATGAAATTAAGGAACGAATATTGGATAAATATGGGGATGATGTTAAGGCTATTGGTGTTTATGGCTCTCTTGGTCGTCAGACTGATGGGCCCTATTCGGATATTGAGATGATGTGTGTCATGTCAACAGAGGAAGCAGAGTTCAGCCATGAATGGACAACCGGTGAGTGGAAGGTGGAAGTGAATTTTGATAGCGAAGAGATTCTACTAGATTATGCATCTCAGGTGGAATCAGATTGGCCGCTTACACATGGTCAATTTTTCTCTATTTTGCCGATTTATGATTCAGGTGGATACTTAGAGAAAGTGTATCAAACTGCTAAATCGGTAGAAGCCCAAACGTTCCACGATGCGATTTGTGCCCTTATCGTAGAAGAGCTGTTTGAATATGCAGGCAAATGGCGTAATATTCGTGTGCAAGGACCGACAACATTTCTACCATCCTTGACTGTACAGGTAGCAATGGCAGGTGCCATGTTGATTGGTCTGCATCATCGCATCTGTTATACGACGAGCGCTTCGGTCTTAACTGAAGCAGTTAAGCAATCAGATCTTCCTTCAGGTTATGACCATCTGTGCCAGTTCGTAATGTCTGGTCAACTTTCCGACTCTGAGAAACTTCTGGAATCGCTAGAGAATTTCTGGAATGGGATTCAGGAGTGGACAGAACGACACGGATATATAGTGGATGTGTCAAAACGCATACCATTTTGAACGATGACCTCTAATAATTGTTAATCATGTTGGTTACCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCCAGTCACGTAGCGATAGCGGAGTGTATACTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCT(SEQ ID NO：20)

所有的PCR反应在50μl体积中进行，其中含有1-2μl的DNA或来自克隆重悬物的DNA，5μl的10X Pfu Ultra缓冲液(Stratagene)，1μL的10mM dNTP共混物(Roche)，0.5μL的0.2uM引物，1μl Pfu Ultra高保真聚合酶，用水将体积调节至总体积为50μl。PCR条件是：95℃，2分钟；95℃，30秒，62℃，30秒，72℃，1分钟，共30个循环；然后1个循环的72℃，10分钟。

将得到的PCR片段用Qiagen凝胶纯化试剂盒根据说明书进行凝胶纯化。

将混合到一起的纯化PCR片段中取0.25μl的等分部分进行退火，加入到新的PCR混合物中，用引物P3和P2以上述方案进行PCR获得融合构建体。PCR混合物的总体积是50μl。PCR条件与上述相同，只是根据引物的Tm调节了退火温度。

将所需的SigH、SigA1和SigA2构建体连接到已经用EcoRI和BamHI消化的质粒pBS19中，以产生用于如实施例2所述转化宿主细胞的SigA和SigH表达载体。

将转化混合物铺板到LB+1.6％脱脂牛奶+5μg/ml cmp平板上。第二天，挑取形成晕的菌落，铺板，以获得单个菌落。菌落纯化进行两次。通过测序aprE启动子区域分析五个单独的菌落。所有的菌落都具有aprE启动子的-35区共有序列。

实施例2

宿主细胞转化和aprE蛋白酶的表达

用电穿孔的方法，将含有SigA或SigH构建体的5微升的连接混合物用来转化大肠杆菌Top10细胞(Invitrogen)。转化的细胞铺板到含有5ppm/ml氯霉素(Cm)的LB琼脂糖平板上，让菌落在37℃生长过夜。挑取单个的菌落，转移到含有5ml的LB+5ppm/ml Cm的试管中。在37℃，250rpm振摇的条件下让培养物生长过夜。从大肠杆菌培养物中制备质粒DNA，取一部分该质粒DNA制品去测序(Sequetech)。用Phrep，Phrap，Consed，Custal W软件进行自动序列分析。

携带来自三个表达载体中的每一个的正确构建体的质粒用来转化枯草芽孢杆菌宿主细胞。含有SigH(SEQ ID NO：1)和SigA1(SEQ ID NO：2)和SigA2(SEQ ID NO：3)构建体的表达载体被称为pBS19 ymaH-H和pBS19ymaH-A1和pBS19 ymaH-A2，如下所述将这些表达载体转化到枯草芽孢杆菌菌株BG2941和BG2942中。两微升带有适宜构建体的质粒DNA用来转化100μl的枯草芽孢杆菌细胞BG 2941(ΔnprE，amyE::PxylRA-comK-phleoR)和BG2942(ΔnprE，degU(Hy)32，amyE::PxylRA-comK-phleoR)。带有SigH构建体的BG2941和BG2942转化细胞分别称为41SigH和42SigH；带有SigA1构建体的BG2941和BG2942转化细胞分别称为41SigA1和42SigA1。一些BG2941和BG2942宿主细胞也用对照pBS19质粒转化，称为41pBS19和42pBS19。BG 2941和BG2942宿主细胞都具有nprE基因的缺失，其消除了大部分的非aprE背景蛋白水解活性，因此，有利于测定产生的碱性蛋白酶(aprE)。BG 2941和BG2942宿主细胞还带有盒amyE::PxylRA-comK-phleoR，其允许通过用木糖诱导生长培养物来制备感受态细胞(Hahn等人，Mol Microbiol.18：755-67[1995])。2942宿主细胞也携带degU基因中的突变(degU(Hy)32突变)，携带该突变的宿主细胞独自分泌的枯草杆菌蛋白酶水平比不携带该degU(Hy)突变的宿主细胞分泌的枯草杆菌蛋白酶水平提高几倍(Msadek 等人J Bacteriol，172：824-834[1990])。

杆菌宿主细胞中过表达YmaH的效果用实施例3中所述的试验定性和定量检测。

实施例3

过表达ymaH对蛋白酶生产的影响

酪蛋白试验：首先用定性试验测定过表达的ymaH对杆菌宿主细胞生产蛋白酶的影响，该定性实验中比较了在琼脂糖平板上生长的菌落产生的晕斑的大小，该平板含有脱脂牛奶形式的酪蛋白。随着杆菌细胞分泌出蛋白酶，其消化脱脂牛奶中的酪蛋白，并围绕生长的菌落形成清晰的区域或晕斑。具有无活性的蛋白酶的宿主细胞会呈现围绕菌落的很小晕斑或没有晕斑。因此，晕斑的大小提供了分泌菌落产生的蛋白酶量的定性评估(Wells，T.A.等人Nucleic Acids Res.，11，7911-7925：[1983])。

将用SigH或SigA1表达载体转化的BG2941和BG2942枯草芽孢杆菌宿主细胞铺板到含有1.6％脱脂牛奶和5ppm Cm/ml的LB琼脂平板上，在37℃孵育过夜。第二天，一些转化体的菌落是在含有5ppm/ml Cm的LB琼脂平板上分离的单个菌落，这些平板在37℃孵育过夜。挑取单菌落分离物并接种到同样类型的平板上，再次在37℃孵育过夜。

最大的晕斑由42SigH宿主细胞产生，其带有degU(Hy)32突变和使其能够过表达ymaH的SigH构建体。具体地说，42SigH细胞的晕斑大小证明了过表达的ymaH进一步增强了宿主细胞中枯草杆菌蛋白酶的产生，该宿主细胞已经产生了比野生型细胞高水平的酶，即，42SigH细胞产生的晕斑大于携带degU(Hy)突变但是不带有能使其过表达ymaH的构建体的42pBS19细胞产生的晕斑，但是42pBS19依次也产生了大于41pBS19细胞产生的晕斑，41pBS19细胞不带有degU(Hy)32突变也不带有能使其过表达ymaH的构建体。42SigH细胞产生的晕斑也大于41SigH细胞产生的晕斑，41SigH细胞不带有degU(Hy)突变，但是带有能使其过表达ymaH的SigH构建体。

AAPF检测——过表达ymaH的转化的杆菌宿主细胞42SigH，42SigA1，41SigA2，以及它们各自的对照42pBS19和41pBS19的枯草杆菌蛋白酶生产被定量为分泌的aprE蛋白酶活性的函数。分泌的蛋白酶的蛋白水解活性测定为底物琥珀酰-L-Ala-L-Ala-L-Pro-L-Phe-对-硝基苯胺(AAPF，来自Sigma Chemical Co)的水解率。该检测测得蛋白酶生产的水平为水解和释放对硝基苯胺而产生的405nm/分钟处的吸光度(Estell等人，J Biol Chem.，260：6518-6521[1985])。该测定用Sofmax Pro软件进行，具体条件设定为：类型：动态的；减小(Reduction)：Vmax点(读最好的15点/28个点)；Lm1：405nm；时间：5分钟；间隔：11秒。

通过将转化细胞41SigH和42SigA1和42SigH的单个菌落接种到5ml含5pmm/ml氯霉素(Cm)的LB中，并让这些细胞在振摇下37℃下生长，直至生长达到中对数期，得到枯草芽孢杆菌对照宿主细胞41pBS19和42pBS19，以及过表达ymaH的宿主细胞的液体培养物，将各个培养物用含有5ppm/ml Cm的新鲜复合培养基以1∶100稀释，并在250rpm振摇下在37℃下生长。在图中所示时间点取培养物的样本。离心样本，检测上清中的枯草杆菌蛋白酶的生产。

10微升的各种枯草芽孢杆菌培养物上清用100ul的Tris缓冲液稀释，其中含有10mM Tris+0.005％

-80，pH 8.6；和25μl的100mg/ml AAPF。计算各个蛋白酶的活性，过表达YmaH对蛋白酶生产的影响示于图3A-B和图4中。

图3A和3B表明在杆菌宿主细胞中过表达ymaH，无论存在(42SigA和42SigH；图3A)还是不存在(41SigH；图3B)degU(Hy)突变，与各自的对照细胞41pBS19和42pBS19产生的水平相比，都以几倍的水平增强了aprE枯草杆菌蛋白酶的生产。另外，过表达ymaH的细胞在比不过表达ymaH的细胞早的时间产生了升高水平的枯草杆菌蛋白酶。例如，图3A表明42sigH细胞在生长20小时时产生了与亲本对照细胞在48小时时产生的几乎同样多的枯草杆菌蛋白酶。相似地，图3B表明41SigH细胞在25小时时产生了比41pBS对照细胞在48小时产生的多的枯草杆菌蛋白酶。图4中所示图表明表达ymaH的细胞当该表达用SigH启动子驱动(42SigH)时，导致产生的枯草杆菌蛋白酶多于其中用sigma启动子驱动ymaH表达的细胞(42SigA)产生的枯草杆菌蛋白酶。图4还表明，无论是被SigH还是SigA启动子驱动，ymaH的过表达都在早至细胞仅仅生长一小时后的时间点就导致枯草杆菌蛋白酶的增强生产。

Claims

1.一种分离的嵌合多核苷酸，包括有效连接到编码YmaH蛋白质的多核苷酸的SigA启动子的多核苷酸序列，其中所述多核苷酸序列由SEQ IDNO：2或SEQ ID NO：3组成。

2.一种载体，包含有效连接到sigA和/或sigH启动子上的编码YmaH蛋白质的多核苷酸，其中所述多核苷酸由SEQ ID NO：1、2、3或13组成。

3.一种改良的包含权利要求2所述载体的枯草芽孢杆菌宿主细胞，其中所述改良的枯草芽孢杆菌宿主细胞能够生产枯草杆菌蛋白酶。

4.如权利要求3所述的改良的宿主细胞，其中所述枯草杆菌蛋白酶与所述改良的宿主细胞同源或异源。

5.如权利要求3所述的改良的宿主细胞，其中所述枯草杆菌蛋白酶的表达由aprE启动子驱动。

6.如权利要求3所述的宿主细胞，其中所述枯草杆菌蛋白酶选自：枯草杆菌蛋白酶168、枯草杆菌蛋白酶BPN′、枯草杆菌蛋白酶Carlsberg、迟缓芽孢杆菌的枯草杆菌蛋白酶、克劳氏芽孢杆菌的枯草杆菌蛋白酶、枯草杆菌蛋白酶DY、枯草杆菌蛋白酶147和枯草杆菌蛋白酶309。

7.如权利要求3所述的改良的宿主细胞，其中所述改良的宿主细胞包含degU(Hy)32突变。

8.一种获得改良的枯草芽孢杆菌细胞的方法，包括：

a)用权利要求2的载体转化枯草芽孢杆菌宿主细胞，其中所述枯草芽孢杆菌细胞能够表达枯草杆菌蛋白酶；和

b)在适宜表达所述枯草杆菌蛋白酶的生长条件下生长所述改良的细胞。

9.如权利要求8所述的方法，其中包含所述多核苷酸构建体的所述载体存在于复制的质粒上。

10.如权利要求8所述的方法，其中所述构建体被整合到所述改良的细胞的基因组中。

11.如权利要求8所述的方法，其中所述枯草杆菌蛋白酶与所述改良的宿主细胞同源或异源。

12.一种在能够生产枯草杆菌蛋白酶的改良的枯草芽孢杆菌细胞中生产所述枯草杆菌蛋白酶的方法，所述方法包括：

a)培养所述改良的枯草芽孢杆菌细胞，其中所述改良的细胞能够过表达ymaH；和

b)在适宜表达所述枯草杆菌蛋白酶的生长条件下生长所述改良的枯草芽孢杆菌细胞。

13.如权利要求12所述的方法，进一步包括回收所述枯草杆菌蛋白酶的步骤。

14.如权利要求12所述的方法，其中所述枯草杆菌蛋白酶产生的时间点早于枯草杆菌蛋白酶在相应的前体宿主细胞中产生的时间点。

15.如权利要求12所述的方法，其中所述枯草杆菌蛋白酶的表达由aprE启动子驱动。

16.如权利要求12所述的方法，其中所述枯草杆菌蛋白酶与所述改良的宿主细胞同源或异源。

17.一种在枯草芽孢杆菌中增强枯草杆菌蛋白酶表达的方法，包括：

a)在枯草芽孢杆菌亲本宿主细胞中获得改良的枯草芽孢杆菌细胞，该改良的枯草芽孢杆菌细胞包含过表达的ymaH；

b)在适宜的生长条件下生长所述改良的枯草芽孢杆菌细胞；和

c)使所述枯草杆菌蛋白酶在所述改良的枯草芽孢杆菌细胞中表达，其中所述枯草杆菌蛋白酶在所述改良的枯草芽孢杆菌细胞中的表达与所述枯草杆菌蛋白酶在所述枯草芽孢杆菌亲本宿主细胞中的表达相比得到了增强。

18.如权利要求17所述的方法，其中所述过表达包括用包含编码YmaH蛋白质的多核苷酸的多核苷酸构建体转化枯草芽孢杆菌亲本宿主细胞，所述编码YmaH蛋白质的多核苷酸有效连接到sigA或sigH启动子。

19.如权利要求18所述的方法，其中有效连接到sigA或sigH启动子的编码YmaH蛋白质的所述多核苷酸由选自SEQ ID NO：1、2、3和13的多核苷酸序列组成。

20.如权利要求18所述的方法，其中所述构建体存在于质粒中或被整合到所述改良的细胞的基因组中。

21.如权利要求18所述的方法，其中所述宿主细胞是野生型细胞。

22.如权利要求18所述的方法，其中所述宿主细胞是改变的宿主细胞。

23.如权利要求17所述的方法，其中所述枯草杆菌蛋白酶与所述改良的宿主细胞同源或异源。

24.如权利要求8所述的方法，其中aprE启动子驱动所述枯草杆菌蛋白酶的表达。

25.如权利要求17所述的方法，其中aprE启动子驱动所述枯草杆菌蛋白酶的表达。