CN1965085A

CN1965085A - 具有高分泌水平的突变的原核细胞

Info

Publication number: CN1965085A
Application number: CNA2005800186315A
Authority: CN
Inventors: 阿伦·K·尼尔森; 迈克尔·D·拉斯马森
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2004-04-07
Filing date: 2005-04-07
Publication date: 2007-05-16
Also published as: EP1735451A1; EP1735451B1; US20090136995A1; US7951556B2; ATE447031T1; DE602005017374D1; WO2005098003A1; DK1735451T3

Abstract

本发明涉及一种突变的原核细胞，其与其它的等基因但未突变的细胞相比，能分泌较高量的至少一种目标异源多肽，并降低了YusZ或YusX，或其同源物的表达水平，以及构建上述细胞和使用上述细胞生产多肽的方法。

Description

具有高分泌水平的突变的原核细胞

发明领域：

本发明涉及突变的原核细胞，其与其它的等基因(isogenic)但未突变的细胞相比，能够分泌较高量的至少一种目标异源多肽，同时降低了YusZ或YusX，或其同源物的表达水平，和构建上述细胞和应用上述细胞生产多肽的方法。

技术背景：

yusZ和yusX的DNA序列在1993年首次报道，但仅作为推定的开放阅读框被报道(Chen等，1993，Metalloregulation in Bacillus subtilis：isolation andcharacterization of two genes difierentially repressed by metal ions，J Bact175(17)：5428-5437)。

在以后的文献中，人们推测yusX和紧邻yusX上游的被称作yusY的开放阅读框可能是由于单yusXY基因的移码突变造成的。然而，该文献的作者没有进行进一步的研究，同时得出结论认为上述基因在细胞中的功能仍然是未知的(Kanamaru等，2002，Overexpression of the PepF OligopeptidaseInhibits Sporulation Initiation in Bacillus Subtillis，J Bact 184(1)：43-50)。

定义：

在本发明中使用了本技术领域常规的分子生物学、微生物学和重组DNA技术。这些技术在文献中有详细的解释。如参见，Sambrook、Fritsch和Maniatis，Molecular Cloning：A Laboratory Manual，第二版(1989)，ColdSpring Harbor Laboratory Press，Cold Spring Harbor，New York(在此被称为“Sambrook等，1998”)；DNA Cloning：A Practical Approach，第I卷和第II卷(D.N.Glover编著，1985)；Oligonucleotide Synthesis(M.J.Gait编著，1984)；Nucleic Acid Hybridization(B.D.Hames和S.J.Higgins编著，(1985))；Transcription And Translation(B.D.Hames和S.J.Higgins编著，(1984))；Animal Cell Culture(R.I.Freshney编著，(1986))；Immobilized Cells AndEnzymes(IRL Press，(1986))；B.Perbal，A Pracctical Guide To MolecularCloning(1984)。

术语“多核苷酸“是指单链的或双链的脱氧核糖核苷酸或核糖核苷酸碱基的聚合体，从5’端到3’端阅读。多核苷酸包括RNA和DNA，可以是从自然界分离的、在体外合成的、或者是将天然的和合成的分子进行组合而制备的。

术语“核酸分子”或“核苷酸序列”是指单链形式的或双链螺旋形式的核糖核苷(腺苷、鸟苷、尿苷或胞苷；“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷；“DNA分子”)的磷酸酯聚合体。可能是双链的DNA-DNA、DNA-RNA和RNA-RNA螺旋。术语核酸分子，尤其DNA或RNA分子，仅指分子的一级结构和二级结构，并不将其限定于任何具体的三级或四级形式。因此，上述术语包括存在于线性或环状的DNA分子(如限制性片段)、质粒和染色体及他处的双链DNA。在描述特定的双链DNA分子的结构时，本发明根据通常的惯例仅给出沿着DNA非转录链(即与mRNA序列同源的链)从5’到3’方向的序列。“重组DNA分子”是指经过分子生物学操作的DNA分子。

核酸分子与另外一个核酸分子，如cDNA、基因组DNA、或RNA是“可杂交的(hybridizable)”，如果单链形式的核酸分子在适当的温度和溶液离子强度条件下能够与另外一个核酸分子退火(参见Sambtook等，如前所述)。温度和离子强度条件决定着杂交的“严紧度(stringency)”。

在本发明中，杂交意味着所述核苷酸序列与标记的多核苷酸探针杂交，其中所述标记的多核苷酸探针与SEQ ID NO：1、SEQ ID NO：3、或SEQ IDNO：5所示的核苷酸序列在非常低到非常高的严紧条件下杂交。在上述条件下与所述多核苷酸探针杂交的分子，可以使用X-射线胶片或通过任何其它本领域已知的方法进行检测。在本上下文中当使用的术语“多核苷酸探针”时，可理解为所述探针包含至少15个核苷酸。

在一个感兴趣的实施方式中，所述多核苷酸探针是SEQ ID NO：1、SEQID NO：3、或SEQ ID NO：5的至少15个核苷酸的片段的互补链。在另外一个感兴趣的实施方式中，所述多核苷酸探针是编码SEQ ID NO：2、SEQ IDNO：4、或SEQ ID NO：6多肽的任意核苷酸序列的互补链的具有至少15个核苷酸的片段。在又一个感兴趣的实施方式中，所述多核苷酸探针是SEQ IDNO：1、SEQ ID NO：3、或SEQ ID NO：5的互补链。在又一个感兴趣的实施方式中，所述多核苷酸探针是SEQ ID NO：1、SEQ ID NO：3、或SEQ ID NO：5的成熟多肽编码区的互补链。

对于长度为至少100个核苷酸的长探针来说，非常低到非常高的严紧条件定义为按照标准的Southern印迹分析程序，在如下条件下进行的预杂交和杂交：42℃、5X SSPE、0.1％SDS、5X Denhardt’s溶液、100微克/ml经过剪切和变性的鲑精DNA。优选地，所述至少100个核苷酸的长探针包含不超过1000个核苷酸。对于长度为至少100个核苷酸的长探针来说，载体材料最后用2x SSC、1％SDS在42℃(非常低的严紧条件)下洗涤三次，每次15分钟，优选用0.5x SSC、0.1％SDS在42℃(低度严紧条件)下洗涤三次，每次15分钟，更优选用0.2x SSC、0.1％SDS在42℃(中度严紧条件)下洗涤三次，每次15分钟，还更优选用0.2x SSC、0.1％SDS在55℃(中高度严紧条件)下洗涤三次，每次15分钟，最优选用0.1x SSC、0.1％SDS在60℃(高度严紧条件)下洗涤三次，每次15分钟，尤其是用0.1x SSC、0.1％SDS在68℃(非常高的严紧条件)下洗涤三次，每次15分钟。

虽然不是特别优选的，但预期也可以使用较短的探针，如长度从约15到99个核苷酸的探针，如长度从约15到约70个核苷酸的探针。对于上述短探针来说，严紧条件定义为根据标准的Southern印迹分析程序，在如下条件下进行预杂交、杂交和杂交后洗涤：比根据Bolton和McCarthy所描述的计算方法(1962，Proceedings of the National Academy of Sciences USA48：1390)计算的Tm值低5℃-10℃的温度下，在0.9M NaCl、0.09MTris-HCl pH7.6、6mM EDTA、0.5％NP-40、1x Denhardt’s溶液、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP、和0.2mg/ml酵母RNA。

对于长度为约15个核苷酸到99个核苷酸的短探针来说，将载体材料在低于所计算出的Tm值5℃-10℃的温度下用6x SCC加0.1％SDS洗涤一次，15分钟，然后用6x SSC洗涤两次，每次15分钟。

DNA“编码序列”或“开放阅读框(ORF)”是指当置于合适的调控序列控制之下时，在体内或体外细胞中转录并翻译成多肽的双链DNA序列。编码序列的边界由位于5’(氨基)末端的起始密码子和位于3’(羧基)末端的翻译终止密码子确定。编码序列包括但不限于，原核序列、来自真核mRNA的cDNA、来自真核(如哺乳动物)DNA的基因组DNA序列、和甚至合成的DNA序列。如果想要在真核细胞中表达编码序列，则通常将聚腺苷酸化信号和转录终止序列置于编码序列的3’端。

表达载体是一种DNA分子，有线性的和环状的，其包含编码目标多肽的片段，其可操作地连接于为其转录提供的其它片段。所述其它片段可包括启动子和终止子序列，和任选的一个或多个复制起点、一个或多个选择标记、增强子、聚腺苷酸化信号等。表达载体通常衍生自质粒或病毒DNA，或者可包含两者的元件。

转录和翻译调控序列是DNA调控序列，如启动子、增强子、终止子等，其提供编码序列在宿主细胞中的表达。在真核细胞中，聚腺苷酸化信号是控制序列。

“分泌信号序列”是编码如下多肽(“分泌肽(secretory peptide)”)的DNA序列，其作为大型多肽(larger peptide)的一部分，指导大型多肽通过细胞的分泌途径而分泌，在所述细胞中合成该大型多肽。所述大型多肽通常在经过分泌途径的过程中被切割以去除上述分泌肽。

本发明中使用的术语“启动子”具有本领域公认的含义，其表示包含用于结合RNA聚合酶并启动转录的DNA序列的基因部分。启动子序列通常(但不总是)位于基因的5’非编码区。

如果一种染色体基因所编码的多肽不再以功能性形式被表达，则将上述染色体基因成为非功能性的。此基因的非功能性可以通过多种本领域已知的基因操作来诱导，Sambrook等(见上文)描述了其中一些基因操作方法。基因的ORF的部分缺失通常会使基因成为非功能性的，突变也是如此。

本发明中使用的术语“染色体基因的可表达拷贝”是指染色体基因的ORF拷贝，其中所述ORF可表达以产生完全功能性基因产物。可表达拷贝可以不由染色体基因的天然启动子转录，其可改为由外源或异源启动子转录，或者其可根本没有启动子，仅通过存在于ORF5’端上游的基因的转录通读(transcriptional read-through)而表达。在本文中，转录通读的含义与本领域通常所公认的含义相同。

“可操作连接的”，当指DNA片段时，表示将片段进行排列以使它们能够共同发挥功能以实现预期目的，例如从启动子开始转录，经过编码片段直至终止子。

当RNA聚合酶将编码序列转录成mRNA，然后所述mRNA经过反式RNA剪接(trans-RNA spliced)并被翻译为由所述编码序列编码的蛋白时，则称编码序列在细胞中的转录和翻译控制序列的“控制之下”。

“异源”DNA是指不是天然位于细胞中或所述细胞的染色体位点中的DNA。优选的，异源DNA包括对所述细胞来说是外源的基因。

本发明中使用的术语“核酸构建体”是指cDNA、基因组DNA、合成DNA或RNA来源的任意的核酸分子。术语“构建体”是指核酸片段，其可以是单链的或双链的，并可基于编码目标多肽的全部或部分天然存在的核苷酸序列。构建体可选择地包含其它核酸片段。

本发明的编码本发明多肽的核酸构建体可合适地为基因组或cDNA来源，例如通过制备基因组或cDNA文库，并使用合成寡核苷酸探针根据标准技术(参见上文Sambrook等)，通过杂交筛选出编码全部或部分多肽的DNA序列所得到的。

本发明编码多肽的核酸构建体还可以通过已经建立的标准方法进行合成制备，例如，Beaucage和Caruthers描述的亚磷酰胺(phosphoamidite)方法(Tetrahedron Letters 22(1981)，1859-1869)，或者Mattes等描述的方法(EMBO Journal 3(1984)，801-805)。按照亚磷酰胺方法，例如在DNA自动合成仪中合成寡核苷酸，然后经过纯化、退火、连接，并克隆到合适的载体中。

此外，核酸构建体可以是混合的合成和基因组来源的、混合的合成和cDNA来源的、或者混合的基因组和cDNA来源的，其按照标准技术通过连接合成的、基因组或cDNA来源(如适当的)的片段来制备，其中上述片段对应于完整核酸构建体的各个部分。还可以使用特异性引物通过聚合酶链式反应来制备核酸构建体，例如US4,683,202或Saiki等(Science239(1988)，487-491)所描述的。

术语核酸构建体，当其包含对于本发明编码序列的表达来说是必需的控制序列时，其与术语“表达盒”是同义的。

在本发明中，术语“控制序列”包括对于核酸序列的编码序列的表达来说是必需的或有利的所有组分。每个控制序列可为对于编码多肽的核酸序列来说是天然的或是异源的。这样的控制序列包括但不限于，前导序列、聚腺苷酸化序列、前肽序列、启动子、信号序列、和转录终止子。控制序列最低限度包括启动子，和转录及翻译终止信号。为了导入特异限制性位点，以便于将控制序列与编码多肽的核酸序列编码区连接到一起，可以为控制序列提供一段接头。

控制序列可以是合适的启动子序列，即被宿主细胞识别以表达核酸序列的核酸序列。启动子序列包含介导多肽表达的转录和翻译调控序列。启动子可以是任意在优选宿主细胞中显示转录活性的核酸序列，并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。

控制序列还可以是合适的转录终止子序列，即能够被宿主细胞识别以终止转录的序列。终止子序列可操作地连接到编码多肽的核酸序列的3’末端。在优选宿主细胞中具有功能的任意终止子，可以在本发明中使用。

控制序列还可以是聚腺苷酸化序列，即可操作地连接到核酸序列的3’末端，并且当转录时，作为一种向所转录的mRNA上添加聚腺苷残基的信号而被宿主细胞识别的序列。在优选宿主细胞中具有功能的任意聚腺苷酸化序列，均可以在本发明中使用。

控制序列还可以是信号肽编码区，其所编码的氨基酸序列连接在多肽的氨基末端，所述多肽能够将表达的多肽导入宿主细胞的细胞分泌途径。核酸序列的编码序列的5’端可以固有包含信号肽编码区，其在翻译阅读框中与编码分泌性多肽的编码区片段天然相连。可选择地，编码序列的5’端可以包含对于编码分泌的多肽的编码序列部分来说是外源的信号肽编码区。在编码序列不固有地包含信号肽编码区的情况下，需要外源信号肽编码区。可选择地，外源信号肽编码区可简单地替代天然的信号肽编码区，以获得相对于通常与编码序列连接的天然的信号肽编码区来说增强的胞外蛋白的分泌。信号肽编码区可获自曲霉属(Aspergillus)菌种的葡糖淀粉酶或淀粉酶基因、根毛霉属(Rhizomucor)菌种的脂肪酶或蛋白酶基因、酿酒酵母(Saccharomyces cerevisiae)的α-因子基因、芽孢杆菌属(Bacillus)菌种的淀粉酶或蛋白酶基因、或小牛前凝乳酶原(preprochymosin)基因。然而，能够将表达的多肽导入优选宿主细胞的分泌途径的任意信号肽编码区，均可以在本发明中使用。

控制序列还可以是前肽编码区，其编码位于多肽氨基末端的氨基酸序列。所得到的多肽称为酶原(proenzyme)或多肽原(propolypeptide)(某些情况中称作酶原(zymogen))。多肽原通常是无活性的，并通过催化或自主催化从多肽原中切割前肽，从而将多肽原转化为成熟的活性多肽。前肽编码区可获自枯草芽孢杆菌碱性蛋白酶基因(aprE)、枯草芽孢杆菌中性蛋白酶基因(nprT)、酿酒酵母α-因子基因、或嗜热毁丝酶(Myceliophthorathermophilum)漆酶基因(WO95/33836)。

另外还预期添加调控序列，其允许相对于宿主细胞的生长调控多肽的表达。调控系统的实例是那些使基因的表达响应于化学或物理的刺激，包括调控化合物的存在，而打开或关闭的系统。原核系统中的调控系统包括lac、tac、和trp操作子系统。

指导本发明基因转录(尤其是在细菌宿主细胞中转录)的合适启动子的实例是获自大肠杆菌(E.coli)lac操作子、天蓝色链霉菌(Streptomycescoelicolor)琼脂水解酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶(levansucrase)基因(sacB)、枯草芽孢杆菌碱性蛋白酶基因、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、解淀粉芽孢杆菌BAN淀粉酶基因、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、和原核β-内酰胺酶(Villa-Kamaroff等，1978，Proceedings of the National Academy ofSciences USA75：3727-3731)、以及tac启动子(DeBoer等，1983，Proceedingsof the National Academy of Sciences USA80：21-25)的启动子。其它的启动子在“Useful proteins from recombinant bacteria”，Scientific American，1980，242：74-94；以及上文所提及的Sambrook等，1989的文献中描述。

在细菌宿主细胞中有效的信号肽编码区是获自芽孢杆菌NCIB11837的产麦芽糖淀粉酶基因、嗜热脂肪芽孢杆菌α-淀粉酶基因、地衣芽孢杆菌枯草杆菌蛋白酶基因、地衣芽孢杆菌β-内酰胺酶基因、嗜热脂肪芽孢杆菌中性蛋白酶基因(nprT、nprS、nprM)、和枯草芽孢杆菌PrsA基因的信号肽编码区。其它的信号肽在Simonen和Palva，1993，Microbiological Reviews57：109-137中描述。

本发明还涉及包含本发明核酸序列、启动子和转录及翻译终止信号的重组表达载体。还可以将上文所述的各种核酸和控制序列连接在一起，以产生重组表达载体，该重组表达载体可包括一个或多个方便的限制性位点以使编码多肽的核酸序列在所述位点进行插入或取代。可选择地，本发明的核酸序列可以通过将包含所述序列的核酸序列或核酸构建体插入到合适的载体而进行表达。在构建表达载体时，所述编码序列在载体中的位置使得所述编码序列可操作地与合适的控制序列连接用于进行表达和可能的分泌。

重组表达载体可以是任意可方便地接受重组DNA操作，并且能够使所述核酸序列表达的载体(如质粒或病毒)。载体的选择将通常取决于载体与其将要导入的宿主细胞的兼容性。载体可以是线性或者闭环形质粒。载体可以是自主复制载体，即作为存在于染色体外的实体存在的其复制不依赖于染色体复制的载体，如质粒、染色体外元件、微型染色体、或人工染色体。载体可包含任意确保自主复制的工具。可选择地，载体可以是如下的载体，当导入宿主细胞时，其被整合到基因组，然后与所整合的染色体一起复制。载体系统可以是单个载体或质粒，或两个或多个载体或质粒，其共同含有将被导入宿主细胞的基因组的总DNA，或转座子。

本发明的载体优选包含一个或多个选择标记，其允许容易地选择转化细胞。选择标记可以是这样的基因，其表达产物提供抗微生物剂抗性或病毒抗性、对于重金属的抗性、原养型到营养缺陷型等。

抗生素选择标记赋予了对一些抗生素的抗生素抗性，如氨苄青霉素、卡那霉素、氯霉素、四环素、新霉素、潮霉素、或氨甲蝶呤。对于酵母宿主细胞来说，合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。

本发明的载体优选包含使载体、或载体的较小部分稳定整合到宿主细胞基因组，或使载体在宿主细胞中不依赖于细胞基因组而自主复制的元件。

载体、或载体的较小部分，如本发明的扩增单元，当导入宿主细胞时，可以整合到宿主细胞基因组。对于染色体整合，载体可依赖于载体中编码多肽的核酸序列，或载体的任何其它元件，用于通过同源或非同源重组将载体稳定整合到基因组。

可选择地，载体可包含额外的核酸序列，其用于指导通过同源重组整合到宿主细胞基因组中。所述额外的核酸序列能够使载体精确整合到宿主细胞基因组染色体的准确位置。为了提高在精确位置整合的可能性，整合元件应优选包含足够数目的核酸，如100至1,500个碱基对，优选400至1,500个碱基对，并最优选800至1,500个碱基对，其与相应的靶序列高度同源以增强同源重组的可能性。整合元件可以是任意的与宿主细胞基因组中的靶序列同源的序列。此外，整合元件可以是非编码或编码核酸序列；适于通过同源重组而进行位点特异性整合的编码序列的具体实例在WO02/00907(Novozymes，Denmark)中给出，其全文并入本文作为参考。

另一方面，可将载体通过非同源重组而整合到宿主细胞基因组。这样的核酸序列可以是任意的与宿主细胞基因组中的靶序列同源的序列，而且，此外，可以是非编码或编码序列。载体、表达盒、扩增单元、基因或实际上任何确定的核苷酸序列的拷贝数是指在任一时刻存在于宿主细胞中的相同拷贝的数目。基因或另一确定的染色体核苷酸序列可以在染色体上存在一个、两个或多个拷贝。自主复制载体可以在每个宿主细胞中存在一个、或几百个拷贝。

本发明的扩增单元是指这样的核苷酸序列，其能够整合到宿主细胞染色体，并且其可以在宿主细胞中通过倍增复制来提高整合到染色体上的拷贝的数目。上述单元包含本文所定义的表达盒，所述表达盒包含至少一个目标基因的拷贝和如本文中所定义的宿主细胞染色体基因的可表达拷贝。当扩增单元被整合到宿主细胞染色体时，其被定义为染色体的一个特殊区域，其易于通过两个DNA直接重复区域之间的同源重组而得到复制。因此扩增单元相对于两侧的DNA的精确边界是功能性地定义的，因为复制过程可能实际上复制部分导入染色体的DNA以及部分它本身的内源染色体，这取决于重复区域内的准确重组位点。上述原理在Janniére等的文献中(1985，Stable gene amplification in the chromosome of Bacillus subtilis.Gene，40：47-55)阐明，该文献并入本文作为参考。

对于自主复制，载体可进一步包含能够使其在所述宿主细胞中自主复制的复制起点。细菌复制起点的实例是质粒pBR322、pUC19、pACYC177、pACYC184、pUB110、pE194、pTA1060和pAMbetal的复制起点。在酵母宿主细胞中使用的复制起点的实例是2微米复制起点，CEN6和ARS4的组合，和CEN3和ARS1的组合。复制起点可以是带有突变的复制起点，其中所述突变使其在宿主细胞中以温度敏感的(temperature sensitive)方式起作用(参见如Ehrlich，1978，Proceedings of the National Academy of SciencesUSA75：1433)。

本发明还涉及包含本发明核酸序列的重组宿主细胞，其有利地用于多肽的重组生产。术语“宿主细胞”包含任何在复制过程中由于发生突变而不同于亲代细胞的子代。

所述细胞优选用包含本发明的核酸序列的载体转化，然后将该载体整合到宿主染色体中。“转化”是指将包含本发明核酸序列的载体导入宿主细胞，使载体作为染色体整合子(chromosomal integrant)或者作为自我复制的染色体外载体而被保持。通常，整合被认为是有利的，因为这样核酸序列更有可能稳定地保持在所述细胞中。可以通过如上所述的同源或非同源重组使所述载体整合到宿主染色体中。

细菌宿主细胞的转化，可以通过例如下述的方式实现：原生质体转化(参见如Chang和Cohen，1979，Molecular General Genetics 168：111-115)、使用感受态细胞(参见如Young和Spizizin，1961，Journal of Bacteriology81：823-829，或Dubnar和Davidoff-Abelson，1971，Journal of MolecularBiology 56：209-221)、电穿孔(参见如Shigekawa和Dower，1988，Biotechniques 6：742-751)、或接合(conjugation)(参见如Koehler和Thorne，1987，Journal of Bacteriology 169：5771-5278)。

将上述转化的或转染的宿主细胞在合适的营养培养基中在能使目标多肽表达的条件下进行培养，之后从细胞或培养液中回收产生的多肽。

用于培养细胞的培养基可以是任意的适用于培养所述宿主细胞的常规培养基，如基本培养基或包含合适添加物的复合培养基。合适的培养基可由供应商获得，或可以根据公开的配方(如美国典型培养物保藏中心(American Type Culture Collection)的目录)制备。使用本领域已知的方法制备上述培养基(细菌和酵母的参考文献，参见如Bennett，J.W.和LaSure，L.编辑的More Gene Manipulations in Fungi，Academic Press，CA，1991)。

通过常规方法从培养基中回收多肽，所述常规方法包括通过离心或过滤从培养基中分离出宿主细胞，使用盐如硫酸铵沉淀所述上清液或滤液中的蛋白质成分，通过各种层析方法，如离子交换层析、凝胶过滤层析、亲和层析等进行纯化，使用何种层析方法这依赖于所纯化多肽的类型。

可以使用本领域已知的对所述多肽具有特异性的方法来检测所述多肽。这样的检测方法可包括使用特异性抗体、生成酶产物、或酶底物的消失。例如，可以使用酶活性测定来检测多肽的活性。

可以通过本领域已知的多种方法来纯化本发明的多肽，所述方法包括但不限于，层析(如离子交换层析、亲和层析、疏水层析、层析聚焦和大小排阻层析)、电泳方法(如制备型等电聚焦(IEF)、溶解度差异(如硫酸铵沉淀法)、或提取(参见如Protein Purification，J.-C.Janson和Lars Ryden编辑，VCH Publishers，New York，1989)。

在本上下文中，术语“基本上(substantially)纯的多肽”是指这样的多肽制剂，其包含至多10重量％的与所述多肽天然结合的其它多肽物质(优选其它多肽物质的百分率较低，如至多8重量％，至多6重量％，至多5重量％，至多4重量％，至多3重量％，至多2重量％，至多1重量％，和至多重量％)。因此，优选基本上纯的多肽的纯度为至少92％，即所述多肽占制剂中存在的总多肽物质的至少92重量％，并优选更高的百分率，如至少94％的纯度，至少95％的纯度，至少96％的纯度，至少96％的纯度，至少97％的纯度，至少98％的纯度，至少99％的纯度，和最多99.5％的纯度。本发明所公开的多肽优选是基本纯的形式。具体地，优选本发明公开的多肽是“基本上(essentially)纯的形式”，即，多肽制剂基本上不含其它与其天然结合的多肽物质。这可以通过例如利用公知的重组方法来制备所述多肽而实现。在本文中，术语“基本纯的多肽”与术语“分离的多肽”和“分离形式的多肽”是同义的。

在本上下文中，两个氨基酸序列或者两个核苷酸序列之间的同源性用参数“同一性”来描述。为了本发明的目的，可以使用完全Smith-Waterman比对法来进行序列比对和计算同源性得分，完全Smith-Waterman比对法对蛋白和DNA比对均适用。对蛋白和DNA比对，分别使用缺省计分矩阵BLOSUM50和同一性矩阵。对于缺口中的第一个残基，蛋白的罚分是-12，DNA的罚分是-16，而对于缺口中的其它残基，蛋白的罚分是-2，DNA的罚分是-4。可以使用FASTA包v20u6版本来进行比对(W.R.Pearson和D.J.Lipman(1988)，“Improved Tools for Biological Sequence Analysis”，PNAS85：2444-2448，和W.R.Pearson(1990)，“Rapid and Sensitive SequenceComparison with FASTP and FASTA”，Methods in Enzymology，183：63-98)。

进行蛋白序列的多重比对可以使用“ClustalW”(Thompson，J.D.，Higgins，D.G.和Gibson，T.J.(1994)CLUSTAL W：improving the sensitivity ofprogressive multiple sequence alignment through sequence weighting，positions-specific gap penalties and weight matrix choice.Nucleic AcidsResearch，22：4673-4680)。DNA序列的多重比对可以使用蛋白比对作为模板，将其中的氨基酸用DNA序列相应的密码子代替。

在本上下文中，YusZ或YusX蛋白的功能同源物是指这样的蛋白，当其在细胞中降低表达水平时，使异源多肽(优选一种酶，如α-淀粉酶)的分泌与正常表达YusZ或YusX功能同源物的等基因细胞相比增加，其都是在基本上相同的条件下进行培养的。此外，当如上文所述进行比对时，YusZ或YusX蛋白的功能同源物分别与YusZ或YusX蛋白具有至少50％，优选55％、60％、65％、70％、75％、80％、85％、90％、95％、97％，或最优选99％的氨基酸序列同一性。

在本上下文中，术语“等位基因变体”表示占据同一染色体基因座的两个或多个基因可选形式中的任一个。等位基因变体可以通过突变自然出现，同时可能在群体中形成多态性。基因突变可以是沉默的(即所编码的多肽没有发生变化)，或者可编码氨基酸序列发生变化的多肽。多肽的等位变体是指由基因的等位基因变体编码的多肽。本文所定义的功能同源物包括等位基因变体。

YusZ或YusX蛋白或其功能同源物可以是从自然界分离并鉴定的野生型的蛋白。上述野生型蛋白可以通过本领域标准技术进行特定筛选。此外，编码YusZ或YusX蛋白或其功能同源物的基因，可以通过DNA改组技术来制备，如在J.E.Ness等Nature Biotechnology17：893-896(1999)中所描述的。另外，YusZ或YusX蛋白或其功能同源物可以是人工变体。所述人工变体可以通过本领域已知的标准技术，如通过定点/随机诱变来构建。在本发明的一个实施方式中，氨基酸的改变(在人工变体以及野生型多肽中)是较少天然的，其为不明显影响蛋白的折叠和/或活性的保守性氨基酸取代；小缺失，通常为一个到大约30个氨基酸的缺失；小氨基或羧基末端延伸，如氨基末端的甲硫氨酸残基；小接头肽，多至大约20-25个残基；或小延伸，其通过改变净电荷或其它功能而有利于纯化，如多组氨酸束(poly-histidine tract)、抗原表位或结合域。

保守取代的实例是在碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸)、芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸、丝氨酸和苏氨酸)的组内的氨基酸取代。通常不改变比活性(specific activity)的氨基酸取代在本领域是已知的，并例如在H.Neurath和R.L.Hill，1979，The Proteins，Academic Press，New York中描述。最经常发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly以及它们的反向交换。

对于本领域技术人员显而易见的是，上述修饰可以发生在分子功能关键区的外面，从而使多肽仍然保持其活性。因此，对于本发明核苷酸序列所编码多肽的活性必需的氨基酸残基，并由此优选不进行修饰，如取代，可以根据本领域已知的方法，如定点诱变或丙氨酸扫描诱变(alanine scanningmutagenesis)(参见如Cunningham和Wells，1989，Science 244：1081-1085)来鉴定。在后一项技术中，在分子中的每个带正电荷的残基导入突变，并测试所得到的突变分子的活性，以鉴定出对于分子的活性来说必需的氨基酸残基。还可以通过三维结构分析技术来测定底物-酶相互作用的位点，如通过如核磁共振分析、晶体学或光亲和标记(参见如Vos等，1992，Science255：306-312；Smith等，1992，Journal of Molecular Biology 224：899-904；Wlodaver等，1992，FEBS Letters 309：59-64)的技术所测定的。

此外，可以通过导入核苷酸取代来修饰编码本发明多肽的核苷酸序列，其中上述核苷酸取代不造成由核苷酸序列编码的多肽的氨基酸序列的改变，但其相应于用来生产酶的宿主生物的密码子使用特征(codon usage)。

向核苷酸序列中导入突变，使其中一个核苷酸交换为另外一个核苷酸，可以使用本领域已知的任意方法通过定点诱变而实现。特别有用的方法是，使用带有目标插入物的超螺旋双链DNA载体，和两条包含所需突变的合成引物。每条互补于载体的相反链的寡核苷酸引物在使用Pfu DNA聚合酶的温度循环过程中进行延伸。由于引物的掺入，生成含有交错切口的突变质粒。在进行完温度循环之后，将产物用DpnI进行处理，其中Dpnl特异于甲基化和半甲基化的DNA，以将亲代DNA模板消化并选择出含有突变的合成DNA。还可以使用本领域已知的其它方法。关于核苷酸取代的一般性描述参见如Ford等，1991，Protein Expression and Purification 2：95-107。

附图：

附图1显示如下文实施例7所描述的染色的或标记的聚丙烯酰胺凝胶电泳(PAGE)的凝胶。通过PAGE，检测了来自yusZ-缺失菌株(ANaprH-b)的四份独立分离物的蛋白酶产量(附图1，1-4号)，并与来自其它等基因对照菌株(ANaprH)的四份独立分离物的蛋白酶产量进行了比较，PAGE凝胶上标记的蛋白酶条带的浓度的差异清楚地显示yusZ-缺失菌株(ANaprH-b)比相应的参考菌株(ANaprH)产生了更多的蛋白酶。

发明概述：

枯草芽孢杆菌yusZ的DNA序列显示在SEQ ID NO：1中，推定的编码氨基酸序列显示在SEQ ID NO：2中，枯草芽孢杆菌yusX的DNA序列显示在SEQ ID NO：3中，推定的编码氨基酸序列显示在SEQ ID NO：4中；枯草芽孢杆菌yusY的DNA序列显示在SEQ ID NO：5中，推定的编码氨基酸序列显示在SEQ ID NO：6中。地衣芽孢杆菌yusZ的DNA编码序列显示在SEQ IDNO：24中，推定的编码氨基酸序列显示在SEQ ID NO：25中。

本发明所要解决的问题是如何提高在原核细胞中生产的异源多肽的分泌。本发明提供了突变的原核细胞，其与各自相应的其它等基因但未突变的细胞相比，降低了YusZ(SEQ ID NO’s：2或25)、YusX(SEQ ID NO：4)、或其同源物的表达水平，并分泌较高量的至少一种目标异源多肽。通常，在相同的生长条件下，将本发明的突变细胞与未突变的亲本细胞相比，其中所述突变体来源于未突变的亲本细胞；除了导致YusZ或YusX表达水平降低的突变外，亲本细胞与突变细胞是完全等基因的。本发明人发现在原核宿主细胞中降低YusZ或YusX的表达水平能够提高分泌的异源多肽的产量。此结果对于工业化生产分泌的多肽例如酶是非常令人感兴趣的。

因此，在第一个方面中，本发明涉及一种突变的原核细胞，其与其它等基因但未突变的细胞相比，降低了YusZ(SEQ ID NO’s：2或25)、YusX(SEQID NO：4)、或其同源物的表达水平，并分泌较高量的至少一种目标异源多肽。

在第二个方面中，本发明涉及构建突变的原核细胞的方法，所述方法包含如下步骤：

a)对原核细胞进行突变；和

b)筛选那些与其它等基因但未突变的细胞相比，降低了YusZ(SEQ IDNO’s：2或25)或YusX(SEQ ID NO：4)、或其同源物的表达水平，并分泌较高量的至少一种目标异源多肽的突变细胞。

本发明的最后一个方面涉及生产目标多肽的方法，所述方法包含如下步骤：

a)培养突变的原核细胞，其与其它的等基因但未突变的细胞相比，降低了YusZ(SEQ ID NO’s：2或25)、YusX(SEQ ID NO：4)、或其同源物表达水平，并分泌较高量的目标多肽；和

b)分离目标多肽。

发明详述：

本发明的第一方面涉及一种突变的原核细胞，其与其它等基因但未突变的细胞相比，降低了YusZ(SEQ ID NO’s：2或25)、YusX(SEQ ID NO：4)、或其同源物的表达水平，并分泌较高量的至少一种目标异源多肽。

本发明优选的实施方式涉及第一方面的细胞，其是革兰氏阳性细胞，优选是芽孢杆菌属细胞，更优选是嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌(B.amyloliquefaciens)、短芽孢杆菌(B.brevis)、环状芽孢杆菌(B.circulans)、B.clausii、凝结芽孢杆菌(B.coagulans)、灿烂芽孢杆菌(B.lautus)、迟缓芽孢杆菌(B.lentus)、地衣芽孢杆菌(B.licheniformis)、巨大芽孢杆菌(B.megaterium)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、枯草芽孢杆菌(B.subtilis)、或苏云金芽孢杆菌(B.thuringiensis)细胞；或涉及第二或第三方面的方法，其中所述细胞如上所列。

在本文中，YusZ或YusX蛋白的进化同源物(evolutionary homologue)、等位基因变体、人工变体、改组蛋白、种间变体(species variant)等等，均被称作YusZ或YusX蛋白或“功能同源物”(functional homologue)，并且本发明人预期在本发明的细胞和方法中降低上述功能同源物蛋白的表达将同等有效。

特别地，优选的实施方式涉及如下的细胞，其中YusZ或YusX蛋白或其功能同源物包含分别与SEQ ID NO：2或SEQ ID NO：4所示氨基酸序列具有至少70％同一性的氨基酸序列；优选分别与SEQ ID NO：2或SEQ IDNO：4所示氨基酸序列具有至少75％、80％、85％、90％、95％、97％、或甚至99％的同一性的氨基酸序列。

另一个优选实施方式涉及本发明的细胞、或本发明的方法，其中的YusZ或YusX蛋白或其功能同源物包含或分别由SEQ ID NO：2或SEQ ID NO：4所示的氨基酸序列组成。

基于yusX和yusY基因在操纵子中的结构(organisation)，降低YusX的表达可以通过突变上述编码基因，或通过突变操纵子紧邻上游的开放阅读框即yusY来实现。

相应地，在本发明的优选实施方式中，降低YusZ或YusX或其同源物的表达是通过突变一个或多个相对应的编码基因来实现的，本发明的细胞优选在yusZ(SEQ ID NOs：1或24)、yusX(SEQ ID NO：3)、和/或yusY(SEQID NO：5)、或其同源物中突变；而且优选地，所述yusZ、yusX、和/或yusY的同源物编码具有分别与SEQ ID NOs：2或25、SEQ ID NO：4、或SEQ IDNO：6所示序列具有至少70％同一性；或者优选分别与SEQ ID NOs：2、SEQID NO：4、或SEQ ID NO：6所示氨基酸序列具有至少75％、80％、85％、90％、95％、97％、或甚至99％的同一性的氨基酸序列的多肽；最优选地，所述yusZ、yusX、和/或yusY的同源物具有分别与SEQ ID NO’s：1或24、SEQ ID NO：3、或SEQ ID NO：5所示序列具有至少70％同一性；或优选分别与SEQ ID NOs：1或24、SEQ ID NO：3、或SEQ ID NO：5所示序列具有至少75％、80％、85％、90％、95％、97％、或甚至99％的同一性的核苷酸序列。

如本文中的其他地方所述，在细胞中鉴定功能性yusZ、yusX或YusY基因的一种方法是通过杂交。因此，优选的实施方式涉及第一方面的细胞，或第二或第三方面的方法，其中所述细胞在至少一个多核苷酸突变，其中所述至少一个多核苷酸中的至少100bp大小的亚序列与具有SEQ ID NOs：1或24、SEQ ID NO：3、或SEQ ID NO：5所示序列或其各自的互补序列的多核苷酸在非常低到非常高严紧性杂交条件下，优选非常低、低、中度、中高、高度或非常高的严紧杂交条件下杂交。

本发明的细胞可以用任何合适的方式进行突变，而且进行上述诱变的方法在本领域是公知的。

本发明的优选实施方式涉及第一方面的细胞，其中的yusZ、yusX、和/或yusY，或其同源物从染色体中部分或全部缺失。

另外一个优选实施方式涉及如下的细胞，其中的yusZ、yusX、和/或yusY，或其同源物包含至少一个移码突变或无义突变。

本发明的突变细胞与其它的等基因但未突变的细胞如亲本细胞相比，降低了YusZ或YusX蛋白、或其功能类似物的表达水平。应通过如下来进行对比：在基本相同的条件下，培养本发明的细胞以及等基因但未突变的细胞，然后通过本领域任意标准方法比较YusZ或YusX蛋白的量。优选本发明的细胞比未突变细胞少产生至少5％的YusZ或YusX，更优选至少10％、还更优选至少20％、最优选至少50％的YusZ或YusX蛋白或其功能同源物。

在优选实施方式中，本发明的细胞与其它等基因但未突变的细胞相比，YusZ或YusX或其同源物的表达水平降低了至少两倍；优选所述细胞与其它等基因但未突变的细胞相比，检测不到YusZ或YusX或其同源物的表达。

正如本发明人在此所显示的，在基本相同的条件下培养时，第一方面的细胞比对应的等基因但未突变的细胞，分泌更大量的目标异源多肽。

因此，本发明的优选实施方式涉及第一方面的细胞，其比其它等基因但未突变的细胞分泌更大量的目标异源多肽。优选本发明的细胞比未突变细胞多分泌至少5％、更优选至少10％、还更优选至少20％、最优选至少50％。可以通过本领域任意合适的分析方法来检测由所述细胞分泌的异源多肽的量；在下文中显示了一个非限制性的检测α淀粉酶分泌量的实例。

在本发明优选的实施方式中，所述至少一种异源多肽包含酶，优选所述酶是裂合酶、连接酶、水解酶、氧化还原酶、转移酶或异构酶。

将编码异源多肽的多核苷酸的一个或多个拷贝稳定地整合到原核细胞的染色体的方法在本领域中被充分地描述，如WO94/14968、WO99/41358、WO91/09129、WO02/00907或WO01/90393，上述文献在此全部并入作为参考。

因此，在本发明优选实施方式中，所述细胞包含一个或多个染色体整合的编码所述至少一种异源多肽的多核苷酸的拷贝。

本领域技术人员非常清楚，在多肽的工业化生产中，提高编码目标多肽的多核苷酸的表达是有利的，而且增强启动子强度是提高表达的途径之一，这在本领域中是公知常识，参见WO99/43835、WO93/10249、WO98/07846、或WO03/008575，上述文献在此全文并入作为参考。

优选的实施方式涉及本发明的细胞，其中的所述至少一种异源多肽由从至少一个异源启动子转录的多核苷酸编码，优选所述至少一个启动子包含人工启动子，更优选所述人工启动子包含一个或多个mRNA稳定序列(mRNA stabilizing sequence)，优选衍生自cryIIIa启动子。

实施例：

材料与方法：

菌株

枯草芽孢杆菌168，F.Kunst等，“The complete genome sequence of theGram-positive bacterium Bacillus subtilis”，Nature(1997)390：249-256。

枯草芽孢杆菌AN83，该菌株是携带质粒pKTH10的枯草芽孢杆菌168，其中所述质粒组成型地大量表达淀粉酶。

枯草芽孢杆菌AN133，该菌株是缺失yusZ基因的枯草芽孢杆菌168菌株。

枯草芽孢杆菌AN137，该菌株是携带质粒pKTH10的AN133，其中所述质粒组成型地大量表达淀粉酶。

枯草芽孢杆菌AN151，该菌株是缺失yusX基因的枯草芽孢杆菌168菌株。

枯草芽孢杆菌AN155，该菌株是携带质粒pKTH10的AN151，其中所述质粒组成型地大量表达淀粉酶。

地衣芽孢杆菌SJ1707，该菌株在美国专利No.5,698,415中描述。

地衣芽孢杆菌AN10R，该菌株是将SJ1707进行基因工程改造以过量表达来自Nocardiopsis prasina NRLL 18262(WO1988/003947)的蛋白酶10R。

地衣芽孢杆菌AN10R-b，该菌株是缺失yusZ基因的地衣芽孢杆菌AN10R菌株。

地衣芽孢杆菌ANaprH，该菌株是将SJ1707进行基因工程改造以过量表达来自Bacillus clausii的aprH碱性蛋白酶基因。

地衣芽孢杆菌ANaprH-b，该菌株是缺失yusZ基因的地衣芽孢杆菌ANaprH菌株。

枯草芽孢杆菌PP289-5，用于接合转移包含来自pUB110(在WO96/23073中描述)的oriT的质粒的供体菌株。

枯草芽孢杆菌AN220，该菌株是将枯草芽孢杆菌168进行基因工程改造以过量表达来自解淀粉芽孢杆菌的apr碱性蛋白酶基因。

枯草芽孢杆菌AN225，该菌株是缺失yusZ基因的AN220。

引物：

yusZ1F(SEQ ID NO：7)：ccttcccggggctaagcttttcggc

yusZ2R(SEQ ID NO：8)：gatagactcccacgcgctggacgctcctgt

yusZ2F(SEQ ID NO：9)：acaggagcgtccagcgcgtgggagtctatc

yusZ3R(SEQ ID NO：10)：aacggtaccctgaccaagcagacag

yusX1F(SEQ ID NO：11)：aatgcccgggcaagctttacagctg

yusX2R(SEQ ID NO：12)：ggcgtcacgcacagcaacgagcgacgattg

yusX2F(SEQ ID NO：13)：caatcgtcgctcgttgctgtgcgtgacgcc

yusX3R(SEQ ID NO：14)：aatcggtaccatcataatgactgtc

yusZlich1F(SEQ ID NO：19)：tcagcagcccgcggagcagccgttttaatggaacc

yusZlich2R(SEQ ID NO：20)：atgaccgcacgttcccaaatgctcgtcgcgcccgttacaa

yusZlich3F(SEQ ID NO：21 )：ttgtaacgggcgcgacgagcatttgggaacgtgcggtcat

yusZlich4R(SEQ ID NO：22)：gcggatttgacgtcaatcgcttaccagtgcggaaac

质粒：

pKTH10：Vehmaanpera J，Steinborn G，Hofemeister J.，“Genetic manipulationofBacillus amyloliquefaciens.”，J Biotechnol，1990-07，19(2-3)：221-40。该质粒组成型表达解淀粉芽孢杆菌α-淀粉酶(AmyQ)。

pSJ6410：质粒pSJ2739(在美国专利6,100,063中描述)的衍生质粒，pSJ2739又是衍生自pE194，在复制上属于天然温度敏感型。PSJ6410由pE194复制子、以及衍生自质粒pUB110的片段、和地衣芽孢杆菌α-淀粉酶基因、以及在该基因前面的来自苏云金芽孢杆菌cryIIIA调控区的片段组成。这些额外的片段对于使用pSJ6410在本发明中作为载体是不相关的。

pAN28：通过将用限制酶XmaI和KpnI酶切的PCR产物yuszSOEpcr(SEQ ID NO：15)连接到pSJ6410质粒用XmaI-KpnI酶切后的大的片段上。上述质粒包含pE194的温度敏感复制起点，被用于通过双交换事件(doublecross-over event)将yusZ基因从枯草芽孢杆菌168的染色体中缺失。PCR产物yuszSOEpcr是利用重叠延伸的剪接(splicing by overlap extension)技术通过聚合酶链式反应产生的(SOE by PCR，Horton RM等，Biotechniques，1990-05；8(5)：528-35)。两个中间PCR产物，PCR1和PCR2，在末端都有一小段对方的序列，在第二阶段的PCR过程中将其混合在一起，从而产生最终的剪接产物，yuszSOEpcr。PCR1是通过使用引物yusZ1F和yusZ2R得到的，其包含yusZ上游序列(655bp)。PCR2是通过使用引物yusZ2F和yusZ3R得到的，其包含yusZ下游序列(690bp)。将枯草芽孢杆菌168的染色体DNA作为PCR的模板。在第二阶段的PCR过程中，以PCR1和PCR2作为模板，以yusZ1F和yusZ3R作为引物，从而得到所述剪接产物(1315bp)，其中的yusZ基因从编码280个氨基酸缩减到仅编码25个氨基酸。质粒pAN28的完整核苷酸序列显示在SEQ ID NO：16中。

pAN23：通过将用限制酶XmaI和KpnI酶切的PCR产物yusxSOEpcr(SEQID NO：17)连接到pSJ6410质粒用XmaI-KpnI酶切后的大的片段上。上述质粒包含pE194的温度敏感复制起点，被用于通过双交换事件将yusX基因从枯草芽孢杆菌168的染色体中缺失。PCR产物yusxSOEpcr是利用重叠延伸的剪接技术通过聚合酶链式反应产生的(SOE by PCR，Horton RM等，Biotechniques，1990-05；8(5)：528-35)。两个中间PCR产物，PCR1和PCR2，在末端都有一小段对方的序列，在第二阶段的PCR过程中将其混合在一起，从而产生最终的剪接产物，yusxSOEpcr。PCR1是通过使用引物yusX1F和yusX2R得到的，其包含yusX上游序列(560bp)。PCR2是通过使用引物yusX2F和yusX3R得到的，其包含yusX下游序列(560bp)。将枯草芽孢杆菌168的染色体DNA用作PCR的模板。在第二阶段的PCR过程中，以PCR1和PCR2作为模板，以yusX1F和yusX3R作为引物，从而得到所述剪接产物(1090bp)，其中的yusX基因从500个氨基酸缩减到27个氨基酸。质粒pAN23的完整序列显示在SEQ ID NO：18中。

pAN212b：质粒pSJ2739(在美国专利6,100,063中描述)的衍生质粒，pSJ2739又是pE194的衍生质粒，pE194在复制上属于天然温度敏感型。pAN212b由pE194复制子、以及衍生自质粒pUB110的片段组成。质粒pAN212b的完整序列显示在SEQ ID NO：23中。

常规分子生物学方法

除非另有所述，DNA操作和转化均使用标准分子生物学方法来进行(Sambrook等(1989)，Molecular cloning：A laboratory manual，Cold SpringHarbor lab，Cold Spring Harbor，NY；Ausubel，F.M.等(编著)，“Currentprotocols in Molecular Biology”，John Wiley和Sons，1995；Harwood，C.R.，和Cutting，S.M.(编著)，“Molecular Biological Methods for Bacillus”，JohnWiley and Sons，1990)。

DNA操作时酶的使用按照供应商的说明来进行(例如限制性核酸内切酶、连接酶等可获自New England Biolabs，Inc.)。

感受态细胞的制备和转化如下列文献中所述，Yasbin，R.E.，Wilson，G.A.和Young，F.E.(1975)，Transformation and transfection in lysogenic strains ofBacillus subtilis：evidence for selective induction of prophage in competentcells.J.Bacteriol，121：296-304。

培养基

LB琼脂：如Ausubel，F.M.等(编著)，“Current protocols in MolecularBiology”，John Wiley and Sons，(1995)中所述。

LBP：在LB琼脂中添加0.05M的磷酸钾，pH7.0。

LBPG：在LB琼脂中添加0.5％的葡萄糖(Glucose)和0.05M磷酸钾，pH7.0。

LBPSK：在LB琼脂中添加0.05M的磷酸钾，pH7.0和1％的脱脂乳。

BPX：如EP0506 780(WO91/09129)中所述。

发酵

在装有100ml BPX的摇瓶中进行发酵，来评估淀粉酶的产量，发酵条件是37℃，300rpm，发酵7天。收获10ml的培养物，10,000(10.000)g离心以去除细胞和碎片。澄清的上清液用于分析α-淀粉酶的活性。

α-淀粉酶活性分析

以4，6-亚乙基(G₇)-p-硝基苯基(G₁)-α，D-麦芽七糖苷(maltoheptaoside)(亚乙基-G₇PNP)作为底物，通过酶促比色试验法来检测α-淀粉酶的活性(Boehringer Mannheim，Germany art.1442309)。在特定的一系列条件下(温度、pH值、反应时间、缓冲液条件)，1mg的给定α-淀粉酶将水解一定量的底物，从而生成黄色。在405nm下测定颜色强度(colour intensity)。在给定的一系列条件下，测定得到的吸光度与所述α-淀粉酶的活性成正比。

蛋白酶分析

在微量滴定板中利用分光光度法测定蛋白酶活性。蛋白酶水解切割寡肽N-suc-ala-ala-pro-phe-pNA(L-1400，Bachem)生成黄色，可以在405nm下检测。

实施例1：枯草芽孢杆菌yusZ-缺失突变株的构建

通过PCR利用SOE产生1315bp的yuszSOEpcr DNA片段，其包含yusZ基因的同阅读框(in-frame)的255个氨基酸缺失，然后克隆到带有温度敏感复制起点的质粒(pSJ6410)，生成质粒pAN28。将pAN28通过转化导入到枯草芽孢杆菌168菌株，并在45℃下(非允许温度)，在添加了1微克/ml erm的LBPG培养基上铺板培养以筛选整合子(intergant)。将这些培养板上的转化子在yusZ-上游或yusZ-下游基因座处通过单(erm⁺)交换事件整合了上述质粒。质粒可以以两种方式之一被切除，其中之一产生野生型菌株，另外一种情况中产生yusZ基因被yuszSOEpcr(ΔyusZ)取代的菌株。

为了进行切除、筛选和鉴定缺失yusZ的菌株，将上述整合子接种到10ml的LB中，并在30℃生长过夜(允许温度)。将100微升长出的(outgrown)整合子培养物转移到10ml LB，并在30℃再次生长过夜。将细胞在LBPG上铺板，温度为30℃，然后通过影印平板法，将其中发生双交换(整合-切除)的菌株标记为erm^-。

采用yusZ1F和yusZ3R引物对菌株进行PCR分析，以检测发生了双交换事件的菌株中野生型(2155bp)或缺失型(1315bp)的yusZ基因的存在。分离yusZ-缺失的菌株，命名为AN133，并且通过对涵盖完整yuszSOEpcr区(引物yusZ1F和yusZ3R)的全面序列分析来验证上述缺失。

实施例2：枯草芽孢杆菌yusZ-缺失突变株的淀粉酶产量

用质粒pKTH10转化AN133，其组成型表达解淀粉芽孢杆菌的α-淀粉酶AmyQ。所得到的菌株命名为AN137。由两份独立的分离物一式三份地检测AN137的淀粉酶产量，并与对照菌株AN83的淀粉酶产量进行比较。AN137菌株(ΔyusZ)与对照菌株AN83相比提高了α-淀粉酶的产量，平均产量高于对照菌株AN83，达205％，其中对照菌株AN83携带的是野生型的yusZ基因。结果如表1所示。

表1：AN137菌株(ΔyusZ)以及对照菌株AN83的淀粉酶产量。

菌株	淀粉酶活性(相对)	平均产量	平均产量
菌株	淀粉酶活性(相对)	平均产量	平均产量	AN137-1.1	21.5	19.3	205％
AN137-1.2	20.3			AN137-1.1	21.5
AN137-1.2	20.3	AN137-1.3	18.1
AN137-2.1	17.4	AN137-1.3	18.1
AN137-2.1	17.4	AN137-2.2	20.6
AN137-2.3	17.8	AN137-2.2	20.6
AN137-2.3	17.8	AN83-1.1	9.11	9.4	100％
AN83-1.2	7.52	AN83-1.1	9.11
AN83-1.2	7.52	AN83-1.3	6.76
AN83-2.1	10.5	AN83-1.3	6.76
AN83-2.1	10.5	AN83-2.2	10.5
AN83-2.3	11.9	AN83-2.2	10.5

实施例3：枯草芽孢杆菌yusX-缺失突变株的构建

通过PCR利用SOE产生1090 bp的yusxSOEpcrDNA片段，其包含yusX基因的473个氨基酸的同阅读框缺失，并将其克隆到带有温度敏感复制起点的质粒(pSJ6410)，得到质粒pAN23，如上所述。将pAN23通过转化导入枯草芽孢杆菌168菌株，并在45℃下(非允许温度)，在添加了1微克/ml erm的LBPG培养基上铺板培养以筛选出整合子。这些培养板上的转化子在yusX-上游或yusX-下游基因座处通过单(erm⁺)交换事件整合了上述质粒。切除质粒可以有两种方式，其中之一将产生野生型菌株，在另外一种情况下将产生yusX基因被yusxSOEpcr(ΔyusX)取代的菌株。

为了进行切除、筛选和鉴定缺失yusX的菌株，将上述整合子接种到10ml的LB，并在30℃生长过夜(允许温度)。将100微升长出的整合子培养物转移到10ml LB，并再次在30℃生长过夜。将细胞在LBPG上在30℃铺板，然后通过影印平板法，将发生双交换(整合-切除)的菌株标记为erm-。用引物yusX1F和yusX3R对菌株上进行PCR，以检测发生了双交换的菌株中野生型(2539bp的PCR产物)或截短的(1090bp的PCR产物)yusX基因的存在。将yusX-缺失的菌株命名为AN151，并且通过涵盖完整yusxSOEpcr区(引物yusX1F和yusX3R)的全面序列分析来验证。

实施例4：枯草芽孢杆菌yusX-缺失突变株的淀粉酶产量

用质粒pKTH10转化yusX-缺失突变株AN151，其中上述质粒组成型表达解淀粉芽孢杆菌的α-淀粉酶AmyQ。所得到的菌株命名为AN155。由两份独立的分离物一式二份地检测AN155的淀粉酶产量，并与对照菌株AN83的淀粉酶产量进行比较。结果如表2所示，yusX缺失的AN155菌株与对照菌株AN83相比，提高了α-淀粉酶的产量，平均产量高于对照菌株AN83，达239％，其中对照菌株AN83携带的是野生型yusX基因的拷贝。

表2：AN137菌株(yusX-缺失突变株)和对照菌株AN83的淀粉酶产量。

菌株	淀粉酶活性(相对)	平均产量	平均产量
菌株	淀粉酶活性(相对)	平均产量	平均产量	AN155-1.1	29.9	29.8	238％
AN155-1.2	32.2			AN155-1.1	29.9
AN155-1.2	32.2	AN155-1.3	30.2
AN155-2.1	28.1	AN155-1.3	30.2
AN155-2.1	28.1	AN155-2.2	28.9
AN155-2.3	29.5	AN155-2.2	28.9
AN155-2.3	29.5	AN83-1.1	12.4	12.5	100％
AN83-1.2	12.9	AN83-1.1	12.4
AN83-1.2	12.9	AN83-1.3	11.5

AN83-2.1	12.3
AN83-2.1	12.3	AN83-2.2	11.9
AN83-2.3	13.8	AN83-2.2	11.9

实施例5：地衣芽孢杆菌yusZ缺失突变株的构建

可以通过任意可用的标准方法来缺失地衣形芽孢杆菌的yusZ基因。地衣芽孢杆菌的基因组序列是可公开得到的；地衣芽孢杆菌yusZ基因的序列如SEQ ID NO：24所示，其所编码的多肽如SEQ ID NO：25所示。例如，可以使用如上所述的(在“质粒”部分，pAN28)通过重叠延伸拼接(SOE-PCR)的技术产生PCR产物。PCR1可包含yusZ上游序列，其可以使用yusZlich1F和yusZlich2R作为引物，使用SJ1707染色体DNA作为模板在PCR反应中生成。PCR2可包含yusZ下游序列，其可以使用yusZlich3F和yusZlich4R作为引物，以SJ1707的染色体DNA作为模板在另外的PCR反应中生成。在第二阶段的PCR过程中，使用PCR1和PCR2作为模板，以yusZlich1F和yusZlich4R作为引物，产生剪接产物(991bp，称作yuzZlichSOE)，其中yusZ基因由编码280个氨基酸减至仅编码25个氨基酸。可通过将yusZlichSOE克隆到温度敏感型质粒pAN212b的BsaHI-SacII位点来构建称为“缺失质粒(deletion plasmid)”的质粒-得到质粒pAN212b-yusZ(＝缺失质粒)。质粒pAN212b-yusZ的完整序列如SEQ ID NO：26所示。

可将上述缺失质粒转化到枯草芽孢杆菌接合供体菌株PP289-5(其包含染色体dal-缺失，和质粒pBC16和pLS20)的感受态细胞，并通过使用标准方法(如WO02/00907所述)接合到地衣芽孢杆菌AN10R和ANaprH菌株。然后可将yusZ缺失从缺失质粒通过(由整合和切除温度敏感的质粒介导的)PCR1和PCR2的双同源重组转移到目标地衣芽孢杆菌菌株的染色体(如实施例2所述)。可以使用引物yusZlich1F和yusZlich4R通过PCR来鉴定yusZ-缺失的菌株，并通过标准序列分析进行验证。

实施例6：地衣芽孢杆菌yusZ-缺失突变株的10R蛋白酶产量

将地衣芽孢杆菌菌株SJ1707进行改造以非常高水平地表达Nocardiopsisprasina NRLL18262(AN10R)的蛋白酶10R。由AN10R缺失yusZ基因得到AN10R-b。由四份独立的分离物一式二份地检测AN10R-b的蛋白酶产量，并与对照菌株AN10R的蛋白酶产量进行比较。AN10R-b菌株(yusZ-缺失突变株)与对照菌株AN10R相比，提高了蛋白酶的产量，比AN10R平均高出72％。结果如表3所示。

表3：AN10R-b菌株(yusZ-缺失突变株)和对照菌株An10R的蛋白酶10R的产量。

菌株	蛋白酶活性(相对)	平均产量	平均产量
菌株	蛋白酶活性(相对)	平均产量	平均产量	AN10R-B-1.1	72.4	57	172％
AN10R-B-1.2	24.4			AN10R-B-1.1	72.4
AN10R-B-1.2	24.4	AN10R-B-2.1	48.0
AN10R-B-2.2	43.5	AN10R-B-2.1	48.0
AN10R-B-2.2	43.5	AN10R-B-3.1	63.6
AN10R-B-3.2	51.7	AN10R-B-3.1	63.6
AN10R-B-3.2	51.7	AN10R-B-4.1	87.3
AN10R-B-4.2	65.0	AN10R-B-4.1	87.3
AN10R-B-4.2	65.0	AN10R-1.1	53.6	33	100％
AN10R-1.2	16.1	AN10R-1.1	53.6
AN10R-1.2	16.1	AN10R-2.1	12.4
AN10R-2.2	28.5	AN10R-2.1	12.4
AN10R-2.2	28.5	AN10R-3.1	57.9
AN10R-3.2	49.1	AN10R-3.1	57.9
AN10R-3.2	49.1	AN10R-4.1	23.4
AN10R-4.2	26.8	AN10R-4.1	23.4

实施例7：地衣芽孢杆菌yusZ-缺失突变株的AprH蛋白酶产量

将地衣芽孢杆菌菌株SJ1707改造以高水平表达Bacillus clausii(ANaprH)的aprH蛋白酶基因。ANaprH缺失yusZ基因得到ANaprH-b菌株。由四份独立的分离物测定ANaprH-b的蛋白酶产量(图1，1-4号)并与来自对照菌株ANaprH的四份独立的分离物的蛋白酶产量，通过聚丙烯酰胺凝胶电泳(PAGE)进行比较，其中凝胶被标记以使蛋白酶可见。

如图1所示，丙烯酰胺凝胶上标记的蛋白酶条带的浓度差别清楚地显示yusZ-缺失菌株(ANaprH-b)比对应的参考菌株(ANaprH)产生更多的aprH编码的蛋白酶。

实施例8：枯草芽孢杆菌yusZ-缺失突变株的Apr蛋白酶产量

将枯草芽孢杆菌菌株168进行改造以高水平表达解淀粉酶芽孢杆菌(AN220)的apr蛋白酶基因。AN220缺失yusZ基因得到AN225。由四份独立的分离物一式二份地检测AN225的蛋白酶产量，并与对照菌株AN220的蛋白酶产量相比较。AN225菌株(yusZ-缺失突变株)提高了蛋白酶的产量，平均比对照菌株AN220高出了14％。结果如表4所示。

表4：AN10R-b(ΔyusZ)和对照菌株An10R的蛋白酶10R的产量。

株系	蛋白酶活性(相对)	平均产量	平均产量
株系	蛋白酶活性(相对)	平均产量	平均产量	AN225-B-1.1	42.8	44.5	114％
AN225-B-1.2	42.8			AN225-B-1.1	42.8
AN225-B-1.2	42.8	AN225-B-2.1	53.2
AN225-B-2.2	47.5	AN225-B-2.1	53.2
AN225-B-2.2	47.5	AN225-B-3.1	30.9
AN225-B-3.2	51.8	AN225-B-3.1	30.9
AN225-B-3.2	51.8	AN225-B-4.1	49.4
AN225-B-4.2	37.3	AN225-B-4.1	49.4
AN225-B-4.2	37.3	AN220-1.1	59	38.9	100％
AN220-1.2	51.8	AN220-1.1	59
AN220-1.2	51.8	AN220-2.1	49
AN220-2.2	33.6	AN220-2.1	49
AN220-2.2	33.6	AN220-3.1	32.6
AN220-3.2	23.7	AN220-3.1	32.6
AN220-3.2	23.7	AN220-4.1	27.1
AN220-4.2	34.6	AN220-4.1	27.1

序列表

<110>诺维信公司(Novozymes A/S)

<120>具有高分泌水平的突变的原核细胞

<130>10576.204

<160>26

<170>PatentIn version3.3

<210>1

<211>843

<212>DNA

<213>枯草芽孢杆菌(bacillus subtilis)168

<400>1

atgaataaaa aaatagccat cgtgacagga gcgtccagcg gcttcggtct gctggcagct 60

gtaaagcttg cccgatcatt tttcgtgata gccacatcaa gacagcctga aaaagcggaa 120

cagcttcgag aattggctgc agcacacaat gtgtctgatt ctattcacat tacagctctc 180

gatgtcaccg atgaacaatc tatagtctca ttcggaaaag ctgttagtgc ttacgccccg 240

atcgatttac tcgttaacaa cgccggaacg gcttatggag gatttatcga ggatgtgccg 300

atggaacatt tcagacaaca atttgaaacg aatgtcttcg gtgtgatcca tgtgacaaaa 360

accgtgctgc cttacataag aaagcatggc ggcgcaaaga ttataaacgt gagcagcatc 420

agcggactga caggattccc agcgctgtcg ccatatgttt cttccaagca tgcattggaa 480

ggtttttctg aaagcctgcg tatcgagctg cttccgttcg gtatcgaaac cgctttgatc 540

gagccgggct catacaagac atcgatctgg tcaacgtcat tatcaaattt tatgtcggtg 600

cctgctgacg attcagccta tcatcaatac tataaaaaga tcctttccta tgttcaaaaa 660

aacggagaag aaagcggaga tccccaagag gttgccgacc tcatttatca attggcaaca 720

aaacagcaca taaagaattt gcgatacccg atcggaaagg gcatcaagct caccctgctg 780

ttccgatcgc tttttccttg gtctgcgtgg gagtctatcc tgaagaaaaa gctattcagc 840

tga 843

<210>2

<211>280

<212>PRT

<213>枯草芽孢杆菌168

<400>2

Met Asn Lys Lys Ile Ala Ile Val Thr Gly Ala Ser Ser Gly Phe Gly

1 5 10 15

Leu Leu Ala Ala Val Lys Leu Ala Arg Ser Phe Phe Val Ile Ala Thr

20 25 30

Ser Arg Gln Pro Glu Lys Ala Glu Gln Leu Arg Glu Leu Ala Ala Ala

35 40 45

His Asn Val Ser Asp Ser Ile His Ile Thr Ala Leu Asp Val Thr Asp

50 55 60

Glu Gln Ser Ile Val Ser Phe Gly Lys Ala Val Ser Ala Tyr Ala Pro

65 70 75 80

Ile Asp Leu Leu Val Asn Asn Ala Gly Thr Ala Tyr Gly Gly Phe Ile

85 90 95

Glu Asp Val Pro Met Glu His Phe Arg Gln Gln Phe Glu Thr Asn Val

100 105 110

Phe Gly Val Ile His Val Thr Lys Thr Val Leu Pro Tyr Ile Arg Lys

115 120 125

His Gly Gly Ala Lys Ile Ile Ash Val Ser Ser Ile Ser Gly Leu Thr

130 135 140

Gly Phe Pro Ala Leu Ser Pro Tyr ValSer Ser Lys His Ala Leu Glu

145 150 155 160

Gly Phe Ser Glu Ser Leu Arg Ile Glu Leu Leu Pro Phe Gly Ile Glu

165 170 175

Thr Ala Leu Ile Glu Pro Gly Ser Tyr Lys Thr Ser Ile Trp Ser Thr

180 185 190

Ser Leu Ser Asn Phe Met Ser Val Pro Ala Asp Asp Ser Ala Tyr His

195 200 205

Gln Tyr Tyr Lys Lys Ile Leu Ser Tyr Val Gln Lys Asn Gly Glu Glu

210 215 220

Ser Gly Asp Pro Gln Glu Val Ala Asp Leu Ile Tyr Gln Leu Ala Thr

225 230 235 240

Lys Gln His Ile Lys Asn Leu Arg Tyr Pro Ile Gly Lys Gly Ile Lys

245 250 255

Leu Thr Leu Leu Phe Arg Ser Leu Phe Pro Trp Ser Ala Trp Glu Ser

260 265 270

Ile Leu Lys Lys Lys Leu Phe Ser

275 280

<210>3

<211>1503

<212>DNA

<213>枯草芽孢杆菌168

<400>3

atgaatcggc tttccgcaga ttttcaatcg tcgctcgtta cattagatca taaacttgtg 60

gacattaatc aagacgtgtg gaatgaattg ttaacaaaac cgggattgcg cgatgtttct 120

tacatattaa atgaaagaag acagagggtt gccgaaaagc ttagccccgg taaggaaaaa 180

ctgatcggaa accttgcggt ggacggatat cacgcttgga gtgacttata caatatggtt 240

gtcgggaaaa tgacgatccc gtatgaggaa aacggtgaaa acaagcaatt gtctgtcggt 300

caggcggaga atatgatgga tcatcaagac cgtactgtca gaaaaacagt atatgaacgt 360

ttccgccaag cttgggagag caagcaagat attttcagca gcacgctgaa tcatttggcg 420

ggattccggc ttgaaaccta taaagcgcgc ggctgggaga atgtcctgaa ggaaccgctg 480

caaattaaca ggatgaaaaa agaaacactt gatacgatgt ggcaggtcat cactgaaaac 540

aagaagccgt tcgttcagtt tttgaaccgg aaagcatcca tgctcggcct tgaaaaactc 600

agctggtacg atgtcgaggc accgatcggt tctgacggaa aggtctattc gtatgatgaa 660

gccgcaaata tcattaccag ccagttttca acgtttggca aaaagctgtc ctcattcact 720

gaaaaagcgt ttcgggacgg ctggattgag gcggaagaca ggagcggaaa aagagtcggc 780

ggcttttgca ccagttttcc ggacagcggg gaatcccgga ttttcatgac attttcggga 840

agcgcctcaa atgtctctac ccttgcgcat gaactcgggc acgcgttcca tcaggaagca 900

atgctcaacg tcaggccgtt aaaccgttcc tacgccatga acgttgcaga aacagcttca 960

acgtttgcag agatgatagt ggcggacgcg actgtccagc aggccgagac gagggaagaa 1020

aagcttgttc ttctggagga taaagtgcaa agaagcgttg cgttcttcat gaacattcac 1080

gcaagatttc tatttgaaac gagattctac gaggaacgaa agcggggagt ggtaccggcc 1140

agccgcttga atgagctgat ggaagaggcg caaagagagg catactgcaa tgcgttagaa 1200

gaatatcatc cgcttttttg ggcatcaaag cttcattttc acatcacgag ggtgccgttt 1260

tacaatttcc cttatacatt cggctacctg ttttctcttg gtatttacgc gttggcgctt 1320

gaagaaaaag acacattcga agagaagtat atggcgctat tgcgcgatac ggcttctatg 1380

acagtggagg atttggcgat gaagcatttg ggcgctgaca tcacaaagcg cgatttctgg 1440

gagaatgcca tcaagctggc tgtgcgtgac gccgaaacct ttttacaaat gaccgaatct 1500

taa 1503

<210>4

<211>500

<212>PRT

<213>枯草芽孢杆菌168

<400>4

Met Asn Arg Leu Ser Ala Asp Phe Gln Ser Ser Leu Val Thr Leu Asp

1 5 10 15

His Lys Leu Val Asp Ile Asn Gln Asp Val Trp Asn Glu Leu Leu Thr

20 25 30

Lys Pro Gly Leu Arg Asp Val Ser Tyr Ile Leu Asn Glu Arg Arg Gln

35 40 45

Arg Val Ala Glu Lys Leu Ser Pro Gly Lys Glu Lys Leu Ile Gly Asn

50 55 60

Leu Ala Val Asp Gly Tyr His Ala Trp Ser Asp Leu Tyr Asn Met Val

65 70 75 80

Val Gly Lys Met Thr Ile Pro Tyr Glu Glu Asn Gly Glu Asn Lys Gln

85 90 95

Leu Ser Val Gly Gln Ala Glu Asn Met Met Asp His Gln Asp Arg Thr

100 105 110

Val Arg Lys Thr Val Tyr Glu Arg Phe Arg Gln Ala Trp Glu Ser Lys

115 120 125

Gln Asp Ile Phe Ser Ser Thr Leu Ash His Leu Ala Gly Phe Arg Leu

130 135 140

Glu Thr Tyr Lys Ala Arg Gly Trp Glu Asn Val Leu Lys Glu Pro Leu

145 150 155 160

Gln Ile Asn Arg Met Lys Lys Glu Thr Leu Asp Thr Met Trp Gln Val

165 170 175

Ile Thr Glu Asn Lys Lys Pro Phe Val Gln Phe Leu Asn Arg Lys Ala

180 185 190

Ser Met Leu Gly Leu Glu Lys Leu Ser Trp Tyr Asp Val Glu Ala Pro

195 200 205

Ile Gly Ser Asp Gly Lys Val Tyr Ser Tyr Asp Glu Ala Ala Asn Ile

210 215 220

Ile Thr Ser Gln Phe Ser Thr Phe Gly Lys Lys Leu Ser Ser Phe Thr

225 230 235 240

Glu Lys Ala Phe Arg Asp Gly Trp Ile Glu Ala Glu Asp Arg Ser Gly

245 250 255

Lys Arg Val Gly Gly Phe Cys Thr Ser Phe Pro Asp Ser Gly Glu Ser

260 265 270

Arg Ile Phe Met Thr Phe Ser Gly Ser Ala Ser Asn Val Ser Thr Leu

275 280 285

Ala His Glu Leu Gly His Ala Phe His Gln Glu Ala Met Leu Asn Val

290 295 300

Arg Pro Leu Asn Arg Ser Tyr Ala Met Asn Val Ala Glu Thr Ala Ser

305 310 315 320

Thr Phe Ala Glu Met Ile Val Ala Asp Ala Thr Val Gln Gln Ala Glu

325 330 335

Thr Arg Glu Glu Lys Leu Val Leu Leu Glu Asp Lys Val Gln Arg Ser

340 345 350

Val Ala Phe Phe Met Asn Ile His Ala Arg Phe Leu Phe alu Thr Arg

355 360 365

Phe Tyr Glu Glu Arg Lys Arg Gly Val Val Pro Ala Ser Arg Leu Asn

370 375 380

Glu Leu Met Glu Glu Ala Gln Arg Glu Ala Tyr Cys Asn Ala Leu Glu

385 390 395 400

Glu Tyr His Pro Leu Phe Trp Ala Ser Lys Leu His Phe His Ile Thr

405 410 415

Arg Val Pro Phe Tyr Asn Phe Pro Tyr Thr Phe Gly Tyr Leu Phe Ser

420 425 430

Leu Gly Ile Tyr Ala Leu Ala Leu Glu Glu Lys Asp Thr Phe Glu Glu

435 440 445

Lys Tyr Met Ala Leu Leu Arg Asp Thr Ala Ser Met Thr Val Glu Asp

450 455 460

Leu Ala Met Lys His Leu Gly Ala Asp Ile Thr Lys Arg Asp Phe Trp

465 470 475 480

Glu Asn Ala Ile Lys Leu Ala Val Arg Asp Ala Glu Thr Phe Leu Gln

485 490 495

Met Thr Glu Ser

500

<210>5

<211>297

<212>DNA

<213>枯草芽孢杆菌168

<400>5

atggcgctgc aaggggtagg ccaaagatgg gatcttgatt cattttttaa gggcgggagc 60

caatcggaag aattcaaagg ttatattgag aagctgtcac aaagtctgcg tgcatttcaa 120

gacaggactg atgcgtttca ggtgcctgaa tcgcctgaag aggctgaagg gctgaccgcg 180

ttgcttgatt taatcgaaca gacatccgtc aagcttcagc aggccggcgc ttttgttgct 240

tgcctccagg cccagaatat caatgatcaa aaggctatag agcatcaggc ctcatga 297

<210>6

<211>98

<212>PRT

<213>枯草芽孢杆菌168

<400>6

Met Ala Leu Gln Gly Val Gly Gln Arg Trp Asp Leu Asp Ser Phe Phe

1 5 10 15

Lys Gly Gly Ser Gln Ser Glu Glu Phe Lys Gly Tyr Ile Glu Lys Leu

20 25 30

Ser Gln Ser Leu Arg Ala Phe Gln Asp Arg Thr Asp Ala Phe Gln Val

35 40 45

Pro Glu Ser Pro Glu Glu Ala Glu Gly Leu Thr Ala Leu Leu Asp Leu

50 55 60

Ile Glu Gln Thr Ser Val Lys Leu Gln Gln Ala Gly Ala Phe Val Ala

65 70 75 80

Cys Leu Gln Ala Gln Asn Ile Asn Asp Gln Lys Ala Ile Glu His Gln

85 90 95

Ala Ser

<210>7

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物yusZ1F

<400>7

ccttcccggg gctaagcttt tcggc 25

<210>8

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物yusZ2R

<400>8

gatagactcc cacgcgctgg acgctcctgt 30

<210>9

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物yusZ2F

<400>9

acaggagcgt ccagcgcgtg ggagtctatc 30

<210>10

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物yusZ3R

<400>10

aacggtaccc tgaccaagca gacag 25

<210>11

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物yusX1F

<400>11

aatgcccggg caagctttac agctg 25

<210>12

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物yusX2R

<400>12

ggcgtcacgc acagcaacga gcgacgattg 30

<210>13

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物yusX2F

<400>13

caatcgtcgc tcgttgctgt gcgtgacgcc 30

<210>14

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物yusX3R

<400>14

aatcggtacc atcataatga ctgtc 25

<210>15

<211>1315

<212>DNA

<213>人工序列

<220>

<223>PCR产物yuszSOEpcr

<400>15

ccttcccggg gctaagcttt tcggcaaccc tctgtcttct ttcatttaat atgtaagaaa 60

catcgcgcaa tcccggtttt gttaacaatt cattccacac gtcttgatta atgtccacaa 120

gtttatgatc taatgtaacg agcgacgatt gaaaatctgc ggaaagccga ttcatgaggc 180

ctgatgctct atagcctttt gatcattgat attctgggcc tggaggcaag caacaaaagc 240

gccggcctgc tgaagcttga cggatgtctg ttcgattaaa tcaagcaacg cggtcagccc 300

ttcagcctct tcaggcgatt caggcacctg aaacgcatca gtcctgtctt gaaatgcacg 360

cagactttgt gacagcttct caatataacc tttgaattct tccgattggc tcccgccctt 420

aaaaaatgaa tcaagatccc atctttggcc taccccttgc agcgccatat cacaaaaccc 480

ctttccttct ttcgttctat tatagaacaa ttctgaatta ttgtataaaa atttctatta 540

caggcgtcat ttcgtgttca ggatagtaca atagctgtag cagtttaata ggagggttag 600

gatgaataaa aaaatagcca tcgtgacagg agcgtccagc gcgtgggagt ctatcctgaa 660

gaaaaagcta ttcagctgat ctaaattata attattataa tttagtattg atttttattt 720

agtatatgat ataattaagt caacagatca caaggaggac gttatcttat gaaaactgaa 780

aacgcaaaaa caaatcaaac attagttgag aattcactga acacacaatt atcaaactgg 840

tttcttttat actctaagct ccaccgtttc cattggtatg tgaaagggcc tcatttcttt 900

acattgcacg agaaatttga agaactttat gaccatgcgg ctgaaacagt ggataccatc 960

gctgagcgcc tgctggcgat tggcggacag cctgttgcca cagtgaaaga atacactgag 1020

catgcatcta tcacagacgg cggaaacgaa acatcagcat cagaaatggt acaagcattg 1080

gtaaacgact acaaacaaat cagcagcgaa tctaaattcg tgatcggcct ggctgaagaa 1140

aatcaagaca atgcgacagc ggacttgttt gtcggattaa ttgaagaagt tgaaaaacaa 1200

gtgtggatgc tttcctctta tttagggtaa caaaaaagct gaaccttaat cgggttcagc 1260

tttttgtttt ttcttagctt gaactgcttt ctgtctgctt ggtcagggta ccgtt 1315

<210>16

<211>6305

<212>DNA

<213>人工序列

<220>

<223>质粒pAN28

<400>16

gctaagcttt tcggcaaccc tctgtcttct ttcatttaat atgtaagaaa catcgcgcaa 60

tcccggtttt gttaacaatt cattccacac gtcttgatta atgtccacaa gtttatgatc 120

taatgtaacg agcgacgatt gaaaatctgc ggaaagccga ttcatgaggc ctgatgctct 180

atagcctttt gatcattgat attctgggcc tggaggcaag caacaaaagc gccggcctgc 240

tgaagcttga cggatgtctg ttcgattaaa tcaagcaacg cggtcagccc ttcagcctct 300

tcaggcgatt caggcacctg aaacgcatca gtcctgtctt gaaatgcacg cagactttgt 360

gacagcttct caatataacc tttgaattct tccgattggc tcccgccctt aaaaaatgaa 420

tcaagatccc atctttggcc taccccttgc agcgccatat cacaaaaccc ctttccttct 480

ttcgttctat tatagaacaa ttctgaatta ttgtataaaa atttctatta caggcgtcat 540

ttcgtgttca ggatagtaca atagctgtag cagtttaata ggagggttag gatgaataaa 600

aaaatagcca tcgtgacagg agcgtccagc gcgtgggagt ctatcctgaa gaaaaagcta 660

ttcagctgat ctaaattata attattataa tttagtattg atttttattt agtatatgat 720

ataattaagt caacagatca caaggaggac gttatcttat gaaaactgaa aacgcaaaaa 780

caaatcaaac attagttgag aattcactga acacacaatt atcaaactgg tttcttttat 840

actctaagct ccaccgtttc cattggtatg tgaaagggcc tcatttcttt acattgcacg 900

agaaatttga agaactttat gaccatgcgg ctgaaacagt ggataccatc gctgagcgcc 960

tgctggcgat tggcggacag cctgttgcca cagtgaaaga atacactgag catgcatcta 1020

tcacagacgg cggaaacgaa acatcagcat cagaaatggt acaagcattg gtaaacgact 1080

acaaacaaat cagcagcgaa tctaaattcg tgatcggcct ggctgaagaa aatcaagaca 1140

atgcgacagc ggacttgttt gtcggattaa ttgaagaagt tgaaaaacaa gtgtggatgc 1200

tttcctctta tttagggtaa caaaaaagct gaaccttaat cgggttcagc tttttgtttt 1260

ttcttagctt gaactgcttt ctgtctgctt ggtcagggta ccattttgac ggaaccgatt 1320

gggacgagtc ccgaaagctg aaccgcatct ataagtttca aggaaaggct tgggattggg 1380

aagtttccaa tgaaaacggc aactatgatt atttgatgta tgccgacatc gattatgacc 1440

atcctgatgt cgcagcagaa attaagagat ggggcacttg gtatgccaat gaactgcaat 1500

tggacggaaa ccgtcttgat gctgtcaaac acattaaatt ttcttttttg cgggattggg 1560

ttaatcatgt cagggaaaaa acggggaagg aaatgtttac ggtagctgaa tattggcaga 1620

atgacttggg cgcgctggaa aactatttga acaaaacaaa ttttaatcat tcagtgtttg 1680

acgtgccgct tcattatcag ttccatgctg catcgacaca gggaggcggc tatgatatga 1740

ggaaattgct gaagggtacg gtcgtttcca agcatccgtt gaaatcggtt acatttgtcg 1800

ataaccatga tacacagccg gggcaatcgc ttgagtcgac tgtccaaaca tggtttaagc 1860

cgcttgctta cgcttttatt ctcacaaggg aatctggata ccctcaggtt ttctacgggg 1920

atatgtacgg gacgaaagga gactcccagc gcgaaattcc tgccttgaaa cacaaaattg 1980

aaccgatctt aaaagcgaga aaacagtatg cgtacggagc acagcatgat tatttcgacc 2040

accatgacat tgtcggctgg acaagggaag gcgacagctc ggttgcaaat tcaggtttgg 2100

cggcattaat aacagacgga cccggtgggg caaagcgaat gtatgtcggc cggcaaaacg 2160

ccggtgagac atggcatgac attaccggaa accgttcgga gccggttgtc atcaattcgg 2220

aaggctgggg agagtttcac gtaaacggcg ggtcggtttc aatttatgtt caaagataga 2280

agagcagaga ggacggattt cctgaaggaa atccgttttt ttattttgcc cgtcttataa 2340

atttcgttga ttacatttta taattaattt taacaaagtg tcataagccc tcaggaatat 2400

tgctgacagt ttagaatccc taggtaaggc ggggatgaaa tggcaacgtt atctgatgta 2460

gcaaagaaag aaatgtgtcg aaaatgacgg tatcgcgggt gatcaatcat cctgagactg 2520

tgacggatga attgaaaaag cttgcatgcc tgcaggtcga ttcacaaaaa ataggcacac 2580

gaaaaacaag ttaagggatg cagtttatgc atcccttaac ttacttatta aataatttat 2640

agctattgaa aagagataag aattgttcaa agctaatatt gtttaaatcg tcaattcctg 2700

catgttttaa ggaattgtta aattgatttt ttgtaaatat tttcttgtat tctttgttaa 2760

cccatttcat aacgaaataa ttatactttt gtttatcttt gtgtgatatt cttgattttt 2820

ttctacttaa tctgataagt gagctattca ctttaggttt aggatgaaaa tattctcttg 2880

gaaccatact taatatagaa atatcaactt ctgccattaa aagtaatgcc aatgagcgtt 2940

ttgtatttaa taatctttta gcaaacccgt attccacgat taaataaatc tcattagcta 3000

tactatcaaa aacaattttg cgtattatat ccgtacttat gttataaggt atattaccat 3060

atattttata ggattggttt ttaggaaatt taaactgcaa tatatccttg tttaaaactt 3120

ggaaattatc gtgatcaaca agtttatttt ctgtagtttt gcataattta tggtctattt 3180

caatggcagt tacgaaatta cacctcttta ctaattcaag ggtaaaatgg ccttttcctg 3240

agccgatttc aaagatatta tcatgttcat ttaatcttat atttgtcatt attttatcta 3300

tattatgttt tgaagtaata aagttttgac tgtgttttat atttttctcg ttcattataa 3360

ccctctttaa tttggttata tgaattttgc ttattaacga ttcattataa ccacttattt 3420

tttgtttggt tgataatgaa ctgtgctgat tacaaaaata ctaaaaatgc ccatattttt 3480

tcctccttat aaaattagta taattatagc acgagctctg ataaatatga acatgatgag 3540

tgatcgttaa atttatactg caatcggatg cgattattga ataaaagata tgagagattt 3600

atctaatttc ttttttcttg taaaaaaaga aagttcttaa aggttttata gttttggtcg 3660

tagagcacac ggtttaacga cttaattacg aagtaaataa gtctagtgtg ttagacttta 3720

tgaaatctat atacgtttat atatatttat tatccggagg tgtagcatgt ctcattcaat 3780

tttgagggtt gccagagtta aaggatcaag taatacaaac gggatacaaa gacataatca 3840

aagagagaat aaaaactata ataataaaga cataaatcat gaggaaacat ataaaaatta 3900

tgatttgatt aacgcacaaa atataaagta taaagataaa attgatgaaa cgattgatga 3960

gaattattca gggaaacgta aaattcggtc agatgcaatt cgacatgtgg acggactggt 4020

tacaagtgat aaagatttct ttgatgattt aagcggagaa gaaatagaac gattttttaa 4080

agatagcttg gagtttctag aaaatgaata cggtaaggaa aatatgctgt atgcgactgt 4140

ccatctggat gaaagagtcc cacatatgca ctttggtttt gtccctttaa cagaggacgg 4200

gagattgtct gcaaaagaac agttaggcaa caagaaagac tttactcaat tacaagatag 4260

atttaatgag tatgtgaatg agaaaggtta tgaacttgaa agaggcacgt ccaaagaggt 4320

tacagaacga gaacataaag cgatggatca gtacaagaaa gatactgtat ttcataaaca 4380

ggaactgcaa gaagttaagg atgagttaca gaaggcaaat aagcagttac agagtggaat 4440

agagcatatg aggtctacga aaccctttga ttatgaaaat gagcgtacag gtttgttctc 4500

tggacgtgaa gagactggta gaaagatatt aactgctgat gaatttgaac gcctgcaaga 4560

aacaatctct tctgcagaac ggattgttga tgattacgaa aatattaaga gcacagacta 4620

ttacacagaa aatcaagaat taaaaaaacg tagagagagt ttgaaagaag tagtgaatac 4680

atggaaagag gggtatcacg aaaaaagtaa agaggttaat aaattaaagc gagagaatga 4740

tagtttgaat gagcagttga atgtatcaga gaaatttcaa gctagtacag tgactttata 4800

tcgtgctgcg agggcgaatt tccctgggtt tgagaaaggg tttaataggc ttaaagagaa 4860

attctttaat gattccaaat ttgagcgtgt gggacagttt atggatgttg tacaggataa 4920

tgtccagaag gtcgatagaa agcgtgagaa acagcgtaca gacgatttag agatgtagag 4980

gtacttttat gccgagaaaa ctttttgcgt gtgacagtcc ttaaaatata cttagagcgt 5040

aagcgaaagt agtagcgaca gctattaact ttcggtttca aagctctagg atttttaatg 5100

gacgcagcgc atcacacgca aaaaggaaat tggaataaat gcgaaatttg agatgttaat 5160

taaagacctt tttgaggtct ttttttctta gatttttggg gttatttagg ggagaaaaca 5220

taggggggta ctacgacctc ccccctaggt gtccattgtc cattgtccaa acaaataaat 5280

aaatattggg tttttaatgt taaaaggttg ttttttatgt taaagtgaaa aaaacagatg 5340

ttgggaggta cagtgatggt tgtagataga aaagaagaga aaaaagttgc tgttacttta 5400

agacttacaa cagaagaaaa tgagatatta aatagaatca aagaaaaata taatattagc 5460

aaatcagatg caaccggtat tctaataaaa aaatatgcaa aggaggaata cggtgcattt 5520

taaacaaaaa aagatagaca gcactggcat gctgcctatc tatgactaaa ttttgttaag 5580

tgtattagca ccgttattat atcatgagcg aaaatgtaat aaaagaaact gaaaacaaga 5640

aaaattcaag aggacgtaat tggacatttg ttttatatcc agaatcagca aaagccgagt 5700

ggttagagta tttaaaagag ttacacattc aatttgtagt gtctccatta catgataggg 5760

atactgatac agaaggtagg atgaaaaaag agcattatca tattctagtg atgtatgagg 5820

gtaataaatc ttatgaacag ataaaaataa ttacagaaga attgaatgcg actattccgc 5880

agattgcagg aagtgtgaaa ggtcttgtga gatatatgct tcacatggac gatcctaata 5940

aatttaaata tcaaaaagaa gatatgatag tttatggcgg tgtagatgtt gatgaattat 6000

taaagaaaac aacaacagat agatataaat taattaaaga aatgattgag tttattgatg 6060

aacaaggaat cgtagaattt aagagtttaa tggattatgc aatgaagttt aaatttgatg 6120

attggttccc gcttttatgt gataactcgg cgtatgttat tcaagaatat ataaaatcaa 6180

atcggtataa atctgaccga tagattttga atttaggtgt cacaagacac tcttttttcg 6240

caccagcgaa aactggttta agccgactgc gcaaaagaca taatcgactc tagaggatcc 6300

ccggg 6305

<210>17

<211>1090

<212>DNA

<213>人工序列

<220>

<223>PCR产物yusxSOEpcr

<400>17

aatgcccggg caagctttac agctgccagc agaccgaagc cgctggacgc tcctgtcacg 60

atggctattt ttttattcat cctaaccctc ctattaaact gctacagcta ttgtactatc 120

ctgaacacga aatgacgcct gtaatagaaa tttttataca ataattcaga attgttctat 180

aatagaacga aagaaggaaa ggggttttgt gatatggcgc tgcaaggggt aggccaaaga 240

tgggatcttg attcattttt taagggcggg agccaatcgg aagaattcaa aggttatatt 300

gagaagctgt cacaaagtct gcgtgcattt caagacagga ctgatgcgtt tcaggtgcct 360

gaatcgcctg aagaggctga agggctgacc gcgttgcttg atttaatcga acagacatcc 420

gtcaagcttc agcaggccgg cgcttttgtt gcttgcctcc aggcccagaa tatcaatgat 480

caaaaggcta tagagcatca ggcctcatga atcggctttc cgcagatttt caatcgtcgc 540

tcgttgctgt gcgtgacgcc gaaacctttt tacaaatgac cgaatcttaa agaaaaagcc 600

gtggcgttaa atgccccggc tttttcaatt cttctctgaa tgaggatttc attctctgga 660

tatacctaaa ataaatggaa tcctacaggg gggaaacata tgcatttgat cagagcagcc 720

ggggctgtat gtctcgcagt ggttctgatt gcgggctgcc gtttcaatga agaccagcat 780

caggcagaag gagaaaatac agccgtcacc cagctgaagt ccgttcccta cagtaatttt 840

tcgcttcgtg tgagctacgg ggatggtgag cataaccgtt atgaaggaat ctatacaaag 900

aacgggactc aggaaaaagc ggaaatacag gataagctct ccggtgtcaa tcaggaagga 960

gaagaagcgt tagatgagat gaaaatgatt ttgagcgagc tttccgtgac agaccaaatg 1020

gctgaaacag aagtgataca cagtgtgctg gcagcattta atctggacag tcattatgat 1080

ggtaccgatt 1090

<210>18

<211>6079

<212>DNA

<213>人工序列

<220>

<223>质粒pAN23

<400>18

caagctttac agctgccagc agaccgaagc cgctggacgc tcctgtcacg atggctattt 60

ttttattcat cctaaccctc ctattaaact gctacagcta ttgtactatc ctgaacacga 120

aatgacgcct gtaatagaaa tttttataca ataattcaga attgttctat aatagaacga 180

aagaaggaaa ggggttttgt gatatggcgc tgcaaggggt aggccaaaga tgggatcttg 240

attcattttt taagggcggg agccaatcgg aagaattcaa aggttatatt gagaagctgt 300

cacaaagtct gcgtgcattt caagacagga ctgatgcgtt tcaggtgcct gaatcgcctg 360

aagaggctga agggctgacc gcgttgcttg atttaatcga acagacatcc gtcaagcttc 420

agcaggccgg cgcttttgtt gcttgcctcc aggcccagaa tatcaatgat caaaaggcta 480

tagagcatca ggcctcatga atcggctttc cgcagatttt caatcgtcgc tcgttgctgt 540

gcgtgacgcc gaaacctttt tacaaatgac cgaatcttaa agaaaaagcc gtggcgttaa 600

atgccccggc tttttcaatt cttctctgaa tgaggatttc attctctgga tatacctaaa 660

ataaatggaa tcctacaggg gggaaacata tgcatttgat cagagcagcc ggggctgtat 720

gtctcgcagt ggttctgatt gcgggctgcc gtttcaatga agaccagcat caggcagaag 780

gagaaaatac agccgtcacc cagctgaagt ccgttcccta cagtaatttt tcgcttcgtg 840

tgagctacgg ggatggtgag cataaccgtt atgaaggaat ctatacaaag aacgggactc 900

aggaaaaagc ggaaatacag gataagctct ccggtgtcaa tcaggaagga gaagaagcgt 960

tagatgagat gaaaatgatt ttgagcgagc tttccgtgac agaccaaatg gctgaaacag 1020

aagtgataca cagtgtgctg gcagcattta atctggacag tcattatgat ggtaccattt 1080

tgacggaacc gattgggacg agtcccgaaa gctgaaccgc atctataagt ttcaaggaaa 1140

ggcttgggat tgggaagttt ccaatgaaaa cggcaactat gattatttga tgtatgccga 1200

catcgattat gaccatcctg atgtcgcagc agaaattaag agatggggca cttggtatgc 1260

caatgaactg caattggacg gaaaccgtct tgatgctgtc aaacacatta aattttcttt 1320

tttgcgggat tgggttaatc atgtcaggga aaaaacgggg aaggaaatgt ttacggtagc 1380

tgaatattgg cagaatgact tgggcgcgct ggaaaactat ttgaacaaaa caaattttaa 1440

tcattcagtg tttgacgtgc cgcttcatta tcagttccat gctgcatcga cacagggagg 1500

cggctatgat atgaggaaat tgctgaaggg tacggtcgtt tccaagcatc cgttgaaatc 1560

ggttacattt gtcgataacc atgatacaca gccggggcaa tcgcttgagt cgactgtcca 1620

aacatggttt aagccgcttg cttacgcttt tattctcaca agggaatctg gataccctca 1680

ggttttctac ggggatatgt acgggacgaa aggagactcc cagcgcgaaa ttcctgcctt 1740

gaaacacaaa attgaaccga tcttaaaagc gagaaaacag tatgcgtacg gagcacagca 1800

tgattatttc gaccaccatg acattgtcgg ctggacaagg gaaggcgaca gctcggttgc 1860

aaattcaggt ttggcggcat taataacaga cggacccggt ggggcaaagc gaatgtatgt 1920

cggccggcaa aacgccggtg agacatggca tgacattacc ggaaaccgtt cggagccggt 1980

tgtcatcaat tcggaaggct ggggagagtt tcacgtaaac ggcgggtcgg tttcaattta 2040

tgttcaaaga tagaagagca gagaggacgg atttcctgaa ggaaatccgt ttttttattt 2100

tgcccgtctt ataaatttcg ttgattacat tttataatta attttaacaa agtgtcataa 2160

gccctcagga atattgctga cagtttagaa tccctaggta aggcggggat gaaatggcaa 2220

cgttatctga tgtagcaaag aaagaaatgt gtcgaaaatg acggtatcgc gggtgatcaa 2280

tcatcctgag actgtgacgg atgaattgaa aaagcttgca tgcctgcagg tcgattcaca 2340

aaaaataggc acacgaaaaa caagttaagg gatgcagttt atgcatccct taacttactt 2400

attaaataat ttatagctat tgaaaagaga taagaattgt tcaaagctaa tattgtttaa 2460

atcgtcaatt cctgcatgtt ttaaggaatt gttaaattga ttttttgtaa atattttctt 2520

gtattctttg ttaacccatt tcataacgaa ataattatac ttttgtttat ctttgtgtga 2580

tattcttgat ttttttctac ttaatctgat aagtgagcta ttcactttag gtttaggatg 2640

aaaatattct cttggaacca tacttaatat agaaatatca acttctgcca ttaaaagtaa 2700

tgccaatgag cgttttgtat ttaataatct tttagcaaac ccgtattcca cgattaaata 2760

aatctcatta gctatactat caaaaacaat tttgcgtatt atatccgtac ttatgttata 2820

aggtatatta ccatatattt tataggattg gtttttagga aatttaaact gcaatatatc 2880

cttgtttaaa acttggaaat tatcgtgatc aacaagttta ttttctgtag ttttgcataa 2940

tttatggtct atttcaatgg cagttacgaa attacacctc tttactaatt caagggtaaa 3000

atggcctttt cctgagccga tttcaaagat attatcatgt tcatttaatc ttatatttgt 3060

cattatttta tctatattat gttttgaagt aataaagttt tgactgtgtt ttatattttt 3120

ctcgttcatt ataaccctct ttaatttggt tatatgaatt ttgcttatta acgattcatt 3180

ataaccactt attttttgtt tggttgataa tgaactgtgc tgattacaaa aatactaaaa 3240

atgcccatat tttttcctcc ttataaaatt agtataatta tagcacgagc tctgataaat 3300

atgaacatga tgagtgatcg ttaaatttat actgcaatcg gatgcgatta ttgaataaaa 3360

gatatgagag atttatctaa tttctttttt cttgtaaaaa aagaaagttc ttaaaggttt 3420

tatagttttg gtcgtagagc acacggttta acgacttaat tacgaagtaa ataagtctag 3480

tgtgttagac tttatgaaat ctatatacgt ttatatatat ttattatccg gaggtgtagc 3540

atgtctcatt caattttgag ggttgccaga gttaaaggat caagtaatac aaacgggata 3600

caaagacata atcaaagaga gaataaaaac tataataata aagacataaa tcatgaggaa 3660

acatataaaa attatgattt gattaacgca caaaatataa agtataaaga taaaattgat 3720

gaaacgattg atgagaatta ttcagggaaa cgtaaaattc ggtcagatgc aattcgacat 3780

gtggacggac tggttacaag tgataaagat ttctttgatg atttaagcgg agaagaaata 3840

gaacgatttt ttaaagatag cttggagttt ctagaaaatg aatacggtaa ggaaaatatg 3900

ctgtatgcga ctgtccatct ggatgaaaga gtcccacata tgcactttgg ttttgtccct 3960

ttaacagagg acgggagatt gtctgcaaaa gaacagttag gcaacaagaa agactttact 4020

caattacaag atagatttaa tgagtatgtg aatgagaaag gttatgaact tgaaagaggc 4080

acgtccaaag aggttacaga acgagaacat aaagcgatgg atcagtacaa gaaagatact 4140

gtatttcata aacaggaact gcaagaagtt aaggatgagt tacagaaggc aaataagcag 4200

ttacagagtg gaatagagca tatgaggtct acgaaaccct ttgattatga aaatgagcgt 4260

acaggtttgt tctctggacg tgaagagact ggtagaaaga tattaactgc tgatgaattt 4320

gaacgcctgc aagaaacaat ctcttctgca gaacggattg ttgatgatta cgaaaatatt 4380

aagagcacag actattacac agaaaatcaa gaattaaaaa aacgtagaga gagtttgaaa 4440

gaagtagtga atacatggaa agaggggtat cacgaaaaaa gtaaagaggt taataaatta 4500

aagcgagaga atgatagttt gaatgagcag ttgaatgtat cagagaaatt tcaagctagt 4560

acagtgactt tatatcgtgc tgcgagggcg aatttccctg ggtttgagaa agggtttaat 4620

aggcttaaag agaaattctt taatgattcc aaatttgagc gtgtgggaca gtttatggat 4680

gttgtacagg ataatgtcca gaaggtcgat agaaagcgtg agaaacagcg tacagacgat 4740

ttagagatgt agaggtactt ttatgccgag aaaacttttt gcgtgtgaca gtccttaaaa 4800

tatacttaga gcgtaagcga aagtagtagc gacagctatt aactttcggt ttcaaagctc 4860

taggattttt aatggacgca gcgcatcaca cgcaaaaagg aaattggaat aaatgcgaaa 4920

tttgagatgt taattaaaga cctttttgag gtcttttttt cttagatttt tggggttatt 4980

taggggagaa aacatagggg ggtactacga cctcccccct aggtgtccat tgtccattgt 5040

ccaaacaaat aaataaatat tgggttttta atgttaaaag gttgtttttt atgttaaagt 5100

gaaaaaaaca gatgttggga ggtacagtga tggttgtaga tagaaaagaa gagaaaaaag 5160

ttgctgttac tttaagactt acaacagaag aaaatgagat attaaataga atcaaagaaa 5220

aatataatat tagcaaatca gatgcaaccg gtattctaat aaaaaaatat gcaaaggagg 5280

aatacggtgc attttaaaca aaaaaagata gacagcactg gcatgctgcc tatctatgac 5340

taaattttgt taagtgtatt agcaccgtta ttatatcatg agcgaaaatg taataaaaga 5400

aactgaaaac aagaaaaatt caagaggacg taattggaca tttgttttat atccagaatc 5460

agcaaaagcc gagtggttag agtatttaaa agagttacac attcaatttg tagtgtctcc 5520

attacatgat agggatactg atacagaagg taggatgaaa aaagagcatt atcatattct 5580

agtgatgtat gagggtaata aatcttatga acagataaaa ataattacag aagaattgaa 5640

tgcgactatt ccgcagattg caggaagtgt gaaaggtctt gtgagatata tgcttcacat 5700

ggacgatcct aataaattta aatatcaaaa agaagatatg atagtttatg gcggtgtaga 5760

tgttgatgaa ttattaaaga aaacaacaac agatagatat aaattaatta aagaaatgat 5820

tgagtttatt gatgaacaag gaatcgtaga atttaagagt ttaatggatt atgcaatgaa 5880

gtttaaattt gatgattggt tcccgctttt atgtgataac tcggcgtatg ttattcaaga 5940

atatataaaa tcaaatcggt ataaatctga ccgatagatt ttgaatttag gtgtcacaag 6000

acactctttt ttcgcaccag cgaaaactgg tttaagccga ctgcgcaaaa gacataatcg 6060

actctagagg atccccggg 6079

<210>19

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物yusZlich1F

<400>19

tcagcagccc gcggagcagc cgttttaatg gaacc 35

<210>20

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物yusZlich2R

<400>20

atgaccgcac gt tcccaaat gctcgtcgcg cccgttacaa 40

<210>21

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物yusZl ich3F

<400>21

ttgtaacggg cgcgacgagc atttgggaac gtgcggtcat 40

<210>22

<211>36

<212>DNA

<213>人工序列

<223>引物yusZlich4R

<400>22

gcggatttga cgtcaatcgc ttaccagtgc ggaaac 36

<210>23

<211>4350

<212>DNA

<213>人工序列

<220>

<223>质粒pAN212b

<400>23

aattcagatc cttattgttc ccgcgggacg tcgattcaca aaaataggca cacgaaaaac 60

aagtaaggga tgcagtttat gcatccctta acttacttat taaataattt atagctattg 120

aaaagagata agaattgttc aaagctaata ttgtttaaat cgtcaattcc tgcatgtttt 180

aaggaattgt taaattgatt ttttgtaaat attttcttgt attctttgtt aacccatttc 240

ataacgaaat aattatactt ttgtttatct ttgtgtgata ttcttgattt ttttctactt 300

aatctgataa gtgagctatt cactttaggt ttaggatgaa aatattctct tggaaccata 360

cttaatatag aaatatcaac ttctgccatt aaaagtaatg ccaatgagcg ttttgtattt 420

aataatcttt tagcaaaccc gtattccacg attaaataaa tctcattagc tatactatca 480

aaaacaattt tgcgtattat atccgtactt atgttataag gtatattacc atatatttta 540

taggattggt ttttaggaaa tttaaactgc aatatatcct tgtttaaaac ttggaaatta 600

tcgtgatcaa caagtttatt ttctgtagtt ttgcataatt tatggtctat ttcaatggca 660

gttacgaaat tacacctctt tactaattca agggtaaaat ggccttttcc tgagccgatt 720

tcaaagatat tatcatgttc atttaatctt atatttgtca ttattttatc tatattatgt 780

tttgaagtaa taaagttttg actgtgtttt atatttttct cgttcattat aaccctcttt 840

aatttggtta tatgaatttt gcttattaac gattcattat aaccacttat tttttgtttg 900

gttgataatg aactgtgctg attacaaaaa tactaaaaat gcccatattt tttcctcctt 960

ataaaattag tataattata gcacgagctc tgataaatat gaacatgatg agtgatcgtt 1020

aaatttatac tgcaatcgga tgcgattatt gaataaaaga tatgagagat ttatctaatt 1080

tcttttttct tgtaaaaaaa gaaagttctt aaaggtttta tagttttggt cgtagagcac 1140

acggtttaac gacttaatta cgaagtaaat aagtctagtg tgttagactt tatgaaatct 1200

atatacgttt atatatattt attatccgga ggtgtagcat gtctcattca attttgaggg 1260

ttgccagagt taaaggatca agtaatacaa acgggataca aagacataat caaagagaga 1320

ataaaaacta taataataaa gacataaatc atgaggaaac atataaaaat tatgatttga 1380

ttaacgcaca aaatataaag tataaagata aaattgatga aacgattgat gagaattatt 1440

cagggaaacg taaaattcgg tcagatgcaa ttcgacatgt ggacggactg gttacaagtg 1500

ataaagattt ctttgatgat ttaagcggag aagaaataga acgatttttt aaagatagct 1560

tggagtttct agaaaatgaa tacggtaagg aaaatatgct gtatgcgact gtccatctgg 1620

atgaaagagt cccacatatg cactttggtt ttgtcccttt aacagaggac gggagattgt 1680

ctgcaaaaga acagttaggc aacaagaaag actttactca attacaagat agatttaatg 1740

agtatgtgaa tgagaaaggt tatgaacttg aaagaggcac gtccaaagag gttacagaac 1800

gagaacataa agcgatggat cagtacaaga aagatactgt atttcataaa caggaactgc 1860

aagaagttaa ggatgagtta cagaaggcaa ataagcagtt acagagtgga atagagcata 1920

tgaggtctac gaaacccttt gattatgaaa atgagcgtac aggtttgttc tctggacgtg 1980

aagagactgg tagaaagata ttaactgctg atgaatttga acgcctgcaa gaaacaatct 2040

cttctgcaga acggattgtt gatgattacg aaaatattaa gagcacagac tattacacag 2100

aaaatcaaga attaaaaaaa cgtagagaga gtttgaaaga agtagtgaat acatggaaag 2160

aggggtatca cgaaaaaagt aaagaggtta ataaattaaa gcgagagaat gatagtttga 2220

atgagcagtt gaatgtatca gagaaatttc aagctagtac agtgacttta tatcgtgctg 2280

cgagggcgaa tttccctggg tttgagaaag ggtttaatag gcttaaagag aaattcttta 2340

atgattccaa atttgagcgt gtgggacagt ttatggatgt tgtacaggat aatgtccaga 2400

aggtcgatag aaagcgtgag aaacagcgta cagacgattt agagatgtag aggtactttt 2460

atgccgagaa aactttttgc gtgtgacagt ccttaaaata tacttagagc gtaagcgaaa 2520

gtagtagcga cagctattaa ctttcggttt caaagctcta ggatttttaa tggacgcagc 2580

gcatcacacg caaaaaggaa attggaataa atgcgaaatt tgagatgtta attaaagacc 2640

tttttgaggt ctttttttct tagatttttg gggttattta ggggagaaaa catagggggg 2700

tactacgacc tcccccctag gtgtccattg tccattgtcc aaacaaataa ataaatattg 2760

ggtttttaat gttaaaaggt tgttttttat gttaaagtga aaaaaacaga tgttgggagg 2820

tacagtgatg gttgtagata gaaaagaaga gaaaaaagtt gctgttactt taagacttac 2880

aacagaagaa aatgagatat taaatagaat caaagaaaaa tataatatta gcaaatcaga 2940

tgcaaccggt attctaataa aaaaatatgc aaaggaggaa tacggtgcat tttaaacaaa 3000

aaaagataga cagcactggc atgctgccta tctatgacta aattttgtta agtgtattag 3060

caccgttatt atatcatgag cgaaaatgta ataaaagaaa ctgaaaacaa gaaaaattca 3120

agaggacgta attggacatt tgttttatat ccagaatcag caaaagccga gtggttagag 3180

tatttaaaag agttacacat tcaatttgta gtgtctccat tacatgatag ggatactgat 3240

acagaaggta ggatgaaaaa agagcattat catattctag tgatgtatga gggtaataaa 3300

tcttatgaac agataaaaat aattacagaa gaattgaatg cgactattcc gcagattgca 3360

ggaagtgtga aaggtcttgt gagatatatg cttcacatgg acgatcctaa taaatttaaa 3420

tatcaaaaag aagatatgat agtttatggc ggtgtagatg ttgatgaatt attaaagaaa 3480

acaacaacag atagatataa attaattaaa gaaatgattg agtttattga tgaacaagga 3540

atcgtagaat ttaagagttt aatggattat gcaatgaagt ttaaatttga tgattggttc 3600

ccgcttttat gtgataactc ggcgtatgtt attcaagaat atataaaatc aaatcggtat 3660

aaatctgacc gatagatttt gaatttaggt gtcacaagac actctttttt cgcaccagcg 3720

aaaactggtt taagccgact gcgcaaaaga cataatcgac tctagaggat ccccgggtac 3780

cgagctctgc cttttagtcc agctgatttc actttttgca ttctacaaac tgcataactc 3840

atatgtaaat cgctcctttt taggtggcac aaatgtgagg cattttcgct ctttccggca 3900

accacttcca agtaaagtat aacacactat actttatatt cataaagtgt gtgctctgcg 3960

aggctgtcgg cagtgccgac caaaaccata aaacctttaa gacctttctt ttttttacga 4020

gaaaaaagaa acaaaaaaac ctgccctctg ccacctcagc aaaggggggt tttgctctcg 4080

tgctcgttta aaaatcagca agggacaggt agtatttttt gagaagatca ctcaaaaaat 4140

ctccaccttt aaacccttgc caatttttat tttgtccgtt ttgtctagct taccgaaagc 4200

cagactcagc aagaataaaa tttttattgt ctttcggttt tctagtgtaa cggacaaaac 4260

cactcaaaat aaaaaagata caagagaggt ctctcgtatc ttttattcag caatcgcgcc 4320

cgattgctga acagattaat aatgagctcg 4350

<210>24

<211>843

<212>DNA

<213>地衣芽孢杆菌(Bacillus licheniformis)SJ1707

<220>

<221>CDS

<222>(1)..(840)

<223>YusZ

<400>24

ttg aac aat aaa atc gca att gta acg ggc gcg acg agc gga ttt ggt 48

Leu Asn Asn Lys Ile Ala Ile Val Thr Gly Ala Thr Ser Gly Phe Gly

1 5 10 15

tta ttg acc gct tta aaa ctc gca agc act cat ttc gta atc gca acg 96

Leu Leu Thr Ala Leu Lys Leu Ala Ser Thr His Phe Val Ile Ala Thr

20 25 30

gcg cgc cat cea gaa aaa gcg gaa get ctg egg aac cgt ata gcg gag 144

Ala Arg His Pro Glu Lys Ala Glu Ala Leu Arg Asn Arg Ile Ala Gh

35 40 45

ctg tcg atc gag tca tcg att gcc gtc gct gaa ctt gat gtc aca aac 192

Leu Ser Ile Glu Ser Ser Ile Ala ValAla Glu Leu Asp Val Thr Asn

50 55 60

gaa caa tcg att tcc tca ttt tcc gaa gag ctg aag cag tac gga cag 240

Glu Gln Ser Ile Ser Ser Phe Ser GLU GLU Leu Lys Gln Tyr Gly Gln

65 70 75 80

ata gac gtt ctc atc aat aat gca gga acg gca tac ggc gga tte gct 288

Ile Asp Val Leu Ile Asn Asn Ala Gly Thr Ala Tyr Gly Gly Phe Ala

85 90 95

gaa gag ctt tct ctt ggc gac tac aga aaa cag tat gac acc aat gtt 336

Glu Glu Leu Ser Leu Gly Asp Tyr Arg Lys Gln Tyr Asp Thr Asn Val

100 105 110

ttc ggc ctg gtg gca gtc aca aaa gcg gtc ctt cct tat atg aag aaa 384

Phe Gly Leu Val Ala Val Thr Lys Ala Val Leu Pro Tyr Met Lys Lys

115 120 125

cac agc ggc gcc aaa atc atc aat ctg agc agc atc agc ggg cgg atc 432

His Ser Gly Ala Lys Ile Ile Asn Leu Ser Ser Ile Ser Gly Arg Ile

130 135 140

gct ttc ccc gct ttc tcg gca tat gct tca tca aag cat gca gtt gaa 480

Ala Phe Pro Ala Phe Ser Ala Tyr Ala Ser Ser Lys His Ala Val Glu

145 150 155 160

ggc ttt tca gaa agc ctc cgc ctc gaa ctc cgt cca ttc ggc atc aat 528

Gly Phe Ser Glu Ser Leu Arg Leu Glu Leu Arg Pro Phe Gly Ile Asn

165 170 175

gtg gcc gtc gte cag ccg gga tcg tac cag acg gcg att tgg gag aca 576

Val Ala Val Val Gln Pro Gly Ser Tyr Gln Thr Ala Ile Trp Glu Thr

180 185 190

tcg ttt gcc gcc caa gtc act gca cct gat gcc gaa tea cag tac aaa 624

Ser Phe Ala Ala Gln Val Thr Ala Pro Asp Ala Glu Ser Gln Tyr Lys

195 200 205

aca tat ttc gag cgg atc tcc gcc tac att gca gcg agc cgc aaa cat 672

Thr Tyr Phe Glu Arg Ile Ser Ala Tyr Ile Ala Ala Ser Arg Lys His

210 215 220

tac gga aac ecg gat gat gtg gct gaa ttg atc tgc cga ctc gct gca 720

Tyr Gly Asn Pro Asp Asp Val Ala Glu Leu Ile Cys Arg Leu Ala Ala

225 230 235 240

aaa aag cgg ctg aac agg ctg cgc tat ccg atc ggc agg ggc gtc cgt 768

Lys Lys Arg Leu Asn Arg Leu Arg Tyr Pro Ile Gly Arg Gly Val Arg

245 250 255

ctc tcg atc ctt ctc cac caa atc ctg cca tgg cgg att tgg gaa cgt 816

Leu Ser Ile Leu Leu His Gln Ile Leu Pro Trp Arg Ile Trp Glu Arg

260 265 270

gcg gtc ata aaa aaa ttg ctt aaa tga 843

Ala Val Ile Lys Lys Leu Leu Lys

275 280

<210>25

<211>280

<212>PRT

<213>地衣芽孢杆菌SJ1707

<400>25

Leu Asn Asn Lys Ile Ala Ile Val Thr Gly Ala Thr Ser Gly Phe Gly

1 5 10 15

Leu Leu Thr Ala Leu Lys Leu Ala Ser Thr His Phe Val Ile Ala Thr

20 25 30

Ala Arg His Pro Glu Lys Ala Glu Ala Leu Arg Asn Arg Ile Ala Glu

35 40 45

Leu Ser Ile Glu Ser Ser Ile Ala Val Ala Glu Leu Asp Val Thr Asn

50 55 60

Glu Gln Ser Ile Ser Ser Phe Ser Glu Glu Leu Lys Gln Tyr Gly Gln

65 70 75 80

Ile Asp Val Leu Ile Asn Asn Ala Gly Thr Ala Tyr Gly Gly Phe Ala

85 90 95

Glu Glu Leu Ser Leu Gly Asp Tyr Arg Lys Gln Tyr Asp Thr Asn Val

100 105 110

Phe Gly Leu Val Ala Val Thr Lys Ala Val Leu Pro Tyr Met Lys Lys

115 120 125

His Ser Gly Ala Lys Ile Ile Asn Leu Ser Ser Ile Ser Gly Arg Ile

130 135 140

Ala Phe Pro Ala Phe Ser Ala Tyr Ala Ser Ser Lys His Ala Val Glu

145 150 155 160

Gly Phe Ser Glu Ser Leu Arg Leu Glu Leu Arg Pro Phe Gly Ile Asn

165 170 175

Val Ala Val Val Gln Pro Gly Ser Tyr Gln Thr Ala Ile Trp Glu Thr

180 185 190

Ser Phe Ala Ala Gln Val Thr Ala Pro Asp Ala Glu Ser Gln Tyr Lys

195 200 205

Thr Tyr Phe Glu Arg Ile Ser Ala Tyr Ile Ala Ala Ser Arg Lys His

210 215 220

Tyr Gly Asn Pro Asp Asp Val Ala Glu Leu Ile Cys Arg Leu Ala Ala

225 230 235 240

Lys Lys Arg Leu Ash Arg Leu Arg Tyr Pro Ile Gly Arg Gly Val Arg

245 250 255

Leu Ser Ile Leu Leu His Gln Ile Leu Pro Trp Arg Ile Trp Glu Arg

260 265 270

Ala Val Ile Lys Lys Leu Leu Lys

275 280

<210>26

<211>5313

<212>DNA

<213>人工序列

<220>

<223>质粒pAN212b-yusZ

<400>26

aattcagatc cttattgttc ccgcggagca gccgttttaa tggaaccgac tccccctctt 60

ccagatatac gcttgatcct tccgtttgag cggcattttt gctgactttc acacgatctt 120

ccaaatttcc gttttctatt gcataaatcg ccgtggcaat tttggttatg ctggctggat 180

acattttttt gcggctgttt ttttcataga ggacctggcc cgatttccca tcgatcaata 240

tagcggaaac gcttttgatt tccggtttgt ttttttctcc tgcttgagcc gagctatgaa 300

aaaacagcgt cagacatagt acaataatga acaggaggga tcgtttaaca ttcatcgtgt 360

caccctgcct tctttctctt ttgcaatttt tataaaaata ggtcttttag cactttttaa 420

attttaccaa tgatgaactg tcgctgacaa gccttttctt gtcaacaagc caaaattttg 480

aatggaggaa actcattgaa caataaaatc gcaattgtaa cgggcgcgac gagcatttgg 540

gaacgtgcgg tcataaaaaa attgcttaaa tgaggtaatt taaaataatt ataatttagt 600

attgatttta attttgtatt tgttataata taattaacaa atgaaaaaca cgaggaggaa 660

atatcatatg atctctcaac aattaaaaca gcaaaatcct gtacttgaaa actcaatgaa 720

tacgaatttg tcaaactggt tcatccttta cacgaagctt caccgttttc actggtacgt 780

aaaagggccg cagttcttta ccctacatga aaaatttgaa gagctataca accatgcgtc 840

agaaacagca gatgtgatcg cggaacgctt gctggccatc ggcggacagc cgctcgccac 900

aatgaaagaa tacattgacc acggcacaat tgaggaaaac ggagccgaaa aaacggccga 960

agaaatggtt tccgcactgg taagcgattg acgtcgattc acaaaaatag gcacacgaaa 1020

aacaagtaag ggatgcagtt tatgcatccc ttaacttact tattaaataa tttatagcta 1080

ttgaaaagag ataagaattg ttcaaagcta atattgttta aatcgtcaat tcctgcatgt 1140

tttaaggaat tgttaaattg attttttgta aatattttct tgtattcttt gttaacccat 1200

ttcataacga aataattata cttttgttta tctttgtgtg atattcttga tttttttcta 1260

cttaatctga taagtgagct attcacttta ggtttaggat gaaaatattc tcttggaacc 1320

atacttaata tagaaatatc aacttctgcc attaaaagta atgccaatga gcgttttgta 1380

tttaataatc ttttagcaaa cccgtattcc acgattaaat aaatctcatt agctatacta 1440

tcaaaaacaa ttttgcgtat tatatccgta cttatgttat aaggtatatt accatatatt 1500

ttataggatt ggtttttagg aaatttaaac tgcaatatat ccttgtttaa aacttggaaa 1560

ttatcgtgat caacaagttt attttctgta gttttgcata atttatggtc tatttcaatg 1620

gcagttacga aattacacct ctttactaat tcaagggtaa aatggccttt tcctgagccg 1680

atttcaaaga tattatcatg ttcatttaat cttatatttg tcattatttt atctatatta 1740

tgttttgaag taataaagtt ttgactgtgt tttatatttt tctcgttcat tataaccctc 1800

tttaatttgg ttatatgaat tttgcttatt aacgattcat tataaccact tattttttgt 1860

ttggttgata atgaactgtg ctgattacaa aaatactaaa aatgcccata ttttttcctc 1920

cttataaaat tagtataatt atagcacgag ctctgataaa tatgaacatg atgagtgatc 1980

gttaaattta tactgcaatc ggatgcgatt attgaataaa agatatgaga gatttatcta 2040

atttcttttt tcttgtaaaa aaagaaagtt cttaaaggtt ttatagtttt ggtcgtagag 2100

cacacggttt aacgacttaa ttacgaagta aataagtcta gtgtgttaga ctttatgaaa 2160

tctatatacg tttatatata tttattatcc ggaggtgtag catgtctcat tcaattttga 2220

gggttgccag agttaaagga tcaagtaata caaacgggat acaaagacat aatcaaagag 2280

agaataaaaa ctataataat aaagacataa atcatgagga aacatataaa aattatgatt 2340

tgattaacgc acaaaatata aagtataaag ataaaattga tgaaacgatt gatgagaatt 2400

attcagggaa acgtaaaatt cggtcagatg caattcgaca tgtggacgga ctggttacaa 2460

gtgataaaga tttctttgat gatttaagcg gagaagaaat agaacgattt tttaaagata 2520

gcttggagtt tctagaaaat gaatacggta aggaaaatat gctgtatgcg actgtccatc 2580

tggatgaaag agtcccacat atgcactttg gttttgtccc tttaacagag gacgggagat 2640

tgtctgcaaa agaacagtta ggcaacaaga aagactttac tcaattacaa gatagattta 2700

atgagtatgt gaatgagaaa ggttatgaac ttgaaagagg cacgtccaaa gaggttacag 2760

aacgagaaca taaagcgatg gatcagtaca agaaagatac tgtatttcat aaacaggaac 2820

tgcaagaagt taaggatgag ttacagaagg caaataagca gttacagagt ggaatagagc 2880

atatgaggtc tacgaaaccc tttgattatg aaaatgagcg tacaggtttg ttctctggac 2940

gtgaagagac tggtagaaag atattaactg ctgatgaatt tgaacgcctg caagaaacaa 3000

tctcttctgc agaacggatt gttgatgatt acgaaaatat taagagcaca gactattaca 3060

cagaaaatca agaattaaaa aaacgtagag agagtttgaa agaagtagtg aatacatgga 3120

aagaggggta tcacgaaaaa agtaaagagg ttaataaatt aaagcgagag aatgatagtt 3180

tgaatgagca gttgaatgta tcagagaaat ttcaagctag tacagtgact ttatatcgtg 3240

ctgcgagggc gaatttccct gggtttgaga aagggtttaa taggcttaaa gagaaattct 3300

ttaatgattc caaatttgag cgtgtgggac agtttatgga tgttgtacag gataatgtcc 3360

agaaggtcga tagaaagcgt gagaaacagc gtacagacga tttagagatg tagaggtact 3420

tttatgccga gaaaactttt tgcgtgtgac agtccttaaa atatacttag agcgtaagcg 3480

aaagtagtag cgacagctat taactttcgg tttcaaagct ctaggatttt taatggacgc 3540

agcgcatcac acgcaaaaag gaaattggaa taaatgcgaa atttgagatg ttaattaaag 3600

acctttttga ggtctttttt tcttagattt ttggggttat ttaggggaga aaacataggg 3660

gggtactacg acctcccccc taggtgtcca ttgtccattg tccaaacaaa taaataaata 3720

ttgggttttt aatgttaaaa ggttgttttt tatgttaaag tgaaaaaaac agatgttggg 3780

aggtacagtg atggttgtag atagaaaaga agagaaaaaa gttgctgtta ctttaagact 3840

tacaacagaa gaaaatgaga tattaaatag aatcaaagaa aaatataata ttagcaaatc 3900

agatgcaacc ggtattctaa taaaaaaata tgcaaaggag gaatacggtg cattttaaac 3960

aaaaaaagat agacagcact ggcatgctgc ctatctatga ctaaattttg ttaagtgtat 4020

tagcaccgtt attatatcat gagcgaaaat gtaataaaag aaactgaaaa caagaaaaat 4080

tcaagaggac gtaattggac atttgtttta tatccagaat cagcaaaagc cgagtggtta 4140

gagtatttaa aagagttaca cattcaattt gtagtgtctc cattacatga tagggatact 4200

gatacagaag gtaggatgaa aaaagagcat tatcatattc tagtgatgta tgagggtaat 4260

aaatcttatg aacagataaa aataattaca gaagaattga atgcgactat tccgcagatt 4320

gcaggaagtg tgaaaggtct tgtgagatat atgcttcaca tggacgatcc taataaattt 4380

aaatatcaaa aagaagatat gatagtttat ggcggtgtag atgttgatga attattaaag 4440

aaaacaacaa cagatagata taaattaatt aaagaaatga ttgagtttat tgatgaacaa 4500

ggaatcgtag aatttaagag tttaatggat tatgcaatga agtttaaatt tgatgattgg 4560

ttcccgcttt tatgtgataa ctcggcgtat gttattcaag aatatataaa atcaaatcgg 4620

tataaatctg accgatagat tttgaattta ggtgtcacaa gacactcttt tttcgcacca 4680

gcgaaaactg gtttaagccg actgcgcaaa agacataatc gactctagag gatccccggg 4740

taccgagctc tgccttttag tccagctgat ttcacttttt gcattctaca aactgcataa 4800

ctcatatgta aatcgctcct ttttaggtgg cacaaatgtg aggcattttc gctctttccg 4860

gcaaccactt ccaagtaaag tataacacac tatactttat attcataaag tgtgtgctct 4920

gcgaggctgt cggcagtgcc gaccaaaacc ataaaacctt taagaccttt ctttttttta 4980

cgagaaaaaa gaaacaaaaa aacctgccct ctgccacctc agcaaagggg ggttttgctc 5040

tcgtgctcgt ttaaaaatca gcaagggaca ggtagtattt tttgagaaga tcactcaaaa 5100

aatctccacc tttaaaccct tgccaatttt tattttgtcc gttttgtcta gcttaccgaa 5160

agccagactc agcaagaata aaatttttat tgtctttcgg ttttctagtg taacggacaa 5220

aaccactcaa aataaaaaag atacaagaga ggtctctcgt atcttttatt cagcaatcgc 5280

gcccgattgc tgaacagatt aataatgagc tcg 5313

Claims

1.突变的原核细胞，其与其它的等基因但未突变的细胞相比，降低了YusZ(SEQ ID NOs：2或25)、YusX(SEQ ID NO：4)或其同源物的表达水平，并分泌较高量的至少一种目标异源多肽。

2.根据权利要求1所述的细胞，其是革兰氏阳性细胞。

3.根据权利要求2所述的细胞，其是芽孢杆菌属细胞。

4.根据权利要求3所述的细胞，其是嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、B.clausii、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌细胞。

5.根据权利要求1-4任一项所述的细胞，其中所述YusZ或YusX同源物包含分别与SEQ ID NOs：2或25、或SEQ ID NO：4所示序列具有至少70％同一性的氨基酸序列。

6.根据权利要求1-5任一项所述的细胞，其在yusZ(SEQ ID NOs：1或24)、yusX(SEQ ID NO：3)和/或yusY(SEQ ID NO：5)，或其同源物中突变。

7.根据权利要求6所述的细胞，其中所述yusZ、yusX和/或yusY同源物编码多肽，所述多肽具有分别与SEQ ID NOs：2或25、SEQ ID NO：4、或SEQ ID NO：6所示序列具有至少70％同一性的氨基酸序列。

8.根据权利要求6所述的细胞，其中所述yusZ、yusX和/或yusY同源物具有分别与SEQ ID NOs：1或24、SEQ ID NO：3、或SEQ ID NO：5所示序列具有至少70％同一性的核苷酸序列。

9.根据权利要求1-8任一项所述的细胞，其在至少一种多核苷酸突变，其中所述至少一种多核苷酸中具有至少100bp大小的亚序列能够与具有SEQ ID NOs：1或24、SEQ ID NO：3、或SEQ ID NO：5所示序列或其各自的互补序列的多核苷酸在中等严紧杂交条件下杂交。

10.根据权利要求6-9任一项所述的细胞，其中yusZ、yusX和/或yusY，或其同源物，部分或全部从染色体中缺失。

11.根据权利要求6-9任一项所述的细胞，其中yusZ、yusX和/或yusY，或其同源物，包含至少一种移码突变或无义突变。

12.根据权利要求1-11任一项所述的细胞，其与其它的等基因但未突变的细胞相比，YusZ或YusX，或其同源物的表达水平降低至少两倍。

13.根据权利要求1-12任一项所述的细胞，其与其它的等基因但未突变的细胞相比，检测不到YusZ或YusX，或其同源物的表达。

14.根据权利要求1-13任一项所述的细胞，其中所述至少一种异源多肽包含酶。

15.根据权利要求14所述的细胞，其中所述的酶是裂合酶、连接酶、水解酶、氧化还原酶、转移酶或异构酶。

16.根据权利要求1-15任一项所述的细胞，其包含一个或多个染色体整合的、编码所述至少一种异源多肽的多核苷酸的拷贝。

17.根据权利要求1-16任一项所述的细胞，其中所述至少一种异源多肽由从至少一种异源启动子转录的多核苷酸编码。

18.根据权利要求17所述的细胞，其中所述至少一种启动子包含人工启动子。

19.根据权利要求18所述的细胞，其中所述人工启动子包含一种或多种mRNA稳定序列，优选衍生自cryIIIa启动子。

20.构建突变的原核细胞的方法，所述方法包含如下步骤：

a)将原核细胞突变；和

b)筛选与其它等基因但未突变的细胞相比，降低了YusZ(SEQ ID NOs：2或25)或YusX(SEQ ID NO：4)、或其同源物的表达水平、并分泌较高量的至少一种目标异源多肽的突变细胞。

21.根据权利要求20所述的方法，其中所述细胞是革兰氏阳性细胞。

22.根据权利要求21所述的方法，其中所述细胞是芽孢杆菌属细胞。

23.根据权利要求22所述的方法，其中所述细胞是嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、B.clausii、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌细胞。

24.根据权利要求20-23任一项所述的方法，其中所述YusZ或YusX同源物包含分别与SEQ ID NOs：2或25、或SEQ ID NO：4所示序列具有至少70％同一性的氨基酸序列。

25.根据权利要求20-24任一项所述的方法，其中步骤(a)中所述细胞在yusZ(SEQ ID NOs：1或24)、yusX(SEQ ID NO：3)和/或yusY(SEQ IDNO：5)，或其同源物中突变。

26.根据权利要求25所述的方法，其中所述yusZ、yusX和/或yusY同源物编码多肽，所述多肽具有分别与SEQ ID NOs：2或25、SEQ ID NO：4、或SEQ ID NO：6所示序列具有至少70％同一性的氨基酸序列。

27.根据权利要求25所述的方法，其中所述yusZ、yusX和/或yusY同源物具有分别与SEQ ID NOs：1或24、SEQ ID NO：3、或SEQ ID NO：5所示序列具有至少70％同一性的核苷酸序列。

28.根据权利要求20-27任一项所述的方法，其中步骤(a)中所述细胞在至少一种多核苷酸中突变，其中所述至少一种多核苷酸中具有至少100bp大小的亚序列与具有SEQ ID NOs：1或24、SEQ ID NO：3、或SEQ ID NO：5所示序列或其各自的互补序列的多核苷酸在中等严紧杂交条件下杂交。

29.根据权利要求25-28任一项所述的方法，其中步骤(a)中所述细胞通过从细胞的染色体中部分或全部缺失yusZ、yusX和/或yusY，或其同源物来进行突变。

30.根据权利要求25-28任一项所述的方法，其中步骤(a)中所述细胞通过在yusZ、yusX和/或yusY，或其同源物中导入至少一种移码突变或无义突变来进行突变。

31.根据权利要求20-30任一项所述的方法，其中在步骤(b)中所筛选的细胞与其它的等基因但未突变的细胞相比，YusZ或YusX，或其同源物的表达水平降低了至少两倍。

32.根据权利要求20-31任一项所述的方法，其中在步骤(b)中所筛选的细胞与其它的等基因但未突变的细胞相比，检测不到YusZ或YusX，或其同源物的表达。

33.根据权利要求20-32任一项所述的方法，其中所述至少一种目标异源多肽包含酶。

34.根据权利要求33所述的方法，其中所述酶是裂合酶、连接酶、水解酶、氧化还原酶、转移酶或异构酶。

35.根据权利要求20-34任一项所述的方法，其中所述细胞包含一个或多个染色体整合的、编码所述至少一种目标异源多肽的多核苷酸的拷贝。

36.根据权利要求20-35任一项所述的方法，其中所述至少一种目标异源多肽由从至少一种异源启动子转录的多核苷酸编码。

37.根据权利要求36所述的方法，其中所述至少一种启动子包含人工启动子。

38.根据权利要求37所述的方法，其中所述人工启动子包含一种或多种mRNA稳定序列，优选衍生自cryIIIa启动子。

39.生产目标多肽的方法，所述方法包含如下步骤：

(a)培养突变的原核细胞，其与其它的等基因但未突变的细胞相比，降低了YusZ(SEQ ID NOs：2或25)、YusX(SEQ ID NO：4)、或其同源物的表达水平，同时分泌较高量的目标多肽；和

(b)分离目标多肽。

40.根据权利要求39所述的方法，其中所述细胞是革兰氏阳性细胞。

41.根据权利要求40所述的方法，其中所述细胞是芽孢杆菌属细胞。

42.根据权利要求41所述的方法，其中所述细胞是嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、B.clausii、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌细胞。

43.根据权利要求39-42任一项所述的方法，其中所述YusZ或YusX同源物包含分别与SEQ ID NOs：2或25、或SEQ ID NO：4所示序列具有至少70％同一性的氨基酸序列。

44.根据权利要求39-43任一项所述的方法，其中步骤(a)中所述细胞在yusZ(SEQ ID NOs：1或24)、yusX(SEQ ID NO：3)、和/或yusY(SEQ IDNO：5)，或其同源物中突变。

45.根据权利要求44所述的方法，其中所述yusZ、yusX、和/或yusY同源物编码多肽，所述多肽具有分别与SEQ ID Nos：2或25、SEQ ID NO：4、或SEQ ID NO：6所示序列具有至少70％同一性的氨基酸序列。

46.根据权利要求44所述的方法，其中所述yusZ、yusX、和/或yusY同源物具有分别与SEQ ID NOs：1或24、SEQ ID NO：3、或SEQ ID NO：5所示序列具有至少70％同一性的核苷酸序列。

47.根据权利要求39-46任一项所述的方法，其中步骤(a)中所述细胞在至少一种多核苷酸中突变，其中所述至少一种多核苷酸中具有至少100bp大小的亚序列与具有SEQ ID NOs：1或24、SEQ ID NO：3、或SEQ ID NO：5所示序列或其各自的互补序列的多核苷酸在中度严紧杂交条件下杂交。

48.根据权利要求39-47任一项所述的方法，其中步骤(a)中所述细胞通过从细胞的染色体中部分或全部缺失yusZ、yusX、和/或yusY，或其同源物来进行突变。

49.根据权利要求39-47任一项所述的方法，其中步骤(a)中所述细胞通过向yusZ、yusX、和/或yusY，或其同源物中导入至少一种移码突变或无义突变来进行突变。

50.根据权利要求39-49任一项所述的方法，其中步骤(a)中所述细胞与其它的等基因但未突变的细胞相比，YusZ或YusX，或其同源物的表达水平降低了至少两倍。

51.根据权利要求39-50任一项所述的方法，其中步骤(a)中所述细胞与其它的等基因但未突变的细胞相比，检测不到YusZ或YusX，或其同源物的表达。

52.根据权利要求39-51任一项所述的方法，其中所述至少一种目标多肽包含酶。

53.根据权利要求52所述的方法，其中所述酶是裂合酶、连接酶、水解酶、氧化还原酶、转移酶或异构酶。

54.根据权利要求39-53任一项所述的方法，其中所述细胞包含一个或多个染色体整合的、编码所述至少一种目标多肽的多核苷酸的拷贝。

55.根据权利要求39-54任一项所述的方法，其中所述至少一种目标多肽由从至少一种异源启动子转录的多核苷酸编码。

56.根据权利要求55所述的方法，其中所述至少一种启动子包含人工启动子。

57.根据权利要求56所述的方法，其中所述人工启动子包含一个或多个mRNA稳定序列，优选衍生自cryIIIa启动子。