CN1965085A - 具有高分泌水平的突变的原核细胞 - Google Patents

具有高分泌水平的突变的原核细胞 Download PDF

Info

Publication number
CN1965085A
CN1965085A CNA2005800186315A CN200580018631A CN1965085A CN 1965085 A CN1965085 A CN 1965085A CN A2005800186315 A CNA2005800186315 A CN A2005800186315A CN 200580018631 A CN200580018631 A CN 200580018631A CN 1965085 A CN1965085 A CN 1965085A
Authority
CN
China
Prior art keywords
cell
seq
yusz
yusx
bacillus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800186315A
Other languages
English (en)
Inventor
阿伦·K·尼尔森
迈克尔·D·拉斯马森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN1965085A publication Critical patent/CN1965085A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及一种突变的原核细胞,其与其它的等基因但未突变的细胞相比,能分泌较高量的至少一种目标异源多肽,并降低了YusZ或YusX,或其同源物的表达水平,以及构建上述细胞和使用上述细胞生产多肽的方法。

Description

具有高分泌水平的突变的原核细胞
发明领域:
本发明涉及突变的原核细胞,其与其它的等基因(isogenic)但未突变的细胞相比,能够分泌较高量的至少一种目标异源多肽,同时降低了YusZ或YusX,或其同源物的表达水平,和构建上述细胞和应用上述细胞生产多肽的方法。
技术背景:
yusZ和yusX的DNA序列在1993年首次报道,但仅作为推定的开放阅读框被报道(Chen等,1993,Metalloregulation in Bacillus subtilis:isolation andcharacterization of two genes difierentially repressed by metal ions,J Bact175(17):5428-5437)。
在以后的文献中,人们推测yusX和紧邻yusX上游的被称作yusY的开放阅读框可能是由于单yusXY基因的移码突变造成的。然而,该文献的作者没有进行进一步的研究,同时得出结论认为上述基因在细胞中的功能仍然是未知的(Kanamaru等,2002,Overexpression of the PepF OligopeptidaseInhibits Sporulation Initiation in Bacillus Subtillis,J Bact 184(1):43-50)。
定义:
在本发明中使用了本技术领域常规的分子生物学、微生物学和重组DNA技术。这些技术在文献中有详细的解释。如参见,Sambrook、Fritsch和Maniatis,Molecular Cloning:A Laboratory Manual,第二版(1989),ColdSpring Harbor Laboratory Press,Cold Spring Harbor,New York(在此被称为“Sambrook等,1998”);DNA Cloning:A Practical Approach,第I卷和第II卷(D.N.Glover编著,1985);Oligonucleotide Synthesis(M.J.Gait编著,1984);Nucleic Acid Hybridization(B.D.Hames和S.J.Higgins编著,(1985));Transcription And Translation(B.D.Hames和S.J.Higgins编著,(1984));Animal Cell Culture(R.I.Freshney编著,(1986));Immobilized Cells AndEnzymes(IRL Press,(1986));B.Perbal,A Pracctical Guide To MolecularCloning(1984)。
术语“多核苷酸“是指单链的或双链的脱氧核糖核苷酸或核糖核苷酸碱基的聚合体,从5’端到3’端阅读。多核苷酸包括RNA和DNA,可以是从自然界分离的、在体外合成的、或者是将天然的和合成的分子进行组合而制备的。
术语“核酸分子”或“核苷酸序列”是指单链形式的或双链螺旋形式的核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)的磷酸酯聚合体。可能是双链的DNA-DNA、DNA-RNA和RNA-RNA螺旋。术语核酸分子,尤其DNA或RNA分子,仅指分子的一级结构和二级结构,并不将其限定于任何具体的三级或四级形式。因此,上述术语包括存在于线性或环状的DNA分子(如限制性片段)、质粒和染色体及他处的双链DNA。在描述特定的双链DNA分子的结构时,本发明根据通常的惯例仅给出沿着DNA非转录链(即与mRNA序列同源的链)从5’到3’方向的序列。“重组DNA分子”是指经过分子生物学操作的DNA分子。
核酸分子与另外一个核酸分子,如cDNA、基因组DNA、或RNA是“可杂交的(hybridizable)”,如果单链形式的核酸分子在适当的温度和溶液离子强度条件下能够与另外一个核酸分子退火(参见Sambtook等,如前所述)。温度和离子强度条件决定着杂交的“严紧度(stringency)”。
在本发明中,杂交意味着所述核苷酸序列与标记的多核苷酸探针杂交,其中所述标记的多核苷酸探针与SEQ ID NO:1、SEQ ID NO:3、或SEQ IDNO:5所示的核苷酸序列在非常低到非常高的严紧条件下杂交。在上述条件下与所述多核苷酸探针杂交的分子,可以使用X-射线胶片或通过任何其它本领域已知的方法进行检测。在本上下文中当使用的术语“多核苷酸探针”时,可理解为所述探针包含至少15个核苷酸。
在一个感兴趣的实施方式中,所述多核苷酸探针是SEQ ID NO:1、SEQID NO:3、或SEQ ID NO:5的至少15个核苷酸的片段的互补链。在另外一个感兴趣的实施方式中,所述多核苷酸探针是编码SEQ ID NO:2、SEQ IDNO:4、或SEQ ID NO:6多肽的任意核苷酸序列的互补链的具有至少15个核苷酸的片段。在又一个感兴趣的实施方式中,所述多核苷酸探针是SEQ IDNO:1、SEQ ID NO:3、或SEQ ID NO:5的互补链。在又一个感兴趣的实施方式中,所述多核苷酸探针是SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5的成熟多肽编码区的互补链。
对于长度为至少100个核苷酸的长探针来说,非常低到非常高的严紧条件定义为按照标准的Southern印迹分析程序,在如下条件下进行的预杂交和杂交:42℃、5X SSPE、0.1%SDS、5X Denhardt’s溶液、100微克/ml经过剪切和变性的鲑精DNA。优选地,所述至少100个核苷酸的长探针包含不超过1000个核苷酸。对于长度为至少100个核苷酸的长探针来说,载体材料最后用2x SSC、1%SDS在42℃(非常低的严紧条件)下洗涤三次,每次15分钟,优选用0.5x SSC、0.1%SDS在42℃(低度严紧条件)下洗涤三次,每次15分钟,更优选用0.2x SSC、0.1%SDS在42℃(中度严紧条件)下洗涤三次,每次15分钟,还更优选用0.2x SSC、0.1%SDS在55℃(中高度严紧条件)下洗涤三次,每次15分钟,最优选用0.1x SSC、0.1%SDS在60℃(高度严紧条件)下洗涤三次,每次15分钟,尤其是用0.1x SSC、0.1%SDS在68℃(非常高的严紧条件)下洗涤三次,每次15分钟。
虽然不是特别优选的,但预期也可以使用较短的探针,如长度从约15到99个核苷酸的探针,如长度从约15到约70个核苷酸的探针。对于上述短探针来说,严紧条件定义为根据标准的Southern印迹分析程序,在如下条件下进行预杂交、杂交和杂交后洗涤:比根据Bolton和McCarthy所描述的计算方法(1962,Proceedings of the National Academy of Sciences USA48:1390)计算的Tm值低5℃-10℃的温度下,在0.9M NaCl、0.09MTris-HCl pH7.6、6mM EDTA、0.5%NP-40、1x Denhardt’s溶液、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP、和0.2mg/ml酵母RNA。
对于长度为约15个核苷酸到99个核苷酸的短探针来说,将载体材料在低于所计算出的Tm值5℃-10℃的温度下用6x SCC加0.1%SDS洗涤一次,15分钟,然后用6x SSC洗涤两次,每次15分钟。
DNA“编码序列”或“开放阅读框(ORF)”是指当置于合适的调控序列控制之下时,在体内或体外细胞中转录并翻译成多肽的双链DNA序列。编码序列的边界由位于5’(氨基)末端的起始密码子和位于3’(羧基)末端的翻译终止密码子确定。编码序列包括但不限于,原核序列、来自真核mRNA的cDNA、来自真核(如哺乳动物)DNA的基因组DNA序列、和甚至合成的DNA序列。如果想要在真核细胞中表达编码序列,则通常将聚腺苷酸化信号和转录终止序列置于编码序列的3’端。
表达载体是一种DNA分子,有线性的和环状的,其包含编码目标多肽的片段,其可操作地连接于为其转录提供的其它片段。所述其它片段可包括启动子和终止子序列,和任选的一个或多个复制起点、一个或多个选择标记、增强子、聚腺苷酸化信号等。表达载体通常衍生自质粒或病毒DNA,或者可包含两者的元件。
转录和翻译调控序列是DNA调控序列,如启动子、增强子、终止子等,其提供编码序列在宿主细胞中的表达。在真核细胞中,聚腺苷酸化信号是控制序列。
“分泌信号序列”是编码如下多肽(“分泌肽(secretory peptide)”)的DNA序列,其作为大型多肽(larger peptide)的一部分,指导大型多肽通过细胞的分泌途径而分泌,在所述细胞中合成该大型多肽。所述大型多肽通常在经过分泌途径的过程中被切割以去除上述分泌肽。
本发明中使用的术语“启动子”具有本领域公认的含义,其表示包含用于结合RNA聚合酶并启动转录的DNA序列的基因部分。启动子序列通常(但不总是)位于基因的5’非编码区。
如果一种染色体基因所编码的多肽不再以功能性形式被表达,则将上述染色体基因成为非功能性的。此基因的非功能性可以通过多种本领域已知的基因操作来诱导,Sambrook等(见上文)描述了其中一些基因操作方法。基因的ORF的部分缺失通常会使基因成为非功能性的,突变也是如此。
本发明中使用的术语“染色体基因的可表达拷贝”是指染色体基因的ORF拷贝,其中所述ORF可表达以产生完全功能性基因产物。可表达拷贝可以不由染色体基因的天然启动子转录,其可改为由外源或异源启动子转录,或者其可根本没有启动子,仅通过存在于ORF5’端上游的基因的转录通读(transcriptional read-through)而表达。在本文中,转录通读的含义与本领域通常所公认的含义相同。
“可操作连接的”,当指DNA片段时,表示将片段进行排列以使它们能够共同发挥功能以实现预期目的,例如从启动子开始转录,经过编码片段直至终止子。
当RNA聚合酶将编码序列转录成mRNA,然后所述mRNA经过反式RNA剪接(trans-RNA spliced)并被翻译为由所述编码序列编码的蛋白时,则称编码序列在细胞中的转录和翻译控制序列的“控制之下”。
“异源”DNA是指不是天然位于细胞中或所述细胞的染色体位点中的DNA。优选的,异源DNA包括对所述细胞来说是外源的基因。
本发明中使用的术语“核酸构建体”是指cDNA、基因组DNA、合成DNA或RNA来源的任意的核酸分子。术语“构建体”是指核酸片段,其可以是单链的或双链的,并可基于编码目标多肽的全部或部分天然存在的核苷酸序列。构建体可选择地包含其它核酸片段。
本发明的编码本发明多肽的核酸构建体可合适地为基因组或cDNA来源,例如通过制备基因组或cDNA文库,并使用合成寡核苷酸探针根据标准技术(参见上文Sambrook等),通过杂交筛选出编码全部或部分多肽的DNA序列所得到的。
本发明编码多肽的核酸构建体还可以通过已经建立的标准方法进行合成制备,例如,Beaucage和Caruthers描述的亚磷酰胺(phosphoamidite)方法(Tetrahedron Letters 22(1981),1859-1869),或者Mattes等描述的方法(EMBO Journal 3(1984),801-805)。按照亚磷酰胺方法,例如在DNA自动合成仪中合成寡核苷酸,然后经过纯化、退火、连接,并克隆到合适的载体中。
此外,核酸构建体可以是混合的合成和基因组来源的、混合的合成和cDNA来源的、或者混合的基因组和cDNA来源的,其按照标准技术通过连接合成的、基因组或cDNA来源(如适当的)的片段来制备,其中上述片段对应于完整核酸构建体的各个部分。还可以使用特异性引物通过聚合酶链式反应来制备核酸构建体,例如US4,683,202或Saiki等(Science239(1988),487-491)所描述的。
术语核酸构建体,当其包含对于本发明编码序列的表达来说是必需的控制序列时,其与术语“表达盒”是同义的。
在本发明中,术语“控制序列”包括对于核酸序列的编码序列的表达来说是必需的或有利的所有组分。每个控制序列可为对于编码多肽的核酸序列来说是天然的或是异源的。这样的控制序列包括但不限于,前导序列、聚腺苷酸化序列、前肽序列、启动子、信号序列、和转录终止子。控制序列最低限度包括启动子,和转录及翻译终止信号。为了导入特异限制性位点,以便于将控制序列与编码多肽的核酸序列编码区连接到一起,可以为控制序列提供一段接头。
控制序列可以是合适的启动子序列,即被宿主细胞识别以表达核酸序列的核酸序列。启动子序列包含介导多肽表达的转录和翻译调控序列。启动子可以是任意在优选宿主细胞中显示转录活性的核酸序列,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。
控制序列还可以是合适的转录终止子序列,即能够被宿主细胞识别以终止转录的序列。终止子序列可操作地连接到编码多肽的核酸序列的3’末端。在优选宿主细胞中具有功能的任意终止子,可以在本发明中使用。
控制序列还可以是聚腺苷酸化序列,即可操作地连接到核酸序列的3’末端,并且当转录时,作为一种向所转录的mRNA上添加聚腺苷残基的信号而被宿主细胞识别的序列。在优选宿主细胞中具有功能的任意聚腺苷酸化序列,均可以在本发明中使用。
控制序列还可以是信号肽编码区,其所编码的氨基酸序列连接在多肽的氨基末端,所述多肽能够将表达的多肽导入宿主细胞的细胞分泌途径。核酸序列的编码序列的5’端可以固有包含信号肽编码区,其在翻译阅读框中与编码分泌性多肽的编码区片段天然相连。可选择地,编码序列的5’端可以包含对于编码分泌的多肽的编码序列部分来说是外源的信号肽编码区。在编码序列不固有地包含信号肽编码区的情况下,需要外源信号肽编码区。可选择地,外源信号肽编码区可简单地替代天然的信号肽编码区,以获得相对于通常与编码序列连接的天然的信号肽编码区来说增强的胞外蛋白的分泌。信号肽编码区可获自曲霉属(Aspergillus)菌种的葡糖淀粉酶或淀粉酶基因、根毛霉属(Rhizomucor)菌种的脂肪酶或蛋白酶基因、酿酒酵母(Saccharomyces cerevisiae)的α-因子基因、芽孢杆菌属(Bacillus)菌种的淀粉酶或蛋白酶基因、或小牛前凝乳酶原(preprochymosin)基因。然而,能够将表达的多肽导入优选宿主细胞的分泌途径的任意信号肽编码区,均可以在本发明中使用。
控制序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得到的多肽称为酶原(proenzyme)或多肽原(propolypeptide)(某些情况中称作酶原(zymogen))。多肽原通常是无活性的,并通过催化或自主催化从多肽原中切割前肽,从而将多肽原转化为成熟的活性多肽。前肽编码区可获自枯草芽孢杆菌碱性蛋白酶基因(aprE)、枯草芽孢杆菌中性蛋白酶基因(nprT)、酿酒酵母α-因子基因、或嗜热毁丝酶(Myceliophthorathermophilum)漆酶基因(WO95/33836)。
另外还预期添加调控序列,其允许相对于宿主细胞的生长调控多肽的表达。调控系统的实例是那些使基因的表达响应于化学或物理的刺激,包括调控化合物的存在,而打开或关闭的系统。原核系统中的调控系统包括lac、tac、和trp操作子系统。
指导本发明基因转录(尤其是在细菌宿主细胞中转录)的合适启动子的实例是获自大肠杆菌(E.coli)lac操作子、天蓝色链霉菌(Streptomycescoelicolor)琼脂水解酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶(levansucrase)基因(sacB)、枯草芽孢杆菌碱性蛋白酶基因、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、解淀粉芽孢杆菌BAN淀粉酶基因、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、和原核β-内酰胺酶(Villa-Kamaroff等,1978,Proceedings of the National Academy ofSciences USA75:3727-3731)、以及tac启动子(DeBoer等,1983,Proceedingsof the National Academy of Sciences USA80:21-25)的启动子。其它的启动子在“Useful proteins from recombinant bacteria”,Scientific American,1980,242:74-94;以及上文所提及的Sambrook等,1989的文献中描述。
在细菌宿主细胞中有效的信号肽编码区是获自芽孢杆菌NCIB11837的产麦芽糖淀粉酶基因、嗜热脂肪芽孢杆菌α-淀粉酶基因、地衣芽孢杆菌枯草杆菌蛋白酶基因、地衣芽孢杆菌β-内酰胺酶基因、嗜热脂肪芽孢杆菌中性蛋白酶基因(nprT、nprS、nprM)、和枯草芽孢杆菌PrsA基因的信号肽编码区。其它的信号肽在Simonen和Palva,1993,Microbiological Reviews57:109-137中描述。
本发明还涉及包含本发明核酸序列、启动子和转录及翻译终止信号的重组表达载体。还可以将上文所述的各种核酸和控制序列连接在一起,以产生重组表达载体,该重组表达载体可包括一个或多个方便的限制性位点以使编码多肽的核酸序列在所述位点进行插入或取代。可选择地,本发明的核酸序列可以通过将包含所述序列的核酸序列或核酸构建体插入到合适的载体而进行表达。在构建表达载体时,所述编码序列在载体中的位置使得所述编码序列可操作地与合适的控制序列连接用于进行表达和可能的分泌。
重组表达载体可以是任意可方便地接受重组DNA操作,并且能够使所述核酸序列表达的载体(如质粒或病毒)。载体的选择将通常取决于载体与其将要导入的宿主细胞的兼容性。载体可以是线性或者闭环形质粒。载体可以是自主复制载体,即作为存在于染色体外的实体存在的其复制不依赖于染色体复制的载体,如质粒、染色体外元件、微型染色体、或人工染色体。载体可包含任意确保自主复制的工具。可选择地,载体可以是如下的载体,当导入宿主细胞时,其被整合到基因组,然后与所整合的染色体一起复制。载体系统可以是单个载体或质粒,或两个或多个载体或质粒,其共同含有将被导入宿主细胞的基因组的总DNA,或转座子。
本发明的载体优选包含一个或多个选择标记,其允许容易地选择转化细胞。选择标记可以是这样的基因,其表达产物提供抗微生物剂抗性或病毒抗性、对于重金属的抗性、原养型到营养缺陷型等。
抗生素选择标记赋予了对一些抗生素的抗生素抗性,如氨苄青霉素、卡那霉素、氯霉素、四环素、新霉素、潮霉素、或氨甲蝶呤。对于酵母宿主细胞来说,合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。
本发明的载体优选包含使载体、或载体的较小部分稳定整合到宿主细胞基因组,或使载体在宿主细胞中不依赖于细胞基因组而自主复制的元件。
载体、或载体的较小部分,如本发明的扩增单元,当导入宿主细胞时,可以整合到宿主细胞基因组。对于染色体整合,载体可依赖于载体中编码多肽的核酸序列,或载体的任何其它元件,用于通过同源或非同源重组将载体稳定整合到基因组。
可选择地,载体可包含额外的核酸序列,其用于指导通过同源重组整合到宿主细胞基因组中。所述额外的核酸序列能够使载体精确整合到宿主细胞基因组染色体的准确位置。为了提高在精确位置整合的可能性,整合元件应优选包含足够数目的核酸,如100至1,500个碱基对,优选400至1,500个碱基对,并最优选800至1,500个碱基对,其与相应的靶序列高度同源以增强同源重组的可能性。整合元件可以是任意的与宿主细胞基因组中的靶序列同源的序列。此外,整合元件可以是非编码或编码核酸序列;适于通过同源重组而进行位点特异性整合的编码序列的具体实例在WO02/00907(Novozymes,Denmark)中给出,其全文并入本文作为参考。
另一方面,可将载体通过非同源重组而整合到宿主细胞基因组。这样的核酸序列可以是任意的与宿主细胞基因组中的靶序列同源的序列,而且,此外,可以是非编码或编码序列。载体、表达盒、扩增单元、基因或实际上任何确定的核苷酸序列的拷贝数是指在任一时刻存在于宿主细胞中的相同拷贝的数目。基因或另一确定的染色体核苷酸序列可以在染色体上存在一个、两个或多个拷贝。自主复制载体可以在每个宿主细胞中存在一个、或几百个拷贝。
本发明的扩增单元是指这样的核苷酸序列,其能够整合到宿主细胞染色体,并且其可以在宿主细胞中通过倍增复制来提高整合到染色体上的拷贝的数目。上述单元包含本文所定义的表达盒,所述表达盒包含至少一个目标基因的拷贝和如本文中所定义的宿主细胞染色体基因的可表达拷贝。当扩增单元被整合到宿主细胞染色体时,其被定义为染色体的一个特殊区域,其易于通过两个DNA直接重复区域之间的同源重组而得到复制。因此扩增单元相对于两侧的DNA的精确边界是功能性地定义的,因为复制过程可能实际上复制部分导入染色体的DNA以及部分它本身的内源染色体,这取决于重复区域内的准确重组位点。上述原理在Janniére等的文献中(1985,Stable gene amplification in the chromosome of Bacillus subtilis.Gene,40:47-55)阐明,该文献并入本文作为参考。
对于自主复制,载体可进一步包含能够使其在所述宿主细胞中自主复制的复制起点。细菌复制起点的实例是质粒pBR322、pUC19、pACYC177、pACYC184、pUB110、pE194、pTA1060和pAMbetal的复制起点。在酵母宿主细胞中使用的复制起点的实例是2微米复制起点,CEN6和ARS4的组合,和CEN3和ARS1的组合。复制起点可以是带有突变的复制起点,其中所述突变使其在宿主细胞中以温度敏感的(temperature sensitive)方式起作用(参见如Ehrlich,1978,Proceedings of the National Academy of SciencesUSA75:1433)。
本发明还涉及包含本发明核酸序列的重组宿主细胞,其有利地用于多肽的重组生产。术语“宿主细胞”包含任何在复制过程中由于发生突变而不同于亲代细胞的子代。
所述细胞优选用包含本发明的核酸序列的载体转化,然后将该载体整合到宿主染色体中。“转化”是指将包含本发明核酸序列的载体导入宿主细胞,使载体作为染色体整合子(chromosomal integrant)或者作为自我复制的染色体外载体而被保持。通常,整合被认为是有利的,因为这样核酸序列更有可能稳定地保持在所述细胞中。可以通过如上所述的同源或非同源重组使所述载体整合到宿主染色体中。
细菌宿主细胞的转化,可以通过例如下述的方式实现:原生质体转化(参见如Chang和Cohen,1979,Molecular General Genetics 168:111-115)、使用感受态细胞(参见如Young和Spizizin,1961,Journal of Bacteriology81:823-829,或Dubnar和Davidoff-Abelson,1971,Journal of MolecularBiology 56:209-221)、电穿孔(参见如Shigekawa和Dower,1988,Biotechniques 6:742-751)、或接合(conjugation)(参见如Koehler和Thorne,1987,Journal of Bacteriology 169:5771-5278)。
将上述转化的或转染的宿主细胞在合适的营养培养基中在能使目标多肽表达的条件下进行培养,之后从细胞或培养液中回收产生的多肽。
用于培养细胞的培养基可以是任意的适用于培养所述宿主细胞的常规培养基,如基本培养基或包含合适添加物的复合培养基。合适的培养基可由供应商获得,或可以根据公开的配方(如美国典型培养物保藏中心(American Type Culture Collection)的目录)制备。使用本领域已知的方法制备上述培养基(细菌和酵母的参考文献,参见如Bennett,J.W.和LaSure,L.编辑的More Gene Manipulations in Fungi,Academic Press,CA,1991)。
通过常规方法从培养基中回收多肽,所述常规方法包括通过离心或过滤从培养基中分离出宿主细胞,使用盐如硫酸铵沉淀所述上清液或滤液中的蛋白质成分,通过各种层析方法,如离子交换层析、凝胶过滤层析、亲和层析等进行纯化,使用何种层析方法这依赖于所纯化多肽的类型。
可以使用本领域已知的对所述多肽具有特异性的方法来检测所述多肽。这样的检测方法可包括使用特异性抗体、生成酶产物、或酶底物的消失。例如,可以使用酶活性测定来检测多肽的活性。
可以通过本领域已知的多种方法来纯化本发明的多肽,所述方法包括但不限于,层析(如离子交换层析、亲和层析、疏水层析、层析聚焦和大小排阻层析)、电泳方法(如制备型等电聚焦(IEF)、溶解度差异(如硫酸铵沉淀法)、或提取(参见如Protein Purification,J.-C.Janson和Lars Ryden编辑,VCH Publishers,New York,1989)。
在本上下文中,术语“基本上(substantially)纯的多肽”是指这样的多肽制剂,其包含至多10重量%的与所述多肽天然结合的其它多肽物质(优选其它多肽物质的百分率较低,如至多8重量%,至多6重量%,至多5重量%,至多4重量%,至多3重量%,至多2重量%,至多1重量%,和至多重量%)。因此,优选基本上纯的多肽的纯度为至少92%,即所述多肽占制剂中存在的总多肽物质的至少92重量%,并优选更高的百分率,如至少94%的纯度,至少95%的纯度,至少96%的纯度,至少96%的纯度,至少97%的纯度,至少98%的纯度,至少99%的纯度,和最多99.5%的纯度。本发明所公开的多肽优选是基本纯的形式。具体地,优选本发明公开的多肽是“基本上(essentially)纯的形式”,即,多肽制剂基本上不含其它与其天然结合的多肽物质。这可以通过例如利用公知的重组方法来制备所述多肽而实现。在本文中,术语“基本纯的多肽”与术语“分离的多肽”和“分离形式的多肽”是同义的。
在本上下文中,两个氨基酸序列或者两个核苷酸序列之间的同源性用参数“同一性”来描述。为了本发明的目的,可以使用完全Smith-Waterman比对法来进行序列比对和计算同源性得分,完全Smith-Waterman比对法对蛋白和DNA比对均适用。对蛋白和DNA比对,分别使用缺省计分矩阵BLOSUM50和同一性矩阵。对于缺口中的第一个残基,蛋白的罚分是-12,DNA的罚分是-16,而对于缺口中的其它残基,蛋白的罚分是-2,DNA的罚分是-4。可以使用FASTA包v20u6版本来进行比对(W.R.Pearson和D.J.Lipman(1988),“Improved Tools for Biological Sequence Analysis”,PNAS85:2444-2448,和W.R.Pearson(1990),“Rapid and Sensitive SequenceComparison with FASTP and FASTA”,Methods in Enzymology,183:63-98)。
进行蛋白序列的多重比对可以使用“ClustalW”(Thompson,J.D.,Higgins,D.G.和Gibson,T.J.(1994)CLUSTAL W:improving the sensitivity ofprogressive multiple sequence alignment through sequence weighting,positions-specific gap penalties and weight matrix choice.Nucleic AcidsResearch,22:4673-4680)。DNA序列的多重比对可以使用蛋白比对作为模板,将其中的氨基酸用DNA序列相应的密码子代替。
在本上下文中,YusZ或YusX蛋白的功能同源物是指这样的蛋白,当其在细胞中降低表达水平时,使异源多肽(优选一种酶,如α-淀粉酶)的分泌与正常表达YusZ或YusX功能同源物的等基因细胞相比增加,其都是在基本上相同的条件下进行培养的。此外,当如上文所述进行比对时,YusZ或YusX蛋白的功能同源物分别与YusZ或YusX蛋白具有至少50%,优选55%、60%、65%、70%、75%、80%、85%、90%、95%、97%,或最优选99%的氨基酸序列同一性。
在本上下文中,术语“等位基因变体”表示占据同一染色体基因座的两个或多个基因可选形式中的任一个。等位基因变体可以通过突变自然出现,同时可能在群体中形成多态性。基因突变可以是沉默的(即所编码的多肽没有发生变化),或者可编码氨基酸序列发生变化的多肽。多肽的等位变体是指由基因的等位基因变体编码的多肽。本文所定义的功能同源物包括等位基因变体。
YusZ或YusX蛋白或其功能同源物可以是从自然界分离并鉴定的野生型的蛋白。上述野生型蛋白可以通过本领域标准技术进行特定筛选。此外,编码YusZ或YusX蛋白或其功能同源物的基因,可以通过DNA改组技术来制备,如在J.E.Ness等Nature Biotechnology17:893-896(1999)中所描述的。另外,YusZ或YusX蛋白或其功能同源物可以是人工变体。所述人工变体可以通过本领域已知的标准技术,如通过定点/随机诱变来构建。在本发明的一个实施方式中,氨基酸的改变(在人工变体以及野生型多肽中)是较少天然的,其为不明显影响蛋白的折叠和/或活性的保守性氨基酸取代;小缺失,通常为一个到大约30个氨基酸的缺失;小氨基或羧基末端延伸,如氨基末端的甲硫氨酸残基;小接头肽,多至大约20-25个残基;或小延伸,其通过改变净电荷或其它功能而有利于纯化,如多组氨酸束(poly-histidine tract)、抗原表位或结合域。
保守取代的实例是在碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸)、芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸、丝氨酸和苏氨酸)的组内的氨基酸取代。通常不改变比活性(specific activity)的氨基酸取代在本领域是已知的,并例如在H.Neurath和R.L.Hill,1979,The Proteins,Academic Press,New York中描述。最经常发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly以及它们的反向交换。
对于本领域技术人员显而易见的是,上述修饰可以发生在分子功能关键区的外面,从而使多肽仍然保持其活性。因此,对于本发明核苷酸序列所编码多肽的活性必需的氨基酸残基,并由此优选不进行修饰,如取代,可以根据本领域已知的方法,如定点诱变或丙氨酸扫描诱变(alanine scanningmutagenesis)(参见如Cunningham和Wells,1989,Science 244:1081-1085)来鉴定。在后一项技术中,在分子中的每个带正电荷的残基导入突变,并测试所得到的突变分子的活性,以鉴定出对于分子的活性来说必需的氨基酸残基。还可以通过三维结构分析技术来测定底物-酶相互作用的位点,如通过如核磁共振分析、晶体学或光亲和标记(参见如Vos等,1992,Science255:306-312;Smith等,1992,Journal of Molecular Biology 224:899-904;Wlodaver等,1992,FEBS Letters 309:59-64)的技术所测定的。
此外,可以通过导入核苷酸取代来修饰编码本发明多肽的核苷酸序列,其中上述核苷酸取代不造成由核苷酸序列编码的多肽的氨基酸序列的改变,但其相应于用来生产酶的宿主生物的密码子使用特征(codon usage)。
向核苷酸序列中导入突变,使其中一个核苷酸交换为另外一个核苷酸,可以使用本领域已知的任意方法通过定点诱变而实现。特别有用的方法是,使用带有目标插入物的超螺旋双链DNA载体,和两条包含所需突变的合成引物。每条互补于载体的相反链的寡核苷酸引物在使用Pfu DNA聚合酶的温度循环过程中进行延伸。由于引物的掺入,生成含有交错切口的突变质粒。在进行完温度循环之后,将产物用DpnI进行处理,其中Dpnl特异于甲基化和半甲基化的DNA,以将亲代DNA模板消化并选择出含有突变的合成DNA。还可以使用本领域已知的其它方法。关于核苷酸取代的一般性描述参见如Ford等,1991,Protein Expression and Purification 2:95-107。
附图:
附图1显示如下文实施例7所描述的染色的或标记的聚丙烯酰胺凝胶电泳(PAGE)的凝胶。通过PAGE,检测了来自yusZ-缺失菌株(ANaprH-b)的四份独立分离物的蛋白酶产量(附图1,1-4号),并与来自其它等基因对照菌株(ANaprH)的四份独立分离物的蛋白酶产量进行了比较,PAGE凝胶上标记的蛋白酶条带的浓度的差异清楚地显示yusZ-缺失菌株(ANaprH-b)比相应的参考菌株(ANaprH)产生了更多的蛋白酶。
发明概述:
枯草芽孢杆菌yusZ的DNA序列显示在SEQ ID NO:1中,推定的编码氨基酸序列显示在SEQ ID NO:2中,枯草芽孢杆菌yusX的DNA序列显示在SEQ ID NO:3中,推定的编码氨基酸序列显示在SEQ ID NO:4中;枯草芽孢杆菌yusY的DNA序列显示在SEQ ID NO:5中,推定的编码氨基酸序列显示在SEQ ID NO:6中。地衣芽孢杆菌yusZ的DNA编码序列显示在SEQ IDNO:24中,推定的编码氨基酸序列显示在SEQ ID NO:25中。
本发明所要解决的问题是如何提高在原核细胞中生产的异源多肽的分泌。本发明提供了突变的原核细胞,其与各自相应的其它等基因但未突变的细胞相比,降低了YusZ(SEQ ID NO’s:2或25)、YusX(SEQ ID NO:4)、或其同源物的表达水平,并分泌较高量的至少一种目标异源多肽。通常,在相同的生长条件下,将本发明的突变细胞与未突变的亲本细胞相比,其中所述突变体来源于未突变的亲本细胞;除了导致YusZ或YusX表达水平降低的突变外,亲本细胞与突变细胞是完全等基因的。本发明人发现在原核宿主细胞中降低YusZ或YusX的表达水平能够提高分泌的异源多肽的产量。此结果对于工业化生产分泌的多肽例如酶是非常令人感兴趣的。
因此,在第一个方面中,本发明涉及一种突变的原核细胞,其与其它等基因但未突变的细胞相比,降低了YusZ(SEQ ID NO’s:2或25)、YusX(SEQID NO:4)、或其同源物的表达水平,并分泌较高量的至少一种目标异源多肽。
在第二个方面中,本发明涉及构建突变的原核细胞的方法,所述方法包含如下步骤:
a)对原核细胞进行突变;和
b)筛选那些与其它等基因但未突变的细胞相比,降低了YusZ(SEQ IDNO’s:2或25)或YusX(SEQ ID NO:4)、或其同源物的表达水平,并分泌较高量的至少一种目标异源多肽的突变细胞。
本发明的最后一个方面涉及生产目标多肽的方法,所述方法包含如下步骤:
a)培养突变的原核细胞,其与其它的等基因但未突变的细胞相比,降低了YusZ(SEQ ID NO’s:2或25)、YusX(SEQ ID NO:4)、或其同源物表达水平,并分泌较高量的目标多肽;和
b)分离目标多肽。
发明详述:
本发明的第一方面涉及一种突变的原核细胞,其与其它等基因但未突变的细胞相比,降低了YusZ(SEQ ID NO’s:2或25)、YusX(SEQ ID NO:4)、或其同源物的表达水平,并分泌较高量的至少一种目标异源多肽。
本发明优选的实施方式涉及第一方面的细胞,其是革兰氏阳性细胞,优选是芽孢杆菌属细胞,更优选是嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌(B.amyloliquefaciens)、短芽孢杆菌(B.brevis)、环状芽孢杆菌(B.circulans)、B.clausii、凝结芽孢杆菌(B.coagulans)、灿烂芽孢杆菌(B.lautus)、迟缓芽孢杆菌(B.lentus)、地衣芽孢杆菌(B.licheniformis)、巨大芽孢杆菌(B.megaterium)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、枯草芽孢杆菌(B.subtilis)、或苏云金芽孢杆菌(B.thuringiensis)细胞;或涉及第二或第三方面的方法,其中所述细胞如上所列。
在本文中,YusZ或YusX蛋白的进化同源物(evolutionary homologue)、等位基因变体、人工变体、改组蛋白、种间变体(species variant)等等,均被称作YusZ或YusX蛋白或“功能同源物”(functional homologue),并且本发明人预期在本发明的细胞和方法中降低上述功能同源物蛋白的表达将同等有效。
特别地,优选的实施方式涉及如下的细胞,其中YusZ或YusX蛋白或其功能同源物包含分别与SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列具有至少70%同一性的氨基酸序列;优选分别与SEQ ID NO:2或SEQ IDNO:4所示氨基酸序列具有至少75%、80%、85%、90%、95%、97%、或甚至99%的同一性的氨基酸序列。
另一个优选实施方式涉及本发明的细胞、或本发明的方法,其中的YusZ或YusX蛋白或其功能同源物包含或分别由SEQ ID NO:2或SEQ ID NO:4所示的氨基酸序列组成。
基于yusX和yusY基因在操纵子中的结构(organisation),降低YusX的表达可以通过突变上述编码基因,或通过突变操纵子紧邻上游的开放阅读框即yusY来实现。
相应地,在本发明的优选实施方式中,降低YusZ或YusX或其同源物的表达是通过突变一个或多个相对应的编码基因来实现的,本发明的细胞优选在yusZ(SEQ ID NOs:1或24)、yusX(SEQ ID NO:3)、和/或yusY(SEQID NO:5)、或其同源物中突变;而且优选地,所述yusZ、yusX、和/或yusY的同源物编码具有分别与SEQ ID NOs:2或25、SEQ ID NO:4、或SEQ IDNO:6所示序列具有至少70%同一性;或者优选分别与SEQ ID NOs:2、SEQID NO:4、或SEQ ID NO:6所示氨基酸序列具有至少75%、80%、85%、90%、95%、97%、或甚至99%的同一性的氨基酸序列的多肽;最优选地,所述yusZ、yusX、和/或yusY的同源物具有分别与SEQ ID NO’s:1或24、SEQ ID NO:3、或SEQ ID NO:5所示序列具有至少70%同一性;或优选分别与SEQ ID NOs:1或24、SEQ ID NO:3、或SEQ ID NO:5所示序列具有至少75%、80%、85%、90%、95%、97%、或甚至99%的同一性的核苷酸序列。
如本文中的其他地方所述,在细胞中鉴定功能性yusZ、yusX或YusY基因的一种方法是通过杂交。因此,优选的实施方式涉及第一方面的细胞,或第二或第三方面的方法,其中所述细胞在至少一个多核苷酸突变,其中所述至少一个多核苷酸中的至少100bp大小的亚序列与具有SEQ ID NOs:1或24、SEQ ID NO:3、或SEQ ID NO:5所示序列或其各自的互补序列的多核苷酸在非常低到非常高严紧性杂交条件下,优选非常低、低、中度、中高、高度或非常高的严紧杂交条件下杂交。
本发明的细胞可以用任何合适的方式进行突变,而且进行上述诱变的方法在本领域是公知的。
本发明的优选实施方式涉及第一方面的细胞,其中的yusZ、yusX、和/或yusY,或其同源物从染色体中部分或全部缺失。
另外一个优选实施方式涉及如下的细胞,其中的yusZ、yusX、和/或yusY,或其同源物包含至少一个移码突变或无义突变。
本发明的突变细胞与其它的等基因但未突变的细胞如亲本细胞相比,降低了YusZ或YusX蛋白、或其功能类似物的表达水平。应通过如下来进行对比:在基本相同的条件下,培养本发明的细胞以及等基因但未突变的细胞,然后通过本领域任意标准方法比较YusZ或YusX蛋白的量。优选本发明的细胞比未突变细胞少产生至少5%的YusZ或YusX,更优选至少10%、还更优选至少20%、最优选至少50%的YusZ或YusX蛋白或其功能同源物。
在优选实施方式中,本发明的细胞与其它等基因但未突变的细胞相比,YusZ或YusX或其同源物的表达水平降低了至少两倍;优选所述细胞与其它等基因但未突变的细胞相比,检测不到YusZ或YusX或其同源物的表达。
正如本发明人在此所显示的,在基本相同的条件下培养时,第一方面的细胞比对应的等基因但未突变的细胞,分泌更大量的目标异源多肽。
因此,本发明的优选实施方式涉及第一方面的细胞,其比其它等基因但未突变的细胞分泌更大量的目标异源多肽。优选本发明的细胞比未突变细胞多分泌至少5%、更优选至少10%、还更优选至少20%、最优选至少50%。可以通过本领域任意合适的分析方法来检测由所述细胞分泌的异源多肽的量;在下文中显示了一个非限制性的检测α淀粉酶分泌量的实例。
在本发明优选的实施方式中,所述至少一种异源多肽包含酶,优选所述酶是裂合酶、连接酶、水解酶、氧化还原酶、转移酶或异构酶。
将编码异源多肽的多核苷酸的一个或多个拷贝稳定地整合到原核细胞的染色体的方法在本领域中被充分地描述,如WO94/14968、WO99/41358、WO91/09129、WO02/00907或WO01/90393,上述文献在此全部并入作为参考。
因此,在本发明优选实施方式中,所述细胞包含一个或多个染色体整合的编码所述至少一种异源多肽的多核苷酸的拷贝。
本领域技术人员非常清楚,在多肽的工业化生产中,提高编码目标多肽的多核苷酸的表达是有利的,而且增强启动子强度是提高表达的途径之一,这在本领域中是公知常识,参见WO99/43835、WO93/10249、WO98/07846、或WO03/008575,上述文献在此全文并入作为参考。
优选的实施方式涉及本发明的细胞,其中的所述至少一种异源多肽由从至少一个异源启动子转录的多核苷酸编码,优选所述至少一个启动子包含人工启动子,更优选所述人工启动子包含一个或多个mRNA稳定序列(mRNA stabilizing sequence),优选衍生自cryIIIa启动子。
实施例:
材料与方法:
菌株
枯草芽孢杆菌168,F.Kunst等,“The complete genome sequence of theGram-positive bacterium Bacillus subtilis”,Nature(1997)390:249-256。
枯草芽孢杆菌AN83,该菌株是携带质粒pKTH10的枯草芽孢杆菌168,其中所述质粒组成型地大量表达淀粉酶。
枯草芽孢杆菌AN133,该菌株是缺失yusZ基因的枯草芽孢杆菌168菌株。
枯草芽孢杆菌AN137,该菌株是携带质粒pKTH10的AN133,其中所述质粒组成型地大量表达淀粉酶。
枯草芽孢杆菌AN151,该菌株是缺失yusX基因的枯草芽孢杆菌168菌株。
枯草芽孢杆菌AN155,该菌株是携带质粒pKTH10的AN151,其中所述质粒组成型地大量表达淀粉酶。
地衣芽孢杆菌SJ1707,该菌株在美国专利No.5,698,415中描述。
地衣芽孢杆菌AN10R,该菌株是将SJ1707进行基因工程改造以过量表达来自Nocardiopsis prasina NRLL 18262(WO1988/003947)的蛋白酶10R。
地衣芽孢杆菌AN10R-b,该菌株是缺失yusZ基因的地衣芽孢杆菌AN10R菌株。
地衣芽孢杆菌ANaprH,该菌株是将SJ1707进行基因工程改造以过量表达来自Bacillus clausii的aprH碱性蛋白酶基因。
地衣芽孢杆菌ANaprH-b,该菌株是缺失yusZ基因的地衣芽孢杆菌ANaprH菌株。
枯草芽孢杆菌PP289-5,用于接合转移包含来自pUB110(在WO96/23073中描述)的oriT的质粒的供体菌株。
枯草芽孢杆菌AN220,该菌株是将枯草芽孢杆菌168进行基因工程改造以过量表达来自解淀粉芽孢杆菌的apr碱性蛋白酶基因。
枯草芽孢杆菌AN225,该菌株是缺失yusZ基因的AN220。
引物
yusZ1F(SEQ ID NO:7):ccttcccggggctaagcttttcggc
yusZ2R(SEQ ID NO:8):gatagactcccacgcgctggacgctcctgt
yusZ2F(SEQ ID NO:9):acaggagcgtccagcgcgtgggagtctatc
yusZ3R(SEQ ID NO:10):aacggtaccctgaccaagcagacag
yusX1F(SEQ ID NO:11):aatgcccgggcaagctttacagctg
yusX2R(SEQ ID NO:12):ggcgtcacgcacagcaacgagcgacgattg
yusX2F(SEQ ID NO:13):caatcgtcgctcgttgctgtgcgtgacgcc
yusX3R(SEQ ID NO:14):aatcggtaccatcataatgactgtc
yusZlich1F(SEQ ID NO:19):tcagcagcccgcggagcagccgttttaatggaacc
yusZlich2R(SEQ ID NO:20):atgaccgcacgttcccaaatgctcgtcgcgcccgttacaa
yusZlich3F(SEQ ID NO:21 ):ttgtaacgggcgcgacgagcatttgggaacgtgcggtcat
yusZlich4R(SEQ ID NO:22):gcggatttgacgtcaatcgcttaccagtgcggaaac
质粒
pKTH10:Vehmaanpera J,Steinborn G,Hofemeister J.,“Genetic manipulationofBacillus amyloliquefaciens.”,J Biotechnol,1990-07,19(2-3):221-40。该质粒组成型表达解淀粉芽孢杆菌α-淀粉酶(AmyQ)。
pSJ6410:质粒pSJ2739(在美国专利6,100,063中描述)的衍生质粒,pSJ2739又是衍生自pE194,在复制上属于天然温度敏感型。PSJ6410由pE194复制子、以及衍生自质粒pUB110的片段、和地衣芽孢杆菌α-淀粉酶基因、以及在该基因前面的来自苏云金芽孢杆菌cryIIIA调控区的片段组成。这些额外的片段对于使用pSJ6410在本发明中作为载体是不相关的。
pAN28:通过将用限制酶XmaI和KpnI酶切的PCR产物yuszSOEpcr(SEQ ID NO:15)连接到pSJ6410质粒用XmaI-KpnI酶切后的大的片段上。上述质粒包含pE194的温度敏感复制起点,被用于通过双交换事件(doublecross-over event)将yusZ基因从枯草芽孢杆菌168的染色体中缺失。PCR产物yuszSOEpcr是利用重叠延伸的剪接(splicing by overlap extension)技术通过聚合酶链式反应产生的(SOE by PCR,Horton RM等,Biotechniques,1990-05;8(5):528-35)。两个中间PCR产物,PCR1和PCR2,在末端都有一小段对方的序列,在第二阶段的PCR过程中将其混合在一起,从而产生最终的剪接产物,yuszSOEpcr。PCR1是通过使用引物yusZ1F和yusZ2R得到的,其包含yusZ上游序列(655bp)。PCR2是通过使用引物yusZ2F和yusZ3R得到的,其包含yusZ下游序列(690bp)。将枯草芽孢杆菌168的染色体DNA作为PCR的模板。在第二阶段的PCR过程中,以PCR1和PCR2作为模板,以yusZ1F和yusZ3R作为引物,从而得到所述剪接产物(1315bp),其中的yusZ基因从编码280个氨基酸缩减到仅编码25个氨基酸。质粒pAN28的完整核苷酸序列显示在SEQ ID NO:16中。
pAN23:通过将用限制酶XmaI和KpnI酶切的PCR产物yusxSOEpcr(SEQID NO:17)连接到pSJ6410质粒用XmaI-KpnI酶切后的大的片段上。上述质粒包含pE194的温度敏感复制起点,被用于通过双交换事件将yusX基因从枯草芽孢杆菌168的染色体中缺失。PCR产物yusxSOEpcr是利用重叠延伸的剪接技术通过聚合酶链式反应产生的(SOE by PCR,Horton RM等,Biotechniques,1990-05;8(5):528-35)。两个中间PCR产物,PCR1和PCR2,在末端都有一小段对方的序列,在第二阶段的PCR过程中将其混合在一起,从而产生最终的剪接产物,yusxSOEpcr。PCR1是通过使用引物yusX1F和yusX2R得到的,其包含yusX上游序列(560bp)。PCR2是通过使用引物yusX2F和yusX3R得到的,其包含yusX下游序列(560bp)。将枯草芽孢杆菌168的染色体DNA用作PCR的模板。在第二阶段的PCR过程中,以PCR1和PCR2作为模板,以yusX1F和yusX3R作为引物,从而得到所述剪接产物(1090bp),其中的yusX基因从500个氨基酸缩减到27个氨基酸。质粒pAN23的完整序列显示在SEQ ID NO:18中。
pAN212b:质粒pSJ2739(在美国专利6,100,063中描述)的衍生质粒,pSJ2739又是pE194的衍生质粒,pE194在复制上属于天然温度敏感型。pAN212b由pE194复制子、以及衍生自质粒pUB110的片段组成。质粒pAN212b的完整序列显示在SEQ ID NO:23中。
常规分子生物学方法
除非另有所述,DNA操作和转化均使用标准分子生物学方法来进行(Sambrook等(1989),Molecular cloning:A laboratory manual,Cold SpringHarbor lab,Cold Spring Harbor,NY;Ausubel,F.M.等(编著),“Currentprotocols in Molecular Biology”,John Wiley和Sons,1995;Harwood,C.R.,和Cutting,S.M.(编著),“Molecular Biological Methods for Bacillus”,JohnWiley and Sons,1990)。
DNA操作时酶的使用按照供应商的说明来进行(例如限制性核酸内切酶、连接酶等可获自New England Biolabs,Inc.)。
感受态细胞的制备和转化如下列文献中所述,Yasbin,R.E.,Wilson,G.A.和Young,F.E.(1975),Transformation and transfection in lysogenic strains ofBacillus subtilis:evidence for selective induction of prophage in competentcells.J.Bacteriol,121:296-304。
培养基
LB琼脂:如Ausubel,F.M.等(编著),“Current protocols in MolecularBiology”,John Wiley and Sons,(1995)中所述。
LBP:在LB琼脂中添加0.05M的磷酸钾,pH7.0。
LBPG:在LB琼脂中添加0.5%的葡萄糖(Glucose)和0.05M磷酸钾,pH7.0。
LBPSK:在LB琼脂中添加0.05M的磷酸钾,pH7.0和1%的脱脂乳。
BPX:如EP0506 780(WO91/09129)中所述。
发酵
在装有100ml BPX的摇瓶中进行发酵,来评估淀粉酶的产量,发酵条件是37℃,300rpm,发酵7天。收获10ml的培养物,10,000(10.000)g离心以去除细胞和碎片。澄清的上清液用于分析α-淀粉酶的活性。
α-淀粉酶活性分析
以4,6-亚乙基(G7)-p-硝基苯基(G1)-α,D-麦芽七糖苷(maltoheptaoside)(亚乙基-G7PNP)作为底物,通过酶促比色试验法来检测α-淀粉酶的活性(Boehringer Mannheim,Germany art.1442309)。在特定的一系列条件下(温度、pH值、反应时间、缓冲液条件),1mg的给定α-淀粉酶将水解一定量的底物,从而生成黄色。在405nm下测定颜色强度(colour intensity)。在给定的一系列条件下,测定得到的吸光度与所述α-淀粉酶的活性成正比。
蛋白酶分析
在微量滴定板中利用分光光度法测定蛋白酶活性。蛋白酶水解切割寡肽N-suc-ala-ala-pro-phe-pNA(L-1400,Bachem)生成黄色,可以在405nm下检测。
实施例1:枯草芽孢杆菌yusZ-缺失突变株的构建
通过PCR利用SOE产生1315bp的yuszSOEpcr DNA片段,其包含yusZ基因的同阅读框(in-frame)的255个氨基酸缺失,然后克隆到带有温度敏感复制起点的质粒(pSJ6410),生成质粒pAN28。将pAN28通过转化导入到枯草芽孢杆菌168菌株,并在45℃下(非允许温度),在添加了1微克/ml erm的LBPG培养基上铺板培养以筛选整合子(intergant)。将这些培养板上的转化子在yusZ-上游或yusZ-下游基因座处通过单(erm+)交换事件整合了上述质粒。质粒可以以两种方式之一被切除,其中之一产生野生型菌株,另外一种情况中产生yusZ基因被yuszSOEpcr(ΔyusZ)取代的菌株。
为了进行切除、筛选和鉴定缺失yusZ的菌株,将上述整合子接种到10ml的LB中,并在30℃生长过夜(允许温度)。将100微升长出的(outgrown)整合子培养物转移到10ml LB,并在30℃再次生长过夜。将细胞在LBPG上铺板,温度为30℃,然后通过影印平板法,将其中发生双交换(整合-切除)的菌株标记为erm-
采用yusZ1F和yusZ3R引物对菌株进行PCR分析,以检测发生了双交换事件的菌株中野生型(2155bp)或缺失型(1315bp)的yusZ基因的存在。分离yusZ-缺失的菌株,命名为AN133,并且通过对涵盖完整yuszSOEpcr区(引物yusZ1F和yusZ3R)的全面序列分析来验证上述缺失。
实施例2:枯草芽孢杆菌yusZ-缺失突变株的淀粉酶产量
用质粒pKTH10转化AN133,其组成型表达解淀粉芽孢杆菌的α-淀粉酶AmyQ。所得到的菌株命名为AN137。由两份独立的分离物一式三份地检测AN137的淀粉酶产量,并与对照菌株AN83的淀粉酶产量进行比较。AN137菌株(ΔyusZ)与对照菌株AN83相比提高了α-淀粉酶的产量,平均产量高于对照菌株AN83,达205%,其中对照菌株AN83携带的是野生型的yusZ基因。结果如表1所示。
表1:AN137菌株(ΔyusZ)以及对照菌株AN83的淀粉酶产量。
    菌株   淀粉酶活性(相对)     平均产量     平均产量
    AN137-1.1   21.5 19.3 205%
    AN137-1.2   20.3
    AN137-1.3   18.1
    AN137-2.1   17.4
    AN137-2.2   20.6
    AN137-2.3   17.8
    AN83-1.1   9.11 9.4 100%
    AN83-1.2   7.52
    AN83-1.3   6.76
    AN83-2.1   10.5
    AN83-2.2   10.5
    AN83-2.3   11.9
实施例3:枯草芽孢杆菌yusX-缺失突变株的构建
通过PCR利用SOE产生1090 bp的yusxSOEpcrDNA片段,其包含yusX基因的473个氨基酸的同阅读框缺失,并将其克隆到带有温度敏感复制起点的质粒(pSJ6410),得到质粒pAN23,如上所述。将pAN23通过转化导入枯草芽孢杆菌168菌株,并在45℃下(非允许温度),在添加了1微克/ml erm的LBPG培养基上铺板培养以筛选出整合子。这些培养板上的转化子在yusX-上游或yusX-下游基因座处通过单(erm+)交换事件整合了上述质粒。切除质粒可以有两种方式,其中之一将产生野生型菌株,在另外一种情况下将产生yusX基因被yusxSOEpcr(ΔyusX)取代的菌株。
为了进行切除、筛选和鉴定缺失yusX的菌株,将上述整合子接种到10ml的LB,并在30℃生长过夜(允许温度)。将100微升长出的整合子培养物转移到10ml LB,并再次在30℃生长过夜。将细胞在LBPG上在30℃铺板,然后通过影印平板法,将发生双交换(整合-切除)的菌株标记为erm-。用引物yusX1F和yusX3R对菌株上进行PCR,以检测发生了双交换的菌株中野生型(2539bp的PCR产物)或截短的(1090bp的PCR产物)yusX基因的存在。将yusX-缺失的菌株命名为AN151,并且通过涵盖完整yusxSOEpcr区(引物yusX1F和yusX3R)的全面序列分析来验证。
实施例4:枯草芽孢杆菌yusX-缺失突变株的淀粉酶产量
用质粒pKTH10转化yusX-缺失突变株AN151,其中上述质粒组成型表达解淀粉芽孢杆菌的α-淀粉酶AmyQ。所得到的菌株命名为AN155。由两份独立的分离物一式二份地检测AN155的淀粉酶产量,并与对照菌株AN83的淀粉酶产量进行比较。结果如表2所示,yusX缺失的AN155菌株与对照菌株AN83相比,提高了α-淀粉酶的产量,平均产量高于对照菌株AN83,达239%,其中对照菌株AN83携带的是野生型yusX基因的拷贝。
表2:AN137菌株(yusX-缺失突变株)和对照菌株AN83的淀粉酶产量。
    菌株    淀粉酶活性(相对)   平均产量    平均产量
    AN155-1.1     29.9 29.8 238%
    AN155-1.2     32.2
    AN155-1.3     30.2
    AN155-2.1     28.1
    AN155-2.2     28.9
    AN155-2.3     29.5
    AN83-1.1     12.4 12.5 100%
    AN83-1.2     12.9
    AN83-1.3     11.5
    AN83-2.1     12.3
    AN83-2.2     11.9
    AN83-2.3     13.8
实施例5:地衣芽孢杆菌yusZ缺失突变株的构建
可以通过任意可用的标准方法来缺失地衣形芽孢杆菌的yusZ基因。地衣芽孢杆菌的基因组序列是可公开得到的;地衣芽孢杆菌yusZ基因的序列如SEQ ID NO:24所示,其所编码的多肽如SEQ ID NO:25所示。例如,可以使用如上所述的(在“质粒”部分,pAN28)通过重叠延伸拼接(SOE-PCR)的技术产生PCR产物。PCR1可包含yusZ上游序列,其可以使用yusZlich1F和yusZlich2R作为引物,使用SJ1707染色体DNA作为模板在PCR反应中生成。PCR2可包含yusZ下游序列,其可以使用yusZlich3F和yusZlich4R作为引物,以SJ1707的染色体DNA作为模板在另外的PCR反应中生成。在第二阶段的PCR过程中,使用PCR1和PCR2作为模板,以yusZlich1F和yusZlich4R作为引物,产生剪接产物(991bp,称作yuzZlichSOE),其中yusZ基因由编码280个氨基酸减至仅编码25个氨基酸。可通过将yusZlichSOE克隆到温度敏感型质粒pAN212b的BsaHI-SacII位点来构建称为“缺失质粒(deletion plasmid)”的质粒-得到质粒pAN212b-yusZ(=缺失质粒)。质粒pAN212b-yusZ的完整序列如SEQ ID NO:26所示。
可将上述缺失质粒转化到枯草芽孢杆菌接合供体菌株PP289-5(其包含染色体dal-缺失,和质粒pBC16和pLS20)的感受态细胞,并通过使用标准方法(如WO02/00907所述)接合到地衣芽孢杆菌AN10R和ANaprH菌株。然后可将yusZ缺失从缺失质粒通过(由整合和切除温度敏感的质粒介导的)PCR1和PCR2的双同源重组转移到目标地衣芽孢杆菌菌株的染色体(如实施例2所述)。可以使用引物yusZlich1F和yusZlich4R通过PCR来鉴定yusZ-缺失的菌株,并通过标准序列分析进行验证。
实施例6:地衣芽孢杆菌yusZ-缺失突变株的10R蛋白酶产量
将地衣芽孢杆菌菌株SJ1707进行改造以非常高水平地表达Nocardiopsisprasina NRLL18262(AN10R)的蛋白酶10R。由AN10R缺失yusZ基因得到AN10R-b。由四份独立的分离物一式二份地检测AN10R-b的蛋白酶产量,并与对照菌株AN10R的蛋白酶产量进行比较。AN10R-b菌株(yusZ-缺失突变株)与对照菌株AN10R相比,提高了蛋白酶的产量,比AN10R平均高出72%。结果如表3所示。
表3:AN10R-b菌株(yusZ-缺失突变株)和对照菌株An10R的蛋白酶10R的产量。
 菌株     蛋白酶活性(相对)     平均产量     平均产量
 AN10R-B-1.1     72.4 57 172%
 AN10R-B-1.2     24.4
 AN10R-B-2.1     48.0
 AN10R-B-2.2     43.5
  AN10R-B-3.1     63.6
  AN10R-B-3.2     51.7
  AN10R-B-4.1     87.3
  AN10R-B-4.2     65.0
  AN10R-1.1     53.6 33 100%
  AN10R-1.2     16.1
  AN10R-2.1     12.4
  AN10R-2.2     28.5
  AN10R-3.1     57.9
  AN10R-3.2     49.1
  AN10R-4.1     23.4
  AN10R-4.2     26.8
实施例7:地衣芽孢杆菌yusZ-缺失突变株的AprH蛋白酶产量
将地衣芽孢杆菌菌株SJ1707改造以高水平表达Bacillus clausii(ANaprH)的aprH蛋白酶基因。ANaprH缺失yusZ基因得到ANaprH-b菌株。由四份独立的分离物测定ANaprH-b的蛋白酶产量(图1,1-4号)并与来自对照菌株ANaprH的四份独立的分离物的蛋白酶产量,通过聚丙烯酰胺凝胶电泳(PAGE)进行比较,其中凝胶被标记以使蛋白酶可见。
如图1所示,丙烯酰胺凝胶上标记的蛋白酶条带的浓度差别清楚地显示yusZ-缺失菌株(ANaprH-b)比对应的参考菌株(ANaprH)产生更多的aprH编码的蛋白酶。
实施例8:枯草芽孢杆菌yusZ-缺失突变株的Apr蛋白酶产量
将枯草芽孢杆菌菌株168进行改造以高水平表达解淀粉酶芽孢杆菌(AN220)的apr蛋白酶基因。AN220缺失yusZ基因得到AN225。由四份独立的分离物一式二份地检测AN225的蛋白酶产量,并与对照菌株AN220的蛋白酶产量相比较。AN225菌株(yusZ-缺失突变株)提高了蛋白酶的产量,平均比对照菌株AN220高出了14%。结果如表4所示。
表4:AN10R-b(ΔyusZ)和对照菌株An10R的蛋白酶10R的产量。
  株系    蛋白酶活性(相对)     平均产量     平均产量
  AN225-B-1.1     42.8 44.5 114%
  AN225-B-1.2     42.8
  AN225-B-2.1     53.2
  AN225-B-2.2     47.5
  AN225-B-3.1     30.9
  AN225-B-3.2     51.8
  AN225-B-4.1     49.4
  AN225-B-4.2     37.3
  AN220-1.1     59 38.9 100%
  AN220-1.2     51.8
  AN220-2.1     49
  AN220-2.2     33.6
  AN220-3.1     32.6
  AN220-3.2     23.7
  AN220-4.1     27.1
  AN220-4.2     34.6
序列表
<110>诺维信公司(Novozymes A/S)
<120>具有高分泌水平的突变的原核细胞
<130>10576.204
<160>26
<170>PatentIn version3.3
<210>1
<211>843
<212>DNA
<213>枯草芽孢杆菌(bacillus subtilis)168
<400>1
atgaataaaa aaatagccat cgtgacagga gcgtccagcg gcttcggtct gctggcagct     60
gtaaagcttg cccgatcatt tttcgtgata gccacatcaa gacagcctga aaaagcggaa    120
cagcttcgag aattggctgc agcacacaat gtgtctgatt ctattcacat tacagctctc    180
gatgtcaccg atgaacaatc tatagtctca ttcggaaaag ctgttagtgc ttacgccccg    240
atcgatttac tcgttaacaa cgccggaacg gcttatggag gatttatcga ggatgtgccg    300
atggaacatt tcagacaaca atttgaaacg aatgtcttcg gtgtgatcca tgtgacaaaa    360
accgtgctgc cttacataag aaagcatggc ggcgcaaaga ttataaacgt gagcagcatc    420
agcggactga caggattccc agcgctgtcg ccatatgttt cttccaagca tgcattggaa    480
ggtttttctg aaagcctgcg tatcgagctg cttccgttcg gtatcgaaac cgctttgatc    540
gagccgggct catacaagac atcgatctgg tcaacgtcat tatcaaattt tatgtcggtg    600
cctgctgacg attcagccta tcatcaatac tataaaaaga tcctttccta tgttcaaaaa    660
aacggagaag aaagcggaga tccccaagag gttgccgacc tcatttatca attggcaaca    720
aaacagcaca taaagaattt gcgatacccg atcggaaagg gcatcaagct caccctgctg    780
ttccgatcgc tttttccttg gtctgcgtgg gagtctatcc tgaagaaaaa gctattcagc    840
tga                                                                  843
<210>2
<211>280
<212>PRT
<213>枯草芽孢杆菌168
<400>2
Met Asn Lys Lys Ile Ala Ile Val Thr Gly Ala Ser Ser Gly Phe Gly
1               5                   10                  15
Leu Leu Ala Ala Val Lys Leu Ala Arg Ser Phe Phe Val Ile Ala Thr
            20                  25                  30
Ser Arg Gln Pro Glu Lys Ala Glu Gln Leu Arg Glu Leu Ala Ala Ala
        35                  40                  45
His Asn Val Ser Asp Ser Ile His Ile Thr Ala Leu Asp Val Thr Asp
    50                  55                  60
Glu Gln Ser Ile Val Ser Phe Gly Lys Ala Val Ser Ala Tyr Ala Pro
65                  70                  75                  80
Ile Asp Leu Leu Val Asn Asn Ala Gly Thr Ala Tyr Gly Gly Phe Ile
                85                  90                  95
Glu Asp Val Pro Met Glu His Phe Arg Gln Gln Phe Glu Thr Asn Val
            100                 105                 110
Phe Gly Val Ile His Val Thr Lys Thr Val Leu Pro Tyr Ile Arg Lys
        115                 120                 125
His Gly Gly Ala Lys Ile Ile Ash Val Ser Ser Ile Ser Gly Leu Thr
    130                 135                 140
Gly Phe Pro Ala Leu Ser Pro Tyr ValSer Ser Lys His Ala Leu Glu
145                 150                155                 160
Gly Phe Ser Glu Ser Leu Arg Ile Glu Leu Leu Pro Phe Gly Ile Glu
                165                 170                 175
Thr Ala Leu Ile Glu Pro Gly Ser Tyr Lys Thr Ser Ile Trp Ser Thr
            180                 185                 190
Ser Leu Ser Asn Phe Met Ser Val Pro Ala Asp Asp Ser Ala Tyr His
        195                 200                 205
Gln Tyr Tyr Lys Lys Ile Leu Ser Tyr Val Gln Lys Asn Gly Glu Glu
    210                 215                 220
Ser Gly Asp Pro Gln Glu Val Ala Asp Leu Ile Tyr Gln Leu Ala Thr
225                 230                 235                 240
Lys Gln His Ile Lys Asn Leu Arg Tyr Pro Ile Gly Lys Gly Ile Lys
                245                 250                 255
Leu Thr Leu Leu Phe Arg Ser Leu Phe Pro Trp Ser Ala Trp Glu Ser
            260                 265                 270
 Ile Leu Lys Lys Lys Leu Phe Ser
     275                     280
<210>3
<211>1503
<212>DNA
<213>枯草芽孢杆菌168
<400>3
atgaatcggc tttccgcaga ttttcaatcg tcgctcgtta cattagatca taaacttgtg     60
gacattaatc aagacgtgtg gaatgaattg ttaacaaaac cgggattgcg cgatgtttct    120
tacatattaa atgaaagaag acagagggtt gccgaaaagc ttagccccgg taaggaaaaa    180
ctgatcggaa accttgcggt ggacggatat cacgcttgga gtgacttata caatatggtt    240
gtcgggaaaa tgacgatccc gtatgaggaa aacggtgaaa acaagcaatt gtctgtcggt    300
caggcggaga atatgatgga tcatcaagac cgtactgtca gaaaaacagt atatgaacgt    360
ttccgccaag cttgggagag caagcaagat attttcagca gcacgctgaa tcatttggcg    420
ggattccggc ttgaaaccta taaagcgcgc ggctgggaga atgtcctgaa ggaaccgctg    480
caaattaaca ggatgaaaaa agaaacactt gatacgatgt ggcaggtcat cactgaaaac    540
aagaagccgt tcgttcagtt tttgaaccgg aaagcatcca tgctcggcct tgaaaaactc    600
agctggtacg atgtcgaggc accgatcggt tctgacggaa aggtctattc gtatgatgaa    660
gccgcaaata tcattaccag ccagttttca acgtttggca aaaagctgtc ctcattcact    720
gaaaaagcgt ttcgggacgg ctggattgag gcggaagaca ggagcggaaa aagagtcggc    780
ggcttttgca ccagttttcc ggacagcggg gaatcccgga ttttcatgac attttcggga    840
agcgcctcaa atgtctctac ccttgcgcat gaactcgggc acgcgttcca tcaggaagca    900
atgctcaacg tcaggccgtt aaaccgttcc tacgccatga acgttgcaga aacagcttca    960
acgtttgcag agatgatagt ggcggacgcg actgtccagc aggccgagac gagggaagaa   1020
aagcttgttc ttctggagga taaagtgcaa agaagcgttg cgttcttcat gaacattcac   1080
gcaagatttc tatttgaaac gagattctac gaggaacgaa agcggggagt ggtaccggcc   1140
agccgcttga atgagctgat ggaagaggcg caaagagagg catactgcaa tgcgttagaa   1200
gaatatcatc cgcttttttg ggcatcaaag cttcattttc acatcacgag ggtgccgttt   1260
tacaatttcc cttatacatt cggctacctg ttttctcttg gtatttacgc gttggcgctt   1320
gaagaaaaag acacattcga agagaagtat atggcgctat tgcgcgatac ggcttctatg   1380
acagtggagg atttggcgat gaagcatttg ggcgctgaca tcacaaagcg cgatttctgg   1440
gagaatgcca tcaagctggc tgtgcgtgac gccgaaacct ttttacaaat gaccgaatct   1500
taa                                                                 1503
<210>4
<211>500
<212>PRT
<213>枯草芽孢杆菌168
<400>4
Met Asn Arg Leu Ser Ala Asp Phe Gln Ser Ser Leu Val Thr Leu Asp
1               5                   10                  15
His Lys Leu Val Asp Ile Asn Gln Asp Val Trp Asn Glu Leu Leu Thr
            20                  25                  30
Lys Pro Gly Leu Arg Asp Val Ser Tyr Ile Leu Asn Glu Arg Arg Gln
        35                  40                  45
Arg Val Ala Glu Lys Leu Ser Pro Gly Lys Glu Lys Leu Ile Gly Asn
    50                  55                  60
Leu Ala Val Asp Gly Tyr His Ala Trp Ser Asp Leu Tyr Asn Met Val
65                  70                  75                   80
Val Gly Lys Met Thr Ile Pro Tyr Glu Glu Asn Gly Glu Asn Lys Gln
                85                  90                  95
Leu Ser Val Gly Gln Ala Glu Asn Met Met Asp His Gln Asp Arg Thr
            100                 105                 110
Val Arg Lys Thr Val Tyr Glu Arg Phe Arg Gln Ala Trp Glu Ser Lys
        115                 120                 125
Gln Asp Ile Phe Ser Ser Thr Leu Ash His Leu Ala Gly Phe Arg Leu
    130                 135                 140
Glu Thr Tyr Lys Ala Arg Gly Trp Glu Asn Val Leu Lys Glu Pro Leu
145                 150                 155                 160
Gln Ile Asn Arg Met Lys Lys Glu Thr Leu Asp Thr Met Trp Gln Val
                165                 170                 175
Ile Thr Glu Asn Lys Lys Pro Phe Val Gln Phe Leu Asn Arg Lys Ala
            180                 185                 190
Ser Met Leu Gly Leu Glu Lys Leu Ser Trp Tyr Asp Val Glu Ala Pro
        195                 200                 205
Ile Gly Ser Asp Gly Lys Val Tyr Ser Tyr Asp Glu Ala Ala Asn Ile
    210                 215                 220
Ile Thr Ser Gln Phe Ser Thr Phe Gly Lys Lys Leu Ser Ser Phe Thr
225                 230                 235                 240
Glu Lys Ala Phe Arg Asp Gly Trp Ile Glu Ala Glu Asp Arg Ser Gly
                245                 250                 255
Lys Arg Val Gly Gly Phe Cys Thr Ser Phe Pro Asp Ser Gly Glu Ser
            260                 265                 270
Arg Ile Phe Met Thr Phe Ser Gly Ser Ala Ser Asn Val Ser Thr Leu
        275                 280                 285
Ala His Glu Leu Gly His Ala Phe His Gln Glu Ala Met Leu Asn Val
    290                 295                 300
Arg Pro Leu Asn Arg Ser Tyr Ala Met Asn Val Ala Glu Thr Ala Ser
305                 310                 315                 320
Thr Phe Ala Glu Met Ile Val Ala Asp Ala Thr Val Gln Gln Ala Glu
                325                 330                 335
Thr Arg Glu Glu Lys Leu Val Leu Leu Glu Asp Lys Val Gln Arg Ser
            340                 345                 350
Val Ala Phe Phe Met Asn Ile His Ala Arg Phe Leu Phe alu Thr Arg
        355                 360                 365
Phe Tyr Glu Glu Arg Lys Arg Gly Val Val Pro Ala Ser Arg Leu Asn
    370                 375                 380
Glu Leu Met Glu Glu Ala Gln Arg Glu Ala Tyr Cys Asn Ala Leu Glu
385                 390                 395                 400
Glu Tyr His Pro Leu Phe Trp Ala Ser Lys Leu His Phe His Ile Thr
                405                 410                 415
Arg Val Pro Phe Tyr Asn Phe Pro Tyr Thr Phe Gly Tyr Leu Phe Ser
            420                 425                 430
Leu Gly Ile Tyr Ala Leu Ala Leu Glu Glu Lys Asp Thr Phe Glu Glu
        435                 440                 445
Lys Tyr Met Ala Leu Leu Arg Asp Thr Ala Ser Met Thr Val Glu Asp
    450                 455                 460
Leu Ala Met Lys His Leu Gly Ala Asp Ile Thr Lys Arg Asp Phe Trp
465                 470                 475                 480
Glu Asn Ala Ile Lys Leu Ala Val Arg Asp Ala Glu Thr Phe Leu Gln
                485                 490                 495
Met Thr Glu Ser
            500
<210>5
<211>297
<212>DNA
<213>枯草芽孢杆菌168
<400>5
atggcgctgc aaggggtagg ccaaagatgg gatcttgatt cattttttaa gggcgggagc     60
caatcggaag aattcaaagg ttatattgag aagctgtcac aaagtctgcg tgcatttcaa    120
gacaggactg atgcgtttca ggtgcctgaa tcgcctgaag aggctgaagg gctgaccgcg    180
ttgcttgatt taatcgaaca gacatccgtc aagcttcagc aggccggcgc ttttgttgct    240
tgcctccagg cccagaatat caatgatcaa aaggctatag agcatcaggc ctcatga       297
<210>6
<211>98
<212>PRT
<213>枯草芽孢杆菌168
<400>6
Met Ala Leu Gln Gly Val Gly Gln Arg Trp Asp Leu Asp Ser Phe Phe
1               5                   10                  15
Lys Gly Gly Ser Gln Ser Glu Glu Phe Lys Gly Tyr Ile Glu Lys Leu
            20                  25                  30
Ser Gln Ser Leu Arg Ala Phe Gln Asp Arg Thr Asp Ala Phe Gln Val
        35                  40                  45
Pro Glu Ser Pro Glu Glu Ala Glu Gly Leu Thr Ala Leu Leu Asp Leu
    50                  55                  60
Ile Glu Gln Thr Ser Val Lys Leu Gln Gln Ala Gly Ala Phe Val Ala
65                  70                  75                  80
Cys Leu Gln Ala Gln Asn Ile Asn Asp Gln Lys Ala Ile Glu His Gln
                85                  90                  95
Ala Ser
<210>7
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物yusZ1F
<400>7
ccttcccggg gctaagcttt tcggc                                                  25
<210>8
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物yusZ2R
<400>8
gatagactcc cacgcgctgg acgctcctgt                                             30
<210>9
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物yusZ2F
<400>9
acaggagcgt ccagcgcgtg ggagtctatc                                             30
<210>10
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物yusZ3R
<400>10
aacggtaccc tgaccaagca gacag                                                  25
<210>11
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物yusX1F
<400>11
aatgcccggg caagctttac agctg                                                  25
<210>12
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物yusX2R
<400>12
ggcgtcacgc acagcaacga gcgacgattg                                             30
<210>13
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物yusX2F
<400>13
 caatcgtcgc tcgttgctgt gcgtgacgcc                                            30
<210>14
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物yusX3R
<400>14
 aatcggtacc atcataatga ctgtc                                                 25
<210>15
<211>1315
<212>DNA
<213>人工序列
<220>
<223>PCR产物yuszSOEpcr
<400>15
ccttcccggg gctaagcttt tcggcaaccc tctgtcttct ttcatttaat atgtaagaaa     60
catcgcgcaa tcccggtttt gttaacaatt cattccacac gtcttgatta atgtccacaa    120
gtttatgatc taatgtaacg agcgacgatt gaaaatctgc ggaaagccga ttcatgaggc    180
ctgatgctct atagcctttt gatcattgat attctgggcc tggaggcaag caacaaaagc    240
gccggcctgc tgaagcttga cggatgtctg ttcgattaaa tcaagcaacg cggtcagccc    300
ttcagcctct tcaggcgatt caggcacctg aaacgcatca gtcctgtctt gaaatgcacg    360
cagactttgt gacagcttct caatataacc tttgaattct tccgattggc tcccgccctt    420
aaaaaatgaa tcaagatccc atctttggcc taccccttgc agcgccatat cacaaaaccc    480
ctttccttct ttcgttctat tatagaacaa ttctgaatta ttgtataaaa atttctatta    540
caggcgtcat ttcgtgttca ggatagtaca atagctgtag cagtttaata ggagggttag    600
gatgaataaa aaaatagcca tcgtgacagg agcgtccagc gcgtgggagt ctatcctgaa    660
gaaaaagcta ttcagctgat ctaaattata attattataa tttagtattg atttttattt    720
agtatatgat ataattaagt caacagatca caaggaggac gttatcttat gaaaactgaa    780
aacgcaaaaa caaatcaaac attagttgag aattcactga acacacaatt atcaaactgg    840
tttcttttat actctaagct ccaccgtttc cattggtatg tgaaagggcc tcatttcttt    900
acattgcacg agaaatttga agaactttat gaccatgcgg ctgaaacagt ggataccatc    960
gctgagcgcc tgctggcgat tggcggacag cctgttgcca cagtgaaaga atacactgag   1020
catgcatcta tcacagacgg cggaaacgaa acatcagcat cagaaatggt acaagcattg   1080
gtaaacgact acaaacaaat cagcagcgaa tctaaattcg tgatcggcct ggctgaagaa   1140
aatcaagaca atgcgacagc ggacttgttt gtcggattaa ttgaagaagt tgaaaaacaa   1200
gtgtggatgc tttcctctta tttagggtaa caaaaaagct gaaccttaat cgggttcagc   1260
tttttgtttt ttcttagctt gaactgcttt ctgtctgctt ggtcagggta ccgtt        1315
<210>16
<211>6305
<212>DNA
<213>人工序列
<220>
<223>质粒pAN28
<400>16
gctaagcttt tcggcaaccc tctgtcttct ttcatttaat atgtaagaaa catcgcgcaa     60
tcccggtttt gttaacaatt cattccacac gtcttgatta atgtccacaa gtttatgatc    120
taatgtaacg agcgacgatt gaaaatctgc ggaaagccga ttcatgaggc ctgatgctct    180
atagcctttt gatcattgat attctgggcc tggaggcaag caacaaaagc gccggcctgc    240
tgaagcttga cggatgtctg ttcgattaaa tcaagcaacg cggtcagccc ttcagcctct    300
tcaggcgatt caggcacctg aaacgcatca gtcctgtctt gaaatgcacg cagactttgt    360
gacagcttct caatataacc tttgaattct tccgattggc tcccgccctt aaaaaatgaa    420
tcaagatccc atctttggcc taccccttgc agcgccatat cacaaaaccc ctttccttct    480
ttcgttctat tatagaacaa ttctgaatta ttgtataaaa atttctatta caggcgtcat    540
ttcgtgttca ggatagtaca atagctgtag cagtttaata ggagggttag gatgaataaa    600
aaaatagcca tcgtgacagg agcgtccagc gcgtgggagt ctatcctgaa gaaaaagcta    660
ttcagctgat ctaaattata attattataa tttagtattg atttttattt agtatatgat    720
ataattaagt caacagatca caaggaggac gttatcttat gaaaactgaa aacgcaaaaa    780
caaatcaaac attagttgag aattcactga acacacaatt atcaaactgg tttcttttat    840
actctaagct ccaccgtttc cattggtatg tgaaagggcc tcatttcttt acattgcacg    900
agaaatttga agaactttat gaccatgcgg ctgaaacagt ggataccatc gctgagcgcc    960
tgctggcgat tggcggacag cctgttgcca cagtgaaaga atacactgag catgcatcta   1020
tcacagacgg cggaaacgaa acatcagcat cagaaatggt acaagcattg gtaaacgact   1080
acaaacaaat cagcagcgaa tctaaattcg tgatcggcct ggctgaagaa aatcaagaca   1140
atgcgacagc ggacttgttt gtcggattaa ttgaagaagt tgaaaaacaa gtgtggatgc   1200
tttcctctta tttagggtaa caaaaaagct gaaccttaat cgggttcagc tttttgtttt   1260
ttcttagctt gaactgcttt ctgtctgctt ggtcagggta ccattttgac ggaaccgatt   1320
gggacgagtc ccgaaagctg aaccgcatct ataagtttca aggaaaggct tgggattggg   1380
aagtttccaa tgaaaacggc aactatgatt atttgatgta tgccgacatc gattatgacc   1440
atcctgatgt cgcagcagaa attaagagat ggggcacttg gtatgccaat gaactgcaat   1500
tggacggaaa ccgtcttgat gctgtcaaac acattaaatt ttcttttttg cgggattggg   1560
ttaatcatgt cagggaaaaa acggggaagg aaatgtttac ggtagctgaa tattggcaga   1620
atgacttggg cgcgctggaa aactatttga acaaaacaaa ttttaatcat tcagtgtttg   1680
acgtgccgct tcattatcag ttccatgctg catcgacaca gggaggcggc tatgatatga   1740
ggaaattgct gaagggtacg gtcgtttcca agcatccgtt gaaatcggtt acatttgtcg   1800
ataaccatga tacacagccg gggcaatcgc ttgagtcgac tgtccaaaca tggtttaagc   1860
cgcttgctta cgcttttatt ctcacaaggg aatctggata ccctcaggtt ttctacgggg   1920
atatgtacgg gacgaaagga gactcccagc gcgaaattcc tgccttgaaa cacaaaattg   1980
aaccgatctt aaaagcgaga aaacagtatg cgtacggagc acagcatgat tatttcgacc   2040
accatgacat tgtcggctgg acaagggaag gcgacagctc ggttgcaaat tcaggtttgg   2100
cggcattaat aacagacgga cccggtgggg caaagcgaat gtatgtcggc cggcaaaacg   2160
ccggtgagac atggcatgac attaccggaa accgttcgga gccggttgtc atcaattcgg   2220
aaggctgggg agagtttcac gtaaacggcg ggtcggtttc aatttatgtt caaagataga   2280
agagcagaga ggacggattt cctgaaggaa atccgttttt ttattttgcc cgtcttataa   2340
atttcgttga ttacatttta taattaattt taacaaagtg tcataagccc tcaggaatat   2400
tgctgacagt ttagaatccc taggtaaggc ggggatgaaa tggcaacgtt atctgatgta   2460
gcaaagaaag aaatgtgtcg aaaatgacgg tatcgcgggt gatcaatcat cctgagactg   2520
tgacggatga attgaaaaag cttgcatgcc tgcaggtcga ttcacaaaaa ataggcacac   2580
gaaaaacaag ttaagggatg cagtttatgc atcccttaac ttacttatta aataatttat   2640
agctattgaa aagagataag aattgttcaa agctaatatt gtttaaatcg tcaattcctg   2700
catgttttaa ggaattgtta aattgatttt ttgtaaatat tttcttgtat tctttgttaa   2760
cccatttcat aacgaaataa ttatactttt gtttatcttt gtgtgatatt cttgattttt   2820
ttctacttaa tctgataagt gagctattca ctttaggttt aggatgaaaa tattctcttg   2880
gaaccatact taatatagaa atatcaactt ctgccattaa aagtaatgcc aatgagcgtt   2940
ttgtatttaa taatctttta gcaaacccgt attccacgat taaataaatc tcattagcta   3000
tactatcaaa aacaattttg cgtattatat ccgtacttat gttataaggt atattaccat   3060
atattttata ggattggttt ttaggaaatt taaactgcaa tatatccttg tttaaaactt   3120
ggaaattatc gtgatcaaca agtttatttt ctgtagtttt gcataattta tggtctattt   3180
caatggcagt tacgaaatta cacctcttta ctaattcaag ggtaaaatgg ccttttcctg   3240
agccgatttc aaagatatta tcatgttcat ttaatcttat atttgtcatt attttatcta   3300
tattatgttt tgaagtaata aagttttgac tgtgttttat atttttctcg ttcattataa   3360
ccctctttaa tttggttata tgaattttgc ttattaacga ttcattataa ccacttattt   3420
tttgtttggt tgataatgaa ctgtgctgat tacaaaaata ctaaaaatgc ccatattttt   3480
tcctccttat aaaattagta taattatagc acgagctctg ataaatatga acatgatgag   3540
tgatcgttaa atttatactg caatcggatg cgattattga ataaaagata tgagagattt   3600
atctaatttc ttttttcttg taaaaaaaga aagttcttaa aggttttata gttttggtcg   3660
tagagcacac ggtttaacga cttaattacg aagtaaataa gtctagtgtg ttagacttta   3720
tgaaatctat atacgtttat atatatttat tatccggagg tgtagcatgt ctcattcaat   3780
tttgagggtt gccagagtta aaggatcaag taatacaaac gggatacaaa gacataatca   3840
aagagagaat aaaaactata ataataaaga cataaatcat gaggaaacat ataaaaatta   3900
tgatttgatt aacgcacaaa atataaagta taaagataaa attgatgaaa cgattgatga   3960
gaattattca gggaaacgta aaattcggtc agatgcaatt cgacatgtgg acggactggt   4020
tacaagtgat aaagatttct ttgatgattt aagcggagaa gaaatagaac gattttttaa   4080
agatagcttg gagtttctag aaaatgaata cggtaaggaa aatatgctgt atgcgactgt   4140
ccatctggat gaaagagtcc cacatatgca ctttggtttt gtccctttaa cagaggacgg   4200
gagattgtct gcaaaagaac agttaggcaa caagaaagac tttactcaat tacaagatag   4260
atttaatgag tatgtgaatg agaaaggtta tgaacttgaa agaggcacgt ccaaagaggt   4320
tacagaacga gaacataaag cgatggatca gtacaagaaa gatactgtat ttcataaaca   4380
ggaactgcaa gaagttaagg atgagttaca gaaggcaaat aagcagttac agagtggaat   4440
agagcatatg aggtctacga aaccctttga ttatgaaaat gagcgtacag gtttgttctc   4500
tggacgtgaa gagactggta gaaagatatt aactgctgat gaatttgaac gcctgcaaga   4560
aacaatctct tctgcagaac ggattgttga tgattacgaa aatattaaga gcacagacta   4620
ttacacagaa aatcaagaat taaaaaaacg tagagagagt ttgaaagaag tagtgaatac   4680
atggaaagag gggtatcacg aaaaaagtaa agaggttaat aaattaaagc gagagaatga   4740
tagtttgaat gagcagttga atgtatcaga gaaatttcaa gctagtacag tgactttata   4800
tcgtgctgcg agggcgaatt tccctgggtt tgagaaaggg tttaataggc ttaaagagaa   4860
attctttaat gattccaaat ttgagcgtgt gggacagttt atggatgttg tacaggataa   4920
tgtccagaag gtcgatagaa agcgtgagaa acagcgtaca gacgatttag agatgtagag   4980
gtacttttat gccgagaaaa ctttttgcgt gtgacagtcc ttaaaatata cttagagcgt   5040
aagcgaaagt agtagcgaca gctattaact ttcggtttca aagctctagg atttttaatg   5100
gacgcagcgc atcacacgca aaaaggaaat tggaataaat gcgaaatttg agatgttaat   5160
taaagacctt tttgaggtct ttttttctta gatttttggg gttatttagg ggagaaaaca   5220
taggggggta ctacgacctc ccccctaggt gtccattgtc cattgtccaa acaaataaat   5280
aaatattggg tttttaatgt taaaaggttg ttttttatgt taaagtgaaa aaaacagatg   5340
ttgggaggta cagtgatggt tgtagataga aaagaagaga aaaaagttgc tgttacttta   5400
agacttacaa cagaagaaaa tgagatatta aatagaatca aagaaaaata taatattagc   5460
aaatcagatg caaccggtat tctaataaaa aaatatgcaa aggaggaata cggtgcattt   5520
taaacaaaaa aagatagaca gcactggcat gctgcctatc tatgactaaa ttttgttaag   5580
tgtattagca ccgttattat atcatgagcg aaaatgtaat aaaagaaact gaaaacaaga   5640
aaaattcaag aggacgtaat tggacatttg ttttatatcc agaatcagca aaagccgagt   5700
ggttagagta tttaaaagag ttacacattc aatttgtagt gtctccatta catgataggg   5760
atactgatac agaaggtagg atgaaaaaag agcattatca tattctagtg atgtatgagg   5820
gtaataaatc ttatgaacag ataaaaataa ttacagaaga attgaatgcg actattccgc   5880
agattgcagg aagtgtgaaa ggtcttgtga gatatatgct tcacatggac gatcctaata   5940
aatttaaata tcaaaaagaa gatatgatag tttatggcgg tgtagatgtt gatgaattat   6000
taaagaaaac aacaacagat agatataaat taattaaaga aatgattgag tttattgatg   6060
aacaaggaat cgtagaattt aagagtttaa tggattatgc aatgaagttt aaatttgatg   6120
attggttccc gcttttatgt gataactcgg cgtatgttat tcaagaatat ataaaatcaa   6180
atcggtataa atctgaccga tagattttga atttaggtgt cacaagacac tcttttttcg   6240
caccagcgaa aactggttta agccgactgc gcaaaagaca taatcgactc tagaggatcc   6300
ccggg                                                               6305
<210>17
<211>1090
<212>DNA
<213>人工序列
<220>
<223>PCR产物yusxSOEpcr
<400>17
aatgcccggg caagctttac agctgccagc agaccgaagc cgctggacgc tcctgtcacg     60
atggctattt ttttattcat cctaaccctc ctattaaact gctacagcta ttgtactatc    120
ctgaacacga aatgacgcct gtaatagaaa tttttataca ataattcaga attgttctat    180
aatagaacga aagaaggaaa ggggttttgt gatatggcgc tgcaaggggt aggccaaaga    240
tgggatcttg attcattttt taagggcggg agccaatcgg aagaattcaa aggttatatt    300
gagaagctgt cacaaagtct gcgtgcattt caagacagga ctgatgcgtt tcaggtgcct    360
gaatcgcctg aagaggctga agggctgacc gcgttgcttg atttaatcga acagacatcc    420
gtcaagcttc agcaggccgg cgcttttgtt gcttgcctcc aggcccagaa tatcaatgat    480
caaaaggcta tagagcatca ggcctcatga atcggctttc cgcagatttt caatcgtcgc    540
tcgttgctgt gcgtgacgcc gaaacctttt tacaaatgac cgaatcttaa agaaaaagcc    600
gtggcgttaa atgccccggc tttttcaatt cttctctgaa tgaggatttc attctctgga    660
tatacctaaa ataaatggaa tcctacaggg gggaaacata tgcatttgat cagagcagcc    720
ggggctgtat gtctcgcagt ggttctgatt gcgggctgcc gtttcaatga agaccagcat    780
caggcagaag gagaaaatac agccgtcacc cagctgaagt ccgttcccta cagtaatttt    840
tcgcttcgtg tgagctacgg ggatggtgag cataaccgtt atgaaggaat ctatacaaag    900
aacgggactc aggaaaaagc ggaaatacag gataagctct ccggtgtcaa tcaggaagga    960
gaagaagcgt tagatgagat gaaaatgatt ttgagcgagc tttccgtgac agaccaaatg   1020
gctgaaacag aagtgataca cagtgtgctg gcagcattta atctggacag tcattatgat   1080
ggtaccgatt                                                          1090
<210>18
<211>6079
<212>DNA
<213>人工序列
<220>
<223>质粒pAN23
<400>18
caagctttac agctgccagc agaccgaagc cgctggacgc tcctgtcacg atggctattt     60
ttttattcat cctaaccctc ctattaaact gctacagcta ttgtactatc ctgaacacga    120
aatgacgcct gtaatagaaa tttttataca ataattcaga attgttctat aatagaacga    180
aagaaggaaa ggggttttgt gatatggcgc tgcaaggggt aggccaaaga tgggatcttg    240
attcattttt taagggcggg agccaatcgg aagaattcaa aggttatatt gagaagctgt    300
cacaaagtct gcgtgcattt caagacagga ctgatgcgtt tcaggtgcct gaatcgcctg    360
aagaggctga agggctgacc gcgttgcttg atttaatcga acagacatcc gtcaagcttc    420
agcaggccgg cgcttttgtt gcttgcctcc aggcccagaa tatcaatgat caaaaggcta    480
tagagcatca ggcctcatga atcggctttc cgcagatttt caatcgtcgc tcgttgctgt    540
gcgtgacgcc gaaacctttt tacaaatgac cgaatcttaa agaaaaagcc gtggcgttaa    600
atgccccggc tttttcaatt cttctctgaa tgaggatttc attctctgga tatacctaaa    660
ataaatggaa tcctacaggg gggaaacata tgcatttgat cagagcagcc ggggctgtat    720
gtctcgcagt ggttctgatt gcgggctgcc gtttcaatga agaccagcat caggcagaag    780
gagaaaatac agccgtcacc cagctgaagt ccgttcccta cagtaatttt tcgcttcgtg    840
tgagctacgg ggatggtgag cataaccgtt atgaaggaat ctatacaaag aacgggactc    900
aggaaaaagc ggaaatacag gataagctct ccggtgtcaa tcaggaagga gaagaagcgt    960
tagatgagat gaaaatgatt ttgagcgagc tttccgtgac agaccaaatg gctgaaacag   1020
aagtgataca cagtgtgctg gcagcattta atctggacag tcattatgat ggtaccattt   1080
tgacggaacc gattgggacg agtcccgaaa gctgaaccgc atctataagt ttcaaggaaa   1140
ggcttgggat tgggaagttt ccaatgaaaa cggcaactat gattatttga tgtatgccga   1200
catcgattat gaccatcctg atgtcgcagc agaaattaag agatggggca cttggtatgc   1260
caatgaactg caattggacg gaaaccgtct tgatgctgtc aaacacatta aattttcttt   1320
tttgcgggat tgggttaatc atgtcaggga aaaaacgggg aaggaaatgt ttacggtagc   1380
tgaatattgg cagaatgact tgggcgcgct ggaaaactat ttgaacaaaa caaattttaa   1440
tcattcagtg tttgacgtgc cgcttcatta tcagttccat gctgcatcga cacagggagg   1500
cggctatgat atgaggaaat tgctgaaggg tacggtcgtt tccaagcatc cgttgaaatc   1560
ggttacattt gtcgataacc atgatacaca gccggggcaa tcgcttgagt cgactgtcca   1620
aacatggttt aagccgcttg cttacgcttt tattctcaca agggaatctg gataccctca   1680
ggttttctac ggggatatgt acgggacgaa aggagactcc cagcgcgaaa ttcctgcctt   1740
gaaacacaaa attgaaccga tcttaaaagc gagaaaacag tatgcgtacg gagcacagca   1800
tgattatttc gaccaccatg acattgtcgg ctggacaagg gaaggcgaca gctcggttgc   1860
aaattcaggt ttggcggcat taataacaga cggacccggt ggggcaaagc gaatgtatgt   1920
cggccggcaa aacgccggtg agacatggca tgacattacc ggaaaccgtt cggagccggt   1980
tgtcatcaat tcggaaggct ggggagagtt tcacgtaaac ggcgggtcgg tttcaattta   2040
tgttcaaaga tagaagagca gagaggacgg atttcctgaa ggaaatccgt ttttttattt   2100
tgcccgtctt ataaatttcg ttgattacat tttataatta attttaacaa agtgtcataa   2160
gccctcagga atattgctga cagtttagaa tccctaggta aggcggggat gaaatggcaa   2220
cgttatctga tgtagcaaag aaagaaatgt gtcgaaaatg acggtatcgc gggtgatcaa   2280
tcatcctgag actgtgacgg atgaattgaa aaagcttgca tgcctgcagg tcgattcaca   2340
aaaaataggc acacgaaaaa caagttaagg gatgcagttt atgcatccct taacttactt   2400
attaaataat ttatagctat tgaaaagaga taagaattgt tcaaagctaa tattgtttaa   2460
atcgtcaatt cctgcatgtt ttaaggaatt gttaaattga ttttttgtaa atattttctt   2520
gtattctttg ttaacccatt tcataacgaa ataattatac ttttgtttat ctttgtgtga   2580
tattcttgat ttttttctac ttaatctgat aagtgagcta ttcactttag gtttaggatg   2640
aaaatattct cttggaacca tacttaatat agaaatatca acttctgcca ttaaaagtaa   2700
tgccaatgag cgttttgtat ttaataatct tttagcaaac ccgtattcca cgattaaata   2760
aatctcatta gctatactat caaaaacaat tttgcgtatt atatccgtac ttatgttata   2820
aggtatatta ccatatattt tataggattg gtttttagga aatttaaact gcaatatatc   2880
cttgtttaaa acttggaaat tatcgtgatc aacaagttta ttttctgtag ttttgcataa   2940
tttatggtct atttcaatgg cagttacgaa attacacctc tttactaatt caagggtaaa   3000
atggcctttt cctgagccga tttcaaagat attatcatgt tcatttaatc ttatatttgt   3060
cattatttta tctatattat gttttgaagt aataaagttt tgactgtgtt ttatattttt   3120
ctcgttcatt ataaccctct ttaatttggt tatatgaatt ttgcttatta acgattcatt   3180
ataaccactt attttttgtt tggttgataa tgaactgtgc tgattacaaa aatactaaaa   3240
atgcccatat tttttcctcc ttataaaatt agtataatta tagcacgagc tctgataaat   3300
atgaacatga tgagtgatcg ttaaatttat actgcaatcg gatgcgatta ttgaataaaa   3360
gatatgagag atttatctaa tttctttttt cttgtaaaaa aagaaagttc ttaaaggttt   3420
tatagttttg gtcgtagagc acacggttta acgacttaat tacgaagtaa ataagtctag   3480
tgtgttagac tttatgaaat ctatatacgt ttatatatat ttattatccg gaggtgtagc   3540
atgtctcatt caattttgag ggttgccaga gttaaaggat caagtaatac aaacgggata   3600
caaagacata atcaaagaga gaataaaaac tataataata aagacataaa tcatgaggaa   3660
acatataaaa attatgattt gattaacgca caaaatataa agtataaaga taaaattgat   3720
gaaacgattg atgagaatta ttcagggaaa cgtaaaattc ggtcagatgc aattcgacat   3780
gtggacggac tggttacaag tgataaagat ttctttgatg atttaagcgg agaagaaata   3840
gaacgatttt ttaaagatag cttggagttt ctagaaaatg aatacggtaa ggaaaatatg   3900
ctgtatgcga ctgtccatct ggatgaaaga gtcccacata tgcactttgg ttttgtccct   3960
ttaacagagg acgggagatt gtctgcaaaa gaacagttag gcaacaagaa agactttact   4020
caattacaag atagatttaa tgagtatgtg aatgagaaag gttatgaact tgaaagaggc   4080
acgtccaaag aggttacaga acgagaacat aaagcgatgg atcagtacaa gaaagatact   4140
gtatttcata aacaggaact gcaagaagtt aaggatgagt tacagaaggc aaataagcag   4200
ttacagagtg gaatagagca tatgaggtct acgaaaccct ttgattatga aaatgagcgt   4260
acaggtttgt tctctggacg tgaagagact ggtagaaaga tattaactgc tgatgaattt   4320
gaacgcctgc aagaaacaat ctcttctgca gaacggattg ttgatgatta cgaaaatatt   4380
aagagcacag actattacac agaaaatcaa gaattaaaaa aacgtagaga gagtttgaaa   4440
gaagtagtga atacatggaa agaggggtat cacgaaaaaa gtaaagaggt taataaatta   4500
aagcgagaga atgatagttt gaatgagcag ttgaatgtat cagagaaatt tcaagctagt   4560
acagtgactt tatatcgtgc tgcgagggcg aatttccctg ggtttgagaa agggtttaat   4620
aggcttaaag agaaattctt taatgattcc aaatttgagc gtgtgggaca gtttatggat   4680
gttgtacagg ataatgtcca gaaggtcgat agaaagcgtg agaaacagcg tacagacgat   4740
ttagagatgt agaggtactt ttatgccgag aaaacttttt gcgtgtgaca gtccttaaaa   4800
tatacttaga gcgtaagcga aagtagtagc gacagctatt aactttcggt ttcaaagctc   4860
taggattttt aatggacgca gcgcatcaca cgcaaaaagg aaattggaat aaatgcgaaa   4920
tttgagatgt taattaaaga cctttttgag gtcttttttt cttagatttt tggggttatt   4980
taggggagaa aacatagggg ggtactacga cctcccccct aggtgtccat tgtccattgt   5040
ccaaacaaat aaataaatat tgggttttta atgttaaaag gttgtttttt atgttaaagt   5100
gaaaaaaaca gatgttggga ggtacagtga tggttgtaga tagaaaagaa gagaaaaaag   5160
ttgctgttac tttaagactt acaacagaag aaaatgagat attaaataga atcaaagaaa   5220
aatataatat tagcaaatca gatgcaaccg gtattctaat aaaaaaatat gcaaaggagg   5280
aatacggtgc attttaaaca aaaaaagata gacagcactg gcatgctgcc tatctatgac   5340
taaattttgt taagtgtatt agcaccgtta ttatatcatg agcgaaaatg taataaaaga   5400
aactgaaaac aagaaaaatt caagaggacg taattggaca tttgttttat atccagaatc   5460
agcaaaagcc gagtggttag agtatttaaa agagttacac attcaatttg tagtgtctcc   5520
attacatgat agggatactg atacagaagg taggatgaaa aaagagcatt atcatattct   5580
agtgatgtat gagggtaata aatcttatga acagataaaa ataattacag aagaattgaa   5640
tgcgactatt ccgcagattg caggaagtgt gaaaggtctt gtgagatata tgcttcacat   5700
ggacgatcct aataaattta aatatcaaaa agaagatatg atagtttatg gcggtgtaga   5760
tgttgatgaa ttattaaaga aaacaacaac agatagatat aaattaatta aagaaatgat   5820
tgagtttatt gatgaacaag gaatcgtaga atttaagagt ttaatggatt atgcaatgaa   5880
gtttaaattt gatgattggt tcccgctttt atgtgataac tcggcgtatg ttattcaaga   5940
atatataaaa tcaaatcggt ataaatctga ccgatagatt ttgaatttag gtgtcacaag   6000
acactctttt ttcgcaccag cgaaaactgg tttaagccga ctgcgcaaaa gacataatcg   6060
actctagagg atccccggg                                                6079
<210>19
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物yusZlich1F
<400>19
tcagcagccc gcggagcagc cgttttaatg gaacc                                       35
<210>20
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物yusZlich2R
<400>20
atgaccgcac gt tcccaaat gctcgtcgcg cccgttacaa                                 40
<210>21
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物yusZl ich3F
<400>21
ttgtaacggg cgcgacgagc atttgggaac gtgcggtcat                                  40
<210>22
<211>36
<212>DNA
<213>人工序列
<223>引物yusZlich4R
<400>22
gcggatttga cgtcaatcgc ttaccagtgc ggaaac                                      36
<210>23
<211>4350
<212>DNA
<213>人工序列
<220>
<223>质粒pAN212b
<400>23
aattcagatc cttattgttc ccgcgggacg tcgattcaca aaaataggca cacgaaaaac     60
aagtaaggga tgcagtttat gcatccctta acttacttat taaataattt atagctattg    120
aaaagagata agaattgttc aaagctaata ttgtttaaat cgtcaattcc tgcatgtttt    180
aaggaattgt taaattgatt ttttgtaaat attttcttgt attctttgtt aacccatttc    240
ataacgaaat aattatactt ttgtttatct ttgtgtgata ttcttgattt ttttctactt    300
aatctgataa gtgagctatt cactttaggt ttaggatgaa aatattctct tggaaccata    360
cttaatatag aaatatcaac ttctgccatt aaaagtaatg ccaatgagcg ttttgtattt    420
aataatcttt tagcaaaccc gtattccacg attaaataaa tctcattagc tatactatca    480
aaaacaattt tgcgtattat atccgtactt atgttataag gtatattacc atatatttta    540
taggattggt ttttaggaaa tttaaactgc aatatatcct tgtttaaaac ttggaaatta    600
tcgtgatcaa caagtttatt ttctgtagtt ttgcataatt tatggtctat ttcaatggca    660
gttacgaaat tacacctctt tactaattca agggtaaaat ggccttttcc tgagccgatt    720
tcaaagatat tatcatgttc atttaatctt atatttgtca ttattttatc tatattatgt    780
tttgaagtaa taaagttttg actgtgtttt atatttttct cgttcattat aaccctcttt    840
aatttggtta tatgaatttt gcttattaac gattcattat aaccacttat tttttgtttg    900
gttgataatg aactgtgctg attacaaaaa tactaaaaat gcccatattt tttcctcctt    960
ataaaattag tataattata gcacgagctc tgataaatat gaacatgatg agtgatcgtt   1020
aaatttatac tgcaatcgga tgcgattatt gaataaaaga tatgagagat ttatctaatt   1080
tcttttttct tgtaaaaaaa gaaagttctt aaaggtttta tagttttggt cgtagagcac   1140
acggtttaac gacttaatta cgaagtaaat aagtctagtg tgttagactt tatgaaatct   1200
atatacgttt atatatattt attatccgga ggtgtagcat gtctcattca attttgaggg   1260
ttgccagagt taaaggatca agtaatacaa acgggataca aagacataat caaagagaga   1320
ataaaaacta taataataaa gacataaatc atgaggaaac atataaaaat tatgatttga   1380
ttaacgcaca aaatataaag tataaagata aaattgatga aacgattgat gagaattatt   1440
cagggaaacg taaaattcgg tcagatgcaa ttcgacatgt ggacggactg gttacaagtg   1500
ataaagattt ctttgatgat ttaagcggag aagaaataga acgatttttt aaagatagct   1560
tggagtttct agaaaatgaa tacggtaagg aaaatatgct gtatgcgact gtccatctgg   1620
atgaaagagt cccacatatg cactttggtt ttgtcccttt aacagaggac gggagattgt   1680
ctgcaaaaga acagttaggc aacaagaaag actttactca attacaagat agatttaatg   1740
agtatgtgaa tgagaaaggt tatgaacttg aaagaggcac gtccaaagag gttacagaac   1800
gagaacataa agcgatggat cagtacaaga aagatactgt atttcataaa caggaactgc   1860
aagaagttaa ggatgagtta cagaaggcaa ataagcagtt acagagtgga atagagcata   1920
tgaggtctac gaaacccttt gattatgaaa atgagcgtac aggtttgttc tctggacgtg   1980
aagagactgg tagaaagata ttaactgctg atgaatttga acgcctgcaa gaaacaatct   2040
cttctgcaga acggattgtt gatgattacg aaaatattaa gagcacagac tattacacag   2100
aaaatcaaga attaaaaaaa cgtagagaga gtttgaaaga agtagtgaat acatggaaag   2160
aggggtatca cgaaaaaagt aaagaggtta ataaattaaa gcgagagaat gatagtttga   2220
atgagcagtt gaatgtatca gagaaatttc aagctagtac agtgacttta tatcgtgctg   2280
cgagggcgaa tttccctggg tttgagaaag ggtttaatag gcttaaagag aaattcttta   2340
atgattccaa atttgagcgt gtgggacagt ttatggatgt tgtacaggat aatgtccaga   2400
aggtcgatag aaagcgtgag aaacagcgta cagacgattt agagatgtag aggtactttt   2460
atgccgagaa aactttttgc gtgtgacagt ccttaaaata tacttagagc gtaagcgaaa   2520
gtagtagcga cagctattaa ctttcggttt caaagctcta ggatttttaa tggacgcagc   2580
gcatcacacg caaaaaggaa attggaataa atgcgaaatt tgagatgtta attaaagacc   2640
tttttgaggt ctttttttct tagatttttg gggttattta ggggagaaaa catagggggg   2700
tactacgacc tcccccctag gtgtccattg tccattgtcc aaacaaataa ataaatattg   2760
ggtttttaat gttaaaaggt tgttttttat gttaaagtga aaaaaacaga tgttgggagg   2820
tacagtgatg gttgtagata gaaaagaaga gaaaaaagtt gctgttactt taagacttac   2880
aacagaagaa aatgagatat taaatagaat caaagaaaaa tataatatta gcaaatcaga   2940
tgcaaccggt attctaataa aaaaatatgc aaaggaggaa tacggtgcat tttaaacaaa   3000
aaaagataga cagcactggc atgctgccta tctatgacta aattttgtta agtgtattag   3060
caccgttatt atatcatgag cgaaaatgta ataaaagaaa ctgaaaacaa gaaaaattca   3120
agaggacgta attggacatt tgttttatat ccagaatcag caaaagccga gtggttagag   3180
tatttaaaag agttacacat tcaatttgta gtgtctccat tacatgatag ggatactgat   3240
acagaaggta ggatgaaaaa agagcattat catattctag tgatgtatga gggtaataaa   3300
tcttatgaac agataaaaat aattacagaa gaattgaatg cgactattcc gcagattgca   3360
ggaagtgtga aaggtcttgt gagatatatg cttcacatgg acgatcctaa taaatttaaa   3420
tatcaaaaag aagatatgat agtttatggc ggtgtagatg ttgatgaatt attaaagaaa   3480
acaacaacag atagatataa attaattaaa gaaatgattg agtttattga tgaacaagga   3540
atcgtagaat ttaagagttt aatggattat gcaatgaagt ttaaatttga tgattggttc   3600
ccgcttttat gtgataactc ggcgtatgtt attcaagaat atataaaatc aaatcggtat   3660
aaatctgacc gatagatttt gaatttaggt gtcacaagac actctttttt cgcaccagcg   3720
aaaactggtt taagccgact gcgcaaaaga cataatcgac tctagaggat ccccgggtac   3780
cgagctctgc cttttagtcc agctgatttc actttttgca ttctacaaac tgcataactc   3840
atatgtaaat cgctcctttt taggtggcac aaatgtgagg cattttcgct ctttccggca   3900
accacttcca agtaaagtat aacacactat actttatatt cataaagtgt gtgctctgcg   3960
aggctgtcgg cagtgccgac caaaaccata aaacctttaa gacctttctt ttttttacga   4020
gaaaaaagaa acaaaaaaac ctgccctctg ccacctcagc aaaggggggt tttgctctcg   4080
tgctcgttta aaaatcagca agggacaggt agtatttttt gagaagatca ctcaaaaaat   4140
ctccaccttt aaacccttgc caatttttat tttgtccgtt ttgtctagct taccgaaagc   4200
cagactcagc aagaataaaa tttttattgt ctttcggttt tctagtgtaa cggacaaaac   4260
cactcaaaat aaaaaagata caagagaggt ctctcgtatc ttttattcag caatcgcgcc   4320
cgattgctga acagattaat aatgagctcg                                    4350
<210>24
<211>843
<212>DNA
<213>地衣芽孢杆菌(Bacillus licheniformis)SJ1707
<220>
<221>CDS
<222>(1)..(840)
<223>YusZ
<400>24
ttg aac aat aaa atc gca att gta acg ggc gcg acg agc gga ttt ggt       48
Leu Asn Asn Lys Ile Ala Ile Val Thr Gly Ala Thr Ser Gly Phe Gly
1               5                   10                  15
tta ttg acc gct tta aaa ctc gca agc act cat ttc gta atc gca acg       96
Leu Leu Thr Ala Leu Lys Leu Ala Ser Thr His Phe Val Ile Ala Thr
            20                  25                  30
gcg cgc cat cea gaa aaa gcg gaa get ctg egg aac cgt ata gcg gag      144
Ala Arg His Pro Glu Lys Ala Glu Ala Leu Arg Asn Arg Ile Ala Gh
        35                  40                  45
ctg tcg atc gag tca tcg att gcc gtc gct gaa ctt gat gtc aca aac      192
Leu Ser Ile Glu Ser Ser Ile Ala ValAla Glu Leu Asp Val Thr Asn
    50                  55                 60
gaa caa tcg att tcc tca ttt tcc gaa gag ctg aag cag tac gga cag      240
Glu Gln Ser Ile Ser Ser Phe Ser GLU GLU Leu Lys Gln Tyr Gly Gln
65                  70                  75                  80
ata gac gtt ctc atc aat aat gca gga acg gca tac ggc gga tte gct      288
Ile Asp Val Leu Ile Asn Asn Ala Gly Thr Ala Tyr Gly Gly Phe Ala
                85                  90                  95
gaa gag ctt tct ctt ggc gac tac aga aaa cag tat gac acc aat gtt      336
Glu Glu Leu Ser Leu Gly Asp Tyr Arg Lys Gln Tyr Asp Thr Asn Val
            100                 105                 110
ttc ggc ctg gtg gca gtc aca aaa gcg gtc ctt cct tat atg aag aaa      384
Phe Gly Leu Val Ala Val Thr Lys Ala Val Leu Pro Tyr Met Lys Lys
        115                 120                 125
cac agc ggc gcc aaa atc atc aat ctg agc agc atc agc ggg cgg atc      432
His Ser Gly Ala Lys Ile Ile Asn Leu Ser Ser Ile Ser Gly Arg Ile
    130                 135                 140
gct ttc ccc gct ttc tcg gca tat gct tca tca aag cat gca gtt gaa      480
Ala Phe Pro Ala Phe Ser Ala Tyr Ala Ser Ser Lys His Ala Val Glu
145                  150                  155                  160
ggc ttt tca gaa agc ctc cgc ctc gaa ctc cgt cca ttc ggc atc aat      528
Gly Phe Ser Glu Ser Leu Arg Leu Glu Leu Arg Pro Phe Gly Ile Asn
                165                 170                 175
gtg gcc gtc gte cag ccg gga tcg tac cag acg gcg att tgg gag aca      576
Val Ala Val Val Gln Pro Gly Ser Tyr Gln Thr Ala Ile Trp Glu Thr
            180                 185                 190
tcg ttt gcc gcc caa gtc act gca cct gat gcc gaa tea cag tac aaa      624
Ser Phe Ala Ala Gln Val Thr Ala Pro Asp Ala Glu Ser Gln Tyr Lys
        195                 200                 205
aca tat ttc gag cgg atc tcc gcc tac att gca gcg agc cgc aaa cat      672
Thr Tyr Phe Glu Arg Ile Ser Ala Tyr Ile Ala Ala Ser Arg Lys His
    210                 215                 220
tac gga aac ecg gat gat gtg gct gaa ttg atc tgc cga ctc gct gca      720
Tyr Gly Asn Pro Asp Asp Val Ala Glu Leu Ile Cys Arg Leu Ala Ala
225                 230                 235                 240
aaa aag cgg ctg aac agg ctg cgc tat ccg atc ggc agg ggc gtc cgt      768
Lys Lys Arg Leu Asn Arg Leu Arg Tyr Pro Ile Gly Arg Gly Val Arg
                245                 250                 255
ctc tcg atc ctt ctc cac caa atc ctg cca tgg cgg att tgg gaa cgt      816
Leu Ser Ile Leu Leu His Gln Ile Leu Pro Trp Arg Ile Trp Glu Arg
            260                 265                 270
gcg gtc ata aaa aaa ttg ctt aaa tga                                  843
Ala Val Ile Lys Lys Leu Leu Lys
        275                 280
<210>25
<211>280
<212>PRT
<213>地衣芽孢杆菌SJ1707
<400>25
Leu Asn Asn Lys Ile Ala Ile Val Thr Gly Ala Thr Ser Gly Phe Gly
1               5                   10                  15
Leu Leu Thr Ala Leu Lys Leu Ala Ser Thr His Phe Val Ile Ala Thr
            20                  25                  30
Ala Arg His Pro Glu Lys Ala Glu Ala Leu Arg Asn Arg Ile Ala Glu
        35                  40                  45
Leu Ser Ile Glu Ser Ser Ile Ala Val Ala Glu Leu Asp Val Thr Asn
    50                  55                  60
Glu Gln Ser Ile Ser Ser Phe Ser Glu Glu Leu Lys Gln Tyr Gly Gln
65                  70                  75                  80
Ile Asp Val Leu Ile Asn Asn Ala Gly Thr Ala Tyr Gly Gly Phe Ala
                85                  90                  95
Glu Glu Leu Ser Leu Gly Asp Tyr Arg Lys Gln Tyr Asp Thr Asn Val
            100                 105                 110
Phe Gly Leu Val Ala Val Thr Lys Ala Val Leu Pro Tyr Met Lys Lys
        115                 120                 125
His Ser Gly Ala Lys Ile Ile Asn Leu Ser Ser Ile Ser Gly Arg Ile
    130                 135                 140
Ala Phe Pro Ala Phe Ser Ala Tyr Ala Ser Ser Lys His Ala Val Glu
145                 150                 155                 160
Gly Phe Ser Glu Ser Leu Arg Leu Glu Leu Arg Pro Phe Gly Ile Asn
                165                 170                 175
Val Ala Val Val Gln Pro Gly Ser Tyr Gln Thr Ala Ile Trp Glu Thr
            180                 185                 190
Ser Phe Ala Ala Gln Val Thr Ala Pro Asp Ala Glu Ser Gln Tyr Lys
        195                 200                 205
Thr Tyr Phe Glu Arg Ile Ser Ala Tyr Ile Ala Ala Ser Arg Lys His
    210                 215                 220
Tyr Gly Asn Pro Asp Asp Val Ala Glu Leu Ile Cys Arg Leu Ala Ala
225                 230                 235                 240
Lys Lys Arg Leu Ash Arg Leu Arg Tyr Pro Ile Gly Arg Gly Val Arg
                245                 250                 255
Leu Ser Ile Leu Leu His Gln Ile Leu Pro Trp Arg Ile Trp Glu Arg
            260                 265                 270
Ala Val Ile Lys Lys Leu Leu Lys
        275                 280
<210>26
<211>5313
<212>DNA
<213>人工序列
<220>
<223>质粒pAN212b-yusZ
<400>26
aattcagatc cttattgttc ccgcggagca gccgttttaa tggaaccgac tccccctctt     60
ccagatatac gcttgatcct tccgtttgag cggcattttt gctgactttc acacgatctt    120
ccaaatttcc gttttctatt gcataaatcg ccgtggcaat tttggttatg ctggctggat    180
acattttttt gcggctgttt ttttcataga ggacctggcc cgatttccca tcgatcaata    240
tagcggaaac gcttttgatt tccggtttgt ttttttctcc tgcttgagcc gagctatgaa    300
aaaacagcgt cagacatagt acaataatga acaggaggga tcgtttaaca ttcatcgtgt    360
caccctgcct tctttctctt ttgcaatttt tataaaaata ggtcttttag cactttttaa    420
attttaccaa tgatgaactg tcgctgacaa gccttttctt gtcaacaagc caaaattttg    480
aatggaggaa actcattgaa caataaaatc gcaattgtaa cgggcgcgac gagcatttgg    540
gaacgtgcgg tcataaaaaa attgcttaaa tgaggtaatt taaaataatt ataatttagt    600
attgatttta attttgtatt tgttataata taattaacaa atgaaaaaca cgaggaggaa    660
atatcatatg atctctcaac aattaaaaca gcaaaatcct gtacttgaaa actcaatgaa    720
tacgaatttg tcaaactggt tcatccttta cacgaagctt caccgttttc actggtacgt    780
aaaagggccg cagttcttta ccctacatga aaaatttgaa gagctataca accatgcgtc    840
agaaacagca gatgtgatcg cggaacgctt gctggccatc ggcggacagc cgctcgccac    900
aatgaaagaa tacattgacc acggcacaat tgaggaaaac ggagccgaaa aaacggccga    960
agaaatggtt tccgcactgg taagcgattg acgtcgattc acaaaaatag gcacacgaaa   1020
aacaagtaag ggatgcagtt tatgcatccc ttaacttact tattaaataa tttatagcta   1080
ttgaaaagag ataagaattg ttcaaagcta atattgttta aatcgtcaat tcctgcatgt   1140
tttaaggaat tgttaaattg attttttgta aatattttct tgtattcttt gttaacccat   1200
ttcataacga aataattata cttttgttta tctttgtgtg atattcttga tttttttcta   1260
cttaatctga taagtgagct attcacttta ggtttaggat gaaaatattc tcttggaacc   1320
atacttaata tagaaatatc aacttctgcc attaaaagta atgccaatga gcgttttgta   1380
tttaataatc ttttagcaaa cccgtattcc acgattaaat aaatctcatt agctatacta   1440
tcaaaaacaa ttttgcgtat tatatccgta cttatgttat aaggtatatt accatatatt   1500
ttataggatt ggtttttagg aaatttaaac tgcaatatat ccttgtttaa aacttggaaa   1560
ttatcgtgat caacaagttt attttctgta gttttgcata atttatggtc tatttcaatg   1620
gcagttacga aattacacct ctttactaat tcaagggtaa aatggccttt tcctgagccg   1680
atttcaaaga tattatcatg ttcatttaat cttatatttg tcattatttt atctatatta   1740
tgttttgaag taataaagtt ttgactgtgt tttatatttt tctcgttcat tataaccctc   1800
tttaatttgg ttatatgaat tttgcttatt aacgattcat tataaccact tattttttgt   1860
ttggttgata atgaactgtg ctgattacaa aaatactaaa aatgcccata ttttttcctc   1920
cttataaaat tagtataatt atagcacgag ctctgataaa tatgaacatg atgagtgatc   1980
gttaaattta tactgcaatc ggatgcgatt attgaataaa agatatgaga gatttatcta   2040
atttcttttt tcttgtaaaa aaagaaagtt cttaaaggtt ttatagtttt ggtcgtagag   2100
cacacggttt aacgacttaa ttacgaagta aataagtcta gtgtgttaga ctttatgaaa   2160
tctatatacg tttatatata tttattatcc ggaggtgtag catgtctcat tcaattttga   2220
gggttgccag agttaaagga tcaagtaata caaacgggat acaaagacat aatcaaagag   2280
agaataaaaa ctataataat aaagacataa atcatgagga aacatataaa aattatgatt   2340
tgattaacgc acaaaatata aagtataaag ataaaattga tgaaacgatt gatgagaatt   2400
attcagggaa acgtaaaatt cggtcagatg caattcgaca tgtggacgga ctggttacaa   2460
gtgataaaga tttctttgat gatttaagcg gagaagaaat agaacgattt tttaaagata   2520
gcttggagtt tctagaaaat gaatacggta aggaaaatat gctgtatgcg actgtccatc   2580
tggatgaaag agtcccacat atgcactttg gttttgtccc tttaacagag gacgggagat   2640
tgtctgcaaa agaacagtta ggcaacaaga aagactttac tcaattacaa gatagattta   2700
atgagtatgt gaatgagaaa ggttatgaac ttgaaagagg cacgtccaaa gaggttacag   2760
aacgagaaca taaagcgatg gatcagtaca agaaagatac tgtatttcat aaacaggaac   2820
tgcaagaagt taaggatgag ttacagaagg caaataagca gttacagagt ggaatagagc   2880
atatgaggtc tacgaaaccc tttgattatg aaaatgagcg tacaggtttg ttctctggac   2940
gtgaagagac tggtagaaag atattaactg ctgatgaatt tgaacgcctg caagaaacaa   3000
tctcttctgc agaacggatt gttgatgatt acgaaaatat taagagcaca gactattaca   3060
cagaaaatca agaattaaaa aaacgtagag agagtttgaa agaagtagtg aatacatgga   3120
aagaggggta tcacgaaaaa agtaaagagg ttaataaatt aaagcgagag aatgatagtt   3180
tgaatgagca gttgaatgta tcagagaaat ttcaagctag tacagtgact ttatatcgtg   3240
ctgcgagggc gaatttccct gggtttgaga aagggtttaa taggcttaaa gagaaattct   3300
ttaatgattc caaatttgag cgtgtgggac agtttatgga tgttgtacag gataatgtcc   3360
agaaggtcga tagaaagcgt gagaaacagc gtacagacga tttagagatg tagaggtact   3420
tttatgccga gaaaactttt tgcgtgtgac agtccttaaa atatacttag agcgtaagcg   3480
aaagtagtag cgacagctat taactttcgg tttcaaagct ctaggatttt taatggacgc   3540
agcgcatcac acgcaaaaag gaaattggaa taaatgcgaa atttgagatg ttaattaaag   3600
acctttttga ggtctttttt tcttagattt ttggggttat ttaggggaga aaacataggg   3660
gggtactacg acctcccccc taggtgtcca ttgtccattg tccaaacaaa taaataaata   3720
ttgggttttt aatgttaaaa ggttgttttt tatgttaaag tgaaaaaaac agatgttggg   3780
aggtacagtg atggttgtag atagaaaaga agagaaaaaa gttgctgtta ctttaagact   3840
tacaacagaa gaaaatgaga tattaaatag aatcaaagaa aaatataata ttagcaaatc   3900
agatgcaacc ggtattctaa taaaaaaata tgcaaaggag gaatacggtg cattttaaac   3960
aaaaaaagat agacagcact ggcatgctgc ctatctatga ctaaattttg ttaagtgtat   4020
tagcaccgtt attatatcat gagcgaaaat gtaataaaag aaactgaaaa caagaaaaat   4080
tcaagaggac gtaattggac atttgtttta tatccagaat cagcaaaagc cgagtggtta   4140
gagtatttaa aagagttaca cattcaattt gtagtgtctc cattacatga tagggatact   4200
gatacagaag gtaggatgaa aaaagagcat tatcatattc tagtgatgta tgagggtaat   4260
aaatcttatg aacagataaa aataattaca gaagaattga atgcgactat tccgcagatt   4320
gcaggaagtg tgaaaggtct tgtgagatat atgcttcaca tggacgatcc taataaattt   4380
aaatatcaaa aagaagatat gatagtttat ggcggtgtag atgttgatga attattaaag   4440
aaaacaacaa cagatagata taaattaatt aaagaaatga ttgagtttat tgatgaacaa   4500
ggaatcgtag aatttaagag tttaatggat tatgcaatga agtttaaatt tgatgattgg   4560
ttcccgcttt tatgtgataa ctcggcgtat gttattcaag aatatataaa atcaaatcgg   4620
tataaatctg accgatagat tttgaattta ggtgtcacaa gacactcttt tttcgcacca   4680
gcgaaaactg gtttaagccg actgcgcaaa agacataatc gactctagag gatccccggg   4740
taccgagctc tgccttttag tccagctgat ttcacttttt gcattctaca aactgcataa   4800
ctcatatgta aatcgctcct ttttaggtgg cacaaatgtg aggcattttc gctctttccg   4860
gcaaccactt ccaagtaaag tataacacac tatactttat attcataaag tgtgtgctct   4920
gcgaggctgt cggcagtgcc gaccaaaacc ataaaacctt taagaccttt ctttttttta   4980
cgagaaaaaa gaaacaaaaa aacctgccct ctgccacctc agcaaagggg ggttttgctc   5040
tcgtgctcgt ttaaaaatca gcaagggaca ggtagtattt tttgagaaga tcactcaaaa   5100
aatctccacc tttaaaccct tgccaatttt tattttgtcc gttttgtcta gcttaccgaa   5160
agccagactc agcaagaata aaatttttat tgtctttcgg ttttctagtg taacggacaa   5220
aaccactcaa aataaaaaag atacaagaga ggtctctcgt atcttttatt cagcaatcgc   5280
gcccgattgc tgaacagatt aataatgagc tcg                                5313

Claims (57)

1.突变的原核细胞,其与其它的等基因但未突变的细胞相比,降低了YusZ(SEQ ID NOs:2或25)、YusX(SEQ ID NO:4)或其同源物的表达水平,并分泌较高量的至少一种目标异源多肽。
2.根据权利要求1所述的细胞,其是革兰氏阳性细胞。
3.根据权利要求2所述的细胞,其是芽孢杆菌属细胞。
4.根据权利要求3所述的细胞,其是嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、B.clausii、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌细胞。
5.根据权利要求1-4任一项所述的细胞,其中所述YusZ或YusX同源物包含分别与SEQ ID NOs:2或25、或SEQ ID NO:4所示序列具有至少70%同一性的氨基酸序列。
6.根据权利要求1-5任一项所述的细胞,其在yusZ(SEQ ID NOs:1或24)、yusX(SEQ ID NO:3)和/或yusY(SEQ ID NO:5),或其同源物中突变。
7.根据权利要求6所述的细胞,其中所述yusZ、yusX和/或yusY同源物编码多肽,所述多肽具有分别与SEQ ID NOs:2或25、SEQ ID NO:4、或SEQ ID NO:6所示序列具有至少70%同一性的氨基酸序列。
8.根据权利要求6所述的细胞,其中所述yusZ、yusX和/或yusY同源物具有分别与SEQ ID NOs:1或24、SEQ ID NO:3、或SEQ ID NO:5所示序列具有至少70%同一性的核苷酸序列。
9.根据权利要求1-8任一项所述的细胞,其在至少一种多核苷酸突变,其中所述至少一种多核苷酸中具有至少100bp大小的亚序列能够与具有SEQ ID NOs:1或24、SEQ ID NO:3、或SEQ ID NO:5所示序列或其各自的互补序列的多核苷酸在中等严紧杂交条件下杂交。
10.根据权利要求6-9任一项所述的细胞,其中yusZ、yusX和/或yusY,或其同源物,部分或全部从染色体中缺失。
11.根据权利要求6-9任一项所述的细胞,其中yusZ、yusX和/或yusY,或其同源物,包含至少一种移码突变或无义突变。
12.根据权利要求1-11任一项所述的细胞,其与其它的等基因但未突变的细胞相比,YusZ或YusX,或其同源物的表达水平降低至少两倍。
13.根据权利要求1-12任一项所述的细胞,其与其它的等基因但未突变的细胞相比,检测不到YusZ或YusX,或其同源物的表达。
14.根据权利要求1-13任一项所述的细胞,其中所述至少一种异源多肽包含酶。
15.根据权利要求14所述的细胞,其中所述的酶是裂合酶、连接酶、水解酶、氧化还原酶、转移酶或异构酶。
16.根据权利要求1-15任一项所述的细胞,其包含一个或多个染色体整合的、编码所述至少一种异源多肽的多核苷酸的拷贝。
17.根据权利要求1-16任一项所述的细胞,其中所述至少一种异源多肽由从至少一种异源启动子转录的多核苷酸编码。
18.根据权利要求17所述的细胞,其中所述至少一种启动子包含人工启动子。
19.根据权利要求18所述的细胞,其中所述人工启动子包含一种或多种mRNA稳定序列,优选衍生自cryIIIa启动子。
20.构建突变的原核细胞的方法,所述方法包含如下步骤:
a)将原核细胞突变;和
b)筛选与其它等基因但未突变的细胞相比,降低了YusZ(SEQ ID NOs:2或25)或YusX(SEQ ID NO:4)、或其同源物的表达水平、并分泌较高量的至少一种目标异源多肽的突变细胞。
21.根据权利要求20所述的方法,其中所述细胞是革兰氏阳性细胞。
22.根据权利要求21所述的方法,其中所述细胞是芽孢杆菌属细胞。
23.根据权利要求22所述的方法,其中所述细胞是嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、B.clausii、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌细胞。
24.根据权利要求20-23任一项所述的方法,其中所述YusZ或YusX同源物包含分别与SEQ ID NOs:2或25、或SEQ ID NO:4所示序列具有至少70%同一性的氨基酸序列。
25.根据权利要求20-24任一项所述的方法,其中步骤(a)中所述细胞在yusZ(SEQ ID NOs:1或24)、yusX(SEQ ID NO:3)和/或yusY(SEQ IDNO:5),或其同源物中突变。
26.根据权利要求25所述的方法,其中所述yusZ、yusX和/或yusY同源物编码多肽,所述多肽具有分别与SEQ ID NOs:2或25、SEQ ID NO:4、或SEQ ID NO:6所示序列具有至少70%同一性的氨基酸序列。
27.根据权利要求25所述的方法,其中所述yusZ、yusX和/或yusY同源物具有分别与SEQ ID NOs:1或24、SEQ ID NO:3、或SEQ ID NO:5所示序列具有至少70%同一性的核苷酸序列。
28.根据权利要求20-27任一项所述的方法,其中步骤(a)中所述细胞在至少一种多核苷酸中突变,其中所述至少一种多核苷酸中具有至少100bp大小的亚序列与具有SEQ ID NOs:1或24、SEQ ID NO:3、或SEQ ID NO:5所示序列或其各自的互补序列的多核苷酸在中等严紧杂交条件下杂交。
29.根据权利要求25-28任一项所述的方法,其中步骤(a)中所述细胞通过从细胞的染色体中部分或全部缺失yusZ、yusX和/或yusY,或其同源物来进行突变。
30.根据权利要求25-28任一项所述的方法,其中步骤(a)中所述细胞通过在yusZ、yusX和/或yusY,或其同源物中导入至少一种移码突变或无义突变来进行突变。
31.根据权利要求20-30任一项所述的方法,其中在步骤(b)中所筛选的细胞与其它的等基因但未突变的细胞相比,YusZ或YusX,或其同源物的表达水平降低了至少两倍。
32.根据权利要求20-31任一项所述的方法,其中在步骤(b)中所筛选的细胞与其它的等基因但未突变的细胞相比,检测不到YusZ或YusX,或其同源物的表达。
33.根据权利要求20-32任一项所述的方法,其中所述至少一种目标异源多肽包含酶。
34.根据权利要求33所述的方法,其中所述酶是裂合酶、连接酶、水解酶、氧化还原酶、转移酶或异构酶。
35.根据权利要求20-34任一项所述的方法,其中所述细胞包含一个或多个染色体整合的、编码所述至少一种目标异源多肽的多核苷酸的拷贝。
36.根据权利要求20-35任一项所述的方法,其中所述至少一种目标异源多肽由从至少一种异源启动子转录的多核苷酸编码。
37.根据权利要求36所述的方法,其中所述至少一种启动子包含人工启动子。
38.根据权利要求37所述的方法,其中所述人工启动子包含一种或多种mRNA稳定序列,优选衍生自cryIIIa启动子。
39.生产目标多肽的方法,所述方法包含如下步骤:
(a)培养突变的原核细胞,其与其它的等基因但未突变的细胞相比,降低了YusZ(SEQ ID NOs:2或25)、YusX(SEQ ID NO:4)、或其同源物的表达水平,同时分泌较高量的目标多肽;和
(b)分离目标多肽。
40.根据权利要求39所述的方法,其中所述细胞是革兰氏阳性细胞。
41.根据权利要求40所述的方法,其中所述细胞是芽孢杆菌属细胞。
42.根据权利要求41所述的方法,其中所述细胞是嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、B.clausii、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌细胞。
43.根据权利要求39-42任一项所述的方法,其中所述YusZ或YusX同源物包含分别与SEQ ID NOs:2或25、或SEQ ID NO:4所示序列具有至少70%同一性的氨基酸序列。
44.根据权利要求39-43任一项所述的方法,其中步骤(a)中所述细胞在yusZ(SEQ ID NOs:1或24)、yusX(SEQ ID NO:3)、和/或yusY(SEQ IDNO:5),或其同源物中突变。
45.根据权利要求44所述的方法,其中所述yusZ、yusX、和/或yusY同源物编码多肽,所述多肽具有分别与SEQ ID Nos:2或25、SEQ ID NO:4、或SEQ ID NO:6所示序列具有至少70%同一性的氨基酸序列。
46.根据权利要求44所述的方法,其中所述yusZ、yusX、和/或yusY同源物具有分别与SEQ ID NOs:1或24、SEQ ID NO:3、或SEQ ID NO:5所示序列具有至少70%同一性的核苷酸序列。
47.根据权利要求39-46任一项所述的方法,其中步骤(a)中所述细胞在至少一种多核苷酸中突变,其中所述至少一种多核苷酸中具有至少100bp大小的亚序列与具有SEQ ID NOs:1或24、SEQ ID NO:3、或SEQ ID NO:5所示序列或其各自的互补序列的多核苷酸在中度严紧杂交条件下杂交。
48.根据权利要求39-47任一项所述的方法,其中步骤(a)中所述细胞通过从细胞的染色体中部分或全部缺失yusZ、yusX、和/或yusY,或其同源物来进行突变。
49.根据权利要求39-47任一项所述的方法,其中步骤(a)中所述细胞通过向yusZ、yusX、和/或yusY,或其同源物中导入至少一种移码突变或无义突变来进行突变。
50.根据权利要求39-49任一项所述的方法,其中步骤(a)中所述细胞与其它的等基因但未突变的细胞相比,YusZ或YusX,或其同源物的表达水平降低了至少两倍。
51.根据权利要求39-50任一项所述的方法,其中步骤(a)中所述细胞与其它的等基因但未突变的细胞相比,检测不到YusZ或YusX,或其同源物的表达。
52.根据权利要求39-51任一项所述的方法,其中所述至少一种目标多肽包含酶。
53.根据权利要求52所述的方法,其中所述酶是裂合酶、连接酶、水解酶、氧化还原酶、转移酶或异构酶。
54.根据权利要求39-53任一项所述的方法,其中所述细胞包含一个或多个染色体整合的、编码所述至少一种目标多肽的多核苷酸的拷贝。
55.根据权利要求39-54任一项所述的方法,其中所述至少一种目标多肽由从至少一种异源启动子转录的多核苷酸编码。
56.根据权利要求55所述的方法,其中所述至少一种启动子包含人工启动子。
57.根据权利要求56所述的方法,其中所述人工启动子包含一个或多个mRNA稳定序列,优选衍生自cryIIIa启动子。
CNA2005800186315A 2004-04-07 2005-04-07 具有高分泌水平的突变的原核细胞 Pending CN1965085A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DKPA200400582 2004-04-07
DKPA200400582 2004-04-07

Publications (1)

Publication Number Publication Date
CN1965085A true CN1965085A (zh) 2007-05-16

Family

ID=34962895

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800186315A Pending CN1965085A (zh) 2004-04-07 2005-04-07 具有高分泌水平的突变的原核细胞

Country Status (7)

Country Link
US (1) US7951556B2 (zh)
EP (1) EP1735451B1 (zh)
CN (1) CN1965085A (zh)
AT (1) ATE447031T1 (zh)
DE (1) DE602005017374D1 (zh)
DK (1) DK1735451T3 (zh)
WO (1) WO2005098003A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101621100B1 (ko) 2007-03-30 2016-05-13 더 리서치 파운데이션 오브 스테이트 유니버시티 오브 뉴욕 백신에 유용한 약독화 바이러스

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9708452D0 (en) 1997-04-26 1997-06-18 Univ Newcastle Improved prokaryotic expression of protein

Also Published As

Publication number Publication date
US7951556B2 (en) 2011-05-31
DK1735451T3 (da) 2010-03-08
DE602005017374D1 (de) 2009-12-10
EP1735451A1 (en) 2006-12-27
US20090136995A1 (en) 2009-05-28
WO2005098003A1 (en) 2005-10-20
EP1735451B1 (en) 2009-10-28
ATE447031T1 (de) 2009-11-15

Similar Documents

Publication Publication Date Title
US6326206B1 (en) In vivo recombination
JP4571304B2 (ja) バチルス細胞内でのポリペプチドの製法
US9458468B2 (en) Method for stable gene-amplification in a bacterial host cell
EP2689015B1 (en) Methods for producing secreted polypeptides
CN109312353A (zh) 通过crispr-抑制来改善微生物
WO2003095658A1 (en) Homologous recombination into bacterium for the generation of polynucleotide libraries
CN101495625B (zh) 地衣芽孢杆菌中的氯霉素抗性选择
US20070259404A1 (en) Method of Producing Heterologous Proteases
JP2001503641A (ja) バシラス細胞のサーファクチン突然変異株におけるポリペプチドの製造方法
CN113939588A (zh) 温度敏感性的rna指导的内切核酸酶
EP1995319A1 (en) Bacillus licheniformis mutant host cell
DK3019607T3 (en) DIRECT TRANSMISSION OF POLYNUCLEOTIDES BETWEEN GENOMES
EP1290207B1 (en) Method for increasing gene copy number in a host cell and resulting host cell
US8535911B2 (en) Cell with improved secretion mediated by MrgA protein or homologue
EP1497431A2 (en) Improved bacillus host cell
CN1965085A (zh) 具有高分泌水平的突变的原核细胞
Kimura et al. Determination and characterization of IS4Bsu1-insertion loci and identification of a new insertion sequence element of the IS256 family in a natto starter
WO2003087148A2 (en) Bacillus licheniformis mutant host cell
DK3044591T3 (en) RECOMBINANT MICRO-ORGANISMS AND PROCEDURES FOR USE THEREOF
KR20220097505A (ko) 바실러스 세포에서 단백질 생산을 향상시키기 위한 조성물 및 방법
Yamagata et al. A stable plasmid vector and control of its copy number in Bacillus brevis 47, a protein-producing bacterium
US20220170003A1 (en) Means And Methods For Improving Protease Expression
CN111417726A (zh) 通过与前肽共表达改善蛋白酶的表达
JP2002515755A (ja) インビボ組換え

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070516