CN105950523A

CN105950523A - 在芽孢杆菌属细胞中获得遗传感受态的方法

Info

Publication number: CN105950523A
Application number: CN201610266725.4A
Authority: CN
Inventors: 兰迪·伯卡; 米歇尔·马兰塔; 玛丽亚·唐; 巴巴拉·彻里
Original assignee: Novozymes Biotech Inc
Current assignee: Novozymes Inc
Priority date: 2006-12-21
Filing date: 2007-12-19
Publication date: 2016-09-21

Abstract

本发明涉及在芽孢杆菌属细胞中获得遗传感受态的方法，具体地涉及为用外源DNA转化而在非感受态芽孢杆菌属细胞中获得遗传感受态的方法。

Description

在芽孢杆菌属细胞中获得遗传感受态的方法

本发明申请是基于申请日为2007年12月19日，申请号为200780051674.2(国际申请号为PCT/US2007/088186)、名称为“在芽孢杆菌属细胞中获得遗传感受态的方法”的发明专利申请的分案申请。

对序列表的引用

本申请包含计算机可读格式的序列表。所述计算机可读格式通过提述并入本文。

技术领域

本发明涉及在非感受态芽孢杆菌属(Bacillus)细胞中获得遗传感受态的方法。

背景技术

遗传感受态是这样的生理状态：外源DNA能够被内在化，产生转化事件(Berka等,2002,Mol.Microbiol.43:1331-45)，但是与涉及电穿孔、原生质体和热休克或CaCl₂处理的人工转化不同。在革兰氏阳性和革兰氏阴性细菌菌种中都已经观察到了天然感受态(Dubnau,1999,Annual Rev.Microbiol.53:217-44)，并且过程需要十几种蛋白质，其表达经过精确地设计编排以满足每种生物的需要。

关于天然感受态的目的，已经提出了几种假设，这些假设可以总结为为食物的DNA、为修复的DNA和为遗传多样性的DNA(Dubnau,1999,见上文)。为食物的DNA假设得到如下观察结果的支持：感受态是稳定期现象，当细胞营养有限时出现，并且强大的非特异性核酸酶经常与转化特异性蛋白质共表达。第二种假设的证据来自下述事实：编码DNA修复酶的基因与编码DNA转运蛋白的那些基因协同表达。最后，用于遗传多样性的DNA假设提出，感受态是通过水平基因转移用于探索适应性景观(for exploring the fitness landscape)的机制。感受态受到细胞密度感受机制(quorum-sensing mechanism)的调节，并且其是一种双稳态状态(Avery,2005,Trends Microbiol.13:459-462)，这样的观察结果支持着这一假设。

公共数据库现在包含众多完整的细菌基因组，包括来自同一菌种不同菌株的几个基因组。近来的分析表明，使用配对全基因组比对，同一菌种的不同菌株在基因内容上可能有很大差异。例如，大肠杆菌菌株CFT073、EDL933和MG1655的基因组比较表明，它们的联合蛋白质(基因产物)集合中只有39.2％对于所有三株菌都是常见的，突出表明了同一菌种的菌株之间令人惊讶的多样性(Blattner等,1997,Science 277:1453-74；Hayashi等,2006,Mol.Syst.Biol.doi:10.1038:msb4100049；Perna等,2001,Nature 409:529-33；Welch等,2002,Proc.Natl.Acad Sci.USA 99:17020-17024)。此外，大肠杆菌菌株CFT073的基因组序列表明有1,623个菌株特异基因(21.2％)。根据这类比较，清楚地表明细菌基因组分成常见的保守骨架和菌株特异性序列。通常，菌种中指定菌株的基因组按照在所有菌株之间都保守的保守“骨架”基因和可能通过水平转移获得的非保守基因的分布而呈现镶嵌结构(Brzuszkiewicz等,2006,Proc.Natl.Acad.Sci.USA 103:12879-12884；Welch等,2002,见上文)。

按照实际应用，藉由天然感受态的转化是构建细菌菌株如芽孢杆菌的极为有用的工具，所述菌株中可以包含染色体基因的已改变的等位基因，或者通过重组DNA方法装配的质粒。尽管可以通过上述人工方法(例如，电穿孔、原生质体，和热休克或CaCl₂处理)实现用质粒和染色体DNA转化某些菌种，但是通过天然感受态导入DNA可以在简单、方便、速度和效率方面提供明显的优势。

在枯草芽孢杆菌(Bacillus subtilis)中，藉由涉及细胞密度感受、信号转导和基因表达级联的过程，群体中只有5-10％的细胞分化成感受态状态(称为K-状态)(Avery,2005,见上文)。已知至少50个基因与感受态直接有关，并且多达165个基因受到中央转录因子ComK(直接或间接)的调节(Berka等,2002,见上文)。枯草芽孢杆菌中的感受态级联由两个调节模块组成，所述模块由分子开关(图1)间隔，所述分子开关涉及ComS与衔接分子MecA的结合，从而通过ClpC/ClpP蛋白酶干扰转录因子ComK的降解(Turgay等,1998,EMBO J.17:6730-6738)。

在密切相关的菌种地衣芽孢杆菌(Bacillus licheniformis)中，感受态相比而言知之甚少。Thorne和同事(Gwinn和Thorne,1964,见上文；Leonard等,1964,J.Bacteriol.88:220-225；Thorne和Stull,1966,J.Bacteriol.91:1012-1020)在20世纪60年代发表了一系列文章，描述通过天然感受态对源自地衣芽孢杆菌ATCC 9945A的三株营养缺陷型突变体的转化。仅在三株特定的营养缺陷型突变体，9945A-M28(gly^–)、-M30(未表征的营养缺陷型)，和-M33(pur–)中观察到了天然感受态。源自相同亲本菌株(ATCC 9945A)的很多其他营养缺陷型不产生转化体，包括需要硫胺素、赖氨酸、精氨酸、甲硫氨酸、色氨酸、组氨酸、尿嘧啶、腺嘌呤或次黄嘌呤，和13种其他未表征的营养缺陷型需要(Gwinn和Thorne,1964,见上文)的那些。此外，这些研究者不能证明地衣芽孢杆菌ATCC 10716中通过天然感受态进行的转化(Gwinn和Thorne,1964,见上文)。如Throne和同事的早期工作所建议的，大多数地衣芽孢杆菌分离株不出现天然感受态，并且近年来，仅通过电穿孔(Tangney等,1994,Biotechnol.Techniques 8:463-466)、接合(Herzog-Velikonja等,1994,Plasmid31:201-206)或原生质体(protoplasing)(Pragai等,1994,Microbiol(Reading)140:305-310)，已经实现了很多地衣芽孢杆菌分离株的转化。地衣芽孢杆菌中明显缺少感受态状态的原因尚不可知。

Ashikaga等,2000,Journal of Bacteriology 182:2411-2415，描述了枯草芽孢杆菌纳豆亚种(Bacillus subtlis subsp.natto)发展遗传感受态和表达并入外源DNA所需的后期感受态基因(late competence gene)的能力。Liu等,1996,Journal ofBacteriology 178:5144-5152，描述了通过多拷贝表达comS而提高野生型枯草芽孢杆菌中感受基因转录和转化效率。Tortosa等,2000,Molecular Microbiology 35:1110-1119，证明了破坏ylbF基因会引起comK表达的减少，并且comS的过量表达足以避开ylbF突变的感受态表型。

因为地衣芽孢杆菌是具有工业重要性的菌种，所以极为期望表现天然感受态的工程菌株用于构建新的改进型生产菌株。提供用于在转化性差的地衣芽孢杆菌菌株中诱导感受态的交钥匙方法(turn-key method)可以提高导入染色体标记/等位基因和表达质粒的速度与效率。如本文所述，术语转化性差和非感受态可互换使用，这些术语指，当如前所述用于在枯草芽孢杆菌或土芽孢杆菌中感受态介导的转化时，每微克DNA中的转化体数目小于自发突变效率的两倍(Anagnostopoulos和Spizizen,1961,J.Bacteriol.81:741-746；Thorne和Stull,1966,J.Bacteriol.91:1012-1020；Gwinn和Thorne,1964,见上文)。

本发明涉及在非感受态芽孢杆菌属细胞中获得遗传感受态的方法。

发明内容

本发明涉及获得感受态芽孢杆菌属宿主细胞的方法，包含：

(a)将至少一个拷贝的第一核酸构建体导入非感受态芽孢杆菌属宿主细胞，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌属宿主细胞是外源的；和

(b)分离包含编码ComS多肽的多核苷酸的感受态芽孢杆菌属宿主细胞。

本发明还涉及获得芽孢杆菌属转化体的方法，包含：

(a)将外源DNA转化进芽孢杆菌属宿主细胞，所述细胞通过至少一个拷贝的导入的第一核酸构建体而成为感受态，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌属宿主细胞是外源的；和

(b)分离包含所述外源DNA的芽孢杆菌属宿主细胞转化体。

本发明还涉及产生生物物质的方法，包含：

(a)在有利于产生所述物质的条件下培养用外源DNA转化的芽孢杆菌属宿主细胞，所述DNA编码或参与具有生物活性的物质的表达，其中通过至少一个拷贝的导入的核酸构建体而使芽孢杆菌属宿主细胞成为感受态，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌属宿主细胞是外源的，并且所述细胞在导入该核酸构建体之前是非感受态的；和

(b)回收所述具有生物活性的物质。

本发明还涉及包含至少一个拷贝的导入的第一核酸构建体的感受态芽孢杆菌属宿主细胞，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌属宿主细胞是外源的，并且所述细胞在导入该核酸构建体之前是非感受态的。

本发明还涉及产生亲本芽孢杆菌属细胞的突变体的方法，其包括：

(a)用包含核酸构建体的外源DNA转化亲本芽孢杆菌属细胞，以修饰亲本芽孢杆菌属细胞中编码多肽的基因，这产生在相同条件下培养时与亲本细胞相比产生的多肽较少或产生的多肽生物活性较低的突变细胞，其中通过至少一个拷贝的导入的第一核酸构建体而使芽孢杆菌属细胞成为感受态，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于亲本芽孢杆菌属细胞是外源的，并且所述细胞在导入该核酸构建体之前是非感受态的；和

(b)分离所述突变细胞。

在优选的方面，上述成为感受态的芽孢杆菌属细胞进一步包含至少一个拷贝的导入的第二核酸构建体，所述构建体包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属宿主细胞更进一步的感受态。

具体地，本发明涉及如下各项：

1.获得芽孢杆菌属转化体的方法，包括：

(a)将外源DNA转化进通过至少一个拷贝导入的第一核酸构建体而成为感受态的芽孢杆菌属宿主细胞，所述第一核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌属宿主细胞是外源的，所述细胞在导入第一核酸构建体之前为非感受态的；和

(b)分离包含所述DNA的芽孢杆菌属宿主细胞的转化体。

2.项1的方法，其中编码ComS多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComS多肽包含与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9，或其全长互补链杂交；和(iv)多核苷酸，其编码ComS变体，该ComS变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2，SEQID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10。

3.项1的方法，其中ComS多肽包含或其组成为SEQ ID NO:2，SEQ ID NO:4，SEQ IDNO:6，SEQ ID NO:8，或SEQ ID NO:10；或其保持ComS多肽活性的片段。

4.项1-3中任一项的方法，其中感受态芽孢杆菌属宿主细胞进一步包含至少一个拷贝的导入的第二核酸构建体，所述第二核酸构建体包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属宿主细胞更进一步的感受态。

5.项4的方法，其中编码ComK多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComK多肽包含与SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ IDNO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ IDNO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQ ID NO:11，SEQ ID NO:13，SEQ IDNO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQ ID NO:23，SEQ ID NO:25，SEQ IDNO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQ ID NO:35，SEQ ID NO:37，SEQ IDNO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQ ID NO:47，或SEQ ID NO:49优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ IDNO:11，SEQ ID NO:13，SEQ ID NO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQ IDNO:23，SEQ ID NO:25，SEQ ID NO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQ IDNO:35，SEQ ID NO:37，SEQ ID NO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQ IDNO:47，或SEQ ID NO:49，或其全长互补链杂交；和(iv)多核苷酸，其编码ComK变体，该ComK变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:12，SEQ ID NO:14，SEQ IDNO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ IDNO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ IDNO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50。

6.项4的方法，其中ComK多肽包含或其组成为SEQ ID NO:12，SEQ ID NO:14，SEQID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50；或其保持ComK多肽活性的片段。

7.获得感受态芽孢杆菌属宿主细胞的方法，包括：

(a)向非感受态芽孢杆菌属宿主细胞导入至少一个拷贝的第一核酸构建体，其包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌属宿主细胞是外源的；和

8.项7的方法，其中编码ComS多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComS多肽包含与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9，或其全长互补链杂交；和(iv)多核苷酸，其编码ComS变体，该ComS变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2，SEQID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10。

9.项7的方法，其中ComS多肽包含或其组成为SEQ ID NO:2，SEQ ID NO:4，SEQ IDNO:6，SEQ ID NO:8，或SEQ ID NO:10；或其保持ComS多肽活性的片段。

10.项7-9中任一项的方法，其中感受态芽孢杆菌属宿主细胞进一步包含至少一个拷贝的导入的第二核酸构建体，所述核酸构建体包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属宿主细胞更进一步的感受态。

11.项10的方法，其中编码ComK多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComK多肽包含与SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ IDNO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ IDNO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQ ID NO:11，SEQ ID NO:13，SEQ IDNO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQ ID NO:23，SEQ ID NO:25，SEQ IDNO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQ ID NO:35，SEQ ID NO:37，SEQ IDNO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQ ID NO:47，或SEQ ID NO:49优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ IDNO:11，SEQ ID NO:13，SEQ ID NO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQ IDNO:23，SEQ ID NO:25，SEQ ID NO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQ IDNO:35，SEQ ID NO:37，SEQ ID NO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQ IDNO:47，或SEQ ID NO:49或其全长互补链杂交；和(iv)多核苷酸，其编码ComK变体，该ComK变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:12，SEQ ID NO:14，SEQ IDNO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ IDNO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ IDNO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50。

12.项10的方法，其中ComK多肽包含或其组成为SEQ ID NO:12，SEQ ID NO:14，SEQID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50；或其保持ComK多肽活性的片段。

13.产生生物物质的方法，包含：

(a)在有利于产生所述物质的条件下培养用外源DNA转化的芽孢杆菌属宿主细胞，所述DNA编码或参与具有生物活性的物质的表达，其中通过至少一个拷贝的导入的核酸构建体使芽孢杆菌属宿主细胞成为感受态，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌属宿主细胞是外源的，所述宿主细胞在导入核酸构建体之前是非感受态的；和

(b)回收所述具有生物活性的物质。

14.项13的方法，其中编码ComS多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComS多肽包含与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，或SEQ ID NO:7优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQ ID NO:2，SEQ IDNO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9，或其全长互补链杂交；和(iv)多核苷酸，其编码ComS变体，该ComS变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2，SEQ ID NO:4，SEQID NO:6，SEQ ID NO:8，或SEQ ID NO:10。

15.项13的方法，其中ComS多肽包含或其组成为SEQ ID NO:2，SEQ ID NO:4，SEQID NO:6，SEQ ID NO:8，或SEQ ID NO:10；或其保持ComS多肽活性的片段。

16.项13-15中任一项的方法，其中感受态芽孢杆菌属宿主细胞进一步包含至少一个拷贝的导入的第二核酸构建体，所述核酸构建体包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属宿主细胞更进一步的感受态。

17.项16的方法，其中编码ComK多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComK多肽包含与SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ IDNO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ IDNO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50优选具有至少60％同一性的氨基酸序列，更优选具有至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQ ID NO:11，SEQ ID NO:13，SEQID NO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQ ID NO:23，SEQ ID NO:25，SEQID NO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQ ID NO:35，SEQ ID NO:37，SEQID NO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQ ID NO:47，或SEQ ID NO:49优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQID NO:11，SEQ ID NO:13，SEQ ID NO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQID NO:23，SEQ ID NO:25，SEQ ID NO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQID NO:35，SEQ ID NO:37，SEQ ID NO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQID NO:47，或SEQ ID NO:49或其全长互补链杂交；和(iv)多核苷酸，其编码ComK变体，该ComK变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:12，SEQ ID NO:14，SEQID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50。

18.项16的方法，其中ComK多肽包含或其组成为SEQ ID NO:12，SEQ ID NO:14，SEQID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50；或其保持ComK多肽活性的片段。

19.感受态芽孢杆菌属宿主细胞，其包含至少一个拷贝的导入的第一核酸构建体，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌宿主属细胞是外源的，所述细胞在导入第一核酸构建体之前是非感受态的。

20.项19的感受态芽孢杆菌属宿主细胞，其中编码ComS多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComS多肽包含与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ IDNO:8，或SEQ ID NO:10优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9，或其全长互补链杂交；和(iv)多核苷酸，其编码ComS变体，该ComS变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10。

21.项19的感受态芽孢杆菌属宿主细胞，其中ComS多肽包含或其组成为SEQ IDNO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10；或其保持ComS多肽活性的片段。

22.项19-21中任一项的感受态芽孢杆菌属宿主细胞，其进一步包含至少一个拷贝的导入的第二核酸构建体，所述核酸构建体包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属宿主细胞更进一步的感受态。

23.项22的感受态芽孢杆菌属宿主细胞，其中编码ComK多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComK多肽包含与SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，SEQID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ ID NO:28，SEQID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ ID NO:40，SEQID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQ ID NO:11，SEQID NO:13，SEQ ID NO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQ ID NO:23，SEQID NO:25，SEQ ID NO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQ ID NO:35，SEQID NO:37，SEQ ID NO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQ ID NO:47，或SEQ ID NO:49优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15，SEQ ID NO:17，SEQ ID NO:19，SEQID NO:21，SEQ ID NO:23，SEQ ID NO:25，SEQ ID NO:27，SEQ ID NO:29，SEQ ID NO:31，SEQID NO:33，SEQ ID NO:35，SEQ ID NO:37，SEQ ID NO:39，SEQ ID NO:41，SEQ ID NO:43，SEQID NO:45，SEQ ID NO:47，或SEQ ID NO:49或其全长互补链杂交；和(iv)多核苷酸，其编码ComK变体，该ComK变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:12，SEQID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50。

24.项22的感受态芽孢杆菌属宿主细胞，其中ComK多肽包含或其组成为SEQ IDNO:12，SEQ ID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ IDNO:24，SEQ ID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ IDNO:36，SEQ ID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ IDNO:48，或SEQ ID NO:50；或其保持ComK多肽活性的片段。

25.项19-24中任一项的感受态芽孢杆菌属宿主细胞，其已经用外源DNA转化。

26.通过项1-6中任一项的方法获得的芽孢杆菌属转化体。

27.通过项13-18中任一项的方法获得的生物物质。

28.产生亲本芽孢杆菌属细胞的突变体的方法，其包括：

(a)向亲本芽孢杆菌属细胞中导入包含核酸的外源DNA，以修饰亲本芽孢杆菌属细胞中编码多肽的基因，这导致在相同条件下培养时与亲本细胞相比产生较少的所述多肽的突变细胞，其中通过至少一个拷贝的导入的第一核酸构建体使亲本芽孢杆菌属细胞成为感受态，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于亲本芽孢杆菌属细胞是外源的，所述细胞在导入第一核酸构建体之前是非感受态的；和

(b)分离所述突变细胞。

29.项28的方法，其中编码ComS多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComS多肽包含与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9，或其全长互补链杂交；和(iv)多核苷酸，其编码ComS变体，该ComS变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2，SEQID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10。

30.项28的方法，其中ComS多肽包含或其组成为SEQ ID NO:2，SEQ ID NO:4，SEQID NO:6，SEQ ID NO:8，或SEQ ID NO:10；或其保持ComS多肽活性的片段。

31.项28-30中任一项的方法，其中亲本芽孢杆菌属细胞进一步包含至少一个拷贝的导入的第二核酸构建体，所述核酸构建体包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属细胞更进一步的感受态。

32.项31的方法，其中编码ComK多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComK多肽包含与SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ IDNO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ IDNO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQ ID NO:11，SEQ ID NO:13，SEQ IDNO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQ ID NO:23，SEQ ID NO:25，SEQ IDNO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQ ID NO:35，SEQ ID NO:37，SEQ IDNO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQ ID NO:47，或SEQ ID NO:49优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ IDNO:11，SEQ ID NO:13，SEQ ID NO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQ IDNO:23，SEQ ID NO:25，SEQ ID NO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQ IDNO:35，SEQ ID NO:37，SEQ ID NO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQ IDNO:47，或SEQ ID NO:49或其全长互补链杂交；和(iv)多核苷酸，其编码ComK变体，该ComK变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:12，SEQ ID NO:14，SEQ IDNO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ IDNO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ IDNO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50。

33.项31的方法，其中ComK多肽包含或其组成为SEQ ID NO:12，SEQ ID NO:14，SEQID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50；或其保持ComK多肽活性的片段。

34.通过项28-33中任一项的方法获得的突变芽孢杆菌属细胞。

附图说明

图1表明枯草芽孢杆菌的感受态调控级联。模块1包括感受态信息素CSF的检测和通过磷酸中继机制(phosphorelay mechanism)进行的信号传导，其引起ComS肽的合成。ComS通过与MecA结合而干扰转录因子ComK的蛋白质分解降解，MecA活化编码后期感受态功能的模块2，后期感受态功能编码DNA转运机制。

图2A和2B表示地衣芽孢杆菌DNA甲基转移酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NO:51和52)。

图3A、3B和3C表示地衣芽孢杆菌Bli1904II限制-修饰系统的基因组DNA序列，其包含编码Bli1904II限制性内切核酸酶和M.Bli1904II DNA甲基转移酶的基因(SEQ ID NO:53)。Bli1904II限制性内切核酸酶编码区的反向补体(reverse complement)用双下划线表示，而M.Bli1904II DNA甲基转移酶编码区用单下划线表示。

图4显示pMDT138的限制图谱。

图5显示pKK223-3的限制图谱。

图6显示pNBT51的限制图谱。

图7显示pNBT52的限制图谱。

图8显示pNBT53的限制图谱。

图9显示pNBT54的限制图谱。

图10显示pNBT35的限制图谱。

图11显示pNBT30的限制图谱。

图12显示pNBT31的限制图谱。

图13显示pNBT36的限制图谱。

图14显示pMDT100的限制图谱。

图15显示枯草芽孢杆菌和地衣芽孢杆菌基因组编码的ComS蛋白质的氨基酸序列比对。

图16显示pMRT098的限制图谱。

图17显示pMRT098/comK的限制图谱。

图18显示pMRT098/comK/amyL3’的限制图谱。

图19显示pMRT098/comK/amyL#24的限制图谱。

图20显示pMMar2的限制图谱。

图21显示枯草芽孢杆菌comS和地衣芽孢杆菌comK共表达的示意图。

定义

感受态：术语“感受态”在本文中定义为天然生理状态，在这种状态中外源(胞外)DNA能够内在化至芽孢杆菌属宿主细胞中，产生转化事件(Berka等,2002,Mol.Microbiol.43:1331-45)。感受态不同于涉及电穿孔、原生质体、热休克或CaCl₂处理的人工转化。

感受态机制(级联)：术语“感受态机制”和“感受态级联”在本文可以互换使用，指细胞分化过程，所述过程将芽孢杆菌属细胞转化成天然可转化的细胞，所述可转化细胞能使用后期感受态基因编码的特定转运蛋白质摄取和合并外源(胞外)DNA，所述基因包含comC、comE、comF和comG操纵子。

非感受态：如本文所述，术语“非感受态”和“可转化性差”可互换使用，并且这些术语指使用如前所述在枯草芽孢杆菌或地衣芽孢杆菌中由感受态介导的转化方法时(Anagnostopoulos和Spizizen,1961,J.Bacteriol.81:741-746；Thorne和Stull,1966,J.Bacteriol.91:1012-1020；Gwinn和Thorne,1964,见上文)，每微克DNA中转化体的数目少于自发突变频率的两倍。

ComS多肽：术语“ComS多肽”在本文中定义为comS基因的产物，其参与遗传感受态的调控。ComS是感受态信号转导途径中其他调控组分之间的装配接头(Ogura等,1999,Mol.Microbiol.32:799-812；Liu and Zuber,1998,J.Bacteriol.180:4243-4251)。

ComK多肽：术语“ComK多肽”在本文中定义为comK基因的产物；在感受态发展之前作为最后的自身调控控制开关起作用的转录因子；参与后期感受态基因表达的活化，所述基因参与DNA-结合和摄取以及重组(Liu和Zuber,1998,见上文；Hamoen等,1998,GenesDev.12:1539-1550)。

外源多核苷酸：术语“外源多核苷酸”及其变体(variation)用于本文中指对于芽孢杆菌属细胞非天然的多核苷酸，或者对于芽孢杆菌属细胞是天然的，但是已经通过使用对于芽孢杆菌属细胞非天然的遗传元件修饰的多核苷酸，或者已经通过使用天然元件修饰的多核苷酸，该天然元件已经经过操作，以芽孢杆菌属细胞中通常不存在的方式起作用。

外源DNA：术语“外源DNA”在本文表示在芽孢杆菌属细胞外部的DNA。

同一性：参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。

就本发明而言，两个氨基酸序列之间的同一性程度使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来测定，如在EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends inGenetics 16:276-277)的Needle程序中所执行的，优选3.0.0版或以后的版本。使用的可选参数为缺口开放罚分(gap open penalty)10，缺口延伸罚分(gap extension penalty)0.5，和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性”的输出结果(使用-nobrief选项获得)作为百分比同一性，并如下计算：

(相同残基×100)/(比对长度-比对中缺口的总数)

就本发明而言，两个脱氧核糖核苷酸序列之间的序列同一性程度使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)测定，如EMBOSS软件包(EMBOSS:TheEuropean Molecular Biology Open Software Suite,Rice等,2000,见上文)的Needle程序所执行的，优选3.0.0版或以后的版本。使用的可选参数为缺口开放罚分10，缺口延伸罚分0.5，和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性”的输出结果(使用-nobrief选项获得)作为百分比同一性，并如下计算：

(相同脱氧核糖核苷酸×100)/(比对长度-比对中缺口的总数)

肽片段：术语“肽片段”在本文中定义为从ComS多肽或ComK多肽的氨基和/或羧基末端缺失一个或多个氨基酸的ComS多肽或ComK多肽，其中所述片段分别具有ComS或ComK活性。在优选的方面，SEQ ID NO:2、4、6、8或10的ComS片段，或其同源物，含有至少30个氨基酸残基，更优选至少35个氨基酸残基，并且最优选至少40个氨基酸残基。在另一个优选的方面，SEQ ID NO:12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48或50的ComK片段，或其同源物，含有至少400个氨基酸残基，更优选至少420个氨基酸残基，并且最优选至少440个氨基酸残基。

亚序列：术语“亚序列(subsequence)”在本文中定义为编码ComS多肽或ComK多肽的多核苷酸，其从所述多核苷酸的5’和/或3’端缺失一个或多个核苷酸，其中所述亚序列编码具有ComS或ComK活性的肽片段。在优选的方面，SEQ ID NO:1、3、5、7，或9的comS亚序列，或其同源物，含有至少90个核苷酸，更优选至少105个核苷酸，并且最优选至少120个核苷酸。在另一个优选的方面，SEQ ID NO:11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47或49的comK亚序列，或其同源物，含有至少1200个核苷酸，更优选至少1260个核苷酸，并且最优选至少1320个核苷酸。

等位变体(allelic variant)：术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生，并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。

分离的多核苷酸：术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。在优选的方面，所述多核苷酸如通过琼脂糖电泳测定为至少1％纯，优选至少5％纯，更优选至少10％纯，更优选至少20％纯，更优选至少40％纯，更优选至少60％纯，甚至更优选至少80％纯，并且最优选至少90％纯。

基本上纯的多核苷酸：术语“基本上纯的(substantially pure)多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物，并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此，基本上纯的多核苷酸按重量计含有至多10％，优选至多8％，更优选至多6％，更优选至多5％，更优选至多4％，更优选至多3％，甚至更优选至多2％，最优选至多1％，并且甚至最优选至多0.5％的与其天然或重组结合的其它多核苷酸材料。然而，基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区，例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90％纯，优选至少92％纯，更优选至少94％纯，更优选至少95％纯，更优选至少96％纯，更优选至少97％纯，甚至更优选至少98％纯，最优选至少99％，并且甚至最优选至少99.5％纯。本发明所述多核苷酸优选为基本上纯的形式，即，所述多核苷酸制备物基本上不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的，或它们的任何组合。

分离的多肽：术语“分离的多肽”用于本文中指由其来源分离的多肽。在优选的方面，所述多肽如通过SDS-PAGE测定是至少1％纯，优选至少5％纯，更优选至少10％，更优选至少20％纯，更优选至少40％纯，更优选至少60％纯，甚至更优选至少80％纯，和最优选至少90％纯的多肽。

基本上纯的多肽：术语“基本上纯的多肽”在本文表示多肽制备物，所述多肽制备物按重量计含有至多10％，优选至多8％，更优选至多6％，更优选至多5％，更优选至多4％，更优选至多3％，甚至更优选至多2％，最优选至多1％，并且甚至最优选至多0.5％的与其天然或重组结合的(associated)的其它多肽材料。因此，优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92％纯，优选至少94％纯，更优选至少95％纯，更优选至少96％纯，更优选至少96％纯，更优选至少97％纯，更优选至少98％纯，甚至更优选至少99％纯，最优选至少99.5％纯，并且甚至最优选100％纯。本发明的多肽优选是基本上纯的形式，即，所述多肽制备物基本上(essentially)不含与其天然或重组结合的其它多肽材料。这能够通过以下方法实现，例如，通过公知的重组方法或由经典纯化方法制备多肽。

核酸构建体：术语“核酸构建体”用于本文指单链或双链的核酸分子，其分离自天然存在的基因，或将其修饰以本来不存在于(not otherwise exist)自然界中的方式含有核酸的区段。当所述核酸构建体含有表达编码序列所需的调控序列时，术语核酸构建体与术语“表达盒”同义。

调控序列(control sequence)：术语“调控序列”在本文定义为包括对于表达编码本发明多肽的多核苷酸是必需的或有利的所有组分。各种调控序列对于编码所述多肽的多核苷酸可以是天然的或外源的，或各种调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况，调控序列包括启动子和转录和翻译的终止信号。调控序列可与用于导入特异性限制位点的接头一起提供，所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。

启动子：术语“启动子”在本文定义为与RNA聚合酶结合并指导聚合酶到达多核苷酸正确的下游转录起始位点以启动转录的DNA序列，所述多核苷酸编码具有生物活性的多肽。RNA聚合酶有效地催化与编码区合适DNA链互补的信使RNA的装配。术语“启动子”还应理解为包括5’非编码区(在启动子和翻译起点之间)，用于转录成mRNA后的翻译，顺式作用转录控制元件如增强子，和/或其他能与转录因子相互作用的核苷酸序列。启动子可以是野生型、变体、杂合或共有(consensus)启动子。

启动子区：术语“启动子区”在本文定义为包含一个或多个(几个)启动子序列的核苷酸序列，例如，三联启动子(tandem triple promoter)。

启动子变体：术语“启动子变体”在本文定义为这样的启动子，其具有的核苷酸序列包含对亲本启动子的一个或多个(几个)核苷酸的取代、缺失和/或插入，其中突变启动子具有比相应的亲本启动子更多或更少的启动子活性。术语“启动子变体”还包含天然变体和使用本领域已知方法获得的体外产生的变体，所述方法如经典诱变、定点诱变，和DNA改组。

串联启动子：术语“串联启动子”在本文定义为两个或更多的启动子序列，每个都与编码序列可操作地连接，并介导编码序列转录成mRNA。

杂合启动子：术语“杂合启动子”在本文定义为两个或更多启动子的部分，其融合在一起产生为所述两个或多个启动子的融合体的序列，与编码具有生物活性的多肽的多核苷酸编码序列可操作连接时介导该编码序列转录成mRNA。

可操作地连接：术语“可操作地连接”在本文表示这样的构型，其中将调控序列置于相对于多核苷酸序列的编码序列的合适位置，使得调控序列指导多肽的编码序列的表达。

编码序列：当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开放阅读框确定，所述开放阅读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始，并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。

表达：术语“表达”包括涉及感兴趣的多肽产生的任何步骤，其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

表达载体：术语“表达载体”在本文定义为线性的或环状的DNA分子，其包含编码感兴趣的多肽的多核苷酸，并且与提供用于其表达的额外核苷酸可操作地连接。

宿主细胞：如本文中所使用的术语“宿主细胞”包括任何细胞类型，所述细胞类型对于使用核酸构建体或表达载体的转化、转染、转导、接合等是易感的(susceptible)。

转化：术语“转化”在本文定义为将外源DNA导入芽孢杆菌属细胞，使所述DNA作为染色体整合体或作为自复制的染色体外载体保留。

转染：术语“转染”在本文定义为用病毒核酸转化芽孢杆菌属宿主细胞。

转导：术语“转导”在本文定义为将来自第一芽孢杆菌属细胞的DNA包装入病毒颗粒，并通过用病毒颗粒感染第二芽孢杆菌属细胞，将细菌DNA转入第二细胞。

接合：术语“接合”在本文定义为通过细胞与细胞的接触，将DNA直接从一个芽孢杆菌属细胞转移至另一个芽孢杆菌属细胞。

转化体：术语“转化体”在本文定义为通常包含任何芽孢杆菌属宿主细胞，其中已经通过转化将外源DNA导入了所述细胞。术语“转化体”不包括由人工方法如电穿孔、原生质体、热休克或CaCl₂处理产生的转染体、接合体和转化体。

修饰：术语“修饰”在本文的意思是，对ComS多肽或ComK多肽的任何化学修饰，以及对编码如ComS多肽或ComK多肽的DNA的遗传操作。所述修饰可以是一个或多个氨基酸的取代、缺失和/或插入，以及一个或多个氨基酸侧链的置换。

人工变体：当用在本文时，术语“ComS人工变体”是指由表达修饰的ComS编码序列的生物产生的ComS多肽。术语“ComK人工变体”是指由表达修饰的ComK编码序列的生物产生的ComK多肽。所述修饰的核苷酸序列通过人为干预(human intervention)，通过修饰亲本ComS或亲本ComK编码序列来获得。亲本序列可以是野生型序列、合成序列、突变序列等。

发明详述

本发明涉及获得感受态芽孢杆菌属宿主细胞的方法，其包括：(a)将至少一个拷贝的第一核酸构建体导入非感受态芽孢杆菌属宿主细胞，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于所述芽孢杆菌属宿主细胞是外源的；和(b)分离包含编码ComS多肽的多核苷酸的感受态芽孢杆菌属宿主细胞。

本发明还涉及产生获得芽孢杆菌属转化体的方法，其包括：(a)将外源DNA转化进芽孢杆菌属宿主细胞，所述细胞通过至少一个拷贝的导入的第一核酸构建体而成为感受态，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌属宿主细胞是外源的，所述细胞在导入第一核酸构建体之前是非感受态的；和(b)分离包含所述DNA的芽孢杆菌属宿主细胞的转化体。

与非感受态芽孢杆菌属细胞相比，本发明的方法将获得的转化体的数目增加至少10倍，优选至少100倍，更优选至少1000倍，甚至更优选至少10,000倍，并且最优选至少100,000倍。

芽孢杆菌属宿主细胞

在本发明的方法中，芽孢杆菌属宿主细胞可以是任何非感受态或可转化性差的芽孢杆菌属细胞。如本文所述，术语非感受态或可转化性差指在枯草芽孢杆菌或地衣芽孢杆菌中在使用感受态介导的转化方法时，每微克DNA中的转化体的数目小于自发突变频率的两倍。在本文，术语非感受态和可转化性差可以互换使用。应理解的是，本文中的术语“芽孢杆菌属”还涵盖芽孢杆菌属的同义词和曾被分类为芽孢杆菌的属如土芽孢杆菌属(Geobacillus)和类芽孢杆菌属(Paenibacillus)。在本发明的实践中有用的非感受态芽孢杆菌属宿主细胞包括，但不限于，嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、萎缩芽孢杆菌(Bacillus atrophaeus)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacillus coagulans)、坚固芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、莫海威芽孢杆菌(Bacillusmojavensis)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、苏云金芽孢杆菌(Bacillusthuringiensis)，和花域芽孢杆菌(Bacillus vallismortis)细胞。

在优选的方面，非感受态芽孢杆菌属宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在更优选的方面，非感受态芽孢杆菌属宿主细胞是解淀粉芽孢杆菌细胞。在另外的更优选方面，非感受态芽孢杆菌属宿主细胞是克劳氏芽孢杆菌细胞。在另外的更优选方面，非感受态芽孢杆菌属宿主细胞是地衣芽孢杆菌细胞。在另外的更优选方面，非感受态芽孢杆菌属宿主细胞是枯草芽孢杆菌细胞。在最优选的方面，非感受态芽孢杆菌属宿主细胞是地衣芽孢杆菌细胞。

在本发明的另外的方面，芽孢杆菌属宿主细胞可以另外包含一个或多个(几个)修饰，例如，对其他基因的缺失或破坏，所述其它基因可能不利于感兴趣的多肽或生物化学物质(biochemical)的产生、回收或应用。在优选的方面，芽孢杆菌属宿主细胞是蛋白酶缺陷型细胞。在更优选的方面，芽孢杆菌属宿主细胞包含对aprE和nprE的破坏或缺失。在另外的优选方面，芽孢杆菌属宿主细胞不产生孢子。在另外的更优选的方面，芽孢杆菌属宿主细胞包含对spoIIAC的破坏或缺失。在另外的优选方面，芽孢杆菌属宿主细胞包含破坏或缺失与表面活性肽的生物合成有关的基因之一，所述基因例如srfA、srfB、srfC和srfD。参见，例如，美国专利5,958,728。也可以破坏或缺失不利于感兴趣的多肽或生物物质产生、回收或应用的其他基因，例如，amyE基因。

本发明还涉及感受态芽孢杆菌属宿主细胞，其包含至少一个拷贝的导入的第一核酸构建体，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌属宿主细胞是外源的，所述细胞在导入第一核酸构建体之前是非感受态的。

在优选的方面，上述成为感受态的芽孢杆菌属宿主细胞进一步包含至少一个拷贝的导入的第二核酸构建体，所述核酸构建体包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属宿主细胞高于通过表达ComS多肽获得的感受态的更进一步的感受态。通过进一步将获得的转化体数目与通过表达ComS多肽获得感受态的芽孢杆菌属细胞相比，增加至少2倍，优选至少5倍，更优选至少10倍，更优选至少100倍，甚至更优选至少1000倍，最优选至少10,000倍，和甚至最优选至少100,000倍，由此赋予芽孢杆菌属宿主细胞更进一步的感受态。

本发明还涉及这样的感受态芽孢杆菌属宿主细胞，所述细胞包含核酸构建体或重组表达载体，其包含编码或参与生物物质表达的感兴趣的DNA。

ComS多肽和ComK多肽和它们的多核苷酸

在本发明的方法中，可以使用适于赋予非感受态芽孢杆菌属细胞遗传感受态的编码ComS多肽的任何分离的多核苷酸。此外，可以使用适于赋予感受态芽孢杆菌属细胞在遗传上更强的感受态的编码ComK多肽的任何分离的多核苷酸。

分离的多核苷酸可以是基因组、cDNA、半合成、合成来源，或它们的任何组合。

编码ComS多肽的多核苷酸可以获得自，例如，解淀粉芽孢杆菌(登录号Q70KJ5)、枯草芽孢杆菌(登录号P80355和Q83WC2)，或地衣芽孢杆菌。

编码ComK多肽的多核苷酸可以获得自，例如，枯草芽孢杆菌168(登录号P40396)、地衣芽孢杆菌(DSM 13/ATCC 14580)(登录号Q65LN7)、地衣芽孢杆菌(登录号Q8VQ66)、芽孢杆菌菌种Bt 24(登录号Q2HQ42)、韦氏芽孢杆菌(Bacillus weihenstephanensis)KBAB4(登录号Q2AUN4)、苏云金芽孢杆菌konkukian亚种(登录号Q6HM51)、蜡状芽孢杆菌(Bacilluscereus)ATCC 10987(登录号Q73C31)、蜡状芽孢杆菌菌株ZK/E33L(登录号Q63EM6)、蜡状芽孢杆菌G9241(登录号Q4MPH9)、炭疽芽孢杆菌(Bacillus anthracis)(登录号Q81TW5)、蜡状芽孢杆菌(ATCC 14579/DSM 31；登录号Q81GQ3)、蜡状芽孢杆菌cytotoxis亚种NVH 391-98(登录号Q2E900)、芽孢杆菌菌种NRRL B-14911(登录号Q2B9A0)、芽孢杆菌菌种Ob 20(登录号Q2HQ30)、芽孢杆菌菌种Bt 26(登录号Q2HQ36)、芽孢杆菌菌种Ob 07(登录号Q2HQ38)、芽孢杆菌菌种Bt 30(登录号Q2HQ39)、芽孢杆菌菌种Bt 35(登录号Q2HQ35)、芽孢杆菌菌种Ob12b(登录号Q2HQ37)，和苏云金芽孢杆菌以色列亚种(Bacillus thuringiensissubsp.israelensis)(ATCC 35646；登录号Q3EYL1)。

在第一方面，编码ComS多肽的分离的多核苷酸包含与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10具有如下同一性程度的氨基酸序列，优选至少60％，更优选具有至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，至少97％，至少98％，或至少99％(下文中的“同源ComS多肽”或“ComS同源物”)。在优选的方面，同源的ComS多肽包含这样的氨基酸序列，其与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10有十个氨基酸不同，优选五个氨基酸不同，更优选四个氨基酸不同，甚至更优选三个氨基酸不同，最优选两个氨基酸不同，并且甚至最优选一个氨基酸不同。

分离的多核苷酸优选编码包含SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ IDNO:8，或SEQ ID NO:10的氨基酸序列的ComS多肽，或其等位变体；或其保持ComS多肽活性的片段。在优选的方面，ComS多肽包含SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10的氨基酸序列。在另外的优选方面，ComS多肽由SEQ ID NO:2，SEQ IDNO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10的氨基酸序列，或其等位变体；或其具有ComS活性的片段组成。在另外优选的方面，ComS多肽由SEQ ID NO:2，SEQ ID NO:4，SEQ IDNO:6，SEQ ID NO:8，或SEQ ID NO:10的氨基酸序列组成。

在另外的第一方面，编码ComK多肽的分离的多核苷酸包含与SEQ ID NO:12，SEQID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50具有如下同一性程度的氨基酸序列，优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，至少97％，至少98％，或至少99％(下文中的“同源ComK多肽”或“ComK同源物”)。在优选的方面，同源的ComK多肽包含氨基酸序列，所述氨基酸序列与SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ IDNO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ IDNO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ IDNO:46，SEQ ID NO:48，或SEQ ID NO:50的氨基酸有十个氨基酸不同，优选五个氨基酸不同，更优选四个氨基酸不同，甚至更优选三个氨基酸不同，最优选两个氨基酸不同，并且甚至最优选一个氨基酸不同。

分离的多核苷酸优选编码包含SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，SEQID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ ID NO:28，SEQID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ ID NO:40，SEQID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50的ComK多肽，或其等位变体；或其保持ComK多肽活性的片段。在优选的方面，ComK多肽包含SEQ ID NO:12，SEQID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50的氨基酸序列。在另外的优选方面，ComK多肽由SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ IDNO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ IDNO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQID NO:50的氨基酸序列，或其等位变体；或其具有ComK活性的片段组成。在另外优选的方面，ComK多肽由SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ IDNO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ IDNO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50的氨基酸序列组成。

在第二方面，编码ComS多肽的分离的多核苷酸优选在至少非常低严紧性条件下，更优选至少低严紧性条件下，更优选至少中严紧性条件下，更优选至少中-高严紧性条件下，甚至更优选至少高严紧性条件下，并且最优选至少非常高严紧性条件下，与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9杂交：(ii)(i)的亚序列，或(iii)(i)或(ii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,MolecularCloning,A Laboratory Manual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的亚序列含有至少90个连续的核苷酸或优选至少120个连续的核苷酸。此外，所述亚序列可编码具有ComS活性的多肽片段。

在另一个第二方面，编码ComK多肽的分离的多核苷酸在优选至少非常低严紧性条件下，更优选至少低严紧性条件下，更优选至少中严紧性条件下，更优选至少中-高严紧性条件下，甚至更优选至少高严紧性条件下，并且最优选至少非常高严紧性条件下，与SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ IDNO:47或SEQ ID NO:49杂交，(ii)(i)的亚序列，或(iii)(i)或(ii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Molecular Cloning,A LaboratoryManual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47或SEQ ID NO:49的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可编码具有ComK活性的多肽片段。

上述核苷酸序列或其亚序列，以及上述氨基酸序列或其片段，可用于设计核酸探针，以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆编码ComS多肽和ComK多肽的DNA。具体而言，根据标准的Southern印迹方法，可将这些探针用于与感兴趣的属或种的基因组DNA杂交，以鉴定和分离其中相应的基因。这些探针可明显短于完整序列，但长度应为至少14，优选至少17，更优选至少20，并且最优选至少50个核苷酸。然而，优选所述核酸探针长度为至少60个核苷酸。例如，所述核酸探针的长度可以是至少100个核苷酸。DNA和RNA两种探针均可使用。通常将探针标记以探测相应的基因(例如，用³²P、³H、³⁵S、生物素或抗生物素蛋白(avidin)标记)。这些探针包含于本发明中。

因而，可从制备自这些其它生物体的基因组DNA文库中筛选与上述探针杂交并且编码ComS多肽或ComK多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或其它分离技术分离来自这些其它生物体的基因组DNA。可以将来自文库的DNA或分离的DNA转移至硝酸纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9或其亚序列，或SEQ ID NO:11、SEQID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47或SEQ ID NO:49，其全长互补链，或其亚序列同源的克隆或DNA，将所述载体材料用在Sounthern印迹中。

就本发明而言，杂交表示核苷酸序列在非常低至非常高严紧性条件下与标记的核酸探针杂交，所述核酸探针对应于SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9中所示的核苷酸序列，它的全长互补链，或它们的亚序列，或SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ IDNO:47或SEQ ID NO:49，它的全长互补链，或他们的亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。

在优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:2的ComS多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:1或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:4的ComS多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:3或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:6的ComS多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:5或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:8的ComS多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:7或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:10的ComS多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:9或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:12的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:11或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:14的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:13或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:16的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:15或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:18的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:17或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:20的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:19或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:22的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:21或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:24的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:23或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:26的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:25或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:28的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:27或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:30的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:29或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:32的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:31或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:34的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:33或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:36的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:35或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:38的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:37或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:40的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:39或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:42的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:41或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:44的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:43或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:46的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:45或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:48的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:47或其全长互补链。

在另一个优选的方面，核酸探针是多核苷酸，其编码SEQ ID NO:50的ComK多肽，或其亚序列。在另一个优选方面，核酸探针是SEQ ID NO:49或其全长互补链。

对于长度至少100个核苷酸的长探针，将非常低至非常高严紧性条件定义为在42℃，在5X SSPE、0.3％SDS、200μg/ml已剪切并且变性的鲑精DNA，并且对于非常低和低严紧性为25％的甲酰胺、对于中和中-高严紧性为35％的甲酰胺、或对于高和非常高严紧性为50％的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。

对于长度为至少100个核苷酸的长探针，使用2X SSC、0.2％SDS优选至少在45℃(非常低严紧性)，更优选至少在50℃(低严紧性)，更优选至少在55℃(中严紧性)，更优选至少在60℃(中-高严紧性)，甚至更优选至少在65℃(高严紧性)，并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次，每次15分钟。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，将严紧性条件定义为在比使用Bolton和McCarthy的计算法(1962,Proceedings of the National Academy ofSciences USA 48:1390)得出的T_m低大约5℃至大约10℃，在0.9M NaCl，0.09M Tris-HClpH 7.6，6mM EDTA，0.5％NP-40，1×Denhardt溶液，1mM焦磷酸钠(sodium pyrophosphate)，1mM磷酸二氢钠(sodium monobasic phosphate)，0.1mM ATP和0.2mg/ml的酵母RNA中，根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，将载体材料在6×SSC加0.1％SDS中洗涤一次15分钟，并用6×SSC在比计算的T_m低5℃至10℃的温度下洗涤两次，每次15分钟。

在第三个方面，分离的多核苷酸编码ComS多肽的人工变体，所述人工变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8或SEQ ID NO:10，或其同源序列；或其成熟多肽。

在另外的第三方面，分离的多核苷酸编码ComK多肽的人工变体，所述人工变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48或SEQ ID NO:50，或其同源序列；或其成熟多肽。

优选地，氨基酸改变对性质是较不重要的(of a minor nature)，即保守的氨基酸取代或插入，其不显著影响蛋白质的折叠和/或活性；小缺失，通常缺失1至大约30个氨基酸；小的氨基或羧基末端延伸，例如氨基末端甲硫氨酸残基；多至大约20-25个残基的小接头肽；或通过改变净电荷或其它功能来促进纯化的小延伸，例如多组氨酸序列(polyhistidine tract)、抗原表位(antigenic epitope)或结合域(binding domain)。

保守取代的实例是在以下组之内：碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的，并且由例如H.Neurath和R.L.Hill,1979,In,The Proteins,Academic Press,New York描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

除了20个基本氨基酸，非基本氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰，和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成，并且优选是商业上可获得的，包括六氢吡啶羧酸(pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸，和3,3-二甲基脯氨酸。

可选地，氨基酸改变具有这样的性质以使ComS多肽或ComK多肽的物理化学性质改变。例如，氨基酸改变可改进ComS或ComK对于MecA的结合亲和力和/或结合动力学，或ComK与基因组中它的DNA序列靶标的结合亲和力等。

能够根据本领域已知的方法，例如定点诱变或丙氨酸分区诱变法(alanine-scanning mutagenesis)(Cunningham和Wells,1989,Science 244:1081-1085)来鉴定亲本ComS或ComK多肽中的必需氨基酸。在后一技术中，将单一丙氨酸突变导入到分子中的每个残基，并且测试所得突变分子的生物活性(即，限制性内切核酸酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过物理分析结构来测定，如通过以下这些技术：如核磁共振、晶体学、电子衍射或光亲和标记，连同推定的接触位点氨基酸的突变来测定。参见例如de Vos等,1992,Science 255:306-312；Smith等,1992,J.Mol.Biol.224:899-904；Wlodaver等,1992,FEBS Lett.309:59-64。必需氨基酸的身份(identity)也能够通过分析与多肽的同一性来推断，所述多肽与根据本发明的多肽相关。

能够使用已知的诱变、重组和/或改组方法，继之以有关的筛选方法，例如那些由Reidhaar-Olson和Sauer,1988,Science 241:53-57；Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156；WO 95/17413；或WO 95/22625公开的那些方法，来进行并测试单个或多个氨基酸取代。能够使用的其它方法包括易错PCR、噬菌体展示(例如，Lowman等,1991,Biochem.30:10832-10837；美国专利5,223,409；WO 92/06204)和区域定向的诱变(region directed-mutagenesis)(Derbyshire等,1986,Gene 46:145；Ner等,1988,DNA 7:127)。

诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子，并且使用本领域内标准方法快速测序。这些方法允许快速确定感兴趣的多肽中单个氨基酸残基的重要性，并且能够应用于未知结构的多肽。

氨基酸取代、缺失和/或插入的总数优选是10，更优选9，更优选8，更优选7，更优选至多6，更优选5，更优选4，甚至更优选3，最优选2，并且甚至最优选1。

ComS和ComK多核苷酸的表达

可以用许多方式操作编码ComS多肽或ComK多肽的多核苷酸，以用于多核苷酸在芽孢杆菌属宿主细胞中的表达。依赖于核酸构建体或载体或芽孢杆菌属宿主细胞，在将多核苷酸的序列插入核酸构建体或载体之前对其进行操作可能是理想的或必需的。使用克隆方法修饰核苷酸序列的技术是本领域熟知的。

包含编码ComS多肽或ComK多肽的多核苷酸的核酸构建体可以与一个或多个调控序列可操作地连接，所述调控序列在芽孢杆菌属宿主细胞中在与该调控序列相容的条件下能够指导编码序列的表达。

每个调控序列对于编码ComS多肽或ComK多肽的核苷酸序列可以是天然或外源的。这样的调控序列包括，但不限于，前导序列、启动子、信号序列和转录终止子。最少的情况，调控序列包括启动子和转录和翻译的终止信号。调控序列可以与用于导入特异性限制位点的接头一起提供，所述特异性限制位点促进调控序列与编码ComS多肽或ComK多肽的核苷酸序列编码区的连接。

调控序列可以是合适的启动子序列，其是由用于表达编码ComS多肽或ComK多肽的多核苷酸的芽孢杆菌属宿主细胞识别的核苷酸序列。启动子序列含有介导ComS多肽或ComK多肽表达的转录调控序列。启动子区可以是在所选芽孢杆菌属宿主细胞中显示转录活性的任何核苷酸序列，并可获得自指导与芽孢杆菌属宿主细胞同源或异源的具有生物活性的胞外或胞内多肽合成的基因。

启动子区可以包含单一启动子或启动子的组合。当启动子区包含启动子的组合时，启动子优选串联(in tandem)。启动子区的启动子可以是能启动编码具有生物活性的多肽的多核苷酸在感兴趣的芽孢杆菌属宿主细胞中转录的任何启动子。启动子对于编码具有生物活性的多肽的核苷酸序列可以是天然的、外源的或其组合。这样的启动子能获得自指导与芽孢杆菌属宿主细胞同源或异源的具有生物活性的胞外或胞内多肽合成的基因。

在优选的方面，启动子区包含获得自细菌来源的启动子。在更优选的方面，启动子区包含获得自革兰氏阳性细菌的启动子。在另一个更优选的方面，启动子区包含获得自革兰氏阴性细菌的启动子。革兰氏阳性细菌包括，但不限于，芽孢杆菌属、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、土芽孢杆菌属和海洋芽孢杆菌属(Oceanobacillus)。革兰氏阴性细菌包括，但不限于，大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏球菌属(Neisseria)和尿枝原体属(Ureaplasma)。

在最优选的方面，启动子区包含获得自芽孢杆菌属菌株的启动子，例如，Bacillusagaradherens、嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚固芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌；或获得自链霉菌属菌株，例如，浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomycesmurinus)。

用于指导编码本发明方法中具有生物活性的多肽的多核苷酸转录的合适启动子的实例是从下述获得的启动子：大肠杆菌lac操纵子、天蓝色链霉菌(Streptomycescoelicolor)琼脂糖酶基因(dagA)、迟缓芽孢杆菌或克劳氏芽孢杆菌碱性蛋白酶基因(aprH)，地衣芽孢杆菌碱性蛋白酶基因(枯草蛋白酶Carlsberg基因(subtilisinCarlsberg gene))，枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因，苏云金芽孢杆菌拟步行甲亚种(Bacillus thuringiensissubsp.tenebrionis)CryIIIA基因(cryIIIA)或其部分，原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731)，和巨大芽孢杆菌xylA基因(Rygus and Hillen,1992,J.Bacteriol.174:3049-3055；Kim等,1996,Gene 181:71-76)，以及tac启动子(DeBoer等,1983,Proceedings of theNational Academy of Sciences USA 80:21-25)，质粒pUB110的orfβ启动子(Tortosa等,2000,Mol.Microbiol.35:1110-1119)，和spac启动子(Henner,1990,MethodsEnzymol.185:223-228)。其他实例是spo1细菌噬菌体启动子和tac启动子的启动子(DeBoer等,1983,Proceedings of the National Academy of Sciences USA 80:21-25)。在"Useful proteins from recombinant bacteria"于Scientific American,1980,242:74-94中；和Sambrook,Fritsch,和Maniatis,1989,Molecular Cloning,A LaboratoryManual,第2版,Cold Spring Harbor,New York中描述了其他启动子。

在另一个优选的方面，启动子区包含启动子，其为“共有”启动子，在“-35”区具有序列TTGACA，并且在“-10”区具有TATAAT。共有启动子可以获得自能在芽孢杆菌属宿主细胞中起作用的任何启动子。可以通过下述方法完成“共有”启动子的构建：使用本领域公知的方法进行定点诱变产生启动子，其更完美地符合枯草芽孢杆菌营养型“σA-型”启动子的“-10”和“-35”区已确定的共有序列(Voskuil等,1995,Molecular Microbiology 17:271-279)。

在另一个优选的方面，启动子区包含“共有”启动子，该“共有”启动子获得自从下述获得的启动子：大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、克劳氏芽孢杆菌或迟缓芽孢杆菌碱性蛋白酶基因(aprH)，地衣芽孢杆菌碱性蛋白酶基因(枯草蛋白酶Carlsberg基因)，枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因，苏云金芽孢杆菌拟步行甲亚种CryIIIA基因(cryIIIA)或其部分，或原核β-内酰胺酶基因spo1细菌噬菌体启动子。

在更优选的方面，启动子区包含获得自解淀粉芽孢杆菌α-淀粉酶基因(amyQ)的“共有”启动子。

在另一个优选的方面，启动子区包含启动子，其为杂合启动子。

在另一个优选的方面，启动子区包含启动子，其为变体启动子。参见，例如，WO 05/098-16，美国专利5,698,415和美国专利6,100,063。在优选的方面，变体启动子是P_amyL4199，其中P＝启动子。

在另一个优选的方面，启动子区包含启动子，其为串联启动子。参见，例如，WO 99/043835和WO 05/098016。在优选的方面，串联启动子是P_共有amyQ-P_cryIIIA-cryIIIA mRNA加工/稳定序列(mRNA processing/stablizing sequence)。在另一个优选的方面，串联启动子是P_amyL4199-P_共有amyQ-P_cryIIIA-cryIIIA mRNA加工/稳定序列。

在本发明的方法中，杂合或串联启动子应理解为对于编码具有生物活性的多肽的多核苷酸是异源的，即使其野生型启动子对于所述多核苷酸序列是天然的。例如，在一个由至少两个启动子组成的串联启动子中，一个启动子可以是编码生物物质的多核苷酸的野生型启动子。

调控序列也可以是合适的转录终止子序列，其是由芽孢杆菌属宿主细胞识别以终止转录的序列。所述终止子序列与编码ComS多肽或ComK多肽的核苷酸序列的3’末端可操作地连接。在所选芽孢杆菌属宿主细胞中有功能的任何终止子都可用于本发明中。

调控序列还可以是合适的前导序列，其是对于芽孢杆菌属宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于指导具有生物活性的多肽合成的核苷酸序列的5’-末端。在所选芽孢杆菌属宿主细胞中有功能的任何前导序列都可用于本发明中。

调控序列还可以是mRNA稳定序列。术语“mRNA稳定序列”在本文中定义为位于启动子区下游和编码ComS多肽或ComK多肽的多核苷酸编码序列上游的序列，启动子区与其可操作地连接，从而使所有从启动子区合成的mRNA可以被加工以产生在转录物的5’末端包含稳定物序列(stabilizer sequence)的mRNA转录物。在mRNA转录物的5’末端存在这样的稳定物序列可以增加其半衰期(Agaisse和Lereclus,1994,见上文,Hue等,1995,Journal ofBacteriology 177:3465-3471)。mRNA加工/稳定序列与细菌16S核糖体RNA的3’末端互补。在优选的方面，mRNA加工/稳定序列基本产生单一大小的转录物，其在5’末端包含稳定序列。mRNA加工/稳定序列优选为一个与细菌16S核糖体RNA的3’末端互补的序列。参见，美国专利6,255,076和5,955,310。

对于芽孢杆菌属宿主细胞有效的mRNA加工/稳定序列是WO 94/25612中公开的苏云金芽孢杆菌cryIIIA mRNA加工/稳定序列，或其保持mRNA加工/稳定功能的部分，或Hue等,1995,Journal of Bacteriology 177:3465-3471中公开的枯草芽孢杆菌SP82 mRNA加工/稳定序列，或其保持mRNA加工/稳定功能的部分。

然后使用本领域已知的方法或本文所述用于表达ComS多肽或ComK多肽的方法，将核酸构建体导入芽孢杆菌属宿主细胞。

还可以与如上所述相似地构建包含感兴趣的DNA的核酸构建体，所述DNA编码或参与具有生物活性的物质的表达。

为了获得导入DNA的产物的分泌，调控序列还可以是信号肽编码区，其编码与多肽的氨基末端相连的氨基酸序列，其可指导表达的多肽进入细胞的分泌途径。信号肽编码区对于所述多肽可为天然的或可从外部来源获得。核苷酸序列的编码序列的5’端可固有地包含信号肽编码区，其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可选地，编码序列5’端可含有信号肽编码区，其对于编码分泌多肽的编码序列的部分是外源的。外源信号肽编码区在编码序列不正常含有信号肽编码区时可能是必需的。或者，外源信号肽编码区可以简单地取代天然信号肽编码区以相对于与编码序列正常结合的天然信号肽编码区获得增强的多肽分泌。信号肽编码区可以获得自芽孢杆菌属菌种的淀粉酶或蛋白酶基因。然而，能够指导表达的多肽进入所选芽孢杆菌属宿主细胞的分泌途径的任何信号肽编码区可用于本发明中。

对于芽孢杆菌属宿主细胞有效的信号肽编码区是从如下获得的信号肽编码区：芽孢杆菌属NCIB 11837产麦芽糖淀粉酶基因、嗜热脂肪芽孢杆菌α-淀粉酶基因、地衣芽孢杆菌枯草蛋白酶基因、地衣芽孢杆菌β-内酰胺酶基因、嗜热脂肪芽孢杆菌中性蛋白酶基因(nprT,nprS,nprM)和枯草芽孢杆菌prsA基因。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews 57:109-137描述。

重组表达载体

在本发明的方法中，可以使用重组表达载体重组产生ComS多肽或ComK多肽，所述重组表达载体包含编码ComS多肽或ComK多肽的多核苷酸，启动子，和转录和翻译终止信号。上述各种核酸和调控序列可以结合在一起以产生重组表达载体，所述载体可以包括一个或多个方便的限制位点以允许在这些位点插入或取代指导ComS多肽或ComK多肽合成的多核苷酸。可选地，可通过将多核苷酸或包含所述多核苷酸的核酸构建体插入合适的用于表达的载体中来表达多核苷酸。在制备表达载体的过程中，将编码序列置于载体中，使得该编码序列与用于表达和可能的分泌的合适的调控序列可操作地连接。

重组表达载体可以是任何载体，其能够方便地进行重组DNA步骤，并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将导入该载体的芽孢杆菌属宿主细胞的相容性。载体可以是线状或闭合环状质粒。载体可以是自主复制载体，即，作为染色体外实体(entity)存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者，载体可以是一种当被导入芽孢杆菌属宿主细胞中时，整合到基因组中并且与整合了该载体的染色体一起复制的载体。载体系统可以是单独的载体或质粒或两个或更多的载体或质粒，其共同含有待导入芽孢杆菌属细胞基因组的完整DNA(total DNA)，或者是转座子(transposon)。

当导入芽孢杆菌属宿主细胞时，载体可以整合入基因组。为了整合，载体可依赖于指导ComS多肽或ComK多肽合成的核苷酸序列，或通过同源重组将载体稳定整合入基因组的任何其它载体元件。或者，载体可以含有额外的核苷酸序列，用于指导通过同源重组整合入芽孢杆菌属宿主细胞的基因组。所述额外的核苷酸序列使载体能够整合入芽孢杆菌属细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性，整合元件应该优选含有足够数目的核酸，如100至1,500碱基对，优选400至1,500碱基对，并且最优选800至1,500碱基对，其与相应的靶序列高度同源以增强同源重组的概率。整合元件可以是任何序列，其与芽孢杆菌属宿主细胞基因组中的靶序列同源。此外，整合元件可以是非编码或编码的核苷酸序列。

为了自主复制，载体可以进一步包含复制起点，其使载体能够在所述的芽孢杆菌属宿主细胞中自主地复制。细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点，和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。复制起点可以是具有突变以使其在芽孢杆菌属宿主细胞中的功能对温度敏感的复制起点(参见，例如，Ehrlich,1978,Proceedings of theNational Academy of Sciences USA 75:1433-1436)。

可以将多于一个拷贝的指导具有生物活性的多肽，或ComS多肽或ComK多肽合成的核苷酸序列导入芽孢杆菌属宿主细胞以扩增核苷酸序列的表达。核苷酸序列的稳定扩增可通过如下方式获得：使用本领域公知的方法将至少一个额外拷贝的序列整合入芽孢杆菌属宿主细胞基因组并选择转化体。WO 94/14968中描述了用于实现基因组DNA序列扩增的方便的方法。

载体优选地含有一个或多个选择性标记，其允许简单选择经转化的细胞。选择性标记是基因，其产物提供杀生物剂抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或赋予抗生素抗性的标记，所述抗生素抗性例如氨苄青霉素、卡那霉素、红霉素、氯霉素或四环素抗性。此外，可以通过共转化完成选择，例如，如WO 91/09129中所述，其中选择性标记在单独的载体上。

用于连接上述元件以构建重组表达载体的方法是本领域技术人员熟知的(参见，例如，Sambrook等,1989,见上文)。

也可以与如上所述相似地构建包含感兴趣的DNA的重组表达载体，所述DNA编码或参与具有生物活性的物质的表达。

将载体导入芽孢杆菌属细胞可，例如，通过如下实现：原生质体转化(参见，例如，Chang和Cohen,1979,Molecular General Genetics 168:111-115)，使用感受态细胞(参见，例如，Young和Spizizen,1961,Journal of Bacteriology 81:823-829或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology 56:209-221)，电穿孔(参见，例如，Shigekawa和Dower,1988,Biotechniques 6:742-751)或接合(参见，例如，Koehler和Thorne,1987,Journal of Bacteriology 169:5771-5278)。

DNA

在本发明的方法中，根据本发明的方法获得的，导入感受态芽孢杆菌属细胞的外源DNA可以是任何感兴趣的DNA。DNA可以是基因组、cDNA、半合成、合成来源，或其任意组合。DNA可以编码具有感兴趣的生物活性的任何物质(下文中的“生物物质”)或者可以是参与所述生物物质表达的DNA，例如，启动子。

具有生物活性的物质可以是任何感兴趣的多肽。多肽对于感兴趣的芽孢杆菌属宿主细胞可以是天然的或异源(外源)的。术语“异源多肽”在本文中定义为对宿主细胞不是天然的多肽；天然多肽，其中进行了结构修饰以使天然多肽改变，例如，使天然多肽的蛋白质序列改变；或作为通过重组DNA技术对编码多肽的DNA操作的结果，例如更强的启动子，而使其表达量改变的天然多肽。多肽可以是下述多肽和杂合多肽的天然存在的等位变体和工程改造的变体。

术语“多肽”在本文并不指特定长度的编码产物，因此，包括肽、寡肽和蛋白质。术语“多肽”还包括杂合多肽，其包含获得自至少两个不同多肽的部分或全部多肽序列的组合，其中一个或多个多肽对芽孢杆菌属细胞可以是异源的。多肽进一步包括多肽的天然存在的等位变体和工程改造的变体。

在优选的方面，多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫调节剂(immunodilator)、神经递质、受体、报告蛋白质、结构蛋白质和转录因子。

在更优选的方面，多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶或连接酶。在最优选的方面，多肽是α-葡糖苷酶、氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环式糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖脑苷脂酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变构酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶或木聚糖酶。

在另一个优选方面，多肽是清蛋白、胶原、原弹性蛋白、弹性蛋白或明胶。

在另一个优选方面，多肽是杂合多肽，其包含获得自至少两个不同多肽的部分或完整多肽序列的组合，其中一个或多个多肽对于芽孢杆菌属宿主细胞可以是异源的。

在另一个优选的方面，多肽是融合的多肽，其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码一种多肽的核苷酸序列(或其部分)与编码另一种多肽的核苷酸序列(或其部分)融合而产生融合的多肽。产生融合多肽的技术是本领域已知的，且包括连接编码多肽的编码序列以使它们在阅读框中，并且使融合的多肽的表达在相同启动子和终止子的调控下。

编码感兴趣的多肽的DNA可以获得自任何原核、真核或其他来源。就本发明而言，用于本文与给定的来源有关的术语“获得自”，意思应为多肽由所述来源产生，或由其中插入了来自所述来源的基因的细胞产生。

用于分离或克隆编码感兴趣的多肽的DNA的技术是本领域内已知的，且包括从基因组DNA分离，从cDNA制备，或它们的组合。可通过例如使用熟知的聚合酶链式反应(PCR)实现从这种基因组DNA克隆感兴趣的多核苷酸。参见，例如，Innis等,1990,PCR Protocols:AGuide to Methods and Application,Academic Press,New York。克隆步骤可以涉及包含编码多肽的核酸序列的期望核酸片段的切除与分离，向载体分子中插入该片段，和将重组载体并入突变芽孢杆菌属细胞，其中将复制多个拷贝或克隆的所述核酸序列。DNA可以是基因组、cDNA、RNA、半合成、合成来源的，或它们的任意组合。

可以用许多方式操作编码感兴趣的多肽的DNA以提供DNA在合适的芽孢杆菌属宿主细胞中的表达。用于编码感兴趣的多肽的DNA的核酸构建体和重组表达载体的构建可以如本文ComS多肽或ComK多肽的表达中所述进行。

DNA还可以是调控序列，例如，启动子，用于操作感兴趣的基因的表达。调控序列的非限定性实例在本文中描述。

DNA还可以是用于将芽孢杆菌属细胞中感兴趣的基因失活的核酸构建体。

DNA的范围不限定于上述公开的具体实例，因为这些实例意欲作为对本发明几个方面的说明。

产生方法

本发明还涉及产生生物物质的方法，其包括：(a)在有益于产生物质的条件下培养芽孢杆菌属宿主细胞，所述细胞用编码或参与具有生物活性的物质的表达的外源DNA转化，其中通过至少一个拷贝导入的核酸构建体使芽孢杆菌属宿主细胞成为感受态，所述核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于芽孢杆菌属宿主细胞是异源的，所述细胞在导入该核酸构建体之前是非感受态的；和(b)回收具有生物活性的物质。

在优选的方面，上述成为感受态的芽孢杆菌属宿主细胞进一步包含至少一个拷贝的导入的第二核酸构建体，所述第二核酸构建体包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属宿主细胞更进一步的感受态。

使用本领域已知的方法在适合于产生感兴趣的多肽的营养培养基中培养芽孢杆菌属宿主细胞。例如，可以通过在合适培养基中和允许表达和/或分离感兴趣的多肽的条件下进行的摇瓶培养，和在实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养，所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公布的组成制备(例如，在美国典型培养物保藏中心的目录中)。分泌的感兴趣的物质能够从培养基中直接回收。

感兴趣的生物物质，例如多肽，可以使用本领域已知的特定用于该物质的方法来检测。这些检测方法可包括特异性抗体的使用、高效液相层析、毛细管层析、酶产物的形成、酶底物的消失或SDS-PAGE。例如，酶试验(enzyme assay)可用于测定具有酶活性的多肽的活性。对于很多酶，用于测定酶活性的方法在本领域中已知(参见，例如，D.Schomburg和M.Salzmann(编),Enzyme Handbook,Springer-Verlag,New York,1990)。

所得感兴趣的生物物质，例如，多肽，可以用本领域已知的方法分离。例如，感兴趣的多肽可以通过常规方法从培养基中分离，所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。然后分离的感兴趣的生物物质可以通过多种本领域已知的方法进一步纯化，所述方法包括但不限于层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型(preparative)等电聚焦(IEF))、差示溶解度(例如，硫酸铵沉淀)或提取(参见，例如，Protein Purification,J.-C.Janson和Lars Ryden编,VCHPublishers,New York,1989)。

基因的修饰

本发明还涉及产生亲本芽孢杆菌属细胞突变体的方法，其包括(a)将包含核酸的外源DNA转化入亲本芽孢杆菌属细胞，以修饰亲本芽孢杆菌属细胞中编码多肽的基因，这产生在相同条件下培养时与亲本细胞相比产生较少的所述多肽或产生的多肽生物活性较低的突变细胞；其中亲本芽孢杆菌属细胞通过至少一个拷贝导入的第一核酸构建体成为感受态，所述第一核酸构建体包含与编码ComS多肽的多核苷酸可操作连接的启动子区，其中编码ComS多肽的多核苷酸对于亲本芽孢杆菌属细胞是外源的，所述细胞在导入第一核酸构建体之前是非感受态的；和(b)分离突变细胞。

在优选的方面，修饰是将使其产物的产生消失的基因失活。

在另一个优选的方面，上述成为感受态的芽孢杆菌属细胞进一步包含至少一个拷贝导入的第二核酸构建体，其包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属细胞更进一步的感受态。

可以使用本领域公知的方法构建包含修饰基因的突变细胞，例如，通过插入、破坏、替代或缺失。待修饰的基因可以是，例如，编码区或其对于活性而言关键的部分，或编码区表达所需的调节元件。这样的调节或调控序列的实例可以是启动子序列或其功能部分，即，足以影响基因表达的部分。其他用于可能的修饰的调控序列包括，但不限于，前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活因子。

可以通过在基因或其转录或翻译所需的调节元件中导入、取代或去除一个或多个核苷酸而完成基因的修饰。例如，可以插入或去除核苷酸，导致终止密码子的导入，起始密码子的去除，或开放阅读框的改变。

修饰基因的方便方法的实例是基于基因置换、基因缺失或基因破坏的技术。例如，在基因破坏方法中，将对应于内源核苷酸序列的核酸序列在体外突变，产生缺陷型核酸序列，然后将所述缺陷型核酸序列导入亲本细胞，产生缺陷型基因。通过同源重组，缺陷核酸序列替代内源核苷酸序列。可能更理想的是，缺陷型核苷酸序列还编码标记，其可用于选择核苷酸序列已被修饰或破坏的转化体。在特别优选的方面，用选择性标记如本文所述的那些破坏核苷酸序列。

这样构建的芽孢杆菌属突变细胞作为宿主细胞用于表达对细胞是天然或外源的多肽特别有用。因此，本发明进一步涉及产生天然或外源多肽的方法，其包括：(a)在有益于多肽产生的条件下培养突变细胞；和(b)回收所述多肽。术语“外源多肽”在本文定义为对于宿主细胞不是天然的多肽，其中经过修饰而使天然序列改变的天然蛋白质，或作为通过重组DNA技术操作宿主细胞的结果而表达量发生改变的天然蛋白质。

能在这样的突变体中表达的多肽的实例在本文描述。

用于培养和纯化感兴趣的产物的方法可以通过本领域已知和本文所述的方法进行。

通过下述实施例进一步描述本发明，但不应将下述实施例理解为对本发明范围的限制。

具体实施方式

DNA测序

使用Applied Biosystems Model 3130X Genetic Analyzer(3130X型遗传分析仪)(Applied Biosystems,Foster City,CA,USA)，利用染料终止子化学(dye terminatorchemistry)(Giesecke等,1992,Journal of Virol.Methods 38:47-60)进行DNA测序。使用phred/phrap/consed(University of Washington,Seattle,WA,USA)用测序特定引物组装序列。

大肠杆菌菌株

使用ONETOP10化学感受态大肠杆菌细胞(Invitrogen Corporation,Carlsbad,CA,USA)，感受态大肠杆菌细胞(Stratagene,La Jolla,CA,USA)，XL1-Blue感受态大肠杆菌细胞(Stratagene,La Jolla,CA,USA)，和Gold超感受态大肠杆菌细胞(Stratagene,La Jolla,CA,USA)用于常规的质粒构建与增殖。

芽孢杆菌属菌株

枯草芽孢杆菌168Δ4源自枯草芽孢杆菌典型菌株168(BGSC 1A1,BacillusGenetic Stock Center,Columbus,OH,USA)，并在spoIIAC、aprE、nprE和amyE基因中有缺失。基本如对枯草芽孢杆菌A164Δ5所述进行这四个基因的缺失，过程如美国专利5,891,701中详细所述。向枯草芽孢杆菌168Δ4的培养物中补充50μg/ml色氨酸。

在枯草芽孢杆菌168Δ4(枯草芽孢杆菌168ΔsigFΔaprEΔnprEΔamyE)中构建了所有温度敏感型质粒。使用枯草芽孢杆菌A164Δ5(枯草芽孢杆菌A164ΔspoIIAC,ΔaprE,ΔnprE,ΔamyE,ΔsrfAC)作为宿主评价地衣芽孢杆菌comK过表达对枯草芽孢杆菌转化效率的影响。枯草芽孢杆菌菌株MDT101，如本文所述，表达地衣芽孢杆菌SJ1904限制-修饰系统(restriction-modification system)的DNA甲基转移酶成分，将该菌株用于在转化实验前修饰质粒DNA。地衣芽孢杆菌SJ1904(美国专利5,733,753)用作宿主用于表达枯草芽孢杆菌comS基因，用于增加地衣芽孢杆菌comK基因的表达，并且用于后续在地衣芽孢杆菌中诱导感受态。

根据Anagnostopolous和Spizizen,1961,J.Bacteriol.81:741-746的方法转化枯草芽孢杆菌。根据Susanna等,2004,J.Bacteriol.186:1120-1128的方法，通过电穿孔转化地衣芽孢杆菌菌株SJ1904。用已经甲基化的质粒DNA转化限制-健全型(restriction-proficient)地衣芽孢杆菌菌株，赋予其对地衣芽孢杆菌中限制(restriction)的抗性。为了提供正确的甲基化，从枯草芽孢杆菌MDT101的先前转化体分离了DNA。

培养基

2X YT平板由每升16g胰蛋白胨、10g酵母提取物，5g NaCl，和15g细菌用琼脂(bacto agar)组成。

2X YT氨苄青霉素平板由每升16g胰蛋白胨、10g酵母提取物，5g NaCl，和15g细菌用琼脂，补充有100μg/ml氨苄青霉素组成。

TBAB由Tryptose Blood Agar Base(胰蛋白眎血琼脂基底)(BD Diagnostics,Franklin Lakes,NJ,USA)组成。

LB培养基由每升10g胰蛋白胨、5g酵母提取物和5g NaCl组成。

LB平板由LB培养基与每升15g细菌用琼脂组成。

LB红霉素培养基由包含5μg/ml红霉素的LB培养基组成。

LB红霉素/林可霉素平板由LB培养基与每毫升1μg红霉素和25μg林可霉素组成。

LB氯霉素平板由LB培养基与每毫升5μg氯霉素组成。

LB红霉素/氯霉素平板由LB培养基与每毫升1μg红霉素和5μg氯霉素组成。

VY培养基由每升25g小牛肉浸出物(veal infusion)(BD Diagnostics,FranklinLakes,NJ,USA)和5g酵母提取物组成。

Spizizen I培养基由1X Spizizen盐、0.5％葡萄糖、0.1％酵母提取物和0.02％酪蛋白水解物组成。这个培养基在本文也称作基本培养基。

1X Spizizen盐由每升6g KH₂PO₄,14g K₂HPO₄,2g(NH₄)₂SO₄,1g柠檬酸钠和0.2g ofMgSO₄组成，pH 7.0。

Spizizen II培养基由Spizizen I培养基补充0.5mM CaCl₂和2.5mM MgCl₂组成。

TBAB红霉素/林可霉素平板由TBAB培养基和每毫升1μg红霉素和25μg林可霉素组成。

实施例1：测定地衣芽孢杆菌菌株SJ1904的基因组序列

从使用454 DNA测序技术(Margulies等,2005,Nature 437:376-380)产生的重叠群(contig)，使用Sanger测序技术的随机配对读数(random paired reads)，和为了关闭缺口和解析重复序列的来自基因组DNA的PCR片段的读数，确定地衣芽孢杆菌菌株SJ1904完整染色体的基因组序列。使用Phrap组装测序数据，并在Consed中编辑和查看。使用Glimmer(Delcher等,1999,Nucleic Acids Research 27:4636-4641)由基因组DNA序列预测基因模型。使用E-值阈值为1X10^-5的BLASTP，通过与无冗余数据库PIR-NREF(Wu等,2002,NucleicAcids Research 30:35-37)的比较，对基因模型进行机器注解。

实施例2：地衣芽孢杆菌M.Bli1904II DNA甲基转移酶基因的鉴定

使用BLASTP(Altschul等,1997,Nucleic Acids Research 25:3389-3402)将地衣芽孢杆菌菌株SJ1904基因模型的推定的氨基酸序列与来自REBASE(Roberts,R.J.,Macelis,M.,Rebase.2005)的蛋白质序列进行比较。因为DNA甲基转移酶具有中等水平的序列保守性，所以这项分析鉴定了这个基因组中所有推定的DNA甲基转移酶。使用通过InterProScan v3.3版执行的Prints-S 16版，鉴定了M.Bli1904II中的胞嘧啶特异性DNA甲基转移酶特征(signature)。此外，发现存在于胞嘧啶特异性DNA甲基转移酶中的六个高度保守的基序(motif)在地衣芽孢杆菌M.Bli1904II DNA甲基转移酶中也是保守的。

实施例3：地衣芽孢杆菌M.Bli1904II DNA甲基转移酶基因的表征

地衣芽孢杆菌M.Bli1904II DNA甲基转移酶基因的核苷酸序列(SEQ ID NO:51)和推定的氨基酸序列(SEQ ID NO:52)如图2A和2B中所示。编码序列为1014bp，其包括终止密码子。编码区为36.1％G+C。编码的预测蛋白质为337个氨基酸，分子量为38.5kDa。

使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)，如EMBOSS的Needle程序中所执行的，缺口开放罚分为10，缺口延伸罚分为0.5，使用EBLOSUM 62矩阵，确定了氨基酸序列的比较性配对全局比对(comparative pairwise global alignment)。比对显示，地衣芽孢杆菌M.Bli1904II DNA甲基转移酶的推定氨基酸序列与韦氏芽孢杆菌C-5胞嘧啶特异性DNA甲基转移酶前体(UniRef100_Q2AVE0)共享64％的同一性，并且与Oceanobacillus iheyensis的胞嘧啶特异性DNA甲基转移酶(UniRef100_Q8EL98)共享47％的同一性。当使用Needle标记为“最长同一性”的输出结果作为百分比同一性并如下计算时：

(相同的残基x100)/(比对长度-比对中缺口数目)

地衣芽孢杆菌M.Bli1904II DNA甲基转移酶的推定氨基酸序列与韦氏芽孢杆菌C-5胞嘧啶特异性DNA甲基转移酶前体(UniRef100_Q2AVE0)共享68.5％的同一性，并且与Oceanobacillus iheyensis的胞嘧啶特异性DNA甲基转移酶(UniRef100_Q8EL98)共享55.9％的同一性。

实施例4：地衣芽孢杆菌M.Bli1904II DNA甲基转移酶基因的克隆

为在枯草芽孢杆菌中表达而通过PCR克隆了地衣芽孢杆菌M.Bli1904II DNA甲基转移酶基因。

根据Pitcher等,1989,Lett.Appl.Microbiol.8:151-156的方法从地衣芽孢杆菌SJ1904分离了基因组DNA。图3显示了包含编码Bli1904II限制性内切核酸酶和M.Bli1904IIDNA甲基转移酶的基因的地衣芽孢杆菌染色体区域。使用如下所示的引物999611和999612，通过PCR从地衣芽孢杆菌SJ1904基因组DNA扩增了地衣芽孢杆菌SJ1904染色体中约1043bp的片段，其包括M.Bli1904II DNA甲基转移酶基因的核糖体结合位点和编码区，包含SEQ IDNO:53的核苷酸2019-3049(图3A、3B和3C)。引物999611并入了SacI限制性位点，而引物999612并入了MluI限制性位点。

引物999611：

5′-GAGCTCTGCAAGGAGGTATAATTTTG-3′(SEQ ID NO:54)

引物999612：

5′-ACGCGTTTATTCAGCTATTGCATATTC-3′(SEQ ID NO:55)

使用PfxDNA聚合酶(Invitrogen,Carlsbad,CA,USA)进行PCR。扩增反应(50μl)由下述组成：1X Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA)，1mMMgSO₄，300μM每种dNTP，0.3μM每条引物，1.25单位Pfx DNA聚合酶，和约200ng模板DNA。使用40温度循环仪(Stratagene Corporation,LaJolla,CA,USA)进行反应，程序为95℃2分钟的1个循环；95℃1分钟、55℃1分钟和68℃1分钟的30个循环；和68℃3分钟的1个循环。

使用用于测序的ZEROPCR克隆试剂盒(Invitrogen,Carlsbad,CA,USA)将获得的约1043bp PCR产物克隆入载体pCR4Blunt，并根据制造商说明转化入ONETOP10化学感受态大肠杆菌细胞中。使用Plasmid Midi试剂盒(QIAGENInc.,Valencia,CA,USA)从一个转化体分离质粒DNA，并通过用EcoRI、NcoI和SnaBI消化然后在TBE(50mM Tris碱-50mM硼酸-1mM EDTA二钠)缓冲液中的0.8％琼脂糖电泳进行验证，用EcoRI消化获得了3939bp和1061bp的期望片段；NcoI为3217bp和1783bp；而SnaBI为4165bp和835bp。通过DNA测序确认了克隆的PCR片段的DNA序列。将这个质粒命名为pMDT138(图4)。

根据制造商说明，将质粒pMDT138转化入大肠杆菌XL1-Blue细胞(StratageneCorporation,La Jolla,CA,USA)，在37℃在2X YT氨苄青霉素平板上选择氨苄青霉素抗性。将一个转化体命名为MDT45，并按照布达佩斯条约的条款于2006年9月7日将其保藏在农业研究培养物保藏中心/农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearch Service Patent Culture Collection,Northern Regional ResearchCenter)，1815 University Street,Peoria,Illinois,61604，并且给予登录号NRRL B-41967。

实施例5：pMDT100的构建

质粒pMDT100是大肠杆菌复制子，其包含P_amyL4199/P_{短共有amyQ}/P_cryIIIA/cryIIIAstab三联启动子，其驱动克劳氏芽孢杆菌碱性蛋白酶基因(aprH)的表达。这个aprH表达盒和pC194的cat基因(Horinouchi和Weisblum,1982,J.Bacteriol.150:804-814)两侧侧翼均为枯草芽孢杆菌α-淀粉酶(amyE)基因的片段，允许通过双同源重组藉由两个amyE片段在枯草芽孢杆菌染色体的amyE基因座插入aprH表达盒和cat基因。用另一个基因替代pMDT100中的aprH基因允许将所述基因插入枯草芽孢杆菌染色体并在枯草芽孢杆菌中表达。pMDT100的构建如下所述。

质粒pNBT51。根据制造商的说明，使用质粒试剂盒(QIAGEN Inc.,Valencia,CA,USA)从大肠杆菌DH5α宿主分离了质粒pNBT10(pDG268MCS-Pr_cryIIIA/cryIIIAstab/SAV；美国专利No.6,255,076)，并用ClaI和ScaI消化。裂解发生在aprH编码序列大约在密码子326处的ClaI位点，而不是大约在密码子23处的ClaI位点，后者通过大肠杆菌Dam DNA甲基转移酶导致的甲基化而被阻断。使用Klenow片段(New England Biolabs,Inc.,Beverly,MA,USA)和dNTP，根据制造商的说明将ClaI末端平端化。通过TBE缓冲液中0.8％的琼脂糖电泳分析了消化的质粒，并使用凝胶提取试剂盒(QIAGENInc.,Valencia,CA,USA)纯化了约6615bp的载体片段。用SalI和ScaI消化质粒pOS4301(Bacillus Genetic Stock Center,Ohio State Universit,Columbus,OH,USA)，并使用Klenow片段和dNTP将SalI末端平端化，如上所述。通过TBE缓冲液中0.8％的琼脂糖电泳分析了消化的质粒，并使用凝胶提取试剂盒纯化了携带大肠杆菌rrnB转录终止子的约840bp的片段。可以从载体pKK223-3(GE Healthcare,Piscataway,NJ,USA)(图5)分离同样的840bp SalI/ScaI片段。根据制造商的说明，用T4 DNA连接酶(RocheDiagnostics Corporation,Indianapolis,IN,USA)将pNBT10载体片段和携带终止子的片段连接在一起，并根据制造商的说明，用所述连接物转化了大肠杆菌DH5α(Gibco BRL,Gaithersburg,MD,USA)，在37℃在2X YT氨苄青霉素平板上选择氨苄青霉素抗性。将得到的质粒命名为pNBT51(pDG268-P_cryIIIA/cryIIIAstab/SAVΔ)(图6)。

质粒pNBT52。用SfiI消化质粒pNBT51，在11℃与T4 DNA聚合酶(RocheDiagnostics Corporation,Indianapolis,IN,USA)和25μM每种dNTP一起温育20分钟，将末端平端化，然后75℃温育10分钟，将聚合酶热失活。然后用DraIII消化末端平端化的质粒，并通过TBE缓冲液中的0.8％琼脂糖电泳分析，使用凝胶提取试剂盒纯化了约5920bp的载体片段。用DraIII和Ecl136II消化质粒pNBT20(pDG268MCS-P_{短共有amyQ}/SAV；美国专利No.6,255,076)，并且使用凝胶提取试剂盒纯化了约1641bp的携带短共有amyQ启动子(P_{短共有amyQ})的片段。如上所述连接pNBT51载体片段和P_{短共有amyQ}片段，并如上所述用所述连接物转化了大肠杆菌DH5α，在37℃在2X YT氨苄青霉素平板上选择氨苄青霉素抗性。使用8小量制备试剂盒(QIAGEN,Valencia,CA,USA)从几个转化体分离了质粒DNA，用SphI消化，并通过TBE缓冲液中的0.8％琼脂糖电泳分析。将具有期望的约4873bp和2688bp的限制性片段的一个质粒命名为pNBT52(pDG268-P_{短共有amyQ}/P_cryIIIA/cryIIIAstab/SAVΔ)(图7)。

质粒pNBT53。用SfiI和SacI消化质粒pNBT6(pHP13amp-SAV；美国专利No.6,255,076)，并通过TBE缓冲液中的0.8％琼脂糖电泳分析，使用凝胶提取试剂盒纯化了约6438bp的载体片段。用SfiI和SacI消化质粒pNBT52，并通过TBE缓冲液中0.8％的琼脂糖电泳分析，并且使用凝胶提取试剂盒纯化了约727bp的携带P_{短共有amyQ}/P_cryIIIA/cryIIIAstab串联启动子的片段。如上所述连接pNBT6载体片段和P_{短共有amyQ}/P_cryIIIA/cryIIIAstab片段，并如上所述用所述连接物转化了大肠杆菌DH5α细胞，在37℃在2X YT氨苄青霉素平板上选择氨苄青霉素抗性。使用8小量制备试剂盒(QIAGEN,Valencia,CA,USA)，从几个转化体分离了质粒DNA，用PvuII消化，并通过TBE缓冲液中的0.8％琼脂糖电泳分析。将具有期望的约4903bp、1320bp和942bp的限制性片段的一个质粒命名为pNBT53(pHP13amp-P_{短共有amyQ}/P_cryIIIA/cryIIIAstab/SAV)(图8)。

质粒pNBT54。用SfiI和BamHI消化质粒pNBT1(pDG268MCS；美国专利No.6,255,076)，并通过TBE缓冲液中的0.8％琼脂糖电泳分析，使用凝胶提取试剂盒纯化了约6040bp的载体片段。用SfiI和BamHI消化质粒pNBT53，并通过TBE缓冲液中0.8％的琼脂糖电泳分析，并且使用凝胶提取试剂盒纯化了约1953bp的携带P_{短共有amyQ}/P_cryIIIA/cryIIIAstab/SAV表达盒的片段。如上所述连接pNBT1载体片段和P_{短共有amyQ}/P_cryIIIA/cryIIIAstab/SAV片段，并如上所述用所述连接物转化了大肠杆菌DH5α细胞，在37℃在2XYT氨苄青霉素平板上选择氨苄青霉素抗性。使用8小量制备试剂盒，从几个转化体分离了质粒DNA，并通过用SfiI和BamHI同时消化，然后是TBE缓冲液中的0.8％琼脂糖凝胶电泳来分析。将具有期望的约6040bp和1953bp的限制性片段的一个质粒命名为pNBT54(pDG268MCS-P_{短共有amyQ}/P_cryIIIA/cryIIIAstab/SAV)(图9)。

质粒pNBT35。用SfiI和BamHI消化质粒pNBT2(pDG268MCSΔ-Pr_cryIIIA/cryIIIAstab/SAV；美国专利No.6,255,076)，并通过TBE缓冲液中的0.8％琼脂糖凝胶电泳分析，使用凝胶提取试剂盒纯化了约5394bp的载体片段。用SfiI和BamHI消化质粒pNBT54，并通过TBE缓冲液中0.8％的琼脂糖电泳分析，并且使用凝胶提取试剂盒纯化了约1953bp的携带P_{短共有amyQ}/P_cryIIIA/cryIIIAstab/SAV表达盒的片段。如上所述连接pNBT2载体片段和P_{短共有amyQ}/P_cryIIIA/cryIIIAstab/SAV片段，并如上所述用所述连接物转化了大肠杆菌DH5α细胞，在37℃在2X YT氨苄青霉素平板上选择氨苄青霉素抗性。使用8小量制备试剂盒，从几个转化体分离了质粒DNA，用NcoI消化，并通过TBE缓冲液中的0.8％琼脂糖凝胶电泳分析。将具有期望的约5492bp和1855bp的限制性片段的一个质粒命名为pNBT35(pDG268MCSΔ-P_{短共有amyQ}/P_cryIIIA/cryIIIAstab/SAV)(图10)。

质粒pNBT30。构建了质粒pNBT30，其包含amyL基因启动子的amyL4199变体的PCR克隆(美国专利No.6,100,063)。根据Pitcher等,1989,见上文的方法分离了地衣芽孢杆菌SJ1904的基因组DNA。使用如下所示的引物950872和991151，通过PCR从地衣芽孢杆菌SJ1904的基因组DNA扩增了amyL4199启动子(P_amyL4199)基因。引物950872并入了SfiI限制性位点，而引物991151并入了SacI限制性位点和P_amyL4199的变体核苷酸。

引物950872：

5′-CCAGGCCTTAAGGGCCGCATGCGTCCTTCTTTGTGCT-3′(SEQ ID NO:56)

引物991151：

5′-GAGCTCCTTTCAATGTGATACATATGA-3′(SEQ ID NO:57)

使用Gold DNA聚合酶(Applied Biosystems,Foster City,CA,USA)根据制造商的推荐进行了PCR，只是MgCl₂浓度是3mM，而不是标准的1.5mM。扩增反应(50μl)由下述组成：10mM Tris-HCl(pH 8.3)，50mM KCl，3.0mM MgCl₂，200μM每种dNTP，0.5μM每条引物，0.25单位Gold DNA聚合酶，和约200ng模板DNA。在40温度循环仪中进行PCR，程序为95℃9分钟的1个循环；95℃1分钟、55℃1分钟和72℃1分钟的30个循环；和72℃3分钟的1个循环。

使用TA克隆试剂盒(Invitrogen,Carlsbad,CA,USA)将得到的约625bp的PCR产物克隆入载体pCR2.1，并根据制造商的说明转化入ONETOP10化学感受态大肠杆菌细胞(Invitrogen,Carlsbad,CA,USA)。使用8小量制备试剂盒从几个转化体分离了质粒DNA，并通过用EcoRI消化，然后是TBE缓冲液中0.8％的琼脂糖电泳来分析克隆的PCR片段的存在。将一个具有预期的约3913bp和640bp的限制性片段的质粒命名为pNBT30(pCR2.1-amyL4199)(图11)。通过DNA测序确认了克隆的PCR片段的DNA序列。

质粒pNBT31。用SfiI和SacI消化质粒pNBT3(pDG268MCSΔneo-Pr_cryIIIA/cryIIIAstab/SAV；美国专利No.6,255,076)，并通过TBE缓冲液中的0.8％琼脂糖电泳分析，使用凝胶提取试剂盒纯化了约7931bp的载体片段。用SfiI和SacI消化质粒pNBT30，并通过TBE缓冲液中0.8％的琼脂糖电泳分析，并且使用凝胶提取试剂盒纯化了约612bp的携带P_amyL4199的片段。如上所述连接pNBT3载体片段和P_amyL4199片段，并根据制造商的说明用所述连接物转化了大肠杆菌XL1-Blue细胞(StratageneCorporation,La Jolla,CA,USA)，在37℃在2X YT氨苄青霉素平板上选择氨苄青霉素抗性。使用8小量制备试剂盒从几个转化体分离了质粒DNA，用NcoI消化，并通过TBE缓冲液中的0.8％琼脂糖电泳分析。将具有预期的约6802bp和1741bp的限制性片段的一个质粒命名为pNBT31(图12)。

质粒pNBT36。用SfiI消化质粒pNBT35，并使用T4 DNA聚合酶和dNTP将末端平端化，如上所述。然后将末端平端化的质粒用DraIII消化，并通过TBE缓冲液中的0.8％琼脂糖电泳分析。使用凝胶提取试剂盒纯化了约5808bp的载体片段。用DraIII和Ecl136II消化质粒pNBT31，并通过TBE缓冲液中0.8％的琼脂糖电泳分析，并且使用凝胶提取试剂盒纯化了约2150bp携带P_amyL4199的片段。如上所述连接pNBT35载体片段和P_amyL4199片段，并根据制造商的说明用所述连接物转化了大肠杆菌细胞(Stratagene Corporation,La Jolla,CA,USA)，在37℃在2X YT氨苄青霉素平板上选择氨苄青霉素抗性。使用8小量制备试剂盒从几个转化体分离了质粒DNA，用NcoI消化，并通过TBE缓冲液中的0.8％琼脂糖电泳分析。将具有预期的约5492bp和2466bp的限制性片段的一个质粒命名为pNBT36(图13)。

质粒pMDT100。用DraIII和SacI消化质粒pNBT13(pDG268Δneo-P_amyL/P_cryIIIA/cryIIIAstab/SAV；美国专利No.6,255,076)，并使用凝胶提取试剂盒纯化了约6395bp的载体片段。用DraIII和SacI消化质粒pNBT36，并通过TBE缓冲液中0.8％的琼脂糖电泳分析，并且使用凝胶提取试剂盒纯化了约2873bp的携带P_amyL4199/P_{短共有amyQ}/P_cryIIIA三联启动子的片段。如上所述连接pNBT13载体片段和P_amyL4199/P_{短共有amyQ}/P_cryIIIA片段，并如上所述用所述连接物转化了大肠杆菌细胞，在37℃在2X YT氨苄青霉素平板上选择氨苄青霉素抗性。使用8小量制备试剂盒从几个转化体分离了质粒DNA，用ApaI消化，并通过TBE缓冲液中的0.8％琼脂糖分析。将具有预期的约4974bp和4294bp的限制性片段的一个质粒命名为pMDT100(图14)。

实施例6：地衣芽孢杆菌M.Bli1904II DNA甲基转移酶基因在枯草芽孢杆菌中的表达

将地衣芽孢杆菌M.Bli1904II DNA甲基转移酶基因插入枯草芽孢杆菌的染色体中，以在该宿主中表达甲基转移酶，从而允许枯草芽孢杆菌中DNA的甲基化。

用SacI和MluI消化质粒pMDT100并通过TBE缓冲液中0.8％的琼脂糖电泳分析，并使用凝胶提取试剂盒纯化了约8100bp的载体片段。用SacI和MluI消化质粒pMDT138，并且使用凝胶提取试剂盒纯化了约1033bp的携带M.Bli1904II基因的片段。如上所述连接pMDT100载体片段和M.Bli1904II基因片段。此连接将M.Bli1904II基因置于P_amyL4199/P_{短共有amyQ}/P_cryIIIA/cryIIIAstab启动子的下游和aprH转录终止子的上游。根据Anagnostopoulos和Spizizen,1961,J.Bacteriol.81:741-746的方法用所述连接物转化枯草芽孢杆菌168Δ4，在37℃在TBAB氯霉素平板上选择氯霉素抗性的转化体。在37℃在TBAB新霉素平板上筛选新霉素敏感的抗氯霉素转化体，以确定是否已将DNA通过双交换插入到枯草芽孢杆菌染色体的amyE基因中。

使用如下所示的引物994112和999592(其分别结合在三联启动子和M.Bli1904IIDNA甲基转移酶基因内)和如下所示的引物999611和960456(其分别结合在M.Bli1904IIDNA甲基转移酶基因和amyE基因内)，通过PCR确认了在amyE基因座存在M.Bli1904II DNA甲基转移酶表达盒。将在amyE基因座包含cat基因和M.Bli1904II DNA甲基转移酶表达盒的一个这样的转化体，命名为枯草芽孢杆菌MDT101。

引物994112：

5′-GCGGCCGCTCGCTTTCCAATCTGA-3′(SEQ ID NO:58)

引物999592：

5′-ATCGATCAGCTTGGATAAACCCTA-3′(SEQ ID NO:59)

引物999611:

5′-GAGCTCTGCAAGGAGGTATAATTTTG-3′(SEQ ID NO:60)

引物960456:

5′-CGTCGACGCCTTTGCGGTAGTGGTGCTT-3′(SEQ ID NO:61)

使用Taq DNA聚合酶(New England Biolabs,Inc.,Beverly,MA,USA)根据制造商的说明进行了PCR。扩增反应(50μl)由下述组成：10mM Tris-HCl(pH 8.3)，50mM KCl，3.0mMMgCl₂，200μM每种dNTP，0.5μM每条引物，0.25单位Taq DNA聚合酶，和约200ng基因组DNA。在40温度循环仪中进行PCR，程序为95℃2分钟的1个循环；95℃2分钟、55℃2分钟和72℃2分钟的30个循环；和72℃3分钟的1个循环。

实施例7：地衣芽孢杆菌感受态基因的编目

在查询指令中使用术语“感受态”为关键字搜索枯草芽孢杆菌数据库(Subtilist；Moszer等,2002,Nucleic Acids Res.30:62-65)产生了50个基因的列表，这些基因在该物种的感受态发展中起作用(表1)。使用BLAST(McGinnis和Madden,2004,Nucleic AcidsRes.32:W20-5)，用1×10^–10的最小期望分值，在地衣芽孢杆菌ATCC 14580的基因组序列(Rey等,2004,Genome Biol.5:R77)中鉴定了枯草芽孢杆菌感受态基因的直系同源基因。

表1.由枯草芽孢杆菌和地衣芽孢杆菌基因组编码的感受态基因的比较

如表1所示，地衣芽孢杆菌ATCC 14580基因组表现出携带除comP基因和comS基因之外的感受态发展所需全部基因，其中comP基因已经通过插入序列IS3Bli1(Lapidus等,2002,FEMS Microbiol.Lett.209:23-30)破坏，而comS或者不存在，或者与枯草芽孢杆菌中的相应基因本质上不同。没有活性comP基因产物，感受态信号转导级联的早期部分不能在地衣芽孢杆菌中正确工作。然而，能通过增加中央转录因子ComK的表达而绕过感受态级联的早期部分，ComK诱导编码DNA结合和摄取机制的后期感受态基因的转录(Susanna等,2004,J.Bacteriol.186:1120-8)。然而，如果MecA蛋白的水平高到足以结合并失活所有ComK蛋白，那么有可能仅增加comK基因的表达不足以诱导感受态。取而代之的，需要增加comS基因的表达来克服MecA的活性，并且从而释放ComK来活化后期感受态基因的转录。

在枯草芽孢杆菌中，将comS基因嵌入srfA基因第四个氨基酸活化域的编码区中。因此，扫描地衣芽孢杆菌中相应的区域(srfA直系同源基因)来定位可能的ComS样序列。图15中的比较比对显示，最接近的预测的地衣芽孢杆菌直系同源物与枯草芽孢杆菌中已知的ComS基因产物略有不同，并且多个已知对生物活性重要的残基在地衣芽孢杆菌中出现歧化。还不了解地衣芽孢杆菌中推定的ComS直系同源物是否有功能。

进行了两种实验方法。第一种方法涉及增加comK的表达以绕过感受态级联的早期部分，而第二种方法涉及增加comS的表达以避免ComK由MecA/ClpCP复合物降解(参见图1)。

实施例8：pMRT098的构建

使用如下所示的引物992129和992130，通过PCR从质粒pAX01(等,2001,J.Bact.183:2696-2699)扩增了xylA启动子和xylR基因。

引物992129

5’-GAGCTCGGATCCCATTTCC-3’(SEQ ID NO:62)

引物992130

5’-ATCTCTGAGCTCGCGATGATTAATTAATTCAGAACGCTCGGTTGCCGCCGGGCGTTTTTTATGCAGCAATGGCAAGAACGTCCCGGTTAGCTCC-3’(SEQ ID NO:63)

PCR扩增在50μl反应中进行，所述反应由下述组成：10ng pAX01 DNA，0.4μM每种引物，dATP、dCTP、dGTP和dTTP各200μM，包含2.5mM MgCl₂的1X PCR Buffer II和2.5单位AMPLITAQ酶(Applied Biosystems,Inc.,Foster City,CA,USA)。在40温度循环仪中进行反应，程序为95℃10分钟的1个循环；95℃1分钟、53℃1分钟和72℃1.5分钟的25个循环；和72℃7分钟的1个循环。通过0.5X TBE缓冲液中的0.8％琼脂糖凝胶电泳使PCR产物可见。期望的片段长约1500bp。

使用克隆试剂盒(Invitrogen,Carlsbad,CA,USA)将PCR片段克隆入载体pCR2.1，并根据制造商的说明转化入大肠杆菌ONE感受态细胞。在补充有100μg/ml氨苄青霉素的2X YT琼脂平板上筛选转化体，在37℃温育16小时。根据制造商的说明，使用9600(QIAGEN Inc.,Valencia,CA,USA)从这些转化体中的几个纯化了质粒DNA，并使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA,USA)，通过DNA测序确认了插入物的DNA序列。将携带正确PCR片段的质粒命名为pMRT091。

用BamHI和SacI消化质粒pMRT091和pUC18(Yanisch-Perron等,1985,Gene 33:103-119)。通过0.5X TBE缓冲液中的0.8％琼脂糖凝胶电泳解析消化的产物，使用DNA提取试剂盒，根据制造商的说明将来自pUC18的较大载体片段和来自pMRT091的较小片段凝胶纯化。使用快速DNA连接试剂盒(Roche Applied Science,Indianapolis,IN,USA)，根据制造商的说明将两个纯化的片段连接在一起，并将连接混合物转化进大肠杆菌XL1 SE感受态细胞(Stratagene,Inc.,La Jolla,CA,USA)。在补充有100μg/ml氨苄青霉素的2X YT琼脂平板上筛选转化体。

根据制造商的说明，使用9600从几个转化体中纯化了质粒DNA，并通过BamHI和SacI消化，然后由0.5X TBE缓冲液中的0.8％琼脂糖凝胶电泳分析。通过存在约700bp的Ava I/Bam HI pMRT091片段而鉴定正确的质粒，并命名为pMRT096。

此外，用引物992131和992132，然后用引物992129和992131，通过SOE PCR(Horton等,1989,Gene 77:61-68)，缺失pMRT096的xylR基因中存在的HindIII和EcoRI位点。

引物992131

5’-CTTCTCGAGAATAATATTTCCTTCTAAGTCGGTTAGGATTCCG-3’(SEQ ID NO:64)

引物992132

5’-CAAGCATCAAAAAACACCAACTTAGTTCGGTGGATAAACAAAGGAGTGGTTATTATTCAAATTGCAGATCAGGCTTTAG-3’(SEQ ID NO:65)

PCR扩增在50μl反应中进行，所述反应由下述组成：10ng pAX01 DNA，0.4μM每种引物，200μM每种dATP、dCTP、dGTP和dTTP，包含2.5mM MgCl₂的1X PCR Buffer II和2.5单位AMPLITAQ酶。在40温度循环仪中进行反应，程序为95℃10分钟的1个循环；95℃1分钟、55℃1分钟和72℃1分钟的25个循环；和72℃7分钟的1个循环。通过0.5X TBE缓冲液中的0.8％琼脂糖凝胶电泳使PCR产物可见。期望的片段长约700bp。

使用克隆试剂盒将PCR片段克隆入pCR2.1，并根据制造商的说明转化入大肠杆菌ONE感受态细胞。在补充有100μg/ml氨苄青霉素的2X YT琼脂平板上筛选转化体，在37℃温育16小时。根据制造商的说明，使用9600(QIAGENInc.,Valencia,CA,USA)从这些转化体中的几个纯化了质粒DNA，并使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA,USA)，通过DNA测序确认了插入物的DNA序列。将携带正确PCR片段的质粒命名为pMRT092。

用BamHI和AvaI消化质粒pMRT096和pMRT092。通过0.5X TBE缓冲液中的0.8％琼脂糖凝胶电泳解析消化的产物，使用DNA提取试剂盒，根据制造商的说明将来自pMRT096的较大载体片段和来自pMRT092的较小片段凝胶纯化。使用快速DNA连接试剂盒，根据制造商的说明将两个纯化的片段连接在一起，并将连接混合物转化进大肠杆菌XL1 SE感受态细胞(Stratagene,Inc.,La Jolla,CA,USA)。在补充有100μg/ml氨苄青霉素的2X YT琼脂平板上筛选转化体。

根据制造商的说明，使用9600从几个转化体中纯化了质粒DNA，并通过EcoRI和HindIII消化，然后由0.5X TBE缓冲液中的0.8％琼脂糖凝胶电泳分析。通过用EcoRI或HindIII消化时存在单一的4200bp片段而鉴定了正确的质粒。将这个构建体命名为pMRT098(图16)。

实施例9：pΔComS的构建

如下构建质粒pΔComS：用BamHI加HindIII消化pBD2528(也称作pComS，Hahn等,1996,Mol.Microbiol.21:763-75)，用DNA聚合酶I(Klenow片段)处理以产生平末端，并且通过用T4 DNA连接酶将载体再次连接而产生对照质粒，其除了缺少comS基因外均与pBD2528相同。为了确保正确的甲基化以进一步转化入地衣芽孢杆菌SJ1904，根据Anagnostopoulos和Spizizen,1961,见上文的过程，将质粒pΔcomS和pComS转化入本文所述的枯草芽孢杆菌MDT101。在补充有20μg/ml卡那霉素的TBAB培养基上筛选转化体。

实施例10：扩增地衣芽孢杆菌SJ1904 comK基因并将其克隆进大肠杆菌载体pMRT098

设计了下述PCR引物从地衣芽孢杆菌SJ1904扩增编码ComK的DNA。加入限制酶位点BamHI和PstI(下划线)以便将comK基因片段克隆进pMRT098。

引物999722：

5'-GTGGATCCgattaggaggatcaaaatg-3’(SEQ ID NO:66)

BamHI

引物999723：

5'-CAGTACTGCAGtcaatagcgctttttcagctccctgaggatAaattcgtatatc-3’(SEQ IDNO:67)

PstI

使用Expand高保真PCR系统(Roche Applied Science,Indianapolis,IN,USA)，通过PCR扩增了comK基因片段。根据Pitcher等,1989,见上文的过程，从地衣芽孢杆菌SJ1904分离了基因组DNA。PCR扩增反应混合物包含1μl 145ng/μl的地衣芽孢杆菌SJ1904基因组DNA，1μl引物999722(50pmol/μl)，1μl引物999723(50pmol/μl)，包含15mM MgCl₂的5μl 10XPCR缓冲液，1μl dNTP混合物(每种10mM)，37.25μl水，和0.75μl(3.5单位/μl)DNA聚合酶混合物。使用5333(Hamburg,Germany)扩增片段，程序为94℃2分钟的1个循环；94℃15秒、60℃30秒和72℃1分钟的10个循环；94℃15秒、60℃30秒和72℃1分钟的15个循环，并在每个连续的循环中加上5秒延长的72℃；和72℃7分钟的1个循环；和4℃保温。

使用30K OMEGA^TM离心设备，根据制造商的说明(Pall LifeScience,Inc.,Ann Arbor,MI,USA)纯化了579bp PCR产物。然后用BamHI和PstI消化579bpPCR产物和载体pMRT098。使用快速DNA连接试剂盒，根据制造商的说明将所述片段连接在一起。使用两微升反应物，根据制造商的说明转化大肠杆菌细胞。

由大肠杆菌转化体制备质粒DNA，并使用1μl质粒模板、1.6ng引物999722或引物999723(如上所述)并加水至6μl来测序。用Applied Biosystems Model 377 SequencerXL，使用染料终止子化学进行DNA测序。将鉴定为具有正确序列的所得质粒命名为pMRT098/comK(图17)。

实施例11：构建包含在木糖诱导型启动子调控下的地衣芽孢杆菌SJ1904 comK基因的大肠杆菌质粒，其中基因和启动子由amyL整合臂从侧翼包围

设计了下述引物从pMRT074(美国公开申请2003/175902)扩增编码3’-amyL整合臂的DNA：

引物999726：

5'-ctgaaacaacaaaaacggctttac-3’(SEQ ID NO:68)

引物999727：

5'-ACTGAAGCTTggttgcggtcagcgggatcg-3’(SEQ ID NO:69)

HindIII

因为3’-amyL整合臂具有天然的PstI位点，所以为将3’-amyL整合臂以PstI-HindIII片段克隆进pMRT098/comK而增加HindIII切割位点。使用Expand高保真PCR系统，通过PCR扩增了目的片段。PCR扩增反应混合物包含约10ng pMRT074质粒DNA，1μl引物999726(50pmol/μl)，1μl引物999727(50pmol/μl)，包含15mM MgCl₂的5μl 10X PCR缓冲液，1μldNTP混合物(每种10mM)，37.25μl水，和0.75μl(3.5单位/μl)DNA聚合酶混合物。使用5333扩增片段，程序为94℃2分钟的1个循环；94℃15秒、60℃30秒和72℃1分钟的10个循环；94℃15秒、60℃30秒和72℃1分钟的15个循环，并在每个连续的循环中加上5秒延长的72℃；和72℃7分钟的1个循环；和4℃保温。

使用30K OMEGA^TM离心设备，根据制造商的说明纯化了450bp PCR产物。然后用HindIII和PstI消化纯化的PCR产物和载体pMRT098/comK，由TBE缓冲液中的1％琼脂糖凝胶电泳分析，并使用凝胶提取试剂盒纯化两个片段。使用快速DNA连接试剂盒，根据制造商的说明连接片段。使用两微升反应物，根据制造商的说明转化大肠杆菌细胞。由大肠杆菌转化体制备质粒DNA，并用HindIII和PstI消化，然后由TBE缓冲液中的1％琼脂糖凝胶电泳分析。将鉴定为具有正确限制图谱的所得质粒命名为pMRT098/comK/amyL3’(图18)。

设计了下述引物从pMRT074扩增编码5’-amyL整合臂的DNA：

引物999724：

EcoRI

5'-AGTCgaattcgactggaagcagagc-3’(SEQ ID NO:70)

引物999756：

Sac I

5'-TCAGGAGCTCagtaccattttccctata-3’(SEQ ID NO:71)

加入EcoRI和SacI限制性位点以便将5’-amyL整合臂克隆进pMRT098/comK/amyL3’(如上所述)。使用上述条件，通过PCR扩增目的片段。

使用30K OMEGA^TM离心设备，根据制造商的说明纯化了523bp PCR产物。然后用EcoRI和SacI消化523bp的PCR产物和载体pMRT098/comK/amyL3’，由TBE缓冲液中的1％琼脂糖凝胶电泳分析，并使用凝胶提取试剂盒纯化两个片段。使用快速DNA连接试剂盒，根据制造商的说明连接片段。使用连接物的2μl等分试样，根据制造商的说明转化大肠杆菌细胞。由大肠杆菌转化体制备质粒DNA，并用EcoRI和SacI消化，然后由1X TBE缓冲液中的1％琼脂糖凝胶电泳分析。将鉴定为具有正确限制图谱的所得质粒命名为pMRT098/comK/amyL#24(图19)。

实施例12：地衣芽孢杆菌SJ1904 comK表达载体pMMar2的构建

用EcoRI,ScaI和HindIII消化质粒pMRT098/comK/amyl#24，并由TAE缓冲液(每升4.84g Tris碱，1.14ml冰醋酸，和2ml 0.5M EDTA pH 8.0)中的0.7％琼脂糖凝胶电泳，连同凝胶提取试剂盒，纯化了3178bp片段。通过用EcoRI和HindIII消化从pMRT077(WO 2003/054163)产生了载体片段，并由TAE缓冲液中的0.7％琼脂糖凝胶电泳，连同凝胶提取试剂盒，纯化了4340bp片段。然后使用T4 DNA连接酶，在16℃用16小时以大致相当的摩尔浓度连接3178bp和4340bp片段。根据Anagnostopoulos和Spizizen,1961,见上文的过程，使用全部连接混合物转化枯草芽孢杆菌168Δ4感受态细胞。在TBAB红霉素/林可霉素平板上筛选转化体。

根据Pitcher等,1989,见上文所述的过程，从几个转化体制备了枯草芽孢杆菌基因组DNA。使用PCR扩增，使用Expand高保真PCR系统确认了质粒构建。50μl PCR扩增反应混合物包含约100ng基因组DNA，1μl引物999722(50pmol/μl)，1μl引物999727(50pmol/μl)，包含15mM MgCl₂的5μl 10X PCR缓冲液，1μl dNTP混合物(每种10mM)，37.25μl水，和0.75μl(3.5单位/μl)DNA聚合酶混合物。使用Eppendorf Mastercycler 5333扩增片段，程序为94℃2分钟的1个循环；94℃15秒、60℃30秒和72℃1分钟的10个循环；94℃15秒、60℃30秒和72℃1分钟的15个循环，并在每个连续的循环中加上5秒延长的72℃；和72℃7分钟的1个循环；和4℃保温。

包含期望的1029bp扩增片段的转化体，其由TBE缓冲液中0.8％琼脂糖凝胶电泳所确定，命名为pMMar2(图20)。此外，由枯草芽孢杆菌168Δ4/pMMar2制备了质粒DNA，然后进行限制性酶消化，通过凝胶电泳分析，得到期望大小的片段。为了确保正确的甲基化以进一步转化进地衣芽孢杆菌SJ1904，根据Anagnostopoulos和Spizizen,1961,见上文的过程，将质粒pMMar2转化进本文所述的枯草芽孢杆菌MDT101。在TBAB红霉素/林可霉素平板上筛选转化体。

实施例13：将pMMar2转化进地衣芽孢杆菌SJ1904的amyL基因座

将包含木糖诱导型xylA启动子(Kim等,1996,Gene 181:71-6)调控下的地衣芽孢杆菌comK基因的表达盒，通过染色体整合和温度敏感质粒pMMar2的切除合并入地衣芽孢杆菌SJ1904的基因组DNA。将包含质粒pMMar2的地衣芽孢杆菌转化体在45℃涂布于TBAB红霉素/林可霉素平板上，迫使载体整合。根据在45℃在TBAB红霉素/林可霉素平板上生长的能力选择期望的整合体。然后不加选择在34℃在VY培养基中培养整合体，诱导切除整合的质粒。将细胞涂布在LB平板或基本培养基平板上，并筛选对红霉素敏感的菌落。筛选对红霉素敏感的克隆通过PCR进行的基因转变，检测整合的xylA::comK表达盒。获得的菌株包含整合于amyL基因座、驱动地衣芽孢杆菌comK表达的xylA启动子，将所述菌株命名为地衣芽孢杆菌SJ1904 xylA::comK。

实施例14：用pMMar2、pComS或pΔComS转化地衣芽孢杆菌SJ1904和SJ1904 xylA::comK

使用质粒Midi试剂盒，从枯草芽孢杆菌MDT101分离了质粒pMMar2、pComS和pΔComS。用pMMar2、pComS和pΔComS质粒DNA转化了地衣芽孢杆菌菌株SJ1904，并如上所述通过电穿孔用pComS质粒DNA转化了地衣芽孢杆菌xylA::comK。将获得的地衣芽孢杆菌转化体分别命名为SJ1904(pMMar2)、SJ1904(pComS)、SJ1904(pΔComS)和SJ1904 xylA::comK(pComS)。

实施例15：地衣芽孢杆菌comK基因在枯草芽孢杆菌A164Δ5和地衣芽孢杆菌SJ1904中的表达

首先如上所述通过转化将携带在木糖诱导型xylA启动子转录调控下的地衣芽孢杆菌comK基因的质粒pMMar2导入枯草芽孢杆菌164Δ5。pMMar2载体还携带赋予红霉素抗性的基因。然后将命名为枯草芽孢杆菌164Δ5/pMMar2的红霉素抗性转化体，在包含葡萄糖(抑制xylA启动子)或葡萄糖加木糖(部分抑制xylA启动子)或木糖(脱抑制xylA启动子)的培养基中测试感受态发展。使用上述方法，通过在包含1％木糖和/或0.5％葡萄糖的Spizizen I培养基中培养而制备枯草芽孢杆菌164Δ5/pMMar2和枯草芽孢杆菌164Δ5感受态细胞。使用前在-80℃冻存细胞。为了转化，将细胞混合物在37℃水浴中快速解冻。向每种转化混合物加入一微克pGME086质粒DNA和包含0.5％葡萄糖或1％木糖和0.2μg/ml氯霉素的LB培养基。质粒pGME086是pE194(Gryczan等,1982,J.Bacteriol.152:722-735)的衍生物，携带来自pC194(Horinouchi等,1982,J.Bacteriol.150:815-825)的氯霉素抗性标记。转化混合物在34℃在振荡培养箱中培养1小时。1小时后，将反应混合物涂布在LB氯霉素/红霉素平板上。在34℃培养平板24小时。次日计数菌落，确定转化效率。

表2显示了在以木糖作为唯一碳源的培养基中受体菌株生长后，转化体的数目约为在葡萄糖或葡萄糖加木糖中生长后获得的数目的200倍。这些结果证明，异源地衣芽孢杆菌comK基因不仅由xylA启动子转录，而且地衣芽孢杆菌ComK蛋白质有效地诱导了枯草芽孢杆菌中的感受态状态。

表2.使用来自地衣芽孢杆菌的comK基因在枯草芽孢杆菌中的感受态诱导

对照培养基是标准的枯草芽孢杆菌感受态培养基(Anagnostopolous和Spizizen,1961,见上文)。

这些数字是从转化反应的1:50稀释测定的。括号中的数字来自重复的实验。

实施例16：DNA微阵列分析

使用DNA微阵列比较葡萄糖培养基(comK抑制型)上和木糖培养基(comK诱导型)上生长的地衣芽孢杆菌菌株SJ1904 xylA::comK的全局转录谱。

通过点印CDS特异性寡核苷酸(50mer)而制备DNA微阵列，所述寡核苷酸选自地衣芽孢杆菌ATCC 14580基因组中的蛋白质编码基因，如Genbank中所保存的(登录号CP000002)。寡核苷酸购自MWG-Biotech,Inc.,Highpoint,NC,USA。用于微阵列点印、杂交和分析的方法如Berka等,2003,Proc.Natl.Acad.Sci.USA 100:5682-5687所述进行。

在包含0.5％葡萄糖(抑制培养基)或1％木糖(诱导培养基)的Spizizen I培养基中培养地衣芽孢杆菌SJ1904 xylA::comK细胞。在接种后1、3和5小时收获细胞，并使用Berka等,2003,见上文中所述方法分离总细胞RNA。通过25μg总RNA的反转录制备荧光探针，根据Berka等,2003,见上文的过程在第一链cDNA中并入氨基烯丙基-dUTP。然后根据Berka等,2003,见上文的过程，通过直接偶联至Cy3或Cy5单功能反应活性染料(AmershamPharmacia Biotech,Arlington Heights,IL,USA)而标记氨基-cDNA产物。用Cy3标记来自葡萄糖培养基中生长的细胞的探针，并且用Cy5标记来自木糖培养基中生长的细胞的探针。杂交和洗涤条件与Berka等,2003,见上文中所述相同。

使用4000B扫描仪(Axon Instruments,Union City,CA,USA)使微阵列片成像。使用软件(Axon Instruments)将微阵列点的荧光强度值量化(包括背景减除)，并且使用S+ARRAYANALYZER^TM软件(Insightful Corporation,Seattle,WA,USA)中提供的Lowess功能将获得的数字标准化。根据Cy5/Cy3比例≥2.0来指定受到xylA::comK表达单元的表达诱导的基因。

使用DNA微阵列比较葡萄糖培养基(comK抑制型)上和木糖培养基(comK诱导型)上生长的地衣芽孢杆菌菌株SJ1904 xylA::comK的全局转录谱。这个分析的结果显示，与葡萄糖培养基相比，木糖培养基上生长的细胞中comK转录水平有实质性增加(10至30倍)。然而，在这个实验中，后期感受态基因(comE,comF和comG操纵子)的转录未出现相应的增加。先前在枯草芽孢杆菌中的研究(Brzuszkiewicz等,2006,Proc.Natl.Acad.Sci.USA 103:12879-84)表明，comK转录的增加引起了后期感受态基因的转录增加。然而，这种关系未在地衣芽孢杆菌中观察到。

实施例17：pMDT131的构建

构建了质粒pMDT131，以创建赋予氯霉素抗性的温度敏感型质粒。用EcoRI消化质粒pMRT074(美国公开申请2003/0175902)，然后用T4 DNA聚合酶加dNTP处理以产生平末端，如实施例5中所述。然后用NotI消化质粒，由TBE缓冲液中0.8％琼脂糖凝胶电泳分析，使用凝胶提取试剂盒纯化了约4355bp的载体片段。用Eco47III和NotI消化质粒pNBT1，由TBE缓冲液中的0.8％琼脂糖凝胶电泳分析，并使用凝胶提取试剂盒纯化携带cat基因和多克隆位点的约1222bp的片段。使用T4 DNA连接酶，如上所述连接pMRT074载体片段和pNBT1 cat片段，并根据Anagnostopoulos和Spizizen,1961,见上文的过程，用所述连接物转化了枯草芽孢杆菌168Δ4，在34℃在TBAB氯霉素平板上筛选氯霉素抗性。使用质粒Midi试剂盒，从一株转化体分离了质粒DNA，并通过用BamHI消化，然后由TBE缓冲液中0.8％琼脂糖凝胶电泳来确认，电泳得到了约3779bp和1802bp的期望片段。将获得的质粒命名为pMDT131(图21)。

实施例18：枯草芽孢杆菌comS和地衣芽孢杆菌comK基因在地衣芽孢杆菌中的共表达-

有两种可能的方法测试下述假说：MecA/ClpCP复合物以意想不到的高活性阻止ComK诱导地衣芽孢杆菌中的后期感受态基因。第一种方法涉及mecA基因的破坏。然而，先前的研究已经表明，mecA通常可以作为衔接分子，靶向受调控降解的蛋白质(Persuh等,1999,Mol.Microbiol.33:886-94)，并且因此，感受态之外的处理可能对mecA-缺陷型细胞具有负面影响。第二种方法涉及增加ComS的表达，其表面上可以从MecA/ClpCP复合物释放ComK，保护它不被降解并且从而使后期感受态基因能够被诱导。为了使用这种方法，通过用质粒和染色体DNA转化，测试地衣芽孢杆菌菌株SJ1904 xylA::comK+pComS(实施例14)的感受态发展。地衣芽孢杆菌菌株SJ1904 xylA::comK+pComS(a)在amyL基因座包含xylA::comK转录单元的拷贝，并且(b)携带包含枯草芽孢杆菌comS基因拷贝的质粒(图22)。作为对照，在相同的试验中测试了很多其他地衣芽孢杆菌菌株，包括SJ1904背景菌株，和仅携带xylA::comK表达单元、pComS载体或pΔComS对照质粒的菌株(实施例14)。

将下述地衣芽孢杆菌转化宿主从冷冻甘油储液涂布至合适的选择培养基上，在过夜培养后获得连片生长：SJ1904 xylA::comK，SJ1904 xylA::comK+pComS，SJ1904+pComS，SJ1904+pΔComS和SJ1904。向500ml侧口瓶(side-arm flask)中加入包含2％木糖的五十毫升Spizizen I培养基。向培养平板上加入另外5ml包含2％木糖的Spizizen I培养基，通过用无菌涂抹棒刮抹而收集细胞并转移至无菌管中。向侧口瓶中加入每5ml培养物中的五百微升，获得Klett读数30。在37℃，250rpm温育培养物11小时。向Falcon 2059管加入来自每个11小时培养物的二百五十微升加包含2％木糖和2mM EGTA的250μl Spizizen II培养基。向每个管加入一微克转化DNA，或者质粒或者染色体DNA，使用10mM Tris-0.1mM EDTA(TE)缓冲液作为阴性对照。对于染色体DNA，将试管在37℃、250rpm温育1小时，对于质粒DNA，将试管在34℃、250rpm温育1小时。将包含染色体DNA的转化反应物涂布在包含100μg/ml壮观霉素的TBAB平板上。将包含质粒DNA的转化反应物涂布在TBAB红霉素/林可霉素平板上。对于壮观霉素选择在37℃温育平板，而对于在含有红霉素的平板上的选择在34℃温育。在次日计数菌落，确定转化效率。

表4中的结果表明，在本实验所用条件下，含质粒携带的枯草芽孢杆菌comS基因的地衣芽孢杆菌受体菌株(样品2和3)用染色体DNA每个平板得到了约20至45个转化体，而使用质粒DNA时每个平板得到了3至7个转化体。相反，不含枯草芽孢杆菌comS基因的菌株仅得到背景水平的壮观霉素抗性菌落，没有红霉素抗性菌落。comS和comK基因表达提高的组合大概使地衣芽孢杆菌中的转化效率翻倍，尽管只有comK表达提高不诱导感受态。对源自地衣芽孢杆菌SJ1904 xylA::comK+pComS菌株的pMDT131转化的三株独立的红霉素和卡那霉素抗性菌落的PCR分析表明，这些菌株全部包含整合的xylA::comK表达盒、pComS质粒和基于pE194的质粒，证明它们是真正的转化体。

表3.用质粒和染色体DNA对地衣芽孢杆菌SJ1904衍生物进行的感受态介导转化

*三块板的平均值

**四块板的平均值

***将无DNA对照涂布在包含壮观霉素的培养基上[用壮观霉素筛选可能产生低水平的自发壮观霉素抗性突变体(Kimura等,1973,Mol.Gen.Genet.124:107-115)]。

本文描述的和要求保护的发明并不局限于本文所公开的具体实施方案的范围内，因为这些实施方案意欲作为本发明几个方面的说明。任何等同的实施方案意欲在本发明的范围内。事实上，从前面的说明中，除本文所显示和描述的之外，本发明的多种修改对于本领域技术人员将是显而易见的。这些修改也意欲落入所附权利要求的范围内。在冲突的情况下，以包括定义的本公开为准。

本文引用了许多参考文献，其公开的内容通过提述以其整体并入。

Claims

1.获得芽孢杆菌属转化体的方法，包括：

(b)分离包含所述DNA的芽孢杆菌属宿主细胞的转化体。

2.权利要求1的方法，其中编码ComS多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComS多肽包含与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9，或其全长互补链杂交；和(iv)多核苷酸，其编码ComS变体，该ComS变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2，SEQID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10。

3.权利要求1的方法，其中ComS多肽包含或其组成为SEQ ID NO:2，SEQ ID NO:4，SEQID NO:6，SEQ ID NO:8，或SEQ ID NO:10；或其保持ComS多肽活性的片段。

4.权利要求1-3中任一项的方法，其中感受态芽孢杆菌属宿主细胞进一步包含至少一个拷贝的导入的第二核酸构建体，所述第二核酸构建体包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属宿主细胞更进一步的感受态。

5.权利要求4的方法，其中编码ComK多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComK多肽包含与SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ ID NO:28，SEQ ID NO:30，SEQ IDNO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ ID NO:40，SEQ ID NO:42，SEQ IDNO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQ ID NO:11，SEQ ID NO:13，SEQ IDNO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQ ID NO:23，SEQ ID NO:25，SEQ IDNO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQ ID NO:35，SEQ ID NO:37，SEQ IDNO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQ ID NO:47，或SEQ ID NO:49优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ IDNO:11，SEQ ID NO:13，SEQ ID NO:15，SEQ ID NO:17，SEQ ID NO:19，SEQ ID NO:21，SEQ IDNO:23，SEQ ID NO:25，SEQ ID NO:27，SEQ ID NO:29，SEQ ID NO:31，SEQ ID NO:33，SEQ IDNO:35，SEQ ID NO:37，SEQ ID NO:39，SEQ ID NO:41，SEQ ID NO:43，SEQ ID NO:45，SEQ IDNO:47，或SEQ ID NO:49，或其全长互补链杂交；和(iv)多核苷酸，其编码ComK变体，该ComK变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:12，SEQ ID NO:14，SEQ IDNO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQ IDNO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQ IDNO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50。

6.权利要求4的方法，其中ComK多肽包含或其组成为SEQ ID NO:12，SEQ ID NO:14，SEQID NO:16，SEQ ID NO:18，SEQ ID NO:20，SEQ ID NO:22，SEQ ID NO:24，SEQ ID NO:26，SEQID NO:28，SEQ ID NO:30，SEQ ID NO:32，SEQ ID NO:34，SEQ ID NO:36，SEQ ID NO:38，SEQID NO:40，SEQ ID NO:42，SEQ ID NO:44，SEQ ID NO:46，SEQ ID NO:48，或SEQ ID NO:50；或其保持ComK多肽活性的片段。

7.获得感受态芽孢杆菌属宿主细胞的方法，包括：

8.权利要求7的方法，其中编码ComS多肽的多核苷酸选自下组：(i)多核苷酸，其编码的ComS多肽包含与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10优选具有至少60％同一性的氨基酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(ii)多核苷酸，其包含与SEQID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9优选具有至少60％同一性的核苷酸序列，更优选至少65％同一性，甚至更优选至少70％同一性，甚至更优选至少75％同一性，甚至更优选至少80％同一性，甚至更优选至少85％同一性，最优选至少90％同一性，和甚至最优选至少95％同一性；(iii)多核苷酸，其在优选至少中严紧性条件下，更优选至少中-高严紧性条件下，和最优选至少高严紧性条件下，与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，或SEQ ID NO:9，或其全长互补链杂交；和(iv)多核苷酸，其编码ComS变体，该ComS变体包含取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2，SEQID NO:4，SEQ ID NO:6，SEQ ID NO:8，或SEQ ID NO:10。

9.权利要求7的方法，其中ComS多肽包含或其组成为SEQ ID NO:2，SEQ ID NO:4，SEQID NO:6，SEQ ID NO:8，或SEQ ID NO:10；或其保持ComS多肽活性的片段。

10.权利要求7-9中任一项的方法，其中感受态芽孢杆菌属宿主细胞进一步包含至少一个拷贝的导入的第二核酸构建体，所述核酸构建体包含与编码ComK多肽的多核苷酸可操作连接的启动子区，赋予芽孢杆菌属宿主细胞更进一步的感受态。