CN1322138C - 用于基因的稳定的染色体多拷贝整合的方法 - Google Patents

用于基因的稳定的染色体多拷贝整合的方法 Download PDF

Info

Publication number
CN1322138C
CN1322138C CNB01811587XA CN01811587A CN1322138C CN 1322138 C CN1322138 C CN 1322138C CN B01811587X A CNB01811587X A CN B01811587XA CN 01811587 A CN01811587 A CN 01811587A CN 1322138 C CN1322138 C CN 1322138C
Authority
CN
China
Prior art keywords
gene
dna
host cell
copy
conditionality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB01811587XA
Other languages
English (en)
Other versions
CN1437656A (zh
Inventor
斯蒂恩·T·乔根森
詹斯·T·安德森
迈克尔·D·瑞斯马森
卡斯滕·奥尔森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN1437656A publication Critical patent/CN1437656A/zh
Application granted granted Critical
Publication of CN1322138C publication Critical patent/CN1322138C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

本发明解决的问题是通过同源重组将目的基因的多拷贝整合到充分限定的位点,所述位点相邻与细菌宿主菌株染色体中的条件必需基因,所述染色体中在不同位点已经包含了目的基因的至少一个拷贝。

Description

用于基因的稳定的染色体多拷贝整合的方法
发明领域
本发明方法涉及插入基因到细菌菌株染色体,并得到菌株。在生物技术工业中需要构建具有稳定染色体整合几个目的基因拷贝的多肽生产菌株,且不会在菌株中留下抗生素抗性标记基因。
背景技术
在多肽的工业化生产中,希望得到尽可能高的产量。一种提高产量的方法是提高编码目的多肽的基因的拷贝数量。这可以由将基因放于高拷贝数量质粒达到,但是如果在宿主细胞培养过程中没有选择性压力质粒是不稳定的且经常从宿主细胞中丢失。另一种提高目的基因拷贝数量的方法是将其以多拷贝整合入宿主细胞染色体。通过双同源重组而不采用抗生素标记整合基因进入染色体在先前已有记载(Hone等, MicrobialPathogenesis,1988,5:407-418);两种基因的整合已有记载(Novo Nordisk:WO91/09129和WO94/14968)。整合基因的几个拷贝进入宿主染色体的问题是不稳定性。由于拷贝的序列同一性,在宿主细胞培养过程中拷贝有在染色体外重组的高倾向,除非在拷贝间包括选择性标记或其它必需的DNA并且在培养过程中施加选择性压力,特别是如果所述基因相互位置相对靠近。已有记载如何整合以反平行串联(anti-parellel tandem)紧邻排列的两个基因以获得较好的稳定性(Novo Nordisk:WO99/41358)。
当今有关重组DNA技术的工业化应用的讨论提出了一些问题,并涉及抗生素标记基因的应用。传统上抗生素标记基因用作挑选菌株的方法,所述菌株带有标记基因和编码工业目的多肽的伴随表达盒的多个拷贝。为满足当今对没有抗生素标记的重组生产宿主菌株的要求,我们已经寻找当今技术的可能的替代方法,它可以非抗生素标记基因取代当今所用的抗生素标记。因此为提供没有抗生素抗性标记的重组生产菌株,工业上需要发现稳定整合基因的多个拷贝进入宿主细胞染色体的新方法。
发明概述
本发明解决的问题是通过同源重组将目的基因的多个拷贝整合到细菌宿主菌株的确切限定的染色体位置,所述菌株中已至少包含一个在不同位置的目的基因的拷贝。这可通过菌株的宿主染色体中一或多个条件性必需基因(conditionally essential gene)(下文称为“整合基因”)的部分的缺失而实现,所述菌株中已包含至少一个目的基因的拷贝,或通过改变所述基因以使其非功能化而实现;或通过整合至少一个部分非功能化条件必需基因到宿主染色体,从而所得菌株具有缺陷(例如,特定的碳源利用)或生长需要(例如氨基酸营养缺陷型)或对给定的胁迫敏感。然后将目的基因的下一个拷贝(即第二或第三个等)引入到载体上,在载体上所述基因上游侧接整合基因的部分片段,下游侧接与宿主染色体上整合基因的DNA序列下游同源的片段。这样,宿主染色体和输入的载体都不包含整合基因的完全译本(full version)。在一非限制实施例中所述宿主染色体可能包含整合基因的前2/3,载体包含后2/3,这样就有效地在载体和染色体上建立了整合基因的1/3的序列的重叠。
整合基因完全译本的表达只有当在载体和宿主染色体之间借助部分整合基因序列发生同源重组时才会发生,甚至在目的基因指导进入已经包含在染色体上的相同的基因中同源整合到染色体的背景下可有效选择此特定的重组情况。
即使在输入载体上的目的基因和染色体其他位置此基因的其他拷贝之间存在扩展的同源性,以及即使不能证实基于目的基因表达所得定性表型的所要的整合体,此方法能在预定基因座的同源重组引导下进行基因整合,只是因为此基因已存在于所述宿主中的一或多个拷贝中。
在本文的非限制性实施例中提供了芽孢杆菌属酶生产菌株,其包含编码市售淀粉酶Termamyl(Novo Nordisk,丹麦)基因的两个反平行拷贝(相反的方向)。与枯草芽孢杆菌dal基因同源的基因,其编码D-丙氨酸消旋酶,证实存在于芽孢杆菌生产菌株中,对其测序并且对芽孢杆菌双拷贝Termamyl菌株的dal基因进行部分缺失。按照上述方法在有效恢复完整的dal基因的过程中,构建载体以使与dal基因座相邻的第三Termamyl基因拷贝实现稳定的非线性染色体插入。
在本文的另一非限制性实施例中,将编码淀粉酶基因的另一拷贝引入到芽孢杆菌属酶生产菌株的木糖异构酶操纵子,所述菌株已包含位于染色体其它位置的淀粉酶基因的至少两个拷贝。
在本文的另一非限制性实施例中,通过整合另一编码淀粉酶基因到芽孢杆菌属酶生产菌株葡糖酸操纵子我们证实了本发明方法。以下也给出了整合到条件性必需基因的其它非限制性实施例。
相应地,本发明第一个方面方法涉及构建包括目的基因至少两个拷贝的细胞,所述拷贝整合到染色体的不同位置,该方法包括以下步骤:
a)提供包含目的基因至少一个染色体拷贝的宿主细胞,并且其包含一或多个已被改变为非功能性的条件必须染色体基因;
b)提供DNA构建体,其包含:
i)步骤a)所述条件必需基因的改变的非功能性拷贝;
ii)目的基因的至少一个拷贝,其一端侧接i),另一端侧接与宿主细胞DNA序列同源的DNA片段(位于相邻于步骤a)的基因的宿主细胞染色体上);其中在i)的改变的拷贝和步骤a)的改变的染色体基因间的第一次重组恢复了条件性必须染色体基因的功能性,使细胞可供选择;
c)将DNA构建体引入宿主细胞并在需要功能性条件必需基因的选择性条件下培养细胞;和
d)挑选在前述步骤的选择性条件下生长的细胞;其中目的基因的至少一个拷贝整合到与步骤a)的基因相邻的宿主细胞染色体中;并任选
e)重复步骤a)到d)至少一次,每次重复在步骤a)中采用不同的染色体基因。
本发明第一个方面所述的另一方法涉及构建包含稳定整合到染色体不同位置的目的基因的至少两个拷贝的细胞,所述方法包括以下步骤:
a)提供包含目的基因至少一个染色体拷贝的宿主细胞;
b)改变宿主细胞条件必须染色体基因,从而使所述基因失去功能;
c)制造DNA构建体,其包含:
i)步骤b)的染色体基因的改变的非功能性拷贝;
ii)目的基因的至少一个拷贝,其一端侧接i),另一端侧接与宿主细胞DNA序列同源的DNA片段(位于相邻于步骤b)的基因的宿主细胞染色体上);其中在i)的改变的拷贝和步骤b)的改变的染色体基因间的第一次重组恢复了条件性必需染色体基因的功能性,使细胞可供选择;
d)将DNA构建体引入宿主细胞并在需要步骤b)的功能性基因的选择性条件下培养细胞;
e)挑选在步骤d)的选择性条件下生长的细胞;其中目的基因的至少一个拷贝整合到与步骤b)的基因相邻的宿主细胞染色体中;并任选
f)重复步骤a)到e)至少一次,每次重复在步骤b)中采用不同的染色体基因。
本文中也以用于进行本发明方法所需的DNA构建体的形式记述了遗传工具。
其后,本发明的第二方面涉及DNA构建体,其包含:
i)宿主细胞的条件必须染色体基因的改变的非功能性拷贝,优选所述拷贝部分缺失;和
ii)目的基因的至少一个拷贝,其一端侧接i),另一端侧接与宿主细胞DNA序列同源的DNA片段(位于相邻于步骤i)的条件性必需基因的宿主细胞染色体上)。
本发明提供了得到包含至少两个目的基因拷贝的宿主细胞的方法,所述拷贝稳定地整合到与条件必需基因座相邻的染色体上。
相应地,本发明的第三方面涉及包含只是目的基因两个拷贝的宿主细胞,所述拷贝稳定整合到染色体,其中至少一个拷贝整合到相邻于条件性必需基因座,并且其中所述细胞通过第一方面的任一方法得到。
本发明记述的另一方法涉及包含目的基因至少两个拷贝的宿主细胞,所述拷贝稳定整合到染色体,其中整合的每一拷贝到相邻于不同的条件性必需基因座,并且其中所述细胞通过第一方面的任一方法得到。
本发明方法依赖于补充一个使之非功能化的条件性必需基因,本文描述了多个包含此非功能性基因的宿主细胞。为进行本发明所述的多轮(multiple rounds)基因整合,提供包含几个非功能性条件必需基因的宿主细胞是较为有利的。
本发明的第四方面涉及地衣芽孢杆菌细胞,其中至少两个条件性必需基因被非功能化,优选所述基因选自xylA,galE,gntK,gntP,glpP,glpF,glpK,glpD,araA,metC lysA,和dal。
本文所述任何用于本发明方法的宿主细胞都包括在本发明范围内。
本发明的另一方面涉及按照第一方面所述方法前述细胞的用途。
如上所述,本文记述了本发明的基因工具,当构建体如本领域所常见的存在于宿主细胞,或在其中增殖时,本发明范围应包括这样的构建体。
本发明的另一方面涉及包含第二方面所定义的DNA构建体的细胞。
本发明的最后一方面涉及生产目的酶的方法,包含在适合生产酶的条件下培养前述任一方面所定义的细胞,并任选纯化所述酶。
附图说明
图1:图示了地衣芽孢杆菌木糖异构酶区,PCR片段,缺失以及整合的质粒和菌株。
图2:图示了地衣芽孢杆菌葡糖酸区,PCR片段,缺失以及整合的质粒和菌株。
图3:图示了地衣芽孢杆菌D-丙氨酸消旋酶编码区,PCR片段,缺失以及整合的质粒和菌株。
术语解释
按照本发明,可能应用本领域技术人员所熟知的传统的分子生物学,微生物学,和重组DNA技术。在相关文献中已有对此技术的详细描述。参见,例如:Sambrook,Fritsch & Maniatis,Molecular Cloning:A LaboratoryManual,Second Edition(1989)Cold Spring Harbor Laboratory Press,ColdSpring Harbor,New York(herein″Sambrook et al.,1989″)DNA Cloning:APractical Approach,Volumes I and II/D.N.Glover ed.1985);OligonucleotideSynthesis(M.J.Gait ed.1984);Nucleic Acid Hybridization(B.D.Hames & S.J.Higgins eds(1985));Transcription And Translation(B.D.Hames & S.J.Higgins,eds.(1984));Animal Cell Culture(R.I.Freshney,ed.(1986));Immobilized Cells And Enzymes(IRL Press,(1986));B.Perbal,A PracticalGuide To Molecular Cloning(1984)。
“ 多核苷酸”是脱氧核糖核酸或核糖核酸碱基的单-或双链聚合物,多核苷酸序列是所述聚合物从5’到3’末端的碱基实际序列。多核苷酸包括RNA和DNA,可分离自天然来源,体外合成,或从天然和合成分子组合中制备。
“核酸分子”或“核苷酸序列”指核糖核苷(腺苷,鸟苷,尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷,脱氧鸟苷,脱氧胸苷,脱氧胞苷;“DNA分子”,)的磷酸酯聚合形式,是单链或双链螺旋形式。可能是双链的DNA-DNA,DNA-RNA和RNA-RNA螺旋。术语核酸分子,具体是DNA或RNA分子仅指所述分子的一级和二级结构,并不限定其三,四级结构。因此,此用语包括的双链DNA可以为inter alia,线性,或环状DNA分子(例如限制片段),质粒和染色体。在讨论特定双链DNA分子的结构时,可以按照传统方法沿DNA非转录链(即具有与mRNA同源序列的链)的5’到3’方向描述序列。“重组DNA分子”是经过了分子生物学操作的DNA分子。
DNA“编码序列”或“开放式读码框(ORF)”是双链DNA序列,当其被置于合适的调控序列调控下可体外或体内转录翻译为细胞中的多肽。ORF“编码”多肽。通过5’(氨基)末端的起始密码子和3’(羧基)末端翻译终止密码子确定编码序列的边界。编码序列可包括,但不限于,原核生物序列,来自于真核生物mRNA的cDNA,来自于真核生物(例如哺乳动物)DNA的基因组DNA序列,以及甚至为合成的DNA序列。如果意图使编码序列在真核细胞中表达,聚酰苷酸化信号和转录终止序列通常位于编码序列的3’。
表达载体是DNA分子,线性或环形,其包含可操纵连接到提供其转录的其它区段的编码目的多肽的区段。所述的其它区段可包括启动子和终止子序列,并任选一或多个复制起点,一或多个可选择标记,增强子,聚酰苷酸化信号,等等。表达载体一般得自质粒或病毒DNA,或可能两者的组件都包含。
转录和翻译控制序列是DNA调控序列,如启动子,增强子,终止子等,其允许在宿主细胞例如真核生物细胞中表达编码序列,聚酰苷酸化信号是控制序列。
“分泌信号序列”是编码多肽(“分泌多肽”,其作为较大多肽的组分,指导较大多肽通过其于其中合成的细胞的分泌途径)的DNA序列。在转运通过分泌途径时,较大的多肽通常裂解以除去分泌肽。
本文所用术语“启动子”是其现有技术认可的含义,用以表示包含DNA序列的基因部分,其可结合RNA聚合酶和启动转录。启动子序列通常但不总是出现在基因的5’非编码区。
如果基因编码的多肽不再被表达为功能性形式,则染色体基因被“非功能化”。可通过本领域所熟知的大量基因操作或改变来诱导这样的非功能性,其中一些记述在Sambrook等,出处同上。基因的ORF内的部分缺失通常使基因非功能化,如突变例如取代,插入,移码等。
当用于DNA区段时“可操纵连接”指排列区段使它们共同(in concert)起作用,例如通过RNA聚合酶与启动子区段结合并经编码区段进行转录从而开始转录过程,直到聚合酶遭遇转录终止子区段而终止。
本文中宿主细胞的“异源”DNA是指不是源于所述细胞的外源DNA。
本文所用术语“核酸构建体”是指cDNA,基因组DNA,合成的DNA或RNA源的任何核酸分子。术语“构建体”是指核酸区段,其可是单或双链的,其可以基于编码目的多肽的完全或部分天然存在的核苷酸序列。所述构建体可任选含有其它核酸区段。
编码本发明多肽的本发明的核酸构建体可以是基因组或cDNA源的,例如通过制备基因组或cDNA文库并按照标准技术(例如参见Sambrook等,出处同上)采用合成的寡核苷酸探针通过杂交筛选编码全部或部分所述多肽的DNA序列而得到。
也可通过以建立的标准方法合成制备编码所述多肽的本发明的核酸构建体,例如Beaucage和Caruthers,Tetrahedron Letters 22(1981),1859-1869记述的亚磷酰胺(phosphoamidite)法,或由Mattes等,EMBO Journal3(1984),801-805记述的方法。按照亚磷酰胺法,合成寡核苷酸,例如在自动DNA合成仪上合成,纯化,退火,连接并克隆在合适的载体中。
此外,按照标准方法,通过连接相应于所述整个核酸构建体的各部分合成的,基因组的或cDNA源的(合适的)片段来制备,所述核酸构建体可以是混合合成和基因组源的,混合合成和cDNA源的或混合基因组和cDNA源的。也可采用特定的引物通过聚合酶链式反应制备所述的核酸构建体,例如US4683202或Saiki等,Science 239(1988),487-491所述。
当所述核酸构建体包含本发明的编码序列表达所需的控制序列时,术语核酸构建体可与术语“表达盒”含义相同。
本文中术语“控制序列”包括所有核酸序列编码序列表达所需或有利的组件。每一控制序列相对编码所述多肽的核酸序列可以是天然的或外来的。这样的控制序列包括但不限于前导序列,聚酰苷酸化序列,多肽序列,启动子,信号序列,转录终止子。最低限,控制序列应包括启动子,转录和翻译终止信号。为引入利于控制序列与编码多肽的核酸序列的编码区连接的特定的限制型酶切位点,提供控制序列接头。
所述控制序列可以是合适的启动子序列,能被宿主细胞识别用于核酸序列表达的核酸序列。所述启动子序列包括介导所述多肽表达的转录和翻译控制序列。所述启动子可以是在所选宿主细胞中表现出转录活性的任何核酸序列,可从编码胞外或胞内多肽同源或异源于宿主细胞的多肽得到。
控制序列可以是任何合适的转录终止序列,其被宿主细胞识别以终止转录。所述终止序列可操纵连接到编码所述多肽的核酸序列的3’末端。本发明中可以使用在所选宿主细胞起作用的任何终止子。
所述控制序列也可以是聚酰苷酸化序列,其是操作连接到核酸序列的3’末端的序列,并且在转录时其可被宿主细胞识别为添加聚酰苷酸残基到转录的mRNA的信号。本发明中可以采用任何在所选宿主细胞中起作用的聚酰苷酸化序列。
所述控制序列也可以是信号肽编码区,其编码连接到所述多肽氨基末端的氨基酸序列,其可指导表达的多肽进入宿主细胞的细胞分泌途径。所述核酸序列的编码序列的5’末端可自然含有信号肽编码区,其在翻译读码框中天然地与编码分泌多肽的编码区的区段相连。或者,编码序列的5’端可包含信号肽编码区,其相对编码分泌多肽的编码序列部分是外来的。如果编码序列通常不包括信号肽编码区,可能需要外来的信号肽编码区。或者,外来的信号肽编码区可简单地取代天然的信号肽编码区以得到相对天然的信号肽编码区多肽分泌的增强,所述天然的信号肽编码区通常与编码区相连。可从曲霉属种的葡糖淀粉酶或淀粉酶基因,从毛霉属(Rhizomucor)脂酶或蛋白酶基因,从酿酒酵母α-因子,从芽孢杆菌属淀粉酶或蛋白酶基因,或calfpreprochymosin基因得到所述信号肽编码区。但是,本发明可以使用任何能指导表达的多肽进入所选宿主细胞的分泌途径的信号肽编码区。
所述控制序列也可以是前肽的编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽已知为酶原(proenzyme)或多肽原(某些情况下为zymogen)。多肽原通常是无活性的,可以通过前肽的催化或自催化裂解从多肽原转化为成熟的有活性的多肽。所述前肽编码区可从枯草芽孢杆菌碱性蛋白酶基因(aprE),枯草芽孢杆菌中性蛋白酶基因(nprT),酿酒酵母α-因子基因,或Myceliophthora thermophilum laccase基因(WO95/33836)。
可能也需要添加使所述多肽的表达调控与宿主细胞的生长有关调控序列。调控系统的例子是响应化学或物理刺激,包括存在调控化合物引起基因表达开放或关闭的。原核生物调控系统包括lac,tac,和trp操纵子系统。其它的调控系统的例子是使基因扩增的那些。在真核生物系统中,这些包括在氨甲喋呤存在下扩增的二氢叶酸还原酶基因,以重金属扩增的金属硫蛋白基因。在这些情况下,编码所述多肽的核酸序列可与调控序列串联放置。
适合于指导本发明核酸构建体转录的启动子,特别是在细菌宿主细胞中,是得自大肠杆菌lac操纵子,天蓝色链霉琼脂糖酶基因(dagA),枯草芽孢杆菌levansucrase基因(sacB),枯草芽孢杆菌碱性蛋白酶基因,地衣芽孢杆菌α-淀粉酶基因(amyL),嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM),解淀粉芽孢杆菌α-淀粉酶基因(amyQ),解淀粉芽孢杆菌BANAMYLASE GENE,地衣芽孢杆菌青霉素酶基因(penP),枯草芽孢杆菌xylA和xylB基因,以及原核生物β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceeding of the National Academy of Sciences USA 75:3727-3731),以及tac启动子(Deboer等,1983,Prodeedings of the National Academy ofSciences USA 80:21-25)。其它的启动子记述在“Useful Proteins fromrecombinant bacteria”in Scientific American,1980,242:74-94;和Sambrook等,1989,出处同上。
本发明还涉及重组表达载体,其包含本发明核酸序列,启动子,转录和翻译终止信号。如上所述的各种核酸和控制序列可结合产生重组表达载体,其可包括一或多个便利的限制酶切位点以允许在这些位点进行编码所述多肽的核酸序列的插入或取代。或者,本发明的核酸序列可通过将核酸序列或包含序列的核酸构建体插入到合适的载体中进行表达。在创建表达载体中,编码序列位于载体中,这样编码序列可操纵连接到合适的控制序列以进行表达,并且可能分泌。
重组表达载体可以是能便利的进行重组DNA步骤并引起所述核酸序列表达的任何载体(例如质粒或病毒)。载体的选择一般依赖于载体与载体引入其中的宿主细胞的相容性。所述载体可以是线性的或闭合的环形质粒。所述载体可以是自主复制载体,即作为染色体外物质存在的载体,其复制独立于染色体复制,例如质粒,染色体外组件,小染色体,人造染色体。所述载体可包含保证自主复制的任何方式。或者,所述载体可以是在引入宿主细胞时整合到基因组并与整合入其中的染色体一起复制的载体。所述载体系统可以是单独的载体或质粒或两或更多个载体或质粒,其一起包含要引入宿主细胞基因组的总DNA,或转座子。
本发明载体优选包含一或多个“选择性标记”,其使转化细胞的挑选较为容易。选择性标记是一种基因,其产物提供杀生物剂,抗生素或病毒抗性,对重金属抗性,原养型变为营养缺陷型,等。
“条件性必需基因”可能起“非抗生素选择性标记”的作用。细菌条件性必需选择性标记的非限制性实施例是枯草芽孢杆菌或地衣芽孢杆菌的dal基因,只有当细菌在D-丙氨酸缺乏下培养时,它们才是必需的。同样,当细胞在半乳糖存在下培养或在能产生半乳糖的培养基中培养时,编码涉及UDP-半乳糖转换的酶的基因能在细胞中起条件性必需标记的作用。这样的基因的非限制性实施例选自编码枯草芽孢杆菌或地衣芽孢杆菌UTP-依赖型磷酸化酶(EC 2.7.7.10),UDP-葡萄糖依赖型uridylyltransferase(Ec2.7.7.12),或UDP-半乳糖差向异构酶(EC 5.1.3.2)的基因。同样芽孢杆菌的木糖异构酶基因如xylA,也可在以木糖为唯一碳源的极限培养基中培养细胞时用作限制性标记。利用葡糖酸必需的基因,gntK,和gntP也可在以木糖为唯一碳源的极限培养基中培养细胞时用作限制性标记。下面给出条件性必需基因的其它非限制性实施例。
抗生素限制性标记赋予对这些抗生素的抗性,如氨苄西林,卡那霉素,氯霉素,红霉素,四环素,新霉素,潮霉素或氨甲喋呤。
此外,通过共转化可完成选择,例如WO91/17243所述,其中选择性标记位于分离的载体上。
本发明载体优选包含能稳定整合载体,或载体的一较小部分进入宿主细胞基因中或在独立于细胞基因组的细胞中的载体上进行自主复制的组件。
所述载体或载体的一较小部分可在引入宿主细胞时整合到宿主细胞基因组。对于染色体整合,载体可能依赖于编码多肽或所述载体任一其它组件的核酸序列,其用以通过同源或非同源重组将载体稳定整合到基因组中。
或者,所述载体可能包括其它的核酸序列,用以指导通过同源重组整合到宿主细胞基因组。其它的核酸序列使要整合进入宿主细胞基因组的载体准确定位到染色体中。为提高在准确位置进行整合的可能性,整合的组件优选应包含足够数量的核酸,例如100到1500碱基对,优选400到1500碱基对,优选400到1500碱基对,最优选800到1500碱基对,其应与对应的靶序列高度同源以增强同源重组的可能性。整合组件可以是宿主细胞基因组中与靶序列同源的任何序列。此外,整合组件可以是非编码或编码的核酸序列。
载体,表达盒,扩增单元,基因或实际上任何定义的核苷酸序列的拷贝数量是任何时候在宿主细胞中存在的相同拷贝的数量。基因或另一定义染色体核苷酸序列可能存在于染色体上的1,2或更多拷贝中。自主复制载体可能存在于每一宿主细胞的1,或几百个拷贝中。
对于自主复制,所述载体可能还包括使所述载体在目的宿主细胞中自主复制的复制起点。细菌性复制起点例如有质粒pBR322,pUC19,pACYC177,pACYC184,pUB110,pE194,pTA1060和pAMB1的复制起点。所述复制起点可以具有突变,该突变使其在宿主细胞中的作用对温度敏感(例如参见,Ehrlich,1978,Proceeding fo the National Academy of SciencesUSA 75:1433)。
本发明还涉及重组宿主细胞,其包含本发明的核酸序列,其有利于在多肽的重组生产中应用。术语“宿主细胞”包括亲本细胞的任何由于复制过程中发生的突变而与亲本细胞不同的子代细胞。
优选用包含本发明的核酸序列的载体转化细胞,然后将所述载体整合到宿主染色体中。“转化”指将含有本发明的核酸序列的载体引入到宿主细胞中,以将细胞保持为染色体整合体或自主复制染色体外载体。由于核酸序列更可能在细胞中稳定保持,一般认为整合是有利的。可如上所述通过同源或非同源重组将载体整合到宿主染色体。
宿主细胞的选择很大程度上有赖于编码多肽的基因及其来源。宿主细胞可以是单细胞微生物,例如原核生物,或非单细胞微生物,例如真核生物。可用的细胞是细菌细胞,例如革兰氏阳性细菌,包括但不限于芽孢杆菌属细胞,例如,嗜碱芽孢杆菌(Bacillus alkalophilus),解淀粉芽孢杆菌,短芽孢杆菌,环状芽孢杆菌,凝结芽孢杆菌,灿烂芽孢杆菌,迟缓芽孢杆菌,地衣芽孢杆菌,巨大芽孢杆菌,嗜热脂肪芽孢杆菌,枯草芽孢杆菌,苏云金芽孢杆菌;或链霉菌属细胞,浅青紫链霉菌或鼠灰链霉菌,或革兰氏阴性细菌,例如大肠杆菌以及假单孢菌属。优选的实施方案中,细菌宿主细胞是迟缓芽孢杆菌,地衣芽孢杆菌,嗜热脂肪芽孢杆菌,或枯草芽孢杆菌细胞。
可能影响细菌宿主细胞转化的情况有,例如,原生质体转化(例如参见,Chang和Cohen,1979,Molecular General Genetics 168:111-115),采用感受态细胞(例如参见,Young和Spizizin,1961,Journal of Bacteriology81:8233-829,或Dubnar和Davidoff-Abelson,1971,Journal of MolecularBiology 56:209-221),通过电穿孔方法(例如参见,Shigekawa和Dower,1988,Biotechniques 6:742-751),或通过接合方法(例如参见,Koehler和Thorne,1987,Journal of Bacteriology 169:5771-5278)。
在允许所要的多肽表达的条件下,将如上所述转化或转染的细胞培养在合适营养的培养基中,然后从细胞或培养液中回收所得的多肽。
用于培养细胞的培养基可以是任何用于培养宿主细胞的传统培养基,例如含有合适的添加剂的极限或复合培养基。合适的培养基市售可得或按照出版物制备(例如ATCC目录)。采用本领域所熟知方法制备培养基(例如参见,references for bacteria和yeast;Bennett,J.W.和LaSure,L.,editors,More Gene Manipulations in Fungi,Academic Press,CA,1991)。
如果多肽分泌到营养培养基中,可直接从培养基中回收所述多肽。如果多肽未被分泌,则从细胞裂解液回收。可按照传统方法从培养基中回收所述多肽,包括通过离心或过滤从培养基分离宿主细胞,采用盐沉淀上清或滤过液的蛋白成分,例如硫酸铵,根据目的蛋白的类型通过多种层析方法进行纯化,例如离子交换层析,凝胶过滤层析,亲和层析,等等。
可采用本领域所熟知的针对所述多肽的方法对多肽进行测定。这些检测方法包括使用特异性抗体,形成酶产物,或酶底物的消失。例如可采用酶分析测定多肽的活性。
本发明多肽可由本领域所知的多种方法纯化,例如但不限于,层析(例如离子交换,亲和,疏水,色谱聚焦,排阻),电泳方法(例如制备型等电聚焦(IEF),溶解度差异(differential Solubility)(例如硫酸铵沉淀法),或萃取(extraction)(例如参见,Protein Purification,J.-C.Janson和Lars Ryden,editors,VCH Publishers,New York,1989)。
发明详述
本发明第一方面涉及构建包含至少两个稳定整合到染色体不同位置的目的基因拷贝的细胞的方法。
在本发明方法中,设想在通过第一次同源重组引导及选择的DNA构建体整合到宿主细胞染色体中后,可在构建体包含的DNA片段和位于邻近本发明第一方面方法的步骤b)的基因的同源宿主细胞DNA序列之间发生第二重组,其中所述构建体的DNA片段与所述宿主细胞DNA序列同源。
因此,本发明的一个优选实施方案涉及第一方面的方法,其中在引入DNA构建体并在选择性条件下培养细胞的步骤之后,或在挑选宿主细胞步骤后,在DNA片段和同源宿主细胞DNA序列之间发生第二次重组。
本发明优选的实施方案涉及第一方面的方法,其中在步骤d)之后和在步骤e)之前,在所述DNA片段和同源宿主细胞DNA序列之间发生第二次重组。
此外,设想可以添加一个标记基因到DNA构建体,其利于第一重组整合体的选择,其中通过如上第二次重组再从宿主细胞染色体剪切标记基因。
在优选实施方案中,本发明涉及第一方面的方法,其中的DNA构建体还包括位于构建体上的至少一个标记基因,这样其通过第二次重组在染色体外进行重组;至少一个标记基因赋予对抗生素的抗性,更优选至少一个标记基因赋予对抗生素的抗性,更优选所述抗生素选自氯霉素,卡那霉素,氨苄西林,红霉素,壮观霉素和四环素;最优选宿主细胞选自在选择性条件下培养的并且在染色体中不包含所述的至少一个标记基因。
在DNA构建体的那部分包含标记基因也可进行本发明方法,所述标记基因在第二次重组后保持整合在染色体中。但是由于在染色体中优选不包含标记基因,在进行整合后必须采用除去标记基因的替代方法。如果其两端侧接一定的已知为解离酶切位点或res-位点的识别序列,本领域已熟知酶切DNA部分的特定的限制酶或解离酶,例如参见WO96/23073(NovoNordiskA/S),本文引入作为参考。
本发明优选的实施方案涉及第一方面的方法,其中DNA构建体还包含至少一个标记基因,其位于改变的拷贝和DNA片段之间,并且其中所述的至少一个标记基因侧接为特定的解离酶所识别的核苷酸序列,优选所述核苷酸序列是res;更优选所述至少一个标记基因是在挑选选择性条件下培养的宿主细胞后,通过解离酶作用剪切自染色体。
目的基因可能编码宿主细胞天然产生的酶,实际上可能只是想要提高内源于宿主细胞的基因的拷贝数量。
因此本发明优选的实施方案涉及第一方面的方法,其中所述目的基因源于宿主细胞。
本发明的另一实施方案涉及第一方面的方法,其中所述目的基因编码酶,优选淀粉分解酶,脂肪分解酶,蛋白水解酶,溶细胞酶,氧化还原酶或植物细胞壁降解酶,更优选具有活性的酶选自氨肽酶,淀粉酶,淀粉葡糖苷酶,糖酶,羧肽酶,过氧化氢酶,纤维素酶,壳多糖酶,角质酶(cutinase),环糊精糖基转移酶,脱氧核糖核酸酶,酯酶,半乳糖苷酶,β-半乳糖苷酶,葡糖淀粉酶,葡糖氧化酶,葡糖苷酶,卤过氧化物酶(haloperoxidase),半纤维素酶,转化酶,异构酶,漆酶,连接酶,脂酶,裂合酶,甘露糖苷酶,氧化酶,果胶酶,过氧化物酶,植酸酶,酚氧化酶,多酚氧化酶,蛋白酶,核糖核酸酶,转移酶,转谷胺酰胺酶,或木聚糖酶。
如上所述,目的基因可能内源于宿主细胞,但是如果当整合过程完成时,本发明方法所得的生产细胞包含尽可能少的外源的,外来的,或异源的DNA,这是较为有利的。
结果本发明的优选实施方案涉及第一方面的方法,其中在选择性条件下培养的经挑选的宿主细胞基本不包含外源性DNA,优选每一整合的目的基因中少于500个碱基对,更优选少于300bp,更优选少于100bp,还更优选少于50bp,更优选少于25个bp,最优选没有外源DNA。
本发明的优选实施方案还涉及第一方面的方法,其中所述在选择性条件下培养的经挑选的宿主细胞只包含内源的DNA。
另一实施方案涉及的方法中,第一方面步骤e)中的挑选的宿主细胞只包含内源性DNA。
本领域已有通过改变或操作使基因非功能化的许多方法,如部分缺失基因或基因的启动子,或通过引入突变到基因或基因的启动子区。
本发明优选的实施方案涉及第一方面的方法,其中通过部分缺失所述基因,或通过在基因中引入一或多个突变改变宿主细胞的条件性必需染色体基因。
本发明在于在步骤中使宿主细胞中的至少一个条件性必需染色体基因非功能化,特别在于要非功能化的条件性必需基因的数量。可通过本领域所熟知的部分缺失或突变使所述基因非功能化;通过使用下面非限制性实施例所示的“缺失质粒”,所述基因可以被非功能化。对涉及第一方面方法步骤b)的改变的染色体基因的优选的每一实施方案,本文的非限制性实施例显示了最优选的实施方案,有为此目的进行构建的基因工具可参见参考文献,例如用于构建“缺失质粒”的PCR引物序列。
因此本发明的优选实施方案涉及第一方面的方法,其中所述改变的宿主细胞的条件必需染色体基因编码D-丙氨酸消旋酶,优选所述基因是自芽孢杆菌细胞的dal同系物,更优选所述基因同源于枯草芽孢杆菌,最优选所述基因是地衣芽孢杆菌的dal基因。
本发明的另一实施方案涉及第一方面的方法,其中所述改变的宿主细胞的条件必需染色体基因编码D-丙氨酸消旋酶,并且与表示为SEQ ID 12的1303到2469位的地衣芽孢杆菌dal序列有至少75%,优选80%,或优选85%,更优选90%,或更优选95%,最优选至少97%的同一性。
所述条件性必需基因可编码涉及利用特定碳源的多肽,例如木糖或阿拉伯糖,其中当所述基因非功能化时,宿主细胞不能在只补充有那种特定的碳源的极限培养基中生长。
本发明优选的实施方案涉及第一方面的方法,其中所述的改变的宿主细胞条件性必需染色体基因是木糖操纵子的,优选所述基因同源于枯草芽孢杆菌的xylA基因,最优选所述基因同源于地衣芽孢杆菌木糖异构酶操纵子的一或多个基因。
本发明优选的实施方案涉及第一方面的方法,其中所述改变的宿主细胞的条件性必需染色体基因编码半乳糖激酶(EC2.7.1.6),UTP-依赖型焦磷酸化酶(EC2.7.7.10),UDP-葡萄糖依赖型uridylyltransferase(EC2.7.7.12),或UDP-半乳糖差向异构酶(EC5.1.2.3),优选所述基因编码UDP-半乳糖差向异构酶(EC5.1.2.3),更优选所述基因与芽胞杆菌属的galE同源,最优选所述基因是地衣芽孢杆菌的galE。
本发明的优选实施方案涉及第一方面的方法,其中所述改变的宿主细胞的条件性必需染色体基因是葡糖酸操纵子的一或多个基因,优选所述基因编码葡糖酸激酶(EC2.7.1.12)或葡糖酸通透酶或两者,更优选所述基因是同源于源自枯草芽胞杆菌的gntK或gntP基因的一或多个基因,最优选所述基因是地衣芽胞杆菌的gntK或gntP,基因。
本发明的另一优选实施方案涉及第一方面的方法,其中所述改变的宿主细胞的条件性必需染色体基因是葡糖酸操纵子的一或多个基因,优选所述基因编码葡糖酸激酶(EC2.7.1.12)或葡糖酸通透酶或两者,并且与地衣芽胞杆菌的gntK或gntP序列的任一具有至少75%,优选85%,更优选95%,最优选至少97%的同一性。
本发明的另一优选的实施方案涉及第一方面的方法,其中所述改变的宿主细胞的条件性必需染色体基因是甘油操纵子的一或多个基因,优选所述基因编码甘油摄取易化蛋白(glycerol uptake facilityator)(通透酶(permease)),甘油激酶,或甘油脱氢酶,更优选所述基因是同源于源自枯草芽胞杆菌的glpP,glpF,glpK,glpD基因的一或多个基因,最优选所述基因是源于地衣芽胞杆菌的表示为SEQ ID No:26的glpP,glpF,glpK,glpD基因的一或多个基因。
本发明的另一优选的实施方案还涉及第一方面的方法,其中所述改变的宿主细胞的条件性必需染色体基因是甘油操纵子的一或多个基因,优选所述基因编码甘油摄取易化蛋白(通透酶),甘油激酶或甘油脱氢酶,并且与地衣芽胞杆菌的表示为SEQ ID NO:26的glpP,glpF,glpK和glpD序列的任一个有至少75%,优选85%,更优选95%,最优选至少97%的同一性。
本发明的另一优选实施方案涉及第一方面的方法,其中所述改变的宿主细胞的条件性必需染色体基因是阿拉伯糖操纵子的一或多个基因,优选所述基因编码阿拉伯糖异构酶,更优选所述基因同源于枯草芽胞杆菌的araA基因,最优选所述基因是源于地衣芽胞杆菌表示为SEQ ID NO:38的araA基因。
本发明的另一优选实施方案涉及第一方面的方法,其中所述改变的宿主细胞的条件性必需染色体基因是阿拉伯糖操纵子的一或多个基因,优选所述基因编码阿拉伯糖异构酶,并且与地衣芽胞杆菌的表示为SEQ IDNO:38的araA序列具有至少75%,优选85%,更优选95%,最优选至少97%的同一性。
文献中已有其它条件性必需基因的记述,例如用于合成一或多个氨基酸的细胞所需的基因,其中编码合成氨基酸所需多肽的非功能性基因使细胞为那种氨基酸的营养缺陷型,只有当培养基中补充了此种氨基酸时,所述细胞才能生长。此基因功能性的恢复使细胞可以自己合成此氨基酸,在营养缺陷型细胞的背景下可将其挑出来。
于是,本发明的优选实施方案涉及第一方面的方法,其中所述宿主细胞的条件性必需染色体基因编码涉及氨基酸合成的一或多个多肽,所述基因的非功能性使细胞为一或多个氨基酸的营养缺陷型,其中此基因功能性的恢复使细胞为此氨基酸的原养型。
本发明特别优选的实施方案涉及第一方面的方法,其中所述宿主细胞的条件性必需染色体基因编码涉及赖氨酸或甲硫氨酸合成的一或多个多肽,更优选的所述基因与枯草芽孢杆菌的metC或lysA基因同源,最优选所述基因是地衣芽孢杆菌的metC或lysA基因。
本发明另一特别优选的实施方案涉及第一方面的方法,其中所述宿主细胞的条件性必需染色体基因与地衣芽孢杆菌的表示为SEQ ID NO:42的metC序列或地衣芽孢杆菌的表示为SEQ ID NO:48的lysA序列有至少75%,优选85%,更优选95%,最优选97%的同一性。
如上所述,本发明方法与生物技术工业密切相关,多个优选生物体在本领域所熟知,特别是革兰氏阳性宿主细胞,特定的芽孢杆菌属宿主细胞,具体是嗜碱芽孢杆菌,解淀粉芽孢杆菌,短芽孢杆菌,环状芽孢杆菌,bacillusclausii,凝结芽孢杆菌,灿烂芽孢杆菌,迟缓芽孢杆菌,地衣芽孢杆菌,巨大芽孢杆菌,嗜热脂肪芽孢杆菌,枯草芽孢杆菌,苏云金芽孢杆菌。
本发明优选的实施方案涉及第一方面的方法,其中所述宿主细胞是革兰氏阳性细菌细胞,优选芽孢杆菌属细胞,最优选芽孢杆菌细胞选自嗜碱芽孢杆菌,解淀粉芽孢杆菌,短芽孢杆菌,环状芽孢杆菌,bacillus clausii,凝结芽孢杆菌,灿烂芽孢杆菌,迟缓芽孢杆菌,地衣芽孢杆菌,巨大芽孢杆菌,嗜热脂肪芽孢杆菌,枯草芽孢杆菌,苏云金芽孢杆菌。
本发明的另一实施方案涉及第一方面的方法,其中所述DNA构建体是质粒。
如其它部分所述,本发明提供了进行本发明方法的遗传工具,例如宿主细胞,本发明的DNA构建体,例如第二方面的DNA构建体包括:
i)自宿主细胞的条件性必需染色体基因的改变的非功能性拷贝,优选拷贝部分缺失;和
ii)至少一个目的基因拷贝,其一端侧接于i),另一端侧接于与宿主细胞DNA序列同源的DNA片段,所述DNA序列位于相邻于i)的条件性必需基因的宿主细胞染色体上。
本发明优选的实施方案涉及第二方面的DNA构建体,其中所述i)中改变的宿主细胞的条件性必需基因编码D-丙氨酸消旋酶,优选所述基因是芽孢杆菌细胞的dal同系物,更优选所述基因与自枯草芽孢杆菌的dal同源,最优选所述基因是地衣芽孢杆菌dal基因。
本发明的另一优选实施方案涉及第二方面的构建体,其中所述i)中改变的宿主细胞的条件性必需基因编码D-丙氨酸消旋酶,并且其与表示为SEQ ID NO:12地衣芽孢杆菌的dal序列1303到2469位具有至少75%,优选80%,或优选85%,更优选90%,或更优选95%,最优选97%同一性。
本发明的另一实施方案涉及第二方面的DNA构建体,其中宿主细胞的条件性必需染色体基因的改变的非功能性拷贝是宿主细胞在只补充了一种特定主要碳源的极限培养基中培养所需的一或多个拷贝。
本发明的优选实施方案涉及第二方面的DNA构建体,其中宿主细胞的条件性必需染色体基因的i)中改变的非功能性拷贝是木糖操纵子的一或多个基因,优选所述基因与枯草芽孢杆菌的xylA基因同源,最优选所述基因与地衣芽孢杆菌的木糖异构酶操纵子的一或多个基因同源。
本发明的另一优选实施方案涉及第二方面的DNA构建体,其中i)中改变的宿主细胞的染色体基因编码半乳糖激酶(EC2.7.1.6),UTP-依赖型焦磷酸化酶(EC2.7.7.10),UDP-葡萄糖依赖型uridylyltransferase(EC2.7.7.12),或UDP-半乳糖差向异构酶(EC5.1.2.3),优选所述基因编码UDP-半乳糖差向异构酶(EC5.1.2.3),更优选所述基因与芽胞杆菌的galE同源,最优选所述基因是地衣芽孢杆菌的galE。
本发明的另一更优选实施方案涉及第二方面的DNA构建体,其中所述条件性必需染色体基因是葡糖酸操纵子的一或多个基因,优选所述基因编码葡糖酸激酶(EC2.7.1.12)或葡糖酸通透酶或两者,更优选所述基因是同源于源自枯草芽胞杆菌的gntK或gntP基因,最优选所述基因是地衣芽胞杆菌的gntK或gntP基因的一个或多个基因。
本发明的另一优选实施方案还涉及第二方面的DNA构建体,其中所述条件性必需染色体基因是甘油操纵子的一或多个基因,优选所述基因编码甘油摄取易化蛋白(glycerol uptake facilitator)(通透酶),甘油激酶,或甘油脱氢酶,更优选所述基因是同源于源自枯草芽胞杆菌的glpP,glpF,glpK,glpD基因的一或多个基因,最优选所述基因是源于地衣芽胞杆菌的表示为SEQ ID No:26的glpP,glpF,glpK,glpD基因的一或多个基因。
本发明的一特别优选实施方案涉及第二方面的DNA构建体,其中所述条件性必需染色体基因是甘油操纵子的一或多个基因,优选所述基因编码甘油摄取易化蛋白(通透酶),甘油激酶,或甘油脱氢酶,并且其具有与地衣芽胞杆菌的表示为SEQ ID No:26的glpP,glpF,glpK,glpD基因中的任一个的至少75%,优选85%,更优选95%,最优选至少97%的同一性。
本发明的另一更优选实施方案涉及第二方面的DNA构建体,其中所述宿主细胞的条件性必需染色体基因是阿拉伯糖操纵子的一或多个基因,优选所述基因编码阿拉伯糖异构酶,更优选所述基因同源于枯草芽胞杆菌的araA基因,最优选所述基因是源于地衣芽胞杆菌表示为SEQ ID NO:38的araA基因。
本发明的优选实施方案涉及第二方面的DNA构建体,其中所述条件性必需染色体基因是阿拉伯糖操纵子的一或多个基因,优选所述基因编码阿拉伯糖异构酶,并且与地衣芽胞杆菌的表示为SEQ ID NO:38的araA基因具有至少75%,优选85%,更优选95%,最优选至少97%的同一性。
本发明的另一优选实施方案还涉及第二方面的DNA构建体,其中所述宿主细胞的条件性必需染色体基因编码涉及氨基酸合成的一或多个多肽,当所述非功能性基因存在细胞中而没有所述基因的其它功能性拷贝时,所述细胞为一或多个氨基酸的营养缺陷型,其中此基因功能性的恢复使细胞为此氨基酸的原养型;优选条件性必需染色体基因编码涉及赖氨酸或甲硫氨酸合成的一或多个多肽,更优选的所述基因与枯草芽孢杆菌的metC或lysA基因同源,最优选所述基因是地衣芽孢杆菌的metC或lysA基因。还更优选所述条件性必需染色体基因与地衣芽孢杆菌的表示为SEQ ID NO:42的metC序列或地衣芽孢杆菌的表示为SEQ ID NO:48的lysA序列有至少75%,优选85%,更优选95%,最优选97%的同一性。
本发明提供了在生物技术工业大有用途的构建生产型宿主细胞的方法,如第三方面的包含目的基因至少两个稳定整合到染色体的拷贝的宿主细胞,其中至少一个整合的拷贝相邻于条件必需基因座,其中所述细胞由第一方面定义的任一方法得到。
本发明的第一方面记述了整合目的基因进入宿主细胞染色体,由此目的基因整合到相邻于条件必需基因座的位置。目的基因和所述基因座的准确的相对位置并非本方法所主要关注的,但是一般来说应该缩小间隔两者的碱基对的长度,这样既可达到稳定的整合,又可使多余整合到宿主细胞基因组的DNA序列最少。
因此,本发明优选的实施方案涉及第三方面的宿主细胞,其中所述目的基因与条件性必需基因座相距不超过1000个碱基对,优选不超过750个碱基对,更优选不超过500个碱基对,更优选不超过250个碱基对,最优选不超过100个碱基对。
如上所述,目的在于使宿主细胞基因组中存在的整合的或多余DNA序列最少,特别是外源的DNA,理想的宿主细胞只包含内源DNA,如整合到限定的不同的染色体位置的内源目的基因的多个拷贝。
因此,本发明的优选实施方案涉及第三方面的宿主细胞,其基本不包括非外源性DNA,优选每一整合的目的基因中所述外源DNA少于500个碱基对,更优选少于300bp,甚至更优选少于100bp,还更优选少于50bp,或更优选少于25bp,最优选没有外源性DNA。
本发明另一优选的实施方案涉及第三方面的宿主细胞,其只包含内源性DNA。
在生物技术工业中,优选一定的细菌菌株作为如前所述的宿主细胞。
本发明的优选实施方案涉及第三方面的宿主细胞,其是革兰氏阳性细菌细胞,优选芽胞杆菌属细胞,最优选芽胞杆菌属细胞选自嗜碱芽孢杆菌,解淀粉芽孢杆菌,短芽孢杆菌,环状芽孢杆菌,bacillus clausii,凝结芽孢杆菌,灿烂芽孢杆菌,迟缓芽孢杆菌,地衣芽孢杆菌,巨大芽孢杆菌,嗜热脂肪芽孢杆菌,枯草芽孢杆菌,苏云金芽孢杆菌。
本发明另一优选的实施方案涉及第三方面的宿主细胞,其中与整合的目的基因拷贝相邻的是编码D-丙氨酸消旋酶的基因,优选同源于枯草芽胞杆菌dal基因的基因,更优选与地衣芽胞杆菌dal序列的表示为SEQ ID 12的1303到2469位具有至少75%同一性的基因,更优选至少85%相同于,更优选至少95%相同于,最优选至少97%相同于地衣芽胞杆菌的dal序列表示为SEQ ID 12的1303到2469位的基因。
本发明特别优选的实施方案涉及第三方面的宿主细胞,其中整合的目的基因拷贝相邻于宿主细胞在只补充了一特定主要碳源的极限培养基中生长所必需的基因。
本发明另一优选的实施方案还涉及第三方面的宿主细胞,其中整合的所述目的基因拷贝相邻于木糖操纵子基因,优选相邻于同源于枯草芽胞杆菌xylR或xylA基因的基因,最优选相邻于地衣芽胞杆菌的xylR或xylA的基因。
本发明一更优选的实施方案涉及第三方面的宿主细胞,其中整合的所述目的基因拷贝相邻于编码半乳糖激酶(EC2.7.1.6)的基因,UTP-依赖型焦磷酸化酶(EC2.7.7.10),UDP-葡萄糖依赖型uridylyltransferase(EC2.7.7.12),或UDP-半乳糖差向异构酶(EC5.1.2.3),优选所述基因编码UDP-半乳糖差向异构酶(EC5.1.2.3),更优选相邻于与枯草芽胞杆菌的galE同源的基因,最优选相邻于地衣芽孢杆菌的galE。
本发明另一优选的实施方案涉及第三方面的宿主细胞,其中整合的所述目的基因拷贝相邻于葡糖酸操纵子的基因,优选相邻于编码葡糖酸激酶(EC2.7.1.12)或葡糖酸通透酶的基因,更优选相邻于同源于源自枯草芽胞杆菌的gntR,gntK,gntP,或gntZ基因的基因,最优选所述基因相邻于地衣芽胞杆菌的gntR,gntK,gntP,或gntZ基因。
本发明另一优选的实施方案涉及第三方面的宿主细胞,其中整合的所述目的基因拷贝相邻于甘油操纵子的基因,优选所述基因编码甘油摄取易化蛋白(通透酶),甘油激酶,或甘油脱氢酶,更优选所述基因同源于源自枯草芽胞杆菌的glpP,glpF,glpK,glpD基因,最优选所述基因是源于地衣芽胞杆菌的表示为SEQ ID No:26的glpP,glpF,glpK,glpD基因。
本发明另一优选的实施方案涉及第三方面的宿主细胞,其中整合的所述目的基因拷贝相邻于阿拉伯糖操纵子的基因,优选所述基因编码阿拉伯糖异构酶,更优选所述基因同源于枯草芽胞杆菌的araA基因,最优选所述基因是源于地衣芽胞杆菌表示为SEQ ID NO:38的araA基因。
本发明优选的实施方案涉及第三方面的宿主细胞,其中整合的所述目的基因拷贝相邻的基因编码涉及氨基酸合成的一或多个多肽,并且所述基因的非功能性使细胞为一或多个氨基酸的营养缺陷型,并且其中所述基因的功能性的恢复使所述细胞为所述氨基酸的原养型;优选整合的所述目的基因拷贝相邻的基因编码涉及赖氨酸或甲硫氨酸合成的一或多个多肽,更优选所述基因同源于枯草芽胞杆菌的metC或lysA基因,最优选所述基因是源于地衣芽胞杆菌的metC或lysA基因。同样优选整合的所述目的基因拷贝相邻的基因与地衣芽胞杆菌的表示为SEQ ID No:42的metC序列或地衣芽胞杆菌的表示为SEQ ID No:48的lysA序列有至少75%,优选至少85%,更优选至少95%,最优选至少97%同一性。
第三方面的宿主细胞特别关注于多肽如酶的工业化生产。
本发明优选的实施方案涉及第三方面的宿主细胞,其中所述目的基因编码酶,优选淀粉分解酶,脂肪分解酶,蛋白水解酶,溶细胞酶,氧化还原酶或植物细胞壁降解酶,更优选具有活性的酶选自氨肽酶,淀粉酶,淀粉葡糖苷酶,糖酶,羧肽酶,过氧化氢酶,纤维素酶,壳多糖酶,角质酶(cutinase),环糊精糖基转移酶,脱氧核糖核酸酶,酯酶,半乳糖苷酶,β-半乳糖苷酶,葡糖淀粉酶,葡糖氧化酶,葡糖苷酶,卤过氧化物酶,半纤维素酶,转化酶,异构酶,漆酶,连接酶,脂酶,裂合酶,甘露糖苷酶,氧化酶,果胶酶,过氧化物酶,植酸酶,酚氧化酶,多酚氧化酶,蛋白酶,核糖核酸酶,转移酶,转谷胺酰胺酶,或木聚糖酶。还优选所述目的基因编码抗微生物肽,优选抗真菌肽或抗细菌肽;或所述目的基因编码人体中具有生物活性的肽,优选具有药物活性的肽,更优选胰岛素/胰岛素原/前胰岛素原或其变体,生长激素或其变体,或凝血因子VII或VIII或其变体。
本发明另一优选的实施方案涉及第三方面的宿主细胞,其中没有抗生素标记存在。
本发明公开了适合应用于第一方面方法的宿主细胞的构建,特别涉及宿主细胞,其中一,二或多个条件必需基因被非功能化。以下的非限制性实施例显示了如果采用本发明的特定缺失质粒的部分缺失从而使本发明优选的条件性必需基因非功能化。特别本发明涉及第四方面的芽孢杆菌属细胞,其优选是地衣芽孢杆菌细胞,其中至少两个条件性必需基因被非功能化,优选所述基因选自xylA,galE,gntK,gntP,glpP,glpF,glpK,glpD,araA,metC,lysA,和dal。
在第一方面的方法中类似地设想了第三方面这样的宿主细胞的用途。
本发明提供的另一用于第一方面方法的遗传工具是包含第二方面的DNA构建体的宿主细胞。
本发明的最后一方面涉及生产目的酶的方法,包括在适合生产酶的条件下培养第三方面的细胞,并任选纯化所述酶。
实施例
实施例1
地衣芽孢杆菌SJ4671(WO99/41358)在其染色体上包含两个稳定整合的amyL基因拷贝,它们以相反的相对方向插入到地衣芽孢杆菌α-淀粉酶基因,amyL的区。以下的实施例描述了通过可选择的,指导的整合到地衣芽孢杆菌染色体的另一限定区将第三amyL基因拷贝插入到此菌株中,从而得到含有三个稳定的amyL基因的染色体拷贝的菌株,其不含外来的DNA。
木糖异构酶的缺失/整合概述(图1)
地衣芽胞杆菌木糖异构酶区的序列可由GenBank/EMBL获得,保藏号Z80222。
通过在温度敏感亲本质粒上克隆来自木糖异构酶区的两个PCR扩增片段从而构建称为“缺失质粒”的质粒。所述PCR片段为“A”和“B”,其中A包含xylR启动子和部分xylR基因;B包含缺失了启动子的xylA的内部片段和基因的前70个碱基对。将侧接解离酶(res)位点的壮观霉素抗性基因引入到质粒上的片段A和B之间。以后可通过解离酶介导的位点特异性重组除去此壮观霉素抗性基因。
通过温度敏感质粒的整合以及剪切介导的,经片段A和B的双重(dovble)同源重组使木糖异构酶缺失从缺失质粒转移到芽孢杆菌属目标菌株的染色体。所得菌株称为“缺失菌株”。此菌株不能在木糖作为唯一碳源的极限培养基中生长。
构建“整合质粒”用于将基因插入到缺失菌株的木糖异构酶区。我们意图PCR扩增称为“C”的片段,其包含xylA启动子和xylA基因的约1kb。但是,如后面所述,只有称为“D”的较小片段成功得到了扩增和克隆,其包含xylA启动子和xylA基因的前250bp。整合质粒在温度敏感载体上包含片段A和D。在整合质粒片断A和D间表达盒也得以克隆。
温度敏感整合质粒转移到地衣芽孢杆菌缺失菌株,其整合到染色体中;随后的温度敏感载体的剪切得到保证,然后可以分离“整合菌株”,其在木糖作为唯一碳源的极限培养基中生长。这样的整合菌株经片段A和D的双重同源重组恢复了染色体xylA基因。在此过程中,表达盒式结构已被整合到染色体中。
质粒构建体
采用amersham pharmacia biotech的Ready-To-Go PCR Bead,按照生产商指导进行PCR扩增,退火温度55。
质粒pSJ5128和pSJ5129
从地衣芽孢杆菌PL1980染色体DNA扩增A片段(xylR启动子和部分xylR基因),采用引物:
#183235;[HindIII Z80222 1242-1261→](SEQ ID 1):
5′-GACTAAGCTTCTGCATAGTGAGAGAAGACG
#183234:[EcoRI;BglII;NotI;MluI;SalI;ScaI←Z80222 2137-2113→](SEQ ID 2):
5′-
GACTGAATTCAGATCTGCGGCCGCACGCGTGTCGACAGTACTGAAATA
GAGGAAAAAATAAGTTTTC
用EcoRI和HindIII消化PCR片段并纯化,然后与EcoRI和HindIII消化的pUC19连接。连接的混合物通过电穿孔转化进入大肠杆菌SJ2,挑选氨苄西林抗性转化体(200μg/ml)。对三个这样的氨苄西林抗性转化体的PCR片段进行测序,发现全部都正确。保留的两个命名为SJ5128(SJ2/pSJ5128)和SJ5129(SJ2/pSJ5129)的克隆。
质粒pSJ5124,pSJ5125:
从地衣芽孢杆菌PL1980染色体DNA扩增B片段(xylA的内部部分,缺失了启动子和编码区的前70个碱基对),采用引物为:
#183230[EcoRI ←Z80222 3328-3306→](SEQ  ID  3):
5′-GACTGAATTCCGTATCCATTCCTGCGATATGAG
#183227[BamHI;BglII←Z80222 2318-2342→](SEQ  ID  4):
5′-GACTGGATCCAGATCTTATTACAACCCTGATGAATTTGTCG
用EcoRI和HindIII消化PCR片段并纯化,然后与EcoRI+HindIII消化的pUC19连接,并通过电穿孔转化到大肠杆菌SJ2。挑选氨苄西林抗性转化体(200μg/ml)。通过DNA测序确认两个克隆是正确的,保留命名为SJ5124(SJ2/pSJ5124)和SJ5125(SJ2/pSJ5125)。
质粒pSJ5130:
从地衣芽孢杆菌PL1980染色体DNA扩增C片段(包含xylA启动子和xylA基因的约1kb),采用引物为:
#183230(参见上面,SEQ ID 3)
#183229[BamHI;BglII;NheI;ClaI;SacII←Z80222 2131-2156→](SEQ ID 5):
5′-
GACTGGATCCAGATCTGCTAGCATCGATCCGCGGCTATTTCCATTGAAA
GCGATTAATTG
用EcoRI和BamHI消化PCR片段并纯化,然后与EcoRI和BamHI消化的pUC19连接,并通过电穿孔转化到大肠杆菌SJ2。挑选氨苄西林抗性转化体(200μg/ml)。发现一含有全长PCR片段的克隆在启动子区的-35到-10序列间具有单一的碱基对缺失。保留此转化体并命名为SJ5130(SJ2/pSJ5130)。
质粒pSJ5131:
此质粒如上同pSJ5130构建,但证实只含有400碱基对PCR片段(D片段),其包含xylA启动子和xylA编码序列的前250碱基对。DNA测序证实在片段中没有序列错误存在。保留此转化体并命名为SJ5131(SJ2/pSJ5131)。
质粒pSJ5197,pSJ5198:
这些质粒在温度敏感,可移动载体上含有A(xylR)片段。它们通过将来自pSJ5129的0.9kb BglII-HindIII片段与pSJ2739的5.4kb BglII-HindIII片段相连,再用连接复合体转化枯草芽孢杆菌DN1885感受态细胞而构建,然后进行红霉素抗性(5μg/ml)筛选。保留两个克隆,SJ5197(DN1885/pSJ5131)和SJ5198(DN1885/pSJ5198)。
质粒pSJ5211,pSJ5212:
这些质粒包含插入到邻近B片段的res-spc-res盒。它们通过将pSJ3358的1.5kb BclI-BamHI片段连接到pSJ5124的BglII位点,并将连接的混合体转化进入大肠杆菌SJ2而构建,然后进行氨苄西林抗性(200μg/ml)和壮观霉素抗性(120μg/ml)选择。保留两个克隆,SJ5211(SJ2/pSJ5211)和SJ5212(SJ2/pSJ5212),其中res-spc-res盒以可能的方向之一插入。
缺失质粒
质粒pSJ5218:
此质粒包含侧接A和B片段的res-spc-res盒。其通过将pSJ5211的2.5kbEcoRI-BamHI片段连接到5.3kb pSJ5197的EcoRI-BglII片段,并将连接的复混合体转化进入枯草芽孢杆菌DN1885而构建,然后进行红霉素抗性(5μg/ml)和壮观霉素抗性(120μg/ml)选择。保留转化体SJ5218(DN1885/pSJ5218)。
整合质粒
质粒pSJ5247,pSJ5248:
这些质粒在温度敏感,可移动载体上包含短的400碱基对的D片段(PxylA-xylA),以及A片段(xylR)。它们通过将pSJ5131的0.4kb BglII-EcoRI片段连接到5.3kb pSJ5197的BglII-EcoRI片段,并将连接的混合体转化进入枯草芽孢杆菌DN1885而构建,然后于30℃进行红霉素抗性(5μg/ml)选择。保留两个转化体SJ5247(DN1885/pSJ5247)和SJ5248(DN1885/pSJ5248)。
构建具有染色体xylA缺失的菌株
将缺失质粒pSJ5218转化进入枯草芽孢杆菌接合供体菌株PP289-5(其含有染色体dal-缺失,以及质粒pBC16和pLS20),转化体进行壮观霉素抗性(120μg/ml),红霉素抗性(5μg/ml)和四环素抗性(5μg/ml)选择,于带有D-丙氨酸(100μg/ml)平板上30℃下进行。保留两个转化体SJ5219和pSJ5220。
WO99/41358所述的两拷贝的地衣芽孢杆菌α-淀粉酶菌株SJ4671在接合中用作受体。
供体菌株SJ5219和SJ5220在补充了D-丙氨酸(100μg/ml),壮观霉素(120μg/ml),红霉素(5μg/ml),四环素(5μg/ml)的LBPSG平板(磷酸(0.01MK3PO4),葡萄糖(0.4%),淀粉(0.5%)的LB平板)上,30下培养过夜。受体菌株在LBPSG平板培养过夜。
一接种针菌环量的供体和受体在LBPSG平板上与D-丙氨酸(100μg/ml)混合,在30℃下温育5小时。然后将此平板复制到含有壮观霉素(120μg/ml),红霉素(5μg/ml)的LBPSG上,在30℃下温育2天。此四个接合得到13到25个转接合子。
50℃下在有壮观霉素(120μg/ml)和红霉素(5μg/ml)的LBPSG上再分离四环素敏感性(指示缺少pBC16)转接合子,温育过夜,所述50℃平板的单个克隆接种到10ml TY液体培养液中,26℃下振动温育3天。然后将等分试样转移到新鲜的10ml TY培养基中,30℃下温育过夜。将所述培养液铺板在有120μg/ml壮观霉素的LBPSG上,30℃下温育过夜后,将这些平板分别复制铺板到壮观霉素和红霉素,从所有菌株接合得到红霉素敏感性,壮观霉素抗性分离体。
保留以下的菌株,其包含被res-spc-res盒取代的染色体xylA启动子和xylA编码序列的前70个碱基对:
SJ5231:SJ4671受体,SJ5219供体。
SJ5232:SJ4671受体,SJ5220供体。
在TSS极限培养基琼脂平板上进行菌株表型分析,所述平板如下制备。400ml H2O和10g琼脂121℃高压灭菌20分钟,冷却到60℃。添加如下的无菌溶液:
1 M TrispH7.5  25ml
2%FeCl3.6H2O  1ml
2%二水合柠檬酸三钠1ml
1 M K2HPO4 1.25ml
10%MgSO4.7H2O 1ml
10%谷氨酰胺 10ml,和
20%葡萄糖12.5ml,或
15%木糖16.7ml
地衣芽孢杆菌SJ4671在葡萄糖和木糖TSS平板上都生长良好,形成褐色菌落。
xylA缺失菌株SJ5231-SJ5232在葡萄糖TSS平板上生长良好,但在TSS木糖平板上即使经过延长时间的温育也只有很薄,透明的生长。显然这些菌株不能利用木糖为单一碳源。
定向和选择整合到xyl区
整合质粒pSJ5247(包含D和A片段)以及作为阴性对照的pSJ5198(只含有A片段)转化进入枯草芽孢杆菌接合供体菌株PP289-5(其含有染色体dal缺失,质粒pBC16和pLS20)的感受态细胞,在30℃下在有D-丙氨酸(100μg/ml)平板上挑选红霉素(5μg/ml)和四环素(100μg/ml)抗性转化体。
保留的转化体是:
SJ5255:PP289-5/pSJ5198。
SJ5257:PP289-5/pSJ5248。
供体菌株SJ5255和SJ5257用于与受体SJ5231接合。30℃下在红霉素(5μg/ml)上筛选转接合子。转接合子50℃下在含有木糖的TSS平板上划线。平行地,SJ5221作为木糖异构酶阳性对照菌株也划线(同样在50℃下)。
温育过夜后,所有菌株形成很薄的,透明的生长。但是对照生长较好,菌落褐色。
50℃下再温育一天后,来自SJ5257的转接合子,即含有具有PxylA-xylA片段(D)的整合质粒的菌株,在薄的,透明的生长背景下出现了一些褐色菌落。在随后的50℃下持续温育天数里,这些菌落稳定地生长,又出现其它菌落。
得自SJ5255(阴性对照,不能恢复染色体xylA基因)的转接合子没有观察到褐色菌落(除了第一次温育过夜之后所见的薄的,透明的生长外,没有更进一步生长)。
α-淀粉酶定向整合进入xyl区
含有整合质粒的amyL构建体
通过采用BglII消化此质粒,以及插入含有自pSJ4457的BglII-BclI片段的1.9kbamyL,从整合载体质粒pSJ5247构建质粒pSJ5291和pSJ5292。所述连接复合体转化进入枯草芽孢杆菌DN1885,保留此两个转化体为SJ5291和SJ5292。
构建接合供体菌株,转移至地衣芽孢杆菌宿主,以及染色体整合
将质粒pSJ5291和pSJ5292转化到枯草芽孢杆菌接合供体菌株pP289-5(其含有染色体dal缺失,以及质粒pBC16和pLS20)的感受态细胞,在含有D-丙氨酸(100μg/ml)的平板30℃下挑选红霉素抗性(5μg/ml)和四环素抗性(5μg/ml)转化体。
保留转化体SJ5293(PP289-5/pSJ5291)和SJ5294(PP289-5/pSJ5292)。在与木糖异构酶缺失菌株SJ5231和SJ5232接合中此二菌株用作供体。在含有红霉素抗性(5μg/ml)的LBPGA平板上挑选转接合子,来自每一接合的一或二个四环素敏感转接合子在50℃下温育的TSS木糖平板上划线。温育两天后,生长良好的菌落接种到不含抗生素的液体TY培养基(10ml)中,将这些培养液30℃下振荡培养。培养过夜后,将每一培养液的100μL转移到新的10ml TY培养基中,重复培养过程。此过程重复两次,此外所述培养液30℃下铺板在TSS木糖平板上。约一周后,所有的复制铺板到TSS木糖以及含有红霉素(5μg/ml)的LBPSG上。接下来的一天,推定Em敏感菌株在同样的平板类型上再划线。
保留在TSS木糖平板上生长良好的随后的Em敏感菌株:
SJ5308(来自于接合供体SJ5293,宿主SJ5231)
SJ5309(来自于接合供体SJ5293,宿主SJ5231)
SJ5310(来自于接合供体SJ5293,宿主SJ5232)
SJ5315(来自于接合供体SJ5294,宿主SJ5231)
Southern印迹分析
两拷贝amyL菌株SJ4671和菌株SJ5308,SJ5309,SJ5310,SJ5315在TY葡萄糖中培养过夜,提取染色体DNA。用HindIII消化所述染色体DNA,琼脂糖凝胶电泳分离片段,并转移到Immobilon-N滤膜上(Miilipore)并杂交到基于HindIII消化的pSJ5292的生物素化的探针上(采用NEBlot PhotopeKit和Photope Detection Kit6K)。
在此两拷贝菌株中,两amyL基因拷贝保持在~10kbHindIII片段上。此外杂交~2.8kb片段,其预计与xyl区杂交。在具有第三amyL基因插入到木糖基因区的四个菌株中,~2.8kb片段缺失并被~4.6kb片段替代。完全可以预计amyL基因整合到木糖基因区。保持要进行两拷贝插入的~10kb片段。
综上,Southern印迹分析显示菌株SJ5308,SJ5309,SJ5310和SJ5315在它们染色体上具有正确插入的第三amyL基因拷贝。
摇瓶评价
将具有amyL基因整合到木糖异构酶区中的菌株,以及几个对照菌株接种到摇瓶中的100ml BPX培养基中,37℃下300rpm培养7天。由Phadebas分析确定培养液中α-淀粉酶活性:
菌株                                  α-淀粉酶相对活性单位/ml
                                                                                
SJ4270(一拷贝amyL菌株)                100
SJ4671(二拷贝amyL菌株)                161
SJ5231(xylA基因缺失的二拷贝amyL菌株)  148
SJ5308(三拷贝amyL菌株)                200
SJ5309(三拷贝amyL菌株)                245
SJ5310(三拷贝amyL菌株)                200
SJ5315(三拷贝amyL菌株)                200
                                                                                  
将每一摇瓶的等分试样铺板在淀粉酶指示剂平板上。所有菌落都是淀粉酶阳性。来自SJ4671,SJ5309和SJ5315中每一个的四个单一菌落接种到新鲜BPX摇瓶中,如上培养。培养液中的α-淀粉酶活性由Phadebas分析确定。
菌株                        α-淀粉酶相对活性单位/ml
                                                                                    
SJ4671(二拷贝amyL 1菌株)    100
SJ4671                      102
SJ4671                      88
SJ4671                      84
SJ5309(三拷贝amyL菌株)      149
SJ5309                      141
SJ5309                      135
SJ5309                      149
SJ53 15(三拷贝amyL菌株)     135
SJ5315                      147
SJ5315                      159
SJ5315                      153
                                                                                    
在所述摇瓶条件下,所述三拷贝amyL菌株(黑体)产生比二拷贝amyL菌株多约50%的α-淀粉酶。
实施例2:
WO99/41358以SJ4671记述了在其染色体具有两个稳定整合的amyL基因拷贝的地衣芽孢杆菌的菌株,所述拷贝以相反的相对方向插入到枯草芽孢杆菌α-淀粉酶基因,amyL,的区。如上记述了amyL基因的第三拷贝插入到xylRA。
此记述了通过选择的,定向整合到地衣芽孢杆菌染色体的另一区插入到第四amyL基因拷贝的此三拷贝菌株。
葡糖酸缺失/整合概述(图2)
由Genband/EMBL可获得用于葡糖酸利用的包含gntR,gntK,gntP,gntZ基因的地衣芽孢杆菌葡糖酸操纵子的序列区,保藏号D31631。图2给出了该区的图示。
缺失可由克隆引入,在温度敏感质粒上,PCR扩增命名为″A″的片段(包含gntK的部分和gntP基因的部分)和″B″(包含gntZ的内部片段)。为帮助缺失菌株的挑选,在片段″A″和″B″之间引入侧接解离酶位点的卡那霉素抗性基因,得到图2中称为“缺失质粒”的质粒。此卡那霉素抗性基因可以后通过解离酶介导的位点专一重组除去,如WO96/23073所述。
通过双重重组经片段“A”和″B″将所述缺失转移到目标菌株染色体,由温度敏感质粒的整合和切除介导。所得为图2中标记为“缺失质粒”的菌株。此菌株在葡糖酸作为唯一碳源的极限培养基中不能生长。
质粒构建体
为构建用于基因插入的整合质粒,扩增PCR片段“C”。此片段包含约1kb的gntP的内部片段。所述整合质粒由温度敏感载体上的片段″B″和″C″构成。在″B″和″C″之间克隆用于整合的表达盒。一旦转移到地衣芽孢杆菌缺失菌株并且温度敏感载体整合和切除,在葡糖酸作为唯一碳源的极限培养基中可以生长的菌株可被分离。这样的菌株已经通过经片段″B″和″C″的双重同源重组恢复了染色体gntP基因。在此过程中,表达盒整合到染色体得到图2的“整合菌株”。
按照制造商指导,采用amersham pharmacia biotech的Ready-To-GoPCR Beads进行PCR扩增,退火温度55℃。
缺失质粒pMOL1789和pMOL1790:
从地衣芽孢杆菌染色体DNA扩增″B″片段(包含gntZ内部部分),采用引物:
#187338[AvaI←D31631  4903-4922→](SEQ  ID  6):
5′-TATTTCCCGAGATTCTGTTATCGACTCGCTC
#187339[EagI←D31631  5553-5538→](SEQ  ID  7):
5′-GTTTTCGGCCGCTGTCCGTTCGTCTTT
所述片段用AvaI+EagI消化,与AvaI+EagI消化的pMOL1642连接,通过转化将连接质粒引入枯草芽孢杆菌JA578,进行红霉素(5μg/ml)抗性挑选。在三个克隆上的插入体进行测序,发现所有都正确。保留MOL1789(JA578(repF+)/pMOL1789)和MOL1790(JA578/pMOL1790)。图2中显示了相对gntZ″B″片段的终点。
质粒pMOL1820和pMOL1821:
从地衣芽孢杆菌染色体DNA扩增″A″片段(包含部分gntK和部分gntP基因),采用引物:
#184733[←D31631  3738-3712→](SEQ  ID  8):
5′-GTGTGACGGATAAGGCCGCCGTCATTG
#184788[←D31631  3041-3068→](SEQ  ID  9):
5′-CTCTTGTCTCGGAGCCTGCATTTTGGGG
所述片段用ClaI+EcoRL消化,与EcoRL+ClaI消化的pMOL1789连接,通过转化将连接质粒引入枯草芽孢杆菌PL1801,进行红霉素(5μg/ml)抗性挑选。对三个克隆上的插入体进行测序,发现所有都正确。保留MOL1820(JA578/pMOL1820)和MOL1821(JA578/pMOL1821)。图2中显示了相对gntZ″A″片段的终点。
整合质粒pMOL1912和pMOL1913:
这些质粒在温度敏感,可移动载体上包含gntK的短C-末端部分和gntP全部开放读框(“C”片段)。它们通过连接地衣芽孢杆菌染色体DNA的0.9kb片段制作,采用引物:
#B1656D07[←D31631  3617-3642→](SEQ ID 10):
5′-AGCATTATTCTTCGAAGTCGCATTGG
#B1659F03[BglII←D31631  4637-4602→](SEQ ID 11):
5′-TTAAGATCTTTTTTATACAAATAGGCTTAACAATAAAGTAAATCC
所述片段用BglII+EcoRI消化,与BglII+EcoRI消化的pMOL1820连接,转化连接混合物,通过转化将连接质粒引入枯草芽孢杆菌PL1801,进行红霉素(5μg/ml)抗性挑选。在三个克隆上的插入体进行测序,发现所有都正确。保留 MOL1912 (PL1801/pMOL1789)和 MOL1913(PL1801/pMOL1913)。图2中显示了相对gntZ″C″片段的终点。
发现这些质粒即使不具有直接gntP基因上游的启动子序列它们也可表达功能性GntP。为了通过在葡糖酸中选择生长在gntP区进行定向整合,需要缺失部分整合质粒pMOL1912上的gntP基因的N-末端序列。
质粒pMOL1972和pMOL1973:
这些质粒是pMOL1912的缺失衍生物,除了编码N-末端53个氨基酸的前158bp,其包含全部gntP基因。用StuI+EcoRV消化质粒pMOL1912并重新连接。通过感受态,所述连接复合物转化到枯草芽孢杆菌PL1801,进行红霉素(5μg/ml)抗性选择。通过限制性消化证实缺失。保留MOL1972(PL1801/pMOL1972)和MOL1973(PL1801/pMOL1973)。
当作为自由质粒在引入时,在gntP缺失背景下,这些质粒不支持在TSS葡糖酸平板上生长。
构建染色体gntP缺失的菌株
将缺失质粒pMOL1920转化到枯草芽孢杆菌接合供体菌株PP289-5的感受态细胞(其包含染色体dal缺失,和质粒pBC16和pLS20),在带有D-丙氨酸(100μg/ml)的平板30℃下进行卡那霉素抗性(10μg/ml),红霉素抗性(5μg/ml)和四环素抗性(5μg/ml)选择。保留两个转化体MOL1822和MOL1823。
两拷贝地衣芽孢杆菌α-淀粉酶菌株SJ4671,WO99/41358中所述,用作接合受体。
供体菌株MOL1822和MOL1823在30℃下在LBPSG平板(含有磷酸盐(0.01MK3PO4),葡萄糖(0.4%),和淀粉(0.5%)的LB平板)上培养过夜,其中添加了D-丙氨酸(100μg/ml),卡那霉素(10μg/ml),红霉素(5μg/ml)和四环素(5μg/ml)。受体菌株在LBPSG平板上培养过夜。
一菌环量供体和受体在含有D-丙氨酸(100μg/ml)的LBPSG平板表面混合,并在30℃下培养5小时。然后将此复制铺板到含有红霉素(5μg/ml)和卡那霉素(10μg/ml)的LBPSG上,并在30℃下培养2天。此4个接合产生25到50个转接合子。
50℃下在含有红霉素(5μg/ml)和卡那霉素(10μg/ml)的LBPSG上重新分离四环素敏感(指示缺少pBC16)转接合子,培养过夜,将50℃平板的单一菌落接种到10ml TY液体培养液,并在26℃下振荡培养3天,然后将等分试样转移至新鲜的10ml TY培养液,30℃下培养过夜。然后将培养液铺板到含有卡那霉素(10μg/ml)的LBPSG上,经过在30℃下培养过夜后,将这些平板分别复制铺板到卡那霉素和红霉素,从所有菌株组合物得红霉素敏感性,卡那霉素抗性分离体。保留如下的菌株,其中编码C-末端的gntP基因的部分被res-kana-res盒取代:
MOL1871:SJ4671受体,MOL1822供体.
MOL1872:SJ4671受体,MOL1823供体。
在TSS极限培养基琼脂平板上分析菌株表现型,所述平板如下制备:
400ml H2O和10g琼脂121℃高压灭菌20分钟,冷却到60℃。添加如下的无菌溶液:
1 M TrispH7.5 25ml
2%FeCl3.6H2O 1ml
2%二水合柠檬酸三钠1ml
1 M K2HPO4 1.25ml
10%MgSO4.7H2O 1ml
10%谷氨酰胺 10ml,和
20%葡萄糖 12.5ml,或
15%葡糖酸 16.7ml
地衣芽孢杆菌SJ4671在葡萄糖和葡糖酸TSS平板上都生长良好,形成褐色菌落。gntp缺失菌株MOL1871和MOL1872在葡萄糖TSS平板上生长良好,但在TSS葡糖酸平板上即使经过延长时间培养只形成很薄,透明的生长。这些菌株显然不能利用葡糖酸作为单一碳源。
如较前所述对三拷贝菌株SJ5309进行同样的gntP缺失步骤以制备淀粉酶表达盒的第四拷贝的整合。
定向和选择整合到gnt区
整合质粒pMOL1972(含有″B”和”C″片段),和作为阴性对照的pMOL1789(只含有″B″片段),转化入枯草芽孢杆菌接合供体菌株PP289-5(其含有染色体dal-缺失,和质粒pBC16和pLS20)感受态细胞,在带有D-丙氨酸(100μg/ml)的平板30℃下进行红霉素抗性(5μg/ml)和四环素抗性(5μg/ml)选择。保留转化体:
MOL1974:PP289-5/pMOL1972.
MOL1975:PP289-5/pMOL1973.
供体菌株MOL1974和MOL1975用于接合受体MOL1871和MOL1872。30℃下进行对红霉素(5μg/ml)的转接合子的选择。50℃下转接合子在含有葡糖酸的TSS平板上划线。作为平行对照,对SJ4671划线作为葡糖酸阳性对照菌株(也在50℃下)。
培养过夜后,所有的菌株形成了很薄的,透明的生长。所述对照却具有较好的生长,菌落呈褐色。再培养1天后,得自MOL1871和MOL1872的转接合子在薄的,透明的生长的背景中出现了一些褐色的菌落。这些菌落稳定生长,并且在50℃下继续培养的随后天数里继续出现了其它菌落。
gntP缺失菌株MOL1871和MOL1872中没有观察到菌落。
α-淀粉酶基因定向整合到gnt区
含amyL整合质粒的构建
下面的构建计划是有关利用如上的选择原则,整合gnt区中具有α-淀粉酶基因表达盒。
用BglII消化整合质粒pMOL1972,通过连接插入含有pSJ4457的amyL的1.9kb BglII-BclI片段(如WO99/41358)。连接混合物然后转化到枯草芽孢杆菌DN1885,并且在含有红霉素(5μg/ml)的LBPSG平板上进行转化体选择,通过限制性消化质粒DNA证实。
接合供体菌株,转移到地衣芽孢杆菌,和染色体整合
具有表达盒的整合质粒转化到枯草芽孢杆菌接合供体菌株PP289-5(其包含染色体dal-缺失,和质粒pBC16和pLS20)的感受态细胞,30℃下在D-丙氨酸(100μg/ml)平板上进行红霉素(5μg/ml)和四环素(5μg/ml)抗性选择。
保留包含具有表达盒整合质粒的转化体,并在与三拷贝菌株SJ5309gntP缺失受体接合中用作供体,反过来其构建如上对缺失菌株MOL1871和MOL1872所述。
在红霉素(5μg/ml)LBPGA平板上进行转接合子选择,且在50℃下培养的TSS葡糖酸平板上对来自每一接合的一或二个四环素敏感转接合子进行划线。培养2天后,将生长良好的菌落接种到不含抗生素的液体TY培养基(10ml)中,这些培养基30℃下振荡培养。培养过夜后,将每一培养基的100μl转移到10mlTY培养基中,并培养。此步骤重复两次,此外30℃下将所述培养液铺板在TSS-葡糖酸平板上。
约1周后,所有平板复制铺板到红霉素(5μg/ml)TSS-葡糖酸以及LBPSG并培养。接下的一天在同样的平板类型上对推定的Em-敏感性菌株进行再划线。
如先前对木糖区整合所述,进行Southern印迹分析和摇瓶评价以证实α-淀粉酶表达盒的gnt区中的整合位点,以及此四拷贝菌株的产量提高。
实施例3
地衣芽孢杆菌SJ4671(WO99/41358)在其如上图包含两个稳定整合的amyL基因拷贝,其以相反的相对方向插入在地衣芽孢杆菌α-淀粉酶基因,amyL的区。以下的实施例记述了通过选择性,定向整合到地衣芽孢杆菌染色体的另一区,将第三amyL基因拷贝插入到此菌株。
D-丙氨酸消旋酶缺失/整合概述
地衣芽孢杆菌D-丙氨酸消旋酶区DNA序列在本文中测定并被表示为SEQ ID 12的1303到2469位。通过克隆地衣芽孢杆菌D-丙氨酸消旋酶区的一个2281bp PCR扩增片段在温度敏感亲本质粒上构建称为″Dal缺失质粒″的质粒。所述PCR2281bp片段以″A″表示,其中A包含从dal基因的ATG起始密码子上游245个碱基对到dal基因的下游的867个碱基对的序列。
使克隆的片段A上的dal基因的C-末端部分的586个碱基对缺失,这会得到包含如下的片段“B”和“C”的质粒。将侧接解离酶(res)位点的壮观霉素抗性基因引入到所述质粒的片段“B”和“C”之间。以后可通过解离酶介导的位点特异性重组(site-specific recombination)将所述壮观霉素抗性基因除去。
D-丙氨酸消旋酶的缺失通过经片段″B″和″C″的双重同源重组从Dal-缺失质粒转移到芽孢杆菌属目标菌株染色体,这由温度敏感的Dal-缺失质粒的整合和剪切所介导。所得菌株称为″Dal-缺失菌株″。此菌株在没有D-丙氨酸的培养基中不能生长。
构建整合质粒使基因插入到所述缺失菌株的D-丙氨酸区。我们意图PCR扩增称为“D”的片段,其包含从ATG起始密码子的下游41个碱基对开始的dal基因的1117个碱基对。所述启动子区被大肠杆菌rrnB核糖体RNA操纵子(EMBL/e09023:碱基对197-295)的3’末端序列的T1和T2终止子所取代。
所述整合质粒在温度敏感载体上包含片段D和C。要整合的表达盒克隆在片段D和C间。一旦转移到所述地衣芽孢杆菌缺失菌株,温度敏感载体整合和剪切后,可分离得到在不含D-丙氨酸的培养基中可以生长的所述菌株。这样的″整合菌株″通过片段″B″和″C″的双重同源重组已经恢复了染色体dal基因。在此过程中所述表达盒被整合到所述染色体中。
质粒构建体
采用amersham pharmacia biotech的Ready-To-Go PCR Beads按照生产商指导,在退火温度55℃下进行PCR扩增。
质粒pJA744:
自地衣芽孢杆菌SJ4671染色体DNA的A片段进行扩增,采用引物为:
#148779;[dal区中SphI位点的上游](SEQ ID  14):
5′-GATGAACTTCTGATGGTTGC
#148780:[BamHI<dal](SEQ ID 15):
5′-AAAGGATCCCCCTGACTACATCTGGC
所述PCR片段用SphI和BamHI消化并纯化,然后与SphI和BamHI消化的pPL243连接。用连接混合物转化枯草芽孢杆菌JA691(repF+,dal-)感受态细胞,然后进行卡那霉素抗性选择(10μg/ml)。正确的菌落能补充JA691dal表型。
质粒pJA770:
该质粒包含插入到B和C片段之间的res-spc-res盒。它是通过将pSJ3358的1.5 kb BclI-BamHI与pJA744的BclI BclI位点相连而构建的。用连接混合物转化枯草芽孢杆菌JA691(repF+,dal-)感受态细胞,然后进行卡那霉素抗性(10μg/ml),和壮观霉素抗性(120μg/ml)选择。通过BclI和BamHI剪切可以定位壮观霉素抗性基因。
Dal缺失质粒
质粒pJA851:
从pSJ2739质粒DNA us PCR扩增片段(包含ermC基因和pE194复制起点),所用引物:
#170046[NotI;<ermC基因和pE194复制起点>](SEQ ID 16)
5′-AAAGCGGCCGCGAGACTGTGACGGATGAATTGAAAAAGC
#170047[EcoRI;←ermC基因和pE194复制起点→](SEQ ID 17):
5′-AAAGAATTCGTGAAATCAGCTGGACTAAAAGG
所述PCR片段用EcoRI和NotI消化并纯化,然后与EcoRI和NotI消化的pJA770连接。用连接混合物转化枯草芽孢杆菌JA691感受态细胞,然后进行壮观霉素抗性(120μg/ml),红霉素抗性(5μg/ml)选择。
质粒PJA748:
从地衣芽孢杆菌SJ4671 DNAPCR扩增片段(包含没有启动子区的dal基因),所用引物:
#150506[BamHI;<dal gene](SEQ ID 18)
5′-AAAGGATCCCGCAAGCAAAGTTGTTTTTCCGC
#150507[KpnI;<-dal gene](SEQ ID 19):
5′-AAAGGTACCGAAAGACATGGGCCGAAATCG
所述PCR片段用KpnI和BamHI消化然后纯化,然后与KpnI和BamHI消化的pPL2438连接。用连接混合物转化枯草芽孢杆菌JA691感受态细胞,然后进行卡那霉素抗性(10μg/ml)选择。
质粒pJA762:
从大肠杆菌SJ2 DNA扩增片段(包含大肠杆菌rrnB末端序列EMBL[e09023]从碱基对197到295位的T1和T2终止子),所用引物:
#158089[KpnI;<rrnB的T1和T2终止子](SEQ ID 20)
5′-AAAGGTACCGGTAATGACTCTCTAGCTTGAGG
#158090[ClaI;<rrnB的T1和T2终止子](SEQ ID 21):
5′-CAAATCGATCATCACCGAAACGCGGCAGGCAGC
PCR片段用KpnI和ClaI消化并纯化,然后与KpnI和ClaI消化的pJA748连接。用连接混合物转化枯草芽孢杆菌JA691感受态细胞,然后进行卡那霉素抗性(10μg/ml)选择。
质粒pJA767:
从地衣芽孢杆菌SJ4671(WO99/41358)DNA PCR扩增片段(包含dal(DFS)的0.7kbp DNA序列下游),所用引物:
#150508[HindIII;<DFS](SEQ ID 22)
5’-ATTAAGCTTGATATGATTATGAATGGAATGG
#150509[NheI;<DFS](SEQ ID 23):
5′-AAAGCTAGCATCCCCCTGACTACATCTGGC
用HindIII和NheI消化所述PCR片段并纯化,然后与KpnI和ClaI消化的pJA762连接。用连接混合物转化枯草芽孢杆菌JA691感受态细胞,然后进行卡那霉素抗性(10μg/ml)选择。
质粒pJA776
该质粒包含侧接所述D和C片段的amyL盒。它是通过将pSJ4457的2.8kb HindIII-NheI片段与pJA767的4.2kb BamHI-HindIII片段连接而构建的,将连接混合物转化到枯草芽孢杆菌JA691感受态细胞,然后进行卡那霉素抗性(10μg/ml)选择。
Dal整合质粒
质粒pJA1020:
该质粒包含侧接所述D和C片段的amyL盒。该质粒还包含质粒pE194复制起点,repF和Emr-基因。它是通过将pJA776的2.7kb EcoRI-NheI片段与3.8kbpJA851的EcoRI-NheI片段连接而构建的,将连接混合物转化到枯草芽孢杆菌JA691感受态细胞,然后进行红霉素抗性(10μg/ml)选择。
染色体dal缺失的构建
将所述缺失质粒pJA851转化到枯草芽孢杆菌接合供体菌株PP289-5感受态细胞(其包含染色体dal-缺失,和质粒pBC16和pLS20),并且转化体在30℃下,于含D-丙氨酸平板上进行壮观霉素抗性(120μg/ml),红霉素抗性(5μg/ml)和四环素抗性(5μg/ml)选择。保留转化体为JA954并用在随后的接合实验中作为供体。
两拷贝amyL地衣芽孢杆菌SJ4671(WO99/41358)在随后的接合实验中用作受体。
供体菌株JA954在补充了D-丙氨酸(100g/ml),壮观霉素(120μg/ml),红霉素(5μg/ml)和四环素(5μg/m1)的LBPSG平板(LB平板中含有磷酸盐(0.01MK3PO4),葡萄糖(0.4%),和淀粉(0.5%))上,30℃下生长过夜。所述受体菌株SJ4671在LBPSG平板生长过夜。
各约一环(loop)量接种针的供体和受体在含有D-丙氨酸(100g/ml)的LBPSG平板表面混合,并在30℃下培养5小时。然后该平板复制铺板到含有壮观霉素(120μg/ml)和红霉素(5μg/ml)的LBPSG平板上,在30℃下培养2天。这四种接合得到13-25种转接合子。
50℃下在含有壮观霉素(120μg/ml)和红霉素(5μg/ml)的LBPSG平板上重新分离四环素敏感型(暗标缺少PBC)转接合子并培养过夜。50℃平板的单个菌落接种到含有D-丙氨酸(100μg/ml)的10mlTY液体培养基中,并在26℃下振荡培养3天,其后将等分试样转移到新鲜的10mlTY培养基中,30℃下继续培养过夜。将所述培养液铺板到含有壮观霉素(120μg/ml)和D-丙氨酸(100μg/ml)的LBPSG平板上,30℃下培养过夜后,将这些平板复制铺板到分别含有或不含有D-丙氨酸(100μg/ml),壮观霉素和红霉素的LBPSG平板上。
从全部菌株组合物中得到D-丙氨酸自养型,红霉素敏感型,和壮观霉素抗性分离株。保留如下的菌株,其中染色体dal启动子和dal编码序列的前672个碱基对被res-spc-res盒所取代:
地衣芽孢杆菌JA967:SJ4671受体,JA954供体.
在补充或未补充D-丙氨酸(100μg/ml)的含120μg壮观霉素的LBPG上分析菌株表型。
地衣芽孢杆菌SJ4671在含有或不含D-丙氨酸的平板上都生长良好。所述dal缺失菌株JA967在LBPGD-丙氨酸平板上生长良好,而在没有D-丙氨酸的LBPG上却不这样。这些菌株在未加D-丙氨酸的培养基中不能生长。
地衣芽孢杆菌dal-区序列(SEQ ID 12):
自地衣芽孢杆菌ATCC14580染色体DNA PCR扩增dal-区(包含ydcC基因,终止子,dal基因和dal(DFS)序列下游,所用引物:
#145507[<ydcC-dal-DFS>](SEQ ID 24):
5′-GCGTACCGTTAAAGTCGAACAGCG
#150509 [NheI;<ydcC-dal-DFS>](SEQ ID 25):
5′-AAAGCTAGCATCCCCCTGACTACATCTGGC
对以SEQ ID 12的位点1303-2469表示的地衣芽孢杆菌D-丙氨酸编码序列的测序,以及随后对公共数据库的同源检索表明新分离的dal基因与枯草芽孢杆菌的dal基因只有约67%的序列同一性,没有其它D-丙氨酸消旋酶编码基因表现出相对此新的地衣芽孢杆菌dal基因的更高的同源性。
接合供体菌株,转移到地衣芽孢杆菌,和染色体整合
所述具有表达盒的整合质粒pJA1020被转化到枯草芽孢杆菌接合供体菌株PP289-5的感受态细胞(其包含染色体dal-缺失,和质粒pBC16和pLS20),在含有D-丙氨酸(100ug/ml)的平板上,在30℃下进行红霉素(5μg/ml)和四环素(5μg/ml)抗性选择。
保存含有带表达盒的整合质粒的转化体,并用作与两拷贝菌株JA967的dal缺失受体接合的供体。
在含有红霉素(5μg/ml)的LBPGA平板上选择转接合子,每一接合的一或二种四环素敏感型转接合子在50下培养的LBPG平板上划线。培养2天后,生长良好的菌株接种到不含抗生素的液体TY培养基(10ml)中,将这些培养基30℃下振荡培养。培养过夜后,每一培养液的100μl转移到新的10mlTY培养基中,并培养。此步骤重复两次,此外30℃下所述培养液铺板到LBPG平板上。
所有平板复制铺板到LBPGS,含壮观霉素(120μg/ml)的LBPGS,含红霉素(5μg/ml)LBPGS上,并培养。接下来的一天,推断壮观霉素敏感型和红霉素敏感型菌株在同样类型的平板上重新划线。
如先前对木糖区整合所述,进行Southem印迹分析和摇瓶评价以证实α-淀粉酶表达盒的dal区中的整合位点,以及此三拷贝菌株的产量的提高。
实施例4
本文中,我们进行了对枯草芽孢杆菌基因组和地衣芽孢杆菌染色体特定区(SEQ ID No:26)的研究,我们发现所述地衣芽孢杆菌区包含基因glpP,glpF,glpK和glpD。所述分析区大小为5761核苷酸,并且所述DNA序列表示为SEQ ID No:26。
glpP编码区在SEQ ID No:26中从位点261延伸到位点818。采用blastprogram对EMBL和Swiss-prot数据库的检索揭示最近的同源性是枯草芽孢杆菌glpP基因(在DNA水平)和枯草芽孢杆菌GlpP蛋白(在蛋白质水平)。在DNA水平上,对枯草芽孢杆菌glpP编码区的同一性是72.4%,采用GCG程序包GAP程序(Wisconsin Package Version 10.0,Genetics Computer Group(GCG),Madison,Wisc.)进行的对比。推导出GlpP蛋白与枯草芽孢杆菌GlpP蛋白的同一性是78.9%。
所述glpF编码区从SEQ ID No:26的1048位延伸到1863位。采用blast算法对EMBL和Swiss-prot数据库的检索揭示最近的同源性是枯草芽孢杆菌glpF基因(在DNA水平)和枯草芽孢杆菌GlpF蛋白(在蛋白质水平)。在DNA水平,所述对枯草芽孢杆菌glpF编码区的同一性是72.8%。推导的GlpF蛋白对枯草芽孢杆菌GlpF蛋白的同一性是79.3%。
SEQ ID No:26中glpK编码区从1905位延伸到3395位。采用blastprogram对EMBL和Swiss-prot数据库的检索揭示最近的同源性是枯草芽孢杆菌glpK基因(在DNA水平)和枯草芽孢杆菌GlpK蛋白(在蛋白质水平)。在DNA水平,对枯草芽孢杆菌glpK编码区的所述同一性是75.6%。推导的GlpK蛋白对枯草芽孢杆菌GlpK蛋白的同一性是85.9%。
SEQ ID No:26中glpD编码区从3542位延伸到5209位。采用blastprogram对EMBL和Swiss-prot数据库的检索揭示最近的同源性是枯草芽孢杆菌glpD基因(在DNA水平)和枯草芽孢杆菌GlpD蛋白(在蛋白质水平)。在DNA水平,对枯草芽孢杆菌glpD编码区的所述同一性是72.9%。推导的GlpD蛋白对枯草芽孢杆菌GlpD蛋白的同一性是81.9%。
此外地衣芽孢杆菌区包含yhxB基因的一部分,以编码区5394位起始并延伸超过SEQ ID NO:26所示测序片段的末端。
利用glpD基因定向染色体整合(directed chromosomal integration)
与上述实施例策略相似,自地衣芽孢杆菌染色体DNA PCR扩增glpD基因和下游区部分,并组合提供载体,其可在第一步中,用于glpD基因的3’末端缺失,在第二步中,用于glpD基因的恢复以及目的基因表达盒同时插入到所述染色体中。
按照本文中其它部分所述的标准PCR方法,采用如下的两引物PCR扩增称为‘glpD’的glpD基因内部片段:
(SEQ ID No:27)
5′-GACTGAATTCGCAATTTGAAGTGAAAATGGTAGC,
和(SEQ ID No:28)
5-GACTGGATCCAGATCTCATCTTTTCGGGAAATC。
纯化所得的片段,并用EcoRI和BamHI消化,与EcoRI和BamHI消化的pUC19连接,转化所述连接混合物到大肠杆菌SJ2进行氨苄青霉素抗性(200μg/ml)选择。保留具有正确序列的的克隆并称为SJ5767(SJ2/pSJ5767)。
采用如下的引物扩增DNA片段,所述片段来自glpD基因3’末端下游地衣芽孢杆菌染色体的55到555个碱基对:
(SEQ ID No:29)5′ -
GACTGAATTCAGATCTGCGGCCGCACGCGTAGTACTCCC
GGCGTGAGGCTGTCTTG
和(SEQ ID No:30)
5′-GACTAAGCTTCAGTTACGCTCAAACACGTACG。
纯化所得片段并用EcoRI和HindIII消化,并与EcoRI和HindIII消化的pUC19连接,连接混合物转化到大肠杆菌SJ2进行氨苄青霉素(200μg/ml)抗性选择。具有正确序列的克隆保留为SJ5789(SJ2/pSJ5789)。
然后通过剪切pSJ3358的1.5kb BclI-BamHI片段并将其插入到已用BglII消化的pSJ5767中,将glpD基因内部片段(internal fragment)与壮观霉素抗性基因结合,其侧接解离酶位点。将所述连接混合物转化到大肠杆菌SJ2进行氨苄青霉素(200μg/ml)和壮观霉素(120μg/ml)抗性选择。保留具有正确序列的克隆为SJ5779(SJ2/pSJ5779)。
为构建地衣芽孢杆菌染色体中glpD的3′-末端缺失的最终质粒(finalplasmid),用HindIII和BglII消化pSJ5789,将所述0.5kb片段与pSJ2739的5.5kb HindIII-BglII片段连接。将连接混合物转化到枯草芽孢杆菌DN1885,30℃下进行红霉素(5(μg/ml)抗性选择。所得质粒用EcoRI和BglII消化,所述4.8kb片段与剪切自pSJ5779的2.4kb EcoRI-BamHI片段连接,然后所得连接混合物转化到枯草芽孢杆菌DN1885,30℃下进行红霉素(5μg/ml),壮观霉素(120μg/ml)抗性选择。
如前述实施例所述,通过利用枯草芽孢杆菌接合供体菌株PP289-5将所述缺失质粒转化到地衣芽孢杆菌,将缺失质粒转化到地衣芽孢杆菌,采用如前述实施例所述必要的同样方法将所述缺失转移到染色体。
在以甘油为唯一碳源的TSS极限培养基琼脂平板上进行对所得glpD缺失菌株的生长测试。
设计所述整合质粒使之能通过同源重组修复染色体glpD基因,并携带包含glpD基因完整的3′-末端。通过设计保持GlpD蛋白的氨基酸序列的定点突变除去在glpD基因内的BglII位点是有用的。此突变由PCR引入,如下所述。
采用引物SEQ ID No.27和SEQ ID No.28扩增glpD基因的内部片段.
扩增glpD基因的3-末端,采用引物:
(SEQ ID No:31)
5′-CCGAGATTTCCCGAAAAGATGAAATTTGGACTTCTGAATCCGGACTG,
(SEQ ID No:32)
5′-GACTAAGCTTAGATCTGCTAGCATCGATTGATTATTAACGAAAATTCA
 CC
混合此两扩增的片段,所得混合物用作利用引物SEQ ID No:27和SEQID No:32的PCR扩增的模板。
所得片段用EcoRI和HindIII消化,与EcoRI和HindIII消化的pUC19连接,所述连接混合物转化到大肠杆菌SJ2进行氨苄青霉素抗性(200μg/ml)选择。具有正确序列的菌落得到证实,命名为SJ5775(SJ2/pSJ5775)。
为构建最终整合载体质粒,用HindIII和BglII消化pSJ5789,所述0.5kb片段与pSJ2739的5.5kb HindIII-BglII片段连接。所述连接混合物转化到枯草芽孢杆菌DN1885,30℃下进行红霉素(5μg/ml)抗性选择。所得质粒用EcoRI和BglII消化,与剪切自pSJ5775的1.5kb BglII-EcoRI片段连接,所得连接混合物转化到枯草芽孢杆菌DN1885,30℃下进行红霉素(5μg/ml)抗性选择。
此整合载体质粒具有几个紧接glpD基因3′-末端的限制酶切位点,所述基因中已插入了表达盒。
如前述实施例所述,利用枯草芽孢杆菌接合供体菌株PP289-5将所得整合质粒转移到地衣芽孢杆菌glpD缺失菌株。
整合质粒已经glpD序列整合到染色体的细胞,50℃下在甘油极限培养基平板根据它们的生长能力分离。这样的细胞用作菌株分离的起点(starting point),其通过第二次重组失去了整合质粒,但在染色体上保留了glpD基因的修复译本以及表达盒。
得到这样的菌株的方法与前述实施例中,用于分离在染色体的木糖异构酶区整合有表达盒的菌株所述相当。
glpFK基因用于定向染色体整合.
与前述实施例策略相同,自地衣芽孢杆菌染色体DNA通过PCR扩增部分glpF基因和glpP区上游,并组合提供载体,其可在第一步中,缺失启动子和所述glpF基因的5’-末端,并在第二步中恢复启动子和glpF基因,以及表达盒同时插入到染色体,glpF启动子上游。预计glpF启动子的缺失会消除glpF基因和下游glpK基因的表达。如前所述进行PCR扩增。
扩增包含glpP基因的DNA片段,所用引物:
(SEQ ID No:33)5′-GACTAAGCTTGTGAAGGAGATGGAACATGAG,和
(SEQ ID No:34)
5′-GACTGGATCCAGATCTGCGGCCGCACGCGTCGACAGTACTATTT
TTAGTTCCAGTATTTTTTCC。
纯化所得片段,并用HindIII和BamHI消化,与HindIII和BamHI消化的pUC19连接,并将连接混合物转化到大肠杆菌SJ2进行氨苄青霉素抗性(200μg/ml)选择。保留正确的菌落为SJ5753(SJ2/pSJ5753)。
扩增包含大部分glpF基因但缺少编码序列前160个碱基对的DNA片段,所用引物为:
(SEQ ID No:35)5′-GAGCTCTAGATCTTCGGCGGCATCAGCGGAGC,
(SEQ ID No:36)5′-GACTGAATTCCTTTTGCGCAATATGGAC。
所得片段用XbaI和EcoRI消化,与XbaI和EcoRI消化的pUC19连接,所述连接混合物转化到大肠杆菌SJ2,进行氨苄青霉素抗性(200μg/ml)选择。保留正确的菌落为SJ5765(SJ2/pSJ5765)。
为构建用于glpF基因启动子和5′-末端缺失的质粒,自pSJ5753剪切作为HindIII-BglII片段的含glpP的片段,所述gpF片段作为BglII-EcoRI片段剪切自pSJ5765,并且这些片段与pSJ2739的HindIII-EcoRI片段连接。所述连接混合物转化到枯草芽孢杆菌DN1885,30℃下进行红霉素(5μg/ml)抗性选择。
所得质粒用BglII消化并与pSJ3358的1.5kbBclI-BamHI片段连接,其包含侧接解离酶识别位点的壮观霉素抗性基因。将所述连接混合物转化到枯草芽孢杆菌DN1885,在30℃下进行红霉素(5μg/ml),壮观霉素(120μg/ml)抗性选择。
如前面的实施例所述,利用枯草芽孢杆菌接合供体菌株PP289-5将如此构建的所述缺失质粒转移到地衣芽孢杆菌,通过前面实施例所述的必要的同样方法将所述缺失转移到染色体。
在以甘油为唯一碳源的TSS极限培养基琼脂平板上进行对所得glpF缺失菌株的生长测试。
设计整合质粒使之可以通过同源重组修复glpFK基因区,并携带glpF启动子和完整的glpF基因。此片段扩增自染色体地衣芽孢杆菌DNA,采用引物为:
(SEQ ID No:36)
和(SEQ ID No:37)
5′-GAGCTCTAGATCTGCTAGCATCGATCCGCGGTTAAAATGTGAAAAATT
ATTGACAACG。
所得片段用XbaI和EcoRI消化,与XbaI和EcoRI消化的pUC19连接,所述连接混合物转化到大肠杆菌SJ2进行氨苄青霉素(200μg/ml)抗性选择。随后自此质粒剪切作为BglII-EcoRI片段的扩增片段,所述扩增片段与包含作为HindIII-BglII片段剪切自pSJ5753片段glpP的连接。所述连接混合物转化到枯草芽孢杆菌DN1885,30℃下进行红霉素(5μg/ml)抗性选择。目的表达盒随后插入到位于glpP基因末端和glpF启动子之间的接头区。
如前面实施例所述,利用枯草芽孢杆菌接合供体菌株PP289-5将所得整合质粒转移到地衣芽孢杆菌glpF缺失菌株。
根据50℃下在甘油基本培养基平板上的生长能力分离通过glpF序列已将整合质粒整合到其染色体的菌落。这样的菌落用作分离菌株的起始点,其通过第二重组已丢失了所述整合质粒,但还保留了glpF基因的修复译本以及表达盒。
得到这样的菌株的方法与前述实施例中,用于分离在染色体的木糖异构酶区整合有表达盒的菌株所述相当。
glpD和glpFK连续用于染色体整合
该方法设想了利用作为起始菌株的具有glpD基因缺失和glpF基因缺失的菌株,以及利用不能表达glpK基因产物的,在补充了甘油-3-磷酸的基本培养基中生长的菌株的能力,而glpD缺陷菌株在此底物上不能生长。
然后该方法首次引入了整合质粒设计修复所述glpD基因,以及利用在含甘油-3-磷酸的基本培养基中生长选择正确的整合。此将表达盒拷贝插入到邻近glpD基因。
在第二步中,利用设计修复glpF基因的整合载体将表达盒的另一拷贝插入到glpP和glpF基因之间,利用含甘油的基本培养基中的生长选择正确的整合。
如果两个表达盒相同(或高度同源,或含同源区),有利的是将这些表达盒插入到载体质粒,插入的方向为使得它们在最终的菌株中以相对相反的方向整合,这样可以防止经过同源重组丢失它们,所述重组条件为对在甘油上生长没有选择。
实施例5
在此工作中,我们进行了对枯草芽孢杆菌基因组和地衣芽孢杆菌染色体第二特定区(SEQ ID No:38)的同源研究,我们发现所述区包含地衣芽孢杆菌abnA基因的3′-末端,以及araA基因5′-末端。所述分析区的大小为1500个核苷酸,所述DNA序列表示为SEQ ID No:38。
SEQ ID No:38中abnA编码区3′-末端从位点1延伸到位点592。采用blast程序对EMBL和Swiss-prot数据库的检索揭示最近的同源是枯草芽孢杆菌abnA基因(在DNA水平上)和AbnA蛋白(在蛋白质水平上)。在DNA水平上与相应的枯草芽孢杆菌abnA编码区的同一性为68.9%。推导的AbnA蛋白片段对相应的枯草芽孢杆菌AbnA蛋白片段的同一性是75.8%。
SEQ ID No:38中araA编码区的5′-末端从位点859延伸到1500。采用blast程序对EMBL和Swiss-prot数据库的检索揭示最近的同源是枯草芽孢杆菌araA基因(在DNA水平上)和AraA蛋白(在蛋白质水平上)。在DNA水平上与相应的枯草芽孢杆菌araA编码区的同一性为68.2%。推导的AbnA蛋白片段对相应的枯草芽孢杆菌AraA蛋白片段的同一性是62.6%。最高的同一性,在与嗜热脂肪芽孢杆菌AraA蛋白片段的对比中测定,为68.4%。
利用araA基因用于定向染色体整合
与前述实施例策略相同,自地衣芽孢杆菌染色体DNA通过PCR扩增部分araA基因和abnA区上游,并组合提供载体,其可在第一步中,缺失启动子和所述araA基因的5’-末端,并在第二步中恢复启动子和araA基因,以及表达盒同时插入到染色体,araA启动子上游。如前所述进行PCR扩增。
扩增araA的araA基因上游的DNA片段,所用引物:
(SEQ ID No:39)5′-GACTAAGCTTCATCCGGCGATCAGTTTAATGC,和
(SEQ ID No:40)
5′-GACTGAATTCAGATCTGCGGCCGCACGCGTCGACAGTACTATTTTTTT
TTGACAGATTTCAGAAC。
用HindIII和EcoRI消化所得片段,将其与HindIII和EcoRI消化的pUC19连接,所述连接混合物转化到大肠杆菌SJ2进行氨苄青霉素抗性(200μg/ml)选择SJ5751(SJ2/pSJ5751)。
扩增包含araA基因内部部分的片段,所用引物为:
(SEQ ID No:41)
5′-GACTGGATCCAGATCTAGTCGAGTACAAAGCGGTGGC,和
(SEQ ID No:42)
5′-GACTGAATTCGACCAGCCAAGCTGAATCTGC.
用BamHI和EcoRI消化所得片段,与BamHI和EcoRI消化的pUC19连接,所述连接混合物转化到大肠杆菌SJ2进行氨苄青霉素抗性(200μg/ml)选择,保留正确的转化体为SJ5752(SJ2/pSJ5760)。
自pSJ5751剪切作为HindIII-BglII片段的abnA基因片段,连接到pSJ2739的5.5kb HindIII-BglII片段,所述所述连接混合物转化到枯草芽孢杆菌DN1885,30℃下进行红霉素(5μg/ml)抗性选择,保留正确的转化体为SJ5756(DN1885/pSJ5756)。
用BglII消化质粒pSJ5760,插入包含侧接解离酶识别位点的壮观霉素抗性基因的pSJ3358的1.5kb BamHI-BclI片段。保留克隆为SJ5777(SJ2/pSJ5777)。
通过自pSJ5777剪切作为EcoRI-BamHI片段的araA-res-spc-res片段,以及将其与pSJ5756的EcoRI-BglII片段连接而构建最终的缺失质粒。所述连接混合物转化到枯草芽孢杆菌DN1885,30℃下进行红霉素(5μg/ml),壮观霉素(120μg/ml)抗性选择,保留正确的转化体为SJ5803(SJ2/pSJ5803)。
如前面的实施例所述,利用枯草芽孢杆菌接合供体菌株PP289-5将所述缺失质粒pSJ5803转移到地衣芽孢杆菌,利用必要的如前面实施例所述的同样方法将所述缺失转移到染色体中。
得到araA缺失菌株在以阿拉伯糖为唯一碳源的TSS基本培养基琼脂平板上检验其生长。
设计整合载体质粒使之能通过同源重组修复araA基因区,除了pSJ5756的abnA基因片段外,其携带有araA启动子和araA基因5′-末端。所述araA启动子片段扩增自染色体地衣芽孢杆菌DNA,所用引物基因给定为SEQ IDNo:26的序列合成得到。构建所述质粒,这样目的基因的表达盒能插入到abnA基因下游,而不是araA启动子的上游。
如前面的实施例所述,利用枯草芽孢杆菌接合供体菌株PP289-5,将所得整合质粒转移到地衣芽孢杆菌araA缺失菌株。根据50℃下在阿拉伯糖基本培养基平板上的生长能力分离通过araA序列已将整合质粒整合到其染色体的菌落。这样的菌落用作分离菌株的起始点,其通过第二重组已丢失了所述整合质粒,但还保留了araA基因的修复译本以及表达盒。
得到这样的菌株的方法与前述实施例中,用于分离在染色体的木糖异构酶区整合有表达盒的菌株所述相当。
实施例6
在此工作中,我们对枯草芽孢杆菌基因组和地衣芽孢杆菌染色体第三特定区(SEQ ID No:42)进行了研究,结果发现地衣芽孢杆菌区包含ispA基因的3′-末端和metC基因。分析所述区的大小为4078个核苷酸,所述DNA序列表示为SEQ ID No:42。
SEQ ID No:42中ispA编码区的3′-末端从1位延伸到647位。采用此特定序列对EMBL和Swiss-prot数据库的检索揭示最近的同源物(在DNA水平)为枯草芽孢杆菌ispA基因和(在蛋白质水平)枯草芽孢杆菌IspA蛋白。在采用Vector NTI6.0程序包(Informax″,Inc.)中的AlignX程序进行构建的对比中,在DNA水平的针对相应的枯草芽孢杆菌ispA编码区同一性是72.6%。推导的IspA蛋白对相应的枯草芽孢杆菌IspA蛋白片段的同一性是82.3%。
所述metC编码区从SEQ ID No:42中的1121位延伸到3406位。采用此特定序列对EMBL和Swiss-prot数据库的检索揭示最近的同源物(在DNA水平)为枯草芽孢杆菌metC基因和(在蛋白质水平)枯草芽孢杆菌metC蛋白。在DNA水平的针对相应的枯草芽孢杆菌ispA编码区同一性是72.6%。推导的MetC蛋白对相应的枯草芽孢杆菌MetC蛋白的同一性是84.6%。
metC基因用于定向染色体整合
自地衣芽孢杆菌染色体DNA,PCR扩增metC基因部分和所述下游区,并组合提供可用于metC基因3′-末端缺失的载体。
扩增得自地衣芽孢杆菌染色体,metC基因3′-末端下游4到671个碱基对的DNA片段,所用引物为:
(SEQ ID No:44)
5′-AAAAAACCCGAGTTTCACAAAAAATCCACTACAAACGCCGCC,和
(SEQ ID No:45)
5′-TTTTTTTTAAGCTTATGCCGCATGTTCCTTGCTGTTTTCAC.
所得片段用AvaI和HindIII消化,与AvaI和HindIII消化的pMOL1887连接,所述连接混合物转化到枯草芽孢杆菌PL1801,30℃下进行红霉素(5μg/ml)和卡那霉素(10μg/ml)抗性选择。保留一个菌落为CL057(PL1801/pCLO57)。
扩增得自地衣芽孢杆菌染色体metC基因内部片段,进入到metC开放式读码框的247到754个碱基对,采用引物为:
(SEQ ID No:46)
5’-AAAAAAATCGATTCAGGGATATAAACGATCCG,和
(SEQ ID No:47)
5′-TTTTTTTTTTCCATCGCACTGGGATATCAGCTCTTCATAAGCATC
所得片段用ClaI和BstXI消化,与ClaI和BstXI消化的pCLO57连接,所得连接混合物转化到枯草芽孢杆菌PL1801,30℃下进行红霉素(5μg/ml)和卡那霉素(10μg/ml)抗性选择。保留一个菌落为CL058(PL1801/pCLO58)。
所得缺失质粒pCLO58具有一盒,其由内部metC片段组成,所述片段之后是侧接解离酶位点的卡那霉素抗性基因,其最终后接metC基因下游的DNA片段。所述缺失质粒pCL058转移到接合供体菌株PP1060-1,其是PP289-5的isogen,这前面已有记述,除了所述编码绿荧光蛋白(GFP)基因已被整合到染色体上。30℃下对所得菌株CL071(PP10601/pCL058)进行红霉素抗性选择。供体菌株CL071与地衣芽孢杆菌受体SJ3047交配(mate),30下进行红霉素抗性选择接合体和dal+表现型。
接合体CLO74在卡那霉素(20μg/ml)上划线,选择具有质粒整合到染色体的细胞。将所得菌株CLO78铺板到SMS-葡萄糖基本平板揭示所述质粒已经整合到metC基因的内部部分,产生对甲硫氨酸的需要。CLO78用作菌株分离的起点,其通过第二重组已经丢失了整合质粒,但保留了metC基因的缺失译本。
这样的菌株,命名为CLO80适当地用作携带盒质粒的受体,必须如前面实施例所述,在选择完整的metC基因条件下,其能被定向整合到metC基因座。
实施例7
在此工作中,我们对枯草芽孢杆菌基因组和地衣芽孢杆菌染色体的第四特定区(SEQ ID No:48)作了同源性研究,我们发现所述地衣芽孢杆菌区包含spoVAF基因和lys4基因的3′-末端。此分析区的大小是3952个核苷酸,所述DNA序列表示为SEQ ID No:48。
SEQ ID No:42中spoVAF编码区的3′-末端从1位延伸到310位。在DNA水平,与枯草芽孢杆菌spoVAF编码区的同一性是62.7%。推导的SpoVAF蛋白对枯草芽孢杆菌SpoVAF蛋白的同一性是55.2%。
SEQ ID No:48中lysA编码区从1048位延伸到2367位。采用此特定序列的对EMBL和Swiss-prot数据库的BLAST检索揭示最近的同源性是枯草芽孢杆菌lysA基因(在DNA水平)和枯草芽孢杆菌LysA蛋白(在蛋白质水平)。在DNA水平,对枯草芽孢杆菌lysA编码区的同一性是73.0%,推导的LysA蛋白对枯草芽孢杆菌LysA蛋白的同一性是82.2%。
lysA基因用于定向染色体整合
与前述实施例方法相同,自地衣芽孢杆菌染色体DNA PCR扩增得到lysA基因部分,并且结合以提供载体,其可在第一步中用于lysA基因部分缺失,赋予细胞对赖氨酸的自养性,并且在第二步中,恢复lysA基因,并且使目的基因的表达盒同时插入到染色体中。基于前述实施例的策略,本领域一般技术人员可以确定必需的引物以及选择进行此方法的条件。
普通物质和方法
在体外DNA工作中,采用标准分子生物学方法进行细菌菌株等的转化(Maniatis,T.,Fritsch,E.F.,Sambrook,J.″Molecular Cloning.A laboratorymanual″. Cold  Spring Harbor Laboratories,1982;Ausubel,F.  M.等(eds.)″Current Protocols in Molecular Biology″.John Wiley 和 Sons,1995;Harwood,C.R.,和Cutting,S.M.(eds.)″Molecular Biological Methods forBacillus″.John Wiley和Sons,1990)。
除非另有指出,一般按照提供者的说明书使用用于DNA操作的酶。所用培养基(TY,BPX和LB琼脂)记述在EP0506780中。
如提供者记述,采用Pharmacia & Upjohn的Phadebasr淀粉酶实验进行淀粉酶的活性测定。
侧接位点特异性(通过自质粒PAM betal解离酶识别res位点)重组酶识别位点以利于缺失的抗性基因,如壮观霉素抗性或卡那霉素抗性,其在US专利5,882,888已有记述。在同一专利中还记述了质粒pSJ3358,和菌株枯草芽孢杆菌PP289-5。
pUC19记述在Yanisch-Perron,C.,Vieira,J.,Messing,J.(1985)ImprovedM13 phage cloning vectors and host strains:nucleotide sequences of theM13mp18 and pUC19 vectors.Gene 33,103-119.
pE194记述在Horinouchi,S.,和Weisblum,B.(1982).Nucleotide sequenceand functional map of pE194,a plasmid that specifies inducible resistance tomacrolide,lincosamide,and streptogramin type B antibiotics.J.Bacteriol.,150,804-814.
质粒pSJ2739记述在US专利6,100,063.
质粒pMOL1642表示为SEQ ID No:49以及下表:
特征 碱基对  参考(Reference)
res-位点 5870..6061  EMBL:AF007787/4852..4951
Kan(R) 6241..162  EMBL:SA110KAR/1390..2151
res-位点 203..376  EMBL:AF007787/4852..4951
启动子PamyQ 378..396 EMBL:A00607/67..181
prsA′ 492..1008 地衣芽孢杆菌
Ery(R) 1133..1864(compl.) EMBL:SAE194/2857..2004
Pre 2276..3484 EMBL:SAE194/join(3150..3728,1..633
repF 4113..4709 EMBL:SAE194/1244..1594
oriT 4805..5368 EMBL:PP110CG/1021..1575
ups prsA 5375..5869 地衣芽孢杆菌
菌株大肠杆菌SJ2和枯草芽孢杆菌DN1885记述在Diderichsen,B.,Wedsted,U.,Hedegaard,L.,Jensen,B.R.,Sjholm,C.(1990).Cloning of aldB,which encodes acetolactate decarboxylase,an exoenzyme from Bacillus brevis.Journal of Bacteriology 172,4315-4321.
枯草芽孢杆菌PL1801具有apr和npr基因的枯草芽孢杆菌DN1885。
地衣芽孢杆菌PL1980是这样的菌株,对其加工通过将氯霉素抗性基因插入到碱性蛋白酶基因使其不能产生碱性蛋白酶。
枯草芽孢杆菌JA578是枯草芽孢杆菌168spo,具有repF表达盒(SEQID No:50)的amyE,其插入到染色体上dal基因(EMBL:BSDAL,Accession;#M16207)下游。所述表示为SEQ ID No:50的repF表达盒包含产麦芽糖(maltogenic)淀粉酶启动子PamyM(SEQ ID No:50的1-181位),其来自Bacillus Stearotermophilus(EMBL:BSAMYL02,Accession#;M36539),包含RBS的接头(SEQ ID No:50的182-211位),其与质粒pE194(EMBL:PPCG2,accession#;J01755)的repF基因(SEQ ID No:50的212-808位)融合,在SEQID No:50的212位具有RepF启动密码子,在809位具有终止密码子。
枯草芽孢杆菌JA691是枯草芽孢杆菌JA578dal-
序列表
<110>诺雏信公司(Novozymes A/S)
斯蒂恩.T.乔根森(J rgensen,steen Troels)
迈克尔.D.拉斯马森(Rasmussen,Michael Dolberg)
詹斯.T.安德森(Andersen,Jens T nne)
卡斯滕.安德森(Olsen,Carsten)
<120>用于基因的稳定的染色体多拷贝整合的方法
<130>10022.204-WO
<150>DK PA200000981
<151>2000-06-23
<150>US60/217,929
<151>2000-07-13
<160>50
<170>PatentIn version 3.1
<210>1
<211>30
<212>DNA
<213>人工序列:引物#183235
<400>1
gactaagctt ctgcatagtg agagaagacg                                     30
<210>2
<211>67
<212>DNA
<213>人工序列:引物#183234
<400>2
gactgaattc agatctgcgg ccgcacgcgt gtcgacagta ctgaaataga ggaaaaaata    60
agttttc                                                              67
<210>3
<211>33
<212>DNA
<213>人工序列:引物#183230
<400>3
gactgaattc cgtatccatt cctgcgatat gag                               33
<210>4
<211>41
<212>DNA
<213>人工序列:引物#183227
<400>4
gactggatcc agatct tatt acaaccctga tgaatttgtc g                     41
<210>5
<211>60
<212>DNA
<213>人工序列:引物#183229
<400>5
gactggatcc agatctgcta gcatcgatcc gcggctattt ceattgaaag cgattaattg  60
<210>6
<211>31
<212>DNA
<213>人工序列:引物#187338
<400>6
tatttcccga gattctgtta tcgactcgct c                                 31
<210>7
<211>27
<212>DNA
<213>人工序列:引物#187339
<400>7
gttttcggcc gctgtccgtt cgtcttt                                      27
<210>8
<211>27
<212>DNA
<213>人工序列:引物#184733
<400>8
gtgtgacgga taaggccgcc gtcattg                                    27
<210>9
<211>28
<212>DNA
<213>人工序列:引物#184788
<400>9
ctcttgtctc ggagcctgca ttttgggg                                   28
<210>10
<211>26
<212>DNA
<213>人工序列:引物#B1656D07
<400>10
agcattattc ttcgaagtcg cattgg                                     26
<210>11
<211>45
<212>DNA
<213>人工序列:引物#B1659F03
<400>11
ttaagatctt ttttatacaa ataggcttaa caataaagta aatcc                45
<210>12
<211>3342
<212>DNA
<213>地衣芽孢杆菌(Bacillus licheniformis)
<220>
<221>CDS
<222>(1303)..(2469)
<223>DNA sequence of the dal-gene encoding D-alanine racemase
<220>
<221>misc_feature
<222>(2685)..(2685)
<223>不确定
<400>12
gcgtaccgtt aaagtcgaac agcggtttct tcctttttac atccatggat taaaaagggg     60
ttgaaaaaag gtgagaaaaa gctttgtttt gcttttaacg gggctgcatg taatccttat    120
gctttctgcc tgcggccaaa aatcgcaaga agatgttgtg acggggctcg acaagaaggc    180
aaaagaatac acgtcctata aggcaaaagc gaaaatgacc attgaaacgg ggaatgaccc    240
gcaggagtac aacgtggaaa tctggcataa aaaaccttct ctttaccggg tctatttgga    300
aaacccgaaa aaagaccaga gccaggtgat cttgcgcaat gaaaacggcg tgtttgtttt    360
gactccgtcg ctgaataaaa gcttccgctt tcacagcgac tggcccaata acagcagcca    420
ggtatactta ttcgaatcgc tcgtaaagga tgtcaaaaat gatggggaag cttctttttc    480
cgcaaaggat tcaaaataca tttttgaaac gaaaacgaat tatcagcata atcagatgct    540
gccgactcag gaaatcgttt tccataaaaa gaccatggct ccttcatcgg ttaaagtgat    600
ggataccgac cgcaaaccga tggtaaaggt tgagtttaca agctttgaat tcgataagcc    660
gctcgataaa gactcttttg atgaaaagaa aaatatgacg ctgtctcaaa ttgacgtagc    720
gacaagcgct gacgtgtcag actctttcgc tgtcaaaacg ccgctcgatg tgcctcaggg    780
cgtgaaaaag cttgaagaga aagagatggc gactgaagac ggcaaacgga tcgtcatcac    840
atatggcggt gaaaaatcct ttacattgat tcaggaaaaa gcccgcgtcg ccaaaacatc    900
cacttccgta tccatgaacg gagagcccgt tgacctcggc ttcacggtcg gcgcactgac    960
ggataaatcg ttgtcatgga catatgacgg agtcgattac tttatctcat cagaagatct   1020
ttctcaagat gaacttctga tggttgcaaa aagcatgcag ggacagtctt cgaaatagac   1080
tgtgccgtat ccggcagcct gttttccgcc cggaagcgga aagcaggctt ttttatattt   1140
gcgtcgcaag cgtatgattt cgacagcttt tccgtaaaat gtataccgtg ccagcaattt   1200
ttcttttgtt cagggctgat gatcccgtgc aaaatttccc tttctccgaa ctttttagta   1260
tgatgggaag gacgagtgaa acaaggaaca ggaagtgtca tg atg agc tta aaa      1314
                                               Met Ser Leu Lys
                                               1
cca ttc tat aga aag aca tgg gcc gaa atc gat tta acg gct tta aaa     1362
Pro Phe Tyr Arg Lys Thr Trp Ala Glu Ile Asp Leu Thr Ala Leu Lys
5                   10                  15                  20
gaa aac gtc cgc aat atg aag cgg cac atc ggc gag cat gtc cgc ctg     1410
Glu Asn Val Arg Asn Met Lys Arg His Ile Gly Glu His Val Arg Leu
                25                  30                  35
atg gcc gtc gtt aaa gcg aat gcc tac gga cac ggg gat gca cag gta     1458
Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly Asp Ala Gln Val
            40                  45                  50
gcg aag gcg gct crt gca gaa ggg gcg tcc att ctt gct gtg gct tta     1506
Ala Lys Ala Ala Leu Ala Glu Gly Ala Ser Ile Leu Ala Val Ala Leu
        55                  60                  65
ttg gat gaa gcg ctt tcg ctg agg gcg cag ggg att gaa gaa ccg att     1554
Leu Asp Glu Ala Leu Ser Leu Arg Ala Gln Gly Ile Glu Glu Pro Ile
    70                  75                  80
ctt gtc ctc ggt gca gtg ccg acc gaa tat gca agc att gcc gcg gaa     1602
Leu Val Leu Gly Ala Val Pro Thr Glu Tyr Ala Ser Ile Ala Ala Glu
85                  90                  95                  100
aag cgc att atc gtg act ggc tac tcc gtc ggc tgg ctg aaa gac gtg     1650
Lys Arg Ile Ile Val Thr Gly Tyr Ser Val Gly Trp Leu Lys Asp Val
                105                 110                 115
ctc ggt ttt ctg aat gag gcc gaa gct cct ctt gaa tat cat ttg aag     1698
Leu Gly Phe Leu Asn Glu Ala Glu Ala Pro Leu Glu Tyr His Leu Lys
            120                 125                 130
atc gac acg ggc atg ggc cgc ctt ggc tgc aaa acg gaa gaa gag atc     1746
Ile Asp Thr Gly Met Gly Arg Leu Gly Cys Lys Thr Glu Glu Glu Ile
        135                 140                 145
aaa gaa atg atg gag atg acc gaa tcg aac gat aag ctc aat tgt acg     1794
Lys Glu Met Met Glu Met Thr Glu Ser Asn Asp Lys Leu Asn Cys Thr
    150                 155                 160
ggc gtg ttc act cat ttc gcc acg gcg gac gaa aag gac acc gat tat     1842
Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu Lys Asp Thr Asp Tyr
165                 170                 175                 180
ttc aac atg cat ctt gac cgc ttt aaa gag ctg atc agc ccc ttc ccg     1890
Phe Asn Met His Leu Asp Arg Phe Lys Glu Leu Ile Ser Pro Phe Pro
                185                 190                 195
ctt gac cgt ttg atg gtg cat tcg tca aac agc gcc gcg ggt ctg cgc     1938
Leu Asp Arg Leu Met Val His Ser Ser Ash Ser Ala Ala Gly Leu Arg
            200                 205                 210
ttc agg gaa cag cta ttt aat gcc gtc cgc ttc ggc atc ggc atg tac     1986
Phe Arg Glu Gln Leu Phe Asn Ala Val Arg Phe Gly Ile Gly Met Tyr
        215                 220                 225
ggt ttg gcg ccg tca acc gaa ata aaa gac gag ctg ccg ttt cgt ctg     2034
Gly Leu Ala Pro Ser Thr Glu Ile Lys Asp Glu Leu Pro Phe Arg Leu
    230                 235                 240
cgg gaa gtg ttt tcg ctt cat acc gaa ctc acc cat gtg aaa aaa att     2082
Arg Glu Val Phe Ser Leu His Thr Glu Leu Thr His Val Lys Lys Ile
245                 250                 255                 260
aaa aaa ggc gag agc gtc agc tac ggg gcg aca tat aca gct cag cgc     2130
Lys Lys Gly Glu Ser Val Ser Tyr Gly Ala Thr Tyr Thr Ala Gln Arg
                265                 270                 275
gac gaa tgg atc ggg aca gtc ccc gtc ggg tat gcc gac gga tgg ctg     2178
Asp Glu Trp Ile Gly Thr Val Pro Val Gly Tyr Ala Asp Gly Trp Leu
            280                 285                 290
agg cgc ctg gcc gga acg gaa gtg ctg atc gac gga aaa cgc caa aaa     2226
Arg Arg Leu Ala Gly Thr Glu Val Leu Ile Asp Gly Lys Arg Gln Lys
        295                 300                 305
ata gca ggg aga atc tgc atg gac cag ttc atg att tcc ctt gcc gaa     2274
Ile Ala Gly Arg Ile Cys Met Asp Gln Phe Met Ile Ser Leu Ala Glu
    310                 315                 320
gaa tac cct gtc ggc aca aag gtt acc ttg atc gga aag caa aaa gac     2322
Glu Tyr Pro Val Gly Thr Lys Val Thr Leu Ile Gly Lys Gln Lys Asp
325                 330                 335                 340
gaa tgg atc tca gtc gac gaa atc gcccaa aat ttg cag acg atc aat     2370
Glu Trp Ile Ser Val Asp Glu Ile Ala Gln Asn Leu Gln Thr Ile Asn
                345                 350                 355
tat gaa att acc tgt atg ata agt tca agg gtg ccc cgt atg ttt ttg     2418
Tyr Glu Ile Thr Cys Met Ile Ser Ser Arg Val Pro Arg Met Phe Leu
            360                 365                 370
gaa aat ggg agt ata atg gaa ata agg aat ccg atc ttg cct gat caa     2466
Glu Asn Gly Ser Ile Met Glu Ile Arg Asn Pro Ile Leu Pro Asp Gln
        375                 380                 385
tcc tgaaaattga tgaattagcg gaaaaacaac tttgcttgcg aaaagaataa          2519
Ser
tgatatgatt atgaatggaa tggatagagt gttgtatccg taagtttggt ggaggtgtat   2579
gtttttgtct gaatccagcg caacaactga aatattgatt cgcttgccag aagctttagt   2639
atcagaactg gatggtgtcg tcatgcgaga taaccgggag cagganatga actgatttta   2699
ccaagccaca aaaatgtagg aacgcgaacg caaaaaatcg acaaattcgg ggaatcgatg   2759
agaagcggtt atatggagat ggccaagatc caatttgaac atctcttctg aggctcaatt   2819
tgcagagtat gaggctgaaa acacagtaga gcgcttacta agcggatgat aatcatttga   2879
ttgttaaacg cggcgatgtt tattttgctg acctatctcc tgttgttggc tcagaacaag   2939
gcggggtgcg cccggtttta gtgattcaaa acaacatcgg caatcgcttc agcccaactg   2999
ctattgttgc agccataaca gcccaaatac agaaagcaaa attacctacc cacgtcgaaa   3059
ttgatgcgaa acgctacggt tttgaaagag actccgttat attgctcgaa caaattcgga   3119
cgattgacaa gcaaagatta acggacaaaa tcacccatct cgatgatgaa atgatggaaa   3179
aggtcaacga agccttacaa atcagtttgg cactcattga tttttaatat tgatgaaagt   3239
tgctcgaggc gaaagagcaa ctttttttgt gttcaaaaat aacaatacga tataatggta   3299
actgttagtc ctaaaaatgt tagccagatg tagtcagggg gat                     3342
<210>13
<211>389
<212>PRT
<213>地衣芽孢杆菌(Bacillus licheniformis)
<220>
<221>misc_feature
<222>(2685)..(2685)
<223>不确定
<400>13
Met Ser Leu Lys Pro Phe Tyr Arg Lys Thr Trp Ala Glu Ile Asp Leu
1               5                   10                  15
Thr Ala Leu Lys Glu Asn Val Arg Asn Met Lys Arg His Ile Gly Glu
            20                  25                  30
His Val Arg Leu Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly
        35                  40                  45
Asp Ala Gln Val Ala Lys Ala Ala Leu Ala Glu Gly Ala Ser Ile Leu
    50                  55                  60
Ala Val Ala Leu Leu Asp Glu Ala Leu Ser Leu Arg Ala Gln Gly Ile
65                  70                  75                  80
Glu Glu Pro Ile Leu Val Leu Gly Ala Val Pro Thr Glu Tyr Ala Ser
                85                  90                  95
Ile Ala Ala Glu Lys Arg Ile Ile Val Thr Gly Tyr Ser Val Gly Trp
            100                 105                 110
Leu Lys Asp Val Leu Gly Phe Leu Asn Glu Ala Glu Ala Pro Leu Glu
        115                 120                 125
Tyr His Leu Lys Ile Asp Thr Gly Met Gly Arg Leu Gly Cys Lys Thr
    130                 135                 140
Glu Glu Glu Ile Lys Glu Met Met Glu Met Thr Glu Ser Asn Asp Lys
145                 150                 155                 160
Leu Asn Cys Thr Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu Lys
                165                 170                 175
Asp Thr Asp Tyr Phe Asn Met His Leu Asp Arg Phe Lys Glu Leu Ile
            180                 185                 190
Ser Pro Phe Pro Leu Asp Arg Leu Met Val His Ser Ser Asn Ser Ala
        195                 200             205
Ala Gly Leu Arg Phe Arg Glu Gln Leu Phe Asn Ala Val Arg Phe Gly
    210                 215                 220
Ile Gly Met Tyr Gly Leu Ala Pro Ser Thr Glu Ile Lys Asp Glu Leu
225                 230                 235                 240
Pro Phe Arg Leu Arg Glu Val Phe Ser Leu His Thr Glu Leu Thr His
                245                 250                 255
Val Lys Lys Ile Lys Lys Gly Glu Ser Val Ser Tyr Gly Ala Thr Tyr
            260                 265                 270
Thr Ala Gln Arg Asp Glu Trp Ile Gly Thr Val Pro Val Gly Tyr Ala
        275                 280                 285
Asp Gly Trp Leu Arg Arg Leu Ala Gly Thr Glu Val Leu Ile Asp Gly
  290                  295                 300
Lys Arg Gln Lys Ile Ala Gly Arg Ile Cys Met Asp Gln Phe Met Ile
305                 310                 315                 320
Ser Leu Ala Glu Glu Tyr Pro Val Gly Thr Lys Val Thr Leu Ile Gly
                325                 330                 335
Lys Gln Lys Asp Glu Trp Ile Ser Val Asp Glu Ile Ala Gln Asn Leu
            340                 345                 350
Gln Thr Ile Asn Tyr Glu Ile Thr Cys Met Ile Ser Ser Arg Val Pro
        355                 360                 365
Arg Met Phe Leu Glu Asn Gly Ser Ile Met Glu Ile Arg Asn Pro Ile
    370                 375                 380
Leu Pro Asp Gln Ser
385
<210>14
<211>20
<212>DNA
<213>人工序列:引物#148779
<400>14
gatgaacttc tgatggttgc                                                20
<210>15
<211>26
<212>DNA
<213>人工序列:引物#148780
<400>15
aaaggatccc cctgactaca tctggc                                        26
<210>16
<211>39
<212>DNA
<213>人工序列:引物#170046
<400>16
aaagcggccg cgagactgtg acggatgaat tgaaaaagc                         39
<210>17
<211>32
<212>DNA
<213>人工序列:引物#170047
<400>17
aaagaattcg tgaaatcagc tggactaaaa gg                                32
<210>18
<211>32
<212>DNA
<213>人工序列:引物#150506
<400>18
aaaggatccc gcaagcaaag ttgtttttcc gc                                32
<210>19
<211>30
<212>DNA
<213>人工序列:引物#150507
<400>19
aaaggtaccg aaagacatgg gccgaaatcg                                  30
<210>20
<211>32
<212>DNA
<213>人工序列:引物#158089
<400>20
aaaggtaccg gtaatgactc tctagcttga gg                              32
<210>21
<211>33
<212>DNA
<213>人工序列:引物#158090
<400>21
caaatcgatc atcaccgaaa cgcggcaggc agc                              33
<210>22
<211>31
<212>DNA
<213>人工序列:引物#150508
<400>22
attaagcttg atatgattat gaatggaatg g                                31
<210>23
<211>30
<212>DNA
<213>人工序列:引物#150509
<400>23
aaagctagca tccccctgac tacatctggc                                  30
<210>24
<211>24
<212>DNA
<213>人工序列:引物#145507
<400>24
gcgtaccgtt aaagtcgaac agcg                                        24
<210>25
<211>30
<212>DNA
<213>人工序列:引物#150509
<400>25
aaagctagca tccccctgac tacatctggc                                  30
<210>26
<211>5761
<212>DNA
<213>地衣芽孢杆菌(Bacillus licheniformis)
<400>26
accggggccg ggcgttttgt cggcaacgtc tgtatatttc agccttgaaa ggcccttgat     60
tccttcatgg atgatcgctt tcataaaaaa attcccccca ttcgagttgg ttgtgttaaa    120
ttatggacat gaatgaaggt aaatgtaaaa tgatttgccc ggggccgctt agaggccttc    180
tgttttataa aggattgcaa tgaggcggaa attccattag tgtaatacag aagcaagcta    240
gcaagtgaag gagatggaac atgagttttc acgatcaaaa tattttacct gcggtacgca    300
atatgaagca gttcgataca ttcctggaca gccctttttc atacggggtg ctgcttgaca    360
tccatcttgg acagctggga ggcgtgatca gcgcggcaag atcccatggg aaaaaaatgt    420
ttgttcacgt cgatctgatc caaggaatta agcatgatga atacggtgcg gaattcattt    480
gccaggaaat gaaaccggcg ggcattcttt ctacgagatc aagcgttatc gccaaagcaa    540
agcagaagaa agtgtatgcg atccagcgca tgtttttaat agacacaagc gccatgaaga    600
agagcattga attggtgaaa aagcacagac ccgactatat agaagtgctt cccggagtag    660
tgccggaatt gatcagggaa gtcaaagaaa taaccggcat tccgatcttt gcgggcgggt    720
ttatccgtac cgaaaaagac gtcgagcagg cgcttgcagc aggggcgtcc gcagtcacca    780
cctcagacac tgatttatgg aaaaaatact ggaactaaaa atttaaaatg tgaaaaatta    840
ttgacaacgc tttcactata cgatacgatc ttactaagtt aatacattgt gacggagacc    900
cggagaccac agcagttctt tactcagtat gatgtaaaga aagtttgctg tgttttttta    960
tggtctttta gacacagtgg agaaggtgaa cttatggcgt tcatctatta gaataatact   1020
tcataataga ttttaggagg gatagccttg acagcatttt ggggggaagt tatcggaacg   1080
atgctgctca tcgtctttgg agctggagtt tgtgcaggag ttaatttgaa aaaatcgctg   1140
tcccatcaat ccggatggat tgtgatcgtc ttcggctggg ggcttggcgt ggccatggcg   1200
gtatatgccg tcggcggcat cagcggagcg catttaaatc cggccgttac attggggctg   1260
gcatttgtcg gagattttcc ttgggaagaa gtgccttcat atattttggg acagatgatc   1320
ggcgcatttt taggagcggt gctcgttttt cttcactact tgccgcactg gaaagaaacc   1380
gaggatcaag gcgcgaagct tggagtattt tcgacaggtc cggcgattcc aaatacattt   1440
gcaaacctgt tcagtgaaac attggggact tttattctcg ttctcggact tttaacgatc   1500
ggtgcaaaca agtttactga cggactgaat cctcttgttg tcggatttct gatcgtggcg   1560
atcggtatct cgctcggcgg aacaacaggc tatgcgatta accctgcccg cgatctgggg   1620
ccgagaattg cccattttgt ccttccgatt gcaggcaaag ggagttcaaa ctggaagtac   1680
gcgtggatcc ctgttttagg accggcgctt ggcggttcat ttgcaggcgt tttttacaac   1740
gccgtattca aagggcatat cacaaacaca ttttggattg taagcgttat actagttgtg   1800
atattgttag gtttctatat tcatatgaaa aaacaagcag ttgatcaatc ggtcaacatt   1860
taaaaaaaag caatcttaac agacatataa gggggagttt caaaatggaa aagtacattt   1920
tgtctcttga tcaaggcacc acaagcacaa gggcgattgt tttcaacaaa gcaggcgaaa   1980
tcgtccatat tgcgcaaaag gaattccagc aatattttcc aaaccccggc tgggttgaac   2040
acaatgcaaa cgaaatctgg ggctctgttc tgtcggtgat cgcttcagcg ctttcagaat   2100
cggggatcga agccggacaa attgccggaa tcgggatcac aaaccagcgg gaaacgaccg   2160
tggtttggga taaacatacc ggcaaaccgg tctacaacgc gattgtgtgg cagtcccgcc   2220
aatcggctga gatatgccag gaattaaaag agaaaggcta tgaagagacg atcagagaaa   2280
aaacagggct tttaatcgat ccttattttt caggcacgaa agtgaaatgg atcctggatc   2340
atgtggaagg ggcaagggag aaagccgaaa acggcgacct tctcttcggt acgatcgatt   2400
cttggctgat ctggaaaatg tccggcggaa aagcgcatgt gacagattat tcaaacgcct   2460
caagaacatt gatgttcaac atctatgacc taaaatggga tgatgaactt ctcgatattc   2520
tcggcgtgcc gaaatcgatg gttccggaag tcaagccttc atcgcatgta tacgctgaaa   2580
cggtcgatta tcatttcttc ggcaaaaaca ttccgattgc aggtgcagcc ggcgaccagc   2640
aggcagcatt gttcgggcag gcttgctttg aagaaggaat ggttaagaac acgtatggaa   2700
caggctgctt tatgctgatg aacaccggcg agaaagcgat taaatcagag cacggcctgc   2760
tgacgacaat cgcttggggc atcgacggaa aggtggaata tgcgctggaa ggcagcgtct   2820
tcgtcgcggg ttccgctatt caatggctgc gtgatgggct gagaatgttt aaagacgcca   2880
aagaaagtga aaaatacgct gtaagagcag aatctgccga tggtgtttat gtggtccctg   2940
catttgtagg tttaggcacg ccttattggg acagcgatgt ccgcggcgct gtattcggac   3000
tgacccgggg tacgacgaaa gagcatttta tcagagcaac gcttgaagcg cttgcctatc   3060
aaacgaaaga cgtgctggac gcaatgaagg aagactccgg gatcccggtt aaaacgctga   3120
gagtcgacgg cggagctgtc aaaaacaact tcctgatgga ttttcagggc gacattttag   3180
atgtccctgt agaacgtcct gaaatcaatg aaacaacagc gcttggttca gcctatttag   3240
cgggccttgc tgtcggcttc tggagcgatc gttccgagat caaagaccag tggcagcttg   3300
acaaacgttt tgaaccgaaa atggaagaaa aagagcgtga gagcctgtac aacgggtgga   3360
agaaagctgt aaatgcagct agggctttta aataagctgc atgtatgtta caatctaatt   3420
aagttaatag aaacggttgg agaagaggag agaccgcaga caccaaagca gtatcagcgc   3480
tttggatgtt tgtggtctct ttttctattt tttaccgtga caacaaggga ggacatgaaa   3540
catggaatca ttattttcaa gccgtaaacg ggacgacatt ttacagaata tgacgaagca   3600
gaagtatgac gtgtttatta tcggcggagg tattactggg gctgggacgg cattggatgc   3660
cgcatcgcgc ggaatgaaaa cggcgctttg cgaaatgcag gactttgcag ccggaacgtc   3720
aagccgttcc acgaaacttg tacacggcgg gcttcgctat ttaaagcaat ttgaagtgaa   3780
aatggtagcc gaggtcggca aagagcgggc gatcgtctat gaaaacgggc cgcacgttac   3840
aacgcccgaa tggatgctgc ttccgatgca taagggaggg actttcggca aattcagcac   3900
ttcaatcgga ctgagggtgt acgacttttt ggcaggcgtc aaaaaagctg agcggaggag   3960
catgctgact gccgaagaaa cgcttcaaaa agagccgctc gtgaaaaaga acggcctgaa   4020
gggcggcggc tattatgtcg aataccggac ggatgatgcc agattgacga tcgaagtcat   4080
gaaagaagcc gttaaattcg gagccgaggc cgtcaattat gcaaaagtaa gcgattttat   4140
atatgaaaac ggcaaggtca ccggcgtggt cattgaagac gtcttcacga aaaaaacgta   4200
ccgcgtctac gcgaaaaaaa ttgtcaatgc cgcggggccg tgggtcgacc gtctgcggga   4260
aaaagaccat tcaaaagaag gcaaacacct tcagcataca aaaggcgtgc atcttgtttt   4320
tgatcaatcg gtctttcctt taaaacaagc cgtttatttt gatacgcctg acggccgcat   4380
ggtgttcgcc attccgagag acggaaaggc atatgtcggc acaacagaca ccgtctacaa   4440
cgagaatttg gaacaccctc gaatgacgac agcagacagg gattatgtca tcaatgcaat   4500
caactatatg ttccctgaac ttggaatcaa agccgaagat gtcgaatcaa gctgggctgg   4560
cctcagaccg ctgattcatg aagaaggaaa agacccgtcc gagatttccc gaaaagatga   4620
gatctggact tctgaatccg gactgatcac gatcgccggc ggaaagctga caggctacag   4680
aaaaatggct gagcatatcg tcgatcttgt cagagaccga ttaaaagaag agggcgacag   4740
agacttcggg ccttgcagaa caaaaacgat gccgatttca ggcggccata tcggcggctc   4800
caaaaatctg gaggctttta ttcaagcgaa agcagccgaa gggattgagg ccggactgtc   4860
cgaagagacg gccaaacaaa tcgccgcacg atacggttcg aacgcagacc gcctgtttga   4920
tcgtattcca tcgctgaaag atgaagcagc aaaacgccgc atccctgtcc atgtactagc   4980
agaaatggat tacgggatcg aggaagaaat ggcagccgtc ccggcagact tcttcgtccg   5040
cagaaccggt gcgctgttct ttgacatcaa ttgggtccgc acttacaaag agagccttac   5100
ggactacatg agcgagaagc tgaactggga tggcgaaacg aaggcccggc atgtcaaggc   5160
attggaagga ctactacacg atgctgttgt cccgctggaa agcaaatgat ttattaggtc   5220
aaataacctt ggtgaatttt cgttaataat caatcgaatg gcccggcgtg aggctgtctt   5280
gaacaggcag cctcattttt ttcatttggc atgctaaatt tggacaaagc ggcggtttgt   5340
cgatatgata aaagaaaagc tgcaattact tagctagaac attggaggta atcatgagct   5400
ggagaacgag ctatgaacgc tggagaaaca aagaaaactt agattccgaa ttaaaagcgc   5460
ttcttttgga agcggaagga aatgaaaaag aactagagga ttgcttttat aaaaaacttg   5520
agtttggtac agccggtatg cgcggtgaga tcggaccggg cccgaaccgc atgaacgttt   5580
atacggttcg caaagcatcg gcgggccttg ccgcatacat aggagcgaac ggcggcgaag   5640
caaaaaagcg cggcgttgtg atcgcgtacg attcccgcca caaatcgcct gaatttgcaa   5700
tggaagctgc taagacgctc gcagaaaacg gcgttcaaac gtacgtgttt gagcgtaact   5760
g                                                                   5761
<210>27
<211>34
<212>DNA
<213>人工序列:引物
<400>27
gactgaattc gcaat ttgaa gtgaaaatgg tagc                           34
<210>28
<211>33
<212>DNA
<213>人工序列:引物
<400>28
gactggatcc agatctcatc ttttcgggaa atc                             33
<210>29
<211>56
<212>DNA
<213>人工序列:引物
<400>29
gactgaattc agatctgcgg ccgcacgcgt agtactcccg gcgtgaggct gtcttg    56
<210>30
<211>32
<212>DNA
<213>人工序列:引物
<400>30
gactaagctt cagt tacgct caaacacgta cg                             32
<210>31
<211>47
<212>DNA
<213>人工序列:引物
<400>31
ccgagatttc ccgaaaagat gaaatttgga cttctgaatc cggactg              47
<210>32
<211>50
<212>DNA
<213>人工序列:引物
<400>32
gactaagctt agatctgcta gcatcgattg attattaacg aaaattcacc               50
<210>33
<211>31
<212>DNA
<213>人工序列:引物
<400>33
gactaagctt gtgaaggaga tggaacatga g                                   31
<210>34
<211>64
<212>DNA
<213>人工序列:引物
<400>34
gactggatcc agatctgcgg ccgcacgcgt cgacagtact atttttagtt ccagtatttt    60
ttcc                                                                 64
<210>35
<211>32
<212>NA
<213>人工序列:引物
<400>35
gagctctaga tcttcggcgg catcagcgga gc                                  32
<210>36
<211>28
<212>DNA
<213>人工序列:引物
<400>36
gactgaattc cttttgcgca atatggac                                       28
<210>37
<211>58
<212>DNA
<213>人工序列:引物
<400>37
gagctctaga tctgctagca tcgatccgcg gttaaaatgt gaaaaat tat tgacaacg      58
<210>38
<211>1500
<212>DNA
<213>地衣芽孢杆菌(Bacillus licheniformis)
<400>38
atcagcgata gggctcgcat cgacagaccg gatttcatcc ggccaatggc gggatgacgg     60
gctggtcatc aggtcgacat ccggcgatca gtttaatgcc attgaccctg atctggtcat    120
tgacaaagac ggaaagccct ggctctcatt cggttccttc tggagcggca ttaagctgac    180
aaggcttgat aaaaacacga tgaaaccgac gggaagcctg tattcgatcg cctcaaggcc    240
gaataacgga ggagcggttg aagccccgaa cattacctac aaagacggct actattactt    300
atttgtctcg tttgacagct gctgcaaagg ggtggacagc acatataaaa tagcctatgg    360
ccgttcaacg agcattacgg gaccctatta tgataaaagc ggcaaaaata tgatgaacgg    420
cggagggacg atcctggact ccggcaatga ccgctggaaa gggccgggac atcaggatgt    480
tctgaacaac tcgatccttg tcaggcatgc ttacgacgcg ctggacaatg gtgtatcaaa    540
gctgctcatc aatgacttgt actgggattc ccaaggatgg ccgacttatt aacagcagat    600
gacgggcggt ttccgcccgg ttttttttgt tctgaaatct gtcaaaaaaa aataaaaaac    660
ataccggaaa ttaaattgac agtttttttc ataatgatat aatgaagttg ttcgtacaaa    720
tatgtttttt atgttagttg tacgtacata taatcgcgat acagtttgag atcaaggtat    780
gatttatgtt tttttgtaag cgttttaata gtttgctatt ctacacagac accataaaga    840
cgaggaggag gaagctattt gattcaggca aagacgcatg tgttttggtt tgtgacaggc    900
agccagcatt tatatggcga agaggcggta caagaggtag aagagcattc caaaatgatc    960
tgcaacggat taaatgacgg agatttaagg tttcaagtcg agtacaaagc ggtggccact   1020
tcgctggacg gcgtcagaaa actgtttgaa gaggcgaacc gggacgatga gtgcgcaggc   1080
atcatcacct ggatgcatac gttttcaccg gccaaaatgt ggattcccgg cctttccgag   1140
ctgaataagc cgctgctcca ttttcatacc cagtttaacc gggacattcc gtgggataaa   1200
atcgacatgg atttcatgaa tattaatcag tctgcccacg gcgaccgcga atacggtttt   1260
atcggagcga gattgggcat tcctcgaaaa gtaatcgccg gatattggga agacagagaa   1320
gtaaagcgct cgatcgacaa atggatgagc gcagcggtcg catatattga aagccgccat   1380
atcaaagtcg cccgatttgg ggacaacatg cggaatgtgg cggtaacaga aggagataag   1440
attgaagcgc agattcagct tggctggtct gtcgacggat atggaatcgg cgatctcgtc   1500
<210>39
<211>32
<212>DNA
<213>人工序列:引物
<400>39
gactaagctt catccggcga tcagtttaat gc                                  32
<210>40
<211>65
<212>DNA
<213>人工序列:引物
<400>40
gactgaattc agatctgcgg ccgcacgcgt cgacagtact attttttttt gacagatttc    60
agaac                                                                65
<210>41
<211>37
<212>DNA
<213>人工序列:引物
<400>41
gactggatcc agatctagtc gagtacaaag cggtggc                             37
<210>42
<211>31
<212>DNA
<213>人工序列:引物
<400>42
gactgaattc gaccagccaa gctgaatctg c                                   31
<210>43
<211>4078
<212>DNA
<213>地衣芽孢杆菌(Bacillus licheniformis)
<400>43
tttccggcgt agcacccgaa gcgaacctat taatcgtcaa ggtgctcggc ggtgaagacg     60
gcagcgggga ttatgaatgg atcatcaacg ggatcaacta cgccgttgag caaaaagccg    120
acattatttc aatgtcgctc ggcggtcctg ccgacgttcc ggagttgaag gaagcggtga    180
caaacgccgt gaagagcgga gtgctcgtcg tctgcgccgc aggaaacgaa ggcgacggca    240
atgaccgtac agaggagtac tcataccctg ctgcatacaa cgaagtcatc gccgtcggat    300
ccgtgtcatt gacgcgtgag tcttccgaat tttcaaatgc gaacaaagaa attgaccttg    360
ttgcacctgg agaagaaatc ctctctacat tgcccgacca tcaatacgga aagctgacgg    420
gaacatcgat ggctacaccg cacgtcagcg gcgcgctcgc tctcatcaag tcagctgaag    480
aagaggcgtt taaacggaaa ctgacagaac ccgaactgta tgctcagtta atccgccgca    540
cccttcctct tgattactca aaagcgctga tcggcaacgg attcttatat ttgtcagcgc    600
cggaggtact ggcggaaaaa gccggcgaag caaaacttct ttccctttaa cagtctaaag    660
gaggctgccg acaatgtcgg cggccttttt catggccatg tataaagctg aatcttttta    720
attgcaagaa ttcaaaaatt attttgacta aaagatcgcg gcggtatata atctactaaa    780
caatttcatc gccgggaaca tggtaatcta acgaggttag attttaaaag ggaagtttgg    840
tgaaaatcca acgcggtccc gccactgtga atgaggaggt tatttcataa aacccactgt    900
ttctatatgg gaagggggaa ataaccgtcg attcatgagc caggagacct gcctgttctg    960
acgcaccata aacctacggt cgataggagg tgttcgagtt gacgtaacaa tcgctacgtt   1020
tatttctcgt tcgcaacatg ctgttttcag gcattcacct tctcattgtc cgaagtgtga   1080
gtgtcttttt ttattgaaca ctaaaaggag gagaccagac atgactaatg taaaaacgag   1140
cagcttgggc tttccaagaa tcggcttgaa cagagaatgg aaaaaatcgc ttgaggctta   1200
ttggaaagga aacacggacc gcgagacctt tttgaaagaa atggatgaac aatttttagc   1260
agcgctccag actcagcttg atcagcaaat cgatatcata ccggtttccg actttacaat   1320
gtacgaccat gttcttgaca cggcggtgat gttcaactgg attccagatc gattcaagga   1380
tataaacgat ccgttagata cttatttcgc aatggcgaga ggcacgaaag atgctgtatc   1440
gagtgaaatg acaaaatggt ttaatacaaa ctaccattat attgtgcctg aatatgaaaa   1500
aggtgcacaa taccgcgtga cgagaaacaa accgcttcaa gattaccaaa gagcaaaagc   1560
agcattggga acagaaacga agcccgtcat actcggcctt tacactttcg tagcccttgc   1620
aaaaggctat gaacaacagg atattaaaga tatttataac caaatgacac ctctttacat   1680
ccaggttttg aaagagcttg agcaggaagg cgtcaaatgg gtgcaaattg acgagcctgc   1740
tcttgtgacg gcttcacctg aagaagcggc tgctgtcaaa gaaatctatc agacgattac   1800
agaagaagtc tctgaactga acatccttct gcaaacctac tttgactcgg ttgatgctta   1860
tgaagagctg atatcgtttc ctgtcgcagg aattggtctt gattttgttc atgataaagg   1920
gaaaaacttc gaacacctga aagcgcacgg ttttcctaaa gacaaagtcc ttgccgccgg   1980
cattttagac ggacgcaaca tttggaaagc caatctcgaa gagcgcctcg acctgacgct   2040
tgaactgatc cagagagcgg gtgttgacga agtctggatt cagccttcaa acagcctgct   2100
tcatgtccct gtcgcaaaac acccgggcga acatcttgcc gacgatctct tgaacggttt   2160
atctttcgca aaagagaaac ttctggagct tacactgctg aagaacggac ttgtttccgg   2220
aaaagcggcc atccaagcgg aaatcgatga agcgcacgga caccttcaag atctcaaaca   2280
gtacggtgca gcgacaaatt cggcctttgc cgaagaaaga ggcaagctga ctgaggaaga   2340
ctttaaacgc ccgacagctt ttgaagaaag gctgcggatt caaaatgact ctctcggact   2400
tcccctattg ccgacaacaa cgatcggcag cttcccgcag acggcggatg tgcggagcgc   2460
gcggcaaaaa tggcggaaaa aagaatggtc cgacgagcag tatgaagcat ttattcagga   2520
agaaacaaag aaatggattg atattcagga agatctcgga cttgacgttc tcgttcacgg   2580
agaattcgaa cggacagaca tggttgagta tttcggcgaa aagctcggag gattcgcctt   2640
tactaaatac gcctgggttc agtcatacgg ttcccgctgc gtccggccgc cggtcatcta   2700
cggagatgtc gagtttaaag agccgatgac ggtaaaagaa acggtttacg cccaatcctt   2760
gacctcgaag aaagtcaagg gcatgctgac agggcctgtt accattttaa actggtcctt   2820
tgcccgctat gacctgccga gaaaagagat cgccttccaa atcgcctgcg ccctccgcaa   2880
agaggttgaa gcgcttgaaa aagcaggaat tcaaatcatt caggtcgatg aacctgcctt   2940
gagagaaggc ctgccgctta aagaacggga ttgggacgag tatctcaaat gggctgcaga   3000
agcgttcaga ctgtccactt catctgtgga agatacgacg caaatccata cgcatatgtg   3060
ctacagcaac tttgaagata tcgtagacgc gatcgaagat cttgacgcag acgtcattac   3120
gatcgagcac agcagaagcc acggcggatt tcttgattat ctggaacagc acccttacct   3180
gaaagggctt ggtcttggcg tatatgatat tcacagccct cgcgtccctt ccagcgatga   3240
aatgctcacg atcatagaag acgcgctgaa agtctgcccg gctgatcgct tctgggtaaa   3300
ccctgactgc ggtttaaaaa cgagacagcc agaggaaacg atcgcagcgc ttaagaatat   3360
ggttgaagca gccaaacaag caagaggcaa actggctcag actgtttaat ttcacaaaaa   3420
atccactaca aacgccgcct gttcacacgg gcggctcttt tcatggctcc agcccttttt   3480
aggccaaaag aaccgttata caaggtatgt ccgcccaaaa aacattaaga cttttgattc   3540
attcgtacga tttccttccg tatccttttc ttttaacata tttgtagtag atgatggaag   3600
ggaaggaaaa tatgtagtga ttgacgatgg aatagcgtta gaacgaaaaa tcaagcgaaa   3660
aatatatcag gaagacattc actctcttca gctatacgta aaagatgtga atgccgccat   3720
tgatgagctg aggcaggaaa gttcttctat tttaaaagca caccaaacgt atatcaacgg   3780
atggcgcgga caggcgcgcg aaatgtatga cgcgcttttg gacgatctcg accgggcgga   3840
atcgcgcgtg tatgacaagc tgaggaccat taaagagcag gcggacgaag aaattgaacg   3900
gcttcagctg aaagccgagg agctgatatg acgatccggc tgaacatcaa tgatctgcac   3960
gccctcgccc gccaatttcg ttattcccac cagcgaatca gcgatttaat acgccttttg   4020
aaccg tcatt ttcatggttc ttttctccag cgtgaaaaca gcaaggaaca tgcggcat     4078
<210>44
<211>42
<212>DNA
<213>人工序列:引物
<400>44
aaaaaacccg agtttcacaa aaaatccact acaaacgccg cc                       42
<210>45
<211>41
<212>DNA
<213>人工序列:引物
<400>45
ttttttttaa gcttatgccg catgttcctt gctgttttca c                        41
<210>46
<211>32
<212>DNA
<213>人工序列:引物
<400>46
aaaaaaatcg attcagggat ataaacgatc cg                                  32
<210>47
<211>45
<212>DNA
<213>人工序列:引物
<400>47
tttttttttt ccatcgcact gggatatcag ctcttcataa gcatc                    45
<210>48
<211>3952
<212>DNA
<213>地衣芽孢杆菌(Bacillus licheniformis)
<400>48
tttatacgtt tccctctcgg caatcggagc ctacacgaca ccaagctacg agctgagcct     60
ggcgaataaa atggtgaagc tgtttatgct gatattggtg gcgcttttta aagtggaggg    120
atttgtcatc ggattaacga tcttaactat agtgatgact tcgatcaggt cattgcgaac    180
gccttactta tggcctctcc tcccgttcaa tggaaaagcg ttttggcatg ttctcgtgcg    240
cacgtccgtt ccagggggaa aagtcaggcc gagcatcgtt catccgagaa accgctccag    300
acagccgtga agccggcatt cgaagaggct tttccccggg gaaaagcctc tttttcaata    360
atcgaattcc ggtctttgag taccgatgcc tttgtattca ttggcagaga tcgcgactgc    420
ccggaggctg cagatgttgt tctgtcttct gatcggatag acgacataca gcatttcgcg    480
gccgtacggg tcaatcgttg acgaatgaag gaaaacctca gttcctctcc gccaaaatct    540
cgtattcgcc ggagctgtaa taatctgccc ttcataaggc tcataaattc tctgttcata    600
atgcgcagcc ggctgataag gggcgtatac atcttcaggt gcatagccgg gagcgggggt    660
gtagggataa cgatttggat acatatgata acctctttcc cacttcgttt tttggttttc    720
atctttaaga ttatattcag gtaaatgcct atttgtatgg gcgaaaatct cagcttttcg    780
gctctttttt tattgaatgg acgttgtgta tgcctatttc tatcaagcgc tgttttctgt    840
tattctataa tcaatagaat ggattagttg tttagggaat catttccttt ataaatcaag    900
aaaatttgga caaatggtgg tttagttttt aaaacgaaat gttataatac aacataagaa    960
tcgcactatc atgaagccgg aagatgcatc gggcagcaac cggagcgccc cttgcacctt   1020
tgtcgataga gaaagaggga atgacaattg tttttacacg gtactagcag acaaaatgaa   1080
agagggcacc tcgaaatcgg cggtgtcgat gttctatcat tggcagaaag atacggaaca   1140
cctctttatg tatacgatgt cgcgctgatt agagagcgcg cccgaaaatt ccagaaggca   1200
ttcaaggaag ccggtttaaa agcgcaggta gcgtatgcaa gcaaggcgtt ttcatcggtt   1260
gccatgattc agcttgccga acaagagggg ctgtctctgg atgtggtatc gggaggagag   1320
cttttcactg cgatcaaagc agggttccca gctgagcgga ttcattttca cggaaacaat   1380
aagagccctg aagaactagc catggcgctg gagcatcaaa tcggctgcat cgtgctcgat   1440
aactttcacg agatcgccat tacagaagat ctttgcaagc gatcaggaca aactgtagac   1500
gttttgctca gaatcactcc gggagttgaa gcgcacacgc acgattatat tacgacgggg   1560
caggaagatt ccaaattcgg ttttgatctg cataatggac aggtcgaaca agccatcgaa   1620
caagtccgcc gctcgtctgc gtttaagctc ctcggcgtgc actgccacat cggttcgcaa   1680
atttttgata cggcaggatt tgtccttgca gcagacaaga ttttcgagaa gcttgcggaa   1740
tggcgggaga cttactcttt cattccggaa gtgctcaatc ttggcggggg cttcggcatc   1800
cgctatacaa aagacgacga gccgcttgca gctgatgttt atgttgaaaa aatcatcgag   1860
gcggtcaaag caaatgccga gcatttcggc tttgacatcc ctgagatttg gatcgaacca   1920
ggccggtctc tcgtcggtga tgcggggact acgctgtaca cgatcggttc tcaaaaagag   1980
gtgccgggca ttcgcaaata tgtagccatc gacggcggca tgagcgataa tatcaggccg   2040
gcgctttatg aggcaaaata tgaagcagcc gtcgccaaca ggatgaacga tgcttgtcat   2100
gataccgcat caatcgcagg aaaatgctgc gaaagcggag atatgctgat ttgggatttg   2160
gaaatccccg aagttcgcga cggagatgtg ctcgccgttt tctgcaccgg tgcgtacggc   2220
tacagcatgg ccaacaacta caaccgcatt ccgcgcccgg ccgtcgtctt tgtcgaggac   2280
ggggaagcgc agctcgtcat tcagagagag acgtatgagg atatcgtcaa gctggatctg   2340
ccgctgaaat cgaaagtcaa acaataaaaa aatggagatt ccctaagagg ggggtctcca   2400
tttttaattc aagcacgaaa aacacttccc ggtgatcggg aggtgttttt tgttaaaaag   2460
atcatgacat gcatagaaca gcgaccgggc tagttgtata taatattgtg aatttaacaa   2520
aaaatttaca aaggagatga taaaggcaat gaccagggtg aaaaggatga gatttgctga   2580
tttgttggat ttagaggcgg agtagatgaa accggccaaa gtatccctac tccaccgatt   2640
gctccagtgc ctgaagcaat gtgttgattg taacacagta aatcgtttta cagcaataaa   2700
catttttgtg aatattttat tgattttggc tgtgatctca ttcccatatt ctgctgcggc   2760
ccatggcgca acacagtccg gcgatcaata ttcaagcttt gaagaattgg agcggaatga   2820
agatccagct tcttaccgaa ttacggagaa gaacgcaaga gtgccgatgc tcatcatggc   2880
catccatgga ggcggcatcg aacccggaac gagcgaaatc gccaatgaag tgtccaaaaa   2940
ctattccctg tacttgtttg aagggctgaa atcatcaggc aatacggacc ttcacattac   3000
aagcacgcgt tttgacgagc cagcggcgct cgcaattact gcaagccacc agtatgtcat   3060
gtcgctccac ggctattaca gtgaagaccg cgatattaaa gtaggcggca cagaccgcgc   3120
taaaatcaga atattggttg atgagctgaa ccgctcgggg tttgccgctg aaatgctggg   3180
gacagatgac aagtatgccg gaacccatcc gaataacatc gccaacaagt cgctttccgg   3240
gctgagcatt cagcttgaaa tgagcacggg tttccgcaaa tctttattcg accggtttac   3300
actaaaagac agggcggcga cgcaaaacga aacgttttac cgatttacaa agctgctgac   3360
agattttatt catgaaaact atgaagaaga cggaggggat ttcccctctg caaaaataaa   3420
acaccccctt caagtgaaaa aaggaggtgt ttcggcggtt gtgttaaccg ttggactctg   3480
aggtgccgcc gccggtgaat acggaaacga tggcgttcca cagagacaca aagaagtcga   3540
tcagtttttg aagaaagttt tgtccttctt cagaatccaa gaatttcgtg attttatcct   3600
ttgctttgtc aagctggtct ccaacctggt tccagtcgat attaatattt ttcatgttat   3660
taaataaaga tataagagag tttttctgat cttctgtgag tgtcacgcca agttcggaag   3720
cagccgaatc aatcgttttc tccaattcct cttttgactc gggaactccg tttttcgaga   3780
tttcttcctt gactttggcc atcagcgctg acgcgttttc actgccgatt ttctcgccaa   3840
gctctgaagt ggtgacaagc tcttcattcg cgaccttttt cacatcttcg gaaatttttt   3900
cgcccgaagt cgtttcatac gctttcatca atccggttaa agcggctgtg cc           3952
<210>49
<211>6837
<212>DNA
<213>质粒pMOL1642
<220>
<221>misc_feature
<222>(669)..(669)
<223>未知
<400>49
gatcttcctt caggttatga ccatctgtgc cagttcgtaa tgtctggtca actttccgac     60
tctgagaaac ttctggaatc gctagagaat ttctggaatg ggattcagga gtggacagaa    120
cgacacggat atatagtgga tgtgtcaaaa cgcataccat tttgaacgat gacctctaat    180
aattgttaat catgttggag ctcagtgaga gcgaagcgaa cacttgattt tttaattttc    240
tatcttttat aggtcattag agtatactta tttgtcctat aaactattta gcagcataat    300
agatttattg aataggtcat ttaagttgag catattagag gaggaaaatc ttggagaaat    360
atttgaagaa cccgaggatc catgctgtcc agactgtccg ctgtgtaaaa aataggaata    420
aaggggggtt gttattattt tactgatatg taaaatataa tttgtataag aaaatgagag    480
ggagaggaaa catgaagaag attgcaattg cggcgattac agcgacaagc gtgctggctc    540
tcagcgcatg cagcggggga gattctgagg ttgttgcgga aacaaaagct ggaaatatta    600
caaaagaaga cctttatcaa acattaaaag acaatgccgg agcggacgca ctgaacatgc    660
ttgttcagna aaaagtactc gatgataaat acgatgtctc cgacaaagaa atcgacaaaa    720
agctgaacga gtacaaaaaa tcaatgggtg accagctcaa ccagctcatt gaccaaaaag    780
gcgaagactt cgtcaaagaa cagatcaaat acgaacttct gatgcaaaaa gccgcaaagg    840
ataacataaa agtaaccgat gatgacgtaa aagaatatta tgacggcctg aaaggcaaaa    900
tccacttaag ccacattctt gtgaaagaaa agaaaacggc tgaagaagtt gagaaaaagc    960
tgaaaaaagg cgaaaaattc gaagaccttg caaaagagta ttcggtaccc gggtctagag   1020
tcgacgcggc cgcaaccatt tgatcaaagc ttgcatgcct gcaggtcgat tcacaaaaaa   1080
taggcacacg aaaaacaagt taagggatgc agtttatgca tcccttaact tacttattaa   1140
ataatttata gctattgaaa agagataaga attgttcaaa gctaatattg tttaaatcgt   1200
caattcctgc atgttttaag gaattgttaa attgattttt tgtaaatatt ttcttgtatt   1260
ctttgttaac ccatttcata acgaaataat tatacttttg tttatctttg tgtgatattc   1320
ttgatttttt tctacttaat ctgataagtg agctattcac tttaggttta ggatgaaaat   1380
attctcttgg aaccatactt aatatagaaa tatcaacttc tgccattaaa agtaatgcca   1440
atgagcgttt tgtatttaat aatcttttag caaacccgta ttccacgatt aaataaatct   1500
cattagctat actatcaaaa acaattttgc gtattatatc cgtacttatg ttataaggta   1560
tattaccata tattttatag gattggtttt taggaaattt aaactgcaat atatccttgt   1620
ttaaaacttg gaaattatcg tgatcaacaa gtttattttc tgtagttttg cataatttat   1680
ggtctatttc aatggcagtt acgaaattac acctctttac taattcaagg gtaaaatggc   1740
cttttcctga gccgatttca aagatattat catgttcatt taatcttata tttgtcatta   1800
ttttatctat attatgtttt gaagtaataa agttttgact gtgttttata tttttctcgt   1860
tcattataac cctctttaat ttggttatat gaattttgct tattaacgat tcattataac   1920
cacttatttt ttgtttggtt gataatgaac tgtgctgatt acaaaaatac taaaaatgcc   1980
catatttttt cctccttata aaattagtat aattatagca cgagctctga taaatatgaa   2040
catgatgagt gatcgttaaa tttatactgc aatcggatgc gattattgaa taaaagatat   2100
gagagattta tctaatttct tttttcttgt aaaaaaagaa agttcttaaa ggttttatag   2160
ttttggtcgt agagcacacg gtttaacgac ttaattacga agtaaataag tctagtgtgt   2220
tagactttat gaaatctata tacgtttata tatatttatt atccggaggt gtagcatgtc   2280
tcattcaatt ttgagggttg ccagagttaa aggatcaagt aatacaaacg ggatacaaag   2340
acataatcaa agagagaata aaaactataa taataaagac ataaatcatg aggaaacata   2400
taaaaattat gatttgatta acgcacaaaa tataaagtat aaagataaaa ttgatgaaac   2460
gattgatgag aattattcag ggaaacgtaa aattcggtca gatgcaattc gacatgtgga   2520
cggactggtt acaagtgata aagatttctt tgatgattta agcggagaag aaatagaacg   2580
attttttaaa gatagcttgg agtttctaga aaatgaatac ggtaaggaaa atatgctgta   2640
tgcgactgtc catctggatg aaagagtccc acatatgcac tttggttttg tccctttaac   2700
agaggacggg agattgtctg caaaagaaca gttaggcaac aagaaagact ttactcaatt   2760
acaagataga tttaatgagt atgtgaatga gaaaggttat gaacttgaaa gaggcacgtc   2820
caaagaggtt acagaacgag aacataaagc gatggatcag tacaagaaag atactgtatt   2880
tcataaacag gaactgcaag aagttaagga tgagttacag aaggcaaata agcagttaca   2940
gagtggaata gagcatatga ggtctacgaa accctttgat tatgaaaatg agcgtacagg   3000
tttgttctct ggacgtgaag agactggtag aaagatatta actgctgatg aatttgaacg   3060
cctgcaagaa acaatctctt ctgcagaacg gattgttgat gattacgaaa atattaagag   3120
cacagactat tacacagaaa atcaagaatt aaaaaaacgt agagagagtt tgaaagaagt   3180
agtgaataca tggaaagagg ggtatcacga aaaaagtaaa gaggttaata aattaaagcg   3240
agagaatgat agtttgaatg agcagttgaa tgtatcagag aaatttcaag ctagtacagt   3300
gactttatat cgtgctgcga gggcgaattt ccctgggttt gagaaagggt ttaataggct   3360
taaagagaaa ttctttaatg attccaaatt tgagcgtgtg ggacagttta tggatgttgt   3420
acaggataat gtccagaagg tcgatagaaa gcgtgagaaa cagcgtacag acgatttaga   3480
gatgtagagg tacttttatg ccgagaaaac tttttgcgtg tgacagtcct taaaatatac   3540
ttagagcgta agcgaaagta gtagcgacag ctattaactt tcggtttcaa agctctagga   3600
tttttaatgg acgcagcgca tcacacgcaa aaaggaaatt ggaataaatg cgaaatttga   3660
gatgttaatt aaagaccttt ttgaggtctt tttttcttag atttttgggg ttatttaggg   3720
gagaaaacat aggggggtac tacgacctcc cccctaggtg tccattgtcc attgtccaaa   3780
caaataaata aatattgggt ttttaatgtt aaaaggttgt tttttatgtt aaagtgaaaa   3840
aaacagatgt tgggaggtac agtgatggtt gtagatagaa aagaagagaa aaaagttgct   3900
gttactttaa gacttacaac agaagaaaat gagatattaa atagaatcaa agaaaaatat   3960
aatattagca aatcagatgc aaccggtatt ctaataaaaa aatatgcaaa ggaggaatac   4020
ggtgcatttt aaacaaaaaa agatagacag cactggcatg ctgcctatct atgactaaat   4080
tttgttaagt gtattagcac cgttattata tcatgagcga aaatgtaata aaagaaactg   4140
aaaacaagaa aaattcaaga ggacgtaatt ggacatttgt tttatatcca gaatcagcaa   4200
aagccgagtg gttagagtat ttaaaagagt tacacattca atttgtagtg tctccattac   4260
atgataggga tactgataca gaaggtagga tgaaaaaaga gcattatcat attctagtga   4320
tgtatgaggg taataaatct tatgaacaga taaaaataat tacagaagaa ttgaatgcga   4380
ctattccgca gattgcagga agtgtgaaag gtcttgtgag atatatgctt cacatggacg   4440
atcctaataa atttaaatat caaaaagaag atatgatagt ttatggcggt gtagatgttg   4500
atgaattatt aaagaaaaca acaacagata gatataaatt aattaaagaa atgattgagt   4560
ttattgatga acaaggaatc gtagaattta agagtttaat ggattatgca atgaagttta   4620
aatttgatga ttggttcccg cttttatgtg ataactcggc gtatgttatt caagaatata   4680
taaaatcaaa tcggtataaa tctgaccgat agattttgaa tttaggtgtc acaagacact   4740
cttttttcgc accagcgaaa actggtttaa gccgactgcg caaaagacat aatcgactct   4800
agaggatcct tttagtccag ctgatttcac tttttgcatt ctacaaactg cataactcat   4860
atgtaaatcg ctccttttta ggtggcacaa atgtgaggca ttttcgctct ttccggcaac   4920
cacttccaag taaagtataa cacactatac tttatattca taaagtgtgt gctctgcgag   4980
gctgtcggca gtgccgacca aaaccataaa acctttaaga cctttctttt ttttacgaga   5040
aaaaagaaac aaaaaaacct gccctctgcc acctcagcaa aggggggttt tgctctcgtg   5100
ctcgtttaaa aatcagcaag ggacaggtag tattttttga gaagatcact caaaaaatct   5160
ccacctttaa acccttgcca atttttattt tgtccgtttt gtctagctta ccgaaagcca   5220
gactcagcaa gaataaaatt tttattgtct ttcggttttc tagtgtaacg gacaaaacca   5280
ctcaaaataa aaaagataca agagaggtct ctcgtatctt ttattcagca atcgcgcccg   5340
attgctgaac agattaataa tgagccgcgg atatcgatgc cttgtcagag agattcctga   5400
agagcggcag gataaggtat ttagaatgat taatgtgctg atcttaattt tattgatctc   5460
atcattcatt gagatttcct ttacggtgta aagaaaaagg atagctgccg atcgtattga   5520
tccggcagct atccttttgt ttattagcat atccaagaag caccaataat aattaataag   5580
atgaacagca ccacaagcag cgcaaagccg ccagcgaaac ctcctgcata accgtcgccc   5640
atattgacac ctcctctgcc ccagtcgtta cattagtgta tgcacgaatg tcatgaaacg   5700
attaggctat cgtccaaaag aaaagaaccg cctgaaaaaa tgacggttct tttctcattt   5760
tctaaggttt tagtacagat aagctgcacc aacgatgatt aataaaatga acaacacgac   5820
caataaagca aaaccgcttg agtatcctcc gctcatgtta ttgacctcga attctgatca   5880
aatggttcag tgagagcgaa gcgaacactt gattttttaa ttttctatct tttataggtc   5940
attagagtat acttatttgt cctataaact atttagcagc ataatagatt tattgaatag   6000
gtcatttaag ttgagcatat tagaggagga aaatcttgga gaaatatttg aagaacccga   6060
acgcgtgagt agttcaacaa acgggccagt ttgttgaaga ttagatgcta taattgttat   6120
taaaaggatt gaaggatgct taggaagacg agttattaat agctgaataa gaacggtgct   6180
ctccaaatat tcttatttag aaaagcaaat ctaaaattat ctgaaaaggg aatgagaata   6240
gtgaatggac caataataat gactagagaa gaaagaatga agattgttca tgaaattaag   6300
gaacgaatat tggataaata tggggatgat gttaaggcta ttggtgttta tggctctctt   6360
ggtcgtcaga ctgatgggcc ctattcggat attgagatga tgtgtgtcat gtcaacagag   6420
gaagcagagt tcagccatga atggacaacc ggtgagtgga aggtggaagt gaattttgat   6480
agcgaagaga ttctactaga ttatgcatct caggtggaat cagattggcc gcttacacat   6540
ggtcaatttt tctctatttt gccgatttat gattcaggtg gatacttaga gaaagtgtat   6600
caaactgcta aatcggtaga agcccaaacg ttccacgatg cgatttgtgc ccttatcgta   6660
gaagagctgt ttgaatatgc aggcaaatgg cgtaatattc gtgtgcaagg accgacaaca   6720
tttctaccat ccttgactgt acaggtagca atggcaggtg ccatgttgat tggtctgcat   6780
catcgcatct gttatacgac gagcgcttcg gtcttaactg aagcagttaa gcaatca      6837
<210>50
<211>817
<212>DNA
<213>人工序列:repF表达盒
<400>50
gaattccggc ccaacgatgg ctgatttccg ggttgacggc cggcggaacc aaggggtgat     60
cggtcggcgg aaatgaaggc ctgcggcgag tgcgggcctt ctgttttgag gattataatc    120
agagtatatt gaaagtttcg cgatcttttc gtataattgt tttaggcata gtgcaatcga    180
taagcttgaa ttcggaggcc gttattatat catgagcgaa aatgtaataa aagaaactga    240
aaacaagaaa aattcaagag gacgtaattg gacatttgtt ttatatccag aatcagcaaa    300
agccgagtgg ttagagtatt taaaagagtt acacattcaa tttgtagtgt ctccattaca    360
tgatagggat actgatacag aaggtaggat gaaaaaagag cattatcata ttctagtgat    420
gtatgagggt aataaatctt atgaacagat aaaaataatt acagaagaat tgaatgcgac    480
tattccgcag attgcaggaa gtgtgaaagg tcttgtgaga tatatgcttc acatggacga   540
tcctaataaa tttaaatatc aaaaagaaga tatgatagtt tatggcggtg tagatgttga   600
tgaattatta aagaaaacaa caacagatag atataaatta attaaagaaa tgattgagtt   660
tattgatgaa caaggaatcg tagaatttaa gagtttaatg gattatgcaa tgaagtttaa   720
atttgatgat tggttcccgc ttttatgtga taactcggcg tatgttattc aagaatatat   780
aaaatcaaat cggtataaat ctgaccgata gggatcc                            817

Claims (21)

1.一种生产蛋白质的方法,该方法包括以下步骤:
a)培养细菌宿主细胞,该细胞包括编码所述蛋白质的基因的至少两个拷贝,所述拷贝已稳定整合到染色体的不同位置,其中至少一个DNA构建体被整合到该细菌宿主中不具备功能的条件性必需染色体基因上,其中该DNA构建体包括:
i)条件性必需基因的不具功能的拷贝;和
ii)编码该蛋白质的基因的至少一个拷贝,其位于不具备功能的拷贝和一个DNA片段之间,该DNA片段与染色体上邻接不具功能的条件性必需基因的DNA序列同源;
其中不具备功能的条件性必需基因与不具备功能的拷贝之间的第一次重组产生一个位于染色体上的功能性的条件性必需基因,并且其中该细菌宿主细胞在整合至少一个DNA构建体之前,就已经在染色体中具有目的基因的一个拷贝了;和
b)回收该蛋白质。
2.权利要求1的方法,其中该宿主细胞还包括至少一个附加的DNA构建体,该构建体被整合到该宿主细胞的至少一个不同的不具备功能的条件性必需染色体基因中。
3.权利要求1或2的方法,其中在所述DNA片段与邻接不具备功能性的条件性必需基因的DNA序列间进行第二次重组。
4.权利要求3的方法,所述DNA构建体还包括至少一个标记基因,该基因位于所述构建体上,这样其通过第二次重组而从染色体上除去。
5.权利要求4的方法,其中所述的至少一个标记基因赋予对抗生素的抗性,所述抗生素选自氯霉素,卡那霉素,氨苄青霉素,红霉素,壮观霉素和四环素。
6.权利要求1-5中任一项的方法,其中所述DNA构建体还在所述的不具备功能的拷贝和所述DNA片段间包括至少一个标记基因,并且其中至少一个标记基因位于解离酶所识别的核苷酸序列之间。
7.权利要求6的方法,其中至少一个标记基因通过解离酶从染色体上被切除。
8.权利要求1-7任一项的方法,其中宿主细胞中不具备功能的条件性必需染色体基因由于所述基因的部分缺失,或由于引入一或多个突变到所述基因中而不具备功能。
9.权利要求1-8任一项的方法,其中所述宿主细胞是芽孢杆菌属宿主细胞。
10.权利要求9的方法,其中所述宿主细胞是地衣芽孢杆菌宿主细胞。
11.一种生产细菌宿主细胞的方法,所述宿主细胞包括稳定整合到染色体不同位置的目的基因的至少两个拷贝,该方法包括以下步骤:
a)向该细菌宿主细胞中引入DNA构建体,其中该宿主细胞包括目的基因的至少一个染色体拷贝,以及一或多个不具备功能的条件性必需染色体基因,并且该DNA构建体包括:
i)条件性必需基因的不具功能的拷贝;和
ii)目的基因的至少一个拷贝,位于不具备功能的拷贝和一个DNA片段之间,该DNA片段与染色体上邻接不具功能的条件性必需基因的DNA序列同源;
其中不具备功能的条件性必需基因与不具备功能的拷贝之间的第一次重组在染色体上产生一个功能性的条件性必需基因,从而产生了一种细菌宿主细胞,该宿主细胞包括稳定整合到染色体不同位置的目的基因的至少两个拷贝。
12.权利要求11的方法,还包括将至少一个附加的DNA构建体整合到该宿主细胞的至少一个不同的不具备功能的条件性必需染色体基因中。
13.权利要求11或12的方法,还包括在所述DNA片段与邻接不具备功能的条件性必需基因的DNA序列间进行第二次重组。
14.权利要求11-13中任一项的方法,其中该DNA构建体还包括至少一个标记基因,该基因位于所述构建体上,这样其通过第二次重组而从染色体上除去。
15.权利要求14的方法,其中所述的至少一个标记基因赋予对抗生素的抗性,所述抗生素选自氯霉素,卡那霉素,氨苄青霉素,红霉素,壮观霉素和四环素。
16.权利要求11-15中任一项的方法,其中所述DNA构建体还在所述的不具备功能的拷贝和所述DNA片段间包括至少一个标记基因,并且其中至少一个标记基因位于解离酶所识别的核苷酸序列之间。
17.权利要求16的方法,还包括用解离酶从染色体上将所述的至少一个标记基因切除下来。
18.权利要求11-17任一项的方法,其中所述宿主细胞的不具备功能的条件性必需染色体基因由于所述基因的部分缺失,或由于引入一或多个突变到所述基因中而不具备功能。
19.权利要求11-18任一项的方法,其中所述宿主细胞是芽孢杆菌属宿主细胞。
20.权利要求19的方法,其中所述宿主细胞是地衣芽孢杆菌宿主细胞。
21.由权利要求11-20任一项的方法得到的宿主细胞。
CNB01811587XA 2000-06-23 2001-06-21 用于基因的稳定的染色体多拷贝整合的方法 Expired - Fee Related CN1322138C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DKPA200000981 2000-06-23
DKPA200000981 2000-06-23

Publications (2)

Publication Number Publication Date
CN1437656A CN1437656A (zh) 2003-08-20
CN1322138C true CN1322138C (zh) 2007-06-20

Family

ID=34178321

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB01811587XA Expired - Fee Related CN1322138C (zh) 2000-06-23 2001-06-21 用于基因的稳定的染色体多拷贝整合的方法

Country Status (2)

Country Link
CN (1) CN1322138C (zh)
DK (1) DK1297170T3 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106282219A (zh) * 2015-05-13 2017-01-04 青岛蔚蓝生物集团有限公司 一种稳定、高效的转化野生型克劳氏芽孢杆菌的方法
CN106191093B (zh) * 2016-09-18 2019-11-08 湖北工业大学 增强芽孢杆菌碱性条件下纤维素外切酶表达量的方法
CN106191013B (zh) * 2016-09-27 2019-11-08 湖北工业大学 温度、酸度控制纤维素酶在巨大芽孢杆菌中表达的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0185512A1 (en) * 1984-12-12 1986-06-25 Novo Nordisk A/S Method for stabilizing extra-chromosomal elements in bacteria during cultivation, extra-chromosomal elements, transformed bacteria and a method of producing a desired product in transformed bacteria
WO1999041358A1 (en) * 1998-02-12 1999-08-19 Novo Nordisk A/S A prokaryotic cell comprising two copies of a gene transcribed in different directions
EP0972838A1 (en) * 1998-07-15 2000-01-19 Roche Diagnostics GmbH Escherichia coli host/vector system based on antibiotic-free selection by complementation of an auxotrophy
CN1241635A (zh) * 1998-07-15 2000-01-19 罗奇戴格诺斯蒂克斯有限责任公司 新型的基于营养缺陷型互补的非抗生素筛选的大肠杆菌宿主/载体系统
CN1255166A (zh) * 1997-03-14 2000-05-31 艾德药品公司 将基因整合至哺乳动物细胞特定位点的方法及所用载体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0185512A1 (en) * 1984-12-12 1986-06-25 Novo Nordisk A/S Method for stabilizing extra-chromosomal elements in bacteria during cultivation, extra-chromosomal elements, transformed bacteria and a method of producing a desired product in transformed bacteria
CN1255166A (zh) * 1997-03-14 2000-05-31 艾德药品公司 将基因整合至哺乳动物细胞特定位点的方法及所用载体
WO1999041358A1 (en) * 1998-02-12 1999-08-19 Novo Nordisk A/S A prokaryotic cell comprising two copies of a gene transcribed in different directions
EP0972838A1 (en) * 1998-07-15 2000-01-19 Roche Diagnostics GmbH Escherichia coli host/vector system based on antibiotic-free selection by complementation of an auxotrophy
CN1241635A (zh) * 1998-07-15 2000-01-19 罗奇戴格诺斯蒂克斯有限责任公司 新型的基于营养缺陷型互补的非抗生素筛选的大肠杆菌宿主/载体系统

Also Published As

Publication number Publication date
CN1437656A (zh) 2003-08-20
DK1297170T3 (en) 2016-03-14

Similar Documents

Publication Publication Date Title
US6808896B2 (en) Method for stable chromosomal multi-copy integration of genes
Schulz et al. hrcA, the first gene of the Bacillus subtilis dnaK operon encodes a negative regulator of class I heat shock genes
US10280426B2 (en) Method for stable gene-amplification in a bacterial host cell
CN101495625B (zh) 地衣芽孢杆菌中的氯霉素抗性选择
JP4571304B2 (ja) バチルス細胞内でのポリペプチドの製法
CN101506367B (zh) Dna分子和方法
WO2003095658A1 (en) Homologous recombination into bacterium for the generation of polynucleotide libraries
AU2006349179A1 (en) Process for chromosomal integration and DNA sequence replacement in Clostridia
US5958728A (en) Methods for producing polypeptides in mutants of bacillus cells
WO1998022598A1 (en) Methods for producing polypeptides in surfactin mutants of bacillus cells
US20070172937A1 (en) Recombinant cells that highly express chromosomally-integrated heterologous genes
CN101978057B (zh) 修饰宿主dna中的对象区域的方法和选择性标记盒
CN1322138C (zh) 用于基因的稳定的染色体多拷贝整合的方法
WO2023117970A1 (en) Method for improved production of intracellular proteins in bacillus
US20130217097A1 (en) Cell with improved secretion mediated by mrga protein or homologue
US20220389459A1 (en) Selection marker free methods for modifying the genome of bacillus and compositions thereof
JPH09173070A (ja) プラスミド、プラスミド導入微生物、それらの製造法及び用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070620

Termination date: 20180621

CF01 Termination of patent right due to non-payment of annual fee