CN1902318A - 细菌宿主细胞中稳定地基因扩增的方法 - Google Patents

细菌宿主细胞中稳定地基因扩增的方法 Download PDF

Info

Publication number
CN1902318A
CN1902318A CNA2004800395994A CN200480039599A CN1902318A CN 1902318 A CN1902318 A CN 1902318A CN A2004800395994 A CNA2004800395994 A CN A2004800395994A CN 200480039599 A CN200480039599 A CN 200480039599A CN 1902318 A CN1902318 A CN 1902318A
Authority
CN
China
Prior art keywords
gene
cell
conditionality
bacillus
conditionality indispensable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004800395994A
Other languages
English (en)
Inventor
卡斯滕·奥尔森
迈克尔·D·拉斯马森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN1902318A publication Critical patent/CN1902318A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2468Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1) acting on beta-galactose-glycoside bonds, e.g. carrageenases (3.2.1.83; 3.2.1.157); beta-agarase (3.2.1.81)
    • C12N9/2471Beta-galactosidase (3.2.1.23), i.e. exo-(1-->4)-beta-D-galactanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y201/00Transferases transferring one-carbon groups (2.1)
    • C12Y201/01Methyltransferases (2.1.1)
    • C12Y201/010145-Methyltetrahydropteroyltriglutamate--homocysteine S-methyltransferase (2.1.1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01023Beta-galactosidase (3.2.1.23), i.e. exo-(1-->4)-beta-D-galactanase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

一种细菌宿主细胞,在其染色体中包含了一种扩增单位的至少两个拷贝,该扩增单位包括:i)目的基因的至少一个拷贝,和ii)可表达的条件性必需基因,该条件性必需基因或者没有启动子,或者由活性显著地低于该基因的内源启动子的异源启动子所转录,而且此条件性必需基因如果失去功能,将造成细胞针对至少一种特定物质的营养缺陷,或使细胞不能利用一种或多种特定的单一碳源;利用本发明的细胞生产蛋白质的方法,及构建本发明的细胞的方法。

Description

细菌宿主细胞中稳定地基因扩增的方法
发明领域
在生物技术产业中,人们期望构建在其染色体中具有稳定地整合了目标基因的多个拷贝,并不保留抗生素抗性标记基因的多肽生产菌株。
本发明涉及细菌宿主细胞,其基因组中包含了扩增单位的至少两个拷贝,该扩增单位包括:(1)目的基因的至少一个拷贝,和(2)可表达的条件性必需基因,此基因或者是无启动子的,或者是由活性显著低于此基因的内源启动子的异源启动子转录的,而且此基因如果失去功能,将造成细胞针对至少一种特定物质的营养缺陷,或者使该细胞无法利用一种或多种特定的单一碳源;本发明还涉及利用此细胞生产蛋白质的方法,以及构建此细胞的方法。
发明背景
在工业化的多肽生产中,尽可能地提高产品的产量是令人感兴趣的问题。提高产量的方法之一是提高编码目的多肽的基因的拷贝数。这可以通过将该基因置于高拷贝数的质粒中来实现,但质粒是不稳定的,而且如果在培养宿主细胞的过程中没有施加选择压力,质粒常常会丢失。另外一条提高目的基因的拷贝数的途径是将该基因的多个拷贝整合到宿主细胞的染色体中。
当前,关于工业应用重组DNA技术的公开争论,已引起了人们对于使用抗生素标记基因的疑问和关注。传统上,抗生素标记基因用于选择那些携带有该标记基因的多个拷贝,并同时携带有编码具工业价值的多肽的表达盒的多个拷贝的菌株。为了顺应当前对于不带抗生素标记的重组生产菌株的需求,我们寻找了现有技术的可能替代技术,这些技术允许使用非抗生素的标记基因来取代我们目前使用的抗生素标记。
WO 02/00907(Novozymes,丹麦)公开了一种将基因稳定地多拷贝地整合到生产用宿主细胞中染色体上明确的特定位点中的技术。根据其公开内容,首先通过使一个或更多的条件性必需基因失活使受体细胞产生缺陷,例如使此细胞成为针对某种氨基酸的营养缺陷。然后可以将目的基因与一段可弥补该细胞的所述缺陷的DNA序列共同整合入染色体,这样就使此细胞成为可以选择的。该发明公开的条件性必需基因标记是地衣芽孢杆菌(Bacillus licheniformis)的metC基因。
WO 01/90393(Novozymes,丹麦)公开了一种方法,用于通过基因扩增提高宿主细胞中基因拷贝数,而不在宿主细胞中残留抗生素抗性标记。此方法是基于使宿主细胞中一种特定的条件性必需染色体基因失去功能。在染色体中整合进了单个扩增单位,该单位包括目的基因和DNA序列,该序列整合到染色体中之后,能弥补染色体中失去功能的条件性必需基因。
为了提供不含抗生素抗性标记的重组生产菌株,寻找将基因稳定地多拷贝地整合到宿主细胞染色体的新方法在工业上仍然是有意义的。即使是现有方法的增益性的进步或者仅仅是替代性方法,也是具有相当的工业价值的。
发明概述
本发明要解决的问题是:提供备选的宿主细胞,这些细胞含有目的基因的多个拷贝并不含抗生素标记,用于在工业上高产量地生产多肽。
本发明的解决方案是基于观察到的如下事实:扩增单元可以整合到宿主细胞的染色体中并继而被扩增,而不需用到常规的抗生素标记,抗生素,或内源产生的抑制性化合物。
在传统的扩增程序中,基因表达的提高是抗生素抗性标记基因复制的结果,这些复制是经过分步的培养和选择过程,通过在每一培养步骤中向培养基添加逐渐增多的抗生素化合物而选择到的。
营养缺陷的细胞,例如由于某个条件性必需基因丧失功能而形成的营养缺陷细胞,在一般情况下,只要该基因的一个单功能性拷贝整合(或恢复)到其染色体中,都能够回复为原养型的表型。由于一般只需要一个拷贝就足够了,所以这类基因以往并没有被当作值得注意的候选扩增对象。
然而,本发明人通过降低启动子的活性降低了某个非抗生素抗性的条件性必需基因的表达水平,使得对于缺陷型的宿主细胞而言,具有该基因的一个以上的拷贝数更为有利。当含有这样的低表达水平的条件性必需基因的扩增单位被整合到缺失了该基因的宿主细胞中时,将可重复性地发生被整合的扩增单位的基因复制,这与使用传统的可扩增抗生素抗性标记时所观察到的情形有可比性(comparable)。
事实上,本发明提供了控制宿主细胞中的基因表达水平,即拷贝数的方法。根据表达单位中包括的目的基因的所需要的表达水平,可以通过仔细选择此扩增单位中表达条件性必需标记基因的外源启动子的强度,来上调或者下调该扩增单位的最佳拷贝数。
据此,本发明的第一方面涉及一种细菌宿主细胞,其基因组含有扩增单位的至少两个拷贝,此扩增单位包含:
i)目的基因的至少一个拷贝,及
ii)可表达的条件性必需基因(expressible conditionally essentialgene),该基因或是无启动子的(promoterless),或是由活性显著(substantially)低于该基因的内源启动子的异源启动子转录的,且
如果此条件性必需基因失去功能,则造成该细胞针对至少一种特定物质的营养缺陷,或使其不能利用一种或多种特定的单一碳源。
本发明的第二方面涉及一种产生目标基因所编码的蛋白质的方法,该方法包括
a)培养细菌宿主细胞,该细胞的基因组中含有扩增单位的至少两个复制的拷贝,此扩增单位包括:
i)目的基因的至少一个拷贝,及
ii)可表达的条件性必需基因,该基因或是无启动子的,或是由活性显著低于该基因的内源启动子的异源启动子转录的,且
如果此条件性必需基因失去功能,则造成该细胞针对至少一种特定物质的营养缺陷,或使其不能利用一种或多种特定的单一碳源。和
b)回收上述蛋白。
本发明的最后一方面还涉及一种方法,用来产生中含有目的基因的两个及以上的扩增的染色体拷贝的细菌细胞,该方法包括
a)提供细菌宿主细胞,该细胞中含有扩增单位的至少一个拷贝,此扩增单位包括:
i)目的基因的至少一个拷贝,及
ii)条件性必需基因的可表达的功能性拷贝,该基因或是无启动子的,或是由活性显著低于该基因的内源启动子的异源启动子转录的,且
如果此条件性必需基因失去功能,则造成该细胞针对至少一种特定物质的营养缺陷,或使其不能利用一种或多种特定的单一碳源,和
b)在适合生长的条件下,在缺少所述至少一种特定物质和/或含有所述一种或多种特定的单一碳源的培养基中培养这种细胞,从而使那些在染色体中发生了该扩增单位复制的细胞具有生长优势。
c)选择在其染色体中扩增单位已被复制的细胞,从而获得目的基因的两个及以上的扩增的染色体拷贝。
我们预料,在此列出的本发明的细胞的所有优选实施方案都将适用于本发明第二和第三方面的方法。
定义
根据本发明,可能用到属于现有技术范围的分子生物学,微生物学和重组DNA技术,这些技术在文献中已得到充分描述。请参考:Sambrook,Fritsch & Maniatis,Molecular Cloning:A Laboratory Manual,Second Edition(1989)Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NewYork(此处为“Sambrook et al.,1989”);DNA Cloning:A PracticalApproach,Volumes I and II/D.N.Glover ed.1985);Oligonucleotide Synthesis(M.J.Gait ed.1984);Nucleic Acid Hybridization(B.D.Hames & S.J.Higginseds(1985));Transcription And Translation(B.D.Hames & S.J.Higgins,eds.(1984));Animal Cell Culture(R.I.Freshney,ed.(1986));ImmobilizedCells And Enzymes(IRL Press,(1986));B.Perbal,A Practical Guide ToMolecular Cloning(1984);等等。
“多核苷酸”是指脱氧核苷酸或核糖核苷酸碱的单链或双链的多聚物,其按5’端到3’端的顺序阅读;多核苷酸包括RNA和DNA,其可以从自然来源中分离,或体外合成,或通过将天然分子和合成分子组合来制备。
“核酸分子”或“核苷酸序列”是指核糖核苷(腺嘌呤核苷,鸟嘌呤核苷,尿嘧啶核苷或胞嘧啶核苷,“RNA分子”)或脱氧核糖核苷(脱氧腺嘌呤核苷,脱氧鸟嘌呤核苷,脱氧胸腺嘧啶核苷或脱氧胞嘧啶核苷,“DNA分子”)的磷酸酯的多聚物形式,其可以是单链,也可以是双链螺旋。DNA-DNA,DNA-RNA和RNA-RNA都可能形成螺旋。术语“核酸分子”,特别地,DNA或RNA分子,只指该分子的一级和二级结构,而并不将其限定于任何特定的三级或四级结构。因此,此术语可以指存在于例如线性或环状DNA分子(如限制性片断),质粒,或者染色体中的双链DNA分子。在对于特定的双链DNA分子的结构的讨论中,描述DNA的序列时,本文可能依照惯例,只给出该DNA非转录链(即具有和mRNA同源的序列的那条链)的从5’端到3’端的序列。“重组DNA分子”是指经受了分子生物学操作的DNA分子。
核酸分子与另一个核酸分子(例如cDNA,基因组DNA或者RNA)“可以杂交”(hybridizable),是指一个核酸分子的单链形式可以在合适的温度和溶液离子强度条件下与另一个核酸分子退火(参见前文Sambrook et.al)。温度和离子强度条件决定了杂交反应的“严紧度”。
DNA“编码序列”或“开放阅读框”是指DNA序列,当其在体内或体外的细胞中被置于合适的调节序列的调控之下时,会被转录并翻译成多肽。编码序列的边界由5’(氨基)端的起始密码子和3’(羧基)端的翻译终止密码子来确定。编码序列可以包含但不限于:原核序列,来源于真核mRNA的cDNA,来源于真核(例如哺乳动物的)DNA的基因组DNA序列,乃至合成的DNA序列。如果编码序列是用于在真核细胞中表达的,其3’一侧通常会具有聚腺苷酸化信号和转录终止序列。
表达载体是指线性或者环状的DNA分子,其包含编码目的多肽的片段,此片段可操作性地连接到帮助其转录的附加片段,这些附加片段可包括启动子及终止子序列,以及可选的一个或多个复制起点,一个或多个可选择标记,增强子,聚腺苷酸化信号等等。表达载体一般来源于细菌或者病毒DNA,还可能同时含有以上二者的元件。
转录和翻译调控序列是指细胞中为编码序列的表达服务的DNA调节序列,例如启动子,增强子,终止子等。在真核细胞中,聚腺苷酸化信号属于调控序列。
“分泌信号序列”是指DNA序列,其编码多肽(“分泌肽”),其是更大的多肽的一部分,并引导该大多肽在合成此大多肽的细胞中经历分泌途径。此大多肽在此分泌途径中转运时,通常受到切割而去掉其分泌肽。
术语“启动子”在此处使用其在相关技术领域中公认的意义,即指基因的一部分,其含有用于RNA聚合酶结合及转录起始的DNA序列。启动子通常但并不总是存在于基因的5’非编码区。
当染色体基因所编码的多肽不再能表达为有功能的形式时,就称此基因失去了功能。相关技术领域中有多种已知方法可以诱导基因的功能丧失,Sambrook et al.(参见前文)中描述了其中一些方法。基因的开放阅读框中的如部分缺失和突变都经常造成基因失去功能。
术语“染色体基因的可表达拷贝”在本文中用于表示某个染色体基因的开放阅读框的一个拷贝,此开放阅读框可以表达产生具有完全功能的基因产物。此可表达拷贝可能并非由染色体基因天然的启动子转录,而是由一外来的或异源的启动子转录,或者可能不含启动子,而只是由于其开放阅读框5’端上游的某个基因发生转录通读而得以表达。这里,转录通读(read-through)的含义与相关技术领域中普遍接受的含义相同。
“可操作性地连接”在指DNA片段时,指多个DNA片段排列成某种方式,以使其协调一致地行使功能来实现某个预定目的。例如,转录自启动子起始,贯通编码片段,直至终止子。
某个编码序列受转录和翻译控制序列的“调控”,是指RNA聚合酶将此编码序列转录成mRNA,mRNA再经过转录后剪接和翻译成为该编码序列所编码的蛋白。
“异源”DNA是指天然情况下在细胞中不存在,或者在细胞中的某个染色体位点中不存在的DNA。较优选地,异源DNA包括对细胞而言外来的基因。
本文所用的“核酸构建体”是指任何来源于cDNA,基因组DNA,合成DNA或RNA的核酸分子。“构建体”是指可以为单链或双链的核酸片段,其可以基于一段编码目的多肽的,完全天然或部分天然存在的核苷酸序列。此构建体还可选地含有其他核酸片段。
编码本发明的多肽的本发明的核酸构建体可以适当地来自基因组或者cDNA源,例如由以下手段得到:构建基因组或者cDNA文库,再根据标准技术(参见前文Sambrook et al.)利用合成的寡核苷酸探针进行杂交,来筛选编码该多肽的全体或部分的DNA序列。
编码该多肽的本发明的核酸构建体还可以由已确立的标准方法来合成得到,例如Beaucage and Caruthers,Tetrahedron Letters 22(1981),1859-1869描述的亚磷酰胺(phosphoamidite)法,或Matthes et al.,EMBO Journal 3(1984),801-805描述的方法。根据亚磷酰胺(phosphoamidite)法,寡核苷酸在例如自动DNA合成仪中合成,经过纯化,退火,连接,克隆进合适的载体。
进一步地,此核酸构建体可以为混合的合成和基因组来源,混合的和cDNA来源,或混合的基因组和cDNA来源,这是根据标准方法,适当选择来源于合成、基因组或cDNA的片断,对应于整个核酸构建体的不同部分将其连接各个片断而制备得到的。此核酸构建体还可以通过使用特定引物由聚合酶链式反应制得,例如US 4,683,202或Saiki et al.,Science 239(1988),487-491所描述的。
当核酸构建体含有本发明的编码序列的表达所必需的调控序列时,术语“核酸构建体”可与术语“表达盒”(expression cassette)同义。
术语“调控序列”在此定义为,包括一切对核酸序列的编码序列的表达是必需或者有利的元件。每一调控序列对于编码多肽核酸序列的核酸序列而言可以是固有的也可以是外来的。这样的调控序列可以包括但不限于,前导序列,聚腺苷酸化序列,前肽序列,启动子,信号序列及转录终止子。调控序列至少包括启动子和转录及翻译的终止信号。调控序列可能加有接头以引入特定的限制性位点,以便于将调控序列和编码多肽的核酸序列的编码区连接起来。
调控序列可以是合适的启动子序列,即为宿主细胞所识别的用于核酸序列表达的核酸序列。启动子序列包含介导多肽的表达的转录和翻译调控序列。启动子可以是所选宿主细胞中任何显示出转录活性的核酸序列,从与宿主细胞同源或异源的胞内或胞间的多肽的编码基因中都可以获得启动子。
调控序列也可以是合适的转录终止子序列,即为宿主细胞所识别以终止转录的序列。调控序列可操作性地连接到编码多肽的核酸序列的3’端。在本发明中可能用到任何在所选宿主细胞中有功能的终止子。
调控序列还可以是聚腺苷酸化序列,此序列可操作性地连接到核酸序列的3’端,经过转录后为宿主细胞所识别,作为向转录后的mRNA添加聚腺苷(polyadesine)残基的信号。本发明中可能用到任何在所选宿主细胞中有功能的聚腺苷酸化序列。
调控序列还可以是信号肽编码区,其编码一段氨基酸序列,此序列连接到多肽的氨基端并引导表达后的多肽进入宿主细胞的细胞分泌途径。核酸序列的编码序列的5’端可能包含固有的信号肽编码区,此信号肽编码区天然地与编码区中编码分泌性多肽的片段连接并与之处于同一阅读框中。另一情况下,核酸序列的编码序列的5’端可能包含相对编码序列中编码分泌性多肽的部分是外来的信号肽编码区。若该编码序列在通常情况下不含有信号肽编码区,则可能需要外来的信号肽编码区。另一情况下,为了获得与使用编码序列通常相关的天然信号肽编码区相比更高的酶分泌,可以简单用外来的信号肽编码区替代天然的信号肽编码区。信号肽编码序列可以得自曲霉属(Aspergillus)某些种的葡糖淀粉酶或淀粉酶基因,根毛霉属(Rhizomucor)某些种的脂肪酶或蛋白酶基因,酿酒酵母(Saccharomycescerevisiae)的α因子基因,芽孢杆菌属(Bacillus)某些种的淀粉酶或蛋白酶基因,或小牛前凝乳酶原(calf preprochymosin)基因。但是,任何能够在所选宿主细胞中引导表达后的多肽进入分泌途径的信号肽编码区在本发明中都可能用到。
调控序列还可以是前肽编码区,其编码位于多肽的氨基端的一段氨基酸序列。这样的多肽称为酶原(proenzyme)或多肽原,(有时也称为酶原(zymogen))。多肽原一般没有活性,通过催化或自身催化裂解其前肽后,可转化为有活性的成熟多肽。前肽编码区可以得自枯草芽孢杆菌(Bacillussubtilis)碱性蛋白酶基因(aprE),枯草芽孢杆菌(Bacillus sybtilis)中性蛋白酶基因(nprT),酿酒酵母(Saccharomyces cerevisiae)α因子基因,或嗜热毁丝霉(Myceliophthora thermophilum)漆酶基因(WO 95/33836)。
加入某些允许相应于宿主细胞的生长来调节多肽表达的调节序列,可能也是有益的。某些调节系统使得基因的表达响应于某个物理和化学的刺激因素,例如某种调节性化合物的存在,而打开或关闭。原核系统中的调节系统包括lac,tac,和trp操纵基因系统。在酵母中可以使用ADH2系统和GAL1系统。在丝状真菌中,TAKAα-淀粉酶启动子,黑曲霉(Aspergillusniger)葡糖淀粉酶启动子,和米曲霉(Aspergillus oryzae)葡糖淀粉酶启动子都可以用作调节序列。调节序列还包括用于基因扩增的序列。在真核系统中,这样的序列包括二氢叶酸还原酶基因,其在氨甲蝶呤存在下扩增;和金属硫蛋白基因,其在重金属存在下扩增。在这些情况下,编码多肽的核酸序列可能和调节序列串联。
适于引导本发明的条件性必需基因的转录,尤其是在细菌宿主细胞中的转录的启动子可以来自于大肠杆菌(E.coli)lac操纵子,天蓝色链霉菌(Streptomyces coelicolor)琼脂水解酶基因(dagA),枯草芽孢杆菌(Bacillussubtilis)蔗糖6-果糖基转移酶基因(sacB),枯草芽孢杆菌(Bacillus subtilis)碱性蛋白酶基因,地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL),嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)生麦芽糖淀粉酶基因(amyM),解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因,(amyQ),解淀粉芽孢杆菌(Bacillus amylolipuefaciens)BAN淀粉酶基因,地衣芽孢杆菌(Bacillus licheniformis)青霉素酶基因(penP),枯草芽孢杆菌(Bacillus subtilis)xylA及xylB基因,原核的β内酰胺酶基因(Villa-Kamaroff et al.,1978,Proceedings of the National Academy ofSciences USA 75:3727-3731),及tac启动子(DeBoer et al.,1983,Proceedings of the National Academy of Sciences USA 80:21-25)。在“Usefulproteins from recombinant bacteria”(Scientific Ametican,1980,242:74-94)和Sambrook et al.,1989(见前文)中描述了更多的启动子。
术语“营养缺陷”(auxotrophic)在本文中表示营养缺陷的细胞必须获得至少一种特定的物质用于其生长和新陈代谢,而此物质是其亲代生物自身可以合成的。此术语用于指那些由于发生了突变性改变而不再能合成此物质的生物,例如细菌菌株。
对于细菌宿主细胞有效的信号肽编码区可以来自芽孢杆菌NCIB 11837(Bacillus NCIB 11837)的生麦芽糖淀粉酶基因,嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)α-淀粉酶基因,地衣芽孢杆菌(Bacillus licheniformis)的枯草杆菌蛋白酶基因,地衣芽孢杆菌(Bacillus licheniformis)的β内酰胺酶基因,嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)中性蛋白酶基因(nprT,nprS,nprM)和枯草芽孢杆菌(Bacillus subtilis)PrsA基因。在Simonen and Palva,1993,Microbiological Reviews 57:109-137中描述了更多的信号肽。
本发明还涉及包含本发明的核酸序列、启动子及转录和翻译终止信号的重组表达载体。可以将上文描述的各种核酸和调控序列连接起来形成重组表达载体,此载体可含有一个或多个方便的限制性位点,以便于在这些位点插入或者置换编码多肽的核酸序列。或者,可以将本发明的核酸序列或包含此序列的核酸构建体插入合适的用于表达的载体,从而表达此序列。在创建表达载体时,编码序列在载体中的定位使得该序列可操作性地连接于用于表达的调控序列,及可能用于分泌的调控序列。
重组表达载体可以是任何能够方便地对其执行重组DNA操作,并能导致核酸序列表达的载体(例如质粒或病毒)。载体的选择通常取决于载体与其将要转入的宿主细胞之间的相容性。载体可以是线性或者闭环的质粒。载体可以是:自主复制的载体,即作为染色体外的实体存在并独立于染色体复制的载体,例如质粒;染色体外元件;微型染色体;或人工染色体。载体可以包含任何用于确保自我复制的要素。或者,载体也可以在导入宿主细胞以后整合到基因组中,并伴随其整合入的染色体共同复制。载体系统可以是单独的载体或质粒,也可以是两个或更多的载体或质粒,这多个载体或质粒共同容纳要导入宿主细胞基因组的整个DNA或者转座子。
本发明的载体优选地包含一个或更多可选择的标记以便于选择被转化的细胞。可选择的标记是指一种基因,其表达产物有助于产生针对杀微生物剂或病毒的抗性,针对重金属的抗性,营养缺陷型向原养型的转化,等等。
抗生素选择标记赋予针对抗生素例如青霉素、卡那霉素、氯霉素、四环素、新霉素、潮霉素和氨甲蝶呤等的抗性。适用于酵母宿主细胞的标记有ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。
本发明的载体优选地含有元件,该元件使载体或其较小部分可以稳定整合到宿主细胞基因组中,或者使细胞中的载体可以独立于宿主细胞基因组而自主复制。
载体,或其较小的部分如本发明的扩增单位,在导入宿主细胞后,可能整合到宿主细胞的基因组中。对于染色体整合,载体可能依靠编码多肽的核酸序列或该载体的任何其他元件,通过同源或非同源重组,来将自身稳定地整合到基因组中。
或者,该载体可以包括用于引导借助同源重组整合进入宿主细胞基因组的附加核酸序列。这些附加的核酸序列使载体能够整合到宿主细胞基因组染色体上的精确位置。为了提高整合到精确位置的可能性,整合元件优选地应含有足够数量的核酸,例如100到1500个碱基,较优为400到1500个碱基,最优为800到1500个碱基,这些核酸与相应的目标序列高度同源,以提高同源重组的可能性。整合元件可以是任何与宿主细胞基因组中的目标序列同源的序列。此外,整合元件可以是非编码的或者编码的核酸序列;WO 02/00907(Novozymes,丹麦)具体举出了若干适用于借助同源重组的位点特异性整合的编码序列,此处引入其全文作为参考。
另一方面,载体也可以借助非同源重组整合进宿主细胞的基因组。这些核酸序列可以是任何与宿主细胞基因组中的目标序列同源的序列,而且,其可以是非编码或编码序列。拷贝数(载体的,表达盒的,扩增单位的,基因的或实际上任何确定的核苷酸序列的拷贝数)是指在任何时刻下某个宿主细胞中存在的相同的拷贝的数目。基因或确定的染色体核苷酸序列在染色体上可能有一个、两个或更多的拷贝。自主复制的载体在每个细胞中可以有一个或者数百个拷贝。
本发明的扩增单位是指核苷酸序列,其能够整合到宿主细胞的基因组,然后可通过重复扩增过程来增加其染色体中整合的拷贝数。该扩增单位包含如本文定义的表达盒,此表达盒包含目的基因的至少一个拷贝和宿主细胞的染色体基因的如本文所定义的可表达拷贝。当此扩增单位整合到宿主细胞的染色体中后,它就表示染色体上的那个特定区域。此区域容易由于DNA的两个直接重复的区域之间发生同源重组而被复制。扩增单位相对于其侧翼的DNA序列的精确界线是从功能意义上确定的:复制过程可能实际上会复制部分被引入染色体的DNA和部分内源染色体,这取决于重复区域中发生同源重组的确切位置。Janni ére et al.(1985,Stable geneamplification in the chromosome of Bacillus subtilis.Gene,40:47-55)阐明了这个原理,此处引入其全文作为参考。
为实现自主复制,载体还可进一步包括复制起点,其使得该载体可以在所讨论的宿主细胞中自主复制。细菌的复制起点包括例如pBR322、pUC19、pACYC177、pACYC184、pUB110、pE194、pTA1060和pAMbetal等质粒的复制起点。酵母宿主细胞中使用的复制起点有2micron复制起点(2micron origin of replication),CEN6和ARS4的结合,以及CEN3和ARS1的结合。复制起点可以含有某种突变,造成其在宿主细胞中的功能行使对温度敏感。(参考例如Ehrlich,1978,Proceedings of the NationalAcademy of Sciences USA 75:1433)。
本发明还涉及含有本发明的核酸序列的重组宿主细胞,这些细胞适用于重组生产多肽。术语“宿主细胞”包括所有在复制中发生了突变从而与亲代细胞不完全相同的子代细胞。
优选地使用含有本发明的核酸序列的载体来转化细胞,然后使此载体整合到宿主细胞的染色体中。“转化”指将含有本发明的核酸序列的载体导入到宿主细胞中,使得该载体作为染色体整合体(chromosomal integrant)或者自主复制的染色体外载体而被保持。一般认为整合是更有利的,因为这样核酸序列更有可能在细胞中稳定保持。整合可能如前所述借助同源或者非同源重组而发生。
细菌细胞的转化可以通过例如下列手段来实现:原生质体转化(参考例如Chang and Cohen,1979,Molecular General Genetics 168:111-115),使用感受态细胞(参考例如Young and Spizizin,1961,Journal ofBacteriology 81:823-829,或Dubnar and Davidoff-Abelson,1971,Journalof Molecular Biology 56:209-221),电穿孔(参考例如Shigekawa and Dower,1988,Biotechniques 6:742-751),或接合(参考例如Koehler and Thorne,1987,Journal of Bacteriology 169:5771-5278)。
如上描述的转化或转染后的宿主细胞可以在合适的营养培养基中,在允许目标多肽表达的条件下培养,然后从细胞中或者培养液中回收由此产生的多肽。
用于培养细胞的培养基可以是任何适于宿主细胞生长的常规培养基,例如含有合适补充物的基本培养基或者复合培养基。合适的培养基可以得自供货商,也可以根据公开的配方(例如美国典型培养物保藏中心的目录所载)来制备。培养基的制备采用现有技术已知的步骤。(参考例如referencesfor bacteria and yeast;Bennett,J.W.and LaSure,L.,editors,More GeneManipulations in Fungi,Academic Press,CA,1991)。
如果多肽被分泌到营养培养基中,则其可直接从培养基回收。如果其不被分泌,则从细胞裂解物回收。使用常规步骤来从培养基回收多肽,包括:利用离心或者过滤将宿主细胞和培养基分离;利用盐,例如硫酸铵,来沉淀上清或滤液中的蛋白组分;根据目标多肽的类型,采用多种层析手段来纯化,例如离子交换层析,凝胶过滤层析,亲和层析等等。
可以利用现有技术已知的对多肽具有特异性的方法来检测多肽。这些检测方法包括异性的抗体的使用,酶产物的生成,或者酶底物的消失。例如,酶测定可以用来确定多肽的活性。
本发明的多肽的纯化可以利用现有技术已知的多种手段,包括但不限于:层析(例如离子交换,亲和,疏水,层析聚焦及体积排阻);电泳手段(例如制备型等电聚焦(IEF));溶解度差异(例如硫酸铵沉淀);或萃取(extraction)(参考例如Protein Purification,J.-C.Janson and Lars Ryden,editors,VCH Publishers,New York,1989)。
发明详述
本发明的第一方面提供了一种细菌宿主细胞,其基因组中含有扩增单位的至少两个拷贝,该扩增单位包括:
i)目的基因的至少一个拷贝,及
ii)可表达的条件性必需基因,该基因或是无启动子的,或是由活性显著低于该基因的内源启动子的异源启动子转录的,且
如果此条件性必需基因失去功能,则造成该细胞成为针对至少一种特定物质的营养缺陷,或使其不能利用一种或多种特定的单一碳源。
对宿主细胞的选择较大程度上取决于编码多肽的基因和此基因的来源。宿主细胞可以是单细胞生物例如原核生物,也可以是非单细胞生物例如真核生物。有用的单细胞生物细胞为细菌细胞,例如革兰氏阳性细菌,包括但不限于:芽孢杆菌属(Bacillus)的细胞,例如嗜碱芽孢杆菌(Bacillusalkalophilus),解淀粉芽孢杆菌(Bacillus amyloliquefaciens),短芽孢杆菌(Bacillus brevis),环状芽孢杆菌(Bacillus circulans),凝结芽孢杆菌(Bacilluscoagulans),灿烂芽胞杆菌(Bacillus lautus),缓慢芽孢杆菌(Bacillus lentus),地衣芽孢杆菌(Bacillus licheniformis),巨大芽孢杆菌(Bacillus megaterium),嗜热脂肪芽胞杆菌(Bacillus stearothermophilus),枯草芽孢杆菌(Bacillussubtilis)及苏云金芽孢杆菌(Bacillus thuringiensis);或者为链霉菌属(Streptomyces)的细胞,例如变青链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus);还可以是革兰氏阴性细菌,例如大肠杆菌(E.coli)和假单孢菌属的某些种(Pseudomonas sp.)。在一优选的实施方案中,细菌宿主细胞为缓慢芽孢杆菌(Bacillus lentus),地衣芽孢杆菌(Bacilluslicheniformis),嗜热脂肪芽胞杆菌(Bacillus stearothermophilus)或枯草芽孢杆菌(Bacillus subtilis)细胞。在一优选的实施方案中,细菌宿主细胞是原核细胞,较优地为革兰氏阳性的原核细胞,更优选地,该原核细胞为芽孢杆菌属(Bacillus)的某个种,优选地选自下列组合:嗜碱芽孢杆菌(Bacillusalkalophilus),解淀粉芽孢杆菌(Bacillus amyloliquefaciens),短芽孢杆菌(Bacillus brevis),环状芽孢杆菌(Bacillus circulans),凝结芽孢杆菌(Bacillus coagulans),灿烂芽胞杆菌(Bacillus lautus),缓慢芽孢杆菌(Bacillus lentus),地衣芽孢杆菌(Bacillus licheniformis),巨大芽孢杆菌(Bacillus megaterium),嗜热脂肪芽胞杆菌(Bacillus stearothermophilus),枯草芽孢杆菌(Bacillus subtilis)及苏云金芽孢杆菌(Bacillus thuringiensis)。
如上所述,可以通过若干方法将载体或其一较小部分例如本发明的扩增单位整合到宿主细胞的基因组中。此处提供通过同源重组的整合的非限定性实例。
本发明的优选的实施方案涉及一种本发明的细胞,或者本发明的方法,其中所述扩增单位还含有核苷酸序列,其与宿主细胞的染色体序列具有足够的同源性以使其能够通过同源重组整合进入宿主细胞染色体,优选地,扩增单位还含有至少100bp,较优地为至少200bp,更优选地为至少300bp,更优选地为至少400bp,最优选地为至少500bp的核苷酸序列,此序列与宿主细胞的染色体核苷酸序列具有至少70%,较优地为至少80%,更优选地为至少90%,更优选地为至少95%,最优选地为至少98%的同一性。
在一个非限定性的实例中,进入宿主细胞染色体的整合可以通过下列手段选择到:首先用本文中他处描述的方式使条件性必需的宿主基因失去功能,从而使得宿主细胞可以被选择;然后以载体的整合为目标,在载体中引入同一宿主基因的同样的无功能拷贝,此拷贝具有一定长度,以允许分别位于载体上的和基因组中的宿主基因的两个不同的无功能拷贝之间发生同源重组,此拷贝还被设计为如果发生上述同源重组,则会恢复产生该宿主基因的功能性拷贝。从而使得宿主细胞可以被选择。或者,载体可以直接含有上述条件性必需基因的功能性拷贝,以选择在基因组中任何位置发生的整合。
本发明优选的实施方案涉及本发明的细胞,其中通过与部分缺失条件性必需基因的同源重组,第一扩增单位整合入宿主细胞染色体并使得基因具有功能。
本发明的优选的实施方案涉及一种本发明的细胞,在其中目的基因编码目的多肽,优选地,此多肽为酶,例如蛋白酶,纤维素酶,脂肪酶,木聚糖酶,磷脂酶,或较优地为淀粉酶。
本发明的另一个优选的实施方案涉及一种本发明的细胞,在其中所述多肽为激素,激素原,前激素原,小肽,受体,或者神经肽。
本发明的另一个优选的实施方案涉及一种本发明的细胞,在其中目的基因编码酶,优选地为淀粉分解酶,脂肪分解酶,蛋白分解酶,纤维素分解酶,氧化还原酶或者植物细胞壁降解酶,更优选地为一种具有选自下列的酶活性的酶:氨肽酶,淀粉酶,淀粉葡萄糖苷酶,糖酶,羧肽酶,过氧化氢酶,纤维素酶,几丁质酶,角质酶,环糊精葡萄糖基转移酶,脱氧核糖核酸酶,酯酶,半乳糖苷酶,β-半乳糖苷酶,葡糖淀粉酶,葡萄糖氧化酶,葡萄糖苷酶,卤素过氧化物酶(haloperoxidase),半纤维素酶,转化酶,异构酶,漆酶,连接酶,脂肪酶,裂合酶,甘露糖苷酶,氧化酶,果胶酶,过氧化物酶,植酸酶,酚氧化酶,多酚氧化酶,蛋白酶,核糖核酸酶,转移酶,谷氨酰胺转移酶,或木聚糖酶。
本发明的另一个优选的实施方案涉及一种本发明的细胞,在其中目的基因编码抗微生物肽,优选地为抗真菌或抗细菌肽;或编码在人体内有生物学功能的肽,优选地为具药学活性的肽,更优选地为胰岛素/胰岛素原/前胰岛素原或其变体;生长激素或其变体,或凝血因子VII或VIII或其变体。
条件性必需基因已在文献中得到充分描述。例如,细胞合成一种或多种氨基酸时所需的某些基因,细胞中某种氨基酸的合成所必需的某个多肽的编码基因失去功能后,将使细胞成为针对此氨基酸的营养缺陷,且此细胞将只能在添加了该氨基酸的培养基中生长。如果该基因的功能恢复,或者通过提供外源的该基因的功能性拷贝而被弥补,将使细胞能够自己合成此氨基酸,由此该细胞可以从营养缺陷的细胞的背景中选择出来。
因此,本发明的一个优选的实施方案涉及本发明第一方面的细胞,在其中宿主细胞的条件性必需的染色体基因编码一种或多种参与氨基酸合成的多肽;该基因的内源形式如果失去功能将造成细胞针对一种或多种氨基酸的营养缺陷,而该基因的功能如果恢复将使细胞变为针对上述氨基酸的原养型。
枯草芽孢杆菌(Bacillus subtilis)metE基因编码S-腺苷-甲硫氨酸合成酶(S-adenosyl-methionine synthetase),metE/MetE的序列可以从EMBL:BS52812(accession no.U52812)得到。(Yocum,R.R.;Perkins,J.B.;Howitt,C.L.;Pero,J.;1996.Cloning and characterization of the metE geneencoding S-adenosylmethionine synthetase from Bacillus subtilis.J.Bacteriol.178(15):4604)。
leuB基因编码3-异丙基苹果酸脱氢酶(3-isopropylmalatedehydrogenase),该酶催化3-羧基-2-羟基-4-甲基戊酸(3-carboxy-2-hydroxy-4-methylpentanoate)到3-羧基-4-甲基-2-氧代戊酸(3-carboxy-4-methyl-2-oxopentanoate)的转化。leuB缺陷的菌株将成为针对亮氨酸的营养缺陷型。
lysA基因编码二氨基庚二酸脱羧酶(diaminopimelate decarboxylase),该酶催化消旋-2,6-二氨基庚二酸(Meso-2,6-diaminoheptanedioate)转化为L-赖氨酸。lysA缺陷的菌株将成为针对赖氨酸的营养缺陷型。
本发明的优选的实施方案涉及一种本发明的细胞,在其中所述条件性必需基因编码来自于某个氨基酸的生物合成途径的酶;优选地,该条件性必需基因编码一个或多个参与赖氨酸,亮氨酸或甲硫氨酸合成的多肽,较优地,该条件性必需基因与来自枯草芽孢杆菌(Bacillus subtilis)的lysA,leuB,metC或metE基因同源,更优选地,该条件性必需基因是来自地衣芽孢杆菌(Bacillus licheniformis)的lysA,leuB,metC,或metE基因;更优选地,该条件性必需基因与下列序列具有至少75%,更优选地为至少85%,更优选地为至少95%,最优选地为至少97%的同一性:WO02/00907 A1SEQ ID NO:48所示的来自地衣芽孢杆菌(Bacilluslicheniformis)的lysA序列;来自地衣芽孢杆菌(Bacillus licheniformis)的leuB序列;WO 02/00907 A1 SEQ ID NO:42所示的来自地衣芽孢杆菌的metC序列,及SEQ ID NO:16的997至2199位所示的来自枯草芽孢杆菌的metE序列。
hemA基因编码谷氨酰-tRNA还原酶(glutamyl-tRNA reductase),该酶催化5-氨基乙酰丙酸的合成。hemA缺陷的菌株必需获得5-氨基乙酰丙酸或氯高铁血红素的补充。
在另一个实施方案中,所述条件性必需基因编码谷氨酰-tRNA还原酶,较优地,所述条件性必需基因与来自枯草芽孢杆菌的hemA基因同源,更优选地,该条件性必需基因为来自地衣芽孢杆菌的hemA基因;较优地,该条件性必需基因与来自地衣芽孢杆菌的hemA基因具有至少75%,更优选地为至少85%,更优选地为至少95%,最优选地为至少97%的一致性。
所述条件性必需基因可能编码参与利用特定碳源,例如木糖,glucanate,甘油,或阿拉伯糖的多肽,在这种情况下,如果此基因失去功能,宿主细胞将无法在只添加了上述特定碳源的基本培养基中生长。
本发明的优选的实施方案涉及一种本发明的细胞,在其中至少有一个条件性必需的染色体基因是宿主细胞在只添加了一种特定的主要碳源的基本培养基上生长所必需的一个或多个基因。
本发明的一个优选的实施方案涉及一种本发明的细胞,在其中至少有一个条件性必需的染色体基因编码利用木糖的所需的酶,较优地,此条件性必需基因和来自枯草芽孢杆菌的xylA基因同源,更优选地,此条件性必需基因与来自地衣芽孢杆菌的木糖异构酶操纵子的某个基因同源,最优选地,其与来自地衣芽孢杆菌的xylA基因同源;优选地,此条件性必需基因编码木糖异构酶,而且其与来自地衣芽孢杆菌的xylA基因具有至少75%,更优选地为至少85%,更优选地为至少95%,最优为至少97%的一致性。
本发明的另外一个优选的实施方案涉及一种本发明的细胞,在其中至少有一个条件性必需的染色体基因编码利用gluconate的所需的酶,优选地,该条件性必需基因编码葡萄糖酸激酶(gluconate kinase)或者葡萄糖酸透性酶(gluconate permease);更优选地,该基因与来自枯草芽孢杆菌的gntK或gntP基因同源,最优选地,该基因为地衣芽孢杆菌的gntK或gntP基因;该条件性必需基因优选地编码葡萄糖激酶(gluconate kinase)或者葡萄糖透性酶(gluconate permease)或同时编码二者,并优选地和来自地衣芽孢杆菌的gntK和gntP序列具有至少75%,更优选地为至少85%,更优选地为至少95%,最优选地为至少97%的一致性。
另外一个优选的实施方案涉及一种本发明的细胞,在其中所述条件性必需基因编码利用甘油所需的酶,优选地,该条件性必需基因编码甘油转运易化蛋白(glycerol uptake facilitator)(透性酶),或甘油激酶,或甘油脱氢酶;更优选地,该基因与来自枯草芽孢杆菌的glpP,glpF,glpK,或glpD基因同源;最优选地,该基因包括已公开的PCT申请WO 02/00907 A1(Novozymes A/S)中SEQ ID NO:26所表示的来自地衣芽孢杆菌的glpP,glpF,glpK和glpD基因中的一种或多种,此处引入该申请全文供参考;该条件性必需基因优选地编码甘油转运易化蛋白(glycerol uptake facilitator)(透性酶),或甘油激酶,或甘油脱氢酶,并优选地和WO 02/00907 A1(Novozymes A/S)中SEQ ID NO:26所表示的来自地衣芽孢杆菌的glpP,glpF,glpK和glpD序列具有至少75%,更优选地为至少85%,更优选地为至少95%,最优选地为至少97%的同一性。
另外一个优选的实施方案涉及一种本发明的细胞,在其中所述条件性必需基因编码利用阿拉伯糖所需的酶,优选为阿拉伯糖异构酶;更优选地,该基因与来自枯草芽孢杆菌的araA基因同源;最优选地,该基因是WO02/00907 A1中SEQ ID NO:38所表示的来自地衣芽孢杆菌的araA基因;该条件性必需基因优选地编码阿拉伯糖异构酶,并与WO 02/00907 A1(Novozymes A/S)中SEQ ID NO:38所表示的来自地衣芽孢杆菌的araA序列具有至少75%,更优选地为至少85%,更优选地为至少95%,最优选地为至少97%的同一性。
本发明的细胞中的扩增单位也可以包含抗生素标记基因。但是,由于人们更希望染色体中不含标记基因,必须提供一种除去标记基因的供选手段。有一类称为解离酶(resolvases)的特殊的限制酶,它能切除DNA上的某些在其两侧翼都存在特定识别序列的部分,这些识别序列称为解离酶位点或者res-位点。在相关技术领域中这些解离酶是为人熟知的,参考例如WO 96/23073(Novo Nordisk A/S),此处引入其全文供参考。
一个优选的实施方案涉及一种本发明的细胞,在其中所述扩增单位还包括抗生素选择标记,优选地,该选择标记的两侧翼都存在解离酶位点或者res-位点。
解离酶作用之后,位于res-位点之间的抗生素限制性标记将从细胞的染色体上切除,只留下一拷贝的res-位点,作为这个步骤业已发生的证据。
据此,一个优选的实施方案涉及一种本发明的细胞,在其中所述扩增单位还包括解离酶位点或者res-位点。
由于本发明依赖于扩增单位所含的条件性必需基因的转录低于其野生型的转录水平,最好在该基因的上游加入一个或多个位于不同阅读框中的转录终止子,以免被染色体上位于该扩增单位整合位点的上游的某个基因意外通读。
一个优选的实施方案涉及一种本发明的细胞,在其中所述扩增单位所包含的所述条件性必需基因的上游存在至少一个转录终止子。
另外一种降低所述条件性必需基因的转录的方法是使其表达自异源的或者完全人工的,与通常转录此基因的野生型或内源启动子相比活性较低的启动子。该条件性必需基因优选地转录自异源启动子,其活性水平与该条件性必需基因的内源启动子相比降低了2倍,更优为5倍,更优为10倍,更优为50倍,最优为100倍。
还有一种策略是在所述扩增单位中使用无启动子的条件性必需基因,然后依靠位于该条件性必需基因上游的任何其他基因所产生的通读转录。此通读转录可以发生在该扩增单位整合到本发明的细胞的染色体之前或之后。优选地,所述条件性必需基因是无启动子的;更优选地,目的基因位于扩增单位中条件性必需基因的上游,以使得二者被同方向(directionally)地转录,从而该条件转录基因可以通过目的基因的转录通读而得以表达。
本发明的第二方面涉及一种表达目标基因所编码的蛋白质的方法,该方法包括
a)培养一种细菌宿主细胞,该细胞的基因组中含有扩增单位的至少两个经过复制的拷贝,此扩增单位包括:
i)目的基因的至少一个拷贝,及
ii)可表达的条件性必需基因,该基因或是无启动子的,或是由活性显著低于该基因的内源启动子的异源启动子转录的,且
如果此条件性必需基因失去功能,则造成该细胞针对至少一种特定物质的营养依赖,或使该细胞不能利用一种或多种特定的单一碳源。和
b)回收此蛋白。
如前所述,我们预料任何本发明的细胞都适用于第二方面的方法,特别是上面列出的优选的实施方案。
本发明的最后一方面还涉及一种方法,用来产生中含有目的基因的两个及以上的经过扩增的染色体拷贝的细菌细胞,该方法包括
a)提供细菌宿主细胞,该细胞的基因组中含有一个扩增单位的至少一个拷贝,此扩增单位包括:
i)目的基因的至少一个拷贝,及
ii)条件性必需基因的可表达的功能性拷贝,该基因或是无启动子的,或是由活性显著低于该基因的内源启动子的异源启动子转录的,且
如果此条件性必需基因失去功能,则造成细胞针对至少一种特定物质的营养依赖,或使该细胞不能利用一种或多种特定的单一碳源。和
b)在合适生长的条件下,在缺少所述至少一种特定物质和/或含有所述一种或多种特定的单一碳源的培养基中培养这种细菌细胞,由此使那些在其染色体中发生了该扩增单位复制的细胞具有生长优势。
c)选择在其染色体中扩增单位已被复制的细胞,由此获得目的基因的两个及以上的经过扩增的染色体拷贝。
同样,如前所述,我们预料本发明最后一方面的方法适用于生产任何本发明的细胞,特别是上面列出的所述细胞的优选的实施例。
实施例
菌株和供体生物
枯草芽孢杆菌PL1801.该菌株是apr和npr基因被破坏的枯草芽孢杆菌DN1885(Diderichsen,B.,Wedsted,U.,Hedegaard,L.,Jensen,B.R.,Sjholm,C.(1990)Cloning of aldB,which encodesalpha-acetolactate decarboxylase,an exoenzyme from Bacillus brevis.J.Bacteriol.,172,4315-4321)。
枯草芽孢杆菌CLO46,该菌株得自枯草芽孢杆菌PL1801,利用质粒pCLO43将其metE基因缺失并替换为pUB110的卡那霉素抗性基因。
枯草芽孢杆菌CLO49,该菌株得自枯草芽孢杆菌CLO46,其卡那霉素抗性基因被缺失。
感受态细胞按照下列文献描述的方法制备和转化:Yasbin,R.E.,Wilson,G.A.and Young,F.E.(1975)Transformation and transfection inlysogenic strains of Bacillus subtilis:evidence for selective induction ofprophage in competent cells.J.Bacteriol,121:296-304.
质粒
pCLO43:
该质粒衍生自pBR322(Watson,N.,1988 Gene 70(2):399-403),主要包含:令该质粒可以在大肠杆菌中扩增的元件,氨苄青霉素抗性基因,赋予卡那霉素抗性的基因,两个来自枯草芽孢杆菌metE基因的侧接片段,分别插入卡那霉素抗性基因上下游两侧,两个直接重复的片段,作为pAMBetal的res位点的标记(signify)(Janniere,L.,1996,Nucleic AcidsRes.24(17):3431-3436)。该质粒用于缺失枯草芽孢杆菌(B.subtilis)PL1801菌株中metE基因。
表1.质粒pCLO43,7311bp
  位置(bp)   大小(bp)   元件(bp)   来源
  1-973   973   metE上游序列   枯草芽孢杆菌
  974-1010   37   接头   合成
  10111-1184   174   来自pAMbetal的res位点   粪肠球菌(E.faecalis)
  1185-1190   6   接头   合成
  1191-2159   969   pUB110(卡那霉素抗性基因)   金黄色葡萄球菌(S.aureus)
  2160-2162   3   接头   合成
  2163-2336   174   来自pAMβ1的res位点   粪肠球菌(E.faecalis)
  2337-2357   21   接头   合成
  2358-3870   1513   metE下游序列   枯草芽孢杆菌
  3871-7311   3441   pBR322   大肠杆菌(E.coli)
pCLO1154:
该质粒衍生自pBR322(Watson,N.,1988 Gene 70(2):399-403),主要包含:令该质粒可以在大肠杆菌中扩增的元件。该质粒编码氨苄青霉素抗性基因,卡那霉素抗性基因,氯霉素抗性基因,及来自大肠杆菌的lacZ基因。在此质粒中,来自维多利亚水母(A.Victoria)的gfp基因和来自枯草芽孢杆菌的metE基因在转录水平上融合,并受可以与其他启动子交换的启动子的调控。此质粒用于CLO49的amyE基因座中的整合和扩增的研究。下列引物用于从自PL1801中分离的染色体DNA中PCR扩增metE片断:
P52(SEQ ID NO:1):aataataaagatctggaggagaaacaatgacaacc
P53(SEQ ID NO:2):aaataataagatctaaattatactagctgtgtc
表2.质粒pCLO1154,13135bp.
  位置(bp)   大小(bp)   元件(bp)   来源
  1-539   539   amyE上游   枯草芽孢杆菌
  540-2853   2314   metE基因   枯草芽孢杆菌
  2854-2891   38   接头   合成
  2892-3605   714   gfp基因   维多利亚水母(A.victoria)
  3606-3739   134   启动子-alr   枯草芽孢杆菌
  3740-3785   46   接头   合成
  3786-4821   1036   pC194(cat基因)   金黄色葡萄球菌
  4822-5008   187   部分tetC基因   枯草芽孢杆菌
  5009-5106   98   启动子   合成
  5107-5111   6   接头   合成
  5112-8224   3113   spoVG-lacZ融合   枯草芽孢杆菌和大肠杆菌
  8226-8314   89   部分tetC基因   大肠杆菌
  8315-9657   1343   amyE下游   枯草芽孢杆菌
  9658-9845   188   接头   合成
  9846-11117   1272   pUB110(neo基因)   金黄色葡萄球菌
  11118-11184   67   接头   合成
  11185-11277   93   Tn5片断   大肠杆菌
  11278-11281   4   接头   合成
  11282-13119   1838   pBR322(bla基因)   大肠杆菌
  13120-13129   10   接头   合成
扩增PL1801菌株用于LacZ活性的测定
枯草芽孢杆菌PL1801菌株在液体培养基TY中扩增,在37℃,300rpm下孵育10代后,收集细胞,用声波或者溶菌酶处理破碎细胞。
通用分子生物学方法
除非特别说明,DNA操作和转化都按照标准的分子生物学方法进行(Sambrook et al.(1989)Molecular cloning:A laboratory manual,ColdSpring Harborlab.,Cold Spring Harbor,NY;Ausubel,F.M.et al.(eds.)″Current protocols in Molecular Biology″.John Wiley and Sons,1995;Harwood,C.R.,and Cutting,S.M.(eds.)″Molecular Biological Methodsfor Bacillus″.John Wiley and Sons,1990)。
DNA操作所用的酶按照提供商的说明使用(例如限制性内切酶,连接酶等可得自New England Bio-labs,Inc.)
培养基
TY:(如Ausubel,F.M.et al.(eds.)″Current protocols in MolecularBiology″.John Wiley and Sons,1995所述)。LB琼脂(如as described inAusubel,F.M.et al.(eds.)″Current protocols in Molecular Biology″.JohnWiley and Sons,1995所述)。
基本TSS琼脂:如FouetA.and Sonenshein,A.L.(1990)A Targetfor Carbon Source-Dependant Negative Regulation of the citB Promoter ofBacillus subtilis.J.Bacteriol.,172,835-844所述。用于平板时,添加2%的琼脂;用于甲硫氨酸原养型测定时,平板中加入50μg/ml的甲硫氨酸。
β-半乳糖苷酶活性测定
利用邻-硝基苯-β-D-半乳吡喃糖苷(ortho-nitrophenyl-beta-D-galactopyranoside)作为酶底物来测定β-半乳糖苷酶活性。在一组给定的条件下(温度,pH,反应时间,缓冲条件),一定量的β-半乳糖苷酶可以降解一定量的底物产生黄色。在420nm测定显色强度。在一组给定的条件下,测得的吸光度值与被测β-半乳糖苷酶的活性成正比。
缺失枯草芽孢杆菌(B.subtilis)的metE
构建了用于缺失枯草芽孢杆菌中metE基因的质粒。用PCR扩增了分别位于glaE基因的上游和下游的两个侧接序列,并通过PCR将它们分别融合到卡那霉素(Kana)标记的每侧。然后将此片断连接到质粒pBR322中。
上游metE片断:
P42(SEQ ID NO:3):attttataggatcccgctgattcattttcttctgcgaac
P43(SEQ ID NO:4):gaattccatcgcactggacgacattttcaggtcgattctcggaaatcc
下游metE片断:
P44(SEQ ID NO:5):cccgaggcctttcaggcccgcaaacaatatggttgaagccgcaaaacagg
P45(SEQ ID NO:6):ataataatggtaccatattgatgtgacacttgaagttgc
将由此得到的质粒pCLO43(SEQ ID NO:7)线性化,然后转入枯草芽孢杆菌PL1801,铺含有10μg/ml卡那霉素的LBPG培养基平板,这样就使得metE基因被Kan标记所取代。
在没有甲硫氨酸的基本培养基上检验了名为CLO46的metE缺失的菌株。原先的枯草芽孢杆菌PL1801(metE+)菌株在这样的培养基上生长良好,而metE菌株CLO46即使在孵育数天之后也未见生长。在作为对照的添加了50μg/ml甲硫氨酸的平板上,两种菌株都生长。由此就确证了metE-菌株上存在所报道的营养缺陷表型。
位于CLO46的metE基因座中的Kan标记在其两侧具有解离酶识别位点(res),使得在解离酶存在下可以发生特异性的切除反应。为了从染色体上除去Kan标记,先用含有编码解离酶的基因及红霉素(Erm)抗性标记的温度敏感型质粒pWT来转化CLO46,用含有5μg/ml红霉素的平板选择转化子,测试其Kan标记是否丧失,然后在50℃下不含抗生素的平板上划线两次,以消除菌株中的pWT质粒。对选择到的克隆进行Erm和Kan抗性丧失的筛选,将得到克隆的命名为CLO49(PL1801,metE-;无抗生素标记)。
扩增质粒
扩增质粒具有转录单位,其包含gfp基因和metE基因,在这两个基因前面有克隆位点,此位点中可克隆入启动子(pCLO1154,SEQ ID NO:8)。质粒上还有lacZ报告基因,其由与metE基因前面的那个启动子分离的启动子表达。上述两个转录单位的侧翼都具有来自枯草芽孢杆菌(B.subtilis)amyE基因座的片断。
活性不同的启动子被克隆到gfp-metE转录单位前面的EcoRI和HindIII位点之间。启动子的活性范围在30到519个任意单位之间。见表3。
  启动子   活性/单位   序列
  Pr30   30   (SEQ ID NO:9)
  Pr43   43   (SEQ ID NO:10)
  Pr119   119   (SEQ ID NO:11)
  Pr164   164   (SEQ ID NO:12)
  Pr342   342   (SEQ ID NO:13)
  Pr409   409   (SEQ ID NO:14)
  Pr519   519   (SEQ ID NO:15)
表3:该表列出了扩增实验所用的启动子并给出了其序列。
扩增实验
由上所得的扩增质粒被转化到CLO49(metE-)中,铺加有6μg/ml氯霉素的LB培养基平板,对转化子的卡那霉素抗性进行选择。
对卡那霉素敏感的转化子可能在amyE基因座中整合了扩增质粒的一部分,包括lacZ报告基因和gfp-metE操纵子。这些转化子所带有的基因只有一个拷贝,而且不能被扩增。
对卡那霉素具有抗性的转化子可能在amyE基因座中整合了完整的扩增质粒,扩增有可能发生。
将上述两种转化子铺不含甲硫氨酸的固体基本TSS培养基平板。amyE基因座中整合了完整的扩增质粒的转化子产生若干菌落,而只整合了部分扩增质粒的转化子在基本培养基上没有生长。这说明即使具有最强的启动子,metE基因的一个拷贝也不足以表达足够的MetE蛋白来弥补该菌株对于甲硫氨酸的营养缺陷。不过,metE基因的扩增确实造成了菌株的生长。
在扩增步骤中挑取某些菌落,然后,和染色体中只整合了metE基因的一个拷贝的菌落一起,在液体LB培养基中培养,在指数生长期收集细胞,并测定-半乳糖苷酶(β)活性。下表给出了扩增结果评定的结果。
一些克隆表现出异常的酶活性,这可以解释为启动子发生了上升突变(up-mutations)。
  启动子强度   菌株   单位数   拷贝数
  30   一个基因拷贝   105   1,0
  扩增   1361   12,4
  扩增   218   2,0
  43   一个基因拷贝   101   0,9
  扩增   1467   13,4
  扩增   1460   13,3
  119   一个基因拷贝   113   1,0
  扩增   1055   9,6
  扩增   1075   9,8
  164   一个基因拷贝   102   0,9
  扩增   881   8,0
  扩增   855   7,8
342   一个基因拷贝   134   1,2
  扩增   606   5,5
  409   一个基因拷贝   105   1,0
  扩增   533   4,9
  扩增   493   4,5
  519   一个基因拷贝   105   1,0
  扩增   544   5,0
  扩增   114   1,0
表4:上表显示了扩增试验的结果以及所有菌株在LB液体培养基中生长后测得的β-半乳糖苷酶活性。酶活性已经换算为基于酶活性的报告基因拷贝数。
这里所总结的结果显示,确实有可能通过在不含甲硫氨酸的基本培养基中培养菌株来增加含有弱表达的metE基因并整合在染色体中的表达盒的拷贝数。根据酶活性确定的扩增潜力大于10个拷贝(观测到最高达25个拷贝),非常类似于通过传统的卡那霉素抗生素选择/扩增所达到的结果。
                        序列表
<110>诺维信公司(Novozymes A/S)
<120>细菌宿主细胞中稳定地基因扩增的方法
<130>10442.204-WO
<160>17
<170>PatentIn version 3.2
<210>1
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物P52
<400>1
aataataaag atctggagga gaaacaatga caacc                            35
<210>2
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物P53
<400>2
aaataataag atctaaatta tactagctgt gtc                              33
<210>3
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物P42
<400>3
attttatagg atcccgctga ttcattttct tctgcgaac                        39
<210>4
<211>48
<212>DNA
<213>人工序列
<220>
<223>引物P43
<400>4
gaattccatc gcactggacg acattttcag gtcgattctc ggaaatcc              48
<210>5
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物P44
<400>5
cccgaggcct ttcaggcccg caaacaatat ggttgaagcc gcaaaacagg            50
<210>6
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物P45
<400>6
ataataatgg taccatattg atgtgacact tgaagttgc                        39
<210>7
<211>7311
<212>DNA
<213>人工序列
<220>
<223>质粒pCL043
<400>7
cttggagggc caagcgatgt gccagagcta aaagaagcag tgaaaaacgc agtgaaaaac     60
ggagtgcttg tcgtttgtgc agcgggaaat gaaggtgacg gcgacgaacg cacagaagag    120
ctttcctacc ccgcagctta taatgaagtg attgcagttg gatctgtttc tgtagcgcga    180
gaattatcag aattttctaa cgcgaataaa gagattgacc ttgtggcacc aggagaaaac    240
atcttatcca cccttcccaa caagaagtac ggtaagctga ccggcacttc aatggctgcc    300
cctcatgtca gcggtgcgct tgctttaatc aaaagctatg aagaagaatc atttcaaaga    360
aagctttctg aatctgaggt tttcgcacag ctaatccgca ggacacttcc tcttgatatt    420
gcaaaaacgc tggcaggcaa tggattcctg tatttaacag ctcctgatga gctcgcagaa    480
aaagcagagc aatcacattt gttgacccta taagattatt tttcttatat aatatacacc    540
acatcatgta aataaaaatt tcaaattcta tgttgacaat gaatttgaat tactgttaag    600
attaccaaca aatgattcaa cttttcaaaa aattaataac attttctctt atcgagagtt    660
gggcgaggga ttggcctttt gaccccaaca gcaaccgacc gtaataccat tgtgaaatgg    720
ggcgcactgc ttttcgcgcc gagactgatg tctcataagg cacggtgcta attccatcag    780
attgtgtctg agagatgaga gaggcagtgt tttacgtaga aaagcctctt tctctcatgg    840
gaaagaggct ttttgttgtg agaaaacctc ttagcagcct gtatccgcgg gtgaaagaga    900
gtgttttaca tataaaggag gagaaacaat gacaaccatc aaaacatcga atttaggatt    960
tccgagaatc gacctgaaaa tgtcgtccag tgcgatggaa ttctgatcaa atggttcagt   1020
gagagcgaag cgaacacttg attttttaat tttctatctt ttataggtca ttagagtata   1080
cttatttgtc ctataaacta tttagcagca taatagattt attgaatagg tcatttaagt   1140
tgagcatatt agaggaggaa aatcttggag aaatatttga agaacccgaa cgcgtgagta   1200
gttcaacaaa cgggccagtt tgttgaagat tagatgctat aattgttatt aaaaggattg    1260
aaggatgctt aggaagacga gttattaata gctgaataag aacggtgctc tccaaatatt    1320
cttatttaga aaagcaaatc taaaattatc tgaaaaggga atgagaatag tgaatggacc    1380
aataataatg actagagaag aaagaatgaa gattgttcat gaaattaagg aacgaatatt    1440
ggataaatat ggggatgatg ttaaggctat tggtgtttat ggctctcttg gtcgtcagac    1500
tgatgggccc tattcggata ttgagatgat gtgtgtcatg tcaacagagg aagcagagtt    1560
cagccatgaa tggacaaccg gtgagtggaa ggtggaagtg aattttgata gcgaagagat    1620
tctactagat tatgcatctc aggtggaatc agattggccg cttacacatg gtcaattttt    1680
ctctattttg ccgatttatg attcaggtgg atacttagag aaagtgtatc aaactgctaa    1740
atcggtagaa gcccaaacgt tccacgatgc gatttgtgcc cttatcgtag aagagctgtt    1800
tgaatatgca ggcaaatggc gtaatattcg tgtgcaagga ccgacaacat ttctaccatc    1860
cttgactgta caggtagcaa tggcaggtgc catgttgatt ggtctgcatc atcgcatctg    1920
ttatacgacg agcgcttcgg tcttaactga agcagttaag caatcagatc ttccttcagg    1980
ttatgaccat ctgtgccagt tcgtaatgtc tggtcaactt tccgactctg agaaacttct    2040
ggaatcgcta gagaatttct ggaatgggat tcaggagtgg acagaacgac acggatatat    2100
agtggatgtg tcaaaacgca taccattttg aacgatgacc tctaataatt gttaatcatg    2160
ttggagctca gtgagagcga agcgaacact tgatttttta attttctatc ttttataggt    2220
cattagagta tacttatttg tcctataaac tatttagcag cataatagat ttattgaata    2280
ggtcatttaa gttgagcata ttagaggagg aaaatcttgg agaaatattt gaagaacccg    2340
aggcctttca ggcccgcaaa caatatggtt gaagccgcaa aacaggcaag agcacagcag    2400
acacagctag tataatttga aaaaaccatc tgcatttggc agatggtttt tttctataat    2460
acagccacaa tcggtttctt atttagcaaa tcccccaaat actttgttta ttttgcactt    2520
ttttaagaat gttctttgca ttcttttcgg ctatactaat aacactctat tgacaggagg    2580
gattgggatg aatcatgaaa cgttcttaaa acgggctgtc actctcgcat gtgaaggagt    2640
gaatgcagga atcggcgggc cttttggagc cgttatcgtg aaagacggag ccattattgc    2700
agagggacag aacaacgtca caacaagcaa tgatccgact gcccacgcgg aagtcacagc    2760
tattcggaaa gcctgtaagg tgctaggagc ctaccagctt gatgactgca ttttgtatac    2820
gagctgtgaa ccatgcccaa tgtgcttggg cgccatctac tgggcccggc ctaaagccgt    2880
tttctatgca gctgagcaca cagacgctgc cgaagccggg tttgatgatt cattcattta    2940
taaagaaatt gataaacctg ctgaagaaag aacgatcccc ttttatcaag tgacactaac    3000
agagcattta tccccgtttc aagcatggcg gaacttcgcc aataagaaag aatattaaaa    3060
ggatcaggca tgcgcggcct ggtccttgtt atttctccaa gtagccgcta tgccctgtgc    3120
aaatacaaaa cagcatatac gcgcaattca gcacggcaga caccgtgcca gccacccgct    3180
tcatctgtaa cttttggttt aaaggcatgc ttcaaacgct tctctgaagt tttatcataa    3240
atctgtgccc gccccgcatg tccgacacca aaaaacatcc tgagaatcct caggatgccg    3300
gtcattattt taattctagt tttacatcaa catttcctct ggttgccttt gagtaaggac    3360
agaattcatg agcggcgttg acaagctctt gtgccttttc ccgatctaaa tctttcgtgt    3420
tcacaacaag tgtgacaccg attttaaacc cgccgtcgct ctcatccttc atgaggctga    3480
cctgcccttc aatctccgaa tcaatttcga tattctgctc tttggctacg tgttcgagcg    3540
cgccgccgaa gcatgcagca taccctgccg caaagagctg ttccggattt gtgccggttt    3600
gtccttcttt tttggcattt ggcatgacaa tatcaaaatc aagaacaccg tcatctgatg    3660
taatatgtcc tgctcgtccg cctcgcgcgg ttacttttgc tgtaaatagt gccatatttc    3720
ccaacctcct tatttgtatc tagttgttat atttcccttt ctgatctttt taaacatgct    3780
atgtttgccg agaataggaa aagtgaggtt tttcagatac aatagaatcg aatgacaaaa    3840
aagagttggt gaacaaaatg gaaaataaat ttgatcatat gcggtgtgaa ataccgcaca    3900
gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc    3960
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt    4020
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg    4080
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg    4140
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat    4200
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta    4260
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct    4320
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc    4380
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa    4440
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg    4500
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag    4560
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt    4620
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta    4680
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc    4740
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca    4800
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa    4860
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat    4920
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct    4980
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt    5040
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat    5100
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta    5160
atagtttgcg caacgttgtt gccattgctg caggcatcgt ggtgtcacgc tcgtcgtttg    5220
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt    5280
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg    5340
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg    5400
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc    5460
ggcgaccgag ttgctcttgc ccggcgtcaa cacgggataa taccgcgcca catagcagaa    5520
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac    5580
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt    5640
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg    5700
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa    5760
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata    5820
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca    5880
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtcttcaag    5940
aattctcatg tttgacagct tatcatcgat aagctttaat gcggtagttt atcacagtta    6000
aattgctaac gcagtcaggc accgtgtatg aaatctaaca atgcgctcat cgtcatcctc    6060
ggcaccgtca ccctggatgc tgtaggcata ggcttggtta tgccggtact gccgggcctc    6120
ttgcgggata tcgtccattc cgacagcatc gccagtcact atggcgtgct gctagcgcta    6180
tatgcgttga tgcaatttct atgcgcaccc gttctcggag cactgtccga ccgctttggc    6240
cgccgcccag tcctgctcgc ttcgctactt ggagccacta tcgactacgc gatcatggcg    6300
accacacccg tcctgtggat cctctacgcc ggacgcatcg tggccggcat caccggcgcc    6360
acaggtgcgg ttgctggcgc ctatatcgcc gacatcaccg atggggaaga tcgggctcgc    6420
cacttcgggc tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc cgtggccggg    6480
ggactgttgg gcgccatctc cttgcatgca ccattccttg cggcggcggt gctcaacggc    6540
ctcaacctac tactgggctg cttcctaatg caggagtcgc ataagggaga gcgtcgaccg    6600
atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc    6660
gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg    6720
ctctgggtca ttttcggcga ggaccgcttt cgctggagcg cgacgatgat cggcctgtcg    6780
cttgcggtat tcggaatctt gcacgccctc gctcaagcct tcgtcactgg tcccgccacc    6840
aaacgtttcg gcgagaagca ggccattatc gccggcatgg cggccgacgc gctgggctac    6900
gtcttgctgg cgttcgcgac gcgaggctgg atggccttcc ccattatgat tcttctcgct    6960
tccggcggca tcgggatgcc cgcgttgcag gccatgctgt ccaggcaggt agatgacgac    7020
catcagggac agcttcaagg atcgctcgcg gctcttacca gcctaacttc gatcactgga    7080
ccgctgatcg tcacggcgat ttatgccgcc tcggcgagca catggaacgg gttggcatgg    7140
attgtaggcg ccgccctata ccttgtctgc ctccccgcgt tgcgtcgcgg tgcatggagc  7200
cgggccacct cgacctgaat ggaagccggc ggcacctcgc taacggattc accactccaa  7260
gaattggagc caatcaattc ttgcggagaa ctgtgaatgc gcaaaccaac c           7311
<210>8
<211>13129
<212>DNA
<213>人工序列
<220>
<223>质粒pCLO1154
<220>
<221>misc_feature
<222>(5067)..(5067)
<223>n代表a,c,g,或t
<400>8
aacaaaattc tccagtcttc acatcggttt gaaaggagga agcggaagaa tgaagtaaga     60
gggatttttg actccgaagt aagtcttcaa aaaatcaaat aaggagtgtc aagaatgttt    120
gcaaaacgat tcaaaacctc tttactgccg ttattcgctg gatttttatt gctgtttcat    180
ttggttctgg caggaccggc ggctgcgagt gctgaaacgg cgaacaaatc gaatgagctt    240
acagcaccgt cgatcaaaag cggaaccatt cttcatgcat ggaattggtc gttcaatacg    300
ttaaaacaca atatgaagga tattcatgat gcaggatata cagccattca gacatctccg    360
attaaccaag taaaggaagg gaatcaagga gataaaagca tgtcgaactg gtactggctg    420
tatcagccga catcgtatca aattggcaac cgttacttag gtactgaaca agaatttaaa    480
gaaatgtgtg cagccgctga agaatatggc ataaaggtca ttgttgacgc gcggccgcgg    540
atctaaatta tactagctgt gtctgctgtg ctcttgcctg ttttgcggct tcaaccatat    600
ttttcaatgc tgcaaccgtt tcttcctgct gtcttgtttt caatccgcag tctggattta    660
cccagaagcg gtcagtcgga cagacggcaa gcgcatcaac gataatattg tacatttctt    720
cagttgacgg cacacgaggg ctgtgaatgt catatacacc aaggccaagc cctttcaaat    780
acgggtggtt ttttaagtaa tctaaaaatc ctccgtggct tctgctatgt tcgattgtaa    840
tcacatcggc atcaagatca ttgattgtat caacgatatc ttcgaagttg ctgtagcaca    900
tatgtgtatg aatttgtgtc tcgtttttca cggaagaagt ggttaatctg aaagcttctg    960
ccgcccaagt caaatactca tcccaatcgc gggttttcaa tggaaggcct tcacgcagcg   1020
ctggttcatc gacttgaatg atttgaatgc ctgcgtcttc aagcgcttta acttctttgc   1080
gaagggcaag cccgatttgg aaggcgattt ctttcctcga gatgtcgttt cgagggaaag   1140
accagtttaa gattgtaacc gggcccgtca gcattccttt cacatgcttg gaagtcaatg   1200
actgtgcgta gactgtgtct ttcactgtca tcggttcaat aaattcaaca tctccgtaaa   1260
tgactggcgg gcggacacag cgtgagccgt atgattgaac ccaggcatat ttagtgaagg   1320
cgaaaccggc cagcttttca ccgaagtatt cgaccatgtc tgtccgttca aattcgccgt    1380
gaacaaggac atcaagctcc aattcttcct gaatatcaat ccatcttttt gtttccgcat    1440
tgataaagtt ttgatactgt tcatcggacc actcagcttt ccgccatttt tggcgtgccc    1500
tccgcacttc agcagactgc gggaagctgc cgatcgttgt cgtcggcaaa agcggaaggc    1560
cgagagattc attttgtagg gctaaacgtt cttcaaacgg aatcgggcgc ttgaagtctt    1620
tatcagttaa ttgctcaagc tctttctttt gttcagaatt ggcgcctgtt gcaaactgtt    1680
taagcgcctg gatatcagcc ttagcctgct gaatctcttc gctgatcgcc gcttttcctg    1740
atactaagcc ttctttcaaa gctgtcagct cggccagctt ttcttttgcg taggataatc    1800
cgttcaatag gtctttttcc aaatgctcat cagggtgttt cgctactgga acatcgagca    1860
ggctgctgga aggctgaatc cacagttcat caacttttgc aatgctgaga acatcaagaa    1920
cggcatcgag actctcttca aggtccgctt tccaaatgtt gcgtccgtcg ataacgccgg    1980
ctgccagcac tttatctgtc gggaagccat gtgttttaag ctgttccagg tttctgcctt    2040
tgtcgtgaac gaaatcaagg ccaattccct gaaccgggta agagatcagc tcttcataag    2100
catcaacaga atcaaaatac gtctgcaaaa gcacattcaa ggatgaaagc tcacttgtaa    2160
tgctttcaaa taattctttt gcgccgcgta catcttcact agaggcggta acgagcgccg    2220
gctcatcgat ttgaacccat tttacgcctt cttcttcaag ctctttcaaa agctgtacat    2280
ataatggcac aaggcgtttt tggatcgctt ttgcttcaga cggttcatag cctttagcaa    2340
gcgtaacgaa cgtataaggg ccgacaatca caggctttgt ttccacaccg tattcctgtt    2400
tgatccggcg ataatcttcg agttgtttgt ttcttgtcag acggaactca atgctctcgt    2460
catattccgg aacgatgtaa tggtaatttg tattaaacca ttttgtcatt tcactagata    2520
cagcgtcttt gattccgcgg gcgatagcga agtatgtatc ggtagcgtca gtcaaatgtc    2580
tgaaccgttt cgggatccag ttgaagctga ctgctgtgtc gagtacatgg tcatactgtg    2640
tgaaatcaga aacaggcaca acatcaatct gctggtcaat ttgtgttttt actgcggata    2700
aaaatagttc gtcgatttgc ttcaaaaacg tatctttatc agtactgcct ttccaatacg    2760
cttcaagtgc ttttttccat tcccggttca ggtcgattct cggaaatcct aaattcgatg    2820
ttttgatggt tgtcattgtt tctcctccag atccgtcgac ctgcataaac tgcatccctt    2880
aacttgtttt atttgtatag ttcatccatg ccatgtgtaa tcccagcagc tgttacaaac    2940
tcaagaagga tcatgtgatc tctcttttcg ttgggatctt tggaaagggc agattgcgtg    3000
gacaggtaat ggttgtctgg taaaaggaca gggccatcgc caattggagt attttgttga    3060
taatggtctg ctaattgaac gcttccatct ttaatgttgt gtctaatttt gaagttaact    3120
ttgatgccat tctttggttt gtctgccatg atgtatacat tatgtgagtt ataattgtat    3180
tccattttgt gtccaagaat gtttccatct tctttaaaat caataccttt taactcgatt    3240
ctattaacaa gggtatcacc ttcaaacttg acttcagcac gtgtcttgta gttcccgtca    3300
tctttgtaaa atatagttct ttcctgtaca taaccttcgg gcatggcact cttgaaaaag    3360
tcatgctgtt tcatatgatc tgggtatcta gaaaagcatt gaacaccata agagagagta    3420
gtgacaagcg ttggccatgg aacaggtagc ttcccagtag tgcaaataaa tttaagggta    3480
agttttccgt atgttgcatc accttcaccc tctccactaa cagagaattt ttgcccatta    3540
acatcgccat ctaattcaac aagaattggg acaactccag tgaaaagttc ttctccttta    3600
ctcataaagc ttccctccta gcttttattc aatatcattt acatatcata ctaaaattaa    3660
aggctaaagg gaaacgatgt ctaacgaaaa aaaggccaaa tcatgtttgg cctttggcgg    3720
ttatttcgat gattgtcccg aattctggcc cttaaggcca attctcatgt ttgacagctt    3780
atcatcggca atagttaccc ttattatcaa gataagaaag aaaaggattt ttcgctacgc    3840
tcaaatcctt taaaaaaaca caaaagacca cattttttaa tgtggtcttt attcttcaac    3900
taaagcaccc attagttcaa caaacgaaaa ttggataaag tgggatattt ttaaaatata    3960
tatttatgtt acagtaatat tgacttttaa aaaaggattg attctaatga agaaagcaga    4020
caagtaagcc tcctaaattc actttagata aaaatttagg aggcatatca aatgaacttt    4080
aataaaattg atttagacaa ttggaagaga aaagagatat ttaatcatta tttgaaccaa    4140
caaacgactt ttagtataac cacagaaatt gatattagtg ttttataccg aaacataaaa    4200
caagaaggat ataaatttta ccctgcattt attttcttag tgacaagggt gataaactca    4260
aatacagctt ttagaactgg ttacaatagc gacggagagt taggttattg ggataagtta    4320
gagccacttt atacaatttt tgatggtgta tctaaaacat tctctggtat ttggactcct    4380
gtaaagaatg acttcaaaga gttttatgat ttataccttt ctgatgtaga gaaatataat    4440
ggttcgggga aattgtttcc caaaacacct atacctgaaa atgctttttc tctttctatt    4500
attccatgga cttcatttac tgggtttaac ttaaatatca ataataatag taattacctt    4560
ctacccatta ttacagcagg aaaattcatt aataaaggta attcaatata tttaccgcta    4620
tctttacagg tacatcattc tgtttgtgat ggttatcatg caggattgtt tatgaactct    4680
attcaggaat tgtcagatag gcctaatgac tggcttttat aatatgagat aatgccgact    4740
gtacttttta cagtcggttt tctaatgtca ctaacctgcc ccgttagttg aagaaggttt    4800
ttatattaca gctccagatc ctctacgccg gacgcatcgt ggccggcatc accggcgcca    4860
caggtgcggt tgctggcgcc tatatcgccg acatcaccga tggggaagat cgggctcgcc    4920
acttcgggct catgagcgct tgtttcggcg tgggtatggt ggcaggcccc gtggccgggg    4980
gactgttggg cgccatctcc ttgcatgccc agaaatttat ccttaagctg gattcaggaa    5040
gaggggcgtt tgacaggaag ggggagnagg catataatga gatgagtact gttaactggg    5100
caggatggat ccccagcttg ttgatacact aatgctttta tatagggaaa aggtggtgaa    5160
ctactgtgga agttactgac gtaagattac gggtcgaccg ggaaaaccct ggcgttaccc    5220
aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc    5280
gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc tttgcctggt    5340
ttccggcacc agaagcggtg ccggaaagct ggctggagtg cgatcttcct gaggccgata    5400
ctgtcgtcgt cccctcaaac tggcagatgc acggttacga tgcgcccatc tacaccaacg    5460
taacctatcc cattacggtc aatccgccgt ttgttcccac ggagaatccg acgggttgtt    5520
actcgctcac atttaatgtt gatgaaagct ggctacagga aggccagacg cgaattattt    5580
ttgatggcgt taactcggcg tttcatctgt ggtgcaacgg gcgctgggtc ggttacggcc    5640
aggacagtcg tttgccgtct gaatttgacc tgagcgcatt tttacgcgcc ggagaaaacc    5700
gcctcgcggt gatggtgctg cgctggagtg acggcagtta tctggaagat caggatatgt    5760
ggcggatgag cggcattttc cgtgacgtct cgttgctgca taaaccgact acacaaatca    5820
gcgatttcca tgttgccact cgctttaatg atgatttcag ccgcgctgta ctggaggctg    5880
aagttcagat gtgcggcgag ttgcgtgact acctacgggt aacagtttct ttatggcagg    5940
gtgaaacgca ggtcgccagc ggcaccgcgc ctttcggcgg tgaaattatc gatgagcgtg    6000
gtggttatgc cgatcgcgtc acactacgtc tgaacgtcga aaacccgaaa ctgtggagcg    6060
ccgaaatccc gaatctctat cgtgcggtgg ttgaactgca caccgccgac ggcacgctga    6120
ttgaagcaga agcctgcgat gtcggtttcc gcgaggtgcg gattgaaaat ggtctgctgc    6180
tgctgaacgg caagccgttg ctgattcgag gcgttaaccg tcacgagcat catcctctgc    6240
atggtcaggt catggatgag cagacgatgg tgcaggatat cctgctgatg aagcagaaca    6300
actttaacgc cgtgcgctgt tcgcattatc cgaaccatcc gctgtggtac acgctgtgcg    6360
accgctacgg cctgtatgtg gtggatgaag ccaatattga aacccacggc atggtgccaa    6420
tgaatcgtct gaccgatgat ccgcgctggc taccggcgat gagcgaacgc gtaacgcgaa    6480
tggtgcagcg cgatcgtaat cacccgagtg tgatcatctg gtcgctgggg aatgaatcag    6540
gccacggcgc taatcacgac gcgctgtatc gctggatcaa atctgtcgat ccttcccgcc    6600
cggtgcagta tgaaggcggc ggagccgaca ccacggccac cgatattatt tgcccgatgt    6660
acgcgcgcgt ggatgaagac cagcccttcc cggctgtgcc gaaatggtcc atcaaaaaat    6720
ggctttcgct acctggagag acgcgcccgc tgatcctttg cgaatacgcc cacgcgatgg    6780
gtaacagtct tggcggtttc gctaaatact ggcaggcgtt tcgtcagtat ccccgtttac    6840
agggcggctt cgtctgggac tgggtggatc agtcgctgat taaatatgat gaaaacggca    6900
acccgtggtc ggcttacggc ggtgattttg gcgatacgcc gaacgatcgc cagttctgta    6960
tgaacggtct ggtctttgcc gaccgcacgc cgcatccagc gctgacggaa gcaaaacacc    7020
agcagcagtt tttccagttc cgtttatccg ggcaaaccat cgaagtgacc agcgaatacc    7080
tgttccgtca tagcgataac gagctcctgc actggatggt ggcgctggat ggtaagccgc    7140
tggcaagcgg tgaagtgcct ctggatgtcg ctccacaagg taaacagttg attgaactgc    7200
ctgaactacc gcagccggag agcgccgggc aactctggct cacagtacgc gtagtgcaac    7260
cgaacgcgac cgcatggtca gaagccgggc acatcagcgc ctggcagcag tggcgtctgg    7320
cggaaaacct cagtgtgacg ctccccgccg cgtcccacgc catcccgcat ctgaccacca    7380
gcgaaatgga tttttgcatc gagctgggta ataagcgttg gcaatttaac cgccagtcag    7440
gctttctttc acagatgtgg attggcgata aaaaacaact gctgacgccg ctgcgcgatc    7500
agttcacccg tgcaccgctg gataacgaca ttggcgtaag tgaagcgacc cgcattgacc    7560
ctaacgcctg ggtcgaacgc tggaaggcgg cgggccatta ccaggccgaa gcagcgttgt    7620
tgcagtgcac ggcagataca cttgctgatg cggtgctgat tacgaccgct cacgcgtggc    7680
agcatcaggg gaaaacctta tttatcagcc ggaaaaccta ccggattgat ggtagtggtc    7740
aaatggcgat taccgttgat gttgaagtgg cgagcgatac accgcatccg gcgcggattg    7800
gcctgaactg ccagctggcg caggtagcag agcgggtaaa ctggctcgga ttagggccgc    7860
aagaaaacta tcccgaccgc cttactgccg cctgttttga ccgctgggat ctgccattgt    7920
cagacatgta taccccgtac gtcttcccga gcgaaaacgg tctgcgctgc gggacgcgcg    7980
aattgaatta tggcccacac cagtggcgcg gcgacttcca gttcaacatc agccgctaca    8040
gtcaacagca actgatggaa accagccatc gccatctgct gcacgcggaa gaaggcacat    8100
ggctgaatat cgacggtttc catatgggga ttggtggcga cgactcctgg agcccgtcag    8160
tatcggcgga attacagctg agcgccggtc gctaccatta ccagttggtc tggtgtcaaa    8220
aataagcatg caccattcct tgcggcggcg gtgctcaacg gcctcaacct actactgggc    8280
tgcttcctaa tgcaggagtc gcataaggga gagcgtcgac atggatgagc gatgatgata    8340
tccgtttagg ctgggcggtg atagcttctc gttcaggcag tacgcctctt ttcttttcca    8400
gacctgaggg aggcggaaat ggtgtgaggt tcccggggaa aagccaaata ggcgatcgcg    8460
ggagtgcttt atttgaagat caggctatca ctgcggtcaa tagatttcac aatgtgatgg    8520
ctggacagcc tgaggaactc tcgaacccga atggaaacaa ccagatattt atgaatcagc    8580
gcggctcaca tggcgttgtg ctggcaaatg caggttcatc ctctgtctct atcaatacgg    8640
caacaaaatt gcctgatggc aggtatgaca ataaagctgg agcgggttca tttcaagtga    8700
acgatggtaa actgacaggc acgatcaatg ccaggtctgt agctgtgctt tatcctgatg    8760
atattgcaaa agcgcctcat gttttccttg agaattacaa aacaggtgta acacattctt    8820
tcaatgatca actgacgatt accttgcgtg cagatgcgaa tacaacaaaa gccgtttatc    8880
aaatcaataa tggaccagac gacaggcgtt taaggatgga gatcaattca caatcggaaa    8940
aggagatcca atttggcaaa acatacacca tcatgttaaa aggaacgaac agtgatggtg    9000
taacgaggac cgagaaatac agttttgtta aaagagatcc agcgtcggcc aaaaccatcg    9060
gctatcaaaa tccgaatcat tggagccagg taaatgctta tatctataaa catgatggga    9120
gccgagtaat tgaattgacc ggatcttggc ctggaaaacc aatgactaaa aatgcagacg    9180
gaatttacac gctgacgctg cctgcggaca cggatacaac caacgcaaaa gtgattttta    9240
ataatggcag cgcccaagtg cccggtcaga atcagcctgg ctttgattac gtgctaaatg     9300
gtttatataa tgactcgggc ttaagcggtt ctcttcccca ttgagggcaa ggctagacgg     9360
gacttaccga aagaaaccat caatgatggt ttcttttttg ttcataaatc agacaaaact     9420
tttctcttgc aaaagtttgt gaagtgttgc acaatataaa tgtgaaatac ttcacaaaca     9480
aaaagacatc aaagagaaac ataccctgca aggatgctga tattgtctgc atttgcgccg     9540
gagcaaacca aaaacctggt gagacacgcc ttgaattagt agaaaagaac ttgaagattt     9600
tcaaaggcat cgttagtgaa gtcatggcga gcggatttga cggcattttc ttagtcggta     9660
acaatcctcg ttaaaggaca aggacctgag cggaagtgta tcgtacagta gacggagtat     9720
actagtatag tctatagtcc gtggaattat tatatttatc tccgacgata ttctcatcag     9780
tgaaatccag ctggagttct ttagcaaatt tttttattag ctgaacttag tattagtggg     9840
gccgctgata attactaata ctaggagaag ttaataaata cgtaaccaac atgattaaca     9900
attattagag gtcatcgttc aaaatggtat gcgttttgac acatccacta tatatccgtg     9960
tcgttctgtc cactcctgaa tcccattcca gaaattctct agcgattcca gaagtttctc    10020
agagtcggaa agttgaccag acattacgaa ctggcacaga tggtcataac ctgaaggaag    10080
atctgattgc ttaactgctt cagttaagac cgaagcgctc gtcgtataac agatgcgatg    10140
atgcagacca atcaacatgg cacctgccat tgctacctgt acagtcaagg atggtagaaa    10200
tgttgtcggt ccttgcacac gaatattacg ccatttgcct gcatattcaa acagctcttc    10260
tacgataagg gcacaaatcg catcgtggaa cgtttgggct tctaccgatt tagcagtttg    10320
atacactttc tctaagtatc cacctgaatc ataaatcggc aaaatagaga aaaattgacc    10380
atgtgtaagc ggccaatctg attccacctg agatgcataa tctagtagaa tctcttcgct    10440
atcaaaattc acttccacct tccactcacc ggttgtccat tcatggctga actctgcttc    10500
ctctgttgac atgacacaca tcatctcaat atccgaatag ggcccatcag tctgacgacc    10560
aagagagcca taaacaccaa tagccttaac atcatcccca tatttatcca atattcgttc    10620
cttaatttca tgaacaatct tcattctttc ttctctagtc attattattg gtccattcac    10680
tattctcatt cccttttcag ataattttag atttgctttt ctaaataaga atatttggag    10740
agcaccgttc ttattcagct attaataact cgtcttccta agcatcatgg tctcactttt    10800
ccactttttg tcttgtccac taaaaccctt gatttttcat ctgaataaat gctactatta    10860
ggacacataa tattaaaaga aacccccatc tatttagtta tttgtttagt cacttataac    10920
tttaacagat ggggtttttc tgtgcaacca attttaaggg ttttcaatac tttaaaacac    10980
atacatacca acacttcaac gcacctttca gcaactaaaa taaaaatgac gttatttcta    11040
tatgtatcaa gataagaaag aacaagttca aaaccatcaa aaaaagacac cttttcaggt    11100
gcttttttta ttttataaac tcattccctg atctccccat actcctccaa tccaaagcta    11160
tttagaaaga ttactatatc ctcaaacagg cggtaaccgg cctcttcatc gggaatgcgc    11220
gcgaccttca gcatcgccgg catgtccccc tggcggacgg gaagtatcca gctcgaggtc    11280
gggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc    11340
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc    11400
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg    11460
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt    11520
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc    11580
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc    11640
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag    11700
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg    11760
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa    11820
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag    11880
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact    11940
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa    12000
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt    12060
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag    12120
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca    12180
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc    12240
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt    12300
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg    12360
ttgttgccat tgctgcaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca    12420
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg    12480
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca    12540
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg    12600
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct    12660
cttgcccggc gtcaacacgg gataataccg cgccacatag cagaacttta aaagtgctca    12720
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca    12780
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg    12840
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac    12900
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt    12960
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc    13020
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat    13080
taacctataa aaataggcgt atcacgaggc cctttcgtct tcaagaatt                13129
<210>9
<211>87
<212>DNA
<213>人工序列
<220>
<223>启动子PR30
<400>9
gaattcatgc atcgcggagg tgagatttga cactagtagg ctacgggact ataatgcggg    60
aagtactgtt aactgcagga taagctt                                        87
<210>10
<211>86
<212>DNA
<213>人工序列
<220>
<223>启动子PR43
<400>10
gaattcatgc attcgaattt ggaaatcgac aggagcgggc gggtagggta taatatatgt    60
agtactgtta actgcaggat aagctt                                         86
<210>11
<211>87
<212>DNA
<213>人工序列
<220>
<223>启动子PR119
<400>11
gaattcatgc atcgagcgga agtttgttga cacagctcca ggatacaaat ataatgggtc    60
gagtactgtt aactgcagga taagctt                                        87
<210>12
<211>86
<212>DNA
<213>人工序列
<220>
<223>启动子PR164
<400>12
gaattcatgc atggacagtt cgtctttgac aaatctaaga aagggaacta taatgtgggc    60
agtactgtta actgcaggat aagctt                                         86
<210>13
<211>87
<212>DNA
<213>人工序列
<220>
<223>启动子PR342
<400>13
gaattcatgc atgcggatgg aaggggttga caccggcgcc gggtccaggt ataatcttga    60
cagtactgtt aactgcagga taagctt                                        87
<210>14
<211>87
<212>DNA
<213>人工序列
<220>
<223>启动子PR409
<400>14
gaattcatgc atagaggagt ttattcttga caaatgcgag gcagaatggt ataatacgta    60
gagtactgtt aactgcagga taagctt                                        87
<210>15
<211>87
<212>DNA
<213>人工序列
<220>
<223>启动子PR519
<400>15
gaattcatgc atagtaaagt ttattcttga caagaattgg cgcgggtgat ataataaata    60
cagtactgtt aactgcagga taagctt                                        87
<210>16
<211>2591
<212>DNA
<213>枯草芽孢杆菌(Bacillus subtilis)
<220>
<221>CDS
<222>(997)..(2199)
<223>MetE编码序列
<400>16
ggatccgctt tgaaatgcgg agcagaaaga atggtgaacg gctgctcaac tgttttctta     60
tcatttcctt ccggacggat aaacagctgc cgcgcaaata aattgtgcca tgcgaactca    120
tttacgacag tgatcggcag cctgtatttc tcgtctgctc cggcaaatcc ttcgaaaaca    180
aacagttcat ctcgctcctt taaatagctg acaactttcg tgtacagccg ctcaaacgct    240
tcttctgaaa tcggctgatt caccgggccc caatcgatct tatttttcgt gctttcttcc    300
tccacgatga atttatcttt aggtgagcgt cctgtgtaag cgcctgttgt cgcgcgaaca    360
gcacctgtgg atgttaaaat gccttcgttt cgggagagga ctttttctgt tagctgtgct    420
gctgataaat tatgacgcac atttggacat gttaataagg cttgtgaatc agcggtcaaa    480
tcaactgagt tcatatgaaa ccttccttta tcgttttttg tgttttgcta attgtgaatt    540
agtataacat atattttcaa atagtctata ctatttattg ttttttgtgt gtgcatttcc    600
attgttttcc ctcaatatag gtgcctattt cttctgaatc atattgacat tgcaaaccct    660
tttacgataa gatatttcat tgagcggata ctcttatccc gagctggcgg agggacaggc     720
cctatgaagc ccagcaaccg gtttctctgt tatttattat gttcaattga gtgagacaac     780
caaggtgcta acctgttgca aggttgtatg attccttgag cgataagagt gaaaggcaca     840
aagaccaaac cctttcctcg atggaaaagg tttttttatt tcataaatat gccaattaac     900
attctctaat ataactgtac attgtataag agggagcgag ttccgtatca tatatacaag     960
gtctttcggg aggccttgtg caggaggaag caaatc atg agt aaa aat cgt cgt      1014
                                        Met Ser Lys Asn Arg Arg
                                        1               5
tta ttt aca tca gaa tct gtt acg gag ggg cat ccg gat aaa atc tgt      1062
Leu Phe Thr Ser Glu Ser Val Thr Glu Gly His Pro Asp Lys Ile Cys
            10                  15                  20
gac cag att tat gac agc att tta gat gaa att tta aag aaa gac cct      1110
Asp Gln Ile Tyr Asp Ser Ile Leu Asp Glu Ile Leu Lys Lys Asp Pro
        25                  30                  35
aac gcg cgt gtt gct tgt gaa aca tct gtg aca aca ggt ttg gtt ctt      1158
Asn Ala Arg Val Ala Cys Glu Thr Ser Val Thr Thr Gly Leu Val Leu
    40                  45                  50
gta agc gga gag atc aca act tct acg tat gtt gac att ccg aaa acg      1206
Val Ser Gly Glu Ile Thr Thr Ser Thr Tyr Val Asp Ile Pro Lys Thr
55                  60                  65                  70
gtt cgc caa acc att aaa gaa atc gga tac aca cgt gca aaa tac gga      1254
Val Arg Gln Thr Ile Lys Glu Ile Gly Tyr Thr Arg Ala Lys Tyr Gly
                75                  80                  85
ttt gat gcg gaa act tgt gcg gtt tta aca tca att gat gag cag tct      1302
Phe Asp Ala Glu Thr Cys Ala Val Leu Thr Ser Ile Asp Glu Gln Ser
            90                  95                  100
gct gat atc gcg atg ggc gta gac cca gcg ctt gaa gcc cgt gaa ggc      1350
Ala Asp Ile Ala Met Gly Val Asp Pro Ala Leu Glu Ala Arg Glu Gly
        105                 110                 115
aca atg agc gac gaa gaa att gaa gcg att ggt gcg ggt gac caa gga      1398
Thr Met Ser Asp Glu Glu Ile Glu Ala Ile Gly Ala Gly Asp Gln Gly
    120                 125                 130
tta atg ttc ggt tat gtg tgc aac gaa acg aaa gag ctt atg cct ctt      1446
Leu Met Phe Gly Tyr Val Cys Asn Glu Thr Lys Glu Leu Met Pro Leu
135                 140                 145                 150
cca att tca ctt gcc cat aaa tta gcc cgc cgc cta agt gaa gtc cgt      1494
Pro Ile Ser Leu Ala His Lys Leu Ala Arg Arg Leu Ser Glu Val Arg
                155                 160                 165
aaa gaa gat att ctt ccg tac ctt cgc cct gac ggc aaa aca cag gta      1542
Lys Glu Asp Ile Leu Pro Tyr Leu Arg Pro Asp Gly Lys Thr Gln Val
            170                 175                 180
acg gtt gag tac gat gaa aat aac aaa cca gtc cgc att gac gcg att      1590
Thr Val Glu Tyr Asp Glu Asn Asn Lys Pro Val Arg Ile Asp Ala Ile
        185                 190                 195
gtt att tca act cag cat cac cct gaa att aca ctt gag caa att cag      1638
Val Ile Ser Thr Gln His His Pro Glu Ile Thr Leu Glu Gln Ile Gln
    200                 205                 210
cgc aac att aaa gaa cat gta atc aat ccg gtt gtt cct gaa gag ctg      1686
Arg Asn Ile Lys Glu His Val Ile Asn Pro Val Val Pro Glu Glu Leu
215                 220                 225                 230
att gat gaa gaa aca aaa tat ttc atc aac cct aca gga cgt ttc gta      1734
Ile Asp Glu Glu Thr Lys Tyr Phe Ile Asn Pro Thr Gly Arg Phe Val
                235                 240                 245
atc gga ggc cct caa ggg gat gcg gga ctt aca gga cgc aaa atc atc      1782
Ile Gly Gly Pro Gln Gly Asp Ala Gly Leu Thr Gly Arg Lys Ile Ile
            250                 255                 260
gtt gat acg tac ggc ggc tat gca cgc cac ggc gga ggc gcg ttc tca      1830
Val Asp Thr Tyr Gly Gly Tyr Ala Arg His Gly Gly Gly Ala Phe Ser
        265                 270                 275
ggt aag gac gcg acg aag gta gac cgt tct gca gct tat gcg gca aga      1878
Gly Lys Asp Ala Thr Lys Val Asp Arg Ser Ala Ala Tyr Ala Ala Arg
    280                 285                 290
tac gtt gcg aaa aac atc gtt gcg gct gag ctt gct gat tct tgc gaa      1926
Tyr Val Ala Lys Asn Ile Val Ala Ala Glu Leu Ala Asp Ser Cys Glu
295                 300                 305                 310
gta cag ctt gct tac gcg atc ggt gtt gca cag cct gtg tca atc tca      1974
Val Gln Leu Ala Tyr Ala Ile Gly Val Ala Gln Pro Val Ser Ile Ser
                315                 320                 325
atc aac aca ttc ggt tca gga aaa gct tct gag gaa aaa ctg att gaa      2022
Ile Asn Thr Phe Gly Ser Gly Lys Ala Ser Glu Glu Lys Leu Ile Glu
            330                 335                 340
gtt gtt cgc aat aac ttt gat tta cga cct gcc ggc att atc aaa atg      2070
Val Val Arg Asn Asn Phe Asp Leu Arg Pro Ala Gly Ile Ile Lys Met
        345                 350                 355
ctt gat ttg cgc cgt ccg atc tat aaa caa act gct gcg tac ggc cac      2118
Leu Asp Leu Arg Arg Pro Ile Tyr Lys Gln Thr Ala Ala Tyr Gly His
    360                 365                 370
ttt gga cgt cac gat gtt gac ctt cca tgg gag cgc aca gac aaa gcg      2166
Phe Gly Arg His Asp Val Asp Leu Pro Trp Glu Arg Thr Asp Lys Ala
375                 380                 385                 390
gag cag ctg cgt aaa gaa gcg tta gga gaa taa ttttatagcc gcttactggt    2219
Glu Gln Leu Arg Lys Glu Ala Leu Gly Glu
                395                 400
taagcggctt tccctttttt atcgttgtat tcatgtttat ttttttacat aactgcgaaa    2279
ccaaatacta ttcacagcgt ctataaatag gggttcaatg atgacaattt taattatgga    2339
ggcaatacta tgtgtggatt tgtcggggtt tttaacaagc atccgttagc tcaaaccgct    2399
gatcaagaag aactaatcaa acaaatgaac caaatgatcg ttcaccgcgg tcctgacagt    2459
gatggatatt tccatgatga gcacgtcggc ttcggattca gacggctcag cattattgat    2519
gtagaaaatg gtggacagcc tttatcatat gaagatgaaa catattggat tatctttaac    2579
ggagtaaatc ta                                                        2591
<210>17
<211>400
<212>PRT
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>17
Met Ser Lys Asn Arg Arg Leu Phe Thr Ser Glu Ser Val Thr Glu Gly
1               5                   10                  15
His Pro Asp Lys Ile Cys Asp Gln Ile Tyr Asp Ser Ile Leu Asp Glu
            20                  25                  30
Ile Leu Lys Lys Asp Pro Asn Ala Arg Val Ala Cys Glu Thr Ser Val
        35                  40                  45
Thr Thr Gly Leu Val Leu Val Ser Gly Glu Ile Thr Thr Ser Thr Tyr
    50                  55                  60
Val Asp Ile Pro Lys Thr Val Arg Gln Thr Ile Lys Glu Ile Gly Tyr
65                  70                  75                  80
Thr Arg Ala Lys Tyr Gly Phe Asp Ala Glu Thr Cys Ala Val Leu Thr
                85                  90                  95
Ser Ile Asp Glu Gln Ser Ala Asp Ile Ala Met Gly Val Asp Pro Ala
            100                 105                 110
Leu Glu Ala Arg Glu Gly Thr Met Ser Asp Glu Glu Ile Glu Ala Ile
        115                 120                 125
Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Val Cys Asn Glu Thr
    130                 135                 140
Lys Glu Leu Met Pro Leu Pro Ile Ser Leu Ala His Lys Leu Ala Arg
145                 150                 155                 160
Arg Leu Ser Glu Val Arg Lys Glu Asp Ile Leu Pro Tyr Leu Arg Pro
                165                 170                 175
Asp Gly Lys Thr Gln Val Thr Val Glu Tyr Asp Glu Asn Asn Lys Pro
            180                 185                 190
Val Arg Ile Asp Ala Ile Val Ile Ser Thr Gln His His Pro Glu Ile
        195                 200                 205
Thr Leu Glu Gln Ile Gln Arg Asn Ile Lys Glu His Val Ile Asn Pro
    210                 215                 220
Val Val Pro Glu Glu Leu Ile Asp Glu Glu Thr Lys Tyr Phe Ile Asn
225                 230                 235                 240
Pro Thr Gly Arg Phe Val Ile Gly Gly Pro Gln Gly Asp Ala Gly Leu
                245                 250                 255
Thr Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Tyr Ala Arg His
            260                 265                 270
Gly Gly Gly Ala Phe Ser Gly Lys Asp Ala Thr Lys Val Asp Arg Ser
        275                 280                 285
Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala Ala Glu
    290                 295                 300
Leu Ala Asp Ser Cys Glu Val Gln Leu Ala Tyr Ala Ile Gly Val Ala
305                 310                 315                 320
Gln Pro Val Ser Ile Ser Ile Asn Thr Phe Gly Ser Gly Lys Ala Ser
                325                 330                 335
Glu Glu Lys Leu Ile Glu Val Val Arg Asn Asn Phe Asp Leu Arg Pro
            340                 345                 350
Ala Gly Ile Ile Lys Met Leu Asp Leu Arg Arg Pro Ile Tyr Lys Gln
        355                 360                 365
Thr Ala Ala Tyr Gly His Phe Gly Arg His Asp Val Asp Leu Pro Trp
    370                 375                 380
Glu Arg Thr Asp Lys Ala Glu Gln Leu Arg Lys Glu Ala Leu Gly Glu
385                 390                 395                 400

Claims (29)

1.一种细菌宿主细胞,其基因组中含有扩增单位的至少两个拷贝,该扩增单位包括:
i)目的基因的至少一个拷贝,及
ii)可表达的条件性必需基因,该基因或是无启动子的,或是由具有活性显著低于该基因的内源启动子的异源启动子转录的,且
如果此条件性必需基因失去功能,则赋予所述细胞针对至少一种特定物质的营养缺陷,或使该细胞不能利用一种或多种特定的单一碳源。
2.权利要求1的细胞,其中所述细菌细胞是原核细胞。
3.权利要求2的细胞,其中所述原核细菌细胞是革兰氏阳性细胞。
4.权利要求3的细胞,其中所述革兰氏阳性细菌细胞是芽孢杆菌属的菌种,其优选自:嗜碱芽孢杆菌,解淀粉芽孢杆菌,短芽孢杆菌,环状芽孢杆菌,凝结芽孢杆菌,灿烂芽孢杆菌,迟缓芽孢杆菌,地衣芽孢杆菌,巨大芽孢杆菌,嗜热脂肪芽孢杆菌,枯草芽孢杆菌及苏云金芽孢杆菌。
5.权利要求1至4中任一项的细胞,其中所述目的基因编码酶,优选为淀粉分解酶,脂肪分解酶,蛋白分解酶,纤维素分解酶,氧化还原酶或者植物细胞壁降解酶,更优选为具有选自下组的活性的酶:氨肽酶,淀粉酶,淀粉葡萄糖苷酶,糖酶,羧肽酶,过氧化氢酶,纤维素酶,几丁质酶,角质酶,环糊精葡萄糖基转移酶,脱氧核糖核酸酶,酯酶,半乳糖苷酶,β-半乳糖苷酶,葡糖淀粉酶,葡萄糖氧化酶,葡萄糖苷酶,卤素过氧化物酶,半纤维素酶,转化酶,异构酶,漆酶,连接酶,脂肪酶,裂合酶,甘露糖苷酶,氧化酶,果胶酶,过氧化物酶,植酸酶,酚氧化酶,多酚氧化酶,蛋白酶,核糖核酸酶,转移酶,谷氨酰胺转移酶,或木聚糖酶。
6.权利要求1至4中任一项的细胞,其中所述目的基因编码抗微生物肽,优选为抗真菌肽或抗细菌肽。
7.权利要求1至4中任一项的细胞,其中所述目的基因编码在人体内有生物活性的肽,优选为药学活性的肽,更优选为胰岛素/胰岛素原/前胰岛素原或其变体;生长激素或其变体,或凝血因子VII或VIII或其变体。
8.权利要求1至7中任一项的细胞,其中所述条件性必需基因编码来自氨基酸的生物合成途径的酶。
9.权利要求8的细胞,其中所述条件性必需基因编码一种或多种参与赖氨酸,亮氨酸或甲硫氨酸合成的多肽,优选地,所述条件性必需基因与来自枯草芽孢杆菌的lysA,leuB,metC,或metE基因同源,更优选地,所述条件性必需基因是来自地衣芽孢杆菌的lysA,leuB,metC,或metE基因。
10.权利要求8的细胞,其中,所述条件性必需基因与下列序列具有至少75%,优选85%,更优选95%,并最优选至少97%的同一性:WO 02/00907A1SEQ ID NO:48所示的地衣芽孢杆菌的lysA序列;地衣芽孢杆菌的leuB序列;WO 02/00907A1的SEQ ID NO:42所示的地衣芽孢杆菌的metC序列,或SEQ ID NO:16的位置997至2199所示的枯草芽孢杆菌的metE序列。
11.权利要求1至7中任一项的细胞,其中所述条件性必需基因编码谷氨酰-tRNA还原酶,优选地,所述条件性必需基因与来自枯草芽孢杆菌的hemA基因同源,更优选地,所述条件性必需基因是来自地衣芽孢杆菌的hemA基因。
12.权利要求1至7中任一项的细胞,其中所述条件性必需基因与地衣芽孢杆菌的hemA序列具有至少75%,优选85%,更优选95%,并最优选至少97%的同一性。
13.权利要求1至7中任一项的细胞,其中所述条件性必需基因编码利用木糖所必需的酶,优选地,此条件性必需基因和来自枯草芽孢杆菌的xylA基因同源,更优选地,此条件性必需基因与地衣芽孢杆菌的木糖异构酶操纵子的基因同源,最优选地,此条件性必需基因与地衣芽孢杆菌的xylA基因同源。
14.权利要求1至7中任一项的细胞,其中所述条件性必需基因编码木糖异构酶,而且此条件性必需基因与地衣芽孢杆菌的xylA基因具有至少75%,优选85%,更优选95%,并最优选至少97%的同一性。
15.权利要求1至7中任一项的细胞,其中所述条件性必需基因编码利用葡萄糖酸所必需的酶,优选地,此条件性必需基因编码葡萄糖酸激酶(EC 2.7.1.12)或者葡萄糖酸透性酶,更优选地,该基因与来自枯草芽孢杆菌的gntK基因或gntP基因同源,最优选地,该基因是来自地衣芽孢杆菌的gntK或gntP基因。
16.权利要1至7中任一项的细胞,其中所述条件性必需基因编码葡萄糖酸激酶(EC 2.7.1.12),或者葡萄糖酸透性酶,或同时编码二者,并与来自地衣芽孢杆菌的gntK和gntP序列中的任何具有至少75%,优选85%,更优选95%,并最优选至少97%的同一性。
17.权利要求1至7中任一项的细胞,其中所述条件性必需基因编码利用甘油所必需的酶,优选地,该条件性必需基因编码甘油吸收易化蛋白(透性酶),甘油激酶,或甘油脱氢酶;更优选地,该条件性必需基因与来自枯草芽孢杆菌的glpP,glpF,glpK,或glpD基因同源;并最优选地,该条件性必需基因包括WO 02/00907A1中SEQ ID NO:26所示的来自地衣芽孢杆菌的glpP,glpF,glpK和glpD基因中的一种或多种。
18.权利要求1至7中任一项的细胞,其中所述条件性必需基因编码甘油吸收易化蛋白(透性酶),甘油激酶,或甘油脱氢酶,并且该条件性必需基因与WO 02/00907A1中SEQ ID NO:26所示的来自地衣芽孢杆菌的glpP,glpF,glpK和glpD序列具有至少75%,优选85%,更优选95%,并最优选至少97%的同一性。
19.权利要求1至7中任一项的细胞,其特中所述条件性必需基因编码利用阿拉伯糖所必需的酶,优选为阿拉伯糖异构酶,更优选地,该基因与来自枯草芽孢杆菌的araA基因同源,最优选地,该基因是WO 02/00907A1中SEQ ID NO:38所示的来自地衣芽孢杆菌的araA基因
20.权利要求1至7中任一项的细胞,其中所述条件性必需基因编码阿拉伯糖异构酶,并与WO 02/00907A1中SEQ ID NO:38所示的来自地衣芽孢杆菌的araA序列具有至少75%,优选85%,更优选95%,并最优选至少97%的同一性。
21.权利要求1至20中任一项的细胞,其中所述扩增单位还包含抗生素选择标记,优选地,该选择标记的侧翼与解离酶位点或res-位点相连。
22.权利要求1至20中任一项的细胞,其中所述扩增单位还包含一个解离酶位点或res-位点。
23.权利要求1至22中任一项的细胞,其中所述扩增单位中所包含的条件性必需基因具有位于该基因上游的至少一个转录终止子。
24.权利要求1至23中任一项的细胞,其中所述条件性必需基因由异源启动子转录,该启动子的活性水平与该条件性必需基因的内源启动子相比降低了2倍,优选5倍,更优选10倍,还更优选50倍,并最优选100倍。
25.权利要求1至23中任一项的细胞,其中所述条件性必需基因无启动子。
26.权利要求25的细胞,其中在所述扩增单位中,所述目的基因位于所述条件性必需基因的上游,而且其中此二基因被同方向转录。
27.权利要求26的细胞,其特征在于所述条件性必需基因通过目的基因的通读转录而得以表达。
28.一种产生目标基因所编码的蛋白质的方法,包括:
a)培养细菌宿主细胞,该细胞的基因组中含有扩增单位的至少两个重复的拷贝,此扩增单位包括:
i)目的基因的至少一个拷贝,及
ii)可表达的条件性必需基因,该基因或是无启动子的,或是由具有活性显著低于该基因的内源启动子的异源启动子转录的,且
如果此条件性必需基因失去功能,则赋予该细胞针对至少一种特定物质的营养缺陷,或使其不能利用一种或多种特定的单一碳源。及
b)回收上述蛋白。
29.一种用来产生含有目的基因的两个或更多扩增的染色体拷贝的细菌细胞的方法,该方法包括:
a)提供细菌宿主细胞,该细胞含有扩增单位的至少一个拷贝,此扩增单位包括:
i)目的基因的至少一个拷贝,及
ii)条件性必需基因的可表达的功能性拷贝,该基因或是无启动子的,或是由具有活性显著低于该基因的内源启动子的异源启动子转录的,且
如果此条件性必需基因失去功能,则赋予该细胞针对至少一种特定物质的营养缺陷,或使其不能利用一种或多种特定的单一碳源。
b)在适合在缺少所述至少一种特定物质和/或含有所述一种或多种特定的单一碳源的培养基中生长的条件下,培养所述细胞,从而使那些在其染色体中所述扩增单位已被复制的细胞具有生长优势。
c)选择在其染色体中扩增单位已被复制的细胞,从而产生目的基因的两个或更多扩增的染色体拷贝。
CNA2004800395994A 2003-10-31 2004-10-29 细菌宿主细胞中稳定地基因扩增的方法 Pending CN1902318A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DKPA200301624 2003-10-31
DKPA200301624 2003-10-31

Publications (1)

Publication Number Publication Date
CN1902318A true CN1902318A (zh) 2007-01-24

Family

ID=34530581

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800395994A Pending CN1902318A (zh) 2003-10-31 2004-10-29 细菌宿主细胞中稳定地基因扩增的方法

Country Status (4)

Country Link
US (4) US7700322B2 (zh)
EP (1) EP1687433A1 (zh)
CN (1) CN1902318A (zh)
WO (1) WO2005042750A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101981193A (zh) * 2008-03-28 2011-02-23 丹尼斯科美国公司 在细菌细胞中扩增基因座的方法
CN109797124A (zh) * 2019-03-28 2019-05-24 湖南师范大学 一株杀虫性能好、对环境安全的苏云金芽胞杆菌及其应用

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7700322B2 (en) 2003-10-31 2010-04-20 Novozymes A/S Method for stable gene-amplification in a bacterial host cell
CN101006174B (zh) 2004-06-21 2010-05-26 诺维信公司 以相同取向稳定保持的至少两个orf的多拷贝
DE102005047596A1 (de) * 2005-10-05 2007-04-12 Degussa Ag Verfahren zur fermentativen Herstellung von L-Aminosäuren unter Verwendung coryneformer Bakterien
US9133464B2 (en) 2007-12-19 2015-09-15 Glycofi, Inc. Yeast strains for protein production
WO2012174430A2 (en) * 2011-06-17 2012-12-20 Invista Technologies S.A.R.L. Methods of making nylon intermediates from glycerol
WO2013092965A2 (en) * 2011-12-23 2013-06-27 Deinove Bacteria with reconstructed transcriptional units and the uses thereof
DE102016116794A1 (de) 2016-09-08 2018-03-08 Universität Bielefeld Verfahren und Mittel zur Herstellung von Aminolävulinsäure
CN109804072A (zh) 2016-10-25 2019-05-24 诺维信公司 地衣芽孢杆菌中flp介导的基因组整合
WO2018134386A1 (en) 2017-01-23 2018-07-26 Novozymes A/S Host cells and methods for producing double-stranded rna
CN111511908A (zh) 2017-11-10 2020-08-07 诺维信公司 温度敏感性cas9蛋白
US20210017544A1 (en) 2017-12-22 2021-01-21 Novozymes A/S Counter-Selection by Inhibition of Conditionally Essential Genes
CN113939588A (zh) 2019-05-15 2022-01-14 诺维信公司 温度敏感性的rna指导的内切核酸酶
WO2020260061A1 (en) 2019-06-25 2020-12-30 Novozymes A/S Counter-selection by inhibition of conditionally essential genes
WO2023178381A1 (en) * 2022-03-21 2023-09-28 The University Of Queensland Methods for gene amplification

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK153992D0 (da) * 1992-12-22 1992-12-22 Novo Nordisk As Metode
GB9518395D0 (en) * 1995-09-08 1995-11-08 Therexsys Ltd Plasmid stabilization
EP0972838B1 (en) * 1998-07-15 2004-09-15 Roche Diagnostics GmbH Escherichia coli host/vector system based on antibiotic-free selection by complementation of an auxotrophy
WO2001090393A1 (en) 2000-05-24 2001-11-29 Novozymes A/S Method for increasing gene copy number in a host cell and resulting host cell
EP1297170B1 (en) * 2000-06-23 2016-03-02 Novozymes A/S Method for stable chromosomal multi-copy integration of genes
US7700322B2 (en) * 2003-10-31 2010-04-20 Novozymes A/S Method for stable gene-amplification in a bacterial host cell

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101981193A (zh) * 2008-03-28 2011-02-23 丹尼斯科美国公司 在细菌细胞中扩增基因座的方法
CN101981193B (zh) * 2008-03-28 2016-05-11 丹尼斯科美国公司 在细菌细胞中扩增基因座的方法
CN109797124A (zh) * 2019-03-28 2019-05-24 湖南师范大学 一株杀虫性能好、对环境安全的苏云金芽胞杆菌及其应用
CN109797124B (zh) * 2019-03-28 2023-01-31 湖南师范大学 一株杀虫性能好、对环境安全的苏云金芽胞杆菌及其应用

Also Published As

Publication number Publication date
US20100151521A1 (en) 2010-06-17
US7700322B2 (en) 2010-04-20
WO2005042750A1 (en) 2005-05-12
US20070134760A1 (en) 2007-06-14
US10280426B2 (en) 2019-05-07
US20160362698A1 (en) 2016-12-15
US20140178930A1 (en) 2014-06-26
US8685653B2 (en) 2014-04-01
EP1687433A1 (en) 2006-08-09
US9458468B2 (en) 2016-10-04

Similar Documents

Publication Publication Date Title
CN1902318A (zh) 细菌宿主细胞中稳定地基因扩增的方法
CN1890373A (zh) Dna克隆载体质粒及其使用方法
CN1296486C (zh) 在cho细胞内表达重组蛋白的方法
CN1208456C (zh) 体内重组
CN1174101C (zh) 在芽孢杆菌属细胞中生产多肽的方法
KR101377582B1 (ko) 디엔에이 모듈 클로닝 벡터 플라스미드 및 그의 용도
CA2480277C (en) Enhanced protein expression in bacillus
Platt et al. Genetic system for reversible integration of DNA constructs and lacZ gene fusions into the Escherichia coli chromosome
CN1063488C (zh) Dna扩增
CN1425068A (zh) 在制备多肽的方法中有效的真菌转录激活因子
WO2003095658A1 (en) Homologous recombination into bacterium for the generation of polynucleotide libraries
CN1575339A (zh) 用于生产异源性蛋白的、衍生自正链rna病毒基因组的复制子
CN1307642A (zh) 通过改变基因拷贝数制备多肽的方法
CN1278302A (zh) 用于减少同源重组现象的腺病毒载体及方法
CN1831133A (zh) 低氧诱导因子小干扰rna质粒
FI20195716A1 (en) Genetically modified fungi and related methods and uses
CN1602359A (zh) 靶向性载体的制备方法及其应用
CN1898388A (zh) Pgro表达单元
CN1863918A (zh) 用于重组腺病毒的包装细胞
CN1865448A (zh) 一种转基因牛的获得方法
CN1314941A (zh) 丙酸杆菌载体
CN108138162A (zh) 重组细胞,重组细胞的制造方法以及有机化合物的生产方法
CN1034578A (zh) 编码构巢曲霉中异青霉素n合成酶的重组dna表达载体和dna化合物
CN1325444A (zh) 经过特异性灭活丁子香酚和阿魏酸分解代谢的基因构建制备取代酚的生产菌株
CN1247786C (zh) 在芽孢杆菌细胞的枯草菌脂肽突变体中生产多肽的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20070124