CN109082431A - 利用改进的肠杆菌科菌株制备芳香族l-氨基酸的方法 - Google Patents

利用改进的肠杆菌科菌株制备芳香族l-氨基酸的方法 Download PDF

Info

Publication number
CN109082431A
CN109082431A CN201710445116.XA CN201710445116A CN109082431A CN 109082431 A CN109082431 A CN 109082431A CN 201710445116 A CN201710445116 A CN 201710445116A CN 109082431 A CN109082431 A CN 109082431A
Authority
CN
China
Prior art keywords
leu
glu
ala
arg
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710445116.XA
Other languages
English (en)
Inventor
C·格特
M·里平
B·巴瑟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Evonik Operations GmbH
Original Assignee
Evonik Degussa GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Evonik Degussa GmbH filed Critical Evonik Degussa GmbH
Priority to CN201710445116.XA priority Critical patent/CN109082431A/zh
Publication of CN109082431A publication Critical patent/CN109082431A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/142Amino acids; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/22Tryptophan; Tyrosine; Phenylalanine; 3,4-Dihydroxyphenylalanine
    • C12P13/227Tryptophan

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Polymers & Plastics (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Animal Husbandry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Food Science & Technology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种利用改进的肠杆菌科菌株制备芳香族L‑氨基酸的方法,所述菌株包含编码热休克蛋白ClpB变体的核苷酸序列,以及与SEQ ID NO:2至少95%相同的氨基酸序列,其中氨基酸序列中位置7处的L‑苏氨酸残基已被L‑异亮氨酸残基代替。

Description

利用改进的肠杆菌科菌株制备芳香族L-氨基酸的方法
发明领域
本发明涉及编码热休克蛋白ClpB变体的核苷酸序列;包含所述核苷酸 序列的重组DNA序列;包含本发明的核苷酸序列或本发明的DNA片段的 微生物;以及通过发酵制备芳香族L-氨基酸的方法。
发明背景
芳香族L-氨基酸用于人类药物和制药工业、食品工业和动物营养。
已知芳香族L-氨基酸可以通过肠杆菌科(Enterobacteriaceae)菌株的发 酵产生,特别是肠杆菌(E.coli)和粘质沙雷氏菌(Serratia marcescens)。因为 意义重大,对改进制备方法一直在做工作。对方法的改进可以涉及发酵措 施,例如,搅拌和供氧,或者涉及营养培养基的组成,例如,发酵期间使 用的糖的选择或糖浓度,或者涉及产物形式的检查,例如通过离子交换色 谱,或者涉及微生物本身的内在性能特性。
几年来,同样已使用重组DNA技术方法用于产生L-氨基酸的肠杆菌 科菌株的靶向改进,例如通过扩增单独的氨基酸生物合成基因或修饰特定 基因的特性并检测对生成的影响。大肠杆菌和沙门氏菌(Salmonella)的细胞 和分子生物学综述可以在Neidhardt(ed):Escherichia coli and Salmonella, Cellular and Molecular Biology,2ndedition,ASM Press,Washington,D.C., USA(1996)中找到。
由于芳香族L-氨基酸的生物合成途径的复杂性和由于其与细胞中的许 多其他代谢途径的相互联系,不可能预测菌株的哪些遗传变化或修饰可以 实现改进的芳香族L-氨基酸(优选L-色氨酸)生成。
此外,需要进一步优化特别是那些适合产生芳香族L-氨基酸,特别是 适合产生L-色氨酸的肠杆菌科菌株,因此提供利用肠杆菌科的微生物发酵 产生芳香族L-氨基酸的改进方法。
因此,提供一种通过发酵高效制备芳香族L-氨基酸的方法也是本发明 的目的。为了这个目的,开发了来自肠杆菌科的新重组微生物。
发明概述
本发明提供编码热休克蛋白ClpB变体的核苷酸序列,其氨基酸序列与 SEQ IDNO:2至少95%相同,其中氨基酸序列中位置7处的L-苏氨酸残基 已被L-异亮氨酸残基代替。
此外,本发明提供包含所述核苷酸序列的DNA片段和载体;提供所述 核苷序列的微生物;以及一种通过发酵制备芳香族L-氨基酸的方法。
发明详述
在形成本发明基础的工作中,令人惊讶地发现包含本发明的核苷酸序 列的本发明的微生物以增加的方式产生芳香族L-氨基酸,特别是L-色氨酸, 并且在细胞或培养基中富集它们。
本发明提供编码热休克蛋白ClpB变体的核苷酸序列,其氨基酸序列与 SEQ IDNO:2至少95%相同,其中氨基酸序列中位置7处的L-苏氨酸残基 已被L-异亮氨酸残基代替。
优选地,本发明的核苷酸序列编码与SEQ ID NO:2至少96%,特别优 选至少97%或至少98%且非常特别优选至少99%或100%相同的多肽,并 且在位置7处的L-苏氨酸残基必须被L-异亮氨酸残基代替。
相似地,本发明提供编码热休克蛋白ClpB变体的核苷酸序列,以及具 有SEQ IDNO:2的序列的氨基酸序列,包括1-20个氨基酸,优选1-10个 氨基酸的取代、缺失、插入和/或倒位,其中在其位置7处的L-苏氨酸残基 必须被L-异亮氨酸残基代替。
所述核苷酸序列编码的多肽优选具有对应于857个氨基酸的长度。
此外,本发明还提供核苷酸序列,其包含上述核苷酸序列或其代表上 述核苷酸序列的片段。这样的片段至少编码上述核苷酸序列的氨基酸序列 的位置5-820。所述片段具有在位置7处的L-苏氨酸残基被L-异亮氨酸残 基取代。在所述片段中保持核苷酸序列的功能性。
大肠杆菌的基因或开放阅读框(ORF)的核苷酸序列是现有技术的一部 分,并且可以从Blattner et al.(Science 277:1453–1462(1997))公开的大肠杆 菌基因组序列收集。已知宿主内源酶(甲硫氨酸氨肽酶)使得可以切除N-端 氨基酸甲硫氨酸。
通过以下细节描述大肠杆菌的clp基因:
描述:分子伴侣蛋白ClpB
可选名称:热休克蛋白F84.1
参考文献:Kitagawa et al.;Journal of Bacteriology 173(14):4247– 4253(1991)
登录号:NC_000913.3,Region 2731600-2734173
可选基因名称:b2592
编码的多肽具有857个氨基酸的长度。
志贺氏菌(Shigella)、沙门氏菌(Salmonella)、克雷伯氏菌(Klebsiella)和 肠杆菌(Enterobacter)的核苷酸序列也是现有技术的一部分。从同样属于肠 杆菌科的福氏志贺氏菌(Shigella flexneri)和肠道沙门氏菌(Salmonella enterica),clpB基因的核苷酸序列相似地是已知的(登录号:NC_004337.2 (REGION:2731535-2734108)和登录号:NC_003197.2(REGION:互补 (2802119-2804692))。clpB的其他核苷酸序列可以从以下肠杆菌找到:鲍氏 志贺氏菌(Shigella boydii)(登录号:WP_073691276.1)、痢疾志贺氏菌(Shigella dysenteriae)(登录号:AHA66636.1);宋内氏志贺氏菌(Shigella sonnei)(登录号:WP_052992191.1)、肺炎克雷伯氏菌(Klebsiella pneumoniae) (登录号:WP_040215337.1)、阴沟肠杆菌(Enterobacter cloacae)(登录号: WP_063941894.1)。
核苷酸序列可以收集自国家医学图书馆(Bethesda,MD,USA)的国家生 物技术信息中心(NCBI)的数据库、欧洲分子生物学实验室(EMBL, Heidelberg,Germany andHinxon,UK)的核苷酸序列数据库或日本DNA数 据库(DDBJ,Mishima,Japan)。
为了更清晰,与大肠杆菌的clpB基因相关的已知序列在SEQ ID No.1 下描述。由此编码的氨基酸序列在SEQ ID No.2下描述。与福氏志贺氏菌 的clpB基因相关的已知序列在SEQ ID No.3下描述。由此编码的氨基酸序 列在SEQ ID No.4下描述。与肠道沙门氏菌的clpB基因相关的已知序列在 SEQ ID No.5下描述。由此编码的氨基酸序列在SEQ ID No.6下描述。
指定世代中描述的基因可以根据本发明使用。此外,可以使用产生自 遗传密码简并性或通过功能中立的有义突变产生的核苷酸序列、等位基因 或基因。优选使用内源基因。
包含功能中立的有义突变的clpB基因的等位基因包括那些在由此编码 的蛋白中导致最多20个,优选最多10个或最多5个,非常特别优选最多3 个或最多2个或最少1个保守氨基酸取代的等位基因。
在芳香族氨基酸的情况下,保守取代是其中苯丙氨酸、色氨酸和酪氨 酸互相取代的取代。在疏水氨基酸的情况下,保守取代是其中亮氨酸、异 亮氨酸和缬氨酸互相取代的取代。在极性氨基酸的情况下,保守取代是其 中谷氨酰胺和天冬酰胺互相取代的取代。在碱性氨基酸的情况下,保守取 代是其中精氨酸、赖氨酸和组氨酸互相取代的取代。在酸性氨基酸的情况 下,保守取代是其中天冬氨酸和谷氨酸互相取代的取代。在包含羟基的氨基酸的情况下,保守取代是其中丝氨酸和苏氨酸互相取代的取代。
相似地,还可以使用编码所述蛋白变体的那些核苷酸序列,所述变体 在N-或C-端额外地包含延伸或截短至少一个氨基酸。这种延伸或截短不超 过40、30、20、10、5、3或2个氨基酸或氨基酸残基。
合适的核苷酸序列还包括编码其中至少一个氨基酸已插入(插入)或去 除(缺失)的蛋白的那些核苷酸序列。称作插入缺失(indels)的这类修饰的最大 数量可以包括2、3、5、10个氨基酸,但是绝不超过20个氨基酸。
还用于本发明的方法的本发明的核苷酸序列可以通过现有技术中描述 的靶向诱变的方法获得。
可以使用位点定向诱变方法,利用诱变寡核苷酸(T.A.Brown: Gentechnologie für Einsteiger[Gene technology for beginners],Spektrum Akademischer Verlag,Heidelberg,1993)或聚合酶链反应(PCR),如Gait: Oligonucleotide synthesis:APractical Approach(IRL Press,Oxford,UK,1984) 或者Newton和Graham(PCR,SpektrumAkademischer Verlag,Heidelberg, 1994)的手册所述。为了在clp基因中构建突变,例如,可以使用来自 Stratagene(Amsterdam,the Netherlands)的快速改变位点定向诱变试剂盒。当 使用这些方法时,在从分离的野生型菌株总DNA开始的聚合酶链反应(PCR) 的辅助下扩增现有技术中描述的clpB基因,克隆入合适的质粒载体,然后 使DNA经过诱变方法。通过“GeneSOEing”(Gene Splicing by Overlap Extension,Horton,MolecularBiotechnology 3:93-98(1995)),可以简单地通 过PCR获得点突变。可以通过DNA测序确定并检查产生的突变,例如根 据Sanger等人的方法(Proceedings of the NationalAcademy of Science USA 74(12):5463-5467(1977))。
可以通过例如转化和/或基因置换或等位基因置换的方法将产生的本 发明的核苷酸序列或DNA片段并入合适的菌株。为此,可以特别使用本发 明的载体,其特点是它们包含本发明的核苷酸或者DNA片段,所述DNA 片段包含本发明的核苷酸序列或其部分。优选地,所述载体额外地包含启 动子。可以将所述载体转化入合适的微生物。
一种习惯方法是基因置换的方法,如Hamilton et al.(Journal ofBacteriology 174,4617–4622(1989))所述,借助于条件复制pSC101衍生物 pMAK705或用pKO3(Link et al.,Journal of Bacteriology 179:6228-6237)。 同样可以使用现有技术中描述的其他方法,例如,Martinez-Morales et al. (Journal of Bacteriology 1999,7143-7148(1999))的方法或Boyd et al.(Journal of Bacteriology 182,842-847(2000))的方法。
同样可以通过接合或转导将产生的核苷酸序列或等位基因转移入各种 菌株。
关于遗传和分子生物学术语的更详细解释可以在已知的教科书中找 到,例如,Birge(Bacterial and Bacteriophage Genetics,4th ed.,Springer Verlag, New York(USA),2000)的教科书或Berg,Tymoczko and Stryer(Biochemistry, 5th ed.,Freemanand Company,New York(USA),2002)的教科书或Sambrook et al.(Molecular Cloning,ALaboratory Manual,(3-Volume Set),Cold Spring Harbor Laboratory Press,ColdSpring Harbor(USA),2001)的手册。
本发明进一步提供来自肠杆菌科的微生物,其包含本发明的核苷酸序 列或所述核苷酸序列的部分或本发明的DNA片段。所述核苷酸序列以表达 形式存在。本发明相似地提供来自肠杆菌科的微生物,其包含本发明的载 体。
在一优选实施方案中,本发明的核苷酸序列或本发明的DNA片段已整 合入染色体。
所述微生物是肠杆菌科的代表,选自埃希氏菌属(Escherichia)、欧文氏 菌属(Erwinia)和普罗威登斯菌属(Providencia)。优选埃希氏菌属。必须特别 提到物种大肠杆菌。优选地,使用具有增加的Trp操纵子表达的微生物。
可以利用上文描述的转化、转导或接合的方法制备本发明的微生物。 优选地,利用上文描述的本发明的载体进行转化、转导或接合。
为了制备本发明的肠杆菌科菌株,优选使用已具有在细胞中富集期望 的芳香族L-氨基酸(特别是L-色氨酸)的能力和/或将其分泌入细胞周围的营 养培养基或在发酵液中积累它的能力的菌株(起始菌株或亲代菌株)。表述 “产生”也可以用于这个。为了本发明的目的,术语“芳香族L-氨基酸”涵盖 氨基酸L-苯丙氨酸、L-色氨酸或L-酪氨酸。本发明的微生物产生芳香族L- 氨基酸,优选L-色氨酸。这里,产生的氨基酸在细胞或培养基中富集。
更特别地,用于本发明的措施的菌株具有在≤(最多)120小时、≤96小 时、≤48小时、≤36小时、≤24小时或≤12小时中于细胞和/或营养培养基 或发酵液中富集或积累≥(最少)0.25g/l、≥0.5g/l、≥1.0g/l、≥1.5g/l、≥2.0 g/l、≥4g/l或≥10g/l的芳香族L-氨基酸(优选L-色氨酸)的能力。这里,所 述菌株可以是通过诱变和选择,通过重组DNA技术或通过两种方法的组合 产生的菌株。
包含本发明的核苷酸序列的优选重组微生物可以从葡萄糖、蔗糖、乳 糖、果糖、麦芽糖、糖蜜、可能淀粉、可能纤维素或者从甘油和乙醇、可 能还从混合物产生芳香族L-氨基酸,L-色氨酸。
适合亲代菌株以及产生或分泌L-色氨酸的埃希氏菌属,特别是物种大 肠杆菌的菌株实例是:
-大肠杆菌SV164(pGH5) (WO 94/08031)
-大肠杆菌AGX17(pGX44)(NRRL B-12263) (US 4,371,614)
-大肠杆菌AGX6(pGX50)aroP(NRRL B-12264) (US 4,371,614)
-大肠杆菌AGX17/pGX50,pACKG4-pps(WO 97/08333)
-大肠杆菌ATCC 31743 (CA 1182409)
-大肠杆菌C534/pD2310,pDM136 (ATCC 39795) (WO8 7/01130)
-大肠杆菌JB102/p5LRPS2 (US 5,939,295).
来自肠杆菌科的产生L-色氨酸或分泌L-色氨酸的菌株优选具有选自以 下的一个或多个遗传或表型特征:5-甲基-DL-色氨酸抗性,5-氟-色氨酸抗 性,4-甲基-DL-色氨酸抗性,6-甲基-DL-色氨酸抗性,4-氟-色氨酸抗性, 6-氟-色氨酸抗性,邻氨基苯甲酸抗性,吲唑氨丙酸抗性,吲哚抗性,吲哚 丙烯酸抗性,需要苯丙氨酸,需要酪氨酸,可能的蔗糖利用能力,色氨酸 操纵子的增强,优选邻氨基苯甲酸合成酶,优选反馈-抗性形式,部分缺陷 的色氨酰基-tRNA合成酶,减弱的色氨酸吸收,缺陷的色氨酸酶,失活的 阻遏蛋白,丝氨酸生物合成的增强,磷酸烯醇丙酮酸合成的增强,D-赤藓 糖4-磷酸合成的增强,3-脱氧-D-arabino-heptulosonate 7-磷酸(DHAP)合成的 增强,分支酸生物合成的增强。
此外,对于用肠杆菌科菌株产生芳香族L-氨基酸,特别是L-色氨酸, 额外地增强已知生物合成途径的一种或多种酶或者回补代谢的酶或者产生 还原型磷酸烟酰胺腺嘌呤二核苷酸的酶或者糖酵解的酶或者PTS酶或者硫 代谢的酶可能是有利的。一般优选使用内源基因。
此外,对于产生芳香族L-氨基酸,特别是L-色氨酸,额外地关闭不期 望的次级反应可能是有利的(Nakayama:"Breeding of Amino Acid Producing Microorganisms",in:Overproduction of Microbial Products,Krumphanzl, Sikyta,Vanek(eds.),AcademicPress,London,UK,1982)。
上文描述的本发明的微生物可以用于产生芳香族L-氨基酸,特别是L- 色氨酸。
本发明特别提供一种制备芳香族L-氨基酸或包含芳香族L-氨基酸的饲 料添加剂的方法,其中将本发明的微生物在培养基中发酵,并且获得的L- 氨基酸在细胞或发酵培养基中富集或者由此分离。所述方法特别适合制备 L-色氨酸或包含L-色氨酸的饲料添加剂。
将本发明的微生物以分批方法、补料分批方法、重复的补料分批方法 或连续方法培养(DE102004028859.3或US 5,763,230)。这类方法的综述可 在Chmiel(Bioprozesstechnik 1.Einführung in die Bioverfahrenstechnik [Bioprocesstechnology 1.Introduction to bioprocess technology](Gustav Fischer Verlag,Stuttgart,1991))的教科书或Storhas(Bioreaktoren und periphere Einrichtungen[Bioreactors and peripheral devices](Vieweg Verlag, Braunschweig/Wiesbaden,1994))的教科书中获得。
在分批方法的情况下,除了一些例外,例如氧和pH矫正剂,所有起始 材料最初以一批的形式装载,并且所述微生物在获得的培养基中培养。
在补料分批方法的情况下,所述微生物最初通过分批方法培养(分批阶 段)。随后以连续或不连续方式向培养物添加产生产物必不可少的起始材 料,如果必要还有多种起始材料(补料阶段)。在制备L-氨基酸的情况下, 包括碳源。
在重复的补料分批方法的情况下,包括补料分批方法,其中,发酵完 成之后,将获得的一部分发酵液用作接种物开始新重复的补料分批方法。 如果必要,这个循环可以重复多次。重复的补料分批方法例如描述于WO 02/18543和WO 05/014843。
在连续方法的情况下,分批或补料分批方法之后是连续添加一种或多 种,可能全部起始材料至培养物并且同时去除发酵液。例如,连续方法在 专利说明书US 5,763,230、WO 05/014840、WO 05/014841和WO 05/014842 中描述。培养基必须以合适的方式满足特定菌株的需求。不同微生物的培 养基在美国细菌学学会的手册“Manual of Methods forGeneral Bacteriology” (Washington D.C.,USA,1981)中描述。术语培养培养基、发酵培养基和营养 培养基或培养基是可交换的。
一般来说,培养基包含一种或多种碳源、氮源和磷源。
作为碳源,可以使用糖和碳水化合物,例如葡萄糖、蔗糖、乳糖、果 糖、麦芽糖、糖蜜、淀粉和可能的纤维素,油和脂肪,例如大豆油、葵花 籽油、花生油和椰子脂肪,脂肪酸,例如棕榈酸、硬脂酸和亚油酸,醇, 例如甘油和乙醇,以及有机酸,例如乙酸。这些物质可以单独或作为混合 物使用。
作为氮源,可以使用有机含氮化合物如蛋白胨、酵母提取物、肉膏、 麦芽提取物、玉米浆、大豆粉和尿素,或者无机化合物如硫酸铵、氯化铵、 磷酸铵、碳酸铵和硝酸铵。氮源可以单独或作为混合物使用。
作为磷源,可使用磷酸、磷酸二氢钾或磷酸氢二钾或者相应的含钠盐。
此外,培养基必须包含生长必需的金属盐,例如硫酸镁或硫酸铁。最 后,除了上文提到的物质,可以使用必需的生长物质如氨基酸和维生素。 此外,可以将合适的前体添加至培养基中。上文提到的起始材料可以以单 一批次的形式添加至培养物中,或者在培养期间适当供给。
发酵一般在5.5-9.0,更特别是6.0-8.0的pH下进行。为了控制培养物 的pH,适当使用碱性化合物如氢氧化钠、氢氧化钾、氨或氨水或者酸性化 合物如磷酸或硫酸。为了控制泡沫的发展,可以使用消泡剂,例如脂肪酸 聚乙二醇酯。为了保持质粒的稳定性,可以向培养基添加合适的选择性物 质,例如抗生素。为了保持需氧条件,将氧气或含氧气体混合物如空气引 入培养物。培养物的温度通常为25℃-45℃,并且优选30℃-40℃。微生物 的活性导致发酵液或培养液中L-氨基酸的富集或积累。继续培养直至形成 最大的期望L-氨基酸。这个目标通常在10小时-160小时内达到。在连续 方法中,较长的培养时间是可能的。
发酵液或培养液理解为表示发酵培养基,其中微生物已在一定温度下 培养一定时间。发酵完成时,所得的发酵液因此包含a)因为微生物细胞繁 殖产生的微生物的生物质(=细胞团),b)发酵期间形成的L-氨基酸,c)发 酵期间形成的有机副产物,以及d)使用的发酵培养基或未被发酵消耗的起 始材料的组分,例如,维生素如硫胺素或者盐如硫酸镁。然后可以收集产 生的培养液或发酵液,并且可以获得或分离期望的L-氨基酸或包含L-氨基 酸的产物。在一种方法变体中,如果需要,将发酵液浓缩,然后纯化或分 离纯净或几乎纯净形式的L-氨基酸。纯化L-氨基酸的典型方法是离子交换 色谱、结晶、提取方法和用活性炭处理。结果获得基本上纯的L-氨基酸, 具有≥90重量%、≥95重量%、≥96重量%、≥97重量%、≥98重量%或≥99 重量%的含量。
在另一方法变体中,同样可以从产生的发酵液制备产物,通过去除发 酵液中存在的细菌生物质至完全程度(100%)或几乎完全程度,即超过或大 于(>)90%、>95%、>97%、>99%,以及通过在产物中留下发酵液的剩余组 分至很大程度,即至30%–100%、40%–100%、50%–100%、60%–100%、 70%–100%、80%–100%或90%–100%的程度,优选大于或等于(≥)50%、 ≥60%、≥70%、≥80%、≥90%或≥95%,或者至完全程度(100%)。
通过使用分离方法,例如离心、过滤、倾析、絮凝或它们的组合,去 除或分离生物质。然后利用已知方法,例如借助于旋转式蒸发器、薄膜蒸 发器、降膜蒸发器,通过反渗透,通过纳滤或它们的组合,将获得的培养 液增稠或浓缩。
然后通过冷冻干燥、喷雾干燥、喷雾造粒的方法或者通过其他过程将 这种浓缩的发酵液加工以给出优选自由流动的细粉。然后可以通过合适的 压实或造粒过程转而将这种自由流动的细粉转化为粗糙的、高度自由流动 的、可储存和基本上无尘的产物。这里,完全去除水至超过90%的程度, 因此产物中的水含量少于10重量%、少于5重量%、少于4重量%或少于3 重量%。
在发酵期间一次或多次分析芳香族L-氨基酸以确定浓度可以通过分离 芳香族L-氨基酸实现,利用离子交换色谱,优选阳离子交换色谱,随后利 用茚三酮柱后衍生化,如Spackman et al.(Analytical Chemistry 30:1190-1206 (1958))所述。还可以采用邻苯二甲醛而不是茚三酮用于柱后衍生化。离子 交换色谱的综述文章可以在Pickering(LC·GC(Magazine of Chromatographic Science)7(6),484-487(1989))中找到。
同样可以进行柱前衍生化,例如使用邻苯二甲醛或异硫氰酸苯酯,并 且通过反相色谱(RP),优选高效液相色谱(HPLC)形式,分级分离所得的氨 基酸衍生物。例如,这样的方法在Lindroth et al.(Analytical Chemistry 51: 1167-1174(1979))中描述。通过光度法进行检测(吸收、荧光)。
氨基酸分析的综述可以在教科书Lottspeich和Zorbas的教科书 "Bioanalytik"[Bioanalysis](Spektrum Akademischer Verlag,Heidelberg, Germany 1998)中找到。
本发明的方法用于选自芳香族L-氨基酸化合物L-酪氨酸、L-苯丙氨酸 和L-色氨酸的有机化学化合物的发酵生产。特别优选L-色氨酸。
附图说明
图1示出包含clpB基因的置换载体pKO3_clpBT7I的图。
图2示出质粒pMU91的图。
指定长度应当理解为近似值。有关的进一步细节可以在实施例中找到。
实施例
以下在示例性实施方案的基础上更特别说明本发明。
用于大肠杆菌的基本(M9)和完全培养基(LB)由J.H.Miller(A short course inbacterial genetics(1992),Cold Spring Harbor Laboratory Press)描述。 从大肠杆菌分离质粒DNA以及限制、连接、Klenow和碱性磷酸酶处理的 所有技术按照Sambrook et al.(Molecular cloning-A laboratory manual(1989) Cold Spring Harbor LaboratoryPress)进行。除非另有说明,大肠杆菌的转化 按照Chung et al.(Proceedings of theNational Academy of Sciences of the United States of America,USA(1989)86:2172-2175)进行。
除非另有说明,菌株制备和转化中的温育温度为37℃。
实施例1
置换载体pKO3_clpBT7I的构建
可以鉴定导致位置7处从苏氨酸(T)至异亮氨酸(I)的氨基酸取代的clpB 基因中的点突变。
利用聚合酶链反应(PCR)和合成的寡核苷酸扩增clpB等位基因。将大 肠杆菌K12MG1655中clpB基因的核苷酸序列(登录号NC_000913.3,区域: 2731600-2734173,Blattner et al.(Science 277:1453-1462(1997))用作起始点 合成PCR引物(EurofinsMWG GmbH,Ebersberg,Germany)。
引物设计和两侧的PCR
左侧
clpBT7I_lfw
5'CAGTTAGCGGCCGCCTGTTCGGCTCGTTCGGTAAGG 3'
随机NotI SEQ ID No.9
clpBT7I_lrv
5'GTTATGCGTCTGGATCGTCTTATTAATAAATTCCAGCTTGCTCTTG 3'
g2732176a SEQ ID No.10
利用“QIAGEN Genomic-tips 100/G”(QIAGEN GmbH,Hilden,Germany) 根据来自制造商的信息分离用于PCR的染色体大肠杆菌MG1655DNA。利 用两条特异性引物“clpBT7I_lfw”和“clpBT7I_lrv”,在标准PCR条件下(Innis et al.:PCR Protocols.A guide tomethods and applications,1990,Academic Press)用Pfu DNA聚合物(PromegaCorporation,Madison,USA)用MG1655 DNA作为模板进行PCR以扩增片段“clpBT7I_left”(长度:539bp)。通过引 物,将NotI限制性位点和点突变g2732176a引入PCR产物。
右侧
clpBT7I_rfw
5'CAAGAGCAAGCTGGAATTTATTAATAAGACGATCCAGACGCATAAC 3'
g2732176a SEQ ID No.11
clpBT7I_rrv
5'TAGGTAGCGGCCGCCAATCGAGCGGGAACGGAAGTC 3'
随机NotI SEQ ID No.12
利用两条引物“clpBT7I_rfw”和“clpBT7I_rrv”,用MG1655DNA作为模 板进行PCR以扩增片段“clpBT7I_right”(长度:580bp)。通过引物,将NotI 限制性位点和点突变g2732176a引入PCR产物。
通过重叠PCR融合两侧
利用两条外部引物“clpBT7I_lfw”和“clpBT7I_rrv”通过重叠PCR将两侧 通过它们的重叠区域(重叠)融合在一起。所得产物“clpBT7I_Insert”具有 1073bp的长度。在两端,在每种情况下限制性酶NotI的识别序列在6个 碱基的随机序列之后。
将插入物克隆入pKO3
利用Qiaquick(QIAGEN GmbH,Hilden,Germany)纯化上述融合产物, 然后利用NotI消化。这产生NotI“粘性末端”。再次利用Qiaquick纯化消化 物,并且这还导致去除短切除随机序列。
同样利用NotI切割载体pKO3,并且同时利用碱性磷酸酶去磷酸化。 此后,利用Qiaquick纯化消化物,并且这还导致去除NotI位点之间的短片 段。限制性产物同样具有NotI“粘性末端”。这些是未磷酸化的,防止质粒 的自我连接。
通过利用T4连接酶进行连接以便以1:3的摩尔比连接载体和插入物。 利用1μl的连接反应物转化大肠杆菌(E.coli)克隆菌株NEB5alpha的化学感 受态细胞并涂布在包含20mg/l氯霉素的LB琼脂上。将平板在30℃下温 育40h。
质粒克隆的检测
通过利用限制性酶AcuI切割质粒pKO3_clpBT7I证实成功的克隆。
挑取10个菌落并在每种情况下在30℃/180rpm下于10ml LB+20mg/l 氯霉素中培养过夜。
第二天,在每种情况下将2ml培养物离心并从沉淀制备小量提取物 (miniprep)。
连接产物可以包含两个方向的插入物。AcuI限制性消化使得可以检测 其是否存在及其存在的方向:
方向a的插入物:片段2872bp和3837bp
方向b的插入物:片段1909bp和4800bp
空pKO3载体:片段5681bp(线性化)
利用AcuI切割10个质粒克隆并在0.8%TAE琼脂糖凝胶上分离产物。 选择包含方向“a”的插入物的一个质粒克隆并称作“pKO3_clpBT7I”。
利用引物“pKO3-L”和“pKO3-R”测序所述克隆的插入物。
pKO3-L 5'AGGGCAGGGTCGTTAAATAGC 3'SEQ ID No.13
pKO3-R 5'TTAATGCGCCGCTACAGGGCG 3'SEQ ID No.14
通过利用引物“pKO3-L”和“pKO3-R”(QIAGEN GmbH,Hilden, Germany)确定扩增片段“clpBT7I_Insert”的DNA序列。证实了clpB等位基 因的预期序列,并且克隆片段在SEQID No.7中描述。部分基因产物或由 此衍生的蛋白在SEQ ID No.8中描述。
所得的置换载体pKO3_clpBT7I在图1中示出。
实施例2
用clpB_T7I等位基因置换菌株DM2280的clpB野生型基因
大肠杆菌菌株DM2280/pMU91中clpB基因的位点定向诱变
产生L-色氨酸的大肠杆菌菌株DM2280/pMU91是专利说明书 US-A-5,756,345中描述的大肠杆菌K-12菌株JP6015/pMU91的P1-转导可 获得的trpS+衍生物。pMU91是源自pSC101(Cohen et al.,Journal of Bacteriology 132:734-737(1977))的质粒,其包含TetR、trpE476DCBA和 serA+。JP6015/pMU91依布达佩斯条约在Leibniz Institute DSMZ–德国微 生物和细胞培养物保藏中心(DSMZ,Braunschweig,Germany)储存为DSM 10123,保藏日1995年7月14日。DM2280依布达佩斯条约在Leibniz Institute DSMZ-德国微生物和细胞培养物保藏中心(DSMZ,Braunschweig, Germany)储存为DSM 32450,保藏日1995年7月14日。
通过用质粒pKO3_clpBT7I转化DM2280进行用质粒编码的突变构建 体置换染色体clpB基因。利用Link et al.(Journal of Bacteriology 179: 6228-6237(1997))描述的选择方法进行基因置换并通过测序验证。
置换导致SEQ ID No.7(T7I)中描述的clpB等位基因形式存在于 DM2280中(通过Eurofins MWG GmbH,Ebersberg,Germany测序)。将获得 的菌株称作DM2280_clpBT7I。
从菌株JP6015/pMU91分离专利说明书US-A-5,756,345中描述且携带 色氨酸生成的遗传信息的质粒pMU91。质粒在图2中示出。用所述质粒转 化菌株DM2280_clpBT7I。将获得的转化子之一称作 DM2280_clpBT7I/pMU91。
实施例3
利用菌株DM2280_clpBT7I/pMU91产生L-色氨酸
将菌株DM2280_clpBT7I/pMU91和DM2280/pMU91在30℃下于具有 以下组成的LB培养基上进一步增殖:10g/l细菌用胰蛋白胨、5g/l酵母提 取物、10g/l NaCl(利用NaOH将pH调整至7.5)、2g/l葡萄糖、20g/l琼脂 和5mg/l四环素。在100ml锥形瓶中包含的10ml分批培养物中检测L-色 氨酸的形成。为此,将具有以下组成的10ml预培养基接种:1g/l酵母提 取物、100ml/l MOPS缓冲液(10x)、10g/l甘油和5mg/l四环素,并且在30℃ 和150rpm下于来自Kühner AG(Birsfelden,Switzerland)的ESR培养箱上温 育16小时。
根据表1-3从溶液A和B制备10x MOPS缓冲液;将2个体积的溶液 A无菌添加至3个体积的溶液B中。
表1:10x MOPS缓冲液的溶液A(无菌过滤的)。
组分 浓度
MOPS(吗啉丙磺酸) 419g/L
KOH(固体) 将pH调整至7.4
表2:10x MOPS缓冲液的溶液B。通过高压灭菌消毒(30分钟,121℃)。
组分 浓度
Na<sub>3</sub>柠檬酸盐x 2H<sub>2</sub>O 2.35g/l
FeSO<sub>4</sub>x 7H<sub>2</sub>O 0.22g/l
NH<sub>4</sub>Cl 32.0g/l
MgSO<sub>4</sub>x 7H<sub>2</sub>O 6.7g/l
KCl 4.0g/l
CaCl<sub>2</sub>x 2H<sub>2</sub>O 0.25mg/l
微量元素储备溶液(表3) 3.33ml/l
表3:10x MOPS缓冲液的微量元素储备溶液(在去离子水中)。
组分 浓度
(NH<sub>4</sub>)<sub>6</sub>Mo<sub>7</sub>O<sub>24</sub>x 4H<sub>2</sub>O 3.7mg/l
H<sub>3</sub>BO<sub>3</sub> 24.0mg/l
CoCl<sub>2</sub>x 6H<sub>2</sub>O 7.1mg/l
ZnSO<sub>4</sub>x 7H<sub>2</sub>O 28.7mg/l
MnCl<sub>2</sub>x 4H<sub>2</sub>O 15.8mg/l
CuSO<sub>4</sub>x 5H<sub>2</sub>O 2.5mg/l
在每种情况下将250μl的这种预培养物接种在10ml表4的生产培养 基PM1中,并且在30℃和150rpm下温育72小时。温育之后,利用来自 Dr.Lange(Düsseldorf,Germany)的LP2W光度计在660nm的测量波长下确 定培养悬浮液的光密度(OD)。
表4:PM1培养基:用于100ml锥形瓶中的生产测试
组分 浓度
10X MOPS缓冲液 100ml/l
硫胺素HCl(0.01%) 1.0ml/l
KH2PO4(15mM) 10ml/l
葡萄糖 10g/l
四环素 5mg/l
此后,如Lindroth et al.(Analytical Chemistry(1979)51:1167-1174)所 述,通过反相HPLC确定无菌过滤的培养上清液中形成的L-色氨酸浓度。
表5示出实验结果。与DM2280/pMU91相比,菌株DM2280_clpBT7I /pMU91具有明显增加的L-色氨酸产量。
表5:利用菌株DM2280_clpBT7I/pMU91产生L-色氨酸
菌株 OD(660nm) L-色氨酸,g/l 收率,净%
DM2280/pMU91 3.58 0.82 13.60
DM2280_clpBT7I/pMU91 3.51 0.94 14.45
使用的缩写和名称的含义如下:
CmR:氯霉素抗性基因
sacB:来自枯草芽孢杆菌的sacB基因
RepA:质粒pSC101的温度敏感复制区
clpB′:clpB基因的部分编码区
ryfD:ryfD基因的编码区
′yfiH:yfiH基因的部分编码区
pSC101:质粒片段pSC101
serA:编码D-3-磷酸甘油酸盐脱氢酶的serA基因的编码区
trpE476DCBA:trpE476等位基因的部分色氨酸操纵子trpLEDCBA
tetA:四环素抗性基因
限制性酶缩写的含义如下:
NotI:来自豚鼠耳炎诺卡菌(Nocardia otitidiscaviarum)的限制性内切核 酸酶
SalI:来自白色链霉菌G(Streptomyces albus G)的限制性内切核酸酶
HindIII:来自流感嗜血杆菌Rd(Haemophilus influenzae Rd)的限制性内 切核酸酶
AcuI:来自乙酸钙不动杆菌(Acinetobacter calcoaceticus)的限制性内切 核酸酶
XhoI:来自Xanthomonas holcicola的限制性内切核酸酶
说明书中引用的非专利文献
[1]Neidhardt(ed):Escherichia coli and Salmonella,Cellular andMolecular Biology,2nd edition, ASM Press,Washington,D.C.,USA(1996)
[2]Blattner et al.,Science 277:1453–1462(1997)
[3]Kitagawa et al.;Journal of Bacteriology 173(14):4247–4253(1991)
[4]T.A.Brown:Gentechnologie für Einsteiger[Gene technology forbeginners],Spektrum Akademischer Verlag,Heidelberg,1993
[5]Gait:Oligonucleotide synthesis:A Practical Approach(IRL Press,Oxford,UK,1984)
[6]Newton and Graham PCR,Spektrum Akademischer Verlag,Heidelberg,1994
[7]Horton,Molecular Biotechnology 3:93-98(1995):Gene Splicing byOverlap Extension
[8]Sanger et al.,Proceedings of the National Academy of Science USA74(12):5463-5467(1977)
[9]Hamilton et al.,Journal of Bacteriology 174,4617–4622(1989)
[10]Link et al.,Journal of Bacteriology 179:6228-6237
[11]Martinez-Morales et al.,Journal of Bacteriology 1999,7143-7148(1999)
[12]Boyd et al.(Journal of Bacteriology 182,842-847(2000))
[13]Birge:Bacterial and Bacteriophage Genetics,4th ed.,SpringerVerlag,New York(USA),2000
[14]Berg,Tymoczko and Stryer:Biochemistry,5th ed.,Freeman and Company,New York(USA), 2002
[15]Sambrook et al.:Molecular Cloning,A Laboratory Manual,(3-VolumeSet),Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001
[16]Nakayama:Breeding of Amino Acid Producing Microorganisms,in:Overproduction of Microbial Products,Krumphanzl,Sikyta,Vanek(eds.),AcademicPress,London,UK,1982
[17]Chmiel:Bioprozesstechnik 1.Einführung in die Bioverfahrenstechnik[Bioprocess technology 1. Introduction to bioprocess technology](GustavFischer Verlag,Stuttgart,1991)
[18]Storhas:Bioreaktoren und periphere Einrichtungen[Bioreactors andperipheral devices] (Vieweg Verlag,Braunschweig/Wiesbaden,1994)
[19]Manual of Methods for General Bacteriology,American Society forBacteriology(Washington D.C.,USA,1981)
[20]Spackman et al.,Analytical Chemistry 30:1190-1206(1958)
[21]Pickering,LC·GC(Magazine of Chromatographic Science)7(6),484-487(1989)
[22]Lindroth et al.,Analytical Chemistry 51:1167-1174(1979)
[23]Lottspeich and Zorbas:Bioanalytik[Bioanalysis](SpektrumAkademischer Verlag,Heidelberg, Germany,1998).
[24]J.H.Miller:A short course in bacterial genetics(1992),Cold SpringHarbor Laboratory Press
[25]Sambrook et al.:Molecular cloning-A laboratory manual(1989),ColdSpring Harbor Laboratory Press
[26]Chung et al.(Proceedings of the National Academy of Sciences ofthe United States of America, USA(1989)86:2172-2175
[27]Innis et al.:PCR Protocols.A guide to methods and applications,1990,Academic Press
[28]Link et al.,Journal of Bacteriology 179:6228-6237(1997)
序列表
&lt;110&gt; 赢创德固赛有限公司
&lt;120&gt; 利用改进的肠杆菌科菌株制备芳香族L-氨基酸的方法
&lt;130&gt; 201600334
&lt;160&gt; 14
&lt;170&gt; PatentIn version 3.5
&lt;210&gt; 1
&lt;211&gt; 2574
&lt;212&gt; DNA
&lt;213&gt; Escherichia coli
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (1)..(2574)
&lt;223&gt; coding sequence clpB
&lt;400&gt; 1
atg cgt ctg gat cgt ctt act aat aaa ttc cag ctt gct ctt gcc gat 48
Met Arg Leu Asp Arg Leu Thr Asn Lys Phe Gln Leu Ala Leu Ala Asp
1 5 10 15
gcc caa tca ctt gca ctc ggg cac gac aac caa ttt atc gaa cca ctt 96
Ala Gln Ser Leu Ala Leu Gly His Asp Asn Gln Phe Ile Glu Pro Leu
20 25 30
cat tta atg agc gcc ctg ctg aat cag gaa ggg ggt tcg gtt agt cct 144
His Leu Met Ser Ala Leu Leu Asn Gln Glu Gly Gly Ser Val Ser Pro
35 40 45
tta tta aca tcc gct ggc ata aat gct ggc cag ttg cgc aca gat atc 192
Leu Leu Thr Ser Ala Gly Ile Asn Ala Gly Gln Leu Arg Thr Asp Ile
50 55 60
aat cag gca tta aat cgt tta ccg cag gtt gaa ggt act ggt ggt gat 240
Asn Gln Ala Leu Asn Arg Leu Pro Gln Val Glu Gly Thr Gly Gly Asp
65 70 75 80
gtc cag cca tca cag gat ctg gtg cgc gtt ctt aat ctt tgc gac aag 288
Val Gln Pro Ser Gln Asp Leu Val Arg Val Leu Asn Leu Cys Asp Lys
85 90 95
ctg gcg caa aaa cgt ggt gat aac ttt atc tcg tca gaa ctg ttc gtt 336
Leu Ala Gln Lys Arg Gly Asp Asn Phe Ile Ser Ser Glu Leu Phe Val
100 105 110
ctg gcg gca ctt gag tct cgc ggc acg ctg gcc gac atc ctg aaa gca 384
Leu Ala Ala Leu Glu Ser Arg Gly Thr Leu Ala Asp Ile Leu Lys Ala
115 120 125
gca ggg gcg acc acc gcc aac att act caa gcg att gaa caa atg cgt 432
Ala Gly Ala Thr Thr Ala Asn Ile Thr Gln Ala Ile Glu Gln Met Arg
130 135 140
gga ggt gaa agc gtg aac gat caa ggt gct gaa gac caa cgt cag gct 480
Gly Gly Glu Ser Val Asn Asp Gln Gly Ala Glu Asp Gln Arg Gln Ala
145 150 155 160
ttg aaa aaa tat acc atc gac ctt acc gaa cga gcc gaa cag ggc aaa 528
Leu Lys Lys Tyr Thr Ile Asp Leu Thr Glu Arg Ala Glu Gln Gly Lys
165 170 175
ctc gat ccg gtg att ggt cgt gat gaa gaa att cgc cgt acc att cag 576
Leu Asp Pro Val Ile Gly Arg Asp Glu Glu Ile Arg Arg Thr Ile Gln
180 185 190
gtg ctg caa cgt cgt act aaa aat aac ccg gta ctg att ggt gaa ccc 624
Val Leu Gln Arg Arg Thr Lys Asn Asn Pro Val Leu Ile Gly Glu Pro
195 200 205
ggc gtc ggt aaa act gcc atc gtt gaa ggt ctg gcg cag cgt att atc 672
Gly Val Gly Lys Thr Ala Ile Val Glu Gly Leu Ala Gln Arg Ile Ile
210 215 220
aac ggc gaa gtg ccg gaa ggg ttg aaa ggc cgc cgg gta ctg gcg ctg 720
Asn Gly Glu Val Pro Glu Gly Leu Lys Gly Arg Arg Val Leu Ala Leu
225 230 235 240
gat atg ggc gcg ctg gtg gct ggg gcg aaa tat cgc ggt gag ttt gaa 768
Asp Met Gly Ala Leu Val Ala Gly Ala Lys Tyr Arg Gly Glu Phe Glu
245 250 255
gaa cgt tta aaa ggc gtg ctt aac gat ctt gcc aaa cag gaa ggc aac 816
Glu Arg Leu Lys Gly Val Leu Asn Asp Leu Ala Lys Gln Glu Gly Asn
260 265 270
gtc atc cta ttt atc gac gaa tta cat acc atg gtc ggc gcg ggt aaa 864
Val Ile Leu Phe Ile Asp Glu Leu His Thr Met Val Gly Ala Gly Lys
275 280 285
gcc gat ggc gca atg gac gcc gga aac atg ctg aaa ccg gcg ctg gcg 912
Ala Asp Gly Ala Met Asp Ala Gly Asn Met Leu Lys Pro Ala Leu Ala
290 295 300
cgt ggt gaa ttg cac tgc gta ggt gcc acg acg ctt gac gaa tat cgc 960
Arg Gly Glu Leu His Cys Val Gly Ala Thr Thr Leu Asp Glu Tyr Arg
305 310 315 320
cag tac att gaa aaa gat gct gcg ctg gaa cgt cgt ttc cag aaa gtg 1008
Gln Tyr Ile Glu Lys Asp Ala Ala Leu Glu Arg Arg Phe Gln Lys Val
325 330 335
ttt gtt gcc gag cct tct gtt gaa gat acc att gcg att ctg cgt ggc 1056
Phe Val Ala Glu Pro Ser Val Glu Asp Thr Ile Ala Ile Leu Arg Gly
340 345 350
ctg aaa gaa cgt tac gaa ttg cac cac cat gtg caa att act gac ccg 1104
Leu Lys Glu Arg Tyr Glu Leu His His His Val Gln Ile Thr Asp Pro
355 360 365
gca att gtt gca gcg gcg acg ttg tct cat cgc tac att gct gac cgt 1152
Ala Ile Val Ala Ala Ala Thr Leu Ser His Arg Tyr Ile Ala Asp Arg
370 375 380
cag ctg ccg gat aaa gcc atc gac ctg atc gat gaa gca gca tcc agc 1200
Gln Leu Pro Asp Lys Ala Ile Asp Leu Ile Asp Glu Ala Ala Ser Ser
385 390 395 400
att cgt atg cag att gac tca aaa cca gaa gaa ctc gac cga ctc gat 1248
Ile Arg Met Gln Ile Asp Ser Lys Pro Glu Glu Leu Asp Arg Leu Asp
405 410 415
cgt cgt atc atc cag ctc aaa ctg gaa caa cag gcg tta atg aaa gag 1296
Arg Arg Ile Ile Gln Leu Lys Leu Glu Gln Gln Ala Leu Met Lys Glu
420 425 430
tct gat gaa gcc agt aaa aaa cgt ctg gat atg ctc aac gaa gaa ctg 1344
Ser Asp Glu Ala Ser Lys Lys Arg Leu Asp Met Leu Asn Glu Glu Leu
435 440 445
agc gac aaa gaa cgt cag tac tcc gag tta gaa gaa gag tgg aaa gca 1392
Ser Asp Lys Glu Arg Gln Tyr Ser Glu Leu Glu Glu Glu Trp Lys Ala
450 455 460
gag aag gca tcg ctt tct ggt acg cag acc att aaa gcg gaa ctg gaa 1440
Glu Lys Ala Ser Leu Ser Gly Thr Gln Thr Ile Lys Ala Glu Leu Glu
465 470 475 480
cag gcg aaa atc gct att gaa cag gct cgc cgt gtg ggg gac ctg gcg 1488
Gln Ala Lys Ile Ala Ile Glu Gln Ala Arg Arg Val Gly Asp Leu Ala
485 490 495
cgg atg tct gaa ctg caa tac ggc aaa atc ccg gaa ctg gaa aag caa 1536
Arg Met Ser Glu Leu Gln Tyr Gly Lys Ile Pro Glu Leu Glu Lys Gln
500 505 510
ctg gaa gcc gca acg cag ctc gaa ggc aaa act atg cgt ctg ttg cgt 1584
Leu Glu Ala Ala Thr Gln Leu Glu Gly Lys Thr Met Arg Leu Leu Arg
515 520 525
aat aaa gtg acc gac gcc gaa att gct gaa gtg ctg gcg cgt tgg acg 1632
Asn Lys Val Thr Asp Ala Glu Ile Ala Glu Val Leu Ala Arg Trp Thr
530 535 540
ggg att ccg gtt tct cgc atg atg gaa agc gag cgc gaa aaa ctg ctg 1680
Gly Ile Pro Val Ser Arg Met Met Glu Ser Glu Arg Glu Lys Leu Leu
545 550 555 560
cgt atg gag caa gaa ctg cac cat cgc gta att ggt cag aac gaa gcg 1728
Arg Met Glu Gln Glu Leu His His Arg Val Ile Gly Gln Asn Glu Ala
565 570 575
gtt gat gcg gta tct aac gct att cgt cgt agc cgt gcg ggg ctg gcg 1776
Val Asp Ala Val Ser Asn Ala Ile Arg Arg Ser Arg Ala Gly Leu Ala
580 585 590
gat cca aat cgc ccg att ggt tca ttc ctg ttc ctc ggc cca act ggt 1824
Asp Pro Asn Arg Pro Ile Gly Ser Phe Leu Phe Leu Gly Pro Thr Gly
595 600 605
gtg ggg aaa aca gag ctt tgt aag gcg ctg gcg aac ttt atg ttt gat 1872
Val Gly Lys Thr Glu Leu Cys Lys Ala Leu Ala Asn Phe Met Phe Asp
610 615 620
agc gac gag gcg atg gtc cgt atc gat atg tcc gag ttt atg gag aaa 1920
Ser Asp Glu Ala Met Val Arg Ile Asp Met Ser Glu Phe Met Glu Lys
625 630 635 640
cac tcg gtg tct cgt ttg gtt ggt gcg cct ccg gga tat gtc ggt tat 1968
His Ser Val Ser Arg Leu Val Gly Ala Pro Pro Gly Tyr Val Gly Tyr
645 650 655
gaa gaa ggt ggc tac ctg acc gaa gcg gtg cgt cgt cgt ccg tat tcc 2016
Glu Glu Gly Gly Tyr Leu Thr Glu Ala Val Arg Arg Arg Pro Tyr Ser
660 665 670
gtc atc ctg ctg gat gaa gtg gaa aaa gcg cat ccg gat gtc ttc aac 2064
Val Ile Leu Leu Asp Glu Val Glu Lys Ala His Pro Asp Val Phe Asn
675 680 685
att ctg ttg cag gta ctg gat gat ggg cgt ctg act gac ggg caa ggg 2112
Ile Leu Leu Gln Val Leu Asp Asp Gly Arg Leu Thr Asp Gly Gln Gly
690 695 700
aga acg gtc gac ttc cgt aat acg gtc gtc att atg acc tct aac ctc 2160
Arg Thr Val Asp Phe Arg Asn Thr Val Val Ile Met Thr Ser Asn Leu
705 710 715 720
ggt tcc gat ctg att cag gaa cgc ttc ggt gaa ctg gat tat gcg cac 2208
Gly Ser Asp Leu Ile Gln Glu Arg Phe Gly Glu Leu Asp Tyr Ala His
725 730 735
atg aaa gag ctg gtg ctc ggt gtg gta agc cat aac ttc cgt ccg gaa 2256
Met Lys Glu Leu Val Leu Gly Val Val Ser His Asn Phe Arg Pro Glu
740 745 750
ttc att aac cgt atc gat gaa gtg gtg gtc ttc cat ccg ctg ggt gaa 2304
Phe Ile Asn Arg Ile Asp Glu Val Val Val Phe His Pro Leu Gly Glu
755 760 765
cag cac att gcc tcg att gcg cag att cag ttg aaa cgt ctg tac aaa 2352
Gln His Ile Ala Ser Ile Ala Gln Ile Gln Leu Lys Arg Leu Tyr Lys
770 775 780
cgt ctg gaa gaa cgt ggt tat gaa atc cac att tct gac gag gcg ctg 2400
Arg Leu Glu Glu Arg Gly Tyr Glu Ile His Ile Ser Asp Glu Ala Leu
785 790 795 800
aaa ctg ctg agc gag aac ggt tac gat ccg gtc tat ggt gca cgt cct 2448
Lys Leu Leu Ser Glu Asn Gly Tyr Asp Pro Val Tyr Gly Ala Arg Pro
805 810 815
ctg aaa cgt gca att cag cag cag atc gaa aac ccg ctg gca cag caa 2496
Leu Lys Arg Ala Ile Gln Gln Gln Ile Glu Asn Pro Leu Ala Gln Gln
820 825 830
ata ctg tct ggt gaa ttg gtt ccg ggt aaa gtg att cgc ctg gaa gtt 2544
Ile Leu Ser Gly Glu Leu Val Pro Gly Lys Val Ile Arg Leu Glu Val
835 840 845
aat gaa gac cgg att gtc gcc gtc cag taa 2574
Asn Glu Asp Arg Ile Val Ala Val Gln
850 855
&lt;210&gt; 2
&lt;211&gt; 857
&lt;212&gt; PRT
&lt;213&gt; Escherichia coli
&lt;400&gt; 2
Met Arg Leu Asp Arg Leu Thr Asn Lys Phe Gln Leu Ala Leu Ala Asp
1 5 10 15
Ala Gln Ser Leu Ala Leu Gly His Asp Asn Gln Phe Ile Glu Pro Leu
20 25 30
His Leu Met Ser Ala Leu Leu Asn Gln Glu Gly Gly Ser Val Ser Pro
35 40 45
Leu Leu Thr Ser Ala Gly Ile Asn Ala Gly Gln Leu Arg Thr Asp Ile
50 55 60
Asn Gln Ala Leu Asn Arg Leu Pro Gln Val Glu Gly Thr Gly Gly Asp
65 70 75 80
Val Gln Pro Ser Gln Asp Leu Val Arg Val Leu Asn Leu Cys Asp Lys
85 90 95
Leu Ala Gln Lys Arg Gly Asp Asn Phe Ile Ser Ser Glu Leu Phe Val
100 105 110
Leu Ala Ala Leu Glu Ser Arg Gly Thr Leu Ala Asp Ile Leu Lys Ala
115 120 125
Ala Gly Ala Thr Thr Ala Asn Ile Thr Gln Ala Ile Glu Gln Met Arg
130 135 140
Gly Gly Glu Ser Val Asn Asp Gln Gly Ala Glu Asp Gln Arg Gln Ala
145 150 155 160
Leu Lys Lys Tyr Thr Ile Asp Leu Thr Glu Arg Ala Glu Gln Gly Lys
165 170 175
Leu Asp Pro Val Ile Gly Arg Asp Glu Glu Ile Arg Arg Thr Ile Gln
180 185 190
Val Leu Gln Arg Arg Thr Lys Asn Asn Pro Val Leu Ile Gly Glu Pro
195 200 205
Gly Val Gly Lys Thr Ala Ile Val Glu Gly Leu Ala Gln Arg Ile Ile
210 215 220
Asn Gly Glu Val Pro Glu Gly Leu Lys Gly Arg Arg Val Leu Ala Leu
225 230 235 240
Asp Met Gly Ala Leu Val Ala Gly Ala Lys Tyr Arg Gly Glu Phe Glu
245 250 255
Glu Arg Leu Lys Gly Val Leu Asn Asp Leu Ala Lys Gln Glu Gly Asn
260 265 270
Val Ile Leu Phe Ile Asp Glu Leu His Thr Met Val Gly Ala Gly Lys
275 280 285
Ala Asp Gly Ala Met Asp Ala Gly Asn Met Leu Lys Pro Ala Leu Ala
290 295 300
Arg Gly Glu Leu His Cys Val Gly Ala Thr Thr Leu Asp Glu Tyr Arg
305 310 315 320
Gln Tyr Ile Glu Lys Asp Ala Ala Leu Glu Arg Arg Phe Gln Lys Val
325 330 335
Phe Val Ala Glu Pro Ser Val Glu Asp Thr Ile Ala Ile Leu Arg Gly
340 345 350
Leu Lys Glu Arg Tyr Glu Leu His His His Val Gln Ile Thr Asp Pro
355 360 365
Ala Ile Val Ala Ala Ala Thr Leu Ser His Arg Tyr Ile Ala Asp Arg
370 375 380
Gln Leu Pro Asp Lys Ala Ile Asp Leu Ile Asp Glu Ala Ala Ser Ser
385 390 395 400
Ile Arg Met Gln Ile Asp Ser Lys Pro Glu Glu Leu Asp Arg Leu Asp
405 410 415
Arg Arg Ile Ile Gln Leu Lys Leu Glu Gln Gln Ala Leu Met Lys Glu
420 425 430
Ser Asp Glu Ala Ser Lys Lys Arg Leu Asp Met Leu Asn Glu Glu Leu
435 440 445
Ser Asp Lys Glu Arg Gln Tyr Ser Glu Leu Glu Glu Glu Trp Lys Ala
450 455 460
Glu Lys Ala Ser Leu Ser Gly Thr Gln Thr Ile Lys Ala Glu Leu Glu
465 470 475 480
Gln Ala Lys Ile Ala Ile Glu Gln Ala Arg Arg Val Gly Asp Leu Ala
485 490 495
Arg Met Ser Glu Leu Gln Tyr Gly Lys Ile Pro Glu Leu Glu Lys Gln
500 505 510
Leu Glu Ala Ala Thr Gln Leu Glu Gly Lys Thr Met Arg Leu Leu Arg
515 520 525
Asn Lys Val Thr Asp Ala Glu Ile Ala Glu Val Leu Ala Arg Trp Thr
530 535 540
Gly Ile Pro Val Ser Arg Met Met Glu Ser Glu Arg Glu Lys Leu Leu
545 550 555 560
Arg Met Glu Gln Glu Leu His His Arg Val Ile Gly Gln Asn Glu Ala
565 570 575
Val Asp Ala Val Ser Asn Ala Ile Arg Arg Ser Arg Ala Gly Leu Ala
580 585 590
Asp Pro Asn Arg Pro Ile Gly Ser Phe Leu Phe Leu Gly Pro Thr Gly
595 600 605
Val Gly Lys Thr Glu Leu Cys Lys Ala Leu Ala Asn Phe Met Phe Asp
610 615 620
Ser Asp Glu Ala Met Val Arg Ile Asp Met Ser Glu Phe Met Glu Lys
625 630 635 640
His Ser Val Ser Arg Leu Val Gly Ala Pro Pro Gly Tyr Val Gly Tyr
645 650 655
Glu Glu Gly Gly Tyr Leu Thr Glu Ala Val Arg Arg Arg Pro Tyr Ser
660 665 670
Val Ile Leu Leu Asp Glu Val Glu Lys Ala His Pro Asp Val Phe Asn
675 680 685
Ile Leu Leu Gln Val Leu Asp Asp Gly Arg Leu Thr Asp Gly Gln Gly
690 695 700
Arg Thr Val Asp Phe Arg Asn Thr Val Val Ile Met Thr Ser Asn Leu
705 710 715 720
Gly Ser Asp Leu Ile Gln Glu Arg Phe Gly Glu Leu Asp Tyr Ala His
725 730 735
Met Lys Glu Leu Val Leu Gly Val Val Ser His Asn Phe Arg Pro Glu
740 745 750
Phe Ile Asn Arg Ile Asp Glu Val Val Val Phe His Pro Leu Gly Glu
755 760 765
Gln His Ile Ala Ser Ile Ala Gln Ile Gln Leu Lys Arg Leu Tyr Lys
770 775 780
Arg Leu Glu Glu Arg Gly Tyr Glu Ile His Ile Ser Asp Glu Ala Leu
785 790 795 800
Lys Leu Leu Ser Glu Asn Gly Tyr Asp Pro Val Tyr Gly Ala Arg Pro
805 810 815
Leu Lys Arg Ala Ile Gln Gln Gln Ile Glu Asn Pro Leu Ala Gln Gln
820 825 830
Ile Leu Ser Gly Glu Leu Val Pro Gly Lys Val Ile Arg Leu Glu Val
835 840 845
Asn Glu Asp Arg Ile Val Ala Val Gln
850 855
&lt;210&gt; 3
&lt;211&gt; 2574
&lt;212&gt; DNA
&lt;213&gt; Shigella flexneri
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (1)..(2574)
&lt;223&gt; coding sequence clpB
&lt;400&gt; 3
atg cgt ctg gat cgt ctt act aat aaa ttc cag ctt gct ctt gcc gat 48
Met Arg Leu Asp Arg Leu Thr Asn Lys Phe Gln Leu Ala Leu Ala Asp
1 5 10 15
gcc caa tca ctt gca ctc ggg cac gac aac caa ttc atc gaa cca ctt 96
Ala Gln Ser Leu Ala Leu Gly His Asp Asn Gln Phe Ile Glu Pro Leu
20 25 30
cat tta atg agc gcc ctg ctg aat cag gaa ggg ggt tcg gtt agt cct 144
His Leu Met Ser Ala Leu Leu Asn Gln Glu Gly Gly Ser Val Ser Pro
35 40 45
tta tta aca tcc gct ggc ata aat gct ggc cag ttg cgc aca gat atc 192
Leu Leu Thr Ser Ala Gly Ile Asn Ala Gly Gln Leu Arg Thr Asp Ile
50 55 60
aat cag gca tta aat cgt tta ccg cag gtt gaa ggt act ggt ggt gat 240
Asn Gln Ala Leu Asn Arg Leu Pro Gln Val Glu Gly Thr Gly Gly Asp
65 70 75 80
gtc cag cca tca cag gat ctg gtg cgc gtt ctt aat ctt tgc gac aag 288
Val Gln Pro Ser Gln Asp Leu Val Arg Val Leu Asn Leu Cys Asp Lys
85 90 95
ctg gcg caa aaa cgt ggt gat aac ttt atc tcg tca gaa ctg ttc gtt 336
Leu Ala Gln Lys Arg Gly Asp Asn Phe Ile Ser Ser Glu Leu Phe Val
100 105 110
ctg gcg gca ctt gag tct cgc ggc acg ctg gcc gac atc ctg aaa gca 384
Leu Ala Ala Leu Glu Ser Arg Gly Thr Leu Ala Asp Ile Leu Lys Ala
115 120 125
aca ggg gcg acc acc gcc aac att act caa gcg att gaa caa atg cgt 432
Thr Gly Ala Thr Thr Ala Asn Ile Thr Gln Ala Ile Glu Gln Met Arg
130 135 140
gga ggt gaa agc gtg aac gat caa ggt gct gaa gac caa cgt cag gct 480
Gly Gly Glu Ser Val Asn Asp Gln Gly Ala Glu Asp Gln Arg Gln Ala
145 150 155 160
ttg aaa aaa tat acc atc gac ctt acc gaa cga gcc gaa cag ggc aaa 528
Leu Lys Lys Tyr Thr Ile Asp Leu Thr Glu Arg Ala Glu Gln Gly Lys
165 170 175
ctc gat ccg gtg att ggt cgt gat gaa gaa att cgc cgt acc att cag 576
Leu Asp Pro Val Ile Gly Arg Asp Glu Glu Ile Arg Arg Thr Ile Gln
180 185 190
gtg ctg caa cgt cgt act aaa aat aac ccg gta ctg att ggt gaa ccc 624
Val Leu Gln Arg Arg Thr Lys Asn Asn Pro Val Leu Ile Gly Glu Pro
195 200 205
ggc gtc ggt aaa act gcc atc gtt gaa ggt ctg gcg cag cgt att atc 672
Gly Val Gly Lys Thr Ala Ile Val Glu Gly Leu Ala Gln Arg Ile Ile
210 215 220
aac ggc gaa gtg ccg gaa gga ttg aaa ggc cgc cgc gta ctg gcg ctg 720
Asn Gly Glu Val Pro Glu Gly Leu Lys Gly Arg Arg Val Leu Ala Leu
225 230 235 240
gat atg ggc gcg ctg gtg gct ggg gcg aaa tat cgc ggt gag ttt gaa 768
Asp Met Gly Ala Leu Val Ala Gly Ala Lys Tyr Arg Gly Glu Phe Glu
245 250 255
gaa cgt tta aaa ggc gtg ctt aac gat ctt gcc aaa cag gaa ggc aac 816
Glu Arg Leu Lys Gly Val Leu Asn Asp Leu Ala Lys Gln Glu Gly Asn
260 265 270
gtc atc ctg ttt atc gac gaa tta cat acc atg gtc ggc gcg ggt aaa 864
Val Ile Leu Phe Ile Asp Glu Leu His Thr Met Val Gly Ala Gly Lys
275 280 285
gcc gat ggc gca atg gac gcc gga aac atg ctg aaa ccg gcg ctg gcg 912
Ala Asp Gly Ala Met Asp Ala Gly Asn Met Leu Lys Pro Ala Leu Ala
290 295 300
cgt ggt gaa ttg cac tgc gta ggt gcc acg acg ctt gac gaa tat cgc 960
Arg Gly Glu Leu His Cys Val Gly Ala Thr Thr Leu Asp Glu Tyr Arg
305 310 315 320
cag tac atc gaa aaa gat gct gcg ctg gaa cgt cgt ttc cag aaa gtg 1008
Gln Tyr Ile Glu Lys Asp Ala Ala Leu Glu Arg Arg Phe Gln Lys Val
325 330 335
ttt gtt gcc gag cct tct gtt gaa gat acc att gcg att ctg cgt ggc 1056
Phe Val Ala Glu Pro Ser Val Glu Asp Thr Ile Ala Ile Leu Arg Gly
340 345 350
ctg aaa gaa cgt tac gaa ttg cac cac cat gtg caa att act gac ccg 1104
Leu Lys Glu Arg Tyr Glu Leu His His His Val Gln Ile Thr Asp Pro
355 360 365
gca att gtt gca gca gcg acg ttg tct cat cgc tac att gct gac cgt 1152
Ala Ile Val Ala Ala Ala Thr Leu Ser His Arg Tyr Ile Ala Asp Arg
370 375 380
cag ctg ccg gat aaa gcc atc gac ctg atc gat gaa gca gca tcc agc 1200
Gln Leu Pro Asp Lys Ala Ile Asp Leu Ile Asp Glu Ala Ala Ser Ser
385 390 395 400
att cgt atg cag att gac tca aaa cca gaa gaa ctc gac cga ctc gat 1248
Ile Arg Met Gln Ile Asp Ser Lys Pro Glu Glu Leu Asp Arg Leu Asp
405 410 415
cgt cgt atc atc cag ctc aaa ctg gaa caa cag gcg tta atg aaa gag 1296
Arg Arg Ile Ile Gln Leu Lys Leu Glu Gln Gln Ala Leu Met Lys Glu
420 425 430
tct gat gaa gcc agt aaa aaa cgc ctg gat atg ctc aac gaa gaa ctg 1344
Ser Asp Glu Ala Ser Lys Lys Arg Leu Asp Met Leu Asn Glu Glu Leu
435 440 445
agc gac aaa gaa cgt cag tac tcc gag tta gaa gaa gag tgg aaa gca 1392
Ser Asp Lys Glu Arg Gln Tyr Ser Glu Leu Glu Glu Glu Trp Lys Ala
450 455 460
gag aag gca tcg ctt tct ggt acg cag acc att aaa gcg gaa ctg gaa 1440
Glu Lys Ala Ser Leu Ser Gly Thr Gln Thr Ile Lys Ala Glu Leu Glu
465 470 475 480
cag gcg aaa atc gct att gaa cag gct cgc cgt gtg ggg gac ctg gcg 1488
Gln Ala Lys Ile Ala Ile Glu Gln Ala Arg Arg Val Gly Asp Leu Ala
485 490 495
cgg atg tct gaa ctg caa tac ggc aaa atc ccg gaa ctg gaa aag caa 1536
Arg Met Ser Glu Leu Gln Tyr Gly Lys Ile Pro Glu Leu Glu Lys Gln
500 505 510
ctg gaa gcc gca acg cag ctc gaa ggc aaa act atg cgt ctg ttg cgt 1584
Leu Glu Ala Ala Thr Gln Leu Glu Gly Lys Thr Met Arg Leu Leu Arg
515 520 525
aat aaa gtg acc gat gcc gaa att gct gaa gtg ctg gcg cgt tgg acg 1632
Asn Lys Val Thr Asp Ala Glu Ile Ala Glu Val Leu Ala Arg Trp Thr
530 535 540
ggg att ccg gtt tct cgc atg atg gaa agc gag cgc gaa aaa ctg ctg 1680
Gly Ile Pro Val Ser Arg Met Met Glu Ser Glu Arg Glu Lys Leu Leu
545 550 555 560
cgt atg gag caa gaa ctg cac cat cgc gtc att ggt cag aac gaa gcg 1728
Arg Met Glu Gln Glu Leu His His Arg Val Ile Gly Gln Asn Glu Ala
565 570 575
gtt gat gcg gta tct aac gct att cgc cgt agc cgt gcg ggg ttg gcg 1776
Val Asp Ala Val Ser Asn Ala Ile Arg Arg Ser Arg Ala Gly Leu Ala
580 585 590
gat cca aat cgc ccg att ggt tca ttc ctg ttc ctc ggc cca acg ggt 1824
Asp Pro Asn Arg Pro Ile Gly Ser Phe Leu Phe Leu Gly Pro Thr Gly
595 600 605
gtg ggg aaa act gag ctt tgt aag gcg ctg gcg aac ttt atg ttt gat 1872
Val Gly Lys Thr Glu Leu Cys Lys Ala Leu Ala Asn Phe Met Phe Asp
610 615 620
agc gac gag gcg atg gtc cgt atc gat atg tcc gaa ttt atg gag aaa 1920
Ser Asp Glu Ala Met Val Arg Ile Asp Met Ser Glu Phe Met Glu Lys
625 630 635 640
cac tcg gtg tct cgt ctg gtt ggt gcg cct ccg gga tat gtc ggt tat 1968
His Ser Val Ser Arg Leu Val Gly Ala Pro Pro Gly Tyr Val Gly Tyr
645 650 655
gaa gaa ggt ggc tac ctg acc gaa gct gtg cgt cgt cgt ccg tat tcc 2016
Glu Glu Gly Gly Tyr Leu Thr Glu Ala Val Arg Arg Arg Pro Tyr Ser
660 665 670
gtc atc ctg ctg gat gaa gtg gaa aaa gcg cat ccg gat gtc ttc aat 2064
Val Ile Leu Leu Asp Glu Val Glu Lys Ala His Pro Asp Val Phe Asn
675 680 685
att ctg ttg cag gta ctg gat gat ggg cgt ctg act gac ggg cag ggg 2112
Ile Leu Leu Gln Val Leu Asp Asp Gly Arg Leu Thr Asp Gly Gln Gly
690 695 700
aga acg gtc gac ttc cgt aat acg gtt gtc att atg acc tct aac ctc 2160
Arg Thr Val Asp Phe Arg Asn Thr Val Val Ile Met Thr Ser Asn Leu
705 710 715 720
ggt tcc gat ctg att cag gaa cgc ttc ggt gaa ctg gat tat gcg cac 2208
Gly Ser Asp Leu Ile Gln Glu Arg Phe Gly Glu Leu Asp Tyr Ala His
725 730 735
atg aaa gag ctg gtg ctc ggt gtg gtt agc cat aac ttc cgt ccg gaa 2256
Met Lys Glu Leu Val Leu Gly Val Val Ser His Asn Phe Arg Pro Glu
740 745 750
ttc att aac cgt att gat gaa gtg gtg gtc ttc cat ccg ctg ggt gaa 2304
Phe Ile Asn Arg Ile Asp Glu Val Val Val Phe His Pro Leu Gly Glu
755 760 765
cag cac att gcc tcg att gcg cag att cag ttg aaa cgt ctg tac aaa 2352
Gln His Ile Ala Ser Ile Ala Gln Ile Gln Leu Lys Arg Leu Tyr Lys
770 775 780
cgt ctg gaa gaa cgt ggt tat gaa atc cac att tct gac gag gcg ctg 2400
Arg Leu Glu Glu Arg Gly Tyr Glu Ile His Ile Ser Asp Glu Ala Leu
785 790 795 800
aaa ctg ctg agc gag aac ggt tac gat cca gtc tat ggt gca cgt cct 2448
Lys Leu Leu Ser Glu Asn Gly Tyr Asp Pro Val Tyr Gly Ala Arg Pro
805 810 815
ttg aaa cgt gct atc cag cag cag atc gaa aac ccg ctg gca cag caa 2496
Leu Lys Arg Ala Ile Gln Gln Gln Ile Glu Asn Pro Leu Ala Gln Gln
820 825 830
ata ctg tct ggt gaa ttg gtt ccg ggt aaa gtg att cgc ctg gaa gtt 2544
Ile Leu Ser Gly Glu Leu Val Pro Gly Lys Val Ile Arg Leu Glu Val
835 840 845
aat gaa gac cgg att gtc gct gtc cag taa 2574
Asn Glu Asp Arg Ile Val Ala Val Gln
850 855
&lt;210&gt; 4
&lt;211&gt; 857
&lt;212&gt; PRT
&lt;213&gt; Shigella flexneri
&lt;400&gt; 4
Met Arg Leu Asp Arg Leu Thr Asn Lys Phe Gln Leu Ala Leu Ala Asp
1 5 10 15
Ala Gln Ser Leu Ala Leu Gly His Asp Asn Gln Phe Ile Glu Pro Leu
20 25 30
His Leu Met Ser Ala Leu Leu Asn Gln Glu Gly Gly Ser Val Ser Pro
35 40 45
Leu Leu Thr Ser Ala Gly Ile Asn Ala Gly Gln Leu Arg Thr Asp Ile
50 55 60
Asn Gln Ala Leu Asn Arg Leu Pro Gln Val Glu Gly Thr Gly Gly Asp
65 70 75 80
Val Gln Pro Ser Gln Asp Leu Val Arg Val Leu Asn Leu Cys Asp Lys
85 90 95
Leu Ala Gln Lys Arg Gly Asp Asn Phe Ile Ser Ser Glu Leu Phe Val
100 105 110
Leu Ala Ala Leu Glu Ser Arg Gly Thr Leu Ala Asp Ile Leu Lys Ala
115 120 125
Thr Gly Ala Thr Thr Ala Asn Ile Thr Gln Ala Ile Glu Gln Met Arg
130 135 140
Gly Gly Glu Ser Val Asn Asp Gln Gly Ala Glu Asp Gln Arg Gln Ala
145 150 155 160
Leu Lys Lys Tyr Thr Ile Asp Leu Thr Glu Arg Ala Glu Gln Gly Lys
165 170 175
Leu Asp Pro Val Ile Gly Arg Asp Glu Glu Ile Arg Arg Thr Ile Gln
180 185 190
Val Leu Gln Arg Arg Thr Lys Asn Asn Pro Val Leu Ile Gly Glu Pro
195 200 205
Gly Val Gly Lys Thr Ala Ile Val Glu Gly Leu Ala Gln Arg Ile Ile
210 215 220
Asn Gly Glu Val Pro Glu Gly Leu Lys Gly Arg Arg Val Leu Ala Leu
225 230 235 240
Asp Met Gly Ala Leu Val Ala Gly Ala Lys Tyr Arg Gly Glu Phe Glu
245 250 255
Glu Arg Leu Lys Gly Val Leu Asn Asp Leu Ala Lys Gln Glu Gly Asn
260 265 270
Val Ile Leu Phe Ile Asp Glu Leu His Thr Met Val Gly Ala Gly Lys
275 280 285
Ala Asp Gly Ala Met Asp Ala Gly Asn Met Leu Lys Pro Ala Leu Ala
290 295 300
Arg Gly Glu Leu His Cys Val Gly Ala Thr Thr Leu Asp Glu Tyr Arg
305 310 315 320
Gln Tyr Ile Glu Lys Asp Ala Ala Leu Glu Arg Arg Phe Gln Lys Val
325 330 335
Phe Val Ala Glu Pro Ser Val Glu Asp Thr Ile Ala Ile Leu Arg Gly
340 345 350
Leu Lys Glu Arg Tyr Glu Leu His His His Val Gln Ile Thr Asp Pro
355 360 365
Ala Ile Val Ala Ala Ala Thr Leu Ser His Arg Tyr Ile Ala Asp Arg
370 375 380
Gln Leu Pro Asp Lys Ala Ile Asp Leu Ile Asp Glu Ala Ala Ser Ser
385 390 395 400
Ile Arg Met Gln Ile Asp Ser Lys Pro Glu Glu Leu Asp Arg Leu Asp
405 410 415
Arg Arg Ile Ile Gln Leu Lys Leu Glu Gln Gln Ala Leu Met Lys Glu
420 425 430
Ser Asp Glu Ala Ser Lys Lys Arg Leu Asp Met Leu Asn Glu Glu Leu
435 440 445
Ser Asp Lys Glu Arg Gln Tyr Ser Glu Leu Glu Glu Glu Trp Lys Ala
450 455 460
Glu Lys Ala Ser Leu Ser Gly Thr Gln Thr Ile Lys Ala Glu Leu Glu
465 470 475 480
Gln Ala Lys Ile Ala Ile Glu Gln Ala Arg Arg Val Gly Asp Leu Ala
485 490 495
Arg Met Ser Glu Leu Gln Tyr Gly Lys Ile Pro Glu Leu Glu Lys Gln
500 505 510
Leu Glu Ala Ala Thr Gln Leu Glu Gly Lys Thr Met Arg Leu Leu Arg
515 520 525
Asn Lys Val Thr Asp Ala Glu Ile Ala Glu Val Leu Ala Arg Trp Thr
530 535 540
Gly Ile Pro Val Ser Arg Met Met Glu Ser Glu Arg Glu Lys Leu Leu
545 550 555 560
Arg Met Glu Gln Glu Leu His His Arg Val Ile Gly Gln Asn Glu Ala
565 570 575
Val Asp Ala Val Ser Asn Ala Ile Arg Arg Ser Arg Ala Gly Leu Ala
580 585 590
Asp Pro Asn Arg Pro Ile Gly Ser Phe Leu Phe Leu Gly Pro Thr Gly
595 600 605
Val Gly Lys Thr Glu Leu Cys Lys Ala Leu Ala Asn Phe Met Phe Asp
610 615 620
Ser Asp Glu Ala Met Val Arg Ile Asp Met Ser Glu Phe Met Glu Lys
625 630 635 640
His Ser Val Ser Arg Leu Val Gly Ala Pro Pro Gly Tyr Val Gly Tyr
645 650 655
Glu Glu Gly Gly Tyr Leu Thr Glu Ala Val Arg Arg Arg Pro Tyr Ser
660 665 670
Val Ile Leu Leu Asp Glu Val Glu Lys Ala His Pro Asp Val Phe Asn
675 680 685
Ile Leu Leu Gln Val Leu Asp Asp Gly Arg Leu Thr Asp Gly Gln Gly
690 695 700
Arg Thr Val Asp Phe Arg Asn Thr Val Val Ile Met Thr Ser Asn Leu
705 710 715 720
Gly Ser Asp Leu Ile Gln Glu Arg Phe Gly Glu Leu Asp Tyr Ala His
725 730 735
Met Lys Glu Leu Val Leu Gly Val Val Ser His Asn Phe Arg Pro Glu
740 745 750
Phe Ile Asn Arg Ile Asp Glu Val Val Val Phe His Pro Leu Gly Glu
755 760 765
Gln His Ile Ala Ser Ile Ala Gln Ile Gln Leu Lys Arg Leu Tyr Lys
770 775 780
Arg Leu Glu Glu Arg Gly Tyr Glu Ile His Ile Ser Asp Glu Ala Leu
785 790 795 800
Lys Leu Leu Ser Glu Asn Gly Tyr Asp Pro Val Tyr Gly Ala Arg Pro
805 810 815
Leu Lys Arg Ala Ile Gln Gln Gln Ile Glu Asn Pro Leu Ala Gln Gln
820 825 830
Ile Leu Ser Gly Glu Leu Val Pro Gly Lys Val Ile Arg Leu Glu Val
835 840 845
Asn Glu Asp Arg Ile Val Ala Val Gln
850 855
&lt;210&gt; 5
&lt;211&gt; 2574
&lt;212&gt; DNA
&lt;213&gt; Salmonella enterica subsp. enterica serovar Typhimurium LT2
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (1)..(2574)
&lt;223&gt; coding sequence clpB
&lt;400&gt; 5
atg cgt ctg gat cgt ctt act aac aaa ttc cag ctt gct ctt gcc gat 48
Met Arg Leu Asp Arg Leu Thr Asn Lys Phe Gln Leu Ala Leu Ala Asp
1 5 10 15
gcc cag tcg ctc gcg ctg ggg cac gac aac caa ttc atc gaa cct ctt 96
Ala Gln Ser Leu Ala Leu Gly His Asp Asn Gln Phe Ile Glu Pro Leu
20 25 30
cat tta atg agc gcc ttg ctg aac cag gaa ggg gga tcg ata cgt cct 144
His Leu Met Ser Ala Leu Leu Asn Gln Glu Gly Gly Ser Ile Arg Pro
35 40 45
tta tta acc tcc gcc ggc att aat gct ggc cag ttg cgc acc gct atc 192
Leu Leu Thr Ser Ala Gly Ile Asn Ala Gly Gln Leu Arg Thr Ala Ile
50 55 60
gat cag gcg ctg agc cgt tta ccg cag gtg gaa ggc acc ggc ggc gac 240
Asp Gln Ala Leu Ser Arg Leu Pro Gln Val Glu Gly Thr Gly Gly Asp
65 70 75 80
gta cag cct tct tcg gaa ctg gta cgc gta ctg aac ctt tgc gac aag 288
Val Gln Pro Ser Ser Glu Leu Val Arg Val Leu Asn Leu Cys Asp Lys
85 90 95
ctg gcg caa aaa cgg gga gac aat ttt att tcg tca gag ctg ttt gtt 336
Leu Ala Gln Lys Arg Gly Asp Asn Phe Ile Ser Ser Glu Leu Phe Val
100 105 110
ctg gcg gcg ctt gag tct cgc ggc acg tta acc gat ctg ctg aaa tca 384
Leu Ala Ala Leu Glu Ser Arg Gly Thr Leu Thr Asp Leu Leu Lys Ser
115 120 125
gcc ggt gcg acc acg gcc aat atc act cag gca att gaa cag atg cgc 432
Ala Gly Ala Thr Thr Ala Asn Ile Thr Gln Ala Ile Glu Gln Met Arg
130 135 140
gga ggt gaa agc gtg aac gat caa ggg gct gaa gac caa cgt cag gcc 480
Gly Gly Glu Ser Val Asn Asp Gln Gly Ala Glu Asp Gln Arg Gln Ala
145 150 155 160
ttg aaa aaa tat acc gtc gat ctg acc gag cgg gct gaa caa ggc aag 528
Leu Lys Lys Tyr Thr Val Asp Leu Thr Glu Arg Ala Glu Gln Gly Lys
165 170 175
ctt gac ccg gta att ggt cgt gat gaa gaa att cgc cgt acc att cag 576
Leu Asp Pro Val Ile Gly Arg Asp Glu Glu Ile Arg Arg Thr Ile Gln
180 185 190
gta ctg caa cgt cgt acc aaa aac aac ccg gtg tta atc ggt gag cca 624
Val Leu Gln Arg Arg Thr Lys Asn Asn Pro Val Leu Ile Gly Glu Pro
195 200 205
ggg gtc ggt aaa acg gca att gtt gaa gga ctg gcg cag cgc att att 672
Gly Val Gly Lys Thr Ala Ile Val Glu Gly Leu Ala Gln Arg Ile Ile
210 215 220
aac ggt gaa gtc cct gaa ggc tta aaa ggt cgc cgc gta ctg gcg ctg 720
Asn Gly Glu Val Pro Glu Gly Leu Lys Gly Arg Arg Val Leu Ala Leu
225 230 235 240
gat atg ggc gcg ctg gtg gcg ggg gcg aaa tat cgc ggc gaa ttt gaa 768
Asp Met Gly Ala Leu Val Ala Gly Ala Lys Tyr Arg Gly Glu Phe Glu
245 250 255
gag cgt ctg aaa ggc gtg ctg aac gat ctg gcg aaa cag gaa ggc aac 816
Glu Arg Leu Lys Gly Val Leu Asn Asp Leu Ala Lys Gln Glu Gly Asn
260 265 270
gtc atc ctg ttt att gac gag ctg cac acg atg gtt ggc gca ggt aag 864
Val Ile Leu Phe Ile Asp Glu Leu His Thr Met Val Gly Ala Gly Lys
275 280 285
gct gat ggc gca atg gac gcc ggg aat atg ctg aaa ccg gcg ctg gcg 912
Ala Asp Gly Ala Met Asp Ala Gly Asn Met Leu Lys Pro Ala Leu Ala
290 295 300
cgt ggt gaa ctg cac tgt gtg ggc gcc acc acg ctg gat gaa tac cgt 960
Arg Gly Glu Leu His Cys Val Gly Ala Thr Thr Leu Asp Glu Tyr Arg
305 310 315 320
cag tac att gaa aaa gac gcg gcg ctg gaa cgt cgt ttt caa aaa gtg 1008
Gln Tyr Ile Glu Lys Asp Ala Ala Leu Glu Arg Arg Phe Gln Lys Val
325 330 335
ttt gtc gca gaa cct tca gtg gaa gac acc atc gct att ctg cgt ggc 1056
Phe Val Ala Glu Pro Ser Val Glu Asp Thr Ile Ala Ile Leu Arg Gly
340 345 350
ctg aaa gaa cgt tac gag ctg cac cac cat gtg cag atc act gac ccg 1104
Leu Lys Glu Arg Tyr Glu Leu His His His Val Gln Ile Thr Asp Pro
355 360 365
gcg att gtg gcg gcg gca aca tta tct cac cgc tat atc gcc gac cgt 1152
Ala Ile Val Ala Ala Ala Thr Leu Ser His Arg Tyr Ile Ala Asp Arg
370 375 380
cag ttg ccg gat aaa gct atc gac ctc atc gat gaa gct gca tcc agc 1200
Gln Leu Pro Asp Lys Ala Ile Asp Leu Ile Asp Glu Ala Ala Ser Ser
385 390 395 400
att cgt atg cag att gac tct aag ccg gag gag ctg gac aga ctc gac 1248
Ile Arg Met Gln Ile Asp Ser Lys Pro Glu Glu Leu Asp Arg Leu Asp
405 410 415
cgc cgc att att cag ctc aaa ctg gaa cag cag gcg ttg atg aaa gag 1296
Arg Arg Ile Ile Gln Leu Lys Leu Glu Gln Gln Ala Leu Met Lys Glu
420 425 430
tct gac gag gcg agt aaa aaa cgt ctc gat atg ctc aac gaa gaa ctg 1344
Ser Asp Glu Ala Ser Lys Lys Arg Leu Asp Met Leu Asn Glu Glu Leu
435 440 445
gac gac aaa gag cgc cag tat tct gag ctg gaa gaa gag tgg aaa gcg 1392
Asp Asp Lys Glu Arg Gln Tyr Ser Glu Leu Glu Glu Glu Trp Lys Ala
450 455 460
gaa aaa gcg tcg ctc tct ggt acg caa act att aaa gcg gag ctg gag 1440
Glu Lys Ala Ser Leu Ser Gly Thr Gln Thr Ile Lys Ala Glu Leu Glu
465 470 475 480
cag gcg aag att gcc atc gag cag gcg cgt cgc gtt ggc gac ctg gcg 1488
Gln Ala Lys Ile Ala Ile Glu Gln Ala Arg Arg Val Gly Asp Leu Ala
485 490 495
cga atg tct gaa ctg cag tac ggc aaa att ccg gag ctg gaa aaa cag 1536
Arg Met Ser Glu Leu Gln Tyr Gly Lys Ile Pro Glu Leu Glu Lys Gln
500 505 510
ctg gaa gcc gcg acc cag tcg gaa ggt aaa acc atg cgt ctg tta cgt 1584
Leu Glu Ala Ala Thr Gln Ser Glu Gly Lys Thr Met Arg Leu Leu Arg
515 520 525
aac aaa gta acg gat gcg gaa att gcc gaa gtg cta gcg cgc tgg acc 1632
Asn Lys Val Thr Asp Ala Glu Ile Ala Glu Val Leu Ala Arg Trp Thr
530 535 540
ggt att ccg gtt tcc aga atg ctg gaa ggc gaa cgt gaa aaa ctg ttg 1680
Gly Ile Pro Val Ser Arg Met Leu Glu Gly Glu Arg Glu Lys Leu Leu
545 550 555 560
cgt atg gaa caa gag tta cac agc cgt gtg atc ggg cag aat gaa gcc 1728
Arg Met Glu Gln Glu Leu His Ser Arg Val Ile Gly Gln Asn Glu Ala
565 570 575
gtt gaa gca gta tcg aac gcc ata cgt cgt agc cgt gct ggg ctg tcc 1776
Val Glu Ala Val Ser Asn Ala Ile Arg Arg Ser Arg Ala Gly Leu Ser
580 585 590
gat ccg aac cgt ccg att ggt tcc ttc ctg ttc ctg ggg ccg acg ggg 1824
Asp Pro Asn Arg Pro Ile Gly Ser Phe Leu Phe Leu Gly Pro Thr Gly
595 600 605
gtc ggt aaa acc gaa ctg tgt aaa gca ctg gct aac ttt atg ttc gac 1872
Val Gly Lys Thr Glu Leu Cys Lys Ala Leu Ala Asn Phe Met Phe Asp
610 615 620
agc gac gac gcg atg gtg cgt atc gac atg tct gag ttt atg gag aaa 1920
Ser Asp Asp Ala Met Val Arg Ile Asp Met Ser Glu Phe Met Glu Lys
625 630 635 640
cac tcc gtg tct cgt ttg gtc ggg gcg cct ccg gga tat gtc ggc tat 1968
His Ser Val Ser Arg Leu Val Gly Ala Pro Pro Gly Tyr Val Gly Tyr
645 650 655
gaa gaa ggc ggt tat ttg acg gaa gcg gtg cgc cgt cgc cct tat tcc 2016
Glu Glu Gly Gly Tyr Leu Thr Glu Ala Val Arg Arg Arg Pro Tyr Ser
660 665 670
gtc atc ttg ttg gat gaa gtg gaa aaa gcg cat ccg gat gta ttc aac 2064
Val Ile Leu Leu Asp Glu Val Glu Lys Ala His Pro Asp Val Phe Asn
675 680 685
att ctg ttg cag gtg ctg gac gac ggt cga ctg act gac ggg cag ggg 2112
Ile Leu Leu Gln Val Leu Asp Asp Gly Arg Leu Thr Asp Gly Gln Gly
690 695 700
aga acg gtc gac ttc cgt aat acg gtg gtc att atg act tct aac ctc 2160
Arg Thr Val Asp Phe Arg Asn Thr Val Val Ile Met Thr Ser Asn Leu
705 710 715 720
ggt tcc gat ctc att cag gag cgc ttt ggc gaa ctg gat tac ggt cga 2208
Gly Ser Asp Leu Ile Gln Glu Arg Phe Gly Glu Leu Asp Tyr Gly Arg
725 730 735
atg aaa gag atg gtg ctg ggt gtg gtt agc caa aac ttc cgt ccg gaa 2256
Met Lys Glu Met Val Leu Gly Val Val Ser Gln Asn Phe Arg Pro Glu
740 745 750
ttt atc aac cgt att gat gaa gtt gtg gta ttc cat ccg tta ggt gaa 2304
Phe Ile Asn Arg Ile Asp Glu Val Val Val Phe His Pro Leu Gly Glu
755 760 765
caa cac atc gct tct att gct cag atc cag ctg cag cgt ctg tac aaa 2352
Gln His Ile Ala Ser Ile Ala Gln Ile Gln Leu Gln Arg Leu Tyr Lys
770 775 780
cgt ctg gaa gaa cgt ggt tat gaa atc cat atc tcc gac gag gcg ctg 2400
Arg Leu Glu Glu Arg Gly Tyr Glu Ile His Ile Ser Asp Glu Ala Leu
785 790 795 800
aaa ctg ttg agc gcc aac ggt tac gat ccg gtc tac ggg gcg cgt ccg 2448
Lys Leu Leu Ser Ala Asn Gly Tyr Asp Pro Val Tyr Gly Ala Arg Pro
805 810 815
tta aaa cgt gct att caa cag cag atc gaa aac cca ctg gcg cag caa 2496
Leu Lys Arg Ala Ile Gln Gln Gln Ile Glu Asn Pro Leu Ala Gln Gln
820 825 830
atc ctg tct ggt gaa ctg gtt cct ggc aaa gtg att cgc ctt gaa gcc 2544
Ile Leu Ser Gly Glu Leu Val Pro Gly Lys Val Ile Arg Leu Glu Ala
835 840 845
aat gat gat cgt att gtg gca gtg cag taa 2574
Asn Asp Asp Arg Ile Val Ala Val Gln
850 855
&lt;210&gt; 6
&lt;211&gt; 857
&lt;212&gt; PRT
&lt;213&gt; Salmonella enterica subsp. enterica serovar Typhimurium LT2
&lt;400&gt; 6
Met Arg Leu Asp Arg Leu Thr Asn Lys Phe Gln Leu Ala Leu Ala Asp
1 5 10 15
Ala Gln Ser Leu Ala Leu Gly His Asp Asn Gln Phe Ile Glu Pro Leu
20 25 30
His Leu Met Ser Ala Leu Leu Asn Gln Glu Gly Gly Ser Ile Arg Pro
35 40 45
Leu Leu Thr Ser Ala Gly Ile Asn Ala Gly Gln Leu Arg Thr Ala Ile
50 55 60
Asp Gln Ala Leu Ser Arg Leu Pro Gln Val Glu Gly Thr Gly Gly Asp
65 70 75 80
Val Gln Pro Ser Ser Glu Leu Val Arg Val Leu Asn Leu Cys Asp Lys
85 90 95
Leu Ala Gln Lys Arg Gly Asp Asn Phe Ile Ser Ser Glu Leu Phe Val
100 105 110
Leu Ala Ala Leu Glu Ser Arg Gly Thr Leu Thr Asp Leu Leu Lys Ser
115 120 125
Ala Gly Ala Thr Thr Ala Asn Ile Thr Gln Ala Ile Glu Gln Met Arg
130 135 140
Gly Gly Glu Ser Val Asn Asp Gln Gly Ala Glu Asp Gln Arg Gln Ala
145 150 155 160
Leu Lys Lys Tyr Thr Val Asp Leu Thr Glu Arg Ala Glu Gln Gly Lys
165 170 175
Leu Asp Pro Val Ile Gly Arg Asp Glu Glu Ile Arg Arg Thr Ile Gln
180 185 190
Val Leu Gln Arg Arg Thr Lys Asn Asn Pro Val Leu Ile Gly Glu Pro
195 200 205
Gly Val Gly Lys Thr Ala Ile Val Glu Gly Leu Ala Gln Arg Ile Ile
210 215 220
Asn Gly Glu Val Pro Glu Gly Leu Lys Gly Arg Arg Val Leu Ala Leu
225 230 235 240
Asp Met Gly Ala Leu Val Ala Gly Ala Lys Tyr Arg Gly Glu Phe Glu
245 250 255
Glu Arg Leu Lys Gly Val Leu Asn Asp Leu Ala Lys Gln Glu Gly Asn
260 265 270
Val Ile Leu Phe Ile Asp Glu Leu His Thr Met Val Gly Ala Gly Lys
275 280 285
Ala Asp Gly Ala Met Asp Ala Gly Asn Met Leu Lys Pro Ala Leu Ala
290 295 300
Arg Gly Glu Leu His Cys Val Gly Ala Thr Thr Leu Asp Glu Tyr Arg
305 310 315 320
Gln Tyr Ile Glu Lys Asp Ala Ala Leu Glu Arg Arg Phe Gln Lys Val
325 330 335
Phe Val Ala Glu Pro Ser Val Glu Asp Thr Ile Ala Ile Leu Arg Gly
340 345 350
Leu Lys Glu Arg Tyr Glu Leu His His His Val Gln Ile Thr Asp Pro
355 360 365
Ala Ile Val Ala Ala Ala Thr Leu Ser His Arg Tyr Ile Ala Asp Arg
370 375 380
Gln Leu Pro Asp Lys Ala Ile Asp Leu Ile Asp Glu Ala Ala Ser Ser
385 390 395 400
Ile Arg Met Gln Ile Asp Ser Lys Pro Glu Glu Leu Asp Arg Leu Asp
405 410 415
Arg Arg Ile Ile Gln Leu Lys Leu Glu Gln Gln Ala Leu Met Lys Glu
420 425 430
Ser Asp Glu Ala Ser Lys Lys Arg Leu Asp Met Leu Asn Glu Glu Leu
435 440 445
Asp Asp Lys Glu Arg Gln Tyr Ser Glu Leu Glu Glu Glu Trp Lys Ala
450 455 460
Glu Lys Ala Ser Leu Ser Gly Thr Gln Thr Ile Lys Ala Glu Leu Glu
465 470 475 480
Gln Ala Lys Ile Ala Ile Glu Gln Ala Arg Arg Val Gly Asp Leu Ala
485 490 495
Arg Met Ser Glu Leu Gln Tyr Gly Lys Ile Pro Glu Leu Glu Lys Gln
500 505 510
Leu Glu Ala Ala Thr Gln Ser Glu Gly Lys Thr Met Arg Leu Leu Arg
515 520 525
Asn Lys Val Thr Asp Ala Glu Ile Ala Glu Val Leu Ala Arg Trp Thr
530 535 540
Gly Ile Pro Val Ser Arg Met Leu Glu Gly Glu Arg Glu Lys Leu Leu
545 550 555 560
Arg Met Glu Gln Glu Leu His Ser Arg Val Ile Gly Gln Asn Glu Ala
565 570 575
Val Glu Ala Val Ser Asn Ala Ile Arg Arg Ser Arg Ala Gly Leu Ser
580 585 590
Asp Pro Asn Arg Pro Ile Gly Ser Phe Leu Phe Leu Gly Pro Thr Gly
595 600 605
Val Gly Lys Thr Glu Leu Cys Lys Ala Leu Ala Asn Phe Met Phe Asp
610 615 620
Ser Asp Asp Ala Met Val Arg Ile Asp Met Ser Glu Phe Met Glu Lys
625 630 635 640
His Ser Val Ser Arg Leu Val Gly Ala Pro Pro Gly Tyr Val Gly Tyr
645 650 655
Glu Glu Gly Gly Tyr Leu Thr Glu Ala Val Arg Arg Arg Pro Tyr Ser
660 665 670
Val Ile Leu Leu Asp Glu Val Glu Lys Ala His Pro Asp Val Phe Asn
675 680 685
Ile Leu Leu Gln Val Leu Asp Asp Gly Arg Leu Thr Asp Gly Gln Gly
690 695 700
Arg Thr Val Asp Phe Arg Asn Thr Val Val Ile Met Thr Ser Asn Leu
705 710 715 720
Gly Ser Asp Leu Ile Gln Glu Arg Phe Gly Glu Leu Asp Tyr Gly Arg
725 730 735
Met Lys Glu Met Val Leu Gly Val Val Ser Gln Asn Phe Arg Pro Glu
740 745 750
Phe Ile Asn Arg Ile Asp Glu Val Val Val Phe His Pro Leu Gly Glu
755 760 765
Gln His Ile Ala Ser Ile Ala Gln Ile Gln Leu Gln Arg Leu Tyr Lys
770 775 780
Arg Leu Glu Glu Arg Gly Tyr Glu Ile His Ile Ser Asp Glu Ala Leu
785 790 795 800
Lys Leu Leu Ser Ala Asn Gly Tyr Asp Pro Val Tyr Gly Ala Arg Pro
805 810 815
Leu Lys Arg Ala Ile Gln Gln Gln Ile Glu Asn Pro Leu Ala Gln Gln
820 825 830
Ile Leu Ser Gly Glu Leu Val Pro Gly Lys Val Ile Arg Leu Glu Ala
835 840 845
Asn Asp Asp Arg Ile Val Ala Val Gln
850 855
&lt;210&gt; 7
&lt;211&gt; 1073
&lt;212&gt; DNA
&lt;213&gt; Escherichia coli
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (538)..(1071)
&lt;223&gt; partial coding sequence clpBT7I
&lt;400&gt; 7
taggtagcgg ccgccaatcg agcgggaacg gaagtcgccg ccgctcatgc tggctggcgt 60
ggactgtgcg caggcgtgct ggaagagacg gtttcctgtt ttgctgataa tccggaaaat 120
attctcgcct ggttagggcc ggcaattggt ccacgcgcgt tcgaagtggg gggggaggtt 180
cgcgaggcgt ttatggcagt agacgctaaa gcaagtgcag ctttcattca gcatggtgat 240
aagtatctgg cggatattta tcagcttgcc cggcagcgtc tggcgaacgt gggtgttgag 300
caaattttcg gcggcgaccg ttgtacatat acggaaaatg agactttctt ctcttatcgt 360
cgcgacaaga ccaccggtcg tatggcaagt ttcatttggc tgatataacc taaagaatca 420
agacgatccg gtacgcgtga ttttcttttc acattaatct ggtcaataac cttgaataat 480
tgagggatga cctcatttaa tctccagtag caactttgat ccgttatggg aggagtt 537
atg cgt ctg gat cgt ctt att aat aaa ttc cag ctt gct ctt gcc gat 585
Met Arg Leu Asp Arg Leu Ile Asn Lys Phe Gln Leu Ala Leu Ala Asp
1 5 10 15
gcc caa tca ctt gca ctc ggg cac gac aac caa ttt atc gaa cca ctt 633
Ala Gln Ser Leu Ala Leu Gly His Asp Asn Gln Phe Ile Glu Pro Leu
20 25 30
cat tta atg agc gcc ctg ctg aat cag gaa ggg ggt tcg gtt agt cct 681
His Leu Met Ser Ala Leu Leu Asn Gln Glu Gly Gly Ser Val Ser Pro
35 40 45
tta tta aca tcc gct ggc ata aat gct ggc cag ttg cgc aca gat atc 729
Leu Leu Thr Ser Ala Gly Ile Asn Ala Gly Gln Leu Arg Thr Asp Ile
50 55 60
aat cag gca tta aat cgt tta ccg cag gtt gaa ggt act ggt ggt gat 777
Asn Gln Ala Leu Asn Arg Leu Pro Gln Val Glu Gly Thr Gly Gly Asp
65 70 75 80
gtc cag cca tca cag gat ctg gtg cgc gtt ctt aat ctt tgc gac aag 825
Val Gln Pro Ser Gln Asp Leu Val Arg Val Leu Asn Leu Cys Asp Lys
85 90 95
ctg gcg caa aaa cgt ggt gat aac ttt atc tcg tca gaa ctg ttc gtt 873
Leu Ala Gln Lys Arg Gly Asp Asn Phe Ile Ser Ser Glu Leu Phe Val
100 105 110
ctg gcg gca ctt gag tct cgc ggc acg ctg gcc gac atc ctg aaa gca 921
Leu Ala Ala Leu Glu Ser Arg Gly Thr Leu Ala Asp Ile Leu Lys Ala
115 120 125
gca ggg gcg acc acc gcc aac att act caa gcg att gaa caa atg cgt 969
Ala Gly Ala Thr Thr Ala Asn Ile Thr Gln Ala Ile Glu Gln Met Arg
130 135 140
gga ggt gaa agc gtg aac gat caa ggt gct gaa gac caa cgt cag gct 1017
Gly Gly Glu Ser Val Asn Asp Gln Gly Ala Glu Asp Gln Arg Gln Ala
145 150 155 160
ttg aaa aaa tat acc atc gac ctt acc gaa cga gcc gaa cag gcg gcc 1065
Leu Lys Lys Tyr Thr Ile Asp Leu Thr Glu Arg Ala Glu Gln Ala Ala
165 170 175
gct aac tg 1073
Ala Asn
&lt;210&gt; 8
&lt;211&gt; 178
&lt;212&gt; PRT
&lt;213&gt; Escherichia coli
&lt;400&gt; 8
Met Arg Leu Asp Arg Leu Ile Asn Lys Phe Gln Leu Ala Leu Ala Asp
1 5 10 15
Ala Gln Ser Leu Ala Leu Gly His Asp Asn Gln Phe Ile Glu Pro Leu
20 25 30
His Leu Met Ser Ala Leu Leu Asn Gln Glu Gly Gly Ser Val Ser Pro
35 40 45
Leu Leu Thr Ser Ala Gly Ile Asn Ala Gly Gln Leu Arg Thr Asp Ile
50 55 60
Asn Gln Ala Leu Asn Arg Leu Pro Gln Val Glu Gly Thr Gly Gly Asp
65 70 75 80
Val Gln Pro Ser Gln Asp Leu Val Arg Val Leu Asn Leu Cys Asp Lys
85 90 95
Leu Ala Gln Lys Arg Gly Asp Asn Phe Ile Ser Ser Glu Leu Phe Val
100 105 110
Leu Ala Ala Leu Glu Ser Arg Gly Thr Leu Ala Asp Ile Leu Lys Ala
115 120 125
Ala Gly Ala Thr Thr Ala Asn Ile Thr Gln Ala Ile Glu Gln Met Arg
130 135 140
Gly Gly Glu Ser Val Asn Asp Gln Gly Ala Glu Asp Gln Arg Gln Ala
145 150 155 160
Leu Lys Lys Tyr Thr Ile Asp Leu Thr Glu Arg Ala Glu Gln Ala Ala
165 170 175
Ala Asn
&lt;210&gt; 9
&lt;211&gt; 36
&lt;212&gt; DNA
&lt;213&gt; Escherichia coli
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(36)
&lt;223&gt; Primer clpBT7I_lfw
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(6)
&lt;223&gt; random
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (7)..(17)
&lt;223&gt; Restrictionsite NotI
&lt;400&gt; 9
cagttagcgg ccgcctgttc ggctcgttcg gtaagg 36
&lt;210&gt; 10
&lt;211&gt; 46
&lt;212&gt; DNA
&lt;213&gt; Escherichia coli
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(46)
&lt;223&gt; Primer clpBT7I_lrv
&lt;220&gt;
&lt;221&gt; mutation
&lt;222&gt; (23)..(23)
&lt;223&gt; g2732176a (clpBT7I)
&lt;400&gt; 10
gttatgcgtc tggatcgtct tattaataaa ttccagcttg ctcttg 46
&lt;210&gt; 11
&lt;211&gt; 46
&lt;212&gt; DNA
&lt;213&gt; Escherichia coli
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(46)
&lt;223&gt; Primer clpBT7I_rfw
&lt;220&gt;
&lt;221&gt; mutation
&lt;222&gt; (24)..(24)
&lt;223&gt; g2732176a (clpBT7I)
&lt;400&gt; 11
caagagcaag ctggaattta ttaataagac gatccagacg cataac 46
&lt;210&gt; 12
&lt;211&gt; 36
&lt;212&gt; DNA
&lt;213&gt; Escherichia coli
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(36)
&lt;223&gt; Primer clpBT7I_rrv
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(6)
&lt;223&gt; random
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (7)..(14)
&lt;223&gt; restriction site NotI
&lt;400&gt; 12
taggtagcgg ccgccaatcg agcgggaacg gaagtc 36
&lt;210&gt; 13
&lt;211&gt; 21
&lt;212&gt; DNA
&lt;213&gt; Escherichia coli
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(21)
&lt;223&gt; Primer pKO3-L
&lt;400&gt; 13
agggcagggt cgttaaatag c 21
&lt;210&gt; 14
&lt;211&gt; 21
&lt;212&gt; DNA
&lt;213&gt; Escherichia coli
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(21)
&lt;223&gt; Primer pKO3-R
&lt;400&gt; 14
ttaatgcgcc gctacagggc g 21
201600334 2

Claims (15)

1.编码热休克蛋白ClpB变体的核苷酸序列,其氨基酸序列与SEQ ID NO:2至少95%相同,特征在于所述氨基酸序列中位置7处的L-苏氨酸残基已被L-异亮氨酸残基代替。
2.权利要求1的核苷酸序列,其特征在于所编码的多肽基本上具有对应于857个氨基酸的长度。
3.核苷酸序列,特征在于其包含权利要求1和2的核苷酸序列或者是权利要求1和2的核苷酸序列的片段,这样的片段编码权利要求1的氨基酸序列的至少5-820位置。
4.载体,特征在于其包含权利要求1-3中任一项的核苷酸序列,有或无启动子。
5.来自肠杆菌科(Enterobacteriaceae)的微生物,特征在于其包含权利要求1-3中任一项的核苷酸序列。
6.来自肠杆菌科的微生物,特征在于其包含权利要求4的载体。
7.来自肠杆菌科的微生物,其特征在于权利要求1-3中任一项的核苷酸序列被整合入染色体。
8.权利要求5-7中任一项的微生物,特征在于其选自埃希氏菌属(Escherichia)、欧文氏菌属(Erwina)和普罗威登斯菌属(Providencia)。
9.权利要求5-8中任一项的微生物,特征在于其产生选自芳香族L-氨基酸的有机化学化合物。
10.权利要求9的微生物,其特征在于所述芳香族L-氨基酸是L-色氨酸。
11.权利要求5-10的微生物,其特征在于所述微生物具有增加的Trp操纵子表达。
12.通过转化、转导或接合产生权利要求5-11中任一项的微生物的方法,其特征在于所述转化、转导或接合利用权利要求4的载体进行。
13.权利要求5-11的微生物在制备L-色氨酸中的用途。
14.制备芳香族L-氨基酸或包含芳香族L-氨基酸的饲料添加剂的方法,特征在于其包括在培养基中发酵权利要求5-11中任一项的微生物以及在发酵培养基中富集所述芳香族L-氨基酸和/或分离所述芳香族L-氨基酸。
15.权利要求14的方法,其特征在于所述芳香族L-氨基酸是L-色氨酸。
CN201710445116.XA 2017-06-13 2017-06-13 利用改进的肠杆菌科菌株制备芳香族l-氨基酸的方法 Pending CN109082431A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710445116.XA CN109082431A (zh) 2017-06-13 2017-06-13 利用改进的肠杆菌科菌株制备芳香族l-氨基酸的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710445116.XA CN109082431A (zh) 2017-06-13 2017-06-13 利用改进的肠杆菌科菌株制备芳香族l-氨基酸的方法

Publications (1)

Publication Number Publication Date
CN109082431A true CN109082431A (zh) 2018-12-25

Family

ID=64838784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710445116.XA Pending CN109082431A (zh) 2017-06-13 2017-06-13 利用改进的肠杆菌科菌株制备芳香族l-氨基酸的方法

Country Status (1)

Country Link
CN (1) CN109082431A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002040679A2 (en) * 2000-11-15 2002-05-23 Archer-Daniels-Midland Company Corynebacterium glutamicum promoters
WO2003008607A2 (en) * 2001-07-18 2003-01-30 Degussa Ag Process for the preparation of l-amino acids using strains of the enterobacteriaceae family
CN1533439A (zh) * 2001-07-18 2004-09-29 �������¹ɷ����޹�˾ 使用含有弱化的aspA基因的肠细菌科菌株制备L-氨基酸的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002040679A2 (en) * 2000-11-15 2002-05-23 Archer-Daniels-Midland Company Corynebacterium glutamicum promoters
WO2003008607A2 (en) * 2001-07-18 2003-01-30 Degussa Ag Process for the preparation of l-amino acids using strains of the enterobacteriaceae family
CN1533439A (zh) * 2001-07-18 2004-09-29 �������¹ɷ����޹�˾ 使用含有弱化的aspA基因的肠细菌科菌株制备L-氨基酸的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JIABEI LIN ET AL: "Examination of the dynamic assembly equilibrium for E.coli ClpB:ClpB assembly", 《PROTEINS:STRUCTURE,FUNCTION,AND BIOINFORMATICS》 *

Similar Documents

Publication Publication Date Title
CN104812906B (zh) 使用改良的肠杆菌科菌株发酵产生l-氨基酸的方法
KR101337165B1 (ko) 코리네형 박테리아의 rel 유전자의 대립유전자
CN100485028C (zh) 生产氨基酸的细菌及制备l-氨基酸的方法
US20170067066A1 (en) Cell with reduced ppgppase activity
EP2133420B1 (de) Verfahren zur Herstellung von L-Aminosäuren unter Verwendung von verbesserten Stämmen der Familie Enterobacteriaceae
US7618798B2 (en) Alginate gel scaffold having a plurality of continuous parallel microtubular copper capillaries
US20200216867A1 (en) Method for producing l-tryptophan using improved strains of the enterobacteriaceae family
DK2147972T3 (en) A process for producing L-tryptophan using the improved strains of the family Enterobacteriaceae
US8592177B2 (en) Process for the fermentative preparation of organic chemical compounds using Coryneform bacteria in which the sugR gene is present in attenuated form
US8080395B2 (en) Alleles of the PRPD1 gene from coryneform bacteria
US8592187B2 (en) Alleles of the oxyR gene from coryneform bacteria
CN1898392B (zh) 使用肠杆菌科菌株制备l-氨基酸的方法
DE102007052270A1 (de) Verfahren zur Herstellung von L-Aminosäuren unter Verwendung von verbesserten Stämmen der Familie Enterobacteriaceae
CN109082431A (zh) 利用改进的肠杆菌科菌株制备芳香族l-氨基酸的方法
US8143032B1 (en) Alleles of the thrA gene of Enterobacteriaceae
CN110714034A (zh) 发酵生产l-赖氨酸的方法
EP3385275B1 (de) Verfahren zur herstellung von aromatischen l-aminosäuren unter verwendung von verbesserten stämmen der familie enterobacteriaceae
CN111334534A (zh) 使用具有突变的Kup转运蛋白的谷氨酸棒杆菌菌株发酵生产L-赖氨酸的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Essen, Germany

Applicant after: Evonik Operations Limited

Address before: Essen, Germany

Applicant before: EVONIK DEGUSSA GmbH

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181225