CN1263855C - 来自淡青链霉菌的假寡糖生物合成基因的分离及其应用 - Google Patents

来自淡青链霉菌的假寡糖生物合成基因的分离及其应用 Download PDF

Info

Publication number
CN1263855C
CN1263855C CNB971958858A CN97195885A CN1263855C CN 1263855 C CN1263855 C CN 1263855C CN B971958858 A CNB971958858 A CN B971958858A CN 97195885 A CN97195885 A CN 97195885A CN 1263855 C CN1263855 C CN 1263855C
Authority
CN
China
Prior art keywords
dna
ala
leu
gly
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB971958858A
Other languages
English (en)
Other versions
CN1223687A (zh
Inventor
H·德克尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hoechst AG
Sanofi Aventis Deutschland GmbH
Original Assignee
Aventis Pharma Deutschland GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aventis Pharma Deutschland GmbH filed Critical Aventis Pharma Deutschland GmbH
Publication of CN1223687A publication Critical patent/CN1223687A/zh
Application granted granted Critical
Publication of CN1263855C publication Critical patent/CN1263855C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Plant Substances (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

本发明涉及以下内容:一种包含阿卡糖和同源假寡糖生物合成基因的重组DNA分子;用于该分子PCR扩增的寡核苷酸引物;经定位于该分子上的基因表达可获得的蛋白质;含有该DNA分子的载体和宿主细胞;该DNA分子所编码的蛋白质;在上述宿主细胞内由上述载体所表达的蛋白质;在相应宿主生物体内通过融入和/或排除特定的基因而产生阿卡糖的方法;探查出阿卡糖生物合成基因的基因簇的全部基因的方法;在除淡青链霉菌GLA.O外的其它生物体中分离类似的基因簇的方法;诱变内源性阿卡糖生物合成基因启动子以增加阿卡糖产量的方法;淡青链霉菌GLA.O用于阿卡糖制备的用途;和以阿卡糖产量为标准优化的淡青链霉菌GLA.O突变株。

Description

来自淡青链霉菌的假寡糖生物 合成基因的分离及其应用
发明领域
本发明涉及编码α-淀粉酶抑制剂即假寡糖(pseudooligosaccharides)的生物合成的酶的基因的分离。所述的基因特别是指来源于链霉菌属的菌株淡青链霉菌(Streptomyces glaucescens)GLA.O(DSM 40716)的基因。另外,本专利描述了在淡青链霉菌GLA.O的辅助下,这些基因用于制备阿卡糖及其同源物质的用途,为提高并稳定产量将这些基因在其它产生假寡糖的菌株(如,游动放线菌(Actinoplanes sp)SE50/100)中进行的异源性表达,以及在其它微生物中这些基因的异源表达,例如大肠杆菌,枯草芽孢杆菌(Bacillus subtilis),放线菌目(Actinomycetales),如链霉菌属(Streptomyces)、游动放线菌属和小瓶菌属(Ampullariella)、链孢子囊菌属(Streptoporangium)的菌株,吸水链霉菌柠檬变种(Streptomyceshygroscopicus var.limoneus)、淡青链霉菌,以及生物技术相关的真菌(例如,黑曲霉(Aspergillus niger)和产黄青霉(Penicillium chrysogenum))和酵母(例如啤酒酵母(Saccharomyces cerevisiae))。本发明也涉及其它微生物中的同源基因及其分离方法。
发明背景
淡青链霉菌GLA.O可产生两种抗生素羟基链霉素(Hutter(1967)Systematik der Streptomyceten链霉菌分类学(Taxonomy of theStreptomycetes)Basel,Karger Verlag)和丁省霉素(tetracenomysin)(Weber等(1979)微生物学文献(Arch.Microbiol)121:111-116)。众所周知,链霉菌能够合成结构各异的天然产物。然而生成这些化合物的条件经常未知,或者是这些物质仅微量产生而检测不到。
α-淀粉酶抑制剂阿卡糖(acarbose)已从多种游动放线菌菌株(SE50,SE82和SE18)(Schmidt等(1977)Naturwissenschaften64:535-536)中分离出来,这种活性物质在从游动放线菌属、小瓶菌属和链孢子囊菌属中筛选α-淀粉酶抑制剂时被发现。阿卡糖是假四聚糖,包含一个独特的键合了一种氨基糖,即4,6-双脱氧4-氨基-D-吡喃型葡萄糖的不饱和环多醇单位。附加的以α-1,4-糖苷键键合的D-吡喃型葡萄糖单位可键合于该氨基糖上。这样,例如阿卡糖,可含有两分子额外的D-葡萄糖。此生产菌株合成具有不同长度糖基侧链的假寡糖产物的混合物(Schmidt等(1977)Naturwissenschaften 64:535-536)。阿卡糖环多醇残基与来自吸水链霉菌柠檬变种的抗菌素有效霉素A(1wasa等(1979)抗生素杂志(J.Antibiot.)32:595-602)的一个组分化合物valienamine相同。
阿卡糖可由游动放线菌菌株发酵生产,并因作为糖尿病的治疗剂而具有重要经济价值。尽管游动放线菌合成的是α-淀粉酶抑制剂产物的混合物,但阿卡糖仅为相对分子量为645.5的化合物(即含两个葡萄糖单位的acarviosin(Truscheit(1984)第8届医药化学国际研讨会报告(VIIIthInternational Symposium on Medicinal Chemistry,Proc),卷1,瑞典药学科学院(Swedish Academy of Pharmaceutical Sciences),Stockholm,Sweden),阿卡糖这个名称即由acarviosin派生)。选择了发酵条件以保证阿卡糖为发酵主产物。另外采用了主产物为阿卡糖的特定的筛选株和菌株或者应用纯化方法以实现选择性分离(Truscheit(1984)第8届医药化学国际研讨会报告(VIIIth International Symposium onMedicinal Chemistry,Proc),卷1,瑞典药学科学院(Swedish Academy ofPharmaceutical Sciences),Stockholm,Sweden)。也可以通过对混合产物进行化学改造最后得到目的产物阿卡糖。
同链霉菌属相比,目前并没有从遗传角度对游动放线菌属进行深入的研究。为研究链霉菌建立的方法不能或不能总是适用于游动放线菌。为了应用分子生物学方法有目的地优化阿卡糖产量,必须分离和鉴定阿卡糖生物合成基因。本文提出了建立一种游动放线菌属的宿主/载体系统的可能性,然而鉴于当前对游动放线菌的研究相对肤浅这一事实,该方法非常的冗长而复杂。
发明内容
本专利申请所描述的发明达到了克隆阿卡糖和同源假寡糖的生物合成基因的目的,上述基因是从已在遗传学方面彻底研究过的链霉菌属的淡青链霉菌GLA.O中克隆的(Crameri等(1983)普通微生物学杂志(J.Gen.Microbiol.)129:519-527;Hintermann等(1984)分子与普通遗传学(Mol.Gea.Genet.)196:513-520;Motamedi和Hutchinson(1987)PNAS USA 84:4445-4449;Geistlich等(1989)分子微生物学(Mol.Microbiol.)3:1061-1069),令人惊讶的是淡青链霉菌GLA.O是阿卡糖的产生菌。在含有淀粉的培养基中,淡青链霉菌GLA.O产生具有分子量645、807和970的假寡糖。
因而,从淡青链霉菌GLA.O中分离相应的生物合成基因并用其分离毗邻的DNA区以探查出该生物合成基因的基因簇的全部基因是本发明的部分主题。
分离和鉴定假寡糖的生物合成基因对于更好地了解假寡糖的生物合成及其调节非常重要。这样,就可通过已建立的经典的和分子生物学的方法提高淡青链霉菌GLA.O生产阿卡糖的产量。除此之外,编码假寡糖生物合成的完整基因簇或基因簇中的单独基因可表达于其它生物技术相关的微生物以使假寡糖(诸如阿卡糖)产量进一步提高或简化制备方法。生物合成基因的特异性修饰可用于获得专一生产分子量为645的阿卡糖的菌株。因抗生素生物合成基因通常成簇出现且经常高度保守(Stockmann和Piepersberg(1992)FEMS Microbiol.Letters 90:185-190;Malpartida等(1987)自然(Nature)314:642-644),淡青链霉菌GLA.O基因也可作为一种探针用于从诸如游动放线菌属中分离编码阿卡糖的基因。调节基因或编码生物合成中限速步骤的基因的表达可导致淡青链霉菌GLA.O、游动放线菌属或相关的生产菌株的产量增加。产量的提高也可通过关闭(敲除或诱变)在生物合成中起抑制作用的阿卡糖生物合成基因而达到。
克隆从前未分离出来的抗生素生物合成基因的一个可能策略是使用基因特异性探针(Stockmann和Piepersberg(1992)FEMS Microbiol.Letters90:185-190;Malpartida等(1987)自然(Nature)314:642-644)。这些探针可以是p32标记的或以其它途径标记的DNA片段;或者用变性PCR引物和分离的作为模板的染色体DNA直接从所用菌株中扩增合适的基因。
本研究应用后一种方法。假寡糖,如阿卡糖含有一个4,6-脱氧葡萄糖的构建单位作为结构元件。已知dTDP-葡萄糖4,6-脱水酶参与4,6-脱氧葡萄糖的生物合成(Stockmann和Piepersberg(1992)FEMS Microbiol.Letters90:185-190)。由于脱氧糖是天然产物和抗生素的常有组分,因此这种酶可能用于分离相应抗生素生物合成基因。由于这些基因常成簇存在所以,这对初始化分离一个基因是足够的;接着就可以进行毗邻DNA区的分离和鉴定。
例如:一种dTDP-葡萄糖4,6-脱水酶在淡青链霉菌GLA.O中催化羟基链霉素生物合成过程中的一步(Retzlaff等(1993)工业微生物,基础与实用分子遗传学ASM(Industrial Microorganisms.Basic and appliedmolecular genetics ASM)华盛顿特区,美国)。而且dTDP-葡萄糖4,6-脱水酶已从其它微生物,如灰色链霉菌(Streptomyces griseus)(Pissowotzki等(1991)分子与普通遗传学(Mol.Gen.Genet.)231:113-123)、弗氏链霉菌(Streptomyces fradiae)(Merson-Davies和Cundcliffe(1994)分子微生物学(Mol.Microbiol.)13:349-355)和紫红链霉菌(Streptomyces violaceoruber)(Bechthold等(1991)分子与普通遗传学(Mol.Gen.Genet.)248:610-620)中分离出来。
接下来可以从已知生物合成基因的氨基酸序列推出用于扩增dTDP-葡萄糖4,6-脱水酶的PCR引物序列。为得到该序列,从这些酶蛋白质序列中选出保守区域,并将氨基酸序列翻译为与遗传密码相对应的核酸序列。蛋白质序列取自EMBL和Genbank数据库,使用了如下序列:灰色链霉菌;登记号:X62567基因:strE(日期1993年10月30日);紫红链霉菌;登记号:L37334基因:graE(日期1995年4月10日);红色糖多孢菌(Saccharopolyspora etythraea);登记号:L37354 基因:gdh(日期1994年11月9日)。因遗传密码的简并性得到大量可能的引物序列。链霉菌密码子第三位通常包含一个G或C这一事实(Wright和Bibb(1992)基因(gene)113:55-65)减少了需合成引物的数量。这些引物混合物即可被用来对被研究菌的DNA进行PCR扩增,并能获得理想的扩增DNA片段。对于高保守性蛋白质,这一片段具有可预测的长度,这一长度是由相应基因引物间的核酸序列距离得来的。然而,这种性质的实验混合物并不是不可避免地必然导致扩增。引物可能因特异性太低而扩增出大量的片段;或者若染色体上没有所制备的PCR引物的互补结合位点,则不会得到PCR产物。
对链霉菌菌株淡青链霉菌GLA.O的研究得到了一个如预计长度550bp的扩增DNA片段(acbD*)。进一步研究显示,除含有生物合成羟基链霉素的dTDP-葡萄糖-4,6-脱水酶基因外,此菌株意外地含有用于生物合成假寡糖如阿卡糖的另一种dTDP-葡萄糖4,6-脱水酶基因。尽管两基因表现出有高度的同源性。但在氨基酸水平上两者只有65%相同性。
AcbD*探针(见实施例2及表2A)用于从淡青链霉菌GLA.O中分离一个6.8Kb的PstI DNA片段,此片段编码参与假寡糖生物合成的多个基因(acbA,acbB,acbC,acbD,acbE和acbF)。
缺失acbBCD基因(氨基转移酶,acbB,dTDP-葡萄糖合酶,acbC,dTDP-葡萄糖-4,6-脱水酶,acbD,见实施例6)导致在生产培养基中不再产生任何假寡糖的淡青链霉菌GLA.O突变株的产生。因此,缺失相应基因座可证实acbBCD基因参与了假寡糖合成。
从透彻研究过的同源酶功能可以得出结论,dTDP-葡萄糖合酶和dTDP-葡萄糖4,6-脱水酶这两类基因应该参与假寡糖中脱氧糖的生物合成(见上)。氨基转移酶(由基因acbB编码)可能负责将氨基转移到糖残基或环多醇残基。通过分析acbB的蛋白质序列,发现一个参与结合磷酸吡哆醛的氨基酸基序。此基序为典型III型氨基转移酶(EC2.6.1.11;EC2.6.1.13;EC2.6.1.18;EC2.6.1.19;EC2.6.1.62;EC2.6.1.64;EC5.4.3.8)。只有进一步研究假寡糖的生物合成,才可阐明acbB精确的酶功能。acbE编码一种与具有螺旋-转角-螺旋基序的DNA结合蛋白(如:枯草芽孢杆菌DegAP37947:Swiss-Prot数据库)有很多相似之处的转录调节蛋白。因而,例如在葡萄糖存在下,来自枯草芽孢杆菌的转录激活剂CcpA抑制α-淀粉酶的形成(Henkin等(1991)分子微生物学(Mol.Microbiol.)5:575-584)。此类的其它代表物是识别特定的糖结构单元并能对代谢途径中生物合成有正性或负性作用的蛋白质。假寡糖生物合成在淡青链霉菌GLA.O中也受调节。从前只有在含淀粉的培养基中才可证明假寡糖的合成。尽管此方法表明acbE可能负责调节假寡糖合成,但确切机制仍未知。然而,现在可用分子生物学方法特异性修饰基因使假寡糖生物合成率提高。另外,acbE结合的DNA位点可由所谓的凝胶迁移法确定(Miwa等(1994)微生物学(Microbiology)140:2576-2575)。确定并修饰负责假寡糖基因转录的启动子和其它DNA调节区域可提高阿卡糖生物合成率。
目前,acbF的功能仍未确定。其相应基因产物表现出与糖结合蛋白例如来源于变异链球菌(Streptococcus mutans)的糖结合蛋白(MsmE;Q00749:SwissProt数据库)的同源性,因而它有可能与假寡糖生物合成有关。基因acbA的产物表现出与已知的细菌ATP结合蛋白的同源性(如:波赛链霉菌(Streptomyces peucitus)DrrA,P32010:SwissProt数据库)。AcbA蛋白具有典型的ATP/ADP结合基序,即所谓P环。这些蛋白质组成了一个在生物膜上参与代谢物主动转运的名为ABC转运蛋白的重要成分(Higgins(1995)细胞(Cell)82:693-696)。因而,AcbA可能负责将假寡糖运出细胞或参与向细胞内转运用于生物合成α-淀粉酶抑制剂的糖结构单元,如麦芽糖。
目前已经分析过的所有用于生物合成次级代谢产物的链霉菌基因都是成簇分布的。因此,可以假定本申请所述阿卡糖生物合成基因也是以这种基因簇的方式分布的。因而,也可通过分离与本发明所述6.8Kb PstI DNA片段相邻的DNA区域而得到与假寡糖生物合成相关的其余基因。而且如上所述,也很可能从除淡青链霉菌GLA.O以外的微生物中分离出同源性基因簇。
因此,本发明涉及一种包含用于生物合成阿卡糖和同源性假寡糖基因的重组DNA分子,尤其涉及一种重组DNA分子,其上分布了多个单个基因,其中这些基因的转录方向和顺序如图3所示,和/或具有如图3所示的限制性酶切图谱,优选地涉及了一种重组DNA分子,其
(a)包含了如表4的一种DNA序列或其部分;
(b)包含了在严格条件下,其能与如(a)的DNA分子或其部分杂交的一种DNA序列;或
(c)包含了因为遗传密码简并性而不同于如(a)或(b)的DNA分子的一种DNA序列,此DNA序列允许应用如(a)或(b)的DNA分子或其部分所相应地表达的蛋白质的表达。
本发明还涉及一种包含acbA基因的重组DNA分子,尤其是特征在于包含如表4的核苷酸1到720的DNA序列或其部分的DNA分子;还涉及一种包含acbB基因的重组DNA分子,尤其是特征在于包含如表4的核苷酸720到2006的DNA序列或其部分的DNA分子;还涉及一种包含acbC基因的重组DNA分子,尤其是特征在于包含如表4的核苷酸2268到3332的DNA序列或其部分的DNA分子;还涉及一种包含acbD基因的重组DNA分子,尤其是特征在于包含如表4的核苷酸3332到4306的DNA序列或其部分的DNA分子;还涉及一种包含acbE基因的重组DNA分子,尤其是特征在于包含如表4的核苷酸4380到5414的DNA序列或其部分的DNA分子;还涉及一种包含acbF基因的重组DNA分子,尤其是特征在于如包含如表4的核苷酸5676到6854的DNA序列或其部分的DNA分子。
本发明还涉及如上述用于含有生物合成阿卡糖和同源性假寡糖基因的重组DNA分子PCR扩增的寡核苷酸引物,这些引物特别是含有如表1的序列。
本发明还涉及包含上一段之前的一、二段中所述的DNA分子的一种重组DNA分子的一种载体,尤其是其特征在于该载体是一种表达型载体并且上述DNA分子可操纵性地地连接于一个启动子序列,并且该载体优选地适于在选自大肠杆菌、枯草芽孢杆菌、放线菌目,如链霉菌属、游动放线菌属、小瓶菌属和链孢子囊菌属的菌株,吸水链霉菌柠檬变种、淡青链霉菌以及生物技术相关的真菌(例如,黑曲霉、产黄青霉)和酵母(例如啤酒酵母)的宿主体内表达,特别优选淡青链霉菌GLA.O或游动放线菌属。由于该DNA分子与载体启动子序列可操纵地连接仅是本发明一个优选的实施方案,因此使用与该DNA分子相关的内源性启动子序列也可以实现表达,例如在各种情况下的天然启动子,或为优化阿卡糖产量而经诱变的天然启动子。这些启动子也是如本发明的DNA分子的一部分。
本发明还涉及包括一种如本发明的DNA分子的载体,该载体用于从产生阿卡糖的微生物中去除或改变阿卡糖自身生物合成基因。该载体优选取自含有pGM160的组中及如欧洲专利EP 0 334 282和EP 0 158 872中所述的载体。
本发明还涉及用某一上述DNA分子或载体进行转化的一种宿主细胞,其特征在于该宿主细胞选自大肠杆菌,枯草芽孢杆菌,放线菌目,如链霉菌属、游动放线菌属、小瓶菌属和链孢子囊菌属,吸水链霉菌柠檬变种或淡青链霉菌以及生物技术相关的真菌(例如黑曲霉、产黄青霉)和酵母(例如啤酒酵母),特别优选的选自淡青链霉菌GLA.O或游动放线菌属。
本发明还涉及一种通过表达如本发明重组DNA分子的基因而得到的蛋白质混合物,其中该DNA分子包含阿卡糖生物合成基因和同源性假寡糖基因,特别是该DNA分子特征在于
(a)包含了如表4的一种DNA序列或其部分;
(b)包含了在严格条件下能与如(a)的DNA分子或其部分杂交的一种DNA序列;或
(c)包含了因为遗传密码简并性而不同于如(a)或(b)的DNA分子的一种DNA序列,此DNA序列允许应用如(a)或(b)的DNA分子或其部分所相应地表达的蛋白质的表达。
本发明还涉及可通过表达前面段落中所述的DNA分子编码的基因而得到分离的蛋白质
以下陈述适用于本发明所确定的所有单个基因,为求清晰一并陈述:本发明还涉及如上上一段中所述的一种重组DNA分子编码的一种蛋白质,尤其是其特征在于DNA分子包含如表4的核苷酸1到720或720到2006或2268到3332或3332到4306或4380到5414或5676到6854的分子,或其部分;特别优选由acbA或acbB或acbC或acbD或acbE或acbF基因编码的,包含如表4的氨基酸序列或其部分的蛋白质.
本发明还涉及作为本发明部分主题的用于获得如上所述蛋白质的方法,此方法特征在于
(a)蛋白质在合适的宿主细胞中表达,特别是其特征在于宿主细胞选自大肠杆菌,枯草芽孢杆菌,放线菌目,如链霉菌属、游动放线菌属、小瓶菌属和链孢子囊菌属的菌株,吸水链霉菌柠檬变种或淡青链霉菌以及生物技术相关的真菌(例如,黑曲霉和产黄青霉)和酵母(例如啤酒酵母),最优选的宿主细胞选自淡青链霉菌GLA.O和游动放线菌属,并
(b)得以分离。
本发明还涉及制备阿卡糖的方法,其特征在于
(a)在合适的宿主细胞中表达重组DNA分子上的一个或多个基因,该重组DNA分子包含如表4的一种DNA序列或其部分,或包含在严格条件下能与如表4的DNA分子或其部分杂交的一种DNA序列,或包含因为遗传密码简并性而不同于刚刚提到的DNA分子的一种DNA序列,此DNA序列允许应用上述这些DNA分子或其中一部分所相应地表达的蛋白质的表达,特别的,该宿主细胞选自如上段所述的那些宿主细胞,并且
(b)从上述宿主细胞的培养基上清液中分离阿卡糖。
本发明还涉及制备阿卡糖的方法,其特征在于
(a)从一种产生阿卡糖的宿主细胞中去除重组DNA分子的一个或多个基因,该重组DNA分子包含如表4的一种DNA序列或其部分,或包含在严格条件下能与如表4的DNA分子或其部分杂交的一种DNA序列,或包含因为遗传密码简并性而不同于刚刚提到的DNA分子的一种DNA序列,此DNA序列允许应用上述这些DNA分子或其中一部分所相应地表达的蛋白质的表达,特别的,该宿主细胞为淡青链霉菌GLA.O和游动放线菌属,并且
(b)从上述宿主细胞中分离阿卡糖。
在这方面,一个或多个基因的去除可用标准的分子生物学方法完成,例如使用上述载体(pGM160以及其它载体)。被去除的基因例如可以是可能有调节功能的acbE基因。为得到作为单一发酵产物的纯的阿卡糖且不再得到同源假寡糖的混合物,可以用同种方法去除基因(见上)。优选地使用上述用于此目的的载体来去除这些基因。
本发明还涉及制备阿卡糖的方法,其特征在于将前面两段所述的阿卡糖制备方法互相结合起来,这样可以做到人为地表达一个或多个上述基因以及去除一个或多个上述基因。
本发明还涉及改变内源性阿卡糖生物合成基因表达的方法,其是通过突变各自的基因启动子使阿卡糖产量提高。在本文中,可以使用已知的同源性重组方法将突变引入待改进的生产菌株。这些突变可以是转换、删除和/或增加。“增加”,例如可以是增加一个或多个核苷酸,或一个或多个有正性调节效应从而增强一种生物合成阿卡糖内源性基因表达的DNA序列;相反情况下,即增加有负性调节效应的一种DNA序列从而抑制一种内源性阿卡糖生物合成基因也是增加的一种优选形式。“转换”,例如可以是核苷酸的交换,从而减弱或增强起负性或正性作用的调节元件的效应。“删除”可用于去除起负性或正性作用的调节元件。此方法的内源性基因优选地存在于放线菌目,如链霉菌属、游动放线菌属、小瓶菌属或链孢子囊菌属的菌株,吸水链霉菌柠檬变种或淡青链霉菌;尤其特指存在于淡青链霉菌GLA.O和游动放线菌属。
本发明还涉及淡青链霉菌GLA.O用于制备阿卡糖的用途。
本发明还涉及淡青链霉菌GLA.O以“经典途径”获得其突变株的用途,突变株使获得的阿卡糖产量更高。获得改进的天然产物生产菌株的方法已问世很长时间,通常使用突变和筛选这类经典方法。
本发明还涉及探查出生物合成如表4的阿卡糖和同源性多糖的基因簇的全部基因的方法,其特征在于
a)制备源自如表4DNA分子的杂交探针,
b)这些杂交探针用于从获自淡青链霉菌GLA.O的DNA文库中基因组筛选,并且
c)分离和鉴定所获克隆。
本发明还涉及探查出生物合成如表4的阿卡糖和同源性假寡糖的基因簇的全部基因的方法,其特征在于,从如表4的重组DNA分子开始
a)制备PCR引物,
b)这些PCR引物要与所用的载体系统序列杂交的引物相结合以用于累积源自淡青链霉菌GLA.O的基因组的DNA片段,
c)分离和鉴定所累积的片段.
本发明还涉及从除淡青链霉菌GLA.O以外其它产阿卡糖微生物中分离生物合成阿卡糖和同源性假寡糖基因簇的方法,其特征在于,从如权利要求4的重组DNA分子开始,
a)制备杂交探针,
b)这些杂交探针用于从获自相应微生物的DNA文库中进行基因组或cDNA筛选,且
c)分离和鉴定所获克隆。
本发明还涉及从除淡青链霉菌GLA.O以外其它产阿卡糖微生物中分离生物合成阿卡糖和同源性假寡糖的基因簇的方法,其特征在于,从如权利要求4的重组DNA分子开始,
a)制备PCR引物,
b)这些PCR引物用于累积来自相应微生物基因组DNA或cDNA的DNA片段,
c)分离和鉴定所累积的片段,且
d)合适时,应用如前面段落所述的一种方法。
所述的从除淡青链霉菌GLA.O以外其它产阿卡糖微生物中分离生物合成阿卡糖和同源性假寡糖的基因簇的方法其特征在于,这些微生物选自放线菌目,如链霉菌属、游动放线菌属、小瓶菌属或链孢子囊菌属的菌株,吸水链霉菌柠檬变种和淡青链霉菌,优选地选自淡青链霉菌GLA.O和游动放线菌属。
本发明还涉及淡青链霉菌GLA.O在分离阿卡糖中的用途。
通过实施例、表格和更详细地解释本发明,而不意在限制。
具体实施方式
所有的质粒分离过程都按照制造商说明书使用Macherey和Nagel(Duren,德国)分离试剂盒(Nucleobond_)进行。分子生物学操作按照标准方案(Sambrock等(1989)分子克隆:实验室手册,第2版(Molecular cloning:A Laboratory Manual,2nd),Cold Spring Harbor出版社,美国)或依照各个制造商说明书进行。DNA和蛋白质序列的检索应用Genetics ComputerGroup Software,Version 8(程序:FastA、TfastA、BlastX、Motifs、GAP和CODONPREFERENCE)和SwissProt(release 32)、EMBL(release 46)及Prosite(release 12.2)数据库。淡青链霉菌和游动放线菌的分子生物学操作(DNA的分离和DNA转化)依据Hopwood等:链霉菌的遗传操作:实验室手册(Genetic Manupulation of Streptomyces:A Laboratory Manual)The John Innes Foundation,Norwich,英国1985和Motamedi及Hutchinson,淡青链霉菌的蒽环类抗肿瘤抗生素丁省霉素C生物合成基因簇的克隆和异源性表达(Cloning and heterologous expression of a genecluster for the biosynthesis of tetracenomycin C,the anthracyclineantitumor antibiotic of Streptomyces glaucescens.),美国国家科学院学报(Proc.Natl.Acad.Sci.USA)84:4445-4449(1987)所述。
通常,用Boehringer Mannheim(Cat.No.1175033)的“非放射性DNA标记试剂盒”进行杂交。用Boehringer Mannheim(Cat.No.1363514)的“发光检测试剂盒”检测DNA。在本专利申请所给的所有实施例中,在严格条件下进行杂交:68℃,16小时,5XSSC,0.1%N-十二烷基肌氨酸,0.02%SDS,1%封闭剂(Boehinger Mannheim)。SSC指0.15MNaCl/0.015M柠檬酸钠。此处所给的“严格条件”的定义适用于本发明所有方面提到的“严格条件”。在这点上,获得此严格条件,即所述的杂交条件的方法并非特意施以限制性的影响,因为本领域专业人员可以选择其它条件以获得相同的严格条件,例如通过结合其它温度使用其它杂交溶液的方法。
实施例1:PCR引物的合成和测序以及源自淡青链霉菌GLA.O的片段的扩增
标准条件下进行PCR,各种情况下均在100μl反应液中加100pmol引物1和引物2
PCR缓冲液1                        10μl
PCR引物                             各种情况下2.5μl
dNTPs                               各种情况下0.2mM
BSA(10mg/ml)                        1μl
模板DNA                             1μg(1μl)
Taq聚合酶2(5单位/ml)               1.5μl
H2O                               加至100μl
1:Promega
2:Boehringer Mannheim
在样品上铺75μl矿物油,使用Perkin Elmer TC1 DNA热循环仪进行扩增。
参数:
循环               温度              时间
1                96℃            5分钟
                 74℃            5分钟
30               95℃            1.5分钟
                 74℃            1.5分钟
1                74℃            5分钟
表1列出了变性引物的序列,这些引物用于扩增源于不同链霉菌的dTDP-葡萄糖脱水酶。
表1:用于扩增dTDP-葡萄糖-4,6-脱水酶的引物的序列
引物1:CSGGSGSSGCSGGSTTCATSGG  (SEQ ID NO:1)
引物2:GGGWVCTGGYVSGGSCCGTAGTTG(SEQ ID NO:2)
此表中,S=G或C,W=A或T,V=A或G,和Y=T或C。
实施例2:分离于淡青链霉菌GLA.O的PCR片段的DNA序列
采用Sanger等(PNAS USA,74:5463-5467(1977))的双脱氧链终止法进行测序,根据制造商说明书用Pharmacia Biotech(Freiburg,德国)自读测序试剂盒进行反应。用Pharmacia Biotech(Freiburg,德国)的ALF DNA测序仪进行分离和检测。
将PCR片段随后克隆进大肠杆菌载体pUC18(Sure Clone Kit_,Pharmacia Biotech,Freiburg),且对此片段测序,证实了此片段编码dTDP-葡萄糖4,6-脱水酶的设想。然而分离到两个都与dTDP-葡萄糖4,6-脱水酶具有高度同源性但互不相同的基因。据此后面分别命名为acbD*和HstrE*
分离到的PCR片段的序列见表2A和2B,推导出的HstrE*和acbD*的氨基酸序列的同源性比较见表2C。两蛋白仅表现出65%相同性。
表2A:acbD*的DNA序列(引物结合位点下加直线,SEQ ID No.:3)
引物1
  1  CC CGGGCGGG GCGGGGTTCA TCGGCTCCGC CTACGTCCGC CGGCTCCTGT
 51  CGCCCGGGGC CCCCGGCGGC GTCGCGGTGA CCGTCCTCGA CAAACTCACC
101  TACGCCGGCA GCCTCGCCCG CCTGCACGCG GTGCGTGACC ATCCCGGCCT
151  CACCTTCGTC CAGGGCGACG TGTGCGACAC CGCGCTCGTC GACACGCTGG
201  CCGCGCGGCA CGACGACATC GTGCACTTCG CGGCCGAGTC GCACGTCGAC
251  CGCTCCATCA CCGACAGCGG TGCCTTCACC CGCACCAACG TGCTGGGCAC
301  CCAGGTCCTG CTCGACGCCG CGCTCCGCCA CGGTGTGCGC ACCCTCGTGC
351  ACGTCTCCAC CGACGAGGTG TACGGCTCCC TCCCGCACGG GGCCGCCGCG
401  GAGAGCGACC CCCTGCTCCC GACCTCGCCG TACGCGGCGT CGAAGGCGGC
451  CTCGGACCTC ATGGCGCTCG CCCACCACCG CACCCACGGC CTGGACGTCC
501  GGGTGACCCG CTGTTCGAA C AACTACGGCC CGCACCAGTT CCCGGG
                                        引物2
表2B:HstrE*的DNA序列(引物结合位点下加直线,SEQ ID No.:4)
                       引物2
  1  CCCC GGGTGC TGGTAGGGGC CGTAGTTGTT GGAGCAGCGG GTGATGCGCA
 51  CGTCCAGGCC GTGGCTGACG TGCATGGCCA GCGCGAGCAG GTCGCCCGAC
101  GCCTTGGAGG TGGCATAGGG GCTGTTGGGG CGCAGCGGCT CGTCCTCCGT
151  CCACGACCCC GTCTCCAGCG AGCCGTAGAC CTCGTCGGTG GACACCTGCA
201  CGAAGGGGGC CACGCCGTGC CGCAGGGCCG CGTCGAGGAG TGTCTGCGTG
251  CCGCCGGCGT TGGTCCGCAC GAACGCGGCG GCATCGAGCA GCGAGCGGTC
301  CACGTGCGAC TCGGCGGCGA GGTGCACGAC CTGGTCCTGG CCGGCCATGA
351  CCCGGTCGAC CAGGTCCGCG TCGCAGATGT CGCCGTGGAC GAAGCGCAGC
401  CGGGGGTGGT CGCGGACCGG GTCGAGGTTG GCGAGGTTGC CGGCGTAGCT
451  CAGGGCGTCG AGCACGGTGA CGACGGCGTC GGGCGGCCCG TCCGGACCGA
501  GGAGGGTGCG GACGTAGTGC  GAGCCCATGA ACCCCGCCGC C
                                     引物1
表2C:推导出的PCR产物HstrE*和acbD*的氨基酸序列的同源性比较(程序:GAP)
质量:          196.3     长度:           182
比率:          1.091     区间:            0
相似百分比:    77.654    相同百分比:     65.363
PCRstrE.Pep×PCRacbD.Pep
             .         .         .         .         .
1   ..AAGFMGSHYVRTLLGPDGPPDAVVTVLDALSYAGNLANLDPVRDHPRL   48
      :|||:|| ||| ||:|::|.:..||||| |.|||.||.|.:||||| |
1   PGGAGFIGSAYVRRLLSPGAPGGVAVTVLDKLTYAGSLARLHAVRDHPGL   50
             .         .         .         .         .
49  RFVHGDICDADLVDRVMAGQDQVVHLAAESHVDRSLLDAAAFVRTNAGGT   98
    ||:||:||..||| : | :|::||:|||||||||: |.:||.|||. ||
51  TFVQGDVCDTALVDTLAARHDDIVHFAAESHVDRSITDSGAFTRTNVLGT   100
             .         .         .         .         .
99  QTLLDAALRHGVAPFVQVSTDEVYGSLETGSWTEDEPLRPNSPYATSKAS   148
    |.|||||||||| .:|:||||||||||. |. .|.:|| |.||||.|||.
101 QVLLDAALRHGVRTLVHVSTDEVYGSLPHGAAAESDPLLPTSPYAASKAA   150
             .         .         .
149 GDLLALAMHVSHGLDVRITRCSNNYGPYQHPG  180
    :||:||| | .||||||:|||||||||.| |
151 SDLMALAHHRTHGLDVRVTRCSNNYGPHQFP.  181
在每种情况中,上行:SEQ ID No:5
在每种情况中,下行:SEQ ID No:6
实施例3:利用源于淡青链霉菌GLA.O的染色体DNA和分离到并标记的
PCR片段进行的Southern分析
在R2YENG培养基中培养细胞30小时后收集分离DNA。从淡青链霉菌GLA.O中分离染色体DNA,如Hopwood等(链霉菌的遗传操作:实验手册(Genetic Manupulation of Streptomyces:A LaboratoryManual)The John Innes Foundation,Norwich,英国(1985))所述。
用包含acbD*和HstrE*PCR片段的标记探针和经PstI,、BglII和BamHI酶解的淡青链霉菌GLA.O生产菌株的染色体DNA进行Southern杂交。根据制造商说明书(Boehringer Mannheim;Mannheim),用毛地黄毒苷(digoxygenin)标记两个PCR片段,并且在琼脂糖凝胶上分离淡青链霉菌GLA.O生产菌株染色体DNA的酶解液。将DNA通过毛细管作用转移至尼龙膜,杂交后可见与标记探针同源的DNA区域。
两个基因标记不同的DNA序列(图1和图2),被HstrE*标记的片段必定为源于淡青链霉菌GLA.O羟基链霉素生物合成的基因片段。虽然此DNA片段尚未共公开,但由HstrE*推导出的蛋白质序列和源于灰色链霉菌N2-3-11链霉素生物合成的StrE(Pissowotzki等(1991)分子及普通遗传学(Mol.Gen.Genet.)231:113-123)有很高的同源性(82%同源性),以及HstrE*-标记的DNA片段和已公开的淡青链霉菌GLA.O羟基链霉素基因簇(Retzlaff等(1993)工业微生物,基础与应用分子遗传学ASM(Industrial Microorganisms.Basic and applied molecular genetics ASM)华盛顿特区,美国)的限制性图谱相一致都支持这一结论。acbD*探针标记的片段(图2)属于一个尚未研究的DNA区域。此区域编码生物合成淡青链霉菌GLA.O假寡糖的酶。
               实施例4:6.8Kb PstI片段的克隆
除了其它以外,acbD*PCR片段标记了一个6.8Kb PstI DNA片段(图2)。此DNA片段按下述方法分离。用刀片将凝胶上的这一区域切下,用Pharmacia Biotech的分离试剂盒将此DNA从凝胶中分离出来,并克隆进经限制性酶PstI切过的质粒pUC19(质粒pacb1);然后将后一质粒转化进大肠杆菌菌株DH5α。从这些平皿中挑出单个克隆传代培养并用这些克隆进行质粒DNA分离。用上述引物1和2(表1)对源于这些克隆(250)的DNA进行PCR扩增。据此,可分离到包含有6.8Kb PstI片段的适宜的大肠杆菌克隆。
实施例5:分离到的6.8Kb PstI DNA片段的测序
用不同的限制性内切酶酶解此DNA,单个DNA片段克隆进pUC19。然后确定完整片段的DNA序列,见表4(SEQ ID No.:7)。反义链的互补测序仅仅部分证实了6.8Kb PstI DNA序列。发现了几种编码不同蛋白质的开放阅读框架(程序:CODONPREFERENCE和BlastX)。共发现了6个编码区,即一个与ATP结合蛋白高度同源的基因acbA,一个氨基转移酶acbB,一个dTDP-葡萄糖合酶acbC,一个dTDP-葡萄糖脱水酶acbD,一个与Lacl蛋白家族具有同源性的调节基因acbE以及一个与糖结合蛋白类似的acbF。acbA和acbF基因序列仅仅部分确定。与数据库中其它蛋白的同源性和推定蛋白的性质概括于表3。图3以扼要的形式显示了此片段的限制性图谱,其中包含有本文提及的最重要的限制性酶切位点以及已确定的开放阅读框架。
表3:源自淡青链霉菌GLA.O的6.8Kb PstI片段上已确定的开放阅读框架的分析
  开放阅读框架   氨基酸   分子量   FastA§   %相同性   登记号
  acbA   239   *   大肠杆菌   29%   P02914
  acbB   429   45618   DgdA,洋葱伯克霍尔德氏菌   32%   P16932
  acbC   355   37552   StrD,灰色链霉菌   60%   P08075
  acbD   325   35341   StrE,灰色链霉菌   62%   P29782
  acbE   345   36549   DegA,枯草芽孢杆菌   31%   P37947
  acbF   396   *   MalE,大肠杆菌   22%   P02928
*不完整开放阅读框架;§Swiss-Prot数据库(release 32)
实施例6:源自淡青链霉菌GLA.O染色体上的假寡糖生物合成基因
acbBCD的缺失
下面给出了已确定的编码假寡糖生物合成基因的DNA片段的证据。一个3.4Kb基因区域(EcoRI/SstI片段b,图3)被红霉素抗性基因(1.6Kb)替换并与源自6.8Kb PstI片段(pacb1)的侧翼DNA序列共同克隆进温度敏感型质粒pGM160。按下述步骤构建质粒:质粒pacb1的2.2Kb EcoRI/HindIII片段(c,图3)克隆进pGEM7zf(Promega,MadiSon,WI,美国;质粒pacb2),pacb1的1Kb SstI片段(a,图3)克隆进pUC19(质粒pacb3)。用下面的片段进行连接。用BamH I/Hind III酶切质粒pGM160(Muth等(1989)分子及普通遗传学(Mol.Gen Genet.)219:341-348),用XbaI/BamHI酶切质粒pacb2(c,图3),用EcoRI/Hind III酶切质粒pacb3(a,图3),以及用EcoRI/XbaI酶切质粒pIJ4026(Bibb等(1985)基因(Gene)38:215-226)以分离1.6Kb的ermE抗性基因。这些片段混合连接后转化进大肠杆菌DH5α并以氨苄青霉素筛选。得到的质粒,即pacb4从大肠杆菌DH5α中分离出来,用限制性酶解法检测其正确性后,通过原生质体转化将其转入淡青链霉菌GLA.O中。27℃时在R2YENG琼脂上以硫链丝菌肽筛选出转化子。然后在非允许温度39℃下培养转化子,并用已建立的同源重组方法将此质粒整合进基因组(用硫链丝菌肽(25μg/ml)和红霉素(50μg/ml)筛选)。在这些条件下,能够生长的均为质粒已整合进其基因组的那些克隆。分离相应的克隆,使其形成孢子(培养基1,见下)并涂布于含红霉素的琼脂上(培养基1)。再次从这种平板中分离出单个克隆,并在含硫链丝菌肽的培养基和含红霉素的培养基上均划线培养。分析抗红霉素但不再抗硫链丝菌肽的克隆。这些克隆中acbBCD基因已被ermE替代。检测几个克隆后最后选择淡青链霉菌GLA.O Δ acb菌株为参考菌株(抗红霉素,硫链丝菌肽敏感)用于进一步的研究。
培养基1
酵母抽提物               4g/l
麦芽抽提物               10g/l
葡萄糖                   4g/l
琼脂                     15g/l
PH                       7.2
进一步实验检测了相应菌株是否仍能产阿卡糖。培养一些克隆并研究其在一种生物测定中α-淀粉酶抑制剂的合成;然而未检测到活性。接着用Southern杂交进一步鉴定突变株。在预计位点上已发生基因ermE的整合。图4显示野生型和淡青链霉菌GLA.O Δ acb缺失突变株进行的Southern杂交。用源于pabc3的SstI片段为探针。从野生型和突变型中分离染色体DNA,用酶PstI和PstI/Hind III酶解。得到的缺失突变株片段样式与推测的重组情况相吻合。野生型显示出未改变的6.8Kb PstI片段,而突变型却显示出被截短1.8Kb的片段(比较泳道1和3,图4)。ermE抗性基因的整合额外地在PstI片段引入一个内部Hind III酶切位点(比较泳道2和4,图4)。
        实施例7:阿卡糖对α-淀粉酶的抑制
用酶测试检测淀粉(TC-淀粉,Boehringer-Mannheim,Cat.No.297748),可能证实从淡青链霉菌GLA.O分离出的化合物抑制α-淀粉酶。测试原理:淀粉葡糖苷酶将淀粉酶切分解成D-葡萄糖。己糖激酶将葡萄糖转变为葡萄糖-6-磷酸。后者再由葡萄糖-6-磷酸脱氢酶转化为D-葡糖酸-6-磷酸。此反应产生NADPH,其可由光度法检测到其形成。阿卡糖抑制α-淀粉酶,因此阻断D-葡萄糖形成最终也抑制NADPH的形成。
实施例8:用于淡青链霉菌GLA.O生长和生产阿卡糖的培养基
27℃下,配有侧挡板的内装100ml培养基2的500ml锥形瓶在定轨摇床上以120转/分进行发酵。2或3天后终止发酵。如实施例9所述用平板扩散实验检测假寡糖。如果使用培养基3,则不能产生α-淀粉酶抑制剂。这意味着葡萄糖能抑制假寡糖的产生。也可考虑其它糖如麦芽糖和蔗糖,或复合糖源(麦芽抽提物)用于淡青链霉菌GLA.O生产假寡糖。
培养基2:
大豆粉          20g/l
淀粉            20g/l
PH              7.2
培养基3:
大豆粉          20g/l
葡萄糖          20g/l
pH              7.2
         实施例9:使用米黑毛霉进行生物测定
将米黑毛霉(Mucor miehei)菌株的孢子悬浮液倒入琼脂(培养基5)(105孢子/m1),在各种情况下将10ml此混合液倒入培养皿。在纸测试盘(直径6mm)上10μl阿卡糖[腔隙](1mg/ml)或取自淡青链霉菌GLA.O培养基的样品并置于测试平板上,37℃孵育。含淀粉的培养基5上出现抑制圈。以葡萄糖(培养基4)取代淀粉制备的平板作为对照。在此培养基上,装有活性化合物的滤盘周围无抑制圈。
培养基4和5:
KH2PO4×3H2O          0.5g
MgSO4×7H2O            0.2g
NaCl                      0.1g
硫酸铵                    5g
酵母氮源基质              1.7g
葡萄糖(4)或淀粉(5)        5g
琼脂                      15g
         实施例10:淡青链霉菌GLA.O的转化
按Motamedi和Hutchinson((1987)PNAS USA 84:4445-4449)所述分离淡青链霉菌菌株的原生质体,按Hopwood等(链霉菌的遗传操作:实验室手册(Genetic Manupulation of Streptomyces:A LaboratoryManual)The John Innes Foundation,Norwich,英国(1985))说明使用PEG转化法将分离出的质粒DNA转进细胞。原生质体于30℃在R2YENG培养基上再生(Motamedi和Hutchinson(1987)PNAS USA84:4445-4449)。18小时后,在琼脂平板上覆盖含有硫链丝菌肽的溶液,30℃培养(硫链丝菌肽终浓度:20μg/ml)。
实施例11:从淡青链霉菌GLA.O中分离假寡糖、高效液相色谱分析和质谱分离
过滤菌丝体以分离出培养液。用此方法得到的培养基滤液加入XAD16柱,用水清洗该柱之后,活性化合物用30%甲醇洗脱。洗脱液浓缩至水相,后者用乙酸乙酯抽提以除去脂溶性杂质。水相继续浓缩,进一步将活性物质用biogel P2柱在5%甲醇中纯化,在分部收集器中收集各个流分。用米黑毛霉生物检测分析各个流分。活性洗脱液再次层析,在biogel P2上用5%甲醇分离以进一步纯化。以此方法分离的物质用高效液相色谱和质谱进行分析。
高效液相色谱
分离柱:Nucleosil_100C-18
洗脱液:0.1%磷酸=A/乙腈=B
梯度:15分钟内B从0到100%
检测:215nm
流速:2ml/min
上样体积:10-20μl
用高效液相色谱不能区别从淡青链霉菌GLA.O中得到的假寡糖制备物和真正的阿卡糖。在此洗脱系统中,两种成分的滞留时间和紫外吸收光谱完全一样。在这些条件下假寡糖混合物各成分不能分离。
质谱分析(MS)
用电喷雾质谱分析可确定真正的阿卡糖和源于淡青链霉菌GLA.O的假寡糖的分子量和断裂方式。对从购于Bayer公司的阿卡糖(Glucobay)进行分析,在645.5有一质量峰(阿卡糖)。源于淡青链霉菌GLA.O的纯化样品包含具有不同长度糖基侧链的假寡糖的混合物:969(阿卡糖+2个葡萄糖单位),807(阿卡糖+1个葡萄糖单位),645(对应于真正的阿卡糖)。阿卡糖和从淡青链霉菌GLA.O分离出来并且分子量为645的化合物在断裂裂的时候,会形成同样的分子片段,即:145(4-氨基-4,6-脱氧葡萄糖),303(Avarviosin)和465(303加一个葡萄糖单位)。
游动放线菌属SE50也会产生一种具有不同长度糖基侧链的阿卡糖分子的混合物(Truscheit(1984)第8届医药化学国际研讨会报告(VIIIthInternational Symposium on Medicinal Chemistry,Proc),卷1,瑞典药物科学院(Swedish Academy of Pharmaceutical Sciences),Stockholm,瑞典)。选择不同的发酵参数和营养液的基质会影响糖基侧链的长度。
实施例12:用游动放线菌属SE50/100(ATCC31044)进行Southern杂交
从游动放线菌SE50/100中分离染色体DNA并用限制性酶(PstI和BamHI)酶解。用包括源于淡青链霉菌GLA.O的dTDP-葡萄糖4,6-脱水酶acbD的编码区(片段d,图3)的探针进行Southern杂交。此探针和源于游动放线菌属SE50/100的特定区带杂交(图5,泳道1和2)。这使分离源于游动放线菌属SE50/100和其它菌株系的相应片段成为可能。这些DNA区域实际上是否参与阿卡糖的生物合成需要在接下来的研究中证实。另外,PCR引物1和2(表1)也可用来扩增源于游动放线菌属的dTDP-葡萄糖4,6-脱水酶。
                         图表说明
图1:用淡青链霉菌GLA.O进行的Southern杂交。泳道1:PstI,泳道2:BamHI,泳道3:BglII。标记的PCR片段HstrE*用作探针。参与生物合成羟基链霉素的DNA片段的标记。
图2:用淡青链霉菌GLA.O进行的Southern杂交。泳道1:PstI,泳道2:BamHI,泳道3:BgllI。标记的PCR片段acbD*用作探针。参与生物合成假寡糖的DNA片段的标记。
图3:源于淡青链霉菌GLA.O的6.8Kb PstI片段的限制性图谱。用箭头指示开放阅读框架和其转录的方向。片段a,b,c和d代表文中详细说明的DNA区域。
图4:用淡青链霉菌Δacb进行的Southern杂交:泳道1:PstI,泳道2:PstI/Hind III,用淡青链霉菌GLA.O进行的Southern杂交:泳道3:PstI,泳道4:PstI/Hind III。标记的1.0Kb SstI片段a(图3)用作探针。
图5:用游动放线菌属SE50/100进行的杂交:泳道1:PstI,泳道2:BamHI,用淡青链霉菌GLA.O进行的Southern杂交:泳道3:PstI。标记的1.0Kb Smal/EcoRI片段d(dTDP.葡萄糖4,6-脱水酶,图3)作为探针。用箭头指示标记的DNA片段(BamHI:2.1和0.7Kb,PstI:~11-12Kb)。
表4:源于淡青链霉菌GLA.O的6.8Kb PstI片段的DNA序列(SEQ IDNo.:7)。在此DNA序列下面给出已确定的开放阅读框架的推导出的氨基酸顺序(SEQ ID No.:8-13)。起始和终止密码子以及可能的核糖体结合位点下划横线。
acbA:SEQ ID No.:8
acbB:SEQ ID No.:9
acbC:SEQ ID No.:10
acbD:SEQ ID No.:11
acbE:SEQ ID No.:12
acbF:SEQ ID No.:13
表4:(SEQ ID NO.:7,8,9,10,11,12,13)
P
s
t
I
CTGCACCGTTCCCTGGTGCACGACCCGCCCCTGGTCGACGACCAGGGCGCTGTCGCAGAT
---------+---------+---------+---------+---------+---------+  60
GACGTCCCAAGGGACCACGTGCTGGGCGGGGACCAGCTGCTGGTCCCGCGACAGCGTCTA
  Q  L  T  G  Q  H  V  V  R  G  Q  D  V  V  L  A  S  D  C  I -
CGCGGCGATGTCGGCGATGTCGTGGCTGGTGAGCACCACGGTGGTGCCCAGTTCCCGGTG
---------+---------+---------+---------+---------+---------+  120
GCGCCGCTACAGCCGCTACAGCACCGACCACTCGTGGTGCCACCACGGGTCAAGGGCCAC
  A  A  I  D  A  I  D  H  S  T  L  V  V  T  T  G  L  E  R  H -
GGCGCGGTTGACCAGCCGGCGCACCGCGTCCTTCAGCACCATGTCGAGGCCGATCGTGGG
---------+---------+---------+---------+---------+---------+  180
CCGCGCCAACTGGTCGGCCGCGTGGCGCAGGAAGTCGTGGTACAGCTCCGGCTAGCACCC
  A  R  N  V  L  R  R  V  A  D  K  L  V  M  D  L  G  I  T  P -
CTCGTCCCAGAACAGCACGGCCCGGTCGTGCAGCAGGCTCGCCGCGATCTCGGCGCGCAT
---------+---------+---------+---------+---------+---------+  240
GAGCAGGGTCTTGTCGTGCCGGCCCAGCACGTCGTCCGAGCGGCGCTAGAGCCGCGCGTA
  E  D  W  F  L  V  A  P  D  H  L  L  S  A  A  I  E  A  R  M -
S
P
h
I
GCGCTGTCCGAGGCTGAGCTGCCGCACGGGGGTGGACCCCAGCGCGTCGATGTCGAGGAG
---------+---------+---------+---------+---------+---------+  300
CGCGACAGGCTCCGACTCGACGGCGTGCCCCCACCTGGGGTCGCGCAGCTACAGCTCCTC
  R  Q  G  L  S  L  Q  R  V  P  T  S  G  L  A  D  I  D  L  L -
GTCCCGGAACAGGGCGAGGTTGCGCCGGTAGACCCGTCCGGGGATGTCGTAGATGCGGCG
---------+---------+---------+---------+---------+---------+  360
CAGGGCCTTGTCCCGCTCCAACGCGGCCATCTGGCCAGGCCCCTACAGCATCTACGCCGC
  D  R  F  L  A  L  N  R  R  Y  V  P  G  P  I  D  Y  I  R  R -
                       K
                       P
                       n
                       I
CAGGATGCGGAAGGAGTCGGGTACCGACAGGTCCCACCAGAGCTGGCTGCGCTGGCCGAA
---------+---------+---------+---------+---------+---------+  420
GTCCTACGCCTTCCTCAGCCCATGGCTGTCCAGGGTGGTCTCGACCGACCCGACCGGCTT
  L  I  R  F  S  D  P  V  S  L  D  W  W  L  Q  S  R  Q  G  F -
GACGACGCCGATCGTGCGGGCGTTGCGCTGCCGGTGCCGGTAGGGCTCCAGCCCGGCGAC
---------+---------+---------+---------+---------+---------+  480
CTGCTGCGGCTAGCACGCCCGCAACGCGACGGCCACGGCCATCCCGAGGTCGGGCCGCTG
  V  V  G  I  T  R  A  N  R  Q  R  H  R  Y  P  E  L  G  A  V  -
CGTGCAGCGGCCGGAGGTGGGGGTCATGATGCCGGTCAGCATCTTGATCGTGGTCGACTT
---------+---------+---------+---------+---------+---------+  540
GCACGTCGCCGGCCTCCACCCCCACTACTACGGCCAGTCGTAGAACTAGCACCAGCTGAA
  T  C  R  G  S  T  P  T  M  I  G  T  L  M  K  I  T  T  S  K  -
GCCGGCTCCGTTGGCGCCGATGTAGGCGGTCTTCGTGCCGGCCGGTATCTCGAAGGAGAC
---------+---------+---------+---------+---------+---------+  600
CGGCCGAGGCAACCGCGGCTACATCCGCCAGAAGCACCGCCGGCCATAGAGCTTCCTCTG
  G  A  G  N  A  G  I  Y  A  T  K  T  G  A  P  I  E  F  S  V  -
                            K
                            P
                            n
                            I
GTCGTCGACGGCGCGCACGACGCGGTACCGGCGGGTCAGGAGGGTGGAGAGGCTGCCGAG
---------+---------+---------+---------+---------+---------+  660
CAGCAGCTGCCGCGCGTGCTGCGCCATGGCCGCCCAGTCCTCCCACCTCTCCGACGGCTC
  D  D  V  A  R  V  V  R  Y  R  R  T  L  L  T  S  L  S  G  L  -
CAGGCCGGGCTCGCGTTCGGCCAGCGGGAACTCCTTGACGAGGTGTTCGGCCACGATCAC
---------+---------+---------+---------+---------+---------+  720
GTCCGGCCCGAGCGCAAGCCGGTCGGCCTTGAGGAACTGCTCCACAAGCCGGTGCT AGTG
                                                          *   -
  L  G  P  R  R  E  A  L  R  F  E  K  V  L  H  E  A  V  I  V  -
                                               ———— acbA
GCGATCACCCGCTCGACGGCCGTCTCCAGCAGGCGCAGGCCCTCGTCGAGCAGCGCCTCG
---------+---------+---------+---------+---------+---------+  780
CGCTAGTGGGCGAGCTGCCGGCAGAGGTCGTCCGCGTCCGGGAGCAGCTCGTCGCGGAGC
 A  I  V  R  E  V  A  T  E  L  L  R  L  G  E  D  L  L  A  E   -
TCGAGGGTGAACGGCGGTGCCAGCCGCAGGATGTGGCCGCCCAGGGAGGTGCGCAGCCCC
---------+---------+---------+---------+---------+---------+  840
AGCTCCCACTTGCCGCCACGGTCGGCGTCCTACACCGGCGGGTCCCTCCACGCGTCGGGG
 D  L  T  F  P  P  A  L  R  L  I  H  G  G  L  S  T  R  L  G   -
                           s
                           m
                           a
                           I
AGGTCGAGGGCGGTGGTGTAGACGGCCCGGGCGGTCTCGGGGGCGGGTGCCCGGCCGACG
---------+---------+---------+---------+---------+---------+  900
TCCAGCTCCCGCCACCACATCTGCCGGGCCCGCCAGAGCCCCCGCCCACGGGCCGGCTGC
 L  D  L  A  T  T  Y  V  A  R  A  T  E  P  A  P  A  R  G  V   -
GCGTCGGTGACGAACTCCAGGCCCCACAGCAGTCCGAGGCCGCGTACCTGGCCGAGCTGG
---------+---------+---------+---------+---------+---------+  960
CGCAGCCACTGCTTGAGGTCCGGGGTGTCGTCAGGCTCCGGCGCATGGACCGGCTCGACC
 A  D  T  V  F  E  L  G  W  L  L  G  L  G  R  V  Q  G  L  Q   -
                                           S
                                           s
                                           t
                                           I
GGGAAGCGGGACTCCAGGGCGCGCAGCCGCTCCTGGATGAGCTCGCCGAGGACGCGCACG
---------+---------+---------+---------+----------+--------+  1020
CCCTTCGCCCTGAGGTCCCGCGCGTCGGCGAGGACCTACTCGAGCGGCTCCTGCGCGTGC
 P  F  R  S  E  L  A  R  L  R  E  Q  I  L  E  G  L  V  R   V  -
CGGTCGATCAGCCGGTCGCGCTCGACGACCTCCAGCGTGGCGCGGGCGGCGGCGATCCCC
---------+---------+---------+---------+---------+---------+  1080
GCCAGCTAGTCGGCCAGCGCGAGCTGCTGGAGGTCGCACCGCGCCCGCCGCCGCTAGGGG
 R  D  I  L  R  D  R  E  V  V  E  L  T  A  R  A  A  A  I  G   -
                                  S
                                  m
                                  a
                                  I
AGTGGGTTGCTCGCGTACGTCGAGGCGTACGCCCCGGGGTGGCCGCCTCCGGCCTGCGCA
---------+---------+---------+---------+---------+---------+  1140
TCACCCAACGAGCGCATGCAGCTCCGCATGCGGGGCCCCACCGGCGGAGGCCGGACGCGT
 L  P  N  S  A  Y  T  S  A  Y  A  G  P  H  G  G  G  A  Q  A   -
GCTTCCGCGCGTCCGGCCAGCACGGCGAAGGGGAATCCGCTCGCGGTGCCCTTGGACAGC
---------+---------+---------+---------+---------+---------+  1200
CGAAGGCGCGCAGGCCGGTCGTGCCGCTTCCCCTTAGGCGAGCGCCACGGGAACCTGTCG
 A  E  A  R  G  A  L  V  A  F  P  F  G  S  A  T  G  K  S  L   -
ATCGCCAGGTCCGGCTCGATGCCGAACAGTTCGCTGGCGAGGAAGGCGCCGGTGCGCCCG
---------+---------+---------+---------+---------+---------+  1260
TAGCGGTCCAGGCCGAGCTACGGCTTGTCAAGCGACCGCTCCTTCCGCGGCCACGCGGGC
 M  A  L  D  P  E  I  G  F  L  E  S  A  L  F  A  G  T  R  G  -
CCGCCGGTGAGGACCTCGTCGGCGACGAGCAGCACGCCGCCGTCCCGGCAGGCGCCGGCG
---------+---------+---------+----------+--------+---------+  1320
GGCGGCCACTCCTGGAGCAGCCGCTGCTCGTCGTGCGGCGGCAGGGCCGTCCGCGGCCGC
 G  G  T  L  V  E  D  A  V  L  L  V  G  G  D  R  C  A  G  A  -
ATCCGCTCCCAGTAGCCGGGGGGCGGCACGATGACGCCTGCCGCGCCGAGGACGGGTTCG
---------+---------+---------+---------+---------+---------+  1380
TAGGCGAGGGTCATCGGCCCCCCGCCGTGGTACTGCGGACGGCGCGGCTCCTGCCCAAGC
 I  R  E  W  Y  G  P  P  P  V  I  V  G  A  A  G  L  V  P  E   -
AAGACCAGGGCCGAGACGTTGGGCTTCTCCGCGATGTGCCGGCGCACGAGGGTCGCGCAC
---------+---------+---------+---------+---------+---------+  1440
TTCTGGTCCCGGCTCTGCAACCCGAAGAGGCGCTACACGGCCGCGTGCTCCCAGCGCGTG
 F  V  L  A  S  V  N  P  K  E  A  I  M  R  R  V  L  T  A  C   -
CGCACGTCGCACGAGGGGTACTCCAGGCCCAGGGGACAGCGGTAGCCAGTAGGGGCTGTA
---------+---------+---------+---------+---------+---------+  1500
GCGTGCAGCGTGCTCCCCATGAGGTCCGGGTCCCCTGTCGCCATCGGTCATCCCCGACAT
 R  V  D  C  S  P  Y  E  L  G  L  P  C  R  Y  G  T  P  A  T   -
GCCAGCACGCTGTTGCCGCTGAAGGCCTGGTGGCCGATGTCCCAGTGGACCAGCATCCGG
---------+---------+---------+---------+---------+---------+  1560
CGGTCGTGCGACAACGGCGACTTCCGGACCACCGGCTACAGGGTCACCTGGTCGTAGGCC
 A  L  V  S  N  G  S  F  A  Q  H  G  I  D  W  H  V  L  M  R   -
GCGCCCATGGTCTTGCCGTGGAAGCCGTGGCGCAGGGCGCAGATCCGGTTGCGGCCCGGC
---------+---------+---------+---------+---------+---------+  1620
CGCGGGTACCAGAACGGCACCTTCGGCACCGCGTCCCGCGTCTAGGCCAACGCCGGGCCG
 A  G  M  T  K  G  H  F  G  H  R  L  A  C  I  R  N  R  G  P   -
GCGGCGGTCGCCTGGACGACCCGCAGGGCGGCCTCGACCACCTCCGCGCCGGTGGAGAAG
---------+---------+---------+---------+---------+---------+  1680
CGCCGCCAGCGGACCTGCTGGGCGTCCCGCCGGAGCTGGTGGAGGCGCGGCCACCTCTTC
 A  A  T  A  Q  V  V  R  L  A  A  E  V  V  E  A  G  T  S  F   -
AAGGCGTAGGTGTCGAGCTGTTCGGGCAGCAGCCTGGCGAGCAGTTCCAGCAGGCCGGCG
---------+---------+---------+---------+---------+---------+  1740
TTCCGCATCCACAGCTCGACAAGCCCGTCGTCGGACCGCTCGTCAAGGTCGTCCGGCCGC
 F  A  Y  T  D  L  Q  E  P  L  L  R  A  L  L  E  L  L  G  A   -
CGGTCCGGCGTGGCGCTGTCGTGGACGTTCCACAGGCGGCGGGCCTGGGTGGTGAGTGCC
---------+---------+---------+---------+---------+---------+  1800
GCCAGGCCGCACCGCGACAGCACCTGCAAGGTGTCCGCCGCCCGGACCCACCACTCACGG
 R  D  P  T  A  S  D  H  V  N  W  L  R  R  A  Q  T  T  L  A   -
TCGACGACCTCCGGGTGCCCGTGGCCCAGTGACTGGGTGAGGGTCCCGGCCGCGAAGTCG
---------+---------+---------+---------+---------+---------+  1860
AGCTGCTGGAGGCCCACGGGCACCGGGTCACTGACCCACTCCCAGGGCCGGCGCTTCAGC
 E  V  V  E  P  H  G  H  G  L  S  Q  T  L  T  G  A  A  F  D   -
AGGTACTGGTTGCCGTCCAGGTCGGTCAGAACGGGACCGCGTCCCTCGGCGAAGACCCGG
---------+---------+---------+---------+---------+---------+  1920
TCCATGACCAACGGCAGGTCCAGCCAGTCTTGCCCTGGCGCAGGGAGCCGCTTCTGGGCC
 L  Y  Q  N  G  D  L  D  T  L  V  P  G  R  G  E  A  F  V  R   -
CGTCCGTGGACGGCTTCCTCGGAGGCGCCCGGCGCCAGGTGGCGGGCCTCCCGTGCCAGG
---------+---------+---------+---------+---------+---------+  1980
GCAGGCACCTGCCGAAGGAGCCTCCGCGGGCCGCGGTCCACCGCCCGGAGGGCACGGTCC
 R  G  H  V  A  E  E  S  A  G  P  A  L  H  R  A  E  R  A  L   -
TGCTGTGTCTGCCGTAAGCCTGTCATCGCTGCCTCTGCTCGTCGGACCGGCTGACGCGAT
---------+---------+---------+---------+---------+---------+  2040
ACGACACAGACGGCATTCGGACA GTAGCGAC GGAGACGAGCAGCCTGGCCGACTGCGCTA
 H  Q  T  Q  R  L  G  T  M
               ———— acbb
CGCCGGCGAACTGCGTTGTGGCGCACCACGGTTGGGGCGGCTCGGCGCTGAGTCAAACAC
---------+---------+---------+---------+---------+---------+  2100
GCGGCCGCTTGACGCAACACCGCGTGGTGCCAACCCCGCCGAGCCGCGACTCAGTTTGTG
TTGAACACACACCGCTGCAAGAGTTTGCGGGTTGTTTCAGAAAGTTGTTGCGACCCGCCC
---------+---------+---------+---------+---------+---------+  2160
AACTTGTGTGTGGCGACGTTGTCAAACGCCCAACAAAGTCTTTCAACAACGCTCGCCGCG
CGGCACTCTGGTTGAGTCGACGTGCTTACGGCGCCACCACGCCTCACGTTCGAGGAGGGA
---------+---------+---------+---------+---------+---------+  2220
GCCGTGAGACCAACTCAGCTGCACGAATGCCGCGGTCGTGCCCAGTGCAAGCTCCTCCCT
CCTGTGAGAACAAGCCCGCAGACCGACCCGCTCCCGC GGAGGCCGAGGTGAAGGCCCTGG
---------+---------+---------+---------+---------+---------+  2280
GGACACTCTTGTTCGGGCGTCTGGCTGGGCGAGGGCGCCTCCGGCTCCACTTCCGGGACC
                                               V  K  A  L  V -
                                               acbC————
                                                          P
                                                          V
                                                          u
                                                          I
                                                          I
TCCTGGCAGGTGGAACCGGCAGCAGACTGAGGCCGTTCACCCACACCGCCGCCAAGCAGC
---------+---------+---------+---------+---------+---------+  2340
ACGACCGTCCACCTTGGCCGTCGTCTGACTCCGGCAAGTGGGTGTGGCGGCGGTTCGTCG
  L  A  G  G  T  G  S  R  L  R  P  F  T  H  T  A  A  K  Q  L  -
TGCTCCCCATCGCCAACAAGCCCGTGCTCTTCTACGCGCTGGAGTCCCTCGCCGCGGCGG
---------+---------+---------+---------+---------+---------+  2400
ACGAGGGGTAGCGGTTGTTCGGGCACGAGAAGATGCGCGACCTCAGGGAGCGGCGCCGCC
  L  P  I  A  N  K  P  V  L  F  Y  A  L  E  S  L  A  A  A  G  -
GTGTCCGGGAGGCCGGCGTCGTCGTGGGCGCGTACGGCCGGGAGATCCGCGAACTCACCG
---------+---------+---------+---------+---------+---------+  2460
CACAGGCCCTCCGGCCGCAGCAGCACCCGCGCATGCCGGCCCTCTAGGCGCTTGAGTGGC
  V  R  E  A  G  V  V  V  G  A  Y  G  R  E  I  R  E  L  T  G  -
GCGACGGCACCGCGTTCGGGTTACGCATCACCTACCTCCACCAGCCCCGCCCGCTCGGTC
---------+---------+---------+---------+---------+---------+  2520
CGCTGCCGTGGCGCAAGCCCAATGCGTAGTGGATGGAGGTGGTCGGGGCGGGCGAGCCAG
  D  G  T  A  F  G  L  R  I  T  Y  L  H  Q  P  R  P  L  G  L  -
TCGCGCACGCGGTGCGCATCGCCCGCGGCTTCCTGGGCGACGACGACTTCCTGCTGTACC
---------+---------+---------+---------+---------+---------+  2580
AGCGCGTGCGCCACGCGTAGCGGGCGCCGAAGGACCCGCTGCTGCTGAAGGACGACATGG
  A  H  A  V  R  I  A  R  G  F  L  G  D  D  D  F  L  L  Y  L  -
TGGGGGACAACTACGTGCCCCAGGGCGTCACCGACTTCGCCCGCCAATCGGCCCCCGATC
---------+---------+---------+---------+---------+---------+  2640
ACCCCCTGTTGATGGACGGGGTCCCGCAGTGGCTGAAGCGGGCGGTTAGCCGGCGGCTAG
  G  D  N  Y  L  P  Q  G  V  T  D  F  A  R  Q  S  A  A  D  P  -
CCGCGGCGGCCCGGCTGCTGCTCACCCCGGTCGCGGACCCGTCCGCCTTCGGCGTCGCGG
---------+---------+---------+---------+---------+---------+  2700
GGCGCCGCCGGGCCGACGACGAGTGGGGCCAGCGCCCTGGGCAGGCGGAAGCCGCAGCGCC
  A  A  A  R  L  L  L  T  P  V  A  D  P  S  A  F  G  V  A  E  -
AGGTCGACGCGGACGGGAACGTGCTGCGCTTGGAGGAGAAACCCGACGTCCCGCGCAGCT
---------+---------+---------+---------+---------+---------+  2760
TCCAGCTGCGCCTGCCCTTGCACGACGCGAACCTCCTCTTTGGGCTGCAGGCCCCGTCGA
  V  D  A  D  G  N  V  L  R  L  E  E  K  P  D  V  P  R  S  S  -
CGCTCGCGCTCATCGGCGTGTACGCCTTCAGCCCGGCCGTCCACGAGGCGGTACGGGCCA
---------+---------+---------+---------+---------+---------+  2820
GCGAGCGCGAGTAGCCGCACATGCGGAAGTCGGGCCGGCAGGTGCTCCGCCATGCCCGGT
  L  A  L  I  G  V  Y  A  T  S  P  A  V  H  E  A  V  R  A  I  -
TCACCCCCTCCGCCCGCGGCCAGCTGGAGATCACCCACGCCGTGCAGTGGATGATCGACC
---------+---------+---------+---------+---------+---------+  2880
AGTGGGGGAGGCGGGCGCCGCTCGACCTCTAGTCGGTGCGGCACGTCACCTACTAGCTGG
  T  P  S  A  R  G  E  L  E  I  T  H  A  V  Q  W  M  I  D  R  -
GGGGCCTGCGCGTACGGGCCGAGACCACCACCCGGCCCTGGCGCGACACCGGCAGCGCGG
---------+---------+---------+---------+---------+---------+  2940
CCCCGGACGCGCATGCCCGGCTCTGGTGGTGGGCCGGGACCGCGCTGTGGCCGTCGCGCC
  G  L  R  V  R  A  E  T  T  T  R  P  W  R  D  T  G  S  A  E  -
AGGACATGCTGGAGGTCAACCGTCACGTCCTGGACGGACTGGAGGGCCGCATCGAGGGGA
---------+---------+---------+---------+---------+---------+  3000
TCCTGTACGACGTCCAGTTGGCAGTGCAGGACCTGCCTGACCTCCCGGCGTAGCTCCCCT
  D  M  L  E  V  N  R  H  V  L  D  G  L  E  G  R  I  E  G  K  -
AGGTCGACGCGCACAGCACGCTGGTCGGCCGGGTCCGGGTGGCCGAAGGCGCGATCGTGC
---------+---------+---------+---------+---------+---------+  3060
TCCAGCTGCGCGTGTCGTGCGACCAGCCGGCCCAGGCCCACCGGCTTCCGCGCTAGCACG
  V  D  A  H  S  T  L  V  G  R  V  R  V  A  E  G  A  I  V  R  -
GGGGGTCACACGTGGTGGGCCCGGTGGTGATCGGCGCGGGTGCCGTCGTCAGCAACTCCA
---------+---------+---------+---------+---------+---------+  3120
CCCCCAGTGTGCACCACCCGGGCCACCACTAGCCGCGCCCACGGCAGCAGTCGTTGAGGT
  G  S  H  V  V  G  P  V  V  I  G  A  G  A  V  V  S  N  S  S  -
GTGTCGGCCCGTACACCTCCATCGGGGAGGACTGCCGGGTCGAGGACAGCGCCATCGAGT
---------+---------+---------+---------+---------+---------+  3180
CACAGCCGGGCATGTGGAGGTAGCCCCTCCTGACGGCCCAGCTCCTGTCGCGGTAGCTCA
  V  G  P  Y  T  S  I  G  E  D  C  R  V  E  D  S  A  I  E  Y  -
ACTCCGTCCTGCTGCGCGGCGCCCAGGTCGAGGGGGCGTCCCGCATCGAGGCGTCCCTCA
---------+---------+---------+---------+---------+---------+  3240
TGAGGCAGGACGACGCGCCGCGGGTCCAGCTCCCCCGCAGGGCGTAGCTCCGCAGGGAGT
  S  V  L  L  R  G  A  Q  V  E  G  A  S  R  I  E  A  S  L  I  -
TCGCCCGCGGCGCCGTCGTCGGCCCGGCCCCCCGTCTCCCGCAGGCTCACCGACTGGTGA
---------+---------+---------+---------+---------+---------+  3300
AGCCGGCGCCGCGGCAGCAGCCGGGCCGGGGGGCAGAGGGCGTCCGAGTGGCTGACCACT
  G  R  G  A  V  V  G  P  A  P  R  L  P  Q  A  H  R  L  V  I  -
TCGGCGACCACAGCAAGGTGTATCTCACCCC ATGACCACGACCATCCTCGTCACCGGCGG
---------+---------+---------+---------+---------+---------+  3360
AGCCGCTGGTGTGGTTCCACATAGAGTGGGGTACTGGTGCTGGTAGGAGCAGTGGCCGCC
                               M  T  T  T  I  L  V  T  G  C   -
  G  D  H  S  K  V  Y  L  T  P  *
                             acbD————
                                             S
                                             m
                                             a
                                             I
AGCGGGCTTCATTCGCTCCGCCTACGTCCGCCGGCTCCTGTCGCCCGGGGCCCCCGGCGG
---------+---------+---------+---------+---------+---------+  3420
TCGCCCGAAGTAAGCGAGGCGGATGCAGGCGGCCGAGGACAGCGGGCCCCGGGGGCCGCC
 A  G  F  I  R  S  A  Y  V  R  R  L  L  S  P  G  A  P  G  G   -
CGTCGCGGTGACCGTCCTCGACAAACTCACCTACGCCGGCAGCCTCGCCCGCCTGCACGC
---------+---------+---------+---------+---------+---------+  3480
GCAGCGCCACTGGCAGGAGCTGTTTGAGTGGATGCGGCCGTCGGAGCGGGCGGACGTGCG
 V  A  V  T  V  L  D  K  L  T  Y  A  G  S  L  A  R  L  H  A   -
GGTGCGTGACCATCCCGGCCTCACCTTCGTCCAGGGCGACGTGTGCGACACCGCGCTCGT
---------+---------+---------+---------+---------+---------+  3540
CCACGCACTGGTAGGGCCGGAGTGGAAGCAGGTCCCGCTGCACACGCTGTGGCGCGAGCA
 V  R  D  H  P  G  L  T  F  V  Q  G  D  V  C  D  T  A  L  V   -
CGACACGCTGGCCGCGCGGCACGACGACATCGTGCACTTCGCGGCCGAGTCGCACGTCGA
---------+---------+---------+---------+---------+---------+  3600
GCTGTGCGACCGGCGCGCCGTGCTGCTGTAGCACGTGAAGCGCCGGCTCAGCGTGCAGCT
 D  T  L  A  A  R  H  D  D  I  V  H  F  A  A  E  S  H  V  D   -
CCGCTCCATCACCGACAGCGGTGCCTTCACCCGCACCAACGTGCTGGGCACCCAGGTCCT
---------+---------+---------+---------+---------+---------+  3660
GGCGAGGTAGTGGCTGTCGCCACGGAAGTGGGCGTGGTTGCACGACCCGTGGGTCCAGGA
 R  S  I  T  D  S  G  A  F  T  R  T  N  V  L  G  T  Q  V  L   -
GCTCGACGCCGCGCTCCGCCACGGTGTGCGCACCTTCGTGCACGTCTCCACCGACGAGGT
---------+---------+---------+---------+---------+---------+  3720
CGAGCTGCGGCGCGAGGCGGTGCCACACGCGTGGAAGCACGTGCAGAGGTGGCTGCTCCA
 L  D  A  A  L  R  H  G  V  R  T  F  V  H  V  S  T  D  E  V   -
GTACGGCTCCCTCCCGCACGGGGCCGCCGCGGAGAGCGACCCCCTGCTTCCGACCTCGCC
---------+---------+---------+---------+---------+---------+  3780
CATGCCGAGGGAGGGCGTGCCCCGGCGGCGCCTCTCGCTGGGGGACGAAGGCTGGAGCGG
 Y  G  S  L  P  H  G  A  A  A  E  S  D  P  L  L  P  T  S  P   -
GTACGCGGCGTCGAAGGCGGCCTCGGACCTCATGGCGCTCGCCCACCACCGCACCCACGG
---------+---------+---------+---------+---------+---------+  3840
CATGCGCCGCAGCTTCCGCCGGAGCCTGGAGTACCGCGAGCGGGTGGTGGCGTGGGTGCC
 Y  A  A  S  K  A  A  S  D  L  M  A  L  A  H  H  R  T  H  G   -
CCTGGACGTCCGGGTGACCCGCTGTTCGAACAACTTCGGCCCCCACCAGCATCCCGAGAA
---------+---------+---------+---------+---------+---------+  3900
GGACCTGCAGGCCCACTGGGCGACAAGCTTGTTGAAGCCGGGGGTGGTCCTAGGGCTCTT
 L  D  V  R  V  T  R  C  S  N  N  F  G  P  H  Q  H  P  E  K   -
GCTCATACCGCGCTTCCTGACCAGCCTCCTGTCCGGCGGCACCGTTCCCCTCTACGGCGA
---------+---------+---------+---------+---------+---------+  3960
CGAGTATGGCGCGAAGGACTGGTCGGAGGACAGGCCGCCGTGGCAAGGGGAGATGCCGCT
 L  I  P  R  F  L  T  S  L  L  S  G  G  T  V  P  L  Y  G  D   -
CGGGCGGCACGTGCGCGACTGGCTGCACGTCGACGACCACGTCAGGGCCGTCGAACTCGT
---------+---------+---------+---------+---------+---------+  4020
GCCCGCCGTGCACGCGCTGACCGACGTGCAGCTGCTGGTGCAGTCCCGGCAGCTTGAGCA
 G  R  H  V  R  D  W  L  H  V  D  D  H  V  R  A  V  E  L  V   -
                      B
                      g
                      l
                      I
                      I
CCGCGTGTCGGGCCGGCCGGGAGAGATCTACAACATCGGGGGCGGCACCTCGCTGCCCAA
---------+---------+---------+---------+---------+---------+  4080
GGCGCACAGCCCGGCCGGCCCTCTCTAGATGTTGTAGCCCCCGCCGTGGAGCGACGGGTT
 R  V  S  G  R  P  G  E  I  Y  N  I  G  G  G  T  S  L  P  N   -
        S
        s
        t
        I
CCTGGAGCTCACGCACCGGTTGCTCGCACTGTGCGGCGCGGGCCCGGAGCGCATCGTCCA
---------+---------+---------+---------+---------+---------+  4140
GGACCTCGAGTGCGTGGCCAACGAGCGTGACACGCCGCGCCCGGGCCTCGCGTAGCAGGT
L  E  L  T  H  R  L  L  A  L  C  G  A  G  P  E  R  I  V  H    -
CGTCGAGAACCGCAAGGGGCACGACCGGCGCTACGCGGTCGACCACAGCAAGATCACCGC
---------+---------+---------+---------+---------+---------+  4200
GCAGCTCTTGGCGTTCCCCGTGCTGGCCGCGATGCGCCAGCTGGTGTCGTTCTAGTGGCG
 V  E  N  R  K  G  H  D  R  R  Y  A  V  D  H  S  K  I  T  A   -
                               N
                               r
                               u
                               I
GGAACTCGGTTACCGGCCGCGCACCGACTTCGCGACCGCGCTGGCCGACACCGCGAAGTG
---------+---------+---------+---------+---------+---------+  4260
CCTTGAGCCAATGGCCGGCGCGTGGCTGAAGCGCTGGCGCGACCGGCTGTGGCGCTTCAC
 E  L  G  Y  R  P  R  T  D  F  A  T  A  L  A  D  T  A  K  W    -
GTACGAGCGGCACGAGGACTGGTGGCGTCCCCTGCTCGCCGCGACA TGACGTCGGGCCGG
---------+---------+---------+---------+---------+---------+  4320
CATGCTCGCCGTGCTCCTGACCACCGCAGGGGACGAGCGGCGCTGTACTGCAGCCCGGCC
 Y  E  R  H  E  D  W  W  R  P  L  L  A  A  T  *
ACCGCAACCACCGGCCCCGGCCGGCACACCGCCGCCCGCGGCCGGTGGCCGGCCGGTCAG
---------+---------+---------+---------+---------+---------+  4380
TGGCGTTGGTGGCCGGGGCCGGCCGTGTGGCGGCGGGCGCCGGCCACCGGCCGGCCAGTC
                                                          *   -
CGTCCGTGAGCCGGGCGCCGGCCGCCCCGCGGGCCGGCGGCGGTGGACCCCCGGACCACC
---------+---------+---------+---------+---------+---------+  4440
GCAGGCACTCGGCCCGCGGCCGGCGGGGCGCCCGGCCGCCGCCACCTGGGGGCCTGGTGG
 R  G  H  A  P  R  R  G  G  R  P  G  A  A  T  S  G  R  V  V   -
                 E
                 C
                 o
                 R
                 I
AGTTCCGGCATGAAGACGAATTCGGTGCGCGGCGGCGGCGTTCCGCTCATCTCCTCCAGC
---------+---------+---------+---------+---------+---------+  4500
TCAAGGCCGTACTTCTGCTTAAGCCACGCGCCGCCGCCGCAAGGCGAGTAGAGGAGGTCG
 L  E  P  M  F  V  F  E  T  R  P  P  P  T  G  S  M  E  E  L   -
AGTGCGTCCACGGCGACCTGCCCCATCGCCTTGACGGGCTGTCTGATGGTGGTCAGGGGA
---------+---------+---------+---------+---------+---------+  4560
TCACGCAGGTGCCGCTGGACGGGGTAGCGGAACTGCCCGACAGACTACCACCAGTCCCCT
 L  A  D  V  A  V  Q  G  M  A  K  V  P  Q  R  I  T  T  L  P   -
GGGTCGGTGAAGGCCATGAGCGGCGAGTCGTCGAAGCCGACCACCGAGATGTCACCGGGA
---------+---------+---------+---------+---------+---------+  4620
CCCAGCCACTTCCGGTACTCGCCGCTCAGCAGCTTCGGCTGGTGGCTCTACAGTCGCCCT
 P  D  T  F  A  M  L  P  S  D  D  F  G  V  V  S  I  D  G  P   -
ACCGTGAGACCCCGCCGGCGCGCGGCCCGCACGGCGCCGAGGGCCATCATGTCGCTGGCG
---------+---------+---------+---------+---------+---------+  4680
TGGCACTCTGGGGCGGCCGCGCGCCGGGCGTGCCGCGGCTCCCGGTAGTACAGCGACCGC
 V  T  L  G  R  R  R  A  A  R  V  A  G  L  A  M  M  D  S  A   -
CACATGACGGCGGTGCAGCCCAGGTCGATCAGCGCGGACGCGGCGGCCTGGCCCCCCTCC
---------+---------+---------+---------+---------+---------+  4740
GTGTACTGCCGCCACGTCGGGTCCAGCTAGTCGCGCCTGCGCCGCCGGACCGGGGGGAGG
 C  M  V  A  T  C  G  L  D  I  L  A  S  A  A  A  Q  G  G  E   -
                           S
                           s
                           t
                           I
AGGGAGAACAGCGAGTGCTGCACGAGCTCCTCGGACTCCCGCGCCGACACTCCCAGGTGC
---------+---------+---------+---------+---------+---------+  4800
TCCCTCTTGTCGCTCACGACGTGCTCGAGGAGCCTGAGGGCGCGGCTGTGAGGGTCCACG
 L  S  F  L  S  H  Q  V  L  E  E  S  E  R  A  S  V  G  L  H   -
TCCCGCACGCCGGCCCGGAACCCCTCGATCTTCCGCTGCACCGGCACGAAGCGGGCGGGC
---------+---------+---------+---------+---------+---------+  4860
AGGGCGTGCGGCCGGGCCTTGGGGAGCTAGAAGGCGACGTGGCCGTGCTTCGCCCGCCCG
 E  R  V  G  A  R  F  G  E  I  K  R  Q  V  P  V  F  R  A  P   -
CCGACGCCGAGGCCGACGCGCTCGTGCCCCAGCTCCGCCAGGTGCGCCACGGCCAGGCGC
---------+---------+---------+---------+---------+---------+  4920
GGCTGCCGCTCCGGCTGCGCGAGCACGGGGTCGAGGCGGTCCACGCGGTGCCGGTCCGCG
 G  V  A  L  G  V  R  E  H  G  L  E  A  L  H  A  V  A  L  R   -
ATCGCGGCCCGGTCGTCCGGGGAGACGAAGGGTGCCTCGATCCGGGGCGAGAACCCGTTC
---------+---------+---------+---------+---------+---------+  4980
TAGCGCCGGGCCAGCAGGCCCCTCTGCTTCCCACGGAGCTAGGCCCCGCTCTTGGGCAAG
 M  A  A  R  D  D  P  S  V  F  P  A  E  I  R  P  S  F  G  N   -
ACGAGGACGAAGGGCACCTGCCGCTCGTGCAGCCGGCCGTACCGTCCGGTCTCGGCGGTG
---------+---------+---------+---------+---------+---------+  5040
TGCTCCTGCTTCCCGTGGACGGCGAGCACGTCGGCCGGCATGGCAGGCCAGAGCCGCCAC
 V  L  V  F  P  V  Q  R  E  H  L  R  G  Y  R  G  T  E  A  T   -
GTGTCCGCGTGCAGTCCGGAGACGAAGATGATGCCGGACACCCCGCGGTCCACGAGCATC
---------+---------+---------+---------+---------+---------+  5100
CACAGGCGCACGTCAGGCCTCTGCTTCTACTACGGCCTGTGGGGCGCCAGGTGCTCGTAG
 T  D  A  H  L  G  S  V  F  I  I  G  S  V  G  R  D  V  L  M   -
                             S
                             m
                             a
                             I
TCCGTGAGTTCGTCCTCGGTCGAGCCGCCCGGGGTCTGCGTGGCGAGCACGGGCGTGTAG
---------+---------+---------+---------+---------+---------+  5160
AGGCACTCAAGCAGGAGCCAGCTCGGCGGGCCCCAGACGCACCGCTCGTGCCCGCACATC
 E  T  L  E  D  E  T  S  G  G  P  T  Q  T  A  L  V  P  T  Y   -
CCCTGACGCGTGAGCGCCTGCCCCATCACCTGGGCCAGTGCGGGGAAGAAGGGGTTGTCC
---------+---------+---------+---------+---------+---------+  5220
GGGACTGCGCACTCGCGGACGGGGTAGTGGACCCGGTCACGCCCCTTCTTCCCCAACAGG
 G  Q  R  T  L  A  Q  G  M  V  Q  A  L  A  P  F  F  P  N  D   -
AGTTCGGGGGTGACCAGTCCGACCAGCTCGGCGCGGCGCTGTCGCGCCGGCTGCTCGTAG
---------+---------+---------+---------+---------+---------+  5280
TCAAGCCCCCACTGGTCAGGCTGGTCGAGCCGCGCCGCGACAGCGCGGCCGACGAGCATC
 L  E  P  T  V  L  G  V  L  E  A  R  R  Q  R  A  P  Q  E  Y   -
CCCAGCGGGTCCAGTGCGGTCAGCACCGAGTCGCGGGTGCCGGTGGCCACACCGCGCGCA
---------+---------+---------+---------+---------+---------+  5340
GGGTCGCGCAGGTCACGCCAGTCGTGGCTCAGCGCCCACGGCCACCGGTGTGGCGCGCGT
 G  L  A  D  L  A  T  L  V  S  D  R  T  G  T  A  V  G  R  A   -
                                          S
                                          m
                                          a
                                          I
CCGTTCAGCACCCGGCTGACCGTGGCCTTGCTGACGCCCGCCCGGGCTGCGATGTCGGCG
---------+---------+---------+---------+---------+---------+  5400
GGCAAGTCGTGGGCCGACTGGCACCGGAAGGACTGCGGGCGGGCCCGACGCTACAGCCGC
 G  N  L  V  R  S  V  T  A  K  S  V  G  A  R  A  A  I  D  A   -
AGCCGCATGGTCATGGCAACGCACTCTACCTGTCGGGGCGTCAGGGCGTGCCCACCGCGG
---------+---------+---------+---------+---------+---------+  5460
TCGGCGTACCA GTACCGTTGCGTGAGATGGACAGCCCCGCAGTCCCGCACGGGTGGCGCG
 L  R  M  T  M
  ———— acbE
GCGGAACCGGCGGACTGCGGGGCACGGCCCGTCCGCCGCCCACGGACCACGCGCCCGAAA
---------+---------+---------+---------+---------+---------+  5520
CGCCTTGGCCGCCTGACGCCCCGTGCCGGGCAGGCGGCGGGTGCCTGGTGCGCGGGCTTT
CGATGGCTGAAAATGCTTGCAGCAAATTGCCGCAACGTCTTTCGGCGGCTTTTCGATCCT
---------+---------+---------+---------+---------+---------+  5580
GCTACCGACTTTTACGAACGTCGTTTAACGGCGTTGCAGAAAGCCGCCGAAAAGCTAGGA
GTTACGTTCCTGGCAACCCCGGCGCCGCGCAGAAGCGGTTGGCGTGAGGCGTCCAGACCT
---------+---------+---------+---------+---------+---------+  5640
CAATGCAAGGACCGTTGGGGCCGCGGCGCGTCTTCGCCAACCGCACTCCGCAGGTCTGGA
CCGCCCGATTCCGGGATCACTCAGG GGAGTTCACA ATGCGGCGTGGCATTGCGGCCACCG
---------+---------+---------+---------+---------+---------+  5700
GGCGGGCTAAGGCCCTAGTGAGTCCCCTCAAGTGTTACGCCGCACCGTAACGCCGGTGGC
                                   M  R  R  G  I  A  A  T  A -
                                   acbF ————
CGCTGTTCGCGGCTGTGGCCATGACGGCATCGGCGTGTGGCGGGGGCGACAACGGCGGAA
---------+---------+---------+---------+---------+---------+  5760
GCGACAAGCGCCGACACCGGTACTGCCGTAGCCGCACACCGCCCCCGCTGTTGCCGCCTT
  L  F  A  A  V  A  M  T  A  S  A  C  G  G  G  D  N  G  G  S  -
      K
      p
      n
      I
GCGGTACCGACGCGGGCGGCACGGAGCTGTCGGGGACCGTCACCTTCTGGGACACGTCCA
---------+---------+---------+---------+---------+---------+  5820
CGCCATGGCTGCGCCCGCCGTGCCTCGACAGCCCCTGGCAGTGGAAGACCCTGTGCAGGT
  G  T  D  A  G  G  T  E  L  S  G  T  V  T  F  W  D  T  S  N  -
ACGAAGCCGAGAAGGCGACGTACCAGGCCCTCGCGGAGGGCTTCGAGAAGGAGCACCCGA
---------+---------+---------+---------+---------+---------+  5880
TGCTTCGGCTCTTCCGCTGCATGGTCCGGGAGCGCCTCCCGAAGCTCTTCCTCGTGGGCT
  E  A  E  K  A  T  Y  Q  A  L  A  E  G  F  E  K  E  H  P  K  -
AGGTCGACGTCAAGTACGTCAACGTCCCGTTCGGCGAGGCGAACCCCAAGTTCAAGAACG
---------+---------+---------+---------+---------+---------+  5940
TCCAGCTGCAGTTCATGCAGTTGCAGGGCAAGCCGCTCCGCTTGCGGTTCAAGTTCTTGC
  V  D  V  K  Y  V  N  V  P  F  G  E  A  N  A  K  F  K  N  A  -
CCGCGGGCGGCAACTCCGGTGCCCCGGACGTGATGCGTACGGAGGTCGCCTGGGTCGCGG
---------+---------+---------+---------+---------+---------+  6000
GGCGCCCGCCGTTGAGGCCACGGGGCCTGCACTACGCATGCCTCCAGCGGACCCAGCGCC
  A  G  G  N  S  G  A  P  D  V  M  R  T  E  V  A  W  V  A  D  -
ACTTCGCCAGCATCGGCTACCTCGCCCCGCTCGACGGCACGCCCGCCCTCGACGACGGGT
---------+---------+---------+---------+---------+---------+  6060
TGAAGCGGTCGTAGCCGATGGAGCGGGGCGAGCTGCCGTGCGGGCGGGAGCTGCTGCCCA
  F  A  S  I  G  Y  L  A  P  L  D  G  T  P  A  L  D  D  G  S  -
CGGACCACCTTCCCCAGGGCGGCAGCACCAGGTACGAGGGGAAGACCTACGCGGTCCCGC
---------+---------+---------+---------+---------+---------+  6120
GCCTGGTGGAAGGGGTCCCGCCGTCGTGGTCCATGCTCCCCTTCTGGATGCGCCAGGGCG
  D  H  L  P  Q  G  G  S  T  R  Y  E  G  K  T  Y  A  V  P  Q  -
AGGTGATCGACACCCTGGCGCTCTTCTACAACAAGGAACTGGTGACGAAGGCCGGTGTCG
---------+---------+---------+---------+---------+---------+  6180
TCCACTAGCTGTGGGACCGCGAGAAGATGTTGTTCCTTGACGACTGCTTCCGGCCACAGC
  V  I  D  T  L  A  L  F  Y  N  K  E  L  L  T  K  A  G  V  E  -
AGGTGCCGGGCTCCCTCGCCGAGCTGAAGACGGCCGCCGCCGAGATCACCGAGAAGACCG
---------+---------+---------+---------+---------+---------+  6240
TCCACGGCCCGAGGGAGCGGCTCGACTTCTGCCGGCGGCGGCTCTAGTGGCTCTTCTGGC
  V  P  G  S  L  A  E  L  K  T  A  A  A  E  I  T  E  K  T  G  -
GCGCGAGCGGCCTCTACTGCGGGGCGACGACCCGTACTTGGTTCCTGCCCTACCTCTACG
---------+---------+---------+---------+---------+---------+  6300
CGCGCTCGCCGGAGATGACGCCCCGCTGCTGGGCATGAACCAAGGACGGGATGGAGATGC
  A  S  G  L  Y  C  G  A  T  T  R  T  W  F  L  P  Y  L  Y  G  -
GGGAGGGCGGCGACCTGGTCGACGAGAAGAACAAGACCGTCACGGTCGACGACGAAGCCG
---------+---------+---------+---------+---------+---------+  6360
CCCTCCCGCCGCTGGACCAGCTGCTCTTCTTGTTCTGGCAGTGCCAGCTGCTGCTTCGGC
  E  G  G  D  L  V  D  E  K  N  K  T  V  T  V  D  D  E  A  G  -
GTGTGCGCGCCTACCGCGTCATCAAGGACCTCGTGGACAGCAAGGCGGCCATCACCGACG
---------+---------+---------+---------+---------+---------+  6420
CACACGCGCGGATGGCGCAGTAGTTCCTGGAGCACCTGTCGTTCCGCCGGTAGTGGCTGC
  V  R  A  Y  R  V  I  K  D  L  V  D  S  K  A  A  I  T  D  A  -
CGTCCGACGGCTGGAACAACATGCAGAACGCCTTCAAGTCGGGCAAGGTCGCCATGATGG
---------+---------+---------+---------+---------+---------+  6480
GCAGGCTGCCGACCTTGTTGTACGTCTTGCGGAAGTTCAGCCCGTTCCAGCGGTACTACC
  S  D  G  W  N  N  M  Q  N  A  F  K  S  G  K  V  A  M  M  V  -
TCAACGGCCCCTGGGCCATCGAGGACGTCAAGGCGGGAGCCCGCTTCAAGGACGCCGGCA
---------+---------+---------+---------+---------+---------+  6540
AGTTGCCGGGGACCCGGTAGCTCCTGCAGTTCCGCCCTCGGGCGAAGTTCCTGCGGCCGT
  N  G  P  W  A  I  E  D  V  K  A  G  A  R  F  K  D  A  G  N  -
ACCTGGGGGTCGCCCCCGTCCCGGCCGGCAGTGCCGGACACGGCTCTCCCCACGGCGGGT
---------+---------+---------+---------+---------+---------+  6600
TGGACCCCCAGCGGGGGCAGGGCCGGCCGTCACGGCCTGTCCCGAGAGGGGTCCCGCCCA
  L  G  V  A  P  V  P  A  G  S  A  G  Q  G  S  P  Q  G  G  W  -
GGAACCTCTCGGTGTACGCGGGCTCGAAGAACCTCGACCCCTCCTACGCCTTCGTGAAGT
---------+---------+---------+---------+---------+---------+  6660
CCTTGGAGAGCCACATGCGCCCGAGCTTCTTGGAGCTGCGGAGGATGCGGAAGCACTTCA
  N  L  S  V  Y  A  G  S  K  N  L  D  A  S  Y  A  F  V  K  Y  -
        S
        s
        t
        I
ACATGAGCTCCGCCAAGGTGCAGCAGCAGACCACCGAGAAGCTGAGCCTGCTGCCCACCC
---------+---------+---------+---------+---------+---------+  6720
TGTACTCGAGGCGGTTCCACGTCGTCGTCTGGTGGCTCTTCGACTCGGACGACGGGTGGG
  M  S  S  A  K  V  Q  Q  Q  T  T  E  K  L  S  L  L  P  T  R  -
GCACGTCCGTCTACGAGGTCCCGTCCGTCGCGGACAACGAGATGGTGAAGTTCTTCAAGC
---------+---------+---------+---------+---------+---------+  6780
CGTGCAGGCAGATGCTCCAGGGCAGGCAGCGCCTGTTGCTCTACCACTTCAAGAAGTTCG
  T  S  V  Y  E  V  P  S  V  A  D  N  E  M  V  K  F  F  K  P  -
CGGCCGTCGACAAGGCCGTCGAACGGCCGTGGATCGCCGAGGGCAATGCCCTCTTCGAGC
---------+---------+---------+---------+---------+---------+  6840
GCCGGCAGCTGTTCCGGCAGCTTGCCGGCACCTAGCGGCTCCCGTTACGGGAGAAGCTCG
  A  V  D  K  A  V  E  R  P  W  I  A  E  G  N  A  L  F  E  P  -
            P
            s
            t
            I
CGATCCGGCTGCAG
---------+----  6854
GCTAGGCCGACGTC
  I  R  L  Q    -
序列表
(1)一般信息
  (i)申请人:
    (A)姓名:Hoechst Aktiengesellschaft
    (B)街道:
    (C)城市:Frankfurt
    (D)联邦州:
    (E)国家:德国
    (F)邮政编码(ZIP):65926
    (G)电话:069-305-3005
    (H)传真:069-35-7175
    (I)电传:
  (ii)发明名称:来自淡青链霉菌的假寡糖生物合成基因的分离及其应用
  (iii)序列数目:13
  (iv)计算机可读信息:
    (A)介质类型:软盘
    (B)计算机:IBM PC兼容机
    (C)操作系统:PC-DOS/MS-DOS
    (D)软件:Patentln Release#1.0,Version#1.25(EPO)
(2)SEQ ID NO:1的信息:
  (i)序列特征:
    (A)长度:22个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA
  (ix)特征:
    (A)名称/关键词:外显子
    (B)位置:1..22
(xi)SEQ ID NO:1的序列描述:
CSGGSGSSGC SGGSTTCATS GG                                   22
(2)SEQ ID NO:2的信息:
  (i)序列特征:
    (A)长度:24个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA
  (ix)特征:
      (A)名称/关键词:外显子
      (B)位置:1..24
  (xi)SEQ ID NO:2的序列描述:
GGGWVCTGGY VSGGSCCGTA GTTG                                 24
(2)SEQ ID NO:3的信息:
  (i)序列特征:
    (A)长度:546个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (ix)特征:
    (A)名称/关键词:外显子
    (B)位置:1..546
  (xi)SEQ ID NO:3的序列描述:
CCCGGGCGGG GCCGGGTTCA TCGGCTCCGC CTACGTCCGC CGGCTCCTGT CGCCCGGGGC       60
CCCCGGCGGC GTCGCGGTGA CCGTCCTCGA CAAACTCACC TACGCCGGCA GCCTCGCCCG      120
CCTGCACGCG GTGCGTGACC ATCCCGGCCT CACCTTCGTC CAGGGCGACG TGTGCGACAC      180
CGCGCTCGTC GACACGCTGG CCGCGCGGCA CGACGACATC GTGCACTTCG CGGCCGAGTC      240
GCACGTCGAC CGCTCCATCA CCGACAGCGG TGCCTTCACC CGCACCAACG TGCTGGGCAC      300
CCAGGTCCTG CTCGACGCCG CGCTCCGCCA CGGTGTGCGC ACCCTCGTGC ACGTCTCCAC      360
CGACGAGGTG TACGGCTCCC TCCCGCACGG GGCCGCCGCG GAGAGCGACC CCCTGCTCCC      420
GACCTCGCCG TACGCGGCGT CGAAGGCGGC CTCGCACCTC ATGGCGCTCG CCCACCACCG      480
CACCCACGGC CTGGACGTCC GGGTGACCCG CTGTTCGAAC AACTACGGCC CGCACCAGTT      540
CCCGGG                                                                 546
(2)SEQ ID NO:4的信息:
  (i)序列特征:
    (A)长度:541个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
(ii)分子类型:DNA(基因组)
(ix)特征:
    (A)名称/关键词:外显子
    (B)位置:1..541
(xi)SEQ ID NO:4的序列描述:
CCCCGGGTGC TGGTAGGGGC CGTAGTTGTT GGAGCAGCGG GTGATGCGCA  CGTCCAGGCC      60
GTGGCTGACG TGCATGGCCA GCGCGAGCAG GTCGCCCGAC GCCTTGGAGG  TGGCATAGGG     120
GCTGTTGGGG CGCAGCGGCT CGTCCTCCGT CCACGACCCC GTCTCCAGCG  AGCCGTAGAC     180
CTCGTCGGTG GACACCTGCA CGAAGGGGGC CACGCCGTGC CGCAGGGCCG  CGTCGAGGAG     240
TGTCTGCGTG CCGCCGGCGT TGGTCCGCAC GAACGCGGCG GCATCGAGCA  GCGAGCGGTC     300
CACGTGCGAC TCGGCGGCGA GGTGCACGAC CIGGTCCTGG CCGGCCATGA  CCCGGTCGAC     360
CAGGTCCGCG TCGCAGATGT CGCCGTGGAC GAAGCGCAGC CGGGGGTGGT  CGCGGACCGG     420
GTCGAGGTTG GCGAGGTTGC CGGCGTAGCT CAGGGCGTCG AGCACGGTGA  CGACGGCGTC     480
GGGCGGCCCG TCCGGACCGA GGAGGGTGCG GACGTAGTGC GAGCCCATGA  ACCCCGCCGC     540
C                                                                      541
(2)SEQ ID NO:5的信息:
  (i)序列特征:
    (A)长度:180氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:蛋白质
  (ix)特征:
      (A)名称/关键词:PCRstrE.Pep
      (B)位置:1..180
  (xi)SEQ ID NO:5的序列描述:
Ala Ala Gly Phe Met Gly Ser His Tyr Val Arg Thr Leu Leu Gly Pro
1               5                   10                  15
Asp Gly Pro Pro Asp Ala Val Val Thr Val Leu Asp Ala Leu Ser Tyr
            20                  25                  30
Ala Gly Asn Leu Ala Asn Leu Asp Pro Val Arg Asp His Pro Arg Leu
        35                  40                  45
Arg Phe Val His Gly Asp Ile Cys Asp Ala Asp Leu Val Asp Arg Val
    50                  55                  60
Met Ala Gly Gln Asp Gln Val Val His Leu Ala Ala Glu Ser His Val
65                  70                  75                  80
Asp Arg Ser Leu Leu Asp Ala Ala Ala Phe Val Arg Thr Asn Ala Gly
                85                  90                  95
Gly Thr Gln Thr Leu Leu Asp Ala Ala Leu Arg His Gly Val Ala Pro
            100                 105                 110
Phe Val Gln Val Ser Thr Asp Glu Val Tyr Gly Ser Leu Glu Thr Gly
        115                 120                 125
Ser Trp Thr Glu Asp Glu Pro Leu Arg Pro Asn Ser Pro Tyr Ala Thr
    130                 135                 140
Ser Lys Ala Ser Gly Asp Leu Leu Ala Leu Ala Met His Val Ser His
145                 150                 155                 160
Gly Leu Asp Val Arg Ile Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr
                165                 170                 175
Gln His Pro Gly
            180
(2)SEQ ID NO:6的信息:
  (i)序列特征:
    (A)长度:181氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:蛋白质
  (ix)特征:
    (A)名称/关键词:PCRacbD.Pep
    (B)位置:1..181
  (xi)SEQ ID NO:6的序列描述:
Pro Gly Gly Ala Gly Phe Ile Gly Ser Ala Tyr Val Arg Arg Leu Leu
1               5                   10                  15
Ser Pro Gly Ala Pro Gly Gly Val Ala Val Thr Va1 Leu Asp Lys Leu
            20                  25                  30
Thr Tyr Ala Gly Ser Leu Ala Arg Leu His Ala Val Arg Asp His Pro
        35                  40                  45
Gly Leu Thr Phe Val Gln Gly Asp Val Cys Asp Thr Ala Leu Val Asp
    50                  55                  60
Thr Leu Ala Ala Arg His Asp Asp Ile Val His Phe Ala Ala Glu Ser
65                  70                  75                  80
His Val Asp Arg Ser Ile Thr Asp Ser Gly Ala Phe Thr Arg Thr Asn
                85                  90                  95
Val Leu Gly Thr Gln Val Leu Leu Asp Ala Ala Leu Arg His Gly Val
            100                 105                 110
Arg Thr Leu Val His Val Ser Thr Asp Glu Val Tyr Gly Ser Leu Pro
        115                 120                 125
His Gly Ala Ala Ala Glu Ser Asp Pro Leu Leu Pro Thr Ser Pro Tyr
    130                 135                 140
Ala Ala Ser Lys Ala Ala Ser Asp Leu Met Ala Leu Ala His His Arg
145                 150                 155                 160
Thr His Gly Leu Asp Val Arg Val Thr Arg Cys Ser Asn Asn Tyr Gly
                165                 170                 175
Pro His Gln Phe Pro
            180
(2)SEQ ID NO:7的信息:
  (i)序列特征:
    (A)长度:6854个碱基对
    (B)类型:核酸
  (C)链型:双链
  (D)拓扑类型:线性
(ii)分子类型:DNA(基因组)
(ix)特征:
  (A)名称/关键词:阿卡糖生物合成基因簇
  (B)位置:1..6854
(xi)SEQ ID NO:7的序列描述:
CTGCAGGGTT CCCTGGTGCA CGACCCGCCC CTGGTCGACG ACCAGGGCGC TGTCGCAGAT       60
CGCGGCGATG TCGGCGATGT CGTGGCTGGT GAGCACCACG GTGGTGCCCA GTTCCCGGTG      120
GGCGCGGTTG ACCAGCCGGC GCACCGCGTC CTTCAGCACC ATGTCGAGGC CGATCGTGGG      180
CTCGTCCCAG AACAGCACGG CCGGGTCGTG CAGCAGGCTC GCCGCGATCT CGGCGCGCAT      240
GCGCTGTCCG AGGCTGAGCT GCCGCACGGG GGTGGACCCC AGCGCGTCGA TGTCGAGGAG      300
GTCCCGGAAC AGGGCGAGGT TGCGCCGGTA GACCGGTCCG GGGATGTCGT AGATGCGGCG      360
CAGGATGCGG AAGGAGTCGG GTACCGACAG GTCCCACCAG AGCTGGCTGC GCTGGCCGAA      420
GACGACGCCG ATCGTGCGGG CGTTGCGCTG CCGGTGCCGG TAGGGCTCCA GCCCGGCGAC      480
CGTGCAGCGG CCGGAGGTGG GGGTCATGAT GCCGGTCAGC ATCTTGATCG TGGTCGACTT      540
GCCGGCTCCG TTGGCGCCGA TGTAGGCGGT CTTCGTGCCG GCCGGTATCT CGAAGGAGAC      600
GTCGTCGACG GCGCGCACGA CGCGGTACCG GCGGGTCAGG AGGGTGGAGA GGCTGCCGAG      660
CAGGCCGGGC TCGCGTTCGG CCAGCCGGAA CTCCTTGACG AGGTGTTCGG CCACGATCAC      720
GCGATCACCC GCTCGACGGC CGTCTCCAGC AGGCGCAGGC CCTCGTCGAG CAGCGCCTCG      780
TCGAGGGTGA ACGGCGGTGC CAGCCGCAGG ATGTGGCCGC CCAGGGAGGT GCGCAGCCCC      840
ACGTCGAGGG CGGTGGTGTA GACGGCCCGG GCGGTCTCGG GGGCGGGTGC CCGGCCGACG      900
GCGTCGGTGA CGAACTCCAG GCCCCACAGC AGTCCGAGGC CGCGTACCTG GCCGAGCTGG      960
GGGAAGCGGG ACTCCAGGGC GCGCAGCCGC TCCTGGATGA GCTCGCCGAG GACGCGCACG     1020
CGGTCGATCA GCCGGTCGCG CTCGACGACC TCCAGCGTGG CGCGGGCGGC GGCGATCCCC     1080
AGTGGGTTGC TCGCGTACGT CGAGGCGTAC GCCCCGGGGT GGCCGCCTCC GGCCTGCGCA     1140
GCTTCCGCGC GTCCGGCCAG CACGGCGAAG GGGAATCCGC TCGCGGTGCC CTTGGACAGC     1200
ATCGCCAGGT CCGGCTCGAT GCCGAACAGT TCGCTGGCGA GGAAGGCGCC GGTGCGCCCG     1260
CCGCCGGTGA GGACCTCGTC GGCGACGAGC AGCACGCCGC CGTCCCGGCA GGCGCCGGCG     1320
ATCCGCTCCC AGTAGCCGGG GGGCGGCACG ATGACGCCTG CCGCGCCGAG GACGGGTTCG     1380
AAGACCAGGG CCGAGACGTT GGGCTTCTCC GCGATGTGCC GGCGCACGAG GGTCGCGCAC     1440
CGCACGTCGC ACGAGGGGTA CTCCAGGCCC AGGGGACAGC GGTAGCCAGT AGGGGCTGTA     1500
GCCAGCACGC TGTTGCCGCT GAAGGCCTGG TGGCCGATGT CCCAGTGGAC CAGCATCCGG     1560
GCGCCCATGG TCTTGCCGTG GAAGCCGTGG CGCAGGGCGC AGATCCGGTT GCGGCCCGGC     1620
GCGGCGGTCG CCTGGACGAC CCGCAGGGCG GCCTCGACCA CCTCCGCGCC GGTGGAGAAG     1680
AAGGCGTAGG TGTCGAGCTG TTCGGGCAGC AGCCTGGCGA GCAGTTCCAG CAGGCCGGCG     1740
CGGTCCGGCG TGGCGCTGTC GTGGACGTTC CACAGGCGGC GGGCCTGGGT GGTGAGTGCC     1800
TCGACGACCT CCGGGTGCCC GTGGCCCAGT GACTGGGTGA GGGTCCCGGC CGCGAAGTCG       1860
AGGTACTGGT TGCCGTCCAG GTCGGTCAGA ACGGGACCGC GTCCCTCGGC GAAGACCCGG       1920
CGTCCGTGGA CGGCTTCCTC GGAGGCGCCC GGCGCCAGGT GGCGGGCCTC CCGTGCCAGG       1980
TGCTGTGTCT GCCGTAAGCC TGTCATCGCT GCCTCTGCTC GTCGGACCGG CTGACGCGAT       2040
CGCCGGCGAA CTGCGTTGTG GCGCACCACG GTTGGGGCGG CTCGGCGCTG AGTCAAACAC       2100
TTGAACACAC ACCGCTGCAA GAGTTTGCGG GTTGTTTCAG AAAGTTGTTG CGAGCGGCCC       2160
CGGCACTCTG GTTGAGTCGA CGTGCTTACG GCGCCACCAC GCCTCACGTT CGAGGAGGGA       2220
CCTGTGAGAA CAATCCCGCA GACCGACCCG CTCCCGCGGA GGCCGAGGTG AAGGCCVTGG       2280
TCCTGGCAGG TGGAACCGGC AGCAGACTGA GGCCGTTCAC CCACACCGCC GCCAAGCAGC       2340
TGCTCCCCAT CGCCAACAAG CCCGTGCTCT TCTACGCGCT GGAGTCCCTC GCCGCGGCGG       2400
GTGTCCGGGA GGCCGGCGTC GTCGTGGGCG CGTACGGCCG GGAGATCCGC GAACTCACCG       2460
GCGACGGCAC CGCGTTCGGG TTACGCATCA CCTACCTCCA CCAGCCCCGC CCGCTCGGTC       2520
TCGCGCACGC GGTGCGCATC GCCCGCGGCT TCCTGGGCGA CGACGACTTC CTGCTGTACC       2580
TGGGGGACAA CTACCTGCCC CAGGGCGTCA CCGACTTCGC CCGCCAATCG GCCGCCGATC       2640
CCGCGGCGGC CCGGCTGCTG CTCACCCCGG TCGCGGACCC GTCCGCCTTC GGCGTCGCGG       2700
AGGTCGACGC GGACGGGAAC GTGCTGCGCT TGGAGGAGAA ACCCGACGTC CCGCGCAGCT       2760
CGCTCGCGCT CATCGGCGTG TACGCCTTCA GCCCGGCCGT CCACGAGGCG GTACGGGCCA       2820
TCACCCCCTC CGCCCGCGGC GAGCTGGAGA TCACCCACGC CGTGCAGTGG ATGATCGACC       2880
GGGGCCTGCG CGTACGGGCC GAGACCACCA CCCGGCCCTG GCGCGACACC GGCAGCGCGG       2940
AGGACATGCT GGAGGTCAAC CGTCACGTCC TGGACGGACT GGAGGGCCGC ATCGAGGGGA       3000
AGGTCGACGC GCACAGCACG CTGGTCGGCC GGGTCCGGGT GGCCGAAGGC GCGATCGTGC       3060
GGGGGTCACA CGTGGTGGGC CCGGTGGTGA TCGGCGCGGG TGCCGTCGTC AGCAACTCCA       3120
GTGTCGGCCC GTACACCTCC ATCGGGGAGG ACTGCCGGGT CGAGGACAGC GCCATCGAGT       3180
ACTCCGTCCT GCTGCGCGGC GCCCAGGTCG AGGGGGCGTC CCGCATCGAG GCGTCCCTCA       3240
TCGGCCGCGG CGCCGTCGTC GGCCCGGCCC CCCGTCTCCC GCAGGCTCAC CGACTGGTGA       3300
TCGGCGACCA CAGCAACGTG TATCTCACCC CATGACCACG ACCATCCTCG TCACCGGCGG       3360
AGCGGGCTTC ATTCGCTCCG CCTACGTCCG CCGGCTCCTG TCGCCCGGGG CCCCCGGCGG       3420
CGTCGCGGTG ACCGTCCTCG ACAAACTCAC CTACGCCGGC AGCCTCGCCC GCCTGCACGC       3480
GGTGCGTGAC CATCCCGGCC TCACCTTCGT CCAGGGCGAC GTGTGCGACA CCGCGCTCGT       3540
CGACACGCTG GCCGCGCGGC ACGACGACAT CGTGCACTTC GCGGCCGAGT CGCACGTCGA       3600
CCGCTCCATC ACCGACAGCG GTGCCTTCAC CCGCACCAAC GTGCTGGGCA CCCAGGTCCT       3660
GCTCGACGCC GCGCTCCGCC ACGGTGTGCG CACCTTCGTG CACGTCTCCA CCGACGAGGT       3720
GTACGGCTCC CTCCCGCACG GGGCCGCCGC GGAGAGCGAC CCCCTGCTTC CGACCTCGCC       3780
GTACGCGGCG TCGAAGGCGG CCTCGGACCT CATGGCGCTC GCCCACCACC GCACCCACGG       3840
CCTGGACGTC CGGGTGACCC GCTGTTCGAA CAACTTCGGC CCCCACCAGC ATCCCGAGAA       3900
GCTCATACCG CGGCTCCTGA CCAGCCTCCT GTCCGGCGGC ACCGTTCCCC TCTACGGCGA       3960
CGGGCGGCAC GTGCGCGACT GGCTGCACGT CGACGACCAC GTCAGGGCCG TCGAACTCGT       4020
CCGCGTGTCG GGCCGGCCGG GAGAGATCTA CAACATCGGG GGCGGCACCT CGCTGCCCAA       4080
CCTGGAGCTC ACGCACCGGT TGCTCGCACT GTGCGGCGCG GGCCCGGAGC GCATCGTCCA       4140
CGTCGAGAAC CGCAAGGGGC ACGACCGGCG CTACGCGGTC GACCACAGCA AGATCACCGC       4200
GGAACTCGGT TACCGGCCGC GCACCGACTT CGCGACCGCG CTGGCCGACA CCGCGAAGTG       4260
GTACGAGCGG CACGAGGACT GGTGGCGTCC CCTGCTCGCC GCGACATGAC GTCGGGCCGG       4320
ACCGCAACCA CCGGCCCCGG CCGGCACACC GCCGCCCGCG GCCGGTGGCC GGCCGGTCAG       4380
CGTCCGTGAG CCGGGCGCCG GCCGCCCCGC GGGCCGGCGG CGGTGGACCC CCGGACCACC       4440
AGTTCCGGCA TGAAGACGAA TTCGGTGCGC GGCGGCGGCG TTCCGCTCAT CTCCTCCAGC       4500
AGTGCGTCCA CGGCGACCTG CCCCATCGCC TTGACGGGCT GTCTGATGGT GGTCAGGGGA       4560
GGGTCGGTGA AGGCCATGAG CGGCGAGTCG TCGAAGCCGA CCACCGAGAT GTCACCGGGA       4620
ACCGTGAGAC CCCGCCGGCG CGCGGCCCGC ACGGCGCCGA GGGCCATCAT GTCGCTGGCG       4680
CACATGACGG CCGTGCAGCC CAGGTCGATC AGCGCGGACG CGGCGGCCTG GCCCCCCTCC       4740
AGGGAGAACA GCGAGTGCTG CACGAGCTCC TCGGACTCCC GCGCCGACAC TCCCAGGTGC       4800
TCCCGCACGC CGGCCCGGAA CCCCTCGATC TTCCGCTGCA CCGGCACGAA GCGGGCGGGC       4860
CCGACGGCGA GGCCGACGCG CTCGTGCCCC AGCTCCGCCA GGTGCGCCAC GGCCAGGCGC       4920
ATCGCGGCCC GGTCGTCCGG GGAGACGAAG GGTGCCTCGA TCCGGGGCGA GAACCCGTTC       4980
ACGAGGACGA AGGGCACCTG CCGCTCGTGC AGCCGGCCGT ACCGTCCGGT CTCGGCGGTG       5040
GTGTCCGCGT GCAGTCCGGA GACGAAGATG ATGCCGGACA CCCCGCGGTC CACGAGCATC       5100
TCCGTGAGTT CGTCCTCGGT CGAGCCGCCC GGGGTCTGCG TGGCGAGCAC GGGCGTGTAG       5160
CCCTGACGCG TGAGCGCCTG CCCCATCACC TGGGCCAGTG CGGGGAAGAA GGGGTTGTCC       5220
AGTTCGGGGG TGACCAGTCC GACCAGCTCG GCGCGGCGCT GTCGCGCCGG CTGCTCGTAG       5280
CCCAGCGCGT CCAGTGCGGT CAGCACCGAG TCGCGGGTGC CGGTGGCCAC ACCGCGCGCA       5340
CCGTTCAGCA CCCGGCTGAC CGTGGCCTTG CTGACGCCCG CCCGGGCTGC GATGTCGGCG       5400
AGCCGCATGG TCATGGCAAC GCACTCTACC TGTCGGGGCG TCAGGGCGTG CCCACCGCGC       5460
GCGGAACCGG CGGACTGCGG GGCACGGCCC GTCCGCCGCC CACGGACCAC GCGCCCGAAA       5520
CGATGGCTGA AAATGCTTGC AGCAAATTGC CGCAACGTCT TTCGGCGGCT TTTCGATCCT       5580
GTTACGTTCC TGGCAACCCC GGCGCCGCGC AGAAGCGGTT GGCGTGAGGC GTCCAGACCT       5640
CCGCCCGATT CCGGGATCAC TCAGGGGAGT TCACAATGCG GCGTGGCATT GCGGCCACCG       5700
CGCTGTTCGC GGCTGTGGCC ATGACGGCAT CGGCGTGTGG CGGGGGCGAC AACGGCGGAA       5760
GCGGTACCGA CGCGGGCGGC ACGGAGCTGT CGGGGACCGT CACCTTCTGG GACACGTCCA       5820
ACGAAGCCGA GAAGGCGACG TACCAGGCCC TCGCGGAGGG CTTCGAGAAG GAGCACCCGA       5880
AGGTCGACGT CAAGTACGTC AACGTCCCGT TCGGCGAGGC GAACGCCAAG TTCAAGAACG       5940
CCGCGGGCGG CAACTCCGGT GCCCCGGACG TGATGCGTAC GGAGGTCGCC TGGGTCGCGG       6000
ACTTCGCCAG CATCGGCTAC CTCGCCCCGC TCGACGGCAC GCCCGCCCTC GACGACGGGT       6060
CGGACCACCT TCCCCAGGGC GGCAGCACCA GGTACGAGGG GAAGACCTAC GCGGTCCCGC       6120
AGGTGATCGA CACCCTGGCG CTCTTCTACA ACAAGGAACT GCTGACGAAG GCCGGTGTCG       6180
AGGTGCCGGG CTCCCTCGCC GAGCTGAAGA CGGCCGCCGC CGAGATCACC GAGAAGACCG       6240
GCGCGAGCGG CCTCTACTGC GGGGCGACGA CCCGTACTTG GTTCCTGCCC TACCTCTACG       6300
GGGAGGGCGG CGACCTGGTC GACGAGAAGA ACAAGACCGT CACGGTCGAC GACGAAGCCG       6360
GTGTGCGCGC CTACCGCGTC ATCAAGGACC TCGTGGACAG CAAGGCGGCC ATCACCGACG       6420
CGTCCGACGG CTGGAACAAC ATGCAGAACG CCTTCAAGTC GGGCAAGGTC GCCATGATGG       6480
TCAACGGCCC CTGGGCCATC GAGGACGTCA AGGCGGGAGC CCGCTTCAAG GACGCCGGCA       6540
ACCTGGGGGT CGCCCCCGTC CCGGCCGGCA GTGCCGGACA GGGCTCTCCC CAGGGCGGGT       6600
GGAACCTCTC GGTGTACGCG GGCTCGAAGA ACCTCGACGC CTCCTACGCC TTCGTGAAGT       6660
ACATGAGCTC CGCCAAGGTG CAGCAGCAGA CCACCGAGAA GCTGAGCCTG CTGCCCACCC       6720
GCACGTCCGT CTACGAGGTC CCGTCCGTCG CGGACAACGA GATGGTGAAG TTCTTCAAGC       6780
CGGCCGTCGA CAAGGCCGTC GAACGGCCGT GGATCGCCGA GGGCAATGCC CTCTTCGAGC       6840
CGATCCGGCT GCAG                                                         6854
(2)SEQ ID NO:8的信息:
  (i)序列特征:
    (A)长度:240氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:蛋白质
  (ix)特征:
     (A)名称/关键词:acbA
      (B)位置:1..240
  (xi)SEQ ID NO:8的序列描述:
Val Ile Val Ala Glu His Leu Val Lys Glu Phe Arg Leu Ala Glu Arg
1               5                   10                  15
Glu Pro Gly Leu Leu Gly Ser Leu Ser Thr Leu Leu Thr Arg Arg Tyr
            20                  25                  30
Arg Val Val Arg Ala Val Asp Asp Val Ser Phe Glu Ile Pro Ala Gly
        35                  40                  45
Thr Lys Thr Ala Tyr Ile Gly Ala Asn Gly Ala Gly Lys Ser Thr Thr
    50                  55                  60
Ile Lys Met Leu Thr Gly Ile Met Thr Pro Thr Ser Gly Arg Cys Thr
65                  70                  75                  80
Val Ala Gly Leu Glu Pro Tyr Arg His Arg Gln Arg Asn Ala Arg Thr
                85                 90                 95
Ile Gly Val Val Phe Gly Gln Arg Ser Gln Leu Trp Trp Asp Leu Ser
            100                 105                 110
Val Pro Asp Ser Phe Arg Ile Leu Arg Arg Ile Tyr Asp Ile Pro Gly
        115                 120                 125
Pro Val Tyr Arg Arg Asn Leu Ala Leu Phe Arg Asp Leu Leu Asp Ile
    130                 135                 140
Asp Ala Leu Gly Ser Thr Pro Val Arg Gln Leu Ser Leu Gly Gln Arg
145                 150                 155                 160
Met Arg Ala Glu Ile Ala Ala Ser Leu Leu His Asp Pro Ala Val Leu
                165                 170                 175
Phe Trp Asp Glu Pro Thr Ile Gly Leu Asp Met Val Leu Lys Asp Ala
            180                 185                 190
Val Arg Arg Leu Val Asn Arg Ala His Arg Glu Leu Gly Thr Thr Val
        195                 200                 205
Val Leu Thr Ser His Asp Ile Ala Asp Ile Ala Ala Ile Cys Asp Ser
    210                 215                 220
Ala Leu Val Val Asp Gln Gly Arg Val Val His Gln Gly Thr Leu Gln
225                 230                 235                 240
(2)SEQ ID NO:9的信息:
(i)序列特征:
  (A)长度:429氨基酸
  (B)类型:氨基酸
  (C)链型:单链
  (D)拓扑类型:线性
(ii)分子类型:蛋白质
(ix)特征:
  (A)名称/关键词:acbB
  (B)位置:1..429
(xi)SEQ ID NO:9的序列描述:
Met Thr Gly Leu Arg Gln Thr Gln His Leu Ala Arg Glu Ala Arg His
1               5                   10                  15
Leu Ala Pro Gly Ala Ser Glu Glu Ala Val His Gly Arg Arg Val Phe
            20                  25                  30
Ala Glu Gly Arg Gly Pro Val Leu Thr Asp Leu Asp Gly Asn Gln Tyr
        35                  40                  45
Leu Asp Phe Ala Ala Gly Thr Leu Thr Gln Ser Leu Gly His Gly His
    50                  55                  60
Pro Glu Val Val Glu Ala Leu Thr Thr Gln Ala Arg Arg Leu Trp Asn
65                  70                  75                  80
Val His Asp Ser Ala Thr Pro Asp Arg Ala Gly Leu Leu Glu Leu Leu
                85                  90                  95
Ala Arg Leu Leu Pro Glu Gln Leu Asp Thr Tyr Ala Phe Phe Ser Thr
            100                 105                 110
Gly Ala Glu Val Val Glu Ala Ala Leu Arg Val Val Gln Ala Thr Ala
        115                 120                 125
Ala Pro Gly Arg Asn Arg Ile Cys Ala Leu Arg His Gly Phe His Gly
    130                 135                 140
Lys Thr Met Gly Ala Arg Met Leu Val His Trp Asp Ile Gly His Gln
145                 150                 155                 160
Ala Phe Ser Gly Asn Ser Val Leu Ala Thr Ala Pro Thr Gly Tyr Arg
                165                 170                 175
Cys Pro Leu Gly Leu Glu Tyr Pro Ser Cys Asp Val Arg Cys Ala Thr
            180                 185                 190
Leu Val Arg Arg His Ile Ala Glu Lys Pro Asn Val Ser Ala Leu Val
        195                 200                 205
Phe Glu Pro Val Leu Gly Ala Ala Gly Val Ile Val Pro Pro Pro Gly
    210                 215                 220
Tyr Trp Glu Arg Ile Ala Gly Ala Cys Arg Asp Gly Gly Val Leu Leu
225                 230                 235                 240
Val Ala Asp Glu Val Leu Thr Gly Gly Gly Arg Thr Gly Ala Phe Leu
                245                 250                 255
Ala Ser Glu Leu Phe Gly Ile Glu Pro Asp Leu Ala Met Leu Ser Lys
            260                 265                 270
Gly Thr Ala Ser Gly Phe Pro Phe Ala Val Leu A la Gly Arg Ala Glu
        275                 280                 285
Ala Ala Gln Ala Gly Gly Gly His Pro Gly Ala Tyr Ala Ser Thr Tyr
    290                 295                 300
Ala Ser Asn Pro Leu Gly Ile Ala Ala Ala Arg Ala Thr Leu Glu Val
305                 310                 315                 320
Val Glu Arg Asp Arg Leu Ile Asp Arg Val Arg Val Leu Gly Glu Leu
                325                 330                 335
lle Gln Glu Arg Leu Arg Ala Leu Glu Ser Arg Phe Pro Gln Leu Gly
            340                 345                 350
Gln Val Arg Gly Leu GIy Leu Leu Trp Gly Leu Glu Phe Val Thr Asp
        355                 360                 365
Ala Val Gly Arg Ala Pro Ala Pro Glu Thr Ala Arg Ala Val Tyr Thr
    370                 375                 380
Thr Ala Leu Asp Leu Gly Leu Arg Thr Ser Leu Gly Gly His Ile Leu
385                 390                 395                 400
Arg Leu Ala Pro Pro Phe Thr Leu Asp Glu Ala Leu Leu Asp Glu Gly
                405                 410                 415
Leu Arg Leu Leu Glu Thr Ala Val Glu Arg Val Ile Ala
            420                 425
(2)SEQ ID NO:10的信息:
  (i)序列特征:
    (A)长度:355氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:蛋白质
  (ix)特征:
    (A)名称/关键词:acbC
    (B)位置:1..355
    (xi)SEQ ID NO:10的序列描述:
Val Lys Ala Leu Val Leu Ala Gly Gly Thr Gly Ser Arg Leu Arg Pro
1               5                   10                  15
Phe Thr His Thr Ala Ala Lys Gln Leu Leu Pro Ile Ala Asn Lys Pro
            20                  25                  30
Val Leu Phe Tyr Ala Leu Glu Ser Leu Ala Ala Ala Gly Val Arg Glu
        35                  40                  45
Ala Gly Val Val Val Gly Ala Tyr Gly Arg Glu Ile Arg Glu Leu Thr
    50                  55                  60
Gly Asp Gly Thr Ala Phe Gly Leu Arg Ile Thr Tyr Leu His Gln Pro
65                  70                  75                  80
Arg Pro Leu Gly Leu Ala His Ala Val Arg Ile Ala Arg Gly Phe Leu
                85                  90                  95
Gly Asp Asp Asp Phe Leu Leu Tyr Leu Gly Asp Asn Tyr Leu Pro Gln
            100                 105                 110
Gly Val Thr Asp Phe Ala Arg Gln Ser Ala Ala Asp Pro Ala Ala Ala
        115                 120                 125
Arg Leu Leu Leu Thr Pro Val Ala Asp Pro Ser Ala Phe Gly Val Ala
    130                 135                 140
Glu Val Asp Ala Asp Gly ASn Val Leu Arg Leu Glu Glu Lys Pro Asp
145                 150                 155                 160
Val Pro Arg Ser Ser Leu Ala Leu Ile Gly Val Tyr Ala Phe Ser Pro
                165                 170                 175
Ala Val His Glu Ala Val Arg Ala Ile Thr Pro Ser Ala Arg Gly Glu
            180                 185                 190
Leu Glu Ile Thr His Ala Val Gln Trp Met Ile Asp Arg Gly Leu Arg
        195                 200                 205
Val Arg Ala Glu Thr Thr Thr Arg Pro Trp Arg Asp Thr Gly Ser Ala
    210                 215                 220
Glu Asp Mer Leu Glu Val Asn Arg His Val Leu Asp Gly Leu Glu Gly
225                 230                 235                 240
Arg Ile Glu Gly Lys Val Asp Ala His Ser Thr Leu Val Gly Arg Val
                245                 250                 255
Arg Val Ala Glu Gly Ala Ile Val Arg Gly Ser His Val Val Gly Pro
            260                 265                 270
Val Val Ile Gly Ala Gly Ala Val Val Ser Ash Ser Ser Val Gly Pro
        275                 280                 285
Tyr Thr Ser Ile Gly Glu Asp Cys Arg Val Glu Asp Ser Ala Ile Glu
    290                 295                 300
Tyr Ser Val Leu Leu Arg Gly Ala Gln Val Glu Gly Ala Ser Arg Ile
305                 310                 315                 320
Glu Ala Ser Leu Ile Gly Arg Gly Ala Val Val Gly Pro Ala Pro Arg
                325                 330                 335
Leu Pro Gln Ala His Arg Leu Val Ile Gly Asp His Ser Lys Val Tyr
            340                 345                 350
Leu Thr Pro
        355
(2)SEQ ID NO:11的信息:
  (i)序列特征:
    (A)长度:325氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:蛋白质
  (ix)特征:
    (A)名称/关键词:acbD
    (B)位置:1..325
  (xi)SEQ ID NO:11的序列描述:
Met Thr Thr Thr Ile Leu Val Thr Gly Gly Ala Gly Phe Ile Arg Ser
1               5                   10                  15
Ala Tyr Val Arg Arg Leu Leu Ser Pro Gly Ala Pro Gly Gly Val Ala
            20                  25                  30
Val Thr Val Leu Asp Lys Leu Thr Tyr Ala Gly Ser Leu Ala Arg Leu
        35                  40                  45
His Ala Val Arg Asp His Pro Gly Leu Thr Phe Val Gln Gly Asp Val
    50                  55                  60
Cys Asp Thr Ala Leu Val Asp Thr Leu Ala Ala Arg His Asp Asp Ile
65                  70                  75                  80
Val His Phe Ala Ala Glu Sar His Val Asp Arg Ser Ile Thr Asp Ser
                85                  90                  95
Gly Ala Phe Thr Arg Thr Asn Val Leu Gly Thr Gln Val Leu Leu Asp
            100                 105                 110
Ala Ala Leu Arg His Gly Val Arg Thr Phe Val His Val Ser Thr Asp
        115                 120                 125
Glu Val Tyr Gly Ser Leu Pro His Gly Ala Ala Ala Glu Ser Asp Pro
    130                 135                 140
Leu Leu Pro Thr Ser Pro Tyr Ala Ala Ser Lys Ala Ala Ser Asp Leu
145                 150                 155                 160
Met Ala Leu Ala His His Arg Thr His Gly Leu Asp Val Arg Val Thr
                165                  170                 175
Arg Cys Ser Asn Asn Phe Gly Pro His Gln His Pro Glu Lys Leu Ile
            180                 185                 190
Pro Arg Phe Leu Thr Ser Leu Leu Ser Gly Gly Thr Val Pro Leu Tyr
        195                 200                 205
G1y Asp Gly Arg His Val Arg Asp Trp Leu His Val Asp Asp His Val
    210                 215                 220
Arg Ala Val Glu Leu Val Arg Val Ser Gly Arg Pro Gly Glu Ile Tyr
225                 230                 235                 240
Asn Ile Gly Gly Gly Thr Ser Leu Pro Asn Leu Glu Leu Thr His Arg
                245                 250                 255
Leu Leu Ala Leu Cys Gly Ala Gly Pro Glu Arg Ile Val His Val Glu
            260                 265                 270
Asn Arg Lys Gly His Asp Arg Arg Tyr Ala Val Asp His Ser Lys Ile
        275                 280                 285
Thr Ala Glu Leu Gly Tyr Arg Pro Arg Thr Asp Phe Ala Thr Ala Leu
    290                 295                 300
Ala Asp Thr Ala Lys Trp Tyr Glu Arg His Glu Asp Trp Trp Arg Pro
305                 310                 315                 320
Leu Leu Ala Ala Thr
                325
(2)SEQ ID NO:12的信息:
  (i)序列特征:
    (A)长度:345氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑类型:线性
(ii)分子类型:蛋白质
(ix)特征:
    (A)名称/关键词:acbE
    (B)位置:1..345
(xi)SEQ ID NO:12的序列描述:
Met Thr Met Arg Leu Ala Asp Ile Ala Ala Arg Ala Gly Val Ser Lys
1               5                   10                  15
Ala Thr Val Ser Arg Val Leu Asn Gly Ala Arg Gly Val Ala Thr Gly
            20                  25                  30
Thr Arg Asp Ser Val Leu Thr Ala Leu Asp Ala Leu Gly Tyr Glu Gln
        35                  40                  45
Pro Ala Arg Gln Arg Arg Ala Glu Leu Val Gly Leu Val Thr Pro Glu
    50                  55                  60
Leu Asp Asn Pro Phe Phe Pro Ala Leu Ala Gln Val Met Gly Gln Ala
65                  70                  75                  80
Leu Thr Arg Gln Gly Tyr Thr Pro Val Leu Ala Thr Gln Thr Pro Gly
                85                 90                 95
Gly Ser Thr Glu Asp Glu Leu Thr Glu Met Leu Val Asp Arg Gly Val
            100                 105                 110
Ser Gly Ile Ile Phe Val Ser Gly Leu His Ala Asp Thr Thr Ala Glu
        115                 120                 125
Thr Gly Arg Tyr Gly Arg Leu His Glu Arg Gln Val Pro Phe Val Leu
    130                 135                 140
Val Asn Gly Phe Ser Pro Arg Ile Glu Ala Pro Phe Val Ser Pro Asp
145                 150                 155                 160
Asp Arg Ala Ala Mer Arg Leu Ala Val Ala His Leu Ala Glu Leu Gly
                165                 170                 175
His Glu Arg Val Gly Leu Ala Val Gly Pro Ala Arg Phe Val Pro Val
            180                 185                 190
Gln Arg Lys Ile Glu Gly Phe Arg Ala Gly Val Arg Glu Mis Leu Gly
        195                 200                 205
Val Ser Ala Arg Glu Ser Glu Glu Leu Val Gln His Ser Leu Phe Ser
    210                 215                 220
Leu Glu Gly Gly Gln Ala Ala Ala Ser Ala Leu Ile Asp Leu Gly Cys
225                 230                 235                 240
Thr Ala Val Met Cys Ala Ser Asp Met Met Ala Leu Gly Ala Val Arg
                245                 250                 255
Ala Ala Arg Arg Arg Gly Leu Thr Val Pro Gly Asp Ile Ser Val Val
            260                 265                 270
Gly Phe Asp Asp Ser Pro Leu Met Ala Phe Thr Asp Pro Pro Leu Thr
        275                 280                 285
Thr Ile Arg Gln Pro Val Lys Ala Met Gly Gln Val Ala Val Asp Ala
    290                 295                 300
Leu Leu Glu Glu Met Ser Gly Thr Pro Pro Pro Arg Thr Glu Phe Val
305                 310                 315                 320
Phe Met Pro Glu Leu Val Val Arg Gly Ser Thr Ala Ala Gly Pro Arg
                325                 330                 335
Gly Gly Arg Arg Pro Ala His Gly Arg
            340                 345
(2)SEQ ID NO:13的信息:
  (i)序列特征:
    (A)长度:393氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:蛋白质
  (ix)特征:
    (A)名称/关键词:acbF
    (B)位置:1..393
  (xi)SEQ ID NO:13的序列描述:
Met Arg Arg Gly Ile Ala Ala Thr Ala Leu Phe Ala Ala Val Ala Met
1               5                   10                  15
Thr Ala Ser Ala Cys Gly Gly Gly Asp Asn Gly Gly Ser Gly Thr Asp
            20                  25                  30
Ala Gly Gly Thr Glu Leu Ser Gly Thr Val Thr Phe Trp Asp Thr Ser
        35                  40                  45
Aan Glu Ala Glu Lys Ala Thr Tyr Gln Ala Leu Ala Glu Gly Phe Glu
    50                  55                  60
Lys Glu His Pro Lys Val Asp Val Lys Tyr Val Ash Val Pro Phe Gly
65                  70                  75                  80
Glu Ala Asn Ala Lys Phe Lys Asn Ala Ala Gly Gly Asn Ser Gly Ala
                85                  90                  95
Pro Asp Val Met Arg Thr Glu Val Ala Trp Val Ala Asp Phe Ala Ser
            100                 105                 110
Ile Gly Tyr Leu Ala Pro Leu Asp Gly Thr Pro Ala Leu Asp Asp Gly
        115                 120                 125
Ser Asp His Leu Pro Gln Gly Gly Ser Thr Arg Tyr Glu Gly Lys Thr
    130                 135                 140
Tyr Ala Val Pro Gln Val Ile Asp Thr Leu Ala Leu Phe Tyr Asn Lys
145                 150                 155                 160
Glu Leu Leu Thr Lys Ala Gly Val Glu Val Pro Gly Ser Leu Ala Glu
                165                 170                 175
Leu Lys Thr Ala Ala Ala Glu Ile Thr Glu Lys Thr Gly Ala Ser Gly
            180                 185                 190
Leu Tyr Cys Gly Ala Thr Thr Arg Thr Trp Phe Leu Pro Tyr Leu Tyr
        195                 200                 205
Gly Glu Gly Gly Asp Leu Val Asp Glu Lys Asn Lys Thr Val Thr Val
    210                 215                 220
Asp Asp Glu Ala Gly Val Arg Ala Tyr Arg Val Ile Lys Asp Leu Val
225                 230                 235                 240
Asp Ser Lys Ala Ala Ile Thr Asp Ala Ser Asp Gly Trp Asn Asn Met
                245                 250                 255
Gln Asn Ala Phe Lys Ser Gly Lys Val Ala Mat Met Val ASn Gly Pro
            260                 265                 270
Trp Ala Ile Glu Asp Val Lys Ala Gly A la Arg Phe Lys Asp Ala Gly
        275                 280                 285
Asn Leu Gly Val Ala Pro Val Pro Ala Gly Ser Ala Gly Gln Gly Ser
    290                 295                 300
Pro Gln Gly Gly Trp Asn Leu Ser Val Tyr Ala Gly Ser Lys Asn Leu
305                 310                 315                 320
Asp Ala Ser Tyr Ala Phe Val Lys Tyr Met Ser Ser Ala Lys Val Gln
                325                 330                 335
Gln Gln Thr Thr Glu Lys Leu Ser Leu Leu Pro Thr Arg Thr Ser Val
            340                 345                 350
Tyr Glu Val Pro Ser Val Ala Asp Asn Glu Met Val Lys Phe Phe Lys
        355                 360                 365
Pro Ala Val Asp Lys Ala Val Glu Arg Pro Trp Ile Ala Glu Gly Asn
    370                 375                 380
Ala Leu Phe Glu Pro Ile Arg Leu Gln
385                 390

Claims (29)

1.包含阿卡糖生物合成基因的DNA分子,
其特征在于
(a)其包含了如SEQ ID NO:7所示的一种DNA序列;或
(b)其包含了在严格条件下能与如(a)的DNA分子杂交的DNA序列;或
(c)其包含了因为遗传密码简并性而不同于如(a)或(b)的DNA分子的一种DNA序列,此DNA序列能表达能相应地用如(a)或(b)的DNA分子表达的蛋白质。
2.如权利要求1的DNA分子,其特征在于其包含如(a)中提到的序列,即如SEQ ID NO:7所示核苷酸1-720的DNA序列的acbA基因。
3.如权利要求1的DNA分子,其特征在于其包含如(a)中提到的序列,即如SEQ ID NO:7所示核苷酸720-2006的DNA序列的acbB基因。
4.如权利要求1的重组DNA分子,其特征在于其包含如(a)中提到的序列,即如SEQ ID NO:7所示核苷酸2268-3332的DNA序列的acbC基因。
5.如权利要求1的重组DNA分子,其特征在于其包含如(a)中提到的序列,即如SEQ ID NO:7所示核苷酸3332-4306的DNA序列的acbD基因。
6.如权利要求1的重组DNA分子,其特征在于其包含如(a)中提到的序列,即如SEQ ID NO:7所示核苷酸4380-5414的DNA序列的acbE基因。
7.如权利要求1的重组DNA分子,其特征在于其包含如(a)中提到的序列,即如SEQ ID NO:7所示核苷酸5676-6854的DNA序列的acbF基因。
8.用于如权利要求1的DNA分子的PCR扩增的寡核苷酸引物。
9.如权利要求8的具有如SEQ ID NO:1或SEQ ID NO:2的序列的寡核苷酸引物。
10.包含如权利要求1的DNA分子的载体。
11.如权利要求10的载体,其用于在产生阿卡糖的微生物中去除或改变天然的阿卡糖生物合成基因的方法中。
12.如权利要求11的载体,其特征在于其选自pGM160或相关的载体。
13.如权利要求10的载体,其特征在于其是一种表达载体而且该DNA分子可操纵地连接到一种启动子序列上。
14.如权利要求13的适合在宿主体内表达的载体,其中宿主选自大肠杆菌、枯草芽孢杆菌、链霉菌属、游动放线菌属、小瓶菌属和链孢子囊菌属的菌株、吸水链霉菌柠檬变种、淡青链霉菌以及黑曲霉、产黄青霉和啤酒酵母。
15.如权利要求13的载体,其适合在淡青链霉菌GLA.O或游动放线菌属中表达。
16.用如权利要求1所述的DNA分子或如权利要求10所述的载体转化的宿主细胞。
17.如权利要求16的宿主细胞,其特征在于其选自大肠杆菌、枯草芽孢杆菌、链霉菌属、游动放线菌属、小瓶1属和链孢子囊菌属的菌株、吸水链霉菌柠檬变种、淡青链霉菌以及黑曲霉、产黄青霉和啤酒酵母。
18.如权利要求17的宿主细胞,其特征在于其选自淡青链霉菌GLA.O和游动放线菌属。
19.可以通过表达如权利要求1的基因簇中的基因而获得的蛋白质混合物。
20.获得如权利要求19的蛋白质的方法,其特征在于:
(a)这些蛋白质在一种合适的宿主细胞内表达,并且
(b)得以分离。
21.如权利要求20的方法,其特征在于宿主细胞选自大肠杆菌、枯草芽孢杆菌、链霉菌属、游动放线菌属、小瓶菌属和链孢子囊菌属的菌株、吸水链霉菌柠檬变种、淡青链霉菌以及黑曲霉、产黄青霉和啤酒酵母。
22.如权利要求20的方法,其特征在于宿主细胞选自淡青链霉菌GLA.O和游动放线菌属。
23.探查出如权利要求1所述的阿卡糖生物合成基因簇的全部基因的方法,其特征在于
(a)应用来源于如权利要求1的DNA分子的杂交探针,通过杂交方法分离毗邻的基因组DNA区域,并且
(b)对这些DNA区域进行测序。
24.探查出如权利要求1的阿卡糖生物合成基因簇的全部基因的方法,其特征在于
(a)应用来源于如权利要求1的DNA分子的DNA序列的PCR引物和具有允许与所应用的载体系统的序列杂交的序列的引物,通过PCR方法将毗邻的基因组DNA区域分离,并且
(b)对这些DNA区域进行测序。
25.从除淡青链霉菌GLA.O以外的其它产生阿卡糖的微生物中分离生物合成阿卡糖和同源假寡糖的基因簇的方法,其特征在于由如权利要求1的重组DNA分子开始,
(a)制备杂交探针,
(b)用这些杂交探针从获自相应微生物的DNA文库中筛选基因组DNA或cDNA,并且
(c)分离和鉴定所获克隆。
26.从除淡青链霉菌GLA.O以外的其它产生阿卡糖的微生物中分离生物合成阿卡糖和同源假寡糖的基因簇的方法,其特征在于,由如权利要求1的重组DNA分子开始,
(a)制备PCR引物,
(b)用这些PCR引物从相应微生物中累积基因组DNA和cDNA的DNA片段,
(c)分离和鉴定所累积的片段,并且
(d)合适时用于如权利要求25的方法。
27.如权利要求25或26的一种方法,其特征在于微生物选自放线菌目、链霉菌属、游动放线菌属、小瓶菌属和链孢子囊菌属的菌株、吸水链霉菌柠檬变种和淡青链霉菌。
28.如权利要求27的方法,其特征在于微生物特别地选自淡青链霉菌GLA.O和游动放线菌属。
29.淡青链霉菌GLA.O用于获得阿卡糖的用途。
CNB971958858A 1996-06-07 1997-05-30 来自淡青链霉菌的假寡糖生物合成基因的分离及其应用 Expired - Fee Related CN1263855C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19622783A DE19622783A1 (de) 1996-06-07 1996-06-07 Isolierung der Biosynthesegene für Pseudo-Oligosaccharide aus Streptomyces glaucescens GLA.O und ihre Verwendung
DE19622783.6 1996-06-07

Publications (2)

Publication Number Publication Date
CN1223687A CN1223687A (zh) 1999-07-21
CN1263855C true CN1263855C (zh) 2006-07-12

Family

ID=7796342

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB971958858A Expired - Fee Related CN1263855C (zh) 1996-06-07 1997-05-30 来自淡青链霉菌的假寡糖生物合成基因的分离及其应用

Country Status (13)

Country Link
US (2) US6306627B1 (zh)
EP (1) EP0915981B1 (zh)
JP (1) JP2001507923A (zh)
CN (1) CN1263855C (zh)
AT (1) ATE346936T1 (zh)
AU (1) AU728870B2 (zh)
BR (1) BR9709658A (zh)
CA (1) CA2257111A1 (zh)
DE (2) DE19622783A1 (zh)
DK (1) DK0915981T3 (zh)
ES (1) ES2276427T3 (zh)
PT (1) PT915981E (zh)
WO (1) WO1997047748A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0796915A3 (de) * 1996-03-22 1999-04-14 Bayer Ag Verfahren zur Herstellung sowie zur Verwendung von Acarviosyl-Transferase bei der Umwandlung von Acarbose-Homologen in Acarbose, zur Herstellung von Acarbose-Homologen
DE19708127A1 (de) * 1997-02-28 1998-09-03 Bayer Ag Acarbose acb-Cluster: Isolierung von weiteren Genen der Acarbose Biosynthese und des Acarbose-Stoffwechsels aus Actinoplanes sp. SE 50/110 sowie deren Verwendung
KR100761340B1 (ko) 2005-02-28 2007-10-09 명지대학교 산학협력단 발리다마이신 생합성 유전자군의 염기서열, 이를 이용한알파-글루코시데이즈 억제물질 생산 균주의 제조 및알파-글루코시데이즈 억제물질의 대량생산방법
JP5645840B2 (ja) 2008-12-02 2014-12-24 株式会社Wave Life Sciences Japan リン原子修飾核酸の合成方法
JP5998326B2 (ja) 2009-07-06 2016-09-28 ウェイブ ライフ サイエンス リミテッドWave Life Sciences Ltd. 新規核酸プロドラッグおよびその使用方法
DK2620428T3 (da) 2010-09-24 2019-07-01 Wave Life Sciences Ltd Asymmetrisk hjælpegruppe
MX347361B (es) 2011-07-19 2017-04-12 Wave Life Sciences Ltd Metodos para la sintesis de acidos nucleicos funcionalizados.
WO2014010718A1 (ja) 2012-07-13 2014-01-16 株式会社新日本科学 キラル核酸アジュバント
KR102213609B1 (ko) 2012-07-13 2021-02-08 웨이브 라이프 사이언시스 리미티드 키랄 제어
DK2872485T3 (da) 2012-07-13 2021-03-08 Wave Life Sciences Ltd Asymmetrisk hjælpegruppe
WO2015108048A1 (ja) 2014-01-15 2015-07-23 株式会社新日本科学 抗腫瘍作用を有するキラル核酸アジュバンド及び抗腫瘍剤
EP3095460A4 (en) 2014-01-15 2017-08-23 Shin Nippon Biomedical Laboratories, Ltd. Chiral nucleic acid adjuvant having anti-allergic activity, and anti-allergic agent
EP3095461A4 (en) 2014-01-15 2017-08-23 Shin Nippon Biomedical Laboratories, Ltd. Chiral nucleic acid adjuvant having immunity induction activity, and immunity induction activator
SG10201912897UA (en) 2014-01-16 2020-02-27 Wave Life Sciences Ltd Chiral design
CN111187746B (zh) * 2018-11-15 2022-11-22 上海医药工业研究院 一种基因工程菌及其制备方法和应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE730029C (de) 1938-06-28 1943-01-06 Wilhelm O P Rieck G M B H Vorrichtung zum Verschliessen von Flaschen o. dgl.
DE2209834C3 (de) * 1972-03-01 1978-04-20 Bayer Ag, 5090 Leverkusen Herstellung von Saccharase-Inhibitoren
DE19507214A1 (de) * 1995-03-02 1996-10-31 Bayer Ag Acarbose-Biosynthesegene aus Actinoplanes sp., Verfahren zu ihrer Isolierung sowie ihre Verwendung

Also Published As

Publication number Publication date
EP0915981B1 (de) 2006-11-29
US6306627B1 (en) 2001-10-23
JP2001507923A (ja) 2001-06-19
DK0915981T3 (da) 2007-03-26
CA2257111A1 (en) 1997-12-18
AU3170197A (en) 1998-01-07
ES2276427T3 (es) 2007-06-16
DE19622783A1 (de) 1997-12-11
EP0915981A1 (de) 1999-05-19
AU728870B2 (en) 2001-01-18
DE59712773D1 (de) 2007-01-11
CN1223687A (zh) 1999-07-21
US6825013B2 (en) 2004-11-30
PT915981E (pt) 2007-02-28
US20020192793A1 (en) 2002-12-19
WO1997047748A1 (de) 1997-12-18
ATE346936T1 (de) 2006-12-15
BR9709658A (pt) 1999-08-10

Similar Documents

Publication Publication Date Title
CN1263855C (zh) 来自淡青链霉菌的假寡糖生物合成基因的分离及其应用
CN101044243A (zh) 类异戊二烯的生产方法
CN1415014A (zh) 通过基因扩增增加赖氨酸产量
CN1161461C (zh) 碱性磷酸酶在酵母中的表达
CN1882691A (zh) 对l-抗坏血酸进行微生物生产的方法
CN1847389A (zh) 生产l-赖氨酸的棒状菌和制备赖氨酸的方法
CN1329667A (zh) 在制备多肽的方法中有效的真菌转录激活因子
CN1875106A (zh) 重组微生物
CN1133594A (zh) 单纯性疱疹病毒-2ul26基因,衣壳蛋白,免疫测定和蛋白酶抑制剂
CN1668639A (zh) 涉及二酮哌嗪衍生物合成的多核苷酸和由所述多核苷酸编码的多肽
CN100347190C (zh) 编码rpsL基因的核苷酸序列
CN1514880A (zh) 生产依马菌素的方法和组合物
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1286973C (zh) 一种组蛋白甲基转移酶及其制备方法
CN1902218A (zh) 具有提高的果糖发酵能力的酵母菌株
CN1056189C (zh) 编码阿凡曼链霉菌支链α-酮酸脱氢酶复合物的基因
CN1192107C (zh) 从带小棒链霉菌分离的5s棒烷基因及其在棒酸生产中的应用
CN1496370A (zh) 分离的苛养木杆菌gum操纵子,分离的其核酸分子及它们的用途
CN1763086A (zh) 一个新的控制真菌菌落生长与致病力的ank蛋白及其编码基因与利用
CN1160370C (zh) 新的人细胞周期控制相关蛋白及其编码序列
CN1496401A (zh) 编码细胞分裂素合成相关蛋白质的基因
CN1170848C (zh) 新的人肝癌相关蛋白及其编码序列
CN1216989C (zh) 一种新的青霉素g酰化酶及其应用
CN1349560A (zh) 除虫菌素糖苷配基合成酶基因
CN1896226A (zh) 麦迪霉素高产菌株

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Applicant after: Awentis Medicines Deutschland GmbH

Applicant before: Hechester JSC

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: HOECHST AKTIENGESELLSCHAFT (DE) TO: AVENTIS PHARMACY (GERMANY)INTERNATIONAL CO., LTD.

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1020754

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060712

Termination date: 20130530