CN1198935C - 1,3-丙二醇的重组生产方法 - Google Patents

1,3-丙二醇的重组生产方法 Download PDF

Info

Publication number
CN1198935C
CN1198935C CNB97180074XA CN97180074A CN1198935C CN 1198935 C CN1198935 C CN 1198935C CN B97180074X A CNB97180074X A CN B97180074XA CN 97180074 A CN97180074 A CN 97180074A CN 1198935 C CN1198935 C CN 1198935C
Authority
CN
China
Prior art keywords
protein
seq
ala
leu
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB97180074XA
Other languages
English (en)
Other versions
CN1239511A (zh
Inventor
N·S·杜恩-科莱曼
M·狄茨-托里斯
M·W·查瑟
D·特里布尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Danisco US Inc
Original Assignee
Genencor International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genencor International Inc filed Critical Genencor International Inc
Publication of CN1239511A publication Critical patent/CN1239511A/zh
Application granted granted Critical
Publication of CN1198935C publication Critical patent/CN1198935C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S530/00Chemistry: natural resins or derivatives; peptides or proteins; lignins or reaction products thereof
    • Y10S530/82Proteins from microorganisms
    • Y10S530/823Lower fungi, e.g. mold
    • Y10S530/824Yeasts

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

本发明提供了一种用于生物中从多种碳源生产1,3-丙二醇的改进方法,包括含有编码脱水酶蛋白质X的DNA或者编码蛋白质X以及蛋白质1、蛋白质2和蛋白质3中至少一种的DNA的生物。蛋白质X可分离自二醇脱水酶或甘油脱水酶。本发明还提供了含有能够提高1,3-丙二醇产量的蛋白质X的宿主细胞。

Description

1,3-丙二醇的重组生产方法
相关申请
本发明是于1996年11月13日提交的美国临时申请60/030,601的部分继续申请,在此全部引入作为参考。
发明领域
本发明涉及分子生物学领域,并且特别地涉及用于在宿主细胞中生产1,3-丙二醇的改进的方法。特别地,本发明描述了宿主细胞中与1,3-丙二醇生产相关的基因簇的组分,包括蛋白质X,和蛋白质1、蛋白质2以及蛋白质3。尤其特别地本发明描述了为提高宿主细胞中1,3-丙二醇的产量之克隆基因的表达,该克隆基因分别编码或一起编码蛋白质X、蛋白质1、蛋白质2和蛋白质3。
背景
1,3-丙二醇是在聚酯纤维的生产以及聚氨基甲酸乙酯和环状化合物的制造中具有潜在用途的一种单体。
已知多种能产生1,3-丙二醇的化学路线。例如,在磷化氢,水,一氧化碳,氢和一种酸存在时,氧化乙烯可以经过丙烯醛的催化溶液相水合作用再被还原成1,3-丙二醇,或者在一氧化碳和氢气存在时,烃类如甘油可以被具有来自周期表VIII组原子的催化剂转化成1,3-丙二醇。虽然有可能用这些方法产生1,3-丙二醇,但它们昂贵而且产生含有环境污染物的废液。
了解1,3-丙二醇可以通过甘油发酵来生产已经超过一个世纪。已经发现了能产生1,3-丙二醇的细菌菌株,如柠檬酸杆菌属(Citrobacter),梭状芽孢杆菌属(Clostridium),肠杆菌属(Enterobacter),泥杆菌属(Ilyobacter),克雷伯氏菌属(Klebsiella),乳酸杆菌属(Lactobacillus)和暗杆菌属(Pelobacter)中的菌株。在研究过的每一种情况中,甘油经过两步酶催化的反应步骤被转化成1,3-丙二醇。第一步,脱水酶催化甘油转化成3-羟基丙醛(3-HP)和水(方程式1)。第二步,3-HP被NAD+-偶联的氧化还原酶还原成1,3-丙二醇(方程式2)。
                    (方程式1)
    (方程式2)
1,3-丙二醇不再被进一步代谢,因而以高浓度累积在基质中。总反应消耗一个辅助因子形式的还原单位,即还原型b-尼克酰胺腺嘌呤二核苷酸(NADH)被氧化成尼克酰胺腺嘌呤二核苷酸(NAD+)。
从甘油生产1,3-丙二醇通常在无氧条件下以甘油为唯一碳源并且无其它外源还原单位受体时进行。在这些条件下,在例如柠檬酸杆菌属,梭状芽孢杆菌属和克雷伯氏菌属的菌株中,可以经类似的途径加工甘油,首先涉及甘油被NAD+-(或NADP+-)偶联的甘油脱氢酶氧化成二羟丙酮(DHA)(方程式3)。DHA再被DHA激酶磷酸化成为磷酸二羟丙酮(DHAP)(方程式4),从而可用于生物合成以及帮助通过例如酵解过程的ATP的产生。
    (方程式3)
         (方程式4)
与1,3-丙二醇途径相比,此途径可以给细胞提供碳和能量,产生而不是消耗NADH。
肺炎克雷伯氏菌(Klebsiella pneumoniae)和弗劳地柠檬酸杆菌(Citrobacter freundii)中,编码功能相关的甘油脱水酶(dhaB)、1,3-丙二醇氧化还原酶(dhaT)、甘油脱氢酶(dhaD)和二羟丙酮激酶(dhaK)活性的基因被包括在dha调节子中。柠檬酸杆菌属和克雷伯氏菌属的dha调节子已在大肠杆菌(Escherichia coli)表达并且已表明能将甘油转化为1,3-丙二醇。甘油脱水酶(E.C.4.2.1.30)与二醇[1,2-丙二醇]脱水酶(E.C.4.2.1.28)相关但为不同基因编码的不同的酶。在鼠伤寒沙门氏菌(Salmonella typhimurium)和肺炎克雷伯氏菌中二醇脱水酶与pdu操纵子相关,见Bobik等人,1992,细菌学杂志(J.Bacteriol.)174:2253-2266和美国专利5,633,362。Tobimatsu等人,1996,生物化学杂志(J.Biol.Chem.)271:22352-22357公开了编码甘油脱水酶蛋白质X的已命名为ORF4的肺炎克雷伯氏菌基因;Seyfried等人,1996,细菌学杂志(J.Bacteriol.)178:5793-5796公开了编码蛋白质X的已命名为ORF4的弗劳地柠檬酸杆菌的甘油脱水酶基因。Tobimatsu等人,1995,生物化学杂志(J.Biol.Chem.)270:7142-7148公开了二醇脱水酶亚单位α,β和γ并证明了orf4的存在。Luers(1997,FEMS微生物学通讯154:337-345)公开了巴氏梭菌(Clostridium pasteurianum)的蛋白质1、蛋白质2和蛋白质3的氨基酸序列。
已知制备甘油的生物学过程。绝大多数甘油产生菌是酵母菌,其次已知一些细菌,真菌和藻类也产生甘油。细菌和酵母菌都通过糖酵解中的果糖-1,6-二磷酸途径或者Embden Meyerhof Parnas途径将葡萄糖或其它碳水化合物转化为甘油,而特定的藻类将叶绿体中溶解的二氧化碳或碳酸氢盐转化为卡尔文循环中的三碳中间物。经过一系列步骤,此三碳中间物磷酸甘油酸转化为甘油醛3-磷酸,甘油醛3-磷酸可以容易地互变为其酮式异构体磷酸二羟丙酮并最终转变成为甘油。
特别地,地衣芽孢杆菌(Bacillus licheniformis)和番茄乳酸杆菌(Lactobacillus lycopersica)可合成甘油,并且已发现耐盐藻类Dunaliella sp和Asteromonas gracilis中产生甘油起到抗外部高盐浓度的保护作用(Ben-Amotz等人,Experientia 38,49-52,(1982))。类似地,许多耐渗透压酵母菌以合成甘油作为保护方式。酵母属(Saccharomyces)的大多数菌株在乙醇发酵中产生一些甘油并且可以应用渗透压力生理性地提高其产量(Albertyn等人,分子细胞生物学(Mol.Cell.Biol.)14,4135-4144,(1994))。本世纪早期通过使用加入“引导剂”如亚硫酸盐或碱的酵母菌培养物进行甘油的商业化生产。通过失活复合物的形成,引导剂阻断或抑制了乙醛转化为乙醇;因而,过量的还原单位(NADH)可用于生产甘油或被引导向用于还原的DHAP以产生甘油。此方法受亚硫酸盐导致的酵母菌生长的部分抑制反应的局限。用碱通过另外的机制产生过量的NADH单位可以部分克服这一局限。在此情况下,碱起始了康尼扎罗(Cannizarro)不对称反应,从两个单位的乙醛产生乙醇和乙酸。
来自糖化酵母(Saccharomyces diastaticus)的编码甘油-3-磷酸脱氢酶的基因(DAR1,GPD1)已被克隆和测序(Wang等人,细菌学杂志(J.Bacteriol.)176,7091-7095,(1994))。将DAR1基因克隆进穿梭载体并用其转化大肠杆菌,结果表达产生了活性酶。Wang等人(出处同上)认识到DAR1受细胞渗透压环境的调节,但是并没有提出如何在重组生物中利用该基因提高1,3-丙二醇的产量。
其它的甘油3-磷酸脱氢酶已被分离:例如来自酿酒酵母(S.cerevisiae)的立体专一编号的甘油-3-磷酸脱氢酶已被克隆和测序(Larason等人,分子微生物学(Mol.Microbiol.)10,1101,(1993)),并且Albertyn等人,(分子细胞生物学(Mol.Cell.Biol.)14,4135-4144,(1994))描述了来自酿酒酵母的编码甘油-3-磷酸脱氢酶的GPD1的克隆。如Wang等人(出处同上),Larason等人和Albertyn等人都认识到此基因调节的渗透压敏感性,但都没有提出如何用此基因在重组生物中生产1,3-丙二醇。
关于G3PDH的蛋白质,已从酿酒酵母中分离了甘油-3-磷酸酶并且鉴定了该蛋白质由GPP1和GPP2基因编码(Norbeck等人,生物化学杂志(J.Biol.Chem.)271,13875,(1996))。类似于编码G3PDH的基因,GPP2表现出渗透压敏感性。
虽然生产甘油和1,3-丙二醇的生物学方法都已知,但从未证明过用一个单独的重组生物能完成整个过程。
由于化学过程需要高能量而生物学过程需要昂贵的起始物甘油,上述生产1,3-丙二醇的化学和生物学方法都不很适合于工业规模的生产。需要一种要求低能量输入和不昂贵的起始物质的方法。更受欢迎的方法需要一种能将基本碳源如碳水化合物或糖类转化为所需1,3-丙二醇终产物的微生物。
虽然期望有一种生物能将除甘油或二羟丙酮之外的可发酵碳源转化为1,3-丙二醇,已证明这一尝试中存在巨大的难度。例如,Gottschalk等人(EP 373 230)描述了氢供体如果糖或葡萄糖的存在会干扰用于生产1,3-丙二醇的大多数菌株,包括弗劳地柠檬酸杆菌、Clostridium autobutylicum、丁酸梭菌和肺炎克雷伯氏菌的生长。在甘油和果糖或葡萄糖的共发酵中产生1,3-丙二醇的短乳杆菌(Lactobacillus brevis)和布氏乳杆菌(Lactobacillus buchner),当供给甘油作为唯一碳源时不能生长,并且虽然已经证明休止细胞能代谢葡萄糖或果糖,但它们不能产生1,3-丙二醇(Veiga DA Cunha等人,细菌学杂志(J.Bacteriol.)174,1013(1992))。相类似,已证明一株供给甘油和乙酸时产生1,3-丙二醇的多养型泥杆菌(Ilyobacterpolytropus)不能从甘油之外的碳底物(包括果糖和葡萄糖)产生1,3-丙二醇(Steib等人,微生物学文献(Arch.Microbiol.)140,139(1984))。最后Tong等人(生物化学生物技术学应用(Appl.Biochem.Biotech.)34,149(1992))已证明当无外源甘油时,用编码甘油脱水酶的dha调节子转化的大肠杆菌从葡萄糖和木糖都不能产生1,3-丙二醇。
已报道了促进由甘油生产1,3-丙二醇的尝试,此过程包括能提供还原单位的辅助底物,一般为可发酵糖类。已要求了共发酵甘油和葡萄糖的弗劳地柠檬酸杆菌和肺炎克雷伯氏菌DSM 4270的休止细胞产量提高(Gottschalk等人,出处同上,以及Tran-Dinh等人,DE 3734764);但未要求共发酵甘油和葡萄糖的不产生1,3-丙二醇的肺炎克雷伯氏菌ATCC 25955的生长细胞(I-T.Tong,博士论文,University ofWisconsin-Madison(1992))。已报道重组大肠杆菌的甘油和葡萄糖或果糖的共发酵的产量提高;然而,无甘油时不产生1,3-丙二醇(Tong等人,出处同上)。在这些系统中,提供用于细胞维持和生长的能量和碳时,单一生物用碳水化合物作为产生NADH的来源。这些公开的内容表明糖类并不进入产生1,3-丙二醇的碳途径。没有外源的甘油来源时无论如何也不产生1,3-丙二醇。因而这些文献的内容清楚地表明用单一的生物从一种碳源生产1,3-丙二醇是不可能的。
在评价宿主细胞的1,3-丙二醇产生中蛋白质X的作用时,各文献的内容极为混乱。在得到基因信息之前,McGee等人,1982,生物化学生物物理学研究通讯(Biochem.Biophys.Res.Comm.)108:547-551报道来自肺炎克雷伯氏菌ATCC 8724的二醇脱水酶包含通过大小(60K、51K、29K和15K道尔顿)和N-末端氨基酸序列鉴定的四个亚单位。与McGee正好相反,Tobimatsu等人1996,出处同上,报道了来自同一生物的二醇脱水酶的克隆、测序和表达,并且未发现脱水酶与51K道尔顿多肽相关联的证据。Tobimatsu等人1996,出处同上,得出结论蛋白质X多肽不是甘油脱水酶的亚单位,与GenBank登记号U30903中描述的蛋白质X是甘油脱水酶的大亚单位相反。Seyfried等人,出处同上,报道orfZ(蛋白质X)3′末端192bp的缺失对酶活性无影响,并推论orfZ不编码脱水酶活性所需的亚单位。最后,Skraly,F.A.(1997,名为“改善的1,3-丙二醇发酵的代谢工程”的论文)公开,在一个重组ORF3(蛋白质X)被打断产生一个大的融合蛋白的实验中,甘油脱水酶活性丧失,而在另一个实验中,与ORF3为完整的对照相比从甘油生产的1,3-丙二醇降低,但甘油脱水酶活性未失去。
本发明要解决的问题是用一种重组生物从例如葡萄糖或其它糖类的廉价碳底物以商业上可行的量进行1,3-丙二醇的生物学生产。1,3-丙二醇的生物学生产要求以甘油作为两步连续反应的底物,反应中脱水酶(一般为辅酶B12依赖的脱水酶)将甘油转化为中间物3-羟基丙醛,3-羟基丙醛再被NADH(或NADPH)依赖的氧化还原酶还原为1,3-丙二醇。辅助因子需求的复杂性使在工业方法中利用完整细胞催化以将此反应程序用于1,3-丙二醇的生产成为必需。而且,为了使此过程在商业上可行,需要一种比甘油或二羟丙酮更廉价的原料并且需要达到高产量水平。葡萄糖和其它碳水化合物是合适的底物,但是如上所述,已知它们会干扰1,3-丙二醇的产生。因此还没有一种生物能将葡萄糖转化为1,3-丙二醇。
申请者已经解决了提出的问题并且本发明提供了用一种重组生物将可发酵碳源直接生物转化为1,3-丙二醇的方法。葡萄糖作为一种模式底物被采用并且生物转化适用于任何现有微生物。包含编码蛋白质X、蛋白质1、蛋白质2和蛋白质3以及其它与1,3-丙二醇产生相关的蛋白质之基因的微生物,能够以高产量和很好的选择性通过甘油降解途径将葡萄糖和其它糖类转化为1,3-丙二醇。另外,本发明可以普遍性地适用于任何易于转化为1)甘油、2)二羟丙酮或3)甘油的氧化状态的三碳化合物(如甘油3-磷酸)或4)二羟丙酮的氧化状态的三碳化合物(如磷酸二羟丙酮或甘油醛3-磷酸)的碳底物。
发明概述
本发明涉及从单一微生物生产1,3-丙二醇的改进方法。本发明部分建立在此未曾预料的发现上,即在包含至少一个编码脱水酶活性的基因并且能够产生1,3-丙二醇的微生物中,编码蛋白质X的基因的存在与脱水酶活性的体内再激活以及此微生物中1,3-丙二醇的产量提高有关。本发明还部分建立在此未曾预料的发现上,即在包含至少一个编码脱水酶活性的基因并且能够产生1,3-丙二醇的宿主细胞中,编码蛋白质X的基因和至少一个编码选自蛋白质1、蛋白质2和蛋白质3的一种蛋白质的基因的存在与脱水酶活性的体内再激活以及此微生物中1,3-丙二醇的产量提高有关。
因而,本发明提供了用能产生1,3-丙二醇的微生物来生产1,3-丙二醇的改进方法,所述微生物包含至少一种编码脱水酶活性的基因,此方法包含的步骤包括将编码蛋白质X的基因导入生物体产生转化的生物;然后在至少一种能在所述转化的宿主生物中被转化为1,3-丙二醇的碳源存在的情况下,并且在适合于产生1,3-丙二醇的条件下培养此转化的生物,其中碳源选自单糖、寡糖、多糖和一碳底物。
在一个优选实施方案中,改进了的生产1,3-丙二醇的方法还包括将至少一种编码选自蛋白质1、蛋白质2和蛋白质3的一种蛋白质基因导入生物体。此微生物还可以包括如下的至少一种(a)编码甘油-3-磷酸脱氢酶活性的基因;(b)编码甘油-3-磷酸酶活性的基因;和(c)编码1,3-丙二醇氧化还原酶活性的基因。编码脱水酶活性、蛋白质X、蛋白质1、2或3的基因或其它1,3-丙二醇产生所必需的基因可以稳定地存在于宿主细胞基因组中或存在于宿主微生物中的复制型质粒中。
此方法还任选地包括回收1,3-丙二醇的步骤。在本发明的一个方面,碳源是葡萄糖。
微生物选自柠檬酸杆菌属,肠杆菌属,梭状芽孢杆菌属,克雷伯氏菌属,气杆菌属(Aerobacter),乳杆菌属,曲霉属(Aspergillus),酵母属,裂殖酵母属(Schizosaccharomyces),接合酵母属(Zygosaccharomyces),毕氏酵母属(Pichia),克鲁维酵母属(Kluyveromyces),假丝酵母属(Candida),汉逊酵母属(Hansenula),德巴利酵母属(Debaryomyces),毛霉属(Mucor),球拟酵母属(Torulopsis),甲基细菌属(Methylobacter),埃希氏菌属(Escherichia),沙门氏菌属(Salmonella),芽孢杆菌属(Bacillus),链霉菌属(Streptomyces)和假单胞菌属(Pseudomonas)。
在一方面,蛋白质X衍生自甘油脱水酶基因簇,在另一方面蛋白质X衍生自二醇脱水酶基因簇。编码脱水酶活性的基因可能与此微生物同源或异源。在一个实施方案中,甘油脱水酶基因簇衍生自选自克雷伯氏菌属和柠檬酸杆菌属的生物。在另一个实施方案中,二醇脱水酶基因簇衍生自选自克雷伯氏菌属、梭状芽孢杆菌属和沙门氏菌属的生物。
在另一方面,本发明提供的重组微生物包含至少一个编码脱水酶活性的基因;至少一个编码甘油-3-磷酸酶的基因;和至少一个编码蛋白质X的基因,其中所述微生物能够从碳源产生1,3-丙二醇。碳源可以选自单糖、寡糖、多糖和一碳底物。在另一个实施方案中,此微生物还包含一个编码胞质甘油-3-磷酸脱氢酶的基因。在另一个实施方案中,此重组微生物还包含至少一个编码选自蛋白质1、蛋白质2和蛋白质3的蛋白质的基因。此微生物选自柠檬酸杆菌属,肠杆菌属,梭状芽孢杆菌属,克雷伯氏菌属,气杆菌属,乳杆菌属,曲霉属,酵母属,裂殖酵母属,接合酵母属,毕氏酵母属,克鲁维酵母属,假丝酵母属,汉逊酵母属,德巴利酵母属,毛霉属,球拟酵母属,甲基细菌属,埃希氏菌属,沙门氏菌属,芽孢杆菌属,链霉菌属和假单胞菌属。在一方面,蛋白质X衍生自甘油脱水酶基因簇,在另一方面蛋白质X衍生自二醇脱水酶基因簇。在一方面,脱水酶活性与所述微生物异源,而在另一方面脱水酶活性与所述微生物同源。
本发明也提供了在能够产生1,3-丙二醇并且含有至少一种脱水酶活性的基因的微生物中脱水酶活性的体内再激活的方法,包括将编码蛋白质X的基因导入所述微生物的步骤。此微生物选自柠檬酸杆菌属,肠杆菌属,梭状芽孢杆菌属,克雷伯氏菌属,气杆菌属,乳杆菌属,曲霉属,酵母属,裂殖酵母属,接合酵母属,毕氏酵母属,克鲁维酵母属,假丝酵母属,汉逊酵母属,德巴利酵母属,毛霉属,球拟酵母属,甲基细菌属,埃希氏菌属,沙门氏菌属,芽孢杆菌属,链霉菌属和假单胞菌属。
在一方面,编码脱水酶活性的基因与所述微生物异源,而在另一方面编码脱水酶活性的基因与所述微生物同源。在一个实施方案中,编码蛋白质X的基因衍生自甘油脱水酶基因簇,在另一个实施方案中,编码蛋白质X的基因衍生自二醇脱水酶基因簇。
本发明也提供了包含编码蛋白质X、蛋白质1、蛋白质2和蛋白质3的基因的表达载体和宿主细胞。
根据本发明的生产1,3-丙二醇方法的一个优点是与无编码蛋白质X的核酸的宿主细胞相比,编码蛋白质X的核酸存在时能产生1,3-丙二醇的宿主细胞中1,3-丙二醇的产量获得了未曾预料的提高。如后面所证明,含有编码dhaB 1、2和3以及蛋白质X的核酸的宿主细胞比含有编码dhaB 1、2和3但无编码蛋白质X的核酸的宿主细胞产生明显多的1,3-丙二醇。
本发明的另一个优点如后面所证明,是与无编码蛋白质X的核酸和编码蛋白质1、蛋白质2和蛋白质3中至少一种的核酸之宿主细胞相比,同时含有编码蛋白质X的核酸和编码蛋白质1、蛋白质2和蛋白质3中至少一种的核酸之产生1,3-丙二醇的宿主细胞获得了未曾预料的结果,宿主细胞的1,3-丙二醇产量提高。
本发明的生产方法的另一个优点如下所示,是与此微生物中编码蛋白质X的核酸存在相关的此微生物中脱水酶活性的体内再激活。
附图简述
图1阐明了质粒pHK28-26上的来自肺炎克雷伯氏菌的甘油脱水酶基因簇的组分(SEQ ID NO:19)。此图中,orfY编码蛋白质1,orfX编码蛋白质2,orfW编码蛋白质3。DhaB-X指蛋白质X。
图2A-2G阐明了肺炎克雷伯氏菌的甘油脱水酶蛋白质X(dhab4)(SEQ ID NO:59)的核苷酸和氨基酸序列。
图3阐明了肺炎克雷伯氏菌蛋白质1(SEQ ID NO:61)和弗劳地柠檬酸杆菌蛋白质1(SEQ ID NO:60)(图3中称为orfY)的氨基酸排列。
图4阐明了肺炎克雷伯氏菌蛋白质2(SEQ ID NO:63)和弗劳地柠檬酸杆菌蛋白质2(SEQ ID NO:62)(图4中称为orfX)的氨基酸排列。
图5阐明了肺炎克雷伯氏菌蛋白质3(SEQ ID NO:64)和弗劳地柠檬酸杆菌蛋白质3(SEQ ID NO:65)(图5中称为orfW)的氨基酸排列。
图6阐明了大肠杆菌DH5α细胞中质粒pHK28-26(包含dhaB亚单位1、2和3以及蛋白质X和编码蛋白质1、蛋白质2和蛋白质3的开放阅读框架)与pDT24(包含dhaB亚单位1、2和3以及蛋白质X)的原位再激活比较。
图7阐明了大肠杆菌DH5α细胞中质粒pM7(包含编码dhaB亚单位1、2和3以及蛋白质X的基因)与质粒pM11(包含编码dhaB亚单位1、2和3的基因)的原位再激活比较。
图8A-8E阐明了肺炎克雷伯氏菌二醇脱水酶基因簇蛋白质X的核酸序列(SEQ ID NO:66)和氨基酸序列(SEQ ID NO:67)。
图9阐明了用大肠杆菌FM5/pDT24(FM5的描述见Amgen专利US 5,494,816,ATCC保藏号53911)生产1,3-丙二醇的标准的10公升发酵。
图10阐明了阐明了用大肠杆菌DH5α/pHK28-26生产1,3-丙二醇的标准10升发酵。
生物保藏和序列表简述
包含有编码甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶),甘油脱水酶(dhaB),和1,3-丙二醇氧化还原酶(dhaT)的基因的转化的大肠杆菌W2042(包含大肠杆菌宿主W1485和质粒pDT20和pAH42)按照国际认证的为专利申请目的的微生物保藏的布达佩斯条约的条款于1996年9月26日被美国典型培养物保藏中心(ATCC)保藏,保藏号为ATCC 98188。
包容含有编码甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaT)的基因的质粒pMCK10、pMCK17、pMCK30和pMCK35的酿酒酵母YPH500按照国际认证的为专利申请目的的微生物保藏的布达佩斯条约的条款于1996年9月26日被ATCC保藏,保藏号为ATCC74392。
包容含有甘油脱水酶、蛋白质X、蛋白质1、2和3的克雷伯氏菌基因组约35kb的质粒pKP1的大肠杆菌DH5α按照布达佩斯条约的条款于1995年4月18日被ATCC保藏,保藏号为ATCC 69789。包容含有编码二醇脱水酶(包括蛋白质X)的克雷伯氏菌基因组一部分的质粒pKP4的大肠杆菌DH5α按照布达佩斯条约的条款于1995年4月18日被ATCC保藏,保藏号为ATCC 69790。
“ATCC”指的是位于12301 Parklawn Drive,Rockville,MD20852美国的美国典型培养物保藏中心国际保藏单位。命名是按照保藏物的保藏号。
发明详述
本发明涉及单一微生物中1,3-丙二醇的生产并且提供了于单一重组生物从可发酵碳源生产1,3-丙二醇的改进方法。此方法包括能产生1,3-丙二醇的一种微生物,此微生物含有编码脱水酶(dhaB)的同源或异源基因,至少一个编码蛋白质X的基因以及任选的至少一个编码选自蛋白质1、蛋白质2和蛋白质3中一种蛋白质的基因。任选地,此微生物含有至少一个编码甘油-3-磷酸脱氢酶、甘油-3-磷酸酶和1,3-丙二醇氧化还原酶(dhaT)的基因。将碳底物给予此重组微生物并从生长培养基中分离1,3-丙二醇。
本方法提供了可用于聚酯和其它聚合物生产的1,3-丙二醇单体的一种来源,其迅速、低廉而且无害于环境。
下列定义用于解释权利要求书和说明书。
术语“脱水酶基因簇”或“基因簇”指的是与宿主细胞中1,3-丙二醇的产生相关的一系列基因并且意在包括甘油脱水酶基因簇和二醇脱水酶基因簇。dha调节子指的是甘油脱水酶基因簇,见包含调节区域的图1。
术语“再生脱水酶活性”或“再激活脱水酶活性”指的是将无催化底物能力的脱水酶转化为有催化底物能力的脱水酶的现象,或者抑制脱水酶失活的现象,或者在体内延长脱水酶的有效半寿期的现象。
术语“甘油脱水酶”或“脱水酶”或“脱水酶活性”指的是起到能将甘油分子异构化或转化为产物3-羟基丙醛的酶活性作用的多肽。为本发明的目的,脱水酶包括优选底物分别为甘油和1,2-丙二醇的甘油脱水酶(GenBank U09771,U30903)和二醇脱水酶(GenBankD45071)。肺炎克雷伯氏菌ATCC 25955的甘油脱水酶被分别等同于SEQ ID NO:1、2和3的基因dhaB1、dhaB2和dhaB3编码。dhaB1、dhaB2和dhaB3基因分别编码甘油脱水酶的a、b和c亚单位。
短语“脱水酶基因簇的蛋白质X”或“dhaB蛋白质X”或“蛋白质X”指的是与图2所示肺炎克雷伯氏菌脱水酶基因簇的蛋白质X相类似的蛋白质或者图8所示肺炎克雷伯氏菌二醇脱水酶基因簇的蛋白质X相类似的蛋白质。优选地,与宿主生物中无蛋白质X的1,3-丙二醇产量相比,蛋白质X能够增加宿主生物中1,3-丙二醇的产量。“相类似”表示编码此蛋白质的DNA与编码相应于克雷伯氏菌dhaB1、dhaB2和dhaB3的克雷伯氏菌蛋白质X的DNA位于相同的结构位置,即编码蛋白质X的DNA位于编码dhaB1-B3的核酸的3′端,或者表示蛋白质X与克雷伯氏菌二醇或甘油脱水酶蛋白质X具有整体氨基酸序列相似性。本发明包括与肺炎克雷伯氏菌的甘油或二醇脱水酶或弗劳地柠檬酸杆菌的蛋白质X具有至少50%;或至少65%;或至少80%;或至少90%或至少95%相似性的蛋白质X分子。
术语“蛋白质X”内包括的是蛋白质X,也指的是来自柠檬酸杆菌属dha调节子的ORF Z(Seyfried M.1996,细菌学杂志(J.Bacteriol.)178:5793-5796)。本发明也包含来自任何微生物的蛋白质X的氨基酸变体,只要蛋白质X变体保持了其重要功能特征,此特征为与无蛋白质X的宿主生物的1,3-丙二醇产量相比能提高宿主生物的1,3-丙二醇产量。
编码甘油脱水酶活性以及蛋白质X的克雷伯氏菌基因组的一部分被转化进大肠杆菌,转化的大肠杆菌于1995年4月18日按照布达佩斯条约的条款被ATCC保藏并被命名为ATCC保藏号69789。编码二醇脱水酶活性以及蛋白质X的克雷伯氏菌基因组的一部分被转化进大肠杆菌,转化的大肠杆菌于1995年4月18日按照布达佩斯条约的条款被ATCC保藏并被命名为ATCC保藏号69790。
发现克雷伯氏菌甘油脱水酶蛋白质X位于SEQ ID NO:19的碱基9749-11572位,将dhaK的第一个碱基作为位置编号第1。编码蛋白质X的弗劳地柠檬酸杆菌(ATCC保藏号CFU09771)的核酸被发现位于位置11261至13072。
本发明包括被重组导入宿主生物并在质粒上进行复制的编码脱水酶蛋白质X的基因以及稳定维持在宿主基因组中的编码脱水酶蛋白质X的基因。本发明包括提高1,3-丙二醇产量的方法,其中编码蛋白质X的基因与编码脱水酶活性和/或产生1,3-丙二醇必需的基因一起被转化进宿主细胞。编码蛋白质X、脱水酶活性的基因和/或其它基因可以在相同或不同的表达盒中。或者,编码蛋白质X的基因可以分开进行转化,或者提前或落后于编码脱水酶活性和/或其它活性的基因。本发明包括含有编码蛋白质X的内源核酸的宿主细胞以及无编码蛋白质X的内源核酸的宿主细胞。
术语“蛋白质1”、“蛋白质2”和“蛋白质3”指的是微生物内编码的分别类似于蛋白质1(SEQ ID NO:60或SEQ ID NO:61)(也称为orfY),蛋白质2(SEQ ID NO:62或SEQ ID NO:63)(也称为orfX)以及蛋白质3(SEQ ID NO:64或SEQ ID NO:65)(也称为orfW)的蛋白质。
优选地,与宿主生物中无蛋白质X并且有蛋白质1、2和3中至少一种的1,3-丙二醇产量相比,宿主生物中有蛋白质X并且有蛋白质1、2和3中的至少一种能够增加宿主细胞中1,3-丙二醇的产量。类似于表示编码此蛋白质的DNA与编码各个蛋白质的DNA位于相同的结构位置,如图1所示,或者表示各个蛋白质与图3、4和5所示的各个SEQID NO具有整体序列氨基酸相似性。
本发明包括与SEQ ID NO:60或SEQ ID NO:61具有至少50%;或至少65%;或至少80%;或至少90%或至少95%相似性的蛋白质1分子。本发明包括与SEQ ID NO:62或SEQ ID NO:63具有至少50%;或至少65%;或至少80%;或至少90%或至少95%相似性的蛋白质2分子。本发明包括与SEQ ID NO:64或SEQ ID NO:65具有至少50%;或至少65%;或至少80%;或至少90%或至少95%相似性的蛋白质3分子。
术语“蛋白质1”、“蛋白质2”和“蛋白质3”分别包括来自巴氏梭菌的orfY、orfX和orfW(Luers等人,出处同上)以及与巴氏梭菌的orfY、orfX或orfW具有至少50%;或至少65%;或至少80%;或至少90%或至少95%相似性的分子。本发明也包括来自任何微生物的蛋白质1、2和3的氨基酸变体,只要结合蛋白质X的该变体保留了其重要的功能特征,所述特征为与无这些蛋白质的宿主生物的1,3-丙二醇产量相比能提高宿主生物的1,3-丙二醇产量。
本发明包括提高1,3-丙二醇产量的一种方法,其中编码蛋白质1、蛋白质2和蛋白质3中至少一种的基因与编码蛋白质X、脱水酶活性的基因和/或其它产生1,3-丙二醇必需的基因一起转化进宿主细胞。编码蛋白质1、2和3,蛋白质X,脱水酶活性的基因和/或其它基因可以位于相同或不同的表达盒。或者,编码蛋白质1、2和3中至少一种的基因可以分开进行转化,或者提前或落后于编码脱水酶活性和/或其它活性的基因。本发明包括具有编码蛋白质1、蛋白质2或蛋白质3的内源性核酸的宿主细胞以及无编码这些蛋白质的内源性核酸的宿主细胞。
术语“氧化还原酶”或“1,3-丙二醇氧化还原酶”指的是起到能将3-羟基丙醛还原为1,3-丙二醇的酶活性作用的多肽。1,3-丙二醇氧化还原酶包括例如dhaT基因(GenBank U09771,U30903)编码的多肽并且被命名为SEQ ID NO:4。
术语“甘油-3-磷酸脱氢酶”或“G3PDH”指的是起到能将磷酸二羟丙酮(DHAP)转化为甘油-3-磷酸的酶活性作用的多肽。在体内G3PDH可以是NADH-,NADPH-,或FAD依赖的。此酶活性的实例包括:NADH依赖的酶(EC 1.1.1.8)被包括GPD1(GenBank Z74071×2)或GPD2(GenBank Z35169×1)或GPD3(GenBankG984182)或DAR1(GenBank Z74071×2)的几种基因编码;NADPH依赖的酶(EC 1.1.1.94)被gpsA(GenBank U32164,G466746(cds 197911-196892),和L45246)编码;以及FAD依赖的酶(EC 1.1.99.5)被GUT2(GenBank Z47047×23)或glpD(GenBank G147838)或glpABC(GenBank M20938)编码。
术语“甘油-3-磷酸酶”或“sn-甘油-3-磷酸酶”或“d,l-甘油磷酸酶”或“G3P磷酸酶”指的是起到催化甘油-3-磷酸转化为甘油的酶活性作用的多肽。G3P磷酸酶包括例如GPP1(GenBank Z47047×125)或GPP2(GenBank U18813×11)编码的多肽。
术语“甘油激酶”指的是依据反应条件,起到催化甘油转化为甘油-3-磷酸或催化甘油-3-磷酸转化为甘油的酶活性作用的多肽。甘油激酶包括例如GUT1(GenBank U11583×19)编码的多肽。
术语“GPD1”、“DAR1”、“OSG1”、“D2830”和“YDL022W”可以被互换使用并且指编码胞质甘油-3-磷酸脱氢酶,以SEQ ID NO:5的碱基序列为特征的基因。
术语“GPD2”指的是编码胞质甘油-3-磷酸脱氢酶并且以SEQ IDNO:6的碱基序列为特征的基因。
术语“GUT2”和“ YIL155C”可以被互换使用并且指编码线粒体甘油-3-磷酸脱氢酶并且以SEQ ID NO:7的碱基序列为特征的基因。
术语“GPP1”、“RHR2”和“YIL053W”可以被互换使用并且指编码胞质甘油-3-磷酸酶并且以称为SEQ ID NO:8的碱基序列为特征的基因。
术语“GPP2”、“HOR2”和“YER062C”可以被互换使用并且指编码胞质甘油-3-磷酸酶并且以SEQ ID NO:9的碱基序列为特征的基因。
术语“GUT1”指的是编码胞质甘油激酶并且以SEQ ID NO:10的碱基序列为特征的基因。
术语“功能”或“酶功能”指的是酶在改变特定化学反应所需能量中的催化活性。可以理解的是这样一种活性可以应用于处于平衡的反应,其中产物或底物的产生可以在合适的条件下完成。
术语“多肽”和“蛋白质”可被互换使用。
术语“碳底物”或“碳源”指的是能被本发明的宿主生物代谢的碳源,并且特别是选自单糖、寡糖、多糖,和一碳底物或其混合物的碳源。
术语“宿主细胞”或“宿主生物”指的是能接受外源或异源基因并表达这些基因以产生活性基因产物的微生物。
术语“外源基因”、“外源DNA”、“异源基因”和“异源DNA”指的是用多种方法置于宿主生物中的对于一种生物为天然带有的遗传物质。此目的基因可以是天然产生的基因、突变的基因或合成的基因。
术语“重组生物”和“转化的宿主”指的是已被异源或外源基因或同源基因的额外拷贝转化的任何生物。本发明的重组生物表达编码用于从合适的碳底物生产1,3-丙二醇的甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaB)的外源基因。
“基因”指的是表达特定蛋白质的核酸片段,包括位于编码区域之前(5′非编码区)和之后(3′非编码区)的调节序列。术语“天然的”和“野生型的”指的是对其本身的调节序列为天然的基因。
术语“编码”和“把……编码”指的是一个过程,通过此过程基因根据转录和翻译的机制产生氨基酸序列。可以理解的是此编码特定氨基酸序列的过程包括不导致编码的氨基酸改变的涉及碱基改变的DNA序列,或者涉及可能改变一或多个氨基酸,但不影响此DNA序列编码的蛋白质的功能特性的碱基改变的DNA序列。因此可以理解本发明所包括的多于特定的举例序列。序列的修饰,例如导致基本上不影响产生的蛋白质分子的功能特性的沉默突变之序列中的缺失、插入、或替换,也可以被考虑。例如,反映了遗传密码简并性或导致在给定位点产生化学上等同的氨基酸之基因序列的改变也加以考虑。因此,一种疏水性氨基酸丙氨酸的密码子可以被编码另一种疏水性较弱的残基如甘氨酸,或一种疏水性较强的残基如缬氨酸、亮氨酸或异亮氨酸的密码子替换。相类似,导致一种带负电荷的残基替换了另一种带负电荷的残基,例如天冬氨酸替换谷氨酸的替换,或者是一种带正电荷的残基替换了另一种带正电荷的残基,例如赖氨酸替换精氨酸的替换,也可以被认为是产生了生物学上等同的产物。导致蛋白质分子的N末端部分和C末端部分改变的核苷酸改变也不被认为会改变蛋白质的活性。在某些情况下,可能确实期望得到此序列的突变体用于研究改变对蛋白质生物学活性的影响。根据测定编码产物的生物学活性,每一种设计的修饰充分符合本领域的常规技术。而且,熟练的技术人员了解,本发明包括的序列也通过在严格的条件下(0.1×SSC,0.1%SDS,65℃)它们能与此处所举例的序列杂交的能力加以界定。
术语“表达”指的是从编码基因产物序列的基因转录和翻译成为基因产物。
术语“质粒”、“载体”和“盒”指的是经常携带不属于细胞的重要代谢部分的基因,并且通常以环状双链DNA分子的形式存在的染色体外元件单位。这种元件可以是衍生自任何来源的自主复制型序列、基因组整合序列、噬菌体或核苷酸序列、线状或环状的单链或双链的DNA或RNA,其中很多核苷酸序列已经被连接或重组进一个独特的构件,该构件能将启动子片段和用于选定的基因产物的DNA序列以及合适的3′非翻译序列导入细胞。“转化盒”指的是一个特定载体,此载体包含外源基因并且具有能促进对特定的宿主细胞进行转化的除外源基因以外的元件。术语“表达盒”指的是一个特定载体,此载体包含一个外源基因并且具有能容许此基因在外源宿主中提高表达的元件。
术语“转化”和“转染”指的是核酸整合以后细胞对新基因的接受。接受的基因可以被整合进染色体DNA或者以染色体外复制型序列被导入。术语“转化体”指的是转化的产物。
术语“遗传性改变的”指的是通过转化或突变改变遗传物质的方法。
术语“经分离的”指的是从至少一种与其天然相关的组分中分出的蛋白质或DNA序列。
术语“同源的”指的是在革兰氏阳性宿主细胞中天然的或天然地产生的蛋白质或多肽。本发明包括通过重组DNA技术产生同源蛋白质的微生物。
重组生物的构建
包含编码对将碳底物转化为1,3-丙二醇的酶途径必需基因的重组生物可以用本领域熟知的技术来构建。如实施例9所讨论的,编码克雷伯氏菌dhaB1、dhaB2、dhaB3和蛋白质X的基因被用于转化大肠杆菌DH5α,如实施例10所讨论的,编码克雷伯氏菌蛋白质1、2和3中至少一个的基因以及编码蛋白质X的至少一个基因被用于转化大肠杆菌。
从例如为克雷伯氏菌属或酵母属的天然宿主分离编码甘油-3-磷酸脱氢酶(G3PDH)、甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB),和1,3-丙二醇氧化还原酶(dhaT)的基因,并且用其转化宿主菌株,例如大肠杆菌DH5α、ECL707、AA200或W1485;酿酒酵母菌株YPH500或肺炎克雷伯氏菌菌株ATCC25955或ECL2106。
基因的分离
从细菌基因组获得所需基因的方法是普通的方法而且为分子生物学领域所熟知。例如,如果此基因的序列已知,可以用限制性内切核酸酶酶解来建立合适的基因组文库,并且可用互补探针与所需基因序列互补的方法对其进行筛选。一旦分离出此序列,可以用标准的引物引导的扩增方法如聚合酶链式反应(PCR)(U.S.4,683,202)以获得适合于用合适的载体进行转化的量的DNA。
或者,可以建立粘粒文库,其中大片段的基因组DNA(35-45kb)可以被包装在载体中并用于转化合适的宿主。粘粒载体的独特性在于其能容纳大量的DNA。通常,粘粒载体具有外源DNA包装和其后的环化所需的至少一份拷贝的cos DNA序列。除cos序列之外,这些载体也包含一个复制起点如ColE1和抗药性标记如抗氨苄青霉素或新霉素的基因。用粘粒载体转化合适的细菌宿主的方法在Sambrook等人,分子克隆:实验手册,第二版(1989)Cold Spring HarborLaboratory Press,Cold Sspring Harbon,NY(1989)中进行了详细描述。
对于克隆粘粒,一般用合适的限制性内切核酸酶分离和连接外源DNA使之邻近粘粒载体的cos区域。然后包含线性外源DNA的粘粒载体与DNA包装载体如细菌噬菌体I反应。在包装过程中cos位点被切开,外源DNA被包装进细菌病毒颗粒的头部。这些颗粒然后被用于转染适当的宿主细胞如大肠杆菌。一旦注入细胞,外源DNA在cos粘性末端的作用下环化。通过这种方式大片段的外源DNA可以被导入并在重组宿主细胞中表达。
编码甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaT)的基因的 分离和克隆
在本发明的上下文中,利用粘粒载体和粘粒转化方法以克隆来自已知含有能将甘油转化为1,3-丙二醇的基因之细菌菌株的大片段基因组DNA。特别地,用本领域熟知的方法分离肺炎克雷伯氏菌ATCC25955的基因组DNA,用限制性酶Sau3A将其酶切以插入粘粒载体Supercos1,用GigapackII包装提取物对其进行包装。然后用粘粒DNA转化构建的载体大肠杆菌XL1-Blue MR细胞。通过在甘油存在下培养细胞并分析基质中1,3-丙二醇的形成来筛选能将甘油转化为1,3-丙二醇的转化体。
分析了两个1,3-丙二醇阳性转化体,粘粒被命名为pKP1和pKP2。DNA测序显示与弗劳地柠檬酸杆菌的甘油脱水酶基因(dhaB)具有广泛的同源性,表明这些转化体包含编码甘油脱水酶基因的DNA。分析了其它的1,3-丙二醇阳性转化体,粘粒被命名为pKP4和pKP5。DNA测序显示这些粘粒携带编码二醇脱水酶基因的DNA。
编码蛋白质X、蛋白质1、蛋白质2和蛋白质3的基因的分离
虽然本发明利用的是分离自克雷伯氏菌属粘粒的基因,其它的脱水酶基因和蛋白质X及蛋白质1、蛋白质2和蛋白质3的来源包括但不限于柠檬酸杆菌属,梭状芽孢杆菌属,和沙门氏菌属。Tobimatsu等人,1996,生物化学杂志(J.Biol.Chem.)271:22352-22357公开了肺炎克雷伯氏菌属的甘油脱水酶操纵子,其中蛋白质X被命名为ORF4;Seyfried等人,1996,细菌学杂志(J.Bacteriol.)178:5793-5796公开了弗劳地柠檬酸杆菌的甘油脱水酶操纵子,其中蛋白质X被命名为ORF Z。图8公开了克雷伯氏菌属的二醇脱水酶蛋白质X,图3、4和5公开了来自克雷伯氏菌属和柠檬酸杆菌属的蛋白质1、2和3的氨基酸序列。
编码G3PDH和G3P磷酸酶的基因
本发明提供了适合于在宿主细胞中表达G3PDH和G3P磷酸酶活性的基因。
已知编码G3PDH的基因。例如,GPD1已被从酵母属分离,并且具有编码SEQ ID NO:11给出的氨基酸序列的SEQ ID NO:5给出的碱基序列(Wang等人,出处同上)。相类似,G3PDH活性也已被从酵母属分离并由GPD2编码,GPD2具有编码SEQ ID NO:12给出的氨基酸序列的SEQ ID NO:6给出的碱基序列(Eriksson等人,分子微生物学(Mol.Microbiol)17,95,(1995))。
任何编码具有G3PDH活性多肽的基因都被认为适合于本发明的目的,其中此活性能催化磷酸二羟丙酮(DHAP)转化为甘油-3-磷酸(G3P)。而且,任何编码分别相应于基因GPD1、GPD2、GUT2、gpsA、glpD以及glpABC的亚单位的SEQ ID NO:11、12、13、14、15和16中任何一个给出的G3PDH氨基酸序列的基因都被认为能用于本发明,其中氨基酸序列包括不改变酶功能的氨基酸替换、缺失或添加。本领域技术人员知晓分离自其它来源的编码G3PDH的基因也适合应用于本发明。例如,从原核生物分离的GenBank保藏号为M34393,M20938,L06231,U12567,L45246,L45323,L45324,L45325,U32164和U39682的基因;从真菌分离的GenBank保藏号为U30625,U30876和X56162的基因;从昆虫分离的GenBank保藏号为X61223和X14179的基因;以及从哺乳动物来源分离的GenBank保藏号为U12424,M25558和X78593的基因。
已知编码G3P磷酸酶的基因。例如,GPP2已被从酿酒酵母分离,并且具有编码SEQ ID NO:17给出的氨基酸序列的SEQ ID NO:9给出的碱基序列(Norbeck等人,生物化学杂志(J.Biol.Chem)271,第13875页,1996)。
任何编码G3P磷酸酶活性的基因都被认为适用于本发明的目的,其中此活性能催化甘油-3-磷酸转化为甘油。而且,任何编码SEQ IDNO:33和17给出的G3P磷酸酶氨基酸序列的基因都被认为能用于本发明,其中氨基酸序列包括不改变酶功能的氨基酸替换、缺失或添加。技术人员认为分离自其它来源的编码G3P磷酸酶的基因也适合应用于本发明。例如,可以用一或多个下列普通或特定磷酸酶实现甘油-3-磷酸的脱磷酸化以产生甘油:碱性磷酸酶(EC 3.1.3.1)[GenBankM19159,M29663,U02550或M33965];酸性磷酸酶(EC 3.1.3.2)[GenBank U51210,U19789,U28658或L20566];甘油-3-磷酸酶(EC3.1.3.-)[GenBank Z38060或U18813×11];葡萄糖-1-磷酸酶(EC3.1.3.10)[GenBank M33807];葡萄糖-6-磷酸酶(EC3.1.3.9)[GenBank U00445];果糖-1,6-二磷酸酶(EC 3.1.3.11)[GenBankX12545或J03207]或磷酯酰甘油磷酸磷酸酶(EC 3.1.3.27)[GenBankM23546和M23628]。
已知编码甘油激酶的基因。例如,来自酵母属的编码甘油激酶的GUT1已被分离并测序(Pavlik等人,当代遗传学(Curr.Genet.)24,21,(1993)),并且编码SEQ ID NO:18给出的氨基酸序列的SEQ ID NO:10给出了其碱基序列。技术人员知晓虽然在天然条件下甘油激酶催化甘油的降解,但在合适的反应能量条件下同一种酶应能进行甘油的合成,将甘油-3-磷酸转化为甘油。存在通过甘油激酶产生甘油的证据。在无氧或抑制呼吸的条件下,布氏锥虫(Trypanosomabrucei)在甘油-3-磷酸和ADP存在时产生甘油。此反应发生于酵解酶体(D.Hammond,生物化学杂志(J.Biol.Chem.)260,15646-15654,(1985))。
宿主细胞
用于1,3-丙二醇重组生产的合适的宿主细胞可以为原核的或真核的,并且仅以宿主细胞表达活性酶的能力来限制。优选的宿主是一般应用于甘油或1,3-丙二醇的生产的那些,例如柠檬酸杆菌属,肠杆菌属,梭状芽孢杆菌属,克雷伯氏菌属,气杆菌属,乳杆菌属,曲霉属,酵母属,裂殖酵母属,接合酵母属,毕氏酵母属,克鲁维酵母属,假丝酵母属,汉逊酵母属,德巴利酵母属,毛霉属,球拟酵母属,甲基细菌属,埃希氏菌属,沙门氏菌属,芽孢杆菌属,链霉菌属和假单胞菌属。本发明中最优选的是大肠杆菌、克雷伯氏菌属的菌株以及酵母属的菌株。
腺苷钴胺素(辅酶B12)对于甘油脱水酶活性是一种重要的辅助因子。这种辅酶是已知的最复杂的非聚合天然产物,并且其体内合成通过应用约30种基因产物进行。在原核生物中发现了辅酶B12的合成,其中一些能够从头合成此化合物,而另一些能够进行部分反应。例如大肠杆菌不能形成咕啉环结构,但能够催化咕啉醇酰胺转化为类咕啉并且能引入脱氧腺苷基团。
真核生物不能从头合成辅酶B12,并且作为代替从细胞外环境转运进维生素B12,然后此化合物被细胞的酶转化为活性形式的化合物。已经描述了用于这一系列反应的三种酶的活性:1)水钴胺素还原酶(EC 1.6.99.8)将Co(III)还原为Co(II);2)钴(II)胺素还原酶(EC1.6.99.9)将Co(II)还原为Co(I);和3)钴(I)胺素腺苷转移酶(EC1.5.1.17)将5′脱氧腺苷部分从ATP转移到还原的类咕啉。最后一种酶的活性是三种当中表征最全面的一种,并且被鼠伤寒沙门氏杆菌的cobA、大肠杆菌的btuR和P.denitrificans的cobO编码。这三种钴(I)胺素腺苷转移酶基因已被克隆和测序。钴(I)胺素腺苷转移酶活性已在人成纤维细胞和分离的鼠线粒体中检测到(Fenton等人,生物化学生物物理学研究通讯(Biochem.Biophys.Res.Commun.)98,283-9,(1981))。涉及钴还原的两种酶表征不全面并且未得到基因序列。已有关于来自小眼虫(Euglena gracillus)的水钴胺素还原酶(Watanabe等人,生物化学生物物理学文献(Arch.Biochem.Biophys)305,421-7,(1993))以及来自鼠成纤维细胞的存在于微粒体和线粒体内膜部分的微粒体钴(II)胺素还原酶(Pezacka,(Biochem.Biophys.Acta)1157,167-77,(1993))的报道。
含维生素B12的补充培养基可以满足许多微生物中甘油脱水酶活性所需的辅酶B12的产生,但在一些情况下必需在体内另外补充或增加催化活性。真核生物中尤其需要增加了的辅酶B12合成。有了已发表的编码钴(I)胺素腺苷转移酶的基因序列,本领域的技术人员能够完成此基因的克隆和表达。例如,设想酵母如酵母属可以被如此构建,使其除了含有对将碳底物(如葡萄糖)转化为1,3-丙二醇的必需的基因以外,还含有编码钴(I)胺素腺苷转移酶的基因。用于钴还原反应的基因的克隆和表达需要另外的途径。这可以建立在筛选到以乙醇胺为唯一氮源进行生长的大肠杆菌的基础上。在辅酶B12存在时,乙醇胺裂解酶使细胞能在无其它氮源时生长。如果大肠杆菌细胞包含克隆的钴(I)胺素腺苷转移酶基因和来自另一种生物的随机克隆DNA,水钴胺素存在时在乙醇胺上的生长会被促进,并且如果随机克隆的DNA编码钴还原特性,应加以筛选以促进水钴胺素的腺苷化。
甘油脱水酶是一种多亚单位的酶,包含三个以a2b2g2构型排列的蛋白质组分(Seyfried等人,细菌学杂志(J.Bacteriol.)5793-5796(1996))。此构型是一种无活性的脱辅基酶,其结合一分子的辅酶B12后变成有催化活性的全酶。在催化反应中,全酶经过迅速的一级失活后变成无活性的复合物,其中辅酶B12已被转移给羟基钴胺素(Z.Schneider和J.Pawelkiewicz,( ACTA Biochim.Pol)311-328(1966))。甘油脱水酶与作为底物的甘油反应的化学计量分析表明在失活以前每分子的酶催化100,000个反应(Z.Schneider和J.Pawelkiewicz,(ACTA Biochim.Pol.)311-328)。在体外此失活复合物只能通过用镁和亚硫酸盐的强化学处理,去除羟基钴胺素,以另加的辅酶B12替换才能被再激活,(Z.Schneider等人,生物化学杂志(J.Biol.Chem.)3388-3396(1970))。野生型肺炎克雷伯氏菌中失活的甘油脱水酶可以在辅酶B12、腺苷5’-三磷酸(ATP)、和锰存在时在原位(甲苯化(toluenized)细胞)被再激活(S.Honda等人,细菌学杂志(J.Bacteriol.)1458-1465(1980))。已表明这种再激活是由于ATP依赖的用辅酶B12替换无活性的钴胺素(K.Ushio等人,维生素营养学杂志(J.Nutr.Sci.Vitaminol.)225-236(1982))。经原位催化ATP、锰和辅酶B12依赖的再激活处理的甲苯化细胞之细胞提取物就这种再激活而言是无活性的。因此,没有强化学还原处理或者细胞介导的失活辅助因子替换,每分子的甘油脱水酶只能催化100,000个反应。
本发明表明蛋白质X的存在对于体内脱水酶的再激活很重要,而且能产生1,3-丙二醇的宿主细胞在蛋白质X存在时其1,3-丙二醇产量提高。本发明也公开了与蛋白质X一起,蛋白质1、蛋白质2和蛋白质3的存在也提高了产生1,3-丙二醇的宿主细胞的1,3-丙二醇产量。
除大肠杆菌和酵母属外,克雷伯氏菌属也是尤其优选的宿主。已知肺炎克雷伯氏菌在以甘油为唯一碳源生长时产生1,3-丙二醇。认为克雷伯氏菌可以被遗传性改变以从单糖、寡糖、多糖或一碳底物产生1,3-丙二醇。
为了改造这些菌株,最好能提供携带受一或多个组成型或诱导型启动子控制的基因的克雷伯氏菌宿主,这些基因可以单独或一起促进磷酸二羟丙酮转化为甘油以及甘油转化为1,3-丙二醇。分别编码甘油-3-磷酸脱氢酶和甘油-3-磷酸酶的DAR1和GPP2基因的导入提供了克雷伯氏菌从合适的碳源产生1,3-丙二醇的遗传机制。
编码蛋白质X、蛋白质1、蛋白质2和蛋白质3或其它与1,3-丙二醇产生相关的酶基因(例如,G3PDH、G3P磷酸酶、dhaB和/或dhaT)可以被导入任何能在肺炎克雷伯氏菌中复制的质粒,或者它们可以被整合进肺炎克雷伯氏菌基因组。例如,已知肺炎克雷伯氏菌ATCC 25955和肺炎克雷伯氏菌ECL 2106对四环素或氯霉素敏感;因而可以用能在肺炎克雷伯氏菌中复制并且能编码对这两种抗生素的一种或全部抗性的质粒载体将这些基因导入肺炎克雷伯氏菌。用目的基因转化克雷伯氏菌的方法普通并且为本领域所熟知,合适的方案,包括合适的载体和表达技术见Sambrook,出处同上。
载体和表达盒
本发明提供了用于在合适的宿主细胞中克隆、转化和表达蛋白质X、蛋白质1、蛋白质2和蛋白质3以及其它与产生1,3-丙二醇相关的蛋白质(如G3PDH和G3P磷酸酶)的许多载体和转化以及表达盒。合适的载体是与所用细菌相适合的那些。合适的载体可以衍生自例如细菌、病毒(如噬菌体T7或M-13衍生的噬菌体)、粘粒、酵母或植物。获得和应用这些载体的方法为本领域的人所了解(Sambrook等人,分子克隆:实验手册(Molecular Cloning:A Laboratory Manual,Second Edition)卷1,2,3冷泉港实验室,冷泉港(Cold SpringHarbor Laboratory,Cold Spring Harbor,NY(1989))。
一般,载体或盒包含指导相关基因转录和翻译的序列、一个选择性标记以及容许自主复制或染色体整合的序列。合适的载体包含一个位于5’区域的包含控制转录起始的基因以及一个位于3’区域的控制转录终止的DNA片段。虽然可以理解的是该控制区域不必衍生自对于所选作为生产宿主的特定菌种为天然的基因,最优选的是两个控制区域都衍生自与转化的宿主细胞同源的基因。
对于本领域的技术人员,用于指导蛋白质X和蛋白质1、蛋白质2或蛋白质3在期望宿主细胞中表达的起始控制区域或启动子是大量而且熟悉的。实际上任何能驱动这些基因的启动子都适用于本发明,包括但不限于CYC1、HIS3、GAL1、GAL10、ADH1、PGK、PHO5、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI(用于在酵母属的表达);AOX1(用于在毕氏酵母属的表达);以及lac、trp、IPL、IPR、T7、tac、和trc(用于在大肠杆菌的表达)。
终止控制区域可以衍生自对优选宿主为天然的多种基因。或者,终止位点可以为非必需,但如果含有则为最优选的。
为了有效地表达此酶,编码此酶的DNA通过起始密码子有效地连接到选择的表达控制区域,这样表达导致了合适的信使RNA的形成。
为生产1,3-丙二醇目的之合适宿主的转化以及基因的表达
构建了合适的盒后用它们转化合适的宿主细胞。单独地或共同地包含dhaB活性、dhaB蛋白质X和至少一种蛋白质1、蛋白质2和蛋白质3以及任选的包括1,3-丙二醇氧化还原酶(dhaT)的盒的导入,可以用已知方法导入宿主细胞,例如转化(例如用钙渗透处理的细胞、电穿孔法)或利用重组噬菌体病毒的转染(Sambrook等人,出处同上)。在本发明中,用dhaB的亚单位1、2和3以及dha蛋白质X转化大肠杆菌DH5α。
另外,构建了包含编码甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)以及1,3-丙二醇氧化还原酶(dhaT)的大肠杆菌W2042(ATCC 98188)。另外,构建了包含质粒pMCK10、pMCK17、pMCK30和pMCK35的酿酒酵母YPH500(ATCC 74392),其包含编码甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(ahaB)以及1,3-丙二醇氧化还原酶(dhaT)的基因。上述的两种经转化的大肠杆菌和酵母菌都代表了本发明的优选的实施方案。
培养基和碳底物
本发明的发酵培养基必须包含合适的碳底物。合适的底物可以包括但不限于单糖如葡萄糖和果糖,寡糖如乳糖或蔗糖,多糖如淀粉或纤维素,或者其混合物,以及来自可再生原料如奶酪乳清液(cheesewhey permeate),玉米浸汁,甜菜糖浆和大麦麦芽。另外,碳底物也可以是一碳底物如二氧化碳,或者已被证明经过代谢转化成为关键的生物化学中间物的甲醇。已报道甲基营养型酵母(Yamada等人,农业生物化学(Agric.Biol.Chem.)53(2)541-543,(1989))以及细菌(Hunter等人,生物化学(Biochemistry)24,4148-4155,(1985))可从一碳来源(例如甲醇、甲醛或甲酸盐)产生甘油。这些生物能同化氧化状态从甲烷到甲酸盐的一碳化合物并且产生甘油。碳同化的途径可以经过核酮糖一磷酸、丝氨酸、或木酮糖一磷酸(Gottschalk,细菌代谢( Bacterial Metabolism)第二版,Springer-Verlag:New York(1086))。核酮糖一磷酸途径涉及甲酸盐与核酮糖-5-磷酸缩合形成六碳糖,再变成果糖,最后成为三碳产物甘油醛-3-磷酸。相类似,在丝氨酸途径中,同化的一碳化合物经过甲叉四氢叶酸进入糖酵解途径。
已知甲基营养型生物除了利用一碳和二碳底物外,还能利用许多其它的含碳化合物如甲胺、葡萄糖胺以及许多氨基酸用于代谢活动。例如,已知甲基营养型酵母能利用碳源甲胺形成海藻糖或甘油(Bellion等人,(Microb.Growth C1 Compd.),[Int.Symp.],7th(1993),415-32,编者:Murrell,J.Collin;Kelly,Don P,出版:Intercept,Andover,英国)。相类似,很多假丝酵母属的种类能够代谢丙氨酸或油酸(Sulter等人,微生物学文献(Arch.Microbiol.),153(5),485-9(1990))。因此,本发明利用的碳源包括很多种类的含碳底物,并且仅受宿主生物要求的限制。
虽然认为所有上述碳底物和其混合物都适用于本发明,优选的碳底物是单糖、寡糖、多糖,和一碳底物。更优选的是糖类如葡萄糖,果糖,蔗糖和一碳底物如甲醇和二氧化碳。最优选的是葡萄糖。
除了合适的碳源外,发酵培养基必须包含本领域技术人员熟知的合适的矿物质、盐类、辅助因子、缓冲剂和其它组分,这些成分适合培养物的生长并且能促进产生甘油所需要的酶催化途径。尤其被关注的是钴(II)盐和/或维生素B12或其前体。
培养条件
一般,在合适的培养基中30℃培养细胞。本发明中优选的培养基是普通的商业化制备的培养基如Luria Bertani(LB)培养基,Sabouraud Dextrose(SD)培养基或酵母粉麦芽汁提取物(YM)培养基。也可以用其它的特定或合成的培养基,用于特定微生物生长的合适的培养基应为微生物学或发酵学领域的技术人员熟知。反应基质中也可以加入已知能直接或间接调节降解物阻遏的物质,例如环腺苷2′:3′-一磷酸或环腺苷2′:5′-一磷酸。相类似,已知能调节酶活性并导致甘油产量提高的物质(例如亚硫酸盐、亚硫酸氢盐和碱)也可以与遗传操作一起使用或者作为其替代物。
用于发酵的合适的pH范围在pH5.0到pH9.0之间,其中pH6.0到pH8.0作为起始条件的优选范围。
反应可以在有氧或无氧条件下进行,其中优选无氧或微需氧条件。
分批和连续发酵
本方法用分批发酵的方法。经典的分批发酵是一个封闭的系统,其中基质的组分在发酵开始时确定并且在发酵过程中不进行人为的改变。因而,在发酵开始时基质中接种了所需的一种或多种生物,并且进行发酵时不向系统中再加入任何材料。然而一般,分批发酵是根据加入的碳源“批量”进行的,并且经常需要控制例如pH和氧浓度等因素。分批系统中的代谢物和生物量组分始终在改变直到发酵结束。在分批培养物中细胞经过稳定的迟滞期到达迅速生长的对数期,最后到达生长速率停止或暂停的静止期。如果不加以处理,静止期的细胞最后会死亡。通常处于对数期的细胞产生大量的终产物或代谢中间物。
标准的分批系统的变型之一是也适合于本发明的分批补料(Fed-Batch)发酵系统。在此标准分批系统的变型中,发酵进行时以增加的量加入底物。当降解物阻遏开始抑制细胞的代谢时以及期望基质中含有有限量的底物时,适合应用分批补料系统。难以测定分批补料系统中确切的底物浓度,因此根据可测量因素如pH、溶解氧和废气如CO2的分压进行估计。分批发酵和分批补料发酵普通并且为本领域所熟知,应用举例参见Brock,出处同上。
也认为此方法可适用于连续发酵。连续发酵是一个开放系统,其中在发酵进行中将特定的发酵基质连续加入到生物反应器中,同时取出等量的一定条件的基质。连续发酵通常保持培养物始终处于高密度,其中的细胞主要处于对数生长期。
连续发酵容许调节影响细胞生长或终产物浓度的一个或多个因素。例如,有一种方法保持有限的营养物如碳源或氮源的水平维持固定的比率而允许其它因素的改变。在其它系统中许多影响生长的因素可以持续变化,而根据基质浊度测定的细胞浓度维持恒定。连续发酵系统意在维持稳定的生长条件的状态,因而在发酵中由于取出基质导致的细胞损失与细胞生长比率保持平衡。连续发酵工艺中调整营养物和生长因素的方法以及将产物得率最大化的技术为工业微生物领域所熟知,并且很多方法被Brock,出处同上详细描述。
本发明可以采用分批、分批补料或连续发酵工艺并且任何已知形式的发酵都是可行的。另外,可以考虑将细胞作为完整细胞催化剂固定于底物上并经历适合生产1,3-丙二醇的发酵条件。
1,3-丙二醇生产途径中的改变
代表性的酶催化途径 从葡萄糖产生1,3-丙二醇可以用下面的一系列步骤完成。该系列代表了本领域技术人员了解的很多途径。在一系列步骤中葡萄糖被糖酵解途径的酶转化成磷酸二羟丙酮(DHAP)和3-磷酸甘油醛(3-PG)。然后通过DHAP水解形成二羟丙酮(DHA)后再被还原形成甘油,或者通过DHAP还原为甘油-3-磷酸(G3P)后再被水解都可形成甘油。水解步骤可以被任何种类的已知对其底物特异或非特异的细胞磷酸酶催化,或者可以通过重组将此活性引入宿主。还原步骤可以被NAD+(或NADP+)偶联的宿主酶催化,或者可以通过重组将此活性引入宿主。需要注意的是dha调节子包含一个催化方程式3所示可逆反应的甘油脱氢酶(E.C.1.1.1.6)。
                   (方程式1)
   (方程式2)
           (方程式3)
如上面详细描述的,甘油经过中间产物3-羟基丙醛(3-HP)转化为1,3-丙二醇。在由宿主编码的或可通过重组引入宿主的脱水酶催化下由甘油产生中间产物3-HP(方程式1)。此脱水酶可以是甘油脱水酶(E.C.4.2.1.30),二醇脱水酶(E.C.4.2.1.28),或任何其它能催化此转化反应的酶。甘油脱水酶,而不是二醇脱水酶,由dha调节子编码。在NAD+(或NADP+)偶联的宿主酶或者通过重组引入宿主的酶活性催化下从3-HP产生1,3-丙二醇(方程式2)。这一生产1,3-丙二醇的终反应可以被1,3-丙二醇脱氢酶(E.C.1.1.1.202)或其它乙醇脱氢酶催化。
影响碳途径的突变和转化
包含改变的1,3-丙二醇产生途径的多种突变体生物可以应用于本发明。将磷酸丙糖异构酶突变(tpi-)引入微生物是通过碳途径改良性状的突变之应用例子。或者,降低乙醇(adh)或乳酸盐(ldh)产生的突变能增加用于生产1,3-丙二醇的NADH产量。其它的糖酵解中甘油醛-3-磷酸之后的步骤如磷酸甘油酸变位酶(pgm)的突变可以用于促进碳进入1,3-丙二醇的产生途径。抑制PEP损失的影响葡萄糖转运系统如PTS的突变也证明是有用的。阻断1,3-丙二醇产生途径的中间产物的替代途径如甘油分解途径(glp)的突变也可以用于本发明。突变可以针对结构基因以降低或促进酶的活性,或者针对调节基因以调节酶活性的表达水平。
或者,转化可以与突变结合以控制特定的酶活性,从而提高1,3-丙二醇的产量。因此期望通过修饰完整细胞催化剂来提高1,3-丙二醇的产量均属于本发明的范围。
1,3-丙二醇的鉴定和纯化
从发酵基质中纯化1,3-丙二醇的方法为本领域熟知。例如,通过将反应混合物进行有机溶剂抽提、蒸馏和柱层析可以从细胞基质获得丙二醇(U.S.5,356,812)。用于此方法的尤其合适的有机溶剂是环己烷(U.S.5,008,473)。
通过对基质进行高压液相层析(HPLC)分析可以直接鉴定1,3-丙二醇。本发明优选的一种方法是用分析离子交换柱以无梯度形式的0.01N的硫酸为流动相分析发酵基质。
G3PDH和G3P磷酸酶的鉴定和纯化
用酶分析方法测量蛋白质G3PDH和G3P磷酸酶的表达水平,G3PDH活性分析依据DHAP转化为G-3-P反应中的辅助底物NADH的光谱性质。NADH具有固有的UV/可见光吸收并且其吸收可以在340nm用分光光度法检测。通过测定反应中释放的无机磷酸的方法可以测定G3P磷酸酶的活性。最常用的检测方法是用可见光光谱分析测定兰色的钼磷酸铵复合物。
实施例
一般方法
磷酸化、连接和转化的步骤在本领域中众所周知。可在Sambrook等人,分子克隆:实验手册(Molecular Cloning:ALaboratory Manual,Second Edition)卷1,2,3冷泉港实验室,冷泉港(Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989))中找到适合用于下列实施例的技术。
适合细菌培养物维持和生长的材料和方法在本领域中众所周知。可在如普通细菌学方法手册( Manual of Methods for General Bacteriology)(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg G.和Briggs Phillips,编),美国微生物学协会,Washington,DC.(1994)或者Thomas D.Brock生物技术学:工业微生物学教科书,第二版,( Biotechnology:A Txetbook of Industrial Microbiology,SecongEdition)Sinayer Associates,Inc.,Sunderland,MA(1989)中找到适合用于下列实施例的技术。除非另外指明,所有用于细菌细胞生长和维持的试剂和材料可以从Aldrich Chemical(Milwaukee,WI),DIFCO实验室(Detroit,MI)、GIBCO/BRL(Gaithersburg,MD)或Sigma化学公司(St.Louis,MO)获得。
缩写的意思如下:“h”指小时,“min”指分钟,“sec”指秒,“d”指天,“mL”指毫升,“L”指升。
酶分析
用1,2-丙二醇为底物确定无细胞抽提物中甘油脱水酶的活性。基于醛与甲苯-2-噻唑酮腙的反应的此分析方法由Forage和Foster((Biochim.Biophys.Acta.),569,249(1979))描述。如Johnson和Lin,细菌学杂志(J.Bacteriol.),169,2050(1987)所描述,用1,3-丙二醇和NAD+为底物在溶液中或在平板胶中测定有时被称为1,3-丙二醇脱氢酶的1,3-丙二醇氧化还原酶的活性。如所描述的(R.M.Bell和J.E.Cronan,Jr.,生物化学杂志(J.Biol. Chem.)250:7153-8(1975)),在NADH或NADPH耗尽之后,用分光光度测定法测定NADH或NADPH依赖的甘油3-磷酸脱氢酶(G3PDH)的活性。
Honda等人(1980,甘油灭活的辅酶B 12依赖性酶、甘油脱水酶和二醇脱水酶的原位再激活细菌学杂志143:1458-1465)公开了测定脱水酶再激活的分析实验。
甘油-3-磷酸酶,GPP的分析
通过将抽提物与bis-Tris或MES和pH6.5的镁离子缓冲液中的有机磷酸底物孵育进行酶活性分析。使用的底物是l-a-甘油磷酸;d,l-a-甘油磷酸。分析中试剂的终浓度为:缓冲液(20mM bis-Tris或50mMMES);MgCl2(10mM);以及底物(20mM)。如果样品中总蛋白很少并且用酸终止反应无可见沉淀发生,则方便地在比色杯中分析样品。此方法包括在含20mM底物(50mL,200mM),50mM MES,10mM MgCl2,pH6.5缓冲液的比色杯中孵育酶样品。磷酸酶分析终体积为0.5mL。将含酶样品加到反应混合物中;混合比色杯内成分,然后将比色杯放置于T=37℃的循环水浴中5到10分钟,这取决于酶样品中磷酸酶活性范围是否为2到0.02U/mL。通过加入酸性钼酸盐试剂(0.4mL)终止酶反应。加入Fiske SubbaRow试剂(0.1mL)和蒸馏水(1.5mL)后,将溶液混合使之显色。10分钟后,用Cary 219 UV/可见分光光度计在660nm测样品的吸收值。将释放的无机磷酸盐的量与标准曲线比较,通过使用无机磷酸盐贮存液(0.65mM)和用终浓度范围从0.026到O.130mmol/mL的无机磷酸盐制备6个标准品制作标准曲线。
1,3-丙二醇的分离和鉴定
用HPLC监测甘油转化为1,3-丙二醇。用层析领域的技术人员可得的标准技术和材料进行分析。一种合适的方法应用使用UV(210nm)和RI检测的Waters Maxima 820 HPLC系统。将样品注射到装有Shodex SH-1011P前置柱(6mm×50mm)的Shodex SH-1011柱上(8mm×300mm,购自Waters,Milford,MA),温度控制在50℃,用0.01NH2SO4作为流动相,流速为0.5mL/min。当期望进行定量分析时,用已知量的三甲基乙酸作为外标制备样品。一般,甘油(RI检测)、1,3-丙二醇(RI检测)和三甲基乙酸(UV和RI检测)的滞留时间分别为20.67min、26.08min和35.03min。
GC/MS证实了1,3-丙二醇的产生。用GC/MS领域的技术人员可得的标准技术和材料进行分析。一种合适的方法利用与Hewlett Packard5971 Series质量选择性检测器(EI)和HP-INNOWax柱(长30m,内径0.25mm.,薄膜厚0.25微米)连接的Hewlett Packard 5890 Series II气相色谱仪。比较产生的1,3-丙二醇和真正的1,3-丙二醇的滞留时间和质谱(m/e:57,58)。
GC/MS的另一方法涉及样品的衍生化。将30uL浓缩的(70%v/v)高氯酸加入到1.0mL样品(例如,培养物上清)中。混合后,冷冻并冷冻干燥样品。双(三甲基甲硅烷基)三氟乙酰胺:吡啶为1∶1的混合物(300uL)加到冻干物质中,剧烈混合并于65℃静置1小时。离心清除样品的不溶性物质。得到的液体分配成两相,上层用于分析。用DB-5柱(48m,内径0.25mm,薄膜厚0.25um;获自J&WScientific)层析样品,并且比较得自培养物上清的1,3-丙二醇衍生物与得自真正标准品的滞留时间和质谱。TMS衍生的1,3-丙二醇的质谱含有205、177、130和115AMU的特征性离子。
实施例1:用粘粒DNA克隆和转化大肠杆菌宿主细胞以表达1,3-丙二醇 培养基
用合成S12培养基筛选有产生1,3-丙二醇的能力的细菌转化体。S12培养基含有:10mM硫酸铵,50mM磷酸钾缓冲液,pH7.0,2mMMgCl2,0.7mM CaCl2,50uM MnCl2,1uM FeCl3,1uM ZnCl2,1.7uM CuSO4,2.5uM CoCl2,2.4uM Na2MoO4和2uM盐酸硫胺。
用于生长和发酵的培养基A包括:10mM硫酸铵;50mMMOPS/KOH缓冲液,pH7.5;5mM磷酸钾缓冲液,pH7.5;2mMMgCl2;0.7mM CaCl2;50uM MnCl2;1uM ZnCl2;1.72uM CuSO4;2.53uM CoCl2;2.42uM Na2MoO4;2uM盐酸硫胺;0.01%酵母抽提物;0.01%酪蛋白水解物;0.8ug/mL维生素B12和50ug/mL氨苄青霉素。按要求培养基A补加0.2%甘油或0.2%甘油和0.2%D-葡萄糖。
细胞
肺炎克雷伯氏菌ECL2106(Ruch等,细菌学杂志,124,348(1075)),已知在文献中也为产气克雷伯氏菌或产气气杆菌,得自E.C.C.Lin(哈佛医学院,Cambridge,MA)并作为实验室培养物保藏。
肺炎克雷伯氏菌ATCC 25955购自美国典型培养物保藏中心(Rockville,MD)。
大肠杆菌DH5α购自Gibco/BRL并且用从肺炎克雷伯氏菌ATCC25955分离的含有编码甘油或二醇脱水酶基因的粘粒DNA将其转化。含有甘油脱水酶的粘粒被称为pKP1和pKP2,含有二醇脱水酶的粘粒被称为pKP4。被转化的DH5α细胞被称为DH5α-pKP1、DH5α-pKP2和DH5α-pKP4。
大肠杆菌ECL707(Sprenger等,普通微生物学杂志(J.Gen.Microbiol.),135,1255(1989))得自E.C.C.Lin(哈佛医学院,Cambridge,MA)并且相类似地用获自肺炎克雷伯氏菌的粘粒DNA将其转化。这些转化体被称为含有甘油脱水酶基因的ECL707-pKP1和ECL707-pKP2以及含有二醇脱水酶基因的ECL707-pKP4。
含有tpi基因突变的大肠杆菌AA200(Anderson等,普通微生物学杂志,62,329(1970))购自大肠杆菌基因储藏中心,耶鲁大学(New Haven,CT)并且用克雷伯氏菌的粘粒DNA将其转化以产生含有甘油脱水酶基因的重组体生物AA200-pKP1和AA200-pKP2以及含有二醇脱水酶基因的AA200-pKP4。
DH5α
用5mL LB培养基洗六个含有大约1000个菌落的经肺炎克雷伯氏菌DNA转染的大肠杆菌XL1-Blue MR的转化平皿并离心。沉淀细菌并将其重悬浮在5mL LB培养基+甘油中。将等量样品(50uL)接种于含有S12合成培养基以及0.2%甘油+每mL 400ng的B12+0.001%酵母抽提物+50氨苄青霉素的15mL试管中。用培养基将试管加满至顶部,并用石蜡膜封口并且于30℃孵育。48小时后观察到轻微浑浊。如上所述在78小时和132小时分析等量样品的产物分布,等量样品对于1,3-丙二醇为阳性,后一个时间点含有增加量的1,3-丙二醇。
分级稀释对于1,3-丙二醇的产生测试为阳性的细菌,并且涂布到LB-50氨苄青霉素(amp)平板上以分离单个菌落。为产生1,3-丙二醇的目的分离了48个单菌落并对其再次检测。从6个非依赖性菌落分离了粘粒DNA并且将其转化进大肠杆菌DH5α中。为产生1,3-丙二醇的目的再次检测转化体。进一步表征了两个转化体并称其为Dh5α-pKP1和DH5α-pKP2。
将一个获自pKP1的12.1kb的EcoRI-SalI片段亚克隆进pIBI31(IBI Biosystem,New Haven,CT),测序并称为pHK28-26(SEQ IDNO:19)。测序揭示了编码甘油脱水酶和调节作用必需基因的dha操纵子之相关开放阅读框架的基因座。参照SEQ ID NO:19,发现编码二羟基丙酮激酶的dhaK的开放阅读框架之片段位于1-399位碱基;发现编码甘油脱氢酶的dhaD的开放阅读框架之片段位于983-2107位碱基;发现编码抑制子的dhaR的开放阅读框架之片段位于2209-4134位碱基;发现编码1,3-丙二醇氧化还原酶的dhaT的开放阅读框架之片段位于5017-6180位碱基;发现编码甘油脱水酶α亚基的dhaB1的开放阅读框架之片段位于7044-8711位碱基;发现编码甘油脱水酶β亚基的dhaB2的开放阅读框架之片段位于8724-9308位碱基;发现编码甘油脱水酶γ亚基的dhaB3的开放阅读框架之片段位于9311-9736位碱基;以及发现编码未知功能蛋白质的dhaBX的开放阅读框架之片段位于9749-11572位碱基。
经获自肺炎克雷伯氏菌的包装粘粒DNA转染的大肠杆菌XL1-BlueMR之单菌落被接种进含200μL的S15培养基(硫酸铵,10mM;磷酸钾缓冲液,pH7.0,1mM;MOPS/KOH缓冲液,pH7.0,50mM;MgCl2,2mM;CaCl2,0.7mM;MnCl2,50uM;FeCl3,1uM;ZnCl2,1uM;CuSO4,1.72uM;CoCl2,2.53uM; Na2MoO4,2.42uM和盐酸硫胺,2uM)+0.2%甘油+400ng/mL维生素B12+0.001%酵母抽提物+50ug/mL氨苄青霉素的微滴定孔中。除微滴定孔外,也接种一块含有LB-50amp的主平皿。96小时后,取出100uL并在具有0.2微米尼龙膜过滤器的Rainin微离心管中离心。保留细菌并且对滤出物进行HPLC分析。筛选大约240个菌落后鉴定表明产生1,3-丙二醇的阳性菌落。鉴定了三个阳性菌落,其中两个在LB50-amp上生长而一个不能不能在其上生长。分离出在LB-50amp上生长的两个阳性菌落之一的单菌落并证实产生1,3-丙二醇,称之为pKP4。从含有pKP4的大肠杆菌菌株分离出粘粒DNA并且转化大肠杆菌菌株DH5α。证实称为DH5α-pKP4的非依赖性转化体能产生1,3-丙二醇。
ECL707
用相应于pKP1、pKP4其中之一或单独的Supercos载体的粘粒肺炎克雷伯氏菌DNA转化大肠杆菌菌株ECL707,并将其分别命名为ECL707-pKP1、ECL707-pKP2、ECL707-pKP4和ECL707-sc。ECL707中glpK、gld和ptsD是缺陷型的,其分别编码用于磷酸烯醇丙酮酸依赖性磷酸转移酶系统的二羟基丙酮的ATP依赖性甘油激酶、NAD+偶联的甘油脱氢酶和酶II。
将从LB50-amp平板上分离的20个均为粘粒转化的单菌落和5个单独的Supercos载体(阴性对照)转化的菌落转移到主LB-50amp平板上。为了确定这些分离物是否含有脱水酶活性也检测它们将甘油转化成1,3-丙二醇的能力。用无菌牙签将转化体转移到含有200uL补加了0.2%甘油或0.2%甘油加0.2%D-葡萄糖的培养基A之微量滴定板中。30℃孵育48小时后,用0.45微米尼龙过滤器过滤微量滴定板孔的内容物并对其进行HPLC层析。表1中给出了这些测试的结果。
表1由经转化的ECL707将甘油转化至1,3丙二醇
转化体            甘油 *           甘油加葡萄糖 *
ECL707-pKP1        19/20            19/20
ECL707-pKP2        18/20            20/20
ECL707-pKP4        0/20             20/20
ECL707-sc          0/5              0/5
*表示阳性分离物数目/测试的分离物总数
AA200
用相应于pKP1、pKP2、pKP4其中之一和单独的Supercos载体的粘粒肺炎克雷伯氏菌DNA转化大肠杆菌菌株AA200并将其分别命名为AA200-pKP1、AA200-pKP2、AA200-pKP4和AA200-sc。菌株AA200为磷酸丙糖异构酶缺陷型(tpi)。
如描述大肠杆菌菌株ECL707时所述,分离了每种粘粒转化的20个单菌落和5个空载体转化菌落并检测了它们将甘油转化为1,3-丙二醇的能力。表2给出了这些测试的结果。
表2由经转化的AA200将甘油转化至1,3丙二醇
转化体           甘油 *           甘油加葡萄糖 *
AA200-pKP1        17/20            17/20
AA200-pKP2        17/20            17/20
AA200-pKP4        2/20             16/20
AA200-sc          0/5              0/5
*表示阳性分离物数目/测试的分离物总数
实施例2:重组体大肠杆菌利用DAR1、GPP2、dhaB和dhaT将D-葡
                   萄糖转化成1,3-丙二醇
构建用于大肠杆菌转化的一般目的之表达质粒
表达载体pTaclQ
大肠杆菌表达载体pTaclQ含有插入到pBR322的EcoRI的laclq基因(Sutcliffe等,(Cold Spring Harb.Symp.Quant.Biol.)43,77(1979))(Farabaugh,自然(Nature)274,5673(1978)和tac启动子(Amann等,基因(Gene)25,167(1983)。多克隆位点和终止子序列(SEQ ID NO:20)取代了pBR322的从EcoRI到SphI的序列。
甘油脱水酶基因的亚克隆(dhaB1,2,3)
使用引物(SEQ ID NO:21和22)通过PCR从pHK28-26扩增dhaB3基因的开放阅读框架(在5′末端引入了一个EcoRI位点以及在3′末端引入了一个XbaI位点)。将产物亚克隆进pLitmus29(NewEngland Biolab,Inc.,Beverly,MA)以产生含有dhaB3的质粒pDHAB3。
使用限制性酶KpnI和EcoRI将包含获自pHK28-26的dhaB操纵子之4个基因的完整编码区域的区域克隆进pBluescriptII KS+(Stratagene,La Jolla,CA)以构建质粒pM7。
通过用ApaI和XbaI(删除部分dhaB3和所有的dhaBX)酶解含有dhaB(1,2,3,4)的质粒pM7去除dhaBX基因。纯化所得的5.9kb片段并将其与获自质粒pDHAB3的325-bp ApaI-XbaI片段连接(恢复dhaB3基因)以建立含有dhaB(1,2,3)的pM11。
使用引物(SEQ ID NO:23和SEQ ID NO:24)通过PCR从pHK28-26扩增dhaB1基因的开放阅读框架(在5′末端引入了一个HindIII位点和一个共有RBS核糖体结合位点以及在3′末端引入了一个XbaI位点)。将产物亚克隆进pLitmus28(New England Biolab,Inc.)以产生含有dhaB1的质粒pDT1。
将获自含有dhaB1基因、dhaB2基因和dhaB3基因的一部分的pM11之NotI-XbaI片段插入pDT1以建立dhaB表达质粒pDT2。将含有获自pDT2的dhaB(1,2,3)基因之HindIII-XbaI片段插入pTaclQ以建立pDT3。
1,3-丙二醇脱氢酶基因(dhaT)的亚克隆
将含有完整1,3-丙二醇脱氢酶(dhaT)基因的pHK28-26之KpnI-SacI片段亚克隆进pBluescriptII KS+得到了pAH1。使用合成引物(SEQ ID NO:25以及SEQ ID NO:26)从作为模板DNA的pAH1用PCR扩增dhaT基因(在5′末端引入了一个XbaI位点以及在3′末端引入了一个BamHI位点)。将产物亚克隆进pCR-Script(Stratagene)的SrfI位点产生含有dhaT的质粒pAH4和pAH5。质粒pAH4含有用于从pCR-Script中lac启动子开始表达的正确方向的dhaT基因,pAH5含有反方向的dhaT基因。将获自含有dhaT基因的pAH4之XbaI-BamHI片段插入pTaclQ产生质粒pAH8。将获自含有RBS和dhaT基因的pAH8之HindIII-BamHI片段插入pBluescript KS+建立pAH11。将获自含有RBS、dhaT基因和终止子的pAH8之HindIII-SalI片段插入pBluescriptII SK+建立pAH12。
dhaB(1,2,3)和dhaT的表达盒的构建
使用标准分子生物学方法从上述单独dhaB(1,2,3)和dhaT亚克隆组装dhaB(1,2,3)和dhaT的表达盒。将获自含有RBS、dhaT基因和终止子的pAH8之SpeI-KpnI片段插入pDT3的XbaI-KpnI位点以建立pAH23。去除pAH23的dhaB3和dhaT基因之间的SmaI-EcoRI片段以建立pAH26。用含有获自pDT2的EcoRI位点之SpeI-NotI片段取代pAH26的SpeI-NotI片段以产生pAH27。
dhaT和dhaB(1,2,3)表达盒的构建
使用标准分子生物学方法从前述单独的dhaB(1,2,3)和dhaT亚克隆组装dhaT和dhaB(1,2,3)的表达盒。将含有获自pDT3的dhaB(1,2,3)基因之SpeI-SacI片段插入pAH11的SpeI-SacI位点以建立pAH24。
用于增加大肠杆菌中甘油产量的甘油3-磷酸酶的克隆和表达
酿酒酵母的染色体Vλ克隆6592(Gene Bank,保藏号# U18813×11)得自ATCC。使用合成引物(SEQ ID NO:27以及SEQ IDNO:28)从作为靶DNA的λ克隆通过PCR克隆方法克隆到甘油3-磷酸磷酸酶(GPP2)基因(在5 ′末端引入了一个BamHI-RBS-XbaI位点以及在3′末端引入了一个SmaI位点)。将产物亚克隆进pCR-Script(Stratagene)的SrfI位点以产生含有GPP2的质粒pAH15。质粒pAH15含有对于从pCR-Script SK+中lac启动子表达为无活性方向的GPP2基因。将获自含有GPP2基因的pAH15之BamHI-SmaI片段插入pBlueScriptII SK+以产生质粒pAH19。PAH19含有对于从lac启动子表达为正确方向的GPP2基因。将获自含有GPP2基因的pAH19之XbaI-PstI片段插入pPHOX2以建立质粒pAH21。
用于表达dhaT、dhaB(1,2,3)和GPP2基因的质粒
将一个SalI-EcoRI-XbaI接头(SEQ ID NO:29和30)插入用限制性酶SalI-XbaI酶解的pAH5以产生pDT16。接头破坏了XbaI位点。然后将获自pDT16的1kb之SalI-MluI片段插入pAH24,取代了现存的SalI-MluI片段以建立pDT18。
将含有获自pDT18的dhaT和dhaB(1,2,3)之表达盒的4.1kb EcoRI-XbaI片段和含有获自pAH21的GPP2基因之1.0kb的XbaI-SalI片段插入用限制性酶EcoRI和SalI酶解的载体pMMB66EH(F*ste等,基因(GENE),48,119(1986))以建立pDT20。
用于在大肠杆菌中过量表达DAR1的质粒
使用合成引物(SEQ ID NO:46以及SEQ ID NO:47)从酿酒酵母基因组DNA通过PCR克隆分离DAR1。成功的PCR克隆在DAR1 5′末端引入一个NcoI位点,NcoI内的ATG是DAR1的起始甲硫氨酸。在DAR1的3’端翻译终止子之后引入一个BamHI位点。用NcoI+BamHI酶解PCR片段并将其克隆进表达质粒pTrc99A(Pharmacia,Piscataway,New Jersey)内的相同位点以产生pDAR1A。
为了在DAR1的5′末端建立更好的核糖体结合位点,将通过合成引物(SEQ ID NO:48以及SEQ ID NO:49)退火得到的一个SpeI-PBS-NcoI接头插入pDAR1A的NcoI位点以建立pAH40。质粒pAH40含有对于从Trc99A(Pharmacia)的trc启动子表达为正确方向的新RBS和DAR1基因。将获自pDAR1A的NcoI-BamHI片段和通过合成引物(SEQ IDNO:31以及SEQ ID NO:32)退火得到的第二套SpeI-RBS-NcoI接头插入pBluescript II-SK+(Stratagene)的SpeI-BamHI位点以建立pAH41。构件pAH41含有氨苄青霉素抗性基因。将获自pDAR1A的NcoI-BamHI片段和通过合成引物(SEQ ID NO:31以及SEQ ID NO:32)退火得到的第二套SpeI-RBS-NcoI接头插入pBC-SK+(Stratagene)的SpeI-BamHI位点以建立pAH42。构件pAH42含有氯霉素抗性基因。
DAR1和GPP2的表达盒的构建
使用标准分子生物学方法从上述单独的DAR1和GPP2亚克隆组装DAR1和GPP2的表达盒。将含有RBS和GPP2基因的获自pAH19之BamHI-PstI片段插入pAH40以建立pAH43。将含有RBS和GPP2基因的获自pAH19之BamHI-PstI片段插入pAH41以建立pAH44。将含有RBS和GPP2基因的获自pAH19之相同的BamHI-PstI片段插入pAH42以建立pAH45。
如下改造位于GPP2 5′末端的核糖体结合位点。将由合成引物GATCCAGGAAACAGA以及CTAGTCTGTTTCCTG与含有GPP2基因的获自pAH19之XbaI-PstI片段退火得到的BamHI-RBS-SpeI接头插入pAH40的BamHI-PstI位点以建立pAH48。质粒pAH48含有对于从Trc99A(Pharmacia,Piscataway,N.J.)的trc启动子表达为正确方向的DAR1基因、改造的RBS和GPP2基因。
大肠杆菌菌株的构建
大肠杆菌W1485是野生型K-12菌株(ATCC 12345)。用质粒pDT20和pAH42转化此菌株并在补加了50mg/mL羧苄青霉素和10mg/mL氯霉素的LA(Luria Agar,Difco)平板上对其进行选择。
从葡萄糖产生1,3-丙二醇
将大肠杆菌W1485/pDT20/pAH42从平板转移到50mL培养基中,每升培养基含有:22.5g葡萄糖,6.85g K2HPO4,6.3g(NH4)2SO4,0.5g NaHCO3,2.5g NaCl,8g酵母抽提物,8g胰蛋白胨,2.5mg维生素B12,2.5mL改进的Balch微量元素溶液,50mg羧苄青霉素和10mg氯霉素,终pH6.8(HCl),然后过滤除菌。在普通和分子细菌学方法( Methods for General and Molecular Bacteriology)(P.Gerhardt等人,编,158页,美国微生物学协会,Washington,DC(1994))中能找到改进的Balch微量元素溶液的组分。在37℃,300转/分孵育6小时后,加入0.5g葡萄糖和IPTG(终浓度=0.2mM)并且转速降到100转/分。通过GC/MS分析样品。24小时后,W1485/pDT20/pAH42产生1.1g/L的甘油和195mg/L的1,3-丙二醇。
实施例3:dhaB和dhaT在酿酒酵母中的克隆和表达
为4个dha基因的每一个都构建了能作为复制游离基因元件存在的表达质粒。对于所有的表达质粒来说存在酵母ADH1启动子,并通过含有一种或多种限制性内切酶识别位点的DNA片段与酵母ADH1转录终止子分开。每个表达质粒也含有用于在含有氨苄青霉素的培养基上筛选大肠杆菌的β-半乳糖苷酶基因、用于在大肠杆菌中维持质粒的复制起点以及用于在酿酒酵母中维持的2微米(micron)的复制起点。酵母使用的并且存在于表达质粒上的选择性营养标记为下列之一:编码咪唑甘油磷酸脱水酶的HIS3基因、编码乳清酸核苷5’-磷酸脱羧酶的URA3基因、编码N-(5’-磷酸核苷)-邻氨基苯甲酸异构酶的TRP1基因和编码β-异丙基苹果酸脱氢酶的LEU2。
使用在5’末端引入了EcoRI位点的引物(对于dhaT、dhaB3、dhaB2、dhaB1分别为SEQ ID NO:38与SEQ ID NO:39、SEQ ID NO:40与SEQ ID NO:41、SEQ ID NO:42与SEQ ID NO:43、SEQ ID NO:44与SEQ ID NO:45)通过PCR从pHK28-26(SEQ ID NO:19)扩增dhaT、dhaB3、dhaB2和dhaB1的开放阅读框架(10mM Tris pH8.3,50mMKCl,1.5mM MgCl2,0.0001%明胶,200mM dATP,200mM dCTP,200mM dGTP,200mM dTTP,1mM每种引物,1-10ng靶DNA,25单位/mLAmplitaq* DNA聚合酶(Perkin-Elmer Cetus,Norwalk CT))。PCR参数是94℃1分钟,55℃1分钟,72℃1分钟,35个循环。将产物亚克隆进pHIL-D4(Phillips Petroleum,Bartlllesville,OK)的EcoRI位点以产生分别含有dhaT、dhaB3、dhaB2和dhaB1的质粒pMP13、pMP14、pMP20和pMP15。
dhaB1表达质粒pMCK10的构建
用HindIII酶解7.8kb的复制型质粒pGADGH(Clontech,Palo Alto,CA),经去磷酸化并与获自pMP15的dhaB1之HindIII片段连接。得到的质粒(pMCK10)含有对于从ADH1启动子开始的转录为正确方向的dhaB1并含有LEU2标记。
dhaB2表达质粒pMPCK17的构建
用HindIII酶解质粒pGADGH(Clontech,Palo Alto,CA)并通过与HindIII-XmnI和EcoRI-XmnI接头(New England Biolabs,Beverly,MA)连接将单链末端变为EcoRI末端。带有正确EcoRI末端的质粒的选择可通过如下方法实现:与获自质粒pUC4K(Pharmacia Biotech,Uppsala)的EcoRI片段上的卡那霉素抗性基因连接,转化进大肠杆菌菌株DH5α并用含有25mg/mL卡那霉素的LB平板选择。用SnaBI和EcoRI酶解得到的质粒(pGAD/KAN2)并且分离含ADH1启动子的1.8kb片段。用SnaBI和EcoRI酶解质粒pGBT9(Clontech,Palo Alto,CA),并且通过用SnaBI和EcoRI酶解使1.5kb的ADH1/GAL4片段被从pGAD/KAN2分离到的1.8kb的ADH1启动子片段取代。得到的载体(pMCK11)是含ADH1启动子和终止子以及TRP1标记的酵母中的复制型质粒。用EcoRI酶解质粒pMCK11,将其去磷酸化并与获自pMP20的dhaB2之EcoRI片段连接。得到的质粒(pMCK17)有对于从ADH1启动子开始的转录为正确方向的dhaB2并含有TRP1标记。
dhaB3表达质粒pMCK30的构建
用NaeI和PvuII酶解质粒pGBT9(Clontech)并且将1kb的TRP1基因从该载体中除去。TRP1基因被获自质粒pRS406(Stratagene)的称为1.7kb之AatII/NaeI片段的URA3基因取代以产生中间载体pMCK32。在1.5kb的SnaBI/EcoRI片段上将pMCK32上存在的截短的ADH1启动子去除,并用获自质粒pGAD/KAN2的1.8kb之SnaBI/EcoRI片段上的全长ADH1启动子将其取代以产生载体pMCK26。使用pMCK26上单一EcoRI位点插入带有质粒pMP14的dhaB3的EcoRI片段而产生pMCK30。pMCK30复制型表达质粒有对于从ADH1启动子开始的表达为正确方向的dhaB3并且有URA3标记。
dha表达质粒pMCK35的构建
用NaeI和PvuII酶解质粒pGBT9(Clontech)并且将1kb的TRP1基因从该载体中除去。TRP1基因被获自质粒pRS403(Stratagene)的称为XmnI/NaeI片段的HIS3基因取代以产生中间载体pMCK33。在1.5kb的SnaBI/EcoRI片段上将存在于pMCK33上的截短的ADH1启动子去除并用获自质粒pGAD/KAN2的1.8kb之SnaBI/EcoRI片段上的全长ADH1启动子将其取代以产生载体pMCK31。使用pMCK31上的单一EcoRI位点插入带有质粒pMP13的dhaT的EcoRI片段而产生pMCK35。PMCK35复制型表达质粒有对于从ADH1启动子开始的表达为正确方向的dhaT并且有HIS3标记。
用dha表达质粒转化酿酒酵母
使用Frozen-EZ酵母转化试剂盒(Catalog# T2001)(ZymoResearch,Orange,CA)用1-2mg质粒DNA转化购自Stratagene(La Jolla,CA)的酿酒酵母株YPH500(ura3-52 lys2-801 ade2-101 trp1-D63 his3-D200 leu2-D1)(Sikorski R.S.和Hieter P.,遗传学(Genetics)122,19-27,(1989))。用补加了一种或多种如下附加物的补充基础培养基(SMM-0.67%的无氨基酸酵母氮基质,2%葡萄糖)于29℃培养菌落3-4天:硫酸腺嘌呤(20mg/L)、尿嘧啶(20mg/L)、L-色氨酸(20mg/L)、L-组氨酸(20mg/L)、L-亮氨酸(30mg/L)、L-赖氨酸(30mg/L)。将菌落在选择性平板上划线并将其接种于液体培养基。
dha基因的酿酒酵母转化体的筛选
使用对每个基因特异的引物(SEQ ID NO:38-45)用PCR方法分析获自URA+、HIS+、TRP+、LEU+转化体的染色体DNA。证实了所有4个开放阅读框架的存在。
dhaB和dhaT活性在经转化的酿酒酵母中的表达
用体外酶分析证明了有活性的甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaT)的存在。另外,western印迹分析实验证实了从所有4个开放阅读框架表达的蛋白质。
将用质粒pMCK10、pMCK17、pMCK30和pMCK35转化的酵母株YPH500接种于含有0.67%的无氨基酸酵母氮基质、2%葡萄糖、20mg/L硫酸腺嘌呤和30mg/L L-赖氨酸的补充基础培养基。将细胞匀浆并分析抽提物的dhaB活性。对于甘油脱水酶得到0.12单位/mg蛋白质的比活性,以及对于1,3-丙二醇氧化还原酶得到0.024单位/mg蛋白质的比活性。
实施例4:使用重组体酿酒酵母从D-葡萄糖产生1,3-丙二醇
将含有质粒pMCK10、pMCK17、pMCK30和pMCK35的酿酒酵母YPH500在BiostatB发酵罐(B Braun Biotech,Inc.)中培养,最初的1.0L基础培养基含有20g/L葡萄糖、6.7g/L无氨基酸的酵母氮基质、40mg/L硫酸腺嘌呤和60mg/L L-赖氨酸·HCl。在生长过程中,加入另外的酵母氮基质等同物、腺嘌呤和赖氨酸。用另外加入的10%磷酸和2M NaOH将发酵罐控制在pH5.5,30℃以及通过搅拌控制保持40%的溶解氧压力。38小时后,离心收集细胞(OD600=5.8AU)并将其重新悬浮在基础培养基(6.7g/L的无氨基酸酵母氮基质,20mg/L硫酸腺嘌呤,30mg/L L-赖氨酸·HCl,以及50mM磷酸钾缓冲液,pH7.0)。
在无光和无氧气(氮气喷雾)存在下,在10mL卷缩的血清瓶中制备存在于总体积为4mL的补加了0.5%葡萄糖,5ug/mL辅酶B12和0、10、20或40mM氯喹的基础培养基中的含细胞(OD600=20AU)反应混合物,于30℃振摇孵育。30小时后,取出等量样品并进行HPLC分析。结果见表3。
表3利用重组酿酒酵母生产1,3-丙二醇
反应    氯奎(mM)  1,3-丙二醇(mM)
1         0          0.2
2         10         0.2
3         20         0.3
4         40         0.7
实施例5:使用dhaB和dhaT整合进基因组的酿酒酵母双重转化体从 D-葡萄糖生产1,3-丙二醇
实施例5预言性地证明了用dhaB1、dhaB2、dhaB3和dhaT转化酿酒酵母以及将这些基因稳定地整合进酵母基因组以从葡萄糖产生1,3-丙二醇。
表达盒的构建
为在酿酒酵母中进行这些基因的葡萄糖诱导的高水平组成性表达,构建了4个表达盒(dhaB1、dhaB2、dhaB3和dhaT)。这些表达盒由以下组成:(i)获自酿酒酵母株S288C的磷酸甘油酯激酶(PGK)启动子;(ii)基因dhaB1、dhaB2、dhaB3或dhaT其中之一;以及(iii)获自酿酒酵母株S288C的PGK终止子。使用通过重叠延伸(overlapextension)(Horton等,生物技术(Bio Techniques),8:528-535,(1990))的基于PCR技术的基因剪切来重组DNA序列以产生用于最佳表达各个基因的这些无缝连接表达盒。这些表达盒被单独克隆进含有适合酵母表达质粒多盒克隆的限制性位点之合适载体(pLITMUS39)。
酵母整合载体的构建
构建用于将表达盒整合进酵母基因组的载体。这些载体含有以下元件:(i)被亚克隆进表达盒的多克隆区;(ii)用于选择稳定酵母转化体的单一标记;(iii)允许转化酵母前在大肠杆菌中进行基因操作的复制起点和选择性标记。一个整合载体含有URA3营养缺陷型标记(YIp352b),而另一个整合载体含有LYS2营养缺陷型标记(pKP7)。
酵母表达质粒的构建
将dhaB1和dhaB2的表达盒亚克隆进YIp352b(表达质粒#1)的多克隆区,并将dhaB3和dhaT的表达盒亚克隆进pKP7(表达质粒#2)的多克隆区。
用表达质粒转化酵母
使用Frozen-EZ酵母转化试剂盒(Zymo Research,Orange,CA)用表达质粒#1转化酿酒酵母(ura3,lys2),并在缺乏尿嘧啶的平板上选择转化体。染色体DNA的PCR分析证实了dhaB1和dhaB2表达盒的整合。使用Frozen-EZ酵母转化试剂盒用表达质粒#2再次转化选择出来的转化体,并在缺乏赖氨酸的平板上选择双重转化体。染色体DNA的PCR分析证实了dhaB3和dhaT表达盒的整合。染色体DNA的PCR分析证实了双重转化体中所有4个表达盒(dhaB1、dhaB2、dhaB3和dhaT)的存在。
产生于双重转化酵母的蛋白质
Western印迹分析证实了由获自双重转化酵母的dhaB1、dhaB2、dhaB3和dhaT编码的蛋白质的产生。
获自双重转化酵母的酶活性
用上面一般方法中所述的酶分析证实了获自双重转化酵母的有活性的甘油脱水酶和有活性的1,3-丙二醇脱氢酶。
用双重转化酵母生产1,3-丙二醇
如实施例4中所述基本上证明了双重转化酵母从葡萄糖生产1,3-丙二醇。
实施例6:构建含有DA1/GPP2或dhaT/dhaB1-3质粒并将其转化进
                      克雷伯氏菌属
肺炎克雷伯氏菌(ATCC25955)、肺炎克雷伯氏菌(ECL2106)和产酸克雷伯氏菌(K.oxytoca)(ATCC 8724)天然地对氨苄青霉素(最高150ug/mL)和卡那霉素(最高50ug/mL)有抗性,但对四环素(10ug/mL)和氯霉素(25ug/mL)敏感。因此,编码对后两个抗生素有抗性的复制质粒可能用于作为这些克雷伯氏菌菌株的克隆载体。成功地通过用中等拷贝数的质粒pBR322(New England biolabs,Beverly,MA)用电穿孔法将野生型肺炎克雷伯氏菌(ATCC25955)、葡萄糖去阻遏的肺炎克雷伯氏菌(ECL2106)和产酸克雷伯氏菌(ATCC 8724)转化为四环素抗性。该过程通过如下步骤完成:将10mL的过夜培养物接种于1L LB(1%(w/v)Bacto-胰胨(Difco,Detriot,MI),0.5%(w/v)Bacto-酵母抽提物(Difco)和0.5%(w/v)NaCl(Sigma,St.Louis,MO))中,培养物在37℃下孵育至OD600为0.5-0.7。细胞在冰上冷却,4000×g离心15分钟收集,并将其重新悬浮于1L无菌的10%冰冷甘油中。重复离心收集细胞并逐次悬浮于500mL、20mL和最后2mL无菌的10%冰冷甘油中。对于电穿孔法,将40uL细胞与1-2uL DNA在预冷的0.2cm小管中混合,使用BioRad基因脉冲仪(BioRad,Richmond,CA)以200Ω,2.5kV对其进行脉冲4-5毫秒。将1mL SOC培养基(2%(w/v)Bacto-胰胨(Difco),0.5%(w/v)Bacto-酵母抽提物(Difco),10mM NaCl,10mM MgCl2,10mM MgSO4,2.5mM KCl和20mM葡萄糖)加入到细胞中,并且在将悬浮液转移到17×100mm无菌聚丙烯试管之后,在37℃,225转/分下孵育培养物1小时。如所示,在选择性培养基上涂布等量样品。对获自非依赖性四环素抗性转化体的质粒DNA的分析显示出pBR322典型的限制性内切酶酶解模式,提示在含有四环素(10ug/mL)的LB中37℃过夜培养后载体可稳定维持。因而,该载体和衍生物例如编码氨苄青霉素、四环素和氯霉素抗性的pBR329(ATCC 37264)可被用来将DAR1/GPP2和dhaT/dhaB1-3表达盒导入肺炎克雷伯氏菌和产酸克雷伯氏菌中。
基于DAR1和GPP2基因的已知DNA序列,可通过PCR介导的扩增从酿酒酵母基因组得到它们。然后在一个或多个可被用于指导它们在含葡萄糖的培养基中表达的启动子控制下将其转化进肺炎克雷伯氏菌和产酸克雷伯氏菌。为了方便,从通过用PvuII限制性内切酶酶解质粒pAH44得到的2.4kb的DNA片段中得到这些基因,籍此这些基因已排列在表达盒中并且受大肠杆菌lac启动子的控制。将该DNA片段连接到经PvuII酶解的pBR329上,导致其氯霉素抗性基因的插入失活。使用连接的DNA转化大肠杆菌DH5α(Gibco,Gaithersberg,MD)。根据它们的四环素(10ug/mL)抗性选择转化体并筛选它们对氯霉素(25ug/mL)的敏感性。对获自四环素抗性、氯霉素敏感转化体的质粒DNA的分析证实了期望的质粒的存在,质粒中Plac-dar1-gpp2表达盒以任一方向被亚克隆进pBR329的PvuII位点。如所述通过电穿孔法分别将这些称为pJSP1A(顺时针方向)和pJSP1B(逆时针方向)的质粒转化进肺炎克雷伯氏菌(ATCC 25955)、肺炎克雷伯氏菌(ECL2106)和产酸克雷伯氏菌(ATCC 8724)。根据重组体的四环素(10ug/mL)抗性对其进行选择并筛选其对氯霉素(25ug/mL)的敏感性。对分离自非依赖性转化体的质粒的限制性分析显示了仅有期望的酶解模式,并证实了37℃下进行抗生素选择性时它们可以被稳定地保持。在生长培养基中加入IPTG(0.2-2.0mM)可增强DAR1和GPP2基因的表达。
基于4个肺炎克雷伯氏菌的dhaB(1-3)和dhaT基因的已知DNA序列,可通过PCR介导的扩增从肺炎克雷伯氏菌基因组得到这些基因。然后在一个或多个可用于指导这些基因在含葡萄糖培养基中表达的启动子控制下将它们转化进肺炎克雷伯氏菌。为了方便,从通过用KpnI/SacI限制性内切酶酶解质粒pAH24得到的大约4.0kb的DNA片段中获得这些基因,籍此这些基因已排列在表达盒中并且受大肠杆菌lac启动子的控制。将该DNA片段与经类似酶解的pBC-KS+(Strategene,LaJolla,CA)连接并将其用于转化大肠杆菌DH5α。根据转化体的氯霉素(25ug/mL)抗性对其进行选择,并在含X-gal的LB琼脂上筛选其白色菌落表型。获自表明为白色菌落的抗氯霉素转化体质粒DNA的限制性分析证实了期望的被称为PJSP2质粒的存在,其中dhaT-dhaB(1-3)基因被亚克隆进该质粒,在大肠杆菌lac启动子的控制下。
为了促进葡萄糖转化为1,3-丙二醇,通过电穿孔法分别将该质粒转化入已含有Plac-dar1-gpp2表达盒的肺炎克雷伯氏菌(ATCC25955)(pJSP1A)、肺炎克雷伯氏菌(ECL2106)(pJSP1A)和产酸克雷伯氏菌(ATCC 8724)(pJSP1A)。根据共转化体对四环素(10ug/mL)和氯霉素(25ug/mL)的抗性对其进行选择。对分离自非依赖性共转化体的质粒的限制性分析显示了期望的pJSP1A和pJSP2的酶解模式。培养基中加入IPTG(0.2-2.0mM)可增强DAR1、GPP2、dhaB(1-3)和dhaT基因的表达。
实施例7:肺炎克雷伯氏菌从葡萄糖产生1,3-丙二醇
为了用葡萄糖生产1,3-丙二醇,在不同条件下(见表4)将均用pJSP1A转化的肺炎克雷伯氏菌菌株ECL 2106和2106-47以及用pJSP1A和pJSP2转化的ATCC 25955培养于5L Applikon发酵罐中。如Bauer等,应用环境微生物学(Appl.Environ.Micraobiol.)56,1296(1990)中所述,菌株2104-47是得自氟乙酸盐/乳酸盐选择性平板的ECL 2106的耐氟乙酸盐衍生物。在每一种情况下,使用的培养基含有50-100mM磷酸钾缓冲液,pH7.5,40mM(NH4)2SO4,0.1%(w/v)酵母抽提物,10μM CoCl2,6.5μM CuCl2,100μM FeCl3,18μMFeSO4,5μM H3BO3,50μM MnCl2,0.1μM Na2MoO4,25μMZnCl2,0.82mM MgSO4,0.9mM CaCl2和10-20g/L葡萄糖。另外加入葡萄糖,使剩余的葡萄糖保持过量。温度控制在37℃,并且用5N KOH或NaOH将pH控制在7.5。为了维持质粒加入合适的抗生素;也加入指定浓度的IPTG(异丙基-b-D-巯基半乳糖吡喃糖苷)。对于无氧发酵,反应器中喷入0.1vvm氮气;当dO设置点为5%时,反应器中喷入1vvm空气并且在培养基中补加维生素B12。最终浓度和总产量(g/g)见表4。
表4肺炎克雷伯氏菌从葡萄糖生产1,3-丙二醇
生物 dO     IPTG,mM 维生素B12,mg/L     效价g/L     产率g/g
25955[pJSP1A/pJSP2] 0     0.5     0     8.1     16%
25955[pJSP1A/pJSP2] 5%     0.2     0.5     5.2     4%
2106[pJSP1A] 0     0     0     4.9     17%
2106[pJSP1A] 5%     0     5     6.5     12%
2106-47[pJSP1A] 5%     0.2     0.5     10.9     12%
实施例8:含有dar1、gpp2、dhaB和dhaT的重组肺炎克雷伯氏菌将 碳底物转化为1,3-丙二醇
A.不同的肺炎克雷伯氏菌重组菌株将D-果糖转化为1,3-丙二醇
将肺炎克雷伯氏菌(ATCC 25955 pJSP1A)、肺炎克雷伯氏菌(ATCC 25955 pJSP1A/pJSP2)、肺炎克雷伯氏菌(ATCC 2106pJSP1A)和肺炎克雷伯氏菌(ATCC 2106 pJSP1A/pJSP2)的单菌落从琼脂平板转移进分隔的培养试管中,在含有合适抗生素的Luria-Bertani(LB)培养基中传代培养过夜。50mL培养瓶中含有45mL过滤除菌的基础培养基,其称为LLMM/F,其中每升含有:10g果糖;1g酵母抽提物;50mmol磷酸钾,pH7.5;40mmol(NH4)2SO4;0.09mmol氯化钙;2.38mg CoCl2·6H2O;0.88mg  CuCl2·2H2O;27mgFeCL3·2H2O;5mg FeSO4·7H2O.0.31mg H3BO3;10mg MnCl2·4H2O;0.023mg Na2MoO4·2H2O;3.4mg ZnCl2;0.2gMgSO4·7H2O。对于利用任一单个质粒重组体的反应在培养基中加入10ug/mL的四环素;对于利用双重质粒重组体的反应加入10ug/mL四环素和25ug/mL氯霉素。在接种2mL传代培养物前培养基被充分喷入氮气。在某些培养瓶中加入终浓度为0.5mM的IPTG(I)。培养瓶加盖,然后在37℃,100转/分下在New Brunswick Series 25孵育箱/摇床中孵育。反应进行至少24小时或直到大部分碳底物转化为产物。HPLC分析样品。表5描述了不同的克雷伯氏菌重组体从果糖产生1,3-丙二醇(3G)的产量。
表5利用重组克雷伯氏菌从D-果糖生产1,3-丙二醇
                               [3G]
克雷伯氏菌菌株  培养基   转化
                               (g/L)
                                       产碳率%
2106 pBR329     LLMM/F    100    0       0
2106 pJSP1A     LLMM/F    50     0.66    15.5
2106 pJSP1A     LLMM/F+I  100    0.11    1.4
2106            LLMM/F    58     0.26    5
pJSP1 A/pJSP2
25955 pBR329    LLMM/F    100    0       0
25955 pJSP1A    LLMM/F    100    0.3     4
25955 pJSP1A    LLMM/F+I  100    0.15    2
25955           LLMM/F    100    0.9     11
pJSP1A/pJSP2
25955           LLMM/F+I  62     1.0     20
pJSP1A/pJSP2
B.肺炎克雷伯氏菌(ATCC 25955 pJSP1A/pJSP2)将不同的碳底物转化成1,3-丙二醇:
取肺炎克雷伯氏菌(ATCC 25955 pJSP1A/pJSP2)冰冻储存培养物的等量样品(0.1mL)转移到250mL带挡板培养瓶中的50mL种子培养基中。每升种子培养基含有:0.1mol NaK/PO4缓冲液,pH7.0;3g(NH4)2SO4;5g葡萄糖,0.15g MgSO4·7H2O,10mL 100X微量元素溶液,25mg氯霉素,10mg四环素和1g酵母抽提物。每升100X微量元素溶液含有:10g柠檬酸,1.5g CaCl2·2H2O,2.8g FeSO4·7H2O,0.39gZnSO4·7H2O,0.38g CuSO4·5H2O,0.2g CoCl2·6H2O和0.3gMnCl2·4H2O。用KOH或H2SO4将得到的溶液滴定到pH7.0。葡萄糖、微量元素、抗生素和酵母抽提物分开灭菌。种子接种物在35℃和250转/分培养过夜。
反应设计是半需氧的。系统由在留有铝箔条部分开口的125mL密封培养瓶中的130mL反应培养基组成。每升反应培养基含有:3g(NH4)2SO4;20g碳底物;0.15mol NaK/PO4缓冲液,pH7.5;1g酵母抽提物;0.15g MgSO4·7H2O;0.5mmol IPTG;10mL 100X微量元素溶液;25mg氯霉素;以及10mg四环素。用KOH或H2SO4将得到的溶液滴定到pH7.5。碳源是:D-葡萄糖(Glc);D-果糖(Frc);D-乳糖(Lac);D-蔗糖(Suc);D-麦芽糖(Mal);以及D-甘露糖(Man)。培养基中加入一些玻璃珠以促进混合。加入种子接种物起始反应,使细胞悬浮液I600nm测定的光密度开始为0.1AU。35℃:250转/分孵育培养瓶。24小时后用HPLC测定3G的产生。表6描述了从不同碳底物产生1,3-丙二醇的产量。
表6利用重组克雷伯氏菌25955pJSP1A/pJSP2从多种碳底物生产1,3-丙二醇
                   1,3-丙二醇(g/L)
碳底物        实验1        实验2        实验3
Glc           0.89          1            1.6
Frc           0.19          0.23         0.24
Lac           0.15          0.58         0.56
Suc           0.88          0.62
Mal           0.05          0.03         0.02
Man           0.03          0.05         0.04
实施例9:使用dhaBX基因改善1,3-丙二醇产生
实施例9证明了当引入编码蛋白质X的基因时促进了1,3-丙二醇的产生。
表达载体pTaclQ的构建
将含有laclq基因(Farabaugh,P.J.1978,自然274(5673)765-769)和tac启动子(Amann等,1983,基因25,167-178)的大肠杆菌表达载体pTaclQ插入pBR322的限制性内切酶位点EcoRI(Sutcliffe,1979,Cold Spring Harb.Symp.Quant.Biol.43,77-90)。多克隆位点和终止子序列(SEQ ID NO:50)取代了pBR322中从EcoRI到SphI的序列。
亚克隆甘油脱水酶基因(dhaB1,2,3,X)
用限制性内切酶KpnI和EcoRI将含有获自pHK28-26的dhaB操纵子之克雷伯氏菌dhaB1、dhaB2、dhaB3和dhaBX的全部编码区的区域克隆进pBluescriptIIKS+(Stratagene)以建立质粒pM7。
用在5’末端引入了一个EcoRI位点以及在3’末端引入了一个XbaI位点的引物(SEQ ID NO:51和SEG ID NO:52)利用PCR从pHK28-26扩增dhaB3的开放阅读框架。将产物亚克隆进pLitmus29(NEB)以产生含有dhaB3的质粒pDHAB3。
通过用ApaI和XbaI酶解质粒pM7,纯化5.9kb片段并将其与获自质粒pDHAB3的325bp之ApaI-XbaI片段连接以去除dhaBX基因,建立含有dhaB1、dhaB2和dhaB3的pM11。
用5’末端引入了一个HindIII位点和一个共有核糖体结合位点以及在3’末端引入了一个XbaI位点的引物(SEQ ID NO:53与SEQ IDNO:54)利用PCR从pHK28-26扩增dhaB1的开放阅读框架。将产物亚克隆进pLitmus28(NEB)以产生含有dhaB1的质粒pDT1。
将获自含有dhaB1基因、dhaB2基因和dhaB3基因一部分的pM11之NotI-XbaI片段插入pDT1以建立dhaB表达质粒pDT2。将含有获自pDT2的dhaB(1,2,3)基因的HindIII-XbaI片段插入pTaclQ以建立pDT3。
亚克隆TMG脱氢酶基因(dhaT)
将含有TMG脱氢酶(dhaT)基因之pHK28-26的KpnI-SacI片段亚克隆进pBluescriptII KS+以建立质粒pAH11。利用在5’末端引入了一个XbaI位点以及在3’末端引入了一个BamHI位点的合成引物(SEQID NO:55与SEQ ID NO:56)从作为模板DNA的pAH1通过PCR克隆dhaT基因。将产物亚克隆进pCR-Script(Stratagene)的SrfI位点以产生含有dhaT的质粒pAH4和pAH5。pAH4含有对于从pCR-Script中lac启动子开始的表达为正确方向的dhaT基因,pAH5含有反向的dhaT基因。将获自含dhaT基因的pAH4的XbaI-BamHI片段插入pTaclQ以产生质粒pAH8。将获自含RBS和dhaT基因的pAH8之HindII-BamHI片段插入pBluescriptII KS+以建立pAH11。
dhAT和dhaB(1,2,3)表达盒的构建
使用标准分子生物学方法用前述单独的dhaB(1,2,3)和dhaT亚克隆组装dhaT和dhaB(1,2,3)的表达盒。将含有获自pDT3的dhaB(1,2,3)基因的SpeI-SacI片段插入pAH11的SpeI-SacI位点以建立pAH24。将SalI-XbaI接头(SEQ ID NO:57和SEQ ID NO:58)插入用限制性酶SalI-XbaI酶解的pAH5以建立pDT16。接头破坏了XbaI位点。获自pDT16的1kb之SalI-MluI片段被插入pAH24,取代已现有的SalI-MluI以建立pDT18。
用于在大肠杆菌中过度表达dhaT和dhaB(1,2,3,X)的质粒
纯化含有获自质粒pM7的dhaB1基因、dhaB2、dhaB3和dhaBX一部分的4.4kb之NotI-XbaI片段,将其与获自质粒pDT18的4.1kb之NotI-XbaI片段连接(恢复dhaB1)以建立含有dhaB1、dhaB2、dhaB3和dhaBX的pM33。
大肠杆菌菌株
大肠杆菌DH5α得自BRL(Difco)。用质粒pM7、pM11、pM33或pDT18转化该菌株并在含有100ug/ml羧苄青霉素的LA平板上对其进行选择。
1,3-丙二醇的产生
在加了100ug/mL羧苄青霉素的LA平板上培养含有质粒pM7、pM11、pM33或pDT18的大肠杆菌DH5α,37℃过夜。获自每种质粒的一个菌落被用于接种在加了0.005g/L维生素B12、0.2mM IPTG、200ug/mL羧苄青霉素和5ml改良的Balch微量元素溶液(在普通和分子细菌学方法(P.Gerhardt等编,158页,美国微生物协会,Washington,DC,1994)中能找到其组成)的25ml培养基(0.2MKH2PO4,2.0g/L柠檬酸,2.0g/L MgSO4·7H2O,1.2ml/LH2SO4(98%),0.3g/L柠檬酸铁铵,0.2g CaCl2·2H2O,5g/L酵母抽提物,10g/L葡萄糖,30g/L甘油)中,终pH 6.8(NH4OH),然后在250mL锥形瓶中过滤除菌。在37℃振摇(300转/分)孵育摇瓶数天,在此期间用标准步骤取样进行HPLC分析。最终产量见表4。
总的说来,如表7所示,结果显示在表达dhaB(1,2,3)或dhaT-dhaB(1,2,3)的质粒中dhaBX的表达大大增加了1,3-丙二醇的产量。
表7dhaBX表达对大肠杆菌产生1,3-丙二醇的影响
菌株                       时间(天数)    1,3-丙二醇(mg/L)*
DH5a/pM7(dhaB1,2,3,X)        1                   1500
                                2                   2700
DH5a/pM11(dhaB1,2,3)          1                   <200μg
                                2                   <200μg
DH5a/pM33(dhaT-dhaB1,2,3,X)  2                   1200
DH5a/pDT18(dhaT-dhaB1,2,3)    2                   88
*表达为数次实验的平均值
引物
SEQ ID NO:50-MCS-终止子
5AGCTTAGGAGTCTAGAATATTGAGCTCGAATTCCCGGGCATGCGGTACCGGATCCAGAAAA
AGCCCGCACCTGACAGTGCGGGCTTTTTTTTT 3′
SEQ ID NO:51-dhaB3-5′端 EcoRI
GGAATTCAGATCTCAGCAATGAGCGAGAAAACCATGC
SEQ ID NO 52:dhaB3-3′端 Xbal
GCTCTAGATTAGCTTCCTTTACGCAGC
SEQ ID NO 53:dhaB1 5′端 HindIlI-SD
5′GGCCAAGCTTAAGGAGGAATTAAATGAAAAG 3′
SEQ ID NO 54:dhaB1 3′端-Xbal
5′GCTCTAGATTATTCAATGGTGTCGGG 3′
SEQ ID NO 55:dhaT 5′端-Xbal
5′GCGCCGTCTAGAATTATGAGCTATCGTATGTTTGATTATCTG 3′
SEQ ID NO 56:dhaT 3′端 BamHI
5′TCTGATACGGGATCCTCAGAATGCCTGGCGGAAAAT 3′
SEQ ID NO 57:pUSH接头1:
5′TCGACGAATTCAGGAGGA 3′
SEQ ID NO 58:pUSH接头2:
5′CTAGTCCTCCTGaaTTCG 3′
                                    实施例10
甘油脱水酶活性的再激活
实施例10证明了在含有至少一个编码蛋白质X基因的微生物中甘油脱水酶活性的体内再激活。
如实施例9所述,构建了质粒pM7和pM11并将其转化进大肠杆菌DH5α细胞。培养转化的细胞并根据Honda等人(1980,甘油失活的辅酶B12依赖性酶、甘油脱水酶和二醇脱水酶的原位再激活,细菌学杂志143:1458-1465)的方法分析1,3-丙二醇的产生。
材料和方法
细胞的甲苯化
细胞生长至对数中期,并在生长较早时,即0.2>OD600<0.8时于室温离心收集细胞。室温下用50mM KPO4 pH8.0清洗收集的细胞。将细胞在50mM KPO4 pH8.0中重新悬浮至OD600为20-30。绝对的OD值不是关键性的。将较少细胞群体重新悬浮在较少体积内。如果在此时加入辅酶B12,则余下步骤在黑暗中进行。将甲苯加入到1%终体积的细胞悬液中并在室温下剧烈振摇悬液5分钟。离心悬液使细胞成团。室温下用50mM KPO4 pH8.0清洗细胞两次(每次25mL)。加入甲苯前将细胞团重新悬浮于所用过的相同体积中并将其转移至干净试管。测定并记录甲苯化细胞的OD600,于4℃贮存。
完整细胞甘油脱水酶分析
为了检测脱水酶活性的存在于37℃分析甲苯处理过的细胞。如下所示进行三套反应:无ATP、在0时加入ATP以及在10分钟加入ATP。
无ATP:100ul  2M甘油
       100ul  150uM辅酶B12
       700ul  缓冲液(0.03M KPO4/0.5M KCl,pH8.0)
T=0分钟ATP: 100ul  2M甘油
              100ul  150uM辅酶B12
              600ul  缓冲液(0.03M KPO4/0.5M KCl,pH8.0)
              100ul  30mM ATP/30mM MnCl2
T=10分钟ATP:100ul  2M甘油
              100ul  150uM辅酶B12
              700ul  缓冲液(0.03M KPO4/0.5M KCl,pH8.0)
加100ul缓冲液而不是辅酶B12以制备每一个上述条件的对照。混合试管。这些试管的每一个中都加入50ul MBTH(3-甲基-2-苯基-噻唑啉酮腙)(在375mM甘氨酸/HCl pH2.7中为6mg/ml),并在冰水中继续孵育。反应管于37℃水浴中放置几分钟以平衡到37℃。将盛有足够所有分析管使用的甲苯化细胞的试管放置于37℃水浴中几分钟以平衡到37℃。将含有2.5倍稀释(在分析缓冲液中)的30mM ATP/30mMMncl2(每个12mM)的试管放置于37℃水浴中几分钟以平衡到37℃。在所有的试管中加入100ul细胞悬浮液,并于0、1、2、3、4、5、10、15、20和30分钟时取样。在每个时间点,取100ul反应物并立即加入到50ul冰冷的MBTH中,振荡,并将其置于冰水浴中。在T=10分钟时,取一份样品并加入到MBTH中,然后尽可能快地加入100ul 2.5倍稀释的ATP/Mn。收集到所有的样品后,将样品试管架置于沸水浴中煮沸3分钟。在冰水浴中冷却试管30秒。将500ul新鲜制备的3.3mg/mlFeCl3·6H2O加入到试管中并且振荡试管。室温下孵育试管30分钟,用水稀释10倍,然后离心收集细胞和颗粒。在670nm测定吸收值并稀释细胞使OD低于1.0。
活性计算举例
稀释因子乘以所测OD670以测定吸收值。对于反应组扣除空白吸收值并扣除T0的A670nm。绝对A670nm除以53.4(3羟基-丙醛的mM消光系数),mM浓度乘以时程中任何反应的稀释度。因为使用了1ml反应物,3羟基-丙醛的浓度(umol/ml)除以分析中使用的mg干重(通过OD600计算并且1 OD600=0.436mg干重),得到每毫克细胞干重中的醛微摩尔系数。
结果
如图6所示,分析完整大肠杆菌细胞在未加入和加入ATP和Mn++时甘油脱水酶的再激活。结果显示含有带dhaB1,2和3以及蛋白质X质粒的细胞有再激活催化性失活的甘油脱水酶之能力。含有蛋白质1、蛋白质2和蛋白质3的细胞再激活催化性失活的甘油脱水酶之能力增加。
如图7所示,分析完整大肠杆菌细胞在未加入和加入ATP和Mn++时甘油失活的甘油脱水酶的再激活。结果显示含有dhaB亚基1、2和3以及X的细胞有再激活催化性失活的甘油脱水酶之能力。缺乏蛋白质X基因的细胞无再激活催化性失活的甘油脱水酶之能力。
图9和10阐明了含有质粒pHK28-26(图1)的宿主细胞在适合产生1,3-丙二醇的条件下培养时,比被pDT24转化并在适合产生1,3-丙二醇的条件下培养的宿主细胞能产生更多的1,3-丙二醇。质粒pDT24是pDT18(实施例9中所述)的衍生物并含有dhaT、dhaB1、2、3和蛋白质X,但缺乏蛋白质1、2和3。
                                      序列表
(1)一般信息
 (i)申请人:MARIA DIAZ-TORRES
        NIGEL DUNN-COLEMAN
        MATTHEW CHASE
 (ii)发明名称:1,3-丙二醇的重组生产方法
 (iii)序列数目:49
 (iv)联系地址:
  (A)地址:GENENCOR INTERNATIONAL,INC.
  (B)街道:4 Cambridge Place
       1870 South Winton Road
  (C)城市:Richester
  (D)州:纽约
  (E)国家:美国
  (F)邮政编码(ZIP):14618
 (v)计算机可读信息:
  (A)介质类型:3.5#软盘
  (B)计算机:IBM PC兼容机
  (C)操作系统:Microsoft Windows 3.1
  (D)软件:Microword 2.0c
 (vi)当前申请数据:
  (A)申请号:未分配
  (B)递交日:1997年11月13日
  (C)分类:
 (vi)在先申请数据:
  (A)申请号:60/030,601
  (B)递交日:1996年11月13日
  (C)分类:
 (viii)代理人/代理机构信息:
  (A)姓名:GLAISTER,DEBRA
  (B)登记号:33,888
  (C)文献/卷号:gc 369-2
 (ix)通讯信息:
  (A)电话:(650)864-7620
  (B)传真:(650)845-6504
(2)SEQ ID NO:1的信息:
 (i)序列特征:
  (A)长度:1668个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (iii)假设:非
 (iv)反义:非
 (vi)初始来源:
  (A)生物:DHAB1
 (xi)SEQ ID NO:1的序列描述
ATGAAAAGAT CAAAACGATT TGCAGTACTG GCCCAGCGCC CCGTCAATCA GGACGGGCTG  60
ATTGGCGAGT GGCCTGAAGA GGGGCTGATC GCCATGGACA GCCCCTTTGA CCCGGTCTCT  120
TCAGTAAAAG TGGACAACGG TCTGATCGTC GAACTGGACG GCAAACGCCG GGACCAGTTT  180
GACATGATCG ACCGATTTAT CGCCGATTAC GCGATCAACG TTGAGCGCAC AGAGCAGGCA  240
ATGCGCCTGG AGGCGGTGGA AATAGCCCGT ATGCTGGTGG ATATTCACGT CAGCCGGGAG  300
GAGATCATTG CCATCACTAC CGCCATCACG CCGGCCAAAG CGGTCGAGGT GATGGCGCAG  360
ATGAACGTGG TGGAGATGAT GATGGCGCTG CAGAAGATGC GTGCCCGCCG GACCCCCTCC  420
AACCAGTGCC ACGTCACCAA TCTCAAAGAT AATCCGGTGC AGATTGCCGC TGACGCCGCC  480
GAGGCCGGGA TCCGCGGCTT CTCAGAACAG GAGACCACGG TCGGTATCGC GCGCTACGCG  540
CCGTTTAACG CCCTGGCGCT GTTGGTCGGT TCGCAGTGCG GCCGCCCCGG CGTGTTGACG   600
CAGTGCTCGG TGGAAGAGGC CACCGAGCTG GAGCTGGGCA TGCGTGGCTT AACCAGCTAC   660
GCCGAGACGG TGTCGGTCTA CGGCACCGAA GCGGTATTTA CCGACGGCGA TGATACGCCG   720
TGGTCAAAGG CGTTCCTCGC CTCGGCCTAC GCCTCCCGCG GGTTGAAAAT GCGCTACACC   780
TCCGGCACCG GATCCGAAGC GCTGATGGGC TATTCGGAGA GCAAGTCGAT GCTCTACCTC   840
GAATCGCGCT GCATCTTCAT TACTAAAGGC GCCGGGGTTC AGGGACTGCA AAACGGCGCG   900
GTGAGCTGTA TCGGCATGAC CGGCGCTGTG CCGTCGGGCA TTCGGGCGGT GCTGGCGGAA   960
AACCTGATCG CCTCTATGCT CGACCTCGAA GTGGCGTCCG CCAACGACCA GACTTTCTCC  1020
CACTCGGATA TTCGCCGCAC CGCGCGCACC CTGATGCAGA TGCTGCCGGG CACCGACTTT  1080
ATTTTCTCCG GCTACAGCGC GGTGCCGAAC TACGACAACA TGTTCGCCGG CTCGAACTTC  1140
GATGCGGAAG ATTTTGATGA TTACAACATC CTGCAGCGTG ACCTGATGGT TGACGGCGGC  1200
CTGCGTCCGG TGACCGAGGC GGAAACCATT GCCATTCGCC AGAAAGCGGC GCGGGCGATC  1260
CAGGCGGTTT TCCGCGAGCT GGGGCTGCCG CCAATCGCCG ACGAGGAGGT GGAGGCCGCC  1320
ACCTACGCGC ACGGCAGCAA CGAGATGCCG CCGCGTAACG TGGTGGAGGA TCTGAGTGCG  1380
GTGGAAGAGA TGATGAAGCG CAACATCACC GGCCTCGATA TTGTCGGCGC GCTGAGCCGC  1440
AGCGGCTTTG AGGATATCGC CAGCAATATT CTCAATATGC TGCGCCAGCG GGTCACCGGC  1500
GATTACCTGC AGACCTCGGC CATTCTCGAT CGGCAGTTCG AGGTGGTGAG TGCGGTCAAC  1560
GACATCAATG ACTATCAGGG GCCGGGCACC GGCTATCGCA TCTCTGCCGA ACGCTGGGCG  1620
GAGATCAAAA ATATTCCGGG CGTGGTTCAG CCCGACACCA TTGAATAA               1668
(2)SEQ ID NO:2的信息:
 (i)序列特征:
  (A)长度:585个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (iii)假设:非
 (iv)反义:非
 (vi)初始来源:
  (A)生物:DHAB2
 (xi)SEQ ID NO:2的序列描述
GTGCAACAGA CAACCCAAAT TCAGCCCTCT TTTACCCTGA AAACCCGCGA GGGCGGGGTA   60
GCTTCTGCCG ATGAACGCGC CGATGAAGTG GTGATCGGCG TCGGCCCTGC CTTCGATAAA  120
CACCAGCATC ACACTCTGAT CGATATGCCC CATGGCGCGA TCCTCAAAGA GCTGATTGCC  180
GGGGTGGAAG AAGAGGGGCT TCACGCCCGG GTGGTGCGCA TTCTGCGCAC GTCCGACGTC  240
TCCTTTATGG CCTGGGATGC GGCCAACCTG AGCGGCTCGG GGATCGGCAT CGGTATCCAG  300
TCGAAGGGGA CCACGGTCAT CCATCAGCGC GATCTGCTGC CGCTCAGCAA CCTGGAGCTG  360
TTCTCCCAGG CGCCGCTGCT GACGCTGGAG ACCTACCGGC AGATTGGCAA AAACGCTGCG  420
CGCTATGCGC GCAAAGAGTC ACCTTCGCCG GTGCCGGTGG TGAACGATCA GATGGTGCGG  480
CCGAAATTTA TGGCCAAAGC CGCGCTATTT CATATCAAAG AGACCAAACA TGTGGTGCAG  540
GACGCCGAGC CCGTCACCCT GCACATCGAC TTAGTAAGGG AGTGA                  585
(2)SEQ ID NO:3的信息:
 (i)序列特征:
  (A)长度:426个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (vi)初始来源:
  (A)生物:DHAB3
 (xi)SEQ ID NO:3的序列描述
ATGAGCGAGA AAACCATGCG CGTGCAGGAT TATCCGTTAG CCACCCGCTG CCCGGAGCAT   60
ATCCTGACGC CTACCGGCAA ACCATTGACC GATATTACCC TCGAGAAGGT GCTCTCTGGC  120
GAGGTGGGCC CGCAGGATGT GCGGATCTCC CGCCAGACCC TTGAGTACCA GGCGCAGATT  180
GCCGAGCAGA TGCAGCGCCA TGCGGTGGCG CGCAATTTCC GCCGCGCGGC GGAGCTTATC  240
GCCATTCCTG ACGAGCGCAT TCTGGCTATC TATAACGCGC TGCGCCCGTT CCGCTCCTCG  300
CAGGCGGAGC TGCTGGCGAT CGCCGACGAG CTGGAGCACA CCTGGCATGC GACAGTGAAT  360
GCCGCCTTTG TCCGGGAGTC GGCGGAAGTG TATCAGCAGC GGCATAAGCT GCGTAAAGGA  420
AGCTAA                                                             426
(2)SEQ ID NO:4的信息:
 (i)序列特征:
  (A)长度:1164个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (vi)初始来源:
  (A)生物:DHAT
 (xi)SEQ ID NO:4的序列描述
ATGAGCTATC GTATGTTTGA TTATCTGGTG CCAAACGTTA ACTTTTTTGG CCCCAACGCC    60
ATTTCCGTAG TCGGCGAACG CTGCCAGCTG CTGGGGGGGA AAAAAGCCCT GCTGGTCACC   120
GACAAAGGCC TGCGGGCAAT TAAAGATGGC GCGGTGGACA AAACCCTGCA TTATCTGCGG   180
GAGGCCGGGA TCGAGGTGGC GATCTTTGAC GGCGTCGAGC CGAACCCGAA AGACACCAAC   240
GTGCGCGACG GCCTCGCCGT GTTTCGCCGC GAACAGTGCG ACATCATCGT CACCGTGGGC   300
GGCGGCAGCC CGCACGATTG CGGCAAAGGC ATCGGCATCG CCGCCACCCA TGAGGGCGAT   360
CTGTACCAGT ATGCCGGAAT CGAGACCCTG ACCAACCCGC TGCCGCCTAT CGTCGCGGTC   420
AATACCACCG CCGGCACCGC CAGCGAGGTC ACCCGCCACT GCGTCCTGAC CAACACCGAA   480
ACCAAAGTGA AGTTTGTGAT CGTCAGCTGG CGCAAACTGC CGTCGGTCTC TATCAACGAT   540
CCACTGCTGA TGATCGGTAA ACCGGCCGCC CTGACCGCGG CGACCGGGAT GGATGCCCTG   600
ACCCACGCCG TAGAGGCCTA TATCTCCAAA GACGCTAACC CGGTGACGGA CGCCGCCGCC   660
ATGCAGGCGA TCCGCCTCAT CGCCCGCAAC CTGCGCCAGG CCGTGGCCCT CGGCAGCAAT   720
CTGCAGGCGC GGGAAAACAT GGCCTATGCT TCTCTGCTGG CCGGGATGGC TTTCAATAAC   780
GCCAACCTCG GCTACGTGCA CGCCATGGCG CACCAGCTGG GCGGCCTGTA CGACATGCCG   840
CACGGCGTGG CCAACGCTGT CCTGCTGCCG CATGTGGCGC GCTACAACCT GATCGCCAAC   900
CCGGAGAAAT TCGCCGATAT CGCTGAACTG ATGGGCGAAA ATATCACCGG ACTGTCCACT   960
CTCGACGCGG CGGAAAAAGC CATCGCCGCT ATCACGCGTC TGTCGATGGA TATCGGTATT  1020
CCGCAGCATC TGCGCGATCT GGGGGTAAAA GAGGCCGACT TCCCCTACAT GGCGGAGATG  1080
GCTCTAAAAG ACGGCAATGC GTTCTCGAAC CCGCGTAAAG GCAACGAGCA GGAGATTGCC  1140
GCGATTTTCC GCCAGGCATT CTGA                                         1164
(2)SEQ ID NO:5的信息:
 (i)序列特征:
  (A)长度:1380个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (vi)初始来源:
  (A)生物:GPD1
 (xi)SEQ ID NO:5的序列描述
CTTTAATTTT CTTTTATCTT ACTCTCCTAC ATAAGACATC AAGAAACAAT TGTATATTGT   60
ACACCCCCCC CCTCCACAAA CACAAATATT GATAATATAA AGATGTCTGC TGCTGCTGAT  120
AGATTAAACT TAACTTCCGG CCACTTGAAT GCTGGTAGAA AGAGAAGTTC CTCTTCTGTT  180
TCTTTGAAGG CTGCCGAAAA GCCTTTCAAG GTTACTGTGA TTGGATCTGG TAACTGGGGT  240
ACTACTATTG CCAAGGTGGT TGCCGAAAAT TGTAAGGGAT ACCCAGAAGT TTTCGCTCCA  300
ATAGTACAAA TGTGGGTGTT CGAAGAAGAG ATCAATGGTG AAAAATTGAC TGAAATCATA  360
AATACTAGAC ATCAAAACGT GAAATACTTG CCTGGCATCA CTCTACCCGA CAATTTGGTT  420
GCTAATCCAG ACTTGATTGA TTCAGTCAAG GATGTCGACA TCATCGTTTT CAACATTCCA  480
CATCAATTTT TGCCCCGTAT CTGTAGCCAA TTGAAAGGTC ATGTTGATTC ACACGTCAGA   540
GCTATCTCCT GTCTAAAGGG TTTTGAAGTT GGTGCTAAAG GTGTCCAATT GCTATCCTCT   600
TACATCACTG AGGAACTAGG TATTCAATGT GGTGCTCTAT CTGGTGCTAA CATTGCCACC   660
GAAGTCGCTC AAGAACACTG GTCTGAAACA ACAGTTGCTT ACCACATTCC AAAGGATTTC   720
AGAGGCGAGG GCAAGGACGT CGACCATAAG GTTCTAAAGG CCTTGTTCCA CAGACCTTAC   780
TTCCACGTTA GTGTCATCGA AGATGTTGCT GGTATCTCCA TCTGTGGTGC TTTGAAGAAC   840
GTTGTTGCCT TAGGTTGTGG TTTCGTCGAA GGTCTAGGCT GGGGTAACAA CGCTTCTGCT   900
GCCATCCAAA GAGTCGGTTT GGGTGAGATC ATCAGATTCG GTCAAATGTT TTTCCCAGAA   960
TCTAGAGAAG AAACATACTA CCAAGAGTCT GCTGGTGTTG CTGATTTGAT CACCACCTGC  1020
GCTGGTGGTA GAAACGTCAA GGTTGCTAGG CTAATGGCTA CTTCTGGTAA GGACGCCTGG  1080
GAATGTGAAA AGGAGTTGTT GAATGGCCAA TCCGCTCAAG GTTTAATTAC CTGCAAAGAA  1140
GTTCACGAAT GGTTGGAAAC ATGTGGCTCT GTCGAAGACT TCCCATTATT TGAAGCCGTA  1200
TACCAAATCG TTTACAACAA CTACCCAATG AAGAACCTGC CGGACATGAT TGAAGAATTA  1260
GATCTACATG AAGATTAGAT TTATTGGAGA AAGATAACAT ATCATACTTC CCCCACTTTT  1320
TTCGAGGCTC TTCTATATCA TATTCATAAA TTAGCATTAT GTCATTTCTC ATAACTACTT  1380
(2)SEQ ID NO:6的信息:
 (i)序列特征:
  (A)长度:2946个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (vi)初始来源:
  (A)生物:GPD2
 (xi)SEQ ID NO:6的序列描述
GAATTCGAGC CTGAAGTGCT GATTACCTTC AGGTAGACTT CATCTTGACC CATCAACCCC    60
AGCGTCAATC CTGCAAATAC ACCACCCAGC AGCACTAGGA TGATAGAGAT AATATAGTAC   120
GTGGTAACGC TTGCCTCATC ACCTACGCTA TGGCCGGAAT CGGCAACATC CCTAGAATTG   180
AGTACGTGTG ATCCGGATAA CAACGGCAGT GAATATATCT TCGGTATCGT AAAGATGTGA   240
TATAAGATGA TGTATACCCA ATGAGGAGCG CCTGATCGTG ACCTAGACCT TAGTGGCAAA   300
AACGACATAT CTATTATAGT GGGGAGAGTT TCGTGCAAAT AACAGACGCA GCAGCAAGTA   360
ACTGTGACGA TATCAACTCT TTTTTTATTA TGTAATAAGC AAACAAGCAC GAATGGGGAA   420
AGCCTATGTG CAATCACCAA GGTCGTCCCT TTTTTCCCAT TTGCTAATTT AGAATTTAAA   480
GAAACCAAAA GAATGAAGAA AGAAAACAAA TACTAGCCCT AACCCTGACT TCGTTTCTAT   540
GATAATACCC TGCTTTAATG AACGGTATGC CCTAGGGTAT ATCTCACTCT GTACGTTACA   600
AACTCCGGTT ATTTTATCGG AACATCCGAG CACCCGCGCC TTCCTCAACC CAGGCACCGC   660
CCCAGGTAAC CGTGCGCGAT GAGCTAATCC TGAGCCATCA CCCACCCCAC CCGTTGATGA   720
CAGCAATTCG GGAGGGCGAA AATAAAACTG GAGCAAGGAA TTACCATCAC CGTCACCATC   780
ACCATCATAT CGCCTTAGCC TCTAGCCATA GCCATCATGC AAGCGTGTAT CTTCTAAGAT   840
TCAGTCATCA TCATTACCGA GTTTGTTTTC CTTCACATGA TGAAGAAGGT TTGAGTATGC   900
TCGAAACAAT AAGACGACGA TGGCTCTGCC ATTGGTTATA TTACGCTTTT GCGGCGAGGT   960
GCCGATGGGT TGCTGAGGGG AAGAGTGTTT AGCTTACGGA CCTATTGCCA TTGTTATTCC  1020
GATTAATCTA TTGTTCAGCA GCTCTTCTCT ACCCTGTCAT TCTAGTATTT TTTTTTTTTT  1080
TTTTTGGTTT TACTTTTTTT TCTTCTTGCC TTTTTTTCTT GTTACTTTTT TTCTAGTTTT  1140
TTTTCCTTCC ACTAAGCTTT TTCCTTGATT TATCCTTGGG TTCTTCTTTC TACTCCTTTA  1200
GATTTTTTTT TTATATATTA ATTTTTAAGT TTATGTATTT TGGTAGATTC AATTCTCTTT  1260
CCCTTTCCTT TTCCTTCGCT CCCCTTCCTT ATCAATGCTT GCTGTCAGAA GATTAACAAG  1320
ATACACATTC CTTAAGCGAA CGCATCCGGT GTTATATACT CGTCGTGCAT ATAAAATTTT  1380
GCCTTCAAGA TCTACTTTCC TAAGAAGATC ATTATTACAA ACACAACTGC ACTCAAAGAT  1440
GACTGCTCAT ACTAATATCA AACAGCACAA ACACTGTCAT GAGGACCATC CTATCAGAAG  1500
ATCGGACTCT GCCGTGTCAA TTGTACATTT GAAACGTGCG CCCTTCAAGG TTACAGTGAT  1560
TGGTTCTGGT AACTGGGGGA CCACCATCGC CAAAGTCATT GCGGAAAACA CAGAATTGCA  1620
TTCCCATATC TTCGAGCCAG AGGTGAGAAT GTGGGTTTTT GATGAAAAGA TCGGCGACGA  1680
AAATCTGACG GATATCATAA ATACAAGACA CCAGAACGTT AAATATCTAC CCAATATTGA  1740
CCTGCCCCAT AATCTAGTGG CCGATCCTGA TCTTTTACAC TCCATCAAGG GTGCTGACAT  1800
CCTTGTTTTC AACATCCCTC ATCAATTTTT ACCAAACATA GTCAAACAAT TGCAAGGCCA  1860
CGTGGCCCCT CATGTAAGGG CCATCTCGTG TCTAAAAGGG TTCGAGTTGG GCTCCAAGGG  1920
TGTGCAATTG CTATCCTCCT ATGTTACTGA TGAGTTAGGA ATCCAATGTG GCGCACTATC  1980
TGGTGCAAAC TTGGCACCGG AAGTGGCCAA GGAGCATTGG TCCGAAACCA CCGTGGCTTA  2040
CCAACTACCA AAGGATTATC AAGGTGATGG CAAGGATGTA GATCATAAGA TTTTGAAATT  2100
GCTGTTCCAC AGACCTTACT TCCACGTCAA TGTCATCGAT GATGTTGCTG GTATATCCAT  2160
TGCCGGTGCC TTGAAGAACG TCGTGGCACT TGCATGTGGT TTCGTAGAAG GTATGGGATG  2220
GGGTAACAAT GCCTCCGCAG CCATTCAAAG GCTGGGTTTA GGTGAAATTA TCAAGTTCGG  2280
TAGAATGTTT TTCCCAGAAT CCAAAGTCGA GACCTACTAT CAAGAATCCG CTGGTGTTGC  2340
AGATCTGATC ACCACCTGCT CAGGCGGTAG AAACGTCAAG GTTGCCACAT ACATGGCCAA  2400
GACCGGTAAG TCAGCCTTGG AAGCAGAAAA GGAATTGCTT AACGGTCAAT CCGCCCAAGG  2460
GATAATCACA TGCAGAGAAG TTCACGAGTG GCTACAAACA TGTGAGTTGA CCCAAGAATT  2520
CCCAATTATT CGAGGCAGTC TACCAGATAG TCTACAACAA CGTCCGCATG GAAGACCTAC  2580
CGGAGATGAT TGAAGAGCTA GACATCGATG ACGAATAGAC ACTCTCCCCC CCCCTCCCCC  2640
TCTGATCTTT CCTGTTGCCT CTTTTTCCCC CAACCAATTT ATCATTATAC ACAAGTTCTA  2700
CAACTACTAC TAGTAACATT ACTACAGTTA TTATAATTTT CTATTCTCTT TTTCTTTAAG  2760
AATCTATCAT TAACGTTAAT TTCTATATAT ACATAACTAC CATTATACAC GCTATTATCG  2820
TTTACATATC ACATCACCGT TAATGAAAGA TACGACACCC TGTACACTAA CACAATTAAA  2880
TAATCGCCAT AACCTTTTCT GTTATCTATA GCCCTTAAAG CTGTTTCTTC GAGCTTTTCA  2940
CTGCAG                                                             2946
(2)SEQ ID NO:7的信息:
 (i)序列特征:
  (A)长度:3178个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (vi)初始来源:
  (A)生物:GUT2
 (xi)SEQ ID NO:7的序列描述
CTGCAGAACT TCGTCTGCTC TGTGCCCATC CTCGCGGTTA GAAAGAAGCT GAATTGTTTC   60
ATGCGCAAGG GCATCAGCGA GTGACCAATA ATCACTGCAC TAATTCCTTT TTAGCAACAC  120
ATACTTATAT ACAGCACCAG ACCTTATGTC TTTTCTCTGC TCCGATACGT TATCCCACCC  180
AACTTTTATT TCAGTTTTGG CAGGGGAAAT TTCACAACCC CGCACGCTAA AAATCGTATT  240
TAAACTTAAA AGAGAACAGC CACAAATAGG GAACTTTGGT CTAAACGAAG GACTCTCCCT   300
CCCTTATCTT GACCGTGCTA TTGCCATCAC TGCTACAAGA CTAAATACGT ACTAATATAT   360
GTTTTCGGTA ACGAGAAGAA GAGCTGCCGG TGCAGCTGCT GCCATGGCCA CAGCCACGGG   420
GACGCTGTAC TGGATGACTA GCCAAGGTGA TAGGCCGTTA GTGCACAATG ACCCGAGCTA   480
CATGGTGCAA TTCCCCACCG CCGCTCCACC GGCAGGTCTC TAGACGAGAC CTGCTGGACC   540
GTCTGGACAA GACGCATCAA TTCGACGTGT TGATCATCGG TGGCGGGGCC ACGGGGACAG   600
GATGTGCCCT AGATGCTGCG ACCAGGGGAC TCAATGTGGC CCTTGTTGAA AAGGGGGATT   660
TTGCCTCGGG AACGTCGTCC AAATCTACCA AGATGATTCA CGGTGGGGTG CGGTACTTAG   720
AGAAGGCCTT CTGGGAGTTC TCCAAGGCAC AACTGGATCT GGTCATCGAG GCACTCAACG   780
AGCGTAAACA TCTTATCAAC ACTGCCCCTC ACCTGTGCAC GGTGCTACCA ATTCTGATCC   840
CCATCTACAG CACCTGGCAG GTCCCGTACA TCTATATGGG CTGTAAATTC TACGATTTCT   900
TTGGCGGTTC CCAAAACTTG AAAAAATCAT ACCTACTGTC CAAATCCGCC ACCGTGGAGA   960
AGGCTCCCAT GCTTACCACA GACAATTTAA AGGCCTCGCT TGTGTACCAT GATGGGTCCT  1020
TTAACGACTC GCGTTTGAAC GCCACTTTAG CCATCACGGG TGTGGAGAAC GGCGCTACCG  1080
TCTTGATCTA TGTCGAGGTA CAAAAATTGA TCAAAGACCC AACTTCTGGT AAGGTTATCG  1140
GTGCCGAGGC CCGGGACGTT GAGACTAATG AGCTTGTCAG AATCAACGCT AAATGTGTGG  1200
TCAATGCCAC GGGCCCATAC AGTGACGCCA TTTTGCAAAT GGACCGCAAC CCATCCGGTC  1260
TGCCGGACTC CCCGCTAAAC GACAACTCCA AGATCAAGTC GACTTTCAAT CAAATCTCCG  1320
TCATGGACCC GAAAATGGTC ATCCCATCTA TTGGCGTTCA CATCGTATTG CCCTCTTTTT  1380
ACTCCCCGAA GGATATGGGT TTGTTGGACG TCAGAACCTC TGATGGCAGA GTGATGTTCT  1440
TTTTACCTTG GCAGGGCAAA GTCCTTGCCG GCACCACAGA CATCCCACTA AAGCAAGTCC  1500
CAGAAAACCC TATGCCTACA GAGGCTGATA TTCAAGATAT CTTGAAAGAA CTACAGCACT  1560
ATATCGAATT CCCCGTGAAA AGAGAAGACG TGCTAAGTGC ATGGGCTGGT GTCAGACCTT  1620
TGGTCAGAGA TCCACGTACA ATCCCCGCAG ACGGGAAGAA GGGCTCTGCC ACTCAGGGCG  1680
TGGTAAGATC CCACTTCTTG TTCACTTCGG ATAATGGCCT AATTACTATT GCAGGTGGTA  1740
AATGGACTAC TTACAGACAA ATGGCTGAGG AAACAGTCGA CAAAGTTGTC GAAGTTGGCG  1800
GATTCCACAA CCTGAAACCT TGTCACACAA GAGATATTAA GCTTGCTGGT GCAGAAGAAT  1860
GGACGCAAAA CTATGTGGCT TTATTGGCTC AAAACTACCA TTTATCATCA AAAATGTCCA  1920
ACTACTTGGT TCAAAACTAC GGAACCCGTT CCTCTATCAT TTGCGAATTT TTCAAAGAAT  1980
CCATGGAAAA TAAACTGCCT TTGTCCTTAG CCGACAAGGA AAATAACGTA ATCTACTCTA  2040
GCGAGGAGAA CAACTTGGTC AATTTTGATA CTTTCAGATA TCCATTCACA ATCGGTGAGT  2100
TAAAGTATTC CATGCAGTAC GAATATTGTA GAACTCCCTT GGACTTCCTT TTAAGAAGAA  2160
CAAGATTCGC CTTCTTGGAC GCCAAGGAAG CTTTGAATGC CGTGCATGCC ACCGTCAAAG  2220
TTATGGGTGA TGAGTTCAAT TGGTCGGAGA AAAAGAGGCA GTGGGAACTT GAAAAAACTG  2280
TGAACTTCAT CCAAGGACGT TTCGGTGTCT AAATCGATCA TGATAGTTAA GGGTGACAAA  2340
GATAACATTC ACAAGAGTAA TAATAATGGT AATGATGATA ATAATAATAA TGATAGTAAT  2400
AACAATAATA ATAATGGTGG TAATGGCAAT GAAATCGCTA TTATTACCTA TTTTCCTTAA  2460
TGGAAGAGTT AAAGTAAACT AAAAAAACTA CAAAAATATA TGAAGAAAAA AAAAAAAAGA  2520
GGTAATAGAC TCTACTACTA CAATTGATCT TCAAATTATG ACCTTCCTAG TGTTTATATT  2580
CTATTTCCAA TACATAATAT AATCTATATA ATCATTGCTG GTAGACTTCC GTTTTAATAT  2640
CGTTTTAATT ATCCCCTTTA TCTCTAGTCT AGTTTTATCA TAAAATATAG AAACACTAAA  2700
TAATATTCTT CAAACGGTCC TGGTGCATAC GCAATACATA TTTATGGTGC AAAAAAAAAA  2760
ATGGAAAATT TTGCTAGTCA TAAACCCTTT CATAAAACAA TACGTAGACA TCGCTACTTG  2820
AAATTTTCAA GTTTTTATCA GATCCATGTT TCCTATCTGC CTTGACAACC TCATCGTCGA  2880
AATAGTACCA TTTAGAACGC CCAATATTCA CATTGTGTTC AAGGTCTTTA TTCACCAGTG  2940
ACGTGTAATG GCCATGATTA ATGTGCCTGT ATGGTTAACC ACTCCAAATA GCTTATATTT  3000
CATAGTGTCA TTGTTTTTCA ATATAATGTT TAGTATCAAT GGATATGTTA CGACGGTGTT  3060
ATTTTTCTTG GTCAAATCGT AATAAAATCT CGATAAATGG ATGACTAAGA TTTTTGGTAA  3120
AGTTACAAAA TTTATCGTTT TCACTGTTGT CAATTTTTTG TTCTTGTAAT CACTCGAG    3178
(2)SEQ ID NO:8的信息:
 (i)序列特征:
  (A)长度:816个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (vi)初始来源:
  (A)生物:GPP1
 (xi)SEQ ID NO:8的序列描述
ATGAAACGTT TCAATGTTTT AAAATATATC AGAACAACAA AAGCAAATAT ACAAACCATC   60
GCAATGCCTT TGACCACAAA ACCTTTATCT TTGAAAATCA ACGCCGCTCT ATTCGATGTT  120
GACGGTACCA TCATCATCTC TCAACCAGCC ATTGCTGCTT TCTGGAGAGA TTTCGGTAAA  180
GACAAGCCTT ACTTCGATGC CGAACACGTT ATTCACATCT CTCACGGTTG GAGAACTTAC  240
GATGCCATTG CCAAGTTCGC TCCAGACTTT GCTGATGAAG AATACGTTAA CAAGCTAGAA  300
GGTGAAATCC CAGAAAAGTA CGGTGAACAC TCCATCGAAG TTCCAGGTGC TGTCAAGTTG  360
TGTAATGCTT TGAACGCCTT GCCAAAGGAA AAATGGGCTG TCGCCACCTC TGGTACCCGT  420
GACATGGCCA AGAAATGGTT CGACATTTTG AAGATCAAGA GACCAGAATA CTTCATCACC  480
GCCAATGATG TCAAGCAAGG TAAGCCTCAC CCAGAACCAT ACTTAAAGGG TAGAAACGGT  540
TTGGGTTTCC CAATTAATGA ACAAGACCCA TCCAAATCTA AGGTTGTTGT CTTTGAAGAC  600
GCACCAGCTG GTATTGCTGC TGGTAAGGCT GCTGGCTGTA AAATCGTTGG TATTGCTACC  660
ACTTTCGATT TGGACTTCTT GAAGGAAAAG GGTTGTGACA TCATTGTCAA GAACCACGAA  720
TCTATCAGAG TCGGTGAATA CAACGCTGAA ACCGATGAAG TCGAATTGAT CTTTGATGAC  780
TACTTATACG CTAAGGATGA CTTGTTGAAA TGGTAA                            816
(2)SEQ ID NO:9的信息:
 (i)序列特征:
  (A)长度:753个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (vi)初始来源:
  (A)生物:GPP2
 (xi)SEQ ID NO:9的序列描述
ATGGGATTGA CTACTAAACC TCTATCTTTG AAAGTTAACG CCGCTTTGTT CGACGTCGAC   60
GGTACCATTA TCATCTCTCA ACCAGCCATT GCTGCATTCT GGAGGGATTT CGGTAAGGAC  120
AAACCTTATT TCGATGCTGA ACACGTTATC CAAGTCTCGC ATGGTTGGAG AACGTTTGAT  180
GCCATTGCTA AGTTCGCTCC AGACTTTGCC AATGAAGAGT ATGTTAACAA ATTAGAAGCT  240
GAAATTCCGG TCAAGTACGG TGAAAAATCC ATTGAAGTCC CAGGTGCAGT TAAGCTGTGC  300
AACGCTTTGA ACGCTCTACC AAAAGAGAAA TGGGCTGTGG CAACTTCCGG TACCCGTGAT  360
ATGGCACAAA AATGGTTCGA GCATCTGGGA ATCAGGAGAC CAAAGTACTT CATTACCGCT  420
AATGATGTCA AACAGGGTAA GCCTCATCCA GAACCATATC TGAAGGGCAG GAATGGCTTA  480
GGATATCCGA TCAATGAGCA AGACCCTTCC AAATCTAAGG TAGTAGTATT TGAAGACGCT  540
CCAGCAGGTA TTGCCGCCGG AAAAGCCGCC GGTTGTAAGA TCATTGGTAT TGCCACTACT  600
TTCGACTTGG ACTTCCTAAA GGAAAAAGGC TGTGACATCA TTGTCAAAAA CCACGAATCC  660
ATCAGAGTTG GCGGCTACAA TGCCGAAACA GACGAAGTTG AATTCATTTT TGACGACTAC  720
TTATATGCTA AGGACGATCT GTTGAAATGG TAA                               753
(2)SEQ ID NO:10的信息:
 (i)序列特征:
  (A)长度:2520个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (vi)初始来源:
  (A)生物:GUT1
 (xi)SEQ ID NO:10的序列描述
TGTATTGGCC ACGATAACCA CCCTTTGTAT ACTGTTTTTG TTTTTCACAT GGTAAATAAC   60
GACTTTTATT AAACAACGTA TGTAAAAACA TAACAAGAAT CTACCCATAC AGGCCATTTC  120
GTAATTCTTC TCTTCTAATT GGAGTAAAAC CATCAATTAA AGGGTGTGGA GTAGCATAGT  180
GAGGGGCTGA CTGCATTGAC AAAAAAATTG AAAAAAAAAA AGGAAAAGGA AAGGAAAAAA  240
AGACAGCCAA GACTTTTAGA ACGGATAAGG TGTAATAAAA TGTGGGGGGA TGCCTGTTCT  300
CGAACCATAT AAAATATACC ATGTGGTTTG AGTTGTGGCC GGAACTATAC AAATAGTTAT  360
ATGTTTCCCT CTCTCTTCCG ACTTGTAGTA TTCTCCAAAC GTTACATATT CCGATCAAGC  420
CAGCGCCTTT ACACTAGTTT AAAACAAGAA CAGAGCCGTA TGTCCAAAAT AATGGAAGAT  480
TTACGAAGTG ACTACGTCCC GCTTATCGCC AGTATTGATG TAGGAACGAC CTCATCCAGA  540
TGCATTCTGT TCAACAGATG GGGCCAGGAC GTTTCAAAAC ACCAAATTGA ATATTCAACT  600
TCAGCATCGA AGGGCAAGAT TGGGGTGTCT GGCCTAAGGA GACCCTCTAC AGCCCCAGCT  660
CGTGAAACAC CAAACGCCGG TGACATCAAA ACCAGCGGAA AGCCCATCTT TTCTGCAGAA  720
GGCTATGCCA TTCAAGAAAC CAAATTCCTA AAAATCGAGG AATTGGACTT GGACTTCCAT  780
AACGAACCCA CGTTGAAGTT CCCCAAACCG GGTTGGGTTG AGTGCCATCC GCAGAAATTA  840
CTGGTGAACG TCGTCCAATG CCTTGCCTCA AGTTTGCTCT CTCTGCAGAC TATCAACAGC   900
GAACGTGTAG CAAACGGTCT CCCACCTTAC AAGGTAATAT GCATGGGTAT AGCAAACATG   960
AGAGAAACCA CAATTCTGTG GTCCCGCCGC ACAGGAAAAC CAATTGTTAA CTACGGTATT  1020
GTTTGGAACG ACACCAGAAC GATCAAAATC GTTAGAGACA AATGGCAAAA CACTAGCGTC  1080
GATAGGCAAC TGCAGCTTAG ACAGAAGACT GGATTGCCAT TGCTCTCCAC GTATTTCTCC  1140
TGTTCCAAGC TGCGCTGGTT CCTCGACAAT GAGCCTCTGT GTACCAAGGC GTATGAGGAG  1200
AACGACCTGA TGTTCGGCAC TGTGGACACA TGGCTGATTT ACCAATTAAC TAAACAAAAG  1260
GCGTTCGTTT CTGACGTAAC CAACGCTTCC AGAACTGGAT TTATGAACCT CTCCACTTTA  1320
AAGTACGACA ACGAGTTGCT GGAATTTTGG GGTATTGACA AGAACCTGAT TCACATGCCC  1380
GAAATTGTGT CCTCATCTCA ATACTACGGT GACTTTGGCA TTCCTGATTG GATAATGGAA  1440
AAGCTACACG ATTCGCCAAA AACAGTACTG CGAGATCTAG TCAAGAGAAA CCTGCCCATA  1500
CAGGGCTGTC TGGGCGACCA AAGCGCATCC ATGGTGGGGC AACTCGCTTA CAAACCCGGT  1560
GCTGCAAAAT GTACTTATGG TACCGGTTGC TTTTTACTGT ACAATACGGG GACCAAAAAA  1620
TTGATCTCCC AACATGGCGC ACTGACGACT CTAGCATTTT GGTTCCCACA TTTGCAAGAG  1680
TACGGTGGCC AAAAACCAGA ATTGAGCAAG CCACATTTTG CATTAGAGGG TTCCGTCGCT  1740
GTGGCTGGTG CTGTGGTCCA ATGGCTACGT GATAATTTAC GATTGATCGA TAAATCAGAG  1800
GATGTCGGAC CGATTGCATC TACGGTTCCT GATTCTGGTG GCGTAGTTTT CGTCCCCGCA  1860
TTTAGTGGCC TATTCGCTCC CTATTGGGAC CCAGATGCCA GAGCCACCAT AATGGGGATG  1920
TCTCAATTCA CTACTGCCTC CCACATCGCC AGAGCTGCCG TGGAAGGTGT TTGCTTTCAA  1980
GCCAGGGCTA TCTTGAAGGC AATGAGTTCT GACGCGTTTG GTGAAGGTTC CAAAGACAGG  2040
GACTTTTTAG AGGAAATTTC CGACGTCACA TATGAAAAGT CGCCCCTGTC GGTTCTGGCA  2100
GTGGATGGCG GGATGTCGAG GTCTAATGAA GTCATGCAAA TTCAAGCCGA TATCCTAGGT  2160
CCCTGTGTCA AAGTCAGAAG GTCTCCGACA GCGGAATGTA CCGCATTGGG GGCAGCCATT  2220
GCAGCCAATA TGGCTTTCAA GGATGTGAAC GAGCGCCCAT TATGGAAGGA CCTACACGAT  2280
GTTAAGAAAT GGGTCTTTTA CAATGGAATG GAGAAAAACG AACAAATATC ACCAGAGGCT  2340
CATCCAAACC TTAAGATATT CAGAAGTGAA TCCGACGATG CTGAAAGGAG AAAGCATTGG  2400
AAGTATTGGG AAGTTGCCGT GGAAAGATCC AAAGGTTGGC TGAAGGACAT AGAAGGTGAA  2460
CACGAACAGG TTCTAGAAAA CTTCCAATAA CAACATAAAT AATTTCTATT AACAATGTAA  2520
(2)SEQ ID NO:11的信息:
 (i)序列特征:
  (A)长度:391个氨基酸
  (B)类型:氨基酸
  (C)链型:未知
  (D)拓扑类型:未知
 (ii)分子类型:蛋白质
 (vi)初始来源:
  (A)生物:GPD1
 (xi)SEQ ID NO:11的序列描述
Met Ser Ala Ala Ala Asp Arg Leu Asn Leu Thr Ser Gly His Leu Asn
1               5                   10                  15
Ala Gly Arg Lys Arg Ser Ser Ser Ser Val Ser Leu Lys Ala Ala Glu
            20                  25                  30
Lys Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr Thr
        35                  40                  45
Ile Ala Lys Val Val Ala Glu Asn Cys Lys Gly Tyr Pro Glu Val Phe
    50                  55                  60
Ala Pro Ile Val Gln Met Trp Val Phe Glu Glu Glu Ile Asn Gly Glu
65                  70                  75                  80
Lys Leu Thr Glu Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr Leu
                85                  90                  95
Pro Gly Ile Thr Leu Pro Asp Asn Leu Val Ala Asn Pro Asp Leu Ile
            100                 105                 110
Asp Ser Val Lys Asp Val Asp Ile Ile Val Phe Asn Ile Pro His Gln
        115                 120                 125
Phe Leu Pro Arg Ile Cys Ser Gln Leu Lys Gly His Val Asp Ser His
    130                 135                 140
Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Val Gly Ala Lys Gly
145                 150                 155                 160
Val Gln Leu Leu Ser Ser Tyr Ile Thr Glu Glu Leu Gly Ile Gln Cys
                165                 170                 175
Gly Ala Leu Ser Gly Ala Asn Ile Ala Thr Glu Val Ala Gln Glu His
            180                 185                 190
Trp Ser Glu Thr Thr Val Ala Tyr His Ile Pro Lys Asp Phe Arg Gly
        195                 200                 205
Glu Gly Lys Asp Val Asp His Lys Val Leu Lys Ala Leu Phe His Arg
    210                 215                 220
Pro Tyr Phe His Val Ser Val Ile Glu Asp Val Ala Gly Ile Ser Ile
225                 230                 235                 240
Cys Gly Ala Leu Lys Asn Val Val Ala Leu Gly Cys Gly Phe Val Glu
                245                 250                 255
Gly Leu Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Val Gly
            260                 265                 270
Leu Gly Glu Ile Ile Arg Phe Gly Gln Met Phe Phe Pro Glu Ser Arg
        275                 280                 285
Glu Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile Thr
    290                 295                 300
Thr Cys Ala Gly Gly Arg Asn Val Lys Val Ala Arg Leu Met Ala Thr
305                 310                 315                 320
Ser Gly Lys Asp Ala Trp Glu Cys Glu Lys Glu Leu Leu Asn Gly Gln
                325                 330                 335
Ser Ala Gln Gly Leu Ile Thr Cys Lys Glu Val His Glu Trp Leu Glu
            340                 345                 350
Thr Cys Gly Ser Val Glu Asp Phe Pro Leu Phe Glu Ala Val Tyr Gln
        355                 360                 365
Ile Val Tyr Asn Asn Tyr Pro Met Lys Asn Leu Pro Asp Met Ile Glu
    370                 375                 380
Glu Leu Asp Leu His Glu Asp
385                 390
(2)SEQ ID NO:12的信息:
 (i)序列特征:
  (A)长度:384个氨基酸
  (B)类型:氨基酸
  (C)链型:未知
  (D)拓扑类型:未知
 (ii)分子类型:蛋白质
 (vi)初始来源:
  (A)生物:GPD2
 (xi)SEQ ID NO:12的序列描述
Met Thr Ala His Thr Asn Ile Lys Gln His Lys His Cys His Glu Asp
1               5                   10                  15
His Pro Ile Arg Arg Ser Asp Ser Ala Val Ser Ile Val His Leu Lys
            20                  25                  30
Arg Ala Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr
        35                  40                  45
Thr Ile Ala Lys Val Ile Ala Glu Asn Thr Glu Leu His Ser His Ile
    50                  55                  60
Phe Glu Pro Glu Val Arg Met Trp Val Phe Asp Glu Lys Ile Gly Asp
65                  70                  75                  80
Glu Asn Leu Thr Asp Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr
                85                  90                  95
Leu Pro Asn Ile Asp Leu Pro His Asn Leu Val Ala Asp Pro Asp Leu
            100                 105                 110
Leu His Ser Ile Lys Gly Ala Asp Ile Leu Val Phe Asn Ile Pro His
        115                 120                 125
Gln Phe Leu Pro Asn Ile Val Lys Gln Leu Gln Gly His Val Ala Pro
    130                 135                 140
His Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Leu Gly Ser Lys
145                 150                 155                 160
Gly Val Gln Leu Leu Ser Ser Tyr Val Thr Asp Glu Leu Gly Ile Gln
                165                 170                 175
Cys Gly Ala Leu Ser Gly Ala Asn Leu Ala Pro Glu Val Ala Lys Glu
            180                 185                 190
His Trp Ser Glu Thr Thr Val Ala Tyr Gln Leu Pro Lys Asp Tyr Gln
        195                 200                 205
Gly Asp Gly Lys Asp Val Asp His Lys Ile Leu Lys Leu Leu Phe His
    210                 215                 220
Arg Pro Tyr Phe His Val Asn Val Ile Asp Asp Val Ala Gly Ile Ser
225                 230                 235                 240
Ile Ala Gly Ala Leu Lys Asn Val Val Ala Leu Ala Cys Gly Phe Val
                245                 250                 255
Glu Gly Met Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Leu
            260                 265                 270
Gly Leu Gly Glu Ile Ile Lys Phe Gly Arg Met Phe Phe Pro Glu Ser
        275                 280                 285
Lys Val Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile
    290                 295                 300
Thr Thr Cys Ser Gly Gly Arg Asn Val Lys Val Ala Thr Tyr Met Ala
305                 310                 315                 320
Lys Thr Gly Lys Ser Ala Leu Glu Ala Glu Lys Glu Leu Leu Asn Gly
                325                 330                 335
Gln Ser Ala Gln Gly Ile Ile Thr Cys Arg Glu Val His Glu Trp Leu
            340                 345                 350
Gln Thr Cys Glu Leu Thr Gln Glu Phe Pro Ile Ile Arg Gly Ser Leu
        355                 360                 365
Pro Asp Ser Leu Gln Gln Arg Pro His Gly Arg Pro Thr Gly Asp Asp
    370                 375                 380
(2)SEQ ID NO:13的信息:
 (i)序列特征:
  (A)长度:614个氨基酸
  (B)类型:氨基酸
  (C)链型:未知
  (D)拓扑类型:未知
 (ii)分子类型:蛋白质
 (vi)初始来源:
  (A)生物:GUT2
 (xi)SEQ ID NO:13的序列描述
Met Thr Arg Ala Thr Trp Cys Asn Ser Pro Pro Pro Leu His Arg Gln
1               5                   10                  15
Val Ser Arg Arg Asp Leu Leu Asp Arg Leu Asp Lys Thr His Gln Phe
            20                  25                  30
Asp Val Leu Ile Ile Gly Gly Gly Ala Thr Gly Thr Gly Cys Ala Leu
        35                  40                  45
Asp Ala Ala Thr Arg Gly Leu Asn Val Ala Leu Val Glu Lys Gly Asp
    50                  55                  60
Phe Ala Ser Gly Thr Ser Ser Lys Ser Thr Lys Met Ile His Gly Gly
65                  70                  75                  80
Val Arg Tyr Leu Glu Lys Ala Phe Trp Glu Phe Ser Lys Ala Gln Leu
                85                  90                  95
Asp Leu Val Ile Glu Ala Leu Asn Glu Arg Lys His Leu Ile Asn Thr
            100                 105                 110
Ala Pro His Leu Cys Thr Val Leu Pro Ile Leu Ile Pro Ile Tyr Ser
        115                 120                 125
Thr Trp Gln Val Pro Tyr Ile Tyr Met Gly Cys Lys Phe Tyr Asp Phe
    130                 135                 140
Phe Gly Gly Ser Gln Asn Leu Lys Lys Ser Tyr Leu Leu Ser Lys Ser
145                 150                 155                 160
Ala Thr Val Glu Lys Ala Pro Met Leu Thr Thr Asp Asn Leu Lys Ala
                165                 170                 175
Ser Leu Val Tyr His Asp Gly Ser Phe Asn Asp Ser Arg Leu Asn Ala
            180                 185                 190
Thr Leu Ala Ile Thr Gly Val Glu Asn Gly Ala Thr Val Leu Ile Tyr
        195                 200                 205
Val Glu Val Gln Lys Leu Ile Lys Asp Pro Thr Ser Gly Lys Val Ile
    210                 215                 220
Gly Ala Glu Ala Arg Asp Val Glu Thr Asn Glu Leu Val Arg Ile Asn
225                 230                 235                 240
Ala Lys Cys Val Val Asn Ala Thr Gly Pro Tyr Ser Asp Ala Ile Leu
                245                 250                 255
Gln Met Asp Arg Asn Pro Ser Gly Leu Pro Asp Ser Pro Leu Asn Asp
            260                 265                 270
Asn Ser Lys Ile Lys Ser Thr Phe Asn Gln Ile Ser Val Met Asp Pro
        275                 280                 285
Lys Met Val Ile Pro Ser Ile Gly Val His Ile Val Leu Pro Ser Phe
    290                 295                 300
Tyr Ser Pro Lys Asp Met Gly Leu Leu Asp Val Arg Thr Ser Asp Gly
305                 310                 315                 320
Arg Val Met Phe Phe Leu Pro Trp Gln Gly Lys Val Leu Ala Gly Thr
                325                 330                 335
Thr Asp Ile Pro Leu Lys Gln Val Pro Glu Asn Pro Met Pro Thr Glu
            340                 345                 350
Ala Asp Ile Gln Asp Ile Leu Lys Glu Leu Gln His Tyr Ile Glu Phe
        355                 360                 365
Pro Val Lys Arg Glu Asp Val Leu Ser Ala Trp Ala Gly Val Arg Pro
    370                 375                 380
Leu Val Arg Asp Pro Arg Thr Ile Pro Ala Asp Gly Lys Lys Gly Ser
385                 390                 395                 400
Ala Thr Gln Gly Val Val Arg Ser His Phe Leu Phe Thr Ser Asp Asn
                405                 410                 415
Gly Leu Ile Thr Ile Ala Gly Gly Lys Trp Thr Thr Tyr Arg Gln Mec
            420                 425                 430
Ala Glu Glu Thr Val Asp Lys Val Val Glu Val Gly Gly Phe His Asn
        435                 440                 445
Leu Lys Pro Cys His Thr Arg Asp Ile Lys Leu Ala Gly Ala Glu Glu
    450                 455                 460
Trp Thr Gln Asn Tyr Val Ala Leu Leu Ala Gln Asn Tyr His Leu Ser
465                 470                 475                 480
Ser Lys Met Ser Asn Tyr Leu Val Gln Asn Tyr Gly Thr Arg Ser Ser
                485                 490                 495
Ile Ile Cys Glu Phe Phe Lys Glu Ser Met Glu Asn Lys Leu Pro Leu
            500                 505                 510
Ser Leu Ala Asp Lys Glu Asn Asn Val Ile Tyr Ser Ser Glu Glu Asn
        515                 520                 525
Asn Leu Val Asn Phe Asp Thr Phe Arg Tyr Pro Phe Thr Ile Gly G1u
    530                 535                 540
Leu Lys Tyr Ser Met Gln Tyr Glu Tyr Cys Arg Thr Pro Leu Asp Phe
545                 550                 555                 560
Leu Leu Arg Arg Thr Arg Phe Ala Phe Leu Asp A1a Lys Glu Ala Leu
                565                 570                 575
Asn Ala Val His Ala Thr Val Lys Val Met Gly Asp Glu Phe Asn Trp
            580                 585                 590
Ser Glu Lys Lys Arg Gln Trp Glu Leu Glu Lys Thr Val Asn Phe Ile
        595                 600                 605
Gln Gly Arg Phe Gly Val
    610
(2)SEQ ID NO:14的信息:
 (i)序列特征:
  (A)长度:339个氨基酸
  (B)类型:氨基酸
  (C)链型:未知
  (D)拓扑类型:未知
 (ii)分子类型:蛋白质
 (vi)初始来源:
  (A)生物:GPSA
 (xi)SEQ ID NO:14的序列描述
Met Asn Gln Arg Asn Ala Ser Met Thr Val Ile Gly Ala Gly Ser Tyr
1               5                   10                  15
Gly Thr Ala Leu Ala Ile Thr Leu Ala Arg Asn Gly His Glu Val Val
            20                  25                  30
Leu Trp Gly His Asp Pro Glu His Ile Ala Thr Leu Glu Arg Asp Arg
        35                  40                  45
Cys Asn Ala Ala Phe Leu Pro Asp Val Pro Phe Pro Asp Thr Leu His
    50                  55                  60
Leu Glu Ser Asp Leu Ala Thr Ala Leu Ala Ala Ser Arg Asn Ile Leu
65                  70                  75                   80
Val Val Val Pro Ser His Val Phe Gly Glu Val Leu Arg Gln Ile Lys
                85                  90                  95
Pro Leu Met Arg Pro Asp Ala Arg Leu Val Trp Ala Thr Lys Gly Leu
            100                 105                 110
Glu Ala Glu Thr Gly Arg Leu Leu Gln Asp Val Ala Arg Glu Ala Leu
        115                 120                 125
Gly Asp Gln Ile Pro Leu Ala Val Ile Ser Gly Pro Thr Phe Ala Lys
    130                 135                 140
Glu Leu Ala Ala Gly Leu Pro Thr Ala Ile Ser Leu Ala Ser Thr Asp
145                 150                 155                 160
Gln Thr Phe Ala Asp Asp Leu Gln Gln Leu Leu His Cys Gly Lys Ser
                165                 170                 175
Phe Arg Val Tyr Ser Asn Pro Asp Phe Ile Gly Val Gln Leu Gly Gly
            180                 185                 190
Ala Val Lys Asn Val Ile Ala Ile Gly Ala Gly Met Ser Asp Gly Ile
        195                 200                 205
Gly Phe Gly Ala Asn Ala Arg Thr Ala Leu Ile Thr Arg Gly Leu Ala
    210                 215                 220
Glu Met Ser Arg Leu Gly Ala Ala Leu Gly Ala Asp Pro Ala Thr Phe
225                 230                 235                 240
Met Gly Met Ala Gly Leu Gly Asp Leu Val Leu Thr Cys Thr Asp Asn
                245                 250                 255
Gln Ser Arg Asn Arg Arg Phe Gly Met Met Leu Gly Gln Gly Met Asp
            260                 265                 270
Val Gln Ser Ala Gln Glu Lys Ile Gly Gln Val Val Glu Gly Tyr Arg
        275                 280                 285
Asn Thr Lys Glu Val Arg Glu Leu Ala His Arg Phe Gly Val Glu Met
    290                 295                 300
Pro Ile Thr Glu Glu Ile Tyr Gln Val Leu Tyr Cys Gly Lys Asn Ala
305                 310                 315                 320
Arg Glu Ala Ala Leu Thr Leu Leu Gly Arg Ala Arg Lys Asp Glu Arg
                325                 330                  335
Ser Ser His
(2)SEQ ID NO:15的信息:
 (i)序列特征:
  (A)长度:501个氨基酸
  (B)类型:氨基酸
  (C)链型:未知
  (D)拓扑类型:未知
 (ii)分子类型:蛋白质
 (vi)初始来源:
  (A)生物:GLPD
 (xi)SEQ ID NO:15的序列描述
Met Glu Thr Lys Asp Leu Ile Val Ile Gly Gly Gly Ile Asn Gly Ala
1               5                   10                  15
Gly Ile Ala Ala Asp Ala Ala Gly Arg Gly Leu Ser Val Leu Met Leu
            20                  25                  30
Glu Ala Gln Asp Leu Ala Cys Ala Thr Ser Ser Ala Ser Ser Lys Leu
        35                  40                  45
Ile His Gly Gly Leu Arg Tyr Leu Glu His Tyr Glu Phe Arg Leu Val
    50                  55                  60
Ser Glu Ala Leu Ala Glu Arg Glu Val Leu Leu Lys Met Ala Pro His
65                  70                  75                  80
Ile Ala Phe Pro Met Arg Phe Arg Leu Pro His Arg Pro His Leu Arg
                85                  90                  95
Pro Ala Trp Met Ile Arg Ile Gly Leu Phe Met Tyr Asp His Leu Gly
            100                 105                 110
Lys Arg Thr Ser Leu Pro Gly Ser Thr Gly Leu Arg Phe Gly Ala Asn
        115                 120                 125
Ser Val Leu Lys Pro Glu Ile Lys Arg Gly Phe Glu Tyr Ser Asp Cys
    130                 135                 140
Trp Val Asp Asp Ala Arg Leu Val Leu Ala Asn Ala Gln Met Val Val
145                 150                 155                 160
Arg Lys Gly Gly Glu Val Leu Thr Arg Thr Arg Ala Thr Ser Ala Arg
                165                 170                 175
Arg Glu Asn Gly Leu Trp Ile Val Glu Ala Glu Asp Ile Asp Thr Gly
            180                 185                 190
Lys Lys Tyr Ser Trp Gln Ala Arg Gly Leu Val Asn Ala Thr Gly Pro
        195                 200                 205
Trp Val Lys Gln Phe Phe Asp Asp Gly Met His Leu Pro Ser Pro Tyr
    210                 215                 220
Gly Ile Arg Leu Ile Lys Gly Ser His Ile Val Val Pro Arg Val His
225                 230                 235                 240
Thr Gln Lys Gln Ala Tyr Ile Leu Gln Asn Glu Asp Lys Arg Ile Val
                245                 250                 255
Phe Val Ile Pro Trp Met Asp Glu Phe Ser Ile Ile Gly Thr Thr Asp
            260                 265                 270
Val Glu Tyr Lys Gly Asp Pro Lys Ala Val Lys Ile Glu Glu Ser Glu
        275                 280                 285
Ile Asn Tyr Leu Leu Asn Val Tyr Asn Thr His Phe Lys Lys Gln Leu
    290                 295                 300
Ser Arg Asp Asp Ile Val Trp Thr Tyr Ser Gly Val Arg Pro Leu Cys
305                 310                 315                 320
Asp Asp Glu Ser Asp Ser Pro Gln Ala Ile Thr Arg Asp Tyr Thr Leu
                325                 330                 335
Asp Ile His Asp Glu Asn Gly Lys Ala Pro Leu Leu Ser Val Phe Gly
            340                 345                 350
Gly Lys Leu Thr Thr Tyr Arg Lys Leu Ala Glu His Ala Leu Glu Lys
        355                 360                 365
Leu Thr Pro Tyr Tyr Gln Gly Ile Gly Pro Ala Trp Thr Lys Glu Ser
    370                 375                 380
Val Leu Pro Gly Gly Ala Ile Glu Gly Asp Arg Asp Asp Tyr Ala Ala
385                 390                 395                 400
Arg Leu Arg Arg Arg Tyr Pro Phe Leu Thr Glu Ser Leu Ala Arg His
                405                 410                 415
Tyr Ala Arg Thr Tyr Gly Ser Asn Ser Glu Leu Leu Leu Gly Asn Ala
            420                 425                 430
Gly Thr Val Ser Asp Leu Gly Glu Asp Phe Gly His Glu Phe Tyr Glu
        435                 440                 445
Ala Glu Leu Lys Tyr Leu Val Asp His Glu Trp Val Arg Arg Ala Asp
    450                 455                 460
Asp Ala Leu Trp Arg Arg Thr Lys Gln Gly Met Trp Leu Asn Ala Asp
465                 470                 475                 480
Gln Gln Ser Arg Val Ser Gln Trp Leu Val Glu Tyr Thr Gln Gln Arg
                485                 490                 495
Leu Ser Leu Ala Ser
            500
(2)SEQ ID NO:16的信息:
 (i)序列特征:
  (A)长度:542个氨基酸
  (B)类型:氨基酸
  (C)链型:未知
  (D)拓扑类型:未知
 (ii)分子类型:蛋白质
 (vi)初始来源:
  (A)生物:GLPABC
 (xi)SEQ ID NO:16的序列描述
Met Lys Thr Arg Asp Ser Gln Ser Ser Asp Val Ile Ile Ile Gly Gly
1               5                   10                  15
Gly Ala Thr Gly Ala Gly Ile Ala Arg Asp Cys Ala Leu Arg Gly Leu
            20                  25                  30
Arg Val Ile Leu Val Glu Arg His Asp Ile Ala Thr Gly Ala Thr Gly
        35                  40                  45
Arg Asn His Gly Leu Leu His Ser Gly Ala Arg Tyr Ala Val Thr Asp
    50                  55                  60
Ala Glu Ser Ala Arg Glu Cys Ile Ser Glu Asn Gln Ile Leu Lys Arg
65                  70                  75                  80
Ile Ala Arg His Cys Val Glu Pro Thr Asn Gly Leu Phe Ile Thr Leu
                85                  90                  95
Pro Glu Asp Asp Leu Ser Phe Gln Ala Thr Phe Ile Arg Ala Cys Glu
            100                 105                 110
Glu Ala Gly Ile Ser Ala Glu Ala Ile Asp Pro Gln Gln Ala Arg Ile
        115                 120                 125
Ile Glu Pro Ala Val Asn Pro Ala Leu Ile Gly Ala Val Lys Val Pro
    130                 135                 140
Asp Gly Thr Val Asp Pro Phe Arg Leu Thr Ala Ala Asn Met Leu Asp
145                 150                 155                 160
Ala Lys Glu His Gly Ala Val Ile Leu Thr Ala His Glu Val Thr Gly
                165                 170                 175
Leu Ile Arg Glu Gly Ala Thr Val Cys Gly Val Arg Val Arg Asn His
            180                 185                 190
Leu Thr Gly Glu Thr Gln Ala Leu His Ala Pro Val Val Val Asn Ala
        195                 200                 205
Ala Gly Ile Trp Gly Gln His Ile Ala Glu Tyr Ala Asp Leu Arg Ile
    210                 215                 220
Arg Met Phe Pro Ala Lys Gly Ser Leu Leu Ile Met Asp His Arg Ile
225                 230                 235                 240
Asn Gln His Val Ile Asn Arg Cys Arg Lys Pro Ser Asp Ala Asp Ile
                245                 250                 255
Leu Val Pro Gly Asp Thr Ile Ser Leu Ile Gly Thr Thr Ser Leu Arg
            260                 265                 270
Ile Asp Tyr Asn Glu Ile Asp Asp Asn Arg Val Thr Ala Glu Glu Val
        275                 280                 285
Asp Ile Leu Leu Arg Glu Gly Glu Lys Leu Ala Pro Val Met Ala Lys
    290                 295                 300
Thr Arg Ile Leu Arg Ala Tyr Ser Gly Val Arg Pro Leu Val Ala Ser
305                 310                 315                 320
Asp Asp Asp Pro Ser Gly Arg Asn Leu Ser Arg Gly Ile Val Leu Leu
                325                 330                 335
Asp His Ala Glu Arg Asp Gly Leu Asp Gly Phe Ile Thr Ile Thr Gly
            340                 345                 350
Gly Lys Leu Met Thr Tyr Arg Leu Met Ala Glu Trp Ala Thr Asp Ala
        355                 360                 365
Val Cys Arg Lys Leu Gly Asn Thr Arg Pro Cys Thr Thr Ala Asp Leu
    370                 375                 380
Ala Leu Pro Gly Ser Gln Glu Pro Ala Glu Val Thr Leu Arg Lys Val
385                 390                 395                 400
Ile Ser Leu Pro Ala Pro Leu Arg Gly Ser Ala Val Tyr Arg His Gly
                405                 410                 415
Asp Arg Thr Pro Ala Trp Leu Ser Glu Gly Arg Leu His Arg Ser Leu
            420                 425                 430
Val Cys Glu Cys Glu Ala Val Thr Ala Gly Glu Val Gln Tyr Ala Val
        435                 440                 445
Glu Asn Leu Asn Val Asn Ser Leu Leu Asp Leu Arg Arg Arg Thr Arg
    450                 455                 460
Val Gly Met Gly Thr Cys Gln Gly Glu Leu Cys Ala Cys Arg Ala Ala
465                 470                 475                 480
Gly Leu Leu Gln Arg Phe Asn Val Thr Thr Ser Ala Gln Ser Ile Glu
                485                 490                 495
Gln Leu Ser Thr Phe Leu Asn Glu Arg Trp Lys Gly Val Gln Pro Ile
            500                 505                 510
Ala Trp Gly Asp Ala Leu Arg Glu Ser Glu Phe Thr Arg Trp Val Tyr
        515                 520                 525
Gln Gly Leu Cys Gly Leu Glu Lys Glu Gln Lys Asp Ala Leu
    530                 535                 540
(2)SEQ ID NO:17的信息:
 (i)序列特征:
  (A)长度:250个氨基酸
  (B)类型:氨基酸
  (C)链型:未知
  (D)拓扑类型:未知
(ii)分子类型:蛋白质
(vi)初始来源:
  (A)生物:GPP2
(xi)SEQ ID NO:17的序列描述
Met Gly Leu Thr Thr Lys pro Leu Ser Leu Lys Val Asn Ala Ala Leu
1               5                   10                  15
Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln Pro Ala Ile Ala Ala
            20                  25                  30
Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr Phe Asp Ala Glu His
        35                  40                  45
Val Ile Gln Val Ser His Gly Trp Arg Thr Phe Asp Ala Ile Ala Lys
    50                  55                  60
Phe Ala Pro Asp Phe Ala Asn Glu Glu Tyr Val Asn Lys Leu Glu Ala
65                  70                  75                  80
Glu Ile Pro Val Lys Tyr Gly Glu Lys Ser Ile Glu Val Pro Gly Ala
                85                  90                  95
Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro Lys Glu Lys Trp Ala
            100                 105                 110
Val Ala Thr Ser Gly Thr Arg Asp Met Ala Gln Lys Trp Phe Glu His
        115                 120                 125
Leu Gly Ile Arg Arg Pro Lys Tyr Phe Ile Thr Ala Asn Asp Val Lys
    130                 135                 140
Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys Gly Arg Asn Gly Leu
145                 150                 155                 160
Gly Tyr Pro Ile Asn Glu Gln Asp Pro Ser Lys Ser Lys Val Val Val
                165                 170                 175
phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly Lys Ala Ala Gly Cys
            180                 185                 190
Lys Ile Ile Gly Ile Ala Thr Thr Phe Asp Leu Asp Phe Leu Lys Glu
        195                 200                 205
Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu Ser Ile Arg Val Gly
    210                 215                 220
Gly Tyr Asn Ala Glu Thr Asp Glu Val Glu Phe Ile Phe Asp Asp Tyr
225                 230                 235                 240
Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp
                245                 250
(2)SEQ ID NO:18的信息:
 (i)序列特征:
  (A)长度:709个氨基酸
  (B)类型:氨基酸
  (C)链型:未知
  (D)拓扑类型:未知
 (ii)分子类型:蛋白质
 (vi)初始来源:
  (A)生物:GUT1
 (xi)SEQ ID NO:18的序列描述
Met Phe Pro Ser Leu Phe Arg Leu Val Val Phe Ser Lys Arg Tyr Ile
1               5                   10                  15
Phe Arg Ser Ser Gln Arg Leu Tyr Thr Ser Leu Lys Gln Glu Gln Ser
            20                  25                  30
Arg Met Ser Lys Ile Met Glu Asp Leu Arg Ser Asp Tyr Val Pro Leu
        35                  40                  45
Ile Ala Ser Ile Asp Val Gly Thr Thr Ser Ser Arg Cys Ile Leu Phe
    50                  55                  60
Asn Arg Trp Gly Gln Asp Val Ser Lys His Gln Ile Glu Tyr Ser Thr
65                  70                  75                  80
Ser Ala Ser Lys Gly Lys Ile Gly Val Ser Gly Leu Arg Arg Pro Ser
                85                  90                  95
Thr Ala Pro Ala Arg Glu Thr Pro Asn Ala Gly Asp Ile Lys Thr Ser
            100                 105                 110
Gly Lys Pro Ile Phe Ser Ala Glu Gly Tyr Ala Ile Gln Glu Thr Lys
        115                 120                 125
Phe Leu Lys Ile Glu Glu Leu Asp Leu Asp Phe His Asn Glu Pro Thr
    130                 135                 140
Leu Lys Phe Pro Lys Pro Gly Trp Val Glu Cys His Pro Gln Lys Leu
145                 150                 155                 160
Leu Val Asr Val Val Gln Cys Leu Ala Ser Ser Leu Leu Ser Leu Gln
                165                 170                 175
Thr Ile Asn Ser Glu Arg Val Ala Asn Gly Leu Pro Pro Tyr Lys Val
            180                 185                 190
Ile Cys Met Gly Ile Ala Asn Met Arg Glu Thr Thr Ile Leu Trp Ser
        195                 200                 205
Arg Arg Thr Gly Lys Pro Ile Val Asn Tyr Gly Ile Val Trp Asn Asp
    210                 215                 220
Thr Arg Thr Ile Lys Ile Val Arg Asp Lys Trp Gln Asn Thr Ser Val
225                 230                 235                 240
Asp Arg Gln Leu Gln Leu Arg Gln Lys Thr Gly Leu Pro Leu Leu Ser
                245                 250                 255
Thr Tyr Phe Ser Cys Ser Lys Leu Arg Trp Phe Leu Asp Asn Glu Pro
            260                 265                 270
Leu Cys Thr Lys Ala Tyr Glu Glu Asn Asp Leu Met Phe Gly Thr Val
        275                 280                 285
Asp Thr Trp Leu Ile Tyr Gln Leu Thr Lys Gln Lys Ala Phe Val Ser
    290                 295                 300
Asp Val Thr Asn Ala Ser Arg Thr Gly Phe Met Asn Leu Ser Thr Leu
305                 310                 315                 320
Lys Tyr Asp Asn Glu Leu Leu Glu Phe Trp Gly Ile Asp Lys Asn Leu
                325                 330                 335
Ile His Met Pro Glu Ile Val Ser Ser Ser Gln Tyr Tyr Gly Asp Phe
            340                 345                 350
Gly Ile Pro Asp Trp Ile Met Glu Lys Leu His Asp Ser Pro Lys Thr
        355                 360                 365
Val Leu Arg Asp Leu Val Lys Arg Asn Leu Pro Ile Gln Gly Cys Leu
    370                 375                 380
Gly Asp Gln Ser Ala Ser Met Val Gly Gln Leu Ala Tyr Lys Pro Gly
385                 390                 395                 400
Ala Ala Lys Cys Thr Tyr Gly Thr Gly Cys Phe Leu Leu Tyr Asn Thr
                405                 410                 415
Gly Thr Lys Lys Leu Ile Ser Gln His Gly Ala Leu Thr Thr Leu Ala
            420                 425                 430
Phe Trp Phe Pro His Leu Gln Glu Tyr Gly Gly Gln Lys Pro Glu Leu
        435                 440                 445
Ser Lys Pro His Phe Ala Leu Glu Gly Ser Val Ala Val Ala Gly Ala
    450                 455                 460
Val Val Gln Trp Leu Arg Asp Asn Leu Arg Leu Ile Asp Lys Ser Glu
465                470                  475                 480
Asp Val Gly Pro Ile Ala Ser Thr Val Pro Asp Ser Gly Gly Val Val
                485                 490                 495
Phe Val Pro Ala Phe Ser Gly Leu Phe Ala Pro Tyr Trp Asp Pro Asp
            500                 505                 510
Ala Arg Ala Thr Ile Met Gly Met Ser Gln Phe Thr Thr Ala Ser His
        515                 520                 525
Ile Ala Arg Ala Ala Val Glu Gly Val Cys Phe Gln Ala Arg Ala Ile
    530                 535                 540
Leu Lys Ala Met Ser Ser Asp Ala Phe Gly Glu Gly Ser Lys Asp Arg
545                 550                 555                 560
Asp Phe Leu Glu Glu Ile Ser Asp Val Thr Tyr Glu Lys Ser Pro Leu
                565                 570                 575
Ser Val Leu Ala Val Asp Gly Gly Met Ser Arg Ser Asn Glu Val Met
            580                 585                 590
Gln Ile Gln Ala Asp Ile Leu Gly Pro Cys Val Lys Val Arg Arg Ser
        595                 600                 605
Pro Thr Ala Glu Cys Thr Ala Leu Gly Ala Ala Ile Ala Ala Asn Met
    610                 615                 620
Ala Phe Lys Asp Val Asn Glu Arg Pro Leu Trp Lys Asp Leu His Asp
625                 630                 635                 640
Val Lys Lys Trp Val Phe Tyr Asn Gly Met Glu Lys Asn Glu Gln Ile
                645                 650                 655
Ser Pro Glu Ala His Pro Asn Leu Lys Ile Phe Arg Ser Glu Ser Asp
            660                 665                 670
Asp Ala Glu Arg Arg Lys His Trp Lys Tyr Trp Glu Val Ala Val Glu
        675                 680                 685
Arg Ser Lys Gly Trp Leu Lys Asp Ile Glu Gly Glu His Glu Gln Val
    690                 695                 700
Leu Glu Asn Phe Gln
705
(2)SEQ ID NO:19的信息:
 (i)序列特征:
  (A)长度:12145个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (vi)初始来源:
  (A)生物:PHK28-26
 (xi)SEQ ID NO:19的序列描述
GTCGACCACC ACGGTGGTGA CTTTAATGCC GCTCTCATGC AGCAGCTCGG TGGCGGTCTC   60
AAAATTCAGG ATGTCGCCGG TATAGTTTTT GATAATCAGC AAGACGCCTT CGCCGCCGTC  120
AATTTGCATC GCGCATTCAA ACATTTTGTC CGGCGTCGGC GAGGTGAATA TTTCCCCCGG  180
ACAGGCGCCG GAGAGCATGC CCTGGCCGAT ATAGCCGCAG TGCATCGGTT CATGTCCGCT  240
GCCGCCGCCG GAGAGCAGGG CCACCTTGCC AGCCACCGGC GCGTCGGTGC GGGTCACATA  300
CAGCGGGTCC TGATGCAGGG TCAGCTGCGG ATGGGCTTTA GCCAGCCCCT GTAATTGTTC  360
ATTCAGTACA TCTTCAACAC GGTTAATCAG CTTTTTCATT ATTCAGTGCT CCGTTGGAGA  420
AGGTTCGATG CCGCCTCTCT GCTGGCGGAG GCGGTCATCG CGTAGGGGTA TCGTCTGACG  480
GTGGAGCGTG CCTGGCGATA TGATGATTCT GGCTGAGCGG ACGAAAAAAA GAATGCCCCG  540
ACGATCGGGT TTCATTACGA AACATTGCTT CCTGATTTTG TTTCTTTATG GAACGTTTTT  600
GCTGAGGATA TGGTGAAAAT GCGAGCTGGC GCGCTTTTTT TCTTCTGCCA TAAGCGGCGG  660
TCAGGATAGC CGGCGAAGCG GGTGGGAAAA AATTTTTTGC TGATTTTCTG CCGACTGCGG  720
GAGAAAAGGC GGTCAAACAC GGAGGATTGT AAGGGCATTA TGCGGCAAAG GAGCGGATCG  780
GGATCGCAAT CCTGACAGAG ACTAGGGTTT TTTGTTCCAA TATGGAACGT AAAAAATTAA  840
CCTGTGTTTC ATATCAGAAC AAAAAGGCGA AAGATTTTTT TGTTCCCTGC CGGCCCTACA  900
GTGATCGCAC TGCTCCGGTA CGCTCCGTTC AGGCCGCGCT TCACTGGCCG GCGCGGATAA   960
CGCCAGGGCT CATCATGTCT ACATGCGCAC TTATTTGAGG GTGAAAGGAA TGCTAAAAGT  1020
TATTCAATCT CCAGCCAAAT ATCTTCAGGG TCCTGATGCT GCTGTTCTGT TCGGTCAATA  1080
TGCCAAAAAC CTGGCGGAGA GCTTCTTCGT CATCGCTGAC GATTTCGTAA TGAAGCTGGC  1140
GGGAGAGAAA GTGGTGAATG GCCTGCAGAG CCACGATATT CGCTGCCATG CGGAACGGTT  1200
TAACGGCGAA TGCAGCCATG CGGAAATCAA CCGTCTGATG GCGATTTTGC AAAAACAGGG  1260
CTGCCGCGGC GTGGTCGGGA TCGGCGGTGG TAAAACCCTC GATACCGCGA AGGCGATCGG  1320
TTACTACCAG AAGCTGCCGG TGGTGGTGAT CCCGACCATC GCCTCGACCG ATGCGCCAAC  1380
CAGCGCGCTG TCGGTGATCT ACACCGAAGC GGGCGAGTTT GAAGAGTATC TGATCTATCC  1440
GAAAAACCCG GATATGGTGG TGATGGACAC GGCGATTATC GCCAAAGCGC CGGTACGCCT  1500
GCTGGTCTCC GGCATGGGCG ATGCGCTCTC CACCTGGTTC GAGGCCAAAG CTTGCTACGA  1560
TGCGCGCGCC ACCAGCATGG CCGGAGGACA GTCCACCGAG GCGGCGCTGA GCCTCGCCCG  1620
CCTGTGCTAT GATACGCTGC TGGCGGAGGG CGAAAAGGCC CGTCTGGCGG CGCAGGCCGG  1680
GGTAGTGACC GAAGCGCTGG AGCGCATCAT CGAGGCGAAC ACTTACCTCA GCGGCATTGG  1740
CTTTGAAAGC AGTGGCCTGG CCGCTGCCCA TGCAATCCAC AACGGTTTCA CCATTCTTGA  1800
AGAGTGCCAT CACCTGTATC ACGGTGAGAA AGTGGCCTTC GGTACCCTGG CGCAGCTGGT  1860
GCTGCAGAAC AGCCCGATGG ACGAGATTGA AACGGTGCAG GGCTTCTGCC AGCGCGTCGG  1920
CCTGCCGGTG ACGCTCGCGC AGATGGGCGT CAAAGAGGGG ATCGACGAGA AAATCGCCGC  1980
GGTGGCGAAA GCTACCTGCG CGGAAGGGGA AACCATCCAT AATATGCCGT TTGCGGTGAC  2040
CCCGGAGAGC GTCCATGCCG CTATCCTCAC CGCCGATCTG TTAGGCCAGC AGTGGCTGGC  2100
GCGTTAATTC GCGGTGGCTA AACCGCTGGC CCAGGTCAGC GGTTTTTCTT TCTCCCCTCC  2160
GGCAGTCGCT GCCGGAGGGG TTCTCTATGG TACAACGCGG AAAAGGATAT GACTGTTCAG  2220
ACTCAGGATA CCGGGAAGGC GGTCTCTTCC GTCATTGCCC AGTCATGGCA CCGCTGCAGC  2280
AAGTTTATGC AGCGCGAAAC CTGGCAAACG CCGCACCAGG CCCAGGGCCT GACCTTCGAC  2340
TCCATCTGTC GGCGTAAAAC CGCGCTGCTC ACCATCGGCC AGGCGGCGCT GGAAGACGCC  2400
TGGGAGTTTA TGGACGGCCG CCCCTGCGCG CTGTTTATTC TTGATGAGTC CGCCTGCATC  2460
CTGAGCCGTT GCGGCGAGCC GCAAACCCTG GCCCAGCTGG CTGCCCTGGG ATTTCGCGAC  2520
GGCAGCTATT GTGCGGAGAG CATTATCGGC ACCTGCGCGC TGTCGCTGGC CGCGATGCAG  2580
GGCCAGCCGA TCAACACCGC CGGCGATCGG CATTTTAAGC AGGCGCTACA GCCATGGAGT  2640
TTTTGCTCGA CGCCGGTGTT TGATAACCAC GGGCGGCTGT TCGGCTCTAT CTCGCTTTGC  2700
TGTCTGGTCG AGCACCAGTC CAGCGCCGAC CTCTCCCTGA CGCTGGCCAT CGCCCGCGAG  2760
GTGGGTAACT CCCTGCTTAC CGACAGCCTG CTGGCGGAAT CCAACCGTCA CCTCAATCAG  2820
ATGTACGGCC TGCTGGAGAG CATGGACGAT GGGGTGATGG CGTGGAACGA ACAGGGCGTG  2880
CTGCAGTTTC TCAATGTTCA GGCGGCGAGA CTGCTGCATC TTGATGCTCA GGCCAGCCAG  2940
GGGAAAAATA TCGCCGATCT GGTGACCCTC CCGGCGCTGC TGCGCCGCGC CATCAAACAC  3000
GCCCGCGGCC TGAATCACGT CGAAGTCACC TTTGAAAGTC AGCATCAGTT TGTCGATGCG  3060
GTGATCACCT TAAAACCGAT TGTCGAGGCG CAAGGCAACA GTTTTATTCT GCTGCTGCAT  3120
CCGGTGGAGC AGATGCGGCA GCTGATGACC AGCCAGCTCG GTAAAGTCAG CCACACCTTT  3180
GAGCAGATGT CTGCCGACGA TCCGGAAACC CGACGCCTGA TCCACTTTGG CCGCCAGGCG  3240
GCGCGCGGCG GCTTCCCGGT GCTACTGTGC GGCGAAGAGG GGGTCGGGAA AGAGCTGCTG  3300
AGCCAGGCTA TTCACAATGA AAGCGAACGG GCGGGCGGCC CCTACATCTC CGTCAACTGC  3360
CAGCTATATG CCGACAGCGT GCTGGGCCAG GACTTTATGG GCAGCGCCCC TACCGACGAT  3420
GAAAATGGTC GCCTGAGCCG CCTTGAGCTG GCCAACGGCG GCACCCTGTT TCTGGAAAAG  3480
ATCGAGTATC TGGCGCCGGA GCTGCAGTCG GCTCTGCTGC AGGTGATTAA GCAGGGCGTG  3540
CTCACCCGCC TCGACGCCCG GCGCCTGATC CCGGTGGATG TGAAGGTGAT TGCCACCACC  3600
ACCGTCGATC TGGCCAATCT GGTGGAACAG AACCGCTTTA GCCGCCAGCT GTACTATGCG  3660
CTGCACTCCT TTGAGATCGT CATCCCGCCG CTGCGCGCCC GACGCAACAG TATTCCGTCG  3720
CTGGTGCATA ACCGGTTGAA GAGCCTGGAG AAGCGTTTCT CTTCGCGACT GAAAGTGGAC  3780
GATGACGCGC TGGCACAGCT GGTGGCCTAC TCGTGGCCGG GGAATGATTT TGAGCTCAAC  3840
AGCGTCATTG AGAATATCGC CATCAGCAGC GACAACGGCC ACATTCGCCT GAGTAATCTG  3900
CCGGAATATC TCTTTTCCGA GCGGCCGGGC GGGGATAGCG CGTCATCGCT GCTGCCGGCC  3960
AGCCTGACTT TTAGCGCCAT CGAAAAGGAA GCTATTATTC ACGCCGCCCG GGTGACCAGC  4020
GGGCGGGTGC AGGAGATGTC GCAGCTGCTC AATATCGGCC GCACCACCCT GTGGCGCAAA  4080
ATGAAGCAGT ACGATATTGA CGCCAGCCAG TTCAAGCGCA AGCATCAGGC CTAGTCTCTT  4140
CGATTCGCGC CATGGAGAAC AGGGCATCCG ACAGGCGATT GCTGTAGCGT TTGAGCGCGT  4200
CGCGCAGCGG ATGCGCGCGG TCCATGGCCG TCAGCAGGCG TTCGAGCCGA CGGGACTGGG  4260
TGCGCGCCAC GTGCAGCTGG GCAGAGGCGA GATTCCTCCC CGGGATCACG AACTGTTTTA  4320
ACGGGCCGCT CTCGGCCATA TTGCGGTCGA TAAGCCGCTC CAGGGCGGTG ATCTCCTCTT  4380
CGCCGATCGT CTGGCTCAGG CGGGTCAGGC CCCGCGCATC GCTGGCCAGT TCAGCCCCCA  4440
GCACGAACAG CGTCTGCTGA ATATGGTGCA GGCTTTCCCG CAGCCCGGCG TCGCGGGTCG  4500
TGGCGTAGCA GACGCCCAGC TGGGATATCA GTTCATCGAC GGTGCCGTAG GCCTCGACGC  4560
GAATATGGTC TTTCTCGATG CGGCTGCCGC CGTACAGGGC GGTGGTGCCT TTATCCCCGG  4620
TGCGGGTATA GATACGATAC ATTCAGTTTC TCTCACTTAA CGGCAGGACT TTAACCAGCT  4680
GCCCGGCGTT GGCGCCGAGC GTACGCAGTT GATCGTCGCT ATCGGTGACG TGTCCGGTAG  4740
CCAGCGGCGC GTCCGCCGGC AGCTGGGCAT GAGTGAGGGC TATCTCGCCG GACGCGCTGA  4800
GCCCGATACC CACCCGCAGG GGCGAGCTTC TGGCCGCCAG GGCGCCCAGC GCAGCGGCGT  4860
CACCGCCTCC GTCATAGGTT ATGGTCTGGC AGGGGACCCC CTGCTCCTCC AGCCCCCAGC  4920
ACAGCTCATT GATGGCGCCG GCATGGTGCC CGCGCGGATC GTAAAACAGG CGTACGCCTG  4980
GCGGTGAAAG CGACATGACG GTCCCCTCGT TAACACTCAG AATGCCTGGC GGAAAATCGC  5040
GGCAATCTCC TGCTCGTTGC CTTTACGCGG GTTCGAGAAC GCATTGCCGT CTTTTAGAGC  5100
CATCTCCGCC ATGTAGGGGA AGTCGGCCTC TTTTACCCCC AGATCGCGCA GATGCTGCGG  5160
AATACCGATA TCCATCGACA GACGCGTGAT AGCGGCGATG GCTTTTTCCG CCGCGTCGAG  5220
AGTGGACAGT CCGGTGATAT TTTCGCCCAT CAGTTCAGCG ATATCGGCGA ATTTCTCCGG  5280
GTTGGCGATC AGGTTGTAGC GCGCCACATG CGGCAGCAGG ACAGCGTTGG CCACGCCGTG  5340
CGGCATGTCG TACAGGCCGC CCAGCTGGTG CGCCATGGCG TGCACGTAGC CGAGGTTGGC  5400
GTTATTGAAA GCCATCCCGG CCAGCAGAGA AGCATAGGCC ATGTTTTCCC GCGCCTGCAG  5460
ATTGCTGCCG AGGGCCACGG CCTGGCGCAG GTTGCGGGCG ATGAGGCGGA TCGCCTGCAT  5520
GGCGGCGGCG TCCGTCACCG GGTTAGCGTC TTTGGAGATA TAGGCCTCTA CGGCGTGGGT  5580
CAGGGCATCC ATCCCGGTCG CCGCGGTCAG GGCGGCCGGT TTACCGATCA TCAGCAGTGG  5640
ATCGTTGATA GAGACCGACG GCAGTTTGCG CCAGCTGACG ATCACAAACT TCACTTTGGT  5700
TTCGGTGTTG GTCAGGACGC AGTGGCGGGT GACCTCGCTG GCGGTGCCGG CGGTGGTATT  5760
GACCGCGACG ATAGGCGGCA GCGGGTTGGT CAGGGTCTCG ATTCCGGCAT ACTGGTACAG  5820
ATCGCCCTCA TGGGTGGCGG CGATGCCGAT GCCTTTGCCG CAATCGTGCG GGCTGCCGCC  5880
GCCCACGGTG ACGATGATGT CGCACTGTTC GCGGCGAAAC ACGGCGAGGC CGTCGCGCAC  5940
GTTGGTGTCT TTCGGGTTCG GCTCGACGCC GTCAAAGATC GCCACCTCGA TCCCGGCCTC  6000
CCGCAGATAA TGCAGGGTTT TGTCCACCGC GCCATCTTTA ATTGCCCGCA GGCCTTTGTC  6060
GGTGACCAGC AGGGCTTTTT TCCCCCCCAG CAGCTGGCAG CGTTCGCCGA CTACGGAAAT  6120
GGCGTTGGGG CCAAAAAAGT TAACGTTTGG CACCAGATAA TCAAACATAC GATAGCTCAT  6180
AATATACCTT CTCGCTTCAG GTTATAATGC GGAAAAACAA TCCAGGGCGC ACTGGGCTAA  6240
TAATTGATCC TGCTCGACCG TACCGCCGCT AACGCCGACG GCGCCAATTA CCTGCTCATT  6300
AAAAATAACT GGCAGGCCGC CGCCAAAAAT AATAATTCGC TGTTGGTTGG TTAGCTGCAG  6360
ACCGTACAGA GATTGTCCTG GCTGGACCGC TGACGTAATT TCATGGGTAC CTTGCTTCAG  6420
GCTGCAGGCG CTCCAGGCTT TATTCAGGGA AATATCGCAG CTGGAGACGA AGGCCTCGTC  6480
CATCCGCTGG ATAAGCAGCG TGTTGCCTCC GCGGTCAACT ACGGAAAACA CCACCGCCAC  6540
GTTGATCTCA GTGGCTTTTT TTTCCACCGC CGCCGCCATT TGCTGGGCGG CGGCCAGGGT  6600
GATTGTCTGA ACTTGTTGGC TCTTGTTCAT CATTCTCTCC CGCACCAGGA TAACGCTGGC  6660
GCGAATAGTC AGTAGGGGGC GATAGTAAAA AACTATTACC ATTCGGTTGG CTTGCTTTAT  6720
TTTTGTCAGC GTTATTTTGT CGCCCGCCAT GATTTAGTCA ATAGGGTTAA AATAGCGTCG  6780
GAAAAACGTA ATTAAGGGCG TTTTTTATTA ATTGATTTAT ATCATTGCGG GCGATCACAT  6840
TTTTTATTTT TGCCGCCGGA GTAAAGTTTC ATAGTGAAAC TGTCGGTAGA TTTCGTGTGC  6900
CAAATTGAAA CGAAATTAAA TTTATTTTTT TCACCACTGG CTCATTTAAA GTTCCGCTAT  6960
TGCCGGTAAT GGCCGGGCGG CAACGACGCT GGCCCGGCGT ATTCGCTACC GTCTGCGGAT  7020
TTCACCTTTT GAGCCGATGA ACAATGAAAA GATCAAAACG ATTTGCAGTA CTGGCCCAGC  7080
GCCCCGTCAA TCAGGACGGG CTGATTGGCG AGTGGCCTGA AGAGGGGCTG ATCGCCATGG  7140
ACAGCCCCTT TGACCCGGTC TCTTCAGTAA AAGTGGACAA CGGTCTGATC GTCGAACTGG  7200
ACGGCAAACG CCGGGACCAG TTTGACATGA TCGACCGATT TATCGCCGAT TACGCGATCA  7260
ACGTTGAGCG CACAGAGCAG GCAATGCGCC TGGAGGCGGT GGAAATAGCC CGTATGCTGG  7320
TGGATATTCA CGTCAGCCGG GAGGAGATCA TTGCCATCAC TACCGCCATC ACGCCGGCCA  7380
AAGCGGTCGA GGTGATGGCG CAGATGAACG TGGTGGAGAT GATGATGGCG CTGCAGAAGA  7440
TGCGTGCCCG CCGGACCCCC TCCAACCAGT GCCACGTCAC CAATCTCAAA GATAATCCGG  7500
TGCAGATTGC CGCTGACGCC GCCGAGGCCG GGATCCGCGG CTTCTCAGAA CAGGAGACCA  7560
CGGTCGGTAT CGCGCGCTAC GCGCCGTTTA ACGCCCTGGC GCTGTTGGTC GGTTCGCAGT  7620
GCGGCCGCCC CGGCGTGTTG ACGCAGTGCT CGGTGGAAGA GGCCACCGAG CTGGAGCTGG  7680
GCATGCGTGG CTTAACCAGC TACGCCGAGA CGGTGTCGGT CTACGGCACC GAAGCGGTAT  7740
TTACCGACGG CGATGATACG CCGTGGTCAA AGGCGTTCCT CGCCTCGGCC TACGCCTCCC  7800
GCGGGTTGAA AATGCGCTAC ACCTCCGGCA CCGGATCCGA AGCGCTGATG GGCTATTCGG  7860
AGAGCAAGTC GATGCTCTAC CTCGAATCGC GCTGCATCTT CATTACTAAA GGCGCCGGGG  7920
TTCAGGGACT GCAAAACGGC GCGGTGAGCT GTATCGGCAT GACCGGCGCT GTGCCGTCGG  7980
GCATTCGGGC GGTGCTGGCG GAAAACCTGA TCGCCTCTAT GCTCGACCTC GAAGTGGCGT  8040
CCGCCAACGA CCAGACTTTC TCCCACTCGG ATATTCGCCG CACCGCGCGC ACCCTGATGC  8100
AGATGCTGCC GGGCACCGAC TTTATTTTCT CCGGCTACAG CGCGGTGCCG AACTACGACA  8160
ACATGTTCGC CGGCTCGAAC TTCGATGCGG AAGATTTTGA TGATTACAAC ATCCTGCAGC  8220
GTGACCTGAT GGTTGACGGC GGCCTGCGTC CGGTGACCGA GGCGGAAACC ATTGCCATTC  8280
GCCAGAAAGC GGCGCGGGCG ATCCAGGCGG TTTTCCGCGA GCTGGGGCTG CCGCCAATCG  8340
CCGACGAGGA GGTGGAGGCC GCCACCTACG CGCACGGCAG CAACGAGATG CCGCCGCGTA  8400
ACGTGGTGGA GGATCTGAGT GCGGTGGAAG AGATGATGAA GCGCAACATC ACCGGCCTCG  8460
ATATTGTCGG CGCGCTGAGC CGCAGCGGCT TTGAGGATAT CGCCAGCAAT ATTCTCAATA  8520
TGCTGCGCCA GCGGGTCACC GGCGATTACC TGCAGACCTC GGCCATTCTC GATCGGCAGT  8580
TCGAGGTGGT GAGTGCGGTC AACGACATCA ATGACTATCA GGGGCCGGGC ACCGGCTATC  8640
GCATCTCTGC CGAACGCTGG GCGGAGATCA AAAATATTCC GGGCGTGGTT CAGCCCGACA  8700
CCATTGAATA AGGCGGTATT CCTGTGCAAC AGACAACCCA AATTCAGCCC TCTTTTACCC  8760
TGAAAACCCG CGAGGGCGGG GTAGCTTCTG CCGATGAACG CGCCGATGAA GTGGTGATCG  8820
GCGTCGGCCC TGCCTTCGAT AAACACCAGC ATCACACTCT GATCGATATG CCCCATGGCG  8880
CGATCCTCAA AGAGCTGATT GCCGGGGTGG AAGAAGAGGG GCTTCACGCC CGGGTGGTGC  8940
GCATTCTGCG CACGTCCGAC GTCTCCTTTA TGGCCTGGGA TGCGGCCAAC CTGAGCGGCT  9000
CGGGGATCGG CATCGGTATC CAGTCGAAGG GGACCACGGT CATCCATCAG CGCGATCTGC  9060
TGCCGCTCAG CAACCTGGAG CTGTTCTCCC AGGCGCCGCT GCTGACGCTG GAGACCTACC  9120
GGCAGATTGG CAAAAACGCT GCGCGCTATG CGCGCAAAGA GTCACCTTCG CCGGTGCCGG  9180
TGGTGAACGA TCAGATGGTG CGGCCGAAAT TTATGGCCAA AGCCGCGCTA TTTCATATCA  9240
AAGAGACCAA ACATGTGGTG CAGGACGCCG AGCCCGTCAC CCTGCACATC GACTTAGTAA  9300
GGGAGTGACC ATGAGCGAGA AAACCATGCG CGTGCAGGAT TATCCGTTAG CCACCCGCTG  9360
CCCGGAGCAT ATCCTGACGC CTACCGGCAA ACCATTGACC GATATTACCC TCGAGAAGGT  9420
GCTCTCTGGC GAGGTGGGCC CGCAGGATGT GCGGATCTCC CGCCAGACCC TTGAGTACCA     9480
GGCGCAGATT GCCGAGCAGA TGCAGCGCCA TGCGGTGGCG CGCAATTTCC GCCGCGCGGC     9540
GGAGCTTATC GCCATTCCTG ACGAGCGCAT TCTGGCTATC TATAACGCGC TGCGCCCGTT     9600
CCGCTCCTCG CAGGCGGAGC TGCTGGCGAT CGCCGACGAG CTGGAGCACA CCTGGCATGC     9660
GACAGTGAAT GCCGCCTTTG TCCGGGAGTC GGCGGAAGTG TATCAGCAGC GGCATAAGCT     9720
GCGTAAAGGA AGCTAAGCGG AGGTCAGCAT GCCGTTAATA GCCGGGATTG ATATCGGCAA     9780
CGCCACCACC GAGGTGGCGC TGGCGTCCGA CTACCCGCAG GCGAGGGCGT TTGTTGCCAG     9840
CGGGATCGTC GCGACGACGG GCATGAAAGG GACGCGGGAC AATATCGCCG GGACCCTCGC     9900
CGCGCTGGAG CAGGCCCTGG CGAAAACACC GTGGTCGATG AGCGATGTCT CTCGCATCTA     9960
TCTTAACGAA GCCGCGCCGG TGATTGGCGA TGTGGCGATG GAGACCATCA CCGAGACCAT    10020
TATCACCGAA TCGACCATGA TCGGTCATAA CCCGCAGACG CCGGGCGGGG TGGGCGTTGG    10080
CGTGGGGACG ACTATCGCCC TCGGGCGGCT GGCGACGCTG CCGGCGGCGC AGTATGCCGA    10140
GGGGTGGATC GTACTGATTG ACGACGCCGT CGATTTCCTT GACGCCGTGT GGTGGCTCAA    10200
TGAGGCGCTC GACCGGGGGA TCAACGTGGT GGCGGCGATC CTCAAAAAGG ACGACGGCGT    10260
GCTGGTGAAC AACCGCCTGC GTAAAACCCT GCCGGTGGTG GATGAAGTGA CGCTGCTGGA    10320
GCAGGTCCCC GAGGGGGTAA TGGCGGCGGT GGAAGTGGCC GCGCCGGGCC AGGTGGTGCG    10380
GATCCTGTCG AATCCCTACG GGATCGCCAC CTTCTTCGGG CTAAGCCCGG AAGAGACCCA    10440
GGCCATCGTC CCCATCGCCC GCGCCCTGAT TGGCAACCGT TCCGCGGTGG TGCTCAAGAC    10500
CCCGCAGGGG GATGTGCAGT CGCGGGTGAT CCCGGCGGGC AACCTCTACA TTAGCGGCGA    10560
AAAGCGCCGC GGAGAGGCCG ATGTCGCCGA GGGCGCGGAA GCCATCATGC AGGCGATGAG    10620
CGCCTGCGCT CCGGTACGCG ACATCCGCGG CGAACCGGGC ACCCACGCCG GCGGCATGCT    10680
TGAGCGGGTG CGCAAGGTAA TGGCGTCCCT GACCGGCCAT GAGATGAGCG CGATATACAT    10740
CCAGGATCTG CTGGCGGTGG ATACGTTTAT TCCGCGCAAG GTGCAGGGCG GGATGGCCGG    10800
CGAGTGCGCC ATGGAGAATG CCGTCGGGAT GGCGGCGATG GTGAAAGCGG ATCGTCTGCA    10860
AATGCAGGTT ATCGCCCGCG AACTGAGCGC CCGACTGCAG ACCGAGGTGG TGGTGGGCGG    10920
CGTGGAGGCC AACATGGCCA TCGCCGGGGC GTTAACCACT CCCGGCTGTG CGGCGCCGCT    10980
GGCGATCCTC GACCTCGGCG CCGGCTCGAC GGATGCGGCG ATCGTCAACG CGGAGGGGCA    11040
GATAACGGCG GTCCATCTCG CCGGGGCGGG GAATATGGTC AGCCTGTTGA TTAAAACCGA    11100
GCTGGGCCTC GAGGATCTTT CGCTGGCGGA AGCGATAAAA AAATACCCGC TGGCCAAAGT    11160
GGAAAGCCTG TTCAGTATTC GTCACGAGAA TGGCGCGGTG GAGTTCTTTC GGGAAGCCCT    11220
CAGCCCGGCG GTGTTCGCCA AAGTGGTGTA CATCAAGGAG GGCGAACTGG TGCCGATCGA    11280
TAACGCCAGC CCGCTGGAAA AAATTCGTCT CGTGCGCCGG CAGGCGAAAG AGAAAGTGTT    11340
TGTCACCAAC TGCCTGCGCG CGCTGCGCCA GGTCTCACCC GGCGGTTCCA TTCGCGATAT    11400
CGCCTTTGTG GTGCTGGTGG GCGGCTCATC GCTGGACTTT GAGATCCCGC AGCTTATCAC    11460
GGAAGCCTTG TCGCACTATG GCGTGGTCGC CGGGCAGGGC AATATTCGGG GAACAGAAGG    11520
GCCGCGCAAT GCGGTCGCCA CCGGGCTGCT ACTGGCCGGT CAGGCGAATT AAACGGGCGC    11580
TCGCGCCAGC CTCTCTCTTT AACGTGCTAT TTCAGGATGC CGATAATGAA CCAGACTTCT    11640
ACCTTAACCG GGCAGTGCGT GGCCGAGTTT CTTGGCACCG GATTGCTCAT TTTCTTCGGC    11700
GCGGGCTGCG TCGCTGCGCT GCGGGTCGCC GGGGCCAGCT TTGGTCAGTG GGAGATCAGT    11760
ATTATCTGGG GCCTTGGCGT CGCCATGGCC ATCTACCTGA CGGCCGGTGT CTCCGGCGCG    11820
CACCTAAATC CGGCGGTGAC CATTGCCCTG TGGCTGTTCG CCTGTTTTGA ACGCCGCAAG    11880
GTGCTGCCGT TTATTGTTGC CCAGACGGCC GGGGCCTTCT GCGCCGCCGC GCTGGTGTAT    11940
GGGCTCTATC GCCAGCTGTT TCTCGATCTT GAACAGAGTC AGCATATCGT GCGCGGCACT    12000
GCCGCCAGTC TTAACCTGGC CGGGGTCTTT TCCACGTACC CGCATCCACA TATCACTTTT    12060
ATACAAGCGT TTGCCGTGGA GACCACCATC ACGGCAATCC TGATGGCGAT GATCATGGCC    12120
CTGACCGACG ACGGCAACGG AATTC                                          12145
(2)SEQ ID NO:20的信息:
 (i)序列特征:
  (A)长度:94个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:20的序列描述
AGCTTAGGAG TCTAGAATAT TGAGCTCGAA TTCCCGGGCA TGCGGTACCG GATCCAGAAA    60
AAAGCCCGCA CCTGACAGTG CGGGCTTTTT TTTT                                94
(2)SEQ ID NO:21的信息:
 (i)序列特征:
  (A)长度:37个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:21的序列描述
GGAATTCAGA TCTCAGCAAT GAGCGAGAAA ACCATGC                             37
(2)SEQ ID NO:22的信息:
 (i)序列特征:
  (A)长度:27个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:22的序列描述
GCTCTAGATT AGCTTCCTTT ACGCAGC                                       27
(2)SEQ ID NO:23的信息:
 (i)序列特征:
  (A)长度:33个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:23的序列描述
GGCCAAGCTT AAGGAGGTTA ATTAAATGAAAAG                                 33
(2)SEQ ID NO:24的信息:
 (i)序列特征:
  (A)长度:26个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:24的序列描述
GCTCTAGATT ATTCAATGGT GTCGGG                                        26
(2)SEQ ID NO:25的信息:
 (i)序列特征:
  (A)长度:42个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:25的序列描述
GCGCCGTCTA GAATTATGAG CTATCGTATG TTTGATTATC TG                      42
(2)SEQ ID NO:26的信息:
 (i)序列特征:
  (A)长度:36个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:26的序列描述
TCTGATACGG GATCCTCAGA ATGCCTGGCG GAAAAT                             36
(2)SEQ ID NO:27的信息:
 (i)序列特征:
  (A)长度:51个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:27的序列描述
GCGCGGATCC AGGAGTCTAG AATTATGGGA TTGACTACTA AACCTCTATC T            51
(2)SEQ ID NO:28的信息:
 (i)序列特征:
  (A)长度:36个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:28的序列描述
GATACGCCCG GGTTACCATT TCAACAGATC GTCCTT                36
(2)SEQ ID NO:29的信息:
 (i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:29的序列描述
TCGACGAATT CAGGAGGA                                    18
(2)SEQ ID NO:30的信息:
 (i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:30的序列描述
CTAGTCCTCC TGAATTCG                                    18
(2)SEQ ID NO:31的信息:
 (i)序列特征:
  (A)长度:19个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:31的序列描述
CTAGTAAGGA GGACAATTC                                   19
(2)SEQ ID NO:32的信息:
 (i)序列特征:
  (A)长度:19个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑类型:线性
 (ii)分子类型:DNA(基因组)
 (xi)SEQ ID NO:32的序列描述
CATGGAATTG TCCTCCTTA                                   19
(2)SEQ ID NO:33的信息:
 (i)序列特征:
  (A)长度:271个氨基酸
  (B)类型:氨基酸
  (C)链型:未知
  (D)拓扑类型:未知
 (ii)分子类型:蛋白质
 (vi)初始来源:
  (A)生物:GPP1
 (xi)SEQ ID NO:33的序列描述
Met Lys Arg Phe Asn Val Leu Lys Tyr Ile Arg Thr Thr Lys Ala Asn
1               5                   10                  15
Ile Gln Thr Ile Ala Met Pro Leu Thr Thr Lys Pro Leu Ser Leu Lys
            20                  25                  30
Ile Asn Ala Ala Leu Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln
        35                  40                  45
Pro Ala Ile Ala Ala Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr
    50                  55                  60
Phe Asp Ala Glu His Val Ile His Ile Ser His Gly Trp Arg Thr Tyr
65                  70                  75                  80
Asp Ala Ile Ala Lys Phe Ala Pro Asp Phe Ala Asp Glu Glu Tyr Val
                85                  90                  95
Asn Lys Leu Glu Gly Glu Ile Pro Glu Lys Tyr Gly Glu His Ser Ile
            100                 105                 110
Glu Val Pro Gly Ala Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro
        115                 120                 125
Lys Glu Lys Trp Ala Val Ala Thr Ser Gly Thr Arg Asp Met Ala Lys
    130                 135                 140
Lys Trp Phe Asp Ile Leu Lys Ile Lys Arg Pro Glu Tyr Phe Ile Thr
145                 150                 155                 160
Ala Asn Asp Val Lys Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys
                165                 170                 175
Gly Arg Asn Gly Leu Gly Phe Pro Ile Asn Glu Gln Asp Pro Ser Lys
            180                 185                 190
Ser Lys Val Val Val Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly
        195                 200                 205
Lys Ala Ala Gly Cys Lys Ile Val Gly Ile Ala Thr Thr Phe Asp Leu
    210                 215                 220
Asp Phe Leu Lys Glu Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu
225                 230                 235                 240
Ser Ile Arg Val Gly Glu Tyr Asn Ala Glu Thr Asp Glu Val Glu Leu
                245                 250                 255
Ile Phe Asp Asp Tyr Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp
            260                 265                 270
(2)SEQ ID NO:34的信息:
 (i)序列特征:
  (A)长度:555个氨基酸
  (B)类型:氨基酸
  (C)链型:未知
  (D)拓扑类型:未知
 (ii)分子类型:蛋白质
 (vi)初始来源:
  (A)生物:DHAB1
 (xi)SEQ ID NO:34的序列描述
Met Lys Arg Ser Lys Arg Phe Ala Val Leu Ala Gln Arg Pro Val Asn
1               5                   10                  15
Gln Asp Gly Leu Ile Gly Glu Trp Pro Glu Glu Gly Leu Ile Ala Met
            20                  25                  30
Asp Ser Pro Phe Asp Pro Val Ser Ser Val Lys Val Asp Asn Gly Leu
        35                  40                  45
Ile Val Glu Leu Asp Gly Lys Arg Arg Asp Gln Phe Asp Met Ile Asp
    50                  55                  60
Arg Phe Ile Ala Asp Tyr Ala Ile Asn Val Glu Arg Thr Glu Gln Ala
65                  70                  75                  80
Met Arg Leu Glu Ala Val Glu Ile Ala Arg Met Leu Val Asp Ile His
                85                  90                  95
Val Ser Arg Glu Glu Ile Ile Ala Ile Thr Thr Ala Ile Thr Pro Ala
            100                 105                 110
Lys Ala Val Glu Val Met Ala Gln Met Asn Val Val Glu Met Met Met
        115                 120                 125
Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His
    130                 135                 140
Val Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala
145                 150                 155                 160
Glu Ala Gly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile
                165                 170                 175
Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ser Gln
            180                185                  190
Cys Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr
        195                 200                 205
Glu Leu Glu Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val
    210                 215                 220
Ser Val Tyr Gly Thr Glu Ala Val Phe Thr Asp Gly Asp Asp Thr Pro
225                 230                 235                 240
Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys
                245                 250                 255
Mat Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ser
            260                 265                 270
Glu Ser Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr
        275                 280                 285
Lys Gly Ala Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile
    290                 295                 300
Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu
305                 310                 315                 320
Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp
                325                 330                 335
Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met
            340                 345                 350
Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val
        355                 360                 365
Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp
    370                 375                 380
Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly
385                 390                 395                 400
Leu Arg Pro Val Thr Glu Ala Glu Thr Ile Ala Ile Arg Gln Lys Ala
                405                 410                 415
Ala Arg Ala Ile Gln Ala Val Phe Arg Glu Leu Gly Leu Pro Pro Ile
            420                 425                 430
Ala Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Asn Glu
        435                 440                 445
Met Pro Pro Arg Asn Val Val Glu Asp Leu Ser Ala Val Glu Glu Met
    450                 455                 460
Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Gly Ala Leu Ser Arg
465                 470                 475                 480
Ser Gly Phe Glu Asp Ile Ala Ser Asn Ile Leu Asn Met Leu Arg Gln
                485                 490                 495
Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Gln
            500                 505                 510
Phe Glu Val Val Ser Ala Val Asn Asp Ile Asn Asp Tyr Gln Gly Pro
        515                 520                 525
Gly Thr Gly Tyr Arg Ile ser Ala Glu Arg Trp Ala Glu Ile Lys Asn
    530                 535                 540
Ile Pro Gly Val Val Gln Pro Asp Thr Ile Glu
545                 550                 555
(2)SEQ ID NO:35的信息:
  (i)序列特征:
    (A)长度:194个氨基酸
    (B)类型:氨基酸
    (C)链型:未知
    (D)拓扑类型:未知
  (ii)分子类型:蛋白质
  (vi)初始来源:
    (A)生物:DHAB2
  (xi)SEQ ID NO:35的序列描述
Met Gln Gln Thr Thr Gln Ile Gln Pro Ser Phe Thr Leu Lys Thr Arg
1               5                   10                  15
Glu Gly Gly Val Ala Ser Ala Asp Glu Arg Ala Asp Glu Val Val Ile
            20                  25                  30
Gly Val Gly Pro Ala Phe Asp Lys His Gln His His Thr Leu Ile Asp
        35                  40                  45
Met Pro His Gly Ala Ile Leu Lys Glu Leu Ile Ala Gly Val Glu Glu
    50                  55                  60
Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val
65                  70                  75                  80
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Sar Gly Ser Gly Ile Gly
                85                  90                  95
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu
            100                 105                 110
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr
        115                 120                 125
Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg
    130                 135                 140
Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg
145                 150                 155                 160
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys
                165                 170                 175
His Val Val Gln Asp Ala Glu Pro Val Thr Leu His Ile Asp Leu Val
            180                 185                 190
Arg Glu
(2)SEQ ID NO:36的信息:
  (i)序列特征:
    (A)长度:140个氨基酸
    (B)类型:氨基酸
    (C)链型:未知
    (D)拓扑类型:未知
  (ii)分子类型:蛋白质
  (vi)初始来源:
    (A)生物:DHAB3
  (xi)SEQ ID NO:36的序列描述
Met Ser Glu Lys Thr Met Arg Val Gln Asp Tyr Pro Leu Ala Thr Arg
1               5                   10                  15
Cys Pro Glu His Ile Leu Thr Pro Thr Gly Lys Pro Leu Thr Asp Ile
            20                  25                  30
Thr Leu Glu Lys Val Leu Ser Gly Glu Val Gly pro Gln Asp Val Arg
         35                 40                  45
Ile  Ser Arg Gln Thr Leu Glu Tyr Gln Ala Gln Ile Ala Glu Gln Met
     50                  55                  60
Gln His Ala Val Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile Ala
65                  70                  75                  80
Ile Pro Asp Glu Arg Ile Leu Ala Ile Tyr Asn Ala Leu Arg Pro Phe
                85                  90                  95
Arg Ser Ser Gln Ala Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu His
            100                 105                 110
Thr Trp His Ala Thr Val Asn Ala Ala Phe Val Arg Glu Ser Ala Glu
        115                 120                 125
Val Tyr Gln Gln Arg His Lys Leu Arg Lys Gly Ser
    130                 135                 140
(2)SEQ ID NO:37的信息:
  (i)序列特征:
    (A)长度:387个氨基酸
    (B)类型:氨基酸
    (C)链型:未知
    (D)拓扑类型:未知
  (ii)分子类型:蛋白质
  (vi)初始来源:
    (A)生物:DHAT
  (xi)SEQ ID NO:37的序列描述
Met Ser Tyr Arg Met Phe Asp Tyr Leu Val Pro Asn Val Asn Phe Phe
1               5                   10                  15
Gly Pro Asn Ala Ile Ser Val Val Gly Glu Arg Cys Gln Leu Leu Gly
            20                  25                  30
Gly Lys Lys Ala Leu Leu Val Thr Asp Lys Gly Leu Arg Ala Ile Lys
        35                  40                  45
Asp Gly Ala Val Asp Lys Thr Leu His Tyr Leu Arg Glu Ala Gly Ile
    50                  55                  60
Glu Val Ala Ile Phe Asp Gly Val Glu pro Asn Pro Lys Asp Thr Asn
65                  70                  75                  80
Val Arg Asp Gly Leu Ala Val Phe Arg Arg Glu Gln Cys Asp Ile Ile
                85                  90                  95
Val Thr Val Gly Gly Gly Ser Pro His Asp Cys Gly Lys Gly Ile Gly
            100                 105                 110
Ile Ala Ala Thr His Glu Gly Asp Leu Tyr Gln Tyr Ala Gly Ile Glu
        115                 120                 125
Thr Leu Thr Asn Pro Leu Pro Pro Ile Val Ala Val Asn Thr Thr Ala
    130                 135                 140
Gly Thr Ala Ser Glu Val Thr Arg His Cys Val Leu Thr Asn Thr Glu
145                 150                 155                 160
Thr Lys Val Lys Phe Val Ile Val Ser Trp Arg Lys Leu Pro Ser Val
                165                 170                 175
Ser Ile Asn Asp Pro Leu Leu Met Ile Gly Lys Pro Ala Ala Leu Thr
            180                 185                 190
Ala Ala Thr Gly Met Asp Ala Leu Thr His Ala Val Glu Ala Tyr Ile
        195                 200                 205
Ser Lys Asp Ala Asn Pro Val Thr Asp Ala Ala Ala Met Gln Ala Ile
    210                 215                 220
Arg Ieu Ile Ala Arg Asn Leu Arg Gln Ala Val Ala Leu Gly Ser Asn
225                 230                 235                 240
Leu Gln Ala Arg Glu Asn Met Ala Tyr Ala Ser Leu Leu Ala Gly Met
                245                 250                 255
Ala Phe Asn Asn Ala Asn Leu Gly Tyr Val His Ala Met Ala His Gln
            260                 265                 270
Leu Gly Gly Leu Tyr Asp Met Pro His Gly Val Ala Asn Ala Val Leu
        275                 280                 285
Leu Pro His Val Ala Arg Tyr Asn Leu Ile Ala Asn Pro Glu Lys Phe
    290                 295                 300
Ala Asp Ile Ala Glu Leu Met Gly Glu Asn Ile Thr Gly Leu Ser Thr
305                 310                 315                 320
Leu Asp Ala Ala Glu Lys Ala Ile Ala Ala Ile Thr Arg Leu Ser Met
                325                 330                 335
Asp Ile Gly Ile Pro Gln His Leu Arg Asp Leu Gly Val Lys Glu Ala
            340                 345                 350
Asp Phe Pro Tyr Met Ala Glu Met Ala  Leu Lys Asp Gly Asn Ala Phe
        355                 360                  365
Ser Asn Pro Arg Lys Gly Asn Glu Gln Glu Ile Ala Ala Ile Phe Arg
    370                 375                 380
Gln Ala Phe
385
(2)SEQ ID NO:38的信息:
  (i)序列特征:
    (A)长度:27个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (xi)SEQ ID NO:38的序列描述
GCGAATTCAT GAGCTATCGT ATGTTTG                                    27
(2)SEQ ID NO:39的信息:
  (i)序列特征:
    (A)长度:28个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (xi)SEQ ID NO:39的序列描述
GCGAATTCAG AATGCCTGGC GGAAAATC                                   28
(2)SEQ ID NO:40的信息:
  (i)序列特征:
    (A)长度:28个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (xi)SEQ ID NO:40的序列描述
GGGAATTCAT GAGCGAGAAA ACCATGCG                                   28
(2)SEQ ID NO:41的信息:
  (i)序列特征:
    (A)长度:27个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (xi)SEQ ID NO:41的序列描述
GCGAATTCTT AGCTTCCTTT ACGCAGC                                      27
(2)SEQ ID NO:42的信息:
  (i)序列特征:
    (A)长度:30个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (xi)SEQ ID NO:42的序列描述
GCGAATTCAT GCAACAGACA ACCCAAATTC                                   30
(2)SEQ ID NO:43的信息:
  (i)序列特征:
    (A)长度:25个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
(ii)分子类型:DNA(基因组)
(xi)SEQ ID NO:43的序列描述
GCGAATTCAC TCCCTTACTA AGTCG                                        25
(2)SEQ ID NO:44的信息:
  (i)序列特征:
    (A)长度:30个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (xi)SEQ ID NO:44的序列描述
GGGAATTCAT GAAAAGATCA AAACGATTTG                                   30
(2)SEQ ID NO:45的信息:
  (i)序列特征:
    (A)长度:29个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (xi)SEQ ID NO:45的序列描述
GCGAATTCTT ATTCAATGGT GTCGGGCTG                                    29
(2)SEQ ID NO:46的信息:
  (i)序列特征:
    (A)长度:34个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
(xi)SEQ ID NO:46的序列描述
TTGATAATAT AACCATGGCT GCTGCTGCTG ATAG                             34
(2)SEQ ID NO:47的信息:
  (i)序列特征:
    (A)长度:39个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (xi)SEQ ID NO:47的序列描述
GTATGATATG TTATCTTGGA TCCAATAAAT CTAATCTTC                         39
(2)SEQ ID NO:48的信息:
  (i)序列特征:
    (A)长度:24个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (xi)SEQ ID NO:48的序列描述
CATGACTAGT AAGGAGGACA ATTC                                         24
(2)SEQ ID NO:49的信息:
  (i)序列特征:
    (A)长度:24个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑类型:线性
  (ii)分子类型:DNA(基因组)
  (xi)SEQ ID NO:49的序列描述
CATGGAATTG TCCTCCTTAC TAGT                                          24

Claims (32)

1.一种用于从微生物产生1,3-丙二醇的方法,包含如下步骤:
a)获得能产生1,3-丙二醇的重组微生物,该微生物包含至少一种编码脱水酶活性的核酸和一种编码蛋白质X的核酸,
其中编码蛋白质X的核酸分离自甘油脱水酶基因簇或二醇脱水酶基因簇,其中甘油脱水酶基因簇来自选自克雷伯氏菌属和柠檬酸杆菌属种类的生物;二醇脱水酶基因簇来自选自克雷伯氏菌属、梭状芽孢杆菌属和沙门氏菌属种类的生物,
其中,蛋白质X与SEQ ID NO:59、SEQ ID NO:67或登记号为U09771的弗劳地柠檬酸杆菌氨基酸序列有至少90%的氨基酸序列相似性,并且没有酶活性;以及
b)在至少一种能被转化为1,3-丙二醇的碳源存在下以及在适合产生1,3-丙二醇的条件下培养该重组微生物,其中碳源选自单糖、寡糖、多糖以及一碳底物,且其中该重组微生物中1,3-丙二醇的产量高于无蛋白质X的重组微生物中1,3-丙二醇的产量。
2.权利要求1的方法,其还包含回收1,3-丙二醇的步骤。
3.权利要求1的方法,其中重组微生物选自柠檬酸杆菌属,肠杆菌属,梭状芽孢杆菌属,克雷伯氏菌属,气杆菌属,乳杆菌属,曲霉属,酵母属,裂殖酵母属,接合酵母属,毕氏酵母属,克鲁维酵母属,假丝酵母属,汉逊酵母属,德巴利酵母属,毛霉属,球拟酵母属,甲基细菌属,埃希氏菌属,沙门氏菌属,芽孢杆菌属,链霉菌属和假单胞菌属。
4.权利要求3的方法,其中重组微生物选自大肠杆菌和克雷伯氏菌属的种。
5.权利要求1的方法,其中该重组微生物包含至少一种编码选自蛋白质1、蛋白质2和蛋白质3的蛋白质的核酸,其中
蛋白质1与SEQ ID NO:60或SEQ ID NO:61具有至少95%的氨基酸序列相似性;
蛋白质2与SEQ ID NO:62或SEQ ID NO:63具有至少95%的氨基酸序列相似性;且
蛋白质3与SEQ ID NO:64或SEQ ID NO:65具有至少95%的氨基酸序列相似性。
6.权利要求5的方法,其中蛋白质1有如SEQ ID NO:60或SEQ IDNO:61所示的序列。
7.权利要求5的方法,其中蛋白质2有如SEQ ID NO:62或SEQ IDNO:63所示的序列。
8.权利要求5的方法,其中蛋白质3有如SEQ ID NO:64或SEQ IDNO:65所示的序列。
9.权利要求1的方法,其中编码脱水酶活性的核酸对于该生物为异源。
10.权利要求1的方法,其中编码脱水酶活性的核酸对于该生物为同源。
11.权利要求1的方法,其中编码蛋白质X的核酸稳定地维持在宿主基因组内。
12.权利要求5的方法,其中至少一个编码选自蛋白质1、蛋白质2和蛋白质3的蛋白质的核酸被稳定地维持在宿主基因组内。
13.权利要求1的方法,其中碳源是葡萄糖。
14.权利要求1的方法,其中编码蛋白质X的核酸有如SEQ IDNO:59所示的序列。
15.权利要求1的方法,其中编码蛋白质X的核酸具有SEQ IDNO:67所示的序列。
16.一种能从碳源产生1,3-丙二醇的重组微生物,该重组微生物包含a)至少一种编码脱水酶活性的核酸;b)至少一种编码甘油-3-磷酸酶的核酸;以及c)至少一种编码蛋白质X的核酸,
其中编码蛋白质X的核酸分离自甘油脱水酶基因簇或二醇脱水酶基因簇,其中甘油脱水酶基因簇来自选自克雷伯氏菌属和柠檬酸杆菌属种类的生物;二醇脱水酶基因簇来自选自克雷伯氏菌属、梭状芽孢杆菌属和沙门氏菌属种类的生物,
其中,蛋白质X与SEQ ID NO:59、SEQ ID NO:67或登记号为U09771的弗劳地柠檬酸杆菌氨基酸序列有至少90%的氨基酸序列相似性,并且没有酶活性,而且其中该重组微生物中1,3-丙二醇的产量高于无蛋白质X的重组微生物中1,3-丙二醇的产量。
17.权利要求16的重组微生物,其还包含d)至少一种编码选自蛋白质1、蛋白质2和蛋白质3的蛋白质的核酸,其中
蛋白质1与SEQ ID NO:60或SEQ ID NO:61具有至少95%的氨基酸序列相似性;
蛋白质2与SEQ ID NO:62或SEQ ID NO:63具有至少95%的氨基酸序列相似性;且
蛋白质3与SEQ ID NO:64或SEQ ID NO:65具有至少95%的氨基酸序列相似性。
18.权利要求17的重组微生物,其中蛋白质1有如SEQ ID NO:60或SEQ ID NO:61所示的序列。
19.权利要求17的重组微生物,其中蛋白质2有如SEQ ID NO:62或SEQ ID NO:63所示的序列。
20.权利要求17的重组微生物,其中蛋白质3有如SEQ ID NO:64或SEQ ID NO:65所示的序列。
21.权利要求16的重组微生物,其中该编码脱水酶活性的核酸对于该微生物为异源。
22.权利要求16的重组微生物,其中该编码脱水酶活性的核酸对于该微生物为同源。
23.权利要求16的重组微生物,其选自柠檬酸杆菌属,肠杆菌属,梭状芽孢杆菌属,克雷伯氏菌属,气杆菌属,乳杆菌属,曲霉属,酵母属,裂殖酵母属,接合酵母属,毕氏酵母属,克鲁维酵母属,假丝酵母属,汉逊酵母属,德巴利酵母属,毛霉属,球拟酵母属,甲基细菌属,埃希氏菌属,沙门氏菌属,芽孢杆菌属,链霉菌属和假单胞菌属。
24.权利要求23的重组微生物,其中该重组微生物是大肠杆菌或克雷伯氏菌属的种。
25.权利要求16的重组微生物,其中编码蛋白质X的核酸有如SEQID NO:59中所示的序列。
26.权利要求16的重组微生物,其中编码蛋白质X的核酸具有SEQID NO:67所示的序列。
27.一种用于在能产生1,3-丙二醇并含有至少一个编码脱水酶活性的核酸之经转化的微生物中延长脱水酶活性的半寿期的方法,包含将编码蛋白质X的核酸引入该微生物,
其中编码蛋白质X的核酸分离自甘油脱水酶基因簇或二醇脱水酶基因簇,其中甘油脱水酶基因簇来自选自克雷伯氏菌属和柠檬酸杆菌属种类的生物;二醇脱水酶基因簇来自选自克雷伯氏菌属、梭状芽孢杆菌属和沙门氏菌属种类的生物,
其中,蛋白质X与SEQ ID NO:59、SEQ ID NO:67或登记号为U09771的弗劳地柠檬酸杆菌氨基酸序列有至少90%的氨基酸序列相似性,并且没有酶活性,而且其中该重组微生物中1,3-丙二醇的产量高于无蛋白质X的重组微生物中1,3-丙二醇的产量。
28.权利要求27的方法,其中编码脱水酶活性的核酸对于该微生物为异源。
29.权利要求27的方法,其中编码脱水酶活性的核酸对于该微生物为同源。
30.权利要求27的方法,其还包含将至少一种编码选自蛋白质1、蛋白质2和蛋白质3的蛋白质的核酸引入该微生物的步骤,其中
蛋白质1与SEQ ID NO:60或SEQ ID NO:61具有至少95%的氨基酸序列相似性;
蛋白质2与SEQ ID NO:62或SEQ ID NO:63具有至少95%的氨基酸序列相似性;且
蛋白质3与SEQ ID NO:64或SEQ ID NO:65具有至少95%的氨基酸序列相似性。
31.权利要求27的方法,其中微生物选自柠檬酸杆菌属,肠杆菌属,梭状芽孢杆菌属,克雷伯氏菌属,气杆菌属,乳杆菌属,曲霉属,酵母属,裂殖酵母属,接合酵母属,毕氏酵母属,克鲁维酵母属,假丝酵母属,汉逊酵母属,德巴利酵母属,毛霉属,球拟酵母属,甲基细菌属,埃希氏菌属,沙门氏菌属,芽孢杆菌属,链霉菌属和假单胞菌属。
32.权利要求31的方法,其中所述微生物是大肠杆菌或克雷伯氏菌属的种。
CNB97180074XA 1996-11-13 1997-11-13 1,3-丙二醇的重组生产方法 Expired - Lifetime CN1198935C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US3060196P 1996-11-13 1996-11-13
US60/030,601 1996-11-13

Publications (2)

Publication Number Publication Date
CN1239511A CN1239511A (zh) 1999-12-22
CN1198935C true CN1198935C (zh) 2005-04-27

Family

ID=21854996

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB971812985A Expired - Fee Related CN1236063C (zh) 1996-11-13 1997-11-10 用重组生物体生产1,3-丙二醇的方法
CNB97180074XA Expired - Lifetime CN1198935C (zh) 1996-11-13 1997-11-13 1,3-丙二醇的重组生产方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB971812985A Expired - Fee Related CN1236063C (zh) 1996-11-13 1997-11-10 用重组生物体生产1,3-丙二醇的方法

Country Status (18)

Country Link
US (3) US6013494A (zh)
EP (2) EP0942989B1 (zh)
JP (2) JP4327909B2 (zh)
KR (1) KR100509310B1 (zh)
CN (2) CN1236063C (zh)
AT (2) ATE452979T1 (zh)
AU (2) AU733534B2 (zh)
BR (2) BR9712761B1 (zh)
CA (2) CA2269088C (zh)
DE (2) DE69739715D1 (zh)
DK (1) DK0946732T3 (zh)
ES (1) ES2336858T3 (zh)
ID (1) ID21487A (zh)
IL (2) IL129722A0 (zh)
MY (1) MY131754A (zh)
NZ (1) NZ335392A (zh)
WO (2) WO1998021339A1 (zh)
ZA (1) ZA9710194B (zh)

Families Citing this family (168)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6428767B1 (en) 1995-05-12 2002-08-06 E. I. Du Pont De Nemours And Company Method for identifying the source of carbon in 1,3-propanediol
US5686276A (en) 1995-05-12 1997-11-11 E. I. Du Pont De Nemours And Company Bioconversion of a fermentable carbon source to 1,3-propanediol by a single microorganism
WO1998021339A1 (en) * 1996-11-13 1998-05-22 E.I. Du Pont De Nemours And Company Method for the production of 1,3-propanediol by recombinant organisms
EP0948628B1 (en) * 1996-11-13 2010-06-23 E.I. Du Pont De Nemours And Company Method for the production of glycerol by recombinant organisms
IL136407A0 (en) 1997-12-02 2001-06-14 Du Pont Method for the production of glycerol by recombinant organisms
GB9806762D0 (en) * 1998-03-31 1998-05-27 Neutec Pharma Plc Treatment and diagnosis of staphylococcal infections
US6432686B1 (en) 1998-05-12 2002-08-13 E. I. Du Pont De Nemours And Company Method for the production of 1,3-propanediol by recombinant organisms comprising genes for vitamin B12 transport
US7074608B1 (en) 1998-05-12 2006-07-11 E. I. Du Pont De Nemours And Company Method for the production of 1,3-propanediol by recombinant organisms comprising genes for coenzyme B12 synthesis
DE69938105T2 (de) 1998-08-04 2009-01-29 Metabolix, Inc., Cambridge Herstellung von polyhydroxyalkanoaten aus polyolen
US6468773B1 (en) * 1999-05-19 2002-10-22 Genencor International, Inc. Mutant 1,3-propandiol dehydrogenase
FR2796081B1 (fr) 1999-07-09 2003-09-26 Agronomique Inst Nat Rech Procede de preparation du 1,3-propanediol par un micro-organisme recombinant en l'absence de coenzyme b12 ou de l'un de ses precurseurs
EP1586647A1 (en) * 1999-08-18 2005-10-19 E.I. du Pont de Nemours and Company Process for the biological production of 1,3-propanediol with high titer
WO2001012833A2 (en) 1999-08-18 2001-02-22 E.I. Du Pont De Nemours And Company Process for the biological production of 1,3-propanediol
BR0008355A (pt) * 1999-08-30 2002-07-16 Wisconsin Alumni Res Found Produção de ácido 3-hidroxipropionico em organismos recombinantes
US6803218B1 (en) 1999-09-24 2004-10-12 Genencor Intl., Inc. Enzymes which dehydrate glycerol
FR2800751B1 (fr) 1999-11-09 2003-08-29 Roquette Freres Procede de production de 1,3 propanediol par voie fermentaire
FR2801058B1 (fr) 1999-11-16 2002-01-18 Roquette Freres Procede de purification du 1,3-propanediol a partir d'un milieu de fermentation
US6617478B2 (en) 2000-11-29 2003-09-09 Samsung Electronics Co., Ltd. Process for preparing a 1,3-alkandiol from 3-hydroxyester
EP1211234A3 (en) 2000-11-29 2003-11-26 Samsung Electronics Co., Ltd. Process for preparing 1,3-alkandiols from 3-hydroxyesters
BR0307010A (pt) * 2002-01-18 2006-04-11 Cargill Inc alanina 2,3-aminomutase
EP2374879A3 (en) 2002-04-22 2012-01-11 E. I. du Pont de Nemours and Company Promoter and plasmid system for genetic engineering
CA2484001A1 (en) * 2002-05-08 2003-11-20 Basf Plant Science Gmbh Methods for increasing oil content in plants
EP2305801B1 (en) 2002-08-16 2017-07-05 Danisco US Inc. Novel variant hyprocrea jecorina CBH1 cellulases
BRPI0314498B1 (pt) 2002-10-04 2019-08-20 E.I. Du Pont De Nemours And Company Escherichia coli transgênica e método para a bioprodução de 1,3-propanodiol
US20060121581A1 (en) 2002-10-04 2006-06-08 Cervin Marguerite A Production of bacterial strains cross reference to related applications
WO2004044210A2 (en) 2002-11-06 2004-05-27 University Of Florida Materials and methods for the efficient production of acetate and other products
CN1965088A (zh) 2002-12-16 2007-05-16 纳幕尔杜邦公司 具有改善了的反应动力学的b12-依赖型脱水酶
US20050233030A1 (en) * 2004-03-10 2005-10-20 Broin And Associates, Inc. Methods and systems for producing ethanol using raw starch and fractionation
MXPA05009553A (es) * 2003-03-10 2006-03-17 Broin And Associates Inc Metodo para producir etanol utilizando almidon como materia prima.
WO2004085611A2 (en) * 2003-03-21 2004-10-07 The Research Foundation Of State University Of New York Model for mutually exclusive domain folding molecular switch
CA2771875A1 (en) 2003-04-01 2005-01-06 Danisco Us Inc. Variant hypocrea jecorina cbh1
US7056439B2 (en) * 2003-05-06 2006-06-06 Tate & Lyle Ingredidents Americas, Inc. Process for producing 1, 3-propanediol
EP1625224B1 (en) * 2003-05-06 2010-07-28 E.I. Du Pont De Nemours And Company Purification of biologically-produced 1,3-propanediol
SI1685244T1 (sl) 2003-11-21 2012-06-29 Danisco Us Inc Ekspresija encimov, ki hidrolizirajo zrnat škrob, v Trichodermi in postopek za proizvajanje glukoze iz zrnatih škrobnih substratov
US20050239181A1 (en) * 2004-03-10 2005-10-27 Broin And Associates, Inc. Continuous process for producing ethanol using raw starch
EP1731604A4 (en) * 2004-03-26 2007-04-04 Nippon Catalytic Chem Ind PROCESS FOR THE PREPARATION OF 1,3-PROPANEL AND / OR 3-HYDROXYPROPIONIC ACID
MX2007001195A (es) * 2004-07-30 2007-10-03 Cargill Inc Alanina 2,3-aminomutasas.
WO2006074005A2 (en) 2004-12-30 2006-07-13 Genencor International, Inc. Variant hypocrea jecorina cbh2 cellulases
US20070029252A1 (en) * 2005-04-12 2007-02-08 Dunson James B Jr System and process for biomass treatment
US7781191B2 (en) * 2005-04-12 2010-08-24 E. I. Du Pont De Nemours And Company Treatment of biomass to obtain a target chemical
CN101155925B (zh) * 2005-04-12 2012-05-09 纳幕尔杜邦公司 处理生物质以获得乙醇的方法
US20070037267A1 (en) * 2005-05-02 2007-02-15 Broin And Associates, Inc. Methods and systems for producing ethanol using raw starch and fractionation
US7524660B2 (en) 2005-05-05 2009-04-28 E.I. Du Pont De Nemours And Company Utilization of fructose in microbial production strains
CN1327001C (zh) * 2005-06-03 2007-07-18 清华大学 利用生物柴油副产物甘油生产1,3-丙二醇的方法
EP1907244A4 (en) * 2005-06-16 2009-07-01 Wabash Technologies Inc PEDAL ASSEMBLY WITH A HYSTERESEMECHANISM
CN100427605C (zh) * 2005-06-17 2008-10-22 清华大学 一种由粗淀粉原料生产1,3-丙二醇和2,3-丁二醇的方法
DE102005048818A1 (de) 2005-10-10 2007-04-12 Degussa Ag Mikrobiologische Herstellung von 3-Hydroxypropionsäure
US7919289B2 (en) 2005-10-10 2011-04-05 Poet Research, Inc. Methods and systems for producing ethanol using raw starch and selecting plant material
NZ566406A (en) 2005-10-26 2012-04-27 Butamax Advanced Biofuels Llc Fermentive production of four carbon alcohols
US8273558B2 (en) 2005-10-26 2012-09-25 Butamax(Tm) Advanced Biofuels Llc Fermentive production of four carbon alcohols
US9303225B2 (en) 2005-10-26 2016-04-05 Butamax Advanced Biofuels Llc Method for the production of isobutanol by recombinant yeast
CN100392071C (zh) * 2005-12-05 2008-06-04 中国农业大学 产乳酸途径缺失的工程菌及其构建方法与应用
CN100463968C (zh) * 2006-01-27 2009-02-25 华侨大学 一种由生物催化转化甘油制备1,3-丙二醇和二羟基丙酮的方法
WO2007090675A2 (en) * 2006-02-06 2007-08-16 Dsm Ip Assets B.V. Novel oxidoreductases and uses thereof
US20070275139A1 (en) * 2006-02-10 2007-11-29 Melissa Joerger Food compositions comprising renewably-based, biodegradable1,3-propanediol
US20070203323A1 (en) 2006-02-10 2007-08-30 Gyorgyi Fenyvesi Food compositions comprising biologically-based biodegradable 1,3-propanediol esters
CN1935991B (zh) * 2006-06-21 2010-05-12 南宁中诺生物工程有限责任公司 产气荚膜梭菌甘油脱水酶基因及其1,3-丙二醇的生产方法
JP5130811B2 (ja) * 2006-07-19 2013-01-30 東レ株式会社 連続発酵による1,3−プロパンジオールの製造方法
DE102006039203B4 (de) 2006-08-22 2014-06-18 Evonik Degussa Gmbh Verfahren zur Herstellung von durch Kristallisation gereinigter Acrylsäure aus Hydroxypropionsäure sowie Vorrichtung dazu
WO2008052596A1 (en) * 2006-10-31 2008-05-08 Metabolic Explorer Process for the biological production of n-butanol with high yield
WO2008052595A1 (en) * 2006-10-31 2008-05-08 Metabolic Explorer Process for the biological production of 1,3-propanediol from glycerol with high yield
US20080176957A1 (en) * 2006-11-15 2008-07-24 Dupont Tate & Lyle Bio Products Company, Llc Preservative compositions comprising renewably-based, biodegradable 1,3-propanediol
DE102007015583A1 (de) 2007-03-29 2008-10-02 Albert-Ludwigs-Universität Freiburg Ein Enzym zur Herstellung von Methylmalonyl-Coenzym A oder Ethylmalonyl-Coenzym A sowie dessen Verwendung
CN101130782B (zh) * 2007-07-23 2011-01-26 江南大学 以葡萄糖为底物产1,3-丙二醇重组酿酒酵母的构建方法
US20090053800A1 (en) * 2007-08-22 2009-02-26 Julie Friend Biomass Treatment Apparatus
US7807419B2 (en) * 2007-08-22 2010-10-05 E. I. Du Pont De Nemours And Company Process for concentrated biomass saccharification
US8445236B2 (en) * 2007-08-22 2013-05-21 Alliance For Sustainable Energy Llc Biomass pretreatment
US7819976B2 (en) * 2007-08-22 2010-10-26 E. I. Du Pont De Nemours And Company Biomass treatment method
DE102007041862A1 (de) 2007-09-03 2009-03-19 Evonik Degussa Gmbh Mikrobiologische Herstellung von Isoprenoiden
MX2010003064A (es) 2007-09-21 2010-04-07 Basf Plant Science Gmbh Plantas con rendimiento aumentado.
CN101205541B (zh) * 2007-10-18 2010-12-08 北京化工大学 重组表达载体和用其转化的宿主细胞发酵甘油高产1,3-丙二醇的方法
US8048624B1 (en) 2007-12-04 2011-11-01 Opx Biotechnologies, Inc. Compositions and methods for 3-hydroxypropionate bio-production from biomass
WO2009078712A2 (en) * 2007-12-17 2009-06-25 Universiteit Van Amsterdam Light-driven co2 reduction to organic compounds to serve as fuels or as industrial half products by an autotroph containing a fermentative gene cassette
DE102007060705A1 (de) 2007-12-17 2009-06-18 Evonik Degussa Gmbh ω-Aminocarbonsäuren oder ihre Lactame, herstellende, rekombinante Zellen
JP5690721B2 (ja) 2008-06-06 2015-03-25 ダニスコ・ユーエス・インク 非セルロース素材への親和性の低減されたセルラーゼ変異体を含む組成物および方法
DE102008002715A1 (de) 2008-06-27 2009-12-31 Evonik Röhm Gmbh 2-Hydroxyisobuttersäure produzierende rekombinante Zelle
DE102008041299A1 (de) 2008-08-18 2010-02-25 Evonik Degussa Gmbh Neuartiges, universell einsetzbares addiction-System
WO2010031083A2 (en) * 2008-09-15 2010-03-18 Opx Biotechnologies, Inc. Methods, systems and compositions related to reduction of conversions of microbially produced 3-hydroxypropionic acid (3-hp) to aldehyde metabolites
EP2364358B1 (en) 2008-12-10 2013-03-06 Direvo Industrial Biotechnology GmbH Polypeptides having cellobiohydrolase ii activity
WO2010080489A1 (en) * 2008-12-19 2010-07-15 E. I. Du Pont De Nemours And Company Ozone treatment of biomass to enhance enzymatic saccharification
WO2010102060A2 (en) * 2009-03-03 2010-09-10 Poet Research, Inc. System for pre-treatment of biomass for the production of ethanol
US8450094B1 (en) 2009-03-03 2013-05-28 Poet Research, Inc. System for management of yeast to facilitate the production of ethanol
HUE034951T2 (en) 2009-03-03 2018-03-28 Poet Res Inc Fermentation system for producing ethanol from xylose
US9068206B1 (en) 2009-03-03 2015-06-30 Poet Research, Inc. System for treatment of biomass to facilitate the production of ethanol
BRPI1010957A2 (pt) 2009-06-03 2018-02-06 Danisco Us Inc variantes de celulase com expressão, atividade e/ou estabilidade aprimorada e uso das mesmas.
US8809027B1 (en) 2009-09-27 2014-08-19 Opx Biotechnologies, Inc. Genetically modified organisms for increased microbial production of 3-hydroxypropionic acid involving an oxaloacetate alpha-decarboxylase
WO2011038364A1 (en) 2009-09-27 2011-03-31 Opx Biotechnologies, Inc. Method for producing 3-hydroxypropionic acid and other products
US8852903B2 (en) 2009-10-23 2014-10-07 E I Du Pont De Nemours And Company Co-metabolism of fructose and glucose in microbial production strains
DE102009046623A1 (de) 2009-11-11 2011-05-12 Evonik Röhm Gmbh Verwendung eines zu einem MeaB-Protein homologen Proteins zur Erhöhung der enzymatischen Aktivität einer 3-Hydroxycarbonsäure-CoA-Mutase
DE102010014680A1 (de) 2009-11-18 2011-08-18 Evonik Degussa GmbH, 45128 Zellen, Nukleinsäuren, Enzyme und deren Verwendung sowie Verfahren zur Herstellung von Sophorolipiden
WO2011063363A2 (en) * 2009-11-20 2011-05-26 Opx Biotechnologies, Inc. Production of an organic acid and/or related chemicals
US20110136190A1 (en) * 2009-12-04 2011-06-09 E. I. Du Pont De Nemours And Company Recombinant bacteria for producing glycerol and glycerol-derived products from sucrose
US8034592B2 (en) * 2009-12-10 2011-10-11 The Curators Of The University Of Missouri Fossil fuel-free process of lignocellulosic pretreatment with biological hydrogen production
WO2011100601A1 (en) 2010-02-11 2011-08-18 Metabolix, Inc. Process for gamma-butyrolactone production
KR101144235B1 (ko) * 2010-02-25 2012-05-10 한국과학기술연구원 바이오에탄올 폐발효액을 이용한 부탄올의 제조방법
CN103003414A (zh) * 2010-04-19 2013-03-27 札幌啤酒株式会社 新微生物以及使用该新微生物的氢的制造方法、1,3-丙二醇的制造方法和生物柴油废液的处理方法
US8906235B2 (en) 2010-04-28 2014-12-09 E I Du Pont De Nemours And Company Process for liquid/solid separation of lignocellulosic biomass hydrolysate fermentation broth
US8721794B2 (en) 2010-04-28 2014-05-13 E I Du Pont De Nemours And Company Production of high solids syrup from lignocellulosic biomass hydrolysate fermentation broth
KR101220499B1 (ko) * 2010-05-25 2013-01-10 한국생명공학연구원 글리세롤로부터 3-하이드록시프로피온산을 고수율로 제조하는 방법
JP5998130B2 (ja) 2010-07-12 2016-09-28 ユニヴェルシテイト ヘントUniversiteit Gent 付加価値バイオ生成物の生成のための代謝操作された生物
DE102010032484A1 (de) 2010-07-28 2012-02-02 Evonik Goldschmidt Gmbh Zellen und Verfahren zur Herstellung von Rhamnolipiden
US20130224804A1 (en) * 2010-09-01 2013-08-29 Eric Knight Expression of steady state metabolic pathways
US8129170B1 (en) 2010-12-06 2012-03-06 E.I. Du Pont De Nemours And Company Recombinant bacteria having the ability to metabolize sucrose
CN103649321B (zh) * 2011-04-05 2019-07-16 拉勒曼德匈牙利流动性管理有限责任公司 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法
KR101560467B1 (ko) 2011-04-13 2015-10-14 이엘씨 매니지먼트 엘엘씨 개인 관리 조성물을 위한 컨디셔닝제
WO2012142169A2 (en) 2011-04-13 2012-10-18 Elc Management Llc Mild anionic surfactants suitable for personal care compositions
FR2976949B1 (fr) * 2011-06-21 2015-08-28 Sanofi Sa Procede de preparation de levures genetiquement transformees capables de produire une molecule d'interet a haut titre
US8785697B2 (en) 2011-06-24 2014-07-22 Eastman Chemical Company Nickel modified catalyst for the production of hydroxy ether hydrocarbons by vapor phase hydrogenolysis of cyclic acetals and ketals
US8829207B2 (en) 2011-06-24 2014-09-09 Eastman Chemical Company Production of cyclic acetals by reactive distillation
US8829206B2 (en) 2011-06-24 2014-09-09 Eastman Chemical Company Production of cyclic acetals or ketals using solid acid catalysts
US9388105B2 (en) 2011-06-24 2016-07-12 Eastman Chemical Company Production of hydroxy ether hydrocarbons by liquid phase hydrogenolysis of cyclic acetals or cyclic ketals
US8969598B2 (en) 2011-06-24 2015-03-03 Eastman Chemical Company Production of cyclic acetals or ketals using liquid-phase acid catalysts
US9056313B2 (en) 2011-06-24 2015-06-16 Eastman Chemical Company Catalysts for the production of hydroxy ether hydrocarbons by vapor phase hydrogenolysis of cyclic acetals and ketals
US9000229B2 (en) 2011-06-24 2015-04-07 Eastman Chemical Company Production of hydroxy ether hydrocarbons by vapor phase hydrogenolysis of cyclic acetals and ketals
EP2540834A1 (en) 2011-06-29 2013-01-02 Metabolic Explorer Method for the preparation of 1,3-propanediol
JP2013013353A (ja) * 2011-07-01 2013-01-24 Daicel Corp 1,3−プロパンジオールの製造方法
JP2013070675A (ja) * 2011-09-28 2013-04-22 Daicel Corp アルキルジオールを産生する組換え菌の培養方法
DE102012201360A1 (de) 2012-01-31 2013-08-01 Evonik Industries Ag Zellen und Verfahren zur Herstellung von Rhamnolipiden
US8686114B2 (en) 2012-03-05 2014-04-01 E I Du Pont De Nemours And Company Variant sucrose transporter polypeptides
US9017961B2 (en) 2012-03-05 2015-04-28 E.I. Du Pont De Nemours And Company Recombinant bacteria comprising novel sucrose transporters
CN102634543A (zh) * 2012-05-04 2012-08-15 杭玉玲 微生物发酵生产1,3-丙二醇的方法
CN104350034B (zh) 2012-06-08 2018-07-31 Cj 第一制糖株式会社 可再生丙烯酸生产和自其制备的产物
CA2881666A1 (en) 2012-08-10 2014-02-13 Opx Biotechnologies, Inc. Microorganisms and methods for the production of fatty acids and fatty acid derived products
KR101437040B1 (ko) * 2012-08-17 2014-09-02 삼성전자 주식회사 삼투압 보호제 첨가에 의한 1,3-프로판디올 생산방법 및 생산용 배지
IN2015DN01365A (zh) * 2012-08-28 2015-07-03 Lanzatech New Zealand Ltd
CA2892786A1 (en) 2012-12-12 2014-06-19 Danisco Us Inc. Variants of cellobiohydrolases
US20140178954A1 (en) 2012-12-20 2014-06-26 E I Du Pont De Nemours And Company Expression of xylose isomerase activity in yeast
WO2014127053A2 (en) 2013-02-13 2014-08-21 Metabolix, Inc. Process for ultra pure chemical production from biobased raw starting materials
US8669076B1 (en) 2013-03-11 2014-03-11 E I Du Pont De Nemours And Company Cow rumen xylose isomerases active in yeast cells
US9187743B2 (en) 2013-03-11 2015-11-17 E I Du Pont De Nemours And Company Bacterial xylose isomerases active in yeast cells
US20140273105A1 (en) 2013-03-12 2014-09-18 E I Du Pont De Nemours And Company Gradient pretreatment of lignocellulosic biomass
BR112015022612A2 (pt) * 2013-03-14 2017-10-24 Du Pont microrganismo recombinante e enzima
US10584860B2 (en) * 2013-03-14 2020-03-10 Ideal Industries, Llc Linear light fixture with interchangeable light engine unit
US20140315258A1 (en) 2013-03-14 2014-10-23 Abengoa Bioenergy New Technologies, Llc Methods for converting cellulosic waste to bioproducts
WO2014145096A1 (en) 2013-03-15 2014-09-18 Cindy Hoppe Flash evaporation for production purification and recovery
US9447438B2 (en) 2013-03-15 2016-09-20 Cargill, Incorporated Acetyl-coA carboxylases
US11408013B2 (en) 2013-07-19 2022-08-09 Cargill, Incorporated Microorganisms and methods for the production of fatty acids and fatty acid derived products
US10337038B2 (en) 2013-07-19 2019-07-02 Cargill, Incorporated Microorganisms and methods for the production of fatty acids and fatty acid derived products
WO2015034948A1 (en) 2013-09-03 2015-03-12 Myriant Corporation A process for manufacturing acrylic acid, acrylonitrile and 1,4-butanediol from 1,3-propanediol
EP3041944A4 (en) * 2013-09-06 2017-04-05 The Curators of the University of Missouri Conversion of glycerol to 1,3-propanediol under haloalkaline conditions
US20150147786A1 (en) 2013-11-24 2015-05-28 E I Du Pont De Nemours And Company High force and high stress destructuring for starch biomass processing
KR101532736B1 (ko) 2014-02-24 2015-07-09 한국생명공학연구원 2,3-부탄디올 합성 유전자가 결실된 미생물 변이체를 이용한 1,3-프로판디올의 제조방법
FR3015186A1 (fr) * 2014-03-11 2015-06-26 Antoine Piccirilli Utilisation d'une composition renfermant du 1,3-propanediol comme e-liquide
EP2949214A1 (en) 2014-05-26 2015-12-02 Evonik Degussa GmbH Methods of producing rhamnolipids
WO2016007350A1 (en) 2014-07-09 2016-01-14 Danisco Us Inc. Preconditioning of lignocellulosic biomass
EP2993228B1 (en) 2014-09-02 2019-10-09 Cargill, Incorporated Production of fatty acid esters
EP3056561A1 (de) 2015-02-16 2016-08-17 Evonik Degussa GmbH Mikroorganismen mit reduzierter Enzymaktivität
JP2018505690A (ja) 2015-02-19 2018-03-01 エボニック デグサ ゲーエムベーハーEvonik Degussa GmbH ラムノ脂質合成
WO2016171285A1 (ja) * 2015-04-20 2016-10-27 パイクリスタル株式会社 アクティブマトリクスアレイ装置の製造方法とこれにより製造されたアクティブマトリクスアレイ装置
CN104774879B (zh) * 2015-04-29 2017-10-20 大连理工大学 一种混菌发酵甘油生产1,3‑丙二醇的方法
BR112018001855A2 (pt) 2015-07-29 2018-09-25 Abengoa Bioenergia Nuevas Tecnologias Sa expressão de enzimas beta-xilosidase recombinantes
US9968531B2 (en) 2015-08-05 2018-05-15 Dupont Tate & Lyle Bio Products Company, Llc Deodorants containing 1,3-propanediol
EP3192866A1 (en) 2016-01-15 2017-07-19 CIC nanoGUNE - Asociación Centro de Investigación Cooperativa en Nanociencias Endocellulases and uses thereof
CN109415716A (zh) 2016-04-08 2019-03-01 纳幕尔杜邦公司 用于酵母的阿拉伯糖异构酶
EP3529258A1 (en) 2016-10-24 2019-08-28 Evonik Degussa GmbH Cells and method for producing rhamnolipids using alternative glucose transporters
WO2018077700A1 (en) 2016-10-24 2018-05-03 Evonik Degussa Gmbh Rhamnolipid-producing cell having reduced glucose dehydrogenase activity
EP3577227A4 (en) 2017-02-02 2020-12-30 Cargill Inc. GENETICALLY MODIFIED CELLS PRODUCING C6-C10 FATTY ACID DERIVATIVES
EP3502126A1 (en) 2017-12-19 2019-06-26 CIC nanoGUNE - Asociación Centro de Investigación Cooperativa en Nanociencias Ancestral cellulases and uses thereof
KR102103408B1 (ko) * 2018-01-16 2020-04-23 한국과학기술원 1,3-프로판디올 생성능을 가지는 변이미생물 및 이를 이용한 1,3-pdo의 제조방법
US20190233853A1 (en) * 2018-02-01 2019-08-01 Invista North America S.A.R.L. Methods and materials for the biosynthesis of beta hydroxy acids and/or derivatives thereof and/or compounds related thereto
US11993803B2 (en) 2018-02-09 2024-05-28 Evonik Operations Gmbh Mixture composition comprising glucolipids
CN111386345B (zh) 2018-10-30 2023-05-16 绿色地球研究所株式会社 1,3-丙二醇的制造方法
CN109337852B (zh) * 2018-11-12 2020-09-04 江南大学 一种重组克雷伯氏杆菌在生产1,3-丙二醇中的应用
CN109370969B (zh) * 2018-11-12 2020-09-04 江南大学 一种重组克雷伯氏杆菌在制备1,3-丙二醇中的应用
CN109750011B (zh) * 2019-02-20 2022-05-10 中国科学院天津工业生物技术研究所 一种甘露糖6-磷酸磷酸酶及甘露糖生物制备方法
CN112625994B (zh) * 2021-01-05 2022-04-15 清华大学 一种重组需钠弧菌及其应用
CN114806981B (zh) * 2021-01-18 2023-05-23 中国科学院上海高等研究院 克雷伯氏菌工程菌在生产1,3-丙二醇中的应用
CN114107145B (zh) * 2021-11-04 2024-05-07 清华大学 一种重组微生物及其在生产1,3-丙二醇中的应用

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3634764A1 (de) 1986-10-11 1988-04-14 Mueller Haidmann Roland Dipl I Aus platten zusammengesetzte decke
DE3734764A1 (de) * 1987-10-14 1989-05-03 Huels Chemische Werke Ag Verfahren zur herstellung von propandiol-(1,3)
EP0373230B1 (en) * 1988-12-12 1993-02-17 Unilever N.V. Process for the microbiological preparation of 1,3-propane-diol from glycerol
US5599689A (en) * 1995-05-12 1997-02-04 E. I. Du Pont De Nemours And Company Process for making 1,3-propanediol from carbohydrates using mixed microbial cultures
US5686276A (en) * 1995-05-12 1997-11-11 E. I. Du Pont De Nemours And Company Bioconversion of a fermentable carbon source to 1,3-propanediol by a single microorganism
US5633362A (en) * 1995-05-12 1997-05-27 E. I. Du Pont De Nemours And Company Production of 1,3-propanediol from glycerol by recombinant bacteria expressing recombinant diol dehydratase
WO1998021339A1 (en) * 1996-11-13 1998-05-22 E.I. Du Pont De Nemours And Company Method for the production of 1,3-propanediol by recombinant organisms

Also Published As

Publication number Publication date
IL129722A (en) 2008-07-08
AU733534B2 (en) 2001-05-17
DE69736070D1 (de) 2006-07-20
WO1998021341A2 (en) 1998-05-22
BR9714313A (pt) 2001-09-18
KR20000053213A (ko) 2000-08-25
CN1244217A (zh) 2000-02-09
IL129722A0 (en) 2000-02-29
EP0942989B1 (en) 2009-12-23
ES2336858T3 (es) 2010-04-16
US6953684B2 (en) 2005-10-11
US6136576A (en) 2000-10-24
EP0942989A1 (en) 1999-09-22
AU5248498A (en) 1998-06-03
WO1998021339A1 (en) 1998-05-22
ATE452979T1 (de) 2010-01-15
CA2269088A1 (en) 1998-05-22
DE69736070T2 (de) 2006-12-21
JP4327909B2 (ja) 2009-09-09
EP0946732B1 (en) 2006-06-07
ZA9710194B (en) 1999-05-12
KR100509310B1 (ko) 2005-08-22
AU735080B2 (en) 2001-06-28
ATE329034T1 (de) 2006-06-15
NZ335392A (en) 2000-10-27
AU5507698A (en) 1998-06-03
US6013494A (en) 2000-01-11
ID21487A (id) 1999-06-17
EP0946732A2 (en) 1999-10-06
JP2001503636A (ja) 2001-03-21
CA2270906A1 (en) 1998-05-22
CN1239511A (zh) 1999-12-22
CA2269088C (en) 2009-07-28
DE69739715D1 (de) 2010-02-04
US20030022323A1 (en) 2003-01-30
BR9712761A (pt) 1999-10-26
MY131754A (en) 2007-08-30
BR9712761B1 (pt) 2010-02-23
BR9714313B1 (pt) 2014-10-21
CN1236063C (zh) 2006-01-11
WO1998021341A3 (en) 1998-06-25
JP2001504338A (ja) 2001-04-03
DK0946732T3 (da) 2006-10-09

Similar Documents

Publication Publication Date Title
CN1198935C (zh) 1,3-丙二醇的重组生产方法
CN1298852C (zh) 用于生产高效价1,3-丙二醇的生物学方法
CN1297662C (zh) 用含有维生素b12转运基因的重组生物体生产1,3-丙二醇的方法
CN1202253C (zh) 用重组生物体生产甘油的方法
CN1174100C (zh) 用重组生物体生产甘油的方法
CN1500877A (zh) 利用单一微生物将可发酵碳源生物转化为1,3-丙二醇
US6428767B1 (en) Method for identifying the source of carbon in 1,3-propanediol
CN1646680A (zh) 用于遗传工程的启动子的质粒系统
MXPA99004405A (en) Method for the production of 1,3-propanediol by recombinant organisms
MXPA02001712A (en) Process for the biological production of 1,3-propanediol with high titer
AU7156500A (en) Bioconversion of a fermentable carbon source to 1,3-propanediol by a single microorganism
MXPA00010723A (en) Method for the production of 1,3-propanediol by recombinant organisms comprising genes for vitamin b12 transport
AU2007249075A1 (en) Bioconversion of fermentable carbon to 1,3-propanediol in a single micro-organism using dehydratases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20050427