CN110423705A - 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法 - Google Patents

用于通过添加交替电子受体改善微生物中的产品收率和产量的方法 Download PDF

Info

Publication number
CN110423705A
CN110423705A CN201910530568.7A CN201910530568A CN110423705A CN 110423705 A CN110423705 A CN 110423705A CN 201910530568 A CN201910530568 A CN 201910530568A CN 110423705 A CN110423705 A CN 110423705A
Authority
CN
China
Prior art keywords
enzyme
glycerol
yeast
clostridium
ethyl alcohol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910530568.7A
Other languages
English (en)
Inventor
A·阿吉罗斯
W·R·西勒斯
T·巴雷特
N·凯阿扎
A·J·肖四世
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Management Of Liquidity Of La Lemande Hungary LLC
Lallemand Hungary Liquidity Management LLC
Original Assignee
Management Of Liquidity Of La Lemande Hungary LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=45952666&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN110423705(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Management Of Liquidity Of La Lemande Hungary LLC filed Critical Management Of Liquidity Of La Lemande Hungary LLC
Publication of CN110423705A publication Critical patent/CN110423705A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/0101Acetaldehyde dehydrogenase (acetylating) (1.2.1.10)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01054Formate C-acetyltransferase (2.3.1.54), i.e. pyruvate formate-lyase or PFL
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

本发明涉及用于通过添加交替电子受体改善微生物中的产品收率和产量的方法,提供了减少或消除甘油产生并且增加产物形成的新型代谢途径;更具体提供了重组微生物,所述微生物包含一种或多种用于产生甘油和/或调节甘油合成的天然酶以及在一个或多个工程化代谢途径中用于将碳水化合物源例如木质纤维素转化成产物例如乙醇的一种或多种天然和/或异源酶,其中所述一种或多种天然和/或异源酶被激活、上调或下调;还提供了重组微生物,所述微生物包含一种或多种用于调节甘油合成的异源酶和/或用于在一个或多个工程化代谢途径中用于将碳水化合物源转化成乙醇的一种或多种天然和/或异源酶,其中所述一种或多种天然和/或异源酶被激活、上调或下调。

Description

用于通过添加交替电子受体改善微生物中的产品收率和产量 的方法
本申请是2012年4月5日提交的同名发明专利申请 201280025218.1的分案申请。
发明背景
生物质例如玉米、甘蔗或其它能源作物以及单糖至乙醇的转化是通过使用酵母发酵常规完成的。然而,在酵母代谢过程中,发酵的主要副产品是甘油。甘油在厌氧生长过程中形成,作为酵母平衡其氧化还原状态和再生在糖酵解过程中用作辅因子的NAD+的方式。已显示甘油的功能不可能作为代谢物本身而是作为电子冷阱(electron sink),捕获电子,从而允许进一步的生长关联代谢继续进行。由于甘油是低价值副产品,因此其可以是不期望的发酵副产品。减少或消除该副产品和进一步将更多的碳导向期望的终产物例如乙醇将是有益的。
在本领域有几个策略,通过生物化学或其它方法将甘油转化成更高价值的产物,但对于除去或减少甘油并且提高至乙醇或其它期望的代谢终产物的总的产糖率而言,实例甚少。通过工程化替代途径,潜在地同时减少或缺失甘油途径,可在酵母代谢过程中使用用于再生 NAD+的交替或替代电子受体。这样的交替或替代电子受体可以是分子例如甲酸或氢。
甘油合成基因的消除已被证明,但该途径的去除完全完全阻断了酵母的厌氧生长,在工业过程中阻止了有用的应用。Ansell,R.,等人, EMBO J.16:2179-87(1997);Pahlman,A-K.,等人,J.Biol.Chem. 276:3555-63(2001);Guo,ZP.,等人,Metab.Eng.13:49-59(2011)。绕过甘油发酵的其它方法需要共利用另外的碳源例如木糖或乙酸来用作电子受体。Lidén,G.,等人,Appl.Env.Microbiol.62:3894-96(1996); Medina,V.G.,等人,Appl.Env.Microbiol.76:190-195(2010)。通过包含甲酸途径作为交替电子受体,可绕过甘油形成并且可增加乙醇产率。已对来自大肠杆菌(E.coli)的丙酮酸甲酸裂解酶(其能够将丙酮酸转化成甲酸)进行工程化来增加甲酸产量。Waks,Z.和Silver,P.A.,Appl.Env.Microbiol.75:1867-1875(2009)。在Waks和Silver中进行了甲酸工程化,以在酿酒酵母中提供甲酸来源,以通过第二微生物大肠杆菌产生氢。Waks和Silver未将甲酸产生与甘油形成的除去组合,并且甲酸用作用于甘油还原的交替电子受体的用途未被提出或评价。因此,尽管先前做了绕过和/或消除甘油产生的努力,但仍然存在对细胞中交替或替代电子受体的工程化以将更多的碳导向期望的终产物例如乙醇的需要。
工程化交替或或替代电子受体的重要性在玉米糖化醪发酵的过程中得到举例说明。每年产生约160亿加仑的基于玉米的乙醇,因此即使乙醇产率的少量增加例如5-10%,亦可转化成高于当前产量额外10 亿左右加仑的乙醇。从玉米糖化醪产生乙醇通常导致范围在10-12g/L 内的甘油产率。参见Yang,R.D.,等人,"Pilot plant studies of ethanolproduction from whole ground corn,corn flour,and starch,"Fuel Alcohol U.S.A.,February 13-16,1982(报导的甘油水平高至7.2%w/w 的正常玉米糖化醪发酵中消耗的初始糖,或在使用20%的糖的情况下约1.4g/100mL)。通过在从玉米产生乙醇中减少或消除甘油产率以及再工程化代谢过程,可获得增加的乙醇产率。可在从玉米产生乙醇中获得额外的益处。玉米糖化醪是富含营养物的培养基,在一些情况下,包含可超过3%的总发酵体积的脂质和蛋白质含量。作为这些组分中包含的能量的结果,甚至可获得比使用例如纯糖预期的更高的乙醇产率。额外的增加可来自玉米糖化醪培养基中的脂质或氨基酸的代谢。本发明的重组细胞和方法使得能够通过减少或消除甘油而从生物质发酵增加乙醇产率。
发明概述
本发明总地来说涉及宿主细胞中的甘油产生的减少或去除以及用于再生NAD+的替代电子受体的工程化。
本发明的一个方面涉及重组微生物,所述微生物包含:一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失;和在一个或多个工程化代谢途径中用于将碳水化合物源转化成乙醇的一种或多种天然和/或异源酶,其中所述一种或多种天然和/或异源酶被激活、上调或下调。在一些实施方案中,重组微生物产生比不具有所述一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的对照更少的甘油。在一些实施方案中,糖源是生物质。在一些实施方案中,生物质包括选自如下物质的木质纤维素材料:草、柳枝稷、大米草、黑麦草、草芦、混合草原禾草、芒草、糖加工残渣、甘蔗渣、甘蔗秆、农业废物、稻秆、稻壳、大麦秆、玉米穗轴、谷类秆、小麦秆、芸苔秆、燕麦秆、燕麦壳、玉米纤维、秸秆、大豆秸秆、玉米秸秆、林业废物、再循环木浆纤维、纸污泥、锯屑、硬木、软木、龙舌兰及其组合。在一些实施方案中,生物质是玉米是玉米糖化醪或或玉米淀粉。
在具体方面,一种或多种用于产生甘油的天然酶由gpd1多核苷酸、gpd2多核苷酸或gpd1多核苷酸和gpd2多核苷酸编码。在某些实施方案中,重组微生物还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸。在其它方面,一种或多种用于产生甘油的天然酶由gpp1多核苷酸、gpp2多核苷酸或gpp1多核苷酸和 gpp2多核苷酸编码。
在具体的方面,一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码。
在其它方面,工程化代谢途径包含丙酮酸至乙酰-CoA和甲酸的转化。在某些实施方案中,丙酮酸通过丙酮酸甲酸裂解酶(PFL)转化成乙酰-CoA和甲酸。在一些实施方案中,PFL具有原核生物或真核生物来源。在一些实施方案中,PFL是双歧杆菌属,埃希氏菌属、好热厌氧杆菌属、梭菌属、链球菌属、乳杆菌属、衣藻属、单鞭毛菌属、新丽鞭毛菌属或芽孢杆菌属的一种或多种。在一些实施方案中,PFL 来自地衣芽孢杆菌(Bacilluslicheniformis)、嗜热链球菌(Streptococcus thermophilus)、胚芽乳杆菌(Lactobacillus plantarum)、干酪乳杆菌(Lactobacillus casei)、青春双岐杆菌(Bifidobacterium adolescentis)、解纤维素梭菌(Clostridium cellulolyticum)、大肠杆菌(Escherichia coli)、莱茵衣藻(Chlamydomonas reinhardtii)PflA、单鞭毛菌属E2或新丽鞭毛菌(Neocallimastix frontalis)的一种或多种。在一个实施方案中,PFL来自青春双岐杆菌。
在另外的方面,工程化代谢途径包括乙酰-CoA至乙醇的转化。在某些实施方案中,乙酰-CoA通过乙醛脱氢酶转化成乙醛,乙醛通过醇脱氢酶转化成乙醇。在某些实施方案中,乙酰-CoA通过双功能乙醛/ 醇脱氢酶转化成乙醇。在一些实施方案中,乙醛脱氢酶、醇脱氢酶或双功能乙醛/醇脱氢酶具有原核或真核生物来源。在一些实施方案中,乙醛脱氢酶来自C.phytofermentans。在一些实施方案中,双功能乙醛 /醇脱氢酶来自埃希氏菌属、梭菌属、衣藻属、单鞭毛菌属或双歧杆菌属。在一些实施方案中,双功能乙醛/醇脱氢酶来自大肠杆菌、 Clostridium phytofermentans、莱茵衣藻、单鞭毛菌属E2或青春双岐杆菌。在一个实施方案中,双功能乙醛/醇脱氢酶来自青春双岐杆菌或单鞭毛菌属E2。
在其它方面,重组微生物包含一种或多种由fdh1多核苷酸、fdh2 多核苷酸或fdh1多核苷酸和fdh2多核苷酸编码的天然酶的缺失。
在某些实施方案中,重组微生物的碳水化合物源是木质纤维素。在某些实施方案中,重组微生物产生乙醇。在某些实施方案中,重组微生物产生甲酸。
在某些实施方案中,重组微生物选自酿酒酵母、乳酸克鲁维酵母、马克思克鲁维酵母、巴斯德毕赤酵母、解脂耶罗维亚酵母、多形汉森酵母、红发夫酵母、实用假丝酵母、Arxula adeninivorans、树干毕赤酵母、汉逊德巴利酵母、多型德巴利酵母、粟酒裂殖酵母、白色念珠菌和西方许旺酵母。在一个实施方案中,重组微生物是酿酒酵母。
在某些实施方案中,重组微生物包含一种或多种由gpd1多核苷酸和gpd2多核苷酸编码的用于产生甘油的天然酶,包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化的工程化代谢途径和包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化的工程化代谢途径,并且重组微生物还包含一种或多种由fdh1多核苷酸和fdh2多核苷酸编码的天然酶的缺失。
在某些实施方案中,重组微生物包含一种或多种由gpp1多核苷酸和gpp2多核苷酸编码的用于产生甘油的天然酶,包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化的工程化代谢途径。在其它实施方案中,重组微生物的一个工程化代谢途径通过双功能乙醛/醇脱氢酶将乙酰-CoA转化成乙醇,并且重组微生物还包括一种或多种由fdh1多核苷酸和fdh2多核苷酸编码的天然酶的缺失。
在某些实施方案中,重组微生物包含一种或多种由fps1多核苷酸编码的用于调节甘油合成的天然酶,包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化的工程化代谢途径。在其它实施方案中,重组微生物的一个工程化代谢途径通过双功能乙醛/醇脱氢酶将乙酰-CoA转化成乙醇,并且重组微生物还包括一种或多种由fdh1多核苷酸和fdh2多核苷酸编码的天然酶的缺失。
在某些实施方案中,重组微生物包含由一种或多种由fps1多核苷酸编码的用于调节甘油合成的天然酶以及一种或多种由gpd1多核苷酸和gpd2多核苷酸编码的用于产生甘油的天然酶,和包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化的工程化代谢途径以及包含通双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化的工程化代谢途径,并且重组微生物还包含一种或多种由fdh1多核苷酸和fdh2多核苷酸编码的天然酶的缺失。
在某些实施方案中,重组微生物包含一种或多种由fps1多核苷酸编码的用于调节甘油合成的天然酶,包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化的工程化代谢途径,和包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化的工程化代谢途径,并且重组微生物还包含一种或多种由fdh1多核苷酸和fdh2多核苷酸编码的天然酶的缺失。
在某些实施方案中,重组微生物包含一种或多种由gpd1多核苷酸和gpd2多核苷酸编码的产生甘油的天然酶,包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化的工程化代谢途径以及包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化的工程化代谢途径,并且重组微生物还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸。
在某些实施方案中,重组微生物包含一种或多种由gpd1多核苷酸和gpd2多核苷酸编码的用于产生甘油的天然酶,以及包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化的工程化代谢途径和包含通双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化的工程化代谢途径,还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸以及一种或多种由fdh1多核苷酸和 fdh2多核苷酸编码的天然酶的缺失。
在某些实施方案中,重组微生物包含一种或多种由gpd1多核苷酸和gpd2多核苷酸编码的用于产生甘油的天然酶和一种或多种由 fps1多核苷酸编码的用于调节甘油合成的天然酶,以及包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化的工程化代谢途径和包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化的工程化代谢途径,还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸。
在某些实施方案中,重组微生物包含一种或多种由gpd1多核苷酸和gpd2多核苷酸编码的用于产生甘油的天然酶和一种或多种由 fps1多核苷酸编码的用于调节甘油合成的天然酶,以及包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化的工程化代谢途径和包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化的工程化代谢途径,还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸和一种或多种由fdh1多核苷酸和fdh2 多核苷酸编码的天然酶的缺失。
在一些实施方案中,一种或多种用于在重组微生物中产生甘油和/ 或调节甘油合成的天然酶的缺失使甘油形成减少:超过约10%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;超过约20%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;超过约30%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;超过约40%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;超过约50%的由不具有一种或多种用于产生甘油和/ 或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;超过约 60%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;超过约70%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;超过约80%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;超过约90%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;超过约95%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;或超过约99%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油。
在一些实施方案中,重组微生物产生选自如下的量的甲酸:在24 小时内至少约0.012g/L;在48小时内至少约0.022g/L或在142小时内至少约2.5g/L。
在一些实施方案中,重组微生物产生选自如下的甲酸产率:比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约0.05倍的甲酸;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约0.1倍的甲酸;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约0.5倍的甲酸;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约1.0倍的甲酸;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约5.0倍的甲酸;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约10.0 倍的甲酸;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约20.0倍的甲酸;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约 30.0倍的甲酸;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约40.0倍的甲酸;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约50.0倍的甲酸;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约75.0倍的甲酸;或比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约100倍的甲酸。
在一些实施方案中,重组微生物产生选自如下的乙醇产率:比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约1%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约2%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约3%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约4%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约5%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约10%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约20%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约30%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约40%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约50%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约60%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约70%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约80%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约90%的乙醇;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约95%的乙醇;或比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约99%的乙醇。
在一些实施方案中,通过重组微生物或其中工程化的酶进行的碳水化合物源至乙醇的转化是在缺氧条件下进行的。
在一些实施方案中,重组微生物在缺氧条件下具有选自如下的乙酸摄取(g/L);比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约1%的乙酸摄取;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约10%的乙酸摄取;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约20%的乙酸摄取;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约30%的乙酸摄取;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约40%的乙酸摄取;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约50%的乙酸摄取;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约60%的乙酸摄取;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约70%的乙酸摄取;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约80%的乙酸摄取;和比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约90%的乙酸摄取。
在一些实施方案中,重组微生物以相较于无一种或多种天然酶(其用于产生甘油和/或调节甘油合成)的缺失的重组微生物更低的葡萄糖利用率产生更多的乙醇,其中葡萄糖利用率选自:比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约1%的每小时使用的葡萄糖;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约5%的每小时使用的葡萄糖;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约10%的每小时使用的葡萄糖;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约20%的每小时使用的葡萄糖;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约 30%的每小时使用的葡萄糖;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约40%的每小时使用的葡萄糖;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约50%的每小时使用的葡萄糖;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约60%的每小时使用的葡萄糖;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约70%的每小时使用的葡萄糖;比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约80%的每小时使用的葡萄糖;和比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约90%的每小时使用的葡萄糖。
本发明的另一个方面涉及重组微生物,所述微生物包含:一种或多种用于调节甘油合成的酶,其中所述一种或多种异源酶被激活、上调或下调;和一种或多种在一个或多个工程化代谢途径中用于将碳水化合物源转化成乙醇的天然和/或异源酶,其中所述一种或多种天然和 /或异源酶被激活、上调或下调。在某些实施方案中,一种或多种用于调节甘油合成的异源酶由fps1多核苷酸编码。在一个实施方案中,fps1 多核苷酸来自大肠杆菌。
在一些实施方案中,上述重组微生物的工程化代谢途径之一包括丙酮酸至乙酰-CoA和甲酸的转化。在某些实施方案中,丙酮酸被丙酮酸甲酸裂解酶(PFL)转化成乙酰-CoA和甲酸。在一些实施方案中,PFL 具有原核生物或真核生物来源。在一些实施方案中,PFL来自双歧杆菌属、埃希氏菌属、好热厌氧杆菌属、梭菌属、链球菌属、乳杆菌属、衣藻属、单鞭毛菌属、新丽鞭毛菌属或芽孢杆菌属的一种或多种。在一些实施方案中,PFL来自地衣芽胞杆菌、嗜热链球菌、胚芽乳杆菌、干酪乳杆菌、青春双岐杆菌、解纤维素梭菌、大肠杆菌、莱茵衣藻PflA、单鞭毛菌属E2或新丽鞭毛菌的一种或多种。在一个实施方案中,PFL 来自青春双岐杆菌。
在一些实施方案中,上述重组微生物的工程化代谢途径之一包括乙酰-CoA至乙醇的转化。在一些实施方案中,乙酰-CoA被乙醛脱氢酶转化成乙醛,乙醛被醇脱氢酶转化成乙醇。在其它实施方案中,乙酰-CoA被双功能乙醛/醇脱氢酶转化成乙醇。在一些实施方案中,乙醛脱氢酶、醇脱氢酶或双功能乙醛/醇脱氢酶具有原核生物或真核生物来源。在一个实施方案中,乙醛脱氢酶来自C.phytofermentans。在某些实施方案中,双功能乙醛/醇脱氢酶来自埃希氏菌属、梭菌属、衣藻属、单鞭毛菌属或双歧杆菌属。在一些实施方案中,双功能乙醛/醇脱氢酶来自大肠杆菌、Clostridium phytofermentans、莱茵衣藻、单鞭毛菌属E2或青春双岐杆菌。在一个实施方案中,双功能乙醛/醇脱氢酶来自青春双岐杆菌或单鞭毛菌属E2。
在其它方面,重组微生物包含一种或多种由fdh1多核苷酸、fdh2 多核苷酸或fdh1多核苷酸和fdh2多核苷酸编码的天然酶的缺失。
在一些实施方案中,重组微生物产生乙醇。在其它实施方案中,重组微生物产生甲酸。在一些实施方案中,重组微生物选自酿酒酵母、乳酸克鲁维酵母、马克思克鲁维酵母、巴斯德毕赤酵母、解脂耶罗维亚酵母、多形汉森酵母、红发夫酵母、实用假丝酵母、Arxulaadeninivorans、树干毕赤酵母、汉逊德巴利酵母、多型德巴利酵母、粟酒裂殖酵母、白色念珠菌和西方许旺酵母。在一个实施方案中,重组微生物是酿酒酵母。
在一些实施方案中,本发明的重组微生物还包含一种或多种天然和/或异源酶,所述酶在一个或多个工程化代谢途径中用于将木糖转化成木酮糖-5-磷酸和/或将阿拉伯糖转化成木酮糖-5-磷酸,其中一种或多种天然和/或异源酶被激活、上调或下调。
在一些实施方案中,本发明的重组微生物还包含一种或多种天然和/或异源酶,所述酶编码糖解酶,包括淀粉酶,纤维素酶,半纤维素酶,纤维素分解酶和淀粉分解辅助酶、菊糖酶,果聚糖酶和戊糖利用酶。在一个方面,糖解酶是淀粉酶,其中淀粉酶选自灰腐质霉(H.grisea)、嗜热子囊菌(T.aurantiacus)、埃默森篮状菌(T.emersonii)、里氏木霉(T.reesei)、澳洲乳白蚁(C.lacteus)、台湾乳白蚁(C. formosanus)、高山象白蚁(N.takasagoensis)、澳大利亚矛颚家白蚁 (C.acinaciformis)、达尔文澳白蚁(M.darwinensis)、N.walkeri、扣囊复膜酵母(S.fibuligera)、C.lucknowense、黄胸散白蚁(R.speratus)、嗜热放线菌(Thermobfida fusca)、热纤梭菌(Clostridum thermocellum)、解纤维素梭菌、约氏梭菌(Clostridum josui)、短小芽孢杆菌(Bacillus pumilis)、粪碱纤维单胞菌(Cellulomonas fimi)、多糖降解菌 (Saccharophagus degradans)、Piromycesequii、Neocallimastix patricarum或拟南芥(Arabidopsis thaliana)。在另一个方面,糖酶解是来自扣囊复膜酵母菌的淀粉酶葡糖淀粉酶(glu-0111-CO)。
本发明的另一个方面涉及用于减少细胞甘油的方法,包括将生物质与本发明的重组微生物接触。本发明的其它方面涉及用于增加细胞质甲酸的方法,包括将生物质与本发明的重组微生物接触。本发明的另一个方面涉及用于将生物质转化成乙醇的方法,包括将生物质与本发明的重组微生物接触。在一些实施方案中,生物质包括木质纤维素生物质。在一些实施方案中,木质纤维素生物质选自草、柳枝稷、大米草、黑麦草、草芦、混合草原禾草、芒草、糖加工残渣、甘蔗渣、甘蔗秆、农业废物、稻秆、稻壳、大麦秆、玉米穗轴、谷类秆、小麦秆、芸苔秆、燕麦秆、燕麦壳、玉米纤维、秸秆、大豆秸秆、玉米秸秆、林业废物、再循环木浆纤维、纸污泥、锯屑、硬木、软木、龙舌兰及其组合。在一些实施方案中,生物质是玉米糖化醪或玉米淀粉。
在另一个方面,本发明还描述了表达用于从玉米淀粉产生燃料乙醇的酶的工业酵母菌株。
附图概述
图1显示了高产率代谢的示意图。
图2描述糖酵解途径。
图3显示糖酵解/发酵途径的示意图。
图4显示描述用于产生GPD1的标记的缺失的引物的位置的图谱。
图5显示描述用于从GPD1基因座除去标志物的引物的位置的图谱。
图6显示描述用于产生GPD2的标记的缺失的引物的位置的图谱。
图7显示描述用于从GPD2基因座除去标志物的引物的位置的图谱。
图8显示描述用于产生FDH1的标记的缺失的引物的位置的图谱。
图9显示描述用于从FDH1基因座除去标志物的引物的位置的图谱。
图10显示描述用于产生FDH2的标记的缺失的引物的位置的图谱。
图11显示描述用于从FDH2基因座除去标志物的引物的位置的图谱。
图12显示来自不同生物的PFL酶的比对。
图13显示48小时过程中甲酸产量的图。
图14显示微氧和缺氧条件下142小时结束时甲酸产量的图。
图15显示通过OD测量的72小时过程中本发明的菌株的生长的图。
图16显示72小时过程中本发明的菌株的甘油产量(g/L)的图。
图17显示72小时过程中本发明的菌株的乙醇产量(g/L)的图。
图18显示72小时过程中本发明的菌株的葡萄糖利用(g/L)的图。
图19显示通过OD测量的142小时过程中本发明的菌株的生长的图。
图20显示本发明的菌株的相对生长率(mOD/min)的图。
图21显示在50小时的发酵后本发明的菌株的乙醇产量(g/L)的图。
图22显示在50小时的发酵后本发明的菌株的乙醇产量(g/L)的图。
图23显示在50小时的发酵后本发明的菌株的甘油产量(g/L)的图。
图24显示在50小时的发酵后本发明的菌株的甘油产量(g/L)的图。
图25显示在72小时的发酵后葡萄糖利用(g/L)、甘油产量(g/L)和乙醇产量(g/L)的图。
图26显示描述大肠杆菌AADH在GPD1基因座上的整合的简图。
图27显示描述大肠杆菌AADH在FCY1基因座上的整合的简图。
图28显示用于PCR构建以及KT-MX和NT-MX整合盒至靶基因座的两个染色体中的整合的策略的示意图。
图29显示用于在靶基因座的两个染色体上用Mascoma Assembly 替代整合的KT-MX和NT-MX选择盒的策略的示意图。
图30显示在M3625的FDH1位点整合的MA0370的分子图谱和基因分型。
图31显示包含用于对MA0370位点基因分型和测序的PCR产物的琼脂糖凝胶的图像。
图32显示在MA3625的FDH2位点整合的MA0280的分子图谱和基因分型。
图33显示包含用于对MA0280位点基因分型和测序的PCR产物的琼脂糖凝胶的图像。
图34显示在M3625的GPD2位点整合的MA0289的分子图谱和基因分型。
图35显示包含用于对MA0370位点基因分型和测序的PCR产物的琼脂糖凝胶的图像。
图36显示在M3625的FCY1位点整合的MA0317的分子图谱和基因分型。
图37显示包含用于对MA0317位点基因分型和测序的PCR产物的琼脂糖凝胶的图像。
图38显示描述利用菌株M2390、M2519、M2691、M3498和M3625 进行的淀粉测定的结果的图。
图39显示细胞提取物(PflA、PflB、AdhE)和好氧培养物上清液 (AE9)的抗肽Western印迹分析。
图40显示描述利用工程化的菌株M3465、M3625、M3679、M3680 和M2390进行的甲酸裂解酶测定的结果的图。
图41显示描述利用工程化的菌株M3465、M3625、M3679和 M3680进行的醇脱氢酶测定的结果的图。
图42显示描述描利用工程化的菌株M3625和M3680,使用 50μg/mL AE9在室温(~25℃)对玉米淀粉进行的葡糖淀粉酶活性测定的结果的图。
图43A是显示用于表达GPD2和青春双岐杆菌pflA、pflB和adhE 的启动子和终止子在M3624和M3515的GPD1基因座上的插入的示意图。
图43B是显示用于表达GPD1和青春双岐杆菌pflA、pflB和adhE 的启动子和终止子在M3624和M3515的GPD2基因座上的插入的示意图。
图43C是显示M3624和M3515中的FDH1基因的缺失的示意图。
图43D是显示用于表达青春双岐杆菌pflA、pflB和adhE的启动子和终止子在M3624和M3515的FDH2基因座上的的插入的示意图。
图44A显示在由28%固体玉米糖化醪的发酵过程中由甘油还原菌株产生的甲酸的HPLC分析。
图44B显示在由28%固体玉米糖化醪的发酵过程中由甘油还原菌株产生的甘油的HPLC分析。
图44C显示在由28%固体玉米糖化醪的发酵过程中由甘油还原菌株产生的乙醇的HPLC分析。
图45A是显示用于表达青春双岐杆菌pflA、pflB和adhE的启动子和终止子在M3465的GPD2基因座上的插入的示意图。
图45B是显示M3465的FDH1基因的缺失的示意图。
图45C是显示用于表达青春双岐杆菌pflA、pflB和adhE的启动子和终止子在M3465的FDH2基因座上的插入的示意图。
图46A是显示用于表达青春双岐杆菌pflA、pflB和adhE的启动子和终止子在M3469的GPD1基因座上的插入的示意图。
图46B是显示M3469的FDH1基因的缺失的示意图。
图46C是显示用于表达青春双岐杆菌pflA、pflB和adhE的启动子和终止子在M3469的FDH2基因座上的插入的示意图。
图47显示在30%固体玉米糖化醪的发酵过程中由甘油还原菌株产生的乙醇滴度的HPLC分析。
图48显示在30%固体玉米糖化醪的发酵过程中由甘油还原菌株产生的甘油滴度的HPLC分析。
图49显示通过青春双岐杆菌双功能醇脱氢酶(AdhE)催化的逆反应,其中乙醇被转化成乙醛。
图50显示通过AdhE进行的乙醛至乙酰CoA的转化的反应的图。
图51是显示用于表达青春双岐杆菌pflA、pflB和adhE的启动子和终止子在TB655的GPP1基因座上的插入的示意图。
图52是显示用于表达青春双岐杆菌pflA、pflB和adhE的启动子和终止子在TB656的GPP2基因座上的的插入的示意图。
图53是描述菌株TB655和TB656相较于菌株M3297的减少的甘油形成的图。
图54是描述菌株TB655和TB656相较于菌株M3297的增加的乙醇产率的图。
图55是描述菌株TB655、TB656和M3297的甲酸产生的图。
发明详述
定义
术语"异源的",当用于指多核苷酸、基因、多肽或酶时,是指通常不在宿主生物中发现的多核苷酸、基因、多肽或酶。"异源的"还包括天然编码区或其部分,所述天然编码区或其部分以不同于对应的天然基因的形式(例如,不在其在生物体的基因组中的天然位置中)被引入源生物。异源多核苷酸或基因可通过例如基因转移引入宿主生物。异源基因可包括作为嵌合基因(其包含被重新引入天然宿主的非天然调控区)的部分的天然编码区。外来基因可包括插入非天然生物体的天然基因或嵌合基因。
术语"异源多核苷酸"意欲包括编码一个或多个多肽或多肽的部分或片段的多核苷酸。异源多核苷酸可来源于任何来源,例如真核生物、原核生物、病毒或合成多核苷酸片段。
术语"启动子"或"替代启动子"意欲包括可转录地控制其在天然状态下不转录地控制的目的基因的多核苷酸。在某些实施方案中,替代启动子的转录控制导致目的基因表达的增加。在某些实施方案中,替代启动子置于目的基因的5'。替代启动子可用于替代天然启动子,或除天然启动子外,还可使用替代启动子。替代启动子相对于其中使用其的宿主细胞可以是内源的,或其可以是引入宿主细胞的异源多核苷酸序列,例如相对于其中使用其的宿主细胞是外源的。
术语"基因”或“多核苷酸”或“多核苷酸序列"意欲包括核酸分子,例如多核苷酸,其包括编码多肽的开放阅读框架和可进一步包括非编码调控序列和内含子。此外,该术语意欲包括一个或多个被定位至功能基因座的基因。此外,该术语意欲包括用于选择的目的的特定基因。基因对于宿主细胞可以是内源的或可被重组地引入宿主细胞,例如作为以附加型形式维持的质粒或被稳定地整合进入基因组的质粒(或其片段)。除了质粒形式以外,基因还可以以例如线性DNA的形式存在。在某些实施方案中,基因或多核苷酸参与生物质至例如乙醇的生物转化的至少一个步骤。因此,该术语意欲包括任何编码多肽的基因,所述多肽是例如乙酸激酶(ACK)、磷酸乙酸转移酶(PTA)、乳酸脱氢酶(LDH)、丙酮酸甲酸裂解酶(PFL)、醛脱氢酶(ADH)和/或醇脱氢酶 (ADH)、乙酰-CoA转移酶(ACS)、乙醛脱氢酶(ACDH)、乙醛/醇脱氢酶(AADH)、甘油-3-磷酸脱氢酶(GPD)、甘油3-磷酸酶(GPP)、乙酰 -CoA合成酶、硫解酶、CoA转移酶、乙酰乙酸脱羧酶、醇乙酰转移酶,D-木糖途径中的酶例如木糖异构酶和木酮糖激酶,L-阿拉伯糖途径中的酶例如L-阿拉伯糖异构酶和L-核酮糖-5-磷酸4-差向异构酶。术语基因还意欲包括特定基因的全部拷贝,例如细胞中编码特定基因产物的全部DNA序列。
术语"转录控制"意欲包括在转录的水平上调节基因表达的能力。在某些实施方案中,转录,从而基因表达,通过在目的基因的编码区的5'末端附近替代或添加的替代启动子调节,从而导致改变的基因表达。在某些实施方案中,工程化一个或多个基因的转录控制以导致这样的基因的最佳(例如,以期望的比率)表达。该术语还包括本领域认识到的诱导型转录控制。
术语"表达"意欲包括至少在mRNA产量的水平上的基因的表达。
术语"表达产物"意欲包括表达的基因的所得产物,例如多肽。
术语"增加的表达"意欲包括至少在增加的mRNA产生的水平上,优选在多肽表达的水平上的基因表达的改变。术语"增加的产量" 意欲包括相较于多肽的天然产量或酶促活性,在表达的多肽的量上、在多肽的酶促活性的水平上的升高或其组合。
术语"活性"和"酶促活性"可互换使用并且意欲包括当在有利的条件下产生时通常归功于选择的多肽的任何功能活性。通常地,选择的多肽的活性包括与产生的多肽相关的总的酶促活性。由宿主细胞产生的并且具有酶促活性的多肽可位于细胞的细胞内空间、与细胞结合、分泌进入细胞外环境或其组合。用于测定相较于分泌的活性的总活性的技术描述于本文中并且在本领域是已知的。
术语"木聚糖降解活性"意欲包括水解寡聚戊糖和多聚戊糖中的糖苷键的能力。
术语"阿拉伯糖降解活性"意欲包括水解寡聚戊糖和多聚戊糖中的糖苷键的能力。
术语"纤维素分解活性"意欲包括水解寡聚己糖和多聚己糖中的糖苷键的能力。纤维素分解活性还可包括使纤维素和半纤维素解聚或脱支的能力。
如本文中所用,术语"乳酸脱氢酶”或“LDH"意欲包括能够将丙酮酸转化成乳酸的酶。应理解,LDH还可催化羟基丁酸的氧化。LDH 包括对应于酶委员会编号1.1.1.27的那些酶。
如本文中所用,术语"醇脱氢酶”或“ADH"意欲包括能够将乙醛转化成醇例如乙醇的酶。ADH还包括能够将丙酮转化成异丙醇的酶。 ADH包括对应于酶委员会编号1.1.1.1的那些酶。
如本文中所用,术语"磷酸乙酸转移酶”或“PTA"意欲包括能够将乙酰磷酸盐转化成乙酰-CoA的盐。PTA包括对应于酶委员会编号 2.3.1.8的那些酶。
如本文中所用,术语"乙酸激酶”或“ACK"意欲包括能够将乙酸转化成乙酰磷酸的酶。ACK包括对应于酶委员会编号2.7.2.1的那些酶。
如本文中所用,术语"丙酮酸甲酸裂解酶”或“PFL"意欲包括能够将丙酮酸转化成乙酰-CoA和甲酸的酶。PFL包括对应于酶委员会编号2.3.1.54的那些酶。
如本文中所用,术语"甲酸脱氢酶”或“FDH"意欲包括能够将甲酸和NAD+转化成NADH和CO2的酶。FDH包括对应于酶委员会编号1.2.1.2的那些酶。
如本文中所用,术语"乙醛脱氢酶”或“ACDH"意欲包括能够将乙酰-CoA转化成乙醛的酶。ACDH包括对应于酶委员会编号1.2.1.3的那些酶。
如本文中所用,术语"乙醛/醇脱氢酶"意欲包括能够将乙酰-CoA 转化成乙醇的酶。乙醛/醇脱氢酶包括对应于酶委员会编号1.2.1.10和 1.1.1.1的那些酶。
如本文中所用,术语"甘油-3-磷酸-脱氢酶”或“GPD"意欲包括能够将二羟丙酮磷酸转化成甘油-3-磷酸的酶。GPD包括对应于酶委员会编号1.1.1.8的那些酶。
如本文中所用,术语"甘油3-磷酸酶”或“GPP"意欲包括能够将甘油3-磷酸转化成甘油的酶。GPP包括对应于酶委员会编号3.1.3.21 的那些酶。
如本文中所用,术语"乙酰-CoA合成酶”或“ACS"意欲包括能够将乙酸转化成乙酰-CoA的酶。乙酰-CoA合成酶包括对应于酶委员会编号6.2.1.1的那些酶。
如本文中所用,术语"硫解酶"意欲包括能够将乙酰-CoA转化成乙酰乙酰-CoA的酶。硫解酶包括对应于酶委员会编号2.3.1.9的那些酶。
如本文中所用,术语"CoA转移酶"意欲包括能够将乙酸和乙酰乙酰-CoA转化成乙酰乙酸和乙酰-CoA的酶。CoA转移酶包括对应于酶委员会编号2.8.3.8的那些酶。
如本文中所用,术语"乙酰乙酸脱羧酶"意欲包括能够将乙酰乙酸转化成丙酮和二氧化碳的酶。乙酰乙酸脱羧酶包括对应于酶委员会编号4.1.1.4的那些酶。
如本文中所用,术语"醇乙酰转移酶"意欲包括能够将乙酰-CoA 和乙醇转化成乙酸乙酯的酶。醇乙酰转移酶包括对应于酶委员会编号 2.3.1.84的那些酶。
术语"丙酮酸脱羧酶活性"意欲包括多肽酶促地将丙酮酸转化成乙醛和二氧化碳的能力(例如,"丙酮酸脱羧酶”或“PDC")。通常地,选择的多肽的活性包括与产生的多肽相关的总的酶促活性,包括例如酶的优良的底物亲和力、热稳定性、不同pH下的稳定性或这些属性的组合。PDC包括对应于酶委员会编号4.1.1.1。
术语"产乙醇的"意欲包括微生物从碳水化合物产生乙醇作为发酵产物的能力。该术语意欲包括但不限于天然存在的产乙醇生物体、具有天然存在的或诱导的突变的产乙醇生物体以及已被遗传修饰的产乙醇生物体。
术语"发酵"意欲包括籍以从碳水化合物产生乙醇(特别是作为发酵的产物)的酶促过程(例如,细胞或无细胞的,例如裂解物或纯化的多肽混合物)。
术语"分泌的"意欲包括多肽至周质空间或细胞外环境的移动。该术语"增加的分泌"意欲包括其中给定的多肽以升高的水平(即,以超过天然存在的分泌量)分泌的状况。在某些实施方案中,术语"增加的分泌"是指相较于天然存在的分泌水平为至少约10%或至少约100%、 200%、300%、400%、500%、600%、700%、800%、900%、1000%或更多的给定多肽的分泌的增加。
术语"分泌多肽"意欲包括单独地或与其它多肽组合地促进另一种多肽从细胞的细胞内空间至细胞外环境的运输的任何多肽。在某些实施方案中,分泌多肽包括所有足以赋予革兰阴性或革兰阳性宿主细胞或酵母宿主细胞分泌活性的必需分泌多肽。通常地,分泌蛋白质在单个区域或基因座中编码,可使用基因工程从一个宿主细胞分离并且转移至另一个宿主细胞。在某些实施方案中,分泌多肽来源于任何具有分泌活性的细菌细胞或任何具有分泌活性的酵母细胞。在某些实施方案中,分泌多肽来源于具有II型分泌活性的宿主细胞。在某些实施方案中,宿主细胞是嗜热细菌细胞。在某些实施方案中,宿主细胞是酵母细胞。
术语"来源于"意欲包括从指定的来源分离(完整地或部分地)多核苷酸区段,或从指定的来源纯化多肽。该术语意欲包括例如从与指定的多核苷酸来源结合的序列或基于所述序列直接克隆、PCR扩增或人工合成。
术语"重组微生物”或“重组宿主细胞"意欲包括本发明的重组微生物的后代或衍生物。因为某些修饰可因突变或环境影响而在后续代中发生,这样的后代或衍生物实际上可以与亲代细胞不完全相同,但仍然包括在本文中使用的术语的范围内。
"嗜热的"意指在约45℃或更高的温度旺盛生长的生物。
"嗜温的"意指在约20-45℃的温度旺盛生长的生物。
术语"有机酸"是本领域承认的。"有机酸",如本文中所用,还包括某些有机溶剂例如乙醇。术语"乳酸"是指以游离酸或盐形式存在的有机酸2-羟基丙酸。乳酸的盐形式称为"乳酸盐",无论中和剂是什么,即碳酸钙或氢氧化铵。术语"醋酸"是指以游离酸或盐形式存在的有机酸甲烷羧酸,也称为乙酸。醋酸的盐形式称为“乙酸盐”。
本发明的某些实施方案提供了某些基因或特定多核苷酸序列在嗜热或嗜温微生物内的“插入”(例如,添加、整合或引入),所述基因或特定多核苷酸序列的插入可被理解为包括"遗传修饰”或“转化",以便所述嗜热或嗜温微生物的所得菌株可被理解为被"遗传修饰的”或“转化的"。在某些实施方案中,菌株可以是细菌、真菌或酵母来源。
本发明的某些实施方案在嗜热或嗜温微生物中提供了某些基因或特定多核苷酸序列的"灭活”或“缺失",所述基因或特定多核苷酸序列的"灭活”或“缺失"可被理解为包括"遗传修饰”或“转化",以便所述嗜热或嗜温微生物的所得菌株可被理解为被“遗传修饰的”或“转化的”。在某些实施方案中,菌株可以是细菌、真菌或酵母来源。
术语"联合生物加工”或“CBP"是指牵涉酶促或微生物水解的生物质加工方案,所述方案通常包括4个生物介导的转化:(1)糖解酶(淀粉酶、纤维素酶和半纤维素酶)的产生;(2)存在于预处理的生物质中的碳水化合物组分至糖的水解;(3)己糖(例如,葡萄糖、甘露糖和半乳糖)的发酵;和(4)戊糖(例如,木糖和阿拉伯糖)的发酵。这4个转化在称为CBP的工艺配置(process configuration)中在单个步骤中发生,这与其它不太高度整合的配置的区别在于其不包括用于纤维素酶和/或半纤维素酶产生的专门处理步骤。
术语"CBP生物"意欲包括本发明的微生物,例如具有适合进行 CBP的性质的微生物。
在本发明的一个方面,基因或特定多核苷酸序列被插入以激活它们编码的活性,例如酶的表达。在某些实施方案中,可将编码参与乙醇的代谢产生的酶(例如,代谢戊糖和/或己糖的酶)的基因添加至嗜温或嗜热生物中。在本发明的某些实施方案中,酶可赋予代谢戊糖的能力并且参与例如D-木糖途径和/或L-阿拉伯糖途径。
在本发明的一个方面,基因或特定多核苷酸序列被部分、大部分或完全缺失、沉默、灭活或下调以使它们编码的活性例如酶的表达失活。缺失提供最大的稳定性,因为不存在恢复功能的回复突变的可能性。或者,可通过插入破坏基因的功能和/或表达的核酸序列(例如, P1转导或本文中已知的其它方法)将基因部分、大部分或完全缺失、沉默、灭活或下调。术语"消除"和"敲除"可与术语"缺失"、"部分缺失"、"大部分缺失”或“完全缺失"互换使用。在某些实施方案中,可通过定向同源重组(以敲除有机酸的产生)来工程化目的嗜热或嗜温微生物的菌株。在其它实施方案中,RNAi或反义DNA(asDNA)可用于部分、大部分或完全沉默、灭活或下调特定目的基因。
在某些实施方案中,如本文中所述被靶向缺失或灭活的基因对于微生物的天然菌株可以是内源性的,从而可被理解为称为"天然基因”或“内源基因"。如果生物未曾进行遗传工程化或通过人工以有意地改变生物的遗传和/或表型构成的方式操作时,生物以“天然状态”存在。例如,野生型生物体可被认为以天然状态存在。在其它实施方案中,被靶向缺失或灭活的基因对于生物体可以是非天然的。
类似地,本文中描述的本发明的酶对于微生物的天然菌株可以是内源性的,从而可被理解为称为"天然的”或“内源的"。
术语"上调的"意指相较于天然宿主生物中的活性,活性的增加,例如酶的酶促活性的增加。
术语"下调的"意指相较于天然宿主生物中的活性,活性的减小,例如酶的酶促活性的减小。
术语"激活的"意指表达的或代谢上具有功能的。
术语"经改造适合于生长的"意指在其中生物不然不生长或其中生物生长缓慢或最低限度地生长的条件下对生长的生物的选择。因此,被认为经改造适合于在选择的条件下生长的生物比未经改造来适合在选择的条件下生长的生物生长更好。生长可通过本领域已知的任何方法来测量,包括但不限于光密度或比生长速率的测量。
术语"碳水化合来源"意欲包括碳水化合物的任何来源,包括但不限于生物质或碳水化合物例如糖或糖醇。"碳水化合物"包括但不限于单糖(例如,葡萄糖、果糖、半乳糖、木糖、阿拉伯糖或核糖)、糖衍生物(例如,山梨醇、甘油、半乳糖醛酸、鼠李糖、木糖醇)、二糖(例如,蔗糖、纤维二糖、麦芽糖或乳糖)、寡糖(例如,木寡聚糖,纤维糊精或麦芽糊精)和多糖(例如,木聚糖、纤维素、淀粉、甘露聚糖、藻酸盐或果胶)。
如本文中所用,"淀粉水解酶"可以是参与淀粉降解、代谢和/或水解的任何酶。术语"淀粉酶"是指将淀粉分解成糖的酶。淀粉酶存在于人唾液中,在唾液中其开始化学降解过程。包含许多淀粉但少量糖的食物例如米和马铃薯当它们被咀嚼时味道有点甜,因为淀粉酶将其一些淀粉在口中转化成糖。胰腺也产生淀粉酶(α-淀粉酶)来将饮食淀粉水解成可被其它酶转化成葡萄糖来为身体提供能量的二糖和三糖。植物和一些细菌也产生淀粉酶。所有淀粉酶是糖苷水解酶并且作用于α-1,4-糖苷键。一些淀粉酶例如γ-淀粉酶(葡糖淀粉酶)还作用于α-1,6- 糖苷键。淀粉酶包括α-淀粉酶(EC 3.2.1.1)、β-淀粉酶(EC 3.2.1.2)和γ- 淀粉酶(EC 3.2.1.3)。α-淀粉酶是在钙不存在的情况下不能起作用的钙金属酶。通过在沿着淀粉链的随机位置上作用,α-淀粉酶分解长链碳水化合物,最终从直链淀粉产生麦芽三糖和麦芽糖,或从支链淀粉产生麦芽糖、葡萄糖或"极限糊精"。因为其可作用于底物上的任何地方,因此α-淀粉酶倾向于比β-淀粉酶更快速地作用。在动物中,其是主要的消化酶并且其最适pH为约6.7-7.0。淀粉酶的另一种形式β- 淀粉酶还被细菌、真菌和植物合成。从非还原末端开始作用,β-淀粉酶催化第二个α-1,4糖苷键的水解,一次切掉两个葡萄糖单元(麦芽糖)。许多微生物产生淀粉酶来降解细胞外淀粉。除了切割直链淀粉和支链淀粉的非还原末端上的最后一个α(1-4)糖苷键,产生葡萄糖外,γ- 淀粉酶还切割α(1-6)糖苷键。另一种淀粉水解酶是作用于麦芽糖和由α-、β-和γ-淀粉酶产生的其它短的麦芽低聚糖、将它们转化成葡萄糖的α-葡糖苷酶。另一种淀粉水解酶是支链淀粉酶。支链淀粉酶是特定种类的葡聚糖酶,一种淀粉水解外酶,其降解芽霉菌糖。芽霉菌糖被认为是通过α-1,6-糖苷键连接的麦芽三糖单元的链。支链淀粉酶(EC 3.2.1.41)也称为芽霉菌糖-6-葡聚糖水解酶(脱支酶)。另一种淀粉水解酶异支链淀粉酶,将芽霉菌糖水解成异葡糖基麦芽糖(6-α-麦芽糖基葡萄糖)。异支链淀粉酶(EC 3.2.1.57)也称为芽霉菌糖4-葡聚糖水解酶。" 淀粉酶"可以是参与淀粉降解、代谢和/或水解的任何酶,包括α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶和α-葡糖苷酶。
如本文中所用,"糖解酶"可以是参与碳水化合物降解、代谢和/ 或水解的任何酶,包括淀粉酶、纤维素酶、半纤维素酶、纤维素分解和淀粉分解辅助酶、菊糖酶、果聚糖酶和戊糖利用酶。
生物质
生物质可包括本领域已知的或本文中描述的任何类型的生物质。例如,生物质可包括但不限于淀粉、糖和木质纤维素材料。淀粉材料可包括但不限于醪液例如玉米、小麦、黑麦、大麦、稻或高粱。糖材料可包括但不限于甜菜、朝鲜蓟根茎、甜高粱或藤条(cane)。术语"木质纤维素材料"、"木质纤维素底物"和"纤维质生物质"意指包含纤维素、半纤维素、木质素或其组合的任何类型的生物质,例如但不限于木质生物质,牧草,草本能源作物、非木本植物生物质、农业废物和/ 或农业残余物,林业废弃物和/或林业废物,造纸污泥和/或废纸污泥、废水处理污泥、城市固体废弃物,来自湿和干粉碎的玉米乙醇植物的玉米纤维和糖加工残渣。术语"半纤维素"、"半纤维素部分"和"半纤维素级分"意指木质纤维素材料的非木质素、非纤维素组分,例如但不限于半纤维素(即,包含木糖葡聚糖、木聚糖、葡糖醛酸聚糖、阿拉伯木聚糖、甘露聚糖、葡萄糖甘露聚糖和半乳葡甘露聚糖等等)、果胶 (例如,聚半乳糖醛酸(homogalacturonan)、鼠李半乳醛聚糖I和II以及木半乳糖醛酸)和蛋白聚糖(例如,阿拉伯半乳聚糖-蛋白质、伸展蛋白和富含脯氨酸的蛋白质)。
在非限定性实例中,木质纤维素材料可包括但不限于,木质生物质例如废弃木质纸浆纤维、锯屑、硬木、软木及其组合;草,例如柳枝稷、大米草、黑麦草、草芦、芒草或其组合;糖加工残渣,例如但不限于甘蔗渣;农业废物、例如但不限于稻秆、稻壳、大麦秆、玉米穗轴、谷类秆、小麦秆、芸苔秆、燕麦秆、燕麦壳和玉米纤维;秸秆,例如但不限于大豆秸秆、玉米秸秆;肉质植物,例如但不限于龙舌兰;和林业废物,例如但不限于再循环木浆纤维、锯屑、硬木(例如,白杨、橡木、枫木、桦木、柳树)、软木或其任意组合。木质纤维素材料可包含一个物种的纤维;或者,木质纤维素材料可包含源自不同木质纤维素材料的纤维的混合物。其它木质纤维素材料是农业废物,例如谷类秆,包括小麦秆,大麦秆,芸苔秆和燕麦秆;玉米纤维;秸秆,例如玉米秸秆和大豆秸秆;草,例如柳枝稷、草庐、大米草和芒草;或其组合。
纸污泥也是用于乳酸或乙酸生产的有机原料。纸污泥是从制浆和造纸产生的固体残渣,通常从初沉池中的处理废水取出。以$30/湿吨的处理成本,污泥处理的成本相当于$5/吨的被生产来销售的纸。湿污泥的处理成本极大地促使将材料转向其它用途,例如至乙醇的转化。本发明提供的处理是可广泛应用的。此外,糖化和/或发酵产物可用于产生乙醇或更高附加值的化学品,例如有机酸、芳族化合物、酯、丙酮和聚合物中间体。
甘油还原
厌氧生长条件需要内源电子受体的产生,例如辅酶烟酰胺腺嘌呤二核苷酸(NAD+)。在细胞氧化还原反应中,NAD+/NADH这一对作为还原当量的储存库和载体起着至关重要的作用。Ansell,R.,等人, EMBO J.16:2179-87(1997)。产生NAD+的细胞甘油的产生用作在酵母的厌氧发酵过程中除去过量还原力的氧化还原阀(redox valve)。然而,甘油的产生是消耗ATP的浪费能量的过程并且导致还原的三碳化合物的损失。Ansell,R.,等人,EMBOJ.16:2179-87(1997)。为了从起始葡萄糖分子产生甘油,甘油3-磷酸脱氢酶(GPD)将二羟丙酮磷酸还原成甘油3-磷酸,甘油3-磷酸酶(GPP)使甘油3-磷酸脱磷酸成甘油。尽管是浪费能量的,但甘油的产生是厌氧生长所必需的代谢过程,因为删除GPD活性在厌氧条件下完全抑制生长。参见Ansell,R.,等人, EMBO J.16:2179-87(1997)。
GPD由两个同基因(isogene)gpd1和gpd2编码。GPD1在厌氧生长细胞中编码主要同种型,而GPD2是在氧气不存在的情况下(这刺激其表达)甘油产生所必需的。Pahlman,A-K.,等人,J.Biol.Chem. 276:3555-63(2001)。GPD将二羟丙酮磷酸转化成甘油的第一步骤是速率控制性的。Guo,Z.P.,等人,Metab.Eng.13:49-59(2011)。GPP也由两个同基因gpp1和gpp2编码。当转换至厌氧条件时,GPP基因的缺失阻止生长,这表明GPP对于细胞对渗透和缺氧胁迫的耐受性是重要的。参见Pahlman,A-K.,等人,J.Biol.Chem.276:3555-63(2001)。
因为甘油是乙醇的厌氧产生的主要副产品,所以已进行了许多努力来除去甘油的细胞产生。然而,由于通过甘油合成产生的还原当量的原因,因此在不补偿该有价值的代谢功能的情况下不能进行甘油合成途径的删除。已进行了消除甘油产生和工程化交替电子受体的努力。 Lidén,G.,等人,Appl.Env.Microbiol.62:3894-96(1996);Medina, V.G.,等人,Appl.Env.Microbiol.76:190-195(2010)。Lidén和Medina 都删除了gpd1和gpd2基因并且尝试使用另外的碳源来绕开甘油形成。 Lidén将来自树干毕赤酵母的木糖还原酶工程化进入酿酒酵母gpd1/2 缺失菌株。木糖还原酶活性在木糖存在的情况下促进甘油缺失菌株的厌氧生长。参见Lidén,G.,等人,Appl.Env.Microbiol.62:3894-96 (1996)。Medina将来自大肠杆菌的乙醛脱氢酶mhpF工程化进入酿酒酵母gpd1/2缺失菌株来将乙酰-CoA转化成乙醛。乙醛脱氢酶活性在醋酸存在的情况下促进甘油缺失菌株的厌氧生长,但在葡萄糖作为唯一碳源存在的情况下则不。Medina,V.G.,等人,Appl.Env.Microbiol. 76:190-195(2010);也参见EP 2277989。Medina指出在工业实现之前需要解决的关于含mhpF菌株的几个问题,包括相较于含GPD1和 GPD2的酵母显著减弱的生长和产物形成率。
将流从甘油重新导向乙醇的另外的努力包括通过或不通过GPD1 的同时敲除将非磷酸化NADP+-依赖性甘油醛-3-磷酸脱氢酶(GAPN) 工程化进入酵母。Bro,C.,等人,Metab.Eng.8:102-111(2006);美国专利申请公布号US2006/0257983;Guo,Z.P.,等人,Metab.Eng. 13:49-59(2011)。然而,存在控制甘油的产生和积累的其它细胞机制,包括甘油输出者例如FPS1,其不需要交替NADP+/NADPH偶联的工程化和甘油合成基因的缺失。Tamás,M.J.,等人,Mol.Microbiol. 31:1087-1004(1999)。
FPS1是位于质膜中的通道蛋白,其在酵母渗透压调节中控制甘油的积累和释放。该菌株的无效突变体积累大量细胞内甘油,生长比野生型慢得多,并且以更慢的速率消耗糖底物。Tamás,M.J.,等人, Mol.Microbiol.31:1087-1004(1999)。尽管在缺氧条件下生长更慢,但 fps1Δ菌株可用作消除NAD+-依赖性甘油活性的替代物。fps1Δ菌株具有减少的甘油形成,但仍然具有完全功能性的NAD+-依赖性甘油合成途径。或者,不删除内源FPS1,可将来自其它生物的FPS1或同源物的组成型活性突变体用于调节甘油合成,同时使NAD+-依赖性甘油活性保持完整。在本发明的调节FPS1的实施方案中,重组宿主细胞仍然可合成和保留甘油,并且获得相较于不能产生甘油的菌株改善的鲁棒性。
下面显示来自酿酒酵母的示例性FPS1序列。
酿酒酵母FPS1(核苷酸;编码序列加以下划线;SEQ ID NO:1):
ttgacggcagttctcatagcatctcaaagcaatagcagtgcaaaagtacataaccgtagga aggtacgcggtaggtatttgagttcgttggtggttatcctccgcaaggcgcttcggcggttatttgttg atagtcgaagaacaccaaaaaaaatgctgttattgctttctccgtaaacaataaaacccggtagcg ggataacgcggctgatgcttttatttaggaaggaatacttacattatcatgagaacattgtcaaggg cattctgatacgggccttccatcgcaagaaaaaggcagcaacggactgagggacggagagagtta cggcataagaagtagtaggagagcagagtgtcataaagttatattattctcgtcctaaagtcaatta gttctgttgcgcttgacaatatatgtcgtgtaataccgtcccttagcagaagaaagaaagacggatc catatatgttaaaatgcttcagagatgtttctttaatgtgccgtccaacaaaggtatcttctgtagcttc ctctattttcgatcagatctcatagtgagaaggcgcaattcagtagttaaaagcggggaacagtgtg aatccggagacggcaagattgcccggccctttttgcggaaaagataaaacaagatatattgcactt tttccaccaagaaaaacaggaagtggattaaaaaatcaacaaagtataacgcctattgtcccaata agcgtcggttgttcttctttattattttaccaagtacgctcgagggtacattctaatgcattaaaagac atgagtaatcctcaaa aagctctaaacgactttctgtccagtgaatctgttcatacacatgatagttctaggaaacaatctaataagcagtc atccgacgaaggacgctcttcatcacaaccttcacatcatcactctggtggtactaacaacaataataacaataat aataataataataacagtaacaacaacaacaacggcaacgatgggggaaatgatgacgactatgattatgaaatgc aagattatagaccttctccgcaaagtgcgcggcctactcccacgtatgttccacaatattctgtagaaagtgggac tgctttcccgattcaagaggttattcctagcgcatacattaacacacaagatataaaccataaagataacggtccg ccgagtgcaagcagtaatagagcattcaggcctagagggcagaccacagtgtcggccaacgtgcttaacattgaag atttttacaaaaatgcagacgatgcgcataccatcccggagtcacatttatcgagaaggagaagtaggtcgagggc tacgagtaatgctgggcacagtgccaatacaggcgccacgaatggcaggactactggtgcccaaactaatatggaa agcaatgaatcaccacgtaacgtccccattatggtgaagccaaagacattataccagaaccctcaaacacctacag tcttgccctccacataccatccaattaataaatggtcttccgtcaaaaacacttatttgaaggaatttttagccga gtttatgggaacaatggttatgattattttcggtagtgctgttgtttgtcaggtcaatgttgctgggaaaatacag caggacaatttcaacgtggctttggataaccttaacgttaccgggtcttctgcagaaacgatagacgctatgaaga gtttaacatccttggtttcatccgttgcgggcggtacctttgatgatgtggcattgggctgggctgctgccgtggt gatgggctatttctgcgctggtggtagtgccatctcaggtgctcatttgaatccgtctattacattagccaatttg gtgtatagaggttttcccctgaagaaagttccttattactttgctggacaattgatcggtgccttcacaggcgctt tgatcttgtttatttggtacaaaagggtgttacaagaggcatatagcgattggtggatgaatgaaagtgttgcggg aatgttttgcgtttttccaaagccttatctaagttcaggacggcaatttttttccgaatttttatgtggagctatg ttacaagcaggaacatttgcgctgaccgatccttatacgtgtttgtcctctgatgttttcccattgatgatgttta ttttgattttcattatcaatgcttccatggcttatcagacaggtacagcaatgaatttggctcgtgatctgggccc acgtcttgcactatatgcagttggatttgatcataaaatgctttgggtgcatcatcatcatttcttttgggttccc atggtaggcccatttattggtgcgttaatgggggggttggtttacgatgtctgtatttatcagggtcatgaatctc cagtcaactggtctttaccagtttataaggaaatgattatgagagcctggtttagaaggcctggttggaagaagag aaatagagcaagaagaacatcggacctgagtgacttctcatacaataacgatgatgatgaggaatttggagaaaga atggctcttcaaaagacaaagaccaagtcatctatttcagacaacgaaaatgaagcaggagaaaagaaagtgcaat ttaaatctgttcagcgcggcaaaagaacgtttggtggtataccaacaattcttgaagaagaagattccattgaaac tgcttcgctaggtgcgacgacgactgattctattgggttatccgacacatcatcagaagattcgcattatggtaat gctaagaaggtaacatgagaaaacagac aagaaaaagaaacaaataatatagactgatagaaaaaaatactgcttactaccgccggtataata tatatatatatatatatttacatagatgattgcatagtgttttaaaaagctttcctaggttaagctatga atcttcataacctaaccaactaaatatgaaaatactgacccatcgtcttaagtaagttgacatgaact cagcctggtcacctactatacatgatgtatcgcatggatggaaagaataccaaacgctaccttccag gttaatgatagtatccaaacctagttggaatttgccttgaacatcaagcagcgattcgatatcagttg ggagcatcaatttggtcattggaataccatctatgcttttctcctcccatattcgcaaaagtagtaagg gctcgttatatacttttgaatatgtaagatataattctatatgatttagtaatttattttctatacgctca gtatttttctgcagttgtcgagtaggtattaaacgcaaaagaagtccatccttttcatcattcaaatgg acatcttggcaaagggcccagttatggaaaatctgggagtcatacaacgattgcagttggctatgc cactcctggtaaggaatcatcaagtctgataattctgttttttagccctttttttttttttttcatggtgttc tcttctcattgcttttcaattttaagttcgttacctttcatatagagtttcttaacagaaatttcacaacg aaaatataattaactacaggca
酿酒酵母FPS1(氨基酸;SEQ ID NO:2):
丙酮酸甲酸裂解酶(PFL)
丙酮酸至乙酰-CoA和甲酸的转化通过丙酮酸甲酸裂解酶(PFL) 来进行。在大肠杆菌中,PFL是负责产生甲酸的主要酶。PFL是需要激活性酶PflAE(其由pflA编码)、活性的S-腺苷甲硫氨酸和单电子供体的PflB的二聚体。参见Waks,Z.和Silver,P.A.,Appl.Env.Microbiol. 75:1867-1875(2009)。Waks和Silver工程化了酿酒酵母的菌株以分泌甲酸(通过添加来自大肠杆菌的PFL和AdhE和缺失内源甲酸脱氢酶) 并使用大肠杆菌在两步骤法中产生氢。然而,Waks和Silver未将甲酸产生与甘油形成的除去组合,甲酸用作用于甘油还原的交替电子受体的用途未被提出或评价。
用于本发明的重组宿主细胞的PFL酶可来自细菌或真核生物来源。细菌PFL的实例包括但不限于地衣芽胞杆菌DSM13、地衣芽胞杆菌ATCC14580、嗜热链球菌CNRZ1066、嗜热链球菌LMG18311、嗜热链球菌LMD-9、胚芽乳杆菌WCFS1(基因登录号lp_2598)、胚芽乳杆菌WCFS1(基因登录号lp_3313)、胚芽乳杆菌JDM1(基因登录号JDM1_2695)、胚芽乳杆菌JDM1(基因登录号JDM1_2087)、干酪乳杆菌bl23、干酪乳杆菌ATCC 334、青春双岐杆菌、长双歧杆菌 (Bifidobacterium longum)NCC2705、长双歧杆菌DJO10A、动物双歧杆菌(Bifidobacterium animalis)DSM 10140、解纤维素梭菌或大肠杆菌。另外的PFL酶可来自PFL1家族、RNR pfl超家族或PFL2超家族。
来自细菌的pflA序列包括:
地衣芽胞杆菌DSM13(核苷酸;SEQ ID NO:3):
地衣芽胞杆菌DSM13(氨基酸;SEQ ID NO:4):
地衣芽胞杆菌ATCC14580(核苷酸;SEQ ID NO:5):
地衣芽胞杆菌ATCC14580(氨基酸;SEQ ID NO:6):
嗜热链球菌CNRZ1066(核苷酸;SEQ ID NO:7):
嗜热链球菌CNRZ1066(氨基酸;SEQ ID NO:8):
嗜热链球菌LMG18311(核苷酸;SEQ ID NO:9):
嗜热链球菌LMG18311(氨基酸;SEQ ID NO:10):
嗜热链球菌LMD-9(核苷酸;SEQ ID NO:11):
嗜热链球菌LMD-9(氨基酸;SEQ ID NO:12):
胚芽乳杆菌WCFS1(基因登录号:lp_2596)(核苷酸;SEQ ID NO:13):
胚芽乳杆菌WCFS1(基因登录号:lp_2596)(氨基酸;SEQ ID NO:14):
胚芽乳杆菌WCFS1(基因登录号:lp_3314)(核苷酸;SEQ ID NO:15):
胚芽乳杆菌WCFS1(基因登录号:lp_3314)(氨基酸;SEQ ID NO:16):
胚芽乳杆菌JDM1(基因登录号:JDM1_2660)(核苷酸;SEQ ID NO:17):
胚芽乳杆菌JDM1(基因登录号:JDM1_2660)(氨基酸;SEQ ID NO:18):
胚芽乳杆菌JDM1(基因登录号:JDM1_2085)(核苷酸;SEQ ID NO:19):
胚芽乳杆菌JDM1(基因登录号:JDM1_2085)(氨基酸;SEQ ID NO:20):
干酪乳杆菌bl23(核苷酸;SEQ ID NO:21):
干酪乳杆菌bl23(氨基酸;SEQ ID NO:22):
干酪乳杆菌ATCC 334(核苷酸;SEQ ID NO:23):
干酪乳杆菌ATCC 334(氨基酸;SEQ ID NO:24):
青春双岐杆菌(核苷酸;SEQ ID NO:25):
青春双岐杆菌(氨基酸;SEQ ID NO:26):
长双歧杆菌NCC2705(核苷酸;SEQ ID NO:27):
长双歧杆菌NCC2705(氨基酸;SEQ ID NO:28):
长双歧杆菌DJO10A(核苷酸;SEQ ID NO:29):
长双歧杆菌DJO10A(氨基酸;SEQ ID NO:30):
动物双歧杆菌DSM 10140(核苷酸;SEQ ID NO:31):
动物双歧杆菌DSM 10140(氨基酸;SEQ ID NO:32):
解纤维素梭菌(核苷酸;SEQ ID NO:33):
解纤维素梭菌(氨基酸;SEQ ID NO:34):
大肠杆菌(核苷酸;SEQ ID NO:35):
大肠杆菌(氨基酸;SEQ ID NO:36):
来自细菌的pflB序列包括:
地衣芽胞杆菌DSM13(核苷酸;SEQ ID NO:37):
地衣芽胞杆菌DSM13(氨基酸;SEQ ID NO:38):
地衣芽胞杆菌ATCC14580(核苷酸;SEQ ID NO:39):
地衣芽胞杆菌ATCC14580(氨基酸;SEQ ID NO:40):
嗜热链球菌CNRZ1066(核苷酸;SEQ ID NO:41):
嗜热链球菌CNRZ1066(氨基酸;SEQ ID NO:42):
嗜热链球菌LMG18311(核苷酸;SEQ ID NO:43):
嗜热链球菌LMG18311(氨基酸;SEQ ID NO:44):
嗜热链球菌LMD-9(核苷酸;SEQ ID NO:45):
嗜热链球菌LMD-9(氨基酸;SEQ ID NO:46):
胚芽乳杆菌WCFS1(基因登录号lp_2598)(核苷酸;SEQ ID NO:47):
胚芽乳杆菌WCFS1(基因登录号lp_2598)(氨基酸;SEQ ID NO:48):
胚芽乳杆菌WCFS1(基因登录号:lp_3313)(核苷酸;SEQ ID NO:49):
胚芽乳杆菌WCFS1(基因登录号:lp_3313)(氨基酸;SEQ ID NO:50):
胚芽乳杆菌JDM1(基因登录号:JDM1_2695)(核苷酸;SEQ ID NO:51):
胚芽乳杆菌JDM1(基因登录号:JDM1_2695)(氨基酸;SEQ ID NO:52):
胚芽乳杆菌JDM1(基因登录号:JDM1_2087)(核苷酸;SEQ ID NO:53):
胚芽乳杆菌JDM1(基因登录号:JDM1_2087)(氨基酸;SEQ ID NO:54):
干酪乳杆菌bl23(核苷酸;SEQ ID NO:55):
干酪乳杆菌bl23(氨基酸;SEQ ID NO:56):
干酪乳杆菌ATCC 334(核苷酸;SEQ ID NO:57):
干酪乳杆菌ATCC 334(氨基酸;SEQ ID NO:58):
青春双岐杆菌(核苷酸;SEQ ID NO:59):
青春双岐杆菌(氨基酸;SEQ ID NO:60):
长双歧杆菌NCC2705(核苷酸;SEQ ID NO:61):
长双歧杆菌NCC2705(氨基酸;SEQ ID NO:62):
长双歧杆菌DJO10A(核苷酸;SEQ ID NO:63):
长双歧杆菌DJO10A(氨基酸;SEQ ID NO:64):
动物双歧杆菌DSM 10140(核苷酸;SEQ ID NO:65):
动物双歧杆菌DSM 10140(氨基酸;SEQ ID NO:66):
解纤维素梭菌(核苷酸;SEQ ID NO:67):
解纤维素梭菌(氨基酸;SEQ ID NO:68):
大肠杆菌(核苷酸;SEQ ID NO:69):
大肠杆菌(氨基酸;SEQ ID NO:70):
真核生物PFL的实例包括但不限于莱茵衣藻PflA1、单鞭毛菌属 E2或新丽鞭毛菌、Acetabularia acetabulum、雨生红球藻、团藻 (Volvox carteri)、海洋真核微藻、绿色鞭毛藻(Ostreococcus lucimarinus)、金藻(Micromonas pusilla)、微单胞菌属(Micromonassp.)、坛紫菜和蓝载藻(Cyanophora paradoxa))、后鞭毛生物(寄生变形毛菌(Amoebidiumparasiticum))、amoebozoan(Mastigamoeba balamuthi)、原生藻菌(stramenopile)(假微型海链藻(Thalassiosira pseudonana)(2))和粘着植物(haptophyte)(小定鞭金藻(Prymnesium parvum))、M.pusilla、微单胞菌属海洋真核微藻(O.tauri)和绿藻(O.lucimarinus)),amoebozoan(M.balamuthi)和原生藻菌(假微型海链藻(T.pseudonana))。参见Stairs,C.W.,等人,"Eukaryotic pyruvate formate lyase and its activatingenzyme were acquired laterally from a firmicute,"Mol.Biol.and Evol.,于2011年2月3日在 http://mbe.oxfordjournals.org/上在线出版的。
来自真核生物的pflA序列包括:
莱茵衣藻PflA1(核苷酸;SEQ ID NO:71):
莱茵衣藻PflA1(氨基酸;SEQ ID NO:72):
新丽鞭毛菌(核苷酸;SEQ ID NO:73):
新丽鞭毛菌(氨基酸;SEQ ID NO:74):
来自真核生物的pfl1序列包括:
莱茵衣藻PflA(核苷酸;SEQ ID NO:75):
莱茵衣藻PflA(氨基酸;SEQ ID NO:76):
单鞭毛菌属E2(核苷酸;SEQ ID NO:77):
单鞭毛菌属E2(氨基酸;SEQ ID NO:78):
新丽鞭毛菌(核苷酸–部分CDS,失去起始;SEQ ID NO:79):
新丽鞭毛菌(氨基酸–部分CDS,失去起始;SEQ ID NO:80):
乙醛/醇脱氢酶
乙醛脱氢酶、醇脱氢酶和/或双功能乙醛/醇脱氢酶至细胞中的工程化可增加乙醇的产量。然而,因为乙醇的产生是氧化还原中性的,因此乙醛/醇脱氢酶活性不能用作甘油的产生给无氧代谢中的细胞提供的氧化还原平衡的替代。当Medina试图在酿酒酵母gpd1/2缺失菌株中表达来自大肠杆菌的乙醛脱氢酶mhpF时,菌株在葡萄糖作为唯一碳源存在的情况下在缺氧条件下不生长。Medina,V.G.,等人,Appl. Env.Microbiol.76:190-195(2010);也参见EP 2277989。相反地,甘油缺失菌株的厌氧生长需要醋酸的存在。然而,乙醛脱氢酶从未与PFL 组合表达或用本发明的重组宿主细胞表达。此外,用改善的乙醛脱氢酶或使用双功能乙醛/醇脱氢酶(AADH)替代内源乙醛脱氢酶可积极地影响反应的体内动力学,从而提供改善的宿主菌株生长。
用于本发明的重组宿主细胞的AADH酶可来自细菌或真核细胞来源。细菌AADH的实例包括但不限于Clostridium phytofermentans、大肠杆菌、凝结芽孢杆菌(Bacilluscoagulans)、缓慢芽孢杆菌(Bacillus lentus)、地衣芽胞杆菌、短小芽孢杆菌(Bacilluspumilus)、枯草芽孢杆菌(Bacillus subtilis)、嗜淀粉拟杆菌(Bacteroidesamylophilus)、多毛拟杆菌(Bacteroides capillosus)、栖瘤胃拟杆菌(Bacteroidesruminocola)、猪拟杆菌(Bacteroides suis)、青春双岐杆菌、动物双歧杆菌(Bifidobacterium animalis)、两岐双岐杆菌(Bifidobacterium bifidum)、婴儿双岐杆菌(Bifidobacterium infantis)、长双歧杆菌(Bifidobacterium longum)、嗜热双歧杆菌(Bifidobacterium thermophilum)、嗜酸乳杆菌 (Lactobacillus acidophilus)、短小乳杆菌(Lactobacillus brevis)、布赫纳乳杆菌(Lactobacillus buchneri)(仅牛)、保加利亚乳杆菌(Lactobacillus bulgaricus)、干酪乳杆菌、纤维二糖乳杆菌(Lactobacilluscellobiosus)、弯曲乳杆菌(Lactobacillus curvatus)、德氏乳杆菌(Lactobacillusdelbruekii)、香肠乳杆菌(Lactobacillus farciminis)(仅猪)、发酵乳杆菌(Lactobacillus fermentum)、瑞士乳杆菌(Lactobacillus helveticus)、乳酸乳杆菌(Lactobacillus lactis)、胚芽乳杆菌、罗特氏乳杆菌 (Lactobacillus reuterii)、肠膜样明串珠菌(Leuconostoc mesenteroides)、乳酸片球菌(Pediococcus acidilacticii)、戊糖片球菌(Pediococcus pentosaceus)、酸丙酸杆菌(Propionibacteriumacidpropionici)(仅牛)、费氏丙酸杆菌(Propionibacterium freudenreichii)、株薛氏丙酸杆菌 (Propionibacterium shermanii)、Enterococcus cremoris、二丁酮肠球菌(Enterococcus diacetylactis)、屎肠球菌(Enterococcus faecium)、中间型肠球菌(Enterococcus intermedius)、乳酸肠球菌(Enterococcus lactis)或嗜热肠球菌(Enterococcus thermophilus)。
AdhE细菌序列包括:
Clostridium phytofermentans(核苷酸;SEQ ID NO:81):
Clostridium phytofermentans(氨基酸;SEQ ID NO:82):
大肠杆菌(核苷酸;SEQ ID NO:83):
大肠杆菌(氨基酸;SEQ ID NO:84):
青春双岐杆菌(氨基酸;SEQ ID NO:100):
凝结芽孢杆菌(氨基酸;SEQ ID NO:101):
地衣芽胞杆菌(氨基酸;SEQ ID NO:102):
屎肠球菌(Enterococcus faecium)TX1330(氨基酸;SEQ ID NO:103):
真核细胞AdhE的实例包括但不限于莱茵衣藻AdhE、单鞭毛菌属E2或新丽鞭毛菌。
来自真核细胞的AdhE序列包括:
莱茵衣藻AdhE(核苷酸;SEQ ID NO:85):
莱茵衣藻AdhE(氨基酸;SEQ ID NO:86):
单鞭毛菌属E2(核苷酸;SEQ ID NO:87):
单鞭毛菌属E2(氨基酸;SEQ ID NO:88):
联合生物加工
联合生物加工(CBP)是纤维质生物质的加工策略,其包括将4个生物介导的事件:酶产生、水解、己糖发酵和戊糖发酵合并成单个过程。执行该策略需要开发利用纤维素、半纤维素和其它生物质组分同时还以充分高的产率和浓度产生目的产物的微生物。CBP的可行性得到动力学和生物能分析的支持。参见van Walsum和Lynd(1998)Biotech.Bioeng.58:316。
CBP提供了相较于以专用糖解酶生产为特征的方法具有更低成本和更高效率的可能性。益处部分产生于避免的资金成本、底物和其它原料以及与糖解酶产生相关的效用。此外,几个因素支持更高水解率的实现,从而减少的使用CBP的反应器体积和资本投资,包括酶- 微生物协同作用和嗜温生物和/或复合糖解系统的使用。此外,附着纤维素的分解纤维素微生物可能成功地与非附着微生物例如污染物竞争纤维素水解产物,这可增加基于微生物纤维素利用的工业过程的稳定性。开发能够进行CBP的微生物的进展正通过两个策略来进行:工程化天然存在的糖解微生物以改善产物相关性质,例如产率和滴度;和工程化显示高成品收率和滴度的非糖解微生物以表达使得能够利用淀粉、纤维素和半纤维素的异源糖解酶系统。
淀粉和纤维素降解
淀粉至组分糖单元的降解通过淀粉分解酶进行。淀粉酶是存在于人唾液中的淀粉分解酶的实例,在唾液中其开始化学降解过程。胰腺也产生淀粉酶(α淀粉酶)来将饮食淀粉水解成二糖和三糖,所述二糖和三糖被其它酶转化成葡萄糖来给身体提供能量。植物和一些细菌也产生淀粉酶。淀粉酶是糖苷水解酶并且作用于α-1,4-糖苷键。
几种淀粉分解酶参与淀粉水解。α-淀粉酶(EC 3.2.1.1)(另名: 1,4-α-D-葡聚糖葡萄糖水解酶;糖原酶)是钙金属酶,即,在钙不存在的情况下完全不能作用。通过在沿着淀粉链的随机位置上作用,α-淀粉酶分解长链碳水化合物,最终从直链淀粉产生麦芽三糖和麦芽糖,或从支链淀粉产生麦芽糖、葡萄糖和"极限糊精"。因为其可在底物上任何地方作用,因此α-淀粉酶倾向于比β-淀粉酶更快地作用。淀粉酶的另一种形式β-淀粉酶(EC3.2.1.2)(别名:1,4-α-D-葡聚糖麦芽糖水解酶;糖原酶;糖原淀粉酶)催化第二α-1,4糖苷键水解,一次切除2个葡萄糖单元(麦芽糖)。第三淀粉酶是γ-淀粉酶(EC 3.2.1.3)(别名:葡聚糖1,4-α-葡糖苷酶;淀粉葡糖苷酶;外切-1,4-α-葡糖苷酶;葡糖淀粉酶;溶酶体α-葡糖苷酶;1,4-α-D-葡聚糖葡糖水解酶)。除了切割直链淀粉和支链淀粉的非还原末端上的最后一个α(1-4)糖苷键,产生葡萄糖外,γ-淀粉酶还将切割α(1-6)糖苷键。
第四酶α-葡糖苷酶作用于由α-、β-和γ-淀粉酶产生的麦芽糖和其它短的麦芽寡糖,将它们转化成葡萄糖。
3个主要类型的酶促活性降解天然纤维素。第一类型是内切葡聚糖酶(1,4-β-D-葡聚糖4-葡聚糖水解酶;EC 3.2.1.4)。内切葡聚糖酶在无定形纤维素的纤维素多糖链上随机切割,从而产生不同长度的寡聚糖和从而新的链末端。第二类型是外切葡聚糖酶,包括纤维糊精酶 (1,4-β-D-葡聚糖葡聚糖水解酶;EC 3.2.1.74)和纤维二糖水解酶 (1,4-β-D-葡聚糖纤维二糖水解酶;EC 3.2.1.91)。外切葡聚糖酶以持续方式作用于纤维素多糖链的还原或非还原末端,释放葡萄糖(葡聚糖水解酶)或纤维二糖(纤维二糖水解酶)作为主要产物。外切葡聚糖酶还可作用于微晶纤维素,假定地从微晶结构剥离纤维素链。第三类型是β-葡糖苷酶(β-葡糖苷葡糖水解酶;EC 3.2.1.21)。β-葡糖苷酶将可溶性纤维糊精和纤维二糖水解成葡萄糖单元。
即使先前已公开了表达用于从谷粒或淀粉产生燃料乙醇的酶的酵母菌株,但因所得菌株相对较弱的产生/耐受高水平乙醇的能力,该应用在基于谷粒的燃料乙醇工业中仍未商业化。例如,美国专利号7,226,776公开了表达乙醇原的多糖酶可从碳水化合物聚合物直接产生乙醇,但显示的最大乙醇滴度为3.9g/l。美国专利号5,422,267公开了酵母中的葡糖淀粉酶用于产生酒精性饮料的用途;然而,未公开乙醇的商业相关滴度。
异源糖解酶
根据本发明的方面,本发明的重组微生物的异源糖解酶的表达可有利地用于从生物质来源产生产物例如乙醇。例如,可异源地表达来自多种来源的纤维素酶以成功地增加乙醇产生的效率。糖解酶可来自真菌、酵母、细菌、植物、原生动物或白蚁来源。在一些实施方案中,糖解酶来自灰腐质霉(H.grisea)、嗜热子囊茵、埃默森篮状菌(T. emersonii)、里氏木霉、澳洲乳白蚁(C.lacteus)、台湾乳白蚁(C. formosanus)、高山象白蚁(N.takasagoensis)、澳大利亚矛颚家白蚁 (C.acinaciformis)、达尔文澳白蚁(M.darwinensis)、N.walkeri、扣囊复膜酵母、C.lucknowense、黄胸散白蚁(R.speratus)、嗜热放线菌、热纤梭菌、解纤维素梭菌、约氏梭菌、短小芽孢杆菌、粪碱纤维单胞菌、多糖降解菌、Piromyces equii、Neocallimastix patricarum 或拟南芥。
在一些实施方案中,用于在本发明的重组微生物中表达的纤维素酶是共同未决的国际申请号PCT/US2011/039192(通过引用并入本文) 的表4或7中公开的任何纤维素酶,或适合用于在适当的宿主细胞中表达的任何纤维素酶。在其它实施方案中,用于在本发明的重组微生物中表达的淀粉酶是任何淀粉酶例如α-淀粉酶、β-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、支链淀粉酶或异支链淀粉酶旁系同源物或直系同源物、共同未决的国际申请号PCT/US2011/039192(通过引用并入本文) 的表15-19中(优选表19中)公开的任何淀粉酶,或适合用于在适当的宿主细胞中表达的任何淀粉酶。在本发明的一些实施方案中,在相同的重组微生物中共表达来自单个生物体的多个糖解酶。在本发明的一些实施方案中,在相同的重组微生物中共表达来自不同生物体的多个糖解酶。具体地,可在相同的重组微生物中共表达来自2、3、4、5、6、7、8、9或更多个生物体的糖解酶。类似地,本发明可包括酵母菌株的共培养,其中酵母菌株表达不同的糖解酶。共培养可包括表达来自相同生物体或来自不同生物体的异源糖解酶的酵母菌株。共培养物可包括来自2、3、4、5、6、7、8、9或更多个生物体的表达糖解酶的酵母菌株。
用于本发明的重组微生物中表达的木质纤维素酶包括内切葡聚糖酶和外切葡聚糖酶。用于在本发明的重组微生物中表达的其它木质纤维素酶包括可作用于木质纤维素材料的辅助酶。木质纤维素酶可以是例如内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木葡聚糖酶、木聚糖内切酶、葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿拉伯呋喃糖水解酶、膨胀素(swollenins)、葡糖醛酸酯酶、扩展蛋白、果胶酶和阿魏酰酯酶。在一些实施方案中,本发明的木质纤维素酶可以是用于降解期望的木质纤维素材料的任何适当的酶。
在本发明的某些实施方案中,木质纤维素酶可以是内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木葡聚糖酶、木聚糖内切酶、葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿拉伯呋喃糖水解酶、膨胀素(swollenins)、葡糖醛酸酯酶、扩展蛋白、果胶酶和阿魏酰酯酶旁系同源物或直系同源物。在具体实施方案中,木质纤维素酶来源于共同未决的国际申请号PCT/US2011/039192(通过引用并入本文)的表4和7中命名的任何物种。
木糖代谢
木糖是可被多种生物代谢成有用的产物的五碳单糖。存在两个主要的木糖代谢途径,每一个途径在它们利用的特征酶上是独特的。一个途径称为"木糖还原酶-木糖醇脱氢酶"或XR-XDH途径。木糖还原酶(XR)和木糖醇脱氢酶(XDH)是用于该木糖降解的方法的两种主要的酶。由XYL1基因编码的XR负责木糖至木糖醇的还原,并且借助于辅因子NADH或NADPH。随后木糖醇被XDH(所述XDH通过XYL2 基因表达)氧化成木酮糖,并且专门地利用辅因子NAD+来实现。由于该途径需要不同的辅因子以及它们可被使用所达到的程度,不平衡可导致木糖醇副产品的过量产生以及期望的乙醇的无效产生。已在实验室中测试了XR和XDH酶水平的不同表达以试图最优化木糖代谢途径的效率。
木糖代谢的另一个途径称为"木糖异构酶"(XI)途径。酶XI负责木糖至木酮糖的直接转化,并且不通过木糖醇中间产物来进行。两个途径都产生木酮糖,尽管使用的酶不同。在木酮糖产生后,XR-XDH 和XI途径通过由基因XKS1编码的酶木酮糖激酶(XK)进行,以进一步将木酮糖修饰成木酮糖-5-磷酸,随后其进入磷酸戊糖途径以进一步分解代谢。
关于在木糖代谢过程中通过磷酸戊糖途径的流的研究已显示限制该步骤的速度可有益于至乙醇的发酵的效率。可提高乙醇产量的对该流的修饰包括a)降低磷酸葡糖异构酶活性,b)删除GND1基因,和 c)删除ZWF1基因(Jeppsson等人,Appl.Environ.Microbiol.68:1604-09(2002))。由于磷酸戊糖途径在代谢过程中产生额外的 NADPH,因此限制该步骤可帮助修正NAD(P)H与NAD+辅因子之间的已很明显的不平衡并减少木糖醇副产物。比较两个木糖代谢途径的另一个实验显示XI途径最能够代谢木糖以产生最大乙醇产率,然而 XR-XDH途径达到快得多的乙醇产生速率(Karhumaa等人,Microb Cell Fact.2007Feb 5;6:5)。也参考国际公布号WO2006/009434,通过引用将其整体并入本文。
在一些实施方案中,本发明的重组微生物具有使用上述酶的一种或多种代谢木糖的能力。
阿拉伯糖代谢
阿拉伯糖是可被多种生物代谢成有用的产物的五碳单糖。L-阿拉伯糖经发现广泛地分布在不同植物组织的许多杂多糖例如阿拉伯聚糖、阿拉伯半乳聚糖、木聚糖和阿拉伯木聚糖中。土壤中的芽孢杆菌属的种类参与植物材料分解的早期,枯草芽孢杆菌分泌3种酶,内切阿拉伯聚糖酶和两种阿拉伯糖苷酶,所述酶能够从植物细胞释放阿拉伯糖基寡聚物和L-阿拉伯糖。
微生物的L-阿拉伯糖代谢的3个途径已进行了描述。许多细菌,包括大肠杆菌,使用阿拉伯糖异构酶(AraA;E.C.5.3.1.4),核酮糖激酶(AraB;E.C.2.7.1.16)和磷酸核酮糖差向异构酶(AraD;E.C.5.1.3.4) 来相继地将L-阿拉伯糖通过L-核酮糖和L-核酮糖5-磷酸转化成D-木酮糖-5-磷酸。参见,例如,Sa-Nogueira I,等人,Microbiology 143:957–69(1997)。D-木酮糖-5-磷酸随后进入磷酸戊糖途径以进一步分解代谢。在第二途径中,L-阿拉伯糖通过阿拉伯糖脱氢酶(ADH)、阿拉伯糖酸内酯(AL)和阿拉伯糖酸脱水酶(AraC)的连续作用转化成 L-2-酮-3-脱氧阿糖酸酯(L-KDA)。参见,例如,Watanabe,S,等人,J.Biol.Chem.281:2612-2623(2006)。L-KDA还可在两个替代途径中被代谢:1)L-KDA通过L-KDA脱水酶和KGSA脱氢酶经2-酮戊二半醛(KGSA)至2-酮戊二酸的转化,或2)L-KDA通过L-KDA醛缩酶至丙酮酸和羟基乙醛的转化。在第三真菌途径中,L-阿拉伯糖通过酶例如NAD(P)H-依赖性醛糖还原酶(AR)、L-阿拉伯糖醇4-脱氢酶 (ALDH)、L-木酮糖还原酶(LXR)、木糖醇脱氢酶(XylD)和木酮糖激酶 (XylB)经由L-阿拉伯糖醇、L-木酮糖和木糖醇转化成D-木酮糖-5-磷酸。这些和其它参与阿拉伯糖代谢和调控的蛋白质可见于 http://www.nmpdr.org/FIG/wiki/rest.cgi/NmpdrPlugin/SeedViewer?p age=Subsystems;subsystem=L-Arabinose_utilization,2011年3月21 日访问的,将其通过引用整体并入本文。
AraC蛋白调节其自己合成和Ara系统的其它基因的表达。参见 Schleif,R.,Trends Genet.16(12):559-65(2000)。在大肠杆菌中,AraC 蛋白正和负调节L-阿拉伯糖的摄取和分解代谢所需的蛋白质的表达。 AraC的同源物例如鼠李糖操纵子的调控蛋白RhaR和RhaS已被鉴定,其包含与AraC的DNA结合结构域同源的区域(Leal,T.F.和de Sa-Nogueira,I.,FEMS Microbiol Lett.241(1):41-48(2004))。这样的阿拉伯糖调控蛋白称为AraC/XylS家族。也参见,Mota,L.J.,等人,Mol. Microbiol.33(3):476-89(1999);Mota,L.J.,等人,J Bacteriol. 183(14):4190-201(2001)。
在大肠杆菌中,L-阿拉伯糖穿过大肠杆菌胞质膜的转运需要高亲和力转运操纵子araFGH、低亲和力转运操纵子上的结合蛋白依赖性系统araE、质子协同转运蛋白的表达。其它阿拉伯糖转运蛋白包括马克斯克鲁维酵母和季也蒙毕赤酵母鉴定的,美国专利号7,846,712(将其通过引用并入本文)中公开的那些阿拉伯糖转运蛋白。
在一些实施方案中,本发明的重组微生物具有使用一种或多种上述酶代谢阿拉伯糖的能力。
微生物
本发明包括多个用于开发具有进行CBP所需的底物利用与产物形成性质的组合的微生物的策略。"天然纤维素分解策略"包括工程化天然存在的纤维素分解性微生物来改善产物相关性质,例如产率和滴度。"重组纤维素分解策略"包括工程化显示高产品收率和滴度的天然非纤维素分解性微生物,以表达使得能够利用纤维素或半纤维素或两者的异源纤维素酶系统。
许多细菌具有通过糖酵解过程将简单己糖发酵成酸性和pH中性产物的能力。糖酵解途径是冗余的,并且包括一系列酶促步骤,通过所述步骤六碳葡萄糖分子通过多个中间产物分解成两个分子的三碳化合物丙酮酸。该过程导致ATP(生物能提供)和还原型辅因子NADH的净产生。
丙酮酸是代谢的重要中间化合物。例如,在好氧条件下,丙酮酸可被氧化成乙酰辅酶A(乙酰-CoA),其随后进入三羧酸循环(TCA),这继而产生合成前体、CO2和还原型辅因子。随后辅因子通过将氢当量经由一系列酶促步骤捐赠给氧而被氧化,从而导致水和ATP的形成。该能量形成过程称为氧化磷酸化。
在缺氧条件下(无可获得的氧),发酵发生,其中有机化合物的降解产物用作氢供体和受体。来自糖酵解的过量NADH在牵涉有机底物的还原的反应中被氧化成产物,例如乳酸盐和乙醇。此外,ATP在称为底物水平磷酸化的过程中从有机酸例如醋酸的产生再生。因此,糖酵解和丙酮酸代谢的发酵产物包括多种有机酸、醇和CO2
大多数兼性厌氧菌通过丙酮酸脱氢酶(PDH)和三羧酸循环(TCA) 需氧地代谢丙酮酸。在缺氧条件下,用于丙酮酸代谢的主要能量途径是通过丙酮酸甲酸裂解酶(PFL)途径来产生甲酸和乙酰-CoA。随后将乙酰-CoA通过磷酸乙酸转移酶(PTA)和乙酸激酶(ACK)转化成醋酸,共产生ATP,或经乙醛脱氢酶(ACDH)和醇脱氢酶(ADH)还原成乙醇。为了维持还原当量的平衡,在丙酮酸至乳酸盐的还原过程中,通过乳酸脱氢酶(LDH)将从糖酵解产生的过量NADH再氧化成 NAD+。NADH还可在乙酰-CoA至乙醇的还原过程中被ACDH和ADH 再氧化,但这在具有功能性LDH的细胞中是次要反应。
宿主细胞
用于本发明的宿主细胞包括任何原核或真核细胞;例如,选自细菌、藻类和酵母细胞的微生物。适合于本发明的宿主细胞是例如气单胞菌属(Aeromonas)、曲霉菌属(Aspergillus)、芽孢杆菌属(Bacillus)、埃希氏菌属、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、红球菌属(Rhodococcus)、酵母菌属(Saccharomyces)和链霉菌属(Streptomyces)的微生物。
在一些实施方案中,宿主细胞是微生物。在一个实施方案中,微生物是酵母。根据本发明,酵母宿主细胞可以例如来自酵母菌属、克鲁维酵母属、假丝酵母属(Candida)、毕赤酵母属、裂殖酵母菌属 (Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)和子囊菌酵母属 (Yarrowia)。作为宿主细胞的酵母物种可包括例如酿酒酵母、博伊丁酵母、S.barnetti、少孢酵母、葡萄汁酵母、糖化酵母、乳酸克鲁维酵母、马克斯克鲁维酵母或脆壁克鲁维酵母。在一些实施方案中,酵母选自酿酒酵母、裂殖酵母、白色念珠菌、巴斯德毕赤酵母、树干毕赤酵母、解脂耶罗维亚酵母、多形汉森酵母、红发夫酵母、产朊假丝酵母 (Candida utilis)、Arxula adeninivorans、汉逊德巴利酵母、多型德巴利酵母、粟酒裂殖酵母和西方许旺酵母。在一个具体实施方案中,酵母是酿酒酵母。在另一个实施方案中,酵母是耐热酿酒酵母。根据本文中的教导,适当的宿主的选择被在本领域技术人员的范围内。
在一些实施方案中,宿主细胞是油脂性细胞。油脂性宿主细胞可以是油脂性酵母细胞。例如,油脂性酵母宿主细胞可来自布拉霉属、念珠菌属、隐球菌属、小克银霉属、油脂酵母属、被孢霉菌属、毛霉菌属、须霉属、腐霉菌属、圆红冬孢酵母属、红酵母属、毛孢子菌属或子囊菌酵母属。根据本发明,油脂性宿主细胞可以是油脂性微藻宿主细胞。例如,油脂性微藻宿主细胞可来自破囊壶菌属 (Thraustochytrium)或裂殖壶菌属(Schizochytrium)。随后可使用常规脂质转酯过程从油脂性生物产生的甘油三酯产生生物柴油。在一些具体实施方案中,油脂性宿主细胞可用于分泌合成的脂质。使用油脂性宿主细胞的实施方案是有利的,因为它们可从木质纤维素原料产生生物柴油,所述原料相对于油料种子底物更便宜,可更稠密地生长,显示更慢的生命周期二氧化碳发射,并且可栽种在边际土地(marginalland) 上。
在一些实施方案中,宿主细胞是耐热宿主细胞。通过允许外部产生的纤维素酶和产乙醇宿主细胞在相似的温度范围内最佳地发挥性能,耐热宿主细胞可特别地用于同步糖化和发酵过程。
耐热宿主细胞可包括例如东方伊萨酵母,Pichia mississippiensis, 墨西哥毕赤酵母、粉状毕赤酵母、仙人掌棒孢酵母、葡萄牙棒孢酵母、 Candida mexicana、多形汉森酵母和克鲁维酵母宿主细胞。在一些实施方案中,耐热细胞是酿酒酵母菌株或其它酵母菌株,所述酵母菌株经改造适合在高温下生长,例如通过在抑制细菌生长的高温下选择生长来进行。
在一些具体的实施方案中,宿主细胞是克鲁维酵母宿主细胞。例如,克鲁维酵母宿主细胞可以是乳酸克鲁维酵母、马克斯克鲁维酵母、K.blattae、K.phaffii、亚罗克鲁维酵母、K.aestuarii、K.dobzhanskii、 K.wickerhamii、K.thermotolerans或克鲁雄酵母宿主细胞。在一个实施方案中,宿主细胞是乳酸克鲁维酵母或马克斯克鲁维酵母宿主细胞。在另一个实施方案中,宿主细胞是马克斯克鲁维酵母宿主细胞。
在一些实施方案中,耐热宿主细胞可在高于约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃或约42℃的温度生长。在本发明的一些实施方案中,耐热宿主细胞可在高于30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃、或约43℃、或约44℃、或约45℃或约50℃的温度从纤维素产生乙醇。
在本发明的一些实施方案中,耐热宿主细胞可在约30℃至60℃、约30℃至55℃、约30℃至50℃、约40℃至60℃、约40℃至55℃或约40℃至50℃的温度生长。在本发明的一些实施方案中,耐热宿主细胞可在约30℃至60℃、约30℃至55℃、约30℃至50℃、约40℃至 60℃、约40℃至55℃或约40℃至50℃的温度从纤维素产生乙醇。
在一些实施方案中,宿主细胞具有代谢木糖的能力。关于木糖利用技术的开发的详细信息可见于下列出版物:Kuyper M等人FEMS Yeast Res.4:655-64(2004),Kuyper M等人FEMS Yeast Res. 5:399-409(2005)和Kuyper M等人FEMS Yeast Res.5:925-34 (2005)(将所述文献通过引用整体并入本文)。例如,木糖利用可通过异源表达例如来自缺氧真菌单鞭毛菌属E2的木糖异构酶基因XylA,过表达5个参与木酮糖至糖酵解中间产物的转化的酿酒酵母酶(木酮糖激酶、核酮糖5-磷酸异构酶、核酮糖5-磷酸表异构酶、转酮醇酶和转醛醇酶)和删除编码醛糖还原酶的GRE3基因以使木糖醇产量降至最低,来在酿酒酵母中实现。
在一些实施方案中,宿主细胞具有代谢阿拉伯糖的能力。例如,阿拉伯糖利用可通过异源表达例如阿拉伯糖异构酶、核酮糖激酶或磷酸核酮糖差向异构酶的一种或多种来实现。
宿主细胞可包含抗生素标记或可以不包含抗生素标记。
在某些实施方案中,宿主细胞是嗜热厌氧杆菌属 (Thermoanaerobacterium)、高温厌氧杆菌属(Thermoanaerobacter)、梭菌属(Clostridium)、土芽孢杆菌属(Geobacillus)、糖球菌属 (Saccharococcus)、类芽孢杆菌属(Paenibacillus)、芽孢杆菌属 (Bacillus)、热解纤维素果汁杆菌属(Caldicellulosiruptor)、Anaerocellum 或厌氧芽孢杆菌属(Anoxybacillus)的微生物。在某些实施方案中,宿主细胞是选自如下的细菌:热产硫磺热厌氧杆菌(Thermoanaerobacterium thermosulfurigenes)、嗜热厌氧杆菌(Thermoanaerobacterium aotearoense)、嗜热厌氧解多糖杆菌 (Thermoanaerobacteriumpolysaccharolyticum)、玉米热厌氧杆菌 (Thermoanaerobacterium zeae)、木聚糖热厌氧杆菌 (Thermoanaerobacterium xylanolyticum)、解糖热厌氧杆菌(Thermoanaerobacterium saccharolyticum)、布氏嗜热厌氧细菌 (Thermoanaerobiumbrockii)、热解糖热厌氧杆菌 (Thermoanaerobacterium thermosaccharolyticum)、热硫化氢高温厌氧杆菌(Thermoanaerobacter thermohydrosulfuricus)、产乙醇热厌氧杆菌(Thermoanaerobacter ethanolicus)和氏热厌氧杆菌 (Thermoanaerobacter brocki)、热纤梭菌(Clostridium thermocellum)、解纤维素梭菌、Clostridium phytofermentans、热葡糖苷酶地牙抱杆菌 (Clostridium straminosolvens)、热葡糖苷酶芽胞杆菌(Geobacillus thermoglucosidasius)、嗜热脂肪地芽孢杆菌(Geobacillusstearothermophilus)、Saccharococcus caldoxylosilyticus、喜温链球菌(Saccharoccus thermophilus)、坎皮纳斯类芽孢杆菌(Paenibacillus campinasensis)、Bacillus flavothermus、Anoxybacillus kamchatkensis、 Anoxybacillus gonensis、Caldicellulosiruptor acetigenus、 Caldicellulosiruptor saccharolyticus、热解纤维素果汁杆菌 (Caldicellulosiruptor kristjanssonii)、Caldicellulosiruptorowensensis、 Caldicellulosiruptor lactoaceticus和嗜热厌氧纤维降解菌(Anaerocellum thermophilum)。在某些实施方案中,宿主细胞是热纤梭菌、解纤维素梭菌或解糖热厌氧杆菌。
密码最优化的多核苷酸
编码异源纤维素酶的多核苷酸可以是密码子优化的。本文使用的术语“密码子优化的编码区”意思是:通过将至少一个或一个以上或很多个密码子替换为生物体的基因中更经常使用的一个或多个密码子,而使核酸编码区适应在该给定生物的细胞中的表达。
一般而言,生物中高度表达的基因偏向于被该生物中最丰富的 tRNA种类所识别的密码子。这种偏向的一种度量是“密码子适应指数”或称“CAI”,其测定在何种程度上,用于编码特定基因中的每个氨基酸的密码子是在来自该生物的高度表达的基因的参照组中最经常存在的启动子。
本发明的密码子优化的序列的CAI对应于大约0.8至1.0,大约 0.8至0.9,或大约1.0。密码子优化的序列可以进一步被修饰以在特定生物中表达,这取决于该生物的生物学限制性。例如,可以从序列中除掉大量的"A"或"T"的串(例如超过4、4、5、6、7、8、9或10 个连续碱基的串),如果已知这些序列对转录产生不利影响。此外,可以为了分子克隆的目的除去特定的限制性酶位点。此类限制性酶位点的实例包括PacI、AscI、BamHI、BglII、EcoRI和XhoI。另外,可以检查DNA序列中的长度为10个碱基或更长的正向重复序列、反向重复序列和镜像重复序列,可以通过将密码子替换为“第二最佳”密码子,即在特定生物(针对该生物进行序列的优化)中发生的频率第二高的密码子,从而对它们进行人工修饰。
包含编码任意多肽链的氨基酸的密码子的核苷酸序列中的变异允许编码基因的序列的差异。由于每个密码子由3个核苷酸组成,并且构成DNA的核苷酸限定在4种特定的碱基,所以有64种可能的核苷酸组合,其中61种编码氨基酸(其余3种密码子编码终止翻译的信号)。本文表1中提供了“遗传密码”,其显示了哪种密码子编码哪种氨基酸。结果是,很多氨基酸被不止一种密码子代表。例如,氨基酸丙氨酸和脯氨酸被4种三元组所编码,丝氨酸和精氨酸被6种三元组编码,而色氨酸和甲硫氨酸仅由1种三元组编码。这种简并性允许DNA碱基组成在很大范围内变化,但不改变DNA所编码的蛋白质的氨基酸序列。
表1:标准遗传密码
很多生物显示出对编码插入到生长中的肽链中的特定氨基酸的特定密码子的使用偏向。不同生物之间的密码子优选性或密码子偏向、密码子使用的差异受到遗传密码的简并性的影响,并且在很多生物中有完善的研究。密码子偏向通常与信使RNA(mRNA)的翻译效率相关,信使RNA的翻译效率又被认为尤其依赖于被翻译的密码子的特性以及特定的转运RNA(tRNA)分子的可利用性。细胞中所选的tRNA 的主导性一般是肽合成中最常使用的密码子的反映。因此,可以基于密码子优化调整基因以便在给定生物中进行优化的基因表达。
鉴于对于多种动物、植物和微生物物种而言大量的基因序列是可以获得的,所以可以计算出密码子使用的相对频率。密码子使用表是可以容易地获得的,例如 http://phenotype.biosci.umbc.edu/codon/sgd/index.php(2008年5月7 日访问)或http://www.kazusa.or.jp/codon/(2011年2月28日访问), 并且这些表格可以按多种方式进行改编。参见Nakamura,Y等人 "Codon usage tabulated from the international DNAsequence databases:status for the year 2000"Nucl.Acids Res.28:292(2000)。下文表2提供了酵母的密码子使用表格,其是从GenBank Release 128.0[2002年2月15日]计算而来的。该表格使用的是mRNA命名法,所以表格使用的是存在于RNA中的尿嘧啶(U)而非存在于DNA 中的胸腺嘧啶(T)。该表格进行了改编所以频率的计算是针对每种氨基酸,而非针对所有64种密码子。
表2:酿酒酵母基因的密码子选择
通过使用该表格或类似表格,本领域普通技术人员可以将频率应用于任何给定的多肽序列,并产生密码子优化的编码区的核酸片段,其编码多肽,但是其使用针对给定物种的优化的密码子。可以通过多种不同的方法设计密码子优化的编码区。
在一种方法中,密码子使用表用于发现用于任何给定氨基酸的单一的使用频率最高的密码子,并且在该特定氨基酸出现在多肽序列中时,每次都使用该密码子。例如,参见上文表2,对于亮氨酸而言,频率最高的密码子是UUG,其使用频率是27.2%。因此,给定氨基酸序列中所有的亮氨酸残基都被分配UUG密码子。
在另一种方法中,密码子的实际频率在编码序列中随机分布。因此,使用该方法进行优化时,如果假定的多肽序列具有100个亮氨酸残基,则,参照表2中酿酒酵母中的使用频率,大约5个或5%的亮氨酸密码子将是CUC,大约11个或11%的亮氨酸密码子将是CUG,大约12个或12%的亮氨酸密码子将是CUU,大约13个或13%的亮氨酸密码子将是CUA,大约26个或26%的亮氨酸密码子将是UUA,大约27个或27%的亮氨酸密码子将是UUG。
这些频率将随机遍布于编码假定的多肽的编码区中的亮氨酸密码子中。如本领域普通技术人员将理解:使用该方法时序列中密码子的分布可以有很大变化。但是,序列总是编码相同的多肽。
当使用上述方法时,术语“大约”用于精确说明给定氨基酸的密码子频率的百分数。本文使用的“大约”定义为比给定数值多1个氨基酸或少1个氨基酸。如果使用频率分数大于或等于0.50,则将氨基酸的整数数值“五入”;如果使用频率分数小于或等于0.49,则将其“四舍”。再次以人基因中亮氨酸的使用频率为例,假设一个多肽具有62个亮氨酸残基,则密码子使用的频率分数这样计算:62乘以每种密码子的频率。因此,62的7.28%等于4.51个UUA密码子,或"大约5”即4、 5或6个UUA密码子;62的12.66%等于7.85个UUG密码子或"大约8"即7、8或9个UUG密码子;62的12.87%等于7.98个CUU 密码子或"大约8”即7、8或9个CUU密码子;62的19.56%等于12.13 个CUC密码子或"大约12”即11、12或13个CUC密码子;62的7.00%等于4.34个CUA密码子或"大约4”即3、4或5个CUA密码子;62的40.62%等于25.19个CUG密码子或"大约25”即24、25 或26个CUG密码子。
可以通过计算每种氨基酸的密码子频率,然后为多肽序列随机分配密码子,人工地以优化的频率随机分配密码子以编码给定的多肽序列。另外,本领域普通技术人员可以容易地获得多种算法和计算机软件程序。例如,Lasergene Package中的"EditSeq"函数,其可以从 DNAstar,Inc.,Madison,WI获得;VectorNTI Suite中的 backtranslation函数,其可以从InforMax,Inc.,Bethesda,MD获得;以及GCG--Wisconsin Package中的"backtranslate"函数,其可以从 Accelrys,Inc.,San Diego,CA获得。另外,公众可以获得多种资源以进行编码区序列的密码子优化,例如 www.entelechon.com/2008/10/backtranslation-tool/(2011年2月28日访问)的"backtranslation"函数和可以从emboss.bioinformatics.nl/cgi-bin/emboss/backtranseq(2011年2月28 日访问)获得的"backtranseq"函数。本领域普通技术人员还可以通过基本的数学函数轻易地实现构建初步算法以基于给定的频率分配密码子。
使用本领域普通技术人员熟知的标准的和常规的分子生物学操作,可以获得多种选择以合成通过上文描述的任意方法设计的密码子优化的编码区。在一种方法中,通过标准方法合成一系列互补的寡核苷酸对(oligonucleotide pair),每个长度是80-90个核苷酸并且跨越想要的序列的长度。合成这些寡核苷酸对,从而实现在退火之后,它们形成80-90个碱基对的双链片段,其包含粘末端,例如,将所述对中的每个寡核苷酸合成为延伸超出与对中的另一寡核苷酸互补的区域 3、4、5、6、7、8、9、10或更多个碱基。每对寡核苷酸的单链末端设计为与另一对寡核苷酸的单链末端退火。使寡核苷酸对退火,然后使大约5至6个这些双链片段通过粘性单链末端退火在一起,然后将它们连接在一起并克隆进入标准的细菌克隆载体,例如可以从 Invitrogen Corporation,Carlsbad,CA获得的载体。然后通过标准方法将构建体测序。几个这样的构建体(由5至6个80-90个碱基对片段的片段组成)连接在一起,即制备大约500个碱基对的片段,从而在一系列质粒构建体中代表完整的想要的序列。然后使用合适的限制性酶切割这些质粒的插入子,并连接在一起以形成最终的构建体。然后将最终的构建体克隆进入标准的细菌克隆载体并测序。另外的方法对于技术人员是完全显而易见的。此外,基因合成可以容易地从商业途径获得。
在另外的实施方式中,将全长的多肽序列针对给定物种进行密码子优化,产生编码整个多肽的密码子优化的编码区,然后,从原始的密码子优化的编码区制备密码子优化的编码区的核酸片段,其编码多肽的片段、变体和衍生物。本领域普通技术人员熟知的是,如果基于密码子在给定物种中的使用频率为全长编码区随机分配密码子,则编码片段、变体和衍生物的核酸片段将不一定是针对给定物种完全密码子优化的。但是,与天然密码子使用相比,此类序列与想要的物种的密码子使用之接近程度仍然要高得多。该方法的优点在于,合成编码给定多肽的每个片段、变体和衍生物的密码子优化的核酸片段虽然是常规操作,但是是耗时的,并且花费巨大。
转座子
为了选择已进入宿主的外来DNA,优选将DNA稳定地维持在目的生物中。关于质粒,存在两个这可籍以发生的方法。一个是通过复制型质粒的使用。这些质粒具有被宿主识别并且允许质粒作为稳定的自主染色体外元件(其在细胞分裂过程中被分离进入子细胞)复制的复制起始点。第二方法通过将质粒整合进入染色体来发生。这主要通过同源重组来发生,并且导致整个质粒或质粒的部分插入宿主染色体。因此,质粒和可选择标记作为一段完整的染色体的复制并且分离进入子细胞。因此,通过使用选择标记确认质粒DNA在转化事件中是否进入细胞需要复制型质粒的使用或将质粒重组至染色体中的能力。这些资格并不能总是得到满足,尤其当操作不具有一套遗传工具的生物时。
一个避免关于质粒相关标记的问题的方法是通过使用转座子。转座子可移动的DNA元件,其由被称为转座酶的酶促机器识别的镶嵌式DNA(mosaic DNA)序列界定。转座酶的功能是将转座子DNA随机插入宿主或靶DNA。可通过标准遗传工程将选择标记物克隆进入转座子。可在体外反应中将所得的DNA片段偶联至转座酶机器,随后可通过电穿孔将复合物引入靶细胞。标记物至染色体上的稳定插入仅需要转座酶机器的功能,从而减轻了对同源重组或复制型质粒的需要。
与转座子的整合相关的随机性质具有以诱变的形式发挥作用的额外有利方面。可建立包含转座子突变体的合并(amalgamation)的文库。这些文库可用于筛选或选择以产生具有期望的表型的突变体。例如,可筛选CBP生物的转座子文库的产生更多乙醇或更少乳酸和/或更多醋酸的能力。
天然纤维素分解策略
天然存在的纤维素分解微生物是用于通过天然策略进行CBP生物开发的起始点。厌氧菌和兼性厌氧菌是特别有益的。主要目的是工程化生物质至溶剂包括但不限于丙酮、异丙醇、乙酸乙酯或乙醇的代谢。与例如乙醇产生相关的混合酸发酵的代谢工程化在嗜温、非纤维素分解性肠细菌的情况下已获得成功。适当的基因转移技术的最近发展允许该类型的工作利用纤维素分解细菌来进行。
重组纤维素分解策略
具有期望的产物形成性质的非纤维素分解微生物是用于通过重组纤维素分解策略进行CBP生物开发的起始点。此开发的主要目的是工程化异源纤维素酶系统,使得能够在预处理的木质纤维素上生长和发酵。纤维素酶的异源产生主要利用以高产率产生乙醇的细菌宿主(大肠杆菌、奥克西托克雷白杆菌(Klebsiella oxytoca)和运动发酵单胞菌(Zymomonas mobilis))和酿酒酵母来进行。纤维素酶在奥克西托克雷白杆菌的菌株中的表达导致增加的水解产率–但在无添加的纤维素酶的情况不生长-对于微晶纤维素,和在无定形纤维素上的厌氧生长。虽然有十几种糖解酶已在酿酒酵母中功能性表达,但作为这样的表达的结果在纤维素上的厌氧生长从未被明确地证明。
本发明的方面涉及嗜热或嗜温微生物用作宿主来通过天然纤维素分解策略进行修饰的用途。它们在生物技术的加工应用中的潜能源自它们在相对高的温度以伴随的高代谢速率生长的能力、物理和化学上稳定的酶的产生以及升高的终产物产率。嗜热细菌的主要组包括真细菌和古细菌。嗜热真细菌包括:向光细菌(phototropic bacteria),例如蓝藻菌、紫细菌和绿细菌;革兰阳性细菌,例如芽孢杆菌属 (Bacillus)、梭菌属(Clostridium)、乳酸菌和放线菌属(Actinomyces);和其它真细菌属,例如硫杆菌属、螺旋体属、脱硫肠状菌属 (Desulfotomaculum)、革兰阴性需氧菌、革兰阴性厌氧菌和栖热袍菌属(Thermotoga)。产甲烷菌(Methanogens)、极端嗜热(本领域承认的术语)和热原体(Thermoplasma)被认为在古细菌内。在某些实施方案中,本发明涉及栖热菌属的革兰阴性器官营养嗜热菌、革兰阳性真细菌属,例如梭菌属(Clostridium),并且其还包括杆菌和球菌属,真细菌属的组中的属,例如热袍菌属(Thermosipho)和栖热孢菌属(Thermotoga),古细菌的组,例如热球菌属(Thermococcus)、热变形菌属(Thermoproteus)(杆状的)、热丝菌属(Thermofilum)(杆状的)、热网菌属(Pyrodictium)、酸菌属(Acidianus)、硫化叶菌属(Sulfolobus)、热棒菌属(Pyrobaculum)、焦球菌属(Pyrococcus)、热盘菌属 (Thermodiscus)、葡萄嗜热菌属(Staphylothermus)、脱硫球菌属 (Desulfurococcus)、古球菌属(Archaeoglobus)和甲烷火菌属 (Methanopyrus)。可适合于本发明的嗜热或嗜温菌(包括细菌、原核生物和真菌)的一些实例包括但不限于:热硫梭菌(Clostridium thermosulfurogenes)、解纤维素梭菌、热纤梭菌、热硫化氢梭菌 (Clostridium thermohydrosulfuricum)、乙酸菌热醋酸梭状芽胞杆菌 (Clostridium thermoaceticum)、热解糖梭菌(Clostridiumthermosaccharolyticum)、酒石酸梭菌(Clostridium tartarivorum)、 Clostridiumthermocellulaseum、Clostridium phytofermentans、热葡糖苷酶地牙抱杆菌、Thermoanaerobacterium thermosaccarolyticum、解糖热厌氧杆菌、乙酸乙基嗜热拟杆菌(Thermobacteroides acetoethylicus)、布氏嗜热厌氧细菌、产甲烷杆菌(Methanobacterium thermoautotrophicum)、Anaerocellum thermophilium、隐蔽热网菌(Pyrodictium occultum)、Thermoproteus neutrophilus、Thermofilum librum、Thermothrix thioparus、Desulfovibrio thermophilus、嗜酸热原体(Thermoplasmaacidophilum)、Hydrogenomonas thermophilus、野生型嗜热菌(Thermomicrobiumroseum)、黄色栖热菌(Thermus flavas)、红色栖热菌(Thermus ruber)、强烈火球菌(Pyrococcus furiosus)、水生栖热菌(Thermus aquaticus)、嗜热栖热菌(Thermusthermophilus)、嗜热光合绿曲菌(Chloroflexus aurantiacus)、海滨嗜热球菌(Thermococcus litoralis)、Pyrodictium abyssi、脂肪嗜热芽孢杆菌(Bacillusstearothermophilus)、温泉红藻(Cyanidium caldarium)、嗜热蓝藻层理鞭枝藻(Mastigocladus laminosus)、 Chlamydothrix calidissima、Chlamydothrixpenicillata、Thiothrix carnea、微细席藻(Phormidium tenuissimum)、Phormidiumgeysericola、Phormidium subterraneum、Phormidium bijahensi、 Oscillatoriafiliformis、铅色聚球藻(Synechococcus lividus)、嗜热光合绿曲菌、布氏热网菌(Pyrodictium brockii)、硫氧化硫杆菌 (Thiobacillus thiooxidans)、嗜酸热硫化叶菌(Sulfolobus acidocaldarius)、嗜热硫杆菌(Thiobacillus thermophilica)、脂肪嗜热芽孢杆菌、Cercosulcifer hamathensis、Vahlkampfia reichi、瓜形膜袋虫 (Cyclidiumcitrullus)、奔马指霉(Dactylaria gallopava)、灰蓝聚球藻(Synechococcus lividus)、细长聚球藻(Synechococcus elongatus)、 Synechococcus minervae、Synechocystisaquatilus、温泉隐球藻 (Aphanocapsa thermalis)、钻头颤藻(Oscillatoriaterebriformis)、两栖颤藻(Oscillatoria amphibia)、Oscillatoria germinata、Oscillatoria okenii、Phormidium laminosum、Phormidium parparasiens、墙生束藻(Symploca thermalis)、Bacillus acidocaldarias、凝结芽孢杆菌、 Bacillusthermocatenalatus、地衣芽胞杆菌、短小芽孢杆菌(Bacillus pamilas)、浸麻芽孢杆菌(Bacillus macerans)、环状芽胞杆菌(Bacillus circulans)、孢芽胞杆菌(Bacilluslaterosporus)、短芽孢杆菌(Bacillus brevis)、枯草芽孢杆菌、球形杆菌(Bacillussphaericus)、致黑脱硫肠状菌(Desulfotomaculum nigrificans)、嗜热链球菌、嗜热乳杆菌(Lactobacillus thermophilus)、保加利亚乳杆菌、嗜热双歧杆菌、 Streptomycesfragmentosporus、嗜热硝基链霉菌、Streptomyces thermovulgaris、嗜热假诺卡氏菌(Pseudonocardia thermophila)、普通嗜热放线菌(Thermoactinomyces vulgaris)、甘蔗高温放线菌 (Thermoactinomyces sacchari)、Thermoactinomyces candidas、弯曲高温单孢菌(Thermomonospora curvata)、绿色热单孢菌 (Thermomonospora viridis)、柠檬高温单孢菌(Thermomonospora citrina)、Microbispora thermodiastatica、Microbisporaaerata、 Microbispora bispora、二叉双歧放线菌(Actinobifida dichotomica)、产色双歧放线菌(Actinobifida chromogena)、青灰小多孢菌 (Micropolyspora caesia)、干草恩小多孢菌(Micropolyspora faeni)、 Micropolyspora cectivugida、Micropolysporacabrobrunea、热绿小多孢菌(Micropolyspora thermovirida)、绿黑小多孢菌(Micropolyspora viridinigra)、Methanobacterium thermoautothropicum、产乙酸热角军纤维素菌(Caldicellulosiruptor acetigenus)、Caldicellulosiruptorsaccharolyticus、热解纤维素果汁杆菌、Caldicellulosiruptor owensensis、Caldicellulosiruptor lactoaceticus、其变体和/或其后代。
在具体实施方案中,本发明涉及选自解纤维素梭菌、热纤梭菌和解糖热厌氧杆菌的嗜热细菌。
在某些实施方案中,本发明涉及选自Fervidobacterium gondwanense、Clostridium thermolacticum、Moorella sp.和 Rhodothermus marinus的嗜热细菌。
在某些实施方案中,本发明涉及热厌氧杆菌属 (Thermoanaerobacterium)或高温厌氧杆菌属(Thermoanaerobacter) 的嗜热细菌,包括但不限于选自:热产硫磺梭菌(Thermoanaerobacterium thermosulfurigenes)、嗜热厌氧杆菌、嗜热厌氧解多糖杆菌、玉米热厌氧杆菌、木聚糖热厌氧杆菌、解糖热厌氧杆菌、布氏嗜热厌氧细菌、热解糖热厌氧杆菌、热硫化氢高温厌氧杆菌、嗜热厌氧乙醇菌和氏热厌氧杆菌的种,其变体及其后代。
在某些实施方案中,本发明涉及土芽孢杆菌属(Geobacillus)、糖球菌属(Saccharococcus)、类芽孢杆菌属(Paenibacillus)、芽孢杆菌属(Bacillus)和厌氧芽孢杆菌属(Anoxybacillus)的微生物,包括但不限于选自:热葡糖苷酶芽胞杆菌、嗜热脂肪地芽孢杆菌、 Saccharococcus caldoxylosilyticus、喜温链球菌、坎皮纳斯类芽孢杆菌、Bacillus flavothermus,Anoxybacillus kamchatkensis,Anoxybacillus gonensis的种,其变体及其后代。
在某些实施方案中,本发明涉及选自如下的嗜温细菌:多糖降解菌;约氏黄杆菌(Flavobacterium johnsoniae);产琥珀酸丝状杆菌 (Fibrobacter succinogenes);亨氏梭菌(Clostridium hungatei); Clostridium phytofermentans;解纤维素梭菌;阿氏梭状杆菌 (Clostridium aldrichii);白蚁梭菌(Clostridium termitididis);解纤维醋弧菌(Acetivibrio cellulolyticus);产乙醇醋弧菌(Acetivibrio ethanolgignens);多食醋弧菌(Acetivibrio multivorans);溶纤维素拟杆菌(Bacteroides cellulosolvens);和Alkalibacter saccharofomentans, 其变体和其后代。
通过天然纤维素分解策略的生物开发
用于CBP的生物开发的一个方法始于天然利用纤维素、半纤维素和/或其它生物质组分的生物,随后对所述生物进行遗传工程化以增强成品收率和耐受性。例如,热纤梭菌是属于具有报导的最高纤维素利用率之列的嗜热细菌。其它目的生物是利用木糖的嗜热菌例如解糖热厌氧杆菌和热解糖热厌氧杆菌。有机酸的产生可负责通常与这些生物相关的低浓度的产生的乙醇。因此,一个目的是通过代谢工程消除这些生物的醋酸和乳酸的产生。许多努力已付诸于开发用于上述靶生物的基因转移系统,并且多个来自天然的热纤梭菌分离株已被表征。参见McLaughlin等人(2002)Environ.Sci.Technol.36:2122。嗜热糖解细菌的代谢工程化是吸引人的活跃领域,最近已报导解糖梭菌的乳酸脱氢酶的敲除。参见Desai等人(2004)Appl.Microbiol.Biotechnol. 65:600。在该生物中敲除乙酸激酶和磷酸乙酸转移酶也是可能的。
通过重组纤维素分解策略的生物开发
用于CBP的生物开发的替代方法包括通过表达异源纤维素酶系统和可能地其它特征来赋予微生物在木质纤维素材料上生长的能力,所述微生物天然地具有高成品产率和耐受性。例如,酿酒酵母已被工程化来表达超过二十几种不同的糖解酶。参见Lynd等人(2002)Microbiol.Mol.Biol.Rev.66:506。
然而在文献中,纤维质水解主要是在酶促定向的知识范畴的背景中进行,CBP加工策略需要根据微生物范畴来考虑纤维质水解。该微生物范畴天然地导致对不同基本问题、生物、纤维质系统的强调,并且相较于酶促范畴设立了里程碑。在本说明书中,热纤梭菌因其在纤维素上的高生长速率与其用于CBP的潜在效用而成为模型生物。
在某些实施方案中,用于本发明的生物可适用于称为同步糖化和发酵(SSF)的方法,所述方法意欲包括将所述微生物和/或一种或多种重组宿主(或其提取物,包括纯化的或未纯化的提取物)用于复合糖 (即,纤维质生物质)的同时降解或解聚和该糖残基通过发酵至乙醇的生物转化。
乙醇产生
根据本发明,重组微生物可用于从生物质产生乙醇,所述生物质在本文中称为木质纤维素材料、木质纤维素底物或纤维质生物质。产生乙醇的方法可以例如通过将生物质与本文中描述的和共同拥有的美国专利申请公布号2011/0189744A1、美国专利申请公布号2011/0312054A1、美国专利申请公布号2012/0003701、国际申请公布号PCT/US2009/065571、国际申请公布号PCT/US2009/069443、国际申请公布号PCT/US2009/064128、国际申请公布号 PCT/IB2009/005881和PCT/US2009/065571(将其每一个的内容通过引用并入本文)中描述的重组微生物接触来实现。
可按照本发明使用许多纤维质底物。用于纤维素活性测定的底物基于它们在水中的溶解性可分成两类:可溶性和不溶性的。可溶性底物包括纤维糊精或衍生物、羧甲基纤维素(CMC)或羟乙基纤维素 (HEC)。不溶性底物包括晶体纤维素、微晶纤维素(Avicel)、无定形纤维素,例如磷酸膨胀纤维素(PASC)、染色的或荧光纤维素以及预处理的木质纤维素生物质。这些底物通常是高度有序的纤维质材料,从而仅是略溶性的。
应理解,适当的木质纤维素材料可以是包含可溶性和/或不溶性纤维素的任何原料,其中不溶性纤维素可以以晶体或非晶体形式存在。在不同的实施方案中,木质纤维素生物质包括例如木材、玉米、玉米秸秆、锯屑、树皮、叶、农业和林业残渣、草例如柳枝稷、反刍动物消化产物、市政废弃物、造纸厂废水、报纸、纸板或其组合。
在一些实施方案中,本发明涉及用于通过将纤维质底物与本发明的重组微生物接触来水解纤维质底物例如上述纤维质底物的方法。在一些实施方案中,本发明涉及用于通过将纤维质底物与包含表达异源纤维素酶的酵母细胞的共培养物接触来水解纤维质底物,例如上述纤维质底物的方法。
在一些实施方案中,本发明涉及用于发酵纤维素的方法。此类方法可以例如通过在包含不溶性纤维素的培养基中培养宿主细胞或共培养物以允许进行纤维素的糖化和发酵来实现。
根据本发明,乙醇的产生可在至少约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃、约43℃、约44℃、约45℃、约46℃、约47℃、约48℃、约49℃或约50℃的温度进行。在本发明的一些实施方案中,耐热宿主细胞可在高于约30℃、约31℃、约32℃、约 33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约 40℃、约41℃、约42℃、或约43℃、或约44℃、或约45℃、或约50℃的温度从纤维素产生乙醇。在本发明的一些实施方案中,耐热宿主细胞可在约30℃至60℃、约30℃至55℃、约30℃至50℃、约40℃至 60℃、约40℃至55℃或约40℃至50℃的温度从纤维素产生乙醇。
在一些实施方案中,产生乙醇的方法可包括将纤维质底物与重组微生物或本发明的共培养物接触,以及另外地将纤维质底物与外部产生的纤维素酶接触。示例性外部产生的纤维素酶是商购可得的并且对于本领域技术人员来说是已知的。
在一些实施方案中,方法包括以特定的速率产生乙醇。例如,在一些实施方案中,乙醇以至少约0.1mg/小时/升、至少约0.25mg/小时 /升、至少约0.5mg/小时/升、至少约0.75mg/小时/升、至少约1.0mg/ 小时/升、至少约2.0mg/小时/升、至少约5.0mg/小时/升、至少约10mg/ 小时/升、至少约15mg/小时/升、至少约20.0mg/小时/升、至少约25 mg/小时/升、至少约30mg/小时/升、至少约50mg/小时/升、至少约 100mg/小时/升、至少约200mg/小时/升、至少约300mg/小时/升、至少约400mg/小时/升或至少约500mg/小时/升的速率产生。
在一些实施方案中,本发明的宿主细胞可以以超过在相同条件下生长的对照菌株(例如,野生型菌株)至少约0.1mg/小时/升、至少约0.25mg/小时/升、至少约0.5mg/小时/升、至少约0.75mg/小时/升、至少约1.0mg/小时/升、至少约2.0mg/小时/升、至少约5.0mg/小时/ 升、至少约10mg/小时/升、至少约15mg/小时/升、至少约20.0mg/ 小时/升、至少约25mg/小时/升、至少约30mg/小时/升、至少约50mg/ 小时/升、至少约100mg/小时/升、至少约200mg/小时/升、至少约300 mg/小时/升、至少约400mg/小时/升或至少约500mg/小时/升的速率产生乙醇。在一些实施方案中,可在任何外部添加的纤维素酶不存在的情况下产生乙醇。
可使用本领域已知的任何方法测量乙醇产量。例如,可使用HPLC 分析评估发酵样品中的乙醇的量。许多乙醇测定试剂盒可商购获得,所述试剂盒使用例如基于醇氧化酶的测定。根据本文中的教导,测定乙醇产量的方法在本领域技术人员的能力范围内。美国能源部(DOE) 提供了用于计算理论乙醇产率的方法。因此,如果已知C6糖(即,葡聚糖、半乳聚糖、甘露聚糖)的重量百分比,则可通过应用如下换算因子来测定每干吨总的C6聚合物以加仑表示的乙醇的理论产率:
(1.11磅的C6糖/磅的聚合物糖)x(0.51磅的乙醇/磅的糖)x(2000 磅的乙醇/吨的C6聚合物糖)x(1加仑的乙醇/6.55磅的乙醇)x (1/100%),其中将因子(1加仑的乙醇/6.55磅的乙醇)作为乙醇在20℃的比重。
并且如果已知C5糖(即,木聚糖、阿拉伯聚糖)的重量百分比,则可通过应用如下换算因子来测定每干吨总的C5聚合物以加仑表示的乙醇的理论产率:
(1.136磅的C5糖/磅的C5多聚体糖)x(0.51磅的乙醇/磅的糖)x (2000磅的乙醇/吨的C5聚合物糖)x(1加仑的乙醇/6.55磅的乙醇)x (1/100%),其中将因子(1加仑的乙醇/6.55磅的乙醇)作为乙醇在20℃的比重。
由此得出,通过将每干吨总的C6聚合物以加仑表示的乙醇的理论产率加上每干吨总的C5聚合物以加仑表示的乙醇的理论产率,给出了每干吨原料以加仑表示的乙醇的总理论产率。
通过应用该分析,DOE提供了每干吨原料以加仑表示的乙醇的理论产率的下列实例:玉米粒,124.4;玉米秸秆,113.0;稻草,109.9;轧棉废料,56.8;森林抚育间伐,81.5;硬木锯屑,100.8;蔗渣,111.5;和混合纸,116.2。重要地要指出,这些是理论产率。DOE警告取决于原料的性质和使用的方法,实际产率可在理论产率的60%至90%之间变化,并且还声明"然而,实现高产率可能花费很高,因此更低的产率加工通常可更具成本效益。"(同前)。
实施例
现一般性地描述本发明,通过参考下列实施例可更容易地理解本发明,所述实施例仅用于举例说明本发明的某些方面和实施方案的目的,并且无意限定本发明。
实施例1
通过交替电子受体的工程化改善乙醇产率
本实施例描述了通过工程化酵母细胞的交替电子受体来减少或消除甘油的途径。甘油是在酵母的厌氧生长过程中的糖代谢的不期望的副产品。在葡萄糖上厌氧生长过程中产生的甘油的量已由Medina,VG, 等人,Appl.Env.Microbiol.76:190-95(2010)经验地测定:
56mmol葡萄糖→1g生物质+88mmol乙醇+95mmol CO2+ 11mmol甘油+1.7mmol乙酸
假定甘油的产生主要为了再生NAD+以继续进行糖酵解,则用于甘油产生的半反应是(Medina,VG,等人,Appl.Env.Microbiol.76: 190-95(2010)):
0.5葡萄糖+NADH+H++ATP→甘油+NAD++ADP+Pi
下列途径描述了工程化上述半反应中的甘油的交替电子受体,工程化在葡萄糖上厌氧生长过程中乙醇产率的增加(通过使用改善的将葡萄糖转化成乙醇的酶活性和/或删除内源产生甘油或调节甘油的基因)。
1.1酵母的甲酸途径的工程化
从葡萄糖产生甲酸可提供与甘油相似的还原当量,如在下面半反应中显示的:
0.5葡萄糖+NADH+H++ADP+Pi→甲酸+NAD++ATP+ 乙醇
除了平衡细胞的氧化还原限制外,该途径还提供增加的ATP产率并且导致如下的总体厌氧生长公式:
56mmol葡萄糖→1g生物质+99mmol乙醇+95mmol CO2+ 11mmol甲酸+1.7mmol乙酸
作为至甘油的交替电子受体的甲酸途径中的工程化导致12.5%的乙醇理论产率的增加。可被靶向以工程化这样的增加的酶包括丙酮酸甲酸裂解酶(PFL)和甲酸脱氢酶(FDH)。参见图1。
1.1.1PFL的表达
通过PFL进行丙酮酸至乙酰-CoA和甲酸的转化。因此,为了在酵母中产生甲酸,可表达PFL。PFL在来自多种来源的细菌中是常见的。强劲产氢细菌(例如来自梭菌属、热厌氧杆菌属)或其它厌氧细菌可能导致增加的生产率。PFL的实例包括但不限于地衣芽胞杆菌、嗜热链球菌、胚芽乳杆菌、干酪乳杆菌、青春双岐杆菌、解纤维素梭菌、大肠杆菌、莱茵衣藻PflA、单鞭毛菌属E2或新丽鞭毛菌。参见下面的实施例4和表1。
1.1.2FDH的缺失
为了防止酵母将甲酸转化成CO2和NADH,可缺失或下调内源 FDH基因。缺失或下调fdh1、fdh2或这两个基因可增强本发明的重组微生物的氧化还原平衡和乙醇产率。
1.2改善乙酰-CoA至乙醇的转化
为了改善乙酰-CoA至乙醇的转化,可用改善的醛脱氢酶(例如,来自C.phytofermentans或其它来源)替代或补充内源酵母基因来将乙酰-CoA转化成乙醛,或用双功能乙醛/醇脱氢酶(AADH)将乙酰-CoA 转化成乙醛以及将乙醛转化成乙醇。通过一个或多个这样的酶的工程化,可增加乙酰-CoA至乙醇的转化的体内动力学,从而提供宿主菌株的改善的生长。双功能醇/醛脱氢酶可来自多种微生物来源,包括但不限于大肠杆菌、醋酪酸梭状芽孢杆菌(C.acetobutylicum)、T. saccharolyticum、热纤梭菌、C.phytofermentans、Piromyces SP E2或青春双岐杆菌。
1.3甘油途径的缺失或下调
缺失或改变甘油形成基因的表达将减少或阻断甘油的内源产生并且可增强乙酸摄取。gpd1、gpd2或这两个基因的缺失和/或gpp1、gpp2 或这两个基因的缺失可用于消除甘油形成和增加乙醇产率。然而,甘油的完全消除可能不适用于工业目的。参见Guo,ZP.,等人,Metab. Eng.13:49-59(2011)。因此,不是完全除去这些甘油形成基因的任一个、全部或一些,而是可改变或下调这些基因中的一个或多个来减少甘油形成和增加乙醇产率。
实施例2
缺失或下调甘油调节性基因FPS1以改善乙醇产率
不是通过缺失或改变甘油形成基因来下调甘油产生或除了通过缺失或改变甘油形成基因来下调甘油产生以外,可通过缺失或改变甘油调节基因来下调甘油产生。FPS1是负责甘油的流出的水甘油通道蛋白。fps1Δ菌株具有减少的甘油形成,但仍然具有完全功能性的NAD+- 依赖性甘油合成途径。除了删除FPS1以外,可表达来自其它生物的 FPS1或其同源物的组合成型活性突变体来改变甘油产生。因为这样的 FPS1缺失或改变菌株仍然可合成和保留甘油,相对于不能产生甘油的菌株可观察到改善的鲁棒性。
fps1Δ菌株的无效突变体因细胞内甘油积累而在缺氧条件下比野生型生长慢得多。Tamás,M.J.,等人,Molecular Microbiol.31(4): 1087-1104(1999)。然而,初步数据表明与青春双岐杆菌PFL结合的青春双岐杆菌双功能AADH在fps1Δ菌株中的表达可使得fps1Δ菌株能够厌氧生长(参见实施例7和图22和24)。此外,当在包含ADH和 PFL的甘油突变型菌株中单独地删除FPS1时,还观察到显著改善的渗透耐受性。增加的对渗透胁迫的抗性通过fps1Δ突变体在几种不同的高克分子渗透压重量浓度培养基(包含1M氯化钠、1M山梨醇和 1M木糖醇)中的改善的生长的观察来测定。通过标记物回收(从而导致FPS1编码序列的大区域的缺失(下文中的天然和缺失的序列))产生 fps1Δ突变体。
FPS1基因座的序列(编码序列加以下划线;SEQ ID NO:104):
aacgcggctgatgcttttatttaggaaggaatacttacattatcatgagaacattgtcaaggg cattctgatacgggccttccatcgcaagaaaaaggcagcaacggactgagggacggagagagtta cggcataagaagtagtaggagagcagagtgtcataaagttatattattctcgtcctaaagtcaatta gttctgttgcgcttgacaatatatgtcgtgtaataccgtcccttagcagaagaaagaaagacggatc catatatgttaaaatgcttcagagatgtttctttaatgtgccgtccaacaaaggtatcttctgtagcttc ctctattttcgatcagatctcatagtgagaaggcgcaattcagtagttaaaagcggggaacagtgtg aatccggagacggcaagattgcccggccctttttgcggaaaagataaaacaagatatattgcactt tttccaccaagaaaaacaggaagtggattaaaaaatcaacaaagtataacgcctattgtcccaata agcgtcggttgttcttctttattattttaccaagtacgctcgagggtacattctaatgcattaaaagac atgagtaatcctcaaaaagctctaaacgactttctgtccagtgaatctgttcatacacatgatagtt ctaggaaacaatctaataagcagtcatccgacgaaggacgctcttcatcacaaccttcacatcatcactctggtgg tactaacaacaataataacaataataataataataataacagtaacaacaacaacaacggcaacgatgggggaaat gatgacgactatgattatgaaatgcaagattatagaccttctccgcaaagtgcgcggcctactcccacgtatgttc cacaatattctgtagaaagtgggactgctttcccgattcaagaggttattcctagcgcatacattaacacacaaga tataaaccataaagataacggtccgccgagtgcaagcagtaatagagcattcaggcctagagggcagaccacagtg tcggccaacgtgcttaacattgaagatttttacaaaaatgcagacgatgcgcataccatcccggagtcacatttat cgagaaggagaagtaggtcgagggctacgagtaatgctgggcacagtgccaatacaggcgccacgaatggcaggac tactggtgcccaaactaatatggaaagcaatgaatcaccacgtaacgtccccattatggtgaagccaaagacatta taccagaaccctcaaacacctacagtcttgccctccacataccatccaattaataaatggtcttccgtcaaaaaca cttatttgaaggaatttttagccgagtttatgggaacaatggttatgattattttcggtagtgctgttgtttgtca ggtcaatgttgctgggaaaatacagcaggacaatttcaacgtggctttggataaccttaacgttaccgggtcttct gcagaaacgatagacgctatgaagagtttaacatccttggtttcatccgttgcgggcggtacctttgatgatgtgg cattgggctgggctgctgccgtggtgatgggctatttctgcgctggtggtagtgccatctcaggtgctcatttgaa tccgtctattacattagccaatttggtgtatagaggttttcccctgaagaaagttccttattactttgctggacaa ttgatcggtgccttcacaggcgctttgatcttgtttatttggtacaaaagggtgttacaagaggcatatagcgatt ggtggatgaatgaaagtgttgcgggaatgttttgcgtttttccaaagccttatctaagttcaggacggcaattttt ttccgaatttttatgtggagctatgttacaagcaggaacatttgcgctgaccgatccttatacgtgtttgtcctct gatgttttcccattgatgatgtttattttgattttcattatcaatgcttccatggcttatcagacaggtacagcaa tgaatttggctcgtgatctgggcccacgtcttgcactatatgcagttggatttgatcataaaatgctttgggtgca tcatcatcatttcttttgggttcccatggtaggcccatttattggtgcgttaatgggggggttggtttacgatgtc tgtatttatcagggtcatgaatctccagtcaactggtctttaccagtttataaggaaatgattatgagagcctggt ttagaaggcctggttggaagaagagaaatagagcaagaagaacatcggacctgagtgacttctcatacaataacga tgatgatgaggaatttggagaaagaatggctcttcaaaagacaaagaccaagtcatctatttcagacaacgaaaat gaagcaggagaaaagaaagtgcaatttaaatctgttcagcgcggcaaaagaacgtttggtggtataccaacaattc ttgaagaagaagattccattgaaactgcttcgctaggtgcgacgacgactgattctattgggttatccgacacatc atcagaagattcgcattatggtaatgctaagaaggtaacatgagaaaacagac aagaaaaagaaacaaataatatagactgatagaaaaaaatactgcttactaccgccggtataata tatatatatatatatatttacatagatgattgcatagtgttttaaaaagctttcctaggttaagctatga atcttcataacctaaccaactaaatatgaaaatactgacccatcgtcttaagtaagttgacatgaact cagcctggtcacctactatacatgatgtatcgcatggatggaaagaataccaaacgctaccttccag gttaatgatagtatccaaacctagttggaatttgccttgaacatcaagcagcgattcgatatcagttg ggagcatcaatttggtcattggaataccatctatgcttttctcctcccatattcgcaaaagtagtaagg gctcgttatatacttttgaatatgtaagatataattctatatgatttagtaatttattttctatacgctca gtatttttctgcagttgtcgagtaggtattaaacgcaaaagaagtccatccttttcatcattcaaatggacatcttggcaaagggcccagttatggaaaatctgggagtcatacaacgattgcagttggctatgc cactcctggtaaggaatcatcaagtctgataattctgttttttagccctttttttttttttttcatg
fps1Δ突变的序列(fps1编码序列的部分未被删除(加以下划线的),并且被删除的区域以Δ表示;SEQ ID NO:105):
aacgcggctgatgcttttatttaggaaggaatacttacattatcatgagaacattgtcaaggg cattctgatacgggccttccatcgcaagaaaaaggcagcaacggactgagggacggagagagtta cggcataagaagtagtaggagagcagagtgtcataaagttatattattctcgtcctaaagtcaatta gttctgttgcgcttgacaatatatgtcgtgtaataccgtcccttagcagaagaaagaaagacggatc catatatgttaaaatgcttcagagatgtttctttaatgtgccgtccaacaaaggtatcttctgtagcttc ctctattttcgatcagatctcatagtgagaaggcgcaattcagtagttaaaagcggggaacagtgtg aatccggagacggcaagattgcccggccctttttgcggaaaagataaaacaagatatattgcactt tttccaccaagaaaaacaggaagtggattaaaaaatcaacaaagtataacgcctattgtcccaata agcgtcggttgttcttctttattattttaccaagtacgctcgagggtacattctaatgcattaaaagac Δgattcgcattatggtaatgctaagaaggtaacatgagaaaacagacaagaaaaagaaacaaat aatatagactgatagaaaaaaatactgcttactaccgccggtataatatatatatatatatatattta catagatgattgcatagtgttttaaaaagctttcctaggttaagctatgaatcttcataacctaaccaa ctaaatatgaaaatactgacccatcgtcttaagtaagttgacatgaactcagcctggtcacctactat acatgatgtatcgcatggatggaaagaataccaaacgctaccttccaggttaatgatagtatccaa acctagttggaatttgccttgaacatcaagcagcgattcgatatcagttgggagcatcaatttggtca ttggaataccatctatgcttttctcctcccatattcgcaaaagtagtaagggctcgttatatacttttga atatgtaagatataattctatatgatttagtaatttattttctatacgctcagtatttttctgcagttgtcg agtaggtattaaacgcaaaagaagtccatccttttcatcattcaaatggacatcttggcaaagggcc cagttatggaaaatctgggagtcatacaacgattgcagttggctatgccactcctggtaaggaatca tcaagtctgataattctgttttttagccctttttttttttttttcatg
实施例3
产生具有缺失的或下调的甘油产生途径的酵母菌株
为了产生具有改变的甘油产生的酵母菌株,可通过产生下列遗传背景来删除或下调内源甘油产生或调节基因:
通过删除下列基因的一个或多个来产生甘油消除背景的菌株: gpd1、gpd2、fdh1、fdh2和/或fps1。已通过删除下列基因的一个或多个:gpd1、gpd2、fdh1、fdh2和/或fps1,和通过在gpd2启动子的控制下表达GPD1(命名为gpd2Δ::GPD1)来产生了甘油减少背景的菌株。这些其中从gpd2启动子表达GPD1的菌株产生了相对于野生型菌株更少量的甘油。
3.1甘油消除菌株gpd1Δgpd2Δfdh1Δfdh2Δ的产生
为了产生甘油消除菌株gpd1Δgpd2Δfdh1Δfdh2Δ,使用下列方法。通过对插入遗传元件使用正向选择和通过对除去遗传元件使用负选择来产生所有遗传修饰。参见图4-11。通过PCR扩增遗传元件,随后将其转化进入宿主菌株,随后选择和筛选期望的修饰。来自酿酒酵母的天然gpd1、gpd2、fdh1、fdh2和缺失后所得的基因座的序列列于下文中。
GPD1基因座的序列(编码序列加以下划线;SEQ ID NO:89):
tacaaacgcaacacgaaagaacaaaaaaagaagaaaacagaaggccaagacagggtca atgagactgttgtcctcctactgtccctatgtctctggccgatcacgcgccattgtccctcagaaaca aatcaaacacccacaccccgggcacccaaagtccccacccacaccaccaatacgtaaacggggc gccccctgcaggccctcctgcgcgcggcctcccgccttgcttctctccccttccttttctttttccagttt tccctattttgtccctttttccgcacaacaagtatcagaatgggttcatcaaatctatccaacctaattc gcacgtagactggcttggtattggcagtttcgtagttatatatatactaccatgagtgaaactgttac gttaccttaaattctttctccctttaattttcttttatcttactctcctacataagacatcaagaaacaatt gtatattgtacaccccccccctccacaaacacaaatattgataatataaagatgtctgctgctgctgatagattaaacttaacttccggccacttgaatgctggtagaaagagaagttcctc ttctgtttctttgaaggctgccgaaaagcctttcaaggttactgtgattggatctggtaactggggtactactatt gccaaggtggttgccgaaaattgtaagggatacccagaagttttcgctccaatagtacaaatgtgggtgttcgaag aagagatcaatggtgaaaaattgactgaaatcataaatactagacatcaaaacgtgaaatacttgcctggcatcac tctacccgacaatttggttgctaatccagacttgattgattcagtcaaggatgtcgacatcatcgttttcaacatt ccacatcaatttttgccccgtatctgtagccaattgaaaggtcatgttgattcacacgtcagagctatctcctgtc taaagggttttgaagttggtgctaaaggtgtccaattgctatcctcttacatcactgaggaactaggtattcaatg tggtgctctatctggtgctaacattgccaccgaagtcgctcaagaacactggtctgaaacaacagttgcttaccac attccaaaggatttcagaggcgagggcaaggacgtcgaccataaggttctaaaggccttgttccacagaccttact tccacgttagtgtcatcgaagatgttgctggtatctccatctgtggtgctttgaagaacgttgttgccttaggttg tggtttcgtcgaaggtctaggctggggtaacaacgcttctgctgccatccaaagagtcggtttgggtgagatcatc agattcggtcaaatgtttttcccagaatctagagaagaaacatactaccaagagtctgctggtgttgctgatttga tcaccacctgcgctggtggtagaaacgtcaaggttgctaggctaatggctacttctggtaaggacgcctgggaatg tgaaaaggagttgttgaatggccaatccgctcaaggtttaattacctgcaaagaagttcacgaatggttggaaaca tgtggctctgtcgaagacttcccattatttgaagccgtataccaaatcgtttacaacaactacccaatgaagaacc tgccggacatgattgaagaattagatctacatgaagattagatttattggagaaagataacatatcatactttcccccacttttttcgaggctcttc tatatcatattcataaattagcattatgtcatttctcataactactttatcacgttagaaattacttatta ttattaaattaatacaaaatttagtaaccaaataaatataaataaatatgtatatttaaattttaaaaa aaaaatcctatagagcaaaaggattttccattataatattagctgtacacctcttccgcattttttgag ggtggttacaacaccactcattcagaggctgtcggcacagttgcttctagcatctggcgtccgtatgt atgggtgtattttaaataataaacaaagtgccacaccttcaccaattatgtctttaagaaatggaca agttccaaagagcttgcccaaggctcgacaaggatgtactttggaatatctatattcaagtacgtgg cgcgcatatgtttgagtgtgcacacaataaaggtt
gpd1Δ突变的序列(gpd1编码序列的部分未被删除(加以下划线的) 和被删除的区域的序列用Δ表示;SEQ ID NO:90):
tacaaacgcaacacgaaagaacaaaaaaagaagaaaacagaaggccaagacagggtca atgagactgttgtcctcctactgtccctatgtctctggccgatcacgcgccattgtccctcagaaaca aatcaaacacccacaccccgggcacccaaagtccccacccacaccaccaatacgtaaacggggc gccccctgcaggccctcctgcgcgcggcctcccgccttgcttctctccccttccttttctttttccagttt tccctattttgtccctttttccgcacaacaagtatcagaatgggttcatcaaatctatccaacctaattc gcacgtagactggcttggtattggcagtttcgtagttatatatatactaccatgagtgaaactgttac gttaccttaaattctttctccctttaattttcttttatcttactctcctacataagacatcaagaaacaatt gtatattgtacaccccccccctccacaaacacaaatattgataatataaagatgtctgctgctgctgatagΔtctacatgaagattagatttattggagaaagataacatatcatactttcccccacttttttcgag gctcttctatatcatattcataaattagcattatgtcatttctcataactactttatcacgttagaaatta cttattattattaaattaatacaaaatttagtaaccaaataaatataaataaatatgtatatttaaattt taaaaaaaaaatcctatagagcaaaaggattttccattataatattagctgtacacctcttccgcattttttgagggtggttacaacaccactcattcagaggctgtcggcacagttgcttctagcatctggcgtc cgtatgtatgggtgtattttaaataataaacaaagtgccacaccttcaccaattatgtctttaagaaa tggacaagttccaaagagcttgcccaaggctcgacaaggatgtactttggaatatctatattcaagt acgtggcgcgcatatgtttgagtgtgcacacaataaaggtt
GPD2基因座的序列(编码序列加以下划线;SEQ ID NO:91):
atagccatcatgcaagcgtgtatcttctaagattcagtcatcatcattaccgagtttgttttcctt cacatgatgaagaaggtttgagtatgctcgaaacaataagacgacgatggctctgccattgttatat tacgcttttgcggcgaggtgccgatgggttgctgaggggaagagtgtttagcttacggacctattgc cattgttattccgattaatctattgttcagcagctcttctctaccctgtcattctagtatttttttttttttttt ttggttttacttttttttcttcttgcctttttttcttgttactttttttctagttttttttccttccactaagctttt tccttgatttatccttgggttcttctttctactcctttagattttttttttatatattaatttttaagtttatgt attttggtagattcaattctctttccctttccttttccttcgctccccttccttatcaatgcttgctgtcagaagattaacaagatacac attccttaagcgaacgcatccggtgttatatactcgtcgtgcatataaaattttgccttcaagatctactttccta agaagatcattattacaaacacaactgcactcaaagatgactgctcatactaatatcaaacagcacaaacactgtc atgaggaccatcctatcagaagatcggactctgccgtgtcaattgtacatttgaaacgtgcgcccttcaaggttac agtgattggttctggtaactgggggaccaccatcgccaaagtcattgcggaaaacacagaattgcattcccatatc ttcgagccagaggtgagaatgtgggtttttgatgaaaagatcggcgacgaaaatctgacggatatcataaatacaa gacaccagaacgttaaatatctacccaatattgacctgccccataatctagtggccgatcctgatcttttacactc catcaagggtgctgacatccttgttttcaacatccctcatcaatttttaccaaacatagtcaaacaattgcaaggc cacgtggcccctcatgtaagggccatctcgtgtctaaaagggttcgagttgggctccaagggtgtgcaattgctat cctcctatgttactgatgagttaggaatccaatgtggcgcactatctggtgcaaacttggcaccggaagtggccaa ggagcattggtccgaaaccaccgtggcttaccaactaccaaaggattatcaaggtgatggcaaggatgtagatcat aagattttgaaattgctgttccacagaccttacttccacgtcaatgtcatcgatgatgttgctggtatatccattg ccggtgccttgaagaacgtcgtggcacttgcatgtggtttcgtagaaggtatgggatggggtaacaatgcctccgc agccattcaaaggctgggtttaggtgaaattatcaagttcggtagaatgtttttcccagaatccaaagtcgagacc tactatcaagaatccgctggtgttgcagatctgatcaccacctgctcaggcggtagaaacgtcaaggttgccacat acatggccaagaccggtaagtcagccttggaagcagaaaaggaattgcttaacggtcaatccgcccaagggataat cacatgcagagaagttcacgagtggctacaaacatgtgagttgacccaagaattcccattattcgaggcagtctac cagatagtctacaacaacgtccgcatggaagacctaccggagatgattgaagagctagacatcgatgacgaatagacactctccccccccctccccctctgatct ttcctgttgcctctttttcccccaaccaatttatcattatacacaagttctacaactactactagtaaca ttactacagttattataattttctattctctttttctttaagaatctatcattaacgttaatttctatatata cataactaccattatacacgctattatcgtttacatatcacatcaccgttaatgaaagatacgacacc ctgtacactaacacaattaaataatcgccataaccttttctgttatctatagcccttaaagctgtttctt cgagctttttcactgcagtaattctccacatgggcccagccactgagataagagcgctatgttagtca ctactgacggctctccagtcatttatgtgattttttagtgactcatgtcgcatttggcccgtttttttccgctgtcgcaacctatttccattaacggtgccgtatggaagagtcatttaaaggcaggagagagagatt actcatcttcattggatcagattgatgactgcgtacggcagat
gpd2Δ突变的序列(删除完整编码区,其以Δ表示;SEQ ID NO: 92):
atagccatcatgcaagcgtgtatcttctaagattcagtcatcatcattaccgagtttgttttcctt cacatgatgaagaaggtttgagtatgctcgaaacaataagacgacgatggctctgccattgttatat tacgcttttgcggcgaggtgccgatgggttgctgaggggaagagtgtttagcttacggacctattgc cattgttattccgattaatctattgttcagcagctcttctctaccctgtcattctagtatttttttttttttttt ttggttttacttttttttcttcttgcctttttttcttgttactttttttctagttttttttccttccactaagctttt tccttgatttatccttgggttcttctttctactcctttagattttttttttatatattaatttttaagtttatgt attttggtagattcaattctctttccctttccttttccttcgctccccttccttatcΔctctgatctttcctgt tgcctctttttcccccaaccaatttatcattatacacaagttctacaactactactagtaacattactac agttattataattttctattctctttttctttaagaatctatcattaacgttaatttctatatatacataact accattatacacgctattatcgtttacatatcacatcaccgttaatgaaagatacgacaccctgtaca ctaacacaattaaataatcgccataaccttttctgttatctatagcccttaaagctgtttcttcgagctt tttcactgcagtaattctccacatgggcccagccactgagataagagcgctatgttagtcactactga cggctctccagtcatttatgtgattttttagtgactcatgtcgcatttggcccgtttttttccgctgtcgc aacctatttccattaacggtgccgtatggaagagtcatttaaaggcaggagagagagattactcatc ttcattggatcagattgatgactgcgtacggcagat
FDH1基因座的序列(编码序列加以下划线;SEQ ID NO:93):
tatttttctatagatatttacactccgcaagtgcaaaaaaaaagcattatcgctaacgatcaa gaggaactgagaccttattagttgtctttgttggcgtaacataaatttcttaggaaaagagaaaatta tctcgaaggcaaaaataaaccaagcctcgagtttaatggttttctaaaaaacactttaaaaacagat cgccataaaaggagaagctccgtaggagaccgttttcgaaacctatgtagaaataaagggaaagc tccaacggtttggataaatctttagaagcatagagtttatacaacattcagtacgaaatgtactctcg aaacgttctcttttcacggtgcttagtagcagaaaaaagtgtcggaaattacctattttgtcaccactc gaggataggcttgaaagagagttttaaccccaacttttctattttgcacttgtttggctatggtttaaa acattctgtttggaccaacagcccaagcggcttatcccttttctttttttcccttataatcgggaatttcc ttactaggaaggcaccgatactagaactccgaatgaaaaagacatgccagtaataaaactattttg atgttatgcggaatatactattcttggattattcactgttaactaaaagttggagaaatcactctgcac tgtcaatcattgaaaaaaagaacatataaaagggcacaaaattgagtcttttttaatgagttcttgctgaggaaagtttagttaatatatcatttacgtaaaatatgcatattcttgtattgtgctttttttattcattt taagcaggaacaatttacaagtattgcaacgctaatcaaatcaaaataacagctgaaaattaatatgtcgaagggaaag gttttgctggttctttacgaaggtggtaagcatgctgaagagcaggaaaagttattggggtgtattgaaaatgaac ttggtatcagaaatttcattgaagaacagggatacgagttggttactaccattgacaaggaccctgagccaacctc aacggtagacagggagttgaaagacgctgaaattgtcattactacgccctttttccccgcctacatctcgagaaac aggattgcagaagctcctaacctgaagctctgtgtaaccgctggcgtcggttcagaccatgtcgatttagaagctg caaatgaacggaaaatcacggtcaccgaagttactggttctaacgtcgtttctgtcgcagagcacgttatggccac aattttggttttgataagaaactataatggtggtcatcaacaagcaattaatggtgagtgggatattgccggcgtg gctaaaaatgagtatgatctggaagacaaaataatttcaacggtaggtgccggtagaattggatatagggttctgg aaagattggtcgcatttaatccgaagaagttactgtactacgactaccaggaactacctgcggaagcaatcaatag attgaacgaggccagcaagcttttcaatggcagaggtgatattgttcagagagtagagaaattggaggatatggtt gctcagtcagatgttgttaccatcaactgtccattgcacaaggactcaaggggtttattcaataaaaagcttattt cccacatgaaagatggtgcatacttggtgaataccgctagaggtgctatttgtgtcgcagaagatgttgccgaggc agtcaagtctggtaaattggctggctatggtggtgatgtctgggataagcaaccagcaccaaaagaccatccctgg aggactatggacaataaggaccacgtgggaaacgcaatgactgttcatatcagtggcacatctctggatgctcaaa agaggtacgctcagggagtaaagaacatcctaaatagttacttttccaaaaagtttgattaccgtccacaggatat tattgtgcagaatggttcttatgccaccagagcttatggacagaagaaataagag tgattatgagtatttgtgagcagaagttttccggtctccttttgttcttgttttggcgtattctccactatt cgtccatagcacatttataccttagctaaatattttgtaaagcaaaattttcgttatctcttaaaaaat agaagagcggtttattaatatcaaataattgaaactgctgatatggtagctatatacaaaatctgct gtcaaaatttggcagtaaacgatcttcacggtagcggttcaaataaagaggaaaagtctttctccct tactgtttttctggaatttggctcgtcgttaataacagaactaaagatacagtaaaaggagagatcg caatcaacttcattaattgtaacagtagcataatcacaactgatcatctacactataaacagtttttat ttctaattatgggcgcctggccggctcaaacattgtgcttttaagactccaaaagtatctgctgcaga aaagagccatataatgttaagtgttcagggataggttatcgcttactacttcaaacgtttcgaaggaaagccagggaagcctatatctgattccctgtttcataatccaatgcagccactagcttataattatttg aactatttgtcgaacatcacagtaataaaatccccagaaagttccacttgctgcatattggcacctgt tgattcactctccatcacttttttgttagccgcccagcctagaaagtctttaaatacatctgaaatttttt tttttttaacagtgcacccgtgcatcatacctcatgcaaggtacctttttttctcaaaggtattgtcttcc attgaagtggcactatggcatgatgaaccctgagcatttctgaattcaacagaaccaaattgtccag aaataaatctgtccgacatgaattatgaaactttttttcaattaagtgaagagaattttgcagcgtctt accattattttgacccattggtcgcatgtttgcgctttgacttcgagaaccatgttaaagcttacttgta cgacaaccaatgaagtatattacggcagtttttttggactgggtcaaaaaaagtgttgcataatcaa atcaggaacacattaaaatgttgtaaaatttgtcttagtatcacctgagtggttattcattacgtacta
fdh1Δ突变的序列(删除完整编码区,其以Δ表示;SEQ ID NO: 94):
tatttttctatagatatttacactccgcaagtgcaaaaaaaaagcattatcgctaacgatcaa gaggaactgagaccttattagttgtctttgttggcgtaacataaatttcttaggaaaagagaaaatta tctcgaaggcaaaaataaaccaagcctcgagtttaatggttttctaaaaaacactttaaaaacagat cgccataaaaggagaagctccgtaggagaccgttttcgaaacctatgtagaaataaagggaaagc tccaacggtttggataaatctttagaagcatagagtttatacaacattcagtacgaaatgtactctcg aaacgttctcttttcacggtgcttagtagcagaaaaaagtgtcggaaattacctattttgtcaccactc gaggataggcttgaaagagagttttaaccccaacttttctattttgcacttgtttggctatggtttaaa acattctgtttggaccaacagcccaagcggcttatcccttttctttttttcccttataatcgggaatttcc ttactaggaaggcaccgatactagaactccgaatgaaaaagacatgccagtaataaaactattttg atgttatgcggaatatactattcttggattattcactgttaactaaaagttggagaaatcactctgcac tgtcaΔtggcagtaaacgatcttcacggtagcggttcaaataaagaggaaaagtctttctcccttactgtttttctggaatttggctcgtcgttaataacagaactaaagatacagtaaaaggagagatcgcaa tcaacttcattaattgtaacagtagcataatcacaactgatcatctacactataaacagtttttatttct aattatgggcgcctggccggctcaaacattgtgcttttaagactccaaaagtatctgctgcagaaaa gagccatataatgttaagtgttcagggataggttatcgcttactacttcaaacgtttcgaaggaaag ccagggaagcctatatctgattccctgtttcataatccaatgcagccactagcttataattatttgaac tatttgtcgaacatcacagtaataaaatccccagaaagttccacttgctgcatattggcacctgttga ttcactctccatcacttttttgttagccgcccagcctagaaagtctttaaatacatctgaaatttttttttt tttaacagtgcacccgtgcatcatacctcatgcaaggtacctttttttctcaaaggtattgtcttccatt gaagtggcactatggcatgatgaaccctgagcatttctgaattcaacagaaccaaattgtccagaa ataaatctgtccgacatgaattatgaaactttttttcaattaagtgaagagaattttgcagcgtcttac cattattttgacccattggtcgcatgtttgcgctttgacttcgagaaccatgttaaagcttacttgtacg acaaccaatgaagtatattacggcagtttttttggactgggtcaaaaaaagtgttgcataatcaaat caggaacacattaaaatgttgtaaaatttgtcttagtatcacctgagtggttattcattacgtacta
FDH2基因座的序列(编码区加以下划线;SEQ ID NO:95):
tgtcgagacaatgtcattgcaagttatataaacattgtaatacatcacctcgatgaaagaga aactggaatgatagatctctttttctcaaaatttcgttaatatgtaataataaggttcctgatgtaattt gtttttgtacaaattattttagattctggaggttcaaataaaatatatattacagccaacgattagggg ggacaagacttgattacacatttttcgttggtaacttgactcttttatgaaaagaaaacattaagttga aggtgcacgcttgaggcgctcctttttcatggtgcttagcagcagatgaaagtgtcagaagttacct attttgtcaccatttgagaataagcttgaaagaaagttgtaaccccaacttttctatcttgcacttgttt ggaccaacagccaaacggcttatcccttttcttttcccttataatcgggaatttccttactaggaaggc accgatactataactccgaatgaaaaagacatgccagtaataaaaataattgatgttatgcggaat atactattcttggattattcactgttaactaaaagttggagaaatcactctgcactgtcaatcattgaa aaaaagaacatataaaagggcacaaaatcgagtcttttttaatgagttcttgctgaggaaaatttag ttaatatatcatttacataaaacatgcatattattgtgttgtactttctttattcattttaagcaggaata attacaagtattgcaacgctaatcaaatcgaaataacagctgaaaattaatatgtcgaagggaaaggt tttgctggttctttatgaaggtggtaagcatgctgaagagcaggaaaagttattggggtgtattgaaaatgaactt ggtatcagaaatttcattgaagaacagggatacgagttggttactaccattgacaaggaccctgagccaacctcaa cggtagacagggagttgaaagacgctgaaattgtcattactacgccctttttccccgcctacatctcgagaaacag gattgcagaagctcctaacctgaagctctgtgtaaccgctggcgtcggttcagaccatgtcgatttagaagctgca aatgaacggaaaatcacggtcaccgaagttactggttctaacgtcgtttctgtcgcagagcacgttatggccacaa ttttggttttgataagaaactataatggtggtcatcaataagcaattaatggtgagtgggatattgccggcgtggc taaaaaatgagtatgatctggaagacaaaataatttcaacggtaggtgccggtagaattggatatagggttctgga aagattggtcgcatttaatccgaagaagttactgtactacgactaccaggaactacctgcggaagcaatcaataga ttgaacgaggccagcaagcttttcaatggcagaggtgatattgttcagagagtagagaaattggaggatatggttg ctcagtcagatgttgttaccatcaactgtccattgcacaaggactcaaggggtttattcaataaaaagcttatttc ccacatgaaagatggtgcatacttggtgaataccgctagaggtgctatttgtgtcgcagaagatgttgccgaggca gtcaagtctggtaaattggctggctatggtggtgatgtctgggataagcaaccagcaccaaaagaccatccctgga ggactatggacaataaggaccacgtgggaaacgcaatgactgttcatatcagtggcacatctctgcatgctcaaaa gaggtacgctcagggagtaaagaacatcctaaatagttacttttccaaaaagtttgattaccgtccacaggatatt attgtgcagaatggttcttatgccaccagagcttatggacagaagaaataagagtgattatgagtatttg tgagcagaagttttccggtctccttttgttcttgttttggcgtattctccactattcgtccatagcacattt ataccttagctaaatattttgtaaagcaaaattttcgttatctcttaaaaaatagaagagcggtttatt aatatcaaataattgaaactgctgatatggtagctatatacaaaatctgctgtcaaaatttggcagta aacgatcttcacggtagcggttcaaataaagaggaaaagtccttctcccttactgtttttctggaattt ggctcgtcgttaataacagaactaaagatacagtaaaaggagagatcgcaatcaacttcattaatt gtaacagtagcataatcacaactggttatctgcgttatagacaattcttactcacaatgatgggcgct tagttggctgtaaacgtcgctttttaaaactccgaaaagttaccgctacagaaaaaaaccataaatg tatgctagttgcgcagagaggtttagggtccaaaatttactaccctgtcgctcactacagcgactgtc ccgaattaagcccgaagagacgcagaactgttgtatgaacctcatgaaaccactgatcttgaagat ttagaccttcagaatcgttttcaattagaagtatacaagaagtctttgtacaataatgtcaagacagagctctgaattatagttcagccttgttattttttttt
fdh2Δ突变的序列(删除完整编码区,其以Δ表示;SEQ ID NO: 96):
tgtcgagacaatgtcattgcaagttatataaacattgtaatacatcacctcgatgaaagaga aactggaatgatagatctctttttctcaaaatttcgttaatatgtaataataaggttcctgatgtaattt gtttttgtacaaattattttagattctggaggttcaaataaaatatatattacagccaacgattagggg ggacaagacttgattacacatttttcgttggtaacttgactcttttatgaaaagaaaacattaagttga aggtgcacgcttgaggcgctcctttttcatggtgcttagcagcagatgaaagtgtcagaagttacct attttgtcaccatttgagaataagcttgaaagaaagttgtaaccccaacttttctatcttgcacttgttt ggaccaacagccaaacggcttatcccttttcttttcccttataatcgggaatttccttactaggaaggc accgatactataactccgaatgaaaaagacatgccagtaataaaaataattgatgttatgcggaat atactattcttggattattcactgttaactaaaagttggagaaatcactctgcactgtcaatcattgaa aaaaagaacatataaaagggcacaaaatcgagtcttttttaatgagttcttgctgaggaaaatttag ttaatatatcatttacataaaacatgcatattattgtgttgtactttctttattcattttaagcaggaata attacaagtattgcaacgctaatcaaatcgaaataacagctgaaaattaatΔtaagagtgattatgagtatttgtgagcagaagttttccggtctccttttgttcttgttttggcgtattctccactattcgtccata gcacatttataccttagctaaatattttgtaaagcaaaattttcgttatctcttaaaaaatagaagagc ggtttattaatatcaaataattgaaactgctgatatggtagctatatacaaaatctgctgtcaaaattt ggcagtaaacgatcttcacggtagcggttcaaataaagaggaaaagtccttctcccttactgtttttc tggaatttggctcgtcgttaataacagaactaaagatacagtaaaaggagagatcgcaatcaactt cattaattgtaacagtagcataatcacaactggttatctgcgttatagacaattcttactcacaatgat gggcgcttagttggctgtaaacgtcgctttttaaaactccgaaaagttaccgctacagaaaaaaacc ataaatgtatgctagttgcgcagagaggtttagggtccaaaatttactaccctgtcgctcactacagc gactgtcccgaattaagcccgaagagacgcagaactgttgtatgaacctcatgaaaccactgatct tgaagatttagaccttcagaatcgttttcaattagaagtatacaagaagtctttgtacaataatgtca agacagagctctgaattatagttcagccttgttattttttttt
3.2包含gpd2Δ::GPD1的甘油减少菌株的产生
如上所述构建甘油减少菌株gpd2Δ::GPD1。gpd1Δ/gpd1Δ gpd2Δ/gpd2Δ::GPD1/GPD1的序列提供于下文中。
GPD2基因座上的GPD1的序列(插入的GPD1加以下划线;SEQ ID NO:97):
agtaactgtgacgatatcaactctttttttattatgtaataagcaaacaagcacgaatgggga aagcctatgtgcaatcaccaaggtcgtcccttttttcccatttgctaatttagaatttaaagaaaccaa aagaatgaagaaagaaaacaaatactagccctaaccctgacttcgtttctatgataataccctgctt taatgaacggtatgccctagggtatatctcactctgtacgttacaaactccggttattttatcggaaca tccgagcacccgcgccttcctcaacccaggcaccgcccccaggtaaccgtgcgcgatgagctaatc ctgagccatcacccaccccacccgttgatgacagcaattcgggagggcgaaaaataaaaactgga gcaaggaattaccatcaccgtcaccatcaccatcatatcgccttagcctctagccatagccatcatg caagcgtgtatcttctaagattcagtcatcatcattaccgagtttgttttccttcacatgatgaagaag gtttgagtatgctcgaaacaataagacgacgatggctctgccattgttatattacgcttttgcggcga ggtgccgatgggttgctgaggggaagagtgtttagcttacggacctattgccattgttattccgatta atctattgttcagcagctcttctctaccctgtcattctagtattttttttttttttttttggttttactttttttt cttcttgcctttttttcttgttactttttttctagttttttttccttccactaagctttttccttgatttatccttg ggttcttctttctactcctttagattttttttttatatattaatttttaagtttatgtattttggtagattcaat tctctttccctttccttttccttcgctccccttccttatcaatgtctgctgctgctgatagattaaac ttaacttccggccacttgaatgctggtagaaagagaagttcctcttctgtttctttgaaggctgccgaaaagcctt tcaaggttactgtgattggatctggtaactggggtactactattgccaaggtggttgccgaaaattgtaagggata cccagaagttttcgctccaatagtacaaatgtgggtgttcgaagaagagatcaatggtgaaaaattgactgaaatc ataaatactagacatcaaaacgtgaaatacttgcctggcatcactctacccgacaatttggttgctaatccagact tgattgattcagtcaaggatgtcgacatcatcgttttcaacattccacatcaatttttgccccgtatctgtagcca attgaaaggtcatgttgattcacacgtcagagctatctcctgtctaaagggttttgaagttggtgctaaaggtgtc caattgctatcctcttacatcactgaggaactaggtattcaatgtggtgctctatctggtgctaacattgccaccg aagtcgctcaagaacactggtctgaaacaacagttgcttaccacattccaaaggatttcagaggcgagggcaagga cgtcgaccataaggttctaaaggccttgttccacagaccttacttccacgttagtgtcatcgaagatgttgctggt atctccatctgtggtgctttgaagaacgttgttgccttaggttgtggtttcgtcgaaggtctaggctggggtaaca acgcttctgctgccatccaaagagtcggtttgggtgagatcatcagattcggtcaaatgtttttcccagaatctag agaagaaacatactaccaagagtctgctggtgttgctgatttgatcaccacctgcgctggtggtagaaacgtcaag gttgctaggctaatggctacttctggtaaggacgcctgggaatgtgaaaaggagttgttgaatggccaatccgctc aaggtttaattacctgcaaagaagttcacgaatggttggaaacatgtggctctgtcgaagacttcccattatttga agccgtataccaaatcgtttacaacaactacccaatgaagaacctgccggacatgattgaagaattagatctacat gaagattagac actctccccccccctccccctctgatctttcctgttgcctctttttcccccaaccaatttatcattataca caagttctacaactactactagtaacattactacagttattataattttctattctctttttctttaagaat ctatcattaacgttaatttctatatatacataactaccattatacacgctattatcgtttacatatcacatcaccgttaatgaaagatacgacaccctgtacactaacacaattaaataatcgccataaccttttctg ttatctatagcccttaaagctgtttcttcgagctttttcactgcagtaattctccacatgggcccagcca ctgagataagagcgctatgttagtcactactgacggctctccagtcatttatgtgattttttagtgact catgtcgcatttggcccgtttttttccgctgtcgcaacctatttccattaacggtgccgtatggaagag tcatttaaaggcaggagagagagattactcatcttcattggatcagattgatgactgcgtacggcag atagtgtaatctgagcagttgcgagacccagactggcactgtctcaatagtatattaatgggcatac attcgtactcccttgttcttgcccacagttctctctctctttacttcttgtatcttgtctccccattgtgcag cgataaggaacattgttctaatatacacggatacaaaagaaatacacat
实施例4
PFL和AADH酶的克隆和表征
为了鉴定用于本发明的菌株的PFL酶,几种PFL酶被鉴定来用于克隆和功能分析。参见表1。通过fcyΔ::ADHE gpd1Δ::ADHE gpd2Δfdh1Δfdh2Δ(M2158)背景中每一个PFL的基于质粒的表达来测定功能性。图22显示在20%玉米糖化醪中的发酵性能。基于高于M2085的产率增加的存在或不存在,PFL被测定为是有功能的。基于图13中显示的数据,解纤维梭菌PFL被测定为无功能的。被列为M1992+pMU2481的菌株是M2085+表达解纤维梭菌PFL的质粒。该菌株似乎不产生甲酸。
表1.PFL酶的分析
生物 功能 SEQ ID NO:
地衣芽孢杆菌ATCC_14580 Nd 6和40
嗜热链球菌LMD_9 Nd 12和46
胚芽乳杆菌WCFS1(lp_3314和lp_3313) Nd 16和50
干酪乳杆菌ATCC_334 24和58
青春双岐杆菌 26和60
解纤维素梭菌 34和68
大肠杆菌 36和70
莱茵衣藻PflA 72和76
单鞭毛菌属E2 78
新丽鞭毛菌 74和80
如实施例7中显示的,测试的9个PFL酶中的8个可使得能够进行本文中描述的甘油消除和甘油减少技术。这些PFL酶中的6个的比对示于图12中。残基中的4个残基不存在于解纤维梭菌中,但在其它 PFL酶中是保守的(在图12中以星号标示)。在青春双岐杆菌PFL的位置640上存在18个氨基酸的插入,所述插入不存在于其它PFL酶中。真核生物PFL(单鞭毛菌和衣藻属)具有据报导参与线粒体靶向的 N末端延伸。该序列的缺失可在酿酒酵母中改善这些酶的性能。这些差异可提供鉴定用于本发明的菌株的其它PFL酶的洞察力。
为了鉴定用于本发明的菌株的AADH酶,几种AADH酶被鉴定来用于克隆和功能分析。参见表2。功能性可通过分析下面表3中所列的和图20中所示的数据来进行测定。如果包含基因型gpd1Δgpd2Δ+ 给定的AADH的菌株具有比菌株gpd1Δgpd2Δ更快的厌氧生长(图20) 并且存在乙酸消耗的证据(表3),则AADH酶被测定为是有功能的。
表2.AADH酶的分析
生物 功能 SEQ ID NO:
大肠杆菌 84
Clostridium phytofermentans 82
莱茵衣藻 86
单鞭毛菌属E2 88
青春双岐杆菌 100
当将甘油缺失菌株厌氧生长时,它们不能生长或发酵并且在糖酵解过程中不能消耗糖。然而,如果这些甘油缺失菌株用AADH补充的话,则菌株能够在培养基中补充乙酸的情况下生长。图20显示亲代菌株、甘油缺失菌株和4个表达来自大肠杆菌(Eco)、Clostridiumphytofermentans(Cph)、莱茵衣藻(Chl)和单鞭毛菌属E2(Pir)的AADH 的甘油缺失菌株的生长速率。如图20中显示的,所有4个基因可恢复高于甘油缺失菌株的生长水平(如通过点线显示的),表明存在功能性AADH。
由上述菌株以及其它菌株产生的产品收率和乙酸的转化示于表3 中。甘油缺失菌株不能消耗糖或产生乙醇。亲代菌株产生甘油和乙醇但不能转化培养基中的乙酸(最初以~2g/L存在),从而产生0.41g/g 葡萄糖的乙醇产率,与厌氧乙醇产率一致。然而,补充有AADH的甘油缺失菌株能够消耗葡萄糖和产生乙醇,但不产生甘油,或甘油产量相较于亲代菌株(Chl AADH)显著减少。参见表3。在这些甘油缺失突变体中,乙酸水平也减少,从而导致比通过亲代菌株获得的更高的乙醇产率(计算为产生的乙醇克数/克消耗的葡萄糖)。
表3.表达AADH的甘油缺失菌株的成品产率和醋酸转化
菌株 甘油<sup>a</sup> 乙酸摄取<sup>a</sup> 乙醇<sup>a</sup> 乙醇产率<sup>b</sup> 生长率(hr<sup>-1</sup>)
亲代M139 1.37 0.14 10.41 0.42 0.27
Δgpd1Δgpd2 M2032 0.00 0.00 0.00 0.00 0.01
Eco AADH M1991 0.00 0.62 11.39 0.46 0.17
Cph AADH M1991 0.00 0.66 11.21 0.45 0.18
Chl AADH M1991 0.00 0.32 9.04 0.47 0.04
Pir AADH M1991 0.00 0.68 11.17 0.45 0.17
Bad AADH M1991 0.00 0.67 10.95 0.44 0.18
Eco mhpF M1991 0.00 0.03 0.50 0.02 0.06
Cph ADH(1428)M1991 0.00 0.60 11.29 0.45 0.19
Cph ADH(2642)M1991 0.00 0.74 11.22 0.45 0.20
Tsac AADH M1991 0.00 0.59 11.89 0.48 0.16
a克/升
b产生的乙醇克数/克消耗的糖
实施例5
PFL和AADH的表达和甲酸的检测
为了检查本发明的酵母菌株的甲酸的表达,将大肠杆菌PFL克隆在FDH缺失菌株中并且在其中表达。菌株M1992+pMU2483具有 FDH1和FDH2的缺失和表达大肠杆菌PflA和PflB的质粒。该菌株通过用表达解纤维梭菌PFL(pMU2481)或大肠杆菌PFL(pMU2483) 的质粒转化菌株M1992(fdh1Δfdh2Δ)来构建。
将菌株在用pH 6.5的HEPES缓冲的YNB培养基中培养,按照制造商的说明书,使用来自Megazymes(目录号K-FORM)的甲酸检测试剂盒测量甲酸。如图13中显示的,在24小时和48小时的生长后,分别测量到约0.0125g/L和0.023g/L的甲酸。通过在酿酒酵母中过表达大肠杆菌PFL已获得相似的结果。Waks和Silver,Appl.Env. Microbiol.75:1867-75(2009)。
PFL也在表达AADH的菌株中共表达。参见图14。M2085是具有基因型gpd1Δgpd2Δfdh1Δfdh2Δ的背景菌株,并且M2032具有基因型gpd1Δgpd2Δ。这两种菌株即使在乙酸存在的情况下都不能厌氧生长。通过将多个拷贝的大肠杆菌AADH整合在M2085背景中的GPD1和FCY1基因座来产生M2158。整合方案示于图26和27中,M2158 的对应核苷酸序列列于下面。一个拷贝的AADH由天然GPD1启动子驱动。参见图26。第二拷贝以相反方向取向,并且由果糖磷酸激酶启动子驱动。参见图26。关于AADH在FCY1中的整合,一个拷贝由ENO1启动子驱动,第二拷贝由PFK1启动子驱动。参见图27。 M2182通过将表达青春双岐杆菌PFL的载体转化进入M2158背景来产生。
GPD1基因座上的M2158 AADH整合的序列(核苷酸;SEQ ID NO:98):
tagattcttttcgaatttgtggtgaagataggaaagttggtacagttctccatcaattttccata ttttgctaaaaactcccttgcatgtctctttgcattcatttctcctgtatacgggttcaacacatcaatcg aattttgcaaagttgtctccatttctagaagactttcatcgggaataaaaaattcatatccattattca aaaacgataatgatccctcgtacttacctgtgtaattggatattttataccatacttcaaaaatatcct tggcctcacttctggtaggatacctttcgccatgtctgccaatcatttgaacttgcgttaatctacaac cttcaggaatatcagtgggtataccgtagttagcgggaaaggagaaatatggcgcagaccctcca agaaagggaaacagactcttctgagagccaattagttcaatatccgcaaaacttctgagtgggatg gagagtgccttagataatagaacacctaaacaaatggcaaaaataacgggcttcaccattgttcct gtatggtgtattagaacatagctgaaaatacttctgcctcaaaaaagtgttaaaaaaaagaggcat tatatagaggtaaagcctacaggcgcaagataacacatcaccgctctcccccctctcatgaaaagt catcgctaaagaggaacactgaaggttcccgtaggttgtctttggcacaaggtagtacatggtaaa aactcaggatggaataattcaaattcaccaatttcaacgtcccttgtttaaaaagaaaagaatttttc tctttaaggtagcactaatgcattatcgatgatgtaaccattcacacaggttatttagcttttgatcctt gaaccattaattaacccagaaatagaaattacccaagtggggctctccaacacaatgagaggaaa ggtgactttttaagggggccagaccctgttaaaaacctttgatggctatgtaataatagtaaattaag tgcaaacatgtaagaaagattctcggtaacgaccatacaaatattgggcgtgtggcgtagtcggta gcgcgctcccttagcatgggagaggtctccggttcgattccggactcgtccaaattattttttactttc cgcggtgccgagatgcagacgtggccaactgtgtctgccgtcgcaaaatgatttgaattttgcgtcg cgcacgtttctcacgtacataataagtattttcatacagttctagcaagacgaggtggtcaaaatag aagcgtcctatgttttacagtacaagacagtccatactgaaatgacaacgtacttgacttttcagtat tttctttttctcacagtctggttatttttgaaagcgcacgaaatatatgtaggcaagcattttctgagtctgctgacctctaaaattaatgctattgtgcaccttagtaacccaaggcaggacagttaccttgcgtgg tgttactatggccggaagcccgaaagagttatcgttactccgattattttgtacagctgatgggacct tgccgtcttcattttttttttttttcacctatagagccgggcagagctgcccggcttaactaagggccg gaaaaaaaacggaaaaaagaaagccaagcgtgtagacgtagtataacagtatatctgacacgca cgtgatgaccacgtaatcgcatcgcccctcacctctcacctctcaccgctgactcagcttcactaaaa aggaaaatatatactctttcccaggcaaggtgacagcggtccccgtctcctccacaaaggcctctcc tggggtttgagcaagtctaagtttacgtagcataaaaattctcggattgcgtcaaataataaaaaaa gtaaccccacttctacttctacatcggaaaaacattccattcacatatcgtctttggcctatcttgtttt gtcctcggtagatcaggtcagtacaaacgcaacacgaaagaacaaaaaaagaagaaaacagaa ggccaagacagggtcaatgagactgttgtcctcctactgtccctatgtctctggccgatcacgcgcc attgtccctcagaaacaaatcaaacacccacaccccgggcacccaaagtccccacccacaccacc aatacgtaaacggggcgccccctgcaggccctcctgcgcgcggcctcccgccttgcttctctcccctt ccttttctttttccagttttccctattttgtccctttttccgcacaacaagtatcagaatgggttcatcaaa tctatccaacctaattcgcacgtagactggcttggtattggcagtttcgtagttatatatatactacca tgagtgaaactgttacgttaccttaaattctttctccctttaattttcttttatcttactctcctacataag acatcaagaaacaattgtatattgtacaccccccccctccacaaacacaaatattgataatataaag atggctgttactaatgtcgctgaacttaacgcactcgtagagcgtgtaaaaaaagcccagcgtgaa tatgccagtttcactcaagagcaagtagacaaaatcttccgcgccgccgctctggctgctgcagatg ctcgaatcccactcgcgaaaatggccgttgccgaatccggcatgggtatcgtcgaagataaagtga tcaaaaaccactttgcttctgaatatatctacaacgcctataaagatgaaaaaacctgtggtgttctg tctgaagacgacacttttggtaccatcactatcgctgaaccaatcggtattatttgcggtatcgttccg accactaacccgacttcaactgctatcttcaaatcgctgatcagtctgaagacccgtaacgccattat cttctccccgcacccgcgtgcaaaagatgccaccaacaaagcggctgatatcgttctgcaggctgct atcgctgccggtgctccgaaagatctgatcggctggatcgatcaaccttctgttgaactgtctaacgc actgatgcaccacccagacatcaacctgatcctcgcgactggtggtccgggcatggttaaagccgc atacagctccggtaaaccagctatcggtgtaggcgcgggcaacactccagttgttatcgatgaaac tgctgatatcaaacgtgcagttgcatctgtactgatgtccaaaaccttcgacaacggcgtaatctgtg cttctgaacagtctgttgttgttgttgactctgtttatgacgctgtacgtgaacgttttgcaacccacgg cggctatctgttgcagggtaaagagctgaaagctgttcaggatgttatcctgaaaaacggtgcgctg aacgcggctatcgttggtcagccagcctataaaattgctgaactggcaggcttctctgtaccagaaa acaccaagattctgatcggtgaagtgaccgttgttgatgaaagcgaaccgttcgcacatgaaaaac tgtccccgactctggcaatgtaccgcgctaaagatttcgaagacgcggtagaaaaagcagagaaa ctggttgctatgggcggtatcggtcatacctcttgcctgtacactgaccaggataaccaaccggctc gcgtttcttacttcggtcagaaaatgaaaacggcgcgtatcctgattaacaccccagcgtctcaggg tggtatcggtgacctgtataacttcaaactcgcaccttccctgactctgggttgtggttcttggggtgg taactccatctctgaaaacgttggtccgaaacacctgatcaacaagaaaaccgttgctaagcgagc tgaaaacatgttgtggcacaaacttccgaaatctatctacttccgccgtggctccctgccaatcgcgc tggatgaagtgattactgatggccacaaacgtgcgctcatcgtgactgaccgcttcctgttcaacaa tggttatgctgatcagatcacttccgtactgaaagcagcaggcgttgaaactgaagtcttcttcgaa gtagaagcggacccgaccctgagcatcgttcgtaaaggtgcagaactggcaaactccttcaaacc agacgtgattatcgcgctgggtggtggttccccgatggacgccgcgaagatcatgtgggttatgtac gaacatccggaaactcacttcgaagagctggcgctgcgctttatggatatccgtaaacgtatctaca agttcccgaaaatgggcgtgaaagcgaaaatgatcgctgtcaccaccacttctggtacaggttctg aagtcactccgtttgcggttgtaactgacgacgctactggtcagaaatatccgctggcagactatgc gctgactccggatatggcgattgtcgacgccaacctggttatggacatgccgaagtccctgtgtgctt tcggtggtctggacgcagtaactcacgccatggaagcttatgtttctgtactggcatctgagttctctg atggtcaggctctgcaggcactgaaactgctgaaagaatatctgccagcgtcctaccacgaagggt ctaaaaatccggtagcgcgtgaacgtgttcacagtgcagcgactatcgcgggtatcgcgtttgcga acgccttcctgggtgtatgtcactcaatggcgcacaaactgggttcccagttccatattccgcacggt ctggcaaacgccctgctgatttgtaacgttattcgctacaatgcgaacgacaacccgaccaagcag actgcattcagccagtatgaccgtccgcaggctcgccgtcgttatgctgaaattgccgaccacttgg gtctgagcgcaccgggcgaccgtactgctgctaagatcgagaaactgctggcatggctggaaacg ctgaaagctgaactgggtattccgaaatctatccgtgaagctggcgttcaggaagcagacttcctgg cgaacgtggataaactgtctgaagatgcattcgatgaccagtgcaccggcgctaacccgcgttacc cgctgatctccgagctgaaacagattctgctggatacctactacggtcgtgattatgtagaaggtga aactgcagcgaagaaagaagctgctccggctaaagctgagaaaaaagcgaaaaaatccgcttaa gtcgagagcttttgattaagccttctagtccaaaaaacacgtttttttgtcatttatttcattttcttaga atagtttagtttattcattttatagtcacgaatgttttatgattctatatagggttgcaaacaagcatttt tcattttatgttaaaacaatttcaggtttaccttttattctgcttgtggtgacgcgtgtatccgcccgctc ttttggtcacccatgtatttaattgcataaataattcttaaaagtggagctagtctatttctatttacatacctctcatttctcatttcctcctaatgtgtcaatgatcatattcttaactggaccgatcttattcgtcaga ttcaaaccaaaagttcttagggctaccacaggaggaaaattagtgtgatataatttaaataatttatc cgccattcctaatagaacgttgttcgacggatatctttctgcccaaaagggttctaagctcaatgaag agccaatgtctaaacctcgttacattgaaaatacagtaaatggttccaccattattatgttggtcttgt ttagtatggccgatcggcgtgtgttttgtttgcaccttttatatagtagaagaatatttgtcttaattctt attagtactgcaacctaaccactaattatcaacaattattggattatataaaggaggtaaattgccg gattaaaatcaaatatcattcatcaacaagtattcatattgtcggcatatttttacatgcggtgtaagt atttggatcgtattcttatagtgtcaatacctcgaagcagcgtttcaagtaccagacgtatgtaggaa ctttttaacgtcgagtccgtaagatttgatcagtattaaaaaaatctagataaatgagtggtacaaat aaaaacatcattaaaaatcgttaaataaaaaagtatgaagatcatctattaaagtattagtagccat tagccttaaaaaaatcagtgctagtttaagtataatctcgggcgcgccggccgaggcggttaagcg gattttttcgcttttttctcagctttagccggagcagcttctttcttcgctgcagtttcaccttctacataatcacgaccgtagtaggtatccagcagaatctgtttcagctcggagatcagcgggtaacgcgggtta gcgccggtgcactggtcatcgaatgcatcttcagacagtttatccacgttcgccaggaagtctgcttc ctgaacgccagcttcacggatagatttcggaatacccagttcagctttcagcgtttccagccatgcca gcagtttctcgatcttagcagcagtacggtcgcccggtgcgctcagacccaagtggtcggcaatttc agcataacgacggcgagcctgcggacggtcatactggctgaatgcagtctgcttggtcgggttgtc gttcgcattgtagcgaataacgttacaaatcagcagggcgtttgccagaccgtgcggaatatggaa ctgggaacccagtttgtgcgccattgagtgacatacacccaggaaggcgttcgcaaacgcgatacc cgcgatagtcgctgcactgtgaacacgttcacgcgctaccggatttttagacccttcgtggtaggac gctggcagatattctttcagcagtttcagtgcctgcagagcctgaccatcagagaactcagatgccagtacagaaacataagcttccatggcgtgagttactgcgtccagaccaccgaaagcacacagggac ttcggcatgtccataaccaggttggcgtcgacaatcgccatatccggagtcagcgcatagtctgcca gcggatatttctgaccagtagcgtcgtcagttacaaccgcaaacggagtgacttcagaacctgtacc agaagtggtggtgacagcgatcattttcgctttcacgcccattttcgggaacttgtagatacgtttac ggatatccataaagcgcagcgccagctcttcgaagtgagtttccggatgttcgtacataacccacat gatcttcgcggcgtccatcggggaaccaccacccagcgcgataatcacgtctggtttgaaggagttt gccagttctgcacctttacgaacgatgctcagggtcgggtccgcttctacttcgaagaagacttcagt ttcaacgcctgctgctttcagtacggaagtgatctgatcagcataaccattgttgaacaggaagcgg tcagtcacgatgagcgcacgtttgtggccatcagtaatcacttcatccagcgcgattggcagggagc cacggcggaagtagatagatttcggaagtttgtgccacaacatgttttcagctcgcttagcaacggt tttcttgttgatcaggtgtttcggaccaacgttttcagagatggagttaccaccccaagaaccacaac ccagagtcagggaaggtgcgagtttgaagttatacaggtcaccgataccaccctgagacgctggg gtgttaatcaggatacgcgccgttttcattttctgaccgaagtaagaaacgcgagccggttggttatc ctggtcagtgtacaggcaagaggtatgaccgataccgcccatagcaaccagtttctctgctttttcta ccgcgtcttcgaaatctttagcgcggtacattgccagagtcggggacagtttttcatgtgcgaacggt tcgctttcatcaacaacggtcacttcaccgatcagaatcttggtgttttctggtacagagaagcctgc cagttcagcaattttataggctggctgaccaacgatagccgcgttcagcgcaccgtttttcaggata acatcctgaacagctttcagctctttaccctgcaacagatagccgccgtgggttgcaaaacgttcac gtacagcgtcataaacagagtcaacaacaacaacagactgttcagaagcacagattacgccgttgtcgaaggttttggacatcagtacagatgcaactgcacgtttgatatcagcagtttcatcgataacaa ctggagtgttgcccgcgcctacaccgatagctggtttaccggagctgtatgcggctttaaccatgccc ggaccaccagtcgcgaggatcaggttgatgtctgggtggtgcatcagtgcgttagacagttcaaca gaaggttgatcgatccagccgatcagatctttcggagcaccggcagcgatagcagcctgcagaac gatatcagccgctttgttggtggcatcttttgcacgcgggtgcggggagaagataatggcgttacgg gtcttcagactgatcagcgatttgaagatagcagttgaagtcgggttagtggtcggaacgataccgc aaataataccgattggttcagcgatagtgatggtaccaaaagtgtcgtcttcagacagaacaccac aggttttttcatctttataggcgttgtagatatattcagaagcaaagtggtttttgatcactttatcttcg acgatacccatgccggattcggcaacggccattttcgcgagtgggattcgagcatctgcagcagcc agagcggcggcgcggaagattttgtctacttgctcttgagtgaaactggcatattcacgctgggcttt ttttacacgctctacgagtgcgttaagttcagcgacattagtaacagccataattcttaattaactttg atatgattttgtttcagattttttatataaaagctttcccaaatagtgctaaagtgaacttagattttttg gtacctgtttcgaaattaaaaatagaaaaatttctctccctatattgttattcttacttcaaatttgttta tcgtttatttactaggcgagacttgagtagacgacaatccaaatagaattaacagattttattggtag aaagcaataatattctttagatggttgagaataaagaagtaaaaaaaccagtaaagagaaaaag aaaaggaagaaaattaaagaaaaaggatgattacacaagaagataataaaaaaactcctttatta agagcggaagaatttaataatgaagatgggaataagcaaaacaaaaacaaagaagggaaaaaa aataaaaaatcgtatttatttatttaaaaaatcatgttgatgacgacaatggaaaaaaaaaaccgat ttcactttctcatccttatatttttcaaaggttgatgcaagtcgatctcaaatcggataacgctgccaa ctgggaaattccgcaattccgcaagaaaaaaaaaaatgtgaaaacgtgattgcattttttacaggt cctaaaggatttagcccacatatcaagagggtggcagtaattgcactgattaagcattcgtcagcat taggcgaatgtgtgcatgaatattgccagtgtgctcgatattagagagtacattgaagaatattgta ccggattatgtacaataactttgttaatgagatattaattttcttttttactagccgctatcccatgcac gatgctaaatttcaagaagaaactgagatttaaaaaattagtggaagctgataaaacggactataa tggtgtatggattgaggaatctcgacatgtttttccatcgttttcaacgatgactgtaacccgtagatt gaaccaggcatgccaaagttagttagatcagggtaaaaattatagatgaggtatttattggagaaa gataacatatcatactttcccccacttttttcgaggctcttctatatcatattcataaattagcattatgt catttctcataactactttatcacgttagaaattacttattattattaaattaatacaaaatttagtaac caaataaatataaataaatatgtatatttaaattttaaaaaaaaaatcctatagagcaaaaggattt tccattataatattagctgtacacctcttccgcattttttgagggtggttacaacaccactcattcaga ggctgtcggcacagttgcttctagcatctggcgtccgtatgtatgggtgtattttaaataataaacaa agtgccacaccttcaccaattatgtctttaagaaatggacaagttccaaagagcttgcccaaggctc gacaaggatgtactttggaatatctatattcaagtacgtggcgcgcatatgtttgagtgtgcacaca ataaaggtttttagatattttgcggcgtcctaagaaaataaggggtttcttaaaaaataacaatagc aaacaaagttccttacgatgatttcagatgtgaatagcatggtcatgatgagtatatacgtttttata aataattaaaagttttcctcttgtctgtttttttgttggctcgtggttgttctcgaaaaaggagagttttc attttcgaaataggtgattatcatcatgttgttatcaccccacgacgaagataatacggagctcaccg ttttctttttttttccctttggctgaaatttcccaccagaacaaacgtgacaaaattatctttgaatccaa agtagcttatatatatacgtagaagtgtttcgagacacacatccaaatacgaggttgttcaatttaaa cccaagaatacataaaaaaaatatagatatattaacttagtaaacaatgactgcaagcacaccatc caatgtcatgacattgttcttgttaaggcatggacaaagtgaattgaatcacgagaatatattctgtg gttggattgacgctaagctaaccgaaaaaggtaaagaacaagctcgtcattctgccgagctaatcg aacaatattgtaaagctaataatttgagattaccccagattggttacacctcacgtttaattaggacc caacagaccatagaaacgatgtgtgaagaatttaagttaaagccacaactgcaggttgtttacgac tttaataaaatcaaacttggagacgaatttggcagtgatgacaaggataatatgaaaatcccgattc ttcaaacttggaggctaaatgaacgtcattacggttcctggcagggccagaggaaaccgaatgtttt aaaagaatatggtaaggataaatatatgttcattaggagagattacgagggtaagccaccacctgt agatcttgaccgtgagatgattcaacaagaaaatgagaagggctcttctactgggtacgaattcaa ggagccaaacagacaaataaaatatgaattggaatgcagcaatcatgacattgtattaccggattc cgaatctcttcgtgaagtggtttatagattgaatccttttctacaaaatgtcatattaaaattagccaa tcaatatgatgaatcttcatgcctgattgtgggccatggaagttcagtgagatcgctactgaaaattc tggagggtatatcagatgatgacatcaagaatgttgatattccaaatggtatccccttagtcgttgaa ttagataagaataatggtcttaagtttatcagaaaattctacctagatcctgaatctgctaagatcaa tgctgagaaagtccgtaatgagggtttcataaaaaatccttaaggggggtaagtatataatataatt gtgtattttccgaagtataatgaaaaccaatagaaaacttattataagtccaatgaggtactttaaa aatgtgatatttataagaacattcctgaatgcagatatatgatatatattgtaaatatatatagatgtg tatatgtatttccattttgtgtgaggttttcttcttttatctcctatataatttgtaaccttaattaacccat gacataaccaatattagcctttgcaaattttgtaacttcttgacgttgttctaacgacaaatcttcatg cttcgattttatatgccttgttaaagcatccagtctcgaaaacgtcttctgatagccctcagatccaag aatttttatacactccgagcaacggaagacaatcttccttttagcgtgaatggtattttggtgtctcgtt aaatcataggaccttgaaaattgggcaccacacggttcatttgtaatgagattcattatctgacacgt aaatatttcgttattaccgtcagaagatgacgtatgggccgatggtgatgcagtcgaaggtttcgaa ttcgaatttgtagatgaatgtgaagataagtgcttc
GPD1基因座上的M2158 AADH整合的序列(核苷酸;SEQ ID NO:99):
cagaattggtgatattcttcattatcccctcgacatctttacttttgatcagctttgtgtatagcg ggatatccgattggaacttggcttcagcaacaaacttgccaaagtggattctcctactcaagctttgc aaacattctatatctctagtggcaacagaaccgaagttattcttatcatcaccatctcttttcgaaatt aatggtataatcttttcaatataaactttttttattttatcattgtaattaacttctggggcataaggcgc caaaatttgtgggtagttaatgctcggtaagaatgatttctgaatcttgtcaggaaagaagggagttt catcaggtgattcgaatcttctgatgcgagaatgcgcaatttcaagatttgaaagagcccaatccaa gaaagatcctttaaaattcggaatttctaaacctggatggtttgcctcataaactgaaggacatgtg gcgaaatgcgacctctcaataaatttgaagatgatcgaatcctccattctaactaattcatctctaat attttgtagatttaaaacagtttctggttttgtgaaatccatatcttataccaattttatgcaggatgct gagtgctatttgttagcaaaacggaatcgatgtttcaacttttcaatactttttttcttcttttcttcgaac ttcgaagattatagagatccattgaaaatttacgataaaggaaatgcaacacgaagtttgaaaaaa agttgatattgaaaaaaaaaaaaaaagagaaccaaaaaaaaattaaaaaacgtgaaaacgatg gtttaacaacttttttcgaatttggtatacgtggaaaaacgaatgtatagatgcatttttaaagaatat atataaaatttagtaattgtattccgcgagcggcgcaataggtgatttcatttagctgctttcagtttg cgtatcatttcttcattgatcttggcttctctatctaaatcctctttcgacttgtaaagtccccaagttcta aaccataagaaccgcctcaatctggaaaatttgtcagtatcaagaccataattcgtgtatgactgaa tcaaatgtaatccactttcgtcatgagtaaattcggccttgctcagagactcctggattttggctaaca acgcagtcccttcgatgcatatagctaggccacaaattatgccaataacggtccatgggttgatgttt tcttgaattctttcgtttttcatgctatttgcgtcttcccaagtcccagcgttccagtattcatactgcgc gttagagtggtagccataagagccggcatattggtaattttcagtattaacgttagaacgtggtgaa tacgatgtggtccagccttgcctcgttgtgtcatatacgatctttttctttgggtcacaaagaatatcat atgcttgagagatgactttaaatctatgtagtttttcgcttgatgttagcagcagcggtgatttactatc actgttggtaaccttttctgagctaaatatttgaatgttatcggaatggtcagggtggtacaattttac ataacgatgatattttttttttaacgacttcttgtccagtttaggatttccagatccggcctttggaatgc caaaaatatcatagggagttggatctgccaactcaggccattgttcatcccttatcgtaagttttctattgccatttttatcgttcgctgtagcatacttagctataaaagtgatttgtgggggacacttttctacaca tgataagtgccacttgaataaaaatgggtatacgaacttatggtgtagcataacaaatatattgcaa gtagtgacctatggtgtgtagatatacgtacagttagttacgagcctaaagacacaacgtgtttgtta attatactgtcgctgtaatatcttctcttccattatcaccggtcattccttgcaggggcggtagtacccg gagaccctgaacttttctttttttttttgcgaaattaaaaagttcattttcaattcgacaatgagatcta caagccattgttttatgttgatgagagccagcttaaagagttaaaaatttcatagctactagtcttcta ggcgggttatctactgatccgagcttccactaggatagcacccaaacacctgcatatttggacgacc tttacttacaccaccaaaaaccactttcgcctctcccgcccctgataacgtccactaattgagcgatt acctgagcggtcctcttttgtttgcagcatgagacttgcatactgcaaatcgtaagtagcaacgtctc aaggtcaaaactgtatggaaaccttgtcacctcacttaattctagctagcctaccctgcaagtcaag aggtctccgtgattcctagccacctcaaggtatgcctctccccggaaactgtggccttttctggcaca catgatctccacgatttcaacatataaatagcttttgataatggcaatattaatcaaatttattttactt ctttcttgtaacatctctcttgtaatcccttattccttctagctatttttcataaaaaaccaagcaactgc ttatcaacacacaaacactaaatcaaaatggctgttactaatgtcgctgaacttaacgcactcgtag agcgtgtaaaaaaagcccagcgtgaatatgccagtttcactcaagagcaagtagacaaaatcttcc gcgccgccgctctggctgctgcagatgctcgaatcccactcgcgaaaatggccgttgccgaatccg gcatgggtatcgtcgaagataaagtgatcaaaaaccactttgcttctgaatatatctacaacgccta taaagatgaaaaaacctgtggtgttctgtctgaagacgacacttttggtaccatcactatcgctgaa ccaatcggtattatttgcggtatcgttccgaccactaacccgacttcaactgctatcttcaaatcgctg atcagtctgaagacccgtaacgccattatcttctccccgcacccgcgtgcaaaagatgccaccaac aaagcggctgatatcgttctgcaggctgctatcgctgccggtgctccgaaagatctgatcggctgga tcgatcaaccttctgttgaactgtctaacgcactgatgcaccacccagacatcaacctgatcctcgcg actggtggtccgggcatggttaaagccgcatacagctccggtaaaccagctatcggtgtaggcgcg ggcaacactccagttgttatcgatgaaactgctgatatcaaacgtgcagttgcatctgtactgatgtc caaaaccttcgacaacggcgtaatctgtgcttctgaacagtctgttgttgttgttgactctgtttatga cgctgtacgtgaacgttttgcaacccacggcggctatctgttgcagggtaaagagctgaaagctgtt caggatgttatcctgaaaaacggtgcgctgaacgcggctatcgttggtcagccagcctataaaattg ctgaactggcaggcttctctgtaccagaaaacaccaagattctgatcggtgaagtgaccgttgttga tgaaagcgaaccgttcgcacatgaaaaactgtccccgactctggcaatgtaccgcgctaaagattt cgaagacgcggtagaaaaagcagagaaactggttgctatgggcggtatcggtcatacctcttgcct gtacactgaccaggataaccaaccggctcgcgtttcttacttcggtcagaaaatgaaaacggcgcgtatcctgattaacaccccagcgtctcagggtggtatcggtgacctgtataacttcaaactcgcacctt ccctgactctgggttgtggttcttggggtggtaactccatctctgaaaacgttggtccgaaacacctg atcaacaagaaaaccgttgctaagcgagctgaaaacatgttgtggcacaaacttccgaaatctatc tacttccgccgtggctccctgccaatcgcgctggatgaagtgattactgatggccacaaacgtgcgc tcatcgtgactgaccgcttcctgttcaacaatggttatgctgatcagatcacttccgtactgaaagca gcaggcgttgaaactgaagtcttcttcgaagtagaagcggacccgaccctgagcatcgttcgtaaa ggtgcagaactggcaaactccttcaaaccagacgtgattatcgcgctgggtggtggttccccgatg gacgccgcgaagatcatgtgggttatgtacgaacatccggaaactcacttcgaagagctggcgctg cgctttatggatatccgtaaacgtatctacaagttcccgaaaatgggcgtgaaagcgaaaatgatcgctgtcaccaccacttctggtacaggttctgaagtcactccgtttgcggttgtaactgacgacgctac tggtcagaaatatccgctggcagactatgcgctgactccggatatggcgattgtcgacgccaacctg gttatggacatgccgaagtccctgtgtgctttcggtggtctggacgcagtaactcacgccatggaag cttatgtttctgtactggcatctgagttctctgatggtcaggctctgcaggcactgaaactgctgaaag aatatctgccagcgtcctaccacgaagggtctaaaaatccggtagcgcgtgaacgtgttcacagtg cagcgactatcgcgggtatcgcgtttgcgaacgccttcctgggtgtatgtcactcaatggcgcacaa actgggttcccagttccatattccgcacggtctggcaaacgccctgctgatttgtaacgttattcgcta caatgcgaacgacaacccgaccaagcagactgcattcagccagtatgaccgtccgcaggctcgcc gtcgttatgctgaaattgccgaccacttgggtctgagcgcaccgggcgaccgtactgctgctaagat cgagaaactgctggcatggctggaaacgctgaaagctgaactgggtattccgaaatctatccgtga agctggcgttcaggaagcagacttcctggcgaacgtggataaactgtctgaagatgcattcgatga ccagtgcaccggcgctaacccgcgttacccgctgatctccgagctgaaacagattctgctggatacc tactacggtcgtgattatgtagaaggtgaaactgcagcgaagaaagaagctgctccggctaaagct gagaaaaaagcgaaaaaatccgcttaagtcgagagcttttgattaagccttctagtccaaaaaaca cgtttttttgtcatttatttcattttcttagaatagtttagtttattcattttatagtcacgaatgttttatga ttctatatagggttgcaaacaagcatttttcattttatgttaaaacaatttcaggtttaccttttattctg cttgtggtgacgcgtgtatccgcccgctcttttggtcacccatgtatttaattgcataaataattcttaa aagtggagctagtctatttctatttacatacctctcatttctcatttcctcctaatgtgtcaatgatcata ttcttaactggaccgatcttattcgtcagattcaaaccaaaagttcttagggctaccacaggaggaa aattagtgtgatataatttaaataatttatccgccattcctaatagaacgttgttcgacggatatctttc tgcccaaaagggttctaagctcaatgaagagccaatgtctaaacctcgttacattgaaaatacagtaaatggttccaccattattatgttggtcttgtttagtatggccgatcggcgtgtgttttgtttgcaccttt tatatagtagaagaatatttgtcttaattcttattagtactgcaacctaaccactaattatcaacaatt attggattatataaaggaggtaaattgccggattaaaatcaaatatcattcatcaacaagtattcat attgtcggcatatttttacatgcggtgtaagtatttggatcgtattcttatagtgtcaatacctcgaagc agcgtttcaagtaccagacgtatgtaggaactttttaacgtcgagtccgtaagatttgatcagtatta aaaaaatctagataaatgagtggtacaaataaaaacatcattaaaaatcgttaaataaaaaagtat gaagatcatctattaaagtattagtagccattagccttaaaaaaatcagtgctagtttaagtataatc tcgggcgcgccggccgaggcggttaagcggattttttcgcttttttctcagctttagccggagcagctt ctttcttcgctgcagtttcaccttctacataatcacgaccgtagtaggtatccagcagaatctgtttca gctcggagatcagcgggtaacgcgggttagcgccggtgcactggtcatcgaatgcatcttcagaca gtttatccacgttcgccaggaagtctgcttcctgaacgccagcttcacggatagatttcggaatacccagttcagctttcagcgtttccagccatgccagcagtttctcgatcttagcagcagtacggtcgcccgg tgcgctcagacccaagtggtcggcaatttcagcataacgacggcgagcctgcggacggtcatactg gctgaatgcagtctgcttggtcgggttgtcgttcgcattgtagcgaataacgttacaaatcagcagg gcgtttgccagaccgtgcggaatatggaactgggaacccagtttgtgcgccattgagtgacataca cccaggaaggcgttcgcaaacgcgatacccgcgatagtcgctgcactgtgaacacgttcacgcgct accggatttttagacccttcgtggtaggacgctggcagatattctttcagcagtttcagtgcctgcag agcctgaccatcagagaactcagatgccagtacagaaacataagcttccatggcgtgagttactgc gtccagaccaccgaaagcacacagggacttcggcatgtccataaccaggttggcgtcgacaatcg ccatatccggagtcagcgcatagtctgccagcggatatttctgaccagtagcgtcgtcagttacaaccgcaaacggagtgacttcagaacctgtaccagaagtggtggtgacagcgatcattttcgctttcacg cccattttcgggaacttgtagatacgtttacggatatccataaagcgcagcgccagctcttcgaagt gagtttccggatgttcgtacataacccacatgatcttcgcggcgtccatcggggaaccaccacccag cgcgataatcacgtctggtttgaaggagtttgccagttctgcacctttacgaacgatgctcagggtcg ggtccgcttctacttcgaagaagacttcagtttcaacgcctgctgctttcagtacggaagtgatctga tcagcataaccattgttgaacaggaagcggtcagtcacgatgagcgcacgtttgtggccatcagta atcacttcatccagcgcgattggcagggagccacggcggaagtagatagatttcggaagtttgtgc cacaacatgttttcagctcgcttagcaacggttttcttgttgatcaggtgtttcggaccaacgttttcag agatggagttaccaccccaagaaccacaacccagagtcagggaaggtgcgagtttgaagttatac aggtcaccgataccaccctgagacgctggggtgttaatcaggatacgcgccgttttcattttctgacc gaagtaagaaacgcgagccggttggttatcctggtcagtgtacaggcaagaggtatgaccgatac cgcccatagcaaccagtttctctgctttttctaccgcgtcttcgaaatctttagcgcggtacattgcca gagtcggggacagtttttcatgtgcgaacggttcgctttcatcaacaacggtcacttcaccgatcag aatcttggtgttttctggtacagagaagcctgccagttcagcaattttataggctggctgaccaacga tagccgcgttcagcgcaccgtttttcaggataacatcctgaacagctttcagctctttaccctgcaac agatagccgccgtgggttgcaaaacgttcacgtacagcgtcataaacagagtcaacaacaacaac agactgttcagaagcacagattacgccgttgtcgaaggttttggacatcagtacagatgcaactgc acgtttgatatcagcagtttcatcgataacaactggagtgttgcccgcgcctacaccgatagctggtt taccggagctgtatgcggctttaaccatgcccggaccaccagtcgcgaggatcaggttgatgtctgggtggtgcatcagtgcgttagacagttcaacagaaggttgatcgatccagccgatcagatctttcgga gcaccggcagcgatagcagcctgcagaacgatatcagccgctttgttggtggcatcttttgcacgcg ggtgcggggagaagataatggcgttacgggtcttcagactgatcagcgatttgaagatagcagttg aagtcgggttagtggtcggaacgataccgcaaataataccgattggttcagcgatagtgatggtac caaaagtgtcgtcttcagacagaacaccacaggttttttcatctttataggcgttgtagatatattcag aagcaaagtggtttttgatcactttatcttcgacgatacccatgccggattcggcaacggccattttc gcgagtgggattcgagcatctgcagcagccagagcggcggcgcggaagattttgtctacttgctctt gagtgaaactggcatattcacgctgggctttttttacacgctctacgagtgcgttaagttcagcgaca ttagtaacagccataattcttaattaactttgatatgattttgtttcagattttttatataaaagctttccc aaatagtgctaaagtgaacttagattttttggtacctgtttcgaaattaaaaatagaaaaatttctctc cctatattgttattcttacttcaaatttgtttatcgtttatttactaggcgagacttgagtagacgacaatccaaatagaattaacagattttattggtagaaagcaataatattctttagatggttgagaataaaga agtaaaaaaaccagtaaagagaaaaagaaaaggaagaaaattaaagaaaaaggatgattacac aagaagataataaaaaaactcctttattaagagcggaagaatttaataatgaagatgggaataag caaaacaaaaacaaagaagggaaaaaaaataaaaaatcgtatttatttatttaaaaaatcatgttg atgacgacaatggaaaaaaaaaaccgatttcactttctcatccttatatttttcaaaggttgatgcaa gtcgatctcaaatcggataacgctgccaactgggaaattccgcaattccgcaagaaaaaaaaaaa tgtgaaaacgtgattgcattttttacaggtcctaaaggatttagcccacatatcaagagggtggcag taattgcactgattaagcattcgtcagcattaggcgaatgtgtgcatgaatattgccagtgtgctcga tattagagagtacattgaagaatattgtaccggattatgtacaataactttgttaatgagatattaatt ttcttttttactagccgctatcccatgcacgatgctaaatttcaagaagaaactgagatttaaaaaatt agtggaagctgataaaacggactataatggtgtatggattgaggaatctcgacatgtttttccatcgt tttcaacgatgactgtaacccgtagattgaaccaggcatgccaaagttagttagatcagggtaaaa attatagatgaggtttaattaaacaagcacgcagcacgctgtatttacgtatttaattttatatatttgt gcatacactactagggaagacttgaaaaaaacctaggaaatgaaaaaacgacacaggaagtccc gtatttactattttttccttccttttgatggggcagggcggaaatagaggataggataagcctactgct tagctgtttccgtctctacttcggtagttgtctcaattgtcgtttcagtattacctttagagccgctagac gatggttgagctatttgttgagggaaaactaagttcatgtaacacacgcataacccgattaaactca tgaatagcttgattgcaggaggctggtccattggagatggtgccttattttccttataggcaacgatg atgtcttcgtcggtgttcaggtagtagtgtacactctgaatcagggagaaccaggcaatgaacttgtt cctcaagaaaatagcggccataggcatggattggttaaccacaccagatatgcttggtgtggcaga atatagtccttttggtggcgcaattttcttgtacctgtggtagaaagggagcggttgaactgttagtat atattggcaatatcagcaaatttgaaagaaaattgtcggtgaaaaacatacgaaacacaaaggtc gggccttgcaacgttattcaaagtcattgtttagttgaggaggtagcagcggagtatatgtattccttt tttttgcctatggatgttgtaccatgcccattctgctcaagcttttgttaaaattatttttcagtattttttc ttccatgttgcgcgttacgagaacagaagcgacagataaccgcaatcatacaactagcgctactgc ggggtgtaaaaagcacaagaactaagccaagatcacaacagttatcgataaaatagcagtgtttg catggccattgagaaggacaacattggcgtgcgcgccaatgttgtctcaccatgtagctccaaacg agttgtaagagacggaccgctcacgcttccgaagcggtcagaaaacgcttcccagtatgcagttga cctacattcaacctgcaaatattgctttgcttcaagaaatgattacacagacgtctattttcttctacat aatgcacgaaacttgggcatttagtcatgtagccgcctagcgagcctgggtgccgtcctatctccttt gttcgtgcaaagagacaggaacacacactgcgttctcttgcggccggtctggcggactcaggggtg cggcgtttgcttaaccggagggaataataaaatcggggtgacgcaagtatgaagtcatgtgtgctt agcaattacgtagagggattagaaataatagtgtgcggttatcggaaccggctcttgttcccgttta gagcaacccaggtgcaggcgtactttaaagtattttctttcttttttttcctgctacttacgctaggagc tgccgcagctgcaaagccgacgtcggagaggcaggtgatcttcggctcggccgacaaatcccctg gatatcattggcctgtcgaggtatcggccgcgtggaactaccgggaattactatgcaaaacaattg gaaatctggtaggaaaaccttgttctagaacttggcgattgctgacaaagaagaaaagggcctatt gttgctgcctcttttgttgttcttcctcgtattgtcttgccggtgttctttgtgtcttttgtgtgtaggttctt actattatagtgctctttgctattatattttcttcgttttcactttgcgtaatgtaacggtcttaaacaaa gttttttttttttcgctcttgcattttccttttctgctctatcttatttgctaattgtagtttcagaagttttac ttaaatatagcactattttccagttttaatgtttcttctcattgctttcttttataattttcgcatataattat acatttacggtgtcttaactctccctcttcacccctcattattccagaaaatactaatacttcttcacac aaaagaacgcagttagacaatcaacaatgaatcctaaatcctctacacctaagattccaagaccca agaacgcatttattctgttcagacagcactaccacaggatcttaatagacgaatggaccgctcaag gtgtggaaataccccataattcaaacatttctaaaattattggtacgaagtggaagggcttacaacc ggaagataaggcacactgggaaaatctagcggagaaggagaaactagaacatgaaaggaagta tcctgaatacaaatacaagccggtaagaaagtctaagaagaagcaactacttttgaaggaaatcg agcaacagcagcagcaacaacagaaagaacagcagcagcagaaacagtcacaaccgcaattac aacagccctttaacaacaatatagttcttatgaaaagagcacattctctttcaccatcttcctcggtgt caagctcgaacagctatcagttccaattgaacaatgatcttaagaggttgcctattccttctgttaata cttctaactatatggtctccagatctttaagtggactacctttgacgcatgataagacggcaagagacctaccacagctgtcatctcaactaaattctattccatattactcagctccacacgacccttcaacgag acatcattacctcaacgtcgctcaagctcaaccaagggctaactcgacccctcaattgccctttattt catccattatcaacaacagcagtcaaacaccggtaactacaactaccacatccacaacaactgcga catcttctcctgggaaattctcctcttctccgaactcctctgtactggagaacaacagattaaacagt atcaacaattcaaatcaatatttacctccccctctattaccttctctgcaagattttcaactggatcagt accagcagctaaagcagatgggaccaacttatattgtcaaaccactgtctcacaccaggaacaatc tattgtccacaactacccctacgcatcatcacattcctcatataccaaaccaaaacattcctctacat caaattataaactcaagcaacactgaggtcaccgctaaaactagcctagtttctccgaaatgattttt tttttccatttcttctttccgttatattatattatactatattccctttaactaaaaatttatgcatttggctc ctgtttaataaaagtttaaatc
将这些菌株在缺氧和微氧条件下生长在含50g/L葡萄糖的YPD 中,在142小时的时间段中测量甲酸。如图14中显示的,在142小时结束时,包含异源PFL和AADH的菌株产生比野生型菌株M139更多的甲酸。
实施例6
PFL和AADH的表达和乙醇的检测
本实施例的目的是确定甲酸的产生是否可赋予fdh、gpd和/或fps 缺失菌株在厌氧生长。用表达来自解纤维梭菌(TB274)和大肠杆菌 (TB275)的PflA/B盒的载体转化含有fdh1Δfdh2Δgpd1Δgpd2Δ遗传背景的酵母菌株(M2025)。这些菌株的每一个菌株还包含表达大肠杆菌 AdhE的第二构建体。制备YPD培养基,将其添加至hungate管,用氮气吹扫氧,将管高压灭菌20分钟。在含有选择两种质粒的维持的抗生素的YPD培养基中制备TB274和TB275的预培养物,进行过夜。在YPD中制备M1901(M2025的亲代菌株)及M2025本身的预培养物,将其分别用作阳性和负对照。产生称为TB267的菌株,其仅包含双功能性ADH质粒。在YPD+选择质粒的抗生素中制备该菌株。该菌株控制ADH或可存在于YPD培养基中的其它电子受体的潜在作用。
将所有菌株接种至约0.05或更低的终OD。在第0、24、48和72 小时测量每一个培养物的OD(图15),制备样品,将其经历代谢物水平的HPLC测定。如所预期的,M1901菌株生长相当快,到24小时时消耗了所有糖底物。不能产生甘油的M2025和TB267菌株在该实验中未显示OD的显著增加。表达PFL和ADH的TB274和TB275 菌株能够在24小时的延滞时间后生长。参见图15。这些数据表明 TB274和TB275中引入的代谢途径不阻止细胞生长。
这些菌株中甘油的产量示于图16中。如所预期的M1901的厌氧生长伴随甘油的产生。在含PflA/B菌株TB274和TB275中观察到痕量的甘油,但这处于或低于不生长的负对照的水平。参见图16。这些数据,结合OD数据,表明PflA/B和AdhE的表达允许M2025的厌氧生长而无相关甘油产生。
乙醇的产量和葡萄糖浓度分别示于图17和18。M1901和TB274 消耗全部糖,但约5g/L葡萄糖保留在TB275发酵中。参见图18。TB274 相较于M1901具有11%的乙醇产率的增加。参见图17。产率的增加高于预期,并且可能部分地以消耗生物质来获得,尽管这未得到确定。
将含有PFL和AADH的菌株与其它工程化以表达AADH的菌株相比较。这些菌株的描述示于表4中。
表4.PFL表达的遗传背景
在氮气吹扫的瓶中测试这5个菌株。如图19中所示,在gdp1Δ gpd2Δfdh1Δfdh2Δ背景中具有PFL和AADH表达盒的菌株M2182 具有比仅包含双功能性ADH活性但根本不生长的菌株M2158更快的生长速率和达到更高的OD。参见图19。这些数据显示表达PFL和 AADH活性的菌株比其它工程化功能性生长更好。高于这类其它工程化功能性的类似改善也在玉米糖化醪发酵中观察到(参见下面的实施例7)。
实施例7
从玉米糖化醪产生乙醇
本实验的目的是确定从下面表5中所列的生物克隆的PFL当用于 20%糖化醪的发酵时是否可提供增加的乙醇产率。已在酵母中测试总共9个PFL的功能。在这些PFL中,仅解纤维梭菌PFL在玉米糖化醪发酵中对甘油合成突变体的生长无正面作用。此外,当使用包含解纤维梭菌PFL的菌株时,在甲酸测定中未观察到甲酸。未测试该菌株对玉米糖化醪发酵的性能。
在具有整合在gpd1Δgpd2Δfdh1Δfdh2Δ背景(M2085)的染色体中的大肠杆菌AADH的菌株M2158或M2275中测试8个PFL的功能,所述M2275除了其还具有gpd2Δ::GPD1甘油减少突变外与M2158 相同。使用20%固体,在带有长颈振荡培养瓶中使用表5中所列的菌株进行两个单独的玉米糖化醪发酵实验。通过代谢物的HPLC分析评价菌株的性能。
表5.用于玉米糖化醪发酵的遗传背景
如图21和22中显示的,PFL的添加改善了仅包含AADH的菌株的乙醇产率。图23和24显示这些菌株如所预期的不产生甘油。已在用于该实验的工业糖化醪底物中观察到约4g/L的甘油。图25显示菌株M2326(其为甘油减少菌株)乙醇产率增加9%。
实施例8
下列实施例显示了酿酒酵母菌株M3625的产生。菌株M3625的基因型是:Δgpd2:青春双岐杆菌pflA/pflB/adhEΔfdh1Δfdh2::青春双岐杆菌pflA/pflB/adhE fcy1Δ::扣囊复膜酵母菌葡糖淀粉酶 (glu-0111-CO)。菌株M2390被称为来自LaSaffre (pahc.com/Phibro/Performance-Products/Catalog/23/Ethanol-Red.ht ml)的乙醇红(ethanolRed)(新)。
用于开发酿酒酵母菌株M3625的遗传修饰技术依赖于在酵母染色体内的特定的已知位点上插入青春双岐杆菌pflA、pflB、AdhE和扣囊复膜酵母菌glu-0111-CO的基因的定向整合。定向整合法产生具有稳定且容易表征的整合事件的转基因菌株。染色体整合,就其本质而言,相对于其它方法,减少异源DNA的任何动员的可能性和增强菌株稳定性。
MX盒是当期望在给定的染色体基因座中插入或删除遗传元件时最常用的工程化工具(Wach A,等人,Yeast 10(13):1793-1808 (1994))。可回收的MX盒包含一个或多个使得能够进行显性和负选择的标记(Goldstein,A.L.和McCusker,J.H.,Yeast 15:1541-1553(1999); Ito-Harashima,S.和McCusker,J.H.,Yeast 21:53–61(2004))。显性标记使得能够选择修饰,反选择标记使得随后能够通过Cre-Lox介导的重组(Güldener,Ulrich,等人,Nucleic Acids Research(1996)24(13) 2519–2524)或侧翼连接盒的重复同源区之间的重组来除去标记系统。由于标记被除去,因此可在随后的工程化步骤中使用它们,它们确保无不期望的外来遗传物质保留在菌株中。
为了在M3625中产生稳定的纯合整合,开发了两个基于新型 HSV-胸苷激酶(TDK)的MX盒。胸苷激酶在酿酒酵母中的表达导致对化合物氟-脱氧尿嘧啶(FUDR)的敏感性。FUDR的细胞毒性依赖于参与嘧啶代谢的两个酶:胸苷激酶(Tdk)和胸苷酸合成酶(ThyA)的存在。Tdk将FUDR转化成氟-dUMP(F-dUMP),所述氟-dUMP是ThyA的共价抑制剂并且是多种真核生物的反选择的基础(Czako,M.和L. Marton,(1994)Plant Physiol 104:1067-1071;Gardiner,D.M.和B.J. Howlett,(2004)Curr Genet 45:249-255;Khang,C.H.,等人,(2005) Fungal Genet Biol 42:483-492;Szybalski,W.(1992)Bioessays 14: 495-500)。
将HSV-TDK表达盒独立地融合至两个最常使用的显性可选择标记,所述标记赋予对药物G418(Kan)或诺尔丝菌素(Nat)的抗性 (Goldstein,A.L.和McCusker,J.H.,Yeast15:1541-1553(1999))。两个双表达盒(称为KT-MX和NT-MX)的转化使得能够正向选择至两个染色体中的整合,如图28A中举例说明的。转化的缺失装配件包含4 个PCR产物,与靶位点的上游同源的5'侧翼(p1)、KT-MX盒(p2)、 NT-MX盒(p3)和与靶位点的下游同源的3'侧翼(p4)。每一个组分单独地使用产生每一个PCR产物的同源重叠延伸的引物来进行扩增。参见表7和8。图28A中弯曲的虚线代表了KT/NT-MX盒与5'侧翼之间的同源性,弯曲实线代表了与3'侧翼的同源性。对于每一轮工程化,侧翼连接靶位点的上游和下游区域的PCR扩增子被设计来包含KT-MX 和NT-MX盒的同源尾。在侧翼和标记都被转化后,在含有G418和 Nat的YPD培养基上进行选择。参见图28B。图28B显示在用KT-MX 和NT-MX替代靶位点后染色体的示意图。
在M3625的构建中采取的每一个工程化步骤后,随后删除和/或用期望的表达盒(Mascoma Assembly)替代所有标记物,从而导致不含抗生素标记的菌株(图29)。图29显示转化的Mascoma Assembly包含一定量的PCR产物,这取决于期望的工程化事件(pX)、与靶位点的上游同源的5'侧翼(p1)和与靶位点的下游同源的3'侧翼(p4)。每一个组分单独地使用产生同源重叠延伸的引物来进行扩增。图29中的重叠曲线代表这些PCR产物的末端上的同源性。图29B显示在FUDR上选择后和用Mascoma Assembly替代遗传标记后染色体的示意图。标记去除的确认通过southern印迹、PCR和选择培养基上的稀释平板技术来进行评价,如下文所述。
在M3625的构建过程中修饰4个基因座。使用表6中所列的 Mascoma Assembly将上述整合法策略用于FDH1、GPD1和GPD2基因座。在图30-37中提供了描述每一个MascomaAssembly的组分的详细分子图谱。
表6.M3625中包含的遗传修饰
靶基因座 基因座修饰 盒ID 盒描述
FDH1 清洁缺失 MA0370 FDH1的清除缺失
FDH2 用表达盒替代 MA0280 2个拷贝的pflA/B和4个拷贝的adhE
GPD2 用表达盒替代 MA0289 2个拷贝的pflA/B和4个拷贝的adhE
FCY1 用表达盒替代 MA0317 4个拷贝的葡糖淀粉酶
表7.用于菌株M3625的产生的引物
表8.用于产生菌株M3625的引物的序列
引物 序列 SEQ ID NO
X11824 Aagcctacaggcgcaagataacacatcac 110
X15546 ggacgaggcaagctaaacagatctctagacctactttatattatcaatatttgtgtttg 111
X15380 Taggtctagagatctgtttagcttgc 112
X15382 Gagactacatgatagtccaaaga 113
X15547 ccgtttcttttctttggactatcatgtagtctcatttattggagaaagataacatatca 114
X11829 Ctcagcattgatcttagcagattcaggatctaggt 115
X11816 Gcagtcatcaggatcgtaggagataagca 116
X15548 ggacgaggcaagctaaacagatctctagacctatgataaggaaggggagcgaaggaaaa 117
X15549 ccgtttcttttctttggactatcatgtagtctcctctgatctttcctgttgcctctttt 118
X11821 Tcacaagagtgtgcagaaataggaggtgga 119
X16096 Catggtgcttagcagcagatgaaagtgtca 120
X15554 ggacgaggcaagctaaacagatctctagacctaattaattttcagctgttatttcgatt 121
X15555 ccgtttcttttctttggactatcatgtagtctcgagtgattatgagtatttgtgagcag 122
X11845 Ttacttgtgaaactgtctccgctatgtcag 123
X15559 Ggaaggcaccgatactagaactccg 124
X15550 gggacgaggcaagctaaacagatctctagacctaattaattttcagctgttattttgat 125
X15552 ccgtttcttttctttggactatcatgtagtctcgagtgattatgagtatttgtgagcag 126
X15553 Accagcgtctggtggacaaacggccttcaac 127
MA0370的基因分型和测序
为了确认在插入MA370后检测到FDH1,使用引物X17826和 X16944从M2390和M3625的基因组DNA扩增PCR产物。预期结果列于表10中,使用的引物的序列列于表11中。描述MA0370整合位点的分子图谱示于图30中,该分子图谱描述了用于除去KT-MX和 NT-MX标记的侧翼的位置和用于基因分型的引物的位置。参见图30 (5'侧翼,酿酒酵母FDH1上游的侧翼区域;3'侧翼–酿酒酵母FDH1 下游的侧翼区域。区域AA–扩增的和已测序的染色体DNA区域)。引物对X15556/X15871用于FDH1 5'侧翼,引物对X15870/X15553用于 FHD1 3'侧翼以产生图30中显示的装配件。用于使用的装配件的引物的序列见于表9中。显示用于确定基因型的PCR产物的琼脂糖凝胶图像示于图31中(泳道1:1KB阶梯;泳道2:M2390(X17826/X16944);泳道3:M3625(X17826/X16944))(参见表11)。
表9.用于产生MA0370整合位点的引物
引物 序列 SEQ ID NO
X15556 Ccactcgaggataggcttgaaaga 128
X15870 ctaatcaaatcaaaataacagctgaaaattaatgagtgattatgagtatttgtgagcag 129
X15871 Aaaacttctgctcacaaatactcataatcactcattaattttcagctgttattttgatt 130
X15553 Accagcgtctggtggacaaacggccttcaac 127
为了测定M3625 MA0370位点的确切DNA序列,在5个独立的 PCR反应中从M3625菌株的基因组DNA扩增区域AA。纯化所有PCR 产物,在Dartmouth College测序设施中利用Sanger法进行测序。
表10.用于MA0370基因分型的引物和基因分型的结果的概述
泳道 模板DNA 引物 预期尺寸(bp) 观察到的正确尺寸
1 1KB阶梯 N/A N/A N/A
2 M2390 X17826/X16944 4386bp
3 M3625 X17826/X16944 3237
表11.用于MA0370基因分型的引物的序列
引物 序列 SEQ ID NO
X17826 Tcgctaacgatcaagaggaactg 152
X16944 Tacacgtgcatttggacctatc 153
MA0280的基因分型和测序
为了确认MA280被插入在FDH2位点上,从M3625基因组DNA 扩增PCR产物。引物和预期的基因分型结果列于表13中。用于对 MA0280进行基因分型和测序的引物列于表14中。描述MA0280整合位点的分子图谱示于图32中。该分子图谱描述了用于替代KT-MX和 NT-MX标记和插入MA0280表达盒的侧翼的位置。用于基因分型的引物的位置示于图谱中。参见图32(M3625菌株的MA0280位点的图谱上的特征描述;FDH2 5’侧翼区-酿酒酵母FDH2上游侧翼区;PFK1p-酿酒酵母PFK1基因启动子;ADHE-青春双岐杆菌ADHE 编码基因;HXT2t-酿酒酵母HXT2基因终止子;ENO1p-酿酒酵母 ENO1基因启动子;PFLB-青春双岐杆菌PFLB编码基因;ENO1t- 酿酒酵母ENO1基因终止子;ADH1p-酿酒酵母ADH1基因启动子; PFLA-青春双岐杆菌PFLA编码基因;PDC1t-酿酒酵母PDC1基因终止子;FBA1t-酿酒酵母FBA1基因终止子;TPI1p-酿酒酵母TPI1基因启动子;FDH2 3'侧翼区-酿酒酵母FDH2下游侧翼区。区域BA-BE,扩增的和测序的染色体DNA区域)。引物对X16096/X17243用于FDH2 5'侧翼,引物对X16738/X16620用于pPFK1-ADH-HXT2,引物对 X16621/X13208用于pENO1-PFL-ENO1t,引物对X13209/X17242用于pADH1-PFL-PDC1t,引物对X17241/X16744用于 pTPI-ADH-FBA1trc,引物对X17244/X11845用于FDH2 5'侧翼以产生图32中显示的装配件。用于产生图32中显示的装配件的引物的序列见于表12。显示用于对MA0280位点基因分型和序列的PCR产物的琼脂糖凝胶图像示于图33(泳道1:1KB阶梯;泳道2:M3625(17413 /15810);泳道3:M3625(17834/14554);泳道4:M3625(16291/15229);泳道5:M3625(16503/11317);泳道6:(16241/16946);泳道7:1KB 阶梯)(参见表14)。
表12.用于产生MA0280整合位点的引物
引物 序列 SEQ ID NO
X16096 Catggtgcttagcagcagatgaaagtgtca 120
X17243 tagttagatcagggtaaaaattatagatgaggtattaattttcagctgttatttcgatt 131
X16738 ctaatcaaatcgaaataacagctgaaaattaatacctcatctataatttttaccctgat 132
X16620 tcggatcagtagataacccgcctagaagactaggttacattgaaaatacagtaaatggt 133
X16621 tggtggaaccatttactgtattttcaatgtaacctagtcttctaggcgggttatctact 134
X13208 ccgaaatattccacggtttagaaaaaaatcggaggtttagacattggctcttcattgag 135
X13209 aagctcaatgaagagccaatgtctaaacctccgatttttttctaaaccgtggaatattt 136
X17242 acatcatcttttaacttgaatttattctctagctttcaatcattggagcaatcatttta 137
X17241 gtccatgtaaaatgattgctccaatgattgaaagctagagaataaattcaagttaaaag 138
X16744 aaaaacttctgctcacaaatactcataatcactcctacttattcccttcgagattatatc 139
X17244 gttcctagatataatctcgaagggaataagtaggagtgattatgagtatttgtgagcag 140
X11845 Ttacttgtgaaactgtctccgctatgtcag 141
为了测定M3625 MA0280位点的确切DNA序列,在5个独立的PCR反应中从M3625菌株的基因组扩增区域BA-BE。纯化所有PCR 产物,在Dartmouth College测序设施中通过Sanger法进行测序。
表13.用于MA0280基因分型的引物和基因分型的结果的概述
泳道 模板DNA 引物 预期的尺寸(bp) 观察到的正确尺寸
1 1KB阶梯 N/A N/A N/A
2 M3625 17413/15810 5567
3 M3625 17834/14554 3686
4 M3625 16291/15229 2569
5 M3625 16503/11317 4352
6 M3625 16241/16946 2478
7 1KB阶梯 N/A N/A N/A
表14.用于MA0280的基因分型的引物的序列
引物 序列 SEQ ID NO
17413 Ggattcttcgagagctaaga 154
15810 Gacttgcagggtaggctagctagaatt 155
17834 Gctgcttcgaggtattgaca 156
14554 Ggctcttcattgagcttagaaccc 157
16291 Aactggaccgatcttattcgt 158
15229 Agtccactgcggagtcatttcaaag 159
16503 Ctgccagcgaattcgactctgcaat 160
11317 Cagtcgctgtagtgagcgacagggtagtaa 161
16241 Ctttgcattagcatgcgta 162
16946 Taggtcgagaccagaatgcatgt 163
MA0289的基因分型和测序
为了确认MA0289在GPD2位点被插入,从M3625基因组DNA 扩增PCR产物。引物和预期的基因分型结果列于表16。用于MA0289 的基因分型的引物的序列列于表17中。描述MA0289整合位点的分子图谱示于图34中。该分子图谱描述用于替代KT-MX和NT-MX标记和插入MA0280表达盒的侧翼的位置。用于基因分型的引物的位置标示于图谱上。参见图34(M3625菌株的MA0280位点的图谱上的特征;GPD2 5'侧翼-酿酒酵母GPD2上游侧翼区;ADHE-青春双岐杆菌 ADHE编码基因;HXT2t-酿酒酵母HXT2基因终止子;PDC1t-酿酒酵母PDC1基因终止子;PFLA-青春双岐杆菌PFLA编码基因; ADH1p-酿酒酵母ADH1基因启动子;ENO1t-酿酒酵母ENO1基因终止子;PFLB-青春双岐杆菌PFLB编码基因;ENO1p-酿酒酵母ENO1 基因启动子;FBA1t-酿酒酵母FBA1基因终止子;TPI1p-酿酒酵母 TPI1基因启动子;GPD2 3'侧翼-酿酒酵母GPD2下游侧翼区;区域 CA-CF–扩增的并且已测序的染色体DNA区域)。引物对X15473/X17460用于GPD2 5'侧翼,引物对X17459/X17289用于 ADH-HXT2,引物对X17290/X13209用于pADH1-PFL-PDC1trc,引物对X13208/X15735用于pENO1-PFL-ENO1trc,引物对X15736/X17457用于pTPI-ADH-FBA1trc,引物对X17458/X15476用于GPD2 3'侧链以产生图34中显示的装配件。用于产生图34中显示的装配件的引物的序列见于表15中。显示用于MA0280位点的基因分型和测序的PCR产物的琼脂糖凝胶图像示于图35中(泳道1:1KB 阶梯;泳道2:M3625(17413/15810);泳道3:M3625(17834/14554);泳道4:M3625(16291/15229);泳道5:M3625(16503/11317);泳道6: (16241/16946);泳道7:1KB阶梯)。
表15.用于产生MA0289整合位点的引物
引物 序列 SEQ ID NO
X15473 Agtcatcaggatcgtaggagataagc 142
X17460 agaagataatatttttatataattatattaatcctaatcttcatgtagatctaattctt 143
X17459 cctttccttttccttcgctccccttccttatcaatggcagacgcaaagaagaaggaaga 144
X17289 gtccatgtaaaatgattgctccaatgattgaaagttacattgaaaatacagtaaatggt 145
X17290 tggtggaaccatttactgtattttcaatgtaactttcaatcattggagcaatcatttta 146
X13208 ccgaaatattccacggtttagaaaaaaatcggaggtttagacattggctcttcattgag 135
X13209 aagctcaatgaagagccaatgtctaaacctccgatttttttctaaaccgtggaatattt 136
X15735 catcttttaacttgaatttattctctagcctagtcttctaggcgggttatctactgat 147
X15736 agataacccgcctagaagactaggctagagaataaattcaagttaaaagatgatgttga 148
X17457 tgggggaaaaagaggcaacaggaaagatcagagctacttattcccttcgagattatatc 149
X17458 gttcctagatataatctcgaagggaataagtagctctgatctttcctgttgcctcttttt 150
X15476 Gtagatctgcccagaatgatgacgtt 151
为了测定M3625 MA0289位点的确切DNA序列,在5个独立的 PCR反应中从M3625菌株的基因组DNA扩增区域CA-CF。纯化所有PCR产物,在Dartmouth College的测序设施中通过Sanger法进行测序。
表16.用于MA0289基因分型的引物和基因分型结果的概述
泳道 模板DNA 引物 预期的尺寸(bp) 观察到的正确尺寸
1 1KB阶梯 N/A N/A N/A
2 M3625 16939/16940 2477
3 M3625 16807/14567 3831
4 M3625 17834/14557 2478
5 M3625 16640/14552 3978
6 M3625 17586/16806 4789
7 1KB阶梯 N/A N/A N/A
表17.用于MA0289的基因分型的引物的序列
引物 序列 SEQ ID NO
16939 Atgctgatgcatgtccacaaag 164
16940 Ccttatcagtcaattgaggaaag 165
16807 Gcgatgagctaatcctgagccat 166
14567 Tggttccaccattattatgttggt 167
17834 Gctgcttcgaggtattgaca 168
14557 Ctaaaccgtggaatatttcggatat 169
16640 Cctcatcagctctggaacaacga 170
14552 Gatccgagcttccactaggatagc 171
17586 Gcagtatgcaagtctcatgctg 172
16806 Gaacttgcaggcaccgatcttca 173
MA0317的基因分型和测序
为了确认MA0317在FCY1位点被插入,从M3625基因组DNA 扩增PCR产物。引物和预期的基因分型结果列表表19中。用于 MA0317的基因分型的引物的序列列于表20中。描述MA0317整合位点的分子图谱示于图36中。该分子图谱描述用于用MA0317替代 FCY1基因的侧翼的位置和用于基因分型的位置或引物。参见图36 (M3625的MA0371位点的图谱上的特征描述;FCY1 5'侧翼–酿酒酵母FCY1上游侧翼区;ENO1p-酿酒酵母ENO1基因启动子;AE9–扣囊复膜酵母菌glu 0111编码基因;ENO1t-酿酒酵母ENO1基因终止子; PDC1t-酿酒酵母PDC1终止子;ADH1p-酿酒酵母ADH1基因启动子; FCY1 3'侧翼-酿酒酵母FCY1下游侧翼区;区域FA-FE,扩增的和已测序的染色体DNA区域)。引物对X18868/X18844用于FCY 5'侧翼,引物对X18845/X15464用于pENO-AE9-ENO1t,引物对 X15465/X11750用于pADH1-AE9-PDC1t,引物对X15479/X18869用于FCY 3'侧翼以产生图36中显示的装配件。用于产生图36中显示的装配件的引物的序列见于表18。显示用于确定基因型的PCR产物的琼脂糖凝胶图像示于图37中(泳道1:1KB阶梯;泳道2:M3625 (13092/17586);泳道3:M3625(10871/14554);泳道4:M3625 (16291/17887);泳道5:M3625(16640/16509);泳道6:M3625 (13246/13095);泳道7:1KB阶梯)。
表18.用于产生MA0317整合位点的引物
引物 序列 SEQ ID NO
X18868 Gccaaagtggattctcctactcaagctttgc 184
X18844 tcggatcagtagataacccgcctagaagactagtagctatgaaatttttaactctttaa 185
X18845 agccagcttaaagagttaaaaatttcatagctactagtcttctaggcgggttatctact 186
X15464 gtccatgtaaaatgattgctccaatgattgaaagaggtttagacattggctcttcattg 187
X15465 ctaagctcaatgaagagccaatgtctaaacctctttcaatcattggagcaatcatttta 188
X11750 ataaaattaaatacgtaaatacagcgtgctgcgtgctcgatttttttctaaaccgtgga 189
X15479 Agcacgcagcacgctgtatttacgta 190
X18869 Agatcctgtggtagtgctgtctgaacagaa 191
为了测定M3625 MA0317位点的确切的DNA序列,在5个独立的PCR反应中从M3625菌株的基因组DNA扩增区域FA-FE。纯化全部PCR产物,在Dartmouth College的测序设施中通过Sanger法进行测序。
表19.用于MA0317基因分型的引物和基因分型的结果的概述
泳道 模板DNA 引物 预期的大小(bp) 观察到的正确尺寸
1 1KB阶梯 N/A N/A N/A
2 M3625 13092/17586 2368
3 M3625 10871/14554 2966
4 M3625 16291/17887 2778
5 M3625 16640/16509 1334
6 M3625 13246/13095 2863
7 1KB阶梯 N/A N/A N/A
表20.用于MA0317的基因分型的引物的序列
引物 序列 SEQ ID NO
13092 Ccacaccatagacttcagccttcttag 174
17586 Gcagtatgcaagtctcatgctg 175
10871 Cgttcgctgtagcatacttagctat 176
14554 Ggctcttcattgagcttagaaccc 177
16291 Aactggaccgatcttattcgt 178
17887 Actgcctcattgatggtggta 179
16640 Cctcatcagctctggaacaacga 180
16509 Gtatgattgcggttatctgtcgc 181
13246 Cctatggatgttgtaccatgcc 182
13095 Ccaatatcttgcagtccatcctcgtcgc 183
图38显示淀粉测定的结果,显示了M3625中的淀粉降解活性。如共同未决的国际申请号PCT/US2011/039192(通过引用整体并入本文)中所述进行测定。
Western印迹蛋白质检测:
抗-PflA、抗-PflB、抗-GA(AE9)和抗-AdhE抗体:
为了检测许多工程化进入酵母菌株的酶的存在和帮助表征所述酶,在LampireBiological Products,Pipersville,PA在兔中产生抗与工程化蛋白质具有序列相似性的合成肽的多克隆抗体。表11描述了用作兔的免疫原的肽:
表21.用于抗体产生的免疫原
蛋白质 免疫原 SEQ ID NO
Sf GA(AE9) 完整的纯化的蛋白质 106
DNKNRYKINGNYKAGC
NSGKKHIVESPQLSSRGGC
CDHIDDNGQLTEEINRYTG
Ba pflA CQNPDTWKMRDGKPVYYE 107
GLTSSEENVENVAKIC
Ba pflB WEGFTEGNWQKDIDVRDC 108
KQRDKDSIPYRNDFTECPEC
CNTITPDGLGRDEEEERIGN
Ba AdhE DAKKKEEPTKPTPEEKLC 109
CKNLGVNPGKTPEEGVEN
CGSYGGNSVSGVNQAVN
对于所有合成肽,添加末端Cys以进行缀合。将肽和纯化的GA 蛋白缀合至KLH,随后注射进入兔。将50天的方案用于抗体产生,使用ELISA监测针对免疫原的各种取血。在于Western印迹中测试这些针对来自工程化酵母菌株的裂解物的多克隆抗体后,使用蛋白G柱纯化来自阳性免的血清。将纯化的抗体透析进入PBS,通过在280 nm的吸光度测定浓度,将抗体用于进一步评价菌株。在利用 SDS-PAGE评价后,抗体的纯度显示大于90%。
针对合成肽产生的抗体用于细胞提取物和培养上清液中的每一种工程化蛋白质的Western印迹检测,如下文中描述的。
菌株生长条件:
将细胞从冷藏原液涂板在YPD(20g/L蛋白胨,10g/L酵母提取物, 20g/L葡萄糖)琼脂上进行48小时,用于在50mL培养管中接种于25mL YPD(20g/L蛋白胨,10g/L酵母提取物,20g/L葡萄糖)中。在以250rpm 振荡的条件下,将细胞在35℃需氧生长8小时,随后取出1mL以接种装有含有7mg/L麦角固醇、289mg/L乙醇和544mg/L Tween 80的 50mL YPD(20g/L蛋白胨,10g/L酵母提取物,20g/L葡萄糖)的密封的CO2吹扫的血清瓶。随后在以250rpm振荡的条件下在35℃将这些培养物缺氧生长过夜(~16h)。通过离心收获细胞,用25mL去离子水洗涤。将所得的湿细胞沉淀用于PflA、PflB和AdhE的Western印迹检测。
将用于接种血清瓶的需氧培养物返回摇动培养箱中温育另外40 小时。在温育结束时,通过离心沉淀细胞,回收上清液,使用10kDa 分子量截留值(MWCO)的滤膜浓缩约10倍。将所得的浓缩物用于细胞外AE9葡糖淀粉酶的Western印迹检测。
细胞裂解和样品制备:
为了进行PflB和AdhE的Western印迹,通过在珠粒破碎机中用 0.5mm的直径的珠粒进行机械破碎和以4800rpm搅拌来匀浆细胞。将 100μL湿细胞添加至100mM磷酸钠缓冲液pH 7.4中的含有1mM苯甲磺酰基氟化物(PMSF)、2mM二硫苏糖醇(DTT)和1%二甲基亚砜(DMSO)的匀浆缓冲液。搅拌细胞,进行6个循环,每个循环10秒,在循环之间于冰上冷却。通过离心沉淀细胞碎片,回收上清液。将15μL 所得的上清液添加至15μL含有50mM DTT的2X浓缩的SDS-PAGE 样品缓冲液,随后加载至4-20%Tris-甘氨酸SDS-PAGE凝胶上。
为了进行PflA的Western印迹检测,通过将40μL湿细胞添加至 40μL含有50mM DTT的2X浓缩的SDS-PAGE样品缓冲液来裂解细胞。随后将混合物在室温温育30分钟,随后在100℃加热2分钟。通过离心沉淀细胞,将30μL的上清液装载至4-20%Tris-甘油 SDS-PAGE凝胶上。
为了进行AE9分析,将15μL的浓缩的需氧性培养上清液添加至 15μL含有50mM DTT的2X浓缩的SDS-PAGE样品缓冲液,随后加载至4-20%Tris-甘油SDS-PAGE凝胶。
在凝胶电脉后,将蛋白质转移至聚偏氟乙烯(PVDF)膜,随后用含有按重量体积比(w/v)2%的牛血清白蛋白(BSA)的Tris缓冲盐溶液 (TBS;10mM Tris,150mM氯化钠pH 7.5)封闭过夜。随后除去封闭溶液,将第一肽抗体于含有Tween 20的Tris缓冲盐溶液(TBST;含有 0.1%v/v Tween 20的TBS)中稀释至约2μg/mL,随后添加至每一张膜。在1小时的温育后,弃去第一抗体,将膜在10mM Tris,500mM氯化钠,0.1%Tween 20pH 7.5(THST)中洗涤3次,每次5分钟。将第二抗体,具有辣根过氧化物酶标记的山羊抗-兔抗体,以1:7500稀释于TBST中,随后添加至印迹,温育1小时。随后弃去第二抗体,再次用THST洗涤3次,每次5分钟。随后弃去洗涤溶液,添加增强化学发光(ECL)底物,使用凝胶成像照相机通过一系列复合曝光来读取印迹。
如图39中显示的,对于抗-PflA、PflB和AdhE第一抗体,在每一个实验菌株中检测到具有大致正确的分子量的条带,然而在背景对照菌株(M2390)中未检测到条带。对于抗-AE9,在工程化以表达蛋白质的菌株(M3625和M3680)中检测到条带,但在其它菌株中未检测到条带。参见图39。对于PflB似乎存在2个不同的条带,这可表明因需氧性细胞裂解条件而产生的蛋白质的含氧切割。
丙酮酸甲酸裂解酶活性测定:
丙酮酸甲酸裂解酶(PflB)在氧不存在的情况下被Pfl激活酶(PflA) 激活并且催化丙酮酸与CoA至甲酸和乙酰-CoA的反应。当将提取物添加至包含丙酮酸、CoA和DTT的反应混合物时,通过测量甲酸的产量来测量细胞提取物中的PflB的活性。
菌株生长条件:
将细胞从冷藏原液涂板在YPD(20g/L蛋白胨,10g/L酵母提取物, 20g/L葡萄糖)琼脂上进行48小时,用于在50mL培养管中接种25mL YPD(20g/L蛋白胨、10g/L酵母提取物、20g/L葡萄糖)。在以250rpm 振荡的条件下在35℃需氧地生长细胞8小时,随后取出1mL来接种装有含有7mg/L麦角固醇、289mg/L乙醇和544mg/L Tween 80的 50mL YPD(20g/L蛋白胨,10g/L酵母提取物,20g/L葡萄糖)的密封的 CO2吹扫的血清瓶中。随后在以250rpm振荡的条件下,在35℃将这些培养物厌氧生长过夜(~16h)。通过离心收获细胞,在厌氧培养室中用25mL去离子水进行洗涤。
细胞裂解和样品制备:
通过在珠粒破碎机中用0.5mm的直径的珠粒进行机械破碎和以 4800rpm搅拌来在厌氧培养室中匀浆细胞。将100μL湿细胞添加至 100mM磷酸钠缓冲液pH 7.4中的含有1mMPMSF、2mM DTT和1% DMSO的匀浆缓冲液。搅拌细胞,进行6个循环,每个循环10秒,在循环之间于冰上冷却。通过以14,100x g离心10分钟沉淀细胞碎片,回收上清液,通过0.22μm的滤膜进行澄清。将所得提取物直接用于活性测定。
Pfl活性测定:
2X浓缩的测定底物混合物由20mM丙酮酸钠、0.11mM CoA和 20mM DTT组成。称取试剂重量,将其带入厌氧培养室,添加至10mL 的100mM磷酸钠缓冲液pH 7.4,所述缓冲液已充分脱气。将100μL 细胞提取物添加至100μL浓缩的测定混合物中,在环境温度(~29℃) 温育30分钟。随后从厌氧培养室取出样品,在100℃于加热块中加热 90秒,随后在冰上冷却以沉淀蛋白质。通过以15,000x g离心10分钟除去沉淀。使用可获自Megazyme InternationalIreland,Bray,Co. Wicklow,Ireland的甲酸测定试剂盒来分析所得上清液的甲酸浓度。
将剩余细胞提取物以1:8稀释于100mM磷酸钠缓冲液pH 7.4,使用BCA总蛋白测定法测定总的蛋白质含量。将Pfl测定样品的甲酸浓度针对样品的总蛋白浓度进行标准化。
如图40中显示的,具有工程化的Pfl活性的实验菌株(M3465, M3625,M3679和M3680)在与反应混合物温育后,显示比背景对照菌株(M2390)显著更高量的甲酸存在。
醇脱氢酶E(AdhE)酶促活性测定
AdhE是通过乙醛作为中间产物催化从乙酰-CoA形成乙醇的细胞内双功能酶。这通过一系列乙醛脱氢酶活性和醇脱氢酶活性作用来实现。酿酒酵母菌株具有天然醇脱氢酶(Adh)活性;这些活性测定的意图是显示Adh活性被工程化菌株保留,并且存在另外的乙醛脱氢酶活性(来自AdhE)。
醇脱氢酶活性:
如上所述,青春双岐杆菌双功能醇脱氢酶(AdhE)具有2个主要功能。一个功能是将乙醛转化成乙醇。该可逆反应利用NADH作为辅因子。为了评价该酶的存在和确保其具有期望的活性,开发了一种测定法来评价其中将乙醇转化成乙醛的逆反应。参见图49。反应速率通过在340nm的NADH吸光度来监测。
菌株生长条件:
将细胞从冷藏原液涂点在YPD(20g/L蛋白胨,10g/L酵母提取物, 20g/L葡萄糖)琼脂板上,在35℃温育过夜。从该板接种具有25mL YPD(20g/L蛋白胨,10g/L酵母提取物,20g/L葡萄糖)的50mL振动沉管,在35℃,250rpm温育过夜。在4℃以5000rpm离心培养物5 分钟,用去离子(DI)水洗涤,随后在4℃以5000rpm离心5分钟,用DI水第二次洗涤,在4℃以5000rpm离心5分钟,随后将其置于冰上。
细胞裂解和样品制备:
将100μL湿细胞沉淀用移液器转移至具有500μL 100mM Na2PO4,2.5mM MgCl2,0.5mM CaCl2 pH 7.4缓冲液和6μL 100mM 苯甲磺酰基氟化物(PMSF)的Zymo ResearchBashingBead 0.5mm管中。使用MP FastPrep-24(设置至以4.0m/s运行10秒,进行3次,在每一次运行之间于冰上冷却10秒)通过机械破碎来裂解细胞。重复该过程3次,每一次运行之间在冰上冷冻1分钟。随后使用Eppendorf 离心机5424以15,000rpm离心每一个管10分钟。取出上清液,将其转移至2mL管。将1μL的New England Biolabs DNAse I添加至每一个管。将管颠倒,置于设置在37℃的培养箱中进行30分钟。从培养箱取出管,将样品转移至0.22μm过滤离心管,将管以10,000rpm离心2分钟。拉出50μL的样品,将其在单独的样品管中用450μL 100mM Na2PO4 pH 7.4稀释,随后置于冰上。
醇脱氢酶活性测定:
用于测定AdhE的醇脱氢酶活性的测定改造自Vallee,B.L.和 Hoch,F.L.的方法,Proc Natl Acad Sci USA(1955)41(6):327–338。将 100μL 0.1M Na4P2O7 pH 9.6缓冲液、32μL 2M乙醇和1.66μL 0.025M NAD+添加至96孔板的每一个孔。在将裂解物添加至反应混合物后,反应的总体积等于153.66μL,产生65mM Na4P2O7 pH 9.6缓冲液、 416.5mM乙醇和0.27mM NAD+的终浓度。为了开始反应,将20μL 1:10 稀释的裂解物用移液器转移至每一个孔中,观察340nm处的吸光度,使用Spectramax M2和Softmax软件记录1.7分钟。以一式两份进行每一个样品以确保重现性。将Thermo Scientific’s BCA Protein Assay 试剂盒用于测量来自产生的裂解物的总蛋白质浓度。该数据用于在分析过程中标准化从实际反应产生的数据。
表22.醇脱氢酶活性测定的数据
工程化的菌株的醇脱氢酶活性。p-值基于单尾T检验。
背景菌株M2390在本测定中表现如所预期的。虽然其不具有工程化进入其基因组的AdhE,但其仍然表达野生型醇脱氢酶,从而在醇脱氢酶测定中具有活性。其它具有工程化进入它们的基因组的AdhE 的菌株应当已表达双功能酶,并且鉴于总蛋白质的浓度在用于测定的每一个样品中是相等的,应当更具活性。由于p值小于0.05,因此 M3625显示统计上显著的比背景菌株更高的活性。然而,其它菌株具有大于0.05的p值,表明即使存在活性的增加(如通过超过背景活性的变化%所显示的)它们也在背景菌株的误差内。参见表22。在标准化蛋白质浓度后,数据的图解表示法显示每一个菌株在1.7分钟的反应期中比背景菌株M2390更具活性。图41显示以在1.7分钟的反应中,以μmol NADH/mg的总蛋白质对时间绘制的每一个菌株的活性。
基于这些结果,该测定显示了所有菌株的醇脱氢酶活性。然而, M2390相较于其它菌株活性较低,并且NAD+至NADH的转化更慢,从而表明工程化AdhE存在于每一个菌株中,并且其显示出适当地发挥作用。
乙醛脱氢酶活性:
AdhE的第二活性是将乙醛转化成乙酰辅酶A的可逆反应。该活性对于酿酒酵母菌株不是天然的,并且应当仅存在于工程化菌株中。为了评价该酶的存在和确保其具有期望的活性,开发了一种测定法来测量通过AdhE进行的乙醛至乙酰CoA的转化。通过340nm处的NADH吸光度来监测反应速率。反应的图解提供于图50中。
菌株生长条件:
将菌株从冷藏原液涂点在YPD(20g/L蛋白胨,10g/L酵母提取物, 20g/L葡萄糖)琼脂板上,在35℃温育过夜。从该板接种具有25mL YPD(20g/L蛋白胨,10g/L酵母提取物,20g/L葡萄糖)的50mL振动沉管,在35℃,250rpm温育过夜。在4℃以5000rpm离心培养物5 分钟,用DI水洗涤,随后在4℃以5000rpm离心5分钟,用DI水第二次洗涤,在4℃以5000rpm离心5分钟,随后将其置于冰上。
细胞裂解和样品制备:
将100μL湿细胞沉淀用移液器转移至具有500μL 100mM Na2PO4、2.5mM MgCl2、0.5mM CaCl2 pH 7.4缓冲液和6μL 100mM 苯甲磺酰基氟化物(PMSF)的Zymo ResearchBashingBead 0.5mm管中。使用MP FastPrep-24(设置至以4.0m/s运行10秒,进行3次,在每一次运行之间于冰上冷却10秒)通过机械破碎来裂解细胞。重复该过程3次,每一次运行之间在冰上冷冻1分钟。随后使用Eppendorf 离心机5424以15,000rpm离心每一个管10分钟。取出上清液,将其转移至2mL管。将1μL的New England Biolabs DNAse I添加至每一个管。将管颠倒,置于设置在37℃的培养箱中进行30分钟。从培养箱取出管,将样品转移至0.22μm过滤离心管,随后使用Eppendorf离心机5424将管以10,000rpm离心2分钟。拉出50μL的样品,将其在单独的样品管中用450μL 100mM Na2PO4 pH 7.4稀释,随后置于冰上。
乙醛脱氢酶活性测定:
将800μL 50mM Na4P2O7 pH 9.6、50μL 0.025M NAD+、50μL 1M 乙醛和50μL 1:10稀释的裂解物添加至Plastibrand micro UV-比色杯中。将比色杯置于设置至在340nm读取吸光度的Shimadzu UV-1700 中。将50μL的2mM CoA利用移液器转移进入比色杯,随后通过轻轻地吸打比色杯中的内容物来混合,监测吸光度,进行5分钟。所得的每一个试剂的终浓度为40mM Na4P2O7 pH 9.6、1.25mM NAD+、 50mM乙醛和0.1mM CoA。以一式二份进行每一个样品以确保重现性。将Thermo Scientific’s BCA Protein Assay试剂盒用于测量来自产生的裂解物的总蛋白质浓度。将该数据用于在分析过程中标准化从实际反应产生的数据。
醇脱氢酶(乙醛脱氢酶活性)测定的数据示于表23中。注意,用于该测定的裂解物是用于先前部分详述的醇脱氢酶测定的相同裂解物。
表23.乙醛脱氢酶活性
乙醛脱氢酶活性。p值基于单尾T检验。
背景菌株M2390在本测定中表现如所预期的。野生型菌株应当不具有乙醛脱氢酶活性,如通过本测定显示的。具有工程化进入它们的基因组的AdhE的其它菌株应当表达蛋白质并且具有乙醛脱氢酶活性。在全部工程化菌株(M3465、M3625、M3679和M3680)中观察到该活性,活性的误差最小并且p值小于0.05。
甲酸脱氢酶活性
在菌株M3465、M3625、M3679和M3680中,将甲酸脱氢酶从基因组敲除以期平衡与所经历的不同工程化步骤的氧化还原。背景菌株M2390应当具有基因完整性。为了确保天然酿酒酵母甲酸脱氢酶基因被除去,开发了酶促测定。甲酸脱氢酶在消耗NAD+的情况下催化甲酸至二氧化碳的转化。
酶促活性可通过测量340nm处的NADH形成来进行监测。
菌株生长条件:
将M2390、M3465、M3625、M3679和M3680从冷藏原液涂点在 YPD(20g/L蛋白胨,10g/L酵母提取物,20g/L葡萄糖)琼脂板上,在 35℃温育过夜。从该板接种具有25mL YPD+24mM甲酸钠的50mL 振动管,在35℃,250rpm温育过夜(20g/L蛋白胨,10g/L酵母提取物, 20g/L葡萄糖)。在4℃以5000rpm离心培养物5分钟,用DI水洗涤,随后在4℃以5000rpm离心5分钟,用DI水第二次洗涤,在4℃以 5000rpm离心5分钟,随后将其置于冰上。
细胞裂解和样品制备:
将100μL湿细胞沉淀用移液器转移至具有500μL 100mM Na2PO4、2.5mM MgCl2、0.5mM CaCl2 pH 7.4缓冲液和6μL 100mM 苯甲磺酰基氟化物(PMSF)的Zymo ResearchBashingBead 0.5mm管中。使用MP FastPrep-24(设置至以4.0m/s运行10秒,进行3次,在每一次运行之间于冰上冷却10秒)通过机械破碎来裂解细胞。重复该过程3次,每一次运行之间在冰上冷冻1分钟。随后使用Eppendorf 离心机5424以15,000rpm离心每一个管10分钟。取出上清液,将其转移至2mL管。将1μL的New England Biolabs DNAse I添加至每一个管。将管颠倒,置于设置在37℃的培养箱中进行30分钟。从培养箱取出管,将样品转移至0.22μm过滤离心管,随后使用Eppendorf离心机5424将管以10,000rpm离心2分钟。
甲酸脱氢酶活性测定:
将800μL 62.5mM K2PO4 pH 7.0、50μL 40mM NAD+和50uL 1M 甲酸钠添加至Plastibrand micro UV-比色杯中。将比色杯置于设置至读取340nm处的吸光度和空白的Shimadzu UV-1700中。将100μL的未稀释的裂解物样品利用移液器转移进入比色杯,随后通过轻轻地吸打比色杯中的内容物来混合,监测吸光度,进行2.5分钟。所得的每一个试剂的终浓度为50mM磷酸钾、2mM NAD+和0.05M甲酸钠。以一式二份进行每一个样品以确保重现性。
表24.工程化菌株的Fdh活性
如表24中显示的,FDH敲除菌株(M3465、M3625、M3679和 M3680)不显示任何甲酸脱氢酶活性。背景菌株M2390具有最小活性。过表达FDH的正对照菌株M3631具有活性,并且产生被观察到和记录的显著量的NADH。
AE9葡糖淀粉酶活性测定:
扣囊复膜孢酵母GLU1葡糖淀粉酶(AE9)从淀粉产生葡萄糖。
在粗制玉米淀粉上测定细胞外AE9葡糖淀粉酶活性以确定葡糖淀粉酶活性在工程化菌株的需氧性培养物上清液中的存在。将细胞进行需氧性培养,通过离心除去,测定所得的上清液的活性,将其与来自不包含AE9的菌株M2390的上清液相比较。
细胞生长条件:
将细胞涂板在YPD(20g/L蛋白胨,10g/L酵母提取物,20g/L葡萄糖)琼脂上进行48小时,用于在50mL培养管中接种25mL YPD(20g/L 蛋白胨,10g/L酵母提取物,20g/L葡萄糖)。在以250rpm振荡的条件下在35℃需氧培养细胞48小时。48小时后,通过离心除去细胞,回收上清液。
样品制备:
通过经过0.22μm滤膜的过滤澄清回收的需氧培养物上清液,使用10kDa分子量截留值滤器浓缩约10倍。随后使用纯化的AE9作为标准,通过苯基反相(苯基-RP)HPLC法分析保留的浓缩物的AE9浓度。将样品稀释至50μg/mL的AE9浓度,并直接用于活性测定。
葡糖淀粉酶活性测定:
在50mM醋酸钠缓冲液pH 5.0中制备2.2%(重量比体积)玉米淀粉溶液。在96孔测定板中,将50μL的上清液(调整至50μg/mL的AE9 浓度)添加至450μL 2.2%淀粉。在不振荡的条件下将板在室温温育,在第1、2、5、10、30、120和210分钟取出50μL的样品。在初始酶添加后,以及在每一次取样后利用移液器抽吸以混合孔。通过测定还原糖的3,5-二硝基水杨酸(DNS)法分析样品。
如图42中所示,M3625和M3680的需氧性培养物上清液显示出相似的对粗制玉米淀粉的活性,如通过DNS分析(Somogyi,M.,Notes on Sugar Determination,JBC(200)45(1952))测量的。M2390上清液的淀粉分解活性在本测定中是可忽略的。
上述数据显示pflA、pflB和AdhE存在于菌株M3625中,并且具有恰当的活性。背景菌株以及正对照(当fdh过表达时)中看到的 Fdh活性不存在于工程化菌株中,这表明该基因被成功敲除。
实施例9
下列实施例显示酿酒酵母菌株M3624的乙醇产率。菌株M3624 的基因型为:Δgpd1::GPD2-青春双岐杆菌 pflA/pFlB/adhEΔgpd2::GPD1-青春双岐杆菌pflA/pflB/adhEΔfdh1 Δfdh2::青春双岐杆菌pflA/pflB/adhE。按照上文实施例8中中使用的相同方法产生菌株M3624。菌株M3624的详细分子图谱示于图43A-D 中。图43A显示了在GPD1基因座上的插入;从GPD1启动子表达的GPD2;PFK2t-PFK2终止子;HXT2t-HXT2终止子;pADH1-ADH1 启动子;PDC1 term-PDC1终止子;FBA1 term-FBA1终止子; pTPI1-TPI1启动子;Scer ENO1 ter-ENO1终止子。图43B显示了 GPD2基因座上的插入;从GPD2启动子表达的GPD1;TDH3 term-TDH3终止子;pPFK1-PFK1启动子;HXT2t-HXT2终止子; PDC1 term-PDC1终止子;pADH1-ADH1启动子;S.cer ENO1 ter-ENO1终止子;FBA1 term-FBA1终止子;pTPI1-TPI1启动子。图43C显示了FDH1基因的缺失;产生FDH1的缺失的侧翼区域。图 43D显示了FDH2基因座上的插入;pPFK1-PFK1启动子,S.cer ENO1 ter-ENO1终止子;pADH1-ADh1启动子;FBA1 term-FBA1终止子; PDC1 term-PDC1终止子;pTPI-TPI1启动子。
图44中显示的数据显示3.4%的乙醇产率增加是通过甘油的减少和甲酸的产生获得的。M2390是对照菌株,M3515和M3624被工程化为具有基因型Δgpd1::GPD2-青春双岐杆菌pflA/pflB/adhE Δgpd2::GPD1-青春双岐杆菌pflA/PFlB/adhE fdh1Δfdh2Δ::青春双岐杆菌pflA/pflB/adhE。M3027被工程化为具有基因型Δgpd1Δgpd2::GPD1- 青春双岐杆菌pflA/PFlB/adhE fdh1Δfdh2Δ::青春双岐杆菌 pflA/pflB/adhE.。图框A显示甲酸的浓度的测量,图框B显示甘油浓度的测量,图框C显示乙醇浓度的测量。
已在4个单独的基因座上对M3515和M3624进行了工程化。 GPD1基因从GPD2启动子表达,GPD2基因从GPD1启动子表达, FDH1和FDH2基因已被删除。此外,如图43A、B和D中所示,表达青春双歧杆菌pflA、pflB和adhE基因。
实施例10
下列实施例显示酿酒酵母菌株M3465和M3469的乙醇产率。菌株M3465的基因型为:Δgpd2::青春双岐杆菌pflA/pflB/adhEΔfdh1Δ fdh2::青春双岐杆菌pflA/pflB/adhE。菌株M3469的基因型为:Δgpd1:: 青春双岐杆菌pflA/pflB/adhE fdh1Δfdh2Δ::青春双岐杆菌 pflA/pflB/adhE。按照上文实施例8中使用的相同方法产生菌株M3465 和M3469。菌株M3465和M3469的详细分子图谱分别示于图45A-C 和46A-C。图45A显示GPD2基因座上的插入;pPFK1-PFK1启动子;HXT2t-HXT2终止子;PDC1 term-PDC1终止子;pADH1-ADH1 启动子;S.cer ENO1 ter-ENO1终止子;FBA1 term-FBA1终止子; pTPI1-TPI1启动子。图45B显示FDH1基因的缺失;产生FDH1的缺失的侧翼区域。图45C显示FDH2基因座上的插入;pPFK1-PFK1 启动子;S.cer ENO1 ter-ENO1终止子;pADH1-ADh1启动子;FBA1 term-FBA1终止子;PDC1 term-PDC1终止子;pTPI-TPI1启动子。图46A显示GPD1基因座上的插入;pPFK1-PFK1启动子; HXT2t-HXT2终止子;PDC1 term-PDC1终止子;pADH1-ADH1启动子;S.cer ENO1 ter-ENO1终止子;FBA1 term-FBA1终止子; pTPI1-TPI1启动子。图46B显示FDH1基因的缺失;产生FDH1的缺失的侧翼区域。图46C显示FDH2基因座上的插入;pPFK1-PFK1 启动子,S.cerENO1 ter-ENO1终止子;pADH1-ADh1启动子;FBA1 term-FBA1终止子;PDC1 term-PDC1终止子;pTPI-TPI1启动子。
该实施例显示乙醇产率的增加取决于甘油减少的水平。利用 M3465(其包含GPD2、FDH1和FDH2基因的缺失和青春双岐杆菌 pflA、pflB和adhE基因从GPD2和FDH2基因座的表达)进行的30%的固体玉米糖化醪的发酵导致1.5%的乙醇滴度的增加。如图47中所示,利用M3469(其包含GPD1、FDH1和FDH2基因的缺失和青春双岐杆菌pflA、pflB和adhE基因从GPD1和FDH2基因座的表达) 进行的30%的固体玉米糖化醪的发酵导致2.5%的乙醇滴度的增加。 M2390是对照亲本菌株。如图48中显示的,利用M3465和M3469 的玉米糖化醪的发酵分别导致低~15%的甘油和低30%的甘油水平。图47和48中所示的M2390是对照菌株。
实施例11
减少甘油形成的替代方法是通过甘油3-磷酸磷酸酶(GPP)基因的缺失。酵母菌属包含两个拷贝的基因GPP1和GPP2。下面的数据显示青春双岐杆菌pflA、pflB和adhE在包含FDH1、FDH2和GPP1 或GPP2的缺失的背景中的表达导致减少的甘油形成(图53;菌株比较,min buff培养基,葡萄糖40g/L,厌氧发酵,35℃–72hr)和增加的乙醇产率(图54;菌株比较,min buff培养基,葡萄糖40g/L,厌氧发酵,35℃–72hr)。还观察到甲酸的产生。参见图55(菌株比较,min buff培养基,葡萄糖40g/L,厌氧发酵,35℃–72hr)。
经工程化以测量甘油形成、乙醇产率和甲酸产量的菌株是酿酒酵母菌株M3297、TB655和TB656。按照上文实施例8中使用的相同方法产生菌株M3297、TB655和TB656。菌株M3297的基因型是:Δfdh1Δfdh2::pflA/pflB/adhE。该菌株仅包含FDH基因的缺失+pflA、pflB和AdhE的表达。菌株TB655的基因型是:Δfdh1Δfdh2::pflA/pflB/adhEΔgpp1::pflA/pflB/adhE。该菌株包含FDH 基因的缺失、pflA、pflB和AdhE的表达和GPP1的缺失。参见图51。菌株TB656的基因型是:Δfdh1Δfdh2::pflA/pflB/adhEΔgpp2::pflA/pflB/adhE。该菌株包含FDH 基因的缺失、pflA、pflB和AdhE的表达和GPP1的缺失。参见图52。
使用上述方法测量由菌株TB655和TB656产生的乙醇、甘油和甲酸的量。相较于对照菌株M3297,菌株TB655和TB656显示统计上显著的产生的乙醇、甘油和甲酸的量的变化。相对于菌株M3297,菌株TB655(gpp1突变体)显示1.3%的乙醇滴度的增加,10%的甘油的减少和100%的产生的甲酸的增加,而菌株TB656(gpp2突变体)显示0.95%的乙醇滴度的增加,6.1%的甘油形成的减少和100%的产生的甲酸的增加。这些结果显示GPP突变与代谢工程方案的新型组合在厌氧生长过程中平衡氧化还原。
通过引用并入
本文中引用的全部美国专利和美国公布的专利申请通过引用并入本文。
等同物
本领域技术人员将认识到,或能够仅使用常规实验确定本文中描述的本发明的特定实施方案的许多等同物。此类等同物期望被包括在下列权利要求中。
本说明书还包括下列内容:
1.一种重组微生物,其包含:
(a)一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失;和
(b)在一个或多个工程化代谢途径中用于将碳水化合物源转化成乙醇的一种或多种天然和/或异源酶,其中所述一种或多种天然和/ 或异源酶被激活、上调或下调。
2.实施方式1的重组微生物,其中所述重组微生物产生比不具有所述一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的对照重组微生物更少的甘油。
3.实施方式1或2的重组微生物,其中所述碳水化合物源是生物质。
4.实施方式1-3的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸、gpd2多核苷酸或gpd1多核苷酸和gpd2多核苷酸编码。
5.实施方式4的重组微生物,其还包含有效地连接于天然gpd2 启动子多核苷酸的天然和/或异源gpd1多核苷酸。
6.实施方式1-3的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpp1多核苷酸、gpp2多核苷酸或gpp1多核苷酸和gpp2多核苷酸编码。
7.实施方式1-6的任一项的重组微生物,其中所述一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码。
8.实施方式1-7的任一项的重组微生物,其中所述工程化代谢途径之一包含丙酮酸至乙酰-CoA和甲酸的转化。
9.实施方式1-8的任一项的重组微生物,其中所述工程化代谢途径之一包括包括乙酰-CoA至乙醇的转化。
10.实施方式1-9的任一项的重组微生物,其还包含一种或多种由fdh1多核苷酸、fdh2多核苷酸或fdh1多核苷酸和fdh2多核苷酸编码的天然酶的缺失。
11.实施方式1-10的任一项的重组微生物,其中所述微生物产生乙醇。
12.实施方式1-11的任一项的重组微生物,其中所述微生物产生甲酸。
13.实施方式1-12的任一项的重组微生物,其中所述微生物选自酿酒酵母、乳酸克鲁维酵母、马克思克鲁维酵母、巴斯德毕赤酵母、解脂耶罗维亚酵母、多形汉森酵母、红发夫酵母、实用假丝酵母、Arxula adeninivorans、树干毕赤酵母、汉逊德巴利酵母、多型德巴利酵母、粟酒裂殖酵母、白色念珠菌和西方许旺酵母。
14.实施方式13的重组微生物,其中所述微生物是酿酒酵母。
15.实施方式8-14的任一项的重组微生物,其中所述丙酮酸被丙酮酸甲酸裂解酶(PFL)转化成乙酰-CoA和甲酸。
16.实施方式15的重组微生物,其中所述PFL具有原核或真核生物来源。
17.实施方式16的重组微生物,其中所述PFL来自双歧杆菌属、埃希氏菌属、好热厌氧杆菌属、梭菌属、链球菌属、乳杆菌属、衣藻属、单鞭毛菌、新丽鞭毛菌属或芽孢杆菌属中的一种或多种。
18.实施方式16的重组微生物,其中所述PFL来自地衣芽胞杆菌、嗜热链球菌、胚芽乳杆菌、干酪乳杆菌、青春双岐杆菌、解纤维素梭菌、大肠杆菌、莱茵衣藻PflA、单鞭毛菌属E2或新丽鞭毛菌的一种或多种。
19.实施方式15-18的任一项的重组微生物,其中所述PFL来自青春双岐杆菌。
20.实施方式9-19的任一项的重组微生物,其中所述乙酰-CoA 被乙醛脱氢酶转化成乙醛,并且其中所述乙醛被醇脱氢酶转化成乙醇。
21.实施方式9-19的任一项的重组微生物,其中所述乙酰-CoA 被双功能乙醛/醇脱氢酶转化成乙醇。
22.实施方式20或21的重组微生物,其中所述乙醛脱氢酶、醇脱氢酶或双功能乙醛/醇脱氢酶具有原核或真核生物来源。
23.实施方式20的重组微生物,其中所述乙醛脱氢酶来自C. phytofermentans。
24.实施方式21的重组微生物,其中所述双功能乙醛/醇脱氢酶来自埃希氏菌属、梭菌属、衣藻属、单鞭毛菌属或双歧杆菌属。
25.实施方式21的重组微生物,其中所述双功能乙醛/醇脱氢酶来自大肠杆菌、Clostridium phytofermentans、莱茵衣藻、单鞭毛菌属E2或青春双岐杆菌。
26.实施方式24或25的重组微生物,其中所述双功能乙醛/醇脱氢酶来自青春双岐杆菌或单鞭毛菌属E2。
27.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码,并且其中所述工程化代谢途径之一包括通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,以及所述工程化代谢途径之一包括通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含一种或多种由fdh1多核苷酸和fdh2多核苷酸编码的天然酶的缺失。
28.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpp1多核苷酸和gpp2多核苷酸编码,并且所述工程化代谢途径之一包括通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化。
29.实施方式28的重组微生物,其中所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
30.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰 -CoA和甲酸的转化。
31.实施方式30的重组微生物,其中所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
32.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码并且所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码,其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,以及所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含由fdh1 多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
33.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰 -CoA和甲酸的转化,以及所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
34.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,以及所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸。
35.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,以及所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷和由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
36.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码并且所述一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,以及所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸。
37.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码并且所述一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,以及所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸和由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
38.实施方式1-37的任一项的重组微生物,其中一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失使甘油形成减少:
(a)超过约10%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;
(b)超过约20%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;
(c)超过约30%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;
(d)超过约40%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;
(e)超过约50%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;
(f)超过约60%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;
(g)超过约70%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;
(h)超过约80%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;
(i)超过约90%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;
(j)超过约95%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油;或
(k)超过约99%的由不具有一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物产生的甘油。
39.实施方式1-38的任一项的重组微生物,其中所述重组微生物产生选自如下的量的甲酸:
(a)在24小时内至少约0.012g/L;
(b)在48小时内至少约0.022g/L;或
(c)在142小时内至少约2.5g/L。
40.实施方式1-39的任一项的重组微生物,其中所述重组微生物产生选自如下的甲酸产率:
(a)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约0.05倍的甲酸;
(b)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约0.1倍的甲酸;
(c)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约0.5倍的甲酸;
(d)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约1.0倍的甲酸;
(e)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约5.0倍的甲酸;
(f)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约10.0倍的甲酸;
(g)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约20.0倍的甲酸;
(h)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约30.0倍的甲酸;
(i)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约40.0倍的甲酸;
(j)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约50.0倍的甲酸;
(k)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约75.0倍的甲酸;或
(l)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约100倍的甲酸。
41.实施方式1-40的任一项的重组微生物,其中所述微生物产生选自如下的乙醇产率:
(a)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约1%的乙醇;
(b)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约2%的乙醇;
(c)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约3%的乙醇;
(d)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约4%的乙醇;
(e)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约5%的乙醇;
(f)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约10%的乙醇;
(g)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约20%的乙醇;
(h)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约30%的乙醇;
(i)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约40%的乙醇;
(j)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约50%的乙醇;
(k)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约60%的乙醇;
(l)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约70%的乙醇;
(m)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约80%的乙醇;
(n)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约90%的乙醇;
(o)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约95%的乙醇;或
(p)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物产生的多至少约99%的乙醇。
42.实施方式1-41的任一项的重组微生物,其中碳水化合物源至乙醇的转化是在缺氧条件下进行的。
43.实施方式1-42的任一项的重组微生物,其中所述重组微生物在缺氧条件下具有选自如下的乙酸摄取(g/L);
(a)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约1%的乙酸摄取;
(b)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约10%的乙酸摄取;
(c)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约20%的乙酸摄取;
(d)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约30%的乙酸摄取;
(e)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约40%的乙酸摄取;
(f)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约50%的乙酸摄取;
(g)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约60%的乙酸摄取;
(h)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约70%的乙酸摄取;
(i)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约80%的乙酸摄取;和
(j)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物摄取的多至少约90%的乙酸摄取。
44.实施方式1-43的任一项的重组微生物,其中所述重组微生物以相较于无一种或多种用于产生甘油和/或调节甘油合成的天然酶的缺失的重组微生物更低的葡萄糖利用率产生更多的乙醇,其中所述葡萄糖利用率选自:
(a)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约1%的每小时使用的葡萄糖;
(b)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约5%的每小时使用的葡萄糖;
(c)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约10%的每小时使用的葡萄糖;
(d)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约20%的每小时使用的葡萄糖;
(e)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约30%的每小时使用的葡萄糖;
(f)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约40%的每小时使用的葡萄糖;
(g)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约50%的每小时使用的葡萄糖;
(h)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约60%的每小时使用的葡萄糖;
(i)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约70%的每小时使用的葡萄糖;
(j)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约80%的每小时使用的葡萄糖;和
(k)比由不具有一种或多种天然和/或异源酶的激活、上调或下调的重组微生物使用的少至少约90%的每小时使用的葡萄糖。
45.一种重组微生物,其包含:
(a)一种或多种用于调节甘油合成的异源酶,其中所述一种或多种异源酶被激活、上调或下调;和
(b)在一个或多个工程化代谢途径中用于将碳水化合物源转化成乙醇的一种或多种天然和/或异源酶,其中所述一种或多种天然和/ 或异源酶被激活、上调或下调。
46.实施方式45的重组微生物,其中所述一种或多种用于调节甘油合成的异源酶由fps1多核苷酸编码。
47.实施方式46的重组微生物,其中所述fps1多核苷酸来自大肠杆菌。
48.实施方式45-47的任一项的重组微生物,其中所述工程化代谢途径之一包括丙酮酸至乙酰-CoA和甲酸的转化。
49.实施方式45-48的任一项的重组微生物,其中所述工程化代谢途径之一包含乙酰-CoA至乙醇的转化。
50.实施方式45-49的任一项的重组微生物,其还包含由fdh1多核苷酸、fdh2多核苷酸或fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
51.实施方式45-50的任一项的重组微生物,其中所述微生物产生乙醇。
52.实施方式45-51的任一项的重组微生物,其中所述微生物产生甲酸。
53.实施方式45-52的任一项的重组微生物,其中所述微生物选自酿酒酵母、乳酸克鲁维酵母、马克思克鲁维酵母、巴斯德毕赤酵母、解脂耶罗维亚酵母、多形汉森酵母、红发夫酵母、实用假丝酵母、Arxula adeninivorans、树干毕赤酵母、汉逊德巴利酵母、多型德巴利酵母、粟酒裂殖酵母、白色念珠菌和西方许旺酵母。
54.实施方式53的重组微生物,其中所述微生物是酿酒酵母。
55.实施方式48-54的任一项的重组微生物,其中所述丙酮酸被丙酮酸甲酸裂解酶(PFL)转化成乙酰-CoA和甲酸。
56.实施方式55的重组微生物,其中所述PFL具有原核或真核生物来源。
57.实施方式56的重组微生物,其中所述PFL来自双歧杆菌属, 埃希氏菌属、好热厌氧杆菌属、梭菌属、链球菌属、乳杆菌属、衣藻属、单鞭毛菌、新丽鞭毛菌属或芽孢杆菌属的一种或多种。
58.实施方式56的重组微生物,其中所述PFL来自地衣芽孢杆菌、嗜热链球菌、胚芽乳杆菌、干酪乳杆菌、青春双岐杆菌、解纤维素梭菌、大肠杆菌、莱茵衣藻PflA、单鞭毛菌属E2或新丽鞭毛菌的一种或多种。
59.实施方式55-58的任一项的重组微生物,其中所述PFL来自青春双岐杆菌。
60.实施方式49-59的任一项的重组微生物,其中所述乙酰-CoA 被乙醛脱氢酶转化成乙醛;并且其中所述乙醛被醇脱氢酶转化成乙醇。
61.实施方式49-59的任一项的重组微生物,其中所述乙酰-CoA 被双功能乙醛/醇脱氢酶转化成乙醇。
62.实施方式60或61的重组微生物,其中所述乙醛脱氢酶、醇脱氢酶或双功能乙醛/醇脱氢酶具有原核或真核生物来源。
63.实施方式60的重组微生物,其中所述乙醛脱氢酶来自C. phytofermentans。
64.实施方式61的重组微生物,其中所述双功能乙醛/醇脱氢酶来自埃希氏菌属、梭菌属、衣藻属、单鞭毛菌属或双歧杆菌属。
65.实施方式64的重组微生物,其中所述双功能乙醛/醇脱氢酶来自大肠杆菌、Clostridium phytofermentans、莱茵衣藻、单鞭毛菌属 E2或青春双岐杆菌。
66.实施方式64或65的重组微生物,其中所述双功能乙醛/醇脱氢酶来自青春双岐杆菌或单鞭毛菌属E2。
67.一种用于减少细胞甘油的方法,包括将生物质与根据实施方式1-66的任一项的重组微生物接触。
68.一种用于增加胞质甲酸的方法,包括将生物质与根据实施方式8-33或48-66的任一项的重组微生物接触。
69.一种用于将生物质转化成乙醇的方法,包括将生物质与根据实施方式1-66的任一项的重组微生物接触。
70.实施方式69的方法,其中所述生物质包含木质纤维素生物质。
71.实施方式70的方法,其中所述木质纤维素生物质选自草、柳枝稷、大米草、黑麦草、草芦、混合草原禾草、芒草、糖加工残渣、甘蔗渣、甘蔗秆、农业废物、稻秆、稻壳、大麦秆、玉米穗轴、谷类秆、小麦秆、芸苔秆、燕麦秆、燕麦壳、玉米纤维、秸秆、大豆秸秆、玉米秸秆、林业废物、再循环木浆纤维、纸污泥、锯屑、硬木、软木、龙舌兰及其组合。
72.实施方式69的方法,其中所述生物质是玉米糖化醪或玉米淀粉。
73.实施方式3的重组微生物,其中所述生物质包含木质纤维素生物质。
74.实施方式72的重组微生物,其中所述木质纤维素生物质选自草、柳枝稷、大米草、黑麦草、草芦、混合草原禾草、芒草、糖加工残渣、甘蔗渣、甘蔗秆、农业废物、稻秆、稻壳、大麦秆、玉米穗轴、谷类秆、小麦秆、芸苔秆、燕麦秆、燕麦壳、玉米纤维、秸秆、大豆秸秆、玉米秸秆、林业废物、再循环木浆纤维、纸污泥、锯屑、硬木、软木、龙舌兰及其组合。
75.实施方式3的重组微生物,其中所述生物质是玉米糖化醪或玉米淀粉。
76.实施方式1-66的任一项的重组微生物,其中所述微生物还包含一种或多种天然和/或异源酶,所述酶在一个或多个工程化代谢途径中用于将木糖转化成木酮糖-5-磷酸和/或将阿拉伯糖转化成木酮糖-5- 磷酸,其中一种或多种天然和/或异源酶被激活、上调或下调。
77.实施方式1-66的任一项的重组微生物,其中所述工程化代谢途径之一包含碳水化合物源至一种或多种糖单元的转化。
78.实施方式77的重组微生物,其中所述工程化代谢途径包含一种或多种编码糖解酶的天然和/或异源酶。
79.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,以及所述工程化代谢途径之一包含通过糖解酶进行的碳水化合物源至一种或多种糖单元的转化,并且还包含由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
80.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpp1多核苷酸和gpp2多核苷酸编码,并且所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,以及所述工程化代谢途径之一包含通过糖解酶进行的碳水化合物源至一种或多种糖单元的转化。
81.实施方式80的重组微生物,其中所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
82.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码,并且所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,以及所述工程化代谢途径之一包含通过糖解酶进行的碳水化合物源至一种或多种糖单元的转化。
83.实施方式82的重组微生物,其中所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包含由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
84.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码并且所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码,其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,以及所述工程化代谢途径之一包含通过糖解酶进行的碳水化合物源至一种或多种糖单元的转化,并且还包含由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
85.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码,其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,以及所述工程化代谢途径之一包含通过糖解酶进行的碳水化合物源至一种或多种糖单元的转化,并且还包含由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
86.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,以及所述工程化代谢途径之一包含通过糖解酶进行的碳水化合物源至一种或多种糖单元的转化,并且还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸。
87.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,以及所述工程化代谢途径之一包含通过糖解酶进行的碳水化合物源至一种或多种糖单元的转化,并且还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸和由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
88.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码并且一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,以及所述工程化代谢途径之一包含通过糖解酶进行的碳水化合物源至一种或多种糖单元的转化,并且还包含有效地连接于天然gpd2启动子多核苷酸的天然和/或异源gpd1多核苷酸。
89.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd1多核苷酸和gpd2多核苷酸编码,以及所述一种或多种用于调节甘油合成的天然酶由fps1多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,以及所述工程化代谢途径之一包含通过糖解酶进行的碳水化合物源至一种或多种糖单元的转化,还包含有效地连接于天然gpd2启动子多核苷酸的天然和/ 或异源gpd1多核苷酸以及由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
90.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpd2多核苷酸编码,并且其中所述工程化代谢途径之一包含通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化,所述工程化代谢途径之一包含通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,以及所述工程化代谢途径之一包含通过糖解酶进行的碳水化合物源至一种或多种糖单元的转化,并且还包含由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
91.实施方式78-89的任一项的重组微生物,其中所述糖解酶选自淀粉酶、纤维素酶、半纤维素酶、纤维素分解和淀粉分解辅助酶、菊糖酶、果聚糖酶和戊糖利用酶。
92.实施方式78-90的任一项的重组微生物,其中所述糖解酶来自微生物,所述微生物选自灰腐质霉(H.grisea)、嗜热子囊茵、埃默森篮状菌(T.emersonii)、里氏木霉、澳洲乳白蚁(C.lacteus)、台湾乳白蚁、高山象白蚁(N.takasagoensis)、澳大利亚矛颚家白蚁(C.acinaciformis)、达尔文澳白蚁、N.walkeri、扣囊复膜酵母、 C.lucknowense、黄胸散白蚁(R.speratus)、嗜热放线菌、热纤梭菌、解纤维素梭菌、约氏梭菌、短小芽孢杆菌、粪碱纤维单胞菌、多糖降解菌、Piromyces equii、Neocallimastix patricarum、拟南芥和扣囊复膜酵母。
93.实施方式92的重组微生物,其中所述糖解酶是扣囊复膜酵母菌葡糖淀粉酶(glu-0111-CO)。
94.实施方式1-26的任一项的重组微生物,其中所述一种或多种用于产生甘油的天然酶由gpp1多核苷酸或gpp2多核苷酸编码,并且其中所述工程化代谢途径之一包括通过丙酮酸甲酸裂解酶进行的丙酮酸至乙酰-CoA和甲酸的转化。
95.实施方式94的重组微生物,其中所述工程化代谢途径之一包括通过双功能乙醛/醇脱氢酶进行的乙酰-CoA至乙醇的转化,并且还包括由fdh1多核苷酸和fdh2多核苷酸编码的一种或多种天然酶的缺失。
序列表
<110> 拉勒曼德匈牙利流动性管理有限责任公司
<120> 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法
<130> 2608.055PC01
<140> 待分配
<141> 2012-04-05
<150> 61/472,085
<151> 2011-04-05
<160> 191
<170> PatentIn version 3.5
<210> 1
<211> 3599
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> FPS1
<220>
<221> 杂项特征
<222> (801)..(2810)
<223> 编码序列
<400> 1
ttgacggcag ttctcatagc atctcaaagc aatagcagtg caaaagtaca taaccgtagg 60
aaggtacgcg gtaggtattt gagttcgttg gtggttatcc tccgcaaggc gcttcggcgg 120
ttatttgttg atagtcgaag aacaccaaaa aaaatgctgt tattgctttc tccgtaaaca 180
ataaaacccg gtagcgggat aacgcggctg atgcttttat ttaggaagga atacttacat 240
tatcatgaga acattgtcaa gggcattctg atacgggcct tccatcgcaa gaaaaaggca 300
gcaacggact gagggacgga gagagttacg gcataagaag tagtaggaga gcagagtgtc 360
ataaagttat attattctcg tcctaaagtc aattagttct gttgcgcttg acaatatatg 420
tcgtgtaata ccgtccctta gcagaagaaa gaaagacgga tccatatatg ttaaaatgct 480
tcagagatgt ttctttaatg tgccgtccaa caaaggtatc ttctgtagct tcctctattt 540
tcgatcagat ctcatagtga gaaggcgcaa ttcagtagtt aaaagcgggg aacagtgtga 600
atccggagac ggcaagattg cccggccctt tttgcggaaa agataaaaca agatatattg 660
cactttttcc accaagaaaa acaggaagtg gattaaaaaa tcaacaaagt ataacgccta 720
ttgtcccaat aagcgtcggt tgttcttctt tattatttta ccaagtacgc tcgagggtac 780
attctaatgc attaaaagac atgagtaatc ctcaaaaagc tctaaacgac tttctgtcca 840
gtgaatctgt tcatacacat gatagttcta ggaaacaatc taataagcag tcatccgacg 900
aaggacgctc ttcatcacaa ccttcacatc atcactctgg tggtactaac aacaataata 960
acaataataa taataataat aacagtaaca acaacaacaa cggcaacgat gggggaaatg 1020
atgacgacta tgattatgaa atgcaagatt atagaccttc tccgcaaagt gcgcggccta 1080
ctcccacgta tgttccacaa tattctgtag aaagtgggac tgctttcccg attcaagagg 1140
ttattcctag cgcatacatt aacacacaag atataaacca taaagataac ggtccgccga 1200
gtgcaagcag taatagagca ttcaggccta gagggcagac cacagtgtcg gccaacgtgc 1260
ttaacattga agatttttac aaaaatgcag acgatgcgca taccatcccg gagtcacatt 1320
tatcgagaag gagaagtagg tcgagggcta cgagtaatgc tgggcacagt gccaatacag 1380
gcgccacgaa tggcaggact actggtgccc aaactaatat ggaaagcaat gaatcaccac 1440
gtaacgtccc cattatggtg aagccaaaga cattatacca gaaccctcaa acacctacag 1500
tcttgccctc cacataccat ccaattaata aatggtcttc cgtcaaaaac acttatttga 1560
aggaattttt agccgagttt atgggaacaa tggttatgat tattttcggt agtgctgttg 1620
tttgtcaggt caatgttgct gggaaaatac agcaggacaa tttcaacgtg gctttggata 1680
accttaacgt taccgggtct tctgcagaaa cgatagacgc tatgaagagt ttaacatcct 1740
tggtttcatc cgttgcgggc ggtacctttg atgatgtggc attgggctgg gctgctgccg 1800
tggtgatggg ctatttctgc gctggtggta gtgccatctc aggtgctcat ttgaatccgt 1860
ctattacatt agccaatttg gtgtatagag gttttcccct gaagaaagtt ccttattact 1920
ttgctggaca attgatcggt gccttcacag gcgctttgat cttgtttatt tggtacaaaa 1980
gggtgttaca agaggcatat agcgattggt ggatgaatga aagtgttgcg ggaatgtttt 2040
gcgtttttcc aaagccttat ctaagttcag gacggcaatt tttttccgaa tttttatgtg 2100
gagctatgtt acaagcagga acatttgcgc tgaccgatcc ttatacgtgt ttgtcctctg 2160
atgttttccc attgatgatg tttattttga ttttcattat caatgcttcc atggcttatc 2220
agacaggtac agcaatgaat ttggctcgtg atctgggccc acgtcttgca ctatatgcag 2280
ttggatttga tcataaaatg ctttgggtgc atcatcatca tttcttttgg gttcccatgg 2340
taggcccatt tattggtgcg ttaatggggg ggttggttta cgatgtctgt atttatcagg 2400
gtcatgaatc tccagtcaac tggtctttac cagtttataa ggaaatgatt atgagagcct 2460
ggtttagaag gcctggttgg aagaagagaa atagagcaag aagaacatcg gacctgagtg 2520
acttctcata caataacgat gatgatgagg aatttggaga aagaatggct cttcaaaaga 2580
caaagaccaa gtcatctatt tcagacaacg aaaatgaagc aggagaaaag aaagtgcaat 2640
ttaaatctgt tcagcgcggc aaaagaacgt ttggtggtat accaacaatt cttgaagaag 2700
aagattccat tgaaactgct tcgctaggtg cgacgacgac tgattctatt gggttatccg 2760
acacatcatc agaagattcg cattatggta atgctaagaa ggtaacatga gaaaacagac 2820
aagaaaaaga aacaaataat atagactgat agaaaaaaat actgcttact accgccggta 2880
taatatatat atatatatat atttacatag atgattgcat agtgttttaa aaagctttcc 2940
taggttaagc tatgaatctt cataacctaa ccaactaaat atgaaaatac tgacccatcg 3000
tcttaagtaa gttgacatga actcagcctg gtcacctact atacatgatg tatcgcatgg 3060
atggaaagaa taccaaacgc taccttccag gttaatgata gtatccaaac ctagttggaa 3120
tttgccttga acatcaagca gcgattcgat atcagttggg agcatcaatt tggtcattgg 3180
aataccatct atgcttttct cctcccatat tcgcaaaagt agtaagggct cgttatatac 3240
ttttgaatat gtaagatata attctatatg atttagtaat ttattttcta tacgctcagt 3300
atttttctgc agttgtcgag taggtattaa acgcaaaaga agtccatcct tttcatcatt 3360
caaatggaca tcttggcaaa gggcccagtt atggaaaatc tgggagtcat acaacgattg 3420
cagttggcta tgccactcct ggtaaggaat catcaagtct gataattctg ttttttagcc 3480
cttttttttt ttttttcatg gtgttctctt ctcattgctt ttcaatttta agttcgttac 3540
ctttcatata gagtttctta acagaaattt cacaacgaaa atataattaa ctacaggca 3599
<210> 2
<211> 669
<212> PRT
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> FPS1
<400> 2
Met Ser Asn Pro Gln Lys Ala Leu Asn Asp Phe Leu Ser Ser Glu Ser
1 5 10 15
Val His Thr His Asp Ser Ser Arg Lys Gln Ser Asn Lys Gln Ser Ser
20 25 30
Asp Glu Gly Arg Ser Ser Ser Gln Pro Ser His His His Ser Gly Gly
35 40 45
Thr Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Ser Asn Asn
50 55 60
Asn Asn Asn Gly Asn Asp Gly Gly Asn Asp Asp Asp Tyr Asp Tyr Glu
65 70 75 80
Met Gln Asp Tyr Arg Pro Ser Pro Gln Ser Ala Arg Pro Thr Pro Thr
85 90 95
Tyr Val Pro Gln Tyr Ser Val Glu Ser Gly Thr Ala Phe Pro Ile Gln
100 105 110
Glu Val Ile Pro Ser Ala Tyr Ile Asn Thr Gln Asp Ile Asn His Lys
115 120 125
Asp Asn Gly Pro Pro Ser Ala Ser Ser Asn Arg Ala Phe Arg Pro Arg
130 135 140
Gly Gln Thr Thr Val Ser Ala Asn Val Leu Asn Ile Glu Asp Phe Tyr
145 150 155 160
Lys Asn Ala Asp Asp Ala His Thr Ile Pro Glu Ser His Leu Ser Arg
165 170 175
Arg Arg Ser Arg Ser Arg Ala Thr Ser Asn Ala Gly His Ser Ala Asn
180 185 190
Thr Gly Ala Thr Asn Gly Arg Thr Thr Gly Ala Gln Thr Asn Met Glu
195 200 205
Ser Asn Glu Ser Pro Arg Asn Val Pro Ile Met Val Lys Pro Lys Thr
210 215 220
Leu Tyr Gln Asn Pro Gln Thr Pro Thr Val Leu Pro Ser Thr Tyr His
225 230 235 240
Pro Ile Asn Lys Trp Ser Ser Val Lys Asn Thr Tyr Leu Lys Glu Phe
245 250 255
Leu Ala Glu Phe Met Gly Thr Met Val Met Ile Ile Phe Gly Ser Ala
260 265 270
Val Val Cys Gln Val Asn Val Ala Gly Lys Ile Gln Gln Asp Asn Phe
275 280 285
Asn Val Ala Leu Asp Asn Leu Asn Val Thr Gly Ser Ser Ala Glu Thr
290 295 300
Ile Asp Ala Met Lys Ser Leu Thr Ser Leu Val Ser Ser Val Ala Gly
305 310 315 320
Gly Thr Phe Asp Asp Val Ala Leu Gly Trp Ala Ala Ala Val Val Met
325 330 335
Gly Tyr Phe Cys Ala Gly Gly Ser Ala Ile Ser Gly Ala His Leu Asn
340 345 350
Pro Ser Ile Thr Leu Ala Asn Leu Val Tyr Arg Gly Phe Pro Leu Lys
355 360 365
Lys Val Pro Tyr Tyr Phe Ala Gly Gln Leu Ile Gly Ala Phe Thr Gly
370 375 380
Ala Leu Ile Leu Phe Ile Trp Tyr Lys Arg Val Leu Gln Glu Ala Tyr
385 390 395 400
Ser Asp Trp Trp Met Asn Glu Ser Val Ala Gly Met Phe Cys Val Phe
405 410 415
Pro Lys Pro Tyr Leu Ser Ser Gly Arg Gln Phe Phe Ser Glu Phe Leu
420 425 430
Cys Gly Ala Met Leu Gln Ala Gly Thr Phe Ala Leu Thr Asp Pro Tyr
435 440 445
Thr Cys Leu Ser Ser Asp Val Phe Pro Leu Met Met Phe Ile Leu Ile
450 455 460
Phe Ile Ile Asn Ala Ser Met Ala Tyr Gln Thr Gly Thr Ala Met Asn
465 470 475 480
Leu Ala Arg Asp Leu Gly Pro Arg Leu Ala Leu Tyr Ala Val Gly Phe
485 490 495
Asp His Lys Met Leu Trp Val His His His His Phe Phe Trp Val Pro
500 505 510
Met Val Gly Pro Phe Ile Gly Ala Leu Met Gly Gly Leu Val Tyr Asp
515 520 525
Val Cys Ile Tyr Gln Gly His Glu Ser Pro Val Asn Trp Ser Leu Pro
530 535 540
Val Tyr Lys Glu Met Ile Met Arg Ala Trp Phe Arg Arg Pro Gly Trp
545 550 555 560
Lys Lys Arg Asn Arg Ala Arg Arg Thr Ser Asp Leu Ser Asp Phe Ser
565 570 575
Tyr Asn Asn Asp Asp Asp Glu Glu Phe Gly Glu Arg Met Ala Leu Gln
580 585 590
Lys Thr Lys Thr Lys Ser Ser Ile Ser Asp Asn Glu Asn Glu Ala Gly
595 600 605
Glu Lys Lys Val Gln Phe Lys Ser Val Gln Arg Gly Lys Arg Thr Phe
610 615 620
Gly Gly Ile Pro Thr Ile Leu Glu Glu Glu Asp Ser Ile Glu Thr Ala
625 630 635 640
Ser Leu Gly Ala Thr Thr Thr Asp Ser Ile Gly Leu Ser Asp Thr Ser
645 650 655
Ser Glu Asp Ser His Tyr Gly Asn Ala Lys Lys Val Thr
660 665
<210> 3
<211> 759
<212> DNA
<213> 地衣芽孢杆菌
<220>
<221> 杂项特征
<223> DSM13
<400> 3
atggatggaa atattcattc gatcgaaaca ttcggcaccg ttgacggtcc aggcatcagg 60
tatgtcgtct tcacacaagg ctgcctgatg cgctgtcaat tttgccataa tgctgatact 120
tgggaaatcg gaaccggaaa acaaatgacg gtttccgaaa tcgttcagga tgtccagcat 180
tatctcccgt ttattcaatc atcgggcgga ggcatcaccg tgagcggagg cgagccgctt 240
ttacaactgc cgtttttaat cgagctgttc aaagcatgca aaagcctcgg cattcacacg 300
gcactcgatt cgtccggcgg atgctattcg gctgcgccgg catttcaaga gcagatcaaa 360
gaactgatcc agtatacaga ccttgttttg cttgacctca agcatcacaa cagaaaaaaa 420
catatcaacc tgacaggaat gccgaatgac cacattttag aatttgcccg gtttctcgct 480
gaacatcaag ttcccgtctg gatccgccac gtactggttc cggggatctc cgatatcgat 540
gccgatttaa cggccctcgg cacgtttatc ggcacgcttg cgaacgttca gaaggtggag 600
gttcttcctt atcacaagct cggcgtctac aaatgggaag cgcttggcct ggattatccg 660
ttaaaagggg ttgaaccgcc aagtgccgac agggccgaaa atgcgtacag actgctcacc 720
gcacacttgc aaggcggatc cttgctgcaa gagacataa 759
<210> 4
<211> 252
<212> PRT
<213> 地衣芽孢杆菌
<220>
<221> 杂项特征
<223> DSM13
<400> 4
Met Asp Gly Asn Ile His Ser Ile Glu Thr Phe Gly Thr Val Asp Gly
1 5 10 15
Pro Gly Ile Arg Tyr Val Val Phe Thr Gln Gly Cys Leu Met Arg Cys
20 25 30
Gln Phe Cys His Asn Ala Asp Thr Trp Glu Ile Gly Thr Gly Lys Gln
35 40 45
Met Thr Val Ser Glu Ile Val Gln Asp Val Gln His Tyr Leu Pro Phe
50 55 60
Ile Gln Ser Ser Gly Gly Gly Ile Thr Val Ser Gly Gly Glu Pro Leu
65 70 75 80
Leu Gln Leu Pro Phe Leu Ile Glu Leu Phe Lys Ala Cys Lys Ser Leu
85 90 95
Gly Ile His Thr Ala Leu Asp Ser Ser Gly Gly Cys Tyr Ser Ala Ala
100 105 110
Pro Ala Phe Gln Glu Gln Ile Lys Glu Leu Ile Gln Tyr Thr Asp Leu
115 120 125
Val Leu Leu Asp Leu Lys His His Asn Arg Lys Lys His Ile Asn Leu
130 135 140
Thr Gly Met Pro Asn Asp His Ile Leu Glu Phe Ala Arg Phe Leu Ala
145 150 155 160
Glu His Gln Val Pro Val Trp Ile Arg His Val Leu Val Pro Gly Ile
165 170 175
Ser Asp Ile Asp Ala Asp Leu Thr Ala Leu Gly Thr Phe Ile Gly Thr
180 185 190
Leu Ala Asn Val Gln Lys Val Glu Val Leu Pro Tyr His Lys Leu Gly
195 200 205
Val Tyr Lys Trp Glu Ala Leu Gly Leu Asp Tyr Pro Leu Lys Gly Val
210 215 220
Glu Pro Pro Ser Ala Asp Arg Ala Glu Asn Ala Tyr Arg Leu Leu Thr
225 230 235 240
Ala His Leu Gln Gly Gly Ser Leu Leu Gln Glu Thr
245 250
<210> 5
<211> 759
<212> DNA
<213> 地衣芽孢杆菌
<220>
<221> 杂项特征
<223> ATCC14580
<400> 5
atggatggaa atattcattc gatcgaaaca ttcggcaccg ttgacggtcc aggcatcagg 60
tatgtcgtct tcacacaagg ctgcctgatg cgctgtcaat tttgccataa tgctgatact 120
tgggaaatcg gaaccggaaa acaaatgacg gtttccgaaa tcgttcagga tgtccagcat 180
tatctcccgt ttattcaatc atcgggcgga ggcatcaccg tgagcggagg cgagccgctt 240
ttacaactgc cgtttttaat cgagctgttc aaagcatgca aaagcctcgg cattcacacg 300
gcactcgatt cgtccggcgg atgctattcg gctgcgccgg catttcaaga gcagatcaaa 360
gaactgatcc agtatacaga ccttgttttg cttgacctca agcatcacaa cagaaaaaaa 420
catatcaacc tgacaggaat gccgaatgac cacattttag aatttgcccg gtttctcgct 480
gaacatcaag ttcccgtctg gatccgccac gtactggttc cggggatctc cgatatcgat 540
gccgatttaa cggccctcgg cacgtttatc ggcacgcttg cgaacgttca gaaggtggag 600
gttcttcctt atcacaagct cggcgtctac aaatgggaag cgcttggcct ggattatccg 660
ttaaaagggg ttgaaccgcc aagtgccgac agggccgaaa atgcgtacag actgctcacc 720
gcacacttgc aaggcggatc cttgctgcaa gagacataa 759
<210> 6
<211> 252
<212> PRT
<213> 地衣芽孢杆菌
<220>
<221> 杂项特征
<223> ATCC14580
<400> 6
Met Asp Gly Asn Ile His Ser Ile Glu Thr Phe Gly Thr Val Asp Gly
1 5 10 15
Pro Gly Ile Arg Tyr Val Val Phe Thr Gln Gly Cys Leu Met Arg Cys
20 25 30
Gln Phe Cys His Asn Ala Asp Thr Trp Glu Ile Gly Thr Gly Lys Gln
35 40 45
Met Thr Val Ser Glu Ile Val Gln Asp Val Gln His Tyr Leu Pro Phe
50 55 60
Ile Gln Ser Ser Gly Gly Gly Ile Thr Val Ser Gly Gly Glu Pro Leu
65 70 75 80
Leu Gln Leu Pro Phe Leu Ile Glu Leu Phe Lys Ala Cys Lys Ser Leu
85 90 95
Gly Ile His Thr Ala Leu Asp Ser Ser Gly Gly Cys Tyr Ser Ala Ala
100 105 110
Pro Ala Phe Gln Glu Gln Ile Lys Glu Leu Ile Gln Tyr Thr Asp Leu
115 120 125
Val Leu Leu Asp Leu Lys His His Asn Arg Lys Lys His Ile Asn Leu
130 135 140
Thr Gly Met Pro Asn Asp His Ile Leu Glu Phe Ala Arg Phe Leu Ala
145 150 155 160
Glu His Gln Val Pro Val Trp Ile Arg His Val Leu Val Pro Gly Ile
165 170 175
Ser Asp Ile Asp Ala Asp Leu Thr Ala Leu Gly Thr Phe Ile Gly Thr
180 185 190
Leu Ala Asn Val Gln Lys Val Glu Val Leu Pro Tyr His Lys Leu Gly
195 200 205
Val Tyr Lys Trp Glu Ala Leu Gly Leu Asp Tyr Pro Leu Lys Gly Val
210 215 220
Glu Pro Pro Ser Ala Asp Arg Ala Glu Asn Ala Tyr Arg Leu Leu Thr
225 230 235 240
Ala His Leu Gln Gly Gly Ser Leu Leu Gln Glu Thr
245 250
<210> 7
<211> 801
<212> DNA
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> CNRZ1066
<400> 7
atggcagaaa ttgattacag tcaggtgact ggacttgttc attcaaccga aagtttcgga 60
tccgtagatg gtcctggtat ccgttttatt gtgtttatgc aaggctgtaa gctgcgttgc 120
caatattgtc ataacccaga tacttgggcc atgaagtcaa ataaggctgt tgaacgtaca 180
gttgaagatg tcttagaaga ggctcttcgc ttccgtcatt tctggggtga gcatggtgga 240
atcactgtat caggtggtga agccatgctt cagattgatt ttgtcactgc cctctttaca 300
gaggctaaga agttagggat tcactgtacg cttgatacgt gtggcttgtc ttatcgtaat 360
actccagagt atcatgaagt tgtcgacaaa cttttggctg taactgactt ggttctactg 420
gatatcaaag agattgaccc cgaacaacac aagtttgtga cccgtcaacc taataagaat 480
atcttggaat ttgctcaata tctgtctgat aaacaagttc cggtctggat tcgtcatgtc 540
ttggtacctg gtttgacaga ttttgacgaa cacttggtta agctcggcga gtttgtaaag 600
accttgaaaa atgtcgataa atttgaaatt cttccatatc atacgatggg ggaattcaag 660
tggcgtgaac ttggcatccc ttatccattg gaaggtgtca aaccaccaac tgcagatcgt 720
gttaaaaatg ctaaggctct tatgcatacg gaaacttatc aagagtataa gaatcgtatc 780
ggggttaaaa ccttggatta a 801
<210> 8
<211> 266
<212> PRT
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> CNRZ1066
<400> 8
Met Ala Glu Ile Asp Tyr Ser Gln Val Thr Gly Leu Val His Ser Thr
1 5 10 15
Glu Ser Phe Gly Ser Val Asp Gly Pro Gly Ile Arg Phe Ile Val Phe
20 25 30
Met Gln Gly Cys Lys Leu Arg Cys Gln Tyr Cys His Asn Pro Asp Thr
35 40 45
Trp Ala Met Lys Ser Asn Lys Ala Val Glu Arg Thr Val Glu Asp Val
50 55 60
Leu Glu Glu Ala Leu Arg Phe Arg His Phe Trp Gly Glu His Gly Gly
65 70 75 80
Ile Thr Val Ser Gly Gly Glu Ala Met Leu Gln Ile Asp Phe Val Thr
85 90 95
Ala Leu Phe Thr Glu Ala Lys Lys Leu Gly Ile His Cys Thr Leu Asp
100 105 110
Thr Cys Gly Leu Ser Tyr Arg Asn Thr Pro Glu Tyr His Glu Val Val
115 120 125
Asp Lys Leu Leu Ala Val Thr Asp Leu Val Leu Leu Asp Ile Lys Glu
130 135 140
Ile Asp Pro Glu Gln His Lys Phe Val Thr Arg Gln Pro Asn Lys Asn
145 150 155 160
Ile Leu Glu Phe Ala Gln Tyr Leu Ser Asp Lys Gln Val Pro Val Trp
165 170 175
Ile Arg His Val Leu Val Pro Gly Leu Thr Asp Phe Asp Glu His Leu
180 185 190
Val Lys Leu Gly Glu Phe Val Lys Thr Leu Lys Asn Val Asp Lys Phe
195 200 205
Glu Ile Leu Pro Tyr His Thr Met Gly Glu Phe Lys Trp Arg Glu Leu
210 215 220
Gly Ile Pro Tyr Pro Leu Glu Gly Val Lys Pro Pro Thr Ala Asp Arg
225 230 235 240
Val Lys Asn Ala Lys Ala Leu Met His Thr Glu Thr Tyr Gln Glu Tyr
245 250 255
Lys Asn Arg Ile Gly Val Lys Thr Leu Asp
260 265
<210> 9
<211> 801
<212> DNA
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> LMG18311
<400> 9
atggcagaaa ttgattacag tcaggtgact ggacttgttc attcaaccga aagtttcgga 60
tccgtagatg gtcctggtat ccgttttatt gtgtttatgc aaggctgtaa gctgcgttgc 120
caatattgtc ataacccaga tacttgggcc atgaagtcaa ataaggctgt tgaacgtaca 180
gttgaagatg tcttagaaga ggctcttcgc ttccgtcatt tctggggtga gcatggtgga 240
atcactgtat caggtggtga agccatgctt cagattgatt ttgtcactgc cctctttaca 300
gaggctaaga agttagggat tcactgtacg cttgatacgt gtggcttgtc ttatcgtaat 360
actccagagt atcatgaagt tgtcgacaaa cttttggctg taactgactt ggttctactg 420
gatatcaaag agattgaccc cgaacaacac aagtttgtga cccgtcaacc taataagaat 480
atcttggaat ttgctcaata tctgtctgat aaacaagttc cggtctggat tcgtcatgtc 540
ttggtacctg gtttgacaga ttttgacgaa cacttggtta agctcggcga gtttgtaaag 600
accttgaaaa atgtcgataa atttgaaatt cttccatatc atacgatggg ggaattcaag 660
tggcgtgaac ttggcatccc ttatccattg gaaggtgtca aaccaccaac tgcagatcgt 720
gttaaaaatg ctaaggctct tatgcatacg gaaacttatc aagagtataa gaatcgtatc 780
ggggttaaaa ccttggatta a 801
<210> 10
<211> 266
<212> PRT
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> LMG18311
<400> 10
Met Ala Glu Ile Asp Tyr Ser Gln Val Thr Gly Leu Val His Ser Thr
1 5 10 15
Glu Ser Phe Gly Ser Val Asp Gly Pro Gly Ile Arg Phe Ile Val Phe
20 25 30
Met Gln Gly Cys Lys Leu Arg Cys Gln Tyr Cys His Asn Pro Asp Thr
35 40 45
Trp Ala Met Lys Ser Asn Lys Ala Val Glu Arg Thr Val Glu Asp Val
50 55 60
Leu Glu Glu Ala Leu Arg Phe Arg His Phe Trp Gly Glu His Gly Gly
65 70 75 80
Ile Thr Val Ser Gly Gly Glu Ala Met Leu Gln Ile Asp Phe Val Thr
85 90 95
Ala Leu Phe Thr Glu Ala Lys Lys Leu Gly Ile His Cys Thr Leu Asp
100 105 110
Thr Cys Gly Leu Ser Tyr Arg Asn Thr Pro Glu Tyr His Glu Val Val
115 120 125
Asp Lys Leu Leu Ala Val Thr Asp Leu Val Leu Leu Asp Ile Lys Glu
130 135 140
Ile Asp Pro Glu Gln His Lys Phe Val Thr Arg Gln Pro Asn Lys Asn
145 150 155 160
Ile Leu Glu Phe Ala Gln Tyr Leu Ser Asp Lys Gln Val Pro Val Trp
165 170 175
Ile Arg His Val Leu Val Pro Gly Leu Thr Asp Phe Asp Glu His Leu
180 185 190
Val Lys Leu Gly Glu Phe Val Lys Thr Leu Lys Asn Val Asp Lys Phe
195 200 205
Glu Ile Leu Pro Tyr His Thr Met Gly Glu Phe Lys Trp Arg Glu Leu
210 215 220
Gly Ile Pro Tyr Pro Leu Glu Gly Val Lys Pro Pro Thr Ala Asp Arg
225 230 235 240
Val Lys Asn Ala Lys Ala Leu Met His Thr Glu Thr Tyr Gln Glu Tyr
245 250 255
Lys Asn Arg Ile Gly Val Lys Thr Leu Asp
260 265
<210> 11
<211> 801
<212> DNA
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> LMD-9
<400> 11
atggcagaaa ttgattacag tcaggtgact ggacttgttc attcaaccga aagtttcgga 60
tccgtagatg gtcctggtat ccgttttatt gtgtttatgc aaggctgtaa gctgcgttgc 120
caatattgtc ataacccaga tacttgggcc atgaagtcaa ataaggctgt tgaacgtaca 180
gttgaagatg tcttagaaga ggctcttcgc ttccgtcatt tctggggtga gcatggtgga 240
atcactgtat caggtggtga agccatgctt cagattgatt ttgtcactgc cctctttaca 300
gaggctaaga agttagggat tcactgtacg cttgatacgt gtggcttgtc ttatcgtaat 360
actccagagt atcatgaagt tgtcgacaaa cttttggctg taactgactt ggttctactg 420
gatatcaaag agattgaccc cgaacaacac aagtttgtga cccgtcaacc taataagaat 480
atcttggaat ttgctcaata tctgtctgat aaacaagttc cggtctggat tcgtcatgtc 540
ttggtacctg gtttgacaga ttttgacgaa cacttggtta agctcggcga gtttgtaaag 600
accttgaaaa atgtcgataa atttgaaatt cttccatatc atacgatggg ggaattcaag 660
tggcgtgaac ttggcatccc ttatccattg gaaggtgtca aaccaccaac tgcagatcgt 720
gttaaaaatg ctaaggctct tatgcatacg gaaacttatc aagagtataa gaatcgtatc 780
ggggttaaaa ccttggatta a 801
<210> 12
<211> 266
<212> PRT
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> LMD-9
<400> 12
Met Ala Glu Ile Asp Tyr Ser Gln Val Thr Gly Leu Val His Ser Thr
1 5 10 15
Glu Ser Phe Gly Ser Val Asp Gly Pro Gly Ile Arg Phe Ile Val Phe
20 25 30
Met Gln Gly Cys Lys Leu Arg Cys Gln Tyr Cys His Asn Pro Asp Thr
35 40 45
Trp Ala Met Lys Ser Asn Lys Ala Val Glu Arg Thr Val Glu Asp Val
50 55 60
Leu Glu Glu Ala Leu Arg Phe Arg His Phe Trp Gly Glu His Gly Gly
65 70 75 80
Ile Thr Val Ser Gly Gly Glu Ala Met Leu Gln Ile Asp Phe Val Thr
85 90 95
Ala Leu Phe Thr Glu Ala Lys Lys Leu Gly Ile His Cys Thr Leu Asp
100 105 110
Thr Cys Gly Leu Ser Tyr Arg Asn Thr Pro Glu Tyr His Glu Val Val
115 120 125
Asp Lys Leu Leu Ala Val Thr Asp Leu Val Leu Leu Asp Ile Lys Glu
130 135 140
Ile Asp Pro Glu Gln His Lys Phe Val Thr Arg Gln Pro Asn Lys Asn
145 150 155 160
Ile Leu Glu Phe Ala Gln Tyr Leu Ser Asp Lys Gln Val Pro Val Trp
165 170 175
Ile Arg His Val Leu Val Pro Gly Leu Thr Asp Phe Asp Glu His Leu
180 185 190
Val Lys Leu Gly Glu Phe Val Lys Thr Leu Lys Asn Val Asp Lys Phe
195 200 205
Glu Ile Leu Pro Tyr His Thr Met Gly Glu Phe Lys Trp Arg Glu Leu
210 215 220
Gly Ile Pro Tyr Pro Leu Glu Gly Val Lys Pro Pro Thr Ala Asp Arg
225 230 235 240
Val Lys Asn Ala Lys Ala Leu Met His Thr Glu Thr Tyr Gln Glu Tyr
245 250 255
Lys Asn Arg Ile Gly Val Lys Thr Leu Asp
260 265
<210> 13
<211> 804
<212> DNA
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> WCFS1
<400> 13
atgccaacga tcacaactaa gacgcccgta aaaggactaa tatttaacat tcaaaaattt 60
agtatcaatg atggaccagg tattcgaaca gtagttttct ttaaagggtg cccgttacgc 120
tgcaagtggt gttctaatcc agaatcacaa tcaggtgagc aagaatcaat gtatgatgaa 180
cagaccgcca agcaaaccat cgtcggtgat tatatgacgg ttgatgatat tatgaaagtt 240
attctacaag ataaagactt ctatgaagag tctggcggtg gggtaacctt ctctggtggt 300
gaagttcttt ttcaagcttc ctttgcgatt gagcttgcta aggcagttaa agcagctggc 360
attaatttag cctgtgagac aactggttac gcacggccta aggtttttaa tgaattcatg 420
tcttatatgg acttcatgta ttatgactgt aaacaatggg acccagccca acatcgaatc 480
ggaacgggtg ccgataacgg ggtaatttta cgtaacttag caactgcagt gcaagctcat 540
caaaagatga tggttcggat tccggttatt ccaggtttta attatacatt gaatgacgcg 600
gatcattttg gacaactatt taatcagatt ggcgtaaccg aagttgaatt attgccattt 660
caccagtttg ggttgaaaaa gtatcaagat ttgggccgaa aatatgcgct agttaatgtt 720
aaacagttac aagcggatga cttaattgat tatgctgaac atattcgtgc acatggtgtt 780
aaagtacggg tgaatgggtg gtaa 804
<210> 14
<211> 267
<212> PRT
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> WCFS1
<400> 14
Met Pro Thr Ile Thr Thr Lys Thr Pro Val Lys Gly Leu Ile Phe Asn
1 5 10 15
Ile Gln Lys Phe Ser Ile Asn Asp Gly Pro Gly Ile Arg Thr Val Val
20 25 30
Phe Phe Lys Gly Cys Pro Leu Arg Cys Lys Trp Cys Ser Asn Pro Glu
35 40 45
Ser Gln Ser Gly Glu Gln Glu Ser Met Tyr Asp Glu Gln Thr Ala Lys
50 55 60
Gln Thr Ile Val Gly Asp Tyr Met Thr Val Asp Asp Ile Met Lys Val
65 70 75 80
Ile Leu Gln Asp Lys Asp Phe Tyr Glu Glu Ser Gly Gly Gly Val Thr
85 90 95
Phe Ser Gly Gly Glu Val Leu Phe Gln Ala Ser Phe Ala Ile Glu Leu
100 105 110
Ala Lys Ala Val Lys Ala Ala Gly Ile Asn Leu Ala Cys Glu Thr Thr
115 120 125
Gly Tyr Ala Arg Pro Lys Val Phe Asn Glu Phe Met Ser Tyr Met Asp
130 135 140
Phe Met Tyr Tyr Asp Cys Lys Gln Trp Asp Pro Ala Gln His Arg Ile
145 150 155 160
Gly Thr Gly Ala Asp Asn Gly Val Ile Leu Arg Asn Leu Ala Thr Ala
165 170 175
Val Gln Ala His Gln Lys Met Met Val Arg Ile Pro Val Ile Pro Gly
180 185 190
Phe Asn Tyr Thr Leu Asn Asp Ala Asp His Phe Gly Gln Leu Phe Asn
195 200 205
Gln Ile Gly Val Thr Glu Val Glu Leu Leu Pro Phe His Gln Phe Gly
210 215 220
Leu Lys Lys Tyr Gln Asp Leu Gly Arg Lys Tyr Ala Leu Val Asn Val
225 230 235 240
Lys Gln Leu Gln Ala Asp Asp Leu Ile Asp Tyr Ala Glu His Ile Arg
245 250 255
Ala His Gly Val Lys Val Arg Val Asn Gly Trp
260 265
<210> 15
<211> 822
<212> DNA
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> WCFS1
<400> 15
atggaaaaca aacaagtttc aacaacgcaa gcggcggcaa aggagccttt gataggctac 60
gttcactcca tcgaaacgtt tggctccgtt gacggaccag gtatccgtta cgtggcattc 120
cttcaaggat gccacatgcg ttgccaatac tgtcacaacc ctgatacttg gaaactcaac 180
gttggcgatc aaatgacggc cgacgagatt ctcgaagacg cggctaaata ccgggctttc 240
tggggcaaga cgggtggcat cacagtcagt ggtggtgaat cactggtaca aatcgacttc 300
atcttagact tattcgaaaa agccaaggcg atgaatatca gtacttgtct ggatacctct 360
ggacagcctt ttacccgaga acaacctttc tttgacaagt tcgaacgtct aatgaaggtc 420
acggacattt cgttggtcga cattaagcac atcgattctg ccaaacacaa gcagttgacc 480
cagtatggga acgaaaatat cttggatatg attcagtaca tggcccaaca ccacgatgat 540
atgtggattc gtcacgtcct ggttccccaa cggactgatt acgatgaaga cttgaagaaa 600
ctcggcgatt acattgctaa aattccaaac gacgtcgttc aaaaagtcga agtattgccg 660
taccatactt tgggcgttaa aaaatatcat gaaatgaaga tcaagtaccg gcttgaagga 720
atcgagtctc caacccaaga tcgggtggca aatgccgaaa agctactgca cactgctgat 780
tacaacgggt acaagacatg gatgccattg ccaaaacttt aa 822
<210> 16
<211> 273
<212> PRT
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> WCFS1
<400> 16
Met Glu Asn Lys Gln Val Ser Thr Thr Gln Ala Ala Ala Lys Glu Pro
1 5 10 15
Leu Ile Gly Tyr Val His Ser Ile Glu Thr Phe Gly Ser Val Asp Gly
20 25 30
Pro Gly Ile Arg Tyr Val Ala Phe Leu Gln Gly Cys His Met Arg Cys
35 40 45
Gln Tyr Cys His Asn Pro Asp Thr Trp Lys Leu Asn Val Gly Asp Gln
50 55 60
Met Thr Ala Asp Glu Ile Leu Glu Asp Ala Ala Lys Tyr Arg Ala Phe
65 70 75 80
Trp Gly Lys Thr Gly Gly Ile Thr Val Ser Gly Gly Glu Ser Leu Val
85 90 95
Gln Ile Asp Phe Ile Leu Asp Leu Phe Glu Lys Ala Lys Ala Met Asn
100 105 110
Ile Ser Thr Cys Leu Asp Thr Ser Gly Gln Pro Phe Thr Arg Glu Gln
115 120 125
Pro Phe Phe Asp Lys Phe Glu Arg Leu Met Lys Val Thr Asp Ile Ser
130 135 140
Leu Val Asp Ile Lys His Ile Asp Ser Ala Lys His Lys Gln Leu Thr
145 150 155 160
Gln Tyr Gly Asn Glu Asn Ile Leu Asp Met Ile Gln Tyr Met Ala Gln
165 170 175
His His Asp Asp Met Trp Ile Arg His Val Leu Val Pro Gln Arg Thr
180 185 190
Asp Tyr Asp Glu Asp Leu Lys Lys Leu Gly Asp Tyr Ile Ala Lys Ile
195 200 205
Pro Asn Asp Val Val Gln Lys Val Glu Val Leu Pro Tyr His Thr Leu
210 215 220
Gly Val Lys Lys Tyr His Glu Met Lys Ile Lys Tyr Arg Leu Glu Gly
225 230 235 240
Ile Glu Ser Pro Thr Gln Asp Arg Val Ala Asn Ala Glu Lys Leu Leu
245 250 255
His Thr Ala Asp Tyr Asn Gly Tyr Lys Thr Trp Met Pro Leu Pro Lys
260 265 270
Leu
<210> 17
<211> 822
<212> DNA
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> JDM1
<400> 17
atggaaaaca aacaagtttc aacaacgcaa gcggcggcaa aagagccttt gataggctac 60
gttcactcca tcgaaacgtt tggctccgtt gacggaccag gtatccgtta cgtggcattc 120
cttcaaggat gccacatgcg ttgccaatac tgtcacaacc ctgatacttg gaaactcaac 180
gttggcgatc aaatgacggc cgacgagatt ctcgaagacg cggctaaata ccgggctttc 240
tggggcaaga cgggtggcat cacagtcagt ggtggtgaat cactggtaca aatcgacttc 300
atcttagact tattcgaaaa agccaaggcg atgaatatca gtacttgtct ggatacctct 360
ggacagcctt ttacccgaga acaacctttc tttgacaagt tcgaacgtct aatgaaggtc 420
acggacattt cgttggtcga cattaagcac atcgattctg ccaaacacaa gcagttgacc 480
cagtatggga acgaaaatat cttggatatg attcagtaca tggcccaaca ccacgatgat 540
atgtggattc gtcacgtcct ggttccccaa cggactgatt acgatgaaga cttgaagaaa 600
ctcggcgatt acattgctaa gattccaaac gacgtcgttc aaaaagtcga agtattgccg 660
taccatactt tgggcgttaa aaaatatcat gaaatgaaga tcaagtaccg gcttgaagga 720
atcgagtctc caacccaaga tcgggtggca aatgccgaaa agctactgca cactgctgat 780
tacaacgggt acaagacatg gatgccattg ccaaaacttt aa 822
<210> 18
<211> 273
<212> PRT
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> JDM1
<400> 18
Met Glu Asn Lys Gln Val Ser Thr Thr Gln Ala Ala Ala Lys Glu Pro
1 5 10 15
Leu Ile Gly Tyr Val His Ser Ile Glu Thr Phe Gly Ser Val Asp Gly
20 25 30
Pro Gly Ile Arg Tyr Val Ala Phe Leu Gln Gly Cys His Met Arg Cys
35 40 45
Gln Tyr Cys His Asn Pro Asp Thr Trp Lys Leu Asn Val Gly Asp Gln
50 55 60
Met Thr Ala Asp Glu Ile Leu Glu Asp Ala Ala Lys Tyr Arg Ala Phe
65 70 75 80
Trp Gly Lys Thr Gly Gly Ile Thr Val Ser Gly Gly Glu Ser Leu Val
85 90 95
Gln Ile Asp Phe Ile Leu Asp Leu Phe Glu Lys Ala Lys Ala Met Asn
100 105 110
Ile Ser Thr Cys Leu Asp Thr Ser Gly Gln Pro Phe Thr Arg Glu Gln
115 120 125
Pro Phe Phe Asp Lys Phe Glu Arg Leu Met Lys Val Thr Asp Ile Ser
130 135 140
Leu Val Asp Ile Lys His Ile Asp Ser Ala Lys His Lys Gln Leu Thr
145 150 155 160
Gln Tyr Gly Asn Glu Asn Ile Leu Asp Met Ile Gln Tyr Met Ala Gln
165 170 175
His His Asp Asp Met Trp Ile Arg His Val Leu Val Pro Gln Arg Thr
180 185 190
Asp Tyr Asp Glu Asp Leu Lys Lys Leu Gly Asp Tyr Ile Ala Lys Ile
195 200 205
Pro Asn Asp Val Val Gln Lys Val Glu Val Leu Pro Tyr His Thr Leu
210 215 220
Gly Val Lys Lys Tyr His Glu Met Lys Ile Lys Tyr Arg Leu Glu Gly
225 230 235 240
Ile Glu Ser Pro Thr Gln Asp Arg Val Ala Asn Ala Glu Lys Leu Leu
245 250 255
His Thr Ala Asp Tyr Asn Gly Tyr Lys Thr Trp Met Pro Leu Pro Lys
260 265 270
Leu
<210> 19
<211> 804
<212> DNA
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> JDM1
<400> 19
atgccaacga tcacaactaa gacgcccgta aaaggactaa tatttaacat tcaaaaattt 60
agtatcaatg atggaccagg tattcgaaca gtagttttct ttaaagggtg cccgttacgc 120
tgcaagtggt gttctaatcc agaatcacaa tcaggtgagc aagaatcaat gtatgatgaa 180
cagaccgcca agcaaaccat cgtcggtgat tatatgacgg ttgatgatat tatgaaagtt 240
attctacaag ataaagactt ctatgaagag tctggcggtg gggtaacctt ctctggtggt 300
gaagttcttt ttcaagcttc ctttgcgatt gagcttgcta aggcagttaa agcagctggc 360
attaatttag cctgtgagac aactggttac gcacggccta aggtttttaa tgaattcatg 420
tcttatatgg acttcatgta ttatgactgt aaacaatggg acccagccca acatcgaatc 480
ggaacgggtg ccgataacgg ggtaatttta cgtaacttag caactgcagt gcaagctcat 540
caaaagatga tggttcggat tccggttatt ccaggtttta attatacatt gaatgacgcg 600
gatcattttg gacaactatt taatcagatt ggcgtaaccg aagttgaatt attgccattt 660
caccagtttg ggttgaaaaa gtatcaagat ttgggccgaa aatatgcgct agttaatgtt 720
aaacagttac aagcggatga cttaattgat tatgctgaac atattcgtgc acatggtgtt 780
aaagtacggg tgaatgggtg gtaa 804
<210> 20
<211> 267
<212> PRT
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> JDM1
<400> 20
Met Pro Thr Ile Thr Thr Lys Thr Pro Val Lys Gly Leu Ile Phe Asn
1 5 10 15
Ile Gln Lys Phe Ser Ile Asn Asp Gly Pro Gly Ile Arg Thr Val Val
20 25 30
Phe Phe Lys Gly Cys Pro Leu Arg Cys Lys Trp Cys Ser Asn Pro Glu
35 40 45
Ser Gln Ser Gly Glu Gln Glu Ser Met Tyr Asp Glu Gln Thr Ala Lys
50 55 60
Gln Thr Ile Val Gly Asp Tyr Met Thr Val Asp Asp Ile Met Lys Val
65 70 75 80
Ile Leu Gln Asp Lys Asp Phe Tyr Glu Glu Ser Gly Gly Gly Val Thr
85 90 95
Phe Ser Gly Gly Glu Val Leu Phe Gln Ala Ser Phe Ala Ile Glu Leu
100 105 110
Ala Lys Ala Val Lys Ala Ala Gly Ile Asn Leu Ala Cys Glu Thr Thr
115 120 125
Gly Tyr Ala Arg Pro Lys Val Phe Asn Glu Phe Met Ser Tyr Met Asp
130 135 140
Phe Met Tyr Tyr Asp Cys Lys Gln Trp Asp Pro Ala Gln His Arg Ile
145 150 155 160
Gly Thr Gly Ala Asp Asn Gly Val Ile Leu Arg Asn Leu Ala Thr Ala
165 170 175
Val Gln Ala His Gln Lys Met Met Val Arg Ile Pro Val Ile Pro Gly
180 185 190
Phe Asn Tyr Thr Leu Asn Asp Ala Asp His Phe Gly Gln Leu Phe Asn
195 200 205
Gln Ile Gly Val Thr Glu Val Glu Leu Leu Pro Phe His Gln Phe Gly
210 215 220
Leu Lys Lys Tyr Gln Asp Leu Gly Arg Lys Tyr Ala Leu Val Asn Val
225 230 235 240
Lys Gln Leu Gln Ala Asp Asp Leu Ile Asp Tyr Ala Glu His Ile Arg
245 250 255
Ala His Gly Val Lys Val Arg Val Asn Gly Trp
260 265
<210> 21
<211> 852
<212> DNA
<213> 干酪乳杆菌
<220>
<221> 杂项特征
<223> bl23
<400> 21
atgaaactca tcgatcagtc acaaagccca ttaaatatct tagaacaagt tggtcaggat 60
catgatggcc cgatcaaagg gtatgttcac tcggtcgaaa gttttggttc ggtcgatggc 120
cctggtattc gcttcgttgt ctttatgcaa gggtgtcgca tgcgttgcca gtattgtcac 180
aaccctgaca cctggaacat tggggttggt gaagaaatga cggccgatca aattttggcg 240
gatgcccagc gctataaagc attctggggt gaccaagggg gtattacctg cagtggcggt 300
gagagtttgg tacaaatcga tttcattctc gaactcttca ccaaggctaa ggcactggga 360
atttcgactt gcctcgatac gtcaggtggc cccttcacgc gtgaccaacc gtggtttggc 420
cagtttgaaa agctgatggc tgttactgac atctcattag ttgatattaa acacattgat 480
tcggccgagc ataaaaagct caccggtttt cctaatgaga atattttgga tatggtgcag 540
tatatgtcgg cgcatggtga tgacatgtgg attcgccacg ttctggtccc ggaacgcact 600
gactttgacc cttatctcaa acggttaggg gactatattg cgacattgga caaaaacgtg 660
gtccaaaaag ttgagattct gccgtatcac acgttaggcg ttaaaaagta tcacgagctt 720
ggcattacgt acccgcttga aggcatcgaa ccgccgtctg ccgaacgcgt taagaatgca 780
gagaatctgc tgcacgttaa ggattatacc ggatggcaaa gctggcgtcc gaaaccagtt 840
gcgagcaact ga 852
<210> 22
<211> 283
<212> PRT
<213> 干酪乳杆菌
<220>
<221> 杂项特征
<223> bl23
<400> 22
Met Lys Leu Ile Asp Gln Ser Gln Ser Pro Leu Asn Ile Leu Glu Gln
1 5 10 15
Val Gly Gln Asp His Asp Gly Pro Ile Lys Gly Tyr Val His Ser Val
20 25 30
Glu Ser Phe Gly Ser Val Asp Gly Pro Gly Ile Arg Phe Val Val Phe
35 40 45
Met Gln Gly Cys Arg Met Arg Cys Gln Tyr Cys His Asn Pro Asp Thr
50 55 60
Trp Asn Ile Gly Val Gly Glu Glu Met Thr Ala Asp Gln Ile Leu Ala
65 70 75 80
Asp Ala Gln Arg Tyr Lys Ala Phe Trp Gly Asp Gln Gly Gly Ile Thr
85 90 95
Cys Ser Gly Gly Glu Ser Leu Val Gln Ile Asp Phe Ile Leu Glu Leu
100 105 110
Phe Thr Lys Ala Lys Ala Leu Gly Ile Ser Thr Cys Leu Asp Thr Ser
115 120 125
Gly Gly Pro Phe Thr Arg Asp Gln Pro Trp Phe Gly Gln Phe Glu Lys
130 135 140
Leu Met Ala Val Thr Asp Ile Ser Leu Val Asp Ile Lys His Ile Asp
145 150 155 160
Ser Ala Glu His Lys Lys Leu Thr Gly Phe Pro Asn Glu Asn Ile Leu
165 170 175
Asp Met Val Gln Tyr Met Ser Ala His Gly Asp Asp Met Trp Ile Arg
180 185 190
His Val Leu Val Pro Glu Arg Thr Asp Phe Asp Pro Tyr Leu Lys Arg
195 200 205
Leu Gly Asp Tyr Ile Ala Thr Leu Asp Lys Asn Val Val Gln Lys Val
210 215 220
Glu Ile Leu Pro Tyr His Thr Leu Gly Val Lys Lys Tyr His Glu Leu
225 230 235 240
Gly Ile Thr Tyr Pro Leu Glu Gly Ile Glu Pro Pro Ser Ala Glu Arg
245 250 255
Val Lys Asn Ala Glu Asn Leu Leu His Val Lys Asp Tyr Thr Gly Trp
260 265 270
Gln Ser Trp Arg Pro Lys Pro Val Ala Ser Asn
275 280
<210> 23
<211> 852
<212> DNA
<213> 干酪乳杆菌
<220>
<221> 杂项特征
<223> ATCC 334
<400> 23
atgaaactca tcgatcagtc acaaagccca ttaaatatct tagaacaagt tggtcaggat 60
catgatggcc cgatcaaagg gtatgttcac tcggtcgaaa gttttggttc ggtcgatggc 120
cctggtattc gcttcgttgt ctttatgcaa gggtgtcgca tgcgttgcca gtattgtcac 180
aaccctgaca cctggaacat tggggttggt gaagaaatga cggccgatca aattttggcg 240
gatgcccagc gctataaagc attctggggt gaccaagggg gtattacgtg cagtggcggt 300
gagagtttgg tacaaatcga tttcattctc gaactcttca ccaaggctaa ggcactggga 360
atttcgactt gcctcgatac gtcaggcggc cccttcacgc gtgaccaacc gtggtttggc 420
cagtttgaaa agctgatggc tgttactgac atctcattag ttgatattaa acacatcgat 480
tcggccgagc ataaaaagct caccggtttt cctaatgaaa atattttaga tatggtgcag 540
tatatgtcgg cgcatggtga tgacatgtgg attcgccacg ttctggtccc ggaacgcact 600
gactttgacc cttatctcaa acgattaggg gactatattg cgacattgga caaaaacgtg 660
gtccaaaaag ttgagattct gccgtatcac acgttaggcg ttaaaaagta tcacgagctt 720
ggcattacgt acccgcttga aggcatcgaa ccgccgtctg ccgatcgcgt taagaatgca 780
gagaatctgc tgcacgttaa ggattatacc ggatggcaaa gctggcgtcc gaaaccagtt 840
gcgagcaact ga 852
<210> 24
<211> 283
<212> PRT
<213> 干酪乳杆菌
<220>
<221> 杂项特征
<223> ATCC 334
<400> 24
Met Lys Leu Ile Asp Gln Ser Gln Ser Pro Leu Asn Ile Leu Glu Gln
1 5 10 15
Val Gly Gln Asp His Asp Gly Pro Ile Lys Gly Tyr Val His Ser Val
20 25 30
Glu Ser Phe Gly Ser Val Asp Gly Pro Gly Ile Arg Phe Val Val Phe
35 40 45
Met Gln Gly Cys Arg Met Arg Cys Gln Tyr Cys His Asn Pro Asp Thr
50 55 60
Trp Asn Ile Gly Val Gly Glu Glu Met Thr Ala Asp Gln Ile Leu Ala
65 70 75 80
Asp Ala Gln Arg Tyr Lys Ala Phe Trp Gly Asp Gln Gly Gly Ile Thr
85 90 95
Cys Ser Gly Gly Glu Ser Leu Val Gln Ile Asp Phe Ile Leu Glu Leu
100 105 110
Phe Thr Lys Ala Lys Ala Leu Gly Ile Ser Thr Cys Leu Asp Thr Ser
115 120 125
Gly Gly Pro Phe Thr Arg Asp Gln Pro Trp Phe Gly Gln Phe Glu Lys
130 135 140
Leu Met Ala Val Thr Asp Ile Ser Leu Val Asp Ile Lys His Ile Asp
145 150 155 160
Ser Ala Glu His Lys Lys Leu Thr Gly Phe Pro Asn Glu Asn Ile Leu
165 170 175
Asp Met Val Gln Tyr Met Ser Ala His Gly Asp Asp Met Trp Ile Arg
180 185 190
His Val Leu Val Pro Glu Arg Thr Asp Phe Asp Pro Tyr Leu Lys Arg
195 200 205
Leu Gly Asp Tyr Ile Ala Thr Leu Asp Lys Asn Val Val Gln Lys Val
210 215 220
Glu Ile Leu Pro Tyr His Thr Leu Gly Val Lys Lys Tyr His Glu Leu
225 230 235 240
Gly Ile Thr Tyr Pro Leu Glu Gly Ile Glu Pro Pro Ser Ala Asp Arg
245 250 255
Val Lys Asn Ala Glu Asn Leu Leu His Val Lys Asp Tyr Thr Gly Trp
260 265 270
Gln Ser Trp Arg Pro Lys Pro Val Ala Ser Asn
275 280
<210> 25
<211> 879
<212> DNA
<213> 青春双岐杆菌
<400> 25
atgtctgaac atattttccg ttccacgacc agacacatgc tgagggattc caaggactac 60
gtcaatcaga cgctgatggg aggcctgtcc ggattcgaat cgccaatcgg cttggaccgt 120
ctcgaccgca tcaaggcgtt gaaaagcggc gatatcggtt tcgtgcactc gtgggacatc 180
aacacttccg tggatggtcc tggcaccaga atgaccgtgt tcatgagcgg atgccctctg 240
cgctgccagt actgccagaa tccggatact tggaagatgc gcgacggcaa gcccgtctac 300
tacgaagcca tggtcaagaa aatcgagcgg tatgccgatt tattcaaggc caccggcggc 360
ggcatcactt tctccggcgg cgaatccatg atgcagccgg ctttcgtgtc acgcgtgttc 420
catgccgcca agcagatggg agtgcatacc tgcctcgaca cgtccggatt cctcggggcg 480
agctacaccg atgacatggt ggatgacatc gacctgtgcc tgcttgacgt caaatccggc 540
gatgaggaga cctaccataa ggtgaccggc ggcatcctgc agccgaccat cgacttcgga 600
cagcgtctgg ccaaggcagg caagaagatc tgggtgcgtt tcgtgctcgt gccgggcctc 660
acatcctccg aagaaaacgt cgagaacgtg gcgaagatct gcgagacctt cggcgacgcg 720
ttggaacata tcgacgtatt gcccttccac cagcttggcc gtccgaagtg gcacatgctg 780
aacatcccat acccgttgga ggaccagaaa ggcccgtccg cggcaatgaa acaacgtgtg 840
gtcgagcagt tccagtcgca cggcttcacc gtgtactaa 879
<210> 26
<211> 292
<212> PRT
<213> 青春双岐杆菌
<400> 26
Met Ser Glu His Ile Phe Arg Ser Thr Thr Arg His Met Leu Arg Asp
1 5 10 15
Ser Lys Asp Tyr Val Asn Gln Thr Leu Met Gly Gly Leu Ser Gly Phe
20 25 30
Glu Ser Pro Ile Gly Leu Asp Arg Leu Asp Arg Ile Lys Ala Leu Lys
35 40 45
Ser Gly Asp Ile Gly Phe Val His Ser Trp Asp Ile Asn Thr Ser Val
50 55 60
Asp Gly Pro Gly Thr Arg Met Thr Val Phe Met Ser Gly Cys Pro Leu
65 70 75 80
Arg Cys Gln Tyr Cys Gln Asn Pro Asp Thr Trp Lys Met Arg Asp Gly
85 90 95
Lys Pro Val Tyr Tyr Glu Ala Met Val Lys Lys Ile Glu Arg Tyr Ala
100 105 110
Asp Leu Phe Lys Ala Thr Gly Gly Gly Ile Thr Phe Ser Gly Gly Glu
115 120 125
Ser Met Met Gln Pro Ala Phe Val Ser Arg Val Phe His Ala Ala Lys
130 135 140
Gln Met Gly Val His Thr Cys Leu Asp Thr Ser Gly Phe Leu Gly Ala
145 150 155 160
Ser Tyr Thr Asp Asp Met Val Asp Asp Ile Asp Leu Cys Leu Leu Asp
165 170 175
Val Lys Ser Gly Asp Glu Glu Thr Tyr His Lys Val Thr Gly Gly Ile
180 185 190
Leu Gln Pro Thr Ile Asp Phe Gly Gln Arg Leu Ala Lys Ala Gly Lys
195 200 205
Lys Ile Trp Val Arg Phe Val Leu Val Pro Gly Leu Thr Ser Ser Glu
210 215 220
Glu Asn Val Glu Asn Val Ala Lys Ile Cys Glu Thr Phe Gly Asp Ala
225 230 235 240
Leu Glu His Ile Asp Val Leu Pro Phe His Gln Leu Gly Arg Pro Lys
245 250 255
Trp His Met Leu Asn Ile Pro Tyr Pro Leu Glu Asp Gln Lys Gly Pro
260 265 270
Ser Ala Ala Met Lys Gln Arg Val Val Glu Gln Phe Gln Ser His Gly
275 280 285
Phe Thr Val Tyr
290
<210> 27
<211> 882
<212> DNA
<213> 长双岐杆菌
<220>
<221> 杂项特征
<223> NCC2705
<400> 27
atgcccgcaa cacccacgtt ccgcaccacg accaggcata tgctcaagga atcgaagacc 60
tatgcctcgc agactttgat gggcggcctt tccggctttg aatccccaat cggactcgac 120
cgacgtgacc gcctttccgc cctgaaatcc ggcgatatcg gcttcgtcca ctcttgggac 180
atcaacacct ccgtggacgg accgggcacc cgtatgaccg tgttcatgtc cggctgcccg 240
ctgcgctgcc agtactgcca gaacccggac acttggaaga tgcgcgacgg caagcccgtc 300
taccttgacg ccatgatcaa gaaggtcgat cgttacaagg acctgttcaa ggccacgcat 360
ggcggtatca ccttctccgg cggcgaatcc atgatgcagc ccgccttcgt ctcgcgtgtg 420
ttccatgccg ccaaggagat gggcgtgcac acctgcctcg acacgtccgg cttcctcaac 480
acgaattaca ccgacgagat gctcgaggac atcgacctgt gtctgctcga cgtcaaatcc 540
ggcgacgagg agacctatca caaggtcacc ggcggcacct tgcagcccac catcgatttt 600
ggccagcgac tggccaaggc cggcaagaag atctgggtgc gatttgtgct cgtgccgggc 660
ctgaccgact ccgaagagaa cgtcgaaaac gtggcgaaga tctgcgagtc cttcggcgat 720
gccgtcgaac acatcgacgt gctgggattc caccagcttg gccgcccgaa gtggcacgaa 780
ctgcgcatcc catacccgct ggagaaccag aagggaccca acgccgccac ccgcgaacgg 840
gtggccaacc agttcaagga ccacggcttc accgtgtatt aa 882
<210> 28
<211> 293
<212> PRT
<213> 长双岐杆菌
<220>
<221> 杂项特征
<223> NCC2705
<400> 28
Met Pro Ala Thr Pro Thr Phe Arg Thr Thr Thr Arg His Met Leu Lys
1 5 10 15
Glu Ser Lys Thr Tyr Ala Ser Gln Thr Leu Met Gly Gly Leu Ser Gly
20 25 30
Phe Glu Ser Pro Ile Gly Leu Asp Arg Arg Asp Arg Leu Ser Ala Leu
35 40 45
Lys Ser Gly Asp Ile Gly Phe Val His Ser Trp Asp Ile Asn Thr Ser
50 55 60
Val Asp Gly Pro Gly Thr Arg Met Thr Val Phe Met Ser Gly Cys Pro
65 70 75 80
Leu Arg Cys Gln Tyr Cys Gln Asn Pro Asp Thr Trp Lys Met Arg Asp
85 90 95
Gly Lys Pro Val Tyr Leu Asp Ala Met Ile Lys Lys Val Asp Arg Tyr
100 105 110
Lys Asp Leu Phe Lys Ala Thr His Gly Gly Ile Thr Phe Ser Gly Gly
115 120 125
Glu Ser Met Met Gln Pro Ala Phe Val Ser Arg Val Phe His Ala Ala
130 135 140
Lys Glu Met Gly Val His Thr Cys Leu Asp Thr Ser Gly Phe Leu Asn
145 150 155 160
Thr Asn Tyr Thr Asp Glu Met Leu Glu Asp Ile Asp Leu Cys Leu Leu
165 170 175
Asp Val Lys Ser Gly Asp Glu Glu Thr Tyr His Lys Val Thr Gly Gly
180 185 190
Thr Leu Gln Pro Thr Ile Asp Phe Gly Gln Arg Leu Ala Lys Ala Gly
195 200 205
Lys Lys Ile Trp Val Arg Phe Val Leu Val Pro Gly Leu Thr Asp Ser
210 215 220
Glu Glu Asn Val Glu Asn Val Ala Lys Ile Cys Glu Ser Phe Gly Asp
225 230 235 240
Ala Val Glu His Ile Asp Val Leu Gly Phe His Gln Leu Gly Arg Pro
245 250 255
Lys Trp His Glu Leu Arg Ile Pro Tyr Pro Leu Glu Asn Gln Lys Gly
260 265 270
Pro Asn Ala Ala Thr Arg Glu Arg Val Ala Asn Gln Phe Lys Asp His
275 280 285
Gly Phe Thr Val Tyr
290
<210> 29
<211> 882
<212> DNA
<213> 长双岐杆菌
<220>
<221> 杂项特征
<223> DJO10A
<400> 29
atgcccgcaa cacccacgtt ccgcaccacg accaggcata tgctcaagga atcgaagacc 60
tatgcctcgc agactttgat gggtggcctt tccggctttg aatccccaat cggactcgac 120
cgacgtgacc gcctttccgc cctgaaatcc ggtgatatcg gcttcgtcca ctcttgggac 180
atcaacacct ccgtggatgg accgggcacc cgcatgaccg tgttcatgtc cggctgcccg 240
ctgcgctgcc agtactgcca gaacccggac acttggaaga tgcgcgacgg caagcccgtc 300
taccttgacg ccatgatcaa gaaggtcgat cgttacaagg acctgttcaa ggccacgcat 360
ggcggtatca ccttctccgg cggcgaatcc atgatgcagc ccgccttcgt ctcgcgtgtg 420
ttccatgccg ccaaggagat gggcgtgcac acctgcctcg atacgtccgg cttcctcaac 480
acgaattaca ccgacgagat gctcgaggac atcgacctgt gtctgctcga cgtcaaatcc 540
ggcgacgagg agacctatca caaggtcacc ggcggcacct tgcagcccac catcgatttt 600
ggccagcgac tggccaaggc cggcaagaag atctgggtgc gatttgtgct cgtgccgggc 660
ctgaccgact ccgaagagaa cgtcgaaaac gtggcgaaga tctgcgagtc cttcggtgat 720
gccgtcgaac acatcgacgt gctgggattc caccagcttg gccgcccgaa gtggcacgaa 780
ctgcgtatcc catacccgct ggagaaccag aagggaccca acgccgccac ccgcgaacgg 840
gtgaccaacc agttcaagga ccacggcttc accgtgtatt aa 882
<210> 30
<211> 293
<212> PRT
<213> 长双岐杆菌
<220>
<221> 杂项特征
<223> DJO10A
<400> 30
Met Pro Ala Thr Pro Thr Phe Arg Thr Thr Thr Arg His Met Leu Lys
1 5 10 15
Glu Ser Lys Thr Tyr Ala Ser Gln Thr Leu Met Gly Gly Leu Ser Gly
20 25 30
Phe Glu Ser Pro Ile Gly Leu Asp Arg Arg Asp Arg Leu Ser Ala Leu
35 40 45
Lys Ser Gly Asp Ile Gly Phe Val His Ser Trp Asp Ile Asn Thr Ser
50 55 60
Val Asp Gly Pro Gly Thr Arg Met Thr Val Phe Met Ser Gly Cys Pro
65 70 75 80
Leu Arg Cys Gln Tyr Cys Gln Asn Pro Asp Thr Trp Lys Met Arg Asp
85 90 95
Gly Lys Pro Val Tyr Leu Asp Ala Met Ile Lys Lys Val Asp Arg Tyr
100 105 110
Lys Asp Leu Phe Lys Ala Thr His Gly Gly Ile Thr Phe Ser Gly Gly
115 120 125
Glu Ser Met Met Gln Pro Ala Phe Val Ser Arg Val Phe His Ala Ala
130 135 140
Lys Glu Met Gly Val His Thr Cys Leu Asp Thr Ser Gly Phe Leu Asn
145 150 155 160
Thr Asn Tyr Thr Asp Glu Met Leu Glu Asp Ile Asp Leu Cys Leu Leu
165 170 175
Asp Val Lys Ser Gly Asp Glu Glu Thr Tyr His Lys Val Thr Gly Gly
180 185 190
Thr Leu Gln Pro Thr Ile Asp Phe Gly Gln Arg Leu Ala Lys Ala Gly
195 200 205
Lys Lys Ile Trp Val Arg Phe Val Leu Val Pro Gly Leu Thr Asp Ser
210 215 220
Glu Glu Asn Val Glu Asn Val Ala Lys Ile Cys Glu Ser Phe Gly Asp
225 230 235 240
Ala Val Glu His Ile Asp Val Leu Gly Phe His Gln Leu Gly Arg Pro
245 250 255
Lys Trp His Glu Leu Arg Ile Pro Tyr Pro Leu Glu Asn Gln Lys Gly
260 265 270
Pro Asn Ala Ala Thr Arg Glu Arg Val Thr Asn Gln Phe Lys Asp His
275 280 285
Gly Phe Thr Val Tyr
290
<210> 31
<211> 903
<212> DNA
<213> 动物双歧杆菌
<220>
<221> 杂项特征
<223> DSM 10140
<400> 31
atgtcgaatt cagagtcgaa tcacggtgca tccgcattcc gcaccacgac gcggcacatg 60
ctcaagtcgt cgaaggagta ccagcgcaag acgctcatgg gcggtctgtc aggattcgaa 120
tcgcccatcg gactcgatcg gcgtgaccgc atcaatgcgt tgaaaaccgg cgacataggt 180
tttgtgcatt cctgggacat caatacgtcg gtggacggcc cgggcacccg catgacggta 240
ttcctgagcg gctgcccact gcgctgccag tactgccaga accccgacac ctggaagatg 300
cgcgacggca agccggtgta cctcgatgcc atggtggtca agatcgaacg gtacaaggac 360
ctgttcgaag ccacgaaagg cggcatcacc ttctcgggcg gcgagtccat gatgcagccg 420
gcattcgtgt cgcgggtgtt ccgggcggcc aaggagatgg gtgtgcacac ctgccttgat 480
acttcgggct tcctcaacgc caactattcg gatgaaatga tcgacgacat cgatctgtgc 540
ctgctcgatg tgaagtccgg agacgaggag acctacaagc gggtaaccgg gggagtgctc 600
cagcccacca tcgatttcgg acagcggttg aacaggaggg gcaagaagat ctgggtgcgc 660
ttcgtgctgg ttcccgggct cacctcgtcg gaggagaacg tggagaatgt ggcccgcatc 720
tgtgagagct tcggcgacgc ggtggagcat atagacgtgc tgccgttcca ccagctcggg 780
cgtccgaagt ggcatgagct gcgaatccct tacccgttgg aggaccagaa gggaccttcc 840
caggcgttgc gcgaccgcgt gcgccagcag ttcgagagcc acggattcac ggtctacgtc 900
taa 903
<210> 32
<211> 300
<212> PRT
<213> 动物双歧杆菌
<220>
<221> 杂项特征
<223> DSM 10140
<400> 32
Met Ser Asn Ser Glu Ser Asn His Gly Ala Ser Ala Phe Arg Thr Thr
1 5 10 15
Thr Arg His Met Leu Lys Ser Ser Lys Glu Tyr Gln Arg Lys Thr Leu
20 25 30
Met Gly Gly Leu Ser Gly Phe Glu Ser Pro Ile Gly Leu Asp Arg Arg
35 40 45
Asp Arg Ile Asn Ala Leu Lys Thr Gly Asp Ile Gly Phe Val His Ser
50 55 60
Trp Asp Ile Asn Thr Ser Val Asp Gly Pro Gly Thr Arg Met Thr Val
65 70 75 80
Phe Leu Ser Gly Cys Pro Leu Arg Cys Gln Tyr Cys Gln Asn Pro Asp
85 90 95
Thr Trp Lys Met Arg Asp Gly Lys Pro Val Tyr Leu Asp Ala Met Val
100 105 110
Val Lys Ile Glu Arg Tyr Lys Asp Leu Phe Glu Ala Thr Lys Gly Gly
115 120 125
Ile Thr Phe Ser Gly Gly Glu Ser Met Met Gln Pro Ala Phe Val Ser
130 135 140
Arg Val Phe Arg Ala Ala Lys Glu Met Gly Val His Thr Cys Leu Asp
145 150 155 160
Thr Ser Gly Phe Leu Asn Ala Asn Tyr Ser Asp Glu Met Ile Asp Asp
165 170 175
Ile Asp Leu Cys Leu Leu Asp Val Lys Ser Gly Asp Glu Glu Thr Tyr
180 185 190
Lys Arg Val Thr Gly Gly Val Leu Gln Pro Thr Ile Asp Phe Gly Gln
195 200 205
Arg Leu Asn Arg Arg Gly Lys Lys Ile Trp Val Arg Phe Val Leu Val
210 215 220
Pro Gly Leu Thr Ser Ser Glu Glu Asn Val Glu Asn Val Ala Arg Ile
225 230 235 240
Cys Glu Ser Phe Gly Asp Ala Val Glu His Ile Asp Val Leu Pro Phe
245 250 255
His Gln Leu Gly Arg Pro Lys Trp His Glu Leu Arg Ile Pro Tyr Pro
260 265 270
Leu Glu Asp Gln Lys Gly Pro Ser Gln Ala Leu Arg Asp Arg Val Arg
275 280 285
Gln Gln Phe Glu Ser His Gly Phe Thr Val Tyr Val
290 295 300
<210> 33
<211> 720
<212> DNA
<213> 解纤维素梭菌
<400> 33
atggagatta aagggaggat acattcattt gagacatttg ggaccgtgga cggtcccgga 60
attagattta ttgtgtttct gaagggctgc ccgcttcgct gtaagtactg ccacaacaga 120
gatgcatgga gttcagaggg tgcaaaactg tacagtcctc aagaggtgtt gaaggaaatc 180
cagaaataca ggaattttat agatgcctct catggaggaa taacagtcag cgggggagaa 240
cctttaattc agcatgaatt tgtaaaggaa ctatttaaat tatgtcgtga agctgggata 300
cataccgctg tggacacttc cggctacgtc aatgtggaag atgtaaagga cacactagag 360
tatacagacc ttgttcttct tgatttaaag caggcaaatg cacagaagca tttggaattg 420
acaggagtgg agaataagcg tatcaagctg tttacaacct acctgggtga aatcggaaaa 480
cctgtttgga taagatatgt gcttataccg ggttatacag atggtgaaga ggatttgctg 540
gcagcataca attatttaaa gggatttaaa aatatagaga aaatagaggt tcttccatat 600
cacataatgg gaaaggcaaa atgggagaag ctgaacgtac aatatcccct ggagggagtt 660
ccttccccta cacaggaaga ggtggacagg gccaaaaaca tcctgactac aggaaaaccg 720
<210> 34
<211> 240
<212> PRT
<213> 解纤维素梭菌
<400> 34
Met Glu Ile Lys Gly Arg Ile His Ser Phe Glu Thr Phe Gly Thr Val
1 5 10 15
Asp Gly Pro Gly Ile Arg Phe Ile Val Phe Leu Lys Gly Cys Pro Leu
20 25 30
Arg Cys Lys Tyr Cys His Asn Arg Asp Ala Trp Ser Ser Glu Gly Ala
35 40 45
Lys Leu Tyr Ser Pro Gln Glu Val Leu Lys Glu Ile Gln Lys Tyr Arg
50 55 60
Asn Phe Ile Asp Ala Ser His Gly Gly Ile Thr Val Ser Gly Gly Glu
65 70 75 80
Pro Leu Ile Gln His Glu Phe Val Lys Glu Leu Phe Lys Leu Cys Arg
85 90 95
Glu Ala Gly Ile His Thr Ala Val Asp Thr Ser Gly Tyr Val Asn Val
100 105 110
Glu Asp Val Lys Asp Thr Leu Glu Tyr Thr Asp Leu Val Leu Leu Asp
115 120 125
Leu Lys Gln Ala Asn Ala Gln Lys His Leu Glu Leu Thr Gly Val Glu
130 135 140
Asn Lys Arg Ile Lys Leu Phe Thr Thr Tyr Leu Gly Glu Ile Gly Lys
145 150 155 160
Pro Val Trp Ile Arg Tyr Val Leu Ile Pro Gly Tyr Thr Asp Gly Glu
165 170 175
Glu Asp Leu Leu Ala Ala Tyr Asn Tyr Leu Lys Gly Phe Lys Asn Ile
180 185 190
Glu Lys Ile Glu Val Leu Pro Tyr His Ile Met Gly Lys Ala Lys Trp
195 200 205
Glu Lys Leu Asn Val Gln Tyr Pro Leu Glu Gly Val Pro Ser Pro Thr
210 215 220
Gln Glu Glu Val Asp Arg Ala Lys Asn Ile Leu Thr Thr Gly Lys Pro
225 230 235 240
<210> 35
<211> 741
<212> DNA
<213> 大肠杆菌
<400> 35
atgtcagtta ttggtcgcat tcactccttt gaatcctgtg gaaccgtaga cggcccaggt 60
attcgcttta tcaccttttt ccagggctgc ctgatgcgct gcctgtattg tcataaccgc 120
gacacctggg acacgcatgg cggtaaagaa gttaccgttg aagatttgat gaaggaagtg 180
gtgacctatc gccactttat gaacgcttcc ggcggcggcg ttaccgcatc cggcggtgaa 240
gcaatcctgc aagctgagtt tgttcgtgac tggttccgcg cctgcaaaaa agaaggcatt 300
catacctgtc tggacaccaa cggttttgtt cgtcgttacg atccggtgat tgatgaactg 360
ctggaagtaa ccgacctggt aatgctcgat ctcaaacaga tgaacgacga gatccaccaa 420
aatctggttg gagtttccaa ccaccgcacg ctggagttcg ctaaatatct ggcgaacaaa 480
aatgtgaagg tgtggatccg ctacgttgtt gtcccaggct ggtctgacga tgacgattca 540
gcgcatcgcc tcggtgaatt tacccgtgat atgggcaacg ttgagaaaat cgagcttctc 600
ccctaccacg agctgggcaa acacaaatgg gtggcaatgg gtgaagagta caaactcgac 660
ggtgttaaac caccgaagaa agagaccatg gaacgcgtga aaggcattct tgagcagtac 720
ggtcataagg taatgttcta a 741
<210> 36
<211> 246
<212> PRT
<213> 大肠杆菌
<400> 36
Met Ser Val Ile Gly Arg Ile His Ser Phe Glu Ser Cys Gly Thr Val
1 5 10 15
Asp Gly Pro Gly Ile Arg Phe Ile Thr Phe Phe Gln Gly Cys Leu Met
20 25 30
Arg Cys Leu Tyr Cys His Asn Arg Asp Thr Trp Asp Thr His Gly Gly
35 40 45
Lys Glu Val Thr Val Glu Asp Leu Met Lys Glu Val Val Thr Tyr Arg
50 55 60
His Phe Met Asn Ala Ser Gly Gly Gly Val Thr Ala Ser Gly Gly Glu
65 70 75 80
Ala Ile Leu Gln Ala Glu Phe Val Arg Asp Trp Phe Arg Ala Cys Lys
85 90 95
Lys Glu Gly Ile His Thr Cys Leu Asp Thr Asn Gly Phe Val Arg Arg
100 105 110
Tyr Asp Pro Val Ile Asp Glu Leu Leu Glu Val Thr Asp Leu Val Met
115 120 125
Leu Asp Leu Lys Gln Met Asn Asp Glu Ile His Gln Asn Leu Val Gly
130 135 140
Val Ser Asn His Arg Thr Leu Glu Phe Ala Lys Tyr Leu Ala Asn Lys
145 150 155 160
Asn Val Lys Val Trp Ile Arg Tyr Val Val Val Pro Gly Trp Ser Asp
165 170 175
Asp Asp Asp Ser Ala His Arg Leu Gly Glu Phe Thr Arg Asp Met Gly
180 185 190
Asn Val Glu Lys Ile Glu Leu Leu Pro Tyr His Glu Leu Gly Lys His
195 200 205
Lys Trp Val Ala Met Gly Glu Glu Tyr Lys Leu Asp Gly Val Lys Pro
210 215 220
Pro Lys Lys Glu Thr Met Glu Arg Val Lys Gly Ile Leu Glu Gln Tyr
225 230 235 240
Gly His Lys Val Met Phe
245
<210> 37
<211> 2226
<212> DNA
<213> 地衣芽孢杆菌
<220>
<221> 杂项特征
<223> DSM13
<400> 37
atggaacaat ggaaaggttt caccacaaac gtttggcaaa aagaagtcaa tgtccgcgat 60
tttattctct cgaactttga gccatatcaa ggtgacgaat cgtttctcga acctccgacg 120
gaagctacat cggcattatg ggatcatgta atggatttga caaaaaaaga gcgtgaaaac 180
ggaggcgtcc ttgatatgga tacagagatc gtctcaacga tcacctcgca cggtcccgga 240
tatttgaaca aagacctgga aaaagtcgtc ggcgttcaaa ccgatgagcc gtttaaacgg 300
tcgcttcagc ctttcggcgg catccgaatg gcaaagcagg catgcgaatc ctatggtttt 360
aaactgaatg aagaagtgga aaggatcttt accgattacc gcaaaactca taaccaaggc 420
gtgtttgacg catatacgga cgaaatgaag ctcgcccgaa aagtcggaat cattaccgga 480
ctgcctgatg cttacgggcg cgggcgcatc atcggtgatt accggagagt ggcgctttac 540
ggcgtggatt tcttgatcga tgaaaagaaa aaagatgcgg ccggcacctc tcgggtgatg 600
tctgaagaaa acatccgcct tcgtgaagaa ctgtcagaac aaatccgagc attgaacgaa 660
cttaaagcgc ttgcaaaaag ctatgggttt gacatttcca agcctgcggc gaatgcaaga 720
gaagcatttc aatggctgta ttttgcctat ttggctgcca ttaaagagca aaacggagca 780
gcaatgagcc ttggccgcgt gtccacgttc cttgatattt acatcgaaag agatttgaaa 840
acgggcgtat taacagagcg tgaagcccaa gagcttgtcg accatttcgt catgaagctg 900
cgtttggtca aattcgcgcg cacacctgac tacaatgaac tgttcagcgg cgatccgacg 960
tgggtgacag aatcaatcgg cggaatggcg cacgacggac gcgccctggt gacgaaaaac 1020
tcgttccgtt tcctgcatac gcttgacaat ttaggcccgg cgcctgaacc gaatttaacc 1080
gttctttggt ctgtcagact gccgcaaaag tttaaaaact actgtgccaa aatgtcgatt 1140
aaaacaagct cgatccaata cgaaaatgac gatatcatgc gtccagaata cggtgatgac 1200
tacggaatcg cctgctgtgt atcggcaatg gcaatcggca aacaaatgca gttcttcgga 1260
gcacgcgcca acttggcgaa agctctttta tatgcgatta acggcggaaa agacgaaaag 1320
cataaaatgc aagtcggtcc ggaaatgccg ccggttgctt ccgacgtgct ggactatgac 1380
gaagtgatgc ataaattcga tcagacgatg gaatggctcg caggcttgta catcaacacg 1440
ctcaatgtca ttcactacat gcatgataaa tattgctatg aaagaattga aatggccctg 1500
cacgacacgg aaattttgcg gacgatggcc actgggatcg ccggcttgag tgttgtcgcc 1560
gattcattaa gcgctgtcaa atatgccaaa gtcagcgtgg tccgcgatga aaacggcatt 1620
gcggtcgatt ttgaaacaga aggcgacttt cctaagtacg gaaataacga tgaccgcgtc 1680
gacgcgatcg ccgttgacat tgtcaagcgc tttatgaaaa aactgcgcaa gcatcagaca 1740
tatcgccagt ccgttcagac catgtcaatt ttaacgatca cgtcaaacgt cgtttacggc 1800
aagaaaaccg gaaatacgcc ggatggacgc cgcgcgggag aaccgtttgc tccaggtgcg 1860
aatccgatgc acggccgcga tactaaaggg acgcttgcat cgctgtcttc agtggcaaag 1920
ctgccttaca gctatgcgct cgacggcatt tccaacacct tttcaatcgt cccgaaagcg 1980
cttggcaaag acgaagagag ccgcgccgcc aatttgtcaa gcatccttga cggatatgcc 2040
gcaaaaacag gacatcactt aaatgtaaac gtatttaaca gagagacact gctcgacgcc 2100
atggaacatc cagaggaata tccgcagtta acgattcgcg tctcaggcta tgcggtcaac 2160
tttattaagc tgacgaaaga acagcagtta gacgtcatca gcagaacctt ccatgaatcg 2220
atgtag 2226
<210> 38
<211> 741
<212> PRT
<213> 地衣芽孢杆菌
<220>
<221> 杂项特征
<223> DSM13
<400> 38
Met Glu Gln Trp Lys Gly Phe Thr Thr Asn Val Trp Gln Lys Glu Val
1 5 10 15
Asn Val Arg Asp Phe Ile Leu Ser Asn Phe Glu Pro Tyr Gln Gly Asp
20 25 30
Glu Ser Phe Leu Glu Pro Pro Thr Glu Ala Thr Ser Ala Leu Trp Asp
35 40 45
His Val Met Asp Leu Thr Lys Lys Glu Arg Glu Asn Gly Gly Val Leu
50 55 60
Asp Met Asp Thr Glu Ile Val Ser Thr Ile Thr Ser His Gly Pro Gly
65 70 75 80
Tyr Leu Asn Lys Asp Leu Glu Lys Val Val Gly Val Gln Thr Asp Glu
85 90 95
Pro Phe Lys Arg Ser Leu Gln Pro Phe Gly Gly Ile Arg Met Ala Lys
100 105 110
Gln Ala Cys Glu Ser Tyr Gly Phe Lys Leu Asn Glu Glu Val Glu Arg
115 120 125
Ile Phe Thr Asp Tyr Arg Lys Thr His Asn Gln Gly Val Phe Asp Ala
130 135 140
Tyr Thr Asp Glu Met Lys Leu Ala Arg Lys Val Gly Ile Ile Thr Gly
145 150 155 160
Leu Pro Asp Ala Tyr Gly Arg Gly Arg Ile Ile Gly Asp Tyr Arg Arg
165 170 175
Val Ala Leu Tyr Gly Val Asp Phe Leu Ile Asp Glu Lys Lys Lys Asp
180 185 190
Ala Ala Gly Thr Ser Arg Val Met Ser Glu Glu Asn Ile Arg Leu Arg
195 200 205
Glu Glu Leu Ser Glu Gln Ile Arg Ala Leu Asn Glu Leu Lys Ala Leu
210 215 220
Ala Lys Ser Tyr Gly Phe Asp Ile Ser Lys Pro Ala Ala Asn Ala Arg
225 230 235 240
Glu Ala Phe Gln Trp Leu Tyr Phe Ala Tyr Leu Ala Ala Ile Lys Glu
245 250 255
Gln Asn Gly Ala Ala Met Ser Leu Gly Arg Val Ser Thr Phe Leu Asp
260 265 270
Ile Tyr Ile Glu Arg Asp Leu Lys Thr Gly Val Leu Thr Glu Arg Glu
275 280 285
Ala Gln Glu Leu Val Asp His Phe Val Met Lys Leu Arg Leu Val Lys
290 295 300
Phe Ala Arg Thr Pro Asp Tyr Asn Glu Leu Phe Ser Gly Asp Pro Thr
305 310 315 320
Trp Val Thr Glu Ser Ile Gly Gly Met Ala His Asp Gly Arg Ala Leu
325 330 335
Val Thr Lys Asn Ser Phe Arg Phe Leu His Thr Leu Asp Asn Leu Gly
340 345 350
Pro Ala Pro Glu Pro Asn Leu Thr Val Leu Trp Ser Val Arg Leu Pro
355 360 365
Gln Lys Phe Lys Asn Tyr Cys Ala Lys Met Ser Ile Lys Thr Ser Ser
370 375 380
Ile Gln Tyr Glu Asn Asp Asp Ile Met Arg Pro Glu Tyr Gly Asp Asp
385 390 395 400
Tyr Gly Ile Ala Cys Cys Val Ser Ala Met Ala Ile Gly Lys Gln Met
405 410 415
Gln Phe Phe Gly Ala Arg Ala Asn Leu Ala Lys Ala Leu Leu Tyr Ala
420 425 430
Ile Asn Gly Gly Lys Asp Glu Lys His Lys Met Gln Val Gly Pro Glu
435 440 445
Met Pro Pro Val Ala Ser Asp Val Leu Asp Tyr Asp Glu Val Met His
450 455 460
Lys Phe Asp Gln Thr Met Glu Trp Leu Ala Gly Leu Tyr Ile Asn Thr
465 470 475 480
Leu Asn Val Ile His Tyr Met His Asp Lys Tyr Cys Tyr Glu Arg Ile
485 490 495
Glu Met Ala Leu His Asp Thr Glu Ile Leu Arg Thr Met Ala Thr Gly
500 505 510
Ile Ala Gly Leu Ser Val Val Ala Asp Ser Leu Ser Ala Val Lys Tyr
515 520 525
Ala Lys Val Ser Val Val Arg Asp Glu Asn Gly Ile Ala Val Asp Phe
530 535 540
Glu Thr Glu Gly Asp Phe Pro Lys Tyr Gly Asn Asn Asp Asp Arg Val
545 550 555 560
Asp Ala Ile Ala Val Asp Ile Val Lys Arg Phe Met Lys Lys Leu Arg
565 570 575
Lys His Gln Thr Tyr Arg Gln Ser Val Gln Thr Met Ser Ile Leu Thr
580 585 590
Ile Thr Ser Asn Val Val Tyr Gly Lys Lys Thr Gly Asn Thr Pro Asp
595 600 605
Gly Arg Arg Ala Gly Glu Pro Phe Ala Pro Gly Ala Asn Pro Met His
610 615 620
Gly Arg Asp Thr Lys Gly Thr Leu Ala Ser Leu Ser Ser Val Ala Lys
625 630 635 640
Leu Pro Tyr Ser Tyr Ala Leu Asp Gly Ile Ser Asn Thr Phe Ser Ile
645 650 655
Val Pro Lys Ala Leu Gly Lys Asp Glu Glu Ser Arg Ala Ala Asn Leu
660 665 670
Ser Ser Ile Leu Asp Gly Tyr Ala Ala Lys Thr Gly His His Leu Asn
675 680 685
Val Asn Val Phe Asn Arg Glu Thr Leu Leu Asp Ala Met Glu His Pro
690 695 700
Glu Glu Tyr Pro Gln Leu Thr Ile Arg Val Ser Gly Tyr Ala Val Asn
705 710 715 720
Phe Ile Lys Leu Thr Lys Glu Gln Gln Leu Asp Val Ile Ser Arg Thr
725 730 735
Phe His Glu Ser Met
740
<210> 39
<211> 2226
<212> DNA
<213> 地衣芽孢杆菌
<220>
<221> 杂项特征
<223> ATCC14580
<400> 39
atggaacaat ggaaaggttt caccacaaac gtttggcaaa aagaagtcaa tgtccgcgat 60
tttattctct cgaactttga gccatatcaa ggtgacgaat cgtttctcga acctccgacg 120
gaagctacat cggcattatg ggatcatgta atggatttga caaaaaaaga gcgtgaaaac 180
ggaggcgtcc ttgatatgga tacagagatc gtctcaacga tcacctcgca cggtcccgga 240
tatttgaaca aagacctgga aaaagtcgtc ggcgttcaaa ccgatgagcc gtttaaacgg 300
tcgcttcagc ctttcggcgg catccgaatg gcaaagcagg catgcgaatc ctatggtttt 360
aaactgaatg aagaagtgga aaggatcttt accgattacc gcaaaactca taaccaaggc 420
gtgtttgacg catatacgga cgaaatgaag ctcgcccgaa aagtcggaat cattaccgga 480
ctgcctgatg cttacgggcg cgggcgcatc atcggtgatt accggagagt ggcgctttac 540
ggcgtggatt tcttgatcga tgaaaagaaa aaagatgcgg ccggcacctc tcgggtgatg 600
tctgaagaaa acatccgcct tcgtgaagaa ctgtcagaac aaatccgagc attgaacgaa 660
cttaaagcgc ttgcaaaaag ctatgggttt gacatttcca agcctgcggc gaatgcaaga 720
gaagcatttc aatggctgta ttttgcctat ttggctgcca ttaaagagca aaacggagca 780
gcaatgagcc ttggccgcgt gtccacgttc cttgatattt acatcgaaag agatttgaaa 840
acgggcgtat taacagagcg tgaagcccaa gagcttgtcg accatttcgt catgaagctg 900
cgtttggtca aattcgcgcg cacacctgac tacaatgaac tgttcagcgg cgatccgacg 960
tgggtgacag aatcaatcgg cggaatggcg cacgacggac gcgccctggt gacgaaaaac 1020
tcgttccgtt tcctgcatac gcttgacaat ttaggcccgg cgcctgaacc gaatttaacc 1080
gttctttggt ctgtcagact gccgcaaaag tttaaaaact actgtgccaa aatgtcgatt 1140
aaaacaagct cgatccaata cgaaaatgac gatatcatgc gtccagaata cggtgatgac 1200
tacggaatcg cctgctgtgt atcggcaatg gcaatcggca aacaaatgca gttcttcgga 1260
gcacgcgcca acttggcgaa agctctttta tatgcgatta acggcggaaa agacgaaaag 1320
cataaaatgc aagtcggtcc ggaaatgccg ccggttgctt ccgacgtgct ggactatgac 1380
gaagtgatgc ataaattcga tcagacgatg gaatggctcg caggcttgta catcaacacg 1440
ctcaatgtca ttcactacat gcatgataaa tattgctatg aaagaattga aatggccctg 1500
cacgacacgg aaattttgcg gacgatggcc actgggatcg ccggcttgag tgttgtcgcc 1560
gattcattaa gcgctgtcaa atatgccaaa gtcagcgtgg tccgcgatga aaacggcatt 1620
gcggtcgatt ttgaaacaga aggcgacttt cctaagtacg gaaataacga tgaccgcgtc 1680
gacgcgatcg ccgttgacat tgtcaagcgc tttatgaaaa aactgcgcaa gcatcagaca 1740
tatcgccagt ccgttcagac catgtcaatt ttaacgatca cgtcaaacgt cgtttacggc 1800
aagaaaaccg gaaatacgcc ggatggacgc cgcgcgggag aaccgtttgc tccaggtgcg 1860
aatccgatgc acggccgcga tactaaaggg acgcttgcat cgctgtcttc agtggcaaag 1920
ctgccttaca gctatgcgct cgacggcatt tccaacacct tttcaatcgt cccgaaagcg 1980
cttggcaaag acgaagagag ccgcgccgcc aatttgtcaa gcatccttga cggatatgcc 2040
gcaaaaacag gacatcactt aaatgtaaac gtatttaaca gagagacact gctcgacgcc 2100
atggaacatc cagaggaata tccgcagtta acgattcgcg tctcaggcta tgcggtcaac 2160
tttattaagc tgacgaaaga acagcagtta gacgtcatca gcagaacctt ccatgaatcg 2220
atgtag 2226
<210> 40
<211> 741
<212> PRT
<213> 地衣芽孢杆菌
<220>
<221> 杂项特征
<223> ATCC14580
<400> 40
Met Glu Gln Trp Lys Gly Phe Thr Thr Asn Val Trp Gln Lys Glu Val
1 5 10 15
Asn Val Arg Asp Phe Ile Leu Ser Asn Phe Glu Pro Tyr Gln Gly Asp
20 25 30
Glu Ser Phe Leu Glu Pro Pro Thr Glu Ala Thr Ser Ala Leu Trp Asp
35 40 45
His Val Met Asp Leu Thr Lys Lys Glu Arg Glu Asn Gly Gly Val Leu
50 55 60
Asp Met Asp Thr Glu Ile Val Ser Thr Ile Thr Ser His Gly Pro Gly
65 70 75 80
Tyr Leu Asn Lys Asp Leu Glu Lys Val Val Gly Val Gln Thr Asp Glu
85 90 95
Pro Phe Lys Arg Ser Leu Gln Pro Phe Gly Gly Ile Arg Met Ala Lys
100 105 110
Gln Ala Cys Glu Ser Tyr Gly Phe Lys Leu Asn Glu Glu Val Glu Arg
115 120 125
Ile Phe Thr Asp Tyr Arg Lys Thr His Asn Gln Gly Val Phe Asp Ala
130 135 140
Tyr Thr Asp Glu Met Lys Leu Ala Arg Lys Val Gly Ile Ile Thr Gly
145 150 155 160
Leu Pro Asp Ala Tyr Gly Arg Gly Arg Ile Ile Gly Asp Tyr Arg Arg
165 170 175
Val Ala Leu Tyr Gly Val Asp Phe Leu Ile Asp Glu Lys Lys Lys Asp
180 185 190
Ala Ala Gly Thr Ser Arg Val Met Ser Glu Glu Asn Ile Arg Leu Arg
195 200 205
Glu Glu Leu Ser Glu Gln Ile Arg Ala Leu Asn Glu Leu Lys Ala Leu
210 215 220
Ala Lys Ser Tyr Gly Phe Asp Ile Ser Lys Pro Ala Ala Asn Ala Arg
225 230 235 240
Glu Ala Phe Gln Trp Leu Tyr Phe Ala Tyr Leu Ala Ala Ile Lys Glu
245 250 255
Gln Asn Gly Ala Ala Met Ser Leu Gly Arg Val Ser Thr Phe Leu Asp
260 265 270
Ile Tyr Ile Glu Arg Asp Leu Lys Thr Gly Val Leu Thr Glu Arg Glu
275 280 285
Ala Gln Glu Leu Val Asp His Phe Val Met Lys Leu Arg Leu Val Lys
290 295 300
Phe Ala Arg Thr Pro Asp Tyr Asn Glu Leu Phe Ser Gly Asp Pro Thr
305 310 315 320
Trp Val Thr Glu Ser Ile Gly Gly Met Ala His Asp Gly Arg Ala Leu
325 330 335
Val Thr Lys Asn Ser Phe Arg Phe Leu His Thr Leu Asp Asn Leu Gly
340 345 350
Pro Ala Pro Glu Pro Asn Leu Thr Val Leu Trp Ser Val Arg Leu Pro
355 360 365
Gln Lys Phe Lys Asn Tyr Cys Ala Lys Met Ser Ile Lys Thr Ser Ser
370 375 380
Ile Gln Tyr Glu Asn Asp Asp Ile Met Arg Pro Glu Tyr Gly Asp Asp
385 390 395 400
Tyr Gly Ile Ala Cys Cys Val Ser Ala Met Ala Ile Gly Lys Gln Met
405 410 415
Gln Phe Phe Gly Ala Arg Ala Asn Leu Ala Lys Ala Leu Leu Tyr Ala
420 425 430
Ile Asn Gly Gly Lys Asp Glu Lys His Lys Met Gln Val Gly Pro Glu
435 440 445
Met Pro Pro Val Ala Ser Asp Val Leu Asp Tyr Asp Glu Val Met His
450 455 460
Lys Phe Asp Gln Thr Met Glu Trp Leu Ala Gly Leu Tyr Ile Asn Thr
465 470 475 480
Leu Asn Val Ile His Tyr Met His Asp Lys Tyr Cys Tyr Glu Arg Ile
485 490 495
Glu Met Ala Leu His Asp Thr Glu Ile Leu Arg Thr Met Ala Thr Gly
500 505 510
Ile Ala Gly Leu Ser Val Val Ala Asp Ser Leu Ser Ala Val Lys Tyr
515 520 525
Ala Lys Val Ser Val Val Arg Asp Glu Asn Gly Ile Ala Val Asp Phe
530 535 540
Glu Thr Glu Gly Asp Phe Pro Lys Tyr Gly Asn Asn Asp Asp Arg Val
545 550 555 560
Asp Ala Ile Ala Val Asp Ile Val Lys Arg Phe Met Lys Lys Leu Arg
565 570 575
Lys His Gln Thr Tyr Arg Gln Ser Val Gln Thr Met Ser Ile Leu Thr
580 585 590
Ile Thr Ser Asn Val Val Tyr Gly Lys Lys Thr Gly Asn Thr Pro Asp
595 600 605
Gly Arg Arg Ala Gly Glu Pro Phe Ala Pro Gly Ala Asn Pro Met His
610 615 620
Gly Arg Asp Thr Lys Gly Thr Leu Ala Ser Leu Ser Ser Val Ala Lys
625 630 635 640
Leu Pro Tyr Ser Tyr Ala Leu Asp Gly Ile Ser Asn Thr Phe Ser Ile
645 650 655
Val Pro Lys Ala Leu Gly Lys Asp Glu Glu Ser Arg Ala Ala Asn Leu
660 665 670
Ser Ser Ile Leu Asp Gly Tyr Ala Ala Lys Thr Gly His His Leu Asn
675 680 685
Val Asn Val Phe Asn Arg Glu Thr Leu Leu Asp Ala Met Glu His Pro
690 695 700
Glu Glu Tyr Pro Gln Leu Thr Ile Arg Val Ser Gly Tyr Ala Val Asn
705 710 715 720
Phe Ile Lys Leu Thr Lys Glu Gln Gln Leu Asp Val Ile Ser Arg Thr
725 730 735
Phe His Glu Ser Met
740
<210> 41
<211> 2310
<212> DNA
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> CNRZ1066
<400> 41
atggcaacgg ttaaaactaa cacagatgtt tttgaaaaag cgtgggaagg ctttaaagga 60
actgactgga aagaaaaagc aagtgtgtct cgcttcgtac aagcaaacta cacaccatat 120
gatggtgatg aaagcttcct tgcaggacca actgaacgct cacttaaaat caaaaaaatc 180
attgaagaaa ctaaagccca ctacgaagaa actcgtttcc caatggatac tcgtccgaca 240
tcaatcgcag atattcctgc cggctatatt tcaaaagacg acgaactaat ctacggtatt 300
caaaatgatg agttattcaa attgaatttc atgccaaaag gcggaattcg tatggcagaa 360
acagctctca aggaacatgg ctatgaacct gatccagctg ttcacgaaat ttttacaaaa 420
catgtaacta cagtaaatga cggtatcttc cgtgcttata catcaaatat ccgtcgtgca 480
cgtcacgcac acactataac tggacttcca gatgcttact ctcgtggacg tatcatcggt 540
gtttatgctc gccttgctct ttacggtgct gacttcttga tgcaagaaaa agtaaacgac 600
tggaactcta tcgaagaaat caacgaagaa actattcgtc ttcgtgaaga agttaacctt 660
caataccaag cacttcaaga tgttgttcgc cttggtgacc tttacggtgt agatgttcgt 720
cgtccagcct tcgatactaa agaagctatc caatggacaa acattgcttt tatggctgta 780
tgtcgtgtta tcaatggtgc ggctacttca cttggtcgtg tgccaatcgt ccttgacata 840
tatgcagaac gtgaccttgc tcgtggtact tacactgaat cagaaatcca agaattcgtt 900
gatgattttg tcttgaaact tcgtactgta aaattcgcac gtacaaaagc ttacgacgaa 960
ctttactcag gtgacccaac attcatcaca acttctatgg ctggtatggg tgctgacgga 1020
cgtcaccgtg ttactaaaat ggactaccgt ttcttgaaca cacttgataa tattggtaat 1080
gctccagaac caaacttgac agttctttgg tctgacaaat tgccttactc attccgtcgc 1140
tactgtatgc acatgagtca caagcactct tctattcaat acgaaggtgt gactactatg 1200
gctaaagacg gatacggtga aatgagctgt atctcatgtt gtgtatcacc acttgaccca 1260
gaaaacgaag aacaacgcca caacatccaa tacttcggtg ctcgtgttaa cgtacttaaa 1320
gcccttctta ctggtttgaa cggtggttac gacgatgttc ataaagacta caaagtattt 1380
gacatcgatc cagtccgtga tgaagttctt gactttgaca ctgttaaagc taacttcgaa 1440
aaatctcttg actggttgac tgacacttat gtagatgccc ttaacatcat ccactacatg 1500
actgataagt acaactacga agctgttcaa atggccttct tgccaactaa acaacgtgct 1560
aacatgggat tcggtatctg tggtttcgca aatactgttg atacattgtc agctatcaag 1620
tacgctacag ttaaaccaat ccgtgacgaa gatggctaca tctacgacta cgaaacaatc 1680
ggtgaatacc cacgttgggg tgaagatgac ccacgttcaa acgaattggc agaatggttg 1740
attgaagctt acactactcg tcttcgtagc cataaactct acaaagatgc agaagctaca 1800
gtttcacttc ttacaatcac ttcgaacgtt gcttactcta aacaaactgg taactctcca 1860
gttcacaaag gggtatacct caacgaagat ggttcagtga acttgtccaa attggaattc 1920
ttctcaccag gtgctaaccc atctaacaaa gctaaaggtg gatggttgca aaacttgaac 1980
tcacttgcaa gccttgactt cggttatgca gctgacggta tctcacttac tactcaagta 2040
tcacctcgtg cccttggtaa gactcgcgac gaacaagttg ataacctcgt aactatcctt 2100
gacggatact tcgaaaacgg tggacaacac cttaacttga acgttatgga cttgtcagct 2160
gtttacaaaa agatcatgag cggtgaagat gttatcgtac gtatctctgg atactgtgta 2220
aacactaaat acctcactcc agaacaaaaa actgaattga cacaacgtgt cttccacgaa 2280
gttctttcaa cggacgatgc tatgggataa 2310
<210> 42
<211> 769
<212> PRT
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> CNRZ1066
<400> 42
Met Ala Thr Val Lys Thr Asn Thr Asp Val Phe Glu Lys Ala Trp Glu
1 5 10 15
Gly Phe Lys Gly Thr Asp Trp Lys Glu Lys Ala Ser Val Ser Arg Phe
20 25 30
Val Gln Ala Asn Tyr Thr Pro Tyr Asp Gly Asp Glu Ser Phe Leu Ala
35 40 45
Gly Pro Thr Glu Arg Ser Leu Lys Ile Lys Lys Ile Ile Glu Glu Thr
50 55 60
Lys Ala His Tyr Glu Glu Thr Arg Phe Pro Met Asp Thr Arg Pro Thr
65 70 75 80
Ser Ile Ala Asp Ile Pro Ala Gly Tyr Ile Ser Lys Asp Asp Glu Leu
85 90 95
Ile Tyr Gly Ile Gln Asn Asp Glu Leu Phe Lys Leu Asn Phe Met Pro
100 105 110
Lys Gly Gly Ile Arg Met Ala Glu Thr Ala Leu Lys Glu His Gly Tyr
115 120 125
Glu Pro Asp Pro Ala Val His Glu Ile Phe Thr Lys His Val Thr Thr
130 135 140
Val Asn Asp Gly Ile Phe Arg Ala Tyr Thr Ser Asn Ile Arg Arg Ala
145 150 155 160
Arg His Ala His Thr Ile Thr Gly Leu Pro Asp Ala Tyr Ser Arg Gly
165 170 175
Arg Ile Ile Gly Val Tyr Ala Arg Leu Ala Leu Tyr Gly Ala Asp Phe
180 185 190
Leu Met Gln Glu Lys Val Asn Asp Trp Asn Ser Ile Glu Glu Ile Asn
195 200 205
Glu Glu Thr Ile Arg Leu Arg Glu Glu Val Asn Leu Gln Tyr Gln Ala
210 215 220
Leu Gln Asp Val Val Arg Leu Gly Asp Leu Tyr Gly Val Asp Val Arg
225 230 235 240
Arg Pro Ala Phe Asp Thr Lys Glu Ala Ile Gln Trp Thr Asn Ile Ala
245 250 255
Phe Met Ala Val Cys Arg Val Ile Asn Gly Ala Ala Thr Ser Leu Gly
260 265 270
Arg Val Pro Ile Val Leu Asp Ile Tyr Ala Glu Arg Asp Leu Ala Arg
275 280 285
Gly Thr Tyr Thr Glu Ser Glu Ile Gln Glu Phe Val Asp Asp Phe Val
290 295 300
Leu Lys Leu Arg Thr Val Lys Phe Ala Arg Thr Lys Ala Tyr Asp Glu
305 310 315 320
Leu Tyr Ser Gly Asp Pro Thr Phe Ile Thr Thr Ser Met Ala Gly Met
325 330 335
Gly Ala Asp Gly Arg His Arg Val Thr Lys Met Asp Tyr Arg Phe Leu
340 345 350
Asn Thr Leu Asp Asn Ile Gly Asn Ala Pro Glu Pro Asn Leu Thr Val
355 360 365
Leu Trp Ser Asp Lys Leu Pro Tyr Ser Phe Arg Arg Tyr Cys Met His
370 375 380
Met Ser His Lys His Ser Ser Ile Gln Tyr Glu Gly Val Thr Thr Met
385 390 395 400
Ala Lys Asp Gly Tyr Gly Glu Met Ser Cys Ile Ser Cys Cys Val Ser
405 410 415
Pro Leu Asp Pro Glu Asn Glu Glu Gln Arg His Asn Ile Gln Tyr Phe
420 425 430
Gly Ala Arg Val Asn Val Leu Lys Ala Leu Leu Thr Gly Leu Asn Gly
435 440 445
Gly Tyr Asp Asp Val His Lys Asp Tyr Lys Val Phe Asp Ile Asp Pro
450 455 460
Val Arg Asp Glu Val Leu Asp Phe Asp Thr Val Lys Ala Asn Phe Glu
465 470 475 480
Lys Ser Leu Asp Trp Leu Thr Asp Thr Tyr Val Asp Ala Leu Asn Ile
485 490 495
Ile His Tyr Met Thr Asp Lys Tyr Asn Tyr Glu Ala Val Gln Met Ala
500 505 510
Phe Leu Pro Thr Lys Gln Arg Ala Asn Met Gly Phe Gly Ile Cys Gly
515 520 525
Phe Ala Asn Thr Val Asp Thr Leu Ser Ala Ile Lys Tyr Ala Thr Val
530 535 540
Lys Pro Ile Arg Asp Glu Asp Gly Tyr Ile Tyr Asp Tyr Glu Thr Ile
545 550 555 560
Gly Glu Tyr Pro Arg Trp Gly Glu Asp Asp Pro Arg Ser Asn Glu Leu
565 570 575
Ala Glu Trp Leu Ile Glu Ala Tyr Thr Thr Arg Leu Arg Ser His Lys
580 585 590
Leu Tyr Lys Asp Ala Glu Ala Thr Val Ser Leu Leu Thr Ile Thr Ser
595 600 605
Asn Val Ala Tyr Ser Lys Gln Thr Gly Asn Ser Pro Val His Lys Gly
610 615 620
Val Tyr Leu Asn Glu Asp Gly Ser Val Asn Leu Ser Lys Leu Glu Phe
625 630 635 640
Phe Ser Pro Gly Ala Asn Pro Ser Asn Lys Ala Lys Gly Gly Trp Leu
645 650 655
Gln Asn Leu Asn Ser Leu Ala Ser Leu Asp Phe Gly Tyr Ala Ala Asp
660 665 670
Gly Ile Ser Leu Thr Thr Gln Val Ser Pro Arg Ala Leu Gly Lys Thr
675 680 685
Arg Asp Glu Gln Val Asp Asn Leu Val Thr Ile Leu Asp Gly Tyr Phe
690 695 700
Glu Asn Gly Gly Gln His Leu Asn Leu Asn Val Met Asp Leu Ser Ala
705 710 715 720
Val Tyr Lys Lys Ile Met Ser Gly Glu Asp Val Ile Val Arg Ile Ser
725 730 735
Gly Tyr Cys Val Asn Thr Lys Tyr Leu Thr Pro Glu Gln Lys Thr Glu
740 745 750
Leu Thr Gln Arg Val Phe His Glu Val Leu Ser Thr Asp Asp Ala Met
755 760 765
Gly
<210> 43
<211> 2310
<212> DNA
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> LMG18311
<400> 43
atggcaacgg ttaaaactaa cacagatgtt tttgaaaaag cgtgggaagg ctttaaagga 60
actgactgga aagaaaaagc aagtgtgtct cgcttcgtac aagcaaacta cacaccatat 120
gatggtgatg aaagcttcct tgcaggacca actgaacgct cacttaaaat caaaaaaatc 180
attgaagaaa ctaaagctca ctacgaagaa actcgtttcc caatggatac tcgtccgaca 240
tcaatcgcag atattcctgc cggctatatt tcaaaagacg acgaactaat ctacggtatt 300
caaaatgatg agttattcaa attgaatttc atgccaaaag gcggaattcg tatggcagaa 360
acagctctca aggaacatgg ctatgaacct gatccagctg ttcacgaaat ttttacaaaa 420
catgtaacta cagtaaatga cggtatcttc cgtgcttata catcaaatat ccgtcgtgca 480
cgtcacgcac acactataac tggacttcca gatgcttact ctcgtggacg tatcatcggt 540
gtttatgctc gccttgctct ttacggtgct gacttcttga tgcaagaaaa agtaaacgac 600
tggaactcta tcgaagaaat caacgaagaa actattcgtc ttcgtgaaga agttaacctt 660
caataccaag cacttcaaga tgttgttcgc cttggtgacc tttacggtgt agatgttcgt 720
cgtccagcct tcgatactaa agaagctatc caatggacaa acattgcttt tatggctgta 780
tgtcgtgtta tcaatggtgc ggctacttca cttggtcgtg tgccaatcgt ccttgacata 840
tatgcagaac gtgaccttgc tcgtggtact tacactgaat cagaaatcca agaattcgtt 900
gatgattttg tcttgaaact tcgtactgta aaattcgcac gtacaaaagc ttacgacgaa 960
ctttactcag gtgacccaac attcatcaca acttctatgg ctggtatggg tgctgacgga 1020
cgtcaccgtg ttactaaaat ggactaccgt ttcttgaaca cacttgataa tattggtaat 1080
gctccagaac caaacttgac agttctttgg tctgacaaat tgccttactc attccgtcgc 1140
tactgtatgc acatgagtca caagcactct tctattcaat acgaaggtgt gactactatg 1200
gctaaagacg gatacggtga aatgagctgt atctcatgtt gtgtatcacc acttgaccca 1260
gaaaacgaag aacaacgcca caacatccaa tacttcggtg ctcgtgttaa cgtacttaaa 1320
gcccttctta ctggtttgaa cggtggttac gacgatgttc ataaagacta caaagtattt 1380
gacatcgatc cagtccgtga tgaagttctt gactttgaca ctgttaaagc taacttcgaa 1440
aaatctcttg actggttgac tgacacttat gtagatgccc ttaacatcat ccactacatg 1500
actgataagt acaactacga agctgttcaa atggccttct tgccaactaa acaacgtgct 1560
aacatgggat tcggtatctg tggtttcgca aatactgttg atacattgtc agctatcaag 1620
tacgctacag ttaaaccaat ccgtgacgaa gatggctaca tctacgacta cgaaacaatc 1680
ggtgaatacc cacgttgggg tgaagatgac ccacgttcaa acgaattggc agaatggttg 1740
attgaagctt acactactcg tcttcgtagc cataaactct acaaagatgc agaagctaca 1800
gtttcacttc ttacaatcac ttcgaacgtt gcttactcta aacaaactgg taactctcca 1860
gttcacaaag gggtatacct caacgaagat ggttcagtga acttgtctaa attggaattc 1920
ttctcaccag gtgctaaccc atctaacaaa gctaaaggtg gatggttgca aaacttgaac 1980
tcacttgcaa gccttgactt cggttatgca gctgacggta tctcacttac tactcaagta 2040
tcacctcgtg cccttggtaa gactcgcgac gaacaagttg ataacctcgt aactatcctt 2100
gacggatact tcgaaaacgg tggacaacac cttaacttga acgttatgga cttgtcagct 2160
gtttacaaaa agatcatgag cggtgaagat gttatcgtac gtatctctgg atactgtgta 2220
aacactaaat acctcactcc agaacaaaaa actgaattga cacaacgtgt cttccacgaa 2280
gttctttcaa cggacgatgc tatgggataa 2310
<210> 44
<211> 769
<212> PRT
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> LMG18311
<400> 44
Met Ala Thr Val Lys Thr Asn Thr Asp Val Phe Glu Lys Ala Trp Glu
1 5 10 15
Gly Phe Lys Gly Thr Asp Trp Lys Glu Lys Ala Ser Val Ser Arg Phe
20 25 30
Val Gln Ala Asn Tyr Thr Pro Tyr Asp Gly Asp Glu Ser Phe Leu Ala
35 40 45
Gly Pro Thr Glu Arg Ser Leu Lys Ile Lys Lys Ile Ile Glu Glu Thr
50 55 60
Lys Ala His Tyr Glu Glu Thr Arg Phe Pro Met Asp Thr Arg Pro Thr
65 70 75 80
Ser Ile Ala Asp Ile Pro Ala Gly Tyr Ile Ser Lys Asp Asp Glu Leu
85 90 95
Ile Tyr Gly Ile Gln Asn Asp Glu Leu Phe Lys Leu Asn Phe Met Pro
100 105 110
Lys Gly Gly Ile Arg Met Ala Glu Thr Ala Leu Lys Glu His Gly Tyr
115 120 125
Glu Pro Asp Pro Ala Val His Glu Ile Phe Thr Lys His Val Thr Thr
130 135 140
Val Asn Asp Gly Ile Phe Arg Ala Tyr Thr Ser Asn Ile Arg Arg Ala
145 150 155 160
Arg His Ala His Thr Ile Thr Gly Leu Pro Asp Ala Tyr Ser Arg Gly
165 170 175
Arg Ile Ile Gly Val Tyr Ala Arg Leu Ala Leu Tyr Gly Ala Asp Phe
180 185 190
Leu Met Gln Glu Lys Val Asn Asp Trp Asn Ser Ile Glu Glu Ile Asn
195 200 205
Glu Glu Thr Ile Arg Leu Arg Glu Glu Val Asn Leu Gln Tyr Gln Ala
210 215 220
Leu Gln Asp Val Val Arg Leu Gly Asp Leu Tyr Gly Val Asp Val Arg
225 230 235 240
Arg Pro Ala Phe Asp Thr Lys Glu Ala Ile Gln Trp Thr Asn Ile Ala
245 250 255
Phe Met Ala Val Cys Arg Val Ile Asn Gly Ala Ala Thr Ser Leu Gly
260 265 270
Arg Val Pro Ile Val Leu Asp Ile Tyr Ala Glu Arg Asp Leu Ala Arg
275 280 285
Gly Thr Tyr Thr Glu Ser Glu Ile Gln Glu Phe Val Asp Asp Phe Val
290 295 300
Leu Lys Leu Arg Thr Val Lys Phe Ala Arg Thr Lys Ala Tyr Asp Glu
305 310 315 320
Leu Tyr Ser Gly Asp Pro Thr Phe Ile Thr Thr Ser Met Ala Gly Met
325 330 335
Gly Ala Asp Gly Arg His Arg Val Thr Lys Met Asp Tyr Arg Phe Leu
340 345 350
Asn Thr Leu Asp Asn Ile Gly Asn Ala Pro Glu Pro Asn Leu Thr Val
355 360 365
Leu Trp Ser Asp Lys Leu Pro Tyr Ser Phe Arg Arg Tyr Cys Met His
370 375 380
Met Ser His Lys His Ser Ser Ile Gln Tyr Glu Gly Val Thr Thr Met
385 390 395 400
Ala Lys Asp Gly Tyr Gly Glu Met Ser Cys Ile Ser Cys Cys Val Ser
405 410 415
Pro Leu Asp Pro Glu Asn Glu Glu Gln Arg His Asn Ile Gln Tyr Phe
420 425 430
Gly Ala Arg Val Asn Val Leu Lys Ala Leu Leu Thr Gly Leu Asn Gly
435 440 445
Gly Tyr Asp Asp Val His Lys Asp Tyr Lys Val Phe Asp Ile Asp Pro
450 455 460
Val Arg Asp Glu Val Leu Asp Phe Asp Thr Val Lys Ala Asn Phe Glu
465 470 475 480
Lys Ser Leu Asp Trp Leu Thr Asp Thr Tyr Val Asp Ala Leu Asn Ile
485 490 495
Ile His Tyr Met Thr Asp Lys Tyr Asn Tyr Glu Ala Val Gln Met Ala
500 505 510
Phe Leu Pro Thr Lys Gln Arg Ala Asn Met Gly Phe Gly Ile Cys Gly
515 520 525
Phe Ala Asn Thr Val Asp Thr Leu Ser Ala Ile Lys Tyr Ala Thr Val
530 535 540
Lys Pro Ile Arg Asp Glu Asp Gly Tyr Ile Tyr Asp Tyr Glu Thr Ile
545 550 555 560
Gly Glu Tyr Pro Arg Trp Gly Glu Asp Asp Pro Arg Ser Asn Glu Leu
565 570 575
Ala Glu Trp Leu Ile Glu Ala Tyr Thr Thr Arg Leu Arg Ser His Lys
580 585 590
Leu Tyr Lys Asp Ala Glu Ala Thr Val Ser Leu Leu Thr Ile Thr Ser
595 600 605
Asn Val Ala Tyr Ser Lys Gln Thr Gly Asn Ser Pro Val His Lys Gly
610 615 620
Val Tyr Leu Asn Glu Asp Gly Ser Val Asn Leu Ser Lys Leu Glu Phe
625 630 635 640
Phe Ser Pro Gly Ala Asn Pro Ser Asn Lys Ala Lys Gly Gly Trp Leu
645 650 655
Gln Asn Leu Asn Ser Leu Ala Ser Leu Asp Phe Gly Tyr Ala Ala Asp
660 665 670
Gly Ile Ser Leu Thr Thr Gln Val Ser Pro Arg Ala Leu Gly Lys Thr
675 680 685
Arg Asp Glu Gln Val Asp Asn Leu Val Thr Ile Leu Asp Gly Tyr Phe
690 695 700
Glu Asn Gly Gly Gln His Leu Asn Leu Asn Val Met Asp Leu Ser Ala
705 710 715 720
Val Tyr Lys Lys Ile Met Ser Gly Glu Asp Val Ile Val Arg Ile Ser
725 730 735
Gly Tyr Cys Val Asn Thr Lys Tyr Leu Thr Pro Glu Gln Lys Thr Glu
740 745 750
Leu Thr Gln Arg Val Phe His Glu Val Leu Ser Thr Asp Asp Ala Met
755 760 765
Gly
<210> 45
<211> 2310
<212> DNA
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> LMD-9
<400> 45
atggcaacgg ttaaaactaa cacagatgtt tttgaaaaag cgtgggaagg ctttaaagga 60
actgactgga aagaaaaagc aagtgtgtct cgcttcgtac aagcaaacta cacaccatat 120
gatggtgatg aaagcttcct tgcaggacca actgaacgct cacttaaaat caaaaaaatc 180
attgaagaaa ctaaagctca ctacgaagaa actcgtttcc caatggatac tcgtccgaca 240
tcaatcgcag atattcctgc cggctatatt tcaaaagacg acgaactaat ctacggtatt 300
caaaatgatg agttattcaa attgaatttc atgccaaaag gcggaattcg tatggcagaa 360
acagctctca aggaacatgg ctatgaacct gatccagctg ttcacgaaat ttttacaaaa 420
catgtaacta cagtaaatga cggtatcttc cgtgcttata catcaaatat ccgtcgtgca 480
cgtcacgcac acactataac tggacttcca gatgcttact ctcgtggacg tatcatcggt 540
gtttatgctc gccttgctct ttacggtgct gacttcttga tgcaagaaaa agtaaacgac 600
tggaactcta tcgaagaaat caacgaagaa actattcgtc ttcgtgaaga agttaacctt 660
caataccaag cacttcaaga tgttgttcgc cttggtgacc tttacggtgt agatgttcgt 720
cgtccagcct tcgatactaa agaagctatc caatggacaa acattgcttt tatggctgta 780
tgtcgtgtta tcaatggtgc ggctacttca cttggtcgtg tgccaatcgt ccttgacata 840
tatgcagaac gtgaccttgc tcgtggtact tacactgaat cagaaatcca agaattcgtt 900
gatgattttg tcttgaaact tcgtactgta aaattcgcac gtacaaaagc ttacgacgaa 960
ctttactcag gtgacccaac attcatcaca acttctatgg ctggtatggg tgctgacgga 1020
cgtcaccgtg ttactaaaat ggactaccgt ttcttgaaca cacttgataa tattggtaat 1080
gctccagaac caaacttgac agttctttgg tctgacaaat tgccttactc attccgtcgc 1140
tactgtatgc acatgagtca caagcactct tctattcaat acgaaggtgt gactactatg 1200
gctaaagacg gatacggtga aatgagctgt atctcatgtt gtgtatcacc acttgaccca 1260
gaaaacgaag aacaacgcca caacatccaa tacttcggtg ctcgtgttaa cgtacttaaa 1320
gcccttctta ctggtttgaa cggtggttac gacgatgttc ataaagacta caaagtattt 1380
gacatcgatc cagtccgtga tgaagttctt gactttgaca ctgttaaagc taacttcgaa 1440
aaatctcttg actggttgac tgacacttat gtagatgccc ttaacatcat ccactacatg 1500
actgataagt acaactacga agctgttcaa atggccttct tgccaactaa acaacgtgct 1560
aacatgggat tcggtatctg tggtttcgca aatactgttg atacattgtc agctatcaag 1620
tacgctacag ttaaaccaat ccgtgacgaa gatggctaca tctacgacta cgaaacaatc 1680
ggtgaatacc cacgttgggg tgaagatgac ccacgttcaa acgaattggc agaatggttg 1740
attgaagctt acactactcg tcttcgtagc cataaactct acaaagatgc agaagctaca 1800
gtttcacttc ttacaatcac ttcgaacgtt gcttactcta aacaaactgg taactctcca 1860
gttcacaaag gggtatacct caacgaagat ggttcagtga acttgtctaa attggaattc 1920
ttctcaccag gtgctaaccc atctaacaaa gctaaaggtg gatggttgca aaacttgaac 1980
tcacttgcaa gccttgactt cggttatgca gctgacggta tctcgcttac tactcaagta 2040
tcacctcgtg cccttggtaa gactcgcgac gaacaagttg ataacctcgt aactatcctt 2100
gacggatact tcgaaaacgg tggacaacac cttaacttga acgttatgga cttgtcagct 2160
gtttacaaaa agatcatgag cggtgaagat gttatcgtac gtatctctgg atactgtgta 2220
aacactaaat acctcactcc agaacaaaaa actgaattga cacaacgtgt cttccacgaa 2280
gttctttcaa cggacgatgc tatgggataa 2310
<210> 46
<211> 769
<212> PRT
<213> 嗜热链球菌
<220>
<221> 杂项特征
<223> LMD-9
<400> 46
Met Ala Thr Val Lys Thr Asn Thr Asp Val Phe Glu Lys Ala Trp Glu
1 5 10 15
Gly Phe Lys Gly Thr Asp Trp Lys Glu Lys Ala Ser Val Ser Arg Phe
20 25 30
Val Gln Ala Asn Tyr Thr Pro Tyr Asp Gly Asp Glu Ser Phe Leu Ala
35 40 45
Gly Pro Thr Glu Arg Ser Leu Lys Ile Lys Lys Ile Ile Glu Glu Thr
50 55 60
Lys Ala His Tyr Glu Glu Thr Arg Phe Pro Met Asp Thr Arg Pro Thr
65 70 75 80
Ser Ile Ala Asp Ile Pro Ala Gly Tyr Ile Ser Lys Asp Asp Glu Leu
85 90 95
Ile Tyr Gly Ile Gln Asn Asp Glu Leu Phe Lys Leu Asn Phe Met Pro
100 105 110
Lys Gly Gly Ile Arg Met Ala Glu Thr Ala Leu Lys Glu His Gly Tyr
115 120 125
Glu Pro Asp Pro Ala Val His Glu Ile Phe Thr Lys His Val Thr Thr
130 135 140
Val Asn Asp Gly Ile Phe Arg Ala Tyr Thr Ser Asn Ile Arg Arg Ala
145 150 155 160
Arg His Ala His Thr Ile Thr Gly Leu Pro Asp Ala Tyr Ser Arg Gly
165 170 175
Arg Ile Ile Gly Val Tyr Ala Arg Leu Ala Leu Tyr Gly Ala Asp Phe
180 185 190
Leu Met Gln Glu Lys Val Asn Asp Trp Asn Ser Ile Glu Glu Ile Asn
195 200 205
Glu Glu Thr Ile Arg Leu Arg Glu Glu Val Asn Leu Gln Tyr Gln Ala
210 215 220
Leu Gln Asp Val Val Arg Leu Gly Asp Leu Tyr Gly Val Asp Val Arg
225 230 235 240
Arg Pro Ala Phe Asp Thr Lys Glu Ala Ile Gln Trp Thr Asn Ile Ala
245 250 255
Phe Met Ala Val Cys Arg Val Ile Asn Gly Ala Ala Thr Ser Leu Gly
260 265 270
Arg Val Pro Ile Val Leu Asp Ile Tyr Ala Glu Arg Asp Leu Ala Arg
275 280 285
Gly Thr Tyr Thr Glu Ser Glu Ile Gln Glu Phe Val Asp Asp Phe Val
290 295 300
Leu Lys Leu Arg Thr Val Lys Phe Ala Arg Thr Lys Ala Tyr Asp Glu
305 310 315 320
Leu Tyr Ser Gly Asp Pro Thr Phe Ile Thr Thr Ser Met Ala Gly Met
325 330 335
Gly Ala Asp Gly Arg His Arg Val Thr Lys Met Asp Tyr Arg Phe Leu
340 345 350
Asn Thr Leu Asp Asn Ile Gly Asn Ala Pro Glu Pro Asn Leu Thr Val
355 360 365
Leu Trp Ser Asp Lys Leu Pro Tyr Ser Phe Arg Arg Tyr Cys Met His
370 375 380
Met Ser His Lys His Ser Ser Ile Gln Tyr Glu Gly Val Thr Thr Met
385 390 395 400
Ala Lys Asp Gly Tyr Gly Glu Met Ser Cys Ile Ser Cys Cys Val Ser
405 410 415
Pro Leu Asp Pro Glu Asn Glu Glu Gln Arg His Asn Ile Gln Tyr Phe
420 425 430
Gly Ala Arg Val Asn Val Leu Lys Ala Leu Leu Thr Gly Leu Asn Gly
435 440 445
Gly Tyr Asp Asp Val His Lys Asp Tyr Lys Val Phe Asp Ile Asp Pro
450 455 460
Val Arg Asp Glu Val Leu Asp Phe Asp Thr Val Lys Ala Asn Phe Glu
465 470 475 480
Lys Ser Leu Asp Trp Leu Thr Asp Thr Tyr Val Asp Ala Leu Asn Ile
485 490 495
Ile His Tyr Met Thr Asp Lys Tyr Asn Tyr Glu Ala Val Gln Met Ala
500 505 510
Phe Leu Pro Thr Lys Gln Arg Ala Asn Met Gly Phe Gly Ile Cys Gly
515 520 525
Phe Ala Asn Thr Val Asp Thr Leu Ser Ala Ile Lys Tyr Ala Thr Val
530 535 540
Lys Pro Ile Arg Asp Glu Asp Gly Tyr Ile Tyr Asp Tyr Glu Thr Ile
545 550 555 560
Gly Glu Tyr Pro Arg Trp Gly Glu Asp Asp Pro Arg Ser Asn Glu Leu
565 570 575
Ala Glu Trp Leu Ile Glu Ala Tyr Thr Thr Arg Leu Arg Ser His Lys
580 585 590
Leu Tyr Lys Asp Ala Glu Ala Thr Val Ser Leu Leu Thr Ile Thr Ser
595 600 605
Asn Val Ala Tyr Ser Lys Gln Thr Gly Asn Ser Pro Val His Lys Gly
610 615 620
Val Tyr Leu Asn Glu Asp Gly Ser Val Asn Leu Ser Lys Leu Glu Phe
625 630 635 640
Phe Ser Pro Gly Ala Asn Pro Ser Asn Lys Ala Lys Gly Gly Trp Leu
645 650 655
Gln Asn Leu Asn Ser Leu Ala Ser Leu Asp Phe Gly Tyr Ala Ala Asp
660 665 670
Gly Ile Ser Leu Thr Thr Gln Val Ser Pro Arg Ala Leu Gly Lys Thr
675 680 685
Arg Asp Glu Gln Val Asp Asn Leu Val Thr Ile Leu Asp Gly Tyr Phe
690 695 700
Glu Asn Gly Gly Gln His Leu Asn Leu Asn Val Met Asp Leu Ser Ala
705 710 715 720
Val Tyr Lys Lys Ile Met Ser Gly Glu Asp Val Ile Val Arg Ile Ser
725 730 735
Gly Tyr Cys Val Asn Thr Lys Tyr Leu Thr Pro Glu Gln Lys Thr Glu
740 745 750
Leu Thr Gln Arg Val Phe His Glu Val Leu Ser Thr Asp Asp Ala Met
755 760 765
Gly
<210> 47
<211> 2445
<212> DNA
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> WCFS1
<400> 47
atgatcatgt ctgaaacttt aactaaaaca acgacaacta ttaaccactt cggtaaattg 60
acgccaatga tggatcgctt acgcgatagc atcattgatg caaaacctta tgtcgatcca 120
gaacgggcga ttctcacaac cgaaacttat cgacaacacc aagacgaaca agtcgatata 180
ttacgggcta aaatgcttga acacgttctt gataaaatga gtatcttcat tgaagatgat 240
actttaattg ttggtaacca agcacgccaa aatcgttggg caccagtatt ccctgagtat 300
tctatgaatt gggtcattga tgaattagat acatttgaga agcgtcctgg tgacgttttc 360
tatattacgg agaaatccaa ggaagaactt cgtgcgattg cgcctttctg gaaacataat 420
accttggaag accgcggcta cgctagtttt ccagaagcaa gtcgtatttt ttatgattta 480
ggtattattg gagccgatgg taatatcact tctggtgatg gtcacattgc ggtcgactat 540
aaaaacgttg ttaataaggg acttaaatgg tatgaagacc gcattaagac agcacttgct 600
aatcttgacc ttactgattt taaccagcaa aaacaatact atttctataa agcgggccta 660
attgtaattg atgccattca caattttgct aaacgttacg cccaattagc gtccaagcaa 720
gctcaaaaca cgacatccgc aactcgcaaa gcacaacttg aaaaaatcgc ccaaattcta 780
aacaaggttc cttacgaacc tgcaaattca ttttatgaag cgattcaagc tgtctggtta 840
gttcatctga ccttacaaat cgaatccaac ggtcattctg tctcatatgg tcgtctagat 900
cagtacctag ctccattcta tgagcacgat ttaaaaactg gtgctattga cgccaacggt 960
gcaaccgaat tactcacaaa cttatgtctt aagacgttaa cgattaataa agtacgctca 1020
tggcaacata ctgaattttc tgcagggagt cccctctacc aaaacattac gattggtggt 1080
caaacaccag atggtaaaga tgccgttaat ccgacgtcct atctgatttt acgagcaatt 1140
gcgcaagcac atttaccaca acccaactta acggtccgtt atcaccatgg cttaagcgat 1200
aagtttatgc gtgaatgtgt cgaagttatt aaacaaggct taggtatgcc tgcgtttaat 1260
aacgacgaaa ttattattcc gtcgtttatt cgtcgtggcg tcaagaaaga agacgcctat 1320
aattacagtg ccatcggttg tgtcgaaaca gcgatccctg gaaaatgggg ctatcgttgc 1380
accgggatga gcttcattaa cttcccacgc gttctcttac tcattatgaa tggtggcatt 1440
gatcctgaat ctggcaaacg gttattaccc gattatggta agttcactga tatgacttct 1500
tttgatcaac ttatgactgc ttgggacaaa gcgctccgtg aaatgacacg acaaagtgtg 1560
attatcgaaa atagttgtga tttggctttg gaacaaaatt atcctgatat tctctgctcc 1620
gttttaaccg acgattgtat cggtcgtggt aagaccatta aagaaggtgg cgcggtatac 1680
gactttatca gtggattaca agttggtatt gctaacctag cggactccct agctgcaatc 1740
aagaaacttg tctttgaaga aaagaagttg acaacaaccc aactttggca cgcacttacc 1800
actgattttg cggatgaaga tggtgaaaag attcggcaga tgctcattaa tgatgcccca 1860
aagtatggta acgatgatga ttatgttgat gatttgattg ttgaagctta taaaccatat 1920
attgatgaaa ttgccaagta caaaaacacg cgctacggtc gcggccctat tggtggcttg 1980
cgctacgcag gaacctcttc tatttcggcc aacgttggtc aagggcacag cactttggct 2040
acaccagatg gtcggcacgc tcggacacca ttagccgaag gttgctcacc agaacatgca 2100
atggatactg atggcccaac tgctgtgttc aaatcagttt ccaaattatc cactaaggac 2160
atcactggtg gcgtattact gaaccaaaag atgtcaccac aaattctacg gagtgatgaa 2220
agctgcatga aattggttgc actactacgg accttcttca atcgacttca tggttaccat 2280
gtccaataca acattgtttc acgggatacc ttgattgatg cacagaacca tcctgacaag 2340
caccgtgact tgattgttcg ggttgctgga tattccgcct tcttcgtggg cctatccaaa 2400
gaaacccaag atgatattat cgaacggacg gagcagtctc tataa 2445
<210> 48
<211> 814
<212> PRT
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> WCFS1
<400> 48
Met Ile Met Ser Glu Thr Leu Thr Lys Thr Thr Thr Thr Ile Asn His
1 5 10 15
Phe Gly Lys Leu Thr Pro Met Met Asp Arg Leu Arg Asp Ser Ile Ile
20 25 30
Asp Ala Lys Pro Tyr Val Asp Pro Glu Arg Ala Ile Leu Thr Thr Glu
35 40 45
Thr Tyr Arg Gln His Gln Asp Glu Gln Val Asp Ile Leu Arg Ala Lys
50 55 60
Met Leu Glu His Val Leu Asp Lys Met Ser Ile Phe Ile Glu Asp Asp
65 70 75 80
Thr Leu Ile Val Gly Asn Gln Ala Arg Gln Asn Arg Trp Ala Pro Val
85 90 95
Phe Pro Glu Tyr Ser Met Asn Trp Val Ile Asp Glu Leu Asp Thr Phe
100 105 110
Glu Lys Arg Pro Gly Asp Val Phe Tyr Ile Thr Glu Lys Ser Lys Glu
115 120 125
Glu Leu Arg Ala Ile Ala Pro Phe Trp Lys His Asn Thr Leu Glu Asp
130 135 140
Arg Gly Tyr Ala Ser Phe Pro Glu Ala Ser Arg Ile Phe Tyr Asp Leu
145 150 155 160
Gly Ile Ile Gly Ala Asp Gly Asn Ile Thr Ser Gly Asp Gly His Ile
165 170 175
Ala Val Asp Tyr Lys Asn Val Val Asn Lys Gly Leu Lys Trp Tyr Glu
180 185 190
Asp Arg Ile Lys Thr Ala Leu Ala Asn Leu Asp Leu Thr Asp Phe Asn
195 200 205
Gln Gln Lys Gln Tyr Tyr Phe Tyr Lys Ala Gly Leu Ile Val Ile Asp
210 215 220
Ala Ile His Asn Phe Ala Lys Arg Tyr Ala Gln Leu Ala Ser Lys Gln
225 230 235 240
Ala Gln Asn Thr Thr Ser Ala Thr Arg Lys Ala Gln Leu Glu Lys Ile
245 250 255
Ala Gln Ile Leu Asn Lys Val Pro Tyr Glu Pro Ala Asn Ser Phe Tyr
260 265 270
Glu Ala Ile Gln Ala Val Trp Leu Val His Leu Thr Leu Gln Ile Glu
275 280 285
Ser Asn Gly His Ser Val Ser Tyr Gly Arg Leu Asp Gln Tyr Leu Ala
290 295 300
Pro Phe Tyr Glu His Asp Leu Lys Thr Gly Ala Ile Asp Ala Asn Gly
305 310 315 320
Ala Thr Glu Leu Leu Thr Asn Leu Cys Leu Lys Thr Leu Thr Ile Asn
325 330 335
Lys Val Arg Ser Trp Gln His Thr Glu Phe Ser Ala Gly Ser Pro Leu
340 345 350
Tyr Gln Asn Ile Thr Ile Gly Gly Gln Thr Pro Asp Gly Lys Asp Ala
355 360 365
Val Asn Pro Thr Ser Tyr Leu Ile Leu Arg Ala Ile Ala Gln Ala His
370 375 380
Leu Pro Gln Pro Asn Leu Thr Val Arg Tyr His His Gly Leu Ser Asp
385 390 395 400
Lys Phe Met Arg Glu Cys Val Glu Val Ile Lys Gln Gly Leu Gly Met
405 410 415
Pro Ala Phe Asn Asn Asp Glu Ile Ile Ile Pro Ser Phe Ile Arg Arg
420 425 430
Gly Val Lys Lys Glu Asp Ala Tyr Asn Tyr Ser Ala Ile Gly Cys Val
435 440 445
Glu Thr Ala Ile Pro Gly Lys Trp Gly Tyr Arg Cys Thr Gly Met Ser
450 455 460
Phe Ile Asn Phe Pro Arg Val Leu Leu Leu Ile Met Asn Gly Gly Ile
465 470 475 480
Asp Pro Glu Ser Gly Lys Arg Leu Leu Pro Asp Tyr Gly Lys Phe Thr
485 490 495
Asp Met Thr Ser Phe Asp Gln Leu Met Thr Ala Trp Asp Lys Ala Leu
500 505 510
Arg Glu Met Thr Arg Gln Ser Val Ile Ile Glu Asn Ser Cys Asp Leu
515 520 525
Ala Leu Glu Gln Asn Tyr Pro Asp Ile Leu Cys Ser Val Leu Thr Asp
530 535 540
Asp Cys Ile Gly Arg Gly Lys Thr Ile Lys Glu Gly Gly Ala Val Tyr
545 550 555 560
Asp Phe Ile Ser Gly Leu Gln Val Gly Ile Ala Asn Leu Ala Asp Ser
565 570 575
Leu Ala Ala Ile Lys Lys Leu Val Phe Glu Glu Lys Lys Leu Thr Thr
580 585 590
Thr Gln Leu Trp His Ala Leu Thr Thr Asp Phe Ala Asp Glu Asp Gly
595 600 605
Glu Lys Ile Arg Gln Met Leu Ile Asn Asp Ala Pro Lys Tyr Gly Asn
610 615 620
Asp Asp Asp Tyr Val Asp Asp Leu Ile Val Glu Ala Tyr Lys Pro Tyr
625 630 635 640
Ile Asp Glu Ile Ala Lys Tyr Lys Asn Thr Arg Tyr Gly Arg Gly Pro
645 650 655
Ile Gly Gly Leu Arg Tyr Ala Gly Thr Ser Ser Ile Ser Ala Asn Val
660 665 670
Gly Gln Gly His Ser Thr Leu Ala Thr Pro Asp Gly Arg His Ala Arg
675 680 685
Thr Pro Leu Ala Glu Gly Cys Ser Pro Glu His Ala Met Asp Thr Asp
690 695 700
Gly Pro Thr Ala Val Phe Lys Ser Val Ser Lys Leu Ser Thr Lys Asp
705 710 715 720
Ile Thr Gly Gly Val Leu Leu Asn Gln Lys Met Ser Pro Gln Ile Leu
725 730 735
Arg Ser Asp Glu Ser Cys Met Lys Leu Val Ala Leu Leu Arg Thr Phe
740 745 750
Phe Asn Arg Leu His Gly Tyr His Val Gln Tyr Asn Ile Val Ser Arg
755 760 765
Asp Thr Leu Ile Asp Ala Gln Asn His Pro Asp Lys His Arg Asp Leu
770 775 780
Ile Val Arg Val Ala Gly Tyr Ser Ala Phe Phe Val Gly Leu Ser Lys
785 790 795 800
Glu Thr Gln Asp Asp Ile Ile Glu Arg Thr Glu Gln Ser Leu
805 810
<210> 49
<211> 2259
<212> DNA
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> WCFS1
<400> 49
atgattacat cagaaaagac aacaaaacca gcagcttgga aaggtttcaa aggcgggcac 60
tggcaggaag aaatcaacat tcgtgatttt attcaaaata acttcacaca gtacaatggc 120
gacgaaagct tcctggccgg accaacagcc gctactaaga ccttgaatga caaagtctta 180
gaattaaaga aacaagaacg tgccgctggt ggtgtgttgg atgctgatac taaagtcgtt 240
gcaacgatta cttcacacgg ccctggttat attcaaaaag atctcgaaaa gattgttggt 300
ctccagactg acaagccttt gaagcgggcc ttcatgccat ttggtggtat tcgaatggct 360
gatgacgctt tgaaatcata cggttatacc cctgatgaag aaaacgacaa gattttcact 420
gaatatcgca agactcataa ccaaggcgtc ttcgatgttt atactcctga catgcggaaa 480
gcacgtcact acaagatcat caccggacta ccagatgcat acgcacgtgg ccgtctcatt 540
cctgatcttc cacgggtcgc tgtttatggg atcgatcgtt taatggaaga caaagctaat 600
gactttgccc acattggtga tggtgaattg actgatgatg ttattcgcct ccgtgaagaa 660
gttcaagatc aataccgtgc tttagcagat atgaagaaga tggctgccag ttatggctac 720
gatattagca agcctgcaac taatgctcaa gaagctattc aatggatgta cttcgcttac 780
ttagctgcta tcaagaccca aaacggcgct gcaatgtccg ttggccggat tgatacaacg 840
atggacatct tcatccaacg tgacttggac aatggtgttc tggacgaaag ccaagctcaa 900
gaattaattg atcaattcgt catgaaacta cggatggttc ggttcatccg tactgaagaa 960
tacaattctc tcttctctgg tgacccaatc tgggcaacct tatcaatgtg tggtttaggc 1020
gtcgacggtc aacaccatgt gactaagact gctttccgga ttttaaagac tttggacaac 1080
atgggcgccg caccagaacc aaacatcacg attttatggt cagaccgctt accagaagac 1140
ttcaaacgtt acgcaactga agtttcaatc gacagttcaa ccattcagta tgaaaatgat 1200
gacttgatgc gggtacaatg gggtaccgat tattatggca ttgcttgctg tgtttccgca 1260
caaccaattg ctgatggaat ccagtacttc ggtgcccggg caaacttagc caaagcgatt 1320
ctttatgcca tcaatggtgg ccgcgacgaa attgctggag atcaagttgg ccctgcttac 1380
gaaccaatta cttcagaata catcgattac gacgaattca tgaagaaatt agacaagcaa 1440
atggattggt tagctgacac ttacgttaac tcactgaatg caattcatta tatgcatgat 1500
aagtactact atgaagctgc ccaattagct ttgaagaata ctgatcttga tcggaccttt 1560
gcaactggga tttctggctt atcacatgcc gcggattcaa tctcagctat caagtatggt 1620
cacgttaaag taattcgtga cgaacgtggt atcgccgttg acttcaaagc cgacaatgac 1680
tacccacgtt atgggaacaa tgacgatcgc gctgatgaca ttgctaaatg gttagtcaaa 1740
gaattataca gcaagatgaa cacgcatcac ctctatcgga atgccaaact ttcaacttct 1800
gttttgacga ttacctccaa cgttgtttat ggtaagaaca ctggtaccac gccaaatggc 1860
cgtcaaaaag gcgaaccatt ctcaccaggt gctaaccctg catacggtgc tgaaaagagt 1920
ggtgcattag cttcacttct ttcaactgcc aaattaccat accgttacgc aactgacggg 1980
atttccaaca cgttcggcgt tacccctaac acgttaggcc atgacctcga atcacggaaa 2040
gacacgttag taaacatgtt agacggttac atgaagaacg atgggatgca cttgaacatc 2100
aacgtcttca ataaagacac tttgattgat gctcagaaac accctgaaga atacccaaca 2160
ttaacggttc gggtttctgg ctattgtgtc tacttcgcag atttaaccaa ggaacaacaa 2220
gatgacgtta tttcacggac attcttcgaa tcaatgtaa 2259
<210> 50
<211> 752
<212> PRT
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> WCFS1
<400> 50
Met Ile Thr Ser Glu Lys Thr Thr Lys Pro Ala Ala Trp Lys Gly Phe
1 5 10 15
Lys Gly Gly His Trp Gln Glu Glu Ile Asn Ile Arg Asp Phe Ile Gln
20 25 30
Asn Asn Phe Thr Gln Tyr Asn Gly Asp Glu Ser Phe Leu Ala Gly Pro
35 40 45
Thr Ala Ala Thr Lys Thr Leu Asn Asp Lys Val Leu Glu Leu Lys Lys
50 55 60
Gln Glu Arg Ala Ala Gly Gly Val Leu Asp Ala Asp Thr Lys Val Val
65 70 75 80
Ala Thr Ile Thr Ser His Gly Pro Gly Tyr Ile Gln Lys Asp Leu Glu
85 90 95
Lys Ile Val Gly Leu Gln Thr Asp Lys Pro Leu Lys Arg Ala Phe Met
100 105 110
Pro Phe Gly Gly Ile Arg Met Ala Asp Asp Ala Leu Lys Ser Tyr Gly
115 120 125
Tyr Thr Pro Asp Glu Glu Asn Asp Lys Ile Phe Thr Glu Tyr Arg Lys
130 135 140
Thr His Asn Gln Gly Val Phe Asp Val Tyr Thr Pro Asp Met Arg Lys
145 150 155 160
Ala Arg His Tyr Lys Ile Ile Thr Gly Leu Pro Asp Ala Tyr Ala Arg
165 170 175
Gly Arg Leu Ile Pro Asp Leu Pro Arg Val Ala Val Tyr Gly Ile Asp
180 185 190
Arg Leu Met Glu Asp Lys Ala Asn Asp Phe Ala His Ile Gly Asp Gly
195 200 205
Glu Leu Thr Asp Asp Val Ile Arg Leu Arg Glu Glu Val Gln Asp Gln
210 215 220
Tyr Arg Ala Leu Ala Asp Met Lys Lys Met Ala Ala Ser Tyr Gly Tyr
225 230 235 240
Asp Ile Ser Lys Pro Ala Thr Asn Ala Gln Glu Ala Ile Gln Trp Met
245 250 255
Tyr Phe Ala Tyr Leu Ala Ala Ile Lys Thr Gln Asn Gly Ala Ala Met
260 265 270
Ser Val Gly Arg Ile Asp Thr Thr Met Asp Ile Phe Ile Gln Arg Asp
275 280 285
Leu Asp Asn Gly Val Leu Asp Glu Ser Gln Ala Gln Glu Leu Ile Asp
290 295 300
Gln Phe Val Met Lys Leu Arg Met Val Arg Phe Ile Arg Thr Glu Glu
305 310 315 320
Tyr Asn Ser Leu Phe Ser Gly Asp Pro Ile Trp Ala Thr Leu Ser Met
325 330 335
Cys Gly Leu Gly Val Asp Gly Gln His His Val Thr Lys Thr Ala Phe
340 345 350
Arg Ile Leu Lys Thr Leu Asp Asn Met Gly Ala Ala Pro Glu Pro Asn
355 360 365
Ile Thr Ile Leu Trp Ser Asp Arg Leu Pro Glu Asp Phe Lys Arg Tyr
370 375 380
Ala Thr Glu Val Ser Ile Asp Ser Ser Thr Ile Gln Tyr Glu Asn Asp
385 390 395 400
Asp Leu Met Arg Val Gln Trp Gly Thr Asp Tyr Tyr Gly Ile Ala Cys
405 410 415
Cys Val Ser Ala Gln Pro Ile Ala Asp Gly Ile Gln Tyr Phe Gly Ala
420 425 430
Arg Ala Asn Leu Ala Lys Ala Ile Leu Tyr Ala Ile Asn Gly Gly Arg
435 440 445
Asp Glu Ile Ala Gly Asp Gln Val Gly Pro Ala Tyr Glu Pro Ile Thr
450 455 460
Ser Glu Tyr Ile Asp Tyr Asp Glu Phe Met Lys Lys Leu Asp Lys Gln
465 470 475 480
Met Asp Trp Leu Ala Asp Thr Tyr Val Asn Ser Leu Asn Ala Ile His
485 490 495
Tyr Met His Asp Lys Tyr Tyr Tyr Glu Ala Ala Gln Leu Ala Leu Lys
500 505 510
Asn Thr Asp Leu Asp Arg Thr Phe Ala Thr Gly Ile Ser Gly Leu Ser
515 520 525
His Ala Ala Asp Ser Ile Ser Ala Ile Lys Tyr Gly His Val Lys Val
530 535 540
Ile Arg Asp Glu Arg Gly Ile Ala Val Asp Phe Lys Ala Asp Asn Asp
545 550 555 560
Tyr Pro Arg Tyr Gly Asn Asn Asp Asp Arg Ala Asp Asp Ile Ala Lys
565 570 575
Trp Leu Val Lys Glu Leu Tyr Ser Lys Met Asn Thr His His Leu Tyr
580 585 590
Arg Asn Ala Lys Leu Ser Thr Ser Val Leu Thr Ile Thr Ser Asn Val
595 600 605
Val Tyr Gly Lys Asn Thr Gly Thr Thr Pro Asn Gly Arg Gln Lys Gly
610 615 620
Glu Pro Phe Ser Pro Gly Ala Asn Pro Ala Tyr Gly Ala Glu Lys Ser
625 630 635 640
Gly Ala Leu Ala Ser Leu Leu Ser Thr Ala Lys Leu Pro Tyr Arg Tyr
645 650 655
Ala Thr Asp Gly Ile Ser Asn Thr Phe Gly Val Thr Pro Asn Thr Leu
660 665 670
Gly His Asp Leu Glu Ser Arg Lys Asp Thr Leu Val Asn Met Leu Asp
675 680 685
Gly Tyr Met Lys Asn Asp Gly Met His Leu Asn Ile Asn Val Phe Asn
690 695 700
Lys Asp Thr Leu Ile Asp Ala Gln Lys His Pro Glu Glu Tyr Pro Thr
705 710 715 720
Leu Thr Val Arg Val Ser Gly Tyr Cys Val Tyr Phe Ala Asp Leu Thr
725 730 735
Lys Glu Gln Gln Asp Asp Val Ile Ser Arg Thr Phe Phe Glu Ser Met
740 745 750
<210> 51
<211> 2259
<212> DNA
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> JDM1
<400> 51
atgattacat cagaaaagac aacaaaacca gcagcttgga aaggtttcaa aggcgggcac 60
tggcaggaag aaatcaacat tcgtgatttt attcaaaata acttcacaca gtacaatggc 120
gacgaaagct tcctggccgg accaacagcc gctactaaga ccttgaatga caaagtctta 180
gaattaaaga aacaagaacg tgccgctggt ggtgtgttgg acgctgatac taaagtcgtt 240
gcaacgatta cttcacacgg ccctggttat attcaaaaag atctcgaaaa gattgttggt 300
ctccagactg acaagccttt gaagcgggcc ttcatgccat ttggtggtat tcgaatggct 360
gatgacgctt tgaaatcata cggttatacc cctgatgaag aaaacgacaa gattttcact 420
gaatatcgca agactcataa ccaaggcgtc ttcgatgttt atactcctga catgcggaaa 480
gcacgtcact acaagatcat caccggacta ccagatgcat acgcacgtgg ccgtctcatt 540
cctgatcttc cacgggtcgc tgtttatggg atcgatcgtt taatggaaga caaagctaat 600
gactttgccc acattggtga tggtgaattg actgatgatg ttattcgcct ccgtgaagaa 660
gttcaagatc aataccgtgc tttagcagat atgaagaaga tggctgccag ttatggctac 720
gatattagca agcctgcaac taatgctcaa gaagctattc aatggatgta cttcgcttac 780
ttagctgcta tcaagaccca aaacggcgct gcaatgtccg ttggccggat tgatacaacg 840
atggacatct tcatccaacg tgacttggac aatggtgttc tggacgaaag ccaagctcaa 900
gaattaattg atcaattcgt catgaaacta cggatggttc ggttcatccg tactgaagaa 960
tacaattctc tcttctctgg tgacccaatc tgggcaacct tatcaatgtg tggtttaggc 1020
gtcgacggtc aacaccatgt gactaagacc gctttccgga ttttaaagac tttggacaac 1080
atgggcgccg caccagaacc aaacatcacg attttatggt cagatcgctt accagaagac 1140
ttcaaacgtt acgcaactga agtttcaatc gacagttcaa ccattcagta tgaaaatgat 1200
gacttgatgc gggtacaatg gggtaccgat tattatggca ttgcttgctg tgtttccgca 1260
caaccaattg ctgatggaat ccagtacttc ggtgcccggg caaacttagc caaagcgatt 1320
ctttatgcca tcaatggtgg ccgcgacgaa attgctggag atcaagttgg ccctgcttac 1380
gaaccaatta cttcagaata catcgattac gacgaattca tgaagaaatt agacaagcaa 1440
atggattggt tagctgacac ttacgtgaac tcactgaatg caattcatta tatgcatgat 1500
aagtactact atgaagctgc ccaattagct ttgaagaata ctgatcttga tcggaccttt 1560
gcaactggga tttctggctt atcacatgcc gcggattcaa tctcagctat caagtatggt 1620
cacgttaaag taattcgtga cgaacgtggt atcgccgttg acttcaaagc cgacaatgac 1680
tacccacgtt atgggaacaa tgacgatcgc gctgatgaca ttgctaaatg gttagtcaaa 1740
gaattataca gcaagatgaa cacgcatcac ctctatcgga atgccaaact ttcaacttct 1800
gttttgacga ttacctccaa cgttgtttat ggtaagaaca ctggtaccac accaaatggc 1860
cgtcaaaaag gcgaaccatt ctcaccaggt gctaaccctg catacggtgc tgaaaagagt 1920
ggtgcattag cttcacttct ttcaactgcc aaattaccat accgttacgc aactgacggg 1980
atttccaaca cgttcggcgt tacccctaac acgttaggcc atgacctcga atcacggaaa 2040
gacacgttag taaacatgtt agacggttac atgaagaacg atgggatgca cttgaacatc 2100
aacgtcttca ataaagacac tttgattgat gctcagaaac accctgaaga atacccaaca 2160
ttaacggttc gggtttctgg ctactgtgtc tacttcgcag atttaaccaa ggaacaacaa 2220
gatgacgtta tttcacggac attcttcgaa tcaatgtaa 2259
<210> 52
<211> 752
<212> PRT
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> JDM1
<400> 52
Met Ile Thr Ser Glu Lys Thr Thr Lys Pro Ala Ala Trp Lys Gly Phe
1 5 10 15
Lys Gly Gly His Trp Gln Glu Glu Ile Asn Ile Arg Asp Phe Ile Gln
20 25 30
Asn Asn Phe Thr Gln Tyr Asn Gly Asp Glu Ser Phe Leu Ala Gly Pro
35 40 45
Thr Ala Ala Thr Lys Thr Leu Asn Asp Lys Val Leu Glu Leu Lys Lys
50 55 60
Gln Glu Arg Ala Ala Gly Gly Val Leu Asp Ala Asp Thr Lys Val Val
65 70 75 80
Ala Thr Ile Thr Ser His Gly Pro Gly Tyr Ile Gln Lys Asp Leu Glu
85 90 95
Lys Ile Val Gly Leu Gln Thr Asp Lys Pro Leu Lys Arg Ala Phe Met
100 105 110
Pro Phe Gly Gly Ile Arg Met Ala Asp Asp Ala Leu Lys Ser Tyr Gly
115 120 125
Tyr Thr Pro Asp Glu Glu Asn Asp Lys Ile Phe Thr Glu Tyr Arg Lys
130 135 140
Thr His Asn Gln Gly Val Phe Asp Val Tyr Thr Pro Asp Met Arg Lys
145 150 155 160
Ala Arg His Tyr Lys Ile Ile Thr Gly Leu Pro Asp Ala Tyr Ala Arg
165 170 175
Gly Arg Leu Ile Pro Asp Leu Pro Arg Val Ala Val Tyr Gly Ile Asp
180 185 190
Arg Leu Met Glu Asp Lys Ala Asn Asp Phe Ala His Ile Gly Asp Gly
195 200 205
Glu Leu Thr Asp Asp Val Ile Arg Leu Arg Glu Glu Val Gln Asp Gln
210 215 220
Tyr Arg Ala Leu Ala Asp Met Lys Lys Met Ala Ala Ser Tyr Gly Tyr
225 230 235 240
Asp Ile Ser Lys Pro Ala Thr Asn Ala Gln Glu Ala Ile Gln Trp Met
245 250 255
Tyr Phe Ala Tyr Leu Ala Ala Ile Lys Thr Gln Asn Gly Ala Ala Met
260 265 270
Ser Val Gly Arg Ile Asp Thr Thr Met Asp Ile Phe Ile Gln Arg Asp
275 280 285
Leu Asp Asn Gly Val Leu Asp Glu Ser Gln Ala Gln Glu Leu Ile Asp
290 295 300
Gln Phe Val Met Lys Leu Arg Met Val Arg Phe Ile Arg Thr Glu Glu
305 310 315 320
Tyr Asn Ser Leu Phe Ser Gly Asp Pro Ile Trp Ala Thr Leu Ser Met
325 330 335
Cys Gly Leu Gly Val Asp Gly Gln His His Val Thr Lys Thr Ala Phe
340 345 350
Arg Ile Leu Lys Thr Leu Asp Asn Met Gly Ala Ala Pro Glu Pro Asn
355 360 365
Ile Thr Ile Leu Trp Ser Asp Arg Leu Pro Glu Asp Phe Lys Arg Tyr
370 375 380
Ala Thr Glu Val Ser Ile Asp Ser Ser Thr Ile Gln Tyr Glu Asn Asp
385 390 395 400
Asp Leu Met Arg Val Gln Trp Gly Thr Asp Tyr Tyr Gly Ile Ala Cys
405 410 415
Cys Val Ser Ala Gln Pro Ile Ala Asp Gly Ile Gln Tyr Phe Gly Ala
420 425 430
Arg Ala Asn Leu Ala Lys Ala Ile Leu Tyr Ala Ile Asn Gly Gly Arg
435 440 445
Asp Glu Ile Ala Gly Asp Gln Val Gly Pro Ala Tyr Glu Pro Ile Thr
450 455 460
Ser Glu Tyr Ile Asp Tyr Asp Glu Phe Met Lys Lys Leu Asp Lys Gln
465 470 475 480
Met Asp Trp Leu Ala Asp Thr Tyr Val Asn Ser Leu Asn Ala Ile His
485 490 495
Tyr Met His Asp Lys Tyr Tyr Tyr Glu Ala Ala Gln Leu Ala Leu Lys
500 505 510
Asn Thr Asp Leu Asp Arg Thr Phe Ala Thr Gly Ile Ser Gly Leu Ser
515 520 525
His Ala Ala Asp Ser Ile Ser Ala Ile Lys Tyr Gly His Val Lys Val
530 535 540
Ile Arg Asp Glu Arg Gly Ile Ala Val Asp Phe Lys Ala Asp Asn Asp
545 550 555 560
Tyr Pro Arg Tyr Gly Asn Asn Asp Asp Arg Ala Asp Asp Ile Ala Lys
565 570 575
Trp Leu Val Lys Glu Leu Tyr Ser Lys Met Asn Thr His His Leu Tyr
580 585 590
Arg Asn Ala Lys Leu Ser Thr Ser Val Leu Thr Ile Thr Ser Asn Val
595 600 605
Val Tyr Gly Lys Asn Thr Gly Thr Thr Pro Asn Gly Arg Gln Lys Gly
610 615 620
Glu Pro Phe Ser Pro Gly Ala Asn Pro Ala Tyr Gly Ala Glu Lys Ser
625 630 635 640
Gly Ala Leu Ala Ser Leu Leu Ser Thr Ala Lys Leu Pro Tyr Arg Tyr
645 650 655
Ala Thr Asp Gly Ile Ser Asn Thr Phe Gly Val Thr Pro Asn Thr Leu
660 665 670
Gly His Asp Leu Glu Ser Arg Lys Asp Thr Leu Val Asn Met Leu Asp
675 680 685
Gly Tyr Met Lys Asn Asp Gly Met His Leu Asn Ile Asn Val Phe Asn
690 695 700
Lys Asp Thr Leu Ile Asp Ala Gln Lys His Pro Glu Glu Tyr Pro Thr
705 710 715 720
Leu Thr Val Arg Val Ser Gly Tyr Cys Val Tyr Phe Ala Asp Leu Thr
725 730 735
Lys Glu Gln Gln Asp Asp Val Ile Ser Arg Thr Phe Phe Glu Ser Met
740 745 750
<210> 53
<211> 2445
<212> DNA
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> JDM1
<400> 53
atgatcatgt ctgaaacttt aactaaaaca acgacaacta ttaaccactt cggtaaattg 60
acgccaatga tggatcgctt acgcgatagc atcattgatg caaaacctta tgtcgatcca 120
gaacgggcga ttctcacaac cgaaacttat cgacaacacc aagacgaaca agtcgatata 180
ttacgggcta aaatgcttga acacgttctt gataaaatga gtatcttcat tgaagatgat 240
actttaattg ttggtaacca agcacgccaa aatcgttggg caccagtatt ccctgagtat 300
tctatgaatt gggtcattga tgaattagat acatttgaga agcgtcctgg tgacgttttc 360
tatattacgg agaaatctaa ggaagaactt cgtgcgattg cgcctttctg gaaacataat 420
accttggaag accgcggcta cgctagtttt ccagaagcaa gtcgtatttt ttatgattta 480
ggtattattg gagccgatgg taatatcact tctggtgatg gtcacattgc ggtcgactat 540
aaaaacgttg ttaataaggg acttaaatgg tatgaagacc gcattaagac agcacttgct 600
aatcttgacc ttactgattt taaccagcaa aaacaatact atttctataa agcgggccta 660
attgtaatcg atgccattca caattttgct aaacgttacg cccaattagc gtccaagcaa 720
gctcaaaaca cgacatccgc aactcgcaaa gcacaacttg aaaaaatcgc ccaaattcta 780
aacaaggttc cttacgaacc tgcaaattca ttttatgaag cgattcaagc tgtctggtta 840
gttcatctga ccttacaaat cgaatccaac ggtcattctg tctcatatgg tcgtctagat 900
cagtacctag atccattcta tgagcacgat ttaaaaactg gtgctattga cgccaacggt 960
gcaaccgaat tactcacaaa cttatgtctt aagacgttaa cgattaataa agtacgctca 1020
tggcaacata ctgaattttc tgcagggagt cccctctacc aaaacattac gattggtggt 1080
caaacaccag atggtaaaga tgccgttaat ccgacgtcct atctgatttt acgagcaatt 1140
gcgcaagcac atttaccaca acccaactta acggtccgtt atcaccatgg cttaagcgat 1200
aagtttatgc gtgaatgtgt cgaagttatt aaacaaggct taggtatgcc tgcgtttaat 1260
aacgacgaaa ttattattcc gtcgtttatt cgtcgtggcg tcaagaaaga agacgcctat 1320
aattacagtg ccatcggttg tgtcgaaaca gcgatccctg gaaaatgggg ctatcgttgc 1380
accgggatga gcttcattaa cttcccacgc gttctcttac tcattatgaa tggtggcatt 1440
gatcctgaat ctggcaaacg gttattaccc gattatggta agttcactga tatgacttct 1500
tttgatcaac ttatgactgc ttgggacaaa gcgctccgtg aaatgacacg acaaagtgtg 1560
attatcgaaa atagttgtga tttggctttg gaacaaaatt atcctgatat tctctgctcc 1620
gttttaaccg acgattgtat cggtcgtggt aagaccatta aagaaggtgg cgcggtatac 1680
gactttatca gtggattaca agttggtatt gctaacctag cggactccct agctgcaatc 1740
aagaaacttg tctttgaaga aaagaagttg acaacaaccc aactttggca cgcacttacc 1800
actgattttg cggatgaaga cggtgaaaag attcggcaga tgctcattaa tgatgcccca 1860
aagtatggta acgatgatga ttatgttgat gatttgattg ttgaagctta taaaccatat 1920
attgatgaaa ttgccaagta caaaaacacg cgctacggtc gcggccctat tggtggcttg 1980
cgttacgcag gaacctcttc tatttcggcc aacgttggtc aagggcacag cactttggct 2040
acaccagatg gtcggcacgc tcggacacca ttagccgaag gttgctcacc agaacatgca 2100
atggatacta atggcccaac tgctgtgttc aaatcagttt ccaagttatc cactaaggac 2160
atcactggtg gcgtattact gaaccaaaag atgtcaccac aaattctacg gagtgatgaa 2220
agctgcatga aattggttgc actactacga accttcttca accgacttca tggttaccat 2280
gtccaataca acattgtttc acgggatacc ttgattgatg cacagaacca tcctgacaag 2340
caccgtgact tgattgttcg ggttgctgga tattccgcct tcttcgtggg cctatccaaa 2400
gaaacccaag atgatattat cgaacggacg gagcagtctc tataa 2445
<210> 54
<211> 814
<212> PRT
<213> 胚芽乳杆菌
<220>
<221> 杂项特征
<223> JDM1
<400> 54
Met Ile Met Ser Glu Thr Leu Thr Lys Thr Thr Thr Thr Ile Asn His
1 5 10 15
Phe Gly Lys Leu Thr Pro Met Met Asp Arg Leu Arg Asp Ser Ile Ile
20 25 30
Asp Ala Lys Pro Tyr Val Asp Pro Glu Arg Ala Ile Leu Thr Thr Glu
35 40 45
Thr Tyr Arg Gln His Gln Asp Glu Gln Val Asp Ile Leu Arg Ala Lys
50 55 60
Met Leu Glu His Val Leu Asp Lys Met Ser Ile Phe Ile Glu Asp Asp
65 70 75 80
Thr Leu Ile Val Gly Asn Gln Ala Arg Gln Asn Arg Trp Ala Pro Val
85 90 95
Phe Pro Glu Tyr Ser Met Asn Trp Val Ile Asp Glu Leu Asp Thr Phe
100 105 110
Glu Lys Arg Pro Gly Asp Val Phe Tyr Ile Thr Glu Lys Ser Lys Glu
115 120 125
Glu Leu Arg Ala Ile Ala Pro Phe Trp Lys His Asn Thr Leu Glu Asp
130 135 140
Arg Gly Tyr Ala Ser Phe Pro Glu Ala Ser Arg Ile Phe Tyr Asp Leu
145 150 155 160
Gly Ile Ile Gly Ala Asp Gly Asn Ile Thr Ser Gly Asp Gly His Ile
165 170 175
Ala Val Asp Tyr Lys Asn Val Val Asn Lys Gly Leu Lys Trp Tyr Glu
180 185 190
Asp Arg Ile Lys Thr Ala Leu Ala Asn Leu Asp Leu Thr Asp Phe Asn
195 200 205
Gln Gln Lys Gln Tyr Tyr Phe Tyr Lys Ala Gly Leu Ile Val Ile Asp
210 215 220
Ala Ile His Asn Phe Ala Lys Arg Tyr Ala Gln Leu Ala Ser Lys Gln
225 230 235 240
Ala Gln Asn Thr Thr Ser Ala Thr Arg Lys Ala Gln Leu Glu Lys Ile
245 250 255
Ala Gln Ile Leu Asn Lys Val Pro Tyr Glu Pro Ala Asn Ser Phe Tyr
260 265 270
Glu Ala Ile Gln Ala Val Trp Leu Val His Leu Thr Leu Gln Ile Glu
275 280 285
Ser Asn Gly His Ser Val Ser Tyr Gly Arg Leu Asp Gln Tyr Leu Asp
290 295 300
Pro Phe Tyr Glu His Asp Leu Lys Thr Gly Ala Ile Asp Ala Asn Gly
305 310 315 320
Ala Thr Glu Leu Leu Thr Asn Leu Cys Leu Lys Thr Leu Thr Ile Asn
325 330 335
Lys Val Arg Ser Trp Gln His Thr Glu Phe Ser Ala Gly Ser Pro Leu
340 345 350
Tyr Gln Asn Ile Thr Ile Gly Gly Gln Thr Pro Asp Gly Lys Asp Ala
355 360 365
Val Asn Pro Thr Ser Tyr Leu Ile Leu Arg Ala Ile Ala Gln Ala His
370 375 380
Leu Pro Gln Pro Asn Leu Thr Val Arg Tyr His His Gly Leu Ser Asp
385 390 395 400
Lys Phe Met Arg Glu Cys Val Glu Val Ile Lys Gln Gly Leu Gly Met
405 410 415
Pro Ala Phe Asn Asn Asp Glu Ile Ile Ile Pro Ser Phe Ile Arg Arg
420 425 430
Gly Val Lys Lys Glu Asp Ala Tyr Asn Tyr Ser Ala Ile Gly Cys Val
435 440 445
Glu Thr Ala Ile Pro Gly Lys Trp Gly Tyr Arg Cys Thr Gly Met Ser
450 455 460
Phe Ile Asn Phe Pro Arg Val Leu Leu Leu Ile Met Asn Gly Gly Ile
465 470 475 480
Asp Pro Glu Ser Gly Lys Arg Leu Leu Pro Asp Tyr Gly Lys Phe Thr
485 490 495
Asp Met Thr Ser Phe Asp Gln Leu Met Thr Ala Trp Asp Lys Ala Leu
500 505 510
Arg Glu Met Thr Arg Gln Ser Val Ile Ile Glu Asn Ser Cys Asp Leu
515 520 525
Ala Leu Glu Gln Asn Tyr Pro Asp Ile Leu Cys Ser Val Leu Thr Asp
530 535 540
Asp Cys Ile Gly Arg Gly Lys Thr Ile Lys Glu Gly Gly Ala Val Tyr
545 550 555 560
Asp Phe Ile Ser Gly Leu Gln Val Gly Ile Ala Asn Leu Ala Asp Ser
565 570 575
Leu Ala Ala Ile Lys Lys Leu Val Phe Glu Glu Lys Lys Leu Thr Thr
580 585 590
Thr Gln Leu Trp His Ala Leu Thr Thr Asp Phe Ala Asp Glu Asp Gly
595 600 605
Glu Lys Ile Arg Gln Met Leu Ile Asn Asp Ala Pro Lys Tyr Gly Asn
610 615 620
Asp Asp Asp Tyr Val Asp Asp Leu Ile Val Glu Ala Tyr Lys Pro Tyr
625 630 635 640
Ile Asp Glu Ile Ala Lys Tyr Lys Asn Thr Arg Tyr Gly Arg Gly Pro
645 650 655
Ile Gly Gly Leu Arg Tyr Ala Gly Thr Ser Ser Ile Ser Ala Asn Val
660 665 670
Gly Gln Gly His Ser Thr Leu Ala Thr Pro Asp Gly Arg His Ala Arg
675 680 685
Thr Pro Leu Ala Glu Gly Cys Ser Pro Glu His Ala Met Asp Thr Asn
690 695 700
Gly Pro Thr Ala Val Phe Lys Ser Val Ser Lys Leu Ser Thr Lys Asp
705 710 715 720
Ile Thr Gly Gly Val Leu Leu Asn Gln Lys Met Ser Pro Gln Ile Leu
725 730 735
Arg Ser Asp Glu Ser Cys Met Lys Leu Val Ala Leu Leu Arg Thr Phe
740 745 750
Phe Asn Arg Leu His Gly Tyr His Val Gln Tyr Asn Ile Val Ser Arg
755 760 765
Asp Thr Leu Ile Asp Ala Gln Asn His Pro Asp Lys His Arg Asp Leu
770 775 780
Ile Val Arg Val Ala Gly Tyr Ser Ala Phe Phe Val Gly Leu Ser Lys
785 790 795 800
Glu Thr Gln Asp Asp Ile Ile Glu Arg Thr Glu Gln Ser Leu
805 810
<210> 55
<211> 2262
<212> DNA
<213> 干酪乳杆菌
<220>
<221> 杂项特征
<223> bl23
<400> 55
atgaaacagc ttgacgaaac caaagttcct aattattggg aaggctttaa cggcggcgac 60
tggcaagaag aaattaatgt gcgcgatttt atcgagcata acctgaacca atatgacggg 120
gacgaaagtt tccttgctgg ccccactgaa gcgacaacag tcctgaacaa tcaggttcta 180
aatttaaaga agcaagaacg tgcaaatggc ggtgttttgg atgctgacaa caatattcca 240
tctacgatca cctcacacgg ccctggttat ttgaacaaag atcttgaaaa gattgttggt 300
gttcagaccg acaagccatt caaacgagca ttcatgccat ttggcggtat tcgaatggct 360
gaagatgcat tggaatctta tggcttcaag acagatcctc aagaacacaa gattttcaat 420
gaatatcgta agacccataa ccaaggtgtc tttgatgctt atacccctga tatgcgaaag 480
gctcgccatt acaagatcgt gactggcttg ccagacgcat acggccgtgg ccggattgtt 540
tctgatttcc cacggatcgc tgtttacggg atcgatcgtt taatggctga gaagttcaag 600
gattataact tgaccggcga cggcgaaatg actgacgatg taatcaaact gcgtgaagaa 660
atcaatgaac aatatcgtgc cttaaacgac atgaagaaga tggccaagga atatggctat 720
gacatctcgc gtccggcagc taatgcgcaa gaagctgttc agtggatcta ctttggctat 780
ctggctgctg ttaagactca aaacggtgcc gcaatgtccg ttggccggat cgatacggtt 840
attgatgctt atatccaacg cgatatgcgc ttaggcaaat tgaacgaaga acaggcacag 900
gaactgattg atcatttggt tatgaaattg cggatggttc gtttcatccg gactgaagaa 960
tataactcac tgttctcagg cgatccaatc tgggcaacct tgtcattggc aggaatgggc 1020
aatgatggcc gtcaccacgt taccaagacg gctttccgtt tcctgaagac tttggacaac 1080
atgggcgcag caccagaacc aaacatcacc ttgctttgga gcgaacgctt gccagaaggc 1140
ttcaaacgct atgcaaccga agtatccatc caaagttcaa ccattcaata tgaaaatgat 1200
gacctgatgc gcaacgaatg gggtaccgat tactacggta ttgcttgctg tgtctcggca 1260
caaccaattg ctgatggcgt tcaatacttt ggtgcccgtg ctaacttagc taagacggtt 1320
ctgtatgcga tcaacggtgg gaaagatgaa attcaggaag cgcaagtagg gcctgaatat 1380
gcaccgatca ccagcgatta cattgattac aaagaattca tgaataagtt cgacaagatg 1440
atggactggc tggccgacac gtatgtcaat gctttgaatg tgattcacta tatgcatgac 1500
aagtattatt atgaagctgc acagctggca ttgaaggata cccaactgaa ccggaccttc 1560
gcaaccggga tttccggcct gtcacacgcg gttgattcca tcagtgcaat caagtatggt 1620
catgtcaagg caattcgcga tgaaaacggt gttgcagttg acttcgttgc tgacaatgat 1680
gactatccac gctatggtaa caacgatgat cgcgctgatg acatcgctaa gtggttggtt 1740
aagaccttct ataacaagat gaacacgcat catctgtatc gcggcgcgaa gttgagtacc 1800
agtgtcctga ccattacctc caacgtggtt tatggtaaga atacagggac aacaccaaac 1860
ggtcgtcaaa aaggcgaacc attctcacca ggtgccaacc cggcatacgg cgcagaaaag 1920
aacggcgcat tggcatcctt gatgtccacc gccaagattc cgtatcatta cgcaactgac 1980
ggcattagta atacgtttgg ggttactccg aacacactgg gccacgatga tgaaactcgt 2040
aaggatacct tggttcacat ggttgacggc tatatggaaa acagcggcat gcatttgaac 2100
atcaacgtct tcaacaagga gaccctgatt gatgctcaga agcacccaga agaataccca 2160
acattgaccg ttcgggtttc tggctactgc gtctacttcg cagatttgac caaggaacaa 2220
caagacgatg tcattgctcg gaccttcttc gaagaaatgt aa 2262
<210> 56
<211> 753
<212> PRT
<213> 干酪乳杆菌
<220>
<221> 杂项特征
<223> bl23
<400> 56
Met Lys Gln Leu Asp Glu Thr Lys Val Pro Asn Tyr Trp Glu Gly Phe
1 5 10 15
Asn Gly Gly Asp Trp Gln Glu Glu Ile Asn Val Arg Asp Phe Ile Glu
20 25 30
His Asn Leu Asn Gln Tyr Asp Gly Asp Glu Ser Phe Leu Ala Gly Pro
35 40 45
Thr Glu Ala Thr Thr Val Leu Asn Asn Gln Val Leu Asn Leu Lys Lys
50 55 60
Gln Glu Arg Ala Asn Gly Gly Val Leu Asp Ala Asp Asn Asn Ile Pro
65 70 75 80
Ser Thr Ile Thr Ser His Gly Pro Gly Tyr Leu Asn Lys Asp Leu Glu
85 90 95
Lys Ile Val Gly Val Gln Thr Asp Lys Pro Phe Lys Arg Ala Phe Met
100 105 110
Pro Phe Gly Gly Ile Arg Met Ala Glu Asp Ala Leu Glu Ser Tyr Gly
115 120 125
Phe Lys Thr Asp Pro Gln Glu His Lys Ile Phe Asn Glu Tyr Arg Lys
130 135 140
Thr His Asn Gln Gly Val Phe Asp Ala Tyr Thr Pro Asp Met Arg Lys
145 150 155 160
Ala Arg His Tyr Lys Ile Val Thr Gly Leu Pro Asp Ala Tyr Gly Arg
165 170 175
Gly Arg Ile Val Ser Asp Phe Pro Arg Ile Ala Val Tyr Gly Ile Asp
180 185 190
Arg Leu Met Ala Glu Lys Phe Lys Asp Tyr Asn Leu Thr Gly Asp Gly
195 200 205
Glu Met Thr Asp Asp Val Ile Lys Leu Arg Glu Glu Ile Asn Glu Gln
210 215 220
Tyr Arg Ala Leu Asn Asp Met Lys Lys Met Ala Lys Glu Tyr Gly Tyr
225 230 235 240
Asp Ile Ser Arg Pro Ala Ala Asn Ala Gln Glu Ala Val Gln Trp Ile
245 250 255
Tyr Phe Gly Tyr Leu Ala Ala Val Lys Thr Gln Asn Gly Ala Ala Met
260 265 270
Ser Val Gly Arg Ile Asp Thr Val Ile Asp Ala Tyr Ile Gln Arg Asp
275 280 285
Met Arg Leu Gly Lys Leu Asn Glu Glu Gln Ala Gln Glu Leu Ile Asp
290 295 300
His Leu Val Met Lys Leu Arg Met Val Arg Phe Ile Arg Thr Glu Glu
305 310 315 320
Tyr Asn Ser Leu Phe Ser Gly Asp Pro Ile Trp Ala Thr Leu Ser Leu
325 330 335
Ala Gly Met Gly Asn Asp Gly Arg His His Val Thr Lys Thr Ala Phe
340 345 350
Arg Phe Leu Lys Thr Leu Asp Asn Met Gly Ala Ala Pro Glu Pro Asn
355 360 365
Ile Thr Leu Leu Trp Ser Glu Arg Leu Pro Glu Gly Phe Lys Arg Tyr
370 375 380
Ala Thr Glu Val Ser Ile Gln Ser Ser Thr Ile Gln Tyr Glu Asn Asp
385 390 395 400
Asp Leu Met Arg Asn Glu Trp Gly Thr Asp Tyr Tyr Gly Ile Ala Cys
405 410 415
Cys Val Ser Ala Gln Pro Ile Ala Asp Gly Val Gln Tyr Phe Gly Ala
420 425 430
Arg Ala Asn Leu Ala Lys Thr Val Leu Tyr Ala Ile Asn Gly Gly Lys
435 440 445
Asp Glu Ile Gln Glu Ala Gln Val Gly Pro Glu Tyr Ala Pro Ile Thr
450 455 460
Ser Asp Tyr Ile Asp Tyr Lys Glu Phe Met Asn Lys Phe Asp Lys Met
465 470 475 480
Met Asp Trp Leu Ala Asp Thr Tyr Val Asn Ala Leu Asn Val Ile His
485 490 495
Tyr Met His Asp Lys Tyr Tyr Tyr Glu Ala Ala Gln Leu Ala Leu Lys
500 505 510
Asp Thr Gln Leu Asn Arg Thr Phe Ala Thr Gly Ile Ser Gly Leu Ser
515 520 525
His Ala Val Asp Ser Ile Ser Ala Ile Lys Tyr Gly His Val Lys Ala
530 535 540
Ile Arg Asp Glu Asn Gly Val Ala Val Asp Phe Val Ala Asp Asn Asp
545 550 555 560
Asp Tyr Pro Arg Tyr Gly Asn Asn Asp Asp Arg Ala Asp Asp Ile Ala
565 570 575
Lys Trp Leu Val Lys Thr Phe Tyr Asn Lys Met Asn Thr His His Leu
580 585 590
Tyr Arg Gly Ala Lys Leu Ser Thr Ser Val Leu Thr Ile Thr Ser Asn
595 600 605
Val Val Tyr Gly Lys Asn Thr Gly Thr Thr Pro Asn Gly Arg Gln Lys
610 615 620
Gly Glu Pro Phe Ser Pro Gly Ala Asn Pro Ala Tyr Gly Ala Glu Lys
625 630 635 640
Asn Gly Ala Leu Ala Ser Leu Met Ser Thr Ala Lys Ile Pro Tyr His
645 650 655
Tyr Ala Thr Asp Gly Ile Ser Asn Thr Phe Gly Val Thr Pro Asn Thr
660 665 670
Leu Gly His Asp Asp Glu Thr Arg Lys Asp Thr Leu Val His Met Val
675 680 685
Asp Gly Tyr Met Glu Asn Ser Gly Met His Leu Asn Ile Asn Val Phe
690 695 700
Asn Lys Glu Thr Leu Ile Asp Ala Gln Lys His Pro Glu Glu Tyr Pro
705 710 715 720
Thr Leu Thr Val Arg Val Ser Gly Tyr Cys Val Tyr Phe Ala Asp Leu
725 730 735
Thr Lys Glu Gln Gln Asp Asp Val Ile Ala Arg Thr Phe Phe Glu Glu
740 745 750
Met
<210> 57
<211> 2262
<212> DNA
<213> 干酪乳杆菌
<220>
<221> 杂项特征
<223> ATCC 334
<400> 57
atgaaacagc ttgacgaaac caaagttcct aattattggg aaggctttaa cggcggcgac 60
tggcaagaag aaattaatgt gcgcgatttt atcgagcata acctgaacca atatgacggg 120
gacgaaagtt tccttgctgg tcccactgaa gcgacaacag tcctgaacaa tcaggttcta 180
aatttaaaga agcaagaacg tgcaaatggc ggtgttttgg atgctgacaa caatattcca 240
tctacgatca cctcacacgg ccctggttat ttgaacaaag atcttgaaaa gattgttggt 300
gttcagaccg acaagccatt caaacgagca ttcatgccat ttggcggtat tcgaatggct 360
gaagatgcat tggaatctta tggcttcaag acagatcctc aagaacacaa gattttcaat 420
gaatatcgta agacccataa ccaaggtgtc tttgatgctt atacccctga tatgcgaaag 480
gctcgccatt acaagatcgt gactggcttg ccagacgcat acggccgcgg ccggattgtt 540
tctgatttcc cacggatcgc tgtttacggg atcgatcgtt taatggctga gaagttcaag 600
gattataact tgaccggcga cggcgaaatg actgacgatg taatcaaatt gcgtgaagaa 660
atcaatgaac aatatcgtgc cttaaacgac atgaagaaga tggccaagga atatggctat 720
gacatctcgc gtccggcagc taatgcgcaa gaagctgttc agtggatcta ctttggctat 780
ctggctgctg ttaagactca aaacggtgcc gcaatgtccg ttggccggat cgatacggtt 840
attgatgctt atatccaacg cgatatgcgc ttaggcaaat tgaacgaaga acaggcacag 900
gaactgattg atcatttggt tatgaaattg cggatggttc gtttcatccg gactgaagaa 960
tataactcac tgttctcagg cgatccaatc tgggcaacct tgtcattggc aggaatgggc 1020
aatgatggcc gtcaccacgt taccaagacg gctttccgtt tcctgaagac tttggacaac 1080
atgggcgcag caccagaacc aaacatcacc ttgctttgga gcgaacgctt gccagaaggc 1140
tttaaacgct atgcaaccga agtatccatc caaagttcaa ccattcaata tgaaaatgat 1200
gacctgatgc gcaatgaatg gggtaccgat tactacggta ttgcttgctg tgtctcggca 1260
caaccaattg ctgatggcgt tcaatacttt ggtgcccgtg ctaacttagc taagacggtt 1320
ctgtatgcga tcaacggtgg taaagatgaa attcaggaag cgcaagtagg gcctgaatat 1380
gcaccgatca ccagcgatta cattgattac aaagaattca tgaataagtt cgacaagatg 1440
atggactggc tggccgacac gtatgtcaat gctttgaatg tgattcacta tatgcatgac 1500
aagtattatt atgaagctgc acagctggca ttgaaggata cccaactgaa ccggaccttc 1560
gcaaccggga tttccggcct gtcacacgcg gttgattcca tcagtgcaat caagtatggt 1620
catgtcaagg caattcgcga tgaaaatggt gttgcagttg acttcgttgc tgacaatgat 1680
gactatccac gttatggtaa caacgatgat cgcgctgatg acatcgctaa gtggttggtt 1740
aagaccttct ataacaagat gaacacgcat catctgtatc gcggcgcgaa gttgagtacc 1800
agtgtcctga ccattacttc caacgtggtt tatggtaaga atacagggac aacaccaaac 1860
ggtcgtcaaa aaggcgaacc attctcacca ggtgccaacc cggcatacgg cgcagaaaag 1920
aacggcgcat tggcatcctt gatgtccacc gccaagattc cgtatcatta cgcaactgac 1980
ggcattagta atacgtttgg ggttactccg aacacactgg gccacgatga tgaaactcgt 2040
aaggatacct tggttcacat ggttgacggc tatatggaaa acagcggcat gcatttgaac 2100
atcaacgtct tcaacaagga gaccctgatt gatgctcaga agcacccaga agaataccca 2160
acattgaccg ttcgggtttc tggctactgc gtctacttcg cagatttgac caaggaacaa 2220
caagacgatg tcattgctcg gaccttcttc gaagaaatgt aa 2262
<210> 58
<211> 753
<212> PRT
<213> 干酪乳杆菌
<220>
<221> 杂项特征
<223> ATCC 334
<400> 58
Met Lys Gln Leu Asp Glu Thr Lys Val Pro Asn Tyr Trp Glu Gly Phe
1 5 10 15
Asn Gly Gly Asp Trp Gln Glu Glu Ile Asn Val Arg Asp Phe Ile Glu
20 25 30
His Asn Leu Asn Gln Tyr Asp Gly Asp Glu Ser Phe Leu Ala Gly Pro
35 40 45
Thr Glu Ala Thr Thr Val Leu Asn Asn Gln Val Leu Asn Leu Lys Lys
50 55 60
Gln Glu Arg Ala Asn Gly Gly Val Leu Asp Ala Asp Asn Asn Ile Pro
65 70 75 80
Ser Thr Ile Thr Ser His Gly Pro Gly Tyr Leu Asn Lys Asp Leu Glu
85 90 95
Lys Ile Val Gly Val Gln Thr Asp Lys Pro Phe Lys Arg Ala Phe Met
100 105 110
Pro Phe Gly Gly Ile Arg Met Ala Glu Asp Ala Leu Glu Ser Tyr Gly
115 120 125
Phe Lys Thr Asp Pro Gln Glu His Lys Ile Phe Asn Glu Tyr Arg Lys
130 135 140
Thr His Asn Gln Gly Val Phe Asp Ala Tyr Thr Pro Asp Met Arg Lys
145 150 155 160
Ala Arg His Tyr Lys Ile Val Thr Gly Leu Pro Asp Ala Tyr Gly Arg
165 170 175
Gly Arg Ile Val Ser Asp Phe Pro Arg Ile Ala Val Tyr Gly Ile Asp
180 185 190
Arg Leu Met Ala Glu Lys Phe Lys Asp Tyr Asn Leu Thr Gly Asp Gly
195 200 205
Glu Met Thr Asp Asp Val Ile Lys Leu Arg Glu Glu Ile Asn Glu Gln
210 215 220
Tyr Arg Ala Leu Asn Asp Met Lys Lys Met Ala Lys Glu Tyr Gly Tyr
225 230 235 240
Asp Ile Ser Arg Pro Ala Ala Asn Ala Gln Glu Ala Val Gln Trp Ile
245 250 255
Tyr Phe Gly Tyr Leu Ala Ala Val Lys Thr Gln Asn Gly Ala Ala Met
260 265 270
Ser Val Gly Arg Ile Asp Thr Val Ile Asp Ala Tyr Ile Gln Arg Asp
275 280 285
Met Arg Leu Gly Lys Leu Asn Glu Glu Gln Ala Gln Glu Leu Ile Asp
290 295 300
His Leu Val Met Lys Leu Arg Met Val Arg Phe Ile Arg Thr Glu Glu
305 310 315 320
Tyr Asn Ser Leu Phe Ser Gly Asp Pro Ile Trp Ala Thr Leu Ser Leu
325 330 335
Ala Gly Met Gly Asn Asp Gly Arg His His Val Thr Lys Thr Ala Phe
340 345 350
Arg Phe Leu Lys Thr Leu Asp Asn Met Gly Ala Ala Pro Glu Pro Asn
355 360 365
Ile Thr Leu Leu Trp Ser Glu Arg Leu Pro Glu Gly Phe Lys Arg Tyr
370 375 380
Ala Thr Glu Val Ser Ile Gln Ser Ser Thr Ile Gln Tyr Glu Asn Asp
385 390 395 400
Asp Leu Met Arg Asn Glu Trp Gly Thr Asp Tyr Tyr Gly Ile Ala Cys
405 410 415
Cys Val Ser Ala Gln Pro Ile Ala Asp Gly Val Gln Tyr Phe Gly Ala
420 425 430
Arg Ala Asn Leu Ala Lys Thr Val Leu Tyr Ala Ile Asn Gly Gly Lys
435 440 445
Asp Glu Ile Gln Glu Ala Gln Val Gly Pro Glu Tyr Ala Pro Ile Thr
450 455 460
Ser Asp Tyr Ile Asp Tyr Lys Glu Phe Met Asn Lys Phe Asp Lys Met
465 470 475 480
Met Asp Trp Leu Ala Asp Thr Tyr Val Asn Ala Leu Asn Val Ile His
485 490 495
Tyr Met His Asp Lys Tyr Tyr Tyr Glu Ala Ala Gln Leu Ala Leu Lys
500 505 510
Asp Thr Gln Leu Asn Arg Thr Phe Ala Thr Gly Ile Ser Gly Leu Ser
515 520 525
His Ala Val Asp Ser Ile Ser Ala Ile Lys Tyr Gly His Val Lys Ala
530 535 540
Ile Arg Asp Glu Asn Gly Val Ala Val Asp Phe Val Ala Asp Asn Asp
545 550 555 560
Asp Tyr Pro Arg Tyr Gly Asn Asn Asp Asp Arg Ala Asp Asp Ile Ala
565 570 575
Lys Trp Leu Val Lys Thr Phe Tyr Asn Lys Met Asn Thr His His Leu
580 585 590
Tyr Arg Gly Ala Lys Leu Ser Thr Ser Val Leu Thr Ile Thr Ser Asn
595 600 605
Val Val Tyr Gly Lys Asn Thr Gly Thr Thr Pro Asn Gly Arg Gln Lys
610 615 620
Gly Glu Pro Phe Ser Pro Gly Ala Asn Pro Ala Tyr Gly Ala Glu Lys
625 630 635 640
Asn Gly Ala Leu Ala Ser Leu Met Ser Thr Ala Lys Ile Pro Tyr His
645 650 655
Tyr Ala Thr Asp Gly Ile Ser Asn Thr Phe Gly Val Thr Pro Asn Thr
660 665 670
Leu Gly His Asp Asp Glu Thr Arg Lys Asp Thr Leu Val His Met Val
675 680 685
Asp Gly Tyr Met Glu Asn Ser Gly Met His Leu Asn Ile Asn Val Phe
690 695 700
Asn Lys Glu Thr Leu Ile Asp Ala Gln Lys His Pro Glu Glu Tyr Pro
705 710 715 720
Thr Leu Thr Val Arg Val Ser Gly Tyr Cys Val Tyr Phe Ala Asp Leu
725 730 735
Thr Lys Glu Gln Gln Asp Asp Val Ile Ala Arg Thr Phe Phe Glu Glu
740 745 750
Met
<210> 59
<211> 2376
<212> DNA
<213> 青春双岐杆菌
<400> 59
atggcagcag ttgatgcaac ggcggtctcc caggaggaac ttgaggctaa ggcttgggaa 60
ggcttcaccg agggcaactg gcagaaggac attgatgtcc gcgacttcat ccagaagaac 120
tacacgccat atgagggcga cgagtccttc ctggctgacg ccaccgacaa gaccaagcac 180
ctgtggaagt atctggacga caactatctg tccgtggagc gcaagcagcg cgtctacgac 240
gtggacaccc acaccccggc gggcatcgac gccttcccgg ccggctacat cgattccccg 300
gaagtcgaca atgtgattgt cggtctgcag accgatgtgc cgtgcaagcg cgccatgatg 360
ccgaacggcg gctggcgtat ggtcgagcag gccatcaagg aagccggcaa ggagcccgat 420
ccggagatca agaagatctt caccaagtac cgcaagaccc acaacgacgg cgtcttcggc 480
gtctacacca agcagatcaa ggtagctcgc cacaacaaga tcctcaccgg cctgccggat 540
gcctacggcc gtggccgcat catcggcgat taccgtcgtg tggccctgta cggcgtgaac 600
gcgctgatca agttcaagca gcgcgacaag gactccatcc cgtaccgcaa cgacttcacc 660
gagccggaga tcgagcactg gatccgcttc cgtgaggagc atgacgagca gatcaaggcc 720
ctgaagcagc tgatcaacct cggcaacgag tacggcctcg acctgtcccg cccggcacag 780
accgcacagg aagccgtgca gtggacctac atgggctacc tcgcctccgt caagagccag 840
gacggcgccg ccatgtcctt cggccgtgtc tccaccttct tcgacgtcta cttcgagcgc 900
gacctgaagg ccggcaagat caccgagacc gacgcacagg agatcatcga taacctggtc 960
atgaagctgc gcatcgtgcg cttcctgcgc accaaggatt acgacgcgat cttctccggc 1020
gatccgtact gggcgacttg gtccgacgcc ggcttcggcg acgacggccg taccatggtc 1080
accaagacct cgttccgtct gctcaacacc ctgaccctcg agcacctcgg acctggcccg 1140
gagccgaaca tcaccatctt ctgggatccg aagctgccgg aagcctacaa gcgcttctgc 1200
gcccgaatct ccatcgacac ctcggccatc cagtacgagt ccgataagga aatccgctcc 1260
cactggggcg acgacgccgc catcgcatgc tgcgtctccc cgatgcgcgt gggcaagcag 1320
atgcagttct tcgccgcccg tgtgaactcc gccaaggccc tgctgtacgc catcaacggc 1380
ggacgcgacg agatgaccgg catgcaggtc atcgacaagg gcgtcatcga cccgatcaag 1440
ccggaagccg atggcacgct ggattacgag aaggtcaagg ccaactacga gaaggccctc 1500
gaatggctgt ccgagaccta tgtgatggct ctgaacatca tccattacat gcatgataag 1560
tacgcttacg agtccatcga gatggctctg cacgacaagg aagtgtaccg caccctcggc 1620
tgcggcatgt ccggcctgtc gatcgcggcc gactccctgt ccgcatgcaa gtacgccaag 1680
gtctacccga tctacaacaa ggacgccaag accacgccgg gccacgagaa cgagtacgtc 1740
gaaggcgccg atgacgatct gatcgtcggc taccgcaccg aaggcgactt cccgctgtac 1800
ggcaacgatg atgaccgtgc cgacgacatc gccaagtggg tcgtctccac cgtcatgggc 1860
caggtcaagc gtctgccggt gtaccgcgac gccgtcccga cccagtccat cctgaccatc 1920
acctccaatg tggaatacgg caaggccacc ggcgccttcc cgtccggcca caagaagggc 1980
accccgtacg ctccgggcgc caacccggag aacggcatgg actcccacgg catgctgccg 2040
tccatgttct ccgtcggcaa gatcgactac aacgacgctc ttgacggcat ctcgctgacc 2100
aacaccatca cccctgatgg tctgggccgc gacgaggaag agcgtatcgg caacctcgtt 2160
ggcatcctgg acgccggcaa cggccacggc ctgtaccacg ccaacatcaa cgtgctgcgc 2220
aaggagcagc tcgaggatgc cgtcgagcat ccggagaagt acccgcacct gaccgtgcgc 2280
gtctccggct acgcggtgaa cttcgtcaag ctcaccaagg aacagcagct cgacgtgatc 2340
tcccgtacgt tccaccaggg cgctgtcgtc gactga 2376
<210> 60
<211> 791
<212> PRT
<213> 青春双岐杆菌
<400> 60
Met Ala Ala Val Asp Ala Thr Ala Val Ser Gln Glu Glu Leu Glu Ala
1 5 10 15
Lys Ala Trp Glu Gly Phe Thr Glu Gly Asn Trp Gln Lys Asp Ile Asp
20 25 30
Val Arg Asp Phe Ile Gln Lys Asn Tyr Thr Pro Tyr Glu Gly Asp Glu
35 40 45
Ser Phe Leu Ala Asp Ala Thr Asp Lys Thr Lys His Leu Trp Lys Tyr
50 55 60
Leu Asp Asp Asn Tyr Leu Ser Val Glu Arg Lys Gln Arg Val Tyr Asp
65 70 75 80
Val Asp Thr His Thr Pro Ala Gly Ile Asp Ala Phe Pro Ala Gly Tyr
85 90 95
Ile Asp Ser Pro Glu Val Asp Asn Val Ile Val Gly Leu Gln Thr Asp
100 105 110
Val Pro Cys Lys Arg Ala Met Met Pro Asn Gly Gly Trp Arg Met Val
115 120 125
Glu Gln Ala Ile Lys Glu Ala Gly Lys Glu Pro Asp Pro Glu Ile Lys
130 135 140
Lys Ile Phe Thr Lys Tyr Arg Lys Thr His Asn Asp Gly Val Phe Gly
145 150 155 160
Val Tyr Thr Lys Gln Ile Lys Val Ala Arg His Asn Lys Ile Leu Thr
165 170 175
Gly Leu Pro Asp Ala Tyr Gly Arg Gly Arg Ile Ile Gly Asp Tyr Arg
180 185 190
Arg Val Ala Leu Tyr Gly Val Asn Ala Leu Ile Lys Phe Lys Gln Arg
195 200 205
Asp Lys Asp Ser Ile Pro Tyr Arg Asn Asp Phe Thr Glu Pro Glu Ile
210 215 220
Glu His Trp Ile Arg Phe Arg Glu Glu His Asp Glu Gln Ile Lys Ala
225 230 235 240
Leu Lys Gln Leu Ile Asn Leu Gly Asn Glu Tyr Gly Leu Asp Leu Ser
245 250 255
Arg Pro Ala Gln Thr Ala Gln Glu Ala Val Gln Trp Thr Tyr Met Gly
260 265 270
Tyr Leu Ala Ser Val Lys Ser Gln Asp Gly Ala Ala Met Ser Phe Gly
275 280 285
Arg Val Ser Thr Phe Phe Asp Val Tyr Phe Glu Arg Asp Leu Lys Ala
290 295 300
Gly Lys Ile Thr Glu Thr Asp Ala Gln Glu Ile Ile Asp Asn Leu Val
305 310 315 320
Met Lys Leu Arg Ile Val Arg Phe Leu Arg Thr Lys Asp Tyr Asp Ala
325 330 335
Ile Phe Ser Gly Asp Pro Tyr Trp Ala Thr Trp Ser Asp Ala Gly Phe
340 345 350
Gly Asp Asp Gly Arg Thr Met Val Thr Lys Thr Ser Phe Arg Leu Leu
355 360 365
Asn Thr Leu Thr Leu Glu His Leu Gly Pro Gly Pro Glu Pro Asn Ile
370 375 380
Thr Ile Phe Trp Asp Pro Lys Leu Pro Glu Ala Tyr Lys Arg Phe Cys
385 390 395 400
Ala Arg Ile Ser Ile Asp Thr Ser Ala Ile Gln Tyr Glu Ser Asp Lys
405 410 415
Glu Ile Arg Ser His Trp Gly Asp Asp Ala Ala Ile Ala Cys Cys Val
420 425 430
Ser Pro Met Arg Val Gly Lys Gln Met Gln Phe Phe Ala Ala Arg Val
435 440 445
Asn Ser Ala Lys Ala Leu Leu Tyr Ala Ile Asn Gly Gly Arg Asp Glu
450 455 460
Met Thr Gly Met Gln Val Ile Asp Lys Gly Val Ile Asp Pro Ile Lys
465 470 475 480
Pro Glu Ala Asp Gly Thr Leu Asp Tyr Glu Lys Val Lys Ala Asn Tyr
485 490 495
Glu Lys Ala Leu Glu Trp Leu Ser Glu Thr Tyr Val Met Ala Leu Asn
500 505 510
Ile Ile His Tyr Met His Asp Lys Tyr Ala Tyr Glu Ser Ile Glu Met
515 520 525
Ala Leu His Asp Lys Glu Val Tyr Arg Thr Leu Gly Cys Gly Met Ser
530 535 540
Gly Leu Ser Ile Ala Ala Asp Ser Leu Ser Ala Cys Lys Tyr Ala Lys
545 550 555 560
Val Tyr Pro Ile Tyr Asn Lys Asp Ala Lys Thr Thr Pro Gly His Glu
565 570 575
Asn Glu Tyr Val Glu Gly Ala Asp Asp Asp Leu Ile Val Gly Tyr Arg
580 585 590
Thr Glu Gly Asp Phe Pro Leu Tyr Gly Asn Asp Asp Asp Arg Ala Asp
595 600 605
Asp Ile Ala Lys Trp Val Val Ser Thr Val Met Gly Gln Val Lys Arg
610 615 620
Leu Pro Val Tyr Arg Asp Ala Val Pro Thr Gln Ser Ile Leu Thr Ile
625 630 635 640
Thr Ser Asn Val Glu Tyr Gly Lys Ala Thr Gly Ala Phe Pro Ser Gly
645 650 655
His Lys Lys Gly Thr Pro Tyr Ala Pro Gly Ala Asn Pro Glu Asn Gly
660 665 670
Met Asp Ser His Gly Met Leu Pro Ser Met Phe Ser Val Gly Lys Ile
675 680 685
Asp Tyr Asn Asp Ala Leu Asp Gly Ile Ser Leu Thr Asn Thr Ile Thr
690 695 700
Pro Asp Gly Leu Gly Arg Asp Glu Glu Glu Arg Ile Gly Asn Leu Val
705 710 715 720
Gly Ile Leu Asp Ala Gly Asn Gly His Gly Leu Tyr His Ala Asn Ile
725 730 735
Asn Val Leu Arg Lys Glu Gln Leu Glu Asp Ala Val Glu His Pro Glu
740 745 750
Lys Tyr Pro His Leu Thr Val Arg Val Ser Gly Tyr Ala Val Asn Phe
755 760 765
Val Lys Leu Thr Lys Glu Gln Gln Leu Asp Val Ile Ser Arg Thr Phe
770 775 780
His Gln Gly Ala Val Val Asp
785 790
<210> 61
<211> 2415
<212> DNA
<213> 长双岐杆菌
<220>
<221> 杂项特征
<223> NCC2705
<400> 61
gtgaagatgc gaaacctaca accccattta aggagtgaca tgaccgcagt ggaaaatgca 60
gctgtctccc aggaggagct cgacgccaag gcgtgggccg gcttcaccga gggcaactgg 120
cagaaggata ttgacgtccg cgacttcatc cagaagaact acaccccgta cgagggcgac 180
gagacattcc tggctcctgc caccgagaag accaagcacc tgtggaagta cctcgacgac 240
aactacctgg ccgtggagcg caagcagcgc gtctacgacg tggacaccca taccccggcc 300
gacgtcgacg ccttcccggc cggctacatc gactccccgg aagtcgataa cgtggtcgtt 360
ggcctccaga ccgacgttcc ctgcaagcgc gcgatgatgc cgaacggtgg ctggcgcatg 420
gtcgagcagg ccatcaagga agccggcaag gaaccggatc cggagatcaa gaagatcttc 480
accaagtacc gcaagaccca caacgacggc gtcttcggcg tgtacaccaa gcagatcaag 540
gtcgcccgcc acaacaagat cctcaccggt ctgccggacg cctacggccg tggccgcatc 600
atcggcgact accgccgcgt cgccctgtac ggcgtgaaca agctcatcgc cttcaagaag 660
cgcgacaagg actccgtgcc gtaccgcaac gacttcaccg agccggagat cgagcactgg 720
atccgcttcc gtgaggagca cgacgagcag atcaaggccc tgaagaagct catcaacctc 780
ggcaacgagt acggcctcga cctgtcccgc ccggcccaga ccgcgcagga agccgtgcag 840
tggacctaca tgggctacct ggcctccatc aagtcccagg acggcgccgc catgtccttc 900
ggccgcaact ccgccttcct cgactgctac atcgagcgcg acctccaggc cggcaagatc 960
accgagaccg acgcccagga gctcatcgac aacatcgtca tgaagctgcg catcgtgcgc 1020
ttcctgcgta ccaaggacta cgattcgatc ttctccggcg acccgtactg ggcgacctgg 1080
tccgacgccg gcttcggcga tgacggccgt tcgatggtca ccaagacctc gttccgtctg 1140
ctcaacaccc tgaccctcga gcacctcgga cctggccccg agccgaacat caccatcttc 1200
tgggatccga agctgcctga ggcctacaag cgcttctgcg ccaagatctc catcgacacc 1260
tcggccatcc agtacgagtc cgacaaggag attcgtagcc actggggcga cgacgcggct 1320
atcgcatgct gcgtgtcccc gatgcgtgtc ggcaagcaga tgcagttctt cgccgcccgc 1380
gtgaactccg ccaaggccct gctgtacgcc atcaacggcg gccgcgacga gatgaccggc 1440
atgcaggtca tcgacaaggg cgtgatcgag ccgattaccc cggaggccga cggcaccctg 1500
gactacgaga aggtcaagaa caactacgag aaggctctcg agtggctgtc cgagacctac 1560
gtcatggccc tgaacatcat ccactacatg cacgataagt acgcgtacga gtccatcgag 1620
atggccctgc acgacaagga agtgtaccgc accctcggct gcggcatgtc cggtctgtcc 1680
atcgccgccg actccctcgc cgccgtcaag tacgccaagg tctacccgat ctacaacaag 1740
gacgcgaaga ccctggaagg ccacgagtac gagtacgttg agggcgccga cgacgacctg 1800
atcgtcggct accgcaccga gggcgagttc ccggtctacg gcaacgacga cgaccgcgcc 1860
gacgacatcg ccaagtgggt cgtctccacg gtcatgggcc aggtcaagag gctcccggtc 1920
taccgcggcg ccgtcccgac ccagtccatc ctgacgatca cctccaacgt cgagtacggc 1980
aagaacaccg gttccttccc gtccggccac gccaagggca ccccgtacgc tccgggcgcc 2040
aacccggaga acggcatgga ctcccacggc atgctgccgt ccatgttctc cgtcggcaag 2100
atcgactaca acgacgctct tgacggcatc tcgctgacca acaccatcac ccctgatggc 2160
ctgggccgcg acgaggacga gcgcatcggc aacctggtcg gcatcctgga cgccggcaac 2220
ggccacggcc tctaccacgc gaacatcaac gttctgcgca aggagaccat ggaggacgcc 2280
gtcgagcacc ccgaaaagta cccgcacctg accgtgcgtg tctccggcta cgcggtgaac 2340
ttcgtcaagc tcaccaagga gcagcagctc gacgtcatct cccgtacctt ccaccagggt 2400
gccgtcgtcg actga 2415
<210> 62
<211> 804
<212> PRT
<213> 长双岐杆菌
<220>
<221> 杂项特征
<223> NCC2705
<400> 62
Met Lys Met Arg Asn Leu Gln Pro His Leu Arg Ser Asp Met Thr Ala
1 5 10 15
Val Glu Asn Ala Ala Val Ser Gln Glu Glu Leu Asp Ala Lys Ala Trp
20 25 30
Ala Gly Phe Thr Glu Gly Asn Trp Gln Lys Asp Ile Asp Val Arg Asp
35 40 45
Phe Ile Gln Lys Asn Tyr Thr Pro Tyr Glu Gly Asp Glu Thr Phe Leu
50 55 60
Ala Pro Ala Thr Glu Lys Thr Lys His Leu Trp Lys Tyr Leu Asp Asp
65 70 75 80
Asn Tyr Leu Ala Val Glu Arg Lys Gln Arg Val Tyr Asp Val Asp Thr
85 90 95
His Thr Pro Ala Asp Val Asp Ala Phe Pro Ala Gly Tyr Ile Asp Ser
100 105 110
Pro Glu Val Asp Asn Val Val Val Gly Leu Gln Thr Asp Val Pro Cys
115 120 125
Lys Arg Ala Met Met Pro Asn Gly Gly Trp Arg Met Val Glu Gln Ala
130 135 140
Ile Lys Glu Ala Gly Lys Glu Pro Asp Pro Glu Ile Lys Lys Ile Phe
145 150 155 160
Thr Lys Tyr Arg Lys Thr His Asn Asp Gly Val Phe Gly Val Tyr Thr
165 170 175
Lys Gln Ile Lys Val Ala Arg His Asn Lys Ile Leu Thr Gly Leu Pro
180 185 190
Asp Ala Tyr Gly Arg Gly Arg Ile Ile Gly Asp Tyr Arg Arg Val Ala
195 200 205
Leu Tyr Gly Val Asn Lys Leu Ile Ala Phe Lys Lys Arg Asp Lys Asp
210 215 220
Ser Val Pro Tyr Arg Asn Asp Phe Thr Glu Pro Glu Ile Glu His Trp
225 230 235 240
Ile Arg Phe Arg Glu Glu His Asp Glu Gln Ile Lys Ala Leu Lys Lys
245 250 255
Leu Ile Asn Leu Gly Asn Glu Tyr Gly Leu Asp Leu Ser Arg Pro Ala
260 265 270
Gln Thr Ala Gln Glu Ala Val Gln Trp Thr Tyr Met Gly Tyr Leu Ala
275 280 285
Ser Ile Lys Ser Gln Asp Gly Ala Ala Met Ser Phe Gly Arg Asn Ser
290 295 300
Ala Phe Leu Asp Cys Tyr Ile Glu Arg Asp Leu Gln Ala Gly Lys Ile
305 310 315 320
Thr Glu Thr Asp Ala Gln Glu Leu Ile Asp Asn Ile Val Met Lys Leu
325 330 335
Arg Ile Val Arg Phe Leu Arg Thr Lys Asp Tyr Asp Ser Ile Phe Ser
340 345 350
Gly Asp Pro Tyr Trp Ala Thr Trp Ser Asp Ala Gly Phe Gly Asp Asp
355 360 365
Gly Arg Ser Met Val Thr Lys Thr Ser Phe Arg Leu Leu Asn Thr Leu
370 375 380
Thr Leu Glu His Leu Gly Pro Gly Pro Glu Pro Asn Ile Thr Ile Phe
385 390 395 400
Trp Asp Pro Lys Leu Pro Glu Ala Tyr Lys Arg Phe Cys Ala Lys Ile
405 410 415
Ser Ile Asp Thr Ser Ala Ile Gln Tyr Glu Ser Asp Lys Glu Ile Arg
420 425 430
Ser His Trp Gly Asp Asp Ala Ala Ile Ala Cys Cys Val Ser Pro Met
435 440 445
Arg Val Gly Lys Gln Met Gln Phe Phe Ala Ala Arg Val Asn Ser Ala
450 455 460
Lys Ala Leu Leu Tyr Ala Ile Asn Gly Gly Arg Asp Glu Met Thr Gly
465 470 475 480
Met Gln Val Ile Asp Lys Gly Val Ile Glu Pro Ile Thr Pro Glu Ala
485 490 495
Asp Gly Thr Leu Asp Tyr Glu Lys Val Lys Asn Asn Tyr Glu Lys Ala
500 505 510
Leu Glu Trp Leu Ser Glu Thr Tyr Val Met Ala Leu Asn Ile Ile His
515 520 525
Tyr Met His Asp Lys Tyr Ala Tyr Glu Ser Ile Glu Met Ala Leu His
530 535 540
Asp Lys Glu Val Tyr Arg Thr Leu Gly Cys Gly Met Ser Gly Leu Ser
545 550 555 560
Ile Ala Ala Asp Ser Leu Ala Ala Val Lys Tyr Ala Lys Val Tyr Pro
565 570 575
Ile Tyr Asn Lys Asp Ala Lys Thr Leu Glu Gly His Glu Tyr Glu Tyr
580 585 590
Val Glu Gly Ala Asp Asp Asp Leu Ile Val Gly Tyr Arg Thr Glu Gly
595 600 605
Glu Phe Pro Val Tyr Gly Asn Asp Asp Asp Arg Ala Asp Asp Ile Ala
610 615 620
Lys Trp Val Val Ser Thr Val Met Gly Gln Val Lys Arg Leu Pro Val
625 630 635 640
Tyr Arg Gly Ala Val Pro Thr Gln Ser Ile Leu Thr Ile Thr Ser Asn
645 650 655
Val Glu Tyr Gly Lys Asn Thr Gly Ser Phe Pro Ser Gly His Ala Lys
660 665 670
Gly Thr Pro Tyr Ala Pro Gly Ala Asn Pro Glu Asn Gly Met Asp Ser
675 680 685
His Gly Met Leu Pro Ser Met Phe Ser Val Gly Lys Ile Asp Tyr Asn
690 695 700
Asp Ala Leu Asp Gly Ile Ser Leu Thr Asn Thr Ile Thr Pro Asp Gly
705 710 715 720
Leu Gly Arg Asp Glu Asp Glu Arg Ile Gly Asn Leu Val Gly Ile Leu
725 730 735
Asp Ala Gly Asn Gly His Gly Leu Tyr His Ala Asn Ile Asn Val Leu
740 745 750
Arg Lys Glu Thr Met Glu Asp Ala Val Glu His Pro Glu Lys Tyr Pro
755 760 765
His Leu Thr Val Arg Val Ser Gly Tyr Ala Val Asn Phe Val Lys Leu
770 775 780
Thr Lys Glu Gln Gln Leu Asp Val Ile Ser Arg Thr Phe His Gln Gly
785 790 795 800
Ala Val Val Asp
<210> 63
<211> 2376
<212> DNA
<213> 长双岐杆菌
<220>
<221> 杂项特征
<223> DJO10A
<400> 63
atgaccgcag tggaaaatgc agctgtctcc caggaggagc tcgacgccaa ggcgtgggcc 60
ggcttcaccg agggcaactg gcagaaggat attgacgtcc gcgacttcat ccagaagaac 120
tacaccccgt acgagggcga cgagacattc ctggctcctg ccaccgagaa gaccaagcac 180
ctgtggaagt acctcgacga caactacctg gccgtggagc gcaagcagcg cgtctacgac 240
gtggacaccc ataccccggc cgacgtcgac gccttcccgg ccggctacat cgactccccg 300
gaagtcgata acgtggtcgt tggcctccag accgacgttc cctgcaagcg cgcgatgatg 360
ccgaacggtg gctggcgcat ggtcgagcag gccatcaagg aagccggcaa ggaaccggat 420
ccggagatca agaagatctt caccaagtac cgcaagaccc acaacgacgg cgtcttcggc 480
gtgtacacca agcagatcaa ggtcgcccgc cacaacaaga tcctcaccgg tctgccggac 540
gcctacggcc gtggccgcat catcggcgac taccgccgcg tcgccctgta cggcgtgaac 600
aagctcatcg ccttcaagaa gcgcgacaag gactccgtgc cgtaccgcaa cgacttcacc 660
gagccggaga tcgagcactg gatccgcttc cgtgaggagc acgacgagca gatcaaggcc 720
ctgaagaagc tcatcaacct cggcaacgag tacggcctcg acctgtcccg cccggcccag 780
accgcgcagg aagccgtgca gtggacctac atgggctacc tggcctccat caagtcccag 840
gacggcgccg ccatgtcctt cggccgcaac tccgccttcc tcgactgcta catcgagcgc 900
gacctccagg ccggcaagat caccgagacc gacgcccagg agctcatcga caacatcgtc 960
atgaagctgc gcatcgtgcg cttcctgcgt accaaggact acgattcgat cttctccggc 1020
gacccgtact gggcgacctg gtccgacgcc ggcttcggcg atgacggccg ttcgatggtc 1080
accaagacct cgttccgtct gctcaacacc ctgaccctcg agcacctcgg acctggcccc 1140
gagccgaaca tcaccatctt ctgggatccg aagctgcctg aggcctacaa gcgcttctgc 1200
gccaagatct ccatcgacac ctcggccatc cagtacgagt ccgacaagga gattcgcagc 1260
cactggggcg acgacgctgc tatcgcctgc tgcgtgtccc cgatgcgtgt cggcaagcag 1320
atgcagttct tcgccgcccg cgtgaactcc gccaaggccc tgctgtacgc catcaacggc 1380
ggccgcgacg agatgaccgg catgcaggtc atcgacaagg gcgtgatcga gccgattacc 1440
ccggaggccg acggcaccct ggactacgag aaggtcaaga acaactacga gaaggctctc 1500
gagtggctgt ccgagaccta cgtcatggcc ctgaacatca tccactacat gcacgataag 1560
tacgcgtacg agtccatcga gatggccctg cacgacaagg aagtgtaccg caccctcggc 1620
tgcggcatgt ccggtctgtc catcgccgcc gactccctcg ccgccgtcaa gtacgccaag 1680
gtctacccga tctacaacaa ggacgcgaag accctggaag gccacgagta cgagtacgtt 1740
gagggcgccg acgacgacct gatcgtcggc taccgcaccg agggcgagtt cccggtctac 1800
ggcaacgacg acgaccgcgc cgacgacatc gccaagtggg tcgtctccac ggtcatgggc 1860
caggtcaaga ggctcccggt ctaccgcggc gccgtcccga cccagtccat cctgacgatc 1920
acctccaacg tcgagtacgg caagaacacc ggttccttcc cgtccggcca cgccaagggc 1980
accccgtacg ctccgggcgc caacccggag aacggcatgg actcccacgg catgctgccg 2040
tccatgttct ccgtcggcaa gatcgactac aacgacgctc ttgacggcat ctcgctgacc 2100
aacaccatca cccctgatgg cctgggccgc gacgaggacg agcgcatcgg caacctggtc 2160
ggcatcctgg acgccggcaa cggccacggc ctctaccacg cgaacatcaa cgttctgcgc 2220
aaggagacca tggaggacgc cgtcgagcac cccgaaaagt acccgcacct gaccgtgcgt 2280
gtctccggct acgcggtgaa cttcgtcaag ctcaccaagg agcagcagct cgacgtcatc 2340
tcccgtacct tccaccaggg tgccgtcgtc gactga 2376
<210> 64
<211> 791
<212> PRT
<213> 长双岐杆菌
<220>
<221> 杂项特征
<223> DJO10A
<400> 64
Met Thr Ala Val Glu Asn Ala Ala Val Ser Gln Glu Glu Leu Asp Ala
1 5 10 15
Lys Ala Trp Ala Gly Phe Thr Glu Gly Asn Trp Gln Lys Asp Ile Asp
20 25 30
Val Arg Asp Phe Ile Gln Lys Asn Tyr Thr Pro Tyr Glu Gly Asp Glu
35 40 45
Thr Phe Leu Ala Pro Ala Thr Glu Lys Thr Lys His Leu Trp Lys Tyr
50 55 60
Leu Asp Asp Asn Tyr Leu Ala Val Glu Arg Lys Gln Arg Val Tyr Asp
65 70 75 80
Val Asp Thr His Thr Pro Ala Asp Val Asp Ala Phe Pro Ala Gly Tyr
85 90 95
Ile Asp Ser Pro Glu Val Asp Asn Val Val Val Gly Leu Gln Thr Asp
100 105 110
Val Pro Cys Lys Arg Ala Met Met Pro Asn Gly Gly Trp Arg Met Val
115 120 125
Glu Gln Ala Ile Lys Glu Ala Gly Lys Glu Pro Asp Pro Glu Ile Lys
130 135 140
Lys Ile Phe Thr Lys Tyr Arg Lys Thr His Asn Asp Gly Val Phe Gly
145 150 155 160
Val Tyr Thr Lys Gln Ile Lys Val Ala Arg His Asn Lys Ile Leu Thr
165 170 175
Gly Leu Pro Asp Ala Tyr Gly Arg Gly Arg Ile Ile Gly Asp Tyr Arg
180 185 190
Arg Val Ala Leu Tyr Gly Val Asn Lys Leu Ile Ala Phe Lys Lys Arg
195 200 205
Asp Lys Asp Ser Val Pro Tyr Arg Asn Asp Phe Thr Glu Pro Glu Ile
210 215 220
Glu His Trp Ile Arg Phe Arg Glu Glu His Asp Glu Gln Ile Lys Ala
225 230 235 240
Leu Lys Lys Leu Ile Asn Leu Gly Asn Glu Tyr Gly Leu Asp Leu Ser
245 250 255
Arg Pro Ala Gln Thr Ala Gln Glu Ala Val Gln Trp Thr Tyr Met Gly
260 265 270
Tyr Leu Ala Ser Ile Lys Ser Gln Asp Gly Ala Ala Met Ser Phe Gly
275 280 285
Arg Asn Ser Ala Phe Leu Asp Cys Tyr Ile Glu Arg Asp Leu Gln Ala
290 295 300
Gly Lys Ile Thr Glu Thr Asp Ala Gln Glu Leu Ile Asp Asn Ile Val
305 310 315 320
Met Lys Leu Arg Ile Val Arg Phe Leu Arg Thr Lys Asp Tyr Asp Ser
325 330 335
Ile Phe Ser Gly Asp Pro Tyr Trp Ala Thr Trp Ser Asp Ala Gly Phe
340 345 350
Gly Asp Asp Gly Arg Ser Met Val Thr Lys Thr Ser Phe Arg Leu Leu
355 360 365
Asn Thr Leu Thr Leu Glu His Leu Gly Pro Gly Pro Glu Pro Asn Ile
370 375 380
Thr Ile Phe Trp Asp Pro Lys Leu Pro Glu Ala Tyr Lys Arg Phe Cys
385 390 395 400
Ala Lys Ile Ser Ile Asp Thr Ser Ala Ile Gln Tyr Glu Ser Asp Lys
405 410 415
Glu Ile Arg Ser His Trp Gly Asp Asp Ala Ala Ile Ala Cys Cys Val
420 425 430
Ser Pro Met Arg Val Gly Lys Gln Met Gln Phe Phe Ala Ala Arg Val
435 440 445
Asn Ser Ala Lys Ala Leu Leu Tyr Ala Ile Asn Gly Gly Arg Asp Glu
450 455 460
Met Thr Gly Met Gln Val Ile Asp Lys Gly Val Ile Glu Pro Ile Thr
465 470 475 480
Pro Glu Ala Asp Gly Thr Leu Asp Tyr Glu Lys Val Lys Asn Asn Tyr
485 490 495
Glu Lys Ala Leu Glu Trp Leu Ser Glu Thr Tyr Val Met Ala Leu Asn
500 505 510
Ile Ile His Tyr Met His Asp Lys Tyr Ala Tyr Glu Ser Ile Glu Met
515 520 525
Ala Leu His Asp Lys Glu Val Tyr Arg Thr Leu Gly Cys Gly Met Ser
530 535 540
Gly Leu Ser Ile Ala Ala Asp Ser Leu Ala Ala Val Lys Tyr Ala Lys
545 550 555 560
Val Tyr Pro Ile Tyr Asn Lys Asp Ala Lys Thr Leu Glu Gly His Glu
565 570 575
Tyr Glu Tyr Val Glu Gly Ala Asp Asp Asp Leu Ile Val Gly Tyr Arg
580 585 590
Thr Glu Gly Glu Phe Pro Val Tyr Gly Asn Asp Asp Asp Arg Ala Asp
595 600 605
Asp Ile Ala Lys Trp Val Val Ser Thr Val Met Gly Gln Val Lys Arg
610 615 620
Leu Pro Val Tyr Arg Gly Ala Val Pro Thr Gln Ser Ile Leu Thr Ile
625 630 635 640
Thr Ser Asn Val Glu Tyr Gly Lys Asn Thr Gly Ser Phe Pro Ser Gly
645 650 655
His Ala Lys Gly Thr Pro Tyr Ala Pro Gly Ala Asn Pro Glu Asn Gly
660 665 670
Met Asp Ser His Gly Met Leu Pro Ser Met Phe Ser Val Gly Lys Ile
675 680 685
Asp Tyr Asn Asp Ala Leu Asp Gly Ile Ser Leu Thr Asn Thr Ile Thr
690 695 700
Pro Asp Gly Leu Gly Arg Asp Glu Asp Glu Arg Ile Gly Asn Leu Val
705 710 715 720
Gly Ile Leu Asp Ala Gly Asn Gly His Gly Leu Tyr His Ala Asn Ile
725 730 735
Asn Val Leu Arg Lys Glu Thr Met Glu Asp Ala Val Glu His Pro Glu
740 745 750
Lys Tyr Pro His Leu Thr Val Arg Val Ser Gly Tyr Ala Val Asn Phe
755 760 765
Val Lys Leu Thr Lys Glu Gln Gln Leu Asp Val Ile Ser Arg Thr Phe
770 775 780
His Gln Gly Ala Val Val Asp
785 790
<210> 65
<211> 2379
<212> DNA
<213> 动物双歧杆菌
<220>
<221> 杂项特征
<223> DSM 10140
<400> 65
atgtcagcaa ttgaaaacgt ggccgaggtg tccccggaag ccatcaagga acaggcttgg 60
gaggggttcg ttcccggcaa ctgggagaag gacatcgacg ttcgtgactt cattcagaag 120
aactacacgc cttacgaggg tgatgaatcg ttcctcgcgg atgcgaccga caagacgaag 180
tacctgtgga agtacctcga cgacaactat ctggcggtgg agcgcaagca gcgtgtctat 240
gatgtggaca cccacacgcc ggcggatatc gacgccttcc cggctggcta tatcgattcc 300
ccggagatcg acaatgtgat cgtcggcctg cagaccgatg agccatgcaa gcgagccatg 360
atgccgaatg gcggttggcg catggtggag caggccatca aggaggccgg caaggagccg 420
gacccggcga tcaagaagat cttcaccaag taccgcaaga cgcataacga cggtgtgttc 480
ggcgtctata cgaagaacat caaagtggca cgccacaaca agattctcac cggcctgccg 540
gatgcctacg gccgcggccg catcatcggc gactaccgtc gtgtggccct gtatggcgtg 600
gatgcgctga ttaagttcaa gcagcgtgac aaggacgcca tcccgtaccg caacgacttc 660
tcggagaccg agatcgagca ctggatccgt taccgcgagg agcacgacga gcagattaag 720
gctctgaaga agctcatcaa cctaggcaag gaatacggac tcgatttggc gcgccccgcc 780
atgaacgcgc gtgaggccgt gcagtggacc tacatgggct acctcgcctc catcaagagc 840
caggacggcg ccgcgatgag cttcggccgc gtgtcagcgt tcttcgacat ctacttcgag 900
cgcgatctca aggaaggcaa gatcaccgag accgacgccc aggagatcat cgacaatctg 960
gtgatgaagc tgcgcatcgt gcgattcctg cgcaccaagg actacgattc gatcttctcg 1020
ggcgacccct actgggcgac atggtcggat gcaggcttcg gcgacgatgg ccgcaccatg 1080
gtcaccaaga cgtcgttccg tctgctcaac acgctcacgc tcgagcattt gggaccggga 1140
cccgaaccga acatcacgat tttctgggat ccgaagctgc cggaaggcta caagcgtttc 1200
tgcgcccaga tctccattga tacctcggcc atccagtatg aatccgacaa ggagatccgc 1260
aaccattggg gtgacgatgc ggccattgca tgctgcgtct ccccgatgcg tgtgggcaag 1320
caaatgcagt tcttcgcggc tcgcgtgaac tccgccaagg cgctgctcta cgcgatcaac 1380
ggcggccgtg acgagatgac cggcatgcag gtgatcgaca agggcatcat cgagccgatc 1440
cagcccgagg ctgacggcac gctcgattac gagaaggtga aggccaacta tgagaaggcc 1500
ctcgaatggc tttcggagac ctacgtcgaa gcgctgaaca tcattcatta catgcatgac 1560
aagtatgcgt atgagtccat cgagatggcg ctgcacgacc gcgaggtcta ccgcaccctg 1620
ggctgcggca tgtccggcct gtcgatcgcc gccgattcgc tttccgcatg caagtacgcc 1680
aaggtgtacc caatctacaa caaggacgcc aaggacatgc cgggtcacga gtacgaatat 1740
gtcgaaggcg cggacgacga tctggtggtc ggctaccgca ccgagggcga gttcccgctt 1800
tacggcaacg acgacgatcg tgccgatgac attgccaagt gggtcgtgtc caccgtcatg 1860
ggccaggtca agcgcctgcc ggtgtatcgt ggtgccgtcc ccacgcagtc gatcctcacg 1920
atcacctcga acgtcgagta tggcaagaac accggatcct tcccgtcggg ccacgccaag 1980
ggaacgccgt acgccccggg cgcgaacccg gagaacggca tggactccca tggcatgctc 2040
ccctcgatgt tctcggtggg caagatcgat tacaacgacg cccttgacgg catctcgctg 2100
acgaacacga tcacacccga cggcctgggc cgcgatgagg acgaacgcat cagcaacctc 2160
gtcggcatcc tcgacgcagg caacggccat ggactgtacc atgcgaacat caacgtgctg 2220
cgcaaggaac agctcgaaga cgccgtggag cacccggaga agtacccgca cctgaccgtg 2280
cgcgtctccg gttacgccgt gaacttcgtc aagcttacga aggaacagca gcttgacgtc 2340
atttcccgca ccttccatca gggcgcggtc gaggactaa 2379
<210> 66
<211> 792
<212> PRT
<213> 动物双歧杆菌
<220>
<221> 杂项特征
<223> DSM 10140
<400> 66
Met Ser Ala Ile Glu Asn Val Ala Glu Val Ser Pro Glu Ala Ile Lys
1 5 10 15
Glu Gln Ala Trp Glu Gly Phe Val Pro Gly Asn Trp Glu Lys Asp Ile
20 25 30
Asp Val Arg Asp Phe Ile Gln Lys Asn Tyr Thr Pro Tyr Glu Gly Asp
35 40 45
Glu Ser Phe Leu Ala Asp Ala Thr Asp Lys Thr Lys Tyr Leu Trp Lys
50 55 60
Tyr Leu Asp Asp Asn Tyr Leu Ala Val Glu Arg Lys Gln Arg Val Tyr
65 70 75 80
Asp Val Asp Thr His Thr Pro Ala Asp Ile Asp Ala Phe Pro Ala Gly
85 90 95
Tyr Ile Asp Ser Pro Glu Ile Asp Asn Val Ile Val Gly Leu Gln Thr
100 105 110
Asp Glu Pro Cys Lys Arg Ala Met Met Pro Asn Gly Gly Trp Arg Met
115 120 125
Val Glu Gln Ala Ile Lys Glu Ala Gly Lys Glu Pro Asp Pro Ala Ile
130 135 140
Lys Lys Ile Phe Thr Lys Tyr Arg Lys Thr His Asn Asp Gly Val Phe
145 150 155 160
Gly Val Tyr Thr Lys Asn Ile Lys Val Ala Arg His Asn Lys Ile Leu
165 170 175
Thr Gly Leu Pro Asp Ala Tyr Gly Arg Gly Arg Ile Ile Gly Asp Tyr
180 185 190
Arg Arg Val Ala Leu Tyr Gly Val Asp Ala Leu Ile Lys Phe Lys Gln
195 200 205
Arg Asp Lys Asp Ala Ile Pro Tyr Arg Asn Asp Phe Ser Glu Thr Glu
210 215 220
Ile Glu His Trp Ile Arg Tyr Arg Glu Glu His Asp Glu Gln Ile Lys
225 230 235 240
Ala Leu Lys Lys Leu Ile Asn Leu Gly Lys Glu Tyr Gly Leu Asp Leu
245 250 255
Ala Arg Pro Ala Met Asn Ala Arg Glu Ala Val Gln Trp Thr Tyr Met
260 265 270
Gly Tyr Leu Ala Ser Ile Lys Ser Gln Asp Gly Ala Ala Met Ser Phe
275 280 285
Gly Arg Val Ser Ala Phe Phe Asp Ile Tyr Phe Glu Arg Asp Leu Lys
290 295 300
Glu Gly Lys Ile Thr Glu Thr Asp Ala Gln Glu Ile Ile Asp Asn Leu
305 310 315 320
Val Met Lys Leu Arg Ile Val Arg Phe Leu Arg Thr Lys Asp Tyr Asp
325 330 335
Ser Ile Phe Ser Gly Asp Pro Tyr Trp Ala Thr Trp Ser Asp Ala Gly
340 345 350
Phe Gly Asp Asp Gly Arg Thr Met Val Thr Lys Thr Ser Phe Arg Leu
355 360 365
Leu Asn Thr Leu Thr Leu Glu His Leu Gly Pro Gly Pro Glu Pro Asn
370 375 380
Ile Thr Ile Phe Trp Asp Pro Lys Leu Pro Glu Gly Tyr Lys Arg Phe
385 390 395 400
Cys Ala Gln Ile Ser Ile Asp Thr Ser Ala Ile Gln Tyr Glu Ser Asp
405 410 415
Lys Glu Ile Arg Asn His Trp Gly Asp Asp Ala Ala Ile Ala Cys Cys
420 425 430
Val Ser Pro Met Arg Val Gly Lys Gln Met Gln Phe Phe Ala Ala Arg
435 440 445
Val Asn Ser Ala Lys Ala Leu Leu Tyr Ala Ile Asn Gly Gly Arg Asp
450 455 460
Glu Met Thr Gly Met Gln Val Ile Asp Lys Gly Ile Ile Glu Pro Ile
465 470 475 480
Gln Pro Glu Ala Asp Gly Thr Leu Asp Tyr Glu Lys Val Lys Ala Asn
485 490 495
Tyr Glu Lys Ala Leu Glu Trp Leu Ser Glu Thr Tyr Val Glu Ala Leu
500 505 510
Asn Ile Ile His Tyr Met His Asp Lys Tyr Ala Tyr Glu Ser Ile Glu
515 520 525
Met Ala Leu His Asp Arg Glu Val Tyr Arg Thr Leu Gly Cys Gly Met
530 535 540
Ser Gly Leu Ser Ile Ala Ala Asp Ser Leu Ser Ala Cys Lys Tyr Ala
545 550 555 560
Lys Val Tyr Pro Ile Tyr Asn Lys Asp Ala Lys Asp Met Pro Gly His
565 570 575
Glu Tyr Glu Tyr Val Glu Gly Ala Asp Asp Asp Leu Val Val Gly Tyr
580 585 590
Arg Thr Glu Gly Glu Phe Pro Leu Tyr Gly Asn Asp Asp Asp Arg Ala
595 600 605
Asp Asp Ile Ala Lys Trp Val Val Ser Thr Val Met Gly Gln Val Lys
610 615 620
Arg Leu Pro Val Tyr Arg Gly Ala Val Pro Thr Gln Ser Ile Leu Thr
625 630 635 640
Ile Thr Ser Asn Val Glu Tyr Gly Lys Asn Thr Gly Ser Phe Pro Ser
645 650 655
Gly His Ala Lys Gly Thr Pro Tyr Ala Pro Gly Ala Asn Pro Glu Asn
660 665 670
Gly Met Asp Ser His Gly Met Leu Pro Ser Met Phe Ser Val Gly Lys
675 680 685
Ile Asp Tyr Asn Asp Ala Leu Asp Gly Ile Ser Leu Thr Asn Thr Ile
690 695 700
Thr Pro Asp Gly Leu Gly Arg Asp Glu Asp Glu Arg Ile Ser Asn Leu
705 710 715 720
Val Gly Ile Leu Asp Ala Gly Asn Gly His Gly Leu Tyr His Ala Asn
725 730 735
Ile Asn Val Leu Arg Lys Glu Gln Leu Glu Asp Ala Val Glu His Pro
740 745 750
Glu Lys Tyr Pro His Leu Thr Val Arg Val Ser Gly Tyr Ala Val Asn
755 760 765
Phe Val Lys Leu Thr Lys Glu Gln Gln Leu Asp Val Ile Ser Arg Thr
770 775 780
Phe His Gln Gly Ala Val Glu Asp
785 790
<210> 67
<211> 2226
<212> DNA
<213> 解纤维素梭菌
<400> 67
atggatccat ggagatattt caaaaacgga aattggtccg aggaaataga tgtaagggat 60
tttattatta ataattatat accatataaa ggagatgatt cctttttaaa aggccctact 120
gaaaagactc aaaaactctg gaaaaaagtc agtggtatcc ttgacgagga aagagagaac 180
ggaggagttc tcgatgttga taccaaaata atatcaacta tcacttcgca tgaacccgga 240
tatattgata aggatttgga aaagattgta ggattgcaga cggataaacc tctaaaaagg 300
ggtataatgc ctttcggtgg tatcaggatg gtagtaaagg gcggagaggc ctacggcaaa 360
aagattgacg aaagtgttgt aaagctattt actgaatata ggaagactca caatgacggt 420
gtttacgatg tctatactcc cgaaatgatg agggcgaaaa aagcaggtat tataaccggg 480
cttcctgatg catacggtag aggaagaata atcggtgatt acagaagagt tgcactgtat 540
ggggttgaca ggcttatcgg agataagcaa aaacaactta caagcctaga aatggattac 600
atggacagtg aaaccataca ggaaagggaa gaaagaaaaa gtcagataaa agctcttgag 660
tacttaaagc aaatggctga aatgtatggc tttgatattt caaggcctgc tgaaaccgca 720
caggaagcat ttcaatggtt gtatttcggt ttcctcggag cagtaaagga gcagaatggt 780
gcggctatga gtcttggaag agtttcaaca ttccttgata tttatataga aagggatatg 840
aaggagggga cacttaccga agaagaggca caggagcttg ttgaccattt tgttatgaag 900
cttagattag taagattcct gagaactcca gagtatgaga aactgttctc aggtgaccct 960
acatggataa ccgaaagcat tggaggtatg ggtcttgacg gacgtactct ggtaacgaag 1020
aattccttca gaatgctgca taccctattt aatctgggtc atgcacccga gcccaatatg 1080
acggtgcttt ggtcggtgca tctgcctgat ggctttaaga aatactgctc atatgtttct 1140
atcaatacaa gctctatcca atacgagagc gatgatataa tgaggtatta ttggggagac 1200
gactacggca tagcatgctg tgtttcagcc atgagaatag gaaagcagat gcagttcttc 1260
ggagcccgct gcaatatggc gaaagctttg ttgtatgcaa ttaacggggg gcgtgatgaa 1320
aaatcgggcg ttcaggtagg acctataatg caggctattg agactgaata tcttgattat 1380
gatgatgtaa taaagaggtt cgacgcagta ctaacatggg ttgcaagact ttacatcaac 1440
actctgaata taatacacta tatgcatgac aagtacgctt atgaaagact acagatggct 1500
ttgcacgaca aggacatatt aagaacaatg gcctgcggaa tagcaggatt atctgtagtt 1560
gcggattctc tgagtgcaat taaatatgca aaggtaaagg taataagaaa tgaagagggg 1620
cttgccgttg actatgacat agaaggtgat tatccgaaat ttggaaataa cgacgaccgt 1680
gtagacaata tagccgtaat gctggtaaaa agctttatgg agaagctgga aaagcagaga 1740
acctacaggc actctgttcc taccctttca atactgacta ttacatcaaa tgttgtatac 1800
ggagctaaga caggtaatac acctgacgga agaaaagcgg gagaaccctt cggaccgggt 1860
gcaaacccaa tgcacggaag agacttgaac ggtgcacttg cagttcttaa atccatttca 1920
aagctgcctt accagtttgc acaggacggt atatcataca ctttttcaat agtaccaaag 1980
gcacttggaa aagaggaaga tacaaggatc aacaaccttg tgtcactgct tgactcttac 2040
tttaaagaag gcggacatca cattaatatc aatgtatttg agagagaaat gctgctggat 2100
gcaatggatc atcctgaaaa gtacccacag ctcacaatca gggtatccgg ctatgcggta 2160
aactttataa aattgacgag ggaacagcag ctagatgtaa ttaacagaac gatacatgaa 2220
aatata 2226
<210> 68
<211> 742
<212> PRT
<213> 解纤维素梭菌
<400> 68
Met Asp Pro Trp Arg Tyr Phe Lys Asn Gly Asn Trp Ser Glu Glu Ile
1 5 10 15
Asp Val Arg Asp Phe Ile Ile Asn Asn Tyr Ile Pro Tyr Lys Gly Asp
20 25 30
Asp Ser Phe Leu Lys Gly Pro Thr Glu Lys Thr Gln Lys Leu Trp Lys
35 40 45
Lys Val Ser Gly Ile Leu Asp Glu Glu Arg Glu Asn Gly Gly Val Leu
50 55 60
Asp Val Asp Thr Lys Ile Ile Ser Thr Ile Thr Ser His Glu Pro Gly
65 70 75 80
Tyr Ile Asp Lys Asp Leu Glu Lys Ile Val Gly Leu Gln Thr Asp Lys
85 90 95
Pro Leu Lys Arg Gly Ile Met Pro Phe Gly Gly Ile Arg Met Val Val
100 105 110
Lys Gly Gly Glu Ala Tyr Gly Lys Lys Ile Asp Glu Ser Val Val Lys
115 120 125
Leu Phe Thr Glu Tyr Arg Lys Thr His Asn Asp Gly Val Tyr Asp Val
130 135 140
Tyr Thr Pro Glu Met Met Arg Ala Lys Lys Ala Gly Ile Ile Thr Gly
145 150 155 160
Leu Pro Asp Ala Tyr Gly Arg Gly Arg Ile Ile Gly Asp Tyr Arg Arg
165 170 175
Val Ala Leu Tyr Gly Val Asp Arg Leu Ile Gly Asp Lys Gln Lys Gln
180 185 190
Leu Thr Ser Leu Glu Met Asp Tyr Met Asp Ser Glu Thr Ile Gln Glu
195 200 205
Arg Glu Glu Arg Lys Ser Gln Ile Lys Ala Leu Glu Tyr Leu Lys Gln
210 215 220
Met Ala Glu Met Tyr Gly Phe Asp Ile Ser Arg Pro Ala Glu Thr Ala
225 230 235 240
Gln Glu Ala Phe Gln Trp Leu Tyr Phe Gly Phe Leu Gly Ala Val Lys
245 250 255
Glu Gln Asn Gly Ala Ala Met Ser Leu Gly Arg Val Ser Thr Phe Leu
260 265 270
Asp Ile Tyr Ile Glu Arg Asp Met Lys Glu Gly Thr Leu Thr Glu Glu
275 280 285
Glu Ala Gln Glu Leu Val Asp His Phe Val Met Lys Leu Arg Leu Val
290 295 300
Arg Phe Leu Arg Thr Pro Glu Tyr Glu Lys Leu Phe Ser Gly Asp Pro
305 310 315 320
Thr Trp Ile Thr Glu Ser Ile Gly Gly Met Gly Leu Asp Gly Arg Thr
325 330 335
Leu Val Thr Lys Asn Ser Phe Arg Met Leu His Thr Leu Phe Asn Leu
340 345 350
Gly His Ala Pro Glu Pro Asn Met Thr Val Leu Trp Ser Val His Leu
355 360 365
Pro Asp Gly Phe Lys Lys Tyr Cys Ser Tyr Val Ser Ile Asn Thr Ser
370 375 380
Ser Ile Gln Tyr Glu Ser Asp Asp Ile Met Arg Tyr Tyr Trp Gly Asp
385 390 395 400
Asp Tyr Gly Ile Ala Cys Cys Val Ser Ala Met Arg Ile Gly Lys Gln
405 410 415
Met Gln Phe Phe Gly Ala Arg Cys Asn Met Ala Lys Ala Leu Leu Tyr
420 425 430
Ala Ile Asn Gly Gly Arg Asp Glu Lys Ser Gly Val Gln Val Gly Pro
435 440 445
Ile Met Gln Ala Ile Glu Thr Glu Tyr Leu Asp Tyr Asp Asp Val Ile
450 455 460
Lys Arg Phe Asp Ala Val Leu Thr Trp Val Ala Arg Leu Tyr Ile Asn
465 470 475 480
Thr Leu Asn Ile Ile His Tyr Met His Asp Lys Tyr Ala Tyr Glu Arg
485 490 495
Leu Gln Met Ala Leu His Asp Lys Asp Ile Leu Arg Thr Met Ala Cys
500 505 510
Gly Ile Ala Gly Leu Ser Val Val Ala Asp Ser Leu Ser Ala Ile Lys
515 520 525
Tyr Ala Lys Val Lys Val Ile Arg Asn Glu Glu Gly Leu Ala Val Asp
530 535 540
Tyr Asp Ile Glu Gly Asp Tyr Pro Lys Phe Gly Asn Asn Asp Asp Arg
545 550 555 560
Val Asp Asn Ile Ala Val Met Leu Val Lys Ser Phe Met Glu Lys Leu
565 570 575
Glu Lys Gln Arg Thr Tyr Arg His Ser Val Pro Thr Leu Ser Ile Leu
580 585 590
Thr Ile Thr Ser Asn Val Val Tyr Gly Ala Lys Thr Gly Asn Thr Pro
595 600 605
Asp Gly Arg Lys Ala Gly Glu Pro Phe Gly Pro Gly Ala Asn Pro Met
610 615 620
His Gly Arg Asp Leu Asn Gly Ala Leu Ala Val Leu Lys Ser Ile Ser
625 630 635 640
Lys Leu Pro Tyr Gln Phe Ala Gln Asp Gly Ile Ser Tyr Thr Phe Ser
645 650 655
Ile Val Pro Lys Ala Leu Gly Lys Glu Glu Asp Thr Arg Ile Asn Asn
660 665 670
Leu Val Ser Leu Leu Asp Ser Tyr Phe Lys Glu Gly Gly His His Ile
675 680 685
Asn Ile Asn Val Phe Glu Arg Glu Met Leu Leu Asp Ala Met Asp His
690 695 700
Pro Glu Lys Tyr Pro Gln Leu Thr Ile Arg Val Ser Gly Tyr Ala Val
705 710 715 720
Asn Phe Ile Lys Leu Thr Arg Glu Gln Gln Leu Asp Val Ile Asn Arg
725 730 735
Thr Ile His Glu Asn Ile
740
<210> 69
<211> 2283
<212> DNA
<213> 大肠杆菌
<400> 69
atgtccgagc ttaatgaaaa gttagccaca gcctgggaag gttttaccaa aggtgactgg 60
cagaatgaag taaacgtccg tgacttcatt cagaaaaact acactccgta cgagggtgac 120
gagtccttcc tggctggcgc tactgaagcg accaccaccc tgtgggacaa agtaatggaa 180
ggcgttaaac tggaaaaccg cactcacgcg ccagttgact ttgacaccgc tgttgcttcc 240
accatcacct ctcacgacgc tggctacatc aacaagcagc ttgagaaaat cgttggtctg 300
cagactgaag ctccgctgaa acgtgctctt atcccgttcg gtggtatcaa aatgatcgaa 360
ggttcctgca aagcgtacaa ccgcgaactg gatccgatga tcaaaaaaat cttcactgaa 420
taccgtaaaa ctcacaacca gggcgtgttc gacgtttaca ctccggacat cctgcgttgc 480
cgtaaatctg gtgttctgac cggtctgcca gatgcatatg gccgtggccg tatcatcggt 540
gactaccgtc gcgttgcgct gtacggtatc gactacctga tgaaagacaa actggcacag 600
ttcacttctc tgcaggctga tctggaaaac ggcgtaaacc tggaacagac tatccgtctg 660
cgcgaagaaa tcgctgaaca gcaccgcgct ctgggtcaga tgaaagaaat ggctgcgaaa 720
tacggctacg acatctctgg tccggctacc aacgctcagg aagctatcca gtggacttac 780
ttcggctacc tggctgctgt taagtctcag aacggtgctg caatgtcctt cggtcgtacc 840
tccaccttcc tggatgtgta catcgaacgt gacctgaaag ctggcaagat caccgaacaa 900
gaagcgcagg aaatggttga ccacctggtc atgaaactgc gtatggttcg cttcctgcgt 960
actccggaat acgatgaact gttctctggc gacccgatct gggcaaccga atctatcggt 1020
ggtatgggcc tcgacggtcg taccctggtt accaaaaaca gcttccgttt cctgaacacc 1080
ctgtacacca tgggtccgtc tccggaaccg aacatgacca ttctgtggtc tgaaaaactg 1140
ccgctgaact tcaagaaatt cgccgctaaa gtgtccatcg acacctcttc tctgcagtat 1200
gagaacgatg acctgatgcg tccggacttc aacaacgatg actacgctat tgcttgctgc 1260
gtaagcccga tgatcgttgg taaacaaatg cagttcttcg gtgcgcgtgc aaacctggcg 1320
aaaaccatgc tgtacgcaat caacggcggc gttgacgaaa aactgaaaat gcaggttggt 1380
ccgaagtctg aaccgatcaa aggcgatgtc ctgaactatg atgaagtgat ggagcgcatg 1440
gatcacttca tggactggct ggctaaacag tacatcactg cactgaacat catccactac 1500
atgcacgaca agtacagcta cgaagcctct ctgatggcgc tgcacgaccg tgacgttatc 1560
cgcaccatgg cgtgtggtat cgctggtctg tccgttgctg ctgactccct gtctgcaatc 1620
aaatatgcga aagttaaacc gattcgtgac gaagacggtc tggctatcga cttcgaaatc 1680
gaaggcgaat acccgcagtt tggtaacaat gatccgcgtg tagatgacct ggctgttgac 1740
ctggtagaac gtttcatgaa gaaaattcag aaactgcaca cctaccgtga cgctatcccg 1800
actcagtctg ttctgaccat cacttctaac gttgtgtatg gtaagaaaac gggtaacacc 1860
ccagacggtc gtcgtgctgg cgcgccgttc ggaccgggtg ctaacccgat gcacggtcgt 1920
gaccagaaag gtgcagtagc ctctctgact tccgttgcta aactgccgtt tgcttacgct 1980
aaagatggta tctcctacac cttctctatc gttccgaacg cactgggtaa agacgacgaa 2040
gttcgtaaga ccaacctggc tggtctgatg gatggttact tccaccacga agcatccatc 2100
gaaggtggtc agcacctgaa cgttaacgtg atgaaccgtg aaatgctgct cgacgcgatg 2160
gaaaacccgg aaaaatatcc gcagctgacc atccgtgtat ctggctacgc agtacgtttc 2220
aactcgctga ctaaagaaca gcagcaggac gttattactc gtaccttcac tcaatctatg 2280
taa 2283
<210> 70
<211> 760
<212> PRT
<213> 大肠杆菌
<400> 70
Met Ser Glu Leu Asn Glu Lys Leu Ala Thr Ala Trp Glu Gly Phe Thr
1 5 10 15
Lys Gly Asp Trp Gln Asn Glu Val Asn Val Arg Asp Phe Ile Gln Lys
20 25 30
Asn Tyr Thr Pro Tyr Glu Gly Asp Glu Ser Phe Leu Ala Gly Ala Thr
35 40 45
Glu Ala Thr Thr Thr Leu Trp Asp Lys Val Met Glu Gly Val Lys Leu
50 55 60
Glu Asn Arg Thr His Ala Pro Val Asp Phe Asp Thr Ala Val Ala Ser
65 70 75 80
Thr Ile Thr Ser His Asp Ala Gly Tyr Ile Asn Lys Gln Leu Glu Lys
85 90 95
Ile Val Gly Leu Gln Thr Glu Ala Pro Leu Lys Arg Ala Leu Ile Pro
100 105 110
Phe Gly Gly Ile Lys Met Ile Glu Gly Ser Cys Lys Ala Tyr Asn Arg
115 120 125
Glu Leu Asp Pro Met Ile Lys Lys Ile Phe Thr Glu Tyr Arg Lys Thr
130 135 140
His Asn Gln Gly Val Phe Asp Val Tyr Thr Pro Asp Ile Leu Arg Cys
145 150 155 160
Arg Lys Ser Gly Val Leu Thr Gly Leu Pro Asp Ala Tyr Gly Arg Gly
165 170 175
Arg Ile Ile Gly Asp Tyr Arg Arg Val Ala Leu Tyr Gly Ile Asp Tyr
180 185 190
Leu Met Lys Asp Lys Leu Ala Gln Phe Thr Ser Leu Gln Ala Asp Leu
195 200 205
Glu Asn Gly Val Asn Leu Glu Gln Thr Ile Arg Leu Arg Glu Glu Ile
210 215 220
Ala Glu Gln His Arg Ala Leu Gly Gln Met Lys Glu Met Ala Ala Lys
225 230 235 240
Tyr Gly Tyr Asp Ile Ser Gly Pro Ala Thr Asn Ala Gln Glu Ala Ile
245 250 255
Gln Trp Thr Tyr Phe Gly Tyr Leu Ala Ala Val Lys Ser Gln Asn Gly
260 265 270
Ala Ala Met Ser Phe Gly Arg Thr Ser Thr Phe Leu Asp Val Tyr Ile
275 280 285
Glu Arg Asp Leu Lys Ala Gly Lys Ile Thr Glu Gln Glu Ala Gln Glu
290 295 300
Met Val Asp His Leu Val Met Lys Leu Arg Met Val Arg Phe Leu Arg
305 310 315 320
Thr Pro Glu Tyr Asp Glu Leu Phe Ser Gly Asp Pro Ile Trp Ala Thr
325 330 335
Glu Ser Ile Gly Gly Met Gly Leu Asp Gly Arg Thr Leu Val Thr Lys
340 345 350
Asn Ser Phe Arg Phe Leu Asn Thr Leu Tyr Thr Met Gly Pro Ser Pro
355 360 365
Glu Pro Asn Met Thr Ile Leu Trp Ser Glu Lys Leu Pro Leu Asn Phe
370 375 380
Lys Lys Phe Ala Ala Lys Val Ser Ile Asp Thr Ser Ser Leu Gln Tyr
385 390 395 400
Glu Asn Asp Asp Leu Met Arg Pro Asp Phe Asn Asn Asp Asp Tyr Ala
405 410 415
Ile Ala Cys Cys Val Ser Pro Met Ile Val Gly Lys Gln Met Gln Phe
420 425 430
Phe Gly Ala Arg Ala Asn Leu Ala Lys Thr Met Leu Tyr Ala Ile Asn
435 440 445
Gly Gly Val Asp Glu Lys Leu Lys Met Gln Val Gly Pro Lys Ser Glu
450 455 460
Pro Ile Lys Gly Asp Val Leu Asn Tyr Asp Glu Val Met Glu Arg Met
465 470 475 480
Asp His Phe Met Asp Trp Leu Ala Lys Gln Tyr Ile Thr Ala Leu Asn
485 490 495
Ile Ile His Tyr Met His Asp Lys Tyr Ser Tyr Glu Ala Ser Leu Met
500 505 510
Ala Leu His Asp Arg Asp Val Ile Arg Thr Met Ala Cys Gly Ile Ala
515 520 525
Gly Leu Ser Val Ala Ala Asp Ser Leu Ser Ala Ile Lys Tyr Ala Lys
530 535 540
Val Lys Pro Ile Arg Asp Glu Asp Gly Leu Ala Ile Asp Phe Glu Ile
545 550 555 560
Glu Gly Glu Tyr Pro Gln Phe Gly Asn Asn Asp Pro Arg Val Asp Asp
565 570 575
Leu Ala Val Asp Leu Val Glu Arg Phe Met Lys Lys Ile Gln Lys Leu
580 585 590
His Thr Tyr Arg Asp Ala Ile Pro Thr Gln Ser Val Leu Thr Ile Thr
595 600 605
Ser Asn Val Val Tyr Gly Lys Lys Thr Gly Asn Thr Pro Asp Gly Arg
610 615 620
Arg Ala Gly Ala Pro Phe Gly Pro Gly Ala Asn Pro Met His Gly Arg
625 630 635 640
Asp Gln Lys Gly Ala Val Ala Ser Leu Thr Ser Val Ala Lys Leu Pro
645 650 655
Phe Ala Tyr Ala Lys Asp Gly Ile Ser Tyr Thr Phe Ser Ile Val Pro
660 665 670
Asn Ala Leu Gly Lys Asp Asp Glu Val Arg Lys Thr Asn Leu Ala Gly
675 680 685
Leu Met Asp Gly Tyr Phe His His Glu Ala Ser Ile Glu Gly Gly Gln
690 695 700
His Leu Asn Val Asn Val Met Asn Arg Glu Met Leu Leu Asp Ala Met
705 710 715 720
Glu Asn Pro Glu Lys Tyr Pro Gln Leu Thr Ile Arg Val Ser Gly Tyr
725 730 735
Ala Val Arg Phe Asn Ser Leu Thr Lys Glu Gln Gln Gln Asp Val Ile
740 745 750
Thr Arg Thr Phe Thr Gln Ser Met
755 760
<210> 71
<211> 594
<212> DNA
<213> 莱茵衣藻
<220>
<221> 杂项特征
<223> PflA1
<400> 71
atgttgaagg ctgcgttgcc acgaattatg aacgctgcta gcatgtcttg tgcagctact 60
gggctgcagc gctccggtcc gctggcgatg aacgctgcga ctacatcgcg aacggggccc 120
gcttcagggc ttccgaaaca ttcctggggt gccagtgctc gacgagcatt tgttgcacct 180
gccactatct cggaacggct gcagccgaag ctctcgacga attactcggt ggttctgccg 240
caatacgagc ccacggatcc ctcgggcatc cctgaggttt tcggaaacgt gcattcaaca 300
gaaagcatga gcgcggtgga cggccctggc gtacggtggt ccgcaactac ctcaagccac 360
gcggcggcat caccatcagc ggcggcgagg ccatgctgca gccacacttt gtgtccaccg 420
tgttccaggt tccagggcat tgagctgctg ccgtaccacg tgttgggccg caacaagtgg 480
gaggtcatgg ggctgccgta ccccctggac ggcacgaaca cgccgccgca cgagcaggta 540
cgggccgtga tcaaggtgtt caacgacaac gacgttcccg tcatctgcgc cgag 594
<210> 72
<211> 198
<212> PRT
<213> 莱茵衣藻
<220>
<221> 杂项特征
<223> PflA1
<400> 72
Met Leu Lys Ala Ala Leu Pro Arg Ile Met Asn Ala Ala Ser Met Ser
1 5 10 15
Cys Ala Ala Thr Gly Leu Gln Arg Ser Gly Pro Leu Ala Met Asn Ala
20 25 30
Ala Thr Thr Ser Arg Thr Gly Pro Ala Ser Gly Leu Pro Lys His Ser
35 40 45
Trp Gly Ala Ser Ala Arg Arg Ala Phe Val Ala Pro Ala Thr Ile Ser
50 55 60
Glu Arg Leu Gln Pro Lys Leu Ser Thr Asn Tyr Ser Val Val Leu Pro
65 70 75 80
Gln Tyr Glu Pro Thr Asp Pro Ser Gly Ile Pro Glu Val Phe Gly Asn
85 90 95
Val His Ser Thr Glu Ser Met Ser Ala Val Asp Gly Pro Gly Val Arg
100 105 110
Trp Ser Ala Thr Thr Ser Ser His Ala Ala Ala Ser Pro Ser Ala Ala
115 120 125
Ala Arg Pro Cys Cys Ser His Thr Leu Cys Pro Pro Cys Ser Arg Phe
130 135 140
Gln Gly Ile Glu Leu Leu Pro Tyr His Val Leu Gly Arg Asn Lys Trp
145 150 155 160
Glu Val Met Gly Leu Pro Tyr Pro Leu Asp Gly Thr Asn Thr Pro Pro
165 170 175
His Glu Gln Val Arg Ala Val Ile Lys Val Phe Asn Asp Asn Asp Val
180 185 190
Pro Val Ile Cys Ala Glu
195
<210> 73
<211> 801
<212> DNA
<213> 新丽鞭毛菌
<400> 73
atgccagcta tcgttgatcc aactactatg gattatatgg aagtcaaggg caatgtccat 60
tcaactgaaa gtttggcttg tcttgaaggt ccaggaaaca gattcctttt atttttaaat 120
ggttgtgctg ctcgttgctt atactgtagt aatccagata cttgggatga aactgttggt 180
actccaatga ccgttggcca acttattaag aagattggaa atcttaaaaa ctactatatc 240
aattctgttg gtggtggtgg tgtcactgtt tctggtggtg aaccattaac tcaatttggt 300
ttcttatctt gtttcttata tgctgtcaag aagcacttaa atcttcatac ctgtgttgaa 360
accactggtc aaggttgtac taaggcttgg aattcagttt tacctcatac tgacttatgc 420
ttagtatgta ttaaacatgc tattccagaa aaatacgaac aaattactcg tactaagaaa 480
ttagatagat gtcttaagtt ccttaaggaa ttagaaaaga gaaacattcc atggtggtgt 540
cgttacgttg ttcttccagg ttacactgat tctaaggaag atattgaagc tttaattgaa 600
ttagttaaga acagtccaac ttgtgaaaga attgaattcc ttccataccc cgaattaggt 660
aaaaacaaat gggaagaatt aggtattgaa tatccattaa agaatattaa acaacttaag 720
aaaagtgaaa ttaaatggat ctgtgatatg gtccgtgaag ctttcaagga ccgtaatatt 780
ccagttactg gtgatactta a 801
<210> 74
<211> 266
<212> PRT
<213> 新丽鞭毛菌
<400> 74
Met Pro Ala Ile Val Asp Pro Thr Thr Met Asp Tyr Met Glu Val Lys
1 5 10 15
Gly Asn Val His Ser Thr Glu Ser Leu Ala Cys Leu Glu Gly Pro Gly
20 25 30
Asn Arg Phe Leu Leu Phe Leu Asn Gly Cys Ala Ala Arg Cys Leu Tyr
35 40 45
Cys Ser Asn Pro Asp Thr Trp Asp Glu Thr Val Gly Thr Pro Met Thr
50 55 60
Val Gly Gln Leu Ile Lys Lys Ile Gly Asn Leu Lys Asn Tyr Tyr Ile
65 70 75 80
Asn Ser Val Gly Gly Gly Gly Val Thr Val Ser Gly Gly Glu Pro Leu
85 90 95
Thr Gln Phe Gly Phe Leu Ser Cys Phe Leu Tyr Ala Val Lys Lys His
100 105 110
Leu Asn Leu His Thr Cys Val Glu Thr Thr Gly Gln Gly Cys Thr Lys
115 120 125
Ala Trp Asn Ser Val Leu Pro His Thr Asp Leu Cys Leu Val Cys Ile
130 135 140
Lys His Ala Ile Pro Glu Lys Tyr Glu Gln Ile Thr Arg Thr Lys Lys
145 150 155 160
Leu Asp Arg Cys Leu Lys Phe Leu Lys Glu Leu Glu Lys Arg Asn Ile
165 170 175
Pro Trp Trp Cys Arg Tyr Val Val Leu Pro Gly Tyr Thr Asp Ser Lys
180 185 190
Glu Asp Ile Glu Ala Leu Ile Glu Leu Val Lys Asn Ser Pro Thr Cys
195 200 205
Glu Arg Ile Glu Phe Leu Pro Tyr Pro Glu Leu Gly Lys Asn Lys Trp
210 215 220
Glu Glu Leu Gly Ile Glu Tyr Pro Leu Lys Asn Ile Lys Gln Leu Lys
225 230 235 240
Lys Ser Glu Ile Lys Trp Ile Cys Asp Met Val Arg Glu Ala Phe Lys
245 250 255
Asp Arg Asn Ile Pro Val Thr Gly Asp Thr
260 265
<210> 75
<211> 2496
<212> DNA
<213> 莱茵衣藻
<220>
<221> 杂项特征
<223> PflA
<400> 75
atgttaacac ccttaagcta tcctatcatc aacaccgtct cgtcaagtct gccagcgctt 60
cacgccatga gccagatgct gctggagaag acaatgcgcc ggggcctcgc cacggtctcg 120
gccgcagcga gctccgctgt tggccggccc atccccatgg ctgttaggtc gccgatgcgc 180
tcgatggccg ctgccagcgc ggccgctgag gccctcccgg tggcacccag ccacagctgc 240
gctgctgacc ccgacaagca cccgcacctg cccgaccccc gcccgaagcc ggccgtggac 300
gcgggcatca acgtccagaa gtatgtgcag gacaactaca ccgcttacgc cggcaactcg 360
tccttcctgg ctggccccac tgacaacacc aagaagctgt ggagcgagct ggagaagatg 420
attgccaccg agatcgagaa gggcgtgatg gacgtggatc cctccaagcc ctccaccatc 480
accgccttcc cgcccggcta catcgacaag gacctggaga cggtggtggg gctgcagacc 540
gacgcgccgc tcaagcgcgc catcaagccc ctgggcggcg tcaacatggt caaggcggcg 600
ctggagtcgt acggctacac ccccgacccc gaggtggccc gcctgtacag cacggtgcgc 660
aagacgcaca acagcggcgt gtttgacgcc tacacggacg agatgcgcgc cgcgcgcaag 720
agcggcatcc tgtccggcct gcccgacggc tacggccgcg gccgcatcat cggcgactac 780
cgccgcgtgg cgctgtacgg cgtggacgcg ctgatcaagg ccaagaagac cgacctgaag 840
cacaacctgc tgggcgtgat ggacgaggag aagatccgcc tgcgcgagga ggtgaacgag 900
cagatccgcg cgctcagcga gctcaaggag atgggcgccg cctacggctt cgacctgagc 960
cgccccgccg ccaactcgcg cgaggcggtg cagtggctgt acttcggcta cctgggcgcc 1020
gtcaaggagc aggacggcgc cgccatgagc ctgggccgca tcgacgcctt cctggacacc 1080
tactttgagc gcgacctcaa ggccggcacc atcactgagg ccgaggtgca ggagctgatc 1140
gaccacttcg tcatgaagct gcgcatcgtg cgccagctgc gcacgcccga gtacaacgcg 1200
ctgtttgccg gcgaccccac ctgggtcacc tgcgtgctgg gcggcactga cgccagcggc 1260
aaggccatgg tcaccaagac cagcttccgc ctgctcaaca ccctgtacaa cctgggcccc 1320
gcgcccgagc ccaacctgac ggtgctgtgg aacgacaacc tgcccgcgcc cttcaaggag 1380
ttctgcgcca aggtgtcgct ggacaccagc tccatccagt acgagtccga caacctcatg 1440
agcaagctgt ttggctccga ctactccatc gcctgctgcg tgtcggccat gcgcgtgggc 1500
aaggacatgc agtactttgg cgcccgcgcc aacctgccca agctgctgct gtacacgctc 1560
aacggcggcc gcgacgaggt gtcgggcgac caggtggggc ccaagttcgc gccggtgcgc 1620
agccccaccg cgccgttgga ctatgaggag gtcaaggcca agatcgagga cggcatggag 1680
tggctggcct ccatgtacgc gaacaccatg aacatcatcc actacatgca cgacaagtac 1740
gactacgagc ggctgcagat ggcgctgcac gacacgcacg tgcgccgcct gctggcgttc 1800
ggcatcagcg gcctgtccgt ggtgaccgac tcgctgtcgg ccatcaagta cgcccaggtg 1860
acgcccgtga ttgacgagcg cggcctcatg acggacttca aggtggaggg cagcttcccc 1920
aagtacggca acgacgatga ccgcgtggac gagatcgccg agtgggtggt gtccaccttc 1980
tccagcaagc tggccaagca gcacacctac cgcaactcgg tgcccacgct gtcggtgctg 2040
accatcacct ccaacgtggt gtacggcaag aagacgggct ccacccccga cggccgcaag 2100
aagggcgagc ccttcgcgcc cggcgccaac ccgctgcacg gccgcgacgc ccacggcgct 2160
ctggcctcgc tcaactcggt ggccaagctg ccctacacca tgtgcctgga cggcatctcc 2220
aacaccttct cgctcatccc ccaggtgctg ggcaggggcg gcgagcacga gcgcgccacc 2280
aacctggcct ccatcctgga cggctacttt gccaacggcg gccaccacat caacgtcaac 2340
gtgctcaacc gctccatgct catggacgcc gtggagcacc ccgagaagta ccccaacctc 2400
accatccgcg tgtccgggta cgctgtgcac ttcgcgcgcc tcacgcgcga gcagcagctg 2460
gaggtgatcg cgcgcacctt ccacgacacc atgtaa 2496
<210> 76
<211> 831
<212> PRT
<213> 莱茵衣藻
<220>
<221> 杂项特征
<223> PflA
<400> 76
Met Leu Thr Pro Leu Ser Tyr Pro Ile Ile Asn Thr Val Ser Ser Ser
1 5 10 15
Leu Pro Ala Leu His Ala Met Ser Gln Met Leu Leu Glu Lys Thr Met
20 25 30
Arg Arg Gly Leu Ala Thr Val Ser Ala Ala Ala Ser Ser Ala Val Gly
35 40 45
Arg Pro Ile Pro Met Ala Val Arg Ser Pro Met Arg Ser Met Ala Ala
50 55 60
Ala Ser Ala Ala Ala Glu Ala Leu Pro Val Ala Pro Ser His Ser Cys
65 70 75 80
Ala Ala Asp Pro Asp Lys His Pro His Leu Pro Asp Pro Arg Pro Lys
85 90 95
Pro Ala Val Asp Ala Gly Ile Asn Val Gln Lys Tyr Val Gln Asp Asn
100 105 110
Tyr Thr Ala Tyr Ala Gly Asn Ser Ser Phe Leu Ala Gly Pro Thr Asp
115 120 125
Asn Thr Lys Lys Leu Trp Ser Glu Leu Glu Lys Met Ile Ala Thr Glu
130 135 140
Ile Glu Lys Gly Val Met Asp Val Asp Pro Ser Lys Pro Ser Thr Ile
145 150 155 160
Thr Ala Phe Pro Pro Gly Tyr Ile Asp Lys Asp Leu Glu Thr Val Val
165 170 175
Gly Leu Gln Thr Asp Ala Pro Leu Lys Arg Ala Ile Lys Pro Leu Gly
180 185 190
Gly Val Asn Met Val Lys Ala Ala Leu Glu Ser Tyr Gly Tyr Thr Pro
195 200 205
Asp Pro Glu Val Ala Arg Leu Tyr Ser Thr Val Arg Lys Thr His Asn
210 215 220
Ser Gly Val Phe Asp Ala Tyr Thr Asp Glu Met Arg Ala Ala Arg Lys
225 230 235 240
Ser Gly Ile Leu Ser Gly Leu Pro Asp Gly Tyr Gly Arg Gly Arg Ile
245 250 255
Ile Gly Asp Tyr Arg Arg Val Ala Leu Tyr Gly Val Asp Ala Leu Ile
260 265 270
Lys Ala Lys Lys Thr Asp Leu Lys His Asn Leu Leu Gly Val Met Asp
275 280 285
Glu Glu Lys Ile Arg Leu Arg Glu Glu Val Asn Glu Gln Ile Arg Ala
290 295 300
Leu Ser Glu Leu Lys Glu Met Gly Ala Ala Tyr Gly Phe Asp Leu Ser
305 310 315 320
Arg Pro Ala Ala Asn Ser Arg Glu Ala Val Gln Trp Leu Tyr Phe Gly
325 330 335
Tyr Leu Gly Ala Val Lys Glu Gln Asp Gly Ala Ala Met Ser Leu Gly
340 345 350
Arg Ile Asp Ala Phe Leu Asp Thr Tyr Phe Glu Arg Asp Leu Lys Ala
355 360 365
Gly Thr Ile Thr Glu Ala Glu Val Gln Glu Leu Ile Asp His Phe Val
370 375 380
Met Lys Leu Arg Ile Val Arg Gln Leu Arg Thr Pro Glu Tyr Asn Ala
385 390 395 400
Leu Phe Ala Gly Asp Pro Thr Trp Val Thr Cys Val Leu Gly Gly Thr
405 410 415
Asp Ala Ser Gly Lys Ala Met Val Thr Lys Thr Ser Phe Arg Leu Leu
420 425 430
Asn Thr Leu Tyr Asn Leu Gly Pro Ala Pro Glu Pro Asn Leu Thr Val
435 440 445
Leu Trp Asn Asp Asn Leu Pro Ala Pro Phe Lys Glu Phe Cys Ala Lys
450 455 460
Val Ser Leu Asp Thr Ser Ser Ile Gln Tyr Glu Ser Asp Asn Leu Met
465 470 475 480
Ser Lys Leu Phe Gly Ser Asp Tyr Ser Ile Ala Cys Cys Val Ser Ala
485 490 495
Met Arg Val Gly Lys Asp Met Gln Tyr Phe Gly Ala Arg Ala Asn Leu
500 505 510
Pro Lys Leu Leu Leu Tyr Thr Leu Asn Gly Gly Arg Asp Glu Val Ser
515 520 525
Gly Asp Gln Val Gly Pro Lys Phe Ala Pro Val Arg Ser Pro Thr Ala
530 535 540
Pro Leu Asp Tyr Glu Glu Val Lys Ala Lys Ile Glu Asp Gly Met Glu
545 550 555 560
Trp Leu Ala Ser Met Tyr Ala Asn Thr Met Asn Ile Ile His Tyr Met
565 570 575
His Asp Lys Tyr Asp Tyr Glu Arg Leu Gln Met Ala Leu His Asp Thr
580 585 590
His Val Arg Arg Leu Leu Ala Phe Gly Ile Ser Gly Leu Ser Val Val
595 600 605
Thr Asp Ser Leu Ser Ala Ile Lys Tyr Ala Gln Val Thr Pro Val Ile
610 615 620
Asp Glu Arg Gly Leu Met Thr Asp Phe Lys Val Glu Gly Ser Phe Pro
625 630 635 640
Lys Tyr Gly Asn Asp Asp Asp Arg Val Asp Glu Ile Ala Glu Trp Val
645 650 655
Val Ser Thr Phe Ser Ser Lys Leu Ala Lys Gln His Thr Tyr Arg Asn
660 665 670
Ser Val Pro Thr Leu Ser Val Leu Thr Ile Thr Ser Asn Val Val Tyr
675 680 685
Gly Lys Lys Thr Gly Ser Thr Pro Asp Gly Arg Lys Lys Gly Glu Pro
690 695 700
Phe Ala Pro Gly Ala Asn Pro Leu His Gly Arg Asp Ala His Gly Ala
705 710 715 720
Leu Ala Ser Leu Asn Ser Val Ala Lys Leu Pro Tyr Thr Met Cys Leu
725 730 735
Asp Gly Ile Ser Asn Thr Phe Ser Leu Ile Pro Gln Val Leu Gly Arg
740 745 750
Gly Gly Glu His Glu Arg Ala Thr Asn Leu Ala Ser Ile Leu Asp Gly
755 760 765
Tyr Phe Ala Asn Gly Gly His His Ile Asn Val Asn Val Leu Asn Arg
770 775 780
Ser Met Leu Met Asp Ala Val Glu His Pro Glu Lys Tyr Pro Asn Leu
785 790 795 800
Thr Ile Arg Val Ser Gly Tyr Ala Val His Phe Ala Arg Leu Thr Arg
805 810 815
Glu Gln Gln Leu Glu Val Ile Ala Arg Thr Phe His Asp Thr Met
820 825 830
<210> 77
<211> 2418
<212> DNA
<213> 单鞭毛菌属E2
<400> 77
atggaaagct tagctttatc caatgtcagt gttcttgcta acactgtttc tgttaacgct 60
gttgctgcca ccaaggtcgc tggtgtcaga atggccaagc catcccgcgc tcttcacacc 120
ccagctatga agactactct taagacttct aagaaggtcc cagctatgca agctaagacc 180
tacgccactc aagctccatg catcaccaac gatgctgctg ccaagagtga aatcgatgtt 240
gaaggttgga ttaagaagca ctacacccca tacgaaggtg atggttcttt ccttgctggt 300
ccaactgaaa agaccaagaa gcttttcgcc aaggctgaag aatacttagc taaggaacgt 360
gccaacggtg gtttatacga tgttgaccca cacactccat ccaccatcac ttcccacaag 420
ccaggttacc ttgacaaaga taacgaagtt atctacggtt accaaactga tgttccactt 480
aagagagcca ttaagccatt cggtggtgtt aacatggtta agaacgctct taaggctgtt 540
aacgttccaa tggacaagga agtcgaacac attttcactg actaccgtaa gactcacaac 600
actgctgtct tcgatcttta ctccaaggaa atgagatctg gtcgttccaa cgctatcatg 660
accggtttac cagatggtta cggtcgtggt cgtattattg gtgattaccg tcgtgttgcc 720
ctttacggta ctgaccgtct tatcgcccaa aagaacaagg ataaggccga actccaaaag 780
agacaaatgg acgaaccaac catgaagctc attggtgaag ttgctgatca agttaaggct 840
cttaagcaac ttactcaaat ggccaagtcc tacggtattg atatctctaa gccagctaag 900
aacgccagag aagctactca atttgtttac tttggttact taggttctat caaggaacaa 960
gatggtgctg ccatgtctct tggtcgtgtt gatgccttcc ttgattgttt ctttgaaaac 1020
gatttaaaga acggtgttat cactgaagct gaagctcaag aaatcattga taaccttatc 1080
cttaagttac gtttcgctcg tcacttacgt accccagaat acaacgactt attcgctggt 1140
gatccaacct gggttactat gtctcttggt ggtatgggat ctgatggtcg taccttagtt 1200
actaagactt ccttccgtgt ccttaacact ctctacaact taggtccagc tccagaacca 1260
aacattactg tcctctggaa caaggctctt ccaaagaact tcaaggactt cgccactaag 1320
gtttctattg atacctcttc catccaatac gaatccgatg ctcttatgtc tgccagattc 1380
ggtgatgact acggtattgc ttgctgtgtc tctgccatga gaattggtaa ggatatgcaa 1440
ttcttcggtg ctcgttgtaa ccttgccaag cttatgcttt acgtccttaa ccacggtaag 1500
gatgaaagaa ctggtaagca agtcggtcca gactttggtc cagttccaga aggtccaatt 1560
ccattcgact ggatgtggga aacctatgac aaggctatgg actggattgc caagctctac 1620
gttaacacca tgaacgttat ccacttctgt cacgaccaat actgttacga atcccttcaa 1680
atggctcttc acgataccga tgtccgtcgt cttatggcct tcggtgttgc tggtctttcc 1740
gttgttgctg attccttctc tgctattaag tacgctaagg ttaccccagt ccgtgatgcc 1800
aagactggtt taactgttga cttcaagatt gaaggtgaat tcccaaaatt cggtaatgat 1860
gatgaccgtg ttgatttctt cgccagaact gttactgaca agcttatcaa caagctcaga 1920
aagaccccaa cctaccgtgg tgctactcac actctttcta ttcttaccat tacctctaac 1980
gtcgtttacg gtaagaagac tggttctact ccagatggtc gtaaggctgg tcaaccattc 2040
gctccaggtt gtaacccaat gcacggtcgt gaattctctg gtgccgttgc ttctctttct 2100
tctgtcgcta aggttaacta cgactcttgt atggatggta tctctaacac cttctctatt 2160
gttccaaaca ctattggtaa gtccttacaa gaacgtcaag gtaacctttc cggtttatta 2220
gatggttact tcaccaaggg tgcccaccac cttaacgtta acgttcttaa gcgtgaaacc 2280
ttagaagacg ccatggccca cccagaaaac tatccaaacc ttactattcg tgtctctggt 2340
tacgctgtca actttgttaa gttaactcca caacaacaaa aggaagttat tgcccgtacc 2400
ttccacgaaa agatgtaa 2418
<210> 78
<211> 805
<212> PRT
<213> 单鞭毛菌属E2
<400> 78
Met Glu Ser Leu Ala Leu Ser Asn Val Ser Val Leu Ala Asn Thr Val
1 5 10 15
Ser Val Asn Ala Val Ala Ala Thr Lys Val Ala Gly Val Arg Met Ala
20 25 30
Lys Pro Ser Arg Ala Leu His Thr Pro Ala Met Lys Thr Thr Leu Lys
35 40 45
Thr Ser Lys Lys Val Pro Ala Met Gln Ala Lys Thr Tyr Ala Thr Gln
50 55 60
Ala Pro Cys Ile Thr Asn Asp Ala Ala Ala Lys Ser Glu Ile Asp Val
65 70 75 80
Glu Gly Trp Ile Lys Lys His Tyr Thr Pro Tyr Glu Gly Asp Gly Ser
85 90 95
Phe Leu Ala Gly Pro Thr Glu Lys Thr Lys Lys Leu Phe Ala Lys Ala
100 105 110
Glu Glu Tyr Leu Ala Lys Glu Arg Ala Asn Gly Gly Leu Tyr Asp Val
115 120 125
Asp Pro His Thr Pro Ser Thr Ile Thr Ser His Lys Pro Gly Tyr Leu
130 135 140
Asp Lys Asp Asn Glu Val Ile Tyr Gly Tyr Gln Thr Asp Val Pro Leu
145 150 155 160
Lys Arg Ala Ile Lys Pro Phe Gly Gly Val Asn Met Val Lys Asn Ala
165 170 175
Leu Lys Ala Val Asn Val Pro Met Asp Lys Glu Val Glu His Ile Phe
180 185 190
Thr Asp Tyr Arg Lys Thr His Asn Thr Ala Val Phe Asp Leu Tyr Ser
195 200 205
Lys Glu Met Arg Ser Gly Arg Ser Asn Ala Ile Met Thr Gly Leu Pro
210 215 220
Asp Gly Tyr Gly Arg Gly Arg Ile Ile Gly Asp Tyr Arg Arg Val Ala
225 230 235 240
Leu Tyr Gly Thr Asp Arg Leu Ile Ala Gln Lys Asn Lys Asp Lys Ala
245 250 255
Glu Leu Gln Lys Arg Gln Met Asp Glu Pro Thr Met Lys Leu Ile Gly
260 265 270
Glu Val Ala Asp Gln Val Lys Ala Leu Lys Gln Leu Thr Gln Met Ala
275 280 285
Lys Ser Tyr Gly Ile Asp Ile Ser Lys Pro Ala Lys Asn Ala Arg Glu
290 295 300
Ala Thr Gln Phe Val Tyr Phe Gly Tyr Leu Gly Ser Ile Lys Glu Gln
305 310 315 320
Asp Gly Ala Ala Met Ser Leu Gly Arg Val Asp Ala Phe Leu Asp Cys
325 330 335
Phe Phe Glu Asn Asp Leu Lys Asn Gly Val Ile Thr Glu Ala Glu Ala
340 345 350
Gln Glu Ile Ile Asp Asn Leu Ile Leu Lys Leu Arg Phe Ala Arg His
355 360 365
Leu Arg Thr Pro Glu Tyr Asn Asp Leu Phe Ala Gly Asp Pro Thr Trp
370 375 380
Val Thr Met Ser Leu Gly Gly Met Gly Ser Asp Gly Arg Thr Leu Val
385 390 395 400
Thr Lys Thr Ser Phe Arg Val Leu Asn Thr Leu Tyr Asn Leu Gly Pro
405 410 415
Ala Pro Glu Pro Asn Ile Thr Val Leu Trp Asn Lys Ala Leu Pro Lys
420 425 430
Asn Phe Lys Asp Phe Ala Thr Lys Val Ser Ile Asp Thr Ser Ser Ile
435 440 445
Gln Tyr Glu Ser Asp Ala Leu Met Ser Ala Arg Phe Gly Asp Asp Tyr
450 455 460
Gly Ile Ala Cys Cys Val Ser Ala Met Arg Ile Gly Lys Asp Met Gln
465 470 475 480
Phe Phe Gly Ala Arg Cys Asn Leu Ala Lys Leu Met Leu Tyr Val Leu
485 490 495
Asn His Gly Lys Asp Glu Arg Thr Gly Lys Gln Val Gly Pro Asp Phe
500 505 510
Gly Pro Val Pro Glu Gly Pro Ile Pro Phe Asp Trp Met Trp Glu Thr
515 520 525
Tyr Asp Lys Ala Met Asp Trp Ile Ala Lys Leu Tyr Val Asn Thr Met
530 535 540
Asn Val Ile His Phe Cys His Asp Gln Tyr Cys Tyr Glu Ser Leu Gln
545 550 555 560
Met Ala Leu His Asp Thr Asp Val Arg Arg Leu Met Ala Phe Gly Val
565 570 575
Ala Gly Leu Ser Val Val Ala Asp Ser Phe Ser Ala Ile Lys Tyr Ala
580 585 590
Lys Val Thr Pro Val Arg Asp Ala Lys Thr Gly Leu Thr Val Asp Phe
595 600 605
Lys Ile Glu Gly Glu Phe Pro Lys Phe Gly Asn Asp Asp Asp Arg Val
610 615 620
Asp Phe Phe Ala Arg Thr Val Thr Asp Lys Leu Ile Asn Lys Leu Arg
625 630 635 640
Lys Thr Pro Thr Tyr Arg Gly Ala Thr His Thr Leu Ser Ile Leu Thr
645 650 655
Ile Thr Ser Asn Val Val Tyr Gly Lys Lys Thr Gly Ser Thr Pro Asp
660 665 670
Gly Arg Lys Ala Gly Gln Pro Phe Ala Pro Gly Cys Asn Pro Met His
675 680 685
Gly Arg Glu Phe Ser Gly Ala Val Ala Ser Leu Ser Ser Val Ala Lys
690 695 700
Val Asn Tyr Asp Ser Cys Met Asp Gly Ile Ser Asn Thr Phe Ser Ile
705 710 715 720
Val Pro Asn Thr Ile Gly Lys Ser Leu Gln Glu Arg Gln Gly Asn Leu
725 730 735
Ser Gly Leu Leu Asp Gly Tyr Phe Thr Lys Gly Ala His His Leu Asn
740 745 750
Val Asn Val Leu Lys Arg Glu Thr Leu Glu Asp Ala Met Ala His Pro
755 760 765
Glu Asn Tyr Pro Asn Leu Thr Ile Arg Val Ser Gly Tyr Ala Val Asn
770 775 780
Phe Val Lys Leu Thr Pro Gln Gln Gln Lys Glu Val Ile Ala Arg Thr
785 790 795 800
Phe His Glu Lys Met
805
<210> 79
<211> 2414
<212> DNA
<213> 新丽鞭毛菌
<400> 79
gcttagcttt atccaacgtc agtgttcttg ctaacactgt ttctattaac gctgttgctg 60
ccaccaaggt cgctggtgtc agaatggcta aaccaactcg tgctcttcac actccagcta 120
tgaagactac tcttaaggct tccaagaagg ctgctgttcc agtcatgcaa gccaagacct 180
acgctactgc tccagttatc actaacgatg ctgctgccaa gagcgaaatc gatgtcgaag 240
gttggattaa gaagcactat actccatacg aaggtgatgg ttctttcctt gctggtccaa 300
ctgaaaagac taagaagctt ttcgccaagg ctgaagaata cttagccaag gaacgtgcta 360
acggtggttt atacgatgtt gacccacaca ctccatctac tattacctcc cacaagccag 420
gttaccttga caaagaaaac gaagttattt acggttacca aactgatgtt cctcttaaga 480
gagccatcaa gccattcggt ggtgttaaca tggttaagaa cgctcttaag gctgttaatg 540
ttccaatgga caaggaagtc gaacacattt tctctgacta ccgtaagact cacaacactg 600
ctgtcttcga tatctactct aaggaaatga gagctggtcg ttccaacgct atcatgactg 660
gtttaccaga tggttacggt cgtggtcgta ttattggtga ttaccgtcgt gttgcccttt 720
acggtactga ccgtcttatc gcccaaaagg aaaaagataa ggctgaactc caaaagaagc 780
aaatggacga accaaccatg aaattaattg gtgaagttgc tgaccaagtt aaggctctta 840
agcaacttac tcaaatggct aagtcctacg gtattgatat taccaagcca gccaagaacg 900
ccagagaagc tactcaattt gtttacttcg gttacttagg ttctatcaag gaacaagatg 960
gtgctgccat gtctcttggt cgtgttgatg ctttcttaga ttgtttcttt gaaaacgatt 1020
taaagaatgg tgttatcact gaatctgaag ctcaagaaat cattgataac cttatcttaa 1080
agttacgttt cgctcgtcac ttacgtactc cagaatacaa cgacttattc gctggtgatc 1140
caacctgggt tactatgtct cttggtggta tgggtagtga tggtcgtacc ttagttacta 1200
agacttcctt ccgtgttctt aacactcttt acaacttagg tccagctcca gaaccaaaca 1260
tcactgtcct ctggaacaag aaccttccaa agaacttcaa ggacttcgct actaaggttt 1320
ctattgatac ctcttccatt caatacgaat ctgatgccct tatgtccgct agattcggtg 1380
atgattacgg aattgcctgc tgtgtttctg ccatgagaat tggtaaggat atgcaattct 1440
tcggtgctcg ttgtaacctt gctaagctta tgctttacgt ccttaaccat ggtaaggatg 1500
aaagaactgg taagcaagtt ggtccagact tcggtccagt tccagaaggt ccaattccat 1560
tcgactggat gtgggaaact tatgacaagg ctatggattg gattgccaag ctttacgtta 1620
acaccatgaa cgttattcac ttctgtcacg accaatactg ttacgaatct cttcaaatgg 1680
ctcttcacga taccgatgtc cgtcgtctta tggccttcgg tgttgctggt ctttctgttg 1740
ttgctgattc cttctctgct attaagtacg ctaaggttac tccaatccgt gatccaaaga 1800
ccggtttaac tgttgacttc aaggttgaag gtgaattccc aaaattcggt aacgatgatg 1860
accgtgttga cttcttcgcc agaactgtta ctgacaagct tattaacaag ttaagaaaga 1920
ctccaaccta ccgtggtgct acccacactc tttctattct taccattacc tctaacgtcg 1980
tttacggtaa gaagaccggt tctactccag atggtcgtaa ggctggtcaa ccattcgccc 2040
caggttgtaa cccaatgcac ggtcgtgaat tctctggtgc cgttgcttct ctttcttccg 2100
ttgctaaggt taactacgat tcttgtatgg atggtatctc taacaccttc tctattgttc 2160
caaacactat cggtaagact ttacaagaac gtcaaggtaa cctttctggt ttattagatg 2220
gttacttcag caagggtgct caccatctta acgttaacgt tcttaagcgt gaaactttag 2280
aagatgccat ggctcaccca gaaaactatc caaaccttac tatccgtgtt tctggttatg 2340
ctgtcaactt cgttaagtta actccagccc aacaaaagga agttattgcc cgtaccttcc 2400
acgaaaagat gtaa 2414
<210> 80
<211> 803
<212> PRT
<213> 新丽鞭毛菌
<400> 80
Leu Ala Leu Ser Asn Val Ser Val Leu Ala Asn Thr Val Ser Ile Asn
1 5 10 15
Ala Val Ala Ala Thr Lys Val Ala Gly Val Arg Met Ala Lys Pro Thr
20 25 30
Arg Ala Leu His Thr Pro Ala Met Lys Thr Thr Leu Lys Ala Ser Lys
35 40 45
Lys Ala Ala Val Pro Val Met Gln Ala Lys Thr Tyr Ala Thr Ala Pro
50 55 60
Val Ile Thr Asn Asp Ala Ala Ala Lys Ser Glu Ile Asp Val Glu Gly
65 70 75 80
Trp Ile Lys Lys His Tyr Thr Pro Tyr Glu Gly Asp Gly Ser Phe Leu
85 90 95
Ala Gly Pro Thr Glu Lys Thr Lys Lys Leu Phe Ala Lys Ala Glu Glu
100 105 110
Tyr Leu Ala Lys Glu Arg Ala Asn Gly Gly Leu Tyr Asp Val Asp Pro
115 120 125
His Thr Pro Ser Thr Ile Thr Ser His Lys Pro Gly Tyr Leu Asp Lys
130 135 140
Glu Asn Glu Val Ile Tyr Gly Tyr Gln Thr Asp Val Pro Leu Lys Arg
145 150 155 160
Ala Ile Lys Pro Phe Gly Gly Val Asn Met Val Lys Asn Ala Leu Lys
165 170 175
Ala Val Asn Val Pro Met Asp Lys Glu Val Glu His Ile Phe Ser Asp
180 185 190
Tyr Arg Lys Thr His Asn Thr Ala Val Phe Asp Ile Tyr Ser Lys Glu
195 200 205
Met Arg Ala Gly Arg Ser Asn Ala Ile Met Thr Gly Leu Pro Asp Gly
210 215 220
Tyr Gly Arg Gly Arg Ile Ile Gly Asp Tyr Arg Arg Val Ala Leu Tyr
225 230 235 240
Gly Thr Asp Arg Leu Ile Ala Gln Lys Glu Lys Asp Lys Ala Glu Leu
245 250 255
Gln Lys Lys Gln Met Asp Glu Pro Thr Met Lys Leu Ile Gly Glu Val
260 265 270
Ala Asp Gln Val Lys Ala Leu Lys Gln Leu Thr Gln Met Ala Lys Ser
275 280 285
Tyr Gly Ile Asp Ile Thr Lys Pro Ala Lys Asn Ala Arg Glu Ala Thr
290 295 300
Gln Phe Val Tyr Phe Gly Tyr Leu Gly Ser Ile Lys Glu Gln Asp Gly
305 310 315 320
Ala Ala Met Ser Leu Gly Arg Val Asp Ala Phe Leu Asp Cys Phe Phe
325 330 335
Glu Asn Asp Leu Lys Asn Gly Val Ile Thr Glu Ser Glu Ala Gln Glu
340 345 350
Ile Ile Asp Asn Leu Ile Leu Lys Leu Arg Phe Ala Arg His Leu Arg
355 360 365
Thr Pro Glu Tyr Asn Asp Leu Phe Ala Gly Asp Pro Thr Trp Val Thr
370 375 380
Met Ser Leu Gly Gly Met Gly Ser Asp Gly Arg Thr Leu Val Thr Lys
385 390 395 400
Thr Ser Phe Arg Val Leu Asn Thr Leu Tyr Asn Leu Gly Pro Ala Pro
405 410 415
Glu Pro Asn Ile Thr Val Leu Trp Asn Lys Asn Leu Pro Lys Asn Phe
420 425 430
Lys Asp Phe Ala Thr Lys Val Ser Ile Asp Thr Ser Ser Ile Gln Tyr
435 440 445
Glu Ser Asp Ala Leu Met Ser Ala Arg Phe Gly Asp Asp Tyr Gly Ile
450 455 460
Ala Cys Cys Val Ser Ala Met Arg Ile Gly Lys Asp Met Gln Phe Phe
465 470 475 480
Gly Ala Arg Cys Asn Leu Ala Lys Leu Met Leu Tyr Val Leu Asn His
485 490 495
Gly Lys Asp Glu Arg Thr Gly Lys Gln Val Gly Pro Asp Phe Gly Pro
500 505 510
Val Pro Glu Gly Pro Ile Pro Phe Asp Trp Met Trp Glu Thr Tyr Asp
515 520 525
Lys Ala Met Asp Trp Ile Ala Lys Leu Tyr Val Asn Thr Met Asn Val
530 535 540
Ile His Phe Cys His Asp Gln Tyr Cys Tyr Glu Ser Leu Gln Met Ala
545 550 555 560
Leu His Asp Thr Asp Val Arg Arg Leu Met Ala Phe Gly Val Ala Gly
565 570 575
Leu Ser Val Val Ala Asp Ser Phe Ser Ala Ile Lys Tyr Ala Lys Val
580 585 590
Thr Pro Ile Arg Asp Pro Lys Thr Gly Leu Thr Val Asp Phe Lys Val
595 600 605
Glu Gly Glu Phe Pro Lys Phe Gly Asn Asp Asp Asp Arg Val Asp Phe
610 615 620
Phe Ala Arg Thr Val Thr Asp Lys Leu Ile Asn Lys Leu Arg Lys Thr
625 630 635 640
Pro Thr Tyr Arg Gly Ala Thr His Thr Leu Ser Ile Leu Thr Ile Thr
645 650 655
Ser Asn Val Val Tyr Gly Lys Lys Thr Gly Ser Thr Pro Asp Gly Arg
660 665 670
Lys Ala Gly Gln Pro Phe Ala Pro Gly Cys Asn Pro Met His Gly Arg
675 680 685
Glu Phe Ser Gly Ala Val Ala Ser Leu Ser Ser Val Ala Lys Val Asn
690 695 700
Tyr Asp Ser Cys Met Asp Gly Ile Ser Asn Thr Phe Ser Ile Val Pro
705 710 715 720
Asn Thr Ile Gly Lys Thr Leu Gln Glu Arg Gln Gly Asn Leu Ser Gly
725 730 735
Leu Leu Asp Gly Tyr Phe Ser Lys Gly Ala His His Leu Asn Val Asn
740 745 750
Val Leu Lys Arg Glu Thr Leu Glu Asp Ala Met Ala His Pro Glu Asn
755 760 765
Tyr Pro Asn Leu Thr Ile Arg Val Ser Gly Tyr Ala Val Asn Phe Val
770 775 780
Lys Leu Thr Pro Ala Gln Gln Lys Glu Val Ile Ala Arg Thr Phe His
785 790 795 800
Glu Lys Met
<210> 81
<211> 2619
<212> DNA
<213> Clostridium phytofermentans
<400> 81
atgacgaaaa aagtggaatt acagacaact ggattagtag actctctcga agcattaaca 60
gcaaaattta gagagttaaa agaagcacaa gagctctttg ctacctacac tcaagagcaa 120
gtagataaaa tcttctttgc tgctgccatg gctgccaatc agcaacgtat tccgttagca 180
aagatggctg tagaagaaac gggtatgggt attgtagaag ataaagtaat taagaatcat 240
tatgctgcag agtatattta caatgcatac aaagatacaa aaacatgtgg agtggttgaa 300
gaagatccta gcttcggtat caaaaaaatt gcagagccaa tcggcgtagt tgcagctgta 360
atcccaacta ccaatcctac ctccactgct atctttaaaa cattactttg tttaaagact 420
cgtaacgcaa tcatcatcag cccacatcct cgtgctaaga actgtaccat cgcagctgct 480
aaggtagttt tagatgctgc agttgctgca ggtgctcctg ctggtataat tggatggatt 540
gatgttccat cacttgaatt aaccaatgaa gttatgaaaa atgcagacat catccttgca 600
actggtggac ctggtatggt aaaggctgct tattcttctg gtaaaccagc acttggtgtt 660
ggcgcaggta atacccctgt tattatggat gaaagctgcg atgttcgcct tgcagtaagc 720
tctattattc actctaagac atttgataac ggtatgattt gtgcttccga gcaatccgta 780
attattagtg ataagattta tgaagctgct aagaaagaat tcaaggatcg tggttgccac 840
atctgctccc cagaagagac tcagaagctt cgtgaaacaa tcctaattaa tggtgctctt 900
aacgctaaaa ttgttggaca aagcgctcat acgattgcaa agcttgcagg atttgatgta 960
gcagaagctg ctaagatttt aattggtgaa gtagaatccg ttgaactaga agaacaattt 1020
gcacacgaga aactttctcc agttcttgct atgtacaaat caaaatcctt tgatgatgca 1080
gtaagcaaag ctgctcgtct tgttgcagat ggcggttatg gccatacttc ttccatctat 1140
attaatgtag gtaccggaca agaaaagatt gcaaagtttt ctgatgctat gaagacttgc 1200
cgtattcttg taaatacacc atcctcccat ggtggtatcg gtgaccttta taactttaaa 1260
ttagctccat ctcttactct tggttgtggc tcctggggcg gtaactctgt atcagaaaac 1320
gtaggagtaa agcacttaat caacattaag acagttgctg agaggagaga aaacatgctt 1380
tggtttagag cacctgagaa agtatacttt aagaagggtt gtttaccagt agccctcgca 1440
gaattaaaag atgtaatgaa taaaaagaaa gtattcattg taaccgatgc tttcctttat 1500
aaaaatggct atacaaaatg tgttactgat cagttagatg ctatgggaat tcagcatact 1560
acttactatg atgttgctcc agatccatct ttagctagtg ctacagaagg tgcagaagcg 1620
atgagactct tcgagccaga ctgtattatc gcactcggtg gtggttctgc aatggatgcc 1680
ggaaagatta tgtgggttat gtatgaacac cctgaagtaa acttccttga ccttgcaatg 1740
cgtttcatgg atattagaaa gcgtgtttac tccttcccta agatgggcga aaaagcttac 1800
tttatcgcag ttccaacttc ctccggtact ggttctgaag ttacaccatt tgctgttatt 1860
accgatgaga gaactggcgt aaaatatcca cttgcagatt acgaattact tcctaagatg 1920
gctattattg atgccgatat gatgatgaat caacctaagg gattaacttc tgcttccggt 1980
attgatgccc ttacccatgc attagaggca tatgcttcta tcatggctac tgactatacg 2040
gatggtttag cattaaaagc tatgaagaat atcttcgctt accttccaag cgcatatgaa 2100
aatggtgccg ctgatccggt tgcaagagaa aagatggcag atgcttctac cttagctggt 2160
atggcattcg caaatgcatt cttaggaatt tgccactcca tggctcataa attaggtgca 2220
ttccaccact taccacacgg tgtagcaaac gcactcttaa tcaacgaagt aatgcgcttt 2280
aactccgtta gcattcctac aaagatgggt actttctctc aataccaata cccacatgcg 2340
ttagatcgtt atgtagaatg tgcgaacttc ttaggtattg ccggaaagaa cgacaatgag 2400
aaattcgaaa accttcttaa ggcaattgat gaattaaaag aaaaagttgg tatcaagaaa 2460
tccatcaaag aatatggcgt agacgagaaa tatttcttag atactttaga tgctatggtt 2520
gaacaggctt tcgatgatca gtgtactggt gctaacccaa gatatccatt aatgaaggaa 2580
atcaaggaaa tctatcttaa agtgtactac ggtaaataa 2619
<210> 82
<211> 872
<212> PRT
<213> Clostridium phytofermentans
<400> 82
Met Thr Lys Lys Val Glu Leu Gln Thr Thr Gly Leu Val Asp Ser Leu
1 5 10 15
Glu Ala Leu Thr Ala Lys Phe Arg Glu Leu Lys Glu Ala Gln Glu Leu
20 25 30
Phe Ala Thr Tyr Thr Gln Glu Gln Val Asp Lys Ile Phe Phe Ala Ala
35 40 45
Ala Met Ala Ala Asn Gln Gln Arg Ile Pro Leu Ala Lys Met Ala Val
50 55 60
Glu Glu Thr Gly Met Gly Ile Val Glu Asp Lys Val Ile Lys Asn His
65 70 75 80
Tyr Ala Ala Glu Tyr Ile Tyr Asn Ala Tyr Lys Asp Thr Lys Thr Cys
85 90 95
Gly Val Val Glu Glu Asp Pro Ser Phe Gly Ile Lys Lys Ile Ala Glu
100 105 110
Pro Ile Gly Val Val Ala Ala Val Ile Pro Thr Thr Asn Pro Thr Ser
115 120 125
Thr Ala Ile Phe Lys Thr Leu Leu Cys Leu Lys Thr Arg Asn Ala Ile
130 135 140
Ile Ile Ser Pro His Pro Arg Ala Lys Asn Cys Thr Ile Ala Ala Ala
145 150 155 160
Lys Val Val Leu Asp Ala Ala Val Ala Ala Gly Ala Pro Ala Gly Ile
165 170 175
Ile Gly Trp Ile Asp Val Pro Ser Leu Glu Leu Thr Asn Glu Val Met
180 185 190
Lys Asn Ala Asp Ile Ile Leu Ala Thr Gly Gly Pro Gly Met Val Lys
195 200 205
Ala Ala Tyr Ser Ser Gly Lys Pro Ala Leu Gly Val Gly Ala Gly Asn
210 215 220
Thr Pro Val Ile Met Asp Glu Ser Cys Asp Val Arg Leu Ala Val Ser
225 230 235 240
Ser Ile Ile His Ser Lys Thr Phe Asp Asn Gly Met Ile Cys Ala Ser
245 250 255
Glu Gln Ser Val Ile Ile Ser Asp Lys Ile Tyr Glu Ala Ala Lys Lys
260 265 270
Glu Phe Lys Asp Arg Gly Cys His Ile Cys Ser Pro Glu Glu Thr Gln
275 280 285
Lys Leu Arg Glu Thr Ile Leu Ile Asn Gly Ala Leu Asn Ala Lys Ile
290 295 300
Val Gly Gln Ser Ala His Thr Ile Ala Lys Leu Ala Gly Phe Asp Val
305 310 315 320
Ala Glu Ala Ala Lys Ile Leu Ile Gly Glu Val Glu Ser Val Glu Leu
325 330 335
Glu Glu Gln Phe Ala His Glu Lys Leu Ser Pro Val Leu Ala Met Tyr
340 345 350
Lys Ser Lys Ser Phe Asp Asp Ala Val Ser Lys Ala Ala Arg Leu Val
355 360 365
Ala Asp Gly Gly Tyr Gly His Thr Ser Ser Ile Tyr Ile Asn Val Gly
370 375 380
Thr Gly Gln Glu Lys Ile Ala Lys Phe Ser Asp Ala Met Lys Thr Cys
385 390 395 400
Arg Ile Leu Val Asn Thr Pro Ser Ser His Gly Gly Ile Gly Asp Leu
405 410 415
Tyr Asn Phe Lys Leu Ala Pro Ser Leu Thr Leu Gly Cys Gly Ser Trp
420 425 430
Gly Gly Asn Ser Val Ser Glu Asn Val Gly Val Lys His Leu Ile Asn
435 440 445
Ile Lys Thr Val Ala Glu Arg Arg Glu Asn Met Leu Trp Phe Arg Ala
450 455 460
Pro Glu Lys Val Tyr Phe Lys Lys Gly Cys Leu Pro Val Ala Leu Ala
465 470 475 480
Glu Leu Lys Asp Val Met Asn Lys Lys Lys Val Phe Ile Val Thr Asp
485 490 495
Ala Phe Leu Tyr Lys Asn Gly Tyr Thr Lys Cys Val Thr Asp Gln Leu
500 505 510
Asp Ala Met Gly Ile Gln His Thr Thr Tyr Tyr Asp Val Ala Pro Asp
515 520 525
Pro Ser Leu Ala Ser Ala Thr Glu Gly Ala Glu Ala Met Arg Leu Phe
530 535 540
Glu Pro Asp Cys Ile Ile Ala Leu Gly Gly Gly Ser Ala Met Asp Ala
545 550 555 560
Gly Lys Ile Met Trp Val Met Tyr Glu His Pro Glu Val Asn Phe Leu
565 570 575
Asp Leu Ala Met Arg Phe Met Asp Ile Arg Lys Arg Val Tyr Ser Phe
580 585 590
Pro Lys Met Gly Glu Lys Ala Tyr Phe Ile Ala Val Pro Thr Ser Ser
595 600 605
Gly Thr Gly Ser Glu Val Thr Pro Phe Ala Val Ile Thr Asp Glu Arg
610 615 620
Thr Gly Val Lys Tyr Pro Leu Ala Asp Tyr Glu Leu Leu Pro Lys Met
625 630 635 640
Ala Ile Ile Asp Ala Asp Met Met Met Asn Gln Pro Lys Gly Leu Thr
645 650 655
Ser Ala Ser Gly Ile Asp Ala Leu Thr His Ala Leu Glu Ala Tyr Ala
660 665 670
Ser Ile Met Ala Thr Asp Tyr Thr Asp Gly Leu Ala Leu Lys Ala Met
675 680 685
Lys Asn Ile Phe Ala Tyr Leu Pro Ser Ala Tyr Glu Asn Gly Ala Ala
690 695 700
Asp Pro Val Ala Arg Glu Lys Met Ala Asp Ala Ser Thr Leu Ala Gly
705 710 715 720
Met Ala Phe Ala Asn Ala Phe Leu Gly Ile Cys His Ser Met Ala His
725 730 735
Lys Leu Gly Ala Phe His His Leu Pro His Gly Val Ala Asn Ala Leu
740 745 750
Leu Ile Asn Glu Val Met Arg Phe Asn Ser Val Ser Ile Pro Thr Lys
755 760 765
Met Gly Thr Phe Ser Gln Tyr Gln Tyr Pro His Ala Leu Asp Arg Tyr
770 775 780
Val Glu Cys Ala Asn Phe Leu Gly Ile Ala Gly Lys Asn Asp Asn Glu
785 790 795 800
Lys Phe Glu Asn Leu Leu Lys Ala Ile Asp Glu Leu Lys Glu Lys Val
805 810 815
Gly Ile Lys Lys Ser Ile Lys Glu Tyr Gly Val Asp Glu Lys Tyr Phe
820 825 830
Leu Asp Thr Leu Asp Ala Met Val Glu Gln Ala Phe Asp Asp Gln Cys
835 840 845
Thr Gly Ala Asn Pro Arg Tyr Pro Leu Met Lys Glu Ile Lys Glu Ile
850 855 860
Tyr Leu Lys Val Tyr Tyr Gly Lys
865 870
<210> 83
<211> 2676
<212> DNA
<213> 大肠杆菌
<400> 83
atggctgtta ctaatgtcgc tgaacttaac gcactcgtag agcgtgtaaa aaaagcccag 60
cgtgaatatg ccagtttcac tcaagagcaa gtagacaaaa tcttccgcgc cgccgctctg 120
gctgctgcag atgctcgaat cccactcgcg aaaatggccg ttgccgaatc cggcatgggt 180
atcgtcgaag ataaagtgat caaaaaccac tttgcttctg aatatatcta caacgcctat 240
aaagatgaaa aaacctgtgg tgttctgtct gaagacgaca cttttggtac catcactatc 300
gctgaaccaa tcggtattat ttgcggtatc gttccgacca ctaacccgac ttcaactgct 360
atcttcaaat cgctgatcag tctgaagacc cgtaacgcca ttatcttctc cccgcacccg 420
cgtgcaaaag atgccaccaa caaagcggct gatatcgttc tgcaggctgc tatcgctgcc 480
ggtgctccga aagatctgat cggctggatc gatcaacctt ctgttgaact gtctaacgca 540
ctgatgcacc acccagacat caacctgatc ctcgcgactg gtggtccggg catggttaaa 600
gccgcataca gctccggtaa accagctatc ggtgtaggcg cgggcaacac tccagttgtt 660
atcgatgaaa ctgctgatat caaacgtgca gttgcatctg tactgatgtc caaaaccttc 720
gacaacggcg taatctgtgc ttctgaacag tctgttgttg ttgttgactc tgtttatgac 780
gctgtacgtg aacgttttgc aacccacggc ggctatctgt tgcagggtaa agagctgaaa 840
gctgttcagg atgttatcct gaaaaacggt gcgctgaacg cggctatcgt tggtcagcca 900
gcctataaaa ttgctgaact ggcaggcttc tctgtaccag aaaacaccaa gattctgatc 960
ggtgaagtga ccgttgttga tgaaagcgaa ccgttcgcac atgaaaaact gtccccgact 1020
ctggcaatgt accgcgctaa agatttcgaa gacgcggtag aaaaagcaga gaaactggtt 1080
gctatgggcg gtatcggtca tacctcttgc ctgtacactg accaggataa ccaaccggct 1140
cgcgtttctt acttcggtca gaaaatgaaa acggcgcgta tcctgattaa caccccagcg 1200
tctcagggtg gtatcggtga cctgtataac ttcaaactcg caccttccct gactctgggt 1260
tgtggttctt ggggtggtaa ctccatctct gaaaacgttg gtccgaaaca cctgatcaac 1320
aagaaaaccg ttgctaagcg agctgaaaac atgttgtggc acaaacttcc gaaatctatc 1380
tacttccgcc gtggctccct gccaatcgcg ctggatgaag tgattactga tggccacaaa 1440
cgtgcgctca tcgtgactga ccgcttcctg ttcaacaatg gttatgctga tcagatcact 1500
tccgtactga aagcagcagg cgttgaaact gaagtcttct tcgaagtaga agcggacccg 1560
accctgagca tcgttcgtaa aggtgcagaa ctggcaaact ccttcaaacc agacgtgatt 1620
atcgcgctgg gtggtggttc cccgatggac gccgcgaaga tcatgtgggt tatgtacgaa 1680
catccggaaa ctcacttcga agagctggcg ctgcgcttta tggatatccg taaacgtatc 1740
tacaagttcc cgaaaatggg cgtgaaagcg aaaatgatcg ctgtcaccac cacttctggt 1800
acaggttctg aagtcactcc gtttgcggtt gtaactgacg acgctactgg tcagaaatat 1860
ccgctggcag actatgcgct gactccggat atggcgattg tcgacgccaa cctggttatg 1920
gacatgccga agtccctgtg tgctttcggt ggtctggacg cagtaactca cgccatggaa 1980
gcttatgttt ctgtactggc atctgagttc tctgatggtc aggctctgca ggcactgaaa 2040
ctgctgaaag aatatctgcc agcgtcctac cacgaagggt ctaaaaatcc ggtagcgcgt 2100
gaacgtgttc acagtgcagc gactatcgcg ggtatcgcgt ttgcgaacgc cttcctgggt 2160
gtatgtcact caatggcgca caaactgggt tcccagttcc atattccgca cggtctggca 2220
aacgccctgc tgatttgtaa cgttattcgc tacaatgcga acgacaaccc gaccaagcag 2280
actgcattca gccagtatga ccgtccgcag gctcgccgtc gttatgctga aattgccgac 2340
cacttgggtc tgagcgcacc gggcgaccgt actgctgcta agatcgagaa actgctggca 2400
tggctggaaa cgctgaaagc tgaactgggt attccgaaat ctatccgtga agctggcgtt 2460
caggaagcag acttcctggc gaacgtggat aaactgtctg aagatgcatt cgatgaccag 2520
tgcaccggcg ctaacccgcg ttacccgctg atctccgagc tgaaacagat tctgctggat 2580
acctactacg gtcgtgatta tgtagaaggt gaaactgcag cgaagaaaga agctgctccg 2640
gctaaagctg agaaaaaagc gaaaaaatcc gcttaa 2676
<210> 84
<211> 891
<212> PRT
<213> 大肠杆菌
<400> 84
Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val
1 5 10 15
Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp
20 25 30
Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro
35 40 45
Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp
50 55 60
Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr
65 70 75 80
Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly
85 90 95
Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu
115 120 125
Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp
130 135 140
Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala
145 150 155 160
Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu
165 170 175
Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala
180 185 190
Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro
195 200 205
Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr
210 215 220
Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe
225 230 235 240
Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp
245 250 255
Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr
260 265 270
Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys
275 280 285
Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile
290 295 300
Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile
305 310 315 320
Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys
325 330 335
Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala
340 345 350
Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr
355 360 365
Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr
370 375 380
Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala
385 390 395 400
Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser
405 410 415
Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn
420 425 430
Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala
435 440 445
Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg
450 455 460
Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys
465 470 475 480
Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala
485 490 495
Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val
500 505 510
Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly
515 520 525
Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly
530 535 540
Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu
545 550 555 560
His Pro Glu Thr His Phe Glu Glu Leu Ala Leu Arg Phe Met Asp Ile
565 570 575
Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met
580 585 590
Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe
595 600 605
Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp
610 615 620
Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met
625 630 635 640
Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr
645 650 655
His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp
660 665 670
Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala
675 680 685
Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His
690 695 700
Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly
705 710 715 720
Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro
725 730 735
His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn
740 745 750
Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg
755 760 765
Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu
770 775 780
Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala
785 790 795 800
Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg
805 810 815
Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu
820 825 830
Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr
835 840 845
Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly
850 855 860
Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro
865 870 875 880
Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala
885 890
<210> 85
<211> 2865
<212> DNA
<213> 莱茵衣藻
<220>
<221> 杂项特征
<223> AdhE
<400> 85
atgatgtcct ccagcctcgt ctctggcaag agggttgccg tgccctctgc tgccaagccc 60
tgtgctgctg tgccgctgcc ccgcgtggcc ggtcgccgga ctgctgcacg cgttgtctgc 120
gaggctgctc cctctggcgc cgcccctgcc agccccaagg ctgaggctgc tgcgcccgtt 180
gccgctgccc cggccacccc ccatgctgag gtgaagaagg agcgcgcccc agccaccgat 240
gaggcgctga cggagctgaa ggcgctgctg aagcgcgccc agaccgccca ggcgcagtac 300
tccacctaca cccaggagca ggtggacgag atcttccgcg ccgccgccga ggccgccaac 360
gccgcccgta tccccctggc caagatggcc gtggaggaga cccgcatggg cgtggctgag 420
gacaaggtgg tgaagaacca cttcgcctcc gagttcatct acaacaagta caagcacact 480
aagacctgcg gcgtcatcga gcacgacccc gccggcggca tccagaaggt ggctgagccc 540
gtgggcgtca ttgccggtat cgtgcccacc accaacccca cctccaccgc catcttcaag 600
tcgctgctgt cgctcaagac ccgcaacgcg ctggtgctgt gcccgcaccc ccgcgccgcc 660
aagagcacca tcgccgccgc gcgcatcgtg cgtgacgccg ccgtggccgc cggcgcgccg 720
cccaacatca tcagctgggt ggagacgccc tcgctgccgg tgtcccaggc gctgatgcag 780
gcgactgaga tcaacctcat cctggccacc ggtggcccgg ccatggtgcg cgccgcctac 840
tcgtccggca acccgtcgct gggtgtgggc gccggcaaca ccccggccct gattgacgag 900
actgccgacg tggccatggc cgtgtcctcc atcctgctgt ccaagacctt tgacaacggc 960
gtcatctgcg cctcggagca gtcggtggtg gtggtggcca aggcctacga cgccgtgcgc 1020
accgagttcg tgcgccgcgg ggcctacttc ctgaccgagg acgacaaggt caaggtccgc 1080
gccggtgtgg ttgtggacgg caagctgaac cccaacattg tgggccagtc catccccaag 1140
ctggcggccc tgttcggcat caaggtgccc cagggcacca aggtgctcat cggcgaggtg 1200
gagaagatcg gccccgagga ggcgctgtcg caggagaagc tgtgccccat cctggccatg 1260
taccgggcgc ccgactacga ccacggcgtc aagatggcct gcgagctcat catgtacggc 1320
ggcgccggcc acacctcggt gctgtacacc aacccgctca acaacgccca catccagcag 1380
taccagagcg cggtcaagac cgtgcgcatc ctcatcaaca cccccgcctc gcagggcgcc 1440
attggtgacc tgtacaactt ccacctggac ccctccctca ccctgggctg cggcacctgg 1500
ggctccacct cggtgtccac caacgtgggc ccgcagcacc tgctgaacat caagaccgtc 1560
accgcgcgcc gcgagaacat gctgtggttc cgcgtgccgc ccaagatcta cttcaagggc 1620
ggctgcctgg aggtggcgct gaccgatctg cgtggcaaat cgcgcgcttt cattgtcacg 1680
gacaagccgc tttttgacat gggatacgcc gacaaggtca cccacatcct ggacagcatt 1740
aacgtgcacc accaggtgtt ctaccacgtg acccccgacc cgaccctggc ctgcattgag 1800
gcgggtctga aggagatcct ggagttcaag cccgatgtca tcatcgcgct gggtggtggc 1860
tcgcccatgg acgccgccaa gatcatgtgg ctgatgtacg agtgccccga cacccgcttc 1920
gacggcctgg ccatgcgctt catggacatc cgcaagcgcg tgtacgaggt gccggagctg 1980
ggcaagaagg ccaccatggt gtgcatcccc accaccagtg gcaccggctc ggaggtgacg 2040
cccttctcgg tggtcaccga cgagcgcctg ggcgccaagt accccctggc cgattacgcc 2100
ctgaccccca gcatggccat tgtggacccc cagctggtgc tcaacatgcc caagaagctg 2160
accgcctggg gcggcattga cgcgctcacg cacgcgctgg agagctacgt gtccatctgc 2220
gccaccgact acaccaaggg tctgtcgcgc gaggccatca gcctgctgtt caagtacctg 2280
ccccgcgcct acgccaacgg ctccaacgac tacctggcgc gtgagaaggt gcactacgcc 2340
gccacgattg ccggcatggc cttcgccaac gccttcctgg gcatctgcca ctccatggcg 2400
cacaagctgg gcgccgccta ccacgtgcct cacggcctgg ccaacgccgc gctgatcagc 2460
cacgtcatcc gctacaacgc caccgacatg cccgccaagc aggccgcctt cccgcagtac 2520
gagtacccca ccgccaagca ggactacgcc gacctggcca acatgctggg cctgggcggc 2580
aacacggtgg acgagaaggt gatcaagctg attgaggcgg tggaggagct caaggccaag 2640
gtggacatcc cgcccaccat caaggagatc ttcaacgacc ccaaggtgga cgccgacttc 2700
ctggcgaacg tggacgccct ggccgaggac gccttcgacg accagtgcac gggcgccaac 2760
ccgcgctacc cgctcatggc cgacctgaag cagctctacc tggacgccca cgccgcgccc 2820
atcctgcccg tcaagaccct ggagttcttc tccaagatca actaa 2865
<210> 86
<211> 954
<212> PRT
<213> 莱茵衣藻
<220>
<221> 杂项特征
<223> AdhE
<400> 86
Met Met Ser Ser Ser Leu Val Ser Gly Lys Arg Val Ala Val Pro Ser
1 5 10 15
Ala Ala Lys Pro Cys Ala Ala Val Pro Leu Pro Arg Val Ala Gly Arg
20 25 30
Arg Thr Ala Ala Arg Val Val Cys Glu Ala Ala Pro Ser Gly Ala Ala
35 40 45
Pro Ala Ser Pro Lys Ala Glu Ala Ala Ala Pro Val Ala Ala Ala Pro
50 55 60
Ala Thr Pro His Ala Glu Val Lys Lys Glu Arg Ala Pro Ala Thr Asp
65 70 75 80
Glu Ala Leu Thr Glu Leu Lys Ala Leu Leu Lys Arg Ala Gln Thr Ala
85 90 95
Gln Ala Gln Tyr Ser Thr Tyr Thr Gln Glu Gln Val Asp Glu Ile Phe
100 105 110
Arg Ala Ala Ala Glu Ala Ala Asn Ala Ala Arg Ile Pro Leu Ala Lys
115 120 125
Met Ala Val Glu Glu Thr Arg Met Gly Val Ala Glu Asp Lys Val Val
130 135 140
Lys Asn His Phe Ala Ser Glu Phe Ile Tyr Asn Lys Tyr Lys His Thr
145 150 155 160
Lys Thr Cys Gly Val Ile Glu His Asp Pro Ala Gly Gly Ile Gln Lys
165 170 175
Val Ala Glu Pro Val Gly Val Ile Ala Gly Ile Val Pro Thr Thr Asn
180 185 190
Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Leu Ser Leu Lys Thr Arg
195 200 205
Asn Ala Leu Val Leu Cys Pro His Pro Arg Ala Ala Lys Ser Thr Ile
210 215 220
Ala Ala Ala Arg Ile Val Arg Asp Ala Ala Val Ala Ala Gly Ala Pro
225 230 235 240
Pro Asn Ile Ile Ser Trp Val Glu Thr Pro Ser Leu Pro Val Ser Gln
245 250 255
Ala Leu Met Gln Ala Thr Glu Ile Asn Leu Ile Leu Ala Thr Gly Gly
260 265 270
Pro Ala Met Val Arg Ala Ala Tyr Ser Ser Gly Asn Pro Ser Leu Gly
275 280 285
Val Gly Ala Gly Asn Thr Pro Ala Leu Ile Asp Glu Thr Ala Asp Val
290 295 300
Ala Met Ala Val Ser Ser Ile Leu Leu Ser Lys Thr Phe Asp Asn Gly
305 310 315 320
Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Ala Lys Ala Tyr
325 330 335
Asp Ala Val Arg Thr Glu Phe Val Arg Arg Gly Ala Tyr Phe Leu Thr
340 345 350
Glu Asp Asp Lys Val Lys Val Arg Ala Gly Val Val Val Asp Gly Lys
355 360 365
Leu Asn Pro Asn Ile Val Gly Gln Ser Ile Pro Lys Leu Ala Ala Leu
370 375 380
Phe Gly Ile Lys Val Pro Gln Gly Thr Lys Val Leu Ile Gly Glu Val
385 390 395 400
Glu Lys Ile Gly Pro Glu Glu Ala Leu Ser Gln Glu Lys Leu Cys Pro
405 410 415
Ile Leu Ala Met Tyr Arg Ala Pro Asp Tyr Asp His Gly Val Lys Met
420 425 430
Ala Cys Glu Leu Ile Met Tyr Gly Gly Ala Gly His Thr Ser Val Leu
435 440 445
Tyr Thr Asn Pro Leu Asn Asn Ala His Ile Gln Gln Tyr Gln Ser Ala
450 455 460
Val Lys Thr Val Arg Ile Leu Ile Asn Thr Pro Ala Ser Gln Gly Ala
465 470 475 480
Ile Gly Asp Leu Tyr Asn Phe His Leu Asp Pro Ser Leu Thr Leu Gly
485 490 495
Cys Gly Thr Trp Gly Ser Thr Ser Val Ser Thr Asn Val Gly Pro Gln
500 505 510
His Leu Leu Asn Ile Lys Thr Val Thr Ala Arg Arg Glu Asn Met Leu
515 520 525
Trp Phe Arg Val Pro Pro Lys Ile Tyr Phe Lys Gly Gly Cys Leu Glu
530 535 540
Val Ala Leu Thr Asp Leu Arg Gly Lys Ser Arg Ala Phe Ile Val Thr
545 550 555 560
Asp Lys Pro Leu Phe Asp Met Gly Tyr Ala Asp Lys Val Thr His Ile
565 570 575
Leu Asp Ser Ile Asn Val His His Gln Val Phe Tyr His Val Thr Pro
580 585 590
Asp Pro Thr Leu Ala Cys Ile Glu Ala Gly Leu Lys Glu Ile Leu Glu
595 600 605
Phe Lys Pro Asp Val Ile Ile Ala Leu Gly Gly Gly Ser Pro Met Asp
610 615 620
Ala Ala Lys Ile Met Trp Leu Met Tyr Glu Cys Pro Asp Thr Arg Phe
625 630 635 640
Asp Gly Leu Ala Met Arg Phe Met Asp Ile Arg Lys Arg Val Tyr Glu
645 650 655
Val Pro Glu Leu Gly Lys Lys Ala Thr Met Val Cys Ile Pro Thr Thr
660 665 670
Ser Gly Thr Gly Ser Glu Val Thr Pro Phe Ser Val Val Thr Asp Glu
675 680 685
Arg Leu Gly Ala Lys Tyr Pro Leu Ala Asp Tyr Ala Leu Thr Pro Ser
690 695 700
Met Ala Ile Val Asp Pro Gln Leu Val Leu Asn Met Pro Lys Lys Leu
705 710 715 720
Thr Ala Trp Gly Gly Ile Asp Ala Leu Thr His Ala Leu Glu Ser Tyr
725 730 735
Val Ser Ile Cys Ala Thr Asp Tyr Thr Lys Gly Leu Ser Arg Glu Ala
740 745 750
Ile Ser Leu Leu Phe Lys Tyr Leu Pro Arg Ala Tyr Ala Asn Gly Ser
755 760 765
Asn Asp Tyr Leu Ala Arg Glu Lys Val His Tyr Ala Ala Thr Ile Ala
770 775 780
Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Ile Cys His Ser Met Ala
785 790 795 800
His Lys Leu Gly Ala Ala Tyr His Val Pro His Gly Leu Ala Asn Ala
805 810 815
Ala Leu Ile Ser His Val Ile Arg Tyr Asn Ala Thr Asp Met Pro Ala
820 825 830
Lys Gln Ala Ala Phe Pro Gln Tyr Glu Tyr Pro Thr Ala Lys Gln Asp
835 840 845
Tyr Ala Asp Leu Ala Asn Met Leu Gly Leu Gly Gly Asn Thr Val Asp
850 855 860
Glu Lys Val Ile Lys Leu Ile Glu Ala Val Glu Glu Leu Lys Ala Lys
865 870 875 880
Val Asp Ile Pro Pro Thr Ile Lys Glu Ile Phe Asn Asp Pro Lys Val
885 890 895
Asp Ala Asp Phe Leu Ala Asn Val Asp Ala Leu Ala Glu Asp Ala Phe
900 905 910
Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr Pro Leu Met Ala Asp
915 920 925
Leu Lys Gln Leu Tyr Leu Asp Ala His Ala Ala Pro Ile Leu Pro Val
930 935 940
Lys Thr Leu Glu Phe Phe Ser Lys Ile Asn
945 950
<210> 87
<211> 2658
<212> DNA
<213> 单鞭毛菌属E2
<400> 87
atgtccggat tacaaatgtt ccaaaacctt tctctttacg gtagtctcgc cgaaatcgat 60
actagcgaaa agcttaacga agctatggac aaattaactg ctgcccaaga acaattcaga 120
gaatacaacc aagaacaagt tgacaaaatc ttcaaggctg ttgctttagc tgcttctcaa 180
aaccgtgttg ctttcgctaa gtacgcacac gaagaaaccc aaaagggtgt tttcgaagat 240
aaggttatca agaacgaatt cgctgctgat tacatttacc acaagtactg caatgacaag 300
accgccggta tcattgaata tgatgaagcc aatggtctta tggaaattgc tgaaccagtt 360
ggtccagttg ttggtattgc tccagttact aacccaactt ctactatcat ctacaagtct 420
ttaattgcct taaagacccg taactgtatt atcttctcac cacatccagg agctcacaag 480
gcctctgttt tcgttgttaa ggtcttacac caagctgctg ttaaggctgg tgccccagaa 540
aactgtattc aaatcatctt cccaaagatg gatttaacta ctgaattatt acaccaccaa 600
aagactcgtt tcatttgggc tactggtggt ccaggtttag ttcacgcctc ttacacttct 660
ggtaagccag ctcttggtgg tggtccaggt aatgctccag ctcttattga tgaaacttgt 720
gatatgaacg aagctgttgg ttctatcgtt gtttctaaga ctttcgattg tggtatgatc 780
tgtgccactg aaaacgctgt tgtcgttgtc gaatctgtct acgaaaactt cgttgctacc 840
atgaagaagc gtggtgccta cttcatgact ccagaagaaa ccaagaaggc ttctaacctt 900
cttttcggag aaggtatgag attaaatgct aaggctgttg gtcaaactgc caagacttta 960
gctgaaatgg ccggtttcga agtcccagaa aacaccgttg ttctctgtgg tgaagcttct 1020
gaagttaaat tcgaagaacc aatggctcac gaaaagttaa ctactatcct cggtatctac 1080
aaggctaagg actttgacga tggtgtcaga ttatgtaagg aattagttac tttcggtggt 1140
aagggtcaca ctgctgttct ctacaccaac caaaacaaca aggaccgtat tgaaaagtac 1200
caaaacgaag ttccagcctt ccacatctta gttgacatgc catcttccct cggttgtatt 1260
ggtgatatgt acaacttccg tcttgctcca gctcttacca ttacttgtgg tactatgggt 1320
ggtggttcct cctctgataa cattggtcca aagcacttac ttaacatcaa gcgtgttggt 1380
atgagacgcg aaaacatgct ttggttcaag attccaaagt ctgtctactt caagcgtgct 1440
atcctttctg aagctttatc tgacttacgt gacacccaca agcgtgctat cattattacc 1500
gatagaacta tgactatgtt aggtcaaact gacaagatca ttaaggcttg tgaaggtcat 1560
ggtatggtct gcactgtcta cgataaggtt gtcccagatc caactatcaa gtgtattatg 1620
gaaggtgtta atgaaatgaa cgtcttcaag ccagatttag ctattgctct tggtggtggt 1680
tctgctatgg atgccgctaa gatgatgcgt ttattctacg aatacccaga ccaagactta 1740
caagatattg ctactcgttt cgtcgatatc cgtaagcgtg ttgttggttg tccaaagctt 1800
ggtagactta ttaagactct tgtctgtatc ccaactacct ctggtactgg tgccgaagtt 1860
actccattcg ctgtcgttac ctctgaagaa ggtcgtaagt acccattagt cgactacgaa 1920
cttactccag atatggctat tgttgatcca gaattcgctg ttggtatgcc aaagcgttta 1980
acttcttgga ctggtattga tgctcttacc cacgccattg aatcttacgt ttctattatg 2040
gctactgact tcactagacc atactctctc cgtgctgttg gtcttatctt cgaatccctt 2100
tcccttgctt acaacaacgg taaggatatt gaagctcgtg aaaagatgca caatgcttct 2160
gctattgctg gtatggcctt tgccaacgct ttccttggtt gttgtcactc tgttgctcac 2220
caacttggtt ccgtctacca cattccacac ggtcttgcca acgctttaat gctttctcac 2280
atcattaagt acaacgctac tgactctcca gttaagatgg gtaccttccc acaatacaag 2340
tacccacaag ctatgcgtca ctacgctgaa attgctgaac tcttattacc accaactcaa 2400
gttgttaaga tgactgatgt tgataaggtt caatacttaa ttgaccgtgt tgaacaatta 2460
aaggctgacg ttggtattcc aaagtctatt aaggaaactg gaatggttac tgaagaagac 2520
ttcttcaaca aggttgacca agttgctatc atggccttcg atgaccaatg tactggtgct 2580
aacccacgtt acccattagt ttctgaatta aaacaattaa tgattgatgc ctggaacggt 2640
gttgtcccaa agctctaa 2658
<210> 88
<211> 885
<212> PRT
<213> 单鞭毛菌属E2
<400> 88
Met Ser Gly Leu Gln Met Phe Gln Asn Leu Ser Leu Tyr Gly Ser Leu
1 5 10 15
Ala Glu Ile Asp Thr Ser Glu Lys Leu Asn Glu Ala Met Asp Lys Leu
20 25 30
Thr Ala Ala Gln Glu Gln Phe Arg Glu Tyr Asn Gln Glu Gln Val Asp
35 40 45
Lys Ile Phe Lys Ala Val Ala Leu Ala Ala Ser Gln Asn Arg Val Ala
50 55 60
Phe Ala Lys Tyr Ala His Glu Glu Thr Gln Lys Gly Val Phe Glu Asp
65 70 75 80
Lys Val Ile Lys Asn Glu Phe Ala Ala Asp Tyr Ile Tyr His Lys Tyr
85 90 95
Cys Asn Asp Lys Thr Ala Gly Ile Ile Glu Tyr Asp Glu Ala Asn Gly
100 105 110
Leu Met Glu Ile Ala Glu Pro Val Gly Pro Val Val Gly Ile Ala Pro
115 120 125
Val Thr Asn Pro Thr Ser Thr Ile Ile Tyr Lys Ser Leu Ile Ala Leu
130 135 140
Lys Thr Arg Asn Cys Ile Ile Phe Ser Pro His Pro Gly Ala His Lys
145 150 155 160
Ala Ser Val Phe Val Val Lys Val Leu His Gln Ala Ala Val Lys Ala
165 170 175
Gly Ala Pro Glu Asn Cys Ile Gln Ile Ile Phe Pro Lys Met Asp Leu
180 185 190
Thr Thr Glu Leu Leu His His Gln Lys Thr Arg Phe Ile Trp Ala Thr
195 200 205
Gly Gly Pro Gly Leu Val His Ala Ser Tyr Thr Ser Gly Lys Pro Ala
210 215 220
Leu Gly Gly Gly Pro Gly Asn Ala Pro Ala Leu Ile Asp Glu Thr Cys
225 230 235 240
Asp Met Asn Glu Ala Val Gly Ser Ile Val Val Ser Lys Thr Phe Asp
245 250 255
Cys Gly Met Ile Cys Ala Thr Glu Asn Ala Val Val Val Val Glu Ser
260 265 270
Val Tyr Glu Asn Phe Val Ala Thr Met Lys Lys Arg Gly Ala Tyr Phe
275 280 285
Met Thr Pro Glu Glu Thr Lys Lys Ala Ser Asn Leu Leu Phe Gly Glu
290 295 300
Gly Met Arg Leu Asn Ala Lys Ala Val Gly Gln Thr Ala Lys Thr Leu
305 310 315 320
Ala Glu Met Ala Gly Phe Glu Val Pro Glu Asn Thr Val Val Leu Cys
325 330 335
Gly Glu Ala Ser Glu Val Lys Phe Glu Glu Pro Met Ala His Glu Lys
340 345 350
Leu Thr Thr Ile Leu Gly Ile Tyr Lys Ala Lys Asp Phe Asp Asp Gly
355 360 365
Val Arg Leu Cys Lys Glu Leu Val Thr Phe Gly Gly Lys Gly His Thr
370 375 380
Ala Val Leu Tyr Thr Asn Gln Asn Asn Lys Asp Arg Ile Glu Lys Tyr
385 390 395 400
Gln Asn Glu Val Pro Ala Phe His Ile Leu Val Asp Met Pro Ser Ser
405 410 415
Leu Gly Cys Ile Gly Asp Met Tyr Asn Phe Arg Leu Ala Pro Ala Leu
420 425 430
Thr Ile Thr Cys Gly Thr Met Gly Gly Gly Ser Ser Ser Asp Asn Ile
435 440 445
Gly Pro Lys His Leu Leu Asn Ile Lys Arg Val Gly Met Arg Arg Glu
450 455 460
Asn Met Leu Trp Phe Lys Ile Pro Lys Ser Val Tyr Phe Lys Arg Ala
465 470 475 480
Ile Leu Ser Glu Ala Leu Ser Asp Leu Arg Asp Thr His Lys Arg Ala
485 490 495
Ile Ile Ile Thr Asp Arg Thr Met Thr Met Leu Gly Gln Thr Asp Lys
500 505 510
Ile Ile Lys Ala Cys Glu Gly His Gly Met Val Cys Thr Val Tyr Asp
515 520 525
Lys Val Val Pro Asp Pro Thr Ile Lys Cys Ile Met Glu Gly Val Asn
530 535 540
Glu Met Asn Val Phe Lys Pro Asp Leu Ala Ile Ala Leu Gly Gly Gly
545 550 555 560
Ser Ala Met Asp Ala Ala Lys Met Met Arg Leu Phe Tyr Glu Tyr Pro
565 570 575
Asp Gln Asp Leu Gln Asp Ile Ala Thr Arg Phe Val Asp Ile Arg Lys
580 585 590
Arg Val Val Gly Cys Pro Lys Leu Gly Arg Leu Ile Lys Thr Leu Val
595 600 605
Cys Ile Pro Thr Thr Ser Gly Thr Gly Ala Glu Val Thr Pro Phe Ala
610 615 620
Val Val Thr Ser Glu Glu Gly Arg Lys Tyr Pro Leu Val Asp Tyr Glu
625 630 635 640
Leu Thr Pro Asp Met Ala Ile Val Asp Pro Glu Phe Ala Val Gly Met
645 650 655
Pro Lys Arg Leu Thr Ser Trp Thr Gly Ile Asp Ala Leu Thr His Ala
660 665 670
Ile Glu Ser Tyr Val Ser Ile Met Ala Thr Asp Phe Thr Arg Pro Tyr
675 680 685
Ser Leu Arg Ala Val Gly Leu Ile Phe Glu Ser Leu Ser Leu Ala Tyr
690 695 700
Asn Asn Gly Lys Asp Ile Glu Ala Arg Glu Lys Met His Asn Ala Ser
705 710 715 720
Ala Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Cys Cys His
725 730 735
Ser Val Ala His Gln Leu Gly Ser Val Tyr His Ile Pro His Gly Leu
740 745 750
Ala Asn Ala Leu Met Leu Ser His Ile Ile Lys Tyr Asn Ala Thr Asp
755 760 765
Ser Pro Val Lys Met Gly Thr Phe Pro Gln Tyr Lys Tyr Pro Gln Ala
770 775 780
Met Arg His Tyr Ala Glu Ile Ala Glu Leu Leu Leu Pro Pro Thr Gln
785 790 795 800
Val Val Lys Met Thr Asp Val Asp Lys Val Gln Tyr Leu Ile Asp Arg
805 810 815
Val Glu Gln Leu Lys Ala Asp Val Gly Ile Pro Lys Ser Ile Lys Glu
820 825 830
Thr Gly Met Val Thr Glu Glu Asp Phe Phe Asn Lys Val Asp Gln Val
835 840 845
Ala Ile Met Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr
850 855 860
Pro Leu Val Ser Glu Leu Lys Gln Leu Met Ile Asp Ala Trp Asn Gly
865 870 875 880
Val Val Pro Lys Leu
885
<210> 89
<211> 2200
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> GPDI基因座
<220>
<221> 杂项特征
<222> (522)..(1698)
<223> 编码序列
<400> 89
tacaaacgca acacgaaaga acaaaaaaag aagaaaacag aaggccaaga cagggtcaat 60
gagactgttg tcctcctact gtccctatgt ctctggccga tcacgcgcca ttgtccctca 120
gaaacaaatc aaacacccac accccgggca cccaaagtcc ccacccacac caccaatacg 180
taaacggggc gccccctgca ggccctcctg cgcgcggcct cccgccttgc ttctctcccc 240
ttccttttct ttttccagtt ttccctattt tgtccctttt tccgcacaac aagtatcaga 300
atgggttcat caaatctatc caacctaatt cgcacgtaga ctggcttggt attggcagtt 360
tcgtagttat atatatacta ccatgagtga aactgttacg ttaccttaaa ttctttctcc 420
ctttaatttt cttttatctt actctcctac ataagacatc aagaaacaat tgtatattgt 480
acaccccccc cctccacaaa cacaaatatt gataatataa agatgtctgc tgctgctgat 540
agattaaact taacttccgg ccacttgaat gctggtagaa agagaagttc ctcttctgtt 600
tctttgaagg ctgccgaaaa gcctttcaag gttactgtga ttggatctgg taactggggt 660
actactattg ccaaggtggt tgccgaaaat tgtaagggat acccagaagt tttcgctcca 720
atagtacaaa tgtgggtgtt cgaagaagag atcaatggtg aaaaattgac tgaaatcata 780
aatactagac atcaaaacgt gaaatacttg cctggcatca ctctacccga caatttggtt 840
gctaatccag acttgattga ttcagtcaag gatgtcgaca tcatcgtttt caacattcca 900
catcaatttt tgccccgtat ctgtagccaa ttgaaaggtc atgttgattc acacgtcaga 960
gctatctcct gtctaaaggg ttttgaagtt ggtgctaaag gtgtccaatt gctatcctct 1020
tacatcactg aggaactagg tattcaatgt ggtgctctat ctggtgctaa cattgccacc 1080
gaagtcgctc aagaacactg gtctgaaaca acagttgctt accacattcc aaaggatttc 1140
agaggcgagg gcaaggacgt cgaccataag gttctaaagg ccttgttcca cagaccttac 1200
ttccacgtta gtgtcatcga agatgttgct ggtatctcca tctgtggtgc tttgaagaac 1260
gttgttgcct taggttgtgg tttcgtcgaa ggtctaggct ggggtaacaa cgcttctgct 1320
gccatccaaa gagtcggttt gggtgagatc atcagattcg gtcaaatgtt tttcccagaa 1380
tctagagaag aaacatacta ccaagagtct gctggtgttg ctgatttgat caccacctgc 1440
gctggtggta gaaacgtcaa ggttgctagg ctaatggcta cttctggtaa ggacgcctgg 1500
gaatgtgaaa aggagttgtt gaatggccaa tccgctcaag gtttaattac ctgcaaagaa 1560
gttcacgaat ggttggaaac atgtggctct gtcgaagact tcccattatt tgaagccgta 1620
taccaaatcg tttacaacaa ctacccaatg aagaacctgc cggacatgat tgaagaatta 1680
gatctacatg aagattagat ttattggaga aagataacat atcatacttt cccccacttt 1740
tttcgaggct cttctatatc atattcataa attagcatta tgtcatttct cataactact 1800
ttatcacgtt agaaattact tattattatt aaattaatac aaaatttagt aaccaaataa 1860
atataaataa atatgtatat ttaaatttta aaaaaaaaat cctatagagc aaaaggattt 1920
tccattataa tattagctgt acacctcttc cgcatttttt gagggtggtt acaacaccac 1980
tcattcagag gctgtcggca cagttgcttc tagcatctgg cgtccgtatg tatgggtgta 2040
ttttaaataa taaacaaagt gccacacctt caccaattat gtctttaaga aatggacaag 2100
ttccaaagag cttgcccaag gctcgacaag gatgtacttt ggaatatcta tattcaagta 2160
cgtggcgcgc atatgtttga gtgtgcacac aataaaggtt 2200
<210> 90
<211> 1060
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> gpd1Δ突变
<220>
<221> 杂项特征
<222> (523)..(542)
<223> 编码序列
<220>
<221> 杂项特征
<222> (543)..(558)
<223> 编码序列未检出
<400> 90
tacaaacgca acacgaaaga acaaaaaaag aagaaaacag aaggccaaga cagggtcaat 60
gagactgttg tcctcctact gtccctatgt ctctggccga tcacgcgcca ttgtccctca 120
gaaacaaatc aaacacccac accccgggca cccaaagtcc ccacccacac caccaatacg 180
taaacggggc gccccctgca ggccctcctg cgcgcggcct cccgccttgc ttctctcccc 240
ttccttttct ttttccagtt ttccctattt tgtccctttt tccgcacaac aagtatcaga 300
atgggttcat caaatctatc caacctaatt cgcacgtaga ctggcttggt attggcagtt 360
tcgtagttat atatatacta ccatgagtga aactgttacg ttaccttaaa ttctttctcc 420
ctttaatttt cttttatctt actctcctac ataagacatc aagaaacaat tgtatattgt 480
acaccccccc cctccacaaa cacaaatatt gataatataa agatgtctgc tgctgctgat 540
agtctacatg aagattagat ttattggaga aagataacat atcatacttt cccccacttt 600
tttcgaggct cttctatatc atattcataa attagcatta tgtcatttct cataactact 660
ttatcacgtt agaaattact tattattatt aaattaatac aaaatttagt aaccaaataa 720
atataaataa atatgtatat ttaaatttta aaaaaaaaat cctatagagc aaaaggattt 780
tccattataa tattagctgt acacctcttc cgcatttttt gagggtggtt acaacaccac 840
tcattcagag gctgtcggca cagttgcttc tagcatctgg cgtccgtatg tatgggtgta 900
ttttaaataa taaacaaagt gccacacctt caccaattat gtctttaaga aatggacaag 960
ttccaaagag cttgcccaag gctcgacaag gatgtacttt ggaatatcta tattcaagta 1020
cgtggcgcgc atatgtttga gtgtgcacac aataaaggtt 1060
<210> 91
<211> 2369
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> GPD2基因座
<220>
<221> 杂项特征
<222> (487)..(1806)
<223> 编码序列
<400> 91
atagccatca tgcaagcgtg tatcttctaa gattcagtca tcatcattac cgagtttgtt 60
ttccttcaca tgatgaagaa ggtttgagta tgctcgaaac aataagacga cgatggctct 120
gccattgtta tattacgctt ttgcggcgag gtgccgatgg gttgctgagg ggaagagtgt 180
ttagcttacg gacctattgc cattgttatt ccgattaatc tattgttcag cagctcttct 240
ctaccctgtc attctagtat tttttttttt tttttttggt tttacttttt tttcttcttg 300
cctttttttc ttgttacttt ttttctagtt ttttttcctt ccactaagct ttttccttga 360
tttatccttg ggttcttctt tctactcctt tagatttttt ttttatatat taatttttaa 420
gtttatgtat tttggtagat tcaattctct ttccctttcc ttttccttcg ctccccttcc 480
ttatcaatgc ttgctgtcag aagattaaca agatacacat tccttaagcg aacgcatccg 540
gtgttatata ctcgtcgtgc atataaaatt ttgccttcaa gatctacttt cctaagaaga 600
tcattattac aaacacaact gcactcaaag atgactgctc atactaatat caaacagcac 660
aaacactgtc atgaggacca tcctatcaga agatcggact ctgccgtgtc aattgtacat 720
ttgaaacgtg cgcccttcaa ggttacagtg attggttctg gtaactgggg gaccaccatc 780
gccaaagtca ttgcggaaaa cacagaattg cattcccata tcttcgagcc agaggtgaga 840
atgtgggttt ttgatgaaaa gatcggcgac gaaaatctga cggatatcat aaatacaaga 900
caccagaacg ttaaatatct acccaatatt gacctgcccc ataatctagt ggccgatcct 960
gatcttttac actccatcaa gggtgctgac atccttgttt tcaacatccc tcatcaattt 1020
ttaccaaaca tagtcaaaca attgcaaggc cacgtggccc ctcatgtaag ggccatctcg 1080
tgtctaaaag ggttcgagtt gggctccaag ggtgtgcaat tgctatcctc ctatgttact 1140
gatgagttag gaatccaatg tggcgcacta tctggtgcaa acttggcacc ggaagtggcc 1200
aaggagcatt ggtccgaaac caccgtggct taccaactac caaaggatta tcaaggtgat 1260
ggcaaggatg tagatcataa gattttgaaa ttgctgttcc acagacctta cttccacgtc 1320
aatgtcatcg atgatgttgc tggtatatcc attgccggtg ccttgaagaa cgtcgtggca 1380
cttgcatgtg gtttcgtaga aggtatggga tggggtaaca atgcctccgc agccattcaa 1440
aggctgggtt taggtgaaat tatcaagttc ggtagaatgt ttttcccaga atccaaagtc 1500
gagacctact atcaagaatc cgctggtgtt gcagatctga tcaccacctg ctcaggcggt 1560
agaaacgtca aggttgccac atacatggcc aagaccggta agtcagcctt ggaagcagaa 1620
aaggaattgc ttaacggtca atccgcccaa gggataatca catgcagaga agttcacgag 1680
tggctacaaa catgtgagtt gacccaagaa ttcccattat tcgaggcagt ctaccagata 1740
gtctacaaca acgtccgcat ggaagaccta ccggagatga ttgaagagct agacatcgat 1800
gacgaataga cactctcccc ccccctcccc ctctgatctt tcctgttgcc tctttttccc 1860
ccaaccaatt tatcattata cacaagttct acaactacta ctagtaacat tactacagtt 1920
attataattt tctattctct ttttctttaa gaatctatca ttaacgttaa tttctatata 1980
tacataacta ccattataca cgctattatc gtttacatat cacatcaccg ttaatgaaag 2040
atacgacacc ctgtacacta acacaattaa ataatcgcca taaccttttc tgttatctat 2100
agcccttaaa gctgtttctt cgagcttttt cactgcagta attctccaca tgggcccagc 2160
cactgagata agagcgctat gttagtcact actgacggct ctccagtcat ttatgtgatt 2220
ttttagtgac tcatgtcgca tttggcccgt ttttttccgc tgtcgcaacc tatttccatt 2280
aacggtgccg tatggaagag tcatttaaag gcaggagaga gagattactc atcttcattg 2340
gatcagattg atgactgcgt acggcagat 2369
<210> 92
<211> 1024
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> gpd2Δ突变
<400> 92
atagccatca tgcaagcgtg tatcttctaa gattcagtca tcatcattac cgagtttgtt 60
ttccttcaca tgatgaagaa ggtttgagta tgctcgaaac aataagacga cgatggctct 120
gccattgtta tattacgctt ttgcggcgag gtgccgatgg gttgctgagg ggaagagtgt 180
ttagcttacg gacctattgc cattgttatt ccgattaatc tattgttcag cagctcttct 240
ctaccctgtc attctagtat tttttttttt tttttttggt tttacttttt tttcttcttg 300
cctttttttc ttgttacttt ttttctagtt ttttttcctt ccactaagct ttttccttga 360
tttatccttg ggttcttctt tctactcctt tagatttttt ttttatatat taatttttaa 420
gtttatgtat tttggtagat tcaattctct ttccctttcc ttttccttcg ctccccttcc 480
ttatcctctg atctttcctg ttgcctcttt ttcccccaac caatttatca ttatacacaa 540
gttctacaac tactactagt aacattacta cagttattat aattttctat tctctttttc 600
tttaagaatc tatcattaac gttaatttct atatatacat aactaccatt atacacgcta 660
ttatcgttta catatcacat caccgttaat gaaagatacg acaccctgta cactaacaca 720
attaaataat cgccataacc ttttctgtta tctatagccc ttaaagctgt ttcttcgagc 780
tttttcactg cagtaattct ccacatgggc ccagccactg agataagagc gctatgttag 840
tcactactga cggctctcca gtcatttatg tgatttttta gtgactcatg tcgcatttgg 900
cccgtttttt tccgctgtcg caacctattt ccattaacgg tgccgtatgg aagagtcatt 960
taaaggcagg agagagagat tactcatctt cattggatca gattgatgac tgcgtacggc 1020
agat 1024
<210> 93
<211> 3180
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> FDH1基因座
<220>
<221> 杂项特征
<222> (880)..(2007)
<223> 编码序列
<400> 93
tatttttcta tagatattta cactccgcaa gtgcaaaaaa aaagcattat cgctaacgat 60
caagaggaac tgagacctta ttagttgtct ttgttggcgt aacataaatt tcttaggaaa 120
agagaaaatt atctcgaagg caaaaataaa ccaagcctcg agtttaatgg ttttctaaaa 180
aacactttaa aaacagatcg ccataaaagg agaagctccg taggagaccg ttttcgaaac 240
ctatgtagaa ataaagggaa agctccaacg gtttggataa atctttagaa gcatagagtt 300
tatacaacat tcagtacgaa atgtactctc gaaacgttct cttttcacgg tgcttagtag 360
cagaaaaaag tgtcggaaat tacctatttt gtcaccactc gaggataggc ttgaaagaga 420
gttttaaccc caacttttct attttgcact tgtttggcta tggtttaaaa cattctgttt 480
ggaccaacag cccaagcggc ttatcccttt tctttttttc ccttataatc gggaatttcc 540
ttactaggaa ggcaccgata ctagaactcc gaatgaaaaa gacatgccag taataaaact 600
attttgatgt tatgcggaat atactattct tggattattc actgttaact aaaagttgga 660
gaaatcactc tgcactgtca atcattgaaa aaaagaacat ataaaagggc acaaaattga 720
gtctttttta atgagttctt gctgaggaaa gtttagttaa tatatcattt acgtaaaata 780
tgcatattct tgtattgtgc tttttttatt cattttaagc aggaacaatt tacaagtatt 840
gcaacgctaa tcaaatcaaa ataacagctg aaaattaata tgtcgaaggg aaaggttttg 900
ctggttcttt acgaaggtgg taagcatgct gaagagcagg aaaagttatt ggggtgtatt 960
gaaaatgaac ttggtatcag aaatttcatt gaagaacagg gatacgagtt ggttactacc 1020
attgacaagg accctgagcc aacctcaacg gtagacaggg agttgaaaga cgctgaaatt 1080
gtcattacta cgcccttttt ccccgcctac atctcgagaa acaggattgc agaagctcct 1140
aacctgaagc tctgtgtaac cgctggcgtc ggttcagacc atgtcgattt agaagctgca 1200
aatgaacgga aaatcacggt caccgaagtt actggttcta acgtcgtttc tgtcgcagag 1260
cacgttatgg ccacaatttt ggttttgata agaaactata atggtggtca tcaacaagca 1320
attaatggtg agtgggatat tgccggcgtg gctaaaaatg agtatgatct ggaagacaaa 1380
ataatttcaa cggtaggtgc cggtagaatt ggatataggg ttctggaaag attggtcgca 1440
tttaatccga agaagttact gtactacgac taccaggaac tacctgcgga agcaatcaat 1500
agattgaacg aggccagcaa gcttttcaat ggcagaggtg atattgttca gagagtagag 1560
aaattggagg atatggttgc tcagtcagat gttgttacca tcaactgtcc attgcacaag 1620
gactcaaggg gtttattcaa taaaaagctt atttcccaca tgaaagatgg tgcatacttg 1680
gtgaataccg ctagaggtgc tatttgtgtc gcagaagatg ttgccgaggc agtcaagtct 1740
ggtaaattgg ctggctatgg tggtgatgtc tgggataagc aaccagcacc aaaagaccat 1800
ccctggagga ctatggacaa taaggaccac gtgggaaacg caatgactgt tcatatcagt 1860
ggcacatctc tggatgctca aaagaggtac gctcagggag taaagaacat cctaaatagt 1920
tacttttcca aaaagtttga ttaccgtcca caggatatta ttgtgcagaa tggttcttat 1980
gccaccagag cttatggaca gaagaaataa gagtgattat gagtatttgt gagcagaagt 2040
tttccggtct ccttttgttc ttgttttggc gtattctcca ctattcgtcc atagcacatt 2100
tataccttag ctaaatattt tgtaaagcaa aattttcgtt atctcttaaa aaatagaaga 2160
gcggtttatt aatatcaaat aattgaaact gctgatatgg tagctatata caaaatctgc 2220
tgtcaaaatt tggcagtaaa cgatcttcac ggtagcggtt caaataaaga ggaaaagtct 2280
ttctccctta ctgtttttct ggaatttggc tcgtcgttaa taacagaact aaagatacag 2340
taaaaggaga gatcgcaatc aacttcatta attgtaacag tagcataatc acaactgatc 2400
atctacacta taaacagttt ttatttctaa ttatgggcgc ctggccggct caaacattgt 2460
gcttttaaga ctccaaaagt atctgctgca gaaaagagcc atataatgtt aagtgttcag 2520
ggataggtta tcgcttacta cttcaaacgt ttcgaaggaa agccagggaa gcctatatct 2580
gattccctgt ttcataatcc aatgcagcca ctagcttata attatttgaa ctatttgtcg 2640
aacatcacag taataaaatc cccagaaagt tccacttgct gcatattggc acctgttgat 2700
tcactctcca tcactttttt gttagccgcc cagcctagaa agtctttaaa tacatctgaa 2760
attttttttt ttttaacagt gcacccgtgc atcatacctc atgcaaggta cctttttttc 2820
tcaaaggtat tgtcttccat tgaagtggca ctatggcatg atgaaccctg agcatttctg 2880
aattcaacag aaccaaattg tccagaaata aatctgtccg acatgaatta tgaaactttt 2940
tttcaattaa gtgaagagaa ttttgcagcg tcttaccatt attttgaccc attggtcgca 3000
tgtttgcgct ttgacttcga gaaccatgtt aaagcttact tgtacgacaa ccaatgaagt 3060
atattacggc agtttttttg gactgggtca aaaaaagtgt tgcataatca aatcaggaac 3120
acattaaaat gttgtaaaat ttgtcttagt atcacctgag tggttattca ttacgtacta 3180
<210> 94
<211> 1630
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> fdh1Δ突变
<400> 94
tatttttcta tagatattta cactccgcaa gtgcaaaaaa aaagcattat cgctaacgat 60
caagaggaac tgagacctta ttagttgtct ttgttggcgt aacataaatt tcttaggaaa 120
agagaaaatt atctcgaagg caaaaataaa ccaagcctcg agtttaatgg ttttctaaaa 180
aacactttaa aaacagatcg ccataaaagg agaagctccg taggagaccg ttttcgaaac 240
ctatgtagaa ataaagggaa agctccaacg gtttggataa atctttagaa gcatagagtt 300
tatacaacat tcagtacgaa atgtactctc gaaacgttct cttttcacgg tgcttagtag 360
cagaaaaaag tgtcggaaat tacctatttt gtcaccactc gaggataggc ttgaaagaga 420
gttttaaccc caacttttct attttgcact tgtttggcta tggtttaaaa cattctgttt 480
ggaccaacag cccaagcggc ttatcccttt tctttttttc ccttataatc gggaatttcc 540
ttactaggaa ggcaccgata ctagaactcc gaatgaaaaa gacatgccag taataaaact 600
attttgatgt tatgcggaat atactattct tggattattc actgttaact aaaagttgga 660
gaaatcactc tgcactgtca tggcagtaaa cgatcttcac ggtagcggtt caaataaaga 720
ggaaaagtct ttctccctta ctgtttttct ggaatttggc tcgtcgttaa taacagaact 780
aaagatacag taaaaggaga gatcgcaatc aacttcatta attgtaacag tagcataatc 840
acaactgatc atctacacta taaacagttt ttatttctaa ttatgggcgc ctggccggct 900
caaacattgt gcttttaaga ctccaaaagt atctgctgca gaaaagagcc atataatgtt 960
aagtgttcag ggataggtta tcgcttacta cttcaaacgt ttcgaaggaa agccagggaa 1020
gcctatatct gattccctgt ttcataatcc aatgcagcca ctagcttata attatttgaa 1080
ctatttgtcg aacatcacag taataaaatc cccagaaagt tccacttgct gcatattggc 1140
acctgttgat tcactctcca tcactttttt gttagccgcc cagcctagaa agtctttaaa 1200
tacatctgaa attttttttt ttttaacagt gcacccgtgc atcatacctc atgcaaggta 1260
cctttttttc tcaaaggtat tgtcttccat tgaagtggca ctatggcatg atgaaccctg 1320
agcatttctg aattcaacag aaccaaattg tccagaaata aatctgtccg acatgaatta 1380
tgaaactttt tttcaattaa gtgaagagaa ttttgcagcg tcttaccatt attttgaccc 1440
attggtcgca tgtttgcgct ttgacttcga gaaccatgtt aaagcttact tgtacgacaa 1500
ccaatgaagt atattacggc agtttttttg gactgggtca aaaaaagtgt tgcataatca 1560
aatcaggaac acattaaaat gttgtaaaat ttgtcttagt atcacctgag tggttattca 1620
ttacgtacta 1630
<210> 95
<211> 2668
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> FDH2基因座
<220>
<221> 杂项特征
<222> (801)..(1929)
<223> 编码序列
<400> 95
tgtcgagaca atgtcattgc aagttatata aacattgtaa tacatcacct cgatgaaaga 60
gaaactggaa tgatagatct ctttttctca aaatttcgtt aatatgtaat aataaggttc 120
ctgatgtaat ttgtttttgt acaaattatt ttagattctg gaggttcaaa taaaatatat 180
attacagcca acgattaggg gggacaagac ttgattacac atttttcgtt ggtaacttga 240
ctcttttatg aaaagaaaac attaagttga aggtgcacgc ttgaggcgct cctttttcat 300
ggtgcttagc agcagatgaa agtgtcagaa gttacctatt ttgtcaccat ttgagaataa 360
gcttgaaaga aagttgtaac cccaactttt ctatcttgca cttgtttgga ccaacagcca 420
aacggcttat cccttttctt ttcccttata atcgggaatt tccttactag gaaggcaccg 480
atactataac tccgaatgaa aaagacatgc cagtaataaa aataattgat gttatgcgga 540
atatactatt cttggattat tcactgttaa ctaaaagttg gagaaatcac tctgcactgt 600
caatcattga aaaaaagaac atataaaagg gcacaaaatc gagtcttttt taatgagttc 660
ttgctgagga aaatttagtt aatatatcat ttacataaaa catgcatatt attgtgttgt 720
actttcttta ttcattttaa gcaggaataa ttacaagtat tgcaacgcta atcaaatcga 780
aataacagct gaaaattaat atgtcgaagg gaaaggtttt gctggttctt tatgaaggtg 840
gtaagcatgc tgaagagcag gaaaagttat tggggtgtat tgaaaatgaa cttggtatca 900
gaaatttcat tgaagaacag ggatacgagt tggttactac cattgacaag gaccctgagc 960
caacctcaac ggtagacagg gagttgaaag acgctgaaat tgtcattact acgccctttt 1020
tccccgccta catctcgaga aacaggattg cagaagctcc taacctgaag ctctgtgtaa 1080
ccgctggcgt cggttcagac catgtcgatt tagaagctgc aaatgaacgg aaaatcacgg 1140
tcaccgaagt tactggttct aacgtcgttt ctgtcgcaga gcacgttatg gccacaattt 1200
tggttttgat aagaaactat aatggtggtc atcaataagc aattaatggt gagtgggata 1260
ttgccggcgt ggctaaaaaa tgagtatgat ctggaagaca aaataatttc aacggtaggt 1320
gccggtagaa ttggatatag ggttctggaa agattggtcg catttaatcc gaagaagtta 1380
ctgtactacg actaccagga actacctgcg gaagcaatca atagattgaa cgaggccagc 1440
aagcttttca atggcagagg tgatattgtt cagagagtag agaaattgga ggatatggtt 1500
gctcagtcag atgttgttac catcaactgt ccattgcaca aggactcaag gggtttattc 1560
aataaaaagc ttatttccca catgaaagat ggtgcatact tggtgaatac cgctagaggt 1620
gctatttgtg tcgcagaaga tgttgccgag gcagtcaagt ctggtaaatt ggctggctat 1680
ggtggtgatg tctgggataa gcaaccagca ccaaaagacc atccctggag gactatggac 1740
aataaggacc acgtgggaaa cgcaatgact gttcatatca gtggcacatc tctgcatgct 1800
caaaagaggt acgctcaggg agtaaagaac atcctaaata gttacttttc caaaaagttt 1860
gattaccgtc cacaggatat tattgtgcag aatggttctt atgccaccag agcttatgga 1920
cagaagaaat aagagtgatt atgagtattt gtgagcagaa gttttccggt ctccttttgt 1980
tcttgttttg gcgtattctc cactattcgt ccatagcaca tttatacctt agctaaatat 2040
tttgtaaagc aaaattttcg ttatctctta aaaaatagaa gagcggttta ttaatatcaa 2100
ataattgaaa ctgctgatat ggtagctata tacaaaatct gctgtcaaaa tttggcagta 2160
aacgatcttc acggtagcgg ttcaaataaa gaggaaaagt ccttctccct tactgttttt 2220
ctggaatttg gctcgtcgtt aataacagaa ctaaagatac agtaaaagga gagatcgcaa 2280
tcaacttcat taattgtaac agtagcataa tcacaactgg ttatctgcgt tatagacaat 2340
tcttactcac aatgatgggc gcttagttgg ctgtaaacgt cgctttttaa aactccgaaa 2400
agttaccgct acagaaaaaa accataaatg tatgctagtt gcgcagagag gtttagggtc 2460
caaaatttac taccctgtcg ctcactacag cgactgtccc gaattaagcc cgaagagacg 2520
cagaactgtt gtatgaacct catgaaacca ctgatcttga agatttagac cttcagaatc 2580
gttttcaatt agaagtatac aagaagtctt tgtacaataa tgtcaagaca gagctctgaa 2640
ttatagttca gccttgttat tttttttt 2668
<210> 96
<211> 1539
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<222> (801)..(1539)
<223> 删除的编码序列
<400> 96
tgtcgagaca atgtcattgc aagttatata aacattgtaa tacatcacct cgatgaaaga 60
gaaactggaa tgatagatct ctttttctca aaatttcgtt aatatgtaat aataaggttc 120
ctgatgtaat ttgtttttgt acaaattatt ttagattctg gaggttcaaa taaaatatat 180
attacagcca acgattaggg gggacaagac ttgattacac atttttcgtt ggtaacttga 240
ctcttttatg aaaagaaaac attaagttga aggtgcacgc ttgaggcgct cctttttcat 300
ggtgcttagc agcagatgaa agtgtcagaa gttacctatt ttgtcaccat ttgagaataa 360
gcttgaaaga aagttgtaac cccaactttt ctatcttgca cttgtttgga ccaacagcca 420
aacggcttat cccttttctt ttcccttata atcgggaatt tccttactag gaaggcaccg 480
atactataac tccgaatgaa aaagacatgc cagtaataaa aataattgat gttatgcgga 540
atatactatt cttggattat tcactgttaa ctaaaagttg gagaaatcac tctgcactgt 600
caatcattga aaaaaagaac atataaaagg gcacaaaatc gagtcttttt taatgagttc 660
ttgctgagga aaatttagtt aatatatcat ttacataaaa catgcatatt attgtgttgt 720
actttcttta ttcattttaa gcaggaataa ttacaagtat tgcaacgcta atcaaatcga 780
aataacagct gaaaattaat taagagtgat tatgagtatt tgtgagcaga agttttccgg 840
tctccttttg ttcttgtttt ggcgtattct ccactattcg tccatagcac atttatacct 900
tagctaaata ttttgtaaag caaaattttc gttatctctt aaaaaataga agagcggttt 960
attaatatca aataattgaa actgctgata tggtagctat atacaaaatc tgctgtcaaa 1020
atttggcagt aaacgatctt cacggtagcg gttcaaataa agaggaaaag tccttctccc 1080
ttactgtttt tctggaattt ggctcgtcgt taataacaga actaaagata cagtaaaagg 1140
agagatcgca atcaacttca ttaattgtaa cagtagcata atcacaactg gttatctgcg 1200
ttatagacaa ttcttactca caatgatggg cgcttagttg gctgtaaacg tcgcttttta 1260
aaactccgaa aagttaccgc tacagaaaaa aaccataaat gtatgctagt tgcgcagaga 1320
ggtttagggt ccaaaattta ctaccctgtc gctcactaca gcgactgtcc cgaattaagc 1380
ccgaagagac gcagaactgt tgtatgaacc tcatgaaacc actgatcttg aagatttaga 1440
ccttcagaat cgttttcaat tagaagtata caagaagtct ttgtacaata atgtcaagac 1500
agagctctga attatagttc agccttgtta ttttttttt 1539
<210> 97
<211> 2863
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> GPD1在GPD2基因座
<220>
<221> 杂项特征
<222> (941)..(2113)
<223> 插入的CDP1
<400> 97
agtaactgtg acgatatcaa ctcttttttt attatgtaat aagcaaacaa gcacgaatgg 60
ggaaagccta tgtgcaatca ccaaggtcgt cccttttttc ccatttgcta atttagaatt 120
taaagaaacc aaaagaatga agaaagaaaa caaatactag ccctaaccct gacttcgttt 180
ctatgataat accctgcttt aatgaacggt atgccctagg gtatatctca ctctgtacgt 240
tacaaactcc ggttatttta tcggaacatc cgagcacccg cgccttcctc aacccaggca 300
ccgcccccag gtaaccgtgc gcgatgagct aatcctgagc catcacccac cccacccgtt 360
gatgacagca attcgggagg gcgaaaaata aaaactggag caaggaatta ccatcaccgt 420
caccatcacc atcatatcgc cttagcctct agccatagcc atcatgcaag cgtgtatctt 480
ctaagattca gtcatcatca ttaccgagtt tgttttcctt cacatgatga agaaggtttg 540
agtatgctcg aaacaataag acgacgatgg ctctgccatt gttatattac gcttttgcgg 600
cgaggtgccg atgggttgct gaggggaaga gtgtttagct tacggaccta ttgccattgt 660
tattccgatt aatctattgt tcagcagctc ttctctaccc tgtcattcta gtattttttt 720
tttttttttt tggttttact tttttttctt cttgcctttt tttcttgtta ctttttttct 780
agtttttttt ccttccacta agctttttcc ttgatttatc cttgggttct tctttctact 840
cctttagatt ttttttttat atattaattt ttaagtttat gtattttggt agattcaatt 900
ctctttccct ttccttttcc ttcgctcccc ttccttatca atgtctgctg ctgctgatag 960
attaaactta acttccggcc acttgaatgc tggtagaaag agaagttcct cttctgtttc 1020
tttgaaggct gccgaaaagc ctttcaaggt tactgtgatt ggatctggta actggggtac 1080
tactattgcc aaggtggttg ccgaaaattg taagggatac ccagaagttt tcgctccaat 1140
agtacaaatg tgggtgttcg aagaagagat caatggtgaa aaattgactg aaatcataaa 1200
tactagacat caaaacgtga aatacttgcc tggcatcact ctacccgaca atttggttgc 1260
taatccagac ttgattgatt cagtcaagga tgtcgacatc atcgttttca acattccaca 1320
tcaatttttg ccccgtatct gtagccaatt gaaaggtcat gttgattcac acgtcagagc 1380
tatctcctgt ctaaagggtt ttgaagttgg tgctaaaggt gtccaattgc tatcctctta 1440
catcactgag gaactaggta ttcaatgtgg tgctctatct ggtgctaaca ttgccaccga 1500
agtcgctcaa gaacactggt ctgaaacaac agttgcttac cacattccaa aggatttcag 1560
aggcgagggc aaggacgtcg accataaggt tctaaaggcc ttgttccaca gaccttactt 1620
ccacgttagt gtcatcgaag atgttgctgg tatctccatc tgtggtgctt tgaagaacgt 1680
tgttgcctta ggttgtggtt tcgtcgaagg tctaggctgg ggtaacaacg cttctgctgc 1740
catccaaaga gtcggtttgg gtgagatcat cagattcggt caaatgtttt tcccagaatc 1800
tagagaagaa acatactacc aagagtctgc tggtgttgct gatttgatca ccacctgcgc 1860
tggtggtaga aacgtcaagg ttgctaggct aatggctact tctggtaagg acgcctggga 1920
atgtgaaaag gagttgttga atggccaatc cgctcaaggt ttaattacct gcaaagaagt 1980
tcacgaatgg ttggaaacat gtggctctgt cgaagacttc ccattatttg aagccgtata 2040
ccaaatcgtt tacaacaact acccaatgaa gaacctgccg gacatgattg aagaattaga 2100
tctacatgaa gattagacac tctccccccc cctccccctc tgatctttcc tgttgcctct 2160
ttttccccca accaatttat cattatacac aagttctaca actactacta gtaacattac 2220
tacagttatt ataattttct attctctttt tctttaagaa tctatcatta acgttaattt 2280
ctatatatac ataactacca ttatacacgc tattatcgtt tacatatcac atcaccgtta 2340
atgaaagata cgacaccctg tacactaaca caattaaata atcgccataa ccttttctgt 2400
tatctatagc ccttaaagct gtttcttcga gctttttcac tgcagtaatt ctccacatgg 2460
gcccagccac tgagataaga gcgctatgtt agtcactact gacggctctc cagtcattta 2520
tgtgattttt tagtgactca tgtcgcattt ggcccgtttt tttccgctgt cgcaacctat 2580
ttccattaac ggtgccgtat ggaagagtca tttaaaggca ggagagagag attactcatc 2640
ttcattggat cagattgatg actgcgtacg gcagatagtg taatctgagc agttgcgaga 2700
cccagactgg cactgtctca atagtatatt aatgggcata cattcgtact cccttgttct 2760
tgcccacagt tctctctctc tttacttctt gtatcttgtc tccccattgt gcagcgataa 2820
ggaacattgt tctaatatac acggatacaa aagaaataca cat 2863
<210> 98
<211> 12394
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> 在GPD1基因座的M2158 AADH整合
<400> 98
tagattcttt tcgaatttgt ggtgaagata ggaaagttgg tacagttctc catcaatttt 60
ccatattttg ctaaaaactc ccttgcatgt ctctttgcat tcatttctcc tgtatacggg 120
ttcaacacat caatcgaatt ttgcaaagtt gtctccattt ctagaagact ttcatcggga 180
ataaaaaatt catatccatt attcaaaaac gataatgatc cctcgtactt acctgtgtaa 240
ttggatattt tataccatac ttcaaaaata tccttggcct cacttctggt aggatacctt 300
tcgccatgtc tgccaatcat ttgaacttgc gttaatctac aaccttcagg aatatcagtg 360
ggtataccgt agttagcggg aaaggagaaa tatggcgcag accctccaag aaagggaaac 420
agactcttct gagagccaat tagttcaata tccgcaaaac ttctgagtgg gatggagagt 480
gccttagata atagaacacc taaacaaatg gcaaaaataa cgggcttcac cattgttcct 540
gtatggtgta ttagaacata gctgaaaata cttctgcctc aaaaaagtgt taaaaaaaag 600
aggcattata tagaggtaaa gcctacaggc gcaagataac acatcaccgc tctcccccct 660
ctcatgaaaa gtcatcgcta aagaggaaca ctgaaggttc ccgtaggttg tctttggcac 720
aaggtagtac atggtaaaaa ctcaggatgg aataattcaa attcaccaat ttcaacgtcc 780
cttgtttaaa aagaaaagaa tttttctctt taaggtagca ctaatgcatt atcgatgatg 840
taaccattca cacaggttat ttagcttttg atccttgaac cattaattaa cccagaaata 900
gaaattaccc aagtggggct ctccaacaca atgagaggaa aggtgacttt ttaagggggc 960
cagaccctgt taaaaacctt tgatggctat gtaataatag taaattaagt gcaaacatgt 1020
aagaaagatt ctcggtaacg accatacaaa tattgggcgt gtggcgtagt cggtagcgcg 1080
ctcccttagc atgggagagg tctccggttc gattccggac tcgtccaaat tattttttac 1140
tttccgcggt gccgagatgc agacgtggcc aactgtgtct gccgtcgcaa aatgatttga 1200
attttgcgtc gcgcacgttt ctcacgtaca taataagtat tttcatacag ttctagcaag 1260
acgaggtggt caaaatagaa gcgtcctatg ttttacagta caagacagtc catactgaaa 1320
tgacaacgta cttgactttt cagtattttc tttttctcac agtctggtta tttttgaaag 1380
cgcacgaaat atatgtaggc aagcattttc tgagtctgct gacctctaaa attaatgcta 1440
ttgtgcacct tagtaaccca aggcaggaca gttaccttgc gtggtgttac tatggccgga 1500
agcccgaaag agttatcgtt actccgatta ttttgtacag ctgatgggac cttgccgtct 1560
tcattttttt tttttttcac ctatagagcc gggcagagct gcccggctta actaagggcc 1620
ggaaaaaaaa cggaaaaaag aaagccaagc gtgtagacgt agtataacag tatatctgac 1680
acgcacgtga tgaccacgta atcgcatcgc ccctcacctc tcacctctca ccgctgactc 1740
agcttcacta aaaaggaaaa tatatactct ttcccaggca aggtgacagc ggtccccgtc 1800
tcctccacaa aggcctctcc tggggtttga gcaagtctaa gtttacgtag cataaaaatt 1860
ctcggattgc gtcaaataat aaaaaaagta accccacttc tacttctaca tcggaaaaac 1920
attccattca catatcgtct ttggcctatc ttgttttgtc ctcggtagat caggtcagta 1980
caaacgcaac acgaaagaac aaaaaaagaa gaaaacagaa ggccaagaca gggtcaatga 2040
gactgttgtc ctcctactgt ccctatgtct ctggccgatc acgcgccatt gtccctcaga 2100
aacaaatcaa acacccacac cccgggcacc caaagtcccc acccacacca ccaatacgta 2160
aacggggcgc cccctgcagg ccctcctgcg cgcggcctcc cgccttgctt ctctcccctt 2220
ccttttcttt ttccagtttt ccctattttg tccctttttc cgcacaacaa gtatcagaat 2280
gggttcatca aatctatcca acctaattcg cacgtagact ggcttggtat tggcagtttc 2340
gtagttatat atatactacc atgagtgaaa ctgttacgtt accttaaatt ctttctccct 2400
ttaattttct tttatcttac tctcctacat aagacatcaa gaaacaattg tatattgtac 2460
accccccccc tccacaaaca caaatattga taatataaag atggctgtta ctaatgtcgc 2520
tgaacttaac gcactcgtag agcgtgtaaa aaaagcccag cgtgaatatg ccagtttcac 2580
tcaagagcaa gtagacaaaa tcttccgcgc cgccgctctg gctgctgcag atgctcgaat 2640
cccactcgcg aaaatggccg ttgccgaatc cggcatgggt atcgtcgaag ataaagtgat 2700
caaaaaccac tttgcttctg aatatatcta caacgcctat aaagatgaaa aaacctgtgg 2760
tgttctgtct gaagacgaca cttttggtac catcactatc gctgaaccaa tcggtattat 2820
ttgcggtatc gttccgacca ctaacccgac ttcaactgct atcttcaaat cgctgatcag 2880
tctgaagacc cgtaacgcca ttatcttctc cccgcacccg cgtgcaaaag atgccaccaa 2940
caaagcggct gatatcgttc tgcaggctgc tatcgctgcc ggtgctccga aagatctgat 3000
cggctggatc gatcaacctt ctgttgaact gtctaacgca ctgatgcacc acccagacat 3060
caacctgatc ctcgcgactg gtggtccggg catggttaaa gccgcataca gctccggtaa 3120
accagctatc ggtgtaggcg cgggcaacac tccagttgtt atcgatgaaa ctgctgatat 3180
caaacgtgca gttgcatctg tactgatgtc caaaaccttc gacaacggcg taatctgtgc 3240
ttctgaacag tctgttgttg ttgttgactc tgtttatgac gctgtacgtg aacgttttgc 3300
aacccacggc ggctatctgt tgcagggtaa agagctgaaa gctgttcagg atgttatcct 3360
gaaaaacggt gcgctgaacg cggctatcgt tggtcagcca gcctataaaa ttgctgaact 3420
ggcaggcttc tctgtaccag aaaacaccaa gattctgatc ggtgaagtga ccgttgttga 3480
tgaaagcgaa ccgttcgcac atgaaaaact gtccccgact ctggcaatgt accgcgctaa 3540
agatttcgaa gacgcggtag aaaaagcaga gaaactggtt gctatgggcg gtatcggtca 3600
tacctcttgc ctgtacactg accaggataa ccaaccggct cgcgtttctt acttcggtca 3660
gaaaatgaaa acggcgcgta tcctgattaa caccccagcg tctcagggtg gtatcggtga 3720
cctgtataac ttcaaactcg caccttccct gactctgggt tgtggttctt ggggtggtaa 3780
ctccatctct gaaaacgttg gtccgaaaca cctgatcaac aagaaaaccg ttgctaagcg 3840
agctgaaaac atgttgtggc acaaacttcc gaaatctatc tacttccgcc gtggctccct 3900
gccaatcgcg ctggatgaag tgattactga tggccacaaa cgtgcgctca tcgtgactga 3960
ccgcttcctg ttcaacaatg gttatgctga tcagatcact tccgtactga aagcagcagg 4020
cgttgaaact gaagtcttct tcgaagtaga agcggacccg accctgagca tcgttcgtaa 4080
aggtgcagaa ctggcaaact ccttcaaacc agacgtgatt atcgcgctgg gtggtggttc 4140
cccgatggac gccgcgaaga tcatgtgggt tatgtacgaa catccggaaa ctcacttcga 4200
agagctggcg ctgcgcttta tggatatccg taaacgtatc tacaagttcc cgaaaatggg 4260
cgtgaaagcg aaaatgatcg ctgtcaccac cacttctggt acaggttctg aagtcactcc 4320
gtttgcggtt gtaactgacg acgctactgg tcagaaatat ccgctggcag actatgcgct 4380
gactccggat atggcgattg tcgacgccaa cctggttatg gacatgccga agtccctgtg 4440
tgctttcggt ggtctggacg cagtaactca cgccatggaa gcttatgttt ctgtactggc 4500
atctgagttc tctgatggtc aggctctgca ggcactgaaa ctgctgaaag aatatctgcc 4560
agcgtcctac cacgaagggt ctaaaaatcc ggtagcgcgt gaacgtgttc acagtgcagc 4620
gactatcgcg ggtatcgcgt ttgcgaacgc cttcctgggt gtatgtcact caatggcgca 4680
caaactgggt tcccagttcc atattccgca cggtctggca aacgccctgc tgatttgtaa 4740
cgttattcgc tacaatgcga acgacaaccc gaccaagcag actgcattca gccagtatga 4800
ccgtccgcag gctcgccgtc gttatgctga aattgccgac cacttgggtc tgagcgcacc 4860
gggcgaccgt actgctgcta agatcgagaa actgctggca tggctggaaa cgctgaaagc 4920
tgaactgggt attccgaaat ctatccgtga agctggcgtt caggaagcag acttcctggc 4980
gaacgtggat aaactgtctg aagatgcatt cgatgaccag tgcaccggcg ctaacccgcg 5040
ttacccgctg atctccgagc tgaaacagat tctgctggat acctactacg gtcgtgatta 5100
tgtagaaggt gaaactgcag cgaagaaaga agctgctccg gctaaagctg agaaaaaagc 5160
gaaaaaatcc gcttaagtcg agagcttttg attaagcctt ctagtccaaa aaacacgttt 5220
ttttgtcatt tatttcattt tcttagaata gtttagttta ttcattttat agtcacgaat 5280
gttttatgat tctatatagg gttgcaaaca agcatttttc attttatgtt aaaacaattt 5340
caggtttacc ttttattctg cttgtggtga cgcgtgtatc cgcccgctct tttggtcacc 5400
catgtattta attgcataaa taattcttaa aagtggagct agtctatttc tatttacata 5460
cctctcattt ctcatttcct cctaatgtgt caatgatcat attcttaact ggaccgatct 5520
tattcgtcag attcaaacca aaagttctta gggctaccac aggaggaaaa ttagtgtgat 5580
ataatttaaa taatttatcc gccattccta atagaacgtt gttcgacgga tatctttctg 5640
cccaaaaggg ttctaagctc aatgaagagc caatgtctaa acctcgttac attgaaaata 5700
cagtaaatgg ttccaccatt attatgttgg tcttgtttag tatggccgat cggcgtgtgt 5760
tttgtttgca ccttttatat agtagaagaa tatttgtctt aattcttatt agtactgcaa 5820
cctaaccact aattatcaac aattattgga ttatataaag gaggtaaatt gccggattaa 5880
aatcaaatat cattcatcaa caagtattca tattgtcggc atatttttac atgcggtgta 5940
agtatttgga tcgtattctt atagtgtcaa tacctcgaag cagcgtttca agtaccagac 6000
gtatgtagga actttttaac gtcgagtccg taagatttga tcagtattaa aaaaatctag 6060
ataaatgagt ggtacaaata aaaacatcat taaaaatcgt taaataaaaa agtatgaaga 6120
tcatctatta aagtattagt agccattagc cttaaaaaaa tcagtgctag tttaagtata 6180
atctcgggcg cgccggccga ggcggttaag cggatttttt cgcttttttc tcagctttag 6240
ccggagcagc ttctttcttc gctgcagttt caccttctac ataatcacga ccgtagtagg 6300
tatccagcag aatctgtttc agctcggaga tcagcgggta acgcgggtta gcgccggtgc 6360
actggtcatc gaatgcatct tcagacagtt tatccacgtt cgccaggaag tctgcttcct 6420
gaacgccagc ttcacggata gatttcggaa tacccagttc agctttcagc gtttccagcc 6480
atgccagcag tttctcgatc ttagcagcag tacggtcgcc cggtgcgctc agacccaagt 6540
ggtcggcaat ttcagcataa cgacggcgag cctgcggacg gtcatactgg ctgaatgcag 6600
tctgcttggt cgggttgtcg ttcgcattgt agcgaataac gttacaaatc agcagggcgt 6660
ttgccagacc gtgcggaata tggaactggg aacccagttt gtgcgccatt gagtgacata 6720
cacccaggaa ggcgttcgca aacgcgatac ccgcgatagt cgctgcactg tgaacacgtt 6780
cacgcgctac cggattttta gacccttcgt ggtaggacgc tggcagatat tctttcagca 6840
gtttcagtgc ctgcagagcc tgaccatcag agaactcaga tgccagtaca gaaacataag 6900
cttccatggc gtgagttact gcgtccagac caccgaaagc acacagggac ttcggcatgt 6960
ccataaccag gttggcgtcg acaatcgcca tatccggagt cagcgcatag tctgccagcg 7020
gatatttctg accagtagcg tcgtcagtta caaccgcaaa cggagtgact tcagaacctg 7080
taccagaagt ggtggtgaca gcgatcattt tcgctttcac gcccattttc gggaacttgt 7140
agatacgttt acggatatcc ataaagcgca gcgccagctc ttcgaagtga gtttccggat 7200
gttcgtacat aacccacatg atcttcgcgg cgtccatcgg ggaaccacca cccagcgcga 7260
taatcacgtc tggtttgaag gagtttgcca gttctgcacc tttacgaacg atgctcaggg 7320
tcgggtccgc ttctacttcg aagaagactt cagtttcaac gcctgctgct ttcagtacgg 7380
aagtgatctg atcagcataa ccattgttga acaggaagcg gtcagtcacg atgagcgcac 7440
gtttgtggcc atcagtaatc acttcatcca gcgcgattgg cagggagcca cggcggaagt 7500
agatagattt cggaagtttg tgccacaaca tgttttcagc tcgcttagca acggttttct 7560
tgttgatcag gtgtttcgga ccaacgtttt cagagatgga gttaccaccc caagaaccac 7620
aacccagagt cagggaaggt gcgagtttga agttatacag gtcaccgata ccaccctgag 7680
acgctggggt gttaatcagg atacgcgccg ttttcatttt ctgaccgaag taagaaacgc 7740
gagccggttg gttatcctgg tcagtgtaca ggcaagaggt atgaccgata ccgcccatag 7800
caaccagttt ctctgctttt tctaccgcgt cttcgaaatc tttagcgcgg tacattgcca 7860
gagtcgggga cagtttttca tgtgcgaacg gttcgctttc atcaacaacg gtcacttcac 7920
cgatcagaat cttggtgttt tctggtacag agaagcctgc cagttcagca attttatagg 7980
ctggctgacc aacgatagcc gcgttcagcg caccgttttt caggataaca tcctgaacag 8040
ctttcagctc tttaccctgc aacagatagc cgccgtgggt tgcaaaacgt tcacgtacag 8100
cgtcataaac agagtcaaca acaacaacag actgttcaga agcacagatt acgccgttgt 8160
cgaaggtttt ggacatcagt acagatgcaa ctgcacgttt gatatcagca gtttcatcga 8220
taacaactgg agtgttgccc gcgcctacac cgatagctgg tttaccggag ctgtatgcgg 8280
ctttaaccat gcccggacca ccagtcgcga ggatcaggtt gatgtctggg tggtgcatca 8340
gtgcgttaga cagttcaaca gaaggttgat cgatccagcc gatcagatct ttcggagcac 8400
cggcagcgat agcagcctgc agaacgatat cagccgcttt gttggtggca tcttttgcac 8460
gcgggtgcgg ggagaagata atggcgttac gggtcttcag actgatcagc gatttgaaga 8520
tagcagttga agtcgggtta gtggtcggaa cgataccgca aataataccg attggttcag 8580
cgatagtgat ggtaccaaaa gtgtcgtctt cagacagaac accacaggtt ttttcatctt 8640
tataggcgtt gtagatatat tcagaagcaa agtggttttt gatcacttta tcttcgacga 8700
tacccatgcc ggattcggca acggccattt tcgcgagtgg gattcgagca tctgcagcag 8760
ccagagcggc ggcgcggaag attttgtcta cttgctcttg agtgaaactg gcatattcac 8820
gctgggcttt ttttacacgc tctacgagtg cgttaagttc agcgacatta gtaacagcca 8880
taattcttaa ttaactttga tatgattttg tttcagattt tttatataaa agctttccca 8940
aatagtgcta aagtgaactt agattttttg gtacctgttt cgaaattaaa aatagaaaaa 9000
tttctctccc tatattgtta ttcttacttc aaatttgttt atcgtttatt tactaggcga 9060
gacttgagta gacgacaatc caaatagaat taacagattt tattggtaga aagcaataat 9120
attctttaga tggttgagaa taaagaagta aaaaaaccag taaagagaaa aagaaaagga 9180
agaaaattaa agaaaaagga tgattacaca agaagataat aaaaaaactc ctttattaag 9240
agcggaagaa tttaataatg aagatgggaa taagcaaaac aaaaacaaag aagggaaaaa 9300
aaataaaaaa tcgtatttat ttatttaaaa aatcatgttg atgacgacaa tggaaaaaaa 9360
aaaccgattt cactttctca tccttatatt tttcaaaggt tgatgcaagt cgatctcaaa 9420
tcggataacg ctgccaactg ggaaattccg caattccgca agaaaaaaaa aaatgtgaaa 9480
acgtgattgc attttttaca ggtcctaaag gatttagccc acatatcaag agggtggcag 9540
taattgcact gattaagcat tcgtcagcat taggcgaatg tgtgcatgaa tattgccagt 9600
gtgctcgata ttagagagta cattgaagaa tattgtaccg gattatgtac aataactttg 9660
ttaatgagat attaattttc ttttttacta gccgctatcc catgcacgat gctaaatttc 9720
aagaagaaac tgagatttaa aaaattagtg gaagctgata aaacggacta taatggtgta 9780
tggattgagg aatctcgaca tgtttttcca tcgttttcaa cgatgactgt aacccgtaga 9840
ttgaaccagg catgccaaag ttagttagat cagggtaaaa attatagatg aggtatttat 9900
tggagaaaga taacatatca tactttcccc cacttttttc gaggctcttc tatatcatat 9960
tcataaatta gcattatgtc atttctcata actactttat cacgttagaa attacttatt 10020
attattaaat taatacaaaa tttagtaacc aaataaatat aaataaatat gtatatttaa 10080
attttaaaaa aaaaatccta tagagcaaaa ggattttcca ttataatatt agctgtacac 10140
ctcttccgca ttttttgagg gtggttacaa caccactcat tcagaggctg tcggcacagt 10200
tgcttctagc atctggcgtc cgtatgtatg ggtgtatttt aaataataaa caaagtgcca 10260
caccttcacc aattatgtct ttaagaaatg gacaagttcc aaagagcttg cccaaggctc 10320
gacaaggatg tactttggaa tatctatatt caagtacgtg gcgcgcatat gtttgagtgt 10380
gcacacaata aaggttttta gatattttgc ggcgtcctaa gaaaataagg ggtttcttaa 10440
aaaataacaa tagcaaacaa agttccttac gatgatttca gatgtgaata gcatggtcat 10500
gatgagtata tacgttttta taaataatta aaagttttcc tcttgtctgt ttttttgttg 10560
gctcgtggtt gttctcgaaa aaggagagtt ttcattttcg aaataggtga ttatcatcat 10620
gttgttatca ccccacgacg aagataatac ggagctcacc gttttctttt tttttccctt 10680
tggctgaaat ttcccaccag aacaaacgtg acaaaattat ctttgaatcc aaagtagctt 10740
atatatatac gtagaagtgt ttcgagacac acatccaaat acgaggttgt tcaatttaaa 10800
cccaagaata cataaaaaaa atatagatat attaacttag taaacaatga ctgcaagcac 10860
accatccaat gtcatgacat tgttcttgtt aaggcatgga caaagtgaat tgaatcacga 10920
gaatatattc tgtggttgga ttgacgctaa gctaaccgaa aaaggtaaag aacaagctcg 10980
tcattctgcc gagctaatcg aacaatattg taaagctaat aatttgagat taccccagat 11040
tggttacacc tcacgtttaa ttaggaccca acagaccata gaaacgatgt gtgaagaatt 11100
taagttaaag ccacaactgc aggttgttta cgactttaat aaaatcaaac ttggagacga 11160
atttggcagt gatgacaagg ataatatgaa aatcccgatt cttcaaactt ggaggctaaa 11220
tgaacgtcat tacggttcct ggcagggcca gaggaaaccg aatgttttaa aagaatatgg 11280
taaggataaa tatatgttca ttaggagaga ttacgagggt aagccaccac ctgtagatct 11340
tgaccgtgag atgattcaac aagaaaatga gaagggctct tctactgggt acgaattcaa 11400
ggagccaaac agacaaataa aatatgaatt ggaatgcagc aatcatgaca ttgtattacc 11460
ggattccgaa tctcttcgtg aagtggttta tagattgaat ccttttctac aaaatgtcat 11520
attaaaatta gccaatcaat atgatgaatc ttcatgcctg attgtgggcc atggaagttc 11580
agtgagatcg ctactgaaaa ttctggaggg tatatcagat gatgacatca agaatgttga 11640
tattccaaat ggtatcccct tagtcgttga attagataag aataatggtc ttaagtttat 11700
cagaaaattc tacctagatc ctgaatctgc taagatcaat gctgagaaag tccgtaatga 11760
gggtttcata aaaaatcctt aaggggggta agtatataat ataattgtgt attttccgaa 11820
gtataatgaa aaccaataga aaacttatta taagtccaat gaggtacttt aaaaatgtga 11880
tatttataag aacattcctg aatgcagata tatgatatat attgtaaata tatatagatg 11940
tgtatatgta tttccatttt gtgtgaggtt ttcttctttt atctcctata taatttgtaa 12000
ccttaattaa cccatgacat aaccaatatt agcctttgca aattttgtaa cttcttgacg 12060
ttgttctaac gacaaatctt catgcttcga ttttatatgc cttgttaaag catccagtct 12120
cgaaaacgtc ttctgatagc cctcagatcc aagaattttt atacactccg agcaacggaa 12180
gacaatcttc cttttagcgt gaatggtatt ttggtgtctc gttaaatcat aggaccttga 12240
aaattgggca ccacacggtt catttgtaat gagattcatt atctgacacg taaatatttc 12300
gttattaccg tcagaagatg acgtatgggc cgatggtgat gcagtcgaag gtttcgaatt 12360
cgaatttgta gatgaatgtg aagataagtg cttc 12394
<210> 99
<211> 13300
<212> DNA
<213> 大肠杆菌
<220>
<221> 杂项特征
<223> 在GPD1基因座的M2158 AADH整合
<400> 99
cagaattggt gatattcttc attatcccct cgacatcttt acttttgatc agctttgtgt 60
atagcgggat atccgattgg aacttggctt cagcaacaaa cttgccaaag tggattctcc 120
tactcaagct ttgcaaacat tctatatctc tagtggcaac agaaccgaag ttattcttat 180
catcaccatc tcttttcgaa attaatggta taatcttttc aatataaact ttttttattt 240
tatcattgta attaacttct ggggcataag gcgccaaaat ttgtgggtag ttaatgctcg 300
gtaagaatga tttctgaatc ttgtcaggaa agaagggagt ttcatcaggt gattcgaatc 360
ttctgatgcg agaatgcgca atttcaagat ttgaaagagc ccaatccaag aaagatcctt 420
taaaattcgg aatttctaaa cctggatggt ttgcctcata aactgaagga catgtggcga 480
aatgcgacct ctcaataaat ttgaagatga tcgaatcctc cattctaact aattcatctc 540
taatattttg tagatttaaa acagtttctg gttttgtgaa atccatatct tataccaatt 600
ttatgcagga tgctgagtgc tatttgttag caaaacggaa tcgatgtttc aacttttcaa 660
tacttttttt cttcttttct tcgaacttcg aagattatag agatccattg aaaatttacg 720
ataaaggaaa tgcaacacga agtttgaaaa aaagttgata ttgaaaaaaa aaaaaaaaga 780
gaaccaaaaa aaaattaaaa aacgtgaaaa cgatggttta acaacttttt tcgaatttgg 840
tatacgtgga aaaacgaatg tatagatgca tttttaaaga atatatataa aatttagtaa 900
ttgtattccg cgagcggcgc aataggtgat ttcatttagc tgctttcagt ttgcgtatca 960
tttcttcatt gatcttggct tctctatcta aatcctcttt cgacttgtaa agtccccaag 1020
ttctaaacca taagaaccgc ctcaatctgg aaaatttgtc agtatcaaga ccataattcg 1080
tgtatgactg aatcaaatgt aatccacttt cgtcatgagt aaattcggcc ttgctcagag 1140
actcctggat tttggctaac aacgcagtcc cttcgatgca tatagctagg ccacaaatta 1200
tgccaataac ggtccatggg ttgatgtttt cttgaattct ttcgtttttc atgctatttg 1260
cgtcttccca agtcccagcg ttccagtatt catactgcgc gttagagtgg tagccataag 1320
agccggcata ttggtaattt tcagtattaa cgttagaacg tggtgaatac gatgtggtcc 1380
agccttgcct cgttgtgtca tatacgatct ttttctttgg gtcacaaaga atatcatatg 1440
cttgagagat gactttaaat ctatgtagtt tttcgcttga tgttagcagc agcggtgatt 1500
tactatcact gttggtaacc ttttctgagc taaatatttg aatgttatcg gaatggtcag 1560
ggtggtacaa ttttacataa cgatgatatt ttttttttaa cgacttcttg tccagtttag 1620
gatttccaga tccggccttt ggaatgccaa aaatatcata gggagttgga tctgccaact 1680
caggccattg ttcatccctt atcgtaagtt ttctattgcc atttttatcg ttcgctgtag 1740
catacttagc tataaaagtg atttgtgggg gacacttttc tacacatgat aagtgccact 1800
tgaataaaaa tgggtatacg aacttatggt gtagcataac aaatatattg caagtagtga 1860
cctatggtgt gtagatatac gtacagttag ttacgagcct aaagacacaa cgtgtttgtt 1920
aattatactg tcgctgtaat atcttctctt ccattatcac cggtcattcc ttgcaggggc 1980
ggtagtaccc ggagaccctg aacttttctt tttttttttg cgaaattaaa aagttcattt 2040
tcaattcgac aatgagatct acaagccatt gttttatgtt gatgagagcc agcttaaaga 2100
gttaaaaatt tcatagctac tagtcttcta ggcgggttat ctactgatcc gagcttccac 2160
taggatagca cccaaacacc tgcatatttg gacgaccttt acttacacca ccaaaaacca 2220
ctttcgcctc tcccgcccct gataacgtcc actaattgag cgattacctg agcggtcctc 2280
ttttgtttgc agcatgagac ttgcatactg caaatcgtaa gtagcaacgt ctcaaggtca 2340
aaactgtatg gaaaccttgt cacctcactt aattctagct agcctaccct gcaagtcaag 2400
aggtctccgt gattcctagc cacctcaagg tatgcctctc cccggaaact gtggcctttt 2460
ctggcacaca tgatctccac gatttcaaca tataaatagc ttttgataat ggcaatatta 2520
atcaaattta ttttacttct ttcttgtaac atctctcttg taatccctta ttccttctag 2580
ctatttttca taaaaaacca agcaactgct tatcaacaca caaacactaa atcaaaatgg 2640
ctgttactaa tgtcgctgaa cttaacgcac tcgtagagcg tgtaaaaaaa gcccagcgtg 2700
aatatgccag tttcactcaa gagcaagtag acaaaatctt ccgcgccgcc gctctggctg 2760
ctgcagatgc tcgaatccca ctcgcgaaaa tggccgttgc cgaatccggc atgggtatcg 2820
tcgaagataa agtgatcaaa aaccactttg cttctgaata tatctacaac gcctataaag 2880
atgaaaaaac ctgtggtgtt ctgtctgaag acgacacttt tggtaccatc actatcgctg 2940
aaccaatcgg tattatttgc ggtatcgttc cgaccactaa cccgacttca actgctatct 3000
tcaaatcgct gatcagtctg aagacccgta acgccattat cttctccccg cacccgcgtg 3060
caaaagatgc caccaacaaa gcggctgata tcgttctgca ggctgctatc gctgccggtg 3120
ctccgaaaga tctgatcggc tggatcgatc aaccttctgt tgaactgtct aacgcactga 3180
tgcaccaccc agacatcaac ctgatcctcg cgactggtgg tccgggcatg gttaaagccg 3240
catacagctc cggtaaacca gctatcggtg taggcgcggg caacactcca gttgttatcg 3300
atgaaactgc tgatatcaaa cgtgcagttg catctgtact gatgtccaaa accttcgaca 3360
acggcgtaat ctgtgcttct gaacagtctg ttgttgttgt tgactctgtt tatgacgctg 3420
tacgtgaacg ttttgcaacc cacggcggct atctgttgca gggtaaagag ctgaaagctg 3480
ttcaggatgt tatcctgaaa aacggtgcgc tgaacgcggc tatcgttggt cagccagcct 3540
ataaaattgc tgaactggca ggcttctctg taccagaaaa caccaagatt ctgatcggtg 3600
aagtgaccgt tgttgatgaa agcgaaccgt tcgcacatga aaaactgtcc ccgactctgg 3660
caatgtaccg cgctaaagat ttcgaagacg cggtagaaaa agcagagaaa ctggttgcta 3720
tgggcggtat cggtcatacc tcttgcctgt acactgacca ggataaccaa ccggctcgcg 3780
tttcttactt cggtcagaaa atgaaaacgg cgcgtatcct gattaacacc ccagcgtctc 3840
agggtggtat cggtgacctg tataacttca aactcgcacc ttccctgact ctgggttgtg 3900
gttcttgggg tggtaactcc atctctgaaa acgttggtcc gaaacacctg atcaacaaga 3960
aaaccgttgc taagcgagct gaaaacatgt tgtggcacaa acttccgaaa tctatctact 4020
tccgccgtgg ctccctgcca atcgcgctgg atgaagtgat tactgatggc cacaaacgtg 4080
cgctcatcgt gactgaccgc ttcctgttca acaatggtta tgctgatcag atcacttccg 4140
tactgaaagc agcaggcgtt gaaactgaag tcttcttcga agtagaagcg gacccgaccc 4200
tgagcatcgt tcgtaaaggt gcagaactgg caaactcctt caaaccagac gtgattatcg 4260
cgctgggtgg tggttccccg atggacgccg cgaagatcat gtgggttatg tacgaacatc 4320
cggaaactca cttcgaagag ctggcgctgc gctttatgga tatccgtaaa cgtatctaca 4380
agttcccgaa aatgggcgtg aaagcgaaaa tgatcgctgt caccaccact tctggtacag 4440
gttctgaagt cactccgttt gcggttgtaa ctgacgacgc tactggtcag aaatatccgc 4500
tggcagacta tgcgctgact ccggatatgg cgattgtcga cgccaacctg gttatggaca 4560
tgccgaagtc cctgtgtgct ttcggtggtc tggacgcagt aactcacgcc atggaagctt 4620
atgtttctgt actggcatct gagttctctg atggtcaggc tctgcaggca ctgaaactgc 4680
tgaaagaata tctgccagcg tcctaccacg aagggtctaa aaatccggta gcgcgtgaac 4740
gtgttcacag tgcagcgact atcgcgggta tcgcgtttgc gaacgccttc ctgggtgtat 4800
gtcactcaat ggcgcacaaa ctgggttccc agttccatat tccgcacggt ctggcaaacg 4860
ccctgctgat ttgtaacgtt attcgctaca atgcgaacga caacccgacc aagcagactg 4920
cattcagcca gtatgaccgt ccgcaggctc gccgtcgtta tgctgaaatt gccgaccact 4980
tgggtctgag cgcaccgggc gaccgtactg ctgctaagat cgagaaactg ctggcatggc 5040
tggaaacgct gaaagctgaa ctgggtattc cgaaatctat ccgtgaagct ggcgttcagg 5100
aagcagactt cctggcgaac gtggataaac tgtctgaaga tgcattcgat gaccagtgca 5160
ccggcgctaa cccgcgttac ccgctgatct ccgagctgaa acagattctg ctggatacct 5220
actacggtcg tgattatgta gaaggtgaaa ctgcagcgaa gaaagaagct gctccggcta 5280
aagctgagaa aaaagcgaaa aaatccgctt aagtcgagag cttttgatta agccttctag 5340
tccaaaaaac acgttttttt gtcatttatt tcattttctt agaatagttt agtttattca 5400
ttttatagtc acgaatgttt tatgattcta tatagggttg caaacaagca tttttcattt 5460
tatgttaaaa caatttcagg tttacctttt attctgcttg tggtgacgcg tgtatccgcc 5520
cgctcttttg gtcacccatg tatttaattg cataaataat tcttaaaagt ggagctagtc 5580
tatttctatt tacatacctc tcatttctca tttcctccta atgtgtcaat gatcatattc 5640
ttaactggac cgatcttatt cgtcagattc aaaccaaaag ttcttagggc taccacagga 5700
ggaaaattag tgtgatataa tttaaataat ttatccgcca ttcctaatag aacgttgttc 5760
gacggatatc tttctgccca aaagggttct aagctcaatg aagagccaat gtctaaacct 5820
cgttacattg aaaatacagt aaatggttcc accattatta tgttggtctt gtttagtatg 5880
gccgatcggc gtgtgttttg tttgcacctt ttatatagta gaagaatatt tgtcttaatt 5940
cttattagta ctgcaaccta accactaatt atcaacaatt attggattat ataaaggagg 6000
taaattgccg gattaaaatc aaatatcatt catcaacaag tattcatatt gtcggcatat 6060
ttttacatgc ggtgtaagta tttggatcgt attcttatag tgtcaatacc tcgaagcagc 6120
gtttcaagta ccagacgtat gtaggaactt tttaacgtcg agtccgtaag atttgatcag 6180
tattaaaaaa atctagataa atgagtggta caaataaaaa catcattaaa aatcgttaaa 6240
taaaaaagta tgaagatcat ctattaaagt attagtagcc attagcctta aaaaaatcag 6300
tgctagttta agtataatct cgggcgcgcc ggccgaggcg gttaagcgga ttttttcgct 6360
tttttctcag ctttagccgg agcagcttct ttcttcgctg cagtttcacc ttctacataa 6420
tcacgaccgt agtaggtatc cagcagaatc tgtttcagct cggagatcag cgggtaacgc 6480
gggttagcgc cggtgcactg gtcatcgaat gcatcttcag acagtttatc cacgttcgcc 6540
aggaagtctg cttcctgaac gccagcttca cggatagatt tcggaatacc cagttcagct 6600
ttcagcgttt ccagccatgc cagcagtttc tcgatcttag cagcagtacg gtcgcccggt 6660
gcgctcagac ccaagtggtc ggcaatttca gcataacgac ggcgagcctg cggacggtca 6720
tactggctga atgcagtctg cttggtcggg ttgtcgttcg cattgtagcg aataacgtta 6780
caaatcagca gggcgtttgc cagaccgtgc ggaatatgga actgggaacc cagtttgtgc 6840
gccattgagt gacatacacc caggaaggcg ttcgcaaacg cgatacccgc gatagtcgct 6900
gcactgtgaa cacgttcacg cgctaccgga tttttagacc cttcgtggta ggacgctggc 6960
agatattctt tcagcagttt cagtgcctgc agagcctgac catcagagaa ctcagatgcc 7020
agtacagaaa cataagcttc catggcgtga gttactgcgt ccagaccacc gaaagcacac 7080
agggacttcg gcatgtccat aaccaggttg gcgtcgacaa tcgccatatc cggagtcagc 7140
gcatagtctg ccagcggata tttctgacca gtagcgtcgt cagttacaac cgcaaacgga 7200
gtgacttcag aacctgtacc agaagtggtg gtgacagcga tcattttcgc tttcacgccc 7260
attttcggga acttgtagat acgtttacgg atatccataa agcgcagcgc cagctcttcg 7320
aagtgagttt ccggatgttc gtacataacc cacatgatct tcgcggcgtc catcggggaa 7380
ccaccaccca gcgcgataat cacgtctggt ttgaaggagt ttgccagttc tgcaccttta 7440
cgaacgatgc tcagggtcgg gtccgcttct acttcgaaga agacttcagt ttcaacgcct 7500
gctgctttca gtacggaagt gatctgatca gcataaccat tgttgaacag gaagcggtca 7560
gtcacgatga gcgcacgttt gtggccatca gtaatcactt catccagcgc gattggcagg 7620
gagccacggc ggaagtagat agatttcgga agtttgtgcc acaacatgtt ttcagctcgc 7680
ttagcaacgg ttttcttgtt gatcaggtgt ttcggaccaa cgttttcaga gatggagtta 7740
ccaccccaag aaccacaacc cagagtcagg gaaggtgcga gtttgaagtt atacaggtca 7800
ccgataccac cctgagacgc tggggtgtta atcaggatac gcgccgtttt cattttctga 7860
ccgaagtaag aaacgcgagc cggttggtta tcctggtcag tgtacaggca agaggtatga 7920
ccgataccgc ccatagcaac cagtttctct gctttttcta ccgcgtcttc gaaatcttta 7980
gcgcggtaca ttgccagagt cggggacagt ttttcatgtg cgaacggttc gctttcatca 8040
acaacggtca cttcaccgat cagaatcttg gtgttttctg gtacagagaa gcctgccagt 8100
tcagcaattt tataggctgg ctgaccaacg atagccgcgt tcagcgcacc gtttttcagg 8160
ataacatcct gaacagcttt cagctcttta ccctgcaaca gatagccgcc gtgggttgca 8220
aaacgttcac gtacagcgtc ataaacagag tcaacaacaa caacagactg ttcagaagca 8280
cagattacgc cgttgtcgaa ggttttggac atcagtacag atgcaactgc acgtttgata 8340
tcagcagttt catcgataac aactggagtg ttgcccgcgc ctacaccgat agctggttta 8400
ccggagctgt atgcggcttt aaccatgccc ggaccaccag tcgcgaggat caggttgatg 8460
tctgggtggt gcatcagtgc gttagacagt tcaacagaag gttgatcgat ccagccgatc 8520
agatctttcg gagcaccggc agcgatagca gcctgcagaa cgatatcagc cgctttgttg 8580
gtggcatctt ttgcacgcgg gtgcggggag aagataatgg cgttacgggt cttcagactg 8640
atcagcgatt tgaagatagc agttgaagtc gggttagtgg tcggaacgat accgcaaata 8700
ataccgattg gttcagcgat agtgatggta ccaaaagtgt cgtcttcaga cagaacacca 8760
caggtttttt catctttata ggcgttgtag atatattcag aagcaaagtg gtttttgatc 8820
actttatctt cgacgatacc catgccggat tcggcaacgg ccattttcgc gagtgggatt 8880
cgagcatctg cagcagccag agcggcggcg cggaagattt tgtctacttg ctcttgagtg 8940
aaactggcat attcacgctg ggcttttttt acacgctcta cgagtgcgtt aagttcagcg 9000
acattagtaa cagccataat tcttaattaa ctttgatatg attttgtttc agatttttta 9060
tataaaagct ttcccaaata gtgctaaagt gaacttagat tttttggtac ctgtttcgaa 9120
attaaaaata gaaaaatttc tctccctata ttgttattct tacttcaaat ttgtttatcg 9180
tttatttact aggcgagact tgagtagacg acaatccaaa tagaattaac agattttatt 9240
ggtagaaagc aataatattc tttagatggt tgagaataaa gaagtaaaaa aaccagtaaa 9300
gagaaaaaga aaaggaagaa aattaaagaa aaaggatgat tacacaagaa gataataaaa 9360
aaactccttt attaagagcg gaagaattta ataatgaaga tgggaataag caaaacaaaa 9420
acaaagaagg gaaaaaaaat aaaaaatcgt atttatttat ttaaaaaatc atgttgatga 9480
cgacaatgga aaaaaaaaac cgatttcact ttctcatcct tatatttttc aaaggttgat 9540
gcaagtcgat ctcaaatcgg ataacgctgc caactgggaa attccgcaat tccgcaagaa 9600
aaaaaaaaat gtgaaaacgt gattgcattt tttacaggtc ctaaaggatt tagcccacat 9660
atcaagaggg tggcagtaat tgcactgatt aagcattcgt cagcattagg cgaatgtgtg 9720
catgaatatt gccagtgtgc tcgatattag agagtacatt gaagaatatt gtaccggatt 9780
atgtacaata actttgttaa tgagatatta attttctttt ttactagccg ctatcccatg 9840
cacgatgcta aatttcaaga agaaactgag atttaaaaaa ttagtggaag ctgataaaac 9900
ggactataat ggtgtatgga ttgaggaatc tcgacatgtt tttccatcgt tttcaacgat 9960
gactgtaacc cgtagattga accaggcatg ccaaagttag ttagatcagg gtaaaaatta 10020
tagatgaggt ttaattaaac aagcacgcag cacgctgtat ttacgtattt aattttatat 10080
atttgtgcat acactactag ggaagacttg aaaaaaacct aggaaatgaa aaaacgacac 10140
aggaagtccc gtatttacta ttttttcctt ccttttgatg gggcagggcg gaaatagagg 10200
ataggataag cctactgctt agctgtttcc gtctctactt cggtagttgt ctcaattgtc 10260
gtttcagtat tacctttaga gccgctagac gatggttgag ctatttgttg agggaaaact 10320
aagttcatgt aacacacgca taacccgatt aaactcatga atagcttgat tgcaggaggc 10380
tggtccattg gagatggtgc cttattttcc ttataggcaa cgatgatgtc ttcgtcggtg 10440
ttcaggtagt agtgtacact ctgaatcagg gagaaccagg caatgaactt gttcctcaag 10500
aaaatagcgg ccataggcat ggattggtta accacaccag atatgcttgg tgtggcagaa 10560
tatagtcctt ttggtggcgc aattttcttg tacctgtggt agaaagggag cggttgaact 10620
gttagtatat attggcaata tcagcaaatt tgaaagaaaa ttgtcggtga aaaacatacg 10680
aaacacaaag gtcgggcctt gcaacgttat tcaaagtcat tgtttagttg aggaggtagc 10740
agcggagtat atgtattcct tttttttgcc tatggatgtt gtaccatgcc cattctgctc 10800
aagcttttgt taaaattatt tttcagtatt ttttcttcca tgttgcgcgt tacgagaaca 10860
gaagcgacag ataaccgcaa tcatacaact agcgctactg cggggtgtaa aaagcacaag 10920
aactaagcca agatcacaac agttatcgat aaaatagcag tgtttgcatg gccattgaga 10980
aggacaacat tggcgtgcgc gccaatgttg tctcaccatg tagctccaaa cgagttgtaa 11040
gagacggacc gctcacgctt ccgaagcggt cagaaaacgc ttcccagtat gcagttgacc 11100
tacattcaac ctgcaaatat tgctttgctt caagaaatga ttacacagac gtctattttc 11160
ttctacataa tgcacgaaac ttgggcattt agtcatgtag ccgcctagcg agcctgggtg 11220
ccgtcctatc tcctttgttc gtgcaaagag acaggaacac acactgcgtt ctcttgcggc 11280
cggtctggcg gactcagggg tgcggcgttt gcttaaccgg agggaataat aaaatcgggg 11340
tgacgcaagt atgaagtcat gtgtgcttag caattacgta gagggattag aaataatagt 11400
gtgcggttat cggaaccggc tcttgttccc gtttagagca acccaggtgc aggcgtactt 11460
taaagtattt tctttctttt ttttcctgct acttacgcta ggagctgccg cagctgcaaa 11520
gccgacgtcg gagaggcagg tgatcttcgg ctcggccgac aaatcccctg gatatcattg 11580
gcctgtcgag gtatcggccg cgtggaacta ccgggaatta ctatgcaaaa caattggaaa 11640
tctggtagga aaaccttgtt ctagaacttg gcgattgctg acaaagaaga aaagggccta 11700
ttgttgctgc ctcttttgtt gttcttcctc gtattgtctt gccggtgttc tttgtgtctt 11760
ttgtgtgtag gttcttacta ttatagtgct ctttgctatt atattttctt cgttttcact 11820
ttgcgtaatg taacggtctt aaacaaagtt tttttttttt cgctcttgca ttttcctttt 11880
ctgctctatc ttatttgcta attgtagttt cagaagtttt acttaaatat agcactattt 11940
tccagtttta atgtttcttc tcattgcttt cttttataat tttcgcatat aattatacat 12000
ttacggtgtc ttaactctcc ctcttcaccc ctcattattc cagaaaatac taatacttct 12060
tcacacaaaa gaacgcagtt agacaatcaa caatgaatcc taaatcctct acacctaaga 12120
ttccaagacc caagaacgca tttattctgt tcagacagca ctaccacagg atcttaatag 12180
acgaatggac cgctcaaggt gtggaaatac cccataattc aaacatttct aaaattattg 12240
gtacgaagtg gaagggctta caaccggaag ataaggcaca ctgggaaaat ctagcggaga 12300
aggagaaact agaacatgaa aggaagtatc ctgaatacaa atacaagccg gtaagaaagt 12360
ctaagaagaa gcaactactt ttgaaggaaa tcgagcaaca gcagcagcaa caacagaaag 12420
aacagcagca gcagaaacag tcacaaccgc aattacaaca gccctttaac aacaatatag 12480
ttcttatgaa aagagcacat tctctttcac catcttcctc ggtgtcaagc tcgaacagct 12540
atcagttcca attgaacaat gatcttaaga ggttgcctat tccttctgtt aatacttcta 12600
actatatggt ctccagatct ttaagtggac tacctttgac gcatgataag acggcaagag 12660
acctaccaca gctgtcatct caactaaatt ctattccata ttactcagct ccacacgacc 12720
cttcaacgag acatcattac ctcaacgtcg ctcaagctca accaagggct aactcgaccc 12780
ctcaattgcc ctttatttca tccattatca acaacagcag tcaaacaccg gtaactacaa 12840
ctaccacatc cacaacaact gcgacatctt ctcctgggaa attctcctct tctccgaact 12900
cctctgtact ggagaacaac agattaaaca gtatcaacaa ttcaaatcaa tatttacctc 12960
cccctctatt accttctctg caagattttc aactggatca gtaccagcag ctaaagcaga 13020
tgggaccaac ttatattgtc aaaccactgt ctcacaccag gaacaatcta ttgtccacaa 13080
ctacccctac gcatcatcac attcctcata taccaaacca aaacattcct ctacatcaaa 13140
ttataaactc aagcaacact gaggtcaccg ctaaaactag cctagtttct ccgaaatgat 13200
tttttttttc catttcttct ttccgttata ttatattata ctatattccc tttaactaaa 13260
aatttatgca tttggctcct gtttaataaa agtttaaatc 13300
<210> 100
<211> 910
<212> PRT
<213> 青春双岐杆菌
<400> 100
Met Ala Asp Ala Lys Lys Lys Glu Glu Pro Thr Lys Pro Thr Pro Glu
1 5 10 15
Glu Lys Leu Ala Ala Ala Glu Ala Glu Val Asp Ala Leu Val Lys Lys
20 25 30
Gly Leu Lys Ala Leu Asp Glu Phe Glu Lys Leu Asp Gln Lys Gln Val
35 40 45
Asp His Ile Val Ala Lys Ala Ser Val Ala Ala Leu Asn Lys His Leu
50 55 60
Val Leu Ala Lys Met Ala Val Glu Glu Thr His Arg Gly Leu Val Glu
65 70 75 80
Asp Lys Ala Thr Lys Asn Ile Phe Ala Cys Glu His Val Thr Asn Tyr
85 90 95
Leu Ala Gly Gln Lys Thr Val Gly Ile Ile Arg Glu Asp Asp Val Leu
100 105 110
Gly Ile Asp Glu Ile Ala Glu Pro Val Gly Val Val Ala Gly Val Thr
115 120 125
Pro Val Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ala
130 135 140
Leu Lys Thr Arg Cys Pro Ile Ile Phe Gly Phe His Pro Gly Ala Gln
145 150 155 160
Asn Cys Ser Val Ala Ala Ala Lys Ile Val Arg Asp Ala Ala Ile Ala
165 170 175
Ala Gly Ala Pro Glu Asn Cys Ile Gln Trp Ile Glu His Pro Ser Ile
180 185 190
Glu Ala Thr Gly Ala Leu Met Lys His Asp Gly Val Ala Thr Ile Leu
195 200 205
Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys
210 215 220
Pro Ala Leu Gly Val Gly Ala Gly Asn Ala Pro Ala Tyr Val Asp Lys
225 230 235 240
Asn Val Asp Val Val Arg Ala Ala Asn Asp Leu Ile Leu Ser Lys His
245 250 255
Phe Asp Tyr Gly Met Ile Cys Ala Thr Glu Gln Ala Ile Ile Ala Asp
260 265 270
Lys Asp Ile Tyr Ala Pro Leu Val Lys Glu Leu Lys Arg Arg Lys Ala
275 280 285
Tyr Phe Val Asn Ala Asp Glu Lys Ala Lys Leu Glu Gln Tyr Met Phe
290 295 300
Gly Cys Thr Ala Tyr Ser Gly Gln Thr Pro Lys Leu Asn Ser Val Val
305 310 315 320
Pro Gly Lys Ser Pro Gln Tyr Ile Ala Lys Ala Ala Gly Phe Glu Ile
325 330 335
Pro Glu Asp Ala Thr Ile Leu Ala Ala Glu Cys Lys Glu Val Gly Glu
340 345 350
Asn Glu Pro Leu Thr Met Glu Lys Leu Ala Pro Val Gln Ala Val Leu
355 360 365
Lys Ser Asp Asn Lys Glu Gln Ala Phe Glu Met Cys Glu Ala Met Leu
370 375 380
Lys His Gly Ala Gly His Thr Ala Ala Ile His Thr Asn Asp Arg Asp
385 390 395 400
Leu Val Arg Glu Tyr Gly Gln Arg Met His Ala Cys Arg Ile Ile Trp
405 410 415
Asn Ser Pro Ser Ser Leu Gly Gly Val Gly Asp Ile Tyr Asn Ala Ile
420 425 430
Ala Pro Ser Leu Thr Leu Gly Cys Gly Ser Tyr Gly Gly Asn Ser Val
435 440 445
Ser Gly Asn Val Gln Ala Val Asn Leu Ile Asn Ile Lys Arg Ile Ala
450 455 460
Arg Arg Asn Asn Asn Met Gln Trp Phe Lys Ile Pro Ala Lys Thr Tyr
465 470 475 480
Phe Glu Pro Asn Ala Ile Lys Tyr Leu Arg Asp Met Tyr Gly Ile Glu
485 490 495
Lys Ala Val Ile Val Cys Asp Lys Val Met Glu Gln Leu Gly Ile Val
500 505 510
Asp Lys Ile Ile Asp Gln Leu Arg Ala Arg Ser Asn Arg Val Thr Phe
515 520 525
Arg Ile Ile Asp Tyr Val Glu Pro Glu Pro Ser Val Glu Thr Val Glu
530 535 540
Arg Gly Ala Ala Met Met Arg Glu Glu Phe Glu Pro Asp Thr Ile Ile
545 550 555 560
Ala Val Gly Gly Gly Ser Pro Met Asp Ala Ser Lys Ile Met Trp Leu
565 570 575
Leu Tyr Glu His Pro Glu Ile Ser Phe Ser Asp Val Arg Glu Lys Phe
580 585 590
Phe Asp Ile Arg Lys Arg Ala Phe Lys Ile Pro Pro Leu Gly Lys Lys
595 600 605
Ala Lys Leu Val Cys Ile Pro Thr Ser Ser Gly Thr Gly Ser Glu Val
610 615 620
Thr Pro Phe Ala Val Ile Thr Asp His Lys Thr Gly Tyr Lys Tyr Pro
625 630 635 640
Ile Thr Asp Tyr Ala Leu Thr Pro Ser Val Ala Ile Val Asp Pro Val
645 650 655
Leu Ala Arg Thr Gln Pro Arg Lys Leu Ala Ser Asp Ala Gly Phe Asp
660 665 670
Ala Leu Thr His Ala Phe Glu Ala Tyr Val Ser Val Tyr Ala Asn Asp
675 680 685
Phe Thr Asp Gly Met Ala Leu His Ala Ala Lys Leu Val Trp Asp Asn
690 695 700
Leu Ala Glu Ser Val Asn Gly Glu Pro Gly Glu Glu Lys Thr Arg Ala
705 710 715 720
Gln Glu Lys Met His Asn Ala Ala Thr Met Ala Gly Met Ala Phe Gly
725 730 735
Ser Ala Phe Leu Gly Met Cys His Gly Met Ala His Thr Ile Gly Ala
740 745 750
Leu Cys His Val Ala His Gly Arg Thr Asn Ser Ile Leu Leu Pro Tyr
755 760 765
Val Ile Arg Tyr Asn Gly Ser Val Pro Glu Glu Pro Thr Ser Trp Pro
770 775 780
Lys Tyr Asn Lys Tyr Ile Ala Pro Glu Arg Tyr Gln Glu Ile Ala Lys
785 790 795 800
Asn Leu Gly Val Asn Pro Gly Lys Thr Pro Glu Glu Gly Val Glu Asn
805 810 815
Leu Ala Lys Ala Val Glu Asp Tyr Arg Asp Asn Lys Leu Gly Met Asn
820 825 830
Lys Ser Phe Gln Glu Cys Gly Val Asp Glu Asp Tyr Tyr Trp Ser Ile
835 840 845
Ile Asp Gln Ile Gly Met Arg Ala Tyr Glu Asp Gln Cys Ala Pro Ala
850 855 860
Asn Pro Arg Ile Pro Gln Ile Glu Asp Met Lys Asp Ile Ala Ile Ala
865 870 875 880
Ala Tyr Tyr Gly Val Ser Gln Ala Glu Gly His Lys Leu Arg Val Gln
885 890 895
Arg Gln Gly Glu Ala Ala Thr Glu Glu Ala Ser Glu Arg Ala
900 905 910
<210> 101
<211> 870
<212> PRT
<213> 凝结芽孢杆菌
<400> 101
Met Ala Ile Asp Glu Lys Val Val Gly Lys Ser Ala Gln Ile Thr Glu
1 5 10 15
Met Val Asp Ser Leu Val Ala Lys Gly Gln Lys Ala Leu Arg Glu Phe
20 25 30
Met Glu Leu Asp Gln Ala Gln Val Asp Asn Ile Val Lys Gln Met Ala
35 40 45
Leu Ala Gly Leu Glu Gln His Met Val Leu Ala Lys Met Ala Val Glu
50 55 60
Glu Thr Gly Arg Gly Val Tyr Glu Asp Lys Met Thr Lys Asn Leu Phe
65 70 75 80
Ala Thr Glu Tyr Ile Tyr His Asn Ile Lys Tyr Asn Lys Thr Val Gly
85 90 95
Ile Ile Asp Glu Asn Asn Asn Glu Gly Ile Val Lys Phe Ala Glu Pro
100 105 110
Val Gly Val Ile Ala Gly Val Thr Pro Val Thr Asn Pro Thr Ser Thr
115 120 125
Thr Met Phe Lys Ala Leu Ile Ala Ile Lys Thr Arg Asn Pro Ile Ile
130 135 140
Phe Ala Phe His Pro Ser Ala Gln Lys Cys Ser Ser His Ala Ala Lys
145 150 155 160
Val Met Leu Asp Ala Ala Val Lys Ala Gly Ala Pro Glu Asn Cys Ile
165 170 175
Gln Trp Ile Glu Lys Pro Ala Ile Glu Ala Thr Gln Gln Leu Met Asn
180 185 190
His Ser Gly Ile Ser Leu Ile Leu Ala Thr Gly Gly Ser Gly Met Val
195 200 205
Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ala Leu Gly Val Gly Pro Gly
210 215 220
Asn Val Pro Cys Tyr Ile Glu Lys Ser Ala Asp Ile Lys Arg Ala Val
225 230 235 240
Asn Asp Leu Ile Leu Ser Lys Thr Phe Asp Asn Gly Met Ile Cys Ala
245 250 255
Ser Glu Gln Ala Val Ile Ile Asp Lys Glu Ile Tyr Asp Asn Val Lys
260 265 270
Asn Glu Leu Ile Ala Asn Gln Cys Tyr Phe Leu Asn Glu Ala Glu Lys
275 280 285
Lys Lys Val Glu Lys Thr Val Ile Asn Glu Lys Thr Gln Ser Val Asn
290 295 300
Ser Ala Ile Val Gly Lys Pro Ala Tyr Glu Ile Ala Lys Met Ala Gly
305 310 315 320
Val Asn Val Pro Glu Asp Thr Lys Ile Leu Ile Ala Glu Leu Thr Gly
325 330 335
Val Gly Pro Asp Tyr Pro Leu Ser Arg Glu Lys Leu Ser Pro Val Leu
340 345 350
Ala Cys Tyr Lys Ala Asn Ser Thr Lys Gln Gly Phe Glu Phe Ala Glu
355 360 365
Ala Met Leu Glu Phe Gly Gly Leu Gly His Ser Ala Val Ile His Ser
370 375 380
Thr Asn Asp Glu Val Ile Glu Gln Tyr Gly Leu Lys Met Lys Ala Gly
385 390 395 400
Arg Ile Ile Val Asn Ser Pro Ser Ser Gln Gly Ala Ile Gly Asp Ile
405 410 415
Tyr Asn Ala Tyr Met Pro Ser Leu Thr Leu Gly Cys Gly Thr Phe Gly
420 425 430
Gly Asn Ser Val Ser Thr Asn Val Gly Val Ile Asn Leu Tyr Asn Val
435 440 445
Lys Thr Met Ala Lys Arg Arg Val Asn Met Gln Trp Phe Lys Ile Pro
450 455 460
Pro Arg Val Tyr Phe Glu Lys Asn Ser Val Gln Tyr Leu Glu Lys Met
465 470 475 480
Pro Asp Ile Ser Ser Ala Phe Ile Val Thr Asp Pro Asp Met Val Arg
485 490 495
Leu Gly Phe Val Glu Lys Val Leu Tyr Tyr Leu Arg Lys Arg Pro Asp
500 505 510
Tyr Val His Cys Glu Ile Phe Ser Glu Val Glu Pro Asp Pro Ser Ile
515 520 525
Glu Thr Val Arg Lys Gly Ala Ala Ala Met Ala Ser Phe Gln Pro Asp
530 535 540
Val Ile Ile Ala Leu Gly Gly Gly Ser Ala Met Asp Ala Ala Lys Gly
545 550 555 560
Met Trp Leu Phe Tyr Glu His Pro Glu Val Asp Phe Asn Glu Leu Lys
565 570 575
Gln Lys Phe Met Asp Ile Arg Lys Arg Val Ala Lys Phe Pro Lys Leu
580 585 590
Gly Glu Lys Ala Gln Leu Val Cys Ile Pro Thr Thr Ser Gly Thr Gly
595 600 605
Ser Glu Val Thr Ser Phe Ala Val Ile Ser Asp Lys Lys Asn Asn Thr
610 615 620
Lys Tyr Pro Leu Ala Asp Tyr Glu Leu Thr Pro Asp Val Ala Ile Ile
625 630 635 640
Asp Pro Gln Phe Val Met Thr Val Pro Lys Ser Val Thr Ala Asp Thr
645 650 655
Gly Met Asp Val Leu Thr His Ala Ile Glu Ala Tyr Val Ser Asn Met
660 665 670
Ala Asn Asp Tyr Thr Asp Gly Leu Ala Ile Lys Ala Ile Gln Leu Val
675 680 685
His Glu Tyr Leu Pro Lys Ala Tyr Ala Asn Gly Asn Asp Ala Leu Ala
690 695 700
Arg Glu Lys Met His Asn Ala Ser Thr Leu Ala Gly Met Ala Phe Ser
705 710 715 720
Asn Ala Phe Leu Gly Ile Asn His Ser Leu Ala His Lys Ile Gly Ala
725 730 735
Glu Phe His Ile Pro His Gly Arg Ala Asn Ala Ile Leu Leu Pro His
740 745 750
Val Ile Arg Tyr Asn Ala Gln Lys Pro Lys Lys Phe Ala Ala Phe Pro
755 760 765
Lys Tyr Glu His Phe Ile Ala Asp Gln Arg Tyr Ala Glu Ile Ala Arg
770 775 780
Val Leu Gly Leu Pro Ala Ser Thr Thr Glu Glu Gly Val Glu Ser Leu
785 790 795 800
Cys Gln Glu Ile Ile Arg Met Cys Lys Leu Phe Asn Ile Pro Leu Ser
805 810 815
Leu Lys Ala Ala Gly Val Asn Arg Ala Asp Phe Glu Lys Arg Val Ala
820 825 830
Ile Ile Ala Asp Arg Ala Phe Glu Asp Gln Cys Thr Pro Ala Asn Pro
835 840 845
Lys Leu Pro Leu Val Ser Glu Leu Glu Asp Ile Leu Arg Lys Ala Phe
850 855 860
Glu Gly Val Glu Ala Lys
865 870
<210> 102
<211> 867
<212> PRT
<213> 地衣芽孢杆菌
<400> 102
Met Ala Ile Glu Glu Lys Asn Met Lys Gln Lys Gln Asn Ala Ser Asn
1 5 10 15
Met Ile Asp Gln Leu Val Glu Lys Gly Leu Lys Ala Leu Glu Glu Phe
20 25 30
Arg Ser Phe Asp Gln Glu Gln Ile Asp Glu Ile Val Lys Gln Met Ala
35 40 45
Leu Ala Gly Leu Asp Gln His Met Pro Leu Ala Lys Leu Ala Val Glu
50 55 60
Glu Thr Lys Arg Gly Val Tyr Glu Asp Lys Ile Ile Lys Asn Met Phe
65 70 75 80
Ala Thr Glu Tyr Val Tyr His His Ile Lys Tyr Asp Lys Thr Val Gly
85 90 95
Ile Ile Asn Glu Asn Glu His Asp Gly Val Ile Glu Ile Ala Glu Pro
100 105 110
Val Gly Val Ile Ala Gly Val Thr Pro Val Thr Asn Pro Thr Ser Thr
115 120 125
Thr Met Phe Lys Ser Leu Ile Ser Ile Lys Thr Arg Asn Pro Ile Val
130 135 140
Phe Ala Phe His Pro Ser Ala Gln Lys Cys Ser Arg Glu Ala Ala Arg
145 150 155 160
Ile Leu Arg Asp Ala Ala Val Lys Ala Gly Ala Pro Asp Asn Cys Ile
165 170 175
Gln Trp Ile Glu Thr Pro Ser Leu Asp Ala Thr Gln Ala Leu Met Thr
180 185 190
His Pro Asn Val Ser Leu Ile Leu Ala Thr Gly Gly Ala Gly Met Val
195 200 205
Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ala Leu Gly Val Gly Pro Gly
210 215 220
Asn Val Pro Cys Tyr Ile Glu Lys Ser Ala Asn Leu Lys Gln Ala Val
225 230 235 240
Asn Asp Leu Ile Leu Ser Lys Thr Phe Asp Asn Gly Met Ile Cys Ala
245 250 255
Ser Glu Gln Ala Val Ile Ile Asp Lys Gly Ile Tyr Ser Asp Val Lys
260 265 270
Ala Glu Met Thr Arg Asn Asn Cys Tyr Phe Leu Asn Lys Thr Glu Lys
275 280 285
Ser Lys Val Glu Lys Leu Val Ile Asn Glu Asn Thr Cys Ala Val Asn
290 295 300
Ala Asp Ile Val Gly Met Pro Ala Phe Lys Ile Ala Glu Met Ala Gly
305 310 315 320
Ile Lys Val Pro Gln Asp Thr Lys Ile Leu Ile Ala Glu Leu Glu Gly
325 330 335
Val Gly Pro Asp Asp Pro Leu Ser Arg Glu Lys Leu Ser Pro Val Leu
340 345 350
Ala Cys Tyr Lys Val Ser Gly Leu Glu Glu Gly Leu Lys Arg Ala Glu
355 360 365
Glu Met Leu Ala Phe Gly Gly Thr Gly His Ser Ala Val Ile His Thr
370 375 380
Asn Asp Gln Glu Ala Val Lys Glu Phe Gly Leu Arg Met Lys Ala Gly
385 390 395 400
Arg Ile Ile Val Asn Ala Pro Ser Ser Gln Gly Ala Ile Gly Asp Ile
405 410 415
Tyr Asn Ala Tyr Met Pro Ser Leu Thr Leu Gly Cys Gly Thr Tyr Gly
420 425 430
Gly Asn Ser Val Ser Ser Asn Val Gly Ala Val His Leu Ile Asn Thr
435 440 445
Lys Lys Val Ala Lys Arg Asn Val Asn Met Gln Trp Phe Lys Val Pro
450 455 460
Pro Lys Ile Tyr Phe Glu Lys His Ala Thr Gln Tyr Leu Ala Lys Met
465 470 475 480
Pro Asp Ile Ser Lys Ala Phe Ile Val Thr Asp Pro Gly Met Val Lys
485 490 495
Leu Gly Tyr Val Asp Arg Ala Leu His Tyr Leu Arg Arg Arg Pro Asp
500 505 510
Tyr Val His Cys Glu Ile Phe Ser Asp Val Glu Pro Asp Pro Ser Ile
515 520 525
Glu Thr Val Met Asn Gly Val Asp Met Met Ala Lys Phe Gln Pro Asp
530 535 540
Val Ile Ile Ala Leu Gly Gly Gly Ser Ala Met Asp Ala Ala Lys Gly
545 550 555 560
Met Trp Met Phe Tyr Glu His Pro Asp Ala Glu Phe Phe Gly Leu Lys
565 570 575
Gln Lys Phe Leu Asp Ile Arg Lys Arg Ile Val Lys Tyr Pro Lys Leu
580 585 590
Gly Gly Lys Ala Lys Phe Val Ala Ile Pro Thr Thr Ser Gly Thr Gly
595 600 605
Ser Glu Val Thr Ser Phe Ser Val Ile Thr Asp Lys Glu Thr Asn Thr
610 615 620
Lys Tyr Pro Leu Ala Asp Tyr Glu Leu Thr Pro Asp Val Ala Ile Ile
625 630 635 640
Asp Pro Gln Phe Val Met Thr Val Pro Lys His Ile Thr Ala Asp Thr
645 650 655
Gly Met Asp Val Leu Thr His Ala Ile Glu Ser Tyr Val Ser Cys Met
660 665 670
Ala Asn Asp Tyr Thr Asp Gly Leu Ala Met Lys Ala Ile Gln Leu Ile
675 680 685
Phe Glu Tyr Leu Pro Arg Ala Tyr Lys Asn Gly Ser Asp Glu Leu Ala
690 695 700
Arg Glu Lys Val His Asn Ala Ser Thr Ile Ala Gly Met Ala Phe Ser
705 710 715 720
Asn Ala Phe Leu Gly Ile Asn His Ser Leu Ala His Lys Leu Gly Ala
725 730 735
Glu Phe Gln Ile Ala His Gly Arg Ala Asn Ala Ile Leu Leu Pro His
740 745 750
Val Ile Arg Tyr Asn Ala Ala Lys Pro Lys Lys Phe Thr Ala Phe Pro
755 760 765
Lys Tyr Ser His Phe Ile Ala Asp Gln Arg Tyr Ala Glu Ile Ala Arg
770 775 780
Thr Leu Gly Leu Pro Ala Lys Thr Thr Ala Glu Gly Val Glu Ser Leu
785 790 795 800
Ile Gln Glu Ile Ile Ser Leu Ala Lys Glu Leu Lys Ile Pro Met Ser
805 810 815
Ile Lys Gln Asn Gly Val Asp Ala Ala Ala Phe Glu Ser Lys Val Asp
820 825 830
Leu Met Ala Glu Arg Ala Phe Glu Asp Gln Cys Thr Thr Ala Asn Pro
835 840 845
Lys Leu Pro Leu Val Ser Glu Leu Ala Glu Ile Tyr Arg Ser Ala Tyr
850 855 860
Lys Gly Val
865
<210> 103
<211> 866
<212> PRT
<213> 屎肠球菌
<400> 103
Met Met Ala Lys Val Met Glu Lys Glu Lys Thr Lys Thr Ile Asp Val
1 5 10 15
Gln Ala Met Ile Asp Gly Leu Ala Glu Lys Ala Asn Val Ala Leu Lys
20 25 30
Glu Met Glu Ser Phe Asp Gln Glu Lys Val Asp His Ile Val His Glu
35 40 45
Met Ala Met Ala Ala Leu Asp Gln His Met Pro Leu Ala Lys Met Ala
50 55 60
Val Glu Glu Thr Gly Arg Gly Val Tyr Glu Asp Lys Ala Ile Lys Asn
65 70 75 80
Met Tyr Ala Ser Glu Tyr Ile Trp His Asn Ile Lys His Asp Lys Thr
85 90 95
Val Gly Val Ile Asn Glu Asp Val Gln Lys Gly Leu Ile Glu Ile Ala
100 105 110
Glu Pro Val Gly Val Val Cys Gly Val Thr Pro Thr Thr Asn Pro Thr
115 120 125
Ser Thr Thr Ile Phe Lys Ser Met Ile Ala Leu Lys Thr Arg Asn Pro
130 135 140
Ile Val Phe Ala Phe His Pro Ser Ala Gln Lys Ser Ser Ala Glu Ala
145 150 155 160
Ala Arg Val Val Arg Asp Ala Ala Ile Ala Ala Gly Ala Pro Glu Asn
165 170 175
Cys Ile Gln Trp Ile Glu His Pro Ser Ile Glu Ala Thr Ser Met Leu
180 185 190
Met Asn His Pro Gly Ile Ala Ile Val Leu Ala Thr Gly Gly Ala Gly
195 200 205
Met Val Lys Ser Ala Tyr Ser Thr Gly Lys Pro Ala Leu Gly Val Gly
210 215 220
Pro Gly Asn Val Pro Ala Tyr Ile Glu Lys Thr Ala Lys Ile Lys Arg
225 230 235 240
Ala Val Asn Asp Leu Ile Val Ser Lys Thr Phe Asp Asn Gly Met Ile
245 250 255
Cys Ala Ser Glu Gln Ala Val Ile Val Asp Lys Glu Ile Tyr Ala Ala
260 265 270
Val Lys Ala Glu Phe Gln Ala His Gln Val Tyr Ile Val Lys Pro Asp
275 280 285
Glu Leu Gln Lys Leu Glu Asp Ala Val Met Asn Glu Gly Lys Tyr Ala
290 295 300
Val Asn Pro Ser Ile Val Gly His Ser Ala Met Glu Ile Ala Lys Leu
305 310 315 320
Ala Gly Ile Ser Val Pro Lys Gly Thr Lys Met Leu Ile Ala Glu Leu
325 330 335
Glu Gly Val Gly Pro Asp Tyr Pro Leu Ser Arg Glu Lys Leu Ser Pro
340 345 350
Val Leu Ala Met Ile Lys Ala Asn Asn Thr Asp His Ala Phe Asp Leu
355 360 365
Cys Glu Gly Met Leu Asn Leu Gly Gly Leu Gly His Thr Ala Val Ile
370 375 380
His Ser Glu Asn Glu Glu Leu His Val Lys Phe Gly Leu Arg Met Lys
385 390 395 400
Ala Cys Arg Ile Leu Val Asn Thr Pro Ser Ala Glu Gly Gly Ile Gly
405 410 415
Asp Ile Tyr Asn Glu Met Ile Pro Ser Leu Thr Leu Gly Cys Gly Ser
420 425 430
Tyr Gly Lys Asn Ser Val Ser Arg Asn Val Ser Ala Val Asn Leu Ile
435 440 445
Asn Val Lys Thr Val Ala Lys Arg Arg Asn Asn Met Gln Trp Phe Lys
450 455 460
Leu Pro Pro Lys Ile Phe Phe Glu Lys Asn Ser Leu Leu Tyr Leu Glu
465 470 475 480
Lys Met Glu Asn Val Glu Arg Val Met Ile Val Cys Asp Pro Gly Met
485 490 495
Val Gln Phe Gly Tyr Cys Asp Thr Val Arg Glu Val Leu Ser Arg Arg
500 505 510
Lys Asn Asp Val Lys Ile Glu Val Phe Ser Glu Val Glu Pro Asn Pro
515 520 525
Ser Thr Asn Thr Val Tyr Ala Gly Thr Lys Leu Met Ala Asp Phe Lys
530 535 540
Pro Asp Thr Val Ile Ala Leu Gly Gly Gly Ser Ala Met Asp Ala Ala
545 550 555 560
Lys Gly Met Trp Met Phe Tyr Glu His Pro Asp Thr Ser Phe Phe Gly
565 570 575
Ala Lys Gln Lys Phe Leu Asp Ile Arg Lys Arg Thr Tyr Lys Ile Asp
580 585 590
Lys Pro Glu Lys Thr Gln Phe Val Cys Ile Pro Thr Thr Ser Gly Thr
595 600 605
Gly Ser Glu Val Thr Pro Phe Ala Val Ile Thr Asp Ser Glu Thr His
610 615 620
Val Lys Tyr Pro Leu Ala Asp Tyr Ala Leu Thr Pro Asp Val Ala Ile
625 630 635 640
Val Asp Pro Gln Phe Val Met Ser Val Pro Ala Ser Val Thr Ala Asp
645 650 655
Thr Gly Met Asp Val Leu Thr His Ala Ile Glu Ser Tyr Val Ser Val
660 665 670
Met Ala Ser Asp Tyr Thr Arg Gly Leu Ser Leu Gln Ala Ile Lys Leu
675 680 685
Val Phe Asp Tyr Leu Glu Lys Ser Val Lys Thr Pro Asp Met Glu Ser
690 695 700
Arg Glu Lys Met His Asn Ala Ser Thr Met Ala Gly Met Ala Phe Ala
705 710 715 720
Asn Ala Phe Leu Gly Ile Cys His Ser Val Ala His Lys Ile Gly Gly
725 730 735
Glu Tyr Gly Ile Pro His Gly Arg Thr Asn Ala Ile Leu Leu Pro His
740 745 750
Ile Ile Arg Tyr Asn Ala Lys Asp Pro Gln Lys His Ala Met Phe Pro
755 760 765
Lys Tyr Asp Tyr Phe Arg Ala Asp Thr Asp Tyr Ala Asp Ile Ala Lys
770 775 780
Phe Leu Gly Leu Lys Gly Glu Thr Thr Glu Glu Leu Val Glu Ala Leu
785 790 795 800
Ala Thr Ala Val Tyr Glu Leu Gly Asn Ser Val Gly Ile Asn Met Ser
805 810 815
Leu Lys Ala Gln Gly Val Thr Gln Glu Thr Leu Asp Thr Thr Val Asp
820 825 830
Arg Met Ala Glu Leu Ala Tyr Glu Asp Gln Cys Thr Thr Ala Asn Pro
835 840 845
Lys Glu Pro Leu Ile Ser Glu Leu Lys Gln Ile Ile Ile Asp Ala Tyr
850 855 860
Asn Gly
865
<210> 104
<211> 3300
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<222> (601)..(2610)
<223> 编码序列
<400> 104
aacgcggctg atgcttttat ttaggaagga atacttacat tatcatgaga acattgtcaa 60
gggcattctg atacgggcct tccatcgcaa gaaaaaggca gcaacggact gagggacgga 120
gagagttacg gcataagaag tagtaggaga gcagagtgtc ataaagttat attattctcg 180
tcctaaagtc aattagttct gttgcgcttg acaatatatg tcgtgtaata ccgtccctta 240
gcagaagaaa gaaagacgga tccatatatg ttaaaatgct tcagagatgt ttctttaatg 300
tgccgtccaa caaaggtatc ttctgtagct tcctctattt tcgatcagat ctcatagtga 360
gaaggcgcaa ttcagtagtt aaaagcgggg aacagtgtga atccggagac ggcaagattg 420
cccggccctt tttgcggaaa agataaaaca agatatattg cactttttcc accaagaaaa 480
acaggaagtg gattaaaaaa tcaacaaagt ataacgccta ttgtcccaat aagcgtcggt 540
tgttcttctt tattatttta ccaagtacgc tcgagggtac attctaatgc attaaaagac 600
atgagtaatc ctcaaaaagc tctaaacgac tttctgtcca gtgaatctgt tcatacacat 660
gatagttcta ggaaacaatc taataagcag tcatccgacg aaggacgctc ttcatcacaa 720
ccttcacatc atcactctgg tggtactaac aacaataata acaataataa taataataat 780
aacagtaaca acaacaacaa cggcaacgat gggggaaatg atgacgacta tgattatgaa 840
atgcaagatt atagaccttc tccgcaaagt gcgcggccta ctcccacgta tgttccacaa 900
tattctgtag aaagtgggac tgctttcccg attcaagagg ttattcctag cgcatacatt 960
aacacacaag atataaacca taaagataac ggtccgccga gtgcaagcag taatagagca 1020
ttcaggccta gagggcagac cacagtgtcg gccaacgtgc ttaacattga agatttttac 1080
aaaaatgcag acgatgcgca taccatcccg gagtcacatt tatcgagaag gagaagtagg 1140
tcgagggcta cgagtaatgc tgggcacagt gccaatacag gcgccacgaa tggcaggact 1200
actggtgccc aaactaatat ggaaagcaat gaatcaccac gtaacgtccc cattatggtg 1260
aagccaaaga cattatacca gaaccctcaa acacctacag tcttgccctc cacataccat 1320
ccaattaata aatggtcttc cgtcaaaaac acttatttga aggaattttt agccgagttt 1380
atgggaacaa tggttatgat tattttcggt agtgctgttg tttgtcaggt caatgttgct 1440
gggaaaatac agcaggacaa tttcaacgtg gctttggata accttaacgt taccgggtct 1500
tctgcagaaa cgatagacgc tatgaagagt ttaacatcct tggtttcatc cgttgcgggc 1560
ggtacctttg atgatgtggc attgggctgg gctgctgccg tggtgatggg ctatttctgc 1620
gctggtggta gtgccatctc aggtgctcat ttgaatccgt ctattacatt agccaatttg 1680
gtgtatagag gttttcccct gaagaaagtt ccttattact ttgctggaca attgatcggt 1740
gccttcacag gcgctttgat cttgtttatt tggtacaaaa gggtgttaca agaggcatat 1800
agcgattggt ggatgaatga aagtgttgcg ggaatgtttt gcgtttttcc aaagccttat 1860
ctaagttcag gacggcaatt tttttccgaa tttttatgtg gagctatgtt acaagcagga 1920
acatttgcgc tgaccgatcc ttatacgtgt ttgtcctctg atgttttccc attgatgatg 1980
tttattttga ttttcattat caatgcttcc atggcttatc agacaggtac agcaatgaat 2040
ttggctcgtg atctgggccc acgtcttgca ctatatgcag ttggatttga tcataaaatg 2100
ctttgggtgc atcatcatca tttcttttgg gttcccatgg taggcccatt tattggtgcg 2160
ttaatggggg ggttggttta cgatgtctgt atttatcagg gtcatgaatc tccagtcaac 2220
tggtctttac cagtttataa ggaaatgatt atgagagcct ggtttagaag gcctggttgg 2280
aagaagagaa atagagcaag aagaacatcg gacctgagtg acttctcata caataacgat 2340
gatgatgagg aatttggaga aagaatggct cttcaaaaga caaagaccaa gtcatctatt 2400
tcagacaacg aaaatgaagc aggagaaaag aaagtgcaat ttaaatctgt tcagcgcggc 2460
aaaagaacgt ttggtggtat accaacaatt cttgaagaag aagattccat tgaaactgct 2520
tcgctaggtg cgacgacgac tgattctatt gggttatccg acacatcatc agaagattcg 2580
cattatggta atgctaagaa ggtaacatga gaaaacagac aagaaaaaga aacaaataat 2640
atagactgat agaaaaaaat actgcttact accgccggta taatatatat atatatatat 2700
atttacatag atgattgcat agtgttttaa aaagctttcc taggttaagc tatgaatctt 2760
cataacctaa ccaactaaat atgaaaatac tgacccatcg tcttaagtaa gttgacatga 2820
actcagcctg gtcacctact atacatgatg tatcgcatgg atggaaagaa taccaaacgc 2880
taccttccag gttaatgata gtatccaaac ctagttggaa tttgccttga acatcaagca 2940
gcgattcgat atcagttggg agcatcaatt tggtcattgg aataccatct atgcttttct 3000
cctcccatat tcgcaaaagt agtaagggct cgttatatac ttttgaatat gtaagatata 3060
attctatatg atttagtaat ttattttcta tacgctcagt atttttctgc agttgtcgag 3120
taggtattaa acgcaaaaga agtccatcct tttcatcatt caaatggaca tcttggcaaa 3180
gggcccagtt atggaaaatc tgggagtcat acaacgattg cagttggcta tgccactcct 3240
ggtaaggaat catcaagtct gataattctg ttttttagcc cttttttttt ttttttcatg 3300
<210> 105
<211> 1326
<212> DNA
<213> 酿酒酵母
<220>
<221> 杂项特征
<223> fps1Δ突变
<220>
<221> 杂项特征
<222> (602)..(636)
<223> 编码序列
<400> 105
aacgcggctg atgcttttat ttaggaagga atacttacat tatcatgaga acattgtcaa 60
gggcattctg atacgggcct tccatcgcaa gaaaaaggca gcaacggact gagggacgga 120
gagagttacg gcataagaag tagtaggaga gcagagtgtc ataaagttat attattctcg 180
tcctaaagtc aattagttct gttgcgcttg acaatatatg tcgtgtaata ccgtccctta 240
gcagaagaaa gaaagacgga tccatatatg ttaaaatgct tcagagatgt ttctttaatg 300
tgccgtccaa caaaggtatc ttctgtagct tcctctattt tcgatcagat ctcatagtga 360
gaaggcgcaa ttcagtagtt aaaagcgggg aacagtgtga atccggagac ggcaagattg 420
cccggccctt tttgcggaaa agataaaaca agatatattg cactttttcc accaagaaaa 480
acaggaagtg gattaaaaaa tcaacaaagt ataacgccta ttgtcccaat aagcgtcggt 540
tgttcttctt tattatttta ccaagtacgc tcgagggtac attctaatgc attaaaagac 600
gattcgcatt atggtaatgc taagaaggta acatgagaaa acagacaaga aaaagaaaca 660
aataatatag actgatagaa aaaaatactg cttactaccg ccggtataat atatatatat 720
atatatattt acatagatga ttgcatagtg ttttaaaaag ctttcctagg ttaagctatg 780
aatcttcata acctaaccaa ctaaatatga aaatactgac ccatcgtctt aagtaagttg 840
acatgaactc agcctggtca cctactatac atgatgtatc gcatggatgg aaagaatacc 900
aaacgctacc ttccaggtta atgatagtat ccaaacctag ttggaatttg ccttgaacat 960
caagcagcga ttcgatatca gttgggagca tcaatttggt cattggaata ccatctatgc 1020
ttttctcctc ccatattcgc aaaagtagta agggctcgtt atatactttt gaatatgtaa 1080
gatataattc tatatgattt agtaatttat tttctatacg ctcagtattt ttctgcagtt 1140
gtcgagtagg tattaaacgc aaaagaagtc catccttttc atcattcaaa tggacatctt 1200
ggcaaagggc ccagttatgg aaaatctggg agtcatacaa cgattgcagt tggctatgcc 1260
actcctggta aggaatcatc aagtctgata attctgtttt ttagcccttt tttttttttt 1320
ttcatg 1326
<210> 106
<211> 53
<212> PRT
<213> 扣囊复膜孢酵母
<220>
<221> 杂项特征
<223> Sf GA (AE9)
<400> 106
Asp Asn Lys Asn Arg Tyr Lys Ile Asn Gly Asn Tyr Lys Ala Gly Cys
1 5 10 15
Asn Ser Lys Lys His Ile Val Glu Ser Pro Gln Leu Ser Ser Arg Gly
20 25 30
Gly Cys Cys Asp His Ile Asp Asp Asn Gly Gln Leu Thr Glu Glu Ile
35 40 45
Asn Arg Tyr Thr Gly
50
<210> 107
<211> 34
<212> PRT
<213> 青春双岐杆菌
<220>
<221> 杂项特征
<223> Ba pflA
<400> 107
Cys Gln Asn Pro Asp Thr Trp Lys Met Arg Asp Gly Lys Pro Val Tyr
1 5 10 15
Tyr Glu Gly Leu Thr Ser Ser Glu Glu Asn Val Glu Asn Asn Ala Lys
20 25 30
Ile Cys
<210> 108
<211> 58
<212> PRT
<213> 青春双岐杆菌
<220>
<221> 杂项特征
<223> Ba pflB
<400> 108
Trp Glu Gly Phe Thr Glu Gly Asn Trp Gln Lys Asp Ile Asp Val Arg
1 5 10 15
Asp Cys Lys Gln Arg Asp Lys Asp Ser Ile Pro Tyr Arg Asn Asp Phe
20 25 30
Thr Glu Cys Pro Glu Cys Cys Asn Thr Ile Thr Pro Asp Gly Leu Gly
35 40 45
Arg Asp Glu Glu Glu Glu Arg Ile Gly Asn
50 55
<210> 109
<211> 53
<212> PRT
<213> 青春双岐杆菌
<400> 109
Asp Ala Lys Lys Lys Glu Glu Pro Thr Lys Pro Thr Pro Glu Glu Lys
1 5 10 15
Leu Cys Cys Lys Asn Leu Gly Val Asn Pro Gly Lys Thr Pro Glu Glu
20 25 30
Gly Val Glu Asn Cys Gly Ser Tyr Gly Gly Asn Ser Val Ser Gly Val
35 40 45
Asn Gln Ala Val Asn
50
<210> 110
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物X11824
<400> 110
aagcctacag gcgcaagata acacatcac 29
<210> 111
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15546
<400> 111
ggacgaggca agctaaacag atctctagac ctactttata ttatcaatat ttgtgtttg 59
<210> 112
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物X15380
<400> 112
taggtctaga gatctgttta gcttgc 26
<210> 113
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物X15382
<400> 113
gagactacat gatagtccaa aga 23
<210> 114
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15547
<400> 114
ccgtttcttt tctttggact atcatgtagt ctcatttatt ggagaaagat aacatatca 59
<210> 115
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物X11829
<400> 115
ctcagcattg atcttagcag attcaggatc taggt 35
<210> 116
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物X11816
<400> 116
gcagtcatca ggatcgtagg agataagca 29
<210> 117
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15548
<400> 117
ggacgaggca agctaaacag atctctagac ctatgataag gaaggggagc gaaggaaaa 59
<210> 118
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15549
<400> 118
ccgtttcttt tctttggact atcatgtagt ctcctctgat ctttcctgtt gcctctttt 59
<210> 119
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物X11821
<400> 119
tcacaagagt gtgcagaaat aggaggtgga 30
<210> 120
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> X16096
<400> 120
catggtgctt agcagcagat gaaagtgtca 30
<210> 121
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15554
<400> 121
ggacgaggca agctaaacag atctctagac ctaattaatt ttcagctgtt atttcgatt 59
<210> 122
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15555
<400> 122
ccgtttcttt tctttggact atcatgtagt ctcgagtgat tatgagtatt tgtgagcag 59
<210> 123
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物X11845
<400> 123
ttacttgtga aactgtctcc gctatgtcag 30
<210> 124
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物X15559
<400> 124
ggaaggcacc gatactagaa ctccg 25
<210> 125
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15550
<400> 125
gggacgaggc aagctaaaca gatctctaga cctaattaat tttcagctgt tattttgat 59
<210> 126
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15552
<400> 126
ccgtttcttt tctttggact atcatgtagt ctcgagtgat tatgagtatt tgtgagcag 59
<210> 127
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物X15553
<400> 127
accagcgtct ggtggacaaa cggccttcaa c 31
<210> 128
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物X15556
<400> 128
ccactcgagg ataggcttga aaga 24
<210> 129
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15870
<400> 129
ctaatcaaat caaaataaca gctgaaaatt aatgagtgat tatgagtatt tgtgagcag 59
<210> 130
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15871
<400> 130
aaaacttctg ctcacaaata ctcataatca ctcattaatt ttcagctgtt attttgatt 59
<210> 131
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X17243
<400> 131
tagttagatc agggtaaaaa ttatagatga ggtattaatt ttcagctgtt atttcgatt 59
<210> 132
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X16738
<400> 132
ctaatcaaat cgaaataaca gctgaaaatt aatacctcat ctataatttt taccctgat 59
<210> 133
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X16620
<400> 133
tcggatcagt agataacccg cctagaagac taggttacat tgaaaataca gtaaatggt 59
<210> 134
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X16621
<400> 134
tggtggaacc atttactgta ttttcaatgt aacctagtct tctaggcggg ttatctact 59
<210> 135
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X13208
<400> 135
ccgaaatatt ccacggttta gaaaaaaatc ggaggtttag acattggctc ttcattgag 59
<210> 136
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X13209
<400> 136
aagctcaatg aagagccaat gtctaaacct ccgatttttt tctaaaccgt ggaatattt 59
<210> 137
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X17242
<400> 137
acatcatctt ttaacttgaa tttattctct agctttcaat cattggagca atcatttta 59
<210> 138
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X17241
<400> 138
gtccatgtaa aatgattgct ccaatgattg aaagctagag aataaattca agttaaaag 59
<210> 139
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 引物X16744
<400> 139
aaaaacttct gctcacaaat actcataatc actcctactt attcccttcg agattatatc 60
<210> 140
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X17244
<400> 140
gttcctagat ataatctcga agggaataag taggagtgat tatgagtatt tgtgagcag 59
<210> 141
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物X11845
<400> 141
ttacttgtga aactgtctcc gctatgtcag 30
<210> 142
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物X15473
<400> 142
agtcatcagg atcgtaggag ataagc 26
<210> 143
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X17460
<400> 143
agaagataat atttttatat aattatatta atcctaatct tcatgtagat ctaattctt 59
<210> 144
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X17459
<400> 144
cctttccttt tccttcgctc cccttcctta tcaatggcag acgcaaagaa gaaggaaga 59
<210> 145
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X17289
<400> 145
gtccatgtaa aatgattgct ccaatgattg aaagttacat tgaaaataca gtaaatggt 59
<210> 146
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X17290
<400> 146
tggtggaacc atttactgta ttttcaatgt aactttcaat cattggagca atcatttta 59
<210> 147
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 引物X15735
<400> 147
catcttttaa cttgaattta ttctctagcc tagtcttcta ggcgggttat ctactgat 58
<210> 148
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15736
<400> 148
agataacccg cctagaagac taggctagag aataaattca agttaaaaga tgatgttga 59
<210> 149
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X17457
<400> 149
tgggggaaaa agaggcaaca ggaaagatca gagctactta ttcccttcga gattatatc 59
<210> 150
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 引物X17458
<400> 150
gttcctagat ataatctcga agggaataag tagctctgat ctttcctgtt gcctcttttt 60
<210> 151
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物X15476
<400> 151
gtagatctgc ccagaatgat gacgtt 26
<210> 152
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物X17826
<400> 152
tcgctaacga tcaagaggaa ctg 23
<210> 153
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物X16944
<400> 153
tacacgtgca tttggaccta tc 22
<210> 154
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物17413
<400> 154
ggattcttcg agagctaaga 20
<210> 155
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物15810
<400> 155
gacttgcagg gtaggctagc tagaatt 27
<210> 156
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物17834
<400> 156
gctgcttcga ggtattgaca 20
<210> 157
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物14554
<400> 157
ggctcttcat tgagcttaga accc 24
<210> 158
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物16291
<400> 158
aactggaccg atcttattcg t 21
<210> 159
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物15229
<400> 159
agtccactgc ggagtcattt caaag 25
<210> 160
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物16503
<400> 160
ctgccagcga attcgactct gcaat 25
<210> 161
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物11317
<400> 161
cagtcgctgt agtgagcgac agggtagtaa 30
<210> 162
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物16241
<400> 162
ctttgcatta gcatgcgta 19
<210> 163
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物16946
<400> 163
taggtcgaga ccagaatgca tgt 23
<210> 164
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物16939
<400> 164
atgctgatgc atgtccacaa ag 22
<210> 165
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物16940
<400> 165
ccttatcagt caattgagga aag 23
<210> 166
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物16807
<400> 166
gcgatgagct aatcctgagc cat 23
<210> 167
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物14567
<400> 167
tggttccacc attattatgt tggt 24
<210> 168
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物17834
<400> 168
gctgcttcga ggtattgaca 20
<210> 169
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物14557
<400> 169
ctaaaccgtg gaatatttcg gatat 25
<210> 170
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物16640
<400> 170
cctcatcagc tctggaacaa cga 23
<210> 171
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物14552
<400> 171
gatccgagct tccactagga tagc 24
<210> 172
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物17586
<400> 172
gcagtatgca agtctcatgc tg 22
<210> 173
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物16806
<400> 173
gaacttgcag gcaccgatct tca 23
<210> 174
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物13092
<400> 174
ccacaccata gacttcagcc ttcttag 27
<210> 175
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物17586
<400> 175
gcagtatgca agtctcatgc tg 22
<210> 176
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物10871
<400> 176
cgttcgctgt agcatactta gctat 25
<210> 177
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物14554
<400> 177
ggctcttcat tgagcttaga accc 24
<210> 178
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物16291
<400> 178
aactggaccg atcttattcg t 21
<210> 179
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物17887
<400> 179
actgcctcat tgatggtggt a 21
<210> 180
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物16640
<400> 180
cctcatcagc tctggaacaa cga 23
<210> 181
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物16509
<400> 181
gtatgattgc ggttatctgt cgc 23
<210> 182
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物13246
<400> 182
cctatggatg ttgtaccatg cc 22
<210> 183
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物13095
<400> 183
ccaatatctt gcagtccatc ctcgtcgc 28
<210> 184
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物X18868
<400> 184
gccaaagtgg attctcctac tcaagctttg c 31
<210> 185
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X18844
<400> 185
tcggatcagt agataacccg cctagaagac tagtagctat gaaattttta actctttaa 59
<210> 186
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X18845
<400> 186
agccagctta aagagttaaa aatttcatag ctactagtct tctaggcggg ttatctact 59
<210> 187
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15464
<400> 187
gtccatgtaa aatgattgct ccaatgattg aaagaggttt agacattggc tcttcattg 59
<210> 188
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X15465
<400> 188
ctaagctcaa tgaagagcca atgtctaaac ctctttcaat cattggagca atcatttta 59
<210> 189
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物X11750
<400> 189
ataaaattaa atacgtaaat acagcgtgct gcgtgctcga tttttttcta aaccgtgga 59
<210> 190
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物X15479
<400> 190
agcacgcagc acgctgtatt tacgta 26
<210> 191
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物X18869
<400> 191
agatcctgtg gtagtgctgt ctgaacagaa 30

Claims (26)

1.重组酵母,其包含:
(a)一种或多种天然酶,其功能是产生甘油和/或调节甘油合成,其中所述一种或多种酶由甘油-3-磷酸脱氢酶(gpd1),甘油-3-磷酸脱氢酶(gpd2)甘油3-磷酸酶1',甘油3-磷酸酶2或fps1多核苷酸编码;和
(b)一种或多种天然和/或异源酶,其在一种或多种工程化代谢途径中起作用以将碳水化合物源转化为乙醇,
其中所述代谢途径之一包括通过丙酮酸甲酸裂解酶将丙酮酸转化为乙酰-CoA和甲酸,
其中所述代谢途径之一包括通过乙醛脱氢酶,醇脱氢酶或双功能乙醛/醇脱氢酶将乙酰-CoA转化为乙醇,并且
其中所述一种或多种天然和/或异源酶被活化,上调或下调。
2.权利要求1的重组酵母,其中所述工程化代谢途径之一包括:
通过乙醛脱氢酶将乙酰-CoA转化为乙醛,和
通过醇脱氢酶将所述乙醛转化为乙醇。
3.权利要求1的重组酵母,其中所述工程化代谢途径之一包括通过双功能乙醛/醇脱氢酶将乙酰-CoA转化为乙醇。
4.权利要求2的重组酵母,还包含由fdh1多核苷酸,fdh2多核苷酸或fdh1多核苷酸和fdh2多核苷酸两者编码的一种或多种天然酶的缺失。
5.权利要求3的重组酵母,还包含由fdh1多核苷酸,fdh2多核苷酸或fdh1多核苷酸和fdh2多核苷酸两者编码的一种或多种天然酶的缺失。
6.权利要求1的重组酵母,其中所述工程化代谢途径之一包括通过糖解酶将碳水化合物源转化为一种或多种糖单元。
7.权利要求4的重组酵母,其中所述工程化代谢途径之一包括通过糖解酶将碳水化合物源转化为一种或多种糖单元。
8.权利要求5的重组酵母,其中所述工程化代谢途径之一包括通过糖解酶将碳水化合物源转化为一种或多种糖单元。
9.权利要求1的重组酵母,其中所述丙酮酸甲酸裂解酶来自下列属的物种中的一种或多种:双岐杆菌属(Bifidobacterium)、好热厌氧杆菌属(Thermoanaerobacter)、梭菌属(Clostridia)、链球菌属(Streptococcus)、乳杆菌属(Lactobacillus)、衣藻属(Chlamydomonas)、单鞭毛菌属(Pyromyces)、新丽鞭毛菌属(Neocallimastix)或芽孢杆菌属(Bacillus)。
10.权利要求1的重组酵母,其中所述丙酮酸甲酸裂解酶来自下列的一种或多种:地衣芽孢杆菌(Bacillus licheniformis)、嗜热链球菌(Streptococcus thermophilus)、胚芽乳杆菌(Lactobacillus plantarum)、干酪乳杆菌(Lactobacillus casei)、青春双岐杆菌(Bifidobacterium adolescentis)、解纤维素梭菌(Clostridiumcellulolyticum)、莱茵衣藻(Chlamydomonas reinhardtii)PflA、单鞭毛菌属(Pyromyces sp.)E2或新丽鞭毛菌(Neocallimastix frontalis)。
11.权利要求1的重组酵母,其中所述丙酮酸甲酸裂解酶来自青春双岐杆菌(Bifidobacterium adolescentis)。
12.权利要求1的重组酵母,其中所述乙醛脱氢酶来自植物发酵梭菌(C.phytofermentans)。
13.权利要求1的重组酵母,其中所述双功能乙醛/醇脱氢酶来自:梭菌属(Clostridia)、衣藻属(Chlamydomonas)、单鞭毛菌属(Pyromyces)或双岐杆菌属(Bifidobacterium)。
14.权利要求1的重组酵母,其中所述双功能乙醛/醇脱氢酶来自:植物发酵梭菌(Clostridium phytofermentans)、莱茵衣藻(Chlamydomonas reinhardtii)、单鞭毛菌属(Pyromyces sp.)E2或青春双岐杆菌(Bifidobacterium adolescentis)。
15.权利要求1的重组酵母,其中所述双功能乙醛/醇脱氢酶来自:青春双岐杆菌(Bifidobacterium adolescentis)或单鞭毛菌属(Pyromyces sp.)E2。
16.权利要求1的重组酵母,其中所述工程化代谢途径之一包括通过糖解酶将碳水化合物源转化为一种或多种糖单元,并且其中所述糖解酶来自选自下列的生物:灰腐质霉(H.grisea)、嗜热子囊菌(T.aurantiacus)、埃默森篮状菌(T.emersonii)、里氏木霉(T.reesei)、澳洲乳白蚁(C.lacteus)、台湾乳白蚁(C.formosanus)、高山象白蚁(N.takasagoensis)、澳大利亚矛颚家白蚁(C.acinaciformis)、达尔文澳白蚁(M.darwinensis)、N.walkeri、C.lucknowense、黄胸散白蚁(R.speratus)、嗜热放线菌(Thermobifida fusca)、热纤梭菌(Clostridium thermocellum)、解纤维素梭菌(Clostridiumcellulolyticum)、约氏梭菌(Clostridium josui)、短小芽孢杆菌(Bacilluspumilus)、粪碱纤维单胞菌(Cellulomonas fimi)、Saccharophagus degradans、马单鞭毛菌(Pyromyces equii)、Neocallimastix patriciarum、拟南芥(Arabidopsis thaliana)和扣囊复膜酵母(S.fibuliger)。
17.权利要求1的重组酵母,
其中所述酵母选自:酿酒酵母(Saccharomyces cerevisiae)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克思克鲁维酵母(Kluyveromyces marxianus)、巴斯德毕赤酵母(Pichia pastoris)、解脂耶罗维亚酵母(Yarrowia lipolytica)、多形汉森酵母(Hansenula polymorpha)、红发夫酵母(Phaffia rhodozyma)、实用假丝酵母(Candidautlilis)、Arxula adeninivorans、树干毕赤酵母(Pichia stipitis)、汉逊德巴利酵母(Debaryomyces hansenii)、多形德巴利酵母(Debaryomyces polymorphus)、粟酒裂殖酵母(Schizosaccharomyces pombe)、白色假丝酵母(Candida albican)和西方许旺酵母(Schwanniomyces occidentalis),
其中所述丙酮酸甲酸裂解酶来自下列中的一种或多种:地衣芽孢杆菌(Bacilluslicheniformis)、嗜热链球菌(Streptococcus thermophilus)、胚芽乳杆菌(Lactobacillus plantarum)、干酪乳杆菌(Lactobacillus casei)、青春双岐杆菌(Bifidobacterium adolescentis)、解纤维素梭菌(Clostridium cellulolyticum)、莱茵衣藻(Chlamydomonas reinhardtii)PflA、单鞭毛菌属(Pyromyces sp.)E2或新丽鞭毛菌(Neocallimastix frontalis),且
其中所述双功能乙醛/醇脱氢酶来自:植物发酵梭菌(Clostridiumphytofermentans)、莱茵衣藻(Chlamydomonas reinhardtii)、单鞭毛菌属(Pyromycessp.)E2或青春双岐杆菌(Bifidobacterium adolescentis)。
18.权利要求17的重组酵母,其中所述工程化代谢途径之一包括通过糖解酶将碳水化合物源转化为一种或多种糖单元,并且其中所述糖解酶来自选自下列的生物:灰腐质霉(H.grisea)、嗜热子囊菌(T.aurantiacus)、埃默森篮状菌(T.emersonii)、里氏木霉(T.reesei)、澳洲乳白蚁(C.lacteus)、台湾乳白蚁(C.formosanus)、高山象白蚁(N.takasagoensis)、澳大利亚矛颚家白蚁(C.acinaciformis)、达尔文澳白蚁(M.darwinensis)、N.walkeri、C.lucknowense、黄胸散白蚁(R.speratus)、嗜热放线菌(Thermobifida fusca)、热纤梭菌(Clostridium thermocellum)、解纤维素梭菌(Clostridiumcellulolyticum)、约氏梭菌(Clostridium josui)、短小芽孢杆菌(Bacilluspumilus)、粪碱纤维单胞菌(Cellulomonas fimi)、Saccharophagus degradans、马单鞭毛菌(Pyromyces equii)、Neocallimastix patriciarum、拟南芥(Arabidopsis thaliana)和扣囊复膜酵母(S.fibuliger)。
19.权利要求1的重组酵母,其中
所述丙酮酸甲酸裂解酶来自青春双岐杆菌(Bifidobacterium adolescentis),并且
所述双功能乙醛/醇脱氢酶来自青春双岐杆菌(Bifidobacterium adolescentis)。
20.权利要求19的重组酵母,其中
所述糖解酶来自扣囊复膜酵母(S.fibuliger),
所述丙酮酸甲酸裂解酶来自青春双岐杆菌(Bifidobacterium adolescentis),并且
所述双功能乙醛/醇脱氢酶来自青春双岐杆菌(Bifidobacterium adolescentis)。
21.权利要求17或20的重组酵母,还包含由fdh1多核苷酸和fdh2多核苷酸两者编码的一种或多种天然酶的缺失。
22.权利要求1~8和17~20之任一项的重组酵母,其中所述工程化代谢途径之一包括:
通过木糖异构酶将木糖转化为木酮糖-5-磷酸,和/或
通过L-阿拉伯糖异构酶,核酮糖激酶或L-核酮糖-5-磷酸4-差向异构酶将阿拉伯糖转化为木酮糖-5-磷酸。
23.将生物质转化为乙醇的方法,包括使生物质与权利要求1~22之任一项的重组酵母接触。
24.权利要求23的方法,其中所述生物质包括木质纤维素生物质。
25.权利要求24的方法,其中所述木质纤维素生物质选自:草、柳枝稷、大米草、黑麦草、草芦、混合草原禾草、芒草、糖加工残渣、甘蔗渣、甘蔗秆、农业废物、稻秆、稻壳、大麦秆、玉米穗轴、谷类秆、小麦秆、芸苔秆、燕麦秆、燕麦壳、玉米纤维、秸秆、大豆秸秆、玉米秸秆、林业废物、再循环木浆纤维、纸污泥、锯屑、硬木、软木、龙舌兰及其组合。
26.权利要求25的方法,其中所述生物质是玉米糖化醪或玉米淀粉。
CN201910530568.7A 2011-04-05 2012-04-05 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法 Pending CN110423705A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161472085P 2011-04-05 2011-04-05
US61/472,085 2011-04-05
CN201280025218.1A CN103649321B (zh) 2011-04-05 2012-04-05 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280025218.1A Division CN103649321B (zh) 2011-04-05 2012-04-05 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法

Publications (1)

Publication Number Publication Date
CN110423705A true CN110423705A (zh) 2019-11-08

Family

ID=45952666

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201280025218.1A Active CN103649321B (zh) 2011-04-05 2012-04-05 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法
CN201910530568.7A Pending CN110423705A (zh) 2011-04-05 2012-04-05 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201280025218.1A Active CN103649321B (zh) 2011-04-05 2012-04-05 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法

Country Status (8)

Country Link
US (4) US8956851B2 (zh)
EP (2) EP3483279A1 (zh)
CN (2) CN103649321B (zh)
BR (2) BR122019017739B1 (zh)
CA (2) CA2832279C (zh)
DK (1) DK2694662T3 (zh)
WO (1) WO2012138942A1 (zh)
ZA (1) ZA201307441B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109750015A (zh) * 2019-03-27 2019-05-14 云南师范大学 一种热稳性提高的木聚糖酶突变体及其应用

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112012028290B1 (pt) 2010-05-05 2021-02-02 Lallemand Hungary Liquidity Management Llc. levedura recombinante, processo para converter biomassa em etanol e meio de fermentação compreendendo dita levedura
CN103649321B (zh) 2011-04-05 2019-07-16 拉勒曼德匈牙利流动性管理有限责任公司 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法
CA2881772C (en) 2012-08-29 2023-03-21 Lallemand Hungary Liquidity Management Llc Expression of enzymes in yeast for lignocellulose derived oligomer cbp
EP3498829A1 (en) 2012-11-09 2019-06-19 Lallemand Hungary Liquidity Management LLC Method for acetate consumption during ethanolic fermentation of cellulosic feedstocks
WO2014081803A1 (en) * 2012-11-20 2014-05-30 Mascoma Corporation An electron consuming ethanol production pathway to displace glycerol formation in s. cerevisiae
HUE045200T2 (hu) * 2013-03-14 2019-12-30 Du Pont Glicerin-3-foszfát dehidrogenáz butanol elõállítására
US10604772B2 (en) 2013-03-15 2020-03-31 Lallemand Hungary Liquidity Management Llc Methods for regulating nitrogen metabolism during the production of ethanol from corn by metabolically engineered yeast strains
MX2016001881A (es) 2013-08-15 2016-08-03 Lallemand Hungary Liquidity Man Llc Metodos para la mejora de rendimiento y produccion de producto en un microorganismo a traves del reciclaje de glicerol.
WO2015041940A2 (en) * 2013-09-19 2015-03-26 Shell Oil Company Novel yeast strains
ES2697757T3 (es) 2013-12-10 2019-01-28 Yeda Res & Dev Uso de enzimas que catalizan la síntesis de piruvato a partir de formiato y acetil-CoA y bacterias que expresan la misma
KR102219700B1 (ko) * 2014-06-23 2021-02-24 삼성전자주식회사 Fps1의 활성이 감소된, 내산성을 갖는 효모 세포 및 그를 이용하여 락테이트를 생산하는 방법
US10619147B2 (en) 2014-08-11 2020-04-14 Lallemand Hungary Liquidity Management Llc Chimeric polypeptides having xylose isomerase activity
US9920312B2 (en) 2014-08-11 2018-03-20 Lallemand Hungary Liquidity Management Llc Mutations in iron-sulfur cluster proteins that improve xylose utilization
MX2018002705A (es) 2015-09-04 2018-12-19 Lallemand Hungary Liquidity Man Llc Cepas de levadura para la expresion y secrecion de proteinas heterologas a altas temperaturas.
BR112018009161A2 (pt) 2015-11-06 2019-04-16 Lallemand Hungary Liquidity Management Llc limitação da trealose produzida por levedura em fermentação
US20190338256A1 (en) * 2016-04-28 2019-11-07 Danisco Us Inc. Redox balancing in yeast
WO2018002360A1 (en) 2016-07-01 2018-01-04 Lallemand Hungary Liquidity Management Llc Alpha-amylases for combination with glucoamylases for improving saccharification
EP3538545A1 (en) 2016-11-09 2019-09-18 Danisco US Inc. Yeast with improved alcohol production
CN110366594B (zh) 2016-12-16 2023-12-15 丹尼斯科美国公司 双功能磷酸转酮酶-磷酸转乙酰酶融合多肽
MX2019007598A (es) 2016-12-22 2019-12-19 Lallemand Hungary Liquidity Man Llc Tolerancia al sulfito en células hospederas de levadura recombinantes.
US20190382739A1 (en) 2017-01-18 2019-12-19 Danisco Us Inc. Modified yeast cells that overexpress a dna polymerase subunit
EP3577239A1 (en) 2017-02-02 2019-12-11 Lallemand Hungary Liquidity Management LLC Heterologous protease expression for improving alcoholic fermentation
US20200377559A1 (en) 2017-03-24 2020-12-03 Danisco Us Inc Reduction of acetate and glycerol in modified yeast having an exogenous ethanol-producing pathway
CN110678545B (zh) 2017-04-17 2023-10-10 丹尼斯科美国公司 减少酵母中乙酸产生的选择的乙酰辅酶a合酶
BR112019024520B1 (pt) 2017-05-23 2023-03-14 Lallemand Hungary Liquidity Management Llc Célula hospedeira de levedura recombinante e meio de fermentação compreendendo a mesma
CN110741014B (zh) 2017-06-06 2024-04-09 丹尼斯科美国公司 具有改善的醇生产的酵母
UY37835A (es) 2017-08-08 2019-03-29 Danisco Us Inc Producción incrementada de etanol por levaduras que albergan alelos del activador de transcripción constitutivo mal
EP3676288A1 (en) 2017-08-29 2020-07-08 Danisco US Inc. Modified yeast comprising glucose-specific, atp-mediated transporters
EP3700920A1 (en) 2017-10-24 2020-09-02 Danisco US Inc. Yeast with improved alcohol production
WO2019149789A1 (en) 2018-02-01 2019-08-08 Dsm Ip Assets B.V. Yeast cell capable of simultaneously fermenting hexose and pentose sugars
WO2019173225A1 (en) 2018-03-06 2019-09-12 Danisco Us Inc Yeast with improved alcohol production under high dissolved solids conditions
WO2019173204A1 (en) 2018-03-06 2019-09-12 Danisco Us Inc Reduction in acetate production by yeast over-expressing pab1
BR112020018041A2 (pt) 2018-03-06 2020-12-29 Danisco Us Inc. Composições e métodos para aumentar a produção de etanol por meio de levedura com o uso de gcy1 e dak1
BR112020018535A2 (pt) 2018-03-13 2020-12-29 Lallemand Hungary Liquidity Management Llc. Levedura e produto de levedura inativados para melhorar o rendimento de fermentação
US20210024909A1 (en) 2018-03-26 2021-01-28 Lallemand Hungary Liquidity Management Llc Chimeric amylases comprising an heterologous starch binding domain
EP3775179A1 (en) * 2018-03-27 2021-02-17 Cargill, Incorporated Methods for ethanol production using engineered yeast
US20210032642A1 (en) 2018-04-06 2021-02-04 Danisco Us Inc. Increased alcohol production from yeast producing an increased amount of active hac1 protein
UY38179A (es) 2018-04-12 2019-11-29 Danisco Us Inc Levadura que sobreexpresa proteína fosfatasas asociadas con la vía hog
EP3802801A1 (en) 2018-05-25 2021-04-14 Danisco US Inc. Overexpression of fumarate reductase results in an increased fermentation rate in yeast
EP3802784A1 (en) 2018-05-30 2021-04-14 Danisco US Inc. Over-expression of transcriptional activator/repressor gis1 in yeast for increased ethanol production
CN108753636B (zh) 2018-06-12 2020-06-09 山东恒鲁生物科技有限公司 一种生产酪醇及羟基酪醇的酵母及构建方法
CN112752845A (zh) 2018-07-27 2021-05-04 丹尼斯科美国公司 来自生产增加量的活性crz1蛋白的酵母的增加的醇生产
WO2020058914A1 (en) 2018-09-19 2020-03-26 Danstar Ferment Ag Expression of heterologous enzymes in yeast for reducing diacetyl and dextrin
WO2020069063A1 (en) 2018-09-28 2020-04-02 Danisco Us Inc Over-expression of gds1 in yeast for increased ethanol and decreased acetate production
US20210395756A1 (en) 2018-09-28 2021-12-23 Danisco Us Inc Over expression of ribonucleotide reductase inhibitor in yeast for increased ethanol production
US20210388397A1 (en) 2018-09-28 2021-12-16 Danisco Us Inc Selected phosphotransacetylase genes for increased ethanol production in engineered yeast
WO2020089847A1 (en) 2018-11-02 2020-05-07 Lallemand Hungary Liquidity Management Llc Process for preventing or limiting microbial contamination during continuous culture
BR112021009148A2 (pt) 2018-11-13 2021-08-17 Lallemand Hungary Liquidity Management Llc. modulação de oxidação de formiato por célula hospedeira de levedura recombinante durante fermentação
BR112021009163A2 (pt) 2018-11-13 2021-08-17 Lallemand Hungary Liquidity Management Llc. combinações sinergísticas de bactéria e levedura
BR112021009161A2 (pt) 2018-11-13 2021-08-31 Lallemand Hungary Liquidity Management Llc. Expressão combinada de enzimas de produção de trealose e degradação de trealose
US20210380989A1 (en) 2018-12-07 2021-12-09 Lallemand Hungary Liquidity Management Llc Modulation of nadph generation by recombinant yeast host cell during fermentation
WO2020146357A1 (en) 2019-01-08 2020-07-16 Danisco Us Inc Hybrid yeast with increased ethanol production
EP3938519A1 (en) 2019-03-14 2022-01-19 Danisco US Inc. Over-expression of fumarate-succinate transporter in yeast for increased ethanol and reduced acetate production
WO2020186224A1 (en) 2019-03-14 2020-09-17 Danisco Us Inc Over-expression of cytochrome b2 in yeast for increased ethanol production
CN110222633B (zh) * 2019-06-04 2021-04-27 北京工业大学 基于火焰图像颜色特征提取的城市固废焚烧过程燃烧工况识别方法
AU2020307380A1 (en) 2019-06-24 2022-01-27 Danisco Us Inc Disruption of Cdc42 effectors in yeast for increased alcohol and lysine production
US20220251582A1 (en) 2019-06-24 2022-08-11 Danisco Us Inc Modified yeast and method for increasing lysine content in fermentation co-products
CA3145108A1 (en) 2019-06-28 2020-12-30 Jaclyn Diana DEMARTINI Modified yeast cells that over-express selected endogenous proteins
WO2021022140A1 (en) 2019-08-01 2021-02-04 Danisco Us Inc Over-expression of pho13 for increased ethanol production by yeast
WO2021022097A1 (en) 2019-08-01 2021-02-04 Danisco Us Inc Over-expression of adh5p for increased ethanol production by yeast
MX2022002310A (es) 2019-08-29 2022-06-02 Danisco Us Inc Expresión de beta-glucosidasa en levadura para producción mejorada de etanol.
EP4065718A1 (en) 2019-11-26 2022-10-05 Danisco US Inc. Reduction in acetate production by yeast over-expressing mig polypeptides
BR112022010438A2 (pt) 2019-11-29 2022-10-11 Lallemand Hungary Liquidity Man Llc Processo para deslocamento de uma enzima exógena
US11198881B2 (en) 2019-11-29 2021-12-14 Lallemand Hungary Liquidity Management Llc Yeast expressing heterologous glucoamylase
WO2021150911A1 (en) 2020-01-23 2021-07-29 Danisco Us Inc Increased ethanol production by overexpression of jid1 in yeast
CN111423994B (zh) * 2020-03-24 2021-03-05 北京北农企业管理有限公司 一种应用于畜禽粪便发酵的菌剂组合及其制备和使用方法
US20210348145A1 (en) 2020-05-11 2021-11-11 Lallemand Hungary Liquidity Management Llc Recombinant yeast host cell expressing an hydrolase
US20220010265A1 (en) * 2020-07-10 2022-01-13 Lallemand Hungary Liquidity Management Llc Process for reducing the activity of microbial contamination in a yeast medium
AR125830A1 (es) 2021-05-10 2023-08-16 Danisco Us Inc Producción de etanol aumentada mediante sobreexpresión de kgd2 en levaduras
WO2023062542A2 (en) * 2021-10-11 2023-04-20 Lallemand Hungary Liquidity Management Llc Recombinant yeast cell having increased pyruvate decarboxylase activity
WO2023076323A1 (en) 2021-10-26 2023-05-04 Danisco Us Inc. Reduction in acetate produced by yeast with reduced expression of rsf2 or tda9
WO2023170628A1 (en) 2022-03-09 2023-09-14 Lallemand Hungary Liquidity Management Llc Bacterial and archaeal alpha-amylases

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1239511A (zh) * 1996-11-13 1999-12-22 金克克国际有限公司 1,3-丙二醇的重组生产方法
CN1763175A (zh) * 2005-08-08 2006-04-26 天津大学 甘油通道蛋白基因缺失降低甘油生成提高乙醇产量的酿酒酵母菌株及构建方法
WO2010019882A1 (en) * 2008-08-15 2010-02-18 Edeniq, Inc. Genetically-engineered yeast and methods of making and using
WO2010056805A2 (en) * 2008-11-12 2010-05-20 Mascoma Corporation Gene knockout mesophilic and thermophilic organisms, and methods of use thereof
EP2277989A1 (en) * 2009-07-24 2011-01-26 Technische Universiteit Delft Fermentative glycerol-free ethanol production
KR20110123122A (ko) * 2010-05-06 2011-11-14 한국생명공학연구원 재조합 효모를 이용한 글리세롤로부터 에탄올의 제조방법

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5422267A (en) 1984-05-22 1995-06-06 Robert R. Yocum Industrial yeast comprising an integrated glucoamylase gene
AU5954486A (en) 1985-05-21 1986-12-24 Biotechnica International Inc. Yeast expressing gluocoamylase
EP0257115A1 (en) 1986-08-21 1988-03-02 Heineken Technisch Beheer B.V. Amylolytic enzyme producing microorganisms, constructed by recombinant DNA technology, and their use in fermentation processes
KR20080029012A (ko) 1999-05-26 2008-04-02 더 유니버시티 오브 플로리다 리서치 파운데이션 동시 당화 및 발효에 적합한 재조합 숙주
FI20012091A0 (fi) 2001-10-29 2001-10-29 Valtion Teknillinen Sienimikro-organismi, jolla on parantunut suorituskyky bioteknisessä prosesseissa
AU2003223629A1 (en) 2002-04-16 2003-11-03 Mallika Ghosh Transgenic saccharomyces cerevisiae and method for bioremediation
GB0227435D0 (en) 2002-11-25 2002-12-31 Univ Denmark Tech Dtu Metabolically engineered micro-organisms having reduced production of undesired metobolic products
JP5796925B2 (ja) 2004-07-16 2015-10-21 ディーエスエム アイピー アセッツ ビー.ブイ. キシロース発酵性真核細胞の代謝工学
KR20080049033A (ko) 2005-09-01 2008-06-03 산또리 가부시키가이샤 글리세롤 채널 유전자 및 그의 용도
WO2007143245A2 (en) 2006-06-01 2007-12-13 Midwest Research Institute An l-arabinose fermenting yeast
US8906667B2 (en) 2006-08-29 2014-12-09 William Marsh Rice University Increasing NADPH-dependent products
US20100062505A1 (en) 2006-12-21 2010-03-11 Gevo, Inc. Butanol production by metabolically engineered yeast
CN102015995B (zh) 2008-03-03 2014-10-22 焦耳无限科技公司 产生碳基目的产物的二氧化碳固定工程微生物
BRPI0911966B1 (pt) 2008-05-11 2018-11-13 Univ Stellenbosch polinucleotídeo codificando uma celobioidrolase
US9994835B2 (en) 2008-05-11 2018-06-12 Lallemand Hungary Liquidity Management Llc Construction of protrophic/celluloytic yeast strains expressing tethered and secreted cellulases
US8470592B2 (en) 2008-07-07 2013-06-25 Mascoma Corporation Isolation and characterization of Schizochytrium aggregatum cellobiohydrolase I (Cbh 1)
CN102143972A (zh) 2008-07-07 2011-08-03 马斯科马公司 白蚁纤维素酶在酵母中的异源表达
CA2964245C (en) 2008-11-21 2020-10-27 Universiteit Stellenbosch Yeast expressing cellulases for simultaneous saccharification and fermentation using cellulose
CA2748135A1 (en) 2008-12-23 2010-07-01 Mascoma Corporation Heterologous biomass degrading enzyme expression in thermoanaerobacterium saccharolyticum
JP2010280164A (ja) 2009-06-05 2010-12-16 Ihi Corp オフセット印刷装置
BR112012028290B1 (pt) 2010-05-05 2021-02-02 Lallemand Hungary Liquidity Management Llc. levedura recombinante, processo para converter biomassa em etanol e meio de fermentação compreendendo dita levedura
EP2576762A4 (en) 2010-06-03 2013-12-04 Mascoma Corp YEAST FOR THE EXPRESSION OF SACCHAROLYTIC ENZYMES FOR CONSOLIDATED BIOVERIC PROCESSING USING STARCH AND CELLULOSE
BR112013003003A2 (pt) * 2010-08-06 2016-06-14 Mascoma Corp produção de produtos malonil-coa derivados através de rotas anaeróbicas
ES2532508T3 (es) 2010-11-18 2015-03-27 Dsm Ip Assets B.V. Cepas de levaduras manipuladas para producir etanol a partir de glicerol
CN103649321B (zh) 2011-04-05 2019-07-16 拉勒曼德匈牙利流动性管理有限责任公司 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1239511A (zh) * 1996-11-13 1999-12-22 金克克国际有限公司 1,3-丙二醇的重组生产方法
CN1763175A (zh) * 2005-08-08 2006-04-26 天津大学 甘油通道蛋白基因缺失降低甘油生成提高乙醇产量的酿酒酵母菌株及构建方法
WO2010019882A1 (en) * 2008-08-15 2010-02-18 Edeniq, Inc. Genetically-engineered yeast and methods of making and using
WO2010056805A2 (en) * 2008-11-12 2010-05-20 Mascoma Corporation Gene knockout mesophilic and thermophilic organisms, and methods of use thereof
EP2277989A1 (en) * 2009-07-24 2011-01-26 Technische Universiteit Delft Fermentative glycerol-free ethanol production
KR20110123122A (ko) * 2010-05-06 2011-11-14 한국생명공학연구원 재조합 효모를 이용한 글리세롤로부터 에탄올의 제조방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109750015A (zh) * 2019-03-27 2019-05-14 云南师范大学 一种热稳性提高的木聚糖酶突变体及其应用
CN109750015B (zh) * 2019-03-27 2023-05-23 云南师范大学 一种热稳性提高的木聚糖酶突变体及其应用

Also Published As

Publication number Publication date
US8956851B2 (en) 2015-02-17
US9719098B2 (en) 2017-08-01
WO2012138942A1 (en) 2012-10-11
EP3483279A1 (en) 2019-05-15
CN103649321A (zh) 2014-03-19
EP2694662B1 (en) 2020-01-08
US20140186930A1 (en) 2014-07-03
CA3227563A1 (en) 2012-10-11
BR112013025753A2 (pt) 2018-04-10
DK2694662T3 (da) 2020-03-02
ZA201307441B (en) 2016-05-25
CN103649321B (zh) 2019-07-16
CA2832279C (en) 2024-03-05
US20170356000A1 (en) 2017-12-14
CA2832279A1 (en) 2012-10-11
US11034967B2 (en) 2021-06-15
BR122019017739B1 (pt) 2021-06-22
US20150232863A1 (en) 2015-08-20
EP2694662A1 (en) 2014-02-12
US20220098600A1 (en) 2022-03-31
BR112013025753A8 (pt) 2018-06-12

Similar Documents

Publication Publication Date Title
CN103649321B (zh) 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法
US20230159962A1 (en) Recombinant yeast expressing heterologous stl1 protein
US11873520B2 (en) Production of malonyl-COA derived products via anaerobic pathways
CA2798452C (en) Detoxification of biomass derived acetate via metabolic conversion to ethanol, acetone, isopropanol, or ethyl acetate
CN103124783A (zh) 表达用于使用淀粉和纤维素进行联合生物加工的糖分解酶的酵母
US20140370561A1 (en) Genetically modified clostridium thermocellum engineered to ferment xylose
KR102281701B1 (ko) 아세토인을 제조하는 방법
CN107406818A (zh) 增强产油酵母中核心脂质的生产
CN111971379A (zh) 葡糖淀粉酶工程化酵母和发酵方法
US20220090045A1 (en) Methods for producing isopropanol and acetone in a microorganism
US20230175021A1 (en) Plant sweet and yeast msf transporter capable of transporting different sugars simultaneously
WO2015020216A1 (ja) キシロースの発酵能が強化された酵母とその利用
KR101828580B1 (ko) 자일로스 이소머라제의 분비발현을 통하여 자일로스를 탄소원으로 이용하는 방법
BR112016002359B1 (pt) Microorganismo recombinate, método para diminuir o glicerol celular produzido, e processo para a conversão de biomassa em etanol

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191108

WD01 Invention patent application deemed withdrawn after publication