CN110325640A - 用于化合物生物合成的梅奇酵母种 - Google Patents

用于化合物生物合成的梅奇酵母种 Download PDF

Info

Publication number
CN110325640A
CN110325640A CN201780087070.7A CN201780087070A CN110325640A CN 110325640 A CN110325640 A CN 110325640A CN 201780087070 A CN201780087070 A CN 201780087070A CN 110325640 A CN110325640 A CN 110325640A
Authority
CN
China
Prior art keywords
xylose
metschnikowia
isolated
plum surprise
xylitol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780087070.7A
Other languages
English (en)
Inventor
亨德里克·尤尔根斯·詹森范弗伦
罗宗丽
艾伦·乔治·德波诺
安德鲁·塔普林·弗格森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Innovative Bioscience Co
Creatus Biosciences Inc
Original Assignee
Innovative Bioscience Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Innovative Bioscience Co filed Critical Innovative Bioscience Co
Publication of CN110325640A publication Critical patent/CN110325640A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/145Fungal isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/16Butanols
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/22Preparation of oxygen-containing organic compounds containing a hydroxy group aromatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Botany (AREA)
  • Virology (AREA)
  • Biomedical Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Peptides Or Proteins (AREA)

Abstract

利用木糖产生木糖醇和其它化合物的指定为加拿大国际保藏中心(IDAC)登记号No.081116‑01的梅奇酵母(Metschnikowia)株,以及从中获得的组合物和方法。

Description

用于化合物生物合成的梅奇酵母种
相关申请的交叉引用
本发明申请主张2016年12月21日提交的美国临时专利申请No.62/437,610的优先权益,该专利申请的内容以其全部内容作为参考并入本文。
技术领域
本发明涉及分子生物学和微生物学领域。本文提供了梅奇酵母(Metschnikowia)种,当培养时,其从木糖产生有用的化合物,以及制备和使用这些梅奇酵母(Metschnikowia)种的方法。
参考序列表
本发明申请包含以ASCII格式,通过EFS-Web提交并且以其全部内容作为参考并入本文的序列表。2017年12月19日所创建的所述ASCII拷贝的名称为14305-008-228_Sequence_Listing.txt并且大小为188,107字节。
发明背景
木糖是作为生产生物衍生化学品的可再生原料存在于的木质纤维生物质中的丰富的糖。然而,木质纤维生物质的使用和生物衍生化学品的生产受微生物中天然的低木糖吸收的限制。因此,使用木糖来生产生物衍生化合物,如木糖醇的微生物是尚未满足的需要。
木糖醇是低卡路里、低-碳水化合物的广泛用作糖的替代的五-碳糖醇(Drucker等人,Arch of Oral Biol.24:965-970(1979))。木糖醇的甜度与蔗糖大致相同,但是卡路里低33%。已报道木糖醇不影响糖尿病患者和高血糖个体的胰岛素水平。据报道木糖醇的消耗还有益于口腔卫生,其降低了龋齿的发病率。例如,据报道口香糖中的木糖醇抑制变形链球菌(Streptoccocus mutans)的生长(Haresaku等人,Caries Res.41:198-203(2007)),并且降低了急性中耳感染的发病率(Azarpazhooh等人,Cochrane Database of SystematicReviews 11:CD007095(2011))。此外,已报道木糖醇抑制健康牙齿釉质的脱矿并且使受损牙釉质再矿化(Steinberg等人,Clinical Preventive Dentistry 14:31-34(1992);Maguire等人,British Dental J.194:429-436(2003);Grillaud等人,Arch ofPediatrics and Adolescent Medicine12:1180-1186(2005))。
商业上,可以通过木糖的化学还原来生产木糖醇,尽管这可以存在与从水解产物中分离和纯化木糖或木糖醇有关的困难。已描述了用于生产木糖醇的微生物系统(Sirisansaneeyakul等人,J.Ferment.Bioeng.80:565-570(1995);Onishi等人,Agric.Biol.Chem.30:1139-1144(1966);Barbosa等人,J.Ind.Microbiol.3:241-251(1988);Gong等人,Biotechnol.Lett.3:125-130(1981);Vandeska等人,WorldJ.Microbiol.Biotechnol.11:213-218(1995);Dahiya等人,Cabdirect.org 292-303(1990);Gong等人,Biotechnol.Bioeng.25:85-102(1983))。例如,已将来自假丝酵母属(Candida)的酵母描述为对于木糖醇生产是有用的。然而,假丝酵母种(Candida spp.)可以是条件致病菌,因此这些生物在与食品有关的过程中的使用是不期望的。
本文所提供的梅奇酵母(Metschnikowia)种、方法和组合物满足这些需要并且提供了其它相关优势。
发明概述
本文提供了分离的新型梅奇酵母(Metschnikowia)种。该梅奇酵母(Metschnikowia)种以不同于其它梅奇酵母(Metschnikowia)种的指定速率和效率产生木糖醇。例如,在一些方面,本文提供了当在好氧条件和30℃,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,从木糖产生至少0.1g/L/h木糖醇的梅奇酵母(Metschnikowia)种。在一些方面,本文提供了当在好氧条件和30℃,在包含4%的木糖的液体酵母氮源(YNB)培养基中培养3天时,从木糖产生至少1g/L木糖醇的分离的梅奇酵母(Metschnikowian)种。在一些方面,本文提供了当在好氧条件和30℃,在包含2%的木糖和2%的葡萄糖的液体酵母氮源(YNB)培养基中培养两天时,从木糖产生至少1g/L木糖醇的分离的梅奇酵母(Metschnikowian)种。
本文还提供了产生不同化合物组合的分离的梅奇酵母(Metschnikowia)种。例如,在一些方面,本文提供了当在好氧条件,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,产生约0.11g/L/h木糖醇,约6.8E-05g/L/h正丁醇、约2.5E-04g/L/h异丁醇、约2.4E-04g/L/h异丙醇、约2.64E-04g/L/h乙醇和约3.73E-06g/L/h 2-苯乙醇的分离的梅奇酵母(Metschnikowia)种。在另一个方面,本文提供了当在好氧条件,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,以约8,000mg/L木糖醇、约4.85mg/L正丁醇、约18.06mg/L异丁醇、约17.5mg/L异丙醇、约19.7mg/L乙醇和约0.269mg/L 2-苯乙醇的浓度产生化合物木糖醇、正丁醇、异丁醇、异丙醇、乙醇和2-苯乙醇的分离的梅奇酵母(Metschnikowia)种。在另一个方面,本文提供了当在好氧条件,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,以99.26%的木糖醇、0.061%的正丁醇、0.223%的异丁醇、0.217%的异丙醇、0.236%的乙醇和0.003%的2-苯乙醇的相对比产生化合物木糖醇、正丁醇、异丁醇、异丙醇、乙醇和2-苯乙醇的分离的梅奇酵母(Metschnikowia)种。
此外,本文提供了具有不同遗传特征的分离的梅奇酵母(Metschnikowia)种。例如,在一些方面,本文提供了具有D1/D2域序列的分离的梅奇酵母(Metschnikowia)种,其包括:(1)与SEQ ID NO:1具有至少96.8%的同一性的核酸序列;(2)SEQ ID NO:2的共有序列内的核酸序列;或者(3)包含SEQ ID NO:2的残基1-153、178至434和453至499并且其中具有不超过4个核苷酸替代的核酸序列,和编码选自SEQ ID NO:37、40、42、44、49、51、52、55和56中的氨基酸序列的至少一个核酸序列。在一些方面,本文提供了具有D1/D2域序列的分离的梅奇酵母(Metschnikowia)种,其包括:(1)与SEQ ID NO:1具有至少96.8%的同一性的编码核酸序列;(2)SEQ ID NO:2的共有序列内的编码核酸序列;或者(3)包含SEQ ID NO:2的残基1-153、178至434和453至499并且其中具有不超过4个核苷酸替代的核酸序列,和选自SEQID NO:57-78的至少一个编码核酸序列。在具体的方面,本文提供了分离的梅奇酵母(Metschnikowia)种,其具有:(1)与SEQ ID NO:2的D1/D2域共有序列具有至少97.1%的同一性的核酸序列;和(2)SEQ ID NO:70的编码核酸序列。
本文还提供了具有不同的遗传特征和生理特征两者的分离的梅奇酵母(Metschnikowia)种。例如,在一些方面,本文提供了分离的梅奇酵母(Metschnikowia)种,其具有:(1)与SEQ ID NO:1具有至少96.8%的同一性的D1/D2域序列;和(2)SEQ ID NO:68的编码核酸序列,并且其中所述分离的梅奇酵母(Metschnikowia)种在包含2%的木糖作为唯一碳源的酵母提取物蛋白胨(YEP)培养基中培养41小时内生长至约25的OD600
在另一个方面,本文所提供的分离的梅奇酵母(Metschnikowia)种具有特定的D1/D2域序列。例如,在一些方面,所述D1/D2域序列包括选自SEQ ID NO:1和3-25的核酸序列。另外,在一些方面,本文所提供的分离的梅奇酵母(Metschnikowia)种的D1/D2域序列不包括选自下列的梅奇酵母(Metschnikowia)种的D1/D2域序列:Metschnikowia andauensis、金佩梅奇酵母(Metschnikowia chrysoperlae)、核果梅奇酵母(Metschnikowiafructicola)、美极梅奇酵母(Metschnikowia pulcherrima)、山西梅奇酵母(Metschnikowia shanxiensis)、中国梅奇酵母(Metschnikowia sinensis)和Metschnikowia zizyphicola。
在一个方面,本文提供了2016年11月8日,根据布达佩斯条约的条款,在作为国际保藏中心的加拿大国际保藏中心以指定登记号No.081116-01保藏的分离的梅奇酵母(Metschnikowia)种。
本文还提供了所保藏的梅奇酵母(Metschnikowia)种的重组形式。因此,在一些方面,本文提供了2016年11月8日,根据布达佩斯条约的条款,在作为国际保藏中心的加拿大国际保藏中心以指定登记号No.081116-01保藏的分离的梅奇酵母(Metschnikowia)种,其中所述梅奇酵母(Metschnikowia)种还包括能够从木糖产生生物衍生化合物的代谢途径或遗传修饰或两者。在一些实施方式中,所述梅奇酵母(Metschnikowia)种的代谢途径包括编码所述代谢途径的至少一种酶的至少一种外源核酸序列。所述生物衍生化合物可以选自任何本文所述的生物衍生化合物,其包括(但不限于)苯基-乙醇、2-甲基-丁醇或者3-甲基-丁醇。
本文还提供了使用本文所提供的分离的梅奇酵母(Metschnikowia)种生产生物衍生化合物(例如,木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇,2-甲基-丁醇或者3-甲基-丁醇)的方法。因此,在一些方面,本文提供了用于生产木糖醇的方法,其包括将本文所提供的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生木糖醇。该梅奇酵母(Metschnikowia)种可以从木糖产生至少0.1g/L/h,至少0.2g/L/h,至少0.3g/L/h,至少0.4g/L/h,至少0.50g/L/h,至少0.60g/L/h,至少0.70g/L/h,至少0.80g/L/h,至少0.90g/L/h,至少1.00g/L/h,至少1.50g/L/h,至少2.00g/L/h,至少2.50g/L/h,至少3.00g/L/h,至少3.50g/L/h,至少4.00g/L/h,至少5.00g/L/h,至少6.00g/L/h,至少7.00g/L/h,至少8.00g/L/h,至少9.00g/L/h或者至少10.00g/L/h的木糖醇。
本文所提供的方法可以包括用木糖作为碳源结合其它共基质培养本文所提供的梅奇酵母(Metschnikowia)种。因此,在一些方面,所述条件包括在包含木糖和C3碳源、C4碳源、C5碳源、C6碳源或它们的组合的培养基中培养所述分离的梅奇酵母(Metschnikowia)种。所述条件还可以包括在包含木糖和选自纤维二糖、半乳糖、葡萄糖、乙醇、乙酸酯、阿拉伯糖、阿糖醇、山梨糖醇和甘油或它们的组合的共基质的培养基中培养所述分离的梅奇酵母(Metschnikowia)种。所述培养条件可以包括好氧培养条件、分批培养、补料-分批培养或者连续培养。所述方法还可以包括将木糖醇与培养中的其它组分分离。
在一些方面,本文提供了通过本文所述的方法生产的生物衍生化合物(例如,木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇,2-甲基-丁醇或者3-甲基-丁醇)。
在一些方面,本文提供了具有本文所述的分离的梅奇酵母(Metschnikowia)种的组合物。另外或者作为另外一种选择,本文还提供了具有本文所述的生物衍生化合物(例如,木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇,2-甲基-丁醇或者3-甲基-丁醇)的组合物。在一些实施方式中,所述组合物是具有木糖的培养基,并且在一些实施方式中,所述组合物是已从中除去了本文所述的分离的梅奇酵母(Metschnikowia)种的培养基。在一些实施方式中,所述组合物包括来自用于产生所述组合物的方法的杂质,其可以包括甘油、阿糖醇、C7糖醇或它们的组合。在具体的实施方式中,所述C7糖醇是庚七醇或其异构体。所述组合物还可以包括特定量的杂质,如甘油或阿糖醇或者两者的量比通过本文所述的分离的梅奇酵母(Metschnikowia)种以外的微生物所产生的相应的甘油或阿糖醇或者两者的量大至少10%、20%、30%或40%。
在另一个方面,本文提供了分离的多肽和分离的核酸,其对应于在本文中从本文所述的新型梅奇酵母(Metschnikowia)种所鉴别的蛋白和核酸。因此,在一些方面,本文提供了具有选自SEQ ID NO:37、40、42、44、49、51、52、55和56的氨基酸序列的分离的多肽。在一些方面,本文提供了具有选自SEQ ID NO:57-78的核酸序列的分离的核酸。还提供了具有本文所述的分离的核酸序列的载体,和具有这种载体的宿主细胞。
附图说明
图1显示了从单个H0梅奇酵母(Metschnikowia)种克隆中鉴别的所有D1/D2序列之间的序列对比。显示了SEQ ID NO:2和3-25。
图2显示了H0梅奇酵母(Metschnikowia)种、美极梅奇酵母(Metschnikowiapulcherrima)进化枝的成员和外类群种Metschnikowia kunwiensis的所有RPB2序列的邻接树,其显示了不同种之间的距离。
图3显示了与美极梅奇酵母(Metschnikowia pulcherrima)进化枝的成员相比,H0梅奇酵母(Metschnikowia)种的示例性生长曲线。
图4显示了H0梅奇酵母(Metschnikowia)种和酿酒酵母(Saccharomycescerevisiae)M2株从木糖生产木糖醇的产量。YP+4%木糖表示具有4%木糖的酵母提取物蛋白胨培养基。YP+10%木糖表示具有10%木糖的酵母提取物蛋白胨培养基。
图5A-5D显示了在不同培养基中培养的H0梅奇酵母(Metschnikowia)种和美极梅奇酵母(Metschnikowia pulcherrima flavia)(FL)株的细胞生长曲线。图5A为具有4%葡萄糖的YNB培养基(YNBG)。图5B为具有4%木糖的YNB培养基(YNBX)。图5C为具有2%葡萄糖和2%木糖的YNB培养基(YNBGX)。图5D为具有4%木糖的YPD培养基(YPDX)。
图6A和6B显示了H0梅奇酵母(Metschnikowia)种和FL株在YNBG、YNBGX和YPDX培养基中所产生的甘油和乙醇。
图7A-7D显示了在H0梅奇酵母(Metschnikowia)种和FL株在YNBG(图7A)、YNBX(图7B)、YNBGX(图7C)和YPDX(图7D)培养基中生长期间所产生的阿糖醇水平。
图8A-8C显示了在H0梅奇酵母(Metschnikowia)种和FL株在YNBX(图8A)、YNBGX(图8B)和YPDX(图8C)培养基中生长期间所产生的木糖醇水平。
图9A-9D显示了H0梅奇酵母(Metschnikowia)种和FL株在YNBG(图9A)、YNBX(图9B)、YNBGX(图9C)和YPDX(图9D)培养基中所产生的多种挥发性化合物的产量峰比。
发明详述
本文所提供的组合物和方法部分基于梅奇酵母(Metschnikowia)属内新型酵母种的发现、分离和鉴定。这种新型梅奇酵母(Metschnikowia)种(在本文中称为“H0”或者“H0梅奇酵母(Metschnikowia)种”)的分离和鉴定已显示出具有多种有利性质、新型的基因和蛋白以及针对H0梅奇酵母(Metschnikowia)种及其重组H0梅奇酵母(Metschnikowia)种的有价值的用途。例如,H0梅奇酵母(Metschnikowia)种的一些有利性质包括其使用葡萄糖、木糖和纤维二糖作为碳源用于生产生物衍生化合物,如木糖醇、阿糖醇、正丁醇、异丁醇、异丙醇、乙醇或苯乙醇的能力。H0梅奇酵母(Metschnikowia)种的示例性新型基因包括ACT1、ARO8、ARO10、GPD1、GXF1、GXF2、GXS1、HGT19、HXT2.6、HXT5、PGK1、QUP2、RPB1、RPB2、TEF1、TPI1、XKS1、XYL1、XYL2、XYT1、TAL1和TKL1,以及Aro10、Gxf2、Hgt19、Hxt5、Tef1、Xks1、Xyl1、Tal1和Tkl1的蛋白。因此,通过将所述H0梅奇酵母(Metschnikowia)种在含有木糖作为碳源用于生产所述生物衍生化合物的培养基中培养,所述H0梅奇酵母(Metschnikowia)种可以在用于生产生物衍生化合物,如木糖醇、阿糖醇、正丁醇、异丁醇、异丙醇、乙醇或苯乙醇的方法中使用。本文还提供了含有通过使用所述H0梅奇酵母(Metschnikowia)种或重组H0梅奇酵母(Metschnikowia)种生产生物衍生化合物的方法所生产的生物衍生化合物的组合物。本文还提供了涉及H0梅奇酵母(Metschnikowia)种的新型蛋白的分离的多肽和涉及H0梅奇酵母(Metschnikowia)种的新型基因的分离的核酸,和包括这些核酸的宿主细胞。
如本文所使用的,当用于表示培养或生长条件时,术语“好氧的”旨在表示在培养或生长条件中具有可用的游离氧(O2)。这包括当液体培养基中的溶氧超过50%饱和时的条件。
如本文所使用的,当用于表示培养或生长条件时,术语“厌氧的”旨在表示培养或生长条件缺少游离氧(O2)。
如本文所使用的,术语“减弱”或其语法等价形式旨在表示削弱、降低或减弱酶或蛋白的活性或量。如果所述减弱导致活性或量低于给定途径起作用所需的临界水平,则酶或蛋白的活性或量的减弱可以模拟完全破环。然而,模拟一条途径完全破环的酶或蛋白的活性或量的减弱仍可以满足另外的途径继续起作用。例如,内源酶或蛋白的减弱可以足以模拟用于产生特定化合物(例如,木糖醇)的相同的酶或蛋白的完全破环,但是酶或蛋白剩余的活性或量仍可以足以维持其它途径或反应,如对于宿主梅奇酵母(Metschnikowia)种幸存、复制或生长来说关键的途径。酶或蛋白的减弱还可以是以足以提高木糖醇得率的量削弱、降低或减弱所述酶或蛋白的活性或量,但不必需模拟所述酶或蛋白的完全破环。
如本文所使用的,术语“生物基的”是指完全或部分由生物衍生化合物所组成的产物。生物基或生物衍生产物是相对于石油衍生产物来说的,其中这种产物来源于或合成自石油或石油化工原料。
如本文所使用的,术语“生物衍生的”表示来源于生物或者通过生物合成并且可以认为是可再生资源,因为它可以通过生物产生。这种生物,具体地本文所公开的梅奇酵母(Metschnikowia)种可以使用原料或生物资源,如糖(例如,木糖、纤维二糖、葡萄糖、果糖、半乳糖(例如,来自海洋植物生物资源的半乳糖)和蔗糖)、得自农业、植物、细菌或动物来源的碳水化合物,和甘油(例如,来自生物柴油生产的粗甘油副产物)。
如本文所使用的,术语“碳源”是指通过生物用于合成其有机分子的任何含碳分子,其包括(但不限于)本文所述的生物衍生化合物。这包括具有不同的碳原子量的分子。具体实例包括C3碳源、C4碳源、C5碳源和C6碳源。“C3碳源”是指含有三个碳原子的碳源,如甘油。“C4碳源”是指含有四个碳原子的碳源,如赤藓糖或者苏糖。“C5碳源”是指含有五个碳原子的碳源,如木糖、阿拉伯糖、阿糖醇、核糖或来苏糖。“C6碳源”是指含有六个碳原子的碳源,如葡萄糖、半乳糖、甘露糖、阿洛糖、阿卓糖、古洛糖或艾杜糖。
如本文所使用的,术语“D1/D2域”是位于在大多数酵母中存在的(26S)rDNA大亚基5'端的450-600个核苷酸域。可以根据D1/D2域的序列趋异来鉴定大部分酵母种。同种酵母株通常在D1/D2域的核苷酸序列中具有小于1%的趋异,而通过对于该域大于1%的趋异来分离生物种。然而,在少见的情况下,如对于葡萄牙棒孢酵母(Clavispora lusitaniae)(Lachance等人,FEMS Yeast Res.2003;4:253-8)、Metschnikowia andauensis和核果梅奇酵母(Metschnikowia fructicola)(Sipiczki等人,PLoS One.2013;8:e67384)以及本文所述的独特的梅奇酵母(Metschnikowia)种,可以在相同种内发现D1/D2域大于1%的差异。例如,本文所述的独特的梅奇酵母(Metschnikowia)种在D1/D2域中具有多达3.8%的趋异。测定D1/D2域的核苷酸序列的方法在本领域中是熟知的。如在本文中更详细描述的,用于测定梅奇酵母(Metschnikowia)种的D1/D2域的一个示例性方法包括使用引物对NL1(5'-GCATATCAATAAGCGGAGGAAAAG-3';SEQ ID NO:26)和NL4(5'-GGTCCGTGTTTCAAGACGG-3';SEQID NO:27),通过PCR扩增499个核苷酸的序列。
如对于核酸序列所应用的,术语“编码”或其语法等价形式是指编码如果所述核酸为RNA,则通过翻译,或者如果所述核酸是DNA,则通过转录和翻译后的肽、多肽或蛋白的氨基酸的核酸序列。因此,术语“编码核酸序列”是指编码转录和/或翻译后的氨基酸的核酸序列。该序列将包括(例如)对应于真核基因的外显子或者真核基因的cDNA的基因组DNA序列。这些序列相对于相同基因的增强子、启动子和内含子,其在正常情况下不编码任何氨基酸。
如本文所使用的术语“外源的”旨在表示将参考分子或参考活性引入本文所述的梅奇酵母(Metschnikowia)种。可以(例如)通过将编码核酸引入到宿主梅奇酵母(Metschnikowia)种的遗传物质中,如通过整合到宿主染色体上或者作为非染色体遗传物质,如质粒来引入所述分子。作为另外一种选择或另外,所引入的分子可以是或者包括(例如)调控(例如,提高、降低或使其成为组成型)编码核酸的表达的非编码核酸,如启动子或增强子。因此,如参考编码核酸的表达所使用的,所述术语是指编码核酸以可表达形式引入宿主梅奇酵母(Metschnikowia)种和/或提高宿主梅奇酵母(Metschnikowia)种的编码核酸的表达(例如,过表达)的核酸的引入。当用于表示生物合成活性时,所述术语是指引入宿主梅奇酵母(Metschnikowia)种中的活性。所述源可以是(例如)在引入梅奇酵母(Metschnikowia)种后,表达参考活性的同源或异源编码核酸。因此,术语“内源的”是指存在于宿主梅奇酵母(Metschnikowia)种中的参考分子或活性。类似地,当用于表示编码核酸的表达时,所述术语是指微生物内所含的编码核酸的表达。术语“异源的”是指来源于参考梅奇酵母(Metschnikowia)种以外的来源的分子或活性,然而“同源的”是指来源于宿主梅奇酵母(Metschnikowia)种的分子或活性。因此,本文所公开的编码核酸的外源表达可以使用异源或同源编码核酸之一或两者。
应理解当梅奇酵母(Metschnikowia)种中包含不止一种外源核酸时,所述不止一种外源核酸是指参考编码核酸或生物合成活性,如以上所讨论的。还应理解微生物可以具有相同外源核酸的一个或多个拷贝。如本文所公开的,还应理解可以将该不止一个外源核酸引入宿主梅奇酵母(Metschnikowia)种的单独的核酸分子上,多顺反子核酸分子上或它们的组合,并且仍认为是不止一个外源核酸。例如,如本文所公开的,可以工程设计微生物以表达编码所期望的途径的酶或蛋白的两种或更多种外源核酸。在其中将编码所期望的活性的两种外源核酸引入宿主梅奇酵母(Metschnikowia)种的情况下,应理解可以将所述两种外源核酸作为单一核酸,例如,在单个质粒上,在不同的质粒上引入,可以在单一位点或多个位点整合到宿主染色体上,并且仍认为是两个外源核酸。类似地,应理解可以将大于两种外源核酸以任何所期望的组合,例如,在单一质粒上,在不同的质粒上引入到宿主生物中,可以在单一位点或多个位点整合到宿主染色体上,并且仍认为是两种或更多种外源核酸,例如,三种外源核酸。因此,参考外源核酸或生物合成活性的数目是指编码核酸的数目或者生物合成活性的数目,而不是引入到宿主生物中的单独的核酸的数目。
如本文所使用的,术语“遗传修饰”、“基因破坏”或其语法等价形式旨在表示使所编码的基因产物在功能上失活,或者具有活性但活性减弱的遗传改变。所述遗传改变可以是(例如)整个基因的缺失、转录或翻译所需的调控序列的缺失、导致产生截短基因产物的基因部分的缺失或者在本领域中熟知的使所编码的基因产物失活或活性减弱的任何多种突变策略。基因破环的一种特别有用的方法是全基因缺失,因为它降低或消除了本文所提供的梅奇酵母(Metschnikowia)种中遗传回复的发生。基因破环还包括无效突变,它是指基因或含有基因的区域内导致基因不被转录成RNA和/或翻译成功能基因产物的突变。这种无效突变可以由多种类型的突变产生,其包括(例如)点突变失活、基因部分缺失、整个基因缺失或染色体节段缺失。
如本文所使用的,术语“失活”或其语法等价形式旨在表示终止所述酶或蛋白的活性。可以通过编码所述酶或蛋白的整个核酸序列的缺失来完成这种失活。失活还可以伴随着编码所述酶或蛋白的核酸序列部分的缺失,从而通过所述核酸序列所编码的所得的酶或蛋白不具有全长酶或蛋白的活性。另外,可以通过编码酶或蛋白的核酸序列中的替代或插入,包括与缺失结合来完成所述酶或蛋白的失活。插入可以包括异源核酸,如本文所述的那些。
如本文所使用的,当用于表示本文所述的梅奇酵母(Metschnikowia)种时,术语“分离的”旨在表示基本不含如参考微生物在自然界中所存在的至少一种组分的生物。所述术语包括除去如其在自然环境中所存在的一些或所有组分的梅奇酵母(Metschnikowia)种。所述术语还包括除去如所述微生物在非天然存在的环境中所存在的一些或所有组分的微生物。因此,分离的梅奇酵母(Metschnikowia)种与如其在自然界中所存在的或者如其在非天然存在的环境中生长、储存或生存的其它物质部分或完全分离。分离的梅奇酵母(Metschnikowia)种的具体实例包括部分纯的微生物、基本纯的微生物和在非天然存在的培养基中培养的微生物。
如本文所使用的,术语“培养基”、“生长培养基”或其语法等价形式是指含有支持细胞,包括任何微生物,如本文所述的梅奇酵母(Metschnikowia)种的生长的营养物的液体或固体(例如,凝胶状)物质。支持生长的营养物包括:提供碳的底物,如(但不限于)木糖、纤维二糖、半乳糖、葡萄糖、乙醇、乙酸酯、阿糖醇、山梨糖醇和甘油;提供基本元素的盐,包括镁、氮、磷和硫;氨基酸源,如蛋白胨或胰蛋白胨;和维生素含量源,如酵母提取物。在所述方法和鉴定本文所述的梅奇酵母(Metschnikowia)种中有用的培养基的具体实例包括具有碳源的酵母提取物蛋白胨(YEP)培养基和酵母氮源(YNB)培养基,如(但不限于)木糖、葡萄糖、纤维二糖、半乳糖或甘油或它们的组合。YEP和YNB培养基的配方在本领域中是熟知的。例如,具有4%的木糖的YEP培养基包括(但不限于)酵母提取物1.0g,蛋白胨2.0g,木糖4.0g和100mL水。作为另一实例,具有2%的葡萄糖和2%的木糖的YNB培养基包括(但不限于)生物素2μg、泛酸钙400μg、叶酸2μg、肌醇2000μg、烟酸400μg、p-氨基苯甲酸200μg、盐酸吡哆醇400μg、核黄素200μg、盐酸硫胺400μg、硼酸500μg、硫酸铜40μg、碘化钾100μg、氯化铁200μg、硫酸锰400μg、钼酸钠200μg、硫酸锌400μg、磷酸二氢钾1g、硫酸镁500mg、氯化钠100mg、氯化钙100mg、20g葡萄糖、20g木糖和1L水。本领域技术人员可以容易地确定培养基中碳源的量。当培养基中存在不止一种提供碳的底物时,这些被称为“共-基质”。培养基还可以包括除生长所需的营养物以外的物质,如仅允许所选细胞生长的物质(例如,抗生素或抗真菌剂),其通常存在于选择培养基中,或者当在相同培养基上生长时,允许相对于另一种微生物来区分一种微生物的物质,其通常存在于鉴定或指示培养基中。这些物质是本领域技术人员所熟知的。
如本文所使用的,术语“梅奇酵母(Metschnikowia)种”是指属于梅奇酵母(Metschnikowia)属的任何酵母种。示例性的梅奇酵母(Metschnikowia)种包括(但不限于)美极梅奇酵母(Metschnikowia pulcherrima)、核果梅奇酵母(Metschnikowiafructicola)、金佩梅奇酵母(Metschnikowia chrysoperlae)、瑞氏梅奇酵母(Metschnikowia reukaufii)、Metschnikowia andauensis、山西梅奇酵母(Metschnikowiashanxiensis)、中国梅奇酵母(Metschnikowia sinensis)、Metschnikowia zizyphicola、二尖梅奇酵母(Metschnikowia bicuspidata)、Metschnikowia lunata、佐贝尔梅奇酵母(Metschnikowia zobellii)、澳洲梅奇酵母(Metschnikowia australis)、Metschnikowiaagaveae、Metschnikowia gruessii、夏威夷梅奇酵母(Metschnikowia hawaiiensis)、克里斯梅奇酵母(Metschnikowia krissii)、梅奇酵母(Metschnikowia)种NS-O-85株、梅奇酵母(Metschnikowia)种NS-O-89株和本文所述的独特的梅奇酵母(Metschnikowia)种,梅奇酵母(Metschnikowia)种H0,作为另外一种选择,称为“H0梅奇酵母(Metschnikowia)种”。本文所述的梅奇酵母(Metschnikowia)种,即“H0梅奇酵母(Metschnikowia)种”是新发现的种,其于2016年11月8日,根据布达佩斯条约的条款,在作为国际保藏中心的加拿大国际保藏中心(“IDAC”)(地址:1015Arlington Street,Winnipeg,Manitoba,Canada R3E3R2)以指定登记号No.081116-01保藏。H0梅奇酵母(Metschnikowia)种所提议的学名为Metschnikowiavinificola(vinifi:来自酿酒用葡萄(酿酒葡萄藤的种);cola:来自拉丁语单词“incola”,表示栖居者)。因此,vinificola(酿酒用葡萄的栖居者)的种名是指来自酿酒用葡萄的标准分离株。
另外,本文所提及的梅奇酵母(Metschnikowia)种可以包括“非天然存在的”或“重组的”梅奇酵母(Metschnikowia)种。该生物旨在表示具有通常不存在于天然存在的梅奇酵母(Metschnikowia)种,包括参考种的野生型菌株中的至少一个遗传变化的梅奇酵母(Metschnikowia)种。遗传变化包括(例如)引入编码代谢多肽的可表达核酸的修饰、其它核酸的添加、核酸缺失和/或微生物遗传物质的其它基因破环。这些修饰包括(例如)其用于参考种的异源、同源或者异源和同源多肽两者的编码区和功能性片段。其它修饰包括(例如)非编码调控区,其中所述修饰改变了基因或操纵子的表达。示例性的代谢多肽包括本文所述的代谢途径内的酶或蛋白。
代谢修饰是指从其天然存在的状态改变的生化反应。因此,本文所述的梅奇酵母(Metschnikowia)种可以具有对编码代谢多肽或其功能性片段的一个或多个核酸序列的遗传修饰,其改变了所述代谢多肽催化的生化反应,包括异化或同化反应和基础代谢。本文公开了示例性的代谢修饰。
如本文所使用的,术语“代谢途径”是指催化底物化合物转化为产物化合物和/或产生用于底物化合物向产物化合物转化的共基质的一个或多个代谢多肽(例如,蛋白或酶)。这种产物化合物可以是本文所述的生物衍生化合物之一,或者是一旦通过代谢途径的其它蛋白或酶的进一步转化,可以导致产生生物衍生化合物的中间体化合物。因此,代谢途径可以由对底物化合物起作用以使其通过一系列中间体化合物转化为给定产物化合物的一系列代谢多肽(例如,2、3、4、5、6、7、8、9、10或更多个)组成。可以通过如本文所述的外源核酸编码或者通过梅奇酵母(Metschnikowia)种天然产生代谢途径的代谢多肽。
如本文所使用的,术语“过表达”或其语法等价形式旨在表示以大于宿主梅奇酵母(Metschnikowia)种的正常情况的量或者在宿主梅奇酵母(Metschnikowia)种内不同于野生型表达的时间或位置的基因产物(例如,核糖核酸(RNA)、蛋白或酶)的表达。
如本文所使用的,当用于表示核酸序列或氨基酸序列时,术语“序列同一性”或者“序列同源性”是指两个或更多个核酸分子之间或者两个或更多个多肽之间的相似性。可以通过比较每条序列中的位置来确定同一性,其可以出于比较的目的进行比对。当所比较的序列中的位置被相同碱基或氨基酸占据时,则所述分子在该位置是同一的。序列之间的同一性程度是所述序列所共有的匹配或同源位置数目的函数。可以使用本领域中已知的软件程序进行两条序列的比对以确定它们的序列同一性百分比,所述软件程序如(例如)Ausubel等人,Current Protocols in Molecular Biology,John Wiley and Sons,Baltimore,MD(1999)中所述的那些。优选地,使用缺省参数进行比对。可以使用的在本领域中熟知的一种比对程序是设置为缺省参数的BLAST。具体地,程序为BLASTN和BLASTP,使用以下缺省参数:遗传密码=标准;过滤器=无;链=两条;截止值=60;预期值=10;Matrix=BLOSUM62;描述=50条序列;排序依据=高分;数据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+SwissProtein+SPupdate+PIR。这些程序的详细信息可见于国家生物技术信息中心(National Center for Biotechnology Information)。
如本文所使用的,当用于表示培养或生长条件时,术语“基本厌氧的”旨在表示液体培养基中溶氧的量小于约10%饱和。所述术语还旨在包括包含液体或固体培养基且维持在小于约1%的氧的气氛中的密封盒。
如本文所使用的,术语“糖醇”是指通过糖的醛或酮的还原所产生的醇。因此,“C7糖醇”是指通过具有7个碳原子的糖的醛或酮的还原所产生的醇,如庚七醇或其异构体。
如本文所使用的,术语“木糖醇”是指具有化学式C5H12O5的戊糖醇,其摩尔质量为152.15g/mol,并且一种IUPAC名为(2R,3r,4S)-戊烷-1,2,3,4,5-五醇[(2S,4R)-戊烷-1,2,3,4,5-五醇]。木糖醇通常用作糖的低热值、低-碳水化合物替代物,其不影响患有糖尿病的人和具有高血糖的个体的胰岛素水平。
如本文所使用的,术语“木糖”是指具有化学式C5H10O5的具有甲酰基官能团的5碳单糖,其摩尔质量为150.13g/mol,并且一种IUPAC名为(3R,4S,5R)-噁烷-2,3,4,5-四醇。木糖在本领域中还已知作为D-木糖、D-吡喃木糖、木糖苷、d-(+)-木糖、吡喃木糖、木糖(woodsugar)、xylomed和D-木戊糖(xylopentose)。
本文提供了当在具有木糖的培养基中培养时,从木糖产生木糖醇及其它生物衍生化合物的新型分离的梅奇酵母(Metschnikowia)。因此,在一些实施方式中,本文提供了当培养时,从木糖产生至少0.1g/L/h木糖醇的分离的梅奇酵母(Metschnikowia)种。本文还提供了当培养时,将至少1g/L的木糖生产为木糖醇的分离的梅奇酵母(Metschnikowia)种。
如本领域技术人员可以理解的,基于培养条件和/或对如本文所述的梅奇酵母(Metschnikowia)种所做的代谢修饰,通过本文所提供的分离的梅奇酵母(Metschnikowia)种从木糖所生产的木糖醇的量可以是不同的。因此,在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少0.2g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少0.3g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少0.4g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少0.50g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少0.60g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少0.70g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少0.80g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少0.90g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少1.00g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少1.50g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少2.00g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少2.50g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少3.00g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少3.50g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少4.00g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少5.00g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少6.00g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少7.00g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少8.00g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少9.00g/L/h的木糖醇。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种从木糖所产生的木糖醇的量为至少10.00g/L/h的木糖醇。
在一些实施方式中,本文所提供的分离的梅奇酵母(Metschnikowia)种将木糖转化为木糖醇的转化效率为至少0.01g木糖醇每1g木糖。所述转化效率可以为至少0.02g木糖醇每1g木糖。所述转化效率可以为至少0.03g木糖醇每1g木糖。所述转化效率可以为至少0.04g木糖醇每1g木糖。所述转化效率可以为至少0.05g木糖醇每1g木糖。所述转化效率可以为至少0.06g木糖醇每1g木糖。所述转化效率可以为至少0.07g木糖醇每1g木糖。所述转化效率可以为至少0.08g木糖醇每1g木糖。所述转化效率可以为至少0.09g木糖醇每1g木糖。所述转化效率可以为至少0.1g木糖醇每1g木糖。所述转化效率可以为至少0.15g木糖醇每1g木糖。所述转化效率可以为至少0.2g木糖醇每1g木糖。所述转化效率可以为至少0.25g木糖醇每1g木糖。所述转化效率可以为至少0.3g木糖醇每1g木糖。所述转化效率可以为至少0.35g木糖醇每1g木糖。所述转化效率可以为至少0.4g木糖醇每1g木糖。所述转化效率可以为至少0.45g木糖醇每1g木糖。所述转化效率可以为至少0.5g木糖醇每1g木糖。所述转化效率可以为至少0.55g木糖醇每1g木糖。所述转化效率可以为至少0.6g木糖醇每1g木糖。所述转化效率可以为至少0.65g木糖醇每1g木糖。所述转化效率可以为至少0.7g木糖醇每1g木糖。所述转化效率可以为至少0.75g木糖醇每1g木糖。所述转化效率可以为至少0.8g木糖醇每1g木糖。所述转化效率可以为至少0.85g木糖醇每1g木糖。所述转化效率可以为至少0.9g木糖醇每1g木糖。所述转化效率可以为至少0.95g木糖醇每1g木糖。所述转化效率可以为至少1g木糖醇每1g木糖。
在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少1g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少2g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少3g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少4g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少5g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少10g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少20g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少30g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少40g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少50g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少60g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少70g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少80g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少90g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少100g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少150g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少200g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少250g/L。在一些实施方式中,通过所述分离的梅奇酵母(Metschnikowia)种在培养基中所产生的木糖醇的浓度为至少300g/L。
本文还提供了分别以具体速率产生本文所述的生物衍生化合物的组合的分离的梅奇酵母(Metschnikowia)种。例如,本文所提供的分离的梅奇酵母(Metschnikowia)种可以产生约0.11g/L/h的木糖醇和一种或多种下列化合物:约6.8E-05g/L/h正丁醇、约2.5E-04g/L/h异丁醇、约2.4E-04g/L/h异丙醇、约2.64E-04g/L/h乙醇或约3.73E-06g/L/h 2-苯乙醇。在一些实施方式中,本文所提供的分离的梅奇酵母(Metschnikowia)种可以产生约6.8E-05g/L/h的正丁醇。在一些实施方式中,本文所提供的分离的梅奇酵母(Metschnikowia)种可以产生约2.5E-04g/L/h的异丁醇。在一些实施方式中,本文所提供的分离的梅奇酵母(Metschnikowia)种可以产生约2.4E-04g/L/h的异丙醇。在一些实施方式中,本文所提供的分离的梅奇酵母(Metschnikowia)种可以产生约2.64E-04g/L/h的乙醇。在一些实施方式中,本文所提供的分离的梅奇酵母(Metschnikowia)种可以产生约3.73E-06g/L/h的2-苯乙醇。当本文所述的分离的梅奇酵母(Metschnikowia)种以具体速率产生生物衍生化合物的组合时,则可以确定这些化合物的比例。因此,在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种以约8,000mg/L木糖醇、约4.85mg/L正丁醇、约18.06mg/L异丁醇、约17.5mg/L异丙醇、约19.7mg/L乙醇和约0.269mg/L 2-苯乙醇的浓度产生化合物木糖醇、正丁醇、异丁醇、异丙醇、乙醇和2-苯乙醇。
本文所述的可以从木糖获得木糖醇产生速率的培养条件包括改变培养基的通气量、培养基温度、培养生长时间量和培养基组成的条件。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种的培养在好氧条件下进行。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种的培养在基本厌氧条件下进行。在一些实施方式中,培养基的温度范围在20℃至35℃,或者26℃至35℃,或者28℃至32℃,或者在30℃。在一些实施方式中,培养生长1天。在一些实施方式中,培养生长2天。在一些实施方式中,培养生长3天。在一些实施方式中,培养生长4天。在一些实施方式中,培养生长5天。在一些实施方式中,培养生长6天。在一些实施方式中,培养生长7天或以上。培养基的组成可以是在本领域中熟知的用于培养酵母,特别是梅奇酵母(Metschnikowia)属内的种的任何培养基。示例性的培养基包括(但不限于)酵母提取物蛋白胨(YEP)培养基或者酵母氮源(YNB)培养基。另外,培养基中所述分离的梅奇酵母(Metschnikowia)种所使用的碳源可以包括作为唯一碳源的木糖,以及木糖与本文所述的其它碳源的组合。培养基中所述碳源的量可以在1%至20%(例如,1%至20%的木糖),或者2%至14%(例如,2%至14%的木糖),或者4%至10%(例如,4%至10%的木糖)的范围内。在一些实施方式中,所述碳源的量为4%(例如,4%的木糖)。
在一些实施方式中,木糖不是唯一碳源。例如,在一些实施方式中,所述培养基包括木糖和C3碳源、C4碳源、C5碳源、C6碳源或它们的组合。因此,在一些实施方式中,所述培养基包括木糖和C3碳源(例如,甘油)。在一些实施方式中,所述培养基包括木糖和C4碳源(例如,赤藓糖或苏糖)。在一些实施方式中,所述培养基包括木糖和C5碳源(例如,阿糖醇、核糖或来苏糖)。在一些实施方式中,所述培养基包括木糖和C6碳源(例如,葡萄糖、半乳糖、甘露糖、阿洛糖、阿卓糖、古洛糖和艾杜糖)。作为另外一种选择或者另外,在一些实施方式中,所述培养基包括木糖和纤维二糖、半乳糖、葡萄糖、阿糖醇、山梨糖醇和甘油或它们的组合。在具体的实施方式中,所述培养基包括木糖和葡萄糖。培养基中两种或更多种碳源的量可以独立地在1%至20%(例如,1%至20%的木糖和1%至20%的葡萄糖),或者2%至14%(例如,2%至14%的木糖和2%至14%的葡萄糖),或者4%至10%(例如,4%至10%的木糖和4%至10%)的范围内。在具体的实施方式中,每种碳源的量为2%(例如,2%的木糖和2%的葡萄糖)。
基于本文所述的条件,在具体的实施方式中,本文提供了当在好氧条件和30℃,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,从木糖产生至少0.1g/L/h木糖醇的分离的梅奇酵母(Metschnikowia)种。在另一个具体的实施方式中,本文提供了当在好氧条件和30℃,在包含4%的木糖的液体酵母氮源(YNB)培养基中培养3天时,将至少0.1%(w/v)的木糖转化为木糖醇的分离的梅奇酵母(Metschnikowia)种。在另一个具体的实施方式中,本文提供了当在好氧条件和30℃,在包含2%的木糖和2%的葡萄糖的液体酵母氮源(YNB)培养基中培养两天时,将至少0.1%(w/v)的木糖转化为木糖醇的分离的梅奇酵母(Metschnikowia)种。在另一个具体实施方式中,当在好氧条件,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,本文所提供的分离的梅奇酵母(Metschnikowia)种可以产生约0.11g/L/h木糖醇,约6.8E-05g/L/h正丁醇、约2.5E-04g/L/h异丁醇、约2.4E-04g/L/h异丙醇、约2.64E-04g/L/h乙醇和约3.73E-06g/L/h 2-苯乙醇。在另一个具体实施方式中,当在好氧条件,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,本文所提供的分离的梅奇酵母(Metschnikowia)种可以以约8,000mg/L木糖醇、约4.85mg/L正丁醇、约18.06mg/L异丁醇、约17.5mg/L异丙醇、约19.7mg/L乙醇和约0.269mg/L 2-苯乙醇的浓度产生化合物木糖醇、正丁醇、异丁醇、异丙醇、乙醇和2-苯乙醇。在另一个具体实施方式中,当在好氧条件,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,本文所提供的分离的梅奇酵母(Metschnikowia)种可以以99.26%的木糖醇、0.061%的正丁醇、0.223%的异丁醇、0.217%的异丙醇、0.236%的乙醇和0.003%的2-苯乙醇的相对比产生化合物木糖醇、正丁醇、异丁醇、异丙醇、乙醇和2-苯乙醇。
可以使用熟知的方法(还参见实施例)来实施适合的纯化和/或测试通过本文所述的梅奇酵母(Metschnikowia)种所产生的生物衍生化合物的产量的测定,包括测试木糖醇、正丁醇、异丁醇、异丙醇、乙醇或2-苯乙醇的产量的测定。对要测试的每个梅奇酵母(Metschnikowia)种,可以生长适当的重复,如重复三次培养。可以监测梅奇酵母(Metschnikowia)种中化合物和副产物的形成。可以使用在本领域中熟知的常规程序,通过方法,如HPLC(高效液相色谱法)、GC-MS(气相色谱-质谱法)和LC-MS(液相色谱-质谱法)或者其它适合的分析方法来分析最终产物、中间产物及其它化合物。还可以通过培养上清液测试发酵肉汤中化合物的释放。可以使用(例如)阳离子交换柱、示差折光检测器和UV检测器通过HPLC(Lin等人,Biotechnol.Bioeng.90:775-779(2005)),或者其它适合的测定和在本领域中熟知的检测方法来定量副产物和残余碳源。还可以使用本领域中熟知的方法测定代谢途径中单个酶或蛋白的活性。
除以上生产特征之外或者作为以上生产特征的替代,可以通过遗传特征鉴定本文所提供的分离的梅奇酵母(Metschnikowia)种。例如,在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种具有包括SEQ ID NO:1的D1/D2域序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种具有D1/D2域序列,其具有与SEQ ID NO:1具有至少96.8%、至少96.9%、至少97%、至少97.1%、至少97.2%、至少97.3%、至少97.4%、至少97.5%、至少97.5%、至少97.6%、至少97.7%、至少97.8%、至少97.9%、至少98%、至少98.1%、至少98.2%、至少98.3%、至少98.4%、至少98.5%、至少98.6%、至少98.7%、至少98.8%、至少98.9%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%或至少99.9%的同一性的核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种具有D1/D2域序列,其包含SEQ ID NO:2的共有序列内的核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种具有D1/D2域序列,其与SEQ ID NO:2的D1/D2域共有序列具有至少97.1,%至少97.2%、至少97.3%、至少97.4%、至少97.5%、至少97.6%、至少97.7%、至少97.8%、至少97.9%、至少98.0%、至少98.1%、至少98.2%、至少98.3%、至少98.4%、至少98.5%、至少98.6%、至少98.7%、至少98.8%、至少98.9%、至少99.0%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%的同一性。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种具有D1/D2域序列,其包括包含SEQ ID NO:2的残基1-153、178至434和453至499并且其中含有不超过1、2、3或4个核苷酸替代的核酸序列。
除所述D1/D2域序列外或另外,可以通过对于H0梅奇酵母(Metschnikowia)种唯一的核酸序列的存在来鉴定本文所述的分离的梅奇酵母(Metschnikowia)种。因此,在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种具有编码选自下列的氨基酸序列的至少一个核酸序列:Aro10(SEQ ID NO:37)、Gxf2(SEQ ID NO:40)、Hgt19(SEQ ID NO:42)、Hxt5(SEQ ID NO:44)、Tef1(SEQ ID NO:46)、Xks1(SEQ ID NO:51)、Xyl1(SEQ ID NO:52)、Tal1(SEQ ID NO:55)和Tkl1(SEQ ID NO:56)。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括编码氨基酸序列Aro10蛋白(SEQ ID NO:37)的核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括编码氨基酸序列Gxf2蛋白(SEQ ID NO:40)的核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括编码氨基酸序列Hgt19蛋白(SEQ ID NO:42)的核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括编码氨基酸序列Hxt5蛋白(SEQ ID NO:44)的核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括编码氨基酸序列Tef1蛋白(SEQ ID NO:49)的核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括编码氨基酸序列Xks1蛋白(SEQ ID NO:51)的核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括编码氨基酸序列Xyl1蛋白(SEQ ID NO:52)的核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括编码氨基酸序列Tal1蛋白(SEQ ID NO:55)的核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括编码氨基酸序列Tkl1蛋白(SEQ ID NO:56)的核酸序列。
在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种具有至少一个编码核酸序列,其选自ACT1(SEQ ID NO:57)、ARO8(SEQ ID NO:58)、ARO10(SEQ ID NO:59)、GPD1(SEQ ID NO:60)、GXF1(SEQ ID NO:61)、GXF2(SEQ ID NO:62)、GXS1(SEQ ID NO:63)、HXT19(SEQ ID NO:64)、HXT2.6(SEQ ID NO:65)、HXT5(SEQ ID NO:66)、PGK1(SEQ IDNO:67)、QUP2(SEQ ID NO:68)、RPB1(SEQ ID NO:69)、RPB2(SEQ ID NO:70)、TEF1(SEQ IDNO:71)、TPI1(SEQ ID NO:72)、XKS1(SEQ ID NO:73)、XYL1(SEQ ID NO:74)、XYL2(SEQ IDNO:75)、XYT1(SEQ ID NO:76)、TAL1(SEQ ID NO:77)和TKL1(SEQ ID NO:78)。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括ACT1(SEQ ID NO:57)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括ARO8(SEQID NO:58)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括ARO10(SEQ ID NO:59)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括GPD1(SEQ ID NO:60)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括GXF1(SEQ ID NO:61)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括GXF2(SEQ ID NO:62)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括GXS1(SEQ ID NO:63)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括HXT19(SEQ ID NO:64)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括HXT2.6(SEQ ID NO:65)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括HXT5(SEQ ID NO:66)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括PGK1(SEQ ID NO:67)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括QUP2(SEQ ID NO:68)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括RPB1(SEQ ID NO:69)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括RPB2(SEQ ID NO:70)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括TEF1(SEQ ID NO:71)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括TPI1(SEQ ID NO:72)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括XKS1(SEQ ID NO:73)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括XYL1(SEQ ID NO:74)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括XYL2(SEQ ID NO:75)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括XYT1(SEQ ID NO:76)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括TAL1(SEQ ID NO:77)的编码核酸序列。在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括TKL1(SEQ ID NO:78)的编码核酸序列。
除所述D1/D2域序列和H0梅奇酵母(Metschnikowia)种的独特蛋白和编码核酸外或另外,可以通过某些生理特征来鉴定本文所述的分离的梅奇酵母(Metschnikowia)种。例如,在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种在包含2%的木糖作为唯一碳源的酵母提取物蛋白胨(YEP)培养基中培养41小时内生长至约25的OD600。其它鉴定特征包括:细胞形状为球形至椭圆形;多极出芽;当在30℃,在YPD肉汤中生长7天时,大量的球形厚壁孢子-样“美极(pulcherrima)”细胞;在YPD琼脂上,在4℃生长缓慢,在20℃至33℃正常生长,和/或在37℃不生长;向培养基中分泌粉红色色素;和吸收右旋葡萄糖、D-半乳糖、D-木糖、蔗糖、甘油、乙醇、琥珀酸盐和纤维二糖。
在某些具体的实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括与SEQ ID NO:1具有至少96.8%的同一性的核酸序列和编码选自SEQ ID NO:37、40、42、44、49、51、52、55和56的氨基酸序列的至少一个核酸序列。
在某些具体的实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括SEQ ID NO:2的共有序列内的核酸序列和编码选自SEQ ID NO:37、40、42、44、49、52、52、55和56的氨基酸序列的至少一个核酸序列。
在某些具体的实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括包含SEQ ID NO:2的残基1-153、178至434和453至499且其中具有不超过4个核苷酸替代的核酸序列,和编码选自SEQ ID NO:37、40、42、44、49、51、52、55和56的氨基酸序列的至少一个核酸序列。
在某些具体的实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括包含与SEQ ID NO:1具有至少96.8%的同一性的核酸序列的D1/D2域序列和选自SEQ IDNO:57-78的至少一个编码核酸序列。
在某些具体的实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括包含SEQ ID NO:2的共有序列内的核酸序列的D1/D2域序列和选自SEQ ID NO:57-78的至少一个编码核酸序列。
在某些具体的实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括D1/D2域序列,所述D1/D2域序列包括包含SEQ ID NO:2的残基1-153、178至434和453至499且其中含有不超过4个核苷酸替代的核酸序列,和选自SEQ ID NO:57-78的至少一个编码核酸序列。
在某些具体的实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包含:与SEQ ID NO:1具有至少96.8%的同一性的D1/D2域序列;和SEQ ID NO:70的编码核酸序列,并且其中所述分离的梅奇酵母(Metschnikowia)种在包含2%的木糖作为唯一碳源的酵母提取物蛋白胨(YEP)培养基中培养41小时内生长至约25的OD600
在某些具体的实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包含与SEQ ID NO:2的D1/D2域共有序列具有至少97.1%的同一性的核酸序列;和SEQ ID NO:70的编码核酸序列。
本文还提供了具有本文所述的具体的D1/D2域序列之一的分离的梅奇酵母(Metschnikowia)种。例如,在一些实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括选自SEQ ID NO:1和3-25之一的核酸序列。因此,在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:1的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:3的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:4的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:5的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:6的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:7的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:8的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:9的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:10的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:11的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:12的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:13的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:14的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ IDNO:15的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQID NO:16的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:17的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:18的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:19的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:20的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:21的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:22的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:23的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:24的核酸序列。在一些实施方式中,所述分离的梅奇酵母(Metschnikowia)种包含SEQ ID NO:25的核酸序列。
在某些具体的实施方式中,本文所述的分离的梅奇酵母(Metschnikowia)种包括不包含已知的梅奇酵母(Metschnikowia)种的D1/D2域的D1/D2域。例如,这些未包括的域是(但不限于)美极梅奇酵母(Metschnikowia pulcherrima)进化枝,如Metschnikowiaandauensis、金佩梅奇酵母(Metschnikowia chrysoperlae)、核果梅奇酵母(Metschnikowia fructicola)、美极梅奇酵母(Metschnikowia pulcherrima)、山西梅奇酵母(Metschnikowia shanxiensis)、中国梅奇酵母(Metschnikowia sinensis)和Metschnikowia zizyphicola内的种的D1/D2域。
在一些实施方式中,本文提供了2016年11月8日,根据布达佩斯条约的条款,在作为国际保藏中心的加拿大国际保藏中心以指定登记号No.081116-01保藏的分离的梅奇酵母(Metschnikowia)种。分离的梅奇酵母(Metschnikowia)种指定的登记号No.081116-01在本文中表示为“H0”或“H0梅奇酵母(Metschnikowia)种”。加拿大国际保藏中心位于1015Arlington Street,Winnipeg,Manitoba,Canada R3E 3R2。
本文还提供了重组梅奇酵母(Metschnikowia)种。因此,在一些实施方式中,本文提供了2016年11月8日,根据布达佩斯条约的条款,在作为国际保藏中心的加拿大国际保藏中心以指定登记号No.081116-01保藏的分离的梅奇酵母(Metschnikowia)种,其中所述梅奇酵母(Metschnikowia)种还包括能够从木糖产生生物衍生化合物的代谢途径或遗传修饰或两者。在具体的实施方式中,所述代谢途径包含编码代谢途径的至少一种酶的至少一种外源核酸序列。
如本文所述,可以将所提供的重组梅奇酵母(Metschnikowia)种修饰以包含能够从木糖产生生物衍生化合物的代谢途径。当所述修饰包括编码代谢途径的至少一种酶的异源外源核酸序列的引入时,可以根据宿主的密码子使用来修饰所述酶的编码序列。标准遗传密码在本领域中是熟知的,如(例如)Osawa等人,Microbiol Rev.56(1):229-64(1992)中所综述的。酵母种,包括(但不限于)酿酒酵母(Saccharomyces cerevisiae)、阿斯米假丝酵母(Candida azyma)、叉开假丝酵母(Candida diversa)、木兰假丝酵母(Candidamagnoliae)、皱膜假丝酵母(Candida rugopelliculosa)、解脂耶罗威亚酵母(Yarrowialipolytica)和Zygoascus hellenicus使用标准编码。某些酵母种使用替代编码。例如,“Leu”的“CUG”标准密码子在“CUG”进化枝种,如白假丝酵母(Candida albicans)、柱状假丝酵母(Candida cylindracea)、口津假丝酵母(Candida melibiosica)、近平滑假丝酵母(Candida parapsilosis)、褶皱假丝酵母(Candida rugose)、树干毕赤酵母(Pichiastipitis)和梅奇酵母(Metschnikowia)种中编码“Ser”。以下提供了H0梅奇酵母(Metschnikowia)种的DNA密码子表。来自非“CUG”进化枝种的外源基因中的DNA密码子CTG需要转变为TTG、CTT、CTC、TTA或CTA以用于蛋白在梅奇酵母(Metschnikowia)种中的功能性表达。其它密码子优化可以导致梅奇酵母(Metschnikowia)种中外源基因的蛋白表达的提高。密码子优化的方法在本领域中是熟知的(例如,Chung等人,BMC Syst Biol.6:134(2012);Chin等人,Bioinformatics 30(15):2210-12(2014)),并且多种工具是可用的(例如,https://www.dna20.com/services/genegps的DNA2.0;和http://genomes.urv.es/OPTIMIZER的OPTIMIZER)。
H0梅奇酵母(Metschnikowia)种的密码子
氨基酸 SLC DNA密码子
异亮氨酸 I ATT ATC ATA
亮氨酸 L CTT CTC CTA TTA TTG
缬氨酸 V GTT GTC GTA GTG
苯丙氨酸 F TTT TTC
蛋氨酸 M ATG
半胱氨酸 C TGT TGC
丙氨酸 A GCT GCC GCA GCG
甘氨酸 G GGT GGC GGA GGG
脯氨酸 P CCT CCC CCA CCG
苏氨酸 T ACT ACC ACA ACG
丝氨酸 S TCT TCC TCA TCG AGT AGC CTG
酪氨酸 Y TAT TAC
色氨酸 W TGG
谷氨酰胺 O CAA CAG
天门冬酰胺 N AAT AAC
组氨酸 H CAT CAC
谷氨酸 E GAA GAG
门冬氨酸 D GAT GAC
赖氨酸 K AAA AAG
精氨酸 R CGT CGC CGA CGG AGA AGG
终止密码子 Stop TAA TAG TGA
在一些实施方式中,本文所提供的分离的梅奇酵母(Metschnikowia)种可以具有一种或多种生物合成途径以从木糖产生化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇。所述生物合成途径可以是内源途径或外源途径。本文所提供的梅奇酵母(Metschnikowia)种还可以具有编码参与产物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇的一种或多种生物合成途径的一种或多种酶或蛋白的可表达的核酸。基于对所述梅奇酵母(Metschnikowia)种是内源的酶或蛋白,可以表达特定生物合成途径的一些或全部的核酸。在一些实施方式中,所述梅奇酵母(Metschnikowia)种可以具有从木糖产生化合物和天然产生所述化合物的生物合成途径的所有酶的内源表达,其可以通过进一步修饰或者提高所述生物合成途径的酶或蛋白(例如,木糖转运蛋白)的表达得到改善。在一些实施方式中,所述梅奇酵母(Metschnikowia)种可以缺乏用于所期望的生物合成途径的一种或多种酶或蛋白,然后将所缺乏的酶或蛋白的可表达核酸引入所述梅奇酵母(Metschnikowia)种以用于后续外源表达。作为另外一种选择,如果所述梅奇酵母(Metschnikowia)种显示出一些途径基因的内源表达,但是缺乏其它基因,则需要所缺乏的酶或蛋白的编码核酸以实现所期望的化合物的生物合成。因此,重组梅奇酵母(Metschnikowia)种还可以包括外源酶或蛋白活性以获得所期望的生物合成途径,或者可以通过引入与一种或多种内源酶或蛋白一起从木糖产生所期望的化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇的一种或多种外源酶或蛋白来获得所期望的生物合成途径。
本文所提供的梅奇酵母(Metschnikowia)种可以含有稳定的遗传变化,它是指可以培养超过5代而无所述变化损失的微生物。通常,稳定的遗传变化包括持续超过10代的修饰,具体地,稳定修饰将持续超过约25代,并且更具体地,稳定遗传修饰将超过50代,包括无穷代。
就基因破环来说,特别有用的稳定遗传变化为基因缺失。对于降低回复至所述遗传变化之前的表型的可能性来说,使用基因缺失来引入稳定遗传变化是特别有用的。例如,可以(例如)通过在一组代谢修饰中使编码催化一个或多个反应的酶的基因缺失来实现生物化学品的稳定生长-偶联的生产。还可以通过多个缺失来提高生物化学品的生长-偶联的生产的稳定性,从而显著降低对于每种破坏的活性所发生的多种补偿回复的可能性。
本领域技术人员将理解参考适合的宿主生物,如本文所提供的梅奇酵母(Metschnikowia)种和它们相应的代谢反应或者适合于所期望的遗传材料,如所期望的代谢途径的基因的来源生物,描述了遗传变化,包括本文中举例说明的代谢修饰。然而,考虑到多种生物的全基因组测序和基因组领域中的高技术水平,本领域技术人员将容易地能够将本文所提供的教导内容和指导应用于基本上所有其它生物。例如,可以通过引入来自参考种以外的种的相同或类似的编码核酸将本文中举例说明的代谢变化容易地应用于其它种。这些遗传变化包括(例如)种同源物的遗传变化,一般地并且具体地,直系同源物、旁系同源物或非直系同源基因置换。
直系同源物是通过垂直传递相关并且在不同生物中负责基本相同或等同的功能的基因。例如,对于环氧化物水解的生物学功能,小鼠环氧化物酶和人环氧化物酶可以考虑是直系同源物。当(例如)它们共有足够量的序列相似性以表示它们是同源的时,基因是通过垂直传递相关的,或者是通过来自共同祖先的进化相关的。如果它们共有立体结构但不必需共有足够量的序列相似性以表示它们是从共同祖先进化而来,从而一级序列相似性不是可鉴别的,则还可以认为基因是直系同源的。直系同源的基因可以编码具有约25%至100%的氨基酸序列同一性的序列相似性的蛋白。如果它们的立体结构也显示出相似性,则编码共有小于25%的氨基酸相似性的蛋白的基因也可以认为是通过垂直传递产生的。认为酶的丝氨酸蛋白酶家族的成员,包括组织纤维蛋白溶酶原活化因子和弹性酶是通过来自共同祖先的垂直传递所产生的。
直系同源物包括通过(例如)进化在结构或整体活性方面出现变化的基因或者它们的编码基因产物。例如,当一个物种编码显示出两种功能的基因产物并且其中这些功能在第二个物种中已分成不同的基因时,三种基因和它们相应的产物被认为是直系同源物。对于生物化学化合物的生产,本领域技术人员将理解选择具有要引入或要破坏的代谢活性的直系同源基因来用于本文所提供的梅奇酵母(Metschnikowia)种的构建。显示出可分离的活性的直系同源物的实例为其中在两个或更多个物种之间或者在单一物种内已分成不同基因产物的不同活性。具体实例是两种类型的丝氨酸蛋白酶活性:弹性酶蛋白水解作用和纤溶酶原蛋白水解作用作为纤维蛋白溶酶原活化因子和弹性酶分离成不同的分子。第二实例是支原体5'-3'核酸外切酶和果蝇DNA聚合酶III活性的分离。可以将来自第一物种的DNA聚合酶认为是来自第二物种的核酸外切酶或聚合酶之一或两者的直系同源物,反之亦然。
相反,旁系同源物是通过(例如)复制,然后进化趋异相关的同源物,并且其具有类似或常规的功能,但是不具有相同的功能。旁系同源物可以起源或衍生自(例如)相同物种或者不同物种。例如,微粒体环氧化物水解酶(环氧化物水解酶I)和可溶性环氧化物水解酶(环氧化物酶水解II)可以认为是旁系同源物,因为它们代表了从共同祖先共同进化而来的两种不同的酶,其催化不同的反应并且在相同物种中具有不同的功能。旁系同源物是来自相同物种,彼此之间具有表明它们是同源的或者通过来自共同祖先的共同进化相关的显著的序列相似性的蛋白。旁系同源的蛋白家族组包括HipA同源物、荧光素酶基因、肽酶等。
非直系同源基因置换是来自一个物种的可以替代不同物种中参考基因功能的非直系同源基因。替代包括(例如)与不同物种中的参考功能相比,能够在来源物种中实施基本相同或类似的功能。尽管通常非直系同源基因置换将可鉴别为与编码参考功能的已知基因在结构上相关,但是尽管如此在结构上不太相关但是在功能上类似的基因以及它们相应的基因产物仍将属于如本文所使用的术语的含义中。与设法替代的编码所述功能的基因相比,功能相似性需要(例如)在非直系同源基因产物的活性位点或结合区中的至少一些结构相似性。因此,非直系同源基因包括(例如)旁系同源物或非相关基因。
因此,在鉴定和构建本文所提供的具有生物合成能力的梅奇酵母(Metschnikowia)种中,通过将本文所提供的教导内容或指导应用于特定物种,本领域技术人员将理解代谢修饰的鉴定可以包括直系同源物的鉴定和包含或失活。在旁系同源物和/或非直系同源基因置换存在于编码催化类似或基本类似的代谢反应的酶的参考微生物中的程度上,本领域技术人员还可以使用这些进化相关的基因。类似地对于基因破环,也可以在宿主微生物中使进化相关的基因被破坏或缺失以降低或消除靶向破坏的酶促活性的功能冗余。
可以通过本领域技术人员熟知的方法确定直系同源物、旁系同源物和非直系同源基因置换。例如,对于两种多肽的核酸或氨基酸序列的检查将显示出所比较的序列之间的序列同一性和相似性。基于这些相似性,本领域技术人员可以确定所述相似性是否足够高以表明所述蛋白通过来自共同祖先的进化相关。本领域技术人员熟知的算法,如Align、BLAST、Clustal W等比较和确定了原始序列的相似性或同一性,并且还确定了可以分配权重和得分的序列中的空位的存在或意义。这些算法在本领域中也是已知的并且类似地适合于确定核苷酸序列的相似性或同一性。基于计算统计学相似性,或者在随机多肽中找到类似匹配的机会和所确定的匹配的显著性的熟知方法来计算确定关联性的足够的相似性的参数。如果需要,本领域技术人员还可以目视优化两条或更多条序列的计算机比较。可以预期相关基因产物或蛋白具有高相似性,例如,25%至100%的序列同一性。如果扫描大小足够的数据库,则不相关的蛋白可以具有与预期偶然发生的基本相同的同一性(约5%)。5%至24%之间的序列可以或可以不代表足够的同源性以得出所比较的序列相关的结论。考虑数据组的大小,可以实施确定这些匹配的显著性的其它统计分析以确定这些序列的相关性。
例如,使用BLAST算法,用于确定两条或更多条序列的相关性的示例性参数可以如下所示。简要地,可以使用BLASTP 2.0.8版(1999-01-05)和下列参数:Matrix:0BLOSUM62;空位开放:11;空位扩展:1;x_dropoff:50;期待值:10.0;字长:3;过滤器:开,进行氨基酸序列比对。可以使用BLASTN 2.0.6版(1998-09-16)和下列参数:匹配:1;错配:-2;空位开放:5;空位扩展:2;x_dropoff:50;期待值:10.0;字长:11;过滤器:关,进行核酸序列比对。本领域技术人员将已知,例如,可以对以上参数进行哪些改变以提高或降低比较的严格性和确定两条或更多条序列的相关性。
具有从木糖生产木糖醇的生物合成途径的微生物在本领域中是已知的。在一些实施方式中,本文提供了具有从木糖生产木糖醇的生物合成途径的梅奇酵母(Metschnikowia)种。本文还提供了通过将具有木糖醇生物合成途径的本文所提供的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以产生木糖醇来生产生物衍生木糖醇的方法。
多种酵母种(假丝酵母种(Candida spp.)、汉氏德巴利氏酵母(Debaryomyceshansenii)、异常毕赤酵母(Pichia anomala)、克鲁维酵母菌种(Kluyveromvces spp)、嗜鞣管囊酵母(Pachysolen tannophilus)、酵母菌种(Saccharomyces spp.)和粟酒裂殖酵母(Schizosaccharomyces pombe))已鉴别具有将木糖转化为木糖醇的能力。(Sirisansaneeyakul等人,J.Ferment.Bioeng.80:565-570(1995);Onishi等人,Agric.Biol.Chem.30:1139-1144(1966);Barbosa等人,J.Ind.Microbiol.3:241-251(1988);Gong等人,Biotechnol.Lett.3:125-130(1981);Vandeska等人,WorldJ.Microbiol.Biotechnol.11:213-218(1995);Dahiya等人,Cabdirect.org292-303(1990);Gong等人,Biotechnol.Bioeng.25:85-102(1983))。还已在多种酵母(酵母菌种(Saccharomyces spp.)、汉氏德巴利氏酵母(D.hansenii)、粉状毕赤酵母(Pichiafarinose)、汉逊酵母种(Hansenula spp.)、Endomycopsis chodatii、假丝酵母种(Candidaspp.)和新型隐球酵母(Cryptococcus neoformans))中发现了从木酮糖产生木糖醇的能力(Onishi等人,Appl.Microbiol.18:1031-1035(1969))。生物生产木糖醇的大部分研究是通过酵母,并且持续发现了能够将木糖转化为木糖醇的新型酵母种(Kamat等人,J.App.Microbiol.115:1357-1367(2013);Bura等人,J.Ind.Microbiol.Biotechnol.39:1003-1011(2012);Junyapate等人,Antonie Van Leeuwenhoek 105:471-480(2014);Guaman-Burneo等人,Antonie Van Leeuwenhoek 108:919-931(2015);Cadete等人,Int.J.Syst.Evolv.Microbiol.65:2968-2974(2015))。
酿酒酵母(Saccharomyces cerevisiae)是在多种食品加工中使用的酵母生物,但其不能天然有效利用木糖。通过表达来自其它酵母种,如木糖发酵酵母(Scheffersomycesstipitis)(树干毕赤酵母(Pichia stipitis))和休哈塔假丝酵母(Candida shehatae)的木糖还原酶,将其工程设计以从木糖产生木糖醇(Hallborn等人,Bio/Technology 9:1090-1095;Hallborn等人,Appl.Microbiol.Biotechol.42:326-333(1994);Lee等人,ProcessBiochem.35:1199-1203(2000);Giovinden等人,Appl.Microbiol.Biotechnol.55:76-80(2001);Chung等人,Enzyme Microb.Technol.30:809-816(2002))。
已研究了在酿酒酵母(S.cerevisiae)中用于木糖醇生产的替代途径。在转酮醇酶-缺陷型酿酒酵母(S.cerevisiae)株中木糖发酵酵母(Scheffersomyces stipitis)木糖醇脱氢酶的表达和木酮糖激酶基因的缺失使得能够通过多步途径将葡萄糖转化为木糖醇(Toivari等人,Appl.Enviorn.Microbiol.73:5471-5476(2007))。
粗糙链孢霉(Neurospora crassa)纤维糊精转运蛋白和胞内β-葡萄糖苷酶的表达使其能够在木糖醇生产期间同时使用纤维二糖和木糖(Oh等人,Metab.Eng.15:226-234(2013);Zha等人,PLoS One 8:e68317(2013))。此外,酿酒酵母(S.cerevisae)ALD5、IDP2或者木糖发酵酵母(S.stipitis)ZWF1的过表达导致了提高的NADPH水平,从而导致了更高的木糖醇产量(Oh等人,Metab.Eng.15:226-234(2013))。
可以通过使用NADPH-偏好和NADH-偏好的木糖还原酶两者来降低NAD(P)H辅因子的限制从而改善木糖醇的生产。通过野生型NADPH-偏好和突变体NADH-偏好的木糖发酵酵母(S.stipitis)的木糖还原酶和酿酒酵母(S.cerevisiae)ZWF1和ACS1的表达,在酿酒酵母(S.cerevisiae)中使用了该策略(Jo等人,Biotechnol.J.10:1935-1943(2015))。
为了降低木糖醇生产的加工成本,在酿酒酵母(S.cerevisiae)中表达了木糖发酵酵母(S.stipitis)的木糖还原酶、棘孢曲霉(Aspergillus aculeatus)的β-葡萄糖苷酶、米曲霉(Apsergillus oryzae)的β-木糖苷酶和里氏木霉(Trichoderma reesei)的木聚糖内切酶(Guirimand等人,Appl.Microbiol.Biotechnol.100:3477-3487(2016))。这些真菌酶的表达使得能够直接降解半纤维素,而无需添加外源酶。
热带假丝酵母(Candida tropicalis)是病原性的,但是也是木糖醇的天然生产菌之一。一些专利和文献已描述了来自假丝酵母属(Candida)的酵母作为从木糖生产木糖醇的宿主菌株的应用;即,热带假丝酵母(C.tropicalis)ATCC 13803(PCT/IN2009/000027&KR100259470)、热带假丝酵母(C.tropicalis)ATCC 9968(PCT/FI1990/000015)、热带假丝酵母(C.tropicalis)KFCC 10960(KR100199819)、热带假丝酵母(C.tropicalis)(NRRL12968)(PCT/IN2013/000523)、热带假丝酵母(C.tropicalis)ATCC 750(West等人,WorldJ.Mircrobiol.Biotechnol.25:913-916(2009))和热带假丝酵母(C.tropicalis)ATCC7349(SAROTE等人,J.Ferment.and Bioeng.80:565-570(1995))。用于改善热带假丝酵母(C.tropicalis)中木糖醇生产的一种策略是来自近平滑假丝酵母(C.parapsilosis)的NADH-偏好的木糖还原酶的表达,其使得能够通过NADPH和NADH两者来减少木糖(Lee等人,Appl.Enviorn.Microbiol.69:6179-6188(2003))。木糖醇脱氢酶的缺失通过阻断木糖醇分解代谢来提高木糖醇的产量,但是需要共基质,如葡萄糖或甘油来再生用于木糖还原酶活性的NADPH(Ko等人,Appl.Environ.Microbiol.72:4207-4213(2006);Ko等人,Biotechnol.Lett.28:1159-1162(2006))。通过将木糖醇脱氢酶基因的缺失与粗糙链孢霉(Neurospora crassa)木糖还原酶的表达结合,进一步改善了木糖醇的生产(Jeon等人,Bioprocess Biosyst.Eng.35:191-198(2012))。通过表达来自拟南芥(Arabidopsisthaliana)的木糖转运蛋白,再次进一步改善了该菌株的木糖吸收和木糖醇生产(Jeon等人,Bioprocess Biosyst.Eng.36:809-817(2013))。
如果作为共基质提供甘油,则可以通过在热带假丝酵母(C.tropicalis)中表达葡萄糖-6-磷酸脱氢酶和6-磷酸葡萄糖酸脱氢酶来提高NADPH的再生(Ahmad等人,BioprocessBiosyst.Eng.35:199-204(2012))。还可以通过使甘油激酶缺失并且表达来自木糖发酵酵母(Scheffersomyces stipitis)的三种NADPH-再生甘油脱氢酶来提高木糖醇的产量(Ahmad等人,Bioprocess Biosyst.Eng.36:1279-1284(2013))。从混合糖底物生产木糖醇的问题之一在于来自热带假丝酵母(C.tropicalis)的木糖还原酶可以将阿拉伯糖转化为阿糖醇,它是木糖醇生产中的污染物。为了防止该问题,使内源木糖还原酶缺失,并且与细菌阿拉伯糖吸收酶一起表达来自粗糙链孢霉(Neurospora crassa)的突变的木糖-特异性木糖还原酶(Yoon等人,Biotechnol.Lett.33:747-753(2011);Nair等人,ChemBioChem 9:1213-1215(2008))。这最大程度减少了阿糖醇的形成,同时允许阿拉伯糖吸收用于细胞生长。
马克斯克鲁维酵母(Kluyveromyces marxianus)是乳制品中常见的耐热酵母。由于其高生长速率,耐受高达52℃的温度且具有使用多种糖的能力,因此它可以用于木糖醇的生产。在马克斯克鲁维酵母(K.marxianus)中,粗糙链孢霉(Neurospora crassa)木糖还原酶的表达单独或者与木糖醇脱氢酶基因的缺失结合导致了木糖醇在最适42℃的生产(Zhang等人,Bioresour.Technol.152:192-201(2014))。通过测试多种木糖转运蛋白的表达,进一步改善了木糖醇的生产:马克斯克鲁维酵母(K.marxianus)水甘油通道蛋白、中间假丝酵母(Candida intermedia)葡萄糖/木糖协助运输蛋白或者中间假丝酵母(C.intermedia)葡萄糖/木糖同向转运蛋白(Zhang等人,Bioresour.Technol.175:642-645(2015))。发现中间假丝酵母(C.intermedia)葡萄糖/木糖协助运输蛋白的表达对于提高木糖醇的得率和产量是有效的,并且值得注意地,产生了最高的所报道的最终木糖醇浓度。还在导致菌株具有改善的木糖利用和木糖醇生产能力的进化适应实验中使用了马克斯克鲁维酵母(K.marxianus)(Sharma等人,Bioprocess Biosyst.Eng.39:835-843(2016))。
已将两种其它酵母种基因工程设计以研究木糖醇的生产。汉氏德巴利氏酵母(Debaryomyces hansenii)是另一种渗透压耐受的和非病原性的天然木糖醇生产菌。通过木糖醇脱氢酶基因的缺失,在该菌种中提高了木糖醇的产量(Pal等人,Bioresour.Technol.147:449-455(2013))。巴斯德毕赤氏酵母(Pichia pastoris)是常用于蛋白表达的酵母。已工程设计通过葡萄糖-阿糖醇-木酮糖-木糖醇途径从葡萄糖直接产生木糖醇(Cheng等人,Appl.Microbiol.Biotechnol.98:3539-3552(2014))。这是通过表达来自氧化葡糖杆菌(Gluconobacter oxydans)的木糖醇脱氢酶和来自肺炎克雷伯氏菌(Klebsiella pneumoniae)的木酮糖-形成阿糖醇脱氢酶实现的。
除丝状真菌和酵母之外,已观察到有限数量的细菌菌种(棒状杆菌种(Corynebacterium)和Enterobacter liquefaciens)从木糖产生木糖醇(Yoshitake等人,Agric.Biol.Chem.35:905-911(1971);Yoshitake等人,Agric.Biol.Chem.37:2261-2267(1973);Yoshitake等人,Agric.Biol.Chem.40:1493-1503(1976);Rangaswamy等人,Appl.Microbiol.Biotechnol.60:88-93(2002))。还已报道了耻垢分枝杆菌(Mycobacterium smegmatis)能够从木酮糖产生木糖醇(Izumori等人,J.Ferment.Technol.66:33-36(1988))。后续的细菌筛选发现葡糖杆菌种(Gluconobacterspp.)和木醋杆菌(Acetobacter xylinum)能够通过阿糖醇向木酮糖以及木酮糖向木糖醇的连续转化,将阿糖醇转化为木糖醇(Suzuki等人,Biosci.Biotechnol.Biochem.66:2614-2620(2002))。
微藻是可再生资源生产的有吸引力的平台。已报道了一次木糖醇在微藻中的生产,其中来自粗糙链孢霉(Neurospora crassa)的木糖还原酶在莱茵衣藻(Chlamydomonasreinhardtii)中的表达使其将少量木糖转化为木糖醇(Pourmir等人,J.Biotechnol.165:178-183(2013))。
已观察到多种丝状真菌(青霉菌种(Penicillium spp.)、曲霉属种(Aspergillusspp.)、甘薯根霉(Rhizopus nigricans)、粉红胶霉(gliocladium roseum)、黄丝衣霉(Byssochlamys fulva)、疣孢漆斑菌(Myrothecium verrucaria)、粗糙链孢霉(Neurosporacrassa)、粘红酵母(Rhodotorula glutinis)和球拟酵母(Torulopsis utilis))的提取物包含能够将木糖转化为木糖醇的酶(Chiang等人,Nature 188:79-81(1960);Chiang等人,Biochem.Biophys.Res.Commun.3:554-559(1960);Chiang等人,Biochem.Biophys.Acta.29:664-5(1958))。后续研究鉴定了能够以不同程度的效率将木糖转化为木糖醇的其它丝状真菌(艾伯塔石座菌(Petromyces albertensis)、青霉菌种(Penicillium spp.)和黑曲霉(Aspergillus niger))(Dahiya等人,Can.J.Microbiol.37:14-18(1991);Sampaio等人,Brazilian J.Microbiol.34:325-328(2003))。
里氏木霉(Trichoderma reesei)是分泌纤维素酶的丝状真菌,当为了阻断木糖醇代谢而使木糖醇脱氢酶和L-阿糖醇-4-脱氢酶的基因缺失时,其产生了更多的木糖醇(Dashtban等人,Appl.Biochem.Biotecnol.169:554-569(2013))。当木糖还原酶过表达且木酮糖激酶受抑制时,木糖醇在里氏木霉(T.reesei)中的产量升高(Hong等人,BiomedRes.Int.2014:169705(2014))。Phanerochaete sordida是具有木质素降解活性的白腐菌,当表达来自黄孢原毛平革菌(Phanerochaete chrysosporium)的木糖还原酶基因时,它产生更多的木糖醇(Hirabayashi等人,J.Biosci.Bioeng.120:6-8(2015)).
细菌通过木糖异构酶代替木糖还原酶-木糖醇脱氢酶途径代谢木糖。因此,用于木糖醇生产的细菌宿主的使用通常包括木糖还原酶的重组表达。在大肠杆菌(Escherichiacoli)中表达了来自热带假丝酵母(Candida tropicalis)的木糖还原酶并且发现它对于从木糖产生木糖醇是起作用的(Suzuki等人,J.Biosci.Bioeng.87:280-284(1999))。后续研究结合内源木酮糖激酶基因的缺失,表达了来自博伊丁假丝酵母(Candida boidinii)、纤维假丝酵母(Candida tenuis)和木糖发酵酵母(Scheffersomyces stipitis)的木糖还原酶(Cirino等人,Biotechnol.Bioeng.95:1167-1176(2006))。为了改善从葡萄糖和木糖的混合物的木糖醇生产,用克服了木糖代谢的葡萄糖阻遏的突变体替代环化AMP受体蛋白。木糖转运蛋白XylE或者XylFGH的表达具有与用突变体形式替代环化AMP受体蛋白的类似影响(Khankal等人,J.Biotehnol.134:246-252(2008))。
对于改善细菌中木糖醇的生产,辅因子再生也是重要的,这已通过大量基因缺失和辅因子再生途径的表达在大肠杆菌(E.coli)进行了研究(Chin等人,Biotechnol.Bioeng.102:209-220(2009);Chin等人,Biotechnol.Prog.27:333-341(2011);Iverson等人,World J.Microbiol.Biotechnol.29:1225-1232(2013);Iverson等人,BMC Syst.Biol.10:31(2016))。针对改善从葡萄糖和木糖的混合物生产木糖醇的另一项研究破坏了磷酸烯醇丙酮酸-依赖性葡萄糖磷酸转移酶系统以消除分解代谢产物阻遏(Su等人,Metab.Eng.31:112-122(2015))。通过破坏木糖异构酶、木酮糖激酶和磷酸烯醇丙酮酸-依赖性果糖磷酸转移酶系统,在该菌株中阻断了内源木糖代谢,并且表达粗糙链孢霉(Neurospora crassa)木糖还原酶以优化木糖醇的生产。
乳酸乳球菌(Lactococcus lactis)是乳品加工,如乳酪生产中常用的良好-鉴定的细菌,并且它可以用于其它食品-相关工艺。当它表达木糖发酵酵母(S.stipitis)的木糖还原酶和短乳杆菌(Lactobacillus brevis)的木糖转运蛋白时,乳酸乳球菌(L.lactis)能够从木糖产生木糖醇(Nyyossola等人,J.Biotechnol.118:55-56(2005))。
乳发酵短杆菌(Corynebacterium glutamicum)是具有多种工业用途,如MSG生产的细菌。已将其工程设计以共利用木糖和葡萄糖,这是木糖醇生产的重要性状(Sasaki等人,Appl.Microbiol.Biotechnol.85:105-115(2009))。为了优化乳发酵短杆菌(C.glutamicum)中木糖醇的生产,结合其乳酸脱氢酶、木酮糖激酶和磷酸烯醇丙酮酸-依赖性果糖磷酸转移酶基因的破坏,已将其工程设计以表达来自纤维假丝酵母(Candidatenuis)的戊糖转运蛋白和突变木糖还原酶(Sasaki等人,Appl.Microbiol.Biotechnol.86:1057-1066(2010))。还通过表达木糖发酵酵母(Scheffersomyces stipitis)木糖还原酶实现了乳发酵短杆菌(C.glutamicum)中木糖醇的生产(Kim等人,Enzyme Microb.Technol.46:366-371(2010))。粘质红酵母(Rhodotorulamucilaginosa)木糖还原酶、大肠杆菌(E.coli)l-阿拉伯糖异构酶、根癌农杆菌(Agrobacterium tumefaciens)d-阿洛酮糖3表异构酶、耻垢分枝杆菌(Mycobacteriumsmegmatis)l-木酮糖还原酶和融合戊糖转运蛋白的表达使得能够从木糖和阿拉伯糖的混合物产生木糖醇而不会形成阿糖醇(Dhar等人,J.Biotechnol.230:63-71(2016))。
应理解本文所提供的梅奇酵母(Metschnikowia)种可以用作木糖醇生产的宿主菌株。其它代谢工程可以用于采用梅奇酵母(Metschnikowia)种,从而在这些梅奇酵母(Metschnikowia)种中进一步提高了木糖醇的产量。
具有从木糖生产阿糖醇的生物合成途径的微生物在本领域中是已知的。在一些实施方式中,本文提供了具有从木糖生产阿糖醇的生物合成途径的梅奇酵母(Metschnikowia)种。本文还提供了通过将具有阿糖醇生物合成途径的本文所提供的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以产生阿糖醇来生产生物衍生阿糖醇的方法。
已鉴定了可以从木糖产生阿糖醇的一些酵母种。例如,最近鉴定的Zygocaccharomyces rouxxii NRRL 27,624株已知从葡萄糖产生作为主要代谢产物的D-阿糖醇(Saha等人,2007,J.Ind.Microbial.Biotechnol.,34:519-523)。然而,还将其鉴别为从木糖和从木糖和木酮糖的混合物产生D-阿糖醇和木糖醇(Saha等人,2007)。基于这些结果,从木糖产生D-阿糖醇的途径包括木糖还原酶、木糖醇脱氢酶和阿糖醇脱氢酶(Saha等人,2007)。另外,麦芽糖假丝酵母(Candida maltosa)已显示通过木酮糖还原酶从D-木酮糖产生D-阿糖醇(Cheng等人,2011,Microbial.Cell Factories,10:5)。还发现通过在德巴利酵母属(Debaryomyces)、地霉属(Geotrichum)和梅奇酵母属(Metschnikowia)内的酵母种中添加木糖和甘油,改善了阿糖醇的生产(2012年1月26日公开的国际专利申请公开WO2012/011962)。
应理解本文所提供的梅奇酵母(Metschnikowia)种可以用作阿糖醇生产的宿主菌株。其它代谢工程可以用于采用梅奇酵母(Metschnikowia)种,从而在这些梅奇酵母(Metschnikowia)种中进一步提高了阿糖醇的产量。
具有从木糖生产乙醇的生物合成途径的微生物在本领域中是已知的。在一些实施方式中,本文提供了具有编码从木糖生产乙醇的生物合成途径的酶的至少一种外源核酸的梅奇酵母(Metschnikowia)种。随着木糖吸收的提高,所述微生物还可以具有改善的从木糖产生乙醇的产量。本文还提供了通过将具有乙醇生物合成途径的本文所提供的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以产生乙醇来生产生物衍生乙醇的方法。
乙醇具有一些用途并且最常用作燃料添加剂。作为燃料添加剂,乙醇是低价值产品,其大部分生产成本归因于原料价格。因此,将期望开发用于从易得、廉价起始材料,如木质纤维素生产乙醇的产乙醇和发酵过程。目前,认为葡萄糖和木糖两者的发酵是生物质向乙醇经济转化的最优先选项。大部分微生物能够发酵葡萄糖,但已报道仅有少数有效使用木糖,并且更少数发酵这种戊糖为乙醇。
相对少数野生型微生物可以发酵D-木糖。这些微生物通常不适合大规模发酵。这种不利程度可能是(例如)由于对微生物的不熟悉、获得微生物的困难、在预处理的木质纤维素上的产量和生长不良或者当在来源于生物质的混合糖上生长时,得率不令人满意。(C.Abbas,“Lignocellulosics to ethanol:meeting ethanol demand in the future,”The Alcohol Textbook,第4版.(K.A.Jacques,T.P.Lyons and D.R.Kelsall主编).Nottingham University Press,Nottingham,UK,2003,第41-57页;C.Abbas,“Emergingbiorefineries and biotechnological applications of nonconventional yeast:nowand in the future,”The Alcohol Textbook,第4版.(K.A.Jacques,T.P.Lyons andD.R.Kelsall主编).Nottingham University Press,Nottingham,United Kingdom,2003,第171-191页)。
酵母被认为是用于木糖酒精发酵的有前景的微生物(参见Ryabova,如上)。它们具有比细菌更大的细胞,耐受病毒感染并且往往更耐受来自乙醇的负反馈。此外,已对于一些种广泛研究了酵母的生长和代谢。
已知一些酵母天然发酵D-木糖。这些包括(例如)树干毕赤酵母(Pichiastipitis)、休哈塔假丝酵母(Candida shehatae)和嗜鞣管囊酵母(Pachysolentannophilus)(参见Ryabova,如上;Cite 2,C.Abbas 2003)。常见的啤酒酵母酿酒酵母(Saccharomyces cerevisiae)已知天然不发酵D-木糖,但是已报道了的确发酵D-木糖的一些代谢工程酿酒酵母(S.cerevisiae)株。
大量研究已描述了通过重组酿酒酵母(S.cerevisiae)的D-木糖代谢(参见,例如,Matsushika等人,Applied Microbiology and Biotechnology 84,no.1(2009):37-53;美国专利公开No.2005/0153411A1(Jul.14,2005);美国专利公开No.2004/0231661A1(Nov.25,2004);美国专利公开No.4,368,268(1983年1月11日);美国专利公开No.6,582,944(2003年6月24日);美国专利公开No.7,226,735(2007年6月5日);美国专利公开No.2004/0142456A1(2004年7月22日);Jeffries,T.W.&Jin,Y-S.,Appl.Microbiol.Biotechnol.63:495-509(2004);Jin,Y-S.,Met.Eng.6:229-238(2004);Pitkanen,J-Y.,Helsinki Univ.of Tech.,Dept.of Chem.Tech.,TechnicalBiochemistry Report(2005年1月);Porro,D.等人,App.&Env.Microbiol.65(9):4211-4215(1999);Jin,Y-S.,等人,App.&Env.Microbiol.70(11):6816-6825(2004);Sybirna,K,等人,Curr.Genetics 47(3):172-181(2005);Toivari,M.H.等人,Metabolic Eng.3:236-249(2001)。
酵母中D-木糖的代谢沿类似于通过戊糖磷酸途径的葡萄糖代谢的途径进行。来自D-木糖的碳通过糖酵解过程被加工成乙醇或者通过呼吸性TCA酸环被加工成CO2。向乙醇的发酵部分依赖于丙酮酸盐代谢,它是可以在呼吸或发酵中使用的代谢产物(参见van Hoek,P.,等人,Appl.&Enviro.Microbiol.64(6);2133-2140(1998))。丙酮酸盐在丙酮酸盐通过丙酮酸脱羧酶(E.C.4.1.1.1)脱羧为乙醛后进入发酵。丙酮酸脱羧酶是生物素-依赖性羧化酶家组成员。它通过ATP裂解催化丙酮酸盐脱羧以形成丁酮二酸盐。丁酮二酸盐可以用于脂肪、葡萄糖和一些氨基酸或其它衍生物的合成。所述酶是高度保守的并且存在于多种原核生物和真核生物中。
能够从木糖产生乙醇的其它微生物在本领域中也是已知的。已报道耐热甲醇营养型酵母多形汉逊酵母(Hansenula polymorpha)(也称为安格斯毕赤酵母(Pichiaangusta))分别具有37℃和48℃的最适和最高生长温度,并且在一定条件下可以天然发酵D-木糖。(US 8071298;Voronovsky等人,FEMS Yeast Res.5(11):1055-62(2005))。另外,已报道当经受好氧和微好氧条件两者时,三株树干毕赤酵母(Pichia stipitis)和三株休哈塔假丝酵母(Candida shehatae)发酵木糖。在所考虑的菌株中,树干毕赤酵母(P.stipitis)NRRL Y-7124能够以0.39g每克木糖的得率(76%的理论得率)和与休哈塔假丝酵母(C.shehatae)NRRL Y-12878所显示的最快速度相当的速度利用好氧提供的几乎150g/L木糖的7g/L以产生52g/L乙醇。对于所有测试株,由好氧培养所产生的发酵比微好氧培养的更有利。Slininger,P.J.等人,Biotechnol Lett(1985)7:431。
例如,在葡萄糖、果糖和蔗糖上生长的产乙醇细菌运动发酵单胞菌(Zymomonasmobilis)通过Entner-Douderoff途径将这些糖代谢为CO2和乙醇。尽管野生菌株不可以使用木糖作为碳源,但是已工程设计了能够在这种糖上生长的运动发酵单胞菌(Z.mobilis)的重组株(美国专利公开No.20080187973,美国专利公开No.5,514,583,美国专利公开No.5,712,133,WO 95/28476,Feldmann等人(1992)Appl Microbiol Biotechnol 38:354-361,Zhang等人(1995)Science 267:240-243)。
已报道了通过重组大肠杆菌(Escherichia coli)的木糖向乙醇的转化。添加少量的钙、镁和亚铁离子刺激发酵。Beall等人,Biotechnology and Bioengineering 38,no.3(1991):296-303。
应理解本文所提供的梅奇酵母(Metschnikowia)种可以用作乙醇生产的宿主菌株。其它代谢工程可以用于采用梅奇酵母(Metschnikowia)种,从而在这些梅奇酵母(Metschnikowia)种中进一步提高了乙醇的产量。
具有从木糖生产正丁醇的生物合成途径的微生物在本领域中是已知的。在一些实施方式中,本文提供了具有编码从木糖生产正丁醇的生物合成途径的酶的至少一种外源核酸的梅奇酵母(Metschnikowia)种。随着木糖吸收的提高,所述微生物还可以具有改善的从木糖产生正丁醇的产量。本文还提供了通过将具有正丁醇生物合成途径的本文所提供的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以产生正丁醇来生产生物衍生正丁醇的方法。
丁醇作为燃料提供了一些优势。丁醇是四碳醇,它是和大部分溶剂(醇、醚、醛、酮和烃)可混溶的透明中性液体并且微溶于水(与完全可混溶的乙醇相比,水溶性6.3%)。它具有与汽油相当的辛烷值,这使其成为制备用于燃烧汽油的任何内燃机的有价值的燃料。燃料测试也已证明丁醇在存在水的情况下不会发生相分离,并且对弹性体膨胀无不利影响。丁醇不仅具有比乙醇更接近于汽油的更高的含能量,因此它在燃料经济性方面的妥协性更低,而且由于其低蒸气压,它还可以容易地添加至常规汽油。
可以通过丙酮、丁醇和乙醇发酵途径(“ABE途径”)实现丁醇的生物合成。使用细菌醋酪酸梭状芽孢杆菌的溶剂-产生种,这种丁醇发酵生产途径的产物为6份丁醇、3份丙酮和1份乙醇。已将丁醇-生产途径引入多种宿主生物。例如,出于它们的高生长速率和遗传工具效率,在大肠杆菌(Escherichia coli)(Atsumi等人,Nature 451:86-89(2008))和酿酒酵母(Saccharomyces cerevisiae)(Steen等人,Microb.Cell Fact 7:36(2008))中表达了该途径。出于它们潜在更高的溶剂耐受性,使用了恶臭假单胞菌(Pseudomonas putida),短乳杆菌(Lactobacillus brevis)和枯草芽孢杆菌(Bacillus subtilis)(Nielsen等人,Metab.Eng.11:262-273(2009);Berezina等人,Appl.Microbiol.Biot.87:635-646(2010))。
使用粮食作物作为起始材料用于丁醇生产的替代是生物质,具体地木质纤维素生物质。已将梭菌(Clostridium spp.)株工程设计以对于木糖产生丁醇,如糖化丙酮丁醇梭菌(C.saccharoperbutylacetonicum)(例如,糖化丙酮丁醇梭菌(C.saccharoperbutylacetonicum)株ATCC 27021或者糖化丙酮丁醇梭菌(C.saccharoperbutylacetonicum)株ATCC 27022)。参见,例如,美国专利No.8900841。将解纤维梭菌(Clostridium cellulolyticum)工程设计以改变其天然缬氨酸合成途径用于从结晶纤维素生产异丁醇(Higashide等人,Appl.Environ.Microb.77:2727-2733(2011))。向噬纤维梭菌(Clostridium cellulovorans),其天然产生丁酸作为主要代谢产物,引入醛/醇脱氢酶(AdhE2)以将来自纤维素的前体丁酰-CoA转化为1-丁醇(Yang等人,Metab.Eng.32:39-48(2015))。还使用解糖热厌氧杆菌(Thermoanaerobacteriumsaccharolyticum)显示了从木糖生产1-丁醇(Bhandiwad等人,Metab.Eng.21:17-25(2014))。
为了提高纤维素分解速率并减少污染的机会,使用了嗜热微生物。使用纤维二糖作为底物,在热葡糖苷酶地芽孢杆菌(Geobacillus thermoglucosidasius)中显示了嗜热生物中异丁醇生产的第一实例(Lin等人,Metab.Eng.24:1-8(2014))。在本研究中,研究了参与异丁醇合成的酶的热稳定性。将本研究的结果应用于通过表达和优化异丁醇生物合成途径,在热纤维梭菌(Clostridium thermocellum)中将纤维素直接转化为异丁醇(Lin等人,Metab.Eng.31:44-52(2015))。
最有效的乙醇-产生酵母之一,酿酒酵母(S.cerevisiae)具有一些优势,如从己糖产生乙醇的高产量和对乙醇以及木质纤维素生物质的酸解产物中的其它抑制化合物的高耐受性。尽管这种酵母的标准株不可以使用戊糖,如木糖,但是可以通过整合用于木糖吸收途径,如来自树干毕赤酵母(Pichia stipitis)的木糖还原酶和木糖醇脱氢酶的细胞间表达的基因和用于展示来自棘孢曲霉(A.acleatus)的β-葡萄糖苷酶的基因提供可以发酵木糖和纤维寡糖的重组酵母菌株。参见,例如,美国专利公开No.20100129885;美国专利公开No.20100261241。
应理解本文所提供的梅奇酵母(Metschnikowia)种可以用作正丁醇生产的宿主菌株。其它代谢工程可以用于采用梅奇酵母(Metschnikowia)种,从而在这些梅奇酵母(Metschnikowia)种中进一步提高了正丁醇的产量。
具有从木糖生产异丁醇的生物合成途径的微生物在本领域中是已知的。在一些实施方式中,本文提供了具有编码从木糖生产异丁醇的生物合成途径的酶的至少一种外源核酸的梅奇酵母(Metschnikowia)种。随着木糖吸收的提高,所述微生物还可以具有改善的从木糖产生异丁醇的产量。本文还提供了通过将具有异丁醇生物合成途径的本文所提供的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以产生异丁醇来生产生物衍生异丁醇的方法。
异丁醇,也是生物燃料候选,已在表达异源五步骤代谢途径的重组微生物中得到生产(参见,例如,WO/2007/050671、WO/2008/098227和WO/2009/103533)。包括用于从五-碳(戊糖)糖,包括木糖生产异丁醇的途径的重组微生物在本领域中也是已知的。(参见,例如,WO 2012173659;WO 2011153144)。可以工程设计重组微生物以表达功能性外源木糖异构酶。在酵母中起作用的外源木糖异构酶在本领域中是已知的。参见,例如,US2006/0234364。外源木糖异构酶基因可以操作性连接至在酵母细胞中起作用的启动子和终止子序列。
例如,重组酿酒酵母(Saccharomyces cerevisiae)已知从木糖产生异丁醇。参见,例如,US20130035515,Brat等人,FEMS yeast research 13.2(2013):241-244;Lee,Won-Heong等人Bioprocess and biosystems engineering 35.9(2012):1467-1475。将优化的,胞质定位的缬氨酸生物合成途径的过表达与来自植物发酵梭菌(Clostridiumphytofermentans)的木糖异构酶XylA、转二羟丙酮基酶Tal1和木酮糖激酶Xks1的过表达一起同时进行使得重组酿酒酵母(Saccharomyces cerevisiae)细胞能够补足ilv2,3,5三重缺失突变体的缬氨酸营养缺陷以用于在作为唯一碳源的d-木糖上生长。此外,在酮酸脱羧酶Aro10和乙醇脱氢酶Adh2的额外过表达之后,细胞能够直接将D-木糖发酵为异丁醇。
应理解本文所提供的梅奇酵母(Metschnikowia)种可以用作异丁醇生产的宿主菌株。其它代谢工程可以用于采用梅奇酵母(Metschnikowia)种,从而在这些梅奇酵母(Metschnikowia)种中进一步提高了异丁醇的产量。
具有从木糖生产异丙醇的生物合成途径的微生物在本领域中是已知的。在一些实施方式中,本文提供了具有编码从木糖生产异丙醇的生物合成途径的酶的至少一种外源核酸的梅奇酵母(Metschnikowia)种。随着木糖吸收的提高,所述微生物还可以具有改善的从木糖产生异丙醇的产量。本文还提供了通过将具有异丙醇生物合成途径的本文所提供的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以产生异丙醇来生产生物衍生异丙醇的方法。
乙烯的聚合提供了聚乙烯,它是一类具有多种有用应用的塑料。传统上,通过炼制的非可再生化石燃料生产乙烯,但是生物学衍生的乙醇脱水为乙烯提供了从可再生碳源,即来自可发酵糖发酵的乙醇生产乙烯的替代途径。类似地,异丙醇和正丙醇可以脱水为丙烯,其反过来可以聚合为聚丙烯。和聚乙烯一样,使用生物学-衍生的丙醇作为起始材料(即,异丙醇或正丙醇)将导致产生“绿色聚丙烯”。参见,例如,WO 2009/049274,WO 2009/103026,WO 2009/131286,WO 2010/071697,WO 2011/031897,WO 2011/029166,WO 2011/022651,WO 2012/058603。
已在工程设计以具有异丙醇途径并且产生提高的量的异丙醇的重组乳杆菌(Lactobacillus)宿主细胞(例如,儒氏乳杆菌(Lactobacillus reuteri))中观察到了异丙醇的生产。参见,例如,WO2013178699A1。还观察到了使用合成途径,通过工程设计的大肠杆菌(Escherichia coli),从纤维二糖直接生产异丙醇。参见,例如,Soma等人,Journal ofbioscience and bioengineering 114.1(2012):80-85。
应理解本文所提供的梅奇酵母(Metschnikowia)种可以用作异丙醇生产的宿主菌株。其它代谢工程可以用于采用梅奇酵母(Metschnikowia)种,从而在这些梅奇酵母(Metschnikowia)种中进一步提高了异丙醇的产量。
具有从木糖生产乙酸乙酯的生物合成途径的微生物在本领域中是已知的。在一些实施方式中,本文提供了具有编码从木糖生产乙酸乙酯的生物合成途径的酶的至少一种外源核酸的梅奇酵母(Metschnikowia)种。随着木糖吸收的提高,所述微生物还可以具有改善的从木糖产生乙酸乙酯的产量。本文还提供了通过将具有乙酸乙酯生物合成途径的本文所提供的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以产生乙酸乙酯来生产生物衍生乙酸乙酯的方法。
乙酸乙酯是环境友好的溶剂,其具有多种工业应用。乙酸乙酯的微生物合成是所期望的。酵母产生大量这种酯的能力是长期已知的,并且可以应用于从可再生原材料的大规模酯生产。异常毕赤酵母(Pichia anomala)、产朊假丝酵母(Candida utilis)和马克斯克鲁维酵母(Kluyveromyces marxianus)是以高得率将糖转化为乙酸乙酯的酵母。等人,Appl Microbiol Biotechnol(2014)98:5397–5415。
多种乙酸乙酯的合成需要氧,这通常通过通气来提供。乙酸乙酯是易挥发的,从而通气导致其相转移和汽提。这种汽提过程不可避免,但是在实验期间需要充分处理,并且提供了合成酯成本有效的过程集成回收的机会。
应理解本文所提供的梅奇酵母(Metschnikowia)种可以用作乙酸乙酯生产的宿主菌株。其它代谢工程可以用于采用梅奇酵母(Metschnikowia)种,从而在这些梅奇酵母(Metschnikowia)种中进一步提高了乙酸乙酯的产量。
具有从木糖生产苯基-乙醇的生物合成途径的微生物在本领域中是已知的。在一些实施方式中,本文提供了具有编码从木糖生产苯基-乙醇的生物合成途径的酶的至少一种外源核酸的梅奇酵母(Metschnikowia)种。随着木糖吸收的提高,所述微生物还可以具有改善的从木糖产生苯基-乙醇的产量。本文还提供了通过将具有苯基-乙醇生物合成途径的本文所提供的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以产生苯基-乙醇来生产生物衍生苯基-乙醇的方法。
苯基-乙醇是可以通过微生物生产的无色、透明、轻微粘度液体。已发现苯基-乙醇存在于一些天然精油中、食物、香料和烟草中,以及未蒸馏的酒精饮料、啤酒和酒中。它防止或延缓细菌生长,并因此保护化妆品和个人护理产物不会腐坏。苯基-乙醇还赋予产品香味。
应理解本文所提供的梅奇酵母(Metschnikowia)种可以用作苯基-乙醇生产的宿主菌株。其它代谢工程可以用于采用梅奇酵母(Metschnikowia)种,从而在这些梅奇酵母(Metschnikowia)种中进一步提高了苯基-乙醇的产量。
具有从木糖生产2-甲基-丁醇的生物合成途径的微生物在本领域中是已知的。在一些实施方式中,本文提供了具有编码从木糖生产2-甲基-丁醇的生物合成途径的酶的至少一种外源核酸的梅奇酵母(Metschnikowia)种。随着木糖吸收的提高,所述微生物还可以具有改善的从木糖产生2-甲基-丁醇的产量。本文还提供了通过将具有2-甲基-丁醇生物合成途径的本文所提供的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以产生2-甲基-丁醇来生产生物衍生2-甲基-丁醇的方法。
2-甲基-丁醇可以用作溶剂和其它化学品生产中的中间体。2-甲基-丁醇还应用于燃料和润滑油添加剂、浮选助剂、腐蚀抑制剂的生产、药物、油漆溶剂和萃取剂。
应理解本文所提供的梅奇酵母(Metschnikowia)种可以用作3-甲基丁醇生产的宿主菌株。其它代谢工程可以用于采用梅奇酵母(Metschnikowia)种,从而在这些梅奇酵母(Metschnikowia)种中进一步提高了2-甲基丁醇的产量。
具有从木糖生产3-甲基-丁醇的生物合成途径的微生物在本领域中是已知的。在一些实施方式中,本文提供了具有编码从木糖生产3-甲基-丁醇的生物合成途径的酶的至少一种外源核酸的梅奇酵母(Metschnikowia)种。随着木糖吸收的提高,所述微生物还可以具有改善的从木糖产生3-甲基-丁醇的产量。本文还提供了通过将具有3-甲基-丁醇生物合成途径的本文所提供的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以产生3-甲基-丁醇来生产生物衍生3-甲基-丁醇的方法。
3-甲基-丁醇(也称为异戊醇)是透明、无色的醇。3-甲基-丁醇是香蕉油生产中的主要成分,它是自然界中存在的酯并且还在工业中作为风味剂生产。它也是用于细菌鉴定性吲哚试验的柯氏试剂的主要成分。3-甲基-丁醇还在氯仿:异戊醇试剂中用作消泡剂。
应理解本文所提供的梅奇酵母(Metschnikowia)种可以用作3-甲基-丁醇生产的宿主菌株。其它代谢工程可以用于采用梅奇酵母(Metschnikowia)种,从而在这些梅奇酵母(Metschnikowia)种中进一步提高了3-甲基-丁醇的产量。
基于对于特定化合物的梅奇酵母(Metschnikowia)种的生物合成途径组成,本文所提供的梅奇酵母(Metschnikowia)种可以包括至少一种外源表达的生物合成途径-编码核酸和多达全部所述化合物的一种或多种生物合成途径的编码核酸。所述化合物可以是(例如)木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或者3-甲基-丁醇。例如,可以通过相应编码核酸的外源表达,在缺乏从木糖生产乙醇所需的途径酶或蛋白的梅奇酵母(Metschnikowia)种中建立乙醇的生物合成。换言之,在缺乏乙醇途径的全部的酶或蛋白的梅奇酵母(Metschnikowia)种中,可以包括所述途径中的所有酶或蛋白的外源表达,尽管应理解即使所述梅奇酵母(Metschnikowia)种含有所述途径酶或蛋白中的至少一种,但是仍可以表达所述途径的全部酶或蛋白。例如,可以在本文所提供的H0梅奇酵母(Metschnikowia)种中包括用于乙醇生产的途径中的全部酶或蛋白的外源表达以提高从木糖生产乙醇的产量,尽管所述H0梅奇酵母(Metschnikowia)种具有从木糖产生乙醇的生物合成途径的所有酶的内源表达。
考虑到本文所提供的教导和指导,本领域技术人员将理解以可表达形式引入的编码核酸的数目将至少与梅奇酵母(Metschnikowia)种的途径缺陷平行。因此,本文所提供的梅奇酵母(Metschnikowia)种可以具有1、2、3、4、5、6、7或8个以至多达全部编码构成生物合成途径的酶或蛋白的核酸。在一些实施方式中,所述梅奇酵母(Metschnikowia)种还可以包括有利于或优化特定化合物的生物合成或者赋予宿主微生物其它有用功能的其它遗传修饰。一种这种其它功能可以包括(例如)特定化合物的一个或多个途径前体的合成增强。
在一些实施方式中,本文所提供的梅奇酵母(Metschnikowia)种含有从木糖合成化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯或苯基-乙醇的酶促能力。在该具体实施方式中,它对于提高化合物的合成或积累可以是有用的,以(例如)驱使生物合成途径反应向所期望的化合物的生产进行。可以通过(例如)编码用于从木糖生产化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯或苯基-乙醇的一个或多个生物合成途径酶或蛋白的核酸的过表达来完成合成或积累的提高。可以(例如)通过内源基因的外源表达或者通过异源基因的外源表达来进行所期望的途径的生物合成途径的酶和/或蛋白的过表达。因此,可以容易地修饰如本文所提供的梅奇酵母(Metschnikowia)种以用于产生所期望的化合物,例如,通过1、2、3、4、5个和多达全部编码所期望的产物的生物合成途径酶或蛋白的核酸的过表达。另外,可以通过导致生物合成途径中的酶活性提高的内源基因突变来产生梅奇酵母(Metschnikowia)种。
在特别有用的实施方式中,使用编码核酸的外源表达。外源表达赋予了定制宿主的表达和/或调控元件的能力和实现通过用户控制的所期望的表达水平的应用。然而,在其它实施方式中,也可以使用内源表达,如当与诱导型启动子或者其它调控元件连接时,通过除去负调控效应因子或者基因启动子的诱导。因此,可以通过提供适当的诱导剂来上调具有天然存在的诱导型启动子的内源基因,或者可以工程设计内源基因的调控区以引入诱导型调控元件,借此使得能够在所期望的时间调控内源基因表达的提高。类似地,可以作为引入梅奇酵母(Metschnikowia)种的外源基因的调控元件包含诱导型启动子。
应理解可以将本文所述的一种或多种外源核酸中的任一种引入梅奇酵母(Metschnikowia)种以产生所期望的化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇的产量提高的梅奇酵母(Metschnikowia)种。可以引入核酸以给予(例如)微生物从木糖产生乙醇的生物合成途径。作为另外一种选择,可以引入编码核酸以产生中间梅奇酵母(Metschnikowia)种,其具有催化一些所期望的反应的生物合成能力以赋予生物合成能力。例如,具有生物合成途径的梅奇酵母(Metschnikowia)种可以包含编码所期望的酶或蛋白的至少两个外源核酸。因此,应理解可以在本文所提供的梅奇酵母(Metschnikowia)种中包含生物合成途径的两种或更多种酶或蛋白的任何组合。类似地,应理解可以在本文所提供的梅奇酵母(Metschnikowia)种中包含生物合成途径的三个或以上的酶或蛋白的任意组合,只要所期望的生物合成途径的酶和/或蛋白的组合导致相应所期望的化合物的产生。类似地,根据需要,可以在本文所提供的梅奇酵母(Metschnikowia)种中包含如本文所公开的生物合成途径的四个或以上的酶或蛋白的任意组合,只要所期望的生物合成途径的酶和/或蛋白的组合导致相应所期望的化合物的产生。
除如本文所述的所期望的化合物的生物合成外,还可以以彼此和/或与本领域中熟知的其它微生物和方法的不同组合使用本文所提供的梅奇酵母(Metschnikowia)种和方法以实现通过其它途径的化合物生物合成。例如,除乙醇生产菌的使用以外,生产乙醇的一种替代方法是通过添加能够将乙醇途径中间产物转化为乙醇的梅奇酵母(Metschnikowia)种。一种这种程序包括(例如)通过产生乙醇途径中间产物的梅奇酵母(Metschnikowia)种的发酵。然后,乙醇途径中间产物可以用作将乙醇途径中间产物转化为乙醇的第二微生物的底物。可以将乙醇途径中间产物直接添加至第二生物的另一培养,或者可以通过(例如)细胞分离从乙醇途径中间产物产生菌的原始培养中除去这些梅奇酵母(Metschnikowia)种,然后可以使用向发酵肉汤的第二生物的后续添加以产生最终化合物,而不使用中间产物纯化步骤。尽管在本文中将乙醇用作实例,但是相同方法可以用于其它所期望的化合物的生产,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇。
在其它实施方式中,可以以多种子途径组合本文所提供的梅奇酵母(Metschnikowia)种和方法以实现所期望的化合物的生物合成。在这些实施方式中,本文所述的所期望的化合物的生物合成途径可以分离成不同的梅奇酵母(Metschnikowia)种,并且所述不同的梅奇酵母(Metschnikowia)种可以共培养以产生最终化合物。在该生物合成方案中,一种微生物的化合物是第二微生物的底物,直至合成了最终的化合物。例如,可以通过构建含有用于一种途径中间产物向另一种途径中间产物或者化合物的转化的生物合成途径的微生物来完成所期望的化合物的生物合成。作为另外一种选择,还可以通过使用两种生物在相同容器中的共培养或共发酵,通过生物合成从梅奇酵母(Metschnikowia)种产生所期望的化合物,其中所述第一微生物产生所期望的化合物的中间产物,而第二微生物将所述中间产物转化为所期望的化合物。所期望的化合物可以是木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或者3-甲基-丁醇。
考虑到本文所提供的教导和指导,本领域技术人员将理解对于本文所提供的梅奇酵母(Metschnikowia)种和方法,与其它梅奇酵母(Metschnikowia)种,与具有子途径的其它梅奇酵母(Metschnikowia)种的共培养以及与在本领域中熟知的产生所期望的化合物的其它化学和/或生物化学程序的组合一起存在多种组合和排列。
本文提供了生产如本文所述的生物衍生化合物的方法。这些方法可以包括将具有代谢途径的分离的梅奇酵母(Metschnikowia)种在从木糖生产所述生物衍生化合物的条件下培养足够的一段时间来用于生产所述生物衍生化合物。因此,在一些实施方式中,本文提供了用于生产木糖醇的方法,其包括将本文所述的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生木糖醇。在一些实施方式中,本文提供了用于生产阿糖醇的方法,其包括将本文所述的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生阿糖醇。在一些实施方式中,本文提供了用于生产乙醇的方法,其包括将本文所述的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生乙醇。在一些实施方式中,本文提供了用于生产正丁醇的方法,其包括将本文所述的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生正丁醇。在一些实施方式中,本文提供了用于生产异丁醇的方法,其包括将本文所述的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生异丁醇。在一些实施方式中,本文提供了用于生产异丙醇的方法,其包括将本文所述的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生异丙醇。在一些实施方式中,本文提供了用于生产乙酸乙酯的方法,其包括将本文所述的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生乙酸乙酯。在一些实施方式中,本文提供了用于生产苯基-乙醇的方法,其包括将本文所述的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生苯基-乙醇。在一些实施方式中,本文提供了用于生产2-甲基-丁醇的方法,其包括将本文所述的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生2-甲基-丁醇。在一些实施方式中,本文提供了用于生产3-甲基-丁醇的方法,其包括将本文所述的分离的梅奇酵母(Metschnikowia)种在一定条件下培养足够的一段时间以从木糖产生3-甲基-丁醇。
本文所提供的方法包括以指定速率、转化效率和/或浓度产生所述生物衍生化合物。因此,在一些实施方式中,本文所提供的方法以至少0.1g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.2g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.3g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.4g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.50g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.60g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.70g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.80g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.90g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少1.00g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少1.50g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少2.00g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少2.50g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少3.00g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少3.50g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少4.00g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少5.00g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少6.00g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少7.00g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少8.00g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少9.00g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少10.00g/L/h的速率从木糖产生所述生物衍生化合物(例如,木糖醇)。
在一些实施方式中,本文所提供的方法以至少0.01g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.02g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.03g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.04g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.05g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.06g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.07g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.08g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.09g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.1g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.15g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.2g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.25g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.3g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.35g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.4g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.45g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.5g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.55g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.6g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.65g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.7g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.75g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.8g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.85g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.9g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少0.95g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少1g生物衍生化合物每1g木糖的转化效率从木糖产生所述生物衍生化合物(例如,木糖醇)。
在一些实施方式中,本文所提供的方法以至少1g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少2g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少3g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少4g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少5g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少10g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少20g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少30g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少40g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少50g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少60g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少70g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少80g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少90g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少100g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少150g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少200g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少250g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少300g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少350g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少400g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。在一些实施方式中,本文所提供的方法以至少500g/L的浓度从木糖产生所述生物衍生化合物(例如,木糖醇)。
可以培养本文所述的任何梅奇酵母(Metschnikowia)种以产生和/或分泌所期望的生物衍生化合物,其包括,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇,2-甲基-丁醇或者3-甲基-丁醇。例如,可以培养本文所提供的梅奇酵母(Metschnikowia)种用于生物合成生产所期望的化合物。因此,在一些实施方式中,本文提供了含有本文所述的所期望的生物衍生化合物或其中间体的培养基。在一些方面,还可以将培养基与产生所期望的生物衍生化合物或其中间体的梅奇酵母(Metschnikowia)种分离。将微生物与培养基分离的方法在本领域中是熟知的。示例性方法包括过滤、絮凝、沉淀、离心、沉降等。
对于所期望的生物衍生化合物,包括木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或者3-甲基-丁醇的生产,在具有碳源及其它必需营养素的培养基中培养本文所提供的梅奇酵母(Metschnikowia)种。在一些实施方式中,在好氧培养基中培养本文所提供的梅奇酵母(Metschnikowia)种。所述好氧培养可以是分批、补料-分批或连续培养,其中培养基中的溶氧高于50%饱和。在一些实施方式中,在基本厌氧培养基中培养本文所提供的梅奇酵母(Metschnikowia)种。如本文所述,实现所期望的化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇的生物合成的一个示例性生长条件包括厌氧培养或发酵条件。在某些实施方式中,本文所提供的梅奇酵母(Metschnikowia)种可以在厌氧或基本厌氧条件下维持、培养或发酵。简要地,厌氧条件是指缺少氧的环境。基本厌氧条件包括(例如)培养、分批发酵或连续发酵,从而培养基中的溶氧浓度保持在0至10%饱和之间。基本厌氧条件还包括将细胞在维持在小于1%的氧的气氛的密封盒内的液体培养基或固体琼脂上生长或休眠。可以通过(例如)用N2/CO2的混合物或者其它适合的非氧气或气体向培养中鼓泡来维持氧的百分比。
有时希望在发酵罐中维持厌氧条件以降低整个过程的成本。可以(例如)通过首先用氮气向培养基鼓泡,然后用隔膜和钳口盖密封烧瓶来获得这些条件。对于未观察到厌氧生长的菌株,可以通过用小孔使隔膜穿孔以用于有限通气来施加微氧或基本厌氧条件。先前已描述了示例性厌氧条件并且所述示例性厌氧条件在本领域中是熟知的。在(例如)2007年8月10日提交的美国专利公开2009/0047719中描述了示例性的好氧和厌氧条件。如本文所公开的,可以以分批、补料-分批或连续方式进行发酵。如果需要,还可以在两相中进行发酵。第一相可以是好氧的以允许高生长,并因此允许高产量,然后是高得率的厌氧相。
如果需要,可以根据需要,通过添加碱,如NaOH或其它碱,或者酸将培养基的pH维持在所期望的pH,如约5.5-6.5的pH,以将培养基维持在所期望的pH。可以使用分光光度计通过测量光密度(600nm)来确定生长速率,并且可以通过监测碳源随时间的减少来确定木糖的吸收速率。
用于本文所提供的梅奇酵母(Metschnikowia)种的培养基可以包括木糖,其作为唯一碳源或者与本文所述的或本领域中已知的一种或多种共基质结合。所述培养基还可以包含其它补充剂,如酵母提取物和/或蛋白胨。所述培养基还可以包含(例如)任何其它碳水化合物源,其可以向梅奇酵母(Metschnikowia)种提供碳源。这些碳源包括,例如:其它糖,如纤维二糖、半乳糖、葡萄糖、乙醇、乙酸酯、阿糖醇、山梨糖醇和甘油。因此,所述培养基可以包含木糖和共基质葡萄糖。所述培养基可以包含木糖和共基质纤维二糖。所述培养基可以包含木糖和共基质半乳糖。所述培养基可以包含木糖和共基质甘油。所述培养基可以包含葡萄糖、木糖和纤维二糖的组合。所述培养基可以包含葡萄糖、木糖和半乳糖的组合。所述培养基可以包含葡萄糖、木糖和甘油的组合。所述培养基可以包含木糖、纤维二糖、半乳糖和甘油的组合。
所述培养基可以具有1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%或更高的量的碳源(w/v)。在一些实施方式中,所述培养基可以具有2%的碳源。在一些实施方式中,所述培养基可以具有4%的碳源。在一些实施方式中,所述培养基可以具有10%的碳源。在一些实施方式中,所述培养基可以具有1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%或更高的量的木糖(w/v)。所述培养基可以具有1%的木糖。所述培养基可以具有2%的木糖。所述培养基可以具有3%的木糖。所述培养基可以具有4%的木糖。所述培养基可以具有5%的木糖。所述培养基可以具有6%的木糖。所述培养基可以具有7%的木糖。所述培养基可以具有8%的木糖。所述培养基可以具有9%的木糖。所述培养基可以具有10%的木糖。所述培养基可以具有11%的木糖。所述培养基可以具有12%的木糖。所述培养基可以具有13%的木糖。所述培养基可以具有14%的木糖。所述培养基可以具有15%的木糖。所述培养基可以具有16%的木糖。所述培养基可以具有17%的木糖。所述培养基可以具有18%的木糖。所述培养基可以具有19%的木糖。所述培养基可以具有20%的木糖。
在一些实施方式中,木糖不是唯一碳源。例如,在一些实施方式中,所述培养基包括木糖和C3碳源、C4碳源、C5碳源、C6碳源或它们的组合。因此,在一些实施方式中,所述培养基包括木糖和C3碳源(例如,甘油)。在一些实施方式中,所述培养基包括木糖和C4碳源(例如,赤藓糖或苏糖)。在一些实施方式中,所述培养基包括木糖和C5碳源(例如,阿糖醇、核糖或来苏糖)。在一些实施方式中,所述培养基包括木糖和C6碳源(例如,葡萄糖、半乳糖、甘露糖、阿洛糖、阿卓糖、古洛糖和艾杜糖)。作为另外一种选择或者另外,在一些实施方式中,所述培养基包括木糖和纤维二糖、半乳糖、葡萄糖、阿糖醇、山梨糖醇和甘油或它们的组合。在具体的实施方式中,所述培养基包括木糖和葡萄糖。培养基中两种或更多种碳源的量可以独立地在1%至20%(例如,1%至20%的木糖和1%至20%的葡萄糖),或者2%至14%(例如,2%至14%的木糖和2%至14%的葡萄糖),或者4%至10%(例如,4%至10%的木糖和4%至10%)的范围内。在具体的实施方式中,每种碳源的量为2%(例如,2%的木糖和2%的葡萄糖)。
所述培养基可以是富含C5的培养基,其以五碳糖(如木糖)作为主要碳源。所述培养基还可以具有C6糖(六碳糖)。在一些实施方式中,所述培养基可以具有C6糖作为主要碳源。在一些实施方式中,所述C6糖是葡萄糖。所述培养可以具有C6糖和C5糖两者作为碳源,并且可以具有以不同比例存在的C6糖和C5糖。在一些实施方式中,培养基中C6糖的量与C5糖的量的比(C6:C5比)在约10:1至约1:20之间。例如,培养基中C6:C5比可以为约10:1、9:1、8:1、7:1、6:1、5:1、3:1、2:1、1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19或者1:20。在一些实施方式中,培养基中C6:C5比为约3:1。在一些实施方式中,培养基中C6:C5比为约1:1。在一些实施方式中,培养基中C6:C5比为约1:5。在一些实施方式中,培养基中C6:C5比为约1:10。所述C5糖可以是木糖,并且所述C6糖可以是葡萄糖。在一些实施方式中,培养基中葡萄糖的量与木糖的量的比(葡萄糖:木糖比)在约20:1至约1:10之间。例如,培养基中葡萄糖:木糖比可以为约20:1、19:1、18:1、17:1、16:1、15:1、14:1、13:1、12:1、11:1、10:1、9:1、8:1、7:1、6:1、5:1、3:1、2:1、1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9或者1:10。在一些实施方式中,培养基中葡萄糖:木糖比为约3:1。在一些实施方式中,培养基中葡萄糖:木糖比为约1:1。在一些实施方式中,培养基中葡萄糖:木糖比为约1:5。在一些实施方式中,培养基中葡萄糖:木糖比为约1:10。
其它碳水化合物源包括(例如)可再生原料和生物质。在本文所提供的方法中可以用作原料的示例性生物质类型包括纤维素生物质和半纤维素生物质原料或原料部分。这些生物质原料含有(例如)作为碳源有用的碳水化合物基质,如木糖、葡萄糖、阿拉伯糖、半乳糖、甘露糖、果糖和淀粉。考虑到本文所提供的教导和指导,本领域技术人员将理解以上举例说明的那些以外的可再生原料和生物质也可以用于培养本文所提供的梅奇酵母(Metschnikowia)种以用于生产所期望的生物衍生化合物,包括,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇。
因此,考虑到本文所提供的教导和指导,本领域技术人员将理解当在作为碳源的木糖上生长时,可以产生分泌本文所述的生物合成的化合物的梅奇酵母(Metschnikowia)种。这些化合物包括(例如)木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇,2-甲基-丁醇或3-甲基-丁醇及其任何中间代谢物。所有所需要的是在一种或多种所需要的酶或蛋白活性中进行工程设计以实现所期望的化合物或中间体的生物合成,包括(例如)用于产生所期望的化合物的一些或全部生物合成途径的包括。因此,本文提供了当在碳水化合物或其它碳源上生长时,生产和/或分泌所期望的化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇,并且当在木糖和任选地其它碳水化合物或碳源上生长时,产生和/或分泌所述所期望的化合物的生物合成途径中所示的中间代谢物的梅奇酵母(Metschnikowia)种。
可以使用如本文举例说明的本领域中熟知的方法构建本文所提供的梅奇酵母(Metschnikowia)种,从而以足够的量外源表达编码代谢途径的酶或蛋白的至少一种核酸以从木糖产生所期望的化合物。应理解在足以产生所期望的化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇,2-甲基-丁醇或者3-甲基-丁醇的情况下培养本文所提供的梅奇酵母(Metschnikowia)种。按照本文所提供的教导和指导,本文所提供的梅奇酵母(Metschnikowia)种可以实现所期望的化合物的生物合成,从而导致产生约0.1-200mM或以上的胞内浓度。通常,所期望的化合物的胞内浓度在约3-150mM之间,具体地约5-125mM之间,并且更具体地约8-100mM之间,包括约10mM、20mM、50mM、80mM或以上。还可以从本文所提供的梅奇酵母(Metschnikowia)种实现每个这些示例性范围之间或以上的胞内浓度。
在一些实施方式中,培养条件包括厌氧或基本厌氧生长或者维持条件。先前已描述了示例性厌氧条件并且所述示例性厌氧条件在本领域中是熟知的。本文描述了并且在(例如)美国专利公开2009/0047719中描述了用于发酵过程的示例性厌氧条件。任何这些条件以及在本领域中熟知的其它厌氧条件可以用于所述梅奇酵母(Metschnikowia)种。在这些厌氧或基本厌氧条件下,生产菌株可以以5-10mM或以上以及在本文中举例说明的所有其它浓度的胞内浓度合成所期望的化合物。应理解,尽管上述说明是指胞内浓度,但是生产性梅奇酵母(Metschnikowia)种可以胞内产生所期望的化合物和/或将所述化合物分泌到培养基中。
本文所提供的方法可以包括在本领域中熟知的任何培养方法,如分批培养、补料-分批培养或者连续培养。该过程可以包括发酵。示例性发酵过程包括(但不限于)补料-分批发酵和分批分离;补料-分批发酵和连续分离;以及连续发酵和连续分离。在示例性分批发酵流程中,使生产生物在用适当气体鼓泡的适合尺寸的生物反应器中生长。在厌氧条件下,用惰性气体或气体,例如,氮气、N2/CO2混合物、氩气、氦等的组合对培养鼓泡。随着细胞生长和使用碳源,以大致平衡碳源和/或营养物的消耗的速度将其它碳源和/或其它营养物补料至生物反应器。将生物反应器的温度维持在所期望的温度,通常在22-37℃的范围内,但是基于生产生物的生长特征和/或发酵过程所需的条件,所述温度可以维持在更高或更低的温度。生长持续所期望的一段时间,从而在发酵罐中实现所期望的培养特征,例如,细胞密度、化合物浓度等。在分批发酵过程中,基于所期望的培养条件,发酵的时间长度通常在几小时至几天的范围内,例如,8至24小时,或者1、2、3、4或5天,或者长达一周。根据需要,pH可以是控制或不控制的,在此情况下在运行结束时,其中pH不控制的培养通常将降低至pH 3-6。在培养期完成时,可以将发酵罐的内容物通过细胞分离单元,例如,离心机、过滤单元等以除去细胞和细胞碎片。在其中胞内表达所期望的化合物的情况下,可以根据需要,在将细胞与发酵肉汤分离之前或之后,使细胞酶促或化学裂解或破裂,以释放其它化合物。可以将发酵肉汤转移至化合物分离单元。通过在本领域中使用的标准分离程序进行化合物分离以将所期望的化合物与稀释的水溶液分离。基于所述发酵过程的化合物的化学特性,这些方法包括(但不限于)使用与水不混溶的有机溶剂(例如,甲苯或其它适合的溶剂,包括(但不限于)二乙醚、乙酸乙酯、四氢呋喃(THF)、二氯甲烷、氯仿、苯、戊烷、己烷、庚烷、石油醚、甲基叔丁基醚(MTBE)、二噁烷、二甲基甲酰胺(DMF)、二甲基亚砜(DMSO)等)的液-液提取法以提供所述化合物的有机溶液,如果适当,标准蒸镏法等。
在示例性完全连续发酵流程中,生产生物通常首先以分批模式长成以实现所期望的细胞密度。当碳源和/或其它营养物耗尽时,以所期望的速率连续提供具有相同组成的补料培养基,并且以相同速率排出发酵液。在这些条件下,生物反应器中的化合物浓度以及细胞密度通常保持恒定。如以上所讨论的,发酵罐的温度保持在所期望的温度。在连续发酵阶段,通常对于优化生产,期望维持适合的pH范围。可以使用常规方法监测和维持pH,其包括添加适合的酸或碱以维持所期望的pH范围。根据情况和需要,连续操作所述生物反应器延长的一段时间,通常至少一周至几周并且长达一个月或更长的时间。根据需要,定期监测发酵溶液和/或培养,包括多达每天取样,以确保化合物浓度和/或细胞密度的一致性。以连续方式,随着新的补料培养基的提供,恒定除去发酵罐的内容物。根据需要,在除去或不除去细胞和细胞碎片的情况下,通常使含有细胞、培养基和产物的排除液流经受连续化合物分离程序。在本领域中使用的连续分离方法可以用于将所述化合物与稀释的水溶液分离,其包括(但不限于)使用与水不混溶的有机溶剂(例如,甲苯或其它适合的溶剂,包括(但不限于)二乙醚、乙酸乙酯、四氢呋喃(THF)、二氯甲烷、氯仿、苯、戊烷、己烷、庚烷、石油醚、甲基叔丁基醚(MTBE)、二噁烷、二甲基甲酰胺(DMF)、二甲基亚砜(DMSO)等)的连续液-液提取法、标准连续蒸镏法等,或者本领域中熟知的其它方法。
除本文所公开的培养和发酵条件之外,实现所期望的化合物的生物合成的生长条件可以包括向所述培养条件中添加渗透保护剂。在某些实施方式中,本文所提供的梅奇酵母(Metschnikowia)种可以如本文所述,在存在渗透保护剂的情况下维持、培养或发酵。简要地,渗透保护剂是指用作渗透剂并且帮助如本文所述的微生物在渗透应力下存活的化合物。渗透保护剂包括(但不限于)甜菜碱、氨基酸和糖海藻糖。这些的非限制性实例为甘氨酸甜菜碱、果仁糖甜菜碱、二甲基噻亭、二甲基锍基丙酸酯、3-二甲基锍基-2-甲基丙酸酯、哌啶酸、二甲基锍基乙酸酯、胆碱、L-卡尼汀和四氢嘧啶(ectoine)。在一个方面,所述渗透保护剂为甘氨酸甜菜碱。本领域的技术人员应理解适合于保护本文所述的微生物抵抗渗透应力的渗透保护剂的量和类型将取决于所使用的微生物。所述培养条件中的渗透保护剂的量可以是(例如)不超过0.1mM、不超过0.5mM、不超过1.0mM、不超过1.5mM、不超过2.0mM、不超过2.5mM、不超过3.0mM、不超过5.0mM、不超过7.0mM、不超过10mM、不超过50mM、不超过100mM或不超过500mM。
所述培养条件可以包括(例如)液体培养程序以及发酵及其它大规模培养程序。如本文所述,可以在好氧、厌氧或基本厌氧的培养条件下获得特别有用的生物合成产物得率。
本文所述的培养条件可以放大并连续生长以用于所期望的化合物的生产。示例性的生长程序包括(例如)补料-分批发酵和分批分离;补料-分批发酵和连续分离,或连续发酵和连续分离。所有这些方法在本领域中是熟知的。发酵程序对于商品化的量的所期望的产物的生物合成生产是特别有用的。通常并且如非连续培养程序一样,连续和/或近-连续生产包括将本文所提供的梅奇酵母(Metschnikowia)种在充足的营养物和培养基中培养以保持和/或几乎保持指数期的生长。处于这些条件下的连续培养可以包括(例如)生长或培养1、2、3、4、5、6或7天或以上。另外,连续培养可以包括1周、2、3、4或5或更多周并且长达数月的更长的时间段。作为另外一种选择,如果适合于具体应用,可以将本文所提供的生物培养数小时。应理解连续和/或近-连续培养条件还可以包括这些示例性时间段之间的所有时间间隔。还应理解培养本文所提供的微生物的时间是出于所期望的目的,生产足够量的化合物的足够的一段时间。
除使用大量所期望的化合物的连续生产,使用本文所提供的梅奇酵母(Metschnikowia)种的上述发酵程序之外,所述生物衍生化合物还可以(例如)同时经受化学合成和/或酶促过程以将所述化合物转化为其它化合物,或者所述生物衍生化合物可以与发酵培养分离并且如果需要,顺序经受化学和/或酶转化以将所述化合物转化为其它化合物。
为了产生更好的生产菌,可以使用代谢模型来优化生长条件。建模还可以用于设计另外优化所述途径的利用的基因敲除(参见,例如,美国专利公开US 2002/0012939、US2003/0224363、US 2004/0029149、US 2004/0072723、US 2003/0059792、US 2002/0168654和US 2004/0009466,和美国专利No.7,127,379)。建模分析使得能够可靠地预测对于将代谢向所期望产物更有效的生产的方向转变的细胞生长的影响。
在一些实施方式中,本文所提供的生产生物衍生化合物的方法还包括使用本领域中熟知的多种方法将所述生物衍生化合物与培养中的其它组分分离。所述生物衍生化合物可以是木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或者3-甲基-丁醇。这些分离方法包括(例如)提取程序以及包括连续液-液萃取、渗透气化、膜滤法、膜分离、反渗透、电渗析、蒸馏、结晶、离心、提取萃取过滤、离子交换色谱、尺寸排阻色谱、吸附色谱、超滤、活性炭吸附、pH调节和沉淀或者以上列举的一种或多种方法的组合的方法。上述所有方法在本领域中是熟知的。
本文还提供了如本文所述的生物衍生化合物。在一些实施方式中,通过本文所提供的方法产生了所述生物衍生化合物,包括木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇。
本文还提供了具有通过本文所述的梅奇酵母(Metschnikowia)种所产生的生物衍生化合物和其它组分的组合物。除所述生物衍生化合物以外的组分可以是细胞部分,例如,微量的培养基细胞部分,或者可以是在存在本文所提供的梅奇酵母(Metschnikowia)种的情况下所产生的发酵肉汤或培养基或其纯化或部分纯化的部分。因此,在一些实施方式中,所述组合物为培养基。在一些实施方式中,所述培养基可以是已除去本文所提供的分离的梅奇酵母(Metschnikowia)种的培养基。当通过本文所提供的梅奇酵母(Metschnikowia)种生产时,所述组合物可以具有(例如)降低的副产物水平。所述组合物可以具有(例如)一种或多种生物衍生化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇,和本文所提供的梅奇酵母(Metschnikowia)种的细胞裂解液或培养上清液。所述其它组分可以是副产物或杂质,如甘油、阿糖醇、C7糖醇或它们的组合。所述副产物可以是甘油。所述副产物可以是阿糖醇。所述副产物可以是C7糖醇(例如,庚七醇或其异构体)。在一些实施方式中,所述副产物或杂质(例如,甘油或阿糖醇或两者)比通过除本文所提供的分离的梅奇酵母(Metschnikowia)种以外的微生物所产生的相应的副产物或杂质的量大至少10%、20%、30%或40%。
在一些实施方式中,本文提供的组合物可以具有生物衍生木糖醇和其它组分。所述其它组分可以是发酵肉汤或培养基。所述其它组分可以是发酵肉汤或培养基的上清液。所述其它组分可以是发酵肉汤或培养基的细胞部分。所述其它组分可以是用于产生生物衍生木糖醇的具有编码如本文所述的蛋白的外源核酸的梅奇酵母(Metschnikowia)种。所述其它组分可以是本文所提供的微生物的细胞裂解液。所述其它组分可以是副产物,如甘油、阿糖醇、C7糖醇或它们的组合。
在一些实施方式中,本文提供的组合物可以具有生物衍生阿糖醇和其它组分。所述其它组分可以是发酵肉汤或培养基。所述其它组分可以是发酵肉汤或培养基的上清液。所述其它组分可以是发酵肉汤或培养基的细胞部分。所述其它组分可以是用于产生生物衍生乙醇的具有编码如本文所述的蛋白的外源核酸的梅奇酵母(Metschnikowia)种。所述其它组分可以是本文所提供的微生物的细胞裂解液。所述其它组分可以是副产物,如甘油、阿糖醇、C7糖醇或它们的组合。
在一些实施方式中,本文提供的组合物可以具有生物衍生乙醇和其它组分。所述其它组分可以是发酵肉汤或培养基。所述其它组分可以是发酵肉汤或培养基的上清液。所述其它组分可以是发酵肉汤或培养基的细胞部分。所述其它组分可以是用于产生生物衍生乙醇的具有编码如本文所述的蛋白的外源核酸的梅奇酵母(Metschnikowia)种。所述其它组分可以是本文所提供的微生物的细胞裂解液。所述其它组分可以是副产物,如甘油、阿糖醇、C7糖醇或它们的组合。
在一些实施方式中,本文提供的组合物可以具有生物衍生正丁醇和其它组分。所述其它组分可以是发酵肉汤或培养基。所述其它组分可以是发酵肉汤或培养基的上清液。所述其它组分可以是发酵肉汤或培养基的细胞部分。所述其它组分可以是用于产生生物衍生正丁醇的具有编码如本文所述的蛋白的外源核酸的梅奇酵母(Metschnikowia)种。所述其它组分可以是本文所提供的微生物的细胞裂解液。所述其它组分可以是副产物,如甘油、阿糖醇、C7糖醇或它们的组合。
在一些实施方式中,本文提供的组合物可以具有生物衍生异丁醇和其它组分。所述其它组分可以是发酵肉汤或培养基。所述其它组分可以是发酵肉汤或培养基的上清液。所述其它组分可以是发酵肉汤或培养基的细胞部分。所述其它组分可以是用于产生生物衍生异丁醇的具有编码如本文所述的蛋白的外源核酸的梅奇酵母(Metschnikowia)种。所述其它组分可以是本文所提供的微生物的细胞裂解液。所述其它组分可以是副产物,如甘油、阿糖醇、C7糖醇或它们的组合。
在一些实施方式中,本文提供的组合物可以具有生物衍生异丙醇和其它组分。所述其它组分可以是发酵肉汤或培养基。所述其它组分可以是发酵肉汤或培养基的上清液。所述其它组分可以是发酵肉汤或培养基的细胞部分。所述其它组分可以是用于产生生物衍生异丙醇的具有编码如本文所述的蛋白的外源核酸的梅奇酵母(Metschnikowia)种。所述其它组分可以是本文所提供的微生物的细胞裂解液。所述其它组分可以是副产物,如甘油、阿糖醇、C7糖醇或它们的组合。
在一些实施方式中,本文提供的组合物可以具有生物衍生乙酸乙酯和其它组分。所述其它组分可以是发酵肉汤或培养基。所述其它组分可以是发酵肉汤或培养基的上清液。所述其它组分可以是发酵肉汤或培养基的细胞部分。所述其它组分可以是用于产生生物衍生乙酸乙酯的具有编码如本文所述的蛋白的外源核酸的梅奇酵母(Metschnikowia)种。所述其它组分可以是本文所提供的微生物的细胞裂解液。所述其它组分可以是副产物,如甘油、阿糖醇、C7糖醇或它们的组合。
在一些实施方式中,本文提供的组合物可以具有生物衍生苯基-乙醇和其它组分。所述其它组分可以是发酵肉汤或培养基。所述其它组分可以是发酵肉汤或培养基的上清液。所述其它组分可以是发酵肉汤或培养基的细胞部分。所述其它组分可以是用于产生生物衍生苯基-乙醇的具有编码如本文所述的蛋白的外源核酸的梅奇酵母(Metschnikowia)种。所述其它组分可以是本文所提供的微生物的细胞裂解液。所述其它组分可以是副产物,如甘油、阿糖醇、C7糖醇或它们的组合。
在一些实施方式中,本文提供的组合物可以具有生物衍生2-甲基-丁醇和其它组分。所述其它组分可以是发酵肉汤或培养基。所述其它组分可以是发酵肉汤或培养基的上清液。所述其它组分可以是发酵肉汤或培养基的细胞部分。所述其它组分可以是用于产生生物衍生2-甲基-丁醇的具有编码如本文所述的蛋白的外源核酸的梅奇酵母(Metschnikowia)种。所述其它组分可以是本文所提供的微生物的细胞裂解液。所述其它组分可以是副产物,如甘油、阿糖醇、C7糖醇或它们的组合。
在一些实施方式中,本文提供的组合物可以具有生物衍生3-甲基-丁醇和其它组分。所述其它组分可以是发酵肉汤或培养基。所述其它组分可以是发酵肉汤或培养基的上清液。所述其它组分可以是发酵肉汤或培养基的细胞部分。所述其它组分可以是用于产生生物衍生3-甲基-丁醇的具有编码如本文所述的蛋白的外源核酸的微生物。所述其它组分可以是本文所提供的微生物的细胞裂解液。所述其它组分可以是副产物,如甘油、阿糖醇、C7糖醇或它们的组合。
在一些实施方式中,可以选择碳原料及其它细胞吸收源,如磷酸盐、氨、硫酸盐、氯化物及其它卤素以改变存在于通过本文所提供的梅奇酵母(Metschnikowia)种所产生的生物衍生化合物中的原子的同位素分布。以上列举的多种碳原料及其它吸收源将在本文中统称为“吸收源”。吸收源可以提供存在于通过本文所提供的梅奇酵母(Metschnikowia)种所产生的生物衍生化合物中或者副产物或杂质中的任何原子的同位素富集。可以对于任何靶原子,包括(例如)碳、氢、氧、氮、硫、磷、氯化物或其它卤素实现同位素富集。
在一些实施方式中,可以选择所述吸收源以改变碳-12、碳-13和碳-14的比。在一些实施方式中,可以选择所述吸收源以改变氧-16、氧-17和氧-18的比。在一些实施方式中,可以选择所述吸收源以改变氢、氘和氚的比。在一些实施方式中,可以选择所述吸收源以改变氮-14和氮-15的比。在一些实施方式中,可以选择所述吸收源以改变硫-32、硫-33、硫-34和硫-35的比。在一些实施方式中,可以选择所述吸收源以改变磷-31、磷-32和磷-33的比。在一些实施方式中,可以选择所述吸收源以改变氯-35、氯-36和氯-37的比。
在一些实施方式中,可以通过选择一种或多种吸收源将靶原子的同位素比改变至所期望的比。吸收源可以来源于天然来源,如自然界所存在的,或者来源于人为来源,并且本领域技术人员可以选择天然来源、人为来源或它们的组合以实现所期望的靶原子的同位素比。人为吸收源的实例包括(例如)至少部分来源于化学合成反应的吸收源。这些同位素富集的吸收源可以是商购的或者在实验室中制备的和/或任选地与所述吸收源的天然源混合以实现所期望的同位素比。在一些实施方式中,可以通过选择如自然界中所存在的所期望的吸收源来源来实现吸收源的靶原子同位素比。例如,如本文所讨论的,天然源可以是生物基的,其来源于生物或者通过生物合成,或者是如石油基产品或大气的来源。在一些这些实施方式中,碳源(例如)可以选自化石燃料-衍生的碳源,其可以相对不含碳-14,或者环境或大气碳源,如CO2,其可以比其石油-衍生的对应物具有更大量的碳-14。
在地球大气中,不稳定的碳同位素碳-14或放射性碳大致占1012个碳原子中的1个,并且其半衰期为约5700年。通过包括宇宙射线和常规氮(14N)的核反应,在上层大气中补充碳储量。由于其很早之前衰变,因此化石燃料不包含碳-14。化石燃料的燃烧降低了大气碳-14的份数,即所谓的“苏斯效应”。
确定化合物中原子的同位素比的方法对于本领域技术人员来说是熟知的。使用本领域中已知的技术,如加速质谱(AMS)、稳定同位素比质谱(SIRMS)和点特异性天然同位素分馏核磁共振技术(SNIF-NMR),通过质谱容易地评价了同位素富集。这些质谱技术可以与分离技术,如液相色谱(LC)、高效液相色谱(HPLC)和/或气相色谱等集成。
就碳而言,在美国作为通过美国材料试验协会(ASTM)国际组织,使用放射性碳年代测定,用于确定固体、液体和气体样品的生物基含量的标准化分析方法开发了ASTMD6866。该标准基于用于确定产品的生物基含量的放射性碳年代测定的使用。ASTM D6866于2004年首次颁布,并且该标准当前有效的版本为ASTM D6866-11(2011年4月1日生效)。放射性碳年代测定技术对于本领域技术人员来说是熟知的,其包括本文所述的那些。
通过碳-14(14C)与碳-12(12C)的比值来估计化合物的生物基含量。具体地,根据下式计算现代分率(Fraction Modern,Fm):Fm=(S-B)/(M-B),其中B、S和M分别代表空白、样品和现代参比的14C/12C比。现代分率是来自“现代”的样品的14C/12C比的偏差的测量。现代的定义是归一化至δ13CVPDB=-19/1000的国家标准局(NBS)草酸I(即标准参考物质(SRM)4990b)的放射性碳浓度(公元1950年)(Olsson,The use of Oxalic acid as aStandard.in,Radiocarbon Variations and Absolute Chronology,Nobel Symposium,12th Proc.,John Wiley&Sons,New York(1970))。使用国际上约定的定义:0.95乘以归一化至δ13CVPDB=-19/1000的NBS草酸I(SRM4990b)的比活性,计算(例如)通过ASM所测量的质谱结果。这相当于1.176±0.010×10-12的绝对(公元1950年)14C/12C比(Karlen等人,ArkivGeofysik,4:465-471(1968))。标准计算考虑了一种同位素相对于另一种的差异吸收,例如,生物系统对12C的吸收优先于13C,然后优先于14C,并且这些修正反映为对于δ13所修正的Fm。
草酸标准品(SRM 4990b或HOx 1)是从一批1955年的甜菜所制备的。尽管制备了1000磅,但是这种草酸标准品不再是可商购的。草酸II标准品(HOx 2;N.I.S.T名称为SRM4990 C)是由一批1977年的法国甜菜糖蜜所制成的。在1980年代早期,12个实验室的小组测量了两种标准品的比值。草酸II与1的活性的比值为1.2933±0.001(加权平均数)。HOx II的同位素比为-17.8/1000。ASTM D6866-11建议使用可用的草酸II标准品SRM4990 C(Hox2)作为现代标准品(参见Mann,Radiocarbon,25(2):519-527(1983)中有关原始vs.现用的草酸标准品的讨论)。Fm=0%代表材料中完全缺少碳-14原子,因此表示是化石(例如,石油基)碳源。在对于1950年后来自核弹试验的向大气注入的碳-14进行修正之后,Fm=100%表示完全现代的碳源。如本文所述,这种“现代”源包括生物基源。
如ASTM D6866中所述,由于1950年代的核试验项目的持续但逐渐减弱的影响,其导致了如ASTM D6866-11中所述的碳-14在大气中的大量富集,因此现代碳的百分比(pMC)可以大于100%。由于所有样品的碳-14活性是以“核弹前”的标准品为参考的,并且因为几乎所有的新的生物基产品是在核弹后的环境中产生的,因此所有pMC值(对于同位素份数修正后)必须乘以0.95(截止2010年)以更好地反映样品真正的生物基含量。大于103%的生物基含量表明要么是发生了分析误差,要么是生物基碳源具有超过数年的历史。
ASTM D6866相对于材料的总有机物含量来定量生物基含量,但是不考虑所存在的无机碳及其它含有非碳的物质。例如,基于ASTM D6866,50%淀粉-基材料和50%水的产品将认为具有生物基含量=100%(作为100%生物基的50%的有机物含量)。在另一个实例中,50%淀粉-基材料、25%石油基材料和25%的水的产品将具有生物基含量=66.7%(75%有机物含量,但仅有50%的产品是生物基的)。在另一个实例中,作为50%有机碳并且是石油基产品的产品将认为具有生物基含量=0%(50%有机碳,但是来自化石来源)。因此,基于用于确定化合物或材料的生物基含量的熟知方法和已知标准品,本领域技术人员可以容易地确定生物基含量和/或本文所提供的具有所期望的生物基含量的所使用的所制备的下游产品。
应用碳-14年代测定技术来定量材料的生物基含量在本领域中是已知的(Currie等人,Nuclear Instruments and Methods in Physics Research B,172:281-287(2000))。例如,碳14年代测定已用于定量含有对苯二甲酸酯-的材料中的生物基含量(Colonna等人,Green Chemistry,13:2543-2548(2011))。值得注意地,来源于可再生的1,3-丙二醇和石油-衍生的对苯二甲酸的聚丙烯对苯二甲酸酯(PPT)聚合物导致Fm值接近30%(即,因为3/11的所述聚合物碳衍生自可再生的1,3-丙二醇,8/11来自化石端成员对苯二甲酸)(Currie等人,如上,2000)。相反,衍生自可再生的1,4-丁二醇和可再生的对苯二甲酸两者的聚对苯二甲酸丁二醇酯聚合物导致生物基含量大于90%(Colonna等人,如上,2011)。
因此,在一些实施方式中,本文提供了具有反映大气碳,也称为环境碳吸收源的碳-12、碳-13和碳-14比的生物衍生化合物。所述生物衍生化合物包括如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或者3-甲基-丁醇。例如,在一些方面,所述生物衍生化合物可以具有至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或多达100%的Fm值。在一些这些实施方式中,所述吸收源是CO2。在一些实施方式中,本文提供了具有反映石油基碳吸收源的碳-12、碳-13和碳-14比的生物衍生化合物。在该方面,本文所提供的生物衍生化合物可以具有小于95%、小于90%、小于85%、小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、小于5%、小于2%或小于1%的Fm值。在一些实施方式中,本文所提供的生物衍生化合物可以具有通过大气碳吸收源与石油基吸收源的组合所获得的碳-12、碳-13和碳-14比。使用这种吸收源的组合是可以改变碳-12、碳-13和碳-14比的一种方式,并且各个比将反映吸收源的比。
此外,本文还提供了产物衍生的生物衍生化合物,其包括如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或3-甲基-丁醇,其中所述生物衍生化合物的碳-12、碳-13和碳-14同位素比与环境中所存在的CO2的值大致相同。例如,在一些方面,本文提供了具有与环境中所存在的CO2的值大致相同的碳-12相对于碳-13相对于碳-14的同位素比,或者本文所公开的任何其它的比的生物衍生化合物。如本文所公开的,应理解产物可以具有与环境中所存在的CO2的值大致相同的碳-12相对于碳-13相对于碳-14的同位素比,或者任何本文所公开的比,其中所述产物是从如本文所公开的生物衍生化合物所产生的,其中对所述生物衍生化合物化学修饰以产生最终产品。如本文所述,化学修饰生物衍生化合物以产生所期望的产品的方法对于本领域技术人员来说是熟知的。
本文还提供了具有通过本文所述的梅奇酵母(Metschnikowia)种或者使用本文所述的方法所产生的一种或多种生物衍生化合物的生物基产品。在一些实施方式中,本文提供了使用本文所述的生物衍生化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或者3-甲基-丁醇所产生的生物基产品。这种生产可以包括将所述生物衍生化合物化学反应(例如,化学转化、化学官能化、化学偶联、氧化、还原、聚合、共聚合等)成最终产品。在一些实施方式中,本文提供了具有本文所述的生物衍生化合物,如木糖醇、阿糖醇、乙醇、正丁醇、异丁醇、异丙醇、乙酸乙酯、苯基-乙醇、2-甲基-丁醇或者3-甲基-丁醇的生物基产品。在一些实施方式中,本文提供了具有至少2%、至少3%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%或100%的如本文所公开的生物衍生化合物的生物基产品。
本文提供了涉及H0梅奇酵母(Metschnikowia)种的蛋白的分离的多肽和涉及H0梅奇酵母(Metschnikowia)种的基因的分离的核酸,和包含这些核酸的宿主细胞。这些核酸在梅奇酵母(Metschnikowia)种中的存在可以将梅奇酵母(Metschnikowia)种鉴定为H0梅奇酵母(Metschnikowia)种或其变体。因此,本文提供了具有蛋白Aro10、Gxf2、Hgt19、Hxt5、Tef1、Xks1、Xyl1、Tal1或Tkl1或其变体的氨基酸序列的分离的多肽;具有编码蛋白Aro10、Gxf2、Hgt19、Hxt5、Tef1、Xks1、Xyl1、Tal1或Tkl1或其变体的核酸序列的分离的核酸;具有ACT1、ARO8、ARO10、GPD1、GXF1、GXF2、GXS1、HGT19、HXT2.6、HXT5、PGK1、QUP2、RPB1、RPB2、TEF1、TPI1、XKS1、XYL1、XYL2、XYT1、TAL1或TKL1的基因的核酸序列的分离的核酸;以及具有这些核酸序列和/或表达这些蛋白的宿主细胞。
H0梅奇酵母(Metschnikowia)种的示例性多肽包括Aro10(SEQ ID NO:37)、Gxf2(SEQ ID NO:40)、Hgt19(SEQ ID NO:42)、Hxt5(SEQ ID NO:44)、Tef1(SEQ ID NO:46)、Xks1(SEQ ID NO:51)、Xyl1(SEQ ID NO:52)、Tal1(SEQ ID NO:55)和Tkl1(SEQ ID NO:56)。因此,在一些实施方式中,本文提供了具有SEQ ID NO:37的氨基酸序列的分离的多肽。在一些实施方式中,本文提供了具有SEQ ID NO:40的氨基酸序列的分离的多肽。在一些实施方式中,本文提供了具有SEQ ID NO:42的氨基酸序列的分离的多肽。在一些实施方式中,本文提供了具有SEQ ID NO:44的氨基酸序列的分离的多肽。在一些实施方式中,本文提供了具有SEQ ID NO:46的氨基酸序列的分离的多肽。在一些实施方式中,本文提供了具有SEQ IDNO:51的氨基酸序列的分离的多肽。在一些实施方式中,本文提供了具有SEQ ID NO:52的氨基酸序列的分离的多肽。在一些实施方式中,本文提供了具有SEQ ID NO:55的氨基酸序列的分离的多肽。在一些实施方式中,本文提供了具有SEQ ID NO:56的氨基酸序列的分离的多肽。
本文还提供了具有作为本文所述的H0梅奇酵母(Metschnikowia)种的蛋白的变体,但仍保留了所述多肽的功能活性的氨基酸序列的分离的多肽。例如,在一些实施方式中,所述分离的多肽具有SEQ ID NO:37、40、42、44、46、51、52、55和56中任一个所示的氨基酸序列,其中所述氨基酸序列包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个氨基酸替代、缺失或插入。本文所提供的蛋白的变体还包括(例如)当与参考多肽序列相比时的缺失、融合或截短。因此,在一些实施方式中,本文所提供的分离的多肽具有与SEQ ID NO:37、40、42、44、46、51、52、55和56中的任一个具有至少95.0%、至少95.1%、至少95.2%、至少95.3%、至少95.4%、至少95.5%、至少95.6%、至少95.7%、至少95.8%、至少95.9%、至少96.0%、至少96.1%、至少96.2%、至少96.3%、至少96.4%、至少96.5%、至少96.6%、至少96.7%、至少96.8%、至少96.9%、至少97.0%、至少97.1%、至少97.2%、至少97.3%、至少97.4%、至少97.5%、至少97.6%、至少97.7%、至少97.8%、至少97.9%、至少98.0%、至少98.1%、至少98.2%、至少98.3%、至少98.4%、至少98.5%、至少98.6%、至少98.7%、至少98.8%、至少98.9%、至少99.0%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%或至少99.8%的同一性的氨基酸序列。
本文所述的蛋白的变体还可以含有保守性氨基酸替代,这表示可以通过不改变所述蛋白的二级和/或三级结构的氨基酸替代一个或多个氨基酸。这些替代可以包括通过具有类似物理化学性质的残基对氨基酸的替代,如用一个脂肪族残基(Ile、Val、Leu或Ala)替代另一个,或者碱性残基Lys和Arg,酸性残基Glu和Asp、酰胺残基Gln和Asn、羟基残基Ser和Tyr或者芳香族残基Phe和Tyr之间的替代。在Bowie等人,Science 247:1306-10(1990)中更全面地描述了表型沉默的氨基酸交换。另外,本文所述的蛋白的变体包括对所述蛋白的功能区以外的氨基酸序列具有氨基酸替代、缺失或添加的那些,只要所述替代、缺失或添加不影响所产生的多肽的功能。做出这些替代或缺失的技术在本领域中是熟知的并且包括(例如)定点突变。
本文所提供的分离的多肽还包括保留了它们的功能的本文所述的蛋白的功能性片段。在一些实施方式中,本文提供了作为本文所述的蛋白的功能性片段的分离的多肽。在一些实施方式中,本文提供了编码作为本文所述的蛋白的功能性片段的多肽的分离的核酸。在一些实施方式中,所述分离的多肽可以是保留了所述蛋白的功能的蛋白,如Aro10(SEQ ID NO:37)、Gxf2(SEQ ID NO:40)、Hgt19(SEQ ID NO:42)、Hxt5(SEQ ID NO:44)、Tef1(SEQ ID NO:46)、Xks1(SEQ ID NO:51)、Xyl1(SEQ ID NO:52)、Tal1(SEQ ID NO:55)和Tkl1(SEQ ID NO:56)的片段。
在一些实施方式中,本文所述的蛋白的变体包括通过其它化学部分,如葡糖基基团、聚乙二醇(PEG)基团、脂类、磷酸盐、乙酰基等的共价修饰或集聚缀合(aggregativeconjugation)。在一些实施方式中,本文所述的蛋白的变体还包括(例如)由本文所述的蛋白和另一种多肽所形成的融合蛋白。用于构建所述融合蛋白的所添加的多肽包括有利于本文所述的蛋白的纯化或寡聚的那些,或者提高本文所述的蛋白的稳定性和/或功能的那些。
本文所述的蛋白可以融合至异源多肽以有利于纯化。多个可用的异源肽(肽标签)允许所述融合蛋白与结合伴侣的选择性结合。肽标签的非限制性实例包括6-His、硫氧还蛋白、血球凝集素、GST和OmpA信号序列标签。识别并结合至异源肽标签的结合伴侣可以是任何分子或化合物,其包括金属离子(例如,金属亲和柱)、抗体、抗体片段或者选择性或特异性结合所述异源肽以允许所述融合蛋白的纯化的任何蛋白或肽。
还可以修饰本文所述的蛋白以有利于寡聚物的形成。例如,本文所述的蛋白可以融合至促进寡聚的肽部分,如亮氨酸拉链,和某些抗体片段多肽,如Fc多肽。用于制备这些融合蛋白的技术是已知的,并且在(例如)WO 99/31241和Cosman等人,Immunity 14:123-133(2001)中得到描述。融合至Fc多肽提供了有利于在蛋白A或蛋白G柱上通过亲和色谱法纯化的额外优势。在Landschulz等人,Science 240:1759-64(1988)中描述了融合至亮氨酸-拉链(LZ),例如,七肽重复序列,它是中间散布着其它氨基酸的四或五个亮氨酸残基。
可以以分离形式或者以基本纯化的形式提供本文所述的蛋白。可以通过已知方法从重组细胞培养物中回收和纯化多肽,所述方法包括(例如)硫酸铵或乙醇沉淀、阴离子或阳离子交换色层法、磷酸纤维素色谱法、疏水性相互作用色谱法、亲和色谱法、羟基磷灰石色谱法和凝集素色谱法。在一些实施方式中,蛋白色谱法用于纯化。
在一些实施方式中,本文提供了具有编码本文所述的蛋白的外源核酸的重组梅奇酵母(Metschnikowia)种。在一些实施方式中,所述重组梅奇酵母(Metschnikowia)种具有编码本文所述的蛋白的外源核酸,其中所述蛋白具有1至25、1至20、1至15、1至10或者1至5个氨基酸替代、缺失或插入。在一些实施方式中,所述蛋白是Aro10(SEQ ID NO:37)、Gxf2(SEQ ID NO:40)、Hgt19(SEQ ID NO:42)、Hxt5(SEQ ID NO:44)、Tef1(SEQ ID NO:46)、Xks1(SEQ ID NO:51)和Xyl1(SEQ ID NO:52)并且保留了所述蛋白的功能。在一些实施方式中,所述蛋白具有Aro10(SEQ ID NO:37)、Gxf2(SEQ ID NO:40)、Hgt19(SEQ ID NO:42)、Hxt5(SEQ ID NO:44)、Tef1(SEQ ID NO:46)、Xks1(SEQ ID NO:51)和Xyl1(SEQ ID NO:52)的1至10个氨基酸替代、缺失或插入并且保留了所述蛋白的功能。在一些实施方式中,所述蛋白具有Aro10(SEQ ID NO:37)、Gxf2(SEQ ID NO:40)、Hgt19(SEQ ID NO:42)、Hxt5(SEQ ID NO:44)、Tef1(SEQ ID NO:46)、Xks1(SEQ ID NO:51)和Xyl1(SEQ ID NO:52)的1至5个氨基酸替代、缺失或插入并且保留了所述蛋白的功能。非天然存在的微生物可以是梅奇酵母(Metschnikowia)种,其包括(但不限于)本文所述的H0梅奇酵母(Metschnikowia)种。
可以通过适合的宿主重组表达本文所述的蛋白。当所述蛋白的异源表达是所期望的时,可以根据所述宿主的密码子使用修饰特定基因的编码序列。标准遗传密码在本领域中是熟知的,如(例如)Osawa等人,Microbiol Rev.56(1):229-64(1992)中所综述的。酵母种,包括(但不限于)酿酒酵母(Saccharomyces cerevisiae)、阿斯米假丝酵母(Candidaazyma)、叉开假丝酵母(Candida diversa)、木兰假丝酵母(Candida magnoliae)、皱膜假丝酵母(Candida rugopelliculosa)、解脂耶罗威亚酵母(Yarrowia lipolytica)和Zygoascus hellenicus使用标准编码。某些酵母种使用替代编码。例如,“Leu”的“CUG”标准密码子在菌种,如白假丝酵母(Candida albicans)、柱状假丝酵母(Candidacylindracea)、口津假丝酵母(Candida melibiosica)、近平滑假丝酵母(Candidaparapsilosis)、褶皱假丝酵母(Candida rugose)、树干毕赤酵母(Pichia stipitis)和梅奇酵母(Metschnikowia)种中编码“Ser”。本文提供了H0梅奇酵母(Metschnikowia)种的密码子表。
此外,宿主可以同时产生同类蛋白的其它形式,从而在相同细胞中表达了相同类型蛋白的多种形式。例如,宿主可以同时产生不同的转运蛋白,其可以形成寡聚物以转运相同的糖。作为另外一种选择,不同的转运蛋白可以独立地起作用以转运不同的糖。
可以通过本领域中已知的常规方法产生本文所述的蛋白的变体,如通过寡核苷酸-定位的定点突变,在特定位置引入突变。定点突变被认为是蛋白质工程的信息方法并且可以依赖于靶标蛋白的高分辨率晶体结构来进行特定氨基酸改变(Van Den Burg等人,PNAS 95:2056-60(1998))。用于鉴别多种蛋白质工程目标的位点特异性改变的计算方法也是本领域中已知的(Hellinga,Nature Structural Biology 5:525-27(1998))。
本领域中已知的其它技术包括(但不限于)非信息性突变技术(一般地称为“定向进化”)。定向进化结合高通量筛选使得能够测试蛋白构象中统计学有意义的变化(Arnold,1998)。定向进化技术可以包括类似于Crameri等人,Nature 391:288-91(1998)中所述的多样化方法、定点饱和突变、交错延伸法(StEP)(Zhao等人,Nature Biotechnology 16:258-61(1998))和DNA合成/重组装(美国专利No.5,965,408)。
如本文所公开的,可以将本文所述的编码蛋白的核酸引入宿主生物。在一些情况下,还可以期望修饰蛋白活性以提高所期望的产品的产量。例如,可以将已知提高蛋白活性的突变引入编码核酸分子。另外,可以应用优化方法以提高蛋白的活性和/或降低抑制活性,例如,降低负调节蛋白的活性。
一种这种优化方法是定向进化。定向进化是包括引入靶向特定基因的突变以改善和/或改变酶的性质的强有力的方法。可以通过开发和实施允许自动筛选多种酶变体(例如,>104种)的灵敏的高通量筛选测定来鉴别改善和/或改变的酶。通常进行突变和筛选的迭代循环以提供具有优化性质的酶。还已开发了可以帮助鉴别用于突变的基因区域的计算算法,并且所述计算算法可以显著减少需要产生和筛选的酶变体的数目。已发展了对于产生多样性变体库有效的多种定向进化技术(有关综述,参见Hibbert等人,Biomol.Eng 22:11-19(2005);Huisman and Lalonde,In Biocatalysis in the pharmaceutical andbiotechnology industries第717-742页(2007),Patel(主编),CRC Press;Otten andQuax.Biomol.Eng 22:1-9(2005).;和Sen等人,Appl Biochem.Biotechnol 143:212-223(2007)),并且这些方法已成功应用于多种酶种类中广泛的性质的改善。已通过定向进化技术改善和/或改变的酶的特性包括,例如:对于非天然底物的转化,选择性/特异性;对于稳健的高温处理,温度稳定性;对于在较低或较高的pH条件下的生物加工,pH稳定性;底物或产物耐受性,从而可以实现高产物滴度;结合(Km),包括拓宽底物结合以包括非天然底物;抑制(Ki),以除去抑制副产物、底物或关键中间体;活性(kcat),以提高酶促反应速率以实现所期望的流量;表达水平,以提高蛋白得率和整体途径流量;氧气稳定性,用于空气敏感性酶在好氧条件下的操作;和厌氧活性,用于好氧酶在不存在氧气的情况下的操作。
已发展了针对特定酶的所期望的性质,使其基因突变和多样化的一些示例性方法。这些方法对于本领域技术人员来说是熟知的。任何这些方法可以用于改变和/或优化本文所述的蛋白的活性。这些方法包括(但不限于)EpPCR,其通过降低PCR反应中DNA聚合酶的保真度来引入随机点突变(Pritchard等人,J Theor.Biol.234:497-509(2005));易错滚环扩增(epRCA),其类似于epPCR,除了将整个环形质粒用作模板并且将在最后2个核苷酸上具有核酸外切酶耐受性硫代磷酸键的随机6-聚体用于扩增所述质粒,然后将其转化至细胞,并且在所述细胞中,所述质粒在串联重复序列再环化(Fujii等人,Nucleic Acids Res.32:e145(2004);和Fujii等人,Nat.Protoc.1:2493-2497(2006));DNA或家族重排,其通常包括用核酸酶,如DNA酶I或者EndoV消化两种或更多种变体基因以产生随机片段池,所述随机片段池在存在DNA聚合酶的情况下通过退火和延伸循环重新组装以产生嵌合基因库(Stemmer,Proc Natl Acad Sci USA 91:10747-10751(1994);和Stemmer,Nature 370:389-391(1994));交错延伸(StEP),其需要模板引导(template priming),然后是具有变性和非常短的持续时间的退火/延伸(短至5秒)的2步PCR的重复循环(Zhao等人,Nat.Biotechnol.16:258-261(1998));随机引导重组(RPR),其中使用随机序列引物来产生与模板的不同片段互补的多个短DNA片段(Shao等人,Nucleic Acids Res 26:681-683(1998))。
其它方法包括异源双链重组,其中将线性化质粒DNA用于形成通过错配修复所修复的异源双链(Volkov等人,Nucleic Acids Res.27:e18(1999);和Volkov等人,MethodsEnzymol.328:456-463(2000));临时模板随机嵌合(RACHITT),其使用了DNA酶I断裂和单链DNA(ssDNA)的大小分级(Coco等人,Nat.Biotechnol.19:354-359(2001));截短模板上的重组延伸(RETT),其需要在存在用作模板池的单向ssDNA片段的情况下链从引物单向生长的模板转换(Lee等人,J.Molec.Catalysis 26:119-129(2003));简并寡核苷酸基因重排(DOGS),其中将简并引物用于控制分子之间的重组;(Bergquist and Gibbs,MethodsMol.Biol 352:191-204(2007);Bergquist等人,Biomol.Eng 22:63-72(2005);Gibbs等人,Gene 271:13-20(2001));用于产生杂合酶的增长截短法(ITCHY),其产生了具有所关心的基因或基因片段的1个碱基对缺失的组合库(Ostermeier等人,Proc.Natl.Acad.Sci.USA96:3562-3567(1999);和Ostermeier等人,Nat.Biotechnol.17:1205-1209(1999));用于产生杂合酶的硫代增长截短法(THIO-ITCHY),其类似于ITCHY,除了将硫代磷酸酯dNTP用于产生截短(Lutz等人,Nucleic Acids Res 29:E16(2001));SCRATCHY,其组合了用于重组基因的两种方法,ITCHY和DNA重排(Lutz等人,Proc.Natl.Acad.Sci.USA98:11248-11253(2001));随机漂变突变(RNDM),其中通过epPCR进行突变,然后筛选/选择保留了可用活性的那些(Bergquist等人,Biomol.Eng.22:63-72(2005));序列饱和突变(SeSaM),随机突变方法,其使用硫代磷酸酯核苷酸的随机掺入和切割,产生随机长度片段池,所述随机长度片段池用作在存在“通用”碱基,如肌苷的情况下延伸的模板,并且含有肌苷的互补序列的复制提供了随机碱基掺入,并因此导致突变(Wong等人,Biotechnol.J.3:74-82(2008);Wong等人,Nucleic Acids Res.32:e26(2004);和Wong等人,Anal.Biochem.341:187-189(2005));合成重排,其使用设计以编码“靶标中所有遗传多样性”的重叠寡核苷酸并且允许重排子代具有很高的多样性(Ness等人,Nat.Biotechnol.20:1251-1255(2002));核苷酸交换和切割技术NexT,其利用了dUTP掺入与随后使用尿嘧啶DNA糖基化酶,然后用哌啶处理以进行终点DNA断裂的组合(Muller等人,Nucleic Acids Res.33:e117(2005))。
其它方法包括不依赖于序列同源性的蛋白质重组(SHIPREC),其中将接头用于辅助两种远缘相关或不相关基因的融合,并且在所述两种基因之间产生一定范围的嵌合体,从而导致产生了单一混合杂交库(Sieber等人,Nat.Biotechnol.19:456-460(2001));基因位点饱和突变TM(GSSMTM),其中起始材料包括在所期望的突变位点含有简并的插入和两个引物的超螺旋双链DNA(dsDNA)质粒(Kretz等人,Methods Enzymol.388:3-11(2004));组合盒式突变(CCM),其包括使用短寡核苷酸盒以替代具有大量可能的氨基酸序列变化的限制区(Reidhaar-Olson等人,Methods Enzymol.208:564-586(1991);和Reidhaar-Olson等人Science 241:53-57(1988));组合多级盒式突变(CMCM),其本质上类似于CCM并且使用高突变率的epPCR来鉴别热点(hot spots)和热区(hot regions),然后通过CMCM延伸以覆盖限定的蛋白序列空间区域(Reetz等人,Angew.Chem.Int.Ed Engl.40:3589-3591(2001));致突变菌株技术,其中条件性ts致突变质粒使用了mutD5基因,其编码了DNA聚合酶III的突变体亚基,从而在选择期间和当不需要选择时,在阻断有害突变的积累期间,允许随机和自然突变频率提高20至4000-X(Selifonova等人,Appl.Environ.Microbiol.67:3645-3649(2001);Low等人,J.Mol.Biol.260:359-3680(1996))。
其它示例性方法包括浏览突变(Look-Through Mutagenesis,LTM),它是评价和优化所选氨基酸的组合突变的多维突变方法(Rajpal等人,Proc.Natl.Acad.Sci.USA 102:8466-8471(2005));基因重组装,它是可以一次应用于多个基因并且产生单个基因的大型嵌合体库(多个突变)的DNA重排法(Verenium Corporation所提供的TunableGeneReassemblyTM(TGRTM)技术)、计算机蛋白设计自动化(PDA),它是锚定具有特定折叠的在结构上限定的蛋白主链,并且搜索可以稳定所述折叠和整体蛋白能学的用于氨基酸替代的序列空间的优化算法,并且它通常对具有已知三维结构的蛋白最有效(Hayes等人,Proc.Natl.Acad.Sci.USA 99:15926-15931(2002));和迭代饱和突变(ISM),其包括使用结构/功能的知识来选择用于酶改善的可能位点,使用突变法,如Stratagene QuikChange(Stratagene;San Diego CA)在所选位点进行饱和突变,对于所期望的性质进行筛选/选择,并且使用改善的克隆,在另一位点重复一次并继续重复直至实现所期望的活性(Reetz等人,Nat.Protoc.2:891-903(2007);和Reetz等人,Angew.Chem.Int.Ed Engl.45:7745-7751(2006))。
可以单独或以任意组合使用任何上述突变方法。另外,所述定向进化方法中的任一种或组合可以结合如本文所述的或者另外如本领域中已知的适应进化技术使用。
本文提供了具有编码本文所述的蛋白的核酸序列以及本文所述的基因的特异性编码核酸序列的分离的核酸。本文所提供的核酸包括具有序列表中所提供的核酸序列的那些;在高严格性杂交条件下(例如,42°,2.5hr.,6×SCC,0.1%SDS),杂交至序列表中所提供的核酸序列的那些;和与序列表中所提供的核酸序列具有显著核酸序列同一性的那些。本文所提供的核酸还涵盖了可以翻译以产生相同氨基酸序列的等价密码子替代。本文还提供了包含本文所述的核酸的载体。所述载体可以是适合于在宿主微生物中表达的表达载体。所述载体可以是病毒载体。
本文所提供的核酸包括编码具有如本文所述的氨基酸序列的蛋白的那些以及保留了它们的功能的它们的变体。本文所提供的核酸可以是cDNA、化学合成的DNA、通过PCR扩增的DNA、RNA或其组合。由于遗传密码的简并度,两条DNA序列可以不同,但仍编码相同的氨基酸序列。
本文还提供了编码本文所述的蛋白的有用的核酸片段,包括探针和引物。可以(例如)在PCR方法中使用这些探针和引物以体外扩增或检测编码本文所述的蛋白的核酸的存在,并且可以在DNA和RNA印迹中用于分析。还可以通过使用这些探针来鉴别表达本文所述的蛋白的细胞。用于产生和使用这些引物和探针的方法是熟知的。
本文还提供了编码本文所述的蛋白的核酸片段,所述核酸片段是具有能够结合至本文所述的蛋白或核酸序列的靶标mRNA或DNA序列的单链核酸的反义或正义寡核苷酸。
编码本文所述的蛋白的核酸可以包括杂交至本文通过SEQ ID NO所公开的核酸的核酸或者杂交至编码本文通过SEQ ID NO所公开的氨基酸序列的核酸分子的核酸分子。杂交条件可以包括如本文所述的那些的本领域技术人员熟知的高严格性、中等严格性或低严格性杂交条件。
严格杂交是指杂交的多核苷酸稳定的条件。如本领域技术人员已知的,杂交的多核苷酸的稳定性反映在杂交物的解链温度(Tm)。一般地,杂交的多核苷酸的稳定性是盐浓度,例如,钠离子浓度和温度的函数。杂交反应可以在较低的严格性条件下进行,然后通过不同,但更高的严格性清洗。对杂交严格性的提及涉及这些清洗条件。高严格性杂交包括仅允许在0.018M NaCl,65℃形成稳定的杂化多核苷酸的那些核酸序列杂交的条件,例如,如果杂交物在0.018M NaCl,65℃不稳定,则它在高严格性条件下将不会稳定,如本文所考虑的。可以(例如)通过在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中,在42℃杂交,然后在0.1×SSPE和0.1%SDS中,在65℃清洗来提供高严格性条件。除高严格性杂交条件以外的杂交条件也可以用于描述本文所公开的核酸序列。例如,短语中等严格性杂交是指相当于在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中,在42℃杂交,然后在0.2×SSPE和0.2%SDS中,在42℃清洗的条件。短语低严格性杂交是指相当于在10%甲酰胺、5×Denhart溶液、6×SSPE、0.2%SDS中,在22℃杂交,然后在1×SSPE、0.2%SDS中,在37℃清洗的条件。Denhart溶液含有1%聚蔗糖、1%聚乙烯吡咯烷酮和1%牛血清白蛋白(BSA)。20×SSPE(氯化钠、磷酸钠、乙二胺四乙酸(EDTA))含有3M氯化钠、0.2M磷酸钠和0.025M(EDTA)。其它适合的低、中等和高严格性杂交缓冲液和条件对于本领域技术人员是熟知的并且在(例如)Sambrook等人,Molecular Cloning:A Laboratory Manual,第3版,Cold Spring HarborLaboratory,New York(2001);和Ausubel等人,Current Protocols in MolecularBiology,John Wiley and Sons,Baltimore,MD(1999)中有描述。
编码本文所提供的蛋白的核酸包括与本文通过SEQ ID NO所公开的核酸序列具有特定序列同一性百分比的那些。例如,核酸分子可以与选自SEQ ID NO:57-78的序列具有至少95.0%、至少95.1%、至少95.2%、至少95.3%、至少95.4%、至少95.5%、至少95.6%、至少95.7%、至少95.8%、至少95.9%、至少96.0%、至少96.1%、至少96.2%、至少96.3%、至少96.4%、至少96.5%、至少96.6%、至少96.7%、至少96.8%、至少96.9%、至少97.0%、至少97.1%、至少97.2%、至少97.3%、至少97.4%、至少97.5%、至少97.6%、至少97.7%、至少97.8%、至少97.9%、至少98.0%、至少98.1%、至少98.2%、至少98.3%、至少98.4%、至少98.5%、至少98.6%、至少98.7%、至少98.8%、至少98.9%、至少99.0%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%或至少99.8%的序列同一性,或者是相同的。
因此,在一些实施方式中,本文所提供的分离的核酸具有本文所公开的H0梅奇酵母(Metschnikowia)种的基因的核酸序列,其包括:ACT1(SEQ ID NO:57)、ARO8(SEQ ID NO:58)、ARO10(SEQ ID NO:59)、GPD1(SEQ ID NO:60)、GXF1(SEQ ID NO:61)、GXF2(SEQ ID NO:62)、GXS1(SEQ ID NO:63)、HXT19(SEQ ID NO:64)、HXT2.6(SEQ ID NO:65)、HXT5(SEQ IDNO:66)、PGK1(SEQ ID NO:67)、QUP2(SEQ ID NO:68)、RPB1(SEQ ID NO:69)、RPB2(SEQ IDNO:70)、TEF1(SEQ ID NO:71)、TPI1(SEQ ID NO:72)、XKS1(SEQ ID NO:73)、XYL1(SEQ IDNO:74)、XYL2(SEQ ID NO:75)、XYT1(SEQ ID NO:76)、TAL1(SEQ ID NO:77)或TKL1(SEQ IDNO:78)。因此,在一些实施方式中,本文提供了具有ACT1(SEQ ID NO:57)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有ARO8(SEQ ID NO:58)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有ARO10(SEQ ID NO:59)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有GPD1(SEQ ID NO:60)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有GXF1(SEQ ID NO:61)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有GXF2(SEQ ID NO:62)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有GXS1(SEQ ID NO:63)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有HXT19(SEQ ID NO:64)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有HXT2.6(SEQ ID NO:65)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有HXT5(SEQ ID NO:66)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有PGK1(SEQ ID NO:67)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有QUP2(SEQ ID NO:68)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有RPB1(SEQ ID NO:69)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有RPB2(SEQID NO:70)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有TEF1(SEQ IDNO:71)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有TPI1(SEQ ID NO:72)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有XKS1(SEQ ID NO:73)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有XYL1(SEQ ID NO:74)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有XYL2(SEQ ID NO:75)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有XYT1(SEQ ID NO:76)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有TAL1(SEQ ID NO:77)的核酸序列的分离的核酸。在一些实施方式中,本文提供了具有TKL1(SEQ ID NO:78)的核酸序列的分离的核酸。
应理解在本文所提供的本发明的定义内,还提供了不显著影响本发明的多个实施方式的活性的改变。因此,以下实施例旨在说明,但不限制本发明。在整个本发明申请中,已参考了多个出版物。在本发明中,这些出版物的公开内容,包括GenBank和GI编号出版物以其全部内容作为参考并入本文以更全面地描述本发明所属领域的技术现状。
实施例I
H0梅奇酵母(Metschnikowia)种的鉴定
本实施例表明H0梅奇酵母(Metschnikowia)种属于梅奇酵母(Metschnikowia)属并且具有D1/D2和与美极梅奇酵母(Metschnikowia pulcherrima)进化枝最密切相关的ITS序列,但是它在其D1/D2区内具有非常高的变异性,从而不可以使用一般对于菌种鉴定适用的1%阈值。然而,高变异性主要限制在两个特定区域并且已鉴别了保守的D1/D2区。使用RPB2基因序列的系统发育分析显示与美极梅奇酵母(Metschnikowia pulcherrima)进化枝的其它成员相比,H0梅奇酵母(Metschnikowia)种是作为亚组与Metschnikowiazizyphicola聚类的新种。H0梅奇酵母(Metschnikowia)种在具有木糖的培养基中的形态学和生理特征,具体地,生长谱确认H0梅奇酵母(Metschnikowia)种是与Metschnikowiazizyphicola密切相关的的新种。
D1/D2域及ITS序列分析
大亚基(LSU)rRNA基因的域1和2(D1/D2域)以及位于小亚基(SSU)和LSU rRNA基因之间的内部转录间隔区(ITS)的序列分析是用于酵母种鉴定的普遍接受的工具(Kurtzmanand Robnett,1998,Antonie Van Leeuwenkoek,73:331-371)。子囊菌酵母的上述研究已表明在D1/D2域中具有超过1%的替代的菌株通常代表单独的物种(Kurtzman&Robnett,1998)。已在葡萄牙棒孢酵母(Clavispora lusitaniae)(Lachance等人,2003,FEMS YeastRes.4:253-258)、Metschnikowia andauensis和核果梅奇酵母(Metschnikowiafructicola)(Sipiczki等人,2013,PLoS One,8:e67384)中发现了例外,其中一些菌株在D1/D2域中显示出大于1%的分歧或异源性。
使用引物NL1(5'-GCATATCAATAAGCGGAGGAAAAG-3';SEQ ID NO:26)和NL4(5'-GGTCCGTGTTTCAAGACGG-3';SEQ ID NO:27),从其基因组DNA扩增了H0梅奇酵母(Metschnikowia)种的D1/D2域。对于H0梅奇酵母(Metschnikowia)种鉴别了D1/D2域的以下示例性499个碱基的序列(从引物NL1之后立即开始,并在引物NL4之前结束):
AAACCAACAGGGATTGCCTCAGTAACGGCGAGTGAAGCGGCAAAAGCTCAAATTTGAAATCCCCCGGGAATTGTAATTTGAAGAGATTTGGGTCCGGCCGGCAGGGGTTAAGTCCACTGGAAAGTGGCGCCACAGAGGGTGACAGCCCCGTGAACCCCTTCAACGCCTTCATCCCAGATCTCCAAGAGTCGAGTTGTTTGGGAATGCAGCTCTAAGTGGGTGGTAAATTCCATCTAAAGCTAAATACCGGCGAGAGACCGATAGCGAACAAGTACAGTGATGGAAAGATGAAAAGCACTTTGAAAAGAGAGTGAAAAAGTACGTGAAATTGTTGAAAGGGAAGGGCTTGCAAGCAGACACTTAACTGGGCCAGCATCGGGGCGGCGGGAAACAAAACCACCGGGGAATGTACCTTTCGAGGATTATAACCCCGGTCCTTATTTCCTCGCCACCCCGAGGCCTGCAATCTAAGGATGCTGGCGTAATGGTTGCAAGTCGC(SEQ ID NO:1)
该示例性D1/D2序列是多种类型的D1/D2域的混合物——覆盖细胞中所有类型的一类共有序列。
使用核苷酸碱基局部比对搜索工具(BLASTN),对NCBI核苷酸集合(nr/nt)数据库比较以上序列。产生了来自BLASTN搜索的分类学报告(表1)。所述分类学报告显示在总计105个命中(hits)中,104个命中来自梅奇酵母(Metschnikowia)属,其中大部分种属于美极梅奇酵母(Metschnikowia pulcherrima)进化枝,包括美极梅奇酵母(Metschnikowiapulcherrima)、核果梅奇酵母(Metschnikowia fructicola)、Metschnikowia andauensis、金佩梅奇酵母(Metschnikowia chrysoperlae)、中国梅奇酵母(Metschnikowiasinensis)、山西梅奇酵母(Metschnikowia shanxiensis)和Metschnikowia zizyphicola。
表1
将以上所鉴定的H0梅奇酵母(Metschnikowia)种的D1/D2域(SEQ ID NO:1)进一步与美极梅奇酵母(Metschnikowia pulcherrima)进化枝内的具体的种的D1/D2域相比较(表2)。鉴别了多个差异。例如,H0梅奇酵母(Metschnikowia)种和美极梅奇酵母(Metschnikowia pulcherrima)进化枝的种美极梅奇酵母(Metschnikowia pulcherrima)、核果梅奇酵母(Metschnikowia fructicola)、Metschnikowia andauensis、金佩梅奇酵母(Metschnikowia chrysoperlae)、中国梅奇酵母(Metschnikowia sinensis)、山西梅奇酵母(Metschnikowia shanxiensis)和Metschnikowia zizyphicola之间的D1/D2域序列的核苷酸数目变化分别为11(2.2%)、14(2.8%)、11(2.2%)、11(2.2%)、11(2.2%)、11(2.2%)和12(2.4%)。
表2
还通过CBS-KNAW真菌生物多样性中心进行D1/D2域和ITS序列的分析。H0梅奇酵母(Metschnikowia)种在培养基麦芽提取物琼脂(MEA,OXOID)上培养。在避光,25℃培养3-4天的培养期之后,使用MoBio-UltraClean微生物DNA分离试剂盒提取DNA。使用引物LR0R(5'-ACCCGCTGAACTTAAGC-3';SEQ ID NO:28)和LR5(5'-TCCTGAGGGAAACTTCG-3';SEQ ID NO:29)扩增含有D1/D2域的片段(Vilgalys and Hester,1990,J.Bacteriol.,172(8):4238-4246)。使用引物LS266(5'-GCATTCCCAAACAACTCGACTC-3';SEQ ID NO:30)和V9G(5'-TTACGTCCCTGCCCTTTGTA-3';SEQ ID NO:31)扩增含有内部转录间隔区1和2的片段以及5.8S基因(ITS)(Gerrits van den Ende&de Hoog 1999))。通过ABI Prism Big DyeTMTerminator v.3.0简便反应循环测序试剂盒对PCR片段测序。在ABI PRISM 3700Genetic分析仪上分析样品,并且通过来自LaserGene软件包的SeqMan程序使用正向和反向序列来组装重叠群。鉴别了以下D1/D2和ITS序列:
D1/D2域序列:
GATTGCCTCAGTAACGGCGAGTGAAGCGGCAAAAGCTCAAATTTGAAATCCCCCGGGAATTGTAATTTGAAGAGATTTGGGTCCGGCCGGCGGGGGTTAAGTCCACTGGAAAGTGGCGCCACAGAGGGTGACAGCCCCGTGAACCCCTTTAAAGCCTTCATCCCAGATCTCCAAGAGTCGAGTTGTTTGGGAATGCAGCTCTAAGTGGGTGGTAAATTCCATCTAAAGCTAAATACCGGCGAGAGACCGATAGCGAACAAGTACAGTGATGGAAAGATGAAAAGCACTTTGAAAAGAGAGTGAAAAAGTACGTGAAATTGTTGAAAGGGAAGGGCTTGCAAGCAGACACTTAACTGGGCCAGCATCGGGGCGGCGGGAAACAAAACCACCGGGGAATGTACCTTTCGAGGATTATAACCCCGGTCTCTATTTCCATGCTGCCCCGAGGCCTGCAATCTAAGGATGCTGGCGTAATGGTTGCAAGTCGCCCGTCTTGAAACACGGACCAAGGAGTCTAACAATCATGCAAGTGTTTGGGCCCAAAACCCATACGCGCAATGAAAGTAACCGGAGCGAACCTTCTGGTGCAGCTCCAGCCACACCGAGACCCAAATCCCGGTGTGAGCAAGCATGGCTGTTGGGACCCGAAAGATGGTGAACTATACCTGGATAGGGTGAAGCCAGAGGAAACTCTGGTGGAGGCTCGTAGCGGTTCTGACGTGCAAATCGATCGTCGAATCTGGGTATAGGGGCGAAAGAC(SEQ ID NO:32)
ITS序列:
CTTAGTGAGGCCTCTGGATTGAATCTAGGGCCGGGGCGACCCGGCCGTGGGTTGAGAAACTGGTCAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAAAAATATTATTACACACTTTTAGGAAAAACCTCTGAACCTTTTTTTTCATATACACTTTTAAAAAACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAATTGCGATACGTAATATGACTTGCAGACGTGAATCATTGAATCTTTGAACGCACATTGCGCCCCGGGGTATTCCCCAGGGCATGCGTGGGTGAGCGATATTTACTCTCAAACCTCCGGTTTGGTCCTGCTTCGGCCTAATATCAACGGCGCTAGAATAAGTTTTAGCCCCATTCTTTTTCCTCACCCTCGTAAGACTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACAGGGATTGCCTCAGTAACGGCGAGTGAAGCGGCAAAAGCTCAAATTTGAAATCCCCCGGGAATTGTAATTTGAAGAGATTTGGGTCCGGCCGGCGGGGGTTAAGTCCACTGGAAAGTGGCGCCACAGAGGGTGACAGCCCCGTGA(SEQ ID NO:33)
使用核苷酸碱基局部比对搜索工具(BLASTN)对NCBI核苷酸集合(nr/nt)数据库并且在CBS-KNAW真菌生物多样性中心的大型真菌数据库中与大部分标准株的序列比较了这些序列。该比较显示H0梅奇酵母(Metschnikowia)种是梅奇酵母(Metschnikowia)属中的新种。该属内最接近的已知种鉴定为Metschnikowia andauensis,其对于D1/D2序列具有97%的序列同一性。另外,美极梅奇酵母(Metschnikowia pulcherrima)对于D1/D2序列显示出98%的序列同一性,但是对于ITS序列仅显示出94%的序列同一性,并且山西梅奇酵母(Metschnikowia shanxiensis)对于D1/D2序列仅显示出96%的序列同一性,对于ITS序列的短片段,显示出98%的序列同一性。
然而,如以上所指出的,Metschnikowia andauensis和核果梅奇酵母(Metschnikowia fructicola)的标准株的D1/D2域报告为非同源的。例如,已报道可以在M.andauensis克隆内发现多达18个(3.6%)替代,并且可以在核果梅奇酵母(M.fructicola)克隆内发现多达25个(5%)替代(Sipiczki等人,2013,PLoS One,8:e67384)。因此,为了检验H0梅奇酵母(Metschnikowia)种的D1/D2域是否同源,从原始H0梅奇酵母(Metschnikowia)种的永久性保藏划线的6个菌落提取DNA,并使用引物ITS1(5'-TCCGTAGGTGAACCTGCGG-3';SEQ ID NO:34)和NL4(5'-GGTCCGTGTTTCAAGACGG-3';27)通过PCR对其进行扩增,所述引物侧接了与质粒pUC19相同的20nt的序列以用于组装克隆。将PCR产物凝胶纯化并克隆至pUC19的SacI和HindIII位点。从两端对克隆的质粒测序,并使用Geneious 7.1.9分析序列。
在所克隆和分析的总计32个D1/D2域序列中,存在具有多达23个碱基变化(4.6%)的23种类型(表3),其超出了H0梅奇酵母(Metschnikowia)种和美极梅奇酵母(M.pulcherrima)进化枝的标准株之间的差异。
表3
D1/D2区中的变化限制在位于SEQ ID NO:1的核苷酸154-177之间和435-452之间的两个主要区域(图1)。在这两个主要可变区之外,仅存在9个其中在至少两个克隆中观察到核苷酸差异的位置。在单个克隆中,两个高变区之外的可变核苷酸数目为0(类型13、15和22),或者1(类型1、6、11、12、17、19、20、21和23),或者2(类型2、3、4、5、7、9、10、14和18),或者3(类型8),或者4(类型16)。
另外,鉴别了以下共有D1/D2域序列:
AAACCAACAGGGATTGCCTCAGTAACGGCGAGTGAAGCGGCAAAAGCTCAAATTTGAAATCCCCCGGGAATTGTAATTTGAAGAGATTTGGGTCCGGCCGGCAGGGGTTAAGTCCACTGGAAAGTGGCGCCACAGAGGGTGACAGCCCCGTGAACCCCTTCAACGCCCTCATCCCAGATCTCCAAGAGTCGAGTTGTTTGGGAATGCAGCTCTAAGTGGGTGGTAAATTCCATCTAAAGCTAAATACCGGCGAGAGACCGATAGCGAACAAGTACAGTGATGGAAAGATGAAAAGCACTTTGAAAAGAGAGTGAAAAAGTACGTGAAATTGTTGAAAGGGAAGGGCTTGCAAGCAGACACTTAACTGGGCCAGCATCGGGGCGGCGGGAAACAAAACCACCGGGGAATGTACCTTTCGAGGATTATAACCCCGGTCTCTATTTCCTYACYRCCCCGAGGCCTGCAATCTAAGGATGCTGGCGTAATGGTTGCAAGTCGC(SEQ ID NO:2)
所有所鉴定的H0梅奇酵母(Metschnikowia)种的D1/D2域序列对共有D1/D2序列具有至少97.1%的序列同一性。
基于这些结果,显然H0梅奇酵母(Metschnikowia)种是梅奇酵母(Metschnikowia)属的成员并且与美极梅奇酵母(Metschnikowia pulcherrima)进化枝的种密切相关,但是显而易见,需要D1/D2域序列以外的其它鉴定来将H0梅奇酵母(Metschnikowia)种与美极梅奇酵母(Metschnikowia pulcherrima)进化枝的其它成员相区别。
RNA聚合酶II(RPB2)基因序列分析
ACT1、EF2和RPB2序列的第1和第2密码子位置已用于梅奇酵母科(Metschnikowiaceae)中所有已知的种的系统发育分析(Guzmán等人,2013,Mol.Phylogenet.Evol.,68(2):161-175)。因此,分析了来自H0梅奇酵母(Metschnikowia)种的RPB2序列。
从GeneBank中对6种美极梅奇酵母(Metschnikowia pulcherrima)进化枝种和接近于美极梅奇酵母(Metschnikowia pulcherrima)但又与之分离的1个外类群种Metschnikowia kunwiensis提取了部分RPB2基因序列(表4)。
表4
从H0梅奇酵母(Metschnikowia)种全基因组鸟枪重叠群提取来自H0梅奇酵母(Metschnikowia)种的RPB2基因序列,并且其表示为:
ATGTCGCAGGAGCCGGTAGAAGACCCTTACGTCTACGACGAGGAGGACGCGCACAGCATCACGCCCGAGGACTGCTGGACGGTGATTCTGTCGTTTTTCCAGGAAAAAGGCCTTGTCTCACAGCAGTTGGACTCGTTCGACGAGTTCATCGAGTCAAACATCCAGGAGTTGGTGTGGGAGGACTCGCACTTGATTCTCGACCAGCCGGCGCAACATACTTCCGAGGACCAGTATGAAAATAAGCGGTTTGAAATCACGTTTGGCAAGATCTATATTTCGAAGCCAACGCAGACCGAGGGCGACGGAACAACGCACCCGATGTTCCCACAGGAGGCACGCTTGCGTAACTTGACCTACAGCTCGCCGCTTTACGTGGACATGCTGAAAAAGAAGTTTCTTTCCGATGACAGAGTGAGAAAGGGTAACGAGCTAGAATGGGTGGAGGAGAAAGTCGATGGCGAGGAGGCCCAGCTGAAGGTGTTCTTGGGTAAGGTGCCAATCATGCTAAGGTCGAAGTTTTGCATGTTGCGGGACTTGGGCGAGCACGAGTTCTACGAGTTGAAAGAGTGCCCTTACGATATGGGTGGCTATTTCGTCATCAACGGTTCCGAAAAAGTCTTGATCGCCCAGGAGCGCTCGGCGGCTAACATTGTCCAGGTGTTTAAGAAGGCAGCGCCCTCGCCCATCTCGCACGTGGCGGAGATCCGTTCCGCGCTTGAAAAGGGTTCCCGTTTGATCTCCTCGATGCAGATCAAACTATATGGTCGTGACGACAAGGGCACCACTGGCAGAACAATCAAGGCCACATTGCCCTACATCAAGGAAGACATCCCGATTGTGATTGTATTCAGAGCCCTCGGCGTGGTCCCCGATGGAGACATTTTGGAACACATTTGTTACGATGCAAACGATTGGCAAATGTTAGAGATGTTGAAGCCATGTGTGGAGGAAGGTTTCGTGATCCAGGAGCGCGAAGTCGCACTTGACTTTATCGGTAGAAGAGGTGTCTTGGGTATCAGAAGGGAAAAGCGTATCCAGTACGCAAAGGATATTTTACAGAAAGAGTTGTTGCCTAACATCACACAGGAGGCCGGTTTCGAGTCAAGAAAGGCATTCTTCTTGGGTTACATGGTCAACCGTTTGTTGTTATGTGCATTAGAAAGAAAGGAGCCTGACGACAGAGATCATTTTGGCAAGAAGAGATTGGATTTGGCCGGACCCTTGTTGGCATCCTTGTTCCGTCTCTTATTCAAAAAGCTTACCAGGGATATCTATAACTACATGCAGCGGTGCGTGGAGAATGACAAGGAGTTTAATCTCACGTTGGCGGTCAAGTCACAGACCATCACTGATGGTTTGCGGTACTCGTTGGCCACAGGTAATTGGGGTGAACAAAGAAAGGCCATGAGTGCACGTGCCGGTGTGTCGCAGGTGTTGAACAGATACACATACTCATCGACATTGTCGCATTTGAGAAGAACAAATACTCCAATTGGCCGTGACGGTAAGATCGCCAAACCTAGACAGTTGCACAACACCCACTGGGGTCTTGTATGTCCTGCAGAAACTCCTGAGGGTCAGGCGTGTGGTTTGGTGAAGAATTTGTCTTTGATGACGTGTATATCCGTTGGTACCTCTTCCGAGCCGATCTTGTATTTCTTGGAAGAGTGGGGTATGGAACCCTTGGAGGACTATGTTCCTTCGAACGCACCAGACTGCACAAGAGTCTTTGTCAACGGTGTATGGGTTGGCACACACAGAGAACCGGCACAGCTTGTCGATACCATGAGGAGGTTGAGAAGGAAGGGCGATATCTCTCCCGAGGTGTCGATCATCAGGGACATCAGAGAAATGGAGTTCAAGATCTTCACCGATGCAGGCCGTGTCTACCGTCCGTTGTTCATCGTGGACGACGACCCAGAGTCCGAAACCAAGGGTGAGTTGATGTTGCAAAAAGAGCACGTGCACAAGTTGTTGAACTCGGCCTACGATGAATATGACGAGGATGACTCCAATGCGTACACATGGTCGTCGTTGGTGAATGATGGTGTGGTAGAGTACGTTGACGCCGAGGAGGAGGAGACAATCATGATCGCCATGACCCCAGAGGATTTGGAGGCTTCCAAGAGTGCGTTGTCGGAGACTCAGCAACAGGATCTTCAAATGGAGGAACAAGAGCTTGATCCTGCAAAGCGAATCAAACCAACTTATACCTCATCCACACACACCTTCACGCATTGTGAGATTCATCCTTCGATGATTTTGGGTGTCGCCGCCTCTATCATTCCGTTCCCCGACCATAACCAGTCGCCGCGTAACACATACCAGTCTGCTATGGGTAAACAAGCCATGGGTGTATTTTTGACTAACTATGCCGTTAGAATGGACACAATGGCAAATATCTTATACTACCCACAGAAACCCTTGGCCACAACAAGAGCCATGGAGCACTTGAAGTTCCGTGAGTTGCCTGCTGGTCAGAATGCAGTGGTGGCCATTGCTTGTTACTCCGGCTACAACCAAGAAGATTCCATGATCATGAACCAGTCGTCGATTGATAGAGGATTGTTCCGGTCTTTGTTTTTCAGATCTTACATGGATCTAGAGAAGAGACAAGGTATGAAAGCCTTGGAGACGTTTGAAAAGCCATCCAGATCTGACACCTTGAGATTGAAGCATGGAACCTACGAAAAGTTAGATGACGATGGTTTGATCGCGCCTGGTGTCAGGGTCAGTGGTGAGGATATCATCATCGGTAAAACCACACCTATTCCACCTGACACCGAGGAGTTGGGTCAGAGAACCCAGTATCATACCAAGAGAGATGCCTCGACGCCATTGAGAAGCACGGAGTCTGGTATTGTTGACCAGGTTCTTTTGACCACAAATGGTGACGGCGCCAAGTTCGTCAAGGTCAGAATGAGAACGACGAAGGTTCCACAAATCGGTGACAAGTTTGCCTCCAGACACGGACAAAAGGGTACAATCGGTGTCACATATAGACACGAGGATATGCCTTTCAGTGCACAGGGTATTGTGCCTGACTTGATCATAAACCCGCATGCTATTCCATCTCGTATGACAGTCGCTCACTTGATCGAGTGTTTGTTGTCGAAAGTCTCTTCCTTGTCCGGATTGGAAGGTGACGCCTCGCCATTCACGGACGTCACAGCCGAGGCTGTTTCCAAATTGTTGAGAGAGCACGGATACCAATCTAGAGGTTTCGAGGTGATGTACAATGGTCACACCGGTAAGAAGATGATGGCGCAAGTGTTCTTTGGCCCAACGTACTACCAGAGATTGAGGCATATGGTGGATGACAAGATCCACGCTAGAGCCAGAGGTCCAGTTCAAGTTTTGACCAGGCAGCCTGTGGAAGGTAGATCCAGGGATGGTGGATTACGTTTCGGAGAGATGGAGAGAGATTGTATGATTGCGCACGGAGCTGCTGGATTCTTAAAGGAAAGATTGATGGAGGCTTCGGATGCTTTCAGAGTTCACGTTTGTGGAATCTGTGGTTTGATGTCGGTGATTGCAAACTTGAAGAAGAACCAGTTCGAGTGTCGGTCGTGCAAAAACAAGACCAACATTTACCAGATCCACATTCCATACGCAGCCAAATTGTTGTTCCAGGAGTTGATGGCCATGAACATTTCTCCTAGATTGTACACGGAGAGATCAGGAATCAGTGTGCGTGTCTGA(SEQ ID NO:70)
在Genieous 7.1.9中编辑序列并使用ClustalW比对。使用Genieous7.1.9 treebuilder构建邻接树。
美极梅奇酵母(Metschnikowia pulcherrima)进化枝成员之间的系统发育距离比美极梅奇酵母(Metschnikowia pulcherrima)种和Metschnikowia kunwiensis外类群种之间的距离更近(图2)。将H0梅奇酵母(Metschnikowia)种与Metschnikowia zizyphicola作为亚组聚类(图2)。其它亚组为:(a)美极梅奇酵母(Metschnikowia pulcherrima)和核果梅奇酵母(Metschnikowia fructicola)(b)M.andauensis、中国梅奇酵母(M.sinensis)和山西梅奇酵母(M.shaxiensis);和(c)金佩梅奇酵母(M.chrysoperlae)(图2)。
以上系统发育分析显示与美极梅奇酵母(Metschnikowia pulcherrima)进化枝的其它成员相比,H0梅奇酵母(Metschnikowia)种是作为亚组与Metschnikowia zizyphicola聚类的新种。
形态学和生理特征
H0梅奇酵母(Metschnikowia)种与其它梅奇酵母(Metschnikowia)种共有某些形态学和生理特征,但是它的确也具有独特的特征。例如,像其它美极梅奇酵母(Metschnikowia pulcherrima)进化枝种一样,H0梅奇酵母(Metschnikowia)种细胞是球形至椭圆形的。多极出芽。当H0梅奇酵母(Metschnikowia)种酵母细胞在YPD肉汤中,在30℃生长7天时,出现大量球形厚壁孢子-样“美极(pulcherrima)”细胞。在YPD琼脂上,H0梅奇酵母(Metschnikowia)种可以在4℃缓慢生长,它在20℃至33℃生长良好,并且在37℃不生长。H0梅奇酵母(Metschnikowia)种向培养基分泌粉红色色素。H0梅奇酵母(Metschnikowia)种可以吸收右旋葡萄糖、D-半乳糖、D-木糖、蔗糖、甘油、乙醇、琥珀酸盐和纤维二糖以及轻微发酵的葡萄糖。
H0梅奇酵母(Metschnikowia)种与美极梅奇酵母(Metschnikowia pulcherrima)进化枝种的其它成员的差别在于其在添加了2%木糖的YP培养基中生长延长的时间段。以0.03的初始OD600,在添加2%木糖的YP培养基中好氧生长41小时的晚期阶段,H0梅奇酵母(Metschnikowia)种和Metschnikowia zizyphicola培养物两者在OD600的光密度接近并且远高于其它菌株(图3)。通过木糖生长谱所显示的H0梅奇酵母(Metschnikowia)种与Metschnikowia zizyphicola之间的密切关系与以上所讨论的RPB2序列分析的结果一致。
基于上述所有实验,显然H0梅奇酵母(Metschnikowia)种是新型的美极梅奇酵母(Metschnikowia pulcherrima)进化枝中的种并且可以通过RPB2序列及其木糖生长谱与其它成员相分离。
实施例II
H0梅奇酵母(Metschnikowia)种从木糖生产木糖醇
本实施例表明当在含有木糖的YEP培养基中培养时,H0梅奇酵母(Metschnikowia)种从木糖产生木糖醇。
在补充有4%w/v或10%w/v木糖的酵母提取物蛋白胨(YEP)培养基中对H0梅奇酵母(Metschnikowia)种测定了从木糖生产木糖醇的产量。作为对照,还测定了酿酒酵母(S.cerevisiae)葡萄酒酵母M2。
将H0梅奇酵母(Metschnikowia)种细胞接种至125ml烧瓶中的50ml YEP+4%w/v或10%w/v木糖培养基中,并在30℃的培养箱中,以120rpm振荡培养。从培养中采集1ml样品,并通过离心除去细胞。将所述上清液通过0.22μm尼龙注射器过滤器过滤至HPLC样品小瓶中。通过HPLC,在Rezex RPM-monosaccharide Pb+2柱(Phenomenex)上,在80℃,使用水作为流动相,以0.6ml/min的流速分析所述上清液中木糖醇的含量。通过Agilent G1362A差示折光检测器(Agilent)检测峰。
H0梅奇酵母(Metschnikowia)种通过木糖依赖性途径产生木糖醇。例如,在4%木糖培养基中,H0梅奇酵母(Metschnikowia)种在5天中从40g/L的木糖中产生约13.8g/L的木糖醇,而在10%的木糖中,它在10天中从100g/L的木糖产生约23g/L的木糖醇(图4)。当木糖用尽时,H0梅奇酵母(Metschnikowia)种开始使用培养基中的木糖醇(图4)。在两种培养基中,酿酒酵母(S.cerevisiae)M2种未产生木糖醇(图4)。
实施例III
通过H0梅奇酵母(Metschnikowia)种对多种化合物的生产
本实施例表明当在含有木糖的YEP培养基中培养时,H0梅奇酵母(Metschnikowia)种产生了几种不同的化合物以及木糖醇。
将所述H0梅奇酵母(Metschnikowia)种在30℃,在含有4%的木糖的YEP培养基中生长。在接种后的第3天和第6天采集样品,并通过气相色谱-质谱法(GCMS)分析挥发性化合物以及木糖醇。
该测定显示通过所述H0梅奇酵母(Metschnikowia)种产生了木糖醇、异丙醇、乙醇、异丁醇、正丁醇和2-苯乙醇。表5显示了在第3和6天所测量的这些产物的平均浓度。当在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中,在好氧条件下培养三天时,这些化合物中每一种的产率确定为约0.11g/L/h的木糖醇、约6.8E-05g/L/h的正丁醇、约2.5E-04g/L/h异丁醇、约2.4E-04g/L/h异丙醇、约2.64E-04g/L/h乙醇和约3.73E-06g/L/h2-苯乙醇,相对比为99.26%的木糖醇、0.061%的正丁醇、0.223%的异丁醇、0.217%的异丙醇、0.236%的乙醇和0.003%的2-苯乙醇。
表5
NT=未测试到。
实施例IV
H0梅奇酵母(Metschnikowia)种的特异性生长和代谢产物生产
本实施例表明当与亲缘关系较近的种(美极梅奇酵母(Metschnikowiapulcherrima flavia))相比时,H0梅奇酵母(Metschnikowia)种差异生长并且产生不同的代谢产物。
分别将H0梅奇酵母(Metschnikowia)种和美极梅奇酵母(Metschnikowiapulcherrima flavia)(FL)的三个单菌落接种至5ml酵母浸出粉胨葡萄糖(YEPD)培养基,并在30℃生长过夜。将培养物转入100ml YEPD,并在30℃生长4小时。收集细胞并接种至500ml烧瓶中的200ml培养基中,其OD600=1.0。使用了四种不同类型的培养基:1)YNBG:具有4%的葡萄糖的酵母氮源培养基,2)YNBX:具有4%的木糖的酵母氮源培养基,3)YNBGX:具有2%葡萄糖和2%木糖的酵母氮源培养基,和4)YPDX:具有2%葡萄糖和2%木糖的YEP。将培养物在30℃生长,并以180rpm振荡。每天采集样品来监测生长(通过OD600测量)和代谢产物含量(通过高效液相色谱法(HPLC)测量)。通过顶空GC-MS测量H0梅奇酵母(Metschnikowia)种和FL所产生的挥发性化合物。OD600和HPLC数据是三次生物实验重复的平均值。还计算了标准偏差。通过峰高大致比较了GC-MS数据。
在所有测试的培养基中,在H0梅奇酵母(Metschnikowia)种和FL株之间观察到生长速率的差异。具体地,H0比FL生长地更快(图5A-5D)。例如,在第3天,H0梅奇酵母(Metschnikowia)种相对于FL的OD600的比在YNBG中为1.17(图5A),在YNBX中为1.30(图5B),在YNBGX中为1.26(图5C)并且在YPDX中为1.19(图5D)。
在第1天,在YNBG、YNBGX和YPDX培养基中检测了甘油和乙醇。在YNBG和YNBGX培养基中两菌株之间的浓度相似(图6A和6B)。然而,在YPDX培养基中,H0梅奇酵母(Metschnikowia)种产生了比FL多45%的甘油(905mg/L相对于624mg/L;图6A)。
在所有生长培养基中,H0梅奇酵母(Metschnikowia)种和FL两者均产生阿糖醇(图7A-7D)。然而,在YNBG培养基中,在第1天,H0梅奇酵母(Metschnikowia)种产生了比FL多60mg/L的阿糖醇(图7A)。最显著地,在YNBGX培养基中,H0梅奇酵母(Metschnikowia)种在第1天、第2天和第3天产生了显著更高的量的阿糖醇——H0梅奇酵母(Metschnikowia)种产生了比FL多约40mg/L的阿糖醇(图7C)。在YNBX和YPDX培养基中,在两个种之间阿糖醇的水平类似(图7B和7D)。
H0梅奇酵母(Metschnikowia)种在YNBX培养基中在第3天(1.61g/L),在YNBGX培养基中在第2天(1.43g/L)并且在YPDX培养基中在第4天(21.5g/L)产生了最大量的木糖醇,而FL在YNBX培养基中在第6天(2.33g/L),在YNBGX培养基中在第2天(0.73g/L)并且在YPDX培养基中在第4天(21.9g/L)产生了最大量的木糖醇(图8A-8C)。在第3天,H0梅奇酵母(Metschnikowia)种与FL之间的木糖醇含量之比为YNBX中的4.39,YNBGX中的5.43和YPDX中的0.87。
通过顶空GC-MS测量了分别对于在YNBG中生长1天和在YNBX、YNBGX和YPDX中生长3天后培养基中的挥发性化合物。计算峰高比并在FL和H0梅奇酵母(Metschnikowia)种之间进行比较。该分析显示FL产生了比H0更多的挥发性化合物(图9A-9D)。具体地,FL在YNBG培养基中产生了更多的乙醛、乙酸乙酯、乙缩醛、1-(1-乙氧基乙氧基)戊烷和苯乙醇(图9A);在YNBX培养基中产生了更多的乙酸异戊酯、2-甲基-1-丁醇和3-甲基-1-丁醇(图9B);在YNBGX培养基中产生了更多的乙酸乙酯、丙酸乙酯、乙酸异戊酯、2-甲基-1-丁醇、3-甲基-1-丁醇和苯乙醇(图9C),和在YPDX培养基中产生了更多的乙醛、异丁醇、乙酸异戊酯、3-甲基-1-丁醇、壬酸乙酯和苯乙醇(图9D)。
基于上述结果,H0梅奇酵母(Metschnikowia)种和FL种之间的生长谱和分泌的代谢产物谱显示了在不同培养基中生长期间生长速率以及一些代谢产物的含量和动态中的差异。
实施例V
H0梅奇酵母(Metschnikowia)种特异性基因和蛋白的鉴定
本实施例表明已鉴别了H0梅奇酵母(Metschnikowia)种特有的多种基因和蛋白。
使用以下参数进行同源性搜索:通过Geneious 7.1.9中的程序tblastn,在由鸟枪重叠群组成的H0梅奇酵母(Metschnikowia)种全基因组中,使用来自酿酒酵母(Saccharomyces cerevisiae)的相应蛋白序列,通过同源性搜索鉴别了基因ACT1、ARO8、ARO10、GPD1、PGK1、RPB1、RPB2、TEF1、TPI1、XKS1、TAL1和TKL1。在由鸟枪重叠群组成的H0梅奇酵母(Metschnikowia)种全基因组中,通过树干毕赤酵母(Pichia stiptis)Xyl1、Xyl2、Hxt2.6、Qup2和Sut1蛋白的同源性搜索鉴别了基因XYL1、XYL2、HXT2.6、QUP2、GXF1和GXF2。在由鸟枪重叠群组成的H0梅奇酵母(Metschnikowia)种全基因组中,通过中间假丝酵母(Candida intermedia)Gxs1和Gxf1蛋白的同源性搜索鉴别了基因GXS1和XYT1。在由鸟枪重叠群组成的H0梅奇酵母(Metschnikowia)种全基因组中,通过白假丝酵母(Candidaalbicans)Hxt5蛋白的同源性搜索鉴别了HXT5基因。通过“易化扩散载体超家族(majorfacilitators)”的基因本体语义注释类别(gene ontology term category),对木糖诱导的蛋白搜索H0梅奇酵母(Metschnikowia)种转录组鉴别了HGT19基因。
基于上述实验,鉴别了对应于已知蛋白的几种独特的氨基酸序列。另外,鉴别了对应于已知基因的几种独特的编码核酸序列。表6提供了来自H0梅奇酵母(Metschnikowia)种的示例性蛋白和编码核酸序列的列表,其中所有编码核酸序列是独特的并且一些相应蛋白是独特的。
表6
将以上所鉴别的氨基酸和核酸序列与它们在核果梅奇酵母(Metschnikowiafructicola)277(FR)和美极梅奇酵母(Metschnikowia pulcherrima flavia)(FL)中的相应同源物相比较。表7显示了当与FR和FL种相比时,与H0梅奇酵母(Metschnikowia)种基因和蛋白相同的核苷酸碱基和氨基酸残基的百分比。
表7
因此,H0梅奇酵母(Metschnikowia)种具有以下基因的独特核酸序列:ACT1、ARO8、ARO10、GPD1、GXF1、GXF2、GXS1、HXT19、HXT2.6、HXT5、PGK1、QUP2、RPB1、RPB2、TEF1、TPI1、XKS1、XYL1、XYL2、XYT1、TAL1和TKL1,以及以下蛋白的独特氨基酸序列:Aro10、Gxf2、Hgt19、Hxt5、Tef1、Xks1、Xyl1、Tal1和Tkl1。
序列表
<110> 创新生物科学公司
<120> 用于化合物生物合成的梅奇酵母种
<130> 14305-008-228
<140> TBA
<141> On even date herewith
<150> 62/437,610
<151> 2016-12-21
<160> 78
<170> PatentIn version 3.5
<210> 1
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> H0梅奇酵母(Metschnikowia)种的D1/D2域的示例性499个碱基的序列
<400> 1
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caacgccttc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtcctta tttcctcgcc accccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 2
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> 共有 D1/D2 域序列
<400> 2
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtctcta tttcctyacy rccccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 3
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H01-1 和 H02-2
<400> 3
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcgggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgagcccctc taacgcctct accccaaatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtctcaa tttcctcacc accccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 4
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H01-2, H01-3 或 H03-2
<400> 4
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcgggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caaagccttc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtctcta tttccatgtt gccccgaggc ctgcattcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 5
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H02-1
<400> 5
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgagcccctc taaagcctct accccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataccc ctggtctcta tttccatgtt gccccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 6
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H02-3
<400> 6
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcgggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgagcccctc taacgcctct accccaaatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtctcta tttccatgtt gccccgaggc ctgcattcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 7
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H03-1
<400> 7
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcgggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgagcccctc taacgcctct accccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtctcta tttccatgtt gccccgaggc ctgcattcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 8
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H1-1, H1-3
<400> 8
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt taacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctctcgag 420
gattataacc ccggtctcaa tttccttgtt gccccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 9
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H1-2
<400> 9
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaaccccct caacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataccc ctggtctcta tttccatgtt gccccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 10
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H1-4
<400> 10
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttaaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt taacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatc gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggga gcaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggccctta ctcccatact gccccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 11
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H1-5, H2-5 或 H2-7
<400> 11
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt taacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggga gcaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggccctta ctcccacacc accccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 12
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H1-6
<400> 12
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcgggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt taacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctctcgag 420
gattataacc ccggtctcaa tttcctcacc accccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 13
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H1-7
<400> 13
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgagcccctc taaagcctct accccaaatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctctcgag 420
gattataacc ccggtctcaa tttcctcacc accccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 14
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H1-8
<400> 14
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg taaacccctt caaagccttc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtcctta ctccctcacc atcccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 15
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H2-1
<400> 15
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caaagccttc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtcctta ctcccacacc accccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 16
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H2-2
<400> 16
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggttcggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caacgccttc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctctcgag 420
gattataacc ccggtctcaa tttccttgtt gccccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 17
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H2-3
<400> 17
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtcctta ctccctcacc atcccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 18
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H2-4
<400> 18
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttaaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcgggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt taacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggga gcaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggccctta ctcccacacc accccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 19
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H2-6, H3-7
<400> 19
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcgggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaaccccct caacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtctcaa tttcctcacc accccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 20
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H2-8
<400> 20
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaaccccct caacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggga gcaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtccttt tttccttgtt gccccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 21
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H3-1, H3-4, H3-6
<400> 21
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggttcggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtccttt tttccttgtt gccccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 22
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H3-2
<400> 22
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caacgccttc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctctcgag 420
gattataacc ccggtctcaa tttcctcacc accccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 23
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H3-3
<400> 23
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caaagccttc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac tggggaatgt acctttcgag 420
gattataacc ccggtcctta ctccctcacc atcccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 24
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H3-5
<400> 24
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggtccggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caaagctttt accccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtctcaa tttccttgtt gccccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 25
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> D1/D2 域序列克隆 H3-8
<400> 25
aaaccaacag ggattgcctc agtaacggcg agtgaagcgg caaaagctca aatttgaaat 60
cccccgggaa ttgtaatttg aagagatttg ggttcggccg gcaggggtta agtccactgg 120
aaagtggcgc cacagagggt gacagccccg tgaacccctt caacgccctc atcccagatc 180
tccaagagtc gagttgtttg ggaatgcagc tctaagtggg tggtaaattc catctaaagc 240
taaataccgg cgagagaccg atagcgaaca agtacagtga tggaaagatg aaaagcactt 300
tgaaaagaga gtgaaaaagt acgtgaaatt gttgaaaggg aagggcttgc aagcagacac 360
ttaactgggc cagcatcggg gcggcgggaa acaaaaccac cggggaatgt acctttcgag 420
gattataacc ccggtcctta ctccctcacc atcccgaggc ctgcaatcta aggatgctgg 480
cgtaatggtt gcaagtcgc 499
<210> 26
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物 NL1
<400> 26
gcatatcaat aagcggagga aaag 24
<210> 27
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物 NL4
<400> 27
ggtccgtgtt tcaagacgg 19
<210> 28
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物 LR0R
<400> 28
acccgctgaa cttaagc 17
<210> 29
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物 LR5
<400> 29
tcctgaggga aacttcg 17
<210> 30
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物 LS266
<400> 30
gcattcccaa acaactcgac tc 22
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 V9G
<400> 31
ttacgtccct gccctttgta 20
<210> 32
<211> 760
<212> DNA
<213> 人工序列
<220>
<223> 来自PCR扩增的D1/D2 域序列
<400> 32
gattgcctca gtaacggcga gtgaagcggc aaaagctcaa atttgaaatc ccccgggaat 60
tgtaatttga agagatttgg gtccggccgg cgggggttaa gtccactgga aagtggcgcc 120
acagagggtg acagccccgt gaaccccttt aaagccttca tcccagatct ccaagagtcg 180
agttgtttgg gaatgcagct ctaagtgggt ggtaaattcc atctaaagct aaataccggc 240
gagagaccga tagcgaacaa gtacagtgat ggaaagatga aaagcacttt gaaaagagag 300
tgaaaaagta cgtgaaattg ttgaaaggga agggcttgca agcagacact taactgggcc 360
agcatcgggg cggcgggaaa caaaaccacc ggggaatgta cctttcgagg attataaccc 420
cggtctctat ttccatgctg ccccgaggcc tgcaatctaa ggatgctggc gtaatggttg 480
caagtcgccc gtcttgaaac acggaccaag gagtctaaca atcatgcaag tgtttgggcc 540
caaaacccat acgcgcaatg aaagtaaccg gagcgaacct tctggtgcag ctccagccac 600
accgagaccc aaatcccggt gtgagcaagc atggctgttg ggacccgaaa gatggtgaac 660
tatacctgga tagggtgaag ccagaggaaa ctctggtgga ggctcgtagc ggttctgacg 720
tgcaaatcga tcgtcgaatc tgggtatagg ggcgaaagac 760
<210> 33
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 来自PCR扩增的 ITS 序列
<400> 33
cttagtgagg cctctggatt gaatctaggg ccggggcgac ccggccgtgg gttgagaaac 60
tggtcaaact tggtcattta gaggaagtaa aagtcgtaac aaggtttccg taggtgaacc 120
tgcggaagga tcattaaaaa tattattaca cacttttagg aaaaacctct gaaccttttt 180
tttcatatac acttttaaaa aactttcaac aacggatctc ttggttctcg catcgatgaa 240
gaacgcagcg aattgcgata cgtaatatga cttgcagacg tgaatcattg aatctttgaa 300
cgcacattgc gccccggggt attccccagg gcatgcgtgg gtgagcgata tttactctca 360
aacctccggt ttggtcctgc ttcggcctaa tatcaacggc gctagaataa gttttagccc 420
cattcttttt cctcaccctc gtaagactac ccgctgaact taagcatatc aataagcgga 480
ggaaaagaaa ccaacaggga ttgcctcagt aacggcgagt gaagcggcaa aagctcaaat 540
ttgaaatccc ccgggaattg taatttgaag agatttgggt ccggccggcg ggggttaagt 600
ccactggaaa gtggcgccac agagggtgac agccccgtga 640
<210> 34
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物 ITS1
<400> 34
tccgtaggtg aacctgcgg 19
<210> 35
<211> 360
<212> PRT
<213> Metschnikowia
<220>
<223> 来自H0梅奇酵母(Metschnikowia)种的 Act1 蛋白
<400> 35
Met Cys Lys Ala Gly Phe Ala Gly Asp Asp Ala Pro Arg Ala Val Phe
1 5 10 15
Pro Ser Ile Val Gly Arg Pro Arg His Gln Gly Ile Met Val Gly Met
20 25 30
Gly Gln Lys Asp Ser Tyr Val Gly Asp Glu Ala Gln Ser Lys Arg Gly
35 40 45
Ile Leu Thr Leu Arg Tyr Pro Ile Glu His Gly Ile Val Asn Asn Trp
50 55 60
Asp Asp Met Glu Lys Ile Trp His His Thr Phe Tyr Asn Glu Leu Arg
65 70 75 80
Val Ala Pro Glu Glu His Pro Val Leu Leu Thr Glu Ala Pro Met Asn
85 90 95
Pro Lys Ser Asn Arg Glu Lys Met Thr Gln Ile Met Phe Glu Thr Phe
100 105 110
Asn Val Pro Ala Phe Tyr Val Ser Ile Gln Ala Val Leu Ser Leu Tyr
115 120 125
Ser Ser Gly Arg Thr Thr Gly Ile Val Leu Asp Ser Gly Asp Gly Val
130 135 140
Thr His Leu Val Pro Ile Tyr Ala Gly Phe Ser Met Pro His Gly Ile
145 150 155 160
Leu Arg Leu Asn Leu Ala Gly Arg Asp Leu Thr Asp Tyr Leu Met Lys
165 170 175
Ile Leu Ser Glu Arg Gly Tyr Thr Phe Ser Thr Thr Ala Glu Arg Glu
180 185 190
Ile Val Arg Asp Ile Lys Glu Lys Leu Cys Tyr Val Ala Leu Asp Phe
195 200 205
Glu Gln Glu Met Gln Thr Ser Ser Gln Ser Ser Ala Ile Glu Lys Ser
210 215 220
Tyr Glu Leu Pro Asp Gly Gln Val Ile Thr Ile Gly Asn Glu Arg Phe
225 230 235 240
Arg Ala Ala Glu Ala Leu Phe Arg Pro Thr Asp Leu Gly Leu Glu Ala
245 250 255
Val Gly Ile Asp Gln Thr Thr Tyr Asn Ser Ile Ile Lys Cys Asp Val
260 265 270
Asp Val Arg Lys Glu Leu Tyr Gly Asn Ile Val Met Ser Gly Gly Thr
275 280 285
Thr Leu Phe Pro Gly Ile Ala Glu Arg Met Gln Lys Glu Ile Thr Ala
290 295 300
Leu Ala Pro Ser Ser Met Lys Val Lys Ile Ile Ala Pro Pro Glu Arg
305 310 315 320
Lys Tyr Ser Val Trp Ile Gly Gly Ser Ile Leu Ala Ser Leu Ser Thr
325 330 335
Phe Gln Gln Met Trp Ile Ser Lys Gln Glu Tyr Asp Glu Ser Gly Pro
340 345 350
Thr Ile Val His His Lys Cys Phe
355 360
<210> 36
<211> 491
<212> PRT
<213> Metschnikowia
<220>
<223> 来自H0梅奇酵母(Metschnikowia)种的 Aro8 蛋白
<400> 36
Met Thr Lys Pro Leu Ala Lys Asp Leu Gln His His Leu Ser Thr Glu
1 5 10 15
Ala Lys Ser Arg Lys Gly Ser Ala Leu Lys Gly Ala Phe Lys Tyr Tyr
20 25 30
Asn Gln Pro Gly Met Thr Phe Leu Gly Gly Gly Leu Pro Leu Ser Asp
35 40 45
Tyr Phe Pro Phe Asp Lys Ile Thr Ala Asp Val Pro Ser Ala Pro Phe
50 55 60
Pro Asn Gly Cys Gly Ala Arg Val Thr Glu Ser Asp Lys Thr Val Ile
65 70 75 80
Glu Val His Lys Arg Lys Gln Asp Asn Ser Asp Ser Gly Tyr Ala Asp
85 90 95
Val Glu Leu Ala Arg Ser Leu Gln Tyr Gly Tyr Thr Glu Gly His Thr
100 105 110
Glu Leu Val Gln Phe Leu Arg Asp His Thr Asp Thr Ile His Arg Val
115 120 125
Pro Tyr Glu Asp Trp Asp Val Ile Thr Asn Val Gly Asn Thr Gln Ala
130 135 140
Trp Asp Ala Val Leu Arg Thr Phe Thr Ser Arg Gly Asp Val Ile Leu
145 150 155 160
Val Glu Asp His Thr Phe Ser Ser Ala Met Glu Thr Ala His Ala His
165 170 175
Gly Val Thr Thr Tyr Pro Val Val Met Asp Thr Glu Gly Ile Val Pro
180 185 190
Ser Ala Leu Glu Lys Leu Leu Asp Asn Trp Val Gly Ala Lys Pro Arg
195 200 205
Met Leu Tyr Thr Ile Cys Thr Gly Gln Asn Pro Thr Gly Ser Cys Leu
210 215 220
Ser Gly Glu Arg Arg Arg Glu Val Tyr Ser Leu Ala Gln Lys His Asp
225 230 235 240
Leu Ile Ile Ile Glu Asp Glu Pro Tyr Tyr Phe Leu Gln Met Glu Pro
245 250 255
Tyr Thr Arg Asp Leu Ala Leu Arg Ser Ser Lys His Val His Gly His
260 265 270
Glu Glu Phe Ile Lys Ala Leu Val Pro Ser Phe Ile Ser Met Asp Val
275 280 285
Asp Gly Arg Val Leu Arg Leu Asp Ser Val Ser Lys Thr Ile Ala Pro
290 295 300
Gly Ala Arg Leu Gly Trp Val Val Gly Gln Lys Arg Leu Leu Glu Arg
305 310 315 320
Phe Leu Arg Leu His Glu Thr Ser Ile Gln Asn Ala Ser Gly Phe Thr
325 330 335
Gln Ser Leu Leu Asn Gly Leu Phe Gln Arg Trp Gly Gln Lys Gly Tyr
340 345 350
Leu Asp Trp Leu Ile Gly Ile Arg Ala Glu Tyr Thr His Lys Arg Asp
355 360 365
Val Ala Ile Asp Ala Leu Tyr Lys Tyr Phe Pro Gln Glu Val Val Thr
370 375 380
Ile Leu Pro Pro Val Ala Gly Met Phe Phe Val Val Asn Leu Asp Ala
385 390 395 400
Ser Lys His Pro Lys Phe Glu Glu Leu Gly Ser Asp Pro Leu Ala Val
405 410 415
Glu Asn Ser Leu Tyr Glu Ala Gly Leu Ala His Gly Cys Leu Met Ile
420 425 430
Pro Gly Ser Trp Phe Lys Ala Asp Gly Glu Thr Thr Pro Pro Gln Ala
435 440 445
Pro Val Pro Val Asp Glu Ser Leu Lys Asn Ser Ile Phe Phe Arg Gly
450 455 460
Thr Tyr Ala Ala Val Pro Leu Asp Glu Leu Glu Val Gly Leu Lys Lys
465 470 475 480
Phe Gly Glu Ala Val Lys Ala Glu Phe Gly Leu
485 490
<210> 37
<211> 615
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种 的 Aro10 蛋白
<400> 37
Met Ala Pro Ile Ile Thr Arg Ala Ser Ser Glu Glu Thr Thr Pro Gln
1 5 10 15
Ile Thr Asp Asp Gln Ile Pro Leu Gly Glu Tyr Leu Phe Leu Arg Ile
20 25 30
Cys Gln Ala Asn Pro Lys Leu Arg Ser Val Phe Gly Ile Pro Gly Asp
35 40 45
Phe Ser Leu Ala Leu Leu Glu His Leu Tyr Thr Lys Ser Val Ala Lys
50 55 60
Lys Val Glu Phe Val Gly Phe Cys Asn Glu Leu Asn Ala Ala Tyr Ala
65 70 75 80
Ala Asp Gly Tyr Ala Lys His Ile Asp Gly Leu Ser Val Leu Leu Thr
85 90 95
Thr Phe Gly Val Gly Glu Leu Ser Thr Leu Asn Ala Ile Ala Gly Ala
100 105 110
Phe Thr Glu Tyr Ala Pro Val Leu His Ile Val Gly Thr Thr Ser Thr
115 120 125
Lys Gln Ala Glu Gln Ser Arg Ala Ala Gly Thr Arg Asp Val Arg Asn
130 135 140
Ile His His Leu Val Gln Asn Lys Asn Pro Leu Cys Ala Pro Asn His
145 150 155 160
Asp Val Tyr Lys Pro Met Val Glu Ser Leu Ser Val Cys Gln Glu Ser
165 170 175
Leu Asp Met Asn Gly Asp Leu Asn Leu Glu Lys Ile Asp Asn Val Leu
180 185 190
Arg Met Val Thr Asn Glu Arg Arg Pro Gly Tyr Ile Phe Ile Pro Ser
195 200 205
Asp Val Ser Asp Ile Met Val Ser Ala Gly Arg Leu Asn Gln Pro Leu
210 215 220
Thr Phe Ser Glu Leu Thr Asp Glu Ser Ala Leu Lys Asn Met Ala Ser
225 230 235 240
Arg Ile Leu Ala Lys Leu Tyr Asn Ser Lys His Pro Ser Val Leu Gly
245 250 255
Asp Ala Leu Ala Asp Arg Phe Gly Gly Gln Thr Ala Leu Asp Asn Leu
260 265 270
Val Glu Lys Leu Pro Ser Asn Phe Val Lys Leu Phe Ser Thr Leu Leu
275 280 285
Ala Arg Asn Ile Asp Glu Thr Leu Pro Asn Tyr Ile Gly Val Tyr Ser
290 295 300
Gly Lys Leu Ser Ser Asp Lys Ile Val Ile Asp Glu Leu Glu Arg Asn
305 310 315 320
Thr Asp Phe Leu Leu Thr Leu Gly His Ala Asn Asn Glu Ile Asn Ser
325 330 335
Gly Val Tyr Ser Thr Asp Phe Ser Ala Ile Thr Glu Tyr Val Glu Val
340 345 350
His Pro Asp Tyr Ile Leu Ile Asp Gly Glu Tyr Val Leu Ile Lys Asn
355 360 365
Ala Glu Thr Gly Lys Arg Leu Phe Ser Ile Val Asp Leu Leu Thr Lys
370 375 380
Leu Val Ser Asp Phe Asp Ala Ser Lys Met Ile His Asn Asn His Ala
385 390 395 400
Val Asn Asn Ile Arg Ala Arg Arg Glu Thr Lys Gln Phe Ser Ser Leu
405 410 415
Asp Thr Val Ser Pro Gly Val Ile Thr Gln Asn Lys Leu Val Asp Phe
420 425 430
Phe Asn Asp Tyr Leu Arg Pro Asn Asp Ile Leu Leu Cys Asp Thr Cys
435 440 445
Ser Phe Leu Phe Gly Val Phe Glu Leu Lys Phe Pro Arg Gly Val Lys
450 455 460
Phe Ile Ala Gln Thr Leu Tyr Glu Ser Ile Gly Tyr Ala Leu Pro Ala
465 470 475 480
Thr Phe Gly Ala Ala Arg Ala Glu Arg Asp Leu Gly Thr Asn Arg Arg
485 490 495
Val Val Leu Ile Gln Gly Asp Gly Ser Ala Gln Met Thr Ile Gln Glu
500 505 510
Trp Ser Thr Tyr Leu Arg Tyr Asp Ile Ser Ser Pro Glu Ile Phe Leu
515 520 525
Leu Asn Asn Glu Gly Tyr Thr Val Glu Arg Met Ile Lys Gly Pro Thr
530 535 540
Arg Ser Tyr Asn Asp Ile Gln Asp Thr Trp Lys Trp Thr Glu Phe Phe
545 550 555 560
Lys Ile Phe Gly Asp Glu Asp Cys Glu Lys His Glu Ala Glu Lys Val
565 570 575
Asn Thr Thr Asn Glu Leu Glu Ala Leu Thr Arg Arg Lys Thr Ser Glu
580 585 590
Lys Ile Arg Leu Tyr Glu Leu Lys Leu Ser Lys Leu Asp Ile Val Asp
595 600 605
Lys Phe Arg Ile Leu Arg Glu
610 615
<210> 38
<211> 370
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Gpd1 蛋白
<400> 38
Met Thr Ala Thr Ala Pro Phe Lys Ile Glu Ser Pro Phe Arg Ile Ala
1 5 10 15
Ile Ile Gly Ser Gly Asn Trp Gly Thr Ala Val Ala Lys Leu Val Ala
20 25 30
Glu Asn Thr Ala Glu Lys Pro Glu Ile Phe Gln Lys Gln Val Asn Met
35 40 45
Trp Val Phe Glu Glu Asp Ile Asn Gly Arg Lys Leu Thr Glu Ile Ile
50 55 60
Asn Thr Asp His Glu Asn Val Lys Tyr Met Pro Glu Val Lys Leu Pro
65 70 75 80
Glu Asn Leu Val Ala Asn Pro Asp Ile Glu Ala Thr Val Lys Asp Ala
85 90 95
Asp Leu Leu Ile Phe Asn Ile Pro His Gln Phe Leu Pro Arg Val Cys
100 105 110
Lys Gln Leu Val Gly Lys Val Ser Pro Thr Ala Arg Ala Ile Ser Cys
115 120 125
Leu Lys Gly Leu Glu Val Asp Ala Ser Gly Cys Lys Leu Leu Ser Gln
130 135 140
Ser Ile Thr Asp Thr Leu Gly Ile Tyr Cys Gly Val Leu Ser Gly Ala
145 150 155 160
Asn Ile Ala Asn Glu Val Ala Arg Gly Arg Trp Ser Glu Thr Ser Ile
165 170 175
Ala Tyr Asn Arg Pro Thr Asp Phe Arg Gly Glu Gly Lys Asp Ile Cys
180 185 190
Glu Phe Val Leu Lys Glu Ala Phe His Arg Arg Tyr Phe His Val Arg
195 200 205
Val Ile Lys Asp Val Ile Gly Ala Ser Ile Ala Gly Ala Leu Lys Asn
210 215 220
Val Val Ala Ile Ala Ala Gly Phe Val Glu Gly Glu Gly Trp Gly Asp
225 230 235 240
Asn Ala Lys Ser Ala Ile Met Arg Ile Gly Leu Lys Glu Thr Ile His
245 250 255
Phe Ala Ser Tyr Trp Glu Lys Phe Gly Ile Gln Gly Leu Ser Ala Pro
260 265 270
Glu Pro Thr Thr Phe Thr Glu Glu Ser Ala Gly Val Ala Asp Leu Ile
275 280 285
Thr Thr Cys Ser Gly Gly Arg Asn Val Lys Val Ala Arg Tyr Met Ile
290 295 300
Glu Lys Asn Val Asp Ala Trp Glu Ala Glu Lys Ala Leu Leu Asn Gly
305 310 315 320
Gln Ser Ser Gln Gly Ile Ile Thr Ala Lys Glu Val His Glu Leu Leu
325 330 335
Val Asn Tyr Lys Leu Gln Glu Glu Phe Pro Leu Phe Glu Ala Thr Tyr
340 345 350
Ala Val Ile Tyr Glu Asn Ala Asp Val Asn Thr Trp Pro Thr Ile Leu
355 360 365
Ala Glu
370
<210> 39
<211> 544
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Gxf1 蛋白
<400> 39
Met Ser Gln Asp Glu Leu His Thr Lys Ser Gly Val Glu Thr Pro Ile
1 5 10 15
Asn Asp Ser Leu Leu Glu Glu Lys His Asp Val Thr Pro Leu Ala Ala
20 25 30
Leu Pro Glu Lys Ser Phe Lys Asp Tyr Ile Ser Ile Ser Ile Phe Cys
35 40 45
Leu Phe Val Ala Phe Gly Gly Phe Val Phe Gly Phe Asp Thr Gly Thr
50 55 60
Ile Ser Gly Phe Val Asn Met Ser Asp Phe Lys Thr Arg Phe Gly Glu
65 70 75 80
Met Asn Ala Gln Gly Glu Tyr Tyr Leu Ser Asn Val Arg Thr Gly Leu
85 90 95
Met Val Ser Ile Phe Asn Val Gly Cys Ala Val Gly Gly Ile Phe Leu
100 105 110
Cys Lys Ile Ala Asp Val Tyr Gly Arg Arg Ile Gly Leu Met Phe Ser
115 120 125
Met Val Val Tyr Val Val Gly Ile Ile Ile Gln Ile Ala Ser Thr Thr
130 135 140
Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Leu Ile Ala Gly Leu Ala Val
145 150 155 160
Gly Thr Val Ser Val Ile Ser Pro Leu Phe Ile Ser Glu Val Ala Pro
165 170 175
Lys Gln Leu Arg Gly Thr Leu Val Cys Cys Phe Gln Leu Cys Ile Thr
180 185 190
Leu Gly Ile Phe Leu Gly Tyr Cys Thr Thr Tyr Gly Thr Lys Thr Tyr
195 200 205
Thr Asp Ser Arg Gln Trp Arg Ile Pro Leu Gly Ile Cys Phe Ala Trp
210 215 220
Ala Leu Phe Leu Val Ala Gly Met Leu Asn Met Pro Glu Ser Pro Arg
225 230 235 240
Tyr Leu Val Glu Lys Ser Arg Ile Asp Asp Ala Arg Lys Ser Ile Ala
245 250 255
Arg Ser Asn Lys Val Ser Glu Glu Asp Pro Ala Val Tyr Thr Glu Val
260 265 270
Gln Leu Ile Gln Ala Gly Ile Asp Arg Glu Ala Leu Ala Gly Ser Ala
275 280 285
Thr Trp Met Glu Leu Val Thr Gly Lys Pro Lys Ile Phe Arg Arg Val
290 295 300
Ile Met Gly Val Met Leu Gln Ser Leu Gln Gln Leu Thr Gly Asp Asn
305 310 315 320
Tyr Phe Phe Tyr Tyr Gly Thr Thr Ile Phe Lys Ala Val Gly Leu Gln
325 330 335
Asp Ser Phe Gln Thr Ser Ile Ile Leu Gly Ile Val Asn Phe Ala Ser
340 345 350
Thr Phe Val Gly Ile Tyr Ala Ile Glu Arg Met Gly Arg Arg Leu Cys
355 360 365
Leu Leu Thr Gly Ser Ala Cys Met Phe Val Cys Phe Ile Ile Tyr Ser
370 375 380
Leu Ile Gly Thr Gln His Leu Tyr Lys Asn Gly Phe Ser Asn Glu Pro
385 390 395 400
Ser Asn Thr Tyr Lys Pro Ser Gly Asn Ala Met Ile Phe Ile Thr Cys
405 410 415
Leu Tyr Ile Phe Phe Phe Ala Ser Thr Trp Ala Gly Gly Val Tyr Cys
420 425 430
Ile Val Ser Glu Ser Tyr Pro Leu Arg Ile Arg Ser Lys Ala Met Ser
435 440 445
Val Ala Thr Ala Ala Asn Trp Met Trp Gly Phe Leu Ile Ser Phe Phe
450 455 460
Thr Pro Phe Ile Thr Ser Ala Ile His Phe Tyr Tyr Gly Phe Val Phe
465 470 475 480
Thr Gly Cys Leu Ala Phe Ser Phe Phe Tyr Val Tyr Phe Phe Val Val
485 490 495
Glu Thr Lys Gly Leu Ser Leu Glu Glu Val Asp Ile Leu Tyr Ala Ser
500 505 510
Gly Thr Leu Pro Trp Lys Ser Ser Gly Trp Val Pro Pro Thr Ala Asp
515 520 525
Glu Met Ala His Asn Ala Phe Asp Asn Lys Pro Thr Asp Glu Gln Val
530 535 540
<210> 40
<211> 548
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Gxf2 蛋白
<400> 40
Met Ser Ala Glu Gln Glu Gln Gln Val Ser Gly Thr Ser Ala Thr Ile
1 5 10 15
Asp Gly Ser Ala Ser Leu Lys Gln Glu Lys Thr Ala Glu Glu Glu Asp
20 25 30
Ala Phe Lys Pro Lys Pro Ala Thr Ala Tyr Phe Phe Ile Ser Phe Leu
35 40 45
Cys Gly Leu Val Ala Phe Gly Gly Tyr Val Phe Gly Phe Asp Thr Gly
50 55 60
Thr Ile Ser Gly Phe Val Asn Met Asp Asp Tyr Leu Met Arg Phe Gly
65 70 75 80
Gln Gln His Ala Asp Gly Thr Tyr Tyr Leu Ser Asn Val Arg Thr Gly
85 90 95
Leu Ile Val Ser Ile Phe Asn Ile Gly Cys Ala Val Gly Gly Leu Ala
100 105 110
Leu Ser Lys Val Gly Asp Ile Trp Gly Arg Arg Ile Gly Ile Met Val
115 120 125
Ala Met Ile Ile Tyr Met Val Gly Ile Ile Ile Gln Ile Ala Ser Gln
130 135 140
Asp Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Leu Ile Thr Gly Leu Gly
145 150 155 160
Val Gly Thr Thr Ser Val Leu Ser Pro Leu Phe Ile Ser Glu Ser Ala
165 170 175
Pro Lys His Leu Arg Gly Thr Leu Val Cys Cys Phe Gln Leu Met Val
180 185 190
Thr Leu Gly Ile Phe Leu Gly Tyr Cys Thr Thr Tyr Gly Thr Lys Asn
195 200 205
Tyr Thr Asp Ser Arg Gln Trp Arg Ile Pro Leu Gly Leu Cys Phe Ala
210 215 220
Trp Ala Leu Leu Leu Ile Ser Gly Met Val Phe Met Pro Glu Ser Pro
225 230 235 240
Arg Phe Leu Ile Glu Arg Gln Arg Phe Asp Glu Ala Lys Ala Ser Val
245 250 255
Ala Lys Ser Asn Gln Val Ser Thr Glu Asp Pro Ala Val Tyr Thr Glu
260 265 270
Val Glu Leu Ile Gln Ala Gly Ile Asp Arg Glu Ala Leu Ala Gly Ser
275 280 285
Ala Gly Trp Lys Glu Leu Ile Thr Gly Lys Pro Lys Met Leu Gln Arg
290 295 300
Val Ile Leu Gly Met Met Leu Gln Ser Ile Gln Gln Leu Thr Gly Asn
305 310 315 320
Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Ile Phe Lys Ala Val Gly Met
325 330 335
Ser Asp Ser Phe Gln Thr Ser Ile Val Leu Gly Ile Val Asn Phe Ala
340 345 350
Ser Thr Phe Val Gly Ile Trp Ala Ile Glu Arg Met Gly Arg Arg Ser
355 360 365
Cys Leu Leu Val Gly Ser Ala Cys Met Ser Val Cys Phe Leu Ile Tyr
370 375 380
Ser Ile Leu Gly Ser Val Asn Leu Tyr Ile Asp Gly Tyr Glu Asn Thr
385 390 395 400
Pro Ser Asn Thr Arg Lys Pro Thr Gly Asn Ala Met Ile Phe Ile Thr
405 410 415
Cys Leu Phe Ile Phe Phe Phe Ala Ser Thr Trp Ala Gly Gly Val Tyr
420 425 430
Ser Ile Val Ser Glu Thr Tyr Pro Leu Arg Ile Arg Ser Lys Gly Met
435 440 445
Ala Val Ala Thr Ala Ala Asn Trp Met Trp Gly Phe Leu Ile Ser Phe
450 455 460
Phe Thr Pro Phe Ile Thr Ser Ala Ile His Phe Tyr Tyr Gly Phe Val
465 470 475 480
Phe Thr Gly Cys Leu Ile Phe Ser Phe Phe Tyr Val Phe Phe Phe Val
485 490 495
Arg Glu Thr Lys Gly Leu Ser Leu Glu Glu Val Asp Glu Leu Tyr Ala
500 505 510
Thr Asp Leu Pro Pro Trp Lys Thr Ala Gly Trp Thr Pro Pro Ser Ala
515 520 525
Glu Asp Met Ala His Thr Thr Gly Phe Ala Glu Ala Ala Lys Pro Thr
530 535 540
Asn Lys His Val
545
<210> 41
<211> 526
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Gxs1 蛋白
<400> 41
Met Gly Leu Glu Ser Asn Lys Leu Ile Arg Lys Tyr Ile Asn Val Gly
1 5 10 15
Glu Lys Arg Ala Gly Ser Ser Gly Met Gly Ile Phe Val Gly Val Phe
20 25 30
Ala Ala Leu Gly Gly Val Leu Phe Gly Tyr Asp Thr Gly Thr Ile Ser
35 40 45
Gly Val Met Ala Met Pro Trp Val Lys Glu His Phe Pro Lys Asp Arg
50 55 60
Val Ala Phe Ser Ala Ser Glu Ser Ser Leu Ile Val Ser Ile Leu Ser
65 70 75 80
Ala Gly Thr Phe Phe Gly Ala Ile Leu Ala Pro Leu Leu Thr Asp Thr
85 90 95
Leu Gly Arg Arg Trp Cys Ile Ile Ile Ser Ser Leu Val Val Phe Asn
100 105 110
Leu Gly Ala Ala Leu Gln Thr Ala Ala Thr Asp Ile Pro Leu Leu Ile
115 120 125
Val Gly Arg Val Ile Ala Gly Leu Gly Val Gly Leu Ile Ser Ser Thr
130 135 140
Ile Pro Leu Tyr Gln Ser Glu Ala Leu Pro Lys Trp Ile Arg Gly Ala
145 150 155 160
Val Val Ser Cys Tyr Gln Trp Ala Ile Thr Ile Gly Ile Phe Leu Ala
165 170 175
Ala Val Ile Asn Gln Gly Thr His Lys Ile Asn Ser Pro Ala Ser Tyr
180 185 190
Arg Ile Pro Leu Gly Ile Gln Met Ala Trp Gly Leu Ile Leu Gly Val
195 200 205
Gly Met Phe Phe Leu Pro Glu Thr Pro Arg Phe Tyr Ile Ser Lys Gly
210 215 220
Gln Asn Ala Lys Ala Ala Val Ser Leu Ala Arg Leu Arg Lys Leu Pro
225 230 235 240
Gln Asp His Pro Glu Leu Leu Glu Glu Leu Glu Asp Ile Gln Ala Ala
245 250 255
Tyr Glu Phe Glu Thr Val His Gly Lys Ser Ser Trp Ser Gln Val Phe
260 265 270
Thr Asn Lys Asn Lys Gln Leu Lys Lys Leu Ala Thr Gly Val Cys Leu
275 280 285
Gln Ala Phe Gln Gln Leu Thr Gly Val Asn Phe Ile Phe Tyr Phe Gly
290 295 300
Thr Thr Phe Phe Asn Ser Val Gly Leu Asp Gly Phe Thr Thr Ser Leu
305 310 315 320
Ala Thr Asn Ile Val Asn Val Gly Ser Thr Ile Pro Gly Ile Leu Gly
325 330 335
Val Glu Ile Phe Gly Arg Arg Lys Val Leu Leu Thr Gly Ala Ala Gly
340 345 350
Met Cys Leu Ser Gln Phe Ile Val Ala Ile Val Gly Val Ala Thr Asp
355 360 365
Ser Lys Ala Ala Asn Gln Val Leu Ile Ala Phe Cys Cys Ile Phe Ile
370 375 380
Ala Phe Phe Ala Ala Thr Trp Gly Pro Thr Ala Trp Val Val Cys Gly
385 390 395 400
Glu Ile Phe Pro Leu Arg Thr Arg Ala Lys Ser Ile Ala Met Cys Ala
405 410 415
Ala Ser Asn Trp Leu Leu Asn Trp Ala Ile Ala Tyr Ala Thr Pro Tyr
420 425 430
Leu Val Asp Ser Asp Lys Gly Asn Leu Gly Thr Asn Val Phe Phe Ile
435 440 445
Trp Gly Ser Cys Asn Phe Phe Cys Leu Val Phe Ala Tyr Phe Met Ile
450 455 460
Tyr Glu Thr Lys Gly Leu Ser Leu Glu Gln Val Asp Glu Leu Tyr Glu
465 470 475 480
Lys Val Ala Ser Ala Arg Lys Ser Pro Gly Phe Val Pro Ser Glu His
485 490 495
Ala Phe Arg Glu His Ala Asp Val Glu Thr Ala Met Pro Asp Asn Phe
500 505 510
Asn Leu Lys Ala Glu Ala Ile Ser Val Glu Asp Ala Ser Val
515 520 525
<210> 42
<211> 628
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Hgt19 蛋白
<400> 42
Met Ser Glu Lys Pro Val Val Ser His Ser Ile Asp Thr Thr Ser Ser
1 5 10 15
Thr Ser Ser Lys Gln Val Tyr Asp Gly Asn Ser Leu Leu Lys Thr Ser
20 25 30
Asn Glu Arg Asp Gly Glu Arg Gly Asn Ile Leu Ser Gln Tyr Thr Glu
35 40 45
Glu Gln Ala Met Gln Met Gly Arg Asn Tyr Ala Leu Lys His Asn Leu
50 55 60
Asp Ala Thr Leu Phe Gly Lys Ala Ala Ala Val Ala Arg Asn Pro Tyr
65 70 75 80
Glu Phe Asn Ser Met Ser Phe Leu Thr Glu Glu Glu Lys Val Ala Leu
85 90 95
Asn Thr Glu Gln Thr Lys Lys Trp His Ile Pro Arg Lys Leu Val Glu
100 105 110
Val Ile Ala Leu Gly Ser Met Ala Ala Ala Val Gln Gly Met Asp Glu
115 120 125
Ser Val Val Asn Gly Ala Thr Leu Phe Tyr Pro Thr Ala Met Gly Ile
130 135 140
Thr Asp Ile Lys Asn Ala Asp Leu Ile Glu Gly Leu Ile Asn Gly Ala
145 150 155 160
Pro Tyr Leu Cys Cys Ala Ile Met Cys Trp Thr Ser Asp Tyr Trp Asn
165 170 175
Arg Lys Leu Gly Arg Lys Trp Thr Ile Phe Trp Thr Cys Ala Ile Ser
180 185 190
Ala Ile Thr Cys Ile Trp Gln Gly Leu Val Asn Leu Lys Trp Tyr His
195 200 205
Leu Phe Ile Ala Arg Phe Cys Leu Gly Phe Gly Ile Gly Val Lys Ser
210 215 220
Ala Thr Val Pro Ala Tyr Ala Ala Glu Thr Thr Pro Ala Lys Ile Arg
225 230 235 240
Gly Ser Leu Val Met Leu Trp Gln Phe Phe Thr Ala Val Gly Ile Met
245 250 255
Leu Gly Tyr Val Ala Ser Leu Ala Phe Tyr Tyr Ile Gly Asp Asn Gly
260 265 270
Ile Ser Gly Gly Leu Asn Trp Arg Leu Met Leu Gly Ser Ala Cys Leu
275 280 285
Pro Ala Ile Val Val Leu Val Gln Val Pro Phe Val Pro Glu Ser Pro
290 295 300
Arg Trp Leu Met Gly Lys Glu Arg His Ala Glu Ala Tyr Asp Ser Leu
305 310 315 320
Arg Gln Leu Arg Phe Ser Glu Ile Glu Ala Ala Arg Asp Cys Phe Tyr
325 330 335
Gln Tyr Val Leu Leu Lys Glu Glu Gly Ser Tyr Gly Thr Gln Pro Phe
340 345 350
Phe Ser Arg Ile Lys Glu Met Phe Thr Val Arg Arg Asn Arg Asn Gly
355 360 365
Ala Leu Gly Ala Trp Ile Val Met Phe Met Gln Gln Phe Cys Gly Ile
370 375 380
Asn Val Ile Ala Tyr Tyr Ser Ser Ser Ile Phe Val Glu Ser Asn Leu
385 390 395 400
Ser Glu Ile Lys Ala Met Leu Ala Ser Trp Gly Phe Gly Met Ile Asn
405 410 415
Phe Leu Phe Ala Ile Pro Ala Phe Tyr Thr Ile Asp Thr Phe Gly Arg
420 425 430
Arg Asn Leu Leu Leu Thr Thr Phe Pro Leu Met Ala Val Phe Leu Leu
435 440 445
Met Ala Gly Phe Gly Phe Trp Ile Pro Phe Glu Thr Asn Pro His Gly
450 455 460
Arg Leu Ala Val Ile Thr Ile Gly Ile Tyr Leu Phe Ala Cys Val Tyr
465 470 475 480
Ser Ala Gly Glu Gly Pro Val Pro Phe Thr Tyr Ser Ala Glu Ala Phe
485 490 495
Pro Leu Tyr Ile Arg Asp Leu Gly Met Gly Phe Ala Thr Ala Thr Cys
500 505 510
Trp Phe Phe Asn Phe Ile Leu Ala Phe Ser Trp Pro Arg Met Lys Asn
515 520 525
Ala Phe Lys Pro Gln Gly Ala Phe Gly Trp Tyr Ala Ala Trp Asn Ile
530 535 540
Val Gly Phe Phe Leu Val Leu Trp Phe Leu Pro Glu Thr Lys Gly Leu
545 550 555 560
Thr Leu Glu Glu Leu Asp Glu Val Phe Asp Val Pro Leu Arg Lys His
565 570 575
Ala His Tyr Arg Thr Lys Glu Leu Val Tyr Asn Leu Arg Lys Tyr Phe
580 585 590
Leu Arg Gln Asn Pro Lys Pro Leu Pro Pro Leu Tyr Ala His Gln Arg
595 600 605
Met Ala Val Thr Asn Pro Glu Trp Leu Glu Lys Thr Glu Val Thr His
610 615 620
Glu Glu Asn Ile
625
<210> 43
<211> 524
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Hxt2.6 蛋白
<400> 43
Met Ser Ser Thr Thr Asp Thr Leu Glu Lys Arg Asp Thr Glu Pro Phe
1 5 10 15
Thr Ser Asp Ala Pro Val Thr Val His Asp Tyr Ile Ala Glu Glu Arg
20 25 30
Pro Trp Trp Lys Val Pro His Leu Arg Val Leu Thr Trp Ser Val Phe
35 40 45
Val Ile Thr Leu Thr Ser Thr Asn Asn Gly Tyr Asp Gly Ser Met Leu
50 55 60
Asn Gly Leu Gln Ser Leu Asp Ile Trp Gln Glu Asp Leu Gly His Pro
65 70 75 80
Ala Gly Gln Lys Leu Gly Ala Leu Ala Asn Gly Val Leu Phe Gly Asn
85 90 95
Leu Ala Ala Val Pro Phe Ala Ser Tyr Phe Cys Asp Arg Phe Gly Arg
100 105 110
Arg Pro Val Ile Cys Phe Gly Gln Ile Leu Thr Ile Val Gly Ala Val
115 120 125
Leu Gln Gly Leu Ser Asn Ser Tyr Gly Phe Phe Leu Gly Ser Arg Ile
130 135 140
Val Leu Gly Phe Gly Ala Met Ile Ala Thr Ile Pro Ser Pro Thr Leu
145 150 155 160
Ile Ser Glu Ile Ala Tyr Pro Thr His Arg Glu Thr Ser Thr Phe Ala
165 170 175
Tyr Asn Val Cys Trp Tyr Leu Gly Ala Ile Ile Ala Ser Trp Val Thr
180 185 190
Tyr Gly Thr Arg Asp Leu Gln Ser Lys Ala Cys Trp Ser Ile Pro Ser
195 200 205
Tyr Leu Gln Ala Ala Leu Pro Phe Phe Gln Val Cys Met Ile Trp Phe
210 215 220
Val Pro Glu Ser Pro Arg Phe Leu Val Ala Lys Gly Lys Ile Asp Gln
225 230 235 240
Ala Arg Ala Val Leu Ser Lys Tyr His Thr Gly Asp Ser Thr Asp Pro
245 250 255
Arg Asp Val Ala Leu Val Asp Phe Glu Leu His Glu Ile Glu Ser Ala
260 265 270
Leu Glu Gln Glu Lys Leu Asn Thr Arg Ser Ser Tyr Phe Asp Phe Phe
275 280 285
Lys Lys Arg Asn Phe Arg Lys Arg Gly Phe Leu Cys Val Met Val Gly
290 295 300
Val Ala Met Gln Leu Ser Gly Asn Gly Leu Val Ser Tyr Tyr Leu Ser
305 310 315 320
Lys Val Leu Asp Ser Ile Gly Ile Thr Glu Thr Lys Arg Gln Leu Glu
325 330 335
Ile Asn Gly Cys Leu Met Ile Tyr Asn Phe Val Ile Cys Val Ser Leu
340 345 350
Met Ser Val Cys Arg Met Phe Lys Arg Arg Val Leu Phe Leu Thr Cys
355 360 365
Phe Ser Gly Met Thr Val Cys Tyr Thr Ile Trp Thr Ile Leu Ser Ala
370 375 380
Leu Asn Glu Gln Arg His Phe Glu Asp Lys Gly Leu Ala Asn Gly Val
385 390 395 400
Leu Ala Met Ile Phe Phe Tyr Tyr Phe Phe Tyr Asn Val Gly Ile Asn
405 410 415
Gly Leu Pro Phe Leu Tyr Ile Thr Glu Ile Leu Pro Tyr Ser His Arg
420 425 430
Ala Lys Gly Leu Asn Leu Phe Gln Phe Ser Gln Phe Leu Thr Gln Ile
435 440 445
Tyr Asn Gly Tyr Val Asn Pro Ile Ala Met Asp Ala Ile Ser Trp Lys
450 455 460
Tyr Tyr Ile Val Tyr Cys Cys Ile Leu Phe Val Glu Leu Val Ile Val
465 470 475 480
Phe Phe Thr Phe Pro Glu Thr Ser Gly Tyr Thr Leu Glu Glu Val Ala
485 490 495
Gln Val Phe Gly Asp Glu Ala Pro Gly Leu His Asn Arg Gln Leu Asp
500 505 510
Val Ala Lys Glu Ser Leu Glu His Val Glu His Val
515 520
<210> 44
<211> 548
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Hxt5 蛋白
<400> 44
Met Ser Ile Phe Glu Gly Lys Asp Gly Lys Gly Val Ser Ser Thr Glu
1 5 10 15
Ser Leu Ser Asn Asp Val Arg Tyr Asp Asn Met Glu Lys Val Asp Gln
20 25 30
Asp Val Leu Arg His Asn Phe Asn Phe Asp Lys Glu Phe Glu Glu Leu
35 40 45
Glu Ile Glu Ala Ala Gln Val Asn Asp Lys Pro Ser Phe Val Asp Arg
50 55 60
Ile Leu Ser Leu Glu Tyr Lys Leu His Phe Glu Asn Lys Asn His Met
65 70 75 80
Val Trp Leu Leu Gly Ala Phe Ala Ala Ala Ala Gly Leu Leu Ser Gly
85 90 95
Leu Asp Gln Ser Ile Ile Ser Gly Ala Ser Ile Gly Met Asn Lys Ala
100 105 110
Leu Asn Leu Thr Glu Arg Glu Ala Ser Leu Val Ser Ser Leu Met Pro
115 120 125
Leu Gly Ala Met Ala Gly Ser Met Ile Met Thr Pro Leu Asn Glu Trp
130 135 140
Phe Gly Arg Lys Ser Ser Leu Ile Ile Ser Cys Ile Trp Tyr Thr Ile
145 150 155 160
Gly Ser Ala Leu Cys Ala Gly Ala Arg Asp His His Met Met Tyr Ala
165 170 175
Gly Arg Phe Ile Leu Gly Val Gly Val Gly Ile Glu Gly Gly Cys Val
180 185 190
Gly Ile Tyr Ile Ser Glu Ser Val Pro Ala Asn Val Arg Gly Ser Ile
195 200 205
Val Ser Met Tyr Gln Phe Asn Ile Ala Leu Gly Glu Val Leu Gly Tyr
210 215 220
Ala Val Ala Ala Ile Phe Tyr Thr Val His Gly Gly Trp Arg Phe Met
225 230 235 240
Val Gly Ser Ser Leu Val Phe Ser Thr Ile Leu Phe Ala Gly Leu Phe
245 250 255
Phe Leu Pro Glu Ser Pro Arg Trp Leu Val His Lys Gly Arg Asn Gly
260 265 270
Met Ala Tyr Asp Val Trp Lys Arg Leu Arg Asp Ile Asn Asp Glu Ser
275 280 285
Ala Lys Leu Glu Phe Leu Glu Met Arg Gln Ala Ala Tyr Gln Glu Arg
290 295 300
Glu Arg Arg Ser Gln Glu Ser Leu Phe Ser Ser Trp Gly Glu Leu Phe
305 310 315 320
Thr Ile Ala Arg Asn Arg Arg Ala Leu Thr Tyr Ser Val Ile Met Ile
325 330 335
Thr Leu Gly Gln Leu Thr Gly Val Asn Ala Val Met Tyr Tyr Met Ser
340 345 350
Thr Leu Met Gly Ala Ile Gly Phe Asn Glu Lys Asp Ser Val Phe Met
355 360 365
Ser Leu Val Gly Gly Gly Ser Leu Leu Ile Gly Thr Ile Pro Ala Ile
370 375 380
Leu Trp Met Asp Arg Phe Gly Arg Arg Val Trp Gly Tyr Asn Leu Val
385 390 395 400
Gly Phe Phe Val Gly Leu Val Leu Val Gly Val Gly Tyr Arg Phe Asn
405 410 415
Pro Val Thr Gln Lys Ala Ala Ser Glu Gly Val Tyr Leu Thr Gly Leu
420 425 430
Ile Val Tyr Phe Leu Phe Phe Gly Ser Tyr Ser Thr Leu Thr Trp Val
435 440 445
Ile Pro Ser Glu Ser Phe Asp Leu Arg Thr Arg Ser Leu Gly Met Thr
450 455 460
Ile Cys Ser Thr Phe Leu Tyr Leu Trp Ser Phe Thr Val Thr Tyr Asn
465 470 475 480
Phe Thr Lys Met Ser Ala Ala Phe Thr Tyr Thr Gly Leu Thr Leu Gly
485 490 495
Phe Tyr Gly Gly Ile Ala Phe Leu Gly Leu Ile Tyr Gln Val Cys Phe
500 505 510
Met Pro Glu Thr Lys Asp Lys Thr Leu Glu Glu Ile Asp Asp Ile Phe
515 520 525
Asn Arg Ser Ala Phe Ser Ile Ala Arg Glu Asn Ile Ser Asn Leu Lys
530 535 540
Lys Gly Ile Trp
545
<210> 45
<211> 417
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Pgk1 蛋白
<400> 45
Met Ser Leu Ser Asn Lys Leu Ser Val Lys Asp Leu Asp Leu Ala Asn
1 5 10 15
Lys Arg Val Phe Ile Arg Val Asp Phe Asn Val Pro Leu Asp Gly Thr
20 25 30
Thr Ile Thr Asn Asn Gln Arg Ile Val Ala Ala Leu Pro Thr Ile Lys
35 40 45
Tyr Val Leu Glu Gln Lys Pro Lys Ala Val Ile Leu Ala Ser His Leu
50 55 60
Gly Arg Pro Asn Gly Glu Arg Val Glu Lys Tyr Ser Leu Ala Pro Val
65 70 75 80
Ala Lys Glu Leu Gln Ser Leu Leu Ser Asp Gln Lys Val Thr Phe Leu
85 90 95
Asn Asp Ser Val Gly Pro Glu Val Glu Lys Ala Val Asn Ser Ala Ser
100 105 110
Gln Gly Glu Val Phe Leu Leu Glu Asn Leu Arg Tyr His Ile Glu Glu
115 120 125
Glu Gly Ser Lys Lys Val Asp Gly Asn Lys Val Lys Ala Ser Lys Glu
130 135 140
Asp Val Glu Lys Phe Arg Gln Gly Leu Thr Ala Leu Ala Asp Val Tyr
145 150 155 160
Val Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met Val
165 170 175
Gly Leu Glu Leu Pro Gln Lys Ala Ala Gly Phe Leu Met Ala Lys Glu
180 185 190
Leu Glu Tyr Phe Ala Lys Ala Leu Glu Asn Pro Thr Arg Pro Phe Leu
195 200 205
Ala Ile Leu Gly Gly Ala Lys Val Ser Asp Lys Ile Gln Leu Ile Asp
210 215 220
Asn Leu Leu Asp Lys Val Asp Ile Leu Ile Val Gly Gly Gly Met Ala
225 230 235 240
Phe Thr Phe Lys Lys Val Leu Asp Asn Met Pro Ile Gly Thr Ser Leu
245 250 255
Phe Asp Glu Ala Gly Ser Lys Asn Val Glu Asn Leu Ile Ala Lys Ala
260 265 270
Lys Lys Asn Asn Val Glu Ile Val Leu Pro Val Asp Phe Val Thr Ala
275 280 285
Asp Asp Phe Asn Lys Asp Ala Asn Thr Gly Val Ala Thr Gln Glu Glu
290 295 300
Gly Ile Pro Asp Gly Trp Met Gly Leu Asp Ala Gly Pro Lys Ser Arg
305 310 315 320
Glu Leu Phe Ala Glu Ala Val Ala Lys Ala Lys Thr Ile Val Trp Asn
325 330 335
Gly Pro Pro Gly Val Phe Glu Phe Glu Lys Phe Ala Gln Gly Thr Lys
340 345 350
Ser Leu Leu Asp Ala Ala Val Lys Ser Ala Glu Ala Gly Asn Thr Val
355 360 365
Ile Ile Gly Gly Gly Asp Thr Ala Thr Val Ala Lys Lys Phe Gly Val
370 375 380
Val Glu Lys Leu Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu Glu
385 390 395 400
Leu Leu Glu Gly Lys Glu Leu Pro Gly Val Val Ala Ile Ser Asp Lys
405 410 415
Gln
<210> 46
<211> 563
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Qup2 蛋白
<400> 46
Met Gly Phe Arg Asn Leu Lys Arg Arg Leu Ser Asn Val Gly Asp Ser
1 5 10 15
Met Ser Val His Ser Val Lys Glu Glu Glu Asp Phe Ser Arg Val Glu
20 25 30
Ile Pro Asp Glu Ile Tyr Asn Tyr Lys Ile Val Leu Val Ala Leu Thr
35 40 45
Ala Ala Ser Ala Ala Ile Ile Ile Gly Tyr Asp Ala Gly Phe Ile Gly
50 55 60
Gly Thr Val Ser Leu Thr Ala Phe Lys Ser Glu Phe Gly Leu Asp Lys
65 70 75 80
Met Ser Ala Thr Ala Ala Ser Ala Ile Glu Ala Asn Val Val Ser Val
85 90 95
Phe Gln Ala Gly Ala Tyr Phe Gly Cys Leu Phe Phe Tyr Pro Ile Gly
100 105 110
Glu Ile Trp Gly Arg Lys Ile Gly Leu Leu Leu Ser Gly Phe Leu Leu
115 120 125
Thr Phe Gly Ala Ala Ile Ser Leu Ile Ser Asn Ser Ser Arg Gly Leu
130 135 140
Gly Ala Ile Tyr Ala Gly Arg Val Leu Thr Gly Leu Gly Ile Gly Gly
145 150 155 160
Cys Ser Ser Leu Ala Pro Ile Tyr Val Ser Glu Ile Ala Pro Ala Ala
165 170 175
Ile Arg Gly Lys Leu Val Gly Cys Trp Glu Val Ser Trp Gln Val Gly
180 185 190
Gly Ile Val Gly Tyr Trp Ile Asn Tyr Gly Val Leu Gln Thr Leu Pro
195 200 205
Ile Ser Ser Gln Gln Trp Ile Ile Pro Phe Ala Val Gln Leu Ile Pro
210 215 220
Ser Gly Leu Phe Trp Gly Leu Cys Leu Leu Ile Pro Glu Ser Pro Arg
225 230 235 240
Phe Leu Val Ser Lys Gly Lys Ile Asp Lys Ala Arg Lys Asn Leu Ala
245 250 255
Tyr Leu Arg Gly Leu Ser Glu Asp His Pro Tyr Ser Val Phe Glu Leu
260 265 270
Glu Asn Ile Ser Lys Ala Ile Glu Glu Asn Phe Glu Gln Thr Gly Arg
275 280 285
Gly Phe Phe Asp Pro Leu Lys Ala Leu Phe Phe Ser Lys Lys Met Leu
290 295 300
Tyr Arg Leu Leu Leu Ser Thr Ser Met Phe Met Met Gln Asn Gly Tyr
305 310 315 320
Gly Ile Asn Ala Val Thr Tyr Tyr Ser Pro Thr Ile Phe Lys Ser Leu
325 330 335
Gly Val Gln Gly Ser Asn Ala Gly Leu Leu Ser Thr Gly Ile Phe Gly
340 345 350
Leu Leu Lys Gly Ala Ala Ser Val Phe Trp Val Phe Phe Leu Val Asp
355 360 365
Thr Phe Gly Arg Arg Phe Cys Leu Cys Tyr Leu Ser Leu Pro Cys Ser
370 375 380
Ile Cys Met Trp Tyr Ile Gly Ala Tyr Ile Lys Ile Ala Asn Pro Ser
385 390 395 400
Ala Lys Leu Ala Ala Gly Asp Thr Ala Thr Thr Pro Ala Gly Thr Ala
405 410 415
Ala Lys Ala Met Leu Tyr Ile Trp Thr Ile Phe Tyr Gly Ile Thr Trp
420 425 430
Asn Gly Thr Thr Trp Val Ile Cys Ala Glu Ile Phe Pro Gln Ser Val
435 440 445
Arg Thr Ala Ala Gln Ala Val Asn Ala Ser Ser Asn Trp Phe Trp Ala
450 455 460
Phe Met Ile Gly His Phe Thr Gly Gln Ala Leu Glu Asn Ile Gly Tyr
465 470 475 480
Gly Tyr Tyr Phe Leu Phe Ala Ala Cys Ser Ala Ile Phe Pro Val Val
485 490 495
Val Trp Phe Val Tyr Pro Glu Thr Lys Gly Val Pro Leu Glu Ala Val
500 505 510
Glu Tyr Leu Phe Glu Val Arg Pro Trp Lys Ala His Ser Tyr Ala Leu
515 520 525
Glu Lys Tyr Gln Ile Glu Tyr Asn Glu Gly Glu Phe His Gln His Lys
530 535 540
Pro Glu Val Leu Leu Gln Gly Ser Glu Asn Ser Asp Thr Ser Glu Lys
545 550 555 560
Ser Leu Ala
<210> 47
<211> 1718
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Rpb1 蛋白
<400> 47
Met Asp Gln Thr Thr Lys Lys Pro Arg Asp Gly Gly Leu Asn Asp Pro
1 5 10 15
Arg Leu Gly Ser Ile Asp Arg Asn Phe Lys Cys Gln Thr Cys Gly Glu
20 25 30
Asp Met Ala Glu Cys Pro Gly His Phe Gly His Ile Glu Leu Ala Lys
35 40 45
Pro Val Phe His Ile Gly Phe Ile Ala Lys Ile Lys Lys Val Cys Glu
50 55 60
Cys Val Cys Met His Cys Gly Lys Leu Leu Val Asp Asp Ala Asn Pro
65 70 75 80
Leu Met Ala Gln Ala Ile Arg Ile Arg Asp Pro Lys Lys Arg Phe Asn
85 90 95
Ala Val Trp Asn Val Ser Lys Thr Lys Met Val Cys Glu Ala Asp Thr
100 105 110
Ile Asn Glu Glu Gly Gln Val Thr Ala Gly Arg Gly Gly Cys Gly His
115 120 125
Thr Gln Pro Thr Val Arg Arg Asp Gly Leu Lys Leu Trp Gly Thr Trp
130 135 140
Lys Gln Asn Lys Thr Tyr Asp Glu Asn Glu Gln Pro Glu Arg Arg Leu
145 150 155 160
Leu Ser Pro Ser Glu Ile Leu Ser Val Phe Arg His Ile Ser Pro Glu
165 170 175
Asp Cys His Lys Leu Gly Phe Asn Glu Asp Tyr Ala Arg Pro Glu Trp
180 185 190
Met Leu Ile Thr Val Leu Pro Val Pro Pro Pro Pro Val Arg Pro Ser
195 200 205
Ile Ala Phe Asn Asp Thr Ala Arg Gly Glu Asp Asp Leu Thr Phe Lys
210 215 220
Leu Ala Asp Ile Leu Lys Ala Asn Ile Asn Val Gln Arg Leu Glu Ile
225 230 235 240
Asp Gly Ser Pro Gln His Val Ile Ser Glu Phe Glu Ala Leu Leu Gln
245 250 255
Phe His Val Ala Thr Tyr Met Asp Asn Asp Ile Ala Gly Gln Pro Gln
260 265 270
Ala Leu Gln Lys Thr Gly Arg Pro Ile Lys Ser Ile Arg Ala Arg Leu
275 280 285
Lys Gly Lys Glu Gly Arg Leu Arg Gly Asn Leu Met Gly Lys Arg Val
290 295 300
Asp Phe Ser Ala Arg Thr Val Ile Ser Gly Asp Pro Asn Leu Asp Leu
305 310 315 320
Asp Gln Val Gly Val Pro Ile Ser Ile Ala Arg Thr Leu Thr Tyr Pro
325 330 335
Glu Val Val Thr Pro Tyr Asn Ile His Lys Leu Thr Glu Tyr Val Arg
340 345 350
Asn Gly Pro Asn Glu His Pro Gly Ala Lys Tyr Val Ile Arg Asp Thr
355 360 365
Gly Asp Arg Ile Asp Leu Met Tyr Asn Lys Arg Ala Gly Asp Ile Ala
370 375 380
Leu Gln Tyr Gly Trp Lys Val Glu Arg His Leu Met Asp Asp Asp Pro
385 390 395 400
Val Leu Phe Asn Arg Gln Pro Ser Leu His Lys Met Ser Met Met Ala
405 410 415
His Arg Val Lys Val Met Pro Tyr Ser Thr Phe Arg Leu Asn Leu Ser
420 425 430
Val Thr Ser Pro Tyr Asn Ala Asp Phe Asp Gly Asp Glu Met Asn Leu
435 440 445
His Val Pro Gln Ser Pro Glu Thr Arg Ala Glu Met Ser Gln Ile Cys
450 455 460
Ala Val Pro Leu Gln Ile Val Ser Pro Gln Ser Asn Lys Pro Val Met
465 470 475 480
Gly Ile Val Gln Asp Thr Leu Cys Gly Ile Arg Lys Met Thr Leu Arg
485 490 495
Asp Asn Phe Ile Glu Tyr Glu Gln Val Met Asn Met Leu Tyr Trp Ile
500 505 510
Pro Asn Trp Asp Gly Val Ile Pro Pro Pro Ala Val Leu Lys Pro Lys
515 520 525
Pro Leu Trp Ser Gly Lys Gln Leu Leu Ser Met Ala Ile Pro Lys Gly
530 535 540
Ile His Leu Gln Arg Phe Asp Asp Gly Arg Asp Met Leu Ser Pro Lys
545 550 555 560
Asp Ser Gly Met Leu Ile Val Asp Gly Glu Ile Ile Phe Gly Val Val
565 570 575
Asp Lys Lys Thr Val Gly Ala Thr Gly Gly Gly Leu Ile His Thr Val
580 585 590
Met Arg Glu Lys Gly Pro Tyr Val Cys Ala Gln Leu Phe Ser Ser Ile
595 600 605
Gln Lys Val Val Asn Tyr Trp Leu Leu His Asn Gly Phe Ser Ile Gly
610 615 620
Ile Gly Asp Thr Ile Ala Asp Lys Asp Thr Met Arg Asp Val Thr Thr
625 630 635 640
Thr Ile Gln Glu Ala Lys Gln Lys Val Gln Glu Ile Ile Ile Asp Ala
645 650 655
Gln Gln Asn Lys Leu Glu Pro Glu Pro Gly Met Thr Leu Arg Glu Ser
660 665 670
Phe Glu His Asn Val Ser Arg Ile Leu Asn Gln Ala Arg Asp Thr Ala
675 680 685
Gly Arg Ser Ala Glu Met Asn Leu Lys Asp Ser Asn Asn Val Lys Gln
690 695 700
Met Val Thr Ser Gly Ser Lys Gly Ser Phe Ile Asn Ile Ser Gln Met
705 710 715 720
Ser Ala Cys Val Gly Gln Gln Ile Val Glu Gly Lys Arg Ile Pro Phe
725 730 735
Gly Phe Gly Asp Arg Thr Leu Pro His Phe Thr Lys Asp Asp Tyr Ser
740 745 750
Pro Glu Ser Lys Gly Phe Val Glu Asn Ser Tyr Leu Arg Gly Leu Thr
755 760 765
Pro Gln Glu Phe Phe Phe His Ala Met Ala Gly Arg Glu Gly Leu Ile
770 775 780
Asp Thr Ala Val Lys Thr Ala Glu Thr Gly Tyr Ile Gln Arg Arg Leu
785 790 795 800
Val Lys Ala Leu Glu Asp Ile Met Val His Tyr Asp Gly Thr Thr Arg
805 810 815
Asn Ser Leu Gly Asp Ile Ile Gln Phe Val Tyr Gly Glu Asp Gly Ile
820 825 830
Asp Ala Thr Ser Val Glu Lys Gln Ser Val Asp Thr Ile Pro Gly Ser
835 840 845
Asp Ser Ser Phe Glu Lys Arg Tyr Arg Ile Asp Val Leu Asp Pro Ala
850 855 860
Lys Ser Ile Pro Glu Ser Leu Leu Glu Ser Gly Lys Gln Ile Lys Gly
865 870 875 880
Asp Val Ala Val Gln Lys Val Leu Asp Glu Glu Tyr Asp Gln Leu Leu
885 890 895
Lys Asp Arg Lys Phe Leu Arg Glu Val Val Phe Pro Asn Gly Asp Tyr
900 905 910
Asn Trp Pro Leu Pro Val Asn Leu Arg Arg Ile Ile Gln Asn Ala Gln
915 920 925
Gln Ile Phe His Ser Gly Arg Gln Lys Ala Ser Asp Leu Arg Leu Glu
930 935 940
Glu Ile Val Glu Gly Val Gln Ser Leu Cys Thr Lys Leu Leu Val Leu
945 950 955 960
Arg Gly Lys Thr Glu Leu Ile Lys Glu Ala Gln Glu Asn Ala Thr Leu
965 970 975
Leu Phe Gln Cys Leu Leu Arg Ser Arg Leu Ala Ala Arg Arg Val Ile
980 985 990
Glu Glu Phe Lys Leu Asn Lys Val Ser Phe Glu Trp Val Cys Gly Glu
995 1000 1005
Ile Glu Ser Gln Phe Gln Lys Ser Ile Val His Pro Gly Glu Met
1010 1015 1020
Val Gly Val Val Ala Ala Gln Ser Ile Gly Glu Pro Ala Thr Gln
1025 1030 1035
Met Thr Leu Asn Thr Phe His Tyr Ala Gly Val Ser Ser Lys Asn
1040 1045 1050
Val Thr Leu Gly Val Pro Arg Leu Lys Glu Ile Leu Asn Val Ala
1055 1060 1065
Lys Asn Ile Lys Thr Pro Ala Leu Thr Val Tyr Leu Glu Pro Glu
1070 1075 1080
Ile Ala Val Asp Ile Glu Lys Ala Lys Val Val Gln Ser Ala Ile
1085 1090 1095
Glu His Thr Thr Leu Lys Asn Val Thr Ser Ser Thr Glu Ile Tyr
1100 1105 1110
Tyr Asp Pro Asp Pro Arg Ser Thr Val Ile Glu Glu Asp Tyr Asp
1115 1120 1125
Thr Val Glu Ala Tyr Phe Ala Ile Pro Asp Glu Lys Val Glu Glu
1130 1135 1140
Thr Ile Asp Asn Gln Ser Pro Trp Leu Leu Arg Leu Glu Leu Asp
1145 1150 1155
Arg Ala Lys Met Leu Asp Lys Gln Leu Thr Met Ala Gln Val Ala
1160 1165 1170
Glu Lys Ile Ser Gln Asn Phe Gly Glu Asp Leu Phe Val Ile Trp
1175 1180 1185
Ser Asp Asp Thr Ala Asp Lys Leu Ile Ile Arg Cys Arg Val Ile
1190 1195 1200
Arg Asp Pro Lys Leu Glu Glu Glu Gly Glu His Glu Glu Asp Gln
1205 1210 1215
Ile Leu Lys Arg Val Glu Ala His Met Leu Glu Thr Ile Ser Leu
1220 1225 1230
Arg Gly Ile Pro Gly Ile Thr Arg Val Phe Met Met Gln His Lys
1235 1240 1245
Met Ser Thr Pro Asp Ala Asp Gly Glu Phe Ser Gln Lys Gln Glu
1250 1255 1260
Trp Val Leu Glu Thr Asp Gly Val Asn Leu Ala Glu Val Ile Thr
1265 1270 1275
Val Pro Gly Val Asp Ala Ser Arg Thr Tyr Ser Asn Asn Phe Ile
1280 1285 1290
Glu Ile Leu Ser Val Leu Gly Ile Glu Ala Thr Arg Thr Ala Leu
1295 1300 1305
Phe Lys Glu Ile Leu Asn Val Ile Ala Phe Asp Gly Ser Tyr Val
1310 1315 1320
Asn Tyr Arg His Met Ala Leu Leu Val Asp Val Met Thr Ala Arg
1325 1330 1335
Gly His Leu Met Ala Ile Thr Arg His Gly Ile Asn Arg Ala Glu
1340 1345 1350
Thr Gly Ala Leu Met Arg Cys Ser Phe Glu Glu Thr Val Glu Ile
1355 1360 1365
Leu Leu Asp Ala Gly Ala Ala Ala Glu Leu Asp Asp Cys Arg Gly
1370 1375 1380
Ile Ser Glu Asn Val Ile Leu Gly Gln Met Pro Pro Leu Gly Thr
1385 1390 1395
Gly Ala Phe Asp Val Met Val Asp Glu Lys Met Leu Gln Asp Ala
1400 1405 1410
Ser Val Ser Ser Asp Ile Gly Val Ala Gly Gln Thr Asp Gly Gly
1415 1420 1425
Ala Thr Pro Tyr Arg Asp Tyr Glu Met Glu Asp Asp Lys Ile Gln
1430 1435 1440
Phe Glu Glu Gly Ala Gly Phe Ser Pro Ile His Thr Ala Asn Val
1445 1450 1455
Ser Asp Ala Ser Gly Ser Leu Thr Ser Tyr Gly Gly Gln Pro Ser
1460 1465 1470
Met Val Ser Pro Thr Ser Pro Phe Ser Phe Gly Ala Thr Ser Pro
1475 1480 1485
Gly Tyr Gly Gly Val Thr Ser Pro Ala Tyr Gly Ala Thr Ser Pro
1490 1495 1500
Thr Tyr Ser Pro Thr Ser Pro Thr Tyr Ser Pro Thr Ser Pro Ser
1505 1510 1515
Tyr Ser Pro Thr Ser Pro Ser Tyr Ser Pro Thr Ser Pro Ser Tyr
1520 1525 1530
Ser Pro Thr Ser Pro Ser Tyr Ser Pro Thr Ser Pro Ser Tyr Ser
1535 1540 1545
Pro Thr Ser Pro Ser Tyr Ser Pro Thr Ser Pro Ser Tyr Ser Pro
1550 1555 1560
Thr Ser Pro Ser Tyr Ser Pro Thr Ser Pro Ser Tyr Ser Pro Thr
1565 1570 1575
Ser Pro Ser Tyr Ser Pro Thr Ser Pro Ser Tyr Ser Pro Thr Ser
1580 1585 1590
Pro Ser Tyr Ser Pro Thr Ser Pro Ser Tyr Ser Pro Thr Ser Pro
1595 1600 1605
Ser Tyr Ser Pro Thr Ser Pro Ser Tyr Ser Pro Thr Ser Pro Ser
1610 1615 1620
Tyr Ser Pro Thr Ser Pro Ser Tyr Ser Pro Thr Ser Pro Ser Tyr
1625 1630 1635
Ser Pro Thr Ser Pro Gln Tyr Ser Pro Thr Ser Pro Ser Tyr Ser
1640 1645 1650
Pro Thr Ser Pro Gln Tyr Ser Pro Thr Ser Pro Ser Tyr Ser Pro
1655 1660 1665
Thr Ser Pro Gln Tyr Ser Pro Thr Ser Pro Ser Tyr Ser Pro Thr
1670 1675 1680
Ser Pro Gln Tyr Ser Pro Thr Ser Pro Gln Tyr Ser Pro Gly Ser
1685 1690 1695
Pro Ala Tyr Ser Pro Gly Ser Pro Ser Tyr Ser Thr Glu Lys Lys
1700 1705 1710
Asp Glu Asp Lys Lys
1715
<210> 48
<211> 1233
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Rpb2 蛋白
<400> 48
Met Ser Gln Glu Pro Val Glu Asp Pro Tyr Val Tyr Asp Glu Glu Asp
1 5 10 15
Ala His Ser Ile Thr Pro Glu Asp Cys Trp Thr Val Ile Ser Ser Phe
20 25 30
Phe Gln Glu Lys Gly Leu Val Ser Gln Gln Leu Asp Ser Phe Asp Glu
35 40 45
Phe Ile Glu Ser Asn Ile Gln Glu Leu Val Trp Glu Asp Ser His Leu
50 55 60
Ile Leu Asp Gln Pro Ala Gln His Thr Ser Glu Asp Gln Tyr Glu Asn
65 70 75 80
Lys Arg Phe Glu Ile Thr Phe Gly Lys Ile Tyr Ile Ser Lys Pro Thr
85 90 95
Gln Thr Glu Gly Asp Gly Thr Thr His Pro Met Phe Pro Gln Glu Ala
100 105 110
Arg Leu Arg Asn Leu Thr Tyr Ser Ser Pro Leu Tyr Val Asp Met Ser
115 120 125
Lys Lys Lys Phe Leu Ser Asp Asp Arg Val Arg Lys Gly Asn Glu Leu
130 135 140
Glu Trp Val Glu Glu Lys Val Asp Gly Glu Glu Ala Gln Ser Lys Val
145 150 155 160
Phe Leu Gly Lys Val Pro Ile Met Leu Arg Ser Lys Phe Cys Met Leu
165 170 175
Arg Asp Leu Gly Glu His Glu Phe Tyr Glu Leu Lys Glu Cys Pro Tyr
180 185 190
Asp Met Gly Gly Tyr Phe Val Ile Asn Gly Ser Glu Lys Val Leu Ile
195 200 205
Ala Gln Glu Arg Ser Ala Ala Asn Ile Val Gln Val Phe Lys Lys Ala
210 215 220
Ala Pro Ser Pro Ile Ser His Val Ala Glu Ile Arg Ser Ala Leu Glu
225 230 235 240
Lys Gly Ser Arg Leu Ile Ser Ser Met Gln Ile Lys Leu Tyr Gly Arg
245 250 255
Asp Asp Lys Gly Thr Thr Gly Arg Thr Ile Lys Ala Thr Leu Pro Tyr
260 265 270
Ile Lys Glu Asp Ile Pro Ile Val Ile Val Phe Arg Ala Leu Gly Val
275 280 285
Val Pro Asp Gly Asp Ile Leu Glu His Ile Cys Tyr Asp Ala Asn Asp
290 295 300
Trp Gln Met Leu Glu Met Leu Lys Pro Cys Val Glu Glu Gly Phe Val
305 310 315 320
Ile Gln Glu Arg Glu Val Ala Leu Asp Phe Ile Gly Arg Arg Gly Val
325 330 335
Leu Gly Ile Arg Arg Glu Lys Arg Ile Gln Tyr Ala Lys Asp Ile Leu
340 345 350
Gln Lys Glu Leu Leu Pro Asn Ile Thr Gln Glu Ala Gly Phe Glu Ser
355 360 365
Arg Lys Ala Phe Phe Leu Gly Tyr Met Val Asn Arg Leu Leu Leu Cys
370 375 380
Ala Leu Glu Arg Lys Glu Pro Asp Asp Arg Asp His Phe Gly Lys Lys
385 390 395 400
Arg Leu Asp Leu Ala Gly Pro Leu Leu Ala Ser Leu Phe Arg Leu Leu
405 410 415
Phe Lys Lys Leu Thr Arg Asp Ile Tyr Asn Tyr Met Gln Arg Cys Val
420 425 430
Glu Asn Asp Lys Glu Phe Asn Leu Thr Leu Ala Val Lys Ser Gln Thr
435 440 445
Ile Thr Asp Gly Leu Arg Tyr Ser Leu Ala Thr Gly Asn Trp Gly Glu
450 455 460
Gln Arg Lys Ala Met Ser Ala Arg Ala Gly Val Ser Gln Val Leu Asn
465 470 475 480
Arg Tyr Thr Tyr Ser Ser Thr Leu Ser His Leu Arg Arg Thr Asn Thr
485 490 495
Pro Ile Gly Arg Asp Gly Lys Ile Ala Lys Pro Arg Gln Leu His Asn
500 505 510
Thr His Trp Gly Leu Val Cys Pro Ala Glu Thr Pro Glu Gly Gln Ala
515 520 525
Cys Gly Leu Val Lys Asn Leu Ser Leu Met Thr Cys Ile Ser Val Gly
530 535 540
Thr Ser Ser Glu Pro Ile Leu Tyr Phe Leu Glu Glu Trp Gly Met Glu
545 550 555 560
Pro Leu Glu Asp Tyr Val Pro Ser Asn Ala Pro Asp Cys Thr Arg Val
565 570 575
Phe Val Asn Gly Val Trp Val Gly Thr His Arg Glu Pro Ala Gln Leu
580 585 590
Val Asp Thr Met Arg Arg Leu Arg Arg Lys Gly Asp Ile Ser Pro Glu
595 600 605
Val Ser Ile Ile Arg Asp Ile Arg Glu Met Glu Phe Lys Ile Phe Thr
610 615 620
Asp Ala Gly Arg Val Tyr Arg Pro Leu Phe Ile Val Asp Asp Asp Pro
625 630 635 640
Glu Ser Glu Thr Lys Gly Glu Leu Met Leu Gln Lys Glu His Val His
645 650 655
Lys Leu Leu Asn Ser Ala Tyr Asp Glu Tyr Asp Glu Asp Asp Ser Asn
660 665 670
Ala Tyr Thr Trp Ser Ser Leu Val Asn Asp Gly Val Val Glu Tyr Val
675 680 685
Asp Ala Glu Glu Glu Glu Thr Ile Met Ile Ala Met Thr Pro Glu Asp
690 695 700
Leu Glu Ala Ser Lys Ser Ala Leu Ser Glu Thr Gln Gln Gln Asp Leu
705 710 715 720
Gln Met Glu Glu Gln Glu Leu Asp Pro Ala Lys Arg Ile Lys Pro Thr
725 730 735
Tyr Thr Ser Ser Thr His Thr Phe Thr His Cys Glu Ile His Pro Ser
740 745 750
Met Ile Leu Gly Val Ala Ala Ser Ile Ile Pro Phe Pro Asp His Asn
755 760 765
Gln Ser Pro Arg Asn Thr Tyr Gln Ser Ala Met Gly Lys Gln Ala Met
770 775 780
Gly Val Phe Leu Thr Asn Tyr Ala Val Arg Met Asp Thr Met Ala Asn
785 790 795 800
Ile Leu Tyr Tyr Pro Gln Lys Pro Leu Ala Thr Thr Arg Ala Met Glu
805 810 815
His Leu Lys Phe Arg Glu Leu Pro Ala Gly Gln Asn Ala Val Val Ala
820 825 830
Ile Ala Cys Tyr Ser Gly Tyr Asn Gln Glu Asp Ser Met Ile Met Asn
835 840 845
Gln Ser Ser Ile Asp Arg Gly Leu Phe Arg Ser Leu Phe Phe Arg Ser
850 855 860
Tyr Met Asp Leu Glu Lys Arg Gln Gly Met Lys Ala Leu Glu Thr Phe
865 870 875 880
Glu Lys Pro Ser Arg Ser Asp Thr Leu Arg Leu Lys His Gly Thr Tyr
885 890 895
Glu Lys Leu Asp Asp Asp Gly Leu Ile Ala Pro Gly Val Arg Val Ser
900 905 910
Gly Glu Asp Ile Ile Ile Gly Lys Thr Thr Pro Ile Pro Pro Asp Thr
915 920 925
Glu Glu Leu Gly Gln Arg Thr Gln Tyr His Thr Lys Arg Asp Ala Ser
930 935 940
Thr Pro Leu Arg Ser Thr Glu Ser Gly Ile Val Asp Gln Val Leu Leu
945 950 955 960
Thr Thr Asn Gly Asp Gly Ala Lys Phe Val Lys Val Arg Met Arg Thr
965 970 975
Thr Lys Val Pro Gln Ile Gly Asp Lys Phe Ala Ser Arg His Gly Gln
980 985 990
Lys Gly Thr Ile Gly Val Thr Tyr Arg His Glu Asp Met Pro Phe Ser
995 1000 1005
Ala Gln Gly Ile Val Pro Asp Leu Ile Ile Asn Pro His Ala Ile
1010 1015 1020
Pro Ser Arg Met Thr Val Ala His Leu Ile Glu Cys Leu Leu Ser
1025 1030 1035
Lys Val Ser Ser Leu Ser Gly Leu Glu Gly Asp Ala Ser Pro Phe
1040 1045 1050
Thr Asp Val Thr Ala Glu Ala Val Ser Lys Leu Leu Arg Glu His
1055 1060 1065
Gly Tyr Gln Ser Arg Gly Phe Glu Val Met Tyr Asn Gly His Thr
1070 1075 1080
Gly Lys Lys Met Met Ala Gln Val Phe Phe Gly Pro Thr Tyr Tyr
1085 1090 1095
Gln Arg Leu Arg His Met Val Asp Asp Lys Ile His Ala Arg Ala
1100 1105 1110
Arg Gly Pro Val Gln Val Leu Thr Arg Gln Pro Val Glu Gly Arg
1115 1120 1125
Ser Arg Asp Gly Gly Leu Arg Phe Gly Glu Met Glu Arg Asp Cys
1130 1135 1140
Met Ile Ala His Gly Ala Ala Gly Phe Leu Lys Glu Arg Leu Met
1145 1150 1155
Glu Ala Ser Asp Ala Phe Arg Val His Val Cys Gly Ile Cys Gly
1160 1165 1170
Leu Met Ser Val Ile Ala Asn Leu Lys Lys Asn Gln Phe Glu Cys
1175 1180 1185
Arg Ser Cys Lys Asn Lys Thr Asn Ile Tyr Gln Ile His Ile Pro
1190 1195 1200
Tyr Ala Ala Lys Leu Leu Phe Gln Glu Leu Met Ala Met Asn Ile
1205 1210 1215
Ser Pro Arg Leu Tyr Thr Glu Arg Ser Gly Ile Ser Val Arg Val
1220 1225 1230
<210> 49
<211> 458
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Tef1 蛋白
<400> 49
Met Gly Lys Glu Lys Ser His Val Asn Val Val Val Ile Gly His Val
1 5 10 15
Asp Ser Gly Lys Ser Thr Thr Thr Gly His Leu Ile Tyr Lys Cys Gly
20 25 30
Gly Ile Asp Lys Arg Thr Ile Glu Lys Phe Glu Lys Glu Ala Ala Glu
35 40 45
Leu Gly Lys Gly Ser Phe Lys Tyr Ala Trp Val Leu Asp Lys Leu Lys
50 55 60
Ala Glu Arg Glu Arg Gly Ile Thr Ile Asp Ile Ala Leu Trp Lys Phe
65 70 75 80
Glu Thr Pro Lys Tyr His Val Thr Val Ile Asp Ala Pro Gly His Arg
85 90 95
Asp Phe Ile Lys Asn Met Ile Thr Gly Thr Ser Gln Ala Asp Cys Ala
100 105 110
Ile Leu Ile Ile Ala Gly Gly Val Gly Glu Phe Glu Ala Gly Ile Ser
115 120 125
Lys Asp Gly Gln Thr Arg Glu His Ala Leu Leu Ala Tyr Thr Leu Gly
130 135 140
Val Arg Gln Leu Ile Val Ala Val Asn Lys Met Asp Ser Val Lys Trp
145 150 155 160
Asp Lys Asn Arg Phe Glu Glu Ile Ile Lys Glu Thr Ser Asn Phe Val
165 170 175
Lys Lys Val Gly Tyr Asn Pro Lys Thr Val Pro Phe Val Pro Ile Ser
180 185 190
Gly Trp Asn Gly Asp Asn Met Ile Glu Ala Ser Thr Asn Cys Pro Trp
195 200 205
Tyr Lys Gly Trp Glu Lys Glu Thr Lys Ala Gly Lys Ser Ser Gly Lys
210 215 220
Thr Leu Leu Glu Ala Ile Asp Ala Ile Glu Pro Pro Thr Arg Pro Thr
225 230 235 240
Asp Lys Ala Leu Arg Leu Pro Leu Gln Asp Val Tyr Lys Ile Gly Gly
245 250 255
Ile Gly Thr Val Pro Val Gly Arg Val Glu Thr Gly Val Ile Lys Ala
260 265 270
Gly Met Val Val Thr Phe Ala Pro Ala Gly Val Thr Thr Glu Val Lys
275 280 285
Ser Val Glu Met His His Glu Gln Leu Val Glu Gly Leu Pro Gly Asp
290 295 300
Asn Val Gly Phe Asn Val Lys Asn Val Ser Val Lys Glu Ile Arg Arg
305 310 315 320
Gly Asn Val Cys Gly Asp Ser Lys Gln Asp Pro Pro Lys Ala Ala Ala
325 330 335
Ser Phe Thr Ala Gln Val Ile Val Leu Asn His Pro Gly Gln Ile Ser
340 345 350
Ser Gly Tyr Ser Pro Val Leu Asp Cys His Thr Ala His Ile Ala Cys
355 360 365
Lys Phe Asp Thr Leu Leu Glu Lys Ile Asp Arg Arg Thr Gly Lys Ser
370 375 380
Leu Glu Ser Glu Pro Lys Phe Val Lys Ser Gly Asp Ala Ala Ile Val
385 390 395 400
Lys Met Val Pro Thr Lys Pro Met Cys Val Glu Ala Phe Thr Asp Tyr
405 410 415
Pro Pro Leu Gly Arg Phe Ala Val Arg Asp Met Arg Gln Thr Val Ala
420 425 430
Val Gly Val Ile Lys Ala Val Glu Lys Ser Asp Lys Ala Gly Lys Val
435 440 445
Thr Lys Ala Ala Gln Lys Ala Ala Lys Lys
450 455
<210> 50
<211> 248
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Tpi1 蛋白
<400> 50
Met Ala Arg Gln Phe Phe Val Gly Gly Asn Phe Lys Met Asn Gly Thr
1 5 10 15
Lys Glu Ser Leu Thr Ala Ile Val Asp Thr Leu Asn Lys Ala Asp Leu
20 25 30
Pro Glu Asn Val Glu Val Val Ile Ala Pro Pro Ala Pro Tyr Leu Ser
35 40 45
Leu Val Val Glu Ala Asn Lys Gln Lys Thr Val Glu Val Ala Ala Gln
50 55 60
Asn Val Phe Ser Lys Ala Ser Gly Ala Tyr Thr Gly Glu Ile Ala Pro
65 70 75 80
Gln Gln Leu Lys Asp Leu Gly Ala Asn Trp Thr Leu Thr Gly His Ser
85 90 95
Glu Arg Arg Thr Ile Ile Lys Glu Ser Asp Glu Phe Ile Ala Glu Lys
100 105 110
Thr Lys Phe Ala Leu Glu Ser Gly Val Ser Val Ile Leu Cys Ile Gly
115 120 125
Glu Thr Leu Glu Glu Lys Lys Ala Gly Ile Thr Leu Glu Val Cys Ala
130 135 140
Arg Gln Leu Asp Ala Val Ser Lys Ile Val Ser Asp Trp Thr Asn Val
145 150 155 160
Val Ile Ala Tyr Glu Pro Val Trp Ala Ile Gly Thr Gly Leu Ala Ala
165 170 175
Thr Ala Gln Asp Ala Gln Asp Ile His Lys Glu Ile Arg Ala His Leu
180 185 190
Ser Lys Thr Ile Gly Ala Glu Gln Ala Glu Ala Val Arg Ile Leu Tyr
195 200 205
Gly Gly Ser Val Asn Gly Lys Asn Ala Val Asp Phe Lys Asp Lys Ala
210 215 220
Asp Val Asp Gly Phe Leu Val Gly Gly Ala Ser Leu Lys Pro Glu Phe
225 230 235 240
Ile Asp Ile Ile Lys Ser Arg Leu
245
<210> 51
<211> 609
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Xks1 蛋白
<400> 51
Met Thr Tyr Ser Ser Ser Ser Gly Leu Phe Leu Gly Phe Asp Leu Ser
1 5 10 15
Thr Gln Gln Leu Lys Ile Ile Val Thr Asn Glu Asn Leu Lys Ala Leu
20 25 30
Gly Thr Tyr His Val Glu Phe Asp Ala Gln Phe Lys Glu Lys Tyr Ala
35 40 45
Ile Lys Lys Gly Val Leu Ser Asp Glu Lys Thr Gly Glu Ile Leu Ser
50 55 60
Pro Val His Met Trp Leu Glu Ala Ile Asp His Val Phe Gly Leu Met
65 70 75 80
Lys Lys Asp Asn Phe Pro Phe Gly Lys Val Lys Gly Ile Ser Gly Ser
85 90 95
Gly Met Gln His Gly Ser Val Phe Trp Ser Lys Ser Ala Ser Ser Ser
100 105 110
Leu Lys Asn Met Ala Glu Tyr Ser Ser Leu Thr Glu Ala Leu Ala Asp
115 120 125
Ala Phe Ala Cys Asp Thr Ser Pro Asn Trp Gln Asp His Ser Thr Gly
130 135 140
Lys Glu Ile Lys Asp Phe Glu Lys Val Val Gly Gly Pro Asp Lys Leu
145 150 155 160
Ala Glu Ile Thr Gly Ser Arg Ala His Tyr Arg Phe Thr Gly Leu Gln
165 170 175
Ile Arg Lys Leu Ala Val Arg Ser Glu Asn Asp Val Tyr Gln Lys Thr
180 185 190
Asp Arg Ile Ser Leu Val Ser Ser Phe Val Ala Ser Val Leu Leu Gly
195 200 205
Arg Ile Thr Thr Ile Glu Glu Ala Asp Ala Cys Gly Met Asn Leu Tyr
210 215 220
Asn Val Thr Glu Ser Lys Leu Asp Glu Asp Leu Leu Ala Ile Ala Ala
225 230 235 240
Gly Val His Pro Lys Leu Asp Asn Lys Ser Lys Arg Glu Thr Asp Glu
245 250 255
Gly Val Lys Glu Leu Lys Arg Lys Ile Gly Glu Ile Lys Pro Val Ser
260 265 270
Tyr Gln Thr Ser Gly Ser Ile Ala Pro Tyr Phe Val Glu Lys Tyr Gly
275 280 285
Phe Ser Pro Asp Ser Lys Ile Val Ser Phe Thr Gly Asp Asn Leu Ala
290 295 300
Thr Ile Ile Ser Leu Pro Leu Arg Lys Asn Asp Val Leu Val Ser Leu
305 310 315 320
Gly Thr Ser Thr Thr Val Leu Leu Val Thr Glu Ser Tyr Ala Pro Ser
325 330 335
Ser Gln Tyr His Leu Phe Lys His Pro Thr Ile Lys Asn Ala Tyr Met
340 345 350
Gly Met Ile Cys Tyr Ser Asn Gly Ala Leu Ala Arg Glu Arg Val Arg
355 360 365
Asp Ala Ile Asn Glu Lys Tyr Gly Val Ala Gly Asp Ser Trp Asp Lys
370 375 380
Phe Asn Glu Ile Leu Asp Arg Ser Gly Asp Phe Asn Asn Lys Leu Gly
385 390 395 400
Val Tyr Phe Pro Ile Gly Glu Ile Val Pro Asn Ala Pro Ala Gln Thr
405 410 415
Lys Arg Met Glu Met Asn Ser His Glu Asp Val Lys Glu Ile Glu Lys
420 425 430
Trp Asp Leu Glu Asn Asp Val Thr Ser Ile Val Glu Ser Gln Thr Val
435 440 445
Ser Cys Arg Val Arg Ala Gly Pro Met Leu Ser Gly Ser Gly Asp Ser
450 455 460
Asn Glu Gly Thr Pro Glu Asn Glu Asn Arg Lys Val Lys Thr Leu Ile
465 470 475 480
Asp Asp Leu His Ser Lys Phe Gly Glu Ile Tyr Thr Asp Gly Lys Pro
485 490 495
Gln Ser Tyr Glu Ser Leu Thr Ser Arg Pro Arg Asn Ile Tyr Phe Val
500 505 510
Gly Gly Ala Ser Arg Asn Lys Ser Ile Ile His Lys Met Ala Ser Ile
515 520 525
Met Gly Ala Thr Glu Gly Asn Phe Gln Val Glu Ile Pro Asn Ala Cys
530 535 540
Ala Leu Gly Gly Ala Tyr Lys Ala Ser Trp Ser Leu Glu Cys Glu Ser
545 550 555 560
Arg Gln Lys Trp Val His Phe Asn Asp Tyr Leu Asn Glu Lys Tyr Asp
565 570 575
Phe Asp Asp Val Asp Glu Phe Lys Val Asp Asp Lys Trp Leu Asn Tyr
580 585 590
Ile Pro Ala Ile Gly Leu Leu Ser Lys Leu Glu Ser Asn Leu Asp Gln
595 600 605
Asn
<210> 52
<211> 318
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Xyl1 蛋白
<400> 52
Met Ala Thr Ile Lys Leu Asn Ser Gly Tyr Asp Met Pro Gln Val Gly
1 5 10 15
Phe Gly Cys Trp Lys Val Thr Asn Ser Thr Cys Ala Asp Thr Ile Tyr
20 25 30
Asn Ala Ile Lys Val Gly Tyr Arg Leu Phe Asp Gly Ala Glu Asp Tyr
35 40 45
Gly Asn Glu Lys Glu Val Gly Glu Gly Ile Asn Arg Ala Ile Asp Glu
50 55 60
Gly Leu Val Ala Arg Asp Glu Leu Phe Val Val Ser Lys Leu Trp Asn
65 70 75 80
Asn Phe His His Pro Asp Asn Val Glu Lys Ala Leu Asp Lys Thr Leu
85 90 95
Gly Asp Leu Asn Val Glu Tyr Leu Asp Leu Phe Leu Ile His Phe Pro
100 105 110
Ile Ala Phe Lys Phe Val Pro Phe Glu Glu Lys Tyr Pro Pro Gly Phe
115 120 125
Tyr Cys Gly Glu Gly Asp Lys Phe Ile Tyr Glu Asp Val Pro Leu Leu
130 135 140
Asp Thr Trp Arg Ala Leu Glu Lys Phe Val Lys Lys Gly Lys Ile Arg
145 150 155 160
Ser Ile Gly Ile Ser Asn Phe Ser Gly Ala Leu Ile Gln Asp Leu Leu
165 170 175
Arg Gly Ala Glu Ile Pro Pro Ala Val Leu Gln Ile Glu His His Pro
180 185 190
Tyr Leu Gln Gln Pro Arg Leu Ile Glu Tyr Val Gln Ser Lys Gly Ile
195 200 205
Ala Ile Thr Ala Tyr Ser Ser Phe Gly Pro Gln Ser Phe Val Glu Leu
210 215 220
Asp His Pro Lys Val Lys Glu Cys Val Thr Leu Phe Glu His Glu Asp
225 230 235 240
Ile Val Ser Ile Ala Lys Ala His Asp Lys Ser Ala Gly Gln Val Leu
245 250 255
Leu Arg Trp Ala Thr Gln Arg Gly Leu Ala Val Ile Pro Lys Ser Asn
260 265 270
Lys Thr Glu Arg Leu Leu Ser Asn Leu Asn Val Asn Asp Phe Asp Leu
275 280 285
Ser Glu Ala Glu Leu Glu Gln Ile Ala Lys Leu Asp Val Gly Leu Arg
290 295 300
Phe Asn Asn Pro Trp Asp Trp Asp Lys Ile Pro Ile Phe His
305 310 315
<210> 53
<211> 362
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Xyl2 蛋白
<400> 53
Met Pro Ala Asn Pro Ser Leu Val Leu Asn Lys Val Asn Asp Ile Thr
1 5 10 15
Phe Glu Asn Tyr Glu Val Pro Leu Leu Thr Asp Pro Asn Asp Val Leu
20 25 30
Val Gln Val Lys Lys Thr Gly Ile Cys Gly Ser Asp Ile His Tyr Tyr
35 40 45
Thr His Gly Arg Ile Gly Asp Phe Val Leu Thr Lys Pro Met Val Leu
50 55 60
Gly His Glu Ser Ala Gly Val Val Val Glu Val Gly Lys Gly Val Thr
65 70 75 80
Asp Leu Lys Val Gly Asp Lys Val Ala Ile Glu Pro Gly Val Pro Ser
85 90 95
Arg Thr Ser Asp Glu Tyr Lys Ser Gly His Tyr Asn Leu Cys Pro His
100 105 110
Met Cys Phe Ala Ala Thr Pro Asn Ser Asn Pro Asp Glu Pro Asn Pro
115 120 125
Pro Gly Thr Leu Cys Lys Tyr Tyr Lys Ser Pro Ala Asp Phe Leu Val
130 135 140
Lys Leu Pro Glu His Val Ser Leu Glu Leu Gly Ala Met Val Glu Pro
145 150 155 160
Leu Thr Val Gly Val His Ala Ser Arg Leu Gly Arg Val Thr Phe Gly
165 170 175
Asp His Val Val Val Phe Gly Ala Gly Pro Val Gly Ile Leu Ala Ala
180 185 190
Ala Val Ala Arg Lys Phe Gly Ala Ala Ser Val Thr Ile Val Asp Ile
195 200 205
Phe Asp Ser Lys Leu Glu Leu Ala Lys Ser Ile Gly Ala Ala Thr His
210 215 220
Thr Phe Asn Ser Met Thr Glu Gly Val Leu Ser Glu Ala Leu Pro Ala
225 230 235 240
Gly Val Arg Pro Asp Val Val Leu Glu Cys Thr Gly Ala Glu Ile Cys
245 250 255
Val Gln Gln Gly Val Leu Ala Leu Lys Ala Gly Gly Arg His Val Gln
260 265 270
Val Gly Asn Ala Gly Ser Tyr Leu Lys Phe Pro Ile Thr Glu Phe Val
275 280 285
Thr Lys Glu Leu Thr Leu Phe Gly Ser Phe Arg Tyr Gly Tyr Asn Asp
290 295 300
Tyr Lys Thr Ser Val Ala Ile Leu Asp Glu Asn Tyr Lys Asn Gly Lys
305 310 315 320
Glu Asn Ala Leu Val Asp Phe Glu Ala Leu Ile Thr His Arg Phe Pro
325 330 335
Phe Lys Asn Ala Ile Glu Ala Tyr Asp Ala Val Arg Ala Gly Asp Gly
340 345 350
Ala Val Lys Cys Ile Ile Asp Gly Pro Glu
355 360
<210> 54
<211> 543
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Xyt1 蛋白
<400> 54
Met Gly Tyr Glu Glu Lys Leu Val Ala Pro Ala Leu Lys Phe Lys Asn
1 5 10 15
Phe Leu Asp Lys Thr Pro Asn Ile His Asn Val Tyr Val Ile Ala Ala
20 25 30
Ile Ser Cys Thr Ser Gly Met Met Phe Gly Phe Asp Ile Ser Ser Met
35 40 45
Ser Val Phe Val Asp Gln Gln Pro Tyr Leu Lys Met Phe Asp Asn Pro
50 55 60
Ser Ser Val Ile Gln Gly Phe Ile Thr Ala Ser Met Ser Leu Gly Ser
65 70 75 80
Phe Phe Gly Ser Leu Thr Ser Thr Phe Ile Ser Glu Pro Phe Gly Arg
85 90 95
Arg Ala Ser Leu Phe Ile Cys Gly Ile Leu Trp Val Ile Gly Ala Ala
100 105 110
Val Gln Ser Ser Ser Gln Asn Arg Ala Gln Leu Ile Cys Gly Arg Ile
115 120 125
Ile Ala Gly Trp Gly Ile Gly Phe Gly Ser Ser Val Ala Pro Val Tyr
130 135 140
Gly Ser Glu Met Ala Pro Arg Lys Ile Arg Gly Thr Ile Gly Gly Ile
145 150 155 160
Phe Gln Phe Ser Val Thr Val Gly Ile Phe Ile Met Phe Leu Ile Gly
165 170 175
Tyr Gly Cys Ser Phe Ile Gln Gly Lys Ala Ser Phe Arg Ile Pro Trp
180 185 190
Gly Val Gln Met Val Pro Gly Leu Ile Leu Leu Ile Gly Leu Phe Phe
195 200 205
Ile Pro Glu Ser Pro Arg Trp Leu Ala Lys Gln Gly Tyr Trp Glu Asp
210 215 220
Ala Glu Ile Ile Val Ala Asn Val Gln Ala Lys Gly Asn Arg Asn Asp
225 230 235 240
Ala Asn Val Gln Ile Glu Met Ser Glu Ile Lys Asp Gln Leu Met Leu
245 250 255
Asp Glu His Leu Lys Glu Phe Thr Tyr Ala Asp Leu Phe Thr Lys Lys
260 265 270
Tyr Arg Gln Arg Thr Ile Thr Ala Ile Phe Ala Gln Ile Trp Gln Gln
275 280 285
Leu Thr Gly Met Asn Val Met Met Tyr Tyr Ile Val Tyr Ile Phe Gln
290 295 300
Met Ala Gly Tyr Ser Gly Asn Thr Asn Leu Val Pro Ser Leu Ile Gln
305 310 315 320
Tyr Ile Ile Asn Met Ala Val Thr Val Pro Ala Leu Phe Cys Leu Asp
325 330 335
Leu Leu Gly Arg Arg Thr Ile Leu Leu Ala Gly Ala Ala Phe Met Met
340 345 350
Ala Trp Gln Phe Gly Val Ala Gly Ile Leu Ala Thr Tyr Ser Glu Pro
355 360 365
Ala Tyr Ile Ser Asp Thr Val Arg Ile Thr Ile Pro Asp Asp His Lys
370 375 380
Ser Ala Ala Lys Gly Val Ile Ala Cys Cys Tyr Leu Phe Val Cys Ser
385 390 395 400
Phe Ala Phe Ser Trp Gly Val Gly Ile Trp Val Tyr Cys Ser Glu Val
405 410 415
Trp Gly Asp Ser Gln Ser Arg Gln Arg Gly Ala Ala Leu Ala Thr Ser
420 425 430
Ala Asn Trp Ile Phe Asn Phe Ala Ile Ala Met Phe Thr Pro Ser Ser
435 440 445
Phe Lys Asn Ile Thr Trp Lys Thr Tyr Ile Ile Tyr Ala Thr Phe Cys
450 455 460
Ala Cys Met Phe Ile His Val Phe Phe Phe Phe Pro Glu Thr Lys Gly
465 470 475 480
Lys Arg Leu Glu Glu Ile Gly Gln Leu Trp Asp Glu Gly Val Pro Ala
485 490 495
Trp Arg Ser Ala Lys Trp Gln Pro Thr Val Pro Leu Ala Ser Asp Ala
500 505 510
Glu Leu Ala His Lys Met Asp Val Ala His Ala Glu His Ala Asp Leu
515 520 525
Leu Ala Thr His Ser Pro Ser Ser Asp Glu Lys Thr Gly Thr Val
530 535 540
<210> 55
<211> 323
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Tal1 蛋白
<400> 55
Met Ser Asn Ser Leu Glu Ser Leu Lys Ala Thr Gly Thr Val Ile Val
1 5 10 15
Thr Asp Thr Gly Glu Phe Asp Ser Ile Ala Lys Tyr Thr Pro Gln Asp
20 25 30
Ala Thr Thr Asn Pro Ser Leu Ile Leu Ala Ala Ser Lys Lys Ala Glu
35 40 45
Tyr Ala Lys Val Ile Asp Val Ala Ile Lys Tyr Ala Glu Asp Lys Gly
50 55 60
Ser Asn Pro Lys Glu Lys Ala Ala Ile Ala Leu Asp Arg Leu Leu Val
65 70 75 80
Glu Phe Gly Lys Glu Ile Leu Ser Ile Val Pro Gly Arg Val Ser Thr
85 90 95
Glu Val Asp Ala Arg Leu Ser Phe Asp Lys Asp Ala Thr Val Lys Lys
100 105 110
Ala Leu Glu Ile Ile Glu Leu Tyr Lys Ser Ile Gly Ile Ser Lys Asp
115 120 125
Arg Val Leu Ile Lys Ile Ala Ser Thr Trp Glu Gly Ile Gln Ala Ala
130 135 140
Lys Glu Leu Glu Ala Lys His Asp Ile His Cys Asn Leu Thr Leu Leu
145 150 155 160
Phe Ser Phe Val Gln Ala Val Ala Cys Ala Glu Ala Lys Val Thr Leu
165 170 175
Ile Ser Pro Phe Val Gly Arg Ile Leu Asp Trp Tyr Lys Ala Ser Thr
180 185 190
Gly Lys Glu Tyr Asp Ala Glu Ser Asp Pro Gly Val Val Ser Val Arg
195 200 205
Gln Ile Tyr Asn Tyr Tyr Lys Lys Tyr Gly Tyr Asn Thr Ile Val Met
210 215 220
Gly Ala Ser Phe Arg Asn Thr Gly Glu Ile Lys Ala Leu Ala Gly Cys
225 230 235 240
Asp Tyr Leu Thr Val Ala Pro Lys Leu Leu Glu Glu Leu Met Asn Ser
245 250 255
Ser Glu Glu Val Pro Lys Val Leu Asp Ala Ala Ser Ala Ser Ser Ala
260 265 270
Ser Glu Glu Lys Val Ser Tyr Ile Asp Asp Glu Ser Glu Phe Arg Phe
275 280 285
Leu Leu Asn Glu Asp Ala Met Ala Thr Glu Lys Leu Ala Gln Gly Ile
290 295 300
Arg Gly Phe Ala Lys Asp Ala Gln Thr Leu Leu Ala Glu Leu Glu Asn
305 310 315 320
Arg Phe Lys
<210> 56
<211> 677
<212> PRT
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 Tkl1 蛋白
<400> 56
Met Ser Asp Ile Asp Gln Leu Ala Ile Ser Thr Ile Arg Leu Leu Ala
1 5 10 15
Val Asp Ala Val Ala Lys Ala Asn Ser Gly His Pro Gly Ala Pro Leu
20 25 30
Gly Leu Ala Pro Ala Ala His Ala Val Trp Lys Glu Met Lys Phe Asn
35 40 45
Pro Lys Asn Pro Asp Trp Val Asn Arg Asp Arg Phe Val Leu Ser Asn
50 55 60
Gly His Ala Cys Ala Leu Leu Tyr Ala Met Leu His Leu Tyr Gly Phe
65 70 75 80
Asp Met Ser Leu Asp Asp Leu Lys Gln Phe Arg Gln Leu Asn Ser Lys
85 90 95
Thr Pro Gly His Pro Glu Lys Phe Glu Ile Pro Gly Ala Glu Val Thr
100 105 110
Thr Gly Pro Leu Gly Gln Gly Ile Ser Asn Ala Val Gly Leu Ala Ile
115 120 125
Ala Gln Lys Gln Phe Ala Ala Thr Phe Asn Lys Asp Asp Phe Ala Ile
130 135 140
Ser Asp Ser Tyr Thr Tyr Ala Phe Leu Gly Asp Gly Cys Leu Met Glu
145 150 155 160
Gly Val Ala Ser Glu Ala Ser Ser Leu Ala Gly His Leu Gln Leu Asn
165 170 175
Asn Leu Ile Ala Phe Trp Asp Asp Asn Lys Ile Ser Ile Asp Gly Ser
180 185 190
Thr Glu Val Ala Phe Thr Glu Asp Val Leu Lys Arg Tyr Glu Ala Tyr
195 200 205
Gly Trp Asp Thr Leu Thr Ile Glu Lys Gly Asp Thr Asp Leu Glu Gly
210 215 220
Val Ala Gln Ala Ile Lys Thr Ala Lys Ala Ser Lys Lys Pro Thr Leu
225 230 235 240
Ile Arg Leu Thr Thr Ile Ile Gly Tyr Gly Ser Leu Gln Gln Gly Thr
245 250 255
His Gly Val His Gly Ala Pro Leu Lys Pro Asp Asp Ile Lys Gln Leu
260 265 270
Lys Glu Lys Phe Gly Phe Asp Pro Thr Lys Ser Phe Val Val Pro Gln
275 280 285
Glu Val Tyr Asp Tyr Tyr Gly Thr Leu Val Lys Lys Asn Gln Glu Leu
290 295 300
Glu Ser Glu Trp Asn Lys Thr Val Glu Ser Tyr Ile Gln Lys Phe Pro
305 310 315 320
Glu Glu Gly Ala Val Leu Ala Arg Arg Leu Lys Gly Glu Leu Pro Glu
325 330 335
Asp Trp Ala Lys Cys Leu Pro Thr Tyr Thr Ala Asp Asp Lys Pro Leu
340 345 350
Ala Thr Arg Lys Leu Ser Glu Met Ala Leu Ile Lys Ile Leu Asp Val
355 360 365
Val Pro Glu Leu Ile Gly Gly Ser Ala Asp Leu Thr Gly Ser Asn Leu
370 375 380
Thr Arg Ala Pro Asp Met Val Asp Phe Gln Pro Pro Gln Thr Gly Leu
385 390 395 400
Gly Asn Tyr Ala Gly Arg Tyr Ile Arg Tyr Gly Val Arg Glu His Gly
405 410 415
Met Gly Ala Ile Met Asn Gly Ile Ala Gly Phe Gly Ala Gly Phe Arg
420 425 430
Asn Tyr Gly Gly Thr Phe Leu Asn Phe Val Ser Tyr Ala Ala Gly Ala
435 440 445
Val Arg Leu Ser Ala Leu Ser His Leu Pro Val Ile Trp Val Ala Thr
450 455 460
His Asp Ser Ile Gly Leu Gly Glu Asp Gly Pro Thr His Gln Pro Ile
465 470 475 480
Glu Thr Leu Ala His Phe Arg Ala Thr Pro Asn Ile Ser Val Trp Arg
485 490 495
Pro Ala Asp Gly Asn Glu Val Ser Ala Ala Tyr Lys Ser Ala Ile Glu
500 505 510
Ser Thr Ser Thr Pro His Ile Leu Ala Leu Thr Arg Gln Asn Leu Pro
515 520 525
Gln Leu Ala Gly Ser Ser Val Glu Lys Ala Ser Thr Gly Gly Tyr Thr
530 535 540
Val Tyr Gln Thr Thr Asp Lys Pro Ala Val Ile Ile Val Ala Ser Gly
545 550 555 560
Ser Glu Val Ala Ile Ser Ile Asp Ala Ala Lys Lys Leu Glu Gly Glu
565 570 575
Gly Ile Lys Ala Asn Val Val Ser Leu Val Asp Phe His Thr Phe Asp
580 585 590
Lys Gln Pro Leu Asp Tyr Arg Leu Ser Val Leu Pro Asp Gly Val Pro
595 600 605
Ile Met Ser Val Glu Val Met Ser Ser Phe Gly Trp Ser Lys Tyr Ser
610 615 620
His Glu Gln Phe Gly Leu Asn Arg Phe Gly Ala Ser Gly Lys Ala Glu
625 630 635 640
Asp Leu Tyr Lys Phe Phe Asp Phe Thr Pro Glu Gly Val Ala Asp Arg
645 650 655
Ala Ala Lys Thr Val Gln Phe Tyr Lys Gly Lys Asp Leu Leu Ser Pro
660 665 670
Leu Asn Arg Ala Phe
675
<210> 57
<211> 1083
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 ACT1 基因
<400> 57
atgtgcaaag ccggttttgc cggtgacgac gcacctcgtg ctgtgttccc atctatcgtg 60
ggtagaccaa gacaccaggg tatcatggtc ggcatgggtc aaaaggactc ttatgttggt 120
gacgaggccc agtccaagag aggtattttg actttgagat accccattga gcatggtatc 180
gtgaacaact gggacgacat ggagaagatc tggcatcaca ccttctacaa cgagttgaga 240
gtcgcccctg aggaacaccc agtcttgttg accgaggctc caatgaaccc taagtccaac 300
agagagaaga tgactcaaat catgttcgag actttcaacg ttccggcttt ctacgtttcc 360
atccaggccg tcttgtcctt gtactcctcc ggtagaacca ctggtattgt tttagattct 420
ggtgacggtg ttactcactt ggttcctatc tatgctggat tctccatgcc tcacggtatt 480
ttgagattga acttggctgg tagagacttg accgactact tgatgaagat tttgtccgag 540
cgtggttaca ctttctccac cactgccgag agagaaattg tccgtgacat caaggagaaa 600
ttgtgctacg tcgccttgga ctttgagcag gagatgcaaa cgtcttctca atcttccgct 660
atcgagaaat cgtacgagtt gccagatgga caagtcatca ctattggtaa cgagagattt 720
agagctgccg aggccttgtt ccgtcctact gacttgggct tggaggctgt tggtatcgac 780
caaaccactt acaactctat catcaagtgt gacgtcgacg ttagaaagga gttgtacggt 840
aacattgtta tgtccggtgg tactacttta ttcccaggta ttgctgagcg tatgcaaaag 900
gagattaccg cgttggctcc ttcctccatg aaggtcaaga ttattgctcc acctgagaga 960
aagtactctg tatggattgg tggctccatc ttggcttcct tgtccacttt ccaacagatg 1020
tggatctcga agcaagagta cgacgagtct ggaccaacta tcgttcacca caagtgtttt 1080
taa 1083
<210> 58
<211> 1476
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 ARO8 基因
<400> 58
atgactaaac cacttgctaa ggatttgcag caccacttga gcacggaggc caagtcacgc 60
aagggcctgg cgcttaaggg cgcattcaag tactacaacc agcccgggat gacgtttctc 120
ggcggcggat tgccccttct ggactatttc ccctttgata aaatcactgc ggacgtgccg 180
ctggcgccgt tcccaaacgg atgtggtgcg agagtcaccg aatcagacaa aaccgtgatt 240
gaggtgcata agcggaaaca agacaacagt gacagcggct acgcggacgt tgagttggcg 300
cgtagtttgc agtacggata cacggaggga cacactgagc ttgtgcagtt cttacgtgac 360
cacaccgaca cgatccaccg cgtgccatat gaagattggg acgtgatcac caatgtgggc 420
aacacgcaag cgtgggacgc cgtgttgcgg acgtttacgc tgcgtggtga cgtgatcttg 480
gtggaagacc acaccttttc gctggccatg gagaccgcgc acgcgcacgg cgtcaccact 540
tatcccgtgg tgatggacac cgagggaatc gtgccatcgg cgttggagaa actcttggac 600
aactgggttg gcgcaaagcc gcgcatgctc tacacgatct gcacgggaca gaacccaact 660
ggatcgtgtc tcagtgggga acgccgccgc gaggtgtatc tgttggcaca gaaacatgat 720
ttgatcatca tcgaggacga gccgtactac ttcttgcaga tggagccata tacacgtgat 780
ttggcgcttc gcctgctgaa gcacgtgcac ggccatgagg agttcatcaa ggcgcttgtt 840
ccctcgttca tctcgatgga cgtggacgga cgtgtgctcc gactcgactc cgtgtcgaag 900
acgatcgctc caggcgcccg tttgggctgg gtcgtggggc agaaacgcct cttggagcga 960
ttcttgcgtt tgcacgaaac gtcgatccag aacgcttcgg gtttcacgca gctgctcttg 1020
aacggcttgt ttcaaagatg gggccagaag ggatacttgg actggttgat tggtatccgt 1080
gctgagtaca ctcacaagag ggacgtggca attgatgctt tatacaagta cttcccgcaa 1140
gaagtagtga cgattttgcc gcccgtggcc ggtatgttct ttgttgtcaa cttggacgcc 1200
agcaagcacc cgaaatttga ggagttgggc agcgacccgt tggctgtcga gaacagcctc 1260
tacgaggctg gcttggcgca cgggtgcttg atgattcctg gctcgtggtt caaggctgac 1320
ggcgagacca ccccgccaca agcgcctgtg cctgtggacg agctgttgaa gaacagcatt 1380
ttctttaggg gtacttacgc ggcagtaccc ttggacgagt tggaggttgg cttgaagaag 1440
tttggcgagg ctgtcaaggc cgagtttggt ttgtaa 1476
<210> 59
<211> 1848
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 ARO10 基因
<400> 59
atggcaccaa tcatcaccag ggcttcatcc gaagaaacaa caccccaaat tacagacgac 60
cagatccctt tgggggagta ccttttcctc agaatctgcc aggcaaatcc aaaacttcgc 120
tcggtgtttg gcattcccgg agacttcagt ttggcgttat tggagcatct ctataccaag 180
ctggtggcga aaaaagttga gtttgttggt ttctgtaacg agctcaatgc ggcatatgca 240
gcagatggat atgcaaagca tattgacggc ttgagtgtct tgcttacgac ttttggggtg 300
ggagaactat ccactttgaa cgccatagcc ggcgcattca cagagtacgc tccagtattg 360
catattgtcg gcaccacatc tacgaaacag gcggagcagt ccagggcggc aggcacgaga 420
gatgtaagaa acatccatca cttggtgcag aacaaaaacc cgctttgtgc gcccaatcac 480
gatgtatata agcccatggt ggaaagttta tctgtatgcc aggaatcctt ggacatgaat 540
ggcgacttga acttggaaaa gatcgataac gtcttgagaa tggtcacaaa tgagaggaga 600
ccagggtaca ttttcattcc gagcgatgtt tccgatatca tggtttccgc aggcaggttg 660
aatcagccgt tgacctttag tgaattgaca gatgagtctg cgttgaaaaa catggccctg 720
agaattttgg caaaacttta caattcaaag cacccttctg tacttggcga tgcattagca 780
gacaggtttg gggggcaaac tgctttggat aaccttgttg aaaagttacc atcgaatttc 840
gtcaagttgt tttccacgct tttggccaga aacatcgacg agactttacc gaactatatc 900
ggggtctaca gcggcaaatt gtcctccgat aagattgtca ttgacgaatt ggagagaaac 960
accgactttt tgttgaccct cggccatgct aacaatgaga tcaattccgg ggtatactca 1020
actgactttt ctgcaatcac cgagtatgtg gaggtgcatc cagattacat tctcattgat 1080
ggcgagtacg ttctcatcaa aaacgcagaa accggaaaga gattgttttc aattgttgat 1140
ttgcttacta agcttgtctc agatttcgat gcatcgaaga tgattcacaa caatcatgct 1200
gttaacaaca ttagagcgag gcgcgaaacc aagcagtttt cgtcattgga tacggtttcg 1260
cctggagtga tcacgcaaaa caagttggtt gattttttca atgactactt gcggccaaac 1320
gatatcttgt tgtgcgatac atgcagtttt ctttttggtg tgttcgagct taagttcccg 1380
aggggcgtca agtttattgc acaaacctta tacgaatcga tcgggtatgc acttcccgcg 1440
acttttggcg ctgcaagggc cgaaagggat ttgggcacga acagaagagt ggtgttgata 1500
cagggagatg gttctgccca aatgacaatc caggaatggt ccacatattt gagatacgac 1560
attctgtcgc cagaaatctt tttgctcaac aacgagggct acacggttga aaggatgatc 1620
aaagggccca ctcggtccta taacgatatt caggacactt ggaaatggac ggaatttttc 1680
aagattttcg gcgacgaaga ctgcgagaag catgaggctg aaaaagtcaa caccacaaac 1740
gaattggaag ctttgactag gcgcaaaaca agcgagaaga tccgcttgta tgaactcaag 1800
ttgagcaaat tagacattgt ggacaaattt cggatcttgc gtgaatag 1848
<210> 60
<211> 1113
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 GPD1 基因
<400> 60
atgaccgcta ctgctccttt caagatcgaa tcccccttca gaattgccat catcggctcc 60
ggtaactggg gtaccgccgt ggccaagctt gtggctgaga acaccgctga gaagccggaa 120
atcttccaga aacaggtgaa catgtgggtg tttgaggagg acatcaacgg ccgcaaattg 180
accgagatca tcaacactga ccatgagaac gtcaagtaca tgccagaggt gaagttgcca 240
gaaaacttgg ttgcaaaccc agacattgag gccaccgtca aggatgctga cctccttatt 300
ttcaacatcc cccaccagtt cttgccaaga gtgtgcaagc aattggttgg caaggtttcg 360
cctaccgcca gagccatttc ctgtcttaag ggcttggagg tggatgcctc tggctgcaaa 420
ttgttgtcgc agtccatcac cgacaccttg ggcatctact gtggtgtctt gtccggtgcc 480
aacatcgcca acgaggtggc tagaggccgc tggtccgaga cctccatcgc ctacaacaga 540
cccaccgact tccgtggcga gggcaaggat atctgtgagt ttgtgttgaa ggaggccttc 600
cacagaagat acttccacgt gcgcgtgatc aaggacgtta ttggcgcctc gatcgccggt 660
gcgttgaaga acgttgtggc cattgccgcc ggcttcgtcg aaggtgaggg ctggggtgac 720
aatgccaagt ctgccatcat gagaatcggc ctcaaggaga ccattcactt tgcctcgtac 780
tgggagaagt ttggcatcca gggtctttct gctcctgagc ctaccacctt caccgaggag 840
tctgccggtg ttgccgactt gatcaccacg tgttccggtg gtagaaacgt caaggttgcc 900
agatacatga ttgagaagaa tgtcgacgct tgggaggctg agaaggcctt gttgaacggc 960
cagtcctcgc aaggtatcat caccgccaag gaggtgcacg agttgttggt gaactacaag 1020
ttgcaagagg agttcccatt gttcgaggcc acctacgctg tcatttacga gaacgccgat 1080
gtcaacacct ggcctacgat tttggccgag taa 1113
<210> 61
<211> 1635
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 GXF1 基因
<400> 61
atgtctcaag acgaacttca tacaaagtct ggtgttgaaa caccaatcaa cgattcgctt 60
ctcgaggaga agcacgatgt caccccactc gcggcattgc ccgagaagtc cttcaaggac 120
tacatttcca tttccatttt ctgtttgttt gtggcatttg gtggttttgt tttcggtttc 180
gacaccggta cgatttccgg tttcgtcaac atgtccgact tcaagaccag atttggtgag 240
atgaatgccc agggcgaata ctacttgtcc aatgttagaa ctggtttgat ggtttctatt 300
ttcaacgtcg gttgcgccgt tggtggtatc ttcctttgta agattgccga tgtttatggc 360
agaagaattg gtcttatgtt ttccatggtg gtttatgtcg ttggtatcat tattcagatt 420
gcctccacca ccaaatggta ccaatacttc attggccgtc ttattgctgg cttggctgtg 480
ggtactgttt ccgtcatctc gccacttttc atttccgagg ttgctcctaa acagctcaga 540
ggtacgcttg tgtgctgctt ccagttgtgt atcaccttgg gtatcttttt gggttactgc 600
acgacctacg gtacaaagac ttacactgac tccagacagt ggagaatccc attgggtatc 660
tgtttcgcgt gggctttgtt tttggtggcc ggtatgttga acatgcccga gtctcctaga 720
tacttggttg agaaatcgag aatcgacgat gccagaaagt ccattgccag atccaacaag 780
gtttccgagg aagaccccgc cgtgtacacc gaggtgcagc ttatccaggc tggtattgac 840
agagaggccc ttgccggcag cgccacatgg atggagcttg tgactggtaa gcccaaaatc 900
ttcagaagag tcatcatggg tgtcatgctt cagtccttgc aacaattgac tggtgacaac 960
tactttttct actacggaac cacgattttc aaggctgttg gcttgcagga ctctttccag 1020
acgtcgatta tcttgggtat tgtcaacttt gcctcgactt ttgtcggtat ttacgccatt 1080
gagagaatgg gcagaagatt gtgtttgttg accggatctg cgtgcatgtt tgtgtgtttc 1140
atcatctact cgctcattgg tacgcagcac ttgtacaaga acggcttctc taacgaacct 1200
tccaacacat acaagccttc cggtaacgcc atgatcttca tcacgtgtct ttacattttc 1260
ttctttgcct cgacctgggc cggtggtgtt tactgtatcg tgtccgagtc ttacccattg 1320
agaatcagat ccaaggccat gtctgtcgcc accgccgcca actggatgtg gggtttcttg 1380
atctcgttct tcacgccttt catcacctcc gccatccact tttactacgg ttttgttttc 1440
actggctgct tggcgttctc cttcttctac gtctacttct ttgtcgtgga gaccaagggt 1500
ctttccttgg aggaggttga cattttgtac gcttccggta cgcttccatg gaagtcctct 1560
ggctgggtgc ctcctaccgc ggacgaaatg gcccacaacg ccttcgacaa caagccaact 1620
gacgaacaag tctaa 1635
<210> 62
<211> 1647
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 GXF2 基因
<400> 62
atgagtgccg aacaggaaca acaagtatcg ggcacatctg ccacgataga tgggctggcg 60
tccttgaagc aagaaaaaac cgccgaggag gaagacgcct tcaagcctaa gcccgccacg 120
gcgtactttt tcatttcgtt cctctgtggc ttggtcgcct ttggcggcta cgttttcggt 180
ttcgataccg gcacgatttc cgggtttgtt aacatggacg actatttgat gagattcggc 240
cagcagcacg ctgatggcac gtattacctt tccaacgtga gaaccggttt gatcgtgtcg 300
atcttcaaca ttggctgtgc cgtcggtggt cttgcgcttt cgaaagttgg tgacatctgg 360
ggcagaagaa ttggtattat ggttgctatg atcatctaca tggtgggaat catcatccag 420
atcgcttcac aggataaatg gtaccagtac ttcattggcc gtttgatcac cgggttgggt 480
gtcggcacca cgtccgtgct cagtcctctt ttcatctccg agtcggctcc gaagcatttg 540
agaggcaccc ttgtgtgttg tttccagctc atggtcacct tgggtatctt tttgggctac 600
tgcacgacct acggtaccaa gaactacact gactcgcgcc agtggcggat tcccttgggt 660
ctttgctttg catgggcgct tttgttgatc tcgggaatgg ttttcatgcc cgaatcccca 720
cgtttcttga ttgaacgcca gagattcgac gaggcgaagg cctccgtggc caaatcgaac 780
caggtctcga ccgaggaccc cgccgtgtac actgaagtgg agttgatcca ggccggtatt 840
gaccgtgagg cattggccgg atccgctggc tggaaagagc ttatcacggg caagcccaag 900
atgttgcagc gtgtgatttt gggaatgatg ctccagtcga tccagcagct caccggtaac 960
aactactttt tctactacgg taccacgatc ttcaaggccg tgggcatgtc ggactcgttc 1020
cagacctcga ttgttttggg tattgtcaac ttcgcctcca cttttgtcgg aatctgggcc 1080
atcgagcgta tgggccgcag atcttgtttg cttgttggtt ccgcgtgcat gagtgtgtgt 1140
ttcttgatct actccatctt gggttccgtc aacctttaca tcgacggcta cgagaacacg 1200
ccttcgaaca cgcgtaagcc taccggtaac gccatgatct tcatcacgtg tttgtttatc 1260
ttcttcttcg cctccacctg ggccggtggt gtgtacagta ttgtttctga aacataccca 1320
ttgagaatcc ggtctaaagg tatggccgtg gccaccgctg ccaactggat gtggggtttc 1380
ttgatttcgt tcttcacgcc tttcatcacc tcggccatcc acttctacta cgggtttgtg 1440
ttcacagggt gtcttatttt ctccttcttc tacgtgttct tctttgttag ggaaaccaag 1500
ggtctctcgt tggaagaggt ggatgagtta tatgccactg acctcccacc atggaagacc 1560
gcgggctgga cgcctccttc tgctgaggat atggcccaca ccaccgggtt tgccgaggcc 1620
gcaaagccta cgaacaaaca cgtttaa 1647
<210> 63
<211> 1647
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 GXS1 基因
<400> 63
atgagcatct ttgaaggcaa agacgggaag ggggtatcct ccaccgagtc gctttccaat 60
gacgtcagat atgacaacat ggagaaagtt gatcaggatg ttcttagaca caacttcaac 120
tttgacaaag aattcgagga gctcgaaatc gaggcggcgc aagtcaacga caaaccttct 180
tttgtcgaca ggattttatc cctcgaatac aagcttcatt tcgaaaacaa gaaccacatg 240
gtgtggctct tgggcgcttt cgcagccgcc gcaggcttat tgtctggctt ggatcagtcc 300
attatttctg gtgcatccat tggaatgaac aaagcattga acttgactga acgtgaagcc 360
tcattggtgt cttcgcttat gcctttaggc gccatggcag gctccatgat tatgacacct 420
cttaatgagt ggttcggaag aaaatcatcg ttgattattt cttgtatttg gtataccatc 480
ggatccgctt tgtgcgctgg cgccagagat caccacatga tgtacgctgg cagatttatt 540
cttggtgtcg gtgtgggtat agaaggtggg tgtgtgggca tttacatttc cgagtctgtc 600
ccagccaatg tgcgtggtag tatcgtgtcg atgtaccagt tcaatattgc tttgggtgaa 660
gttctagggt atgctgttgc tgccattttc tacactgttc atggtggatg gaggttcatg 720
gtggggtctt ctttagtatt ctctactata ttgtttgccg gattgttttt cttgcccgag 780
tcacctcgtt ggttggtgca caaaggcaga aacggaatgg catacgatgt gtggaagaga 840
ttgagagaca taaacgatga aagcgcaaag ttggaatttt tggagatgag acaggctgct 900
tatcaagaga gagaaagacg ctcgcaagag tctttgttct ccagctgggg cgaattattc 960
accatcgcta gaaacagaag agcacttact tactctgtca taatgatcac tttgggtcaa 1020
ttgactggtg tcaatgccgt catgtactac atgtcgactt tgatgggtgc aattggtttc 1080
aacgagaaag actctgtgtt catgtccctt gtgggaggcg gttctttgct tataggtacc 1140
attcctgcca ttttgtggat ggaccgtttc ggcagaagag tttggggtta taatcttgtt 1200
ggtttcttcg ttggtttggt gctcgttggt gttggctacc gtttcaatcc cgtcactcaa 1260
aaggcggctt cagaaggtgt gtacttgacg ggtctcattg tctatttctt gttctttggt 1320
tcctactcga ccttaacttg ggtcattcca tccgagtctt ttgatttgag aacaagatct 1380
ttgggtatga caatctgttc cactttcctt tacttgtggt ctttcaccgt cacctacaac 1440
ttcaccaaga tgtccgccgc cttcacatac actgggttga cacttggttt ctacggtggc 1500
attgcgttcc ttggtttgat ttaccaggtc tgcttcatgc ccgagacgaa ggacaagact 1560
ttggaagaaa ttgacgatat cttcaatcgt tctgcgttct ctatcgcgcg cgagaacatc 1620
tccaacttga agaagggtat ttggtaa 1647
<210> 64
<211> 1887
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 HGT19 基因
<400> 64
atgtcagaaa agcctgttgt gtcgcacagc atcgacacga cgctgtctac gtcatcgaaa 60
caagtctatg acggtaactc gcttcttaag accctgaatg agcgcgatgg cgaacgcggc 120
aatatcttgt cgcagtacac tgaggaacag gccatgcaaa tgggccgcaa ctatgcgttg 180
aagcacaatt tagatgcgac actctttgga aaggcggccg cggtcgcaag aaacccatac 240
gagttcaatt cgatgagttt tttgaccgaa gaggaaaaag tcgcgcttaa cacggagcag 300
accaagaaat ggcacatccc aagaaagttg gtggaggtga ttgcattggg gtccatggcc 360
gctgcggtgc agggtatgga tgagtcggtg gtgaatggtg caacgctttt ctaccccacg 420
gcaatgggta tcacagatat caagaatgcc gatttgattg aaggtttgat caacggtgcg 480
ccctatcttt gctgcgccat catgtgctgg acatctgatt actggaacag gaagttgggc 540
cgtaagtgga ccattttctg gacatgtgcc atttctgcaa tcacatgtat ctggcaaggt 600
ctcgtcaatt tgaaatggta ccatttgttc attgcgcgtt tctgcttggg tttcggtatc 660
ggtgtcaagt ctgccaccgt gcctgcgtat gctgccgaaa ccaccccggc caaaatcaga 720
ggctcgttgg tcatgctttg gcagttcttc accgctgtcg gaatcatgct tggttacgtg 780
gcgtctttgg cattctatta cattggtgac aatggcattt ctggcggctt gaactggaga 840
ttgatgctag gatctgcatg tcttccagct atcgttgtgt tagtccaagt tccgtttgtt 900
ccagaatccc ctcgttggct catgggtaag gaaagacacg ctgaagcata tgattcgctc 960
cggcaattgc ggttcagtga aatcgaggcg gcccgtgact gtttctacca gtacgtgttg 1020
ttgaaagagg agggctctta tggaacgcag ccattcttca gcagaatcaa ggagatgttc 1080
accgtgagaa gaaacagaaa tggtgcattg ggcgcgtgga tcgtcatgtt catgcagcag 1140
ttctgtggaa tcaacgtcat tgcttactac tcgtcgtcga tcttcgtgga gtcgaatctt 1200
tctgagatca aggccatgtt ggcgtcttgg gggttcggta tgatcaattt cttgtttgca 1260
attccagcgt tctacaccat tgacacgttt ggccgacgca acttgttgct cactactttc 1320
cctcttatgg cggtattctt actcatggcc ggattcgggt tctggatccc gttcgagaca 1380
aacccacacg gccgtttggc ggtgatcact attggtatct atttgtttgc atgtgtctac 1440
tctgcgggcg agggaccagt tcccttcaca tactctgccg aagcattccc gttgtatatc 1500
cgtgacttgg gtatgggctt tgccacggcc acgtgttggt tcttcaactt cattttggca 1560
ttttcctggc ctagaatgaa gaatgcattc aagcctcaag gtgcctttgg ctggtatgcc 1620
gcctggaaca ttgttggctt cttcttagtg ttatggttct tgcccgagac aaagggcttg 1680
acgttggagg aattggacga agtgtttgat gtgcctttga gaaaacacgc gcactaccgt 1740
accaaagaat tagtatacaa cttgcgcaaa tacttcttga ggcagaaccc taagccattg 1800
ccgccacttt atgcacacca aagaatggct gttaccaacc cagaatggtt ggaaaagacc 1860
gaggtcacgc acgaggagaa tatctag 1887
<210> 65
<211> 1575
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 HXT2.6 基因
<400> 65
atgctgagca ctaccgatac cctcgaaaaa agggacaccg agcctttcac ttcagatgct 60
cctgtcacag tccatgacta tatcgcagag gagcgtccgt ggtggaaagt gccgcatttg 120
cgtgtattga cttggtctgt tttcgtgatc accctcacct ccaccaacaa cgggtatgat 180
ggcctgatgt tgaatggatt gcaatccttg gacatttggc aggaggattt gggtcaccct 240
gcgggccaga aattgggtgc cttggccaac ggtgttttgt ttggtaacct tgctgctgtg 300
ccttttgctt cgtatttctg cgatcgtttt ggtagaaggc cggtcatttg tttcggacag 360
atcttgacaa ttgttggtgc tgtattacaa ggtttgtcca acagctatgg attttttttg 420
ggttcgagaa ttgtgttggg ttttggtgct atgatagcca ctattccgct gccaacattg 480
atttccgaaa tcgcctaccc tacgcataga gaaacttcca ctttcgccta caacgtgtgc 540
tggtatttgg gagccattat cgcctcctgg gtcacatacg gcaccagaga tttacagagc 600
aaggcttgct ggtcaattcc ttcttatctc caggccgcct tacctttctt tcaagtgtgc 660
atgatttggt ttgtgccaga gtctcccaga ttcctcgttg ccaagggcaa gatcgaccaa 720
gcaagggctg ttttgtctaa ataccataca ggagactcga ctgaccccag agacgttgcg 780
ttggttgact ttgagctcca tgagattgag agtgcattgg agcaggaaaa attgaacact 840
cgctcgtcat actttgactt tttcaagaag agaaacttta gaaagagagg cttcttgtgt 900
gtcatggtcg gtgttgcaat gcagctttct ggaaacggct tagtgtccta ttacttgtcg 960
aaagtgctag actcgattgg aatcactgaa accaagagac agctcgagat caatggctgc 1020
ttgatgatct ataactttgt catctgcgtc tcgttgatga gtgtttgccg tatgttcaaa 1080
agaagagtat tatttctcac gtgtttctca ggaatgacgg tttgctacac gatatggacg 1140
attttgtcag cgcttaatga acagagacac tttgaggata aaggcttggc caatggcgtg 1200
ttggcaatga tcttcttcta ctattttttc tacaacgttg gcatcaatgg attgccattc 1260
ctatacatca ccgagatctt gccttactca cacagagcaa aaggcttgaa tttattccaa 1320
ttctcgcaat ttctcacgca aatctacaat ggctatgtga acccaatcgc catggacgca 1380
atcagctgga agtattacat tgtgtactgc tgtattctct tcgtggagtt ggtgattgtg 1440
tttttcacgt tcccagaaac ttcgggatac actttggagg aggtcgccca ggtatttggt 1500
gatgaggctc ccgggctcca caacagacaa ttggatgttg cgaaagaatc actcgagcat 1560
gttgagcatg tttga 1575
<210> 66
<211> 1647
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 HXT5 基因
<400> 66
atgagcatct ttgaaggcaa agacgggaag ggggtatcct ccaccgagtc gctttccaat 60
gacgtcagat atgacaacat ggagaaagtt gatcaggatg ttcttagaca caacttcaac 120
tttgacaaag aattcgagga gctcgaaatc gaggcggcgc aagtcaacga caaaccttct 180
tttgtcgaca ggattttatc cctcgaatac aagcttcatt tcgaaaacaa gaaccacatg 240
gtgtggctct tgggcgcttt cgcagccgcc gcaggcttat tgtctggctt ggatcagtcc 300
attatttctg gtgcatccat tggaatgaac aaagcattga acttgactga acgtgaagcc 360
tcattggtgt cttcgcttat gcctttaggc gccatggcag gctccatgat tatgacacct 420
cttaatgagt ggttcggaag aaaatcatcg ttgattattt cttgtatttg gtataccatc 480
ggatccgctt tgtgcgctgg cgccagagat caccacatga tgtacgctgg cagatttatt 540
cttggtgtcg gtgtgggtat agaaggtggg tgtgtgggca tttacatttc cgagtctgtc 600
ccagccaatg tgcgtggtag tatcgtgtcg atgtaccagt tcaatattgc tttgggtgaa 660
gttctagggt atgctgttgc tgccattttc tacactgttc atggtggatg gaggttcatg 720
gtggggtctt ctttagtatt ctctactata ttgtttgccg gattgttttt cttgcccgag 780
tcacctcgtt ggttggtgca caaaggcaga aacggaatgg catacgatgt gtggaagaga 840
ttgagagaca taaacgatga aagcgcaaag ttggaatttt tggagatgag acaggctgct 900
tatcaagaga gagaaagacg ctcgcaagag tctttgttct ccagctgggg cgaattattc 960
accatcgcta gaaacagaag agcacttact tactctgtca taatgatcac tttgggtcaa 1020
ttgactggtg tcaatgccgt catgtactac atgtcgactt tgatgggtgc aattggtttc 1080
aacgagaaag actctgtgtt catgtccctt gtgggaggcg gttctttgct tataggtacc 1140
attcctgcca ttttgtggat ggaccgtttc ggcagaagag tttggggtta taatcttgtt 1200
ggtttcttcg ttggtttggt gctcgttggt gttggctacc gtttcaatcc cgtcactcaa 1260
aaggcggctt cagaaggtgt gtacttgacg ggtctcattg tctatttctt gttctttggt 1320
tcctactcga ccttaacttg ggtcattcca tccgagtctt ttgatttgag aacaagatct 1380
ttgggtatga caatctgttc cactttcctt tacttgtggt ctttcaccgt cacctacaac 1440
ttcaccaaga tgtccgccgc cttcacatac actgggttga cacttggttt ctacggtggc 1500
attgcgttcc ttggtttgat ttaccaggtc tgcttcatgc ccgagacgaa ggacaagact 1560
ttggaagaaa ttgacgatat cttcaatcgt tctgcgttct ctatcgcgcg cgagaacatc 1620
tccaacttga agaagggtat ttggtaa 1647
<210> 67
<211> 1254
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 PGK1 基因
<400> 67
atgtctttat ctaacaaatt gtctgtgaaa gacttggacc tcgctaacaa gagagtcttc 60
atcagagtcg acttcaacgt tcctcttgac ggaaccacca tcaccaacaa ccagagaatt 120
gttgctgctt tgccaaccat caaatacgtc ttggagcaga agccaaaggc cgtcatcttg 180
gcttcccact tgggcagacc aaacggtgag agagttgaga agtactcgtt ggctccagtt 240
gccaaggaat tgcagtcctt gttgtctgac cagaaggtca cattcttgaa cgacagcgtt 300
ggacctgagg tcgagaaggc tgtcaacagc gcctctcagg gcgaggtgtt cttgttggag 360
aacttgcgtt accacatcga ggaggaaggc tccaagaagg tcgacggcaa caaggtcaag 420
gcttccaagg aggatgtcga gaagttcaga caaggattga ccgccttggc cgacgtctac 480
gtcaacgacg ctttcggtac cgcccacaga gcccactctt ctatggttgg tcttgaattg 540
cctcagaagg ctgccggttt cttgatggcc aaggagttgg agtacttcgc caaggccttg 600
gagaacccta ccagaccatt cttggccatc ttgggtggtg ccaaggtctc cgacaagatc 660
cagttgatcg acaacttgtt ggacaaggtc gacatcttga ttgttggtgg tggtatggct 720
ttcaccttca agaaggtttt ggacaacatg ccaattggta cttctctttt cgacgaggcc 780
ggctccaaga acgtcgagaa cttgattgcc aaggctaaga agaacaacgt cgagattgtc 840
ttgcccgttg actttgtcac cgctgacgac ttcaacaagg atgccaacac tggtgttgcc 900
acccaagagg agggtatccc agacggatgg atgggtcttg atgccggtcc aaagtccaga 960
gaactctttg ctgaggctgt tgctaaggcc aagaccattg tctggaacgg cccaccaggt 1020
gttttcgagt ttgagaaatt cgctcagggc accaagtcct tgttggacgc tgccgtcaag 1080
tccgccgagg ctggcaacac cgtcatcatt ggcggtggtg acactgccac tgttgccaag 1140
aagttcggtg tcgttgagaa gttgtctcac gtctccactg gtggtggtgc ctccttggag 1200
ttgttggagg gtaaggagtt gccaggtgtc gttgccattt ctgacaagca gtaa 1254
<210> 68
<211> 1692
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 QUP2 基因
<400> 68
atgggctttc gcaacttaaa gcgcaggctc tcaaatgttg gcgactccat gtcagtgcac 60
tctgtgaaag aggaggaaga cttctcccgc gtggaaatcc cggatgaaat ctacaactat 120
aagatcgtcc ttgtggcttt aacagcggcg tcggctgcca tcatcatcgg ctacgatgca 180
ggcttcattg gtggcacggt ttcgttgacg gcgttcaaac tggaatttgg cttggacaaa 240
atgtctgcga cggcggcttc tgctatcgaa gccaacgttg tttccgtgtt ccaggccggc 300
gcctactttg ggtgtctttt cttctatccg attggcgaga tttggggccg taaaatcggt 360
cttcttcttt ccggctttct tttgacgttt ggtgctgcta tttctttgat ttcgaactcg 420
tctcgtggcc ttggtgccat atatgctgga agagtactaa caggtttggg gattggcgga 480
tgtctgagtt tggccccaat ctacgtttct gaaatcgcgc ctgcagcaat cagaggcaag 540
cttgtgggct gctgggaagt gtcatggcag gtgggcggca ttgttggcta ctggatcaat 600
tacggagtct tgcagactct tccgattagc tcacaacaat ggatcatccc gtttgctgta 660
caattgatcc catcggggct tttctggggc ctttgtcttt tgattccaga gctgccacgt 720
tttcttgtat cgaagggaaa gatcgataag gcgcgcaaaa acttagcgta cttgcgtgga 780
cttagcgagg accaccccta ttctgttttt gagttggaga acattagtaa ggccattgaa 840
gagaacttcg agcaaacagg aaggggtttt ttcgacccat tgaaagcttt gtttttcagc 900
aaaaaaatgc tttaccgcct tctcttgtcc acgtcaatgt tcatgatgca gaatggctat 960
ggaatcaatg ctgtgacata ctactcgccc acgatcttca aatccttagg cgttcagggc 1020
tcaaacgccg gtttgctctc aacaggaatt ttcggtcttc ttaaaggtgc cgcttcggtg 1080
ttctgggtct ttttcttggt tgacacattc ggccgccggt tttgtctttg ctacctctct 1140
ctcccctgct cgatctgcat gtggtatatt ggcgcataca tcaagattgc caacccttca 1200
gcgaagcttg ctgcaggaga cacagccacc accccagcag gaactgcagc gaaagcgatg 1260
ctttacatat ggacgatttt ctacggcatt acgtggaatg gtacgacctg ggtgatctgc 1320
gcggagattt tcccccagtc ggtgagaaca gccgcgcagg ccgtcaacgc ttcttctaat 1380
tggttctggg ctttcatgat cggccacttc actggccagg cgctcgagaa tattgggtac 1440
ggatactact tcttgtttgc ggcgtgctct gcaatcttcc ctgtggtagt ctggtttgtg 1500
taccccgaaa caaagggtgt gcctttggag gccgtggagt atttgttcga ggtgcgtcct 1560
tggaaagcgc actcatatgc tttggagaag taccagattg agtacaacga gggtgaattc 1620
caccaacata agcccgaagt actcttacaa gggtctgaaa actcggacac gagcgagaaa 1680
agcctcgcct ga 1692
<210> 69
<211> 5157
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 RPB1 基因
<400> 69
atggaccaga caaccaagaa acccagagat ggtggcttga acgatccacg tttgggctcc 60
atcgaccgta acttcaagtg tcaaacctgt ggcgaagata tggctgaatg tccgggccat 120
tttggccaca ttgagttggc caagcccgtg tttcacatcg gttttattgc caagatcaag 180
aaagtgtgcg agtgtgtttg tatgcactgt ggaaaacttc ttgttgacga tgctaacccc 240
ttgatggctc aggccattcg gatcagggat ccgaagaagc gcttcaacgc cgtgtggaac 300
gtgtccaaga ccaagatggt gtgtgaagca gacactatca atgaagaagg ccaggtcaca 360
gccgggagag gaggatgtgg ccacacgcag ccaactgtgc gcagagacgg cttgaagttg 420
tggggtactt ggaaacagaa caaaacttac gacgagaacg aacagccaga acgtcgtttg 480
ttaagtccat cagagatttt gagcgttttc agacacatca gccccgagga ctgtcataag 540
ttgggcttta acgaggacta tgccagacct gagtggatgt tgatcacggt tttgcctgtc 600
ccaccaccac cagtgaggcc ttccattgcc tttaacgata cggctagagg tgaggatgat 660
ttgacgttca agttggctga cattctcaaa gcaaatatca acgtacagcg tcttgaaatc 720
gacggttcgc cacagcacgt catcagtgag ttcgaggctt tgttacagtt tcatgtggcg 780
acttacatgg ataatgatat cgctggccag cctcaggcgc ttcaaaagac cggtcgtcct 840
atcaaatcga tcagagccag attgaagggt aaagagggga gattgagagg taacttgatg 900
ggcaaacgtg tggacttttc tgcgcgtact gttatttctg gtgaccccaa tctcgacctt 960
gaccaggtcg gtgtgcctat atccattgct aggactttga cttatcctga ggttgtcacc 1020
ccatacaaca ttcacaaatt gaccgagtat gttcgcaatg gccctaatga gcaccctggt 1080
gcgaaatatg tcattcgtga caccggtgac cgtattgatc taatgtacaa caaaagggcg 1140
ggtgacattg ccttgcagta tgggtggaag gttgaacgtc atttgatgga cgacgatcca 1200
gttttgttta atcgtcaacc ctccttgcat aagatgtcca tgatggcaca tcgagtcaaa 1260
gtcatgccct actccacatt cagattgaat ttgtccgtca cttctcctta caatgctgat 1320
ttcgatggtg atgagatgaa cttacatgtt cctcagtcgc ctgagaccag agccgagatg 1380
tctcaaattt gcgcggttcc gcttcaaatc gtctctccac aatcgaacaa acctgtgatg 1440
ggtattgtgc aagacacatt gtgtggtatc cgtaaaatga cattacgcga caatttcatt 1500
gaatatgagc aagtcatgaa catgttgtac tggatcccta actgggatgg tgtcattcct 1560
ccgccggcgg tactcaagcc caagccattg tggtcgggta aacagttgtt gtctatggcc 1620
attcccaagg gtattcactt gcagaggttc gatgacggaa gggacatgct cagtccaaaa 1680
gatctgggga tgttgattgt tgacggtgag atcatctttg gtgttgttga caaaaaaacc 1740
gtcggcgcca ctggaggcgg attgatccac acggtcatga gagagaaggg tccatacgtc 1800
tgtgcgcagc ttttcagctc gatccagaag gttgtcaatt attggctttt gcataatggt 1860
ttctctatcg gtattggtga cacaattgcc gacaaagaca ccatgcgtga tgtgacaacg 1920
accattcaag aggccaaaca gaaggtccag gaaatcatca ttgacgccca gcaaaacaag 1980
ttggagcctg aacccggtat gactctcaga gaatcgttcg agcataatgt ttcccgtatt 2040
ctcaatcaag ctcgtgatac tgctggccgt tccgctgaaa tgaacttgaa ggatctgaac 2100
aacgtgaaac agatggtcac atccggatcg aaaggttctt tcatcaacat ctctcaaatg 2160
tctgcctgtg tcggtcaaca aattgttgag ggtaagcgta ttcccttcgg ttttggtgat 2220
cgtacgttac ctcattttac caaggatgac tactcgcctg aatcgaaggg ttttgttgag 2280
aactcgtacc tcagaggctt gactccccag gagtttttct ttcacgctat ggcaggaaga 2340
gaaggtctta ttgatactgc cgtcaagact gcagaaacag gttacatcca gcgtcgttta 2400
gtcaaagctt tggaagatat tatggtgcat tatgatggca caaccagaaa ctctttaggc 2460
gacatcatcc agtttgttta tggtgaggac ggaattgatg ctacatcggt tgaaaagcaa 2520
tcagttgata ctatacccgg ttcagactcc tcgtttgaga agcgctacag aattgacgtt 2580
ttggacccag ctaaatccat tcctgagtcg ttgctagagt caggcaagca aatcaaggga 2640
gatgtggcag ttcagaaggt gttggatgaa gagtacgacc aattgctcaa ggatcgtaag 2700
ttcttgagag aggttgtttt ccccaatggt gactacaact ggccattacc cgttaatttg 2760
cgtcgtatta ttcaaaatgc tcagcagatt ttccacagtg gccgtcaaaa agcttccgac 2820
ttaagattgg aagagatagt cgaaggcgtg cagtcccttt gtaccaagct tcttgttctc 2880
cgaggaaaga cggagctcat caaggaggcg caggaaaatg cgactttgct tttccagtgc 2940
ttgttgagat ctaggttggc tgctcgtcgt gtcattgagg agttcaagct caataaggtc 3000
tcttttgaat gggtatgtgg tgaaatcgag tcccagtttc agaagtctat tgtacaccca 3060
ggtgagatgg ttggtgttgt cgctgcgcag tctatcggtg agcctgcgac gcagatgact 3120
ttaaacacct tccattacgc cggtgtctct tccaaaaacg ttacccttgg tgtccctcgt 3180
cttaaggaaa ttttgaatgt ggcgaaaaac atcaaaacgc cggctcttac cgtgtacttg 3240
gagcccgaga tcgctgttga cattgaaaag gccaaggttg ttcaatcggc tattgaacac 3300
accacgttga agaacgtgac ctcgtccaca gaaatctact acgatcctga tcctagaagc 3360
accgtgattg aggaagatta tgatactgtt gaagcttact ttgccattcc cgacgagaag 3420
gtcgaggaaa ctatcgacaa tcagtctcca tggttgcttc gtcttgaatt ggacagagcc 3480
aaaatgttgg ataagcaact tacgatggct caagtggccg agaagatttc gcagaacttt 3540
ggagaagact tgttcgttat ttggtctgat gacactgcag acaagttgat catccgttgt 3600
cgtgttatcc gcgatccaaa attggaagag gaaggcgagc acgaggagga ccaaattttg 3660
aagagagtgg aggcccacat gttggagaca atctcattgc gtggtatccc tggtatcacg 3720
agagtcttta tgatgcaaca taagatgagc acgccagatg cggatggtga atttctgcaa 3780
aagcaagaat gggttttgga aactgatggt gtaaacttgg ccgaggtcat cactgttcct 3840
ggcgtcgatg catcccgaac ctattccaac aacttcatcg agattctttc tgtgctcggt 3900
attgaggcga ctcgtactgc tttgttcaag gaaattctca atgtcattgc atttgacggt 3960
tcatacgtca actaccgtca tatggctttg cttgtggacg tcatgactgc acgtggtcat 4020
ttgatggcta tcacccgtca tggtattaac agagcggaaa ctggtgcttt gatgcgttgt 4080
tcttttgaag agacggttga gatcttgttg gatgctggtg ccgctgctga actagatgac 4140
tgccgtggta tctccgagaa tgtcatatta ggacaaatgc cacctttggg taccggtgct 4200
tttgatgtga tggtcgacga gaagatgttg caggacgcaa gtgtgagttc tgatattggt 4260
gttgctggtc agactgacgg aggtgcgacg ccatatagag actatgagat ggaggatgat 4320
aagattcaat ttgaggaagg tgcgggattc tcgccaattc ataccgcaaa tgtatctgat 4380
gcctctgggt ctttaacctc gtacggcggg caaccatcca tggtatcacc tacctcgcca 4440
ttctcgtttg gcgccacgtc tcctgggtat ggcggtgtga cctcgcctgc gtacggcgca 4500
acttcgccaa cgtactcacc aacgtcacca acatactcgc caacttcgcc cagttactca 4560
ccgacgtcac caagttactc accgacgtca ccaagttact caccgacgtc accaagttac 4620
tcaccgacgt caccaagtta ctcgccaaca tcgccaagtt attcgccaac ttcaccaagt 4680
tattcgccaa cttcgccaag ttactcgcca acttcgccaa gttattcgcc tacttcgcca 4740
agttattcgc caacttcgcc aagttactca ccgacgtcac caagttactc accgacgtca 4800
ccaagttact caccgacgtc accaagttac tcgcctactt cgccaagtta ctcgcctact 4860
tcgccaagtt actcacctac ttcgccaagt tattcgccta cttcgcctag ttactcacct 4920
acttcgccgc agtattcgcc aacttcgcct agttactctc cgacgtcgcc gcagtattcg 4980
ccaacttcgc caagctactc gcctacgtca ccgcaatacc tgccaacgtc gccaagttac 5040
tcgcccactt cgcctcaata ctctccaact tcgcctcaat actcgccggg ctcaccggca 5100
tattcaccag gctcaccact gtactctact gagaagaagg acgaggacaa gaagtga 5157
<210> 70
<211> 3702
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 RPB2 基因
<400> 70
atgtcgcagg agccggtaga agacccttac gtctacgacg aggaggacgc gcacagcatc 60
acgcccgagg actgctggac ggtgattctg tcgtttttcc aggaaaaagg ccttgtctca 120
cagcagttgg actcgttcga cgagttcatc gagtcaaaca tccaggagtt ggtgtgggag 180
gactcgcact tgattctcga ccagccggcg caacatactt ccgaggacca gtatgaaaat 240
aagcggtttg aaatcacgtt tggcaagatc tatatttcga agccaacgca gaccgagggc 300
gacggaacaa cgcacccgat gttcccacag gaggcacgct tgcgtaactt gacctacagc 360
tcgccgcttt acgtggacat gctgaaaaag aagtttcttt ccgatgacag agtgagaaag 420
ggtaacgagc tagaatgggt ggaggagaaa gtcgatggcg aggaggccca gctgaaggtg 480
ttcttgggta aggtgccaat catgctaagg tcgaagtttt gcatgttgcg ggacttgggc 540
gagcacgagt tctacgagtt gaaagagtgc ccttacgata tgggtggcta tttcgtcatc 600
aacggttccg aaaaagtctt gatcgcccag gagcgctcgg cggctaacat tgtccaggtg 660
tttaagaagg cagcgccctc gcccatctcg cacgtggcgg agatccgttc cgcgcttgaa 720
aagggttccc gtttgatctc ctcgatgcag atcaaactat atggtcgtga cgacaagggc 780
accactggca gaacaatcaa ggccacattg ccctacatca aggaagacat cccgattgtg 840
attgtattca gagccctcgg cgtggtcccc gatggagaca ttttggaaca catttgttac 900
gatgcaaacg attggcaaat gttagagatg ttgaagccat gtgtggagga aggtttcgtg 960
atccaggagc gcgaagtcgc acttgacttt atcggtagaa gaggtgtctt gggtatcaga 1020
agggaaaagc gtatccagta cgcaaaggat attttacaga aagagttgtt gcctaacatc 1080
acacaggagg ccggtttcga gtcaagaaag gcattcttct tgggttacat ggtcaaccgt 1140
ttgttgttat gtgcattaga aagaaaggag cctgacgaca gagatcattt tggcaagaag 1200
agattggatt tggccggacc cttgttggca tccttgttcc gtctcttatt caaaaagctt 1260
accagggata tctataacta catgcagcgg tgcgtggaga atgacaagga gtttaatctc 1320
acgttggcgg tcaagtcaca gaccatcact gatggtttgc ggtactcgtt ggccacaggt 1380
aattggggtg aacaaagaaa ggccatgagt gcacgtgccg gtgtgtcgca ggtgttgaac 1440
agatacacat actcatcgac attgtcgcat ttgagaagaa caaatactcc aattggccgt 1500
gacggtaaga tcgccaaacc tagacagttg cacaacaccc actggggtct tgtatgtcct 1560
gcagaaactc ctgagggtca ggcgtgtggt ttggtgaaga atttgtcttt gatgacgtgt 1620
atatccgttg gtacctcttc cgagccgatc ttgtatttct tggaagagtg gggtatggaa 1680
cccttggagg actatgttcc ttcgaacgca ccagactgca caagagtctt tgtcaacggt 1740
gtatgggttg gcacacacag agaaccggca cagcttgtcg ataccatgag gaggttgaga 1800
aggaagggcg atatctctcc cgaggtgtcg atcatcaggg acatcagaga aatggagttc 1860
aagatcttca ccgatgcagg ccgtgtctac cgtccgttgt tcatcgtgga cgacgaccca 1920
gagtccgaaa ccaagggtga gttgatgttg caaaaagagc acgtgcacaa gttgttgaac 1980
tcggcctacg atgaatatga cgaggatgac tccaatgcgt acacatggtc gtcgttggtg 2040
aatgatggtg tggtagagta cgttgacgcc gaggaggagg agacaatcat gatcgccatg 2100
accccagagg atttggaggc ttccaagagt gcgttgtcgg agactcagca acaggatctt 2160
caaatggagg aacaagagct tgatcctgca aagcgaatca aaccaactta tacctcatcc 2220
acacacacct tcacgcattg tgagattcat ccttcgatga ttttgggtgt cgccgcctct 2280
atcattccgt tccccgacca taaccagtcg ccgcgtaaca cataccagtc tgctatgggt 2340
aaacaagcca tgggtgtatt tttgactaac tatgccgtta gaatggacac aatggcaaat 2400
atcttatact acccacagaa acccttggcc acaacaagag ccatggagca cttgaagttc 2460
cgtgagttgc ctgctggtca gaatgcagtg gtggccattg cttgttactc cggctacaac 2520
caagaagatt ccatgatcat gaaccagtcg tcgattgata gaggattgtt ccggtctttg 2580
tttttcagat cttacatgga tctagagaag agacaaggta tgaaagcctt ggagacgttt 2640
gaaaagccat ccagatctga caccttgaga ttgaagcatg gaacctacga aaagttagat 2700
gacgatggtt tgatcgcgcc tggtgtcagg gtcagtggtg aggatatcat catcggtaaa 2760
accacaccta ttccacctga caccgaggag ttgggtcaga gaacccagta tcataccaag 2820
agagatgcct cgacgccatt gagaagcacg gagtctggta ttgttgacca ggttcttttg 2880
accacaaatg gtgacggcgc caagttcgtc aaggtcagaa tgagaacgac gaaggttcca 2940
caaatcggtg acaagtttgc ctccagacac ggacaaaagg gtacaatcgg tgtcacatat 3000
agacacgagg atatgccttt cagtgcacag ggtattgtgc ctgacttgat cataaacccg 3060
catgctattc catctcgtat gacagtcgct cacttgatcg agtgtttgtt gtcgaaagtc 3120
tcttccttgt ccggattgga aggtgacgcc tcgccattca cggacgtcac agccgaggct 3180
gtttccaaat tgttgagaga gcacggatac caatctagag gtttcgaggt gatgtacaat 3240
ggtcacaccg gtaagaagat gatggcgcaa gtgttctttg gcccaacgta ctaccagaga 3300
ttgaggcata tggtggatga caagatccac gctagagcca gaggtccagt tcaagttttg 3360
accaggcagc ctgtggaagg tagatccagg gatggtggat tacgtttcgg agagatggag 3420
agagattgta tgattgcgca cggagctgct ggattcttaa aggaaagatt gatggaggct 3480
tcggatgctt tcagagttca cgtttgtgga atctgtggtt tgatgtcggt gattgcaaac 3540
ttgaagaaga accagttcga gtgtcggtcg tgcaaaaaca agaccaacat ttaccagatc 3600
cacattccat acgcagccaa attgttgttc caggagttga tggccatgaa catttctcct 3660
agattgtaca cggagagatc aggaatcagt gtgcgtgtct ga 3702
<210> 71
<211> 1377
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 TEF1 基因
<400> 71
atgggtaaag aaaagtcgca cgtcaacgtc gttgtcattg gacacgtcga ttccggtaag 60
tctactacca ccggtcactt gatctacaag tgtggtggta ttgacaagag aactatcgag 120
aagttcgaga aggaggccgc cgagttgggt aagggttctt tcaagtacgc ttgggtgttg 180
gacaagttga aggctgagag agagagaggt atcactatcg acattgcctt gtggaagttc 240
gagactccta agtaccacgt caccgtcatt gacgccccag gtcacagaga tttcatcaag 300
aacatgatca ctggtacttc ccaggctgac tgtgctatct tgatcatcgc cggtggtgtt 360
ggtgagttcg aggctggtat ctccaaggat ggccagacca gagagcacgc tttgttggct 420
tacaccttgg gtgttagaca attgattgtt gccgtcaaca agatggactc cgtcaagtgg 480
gacaagaaca gatttgagga gatcatcaag gagacctcta acttcgtcaa gaaggttggt 540
tacaacccta agactgtgcc attcgtgcca atctctggtt ggaacggtga caacatgatt 600
gaggcttcca ccaactgccc atggtacaag ggttgggaga aggagaccaa ggccggtaag 660
tcttccggta agaccttgtt ggaggccatt gacgccattg agccaccaac cagacctacc 720
gacaaggcct tgagattgcc tttgcaggat gtctacaaga tcggtggtat cggaacggtg 780
ccagtcggcc gtgtcgagac cggtgtcatc aaggccggta tggtcgtcac cttcgcccca 840
gctggtgtca ccactgaggt caagtccgtc gagatgcacc acgagcagtt ggttgagggt 900
cttccaggtg acaacgttgg tttcaacgtc aagaacgtct ctgttaagga gatcagaaga 960
ggtaacgtct gtggtgactc caagcaggac ccaccaaagg ctgccgcttc tttcaccgct 1020
caggttattg tgttgaacca ccctggtcag atctcctctg gttactctcc agtgttggac 1080
tgtcacaccg cccacattgc ctgtaaattc gacaccttgt tggagaagat tgacagaaga 1140
actggtaagt ccttggagtc tgagcctaag ttcgtcaagt ctggtgacgc cgccattgtc 1200
aagatggtgc caaccaagcc aatgtgtgtt gaggctttca ccgactaccc acctttgggt 1260
agattcgccg tcagagacat gagacagact gttgctgtcg gtgtcatcaa ggccgtcgag 1320
aagtccgaca aggctggtaa ggtcaccaag gctgctcaga aggctgccaa gaagtaa 1377
<210> 72
<211> 747
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 TPI1 基因
<400> 72
atggctcgtc aatttttcgt cggaggtaac ttcaaaatga acggcactaa ggagtcgctc 60
accgccattg tcgacacctt gaacaaggcc gacttgcccg agaacgtcga ggtggtgatt 120
gctcccccag ccccatacct ttccctcgtg gtcgaggcca acaagcagaa gaccgtggag 180
gtcgctgctc aaaacgtgtt cagcaaggcc tccggtgcct acacaggtga gattgctcct 240
cagcaattga aggacttggg cgccaactgg accttgaccg gccactctga gagaagaacg 300
atcatcaagg agtccgacga gttcatcgcc gagaagacca agtttgcttt ggagtctggt 360
gttagcgtca tcttgtgtat cggtgagacc ttggaggaga agaaggctgg catcacgctt 420
gaggtgtgcg ccagacaatt ggacgctgtg tccaagattg tttccgactg gaccaacgtc 480
gtcattgctt acgagcccgt ctgggctatt ggtactggct tggccgccac tgcccaggat 540
gctcaggaca tccacaagga gatcagagcc cacttgtcta agaccattgg cgctgaacaa 600
gccgaggccg tcagaatctt gtacggtggt tccgtcaacg gcaaaaacgc tgttgacttc 660
aaggacaagg ctgatgttga cggattcttg gttggcggtg cctccttgaa gccagagttc 720
attgacatca tcaagtctag attgtaa 747
<210> 73
<211> 1830
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 XKS1 基因
<400> 73
atgacttata gttccagctc tggcctcttt ttgggcttcg acttgtcgac gcagcagctt 60
aaaatcattg tgacaaacga gaacttgaag gcgcttggta cctaccatgt tgagtttgat 120
gctcaattca aagagaaata cgcgatcaaa aagggtgttt tgtcagatga aaaaacgggc 180
gagattttat cacccgtgca catgtggcta gaggcaattg accatgtctt tgggttgatg 240
aaaaaagaca atttcccctt cggaaaagtg aaaggcataa gcggttcagg gatgcagcac 300
ggatcggtct tttggtcgaa gtctgcttct tcatccttaa agaatatggc cgaatattcc 360
tctttaacag aagccttggc tgatgccttt gcgtgtgata cttctcccaa ctggcaggac 420
cattcgacag ggaaagaaat caaagacttt gagaaagtcg ttggaggccc ggacaaattg 480
gcggaaatta caggctcaag agctcactac aggttcactg ggttgcagat tcggaagttg 540
gcagtgagat ctgagaatga cgtttaccag aaaaccgata gaatatcttt ggtgtcgagt 600
tttgttgcgt ccgttctttt gggcaggatc accacaattg aggaggcgga cgcttgcgga 660
atgaatttat acaatgtgac cgagtctaag cttgatgaag atttgttagc aatcgctgca 720
ggggtgcatc caaagctcga taacaaatcc aaaagggaaa cagacgaggg tgtcaaagaa 780
ctaaagcgaa agattggtga gatcaaaccc gtgagttatc agacttcggg ctcaatcgca 840
ccatattttg tcgagaaata cggcttctct ccagattcga agattgtttc gtttacgggt 900
gataatcttg cgaccatcat ctctttgcct ttgagaaaaa acgacgtctt ggtgtcacta 960
ggcacatcca ccaccgtact tttggtgacc gagagctacg cgccttcttc gcagtatcat 1020
cttttcaagc atcctacaat taagaatgct tacatgggaa tgatttgcta cagtaatggc 1080
gcgctagcaa gagaaagagt tcgtgacgcc atcaatgaga agtatggtgt ggcaggggat 1140
tcttgggaca agttcaatga gatcttggat cgctcaggcg acttcaacaa taagttgggt 1200
gtttactttc ccatcggtga aattgtgccc aatgctccgg cccagacaaa gagaatggaa 1260
atgaactcgc atgaggatgt gaaagagatc gaaaagtggg atttggaaaa cgatgtcact 1320
tctattgttg agtcacaaac cgttagttgc cgagtgagag cgggcccaat gctttctgga 1380
tcgggtgact cgaatgaagg aacgcccgaa aatgaaaata ggaaagtcaa aacactcatc 1440
gacgatttac actctaagtt cggcgaaatt tacacagacg ggaaacctca gagctacgag 1500
tctttgactt cgaggccgcg gaacatctac tttgtcggag gggcttcaag aaacaagagt 1560
atcatacaca agatggcttc gatcatgggt gctaccgaag gaaactttca ggttgagatt 1620
ccgaatgcgt gtgctcttgg cggcgcctac aaggcaagct ggagccttga gtgtgagagc 1680
agacaaaagt gggtgcactt caatgattac ctcaatgaga agtacgattt cgatgatgtg 1740
gatgagttca aagtggacga caaatggctc aactatattc cggcgattgg cttgttgtcg 1800
aaattggaaa gcaaccttga ccagaactaa 1830
<210> 74
<211> 957
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 XYL1 基因
<400> 74
atggctacta tcaaattgaa ctctggatac gacatgcccc aagtgggttt tgggtgctgg 60
aaagtaacta acagtacatg tgctgatacg atctacaacg cgatcaaagt tggctacaga 120
ttatttgatg gcgctgaaga ttacgggaac gagaaagagg tgggcgaagg aatcaacagg 180
gccattgacg aaggcttggt ggcacgtgac gagttgttcg tggtgtccaa gctctggaac 240
aacttccatc atccagacaa cgtcgagaag gcgttggaca agactttggg cgacttgaat 300
gtcgagtact tggacttgtt cttgatccat ttcccaattg cgttcaaatt cgtgcccttt 360
gaggagaaat acccgcccgg cttctactgt ggagaaggcg ataagtttat ctacgaggat 420
gtgcctttgc ttgacacgtg gcgggcattg gagaagtttg tgaagaaggg taagatcaga 480
tccatcggaa tctcgaactt ttccggcgcg ttgatccagg acttgctcag gggcgccgag 540
atcccccctg ccgtgttgca gattgagcac cacccatact tgcagcagcc cagattgatt 600
gagtatgtgc agtccaaggg tattgccatc acagcctact cctcttttgg cccacagtcg 660
tttgtggagt tggaccaccc caaggtcaag gagtgtgtca cgcttttcga gcacgaagac 720
attgtttcca tcgctaaagc tcacgacaag tccgcgggcc aggtattatt gaggtgggcc 780
acgcaaaggg gtcttgccgt gattccaaag tcaaacaaaa ccgagcgttt gttgctgaat 840
ttgaatgtga acgattttga tctctctgaa gcagaattgg agcaaatcgc aaagttggac 900
gtgggcttgc gcttcaacaa cccttgggac tgggacaaga ttccaatctt ccattaa 957
<210> 75
<211> 1089
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 XYL2 基因
<400> 75
atgcctgcta acccatcctt ggttttgaac aaagtgaacg acatcacgtt cgagaactac 60
gaggttccgt tactcacaga ccccaacgat gtattggttc aggtgaaaaa gactggaatc 120
tgtggatctg acatccacta ctacacccac ggcagaattg gcgacttcgt gttgacaaag 180
ccaatggttt tgggccacga atccgccggt gtggtcgtgg aggtcggcaa aggtgtcact 240
gacttgaagg ttggtgataa ggttgccatt gagcccggag tgccttctcg caccagtgac 300
gagtacaaga gtggccacta caacttgtgc ccacacatgt gttttgccgc cacgcccaac 360
tctaaccccg acgagccaaa cccgccaggg actttgtgca aatattacaa gtccccagcg 420
gacttcttgg tgaaattgcc tgagcacgtc tcccttgagt tgggcgctat ggtcgagcct 480
ttgactgtcg gtgtgcacgc ctcgcgtttg ggccgtgtca cttttggtga ccacgttgtg 540
gttttcggtg ctggcccagt cggtatcctt gcggctgccg tggccagaaa gtttggcgct 600
gccagcgtga ctatcgtcga catcttcgac agcaaattgg aattggccaa gtccattggc 660
gcggccactc acacattcaa ctcaatgact gagggtgttc tttcggaggc tttgcccgcg 720
ggcgtgagac ctgacgttgt attggagtgc actggagcag agatctgtgt gcagcaaggt 780
gtacttgcgt tgaaggctgg tggccgccac gtgcaagttg gaaatgccgg ctcctatctc 840
aaattcccca tcaccgaatt tgttaccaag gagttgactc tctttggatc cttccgttac 900
ggttacaacg actacaagac gtcggtcgcc atcttggacg agaattacaa gaacgggaag 960
gagaatgcgt tggtggactt tgaagccttg attactcacc gtttcccctt caagaatgcc 1020
attgaggctt acgacgcggt gcgcgctggc gacggagctg tcaagtgtat cattgacggc 1080
ccagagtaa 1089
<210> 76
<211> 1632
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 XYT1 基因
<400> 76
atgggttacg aggaaaagct tgtagcgccc gcgttgaaat tcaaaaactt tcttgacaaa 60
acccccaata ttcacaatgt ctatgtcatt gccgccatct cctgtacatc aggtatgatg 120
tttggatttg atatctcgtc gatgtctgtc tttgtcgacc agcagccata cttgaagatg 180
tttgacaacc ctagttccgt gattcaaggt ttcattaccg cgctgatgag tttgggctcg 240
tttttcggct cgctcacatc cacgttcatc tctgagcctt ttggtcgtcg tgcatcgttg 300
ttcatttgtg gtattctttg ggtaattgga gcagcggttc aaagttcgtc gcagaacagg 360
gcccaattga tttgtgggcg tatcattgca ggatggggca ttggctttgg gtcatcggtg 420
gctcctgttt acgggtccga gatggctccg agaaagatca gaggcacgat tggtggaatc 480
ttccagttct ccgtcaccgt gggtatcttt atcatgttct tgattgggta cggatgctct 540
ttcattcaag gaaaggcctc tttccggatc ccctggggtg tgcaaatggt tcccggcctt 600
atcctcttga ttggactttt ctttattcct gaatctcccc gttggttggc caaacagggc 660
tactgggaag acgccgaaat cattgtggcc aatgtgcagg ccaagggtaa ccgtaacgac 720
gccaacgtgc agattgaaat gtcggagatt aaggatcaat tgatgcttga cgagcacttg 780
aaggagttta cgtacgctga ccttttcacg aagaagtacc gccagcgcac gatcacggcg 840
atctttgccc agatctggca acagttgacc ggtatgaatg tgatgatgta ctacattgtg 900
tacattttcc agatggcagg ctacagcggc aacacgaact tggtgcccag tttgatccag 960
tacatcatca acatggcggt cacggtgccg gcgcttttct gcttggatct cttgggccgt 1020
cgtaccattt tgctcgcggg tgccgcgttc atgatggcgt ggcaattcgg cgtggcgggc 1080
attttggcca cttactcaga accggcatat atctctgaca ctgtgcgtat cacgatcccc 1140
gacgaccaca agtctgctgc aaaaggtgtg attgcatgct gctatttgtt tgtgtgctcg 1200
tttgcattct cgtggggtgt cggtatttgg gtgtactgtt ccgaggtttg gggtgactcc 1260
cagtcgagac aaagaggcgc cgctcttgcg acgtcggcca actggatctt caacttcgcc 1320
attgccatgt tcacgccgtc ctcattcaag aatatcacgt ggaagacgta tatcatctac 1380
gccacgttct gtgcgtgcat gttcatacac gtgtttttct ttttcccaga aacaaagggc 1440
aagcgtttgg aggagatagg ccagctttgg gacgaaggag tcccagcatg gaggtcagcc 1500
aagtggcagc caacagtgcc gctcgcgtcc gacgcagagc ttgcacacaa gatggatgtt 1560
gcgcacgcgg agcacgcgga cttattggcc acgcactcgc catcttcaga cgagaagacg 1620
ggcacggtct aa 1632
<210> 77
<211> 972
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 TAL1 基因
<400> 77
atgtctaact ctttggaatc cttgaaagct accggcaccg tgatcgtcac cgacactggt 60
gagttcgact cgattgccaa gtacacccca caagatgcca ccaccaaccc ttcgttgatt 120
ttagccgcct cgaaaaaggc tgagtacgcc aaggtgattg atgttgctat taaatacgcc 180
gaggacaagg gcagcaaccc taaggagaag gccgccattg ccttggacag attgttggtg 240
gagttcggta aggaaatctt gctgattgtg cctggcagag tgtctaccga ggttgacgcc 300
agattgtcgt ttgacaagga cgccaccgtc aagaaggcgc ttgagatcat cgaattgtac 360
aagtccattg gcatctcgaa ggacagagtg ttgatcaaga tcgcttccac ctgggaaggt 420
atccaggccg ccaaggagtt ggaggccaag cacgacatcc actgtaactt gacgcttttg 480
ttcagtttcg tgcaggcggt ggcgtgtgcc gaggccaagg tcactttgat ctcgcctttc 540
gtcggcagaa tcttggactg gtacaaggcc tccaccggca aggagtacga tgccgagtcc 600
gaccctggtg ttgtgtctgt cagacagatc tacaactact acaagaagta cggctacaac 660
acgattgtca tgggcgcgtc tttcagaaac actggcgaga tcaaggcctt ggctggctgc 720
gactacttga ctgtggcccc taagttgttg gaggagttga tgaactcttc cgaggaggtg 780
cctaaggtgt tggacgctgc ctcggccagc tccgcgtctg aggagaaggt ttcctacatt 840
gacgacgaga gcgagttcag attcttgttg aacgaggacg ccatggccac cgagaagttg 900
gcccagggta tcagaggctt tgccaaggac gcccagacct tgttggccga gttggagaac 960
agattcaagt ag 972
<210> 78
<211> 2034
<212> DNA
<213> Metschnikowia
<220>
<223> 来自 H0梅奇酵母(Metschnikowia)种的 TKL1 基因
<400> 78
atgtccgaca tcgatcaatt ggctatttct accatccgtt tgttggcggt cgacgccgtg 60
gccaaggcca actctggtca ccccggtgcc ccattgggtc tcgcccctgc cgcccacgcc 120
gtttggaagg agatgaaatt caacccaaag aaccccgact gggtcaacag agaccgtttt 180
gtgttgtcga acggtcacgc ttgcgctttg ttatacgcca tgttgcacct ttacggcttc 240
gacatgtcgc ttgacgactt gaagcagttc cgtcagttga actcgaaaac acccggacat 300
cccgagaagt ttgaaatccc aggtgccgag gtcaccacgg gccccttggg tcagggtatc 360
tccaacgccg tgggtttggc cattgcacag aagcaattcg ctgccacgtt caacaaggac 420
gatttcgcca tctctgactc gtacacctac gccttcttgg gtgacggatg tttgatggag 480
ggtgtcgcct cggaagcatc ttctttggct ggccacctcc aattgaacaa cttgattgcg 540
ttctgggacg acaacaagat ctcgatcgat ggatccactg aagtggcctt caccgaggac 600
gtgttgaagc gttacgaggc ttacggttgg gacacgctca cgattgagaa gggtgacact 660
gacttggagg gcgtcgctca ggcgatcaag actgccaagg cgctgaagaa gcctactttg 720
atccgtttga ccaccatcat cggctacggc tcgctccagc agggtaccca cggtgttcac 780
ggtgctccat tgaagccaga tgacatcaag cagttgaagg agaagtttgg cttcgaccca 840
accaagtcgt ttgtcgtgcc tcaggaagtt tacgactact acggcacact cgtaaagaag 900
aaccaggagt tggagtccga gtggaacaag accgtcgagt cctacatcca gaaattccca 960
gaggagggcg ctgtcttggc gcgcagactc aagggtgagt tgcctgagga ctgggccaag 1020
tgcttgccta cttacaccgc tgatgacaag ccgttggcca cgagaaagtt gtctgagatg 1080
gctctcatca agatcttgga tgtcgttcca gagcttattg gtggctctgc cgacttgacc 1140
ggctcgaact tgacccgtgc ccctgacatg gttgacttcc agccccctca gaccggcttg 1200
ggtaactacg ctggtagata catccgttac ggtgtgcgtg agcacggtat gggtgccatc 1260
atgaacggta tcgccggttt tggtgctggt ttccgtaact acggcggtac cttcttgaac 1320
ttcgtctcgt acgccgccgg tgctgtgcgt ttgtcggctc tttctcactt gcctgtgatc 1380
tgggttgcta cgcatgactc gattggtttg ggtgaggacg gtcctaccca ccagcctatt 1440
gagaccttgg cccacttcag agctacccct aacatctctg tgtggagacc tgctgacggt 1500
aacgaggtgt cagctgctta caagtctgcc attgagtcta cctctacccc acacatcttg 1560
gccttgacca gacagaactt gcctcaattg gctggttctt ctgtggagaa ggcctctacc 1620
ggtggttaca ccgtgtacca gaccactgac aagcctgccg tcatcatcgt ggcttctggt 1680
tccgaggtgg ccatctctat tgacgccgcc aagaagttgg agggtgaggg catcaaggcc 1740
aacgttgttt ccttggttga cttccacact ttcgacaagc agcctttgga ctaccgttta 1800
tctgttttgc cagatggcgt gccaatcatg tccgttgagg tgatgtcctc gttcggctgg 1860
tccaagtatt ctcacgagca gttcggcttg aacagattcg gtgcctccgg caaggccgaa 1920
gacctttaca agttcttcga cttcacgcca gaaggcgttg ctgacagagc cgccaagacc 1980
gtgcagttct acaagggcaa ggacctcctt tcgcctttga acagagcctt ctaa 2034

Claims (57)

1.分离的梅奇酵母(Metschnikowia)种,当在好氧条件和30℃下,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,其从木糖产生至少0.1g/L/h的木糖醇。
2.分离的梅奇酵母种,当在好氧条件和30℃下,在包含4%的木糖的液体酵母氮源(YNB)培养基中培养3天时,其从木糖产生至少1g/L的木糖醇。
3.分离的梅奇酵母种,当在好氧条件和30℃下,在包含2%的木糖和2%的葡萄糖的液体酵母氮源(YNB)培养基中培养两天时,其从木糖产生至少1g/L的木糖醇。
4.分离的梅奇酵母种,当在好氧条件下,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,其产生约0.11g/L/h的木糖醇,约6.8E-05g/L/h的正丁醇、约2.5E-04g/L/h的异丁醇、约2.4E-04g/L/h的异丙醇、约2.64E-04g/L/h的乙醇和约3.73E-06g/L/h的2-苯乙醇。
5.分离的梅奇酵母种,当在好氧条件下,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,其以约8,000mg/L木糖醇、约4.85mg/L正丁醇、约18.06mg/L异丁醇、约17.5mg/L异丙醇、约19.7mg/L乙醇和约0.269mg/L 2-苯乙醇的浓度产生化合物木糖醇、正丁醇、异丁醇、异丙醇、乙醇和2-苯乙醇。
6.分离的梅奇酵母种,当在好氧条件下,在包含4%的木糖的液体酵母提取物蛋白胨(YEP)培养基中培养3天时,其以99.26%的木糖醇、0.061%的正丁醇、0.223%的异丁醇、0.217%的异丙醇、0.236%的乙醇和0.003%的2-苯乙醇的相对比产生化合物木糖醇、正丁醇、异丁醇、异丙醇、乙醇和2-苯乙醇。
7.包含D1/D2域序列的分离的梅奇酵母种,所述序列包含:(1)与SEQ ID NO:1具有至少96.8%的同一性的核酸序列;(2)SEQ ID NO:2的共有序列内的核酸序列;或者(3)包含SEQID NO:2的残基1-153、178至434和453至499并且其中具有不超过4个核苷酸替代的核酸序列,和编码选自SEQ ID NO:37、40、42、44、49、51、52、55和56中的氨基酸序列的至少一个核酸序列。
8.包含D1/D2域序列的分离的梅奇酵母种,所述序列包含:(1)与SEQ ID NO:1具有至少96.8%的同一性的核酸序列;或者(2)SEQ ID NO:2的共有序列内的核酸序列;或者(3)包含SEQ ID NO:2的残基1-153、178至434和453至499并且其中具有不超过4个核苷酸替代的核酸序列,和选自SEQ ID NO:57-78的至少一个编码核酸序列。
9.分离的梅奇酵母种,其包含:(1)与SEQ ID NO:1具有至少96.8%的同一性的D1/D2域序列;和(2)SEQ ID NO:68的编码核酸序列,并且其中所述分离的梅奇酵母种在包含2%的木糖作为唯一碳源的酵母提取物蛋白胨(YEP)培养基中培养41小时内生长至约25的OD600
10.分离的梅奇酵母种,其包含:(1)与SEQ ID NO:2的D1/D2域共有序列具有至少97.1%的同一性的核酸序列;和(2)SEQ ID NO:70的编码核酸序列。
11.根据权利要求7-10中任一项所述的分离的梅奇酵母种,其中所述D1/D2域序列包含选自SEQ ID NO:1和3-25的核酸序列。
12.根据权利要求7-11中任一项所述的分离的梅奇酵母种,其中所述D1/D2域序列不包括选自Metschnikowia andauensis、金佩梅奇酵母(Metschnikowia chrysoperlae)、核果梅奇酵母(Metschnikowia fructicola)、美极梅奇酵母(Metschnikowia pulcherrima)、山西梅奇酵母(Metschnikowia shanxiensis)、中国梅奇酵母(Metschnikowia sinensis)和Metschnikowia zizyphicola的梅奇酵母种的D1/D2域序列。
13.分离的梅奇酵母种,其于2016年11月8日,根据布达佩斯条约的条款,在作为国际保藏中心的加拿大国际保藏中心以指定登记号No.081116-01保藏。
14.用于生产木糖醇的方法,其包括将根据权利要求1-13中任一项所述的分离的梅奇酵母种在一定条件下培养足够的一段时间以从木糖产生木糖醇。
15.根据权利要求14所述的方法,其中所述分离的梅奇酵母种从木糖产生至少0.1g/L/h,至少0.2g/L/h,至少0.3g/L/h,至少0.4g/L/h,至少0.50g/L/h,至少0.60g/L/h,至少0.70g/L/h,至少0.80g/L/h,至少0.90g/L/h,至少1.00g/L/h,至少1.50g/L/h,至少2.00g/L/h,至少2.50g/L/h,至少3.00g/L/h,至少3.50g/L/h,至少4.00g/L/h,至少5.00g/L/h,至少6.00g/L/h,至少7.00g/L/h,至少8.00g/L/h,至少9.00g/L/h或者至少10.00g/L/h的木糖醇。
16.根据权利要求14或15所述的方法,其中所述条件包括在包含木糖和C3碳源、C4碳源、C5碳源、C6碳源或它们的组合的培养基中培养所述分离的梅奇酵母种。
17.根据权利要求14或15所述的方法,其中所述条件包括在包含木糖和选自纤维二糖、半乳糖、葡萄糖、乙醇、乙酸酯、阿拉伯糖、阿糖醇、山梨糖醇和甘油或它们的组合的共基质的培养基中培养所述分离的梅奇酵母种。
18.根据权利要求17所述的方法,其中所述共基质为葡萄糖。
19.根据权利要求17所述的方法,其中所述培养基包含葡萄糖、木糖和纤维二糖的组合。
20.根据权利要求17所述的方法,其中所述培养基包含葡萄糖、木糖和半乳糖的组合。
21.根据权利要求17所述的方法,其中所述培养基包含葡萄糖、木糖和甘油的组合。
22.根据权利要求14至21中任一项所述的方法,其中所述培养包括好氧培养条件。
23.根据权利要求14至22中任一项所述的方法,其中所述培养包括分批培养、补料-分批培养或连续培养。
24.根据权利要求14至23中任一项所述的方法,其中所述方法还包括将木糖醇与培养物中的其它组分分离。
25.根据权利要求24所述的方法,其中所述分离包括提取、连续液-液萃取、渗透气化、膜滤法、膜分离、反渗透、电渗析、蒸馏、结晶、离心、提取过滤、离子交换色谱、吸附色谱或超滤。
26.通过根据权利要求14至25中任一项所述的方法所生产的生物衍生木糖醇。
27.组合物,其包含根据权利要求1至13中任一项所述的分离的梅奇酵母种或者根据权利要求26所述的生物衍生木糖醇,或者两者。
28.根据权利要求27所述的组合物,其中所述组合物是包含木糖的培养基。
29.根据权利要求27所述的组合物,其中所述组合物是从中已除去根据权利要求1至13中任一项所述的分离的梅奇酵母种的培养基。
30.根据权利要求27所述的组合物,所述组合物包含甘油、阿糖醇、C7糖醇或它们的组合,其作为来自根据权利要求14至25中任一项所述的方法的杂质。
31.根据权利要求30所述的组合物,其中所述C7糖醇是庚七醇或其异构体。
32.根据权利要求30所述的组合物,其中所述甘油或阿糖醇或两者的量比通过根据权利要求1至13中任一项所述的分离的梅奇酵母种以外的微生物所产生的相应的甘油或阿糖醇或两者的量大至少10%、20%、30%或40%。
33.分离的梅奇酵母种,其于2016年11月8日,根据布达佩斯条约的条款,在作为国际保藏中心的加拿大国际保藏中心以指定登记号No.081116-01保藏,其中所述梅奇酵母种还包含能够从木糖产生生物衍生化合物的代谢途径或遗传修饰或两者。
34.根据权利要求33所述的分离的梅奇酵母种,其中所述代谢途径包含编码所述代谢途径的至少一种酶的至少一种外源核酸序列。
35.根据权利要求33或34所述的分离的梅奇酵母种,其中所述生物衍生化合物选自苯基-乙醇、2-甲基-丁醇和3-甲基-丁醇。
36.生产生物衍生化合物的方法,其包括将根据权利要求33-35中任一项所述的分离的梅奇酵母种在一定条件下培养足够的一段时间以产生所述生物衍生化合物。
37.根据权利要求36所述的方法,其中所述条件包括在包含木糖和C3碳源、C4碳源、C5碳源、C6碳源或它们的组合的培养基中培养所述分离的梅奇酵母种。
38.根据权利要求36所述的方法,其中所述条件包括在包含木糖和选自纤维二糖、半乳糖、葡萄糖、阿糖醇、山梨糖醇和甘油或它们的组合的共基质的培养基中培养所述微生物。
39.根据权利要求37所述的方法,其中所述共基质为葡萄糖。
40.根据权利要求37所述的方法,其中所述培养基包含葡萄糖、木糖和纤维二糖的组合。
41.根据权利要求37所述的方法,其中所述培养基包含葡萄糖、木糖和半乳糖的组合。
42.根据权利要求37所述的方法,其中所述培养基包含葡萄糖、木糖和甘油的组合。
43.根据权利要求36至42中任一项所述的方法,其中所述培养包括好氧培养条件。
44.根据权利要求36至43中任一项所述的方法,其中所述培养包括分批培养、补料-分批培养或连续培养。
45.根据权利要求36至44中任一项所述的方法,其中所述方法还包括将所述生物衍生化合物与培养物中的其它组分分离。
46.根据权利要求45所述的方法,其中所述分离包括提取、连续液-液萃取、渗透气化、膜滤法、膜分离、反渗透、电渗析、蒸馏、结晶、离心、提取过滤、离子交换色谱、吸附色谱或超滤。
47.通过根据权利要求36至46中任一项所述的方法所产生的生物衍生化合物。
48.包含根据权利要求33至35中任一项所述的梅奇酵母种或者根据权利要求47所述的生物衍生化合物的组合物。
49.根据权利要求48所述的组合物,其中所述组合物是包含木糖的培养基。
50.根据权利要求48所述的组合物,其中所述组合物是从中已除去根据权利要求33至35中任一项所述的分离的梅奇酵母种的培养基。
51.根据权利要求48所述的组合物,其作为来自根据权利要求36至46中任一项所述的方法的杂质包含甘油、阿糖醇、C7糖醇或它们的组合。
52.根据权利要求51所述的组合物,其中所述C7糖醇是庚七醇或其异构体。
53.根据权利要求51所述的组合物,其中所述甘油或阿糖醇或两者的量比通过根据权利要求33至35中任一项所述的分离的梅奇酵母种以外的微生物所产生的相应的甘油或阿糖醇或两者的量大至少10%、20%、30%或40%。
54.包含选自SEQ ID NO:37、40、42、44、49、51、52、55和56的氨基酸序列的分离的多肽。
55.包含选自SEQ ID NO:57-78的核酸序列的分离的核酸。
56.包含根据权利要求55所述的分离的核酸序列的载体。
57.包含根据权利要求56所述的载体的宿主细胞。
CN201780087070.7A 2016-12-21 2017-12-20 用于化合物生物合成的梅奇酵母种 Pending CN110325640A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662437610P 2016-12-21 2016-12-21
US62/437,610 2016-12-21
PCT/CA2017/051557 WO2018112634A1 (en) 2016-12-21 2017-12-20 Metschnikowia species for biosynthesis of compounds

Publications (1)

Publication Number Publication Date
CN110325640A true CN110325640A (zh) 2019-10-11

Family

ID=62624110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780087070.7A Pending CN110325640A (zh) 2016-12-21 2017-12-20 用于化合物生物合成的梅奇酵母种

Country Status (9)

Country Link
US (1) US20180195093A1 (zh)
EP (1) EP3559233A4 (zh)
JP (1) JP7117307B2 (zh)
CN (1) CN110325640A (zh)
AU (1) AU2017381576A1 (zh)
BR (1) BR112019013008A2 (zh)
CA (1) CA3047838A1 (zh)
MX (2) MX2019007403A (zh)
WO (1) WO2018112634A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112210619A (zh) * 2020-10-21 2021-01-12 沈阳农业大学 用于检测二尖梅奇酵母的引物对及其应用
CN114011566A (zh) * 2021-09-24 2022-02-08 佛山科学技术学院 一种分离土壤中微塑料的方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112019013007A2 (pt) 2016-12-21 2019-10-08 Creatus Biosciences Inc organismo microbiano não natural, método de produção de um composto bioderivado, composto bioderivado e composição
RU2702195C1 (ru) * 2018-10-29 2019-10-04 Федеральное государственное бюджетное образовательное учреждение высшего образования "Горский государственный аграрный университет" Штамм дрожжей Metschnikowia pulcherrima - продуцент микробного белка и спирта
CN110218662A (zh) * 2019-06-26 2019-09-10 吉林大学 一种嗜低温产香特性突出的美极梅奇酵母及其应用
CN113502233B (zh) * 2021-07-14 2023-05-05 河北科技师范学院 一株美极梅奇酵母及其在葡萄酒酿造中的应用
CN113913310B (zh) * 2021-09-27 2023-08-11 伽蓝(集团)股份有限公司 西藏苞叶雪莲来源的梅奇酵母菌株及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1065276A1 (en) * 1999-06-24 2001-01-03 Ajinomoto Co., Inc. Methods for producing D-arabitol, D-xylulose and xylitol using the yeast Metschnikowia

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020501595A (ja) * 2016-12-21 2020-01-23 クリエイタス バイオサイエンシス インコーポレイテッド キシリトールを生産するメチニコビア種

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1065276A1 (en) * 1999-06-24 2001-01-03 Ajinomoto Co., Inc. Methods for producing D-arabitol, D-xylulose and xylitol using the yeast Metschnikowia
CN1284564A (zh) * 1999-06-24 2001-02-21 味之素株式会社 用于生产d-阿拉伯糖醇、d-木酮糖和木糖醇的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MARIA C等: "Xylitol production by yeasts isolated from rotting wood in the Gala´pagos Islands,Ecuador, and description of Cyberlindnera galapagoensis f.a., sp. nov.", 《ANTONIE VAN LEEUWENHOEK》 *
MATTHIAS SIPICZKI等: "Metschnikowia Species Share a Pool of Diverse rRNA Genes Differing in Regions That Determine Hairpin-Loop Structures and Evolve by Reticulation", 《PLOS ONE》 *
RAO等: "Isolation and characterization of ethanol-producing yeasts from fruits and tree barks", 《LETT APPL MICROBIOL》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112210619A (zh) * 2020-10-21 2021-01-12 沈阳农业大学 用于检测二尖梅奇酵母的引物对及其应用
CN112210619B (zh) * 2020-10-21 2023-05-05 沈阳农业大学 用于检测二尖梅奇酵母的引物对及其应用
CN114011566A (zh) * 2021-09-24 2022-02-08 佛山科学技术学院 一种分离土壤中微塑料的方法
CN114011566B (zh) * 2021-09-24 2024-03-22 佛山科学技术学院 一种分离土壤中微塑料的方法

Also Published As

Publication number Publication date
EP3559233A4 (en) 2020-11-25
CA3047838A1 (en) 2018-06-28
AU2017381576A1 (en) 2019-07-18
MX2023001200A (es) 2023-02-23
EP3559233A1 (en) 2019-10-30
BR112019013008A2 (pt) 2019-10-08
MX2019007403A (es) 2019-12-11
JP2020501596A (ja) 2020-01-23
JP7117307B2 (ja) 2022-08-12
WO2018112634A1 (en) 2018-06-28
US20180195093A1 (en) 2018-07-12

Similar Documents

Publication Publication Date Title
CN110325640A (zh) 用于化合物生物合成的梅奇酵母种
US11473110B2 (en) Xylitol producing Metschnikowia species
KR102281701B1 (ko) 아세토인을 제조하는 방법
CN106661540A (zh) 通过重组菌株从葡萄糖生产木糖醇
JP2012529889A (ja) Mek及び2−ブタノールの炭素効率のよい生合成のための微生物及び方法
US20210222210A1 (en) Methods and organism with increased xylose uptake
CN101748069B (zh) 一种重组蓝藻
Zhu et al. Efficient utilization of carbon to produce aromatic valencene in Saccharomyces cerevisiae using mannitol as the substrate
WO2012133275A1 (ja) Kluyveromyces属の変異体酵母及びこれを用いたエタノールの製造方法
CN111154705B (zh) 热葡萄糖苷酶地芽孢杆菌工程菌及其构建方法及应用
CN104560917B (zh) 一种β-葡萄糖苷酶和β-葡萄糖苷酶突变体及应用
CN110904062A (zh) 一株高产l-丙氨酸的菌株
JP2015033342A (ja) キシロースの発酵能が強化された酵母とその利用
CN112920959B (zh) 一种提高酵母菌中l-薄荷醇产量的方法
JP2017051210A (ja) キシロースの発酵能が強化された酵母とその利用
Mierke Characterisation of two novel oleaginous yeast strains for efficient and sustainable production of acetyl-CoA derived products
Junichi et al. Molecular basis of triterpene-based chemophenetics in ferns
Asseri Improvement of Bioethanol Production from Yeasts by chemical and physical Mutagenesis
Young cerevisiae for Enhanced triterpene Biosynthesis
JP2015062357A (ja) 酵母
Wightman The origin and significance of the THI5 gene family in Saccharomyces cerevisiae
JP2014195442A (ja) 酵母

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191011