CN116348609A - 酵母属酵母细胞及使用其的发酵方法 - Google Patents

酵母属酵母细胞及使用其的发酵方法 Download PDF

Info

Publication number
CN116348609A
CN116348609A CN202180068023.4A CN202180068023A CN116348609A CN 116348609 A CN116348609 A CN 116348609A CN 202180068023 A CN202180068023 A CN 202180068023A CN 116348609 A CN116348609 A CN 116348609A
Authority
CN
China
Prior art keywords
leu
gly
ala
val
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180068023.4A
Other languages
English (en)
Inventor
汉斯·马里纳斯·查尔斯·约翰内斯·德·布鲁因
菲利普·E·伯瑞曼
埃弗特·特吉德·范·瑞杰
芮妮·马赛尔·德·钟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Danisco US Inc
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN116348609A publication Critical patent/CN116348609A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • C12N1/18Baker's yeast; Brewer's yeast
    • C12N1/185Saccharomyces isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • C12N1/18Baker's yeast; Brewer's yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0044Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on other nitrogen compounds as donors (1.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces
    • C12R2001/865Saccharomyces cerevisiae
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Botany (AREA)
  • Virology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

公开了一种酵母属酵母细胞,优选地酿酒酵母酵母细胞,所述酵母细胞包含一个或多个编码具有NADH依赖性硝酸还原酶活性的酶的核酸序列和/或一个或多个编码具有NADH依赖性亚硝酸盐还原酶活性的酶的核酸序列。公开了一种用于使用此类酵母属酵母细胞生产发酵产物的厌氧发酵方法,以及一种所产生的发酵副产物。

Description

酵母属酵母细胞及使用其的发酵方法
技术领域
本发明涉及一种具有产生所需发酵产物的能力的酵母细胞;以及一种用于产生发酵产物的方法,其中在所述方法中使用所述酵母细胞。
背景技术
基于酵母的发酵方法应用于从传统且可再生的碳水化合物原料工业化生产范围广泛且迅速扩大的化合物。
特别是在厌氧发酵方法中,辅因子对NADH/NAD+的氧化还原平衡可导致产物产率的重大挑战。例如,与基于酵母的乙醇生产的化学计量有关的主要挑战是,大量的甘油总是形成副产物。据估计,在典型的工业乙醇工艺中,高达约4重量%的糖原料转化为甘油(Nissen等人Yeast 16(2000)463-474)。
厌氧条件下的甘油生产主要与酵母细胞中的氧化还原平衡机制有关。在酿酒酵母(S.cerevisiae)的厌氧生长期间,糖异化经由所谓的乙醇发酵发生。经由NAD+依赖性糖酵解甘油醛-3-磷酸脱氢酶反应形成的NADH通过经由NADH依赖性醇脱氢酶将通过丙酮酸脱羧形成的乙醛转换为乙醇而被再氧化的。当在代谢中的其他地方发生NAD+至NADH的净还原时,该氧化还原-中性异化途径的固定化学计量引起问题。在厌氧条件下,在这种情况下,酿酒酵母中的NADH再氧化严格依赖于将糖还原为甘油。甘油形成是通过将糖酵解中间体磷酸二羟丙酮(DHAP)还原成甘油3-磷酸(甘油-3P)而引发的,该还原是由NADH依赖性甘油3-磷酸脱氢酶催化的反应。随后,在这个反应中形成的甘油3-磷酸被甘油-3-磷酸酶水解,以产生甘油。因此,甘油是通过酿酒酵母厌氧生产乙醇期间的主要副产物。甘油的产生是非期望的,因为其降低了糖向所需发酵产物(例如乙醇)的总转换率。此外,发酵设施的流出物中存在甘油可增加废水处理的成本。
氮是酵母细胞的关键营养物。如由Linder在他的关于芽殖酵母中氮同化途径的第7章中、在由Sibirney编辑,由Springer Nature Switzerland AG(2019)出版的手册“Non-conventional Yeasts:from Basic Research to Application”,第197页及下文中所述,氨(NH3)是用作芽殖酵母氮源的最简单的氮底物之一。
根据Linder的说法,酵母中用于含氮生物分子的绝大多数生物合成途径首先需要将氨转换为L-谷氨酸和L-谷氨酰胺,然后将所述L-谷氨酸和L-谷氨酰胺用作下游合成代谢转氨反应中的氨基供体。酶NADP+依赖性谷氨酸脱氢酶(EC 1.4.1.4;由GDH1基因编码)催化将α-酮戊二酸胺化以形成l-谷氨酸,而酶谷氨酰胺合酶(EC 6.3.1.2;由GLN1基因编码)催化将L-谷氨酸胺化以形成L-谷氨酰胺。GDH1基因的第二拷贝(被称为GDH3)已在酿酒酵母中描述,并且似乎在氮代谢中发挥独特的生理作用。
根据Linder的说法,同化除氨以外的无机氮源的能力被认为在芽殖酵母中很罕见。据说硝酸根(NO3 )通过经由亚硝酸根(NO2 )的两步还原被同化以产生氨。将硝酸根还原成亚硝酸根据说是通过酶硝酸还原酶(EC 1.7.1.2/EC 1.7.1.3)完成的,所述硝酸还原酶由YNR1基因编码。Linder指出,除了存在黄素腺嘌呤二核苷酸(FAD)和血红素辅基外,硝酸还原酶也是芽殖酵母中目前已知的为数不多的需要钼辅因子(MoCo)才能发挥其活性的酶之一。Linder解释说,酵母硝酸还原酶的氧化还原辅因子需求似乎因物种而异。食腺嘌呤芽生葡萄孢酵母(Blastobotrys adennivorans)(毛红曲霉科(Trichomonascaceae))中的硝酸还原酶被认为对NADPH有特异性,而博伊丁假丝酵母(Candida boidinii)(毕赤酵母科(Pichiaceae))、杰丁塞伯林德纳氏酵母(Cyberlindnera jadinii)(法夫酵母科(Phaffomycetaceae))和多形汉逊酵母(Ogataea polymorpha)(毕赤酵母科)的硝酸还原酶被认为能够使用NADH和NADPH两者。据说亚硝酸盐被含有FAD的酶,亚硝酸还原酶(EC1.7.1.4)进一步还原为氨,所述酶由YNI1基因编码。芽殖酵母亚硝酸还原酶的氧化还原辅因子特异性由Linder指出尚未以全面方式进行研究。
同样在Siverio的在FEMS Microbiology Reviews第26卷(2002)第277-284页上发表的标题为“Assimilation of nitrate by yeasts”,文章中,提到酵母能够使用多种化合物作为氮源。然而,硝酸根和亚硝酸根的使用局限于不同属的相对少数物种。提到酵母(Saccharomyces)属和裂殖酵母属(Schizosaccharomyces)的酵母不能使用硝酸根或亚硝酸根作为唯一的氮源。Siverio所研究的酵母多形汉逊酵母(现更名为安格斯毕赤酵母(Pichia angusta))被发现确实包含硝酸还原酶活性。
正如上面由Linder所指出的,氨是用于酵母培养的优选氮源。尿素可以是廉价的氨源。尿素可容易地分解成两分子的铵离子和一分子的二氧化碳。然而,如Ingledew等人在其发表在American Journal of Enology and Viticulture,(1987),第38卷,第332-335页的文章中所指示,许多国家现已禁止将尿素用作用于饮用酒精制造的酵母食物成分,因为尿素会导致产生少量氨基甲酸乙酯(urethane/ethyl carbamate),氨基甲酸乙酯是食物中的疑似致癌物。Yoa等人在其发表在J.Agric.Food Chem.(2020),第68卷,10984-10991中的题为“Quantitative Analysis of Ethyl Carbamate in Distillers Grains Coproductsand Bovine Plasma by Gas Chromatography-Mass Spectrometry”的文章中已经开发了气相色谱-质谱测定来量化从各种酒糟副产物中提取的氨基甲酸乙酯(缩写为EC,被称为第2A组可能的人类致癌物),并且发现玉米浓缩蒸馏物的可溶物含有范围为1618ng/g至2956ng/g的最高浓度的氨基甲酸乙酯。其他类型的酒糟副产物中的氨基甲酸乙酯的浓度为17ng/g至917ng/g不等。发现饲喂占总饲料(在饲喂时)19-38%的酒糟副产物的家牛在血浆中含有2-3ng/mL的氨基甲酸乙酯。
WO2013/076144A2描述了一种为生产2,3-丁二醇(BDO)而工程化的重组微生物。该专利公布描述2,3-丁二醇是通过酵母进行的醇发酵的副产物,并且通常是葡萄酒中最丰富的次要成分之一。这表明,已经进行了许多尝试来通过以下方式工程化具有降低的乙偶姻产率的酿酒酵母菌株:将碳重新定向到甘油和2,3-BDO以获得具有期望感官特征的低酒精度酵母,从而允许降低葡萄酒中的乙醇含量。WO2013076144A2涉及一种重组微生物,所述重组微生物经工程化以产生2,3-丁二醇(BDO),其中所述微生物选自细菌或酵母并过表达至少一种编码参与将丙酮酸酯转换为2,3-丁二醇的多肽的基因。应用NADH依赖性丁二醇脱氢酶和/或NADH依赖性乙偶姻脱氢酶举例说明了六种不同的代谢途径。
在WO2013/076144A2中描述了2,3-丁二醇生产的许多优化。顺便作为示例,提及NADH依赖性甘油醛-3-磷酸脱氢酶可以通过NADPH依赖性酶替代。值得注意的是,在这种特定情况下,产生BDO的生物体将产生过量的NADPH。有人提到,这种NADPH继而可以经由同化硝酸盐还原来使用,从而需要将硝酸还原酶引入某些缺乏这种酶的酵母菌株中。
本领域中的进步是提供一种新颖酵母细胞,所述新颖酵母细胞适用于用于生产发酵产物(例如乙醇)的厌氧发酵方法,所述新颖酵母细胞与其对应的野生型生物体相比具有降低的甘油产量或如果将所述细胞用于乙醇的发酵制备,则所述细胞缺乏甘油产量。
本领域中的进一步进步是提供一种新颖酵母细胞,所述新颖酵母细胞的使用将导致在厌氧发酵方法中较少受到乳酸菌的污染。不希望受任何类型的理论的束缚,认为在酵母属酵母细胞发酵基于淀粉的原料期间,乳酸菌的污染可降低乙醇产量。
本领域中的进一步进步是提供一种新颖酵母细胞,所述新颖酵母细胞—当在厌氧发酵方法中使用时—导致产生酒糟副产物的具有商业意义的产量,与用其野生型对应物获得的酒糟副产物相比,所述酒糟副产物含有减少量的氨基甲酸乙酯和/或在其他方面改善的品质。
发明内容
因此,本发明提供一种酵母属酵母细胞,优选地酿酒酵母酵母细胞,所述酵母细胞包含一个或多个编码具有NADH依赖性硝酸还原酶活性的酶的核酸序列和/或一个或多个编码具有NADH依赖性亚硝酸还原酶活性的酶的核酸序列。
优选地,此类酵母属酵母细胞进一步包含一个或多个编码具有硝酸盐和/或亚硝酸盐转运体活性的酶的核酸序列。
进一步,此类酵母属酵母细胞可优选地包含黄素腺嘌呤二核苷酸(FAD)、一个或多个血红素辅基和/或钼辅因子(MoCo)、和/或一个或多个编码黄素腺嘌呤二核苷酸(FAD)的核酸序列、一个或多个血红素辅基、和/或钼辅因子(MoCo)。
优选地,所述酵母属酵母细胞是转基因的、重组的和/或经遗传修饰的酵母属酵母细胞。在这种情况下,上述核酸序列优选是与用于构建这种转基因、重组和/或经遗传修饰的酵母属酵母细胞的宿主细胞异源的核酸序列。
有利地,所述酵母属酵母细胞当在发酵方法中使用时,可产生与对应的野生型细胞相比更少的氨基甲酸乙酯。
有利地,所述酵母属酵母细胞当在发酵方法中使用时,可产生与对应的野生型细胞相比更少的甘油。优选地,与对应的野生型细胞相比,所述酵母属酵母细胞可不具有磷酸甘油磷酸酶活性或具有降低的磷酸甘油磷酸酶活性。更优选地,所述酵母属酵母细胞可包含在至少一个选自由GPD1、GPD2、GPP1和GPP2组成的组的基因中的基因组突变,优选地一个或多个选自由GPD1、GPD2、GPP1和GPP2组成的组的基因的缺失。
优选地,所述酵母属酵母细胞可以进一步包含:
-一个或多个编码甘油脱氢酶的核酸序列;和/或
-一个或多个编码二羟基丙酮激酶的核酸序列;和/或
-一个或多个编码甘油转运体的核酸序列。
此外,本发明提供了一种用于生产发酵产物的厌氧发酵方法,所述厌氧发酵方法包括使用如本文所述的酵母属酵母细胞发酵进料,所述进料包含氧化氮源和可发酵碳源。
优选地,可发酵碳源包含一种或多种单糖、二糖和/或多糖(例如淀粉)或由一种或多种单糖、二糖和/或多糖(例如淀粉)组成。
优选地,氧化氮源包含或由以下组成:
-硝酸、硝酸盐或硝酸根离子;和/或
-亚硝酸、亚硝酸盐或亚硝酸根离子。
方便地,所述氧化氮源可以是包含硝酸根和/或亚硝酸根与选自由铵、氨和尿素组成的组的一种或多种其他氮源的组合的组合物的一部分。
有利地,可以产生选自由以下组成的组的发酵产物:乙醇、正丁醇、异丁醇、乳酸、3-羟基-丙酸、丙烯酸、乙酸、琥珀酸、富马酸、苹果酸、衣康酸、马来酸、柠檬酸、己二酸。
此外,可以产生发酵副产物,所述发酵副产物优选地包含或由酒糟,例如具有或不具有可溶物的湿酒糟和/或干酒糟组成。此类发酵副产物,例如此类酒糟,可以有利地包含等于或小于17ng/g的氨基甲酸乙酯。
本发明进一步提供了一种包含酒糟的产物,所述产物是通过本文所述的发酵方法获得或可获得的。此外,本发明提供了一种包含酒糟的产物,所述产物包含等于或小于17ng/g的氨基甲酸乙酯。此类酒糟可包含或由具有或不具有可溶物的湿酒糟和/或干酒糟组成。
本发明进一步提供如本文所述的发酵副产物在动物饲料和/或肥料中的用途。
已经特别地发现了根据本发明的酵母属酵母细胞
有利的是可显著减少或基本上消除甘油产量和/或氨基甲酸乙酯产量,并且可增加所需产物(例如乙醇)的产量。本发明允许增加酵母属酵母细胞中的胞质NADH水平。例如,在乙醇发酵方法中,这可以有利地导致提高的乙醇产率和/或甘油形成减少。这些优点在下文中进一步详述。
此外,当用包含氧化氮源的进料或培养基进行发酵时,本发明允许酵母属酵母细胞相较于污染物(例如乳酸菌)具有优势。由于酵母属酵母细胞的转换氧化氮源的能力,而乳酸菌可能没有这种能力或可能具有较小程度的这种能力,因此降低了乳酸菌达到临界浓度的风险。
序列表的简要说明
本申请包含计算机可读形式的序列表,所述序列表以引用方式并入本文。下表1提供了概述:
表1:序列表的概述:
Figure BDA0004159466160000071
Figure BDA0004159466160000081
Figure BDA0004159466160000091
在本专利申请的上下文中,上述蛋白质/氨基酸序列中的每一者优选地由为在酿酒酵母中表达而进行密码子对优化的DNA/核酸序列编码。为了达到最佳表达,可以加入一个或多个启动子。启动子可以从强到弱调节,并且可包括TDH3、FBA1、ENO2、PGK1、TEF1、HTA1、HHF2、RPL8A、CHO1、RPS3、EFT2、HTA2、ACT1、PFY1、CUP1、ZUO1、VMA6和/或ANB1、HEM13、YHK8、FET4、TIR4、AAC3中的一者或多者。
附图说明
图1提供了对酵母细胞中涉及的代谢途径的概述。
具体实施方式
定义
除非另有定义或由上下文明确指出的,否则本文使用的所有技术和科学术语具有与本领域的普通技术人员通常理解的含义相同的含义。
在整个说明书和所附权利要求书中,词语“包括(comprise)”和“包含(nclude)”以及诸如“包括(comprises/comprising)”和“包含(includes/including)”的变型将被包含性地解释。也就是说,在上下文允许的情况下,这些词语旨在传达可能包括未具体叙述的其他要素或整数。
冠词“一(a/an)”在本文中用于指代一个(种)或多于一个(种)(即,一个(种)或至少一个(种))该冠词的语法对象。举例来说,“一要素”可以表示一个要素或多于一个要素。当以单数形式提及名词(例如化合物、添加剂等)时,意味着包括复数。因此,当提及例如“基因”之类的特定部分时,这意味着该基因中的“至少一种”,例如“至少一种基因”,除非另有说明。
当提及存在几种异构体(例如D对映体和L对映体)的化合物时,该化合物原则上包括该化合物的所有可用于本发明的特定方面的对映异构体、非对映异构体和顺式/反式异构体;特别地当提及诸如化合物时,该化合物包括天然异构体。
术语“碳源”是指碳的来源,优选是包含碳的化合物或分子。优选地,碳源是碳水化合物。碳水化合物在本文中被理解为由碳、氧和氢组成的有机化合物。合适地,碳源可选自由以下组成的组:单糖、二糖和/或多糖、多元醇、酸和酸式盐。更优选地,碳源是选自以下组的化合物:葡萄糖、阿拉伯糖、木糖、半乳糖、甘露糖、鼠李糖、果糖、甘油和乙酸或其盐。
术语“发酵”及其变体,例如“发酵”和/或“发酵性的”,在本文中以经典意义使用,即表示过程在厌氧条件下进行或已经在厌氧条件下进行。厌氧发酵在本文中被定义为在厌氧条件下进行的发酵。厌氧条件在本文中被定义为没有任何氧气的条件或酵母细胞基本上不消耗氧气的条件。基本上不消耗氧气的条件适当地对应于小于5mmol/l.h-1的氧气消耗,特别是小于2.5mmol/l.h-1或小于1mmol/l.h-1的氧气消耗。更优选地,消耗0mmol/L/h(即,氧气消耗为不可检测的)。这合适地对应于培养物发酵液中的溶氧浓度小于空气饱和度的5%,更合适地溶氧浓度小于空气饱和度的1%或小于空气饱和度的0.2%。
术语“细胞”是指优选作为单个细胞存在的真核生物或原核生物。在本发明中,细胞是酵母细胞。也就是说,重组细胞选自由酵母组成的属的组。
术语“酵母”和“酵母细胞”在本文中可互换使用,并且是指一组系统发生不同的单细胞真菌,所述单细胞真菌中的大多数为子囊菌门(Ascomycota)和担子菌门(Basidiomycota)。芽殖酵母(“真酵母”)被分类为酵母(Saccharomycetales)目。根据本发明的酵母细胞是酵母属酵母细胞并且被定义为源自酵母属的酵母细胞。优选地,酵母细胞是酿酒酵母物种的酵母细胞。
术语“重组的”,例如提及本文所用的“重组酵母”、“重组细胞”、“重组微生物”和/或“重组菌株”,分别是指含有作为一种或多种遗传修饰的结果的核酸的酵母、细胞、微生物或菌株。简而言之,所述酵母、细胞、微生物或菌株含有与其亲本(中的任一者)不同的核酸组合。为了构建重组酵母、细胞、微生物或菌株,可以使用重组DNA技术和/或另一种诱变技术。特别地,重组酵母和/或重组酵母细胞可包含对应的野生型酵母和/或细胞中不存在的核酸,所述核酸已经使用重组DNA技术引入到该酵母和/或酵母细胞中(即转基因酵母和/或细胞),或者所述不存在于所述野生型酵母和/或细胞中的核酸是存在于所述野生型酵母和/或酵母细胞中的核酸序列(例如编码野生型多肽的基因)—例如使用重组DNA技术或另一种诱变技术,例如紫外照射—进行一个或多个突变的结果,或者其中基因的核酸序列已经被修饰以将多肽产物(编码该多肽产物)靶向另一个细胞区室。此外,术语“重组的”可以适当地涉及已经例如使用重组DNA技术从中去除了核酸序列的酵母、细胞、微生物或菌株。
包含或具有某种活性的重组酵母在本文中被理解为重组酵母可包含一个或多个编码具有此类活性的酶的核酸序列。因此允许重组酵母功能性地表达此类蛋白质。
如本文所用的术语“转基因的”,例如提及“转基因酵母”和/或“转基因细胞”,分别是指这样的酵母和/或细胞,所述酵母和/或细胞含有非天然存在于所述酵母和/或细胞中的核酸,并且所述核酸已使用重组DNA技术引入所述酵母和/或细胞中,例如重组酵母和/或细胞。
如本文所用的关于蛋白质或多肽的术语“突变的”是指野生型或天然存在的蛋白质或多肽序列中的至少一个氨基酸已经经由对编码这些氨基酸的核酸进行诱变而被不同的氨基酸取代、插入,或从该序列中缺失。诱变是本领域中众所周知的方法,并且包括例如借助于PCR或经由寡核苷酸介导的诱变进行的定点诱变,如在Sambrook等人,MolecularCloning-A Laboratory Manual,第2版,第1-3卷(1989)中所述。如本文所用的关于基因的术语“突变的”是指该基因的核酸序列或该基因的调控序列中的至少一个核苷酸已经被不同的核苷酸取代,或者已经经由诱变从该序列中缺失,从而导致对具有定性改变的功能的蛋白质序列的转录或对该基因的敲除。在本发明的上下文中,“改变的基因”具有与突变基因相同的含义。
本文所用的术语“基因(gen/gene)”是指这样的核酸序列,所述核酸序列可转录成mRNA,然后所述mRNA被翻译成蛋白质。编码某种蛋白质的基因是指一个或多个编码此类蛋白质的核酸序列。
如本文所用的术语“核酸”是指对单链或双链形式的脱氧核糖核苷酸或核糖核苷酸的聚合物(即多核苷酸),并且除非另有限制,否则涵盖具有天然核苷酸的基本性质的已知类似物,因为所述已知类似物以类似于天然存在的核苷酸(例如肽核酸)的方式与单链核酸杂交。多核苷酸可以是天然或异源的结构或调控基因的全长序列或子序列。除非另有说明,否则该术语包括对指定序列及其互补序列的提及。因此,具有出于稳定性或其他原因而被修饰的主链的DNA或RNA是“多核苷酸”,如该术语在本文中所用的。此外,仅举两个示例,包含不常见碱基(诸如肌苷)或经修饰的碱基(诸如三苯甲基化碱基)的DNA或RNA是如本文所使用的术语的多核苷酸。应当理解,已经对DNA和RNA进行了多种修饰,该多种修饰用于本领域技术人员已知的许多有用目的。本文采用的术语多核苷酸包括这种化学、酶促或代谢修饰形式的多核苷酸,以及病毒和细胞(尤其包括简单细胞和复杂细胞)特有的DNA和RNA的化学形式。
术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,用于指代氨基酸残基的聚合物。该术语适用于这样的氨基酸聚合物,在所述氨基酸聚合物中一个或多个氨基酸残基是对应的天然存在的氨基酸的人工化学类似物;以及适用于天然存在的氨基酸聚合物。天然存在的氨基酸的这种类似物的基本性质是,当结合成蛋白质时,该蛋白质对针对相同但完全由天然存在的氨基酸组成的蛋白质被激发的抗体为特异性反应的。术语“多肽”、“肽”和“蛋白质”还包含修饰,该等修饰包括但不限于糖基化、脂质附着、硫酸化、谷氨酸残基的γ-羧化、羟基化和ADP核糖基化。
当参考酶分类(EC)提及酶时,该酶分类是基于由国际生物化学与分子生物学联合会命名委员会(Nomenclature Committee of the International Union ofBiochemistry and Molecular Biology,NC-IUBMB)提供的酶命名法,酶被分类为或可分类为的类别,该命名法可在http://www.chem.qmul.ac.uk/iubmb/enzyme/处找到。还包括没有(尚未)被分类为特定类别但可如此分类的其他合适的酶。
如果在本文中通过引用登录号来提及蛋白质或核酸序列(诸如基因),则除非另有说明,否则该数字特别地用于指代具有可经由www.ncbi.nlm.nih.gov/(在2020年10月1日可得)找到的序列的蛋白质或核酸序列(基因)。
本文中编码多肽的每个核酸序列也包括其任何经保守修饰的变体。这包括参照遗传密码,所述遗传密码描述了所述核酸的每一种可能的沉默变异。术语“经保守修饰的变体”适用于氨基酸和核酸序列两者。关于特定的核酸序列,保守修饰的变体是指由于遗传密码子的简并性而编码氨基酸序列的相同或保守修饰的变体的那些核酸。术语“遗传密码子的简并性”是指大量功能相同的核酸编码任何给定蛋白质的事实。例如,密码子GCA、GCC、GCG和GCU均编码氨基酸丙氨酸。因此,在每个由密码子指定的丙氨酸位置处,可以在不改变编码的多肽的情况下将密码子改变为所述的任何对应密码子。这种核酸变异是“沉默变异”并且代表一种保守修饰的变异。
编码本文的酶的任何外源基因包含编码与任何SEQ ID NO:X具有至少40%、50%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%氨基酸序列同一性的氨基酸序列的核苷酸序列,其中SEQ ID NO:X是本申请的序列表中的蛋白质序列中的任何蛋白质序列。编码酶的外源基因也可包含编码与任何SEQ ID NO:X的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列的核苷酸序列。优选地,与SEQ ID NO:X相比,所述氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个、9个、8个、7个、6个、5个、4个、3个、2个或1个氨基酸取代、插入和/或缺失。
编码本文酶的任何外源基因包含与任何SEQ ID NO:Y具有至少40%、50%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、95%、96%、97%、98%、99%或100%核苷酸(DNA)序列同一性的核苷酸序列,其中SEQ ID NO:Y是本申请的序列表中的任何核苷酸(DNA)序列。
如本文所用,术语具有特定序列(例如“SEQ ID NO:X”)的多肽和/或氨基酸序列的“功能同源物”(或简称“同源物”)是指包含所述特定序列的多肽和/或氨基酸序列,前提条件是一个或多个氨基酸被取代、缺失、添加和/或插入,并且该多肽具有(定性地)用于底物转换的相同酶功能。该功能可以通过使用包含重组细胞的测定系统来测试,该重组细胞包含用于在酵母中表达同源物的表达载体,所述表达载体包含可操作地连接到酵母中的功能性启动子的异源核酸序列,并且所述异源核酸序列编码酶促活性为在待测试的细胞中将乙酰辅酶A转换为乙醛的同源多肽,以及评定所述转换是否发生在所述细胞中。关于核酸序列,术语功能同源物意指包括由于遗传密码子的简并性而与另一核酸序列不同但编码相同多肽序列的核酸序列。
序列同一性在本文中定义为两个或更多个氨基酸(多肽或蛋白质)序列或两个或更多个核酸(多核苷酸)序列之间的关系,如通过比较序列所确定的。通常,在所比较的序列的全长上比较序列同一性或相似性。在本领域中,“同一性”还意指氨基酸或核酸序列(视情况而定)之间的序列相关性程度,如通过具有此类序列的链之间的匹配所确定的。
氨基酸或核苷酸序列当表现出一定的相似性水平时,被认为是同源的。两个同源的序列表示共同的进化起源。两个同源序列是密切相关还是更远距离相关由“百分比同一性”或“相似性百分比”表示,密切相关和更远距离相关分别为高或低“同一性百分比”或“相似性百分比”。尽管存在争议,但为了表示“同一性百分比”或“相似性百分比”,“同源性水平”或“同源性百分比”经常互换使用。可以使用数学算法来完成序列的比较和对两个序列之间的同一性百分比的确定。本领域技术人员将意识到以下事实:几种不同的计算机程序可用于比对两个序列并确定这两个序列之间的同源性(Kruskal,J.B.(1983)An overviewof sequence comparison,在D.Sankoff和J.B.Kruskal(编辑),Time warps,string editsand macromolecules:the theory and practice of sequence comparison,第1-44页,Addison Wesley中)。两个氨基酸序列之间的同一性百分比可以使用用于比对两个序列的Needleman和Wunsch算法来确定。(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。该算法比对氨基酸序列以及核苷酸序列。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。出于本发明的目的,使用来自EMBOSS程序包的NEEDLE程序(2.8.0版或更高版本,EMBOSS:The European Molecular Biology Open Software Suite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6),第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列,使用EBLOSUM62来用于取代矩阵。对于核苷酸序列,使用EDNAFULL。可以指定其他矩阵。用于比对氨基酸序列的任选参数是空位开放罚分10和空位延伸罚分0.5。技术人员将理解,当使用不同的算法时,所有这些不同的参数将产生略微不同的结果,但是两个序列的总体同一性百分比不会显著改变。
同源性或同一性是在包括任何空位或延伸的整个比对区域上两个完整序列之间匹配的同一性百分比。两个比对序列之间的同源性或同一性计算如下:两个序列在比对中显示出相同氨基酸的对应位置的数目除以包括空位的总比对长度。如本文所定义的同一性可以从NEEDLE获得,并在程序的输出中标记为“IDENTITY”。
两个比对序列之间的同源性或同一性计算如下:在两个序列中显示相同氨基酸的比对中对应位置的数目除以减去比对中的空位总数后的比对总长度。如本文所定义的同一性可以通过使用NOBRIEF选项从NEEDLE获得,并在程序的输出中标记为“最长同一性”。
本文所公开的核苷酸或氨基酸序列的变体还可以定义为与(例如,在序列表中)本文特别公开的核苷酸或氨基酸序列相比具有一个或多个取代、插入和/或缺失的核苷酸或氨基酸序列。
任选地,在确定氨基酸相似性程度时,技术人员还可以考虑所谓的“保守性”氨基酸取代,如本领域技术人员所清楚的。保守氨基酸取代是指具有相似侧链的残基的可互换性。例如,一组具有脂肪族侧链的氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;一组具有脂肪族-羟基侧链的氨基酸是丝氨酸和苏氨酸;一组具有含酰胺侧链的氨基酸是天冬酰胺和谷氨酰胺;一组具有芳族侧链的氨基酸是苯丙氨酸、酪氨酸和色氨酸;一组具有碱性侧链的氨基酸是赖氨酸、精氨酸和组氨酸;并且一组具有含硫侧链的氨基酸是半胱氨酸和甲硫氨酸。在一个实施方式中,保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸,以及天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的取代变体是这样的变体,在该等变体中已去除了所公开序列中的至少一个残基并在该至少一个残基的位置插入不同残基。优选地,氨基酸变化是保守性的。在一个实施方式中,每种天然存在的氨基酸的保守取代如下:Ala至Ser;Arg至Lys;Asn至Gln或His;Asp至Glu;Cys至Ser或Ala;Gln至Asn;Glu至Asp;Gly至Pro;His至Asn或Gln;Ile至Leu或Val;Leu至Ile或Val;Lys至Arg;Gln或Glu;Met至Leu或Ile;Phe至Met、leu或Tyr;Ser至Thr;Thr至Ser;Trp至Tyr;Tyr至Trp或Phe;以及Val至Ile或Leu。
本发明的核苷酸序列还可以按照它们分别在中等杂交条件下或优选在严格杂交条件下与本文所述的特定核苷酸序列的各部分杂交的能力来定义。严格杂交条件在本文中被定义为这样的条件,该等条件允许具有至少约25个核苷酸,优选约50个核苷酸、75个或100个核苷酸,以及最优选约200个或更多个核苷酸的核酸序列在约65℃的温度下在包含约1M盐(优选6×SSC)的溶液或具有相当离子强度的任何其他溶液中进行杂交,并在65℃下以包含约0.1M或更少的盐(优选0.2×SSC)的溶液或具有相当离子强度的任何其他溶液洗涤。优选地,执行杂交过夜,即至少10小时,并且优选地执行洗涤至少一小时,其中洗涤溶液至少更换两次。这些条件将通常允许具有约90%或更高序列同一性的序列的特异性杂交。
中等条件在本文中定义为这样的条件,该等条件允许具有至少50个核苷酸,优选约200个或更多个核苷酸的核酸序列在约45℃的温度下在包含约1M盐(优选6×SSC)的溶液或具有相当离子强度的任何其他溶液中杂交,并在室温下以包含约1M盐(优选6×SSC)或具有相当离子强度的任何其他溶液洗涤。优选地,执行杂交过夜,即至少10小时,并且优选地执行洗涤至少一小时,其中洗涤溶液至少更换两次。这些条件将通常允许具有高达50%序列同一性的序列的特异性杂交。本领域技术人员将能够修改这些杂交条件,以便特异性地鉴定同一性在50%和90%之间变化的序列。
“表达”是指将基因转录成结构RNA(rRNA、tRNA)或信使RNA(mRNA),随后翻译成蛋白质。“过表达”是指重组细胞对基因的表达超过所述基因在对应野生型细胞中的表达。此类过表达可以例如通过以下方式布置:增加一个或多个核酸序列的转录频率,例如通过将核酸序列可操作地连接到重组细胞内有功能的启动子上;和/或通过增加某种核酸序列的拷贝数。
核酸序列(即多核苷酸)或蛋白质(即多肽)可以与宿主细胞的基因组同源或异源。
与宿主细胞“同源”是指核酸序列天然存在于宿主细胞的基因组中,或者蛋白质是由该细胞天然产生的。同源蛋白表达可以是例如过表达或在不同启动子控制下的表达。在本发明中,宿主细胞是酵母。
关于宿主细胞,术语“异源的”是指多核苷酸不是天然存在于宿主细胞的基因组中,或者多肽不是由该细胞天然产生的。异源蛋白表达涉及不是在宿主细胞中天然产生的蛋白质的表达。如本文所用,“异源的”可指核酸或蛋白质是源自外来物种的核酸或蛋白质,或者如果源自相同物种,则为通过刻意的人为干预而在其组成和/或基因组基因座方面相对于其天然形式发生实质性改变的。例如,与异源结构基因可操作地连接的启动子来自与该结构基因所来源于的物种不同的物种,或者如果来自相同物种,则它们中的一者或两者为相对于它们的来源形式发生实质性改变的。异源蛋白质可以源自外来物种,或者如果来自相同物种,则为通过刻意的人为干预而相对于其原始形式发生实质性改变的。
术语“异源表达”是指异源核酸在宿主细胞中的表达。异源蛋白质在诸如酵母之类的真核宿主细胞系统中的表达是本领域技术人员熟知的。包含编码具有特定活性的酶的基因的核酸序列的多核苷酸可以在这种真核系统中表达。在一些实施方式中,转化/转染的细胞可以用作用于表达酶的表达系统。异源蛋白质在酵母中的表达是众所周知的。Sherman,F.等人,Methods in Yeast Genetics,Cold Spring Harbor Laboratory(1982)是描述了可用于在酵母中表达蛋白质的各种方法的公知工作。两种被广泛利用的酵母是酿酒酵母和毕赤酵母(Pichia pastoris)。用于在酵母属和毕赤酵母属中表达的载体、菌株和方案是本领域中已知的,并且可从商业供应商(例如,Invitrogen)获得。合适的载体通常具有表达控制序列,诸如启动子,根据需要包括3-磷酸甘油酸激酶或醇氧化酶,以及复制起点、终止序列等。
如本文所用,“启动子”是指导(结构)基因转录的DNA序列。通常,启动子位于基因的5′区域中,靠近(结构)基因的转录起始位点。启动子序列可以是组成型的、诱导型的或阻抑型的。在一个实施方式中,不需要(外部)诱导物。
如本文所用的术语“载体”包括对常染色体表达载体和对用于整合到染色体中的整合载体的提及。
术语“表达载体”是指线性或环状的DNA分子,该线性或环状的DNA分子包含编码感兴趣的多肽的区段,该区段在提供用于其转录的附加核酸区段的控制下(即可操作地连接到所述附加核酸区段)。此类附加区段可包括启动子序列和终止子序列,并且可任选地包括一个或多个复制起点、一个或多个选择性标记、增强子、多腺苷酸化信号等。表达载体通常来源于质粒或病毒DNA,或可含有两者的元件。具体地,表达载体包含这样的核酸序列,该核酸序列包含在5′至3′方向上并可操作地连接的以下项:(a)酵母识别的转录和翻译起始区,(b)感兴趣的多肽的编码序列,以及(c)酵母识别的转录和翻译终止区。“质粒”是指自主复制的染色体外DNA,其未整合到微生物的基因组中并且通常实质上是环状的。
“整合载体”是指线性或环状的DNA分子,该线性或环状的DNA分子可以并入到微生物的基因组中并提供编码感兴趣的多肽的基因的稳定遗传。整合载体通常包含这样的一个或多个区段,该一个或多个区段包含在提供用于基因序列转录的附加核酸区段的控制下(即可操作地连接到该等附加核酸区段)编码感兴趣的多肽的基因序列。此类附加区段可包括启动子序列和终止子序列,以及通常通过同源重组过程来驱动将感兴趣的基因并入到靶细胞基因组中的一个或多个区段。通常,整合载体将为可转移到靶细胞中的载体,但该载体具有在该生物体中无功能的复制子。如果在包含感兴趣的基因的区段内包含适当的标记,则可以选择整合该区段。
“宿主细胞”在本文中被理解为细胞,例如酵母细胞,该细胞将用一个或多个编码一种或多种异源蛋白质的核酸序列转化,以构建经转化的细胞,也称为重组细胞。例如,转化的细胞可包含载体,并且可支持该载体的复制和/或表达。
如本文所用,“转化(transformation/transforming)”是指将外源多核苷酸(即外源核酸序列)插入宿主细胞中,而不管用于该插入的方法(例如,直接摄取、转导、f-接合(f-mating)或电穿孔)如何。外源多核苷酸可以保持为非整合载体,例如质粒,或者可以整合到宿主细胞基因组中。
“破坏”在本文中被理解为任何活性破坏,包括但不限于被破坏的基因的缺失、突变和亲和力降低以及与此类被破坏的基因互补的RNA的表达。它包括所有核酸修饰,例如核苷酸缺失或取代、基因敲除,以及其他影响对应多肽的翻译或转录和/或影响酶促(特异性)活性、酶的底物特异性和/或稳定性的动作。它还包括可靶向编码序列或基因的启动子的修饰。基因缺失菌株(gene disruptant)是具有相应基因的一次或多次破坏的细胞。对酵母天然的在本文中被理解为基因在破坏前存在于酵母细胞中。
术语“编码”具有与“用于编码”相同的含义。因此,举例来说,“一种或多种编码甘油脱氢酶的基因”具有与“一种或多种用于编码甘油脱氢酶的基因”相同的含义。就编码酶的基因而言,短语“一种或多种编码X的基因”具有与“一种或多种编码具有X活性的酶的基因”相同的含义,其中X表示酶。因此,以举例方式,“一个或多个编码NADH依赖性硝酸还原酶的基因”与“一个或多个编码具有NADH依赖性硝酸还原酶活性的酶的基因”具有相同的含义;并且“一种或多种编码NADH依赖性亚硝酸还原酶的异源基因”与“一种或多种编码具有NADH依赖性亚硝酸还原酶活性的酶的异源基因”具有相同的含义。
缩写“NADH”是指烟酰胺腺嘌呤二核苷酸的还原氢化形式。缩写“NAD+”是指烟酰胺腺嘌呤二核苷酸的氧化形式。烟酰胺腺嘌呤二核苷酸可充当所谓的辅因子,协助细胞中的生化反应和/或转化。
“NADH依赖性的”在本文中等同于NADH特异性的,并且“NADH依赖性”在本文中等同于NADH特异性。
NADH依赖性酶在本文中被理解为专门依赖于作为辅因子的NADH或主要依赖于作为辅因子的NADH的酶。“专门NADH依赖性”酶在本文中被理解为对NADH的绝对需求超过NADPH的酶。也就是说,它只有在NADH被作为辅因子应用时才有活性。“主要NADH依赖性”酶在本文中被理解为对作为辅因子的NADH比对作为辅因子的NADPH具有更高特异性和/或更高催化效率的酶。
该酶的特异性特征可由下式描述:
1<Km NADP+/Km NAD+<∞(无穷)
其中Km是所谓的米氏常数。
对于主要NADH依赖性酶,优选地KmNADP+/KmNAD+在1与1000之间、1与500之间、1与200之间、1与100之间、1与50之间、1与10之间、5与100之间、5与50之间、5与20之间或5与10之间。使用已知的分析技术、计算和方案,本文中酶的Km可以分别针对NAD+和NADP+被确定为酶特异性的。这些描述于例如Lodish等人,Molecular Cell Biology第6版,Freeman编著,第80页和第81页,例如图3至图22。
对于主要NADH依赖性酶,优选地作为辅因子的NADPH/NADP+的催化效率(kcat/Km)NADP+与作为辅因子的NADH/NAD+的催化效率(kcat/Km)NAD+之比,即催化效率比(kcat/Km)NADP+:(kcat/Km)NAD+,大于1:1,更优选地等于或大于2:1,还更优选地等于或大于5:1,甚至更优选地等于或大于10:1,还甚至更优选地等于或大于20:1,甚至还更优选地等于或大于100:1,最优选地等于或大于1000:1。
不存在上限,但出于实际原因,主要NADH依赖性酶的催化效率比(kcat/Km)NADP+:(kcat/Km)NAD+可等于或小于1.000.000.000:1(即1.109:1)。
酵母属酵母细胞
酵母属酵母细胞优选是来源于酿酒酵母物种酵母细胞的酵母细胞,在本文中也被称为酿酒酵母酵母细胞。
在替代实施方式中,如本文所述的酵母属酵母细胞可以用裂殖酵母属(Schizosaccharomyces)酵母细胞,例如粟酒裂殖酵母(Schizosaccharomyces pompe)酵母细胞替代,并且可以替代地使用此类裂殖酵母属酵母细胞。
优选地,酵母属酵母细胞是工业酵母细胞。工业过程中的酵母细胞的生存环境与实验室中的生存环境明显不同。工业酵母细胞必须能够在过程期间可能变化的多种环境条件下表现良好。此类变化包括营养来源、pH、乙醇浓度、温度、氧气浓度等的变化,它们共同对酵母细胞的细胞生长和乙醇产生具有潜在影响。工业酵母细胞可以理解为是指当与实验室对应物相比时具有更稳健性能的酵母细胞。也就是说,当与实验室对应物相比时,当选自由营养物来源、pH、乙醇浓度、温度、氧气浓度组成的组的一种或多种环境条件在发酵期间变化时,工业酵母细胞表现出较小的性能变化。优选地,所述酵母属酵母细胞是基于作为宿主的工业酵母属酵母细胞构建的,其中所述构建如下所述进行。工业酵母属酵母细胞的示例是Ethanol
Figure BDA0004159466160000221
(Fermentis)、
Figure BDA0004159466160000222
(DSM)和
Figure BDA0004159466160000223
(Lallemand)。
酵母属酵母细胞包含一个或多个编码NADH依赖性硝酸还原酶的基因和/或一个或多个编码NADH依赖性亚硝酸还原酶的基因。此外,本文所述的酵母属酵母细胞可包含一个或多个编码硝酸盐和/或亚硝酸盐转运体的基因和任选地一个或多个编码其他酶的基因。
本文所述的酵母属酵母细胞可衍生自任何能够产生发酵产物的宿主细胞。优选地,本文所述的酵母属酵母细胞衍生自具有产生乙醇的能力的宿主细胞。优选地,宿主细胞是酵母属酵母细胞,更优选地是如上所述的工业酵母属酵母细胞。
本文所述的酵母属酵母细胞可通过本领域技术人员已知的任何适合并入所需基因的技术衍生自宿主细胞。此类技术可包括诱变、重组DNA技术(包括但不限于CRISPR-CAS技术)、选择性和/或适应性进化、酵母菌株之间的交配、细胞融合和/或胞导(cytoduction)中的任何一者或多者。适当地,一个或多个编码NADH依赖性硝酸还原酶的基因和/或一个或多个编码NADH依赖性亚硝酸还原酶的基因和/或任何其他基因通过上述技术中的一种或多种技术的组合并入酵母属酵母细胞中。
硝酸还原酶
硝酸还原酶(NR)催化硝酸根(NO3 -)还原为亚硝酸根(NO2 -)。亚硝酸还原酶催化亚硝酸根还原为氨(NH3)。硝酸还原酶和/或亚硝酸还原酶可以是某些细胞中所谓的氮同化途径的一部分。包含硝酸还原酶活性和/或亚硝酸还原酶活性的细胞包括某些植物细胞和细菌细胞以及少数酵母细胞。正如Linder所指出的,同化除氨以外的无机氮源的能力被认为在芽殖酵母中很罕见。在天然能够同化硝酸根或亚硝酸根的少数真菌中有食腺嘌呤芽生葡萄孢酵母(毛红曲霉科)、博伊丁假丝酵母(毕赤酵母科)、杰丁塞伯林德纳氏酵母(法夫酵母科)和多形汉逊酵母(毕赤酵母科)。
优选地,如本文所述的酵母属酵母细胞包含至少一个或多个编码NADH依赖性硝酸还原酶的基因。
NADH依赖性硝酸还原酶在本文中被理解为专门依赖于作为辅因子的NADH或主要依赖于作为辅因子的NADH的硝酸还原酶。优选地,NADH依赖性硝酸还原酶的作为辅因子的NADPH/NADP+的催化效率(kcat/Km)NADP+与作为辅因子的NADH/NAD+的催化效率(kcat/Km)NAD+之比,即催化效率比(kcat/Km)NADP+:(kcat/Km)NAD+大于1:1,更优选地等于或大于2:1,还更优选地等于或大于5:1,甚至更优选地等于或大于10:1,还甚至更优选地等于或大于20:1,甚至还更优选地等于或大于100:1,最优选地等于或大于1000:1。不存在上限,但出于实际原因,NADH依赖性硝酸还原酶的催化效率比(kcat/Km)NADP+:(kcat/Km)NAD+可等于或小于1.000.000.000:1(即1.109)。最优选地,NADH依赖性硝酸还原酶专门依赖于作为辅因子的NADH/NAD+。也就是说,最优选地,NADH依赖性硝酸还原酶绝对需要作为辅因子的NADH/NAD+,而不是作为辅因子的NADPH/NADP+。
优选地,NADH依赖性硝酸还原酶是具有酶分类EC 1.7.1.1(即,具有EC编号EC1.7.1.1)或酶分类EC.1.6.6.1(即,具有EC编号1.6.6.1)的NADH依赖性硝酸还原酶。适当地,NADH依赖性硝酸还原酶,也被称为NADH依赖性硝酸氧化还原酶,是催化至少以下化学反应的酶:
硝酸根+NADH+H+→亚硝酸根+NAD++H2O
合适的NADH依赖性硝酸还原酶可以包括一种或多种从以下获得或衍生自以下的NADH依赖性硝酸还原酶:麦仙翁(Agrostemma githago)、绿穗苋(Amaranthus hybridus)、苋(Amaranthus tricolor)、布朗纤维藻(Ankistrodesmus braunii)、拟南芥(Arabidopsisthaliana)、黑曲霉(Aspergillus niger)、构巢曲霉(Aspergillus nidulans)、蛋白核小球藻(Auxenochlorella pyrenoidosa)、慢生根瘤菌属种属(Bradyrhizobium sp.)、慢生根瘤菌属种属750、芥菜型油菜(Brassica juncea)、芥属(Brassica)、芸苔属(oleracea)、茶树(Camellia sinensis)、博伊丁假丝酵母(Candida boidinii)、产朊假丝酵母(Candidautilis)、小米辣(Capsicum frutescens)、藜(Chenopodium album)、杰丁塞伯林德纳氏酵母(Cyberlindnera jadinii)、芥菜型油菜(Brassica juncea)、甘蓝(Brassicaoleracea)、茶树(Camellia sinensis)、小米辣(Capsicum frutescens)、藜(Chenopodiumalbum)、莱茵衣藻(Chlamydomonas reinhardtii)、小球藻(Chlorella fusca)、小球藻属种属(Chlorella sp.)、小球藻属种属、Berlin、普通小球藻(Chlorella vulgaris)、威氏海链藻(Conticribra weissflogii)、黄瓜(Cucumis sativus)、笋瓜(Cucurbita maxima)、西葫芦(Cucurbita pepo)、南瓜属种属(Cucurbita sp.)、盐生杜氏藻(Dunaliellatertiolecta)、赫氏圆石藻(Emiliania huxleyi)、构巢裸壳孢菌(Emericella nidulans)、尖孢镰刀菌(Fusarium oxysporum)、尖孢镰刀菌(Fusarium oxysporum)JCM 11502、水甜茅(Glyceria maxima)、大豆(Glycine max)、陆地棉(Gossypium hirsutum)、智利江蓠(Gracilaria chilensis)、细基江蓠(Gracilaria tenuistipitata)、向日葵(Helianthusannuus)、大麦(Hordeum vulgare)、莴苣(Lactuca sativa)、浮萍(Lemna minor)、白羽扇豆(Lupinus albus)、结核分枝杆菌(Mycobactyerium tuberculosis)、皱叶烟草(Nicotianaplumbaginifolia)、烟草(Nicotiana tabacum)、Ogataea angusta、多形汉逊酵母(Ogataeapolymorpha)、水稻(Oryza sativa)、南极棕囊藻(Phaeocystis Antarctica)、芦苇(Phragmites australis)、小立碗藓(Physcomitrella patens)、豌豆(Pisum arvense)、土马骔(Polytrichum commune)、条斑紫菜(Pyropia yezoensis)、萝卜(Raphanus sativus)、荚膜红细菌(Rhodobacter capsulatus)、荚膜红细菌E1F1、蓖麻(Ricinus communis)、小翠云草(Selaginella kraussiana)、白芥子(Sinapis alba)、中肋骨条藻(Skeletonemacostatum)、热带骨条藻(Skeletonema tropicum)、番茄(Solanum lycopersicum)、菠菜(Spinacia oleracea)、裸花碱蓬(Suaeda maritima)、亚心形扁藻(Tetraselmisgracilis)、龟裂泰来草(Thalassia Testudinum)、南极海链藻(ThalassiosiraAntarctica)、假微型海链藻(Thalassiosira pseudonana)、小麦(Triticum aestivum)、圆锥小麦硬粒亚种(Triticum turgidum subsp durum)、石莼属种属(Ulva sp.)和/或玉蜀黍;和/或此类NADH依赖性硝酸还原酶的功能同源物,所述功能同源物包含与此类上述NADH依赖性硝酸还原酶中的一种或多种NADH依赖性硝酸还原酶具有至少50%、60%、65%、70%、75%、80%、85%、90%、95%、98%或至少99%氨基酸序列同一性的氨基酸序列;和/或此类NADH依赖性硝酸还原酶的功能同源物,所述功能同源物包含与此类上述NADH依赖性硝酸还原酶中的一种或多种NADH依赖性硝酸还原酶的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列,其中优选地上述功能同源物中的任何功能同源物的氨基酸序列与此类上述NADH依赖性硝酸还原酶相比具有不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
优选的NADH依赖性硝酸还原酶包括获自或衍生自以下的NADH依赖性硝酸还原酶:博伊丁假丝酵母(能够利用NADH和NADPH两者作为电子供体的硝酸还原酶)、产朊假丝酵母(能够利用NADH和NADPH两者作为电子供体的硝酸还原酶)、尖孢镰刀菌(如由Fujii等人在Biosci.Biotechnol.Biochem.,72(2),第412-420页,2008中发表的题为“Denitrificationby the Fungus Fusarium oxysporum Involves NADH-Nitrate Reductase”的文章中所述,该文献以引用方式并入本文)、菠菜和玉蜀黍。
因此,优选的NADH依赖性硝酸还原酶包括:NADH依赖性硝酸还原酶,所述NADH依赖性硝酸还原酶包含具有如本文所述的SEQ ID NO:1和/或SEQ ID NO:2的氨基酸序列的多肽;和/或SEQ ID NO:1和/或SEQ ID NO:2的功能同源物,所述功能同源物包含分别与SEQID NO:1和/或SEQ ID NO:2中的一者或多者具有至少40%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%或至少99%氨基酸序列同一性的氨基酸序列;和/或SEQ IDNO:1和/或SEQ ID NO:2的功能同源物,所述功能同源物包含与分别与SEQ ID NO:1和/或SEQ ID NO:2中的一者或多者的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列。优选地,上述功能同源物中的任何功能同源物的氨基酸序列具有分别与SEQ IDNO:1和/或SEQ ID NO:2相比不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
优选地,酵母属酵母细胞包含编码具有NADH依赖性硝酸还原酶活性的酶的外源基因。更优选地,酵母属酵母细胞包含编码具有NADH依赖性硝酸还原酶活性的酶的外源基因,所述酶选自由以下组成的组:获自或衍生自以下的NADH依赖性硝酸还原酶:麦仙翁(Agrostemma githago)、绿穗苋(Amaranthus hybridus)、苋(Amaranthus tricolor)、布朗纤维藻(Ankistrodesmus braunii)、拟南芥(Arabidopsis thaliana)、黑曲霉(Aspergillus niger)、构巢曲霉(Aspergillus nidulans)、蛋白核小球藻(Auxenochlorella pyrenoidosa)、慢生根瘤菌属种属(Bradyrhizobium sp.)、慢生根瘤菌属种属750、芥菜型油菜(Brassica juncea)、芥属(Brassica)、芸苔属(oleracea)、茶树(Camellia sinensis)、博伊丁假丝酵母(Candida boidinii)、产朊假丝酵母(Candidautilis)、小米辣(Capsicum frutescens)、藜(Chenopodium album)、杰丁塞伯林德纳氏酵母(Cyberlindnera jadinii)、芥菜型油菜(Brassica juncea)、甘蓝(Brassicaoleracea)、茶树(Camellia sinensis)、小米辣(Capsicum frutescens)、藜(Chenopodiumalbum)、莱茵衣藻(Chlamydomonas reinhardtii)、小球藻(Chlorella fusca)、小球藻属种属(Chlorella sp.)、小球藻属种属、Berlin、普通小球藻(Chlorella vulgaris)、威氏海链藻(Conticribra weissflogii)、黄瓜(Cucumis sativus)、笋瓜(Cucurbita maxima)、西葫芦(Cucurbita pepo)、南瓜属种属(Cucurbita sp.)、盐生杜氏藻(Dunaliellatertiolecta)、赫氏圆石藻(Emiliania huxleyi)、构巢裸壳孢菌(Emericella nidulans)、尖孢镰刀菌(Fusarium oxysporum)、尖孢镰刀菌(Fusarium oxysporum)JCM 11502、水甜茅(Glyceria maxima)、大豆(Glycine max)、陆地棉(Gossypium hirsutum)、智利江蓠(Gracilaria chilensis)、细基江蓠(Gracilaria tenuistipitata)、向日葵(Helianthusannuus)、大麦(Hordeum vulgare)、莴苣(Lactuca sativa)、浮萍(Lemna minor)、白羽扇豆(Lupinus albus)、结核分枝杆菌(Mycobactyerium tuberculosis)、皱叶烟草(Nicotianaplumbaginifolia)、烟草(Nicotiana tabacum)、Ogataea angusta、多形汉逊酵母(Ogataeapolymorpha)、水稻(Oryza sativa)、南极棕囊藻(Phaeocystis Antarctica)、芦苇(Phragmites australis)、小立碗藓(Physcomitrella patens)、豌豆(Pisum arvense)、土马骔(Polytrichum commune)、条斑紫菜(Pyropia yezoensis)、萝卜(Raphanus sativus)、荚膜红细菌(Rhodobacter capsulatus)、荚膜红细菌E1F1、蓖麻(Ricinus communis)、小翠云草(Selaginella kraussiana)、白芥子(Sinapis alba)、中肋骨条藻(Skeletonemacostatum)、热带骨条藻(Skeletonema tropicum)、番茄(Solanum lycopersicum)、菠菜(Spinacia oleracea)、裸花碱蓬(Suaeda maritima)、亚心形扁藻(Tetraselmisgracilis)、龟裂泰来草(Thalassia Testudinum)、南极海链藻(ThalassiosiraAntarctica)、假微型海链藻(Thalassiosira pseudonana)、小麦(Triticum aestivum)、圆锥小麦硬粒亚种(Triticum turgidum subsp durum)、石莼属种属(Ulva sp.)和玉蜀黍;和此类NADH依赖性硝酸还原酶的功能同源物,所述功能同源物包含与此类上述NADH依赖性硝酸还原酶中的一种或多种NADH依赖性硝酸还原酶具有至少50%、60%、65%、70%、75%、80%、85%、90%、95%、98%或至少99%氨基酸序列同一性的氨基酸序列;和此类NADH依赖性硝酸还原酶的功能同源物,所述功能同源物包含与此类上述NADH依赖性硝酸还原酶中的一种或多种NADH依赖性硝酸还原酶的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列,其中优选地上述功能同源物中的任何功能同源物的氨基酸序列与此类上述NADH依赖性硝酸还原酶相比具有不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
合适地,酵母属酵母细胞可包含编码SEQ ID NO:1和/或SEQ ID NO:2中的任一者的氨基酸序列或与SEQ ID NO:1和/或SEQ ID NO:2中的任一者的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列的核苷酸序列。优选地,所述氨基酸序列具有分别与SEQ ID NO:1和/或SEQ ID NO:2相比不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
酵母属酵母细胞可以将一个或多个编码上述NADH依赖性硝酸还原酶的基因与一个或多个编码NADPH依赖性亚硝酸还原酶的基因组合。然而,优选地,酵母属酵母细胞将一个或多个编码上述NADH依赖性硝酸还原酶的基因与一个或多个编码NADH依赖性亚硝酸还原酶的基因组合。
合适的NADH依赖性硝酸还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站上找到(https://www.uniprot.org/,截至2020年10月4日)、其描述、其可来源于的生物体以及其与SEQ ID NO:1的氨基酸序列同一性列于下表2中。
表2:合适的NADH依赖性硝酸还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站上找到(https://www.uniprot.org/,截至2020年10月4日)、其描述、其可来源于的生物体以及其与SEQ ID NO:1的氨基酸序列同一性列于下表2中。
Figure BDA0004159466160000291
Figure BDA0004159466160000301
Figure BDA0004159466160000311
Figure BDA0004159466160000321
Figure BDA0004159466160000331
Figure BDA0004159466160000341
Figure BDA0004159466160000351
亚硝酸还原酶
如上所述,亚硝酸还原酶催化亚硝酸根还原为氨(NH3)。
优选地,如本文所述的酵母属酵母细胞包含至少一个或多个编码NADH依赖性亚硝酸还原酶的基因。
NADH依赖性亚硝酸还原酶在本文中被理解为专门依赖于作为辅因子的NADH或主要依赖于作为辅因子的NADH的亚硝酸还原酶。优选地,NADH依赖性亚硝酸还原酶的作为辅因子的NADPH/NADP+的催化效率(kcat/Km)NADP+与作为辅因子的NADH/NAD+的催化效率(kcat/Km)NAD+之比,即催化效率比(kcat/Km)NADP+:(kcat/Km)NAD+大于1:1,更优选地等于或大于2:1,还更优选地等于或大于5:1,甚至更优选地等于或大于10:1,还甚至更优选地等于或大于20:1,甚至还更优选地等于或大于100:1,最优选地等于或大于1000:1。不存在上限,但出于实际原因,NADH依赖性亚硝酸还原酶的催化效率比(kcat/Km)NADP+:(kcat/Km)NAD+可等于或小于1.000.000.000:1(即1.109)。最优选地,NADH依赖性亚硝酸还原酶专门依赖于作为辅因子的NADH/NAD+。也就是说,最优选地,NADH依赖性亚硝酸还原酶绝对需要作为辅因子的NADH/NAD+,而不是作为辅因子的NADPH/NADP+。
优选地,NADH依赖性亚硝酸还原酶是具有酶分类EC 1.7.1.15(即具有EC编号EC1.7.1.15)的NADH依赖性亚硝酸还原酶。适当地,NADH依赖性亚硝酸还原酶,也被称为NADH依赖性亚硝酸氧化还原酶,是催化至少以下化学反应的酶:
亚硝酸根+3NADH+5H+→氨+3NAD++2H2O
本领域技术人员将理解氨也可以存在和/或被称为所谓的氢氧化铵NH4OH
合适的NADH依赖性亚硝酸还原酶可包括来源于以下的一种或多种NADH依赖性亚硝酸还原酶:构巢曲霉(也称为构巢裸壳孢菌)、Arcobacter ellisii、太平洋弓形杆菌(Arcobacter pacificus)、枯草芽孢杆菌(Bacillus subtilis)、枯草芽孢杆菌JH642、台湾贪铜菌(Cupriavidus taiwanensis)、大肠杆菌(Escherichia coli)、台湾罗尔斯通氏菌(Ralstonia taiwanensis)、蒲桃罗尔斯通氏菌(Ralstonia syzygii)、茄科罗尔斯通氏菌(Ralstonia solanacearum)、荚膜红细菌(Rhodobacter capsulatus)、荚膜红细菌(Rhodobacter capsulatus)、Paraburkholderia ribeironis;和/或此类NADH依赖性亚硝酸还原酶的功能同源物,所述功能同源物包含与此类上述NADH依赖性亚硝酸还原酶中的一种或多种NADH依赖性亚硝酸还原酶具有至少40%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%或至少99%氨基酸序列同一性的氨基酸序列;和/或此类NADH依赖性亚硝酸还原酶的功能同源物,所述功能同源物包含与此类上述NADH依赖性亚硝酸还原酶中的一种或多种NADH依赖性亚硝酸还原酶的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列,其中优选地上述功能同源物中的任何功能同源物的氨基酸序列与此类上述NADH依赖性亚硝酸还原酶相比具有不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
大肠杆菌在其亚硝酸盐同化途径中利用几种不同的酶。nirD基因编码NADH依赖性亚硝酸还原酶(NADH)小亚基,而nirB基因编码NADH依赖性亚硝酸还原酶(NADH)大亚基。
优选的NADH依赖性亚硝酸还原酶包括来源于构巢曲霉(也被称为构巢裸壳孢菌)的NADH依赖性亚硝酸还原酶,是一种能够利用NADH和NADPH两者作为电子供体的亚硝酸还原酶;和/或来源于大肠杆菌的亚硝酸还原酶。在高硝酸盐和/或亚硝酸盐浓度下,由大肠杆菌的nirB基因编码的亚硝酸还原酶是特别优选的。
因此,优选的NADH依赖性亚硝酸还原酶包括:如本文所述的包含具有SEQ ID NO:3(由nirD编码的大肠杆菌硝酸还原酶小亚基)和/或SEQ ID NO:4(由nirB编码的大肠杆菌硝酸还原酶大亚基)和/或SEQ ID NO:5(由niiA编码的构巢裸壳孢菌硝酸还原酶)的氨基酸序列的多肽的NADH依赖性亚硝酸还原酶;和/或SEQ ID NO:3和/或SEQ ID NO:4和/或SEQ IDNO:5的功能同源物,所述功能同源物包含分别与SEQ ID NO:3和/或SEQ ID NO:4和/或SEQID NO:5中的一者或多者具有至少40%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%或至少99%氨基酸序列同一性的氨基酸序列;和/或SEQ ID NO:3和/或SEQ IDNO:4和/或SEQ ID NO:5的功能性同源物,所述功能性同源物包含分别与SEQ ID NO:3和/或SEQ ID NO:4和/或SEQ ID NO:5中的一者或多者的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列。优选地,上述功能同源物中的任何功能同源物的氨基酸序列具有分别与SEQ ID NO:3和/或SEQ ID NO:4和/或SEQ ID NO:5相比不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
优选地,酵母属酵母细胞包含编码具有NADH依赖性亚硝酸还原酶活性的酶的外源基因。更优选地,酵母属酵母细胞包含编码具有NADH依赖性亚硝酸还原酶活性的酶的外源基因,所述酶选自由以下组成的组:来源于以下的NADH依赖性亚硝酸还原酶:构巢曲霉(也称为构巢裸壳孢菌)、Arcobacter ellisii、太平洋弓形杆菌(Arcobacter pacificus)、枯草芽孢杆菌(Bacillus subtilis)、枯草芽孢杆菌JH642、台湾贪铜菌(Cupriavidustaiwanensis)、大肠杆菌(Escherichia coli)、台湾罗尔斯通氏菌(Ralstoniataiwanensis)、蒲桃罗尔斯通氏菌(Ralstonia syzygii)、茄科罗尔斯通氏菌(Ralstoniasolanacearum)、荚膜红细菌(Rhodobacter capsulatus)、荚膜红细菌(Rhodobactercapsulatus)、Paraburkholderia ribeironis;和/或此类NADH依赖性亚硝酸还原酶的功能同源物,所述功能同源物包含与此类上述NADH依赖性亚硝酸还原酶中的一种或多种NADH依赖性亚硝酸还原酶具有至少40%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%或至少99%氨基酸序列同一性的氨基酸序列;和/或此类NADH依赖性亚硝酸还原酶的功能同源物,所述功能同源物包含与此类上述NADH依赖性亚硝酸还原酶中的一种或多种NADH依赖性亚硝酸还原酶的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列,其中优选地上述功能同源物中的任何功能同源物的氨基酸序列与此类上述NADH依赖性亚硝酸还原酶相比具有不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
合适地,所述酵母属酵母细胞可包含编码SEQ ID NO:3(由nirD编码的大肠杆菌硝酸还原酶小亚基)和/或SEQ ID NO:4(由nirB编码的大肠杆菌硝酸还原酶大亚基)和/或SEQID NO:5(由niiA编码的构巢裸壳孢菌硝酸还原酶)中的任一者的氨基酸序列或与SEQ IDNO:3和/或SEQ ID NO:4和/或SEQ ID NO:5中的任一者的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列的核苷酸。优选地,所述氨基酸序列具有分别与SEQ IDNO:3和/或SEQ ID NO:4和/或SEQ ID NO:5相比不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
所述酵母属酵母细胞可以将一个或多个编码上述NADH依赖性亚硝酸还原酶中的一种或多种NADH依赖性亚硝酸还原酶的基因与一个或多个编码NADPH依赖性硝酸还原酶的基因组合。然而,优选地,所述酵母属酵母细胞将一个或多个编码上述NADH依赖性亚硝酸还原酶中的一种或多种NADH依赖性亚硝酸还原酶的基因与一个或多个编码NADH依赖性硝酸还原酶的基因组合。
合适的NADH依赖性亚硝酸还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站上找到(https://www.uniprot.org/,截至2020年10月4日)、其描述、其可来源于的生物体以及其与SEQ ID NO:3(由nirD编码的小亚基)的氨基酸序列同一性列于下表3中。
合适的NADH依赖性亚硝酸还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站上找到(https://www.uniprot.org/,截至2020年10月4日)、其描述、其可来源于的生物体以及其与SEQ ID NO:4(由nirB编码的大亚基)的氨基酸序列同一性列于下表4中。
表3:合适的NADH依赖性亚硝酸还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站上找到(https://www.uniprot.org/,截至2020年10月4日)、其描述、其可来源于的生物体以及其与SEQ ID NO:3(由nirD编码的小亚基)的氨基酸序列同一性。
Figure BDA0004159466160000391
Figure BDA0004159466160000401
Figure BDA0004159466160000411
Figure BDA0004159466160000421
Figure BDA0004159466160000431
Figure BDA0004159466160000441
Figure BDA0004159466160000451
Figure BDA0004159466160000461
表4:合适的NADH依赖性亚硝酸还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站上找到(https://www.uniprot.org/,截至2020年10月4日)、其描述、其可来源于的生物体以及其与SEQ ID NO:4(由nirB编码的大亚基)的氨基酸序列同一性。
Figure BDA0004159466160000462
Figure BDA0004159466160000471
Figure BDA0004159466160000481
Figure BDA0004159466160000491
Figure BDA0004159466160000501
Figure BDA0004159466160000511
Figure BDA0004159466160000521
Figure BDA0004159466160000531
硝酸盐/亚硝酸盐转运体
优选地,酵母属酵母细胞进一步包含一种或多种遗传修饰,所述一种或多种遗传修饰导致氧化氮源(例如硝酸盐或亚硝酸盐)到酵母细胞中的转运增加。更优选地,酵母属酵母细胞进一步包含一个或多个编码硝酸盐和/或亚硝酸盐转运体的基因。
合适的转运体可包括亚硫酸盐转运体Ssu1和SSu2(如由Cabrera等人在2014年2月出版的第13卷第2期Eukaryotic Cell第267-278页处其题为“Molecular Components ofNitrate and Nitrite Efflux in Yeast”的文章中所述,该参考文献以引用方式并入本文);和来源于安格斯毕赤酵母(也称为多形汉逊酵母)的硝酸盐/亚硝酸盐转运体YNT1,和/或此类硝酸盐/亚硝酸盐转运体中的一种或多种硝酸盐/亚硝酸盐转运体的功能同源物,所述功能同源物包含与上述硝酸盐/亚硝酸盐转运体中的一种或多种硝酸盐/亚硝酸盐转运体具有至少40%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%或至少99%的氨基酸序列同一性的氨基酸序列;和/或此类硝酸盐/亚硝酸盐转运体中的一种或多种硝酸盐/亚硝酸盐转运体的功能同源物,所述功能同源物包含与此类上述硝酸盐/亚硝酸盐转运体中的一种或多种硝酸盐/亚硝酸盐转运体的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列,其中优选地,上述功能同源物中的任何功能同源物的氨基酸序列与此类上述硝酸盐/亚硝酸盐转运体YNT1相比具有不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
优选地,所述酵母属酵母细胞包含编码来源于安格斯毕赤酵母的硝酸盐/亚硝酸盐转运体YNT1和/或此类硝酸盐/亚硝酸盐转运体YNT1的功能同源物的核酸序列,所述功能同源物包含与所述硝酸盐/亚硝酸盐转运体YNT1具有至少50%、60%、65%、70%、75%、80%、85%、90%、95%、98%或至少99%氨基酸序列同一性的氨基酸序列;和/或此类硝酸盐/亚硝酸盐转运体YNT1的功能同源物,所述功能同源物包含与此类上述硝酸盐/亚硝酸盐转运体YNT1中的一种或多种硝酸盐/亚硝酸盐转运体YNT1的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列,其中优选地,上述功能同源物中的任何功能同源物的氨基酸序列与此类上述硝酸盐/亚硝酸盐转运体YNT1相比具有不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
因此,优选的硝酸盐/亚硝酸盐转运体包括:如本文所述的包含具有SEQ ID NO:6的氨基酸序列的多肽的硝酸盐/亚硝酸盐转运体;和/或SEQ ID NO:6的功能同源物,所述功能同源物包含与SEQ ID NO:6具有至少40%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%或至少99%氨基酸序列同一性的氨基酸序列;和/或SEQ ID NO:6的功能同源物,所述功能同源物包含与SEQ ID NO:6的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列。优选地,上述功能同源物中的任何功能同源物的氨基酸序列具有与SEQ ID NO:6相比不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
合适地,酵母属酵母细胞可包含编码SEQ ID NO:6的氨基酸序列或与SEQ ID NO:6中的任一者的氨基酸序列相比具有一个或多个取代、插入和/或缺失的氨基酸序列的核苷酸序列。优选地,所述氨基酸序列具有与SEQ ID NO:6相比不大于300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。
合适的亚硝酸盐/硝酸盐转运体的示例、其UniProt数据库登录号(可以在Uniprot网站上找到(https://www.uniprot.org/,截至2020年10月4日)、其描述、其可来源于的生物体以及其与SEQ ID NO:6的氨基酸序列同一性列于下表5中。
表5:合适的亚硝酸盐/硝酸盐转运体的示例、其UniProt数据库登录号(可以在Uniprot网站上找到(https://www.uniprot.org/,截至2020年10月4日)、其描述、其可来源于的生物体以及其与SEQ ID NO:6的氨基酸序列同一性。
Figure BDA0004159466160000551
Figure BDA0004159466160000561
Figure BDA0004159466160000571
Figure BDA0004159466160000581
Figure BDA0004159466160000591
Figure BDA0004159466160000601
Figure BDA0004159466160000611
Figure BDA0004159466160000621
Figure BDA0004159466160000631
辅因子
优选地,所述酵母属酵母细胞进一步包含合适的辅因子以增强上述NADH依赖性硝酸还原酶和/或NADH依赖性亚硝酸还原酶的活性。优选的辅因子包括黄素腺嘌呤二核苷酸(FAD)、血红素辅基和/或钼辅因子(MoCo)。优选地,酵母属酵母细胞因此可以进一步包含一个或多个编码用于合成黄素腺嘌呤二核苷酸(FAD)、血红素辅基和/或钼辅因子(MoCo)中的一者或多者的酶的基因。例如,酵母属酵母细胞可包含一个或多个编码具有FAD合酶活性的酶的基因。
优选地,酵母属酵母细胞因此是进一步包含以下的酵母属酵母细胞:
-编码GTP 3′,8-环化酶的核酸序列;
-编码环吡喃蝶呤单磷酸合酶的核酸序列;
-编码钼蝶呤合酶催化亚基的核酸序列;
-编码钼蝶呤合酶硫载体亚基的核酸序列;
-编码钼蝶呤腺苷酸转移酶的核酸序列,和/或
-编码钼蝶呤合酶腺苷酸转移酶和/或钼蝶呤钼转移酶的核酸序列。
PCT专利申请PCT/NL2020/050241中描述了合适的编码用于合成钼辅因子(MoCo)的酶的基因集合,所述PCT专利申请以Technische Universiteit Delft的名义公布为WO2020/209718。例如,酵母属酵母细胞可以适当地进一步包含允许酵母产生钼辅因子的重组Moco途径基因集合,其中Moco途径基因集合包含:
-与WO2020/209718中所述的SEQ ID NO:1具有至少70%序列同一性并编码GTP3′,8-环化酶的基因;
-与WO2020/209718中所述的SEQ ID NO:2具有至少70%序列同一性并编码环吡喃蝶呤单磷酸合酶的基因;
-与WO2020/209718中所述的SEQ ID NO:3具有至少70%序列同一性并编码钼蝶呤合酶催化亚基的基因;
-与WO2020/209718中所述的SEQ ID NO:4具有至少70%序列同一性并编码钼蝶呤合酶硫载体亚基的基因;
-与WO2020/209718中所述的SEQ ID NO:5具有至少70%序列同一性并编码钼蝶呤腺苷酸转移酶的基因,和/或
-与WO2020/209718中所述的SEQ ID NO:6具有至少70%序列同一性并且编码钼蝶呤合酶腺苷酸转移酶和/或钼蝶呤钼转移酶的基因。
进一步的优选项如WO2020/209718中所述。WO2020/209718的内容以及如WO2020/209718中所述的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6以引用方式并入本文。
甘油3-磷酸磷酸水解酶和/或甘油3-磷酸脱氢酶的缺失或破坏
适当地,酵母属酵母细胞可进一步包含一个或多个编码甘油3-磷酸磷酸水解酶基因和/或编码甘油3-磷酸脱氢酶基因的内源性核苷酸序列的缺失或破坏。
优选地,酵母细胞中NADH依赖性甘油合成所需的酶活性被降低或缺失。甘油3-磷酸磷酸水解酶和/或甘油3-磷酸脱氢酶的酶活性的降低或缺失可以通过修饰一个或多个编码NAD依赖性甘油3-磷酸脱氢酶(GPD)的基因和/或一个或多个编码磷酸甘油磷酸酶(GPP)的基因,使得该酶的表达显著低于野生型或使得该基因编码活性降低的多肽来实现。此类修饰可以使用公知的生物技术进行,并且可以特别地包括编码GPD和/或GPP的结构基因的启动子区域或编码区域的一个或多个敲除突变或定点诱变。或者,在甘油生产方面有缺陷的酵母菌株可通过随机诱变,之后选择GPD和/或GPP活性降低或缺失的菌株来获得。酿酒酵母GPD1、GPD2、GPP1和GPP2基因在WO2011010923中显示,并且公开于本申请的SEQ ID NO:24至SEQ ID NO:27中。
优选地,至少一种编码GPD的基因和/或至少一种编码GPP的基因被完全缺失,或者编码酶的对其活性必不可少的部分的所述基因的至少部分被缺失。特别地,使用酿酒酵母细胞已经实现了良好的结果,其中GPD1基因和GPD2基因的开放阅读框已经失活。结构基因(靶基因)的失活可由本领域技术人员通过合成地合成或以其他方式构建由侧接有与在宿主细胞基因组的待缺失区域侧翼的序列相同的DNA序列的选择形标记基因组成的DNA片段来实现。特别地,通过整合标记基因kanMX和hphMX4使酿酒酵母中的GPD1和GPD2基因失活,已经获得了良好的结果。随后将这个DNA片段转化到宿主细胞中。检查表达显性标记基因的转化细胞是否正确替换了被设计为待缺失的区域,例如通过诊断性聚合酶链式反应或DNA印迹杂交。
因此,在本发明的酵母属酵母细胞中,甘油3-磷酸磷酸水解酶活性和/或甘油3-磷酸脱氢酶活性被有利地降低。在本发明的细胞中,与除了导致比活性降低的遗传修饰外遗传上相同的菌株(优选在厌氧条件下)相比,甘油磷酸脱氢酶比活性优选地降低了至少0.8倍、0.5倍、0.3倍、0.1倍、0.05倍或0.01倍。甘油磷酸脱氢酶活性可如Overkamp等人(2002,Yeast 19:509-520)所述进行测定。
甘油脱氢酶、二羟基丙酮激酶和甘油转运体
优选地,所述酵母属酵母细胞可以进一步包含:
-一个或多个编码甘油脱氢酶的核酸序列;和/或
-一个或多个编码二羟基丙酮激酶的核酸序列;和/或
-一个或多个编码甘油转运体的核酸序列
更优选地,酵母属酵母细胞可包含:一个或多个编码甘油脱氢酶的核酸序列;和/或一个或多个编码二羟基丙酮激酶的核酸序列;和/或一个或多个编码甘油转运体的核酸序列,均如WO 2019/063507A1中所述和例示(据此以引用方式并入)。
甘油脱氢酶至少催化以下反应:
甘油+NAD+<->甘油酮+NADH+H+
因此,这种酶的两种底物是甘油和NAD+,而其的三种产物是甘油酮、NADH和H+。甘油和二羟基丙酮在本文中是同义词。这种酶属于氧化还原酶家族,特别是作用于供体的CH-OH基团,以NAD+或NADP+作为受体的酶。这类酶的系统名称是甘油:NAD+2-氧化还原酶。其他常用名称包括甘油脱氢酶和NAD+连接的甘油脱氢酶。这种酶参与甘油脂代谢。结构研究已表明,所述酶是锌依赖性的,活性位点位于蛋白质的两个结构域之间。在一个实施方式中,具有甘油脱氢酶活性的酶优选是NAD+连接的甘油脱氢酶(EC1.1.1.6)。此类酶可以来自细菌来源或例如来自真菌来源。一个示例是来自大肠杆菌的gldA。具有甘油脱氢酶活性的酶也可以是NADP+连接的甘油脱氢酶(EC 1.1.1.72)。当重组酵母用于通常在厌氧条件下进行的乙醇生产时,NAD+连接的甘油脱氢酶是优选的。
优选地,酵母属酵母细胞还可包含编码具有二羟基丙酮激酶活性的酶的核酸。酵母属酵母细胞优选地包含一个或多个编码EC编码为EC 2.7.1.28和/或EC 2.7.1.29的具有二羟基丙酮激酶活性的酶的基因。二羟基丙酮激酶催化以下反应中的至少一种反应:
ATP+D-甘油醛<=>ADP+D-甘油醛3-磷酸
或者
EC 2.7.1.29:ATP+甘油酮<=>ADP+磷酸甘油酮
这种酶家族可包括使用ATP而不是大肠杆菌中的磷蛋白作为磷酸根供体的单链形式的二羟基丙酮激酶(也称为甘油酮激酶)(EC 2.7.1.29或EC 2.7.1.28)。这种形式具有与大肠杆菌酶的K和L亚基同源的可分离结构域,并且存在于酵母和其他真核生物以及一些细菌,包括弗氏柠檬酸杆菌(Citrobacter freundii)中。来自番茄的成员已被证明磷酸化二羟基丙酮、3,4-二羟基-2-丁酮和一些其他醛糖和酮糖。来自哺乳动物的成员已被证明催化二羟基丙酮的磷酸化和核糖核苷二磷酸-X化合物的分裂两者,其中FAD是最好的底物。在酵母中有两种二羟基丙酮激酶同工酶(Dak1和Dak2)。在一个实施方式中,酵母属酵母细胞可包含过表达的内源性DAK。具有二羟基丙酮激酶活性的酶可由内源基因(例如DAK1)编码,所述内源基因优选地置于组成型启动子的控制之下。重组细胞可包含增加所述细胞中的二羟基丙酮激酶比活性的遗传修饰。
在一个实施方式中,酵母属酵母细胞可进一步包含一个或多个编码甘油转运体或具有WO 2019/063507 A1中为此列出的氨基酸序列的酶(即WO 2019/063507 A1是指其中针对甘油转运体的SEQ ID NO:16和SEQ ID NO:17,所述序列随此以引用方式并入)或其功能同源物的基因,所述功能同源物具有至少50%,优选地至少60%、70%、75%、80%、85%、90%、95%或至少99%的序列同一性。可在培养基外部获得(例如,来自玉米醪液中的逆流)或在细胞内部合成后分泌的任何甘油可以转运到细胞中并转化为乙醇。
发酵方法
本发明进一步提供了一种用于生产发酵产物的厌氧发酵方法,所述厌氧发酵方法包括使用如上所述的酵母属酵母细胞发酵进料,所述进料包含氧化氮源和可发酵碳源。
可发酵碳源优选地包含或由一种或多种可发酵碳水化合物组成。更优选地,可发酵碳源包括一种或多种单糖、二糖和/或多糖。例如,可发酵碳源可包括一种或多种选自由以下组成的组的碳水化合物:葡萄糖、果糖、蔗糖、麦芽糖、木糖、阿拉伯糖、半乳糖、甘露糖和海藻糖。优选地包含或由一种或多种碳水化合物组成的可发酵碳源可适当地从淀粉、纤维素、半纤维素、木质纤维素和/或果胶中获得。合适地,可发酵碳源可以是优选水性、浆液、悬浮液或液体的形式。
发酵期间可发酵碳水化合物(例如葡萄糖)的浓度优选等于或大于80g/L。也就是说,发酵开始时葡萄糖的初始浓度优选等于或大于80g/L,更优选等于或大于90g/L,甚至更优选等于或大于100g/L,仍更优选等于或大于110g/L,还更优选等于或大于120g/L、等于或大于130g/L、等于或大于140g/L、等于至或大于150g/L、等于或大于160g/L、等于或大于170g/L、或等于或大于180g/L。发酵的开始可以是当可发酵碳水化合物与本发明的重组细胞接触的时刻。
可发酵碳源可以通过使淀粉、木质纤维素和/或果胶与酶组合物接触来制备,其中产生了一种或多种单糖、二糖和/或多糖,并且其中所产生的单糖、二糖和/或多糖随后经发酵以产生发酵产物。
在一个实施方式中,可发酵碳水化合物是生物质水解产物,或包含在生物质水解产物中,所述生物质水解产物为例如玉米秸秆或玉米纤维水解产物。此类生物质水解产物继而可以包含或来源于玉米秸秆和/或玉米纤维。
“水解产物”在本文中被理解为含多糖的材料(例如玉米秸秆、玉米淀粉、玉米纤维或木质纤维素材料),所述多糖已通过加水解聚以形成单糖和低聚糖。水解产物可通过含多糖的材料的酶促水解或酸水解产生。
生物质水解产物可以是木质纤维素生物质水解产物。本文中的木质纤维素包括半纤维素和生物质的半纤维素部分。木质纤维素还包括生物质的木质纤维素级分。合适的木质纤维素材料可在以下列表中找到:果园底料(orchard primings)、树丛(chaparral)、磨坊废弃物(mill waste)、城市木材废弃物、市政废弃物、伐木废弃物、森林疏伐废弃物、短期轮种木本作物、工业废弃物、小麦秸、燕麦秸、水稻秸、大麦秸、黑麦秸、亚麻秸、大豆壳、稻壳、水稻秸、玉米谷蛋白饲料、燕麦壳、甘蔗、玉米秸秆、玉米杆、玉米芯、玉米壳、柳枝稷、芒草、甜高粱、芸苔茎、大豆茎、草原禾草、鸭茅状摩擦禾、狐尾草;甜菜粕、柑橘果实浆、种子壳、纤维素动物粪便、草坪修剪废弃物、棉花、海藻、树木、软木材、硬木材、白杨、松树、灌木丛、草、小麦、小麦秸、甘蔗渣、玉米、玉米壳、玉米棒、玉米粒、来自玉米粒的纤维、来自谷物湿磨或干磨的产物和副产物、城市固体废弃物、废纸、庭院废弃物、草本材料、农业残余物、林业残余物、城市固体废弃物、废纸、纸浆、造纸厂残余物、树枝、灌木、甘蔗、玉米、玉米壳、能源作物、森林、水果、鲜花、谷物、草、草本作物、树叶、树皮、针叶、原木、根、树苗、灌木丛、柳枝稷,树木、蔬菜、水果皮、藤蔓、甜菜粕、小麦麸皮、燕麦壳、硬木材或软木材、由农业加工产生的有机废弃物材料,林业木材废弃物,或它们中的任意两种或更多种的组合。木质纤维素可被视为潜在的可再生原料,通常包含多糖纤维素(葡聚糖)和半纤维素(木聚糖、杂木聚糖和木葡聚糖)。此外,一些半纤维素可能作为葡甘露聚糖存在,例如在源自木材的原料中。这些多糖酶促水解成可溶性糖,包括单体和多聚体两者,例如葡萄糖、纤维二糖、木糖、阿拉伯糖、半乳糖、果糖、甘露糖、鼠李糖、核糖、半乳糖醛酸、葡糖醛酸和其他己糖和戊糖,是在协同作用的不同酶的作用下发生的。此外,果胶和其他果胶物质(例如阿拉伯聚糖)可能占非木本植物组织的典型细胞壁的干物质的相当大比例(约四分之一到一半的干物质可为果胶)。可以预处理木质纤维素材料。预处理可包括将木质纤维素材料暴露于酸、碱、溶剂、热、过氧化物、臭氧、机械粉碎、研磨、铣削或快速减压,或它们中的任何两种或更多种的组合。这种化学预处理往往与热预处理(例如在150-220℃之间达1分钟至30分钟)进行组合。
除了可发酵碳源之外,发酵进料和/或发酵培养基还包含氧化氮源。氧化氮源的示例包括亚硝酸根和硝酸根的碱金属盐和碱土金属盐,例如硝酸钠、亚硝酸钠、硝酸钾、亚硝酸钾、硝酸钙、亚硝酸钙、硝酸镁和/或亚硝酸镁。氧化氮源也可以作为溶解或离解的盐存在,也就是说,其也可以作为亚硝酸根NO2 -离子或硝酸根NO3 -离子存在。合适地,氧化氮源,例如硝酸盐或亚硝酸盐,可以与铵组合存在。例如硝酸铵或亚硝酸铵可用作氧化氮源。然而,硝酸铵可能为爆炸性的,并且因此需要在减轻这种风险的组合物中提供。
氧化氮源的另一个示例是所谓的硝酸尿素铵,也缩写为UAN(UAN例如由挪威的生产商YARA供应)。UAN提供四种不同形式的氮:NH4、NO3、尿素和NH3。即使UAN仍包含尿素,但使用UAN代替尿素可大大降低尿素的百分比。有利地,虽然UAN含有硝酸铵,但是UAN不是爆炸性的并且在空运、陆运或海运期间不被分类为“危险品”。
厌氧发酵方法产生一种或多种发酵产物。合适的发酵产物包括醇类和有机酸。优选的发酵产物包括乙醇、丁醇、乳酸和琥珀酸。此外,该方法还提供干酒糟(DDG)。
这种干酒糟(DDG)可以有利地用作动物饲料,例如用作牛、猪或家禽的饲料的一部分。由于使用根据本发明的酵母属酵母细胞,所以可以改善干酒糟(DDG)的品质。可以减少其中氨基甲酸乙酯和/或乳酸的量并且可以改善其中含氮组分的类型和浓度。有利地,干酒糟可以不包含或包含减少量的氨基甲酸乙酯(urethane/ethyl carbamate)。
有利地,本发明提供了一种包含酒糟的产物,所述产物包含等于或小于17ng/g的氨基甲酸乙酯,更优选等于或小于10ng/g的氨基甲酸乙酯,甚至更优选等于或小于5ng/g,并且最优选等于或小于1ng/g的氨基甲酸乙酯。不存在下限,但出于实际原因酒糟可包含等于或大于0.001ng/g。酒糟可以是湿的或干的,并且可以有或没有可溶物。
在本申请中引用的全部专利和文献参考文件通过引用以其全部内容特此并入。
以下实施例仅提供用于说明目的,并且并非旨在以任何方式限制本发明的范围。
实施例
为了在酵母细胞中并入NADH依赖性硝酸盐和/或亚硝酸盐同化途径,要测试替代基因组合。对于该途径中的许多酶,即硝酸盐和/或亚硝酸盐转运体、NADH依赖性硝酸还原酶和/或NADH依赖性亚硝酸还原酶,将测试多个替代基因,所述基因可以使在厌氧条件下,酵母属酵母细胞将外部氧化氮源转换为细胞内氨,并行地将戊糖和/或己糖转换为乙醇。
除非另有说明,否则使用的方法是标准生化技术。合适的通用方法教科书的示例包括Sambrook等人,Molecular Cloning,a Laboratory Manual(1989)和Ausubel等人,Current Protocols in Molecular Biology(1995),John Wiley&Sons,Inc。
预言性实施例1
乙醇红,一种可从LeSaffre(法国)获得的商业酿酒酵母,可用于表达各种NADH依赖性硝酸还原酶(EC 1.7.1.1)、NADH依赖性亚硝酸还原酶(EC 1.7.1.15)和/或硝酸盐转运体和/或钼辅因子途径。例如,这种经修饰的酵母可以含有来自玉蜀黍的NADH依赖性硝酸还原酶(SEQ ID NO:1)、来自编码小亚基NirD(SEQ ID NO:3)和大亚基NirB(SEQ ID NO:4)的大肠杆菌的NADH依赖性亚硝酸还原酶、和来自大肠杆菌的血红素合酶CysG(SEQ ID NO:22)或酿酒酵母MET8双功能脱氢酶和亚铁螯合酶(YBR213W)(SEQ ID NO:23)的过表达:
SEQ ID NO:23(MET8):
>sp|P15807|MET8_YEAST血红素生物合成蛋白MET8 OS=酿酒酵母(菌株ATCC204508/S288c)OX=559292GN=MET8 PE=1SV=1
Figure BDA0004159466160000721
SEQ ID NO:22(CysG):
>sp|P0AEA8|CYSG_ECOLI血红素合酶OS=大肠杆菌(菌株K12)OX=83333GN=cysGPE=1SV=1
Figure BDA0004159466160000722
Figure BDA0004159466160000731
此外,这种经修饰的酵母可以表达产生钼蝶呤辅因子的功能性途径。用于来自GTP的钼喋呤途径的基因和对应的酶可以从MetaCyc网站(https://metacyc.org,2020年10月5日获得)下载。
大肠杆菌钼蝶呤途径已经由Leimkühler S、Wuebbens MM、Rajagopalan KV.在其发表于发表于Coord Chem Rev.(2011);第255(9-10)卷:第1129-1144页.(doi:10.1016/j.ccr.2010.12.003)的文章“The History of the Discovery of the MolybdenumCofactor and Novel Aspects of its Biosynthesis in Bacteria”中进行了描述。可以表达钼蝶呤辅因子途径的以下酶:MoaA(SEQ ID NO:7)、MoaC(SEQ ID NO:8)、MoaD(SEQ IDNO:9)、MoaE(SEQ ID NO:10)、MoeB(SEQ ID NO:19)、MogA(SEQ ID NO:20)、MoeA(SEQ IDNO:18)、MobA(SEQ ID NO:11)、MobB(SEQ ID NO:12)、MocA(SEQ ID NO13)、和/或IscS(SEQID NO:21)和/或用于钼酸盐转运的ModA、ModB和/或ModC(分别为SEQ ID NO:14、SEQ IDNO:15和SEQ ID NO:16)和/或ModE(SEQ ID NO:17)。
这种经修饰的酵母可以另外或替代地表达功能性途径以从植物中产生钼蝶呤辅因子,如例如由Mendel RR在其发表于J Exp Bot.(2007);第58(9)卷:第2289-2296页.(doi:10.1093/jxb/erm024.电子出版2007年3月9日.PMID:17351249.)的题为“Biology ofthe molybdenum cofactor”的文章中描述。合适地,来自拟南芥的以下酶可以在酵母中表达以产生Cnx1(SEQ ID NO:24)、Cnx2(SEQ ID NO:25)、Cnx3(SEQ ID NO:26)、Cnx5=MOCS3(SEQ ID NO:27)、Cnx6=Moc2B(SEQ ID NO:28)、Cnx7=Moc2A(SEQ ID NO:29):
SEQ ID NO:24(CNX1):
>sp|Q39054|CNX1_ARATH钼蝶呤生物合成蛋白CNX1 OS=拟南芥OX=3702GN=CNX1 PE=1SV=2
Figure BDA0004159466160000741
SEQ ID NO:25(CNX2):
>sp|Q39055|CNX2_ARATH GTP 3′,8-环化酶,线粒体OS=拟南芥OX=3702GN=CNX2 PE=1SV=1
Figure BDA0004159466160000742
SEQ ID NO:26(CNX3):
>sp|Q39056|CNX3_ARATH环吡喃蝶呤单磷酸合酶,线粒体OS=拟南芥OX=3702GN=CNX3 PE=1SV=1
Figure BDA0004159466160000751
SEQ ID NO:27(MOCS3):
>sp|Q9ZNW0|MOCS3_ARATH腺苷酸转移酶和硫转移酶MOCS3 OS=拟南芥OX=3702GN=MOCS3 PE=2SV=1
Figure BDA0004159466160000752
SEQ ID NO:28(Moc2B):
>sp|O22827|MOC2B_ARATH钼蝶呤合酶催化亚基OS=拟南芥OX=3702GN=MOCS2PE=2SV=1
Figure BDA0004159466160000761
SEQ ID NO:29(MOC2A):
>sp|Q9S7A3|MOC2A_ARATH钼蝶呤合酶硫载体亚基OS=拟南芥OX=3702GN=At4g10100 PE=3SV=1
Figure BDA0004159466160000762
SEQ ID NO:7(MoaA):
>sp|P30745|MOAA_ECOLI GTP 3′,8-环化酶OS=大肠杆菌(菌株K12)OX=83333GN=moaA PE=1SV=1
Figure BDA0004159466160000763
SEQ ID NO:8(MoaC):
>sp|P0A738|MOAC_ECOLI环吡喃蝶呤单磷酸合酶OS=大肠杆菌(菌株K12)OX=83333GN=moaC PE=1SV=2
Figure BDA0004159466160000764
Figure BDA0004159466160000771
SEQ ID NO:9(MoaD):
>sp|P30748|MOAD_ECOLI钼蝶呤合酶硫载体亚基OS=大肠杆菌(菌株K12)OX=83333GN=moaD PE=1SV=2
Figure BDA0004159466160000772
SEQ ID NO:10(MoaE):
>sp|P30749|MOAE_ECOLI钼蝶呤合酶催化亚基OS=大肠杆菌(菌株K12)OX=83333GN=moaE PE=1SV=3
Figure BDA0004159466160000773
SEQ ID NO:18(MoeA):
>sp|P12281|MOEA_ECOLI钼蝶呤钼转移酶OS=大肠杆菌(菌株K12)OX=83333GN=moeA PE=1SV=1
Figure BDA0004159466160000774
SEQ ID NO:19(MoeB):
>sp|P12282|MOEB_ECOLI钼蝶呤合酶腺苷酸转移酶OS=大肠杆菌(菌株K12)OX=83333GN=moeB PE=1SV=1
Figure BDA0004159466160000781
SEQ ID NO:20(mogA):
>sp|P0AF03|MOG_ECOLI钼蝶呤腺苷酸转移酶OS=大肠杆菌(菌株K12)OX=83333GN=mog PE=1SV=1
Figure BDA0004159466160000782
SEQ ID NO:11(MobA):
>sp|P32173|MOBA_ECOLI钼辅因子鸟苷酸转移酶OS=大肠杆菌(菌株K12)OX=83333GN=mobA PE=1SV=1
Figure BDA0004159466160000783
SEQ ID NO:13(mocA):
>sp|Q46810|MOCA_ECOLI钼辅因子胞苷转移酶OS=大肠杆菌(菌株K12)OX=83333GN=mocA PE=1SV=1
Figure BDA0004159466160000791
SEQ ID NO:14(modA):
>sp|P37329|MODA_ECOLI钼酸根结合蛋白ModA OS=大肠杆菌(菌株K12)OX=83333GN=modA PE=1SV=1
Figure BDA0004159466160000792
SEQ ID NO:15(modB):
>sp|P39423|MODB_BPT4 NAD--蛋白质ADP-核糖基转移酶modB OS=肠杆菌噬菌体T4 OX=10665GN=modB PE=1SV=2
Figure BDA0004159466160000793
SEQ ID NO:16(modC):
>sp|P09833|MODC_ECOLI钼输入ATP结合蛋白ModC OS=大肠杆菌(菌株K12)OX=83333GN=modC PE=3SV=4
Figure BDA0004159466160000801
SEQ ID NO:21(IscS):
>sp|P0A6B7|ISCS_ECOLI半胱氨酸脱硫酶IscS OS=大肠杆菌(菌株K12)OX=83333GN=iscS PE=1SV=1
Figure BDA0004159466160000802
WO2013144257A1(专利申请PCT/EP2013/056623的公开案)和WO 2015/028582中描述了菌株构建方法。在转化这种酵母后将来自各种感兴趣的基因的表达盒在体内重组到特定基因座处的途径中(US9738890 B2)。
在TWIST(South San Francisco,CA 94080,USA)合成开放阅读框(open readingframe,ORF)。将启动子、ORF和终止子序列使用如由Engler等人(2011)所述的Golden Gate技术装配到表达盒中,并连接到经Bsal消化的主链载体中,该载体用用于体内重组步骤的连接物装饰表达盒。将包括连接物的表达盒通过PCR扩增。此外,使用PCR扩增整合基因座上游和下游部分约500bp的5′-DNA片段和3′-DNA片段,并通过连接物序列进行装饰。在用这些DNA片段转化酵母细胞后,在所需位置发生体内重组和整合到基因组中。CRISPR-Cas9技术用于在整合基因座处进行独特的双链断裂,以靶向通往该特定基因座的途径(DiCarlo等人,2013,Nucleic Acids Res41:4336-4343和WO16110512)。
在厌氧发酵中测试菌株。通过将333g玉米粉(Limagrain,Belgium)/kg醪液与300ml/kg稀釜馏物和367ml/kg脱矿质水混合来制备玉米醪液(30%(w/w)固体)的。用2MKOH溶液将pH调节至5.5。通过添加0.02g/kg的商业α-淀粉酶(Termamyl,Novozymes)液化混合物中的淀粉,并在旋转振荡器中于80℃孵育4小时。在液化后,用2M H2SO4溶液将pH调节至4.5。通过从冷冻管中接种补充有2%w/v葡萄糖的200ml YepH(20g/l植物蛋白胨、10g/l酵母提取物)来预培养菌株,并在500ml摇瓶中孵育。为了确定酵母的接种体积,通过经由CEM-SMART微波进行过滤和干燥来确定培养物的细胞干重(dry cell weight,DCW)含量。将与增殖所需的接种量相对应的一定量的预培养物离心(3min,4500x g),用无菌脱矿质水洗涤一次,再离心一次,重悬于增殖培养基中并转移到增殖烧瓶中。在100ml带泡沫塞的锥形摇瓶中在32℃、150rpm下执行增殖达6h,从而创造半需氧环境。将增殖培养基稀释成70%(v/v)溶液,检查pH 4.5,并供应4.2g/l KNO3和抗生素(新霉素和PenG)。对于每个菌株,添加0.088g/l商业淀粉葡糖苷酶(Spirizyme Excel,novozymes)。使用装有200ml玉米醪液并装配有Ankom气体生产系统盖(Ankom,Macedon,NY,USA)的500ml肖特瓶,以同时糖化发酵(simultaneous saccharification fermentation,SSF)模式执行发酵,从而有效地使发酵厌氧。所述玉米醪液原样使用,添加3.4g/l KNO3和抗生素,pH 4.5。发酵器的接种是通过将10%的增殖培养基转移到发酵器中,达到400ml的体积来完成的。发酵期间不控制pH,而将温度控制在32℃。在整个运行过程中采集发酵样品,并使用具有柱温箱TCC-3400和配备有保护柱(Bio-Rad H灌流器)和Aminex HPX-87H柱(300×7.8mm;Bio-Rad,Hercules,USA)的自动进样器WPS-3000的Dionex Ultimate 3000HPLC系统,通过HPLC分析测量不同的组分;用5mM H28O4以0.55ml/min于65℃进行洗脱;使用折射率检测器RefractoMax 521监测洗脱液。在发酵期间在线测量CO2
序列表
<110> 帝斯曼知识产权资产有限公司(DSM IP Assets B.V.)
<120> 酵母属酵母细胞及使用其的发酵方法
<130> 33826-WO-PCT
<160> 29
<170> BiSSAP 1.3.6
<210> 1
<211> 910
<212> PRT
<213> 玉米(Zea mays)
<220>
<223> NR1硝酸还原酶
<400> 1
Met Ala Ala Val Glu Pro Arg Gln Phe Gly Arg Leu Glu Pro Gly Ser
1 5 10 15
Ser Pro Val Arg Val Ala Thr Asn Gly Ala Lys Ala Tyr Pro Pro Pro
20 25 30
Ala Ser His Leu Pro Arg Arg Ala Asp Ser Pro Val Arg Gly Cys Ser
35 40 45
Phe Pro Pro Leu Val Ser Pro Pro Arg Arg Leu Asp Asp Ala Ser Asp
50 55 60
Asp Glu Asp Glu Glu Gln Glu Asp Trp Arg Glu Leu Tyr Gly Ser His
65 70 75 80
Leu Gln Leu Glu Val Glu Pro Ala Val Gln Asp Ala Arg Asp Glu Gly
85 90 95
Thr Ala Asp Ala Trp Ile Glu Arg Asn Pro Cys Leu Val Arg Leu Thr
100 105 110
Gly Lys His Pro Leu Asn Cys Glu Pro Pro Leu Ala Arg Leu Met His
115 120 125
His Gly Phe Ile Thr Pro Ala Pro Leu His Tyr Val Arg Asn His Gly
130 135 140
Ala Val Pro Arg Gly Asp Trp Ala Thr Trp Thr Val Glu Val Thr Gly
145 150 155 160
Leu Val Arg Arg Pro Ala Arg Leu Thr Met Glu Glu Leu Ala Arg Asp
165 170 175
Phe Pro Ala Val Glu Ile Pro Val Thr Leu Ala Cys Ala Gly Asn Arg
180 185 190
Arg Lys Glu Gln Asn Met Val Gln Gln Thr Val Gly Phe Asn Trp Gly
195 200 205
Ala Ala Gly Val Ser Thr Ser Val Trp Arg Gly Ala Arg Leu Arg Asp
210 215 220
Val Leu Arg Arg Cys Gly Ile Val Pro Arg Lys Gly Gly Ala Leu Asn
225 230 235 240
Val Cys Phe Glu Gly Ala Glu Asp Leu Pro Gly Gly Gly Gly Ser Lys
245 250 255
Tyr Gly Thr Ser Val Thr Arg Glu Trp Ala Leu Asp Pro Ser Arg Asp
260 265 270
Ile Met Leu Ala Tyr Met Gln Asn Gly Glu Pro Leu Leu Pro Asp His
275 280 285
Gly Phe Pro Val Arg Val Ile Ile Pro Gly Cys Ile Gly Gly Arg Met
290 295 300
Val Lys Trp Leu Lys Arg Ile Ile Val Thr Pro Ala Glu Ser Asp Asn
305 310 315 320
Tyr Tyr His Phe Lys Asp Asn Arg Val Leu Pro Ser His Val Asp Ala
325 330 335
Glu Leu Ala Asn Ala Glu Ala Trp Trp Tyr Lys Pro Glu Tyr Ile Ile
340 345 350
Asn Glu Leu Asn Ile Asn Ser Val Ile Thr Thr Pro Gly His Asp Glu
355 360 365
Ile Leu Pro Ile Asn Ser Ile Thr Thr Gln Arg Gly Tyr Thr Met Lys
370 375 380
Gly Tyr Ala Tyr Ser Gly Gly Gly Lys Lys Val Thr Arg Val Glu Val
385 390 395 400
Thr Leu Asp Gly Gly Glu Thr Trp Leu Val Cys His Leu Asp His Pro
405 410 415
Glu Lys Pro Asn Lys Tyr Gly Lys Tyr Trp Cys Trp Cys Phe Trp Ser
420 425 430
Val Glu Val Glu Val Leu Asp Leu Leu Gly Ala Lys Glu Ile Ala Val
435 440 445
Arg Ala Trp Asp Gln Ser Leu Asn Thr Gln Pro Glu Lys Leu Ile Trp
450 455 460
Asn Leu Met Gly Met Met Asn Asn Cys Trp Phe Lys Val Lys Val Asn
465 470 475 480
Val Cys Arg Pro His Lys Gly Glu Ile Gly Leu Val Phe Glu His Pro
485 490 495
Thr Gln Pro Gly Asn Gln Pro Gly Gly Trp Met Ala Arg Gln Lys His
500 505 510
Leu Glu Thr Ala Glu Ala Ala Ala Pro Gly Leu Lys Arg Ser Thr Ser
515 520 525
Thr Pro Phe Met Asn Thr Thr Asp Val Gly Lys Gln Phe Thr Met Ser
530 535 540
Glu Val Arg Lys His Ala Ser Gln Glu Ser Ala Trp Ile Ala Val His
545 550 555 560
Gly His Val Tyr Asp Cys Thr Lys Phe Leu Lys Asp His Pro Gly Gly
565 570 575
Ala Asp Ser Ile Leu Ile Asn Ala Gly Thr Asp Cys Thr Glu Glu Phe
580 585 590
Asp Ala Ile His Ser Asp Lys Ala Lys Ala Leu Leu Asp Thr Tyr Arg
595 600 605
Ile Gly Glu Leu Ile Thr Thr Gly Thr Gly Tyr Ser Ser Asp Asn Ser
610 615 620
Val His Gly Gly Ser Val Leu Ser His Leu Ala Pro Ile Arg Glu Ala
625 630 635 640
Val Arg Ala Pro Ala Leu Ser Asn Pro Arg Asp Lys Ile His Cys Arg
645 650 655
Leu Val Gly Lys Lys Glu Leu Ser Arg Asp Val Arg Leu Phe Arg Phe
660 665 670
Ser Leu Pro Ser Pro Asp Gln Val Leu Gly Leu Pro Ile Gly Lys His
675 680 685
Ile Phe Val Cys Ala Ser Ile Glu Gly Lys Leu Cys Met Arg Ala Tyr
690 695 700
Thr Pro Thr Ser Met Val Asp Glu Ile Gly His Phe Asp Leu Leu Val
705 710 715 720
Lys Val Tyr Phe Lys Asn Glu His Pro Lys Phe Pro Asn Gly Gly Leu
725 730 735
Met Thr Gln Tyr Leu Asp Ser Leu Pro Val Gly Ser Tyr Ile Asp Val
740 745 750
Lys Gly Pro Leu Gly His Val Glu Tyr Thr Gly Arg Gly Ser Phe Val
755 760 765
Ile Asn Gly Lys Gln Arg His Ala Ser Arg Leu Ala Met Ile Cys Gly
770 775 780
Gly Ser Gly Ile Thr Pro Met Tyr Gln Ile Ile Gln Ala Val Leu Arg
785 790 795 800
Asp Gln Pro Glu Asp His Thr Glu Met His Leu Val Tyr Ala Asn Arg
805 810 815
Thr Glu Asp Asp Ile Leu Leu Arg Asp Glu Leu Asp Arg Trp Ala Ala
820 825 830
Glu Tyr Pro Asp Arg Leu Lys Val Trp Tyr Val Ile Asp Gln Val Lys
835 840 845
Arg Pro Glu Glu Gly Trp Lys Tyr Ser Val Gly Phe Val Thr Glu Ala
850 855 860
Val Leu Arg Glu His Val Pro Glu Gly Gly Asp Asp Thr Leu Ala Leu
865 870 875 880
Ala Cys Gly Pro Pro Pro Met Ile Gln Phe Ala Ile Ser Pro Asn Leu
885 890 895
Glu Lys Met Lys Tyr Asp Met Ala Asn Ser Phe Val Val Phe
900 905 910
<210> 2
<211> 926
<212> PRT
<213> 菠菜(Spinacia oleracea)
<220>
<223> NIA硝酸还原酶
<400> 2
Met Ala Ala Ser Val Asp Arg Gln Tyr His Pro Ala Pro Met Ser Gly
1 5 10 15
Val Val Arg Thr Pro Phe Ser Asn His His Arg Ser Asp Ser Pro Val
20 25 30
Arg Asn Gly Tyr Thr Phe Ser Asn Pro Pro Ser Ser Asn Gly Val Val
35 40 45
Lys Pro Gly Glu Lys Ile Lys Leu Val Asp Asn Asn Ser Asn Ser Asn
50 55 60
Asn Gly Ser Asn Asn Asn Asn Asn Arg Tyr Asp Ser Asp Ser Glu Glu
65 70 75 80
Asp Asp Asp Glu Asn Glu Met Asn Val Trp Asn Glu Met Ile Lys Lys
85 90 95
Gly Asn Ser Glu Leu Glu Pro Ser Ser Val Asp Ser Arg Asp Glu Gly
100 105 110
Thr Ala Asp Gln Trp Ile Glu Arg Asn Pro Ser Met Ile Arg Leu Thr
115 120 125
Gly Lys His Pro Phe Asn Ser Glu Pro Pro Leu Thr Arg Leu Met His
130 135 140
His Gly Phe Leu Thr Pro Val Pro Leu His Tyr Val Arg Asn His Gly
145 150 155 160
Pro Val Pro Asn Ala Lys Trp Glu Asp Trp Thr Val Glu Val Thr Gly
165 170 175
Leu Val Lys Arg Pro Ile Arg Phe Thr Met Asp Gln Leu Val Asn Asp
180 185 190
Phe Gln Ser Arg Glu Phe Pro Val Thr Leu Val Cys Ala Gly Asn Arg
195 200 205
Arg Lys Glu Gln Asn Met Thr Lys Gln Ser Ile Gly Phe Asn Trp Gly
210 215 220
Ser Ala Ala Val Ser Thr Ser Val Trp Arg Gly Val Pro Leu Arg Asp
225 230 235 240
Val Leu Lys Arg Cys Gly Val Met Ser Ser Leu Lys Gly Ala Leu Asn
245 250 255
Val Cys Phe Glu Gly Ala Glu Asp Leu Pro Gly Gly Gly Gly Ser Lys
260 265 270
Tyr Gly Thr Ser Val Lys Arg Glu Phe Ala Met Asp Pro Ala Arg Asp
275 280 285
Ile Ile Leu Ala Tyr Met Gln Asn Gly Glu Lys Leu Ser Pro Asp His
290 295 300
Gly Tyr Pro Val Arg Met Ile Ile Pro Gly Phe Ile Gly Gly Arg Met
305 310 315 320
Val Lys Trp Leu Lys Arg Ile Ile Val Thr Thr Thr Glu Ser Asp Asn
325 330 335
Tyr Tyr His Tyr Lys Asp Asn Arg Val Leu Pro Ser His Val Asp Ala
340 345 350
Glu Leu Ala Asn Ser Glu Ala Trp Trp Tyr Lys Gln Glu Tyr Ile Ile
355 360 365
Asn Glu Leu Asn Val Asn Ser Val Ile Thr Ser Pro Cys His Glu Glu
370 375 380
Ile Leu Pro Ile Asn Ala Trp Thr Thr Gln Arg Pro Tyr Thr Met Arg
385 390 395 400
Gly Tyr Ala Tyr Ser Gly Gly Gly Arg Lys Val Thr Arg Val Glu Val
405 410 415
Thr Met Asp Gly Gly Asp Thr Trp Asp Ile Cys Glu Leu Asp His Gln
420 425 430
Glu Arg Gly Ser Lys Tyr Gly Lys Phe Trp Cys Trp Cys Phe Trp Ser
435 440 445
Leu Glu Val Glu Val Leu Asp Leu Leu Gly Ala Lys Glu Ile Gly Val
450 455 460
Arg Ala Trp Asp Glu Ser Leu Asn Thr Gln Pro Glu Lys Leu Ile Trp
465 470 475 480
Asn Val Met Gly Met Met Asn Asn Cys Trp Phe Arg Val Lys Thr Asn
485 490 495
Val Cys Lys Pro His Lys Gly Glu Ile Gly Ile Val Phe Glu His Pro
500 505 510
Thr Gln Pro Gly Asn Lys Ser Gly Gly Trp Met Ala Arg Glu Arg His
515 520 525
Leu Glu Ile Ser Asp Ser Gly Pro Thr Leu Lys Arg Thr Ala Ser Thr
530 535 540
Pro Phe Met Asn Thr Thr Ser Lys Met Tyr Ser Met Ser Glu Val Lys
545 550 555 560
Lys His Asn Thr Ala Asp Ser Ala Trp Ile Val Val His Gly Asn Val
565 570 575
Tyr Asn Ala Thr Arg Phe Leu Lys Asp His Pro Gly Gly Ser Asp Ser
580 585 590
Ile Leu Ile Asn Ala Gly Thr Asp Cys Thr Glu Glu Phe Asp Ala Ile
595 600 605
His Ser Asp Lys Ala Lys Arg Leu Leu Glu Asp Phe Arg Ile Gly Glu
610 615 620
Leu Ile Ser Thr Gly Tyr Thr Ser Asp Ser Ser Ser Pro Gly Asn Ser
625 630 635 640
Val His Gly Gly Ser Val Tyr Ser Gly Leu Ala Gly Leu Ala Pro Ile
645 650 655
Thr Glu Ala Val Pro Leu Arg Asn Val Ala Leu Asn Pro Arg Val Lys
660 665 670
Ile Pro Cys Lys Leu Ile Glu Lys Val Ser Leu Ser His Asp Val Arg
675 680 685
Arg Phe Arg Phe Gly Leu Pro Ser Glu Asp Gln Val Leu Gly Leu Pro
690 695 700
Val Gly Lys His Ile Phe Leu Cys Ala Asn Val Asp Asp Lys Leu Cys
705 710 715 720
Met Arg Ala Tyr Thr Pro Ser Ser Thr Ile Asp Val Val Gly Tyr Phe
725 730 735
Asp Leu Val Val Lys Val Tyr Phe Lys Asp Val His Pro Arg Phe Pro
740 745 750
Asn Gly Gly Val Met Ser Gln His Leu Asp Ser Leu Ser Leu Gly Ser
755 760 765
Ile Val Asp Val Lys Gly Pro Leu Gly His Ile Glu Tyr Leu Gly Lys
770 775 780
Gly Asn Phe Thr Val His Gly Lys Pro Lys Phe Ala Lys Lys Leu Ala
785 790 795 800
Met Ile Ser Gly Gly Thr Gly Ile Thr Pro Ile Tyr Gln Val Met Gln
805 810 815
Ala Ile Leu Lys Asp Pro Glu Asp Lys Thr Glu Met His Val Val Tyr
820 825 830
Ala Asn Arg Thr Glu Glu Asp Ile Leu Leu Arg Glu Glu Leu Asp Lys
835 840 845
Trp Ala Asp Glu Phe Arg Asp Arg Val Lys Val Trp Tyr Val Val Glu
850 855 860
Lys Ala Glu Glu Gly Trp Lys Tyr Asp Thr Gly Phe Ile Ser Glu Lys
865 870 875 880
Ile Leu Arg Asp His Val Pro Ala Val Gly Asp Asp Val Leu Ala Leu
885 890 895
Thr Cys Gly Pro Pro Pro Met Ile Gln Phe Ala Val Gln Pro Asn Leu
900 905 910
Asp Lys Met Gly Phe Asp Ile Lys Glu Gln Leu Leu Ile Phe
915 920 925
<210> 3
<211> 108
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> nirD亚硝酸还原酶大肠杆菌(小亚基)
<400> 3
Met Ser Gln Trp Lys Asp Ile Cys Lys Ile Asp Asp Ile Leu Pro Glu
1 5 10 15
Thr Gly Val Cys Ala Leu Leu Gly Asp Glu Gln Val Ala Ile Phe Arg
20 25 30
Pro Tyr His Ser Asp Gln Val Phe Ala Ile Ser Asn Ile Asp Pro Phe
35 40 45
Phe Glu Ser Ser Val Leu Ser Arg Gly Leu Ile Ala Glu His Gln Gly
50 55 60
Glu Leu Trp Val Ala Ser Pro Leu Lys Lys Gln Arg Phe Arg Leu Ser
65 70 75 80
Asp Gly Leu Cys Met Glu Asp Glu Gln Phe Ser Val Lys His Tyr Glu
85 90 95
Ala Arg Val Lys Asp Gly Val Val Gln Leu Arg Gly
100 105
<210> 4
<211> 847
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> nirB硝酸还原酶大肠杆菌(大亚基)
<400> 4
Met Ser Lys Val Arg Leu Ala Ile Ile Gly Asn Gly Met Val Gly His
1 5 10 15
Arg Phe Ile Glu Asp Leu Leu Asp Lys Ser Asp Ala Ala Asn Phe Asp
20 25 30
Ile Thr Val Phe Cys Glu Glu Pro Arg Ile Ala Tyr Asp Arg Val His
35 40 45
Leu Ser Ser Tyr Phe Ser His His Thr Ala Glu Glu Leu Ser Leu Val
50 55 60
Arg Glu Gly Phe Tyr Glu Lys His Gly Ile Lys Val Leu Val Gly Glu
65 70 75 80
Arg Ala Ile Thr Ile Asn Arg Gln Glu Lys Val Ile His Ser Ser Ala
85 90 95
Gly Arg Thr Val Phe Tyr Asp Lys Leu Ile Met Ala Thr Gly Ser Tyr
100 105 110
Pro Trp Ile Pro Pro Ile Lys Gly Ser Asp Thr Gln Asp Cys Phe Val
115 120 125
Tyr Arg Thr Ile Glu Asp Leu Asn Ala Ile Glu Ser Cys Ala Arg Arg
130 135 140
Ser Lys Arg Gly Ala Val Val Gly Gly Gly Leu Leu Gly Leu Glu Ala
145 150 155 160
Ala Gly Ala Leu Lys Asn Leu Gly Ile Glu Thr His Val Ile Glu Phe
165 170 175
Ala Pro Met Leu Met Ala Glu Gln Leu Asp Gln Met Gly Gly Glu Gln
180 185 190
Leu Arg Arg Lys Ile Glu Ser Met Gly Val Arg Val His Thr Ser Lys
195 200 205
Asn Thr Leu Glu Ile Val Gln Glu Gly Val Glu Ala Arg Lys Thr Met
210 215 220
Arg Phe Ala Asp Gly Ser Glu Leu Glu Val Asp Phe Ile Val Phe Ser
225 230 235 240
Thr Gly Ile Arg Pro Arg Asp Lys Leu Ala Thr Gln Cys Gly Leu Asp
245 250 255
Val Ala Pro Arg Gly Gly Ile Val Ile Asn Asp Ser Cys Gln Thr Ser
260 265 270
Asp Pro Asp Ile Tyr Ala Ile Gly Glu Cys Ala Ser Trp Asn Asn Arg
275 280 285
Val Phe Gly Leu Val Ala Pro Gly Tyr Lys Met Ala Gln Val Ala Val
290 295 300
Asp His Ile Leu Gly Ser Glu Asn Ala Phe Glu Gly Ala Asp Leu Ser
305 310 315 320
Ala Lys Leu Lys Leu Leu Gly Val Asp Val Gly Gly Ile Gly Asp Ala
325 330 335
His Gly Arg Thr Pro Gly Ala Arg Ser Tyr Val Tyr Leu Asp Glu Ser
340 345 350
Lys Glu Ile Tyr Lys Arg Leu Ile Val Ser Glu Asp Asn Lys Thr Leu
355 360 365
Leu Gly Ala Val Leu Val Gly Asp Thr Ser Asp Tyr Gly Asn Leu Leu
370 375 380
Gln Leu Val Leu Asn Ala Ile Glu Leu Pro Glu Asn Pro Asp Ser Leu
385 390 395 400
Ile Leu Pro Ala His Ser Gly Ser Gly Lys Pro Ser Ile Gly Val Asp
405 410 415
Lys Leu Pro Asp Ser Ala Gln Ile Cys Ser Cys Phe Asp Val Thr Lys
420 425 430
Gly Asp Leu Ile Ala Ala Ile Asn Lys Gly Cys His Thr Val Ala Ala
435 440 445
Leu Lys Ala Glu Thr Lys Ala Gly Thr Gly Cys Gly Gly Cys Ile Pro
450 455 460
Leu Val Thr Gln Val Leu Asn Ala Glu Leu Ala Lys Gln Gly Ile Glu
465 470 475 480
Val Asn Asn Asn Leu Cys Glu His Phe Ala Tyr Ser Arg Gln Glu Leu
485 490 495
Phe His Leu Ile Arg Val Glu Gly Ile Lys Thr Phe Glu Glu Leu Leu
500 505 510
Ala Lys His Gly Lys Gly Tyr Gly Cys Glu Val Cys Lys Pro Thr Val
515 520 525
Gly Ser Leu Leu Ala Ser Cys Trp Asn Glu Tyr Ile Leu Lys Pro Glu
530 535 540
His Thr Pro Leu Gln Asp Ser Asn Asp Asn Phe Leu Ala Asn Ile Gln
545 550 555 560
Lys Asp Gly Thr Tyr Ser Val Ile Pro Arg Ser Pro Gly Gly Glu Ile
565 570 575
Thr Pro Glu Gly Leu Met Ala Val Gly Arg Ile Ala Arg Glu Phe Asn
580 585 590
Leu Tyr Thr Lys Ile Thr Gly Ser Gln Arg Leu Ala Met Phe Gly Ala
595 600 605
Gln Lys Asp Asp Leu Pro Glu Ile Trp Arg Gln Leu Ile Glu Ala Gly
610 615 620
Phe Glu Thr Gly His Ala Tyr Ala Lys Ala Leu Arg Met Ala Lys Thr
625 630 635 640
Cys Val Gly Ser Thr Trp Cys Arg Tyr Gly Val Gly Asp Ser Val Gly
645 650 655
Leu Gly Val Glu Leu Glu Asn Arg Tyr Lys Gly Ile Arg Thr Pro His
660 665 670
Lys Met Lys Phe Gly Val Ser Gly Cys Thr Arg Glu Cys Ser Glu Ala
675 680 685
Gln Gly Lys Asp Val Gly Ile Ile Ala Thr Glu Lys Gly Trp Asn Leu
690 695 700
Tyr Val Cys Gly Asn Gly Gly Met Lys Pro Arg His Ala Asp Leu Leu
705 710 715 720
Ala Ala Asp Ile Asp Arg Glu Thr Leu Ile Lys Tyr Leu Asp Arg Phe
725 730 735
Met Met Phe Tyr Ile Arg Thr Ala Asp Lys Leu Thr Arg Thr Ala Pro
740 745 750
Trp Leu Glu Asn Leu Glu Gly Gly Ile Asp Tyr Leu Lys Ala Val Ile
755 760 765
Ile Asp Asp Lys Leu Gly Leu Asn Ala His Leu Glu Glu Glu Met Ala
770 775 780
Arg Leu Arg Glu Ala Val Leu Cys Glu Trp Thr Glu Thr Val Asn Thr
785 790 795 800
Pro Ser Ala Gln Thr Arg Phe Lys His Phe Ile Asn Ser Asp Lys Arg
805 810 815
Asp Pro Asn Val Gln Met Val Pro Glu Arg Glu Gln His Arg Pro Ala
820 825 830
Thr Pro Tyr Glu Arg Ile Pro Val Thr Leu Val Glu Asp Asn Ala
835 840 845
<210> 5
<211> 1104
<212> PRT
<213> 构巢裸壳孢菌(Emericella nidulans)
<220>
<223> niiA亚硝酸还原酶构巢裸壳孢菌(构巢曲霉)
<400> 5
Met Pro Leu Leu Asp Gly Pro Arg Asn Gly Glu Thr Val Thr Ala Ser
1 5 10 15
Ala His Asn Gly Ile Pro Ile Ile Asp Gly Val Asp Pro Ser Thr Leu
20 25 30
Arg Gly Asp Ile Asp Gln Asp Pro Asn Arg Arg Gln Lys Ile Val Val
35 40 45
Val Gly Leu Gly Met Val Ala Val Ala Phe Ile Glu Lys Leu Val Lys
50 55 60
Leu Asp Ser Glu Arg Arg Lys Tyr Asp Ile Val Val Ile Gly Glu Glu
65 70 75 80
Pro His Ile Ala Tyr Asn Arg Val Gly Leu Ser Ser Tyr Phe Glu His
85 90 95
Arg Lys Ile Glu Asp Leu Tyr Leu Asn Pro Lys Glu Trp Tyr Gly Ser
100 105 110
Phe Lys Asp Arg Ser Phe Asp Tyr Tyr Leu Asn Thr Arg Val Thr Asp
115 120 125
Val Phe Pro Gln His Lys Thr Val Lys Thr Ser Thr Gly Asp Ile Val
130 135 140
Ser Tyr Asp Ile Leu Val Leu Ala Thr Gly Ser Asp Ala Val Leu Pro
145 150 155 160
Thr Ser Thr Pro Gly His Asp Ala Lys Gly Ile Phe Val Tyr Arg Thr
165 170 175
Ile Ser Asp Leu Glu Arg Leu Met Glu Phe Ala Ala Asn His Lys Gly
180 185 190
Gln Thr Gly Val Thr Val Gly Gly Gly Leu Leu Gly Leu Glu Ala Ala
195 200 205
Lys Ala Met Thr Asp Leu Glu Asp Phe Gly Ser Val Lys Leu Ile Asp
210 215 220
Arg Asn Lys Trp Val Leu Ala Arg Gln Leu Asp Gly Asp Ala Gly Ser
225 230 235 240
Leu Val Thr Lys Lys Ile Arg Asp Leu Gly Leu Glu Val Leu His Glu
245 250 255
Lys Arg Val Ala Lys Ile His Thr Asp Asp Asp Asn Asn Val Thr Gly
260 265 270
Ile Leu Phe Glu Asp Gly Gln Glu Leu Asp Cys Cys Cys Ile Cys Phe
275 280 285
Ala Ile Gly Ile Arg Pro Arg Asp Glu Leu Gly Gly Ser Thr Gly Ile
290 295 300
Gln Cys Ala Lys Arg Gly Gly Phe Val Ile Asp Glu Ser Leu Arg Thr
305 310 315 320
Ser Val Asn Asp Ile Tyr Ala Ile Gly Glu Cys Ala Ser Trp Glu Asn
325 330 335
Gln Thr Phe Gly Ile Ile Ala Pro Gly Ile Glu Met Ala Asp Val Leu
340 345 350
Ser Phe Asn Leu Thr Asn Pro Asp Lys Glu Pro Lys Arg Phe Asn Arg
355 360 365
Pro Asp Leu Ser Thr Lys Leu Lys Leu Leu Gly Val Asp Val Ala Ser
370 375 380
Phe Gly Asp Phe Phe Ala Asp Arg Asp Gly Pro Lys Phe Leu Pro Gly
385 390 395 400
Gln Arg Pro Ser Ala Glu Ser Ile Gly Ala Ala Asp Pro Asn Arg Glu
405 410 415
Glu Glu Pro Gln Val Lys Ala Leu Thr Tyr Arg Asp Pro Phe Gly Gly
420 425 430
Val Tyr Lys Lys Tyr Leu Phe Thr Met Asp Gly Lys Tyr Leu Leu Gly
435 440 445
Gly Met Met Ile Gly Asp Thr Lys Asp Tyr Val Lys Leu Asn Gln Met
450 455 460
Val Lys Ser Gln Lys Pro Leu Glu Val Pro Pro Ser Glu Phe Ile Leu
465 470 475 480
Gly Ala Gln Ser Gly Gly Glu Glu Asn Ala Asp Asp Leu Asp Asp Ser
485 490 495
Thr Gln Ile Cys Ser Cys His Asn Val Thr Lys Gly Asp Val Val Glu
500 505 510
Ser Val Lys Ser Gly Thr Cys Lys Thr Ile Ala Asp Val Lys Ser Cys
515 520 525
Thr Lys Ala Gly Thr Gly Cys Gly Gly Cys Met Pro Leu Val Gln Ser
530 535 540
Ile Phe Asn Lys Thr Met Leu Asp Met Gly Gln Glu Val Ser Asn Asn
545 550 555 560
Leu Cys Val His Ile Pro Tyr Ser Arg Ala Asp Leu Tyr Asn Val Ile
565 570 575
Ala Ile Arg Gln Leu Arg Thr Phe Asp Asp Val Met Lys Ser Ala Gly
580 585 590
Lys Cys Pro Asp Ser Leu Gly Cys Glu Ile Cys Lys Pro Ala Ile Ala
595 600 605
Ser Ile Leu Ser Ser Leu Phe Asn Pro His Leu Met Asp Lys Glu Tyr
610 615 620
His Glu Leu Gln Glu Thr Asn Asp Arg Phe Leu Ala Asn Ile Gln Arg
625 630 635 640
Asn Gly Thr Phe Ser Val Val Pro Arg Val Pro Gly Gly Glu Ile Thr
645 650 655
Ala Asp Lys Leu Ile Ala Ile Gly Gln Val Ala Lys Lys Tyr Asn Leu
660 665 670
Tyr Cys Lys Ile Thr Gly Gly Gln Arg Ile Asp Met Phe Gly Ala Arg
675 680 685
Lys Gln Asp Leu Leu Asp Ile Trp Thr Glu Leu Val Asp Ala Gly Met
690 695 700
Glu Ser Gly His Ala Tyr Ala Lys Ser Leu Arg Thr Val Lys Ser Cys
705 710 715 720
Val Gly Thr Thr Trp Cys Arg Phe Gly Val Gly Asp Ser Val Gly Met
725 730 735
Ala Ile Arg Leu Glu Gln Arg Tyr Lys Ser Ile Arg Ala Pro His Lys
740 745 750
Phe Lys Gly Ala Val Ser Gly Cys Val Arg Glu Cys Ala Glu Ala Gln
755 760 765
Asn Lys Asp Phe Gly Leu Ile Ala Thr Glu Lys Gly Phe Asn Ile Phe
770 775 780
Val Gly Gly Asn Gly Gly Ala Lys Pro Arg His Ser Glu Leu Leu Ala
785 790 795 800
Lys Asp Val Pro Pro Glu Glu Val Ile Pro Ile Leu Asp Arg Tyr Val
805 810 815
Ile Phe Tyr Ile Arg Thr Ala Asp Lys Leu Gln Arg Thr Ala Arg Trp
820 825 830
Leu Glu Ser Leu Pro Gly Gly Ile Glu Tyr Leu Lys Asp Val Val Leu
835 840 845
Asn Asp Lys Leu Gly Ile Ala Ala Glu Met Glu Arg Gln Met Gln Glu
850 855 860
Leu Val Asp Ser Tyr Phe Cys Glu Trp Thr Glu Thr Val Arg Asn Pro
865 870 875 880
Lys Arg Arg Lys Tyr Phe Gln Gln Phe Ala Asn Thr Asp Glu Thr Val
885 890 895
Glu Asn Val Glu Ile Val Lys Glu Arg Glu Gln Val Arg Pro Thr Tyr
900 905 910
Trp Pro Lys Asp Gly Ala Asn Glu Asp Phe Lys Gly His Gln Trp Ser
915 920 925
Ser Leu Ser Trp Gln Pro Val Ile Lys Ala Asp Tyr Phe Ser Asp Gly
930 935 940
Pro Pro Ala Ile Ser Ser Ala Asn Ile Lys Arg Gly Asp Thr Gln Leu
945 950 955 960
Ala Ile Phe Lys Val Lys Gly Lys Tyr Tyr Ala Thr Gln Gln Met Cys
965 970 975
Pro His Lys Arg Thr Phe Val Leu Ser Asp Gly Leu Ile Gly Asp Asp
980 985 990
Asp Asn Gly Lys Tyr Trp Val Ser Cys Pro Tyr His Lys Arg Asn Phe
995 1000 1005
Glu Leu Asn Gly Glu Gln Ala Gly Arg Cys Gln Asn Asp Glu Ala Met
1010 1015 1020
Asn Ile Ala Thr Phe Pro Val Glu Glu Arg Glu Asp Gly Trp Ile Tyr
1025 1030 1035 1040
Met Lys Leu Pro Pro Val Glu Glu Leu Asp Ser Val Leu Gly Thr Glu
1045 1050 1055
Lys Trp Lys Val Lys Lys Gly Glu Ala Val Asp Pro Phe Glu Ala Tyr
1060 1065 1070
Asp Lys Lys Tyr Ser Gly Met Lys Gly Lys Arg Ala Gly Ala Lys Gly
1075 1080 1085
Ile Glu Gly Ser Lys Pro Thr Arg Ser Pro Ser Asn Thr Ile Asp Trp
1090 1095 1100
<210> 6
<211> 508
<212> PRT
<213> Ogataea angusta
<220>
<223> YNT1硝酸根/亚硝酸转运体安格斯毕赤酵母(多形
汉逊酵母)
<400> 6
Met Gln Leu Ser Thr Leu Trp Glu Pro Pro Ile Val Asn Pro Arg Asn
1 5 10 15
Leu Lys Ala Thr Ser Ile Pro Ile Phe Asn Leu Trp Asn Val Tyr Gly
20 25 30
Arg Asn Phe Phe Phe Gly Trp Phe Gly Phe Phe Val Cys Phe Leu Ser
35 40 45
Trp Phe Ala Phe Pro Pro Leu Leu His Gly Met Leu Lys Lys Asp Leu
50 55 60
Arg Leu Thr Ala Val Asp Ile Ser Asn Asn Asn Ile Cys Gly Leu Thr
65 70 75 80
Gly Thr Leu Leu Gly Arg Phe Ile Leu Gly Pro Leu Asn Asp Lys Tyr
85 90 95
Gly Pro Arg Ile Thr Leu Thr Gly Val Leu Val Ala Gly Ala Ile Pro
100 105 110
Thr Ala Phe Val Pro Leu Val Thr Asn Val Ala Gly Leu His Ala Ile
115 120 125
Arg Phe Phe Ile Ser Phe Leu Gly Ser Ser Phe Ile Cys Cys Ser Gln
130 135 140
Phe Cys Ala Val Phe Phe Asp Asn Asn Ile Ile Gly Thr Ala Asn Ala
145 150 155 160
Ile Ser Ala Gly Trp Gly Asn Ala Gly Gly Gly Val Ala Phe Phe Val
165 170 175
Met Pro Ala Ile Ser Asn Ala Leu Glu Asn Arg Gly Tyr Ser Leu His
180 185 190
His Ser Trp Ser Tyr Ser Phe Val Ile Gly Pro Phe Leu Ile Leu Met
195 200 205
Ile Thr Ala Ile Leu Ile Phe Val Phe Gly Ser Asp Cys Pro Arg Gly
210 215 220
Arg Trp Ser Leu Arg Gly Asp Ile Leu Gly Ile Asn Met Asp Asn Met
225 230 235 240
Leu Val Lys Ser Val Ser Val Thr Arg His Phe Ser Lys Glu Gly Glu
245 250 255
Leu Thr Ser Val Phe Val Glu Pro Val Asn Ala Ile Asp Lys Val Val
260 265 270
Val Glu Pro Asn Gln Asp Gln Glu Ile Leu Glu Val Ala Asp Ile Ile
275 280 285
Asn Gly Asp Glu Ile Ile Glu Asp Pro Ser Leu Asn Asp Val Val Lys
290 295 300
Ile Cys Leu Ser Pro Arg Thr Met Leu Val Gly Leu Cys Tyr Met Cys
305 310 315 320
Ser Phe Gly Thr Glu Leu Ala Val Glu Ser Ile Ile Ser Asn Leu Phe
325 330 335
Gly Gln Lys Met Thr Asn Trp Ser Thr Ser Lys Ala Gly Ala Trp Gly
340 345 350
Ser Met Leu Gly Leu Leu Asn Val Val Ala Arg Pro Ala Gly Gly Ile
355 360 365
Ile Ser Asp Phe Leu Tyr Gln Arg Phe Lys Thr Thr Lys Ala Lys Lys
370 375 380
Phe Trp Met Ile Phe Thr Gly Leu Met Gln Gly Ile Phe Leu Ile Trp
385 390 395 400
Ile Gly Leu Val Pro Glu Leu Ser Ile Ala Gly Leu Ile Val Ser Val
405 410 415
Ser Phe Leu Cys Leu Trp Phe Glu Met Gly Asn Gly Ala Asn Tyr Ala
420 425 430
Cys Val Pro Val Val Asn Arg His His Ser Gly Ile Val Ser Gly Val
435 440 445
Thr Gly Ala Met Gly Asn Leu Gly Gly Ile Leu Phe Ser Leu Val Phe
450 455 460
Arg Tyr Thr Ile Ser Asn Gly Val Asn Asn Tyr Phe Lys Ala Phe Trp
465 470 475 480
Ile Ile Gly Ile Val Cys Thr Ala Val Asn Leu Val Cys Val Leu Ile
485 490 495
Pro Ile Arg Glu Glu Arg Pro Arg Lys Ala Glu Asn
500 505
<210> 7
<211> 329
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> GTP 3',8-环化酶(moaA)
<400> 7
Met Ala Ser Gln Leu Thr Asp Ala Phe Ala Arg Lys Phe Tyr Tyr Leu
1 5 10 15
Arg Leu Ser Ile Thr Asp Val Cys Asn Phe Arg Cys Thr Tyr Cys Leu
20 25 30
Pro Asp Gly Tyr Lys Pro Ser Gly Val Thr Asn Lys Gly Phe Leu Thr
35 40 45
Val Asp Glu Ile Arg Arg Val Thr Arg Ala Phe Ala Arg Leu Gly Thr
50 55 60
Glu Lys Val Arg Leu Thr Gly Gly Glu Pro Ser Leu Arg Arg Asp Phe
65 70 75 80
Thr Asp Ile Ile Ala Ala Val Arg Glu Asn Asp Ala Ile Arg Gln Ile
85 90 95
Ala Val Thr Thr Asn Gly Tyr Arg Leu Glu Arg Asp Val Ala Ser Trp
100 105 110
Arg Asp Ala Gly Leu Thr Gly Ile Asn Val Ser Val Asp Ser Leu Asp
115 120 125
Ala Arg Gln Phe His Ala Ile Thr Gly Gln Asp Lys Phe Asn Gln Val
130 135 140
Met Ala Gly Ile Asp Ala Ala Phe Glu Ala Gly Phe Glu Lys Val Lys
145 150 155 160
Val Asn Thr Val Leu Met Arg Asp Val Asn His His Gln Leu Asp Thr
165 170 175
Phe Leu Asn Trp Ile Gln His Arg Pro Ile Gln Leu Arg Phe Ile Glu
180 185 190
Leu Met Glu Thr Gly Glu Gly Ser Glu Leu Phe Arg Lys His His Ile
195 200 205
Ser Gly Gln Val Leu Arg Asp Glu Leu Leu Arg Arg Gly Trp Ile His
210 215 220
Gln Leu Arg Gln Arg Ser Asp Gly Pro Ala Gln Val Phe Cys His Pro
225 230 235 240
Asp Tyr Ala Gly Glu Ile Gly Leu Ile Met Pro Tyr Glu Lys Asp Phe
245 250 255
Cys Ala Thr Cys Asn Arg Leu Arg Val Ser Ser Ile Gly Lys Leu His
260 265 270
Leu Cys Leu Phe Gly Glu Gly Gly Val Asn Leu Arg Asp Leu Leu Glu
275 280 285
Asp Asp Thr Gln Gln Gln Ala Leu Glu Ala Arg Ile Ser Ala Ala Leu
290 295 300
Arg Glu Lys Lys Gln Thr His Phe Leu His Gln Asn Asn Thr Gly Ile
305 310 315 320
Thr Gln Asn Leu Ser Tyr Ile Gly Gly
325
<210> 8
<211> 161
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 环吡喃蝶呤单磷酸合酶(MoaC)
<400> 8
Met Ser Gln Leu Thr His Ile Asn Ala Ala Gly Glu Ala His Met Val
1 5 10 15
Asp Val Ser Ala Lys Ala Glu Thr Val Arg Glu Ala Arg Ala Glu Ala
20 25 30
Phe Val Thr Met Arg Ser Glu Thr Leu Ala Met Ile Ile Asp Gly Arg
35 40 45
His His Lys Gly Asp Val Phe Ala Thr Ala Arg Ile Ala Gly Ile Gln
50 55 60
Ala Ala Lys Arg Thr Trp Asp Leu Ile Pro Leu Cys His Pro Leu Met
65 70 75 80
Leu Ser Lys Val Glu Val Asn Leu Gln Ala Glu Pro Glu His Asn Arg
85 90 95
Val Arg Ile Glu Thr Leu Cys Arg Leu Thr Gly Lys Thr Gly Val Glu
100 105 110
Met Glu Ala Leu Thr Ala Ala Ser Val Ala Ala Leu Thr Ile Tyr Asp
115 120 125
Met Cys Lys Ala Val Gln Lys Asp Met Val Ile Gly Pro Val Arg Leu
130 135 140
Leu Ala Lys Ser Gly Gly Lys Ser Gly Asp Phe Lys Val Glu Ala Asp
145 150 155 160
Asp
<210> 9
<211> 81
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 钼蝶呤合酶硫载体亚基(MoaD)
<400> 9
Met Ile Lys Val Leu Phe Phe Ala Gln Val Arg Glu Leu Val Gly Thr
1 5 10 15
Asp Ala Thr Glu Val Ala Ala Asp Phe Pro Thr Val Glu Ala Leu Arg
20 25 30
Gln His Met Ala Ala Gln Ser Asp Arg Trp Ala Leu Ala Leu Glu Asp
35 40 45
Gly Lys Leu Leu Ala Ala Val Asn Gln Thr Leu Val Ser Phe Asp His
50 55 60
Pro Leu Thr Asp Gly Asp Glu Val Ala Phe Phe Pro Pro Val Thr Gly
65 70 75 80
Gly
<210> 10
<211> 150
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 钼蝶呤合酶催化亚基(MoaE)
<400> 10
Met Ala Glu Thr Lys Ile Val Val Gly Pro Gln Pro Phe Ser Val Gly
1 5 10 15
Glu Glu Tyr Pro Trp Leu Ala Glu Arg Asp Glu Asp Gly Ala Val Val
20 25 30
Thr Phe Thr Gly Lys Val Arg Asn His Asn Leu Gly Asp Ser Val Asn
35 40 45
Ala Leu Thr Leu Glu His Tyr Pro Gly Met Thr Glu Lys Ala Leu Ala
50 55 60
Glu Ile Val Asp Glu Ala Arg Asn Arg Trp Pro Leu Gly Arg Val Thr
65 70 75 80
Val Ile His Arg Ile Gly Glu Leu Trp Pro Gly Asp Glu Ile Val Phe
85 90 95
Val Gly Val Thr Ser Ala His Arg Ser Ser Ala Phe Glu Ala Gly Gln
100 105 110
Phe Ile Met Asp Tyr Leu Lys Thr Arg Ala Pro Phe Trp Lys Arg Glu
115 120 125
Ala Thr Pro Glu Gly Asp Arg Trp Val Glu Ala Arg Glu Ser Asp Gln
130 135 140
Gln Ala Ala Lys Arg Trp
145 150
<210> 11
<211> 194
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 钼辅因子鸟苷酸转移酶(MobA)
<400> 11
Met Asn Leu Met Thr Thr Ile Thr Gly Val Val Leu Ala Gly Gly Lys
1 5 10 15
Ala Arg Arg Met Gly Gly Val Asp Lys Gly Leu Leu Glu Leu Asn Gly
20 25 30
Lys Pro Leu Trp Gln His Val Ala Asp Ala Leu Met Thr Gln Leu Ser
35 40 45
His Val Val Val Asn Ala Asn Arg His Gln Glu Ile Tyr Gln Ala Ser
50 55 60
Gly Leu Lys Val Ile Glu Asp Ser Leu Ala Asp Tyr Pro Gly Pro Leu
65 70 75 80
Ala Gly Met Leu Ser Val Met Gln Gln Glu Ala Gly Glu Trp Phe Leu
85 90 95
Phe Cys Pro Cys Asp Thr Pro Tyr Ile Pro Pro Asp Leu Ala Ala Arg
100 105 110
Leu Asn His Gln Arg Lys Asp Ala Pro Val Val Trp Val His Asp Gly
115 120 125
Glu Arg Asp His Pro Thr Ile Ala Leu Val Asn Arg Ala Ile Glu Pro
130 135 140
Leu Leu Leu Glu Tyr Leu Gln Ala Gly Glu Arg Arg Val Met Val Phe
145 150 155 160
Met Arg Leu Ala Gly Gly His Ala Val Asp Phe Ser Asp His Lys Asp
165 170 175
Ala Phe Val Asn Val Asn Thr Pro Glu Glu Leu Ala Arg Trp Gln Glu
180 185 190
Lys Arg
<210> 12
<211> 175
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 钼蝶呤-鸟嘌呤二核苷酸生物合成衔接蛋白
(MobB)
<400> 12
Met Ala Gly Lys Thr Met Ile Pro Leu Leu Ala Phe Ala Ala Trp Ser
1 5 10 15
Gly Thr Gly Lys Thr Thr Leu Leu Lys Lys Leu Ile Pro Ala Leu Cys
20 25 30
Ala Arg Gly Ile Arg Pro Gly Leu Ile Lys His Thr His His Asp Met
35 40 45
Asp Val Asp Lys Pro Gly Lys Asp Ser Tyr Glu Leu Arg Lys Ala Gly
50 55 60
Ala Ala Gln Thr Ile Val Ala Ser Gln Gln Arg Trp Ala Leu Met Thr
65 70 75 80
Glu Thr Pro Asp Glu Glu Glu Leu Asp Leu Gln Phe Leu Ala Ser Arg
85 90 95
Met Asp Thr Ser Lys Leu Asp Leu Ile Leu Val Glu Gly Phe Lys His
100 105 110
Glu Glu Ile Ala Lys Ile Val Leu Phe Arg Asp Gly Ala Gly His Arg
115 120 125
Pro Glu Glu Leu Val Ile Asp Arg His Val Ile Ala Val Ala Ser Asp
130 135 140
Val Pro Leu Asn Leu Asp Val Ala Leu Leu Asp Ile Asn Asp Val Glu
145 150 155 160
Gly Leu Ala Asp Phe Val Val Glu Trp Met Gln Lys Gln Asn Gly
165 170 175
<210> 13
<211> 192
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 钼辅因子胞苷转移酶(MocA)
<400> 13
Met Ser Ala Ile Asp Cys Ile Ile Thr Ala Ala Gly Leu Ser Ser Arg
1 5 10 15
Met Gly Gln Trp Lys Met Met Leu Pro Trp Glu Gln Gly Thr Ile Leu
20 25 30
Asp Thr Ser Ile Lys Asn Ala Leu Gln Phe Cys Ser Arg Ile Ile Leu
35 40 45
Val Thr Gly Tyr Arg Gly Asn Glu Leu His Glu Arg Tyr Ala Asn Gln
50 55 60
Ser Asn Ile Thr Ile Ile His Asn Pro Asp Tyr Ala Gln Gly Leu Leu
65 70 75 80
Thr Ser Val Lys Ala Ala Val Pro Ala Val Gln Thr Glu His Cys Phe
85 90 95
Leu Thr His Gly Asp Met Pro Thr Leu Thr Ile Asp Ile Phe Arg Lys
100 105 110
Ile Trp Ser Leu Arg Asn Asp Gly Ala Ile Leu Pro Leu His Asn Gly
115 120 125
Ile Pro Gly His Pro Ile Leu Val Ser Lys Pro Cys Leu Met Gln Ala
130 135 140
Ile Gln Arg Pro Asn Val Thr Asn Met Arg Gln Ala Leu Leu Met Gly
145 150 155 160
Asp His Tyr Ser Val Glu Ile Glu Asn Ala Glu Ile Ile Leu Asp Ile
165 170 175
Asp Thr Pro Asp Asp Phe Ile Thr Ala Lys Glu Arg Tyr Thr Glu Ile
180 185 190
<210> 14
<211> 257
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 钼酸根结合蛋白(ModA)
<400> 14
Met Ala Arg Lys Trp Leu Asn Leu Phe Ala Gly Ala Ala Leu Ser Phe
1 5 10 15
Ala Val Ala Gly Asn Ala Leu Ala Asp Glu Gly Lys Ile Thr Val Phe
20 25 30
Ala Ala Ala Ser Leu Thr Asn Ala Met Gln Asp Ile Ala Thr Gln Phe
35 40 45
Lys Lys Glu Lys Gly Val Asp Val Val Ser Ser Phe Ala Ser Ser Ser
50 55 60
Thr Leu Ala Arg Gln Ile Glu Ala Gly Ala Pro Ala Asp Leu Phe Ile
65 70 75 80
Ser Ala Asp Gln Lys Trp Met Asp Tyr Ala Val Asp Lys Lys Ala Ile
85 90 95
Asp Thr Ala Thr Arg Gln Thr Leu Leu Gly Asn Ser Leu Val Val Val
100 105 110
Ala Pro Lys Ala Ser Val Gln Lys Asp Phe Thr Ile Asp Ser Lys Thr
115 120 125
Asn Trp Thr Ser Leu Leu Asn Gly Gly Arg Leu Ala Val Gly Asp Pro
130 135 140
Glu His Val Pro Ala Gly Ile Tyr Ala Lys Glu Ala Leu Gln Lys Leu
145 150 155 160
Gly Ala Trp Asp Thr Leu Ser Pro Lys Leu Ala Pro Ala Glu Asp Val
165 170 175
Arg Gly Ala Leu Ala Leu Val Glu Arg Asn Glu Ala Pro Leu Gly Ile
180 185 190
Val Tyr Gly Ser Asp Ala Val Ala Ser Lys Gly Val Lys Val Val Ala
195 200 205
Thr Phe Pro Glu Asp Ser His Lys Lys Val Glu Tyr Pro Val Ala Val
210 215 220
Val Glu Gly His Asn Asn Ala Thr Val Lys Ala Phe Tyr Asp Tyr Leu
225 230 235 240
Lys Gly Pro Gln Ala Ala Glu Ile Phe Lys Arg Tyr Gly Phe Thr Ile
245 250 255
Lys
<210> 15
<211> 180
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ModB_BPT4 NAD--蛋白质ADP-核糖基转移酶modB
<400> 15
Met Ile Ile Asn Leu Ala Asp Val Glu Gln Leu Ser Ile Lys Ala Glu
1 5 10 15
Ser Val Asp Phe Gln Tyr Asp Met Tyr Lys Lys Val Cys Glu Lys Phe
20 25 30
Thr Asp Phe Glu Gln Ser Val Leu Trp Gln Cys Met Glu Ala Lys Lys
35 40 45
Asn Glu Ala Leu His Lys His Leu Asn Glu Ile Ile Lys Lys His Leu
50 55 60
Thr Lys Ser Pro Tyr Gln Leu Tyr Arg Gly Ile Ser Lys Ser Thr Lys
65 70 75 80
Glu Leu Ile Lys Asp Leu Gln Val Gly Glu Val Phe Ser Thr Asn Arg
85 90 95
Val Asp Ser Phe Thr Thr Ser Leu His Thr Ala Cys Ser Phe Ser Tyr
100 105 110
Ala Glu Tyr Phe Thr Glu Thr Ile Leu Arg Leu Lys Thr Asp Lys Ala
115 120 125
Phe Asn Tyr Ser Asp His Ile Ser Asp Ile Ile Leu Ser Ser Pro Asn
130 135 140
Thr Glu Phe Lys Tyr Thr Tyr Glu Asp Thr Asp Gly Leu Asp Ser Glu
145 150 155 160
Arg Thr Asp Asn Leu Met Met Ile Val Arg Glu Gln Glu Trp Met Ile
165 170 175
Pro Ile Gly Lys
180
<210> 16
<211> 352
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 钼输入ATP结合蛋白(ModC)
<400> 16
Met Leu Glu Leu Asn Phe Ser Gln Thr Leu Gly Asn His Cys Leu Thr
1 5 10 15
Ile Asn Glu Thr Leu Pro Ala Asn Gly Ile Thr Ala Ile Phe Gly Val
20 25 30
Ser Gly Ala Gly Lys Thr Ser Leu Ile Asn Ala Ile Ser Gly Leu Thr
35 40 45
Arg Pro Gln Lys Gly Arg Ile Val Leu Asn Gly Arg Val Leu Asn Asp
50 55 60
Ala Glu Lys Gly Ile Cys Leu Thr Pro Glu Lys Arg Arg Val Gly Tyr
65 70 75 80
Val Phe Gln Asp Ala Arg Leu Phe Pro His Tyr Lys Val Arg Gly Asn
85 90 95
Leu Arg Tyr Gly Met Ser Lys Ser Met Val Asp Gln Phe Asp Lys Leu
100 105 110
Val Ala Leu Leu Gly Ile Glu Pro Leu Leu Asp Arg Leu Pro Gly Ser
115 120 125
Leu Ser Gly Gly Glu Lys Gln Arg Val Ala Ile Gly Arg Ala Leu Leu
130 135 140
Thr Ala Pro Glu Leu Leu Leu Leu Asp Glu Pro Leu Ala Ser Leu Asp
145 150 155 160
Ile Pro Arg Lys Arg Glu Leu Leu Pro Tyr Leu Gln Arg Leu Thr Arg
165 170 175
Glu Ile Asn Ile Pro Met Leu Tyr Val Ser His Ser Leu Asp Glu Ile
180 185 190
Leu His Leu Ala Asp Arg Val Met Val Leu Glu Asn Gly Gln Val Lys
195 200 205
Ala Phe Gly Ala Leu Glu Glu Val Trp Gly Ser Ser Val Met Asn Pro
210 215 220
Trp Leu Pro Lys Glu Gln Gln Ser Ser Ile Leu Lys Val Thr Val Leu
225 230 235 240
Glu His His Pro His Tyr Ala Met Thr Ala Leu Ala Leu Gly Asp Gln
245 250 255
His Leu Trp Val Asn Lys Leu Asp Glu Pro Leu Gln Ala Ala Leu Arg
260 265 270
Ile Arg Ile Gln Ala Ser Asp Val Ser Leu Val Leu Gln Pro Pro Gln
275 280 285
Gln Thr Ser Ile Arg Asn Val Leu Arg Ala Lys Val Val Asn Ser Tyr
290 295 300
Asp Asp Asn Gly Gln Val Glu Val Glu Leu Glu Val Gly Gly Lys Thr
305 310 315 320
Leu Trp Ala Arg Ile Ser Pro Trp Ala Arg Asp Glu Leu Ala Ile Lys
325 330 335
Pro Gly Leu Trp Leu Tyr Ala Gln Ile Lys Ser Val Ser Ile Thr Ala
340 345 350
<210> 17
<211> 289
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 结合DNA的转录双重调节因子(ModE)
<400> 17
Met Gln Ala Glu Ile Leu Leu Thr Leu Lys Leu Gln Gln Lys Leu Phe
1 5 10 15
Ala Asp Pro Arg Arg Ile Ser Leu Leu Lys His Ile Ala Leu Ser Gly
20 25 30
Ser Ile Ser Gln Gly Ala Lys Asp Ala Gly Ile Ser Tyr Lys Ser Ala
35 40 45
Trp Asp Ala Ile Asn Glu Met Asn Gln Leu Ser Glu His Ile Leu Val
50 55 60
Glu Arg Ala Thr Gly Gly Lys Gly Gly Gly Gly Ala Val Leu Thr Arg
65 70 75 80
Tyr Gly Gln Arg Leu Ile Gln Leu Tyr Asp Leu Leu Ala Gln Ile Gln
85 90 95
Gln Lys Ala Phe Asp Val Leu Ser Asp Asp Asp Ala Leu Pro Leu Asn
100 105 110
Ser Leu Leu Ala Ala Ile Ser Arg Phe Ser Leu Gln Thr Ser Ala Arg
115 120 125
Asn Gln Trp Phe Gly Thr Ile Thr Ala Arg Asp His Asp Asp Val Gln
130 135 140
Gln His Val Asp Val Leu Leu Ala Asp Gly Lys Thr Arg Leu Lys Val
145 150 155 160
Ala Ile Thr Ala Gln Ser Gly Ala Arg Leu Gly Leu Asp Glu Gly Lys
165 170 175
Glu Val Leu Ile Leu Leu Lys Ala Pro Trp Val Gly Ile Thr Gln Asp
180 185 190
Glu Ala Val Ala Gln Asn Ala Asp Asn Gln Leu Pro Gly Ile Ile Ser
195 200 205
His Ile Glu Arg Gly Ala Glu Gln Cys Glu Val Leu Met Ala Leu Pro
210 215 220
Asp Gly Gln Thr Leu Cys Ala Thr Val Pro Val Asn Glu Ala Thr Ser
225 230 235 240
Leu Gln Gln Gly Gln Asn Val Thr Ala Tyr Phe Asn Ala Asp Ser Val
245 250 255
Ile Ile Ala Thr Leu Cys Tyr Lys Ile Thr Ser Ile Ser Lys Glu Lys
260 265 270
Leu His Asp Ser Phe Gly Thr Phe Lys Val Tyr Asp Ile Glu Val Val
275 280 285
Glu
<210> 18
<211> 411
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 钼蝶呤钼转移酶(MoeA)
<400> 18
Met Glu Phe Thr Thr Gly Leu Met Ser Leu Asp Thr Ala Leu Asn Glu
1 5 10 15
Met Leu Ser Arg Val Thr Pro Leu Thr Ala Gln Glu Thr Leu Pro Leu
20 25 30
Val Gln Cys Phe Gly Arg Ile Leu Ala Ser Asp Val Val Ser Pro Leu
35 40 45
Asp Val Pro Gly Phe Asp Asn Ser Ala Met Asp Gly Tyr Ala Val Arg
50 55 60
Leu Ala Asp Ile Ala Ser Gly Gln Pro Leu Pro Val Ala Gly Lys Ser
65 70 75 80
Phe Ala Gly Gln Pro Tyr His Gly Glu Trp Pro Ala Gly Thr Cys Ile
85 90 95
Arg Ile Met Thr Gly Ala Pro Val Pro Glu Gly Cys Glu Ala Val Val
100 105 110
Met Gln Glu Gln Thr Glu Gln Met Asp Asn Gly Val Arg Phe Thr Ala
115 120 125
Glu Val Arg Ser Gly Gln Asn Ile Arg Arg Arg Gly Glu Asp Ile Ser
130 135 140
Ala Gly Ala Val Val Phe Pro Ala Gly Thr Arg Leu Thr Thr Ala Glu
145 150 155 160
Leu Pro Val Ile Ala Ser Leu Gly Ile Ala Glu Val Pro Val Ile Arg
165 170 175
Lys Val Arg Val Ala Leu Phe Ser Thr Gly Asp Glu Leu Gln Leu Pro
180 185 190
Gly Gln Pro Leu Gly Asp Gly Gln Ile Tyr Asp Thr Asn Arg Leu Ala
195 200 205
Val His Leu Met Leu Glu Gln Leu Gly Cys Glu Val Ile Asn Leu Gly
210 215 220
Ile Ile Arg Asp Asp Pro His Ala Leu Arg Ala Ala Phe Ile Glu Ala
225 230 235 240
Asp Ser Gln Ala Asp Val Val Ile Ser Ser Gly Gly Val Ser Val Gly
245 250 255
Glu Ala Asp Tyr Thr Lys Thr Ile Leu Glu Glu Leu Gly Glu Ile Ala
260 265 270
Phe Trp Lys Leu Ala Ile Lys Pro Gly Lys Pro Phe Ala Phe Gly Lys
275 280 285
Leu Ser Asn Ser Trp Phe Cys Gly Leu Pro Gly Asn Pro Val Ser Ala
290 295 300
Thr Leu Thr Phe Tyr Gln Leu Val Gln Pro Leu Leu Ala Lys Leu Ser
305 310 315 320
Gly Asn Thr Ala Ser Gly Leu Pro Ala Arg Gln Arg Val Arg Thr Ala
325 330 335
Ser Arg Leu Lys Lys Thr Pro Gly Arg Leu Asp Phe Gln Arg Gly Val
340 345 350
Leu Gln Arg Asn Ala Asp Gly Glu Leu Glu Val Thr Thr Thr Gly His
355 360 365
Gln Gly Ser His Ile Phe Ser Ser Phe Ser Leu Gly Asn Cys Phe Ile
370 375 380
Val Leu Glu Arg Asp Arg Gly Asn Val Glu Val Gly Glu Trp Val Glu
385 390 395 400
Val Glu Pro Phe Asn Ala Leu Phe Gly Gly Leu
405 410
<210> 19
<211> 249
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 钼蝶呤合酶腺苷酸转移酶(MoeB)
<400> 19
Met Ala Glu Leu Ser Asp Gln Glu Met Leu Arg Tyr Asn Arg Gln Ile
1 5 10 15
Ile Leu Arg Gly Phe Asp Phe Asp Gly Gln Glu Ala Leu Lys Asp Ser
20 25 30
Arg Val Leu Ile Val Gly Leu Gly Gly Leu Gly Cys Ala Ala Ser Gln
35 40 45
Tyr Leu Ala Ser Ala Gly Val Gly Asn Leu Thr Leu Leu Asp Phe Asp
50 55 60
Thr Val Ser Leu Ser Asn Leu Gln Arg Gln Thr Leu His Ser Asp Ala
65 70 75 80
Thr Val Gly Gln Pro Lys Val Glu Ser Ala Arg Asp Ala Leu Thr Arg
85 90 95
Ile Asn Pro His Ile Ala Ile Thr Pro Val Asn Ala Leu Leu Asp Asp
100 105 110
Ala Glu Leu Ala Ala Leu Ile Ala Glu His Asp Leu Val Leu Asp Cys
115 120 125
Thr Asp Asn Val Ala Val Arg Asn Gln Leu Asn Ala Gly Cys Phe Ala
130 135 140
Ala Lys Val Pro Leu Val Ser Gly Ala Ala Ile Arg Met Glu Gly Gln
145 150 155 160
Ile Thr Val Phe Thr Tyr Gln Asp Gly Glu Pro Cys Tyr Arg Cys Leu
165 170 175
Ser Arg Leu Phe Gly Glu Asn Ala Leu Thr Cys Val Glu Ala Gly Val
180 185 190
Met Ala Pro Leu Ile Gly Val Ile Gly Ser Leu Gln Ala Met Glu Ala
195 200 205
Ile Lys Met Leu Ala Gly Tyr Gly Lys Pro Ala Ser Gly Lys Ile Val
210 215 220
Met Tyr Asp Ala Met Thr Cys Gln Phe Arg Glu Met Lys Leu Met Arg
225 230 235 240
Asn Pro Gly Cys Glu Val Cys Gly Gln
245
<210> 20
<211> 195
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 钼蝶呤腺苷酸转移酶(MOG)
<400> 20
Met Asn Thr Leu Arg Ile Gly Leu Val Ser Ile Ser Asp Arg Ala Ser
1 5 10 15
Ser Gly Val Tyr Gln Asp Lys Gly Ile Pro Ala Leu Glu Glu Trp Leu
20 25 30
Thr Ser Ala Leu Thr Thr Pro Phe Glu Leu Glu Thr Arg Leu Ile Pro
35 40 45
Asp Glu Gln Ala Ile Ile Glu Gln Thr Leu Cys Glu Leu Val Asp Glu
50 55 60
Met Ser Cys His Leu Val Leu Thr Thr Gly Gly Thr Gly Pro Ala Arg
65 70 75 80
Arg Asp Val Thr Pro Asp Ala Thr Leu Ala Val Ala Asp Arg Glu Met
85 90 95
Pro Gly Phe Gly Glu Gln Met Arg Gln Ile Ser Leu His Phe Val Pro
100 105 110
Thr Ala Ile Leu Ser Arg Gln Val Gly Val Ile Arg Lys Gln Ala Leu
115 120 125
Ile Leu Asn Leu Pro Gly Gln Pro Lys Ser Ile Lys Glu Thr Leu Glu
130 135 140
Gly Val Lys Asp Ala Glu Gly Asn Val Val Val His Gly Ile Phe Ala
145 150 155 160
Ser Val Pro Tyr Cys Ile Gln Leu Leu Glu Gly Pro Tyr Val Glu Thr
165 170 175
Ala Pro Glu Val Val Ala Ala Phe Arg Pro Lys Ser Ala Arg Arg Asp
180 185 190
Val Ser Glu
195
<210> 21
<211> 404
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 半胱氨酸脱硫酶IscS
<400> 21
Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp
1 5 10 15
Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr
20 25 30
Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu
35 40 45
Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala
50 55 60
Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn
65 70 75 80
Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His
85 90 95
Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg
100 105 110
Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg
115 120 125
Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp
130 135 140
Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly Val Val
145 150 155 160
Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile
165 170 175
Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu
180 185 190
Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr
195 200 205
Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val
210 215 220
Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg
225 230 235 240
Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu Ala Tyr
245 250 255
Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly
260 265 270
Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr
275 280 285
Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser
290 295 300
Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu
305 310 315 320
Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser
325 330 335
Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser
340 345 350
Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr
355 360 365
Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser
370 375 380
Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu
385 390 395 400
Trp Ala His His
<210> 22
<211> 457
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 血红素合酶CysG
<400> 22
Met Asp His Leu Pro Ile Phe Cys Gln Leu Arg Asp Arg Asp Cys Leu
1 5 10 15
Ile Val Gly Gly Gly Asp Val Ala Glu Arg Lys Ala Arg Leu Leu Leu
20 25 30
Asp Ala Gly Ala Arg Leu Thr Val Asn Ala Leu Ala Phe Ile Pro Gln
35 40 45
Phe Thr Ala Trp Ala Asp Ala Gly Met Leu Thr Leu Val Glu Gly Pro
50 55 60
Phe Asp Glu Ser Leu Leu Asp Thr Cys Trp Leu Ala Ile Ala Ala Thr
65 70 75 80
Asp Asp Asp Ala Leu Asn Gln Arg Val Ser Glu Ala Ala Glu Ala Arg
85 90 95
Arg Ile Phe Cys Asn Val Val Asp Ala Pro Lys Ala Ala Ser Phe Ile
100 105 110
Met Pro Ser Ile Ile Asp Arg Ser Pro Leu Met Val Ala Val Ser Ser
115 120 125
Gly Gly Thr Ser Pro Val Leu Ala Arg Leu Leu Arg Glu Lys Leu Glu
130 135 140
Ser Leu Leu Pro Leu His Leu Gly Gln Val Ala Lys Tyr Ala Gly Gln
145 150 155 160
Leu Arg Gly Arg Val Lys Gln Gln Phe Ala Thr Met Gly Glu Arg Arg
165 170 175
Arg Phe Trp Glu Lys Leu Phe Val Asn Asp Arg Leu Ala Gln Ser Leu
180 185 190
Ala Asn Asn Asp Gln Lys Ala Ile Thr Glu Thr Thr Glu Gln Leu Ile
195 200 205
Asn Glu Pro Leu Asp His Arg Gly Glu Val Val Leu Val Gly Ala Gly
210 215 220
Pro Gly Asp Ala Gly Leu Leu Thr Leu Lys Gly Leu Gln Gln Ile Gln
225 230 235 240
Gln Ala Asp Val Val Val Tyr Asp Arg Leu Val Ser Asp Asp Ile Met
245 250 255
Asn Leu Val Arg Arg Asp Ala Asp Arg Val Phe Val Gly Lys Arg Ala
260 265 270
Gly Tyr His Cys Val Pro Gln Glu Glu Ile Asn Gln Ile Leu Leu Arg
275 280 285
Glu Ala Gln Lys Gly Lys Arg Val Val Arg Leu Lys Gly Gly Asp Pro
290 295 300
Phe Ile Phe Gly Arg Gly Gly Glu Glu Leu Glu Thr Leu Cys Asn Ala
305 310 315 320
Gly Ile Pro Phe Ser Val Val Pro Gly Ile Thr Ala Ala Ser Gly Cys
325 330 335
Ser Ala Tyr Ser Gly Ile Pro Leu Thr His Arg Asp Tyr Ala Gln Ser
340 345 350
Val Arg Leu Ile Thr Gly His Leu Lys Thr Gly Gly Glu Leu Asp Trp
355 360 365
Glu Asn Leu Ala Ala Glu Lys Gln Thr Leu Val Phe Tyr Met Gly Leu
370 375 380
Asn Gln Ala Ala Thr Ile Gln Gln Lys Leu Ile Glu His Gly Met Pro
385 390 395 400
Gly Glu Met Pro Val Ala Ile Val Glu Asn Gly Thr Ala Val Thr Gln
405 410 415
Arg Val Ile Asp Gly Thr Leu Thr Gln Leu Gly Glu Leu Ala Gln Gln
420 425 430
Met Asn Ser Pro Ser Leu Ile Ile Ile Gly Arg Val Val Gly Leu Arg
435 440 445
Asp Lys Leu Asn Trp Phe Ser Asn His
450 455
<210> 23
<211> 274
<212> PRT
<213> 酿酒酵母(Saccharomyces cerevisiae)
<220>
<223> MET8_YEAST血红素生物合成蛋白MET8
<400> 23
Met Val Lys Ser Leu Gln Leu Ala His Gln Leu Lys Asp Lys Lys Ile
1 5 10 15
Leu Leu Ile Gly Gly Gly Glu Val Gly Leu Thr Arg Leu Tyr Lys Leu
20 25 30
Ile Pro Thr Gly Cys Lys Leu Thr Leu Val Ser Pro Asp Leu His Lys
35 40 45
Ser Ile Ile Pro Lys Phe Gly Lys Phe Ile Gln Asn Glu Asp Gln Pro
50 55 60
Asp Tyr Arg Glu Asp Ala Lys Arg Phe Ile Asn Pro Asn Trp Asp Pro
65 70 75 80
Thr Lys Asn Glu Ile Tyr Glu Tyr Ile Arg Ser Asp Phe Lys Asp Glu
85 90 95
Tyr Leu Asp Leu Glu Asp Glu Asn Asp Ala Trp Tyr Ile Ile Met Thr
100 105 110
Cys Ile Pro Asp His Pro Glu Ser Ala Arg Ile Tyr His Leu Cys Lys
115 120 125
Glu Arg Phe Gly Lys Gln Gln Leu Val Asn Val Ala Asp Lys Pro Asp
130 135 140
Leu Cys Asp Phe Tyr Phe Gly Ala Asn Leu Glu Ile Gly Asp Arg Leu
145 150 155 160
Gln Ile Leu Ile Ser Thr Asn Gly Leu Ser Pro Arg Phe Gly Ala Leu
165 170 175
Val Arg Asp Glu Ile Arg Asn Leu Phe Thr Gln Met Gly Asp Leu Ala
180 185 190
Leu Glu Asp Ala Val Val Lys Leu Gly Glu Leu Arg Arg Gly Ile Arg
195 200 205
Leu Leu Ala Pro Asp Asp Lys Asp Val Lys Tyr Arg Met Asp Trp Ala
210 215 220
Arg Arg Cys Thr Asp Leu Phe Gly Ile Gln His Cys His Asn Ile Asp
225 230 235 240
Val Lys Arg Leu Leu Asp Leu Phe Lys Val Met Phe Gln Glu Gln Asn
245 250 255
Cys Ser Leu Gln Phe Pro Pro Arg Glu Arg Leu Leu Ser Glu Tyr Cys
260 265 270
Ser Ser
<210> 24
<211> 670
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<220>
<223> 钼蝶呤生物合成蛋白CNX1
<400> 24
Met Glu Gly Gln Gly Cys Cys Gly Gly Gly Gly Gly Lys Thr Glu Met
1 5 10 15
Ile Pro Thr Glu Glu Ala Leu Arg Ile Val Phe Gly Val Ser Lys Arg
20 25 30
Leu Pro Pro Val Ile Val Ser Leu Tyr Glu Ala Leu Gly Lys Val Leu
35 40 45
Ala Glu Asp Ile Arg Ala Pro Asp Pro Leu Pro Pro Tyr Pro Ala Ser
50 55 60
Val Lys Asp Gly Tyr Ala Val Val Ala Ser Asp Gly Pro Gly Glu Tyr
65 70 75 80
Pro Val Ile Thr Glu Ser Arg Ala Gly Asn Asp Gly Leu Gly Val Thr
85 90 95
Val Thr Pro Gly Thr Val Ala Tyr Val Thr Thr Gly Gly Pro Ile Pro
100 105 110
Asp Gly Ala Asp Ala Val Val Gln Val Glu Asp Thr Lys Val Ile Gly
115 120 125
Asp Val Ser Thr Glu Ser Lys Arg Val Lys Ile Leu Ile Gln Thr Lys
130 135 140
Lys Gly Thr Asp Ile Arg Arg Val Gly Cys Asp Ile Glu Lys Asp Ala
145 150 155 160
Thr Val Leu Thr Thr Gly Glu Arg Ile Gly Ala Ser Glu Ile Gly Leu
165 170 175
Leu Ala Thr Ala Gly Val Thr Met Val Lys Val Tyr Pro Met Pro Ile
180 185 190
Val Ala Ile Leu Ser Thr Gly Asp Glu Leu Val Glu Pro Thr Ala Gly
195 200 205
Thr Leu Gly Arg Gly Gln Ile Arg Asp Ser Asn Arg Ala Met Leu Val
210 215 220
Ala Ala Val Met Gln Gln Gln Cys Lys Val Val Asp Leu Gly Ile Val
225 230 235 240
Arg Asp Asp Arg Lys Glu Leu Glu Lys Val Leu Asp Glu Ala Val Ser
245 250 255
Ser Gly Val Asp Ile Ile Leu Thr Ser Gly Gly Val Ser Met Gly Asp
260 265 270
Arg Asp Phe Val Lys Pro Leu Leu Glu Glu Lys Gly Lys Val Tyr Phe
275 280 285
Ser Lys Val Leu Met Lys Pro Gly Lys Pro Leu Thr Phe Ala Glu Ile
290 295 300
Arg Ala Lys Pro Thr Glu Ser Met Leu Gly Lys Thr Val Leu Ala Phe
305 310 315 320
Gly Leu Pro Gly Asn Pro Val Ser Cys Leu Val Cys Phe Asn Ile Phe
325 330 335
Val Val Pro Thr Ile Arg Gln Leu Ala Gly Trp Thr Ser Pro His Pro
340 345 350
Leu Arg Val Arg Leu Arg Leu Gln Glu Pro Ile Lys Ser Asp Pro Ile
355 360 365
Arg Pro Glu Phe His Arg Ala Ile Ile Lys Trp Lys Asp Asn Asp Gly
370 375 380
Ser Gly Thr Pro Gly Phe Val Ala Glu Ser Thr Gly His Gln Met Ser
385 390 395 400
Ser Arg Leu Leu Ser Met Arg Ser Ala Asn Ala Leu Leu Glu Leu Pro
405 410 415
Ala Thr Gly Asn Val Leu Ser Ala Gly Ser Ser Val Ser Ala Ile Ile
420 425 430
Val Ser Asp Ile Ser Ala Phe Ser Ile Asp Lys Lys Ala Ser Leu Ser
435 440 445
Glu Pro Gly Ser Ile Arg Lys Glu Lys Lys Tyr Asp Glu Val Pro Gly
450 455 460
Pro Glu Tyr Lys Val Ala Ile Leu Thr Val Ser Asp Thr Val Ser Ala
465 470 475 480
Gly Ala Gly Pro Asp Arg Ser Gly Pro Arg Ala Val Ser Val Val Asp
485 490 495
Ser Ser Ser Glu Lys Leu Gly Gly Ala Lys Val Val Ala Thr Ala Val
500 505 510
Val Pro Asp Glu Val Glu Arg Ile Lys Asp Ile Leu Gln Lys Trp Ser
515 520 525
Asp Val Asp Glu Met Asp Leu Ile Leu Thr Leu Gly Gly Thr Gly Phe
530 535 540
Thr Pro Arg Asp Val Thr Pro Glu Ala Thr Lys Lys Val Ile Glu Arg
545 550 555 560
Glu Thr Pro Gly Leu Leu Phe Val Met Met Gln Glu Ser Leu Lys Ile
565 570 575
Thr Pro Phe Ala Met Leu Ser Arg Ser Ala Ala Gly Ile Arg Gly Ser
580 585 590
Thr Leu Ile Ile Asn Met Pro Gly Asn Pro Asn Ala Val Ala Glu Cys
595 600 605
Met Glu Ala Leu Leu Pro Ala Leu Lys His Ala Leu Lys Gln Ile Lys
610 615 620
Gly Asp Lys Arg Glu Lys His Pro Lys His Ile Pro His Ala Glu Ala
625 630 635 640
Thr Leu Pro Thr Asp Thr Trp Asp Gln Ser Tyr Lys Ser Ala Tyr Glu
645 650 655
Thr Gly Glu Lys Lys Glu Glu Ala Gly Cys Ser Cys Thr His
660 665 670
<210> 25
<211> 390
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<220>
<223> GTP 3',8-环化酶,线粒体CNX2
<400> 25
Met Arg Arg Cys Phe Ser Lys Ile Thr Asp Cys His Leu Gly Phe Lys
1 5 10 15
Asn Ser Asn Phe Leu Leu Val Gly Ser Glu Val Gly Ser Gly Ser Val
20 25 30
Thr Arg Thr Ile Thr Thr Thr Thr Ser Glu Arg Leu Phe Ser Ser Ser
35 40 45
Tyr Ala Ala His Gln Val Asp Gln Ile Lys Asp Asn Pro Val Ser Asp
50 55 60
Met Leu Ile Asp Lys Phe Gly Arg Leu His Thr Tyr Leu Arg Ile Ser
65 70 75 80
Leu Thr Glu Arg Cys Asn Leu Arg Cys Gln Tyr Cys Met Pro Ser Glu
85 90 95
Gly Val Glu Leu Thr Pro Lys Pro Gln Leu Leu Ser Gln Ser Glu Ile
100 105 110
Val Arg Leu Ala Gly Leu Phe Val Ser Ala Gly Val Asn Lys Ile Arg
115 120 125
Leu Thr Gly Gly Glu Pro Thr Val Arg Lys Asp Ile Glu Glu Ile Cys
130 135 140
Leu Gln Leu Ser Ser Leu Lys Gly Leu Lys Asn Leu Ala Ile Thr Thr
145 150 155 160
Asn Gly Ile Thr Leu Ala Lys Lys Leu Pro Arg Leu Lys Glu Cys Gly
165 170 175
Leu Asp Ser Leu Asn Ile Ser Leu Asp Thr Leu Val Pro Ala Lys Phe
180 185 190
Glu Phe Leu Thr Arg Arg Lys Gly His Asp Arg Val Met Lys Ser Ile
195 200 205
Asp Thr Ala Ile Glu Leu Gly Tyr Asn Pro Val Lys Val Asn Cys Val
210 215 220
Ile Met Arg Gly Leu Asn Asp Asp Glu Ile Cys Asp Phe Val Glu Leu
225 230 235 240
Thr Arg Asp Lys Pro Ile Asn Val Arg Phe Ile Glu Phe Met Pro Phe
245 250 255
Asp Gly Asn Val Trp Asn Val Lys Lys Leu Val Pro Tyr Ala Glu Val
260 265 270
Met Asp Lys Val Val Lys Arg Phe Pro Ser Ile Lys Arg Met Gln Asp
275 280 285
His Pro Thr Glu Thr Ala Lys Asn Phe Thr Ile Asp Gly His Cys Gly
290 295 300
Ser Val Ser Phe Ile Thr Ser Met Thr Glu His Phe Cys Ala Gly Cys
305 310 315 320
Asn Arg Leu Arg Leu Leu Ala Asp Gly Asn Phe Lys Val Cys Leu Phe
325 330 335
Gly Pro Ser Glu Val Ser Leu Arg Asp Pro Leu Arg Ser Gly Ala Asp
340 345 350
Asp Glu Ala Leu Arg Glu Ile Ile Gly Ala Ala Val Lys Arg Lys Lys
355 360 365
Ala Ala His Ala Gly Met Leu Asp Ile Ala Lys Thr Ala Asn Arg Pro
370 375 380
Met Ile His Ile Gly Gly
385 390
<210> 26
<211> 270
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<220>
<223> 环吡喃蝶呤单磷酸合酶,线粒体
<400> 26
Met Ile Ser Thr Leu Arg Arg Ala Val Phe Leu Arg Arg Phe Pro Ala
1 5 10 15
Val Val Ser Pro Ile Lys Arg Ala Phe Ser Ser Arg Ile Asp Asp Glu
20 25 30
Phe Asp Pro Gln Ile Met Asn Ile Asn Glu Leu Asn Gln Glu Met Gln
35 40 45
Ser Ile Phe Gly Gln Glu Pro Ser Pro Asp Gly Pro Gly Thr Met Asp
50 55 60
Phe Ser Glu Leu Lys Ser Ser Lys Ile Glu Pro Leu Arg Ser Lys Asn
65 70 75 80
Ile Asp Phe Arg Gln Gln Ile Glu Tyr His Lys Ser Thr His Ser Ser
85 90 95
Lys Asn Asp Ser Gln Ala Ile Glu Gln Tyr Ala Lys Val Ala Ser Asp
100 105 110
Met Ser Lys Leu Thr His Val Gly Ile Ala Gly Glu Ala Gln Met Val
115 120 125
Asp Val Ser Ser Lys Asp Asn Ser Lys Arg Thr Ala Leu Ala Cys Cys
130 135 140
Lys Val Ile Leu Gly Lys Arg Val Phe Asp Leu Val Leu Ala Asn Gln
145 150 155 160
Met Gly Lys Gly Asp Val Leu Gly Val Ala Lys Ile Ala Gly Ile Asn
165 170 175
Gly Ala Lys Gln Thr Ser Ser Leu Ile Pro Leu Cys His Asn Ile Ala
180 185 190
Leu Thr His Val Arg Val Asp Leu Arg Leu Asn Pro Glu Asp Phe Ser
195 200 205
Val Asp Ile Glu Gly Glu Ala Ser Cys Thr Gly Lys Thr Gly Val Glu
210 215 220
Met Glu Ala Met Thr Ala Val Ser Val Ala Gly Leu Thr Val Tyr Asp
225 230 235 240
Met Cys Lys Ala Ala Ser Lys Asp Ile Ser Ile Thr Asp Val Arg Leu
245 250 255
Glu Arg Lys Thr Gly Gly Lys Ser Gly Ser Trp Ser Arg Leu
260 265 270
<210> 27
<211> 464
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<220>
<223> 腺苷酸转移酶和硫转移酶MOCS3
<400> 27
Met Met Ser Asn Gly Gly Asp Ser Ser Glu Ile Val Arg Glu Leu Glu
1 5 10 15
Glu Leu Lys Leu Lys Lys Ala Glu Ile Glu His Arg Ile Ser Thr Leu
20 25 30
Glu Ala Lys Leu Gln Asp Thr Ala Ala Val Glu Leu Tyr Asp Ala Val
35 40 45
Ser Asn Gly Asp Ser Tyr Leu Thr Ala Pro Glu Leu Glu His Gly Leu
50 55 60
Ser Pro Asp Gln Ile Tyr Arg Tyr Ser Arg Gln Leu Leu Leu Pro Ser
65 70 75 80
Phe Ala Val Glu Gly Gln Ser Asn Leu Leu Lys Ser Ser Val Leu Val
85 90 95
Ile Gly Ala Gly Gly Leu Gly Ser Pro Ala Leu Leu Tyr Leu Ala Ala
100 105 110
Cys Gly Val Gly Gln Leu Gly Ile Ile Asp His Asp Val Val Glu Leu
115 120 125
Asn Asn Met His Arg Gln Ile Ile His Thr Glu Ala Phe Ile Gly His
130 135 140
Pro Lys Val Lys Ser Ala Ala Ala Ala Cys Arg Ser Ile Asn Ser Thr
145 150 155 160
Ile Lys Val Asp Glu Tyr Val Glu Ala Leu Arg Thr Ser Asn Ala Leu
165 170 175
Glu Ile Leu Ser Gln Tyr Asp Ile Ile Val Asp Ala Thr Asp Asn Pro
180 185 190
Pro Ser Arg Tyr Met Ile Ser Asp Cys Cys Val Leu Leu Gly Lys Pro
195 200 205
Leu Val Ser Gly Ala Ala Leu Gly Met Glu Gly Gln Leu Thr Val Tyr
210 215 220
Asn His Asn Gly Gly Pro Cys Tyr Arg Cys Leu Phe Pro Thr Pro Pro
225 230 235 240
Pro Thr Ser Ala Cys Gln Arg Cys Ser Asp Ser Gly Val Leu Gly Val
245 250 255
Val Pro Gly Val Ile Gly Cys Leu Gln Ala Leu Glu Thr Ile Lys Leu
260 265 270
Ala Ser Leu Val Gly Glu Pro Leu Ser Glu Arg Met Leu Leu Phe Asp
275 280 285
Ala Leu Ser Ala Arg Met Arg Ile Val Lys Ile Arg Gly Arg Ser Ser
290 295 300
Gln Cys Thr Val Cys Gly Asp Asn Ser Ser Phe Asn Lys Gln Thr Phe
305 310 315 320
Lys Asp Phe Asp Tyr Glu Asp Phe Thr Gln Phe Pro Leu Phe Ala Gly
325 330 335
Pro Leu Asn Leu Leu Pro Ala Glu Ser Arg Ile Ser Ser Lys Glu Phe
340 345 350
Lys Glu Ile Leu Gln Lys Lys Glu Gln His Val Leu Leu Asp Val Arg
355 360 365
Pro Ser His His Tyr Lys Ile Val Ser Leu Pro Asp Ser Leu Asn Ile
370 375 380
Pro Leu Ala Asn Leu Glu Thr Arg Leu Asn Glu Leu Thr Ser Ala Leu
385 390 395 400
Lys Glu Lys Gly Asn Gly His Ala Asn Thr Glu Ser Cys Thr Asn Pro
405 410 415
Ser Val Phe Val Val Cys Arg Arg Gly Asn Asp Ser Gln Arg Ala Val
420 425 430
Gln Tyr Leu Arg Glu Ser Gly Phe Asp Ser Ala Lys Asp Ile Ile Gly
435 440 445
Gly Leu Glu Ala Trp Ala Ala Asn Val Asn Pro Asn Phe Pro Thr Tyr
450 455 460
<210> 28
<211> 198
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<220>
<223> 钼蝶呤合酶催化亚基
<400> 28
Met Ser Ala Glu Glu Lys Asn Leu Ile Glu Ile Leu Glu Glu Gly His
1 5 10 15
Lys Val Asp Val Val Lys Tyr Ile Asp Tyr Val Ser Ala Pro Gln Ala
20 25 30
Gly Ala Ile Ala Thr Phe Ser Gly Thr Thr Arg Asp Met Phe Glu Gly
35 40 45
Lys Thr Val Leu Glu Leu Arg Tyr Glu Ala Tyr Val Pro Met Ala Thr
50 55 60
Arg Cys Leu Ser Ser Ile Cys Thr Thr Ala Arg Ser Thr Trp Asp Ile
65 70 75 80
His Lys Ile Ala Val Ala His Arg Leu Gly Pro Val Pro Val Gly Glu
85 90 95
Thr Ser Val Leu Ile Ala Val Ser Ser Val His Arg Ala Asp Gly Leu
100 105 110
Asp Ala Cys Lys Phe Leu Ile Asp Glu Leu Lys Ala Ser Val Pro Ile
115 120 125
Trp Lys Lys Glu Val Tyr Thr Asn Gly Glu Ile Trp Lys Glu Asn Ser
130 135 140
Glu Phe Met Glu Lys Arg Leu Glu Leu Ala Glu Lys Arg Asp Ser Ile
145 150 155 160
Val Lys Lys Thr Val Val Glu Glu His Arg Arg Arg Gly Cys Cys Gly
165 170 175
Ser Lys Val Arg Val Glu Glu Asp Glu Glu His Lys Asp Ile Thr Gly
180 185 190
Asp Asn Lys Ser Ser Ser
195
<210> 29
<211> 96
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<220>
<223> 钼蝶呤合酶硫载体亚基
<400> 29
Met Asp Lys Glu Val Thr Lys Ile Glu Ser Asp Asp Thr Ser Ser Val
1 5 10 15
Glu Ile Lys Val Leu Leu Phe Ala Arg Ala Arg Glu Leu Thr Gly Val
20 25 30
Pro Asp Leu Thr Leu Lys Met Pro Ser Gly Ser Thr Thr Gln Lys Cys
35 40 45
Leu Asp Glu Leu Val Leu Lys Phe Pro Ser Leu Glu Glu Val Arg Ser
50 55 60
Cys Val Val Leu Ala Leu Asn Glu Glu Tyr Thr Thr Asp Ser Ala Ile
65 70 75 80
Val Gln His Arg Asp Glu Leu Ala Ile Ile Pro Pro Ile Ser Gly Gly
85 90 95

Claims (22)

1.一种酵母属酵母细胞,优选地酿酒酵母酵母细胞,所述酵母细胞包含一个或多个编码具有NADH依赖性硝酸还原酶活性的酶的核酸序列和/或一个或多个编码具有NADH依赖性亚硝酸还原酶活性的酶的核酸序列。
2.根据权利要求1所述的酵母属酵母细胞,其中所述酵母属酵母细胞进一步包含一个或多个编码具有硝酸盐和/或亚硝酸盐转运体活性的酶的核酸序列。
3.根据权利要求1或2所述的酵母属酵母细胞,其中所述酵母属酵母细胞为转基因、重组和/或经遗传修饰的酵母属酵母细胞。
4.根据权利要求1至3中任一项所述的酵母属酵母细胞,所述酵母属酵母细胞进一步包含黄素腺嘌呤二核苷酸(FAD)、一个或多个血红素辅基和/或钼辅因子(MoCo)。
5.根据权利要求1至4中任一项所述的酵母属酵母细胞,所述酵母属酵母细胞进一步包含一个或多个编码黄素腺嘌呤二核苷酸(FAD)、一个或多个血红素辅基和/或钼辅因子(MoCo)的核酸序列。
6.根据权利要求1至5中任一项所述的酵母属酵母细胞,所述酵母属酵母细胞进一步包含:
-编码GTP 3',8-环化酶的核酸序列;
-编码环吡喃蝶呤单磷酸合酶的核酸序列;
-编码钼蝶呤合酶催化亚基的核酸序列;
-编码钼蝶呤合酶硫载体亚基的核酸序列;
-编码钼蝶呤腺苷酸转移酶的核酸序列,和/或
-编码钼蝶呤合酶腺苷酸转移酶和/或钼蝶呤钼转移酶的核酸序列。
7.根据权利要求1至6中任一项所述的酵母属酵母细胞,所述酵母属酵母细胞进一步包含以下中的一者或多者:
-选自由以下组成的组的多肽:SEQ ID NO:1、SEQ ID NO:2及其功能同源物,所述功能同源物与SEQ ID NO:1和/或SEQ ID NO:2中的任一者具有至少40%的氨基酸序列同一性;和/或
-选自由以下组成的组的多肽:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5及其功能同源物,所述功能同源物与SEQ ID NO:3、SEQ ID NO:4和/或SEQ ID NO:5中的任一者具有至少40%的氨基酸序列同一性;和/或
-选自由以下组成的组的多肽:SEQ ID NO:6及其功能同源物,所述功能同源物与SEQID NO:6具有至少40%的氨基酸序列同一性;和/或
-选自由以下组成的组的多肽:SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23及其功能同源物,所述功能同源物与SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22和/或SEQ ID NO:23中的任一者具有至少40%的氨基酸序列同一性。
8.根据权利要求1至7中任一项所述的酵母属酵母细胞,其中与对应的野生型细胞相比,所述酵母属酵母细胞不具有磷酸甘油磷酸酶活性或具有降低的磷酸甘油磷酸酶活性。
9.根据权利要求1至8中任一项所述的酵母属酵母细胞,其中所述酵母属酵母细胞在选自由GPD1、GPD2、GPP1和GPP2组成的组的至少一个基因中包含基因组突变。
10.根据权利要求1至9中任一项所述的酵母属酵母细胞,其中所述酵母属酵母细胞进一步包含:
-一个或多个编码甘油脱氢酶的核酸序列;和/或
-一个或多个编码二羟基丙酮激酶的核酸序列;和/或
-一个或多个编码甘油转运体的核酸序列。
11.一种用于生产发酵产物的厌氧发酵方法,所述厌氧发酵方法包括使用如权利要求1至10中任一项所述的酵母属酵母细胞发酵进料,所述进料包含氧化氮源和可发酵碳源。
12.根据权利要求11所述的厌氧发酵方法,其中与对应的野生型细胞相比,所述酵母属酵母细胞产生更少的甘油。
13.根据权利要求11或12所述的厌氧发酵方法,其中与对应的野生型细胞相比,所述酵母属酵母细胞产生更少的氨基甲酸乙酯。
14.根据权利要求11至13中任一项所述的厌氧发酵方法,其中所述可发酵碳源包含一种或多种单糖、二糖和/或多糖或由所述一种或多种单糖、二糖和/或多糖组成。
15.根据权利要求11至14中任一项所述的厌氧发酵方法,其中所述氧化氮源包含以下或由以下组成:
-硝酸、硝酸盐或硝酸根离子;和/或
-亚硝酸、亚硝酸盐或亚硝酸根离子。
16.根据权利要求11至15中任一项所述的厌氧发酵方法,其中所述氧化氮源包括硝酸根和/或亚硝酸根与选自由铵、氨和尿素组成的组的一种或多种其他氮源的组合。
17.根据权利要求11至16中任一项所述的厌氧发酵方法,其中所述发酵产物选自由以下组成的组:乙醇、正丁醇、异丁醇、乳酸、3-羟基-丙酸、丙烯酸、乙酸、琥珀酸、富马酸、苹果酸、衣康酸、马来酸、柠檬酸、己二酸。
18.根据权利要求11至17中任一项所述的厌氧发酵方法,其中进一步产生发酵副产物,所述发酵副产物优选地包含酒糟或由酒糟组成。
19.根据权利要求18所述的厌氧发酵方法,其中所述发酵副产物包含等于或小于17ng/g的氨基甲酸乙酯。
20.一种包含酒糟的产物,所述产物是通过根据权利要求11至19中任一项所述的方法获得或可获得的。
21.一种包含酒糟的产物,所述产物包含等于或小于17ng/g的氨基甲酸乙酯。
22.根据权利要求20或权利要求21所述的产物在动物饲料和/或肥料中的用途。
CN202180068023.4A 2020-10-05 2021-10-05 酵母属酵母细胞及使用其的发酵方法 Pending CN116348609A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063087642P 2020-10-05 2020-10-05
US63/087,642 2020-10-05
PCT/EP2021/077334 WO2022073952A1 (en) 2020-10-05 2021-10-05 Saccharomyces yeast cell and fermentation process using such

Publications (1)

Publication Number Publication Date
CN116348609A true CN116348609A (zh) 2023-06-27

Family

ID=78080331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180068023.4A Pending CN116348609A (zh) 2020-10-05 2021-10-05 酵母属酵母细胞及使用其的发酵方法

Country Status (5)

Country Link
US (1) US20230374443A1 (zh)
EP (1) EP4225929A1 (zh)
CN (1) CN116348609A (zh)
BR (1) BR112023006130A2 (zh)
WO (1) WO2022073952A1 (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2277989A1 (en) 2009-07-24 2011-01-26 Technische Universiteit Delft Fermentative glycerol-free ethanol production
WO2013076144A2 (en) 2011-11-21 2013-05-30 Metabolic Explorer Microorganism strains for the production of 2,3-butanediol
DK2831238T3 (en) 2012-03-27 2018-04-03 Dsm Ip Assets Bv CLONING PROCEDURE
AR097480A1 (es) 2013-08-29 2016-03-16 Dsm Ip Assets Bv Células de levadura convertidoras de glicerol y ácido acético con una conversión de ácido acético mejorada
US10619170B2 (en) 2015-01-06 2020-04-14 Dsm Ip Assets B.V. CRISPR-CAS system for a yeast host cell
WO2019063507A1 (en) 2017-09-26 2019-04-04 Dsm Ip Assets B.V. IMPROVED PROCESS FOR THE PRODUCTION OF ETHANOL
NL2022905B1 (en) 2019-04-09 2020-10-20 Univ Delft Tech Yeast with engineered Molybdenum co-factor biosynthesis

Also Published As

Publication number Publication date
BR112023006130A2 (pt) 2023-05-09
EP4225929A1 (en) 2023-08-16
WO2022073952A1 (en) 2022-04-14
US20230374443A1 (en) 2023-11-23

Similar Documents

Publication Publication Date Title
CN118325748A (zh) 重组酵母细胞
WO2018172328A1 (en) Improved glycerol free ethanol production
CA2905133A1 (en) Methods for regulating nitrogen metabolism during the production of ethanol from corn by metabolically engineered yeast strains
CN108603179B (zh) 发酵产物生产增加的真核细胞
WO2023285297A1 (en) Recombinant yeast cell
US20230374443A1 (en) Saccharomyces yeast cell and fermentation process using such
CN110088288B (zh) 用于乙醇生产的改良酵母菌株
WO2021089877A1 (en) Process for producing ethanol
CN117881773A (zh) 重组酵母细胞
CN111133111A (zh) 消耗乙酸的菌株
CN117940571A (zh) 重组酵母细胞
EP4370692A1 (en) Recombinant yeast cell
CN117897490A (zh) 重组酵母细胞
EP4370689A1 (en) Recombinant yeast cell
WO2023208762A2 (en) Mutant yeast cell and process for the production of ethanol
CN118176296A (zh) 重组酵母细胞
CN117916381A (zh) 重组酵母细胞
WO2023285281A1 (en) Recombinant yeast cell
WO2023285282A1 (en) Recombinant yeast cell

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240424

Address after: California, USA

Applicant after: DANISCO US Inc.

Country or region after: U.S.A.

Address before: Holland Heerlen

Applicant before: DSM IP ASSETS B.V.

Country or region before: Netherlands