CN117940571A

CN117940571A - 重组酵母细胞

Info

Publication number: CN117940571A
Application number: CN202280059177.1A
Authority: CN
Inventors: I·M·武特-万鲁兹; J·P·J·施密茨; M·L·A·詹森; H·M·C·J·德布鲁因; S·L·罗塞尔-阿拉贡; E·T·范里杰; P·E·伯尔曼
Original assignee: Danisco US Inc
Current assignee: Danisco US Inc
Priority date: 2021-07-12
Filing date: 2022-07-07
Publication date: 2024-04-26

Abstract

公开了一种重组酵母细胞，该重组酵母细胞功能性地表达：‑编码具有甘油脱氢酶活性的蛋白质的核酸序列；‑编码具有二羟基丙酮激酶活性的蛋白质的核酸序列；和‑编码具有甘油转运蛋白活性的蛋白质的核酸序列，其中编码具有甘油转运蛋白活性的该蛋白质的该核酸序列的表达在启动子(“GT启动子”)的控制下，该GT启动子对甘油转运蛋白的厌氧/好氧表达比率为2或更高；以及一种使用这种重组酵母细胞生产乙醇的方法。

Description

重组酵母细胞

技术领域

本发明涉及一种重组酵母细胞和一种用于生产乙醇的方法，其中使用所述重组酵母细胞。

背景技术

微生物发酵方法适用于从可再生碳水化合物原料工业生产广泛且快速扩大范围的化学化合物。尤其是在厌氧发酵方法中，辅因子对NADH/NAD⁺的氧化还原平衡可能对产物产率造成重大限制。这种挑战的示例为在由酿酒酵母(Saccharomyces cerevisiae)工业生产例如燃料乙醇时作为主要副产物的甘油的形成，这是需要再氧化在生物合成反应中形成的NADH的直接结果。

按体积计，由酿酒酵母生产乙醇是目前工业生物技术中最大的单一发酵方法。已经提出了多种方法以通过基因修饰来改善工业生物技术中使用的生物体的发酵性质。与基于酵母的乙醇生产的化学计量相关的重大挑战是大量的NADH依赖性副产物(诸如甘油)通常作为副产物形成，尤其是在厌氧和氧气受限的条件下或在呼吸以其他方式受限或不存在的条件下。据估计，在典型的工业乙醇工艺中，高达约4wt.％的糖原料被转化为甘油(Nissen等人,"Anaerobic and aerobic batch cultivations of Saccharomycescerevisiae mutants impaired in glycerol Synthesis"[“酿酒酵母突变体的厌氧和好氧分批培养对甘油合成的影响”],(2000),Yeast[酵母],第16卷,第463-474页)。在对于厌氧生长理想的条件下，向甘油的转化甚至可能更高，高达约10％。

厌氧条件下的甘油生产主要与氧化还原代谢有关。在酿酒酵母(S.cerevisiae)的厌氧生长过程中，经由酒精发酵发生糖异化。在该过程中，在糖酵解甘油醛-3-磷酸脱氢酶反应中形成的NADH通过经由NAD⁺依赖性醇脱氢酶将由丙酮酸脱羧形成的乙醛转化为乙醇而被再氧化。当NAD⁺向NADH的净还原发生在代谢的其他地方时，这种氧化还原-中性异化途径的固定化学计量会引起问题。在厌氧条件下，酿酒酵母中的NADH再氧化严格依赖于糖向甘油的还原。甘油形成是通过将糖酵解中间体磷酸二羟丙酮(DHAP)还原为甘油3-磷酸(甘油-3P)而引发的，该反应是由NAD⁺依赖性甘油3-磷酸脱氢酶催化的。随后，在该反应中形成的甘油3-磷酸被甘油-3-磷酸酶水解，以产生甘油和无机磷酸。因此，甘油是由酿酒酵母厌氧生产乙醇过程中的主要副产物，这是不期望的，因为它减少了糖向乙醇的总体转化。此外，乙醇生产工厂的流出物中甘油的存在可能增加废水处理的成本。

在文献中，已经报道了几种不同的方法，这些方法可以帮助减少副产物甘油的量并且使碳转向至乙醇，使得每克发酵碳水化合物的乙醇产率增加。

WO 2015/028583描述了一种经基因修饰的酵母细胞，其包含：a)编码甘油脱氢酶(E.C.1.1.1.6)的一个或多个核酸序列；b)编码二羟基丙酮激酶(E.C.2.7.1.28或E.C.2.7.1.29)的一个或多个核酸序列；以及c)编码甘油转运蛋白的一个或多个核酸序列。此外，该细胞可以包含编码NAD+依赖性乙酰化乙醛脱氢酶的一个或多个核酸序列。WO2015/028583进一步描述了一种方法，该方法包括从乙酸盐和可发酵碳水化合物(特别是选自以下的组的碳水化合物：葡萄糖、果糖、蔗糖、麦芽糖、木糖、阿拉伯糖、半乳糖和甘露糖)制备发酵产物，使用以上酵母细胞在厌氧条件下进行该制备。

WO 2015/028583解释说，由于乙酸通常被认为是存在于水解产物中的最具毒性的化合物，因此期望进一步降低水解产物中的乙酸盐(乙酸)浓度。据提及，增加酵母的厌氧乙酸转化潜力的一种方式是通过引入甘油转化途径，该途径例如转化外部添加的甘油，迫使酵母细胞转化更多的乙酸，以便维持氧化还原平衡。

在实例和表11中，WO 2015/028583说明尤其是转化体T5(其包括源自鲁氏结合酵母(Zygosaccharomycs rouxii)的甘油转运蛋白)导致相对于参考菌株更多的甘油转化。还消耗了更多的乙酸。然而，在该T5的情况下，乙醇滴度不是最高的，因为没有消耗掉所有的糖。因此，尽管用描述于WO 2015/028583中的酵母细胞和方法获得了良好的结果，但仍有进一步改善的空间。

提供这样的酵母和用于生产乙醇的方法将是本领域的进步，其中该酵母包含甘油转化途径和/或甘油转运蛋白，类似于WO 2015/028583中的酵母，但是其中糖转化的速度和/或糖消耗的总量得到改善。

发明内容

诸位发明人现在已经出人意料地发现，通过用特定启动子促进甘油转运蛋白甚至可以进一步改善WO 2015/028583的方法和酵母细胞。

因此，本发明提供了一种重组酵母细胞，该重组酵母细胞功能性地表达：

-编码具有甘油脱氢酶活性的蛋白质(优选在酶类E.C.1.1.1.6内)的核酸序列；

-编码具有二羟基丙酮激酶活性的蛋白质(优选在酶类E.C.2.7.1.28或E.C.2.7.1.29内)的核酸序列；以及

-编码具有甘油转运蛋白活性的蛋白质的核酸序列，

其中编码具有甘油转运蛋白活性的该蛋白质的该核酸序列的表达在启动子(“GT启动子”)的控制下，该GT启动子对甘油转运蛋白的厌氧/好氧表达比率为2或更高。

此外，本发明提供了一种用于生产乙醇的方法，该方法包括使用以上重组酵母细胞转化碳源(诸如碳水化合物或另一种有机碳源)，从而适当地形成乙醇。

有利地，使用以上重组酵母细胞和/或以上方法使得糖转化的速度提高和/或糖消耗的总量增加。

附图说明

通过以下附图说明本发明：

图1：如实例5中所述且展示于表18中的分别用参考菌株RX16、新菌株NX17和新菌株NX18发酵玉米醪的整整66小时过程中的乙醇和CO2气体产量。

图2：如实例5中所述且展示于表19中的分别用参考菌株RX16、新菌株NX17和新菌株NX18发酵玉米醪的前10小时过程中的乙醇和CO2气体产量。

序列表说明

本申请含有呈计算机可读形式的序列表，将其通过援引并入本文。下表1提供了概述。

表1：序列表的概述：

在本专利申请的上下文中，每个以上蛋白质/氨基酸序列都优选地由针对在酵母中表达、更优选地针对在酿酒酵母中表达进行密码子对优化的DNA/核酸序列编码。

具体实施方式

定义

除非另有定义或由上下文清楚地指示，否则本文所用的所有技术和科学术语都具有与本领域普通技术人员通常所理解的相同的含义。

在整个本说明书和所附权利要求中，词语“包含(comprise)”和“包括(include)”以及变体诸如“包含(comprises)”、“包含(comprising)”、“包括(includes)”和“包括(including)”应被包含性地解释。也就是说，在上下文允许的情况下，这些词语旨在表达可能包含未具体列举的其他要素或整数。

冠词“一个/一种(a)”和“一个/一种(an)”在本文中用于指代一个/一种(one)或多于一个/多于一种(more than one)(即，一个/一种(one)或至少一个/至少一种(at leastone))该冠词的语法宾语。举例来说，“一个要素/一种要素(an element)”可以意指一个要素/一种要素(one element)或多于一个要素/多于一种要素(more than one element)。当以单数形式提及名词(例如，化合物、添加剂等)时，意在包括复数形式。因此，当提及特定部分(例如，“基因”)时，除非另有规定，否则这意指该基因中的“至少一个”，例如“至少一个基因”。

当提及存在几种异构体(例如，D和L对映异构体)的化合物时，该化合物原则上包括可以在本发明的特定方面中使用的该化合物的所有对映异构体、非对映异构体和顺式/反式异构体；特别是当提及这种化合物时，它包括一种或多种天然异构体。

除非另有明确指示，否则本文所述的本发明的各种实施例可以交叉组合。

术语“碳源”是指碳的来源，优选包含碳的化合物或分子。优选地，碳源是碳水化合物。在本文中将碳水化合物理解为由碳、氧和氢组成的有机化合物。适当地，碳源可以选自由以下组成的组：单糖、二糖和/或多糖、酸和酸式盐。更优选地，碳源是选自由以下组成的组的化合物：葡萄糖、阿拉伯糖、木糖、半乳糖、甘露糖、鼠李糖、果糖、甘油和乙酸或其盐。

术语“干物质”和“干固体”(分别缩写为“DM”和“DS”)在本文中可互换地使用，并且是指在除去水后剩余的材料。因此，可以通过本领域技术人员已知的任何方法来确定干物质含量。

术语“发酵(ferment)”及其变体诸如“发酵(fermenting)”、“发酵(fermentation)”和/或“发酵(fermentative)”在本文中以经典意义使用，即表明过程在厌氧条件下进行或已经在厌氧条件下进行。在本文中将厌氧发酵定义为在厌氧条件下进行的发酵。在本文中将厌氧条件定义为没有任何氧气或酵母细胞基本上不消耗氧气的条件。基本上不消耗氧气的条件适当地对应于小于5mmol/l.h^-1的耗氧量，特别是小于2.5mmol/l.h^-1或小于1mmol/l.h^-1的耗氧量。更优选地，消耗0mmol/L/h(即，耗氧量是不可检测的)。这适当地对应于培养液中的溶解氧浓度小于空气饱和度的5％，更适当地溶解氧浓度小于空气饱和度的1％或小于空气饱和度的0.2％。

术语“发酵方法”是指用于制备或生产发酵产物的方法。

术语“细胞”是指真核生物体或原核生物体，优选地以单细胞存在。在本发明中，细胞是重组酵母细胞。也就是说，重组细胞选自由酵母组成的属的组。

术语“酵母”和“酵母细胞”在本文中可互换地使用，并且是指一组在系统发育上多样化的单细胞真菌，其中的大部分属于子囊菌门(Ascomycota)和担子菌门(Basidiomycota)。芽殖酵母(“真酵母”)被分类在酵母目(Saccharomycetales)中。根据本发明的酵母细胞优选地是衍生自酵母属(Saccharomyces)的酵母细胞。更优选地，酵母细胞是酿酒酵母种的酵母细胞。

如本文所用，术语“重组”(例如，提及“重组酵母”、“重组细胞”、“重组微生物”和/或“重组菌株”)分别是指含有作为一种或多种基因修饰的结果的核酸的酵母、细胞、微生物或菌株。简单地说，酵母、细胞、微生物或菌株含有来自其一个或多个亲本(其中的任一个)的核酸的不同组合。为了构建重组酵母、细胞、微生物或菌株，可以使用一种或多种重组DNA技术和/或另外一种或多种诱变技术。例如，重组酵母和/或重组酵母细胞可以包含不存在于对应野生型酵母和/或细胞中的核酸，已经使用重组DNA技术将该核酸引入该酵母和/或酵母细胞中(即，转基因酵母和/或细胞)，或者不存在于所述野生型酵母和/或细胞中的该核酸是存在于所述野生型酵母和/或酵母细胞中的核酸序列(诸如编码野生型多肽的基因)中的一种或多种突变(例如，使用重组DNA技术或另一种诱变技术诸如UV辐照)的结果，或者其中基因的核酸序列已经被修饰以将多肽产物(编码它)靶向至另一个细胞区室。此外，术语“重组”可以适当地涉及例如已经使用重组DNA技术从其中除去核酸序列的酵母、细胞、微生物或菌株。

在本文中将包含或具有某种活性的重组酵母理解为重组酵母可以包含编码具有这种活性的蛋白质的一个或多个核酸序列。因此，允许重组酵母功能性地表达这种蛋白质或酶。

术语“功能性地表达”意指存在相关核酸序列的功能性转录，允许核酸序列实际上被转录，例如导致蛋白质的合成。

如本文所用，术语“转基因”(例如，提及“转基因酵母”和/或“转基因细胞”)分别是指这样的酵母和/或细胞，其含有非天然存在于该酵母和/或细胞中并且已经使用例如重组DNA技术被引入该酵母和/或细胞中的核酸，诸如重组酵母和/或细胞。

如本文关于蛋白质或多肽所用的术语“突变”意指，与野生型或天然存在的蛋白质或多肽序列相比，至少一个氨基酸已经被不同的氨基酸替代、插入氨基酸序列中或从氨基酸序列中缺失。氨基酸的替代、插入或缺失可以例如经由编码这些氨基酸的核酸的诱变来实现。诱变是本领域熟知的方法，并且包括例如通过PCR的手段或经由寡核苷酸介导的诱变的定点诱变，如以下文献中所述：Sambrook等人,Molecular Cloning-ALaboratory Manual[分子克隆-实验室手册],第2版,第1-3卷(1989),由Cold Spring Harbor Publishing[冷泉港出版公司]出版)。

如本文关于基因所用的术语“突变”意指，与野生型或天然存在的核酸序列相比，基因或其调控序列的核酸序列中的至少一个核苷酸已经被不同的核苷酸替代、插入核酸序列中或从核酸序列中缺失。氨基酸的替代、插入或缺失可以例如经由诱变来实现，导致例如具有定性或定量改变的功能的蛋白质序列的转录或该基因的敲除。在本发明的上下文中，“改变基因”具有与突变基因相同的含义。

如本文所用，术语“基因(gen)”或“基因(gene)”是指可以被转录成然后被翻译成蛋白质的mRNA的核酸序列。编码某种蛋白质的基因是指编码这种蛋白质的一个或多个核酸序列。

如本文所用，术语“核酸”或“核苷酸”是指呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物(即，多核苷酸)中的单体单元，并且除非另有限制，否则涵盖具有天然核苷酸的本质属性的已知类似物，因为它们以类似于天然存在的核苷酸的方式与单链核酸杂交(例如，肽核酸)。例如，由编码酶的核苷酸序列定义的某种酶包括(除非另有限制)与编码酶的参考核苷酸序列杂交的核苷酸序列。多核苷酸可以是天然或异源结构或调控基因的全长或子序列。除非另有指示，否则该术语包括对指定序列以及其互补序列的提及。因此，具有出于稳定性或其他原因而修饰的骨架的DNA或RNA是如本文所预期的术语“多核苷酸”。此外，包含稀有碱基(诸如肌苷)或修饰的碱基(诸如三苯甲基化碱基)(仅举两个示例)的DNA或RNA是如本文所用的术语多核苷酸。将理解，已经对DNA和RNA进行了多种多样的修饰，其用于本领域技术人员已知的许多有用目的。如本文所用的术语多核苷酸包括多核苷酸的此类化学、酶促或代谢修饰形式，以及病毒和细胞(尤其包括简单和复杂细胞)所特有的DNA和RNA的化学形式。

术语“核苷酸序列”和“核酸序列”在本文中可互换地使用。核酸序列的一个示例是DNA序列。

术语“多肽”、“肽”和“蛋白质”在本文中可互换地用于指代例如由氨基酸序列所展示的氨基酸残基的聚合物。这些术语适用于一个或多个氨基酸残基是对应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物，以及天然存在的氨基酸聚合物。天然存在的氨基酸的此类类似物的本质属性是，当被掺入蛋白质中时，该蛋白质对由相同但完全由天然存在的氨基酸组成的蛋白质引发的抗体具有特异性反应性。术语“多肽”、“肽”和“蛋白质”还包括修饰，包括但不限于糖基化、脂质附接、硫酸化、谷氨酸残基的γ-羧基化、羟基化和ADP-核糖基化。

术语“酶”在本文中是指具有催化功能的蛋白质。在蛋白质催化某种生物反应的情况下，术语“蛋白质”和“酶”在本文中可以可互换地使用。当参考酶类(EC)提及酶时，酶类是这样的类别，其中酶根据国际生物化学与分子生物学联盟命名委员会(the NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology，NC-IUBMB)提供的酶命名法被分类或可以被分类，该命名法可以在http://www.chem.qmul.ac.uk/iubmb/enzyme/找到。意在包括还未(尚未)被分类在指定类别中但可以如此分类的其他合适的酶。

如果在本文中通过参考登录号提及蛋白质或核酸序列(诸如基因)，除非另有规定，否则该编号特别用于指代具有可以经由www.ncbi.nlm.nih.gov/(2020年10月1日可获得)找到的序列的蛋白质或核酸序列(基因)。

在本文中编码多肽的每个核酸序列都还包括其任何保守修饰的变体。通过参考遗传密码，这包括，它描述了核酸的每种可能的沉默变异。术语“保守修饰的变体”适用于氨基酸和核酸序列两者。关于特定核酸序列，保守修饰的变体是指由于遗传密码的简并性而编码相同氨基酸序列或保守修饰的氨基酸序列变体的那些核酸。术语“遗传密码的简并性”是指大量在功能上相同的核酸编码任何给定蛋白质的事实。例如，密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此，在密码子指定丙氨酸的每个位置处，密码子可以被改变为任何所描述的对应密码子而不改变编码的多肽。此类核酸变异是“沉默变异”，并且代表一种保守修饰的变异。

如本文所用，术语具有特定序列(例如，“SEQ ID NO:X”)的多肽和/或氨基酸序列的“功能性同源物”(或简称“同源物”)是指包含所述特定序列的多肽和/或氨基酸序列，条件是一个或多个氨基酸被突变、取代、缺失、添加和/或插入，并且该多肽具有(定性地)相同的用于底物转化的酶功能。

如本文所用，术语具有特定序列(例如，“SEQ ID NO:X”)的多核苷酸和/或核酸序列的“功能性同源物”(或简称“同源物”)是指包含所述特定序列的多核苷酸和/或核酸序列，条件是一个或多个核酸被突变、取代、缺失、添加和/或插入，并且该多核苷酸编码具有(定性地)相同的用于底物转化的酶功能的多肽序列。关于核酸序列，术语功能性同源物意在包括由于遗传密码的简并性而与另一个核酸序列不同并且编码相同多肽序列的核酸序列。

在本文中将序列同一性定义为两个或更多个氨基酸(多肽或蛋白质)序列或者两个或更多个核酸(多核苷酸)序列之间的关系，如通过比较序列所确定。通常，在所比较的序列的整个长度上比较序列同一性或相似性。在本领域中，“同一性”还意指氨基酸或核酸序列之间的序列相关性程度，视情况而定，如通过此类序列的串之间的匹配所确定。

当展现出一定水平的相似性时，氨基酸或核苷酸序列被说成是同源的。两个序列是同源的表明有共同的进化起源。两个同源序列是密切相关还是更远距离相关由“同一性百分比”或“相似性百分比”指示，其分别为高或低。尽管有争议，但为了指示“同一性百分比”或“相似性百分比”，“同源性水平”或“同源性百分比”经常可互换地使用。序列的比较和两个序列之间的同一性百分比的确定可以使用数学算法来完成。技术人员将意识到几种不同的计算机程序可用于比对两个序列并确定两个序列之间的同源性的事实(Kruskal等人,"An overview of sequence comparison:Time warps,string edits,andmacromolecules"[“序列比较的概述：时间扭曲、串编辑与大分子”],(1983),Society forIndustrial and Applied Mathematics(SIAM)[工业与应用数学学会(SIAM)],第25卷,第2期,第201-237页以及由D.Sankoff和J.B.Kruskal(编辑)编辑的手册,"Time warps,stringedits and macromolecules:the theory and practice of sequence comparison"[“时间扭曲、串编辑与大分子：序列比较的理论与实践”],(1983),第1-44页,由Addison-WesleyPublishing Company,Massachusetts USA[美国马萨诸塞州的艾迪生-韦斯利出版公司]出版)。

可以使用尼德曼(Needleman)和翁施(Wunsch)算法对两个序列进行比对来确定两个氨基酸序列之间的同一性百分比。(Needleman等人"A General Method Applicable tothe Search for Similarities in the Amino Acid Sequence of Two Proteins"[“一种适用于寻找两种蛋白质的氨基酸序列的相似性的通用方法”](1970)J.Mol.Biol.[分子生物学杂志]第48卷,第443-453页)。该算法比对氨基酸序列以及核苷酸序列。尼德曼-翁施算法已经在计算机程序NEEDLE中实施。出于本发明的目的，使用来自EMBOSS包的NEEDLE程序(2.8.0版本或更高版本，参见Rice等人,"EMBOSS:The European Molecular Biology OpenSoftware Suite"[EMBOSS：欧洲分子生物学开放软件套件](2000),Trends in Genetics[遗传学趋势]第16卷,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列，使用EBLOSUM62作为取代矩阵。对于核苷酸序列，使用EDNAFULL。可以指定其他矩阵。用于氨基酸序列比对的任选的参数是空位开放罚分为10且空位扩展罚分为0.5。技术人员将理解，所有这些不同的参数都将产生稍微不同的结果，但是当使用不同的算法时，两个序列的总体同一性百分比没有显著改变。

同源性或同一性是两个完整序列之间在包括任何空位或扩展的总比对区域上相同匹配的百分比。如下计算两个比对序列之间的同源性或同一性：在比对中在两个序列中显示相同氨基酸的对应位置的数目除以包括空位的比对的总长度。如本文所定义的同一性可以从NEEDLE获得，并且在程序的输出中被标记为“同一性(IDENTITY)”。

如下计算两个比对序列之间的同源性或同一性：在比对中在两个序列中显示相同氨基酸的对应位置的数目除以在减去比对中的空位的总数后比对的总长度。如本文所定义的同一性可以通过使用NOBRIEF选项从NEEDLE获得，并且在程序的输出中被标记为“最长同一性(longest-identity)”。

也可以将本文公开的核苷酸或氨基酸序列的变体定义为与本文具体公开的核苷酸或氨基酸序列(例如，在序列表中)相比具有一个或多个取代、插入和/或缺失的核苷酸或氨基酸序列。

任选地，在确定氨基酸相似性程度时，技术人员还可以考虑所谓的“保守”氨基酸取代，这对于技术人员将是清楚的。保守氨基酸取代是指具有相似侧链的残基的互换性。例如，具有脂族侧链的一组氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸；具有脂族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸；具有含酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺；具有芳族侧链的一组氨基酸是苯丙氨酸、酪氨酸和色氨酸；具有碱性侧链的一组氨基酸是赖氨酸、精氨酸和组氨酸；并且具有含硫侧链的一组氨基酸是半胱氨酸和甲硫氨酸。在一个实施例中，保守氨基酸取代组是：缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的取代变体是所公开的序列中的至少一个残基已经被除去并且不同的残基插入其位置的变体。优选地，氨基酸变化是保守的。在一个实施例中，每种天然存在的氨基酸的保守取代如下：Ala至Ser；Arg至Lys；Asn至Gln或His；Asp至Glu；Cys至Ser或Ala；Gln至Asn；Glu至Asp；Gly至Pro；His至Asn或Gln；Ile至Leu或Val；Leu至Ile或Val；Lys至Arg；Gln或Glu；Met至Leu或Ile；Phe至Met、Leu或Tyr；Ser至Thr；Thr至Ser；Trp至Tyr；Tyr至Trp或Phe；以及Val至Ile或Leu。

本发明的核苷酸序列还可以由它们在中等杂交条件下或优选地在严格杂交条件下分别与本文公开的特定核苷酸序列的部分杂交的能力来定义。在本文中将严格杂交条件定义为这样的条件，其允许至少约25个核苷酸，优选约50个、75个或100个核苷酸，最优选约200个或更多个核苷酸的核酸序列在约65℃的温度下在包含约1M盐的溶液(优选6xSSC或具有相当的离子强度的任何其他溶液)中杂交，并且在65℃下在包含约0.1M或更少的盐的溶液(优选0.2x SSC或具有相当的离子强度的任何其他溶液)中洗涤。优选地，杂交进行过夜，即至少10小时；并且优选地，洗涤进行至少一小时，其中洗涤溶液至少更换两次。这些条件通常将允许具有约90％或更高序列同一性的序列的特异性杂交。在本文中将中等条件定义为这样的条件，其允许至少50个核苷酸、优选约200个或更多个核苷酸的核酸序列在约45℃的温度下在包含约1M盐的溶液(优选6x SSC或具有相当的离子强度的任何其他溶液)中杂交，并且在室温下在包含约1M盐的溶液(优选6x SSC或具有相当的离子强度的任何其他溶液)中洗涤。优选地，杂交进行过夜，即至少10小时；并且优选地，洗涤进行至少一小时，其中洗涤溶液至少更换两次。这些条件通常将允许具有高达50％序列同一性的序列的特异性杂交。本领域技术人员将能够修改这些杂交条件，以便特异性地鉴定同一性在50％与90％之间变化的序列。

“表达”是指基因转录成结构RNA(rRNA、tRNA)或信使RNA(mRNA)，随后翻译成蛋白质。

“过表达”是指重组细胞对基因(对应地核酸序列)的表达超过其在对应野生型细胞中的表达。这种过表达可以例如通过以下方式安排：增加一个或多个核酸序列的转录频率，例如通过将核酸序列可操作地连接到在重组细胞内有功能的启动子；和/或通过增加某个核酸序列的拷贝数。

术语“上调(upregulate)”、“上调(upregulated)”和“上调(upregulation)”是指细胞增加细胞组分(诸如RNA或蛋白质)的量的过程。这种上调可以响应于基因修饰或由基因修饰引起。

在本文中将术语“途径”或“代谢途径”理解为细胞中构建和分解分子的一系列化学反应。

核酸序列(即，多核苷酸)或蛋白质(即，多肽)对于宿主细胞的基因组可以是天然的或异源的。

关于宿主细胞的“天然”、“同源”或“内源”意指核酸序列确实天然存在于宿主细胞的基因组中，或者蛋白质由该细胞天然产生。术语“天然”、“同源”和“内源”在本文中可互换地使用。

如本文所用，“异源”可以指代核酸序列或蛋白质。例如，关于宿主细胞，“异源”可以指代不以该方式天然存在于宿主细胞的基因组中的多核苷酸，或者多肽或蛋白质不以该方式由该细胞天然产生。异源核酸序列是源自外来物种的核酸，或者如果来自相同物种，则通过故意的人为干预在组成和/或基因组基因座方面相对于其天然形式进行了实质修饰。例如，可操作地连接到天然结构基因的启动子来自与衍生出结构基因的物种不同的物种，或者如果来自相同物种，则一者或两者相对于其原始形式进行了实质修饰。异源蛋白可以源自外来物种，或者如果来自相同物种，则通过故意的人为干预相对于其原始形式进行了实质修饰。也就是说，异源蛋白表达涉及在宿主细胞中不以该方式天然表达的蛋白质的表达。术语“异源表达”是指在宿主细胞中表达异源核酸。异源蛋白在真核宿主细胞系统(诸如酵母)中的表达是本领域技术人员熟知的。包含编码具有特定活性的某种蛋白质或酶的基因的核酸序列的多核苷酸可以在这种真核系统中表达。在一些实施例中，转化/转染细胞可以用作表达酶的表达系统。异源蛋白在酵母中的表达是熟知的。Sherman,F.等人,Methodsin Yeast Genetics[酵母遗传学方法],(1986),由Cold Spring Harbor Laboratory[冷泉港实验室]出版是描述可用于在酵母中表达蛋白质的多种方法的公认的著作。两种广泛利用的酵母是酿酒酵母和巴斯德毕赤酵母(Pichia pastoris)。用于在酵母属和毕赤酵母属(Pichia)中表达的载体、菌株和方案是本领域已知的并且可从商业供应商(例如，英杰公司(Invitrogen))获得。合适的载体通常具有表达控制序列，诸如启动子(包括3-磷酸甘油酸激酶或醇氧化酶启动子)以及按需的复制起点、终止序列等。

如本文所用，“启动子”是指导(结构)基因或其他(部分的)核酸序列的转录的DNA序列。适当地，启动子位于基因的5'区，靠近(结构)基因的转录起始位点。启动子序列可以是组成型的、诱导型的或阻遏型的。在一个实施例中，不需要(外部)诱导物。

如本文所用，术语“载体”包括对常染色体表达载体和用于整合至染色体中的整合载体的提及。

术语“表达载体”是指包含编码目的多肽的区段的线性或环状的DNA分子，该区段在提供其转录的另外的核酸区段的控制下(即，与其可操作地连接)。此类另外的区段可以包括启动子和终止子序列，并且可以任选地包括一个或多个复制起点、一种或多种选择标记、增强子、多腺苷酸化信号等。表达载体通常衍生自质粒或病毒DNA，或者可以含有两者的元件。特别地，表达载体包含核酸序列，其在5'至3'方向上包含并且可操作地连接：(a)酵母识别的转录和翻译起始区，(b)目的多肽的编码序列，以及(c)酵母识别的转录和翻译终止区。

“质粒”是指自主复制的染色体外DNA，其不整合至微生物的基因组中并且通常在自然界中是环状的。

“整合载体”是指线性或环状的DNA分子，其可以掺入微生物的基因组中并且提供编码目的多肽的基因的稳定遗传。整合载体通常包含含有编码目的多肽的基因序列的一个或多个区段，该基因序列在提供其转录的另外的核酸区段的控制下(即，与其可操作地连接)。此类另外的区段可以包括启动子和终止子序列，以及驱动目的基因掺入靶细胞的基因组中(通常通过同源重组的方法)的一个或多个区段。典型地，整合载体将是可以转移至靶细胞中但具有在该生物体中无功能的复制子的载体。如果在该区段内包括适当的标记，则可以选择包含目的基因的区段的整合。

在本文中将“宿主细胞”理解为这样的细胞(诸如酵母细胞)，其将被编码一种或多种异源蛋白的一个或多个核酸序列转化以构建转化细胞(也称为重组细胞)。例如，转化细胞可以含有载体并且可以支持载体的复制和/或表达。

如本文所用，“转化(transformation)”和“转化(transforming)”是指外源多核苷酸插入宿主细胞中，而不考虑用于插入的方法，例如直接摄取、转导、f-接合或电穿孔。外源多核苷酸可以作为非整合载体(例如，质粒)维持，或者替代性地可以整合至宿主细胞基因组中。如本文所用，“转化(transformation)”和“转化(transforming)”是指外源多核苷酸(即，外源核酸序列)插入宿主细胞中，而不考虑用于插入的方法，例如直接摄取、转导、f-接合或电穿孔。外源多核苷酸可以作为非整合载体(例如，质粒)维持，或者替代性地可以整合至宿主细胞基因组中。

在本文中将“组成性表达(constitutive expression)”和“组成性地表达(constitutively expressing)”理解为存在核酸序列的连续转录。也就是说，核酸序列以持续的方式进行转录。组成性地表达的基因总是“开启”。

在本文中将“厌氧组成性表达”理解为核酸序列在厌氧条件下在生物体中组成性地表达。也就是说，在厌氧条件下，核酸序列以持续的方式进行转录，即在此类厌氧条件下，基因总是“开启”。

在本文中将“破坏”理解为对活性的任何破坏，包括但不限于被破坏的基因的亲和力和与这种被破坏的基因互补的RNA的表达的缺失、突变和降低。它包括所有核酸修饰，诸如核苷酸缺失或取代、基因敲除以及影响对应多肽的翻译或转录和/或影响酶(特定)活性、其底物特异性和/或或稳定性的其他行为。它还包括可以靶向基因的编码序列或启动子的修饰。基因破坏株(disruptant)是具有相应基因的一种或多种破坏的细胞。在本文中将对于酵母是天然的理解为基因在破坏前存在于酵母细胞中。

术语“编码(encoding)”具有与“编码(coding for)”相同的含义。因此，举例来说，“编码具有活性X的蛋白质的一个或多个基因(one or more genes encoding a proteinhaving activity X)”具有与“编码具有活性X的蛋白质的一个或多个基因(one or moregenes coding for a protein having activity X)”相同的含义。

就编码蛋白质或酶的基因或核酸序列而言，短语“编码X的核酸序列”(对应地“编码X的一个或多个核酸序列”)(其中X表示某种蛋白质或(酶)活性)具有与“编码具有X活性的蛋白质的核酸序列”(对应地“编码具有X活性的蛋白质的一个或多个核酸序列”)相同的含义。因此，举例来说，“编码转酮酶的一个或多个核酸序列”具有与“编码具有转酮酶活性的蛋白质的一个或多个核酸序列”相同的含义。如上文所指示，冠词“一个”是指“一个或多个”。

在本文中将“氧化还原汇(redox sink)”理解为代谢途径，其总体上消耗或氧化NADH为NAD+和/或阻止或减少NAD+消耗或还原为NADH。非天然代谢途径是在对应野生型细胞中不发生的代谢途径。因此，形成氧化还原汇的非天然代谢途径优选地是与对应野生型酵母细胞相比增加NADH消耗和/或减少NAD+消耗的非天然代谢途径。通过增加NADH消耗和/或减少NAD+消耗，可以在细胞内有利地产生(另外的)非天然氧化还原汇。

缩写“NADH”是指烟酰胺腺嘌呤二核苷酸的还原氢化形式。缩写“NAD+”是指烟酰胺腺嘌呤二核苷酸的氧化形式。烟酰胺腺嘌呤二核苷酸可以充当所谓的辅因子，辅助细胞中的生化反应和/或转化。

“NADH依赖性(NADH dependent)”或“NAD+依赖性(NAD+dependent)”在本文中等同于NADH特异性(NADH specific)，并且“NADH依赖性(NADH dependency)”或“NAD+依赖性(NAD+dependency)”在本文中等同于NADH特异性(NADH specificity)。

在本文中将“NADH依赖性”或“NAD+依赖性”酶理解为即与其他类型的辅因子相比仅依赖于作为辅因子的NADH/NAD+或主要依赖于作为辅因子的NADH/NAD+的酶。在本文中将“仅NADH/NAD+依赖性”酶理解为相对于NADPH/NADP+对NADH/NAD+具有绝对需求的酶。也就是说，它仅在将NADH/NAD+作为辅因子应用时才有活性。在本文中将“主要NADH/NDA+依赖性”酶理解为对作为辅因子的NADH/NAD+比对作为辅因子的NADPH/NADP+具有更高的特异性和/或更高的催化效率的酶。

酶的特异性特征可以通过以下公式来描述：

1<K_m NADP⁺/K_m NAD⁺<∞(无穷大)

其中K_m是所谓的米氏常数。

对于主要NADH依赖性酶，优选地，K_mNADP⁺/K_mNAD⁺在1与1000之间、在1与500之间、在1与200之间、在1与100之间、在1与50之间、在1与10之间、在5与100之间、在5与50之间、在5与20之间或在5与10之间。

使用已知的分析技术、计算和方案可以将本文的酶的K_m确定为分别针对NAD⁺和NADP+的酶特异性。这些例如在以下文献中有描述：Lodish等人,Molecular Cell Biology[分子细胞生物学]第6版,编辑Freeman,第80和81页,例如图3-图22。对于主要NADH依赖性酶，优选地，对作为辅因子的NADPH/NADP+的催化效率(k_cat/K_m)^NADP+与对作为辅因子的NADH/NAD+的催化效率(k_cat/K_m)^NAD+的比率(即，催化效率比率(k_cat/K_m)^NADP+:(k_cat/K_m)^NAD+)大于1:1，更优选等于或大于2:1，还更优选等于或大于5:1，甚至更优选等于或大于10:1，又甚至更优选等于或大于20:1，甚至还更优选等于或大于100:1，最优选等于或大于1000:1。没有上限，但是出于实际原因，主要NADH依赖性酶的催化效率比率(k_cat/K_m)^NADP+:(k_cat/K_m)^NAD+可以等于或小于1.000.000.000:1(即，1.10⁹:1)。

酵母细胞

重组酵母细胞优选地是酵母细胞，或者衍生自酵母细胞，来自酵母科(Saccharomycetaceae)的属或裂殖酵母科(Schizosaccharomycetaceae)的属。也就是说，优选地，衍生出重组酵母细胞的宿主细胞是来自酵母科的属或裂殖酵母科的属的酵母细胞。

合适的酵母细胞的示例包括酵母属，诸如酿酒酵母、真贝酵母(Saccharomyceseubayanus)、Saccharomyces jurei、巴氏酵母(Saccharomyces pastorianus)、Saccharomyces beticus、发酵性酵母(Saccharomyces fermentati)、奇异酵母(Saccharomyces paradoxus)、葡萄汁酵母(Saccharomyces uvarum)和贝酵母(Saccharomyces bayanus)。

合适的酵母细胞的示例进一步包括裂殖酵母属(Schizosaccharomyces)，诸如粟酒裂殖酵母、日本裂殖酵母(Schizosaccharomyces japonicus)、八孢裂殖酵母(Schizosaccharomyces octosporus)和嗜冷裂殖酵母(Schizosaccharomycescryophilus)。

其他示例性酵母包括有孢圆酵母属(Torulaspora)，诸如戴尔有孢圆酵母(Torulaspora delbrueckii)；克鲁维酵母属(Kluyveromyces)，诸如马克斯克鲁维酵母(Kluyveromyces marxianus)；毕赤酵母属，诸如树干毕赤酵母(Pichia stipitis)、巴斯德毕赤酵母或安格斯毕赤酵母；结合酵母属(Zygosaccharomyces)，诸如拜氏结合酵母(Zygosaccharomyces bailii)；酒香酵母属(Brettanomyces)，诸如间型酒香酵母(Brettanomyces inter medius)；布鲁塞尔酒香酵母(Brettanomyces bruxellensis)、异酒香酵母(Brettanomyces anomalus)、班图酒香酵母(Brettanomyces custersianus)、纳氏酒香酵母(Brettanomyces naardenensis)、南斯酒香酵母(Brettanomyces nanus)，布鲁塞尔德克酵母(Dekkera bruxellensis)和异型德克酵母(Dekkera anomala)；梅奇酵母属(Metschmkowia)，伊萨酵母属(Issatchenkia)，诸如东方伊萨酵母(Issatchenkiaorientalis)，克勒克酵母属(Kloeckera)，诸如柠檬形克勒克酵母(Kloeckeraapiculata)；以及短梗霉属(Aureobasidium)，诸如出芽短梗霉(Aureobasidiumpullulans)。

酵母细胞优选地是裂殖酵母属的酵母细胞(在本文中也称为裂殖酵母属酵母细胞)，或酵母属的酵母细胞(在本文中也称为酵母属酵母细胞)。更优选地，酵母细胞是衍生自酿酒酵母种的酵母细胞(在本文中也称为酿酒酵母细胞)。也就是说，优选地，衍生出重组酵母细胞的宿主细胞是来自酿酒酵母种的酵母细胞。

优选地，酵母细胞是工业酵母细胞。酵母细胞在工业过程中的生存环境与在实验室中的生存环境显著不同。工业酵母细胞必须能够在多种环境条件下表现良好，这些环境条件在过程中可以变化。此类变化包括营养源、pH、乙醇浓度、温度、氧气浓度等的变化，它们一起对酵母细胞的细胞生长和乙醇生产具有潜在的影响。可以将工业酵母细胞理解为指代当与实验室对应物相比时具有更稳健的性能的酵母细胞。也就是说，当与实验室对应物相比时，当选自营养源、pH、乙醇浓度、温度、氧气浓度的组的一种或多种环境条件在发酵过程中变化时，工业酵母细胞显示出更少的性能变化。优选地，酵母细胞是在作为宿主的工业酵母细胞的基础上构建的，其中构建如下文所述进行。工业酵母细胞的示例是Ethanol(弗曼蒂斯公司(Fermentis))、(帝斯曼公司(DSM))和(拉曼公司(Lallemand))。

本文所述的重组酵母细胞可以衍生自能够产生发酵产物的任何宿主细胞。优选地，宿主细胞是酵母细胞，更优选如上文所述的工业酵母细胞。优选地，本文所述的酵母细胞衍生自具有生产乙醇的能力的宿主细胞。

因此，本文所述的酵母细胞可以通过本领域技术人员已知合适的任何技术而衍生自宿主细胞。此类技术可以包括诱变、重组DNA技术(包括但不限于CRISPR-CAS技术)、选择性和/或适应性进化、接合、细胞融合和/或酵母菌株之间的胞导中的任何一种或多种。适当地，通过一种或多种以上技术的组合将一种或多种所需基因掺入酵母细胞中。

根据本发明的重组酵母细胞优选地是抑制剂耐受的，即它们可以在它们典型地具有的共同预处理和水解条件的水平下经受住共同的抑制剂，使得重组酵母细胞可用于广泛的应用，即它对于不同的原料、不同的预处理方法和不同的水解条件具有高适应性。在一个实施例中，重组酵母细胞是抑制剂耐受的。抑制剂耐受性是对抑制性化合物的抗性。木质纤维素中抑制性化合物的存在和水平可以随着原料、预处理方法、水解方法的变化而广泛变化。抑制剂类别的示例是羧酸、呋喃和/或酚类化合物。羧酸的示例是乳酸、乙酸或甲酸。呋喃的示例是糠醛和羟基-甲基糠醛。酚类化合物的示例是香草醛(vannilin)、丁香酸、阿魏酸和香豆酸。抑制剂的典型量，对于羧酸：为数克/升，高达20克/升或更多，取决于原料、预处理和水解条件。对于呋喃：为数百毫克/升，高达数克/升，取决于原料、预处理和水解条件。对于酚类：为数十毫克/升，高达一克/升，取决于原料、预处理和水解条件。

在一个实施例中，重组酵母细胞是天然能够进行酒精发酵、优选厌氧酒精发酵的细胞。重组酵母细胞优选地对乙醇具有高耐受性，对低pH(即，能够在低于约5、约4、约3或约2.5的pH下生长)和有机物具有高耐受性，和/或对升高的温度具有高耐受性。

甘油转运蛋白

重组酵母包含编码具有甘油转运蛋白活性的蛋白质的核酸序列。在本文中将甘油转运蛋白活性理解为跨重组酵母细胞的膜转运甘油的活性。

甘油转运蛋白可以适当地允许重组酵母细胞将甘油转运至细胞中，甘油是在培养基中外部可获得的(例如，来自玉米醪中的回流)或在内部细胞合成后分泌的。随后，重组酵母细胞可以在例如合适的甘油脱氢酶和/或合适的二羟基丙酮激酶的帮助下将甘油转化为乙醇。

具有甘油转运蛋白活性的蛋白质在本文中也被称为“甘油转运蛋白酶”、“甘油转运蛋白(glycerol transporter protein)”或被简称为“甘油转运蛋白(glyceroltransporter)”。具有甘油转运蛋白活性的蛋白质在本文中也缩写为“GT”。甘油转运蛋白和编码这种甘油转运蛋白的核酸序列的优选物如WO 2015/028583(通过援引并入本文)中所述。

如下文详细解释的，优选地，重组酵母细胞包含甘油-质子同向转运蛋白活性。也就是说，优选地，具有甘油转运蛋白活性的蛋白质是具有甘油-质子同向转运蛋白活性的蛋白质；并且优选地，编码具有甘油转运蛋白活性的蛋白质的核酸序列是编码具有甘油-质子同向转运蛋白活性的蛋白质的核酸序列。优选地，重组酵母细胞功能性地表达编码具有甘油-质子同向转运蛋白活性的蛋白质的这种核酸序列。还更优选地，重组酵母细胞包含编码具有甘油-质子同向转运蛋白活性的蛋白质的异源葡萄糖耐受基因，适当地允许重组酵母细胞功能性地表达这种蛋白质。

如今，已经鉴定出许多甘油转运蛋白(诸如通道蛋白、协同转运蛋白(facilitator)和同向转运蛋白)，对其进行了生化表征，并且已经克隆了对应基因(Neves等人,"Yeast orthologues associated with glycerol transport and metabolism",[“与甘油转运和代谢相关的酵母同源物”],(2004),FEMS Yeast Res.[FEMS酵母研究]第5卷,第51-62页以及Neves等人"New insights on glycerol transport in Saccharomycescerevisiae"[“酿酒酵母中的甘油转运新见”],(2004),FEBS Letters[欧洲生化学会联合会快报]565(2004)160-162，两者都通过援引并入本文)。

如WO 2015/028583中所解释的，在酿酒酵母的情况下，以下四个不同的基因已经牵涉于甘油转运(参见WO 2015/028583的表4，通过援引并入本文)：FPS1、GUP1、GUP2和STL1。

在WO 2015/028583中，选择了五种对于酿酒酵母异源的替代性的蛋白质。已表明在具有厌氧甘油和乙酸转化途径的菌株中过表达后，这些甘油转运蛋白(作为协同转运蛋白、通道蛋白、单向转运蛋白或同向转运蛋白)使得酵母细胞中的甘油摄取活性提高。

优选地，本发明中的重组酵母细胞功能性地表达如下表2中所列的一个或多个核酸序列和/或对应蛋白质，或者任何这些的具有以下核酸序列(对应地氨基酸序列)的功能性同源物，该核酸序列(对应地氨基酸序列)与如下表2中所列的具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％或99％核酸序列同一性(对应地氨基酸序列同一性)。具有甘油转运蛋白活性的一种或多种合适蛋白质的具体示例及其与首先列出的蛋白质的序列同一性总结于表3(a)至表3(e)中。

表2：优选的甘油转运蛋白和编码这些甘油转运蛋白的基因：

表3a)来自粟酒裂殖酵母的SPAC977.17和具有相似氨基酸序列同一性的蛋白质。

表3b)来自恶性疟原虫的CAC88373和具有相似氨基酸序列同一性的蛋白质。

表3c)来自斑马鱼的AQP9(NP_001171215)和具有相似氨基酸序列同一性的蛋白质。

表3d)来自热带爪蟾的NP_001087946和具有相似氨基酸序列同一性的蛋白质。

表3e)来自鲁氏结合酵母的ZYRO0E01210p和具有相似氨基酸序列同一性的蛋白质。

如上文所指示，重组酵母优选地包含甘油-质子同向转运蛋白活性。也就是说，重组酵母优选地包含编码具有甘油-质子同向转运蛋白活性的异源蛋白的一个或多个核酸序列。此类甘油-质子同向转运蛋白的一个优选的示例是STL1蛋白。STL1蛋白属于“糖转运蛋白样蛋白”的类别，并且可以经受葡萄糖诱导的失活。STL1蛋白是质膜的甘油-质子同向转运蛋白，当使细胞经受渗透休克时，它们可以被强烈但短暂地诱导。优选地，甘油转运蛋白是STL1蛋白；并且优选地，编码具有甘油转运蛋白活性的蛋白质的核酸序列是编码STL1蛋白的核酸序列。优选地，重组酵母细胞包含编码具有甘油转运蛋白活性的蛋白质的核酸序列，其中具有甘油转运蛋白活性的蛋白质是STL1蛋白，最优选衍生自鲁氏结合酵母的STL1蛋白。

更优选地，重组酵母包含编码具有甘油-质子同向转运蛋白活性的一种或多种异源蛋白的一个或多个葡萄糖耐受核酸序列。

优选地，具有甘油转运蛋白活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的氨基酸序列；或者

-SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的功能性同源物，该功能性同源物与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQID NO:5的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的功能性同源物，该功能性同源物当与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQID NO:5的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

更优选地，重组酵母包含(对应地功能性地表达)编码含有由SEQ ID NO:1、2、3、4或5表示，最优选由SEQ ID NO:5表示的氨基酸序列的蛋白质的核酸序列。

具有SEQ ID NO:3或SEQ ID NO:5的氨基酸序列的蛋白质及其功能性同源物是最优选的。

优选地，编码具有甘油转运蛋白活性的蛋白质的核酸序列包含以下或由以下组成：

-SEQ ID NO:6或SEQ ID NO:7的核酸序列；或者

-SEQ ID NO:6或SEQ ID NO:7的功能性同源物，该功能性同源物与SEQ ID NO:6或SEQ ID NO:7的核酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:6或SEQ ID NO:7的功能性同源物，该功能性同源物当与SEQ ID NO:6或SEQ ID NO:7的核酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:6或SEQ ID NO:7的核酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个核酸突变、取代、插入和/或缺失的功能性同源物。

更优选地，重组酵母包含葡萄糖耐受STL基因，最优选衍生自鲁氏结合酵母的STL1蛋白。

可以将编码甘油转运蛋白的核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中，例如如WO 2015/028583(通过援引并入本文)的实例中所述。

GT启动子

重组酵母细胞功能性地表达编码具有甘油转运蛋白活性的蛋白质的核酸序列，其中编码具有甘油转运蛋白活性的蛋白质的核酸序列的表达在启动子(“GT启动子”)的控制下，该GT启动子对甘油转运蛋白的厌氧/好氧表达比率为2或更高。用此适当地意指甘油转运蛋白(“GT”)在厌氧条件下的表达是在好氧条件下的表达的至少2倍。上述可以替代性地表述为重组酵母细胞功能性地表达编码甘油转运蛋白的一个或多个核酸序列，其中甘油转运蛋白在启动子(“GT启动子”)的控制下，该启动子的GT表达比率_{厌氧/好氧}为2或更高。

GT启动子可以适当地可操作地连接到编码具有甘油转运蛋白活性的蛋白质的核酸序列。优选地，GT启动子位于甘油转运蛋白基因的5'区；更优选地，它位于靠近甘油转运蛋白基因的转录起始位点。如上文所指示，甘油转运蛋白基因优选地是甘油-质子同向转运蛋白基因，更优选STL1基因。

优选地，GT启动子是ROX1受抑制的。在本文中ROX1是一种或多种缺氧基因的血红素依赖性阻遏物；其介导缺氧诱导基因(诸如COX5b和CYC7)的好氧转录抑制；阻遏物功能通过响应于氧化应激而降低启动子占有率来调控；并且含有负责DNA结合活性的HMG结构域；参与高渗应激抗性。ROX1受氧气调控。

不希望受任何类型的理论的限制，据信ROX1的调控可以起如下作用：根据Kwast等人,"Genomic Analysis of Anaerobically induced genes in Saccharomycescerevisiae:Functional roles of ROX1 and other factors in mediating the anoxicresponse"[“酿酒酵母中厌氧诱导基因的基因组分析：ROX1和其他因子在介导缺氧反应中的功能作用”],(2002),Journal of bacteriology[细菌学杂志]第184卷,第1期第250-265页，通过援引并入本文：“尽管Rox1以O2依赖性方式起作用，但其表达是氧气(血红素)依赖性的，由血红素依赖性转录因子Hap1激活[19]。因此，随着氧气水平下降至限制血红素生物合成的水平[20]，ROX1不再转录[21]，其蛋白质水平下降[22]，并且它调控的基因去抑制”。其他细节和合适的基序由以下文献提供：Keng,T.(1992),"HAP1 and ROX1 formaregulatory pathway in the repression of HEM13 transcription in Saccharomycescerevisiae"[“HAP1和ROX1在酿酒酵母中形成抑制HEM13转录的调控途径”],Mol.Cell.Biol.[分子与细胞生物学]12:第2616-2623页，以及Ter Kinde和de Steensma,"A microarray-assisted screen for potential Hap1 and Rox1 target genes inSaccharomyces cerevisiae"[“酿酒酵母中潜在的Hap1和Rox1靶基因的微阵列辅助筛选”],(2002),Yeast[酵母]19:第825-840页，通过援引并入本文。

优选地，GT启动子包含ROX1结合基序。GT启动子可以适当地包含一个或多个ROX1结合基序。

优选地，GT启动子可以在其核酸序列中包含基序NNNATTGTTNNN(由SEQ ID NO:8所展示)的拷贝或者一个或多个拷贝，其中“N”代表选自由以下组成的组的核酸：腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。

更优选地，GT启动子包含以下或由以下组成：与选自由以下组成的列表的基因的优选地天然的启动子的核酸序列相同的核酸序列：FET4、ANB1、YHR048W、DAN1、AAC3、TIR2、DIP5、HEM13、YNR014W、YAR028W、FUN57、COX5B、OYE2、SUR2、FRDS1、PIS1、LAC1、YGR035C、YAL028W、EUG1、HEM14、ISU2、ERG26、YMR252C和SML1，或其功能性同源物，该功能性同源物包含与以上项具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性的核酸序列。在本文中对天然启动子的提及是指对于宿主细胞是天然的启动子。

最优选地，根据本发明的重组酵母细胞是这样的重组酵母细胞，其中GT启动子是选自由以下组成的列表的基因的优选地天然的启动子：FET4、ANB1、YHR048W、DAN1、AAC3、TIR2、DIP5和HEM13，或其功能性同源物，该功能性同源物包含与以上项具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性的核酸序列。优选地，重组酵母细胞是重组酿酒酵母细胞；并且优选地，GT启动子是选自由以下组成的列表的酿酒酵母基因的天然启动子：FET4、ANB1、YHR048W、DAN1、AAC3、TIR2、DIP5、HEM13、YNR014W、YAR028W、FUN57、COX5B、OYE2、SUR2、FRDS1、PIS1、LAC1、YGR035C、YAL028W、EUG1、HEM14、ISU2、ERG26、YMR252C和SML1。

另外或在替代方案中，GT启动子优选地在其核酸序列中包含以下基序的一个或多个拷贝：TCGTTYAG和/或AAAAATTGTTGA(由SEQ ID NO:9所展示)，其中“Y”代表C或T。

GT启动子还可以包含这样的核酸序列或由其组成，该核酸序列与DAN、TIR或PAU基因的优选地天然的启动子的核酸序列相同。

优选地，GT启动子包含以下或由以下组成：与选自由以下组成的列表的基因的优选地天然的启动子的核酸序列相同的核酸序列：TIR2、DAN1、TIR4、TIR3、PAU7、PAU5、YLL064C、YGR294W、DAN3、YIL176C、YGL261C、YOL161C、PAU1、PAU6、DAN2、YDR542W、YIR041W、YKL224C、PAU3、YLL025W、YOR394W、YHL046C、YMR325W、YAL068C、YPL282C、PAU2和PAU4，或其功能性同源物，该功能性同源物包含与以上项具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性的核酸序列。在本文中对天然启动子的提及是指对于宿主细胞是天然的启动子。

优选地，重组酵母细胞是重组酿酒酵母细胞；并且优选地，GT启动子是选自由以下组成的列表的酿酒酵母基因的天然启动子：TIR2、DAN1、TIR4、TIR3、PAU7、PAU5、YLL064C、YGR294W、DAN3、YIL176C、YGL261C、YOL161C、PAU1、PAU6、DAN2、YDR542W、YIR041W、YKL224C、PAU3、YLL025W、YOR394W、YHL046C、YMR325W、YAL068C、YPL282C、PAU2和PAU4。

更适当地，GT启动子可以包含以下或由以下组成：与选自由以下组成的列表的基因的优选地天然的启动子的核酸序列相同的序列：TIR2、DAN1、TIR4、TIR3、PAU7、PAU5、YLL064C、YGR294W、DAN3、YIL176C、YGL261C、YOL161C、PAU1、PAU6、DAN2、YDR542W、YIR041W、YKL224C、PAU3和YLL025W，或其功能性同源物，该功能性同源物包含与以上项具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性的核酸序列。

更优选地，根据本发明的重组酵母细胞是这样的重组酵母细胞，其中GT启动子是选自由以下组成的列表的优选地天然的基因的优选地天然的启动子：FET4、ANB1、YHR048W、DAN1、AAC3、TIR2、DIP5和HEM13，或其功能性同源物，该功能性同源物包含与以上项具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性的核酸序列。

最优选地，重组酵母细胞是这样的重组酵母细胞，其中GT启动子是酿酒酵母的ANB1、DAN1或HEM13的天然启动子。

启动子在本文中也分别简单地缩写为ANB1启动子、DAN1启动子和HEM13启动子。

酿酒酵母ANB1启动子的核酸序列展示于SEQ ID NO:10中。酿酒酵母DAN1启动子的核酸序列展示于SEQ ID NO:11中。酿酒酵母HEM13启动子的核酸序列展示于SEQ ID NO:12中。

优选地，GT启动子包含以下或由以下组成：

-SEQ ID NO:10、SEQ ID NO:11或SEQ ID NO:12的核酸序列；或者

-SEQ ID NO:10、SEQ ID NO:11或SEQ ID NO:12的功能性同源物，该功能性同源物与SEQ ID NO:10、SEQ ID NO:11或SEQ ID NO:12的核酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:10、SEQ ID NO:11或SEQ ID NO:12的功能性同源物，该功能性同源物当与SEQ ID NO:10、SEQ ID NO:11或SEQ ID NO:12的核酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:10、SEQ ID NO:11或SEQ ID NO:12的核酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个核酸突变、取代、插入和/或缺失的功能性同源物。

GT启动子也可以是合成的寡核苷酸。也就是说，GT启动子可以是人工寡核苷酸合成的产物。人工寡核苷酸合成是合成生物学中用于在实验室中产生人工寡核苷酸(诸如基因)的方法。商业基因合成服务现在可从世界各地的许多公司获得，其中的一些已经围绕该任务建立了其商业模式。当前的基因合成方法最常基于有机化学和分子生物学技术的组合，并且可以“从头”合成整个基因，而无需前体模板DNA。

GT启动子的GT表达比率_厌氧/好氧优选地为2或更高，优选3或更高、4或更高、5或更高、6或更高、7或更高、8或更高、9或更高、10或更高、20或更高或者50或更高。也就是说，GT启动子的甘油转运蛋白的厌氧/好氧表达比率优选地为2或更高，优选3或更高、4或更高、5或更高、6或更高、7或更高、8或更高、9或更高、10或更高、20或更高或者50或更高。因此，优选地，甘油转运蛋白酶(“GT”)在厌氧条件下的表达是在好氧条件下的表达的至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少20倍或至少50倍。

没有上限，并且GT启动子可以是允许促进甘油转运蛋白基因仅在厌氧条件下表达而不在好氧条件下表达的GT启动子。也就是说，优选地，重组酵母细胞是这样的重组酵母细胞，其中GT启动子使得能够仅在厌氧条件下进行表达。

出于实际原因，可以考虑在等于或大于2至等于或小于10指数10(即，10¹⁰)或至或小于10指数4(即，10⁴)的范围内的GT表达比率厌氧^/ _好氧。

如上文所指示，本文的“表达”是指基因转录成结构RNA(rRNA、tRNA)或信使RNA(mRNA)，随后翻译成蛋白质。

可以例如通过测量在好氧和厌氧条件下生长的细胞的甘油转运蛋白(GT)蛋白质的量来确定GT表达比率。可以通过蛋白质组学来确定GT蛋白的量。

也可以通过测量在好氧和厌氧条件下(例如，在无细胞提取物中)生长的细胞的甘油转运蛋白(GT)活性来确定水平或甘油转运蛋白(GT)表达比率。

作为上述的附加或替代，可以通过测量在好氧和厌氧条件下生长的细胞的甘油转运蛋白基因的转录水平(例如，作为mRNA的量)来确定水平或GT表达比率。技术人员知道如何使用本领域通常已知的方法(例如，Q-PCR、实时PCR、RNA印迹、RNA-seq)来确定翻译水平。

GT启动子有利地使得甘油转运蛋白在厌氧条件下的表达能够高于在好氧条件下的表达。在根据本发明的方法中，重组酵母细胞优选地表达甘油转运蛋白，其中在厌氧条件下表达的甘油转运蛋白的量是在好氧条件下表达的甘油转运蛋白的量的倍数，并且其中该倍数优选地是2或更大，更优选3或更大、4或更大、5或更大、6或更大、7或更大、8或更大、9或更大、10或更大、20或更大或者50或更大。

甘油脱氢酶

重组酵母细胞还功能性地表达编码具有甘油脱氢酶活性的蛋白质的核酸序列。

重组酵母细胞可以包含NAD⁺依赖性甘油脱氢酶(EC 1.1.1.6)和/或NADP⁺依赖性甘油脱氢酶(EC 1.1.1.72)。也就是说，重组酵母细胞可以包含编码具有NAD⁺依赖性甘油脱氢酶活性的蛋白质(EC 1.1.1.6)的核酸序列和/或编码具有NADP⁺依赖性甘油脱氢酶活性的蛋白质(EC 1.1.1.72)的核酸序列。

优选地，具有甘油脱氢酶活性的蛋白质是具有NAD+依赖性甘油脱氢酶活性的蛋白质(EC 1.1.1.6)；并且优选地，重组酵母细胞功能性地表达编码具有NAD⁺依赖性甘油脱氢酶活性的蛋白质(EC 1.1.1.6)的核酸序列。这种蛋白质可以来自细菌来源或例如来自真菌来源。一个示例是来自大肠杆菌(E.coli)的gldA。

在一个替代性的或另外的实施例中，可以存在NADP⁺依赖性甘油脱氢酶(EC1.1.1.72)。

具有甘油脱氢酶活性的蛋白质在本文中也被称为“甘油脱氢酶蛋白”、“甘油脱氢酶(glycerol dehydrogenase enzyme)”或被简称为“甘油脱氢酶(glyceroldehydrogenase)”。以此类推，具有NAD+依赖性甘油脱氢酶活性的蛋白质在本文中也被称为“NAD+依赖性甘油脱氢酶蛋白”、“NAD+依赖性甘油脱氢酶(NAD+dependent glyceroldehydrogenase enzyme)”或被简称为“NAD+依赖性甘油脱氢酶(NAD+dependent glyceroldehydrogenase)”。甘油脱氢酶缩写为GLD。

甘油脱氢酶和编码这种甘油脱氢酶的核酸序列的优选物如WO 2015028582(通过援引并入本文)中所述。

NAD+依赖性甘油脱氢酶(EC 1.1.1.6)是催化以下化学反应的酶：

因此，该酶的两种底物是甘油和NAD⁺，而其三种产物是甘油酮、NADH和H⁺。甘油酮和二羟基丙酮在本文中是同义词。

该甘油脱氢酶属于氧化还原酶家族，特别是以NAD⁺或NADP⁺作为受体作用于供体的CH-OH基团的氧化还原酶。该酶类的系统名称是甘油:NAD⁺2-氧化还原酶。常用的其他名称包括甘油(glycerin)脱氢酶和NAD⁺依赖性甘油脱氢酶。该酶参与甘油脂代谢。甘油脱氢酶蛋白可以进一步由其氨基酸序列定义。同样地，甘油脱氢酶蛋白可以进一步由编码甘油脱氢酶蛋白的核苷酸序列定义。如上文在定义下详细解释的，由编码酶的核苷酸序列定义的某种甘油脱氢酶蛋白包括(除非另有限制)与编码甘油脱氢酶蛋白的这种核苷酸序列杂交的核苷酸序列。

优选地，编码具有甘油脱氢酶活性的蛋白质的核酸序列是异源核酸序列。优选地，具有甘油脱氢酶活性的蛋白质是具有NAD+依赖性甘油脱氢酶活性的异源蛋白。

如果重组酵母细胞包含编码甘油脱氢酶的一个或多个异源核酸序列，则重组酵母细胞优选地进一步包含合适的辅因子以增强甘油脱氢酶的活性。例如，重组酵母细胞可以包含锌、锌离子或锌盐和/或一种或多种将此等包括在细胞中的途径。

具有甘油脱氢酶活性的异源蛋白的合适的示例分别包括肺炎克雷伯菌、产气肠球菌、阿氏耶尔森菌和大肠杆菌的甘油脱氢酶蛋白。此类蛋白质的氨基酸序列已经分别由SEQID NO:13、SEQ ID NO:14、SEQ ID NO:15和SEQ ID NO:16展示。

优选的甘油脱氢酶蛋白是由来自大肠杆菌的gldA基因编码的甘油脱氢酶蛋白。SEQ ID NO:16示出了由来自大肠杆菌的gldA基因编码的该优选的NAD+依赖性甘油脱氢酶蛋白的氨基酸序列。大肠杆菌的gldA基因的核酸序列由SEQ ID NO:17展示。

因此，重组酵母细胞最优选地包含衍生自大肠杆菌的编码具有NAD+依赖性甘油脱氢酶活性的蛋白质(E.C.1.1.1.6)的异源核苷酸序列，任选地针对宿主细胞进行密码子优化，如SEQ ID NO:17中示出的核酸序列所示例。

因此，优选地，具有甘油脱氢酶活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的氨基酸序列；或者

-SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的功能性同源物，该功能性同源物与SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的功能性同源物，该功能性同源物当与SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15或SEQ ID NO:16的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

具有SEQ ID NO:16的氨基酸序列的蛋白质及其功能性同源物是最优选的。

优选地，编码具有甘油脱氢酶活性的蛋白质的核酸序列包含以下或由以下组成：

-SEQ ID NO:17的核酸序列；或者

-SEQ ID NO:17的功能性同源物，该功能性同源物与SEQ ID NO:17的核酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:17的功能性同源物，该功能性同源物当与SEQ ID NO:17的核酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:17的核酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个核酸突变、取代、插入和/或缺失的功能性同源物。

可以将编码甘油脱氢酶蛋白的核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中，例如如WO 2015/028583(通过援引并入本文)的实例中所述。

合适的甘油脱氢酶的其他示例列于表4(a)至表4(d)中。在每个表的顶部，提到了在实例中使用且经BLAST的gldA。

表4(a)：BLAST查询-来自大肠杆菌的gldA

表4(b)：BLAST查询-来自肺炎克雷伯菌的gldA

表4(c)：BLAST查询-来自产气肠球菌的gldA

表4(d)：BLAST查询-来自阿氏耶尔森菌的gldA

二羟基丙酮激酶

重组酵母细胞进一步功能性地表达编码具有二羟基丙酮激酶活性的蛋白质的核酸序列。

具有二羟基丙酮激酶活性的蛋白质在本文中也被称为“二羟基丙酮激酶蛋白”、“二羟基丙酮激酶(dihydroxyacetone kinase enzyme)”或被简称为“二羟基丙酮激酶(dihydroxyacetone kinase)”。二羟基丙酮激酶在本文中缩写为DAK。

二羟基丙酮激酶和编码这种二羟基丙酮激酶的核酸序列的优选物如WO2015028582(通过援引并入本文)中所述。

具有二羟基激酶活性的蛋白质可以适当地属于E.C.2.7.1.28和/或E.C.2.7.1.29的酶类别。因此，重组酵母细胞适当地功能性地表达编码具有二羟基丙酮激酶活性的蛋白质(E.C.2.7.1.28和/或E.C.2.7.1.29)的核酸序列。

在本文中将二羟基丙酮激酶优选地理解为催化以下化学反应的酶(EC2.7.1.29)：

和/或催化以下化学反应的酶(EC 2.7.1.28)：

二羟基丙酮激酶常用的其他名称包括甘油酮激酶、ATP:甘油酮磷酸转移酶和(磷酸化)丙酮醇激酶。应进一步理解，甘油酮和二羟基丙酮是相同的分子。二羟基丙酮激酶蛋白可以进一步由其氨基酸序列定义。同样地，二羟基丙酮激酶蛋白可以进一步由编码二羟基丙酮激酶蛋白的核苷酸序列定义。如上文在定义下详细解释的，由编码酶的核苷酸序列定义的某种二羟基丙酮激酶蛋白包括(除非另有限制)与编码二羟基丙酮激酶蛋白的这种核苷酸序列杂交的核苷酸序列。

优选地，重组酵母细胞功能性地表达编码具有二羟基丙酮激酶活性的天然蛋白的核酸序列。更优选地，编码具有二羟基丙酮激酶活性的蛋白质的核酸序列是天然核酸序列。

酵母包含二羟基丙酮激酶的两种天然同工酶(DAK1和DAK2)。根据本发明，这些天然二羟基丙酮激酶是优选的。优选地，宿主细胞是酿酒酵母细胞；并且优选地，以上天然二羟基丙酮激酶是酿酒酵母细胞的天然二羟基丙酮激酶。酿酒酵母的天然二羟基丙酮激酶蛋白DAK1和DAK2的氨基酸序列已经分别由SEQ ID NO:18和SEQ ID NO:19展示。

重组酵母细胞也可以功能性地表达编码具有二羟基丙酮激酶活性的蛋白质的核酸序列，其中核酸序列是异源核酸序列。在一个实施例中，重组酵母细胞包含编码二羟基丙酮激酶的异源基因。合适的异源基因包括编码来自以下的二羟基丙酮激酶的基因：库德里阿兹威酵母、拜氏结合酵母、乳酸克鲁维酵母、光滑假丝酵母(Candida glabrata)、解脂耶氏酵母、肺炎克雷伯菌、产气肠杆菌、大肠杆菌、解脂耶氏酵母、粟酒裂殖酵母、富氏葡萄孢盘菌(Botryotinia fuckeliana)和皮炎外瓶霉(Exophiala dermatitidis)。优选的具有二羟基丙酮激酶活性的异源蛋白包括分别衍生自肺炎克雷伯菌、解脂耶氏酵母和粟酒裂殖酵母的异源蛋白，如分别由SEQ ID NO:20、SEQ ID NO:21和SEQ ID NO:22所展示。

重组酵母细胞可以包含或可以不包含引起二羟基丙酮激酶过表达(例如，通过过表达编码具有二羟基丙酮激酶活性的蛋白质的核酸序列)的基因修饰。编码二羟基丙酮激酶的核苷酸序列对于细胞可以是天然的或异源的。可以用于在本发明的细胞中过表达二羟基丙酮激酶的核酸序列是例如来自酿酒酵母的二羟基丙酮激酶基因(DAK1)和(DAK2)，如例如以下文献所述：Molin等人,"Dihydroxy-acetone kinases in Saccharomycescerevisiae are involved in detoxification of dihydroxyacetone"[“酿酒酵母中的二羟基丙酮激酶参与二羟基丙酮的解毒”](2003),J.Biol.Chem.[生物化学杂志],第278卷:第1415-1423页，通过援引并入本文。

编码酿酒酵母中的二羟基丙酮激酶蛋白DAK1和DAK2的天然核酸序列已经分别由SEQ ID NO:23和SEQ ID NO:24展示。

优选地，重组酵母细胞包含增加细胞中任何二羟基丙酮激酶的比活性的基因修饰。例如，重组酵母细胞可以包含编码过表达的一种或多种天然和/或异源二羟基丙酮激酶蛋白(诸如DAK1和/或DAK2)的一个或多个天然和/或异源核酸序列。天然二羟基丙酮激酶(诸如DAK1和/或DAK2)可以例如经由一种或多种基因修饰过表达，使得编码二羟基丙酮激酶的基因的拷贝多于存在于非基因修饰的细胞中的拷贝，和/或可以应用非天然启动子。

优选地，重组酵母细胞是这样的重组酵母细胞，其中编码具有二羟基丙酮激酶活性的蛋白质的核酸序列的表达在启动子的控制下。启动子可以例如是对于宿主细胞中的另一个基因天然的启动子。

为了过表达编码二羟基丙酮激酶的核苷酸序列，也可以将核苷酸序列(待过表达)置于表达构建体中，其中它可操作地连接到合适的表达调控区/序列，以确保在将表达构建体转化至本发明的宿主细胞中后二羟基丙酮激酶的过表达(参见上文)。用于(过)表达编码具有二羟基丙酮激酶活性的酶的核苷酸序列的合适的启动子包括优选地对分解代谢物(葡萄糖)抑制不敏感和/或在厌氧条件下有活性的启动子。与除引起过表达的基因修饰外在遗传上相同的菌株相比，被过表达的二羟基丙酮激酶优选地被过表达至少1.1、1.2、1.5、2、5、10或20倍。优选地，与除引起过表达的基因修饰外在遗传上相同的菌株相比，二羟基丙酮激酶在厌氧条件下被过表达至少1.1、1.2、1.5、2、5、10或20倍。应理解，这些过表达水平可以适用于酶活性(细胞中的比活性)的稳态水平、酶蛋白的稳态水平以及细胞中编码酶的转录物的稳态水平。宿主细胞中核苷酸序列的过表达产生至少0.002、0.005、0.01、0.02或0.05Umin-1(mg蛋白质)-1的比二羟基丙酮激酶活性，在30℃下在转化宿主细胞的细胞提取物中确定，如例如WO 2013/081456的实例中所述。

最优选的二羟基丙酮激酶蛋白是由来自酿酒酵母的Dak1基因编码的二羟基丙酮激酶蛋白。SEQ ID NO:18示出了由来自酿酒酵母的Dak1基因编码的合适的二羟基丙酮激酶蛋白的氨基酸序列。SEQ ID NO:23展示了Dak1基因本身的核酸序列。

如果重组酵母细胞包含编码二羟基丙酮激酶的一个或多个过表达的核酸序列，则重组酵母细胞因此最优选地包含编码衍生自酿酒酵母的二羟基丙酮激酶的一个或多个过表达的核苷酸序列，如SEQ ID NO:23中示出的核酸序列所示例。

在一个优选的实施例中，二羟基丙酮激酶由内源基因(例如，DAK1基因)编码，该内源基因优选地置于组成型启动子的控制下。

因此，优选地，具有二羟基丙酮激酶活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21或SEQ ID NO:22的氨基酸序列；或者

-SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21或SEQ ID NO:22的功能性同源物，该功能性同源物与SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21或SEQ ID NO:22的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21或SEQ ID NO:22的功能性同源物，该功能性同源物当与SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21或SEQ ID NO:22的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21或SEQ ID NO:22的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

具有SEQ ID NO:18的氨基酸序列的蛋白质及其功能性同源物是最优选的。

优选地，编码具有二羟基丙酮激酶活性的蛋白质的核酸序列包含以下或由以下组成：

-SEQ ID NO:23或SEQ ID NO:24的核酸序列；或者

-SEQ ID NO:23或SEQ ID NO:24的功能性同源物，该功能性同源物与SEQ ID NO:23或SEQ ID NO:24的核酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:23或SEQ ID NO:24的功能性同源物，该功能性同源物当与SEQ IDNO:23或SEQ ID NO:24的核酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:23或SEQ ID NO:24的核酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个核酸突变、取代、插入和/或缺失的功能性同源物。

可以将编码二羟基丙酮激酶蛋白的核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中。

合适的二羟基丙酮激酶的示例列于表5(a)至表5(d)中。在每个表的顶部，提到了在实例中使用且经BLAST的DAK。

表5(a)：BLAST查询-来自酿酒酵母的DAK1

表5(b)：BLAST查询-来自肺炎克雷伯菌的dhaK

表5(c)：BLAST查询-来自解脂耶氏酵母的DAK1

表5(d)：BLAST查询-来自粟酒裂殖酵母的DAK1

氧化还原汇

优选地，重组酵母细胞可以进一步包含用于功能性地表达在形成非天然氧化还原汇的代谢途径中起作用的蛋白质的一种或多种基因修饰。

例如，这一种或多种基因修饰可以是用于编码一种或多种NAD+/NADH依赖性蛋白的一个或多个任选地异源的核酸序列的功能性表达的一种或多种基因修饰，这一种或多种蛋白质在将NADH转化为NAD+的代谢途径中起作用。存在此类代谢途径的几个示例，如下文进一步所展示。

例如，“用于功能性地表达在形成非天然氧化还原汇的代谢途径中起作用的蛋白质的一种或多种基因修饰”可以选自由以下组成的组：

a)包含以下或由以下组成的一种或多种基因修饰：

-编码包含磷酸转酮酶活性的蛋白质(EC 4.1.2.9或EC 4.1.2.22，PKL)的核酸序列；和/或

-编码具有磷酸转乙酰酶(PTA)活性的蛋白质(EC 2.3.1.8)的核酸序列；和/或

-编码具有乙酸激酶(ACK)活性的蛋白质(EC 2.7.2.12)的核酸序列；

和/或

b)包含以下或由以下组成的一种或多种基因修饰：

-编码具有核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)活性的蛋白质的核酸序列；和/或

-编码具有磷酸核酮糖激酶(PRK)活性的蛋白质的核酸序列；以及

-任选地，编码具有核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)活性的蛋白质的一种或多种分子伴侣的核酸序列；

和/或

c)包含以下或由以下组成的一种或多种基因修饰：

编码包含NADH依赖性乙酰化乙醛脱氢酶活性的蛋白质的核酸序列。

例如，WO 2014/081803描述了表达异源磷酸转酮酶、磷酸转乙酰酶或乙酸激酶和双功能性乙醛-醇脱氢酶的重组微生物，通过援引并入本文；并且WO 2015/148272描述了表达异源磷酸转酮酶、磷酸转乙酰酶和乙酰化乙醛脱氢酶的重组酿酒酵母菌株，通过援引并入本文。此外，WO 2018172328A1描述了可以包含编码具有磷酸转酮酶活性的酶的一个或多个(异源)基因的重组细胞。描述于WO 2014/081803、WO 2015/148272和WO 2018172328A1(全部通过援引并入本文)中的磷酸转酮酶(PKL)途径提供了将NADH转化为NAD+的优选的代谢途径，并且描述于其中的NADH依赖性磷酸转酮酶是用于本发明的优选的NADH依赖性蛋白。

Rubisco

如上文所指示，重组酵母细胞可以功能性地表达或可以不功能性地表达编码核酮糖-1,5-磷酸羧化酶/加氧酶(EC 4.1.1.39；Rubisco)和任选地Rubisco的一种或多种分子伴侣的一个或多个异源核酸序列。

更优选地，重组酵母细胞功能性地表达：

-编码具有核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)活性的蛋白质的异源核酸序列；和/或

-编码具有磷酸核酮糖激酶(PRK)活性的蛋白质的异源核酸序列；和/或

-任选地编码具有核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)活性的蛋白质的一种或多种分子伴侣的一个或多个异源核酸序列。

具有核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)活性的蛋白质在本文中也被称为“核酮糖-1,5-二磷酸羧化酶加氧酶(ribulose-1,5-biphosphate carboxylaseoxygenase)”、“核酮糖-1,5-二磷酸羧化酶加氧酶蛋白”、“核酮糖-1,5-二磷酸羧化酶加氧酶(ribulose-1,5-biphosphate carboxylase oxygenase enzyme)”、“Rubisco酶”、“Rubisco蛋白”或被简称为“Rubisco”。核酮糖-1,5-二磷酸羧化酶加氧酶可以进一步由其氨基酸序列定义。同样地，核酮糖-1,5-二磷酸羧化酶加氧酶可以进一步由编码核酮糖-1,5-二磷酸羧化酶加氧酶的核苷酸序列定义。如上文在定义下详细解释的，由编码酶的核苷酸序列定义的某种核酮糖-1,5-二磷酸羧化酶加氧酶包括(除非另有限制)与编码核酮糖-1,5-二磷酸羧化酶加氧酶的这种核苷酸序列杂交的核苷酸序列。Rubisco蛋白和编码这种Rubisco蛋白的核酸序列的优选物如WO 2014/129898(通过援引并入本文)中所述。

Rubisco蛋白可以适当地选自真核和原核Rubisco蛋白的组。Rubisco蛋白优选地来自非光养生物体。例如，Rubisco蛋白可以来自化能无机自养性微生物。用细菌Rubisco蛋白已经获得了良好的结果。优选地，Rubisco蛋白源自化能无机自养性的硫杆菌属(Thiobacillus)，特别是脱氮硫杆菌。

Rubisco蛋白可以是单亚基Rubisco蛋白或具有多于一个亚基的Rubisco蛋白。优选地，Rubisco蛋白是单亚基Rubisco蛋白。用作为所谓的II型Rubisco蛋白的Rubisco蛋白已经获得了良好的结果。用由cbbM基因(也称为CbbM)编码的Rubisco蛋白获得了尤其良好的结果。

优选的Rubisco蛋白是由来自脱氮硫杆菌的cbbM基因编码的Rubisco蛋白。SEQ IDNO:25示出了由来自脱氮硫杆菌的cbbM基因编码的合适的Rubisco蛋白的氨基酸序列。SEQID NO:26展示了来自脱氮硫杆菌的cbbM基因的核酸序列，针对酿酒酵母进行密码子优化。

因此，优选地，具有核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:25的氨基酸序列；或者

-SEQ ID NO:25的功能性同源物，该功能性同源物与SEQ ID NO:25的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:25的功能性同源物，该功能性同源物当与SEQ ID NO:25的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:25的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

优选地，编码具有核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)活性的蛋白质的核酸序列包含以下或由以下组成：

-SEQ ID NO:26的核酸序列；或者

-SEQ ID NO:26的功能性同源物，该功能性同源物与SEQ ID NO:26的核酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:26的功能性同源物，该功能性同源物当与SEQ ID NO:26的核酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:26的核酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个核酸突变、取代、插入和/或缺失的功能性同源物。

参考与SEQ ID NO:25的氨基酸序列的序列同一性，其他合适的Rubisco多肽的示例及其来源在WO 2014/129898(通过援引并入本文)的表1和下表6中给出。

可以将编码核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)蛋白的核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中，例如如在WO 2014/129898的实例和以下文章中所述：Guadalupe-Medina等人,"Carbon dioxide fixation by Calvin-Cycle enzymesimproves ethanol yield in yeast"[“由卡尔文循环酶固定二氧化碳提高了酵母中的乙醇产率”],发表于Biotechnol,Biofuels[生物燃料的生物技术],2013,第6卷,第125页，两者都通过援引并入本文。

表6：适于表达的天然Rubisco多肽

如上文所指示，至少在发酵方法中使用的过程中，Rubisco蛋白在重组酵母细胞中适当地功能性地表达。

编码Rubisco蛋白的核酸序列可以以一个、两个或更多个拷贝存在于重组酵母细胞中。不希望受任何类型的理论的约束，据信当编码Rubisco蛋白的核酸序列(例如，基因)以小于12个拷贝、更优选小于8个拷贝存在于重组酵母细胞中时，对重组酵母细胞的稳健性最好。因此，优选地，重组酵母细胞包含范围从等于或大于1个拷贝、更优选等于或大于2个拷贝至等于或小于7个拷贝、更优选等于或小于6个拷贝的编码Rubisco蛋白的核酸序列(例如，基因)。重组酵母细胞可以例如包含编码核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)的核酸序列的一个、两个、三个、四个、五个、六个或七个拷贝。

为了增加Rubisco蛋白在本发明的转化(重组)宿主细胞中以足够水平和活性形式表达的可能性，编码Rubisco蛋白和如本文所述的其他蛋白质(参见下文)的核酸序列优选地适于将其密码子使用优化为所讨论的宿主细胞的密码子使用。编码酶的核酸序列对宿主细胞的密码子使用的适应性可以表示为密码子适应指数(CAI)。在本文中将密码子适应指数定义为基因的密码子使用对特定宿主细胞或生物体中高表达的基因的密码子使用的相对适应性的测量值。每个密码子的相对适应性(w)是对于同一种氨基酸，每个密码子的使用与最高丰度密码子的使用的比率。将CAI指数定义为这些相对适应性值的几何平均值。排除非同义密码子和终止密码子(取决于遗传密码)。CAI值的范围从0至1，较高的值指示最高丰度的密码子的比例较高(参见Sharp和Li,"The codon adaptation index-a measure ofdirectional synonymous codon usage bias,and its potential applications"[“密码子适应指数-定向同义密码子使用偏倚的度量及其潜在应用”],(1987),发表于NucleicAcids Research[核酸研究]第15卷,第1281-1295页；还参见：Jansen等人,"Revisitingthe codon adaptation index from a whole-genome perspective:analyzing therelationship between gene expression and codon occurrence in yeast using avariety of models"[“从全基因组角度重新审视密码子适应指数：使用多种模型分析酵母中的基因表达和密码子出现之间的关系”],(2003),Nucleic Acids Res.[核酸研究]第31卷(8),第2242-51页)。适应的核酸序列的CAI优选地为至少0.2、0.3、0.4、0.5、0.6、0.7、0.8或0.9。优选地，序列已经针对在所讨论的真菌宿主细胞(例如像酿酒酵母细胞)中表达进行密码子优化。

优选地，功能性地表达的Rubisco蛋白的由核酮糖-1,5-二磷酸依赖性¹⁴C碳酸氢盐掺入细胞提取物的速率定义的活性为至少1nmol.min^-1.(mg蛋白质)^-1，特别地活性为至少2nmol.min^-1.(mg蛋白质)^-1，更特别地活性为至少4nmol.min^-1.(mg蛋白质)^-1。活性的上限不是关键的。实际上，活性可以为约200nmol.min^-1.(mg蛋白质)^-1或更低，特别是25nmol.min^-1.(mg蛋白质)^-1，更特别是15nmol.min^-1.(mg蛋白质)^-1或更低，例如约10nmol.min^-1.(mg蛋白质)^-1或更低。用于确定该Rubisco活性的测定的条件如WO 2014/129898(通过援引并入本文)的实例(例如，实例4)中所见。

磷酸核酮糖激酶

优选地，重组酵母细胞还功能性地表达编码具有磷酸核酮糖激酶(PRK)活性的蛋白质(EC 2.7.1.19；PRK)的异源核酸序列。

具有磷酸核酮糖激酶(PRK)活性的蛋白质在本文中也被称为“磷酸核酮糖激酶蛋白”、“磷酸核酮糖激酶(phosphoribulokinase enzyme)”、“磷酸核酮糖激酶(phosphoribulokinase)”、“PRK酶”、“PRK蛋白”或被简称为“PRK”。PRK蛋白和编码这种PRK蛋白的核酸序列的优选物如WO 2014/129898(通过援引并入本文)中所述。

根据本发明的功能性地表达的磷酸核酮糖激酶(PRK，(EC 2.7.1.19))能够催化以下化学反应：

因此，该酶的两种底物是ATP和D-核酮糖5-磷酸；其两种产物是ADP和D-核酮糖1,5-二磷酸。

PRK蛋白属于转移酶家族，特别是以醇基作为受体转移含磷基团的转移酶(磷酸转移酶)。该酶类的系统名称是ATP:D-核酮糖-5-磷酸1-磷酸转移酶。常用的其他名称包括磷酸戊糖激酶、核酮糖-5-磷酸激酶、磷酸戊糖激酶、磷酸核酮糖激酶(磷酸化)、5-磷酸核酮糖激酶、核酮糖磷酸激酶、PKK、PRuK和PRK。PRK酶参与碳固定。磷酸核酮糖激酶(PRK)蛋白可以进一步由其氨基酸序列定义。同样地，磷酸核酮糖激酶(PRK)蛋白可以进一步由编码磷酸核酮糖激酶(PRK)的核苷酸序列定义。如上文在定义下详细解释的，由编码酶的核苷酸序列定义的某种磷酸核酮糖激酶(PRK)包括(除非另有限制)与编码磷酸核酮糖激酶(PRK)的这种核苷酸序列杂交的核苷酸序列。

PRK可以来自原核生物或真核生物。用源自真核生物的PRK已经获得了良好的结果。优选地，PRK蛋白源自选自石竹目(Caryophyllales)、特别是选自苋科(Amaranthaceae)、更特别是选自菠菜属(Spinacia)的植物。

优选的PRK蛋白是来自菠菜属的PRK蛋白。SEQ ID NO:27示出了来自菠菜属的这种PRK蛋白的氨基酸序列。SEQ ID NO:28展示了来自菠菜的prk基因的核酸序列-针对酿酒酵母进行密码子优化。

因此，优选地，具有磷酸核酮糖激酶(PRK)活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:27的氨基酸序列；或者

-SEQ ID NO:27的功能性同源物，该功能性同源物与SEQ ID NO:27的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:27的功能性同源物，该功能性同源物当与SEQ ID NO:27的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:27的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

优选地，编码具有磷酸核酮糖激酶(PRK)活性的蛋白质的核酸序列包含以下或由以下组成：

-SEQ ID NO:28的核酸序列；或者

-SEQ ID NO:28的功能性同源物，该功能性同源物与SEQ ID NO:28的核酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:28的功能性同源物，该功能性同源物当与SEQ ID NO:28的核酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:28的核酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个核酸突变、取代、插入和/或缺失的功能性同源物。

可以将编码具有磷酸核酮糖激酶(PRK)活性的蛋白质的核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中，例如如WO 2014/129898(通过援引并入本文)的实例中所述。

参考与SEQ ID NO:27的氨基酸序列的序列同一性，合适的PRK多肽的示例及其来源在WO 2014/129898(通过援引并入本文)的表2和下表7中给出。

表7：适于表达的天然PRK多肽和与来自菠菜属的PRK的同一性

编码PRK蛋白的核酸序列可以在启动子(“PRK启动子”)的控制下，该启动子使得在厌氧条件下的表达能够高于在好氧条件下的表达。此类启动子的示例描述于WO 2017/216136A1和WO 2018/228836(两者都通过援引并入本文)中。更优选地，这种启动子的PRK表达比率厌氧/好氧优选地为2或更高、3或更高、4或更高、5或更高、6或更高、7或更高、8或更高、9或更高、10或更高、20或更高或者50或更高。其他优选物如WO 2018/228836(通过援引并入本文)中所述。

Rubisco分子伴侣

任选地，重组酵母细胞进一步包含编码具有核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)活性的蛋白质的一种或多种分子伴侣的一个或多个优选地异源的核酸序列。

适当地，此类分子伴侣在本文中也被称为“分子伴侣蛋白”、“伴侣蛋白”或被简称为“分子伴侣”。分子伴侣和编码此类分子伴侣的核酸序列的优选物如WO 2014/129898(通过援引并入本文)中所述。

优选地，重组酵母细胞包含编码具有核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)活性的蛋白质的一种或多种分子伴侣的一个或多个异源核酸序列。

伴侣蛋白是为其他蛋白质的正确折叠提供有利条件从而防止聚集的蛋白质。新产生的蛋白质通常必须从氨基酸的线性链折叠成三维形式。伴侣蛋白属于协助蛋白质折叠的一大类分子，称为分子伴侣。折叠蛋白质的能量由腺苷三磷酸(ATP)提供。以下文献撰写了一篇关于可用于本文的分子伴侣的综述文章：Yébenes等人,“Chaperonins:two rings forfolding”[“伴侣蛋白：两个用于折叠的环”](2011),Trends in Biochemical Sciences[生物化学科学趋势],第36卷,第8期,第424-432页，通过援引并入本文。

一种或多种分子伴侣可以是原核分子伴侣或真核分子伴侣。此外，分子伴侣可以是同源的或异源的。例如，重组酵母细胞可以包含编码一种或多种同源或异源的原核或真核的分子伴侣的一个或多个核酸序列，这些分子伴侣在表达时能够与重组酵母细胞中的酶、特别是与Rubisco和PRK中的至少一种功能性地相互作用。

适当地，一种或多种分子伴侣衍生自细菌，更优选衍生自埃希氏杆菌属(Escherichia)，特别是大肠杆菌。优选的分子伴侣是来自大肠杆菌的GroEL和GroES。其他优选的分子伴侣是来自酵母属的分子伴侣，特别是酿酒酵母Hsp10和Hsp60。

如果分子伴侣在诸如线粒体的细胞器中天然表达(示例是酿酒酵母的Hsp60和Hsp10)，则可以例如通过修饰伴侣蛋白的天然信号序列来实现至胞质溶胶的重新定位。在真核生物中，蛋白质Hsp60和Hsp10在结构和功能上分别与GroEL和GroES几乎相同。因此，设想到了来自任何重组酵母细胞的Hsp60和Hsp10都可以用作Rubisco的分子伴侣。这例如在以下文献中有描述：Zeilstra-Ryalls等人,"The universally conserved GroE(Hsp60)chaperonins"[“普遍保守的GroE(Hsp60)伴侣蛋白”],(1991),Annu Rev Microbiol.[微生物学年鉴]第45卷,第301-325页；以及Horwich等人,"Two Families of Chaperonin:Physiology and Mechanism"[“两个伴侣蛋白家族：生理学和机制”](2007),Annu.Rev.Cell.Dev.Biol.[细胞与发育生物学年评]第23卷,第115-145页，两者都通过援引并入本文。

用包含异源分子伴侣GroEL和GroES两者的重组酵母细胞已经获得了良好的结果。

作为GroES的替代物，可以存在GroES的功能性同源物，特别是包含与GroES的氨基酸序列(对应地SEQ ID NO:31的氨基酸序列)具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性的氨基酸序列的功能性同源物。

SEQ ID NO:31提供了基于大肠杆菌的GroES的优选的翻译蛋白序列。SEQ ID NO:32提供了基于来自大肠杆菌的GroES的合成的核酸序列，针对在酿酒酵母中表达进行密码子优化。

与GroES同源的合适的天然分子伴侣多肽的示例在表8中给出。

表8：适于表达的与GroES多肽同源的天然分子伴侣

作为GroEL的替代物，可以存在GroEL的功能性同源物，特别是包含与GroEL的氨基酸序列(对应地SEQ ID NO:29的氨基酸序列)具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性的氨基酸序列的功能性同源物。

SEQ ID NO:29提供了基于大肠杆菌的GroEL的优选的翻译蛋白序列。SEQ ID NO:30提供了基于来自大肠杆菌的GroEL的合成的核酸序列，针对在酿酒酵母中表达进行密码子优化。

与GroEL同源的合适的天然分子伴侣多肽在表9中给出。

表9：适于表达的与GroEL多肽同源的天然分子伴侣

重组酵母细胞优选地包含(对应地功能性地表达)GroES分子伴侣和GroEL分子伴侣。优选地，将来自表8的10kDa分子伴侣(“GroES”)与来自表9的相同生物体属或种的匹配的60kDa分子伴侣(“GroEL”)组合，用于在重组酵母细胞中表达。

例如：>gi|189189366|ref|XP_001931022.1|:71-168 10kDa伴侣蛋白[偃麦草核腔菌]与匹配的>gi|189190432|ref|XP_001931555.1|热休克蛋白60，线粒体的，前体[偃麦草核腔菌Pt-1C-BFP]一起表达。以相同生物体来源类似地产生的来自表8和表9的所有其他组合也都可供技术人员用于表达。此外，可以将来自表8的来自一种生物体的分子伴侣与来自表9的来自另一种生物体的分子伴侣组合，或者可以将GroES与来自表9的分子伴侣组合，或者可以将GroEL与来自表8的分子伴侣组合。

因此，优选地，一种或多种分子伴侣包含以下或由以下组成：

-SEQ ID NO:29和/或SEQ ID NO:31的氨基酸序列；或者

-SEQ ID NO:29和/或SEQ ID NO:31的一种或多种功能性同源物，该一种或多种功能性同源物分别与SEQ ID NO:29和/或SEQ ID NO:31的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:29和/或SEQ ID NO:31的一种或多种功能性同源物，该一种或多种功能性同源物当分别与SEQ ID NO:29和/或SEQ ID NO:31的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当分别与SEQ ID NO:29和/或SEQ ID NO:31的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的一种或多种功能性同源物。

优选地，编码分子伴侣的一个或多个核酸序列包含以下或由以下组成：

-SEQ ID NO:30和/或SEQ ID NO:32的核酸序列；或者

-SEQ ID NO:30和/或SEQ ID NO:32的一种或多种功能性同源物，该一种或多种功能性同源物分别与SEQ ID NO:30和/或SEQ ID NO:32的核酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:30和/或SEQ ID NO:32的一种或多种功能性同源物，该一种或多种功能性同源物当分别与SEQ ID NO:30和/或SEQ ID NO:32的核酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当分别与SEQ ID NO:30和/或SEQ ID NO:32的核酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个核酸突变、取代、插入和/或缺失的一种或多种功能性同源物。

可以将编码分子伴侣的一个或多个核酸序列适当地掺入重组酵母细胞的基因组中，例如如WO 2014/129898(通过援引并入本文)的实例中所述。

磷酸转酮酶

如上文所指示，重组酵母细胞可以包含编码含有磷酸转酮酶(PKL)活性的蛋白质(EC 4.1.2.9或EC 4.1.2.22)的优选地异源的核酸序列和/或编码具有磷酸转乙酰酶(PTA)活性的蛋白质(EC 2.3.1.8)的优选地异源的核酸序列和/或编码具有乙酸激酶(ACK)活性的蛋白质(EC 2.7.2.12)的优选地异源的核酸序列。

重组细胞可以包含编码具有磷酸转酮酶活性的蛋白质的一个或多个异源基因。这种具有磷酸转酮酶活性的蛋白质在本文中也被称为“磷酸转酮酶蛋白”、“磷酸转酮酶(phosphoketolase enzyme)”或被简称为“磷酸转酮酶(phosphoketolase)”。磷酸转酮酶在本文中进一步缩写为“PKL”或“XFP”。

如本文所用，磷酸转酮酶至少催化D-木酮糖5-磷酸转化为D-甘油醛3-磷酸和乙酰磷酸。磷酸转酮酶参与以下反应中的至少一种：

EC 4.1.2.9：

EC 4.1.2.22：

测量磷酸转酮酶活性的合适的酶测定描述于例如以下文献中：Sonderegger等人,"Metabolic Engineering of a Phosphoketolase Pathway for PentoseCatabolismin Saccharomyces cerevisiae"[“酿酒酵母中戊糖分解代谢的磷酸转酮酶途径的代谢工程”],(2004),Applied&Environmental Microbiology[应用与环境微生物学],第70卷(5),第2892-2897页，通过援引并入本文。

优选地，具有磷酸转酮酶(PKL)活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35或SEQ ID NO:36的氨基酸序列；或者

-SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35或SEQ ID NO:36的功能性同源物，该功能性同源物与SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35或SEQ ID NO:36的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35或SEQ ID NO:36的功能性同源物，该功能性同源物当与SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35或SEQ ID NO:36的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:33、SEQID NO:34、SEQ ID NO:35或SEQ ID NO:36的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

编码磷酸转酮酶蛋白的合适的核酸序列可以在选自以下的组的生物体中找到：黑曲霉、粗糙脉孢菌、干酪乳杆菌(L.casei)、植物乳杆菌(L.plantarum)、植物乳杆菌、青春双歧杆菌(B.adolescentis)、两歧双歧杆菌(B.bifidum)、高卢双歧杆菌(B.gallicum)、动物双歧杆菌(B.animalis)、乳酸双歧杆菌(B.lactis)、戊糖乳杆菌(L.pentosum)、嗜酸乳杆菌(L.acidophilus)、产黄青霉(P.chrysogenum)、构巢曲霉(A.nidulans)、棒曲霉(A.clavatus)、肠膜明串珠菌(L.mesenteroides)和酒类酒球菌(O.oenii)。

可以将编码具有磷酸转酮酶(PKL)活性的蛋白质的核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中。

重组细胞可以包含编码具有磷酸转酮酶活性的酶的一个或多个(异源)基因。

磷酸转乙酰酶

如本文所用，磷酸转乙酰酶至少催化乙酰磷酸转化为乙酰辅酶A。

重组细胞可以包含编码具有磷酸转乙酰酶活性的蛋白质的一个或多个异源基因。这种具有磷酸转乙酰酶活性的蛋白质在本文中也被称为“磷酸转乙酰酶蛋白”、“磷酸转乙酰酶(phosphotransacetylase enzyme)”或被简称为“磷酸转乙酰酶(phosphotransacetylase)”。磷酸转乙酰酶在本文中进一步缩写为“PTA”。

优选地，具有磷酸转乙酰酶(PTA)活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的氨基酸序列；或者

-SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的功能性同源物，该功能性同源物与SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的功能性同源物，该功能性同源物当与SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:37、SEQID NO:38、SEQ ID NO:39或SEQ ID NO:40的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

编码具有磷酸转乙酰酶的酶的合适的核酸序列可以在选自以下的组的生物体中找到：青春双歧杆菌、枯草芽孢杆菌(B.subtilis)、解纤维梭菌(C.cellulolyticum)、植物发酵梭菌(C.phytofermentans)、两歧双歧杆菌、动物双歧杆菌、肠膜明串珠菌、植物乳杆菌、嗜热毁丝霉(M.thermophila)和酒类酒球菌。

可以将编码具有磷酸转乙酰酶(PTA)活性的蛋白质的核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中。

乙酸激酶

如本文所用，乙酸激酶至少催化乙酸转化为乙酰磷酸。

重组细胞可以包含编码具有乙酸激酶活性的蛋白质(EC 2.7.2.12)的一个或多个优选地异源的基因。这种具有乙酸激酶活性的蛋白质在本文中也被称为“乙酸激酶蛋白”、“乙酸激酶(acetate kinase enzyme)”或被简称为“乙酸激酶(acetate kinase)”。乙酸激酶在本文中进一步缩写为“ACK”。

优选地，具有乙酸激酶(ACK)活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:41或SEQ ID NO:42的氨基酸序列；或者

-SEQ ID NO:41或SEQ ID NO:42的功能性同源物，该功能性同源物与SEQ ID NO:41或SEQ ID NO:42的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:41或SEQ ID NO:42的功能性同源物，该功能性同源物当与SEQ IDNO:41或SEQ ID NO:42的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:41或SEQ ID NO:42的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

可以将编码具有乙酸激酶(ACK)活性的蛋白质的核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中。

乙酰化乙醛脱氢酶

如上文所指示，重组酵母细胞可以有利地包含并功能性地表达编码含有NAD+依赖性乙酰化乙醛脱氢酶活性的蛋白质(EC 1.2.1.10)的优选地异源的核酸序列。

如果存在乙酰化乙醛脱氢酶，则更优选地，重组酵母细胞功能性地表达：

-编码包含NAD+依赖性乙酰化乙醛脱氢酶活性的蛋白质(EC 1.2.1.10)的优选地异源的核酸序列；以及

-编码具有NAD⁺依赖性醇脱氢酶活性的蛋白质(EC 1.1.1.1或EC 1.1.1.2)的适当地内源或异源的核酸序列；以及

-编码具有乙酰辅酶A合成酶活性的蛋白质(EC 6.2.1.1)的适当地内源或异源的核酸序列。

乙酰化乙醛脱氢酶是催化乙酰辅酶A转化为乙醛的酶(EC 1.2.1.10)。这种转化可以由以下平衡反应式表示：

乙酰辅酶A+NADH+H⁺<->乙醛+NAD⁺+辅酶A

具有乙酰化乙醛脱氢酶活性的蛋白质在本文中也被称为“乙酰化乙醛脱氢酶蛋白”、“乙酰化乙醛脱氢酶(acetylating acetaldehyde dehydrogenase enzyme)”或被简称为“乙酰化乙醛脱氢酶(acetylating acetaldehyde dehydrogenase)”。乙酰化乙醛脱氢酶和编码这种乙酰化乙醛脱氢酶的核酸序列的优选物如WO 2011/010923和WO 2019/063507(通过援引并入本文)中所述。

编码具有NAD⁺依赖性乙酰化乙醛脱氢酶活性的蛋白质(EC 1.2.1.10)的核酸序列优选地是异源核酸序列。因此，编码的NAD⁺依赖性乙酰化乙醛脱氢酶可以优选地是异源NAD⁺依赖性乙酰化乙醛脱氢酶。

具有乙酰化乙醛脱氢酶活性的蛋白质可以是单功能性的或双功能性的。

编码NAD⁺依赖性乙酰化乙醛脱氢酶的核酸序列原则上可以源自包含编码所述脱氢酶的核酸序列的任何生物体。已知的可以催化NADH依赖性地将乙酰辅酶A还原为乙醛的乙酰化乙醛脱氢酶通常可以分为以下三种类型的NAD+依赖性乙酰化乙醛脱氢酶功能性同源物：

1)催化乙酰辅酶A可逆地转化为乙醛、随后乙醛可逆地转化为乙醇的双功能性蛋白。这些类型的蛋白质有利地具有乙酰化乙醛脱氢酶活性以及醇脱氢酶活性两者。这种类型的蛋白质的一个示例是大肠杆菌中的AdhE蛋白(GenBank编号：NP_415757)。AdhE似乎是基因融合的进化产物。AdhE蛋白的NH₂末端区与醛:NAD+氧化还原酶高度同源，而COOH末端区与Fe²⁺依赖性乙醇:NAD+氧化还原酶家族同源(参见Membrillo-Hernandez等人,"Evolution of the adhE Gene Product of Escherichia coli from a FunctionalReductase to a Dehydrogenase"[“大肠杆菌的adhE基因产物从功能性还原酶向脱氢酶的进化”],(2000)J.BioI.Chem.[生物化学杂志]275:第33869-33875页，通过援引并入本文)。大肠杆菌AdhE经受金属催化的氧化，因此对氧气敏感(参见Tamarit等人"Identificationof the Major Oxidatively Damaged Proteins in Escherichia coli Cells Exposedto Oxidative Stress"[“暴露于氧化应激的大肠杆菌细胞中主要氧化损伤蛋白的鉴定”](1998)J.BioI.Chem.[生物化学杂志]273:第3027-3032页，通过援引并入本文)。

2)在严格或兼性厌氧微生物中催化乙酰辅酶A可逆地转化为乙醛但不具有醇脱氢酶活性的蛋白质。这种类型的蛋白质的一个示例已经在克氏梭菌(Clostridium kluyveri)中报道(参见Smith等人"Purification,Properties,and Kinetic Mechanism ofCoenzyme A-Linked Aldehyde Dehydrogenase from Clostridium kluyveri"[“来自克氏梭菌的辅酶A连接的醛脱氢酶的纯化、性质和动力学机制”](1980)Arch.Biochem.Biophys.[生物化学和生物物理学档案]第203卷:第663-675页，通过援引并入本文)。乙酰化乙醛脱氢酶(GenBank编号：EDK33116)已经在克氏梭菌DSM 555的基因组中注释。在植物乳杆菌的基因组中鉴定出同源蛋白AcdH(GenBank编号：NP_784141)。这种类型的蛋白质的另一个示例是在拜氏梭菌(Clostridium beijerinckii)NRRL B593中的所述基因产物(参见Toth等人"The ald Gene,Encoding a Coenzyme A-Acylating Aldehyde Dehydrogenase,Distinguishes Clostridium beijerinckii and Two Other Solvent-ProducingClostridia from Clostridium acetobutylicum"[“编码辅酶A-酰化醛脱氢酶的ald基因区分拜氏梭菌和其他两种产溶剂梭菌与丙酮丁醇梭菌”],(1999),Appl.Environ.Microbiol.[应用与环境微生物学]第65卷:第4973-4980页，GenBank编号：AAD31841，通过援引并入本文)。

3)作为参与4-羟基-2-酮戊酸分解代谢的双功能性醛缩酶-脱氢酶复合物的一部分的蛋白质。此类双功能性酶催化儿茶酚的间位裂解途径的最后两个步骤，儿茶酚是许多细菌物种中苯酚、甲苯酸酯、萘、联苯和其他芳族化合物的降解时的中间体(Powlowski和Shingler"Genetics and biochemistry of phenol degradation by Pseudomonassp.CF600"[“假单胞菌属物种CF600降解苯酚的遗传学与生物化学”](1994)Biodegradation[生物降解]第5卷,第219-236页，通过援引并入本文)。4-羟基-2-酮戊酸首先被4-羟基-2-酮戊酸醛缩酶转化为丙酮酸和乙醛，随后乙醛被乙酰化乙醛脱氢酶转化为乙酰辅酶A。这种类型的乙酰化乙醛脱氢酶的一个示例是假单胞菌属(Pseudomonas)物种CF600中的DmpF蛋白(GenBank编号：CAA43226)(Shingler等人,"Nucleotide Sequence andFunctional Analysis of the Complete Phenol/3,4-Dimethylphenol CatabolicPathway of Pseudomonas sp.Strain CF600"[“假单胞菌属物种菌株CF600的苯酚/3,4-二甲基苯酚分解代谢途径的核苷酸序列和功能分析”],(1992),J.Bacteriol.[细菌学杂志],第174卷,第711-724页，通过援引并入本文)。大肠杆菌MphF蛋白与假单胞菌属物种CF600中的DmpF蛋白同源(Ferrandez等人,"Genetic Characterization and Expression inHeterologous Hosts of the 3-(3-Hydroxyphenyl)Propionate Catabolic Pathway ofEscherichia coli K-12"[“大肠杆菌K-12的3-(3-羟基苯基)丙酸分解代谢途径的遗传表征及其在异源宿主中的表达”](1997)J.Bacteriol.[细菌学杂志]179:第2573-2581页，GenBank编号：NP_414885，通过援引并入本文)。

在一个优选的实施例中，具有乙酰化乙醛脱氢酶活性的蛋白质是双功能性的，并且包含NAD⁺依赖性乙酰化乙醛脱氢酶(EC 1.2.1.10)活性和NAD⁺依赖性醇脱氢酶(EC1.1.1.1或EC 1.1.1.2)活性两者。

合适的核酸序列特别可以在选自以下的组的生物体中找到：埃希氏杆菌属，特别是大肠杆菌；分枝杆菌属(Mycobacterium)，特别是海分枝杆菌(Mycobacterium marinum)、溃疡分枝杆菌(Mycobacterium ulcerans)、结核分枝杆菌(Mycobacteriumtuberculosis)；氧化碳嗜热菌属(Carboxydothermus)，特别是生氢氧化碳嗜热菌(Carboxydothermus hydrogenoformans)；内阿米巴属(Entamoeba)，特别是溶组织内阿米巴(Entamoeba histolytica)；志贺菌属(Shigella)，特别是宋内志贺菌(Shigellasonnei)；伯克霍尔德菌属(Burkholderia)，特别是类鼻疽伯克霍尔德菌(Burkholderiapseudo mallei)，克雷伯菌属(Klebsiella)，特别是肺炎克雷伯菌；固氮菌属(Azotobacter)，特别是棕色固氮菌(Azotobacter vinelandii)；固氮弧菌属(Azoarcus)物种；贪铜菌属(Cupriavidus)，特别是台湾贪铜菌(Cupriavidus taiwanensis)；假单胞菌属，特别是假单胞菌属物种CF600；Pelomaculum，特别是Pelotomaculumthermopropionicum。优选地，编码NAD⁺依赖性乙酰化乙醛脱氢酶的核酸序列源自埃希氏杆菌属，更优选地源自大肠杆菌。

特别合适的是来自大肠杆菌的mhpF基因或其功能性同源物。该基因描述于以下文献中：Ferrandez等人,"Genetic Characterization and Expression in HeterologousHosts of the 3-(3-Hydroxyphenyl)Propionate Catabolic Pathway of Escherichiacoli K-12"[“大肠杆菌K-12的3-(3-羟基苯基)丙酸分解代谢途径的遗传表征及其在异源宿主中的表达”](1997)J.Bacteriol.[细菌学杂志]179:第2573-2581页。用酿酒酵母已经获得了良好的结果，其中已经掺入了来自大肠杆菌的mhpF基因。在一个进一步有利的实施例中，编码(乙酰化)乙醛脱氢酶的核酸序列来自假单胞菌属，特别是例如来自假单胞菌属物种CF600的dmpF。

此外，乙酰化乙醛脱氢酶(或编码这种活性的核酸序列)可以例如选自以下的组：大肠杆菌adhE、溶组织内阿米巴adh2、金黄色葡萄球菌adhE、瘤胃壶菌属(Piromyces)物种E2 adhE、克氏梭菌EDK33116、植物乳杆菌acdH、大肠杆菌eutE、无害李斯特菌acdH和恶臭假单胞菌(Pseudomonas putida)YP 001268189。

优选地，具有NAD⁺依赖性乙酰化乙醛脱氢酶活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47或SEQ ID NO:48的氨基酸序列；或者

-SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47或SEQ ID NO:48的功能性同源物，该功能性同源物与SEQ ID NO:43、SEQ ID NO:44、SEQ IDNO:45、SEQ ID NO:46、SEQ ID NO:47或SEQ ID NO:48的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47或SEQ ID NO:48的功能性同源物，该功能性同源物当与SEQ ID NO:43、SEQ ID NO:44、SEQ IDNO:45、SEQ ID NO:46、SEQ ID NO:47或SEQ ID NO:48的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQID NO:46、SEQ ID NO:47或SEQ ID NO:48的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

最优选地，乙酰化乙醛脱氢酶蛋白是具有乙酰化乙醛脱氢酶活性以及醇脱氢酶活性两者的双功能性蛋白。

可以将编码具有乙酰化乙醛脱氢酶活性的蛋白质的核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中。

对于所列酶的BLAST，合适的酶的示例在下文的表10(a)至表10(e)中进一步展示，给出了合适的替代性的醇/乙醛脱氢酶。

表10(a)BLAST查询-来自大肠杆菌的adHE

表10(b)BLAST查询-来自植物乳杆菌的acdH

表10(c)BLAST查询-来自大肠杆菌的eutE

表10(d)BLAST查询-来自无害李斯特菌的Lin1129

表10(e)BLAST查询-来自金黄色葡萄球菌的adhE

乙酰辅酶A合成酶

如果重组酵母细胞功能性地表达具有乙酰化乙醛脱氢酶活性的蛋白质，则优选地，重组酵母细胞进一步功能性地表达：

-编码具有NAD⁺依赖性醇脱氢酶活性的蛋白质(EC 1.1.1.1或或EC 1.1.1.2)的核酸序列；和/或

-编码具有乙酰辅酶A合成酶活性的蛋白质(EC 6.2.1.1)的核酸序列。

具有乙酰辅酶A合成酶活性的蛋白质在本文中也可以被称为“乙酰辅酶A合成酶蛋白”、“乙酰辅酶A合成酶(acetyl-Coenzyme Asynthetase enzyme)”或被简称为“乙酰辅酶A合成酶(acetyl-Coenzyme A synthetase)”或甚至“乙酰辅酶A合成酶(acetyl CoAsynthetase)”。该蛋白质在本文中进一步缩写为“ACS”。

乙酰辅酶A合成酶(也称为乙酸-辅酶A连接酶或乙酰基活化酶)催化从乙酸、辅酶A(coenzyme A/CoA)和ATP形成乙酰辅酶A，如下所示：

ATP+乙酸+辅酶A＝AMP+二磷酸+乙酰辅酶A

应理解，重组酵母细胞可以天然包含编码乙酰辅酶A合成酶蛋白的内源基因。作为其替代或附加，重组酵母细胞可以包含编码具有乙酰辅酶A合成酶活性的蛋白质(EC6.2.1.1)的异源核酸序列。

例如，根据本发明的重组酵母细胞可以包含可存在于野生型细胞中的乙酰辅酶A合成酶，正如例如酿酒酵母的情况一样，酿酒酵母含有由ACS1(氨基酸序列展示为SEQ IDNO:49)和ACS2(氨基酸序列展示为SEQ ID NO:50)基因编码的两种乙酰辅酶A合成酶同工酶(van den Berg等人(1996)J.Biol.Chem.[生物化学杂志]271:第28953-28959页，通过援引并入本文)，或者宿主细胞可以提供有编码该活性的一个或多个异源基因，例如可以将酿酒酵母的ACS1和/或ACS2基因或其功能性同源物掺入缺乏乙酰辅酶A合成酶同工酶活性的细胞中。

优选地，具有NAD⁺依赖性乙酰辅酶A合成酶活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:49或SEQ ID NO:50的氨基酸序列；或者

-SEQ ID NO:49或SEQ ID NO:50的功能性同源物，该功能性同源物与SEQ ID NO:49或SEQ ID NO:50的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:49或SEQ ID NO:50的功能性同源物，该功能性同源物当与SEQ IDNO:49或SEQ ID NO:50的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:49或SEQ ID NO:50的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

优选地，重组酵母细胞是这样的重组酵母细胞，其中内源或异源的乙酰辅酶A合成酶蛋白被过表达，最优选地通过使用如例如WO 2011/010923(通过援引并入本文)中所述的合适的启动子。可以将编码具有乙酰辅酶A合成酶活性的蛋白质的任何异源核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中。

具有乙酰辅酶A合成酶活性的合适的蛋白质的示例列于表11中。在表11的顶部，提到了在实例中使用且经BLAST的ACS2。

表11：BLAST查询-来自酿酒酵母的ACS2

醇脱氢酶

具有醇脱氢酶活性的蛋白质在本文中也被称为“醇脱氢酶蛋白”、“醇脱氢酶(alcohol dehydrogenase enzyme)”或被简称为“醇脱氢酶(alcohol dehydrogenase)”。该蛋白质在本文中进一步缩写为“ADH”。

醇脱氢酶催化乙醛转化为乙醇。

应理解，重组酵母细胞可以天然包含编码醇脱氢酶蛋白的内源核酸序列。作为其替代或附加，重组酵母细胞可以包含编码具有醇脱氢酶活性的蛋白质的异源核酸序列

例如，重组酵母细胞可以天然包含编码醇脱氢酶的基因，正如酿酒酵母的情况一样(天然酿酒酵母醇脱氢酶ADH1、ADH2、ADH3、ADH4和ADH5的氨基酸序列分别展示为SEQ IDNO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54和SEQ ID NO:55)，参见Lutstorf和Megnet,"Multiple Forms of Alcohol Dehydrogenase in Saccharomyces Cerevisiae"[“酿酒酵母中的多种形式的醇脱氢酶”],(1968),Arch.Biochem.Biophys.[生物化学和生物物理学档案],第126卷,第933-944页，通过援引并入本文；或Ciriacy,"Genetics ofAlcohol Dehydrogenase in Saccharomyces cerevisiae I.Isolation and geneticanalysis of adh mutants"[“酿酒酵母中醇脱氢酶的遗传学I.adh突变体的分离和遗传分析”],(1975),Mutat.Res.[突变研究]29,第315-326页，通过援引并入本文)。

然而，优选地，重组酵母细胞在具有乙酰化乙醛脱氢酶活性以及醇脱氢酶活性两者的适当地异源的双功能性酶内包含醇脱氢酶活性，如上文所述。也就是说，最优选地，醇脱氢酶蛋白是具有乙酰化乙醛脱氢酶活性以及醇脱氢酶活性两者的双功能性蛋白。当重组酵母细胞包含编码具有乙酰化乙醛脱氢酶活性以及醇脱氢酶活性两者的双功能性蛋白的异源核酸序列时，编码编码醇脱氢酶活性的任何天然蛋白的任何天然核酸序列都可以被破坏和/或缺失或可以不被破坏和/或缺失。

因此，重组酵母细胞可以有利地是功能性地表达以下的重组酵母细胞：

-编码具有以下活性的双功能性蛋白的一个或多个异源核酸序列：NAD⁺依赖性乙酰化乙醛脱氢酶活性(EC 1.2.1.10)；和NAD⁺依赖性醇脱氢酶活性(EC 1.1.1.1或EC1.1.1.2)；以及

-编码具有乙酰辅酶A合成酶活性的蛋白质(EC 6.2.1.1)的一个或多个天然或异源的核酸序列，

其中任选地，编码具有NAD⁺依赖性醇脱氢酶活性的蛋白质(EC 1.1.1.1或EC1.1.1.2)的一个或多个天然核酸序列被破坏或缺失。

替代性地，重组酵母细胞可以有利地是功能性地表达以下的重组酵母细胞：

-编码具有NAD⁺依赖性乙酰化乙醛脱氢酶活性的单功能性蛋白(EC 1.2.1.10)的一个或多个天然或异源的核酸序列；以及

-编码具有乙酰辅酶A合成酶活性的蛋白质(EC 6.2.1.1)的一个或多个天然或异源的核酸序列；以及

-编码具有NAD⁺依赖性醇脱氢酶活性的蛋白质(EC 1.1.1.1或EC 1.1.1.2)的一个或多个天然或异源的核酸序列。

上文提供了双功能性蛋白的优选物，并且如针对乙酰化乙醛脱氢酶蛋白所列。如果该蛋白质不是双功能性的，则NAD⁺依赖性醇脱氢酶蛋白优选地是具有NAD⁺依赖性醇脱氢酶活性的蛋白质，其包含以下或由以下组成：

-SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54或SEQ ID NO:55的氨基酸序列；或者

-SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54或SEQ ID NO:55的功能性同源物，该功能性同源物与SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54或SEQ ID NO:55的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54或SEQ ID NO:55的功能性同源物，该功能性同源物当与SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54或SEQ ID NO:55的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54或SEQ ID NO:55的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

可以将编码具有NAD⁺依赖性醇脱氢酶活性的蛋白质的任何异源核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中。

甘油3-磷酸磷酸水解酶和/或甘油3-磷酸脱氢酶的缺失或破坏

重组酵母细胞进一步可以包含或可以不包含编码甘油3-磷酸磷酸水解酶基因和/或编码甘油3-磷酸脱氢酶基因的一个或多个内源核苷酸序列的缺失或破坏。

优选地，降低或缺失酵母细胞中NADH依赖性甘油合成所需的酶活性。甘油3-磷酸磷酸水解酶和/或甘油3-磷酸脱氢酶的酶活性的降低或缺失可以通过以下方式来实现：修饰编码NAD依赖性甘油3-磷酸脱氢酶(GPD)的一个或多个基因和/或编码甘油磷酸磷酸酶(GPP)的一个或多个基因，使得酶的表达大大低于野生型或使得基因编码活性降低的多肽。此类修饰可以使用通常已知的生物技术进行，并且可以特别地包括编码GPD和/或GPP的结构基因的启动子区或编码区的一个或多个敲除突变或定点诱变。替代性地，可以通过随机诱变、然后选择GPD和/或GPP活性降低或不存在的菌株来获得甘油生产有缺陷的酵母菌株。酿酒酵母GPD1、GPD2、GPP1和GPP2基因示于WO 2011010923中，并且公开于该申请的SEQ IDNO:24-27中。

优选地，重组酵母是这样的重组酵母，其进一步包含甘油-3-磷酸脱氢酶(GPD)基因的缺失或破坏。甘油磷酸磷酸酶(GPP)基因中的一个或多个可以被缺失或破坏或可以不被缺失或破坏。

更优选地，重组酵母是这样的重组酵母，其包含甘油-3-磷酸脱氢酶1(GPD1)基因的缺失或破坏。甘油-3-磷酸脱氢酶2(GPD2)基因可以被缺失或破坏或可以不被缺失或破坏。

最优选地，重组酵母是这样的重组酵母，其包含甘油-3-磷酸脱氢酶1(GPD1)基因的缺失或破坏，而甘油-3-磷酸脱氢酶2(GPD2)基因保持活性和/或完整。因此，优选地，酿酒酵母GPD1、GPD2、GPP1和GPP2基因中的仅一个被破坏和缺失，而最优选地，仅选自由GPD1、GPD2、GPP1和GPP2基因组成的组的GPD1被破坏或缺失。

不希望受任何类型的理论的约束，据信根据本发明的重组酵母(其中GPD1基因而不是GPD2基因被缺失或破坏)当应用于以下发酵方法中时可以是有利的，在该发酵方法中葡萄糖在发酵开始时或发酵过程中优选地等于或大于80g/L，更优选等于或大于90g/L，甚至更优选等于或大于100g/L，还更优选等于或大于110g/L，又甚至更优选等于或大于120g/L、等于或大于130g/L、等于或大于140g/L、等于或大于150g/L、等于或大于160g/L、等于或大于170g/L或者等于或大于180g/L。

优选地，至少一个编码GPD的基因和/或至少一个编码GPP的基因被完全缺失，或者编码对其活性必需的酶的一部分的基因的至少一部分被缺失。用酿酒酵母细胞可以获得良好的结果，其中GPD1基因和/或GPD2基因的可读框已经失活。结构基因(靶基因)的失活可以由本领域技术人员通过合成地合成或以其他方式构建由侧翼为这样的DNA序列的选择标记基因组成的DNA片段来完成，这些DNA序列与待缺失的宿主细胞基因组区域侧翼的序列相同。适当地，通过整合标记基因kanMX和hphMX4使酿酒酵母中的GPD1和GPD2基因失活可以获得良好的结果。随后，将该DNA片段转化到宿主细胞中。例如通过诊断性聚合酶链式反应或DNA杂交，检查表达显性标记基因的转化细胞是否正确替换了被设计待缺失的区域。

因此，在本发明的重组酵母细胞中，可以有利地降低细胞中的甘油3-磷酸磷酸水解酶活性和/或细胞中的甘油3-磷酸脱氢酶活性。

葡糖淀粉酶

优选地，重组酵母细胞进一步功能性地表达编码葡糖淀粉酶(EC 3.2.1.20或3.2.1.3)的核酸序列。

具有葡糖淀粉酶活性的蛋白质在本文中也被称为“葡糖淀粉酶(glucoamylaseenzyme)”、“葡糖淀粉酶蛋白”或被简称为“葡糖淀粉酶(glucoamylase)”。葡糖淀粉酶在本文中已经缩写为“GA”。

葡糖淀粉酶(也称为淀粉葡糖苷酶、α-葡糖苷酶、葡聚糖1,4-α葡糖苷酶、麦芽糖酶葡糖淀粉酶和麦芽糖酶-葡糖淀粉酶)至少催化末端1,4连接的α-D-葡萄糖残基从直链淀粉链的非还原端水解，以释放游离D-葡萄糖。葡糖淀粉酶可以进一步由其氨基酸序列定义。同样地，葡糖淀粉酶可以进一步由编码葡糖淀粉酶的核苷酸序列定义。如上文在定义下详细解释的，由编码酶的核苷酸序列定义的某种葡糖淀粉酶包括(除非另有限制)与编码葡糖淀粉酶的这种核苷酸序列杂交的核苷酸序列。

优选地，具有葡糖淀粉酶活性的蛋白质包含以下或由以下组成：

-SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的氨基酸序列；或者

-SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的功能性同源物，该功能性同源物与SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的氨基酸序列具有至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性；或者

-SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的功能性同源物，该功能性同源物当与SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的氨基酸序列相比时具有一个或多个突变、取代、插入和/或缺失，更优选当与SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的氨基酸序列相比时具有不超过300个、不超过250个、不超过200个、不超过150个、不超过100个、不超过75个、不超过50个、不超过40个、不超过30个、不超过20个、不超过10个或不超过5个氨基酸突变、取代、插入和/或缺失的功能性同源物。

SEQ ID NO:56的多肽编码“成熟葡糖淀粉酶”，其是指在翻译和任何翻译后修饰(诸如N末端处理、C末端截短、糖基化、磷酸化等)后呈其最终形式的酶。

在一个实施例中，核苷酸序列编码具有SEQ ID NO:57的氨基酸序列的多肽或其变体，该变体与SEQ ID NO:57的氨基酸序列具有至少50％，优选至少60％、70％、75％、80％、85％、90％、95％、98％或99％的氨基酸序列同一性。SEQ ID NO:57的氨基酸1-17可以编码天然信号序列。

在另一个实施例中，允许表达葡糖淀粉酶的核苷酸序列编码具有SEQ ID NO:58的氨基酸序列的多肽或其变体，该变体与SEQ ID NO:58的氨基酸序列具有至少50％，优选至少60％、70％、75％、80％、85％、90％、95％、98％或99％的氨基酸序列同一性。SEQ ID NO:58的氨基酸1-19可以编码信号序列。

信号序列(也称为信号肽、靶向信号、定位信号、定位序列、转运肽、前导序列或前导肽)可以存在于多肽(此处为葡糖淀粉酶)的N末端，在此处它发出多肽将被分泌(例如，分泌到细胞外和培养基中)的信号。

可以将编码具有葡糖淀粉酶活性的蛋白质的核酸序列(例如，基因)适当地掺入重组酵母细胞的基因组中。

硝酸盐还原酶

重组酵母细胞还可以有利地包含(对应地功能性地表达)编码具有NADH依赖性硝酸盐还原酶活性的酶的核酸序列和/或编码具有NADH依赖性亚硝酸盐还原酶活性的酶的核酸序列。在2020年10月5日向美国专利局提交的非预先公开的美国专利申请US 63087642中已经描述了表达这种替代性的氧化还原汇的细节，将其内容通过援引并入本文。

硝酸盐还原酶(NR)催化硝酸盐(NO₃ ^-)还原为亚硝酸盐(NO₂ ^-)。亚硝酸盐还原酶催化亚硝酸盐还原为氨(NH₃)。硝酸盐还原酶和/或亚硝酸盐还原酶可以是某些细胞中所谓的氮同化途径的一部分。包含硝酸盐还原酶活性和/或亚硝酸盐还原酶活性的细胞包括某些植物细胞和细菌细胞以及少数酵母细胞。正如Linder所指出的那样，在芽殖酵母中，同化除氨以外的无机氮源的能力被认为是罕见的。天然能够同化硝酸盐或亚硝酸盐的少数真菌包括食腺嘌呤芽生葡萄孢酵母(Blastobotrys adeninivorans)(毛红曲霉科(Trichomonascaceae))、博伊丁假丝酵母(Candida boidinii)(毕赤酵母科(Pichiaceae))、杰丁塞伯林德纳氏酵母(Cyberlindnera jadinii)(法夫酵母科(Phaffomycetaceae))和多形汉逊酵母(Ogataea polymorpha)(毕赤酵母科)。

优选地，如本文所述的重组酵母细胞包含编码NADH依赖性硝酸盐还原酶的至少一个或多个基因。

在本文中将NADH依赖性硝酸盐还原酶理解为仅依赖于作为辅因子的NADH或主要依赖于作为辅因子的NADH的硝酸盐还原酶。优选地，NADH依赖性硝酸盐还原酶的对作为辅因子的NADPH/NADP+的催化效率(k_cat/K_m)^NADP+与对作为辅因子的NADH/NAD+的催化效率(k_cat/K_m)^NAD+的比率(即，催化效率比率(k_cat/K_m)^NADP+:(k_cat/K_m)^NAD+)大于1:1，更优选等于或大于2:1，还更优选等于或大于5:1，甚至更优选等于或大于10:1，又甚至更优选等于或大于20:1，甚至还更优选等于或大于100:1，最优选等于或大于1000:1。没有上限，但是出于实际原因，NADH依赖性硝酸盐还原酶的催化效率比率(k_cat/K_m)^NADP+:(k_cat/K_m)^NAD+可以等于或小于1.000.000.000:1(即，1.10⁹)。最优选地，NADH依赖性硝酸盐还原酶仅依赖于作为辅因子的NADH/NAD+。也就是说，最优选地，NADH依赖性硝酸盐还原酶绝对需要作为辅因子的NADH/NAD+，而不是作为辅因子的NADPH/NADP+。

优选地，NADH依赖性硝酸盐还原酶是酶分类EC 1.7.1.1(即，具有EC编号EC1.7.1.1)或酶分类EC.1.6.6.1(即，具有EC编号1.6.6.1)的NADH依赖性硝酸盐还原酶。适当地，NADH依赖性硝酸盐还原酶(也称为NADH依赖性硝酸盐氧化还原酶)是至少催化以下化学反应的酶：

硝酸盐+NADH+H⁺→亚硝酸盐+NAD⁺+H₂O

合适的NADH依赖性硝酸盐还原酶可以包括如获自或衍生自以下的一种或多种NADH依赖性硝酸盐还原酶：麦仙翁(Agrostemma githago)、绿穗苋(Amaranthushybridus)、三色苋(Amaranthus tricolor)、布朗纤维藻(Ankistrodesmus braunii)、拟南芥、黑曲霉、构巢曲霉、Auxenochlorella pyrenoidosa、慢生根瘤菌属(Bradyrhizobium)物种、慢生根瘤菌属物种750、芥菜(Brassica juncea)、甘蓝(Brassica oleracea)、野茶树(Camellia sinensis)、博伊丁假丝酵母、产朊假丝酵母(Candida utilis)、辣椒(Capsicumfrutescens)、藜(Chenopodium album)、杰丁塞伯林德纳氏酵母、芥菜、甘蓝、野茶树、辣椒、藜、莱茵衣藻(Chlamydomonas reinhardtii)、暗色小球藻(Chlorella fusca)、小球藻属(Chlorella)物种、小球藻属柏林物种(Chlorella sp.Berlin)、普通小球藻(Chlorellavulgaris)、威氏海链藻(Conticribra weissflogii)、黄瓜(Cucumis sativus)、笋瓜(Cucurbita maxima)、西葫芦(Cucurbita pepo)、南瓜属(Cucurbita)物种、盐生杜氏藻(Dunaliella tertiolecta)、赫氏圆石藻(Emiliania huxleyi)、构巢裸胞壳、尖孢镰刀菌、尖孢镰刀菌JCM 11502、水甜茅(Glyceria maxima)、大豆(Glycine max)、陆地棉(Gossypium hirsutum)、智利江蓠(Gracilaria chilensis)、细基江蓠(Gracilariatenuistipitata)、向日葵(Helianthus annuus)、大麦(Hordeum vulgare)、莴苣(Lactucasativa)、浮萍(Lemna minor)、白羽扇豆(Lupinus albus)、结核分枝杆菌、皱叶烟草(Nicotiana plumbaginifolia)、烟草(Nicotiana tabacum)、安格斯汉逊酵母(Ogataeaangusta)、多形汉逊酵母、水稻(Oryza sativa)、南极棕囊藻(Phaeocystis Antarctica)、芦苇(Phragmites australis)、小立碗藓(Physcomitrella patens)、紫花豌豆(Pisumarvense)、大金发藓(Polytrichum commune)、条斑紫菜(Pyropia yezoensis)、萝卜(Raphanus sativus)、荚膜红细菌(Rhodobacter capsulatus)、荚膜红细菌E1F1、蓖麻(Ricinus communis)、小翠云(Selaginella kraussiana)、白芥子(Sinapis alba)、中肋骨条藻(Skeletonema costatum)、热带骨条藻(Skeletonema tropicum)、番茄(Solanumlycopersicum)、菠菜、裸花碱蓬(Suaeda maritima)、纤细四爿藻(Tetraselmisgracilis)、龟裂泰来草(Thalassia Testudinum)、南极海链藻(ThalassiosiraAntarctica)、假微型海链藻(Thalassiosira pseudonana)、小麦(Triticum aestivum)、圆锥小麦杜兰亚种(Triticum turgidum subsp durum)、石莼属(Ulva)物种和/或玉蜀黍；和/或此类NADH依赖性硝酸盐还原酶的功能性同源物，这些功能性同源物包含与上述此类NADH依赖性硝酸盐还原酶中的一种或多种具有至少50％、60％、65％、70％、75％、80％、85％、90％、95％、98％或至少99％氨基酸序列同一性的氨基酸序列；和/或此类NADH依赖性硝酸盐还原酶的功能性同源物，这些功能性同源物包含与上述此类NADH依赖性硝酸盐还原酶中的一种或多种的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列，其中优选地，与上述此类NADH依赖性硝酸盐还原酶相比，任何以上功能性同源物的氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

优选的NADH依赖性硝酸盐还原酶包括如获自或衍生自以下的NADH依赖性硝酸盐还原酶：博伊丁假丝酵母(能够利用NADH和NADPH两者作为电子供体的硝酸盐还原酶)、产朊假丝酵母(能够利用NADH和NADPH两者作为电子供体的硝酸盐还原酶)、尖孢镰刀菌(如由Fujii等人在题为“Denitrification by the Fungus Fusarium oxysporum InvolvesNADH-Nitrate Reductase”[“真菌尖孢镰刀菌的反硝化作用涉及NADH-硝酸盐还原酶”]的文章中所述，发表于Biosci.Biotechnol.Biochem.[生物科学，生物技术和生物化学],72(2),第412-420页,2008，通过援引并入本文)、菠菜和玉蜀黍。

因此，优选的NADH依赖性硝酸盐还原酶包括：这样的NADH依赖性硝酸盐还原酶，其包含具有如本文所述的SEQ ID NO:74和/或SEQ ID NO:75的氨基酸序列的多肽；和/或SEQID NO:74和/或SEQ ID NO:75的功能性同源物，这些功能性同源物包含分别与SEQ ID NO:74和/或SEQ ID NO:75中的一个或多个具有至少40％、50％、60％、65％、70％、75％、80％、85％、90％、95％、98％或至少99％氨基酸序列同一性的氨基酸序列；和/或SEQ ID NO:74和/或SEQ ID NO:75的功能性同源物，这些功能性同源物包含分别与SEQ ID NO:74和/或SEQ ID NO:75中的一个或多个的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列。优选地，分别与SEQ ID NO:74和/或SEQ ID NO:75相比，任何以上功能性同源物的氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

优选地，重组酵母细胞包含编码具有NADH依赖性硝酸盐还原酶活性的酶的外源基因。更优选地，重组酵母细胞包含编码具有NADH依赖性硝酸盐还原酶活性的酶的外源基因，该酶选自由如获自或衍生自以下的NADH依赖性硝酸盐还原酶组成的组：麦仙翁、绿穗苋、三色苋、布朗纤维藻、拟南芥、黑曲霉、构巢曲霉、Auxenochlorella pyrenoidosa、慢生根瘤菌属物种、慢生根瘤菌属物种750、芥菜、甘蓝、野茶树、博伊丁假丝酵母、产朊假丝酵母、辣椒、藜、杰丁塞伯林德纳氏酵母、芥菜、甘蓝、野茶树、辣椒、藜、莱茵衣藻、暗色小球藻、小球藻属物种、小球藻属柏林物种、普通小球藻、威氏海链藻、黄瓜、笋瓜、西葫芦、南瓜属物种、盐生杜氏藻、赫氏圆石藻、构巢裸胞壳、尖孢镰刀菌、尖孢镰刀菌JCM 11502、水甜茅、大豆、陆地棉、智利江蓠、细基江蓠、向日葵、大麦、莴苣、浮萍、白羽扇豆、结核分枝杆菌、皱叶烟草、烟草、安格斯汉逊酵母、多形汉逊酵母、水稻、南极棕囊藻、芦苇、小立碗藓、紫花豌豆、大金发藓、条斑紫菜、萝卜、荚膜红细菌、荚膜红细菌E1F1、蓖麻、小翠云、白芥子、中肋骨条藻、热带骨条藻、番茄、菠菜、裸花碱蓬、纤细四爿藻、龟裂泰来草、南极海链藻、假微型海链藻、小麦、圆锥小麦杜兰亚种、石莼属物种和玉蜀黍；以及此类NADH依赖性硝酸盐还原酶的功能性同源物，这些功能性同源物包含与上述此类NADH依赖性硝酸盐还原酶中的一种或多种具有至少50％、60％、65％、70％、75％、80％、85％、90％、95％、98％或至少99％氨基酸序列同一性的氨基酸序列；以及此类NADH依赖性硝酸盐还原酶的功能性同源物，这些功能性同源物包含与上述此类NADH依赖性硝酸盐还原酶中的一种或多种的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列，其中优选地，与上述此类NADH依赖性硝酸盐还原酶相比，任何以上功能性同源物的氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

适当地，重组酵母细胞可以包含编码SEQ ID NO:74和/或SEQ ID NO:75中任一个的氨基酸序列或者与SEQ ID NO:74和/或SEQ ID NO:75中任一个的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列的核苷酸序列。优选地，分别与SEQ ID NO:74和/或SEQ ID NO:75相比，氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

重组酵母细胞可以将编码以上NADH依赖性硝酸盐还原酶的一个或多个基因与编码NADPH依赖性亚硝酸盐还原酶的一个或多个基因组合。然而，优选地，重组酵母细胞将编码以上NADH依赖性硝酸盐还原酶的一个或多个基因与编码NADH依赖性亚硝酸盐还原酶的一个或多个基因组合。

合适的NADH依赖性硝酸盐还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站(www.uniprot.org/，截至2020年10月4日)上找到)、其描述、可以衍生出它们的生物体及其与SEQ ID NO:74的氨基酸序列同一性列于下表12中。

表12：合适的NADH依赖性硝酸盐还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站(www.uniprot.org/，截至2020年10月4日)上找到)、其描述、可以衍生出它们的生物体及其与SEQ ID NO:74的氨基酸序列同一性列于下表12中。

亚硝酸盐还原酶

如上文所指示，亚硝酸盐还原酶催化亚硝酸盐还原为氨(NH₃)。

优选地，如本文所述的重组酵母细胞包含编码NADH依赖性亚硝酸盐还原酶的至少一个或多个基因。

在本文中将NADH依赖性亚硝酸盐还原酶理解为仅依赖于作为辅因子的NADH或主要依赖于作为辅因子的NADH的亚硝酸盐还原酶。优选地，NADH依赖性亚硝酸盐还原酶的对作为辅因子的NADPH/NADP+的催化效率(k_cat/K_m)^NADP+与对作为辅因子的NADH/NAD+的催化效率(k_cat/K_m)^NAD+的比率(即，催化效率比率(k_cat/K_m)^NADP+:(k_cat/K_m)^NAD+)大于1:1，更优选等于或大于2:1，还更优选等于或大于5:1，甚至更优选等于或大于10:1，又甚至更优选等于或大于20:1，甚至还更优选等于或大于100:1，最优选等于或大于1000:1。没有上限，但是出于实际原因，NADH依赖性亚硝酸盐还原酶的催化效率比率(k_cat/K_m)^NADP+:(k_cat/K_m)^NAD+可以等于或小于1.000.000.000:1(即，1.10⁹)。最优选地，NADH依赖性亚硝酸盐还原酶仅依赖于作为辅因子的NADH/NAD+。也就是说，最优选地，NADH依赖性亚硝酸盐还原酶绝对需要作为辅因子的NADH/NAD+，而不是作为辅因子的NADPH/NADP+。

优选地，NADH依赖性亚硝酸盐还原酶是酶分类EC 1.7.1.15(即，具有EC编号EC1.7.1.15)的NADH依赖性亚硝酸盐还原酶。适当地，NADH依赖性亚硝酸盐还原酶(也称为NADH依赖性亚硝酸盐氧化还原酶)是至少催化以下化学反应的酶：

亚硝酸盐+3NADH+5H⁺→氨+3NAD⁺+2H₂O

本领域技术人员将理解，氨也可以作为所谓的氢氧化铵NH₄OH存在和/或被称为所谓的氢氧化铵NH₄OH

合适的NADH依赖性亚硝酸盐还原酶可以包括如衍生自以下的一种或多种NADH依赖性亚硝酸盐还原酶：构巢曲霉(也称为构巢裸胞壳)、肾形弓形杆菌(Arcobacterellisii)、太平洋弓形杆菌(Arcobacter pacificus)、枯草芽孢杆菌、枯草芽孢杆菌JH642、台湾贪铜菌、大肠杆菌、台湾罗尔斯通氏菌(Ralstonia taiwanensis)、蒲桃罗尔斯通氏菌(Ralstonia syzygii)、茄科罗尔斯通氏菌(Ralstonia solanacearum)、荚膜红细菌、荚膜红细菌、里贝罗副伯克霍尔德菌(Paraburkholderia ribeironis)；和/或此类NADH依赖性亚硝酸盐还原酶的功能性同源物，这些功能性同源物包含与上述此类NADH依赖性亚硝酸盐还原酶中的一种或多种具有至少40％、50％、60％、65％、70％、75％、80％、85％、90％、95％、98％或至少99％氨基酸序列同一性的氨基酸序列；和/或此类NADH依赖性亚硝酸盐还原酶的功能性同源物，这些功能性同源物包含与上述此类NADH依赖性亚硝酸盐还原酶中的一种或多种的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列，其中优选地，与上述此类NADH依赖性亚硝酸盐还原酶相比，任何以上功能性同源物的氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

大肠杆菌在其亚硝酸盐同化途径中利用几种不同的酶。nirD基因编码NADH依赖性亚硝酸盐还原酶(NADH)小亚基，而nirB基因编码NADH依赖性亚硝酸盐还原酶(NADH)大亚基。

优选的NADH依赖性亚硝酸盐还原酶包括如衍生自构巢曲霉(也称为构巢裸胞壳)(能够利用NADH和NADPH两者作为电子供体的亚硝酸盐还原酶)和/或大肠杆菌的NADH依赖性亚硝酸盐还原酶。在高硝酸盐和/或亚硝酸盐浓度下，由大肠杆菌的nirB基因编码的亚硝酸盐还原酶是尤其优选的。

因此，优选的NADH依赖性亚硝酸盐还原酶包括：这样的NADH依赖性亚硝酸盐还原酶，其包含具有如本文所述的SEQ ID NO:76(由nirD编码的大肠杆菌亚硝酸盐还原酶小亚基)和/或SEQ ID NO:77(由nirB编码的大肠杆菌亚硝酸盐还原酶大亚基)和/或SEQ ID NO:78(由niiA编码的构巢裸胞壳硝酸盐还原酶)的氨基酸序列的多肽；和/或SEQ ID NO:76和/或SEQ ID NO:77和/或SEQ ID NO:78的功能性同源物，这些功能性同源物包含分别与SEQID NO:76和/或SEQ ID NO:77和/或SEQ ID NO:78中的一个或多个具有至少40％、50％、60％、65％、70％、75％、80％、85％、90％、95％、98％或至少99％氨基酸序列同一性的氨基酸序列；和/或SEQ ID NO:76和/或SEQ ID NO:77和/或SEQ ID NO:78的功能性同源物，这些功能性同源物包含分别与SEQ ID NO:76和/或SEQ ID NO:77和/或SEQ ID NO:78中的一个或多个的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列。优选地，分别与SEQ ID NO:76和/或SEQ ID NO:77和/或SEQ ID NO:78相比，任何以上功能性同源物的氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

优选地，重组酵母细胞包含编码具有NADH依赖性亚硝酸盐还原酶活性的酶的外源基因。更优选地，重组酵母细胞包含编码具有NADH依赖性亚硝酸盐还原酶活性的酶的外源基因，该酶选自由如衍生自以下的NADH依赖性亚硝酸盐还原酶组成的组：构巢曲霉(也称为构巢裸胞壳)、肾形弓形杆菌、太平洋弓形杆菌、枯草芽孢杆菌、枯草芽孢杆菌JH642、台湾贪铜菌、大肠杆菌、台湾罗尔斯通氏菌、蒲桃罗尔斯通氏菌、茄科罗尔斯通氏菌、荚膜红细菌、荚膜红细菌、里贝罗副伯克霍尔德菌；和/或此类NADH依赖性亚硝酸盐还原酶的功能性同源物，这些功能性同源物包含与上述此类NADH依赖性亚硝酸盐还原酶中的一种或多种具有至少40％、50％、60％、65％、70％、75％、80％、85％、90％、95％、98％或至少99％氨基酸序列同一性的氨基酸序列；和/或此类NADH依赖性亚硝酸盐还原酶的功能性同源物，这些功能性同源物包含与上述此类NADH依赖性亚硝酸盐还原酶中的一种或多种的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列，其中优选地，与上述此类NADH依赖性亚硝酸盐还原酶相比，任何以上功能性同源物的氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

适当地，重组酵母细胞可以包含编码SEQ ID NO:76(由nirD编码的大肠杆菌硝酸盐还原酶小亚基)和/或SEQ ID NO:77(由nirB编码的大肠杆菌硝酸盐还原酶大亚基)和/或SEQ ID NO:78(由niiA编码的构巢裸胞壳硝酸盐还原酶)中任一个的氨基酸序列或者与SEQID NO:76和/或SEQ ID NO:77和/或SEQ ID NO:78中任一个的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列的核苷酸序列。优选地，分别与SEQ ID NO:76和/或SEQ ID NO:77和/或SEQ ID NO:78相比，氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

重组酵母细胞可以将编码以上NADH依赖性亚硝酸盐还原酶中的一种或多种的一个或多个基因与编码NADPH依赖性硝酸盐还原酶的一个或多个基因组合。然而，优选地，重组酵母细胞将编码以上NADH依赖性亚硝酸盐还原酶中的一种或多种的一个或多个基因与编码NADH依赖性硝酸盐还原酶的一个或多个基因组合。

合适的NADH依赖性亚硝酸盐还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站(www.uniprot.org/，截至2020年10月4日)上找到)、其描述、可以衍生出它们的生物体及其与SEQ ID NO:76(由nirD编码的小亚基)的氨基酸序列同一性列于下表13中。

合适的NADH依赖性亚硝酸盐还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站(www.uniprot.org/，截至2020年10月4日)上找到)、其描述、可以衍生出它们的生物体及其与SEQ ID NO:77(由nirB编码的大亚基)的氨基酸序列同一性列于下表14中。

表13：合适的NADH依赖性亚硝酸盐还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站(www.uniprot.org/，截至2020年10月4日)上找到)、其描述、可以衍生出它们的生物体及其与SEQ ID NO:76(由nirD编码的小亚基)的氨基酸序列同一性。

表14：合适的NADH依赖性亚硝酸盐还原酶的示例、其UniProt数据库登录号(可以在Uniprot网站(www.uniprot.org/，截至2020年10月4日)上找到)、其描述、可以衍生出它们的生物体及其与SEQ ID NO:77(由nirB编码的大亚基)的氨基酸序列同一性。

硝酸盐/亚硝酸盐转运蛋白

优选地，重组酵母细胞进一步包含使得氧化氮源(诸如硝酸盐或亚硝酸盐)至酵母细胞中的转运增加的一种或多种基因修饰。更优选地，重组酵母细胞进一步包含编码硝酸盐和/或亚硝酸盐转运蛋白的一个或多个基因。

合适的转运蛋白可以包括亚硫酸盐转运蛋白Ssu1和SSu2(如Cabrera等人在题为“Molecular Components of Nitrate and Nitrite Efflux in Yeast”[“酵母中硝酸盐和亚硝酸盐流出物的分子组分”]的文章中所述，发表于2014年2月第13卷第2期EukaryoticCell[真核细胞]第267-278页，通过援引并入本文)；以及衍生自安格斯毕赤酵母(也称为多形汉逊酵母)的硝酸盐/亚硝酸盐转运蛋白YNT1；和/或此类硝酸盐/亚硝酸盐转运蛋白中的一种或多种的功能性同源物，该功能性同源物包含与上述硝酸盐/亚硝酸盐转运蛋白中的一种或多种具有至少40％、50％、60％、65％、70％、75％、80％、85％、90％、95％、98％或至少99％氨基酸序列同一性的氨基酸序列；和/或此类硝酸盐/亚硝酸盐转运蛋白中的一种或多种的功能性同源物，这些功能性同源物包含与上述此类硝酸盐/亚硝酸盐转运蛋白中的一种或多种的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列，其中优选地，与上述这种硝酸盐/亚硝酸盐转运蛋白YNT1相比，任何以上功能性同源物的氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

优选地，重组酵母细胞包含编码以下的核酸序列：衍生自安格斯毕赤酵母的硝酸盐/亚硝酸盐转运蛋白YNT1；和/或这种硝酸盐/亚硝酸盐转运蛋白YNT1的功能性同源物，该功能性同源物包含与硝酸盐/亚硝酸盐转运蛋白YNT1具有至少50％、60％、65％、70％、75％、80％、85％、90％、95％、98％或至少99％氨基酸序列同一性的氨基酸序列；和/或这种硝酸盐/亚硝酸盐转运蛋白YNT1的功能性同源物，这些功能性同源物包含与上述这种硝酸盐/亚硝酸盐转运蛋白YNT1中的一种或多种的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列，其中优选地，与上述这种硝酸盐/亚硝酸盐转运蛋白YNT1相比，任何以上功能性同源物的氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

因此，优选的硝酸盐/亚硝酸盐转运蛋白包括：这样的硝酸盐/亚硝酸盐转运蛋白，其包含具有如本文所述的SEQ ID NO:79的氨基酸序列的多肽；和/或SEQ ID NO:79的功能性同源物，这些功能性同源物包含与SEQ ID NO:79具有至少40％、50％、60％、65％、70％、75％、80％、85％、90％、95％、98％或至少99％氨基酸序列同一性的氨基酸序列；和/或SEQID NO:79的功能性同源物，这些功能性同源物包含与SEQ ID NO:79的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列。优选地，与SEQ ID NO:79相比，任何以上功能性同源物的氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

适当地，重组酵母细胞可以包含编码SEQ ID NO:79的氨基酸序列或者与SEQ IDNO:79中任一个的氨基酸序列相比具有一个或几个取代、插入和/或缺失的氨基酸序列的核苷酸序列。优选地，分别与SEQ ID NO:79相比，氨基酸序列具有不超过300个、250个、200个、150个、100个、75个、50个、40个、30个、20个、10个或5个氨基酸取代、插入和/或缺失。

合适的亚硝酸盐/硝酸盐转运蛋白的示例、其UniProt数据库登录号(可以在Uniprot网站(www.uniprot.org/，截至2020年10月4日)上找到)、其描述、可以衍生出它们的生物体及其与SEQ ID NO:79的氨基酸序列同一性列于下表15中。

表15：合适的亚硝酸盐/硝酸盐转运蛋白的示例、其UniProt数据库登录号(可以在Uniprot网站(www.uniprot.org/，截至2020年10月4日)上找到)、其描述、可以衍生出它们的生物体及其与SEQ ID NO:79的氨基酸序列同一性。

辅因子

优选地，重组酵母细胞进一步包含合适的辅因子以增强上述NADH依赖性硝酸盐还原酶和/或NADH依赖性亚硝酸盐还原酶的活性。优选的辅因子包括黄素腺嘌呤二核苷酸(FAD)、血红素辅基和/或钼辅因子(MoCo)。因此，优选地，重组酵母细胞可以进一步包含编码用于合成黄素腺嘌呤二核苷酸(FAD)、血红素辅基和/或钼辅因子(MoCo)中的一种或多种的酶的一个或多个基因。例如，重组酵母细胞可以包含编码具有FAD合酶活性的酶的一个或多个基因。优选的辅因子如在2020年10月5日向美国专利局提交的非预先公开的美国专利申请US 63087642中所示例，将其内容通过援引并入本文。

重组表达

重组酵母细胞是这样的重组细胞。也就是说，重组酵母细胞包含在所讨论的细胞中非天然存在的核苷酸序列，或者用该核苷酸序列转化或用该核苷酸序列基因修饰。用于在细胞中重组表达酶以及用于对重组酵母细胞进行另外的基因修饰的技术是本领域技术人员熟知的。典型地，此类技术涉及用包含相关序列的核酸构建体转化细胞。此类方法例如从标准手册中获知，诸如Sambrook和Russel(2001)"Molecular Cloning:ALaboratoryManual"[“分子克隆：实验室手册”],(第3版),由Cold Spring Harbor Laboratory Press[冷泉港实验室出版社]出版，或F.Ausubel等人编辑,"Current protocols in molecularbiology"[“分子生物学实验指南”],Green Publishing and Wiley Interscience[格林出版公司与美国威立出版公司],纽约(1987)。用于对真菌宿主细胞进行转化和基因修饰的方法从例如EP-A-0635574、WO 98/46772、WO 99/60102、WO 00/37671、WO 90/14423、EP-A-0481008、EP-A-0635574和US 6265186获知。

发酵方法

本发明进一步提供了用于生产乙醇的方法，该方法包括使用如本说明书中所述的重组酵母细胞转化碳源、优选碳水化合物或另一种有机碳源，从而形成乙醇。

用于该发酵方法的进料适当地包含一种或多种可发酵碳源。可发酵碳源优选地包含一种或多种可发酵碳水化合物或由其组成。更优选地，可发酵碳源包含一种或多种单糖、二糖和/或多糖。例如，可发酵碳源可以包含一种或多种选自由以下组成的组的碳水化合物：葡萄糖、果糖、蔗糖、麦芽糖、木糖、阿拉伯糖、半乳糖、甘露糖和海藻糖。优选地包含一种或多种碳水化合物或由其组成的可发酵碳源可以适当地从淀粉、纤维素、半纤维素、木质纤维素和/或果胶获得。适当地，可发酵碳源可以呈优选地水性的浆料、悬浮液或液体的形式。

发酵过程中可发酵碳水化合物(例如像葡萄糖)的浓度优选地等于或大于80g/L。也就是说，在发酵开始时葡萄糖的初始浓度优选地等于或大于80g/L，更优选等于或大于90g/L，甚至更优选等于或大于100g/L，还更优选等于或大于110g/L，又甚至更优选等于或大于120g/L、等于或大于130g/L、等于或大于140g/L、等于或大于150g/L、等于或大于160g/L、等于或大于170g/L或者等于或大于180g/L。发酵的开始可以是使可发酵可发酵碳水化合物与本发明的重组细胞接触的时刻。

可发酵碳源可以通过使淀粉、木质纤维素和/或果胶与酶组合物接触来制备，其中产生一种或多种单糖、二糖和/或多糖，并且其中产生的单糖、二糖和/或多糖随后被发酵以得到发酵产物。

在酶处理前，可以预处理木质纤维素材料。预处理可以包括使木质纤维素材料暴露于酸、碱、溶剂、热、过氧化物、臭氧，机械粉碎，研磨，碾磨或快速减压，或其任何两种或更多种的组合。通常将这种化学预处理与热预处理(例如，在150℃-220℃之间持续1至30分钟)组合。随后，可以对预处理的材料进行酶水解以释放可以根据本发明发酵的糖。这可以用常规方法进行，例如与纤维素酶(例如，一种或多种纤维二糖水解酶、一种或多种内切葡聚糖酶、一种或多种β-葡糖苷酶和任选地其他酶)接触。可以在环境温度或更高温度下，在释放足够量的一种或多种糖的反应时间下，用纤维素酶进行转化。酶水解的结果是包含C5/C6糖的水解产物，在本文中称为糖组合物。

在一个实施例中，可发酵碳水化合物是诸如玉米秸秆或玉米纤维水解产物的生物质水解产物或由其组成。这种生物质水解产物反过来可以包含或衍生自玉米秸秆和/或玉米纤维。

在本文中将“水解产物”理解为包含多糖的材料(诸如玉米秸秆、玉米淀粉、玉米纤维或木质纤维素材料)，这些多糖已经通过加水解聚以形成单糖和寡糖。水解产物可以通过含多糖材料的酶水解或酸水解产生。

生物质水解产物可以是木质纤维素生物质水解产物。本文的木质纤维素包括生物质的半纤维素和半纤维素部分。木质纤维素还包括生物质的木质纤维素级分。合适的木质纤维素材料可以在以下列表中找到：果园底料、查帕拉尔群落、磨坊废弃物、城市木材废弃物、市政废弃物、砍伐废弃物、森林抚育间伐废弃物(forest thinning)、短期轮种木本作物、工业废弃物、小麦秸秆、燕麦秸秆、水稻秸秆、大麦秸秆、黑麦秸秆、亚麻秸秆、大豆壳、稻壳、水稻秸秆、玉米谷蛋白饲料、燕麦壳、甘蔗、玉米秸秆、玉米秆、玉米芯、玉米皮、柳枝稷、芒草、甜高粱、卡诺拉油菜茎、大豆茎、草原禾草、鸭茅状磨擦禾、狐尾草；甜菜渣、柑橘果渣、种子壳、纤维素动物粪便、草坪修剪废弃物(lawn clipping)、棉花、海草、藻类(包括大型藻类和微型藻类)、树木、软木材、硬木材、杨树、松树、灌木(shrub)、草、小麦、小麦秸秆、甘蔗渣、玉米、玉米皮、玉米芯、玉米粒、来自谷粒的纤维、来自谷物湿磨或干磨的产物和副产物、市政固体废弃物、废纸、庭院废弃物、草本材料、农业残余物、林业残余物、市政固体废弃物、废纸、纸浆、造纸厂残余物、树枝、灌木(bush)、甘蔗、玉米、玉米皮、能源作物、森林、水果、花、谷物、草、草本作物、叶、树皮、针叶、原木、根、幼树、灌木(shrub)、柳枝稷、树木、蔬菜、果皮、藤本植物、甜菜渣、小麦麸皮、燕麦壳、硬木材或软木材、由农业过程产生的有机废弃物材料、林业木材废弃物，或其任何两种或更多种的组合。藻类(诸如大型藻类和微型藻类)具有以下优点：它们可以包含大量的糖醇(诸如山梨糖醇和/或甘露糖醇)。可以被认为是潜在的可再生原料的木质纤维素通常包含多糖纤维素(葡聚糖)和半纤维素(木聚糖、杂木聚糖和木葡聚糖)。此外，一些半纤维素可以作为葡甘露聚糖存在于例如木材衍生的原料中。这些多糖在协同作用的不同酶的作用下发生酶水解成为可溶性糖(包括单体和多聚体两者，例如葡萄糖、纤维二糖、木糖、阿拉伯糖、半乳糖、果糖、甘露糖、鼠李糖、核糖、半乳糖醛酸、葡糖醛酸以及其他己糖和戊糖)。此外，果胶和其他果胶物质(诸如阿拉伯聚糖)可以占来自非木本植物组织的典型的细胞壁干质量的相当大的比例(约四分之一至二分之一的干质量可以是果胶)。可以预处理木质纤维素材料。预处理可以包括使木质纤维素材料暴露于酸、碱、溶剂、热、过氧化物、臭氧，机械粉碎，研磨，碾磨或快速减压，或其任何两种或更多种的组合。通常将这种化学预处理与热预处理(例如，在150℃-220℃之间持续1至30分钟)组合。

用于生产乙醇的方法可以包括好氧增殖步骤和厌氧发酵步骤。更优选地，根据本发明的方法是包括以下步骤的方法：好氧增殖步骤，其中重组酵母细胞的群体增加；以及厌氧发酵步骤，其中通过使用重组酵母细胞群体将碳源转化为乙醇。

在本文中将增殖理解为使得初始重组酵母细胞群体增加的重组酵母细胞生长的过程。增殖的主要目的是使用重组酵母细胞作为活生物体的自然繁殖能力来增加重组酵母细胞的群体。也就是说，增殖是为了生物质的生产，而不是为了乙醇的生产。增殖条件可以包括适当的碳源、通气、温度和营养物添加。增殖是好氧过程，因此增殖罐必须适当通气以维持一定水平的溶解氧。通常通过在进入增殖罐的管道上安装的空气电感器来实现适当的通气，该空气电感器在罐填充时和在再循环过程中将空气引入增殖混合物中。增殖混合物保留溶解氧的能力随添加的空气量和混合物稠度变化，这是通常以50:50至90:10之间的醪液与水的比率添加水的原因。“粘稠的”增殖混合物(80:20及更高的醪液与水的比率)通常需要添加压缩空气来弥补降低的保留溶解氧的能力。增殖混合物中溶解氧的量也随气泡尺寸变化，因此一些乙醇工厂通过与空气电感器相比产生更小气泡的喷洒器添加空气。适当的通气以及较低的葡萄糖对于促进增殖过程中的好氧呼吸是重要的，使得增殖过程中的环境不同于发酵过程中的厌氧环境。

在本文中将厌氧发酵过程理解为在厌氧条件下运行的发酵步骤。

厌氧发酵优选地在对于细胞最佳的温度下运行。因此，对于大部分重组酵母细胞，发酵过程在低于约50℃、低于约42℃或低于约38℃的温度下进行。对于重组酵母细胞或丝状真菌宿主细胞，发酵过程优选地在低于约35℃、约33℃、约30℃或约28℃的温度且高于约20℃、约22℃或约25℃的温度下进行。

在根据本发明的方法中，基于木糖和/或葡萄糖的乙醇产率优选地为至少约50％、约60％、约70％、约80％、约90％、约95％或约98％。在本文中将乙醇产率定义为理论最大产率的百分比。

根据本发明的方法以及其中适当地包括的增殖步骤和/或发酵步骤可以以分批、补料分批或连续模式进行。也可以应用分步水解和发酵(separate hydrolysis andfermentation，SHF)工艺或同时糖化和发酵(simultaneous saccharification andfermentation，SSF)工艺。

根据本发明的重组酵母和方法有利地允许更稳健的方法。有利地，该方法或该方法过程中的任何厌氧发酵可以在存在高浓度的碳源的情况下进行。因此，该方法(对应地其中的任何厌氧发酵步骤)优选地在存在以下浓度的葡萄糖的情况下进行：25g/L或更高、30g/L或更高、35g/L或更高、40g/L或更高、45g/L或更高、50g/L或更高、55g/L或更高、60g/L或更高、65g/L或更高、70g/L或更高、75g/L或更高、80g/L或更高、85g/L或更高、90g/L或更高、95g/L或更高、100g/L或更高、110g/L或更高、120g/L或更高，或者可以例如在25g/L-250g/L、30g/L-200g/L、40g/L-200g/L、50g/L-200g/L、60g/L-200g/L、70g/L-200g/L、80g/L-200g/L或90g/L-200g/L的范围内。

为了回收发酵产物，使用现有技术。对于不同的发酵产物，不同的回收方法是适当的。从水性混合物中回收乙醇的现有方法通常使用分级和吸附技术。例如，啤酒蒸馏器可以用于处理在水性混合物中含有乙醇的发酵产物，以产生富含乙醇的混合物，然后对其进行分级(例如，分馏或其他类似技术)。接下来，可以使含有最高浓度乙醇的级分通过吸附剂以从乙醇中除去大部分(如果不是全部的话)剩余的水。在一个实施例中，除了回收发酵产物之外，可以回收利用酵母。

将在本说明书中引用的所有专利和参考文献都通过援引以其全文并入本文。

提供以下实例仅出于说明目的，而不旨在以任何方式限制本发明的范围

实例

通用分子生物学技术

除非另有指示，否则使用的方法是标准生化技术。合适的通用方法教科书的示例包括Sambrook等人,Molecular Cloning,a Laboratory Manual[分子克隆，实验室手册](1989)和Ausubel等人,Current Protocols in Molecular Biology[分子生物学实验指南](1995),John Wiley&Sons,Inc[约翰·威利父子公司]。

HPLC分析

HPLC分析典型地如以下文献中所述的进行："Determination of sugars,byproducts and degradation products in liquid fraction in process sample”[“工艺样品中液体级分中糖、副产物和降解产物的确定”]；实验室分析程序(LaboratoryAnalytical Procedure，LAP，发布日期：12/08/2006；A.Sluiter,B.Hames,R.Ruiz,C.Scarlata,J.Sluiter和D.Templeton；Technical Report[技术报告](NREL/TP-51042623)；2008年1月；National Renewable Energy Laboratory[国家可再生能源实验室]。

在发酵后，通过使离心后的澄清上清液通过0.2μm孔径的过滤器，将用于HPLC分析的样品与酵母生物质和不溶性组分(玉米醪)分离。

在实例中使用的菌株和DNA序列

表16提供了菌株基因型的概述

表17提供了在这些实例中提及的核酸序列的概述。

表16：在实例中使用的酿酒酵母菌株

表17：在实例中使用的DNA序列

起始菌株

使用Ethanol作为起始菌株制备菌株。Ethanol 是可从乐斯福公司获得的商业酿酒酵母菌株。

可以遵循的菌株构建方法描述于WO 2013/144257A1和WO 2015/028582(通过援引并入本文)中。

来自多种目的基因的表达盒可以在转化该酵母后在体内重组到特定基因座处的途径中(US 9738890 B2)。用Golden Gate技术将启动子、ORF和终止子序列组装到表达盒中，如例如以下文献所述：Engler等人,"Generation of Families ofConstruct VariantsUsing Golden Gate Shuffling"[“使用Golden Gate改组产生构建体变体家族”],(2011),发表于Chaofu Lu等人(编辑),cDNA Libraries:Methods and Applications,Methods inMolecular Biology[cDNA文库：方法与应用，分子生物学方法],第729卷,第167-180页的第11章，通过援引并入本文；并且连接到Bsal消化的骨架载体中，这些骨架载体用用于体内重组步骤的接头修饰表达盒。通过PCR扩增包括接头的表达盒。此外，使用PCR扩增整合基因座的上游和下游部分的5’和3’DNA片段，并且用接头序列进行修饰。在用这些DNA片段转化酵母细胞后，在所需位置进行体内重组并整合至基因组中。CRISPR-Cas9技术用于在整合基因座处产生独特的双链断裂，以将途径靶向该特定基因座(参见DiCarlo等人,"Genomeengineering in Saccharomyces cerevisiae using CRISPR-Cas systems"[“使用CRISPR-Cas系统的酿酒酵母中的基因组工程”],(2013),Nucleic Acids Res[核酸研究]第41卷,第4336-4343页，通过援引并入本文)以及WO 16110512和US2019309268。从含有natMX标记的多拷贝酵母穿梭载体表达gRNA，natMX标记赋予酵母细胞对抗生物质诺尔丝菌素(NTC)的抗性。该质粒的骨架基于pRS305(参见Sikorski和Hieter,"A System of ShuttleVectors and Yeast Host Strains Designed for Efficient Manipulation of DNA inSaccharomyces cerevisiae"[“被设计用于高效操纵酿酒酵母中的DNA的穿梭载体和酵母宿主菌系统”],(1989),Genetics[遗传学],第122卷,第19-27页，通过援引并入本文)，包括功能性2微米ORI序列。从具有kanMX标记的pRS414质粒表达化脓链球菌(Streptococcuspyogenes)CRISPR相关蛋白9(Cas9)(参见Sikorski和Hieter,1989，如上文所指示)，kanMX标记赋予酵母细胞对抗生物质遗传霉素(G418)的抗性。用gRNA设计工具(本领域技术人员已知并且例如描述于https://www.atum.bio/eCommerce/cas9/input)设计指导RNA和原型间隔子序列。

实例1：“Rubisco”菌株(中间菌株IX15)的构建

在本实例中，用来自脱氮硫杆菌的编码核酮糖-1,5-二磷酸羧化酶(RuBisCO)的单亚基的cbbM基因、来自大肠杆菌的编码伴侣蛋白GroEL和GroES(以帮助RuBisCO蛋白在酿酒酵母的胞质溶胶中正确折叠)的基因、来自S.oleacera的编码磷酸核酮糖激酶(prk)的基因转化起始菌株，如以下文献所述：Guadalupe-Medina等人,"Carbon dioxide fixation byCalvin-Cycle enzymes improves ethanol yield in yeast"[“由卡尔文循环酶固定二氧化碳提高了酵母中的乙醇产率”],发表于Biotechnol,Biofuels[生物燃料的生物技术],2013,第6卷,第125页前，通过援引并入本文。这得到了含有cbbM、prk、groEL和groES的参考菌株IX15(关于详细的基因型，参见表16)。

实例2：参考菌株RX16的构建

构建了参考菌株RX16，其包含衍生自鲁氏结合酵母的甘油转运蛋白“Zrou_T5”，之前是根据现有技术的组成型启动子“Sc_ACT1.pro_0001”。

通过用以下三个表达盒转化实例1中获得的中间菌株IX15来构建参考菌株RX16；

-表达盒“片段A”：25-EFT2p.Sc_DAK1.ENO1t-2A；

-表达盒“片段B”：2A-HHF2p.Ec_gldA.CTC1t-2B；以及

-表达盒“片段C”：2B-Sc_ACT1.pro_0001-Zrou_T5.orf-Sc_TEF2.ter_0001-2C。

表达盒“片段A”：含有DNA片段的第一盒(命名为“片段A”)使用Golden Gate克隆进行编译，并且包含酿酒酵母EFT2启动子(Sc_EFT2.pro)、酿酒酵母DAK1 orf(Sc_DAK1.orf)和酿酒酵母ENO1终止子(Sc_ENO1.ter)。用50bp的接头25和2A修饰盒。接头25具有如下所展示的核酸序列：SEQ ID NO:66。接头2A具有如下所展示的核酸序列：SEQ ID NO:67。DNA片段“片段A”的核酸序列展示于SEQ ID NO:59中。

表达盒“片段B”：含有DNA片段的第二盒被命名为“片段B”，并且包含酿酒酵母HHF2启动子(Sc_HHF2.pro)、大肠杆菌gldA orf(Ec_gldA.orf)和酿酒酵母CTC1终止子(Sc_CTC1.ter)。用50bp的接头2A和2B修饰盒。接头2A具有如下所展示的核酸序列：SEQ ID NO:67。接头2B具有如下所展示的核酸序列：SEQ ID NO:68。DNA片段“片段B”的核酸序列展示于SEQ ID NO:60中。

表达盒“片段C”：含有DNA片段的第三盒被命名为“片段C”，并且包含酿酒酵母ACT1启动子(Sc_ACT1.pro_0001)、编码甘油转运蛋白GLYT(ZYRO0E01210)的鲁氏结合酵母orf(Zrou_T5.orf)和酿酒酵母TEF2终止子(Sc_TEF2.ter_0001)。用50bp的接头2B和2C修饰盒。接头2B具有如下所展示的核酸序列：SEQ ID NO:68。接头2C具有如下所展示的核酸序列：SEQ ID NO:69。DNA片段“片段C”的核酸序列展示于SEQ ID NO:61中。

使用CRISPR-Cas9使用用于同源整合的以下序列，将以上三个盒整合至中间菌株IX15中的基因座INT7.03中，该基因座位于酿酒酵母的编码序列PUP2(YGR253C)和ENO1(YGR254W)之间的VII号染色体上的非编码区上：

-Sc_INT7.03_侧翼5(由SEQ ID NO:70所展示)；以及

-Sc_INT7.03_侧翼3(由SEQ ID NO:71所展示)。

进行诊断性PCR以确认三个表达盒在INT7.03基因座处正确组装和整合。选择无质粒菌落，这得到了新菌株RX16(关于详细的基因型，参见表16)。

实例3：新NX17的构建

通过用以下三个表达盒转化实例1中获得的中间菌株IX15来构建新菌株NX17：

-表达盒“片段D”：25-Sc_MYO4.pro-Sc_DAK1.orf-Sc_GPM1.ter-2A；

-表达盒“片段E”：2A-Sc_HHF2.pro-Ec_gldA.orf-Sc_EFM1.ter-2B；以及

-表达盒“片段F”：2B-Sc_ANB1.pro_0001-Zrou_T5.orf-Sc_TEF1.ter_0001-2C。

表达盒“片段D”：命名为“片段D”的第一盒使用Golden Gate克隆进行编译，并且包含酿酒酵母MYO4启动子(Sc_MYO4.pro)、酿酒酵母DAK1 orf(Sc_DAK1.orf)和酿酒酵母GPM1终止子(Sc_GPM1.ter)。用50bp的接头25和2A修饰盒。接头25具有如下所展示的核酸序列：SEQ ID NO:66。接头2A具有如下所展示的核酸序列：SEQ ID NO:67。DNA片段“片段D”的核酸序列展示于SEQ ID NO:62中。

表达盒“片段E”：命名为“片段E”的第二盒包含酿酒酵母HHF2启动子(Sc_HHF2.pro)、大肠杆菌gldA orf(Ec_gldA.orf)和酿酒酵母EFM1终止子(Sc_EFM1.ter)。用50bp的接头2A和2B修饰盒。接头2A具有如下所展示的核酸序列：SEQ ID NO:67。接头2B具有如下所展示的核酸序列：SEQ ID NO:68。DNA片段“片段E”的核酸序列展示于SEQ ID NO:63中。

表达盒“片段F”：命名为“片段F”的第三盒包含酿酒酵母ANB1启动子(Sc_ANB1.pro_0001)、编码甘油转运蛋白GLYT(ZYRO0E01210)的鲁氏结合酵母orf(Zrou_T5.orf)和酿酒酵母终止子(Sc_TEF1.ter_0001)。用50bp的接头2B和2C修饰盒。接头2B具有如下所展示的核酸序列：SEQ ID NO:68。接头2C具有如下所展示的核酸序列：SEQ ID NO:69。DNA片段“片段F”的核酸序列展示于SEQ ID NO:64中。

使用CRISPR-Cas9使用将以上三个盒整合至中间菌株IX15中的INT28基因座中。使用CRISPR-Cas9使用用于同源整合的以下序列，将这三个盒整合至基因座INT28中，该基因座位于酿酒酵母的YDR345C(HXT3)和YDRT246C(SVF1)之间的IV号染色体上的非编码区上：

-INT28_侧翼5(由SEQ ID NO:72所展示)；以及

INT28_侧翼3(由SEQ ID NO:73所展示)

进行诊断性PCR以确认三个表达盒在INT28基因座处正确组装和整合。选择无质粒菌落，这得到了菌株NX17(关于详细的基因型，参见表16)。

实例4：新NX18的构建

通过用以下三个表达盒转化实例1中获得的中间菌株IX15来构建新菌株NX18：

-表达盒“片段D”：25-Sc_MYO4.pro-Sc_DAK1.orf-Sc_GPM1.ter-2A；

-表达盒“片段E”：2A-Sc_HHF2.pro-Ec_gldA.orf-Sc_EFM1.ter-2B；以及

-表达盒“片段G”：2B-Sc_HEM13.pro_0001-Zrou_T5.orf-Sc_TEF1.ter_0001-2C。

片段D和片段E如上文在实例3下所述。

命名为“片段G”的第三盒包含酿酒酵母HEM13启动子(Sc_HEM13.pro_0001)、编码甘油转运蛋白GLYT(ZYRO0E01210)的鲁氏结合酵母orf(Zrou_T5.orf)和酿酒酵母终止子(Sc_TEF1.ter_0001)。用50bp的接头2B和2C修饰盒。用50bp的接头2B和2C修饰盒。接头2B具有如下所展示的核酸序列：SEQ ID NO:68。接头2C具有如下所展示的核酸序列：SEQ ID NO:69。DNA片段“片段G”的核酸序列展示于SEQ ID NO:65中。

使用CRISPR-Cas9使用用于同源整合的以下序列，将以上三个盒整合至中间菌株IX15中的基因座INT28中，该基因座位于酿酒酵母的YDR345C(HXT3)和YDRT246C(SVF1)之间的IV号染色体上的非编码区上。用于同源整合的INT28_侧翼5(SEQ ID NO:72)和INT28_侧翼3(SEQ ID NO:73)。

进行诊断性PCR以确认三个表达盒在INT28基因座处正确组装和整合。选择无质粒菌落，这得到了菌株NX18(关于详细的基因型，参见表16)。

实例5：发酵

预培养物制备和条件：将甘油储备液(-80℃)在室温下解冻，并且用于接种无挡板的0.5L摇瓶中的补充有2％(w/v)葡萄糖的pH 6.0(用2M H2SO4/4N KOH调节)的0.2L过滤灭菌的矿质培养基(如以下文献所述：Luttik等人,"The Saccharomyces cerevisiae ICL2Gene Encodes aMitochondrial 2-Methylisocitrate Lyase Involved in Propionyl-Coenzyme AMetabolism"[“酿酒酵母ICL2基因编码参与丙酰辅酶A代谢的线粒体2-甲基异柠檬酸裂解酶”],(2000),JOURNAL OF BACTERIOLOGY[细菌学杂志],第7007-7013页，通过援引并入本文(Luttik等人,2000)。伴随在200RPM下振荡，将预培养物在32℃下孵育16至20小时。在确定培养物的酵母生物量(CDW)含量(经由OD600与CDW校准的关系)后，将与增殖所需的0.5g CDW/L接种物浓度相对应的量的预培养物离心(3min，5300x g)，用一样品体积的无菌脱矿质水洗涤一次，再离心一次，并且重悬于增殖培养基中。

增殖：100ml无挡板的摇瓶中的pH 5.0(用4N KOH/2M H₂SO₄调节)的增殖培养基由20ml稀释的玉米醪(70％v/v玉米醪:30％v/v脱矿质水)组成。添加尿素(1.25g/L)作为氮源，并且添加标准抗生素混合物(每升玉米醪1ml 100μg/L PenG和1ml 50μg/L新霉素储备液)以防止细菌污染物的生长。所有菌株的葡糖淀粉酶(Spirizyme，诺维信公司(Novozymes))剂量都为0.1g/kg。用于接种增殖阶段的预培养材料的量(0.5g CDW/L)由OD和菌株比OD₆₀₀/CDW换算因子决定。将所需量的预培养物离心(3min，4000rpm)，用一培养物体积的冷(4℃)无菌脱矿质水洗涤一次，再离心一次，重悬于500μL无菌脱矿质水中并且转移以增殖。增殖在32℃下伴随在140rpm下振荡运行6h。

发酵：玉米醪用于本文所述的所有测试。添加1g/L尿素作为氮源，同时应用标准抗生素混合物(100mg/ml PenG储备液+50mg/ml新霉素储备液)。使用2M H₂SO₄/4N KOH将pH调节至5.0。应用的葡糖淀粉酶(Spirizyme，诺维信公司)剂量为0.24g/kg。在140rpm和32℃下振荡的同时，在配备有压力记录/释放盖(安康科技公司(Ankom Technology)，美国纽约州马西登)的500ml的Schott瓶中使用200ml培养基进行发酵。压力发展以psi(磅力/平方英寸)为单位进行测量，并且结果展示于表18和表19中。图1以图形形式展示了表18的结果，并且图2以图形形式展示了表19的结果。列出的压力是产生的累积的压力，以psi表示。

如表18和图1所展示，在整个发酵运行中，新菌株NX17和NX18比参考菌株RX16形成了更多的乙醇和CO2，说明更多的糖转化。这由曲线下方的总面积证明。

表19和图2进一步说明，包含如所要求保护的启动子的根据本发明的菌株NX17和NX18比包含标准组成型启动子的参考菌株RX16在发酵时具有更急剧的启动，即根据本发明的菌株在起始发酵方面更快。

发酵过程中不控制pH。发酵在66h后停止。

取样和分析：所有培养物都在发酵结束时取样。由于发酵液含有活性GA酶，将50μl的10g/L阿卡波糖储备液添加至大约5g样品中以终止葡糖淀粉酶活性。通过使离心后的澄清上清液通过0.2μm孔径的过滤器，将用于HPLC分析的样品与酵母生物质和不溶性组分(玉米醪)分离。如(Sluiter等人,2008)中所述的进行HPLC分析。用HPLC确定发酵结束(EOF)时样品的总糖含量(g/L)，并且结果提供在表20中。

如表20所展示，野生型菌株的总糖含量为13.0g/L，并且参考菌株RX16的总糖含量(g/L)为14.0g/L。新菌株NX17和NX18两者在EOF时的总糖含量(g/L)都为12.6g/L。这些结果说明，根据本发明的菌株使得可用糖的消耗得到改善。

表18：发酵过程中的乙醇和CO2气体产量(以psi计)

表19：发酵过程中的乙醇和CO2气体产量(以psi计)(前10小时)

时间(h)	RX16	NX17	NX18
				0	0	0	0
1	1	1	1
				2	2	2	2
3	2	3	3
				4	3	4	4
5	5	7	7
				6	8	11	11
7	13	18	17
				8	20	27	27
9	29	40	39
				10	41	56	55

表20：发酵结束时的总糖含量(g/L)(发酵66小时)

*重复实验的平均值

参考文献

Entian KD,P.Yeast genetic strain and plasmidcollections.Method Microbiol.2007；629-66.

Nijkamp JF,van den Broek M,Datema E,de Kok S,Bosman L,Luttik MA,Daran-Lapujade P,Vongsangnak W,Nielsen J,Heijne WHM,Klaassen P,Paddon CJ,Platt D,P,van Ham RC,Reinders MJT,Pronk JT,de Ridder D,Daran J-M.Denovo sequencing,assembly and analysis of the genome of the laboratory strainSaccharomyces cerevisiae CEN.PK113-7D,a model for modern industrialbiotechnology.Microb Cell Fact.2012；11:36.

Verduyn C,Postma E,Scheffers WA,van Dijken JP.Effect of benzoicacidon metabolic fluxes in yeasts:A continuous-culture study on theregulation ofrespiration and alcoholic fermentation.Yeast.1992；8:501-17.

Mans R,van Rossum HM,Wijsman M,Backx A,Kuijpers NG,van denBroek M,Daran-Lapujade P,Pronk JT,van Maris AJA,Daran J-M.CRISPR/Cas9:a molecularSwiss army knife for simultaneous introductionof multiple geneticmodifications in Saccharomyces cerevisiae.FEMS YeastRes.2015；15:fov004.

DiCarlo JE,Norville JE,Mali P,Rios X,Aach J,ChurchGM.Genomeengineering in Saccharomyces cerevisiae using CRISPR-Cassystems.Nucleic Acids Res.2013；1-8.

Mikkelsen MD,Buron LD,Salomonsen B,Olsen CE,Hansen BG,Mortensen UH,Halkier BA.Microbial production of indolylglucosinolatethrough engineering ofa multi-gene pathway in a versatile yeast expressionplatform.Metab Eng.2012；14:104-11.

Knijnenburg TA,Daran JM,van den Broek MA,Daran-Lapujade PA,de WindeJH,Pronk JT,Reinders MJ,Wessels LF.Combinatorial effects ofenvironmentalparameters on transcriptional regulation in Saccharomycescerevisiae:Aquantitative analysis of a compendium of chemostat-basedtranscriptomedata.BMC Genomics.2009；10:53.

Mumberg D,Müller R,Funk M.Yeast vectors for the controlledexpressionof heterologous proteins in different genetic backgrounds.Gene.1995；156:119-22.

Gueldener U,Heinisch J,Koehler GJ,Voss D,Hegemann JH.A secondset ofloxP marker cassettes for Cre-mediated multiple gene knockouts inbuddingyeast.Nucleic Acids Res.2002；30:e23.

Guadalupe-Medina V,Wisselink H,Luttik M,de Hulster E,Daran J-M,PronkJT,van Maris AJA.Carbon dioxide fixation by Calvin-Cycle enzymesimprovesethanol yield in yeast.Biotechnol Biofuels.2013；6:125.

Daniel Gietz R,Woods RA:Transformation of yeast by lithiumacetate/single-stranded carrier DNA/polyethylene glycol method.MethodsEnzymol.2002:87-96.

Solis-Escalante D,Kuijpers NGA,Bongaerts N,Bolat I,Bosman L,Pronk JT,Daran J-M,Daran-Lapujade P.amdSYM,a new dominantrecyclable marker cassettefor Saccharomyces cerevisiae.FEMS Yeast Res.2013；13:126-39.

Guadalupe-Medina V,Almering MJH,van Maris AJA,PronkJT.Elimination ofglycerol production in anaerobic cultures of aSaccharomyces cerevisiae strainengineered to use acetic acid as an electronacceptor.Appl EnvironMicrob.2010；76:190-5.

Papapetridis I,van Dijk M,Dobbe AP,Metz B,Pronk JT,vanMarisAJA.Improving ethanol yield in acetate-reducing Saccharomycescerevisiaeby cofactor engineering of 6-phosphogluconate dehydrogenase anddeletionof ALD6.Microb Cell Fact.2016；15:1-16.

Heijnen JJ,van Dijken JP.In search of a thermodynamic descriptionofbiomass yields for the chemotrophic growth of microorganisms.BiotechnolBioeng.1992；39:833-58.

Postma E,Verduyn C,Scheffers WA,van Dijken JP.Enzymic analysisof thecrabtree effect in glucose-limited chemostat cultures ofSaccharomycescerevisiae.Appl Environ Microbiol.1989；55:468-77.

Verduyn C,Postma E,Scheffers WA,van Dijken JP.PhysiologyofSaccharomyces cerevisiae in anaerobic glucose-limited chemostatcultures.JGen Microbiol.1990；136:395-403.

Kwast et al.Genomic Analysis of Anaerobically induced genesinSaccharomyces cerevisiae:Functional roles of ROX1 and other factorsinmediating the anoxic response,2002,Journal of bacteriology vol 184,no1p250-265.

Keng,T.1992.HAP1 and ROX1 form a regulatory pathway in therepressionof HEM13 transcription in Saccharomyces cerevisiae.Mol.Cell.Biol.12:2616-2623.

Labbe-Bois,R.,and P.Labbe.1990.Tetrapyrrole and heme biosynthesisinthe yeast Saccharomyces cerevisiae,p.235-285.In H.A.Dailey(ed.),Biosynthesisof heme and chlorophylls.McGraw-Hill,New York,N.Y.

Zitomer,R.S.,and C.V.Lowry.1992.Regulation of gene expressionbyoxygen in Saccharomyces cerevisiae.Microbiol.Rev.56:1-11.

Zitomer,R.S.,P.Carrico,and J.Deckert.1997.Regulation of hypoxicgeneexpression in yeast.Kidney Int.51:507-513.

Cohen et al.,Induction and repression of DAN1 and the familyofanaerobic mannoprotein genes in Saccharomyces cerevisiae occurs throughacomplex array of regulatory sites.Nucleic Acid Research,2001 Vol.29,No3,799-808

Ter Kinde and de Steensma,A microarray-assisted screen forpotentialHap1 and Rox1 target genes in Saccharomyces cerevisiae,2002,Yeast19:825-840.

Sertil et al.The DAN1 gene of S cerevisiae is regulated in parallelwiththe hypoxic gene,but by a different mechanism,1997,Gene Vol 192,pag199-205.

Nissen et al.,"Anaerobic and aerobic batch cultivationsofSaccharomyces cerevisiae mutants impaired in glycerol Synthesis",(2000),Yeast,vol.16,pages 463-474.

Sambrook et al.,Molecular Cloning-A Laboratory Manual,2nd ed.,Vol.1-3(1989),published by Cold Spring Harbor Publishing.

Kruskal et al,"An overview of sequence comparison:Time warps,stringedits,and macromolecules",(1983),Society for Industrial andAppliedMathematics(SIAM),Vol 25,No.2,pages 201-237.

D.Sankoff and J.B.Kruskal,(ed.),Time warps,string editsandmacromolecules:the theory and practice of sequence comparison,pp.1-44Addison-Wesley Publishing Company.

Needleman et al"A General Method Applicable to the SearchforSimilarities in the Amino Acid Sequence of Two Proteins"(1970)J.Mol.Biol.Vol.48,pages 443-453.

Sherman,F.,et al.,Methods in Yeast Genetics,Cold SpringHarborLaboratory(1986)

Rice et al,"EMBOSS:The European Molecular Biology Open SoftwareSuite"(2000),Trends in Genetics vol.16,(6)pages 276—277,http://emboss.bioinformatics.nl/.

Neves et al.,"Yeast orthologues associated with glycerol transportandmetabolism",(2004),FEMS Yeast Res.Vol.5,pages 51-62.

Neves et al"New insights on glycerol transport inSaccharomycescerevisiae",(2004),FEBS Letters 565(2004)160-162.

Kwast et al.,"Genomic Analysis of Anaerobically induced genesinSaccharomyces cerevisiae:Functional roles of ROX1 and other factorsinmediating the anoxic response",(2002),Journal of bacteriology vol 184,no1pages 250-265.

Molin et al(2003)"Dihydroxy-acetone kinases inSaccharomycescerevisiae are involved in detoxification of dihydroxyacetone"(2003),J.Biol.Chem.,vol.278:pages 1415-1423.

Guadalupe-Medina et al.,"Carbon dioxide fixation by Calvin-Cycleenzymes improves ethanol yield in yeast",published in Biotechnol,Biofuels,2013,vol.6,p.125 onwards.

Yébenes et al.,“Chaperonins:two rings for folding”(2011),TrendsinBiochemical Sciences,Vol.36,No.8,pages 424-432.

Zeilstra-Ryalls et al.,"The universally conserved GroE(Hsp60)chaperonins",published in Annu Rev Microbiol.(1991)vol.45,pages 301-25.

Horwich et al.,"Two Families of Chaperonin:Physiology and Mechanism",(2007),Annu.Rev.Cell.Dev.Biol.Vol.23,pages 115-45.

Sonderegger et al.,"Metabolic Engineering of a PhosphoketolasePathway for Pentose Catabolism in Saccharomyces cerevisiae",(2004),Applied&Environmental Microbiology,vol.70(5),pages 2892-2897.

Membrillo-Hernandez et aI.,"Evolution of the adhE Gene Product ofEscherichia coli from a Functional Reductase to a Dehydrogenase",(2000)J.BioI.Chem.275:pages 33869-33875.

Tamarit et aI."Identification of the Major Oxidatively DamagedProteins in Escherichia coli Cells Exposed to Oxidative Stress"(1998)J.BioI.Chem.273:pages 3027-3032.

Smith et aI."Purification,Properties,and Kinetic Mechanism ofCoenzyme A-Linked Aldehyde Dehydrogenase from Clostridium kluyveri"(1980)Arch.Biochem.Biophys.203:pages 663-675.

Toth et al."The ald Gene,Encoding a Coenzyme A-Acylating AldehydeDehydrogenase,Distinguishes Clostridium beijerinckii and Two Other Solvent-Producing Clostridia from Clostridium acetobutylicum",(1999),Appl.Environ.Microbiol.65:pages 4973-4980.

Powlowski and Shingler"Genetics and biochemistry of phenoldegradation by Pseudomonas sp.CF600",(1994),Biodegradation vol.5,pages 219-236.

Shingler et al.,"Nucleotide Sequence and Functional Analysis of theComplete Phenol/3,4-Dimethylphenol Catabolic Pathway of Pseudomonas sp.StrainCF600",(1992),J.Bacteriol.,Vol.174,pages 711-724.

Ferrandez et al.,"Genetic Characterization and Expression inHeterologous Hosts of the 3-(3-Hydroxyphenyl)Propionate Catabolic Pathway ofEscherichia coli K-12"(1997)J.Bacteriol.179:pages 2573-2581.

Lutstorf and Megnet,"Multiple Forms of Alcohol Dehydrogenase inSaccharomyces Cerevisiae",(1968),Arch.Biochem.Biophys.,vol.126,pages 933-944.

Ciriacy,"Genetics of Alcohol Dehydrogenase in Saccharomycescerevisiae I.Isolation and genetic analysis of adh mutants",(1975),Mutat.Res.29,pages 315-326.

Engler et al.,"Generation of Families of Construct Variants UsingGolden Gate Shuffling",(2011),published in chapter 11 of Chaofu Lu et al.(eds.),cDNA Libraries:Methods and Applications,Methods in Molecular Biology,vol.729,pages 167-180.

DiCarlo et al.,"Genome engineering in Saccharomyces cerevisiae usingCRISPR-Cas systems",(2013),Nucleic Acids Res Vol 41,pages 4336-4343.

Sikorski and Hieter,"A System of Shuttle Vectors and Yeast HostStrains Designed for Efficient Manipulation of DNA in Saccharomycescerevisiae",(1989),Genetics,vol.122,pages 19-27

Claims

1.一种重组酵母细胞，所述重组酵母细胞功能性地表达：

-编码具有甘油脱氢酶活性的蛋白质的核酸序列；

-编码具有二羟基丙酮激酶活性的蛋白质的核酸序列；以及

-编码具有甘油转运蛋白活性的蛋白质的核酸序列，

其中编码具有甘油转运蛋白活性的所述蛋白质的所述核酸序列的表达在启动子(“GT启动子”)的控制下，所述GT启动子对甘油转运蛋白的厌氧/好氧表达比率为2或更高。

2.根据权利要求1所述的重组酵母细胞，其中所述GT启动子是选自由以下组成的列表的基因的启动子：FET4、ANB1、YHR048W、DAN1、AAC3、TIR2、DIP5、HEM13、YNR014W、YAR028W、FUN57、COX5B、OYE2、SUR2、FRDS1、PIS1、LAC1、YGR035C、YAL028W、EUG1、HEM14、ISU2、ERG26、YMR252C、SML1、TIR2、TIR4、TIR3、PAU7、PAU5、YLL064C、YGR294W、DAN3、YIL176C、YGL261C、YOL161C、PAU1、PAU6、DAN2、YDR542W、YIR041W、YKL224C、PAU3、YLL025W、YOR394W、YHL046C、YMR325W、YAL068C、YPL282C、PAU2、PAU4。

3.根据权利要求1或权利要求2所述的重组酵母菌株，其中所述GT启动子是合成的寡核苷酸。

4.根据权利要求1至3中任一项所述的重组酵母细胞，其中具有甘油转运蛋白活性的所述蛋白质是具有甘油-质子同向转运蛋白活性的蛋白质，优选STL1蛋白，优选地衍生自鲁氏结合酵母(Zygosaccharomyces rouxii)。

5.根据权利要求1至4中任一项所述的重组酵母细胞，其中具有甘油脱氢酶活性的所述蛋白质是具有NAD+依赖性甘油脱氢酶活性的蛋白质。

6.根据权利要求1至5中任一项所述的重组酵母细胞，其中编码具有甘油脱氢酶活性的所述蛋白质的所述核酸序列是异源核酸序列。

7.根据权利要求1至6中任一项所述的重组酵母细胞，其中编码具有二羟基丙酮激酶活性的所述蛋白质的所述核酸序列是天然核酸序列。

8.根据权利要求1至7中任一项所述的重组酵母细胞，其中编码具有二羟基丙酮激酶活性的所述蛋白质的所述核酸序列的表达在启动子的控制下。

9.根据权利要求1至8中任一项所述的重组酵母细胞，

其中所述重组酵母细胞包含用于功能性地表达在形成非天然氧化还原汇的代谢途径中起作用的蛋白质的一种或多种基因修饰。

10.根据权利要求1至9中任一项所述的重组酵母细胞，

其中所述重组酵母细胞功能性地表达：

-编码具有磷酸核酮糖激酶(PRK)活性的蛋白质的核酸序列；和/或

-任选地编码具有核酮糖-1,5-二磷酸羧化酶加氧酶(Rubisco)活性的所述蛋白质的一种或多种分子伴侣的核酸序列。

11.根据权利要求1至9中任一项所述的重组酵母细胞，

其中所述重组酵母细胞功能性地表达：

-编码具有乙酸激酶(ACK)活性的蛋白质(EC 2.7.2.12)的核酸序列。

12.根据权利要求1至9中任一项所述的重组酵母细胞，

其中所述重组酵母细胞功能性地表达编码包含NAD+依赖性乙酰化乙醛脱氢酶活性的蛋白质(EC 1.2.1.10)的核酸序列。

13.根据权利要求1至9中任一项所述的重组酵母细胞，

其中所述重组酵母细胞功能性地表达编码具有NADH依赖性硝酸盐还原酶活性的酶的核酸序列和/或编码具有NADH依赖性亚硝酸盐还原酶活性的酶的核酸序列。

14.根据权利要求13所述的重组酵母细胞，其中所述重组酵母细胞进一步功能性地表达编码具有硝酸盐和/或亚硝酸盐转运蛋白活性的酶的核酸序列。

15.根据权利要求1至14中任一项所述的重组酵母细胞，

其中所述重组酵母细胞进一步包含编码具有甘油-3-磷酸脱氢酶(GPD)活性的蛋白质的核酸序列和/或编码具有甘油磷酸磷酸酶(GPP)活性的蛋白质的核酸序列的缺失或破坏。

16.根据权利要求1至15中任一项所述的重组酵母细胞，

其中所述重组酵母细胞进一步功能性地表达编码具有葡糖淀粉酶活性的蛋白质(EC3.2.1.20或3.2.1.3)的核酸序列。

17.一种用于生产乙醇的方法，所述方法包括使用根据权利要求1至16中任一项所述的重组酵母细胞转化碳源，优选碳水化合物。