CN115996757A

CN115996757A - 用于在产油酵母中表达基因的通用基因表达系统

Info

Publication number: CN115996757A
Application number: CN202180041599.1A
Authority: CN
Inventors: 熊小超; 陈树林
Original assignee: Washington State University WSU
Current assignee: Washington State University WSU
Priority date: 2020-04-10
Filing date: 2021-04-07
Publication date: 2023-04-21
Also published as: EP4133091A2; WO2021207374A2; EP4133091A4; US20230183722A1; WO2021207374A3

Abstract

本发明公开了一种用于在包括解脂耶氏酵母和圆红冬孢酵母在内的产油酵母中表达多基因产物的新系统和方法。更具体地，本公开提供了在解脂耶氏酵母中有功能的新型启动子，其可用于生产范围广泛的生物产品。

Description

用于在产油酵母中表达基因的通用基因表达系统

相关申请的交叉引用

本申请要求分别于2020年4月10日和2021年2月9日提交的美国临时专利申请号63/008,098和63/147,352的优先权，其公开内容明确并入本文。

政府权利

本发明是在政府支持下根据美国农业部国家食品和农业研究所授予的拨款/合同编号2019-31100-06053进行的。政府对本发明享有某些权利。

以电子方式提交的材料的引用并入

与本文一起提交的计算机可读的核苷酸/氨基酸序列表通过引用整体并入，其标识如下：26 KB ASCII(文本)文件，名为“335006_ST25”，创建于2021年4月6日。

背景技术

作为一种普遍认为安全(GRAS)的生物体，非传统酵母解脂耶氏酵母(Yarrowialipolytica)已被广泛使用和代谢改造以生产一系列可再生化学品和油脂化学品，包括脂肪醇、长链二羧酸，有机酸酸，包括琥珀酸和柠檬酸，聚酮化合物三乙酸内酯(TAL)和甜味剂赤藓糖醇。解脂耶氏酵母的合成生物学进一步使菌株能够产生有价值的天然产物，包括二十碳五烯酸(EPA)、虾青素和紫罗兰酮。目前已开发出一套遗传操作工具，包括营养缺陷型选择标记、用于靶向过表达和荧光标记的优化GFP，以及同源重组频率增加的Ku70缺失菌株。由于启动子在对于以最佳水平和特定时间控制基因表达的代谢工程中起到至关重要的作用，因此已经在解脂耶氏酵母中进行了天然启动子的表征和工程化。包括P_FBA1、P_TDH1、P_GPM1、P_TEF和P_FBA1IN在内的各种天然启动子已被表征为组成型启动子，并已用于解脂耶氏酵母的代谢工程以生产不同的产品。通过添加上游激活序列(UAS)的串联拷贝，可以增强这些启动子中的一些(例如PTEF)的活性。除了组成型启动子外，还表征了生长阶段诱导型启动子hp4d、细胞色素P450基因(alk1)的正烷烃诱导型启动子、lip2和pox2的油酸或油酸甲酯诱导型启动子。然而，这些诱导型启动子的激活需要通过添加不同的碳源(主要是疏水性底物)作为诱导物来显著改变培养条件，并且这些启动子的活性受到培养基中葡萄糖的抑制，因此限制了它们的广泛应用。

除诱导型启动子外，阻抑型启动子也可用于调节和控制解脂耶氏酵母中的基因表达，以用于生产不同产品。具体而言，不是使基因缺失，而是可使阻抑型启动子通过使用特定的化学或环境因素来阻抑型启动子失活以达到抑制靶基因表达。阻抑型启动子对于代谢工程控制代谢通量非常有用，特别是当由于靶基因与细胞活力相关的基本功能而无法使该基因缺失时。例如，甲硫氨酸阻抑型启动子P_MET3用于在酿酒酵母(Saccharomycescerevisiae)中抑制角鲨烯合酶的表达，并将通量引入青蒿素前体紫穗槐二烯(amorphadiene)的生物合成中。包括P_THR1、P_MET3和P_SER1在内的一组启动子已被表征为酿酒酵母和甲基营养酵母毕赤酵母(Pichia pastoris)中的阻抑型启动子。然而，没有关于解脂耶氏酵母的阻抑型启动子的公开报道。

圆红冬孢酵母(Rhodosporidium toruloides)也被称为Rhodosporidiumtoruloides(anamorph,Rhodotorula glutinis)是另一种重要的产油酵母，并且由于其高脂肪产量、对木质纤维素生物质水解产物中存在的抑制性化合物的耐受性以及其利用C₅糖的能力，其引起了广泛关注。除了微生物脂质生产外，它还经过基因改造以生产脂肪醇和蓝色色素靛蓝。包括PPGI、PPGK、PFBA、PTPI和PGPD在内的多种组成型启动子已经从圆红冬孢酵母基因组中表征。异源途径的多框架工程可以提高成功生产天然产物的机会，并且宿主独立表达系统将进一步能够在不同框架生物体中快速构建。然而，还没有关于在解脂耶氏酵母和圆红冬孢酵母中均有功能的启动子的报道。

随着合成生物学的发展，已经实施了精细的方案和复杂的工程来重建人工生物系统，包括具有17个亚基的大蛋白复合物的表达、重新设计的细菌微区室细胞器(例如CO₂固定羧基体)和模块化信号转导系统(例如细胞中的G蛋白偶联受体(GPCR)信号)。特别是，降解和生物合成途径都涉及多个基因来完成生化功能。为了让酿酒酵母产生植物来源的生物碱胡豆苷，在酵母菌株中表达21个外源基因。为了发现和设计天然产物生物合成，通过在异源宿主中的特征调控部分下表达目的基因来重构生物合成基因簇(BGC)。在细菌中，多个基因可以组织成一个合成的操纵子，并且其表达可以很容易地通过核糖体结合位点(RBS)进行调整。相反，为了构建真核生物中的通路，将BGS中的每个基因都克隆到上游(启动子)和下游(转录终止子)区域之间，然后将表达盒引入宿主。因此，不断需要表达多个基因的新工具来更有效地设计真核细胞工厂。

为了能够在真核生物中方便地表达多个基因，小核糖核酸病毒的2A肽已被用于模式生物酿酒酵母、甲基营养型酵母毕赤酵母和真菌构巢曲霉中。使用已知的自剪接2A肽，多顺反子基因可以翻译成肽并在翻译过程中“切割”。来自小核糖核酸病毒的2A肽已成功用于在多种真核细胞(包括真菌、植物、昆虫和哺乳动物)中表达异源基因。然而，来自包括马鼻炎A病毒(E2A)、人口蹄疫病毒(F2A)、猪捷申病毒-1(P2A)和明脉扁刺蛾(Thosea asigna)病毒(T2A)在内的不同病毒的由约20个氨基酸组成的2A肽表现出不同的切割效率，并且2A肽的功能未在产油酵母解脂耶氏酵母中进行测试。此外，使用2A肽的主要缺点之一是将部分消化的2A肽序列添加到蛋白质的C末端，从而干扰酶活性。据观察，在多顺反子构建体中与2A肽相连的基因的顺序对通路生产力有很大影响。最后，构建由用2A序列分隔的所有单个基因组成的多顺反子片段仍然费时费力。

在建立用于重要的工业相关菌株解脂耶氏酵母和圆红冬孢酵母的遗传操作的分子工具箱方面已经取得了实质性进展，然而，迄今已知的已开发表达系统具有许多缺点和局限性。

(a)解脂耶氏酵母中表征的诱导型启动子主要对疏水底物例如补充的油酸有响应，但被在培养基中的葡萄糖所抑制。这些启动子的应用受到限制，因为它需要碳源的剧烈变化。

(b)阻抑型启动子已被用作下调基因表达的重要工具。然而，在解脂耶氏酵母中没有报道这样的阻抑型启动子。

(c)要构建通用的基因表达系统，需要在不同菌株中发挥作用的启动子。尽管在工业相关生物解脂耶氏酵母和圆红冬孢酵母中已经表征了广泛的启动子，但没有发现在解脂耶氏酵母和圆红冬孢酵母二者中具有功能的报告基因。

(d)自剪接2A肽已被用作构建多顺反子转录本以在真核生物中表达多个基因的强大工具，但尚未探索其在解脂耶氏酵母中的应用。

(e)部分消化的2A肽序列将附加到蛋白质的C末端，因此可靠的表达系统的开发必须消除此附加短肽序列的干扰。

(f)使用传统的克隆方法开发由2A肽序列介导的多个基因组成的多顺反子构建体是一项劳动密集型过程。一种无缝组装由2A序列组成的基因片段的新方法可以促进大型多顺反子结构的构建。

本申请提供了方法和组合物，包括用于在产油酵母解脂耶氏酵母和圆红冬孢酵母中表达多个基因的表达载体。

发明内容

本公开涉及用于制备编码多个基因以调节包括解脂耶氏酵母和圆红冬孢酵母在内的产油酵母的酶促途径的核酸构建体的新系统和方法。这些含油酵母已成为通过合成生物学生产广泛生物产品的新型微生物基础。然而，目前可用于操作产油酵母的工具并不是最佳的。

根据本公开的一个实施方案，从解脂耶氏酵母中分离了六种具有双向功能的铜诱导型启动子和五种阻抑型启动子并用于表达载体中。本文公开的两种阻抑型启动子(SEQID NO:10-11)在非阻抑条件下显示出与强组成型启动子相比相对较高的活性，但可以通过在解脂耶氏酵母中补充低含量的Cu²⁺来几乎完全抑制。

根据一个实施方案，本文公开的Cu²⁺诱导型启动子，包括SEQ ID NOs:1-6的启动子序列，可以被工程化以通过可操作地连接串联的上游激活序列(UAS)来提高每个相应启动子的强度。这种工程化的启动子被成功地用于构建一种比天然Cu²⁺诱导型启动子和组成型启动子二者更高效的途径来生产新型高价值生物产品蜡酯。已通过修饰天然启动子圆红冬孢酵母(修饰的RtGPD；SEQ ID NO:21)开发了在解脂耶氏酵母和圆红冬孢酵母二者中有功能的合成启动子。通过使用来自小核糖核酸病毒的“自切割”2A肽序列，本文公开了一种精心制作但易于组装的载体系统，以在单个启动子的控制下方便地表达多个基因。总而言之，这些共同努力促进了一种新型遗传操作系统的开发，该系统可以方便地在解脂耶氏酵母和圆红冬孢酵母二者中表达多个基因，而无需依赖宿主的优化。它是适用于在选定的微生物宿主中进行多基因表达的强大工具。

根据一个实施方案，提供了在解脂耶氏酵母中有功能的新型诱导型和阻抑型启动子。这些包括包含选自SEQ ID NO:1-6的序列的Cu²+诱导型启动子，包含选自SEQ ID NO:7-9的序列的氨基酸阻抑型启动子和包含选自SEQ ID NO:10-11的序列的Cu²+阻抑型启动子。

根据一个实施方案，提供了转录元件，其包含启动子和可操作地连接到所述启动子的多接头，使得当编码序列通过多接头的核酸内切酶限制性位点之一插入多接头位点时，编码序列可操作地连接到启动子并且能够被所述启动子转录。在一个实施方案中，启动子包含选自由SEQ ID NO:1(P_MT-1)、SEQ ID NO:2(P_MT-2)、SEQ ID NO:3(P_MT-3)、SEQ ID NO:4(P_MT-4)、SEQ ID NO:5(P_MT-5)、SEQ ID NO:6(P_MT-6)、SEQ ID NO:7(P_THR1)、SEQ ID NO:8(P_MET3)、SEQ ID NO:9(P_SER1)、SEQ ID NO:10(P_CTR1)和SEQ ID NO:11(P_CTR2)组成的组的核酸序列，或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的核酸序列具有至少95％序列同一性的核酸序列，其中，启动子可操作地连接至多接头序列。在一个实施方案中，转录元件进一步包含用于表达插入多接头位点的编码序列所需的额外调节元件，包括上游激活序列、核糖体结合位点(RBS)(在酵母中，通常称为Kozak序列)、转录终止序列和聚腺苷酸化识别序列。

在一个实施方案中，转录元件的启动子是Cu²+诱导型启动子，其包含选自由SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的序列，任选地，其中诱导型启动子具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个UAS序列，其位于串联阵列的上游并且可操作地连接至所述启动子序列，任选地其中所述UAS序列包含SEQ ID NO:12的序列。

在一个实施方案中，转录元件的启动子是阻抑型启动子，其包含选自由SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的序列，任选地其中阻抑型启动子包含SEQ ID NO:10或SEQ ID NO:11的序列。

在一个实施方案中，转录元件被形成为质粒并且进一步包含选择标记基因和在解脂耶氏酵母和圆红冬孢酵母中起作用的复制起点以及任选地在大肠杆菌中起作用的第二复制起点。转录元件可进一步包含一系列串联重复的2A多肽编码核酸序列，每个序列在2A多肽编码核酸序列之前具有其自身独特的限制性位点，用于插入编码序列，其将编码序列可操作地连接至转录元件的启动子和其各自的2A多肽编码核酸序列。

在一个实施方案中，2A多肽编码核酸序列编码包含序列GSGEGRGSLLTCGDVEENPGP(SEQ ID NO:13)或GSGATNFSLLKQAGDVEENPGP(SEQ ID NO:14)的多肽，任选地，其中2A多肽编码核酸序列包含SEQ ID NO:15的序列。

在一个实施方案中，转录元件进一步包含编码TEV肽酶的核酸，任选地其中编码TEV肽酶的基因受诱导型启动子调节，任选地其中编码TEV肽酶的基因可操作地连接至作为多顺反子编码区的一部分的转录元件的诱导型启动子。编码TEV的基因的表达允许去除连接到由可操作地连接到转录元件启动子的多顺反子区域表达的蛋白质的C末端的部分2A肽。这种切割消除了由自切割后剩余的残留2A多肽引起的干扰，并增加了表达系统的可靠性。

分离和工程化的启动子可用作新的标准部件，以促进这一重要生物体的代谢工程和合成生物学。根据一个实施方案，本文公开的转录元件用于转化产油酵母解脂耶氏酵母和圆红冬孢酵母以改造细胞以产生所需产物。因此，本发明涵盖包含本文申请的任何转录元件的宿主细胞，其中，诱导型或阻抑型启动子可操作地连接至异源编码序列。更特别地，宿主细胞是解脂耶氏酵母或圆红冬孢酵母细胞，并且任选地宿主细胞是Ku70缺失菌株。在这种情况下，本申请还涵盖用于以可靠且方便的方式在产油酵母解脂耶氏酵母和圆红冬孢酵母中表达多个基因的方法和载体系统。平台中嵌入的独特方法克服了与解脂耶氏酵母和圆红冬孢酵母中多个基因的表达相关的技术挑战，用于构建导致生物燃料和天然产物生物合成的复杂途径。

根据本申请，提供了一组分子生物学工具用于非常规酵母解脂耶氏酵母的遗传操作。本申请的一个实施方案涉及一种工具箱套件，其包括易于组装和充分表征的遗传单元，包括标记、启动子、终止子和其他必要部分。该试剂盒的可用性通过开发用于生产多种生物基产品的重组菌株得到验证。通过使用工具箱套件，简化了程序，以允许对解脂耶氏酵母进行方便、标准化和可扩展的遗传操作，为解脂耶氏酵母中的基因表达、缺失和整合提供一站式综合工具。

附图说明

图1A和1B是表达元件的示意图，其包含启动子，该启动子可操作地连接至包含一系列独特的核酸内切酶限制性位点(图1A中的E1、E2和E3；以及图1B中的E1、E2、E3、E4、E5和E6)的多顺反子区域，这些核酸内切酶限制性位点中可以插入基因产物的编码序列。E1-E6中的每一个之后是2A编码序列，任选地之后是TEV基因。单一载体中元件的这种新组合允许快速构建用于解脂耶氏酵母和圆红冬孢酵母二者的多基因途径。

图2是呈现数据的条形图，其显示了具有和不具有0.2mM Cu²⁺诱导的六个克隆启动子P_MT-1至P_MT-6(分别为SEQ ID NO:1-6)的强度。通过使用在缺乏亮氨酸的合成培养基上生长5小时的细胞，实施LacZ测定以量化启动子的强度。

图3是呈现数据的条形图，其显示了在添加和不添加氨基酸的情况下包括P_THR1(SEQ ID NO:7)、P_MET3(SEQ ID NO:8)和P_SER1(SEQ ID NO:9)在内的三个启动子的强度。氨基酸为L-苏氨酸(Thr)、L-缬氨酸(Val)、L-甲硫氨酸(Met)和L-丝氨酸(Ser)，最终含量范围为0.5至10mM。

图4是呈现数据的条形图，其显示了在添加和不添加Cu²⁺的情况下包括P_CTR1(SEQID NO:10)和P_CTR2(SEQ ID NO:11)在内的两个启动子的强度。启动子P_TEF用作对照以比较强度。

图5是呈现数据的条形图，其显示了在存在和不存在Cu²⁺的情况下随着添加到P_MT-2启动子上游的UAS拷贝数增加(范围从2到48)的P_MT-2启动子的强度。

图6是显示在添加各种浓度的Cu²⁺的情况下天然启动子P_MT-2和通过引入16个拷贝的UAS改造的修饰的(P_MT-2-UAS16)的强度的图。

图7是呈现数据的条形图，其显示了由使用P_MT-2启动子驱动MmWS表达并在40g/L葡萄糖上生长四天的重组体产生的脂肪醇(C16-C18)和WE的含量(详情参见实施方案5)。

图8是呈现数据的条形图，其显示在解脂耶氏酵母中测量的来自圆红冬孢酵母的包括P_PGK、P_FBA、P_TPI和P_GPD在内的四种充分表征的启动子的强度。在P_TPI和P_PGK上游添加16个拷贝的UAS显著增强了启动子在解脂耶氏酵母中的活性。

图9是开发的表达载体pYaliHex的示意图。

图10是用于克隆基因和组装多顺反子构建体的一种程序的示意图。

图11A-11C呈现关于在具有和不具有编码2A肽的序列的构建体中解脂耶氏酵母中GFP和红色荧光蛋白(RFP)的表达的数据。图11A是质粒pF2的示意图，其编码来自真菌粗糙脉孢菌(Neurospora crassa)的没有2A肽的纤维糊精转运蛋白(CDT1)的GFP融合体。图11B是质粒pSX30的示意图，其编码具有间插的2A肽的纤维糊精转运蛋白(CDT1)的GFP融合体。图11C是显示包含质粒pF2(16.7g/L)的重组体和包含质粒pSX30(20g/L)的重组体在纤维二糖上生长时的生长性能的图。

图12是表达载体pYLexp2的示意图。该载体包含启动子tef1N，它是用于解脂耶氏酵母中基因表达最常用的启动子之一。该图显示了pYLexp2中的主要特征及其组织(详情参见表1)。

图13是质粒pUra3lxop的示意图。该质粒包含标记基因ura3，其侧翼为loxP位点，loxP位点的侧翼为第一和第二多接头序列。第一和第二多接头允许插入与基因组序列具有同源性的核酸序列，其允许将质粒元件靶向插入基因组中。此外，可以将其他序列(例如诱导型或阻抑型启动子或基因构建体)插入质粒中，并用与基因组序列具有同源性的核酸序列括起来，用于以靶向方式插入基因组。该质粒代表用于解脂耶氏酵母(包括例如解脂耶氏酵母ΔKu70及其衍生物)中基因破坏和/或基因插入的一个实施方案。

图14提供了用于解脂耶氏酵母中基因缺失/置换的过程的示意图。与两个不同基因组序列具有高同源性(90-100％序列同一性)的5’侧翼和3’侧翼序列位于loxP侧翼序列之外以实现位于5’侧翼和3’侧翼序列之间的质粒序列的插入，其可以包括选择标记基因(例如，Ura3)和其他基因。

图15是表示使用本发明的启动子和表达载体来操纵多个基因的表达以重新定向解脂耶氏酵母的生物合成机制以产生靛蓝的示意图。更具体地，可以用包含单个双向诱导型启动子(例如包含选自SEQ ID NO:1-6的序列的启动子)的表达载体转化解脂耶氏酵母以同时诱导bspA和sfp编码序列的表达以产生活性全BspA酶。这两个基因，包括来自枯草芽孢杆菌(Bacillus subtilis)的sfp和来自淡紫灰链霉菌(Streptomyces lavendulae)的bpsA，是根据对于bspA的SEQ ID NO:25和对于sfp的SEQ ID NO:26中指定的解脂耶氏酵母的密码子合成的。此外，包含本发明的阻抑型启动子(例如，被Cu²⁺下调的SEQ ID NO:10或11的启动子)的表达载体可以可操作地连接至2-氧代戊二酸脱氢酶(ogdhl或ogdh2)编码序列并且Ogdh的表达可以下调以协助生产靛蓝。在进一步的实施方案中，编码Ogdh的构建体可以进一步包括编码SsrA肽标签的序列，该标签被添加到编码的Ogdh蛋白中，允许合成的蛋白质在诱导ClpXP蛋白酶体表达时降解，该蛋白酶体降解包含由11个氨基酸组成的ssrA肽AANDENYALAA(SEQ ID NO:27)的蛋白质，用于更严格地控制其表达(参见图16)。

图16是表示使用本发明的启动子和表达载体通过Cu²⁺介导的诱导和抑制启动子活性关闭靶基因活性的示意图。靶基因在Cu²⁺阻抑型启动子(例如SEQ ID NO:10(P_CTR1))的控制下从表达载体表达，该表达载体将ssrA肽添加到靶基因的蛋白质产物的羧基末端。两个基因(clpX和clpP)各自置于两个Cu²⁺诱导型启动子(例如，分别为SEQ ID NO:1(P_MT-1)和SEQID NO:2(P_MT-2))的控制下，其中在被Cu²⁺诱导后，产生ClpXP蛋白酶的组装，该蛋白酶降解包含ssrA肽的蛋白质。包含图16的构建体的细胞(如图17所示)在没有启动子激活/抑制量的Cu²⁺的情况下产生靶基因产物，然而细胞与刺激量的Cu²⁺的接触不仅停止了新的靶蛋白合成，还消除了已经合成的靶蛋白，以更严格地控制靶基因表达。

图17是表达载体ClpXP的图。

具体实施方式

定义

除非另有定义，否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员的通常理解相同的含义。

本文所用术语“约”是指比指出的值或值的范围大或小10％，但并未旨在将任何值或值的范围仅指定于该更广泛定义。以术语“约”开头的每个值或值的范围也意在涵盖指出绝对值或值的范围的实施方案。

如本文所用，术语“天然(native)”或“自然(natural)”定义了自然界中发现的条件。“天然DNA序列”是自然界中存在的DNA序列，它是通过自然方式产生的，而不是通过基因工程(例如，使用分子生物学/转化技术)产生的。

如本文所用，术语“内源”是指自然状态。例如，细胞内源分子(例如直接重复序列)是自然界中存在于细胞中的分子。“天然”化合物是未从其自然状态进行修饰的内源性化合物。

如本文所用，术语“外源”是指在自然界中发现的组合物中不存在的分子。细胞或细胞基因组的外源核酸是包含对于细胞/细胞基因组来说非天然的序列的核酸。

如本文所用，术语“异源”在核酸序列的上下文中定义了两个或更多个核酸的非天然并置。例如，可操作地连接到第二核酸的异源启动子定义了重组关系，其中启动子连接到该启动子未天然连接的序列。异源启动子可以是宿主细胞的外源性或其可以是宿主细胞的内源性(即，宿主细胞天然的多核苷酸，但由于通过重组DNA技术进行遗传操作而整合到非天然位置)。

如本文所用，术语“纯化的”和类似术语涉及分子或化合物相对于天然环境中通常与该分子或化合物相关的其他组分的富集。术语“纯化的”并不一定表示在该过程中已达到特定分子的完全纯度。如本文所用的“高度纯化的”化合物是指大于90％纯的化合物。

如本文所用，术语“可操作地连接”是指已被置于彼此功能关系中的两个组分。术语“可操作地连接”在用于指代调节序列和编码序列时表示调节序列影响连接的编码序列的表达。

“调节序列”、“调节元件”或“控制元件”是指影响转录的时间和水平/量、RNA加工或稳定性、或相关编码序列的翻译的核酸序列。调节序列可能包括启动子；翻译前导序列；5’和3’非翻译区，内含子；增强子；茎环结构；阻遏物结合序列；转录终止序列；聚腺苷酸化识别序列；等。特定调节序列可位于与其可操作连接的编码序列的上游和/或下游。此外，可操作地连接至编码序列的特定调节序列可位于双链核酸分子的相关互补链上。连接可以通过在方便的限制性位点连接来完成，然而，元件不需要连续以可操作地连接。

“启动子”是指启动可操作地连接到启动子的编码序列的转录并产生RNA的DNA序列。这种RNA可以编码蛋白质，或者可以本身具有功能，例如tRNA、mRNA或rRNA。通常，编码序列位于启动子序列的3’。在大多数时间导致基因在大多数细胞类型中转录的启动子在本文中称为“组成型启动子”。允许基因在特定细胞类型中或响应发育或环境线索而选择性转录的启动子在本文中称为“诱导型启动子”。

如本文所用，“双向启动子”是同时从双链启动子序列的两条链启动转录的启动子。双向启动子可位于编码在相反链上的两个相邻基因之间，其中相邻基因的5’末端彼此朝向并可操作地连接至双向启动子以基于单个启动子的激活同时转录两个基因。

如本文所用，“多接头”或“多克隆位点”可互换使用，并且定义了通常少于100个核苷酸的短DNA序列，其包含两个或更多个不同的限制酶切割识别位点。

如本文所用，术语“序列同一性”描述了被比较的两个序列(即，核酸或蛋白质序列)之间的匹配残基数与比对中被比较的残基总数的比率。可以使用本领域技术人员已知的任何标准技术来确定序列同一性的计算，包括例如使用基于BLAST^TM的同源性搜索，其使用NCBI BLAST^TM软件(2.2.23版)，使用默认参数设置运行(Stephen F.Altschul等人(1997),"Gapped BLAST and PSI-BLAST:a new generation of protein databasesearch programs",Nucleic Acids Res.25:3389-3402)。

如本文所定义的“基因产物”是由基因产生的任何产物。例如，基因产物可以是基因的直接转录产物(例如，mRNA、tRNA、rRNA、反义RNA、干扰RNA、核酶、结构RNA或任何其他类型的RNA)或通过mRNA翻译产生的蛋白质。基因表达可受到外部信号的影响，例如，细胞、组织或生物体暴露于增加或减少基因表达的试剂。基因的表达也可以在从DNA到RNA再到蛋白质的途径中的任何地方进行调节。基因表达的调节可以例如通过作用于转录、翻译、RNA运输和加工、中间分子如mRNA降解的控制或通过特定蛋白质分子在其生产后的激活、失活、区室化或降解或其组合来发生。可以通过本领域已知的任何方法在RNA水平或蛋白质水平测量基因表达，包括但不限于Northern印迹、RT-PCR、Western印迹，或体外、原位或体内蛋白质活性测定。

“宿主细胞”是被外源多核苷酸序列已经转化或转染或能够转化或转染的细胞。已经转化或转染的宿主细胞可以更具体地称为“重组宿主细胞”。

“营养缺陷型”是不能合成生长所必需的特定有机化合物的生物体。如本文所用的“营养缺陷型标记”定义了在营养缺陷型中缺失或缺陷的编码生长必需的有机化合物的基因。

实施方案

本公开涉及用于制备用于转化产油酵母(包括解脂耶氏酵母和圆红冬孢酵母)的核酸构建体的新系统和方法。更具体地，本文描述的表达载体可用于以受控方式同时表达多种基因产物以改变或调节解脂耶氏酵母和圆红冬孢酵母的酶促途径以生产期望产物。

根据一个实施方案，提供了在解脂耶氏酵母中有功能的新诱导型和阻抑型启动子。这些包括包含选自SEQ ID NO:1-6的序列的Cu²⁺诱导型启动子、包含选自SEQ ID NO:7-9的序列的阻抑型启动子和包含选自SEQ ID NO:10-11的序列的Cu²⁺阻抑型启动子。在一个实施方案中，这些启动子中的一个或多个作为表达载体的一部分存在，所述表达载体被配置用于插入目的编码序列，将SEQ ID NO:1-11的启动子序列之一可操作地连接至目的编码序列。这样的载体在被引入解脂耶氏酵母宿主细胞时允许在诱导型或阻抑型启动子的控制下表达目的编码序列。

根据一个实施方案，提供了一种转录元件，其包含启动子和可操作地连接到所述启动子的多接头，使得当编码序列通过多接头的核酸内切酶限制性位点之一插入多接头位点时，编码序列可操作地连接到启动子并且能够在引入到解脂耶氏酵母宿主细胞中时被所述启动子转录。在一个实施方案中，启动子包含850至903bp的核酸序列，该核酸序列包含选自由SEQ ID NO:1(P_MT-1)、SEQ ID NO:2(P_MT-2)、SEQ ID NO:3(P_MT-3)、SEQ ID NO:4(P_MT-4)、SEQ ID NO:5(P_MT-5)、SEQ ID NO:6(P_MT-6)、SEQ ID NO:7(P_THR1)、SEQ ID NO:8(P_MET3)、SEQ IDNO:9(P_SER1)、SEQ ID NO:10(P_CTR1)和SEQ ID NO:11(P_CTR2)组成的组的序列，或与选自由SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的核酸序列具有至少80％、85％、90％、95％或99％序列同一性的核酸序列，其中多接头可操作地连接到所述启动子序列，使得编码序列引入多接头区域会将编码序列置于启动子的转录控制之下。在一个实施方案中，转录元件进一步包含表达插入多接头位点的编码序列所需的额外调节元件，包括例如上游激活序列、核糖体结合位点(RBS)、翻译起始密码子、终止序列和聚腺苷酸化识别序列。在一个实施方案中，转录元件形成为质粒并且进一步包含选择标记基因和在靶宿主细胞(例如，大肠杆菌或解脂耶氏酵母宿主细胞)中有功能的复制起点。

根据一个实施方案，提供了一种转录元件，其包含双向启动子以及第一和第二多接头，其中第一和第二多接头在双链启动子的相对端可操作地连接至所述启动子，使得当通过第一和第二多接头的核酸内切酶限制性位点之一将第一编码序列插入到第一多接头位点并且将第二编码序列插入到第二多接头位点时，第一和第二编码序列两者可操作地连接到双向启动子并且在引入解脂耶氏酵母宿主细胞并激活启动子后两者通过所述启动子同时转录。在一个实施方案中，双向启动子选自包括SEQ ID NO:1(P_MT-1)和SEQ ID NO:2(P_MT-2)、SEQ ID NO:3(P_MT-3)和SEQ ID NO:4(P_MT-4)或SEQ ID NO:5(P_MT-5)和SEQ ID NO:6(P_MT-6)在内的三对核酸序列之一，或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列具有至少95％或99％序列同一性的核酸序列。在一个实施方案中，双向启动子包含SEQ ID NO:1(P_MT-1)和SEQ ID NO:2(P_MT-2)，或包含与SEQ ID NO:1(P_MT-1)和SEQ ID NO:2(P_MT-2)具有至少95％或99％序列同一性的序列。

在一个实施方案中，转录元件的启动子是Cu²⁺诱导型启动子，其包含选自由SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的序列，或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQID NO:6组成的组的序列具有至少95％序列同一性的序列。在一个实施方案中，转录元件的启动子是Cu²⁺诱导型启动子，其包含选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4和SEQID NO:6组成的组的序列，或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4和SEQ IDNO:6组成的组的序列具有至少95％序列同一性的序列。在一个实施方案中，转录元件的启动子是Cu²⁺诱导型启动子，其包含选自由SEQ ID NO:2和SEQ ID NO:6组成的组的序列，或与SEQ ID NO:2或SEQ ID NO:6具有至少95％序列同一性的序列。在一个实施方案中，诱导型启动子具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个上游激活序列(UAS)，其以串联阵列位于SEQ ID NO:1、2、3、4、5或6的启动子序列的上游，并且可操作地连接到所述启动子序列，任选地其中所述UAS序列包含SEQ ID NO:12的序列。

在一个实施方案中，转录元件的启动子是阻抑型启动子，其包含选自由SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的序列，或与选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的序列具有至少80％、85％、90％、95％或99％序列同一性的序列，任选地连接至多接头。

在一个实施方案中，转录元件的启动子是Cu²⁺阻抑型启动子，其包含选自由SEQ IDNO:10和SEQ ID NO:11组成的组的序列，或与选自由SEQ ID NO:10和SEQ ID NO:11组成的组的序列具有至少95％序列同一性的序列。

在一个实施方案中，阻抑型启动子包含SEQ ID NO:10或SEQ ID NO:11的序列，或与选自由SEQ ID NO:10和SEQ ID NO:11组成的组的序列具有至少95％序列同一性的序列，任选地连接至多接头。

在一个实施方案中，阻抑型启动子包含SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9的序列，或与选自由SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9组成的组的序列具有至少95％序列同一性的序列，任选地连接至多接头。

在一个实施方案中，转录元件被形成为质粒并且进一步包含选择标记基因和在解脂耶氏酵母和圆红冬孢酵母中起作用的复制起点以及任选地在大肠杆菌中起作用的第二复制起点。转录元件可以进一步包含一系列串联重复的2A多肽编码核酸序列，每个序列在2A多肽编码核酸序列之前具有其自己独特的限制性位点，以允许易于插入与转录元件的启动子及其各自的2A多肽编码核酸序列可操作连接的目的编码序列。如图1A所示，根据本申请的转录元件的一个实施方案包含可操作地连接至多顺反子区域的诱导型/阻抑型启动子(例如，包含SEQ ID NO:1-11的序列的启动子)，其中多顺反子区域包括区域E1、E2和E3，每个区域代表一个或多个转录元件独特的限制性位点，每个区域后跟2A蛋白编码序列。因此，使用E1、E2和E3的独特限制性位点，可以将三个独立基因的编码序列引入构建体中，以置于启动子的转录控制之下，并用附着的2A多肽表达。

在一个实施方案中，2A多肽编码核酸序列编码包含GSGEGRGSLLTCGDVEENPGP(SEQID NO:13)或GSGATNFSLLKQAGDVEENPGP(SEQ ID NO:14)的序列的多肽，任选地其中2A多肽编码核酸序列包含SEQ ID NO:15的序列。

在一个实施方案中，转录元件进一步包含编码TEV肽酶的核酸，任选地其中编码TEV肽酶的基因由诱导型启动子调节，任选地其中编码TEV肽酶的基因可操作地连接至作为多顺反子编码区的一部分的转录元件的诱导型启动子(如图1A的实施方案所示)。编码TEV的基因的表达允许去除连接到由可操作地连接到转录元件启动子的多顺反子区域表达的蛋白质的C-末端的部分2A肽。这种切割消除了表达的多顺反子蛋白的自切割和释放后剩余的残留2A多肽造成的干扰，增加了表达系统的可靠性。

替代地，或除了图1A所示的实施方案之外，由于Cu²⁺诱导型启动子代表三对双向启动子(SEQ ID NO:1(P_MT-1)和SEQ ID NO:2(P_MT-2))；(SEQ ID NO:3(P_MT-3)和SEQ ID NO:4(P_MT-4))；以及(SEQ ID NO:5(P_MT-5)和SEQ ID NO:6(P_MT-6))，转录可以同时从转录元件的启动子的每条链发生。因此，两个多顺反子区域的同时转录可以在如图1B所示的构建体中发生。

根据一个实施方案，本文公开的任何转录元件进一步包含一个或多个上游激活序列(UAS)，其位于启动子的上游并且可操作地连接至所述启动子序列。串联重复的UAS元件可以相同或不同，并且可以在1至16的数量范围。任选地，UAS序列可以包含SEQ ID NO:12的序列或与SEQ ID NO:12具有至少95％或99％序列同一性的序列。

在一个实施方案中，16个串联重复的包含SEQ ID NO:12的序列的UAS序列位于启动子的上游，其中启动子包含选自由(SEQ ID NO:1(P_MT-1)和SEQ ID NO:2(P_MT-2))；(SEQ IDNO:3(P_MT-3)和SEQ ID NO:4(P_MT-4))以及(SEQ ID NO:5(P_MT-5)和SEQ ID NO:6(P_MT-6))组成的组的序列，或与选自由由(SEQ ID NO:1(P_MT-1)和SEQ ID NO:2(P_MT-2))；(SEQ ID NO:3(P_MT-3)和SEQ ID NO:4(P_MT-4))以及(SEQ ID NO:5(P_MT-5)和SEQ ID NO:6(P_MT-6))组成的组的序列具有至少95％序列同一性的序列。根据一个实施方案，提供了一种转录元件，其中该元件包含位于启动子上游的1至16个串联重复的SEQ ID NO:12的UAS序列，或与SEQ ID NO:12具有至少99％序列同一性的序列，其中启动子包含选自由(SEQ ID NO:1(P_MT-1)和SEQ IDNO:2(P_MT-2))；(SEQ ID NO:3(P_MT-3)和SEQ ID NO:4(P_MT-4))以及(SEQ ID NO:5(P_MT-5)和SEQID NO:6(P_MT-6))组成的组的序列，或与选自由由(SEQ ID NO:1(P_MT-1)和SEQ ID NO:2(P_MT-2))；(SEQ ID NO:3(P_MT-3)和SEQ ID NO:4(P_MT-4))以及(SEQ ID NO:5(P_MT-5)和SEQ IDNO:6(P_MT-6))组成的组的序列具有至少95％序列同一性的序列。在一个实施方案中，多接头可操作地连接到包含UAS序列的启动子，并且任选地进一步包含位于所述多接头下游的一个或多个2A多肽编码核酸序列，其中每个2A多肽编码核酸序列之前是独特的核酸内切酶限制地点。在一个实施方案中，所编码的2A肽具有序列GSGEGRGSLLTCGDVEENPGP(SEQ ID NO:13)或GSGATNFSLLKQAGDVEENPGP(SEQ ID NO:14)的序列，并且任选地2A多肽编码核酸序列包含SEQ ID NO:15的序列或与SEQ ID NO:15具有至少95和或99％序列同一性的序列。

在一个实施方案中，本文公开的任何转录元件进一步包含位于所述启动子和多接头之间的核糖体结合位点和任选的翻译起始密码子。在另一个实施方案中，本文公开的任何转录元件进一步包含位于转录元件的核糖体结合位点和多接头之间的内含子序列，任选地，其中该内含子包含来自基因tef(SEQ ID NO:20)的第一个内含子。

根据一个实施方案，本文公开的任何转录元件可以形成为质粒，其中该质粒进一步包含选择标记。在一个实施方案中，选择标记是营养缺陷型标记，任选地其中营养缺陷型标记是leu2或ura 3。在一个实施方案中，选择标记是抗生素抗性基因，包括例如AmpR或TetR。在一个实施方案中，包含转录元件的质粒还包含一个或多个允许质粒在宿主生物体中复制的复制起点。在一个实施方案中，质粒包含解脂耶氏酵母和/或大肠杆菌的复制区。

如本文申请的转录元件可以进一步与表1-3中公开的任何元件组合。在一个实施方案中，将期望基因产物的编码序列插入本文公开的任何转录元件中，以将SEQ ID NO:1-11的启动子可操作地连接至异源编码序列。然后将构建体引入宿主细胞以修饰宿主细胞编码的基因的表达模式。在一个实施方案中，异源编码序列对于宿主细胞是内源性的，但异源编码序列并非天然可操作地连接至转录元件的启动子。在一个实施方案中，异源编码序列对于宿主细胞而言不是天然的并且代表外源序列。在一个实施方案中，宿主细胞是解脂耶氏酵母或圆红冬孢酵母宿主细胞。在一个实施方案中，宿主细胞是解脂耶氏酵母，并且任选地解脂耶氏酵母的Ku70缺失菌株。

在一个实施方案中，提供了一种用于通过诱导/抑制单个控制元件同时诱导或抑制两种基因产物的表达的方法。根据一个实施方案，同时诱导来自单个启动子的两个或更多个编码区的方法包括提供宿主细胞，所述宿主细胞包含Cu²⁺诱导型双向启动子，所述启动子可操作地连接至所述启动子的正链上的第一编码区和负链上的第二编码区，其中所述启动子包含选自以下组的一对核酸序列：由SEQ ID NO:1和SEQ ID NO:2、SEQ ID NO:3和SEQID NO:4以及SEQ ID NO:5和SEQ ID NO:6组成的成对序列，或与选自由SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列具有至少95％序列同一性的序列；以及使宿主细胞与一定量的Cu²⁺接触，所述Cu²⁺诱导所述启动子的双向转录以诱导所述第一和第二编码区的表达。在一个实施方案中，多个基因以串联阵列可操作地连接至所述启动子，其中2A多肽编码序列位于除所述多个基因中的最后一个之外的所有基因的3’末端，任选地，其中最后一个编码的基因产物是TEV肽酶。

在一个实施方案中，提供了一种用于同时抑制来自单个启动子的两个或更多个基因的表达的方法，包括提供宿主细胞，所述宿主细胞包含可操作地连接到编码多个基因的多顺反子区域的Cu²⁺诱导型启动子，如图1A中公开的，其中编码序列被编码2A蛋白的序列分开，并且任选地进一步包含可操作地连接至阻抑型启动子的TEV基因，其中所述启动子包含选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列，或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列具有至少95％序列同一性的序列；以及使宿主细胞与一定量的Cu²⁺接触，所述Cu²⁺诱导所述启动子的转录，从而诱导包含在多顺反子区中的编码区的表达。在一个实施方案中，启动子包含选自由SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:6组成的组的核酸序列，或与选自由SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:6组成的组的核酸序列具有至少95％序列同一性的序列。

在一个实施方案中，提供了一种用于同时抑制来自单个启动子的两个或更多个基因的表达的方法，包括提供宿主细胞，所述宿主细胞包含可操作地连接至编码多个基因的多顺反子区域的Cu²⁺阻抑型启动子，如图1A中公开的，其中编码序列被编码2A蛋白的序列分开，并且任选地进一步包含可操作地连接至阻抑型启动子的TEV基因，其中所述启动子包含选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的核酸序列，或与选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ IDNO:11组成的组的核酸序列具有至少95％序列同一性的序列，以及使所述宿主细胞与一定量的Cu²⁺或氨基酸接触，其抑制从所述启动子的转录，以抑制包含在多顺反子区中的编码区的表达。在一个实施方案中，阻抑型启动子包含选自由SEQ ID NO:10(CTR1)和SEQ ID NO:11(CTR2)组成的组的序列，并且宿主细胞与一定量的Cu²⁺接触，其抑制从所述启动子的转录。

根据一个实施方案，提供了用于与本公开的转录元件结合使用的构建体，其中补充构建体被设计用于解脂耶氏酵母或圆红冬孢酵母宿主序列的插入、缺失或替换。该方法包括使用包含或允许插入与宿主生物体的内源序列具有高度同源性的序列的载体。这样的构建体可用于使基因组序列缺失或破坏靶内源基因以产生无效突变体。通过在与宿主序列具有95％至100％序列同一性的两组核酸序列之间包括额外序列，补充构建体可用于将基因或基因部分(即，本文公开的任何诱导型或阻抑型启动子)插入到宿主生物体DNA的靶位置。在一个实施方案中，插入选自SEQ ID NO:1-6中任一个的诱导型启动子以替换靶基因的天然启动子并将编码的产物置于诱导型启动子的控制之下。在一个实施方案中，插入选自SEQ ID NO:7-11中任一个的阻抑型启动子以替换靶基因的天然启动子并将编码的产物置于阻抑型启动子的控制之下。在一个实施方案中，该构建体包含基因构建体，该基因构建体包含选自SEQ ID NO:7-11中任一个的启动子，其可操作地连接至具有开放阅读框的序列(即，编码序列)，其中在宿主细胞转化后，该构建体将基因构建体完整插入宿主细胞的DNA中，任选地替换或禁用天然基因。

在一个实施方案中，补充构建体进一步包含也位于与宿主DNA具有高度序列同一性的两个序列之间的选择标记，以允许选择已成功完成同源重组事件的宿主细胞。在进一步的实施方案中，选择标记基因的侧翼可以是loxP位点，随后cre重组酶活性的引入导致选择标记基因的去除。

根据一个实施方案，提供了包含基因盒的补充构建体，其中该基因盒包含选择标记和启动子序列，所述启动子选自由SEQ ID NO:1(P_MT-1)、SEQ ID NO:2(P_MT-2)、SEQ ID NO:3(P_MT-3)、SEQ ID NO:4(P_MT-4)、SEQ ID NO:5(P_MT-5)、SEQ ID NO:6(P_MT-6)、SEQ ID NO:7(P_THR1)、SEQ ID NO:8(P_MET3)、SEQ ID NO:9(P_SER1)、SEQ ID NO:10(P_CTR1)和SEQ ID NO:11(P_CTR2)组成的组，或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的核酸序列具有至少90％、95％或99％序列同一性的核酸序列，其中所述基因盒在盒的两侧侧接有两组独特的多接头或具有与宿主细胞中包含的DNA序列具有95-100％序列同一性的两个不同DNA序列。在一个实施方案中，与宿主细胞中包含的DNA序列具有95-100％序列同一性的两个不同DNA序列包含26s rDNA序列。在一个实施方案中，选择标记基因侧接有loxP位点。在一个实施方案中，启动子序列位于侧接有loxP位点的区域之外，但在与宿主DNA具有高度序列同一性的序列包围的序列内，并且连接至多接头或基因编码序列。

根据一个实施方案，使用本文公开的补充质粒破坏解脂耶氏酵母中的基因并进一步去除伴随的选择标记(例如，ura3)的实验程序包括以下步骤。一种适用于此类程序的载体是载体pURA3loxp，如图13所示。使用载体的loxp位点侧翼的独特限制性位点，将与宿主序列具有高序列同一性的5’和3’序列插入载体中。这些5’和3’是根据宿主中的目标插入位点选择的，并且在一个实施方案中包含26s rDNA序列。质粒通常是线性化的，并且用线性化的质粒转化宿主细胞。基于通过PCR技术的选择和验证，鉴定包含期望重组事件的细胞。一旦鉴定出包含期望重组的细胞，随后就可以通过将cre重组酶活性引入重组宿主细胞来去除选择标记。根据一个实施方案，用质粒(例如pYKCre，参见表2)转化期望宿主转化体以切除位于loxp位点之间的序列(包括选择标记基因)。然后可以选择已消除选择标记和cre表达质粒的菌株。

根据一个实施方案，提供了用于操纵解脂耶氏酵母细胞的试剂盒。根据一个实施方案，试剂盒包括包含本文公开的转录元件的质粒和用于在解脂耶氏酵母中操纵基因表达的额外质粒构建体，包括表2中公开的任何质粒。

在一个实施方案中，包含在试剂盒中的包含SEQ ID NO:1-11的启动子中的任何一个的表达载体可以具有本文描述的任何其他元件，例如选择标记、克隆位点如多克隆位点(即多接头)、上游激活位点、增强子、终止序列、信号肽序列等。另一方面，表达载体可以是自主复制或整合到宿主细胞基因组中的载体。在另一个实施方案中，表达载体可以被环化或线性化(即，用限制性内切酶消化以便可以容易地将目的基因克隆到表达载体中)。在另一个实施方案中，试剂盒可以包括表达载体和编码用于表达的标记或对照基因的对照ORF(例如，编码LacZ-α片段的ORF)，以用作对照以显示表达载体能够连接目的基因并与目的基因一起使用。

在另一个说明性方面，试剂盒可以包括与表达载体一起使用的其他组分，例如用于转化酵母细胞的组分、用于将目的蛋白质编码序列整合到表达载体中的限制酶、连接酶、用于纯化表达载体构建体的组分、缓冲液(例如，连接缓冲液)、使用说明(例如，以促进克隆)，以及适用于用于制备和使用本文所述表达载体的试剂盒的任何其他组分。在另一个实施方案中，表达载体或试剂盒的任何其他组分可以在密封管(例如，灭菌或未灭菌)或任何其他合适的容器或包装(例如，灭菌或未灭菌)中包含在试剂盒中。包括包含选自SEQ IDNO:1-11的启动子序列的表达载体的前述段落中描述的试剂盒可以包括可操作地连接到启动子的蛋白质编码序列，其中蛋白质编码序列对于启动子是异源的(即，组合不会在自然界中发生)。

包括依赖于酶消化和连接以及吉布森组装的程序的一般克隆策略可用于制备本文公开的表达载体，如图10所示。在一个实施方案中，本公开的转录元件和表达载体包括位于多接头立即之前的ATG起始密码子。表达载体可用于靶基因的细胞内表达，或者它们可整合到宿主细胞的基因组中。通常，插入的编码序列包括翻译终止密码子，其中TAA最常用于解脂耶氏酵母。

可以通过引入独特的限制性位点(例如在开放阅读框(ORF)之前的多接头中列出的用于HindIII的AAGCTT)将待表达的目的基因插入到本文公开的表达载体中。包括leu2、CEN1-1和ORI1001在内的解脂耶氏酵母的复制区域可以包含在表达载体中，并且可以通过复制起点侧翼的限制性位点去除(参见例如图12中XbaI消化的使用)。类似地，适当放置的限制性位点的使用也可用于表达盒的回收和替换，参见例如图12，通过XbaI/SpeI消化并插入到其他表达载体的SpeI位点。可以使用表1中公开的元件交换不同载体之间的启动子和终止子序列。

在一个实施方案中，提供了一种试剂盒，其包含

第一质粒，其包含选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的诱导型启动子序列，以及多接头，其中所述多接头可操作地连接到所述启动子；以及

第二质粒，其中所述第二质粒包含

位于编码选择标记基因的核酸序列的侧翼的第一对和第二对34-bp loxp位点；

位于所述第一loxp位点上游的第一限制性位点；和

位于所述第二loxp位点下游的第二限制性位点，其中所述第一和第二限制性位点彼此不同并且是所述第二质粒所独有的。在一个实施方案中，试剂盒还包含选自由SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的阻抑型启动子。在一个实施方案中，阻抑型启动子在第一和第二限制性位点之间插入到第二质粒。在一个实施方案中，该阻抑型启动子形成为第三质粒。

在一个实施方案中，该试剂盒的第二质粒进一步包含在诱导型启动子的控制下编码cre重组酶的核酸序列。替代地，试剂盒可以包含第四质粒，其中所述第四质粒包含编码cre重组酶的核酸序列。在一个实施方案中，试剂盒的第二质粒进一步包含位于所述第一限制性位点上游的第一26s rDNA序列和位于所述第二限制性位点下游的第二26s rDNA序列。

在一个实施方案中，提供了一种试剂盒，其包含

第一质粒，其包含选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的诱导型启动子序列，以及多接头，其中所述多接头可操作地连接至所述诱导型启动子；以及

第二质粒，其中所述第二质粒包含

选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的阻抑型启动子，以及多接头，其中所述多接头可操作地连接至所述阻抑型启动子。在一个实施方案中，第二质粒包含位于多接头下游的SsrA编码序列，使得当编码序列插入多接头并且编码序列可操作地连接到启动子时，从所述构建体表达的蛋白质将包含C-末端SsrA肽标签。在进一步的实施方案中，试剂盒的第一质粒进一步包含可操作地连接至诱导型启动子的序列，其编码降解带SsrA标签的蛋白质的蛋白酶。在一个实施方案中，编码降解带SsrA标签的蛋白质的蛋白酶的各种亚基的核酸序列处于单个诱导型启动子的控制之下。在另一个实施方案中，编码降解带SsrA标签的蛋白质的蛋白酶的各种亚基的每个核酸序列处于不同的诱导型启动子之下。在该试剂盒的一个实施方案中，诱导型启动子选自SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:3ID NO:6组成的组。在试剂盒的一个实施方案中，第二质粒的阻抑型启动子选自由SEQ ID NO:10和SEQID NO:11组成的组。

图16提供了表示使用试剂盒组分制备系统的示意图，其中本发明的启动子和表达载体用于严格调节靶基因产物的表达并允许通过Cu²⁺介导的诱导和抑制的启动子活性快速关闭靶基因的活性。如图16所示，铜诱导型启动子(Pmt-1/Pmt-2)驱动从大肠杆菌中分离的基因clpX和clpP的表达。在大肠杆菌中，ClpX和ClpP一起形成ClpXP蛋白酶体，其可以选择性地识别和降解包含C末端11个氨基酸SsrA标签的蛋白质。靶基因在正常条件下表达，而在添加铜时会受到抑制。在一个实施方案中，所有四种组分都被设计在一个质粒中。靶基因在Cu²⁺阻抑型启动子(例如SEQ ID NO:10(P_CTR1)或SEQ ID NO:11(P_CTR2))的控制下从表达载体表达，其将ssrA肽添加到靶基因的蛋白质产物的羧基末端。两个基因(clpX和clpP)分别置于两个Cu²⁺诱导型启动子(例如，分别为SEQ ID NO:1(P_MT-1)和SEQ ID NO:2(P_MT-2)，或选自SEQ IDNO:1-6的任何Cu²⁺诱导型启动子的诱导型启动子的任何组合)的控制下，其中在被Cu²⁺诱导后产生降解包含ssrA肽的蛋白质的ClpXP蛋白酶的组装体。在一个实施方案中，使用包含SEQ ID NO:1和SEQ ID NO:2的双向启动子驱动clpX和clpP表达离开双链载体的相反链。在一个实施方案中，clpX和clpP表达为多顺反子构建体的一部分，该多顺反子构建体可操作地连接到选自SEQ ID NO:1-6的启动子。包含图16的构建体的细胞在不存在启动子激活/抑制量的Cu²⁺的情况下产生靶基因产物，然而细胞与刺激量的Cu²⁺的接触不仅阻止新靶蛋白的合成(通过抑制靶基因产物的表达)，而且还消除已经合成的靶蛋白(由于ClpXP蛋白酶的降解)，以便更严格地控制靶基因表达。其他降解标签/蛋白酶组合是本领域技术人员已知的并且适用于本发明。

本公开的试剂盒包含在圆红冬孢酵母和解脂耶氏酵母中操纵基因表达所必需的元件。特别地，本公开提供了分离的遗传部分、方法和载体系统。分离出六个具有双向性的铜诱导型启动子和五个阻抑型启动子。在非抑制条件下，与强组成型启动子相比，Cu²⁺阻抑型启动子显示出相对较高的活性，但可以通过补充低含量的Cu²⁺来几乎完全抑制。其中一种Cu²⁺诱导型启动子被设计用于提高串联上游激活序列(UAS)的强度。工程启动子的效用和优势通过以比天然Cu²⁺诱导型和组成型启动子二者更高的滴度生产有价值的生物产品蜡酯得到验证。启动子被设计为在圆红冬孢酵母和解脂耶氏酵母二者中发挥作用。通过使用来自小核糖核酸病毒的自剪接2A肽，其允许在解脂耶氏酵母和圆红冬孢酵母中表达多顺反子基因。进一步引入编码烟草蚀纹病毒(TEV)蛋白酶的基因以去除附着在所表达蛋白质C末端的部分2A肽，从而消除对酶活性的干扰。开发了一种载体系统，用于无缝组装用2A肽间隔的多顺反子结构。本发明为产油酵母中的蛋白质表达、菌株工程改造和开发、复杂途径的构建以及复杂遗传网络的构建提供了强大的生物技术工具。

根据一个实施方案，新的启动子和包含这样的启动子的表达载体可在用于解脂耶氏酵母的途径工程化的应用中使用，以用于生物合成蜡酯、靛蓝、构建用于更严格控制的蛋白质表达/降解机制的系统，以及延伸宿主的底物范围以包括纤维二糖

实施例1

解脂耶氏酵母中双向铜诱导型启动子的鉴定

已在酿酒酵母中鉴定出Cu²⁺诱导型启动子P_CUP1，该启动子是从编码金属硫蛋白的基因中分离出来的，金属硫蛋白是一种低分子量、富含半胱氨酸的蛋白质，并且能够结合重金属，如铜、锌、硒、镉、汞和银。如本文所公开，在解脂耶氏酵母基因组中检索到六个编码金属硫蛋白的基因，即MT-1至MT-6。这些启动子被组织为三对：位于DNA的相对链上的(P_MT-1(SEQ ID NO:1)和P_MT-2(SEQ ID NO:2)；位于DNA的相对链上的(P_MT-3(SEQ ID NO:3)和P_MT-4(SEQ ID NO:4)；以及位于DNA的相对链上的P_MT-5(SEQ ID NO:5)和P_MT-6(SEQ ID NO:6)，双向化以控制解脂耶氏酵母中金属硫蛋白的表达。

通过使用β-半乳糖苷酶(LacZ)，在存在CuSO₄的情况下测量启动子P_MT-1至P_MT-6的强度。如图2所示，所有选择的启动子的强度都可以通过补充到培养基中的终浓度为0.2mM的CuSO₄诱导，其不影响解脂耶氏酵母的细胞生长。在这些启动子中，在Cu²⁺存在下P_MT-2具有最高强度，具有第二高活性的启动子是P_MT-6。Cu²⁺对P_MT-2实现了超过16倍的诱导。P_MT-2和P_MT-6二者的强度与之前鉴定的组成型启动子(如P_TEF)相当，但它们可以被作为廉价和高效的诱导剂的Cu²⁺激活。特别地，启动子组成了三对双向启动子，包括P_MT-1/P_MT-2、P_MT-3/P_MT-4和P_MT-5/P_MT-6。

实施例2

解脂耶氏酵母中氨基酸阻抑型启动子的鉴定

为了分离解脂耶氏酵母中的阻抑型启动子，我们通过分别补充L-苏氨酸或L-缬氨酸、L-甲硫氨酸和L-丝氨酸检查了参与氨基酸生物合成的基因THR1(YALI0F13453p)、MET3(YALI0B08184p)和SER1(YALI0F06468p)的启动子强度。添加10mM氨基酸的P_SER1的P_THR1的活性为其未添加氨基酸5小时后活性的约一半(见图3)。与非抑制条件相比，添加10mM L-甲硫氨酸后P_MET3的强度保持66％。这些启动子的强度可以通过添加相应的氨基酸来抑制。

实施例3

解脂耶氏酵母中铜阻抑型启动子的鉴定

为了寻找对廉价化学品有反应的阻抑型启动子，克隆了属于铜转运蛋白家族的基因CTR1(YALI0C20295p)和CTR2(YALI0F24277p)的两个启动子，并进一步研究了它们的强度。如图4所示，低浓度的Cu²⁺几乎完全抑制了P_CTR1和P_CTR2的强度。存在0.16mM Cu²⁺时P_CTR1的强度仅为未添加Cu²⁺时活性的5％。此外，没有抑制的P_CTR1的强度远高于强启动子P_TEF，而没有抑制的P_CTR2的强度是P_TEF的一半。

实施例4

解脂耶氏酵母中由PMT-2组成的杂种启动子的工程化

研究了UAS拷贝数对添加和不添加铜的P_MT-2强度的影响(图5)。结果表明，当在P_MT-2的上游添加16个串联重复的UAS(UAS16)时，无铜诱导的基础活性和存在0.1mM CuSO₄的强度均达到其最高水平。即使没有铜诱导，P_MT-2-UAS16也具有相对较高的基础强度。这表明P_MT-2及其杂种形式P_MT-2-UAS16均被最高达0.2mM的铜含量诱导，并且P_MT-2-UAS16在相同条件下显示出比P_MT-2更高的活性(图6)。通过使用串联的UAS，进一步增加了铜诱导型启动子的动态调节范围，从而为解脂耶氏酵母中的基因表达和代谢工程的控制提供了额外益处。

实施例5

分离和工程化启动子在解脂耶氏酵母用于生产蜡酯的代谢工程中的效用

为了证明在本研究中分离和工程化的启动子的效用，我们使用启动子P_MT-2-UAS16设计了一条生产生物基长链蜡酯(WE)的途径。WE是广泛用于制造个人化妆品、药物和润滑剂的高价值产品。过去，WE是从鲸油中获得的；然而，现在禁止捕杀抹香鲸阻碍了它进入工业市场。目前用于WE生产的实践依赖于来自灌木荷荷巴(Simmondsia chinensis)的荷荷巴油，荷荷巴适应干旱地区如沙漠地区，但不适合大规模种植。有限的可用性和高生产成本阻碍了WE在广泛应用中的使用。WE的微生物生产提供了一种替代途径，可以潜在地克服这些障碍并促进WE的可持续、大规模和高效生产。在我们之前的研究中，我们通过表达编码来自谷仓猫头鹰(Tyto alba)的脂酰辅酶A还原酶的TaFAR基因，对解脂耶氏酵母进行工程化以生产脂肪醇(C16-C18)。在本发明中，我们通过表达来自小鼠(Mus musculus)的密码子优化的MmWS基因SEQ ID NO:16)来扩展该脂肪醇形成途径以生产WE，该基因编码WE合酶/酰基辅酶A:二酰基甘油酰基转移酶(WS/DGAT)。

气相色谱(GC)分析表明，在存在0.2mM CuSO₄的情况下，在PMT-2-UAS16的控制下表达MmWS的菌株产生了一种代谢物，其保留时间与标准棕榈酰基棕榈酸(C16,C16)的保留时间相匹配。我们通过GC-MS进一步确认了产品的结构，包括其他次要产品，包括硬脂酰基硬脂酸(C18,C18)和棕榈油酰基硬脂酸(C16:1,C18)。由在40g/L葡萄糖上生长4天的重组体产生的WE滴度最高达199.4mg/L，高于通过PTEF驱动表达MmWS的脂肪醇生产菌株产生的179.6mg/L的WE滴度。类似地，在添加0.2mM Cu²⁺的情况下通过使用P_MT-2表达MmWS导致150.9mg/L的WE积累。所有菌株仍然产生高含量的脂肪醇(图7)。本研究证明了通过产油酵母的工程化首次形成长链WE，并且通过途径工程化和发酵优化均可实现更高的产量。已经设计了启动子，并且启动子的效用已在解脂耶氏酵母用于生产新型高价值产品WE的代谢工程中得到验证。

实施例6

来自圆红冬孢酵母的天然启动子的工程化

在解脂耶氏酵母中测量了来自圆红冬孢酵母的四个充分表征的启动子的强度，包括P_PGK、P_FBA、P_TPI和P_GPD。如图8所示，与天然启动子P_TEF相比，它们在解脂耶氏酵母中的活性非常低。我们通过添加解脂耶氏酵母16个拷贝的UAS进一步改造了启动子P_GPD，并将所得的杂种启动子命名为P_GPD-UAS16。新启动子的活性显著增加，甚至高于解脂耶氏酵母天然启动子TEF(图8)。进一步使用启动子P_TEF-UAS16(SEQ ID NO:21，启动子上游有16个UAS元件修饰)替代质粒pYaliHex中的启动子，新载体可直接用于解脂耶氏酵母和圆红冬孢酵母中的基因表达，而不需要宿主依赖性优化。

实施例7

表达载体pYaliHex的开发

如图9所示，开发了质粒pYaliHex以用于在解脂耶氏酵母中表达多个基因。在pYaliHex中，有被编码两个连续2A肽的序列间隔开的编码gfp和TEV肽酶的基因。该质粒提供了多个限制性位点如HindIII、PstI、SmaI以用于克隆靶基因。pYaliHex中的氨苄青霉素抗性基因被修饰以包括限制性位点PmeI和SwaI。

实施例8

使用开发的载体系统组装多顺反子结构

如图10所示，可以进行三个步骤来克隆目的基因并组装由T2A肽序列组成的多顺反子结构。(1)将目的基因克隆到质粒pYaliHex中；(2)通过PmeI(回收供体片段)或SwaI(回收受体片段)对重组质粒进行线性化；以及(3)基于产生的同源区域，使用吉布森组装来组装PmeI消化和SwaI消化的片段。由于SwaI和PmeI限制性位点都已再生，所得质粒可以重新用作供体或受体片段以与其他基因或多顺反子构建体融合。

实施例9

解脂耶氏酵母中纤维二糖代谢途径的工程化

将利用纤维二糖的代谢途径通过编码纤维糊精转运蛋白的CDT1和编码β-葡萄糖苷酶的BGL两个粗糙链孢霉基因的异质表达引入到解脂耶氏酵母中。使用两种方法来表达CDT1和BGL。第一种是用T2A肽序列分离的CDT1和BGL的共表达。在第二种表达载体pSX30中，CDT1和BGL被TEV切割位点和T2A肽序列隔开，并且还包括TEV编码序列。如图11A-11C所示，携带第二种载体的菌株(pSX30)在相同培养条件下表现出比携带pF2的重组体在纤维二糖上更好的生长性能。这些结果突出了表达TEV肽酶以去除添加到蛋白质(如本实施例中的CDT1)中的部分切割的2A肽的优势，从而使该途径达到更好的性能(图11C)。

实施例10

编码蛋白Ku70的基因被破坏的解脂耶氏酵母的产生

分离出了多种解脂耶氏酵母菌株并报告了多种应用，例如柠檬酸发酵、脂质生产和环境生物修复等。其中，法国单倍体菌株W29(ATCC 20460)是最广泛表征的菌株之一。来源于菌株W29的解脂耶氏酵母PO1f(ATCC MYA-2613)是一种营养缺陷型菌株，其无法在缺乏亮氨酸和尿嘧啶的培养基上生长，并且无法产生胞外蛋白酶。解脂耶氏酵母W29和PO1f的基因组已经完全测序。由于明确的遗传背景和营养缺陷型，解脂耶氏酵母PO1f已被广泛基因工程改造。在该实施方案中，通过敲除解脂耶氏酵母PO1f中编码Ku70蛋白的基因开发了解脂耶氏酵母ΔKu70。Ku70蛋白的缺失可以通过增加引入的基因片段与解脂耶氏酵母中的靶基因之间的同源重组来促进基因缺失和替换的过程。

亲本菌株解脂耶氏酵母W29(ATCC 20460)和解脂耶氏酵母PO1f(ATCC MYA-2613)购自美国典型培养物保藏中心(ATCC)。将与Ku70的上游和下游区域同源的约2.0-kb DNA片段依次克隆到质粒pUra3loxp中。将所得质粒线性化后，将DNA转化到解脂耶氏酵母PO1f中，并通过PCR筛选转化体。在确认Ku70缺失后，从菌株中去除ura3，并进一步去除携带Cre重组酶基因的质粒pYLCre。在该菌株中，Ku70蛋白被破坏以简化生成基因敲除和其他位点特异性同源基因整合事件的程序。解脂耶氏酵母ΔKu70的优点是无需筛选许多转化体即可获得用于基因缺失或位点特异性基因掺入基因组的理想菌株。

解脂耶氏酵母宿主菌株ΔKu70是一种营养缺陷型菌株，在leu2和uar3基因二者中具有突变。解脂耶氏酵母ΔKu70可以在完全培养基如酵母提取物-蛋白胨-葡萄糖(YPD)培养基或补充有尿嘧啶和亮氨酸的基本培养基上在28-30℃生长。用于转化解脂耶氏酵母ΔKu70的质粒携带leu2或ura3基因，与宿主中的相应缺陷基因互补。可以根据其在缺乏尿嘧啶或亮氨酸的培养基上生长的能力来选择转化体。在转化之前，解脂耶氏酵母ΔKu70不能在没有亮氨酸或尿嘧啶的基本培养基上生长。

实施例11

用于解脂耶氏酵母的表达载体

要在解脂耶氏酵母中表达异源基因和天然基因，需要功能性启动子通过使用可复制或整合质粒来驱动基因表达。作为合成生物学中的重要工具，启动子已被表征和并对解脂耶氏酵母进行工程化。该试剂盒提供了包含跨越广泛强度范围的单个和单一启动子的表达载体，并且还包括使用铜诱导型启动子构建的表达载体(表1)。这些表达载体提供了必要的工具来微调靶基因的表达。在该系统中，表达盒可以很容易地从载体中通过用指定的限制性内切酶(如XbaI/SpeI)消化回收，然后可以方便地与另一个进行组装。多基因表达可以通过包含启动子、克隆基因和终止子的表达盒的顺序组装来实现。此外，还提供了包含来自xpr2启动子的串联16个拷贝的上游激活序列(UAS16)的载体，用于对天然启动子进行工程化。该试剂盒中提供了编码β-半乳糖苷酶的基因lacZ，用于验证和量化启动子的强度(表2)。最后，通过将表达盒克隆到包含同源序列例如特定靶基因座或部分26s rDNA的质粒中并转化解脂耶氏酵母，可以将表达盒以单拷贝或高拷贝进一步引入到基因组中(表2)。

该试剂盒中包含的一组表达载体如表1所示。表1中列出的所有载体均包含大肠杆菌和解脂耶氏酵母的复制位点，作为大肠杆菌选择标记的氨苄青霉素抗性基因，以及作为解脂耶氏酵母的选择标记的leu2。大多数大肠杆菌菌株如Top10、DH5α和JM109可用于基因克隆和质粒增殖。表达载体pYLexp2包含启动子tef1N，它是解脂耶氏酵母中基因表达最常用的启动子之一。以下图显示了pYLexp2中的主要特征及其组织(图12和表3)。表2提供了本文使用的质粒列表和质粒的主要特征。表2包括根据本发明开发的用于产生敲除菌株的质粒、用于将基因片段整合到酵母基因组中的质粒和携带cre编码重组酶的质粒的特征。

表1.用于根据本公开使用开发的表达载体

表2.根据本公开使用的其他质粒

表3.表达载体pYLexp2的一般特征(见图12)

实施例12

用表达载体转化解脂耶氏酵母

用于解脂耶氏酵母转化的质粒DNA可用常规分子生物学技术制备。无需线性化，源自该试剂盒(表2)中提供的表达载体的质粒可用于直接转化解脂耶氏酵母。尽管已经为解脂耶氏酵母的遗传转化开发了各种方案和方法，但由于方便和高效，建议按照制造商的指南用Frozen-EZ酵母转化II试剂盒(Zymo Research,Irvine,CA,U.S.)进行转化。可以将酵母转化体铺在不含亮氨酸的合成培养基琼脂平板上，该培养基由以下组成：20g/L葡萄糖、6.7g/L酵母氮碱(YNB)，不含氨基酸并且具有硫酸铵(US Biologicals)，补充有2.0g/L的缺乏亮氨酸的完全氨基酸补充(US Biologicals)。在28-30℃下培养3天后，可以看到菌落并准备好从琼脂平板上挑取。同样，不含亮氨酸的合成液体培养基可用于培养重组体。

实施例13

解脂耶氏酵母中基因的缺失和整合

基因的缺失可用于研究基因功能和阻断代谢途径。解脂耶氏酵母基因敲除的产生涉及开发包含上游和下游同源臂和选择标记(例如uar3)的质粒，以替换要敲除的靶基因。该质粒用于转化解脂耶氏酵母，任选地使用线性化质粒，并验证基因缺失。在这个实施方案中，uar3侧翼具有34-bp loxp位点，因此在确认期望重组事件后，可通过编码重组酶的cre的表达去除选择标记(参见图14)。通过这种迭代基因整合和标记管理过程，可以产生解脂耶氏酵母的组合基因敲除。此外，可以将表达盒克隆到含有用于将它们整合到位点特异性位点的同源区域的质粒中。通常，基因在酵母基因组中的存在比在可复制载体中克隆的基因的存在更稳定。最后通过26s rDNA整合，将基因片段以高拷贝数整合到基因组中。

下面提供了一组用于使解脂耶氏酵母中的靶基因缺失的程序：

步骤1：生成破坏质粒并用线性化质粒转化酵母

靶基因(任选的26s rDNA序列)的约1-kb同源5’侧翼和3’侧翼可以分别克隆到质粒pUra3loxp中的ApaI/XbaI和SpeI/NdeI限制性位点(质粒图谱见图13)。所得质粒的线性化可以通过用ApaI或NdeI单消化而不破坏克隆的片段来进行，然后回收的DNA可用于转化解脂耶氏酵母ΔKu70。使用Frozen-EZ酵母转化II试剂盒(Zymo Research,Irvine,CA,U.S.)进行转化后，酵母转化体可以在由合成培养基琼脂平板上在28-30℃下生长，该培养基由20g/L葡萄糖、6.7g/L YNB(US Biologicals)并补充有缺乏尿嘧啶的氨基酸(USBiologicals)组成。

步骤2：通过PCR诊断验证基因敲除

2-3天后，挑取单个菌落，并在YPD肉汤中在28-30℃下进一步培养。同时，可以在YPD琼脂平板上复制菌落。通常，6个菌落足以获得基因被破坏的菌株。培养1-2天后，将1.0ml酵母培养物用于提取基因组DNA。尽管有不同的方法和试剂盒可用于从酵母细胞中提取基因组DNA，但以下程序已被验证为一种高效、快速且廉价的方法，以获得适用于PCR的相对高质量的基因组DNA。

1).收获细胞并重悬在由200mM乙酸锂和1％ SDS组成的500μl裂解液中；

2).在70℃下孵育20分钟；

3).添加等体积的氯仿:异戊醇(24:1)，涡旋并且离心；

4).收集水相，并且添加两倍体积的96-100％乙醇；

5).在冰箱于-20℃保持至少2小时，离心得到沉淀的DNA；

6).用1ml 70％乙醇清洗DNA沉淀；

7).将沉淀溶解在30μl的H2O或TE缓冲液中；

8).在20-ul反应混合物中使用0.5μl DNA溶液作为模板进行PCR；

ura3-testF、ura3-testR的引物和位于5’和3’侧翼外侧的两个引物(F和R)旨在生成PCR产物以验证交叉事件。本实施方案中使用的引物和ura-testF、ura3-testR的序列(5’至3’)为：

ura3-testF:TCCTGGAGGCAGAAGAACTT(SEQ ID NO:18)；

ura3-testR:AGCCCTTCTGACTCACGTAT(SEQ ID NO:19)；

然而，可以根据uar3标记的序列设计其他合适的引物来执行类似的功能。通过进行琼脂糖凝胶电泳检查PCR产物的大小来验证基因敲除。

步骤3：通过重组酶的表达来回收标记

以下步骤可用于去除敲除菌株中的ura3标记。

1).在YPD肉汤中于28-30℃培养鉴定出的敲除菌株的单菌落。收获细胞后，用带有编码cre重组酶的核酸的质粒pYLCre转化菌株。将酵母转化体铺在不含亮氨酸的合成YNB培养基的琼脂平板上；

2).从不含亮氨酸的合成YNB培养基的琼脂平板中挑取转化体，并将其接种到YPD肉汤中；

3).在YPD琼脂平板上对过夜培养物划线得到单菌落，并且在28-30℃孵育1天；

4).挑出单个菌落(通常10个菌株就足够了)并将它们复制到两个合成培养基平板上：对uar-和leu-以及YPD琼脂平板具有选择性。不能在不含尿嘧啶的培养基上生长的细胞没有ura3，质粒pYLCre在不能在不含亮氨酸的培养基上生长的细胞中丢失。为了验证标记丢失，可以使用适当的引物进行PCR。不含ura3基因且不含质粒pYLCre的菌株可用于下一轮的基因缺失。

SEQUENCE LISTING

<110> 华盛顿州立大学；熊小超；陈树林

<120> 用于在产油酵母中表达基因的通用基因表达系统

<130> 67635-335006

<150> 63/008,098

<151> 2020-04-10

<150> 63/147,352

<151> 2021-02-09

<160> 27

<170> PatentIn version 3.5

<210> 1

<211> 903

<212> DNA

<213> 解脂耶氏酵母

<400> 1

tgagatagtg agtttggaag tagtgttgag agtggtgaat gaaaagatgt ctgtgcagtg 60

agaaaaggag ggacatctgg ccgtatttat agattttccc gttcctagat cttcaaaata 120

cagttgtatt cagccgcagc gcaaagtacg catctgcatc ggcagtagca ctaatgtcgc 180

aaagaatgcg gttagacaaa gaaaaaaggc acagccgtgg cacaaacttc tcatatctcc 240

aatgattgac taagatttag gtggcgctaa agtaaacaat gtctttgtag aacttgctag 300

aagggtctga aagagaatgg aaatgtgtaa aggtgtgaag gatagtaatt gtacaagggt 360

gtacgagaag caactcaacc tggactatgt ggattcgatt cacctacttt taacattcaa 420

ctcgaactaa tgtcattata agcgtgccac tcaagtctct atccttctcc attcttccaa 480

cgtctgtgtc aggtgcatcg tacatattgt agatctctcg tcaaagttcc gaagtgtata 540

ttccaatagg actccgaaaa cgcacaagtc cacatgatgc tagacattcg gactccgaaa 600

cactaggagg ggctattatt gtgagatatt tcattattaa tgccgtttgg ccgaatttag 660

ccccgtttca gtggtatttt accgcgcatt actggagcat tcgaggggtt tatgctgcta 720

aggtttcgct tgtatgcgag atgcgagatt atcgctgcgg ctgaaataat tagtaaaaaa 780

gtgaaaaatt accagattgc aatatgtgct cttcgcaaca gcagcagcag atataaatag 840

gagacgagat ccgcaattcg gttgtcacac actcacacac acacacacac acacacacac 900

ata 903

<210> 2

<211> 903

<212> DNA

<213> 解脂耶氏酵母

<400> 2

tatgtgtgtg tgtgtgtgtg tgtgtgtgtg agtgtgtgac aaccgaattg cggatctcgt 60

ctcctattta tatctgctgc tgctgttgcg aagagcacat attgcaatct ggtaattttt 120

cactttttta ctaattattt cagccgcagc gataatctcg catctcgcat acaagcgaaa 180

ccttagcagc ataaacccct cgaatgctcc agtaatgcgc ggtaaaatac cactgaaacg 240

gggctaaatt cggccaaacg gcattaataa tgaaatatct cacaataata gcccctccta 300

gtgtttcgga gtccgaatgt ctagcatcat gtggacttgt gcgttttcgg agtcctattg 360

gaatatacac ttcggaactt tgacgagaga tctacaatat gtacgatgca cctgacacag 420

acgttggaag aatggagaag gatagagact tgagtggcac gcttataatg acattagttc 480

gagttgaatg ttaaaagtag gtgaatcgaa tccacatagt ccaggttgag ttgcttctcg 540

tacacccttg tacaattact atccttcaca cctttacaca tttccattct ctttcagacc 600

cttctagcaa gttctacaaa gacattgttt actttagcgc cacctaaatc ttagtcaatc 660

attggagata tgagaagttt gtgccacggc tgtgcctttt ttctttgtct aaccgcattc 720

tttgcgacat tagtgctact gccgatgcag atgcgtactt tgcgctgcgg ctgaatacaa 780

ctgtattttg aagatctagg aacgggaaaa tctataaata cggccagatg tccctccttt 840

tctcactgca cagacatctt ttcattcacc actctcaaca ctacttccaa actcactatc 900

tca 903

<210> 3

<211> 889

<212> DNA

<213> 解脂耶氏酵母

<400> 3

tgtgagtttg caagtgtgga gagtggtaga tgagatgatt tgtttctgtg tactgagaaa 60

aggagggaga tgtggcccta tttatagatt ttttcagttc ctagatttac aagatacagt 120

tttattcagc cgcagcacaa cgcacgcatc tgcatcagca gtagcactaa tgtcgcaaat 180

aatggggtta gacaaagaaa atggcacagc cgtggcacaa acctcgcata tcaccagtga 240

ttgacttaga tttaggtggc gctaaggtat acaatgtctt tgtggaactt gctagaaggg 300

tctgaaagag tatggtgtgt ataaacatgt aaagcataga ctgtgtataa gggtgtacga 360

gaaccatttc aacttggact atgtggattc gattcaccta cttttgacac tcgatttgaa 420

cacatttcat aatgagcgtt ccactcaagt ccctatcctt ctccattctt ccaacgtctg 480

tatcaggtgc atcgtagatc tctcgtcaaa gttgaaagtg aacatgtgag actcgaaaaa 540

cgcacgataa agtccacatg atgccagcca tttggactcc gaaacacttg aaggtgatat 600

tattgtcaga tctgtcatta ttataccgct tgatccaatt taggtccatt tcaatagtat 660

tttatggtgc atcactggaa cattcgagcg gtatatgctg ctaaggtttc gcttgtatgc 720

gagatgcgag attgtcgctg caactgaaat aattagtaaa aaaagtgaaa agttatcaga 780

tggcaaaatg tgctcgtcgc aacagcagca gtagatataa ataggagatg aggtccatgg 840

tttgtctctc tctctcacac acacacacac acacacaacc acaaccaca 889

<210> 4

<211> 896

<212> DNA

<213> 解脂耶氏酵母

<400> 4

tgtggttgtg gttgtgtgtg tgtgtgtgtg tgtgagagag agagacaaac catggacctc 60

atctcctatt tatatctact gctgctgttg cgacgagcac attttgccat ctgataactt 120

ttcacttttt ttactaatta tttcagttgc agcgacaatc tcgcatctcg catacaagcg 180

aaaccttagc agcatatacc gctcgaatgt tccagtgatg caccataaaa tactattgaa 240

atggacctaa attggatcaa gcggtataat aatgacagat ctgacaataa tatcaccttc 300

aagtgtttcg gagtccaaat ggctggcatc atgtggactt tatcgtgcgt ttttcgagtc 360

tcacatgttc actttcaact ttgacgagag atctacgatg cacctgatac agacgttgga 420

agaatggaga aggataggga cttgagtgga acgctcatta tgaaatgtgt tcaaatcgag 480

tgtcaaaagt aggtgaatcg aatccacata gtccaagttg aaatggttct cgtacaccct 540

tatacacagt ctatgcttta catgtttata cacaccatac tctttcagac ccttctagca 600

agttccacaa agacattgta taccttagcg ccacctaaat ctaagtcaat cactggtgat 660

atgcgaggtt tgtgccacgg ctgtgccatt ttctttgtct aaccccatta tttgcgacat 720

tagtgctact gctgatgcag atgcgtgcgt tgtgctgcgg ctgaataaaa ctgtatcttg 780

taaatctagg aactgaaaaa atctataaat agggccacat ctccctcctt ttctcagtac 840

acagaaacaa atcatctcat ctaccactct ccacacttgc aaactcacat ttcaca 896

<210> 5

<211> 852

<212> DNA

<213> 解脂耶氏酵母

<400> 5

tgtgatagtg tgtttgtgtg taggtggtgt tggagatgag atggtgtgtc tgtgtactga 60

gaaaaggagg gataacgggc cgtatttata gattttcccg ttcctagatc tacaagatac 120

agttgtattc agccgcagca caatgcacgc atgggcatgg cagtagcact aatgtcgcaa 180

agaatggggt caaacaaaga gagagacgcg gctgtggcac aatgatctca tatctagaac 240

attcgtaaca gattagatgg cgctatgtaa acaatgtctt tatggaatgg ggaaagaaga 300

tgggggaaga ctgtagccaa cgccgcacca aaagtgacct caactgaccc atatacacga 360

gactcacttg cttccagatc cctccttgat cctcctatcg gaaacgagct cacttcacat 420

ctaccagctc ttctgcttcg cagatcaccc ccagtaccta ctccaagctc aaagtacatt 480

ccagtcggac tccgaaaaaa cgcaatatac tctaatatga ggctgtcgga ctccgaaaca 540

ctaaacaatc gccatttttg tctgattcaa tacatattaa caccaattct ctctttaaat 600

ccctttcagc tccttgatgg gttctggaat attcgagcgg attgtgctgc taaggtttcc 660

attgtatgca aggtgcgaga ttatcgctgc ggctgaagaa actcaaaatg tgaaagttca 720

tgatatggcg aagagtgcgc ccaagacgaa tgccagcact ggacaatata aatagaagat 780

ggaatccgcc gttcaattca atcacaaata caaacactca caaacactca caaacactca 840

cacacaacca ca 852

<210> 6

<211> 850

<212> DNA

<213> 解脂耶氏酵母

<400> 6

tggttgtgtg tgagtgtttg tgagtgtttg tgagtgtttg tatttgtgat tgaattgaac 60

ggcggattcc atcttctatt tatattgtcc agtgctggca ttcgtcttgg gcgcactctt 120

cgccatatca tgaactttca cattttgagt ttcttcagcc gcagcgataa tctcgcacct 180

tgcatacaat ggaaacctta gcagcacaat ccgctcgaat attccagaac ccatcaagga 240

gctgaaaggg atttaaagag agaattggtg ttaatatgta ttgaatcaga caaaaatggc 300

gattgtttag tgtttcggag tccgacagcc tcatattaga gtatattgcg ttttttcgga 360

gtccgactgg aatgtacttt gagcttggag taggtactgg gggtgatctg cgaagcagaa 420

gagctggtag atgtgaagtg agctcgtttc cgataggagg atcaaggagg gatctggaag 480

caagtgagtc tcgtgtatat gggtcagttg aggtcacttt tggtgcggcg ttggctacag 540

tcttccccca tcttctttcc ccattccata aagacattgt ttacatagcg ccatctaatc 600

tgttacgaat gttctagata tgagatcatt gtgccacagc cgcgtctctc tctttgtttg 660

accccattct ttgcgacatt agtgctactg ccatgcccat gcgtgcattg tgctgcggct 720

gaatacaact gtatcttgta gatctaggaa cgggaaaatc tataaatacg gcccgttatc 780

cctccttttc tcagtacaca gacacaccat ctcatctcca acaccaccta cacacaaaca 840

cactatcaca 850

<210> 7

<211> 500

<212> DNA

<213> 解脂耶氏酵母

<400> 7

ttgcgagggg agaccagaca tggtggaagc acatgagggc ggggggccga tgccggtgct 60

ggaaagtcga ggtttgcaag ctgcatttcg acaaacttgc ggttcagtca cactccaaca 120

acctggtaac tccacacaag ccacaaatcc gttgtaccgt ttcagctaca ccgccacaag 180

tttttttcat tttgagccac aacctggatt tcacatcaga catgaactga ttaggctctg 240

tgggggggga tggcacagat aagcagttga tgtagcagaa gagaggggtt ggggcggatt 300

ctcgagactc catcctgttg ttttatcacg tgacttgtgt acttgtgtgc ttgtggctct 360

ttcactgctt ccgttgcatt tgagcccctc cagttgaccc agaccctcca tggaacacgt 420

ctctaaacaa ggtttagttt ttccaaatga ctgaatactc cgaaatcagt cgcagagaga 480

cttaacacac tccaccacaa 500

<210> 8

<211> 781

<212> DNA

<213> 解脂耶氏酵母

<400> 8

gagacccccg aacaaatgtg ccacaccctt gccaaaatga cgaatacacg gcgtcgcggc 60

cgggaatcga actcttggca ccgccacagg agtgaaattt gaaatttgaa atttgaaaaa 120

taattcacat tttgagtttc aataatatat cgatgaccct cccaaaagac ccaagtcgag 180

acgcaaaaaa acacccagac gacatggatg cggtcacgtg accgcaaaaa ccgccccgga 240

aatccgtttg tgacgtgttc aattccatct ctatgttttt ctgcggtttc tacgatgccg 300

caatggtggc caatgtgcgt ttcactgccg tagtggctgg aacaagccac agggggtcgt 360

cgggccaatc agacggtccc tgacatggtt ctgcgcccta acccgggaac tctaaccccc 420

gtggtggcgc aatcgctgtc ttcatgtgct ttatctcacg tgacggctgg aatctggcag 480

aagacggagt atgtacattt tgtcgttggt cacgttatcc ctaaaacgtg gtgtttaaac 540

tggtcgaatg cttggcccag aacacaagaa gaaaaaaacg agacaacttg atcagtttca 600

acgccacagc aagcttgtct tcactgtggt tggtcttctc cacgccacaa gcaacacgta 660

catgtcaatt acgtcagggt cttttaagtt ctgtggcttt tgaaccagtt ataaagaacc 720

aaccaccctt ttttcaaagc taatcaagac ggggaaattt tttttttgat atttttcgac 780

a 781

<210> 9

<211> 599

<212> DNA

<213> 解脂耶氏酵母

<400> 9

tctagaaatt atattttttt ctgcatatac atattcattt aatagaggag caaagattct 60

tatccccact caagtaattt gttgctataa ctaccaacct ggaccaaccg tacatagtcg 120

tagcgattat tacaacacac ccgaaaacac cataaaaacc ctgtaattcg atacattgga 180

attcgatcag aaaacaatgt ctcttactat cagtttcgat cactaaacct ctctctttac 240

catttgtata tattcaactc cttctggtat acacacatgc ccacaccaac tgtacacact 300

caacactgcg gctcatatat gcaccatgta tgacgcaacg tctcagtcac catctcagtg 360

aaccagtatg taggtgtgtg gtgggttgta cccagacgtg ttccagaata tatatataaa 420

gggccgattt ctcgttttca aacctctcca aactgcacaa tccaaccacc aagagtcact 480

cctcctctaa tacactgtga ctcttctgac tcgggaatca aactttttac agtcacttta 540

taggtgcagc agtatctcga tctcaggaca accacagaat caccacctac tacgacaca 599

<210> 10

<211> 791

<212> DNA

<213> 解脂耶氏酵母

<400> 10

gatcagaact aagctaacac tacagtagaa acagaagaga agccacgaga ggagaaaagg 60

tcacgtgatc cacgagataa caccctccct gatatgttac gtcacgtggc acattctatc 120

ccttctgtgc aatgtcacgt gcctgacctt tctcttcgac cgagagtcct acttttactt 180

gcagctttct cgccgcaccc tctaaatttg ctcgtcggtg catttacgat gtacagttgc 240

gaatctcggg tgattttttg ctcacatttt ggcggtagag cacttctttc cggtgcgaaa 300

tccgtcaaaa tgcaagttcg gggtatttgc gactatggtg atagttttgg aagtgtttct 360

gagtcaatta ctttgggatt ctccttctca ttcccttttg tatatggtat tctatggcat 420

gtatcatggc ttggagttgt ctgaaactca aaatacacct tgataaaatc tgattatctt 480

taacctaaaa gaggtagatc ggaagagtac gaagatagtt ttccggaaca gctacggaaa 540

acggtttgtg aatattaagg gaagttgggg accatggttt tcgtgtcaca tgatctacaa 600

gttgtgtccc ctgtgtgtgt tttgtgtcct gcagtttctg taacgcagtt gtatgtacag 660

tatgtacagt accaggacat actcctaacg ggcctcctct tgcacctgca cctggacgag 720

caaatttcga gcagatatcg agttaccatg caaagatcgg cgtatatata gacaggagct 780

tgggcctatg t 791

<210> 11

<211> 408

<212> DNA

<213> 解脂耶氏酵母

<400> 11

accaatgacc atccagtaaa ctcttcccag aaaccctggt cttggagatc cgtccgagtt 60

gtatgagccc tgtccctggt ttttggcggt ggccagaatg tcgtagacca tgttgtgagt 120

gacttcgagg gagtttgctg agaataggaa cctcctggag ctggtcgtaa ggactccgat 180

accacacact ctttacagtt tgctcaaaga tgcatagtgt tccgctagct agtaatagta 240

taaatctatt cgcacataga ctcagatttt ccagctgaaa cgagcaaata tcaaactcaa 300

aaaagagaca tcagcagctc ataattccag tatttccatc tcttttttat tcaactccaa 360

caccatttct cacacacaaa aatgagccac gaccacggaa gcatggat 408

<210> 12

<211> 105

<212> DNA

<213> 解脂耶氏酵母

<400> 12

ctgaggtgtc tcacaagtgc cgtgcagtcc cgcccccact tgcttctctt tgtgtgtagt 60

gtacgtacat tatcgagacc gttgttcccg cccacctcga tccgg 105

<210> 13

<211> 21

<212> PRT

<213> 明脉扁刺β四体病毒

<400> 13

Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu

1 5 10 15

Glu Asn Pro Gly Pro

20

<210> 14

<211> 22

<212> PRT

<213> 野猪

<400> 14

Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val

1 5 10 15

Glu Glu Asn Pro Gly Pro

20

<210> 15

<211> 63

<212> DNA

<213> 明脉扁刺β四体病毒

<400> 15

ggctccggcg agggccgagg ctccctgctg acctgcggcg acgtcgagga gaaccccggc 60

ccc 63

<210> 16

<211> 1026

<212> DNA

<213> 小家鼠

<400> 16

aagcttatgt tctggcccac caagaaggac ctgaagaccg ctatggaggt cttcgctctc 60

ttccagtggg ccctgtctgc tctcgtcatc gtgaccaccg tcatcattgt gaacctgtac 120

ctcgtcgtgt tcacctccta ctggcccgtc accgtgctga tgctcacctg gctggccttc 180

gactggaaga cccctgagcg aggcggtcga cgattcacct gcgtgcgaaa gtggcgactg 240

tggaagcact actctgacta cttccccctc aagatggtca agaccaagga catctccccc 300

gaccgaaact acattctggt ttgtcacccc cacggcctca tggctcactc ttgtttcggt 360

cacttcgcta ccgacaccac cggtttctcc aagaccttcc ccggaattac cccctacatg 420

ctgaccctcg gcgctttctt ctgggtcccc ttcctgcgag actacgtgat gtctaccggt 480

tcctgctctg tctcccgatc ctctatggac ttcctgctca cccagaaggg caccggtaac 540

atgctcgtgg tggtggtggg aggcctcgcc gagtgtcgat actctacccc cggctccacc 600

accctgttcc tcaagaagcg acagggattc gtccgaaccg ctctgaagca cggcgtgtcc 660

ctcatccctg cctacgcttt cggagagacc gacctgtacg accagcacat tttcaccccc 720

ggtggattcg tcaaccgatt ccagaagtgg ttccagaaga tggtgcacat ctacccctgt 780

gccttctacg gacgaggcct gaccaagaac tcttggggtc tgctccccta ctcccagccc 840

gtcaccaccg tggtgggaga gcctctgcct ctccccaaga tcgagaaccc ctctgaggag 900

attgtggcca agtaccacac cctgtacatt gacgctctgc gaaagctctt cgaccagcac 960

aagaccaagt tcggcatctc cgagacccag gagctcgtca ttgtgtaagt cattgtgtaa 1020

cccggg 1026

<210> 17

<211> 729

<212> DNA

<213> 烟草蚀纹病毒

<400> 17

atgggcgagt ctctgttcaa gggccccaga gactacaacc ccatctcctc caccatctgt 60

catctgacca acgagtccga tggtcacact acctccctct acggtatcgg cttcggcccc 120

ttcatcatca ctaacaagca tctgtttcga cgaaataacg gtactctgct cgtgcaatcc 180

ctccacggcg tgttcaaagt caagaacacc accaccctcc agcagcacct cattgacggc 240

cgagacatga tcatcattcg aatgcccaag gacttccccc cctttcccca gaagctcaag 300

tttcgagagc cccagcgaga ggaacgaatc tgtctggtca ccaccaactt ccagaccaag 360

tccatgtcct ccatggtgtc cgacacctct tgcactttcc cctcctctga cggcatcttc 420

tggaagcact ggatccagac caaggacggt cagtgcggtt ctcctctggt ctccactcga 480

gacggcttca tcgtgggcat ccactccgcc tccaacttca ccaacaccaa taactacttc 540

acctccgtcc ccaagaactt catggagctg ctgactaacc aagaggccca gcagtgggtg 600

tctggttggc gactcaacgc cgattccgtg ctctggggcg gccacaaagt cttcatggtc 660

aagcccgagg agccttttca gcccgtcaag gaggccaccc agctcatgaa cagacgacga 720

cgacgataa 729

<210> 18

<211> 20

<212> DNA

<213> 人工合成序列

<220>

<223> ura3检测引物

<400> 18

tcctggaggc agaagaactt 20

<210> 19

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> ura3检测引物

<400> 19

agcccttctg actcacgtat 20

<210> 20

<211> 122

<212> DNA

<213> 解脂耶氏酵母

<400> 20

gtgagtttca gaggcagcag caattgccac gggctttgag cacacggccg ggtgtggtcc 60

cattcccatc gacacaagac gccacgtcat ccgaccagca ctttttgcag tactaaccgc 120

ag 122

<210> 21

<211> 792

<212> DNA

<213> 圆红冬孢酵母

<400> 21

cggcttgttc tctcctgctc tggtgggctg gcctgacatg taatgtgctc cgccgcaagt 60

ccgtcgtcgg tctcaattcg acgttgaaag ggcatagcgc aaggaagaac cctctgcgga 120

catgcagaat tactggctcg cctgctcctt cgtctactgg aataagtcct gtctcgttaa 180

agccccaacg tcgtttttcg acgtttgtaa ggcgcaagag gtgctatggg ctacgcagga 240

agctgagagg acatagaagt cgggggagga acggcgcaga gcggcagttg cggaagcatg 300

aggaaagcga gacggtccag catctgcagc gccaatccgc aatctcctgg ttgagcctgc 360

accggaagcg tcggaacagt atgcgcagag tcgaacgcaa gtaagaaaga cgcaccctca 420

cactcgctta cttcgagcca tacaacggat caaagctgcg cgtatctcgg cttgtaaggg 480

ccggaaagca acctcggaga tggacacgtc acatcaccaa cttatcgatc tcggccgtcg 540

acgtcgcaga gagggcgaga gaagcggtga aggagggaaa caacccctcg agagcatgat 600

ccgaccgaat ctgcagcgca ggaagccgtt acaagcccgc ctcgagcgca ggtcgggtcc 660

agccggggga cgaaacgcgc gaggctgatt cgtgagcgaa ggaagccgca tcgacaagtt 720

cgctcccctt tgccctcttt cccatcaccc gttctcgcct tacccgctca gaacaacacc 780

agatcactca ca 792

<210> 22

<211> 380

<212> DNA

<213> 圆红冬孢酵母

<400> 22

tagacgcacc tcctccagct tcacctgctt ccaacctttt ccaccgcctg caaccgcact 60

ttcgcctcgt tccttcggac tcttgcggct gcgatgttgt ccagcatcga caggagctgc 120

tttactttcg cttgacctgc ttgccacctg gtgctcgcac gatgccatat atcgcgaggg 180

aggcgagaga gcggagttgg ctggatgacg ctcgctccgg cttgcagctg gttgttacgg 240

tgttgcaaga atttctgtgc agtttgtacg agtggccccg cgttgtggat gatgtcggtt 300

cggttggcac ggccttgctc gctcgctctc tcgttgctcc tcgctcttca ccacttcact 360

tctaacacta actagctaca 380

<210> 23

<211> 785

<212> DNA

<213> 圆红冬孢酵母

<400> 23

tagcggcatg tcccgtcact gtccgcgagg tctgtagaag gagaacgagg tcgatgacgg 60

tgcgtcgagg tcgaggagga cgagagaacc gcccgacgcc gttggaagcc tcgctcccgg 120

tccgagcgag tgtagacaga gtcgaacagg gacgcagcag ccacagcggg acgcttgagc 180

gatgagcgag gtcgtggcgt ccgccaactt gctcgtcgcc gtcgaacctg gcttgggttc 240

gttctcacca ctcgctctca gctcttcttc cacgtgagct tggtttgaac actgcttggc 300

ttttcctaag accgtcggac tcgtctcgca cggcgaagcg gcggtgggaa cgggtcgggg 360

acgaacgggg cgaacgattc catcggatgg agccgaaaca cggcgacgac ggcttgggac 420

tggctcggtt gggttgatat ggatacagag acgctggatc aggctatgga tgaagttgca 480

gacatcccag tgctgtgtgg acgccatgct gacctcgcca tcttctcccc gtcgaccatc 540

cctcccgact cgccattcgc gctgatcccg cgtcggatcc tgcctgttgc acctcttgcg 600

tgagtcttac agcttctcta caccctgccg cggcatcgag gtaacccgga tctttctccc 660

tcgcctttgc caacctccgt cagatttgga cccccgctca acaacttcga ccgaacccac 720

cgcttttctc gcttttctcg acacgccagt cgctttcgca gacacctatc cgcacctaag 780

caacc 785

<210> 24

<211> 370

<212> DNA

<213> 圆红冬孢酵母

<400> 24

tgcagtgcac tctgttgctc gtatcatgtc ccactccctt gtatccctcg agtcggtcga 60

ctcttccctg gcgagtccaa gcggaggagg tggtcgtcgc ctgacccgct cggagtgcgc 120

cgctcgactt ggccctggga gaacaagcct gtgtgagtct gtctagcctg tcagcgaatg 180

cgccagacga gtgcaagcgg gtgagcgagg tcgaccctgc tcgtcactcg ctcgtcgggt 240

gcggccgcat cgttgaactt gcacttctca ctcgcactcg ctctggtaca gctacagtca 300

ctcgcttact actctgcagg ttcacagcaa ctcacccgtc caactcccac cctcccccgt 360

gcagcccacc 370

<210> 25

<211> 3849

<212> DNA

<213> 淡紫灰链霉菌

<400> 25

atgactctgc aagaaacctc tgtgctggaa cccactctgc aaggcaccac caccctcccc 60

ggtctgctgg ctcaaagagt ggccgagcat cccgaggcta ttgccgtggc ctaccgagac 120

gataaactga ccttccgaga gctggcttct cgatctgccg ctctggctga ctatctggag 180

catctcggtg tgtctgccga tgattgcgtc ggtctcttcg tcgaaccctc tattgatctg 240

atggtcggtg cttggggtat cctcaatgct ggcgctgcct atctccctct gtctcccgag 300

taccccgaag acagactccg atacatgatc gagaactctg agaccaagat tattctggct 360

cagcaacgac tggtctcccg actgagagag ctggctccca aagacgtgac tattgtgacc 420

ctccgagagt ccgaggcctt cgtccgaccc gagggcactg aggctcccgc cgctagatct 480

gctagacccg acaccctcgc ctacgtcatc tacacctctg gctctaccgg caagcccaag 540

ggtgtgatga tcgagcaccg atccatcgtg aatcagctcg gttggctgag agagacctat 600

gccattgacc gatccaaggt catcctccag aagaccccta tgtccttcga tgctgcccag 660

tgggagattc tctcccccgc taacggtgcc actgtggtga tgggtgctcc cggcgtgtac 720

gctgatcccg agggcctcat cgagactatc gtgaagcaca acgtcaccac cctccagtgt 780

gtgcccactc tgctccaagg cctcattgat actgagaagt tccccgagtg cgtgtccctc 840

cagcaaatct tttctggcgg cgaagctctg tctcgactgc tggccatcca gactacccaa 900

gagatgcccg gccgagctct gatcaacgtg tacggcccta ccgagaccac tattaattcc 960

tcctccttcc ccgtcgatcc cgccgatctg gatgaaggcc cccagtctat ttccattggt 1020

tcccccgtcc acggcactac ctaccatatt ctggacaagg agaccctcaa gcccgtcggt 1080

gtcggtgaga ttggtgagct gtatatcggt ggcatccagc tggctcgagg ctatctgcac 1140

agagacgatc tcaccgccga acgattcctc gagatcgagc tcgaggaagg cgccgaaccc 1200

gtccgactgt acaaaactgg cgatctgggt cagtggaaca atgatggcac cgtgcagttc 1260

gctggccgag ctgacaatca agtgaagctc cgaggctacc gagtcgagct cgacgagatc 1320

tctctcgcca tcgagaacca cgattgggtg cgaaacgccg ccgtcatcgt caagaatgac 1380

ggtcgaactg gctttcagaa cctcatcgct tgcatcgagc tgtccgagaa ggaagccgcc 1440

ctcatggatc aaggtaatca cggctcccac cacgcttcca aaaagtccaa gctccaagtc 1500

aaggcccagc tgtctaaccc cggtctgaga gatgacgccg aactggccgc cagacccgcc 1560

tttgatctgg agggtgccga acccaccccc gagcagagag ctagagtgtt cgcccgaaaa 1620

acctaccgat tttacgaggg tggcgctgtg actcaagccg atctgctggg tctgctcggc 1680

gccaccgtca ctgctggtta ctccagaaag gctgctgacc tcgcccccgc tgagctcggc 1740

cagatcctcc gatggtttgg ccaatacatc tccgaggaac gactgctgcc taagtacggt 1800

tatgcctccc ccggcgccct ctacgccact caaatgtact ttgagctcga gggcgtcggt 1860

ggcctcaagc ccggctacta ctactatcag cccgtgagac accagctcgt gctgatttcc 1920

gagcgagagg ccaccggtaa ggctactgcc caaatccatt tcatcggcaa gaaatccggc 1980

atcgagcccg tctacaaaaa caatattctg gaggtgctcg agattgagac tggccacatg 2040

gtcggtctgt ttgaacagat tctgcccgcc tatggtctgg atatccacga ccgagcttac 2100

gaacccgccg tcaaagatct gctggacgtg gctgacgagg actactatct gggtactttt 2160

gagctcgtgc ctcacgctgg cgccagagac gatcaagccg aggtgtacgt ccaaactcac 2220

ggtggtaagg tggccggtct gcccgaaggt cagtatcgat acgaaaacgg cgaactcacc 2280

cgattttccg acgacatcgt gctgaagaag catgtcattg ccatcaacca atctgtgtac 2340

caagccgctt cctttggcat ctccgtgtat tccagagccg aggaggagtg gctcaaatac 2400

attaccctcg gcaagaaact ccagcatctg atgatgaacg gcctcaacct cggctttatg 2460

tcctccggtt actcttctaa gaccggcaac cctctccccg cctctcgacg aatggacgct 2520

gtcctcggtg ccaatggcgt ggactctgct cccatgtact ttttcgtcgg cggcagaatc 2580

tccgatgagc aaattggcca cgagggtatg cgagaagact ccgtccacat gcgaggtccc 2640

gccgaactca ttagagacga cctcgtgtcc ttcctccccg attatatgat ccccaaccga 2700

gtggtggtct ttgaccgact gcctctgtcc gccaacggta aaattgacgt gaaggctctg 2760

gccgcttccg atcaagtcaa tgctgagctc gtcgagcgac cttttgtcgc cccccgaacc 2820

gaaaccgaga aagaaatcgc cgccgtctgg gagaaggctc tgcgacgaga aaacgcctct 2880

gtccaagatg atttcttcga atccggcggc aactctctga tcgccgtggg tctcgtcaga 2940

gaactgaacg ctcgactcgg tgtctccctc cctctccagt ctgtgctgga gtcccccacc 3000

atcgagaagc tggccagacg actggaaaga gaagtcgctc aagagtcctc ccgattcgtg 3060

cgactccacg ccgaaaccgg caaggcccga cccgtcatct gttggcccgg tctgggcggt 3120

taccctatga atctgcgatc cctcgctggt gaaatcggcc tcggcagatc cttctacggc 3180

gtccagtctt atggcatcaa cgagggcgaa actccctatg agaccatcac cgagatggcc 3240

aaaaaagaca ttgaggctct gaaggaaatt cagcccgccg gcccttacac tctgtggggt 3300

tactcctttg gcgctagagt cgctttcgaa accgcttacc agctcgagca agctggcgaa 3360

aaggtggaca atctgtttct gattgccccc ggctccccta aagtgcgagc cgagaacggt 3420

aaggtgtggg gccgagaggc ctccttcgct aaccgaggct acaccactat tctcttttcc 3480

gtcttcaccg gcaccatttc tggtcccgat ctggacagat gtctggaaac tgtcactgac 3540

gaagcctcct tcgccgagtt catctccgag ctcaagggta tcgacgtcga tctggctaga 3600

cgaatcatct ccgtggtggg tcaaacctac gagtttgagt attctttcca cgagctcgct 3660

gagcgaactc tgcaagcccc tatttccatc ttcaaggccg tgggcgacga ctactccttc 3720

ctcgagaact cttctggcta ctctgccgaa cctcccactg tcattgatct cgacgccgac 3780

cattactctc tgctgagaga ggacatcggc gagctggtca agcacatccg atatctgctg 3840

ggcgagtaa 3849

<210> 26

<211> 675

<212> DNA

<213> 枯草芽孢杆菌

<400> 26

atgaagatct acggcatcta catggatcga cccctctctc aagaggagaa cgagcgattc 60

atgtccttca tctcccccga gaagcgagag aagtgccgac gattctacca caaggaggac 120

gctcaccgaa ctctgctcgg tgacgtgctg gtccgatccg tcatttccag acagtaccag 180

ctcgacaagt ctgacatccg attttccacc caagagtacg gcaagccttg catccccgat 240

ctgcccgacg cccacttcaa catctcccac tctggtcgat gggtgatctg cgccttcgat 300

tcccagccca ttggcatcga catcgaaaag accaagccca tctctctgga gatcgccaag 360

cgattcttct ctaagactga gtactccgat ctcctcgcca aggacaaaga cgagcagact 420

gactacttct accacctctg gtccatgaag gagtccttca tcaagcaaga gggtaagggt 480

ctgtctctcc ctctggactc cttctccgtg cgactgcacc aagacggtca agtctctatc 540

gagctgcccg actcccactc tccttgctac atcaaaacct acgaggtgga ccccggctac 600

aaaatggctg tgtgtgccgc tcaccccgac ttccccgagg acatcaccat ggtgtcctac 660

gaggagctgc tctaa 675

<210> 27

<211> 11

<212> PRT

<213> 大肠杆菌

<400> 27

Ala Ala Asn Asp Glu Asn Tyr Ala Leu Ala Ala

1 5 10

Claims

1.一种转录元件，其包含：

启动子；和

多接头，

其中所述启动子包含选来自于SEQ ID NO:1(P_MT-1)、SEQ ID NO:2(P_MT-2)、SEQ ID NO:3(P_MT-3)、SEQ ID NO:4(P_MT-4)、SEQ ID NO:5(P_MT-5)、SEQ ID NO:6(P_MT-6)、SEQ ID NO:7(P_THR1)、SEQ ID NO:8(P_MET3)、SEQ ID NO:9(P_SER1)、SEQ ID NO:10(P_CTR1)和SEQ ID NO:11(P_CTR2)组成的组的核酸序列，或与选来自于SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQID NO:11组成的组的核酸序列具有至少95％序列同一性的核酸序列，并且进一步地，其中所述多接头可操作地连接至所述启动子序列。

2.根据权利要求1所述的转录元件，其中所述启动子序列包含选来自于SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的序列，任选地其中所述启动子序列包含选自由SEQ ID NO:2和SEQ ID NO:6组成的组的序列，任选地其中所述启动子包含SEQ ID NO:1和SEQ ID NO:2。

3.根据权利要求2所述的转录元件，进一步包含可操作地连接到所述启动子序列的1至16个UAS序列，任选地其中所述UAS序列中的每一个是相同的并且包含SEQ ID NO:12的序列。

4.权利要求1-3中任一项所述的转录元件，进一步包含位于所述多接头下游的2A多肽编码核酸序列，任选地其中编码的2A肽具有序列GSGEGRGSLLTCGDVEENPGP(SEQ ID NO:13)或GSGATNFSLLKQAGDVEENPGP(SEQ ID NO:14)。

5.根据权利要求4所述的转录元件，其中所述2A多肽编码核酸序列包含与SEQ ID NO:15具有99％序列同一性的序列。

6.根据权利要求4或5所述的转录元件，其中所述转录元件包含多个2A多肽编码核酸序列，其中所述多个2A多肽编码核酸序列中的每一个各自由至少一个对所述转录元件独特的限制酶切割位点进行。

7.根据权利要求6所述的转录元件，还包含编码TEV肽酶的核苷酸序列。

8.根据权利要求1-7中任一项所述的转录元件，还包含来自位于所述启动子和所述多接头之间的基因tef的第一内含子。

9.根据权利要求1-8中任一项所述的转录元件，其形成为质粒。

10.根据权利要求2-9中任一项所述的转录元件，其中所述启动子在启动子序列的每一端侧翼具有多接头序列。

11.根据权利要求1-10中任一项所述的转录元件，进一步包含选择标记，任选地其中所述选择标记是营养缺陷型标记，任选地其中所述营养缺陷型标记是leu2。

12.根据权利要求1-11中任一项所述的转录元件，进一步包含抗生素抗性基因作为选择标记。

13.根据权利要求1-12中任一项所述的转录元件，进一步包含解脂耶氏酵母(Yarrowialipolytica)的复制区。

14.根据权利要求1-13中任一项所述的转录元件，进一步包含大肠杆菌(E.coli)的复制区。

15.根据权利要求1-14中任一项所述的转录元件，其中所述启动子可操作地连接至异源编码序列。

16.包含权利要求15所述的核酸的解脂耶氏酵母(Y.lipolytica)或圆红冬孢酵母(Rhodotorula toruloides)宿主细胞，任选地其中所述宿主细胞是Ku70缺失菌株。

17.一种通过诱导单个控制元件同时诱导两种基因产物表达的方法，所述方法包括

提供宿主细胞，所述宿主细胞包含可操作地连接至所述启动子的正链上的第一基因和负链上的第二基因的Cu²⁺诱导型启动子，其中所述启动子包含选自由SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列，或与由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列具有至少95％序列同一性的序列；

使所述宿主细胞与一定量的Cu²⁺接触，所述Cu²⁺诱导所述启动子的双向转录以诱导所述第一和第二基因的表达。

18.根据权利要求17所述的方法，其中多个基因以串联阵列可操作地连接至所述启动子，其中2A多肽编码序列位于所述多个基因中除了最后一个之外的所有基因的3’末端。

19.权利要求17或18的方法，进一步包括降低内源基因表达的步骤，其中

通过使所述宿主细胞与抑制剂接触来抑制可操作地连接到所述内源基因的可抑制异源启动子，任选地其中所述阻抑型启动子包含选自由SEQ ID NO:10(CTR1)和SEQ ID NO:11(CTR2)组成的组的序列。

20.一种试剂盒，其包含

诱导型启动子序列，其选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组，任选地形成为第一质粒；以及

第二质粒，其中所述第二质粒包含

位于所述第一loxp位点上游的第一限制性位点；以及

位于所述第二loxp位点下游的第二限制性位点，其中所述第一和第二限制性位点彼此不同并且是所述第二质粒所独有的。

21.根据权利要求20所述的试剂盒，其中所述诱导型启动子可操作地连接至多接头并形成为第一质粒。

22.根据权利要求20或21中任一项所述的试剂盒，进一步包含阻抑型启动子，其选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组，任选地形成为第三质粒。

23.根据权利要求20-22中任一项所述的试剂盒，其中所述第二质粒进一步包含在诱导型启动子的控制下编码cre重组酶的核酸序列。

24.根据权利要求20-22中任一项所述的试剂盒，进一步包含第四质粒，其中所述第四质粒包含编码cre重组酶的核酸序列。

25.根据权利要求22-24中任一项所述的试剂盒，其中所述第二质粒还包含位于所述第一限制性位点上游的第一26s rDNA序列和位于所述第二限制性位点下游的第二26s rDNA序列。

26.一种试剂盒，其包含

第一质粒，其包含由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5和SEQ ID NO:6组成的组的诱导型启动子序列，以及多接头，其中所述多接头可操作地连接到所述诱导型启动子；以及

第二质粒，其中所述第二质粒包含

选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的阻抑型启动子，以及多接头，其中所述多接头可操作地连接至所述阻抑型启动子。

27.根据权利要求26所述的试剂盒，其中所述阻抑型启动子选自由SEQ ID NO:10和SEQID NO:11组成的组。

28.权利要求20-27中任一项的试剂盒，其中1-16个UAS元件位于诱导型和/或阻抑型启动子的上游。