CN109072247A

CN109072247A - 含有内含子的启动子及其用途

Info

Publication number: CN109072247A
Application number: CN201780022143.4A
Authority: CN
Inventors: 纪良辉; Y·刘; C·M·J·许; S·A·叶
Original assignee: Temasek Life Sciences Laboratory Ltd
Current assignee: Temasek Life Sciences Laboratory Ltd
Priority date: 2016-02-05
Filing date: 2017-02-02
Publication date: 2018-12-21
Anticipated expiration: 2037-02-02
Also published as: CN109072247B; US20200377898A1; EP3411485A4; BR112018015831A2; EP3411485A1; WO2017135895A1; DK3411485T3; EP3411485B1; US11254943B2

Abstract

本发明涉及分子生物学领域，且更具体地涉及用于酵母或真菌中代谢工程的启动子，以产生具有广泛应用的基于生物的化学制品。在油积累阶段期间，具有强活性的含内含子的启动子特别适用于酵母和真菌，特别是红冬孢酵母属或红酵母属中的遗传工程。这种启动子能够驱动红冬孢酵母属或红酵母属的物种中RNA或蛋白质的强烈表达。

Description

含有内含子的启动子及其用途

相关申请的交叉引用

本申请涉及并要求2016年2月5日提交的美国临时专利申请序列号62/292,030的优先权。每个申请通过引用的方式整体并入本文。

序列提交

本申请与电子格式的序列表一起提交。本序列表的标题为2577251PCTSequenceListing.txt，于2017年1月27日创建，且大小为83kb。该序列表的电子格式的信息通过引用的方式整体并入本文。

背景技术

本发明涉及分子生物学领域，且更具体地涉及酵母或真菌中用于代谢工程以产生具有广泛应用的基于生物的化学制品的启动子。在油积累阶段期间具有强活性的包含内含子的启动子特别适用于在酵母和真菌，特别是红冬孢酵母属(Rhodosporidium)或红酵母属(Rhodotorula)中的遗传工程。这种启动子能够驱动红冬孢酵母属或红酵母属物种中RNA或蛋白质的强烈表达。

本文使用的出版物和其他材料说明了本发明的背景，并且特别是提供关于实践的附加详细信息的那些均通过引用并入本文，并且为方便起见，在下文中用数字引用并在附加的参考文献中按数字列出。

红冬孢酵母属(有性型)或红酵母属(无性型)是系统发育上高度相关的酵母和优良的油(三酰甘油)和类胡萝卜素的产生者[1,2]。超过100g/L的干生物量产量可在一周内轻松产生超过60％的油含量[3-5]。为了利用其高代谢通量和细胞大量产生，我们正在将它作为一种新型合成生物学平台进行开发。迄今为止，已经报道了几种遗传操作工具，诸如根癌土壤杆菌(Agrobacterium tumefaciens)介导的转化、高效基因缺失和用于红冬孢酵母属的组成型和诱导型启动子组[6-9]。由于同源DNA重组，作为重复性DNA序列(诸如重复使用的启动子)将导致工程化的细胞中转基因的不稳定性，多样化的启动子库对于代谢工程是至关重要的。由于红冬孢酵母属的物种是杰出的油产生者，在油积累阶段期间起作用的强而有力的启动子特别有用。

乙酰辅酶A羧化酶(ACC)催化乙酰辅酶A的生物素依赖性羧化以形成丙二酰辅酶A，这一步骤通常被认为是脂肪酸生物合成的第一步和限速步骤[10]。以前，虽然在蛋白质组学研究中发现这种蛋白质非常丰富[4]，但发现1638bp的DNA片段(从-1638nt到预测的翻译起始密码子ATG)几乎没有启动子活性[11]。另外两种蛋白质、脂肪酸合成酶亚基2和脂肪酸转运体也在脂质产生后显示出高蛋白质水平[12]。然而，尚未定义启动子序列。

ATP：柠檬酸裂解酶(ACL)是另一种在脂肪生成中起重要作用的酶[13]。发现圆红冬孢酵母(R.toruloides)ACL1在脂质积累期间高度表达[12]。类似地，尿素羧化酶/脲基甲酸酯水解酶(Dur1)在脂质积累条件下显示出比在非脂质积累条件下更高的蛋白质水平[12]。

除了乙酰辅酶A羧化酶的单独酶活性外，在酿酒酵母(Saccharomycescerevisiae)中，脂肪酸合成的活性分布在两种酵母蛋白质Fas1p和Fas2p之间，大型桶形复合体的β和α亚基含有每种蛋白质的6个拷贝(α6β6)[14]。六个Fas1p和六个Fas2p亚基形成六个独立的反应中心，每个反应中心包含从乙酰基和丙二酰辅酶A合成长链脂肪酸所需的所有酶活性[15，16]。FAS1编码四种独立的酶功能：乙酰转移酶(EC：2.3.1.38)、烯酰还原酶(EC：1.3.1.10)、脱水酶(EC：4.2.1.61)和丙二酰/棕榈酰转移酶(EC：2.3.1.39)[17]。FAS2编码酰基-载体蛋白结构域和三个独立的酶功能：3-酮还原酶(EC：1.1.1.100)、3-酮合成酶(EC：2.3.1.41)和磷酸泛酰巯基乙胺基转移酶(EC：2.7.8.7)[18]。在酿酒酵母中，FAS1和FAS2均由一般转录因子Rap1p、Abf1p和Reb1p组成型激活[19]，并进一步被肌醇/胆碱应答性转录因子异源双链Ino2p-Ino4p激活[20，21]。此外，Fas1p和Fas2p化学计量似乎通过调节机制来确保，其中Fas1p蛋白控制FAS2mRNA水平[22]。

PAT家族蛋白(脂滴包被蛋白(perilipin)、脂肪分化相关蛋白(adipophilin)、TIP47)是存在于几种真菌(诸如解脂耶氏酵母(Yarrowia lipolytica)[24]、金龟子绿僵菌(Metarhizium anisopliae)[25]和圆红冬孢酵母[26])中的脂滴内的丰富的蛋白质[23]。圆红冬孢酵母脂滴包被蛋白(Pln1)也被称为脂滴蛋白(Ldp1)，并且其积累水平在氮饥饿期间增加[26]。建议将脂滴包被蛋白作为动态支架，调节脂质体的形成、生长和脂肪分解[27]。另一个参与油生成的基因是脂肪酸转运基因(FAT1)[26]。

发明内容

本发明涉及分子生物学领域，且更具体地涉及酵母或真菌中用于代谢工程的启动子，以产生具有广泛应用的基于生物的化学制品。在油积累阶段期间具有强活性的包含内含子的启动子特别适用于在酵母和真菌，特别是红冬孢酵母属或红酵母属中进行遗传工程化。这种启动子能够驱动红冬孢酵母属或红酵母属物种中RNA或蛋白质的强烈表达。

在一个方面，本发明提供了可在酵母或真菌中可操作的启动子，其可用于控制与启动子可操作地连接的核酸的表达。在一些实施方案中，启动子含有一个或多个内含子。在其他实施方案中，启动子经修饰以缺失原始起始密码子。在进一步的实施方案中，还修饰启动子以将新的起始密码子引入启动子中，以表达与经修饰的启动子可操作地连接的目标核酸。在其他实施例中，通过修饰引入新起始密码子还包括用于克隆目标核酸的限制酶位点。在一个实施方案中，启动子衍生自乙酰辅酶A羧化酶基因(ACC1)。在另一个实施方案中，启动子衍生自脂滴包被蛋白基因(PLN1)。在进一步的实施方案中，启动子衍生自脂肪酸合成酶1基因(FAS1)。在附加的实施方案中，启动子衍生自ATP:柠檬酸裂解酶基因(ACL1)。在另一个实施方案中，启动子衍生自翻译延伸因子EF-1α(TEF1)。在一些实施方案中，启动子包括5'上游启动子序列的全部。在其他实施方案中，启动子包括5'上游启动子序列的一部分。在每个实施方案中，衍生的启动子保留功能性启动子活性。在一些实施方案中，本文描述的启动子能够在红冬孢酵母属或红酵母属的物种中驱动强烈表达。

在一些实施方案中，基于Clustal V或Clustal W比对方法，启动子包含与SEQIDNo:74、77、80、81、82、83、87、88、89、90、91或92中任一个的ACC1in启动子相比具有至少75％序列相同性的核酸序列。在其他实施方案中，基于Clustal V或Clustal W比对方法，启动子包含与SEQ IDNo:75、85、93或94中任一个的PLN1in启动子相比具有至少75％序列相同性的核酸序列。在其他实施方案中，基于Clustal V或Clustal W比对方法，启动子包含与SEQ ID No:76、86、95或96中任一个的FAS1in启动子相比具有至少75％序列相同性的核酸序列。在进一步的实施方案中，基于Clustal V或Clustal W比对方法，启动子包含与SEQIDNo:79或97中任一个的ACL1in启动子相比较具有至少50％序列相同性的核酸序列。在进一步的实施方案中，基于Clustal V或Clustal W比对方法，启动子包含与SEQ ID号115-122中任一个的TEF1in启动子相比具有至少50％序列相同性的核酸序列。在一些实施方案中，启动子包含前述序列中的任何一个，其中3'ATGG或ATG序列被缺失。在其他实施方案中，启动子包含核酸序列，其中核酸序列在严格条件下可与DNA分子杂交，DNA分子包含SEQ IDNo:74-77、79-83、85-85-96或97或115-122中任一个的完全互补序列(full complement)。

在另一方面，本发明提供了用于在酵母或真菌、或在酵母细胞或真菌细胞中表达目标核酸的重组DNA构建体(也称为核酸构建体)。在一些实施方案中，重组DNA构建体包含与目标核酸可操作地连接的本文所述的启动子。在一些实施方案中，目标核酸编码可用于产生具有广泛应用的基于生物的化学制品的蛋白质。在一些实施方案中，基于生物的化学制品可以是脂肪酸、脂肪醇、萜烯和类胡萝卜素。在其他实施方案中，目标核酸编码萜烯合酶、P450细胞色素氧化酶、脂肪酸还原酶、脂肪酸-CoA还原酶。在一些实施方案中，将目标核酸的编码序列修饰为含有至少55％的G和C含量，优选地含有60％-70％的G和C含量。在其他实施方案中，至少70％的密码子在第三位置具有C或G。

在另一方面，本发明提供了转基因酵母或真菌、或包含本文所述的重组DNA构建体的转基因酵母细胞或真菌细胞。在一些实施方案中，重组DNA构建体稳定地整合到转基因酵母或真菌、或转基因酵母细胞或真菌细胞中。在其他实施方案中，将重组DNA构建体瞬时引入到转基因酵母或真菌、或转基因酵母细胞或真菌细胞中。本发明还提供了制备转基因酵母或真菌、或转基因酵母细胞或真菌细胞的方法。在其他实施方案中，转基因酵母或真菌、或转基因酵母细胞或真菌细胞是还包含培养基的组合物的一部分。在一些实施方案中，酵母是红冬孢酵母属的物种。在其他实施方案中，酵母是红冬孢酵母属的物种。

附图说明

图1A-图1F示出了启动子的示意图。图1A：不含内含子和含有内含子的启动子DUR1和DUR1in。图1B：FAT1启动子。图2C：不含内含子2和含有内含子2的启动子FAS1和FAS1in。图1D：不含内含子和含有内含子的启动子ACL1和ACL1in。图1E：不含内含子和含有内含子的启动子ACC1和ACC1in。图1F：不含内含子2和含有内含子2的启动子PLN1和PLN1in。

图2A和图2B示出了含有内含子的ACC1in启动子的表征。图2A：启动子片段的示意图。图2B：基于相对启动子活性(RPA)的荧光素酶基因检测。将细胞在MinRL2中培养4天。将RPA(％)与1.6kb含有内含因子的P_ACC1in启动子进行比较。

图3A-3F示出了启动子活性的比较。图3A：ACC1和ACC1in启动子。图3B：PLN1和PLN1in启动子。图3C：FAS1和FAS1in启动子。图3D：ACL1和ACL1in启动子。图3E：DUR1和DUR1in启动子。图3F：FAT1启动子。

图4A-图4D示出了ACC1in和PLN1in启动子的结构。图4A：ACC1in启动子(SEQ IDNo:1)。图4B：PLN1in启动子(SEQ ID No:2)。指示了诸如CT盒、内含子和序列变化的主要特征。tsp：由5'RACE确定的转录起始位点。图4C：内含子和富含GC的基序#4(SEQ ID No:3)的序列。图4D：Wt 0.3kb ACC1in与经修饰的ACC1int启动子片段的比较。ACC1int包含ATG>ATC和CTGGCG至CCATGG突变(参见图4A)。将细胞在MinRL2中培养5天，并将相对启动子活性(RPA)相对于GPD1启动子活性进行标准化。图4A和图4B中的氨基酸序列分别在SEQ ID No:73和78中示出。

图5A和5B示出了PLN1in启动子的表征。图5A：顺式作用元件CT盒的连续缺失和潜在位点的示意图。PLN1int 1-8说明了各种突变和序列截断。图5B：相对启动子强度(RPA％)。将细胞在GJm培养基中培养5天。P_GPD1的活性设定为100％。

图6A-图6D示出了不同培养基中启动子活性的比较。PLN1(SEQ IDNo:4)、PLN1in(SEQ ID No:5)、PLN1int1(SEQ ID No:6)和PLN1int3(-223至+155；参见图5A)的圆红冬孢酵母荧光素酶基因报告菌株(luciferase gene reporter strain)在培养基Li2006(图6A)、培养基GJm2(图6B)、培养基MinRL3(图6C)或Y4培养基(图6D)中培养。在第5天测定相对启动子活性。GPD1启动子的活性设定为100％。

图7A-图7C示出了脂质生成和脂质谱(lipid profile)。图7A：圆红冬孢酵母WT和二酰基甘油酰基转移酶(DGAT)突变体菌株中的相对脂质产量。将WT菌株中的脂质产量标准化至100％。图7B：圆红冬孢酵母WT和DGAT突变体菌株中的脂肪酸谱。DGAT突变体的缩写：dl-Δdga1Δlro1；da-Δdga1Δare1；dla–Δdga1Δlro1Δare1；dlad–Δdga1Δlro1Δare1Δdga3。脂质成分的缩写：SE-甾醇酯；TAG-三酰基甘油；FFA-游离脂肪酸；DAG-二酰基甘油；MAG-单酰甘油；PL-极性脂质。图7C：在dlad突变体中制备PLN1、PLN1in、PLN1int、ACC1int、GPD1和无P的报告基因构建体，并在MinRL3中培养5天。

图8示出了荧光素酶报告基因构建体的示意图。LB和RB：农杆菌属(Agrobacterium)T-DNA的右边界和左边界；loxP-RE和loxP-LE是突变体cre重组酶识别位点；RtLUC2：密码子优化的荧光素酶基因，CAR2R和CAR2L分别表示在CAR2基因座处同源重组的右臂和左臂。HPT-3密码子优化的潮霉素抗性基因；“启动子”：插入报告基因测定中的启动子的位置。

图9A和图9B示出了启动子TEF1和TEF1in的示意图和核酸序列。图9A：TEF1和TEF1in的方案。图9B：TEF1和TEF1in的序列。tss-转录起始位点，ct盒-富含CT的顺式作用元件。核酸序列如在SEQ ID No:107中所示。蛋白质序列如在SEQ ID No:108和109中所示。

图10示出了TEF1和TEF1in的启动子强度的比较。通过相对于GPD1启动子的标准化计算所有启动子强度，并命名为相对启动子活性(RPA)。将细胞在YPD培养基中培养1天，并通过荧光素酶活性进行测定。

图11A和图11B示出了TEF1in启动子的连续截断分析。图11A：TEF1in启动子及其截断片段的示意图。TEF1inm1在其翻译起始密码子(ATG至ATC)中表现为定点突变，以排除在靶蛋白之前翻译Tef1的N-末端的18个氨基酸。TEF1inm2～5表示启动子序列的连续截断。图11B：两种不同培养基中(脂质积累培养基GJ2013和丰富培养基YPD)的启动子测定。将细胞在28℃280rpm下培养2天。

具体实施方式

本发明涉及分子生物学领域，且更具体地涉及酵母或真菌中用于代谢工程以产生具有广泛应用的生物基化学品的启动子。在油积累阶段期间具有强活性的包含内含子的启动子特别适用于酵母和真菌，特别是红冬孢酵母属或红酵母属中的遗传工程。这种启动子能够驱动红冬孢酵母属或红酵母属的物种中RNA或蛋白质的强烈表达。

除非另有定义，否则本文使用的所有技术和科学术语具有与本发明所属领域的技术人员通常理解的含义相同的含义。

术语“约”或“近似”意指在统计学上有意义的值范围内。这样的范围可在以下给定值或范围的一个数量级内，优选地在50％内，更优选地在20％内，进一步优选地在10％内，甚至更优选在5％内。术语“约”或“近似”所包含的可允许的变化取决于所研究的特定系统，并且本领域普通技术人员可以容易地理解。

如本文所用，“等位基因”是指基因座的一种或多种替代形式中的任何一种，所有这些等位基因都与性状或特征有关。在二倍体细胞或生物体中，给定基因的两个等位基因占据一对同源染色体上的相应基因座。

“组成型启动子”是指能够使基因最多在大多数细胞类型中表达的启动子。“强组成型启动子”是指在任何给定细胞中将mRNA的表达驱动至任何mRNA种类的前10％的组成型启动子。

“对照”或“对照酵母或真菌”或“对照酵母菌细胞或真菌细胞”提供了用于测量受试酵母或真菌、或酵母细胞或真菌细胞的表型变化的参考点，在其中对于目标多核苷酸已经实现了遗传改造，诸如转化。受试酵母或真菌、或酵母细胞或真菌细胞可以是酵母或真菌、或酵母细胞或真菌细胞的后代，并包含改造。

对照酵母或真菌、或酵母细胞或真菌细胞可包括：例如：(a)即具有相同基因型的野生型酵母或真菌、或酵母细胞或真菌细胞作为导致受试酵母或真菌、或酵母细胞或真菌细胞的遗传改造的起始材料；(b)与起始材料具有相同基因型但已用无效构建体(即，用对目标性状没有已知影响的构建体，诸如包含标记基因的构建体)转化的酵母或真菌、或酵母细胞或真菌细胞；(c)酵母或真菌、或酵母细胞或真菌细胞，其是受试酵母或真菌、或酵母细胞或真菌细胞的后代中的未转化的分离子；(d)酵母或真菌、或酵母细胞或真菌细胞，其遗传上与受试酵母或真菌、或酵母细胞或真菌细胞相同，但其没有暴露于会诱导目标多核苷酸表达的条件或刺激物，或(e)在不表达目标多核苷酸的条件下，受试酵母或真菌、或酵母细胞或真菌细胞本身。

关于基因序列的术语“表达”是指基因的转录，并且适当时，将所得的mRNA转录物翻译成蛋白质。因此，从上下文中可以清楚地看出，蛋白质编码序列的表达是由编码序列的转录和翻译产生的。“强表达”是指mRNA或蛋白质在任何给定细胞中表达至任何mRNA或蛋白质种类的前10％。

如本文所用，“基因”是指包含与基因产物表达相关的5'启动子区域的核酸序列，任何内含子和外显子区域以及与基因产物表达相关的3'或5'非翻译区域。

如本文所用，“基因型”是指细胞或生物体的遗传构成。

术语“异源性”或“外源性”当与核酸的部分联用时，其表示核酸包含两个或更多个在自然界中未发现彼此具有相同关系的子序列。例如，核酸通常是重组产生的，其具有来自不相互关联的基因的两个或更多个序列，该序列排列成新的功能性核酸，例如来自一个来源的启动子和来自另一个来源的编码区域。类似地，异源性或外源性蛋白质表明该蛋白质包含在自然界中彼此不存在相同关系的两个或更多个子序列(例如，融合蛋白)。

在将核酸片段(例如，重组DNA构建体)插入细胞中的“引入”意指“转染”或“转化”或“转导”，并且包括指将核酸片段整合入酵母细胞或者真菌细胞，其中核酸片段可被整合入细胞的基因组(例如，染色体、质粒或线粒体DNA)转化成自主复制子，或瞬时表达(例如，转染的mRNA)。

如本文所用的“可操作的连接”或“可操作地连接的”或“操作性地连接的”被理解为这样的意思：例如，启动子和待表达的核酸并且(如果合适的话)进一步的调节元件(诸如，例如终止子)的顺序排列，以这样的排列方式每个调节元件可在核酸的重组表达中发挥其功能以制备所期望的产物。这不一定需要化学意义上的直接连接。遗传控制序列(诸如，例如增强子序列)也可从稍远的位置或实际上从其他DNA分子(顺式或者反式定位)的位置对靶序列发挥其功能。优选的排列是其中重组表达的核酸序列位于作为启动子的序列的下游，使得这两个序列彼此共价键合。如本领域所熟知的，调节或控制序列可位于核酸序列的5'侧或核酸序列的3'侧。

“过表达”或“超表达”是指在转基因生物中产生基因产物，所述基因产物超过在正常、控制或非转化的生物体中的生产水平。

如本文所用，“表型”是指细胞或生物体的可检测特征，其特征是基因表达的表现。

在本文中可互换地使用的术语“多核苷酸”、“核酸”和“核酸分子”是指核苷酸聚合物，其可以是天然或合成的线性和顺序排列的核苷酸和/或核苷，其包括脱氧核糖核酸、核糖核酸及其衍生物。它包括染色体DNA、自我复制质粒、DNA或RNA的感染性聚合物以及主要发挥结构作用的DNA或RNA。除非另有说明，否则核酸或多核苷酸以5'至3'的方向从左向右书写。核苷酸通过其通常接受的单字母代码来指代。数字范围包括定义范围的数字。

在本文中可互换使用的术语“多肽”、“肽”和“蛋白质”是指氨基酸残基的聚合物。该术语适用于氨基酸聚合物，其中一个或多个氨基酸残基是相应天然存在的氨基酸的人造化学类似物，以及天然存在的氨基酸聚合物。氨基酸可通过它们通常已知的三字母或单字母符号来表示。氨基酸序列分别从氨基至羧基方向从左至右进行书写。数字范围包括定义范围的数字。

“后代”包括任何后续子代的转基因酵母或真菌、或转基因酵母细胞或真菌细胞。

“启动子”是指能够控制另一核酸片段转录的核酸片段。

“在酵母或真菌中起作用的启动子”是能够控制酵母细胞或真菌细胞中转录的启动子，无论其来源是否来自酵母细胞或真菌细胞。

“重组”是指两个本该分离的序列区段的人工组合，例如通过化学合成或通过遗传工程技术操纵分离的核酸区段。“重组”还包括涉及细胞或载体，所述细胞或载体已经通过引入异源核酸而进行修饰或是衍生自这样修饰的细胞的细胞，但不包括通过自然地发生的事件(例如，自发突变、自然转化/转导/转座)而改造的细胞或载体，诸如那些在没有有意的人为干预的情况下发生的事件。

“重组DNA构建体”是指通常在自然界中不常见的核酸片段的组合。因此，重组DNA构建体可包含源自不同来源的调节序列和编码序列，或源自相同来源的调节序列和编码序列但排列的方式与通常在自然界中发现的方式不同。术语“重组DNA构建体”和“重组构建体”在本文中可互换使用。在本文所述的几个实施方案中，重组DNA构建体也可被认为是“过表达DNA构建体”。术语“核酸构建体”也可与“重组DNA构建体”互换使用。

“调节序列”是指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列)的核酸序列，并且其影响转录、RNA加工或稳定，或相关编码序列的翻译。调节序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。术语“调节序列”和“调节元件”在本文中可互换使用。

“稳定转化”是指将核酸片段引入宿主生物体的基因组中，从而导致遗传上稳定的遗传。一旦稳定地转化，核酸片段稳定整合在宿主生物体的基因组和任何后续世代中。

“性状”是指酵母或真菌、或特定酵母或真菌材料或细胞的生理学、形态学、生物化学或物理特征。在一些情况下，这种特征可通过生化技术来测量，例如检测酵母或真菌中产生的物质。

如本文所用的“转化”是指稳定转化和瞬时转化。

“转化细胞”是引入了核酸片段(例如重组DNA构建体)的任何细胞。

“转基因酵母或真菌”包括涉及在其基因组内包含异源多核苷酸的酵母或真菌。例如，异源多核苷酸稳定地整合在基因组内，使得多核苷酸传递给连续世代。异源多核苷酸可单独或作为重组DNA构建体的一部分整合到基因组中。“转基因酵母或真菌”还包括涉及在其基因组内包含多于一种异源多核苷酸的酵母或真菌。每种异源多核苷酸可赋予转基因酵母或真菌不同的性状。“转基因酵母或真菌”包括其所有后代、杂交体(hybrid)和杂交物(cross)并且其持续含有外源DNA。

“瞬时转化”是指将核酸片段引入到宿主生物体的细胞核或含DNA的细胞器官中，这导致基因表达而没有遗传稳定的遗传。

可使用被设计用于检测同源序列的各种比较方法来确定序列比对和百分比相同性计算，该同源序列检测方法包括但不限于生物信息学计算套件的程序(Inc，Madison，WI)。除非另有说明，否则使用具有默认参数(GAP PENALTY＝10，GAP LENGTH PENALTY＝10)的Clustal V对比方法(Higgins and Sharp(1989)CABIOS.5：151153)进行本文提供的序列的多重比对。使用Clustal V方法进行配对比对(pairwise alignment)并计算蛋白质序列的百分比相同性的默认参数为KTUPLE＝1、GAP PENALTY＝3、WINDOW＝5以及DIAGONALS SAVED＝5。对于核酸，这些参数是KTUPLE＝2、GAP PENALTY＝5、WINDOW＝4和DIAGONALS SAVED＝4。在序列比对后，使用Clustal V程序，通过查看同一程序上的“序列距离”表可以获得“百分比相同性”和“发散”值；除非另有说明，否则本文提供和要求保护的百分比相同性和发散按这种方式进行计算。

或者，可使用Clustal W比对方法。Clustal W比对方法(由Higgins and Sharp，CABIOS.5：151-153(1989)；Higgins，D Get al.，Comput.Appl.Biosci.8:189-191(1992)描述)可在生物信息学计算套件(Inc.,Madison，Wis.)的MegAlign^TMv6.1程序中找到。多重比对的默认参数对应于GAP PENALTY＝10、GAP LENGTHPENALTY＝0.2、延迟发散序列＝30％、DNATransit Weight＝0.5、Protein Weight Matrix＝Gonnet系列、DNA Weight Matrix＝IUB。对于配对比对，默认参数是Alignment＝Slow-Accurate、Gap Penalty＝10.0、Gap Length＝0.10、Protein Weight Matrix＝Gonnet 250和DNA Weight Matrix＝IUB。在使用Clustal W程序比对序列后，通过查看同一程序中的“序列距离”表可获得“百分比相同性”和“发散”值。

术语“在严格条件下”是指两种序列在中度或高度严格条件下杂交。更具体地，本领域普通技术人员可以容易地确定中等严格条件，例如，取决于DNA的长度。Sambrook等人，分子克隆：实验室手册，第3版，第6章和第7章，冷泉港实验室出版社，2001年详解了基本条件，并包括5xSSC 0.5％SDS 1.0mM EDTA(pH8.0)的硝化纤维素过滤器的预洗溶液的使用，在约40-50℃、约50％甲酰胺、2xSSC至6xSSC(或其他类似的杂交溶液，例如在约42℃在约50％甲酰胺中的Stark溶液)的杂交条件和例如约40-60℃0.5-6×SSC0.1％SDS的洗涤条件。优选地，中等严格条件包括在约50℃和6×SSC下杂交(和洗涤)。本领域技术人员也可以容易地确定高度严格的条件，例如，取决于DNA的长度。

通常，与中等严格条件相比，这些条件包括在较高温度和/或较低盐浓度下的杂交和/或洗涤(例如在约65℃6×SSC至0.2×SSC、优选6×SSC、更优选2×SSC、最优选0.2×SSC下杂交)。例如，高度严格的条件可包括如上定义的杂交，并在约65-68℃、0.2×SSC、0.1％SDS中洗涤。在杂交和洗涤缓冲液中，SSPE(1xSSPE是0.15M NaCl、10mM NaH₂PO₄和1.25mMEDTA，pH7.4)可代替SSC(1×SSC是0.15M NaCl和15mM柠檬酸钠)；杂交完成后，洗涤15分钟。

还可使用市售的杂交试剂盒，其不使用放射性物质作为探针。具体实施方案包括与ECL直接标记和检测系统(Amersham)的杂交。严格条件包括，例如，使用试剂盒中包含的杂交缓冲液在42℃下杂交4小时，其中添加5％(w/v)封闭试剂和0.5M NaCl，并在55℃在0.4％SDS0.5xSSC中，洗涤两次20分钟，并且在室温下在2xSSC中洗涤一次5分钟。

如本文所用，关于核酸序列，术语“基本上同源的”或“基本上同源”涉及核酸序列，包括在严格条件下与参考的SEQ ID NO：或其部分或其互补物杂交的核酸序列，其是那些允许在两个序列之间发生反平行比对的序列，并且然后所述两个序列在严格条件下能够与相反链上的相应碱基形成氢键以形成双链分子，所述双链分子在适当的严格条件下(包括高度严格性)足够稳定以使得可用本领域熟知的方法被检测到。与序列表中示出的参考核酸序列或其互补序列相比，基本上同源的序列可具有约70％至约80％的序列相同性，或更优选约80％至约85％的序列相同性，或最优选约90％至约95％的序列相同性，至约99％的序列相同性。或者，基本上同源的序列包括在严格条件下与植物基因的内含子的靶区域杂交的那些序列。对于严格条件，参见本文的说明书并参见美国专利号8,455,716和8,536,403。

现描述本发明的实施方案，其包括用于赋予蛋白质表达调节的分离的多核苷酸和重组DNA构建体、包含这些重组DNA构建体的组合物(例如转基因酵母或真菌)以及利用这些重组DNA构建体的方法。

分离的启动子

本发明提供了用于在酵母或真菌物种中表达异源多核苷酸的分离的启动子。在一些实施方案中，启动子含有一个或多个内含子。在其他实施方案中，启动子经修饰以缺失原始的起始密码子。在进一步的实施方案中，启动子还被修饰以将新的起始密码子引入启动子中以表达与经修饰的启动子可操作地连接的目标核酸。在其他实施方案中，引入新起始密码子的修饰还包括用于克隆目标核酸的限位酶位点。在一个实施方案中，启动子衍生自乙酰辅酶A羧化酶基因(ACC1)。在另一个实施方案中，启动子衍生自脂滴包被蛋白基因(PLN1)。在进一步的实施方案中，启动子衍生自脂肪酸合成酶1基因(FAS1)。在另一个实施方案中，启动子衍生自翻译延伸因子EF-1α(TEF1)。在一些实施方案中，启动子包括5'上游启动子序列的全部。在其他实施方案中，启动子包括5'上游启动子序列的一部分。在每个实施方案中，衍生的启动子保留功能性启动子活性。在一些实施方案中，本文描述的启动子能够在红冬孢酵母属或红酵母属的物种中驱动强烈表达。

在一个实施方案中，基于Clustal V或Clustal W比对方法，当与SEQ ID NO：74、77、80、81、82、83、87、88、89、90、91或92中任一个的ACC1in启动子比较时，启动子包含至少75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列相同性的核酸序列。在一些实施方案中，启动子包含前述ACC1in启动子序列中的任一个，其中3'ATGG或ATG序列缺失。

在另一个实施方案中，基于Clustal V或Clustal W比对方法，当与SEQ ID NO：75、85、93或94中任一个的PLN1in启动子比较时，启动子包含至少75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列相同性的核酸序列。在一些实施方案中，启动子包含前述PLN1in启动子序列中的任一个，其中3'ATGG或ATG序列缺失。

在进一步的实施方案中，基于Clustal V或Clustal W比对方法，当与SEQ ID NO：76、86、95或96中任一个的FAS1in启动子比较时，启动子包含至少75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列相同性的核酸序列。在一些实施方案中，启动子包含前述FAS1in启动子序列中的任一个，其中3'ATGG或ATG序列缺失。

在进一步的实施方案中，基于Clustal V或Clustal W比对方法，当与SEQ ID NO：79或97中任一个的ACL1in启动子比较时，启动子包含至少75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列相同性的核酸序列。在一些实施方案中，启动子包含前述ACL1in启动子序列中的任一个，其中3'ATGG或ATG序列缺失。

在进一步的实施方案中，基于Clustal V或Clustal W比对方法，当与SEQ ID NO：115-122中任一个的TEF1in启动子比较时，启动子包含至少75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列相同性的核酸序列。在一些实施方案中，启动子包含前述TEF1in启动子序列中的任一个，其中3'ATGG或ATG序列缺失。翻译延伸因子EF-1α基因(TEF1，-1000～-1)的上游序列显示出甘油醛-3-磷酸脱氢酶启动子(GPD1启动子)的启动子活性的81％。TEF1的内含子1和2(TEF1in启动子)的引入使其启动子活性增强了2倍，当在丰富培养基——酵母提取物-蛋白胨-葡萄糖肉汤(YPD)中培养1天，其活性达到GPD1启动子活性的1.2～3.0倍。在脂质积累阶段，启动子TEF1in的表现略低于GPD1启动子，当在GJ2013中培养2天后，其启动子活性是GPD1启动子活性的91％。连续截短分析和诱变分析说明1.1kb TEF1in启动子显示出最佳性能。

在进一步的实施方案中，启动子包含核酸序列，其中核酸序列在严格条件下可与包含SEQ ID NO：74-77、79-83、85-85-96、97或115-122中任一个的完全互补序列的DNA分子杂交。

基因组和核酸数据库的数据库搜索和同源性搜索可被用于基于核酸的比对鉴定相似的启动子，所述核酸的比对使用算法或计算机程序以及本领域技术人员熟知的这些技术。

在一些实施方案中，本发明涉及如本文所述的分离的启动子或启动子。在其他实施方案中，本发明涉及包含本文所述的分离的启动子或启动子的核酸。

核酸构建体。

一方面，本发明提供了用于在酵母或真菌、或酵母或真菌细胞中表达目标核酸的核酸构建体(也称为重组DNA构建体或有时简称为核酸)。在一些实施方案中，核酸构建体包含与目标核酸可操作地连接的本文所述的启动子。

在一个实施方案中，核酸构建体包含与异源多核苷酸可操作地连接的如本文所述的启动子。在另一个实施方案中，多核苷酸与转录终止子可操作地连接。在进一步的实施方案中，转录终止子在酵母或真菌物种中可操作。蛋白质编码基因的转录终止子通常在终止密码子(TGA、TAG或TAA)之后，位于基因的下游(3')。转录终止子在RNA的加工和稳定以及翻译中起重要作用。大多数但不是所有转录终止子都含有多腺苷酸化序列或切割位点。

在一些实施方案中，目标核酸编码蛋白质，所述蛋白质用于生产具有广泛应用的基于生物的化学制品。在一些实施方案中，基于生物的化学制品可以是脂肪酸、脂肪醇、萜烯和类胡萝卜素。在其他实施方案中，目标核酸编码萜烯合酶、P450细胞色素氧化酶、脂肪酸还原酶、脂肪酸-CoA还原酶。

在一些实施方案中，目标核酸的编码序列是天然存在的。在其他实施方案中，修饰目标核酸的编码序列包含酵母或真菌优选的密码子。在一个实施方案中，编码序列是天然存在的或人工产生的并且含有至少约60％GC。在另一个实施方案中，编码序列是天然存在的或人工产生的并且含有至少约70％GC。在进一步的实施方案中，编码序列是天然存在的或人工产生的并且含有约75％GC。在一个实施方案中，至少约70％的此类编码序列的密码子三联体以C或G结尾。在另一个实施方案中，超过约80％的此类编码序列的密码子三联体以C或G结尾。在一个实施方案中，可选择标记的编码序列是至少60％GC，优选约70％GC，且最优选约75％GC，其中至少70％的密码子三联体以C或G结尾，优选多于80％的密码子三联体以C或G结尾。在一个实施方案中，此类编码序列在至少约40％的总丝氨酸(Ser)残基中由UCG密码子组成。

核酸构建体可包括本领域熟知的其他转录调节区。

在一些实施方案中，核酸构建体还包含可选择标记。可选择标记以及包含这些可选择标记和启动子以驱动其表达的核酸构建体是本领域技术人员熟知的，如国际专利申请公开号WO 2012/169969中所述。与任意合适的可选择标记可操作地连接的任意合适的启动子可用于本发明。在一些实施方案中，与可选择标记一起使用的合适启动子的实例包括但不限于编码以下蛋白质的以下基因的启动子：甘油醛3-磷酸脱氢酶(GPD)、酰基辅酶A载体蛋白(ACP)、脂肪酸去饱和酶、翻译延伸因子(TEF)、丙酮酸脱羧酶(PDC)、烯醇酶(2-磷酸甘油酸脱水酶)(ENO)、肽基脯氨酰异构酶(PPI)、乙酰辅酶A羧化酶(ACC)或转醛酶。

在一个实施方案中，可选择标记的编码序列是天然存在的或人工产生的并含有至少约60％的GC。在第二个实施方案中，可选择标记的编码序列是天然存在的或人工产生的并含有约70％的GC。在第三个实施方案中，可选择标记的编码序列是天然存在的或人工产生的并含有约75％的GC。在一个实施方案中，至少约70％的此类编码序列的密码子三联体以C或G结尾。在另一个实施方案中，超过约80％的此类编码序列的密码子三联体以C或G结尾。在一个实施方案中，可选择标记的编码序列是至少60％GC，优选约70％GC，且最优选约75％GC，其中至少70％的密码子三联体以C或G结尾，优选多于80％的密码子三联体以C或G结尾。在一个实施方案中，此类编码序列在至少约40％的总丝氨酸(Ser)残基中由UCG密码子组成。

在一些实施方案中，可选择标记是无重组标记系统的一部分。在一个实施方案中，无重组标记系统是Cre-lox无重组标记系统，例如Zuo等人描述的系统[38]。这种系统可用于产生无可选择标记的转基因酵母或真菌。在一些实施方案中，无重组标记系统位于本文所述的启动子和一个或多个核酸片段之间。在该实施方案中，通过重组事件去除标记基因使启动子与如本文所述的目标核酸可操作地连接。

在制备核酸构建体时，可以操纵各种DNA片段从而以适当的方向并在适当时在合适的阅读框中提供DNA序列。为此目的，可以使用衔接子或接头连接DNA片段，或者可以涉及其他操作以提供方便的限制性位点、去除多余的DNA、去除限制性位点等。为此目的，可能涉及体外诱变、引物修复、限制、退火、重新取代，例如，翻译和颠换。

本发明的核酸也可以完全或部分地合成，特别是在需要通过本领域已知的方法提供植物优选的序列的情况下。因此，可使用所选宿主优选的密码子合成本发明的全部或部分核酸。物种优选的密码子可通过例如在特定宿主物种中表达的蛋白质中最常使用的密码子来确定。核酸序列的其他修饰可导致突变体具有轻微的活性改变。

在另一方面，本发明提供了包含本文所述的核酸构建体的酵母或真菌细胞。在一个实施方案中，真菌细胞是红冬孢酵母属的一个种类的细胞。在另一个实施方案中，真菌细胞是红酵母属的一个种类的细胞。在一些实施方案中，核酸构建体稳定地整合在真菌细胞的基因组中。在其他实施方案中，真菌细胞也是包含培养基的组合物的一部分。

可使用诸如电穿孔、DNA粒子轰击的技术将一种或多种核酸构建体直接引入真菌细胞中。或者，核酸构建体可与合适的T-DNA侧翼区组合，并导入根癌土壤杆菌(Agrobacterium tumefaciens)宿主，其将基因盒递送到真菌基因组中。因此，可使用提供真菌有效转化/转染的任何方法。参见，例如，美国专利申请号7,241,937、7,273,966和7,291,765以及美国专利申请公开申请号2007/0231905和2008/0010704以及其中引用的参考文献。还参见国际公布的申请号WO 2005/103271和WO 2008/094127以及其中引用的参考文献。

用任意重组构建体产生许多单个转化的真菌以便回收没有任何位置效应的真菌可能是有用的。也可优选地选择含有多于一个引入的核酸构建体拷贝的真菌，从而获得高水平多核苷酸的表达。

如果可能的话，可能期望的是可在特定物种中产生对特定基因是纯合子的真菌系。在一些物种中，这是通过使用单孢菌培养物来实现的。通过使用这些技术，可产生携带插入基因的单倍体，并然后自发地或通过使用秋水仙碱使染色体数加倍。这产生了一种插入的基因是纯合子的真菌，如果插入的基因携带合适的用于检测携带该基因的真菌的可选择标记基因，则可以容易地检测该真菌。或者，真菌可自体受精，导致产生由以下物质组成的孢子混合物：在最简单的情况下，插入的基因有三种类型，纯合子(25％)、杂合子(50％)和无效(25％)。虽然从含有所述基因的真菌中获得无效真菌相对容易，在实践中，有可能通过Southern印迹分析从杂合真菌中获得纯合子真菌，其中小心注意加载完全等量的来自混合群体的DNA，并通过特异于插入的基因的探针的信号强度获得杂合子。建议通过允许每个独立的转化体自体受精来验证Southern印迹分析的结果，因为如果真菌对于插入的基因是纯合的，则可获得纯合子的额外证据，来自自交个体的所有后续真菌系将含有该基因，而如果该真菌对于该基因是杂合的，则从自交种子生长的世代将含有无效的真菌系。因此，通过简单的自交，可选择纯合的真菌系，其也可以通过Southern印迹分析来验证。

另一方面，本发明提供了制备和使用包含本文所述的核酸构建体的真菌物种的方法。在一个实施方案中，制备真菌物种的方法包括将本文所述的核酸构建体引入真菌细胞并选择具有稳定整合在其基因组中的核酸构建体的真菌细胞。在另一个实施方案中，使用真菌物种的方法包括在常规用于培养酵母或真菌物种的培养基中或如本文所述的培养基中(例如GJm2培养基、GJm2培养基或Li2006培养基)培养包含本文所述的核酸构建体的真菌物种。

在一些实施方案中，将转化的真菌转移至标准生长培养基(例如，固体或液体营养培养基、谷物、蛭石、堆肥、泥炭、木材、木屑、稻草等)，并以本领域技术人员已知的方式生长或培育。在一个实施方案中，培养基是minAB培养基或以省略碳源和NH₄NO₃修饰的minAB培养基。

除非另有说明，本发明的实验采用化学、分子生物学、微生物学、重组DNA、遗传学、免疫学、细胞生物学、细胞培养和转基因生物学的常规技术，上述技术在本领域的技术范围内。参见例如Maniatis et al.,1982,Molecular Cloning(Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York)；Sambrook et al.,1989,MolecularCloning,2nd Ed.(Cold Spring Harbor Laboratory Press，Cold Spring Harbor，NewYork)；Sambrook and Russell,2001,Molecular Cloning,3rd Ed.(Cold Spring HarborLaboratory Press，Cold Spring Harbor,New York)；Ausubel et al.,1992),CurrentProtocols in Molecular Biology(John Wiley&Sons,including periodic updates)；Glover,1985,DNA Cloning(IRL Press，Oxford)；Russell,1984,Molecular biology ofplants:a laboratory course manual(Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.)；Anand,Techniques for the Analysis of Complex Genomes，(Academic Press,New York,1992)；Guthrie and Fink,Guide to Yeast Genetics andMolecular Biology(Academic Press,New York,1991)；Harlow and Lane，1988，Antibodies，(Cold Spring Harbor Laboratory Press，Cold Spring Harbor，New York)；Nucleic Acid Hybridization(B.D.Hames&S.J.Higgins eds.1984)；Transcription AndTranslation(B.D.Hames&S.J.Higgins eds.1984)；Culture Of Animal Cells(R.I.Freshney,Alan R.Liss,Inc.,1987)；Immobilized Cells And Enzymes(IRL Press,1986)；B.Perbal,A Practical Guide To Molecular Cloning(1984)；the treatise,Methods In Enzymology(Academic Press,Inc.,N.Y.)；Methods In Enzymology,Vols.154 and 155(Wu et al.eds.)，Immunochemical Methods In Cell And MolecularBiology(Mayer and Walker,eds.,Academic Press,London,1987)；Handbook OfExperimental Immunology,Volumes I-IV(D.M.Weir and C.C.Blackwell，eds.，1986)；Riott，Essential Immunology，6th Edition，Blackwell Scientific Publications，Oxford，1988；Fire et al.，RNA Interference Technology:From Basic Science toDrug Development，Cambridge University Press，Cambridge,2005；Schepers,RNAInterference in Practice,Wiley–VCH,2005；Engelke,RNA Interference(RNAi):TheNuts&Bolts of siRNA Technology,DNA Press,2003；Gott,RNA Interference,Editing,and Modification:Methods and Protocols(Methods in Molecular Biology),HumanPress,Totowa,NJ,2004；Sohail,Gene Silencing by RNA Interference:Technology andApplication，CRC，2004。

实施例

通过参考以下实施例描述本发明，这些实施例是以举例说明的方式提供的，并不意图以任何方式限制本发明。使用本领域熟知的标准技术或下面具体描述的技术。

实施例1

实施例2-6的材料和方法

菌株、培养基和培养条件：除非另有说明，否则使用圆红冬孢酵母(R.toruloides)菌株ATCC 10657作为野生型菌株。圆红冬孢酵母通过同源重组，在非同源末端连接缺陷宿主Δku70e[7]中连续缺失四个二酰基甘油酰基转移酶基因如DGA1、LRO1、ARE1和DGA3，产生了圆红冬孢酵母四重破坏的突变体dlad(Δdga1Δlro1Δare1Δdga3)。

圆红冬孢酵母在28℃在YPD肉汤(1％酵母提取物、2％蛋白胨、2％葡萄糖)中或在固体马铃薯-右旋糖琼脂(PDA)上培养。根癌土壤杆菌在28℃在液体或固体2YT培养基(1.6％胰蛋白胨、1％酵母提取物、0.5％NaCl)中生长。将大肠杆菌XL1-Blue在Luria-Bertani(LB)肉汤中或在LB琼脂上培养，并用于常规DNA操作。

除非另有说明，否则在MinRL3培养基中培养圆红冬孢酵母中的荧光素酶基因报告菌株。MinRL3培养基含有(每升)70g葡萄糖、1.5g酵母提取物、0.5g(NH4)₂SO₄、2.05gK₂HPO₄、1.45g KH₂PO₄、0.6g MgSO₄、0.3g NaCl、10mg CaCl₂、1mg FeSO₄、0.5mg ZnSO₄、0.5mgCuSO₄，、0.5mg H₃BO₄、0.5mg MnSO₄、0.5mg NaMoO₄。将培养基pH调节至6.1。培养基MinRL2培养基含有与MinRL3相同的组合物，只是将葡萄糖浓度增强为100g/L。除非另有说明，否则根据在30℃250rpm 5天进行的脂质积累阶段期间在酵母菌株中的荧光素酶活性测定启动子活性。

一些报告菌株也在脂质生产培养基“Li2006”[32]、培养基“GJm”和“GJm2”[33]中培养，所述培养基具有修饰，其中初始葡萄糖水平分别增加至70、100和70g/L。简而言之，Li2006培养基(每升)含有70g/L葡萄糖、0.1g(NH₄)₂SO₄、0.75g酵母提取物、1.5g MgSO₄·7H₂O、0.4g KH₂PO₄、1.91×10^-6mol ZnSO₄、1.50mmol CaCl₂、1.22×10^-4mmol MnCl₂和1.00×10^-4mmol CuSO₄。GJm培养基(每升)含有70g葡萄糖、0.4g KH₂PO₄、1.5g MgSO₄·7H₂O、10mlTE溶液，pH6.0。TE溶液(每升)含有4.0g CaCl₂·2H₂O、0.55g FeSO₄·7H₂O、0.52g柠檬酸·H₂O、0.1g ZnSO₄·7H₂O、0.076g MnSO₄·H₂O、0.1ml发烟H₂SO₄[34]。

一些报告菌株在萜类化合物生产培养基“Y4”[35]中培养，并进行了一些修饰。简而言之，Y4培养基(每升)含有100g/L葡萄糖、15.7g/L蛋白胨、15.7g/L酵母提取物、12g/L(NH₄)₂SO₄、1g/L KH₂PO₄、1.5g/L MgSO₄·7H₂O(pH5.5)。

质粒构建：使用的寡核苷酸列于表1中。所有DNA限制性酶和修饰酶均来自新英格兰生物实验室(NEB，USA)。质粒pKCL2(图9)是pPZP200的衍生物[36]，其允许在CAR2基因座处有效敲入报告基因盒，其由潮霉素抗性盒(P_GPD1-3::HPT-3::T_SV40)和带有CAR2基因座序列侧翼的荧光素酶报告盒(P_GPD1::RtLUC2::T_35S)组成[29]。P_GPD1-3和P_GPD1是衍生自禾本红酵母(R.graminis)WP1和圆红冬孢酵母ATCC 10657的甘油醛3-磷酸启动子，GenBank登录号分别为JQ806386和JN208861[6]。HPT-3(JQ806387)和RtLUC2(KR258785)分别为编码大肠杆菌潮霉素磷酸转移酶和萤火虫荧光素酶(Luc2，ACH53166.1)的密码子优化的合成基因[6]。

表1

寡核苷酸的序列

使用圆红冬孢酵母基因组DNA作为模板扩增所有启动子序列。使用寡核苷酸对Rt363Sf/Rt364Nr和Rt363Sf/Rt365Nr分别扩增ACL1的上游序列(P_ACL1和P_ACL1in分别为-1000～-1和-1000～+167)。将SpeI-NcoI切割的PCR产物插入载体pKCL2的相同位点以分别产生质粒pKCLAL1和pKCLAL2。使用寡核苷酸对Rt369Sf/Rt370Nr和Rt369Sf/Rt371Nr分别扩增FAS1的上游序列(P_FAS1和P_FAS1in分别为-1001～-1和-1001～+271)。将SpeI-NcoI切割的PCR产物插入pKCL2的相同位点以分别产生pKCLF3和pKCLF4。使用寡核苷酸对Rt361Sf/Rt362Nr扩增FAT1的上游序列(P_FAT1为-1003～-1)，并将SpeI-NcoI切割的PCR产物插入pKCL2的相同位点以产生pKCLF5。使用寡核苷酸对Rt359Sf/Rt360Nr和Rt359Sf/Rt424Nr分别扩增DUR1的上游序列(P_DUR1和P_DUR1in分别为-493-1和-493+627)。将SpeI-NcoI切割的PCR产物插入pKCL2的相同位点以分别产生pKCLDU1和pKCLDU2。

分别使用寡核苷酸对Rt232Sf/Rt233Nr和Rt232Sf/Rt310Nr扩增ACC1的上游序列(P_ACC1和P_ACC1in分别为-1501～-1和-1501～+91)。将SpeI-NcoI切割的PCR产物插入到pKCL2的相同位点，分别产生pKCLA1和pKCLA2。对于连续缺失分析，分别使用寡核苷酸对Rt243Sf/Rt310Nr、Rt242Sf/Rt310Nr、Rt241Sf/Rt310Nr、Rt240Sf/Rt310Nr、Rt239Sf/Rt310Nr和Rt238Sf/Rt310Nr对来自不同位置(分别来自CDS的第一个ATG的-1204、-995、-807、-601、-407和-201)的ACC1in启动子P_ACC1in2、P_ACC1in3、P_ACC1in4、P_ACC1in5、P_ACC1in6和P_ACC1in7进行扩增。将PCR产物用SpeI和NcoI进行双酶切，并插入到pKCL2的相同位点以分别产生质粒pKCLA3、pKCLA4、pKCLA5、pKCLA6、pKCLA7和pKCLA8。为了在ACC1中的原始翻译起始密码子上发生突变，使用质粒pKCLA8的模板和寡核苷酸对(SV40R/Rt373fusion和Rt374fusion/LUC2U)来分别扩增DNA片段ACC1intL和ACC1intR。然后使用上述凝胶纯化的PCR产物(分别为380bp和286bp)和寡核苷酸Rt238Sf和Rt310Nr进行融合PCR法。将得到的PCR产物(0.3kb)用SpeI和NcoI双酶切，并插入到pKCL2的相同位点以产生质粒pKCLA81。

使用寡核苷酸对Rt366Sf/Rt367Nr和Rt366Sf/Rt368Nr分别扩增PLN1的上游序列(P_PLN1和P_PLN1in分别为-362～-1和-362～+152)。将SpeI-NcoI PCR产物(分别为0.4kb和0.5kb)分别插入到pKCL2的相同位点以产生pKCLP3和pKCLP4。对于连续缺失分析，分别使用寡核苷酸对Rt415Sf/Rt368Nr、Rt416Sf/Rt368Nr、Rt417Sf/Rt368Nr、Rt418Sf/Rt368Nr和Rt419Sf/Rt368Nr扩增来自不同上游位置(分别为-223、-180、-106、-70和-43)的PLN1in启动子P_PLN1int3、P_PLN1int4、P_PLN1int5、P_PLN1int6和P_PLN1int7。将得到的PCR产物分别用SpeI和NcoI双酶切，并插入到pKCL2的相同位点，分别产生质粒pKCLP43、pKCLP44、pKCLP45、pKCLP46和pKCLP47。

为了在PLN1的原始翻译起始密码子中制造突变，使用质粒pKCLP4的模板和寡核苷酸对(SV40R/Rt412m和Rt411m/LUC2U)来分别扩增DNA片段PLN1int1L和PLN1int1R。根据供应商的说明书(NEBuilder试剂盒，NEB，英格兰)，通过三片段Gibson组装产生质粒pKCLP41，包括用SpeI-NcoI双酶切pKCLP4载体(12.5kb)和上述两种凝胶纯化的PCR产物，即PLN1int1L和PLN1int1R(分别为713bp和341bp)。为了缺失启动子PLN1in中的ct盒#4(图5A)，使用质粒pKCLP4的模板和寡核苷酸对(SV40R/Rt421m和Rt420m/LUC2U)来分别扩增DNA片段PLN1int8L和PLN1int8R。与pKCLP41的构建一样，质粒pKCLP48由三片段Gibson组装产生，包括用SpeI-NcoI双酶切pKCLP4载体(12.5kb)和上述两种凝胶纯化的PCR产物，即PLN1int8L和PLN1int8R的PCR片段(分别为808bp和269bp)。

根癌土壤杆菌介导的转化：将双载体电转移到根癌土壤杆菌AGL1(2.5kV，25μF，400Ω)中，并随后用添加了链霉素(100μg/ml)的2YT琼脂培养基进行选择。如前所述通过ATMT进行真菌转化[6]。

基因组和总RNA的分离：如前所述提取圆红冬孢酵母的基因组DNA和RNA[6]。通过ND-1000分光光度计(Nanodrop Technologies，美国)和琼脂糖凝胶电泳来分析提取的DNA和RNA的浓度和纯度。

圆红冬孢酵母中的基因注释：基于圆红冬孢酵母ATCC 10657和黏红酵母(R.glutinis)ATCC 204091之间有非常高的序列同源性，除非另有说明,使用黏红酵母ATCC204091的基因组数据库作为参考。在黏红酵母ATCC 204091基因组数据库中，通常使用酿酒酵母(Saccharomyces cerevisiae)和解脂耶氏酵母(Yarrowia lipolytica)蛋白来进行BLAST检索的查询。采用5'和3'RACE与RT-PCR相结合的分析方法，来进一步鉴定精确的基因和mRNA序列。

cDNA末端的快速扩增(RACE)：使用BD SMARTer^TM RACE cDNA扩增试剂盒(Clontech公司，加利福尼亚州，美国)，根据制造商的说明，通过5'RACE和3'RACE获得靶cDNA序列的5'和3'末端。表1列出了5'RACE和3'RACE的寡核苷酸。使用DNase I处理的总RNA作为模板和表1中列出的特异性寡核苷酸，通过逆转录PCR扩增出全长cDNA。

报告基因检测：将双T-DNA载体电转移到根癌土壤杆菌AGL2中，并如先前所述，进行圆红冬孢酵母的根癌土壤杆菌介导转化(ATMT)[6]。在CAR2基因座处，通过白化表型来鉴定其带有敲入T-DNA的菌株，然后用Southern印迹来证实。

在YPD肉汤中培养荧光素酶报告基因菌株，至指数中期。用水洗涤细胞两次，并以0.5的光密度(OD 600)接种到指定培养基中，并在30℃振荡(250rpm)培养。使用如先前所述的一步测量方法[37]加以修改，来确定荧光素酶活性。简而言之，将细胞培养物(10μl)与85μl PBS缓冲液(pH 7.4)混合，并加入到FluoroNunc 96孔板(Thermo Fisher Scientific，朗根塞尔博德，德国)中以测量生物荧光。在光密度OD为600nm下测量细胞密度，用PBS缓冲液将细胞培养物稀释10-20倍至最终体积为100μl，并加入到96孔平底透明板(Nunc，罗斯基勒，丹麦)的孔中。使用Tecan Infinite M200读板器和iCycler 3.0版软件(Tecan，萨尔茨堡，奥地利)来测量和采集所有数据。在OD为600nm下测量细胞密度，并与5μl 10mM D-荧光素(DMSO溶液，目录号L9504，Sigma-Aldrich)混合后来测量荧光值。通过相对于GPD1启动子的标准化，计算相对启动子活性(RPA)。

实施例2

脂质积累过程中所涉及的基因表征

通过针对公共数据库以及圆红冬孢酵母或黏红酵母菌株的内部(in-house)EST和基因组数据库的数据库检索，来鉴定ACC1、ACL1、FAS1、FAT1、DUR1和PLN1的基因组序列(参见方法)。发现ACC1、ACL1、FAS1、FAT1、DUR1和PLN1基因，分别位于黏红酵母ATCC 204091的基因组中的基因座支架No.18、9、10、9、95和10中。5'和3'RACE分析或内部EST数据库检索表明了5'UTR的长度分别为150nt、179nt、142nt(RNA-seq数据)、61nt(RNA-seq数据)、303nt(RNAseq数据)和194nt。值得注意的是，相应基因组序列中的内含子中断了FAS1和PLN1mRNA的5'UTR(分别为图1C和1F)。关于基因的结构的详细信息如表2所示。

表2

基因注释

实施例3

通过荧光素酶报告基因检测来进行启动子的分析

虽然用于真核细胞中基因转录的调节元件通常包含在转录起始位点之前的区域内，但是已经发现例外，例如圆红冬孢酵母的DAO1基因和解脂耶氏酵母(Y.lypolitica)的FBA1基因[28,29]。丰富的蛋白质水平[4]与分离的ACC1基因上游DNA序列的弱启动子活性[11]之间的差异使我们推测内含子序列可能起到主要的作用。因此，DUR1、FAS1、ACC1和PLN1的上游DNA序列与荧光素酶报告基因(RtLUC2，GenBank登记号KR258785)融合成两个版本，一个包含内含子而另一个不含除了FAT1之外的内含子。启动子的范围显示在图1A-1F中。如先前报道的那样，报告基因两侧为CAR2基因组基因座的同源序列，并且可通过同源重组位点特异性地插入CAR2基因座，消除由位置效应引起的报告基因活性变化[30]。

与我们先前的结果一致[11]，通过荧光素酶报告基因检测所确定，ACC1基因的1504nt无内含子上游序列(SEQ ID NO：59)显示出极少的活性。相反，包含内含子1(SEQ IDNO：60)显著增强了启动子活性(图2B；图3A)。

值得注意的是，PLN1启动子(-362至+3；SEQ ID NO：61)显示出比GPD1启动子高2-4倍的活性，GPD1启动子通常是真菌中最强的启动子之一(图3B)。令人惊讶的是，含有内含子1和内含子2序列的PLN1in(P_PLN1in，-362至+155；SEQ ID NO：62)显示出更高的活性，达到GPD1启动子的11倍(图3B)。

FAS1和ACL1启动子的活性模式具有强相似性(图3C和3D)。在培养的初始阶段，两个启动子的内含子1显示出抑制作用(SEQ ID NO：63、64、65、66)，因为无内含子的启动子显示出更高的活性。在第3天后，抑制作用消失，伴随着脂质积累。因此，在脂质积累阶段，含有内含子的FAS1和ACL1启动子可用于延迟目标基因的表达。

在另一方面，DUR1、DUR1in和FAT1(SEQ ID NO：67、68、69)启动子均显示出弱活性(图3E和3F)。

实施例4

ACC1in和PLN1in启动子的进一步表征

嵌套缺失分析揭示了ACC1基因的上游序列长度极大地影响启动子活性。“-201Acc1in”片段(从第一个ATG的-201至+95nt；SEQ ID NO：70)比全长ACC1in片段强约5倍，达到GPD1启动子的约80％(图3B)。在报告基因活性中，“-995 ACC1in”片段(从-995至+95nt；SEQ ID NO：71)排名第二。

在BiologicsCorp(http：//www.biologicscorp.com/tools/GCContent)分析GC含量，显示出两个较高GC区域位于-66～-47和-30～+43。值得注意的是，在内含子1(+28～+41，图4C)内发现了14-nt富含GC的区段(GGCGGGCCCGCGCC(SEQ ID NO：72)，GC含量100％)。因为用ACC1in启动子表达的蛋白质将含有衍生自Acc1的N末端的四-氨基酸肽(MPFS；SEQID NO:73)(图3A)，将ACC1in启动子的天然翻译起始密码子突变为ATC，并将外显子2中的序列CTGGCG变为CCATGG以使得蛋白质翻译从这个产生的NcoI位点开始(图4A)。用该经修饰的片段(SEQ ID NO:74)进行荧光素酶检测，没有显著改变所述启动子活性(图4D)。

类似地，对PLN1in启动子进行嵌套缺失分析。制作所述片段的断点以使得可测试四个富含ct的顺式作用元件的潜在功能。与ACC1in启动子相似，将原始翻译起始密码子改变为ATC，并在外显子3中产生新的翻译起始密码子(图4B)。正如所预期的，该修饰(SEQ IDNO:6；P_PLN1int1)没有显著影响启动子活性。此外，随着片段长度的缩短，启动子活性稳步地降低(图5A和5B)。发现内含子2内的ct盒#4对于强启动子功能是关键的，其缺失会导致报告基因活性降低98.1％，并且ct盒#2似乎也发挥了重要作用(图5B)。

类似地修饰FAS1in和ACL1in，以将原始ATG起始密码子改变为ATC，并添加新的ATG起始密码子以分别产生具有SEQ ID NO:76和SEQ ID NO:80的启动子。

实施例5

在不同培养基中PLN1in启动子的活性

为了观察PLN1in启动子的优异性能是否可在不同的脂质生产培养基中复制，将含有PLN1(SEQ ID NO:4)、PLN1in(SEQ ID NO:5)、PLN1int(SEQ ID NO:6)和PLN1int1片段(图5A)的荧光素酶报告菌株在Li2006培养基、GJm2培养基和MinRL3培养基(参见组合物的材料和方法)中培养5天，其中最初使用相同浓度的葡萄糖(70g/L)。在所有培养基中，显示PLN1和PLN1in的活性与GPD1启动子相比高2-3倍(图6)。与之前观察相一致，在Li2006和GJm2培养基中，启动子PLN1in显示出比无内含子启动子PLN1更高的强度(各自增加约1.4倍，图6A和6B)，虽然这在MinRL3培养基中并不明显(图6C)。PLN1int1片段(SEQ ID NO:6)略微弱于PLN1in片段，可能是由于新产生的翻译起始的-3上游的核苷酸是“T”而不是G/A，即翻译密码子位于不太有利的Kozak共有序列中[31]。在-3位置上把C改变为G将解决此问题。

令人惊讶的是，在Y4培养基中PLN1in启动子弱得多，而FAS1in(具有ATG至ATC的突变并重新产生ATG(SEQ ID NO:76))和ACC1int启动子(具有ATG至ATC的突变并在外显子2中重新产生ATG(SEQ ID NO:77))表现出显著提高的活性(图7D)。

实施例6

脂质缺陷突变体中脂质生产相关启动子的活性

为了评估上述启动子在非油积累遗传背景中的性能，将针对ACL1int(SEQ ID NO:77)、PLN1(SEQ ID NO:4)、PLN1in(SEQ ID NO:5)和PLN1int1(SEQ ID NO:6)的报告基因构建体转化到圆红冬孢酵母四重突变株dlad中，其中通过同源重组来缺失所有4种二酰基甘油酰基转移酶：Dga1、Lro1、Are1和Dga3。该突变体含有非常少的TAG(图7A和7B)。在脂质生产培养基MinRL3中培养报告基因菌株5天，并且每天进行荧光素酶检测。结果显示，与野生型菌株相比所述突变体dlad中启动子性能相似(比较图7C和图6B)。PLN1、PLN1in和PLN1int1与脂质积累条件密切相关，其不依赖于脂质生物合成途径的完整性。

实施例7

实施例8-11的材料和方法

DNA构建：使用的寡核苷酸列于表3中。所有DNA限制酶和修饰酶均来自新英格兰生物实验室(NEB，MA，美国)。通过测序来检验所有构建的质粒的序列保真度。

表3

寡核苷酸序列

除非另有说明，使用圆红冬孢酵母基因组DNA作为模板来扩增启动子序列。分别使用寡核苷酸对Rt356Sf/Rt357Nr2和Rt356Sf/Rt358Nr扩增TEF1(-1000～-1)和TEF1in(-1000～+130)的上游序列(图9A)。将得到的TEF1和TEF1in启动子的PCR产物用SpeI和NcoI双酶切，并插入到载体pKCL2的相同位点以分别产生质粒pKCLT1和pKCLT2。对于连续缺失分析，分别使用寡核苷酸对Rt437Sf/Rt358Nr、Rt438Sf/Rt358Nr、Rt439Sf/Rt358Nr和Rt440Sf/Rt358Nr对来自不同上游位置(分别为-797、-600、-382和-193)的TEF1in启动子P_TEF1int1、P_TEF1int2、P_TEF1int3和P_TEF1int4进行扩增。将得到的PCR产物用SpeI和NcoI双酶切，并插入到pKCL2的相同位点以分别产生质粒pKCLT22、pKCLT23、pKCLT24和pKCLT25。与PLN1int1启动子相似，为了在TEF1in启动子(TEF1int1启动子)的原始翻译起始密码子中进行突变，使用质粒pKCLT2的模板与寡核苷酸对SV40R/Rt409m和Rt410m/LUC2U来分别扩增DNA片段TEF1int1L和TEF1int1R。根据供应商的说明书(NEBuilder试剂盒，NEB，英格兰)，通过三片段Gibson组装产生质粒pKCLT21，包括SpeI-NcoI双酶切pKCLT2载体(12.5kb)和上述凝胶纯化的两种PCR产物，即TEF1inm1L和TEF1inm1R(分别为1349bp和319bp)。

实施例8

TEF1的生物信息学分析

使用来自酿酒酵母(Saccharomyces cerevisiae)的直系同源Tef1p的查询(表4)，通过BLAST检索公共数据库以及圆红冬孢酵母菌株的内部EST和基因组数据库[39,40]，来鉴定翻译延伸因子EF-1α基因(TEF1)的基因组序列。发现所述假定的TEF1同源物位于圆红冬孢酵母ATCC 204091的基因组测序支架No.13中(表4)。通过5'RACE和转录组学分析显示出TEF1的cDNA(SEQ ID NO：112)含有长度为45nt的5'非翻译区(5'UTR)(表4，图9A和9B)。基因组序列显示在SEQ ID NO:111中。

表4

基因注释

实施例9

启动子分析

通过PCR以两种版本(有或没有内含子序列)扩增TEF1的上游DNA序列(图9A和9B)，并且在双载体pKCL2中与密码子优化的荧光素酶报告基因RtLUC2(GenBank登录号KR258785)[29]融合。对于无内含子的TEF1启动子(-1000～-1)，在如YPD肉汤的丰富培养基(rich media)中培养时，内源性TEF1in启动子(-100至+130)产生了显著更高的荧光素酶活性(图10)，在培养1天后其达到GPD1启动子的1.7倍(图10)，而TEF1启动子仅表现出GPD1启动子81％的启动子强度。因此，TEF1in启动子能够驱动强基因表达，并且TEF1的第二内含子可表现为使启动子强度增强2倍的增强子。

实施例10

截短分析

为了研究TEF1in启动子内潜在的上游活化序列(UAS)，产生了启动子序列的一系列截短(图11A)。荧光素酶报告基因测定显示出在启动子序列逐步缩短时，启动子活性逐渐降低(图11B)。翻译起始密码子的定点诱变(在TEF1int1启动子中的ATG至ATC)也使启动子强度减弱25％(图11B)。总之，1.1kb的整合了内含子1和2的TEF1上游序列是最好的启动子。

实施例11

培养基作用

为了研究TEF1in启动子在脂质积累阶段的表现，我们测定了在GJ2013培养基中培养2天后的荧光素酶表达，并以相同条件下在YPD肉汤中的培养物作为对照。结果显示丰富培养基(YPD肉汤)支持TEF1in启动子的更好性能，其表现出高于GPD1启动子3倍的启动子强度(图11B)。在脂质生产培养基(GJ2013培养基)中，TEF1in和GPD1启动子均表现更差。在GJ2013培养基中，GPD1在丰富培养基中表现出37％的启动子强度，而TEF1in启动子在丰富培养基中仅保持11％的启动子强度(图11B)。总的来说，这表明了TEF1in启动子对环境营养条件更敏感，而且营养限制或饥饿可能降低其启动子活性。

在描述本发明的上下文中(特别是在以下权利要求的上下文中)，术语“一个”和“一种”和“所述”以及类似指示物的使用被理解为既包括单数也包括复数，除非本文另有说明或与上下文明显矛盾。术语“包含”、“具有”、“包括”和“含有”应被解释为开放式术语(即指“包括但不限于”)，除非另有说明。除非这里另有说明，这里对数值范围的描述仅仅用作单独指代落入该范围内的每个独立的值的简化方法，并且每个独立的值并入本说明书中如同其在这里单独引用一样。在此所描述的所有方法可以任何合适的次序来进行，除非在此另有说明或除非与上下文明显矛盾。此处提供的任何和所有的实施例或者示例性语言(例如，“如”)的使用都仅仅是为了更好地说明本发明，除非另外声明否则不对本发明的范围构成限定。说明书中的任何语言不应被解释为表明任何未要求保护的要素对于本发明的实践是必不可少的。

本文描述了本发明的实施方案，包括实施本发明时，发明人所知的最佳方式。在阅读上述说明书后，这些实施方案的变化形式对于本领域技术人员将变得明显。发明人预期熟练的技术人员适当地采用这些变化，并且发明人希望本发明以不同于本文具体描述的方式实施。相应地，只要相关法律容许，本发明包括此处所附的权利要求中所述主题的所有修改和等同替换。此外，本发明涵盖上述元件的所有可能变化的任何组合，除非本文另有说明或与上下文明显矛盾。

参考文献

1.Sampaio JP，Gadanho M，Bauer R，WeiβM:Taxonomic studies in theMicrobotryomycetidae:Leucosporidium golubevii sp.nov.，Leucosporidiellagen.nov.and the new orders Leucosporidiales and Sporidiobolales.Mycol Prog2003，2:53-68.

2.Yamazaki M，Komagata K:Taxonomic significance of electrophoreticcomparison of enzymes in the genera Rhodotorula andRhodosporidium.International Journal of Systematic Bacteriology 1981，31:361-381.

3.Zhao X,Wu S,Hu C,Wang Q,Hua Y,Zhao ZK:Lipid production fromJerusalem artichoke by Rhodosporidium toruloides Y4.J Ind MicrobiolBiotechnol 2010,37:581-585.

4.Liu H,Zhao X,Wang F，Li Y，Jiang X，Ye M，Zhao ZK，Zou H:Comparativeproteomic analysis of Rhodosporidium toruloides during lipidaccumulation.Yeast 2009，26:553-566.

5.Turcotte G，Kosaric N:Biosynthesis of lipids by Rhodosporidiumtoruloides ATCC 10788.J Biotechnol 1988，8:221-237.

6.Liu Y，Koh CM，Sun L，Hlaing MM，Du M，Peng N,Ji L:Characterization ofglyceraldehyde-3-phosphate dehydrogenase gene RtGPD1 and development ofgenetic transformation method by dominant selection in oleaginous yeastRhodosporidium toruloides.Appl Microbiol Biotechnol 2013，97:719-729.

7.Koh CM，Liu Y，Moehninsi，Du M，Ji L:Molecular characterization of KU70and KU80 homologues and exploitation of a KU70-deficient mutant for improvinggene deletion frequency in Rhodosporidium toruloides.BMC Microbiol 2014,14:50-59.

8.Lin X,Wang Y,Zhang S,Zhu Z,Zhou YJ,Yang F,Sun W,Wang X,Zhao ZK:Functional integration of multiple genes into the genome of the oleaginousyeast Rhodosporidium toruloides.FEMS Yeast Res 2014,14:547-555.

9.Abbott EP,Ianiri G,Castoria R,Idnurm A:Overcoming recalcitranttransformation and gene manipulation in Pucciniomycotina yeasts.ApplMicrobiol Biotechnol 2012，97:283-295.

10.Tai M,Stephanopoulos G:Engineering the push and pull of lipidbiosynthesis in oleaginous yeast Yarrowia lipolytica for biofuelproduction.Metabolic engineering 2013,15:1-9.

11.Ji L,Peng N,Cheng HI:Polynucleotide sequences from Rhodosporidiumand Rhodotorula and use thereof.2014，WO 2014/142747.

12.Zhu Z，Zhang S，Liu H，Shen H，Lin X，Yang F，Zhou YJ，Jin G，Ye M，Zou H,Zhao ZK:A multi-omic map of the lipid-producing yeast Rhodosporidiumtoruloides.Nat Commun 2012,3:1112.

13.Ratledge C，Wynn JP:The biochemistry and molecular biology of lipidaccumulation in oleaginous microorganisms.Adv Appl Microbiol 2002,51:1-51.

14.Kolodziej SJ,Penczek PA，Schroeter JP，Stoops JK:Structure-functionrelationships of the Saccharomyces cerevisiae fatty acid synthase.Three-dimensional structure.J Biol Chem 1996，271:28422-28429.

15.Leibundgut M,Jenni S,Frick C,Ban N:Structural basis for substratedelivery by acyl carrier protein in the yeast fatty acid synthase.Science2007,316:288-290.

16.Lomakin IB,Xiong Y,Steitz TA:The crystal structure of yeast fattyacid synthase,a cellular machine with eight active sites workingtogether.Cell 2007,129:319-332.

17.Schweizer M，Roberts LM,Holtke HJ,Takabayashi K,Hollerer E,HoffmannB,Muller G,Kottig H,Schweizer E:The pentafunctional FAS1 gene of yeast:itsnucleotide sequence and order of the catalytic domains.Mol Gen Genet 1986,203:479-486.

18.Mohamed AH,Chirala SS,Mody NH,Huang WY,Wakil SJ:Primary structureof the multifunctional alpha subunit protein of yeast fatty acid synthasederived from FAS2 gene sequence.J Biol Chem 1988,263:12315-12325.

19.Schuller HJ,Schutz A,Knab S，Hoffmann B，Schweizer E:Importance ofgeneral regulatory factors Rap1p,Abf1p and Reb1p for the activation of yeastfatty acid synthase genes FAS1 and FAS2.Eur J Biochem 1994,225:213-222.

20.Schuller HJ,Schorr R，Hoffmann B,Schweizer E:Regulatory gene INO4of yeast phospholipid biosynthesis is positively autoregulated and functionsas a transactivator of fatty acid synthase genes FAS1 and FAS2 fromSaccharomyces cerevisiae.Nucleic Acids Res 1992,20:5955-5961.

21.Schwank S,Ebbert R,Rautenstrauss K,Schweizer E，Schuller HJ:Yeasttranscriptional activator INO2 interacts as an Ino2p/Ino4p basic helix-loop-helix heteromeric complex with the inositol/choline-responsive elementnecessary for expression of phospholipid biosynthetic genes in Saccharomycescerevisiae.Nucleic Acids Res 1995,23:230-237.

22.Wenz P,Schwank S，Hoja U，Schuller HJ:A downstream regulatoryelement located within the coding sequence mediates autoregulated expressionof the yeast fatty acid synthase gene FAS2 by the FAS1 gene product.NucleicAcids Res 2001,29:4625-4632.

23.Kimmel AR,Brasaemle DL,McAndrews-Hill M，Sztalryd C,Londos C:Adoption of PERILIPIN as a unifying nomenclature for the mammalian PAT-familyof intracellular lipid storage droplet proteins.J Lipid Res 2010,51:468-471.

24.Athenstaedt K，Jolivet P,Boulard C，Zivy M，Negroni L，Nicaud JM，Chardot T:Lipid particle composition of the yeast Yarrowia lipolytica dependson the carbon source.Proteomics 2006，6:1450-1459.

25.Wang C,St Leger RJ:The Metarhizium anisopliae Perilipin HomologMPL1 Regulates Lipid Metabolism,Appressorial Turgor Pressure,and Virulence.JBiol Chem 2007,282:21110-21115.

26.Zhu Z,Ding Y,Gong Z,Yang L,Zhang S,Zhang C,Lin X,Shen H,Zou H,XieZ,et al:Dynamics of the Lipid Droplet Proteome of the Oleaginous YeastRhodosporidium toruloides.Eukaryot Cell 2015,14:252-264.

27.Digel M,Ehehalt R,Fullekrug J:Lipid droplets lighting up:insightsfrom live microscopy.FEBS Lett 2010,584:2168-2175.

28.Hong SP,Seip J,Walters-Pollak D,Rupert R,Jackson R,Xue Z,Zhu Q:Engineering Yarrowia lipolytica to express secretory invertase with strongFBA1IN promoter.Yeast 2012,29:59-72.

29.Liu Y,Koh CMJ,Ngoh ST,Ji L:Engineering an efficient and tight d-amino acid-inducible gene expression system in Rhodosporidium/Rhodotorulaspecies.Microbial Cell Factories 2015,14:170-185.

30.Koh CM,Liu Y,Du M,Ji L:Molecular characterization of KU70 and KU80homologues and exploitation of a KU70-deficient mutant for improving genedeletion frequency in Rhodosporidium toruloides.BMC Microbiology 2014,14:50.

31.Kozak M:Point mutations define a sequence flanking the AUGinitiator codon that modulates translation by eukaryotic ribosomes.Cell 1986,44:283-292.

32.Li Y-H,Liu B,Zhao Z-B,Bai F-W:Optimization of Culture Conditionsfor Lipid Production by Rhodosporidium toruloides.Chinese Journal ofBiotechnology 2006,22:650-656.

3.Jin G,Zhang Y,Shen H,Yang X,Xie H,Zhao ZK:Fatty acid ethyl estersproduction in aqueous phase by the oleaginous yeast Rhodosporidiumtoruloides.Bioresour Technol 2013,150:266-270.

34.Meesters PA,Eggink G:Isolation and characterization of a delta-9fatty acid desaturase gene from the oleaginous yeast Cryptococcus curvatusCBS 570.Yeast 1996,12:723-730.

35.Li Y,Zhao Z,Bai F:High-density cultivation of oleaginous yeastRhodosporidium toruloides Y4 in fed-batch culture.Enzyme and MicrobialTechnology 2007,41:312-317.

36.Lee LY,Gelvin SB:T-DNA binary vectors and systems.Plant Physiol2008,146:325-332.

37.Leskinen P,Virta M,Karp M:One-step measurement of fireflyluciferase activity in yeast.Yeast 2003,20:1109-1113.

38.Zuo,J,Niu,QW,Moller,SG,Chua,NH:Chemical-regulated,site-specificDNA excision in transgenic plants.Nat Biotechnol,2001.19:157-161.

39.Hu J,Ji L:Draft genome sequences of Rhodosporidium toruloidesstrains ATCC 10788 and ATCC 10657 with compatible mating types.Genomeannouncements 2016,4:e00098-00016.

40.Paul D,Magbanua Z,Arick M,2nd,French T,Bridges SM,Burgess SC,Lawrence ML:Genome Sequence of the Oleaginous Yeast Rhodotorula glutinis ATCC204091.Genome Announc 2014,2:1-2.

序列表

<110> 淡马锡生命科学研究院有限公司

<120> 含有内含子的启动子及其用途

<130> 2577-251PCT

<150> US 62/292,030

<151> 2016-02-05

<160> 122

<170> PatentIn version 3.5

<210> 1

<211> 299

<212> DNA

<213> Rhodosporidium toruloides

<400> 1

cgcgccttgt ccgcttcccc atcctcgtcc tgctcttgct ctcttcccta ccacactctc 60

ccgcttgcgg gctctctttc tcgcttggcg ctcctgctac cgctactcta gactctccta 120

gtctccctgc acaaccatcc ctatcccctc cgcctctctc gcacaccccc cacagcttcg 180

ttccccaact tcacttccga tgccgtgcgt cgcctccctt tcgcctggcg ggcccgcgcc 240

tgcttccgag gacaactact gattgtggga tcatgcgacg acaggttctc tggcgaggc 299

<210> 2

<211> 562

<212> DNA

<213> Rhodosporidium toruloides

<400> 2

cacgcctctg tgactcggta cggagagaga gagcgttggg ttgggttggg gattgtggcg 60

agcgaagggc gacccagcag ccagggagag ggagttggtc tggatgcaaa ccatgcgcat 120

ctcctctcgc agttgaatcg tttttcccgc tctgccctcg ctctctcttc cttctgctct 180

ttactcgctc acgaacaaca acgagccaca cagcgtgagc acacaccgct gcactcactc 240

gctgtcacgg accgcagctc acccttatcg tcactccctc tcccaccgca cagcctcact 300

ccctctctcg ctctccctca caagcacaac acacggcaca ctcgcacgca cactcgcacg 360

caatggccac cgtcaacgag aagcagcccg ccaccgacgc gcccctcgcg cacgagaccg 420

ccatccaccg cgtgcgtccc catccctccc actgtcttcc tcgtgaaacc cgctcacccg 480

ttcgcaagca cacacgcagg tgtcggacta ccccgtgatc aaagacaccc tctcctcgct 540

cgactcgtac gcccactcgc ac 562

<210> 3

<211> 80

<212> DNA

<213> Rhodosporidium toruloides

<400> 3

gtgcgtcgcc tccctttcgc ctggcgggcc cgcgcctgct tccgaggaca actactgatt 60

gtgggatcat gcgacgacag 80

<210> 4

<211> 365

<212> DNA

<213> Rhodosporidium toruloides

<400> 4

cacgcctctg tgactcggta cggagagaga gagcgttggg ttgggttggg gattgtggcg 60

agcgaagggc gacccagcag ccagggagag ggagttggtc tggatgcaaa ccatgcgcat 120

ctcctctcgc agttgaatcg tttttcccgc tctgccctcg ctctctcttc cttctgctct 180

ttactcgctc acgaacaaca acgagccaca cagcgtgagc acacaccgct gcactcactc 240

gctgtcacgg accgcagctc acccttatcg tcactccctc tcccaccgca cagcctcact 300

ccctctctcg ctctccctca caagcacaac acacggcaca ctcgcacgca cactcgcacg 360

ccatg 365

<210> 5

<211> 517

<212> DNA

<213> Rhodosporidium toruloides

<400> 5

cacgcctctg tgactcggta cggagagaga gagcgttggg ttgggttggg gattgtggcg 60

agcgaagggc gacccagcag ccagggagag ggagttggtc tggatgcaaa ccatgcgcat 120

ctcctctcgc agttgaatcg tttttcccgc tctgccctcg ctctctcttc cttctgctct 180

ttactcgctc acgaacaaca acgagccaca cagcgtgagc acacaccgct gcactcactc 240

gctgtcacgg accgcagctc acccttatcg tcactccctc tcccaccgca cagcctcact 300

ccctctctcg ctctccctca caagcacaac acacggcaca ctcgcacgca cactcgcacg 360

caatggccac cgtcaacgag aagcagcccg ccaccgacgc gcccctcgcg cacgagaccg 420

ccatccaccg cgtgcgtccc catccctccc actgtcttcc tcgtgaaacc cgctcacccg 480

ttcgcaagca cacacgcagg tgtcggacta ccccatg 517

<210> 6

<211> 517

<212> DNA

<213> Rhodosporidium toruloides

<400> 6

cacgcctctg tgactcggta cggagagaga gagcgttggg ttgggttggg gattgtggcg 60

agcgaagggc gacccagcag ccagggagag ggagttggtc tggatgcaaa ccatgcgcat 120

ctcctctcgc agttgaatcg tttttcccgc tctgccctcg ctctctcttc cttctgctct 180

ttactcgctc acgaacaaca acgagccaca cagcgtgagc acacaccgct gcactcactc 240

gctgtcacgg accgcagctc acccttatcg tcactccctc tcccaccgca cagcctcact 300

ccctctctcg ctctccctca caagcacaac acacggcaca ctcgcacgca cactcgcacg 360

caatcgccac cgtcaacgag aagcagcccg ccaccgacgc gcccctcgcg cacgagaccg 420

ccatccaccg cgtgcgtccc catccctccc actgtcttcc tcgtgaaacc cgctcacccg 480

ttcgcaagca cacacgcagg tgtcggacta ccccatg 517

<210> 7

<211> 378

<212> DNA

<213> Rhodosporidium toruloides

<400> 7

gtttttcccg ctctgccctc gctctctctt ccttctgctc tttactcgct cacgaacaac 60

aacgagccac acagcgtgag cacacaccgc tgcactcact cgctgtcacg gaccgcagct 120

cacccttatc gtcactccct ctcccaccgc acagcctcac tccctctctc gctctccctc 180

acaagcacaa cacacggcac actcgcacgc acactcgcac gcaatcgcca ccgtcaacga 240

gaagcagccc gccaccgacg cgcccctcgc gcacgagacc gccatccacc gcgtgcgtcc 300

ccatccctcc cactgtcttc ctcgtgaaac ccgctcaccc gttcgcaagc acacacgcag 360

gtgtcggact accccatg 378

<210> 8

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 8

tttccgcggt cgaatttccc cgatcgttca 30

<210> 9

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 9

gagtcgctca cctactgcat c 21

<210> 10

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 10

gaaggcgggg gttctcggaa g 21

<210> 11

<211> 18

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 11

gacgaggtca tccgcgag 18

<210> 12

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 12

gaccagctct accagcgcat cac 23

<210> 13

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 13

tcgccctcct cccctgctcg caaat 25

<210> 14

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 14

tttactagtg gtcgcttctt tcctcgcag 29

<210> 15

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 15

tttccatggg aagtgaagtt ggggaacg 28

<210> 16

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 16

tttccatgga gaacctgtcg tcgcatga 28

<210> 17

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 17

tttactagtc gcgccttgtc cgcttc 26

<210> 18

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 18

tttactagtc ttcagaaggg atgggaggag 30

<210> 19

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 19

tttactagtc tggcacgccg tcgaggac 28

<210> 20

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 20

tttactagtg acccggatta ctcgagcatc 30

<210> 21

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 21

tttactagtg ctcaagcgag ccgatacag 29

<210> 22

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 22

tttactagtt gcgggagttg ttggacac 28

<210> 23

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 23

gatcggaagt gaagttgggg aac 23

<210> 24

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 24

ttcgttcccc aacttcactt ccgatcccgt gcgtcgcctc cctttc 46

<210> 25

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 25

tttactagtt cgacttgtct tcctccgcga 30

<210> 26

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 26

tttccatggc gaaagaggga tgtgag 26

<210> 27

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 27

tttccatgga gaagaggttc tgcgcgga 28

<210> 28

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 28

tttactagtc tgtgatgcta ggtgtcgatc 30

<210> 29

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 29

tttccatggc tgctgcgttt cctggtac 28

<210> 30

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 30

tttccatggc gtcgtactcg cggatg 26

<210> 31

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 31

tttactagtg aactcgactc attacgggag 30

<210> 32

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 32

tttccatggt gtgcggtatt cgacgagttt g 31

<210> 33

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 33

tttccatgga gtagtgctgt ccgcgcaga 29

<210> 34

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 34

tttactagtc tctagcctac gaccgcctc 29

<210> 35

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 35

tttccatggt agcgagtcgt tctctgcag 29

<210> 36

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 36

tttactagtt cgacttgtct tcctccgcga 30

<210> 37

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 37

tttccatggc gaaagaggga tgtgag 26

<210> 38

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 38

tttccatgga gaagaggttc tgcgcgga 28

<210> 39

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 39

tttactagtc acgcctctgt gactcggtac 30

<210> 40

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 40

tttccatggc gtgcgagtgt gcgtgcga 28

<210> 41

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 41

tttccatggg gtagtccgac acctgcg 27

<210> 42

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 42

agcttggatc catgtcgcgt aggctcgttc gg 32

<210> 43

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 43

ttaacgccga attgaattcg gaggtttttc gacgcacgtg agtcg 45

<210> 44

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 44

acgcgacatg gatccaagct caagctaagc tgatcctacc 40

<210> 45

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 45

ggcgcccatg ctgaattaac gccgaattga attcgcgcg 39

<210> 46

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 46

ccttgcgtat aatatttgcc cacgagggac ttgagatgtg a 41

<210> 47

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 47

gttaattcag catgggcgcc cgcgc 25

<210> 48

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 48

cacgcacact cgcacgcaat cgccaccgtc aacgagaagc agc 43

<210> 49

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 49

gctgcttctc gttgacggtg gcgattgcgt gcgagtgtgc gtg 43

<210> 50

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 50

agcacacacg caggtgtcgg ccgccaccat ggaggacgcc aagaac 46

<210> 51

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 51

gttcttggcg tcctccatgg tggcggccga cacctgcgtg tgtgct 46

<210> 52

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 52

tttactagtt tttcccgctc tgccctc 27

<210> 53

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 53

tttactagta cgaacaacaa cgagccacac a 31

<210> 54

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 54

tttactagtg ctcaccctta tcgtcactc 29

<210> 55

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 55

tttactagtg cctcactccc tctctcgct 29

<210> 56

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 56

tttactagta caagcacaac acacggcac 29

<210> 57

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 57

accgccatcc accgcgtgcg gtgaaacccg ctcacccgtt 40

<210> 58

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> oligonucleotide

<400> 58

aacgggtgag cgggtttcac cgcacgcggt ggatggcggt 40

<210> 59

<211> 1504

<212> DNA

<213> Rhodosporidium toruloides

<400> 59

ggtcgcttct ttcctcgcag cacgcttttg tcggctccct gatcagcaca caagctaact 60

aacgctctgg tttcgctggc agtcatgcac ggccttggct cgtcaacctc gttctgggaa 120

gcgcccttct cccgctcaaa cctgtcctcc cgcttccgcc tcatccgcta cgacttcgac 180

ggccacggtc tctcgcccgt ctcgtccctc gacgcagcag atgacggcgc catgatcccg 240

ctcgacgacc tcgtcgggga cttggcggct gtgatcgagt gggctggggt ggagaaggtt 300

gcgggagttg ttggacactc gatgagcggg ctggtggcga gcacatttgc ggccaagtac 360

ccgcagaagc tcgacaagct cggtgagtcg cattgaacct tcctccgccg tctcttctcc 420

gctgacgatt cgtcgacttg gccctgcttc tcgcgcagtc ctcctcggcg caatgcgctc 480

tctgaaccct accgtccaaa gcaacatgct caagcgagcc gatacagtcc tcgaatccgg 540

cctctcagca atcgtcgcac aagtcgtctc cgccgctttg tccgacaagt caaagcagga 600

ctcgcccctc tcggcagcga tggtgcgaac gctcgtgctt ggaacggacc cgagagggta 660

cgcggcggcg tgtagggcgc ttgcgggtgc gaaggacccg gattactcga gcatcaaggc 720

cgagacgttg ggtgcgttcg cttgttctcc ttcctctgct tttctcccag caactgacgc 780

aagcgtctgc aacacagtcg tcgcaggcga gtttgactac ctctcgaaca aggagacgac 840

cgacgcgctg gtcaacgaca tcccgggcgc ggagaaggtc cagatggaca gtgtcggcca 900

ctggcacgcc gtcgaggacc ccgttggact cgccaagatc ctcgatgggt tcttcttgca 960

ggggaaatga ggttgggaag gggggataga ctggggagaa cggcaggtgc gtacgcagcg 1020

gacgtcggtc gggaggactt tttcggggag gatattcgct gactgactcc gacgtcgctt 1080

tcctccttgc agtatcttca gaagggatgg gaggaggcga actgcaaggg taatgaacga 1140

gacaacgccg agggaggaag cgccggaact ctcgggggcg aagaaggagt ggtgtcttcg 1200

ccagcgaaca gcttccgggg tgggttggac agcgccagta gaattccagc gtcgcaacag 1260

agctctagtc gaccgcgatc acccacaagg acgagagcgg gtcgcgcctt gtccgcttcc 1320

ccatcctcgt cctgctcttg ctctcttccc taccacactc tcccgcttgc gggctctctt 1380

tctcgcttgg cgctcctgct accgctactc tagactctcc tagtctccct gcacaaccat 1440

ccctatcccc tccgcctctc tcgcacaccc cccacagctt cgttccccaa cttcacttcc 1500

gatg 1504

<210> 60

<211> 1596

<212> DNA

<213> Rhodosporidium toruloides

<400> 60

ggtcgcttct ttcctcgcag cacgcttttg tcggctccct gatcagcaca caagctaact 60

aacgctctgg tttcgctggc agtcatgcac ggccttggct cgtcaacctc gttctgggaa 120

gcgcccttct cccgctcaaa cctgtcctcc cgcttccgcc tcatccgcta cgacttcgac 180

ggccacggtc tctcgcccgt ctcgtccctc gacgcagcag atgacggcgc catgatcccg 240

ctcgacgacc tcgtcgggga cttggcggct gtgatcgagt gggctggggt ggagaaggtt 300

gcgggagttg ttggacactc gatgagcggg ctggtggcga gcacatttgc ggccaagtac 360

ccgcagaagc tcgacaagct cggtgagtcg cattgaacct tcctccgccg tctcttctcc 420

gctgacgatt cgtcgacttg gccctgcttc tcgcgcagtc ctcctcggcg caatgcgctc 480

tctgaaccct accgtccaaa gcaacatgct caagcgagcc gatacagtcc tcgaatccgg 540

cctctcagca atcgtcgcac aagtcgtctc cgccgctttg tccgacaagt caaagcagga 600

ctcgcccctc tcggcagcga tggtgcgaac gctcgtgctt ggaacggacc cgagagggta 660

cgcggcggcg tgtagggcgc ttgcgggtgc gaaggacccg gattactcga gcatcaaggc 720

cgagacgttg ggtgcgttcg cttgttctcc ttcctctgct tttctcccag caactgacgc 780

aagcgtctgc aacacagtcg tcgcaggcga gtttgactac ctctcgaaca aggagacgac 840

cgacgcgctg gtcaacgaca tcccgggcgc ggagaaggtc cagatggaca gtgtcggcca 900

ctggcacgcc gtcgaggacc ccgttggact cgccaagatc ctcgatgggt tcttcttgca 960

ggggaaatga ggttgggaag gggggataga ctggggagaa cggcaggtgc gtacgcagcg 1020

gacgtcggtc gggaggactt tttcggggag gatattcgct gactgactcc gacgtcgctt 1080

tcctccttgc agtatcttca gaagggatgg gaggaggcga actgcaaggg taatgaacga 1140

gacaacgccg agggaggaag cgccggaact ctcgggggcg aagaaggagt ggtgtcttcg 1200

ccagcgaaca gcttccgggg tgggttggac agcgccagta gaattccagc gtcgcaacag 1260

agctctagtc gaccgcgatc acccacaagg acgagagcgg gtcgcgcctt gtccgcttcc 1320

ccatcctcgt cctgctcttg ctctcttccc taccacactc tcccgcttgc gggctctctt 1380

tctcgcttgg cgctcctgct accgctactc tagactctcc tagtctccct gcacaaccat 1440

ccctatcccc tccgcctctc tcgcacaccc cccacagctt cgttccccaa cttcacttcc 1500

gatgccgtgc gtcgcctccc tttcgcctgg cgggcccgcg cctgcttccg aggacaacta 1560

ctgattgtgg gatcatgcga cgacaggttc tctggc 1596

<210> 61

<211> 365

<212> DNA

<213> Rhodosporidium toruloides

<400> 61

cacgcctctg tgactcggta cggagagaga gagcgttggg ttgggttggg gattgtggcg 60

agcgaagggc gacccagcag ccagggagag ggagttggtc tggatgcaaa ccatgcgcat 120

ctcctctcgc agttgaatcg tttttcccgc tctgccctcg ctctctcttc cttctgctct 180

ttactcgctc acgaacaaca acgagccaca cagcgtgagc acacaccgct gcactcactc 240

gctgtcacgg accgcagctc acccttatcg tcactccctc tcccaccgca cagcctcact 300

ccctctctcg ctctccctca caagcacaac acacggcaca ctcgcacgca cactcgcacg 360

caatg 365

<210> 62

<211> 517

<212> DNA

<213> Rhodosporidium toruloides

<400> 62

cacgcctctg tgactcggta cggagagaga gagcgttggg ttgggttggg gattgtggcg 60

agcgaagggc gacccagcag ccagggagag ggagttggtc tggatgcaaa ccatgcgcat 120

ctcctctcgc agttgaatcg tttttcccgc tctgccctcg ctctctcttc cttctgctct 180

ttactcgctc acgaacaaca acgagccaca cagcgtgagc acacaccgct gcactcactc 240

gctgtcacgg accgcagctc acccttatcg tcactccctc tcccaccgca cagcctcact 300

ccctctctcg ctctccctca caagcacaac acacggcaca ctcgcacgca cactcgcacg 360

caatggccac cgtcaacgag aagcagcccg ccaccgacgc gcccctcgcg cacgagaccg 420

ccatccaccg cgtgcgtccc catccctccc actgtcttcc tcgtgaaacc cgctcacccg 480

ttcgcaagca cacacgcagg tgtcggacta ccccgtg 517

<210> 63

<211> 742

<212> DNA

<213> Rhodosporidium toruloides

<400> 63

gaactcgact cattacggga ggcgccgaca agacgatcaa ggttcgtcca ggacagccct 60

tctctgccgt cgagtttcgt tcccgctgac accctgcctt gtgcgcagat ctactctgag 120

caagcatagg tcgttccagc tgtaccggcg cggtgatcgt cgttgtgcga gtgtaacatt 180

gtgcgatacc cagcagccta tcggaggaca gcgagtgcct cgagagctgg agacgaggag 240

tcgggtgaag cgggcaaggc tggcctcgct ggatgctgag acgtcccaca gcatcgtgca 300

cgaaggagga ggggacgggc ggggacgaag cggtgttggt cgtcgggacc tcgtcgtccg 360

aaagttgggt cgtcgctccg tcgcgcggct cgcttctctc gtttccttct cttccacccg 420

ctcgctctgc ttcttgcttg aactggctca gcttggctcg ctaggaacga actactcgct 480

acactacccc aggtgcgcaa cggacttccc actctccagc tctcggacct cgacgagcga 540

aagacgaacc ccaacgacct ctcctctcgc ctgcctcgtc ttgctcagca cctaacgaca 600

cacgagcgac ccagcccgac tagactcgcg caaacctcgc aaactgaccc gcttgccatt 660

cgcctctcca gctccctctc cccgtcctcg tctccccact tcgctaccct ctcttcaaac 720

tcgtcgaata ccgcacagga tg 742

<210> 64

<211> 1010

<212> DNA

<213> Rhodosporidium toruloides

<400> 64

gaactcgact cattacggga ggcgccgaca agacgatcaa ggttcgtcca ggacagccct 60

tctctgccgt cgagtttcgt tcccgctgac accctgcctt gtgcgcagat ctactctgag 120

caagcatagg tcgttccagc tgtaccggcg cggtgatcgt cgttgtgcga gtgtaacatt 180

gtgcgatacc cagcagccta tcggaggaca gcgagtgcct cgagagctgg agacgaggag 240

tcgggtgaag cgggcaaggc tggcctcgct ggatgctgag acgtcccaca gcatcgtgca 300

cgaaggagga ggggacgggc ggggacgaag cggtgttggt cgtcgggacc tcgtcgtccg 360

aaagttgggt cgtcgctccg tcgcgcggct cgcttctctc gtttccttct cttccacccg 420

ctcgctctgc ttcttgcttg aactggctca gcttggctcg ctaggaacga actactcgct 480

acactacccc aggtgcgcaa cggacttccc actctccagc tctcggacct cgacgagcga 540

aagacgaacc ccaacgacct ctcctctcgc ctgcctcgtc ttgctcagca cctaacgaca 600

cacgagcgac ccagcccgac tagactcgcg caaacctcgc aaactgaccc gcttgccatt 660

cgcctctcca gctccctctc cccgtcctcg tctccccact tcgctaccct ctcttcaaac 720

tcgtcgaata ccgcacagga tggttgcggc gcaggagttg ccgcttgcgc tgagcatcag 780

cttcgcgccc gagtcgtcga ccatctcgat gacgctgttc aaccagcccg agacgtcgaa 840

acccgccctc cccctcgagc tcaagtacaa gtacgacccc tcgacgccgt acgccccgat 900

ccacgagatc accgaggacc gtaaccagag gatcaagcag gtgcgcgaaa ggccgttcaa 960

gcgaagggcg agcgagaact gatgaatttc tgcgcggaca gcactactcc 1010

<210> 65

<211> 1003

<212> DNA

<213> Rhodosporidium toruloides

<400> 65

ctgtgatgct aggtgtcgat cgagggagga ggtggacgag gagaagccag tctgagcgaa 60

gttgacatcc gcctcatctc tccctctcgc tgcgctcgtc tcgctcttca cgtcctcagc 120

ctcacaacgt cgagtaccac cagcagcaag ctcagcaact ctgcacggcg ccgcctgttc 180

gcccgagtgt tcggagcggt gggaggaact cctcggcctt tcgcagctgg tcgtccacga 240

gtcgctggag gatgaaactt tcggtcgtgg tcaacagcgt ccttacaacg tcgcgtggca 300

agtatcaagc gaaaagagcg tggtgacgag gggtgagagc ggttgaaaga agcggagggt 360

cggagcgatt cgcggtgttg caacggcggc ggggaaagtt gcttgcgctc cgtcgtctgg 420

ctctcttgct tcctactact cgctagtacc cagtacaagc tactacaggc tatgcagact 480

cctactcgcc tgctacagct tgcgcactat gacttcgtcc ccctcctccg ctcgaccact 540

cgtcggactc gcctcacacg acggcgacaa cgcctggccg ccctcgctcc gactgggtac 600

agcagaggag gacccgctgg tggactttcg ggggtcgaga caccgcggca ctgtacttca 660

ctacgcccat cctctcgacg gtggctgtat gcggtgatgt cccctcgctc ctgggccgcc 720

tgctgtccct cggccgcagg acgcgtcctt gcgcccgttg gagcgtgtaa cttgctcgaa 780

tacgcgcatc tagcacacac gcactgctac tgagcttgca cgaggcgacc tgctcgctcg 840

ggcccccaac agcccttcac ccgcctcgtt cgacctcgac tttcctttct tccttccact 900

cctcactccg ctcacctcga gcaacctcaa acagactcgc ttcggcttct ccttccttct 960

atacccccca accaccgacg taccaggaaa cgcagcagca atg 1003

<210> 66

<211> 1170

<212> DNA

<213> Rhodosporidium toruloides

<400> 66

ctgtgatgct aggtgtcgat cgagggagga ggtggacgag gagaagccag tctgagcgaa 60

gttgacatcc gcctcatctc tccctctcgc tgcgctcgtc tcgctcttca cgtcctcagc 120

ctcacaacgt cgagtaccac cagcagcaag ctcagcaact ctgcacggcg ccgcctgttc 180

gcccgagtgt tcggagcggt gggaggaact cctcggcctt tcgcagctgg tcgtccacga 240

gtcgctggag gatgaaactt tcggtcgtgg tcaacagcgt ccttacaacg tcgcgtggca 300

agtatcaagc gaaaagagcg tggtgacgag gggtgagagc ggttgaaaga agcggagggt 360

cggagcgatt cgcggtgttg caacggcggc ggggaaagtt gcttgcgctc cgtcgtctgg 420

ctctcttgct tcctactact cgctagtacc cagtacaagc tactacaggc tatgcagact 480

cctactcgcc tgctacagct tgcgcactat gacttcgtcc ccctcctccg ctcgaccact 540

cgtcggactc gcctcacacg acggcgacaa cgcctggccg ccctcgctcc gactgggtac 600

agcagaggag gacccgctgg tggactttcg ggggtcgaga caccgcggca ctgtacttca 660

ctacgcccat cctctcgacg gtggctgtat gcggtgatgt cccctcgctc ctgggccgcc 720

tgctgtccct cggccgcagg acgcgtcctt gcgcccgttg gagcgtgtaa cttgctcgaa 780

tacgcgcatc tagcacacac gcactgctac tgagcttgca cgaggcgacc tgctcgctcg 840

ggcccccaac agcccttcac ccgcctcgtt cgacctcgac tttcctttct tccttccact 900

cctcactccg ctcacctcga gcaacctcaa acagactcgc ttcggcttct ccttccttct 960

atacccccca accaccgacg taccaggaaa cgcagcagca atgtcggcga aggtgcgtcg 1020

aatcgccttc ccgcgacctc gagacgacat tcctgacttt ctccctccct atccctcttc 1080

tgtcctctct gcctaatcct tgatgcctct accatcccac tcgacgactc acgaacccac 1140

ccgcagccca tccgcgagta cgacgccatg 1170

<210> 67

<211> 496

<212> DNA

<213> Rhodosporidium toruloides

<400> 67

ttcgacttgt cttcctccgc gactcgttct gttgctccgc aactcccgct cttagccgcg 60

ccgctatctc tgcgatactc agacgaaacg cttgagcttt ctgccagtcg acccgtgacg 120

attccgcccc cgcttggcgg ctacgcctct tccccgcttc tcctcgtcct ttccgagggt 180

tgttgctgcc gtcaacgtcc agcctgcgct tcactggact gccgttggag ctcaaacgct 240

actggccctc tagtcaactc gcctagcgac tccagcgcag ccctcgctct gcttcagacc 300

cttccccact tcctcccctt tcttcgatct cgcaaacagc gacaacacct tccgccagcc 360

gcacgacaag cttgacttca ccctaaacct ctcatcttat cagcacaaga cccccgcgaa 420

actcgcatca gcgaccactc actccaaccg acgaacccct ccctccgacc ctccctcaca 480

tccctctttc gccatg 496

<210> 68

<211> 1120

<212> DNA

<213> Rhodosporidium toruloides

<400> 68

ttcgacttgt cttcctccgc gactcgttct gttgctccgc aactcccgct cttagccgcg 60

ccgctatctc tgcgatactc agacgaaacg cttgagcttt ctgccagtcg acccgtgacg 120

attccgcccc cgcttggcgg ctacgcctct tccccgcttc tcctcgtcct ttccgagggt 180

tgttgctgcc gtcaacgtcc agcctgcgct tcactggact gccgttggag ctcaaacgct 240

actggccctc tagtcaactc gcctagcgac tccagcgcag ccctcgctct gcttcagacc 300

cttccccact tcctcccctt tcttcgatct cgcaaacagc gacaacacct tccgccagcc 360

gcacgacaag cttgacttca ccctaaacct ctcatcttat cagcacaaga cccccgcgaa 420

actcgcatca gcgaccactc actccaaccg acgaacccct ccctccgacc ctccctcaca 480

tccctctttc gccatgtccg cgacaaagca gcacaagctc ctcatcgcca accgcggcga 540

gatcgctttg cgatgcatgc gttcagctgc cgcactcaag atcccgaccg tcgccatcta 600

catggaggca gacgcatccg ctcctcacgt cttcaaagcc gatgaagcgg ctctcgttcc 660

cgcctacatc gaccaagatg ccgtcctcaa cgtctgccgc gagaagggcg tcacgatgat 720

tcacccgggc tacggcttcc tgagcgagaa cgaggcgttc gcggccaaag tcgagaaagc 780

cgggatcatc tggctcggac cgacgccgtc gcaaatcgag gcgatgggtc tcaagcacga 840

agcgcgtgct cgtgcgatca aggcggacgt ccctgtcctt ccgggctcgg aactcgtcga 900

gacgctcgac ttggcgctcg agcaggcgag caaggtcggc tacccgatcc tcctgaaggc 960

gactgcgggt ggtggaggga tgggaatgag catctgcggg agcgagggcg agctcaagaa 1020

ggcgttccag ggcacgaccg acctcagcaa ggtgcgtctt cgcttccttt tgttcaacta 1080

tctcaagctc acgctctctt ccgcgcagaa cctcttctcc 1120

<210> 69

<211> 1006

<212> DNA

<213> Rhodosporidium toruloides

<400> 69

ctctagccta cgaccgcctc atcctgcgcc gcctgtcctg cagtggcgta ttgcttttcg 60

caccagctac gatctccgct ggacttcccg ggctactcct cctgggaatg ctgcgagctg 120

ttgggtgacc gagtcgggcg caaaggaggt cggggggaga atgggcggcc cgtctcgctc 180

tctcacgcct cagaacgccc agctgaagct ttgcccggac gtatgactac ttcagcgagt 240

agcccagctt ttcagcaggc aaaggatgtg tgtagtgagg atcggggtgt cgacctcccc 300

ttctcctccc cctcgtcacc tctctcgctc gtcacaccac cagaatgggt ctttcaatct 360

ctcgcctgtg tcagttggtt ctctgagctc tgggcgcctt gttccagccc acctggaggc 420

ttgggggacg agattggcgc cgtcaaagcc aggagtgttg gcgcaccgtc ccccgtctcg 480

cgcacgcctc tgggacggcc gctcaggatc tcgtactgac tactgaactc ctgcatgtac 540

gcctgaacca tccacgcctc tccccgccac cgccatcgct tgctgttgac cgtctccccc 600

tccaacacgc gtcgctacgt ctggctcgac ttacctgatt gcgctcactc gtcgcgcgaa 660

tggacgactg tgcactcgct tgattgccta cacccgttgt ggctgtcgac attccaggtg 720

aaggggagga ggaaggggaa ggttcgaaga agaccttgca atggacggcg gtctgctccg 780

tccacagggc gttgagtctc cgtcgttccg gagcacaagc acggcgtgcg cacgttctca 840

gcgagaagga cagcaagcgt ttgcgagtga aagggggacg ttcgagttgg ccggcctgag 900

ggacttcgcc gagagcgaca ccgccttcgc cgtctcacgc tcgtcgctct ctcgctctcg 960

cgctttctga ggcttgtact gctgcagaga acgactcgct accatg 1006

<210> 70

<211> 296

<212> DNA

<213> Rhodosporidium toruloides

<400> 70

gtcgcgcctt gtccgcttcc ccatcctcgt cctgctcttg ctctcttccc taccacactc 60

tcccgcttgc gggctctctt tctcgcttgg cgctcctgct accgctactc tagactctcc 120

tagtctccct gcacaaccat ccctatcccc tccgcctctc tcgcacaccc cccacagctt 180

cgttccccaa cttcacttcc gatgccgtgc gtcgcctccc tttcgcctgg cgggcccgcg 240

cctgcttccg aggacaacta ctgattgtgg gatcatgcga cgacaggttc tctggc 296

<210> 71

<211> 1090

<212> DNA

<213> Rhodosporidium toruloides

<400> 71

tgctcaagcg agccgataca gtcctcgaat ccggcctctc agcaatcgtc gcacaagtcg 60

tctccgccgc tttgtccgac aagtcaaagc aggactcgcc cctctcggca gcgatggtgc 120

gaacgctcgt gcttggaacg gacccgagag ggtacgcggc ggcgtgtagg gcgcttgcgg 180

gtgcgaagga cccggattac tcgagcatca aggccgagac gttgggtgcg ttcgcttgtt 240

ctccttcctc tgcttttctc ccagcaactg acgcaagcgt ctgcaacaca gtcgtcgcag 300

gcgagtttga ctacctctcg aacaaggaga cgaccgacgc gctggtcaac gacatcccgg 360

gcgcggagaa ggtccagatg gacagtgtcg gccactggca cgccgtcgag gaccccgttg 420

gactcgccaa gatcctcgat gggttcttct tgcaggggaa atgaggttgg gaagggggga 480

tagactgggg agaacggcag gtgcgtacgc agcggacgtc ggtcgggagg actttttcgg 540

ggaggatatt cgctgactga ctccgacgtc gctttcctcc ttgcagtatc ttcagaaggg 600

atgggaggag gcgaactgca agggtaatga acgagacaac gccgagggag gaagcgccgg 660

aactctcggg ggcgaagaag gagtggtgtc ttcgccagcg aacagcttcc ggggtgggtt 720

ggacagcgcc agtagaattc cagcgtcgca acagagctct agtcgaccgc gatcacccac 780

aaggacgaga gcgggtcgcg ccttgtccgc ttccccatcc tcgtcctgct cttgctctct 840

tccctaccac actctcccgc ttgcgggctc tctttctcgc ttggcgctcc tgctaccgct 900

actctagact ctcctagtct ccctgcacaa ccatccctat cccctccgcc tctctcgcac 960

accccccaca gcttcgttcc ccaacttcac ttccgatgcc gtgcgtcgcc tccctttcgc 1020

ctggcgggcc cgcgcctgct tccgaggaca actactgatt gtgggatcat gcgacgacag 1080

gttctctggc 1090

<210> 72

<211> 14

<212> DNA

<213> Rhodosporidium toruloides

<400> 72

ggcgggcccg cgcc 14

<210> 73

<211> 4

<212> PRT

<213> Rhodosporidium toruloides

<400> 73

Met Pro Phe Ser

1

<210> 74

<211> 295

<212> DNA

<213> Rhodosporidium toruloides

<400> 74

cgcgccttgt ccgcttcccc atcctcgtcc tgctcttgct ctcttcccta ccacactctc 60

ccgcttgcgg gctctctttc tcgcttggcg ctcctgctac cgctactcta gactctccta 120

gtctccctgc acaaccatcc ctatcccctc cgcctctctc gcacaccccc cacagcttcg 180

ttccccaact tcacttccga tcccgtgcgt cgcctccctt tcgcctggcg ggcccgcgcc 240

tgcttccgag gacaactact gattgtggga tcatgcgacg acaggttctc catgg 295

<210> 75

<211> 518

<212> DNA

<213> Rhodosporidium toruloides

<400> 75

cacgcctctg tgactcggta cggagagaga gagcgttggg ttgggttggg gattgtggcg 60

agcgaagggc gacccagcag ccagggagag ggagttggtc tggatgcaaa ccatgcgcat 120

ctcctctcgc agttgaatcg tttttcccgc tctgccctcg ctctctcttc cttctgctct 180

ttactcgctc acgaacaaca acgagccaca cagcgtgagc acacaccgct gcactcactc 240

gctgtcacgg accgcagctc acccttatcg tcactccctc tcccaccgca cagcctcact 300

ccctctctcg ctctccctca caagcacaac acacggcaca ctcgcacgca cactcgcacg 360

caatcgccac cgtcaacgag aagcagcccg ccaccgacgc gcccctcgcg cacgagaccg 420

ccatccaccg cgtgcgtccc catccctccc actgtcttcc tcgtgaaacc cgctcacccg 480

ttcgcaagca cacacgcagg tgtcggacta ccccatgg 518

<210> 76

<211> 1014

<212> DNA

<213> Rhodosporidium toruloides

<400> 76

gaactcgact cattacggga ggcgccgaca agacgatcaa ggttcgtcca ggacagccct 60

tctctgccgt cgagtttcgt tcccgctgac accctgcctt gtgcgcagat ctactctgag 120

caagcatagg tcgttccagc tgtaccggcg cggtgatcgt cgttgtgcga gtgtaacatt 180

gtgcgatacc cagcagccta tcggaggaca gcgagtgcct cgagagctgg agacgaggag 240

tcgggtgaag cgggcaaggc tggcctcgct ggatgctgag acgtcccaca gcatcgtgca 300

cgaaggagga ggggacgggc ggggacgaag cggtgttggt cgtcgggacc tcgtcgtccg 360

aaagttgggt cgtcgctccg tcgcgcggct cgcttctctc gtttccttct cttccacccg 420

ctcgctctgc ttcttgcttg aactggctca gcttggctcg ctaggaacga actactcgct 480

acactacccc aggtgcgcaa cggacttccc actctccagc tctcggacct cgacgagcga 540

aagacgaacc ccaacgacct ctcctctcgc ctgcctcgtc ttgctcagca cctaacgaca 600

cacgagcgac ccagcccgac tagactcgcg caaacctcgc aaactgaccc gcttgccatt 660

cgcctctcca gctccctctc cccgtcctcg tctccccact tcgctaccct ctcttcaaac 720

tcgtcgaata ccgcacagga tcgttgcggc gcaggagttg ccgcttgcgc tgagcatcag 780

cttcgcgccc gagtcgtcga ccatctcgat gacgctgttc aaccagcccg agacgtcgaa 840

acccgccctc cccctcgagc tcaagtacaa gtacgacccc tcgacgccgt acgccccgat 900

ccacgagatc accgaggacc gtaaccagag gatcaagcag gtgcgcgaaa ggccgttcaa 960

gcgaagggcg agcgagaact gatgaatttc tgcgcggaca gcactactcc atgg 1014

<210> 77

<211> 297

<212> DNA

<213> Rhodosporidium toruloides

<400> 77

gtcgcgcctt gtccgcttcc ccatcctcgt cctgctcttg ctctcttccc taccacactc 60

tcccgcttgc gggctctctt tctcgcttgg cgctcctgct accgctactc tagactctcc 120

tagtctccct gcacaaccat ccctatcccc tccgcctctc tcgcacaccc cccacagctt 180

cgttccccaa cttcacttcc gatcccgtgc gtcgcctccc tttcgcctgg cgggcccgcg 240

cctgcttccg aggacaacta ctgattgtgg gatcatgcga cgacaggttc tccatgg 297

<210> 78

<211> 44

<212> PRT

<213> Rhodosporidium toruloides

<400> 78

Met Ala Thr Val Asn Glu Lys Gln Pro Ala Thr Asp Ala Pro Leu Ala

1 5 10 15

His Glu Thr Ala Ile His Arg Val Ser Asp Tyr Pro Val Ile Lys Asp

20 25 30

Thr Leu Ser Ser Leu Asp Ser Tyr Ala His Ser His

35 40

<210> 79

<211> 1171

<212> DNA

<213> Rhodosporidium toruloides

<400> 79

ctgtgatgct aggtgtcgat cgagggagga ggtggacgag gagaagccag tctgagcgaa 60

gttgacatcc gcctcatctc tccctctcgc tgcgctcgtc tcgctcttca cgtcctcagc 120

ctcacaacgt cgagtaccac cagcagcaag ctcagcaact ctgcacggcg ccgcctgttc 180

gcccgagtgt tcggagcggt gggaggaact cctcggcctt tcgcagctgg tcgtccacga 240

gtcgctggag gatgaaactt tcggtcgtgg tcaacagcgt ccttacaacg tcgcgtggca 300

agtatcaagc gaaaagagcg tggtgacgag gggtgagagc ggttgaaaga agcggagggt 360

cggagcgatt cgcggtgttg caacggcggc ggggaaagtt gcttgcgctc cgtcgtctgg 420

ctctcttgct tcctactact cgctagtacc cagtacaagc tactacaggc tatgcagact 480

cctactcgcc tgctacagct tgcgcactat gacttcgtcc ccctcctccg ctcgaccact 540

cgtcggactc gcctcacacg acggcgacaa cgcctggccg ccctcgctcc gactgggtac 600

agcagaggag gacccgctgg tggactttcg ggggtcgaga caccgcggca ctgtacttca 660

ctacgcccat cctctcgacg gtggctgtat gcggtgatgt cccctcgctc ctgggccgcc 720

tgctgtccct cggccgcagg acgcgtcctt gcgcccgttg gagcgtgtaa cttgctcgaa 780

tacgcgcatc tagcacacac gcactgctac tgagcttgca cgaggcgacc tgctcgctcg 840

ggcccccaac agcccttcac ccgcctcgtt cgacctcgac tttcctttct tccttccact 900

cctcactccg ctcacctcga gcaacctcaa acagactcgc ttcggcttct ccttccttct 960

atacccccca accaccgacg taccaggaaa cgcagcagca atctcggcga aggtgcgtcg 1020

aatcgccttc ccgcgacctc gagacgacat tcctgacttt ctccctccct atccctcttc 1080

tgtcctctct gcctaatcct tgatgcctct accatcccac tcgacgactc acgaacccac 1140

ccgcagccca tccgcgagta cgacgccatg g 1171

<210> 80

<211> 1091

<212> DNA

<213> Rhodosporidium toruloides

<400> 80

tgctcaagcg agccgataca gtcctcgaat ccggcctctc agcaatcgtc gcacaagtcg 60

tctccgccgc tttgtccgac aagtcaaagc aggactcgcc cctctcggca gcgatggtgc 120

gaacgctcgt gcttggaacg gacccgagag ggtacgcggc ggcgtgtagg gcgcttgcgg 180

gtgcgaagga cccggattac tcgagcatca aggccgagac gttgggtgcg ttcgcttgtt 240

ctccttcctc tgcttttctc ccagcaactg acgcaagcgt ctgcaacaca gtcgtcgcag 300

gcgagtttga ctacctctcg aacaaggaga cgaccgacgc gctggtcaac gacatcccgg 360

gcgcggagaa ggtccagatg gacagtgtcg gccactggca cgccgtcgag gaccccgttg 420

gactcgccaa gatcctcgat gggttcttct tgcaggggaa atgaggttgg gaagggggga 480

tagactgggg agaacggcag gtgcgtacgc agcggacgtc ggtcgggagg actttttcgg 540

ggaggatatt cgctgactga ctccgacgtc gctttcctcc ttgcagtatc ttcagaaggg 600

atgggaggag gcgaactgca agggtaatga acgagacaac gccgagggag gaagcgccgg 660

aactctcggg ggcgaagaag gagtggtgtc ttcgccagcg aacagcttcc ggggtgggtt 720

ggacagcgcc agtagaattc cagcgtcgca acagagctct agtcgaccgc gatcacccac 780

aaggacgaga gcgggtcgcg ccttgtccgc ttccccatcc tcgtcctgct cttgctctct 840

tccctaccac actctcccgc ttgcgggctc tctttctcgc ttggcgctcc tgctaccgct 900

actctagact ctcctagtct ccctgcacaa ccatccctat cccctccgcc tctctcgcac 960

accccccaca gcttcgttcc ccaacttcac ttccgatccc gtgcgtcgcc tccctttcgc 1020

ctggcgggcc cgcgcctgct tccgaggaca actactgatt gtgggatcat gcgacgacag 1080

gttctccatg g 1091

<210> 81

<211> 297

<212> DNA

<213> Rhodosporidium toruloides

<400> 81

gtcgcgcctt gtccgcttcc ccatcctcgt cctgctcttg ctctcttccc taccacactc 60

tcccgcttgc gggctctctt tctcgcttgg cgctcctgct accgctactc tagactctcc 120

tagtctccct gcacaaccat ccctatcccc tccgcctctc tcgcacaccc cccacagctt 180

cgttccccaa cttcacttcc gatgccgtgc gtcgcctccc tttcgcctgg cgggcccgcg 240

cctgcttccg aggacaacta ctgattgtgg gatcatgcga cgacaggttc tccatgg 297

<210> 82

<211> 297

<212> DNA

<213> Rhodosporidium toruloides

<400> 82

gtcgggcctt gtctccttcc ccatcctcga cctcctcctg ctctcttccc taccacactc 60

tcccgcttgc gggctttctt tctcgcttgg cgctcttgct accgctactc tagactctcc 120

tagtctccct gcacaacaac cctgctccct cccgcctctc tcgcacaccc cccacagctt 180

cgttccccaa cttcacttcc gatgccgtgc gtcgcctccc tttcgcctag cgggcctgcg 240

cctgcttctg agaacgactg ctgactgtgg aatgatttgc cgacagattc tccatgg 297

<210> 83

<211> 297

<212> DNA

<213> Rhodosporidium toruloides

<400> 83

gtcgggcctt gtctccttcc ccatcctcga cctcctcctg ctctcttccc taccacactc 60

tcccgcttgc gggctttctt tctcgcttgg cgctcttgct accgctactc tagactctcc 120

tagtctccct gcacaacaac cctgctccct cccgcctctc tcgcacaccc cccacagctt 180

cgttccccaa cttcacttcc gatcccgtgc gtcgcctccc tttcgcctag cgggcctgcg 240

cctgcttctg agaacgactg ctgactgtgg aatgatttgc cgacagattc tccatgg 297

<210> 84

<211> 409

<212> DNA

<213> Rhodosporidium toruloides

<400> 84

gttggggaaa gtggcgagcg agcgaagggc gacttggaag tgaagagagt tgggagctgg 60

tccggatgca aaccatgcgc atctcgttcg tcgtgcaatc gtttttcccg ccttctcgct 120

cttctcgctc tctctcttgc tcttcactcg cttgtaagca aacaacgagc acagcgacac 180

agcgtgagca cactcgctcg cactcgcact gactcgggca gctcaccctt atcgtcatcc 240

cacccgcaca gcctcactct cctctctctt tcacacacgc actcaaaaca cgcacgcacg 300

caagatggcc accgtcaacg agaagcagcc cgccaccgac gcgcccctcg cgcacgagac 360

cgccatccac cgcgtgcgtc cccatctctt cctcgtgaaa acccgctca 409

<210> 85

<211> 452

<212> DNA

<213> Rhodosporidium toruloides

<400> 85

gttggggaaa gtggcgagcg agcgaagggc gacttggaag tgaagagagt tgggagctgg 60

tccggatgca aaccatgcgc atctcgttcg tcgtgcaatc gtttttcccg ccttctcgct 120

cttctcgctc tctctcttgc tcttcactcg cttgtaagca aacaacgagc acagcgacac 180

agcgtgagca cactcgctcg cactcgcact gactcgggca gctcaccctt atcgtcatcc 240

cacccgcaca gcctcactct cctctctctt tcacacacgc actcaaaaca cgcacgcacg 300

caagatcgcc accgtcaacg agaagcagcc cgccaccgac gcgcccctcg cgcacgagac 360

cgccatccac cgcgtgcgtc cccatctctt cctcgtgaaa acccgctcaa caactcacac 420

acgtgcaaca cagggctcgg actaccccat gg 452

<210> 86

<211> 988

<212> DNA

<213> Rhodosporidium toruloides

<400> 86

actcggctca tcacgggagg cgccgacaag acgaccaagg tgcgtccaag acggactcct 60

tctccgatcc cgctgacatt ctgcctcgcg cacgcagatc tattctgagc aagcatgagg 120

ccgttccacc tgaaccggcg aggtggtccc cgtcgtgaga gtgtaatatc gttgcgatac 180

ccatgcagcc tcggaggaca tcgagcgcga cgagagtggg agaacgagga gccggttgaa 240

gcggacacgg ttggcctcgc tggatgctgc aagtcgcaca gcactgtgct caaaagacga 300

ggagacgagc gagacggagc ggtgttggac gagggacctc gtcgtccgaa agttgggtcg 360

ctcggctcgc ttccgcttct tcctcccgct cactctgctt cttgctcgac tggctctcgc 420

ttggtctcgc taggaacgaa actacctcgc taaactaccc aggtgcgcag cgactttccc 480

gatcgcgact ctccgacctc gacgagcgaa gacgaacccc aacgactctc ctctcgcttc 540

cttcttcccg ctcagcgccg cagcgacgtg cgcacgacca atccagtccg agtggactcg 600

agcgaacctc gcactgaccc gcttgccgtt cgcctctcca gctttctcct cccgctcctc 660

ctctccccac ttcgctacca ctcttcaaac gactcgtcaa acaccgcaca ggatcgtcgc 720

ggcgcaggac ttgccgctcg cgctgagcat cagcttcgcg cccgagtcgt cgaccatctc 780

gatgacgctg ttcaaccagc ccgaggcgtc gaaacccgcc ctccccctcg agctcaagta 840

caagtacgac ccctcgacgc cgtacgcccc gatccacgag atcaccgagg accgtaatca 900

gaggatcaag caggtgcgcg cgcggccgtt tgagcgagag acgggcgaga aactgatcaa 960

tttccggttc gacagcacta ctccatgg 988

<210> 87

<211> 294

<212> DNA

<213> Rhodosporidium toruloides

<400> 87

cgcgccttgt ccgcttcccc atcctcgtcc tgctcttgct ctcttcccta ccacactctc 60

ccgcttgcgg gctctctttc tcgcttggcg ctcctgctac cgctactcta gactctccta 120

gtctccctgc acaaccatcc ctatcccctc cgcctctctc gcacaccccc cacagcttcg 180

ttccccaact tcacttccga tcccgtgcgt cgcctccctt tcgcctggcg ggcccgcgcc 240

tgcttccgag gacaactact gattgtggga tcatgcgacg acaggttctc catg 294

<210> 88

<211> 296

<212> DNA

<213> Rhodosporidium toruloides

<400> 88

gtcgcgcctt gtccgcttcc ccatcctcgt cctgctcttg ctctcttccc taccacactc 60

tcccgcttgc gggctctctt tctcgcttgg cgctcctgct accgctactc tagactctcc 120

tagtctccct gcacaaccat ccctatcccc tccgcctctc tcgcacaccc cccacagctt 180

cgttccccaa cttcacttcc gatcccgtgc gtcgcctccc tttcgcctgg cgggcccgcg 240

cctgcttccg aggacaacta ctgattgtgg gatcatgcga cgacaggttc tccatg 296

<210> 89

<211> 1090

<212> DNA

<213> Rhodosporidium toruloides

<400> 89

tgctcaagcg agccgataca gtcctcgaat ccggcctctc agcaatcgtc gcacaagtcg 60

tctccgccgc tttgtccgac aagtcaaagc aggactcgcc cctctcggca gcgatggtgc 120

gaacgctcgt gcttggaacg gacccgagag ggtacgcggc ggcgtgtagg gcgcttgcgg 180

gtgcgaagga cccggattac tcgagcatca aggccgagac gttgggtgcg ttcgcttgtt 240

ctccttcctc tgcttttctc ccagcaactg acgcaagcgt ctgcaacaca gtcgtcgcag 300

gcgagtttga ctacctctcg aacaaggaga cgaccgacgc gctggtcaac gacatcccgg 360

gcgcggagaa ggtccagatg gacagtgtcg gccactggca cgccgtcgag gaccccgttg 420

gactcgccaa gatcctcgat gggttcttct tgcaggggaa atgaggttgg gaagggggga 480

tagactgggg agaacggcag gtgcgtacgc agcggacgtc ggtcgggagg actttttcgg 540

ggaggatatt cgctgactga ctccgacgtc gctttcctcc ttgcagtatc ttcagaaggg 600

atgggaggag gcgaactgca agggtaatga acgagacaac gccgagggag gaagcgccgg 660

aactctcggg ggcgaagaag gagtggtgtc ttcgccagcg aacagcttcc ggggtgggtt 720

ggacagcgcc agtagaattc cagcgtcgca acagagctct agtcgaccgc gatcacccac 780

aaggacgaga gcgggtcgcg ccttgtccgc ttccccatcc tcgtcctgct cttgctctct 840

tccctaccac actctcccgc ttgcgggctc tctttctcgc ttggcgctcc tgctaccgct 900

actctagact ctcctagtct ccctgcacaa ccatccctat cccctccgcc tctctcgcac 960

accccccaca gcttcgttcc ccaacttcac ttccgatccc gtgcgtcgcc tccctttcgc 1020

ctggcgggcc cgcgcctgct tccgaggaca actactgatt gtgggatcat gcgacgacag 1080

gttctccatg 1090

<210> 90

<211> 296

<212> DNA

<213> Rhodosporidium toruloides

<400> 90

gtcgcgcctt gtccgcttcc ccatcctcgt cctgctcttg ctctcttccc taccacactc 60

tcccgcttgc gggctctctt tctcgcttgg cgctcctgct accgctactc tagactctcc 120

tagtctccct gcacaaccat ccctatcccc tccgcctctc tcgcacaccc cccacagctt 180

cgttccccaa cttcacttcc gatgccgtgc gtcgcctccc tttcgcctgg cgggcccgcg 240

cctgcttccg aggacaacta ctgattgtgg gatcatgcga cgacaggttc tccatg 296

<210> 91

<211> 296

<212> DNA

<213> Rhodosporidium toruloides

<400> 91

gtcgggcctt gtctccttcc ccatcctcga cctcctcctg ctctcttccc taccacactc 60

tcccgcttgc gggctttctt tctcgcttgg cgctcttgct accgctactc tagactctcc 120

tagtctccct gcacaacaac cctgctccct cccgcctctc tcgcacaccc cccacagctt 180

cgttccccaa cttcacttcc gatgccgtgc gtcgcctccc tttcgcctag cgggcctgcg 240

cctgcttctg agaacgactg ctgactgtgg aatgatttgc cgacagattc tccatg 296

<210> 92

<211> 296

<212> DNA

<213> Rhodosporidium toruloides

<400> 92

gtcgggcctt gtctccttcc ccatcctcga cctcctcctg ctctcttccc taccacactc 60

tcccgcttgc gggctttctt tctcgcttgg cgctcttgct accgctactc tagactctcc 120

tagtctccct gcacaacaac cctgctccct cccgcctctc tcgcacaccc cccacagctt 180

cgttccccaa cttcacttcc gatcccgtgc gtcgcctccc tttcgcctag cgggcctgcg 240

cctgcttctg agaacgactg ctgactgtgg aatgatttgc cgacagattc tccatg 296

<210> 93

<211> 517

<212> DNA

<213> Rhodosporidium toruloides

<400> 93

cacgcctctg tgactcggta cggagagaga gagcgttggg ttgggttggg gattgtggcg 60

agcgaagggc gacccagcag ccagggagag ggagttggtc tggatgcaaa ccatgcgcat 120

ctcctctcgc agttgaatcg tttttcccgc tctgccctcg ctctctcttc cttctgctct 180

ttactcgctc acgaacaaca acgagccaca cagcgtgagc acacaccgct gcactcactc 240

gctgtcacgg accgcagctc acccttatcg tcactccctc tcccaccgca cagcctcact 300

ccctctctcg ctctccctca caagcacaac acacggcaca ctcgcacgca cactcgcacg 360

caatcgccac cgtcaacgag aagcagcccg ccaccgacgc gcccctcgcg cacgagaccg 420

ccatccaccg cgtgcgtccc catccctccc actgtcttcc tcgtgaaacc cgctcacccg 480

ttcgcaagca cacacgcagg tgtcggacta ccccatg 517

<210> 94

<211> 451

<212> DNA

<213> Rhodosporidium toruloides

<400> 94

gttggggaaa gtggcgagcg agcgaagggc gacttggaag tgaagagagt tgggagctgg 60

tccggatgca aaccatgcgc atctcgttcg tcgtgcaatc gtttttcccg ccttctcgct 120

cttctcgctc tctctcttgc tcttcactcg cttgtaagca aacaacgagc acagcgacac 180

agcgtgagca cactcgctcg cactcgcact gactcgggca gctcaccctt atcgtcatcc 240

cacccgcaca gcctcactct cctctctctt tcacacacgc actcaaaaca cgcacgcacg 300

caagatcgcc accgtcaacg agaagcagcc cgccaccgac gcgcccctcg cgcacgagac 360

cgccatccac cgcgtgcgtc cccatctctt cctcgtgaaa acccgctcaa caactcacac 420

acgtgcaaca cagggctcgg actaccccat g 451

<210> 95

<211> 1013

<212> DNA

<213> Rhodosporidium toruloides

<400> 95

gaactcgact cattacggga ggcgccgaca agacgatcaa ggttcgtcca ggacagccct 60

tctctgccgt cgagtttcgt tcccgctgac accctgcctt gtgcgcagat ctactctgag 120

caagcatagg tcgttccagc tgtaccggcg cggtgatcgt cgttgtgcga gtgtaacatt 180

gtgcgatacc cagcagccta tcggaggaca gcgagtgcct cgagagctgg agacgaggag 240

tcgggtgaag cgggcaaggc tggcctcgct ggatgctgag acgtcccaca gcatcgtgca 300

cgaaggagga ggggacgggc ggggacgaag cggtgttggt cgtcgggacc tcgtcgtccg 360

aaagttgggt cgtcgctccg tcgcgcggct cgcttctctc gtttccttct cttccacccg 420

ctcgctctgc ttcttgcttg aactggctca gcttggctcg ctaggaacga actactcgct 480

acactacccc aggtgcgcaa cggacttccc actctccagc tctcggacct cgacgagcga 540

aagacgaacc ccaacgacct ctcctctcgc ctgcctcgtc ttgctcagca cctaacgaca 600

cacgagcgac ccagcccgac tagactcgcg caaacctcgc aaactgaccc gcttgccatt 660

cgcctctcca gctccctctc cccgtcctcg tctccccact tcgctaccct ctcttcaaac 720

tcgtcgaata ccgcacagga tcgttgcggc gcaggagttg ccgcttgcgc tgagcatcag 780

cttcgcgccc gagtcgtcga ccatctcgat gacgctgttc aaccagcccg agacgtcgaa 840

acccgccctc cccctcgagc tcaagtacaa gtacgacccc tcgacgccgt acgccccgat 900

ccacgagatc accgaggacc gtaaccagag gatcaagcag gtgcgcgaaa ggccgttcaa 960

gcgaagggcg agcgagaact gatgaatttc tgcgcggaca gcactactcc atg 1013

<210> 96

<211> 987

<212> DNA

<213> Rhodosporidium toruloides

<400> 96

actcggctca tcacgggagg cgccgacaag acgaccaagg tgcgtccaag acggactcct 60

tctccgatcc cgctgacatt ctgcctcgcg cacgcagatc tattctgagc aagcatgagg 120

ccgttccacc tgaaccggcg aggtggtccc cgtcgtgaga gtgtaatatc gttgcgatac 180

ccatgcagcc tcggaggaca tcgagcgcga cgagagtggg agaacgagga gccggttgaa 240

gcggacacgg ttggcctcgc tggatgctgc aagtcgcaca gcactgtgct caaaagacga 300

ggagacgagc gagacggagc ggtgttggac gagggacctc gtcgtccgaa agttgggtcg 360

ctcggctcgc ttccgcttct tcctcccgct cactctgctt cttgctcgac tggctctcgc 420

ttggtctcgc taggaacgaa actacctcgc taaactaccc aggtgcgcag cgactttccc 480

gatcgcgact ctccgacctc gacgagcgaa gacgaacccc aacgactctc ctctcgcttc 540

cttcttcccg ctcagcgccg cagcgacgtg cgcacgacca atccagtccg agtggactcg 600

agcgaacctc gcactgaccc gcttgccgtt cgcctctcca gctttctcct cccgctcctc 660

ctctccccac ttcgctacca ctcttcaaac gactcgtcaa acaccgcaca ggatcgtcgc 720

ggcgcaggac ttgccgctcg cgctgagcat cagcttcgcg cccgagtcgt cgaccatctc 780

gatgacgctg ttcaaccagc ccgaggcgtc gaaacccgcc ctccccctcg agctcaagta 840

caagtacgac ccctcgacgc cgtacgcccc gatccacgag atcaccgagg accgtaatca 900

gaggatcaag caggtgcgcg cgcggccgtt tgagcgagag acgggcgaga aactgatcaa 960

tttccggttc gacagcacta ctccatg 987

<210> 97

<211> 1170

<212> DNA

<213> Rhodosporidium toruloides

<400> 97

ctgtgatgct aggtgtcgat cgagggagga ggtggacgag gagaagccag tctgagcgaa 60

gttgacatcc gcctcatctc tccctctcgc tgcgctcgtc tcgctcttca cgtcctcagc 120

ctcacaacgt cgagtaccac cagcagcaag ctcagcaact ctgcacggcg ccgcctgttc 180

gcccgagtgt tcggagcggt gggaggaact cctcggcctt tcgcagctgg tcgtccacga 240

gtcgctggag gatgaaactt tcggtcgtgg tcaacagcgt ccttacaacg tcgcgtggca 300

agtatcaagc gaaaagagcg tggtgacgag gggtgagagc ggttgaaaga agcggagggt 360

cggagcgatt cgcggtgttg caacggcggc ggggaaagtt gcttgcgctc cgtcgtctgg 420

ctctcttgct tcctactact cgctagtacc cagtacaagc tactacaggc tatgcagact 480

cctactcgcc tgctacagct tgcgcactat gacttcgtcc ccctcctccg ctcgaccact 540

cgtcggactc gcctcacacg acggcgacaa cgcctggccg ccctcgctcc gactgggtac 600

agcagaggag gacccgctgg tggactttcg ggggtcgaga caccgcggca ctgtacttca 660

ctacgcccat cctctcgacg gtggctgtat gcggtgatgt cccctcgctc ctgggccgcc 720

tgctgtccct cggccgcagg acgcgtcctt gcgcccgttg gagcgtgtaa cttgctcgaa 780

tacgcgcatc tagcacacac gcactgctac tgagcttgca cgaggcgacc tgctcgctcg 840

ggcccccaac agcccttcac ccgcctcgtt cgacctcgac tttcctttct tccttccact 900

cctcactccg ctcacctcga gcaacctcaa acagactcgc ttcggcttct ccttccttct 960

atacccccca accaccgacg taccaggaaa cgcagcagca atctcggcga aggtgcgtcg 1020

aatcgccttc ccgcgacctc gagacgacat tcctgacttt ctccctccct atccctcttc 1080

tgtcctctct gcctaatcct tgatgcctct accatcccac tcgacgactc acgaacccac 1140

ccgcagccca tccgcgagta cgacgccatg 1170

<210> 98

<211> 29

<212> DNA

<213> Rhodosporidium toruloides

<400> 98

tttactagtg cacgcgaagc ggtagaagc 29

<210> 99

<211> 30

<212> DNA

<213> Rhodosporidium toruloides

<400> 99

tttccatgga tcccccccag tacacagtac 30

<210> 100

<211> 26

<212> DNA

<213> Rhodosporidium toruloides

<400> 100

tttccatgga gtcgacgtgg cctgcg 26

<210> 101

<211> 41

<212> DNA

<213> Rhodosporidium toruloides

<400> 101

gtgtactggg ggggatagat cggcaaggaa aagggacacg t 41

<210> 102

<211> 41

<212> DNA

<213> Rhodosporidium toruloides

<400> 102

acgtgtccct tttccttgcc gatctatccc ccccagtaca c 41

<210> 103

<211> 27

<212> DNA

<213> Rhodosporidium toruloides

<400> 103

tttactagtg gcaaacacag caacgac 27

<210> 104

<211> 27

<212> DNA

<213> Rhodosporidium toruloides

<400> 104

tttactagtc gttcttcgac gtccgag 27

<210> 105

<211> 25

<212> DNA

<213> Rhodosporidium toruloides

<400> 105

tttactagtg gctgggtgtg cggag 25

<210> 106

<211> 28

<212> DNA

<213> Rhodosporidium toruloides

<400> 106

tttactagtg cacctcgcgt caaccctc 28

<210> 107

<211> 1150

<212> DNA

<213> Rhodosporidium toruloides

<400> 107

gcacgcgaag cggtagaagc aatgaagcga ggcgagagcg agagaggcag ggcttcagcc 60

atgtccagct gatcggctgt aacgtcgcgc cgggccagtc tgttgaattt gttgcgtcgc 120

ctgagcgtaa tagaagtgca gtagtctact ccgcatgccg agaacgtcga agagcgcgaa 180

gtagggagtc gagggaagcg agggtggcaa acacagcaac gacaagcggt tccgcttcgc 240

tcaaaagctc gttgacgttg ttttgacgtt ttgaagacag tacaacagca gcaagaggcg 300

tgcgaagcgt tggtggcgag agcagcgaca aggagggagg aatgagggag tggtggcgag 360

ggctcgcaaa cgggcgtacg cctcgaatgg agacgtgcga gtcgttcttc gacgtccgag 420

ggatgccgag cgccgagacg gagcacgcaa cgagcgagag gagagcagcc gcgcaaggtg 480

attcgagtgg cgcaagcgga ggacgacgag gagacggacg agggaggagg agggatggcg 540

agcgagcatc ggacggcggg gcgcgagaga cggcgtgagg agccgggtgt ggagagtttg 600

aggaggcgcg ggatgcgaag tggctgggtg tgcggagtga gcggtggcaa agagcgcact 660

tagagtctag agcgaggcag tagtagtaga gctgtatgaa tgaatacaaa gtgtgaatac 720

aacagtttgt aatgcgattc tgagcttgga cgtgtgcgcg cgagagggcg acttgcaagc 780

cagcgcccgc tcgctcttct tccttctgca cctcgcgtca accctcgcat ctcacaccta 840

cactcgcatt caaagtgcgt acactctccc acgacacacg gggacggcgc acaccaccgc 900

gcgtcgcttg aacggcgtcg ccacttcgag ccgtcactga cttcgtcctc gtcctccctc 960

ctctactctc ttgtactgta ctgtgtactg ggggggatag atgggcaagg aaaagggaca 1020

cgtcaacgtc gtcgttatcg gtacgttcag cgtcgtcgag gcgagtctgg cgaggaggag 1080

gacgtcgagc tgacctcgcc ccgtcctccc gcgcaggcca cgtcgactcc ggcaagtcga 1140

ccaccaccgg 1150

<210> 108

<211> 13

<212> PRT

<213> Rhodosporidium toruloides

<400> 108

Met Gly Lys Glu Lys Gly His Val Asn Val Val Val Ile

1 5 10

<210> 109

<211> 12

<212> PRT

<213> Rhodosporidium toruloides

<400> 109

Gly His Val Asp Ser Gly Lys Ser Thr Thr Thr Gly

1 5 10

<210> 110

<211> 1000

<212> DNA

<213> Rhodosporidium toruloides

<400> 110

gcacgcgaag cggtagaagc aatgaagcga ggcgagagcg agagaggcag ggcttcagcc 60

atgtccagct gatcggctgt aacgtcgcgc cgggccagtc tgttgaattt gttgcgtcgc 120

ctgagcgtaa tagaagtgca gtagtctact ccgcatgccg agaacgtcga agagcgcgaa 180

gtagggagtc gagggaagcg agggtggcaa acacagcaac gacaagcggt tccgcttcgc 240

tcaaaagctc gttgacgttg ttttgacgtt ttgaagacag tacaacagca gcaagaggcg 300

tgcgaagcgt tggtggcgag agcagcgaca aggagggagg aatgagggag tggtggcgag 360

ggctcgcaaa cgggcgtacg cctcgaatgg agacgtgcga gtcgttcttc gacgtccgag 420

ggatgccgag cgccgagacg gagcacgcaa cgagcgagag gagagcagcc gcgcaaggtg 480

attcgagtgg cgcaagcgga ggacgacgag gagacggacg agggaggagg agggatggcg 540

agcgagcatc ggacggcggg gcgcgagaga cggcgtgagg agccgggtgt ggagagtttg 600

aggaggcgcg ggatgcgaag tggctgggtg tgcggagtga gcggtggcaa agagcgcact 660

tagagtctag agcgaggcag tagtagtaga gctgtatgaa tgaatacaaa gtgtgaatac 720

aacagtttgt aatgcgattc tgagcttgga cgtgtgcgcg cgagagggcg acttgcaagc 780

cagcgcccgc tcgctcttct tccttctgca cctcgcgtca accctcgcat ctcacaccta 840

cactcgcatt caaagtgcgt acactctccc acgacacacg gggacggcgc acaccaccgc 900

gcgtcgcttg aacggcgtcg ccacttcgag ccgtcactga cttcgtcctc gtcctccctc 960

ctctactctc ttgtactgta ctgtgtactg ggggggatag 1000

<210> 111

<211> 2142

<212> DNA

<213> Rhodosporidium toruloides

<400> 111

atgggcaagg aaaagggaca cgtcaacgtc gtcgttatcg gtacgttcag cgtcgtcgag 60

gcgagtctgg cgaggaggag gacgtcgagc tgacctcgcc ccgtcctccc gcgcaggcca 120

cgtcgactcc ggcaagtcga ccaccaccgg acacttgatc tacaagtgcg gcggtatcga 180

caagcgtacc atcgagaagt tgtgcgtcga aaatcgttct ctgcctccca gcccgctcgg 240

accccaagct gaccctcgca ctctcgtccc acagcgagaa ggaggccgct gagctcggca 300

agggtgagtc gtggtccagc tcgtcgaatt tttcgagcgc gcgagcactc tgcgccgtcg 360

cccgcctcgt ctcgaggtcc tgacggggtg acgtggagct cggtcgccag cgagcacctc 420

gactgacctc gctcgcctcg ctctcgtctg ccaggttcgt tcaagtacgc atgggtcctc 480

gacaagctca aggccgagcg cgagcgtggt atcaccatcg acatcgctct ctggaagttc 540

gagaccccca aggttcgttc gccgtctttc gtctcgcctc gcaactgagt gctaacgtgc 600

gcccgcacgc agtacatgat caccgtcatc gacgccccgg gtcaccgtga cttcatcaag 660

aacatgatca ccggtacctc gcaggccgac tgcgccatcc tcatcattgc cgccggcact 720

ggtgagttcg aggccggtat ctcgaaggac ggccagaccc gcgagcacgc cctcctcgcc 780

ttcaccctcg gtgtccgcca gctcatcgtt gccatcaaca agatggacac gaccaagtac 840

tcggaggccc gttacgagga gatcatcaag gagacgtcca actttatcaa gaaggtcggc 900

ttcaacccca agggcgtccc cttcgtcccc atctcgggat ggcacggcga caacatgatc 960

gaggcgacca ccaacatgcc ctggtacaag ggatggaaga aggagaccaa gtcgggcgag 1020

gtcaccggca agaccctcct cgacgccatc gacgccatcg agcccccctc gcgccccacc 1080

gacaagcccc tccgtcttcc cctccaggtg cgttcgctcg ttctcgcttg tttgcgaccc 1140

tcctcgctga cactcgtctt cgctcgcaca ggacgtctac aagatcggcg gtatcggcac 1200

agtgcccgtc ggccgtgtcg agactggcac gatcaaggcc ggcatggtcg tcaccttcgc 1260

cccgtcgaac gtcaccaccg aggtcaagtc ggtcgagatg caccacgagc agctcgaggc 1320

cggtctcccc ggagacaatg ttggcttcaa cgtcaagaac gtctcggtca aggacatccg 1380

ccgcggcaat gtctgcggtg actcgaagaa cgaccctccc aaggaggctg cgtcgttcaa 1440

ggcccaggtc atcgtcatga accaccccgg ccagatcggc aacggctacg cgcccgtcct 1500

cgactgccac acggcccaca ttgcgtgcaa gttcgacacg ctcctcgaga agatcgaccg 1560

ccgctcgggc aagtcggtcg aggacctccc caagttcatc aagtcgggtg acgccgccat 1620

cgtcaagatg gttccctcga agccgatgtg cgtcgagtcg ttcgccgagt accctcccct 1680

cggtcgtttc gccgtccgtg acatgcgcca gaccgttgcc gtcggtgtca tcaaggtgcg 1740

tcccgcgttt ctctcgcatg ttctcgacag ctcaacgata ctgacgctgt tttccacgat 1800

tcaggcagtc gagaagactg acggcaaggg cggcaagggt gcgtcttttc tcctctctct 1860

cgtgcggagt cctctcgtct tggtgaccga gagctgacct cttccgtcct tcccttcctc 1920

ttccctcgtg cgctctctcc ctctcctacg ctcactcgtc gtgctcctct cgctgtcgcc 1980

tcactcgccc ccttcgccgc cgccccctcg tacctcgacg accctcctcg accacagtca 2040

ccaaggtccg tcctccttcc ttcctcgctc tctggcacaa cccgctgaca ctcccttgcc 2100

cacccgcagt cggcggagaa ggctgccggc aagaagaagt aa 2142

<210> 112

<211> 1683

<212> DNA

<213> Rhodosporidium toruloides

<220>

<221> CDS

<222> (46)..(1431)

<400> 112

acctcgcgtc aaccctcgca tctcacacct acactcgcat tcaaa atg ggc aag gaa 57

Met Gly Lys Glu

1

aag gga cac gtc aac gtc gtc gtt atc ggc cac gtc gac tcc ggc aag 105

Lys Gly His Val Asn Val Val Val Ile Gly His Val Asp Ser Gly Lys

5 10 15 20

tcg acc acc acc gga cac ttg atc tac aag tgc ggc ggt atc gac aag 153

Ser Thr Thr Thr Gly His Leu Ile Tyr Lys Cys Gly Gly Ile Asp Lys

25 30 35

cgt acc atc gag aag ttc gag aag gag gcc gct gag ctc ggc aag ggt 201

Arg Thr Ile Glu Lys Phe Glu Lys Glu Ala Ala Glu Leu Gly Lys Gly

40 45 50

tcg ttc aag tac gca tgg gtc ctc gac aag ctc aag gcc gag cgc gag 249

Ser Phe Lys Tyr Ala Trp Val Leu Asp Lys Leu Lys Ala Glu Arg Glu

55 60 65

cgt ggt atc acc atc gac atc gct ctc tgg aag ttc gag acc ccc aag 297

Arg Gly Ile Thr Ile Asp Ile Ala Leu Trp Lys Phe Glu Thr Pro Lys

70 75 80

tac atg atc acc gtc atc gac gcc ccg ggt cac cgt gac ttc atc aag 345

Tyr Met Ile Thr Val Ile Asp Ala Pro Gly His Arg Asp Phe Ile Lys

85 90 95 100

aac atg atc acc ggt acc tcg cag gcc gac tgc gcc atc ctc atc att 393

Asn Met Ile Thr Gly Thr Ser Gln Ala Asp Cys Ala Ile Leu Ile Ile

105 110 115

gcc gcc ggc act ggt gag ttc gag gcc ggt atc tcg aag gac ggc cag 441

Ala Ala Gly Thr Gly Glu Phe Glu Ala Gly Ile Ser Lys Asp Gly Gln

120 125 130

acc cgc gag cac gcc ctc ctc gcc ttc acc ctc ggt gtc cgc cag ctc 489

Thr Arg Glu His Ala Leu Leu Ala Phe Thr Leu Gly Val Arg Gln Leu

135 140 145

atc gtt gcc atc aac aag atg gac acg acc aag tac tcg gag gcc cgt 537

Ile Val Ala Ile Asn Lys Met Asp Thr Thr Lys Tyr Ser Glu Ala Arg

150 155 160

tac gag gag atc atc aag gag acg tcc aac ttt atc aag aag gtc ggc 585

Tyr Glu Glu Ile Ile Lys Glu Thr Ser Asn Phe Ile Lys Lys Val Gly

165 170 175 180

ttc aac ccc aag ggc gtc ccc ttc gtc ccc atc tcg gga tgg cac ggc 633

Phe Asn Pro Lys Gly Val Pro Phe Val Pro Ile Ser Gly Trp His Gly

185 190 195

gac aac atg atc gag gcg acc acc aac atg ccc tgg tac aag gga tgg 681

Asp Asn Met Ile Glu Ala Thr Thr Asn Met Pro Trp Tyr Lys Gly Trp

200 205 210

aag aag gag acc aag tcg ggc gag gtc acc ggc aag acc ctc ctc gac 729

Lys Lys Glu Thr Lys Ser Gly Glu Val Thr Gly Lys Thr Leu Leu Asp

215 220 225

gcc atc gac gcc atc gag ccc ccc tcg cgc ccc acc gac aag ccc ctc 777

Ala Ile Asp Ala Ile Glu Pro Pro Ser Arg Pro Thr Asp Lys Pro Leu

230 235 240

cgt ctt ccc ctc cag gac gtc tac aag atc ggc ggt atc ggc aca gtg 825

Arg Leu Pro Leu Gln Asp Val Tyr Lys Ile Gly Gly Ile Gly Thr Val

245 250 255 260

ccc gtc ggc cgt gtc gag act ggc acg atc aag gcc ggc atg gtc gtc 873

Pro Val Gly Arg Val Glu Thr Gly Thr Ile Lys Ala Gly Met Val Val

265 270 275

acc ttc gcc ccg tcg aac gtc acc acc gag gtc aag tcg gtc gag atg 921

Thr Phe Ala Pro Ser Asn Val Thr Thr Glu Val Lys Ser Val Glu Met

280 285 290

cac cac gag cag ctc gag gcc ggt ctc ccc gga gac aat gtt ggc ttc 969

His His Glu Gln Leu Glu Ala Gly Leu Pro Gly Asp Asn Val Gly Phe

295 300 305

aac gtc aag aac gtc tcg gtc aag gac atc cgc cgc ggc aat gtc tgc 1017

Asn Val Lys Asn Val Ser Val Lys Asp Ile Arg Arg Gly Asn Val Cys

310 315 320

ggt gac tcg aag aac gac cct ccc aag gag gct gcg tcg ttc aag gcc 1065

Gly Asp Ser Lys Asn Asp Pro Pro Lys Glu Ala Ala Ser Phe Lys Ala

325 330 335 340

cag gtc atc gtc atg aac cac ccc ggc cag atc ggc aac ggc tac gcg 1113

Gln Val Ile Val Met Asn His Pro Gly Gln Ile Gly Asn Gly Tyr Ala

345 350 355

ccc gtc ctc gac tgc cac acg gcc cac att gcg tgc aag ttc gac acg 1161

Pro Val Leu Asp Cys His Thr Ala His Ile Ala Cys Lys Phe Asp Thr

360 365 370

ctc ctc gag aag atc gac cgc cgc tcg ggc aag tcg gtc gag gac ctc 1209

Leu Leu Glu Lys Ile Asp Arg Arg Ser Gly Lys Ser Val Glu Asp Leu

375 380 385

ccc aag ttc atc aag tcg ggt gac gcc gcc atc gtc aag atg gtt ccc 1257

Pro Lys Phe Ile Lys Ser Gly Asp Ala Ala Ile Val Lys Met Val Pro

390 395 400

tcg aag ccg atg tgc gtc gag tcg ttc gcc gag tac cct ccc ctc ggt 1305

Ser Lys Pro Met Cys Val Glu Ser Phe Ala Glu Tyr Pro Pro Leu Gly

405 410 415 420

cgt ttc gcc gtc cgt gac atg cgc cag acc gtt gcc gtc ggt gtc atc 1353

Arg Phe Ala Val Arg Asp Met Arg Gln Thr Val Ala Val Gly Val Ile

425 430 435

aag gca gtc gag aag act gac ggc aag ggc ggc aag gtc acc aag tcg 1401

Lys Ala Val Glu Lys Thr Asp Gly Lys Gly Gly Lys Val Thr Lys Ser

440 445 450

gcg gag aag gct gcc ggc aag aag aag taa acgggcggac tcgaacaagt 1451

Ala Glu Lys Ala Ala Gly Lys Lys Lys

455 460

cccctcgcac gcttctcctt cctctcgctc cccacctcgc attccacacg cctttccgga 1511

tacgaagcag cagtcgtgtc tgaacaacgc ctctctccct ctccctccat ccgcttgtcg 1571

tcatcgcttg atcccctccc ctcctcccga gcgtgttgtt ccctctgcct gctgtctagg 1631

actcctgaaa ggtttacccc ccgtttcgtg tgcaattcgg tttgactcca ta 1683

<210> 113

<211> 461

<212> PRT

<213> Rhodosporidium toruloides

<400> 113

Met Gly Lys Glu Lys Gly His Val Asn Val Val Val Ile Gly His Val

1 5 10 15

Asp Ser Gly Lys Ser Thr Thr Thr Gly His Leu Ile Tyr Lys Cys Gly

20 25 30

Gly Ile Asp Lys Arg Thr Ile Glu Lys Phe Glu Lys Glu Ala Ala Glu

35 40 45

Leu Gly Lys Gly Ser Phe Lys Tyr Ala Trp Val Leu Asp Lys Leu Lys

50 55 60

Ala Glu Arg Glu Arg Gly Ile Thr Ile Asp Ile Ala Leu Trp Lys Phe

65 70 75 80

Glu Thr Pro Lys Tyr Met Ile Thr Val Ile Asp Ala Pro Gly His Arg

85 90 95

Asp Phe Ile Lys Asn Met Ile Thr Gly Thr Ser Gln Ala Asp Cys Ala

100 105 110

Ile Leu Ile Ile Ala Ala Gly Thr Gly Glu Phe Glu Ala Gly Ile Ser

115 120 125

Lys Asp Gly Gln Thr Arg Glu His Ala Leu Leu Ala Phe Thr Leu Gly

130 135 140

Val Arg Gln Leu Ile Val Ala Ile Asn Lys Met Asp Thr Thr Lys Tyr

145 150 155 160

Ser Glu Ala Arg Tyr Glu Glu Ile Ile Lys Glu Thr Ser Asn Phe Ile

165 170 175

Lys Lys Val Gly Phe Asn Pro Lys Gly Val Pro Phe Val Pro Ile Ser

180 185 190

Gly Trp His Gly Asp Asn Met Ile Glu Ala Thr Thr Asn Met Pro Trp

195 200 205

Tyr Lys Gly Trp Lys Lys Glu Thr Lys Ser Gly Glu Val Thr Gly Lys

210 215 220

Thr Leu Leu Asp Ala Ile Asp Ala Ile Glu Pro Pro Ser Arg Pro Thr

225 230 235 240

Asp Lys Pro Leu Arg Leu Pro Leu Gln Asp Val Tyr Lys Ile Gly Gly

245 250 255

Ile Gly Thr Val Pro Val Gly Arg Val Glu Thr Gly Thr Ile Lys Ala

260 265 270

Gly Met Val Val Thr Phe Ala Pro Ser Asn Val Thr Thr Glu Val Lys

275 280 285

Ser Val Glu Met His His Glu Gln Leu Glu Ala Gly Leu Pro Gly Asp

290 295 300

Asn Val Gly Phe Asn Val Lys Asn Val Ser Val Lys Asp Ile Arg Arg

305 310 315 320

Gly Asn Val Cys Gly Asp Ser Lys Asn Asp Pro Pro Lys Glu Ala Ala

325 330 335

Ser Phe Lys Ala Gln Val Ile Val Met Asn His Pro Gly Gln Ile Gly

340 345 350

Asn Gly Tyr Ala Pro Val Leu Asp Cys His Thr Ala His Ile Ala Cys

355 360 365

Lys Phe Asp Thr Leu Leu Glu Lys Ile Asp Arg Arg Ser Gly Lys Ser

370 375 380

Val Glu Asp Leu Pro Lys Phe Ile Lys Ser Gly Asp Ala Ala Ile Val

385 390 395 400

Lys Met Val Pro Ser Lys Pro Met Cys Val Glu Ser Phe Ala Glu Tyr

405 410 415

Pro Pro Leu Gly Arg Phe Ala Val Arg Asp Met Arg Gln Thr Val Ala

420 425 430

Val Gly Val Ile Lys Ala Val Glu Lys Thr Asp Gly Lys Gly Gly Lys

435 440 445

Val Thr Lys Ser Ala Glu Lys Ala Ala Gly Lys Lys Lys

450 455 460

<210> 114

<211> 1003

<212> DNA

<213> Rhodosporidium toruloides

<400> 114

gcacgcgaag cggtagaagc aatgaagcga ggcgagagcg agagaggcag ggcttcagcc 60

atgtccagct gatcggctgt aacgtcgcgc cgggccagtc tgttgaattt gttgcgtcgc 120

ctgagcgtaa tagaagtgca gtagtctact ccgcatgccg agaacgtcga agagcgcgaa 180

gtagggagtc gagggaagcg agggtggcaa acacagcaac gacaagcggt tccgcttcgc 240

tcaaaagctc gttgacgttg ttttgacgtt ttgaagacag tacaacagca gcaagaggcg 300

tgcgaagcgt tggtggcgag agcagcgaca aggagggagg aatgagggag tggtggcgag 360

ggctcgcaaa cgggcgtacg cctcgaatgg agacgtgcga gtcgttcttc gacgtccgag 420

ggatgccgag cgccgagacg gagcacgcaa cgagcgagag gagagcagcc gcgcaaggtg 480

attcgagtgg cgcaagcgga ggacgacgag gagacggacg agggaggagg agggatggcg 540

agcgagcatc ggacggcggg gcgcgagaga cggcgtgagg agccgggtgt ggagagtttg 600

aggaggcgcg ggatgcgaag tggctgggtg tgcggagtga gcggtggcaa agagcgcact 660

tagagtctag agcgaggcag tagtagtaga gctgtatgaa tgaatacaaa gtgtgaatac 720

aacagtttgt aatgcgattc tgagcttgga cgtgtgcgcg cgagagggcg acttgcaagc 780

cagcgcccgc tcgctcttct tccttctgca cctcgcgtca accctcgcat ctcacaccta 840

cactcgcatt caaagtgcgt acactctccc acgacacacg gggacggcgc acaccaccgc 900

gcgtcgcttg aacggcgtcg ccacttcgag ccgtcactga cttcgtcctc gtcctccctc 960

ctctactctc ttgtactgta ctgtgtactg ggggggatag atg 1003

<210> 115

<211> 1134

<212> DNA

<213> Rhodosporidium toruloides

<400> 115

gcacgcgaag cggtagaagc aatgaagcga ggcgagagcg agagaggcag ggcttcagcc 60

atgtccagct gatcggctgt aacgtcgcgc cgggccagtc tgttgaattt gttgcgtcgc 120

ctgagcgtaa tagaagtgca gtagtctact ccgcatgccg agaacgtcga agagcgcgaa 180

gtagggagtc gagggaagcg agggtggcaa acacagcaac gacaagcggt tccgcttcgc 240

tcaaaagctc gttgacgttg ttttgacgtt ttgaagacag tacaacagca gcaagaggcg 300

tgcgaagcgt tggtggcgag agcagcgaca aggagggagg aatgagggag tggtggcgag 360

ggctcgcaaa cgggcgtacg cctcgaatgg agacgtgcga gtcgttcttc gacgtccgag 420

ggatgccgag cgccgagacg gagcacgcaa cgagcgagag gagagcagcc gcgcaaggtg 480

attcgagtgg cgcaagcgga ggacgacgag gagacggacg agggaggagg agggatggcg 540

agcgagcatc ggacggcggg gcgcgagaga cggcgtgagg agccgggtgt ggagagtttg 600

aggaggcgcg ggatgcgaag tggctgggtg tgcggagtga gcggtggcaa agagcgcact 660

tagagtctag agcgaggcag tagtagtaga gctgtatgaa tgaatacaaa gtgtgaatac 720

aacagtttgt aatgcgattc tgagcttgga cgtgtgcgcg cgagagggcg acttgcaagc 780

cagcgcccgc tcgctcttct tccttctgca cctcgcgtca accctcgcat ctcacaccta 840

cactcgcatt caaagtgcgt acactctccc acgacacacg gggacggcgc acaccaccgc 900

gcgtcgcttg aacggcgtcg ccacttcgag ccgtcactga cttcgtcctc gtcctccctc 960

ctctactctc ttgtactgta ctgtgtactg ggggggatag atgggcaagg aaaagggaca 1020

cgtcaacgtc gtcgttatcg gtacgttcag cgtcgtcgag gcgagtctgg cgaggaggag 1080

gacgtcgagc tgacctcgcc ccgtcctccc gcgcaggcca cgtcgactcc atgg 1134

<210> 116

<211> 1134

<212> DNA

<213> Rhodosporidium toruloides

<400> 116

gcacgcgaag cggtagaagc aatgaagcga ggcgagagcg agagaggcag ggcttcagcc 60

atgtccagct gatcggctgt aacgtcgcgc cgggccagtc tgttgaattt gttgcgtcgc 120

ctgagcgtaa tagaagtgca gtagtctact ccgcatgccg agaacgtcga agagcgcgaa 180

gtagggagtc gagggaagcg agggtggcaa acacagcaac gacaagcggt tccgcttcgc 240

tcaaaagctc gttgacgttg ttttgacgtt ttgaagacag tacaacagca gcaagaggcg 300

tgcgaagcgt tggtggcgag agcagcgaca aggagggagg aatgagggag tggtggcgag 360

ggctcgcaaa cgggcgtacg cctcgaatgg agacgtgcga gtcgttcttc gacgtccgag 420

ggatgccgag cgccgagacg gagcacgcaa cgagcgagag gagagcagcc gcgcaaggtg 480

attcgagtgg cgcaagcgga ggacgacgag gagacggacg agggaggagg agggatggcg 540

agcgagcatc ggacggcggg gcgcgagaga cggcgtgagg agccgggtgt ggagagtttg 600

aggaggcgcg ggatgcgaag tggctgggtg tgcggagtga gcggtggcaa agagcgcact 660

tagagtctag agcgaggcag tagtagtaga gctgtatgaa tgaatacaaa gtgtgaatac 720

aacagtttgt aatgcgattc tgagcttgga cgtgtgcgcg cgagagggcg acttgcaagc 780

cagcgcccgc tcgctcttct tccttctgca cctcgcgtca accctcgcat ctcacaccta 840

cactcgcatt caaagtgcgt acactctccc acgacacacg gggacggcgc acaccaccgc 900

gcgtcgcttg aacggcgtcg ccacttcgag ccgtcactga cttcgtcctc gtcctccctc 960

ctctactctc ttgtactgta ctgtgtactg ggggggatag atcggcaagg aaaagggaca 1020

cgtcaacgtc gtcgttatcg gtacgttcag cgtcgtcgag gcgagtctgg cgaggaggag 1080

gacgtcgagc tgacctcgcc ccgtcctccc gcgcaggcca cgtcgactcc atgg 1134

<210> 117

<211> 1133

<212> DNA

<213> Rhodosporidium toruloides

<400> 117

gcacgcgaag cggtagaagc aatgaagcga ggcgagagcg agagaggcag ggcttcagcc 60

atgtccagct gatcggctgt aacgtcgcgc cgggccagtc tgttgaattt gttgcgtcgc 120

ctgagcgtaa tagaagtgca gtagtctact ccgcatgccg agaacgtcga agagcgcgaa 180

gtagggagtc gagggaagcg agggtggcaa acacagcaac gacaagcggt tccgcttcgc 240

tcaaaagctc gttgacgttg ttttgacgtt ttgaagacag tacaacagca gcaagaggcg 300

tgcgaagcgt tggtggcgag agcagcgaca aggagggagg aatgagggag tggtggcgag 360

ggctcgcaaa cgggcgtacg cctcgaatgg agacgtgcga gtcgttcttc gacgtccgag 420

ggatgccgag cgccgagacg gagcacgcaa cgagcgagag gagagcagcc gcgcaaggtg 480

attcgagtgg cgcaagcgga ggacgacgag gagacggacg agggaggagg agggatggcg 540

agcgagcatc ggacggcggg gcgcgagaga cggcgtgagg agccgggtgt ggagagtttg 600

aggaggcgcg ggatgcgaag tggctgggtg tgcggagtga gcggtggcaa agagcgcact 660

tagagtctag agcgaggcag tagtagtaga gctgtatgaa tgaatacaaa gtgtgaatac 720

aacagtttgt aatgcgattc tgagcttgga cgtgtgcgcg cgagagggcg acttgcaagc 780

cagcgcccgc tcgctcttct tccttctgca cctcgcgtca accctcgcat ctcacaccta 840

cactcgcatt caaagtgcgt acactctccc acgacacacg gggacggcgc acaccaccgc 900

gcgtcgcttg aacggcgtcg ccacttcgag ccgtcactga cttcgtcctc gtcctccctc 960

ctctactctc ttgtactgta ctgtgtactg ggggggatag atgggcaagg aaaagggaca 1020

cgtcaacgtc gtcgttatcg gtacgttcag cgtcgtcgag gcgagtctgg cgaggaggag 1080

gacgtcgagc tgacctcgcc ccgtcctccc gcgcaggcca cgtcgactcc atg 1133

<210> 118

<211> 1133

<212> DNA

<213> Rhodosporidium toruloides

<400> 118

gcacgcgaag cggtagaagc aatgaagcga ggcgagagcg agagaggcag ggcttcagcc 60

atgtccagct gatcggctgt aacgtcgcgc cgggccagtc tgttgaattt gttgcgtcgc 120

ctgagcgtaa tagaagtgca gtagtctact ccgcatgccg agaacgtcga agagcgcgaa 180

gtagggagtc gagggaagcg agggtggcaa acacagcaac gacaagcggt tccgcttcgc 240

tcaaaagctc gttgacgttg ttttgacgtt ttgaagacag tacaacagca gcaagaggcg 300

tgcgaagcgt tggtggcgag agcagcgaca aggagggagg aatgagggag tggtggcgag 360

ggctcgcaaa cgggcgtacg cctcgaatgg agacgtgcga gtcgttcttc gacgtccgag 420

ggatgccgag cgccgagacg gagcacgcaa cgagcgagag gagagcagcc gcgcaaggtg 480

attcgagtgg cgcaagcgga ggacgacgag gagacggacg agggaggagg agggatggcg 540

agcgagcatc ggacggcggg gcgcgagaga cggcgtgagg agccgggtgt ggagagtttg 600

aggaggcgcg ggatgcgaag tggctgggtg tgcggagtga gcggtggcaa agagcgcact 660

tagagtctag agcgaggcag tagtagtaga gctgtatgaa tgaatacaaa gtgtgaatac 720

aacagtttgt aatgcgattc tgagcttgga cgtgtgcgcg cgagagggcg acttgcaagc 780

cagcgcccgc tcgctcttct tccttctgca cctcgcgtca accctcgcat ctcacaccta 840

cactcgcatt caaagtgcgt acactctccc acgacacacg gggacggcgc acaccaccgc 900

gcgtcgcttg aacggcgtcg ccacttcgag ccgtcactga cttcgtcctc gtcctccctc 960

ctctactctc ttgtactgta ctgtgtactg ggggggatag atcggcaagg aaaagggaca 1020

cgtcaacgtc gtcgttatcg gtacgttcag cgtcgtcgag gcgagtctgg cgaggaggag 1080

gacgtcgagc tgacctcgcc ccgtcctccc gcgcaggcca cgtcgactcc atg 1133

<210> 119

<211> 931

<212> DNA

<213> Rhodosporidium toruloides

<400> 119

gtggcaaaca cagcaacgac aagcggttcc gcttcgctca aaagctcgtt gacgttgttt 60

tgacgttttg aagacagtac aacagcagca agaggcgtgc gaagcgttgg tggcgagagc 120

agcgacaagg agggaggaat gagggagtgg tggcgagggc tcgcaaacgg gcgtacgcct 180

cgaatggaga cgtgcgagtc gttcttcgac gtccgaggga tgccgagcgc cgagacggag 240

cacgcaacga gcgagaggag agcagccgcg caaggtgatt cgagtggcgc aagcggagga 300

cgacgaggag acggacgagg gaggaggagg gatggcgagc gagcatcgga cggcggggcg 360

cgagagacgg cgtgaggagc cgggtgtgga gagtttgagg aggcgcggga tgcgaagtgg 420

ctgggtgtgc ggagtgagcg gtggcaaaga gcgcacttag agtctagagc gaggcagtag 480

tagtagagct gtatgaatga atacaaagtg tgaatacaac agtttgtaat gcgattctga 540

gcttggacgt gtgcgcgcga gagggcgact tgcaagccag cgcccgctcg ctcttcttcc 600

ttctgcacct cgcgtcaacc ctcgcatctc acacctacac tcgcattcaa agtgcgtaca 660

ctctcccacg acacacgggg acggcgcaca ccaccgcgcg tcgcttgaac ggcgtcgcca 720

cttcgagccg tcactgactt cgtcctcgtc ctccctcctc tactctcttg tactgtactg 780

tgtactgggg gggatagatg ggcaaggaaa agggacacgt caacgtcgtc gttatcggta 840

cgttcagcgt cgtcgaggcg agtctggcga ggaggaggac gtcgagctga cctcgccccg 900

tcctcccgcg caggccacgt cgactccatg g 931

<210> 120

<211> 931

<212> DNA

<213> Rhodosporidium toruloides

<400> 120

gtggcaaaca cagcaacgac aagcggttcc gcttcgctca aaagctcgtt gacgttgttt 60

tgacgttttg aagacagtac aacagcagca agaggcgtgc gaagcgttgg tggcgagagc 120

agcgacaagg agggaggaat gagggagtgg tggcgagggc tcgcaaacgg gcgtacgcct 180

cgaatggaga cgtgcgagtc gttcttcgac gtccgaggga tgccgagcgc cgagacggag 240

cacgcaacga gcgagaggag agcagccgcg caaggtgatt cgagtggcgc aagcggagga 300

cgacgaggag acggacgagg gaggaggagg gatggcgagc gagcatcgga cggcggggcg 360

cgagagacgg cgtgaggagc cgggtgtgga gagtttgagg aggcgcggga tgcgaagtgg 420

ctgggtgtgc ggagtgagcg gtggcaaaga gcgcacttag agtctagagc gaggcagtag 480

tagtagagct gtatgaatga atacaaagtg tgaatacaac agtttgtaat gcgattctga 540

gcttggacgt gtgcgcgcga gagggcgact tgcaagccag cgcccgctcg ctcttcttcc 600

ttctgcacct cgcgtcaacc ctcgcatctc acacctacac tcgcattcaa agtgcgtaca 660

ctctcccacg acacacgggg acggcgcaca ccaccgcgcg tcgcttgaac ggcgtcgcca 720

cttcgagccg tcactgactt cgtcctcgtc ctccctcctc tactctcttg tactgtactg 780

tgtactgggg gggatagatc ggcaaggaaa agggacacgt caacgtcgtc gttatcggta 840

cgttcagcgt cgtcgaggcg agtctggcga ggaggaggac gtcgagctga cctcgccccg 900

tcctcccgcg caggccacgt cgactccatg g 931

<210> 121

<211> 930

<212> DNA

<213> Rhodosporidium toruloides

<400> 121

gtggcaaaca cagcaacgac aagcggttcc gcttcgctca aaagctcgtt gacgttgttt 60

tgacgttttg aagacagtac aacagcagca agaggcgtgc gaagcgttgg tggcgagagc 120

agcgacaagg agggaggaat gagggagtgg tggcgagggc tcgcaaacgg gcgtacgcct 180

cgaatggaga cgtgcgagtc gttcttcgac gtccgaggga tgccgagcgc cgagacggag 240

cacgcaacga gcgagaggag agcagccgcg caaggtgatt cgagtggcgc aagcggagga 300

cgacgaggag acggacgagg gaggaggagg gatggcgagc gagcatcgga cggcggggcg 360

cgagagacgg cgtgaggagc cgggtgtgga gagtttgagg aggcgcggga tgcgaagtgg 420

ctgggtgtgc ggagtgagcg gtggcaaaga gcgcacttag agtctagagc gaggcagtag 480

tagtagagct gtatgaatga atacaaagtg tgaatacaac agtttgtaat gcgattctga 540

gcttggacgt gtgcgcgcga gagggcgact tgcaagccag cgcccgctcg ctcttcttcc 600

ttctgcacct cgcgtcaacc ctcgcatctc acacctacac tcgcattcaa agtgcgtaca 660

ctctcccacg acacacgggg acggcgcaca ccaccgcgcg tcgcttgaac ggcgtcgcca 720

cttcgagccg tcactgactt cgtcctcgtc ctccctcctc tactctcttg tactgtactg 780

tgtactgggg gggatagatg ggcaaggaaa agggacacgt caacgtcgtc gttatcggta 840

cgttcagcgt cgtcgaggcg agtctggcga ggaggaggac gtcgagctga cctcgccccg 900

tcctcccgcg caggccacgt cgactccatg 930

<210> 122

<211> 930

<212> DNA

<213> Rhodosporidium toruloides

<400> 122

gtggcaaaca cagcaacgac aagcggttcc gcttcgctca aaagctcgtt gacgttgttt 60

tgacgttttg aagacagtac aacagcagca agaggcgtgc gaagcgttgg tggcgagagc 120

agcgacaagg agggaggaat gagggagtgg tggcgagggc tcgcaaacgg gcgtacgcct 180

cgaatggaga cgtgcgagtc gttcttcgac gtccgaggga tgccgagcgc cgagacggag 240

cacgcaacga gcgagaggag agcagccgcg caaggtgatt cgagtggcgc aagcggagga 300

cgacgaggag acggacgagg gaggaggagg gatggcgagc gagcatcgga cggcggggcg 360

cgagagacgg cgtgaggagc cgggtgtgga gagtttgagg aggcgcggga tgcgaagtgg 420

ctgggtgtgc ggagtgagcg gtggcaaaga gcgcacttag agtctagagc gaggcagtag 480

tagtagagct gtatgaatga atacaaagtg tgaatacaac agtttgtaat gcgattctga 540

gcttggacgt gtgcgcgcga gagggcgact tgcaagccag cgcccgctcg ctcttcttcc 600

ttctgcacct cgcgtcaacc ctcgcatctc acacctacac tcgcattcaa agtgcgtaca 660

ctctcccacg acacacgggg acggcgcaca ccaccgcgcg tcgcttgaac ggcgtcgcca 720

cttcgagccg tcactgactt cgtcctcgtc ctccctcctc tactctcttg tactgtactg 780

tgtactgggg gggatagatc ggcaaggaaa agggacacgt caacgtcgtc gttatcggta 840

cgttcagcgt cgtcgaggcg agtctggcga ggaggaggac gtcgagctga cctcgccccg 900

tcctcccgcg caggccacgt cgactccatg 930

Claims

1.一种核酸，其包含启动子，基于Clustal V或Clustal W比对方法，所述启动子包含与选自以下的核酸序列相比具有至少75％序列相同性的核酸序列：

(a)SEQ ID NO:75、85、93或94中所示的核酸序列；

(b)SEQ ID NO:115、116、117、118、119、120、121或122中所示的核酸序列；

(c)SEQ ID NO:76、86、95或96中所示的核酸序列；

(d)SEQ ID NO:74、77、80、81、82、83、87、88、89、90、91或92中所示的核酸序列；

(e)SEQ ID NO:79或97中所示的核酸序列；和

(f)SEQ ID NO:87、88、89、90、91、92、93、94、95、96、97、117、118、121或122中所示的核酸序列，其中3'ATG已被缺失，

其中所述启动子能够驱动来自红冬孢酵母属(Rhodosporidium)或红酵母属(Rhodotorula)的物种中RNA或蛋白质的强烈表达。

2.权利要求1的核酸，其中所述启动子含有内含子。

3.权利要求1的核酸，还包含与目标核酸可操作地连接的启动子。

4.权利要求3的核酸，其中所述目标核酸还可操作地连接到转录终止子。

5.转基因酵母或真菌细胞，其包含权利要求1-4中任一项所述的核酸。

6.权利要求5的转基因酵母或真菌细胞，其中所述细胞是红冬孢酵母属或红酵母属的物种的细胞。

7.一种组合物，其包含培养基和权利要求5或6所述的转基因酵母或真菌细胞。

8.一种制备转基因酵母或真菌细胞的方法，其包括：

(a)将权利要求1-4中任一项所述的核酸导入酵母或真菌细胞中，以及

(b)选择包含核酸构建体的转基因酵母或真菌细胞。

9.一种在酵母或真菌细胞中表达目标核酸的方法，其包括在适合于表达目标核酸的条件下，在培养基中培养权利要求5或6所述的转基因酵母或真菌细胞。