CN107636155B - 红冬孢酵母属和红酵母属的d-氨基酸诱导型基因表达系统 - Google Patents

红冬孢酵母属和红酵母属的d-氨基酸诱导型基因表达系统 Download PDF

Info

Publication number
CN107636155B
CN107636155B CN201680031872.1A CN201680031872A CN107636155B CN 107636155 B CN107636155 B CN 107636155B CN 201680031872 A CN201680031872 A CN 201680031872A CN 107636155 B CN107636155 B CN 107636155B
Authority
CN
China
Prior art keywords
ala
leu
gly
ser
pro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680031872.1A
Other languages
English (en)
Other versions
CN107636155A (zh
Inventor
纪良辉
Y·刘
C·M·J·许
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Temasek Life Sciences Laboratory Ltd
Original Assignee
Temasek Life Sciences Laboratory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Temasek Life Sciences Laboratory Ltd filed Critical Temasek Life Sciences Laboratory Ltd
Publication of CN107636155A publication Critical patent/CN107636155A/zh
Application granted granted Critical
Publication of CN107636155B publication Critical patent/CN107636155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/36Vector systems having a special element relevant for transcription being a transcription termination element
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/002Vectors comprising a special translation-regulating system controllable or inducible

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mycology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Botany (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及真菌生物技术领域,更具体地涉及真菌物种中的强诱导型基因表达系统,例如红酵母属(Rhodosporidium)属或红酵母属(Rhodotorula)属的物种。

Description

红冬孢酵母属和红酵母属的D-氨基酸诱导型基因表达系统
相关申请的交叉引用
本申请涉及并要求于2015年4月3日提交的美国临时专利申请第62/142,788号的优先权。该申请通过引用并入本文。
序列表的提交
本申请与电子格式的序列表一起提交。序列表的标题为2577248PCTSequenceListing.txt,于2016年1月12日创建,大小为125kb。电子格式的序列表信息通过引用整体并入本文。
发明背景
本发明涉及真菌生物技术领域,更具体地涉及在真菌物种如红冬孢酵母属(Rhodosporidium)或红酵母属(Rhodotorula)属中的强诱导型基因表达系统。
在此使用的用于阐明本发明背景的出版物和其他材料,特别是提供与实践相关的附加细节的情况通过引用并入,并且为了方便起见,在下文中所引用文献的作者和日期按作者的字母顺序列于所附参考文献中。
红冬孢酵母属和红酵母属是属于担子菌门(Basidiomycota)的柄锈菌亚门(Pucciniomycotina subphylum)的两个紧密相关的真菌属。两者通常作为产油酵母或产类胡萝卜素酵母被分离(1)。由于红冬孢酵母属和红酵母属具有被培养至极高的细胞密度(>100g/l干细胞质量)以及积累超过60%的甘油三酯形式的生物质的能力,因此红冬孢酵母属和红酵母属是具有很大生物技术潜力的真菌宿主(2-4)。为此,我们建立了高效的遗传转化、基因敲除和强大的组成型蛋白表达系统(5-7)。然而,迄今为止,在红冬孢酵母属和红酵母中没有有效的基因表达启动子。这成为这些宿主代谢工程的主要瓶颈(8-10)。
D-氨基酸氧化酶(DAAO,EC1.4.3.3)是特异性催化D-氨基酸氧化脱氨基成α-酮酸、氨和过氧化氢(图1)的黄素酶。DAAO的活性已在细菌、真菌到动物范围中被广泛地鉴定(11)。DAAO以生产头孢菌素而广为人知,这是一种年全球市场约2亿美元的抗生素(12)。
类酵母红冬孢(Rhodosporidium toruloides)和纤细红酵母(Rhodotorulagracilis)DAAO是自1987年以来已被充分记载的过氧化物酶体蛋白(13)。近期关于类酵母红冬孢Dao1的研究主要集中于其异源表达(14)、酶的性质(15-18)和固定(19-22)。已经报道DAO1mRNA转录物在用D-丙氨酸诱导后12小时内达到峰值,且Dao1蛋白可能占可溶性细胞内蛋白质的1.0%((23),然而,没有关于DAO1基因的D-氨基酸可诱导性质可以用于生物技术应用的信息。
小干扰RNA(siRNA)是一类长度为20-25个碱基对长的双链RNA分子。siRNA通过互补核苷酸序列干扰特定基因的表达,导致mRNA在转录后分解,致使没有翻译。siRNA由双链RNA产生,例如来自RNA序列的反向重复序列,并且通常完全碱基配对且仅在单一的特异性mRNA靶标中诱导mRNA切割(24)。微小RNA(miRNA)是基因组编码的非编码RNA,有助于调控基因表达,特别是在发育过程中的基因表达。成熟的miRNA在结构上与由外源dsRNA产生的siRNA类似,不同之处在于它们从更长的RNA编码基因表达为被称为pri-miRNA的初级转录物,其在细胞核中通过微处理器复合物(microprocessor complex)被加工成称为pre-miRNA的茎环结构。pri-miRNA的一个区域是部分自我互补的,允许转录物向自身折回以形成不完全dsRNA的茎环结构。人工miRNA(amiRNA)技术使用内源pri-miRNA,其中miRNA和miRNA*(miRNA双链体的随从链)序列已经被相应的amiRNA/amiRNA*序列取代,该amiRNA/amiRNA*序列指导高效的靶基因的RNA沉默)。miRNA通常与靶基因有不完全的碱基配对,并抑制具有相似序列的多个不同mRNA的翻译。
期望鉴定诱导型启动子并产生可用于引入真菌物种的核酸构建体。
发明概述
本发明涉及真菌生物技术领域,更具体地涉及在真菌物种如红冬孢酵母属(Rhodosporidium)或红酵母属(Rhodotorula)属中的强诱导型基因表达系统。
因此,在一个方面,本发明提供了用于在真菌物种中表达异源多核苷酸的诱导型启动子。在一个实施方案中,诱导型启动子包含与SEQ ID NO:94中所示的核苷酸具有至少75%相同性的核苷酸序列。在另一个实施方案中,诱导型启动子包含与SEQ ID NO:95中所示的核苷酸具有至少75%相同性的核苷酸序列。在进一步的实施方案中,诱导型启动子包含与SEQ ID NO:96中所示的核苷酸具有至少75%相同性的核苷酸序列。在另一个实施方案中,诱导型启动子包含与SEQ ID NO:97中所示的核苷酸具有至少75%相同性的核苷酸序列。在另外的实施方案中,诱导型启动子包含与SEQ ID NO:5中所示的核苷酸具有至少75%相同性的核苷酸序列。在一些实施方案中,启动子包含DNA基序,在本文中有时称为启动子DNA基序。在一个实施方案中,启动子DNA基序包含共有序列AGGNNGNA GN11GANGANGG(SEQ IDNO:6)。在另一个实施方案中,启动子DNA基序与共有序列的特别确定的核苷酸(即特定的A和G)具有至少75%的相同性。在一些实施方案中,诱导型启动子可被D-氨基酸诱导。在其他实施方案中,D-氨基酸是D-丙氨酸、D-苏氨酸、D-丝氨酸、D-缬氨酸或D-脯氨酸。
另一方面,本发明提供了一种核酸构建体。在一个实施方案中,核酸构建体包含可操作地连接至异源多核苷酸的如本文所述的诱导型启动子。在另一个实施方案中,多核苷酸可操作地连接至转录终止子。在另一个实施方案中,转录终止子在真菌物种中是可操作的。在一些实施方案中,核酸构建体含有富含CT的核苷酸序列。在一个实施方案中,富含CT的核苷酸序列与共有序列T(T/C)TCCC(T/C)CTCC(T/C)CCCCAC(A/T)(C/T)CCGA(SEQ ID NO:7)具有至少75%的相同性。
在一些实施方案中,富含CT的核苷酸序列是内含子。在一个实施方案中,内含子被插入、定位或位于核酸构建体中多核苷酸的5'端或5'区的上游或内部。在另一个实施方案中,内含子被插入到诱导型启动子的5'非翻译区(5’UTR)中。在其他实施方案中,内含子包含DNA基序,在本文中有时称为内含子DNA基序。在一个实施方案中,内含子DNA基序包含富含CT的核苷酸序列。在其他实施方案中,富含CT的核苷酸序列被包含在核酸构建体中的异源多核苷酸的编码序列内。在一些实施方案中,富含CT的核苷酸序列可以跨越内含子和启动子的核苷酸和/或围绕内含子的异源多核苷酸。在一些实施方案中,异源多核苷酸编码感兴趣的蛋白质。在其他实施方案中,异源多核苷酸编码用于下调感兴趣的靶基因的RNA分子。
另一方面,本发明提供了包含本文所述的核酸构建体的真菌细胞。在一个实施方案中,真菌细胞是属于红冬孢酵母属的物种的细胞。在另一个实施方案中,真菌细胞是属于红酵母属的物种的细胞。在一些实施方案中,核酸构建体稳定地整合到真菌细胞的基因组中。在其他实施方案中,真菌细胞是也包含培养基的组合物的一部分。
另一方面,本发明提供了制备和使用包含本文所述的核酸构建体的真菌物种的方法。在一个实施方案中,制备真菌物种的方法包括将本文所述的核酸构建体引入真菌细胞中并选择具有核酸稳定整合到其基因组中的真菌细胞。在另一个实施方案中,使用真菌物种的方法包括在含有D-氨基酸的培养基中培养包含本文所述的核酸构建体的真菌物种。在一些实施方案中,D-氨基酸是D-丙氨酸、D-苏氨酸、D-丝氨酸、D-缬氨酸或D-脯氨酸。附图简要说明
图1是说明由D-氨基酸氧化酶催化的反应的图解。还原反应需要FAD辅助因子,其被分子氧再氧化以提供过氧化氢。亚氨基酸自发地水解成相应的酮酸和氨。
图2A-2D显示了在本发明的某些实施方案中使用的二元载体(binary vector)和DAO1启动子结构。图2A:GFP报告基因质粒pKC1、萤光素酶报告基因质粒pKCL2的T-DNA区域,以及报告基因盒对类酵母红冬孢的CAR2等位基因的敲入策略。图2B:具有萤光素酶报告基因RtLUC-2的质粒系列pKCLDx的T-DNA区域。图2C:包括第一内含子的部分DAO1启动子序列(SEQ ID NO:8)。显示了mRNA转录起始位置(tsp)、5'非翻译区(5'UTR)、富含CT区(ct box)、内含子1和N端肽序列(SEQ ID NO:87)的位置。Dao1蛋白的完整肽序列如SEQ ID NO:88所示。图2D:在选择培养基上肉眼选择的候选白化转化体。
图3A-3B显示推定的DAO1基因和柄锈菌亚门和黑粉菌亚门(Ustilagiomycotinasubphyla)的蛋白质。图3A:获得的DAO1基因(SEQ ID NO:9、11、13、15、17、19、21、23、25、27和29)的示意图。图3B:对于Dao1蛋白(SEQ ID NO:10、12、14、16、18、20、22、24、26、28和30)获得的系统树分析。
图4A-4C显示类酵母红冬孢中DAO1的转录谱。图4A:类酵母红冬孢中DAO1基因拷贝的DNA印记分析。使用基因组DNA和寡核苷酸DAO1f和DAO1r的模板扩增地高辛标记的DNA探针(表1),并在图2A中显示。图4B:用70mM D-丙氨酸或L-丙氨酸诱导后3小时和6小时DAO1的mRNA水平。使用的碳源和氮源:CTL-葡萄糖和硫酸铵;L-丙氨酸-葡萄糖和L-丙氨酸;D-丙氨酸-葡萄糖和D-丙氨酸;只有单一的D-丙氨酸-D-丙氨酸。图4C:在各种应激条件下在YPD培养基中培养6小时的类酵母红冬孢细胞中DAO1的mRNA水平。CTL-在28℃下在YPD液体培养基中培养;氧化应激-在28℃下补充1%H2O2(w/v)的YPD液体培养基中培养;冷应激-在4℃下YPD液体培养基中培养;热应激-在37℃下YPD液体培养基中培养;渗透应激-在28℃下补充有1M KCl的YPD液体培养基中培养;甘油-在28℃下YPD液体培养基中培养(YPD中的葡萄糖碳源被相同浓度的甘油代替)。
图5A-5C显示来自柄锈菌亚门物种的DAO1的1.0kb上游序列的分析。图5A:DAO1上游序列中三个高度保守基序的定位。检测的序列:使用Rt1-类酵母红冬孢ATCC 10657(SEQID NO:31);Rt3-类酵母红冬孢MTCC457(SEQ ID NO:32);Rt4-类酵母红冬孢NP11(SEQ IDNO:33);Rg2-粘红酵母(R.glutinis)ATCC 204091(SEQ ID NO:34);Rg3-禾本红酵母(R.graminis)WP1(SEQ ID NO:35);Sr-红色掷孢酵母(S.roseus)(SEQ ID NO:36);Pt-小麦叶锈菌(P.tritartic)(SEQ ID NO:37);Pg-禾柄锈菌(P.graminis)(SEQ ID NO:38);Rm-小红酵母(R.minuta)(SEQ ID NO:39);Sl-S.linerdae(SEQ ID NO:40);Um-玉蜀黍黑粉菌(U.maydis)(SEQ ID NO:41);Sr2-玉米丝黑穗病菌(S.reilianum)(SEQ ID NO:42);M1-杨松栅锈菌(Melampsora laricis-populina)(SEQ ID NO:43)进行多重序列比对,但如所示的不具有共有基序。图5B:所检测的基序的核苷酸序列图形(logo)(基序1:SEQ ID NO:91;基序2:SEQ ID NO:92;基序3:SEQ ID NO:93)。图5C:DAO1的上游序列之间的基序1序列的比对。序列如下所示:Rg3-SEQ ID NO:44;Um-SEQ ID NO:45;Sr2-SEQ ID NO:46;Sr-SEQ IDNO:47;Rg2-SEQ ID NO:48;Rt1-SEQ ID NO:49;S1-SEQ ID NO:50;共有序列-SEQ ID NO:6。
图6A-6C显示了DAO1启动子的功能性解剖。图6A:DAO1启动子的连续缺失的示意图。所有的启动子都克隆在pKCLDx中(图2B),其中x表示DAO1上游序列的不同版本(version)。PDAO1:无内含子1的2021bp的DAO1上游序列;PDAOlin:包括内含子1的2175bp的DAO1上游序列(不含NcoI位点的SEQ ID NO:1);PDAO1int:与PDAO1in相同,除了基序1被删除。PDAO1in2到PDAO1in6是从5'的连续缺失,长度分别为1655、1157、953、663和354bp。使用密码子改编的萤光素酶基因(RtLUC-2,SEQ ID NO:51)作为启动子活性的报告基因。图6B:内含子1和基序1对DAO1启动子活性的影响。将细胞在补充了D-丙氨酸或L-丙氨酸的MinAB培养基中培养21小时。图6C:5'序列缺失对PDAO1in活性的影响。RPA:相对启动子活性;GPD1:甘油醛-3-磷酸脱氢酶的内源性795-bp启动子;P-less:阴性对照构建体,其中RtLUC-2:T35S不与任何启动子融合;D-ala和L-ala:细胞分别在具有D-丙氨酸和L-丙氨酸的培养基中培养。
图7A-7D显示额外的碳源或氮源对DAO1启动子活性的影响。图7A:不同培养基的影响。基础培养基MinAB补充有指定的碳源或氮源,并且蛋白质提取物由21小时培养物制成。缩写:G-葡萄糖(10g/L);AS-硫酸铵(70mM);D-D-丙氨酸(70mM);L-L-丙氨酸(70mM)。图7B:D-丙氨酸浓度的影响。将10g/L葡萄糖和不同浓度的D-丙氨酸补充到基础培养基MinAB中。图7C:葡萄糖浓度的影响。将70mM D-丙氨酸和不同浓度的D-丙氨酸补充到基础培养基MinAB中。图7D:硫酸铵浓度的影响。将10g/L葡萄糖、70mM D-丙氨酸和不同浓度的硫酸铵补充到基础培养基MinAB中。所有实验均进行生物学三次重复,并且RPA表示萤光素酶活性的相对读数。
图8显示不同D-氨基酸对DAO1启动子诱导的影响。在诱导21小时后测定所有启动子活性,并将70mM相同浓度的每种氨基酸作为唯一碳源和氮源补充到MinABs培养基中。
图9A-9C显示来自红冬孢酵母属/红酵母属物种的DAO1的第一内含子序列的分析。图9A:内含子1的5'部分序列的比对。使用的序列是:Rg2-粘红酵母ATCC 204091(SEQ IDNO:52);类酵母红冬孢MTCC 457(SEQ ID NO:53);类酵母红冬孢NP11(SEQ ID NO:54);禾本红酵母WP1(SEQ ID NO:55)。完整的内含子序列分别如SEQ ID NO:56-59所示。图9B:基序2的核苷酸序列图形。图9C:PDAO1in突变体的启动子活性。DAO1in:含有内含子1的启动子的0.7kb版本;DAO1in2:同DAO1in,除了翻译起始密码子被改变为ATC,从而在待表达的蛋白质中不翻译额外的N-末端残基;DAO1in3:同DAO1in2,除了基序2中的所有胞嘧啶残基被改变为腺嘌呤;DAO1in4:同DAO1in2,除了基序2的24nt被删除。
图10A-C显示了DAO1敲除对DAO1in启动子活性的影响。图10A:DAO1缺失突变体的DNA印记分析。用PstI消化基因组DNA(2μg),并与DAO1R的地高辛标记的探针杂交(图2A中的探针2)。图10B:在补充有D-丙氨酸或L-丙氨酸作为唯一碳源的YNB培养基中DAO1无效(null)突变体的生长。图10C:在各种培养基中野生型和DAO1敲除突变株Δdao1的DAO1in启动子活性的比较。用补充有(用+显示的)葡萄糖(10g/L)、硫酸铵(70mM)、D-丙氨酸(D-ala)和L-丙氨酸(70mM)的各种组合的MinAB中培养在CAR2位点处用2.2kb DAO1启动子(PDAO1in)LUC2报告基因敲入的WT和Δdao1细胞。在图10C的右侧显示了较低浓度的D-丙氨酸(10mM和1mM)的诱导。
发明详述
本发明涉及真菌生物技术领域,更具体地涉及在真菌物种如红冬孢酵母属(Rhodosporidium)或红酵母属(Rhodotorula)中的强诱导型基因表达系统。
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的技术人员通常理解的相同的含义。
术语“约”或“近似”是指在统计学上有意义的数值范围内。这样的范围可以在给定值或范围的一个数量级内,优选在50%内、更优选在20%内、更优选在10%内、甚至更优选在5%内。术语“约”或“近似”涵盖的可允许的变化取决于所研究的特定系统,并且可以由本领域的普通技术人员容易地理解。
如本文所用,“等位基因”是指基因座的替代形式中的任意一种或多种,所有这些等位基因涉及性状或特征。在二倍体细胞或生物体中,给定基因的两个等位基因在一对同源染色体上占据相应的基因座。
“改变的水平”是指在转基因生物体中以与正常、对照或未转化的生物体不同的量或比例产生的基因产物。
“编码序列”是指编码特定氨基酸序列的核苷酸序列。
“对照”或“对照真菌”或“对照真菌细胞”提供了参考点,用于测量本发明真菌或真菌细胞的表型变化,其中已经对感兴趣的多核苷酸实现了遗传改变(例如转化)。本发明真菌或真菌细胞可能源自如此改变的真菌或真菌细胞并将包含改变。
对照真菌或真菌细胞可包含例如:(a)野生型真菌或真菌细胞,即与起始材料相同的基因型,所述起始材料的遗传改变导致本发明真菌或真菌细胞;(b)与起始材料具有相同基因型的真菌或真菌细胞,但已经用无效构建体转化(即,对感兴趣的性状没有已知影响的构建体,如包含标记基因的构建体);(c)真菌或真菌细胞,其是本发明真菌或真菌细胞的后代中的非转化分离子;(d)与本发明真菌或真菌细胞遗传相同的真菌或真菌细胞,但其不暴露于诱导感兴趣的多核苷酸表达的条件或刺激物或(e)本发明真菌或真菌细胞自身在感兴趣的多核苷酸不被表达的条件下。
“D-氨基酸氧化酶”(DAAO,EC1.4.3.3),“Dao1”、“Dao1多肽”和“Dao1蛋白”在本文中可互换使用,指的是特异性催化D-氨基酸氧化脱氨基成α-酮酸、氨和过氧化氢的黄素酶。
“DAO1”和“DAO1基因”在本文中可互换使用,是指编码Dao1多肽的核酸序列。
“DAO1启动子”是指位于翻译起始位点上游的DAO1基因的一部分,其控制Dao1多肽或与DAO1启动子可操作地连接的任何核酸的转录。在一些实施方案中,DAO1启动子包括共有序列AGGNNGNAGN11GANGANGG(SEQ ID NO:6),其中N是任何脱氧核糖核苷酸。在其他实施方案中,DAO1启动子可以包括翻译起始位点下游的核苷酸。
如本文中RNAi的情况下使用的“dsRNA”或“RNAi分子”是指化合物,其能够下调或降低基因表达、或下调或降低这种基因的产物的活性至足以达到期望的生物学或生理学效果的程度。本文使用的术语“dsRNA”或“RNAi分子”是指dsRNA、siRNA、shRNA、ihpRNA、合成的shRNA、miRNA中的一种或多种。
术语“下调”如其指基因被本发明的RNAi方法抑制,是指与不存在这样的RNAi构建体时的水平相比,在一种或多种RNAi构建体存在时基因表达水平的降低。术语“下调”在本文中用于指示目标基因表达降低1-100%。例如,表达可以降低约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%。
“表达”是指功能性产物的产生。例如,核酸片段的表达可以指核酸片段的转录(例如,导致mRNA、功能性RNA、dsRNA等的转录)和/或将mRNA翻译成前体或成熟蛋白质。
如本文所用,“基因”是指包含与基因产物的表达相关的5'启动子区、任何内含子和外显子区以及与基因产物表达相关的3'或5'非翻译区的核酸序列。
术语“基因沉默”是指基因表达的抑制,例如转基因、异源基因和/或内源基因表达。基因沉默可以通过影响转录的过程和/或通过影响转录后机制的过程介导。基因沉默可以是等位基因特异性的,其中基因的一个等位基因发生特异性的沉默。
关于序列的“异源”是指源自外来物种的序列,或者如果来自相同物种,通过有意的人为干预从其天然形式对组成和/或基因组基因座进行实质上的修饰。
在将核酸片段(例如,重组DNA构建体)插入细胞的情况下,“引入”是指“转染”或“转化”或“转导”,并且包括指代将核酸片段并入真核或原核细胞中,其中核酸片段可以被并入细胞基因组(例如染色体、质粒、质体或线粒体DNA)、转换成自主复制子或瞬时表达(例如转染的mRNA)。
如本文所用的“内含子”是指插入、定位或位于本文所述的核酸构建体中的多核苷酸的5'末端的上游或内部的内含子。内含子可以从基因(如真菌基因)中分离,或者可以基于已知的内含子合成。
术语“可操作地连接”或“可操纵地连接”在本文中定义为这样的构型,其中调节序列或控制序列被适当地置于相对于核酸构建体的多核苷酸序列的位置,使得控制序列指导本发明的多核苷酸的表达。如本领域所熟知的,调节序列或控制序列可以置于核苷酸序列的5'侧或核苷酸序列的3'侧。
“过表达”是指转基因生物体中超过正常、对照或未转化生物体的生产水平的基因产物的产生。
术语“多核苷酸”、“核酸”和“核酸分子”在本文中可互换使用,指核苷酸的多聚体,其可以是核苷酸和/或核苷的天然或合成的线性和顺序阵列(sequential array),包括脱氧核糖核酸、核糖核酸及其衍生物。它包括染色体DNA、自我复制质粒、DNA或RNA的感染性多聚体以及主要起结构作用的DNA或RNA。除非另有说明,否则核酸或多核苷酸以5'至3'的方向从左至右书写。核苷酸以其通常接受的单字母代码表示。数字范围包括定义范围的数字。“核酸”还可以任选地含有非天然存在的或改变的核苷酸碱基,其允许通过聚合酶的正确阅读并且不减少核酸的表达。
术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,是指氨基酸残基的多聚体。该术语适用于氨基酸多聚体,其中一个或多个氨基酸残基是对应于天然存在的氨基酸的人造化学类似物,该术语也适用于天然存在的氨基酸多聚体。氨基酸可以通过其公知的三字母或单字母符号来表示。氨基酸序列分别从氨基到羧基方向从左到右书写。数字范围包括定义范围的数字。
“后代”包括真菌的任何后续世代。
“启动子”是指能够控制另一个核酸片段转录的核酸片段。
“重组”是指两个分离的序列片段的人工组合,如通过化学合成或通过遗传工程技术操作分离的核酸片段。“重组”还指包括通过引入异源核酸而被修饰的细胞或载体,或源自如此修饰的细胞的细胞,但不包括由天然发生的事件引起的细胞或载体的改变(例如自发突变、自然转化/转导/转座),例如没有有意的人为干预而发生的那些。
“重组DNA构建体”是指通常不在自然界中一起发现的核酸片段的组合。因此,重组DNA构建体可以包含衍生自不同来源的调节序列和编码序列,或衍生自相同来源的调节序列和编码序列但以不同于自然界中正常发现的方式排列。术语“重组DNA构建体”、“重组构建体”和“核酸构建体”在本文中可互换使用。
“调节序列”是指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列)的核苷酸序列,并且所述核苷酸序列影响相关编码序列的转录、RNA加工或稳定性或翻译。调节序列可以包括但不限于启动子、翻译前导序列、内含子和聚腺苷酸化识别序列。术语“调节序列”和“调节元件”在本文中可互换使用。
“转化的细胞”是其中引入了核酸片段(例如,重组DNA构建体)的任何细胞。
如本文所用的“转化”是指稳定转化和瞬时转化。
“稳定转化”是指将核酸片段引入宿主生物体的基因组中,导致遗传上地稳定遗传。一旦稳定转化,核酸片段稳定整合到宿主生物体的基因组和任何后续世代中。
如本文所用的术语“强表达”是指标记蛋白、mRNA、siRNA(小干扰RNA)或miRNA(微小RNA)表达到使用已知的检测方法(例如对于GFP和荧光素酶的荧光检测、GUS和lacZ的活性测定、Northern blot或Western blot)可检测的水平。
“瞬时转化”是指将核酸片段引入宿主生物体的细胞核或含有DNA的细胞器中,导致无遗传上地稳定遗传的基因表达。
“转基因真菌”是指包括在其基因组中包含异源多核苷酸的真菌。例如,异源多核苷酸稳定地整合到基因组内,使得多核苷酸被传递到连续的世代。异源多核苷酸可以单独或作为重组DNA构建体的一部分整合到基因组中。
如本文所用,术语“序列相同性”,“序列相似性”或“同源性”用于描述两个或更多个核苷酸序列之间的序列关系。两个序列之间“序列相同性”的百分比通过在对比窗口(比如参考的SEQ ID NO:的全长)比较两个最佳比对的序列来确定,其中与参考序列(其不包含添加或缺失)进行比较,对比窗口中的序列部分可包含添加或缺失(即空位)以达到两个序列最佳比对。通过确定两个序列中出现相同的核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以对比窗口中的总位置数目,并将结果乘以100得到序列相同性的百分比来计算百分比。与参考序列相比,在每个位置上都相同的序列被称为与参考序列相同,反之亦然。当以5'至3'方向观察时,如果第一核苷酸序列表现出完整的与第二序列或参考序列的互补性,则第一核苷酸序列被称为是在3'至5'方向上观察到的第二核苷酸序列或参考核苷酸序列的“互补体”或与之互补。如本文所用,当以5'至3'阅读序列之一的每个核苷酸与以3’至5’阅读的另一个序列的每个核苷酸互补时,所述核酸序列分子被认为具有“完全互补性”。与参考核苷酸序列互补的核苷酸序列将显示与参考核苷酸序列的反向互补序列相同的序列。这些术语和描述在本领域中被很好地定义,并且被本领域的普通技术人员容易地理解。
序列比对和相同性百分比计算可使用各种设计用于检测同源序列的对比方法来确定,所述方法包括但不限于
Figure BDA0001489370150000121
生物信息学计算套件(
Figure BDA0001489370150000125
Inc.,Madison,WI)的
Figure BDA0001489370150000122
程序。除非另有说明,否则本文提供序列的多重比对通过使用具有默认参数(空位罚分(GAP PENALTY)=10、空位长度罚分(GAP LENGTH PENALTY)=10)的Clustal V比对方法(Higgins and Sharp(1989)CABIOS.5:151 153)进行。使用Clustal V方法进行成对比对和计算蛋白质序列百分比相同性的默认参数是KTUPLE=1、空位罚分=10、窗口=5和DIAGONALS SAVED=5。对于核酸,这些参数是KTUPLE=2、空位罚分=5、窗口=4和DIAGONALS SAVED=4。在序列比对之后,使用Clustal V程序,可以通过查看同一程序中的“序列距离”表来获得“百分比相同性”和“趋异性(divergence)”值;除非另有说明,否则本文提供和要求保护的百分比相同性和趋异性以这种方式计算。
或者,可以使用Clustal W比对方法。可以在
Figure BDA0001489370150000123
生物信息学计算套件(
Figure BDA0001489370150000124
Inc.,Madison,WI)的MegAlignTM v6.1程序中找到Clustal W比对方法(在Higgins and Sharp,CABIOS.5:151-153(1989);Higgins,D.G.et al.,Comput.Appl.Biosci.8:189-191(1992)中描述)。用于多重比对的默认参数对应于空位罚分=10、空位长度罚分=10、延迟趋异序列(Delay Divergent Sequences)=30%、DNA转换权重(DNA Transition Weight)=0.5、蛋白质权重矩阵(Protein Weight Matrix)=Gonnet Series、DNA权重矩阵(DNA Weight Matrix)=IUB。对于成对比对,默认参数是比对=缓慢-精确,空位罚分=10.0,空位长度=0.10,蛋白质权重矩阵=Gonnet 250以及DNA权重矩阵=IUB。在使用Clustal W程序比对序列之后,可以通过在同一程序中查看“序列距离”表来获得“百分比相同性”和“趋异性”值。
如本文所用,关于核酸序列的术语“基本上同源”或“基本同源性”包括在严格条件下与参考的SEQ ID NO:或其部分或其互补序列杂交的核苷酸序列,是那些允许在两个序列之间发生反向平行比对的核苷酸序列,并且这两个序列之后能够在严格条件下在相反的链上的相应碱基间形成氢键以形成双链体分子,所述双链体分子在适当严格(包括高度严格)的条件下足够稳定,以使得其可以通过使用本领域公知的方法检测。基本上同源的序列与序列表所示的参考核苷酸序列或其互补序列相比可具有约70%至约80%序列相同性、或更优选约80%至约85%序列相同性、或最优选约90%至约95%序列相同性、至约99%序列相同性。或者,基本上同源的序列包括在严格条件下与植物基因内含子的靶区域杂交的序列。对于严格条件,参见本文的描述,也参见美国专利第8,455,716号和8,536,403号。
现在描述包括分离的启动子、核酸构建体、包含这些核酸构建体的组合物(例如真菌)以及利用这些核酸构建体的方法的本发明的实施方案。
分离的启动子
本发明提供了真菌物种中表达异源多核苷酸的分离的诱导型启动子:
在一个实施方案中,基于Clustal V或Clustal W比对方法,诱导型启动子包含核酸序列,其与SEQ ID NO:94相比具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列相同性。
在另一个实施方案中,基于Clustal V或Clustal W比对方法,诱导型启动子包含核酸序列,其与SEQ ID NO:95相比具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列相同性。
在另一个实施方案中,基于Clustal V或Clustal W比对方法,诱导型启动子包含核酸序列,其与SEQ ID NO:96相比具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列相同性。
在另一个实施方案中,基于Clustal V或Clustal W比对方法,诱导型启动子包含核酸序列,其与SEQ ID NO:97相比具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列相同性。
在另一个实施方案中,基于Clustal V或Clustal W比对方法,诱导型启动子包含核酸序列,其与SEQ ID NO:5相比具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列相同性。
在另一个实施方案中,诱导型启动子包含核苷酸序列,其中所述核苷酸序列在严格条件下可与包含SEQ ID NO:94、95、96、97或5的全互补序列的DNA分子杂交。
术语“在严格条件下”是指两个序列在中等或高度严格的条件下杂交。更具体地说,本领域普通技术人员可容易地确定中等严格条件,例如根据DNA的长度。Sambrook等人,Molecular Cloning:A Laboratory Manual,third edition,chapters 6and 7,ColdSpring Harbor Laboratory Press,2001中列出了基本条件,并包括使用5×SSC、0.5%SDS、1.0mM EDTA(pH8.0)的硝酸纤维素滤膜预洗溶液,在约40-50℃的约50%甲酰胺、2×SSC至6×SSC的杂交条件(或其他相似的杂交溶液,例如Stark's溶液,在约42℃的约50%甲酰胺中),以及例如约40-60℃、0.5-6×SSC、0.1%SDS的洗涤条件。优选地,中度严格条件包括在约50℃和6xSSC下杂交(和洗涤)。高度严格的条件也可以由本领域技术人员容易地确定,例如取决于DNA的长度。
通常,与中等严格的条件相比,这样的条件包括在较高温度和/或较低盐浓度(例如在约65℃、6×SSC至0.2×SSC,优选6×SSC、更优选2×SSC、最优选0.2×SSC下杂交)下杂交和/或洗涤。例如,高度严格的条件可以包括如上定义的杂交,并在约65-68℃、0.2xSSC、0.1%SDS中洗涤。在杂交和洗涤缓冲液中,SSPE(1xSSPE是0.15M NaCl、10mM NaH2PO4和1.25mM EDTA,pH7.4)可以代替SSC(1×SSC是0.15M NaCl和15mM柠檬酸钠);在杂交结束后,洗涤15分钟。
也可以使用非放射性物质作为探针的市售杂交试剂盒。具体实例包括与ECL直接标记和检测系统(Amersham)杂交。严格条件包括例如使用试剂盒中包括的杂交缓冲液在42℃下杂交4小时,所述杂交缓冲液补充有5%(w/v)封闭试剂和0.5M NaCl,并在55℃下用0.4%SDS、0.5×SSC洗涤两次各20分钟,在室温下用2×SSC洗涤一次5分钟。
在另一个实施方案中,诱导型启动子包含核苷酸序列,其中所述核苷酸序列衍生自SEQ ID NO:94、95、96、97或5,通过选自以下组成的组中的至少一种方法改变一个或多个核苷酸:缺失、取代、添加和插入。
在一些实施方案中,每种上述诱导型启动子包含DNA基序,在本文中有时称为启动子DNA基序。在一个实施方案中,启动子DNA基序包含共有序列AGGNNGNAGN11GANGANGG(SEQID NO:6)。在另一个实施方案中,启动子DNA基序与共有序列的特别确定的核苷酸(即特定的A和G)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的相同性。在一些实施方案中,诱导型启动子可被D-氨基酸诱导。在其他实施方案中,D-氨基酸是D-丙氨酸、D-苏氨酸、D-丝氨酸、D-缬氨酸或D-脯氨酸。
基于使用算法或计算机程序和本领域技术人员熟知的这些技术的核苷酸比对,基因组和核苷酸数据库的数据库检索和同源性检索可用于鉴定相似的诱导型启动子。
核酸构建体:
在一个方面,本发明提供了核酸构建体。
在一个实施方案中,核酸构建体包含可操作地连接至异源多核苷酸的如本文所述的诱导型启动子。在另一个实施方案中,多核苷酸可操作地连接至转录终止子。在另一个实施方案中,转录终止子在真菌物种中是可操作的。蛋白质编码基因的转录终止子通常位于基因的下游(3'),在终止密码子(TGA、TAG或TAA)之后。转录终止子在RNA的加工和稳定以及翻译中起着重要的作用。大多数(但不是全部)转录终止子含有聚腺苷酸化序列或切割位点。
在一些实施方案中,核酸构建体含有富含CT的核苷酸序列。在一个实施方案中,富含CT的核苷酸序列与共有序列T(T/C)TCCC(T/C)CTCC(T/C)CCCCAC(A/T)(C/T)CCGA(SEQ IDNO:7)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的相同性。
在一些实施方案中,富含CT的核苷酸序列是内含子。内含子可以是分离的或衍生自基因,如真菌基因,或者可以基于已知的内含子合成。在一些实施方案中,内含子是DAO1基因的内含子1。在一个实施方案中,DAO1基因是真菌DAO1基因。在一些实施方案中,内含子包含DNA基序,在本文中有时称为内含子DNA基序。在一个实施方案中,内含子DNA基序与共有序列T(T/C)TCCC(T/C)CTCC(T/C)CCCCAC(A/T)(C/T)CCGA(SEQ ID NO:7)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的相同性。
在一个实施方案中,内含子插入、定位或位于核酸构建体中多核苷酸的5'末端的上游或内部。在一些实施方案中,内含子的5'末端可操作地连接至诱导型启动子并且其3'末端可操作地连接至异源多核苷酸。在另一个实施方案中,内含子定位于异源多核苷酸的5'末端或5'区域内。在另一个实施方案中,内含子被插入到诱导型启动子的5'UTR中。
在一些实施方案中,富含CT的核苷酸序列可以跨越内含子和诱导型启动子的核苷酸和/或围绕内含子的异源多核苷酸。
在其他实施方案中,富含CT的核苷酸序列被包含在核酸构建体中的多核苷酸的编码序列内。在一个实施方案中,包含在编码序列内的富含CT的核苷酸序列与与共有序列T(T/C)TCCC(T/C)CTCC(T/C)CCCCAC(A/T)(C/T)CCGA(SEQ ID NO:7)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的相同性。
在一些实施方案中,异源多核苷酸编码感兴趣的蛋白。感兴趣的蛋白的实例包括但不限于抗生素抗性酶、除草剂抗性酶、GFP、GUS、lacZ、萜烯合酶、脂肪酸去饱和酶、P450细胞色素氧化酶、葡聚糖酶、木聚糖酶、甘露聚糖酶、甘露糖苷酶、葡糖苷酶、葡甘露聚糖酶(glucomannanase)、xyluglucanase、羟甲基戊二酰辅酶A合酶、羟甲基戊二酰辅酶A还原酶、乙酰辅酶A C-乙酰转移酶、甲羟戊酸激酶、磷酸甲羟戊酸激酶、二磷酸甲羟戊酸脱羧酶、异戊二烯基二磷酸δ-异构酶、法呢基焦磷酸合酶、牻牛儿基牻牛儿基焦磷酸合酶(geranylgeranyl diphosphate synthase)、甲基转移酶或葡糖基转移酶、β-类胡萝卜素羟化酶和β-类胡萝卜素氧化酶。
在其他实施方案中,异源多核苷酸编码用于下调感兴趣的靶基因的RNA分子。感兴趣的靶基因的下调可以通过使用众所周知的技术,包括但不限于RNAi技术如dsRNA、miRNA、siRNA、smRNA、hpRNA或ihpRNA(统称为RNAi分子)、有义抑制(共抑制)、反义等。这些技术在美国专利第7,312,323号和其中引用的参考文献中描述。例如,可以通过例如转化真菌宿主细胞以包含本文所述的启动子和其他5'和/或3'调节区来实现还原,所述调节区与反义核苷酸序列、发夹、RNA干扰分子、双链RNA、微小RNA或其它核酸分子连接,使得分子的组织优选表达干扰天然DNA序列的mRNA翻译或抑制天然DNA序列在植物细胞中的表达。为了进一步描述RNAi技术或微小RNA技术,参见例如美国专利第5,034,323、6,326,527、6,452,067、6,573,099、6753139、和6,777,588号。也参见国际公开号WO97/01952、WO 98/36083、WO 98/53083、WO 99/32619和WO 01/75164;和美国专利申请公开号2003/0175965、2003/0175783、2003/0180945、2004/0214330、2005/0244858、2005/0277610、2006/0130176、2007/0265220、2008/0313773、2009/0094711、2009/0215860、2009/0308041、20/0058498和2011/0091975。本领域技术人员可以使用本领域众所周知的技术制备RNAi分子或微小RNA分子(本文统称为RNAi分子),所述技术包括用于选择和测试RNAi分子和微小RNA分子的技术,所述RNAi分子和微小RNA分子可用于下调本发明的多核苷酸,参见,例如,Wesley等人(2001)、Mysara等人(2011)和Yan等人(2012年)。
例如,可以制备核酸构建体,其包括转录成可以与其自身退火的RNA的多核苷酸,例如具有茎环结构的双链RNA。在一些实施方案中,双链RNA的茎部分的一条链包含与靶基因的有义编码序列或其片段相似或相同的序列,并且其长度为约10个核苷酸至约1,800个核苷酸。与有义编码序列相似或相同的序列的长度可以是10个核苷酸至1000个核苷酸、15个核苷酸至600个核苷酸、20个核苷酸至500个核苷酸、或者25个核苷酸至100个核苷酸、或者在10个核苷酸至2,500个核苷酸以内的任何长度。双链RNA的茎部分的另一条链包含与靶基因的编码序列的反义链或其片段相似或相同的序列,并且其长度可短于、相同或长于对应的有义序列的长度。在一些情况下,双链RNA的茎部分的一条链包含与靶基因的mRNA的3'或5'非翻译区或其片段相似或相同的序列,并且双链RNA的茎部分的另一条链包含与靶基因的mRNA的3'或5'非翻译区或其片段互补的序列相似或相同的序列。在其他实施方案中,双链RNA的茎部分的一条链包含与从靶基因转录的前体mRNA(pre-mRNA)中的内含子或其片段的序列相似或相同的序列,并且茎部分的另一条链包含与前体mRNA中的内含子或其片段的序列互补的序列相似或相同的序列。
双链RNA的环部分可以是3个核苷酸至5,000个核苷酸,例如3个核苷酸至2500个核苷酸、15个核苷酸至1,000个核苷酸、20个核苷酸至500个核苷酸、或者25个核苷酸至200个核苷酸或在3个核苷酸至5,000个核苷酸以内的任何长度。RNA的环部分可包括内含子或其片段。双链RNA可具有0、1、2、3、4、5、6、7、8、9、10个或更多的茎环结构。
核酸构建体可包括本领域众所周知的其他转录调节区。
在一些实施方案中,核酸构建体还包含可选择标记(selectable marker)。对于本领域技术人员来说,可选择标记是众所周知的将这种可选择标记整合入核酸构建体并用启动子驱动其表达,如国际专利申请公开号WO2012/169969中所述。可操作地连接于任何合适的可选择标记的任何合适的启动子可用于本发明中。在一些实施方案中,与可选择标记一起使用的合适的启动子的实例包括但不限于编码以下蛋白质的以下基因的启动子:甘油醛-3-磷酸脱氢酶(GPD)、乙酰辅酶A载体蛋白(ACP)、脂肪酸去饱和酶、翻译延伸因子(TEF)、丙酮酸脱羧酶(PDC)、烯醇化酶(2-磷酸甘油酸脱水酶)(ENO),肽基脯氨酰异构酶(PPI),乙酰辅酶A羧化酶(ACC)或转醛醇酶。
在一个实施方案中,可选择标记的编码序列是天然存在的或人造的并且含有至少约60%的GC。在第二实施方案中,可选择标记的编码序列是天然存在的或人造的并且含有约70%的GC。在第三实施方案中,可选择标记的编码序列是天然存在的或人造的并含有约75%的GC。在一个实施方案中,至少约70%的这样的编码序列的密码子三联体以C或G结尾。在另一个实施方案中,多于约80%的这样的编码序列的密码子三联体以C或G结尾。在一个实施方案中,可选择标记的编码序列含有至少60%的GC、优选约70%的GC、最优选约75%的GC,其中至少70%的密码子三联体以C或G结尾、优选80%以上的密码子三联体以C或G结尾。在一个实施方案中,这样的编码序列由占总丝氨酸(Ser)残基的至少约40%的UCG密码子组成。
在一些实施方案中,可选择标记是无重组标记系统的一部分。在一个实施方案中,无重组标记系统是Cre-lox无重组标记系统,如Zuo等人(2001年)描述的。这样的系统可用于产生无可选择标记的转基因植物,包括转基因麻风树属的植物。在一些实施方案中,无重组标记系统位于植物可操作启动子和一个或多个核酸片段之间。在该实施方案中,通过重组事件去除标记基因将植物可操作启动子与如本文所述的一或多个核酸片段可操作地连接。
在制备核酸构建体时,可以操作各种DNA片段,以便提供正确方向的DNA序列,并酌情提供合适的阅读框。为此目的,可以使用衔接子或接头来连接DNA片段,或者可以涉及其他操作以提供方便的限制性位点、去除多余的DNA、去除限制性位点等。为此目的,可能涉及体外诱变、引物修复、限制(restriction)、退火、再取代,例如转换和颠换。
本发明的核酸也可以通过本领域已知的方法完全或部分合成,特别是在希望提供植物优选序列的情况下。因此,本发明的核酸的全部或一部分可使用所选定宿主的优选的密码子来合成。物种优选密码子可以例如由在特定宿主物种中表达的蛋白质中最常使用的密码子来确定。核苷酸序列的其他修饰可导致具有轻微改变的活性的突变体。
另一方面,本发明提供了包含本文所述的核酸构建体的真菌细胞。在一个实施方案中,真菌细胞是红冬孢酵母属的物种的细胞。在另一个实施方案中,真菌细胞是红酵母属的物种的细胞。在一些实施方案中,核酸构建体稳定整合到真菌细胞的基因组中。在其他实施方案中,真菌细胞是也包含培养基的组合物的一部分。
可以使用诸如电穿孔、DNA粒子轰击等技术将一或多个核酸构建体直接引入真菌细胞中。或者,可以将核酸构建体与合适的T-DNA侧翼区组合并引入根瘤土壤杆菌(Agrobacterium tumefaciens)宿主中,其将基因盒转运到真菌基因组中。因此,可以使用任何提供真菌的有效转化/转染的方法。参见例如美国专利第7,241,937、7,273,966和7,291,765号以及美国专利申请公开号2007/0231905和2008/0010704以及其中引用的参考文献。也参见国际公开申请号WO 2005/103271和WO 2008/094127以及其中引用的参考文献。
为了回收没有任何位置效应的真菌,用任何重组构建体产生许多单独转化的真菌可能是有用的。也可优选选择含有一个以上拷贝的导入核酸构建体的真菌,从而获得高水平的多核苷酸表达。
如果可能,在特定物种中产生对于特定基因是纯合的真菌系可能是期望的。在一些物种中,这是通过使用单孢菌培养物来完成的。通过使用这些技术,可以产生携带插入的基因的单倍体细胞系,然后自发地或通过使用秋水仙碱使染色体数目翻倍。这产生了插入基因纯合的真菌,如果插入的基因带有用于检测携带该基因的真菌的合适的可选择标记基因,则可以容易地测定该插入基因。或者,真菌可以自体受精,导致在最简单的情况下产生由三种类型组成的孢子混合物,三种类型为对于插入的基因的纯合子(25%)、杂合子(50%)和无效子(25%)。尽管从含有该基因的真菌中评分无效真菌相对比较容易,但实际上可以通过DNA印记分析对来自杂合真菌的纯合子进行评分,其中需仔细注意加载完全等量的来自混合的群体中DNA,并通过插入基因的特异性探针的信号强度对杂合体进行评分。建议通过允许每个独立的转化体自体受精来验证DNA印记分析的结果,因为通过简单的事实可以获得纯合性的额外证据,即如果真菌对插入的基因是纯合的,则所有来自自交个体的随后的真菌系将包含该基因,而如果该真菌对于该基因是杂合的,那么从自交种生长的世代将包含无效真菌系。因此,简单的自交可选择纯合真菌系,其也可通过DNA印记分析确认。
另一方面,本发明提供了制备和使用包含本文所述的核酸构建体的真菌物种的方法。在一个实施方案中,制备真菌物种的方法包括将本文所述的核酸构建体引入真菌细胞中,并选择核酸构建体稳定整合到其基因组中的真菌细胞。在另一个实施方案中,使用真菌物种的方法包括在含有D-氨基酸的培养基中培养包含本文所述的核酸构建体的真菌物种。在一些实施方案中,D-氨基酸是D-丙氨酸、D-苏氨酸、D-丝氨酸、D-缬氨酸或D-脯氨酸。
在一些实施方案中,将转化的真菌转移到标准生长培养基(例如固体或液体营养培养基、谷物、蛭石、堆肥、泥炭、木材、木屑、稻草等)中并以技术人员已知的方式生长或培养。在一个实施方案中,培养基是minAB培养基或经过修饰以省略碳源和NH4NO3的minAB培养基。在其他实施方案中,核酸构建体的多核苷酸的表达由生长培养基中存在的D-氨基酸诱导。在一个实施方案中,在培养转化的真菌之前将D-氨基酸添加到培养基中。在另一个实施方案中,在将转化的真菌加入到培养基中之后将D-氨基酸添加到培养基中。在一些实施方案中,培养基中D-氨基酸的量为约0.1mM至约100mM、优选约1.0mM至约70mM、更优选约1.0mM至约20mM。
在一个实施方案中,使用传统的真菌培养基来培养转化的真菌,其中培养基已经被修饰成不含或含有少量不同于D-氨基酸的碳源。在另一个实施方案中,使用传统的真菌培养基来培养转化的真菌,其中培养基已被修饰为不含或含有少量不同于D-氨基酸的氮源。在一些实施方案中,细胞培养优选在25℃至35℃进行。
在一个实施方案中,将DAO1诱导型构建体引入具有降低的或不具有(零)D-氨基酸氧化酶活性的酵母菌株中。
除非另有说明,否则本发明的实践采用了本领域技术范围内的化学、分子生物学、微生物学、重组DNA、遗传学、免疫学、细胞生物学、细胞培养和转基因生物学的常规技术。参见例如Maniatis等人,1982,MolecularCloning(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York);Sambrook等人,1989,Molecular Cloning,2nd Ed.(ColdSpring Harbor Laboratory Press,Cold Spring Harbor,New York);Sambrook andRussell,2001,Molecular Cloning,3rd Ed.(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York);Ausubel等人,1992),Current Protocols in MolecularBiology(John Wiley&Sons,including periodic updates);Glover,1985,DNA Cloning(IRL Press,Oxford);Russell,1984,Molecular biology of plants:a laboratorycourse manual(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.);Anand,Techniques for the Analysis of Complex Genomes,(Academic Press,NewYork,1992);Guthrie and Fink,Guide to Yeast Genetics and Molecular Biology(Academic Press,New York,1991);Harlow and Lane,1988,Antibodies,(Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New York);Nucleic AcidHybridization(B.D.Hames&S.J.Higgins eds.1984);Transcription And Translation(B.D.Hames&S.J.Higgins eds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,APractical Guide To Molecular Cloning(1984);the treatise,Methods In Enzymology(Academic Press,Inc.,N.Y.);Methods In Enzymology,Vols.154and 155(Wu等人eds.),Immunochemical Methods In Cell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes I-IV(D.M.Weir and C.C.Blackwell,eds.,1986);Riott,Essential Immunology,6thEdition,Blackwell Scientific Publications,Oxford,1988;Fire 等人,RNAInterference Technology:From Basic Science to Drug Development,CambridgeUniversity Press,Cambridge,2005;Schepers,RNA Interference in Practice,Wiley–VCH,2005;Engelke,RNA Interference(RNAi):The Nuts&Bolts of siRNA Technology,DNAPress,2003;Gott,RNAInterference,Editing,and Modification:Methods andProtocols(Methods in Molecular Biology),Human Press,Totowa,NJ,2004;Sohail,Gene Silencing by RNAInterference:Technology and Application,CRC,2004。
实施例
通过参考以下实施例来描述本发明,这些实施例是以说明的方式提供的,而不是以任何方式限制本发明。使用本领域公知的标准技术或下面具体描述的技术。
实施例1
菌株、培养基和培养条件
类酵母红冬孢菌株ATCC 10657得自ATCC(美国)。禾本红酵母(Rhodotorulagraminis)WP1得自真菌品种保藏中心(Fungal Genetics Stock Center,University ofMissouri,美国)。在28℃下在YPD液体培养基(1%酵母提取物、2%蛋白胨、2%葡萄糖,w/v)或马铃薯-葡萄糖琼脂(PDA)中培养类酵母红冬孢。根瘤土壤杆菌(A.tumefaciens)菌株AGL1(26)或AGL2(27)用作T-DNA的供体,并在28℃下在液体或固体2YT培养基(1.6%胰蛋白胨、1%酵母提取物、0.5%NaCl)中培养。在Luria-Bertani(LB)液体培养基或LB琼脂上培养大肠杆菌XL1-Blue,并将大肠杆菌XL1-Blue用于常规DNA操作。
对于基因诱导研究,使用省略了碳源和氮源(NH4NO3)的经修饰的MinAB(28)作为基础培养基。根据需要补充碳源(10g/L葡萄糖、70mM L-丙氨酸或D-丙氨酸)和氮源(70mM硫酸铵、L-丙氨酸或D-丙氨酸)。对于应激处理,将YPD液体培养基用作基础培养基,并在补充各种化学品之后或在苛刻的条件下培养。除非另有说明,细胞培养在28℃和250rpm的旋转振荡器中进行。
实施例2
质粒构建体
所用的寡核苷酸列于表1中。所有的限制酶和修饰酶均得自New England Biolabs(NEB,Massachusetts,美国)。
表1
寡核苷酸序列
Figure BDA0001489370150000231
Figure BDA0001489370150000241
Figure BDA0001489370150000251
*小写和斜体的序列表示所用限制酶的识别位点(标记在括号中)。
质粒pKC1是由潮霉素抗性盒(PGPD1-3::hpt-3::Tsv40)和GFP报告盒(PGPD1::RtGFP::35T)组成的pPZP200衍生物(29),其中PGPD1-3和PGPD1分别是禾本红酵母WP1和类酵母红冬孢ATCC 10657的甘油醛3-磷酸脱氢酶启动子(GenBank登记号分别为JQ806386和JN208861)(30);hpt-3(GenBank登记号JQ806387)和RtGFP(GenBank登记号JQ806388)分别是编码潮霉素磷酸转移酶(Hpt)和eGFP的密码子优化的基因(30);Tsv40和T35s分别是猿猴病毒40和花椰菜花叶病毒35S基因的终止子(图2A)。
质粒pKCL2衍生自pKC1,其中RtGFP报告基因被编码北美萤火虫(Photinuspyralis)萤光素酶(GenBank登记号ACH53166)的合成密码子优化的萤光素酶报告基因RtLUC-2替代。衍生自DAO1编码序列的上游区域的2.0kb SpeI-NcoI DNA片段通过使用类酵母红冬孢基因组DNA和寡核苷酸Rt290Sf和Rt309Nr的模板(表1)进行PCR扩增而获得。将PCR产物用SpeI-NcoI双重消化并与SpeI-NcoI-线性化的pKCL2载体连接以产生质粒pKCLD1(图2B)。
使用相同的模板和寡核苷酸Rt290Sf和Rt287Nr扩增DAO1的含内含子的启动子(PDAO1in,2.2kb)。PDAO1in含有前40nt的Dao1编码序列的外显子1、108nt的内含子1和前6nt的外显子2,给该启动子表达的任何蛋白质产生了额外的16个氨基酸(MHSQKRVVVLGSGVIA;SEQID NO:86)残基。由于引入了用于克隆感兴趣的基因的NcoI位点,因此将第17个残基(G17)的最后一个氨基酸改变为丙氨酸(图2C)。经SpeI-NcoI处理的PDAO1in的PCR产物与经类似消化的pKCL2载体连接以产生质粒pKCLD2。
为了制备基序1缺失的突变启动子(PDAO1int,2.2kb,图5A和图6A),进行了与DAO1共有基序1相邻的上游和下游DNA序列的融合PCR。以pKCLD2为模板和寡核苷酸对SFGFPSEQ/Rt312扩增上游序列,而下游DNA序列以Rt311/35STer为引物。随后,如前所述,使用寡核苷酸Rt290Sf和Rt287Nr通过PCR融合两个PCR片段(31)。所得的2.2kb PCR产物用SpeI-NcoI消化并与类似消化的pKCL2载体连接以产生质粒pKCLD3。
无启动子的RtLUC-2阴性对照载体pKCL20通过SpeI-NcoI切割和平端的pKCL2载体的自我连接来制备。为了构建连续截短的启动子报告质粒,使用pKCLD2作为模板,使用Rt287Nr作为反向引物和使用Rt315S、Rt314S、Rt120S、Rt313S和Rt117S分别作为正向引物来扩增1.7kb、1.2kb、1.0kb、0.7kb和0.4kb的PDAO1in。如上所述处理PCR产物以构建质粒pKCLD4至pKCLD8,其分别含有约1.7kb、1.2kb、1.0kb、0.7kb和0.4kb的PDAO1in启动子(图5A)。
PDAO1int2是含有0.7kb内含子1的PDAO1的突变体,其原始翻译起始密码子通过寡核苷酸定向的位点诱变变为ATC。PDAO1int3是通过将PDAO1in2的基序2中的所有胞嘧啶残基转化为腺嘌呤制备的,而PDAO1int4是缺失24nt基序2的突变体。所有的突变都是通过两步融合PCR来完成的。使用质粒pKCLD7作为DAO1启动子片段的PCR模板。对于启动子PDAO1int2,使用寡核苷酸对SFGFPSEQ/Rt327r和Rt328f/LUC2U分别制备0.8kb和0.4kb的DNA片段。使用Rt313S和Rt287Nr寡核苷酸进行上述DNA片段的融合PCR,所得0.7kb PCR产物用SpeI-NcoI消化并与SpeI-NcoI-线性化的pKCL2载体连接以产生质粒pKCLD71。
类似地,将寡核苷酸对SFGFPSEQ/Rt329r和Rt330f/LUC2U分别用于扩增PDAO1int3的0.8kb上游和0.3kb下游DNA片段。并且寡核苷酸对SFGFPSEQ/Rt329r和Rt331f/LUC2U分别用于PDAO1int4的0.8kb上游和0.3kb下游DNA片段。使用与pKCLD71相同的融合PCR和质粒构建步骤产生质粒pKCLD72和pKCLD73。
实施例3
启动子活性的分析
通过电穿孔(2.5kV,25μF,400Ω)将T-DNA构建体转化到土壤杆菌细胞中,并在补充有链霉素(100μg/ml)的2YT琼脂培养基上进行选择。对类酵母红冬孢进行如前所述根瘤土壤杆菌介导的转化(ATMT)(30)。为了避免位置效应,使用KU70突变株(Ku70e)将所有构建体敲入CAR2基因座(7),其通过选择白化转化体方便地完成(图2C)。
将用PDAOinx::RtLUC2盒转化的酵母菌株在YPD液体培养基内培养至指数中期。将细胞水洗两次并重悬于MinAB,加70mM的D-丙氨酸或L-丙氨酸至在600nm(OD600)的细胞光密度为0.5,并在30℃、250rpm继续培养21小时。收集细胞,洗涤并重悬于补充有1mM DTT、3mMβ-巯基乙醇和1mM PMSF(pH7.4)的PBS缓冲液中补充等体积的0.5mm玻璃珠(Sigma-Aldrich,美国),并用FastPrep 24TM 5G(MP Biomedicals,Irvine,CA,美国)裂解40秒。蛋白质浓度和荧光素酶活性分别使用Bradford方法和市售萤光素酶测定试剂盒(Promega,美国)在供应商方案下测定。使用与iCycler软件(版本3.0,Tecan,Salzburg,Austria)联合使用的Infinite M200平板读数器测量和获取所有数据。所有实验均进行生物学和统计学三次重复。为了测定相对启动子活性(RPA),将发光值减去空白或阴性对照(无启动子的菌株),对蛋白质浓度归一化,然后对PGPD1的值或最大读数归一化。
实施例4
提取基因组DNA和总RNA
使用MasterPure-Yeast DNA和RNA纯化试剂盒(Epicentre,新加坡)分别提取来自类酵母红冬孢的基因组DNA。用
Figure BDA0001489370150000271
ND-1000分光光度计(NanodropTechnologies,Wilmington,美国)测定DNA或RNA样品的浓度,并通过琼脂糖凝胶电泳检查提取的核酸的完整性。
实施例5
DNA印记分析
对于DNA印记分析,用PstI消化基因组DNA(10μg),并在0.8%琼脂糖凝胶中电泳分离。根据生产商的说明书使用DIG High Prime DNA Labeling and Detection Starter试剂盒(Roche Diagnostics,Indiana,美国)进行Southern杂交,并且DIG标记的探针是使用寡核苷酸HptRU和HptRSL2扩增的hpt-3的部分DNA片段(表1)。
实施例6
定量逆转录PCR(qRT-PCR)
用DNase I(Roche Diagnostics)处理全部RNA并通过乙醇沉淀回收以除去痕量DNA。使用用于逆转录的iScriptTM Reverse Transcription Supermix(Bio-Rad,美国)合成cDNA,并使用ABI
Figure BDA0001489370150000272
Select Master Mix(Life Technologies,美国)在ABI PRISM7900HT Sequence Detection System(Life Technologies,美国)中进行实时PCR。PCR条件如下:初始50℃2分钟,95℃变性10分钟,然后进行40个循环的95℃变性15秒、60℃退火1分钟。所有qRT-PCR分析均进行三次重复。使用软件SDS 2.4(Applied Biosystems,LifeTechnologies,美国)获得数据,并针对参考基因ACT1(核苷酸序列:SEQ ID NO:89;氨基酸序列:SEQ ID NO:90)通过2-ΔΔCt方法计算相对基因表达,并通过RQ Manager softwarev1.2.1(Applied Biosystems,美国)进行。
实施例7
类酵母红冬孢ATCC 10657中DAO1的鉴定
通过GenBank登记号DM380716和Z71657获得来自红酵母属的物种的两个DAO1序列(32),并且通过在NCBI的BLASTn检索来鉴定它们在粘红酵母ATCC 204091中的同源物。目标菌株中的DAO1基因(Gen Bank登记号EGU13479.1)位于测序支架(sequencing scaffold)#23上。为了达到全长cDNA序列,进行5'和3'cDNA末端快速扩增(RACE)并获得两个大约0.5kb的cDNA片段(数据未显示)。使用寡核苷酸对Rt332f和Rt333r(表1),通过RT-PCR成功扩增DAO1的全长cDNA(数据未显示)。1183nt的全长mRNA转录物含有1107nt开放读码框(ORF)、29nt 5'UTR(非翻译区)和47nt3'UTR。ORF富含GC,GC含量为63.0%。cDNA和基因组序列之间的比较显示由5个内含子分隔6个外显子(图2A)。所有剪接接口和推定的分支点序列与其他真菌高度相似。368-aa蛋白质含有保守的DAO基序(pfam01266,E-value=4.2E-27),与其他物种的DAAO具有高度同源性,与类酵母红冬孢ATCC 26217的相同性最高(UniProtKB/Swiss-Prot登记号P80324.1,94%相同性)(数据未显示)。
基于BLAST检索,鉴定了来自柄锈菌亚门和黑粉菌亚门的几种推定的Dao1编码基因,并手动注释了它们的mRNA剪接模式。该基因含有4-7个内含子,尽管玉蜀黍黑粉菌的推定DAO基因不含内含子,而玉米丝黑穗病菌同源物含有2个短内含子(图3A)。无根系统发育树分析表明,来自柄锈菌亚门的Dao1可被分为两个进化枝:红冬孢酵母属/红酵母属和掷孢酵母(Sporobolomyces reseus)聚在一个进化枝上,而柄锈菌属(Puccinia)成员和杨松栅锈菌(Melampsora laricis-populina)聚在另一个进化枝上。那些黑粉菌亚门成员,更与第一进化支的那些相关(图3B)。
实施例8
DAO1的拷贝数及其mRNA转录物
当用HindIII或PstI消化时,DNA印记分析显示了一个单一条带,证实在类酵母红冬孢基因组中编码单一DAO1基因(图4A)。为了研究DAO1基因表达的调节,使用肌动蛋白mRNA(ACT1)作为参考,通过qRT-PCR定量在补充有D-丙氨酸或L-丙氨酸水平的YPD培养基中培养的细胞中的mRNA水平。正如所预期的,当补充有L-丙氨酸或硫酸铵作为唯一氮源的MinAB培养基中培养细胞时,DAO1mRNA表达是可以忽略的(图4B)。值得注意的是,如果在70mM D-丙氨酸存在下培养,mRNA水平增加12-18倍,且如果葡萄糖和硫酸铵都在培养基中省略,则在D-丙氨酸补充后6小时,mRNA水平与对照培养基相比增加到~100倍(图4B)。这些结果证实DAO1转录的转录是由D-丙氨酸特异性诱导的,并且额外碳源的存在强烈地抑制了诱导。在各种应激刺激下培养的细胞的qRT-PCR显示,所测试的所有应激刺激都显著抑制了DAO1的转录,而与葡萄糖相比,甘油作为唯一碳源似乎增强DAO1转录(图4C)。
实施例9
DAO1启动子中潜在的顺式作用元件的鉴定
为了理解DAO1转录的调节,将几种来自担子菌真菌的DAO1基因的上游序列(~1.0kb)送至MEME server(http://meme.nbcr.net/meme/)以寻找潜在的用于基因调节的顺式作用原件。结果显示了三个保守的基序。基序1具有AGGNNGNAGN11GANGANGG(SEQ ID NO:6)的共有序列,其位于与转录起始最接近的位置(图5A和5C)。
实施例10
DAO1启动子的荧光素酶报告基因测定
为了研究内含子1和基序1对DAO1转录的影响,使用DAO1启动子的几个突变体用于驱动LUC-2的表达,LUC-2是由Genescript根据红冬孢酵母属和红酵母属的密码子偏好合成的萤光素酶基因。特别地,将通过对启动子的两个分裂的PCR片段进行融合PCR制备的2.2kb基序1缺陷突变启动子PDAO1int、2.0kb无内含子启动子(PDAO1)和2.2kb含内含子1的启动子(PDAO1in)分别克隆到pKCL2中。报告基因盒(图6A)被整合到CAR2基因座中以避免位置效应。由于CAR2编码双功能酶八氢番茄红素合成酶和番茄红素环化酶,其功能性地参与类酵母红冬孢中类胡萝卜素的生物合成,因此可以通过失去红色类胡萝卜素色素容易地鉴定具有敲入LUC-2报告基因盒的菌株(7)。使用DNA印记分析来进一步验证所用的敲入菌株。将细胞在补充了D-丙氨酸或L-丙氨酸的MinAB培养基中培养21小时。结果表明,当使用D-丙氨酸作为诱导剂时,含有内含子的1PDAO1in启动子比不含内含子的PDAO1强约5倍。此外,基序1缺陷的PDAO1int突变体显示对启动子活性的严重去抑制,因为以L-丙氨酸作为唯一碳源和氮源的MinAB培养基显示出高得多的萤光素酶表达水平(图6B)。这些数据证实,内含子1和基序1在通过D-丙氨酸调节的DAO1转录中起重要作用。
为了进一步表征DAO1启动子,进行了2kb PDAO1in的巢式缺失(图6A和实施例2)。当使用D-丙氨酸作为诱导剂时,1.7kb和0.7kb的版本似乎具有略微增加的活性。然而,0.4kb片段看似是最好的启动子,因为它表现出与2.2kb版本类似的活性,同时在含L-丙氨酸的培养基中保持最低的基础活性(图6C)。因此,含有0.7kb和0.4kb内含子1的片段是用作D-丙氨酸诱导型基因表达系统启动子的最优选的片段。
实施例11
培养基碳源和氮源对DAO1启动子活性的影响
为了研究碳源和氮源对启动子活性的影响,将在CAR2基因座敲入的含有2.2kb内含子1的DAO1启动子(PDAO1in)的3个菌株在改良的MinAB培养基中培养,其中葡萄糖和硫酸铵在必要时补充到基础培养基MinAB中。仅在补充有70mM D-丙氨酸的MinAB中观察到最佳的荧光素酶表达。当培养21小时后加入相同水平的L-丙氨酸作为竞争物时,表达降低约5倍(图7A)。单独的硫酸铵(70mM)几乎没有影响,而10g/L的葡萄糖使活性降低一半。引人注目的是,葡萄糖(10g/L)和硫酸铵(70mM)二者的补充导致DAO1in启动子活性的显著抑制。尽管高浓度的D-丙氨酸继续增强活性,但低至20mM的D-丙氨酸有效驱动报告基因的表达(图7B)。葡萄糖(10-100g/L)和硫酸铵(5-50mM)的浓度仅显示边际效应(图7C和7D)。
实施例12
使用不同的D-氨基酸作为诱导剂
先前已经报道,纤细红酵母(Rhodotorula gracilis)D-氨基酸氧化酶显示出对几种中性D-氨基酸的高底物亲和性(33)。在这里,研究了2.2kb DAO1启动子(PDAO1in)报告基因菌株对不同D-氨基酸的诱导性的底物选择性。在补充有70mM的D-氨基酸作为唯一碳源和氮源的MinAB中培养的细胞的萤光素酶测定显示该启动子最优选由D-丙氨酸诱导,因为其具有最佳的强度和最低的背景表达,虽然D-苏氨酸、D-丝氨酸、D-缬氨酸和D-脯氨酸同样有效。其他D-氨基酸如D-亮氨酸、D-苯丙氨酸、D-色氨酸和D-蛋氨酸的效力明显较低(图8)。
实施例13
DAO1基因内含子1中的顺式作用元件的鉴定
由于内含子1强烈地增强启动子活性(图6B),我们试图鉴定针对这种活性的顺式作用元件。在MEME server上对几种红冬孢酵母属/红酵母属的物种的DAO1基因的内含子1序列的针对顺式作用元件的分析显示出保守的富含CT的基序(图9A),其具有共有序列T(T/C)TCCC(T/C)CTCC(T/C)CCCCAC(A/T)(C/T)CCGA(SEQ ID NO:7)且被命名为基序2(图9B)。在GPD1启动子中发现了类似的基序,且已知它是真菌中重要的顺式作用元件(30)。为了证明这个基序的功能,还创建了另外3个0.7kb DAO1in启动子的突变体:DAO1in2,其中原始翻译起始密码子被改变为ATC,从而在待表达的蛋白质中没有额外的N端残基被翻译;DAO1in3,其中DAO1in2的基序2中的所有胞嘧啶残基被改变为腺嘌呤;以及DAO1in4,其中DAO1in2中的24nt基序2被删除。(见实施例2)DAO1in2基本上与DAO1in相同,表明起始16aa的翻译对于启动子活性和调节是可有可无的。然而,DAO1in3和DAO1in4在添加D-丙氨酸和L-丙氨酸二者的MinAB培养基中显示出严重降低的活性。这表明基序2是一般转录增强子的结合位点。
实施例14
DAO1敲除对DAO1启动子活性的影响
根据Koh等人的方法产生DAO1敲除突变体(Δdao1)(7)。通过DNA印记证实了DAO1基因的缺失(图10A)。当使用D-丙氨酸或L-丙氨酸作为唯一碳源时,突变体的生长显著受损(图10B)。值得注意的是,Δdao1表现出比野生型细胞显著更高的荧光素酶报告基因的诱导水平。重要的是,甚至在高水平的碳源(葡萄糖10g/L)和氮源(70mM硫酸铵)存在下,报告基因的强诱导性表达也是可实现的。当添加10g/L葡萄糖和70mM硫酸铵时,Δdao1的启动子活性分别比野生型高7.8倍和4.2倍。当向培养基中加入10g/L葡萄糖和70mM硫酸铵时,差异增加至17倍(图10C)。
在描述本发明的上下文中(特别是在下面的权利要求书的上下文中)使用的术语“一”、“一个”和“该”以及类似的指示被解释为涵盖单数和复数,除非另外指出或明显与上下文矛盾。除非另有说明,否则术语“包含”、“具有”、“包括”和“含有”将被解释为开放式术语(即,意味着“包括但不限于”)。本文中的数值范围的叙述仅仅意图作为单独提及落入该范围内的每个单独值的速记方法,除非在此另外指出,并且每个单独的数值被并入说明书中,就好像其在本文中单独列举一样。在此描述的所有方法可以以任何合适的顺序执行,除非在此另有指示或者与上下文明显矛盾。除非另外声明,否则本文提供的任何和所有示例或示例性语言(例如,“例如”)的使用仅旨在更好地说明本发明,而不是对本发明的范围进行限制。说明书中的任何语言都不应被解释为将任何未要求保护的元素表示为实施本发明所必需的。
这里描述了本发明的实施方案,包括发明人已知的用于实施本发明的最佳模式。在阅读前面的描述之后,那些实施方案的变化对于本领域的普通技术人员来说可能变得显而易见。本发明人期望本领域技术人员适当地采用这样的变化,并且本发明人希望以不同于在此具体描述的方式来实践本发明。因此,本发明包括适用法律允许的所附权利要求书中记载的主题的所有修改和等同物。此外,除非本文另有说明或者与上下文明显矛盾,否则本发明涵盖上述要素在其所有可能变型中的任何组合。
参考文献
1.Sampaio JP,Gadanho M,Bauer R,WeiβM:Taxonomic studies in theMicrobotryomycetidae:Leucosporidium golubevii sp.nov.,Leucosporidiellagen.nov.and the new orders Leucosporidiales and Sporidiobolales.Mycol Prog2003,2(1):53-68.
2.Zhao X,Wu S,Hu C,Wang Q,Hua Y,Zhao ZK:Lipid production fromJerusalem artichoke by Rhodosporidium toruloides Y4.J Ind MicrobiolBiotechnol 2010,37(6):581-585.
3.Liu H,Zhao X,Wang F,Li Y,Jiang X,Ye M,Zhao ZK,Zou H:Comparativeproteomic analysis of Rhodosporidium toruloide during lipidaccumulation.Yeast 2009,26(10):553-566.
4.Turcotte G,Kosaric N:Biosynthesis of lipids by Rhodosporidiumtoruloide ATCC 10788.J Biotechnol 1988,8(3):221-237.
5.Liu Y,Koh CMJ,Sun L,Hlaing MM,Du M,Peng N,Ji L:Characterization ofglyceraldehyde-3-phosphate dehydrogenase gene RtGPD1 and development ofgenetic transformation method by dominant selection in oleaginous yeastRhodosporidium toruloide.Appl Microbiol Biotechnol 2013,97(2):719-729.
6.Peng N,Cheng,H-I,Ji,L.:POLYNUCLEOTIDE SEQUENCES FROM RHODOSPORIDIUMAND RHODOTORULA AND USE THEREOF.In.USA:Temasek Life Sciences Laboratory.
7.Koh CM,Liu Y,Du M,Ji L:Molecular characterization of KU70 and KU80homologues and exploitation of a KU70-deficient mutant for improving genedeletion frequency in Rhodosporidium toruloide.BMC Microbiology 2014,14(1):50.
8.Terpe K:Overview of bacterial expression systems for heterologousprotein production:from molecular and biochemical fundamentals to commercialsystems.Appl Microbiol Biotechnol 2006,72(2):211-222.
9.Hollenberg CP,Gellissen G:Production of recombinant proteins bymethylotrophic yeasts.Current Opinion in Biotechnology 1997,8(5):554-560.
10.Kim SW,Keasling J:Metabolic engineering of the nonmevalonateisopentenyl diphosphate synthesis pathway in Escherichia coli enhanceslycopene production.Biotechnology and bioengineering2001,72(4):408-415.
11.Pollegioni L,Piubelli L,Sacchi S,Pilone MS,Molla G:Physiologicalfunctions of D-amino acid oxidases:from yeast to humans.Cell Mol Life Sci2007,64(11):1373-1394.
12.Pollegioni L,Molla G,Sacchi S,Rosini E,Verga R,Pilone MS:Properties and applications of microbial D-amino acid oxidases:current stateand perspectives.Appl Microbiol Biotechnol 2008,78(1):1-16.
13.Simonetta MP,Vanoni MA,Casalin P:Purification and properties of d-amino-acid oxidase,an inducible flavoenzyme from<i>Rhodotorula gracilis</i>.Biochimica et Biophysica Acta(BBA)-Protein Structure and MolecularEnzymology 1987,914(2):136-142.
14.Abad S,Nahalka J,Winkler M,Bergler G,Speight R,Glieder A,NidetzkyB:High-level expression of Rhodotorula gracilis D-amino acid oxidase inPichia pastoris.Biotechnol Lett 2011,33(3):557-563.
15.Boselli A,Piubelli L,Molla G,Pilone MS,Pollegioni L,Sacchi S:Investigating the role of active site residues of Rhodotorula gracilis D-amino acid oxidase on its substrate specificity.Biochimie 2007,89(3):360-368.
16.Caldinelli L,Molla G,Pilone MS,Pollegioni L:Tryptophan 243 affectsinterprotein contacts,cofactor binding and stability in D-amino acid oxidasefrom Rhodotorula gracilis.The FEBS journal2006,273(3):504-512.
17.Boselli A,Piubelli L,Molla G,Sacchi S,Pilone MS,Ghisla S,Pollegioni L:On the mechanism of Rhodotorula gracilis D-amino acid oxidase:role of the active site serine 335.Biochim Biophys Acta2004,1702(1):19-32.
18.Pollegioni L,Harris CM,Molla G,Pilone MS,Ghisla S:Identificationand role of ionizing functional groups at the active center of Rhodotorulagracilis D-amino acid oxidase.FEBS Lett 2001,507(3):323-326.
19.Hsieh HC,Kuan IC,Lee SL,Tien GY,Wang YJ,Yu CY:Stabilization of D-amino acid oxidase from Rhodosporidium toruloide by immobilization ontomagnetic nanoparticles.Biotechnol Lett 2009,31(4):557-563.
20.Wang SJ,Yu CY,Kuan IC:Stabilization of native and double D-aminoacid oxidases from Rhodosporidium toruloide and Trigonopsis variabilis byimmobilization on streptavidin-coated magnetic beads.Biotechnol Lett 2008,30(11):1973-1981.
21.Kuan I,Liao R,Hsieh H,Chen K,Yu C:Properties of Rhodotorulagracilis D-amino acid oxidase immobilized on magnetic beads through his-tag.JBiosci Bioeng 2008,105(2):110-115.
22.Upadhya R,Nagajyothi,Bhat SG:Stabilization of D-amino acid oxidaseand catalase in permeabilized Rhodotorula gracilis cells and its applicationfor the preparation of alpha-ketoacids*.Biotechnology and Bioengineering2000,68(4):430-436.
23.Molla G,Motteran L,Piubelli L,Pilone MS,Pollegioni L:Regulation ofD-amino acid oxidase expression in the yeast Rhodotorula gracilis.Yeast 2003,20(12):1061-1069.
24.Carthew RW,Sontheimer EJ:Origins and mechanisms of miRNAs andsiRNAs.Cell 2009,136(4):642-655.
25.Eamens A,McHale M,Waterhouse P:The Use of Artificial MicroRNATechnology to Control Gene Expression in Arabidopsis thaliana.In:ArabidopsisProtocols.Edited by Sanchez-Serrano JJ,Salinas J,vol.1062:Humana Press;2014:211-224.
26.Lazo GR,Stein PA,Ludwig RA:A DNA transformation-competentArabidopsis genomic library in Agrobacterium.Nature Biotechnol 1991,9(10):963-967.
27.Cai L,Sun L,Fu L,Ji L:MEDIA COMPOSITIONS,SELECTION METHODS ANDAGROBACTERIUM STRAINS FOR TRANSFORMATION OF PLANTS.In.:US Patent20,120,246,759;2012.
28.Watson B,Currier TC,Gordon MP,Chilton M,Nester E:Plasmid requiredfor virulence of Agrobacterium tumefaciens.J Bacteriol 1975,123(1):255-264.
29.Lee LY,Gelvin SB:T-DNA binary vectors and systems.Plant Physiol2008,146(2):325-332.
30.Liu Y,Koh CM,Sun L,Hlaing MM,Du M,Peng N,Ji L:Characterization ofglyceraldehyde-3-phosphate dehydrogenase gene RtGPD1 and development ofgenetic transformation method by dominant selection in oleaginous yeastRhodosporidium toruloide.Appl Microbiol Biotechnol 2013,97(2):719-729.
31.Szewczyk E,Nayak T,Oakley CE,Edgerton H,Xiong Y,Taheri-Talesh N,Osmani SA,Oakley BR:Fusion PCR and gene targeting in Aspergillus nidulans.NatProtoc 2006,1(6):3111-3120.
32.Pollegioni L,Molla G,Campaner S,Martegani E,Pilone MS:Cloning,sequencing and expression in E.coli of a D-amino acid oxidase cDNA fromRhodotorula gracilis active on cephalosporin C.J Biotechnol 1997,58(2):115-123.
33.Pollegioni L,Falbo A,Pilone MS:Specificity and kinetics ofRhodotorula gracilis D-amino acid oxidase.Biochim Biophys Acta 1992,1120(1):11-16.
Mysara,M.et al.(2011).MysiRNA-designer:a workflow for efficient siRNAdesign.PLOS one 6(10):e25642.
Wesley,S.V.et al.(2001).Construct design for efficient,effective andhigh-throughput gene silencing in plants.Plant J 27:581-590.
Yan,P.et al.(2012).High-throughput construction of intron-containinghairpin RNA vectors for RNAiin plants.PLOS one 7(5):e38186.
Zuo,J.,et al.,Chemical-regulated,site-specific DNA excision intransgenic plants.Nat Biotechnol,2001.19(2):p.157-61.
序列表
<110> 淡马锡生命科学研究院有限公司
<120> 红冬孢酵母属和红酵母属的D-氨基酸诱导型基因表达系统
<130> 2577-248PCT
<150> US 62/142,788
<151> 2015-04-03
<160> 97
<170> PatentIn version 3.5
<210> 1
<211> 2181
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (1803)..(1830)
<223> DNA motif 1
<220>
<221> misc_feature
<222> (2024)..(2024)
<223> G may be replaced by C, A or T
<220>
<221> Intron
<222> (2062)..(2169)
<220>
<221> misc_feature
<222> (2069)..(2092)
<223> DNA motif 2
<220>
<221> misc_feature
<222> (2176)..(2181)
<223> NcoI site
<400> 1
cttcccggtc tcgtatcgag cggaagacat ccccctcttc ctcgctcaga ttgccgctct 60
cctgcaaggc cagcagtggg gcgtcggtgc gtgcccaact cgtctgaagt ggccaaatgg 120
ctgacagtgc tcccgcaggt cacgacgctg ccgccatcct tcgcggtctt cggcagcgga 180
agctttgatt ctttcttgcc tctctcggtt gtacaatcgt cgtgctcgcc agtttgttgt 240
tgatatccct agccttgcct tccatactga acaatctaca actcgtcctt cttgcgcggc 300
ggaaagcgct tcagcacctc gttctgcacg tcttgcggca agtactcccc acccggtcct 360
gcccacatca ccggcagatc tgtccgcttc tcatacactg ctggtgaggc aggttgcgag 420
gcgagagagc gctggaccgc ctcgacttct tccattacgc gaaggaggtt gccgccgatc 480
aagtctgcta ggtcgtcttc cgtccatcct cgtcgcaaca actccgcaat ctgcagagac 540
gaggtagtca gcacatgtca tagctgaaga agcaagcgat gcgcaccaag ttcggaaact 600
tcgacgcgtc ctcaagcccc tcaacactcg agcgcatacc gtcaaagtca gacccgagac 660
cgacgtgctt cttgccgcag acggaggcga tgtactcgat atgatcggcg acacggattt 720
gcgtggcgtt cgtagggtcg ataaaggaag ggtagaagac gaccattctg cgagacgcga 780
aggtcagccg gaaacttctg acgacaggaa gtaacgtcgt acgcacacga tgccgtggtt 840
ctggtgctcg cctggcccga tcagctgaag aacttcctct gggacgtttc gcgggtggtc 900
gtggatcgct cgcgcgccag agtgcgagaa gatgacgggc gcaacgctga gttcgagggc 960
ctgctcgcaa atcgtcagct aaagctcgaa agtgttgaag cgcggtgcgc acgtcgagca 1020
tggtctgatc gcttgtgtgc gagaggtcga ccatcatgcc gagcctgttc agctccggta 1080
caagctcgcg cccgaaggcg gtcaggccgt tcccgtcgtg tacaggctcg ataggagagc 1140
cgtccccggc ggaagaggcg aaggctgtga gaaaaacccg tcaacagagc ggaagaaggc 1200
cgagaggtcg cctcgcctca caagtgtggc aggtgtgcgt gagcgtaagg taccgcacgc 1260
cgagttgctg aaagaggcgt aggatggcca gcgagttcat caggtgatgc gagctgtagg 1320
aagagcgggt tagcgggagg atgtcggtag agactgttcg tacaaacccc tctagcccaa 1380
tcaaggacgc gatcttcccc tccgcgaacg cactccgcac ctcgtccgcc gttcgagcga 1440
gcgccatctc ctcaggatag tgctccacca tccgatgaat aaggtcgacg ctctcgagtg 1500
cccactcgac cgcgttcgtg ggctcaagga agtcctcccc cgtcggctgc gcatcacacg 1560
gagcatacgc aacatggaac aagcctccta cgcgtccttg acgcaacttc gggaggtcga 1620
catggcctgc aagaccggtc gcaagttcag ggaggacgtc gagcggtctc cggcagaggt 1680
ggcgagcgac gtaggggagg tcgacgtgtc cgtctatgag tgggtggcgt ttcaggatcc 1740
cgcgggcctc agcgagcaag gactcgttgg gcaaagtgaa ggtgtactga tgagcggttg 1800
cgaggccgca gagcagcgct gcgacgacgg gaagcttcgg cacgagcatg actgtgagta 1860
gtagtccaag gagaacagcg cagagtcggc aggagggcac atggaggcag agcgtggggc 1920
ggaggaggca gatggggagt cgcgctgggg gacgagaggg tgccgctcga ccaactgctc 1980
tctttcgctc ttgctgctgc ttgtactgct cgaacgacgc catgcattca cagaagcgcg 2040
tcgttgtcct cggatcaggc ggtgcgtctt tccctctcct ccccacaccc gacagttctc 2100
gaggaggagt acagcagcga gcgaggctgc cgagggggat ctgggttgac gcagctcttg 2160
attatacagt gattgccatg g 2181
<210> 2
<211> 1701
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (1323)..(1350)
<223> DNA motif 1
<220>
<221> misc_feature
<222> (1544)..(1544)
<223> G may be replaced by C, A or T
<220>
<221> Intron
<222> (1582)..(1689)
<220>
<221> misc_feature
<222> (1589)..(1612)
<223> DNA motif 2
<220>
<221> misc_feature
<222> (1696)..(1701)
<223> NcoI site
<400> 2
aagtctgcta ggtcgtcttc cgtccatcct cgtcgcaaca actccgcaat ctgcagagac 60
gaggtagtca gcacatgtca tagctgaaga agcaagcgat gcgcaccaag ttcggaaact 120
tcgacgcgtc ctcaagcccc tcaacactcg agcgcatacc gtcaaagtca gacccgagac 180
cgacgtgctt cttgccgcag acggaggcga tgtactcgat atgatcggcg acacggattt 240
gcgtggcgtt cgtagggtcg ataaaggaag ggtagaagac gaccattctg cgagacgcga 300
aggtcagccg gaaacttctg acgacaggaa gtaacgtcgt acgcacacga tgccgtggtt 360
ctggtgctcg cctggcccga tcagctgaag aacttcctct gggacgtttc gcgggtggtc 420
gtggatcgct cgcgcgccag agtgcgagaa gatgacgggc gcaacgctga gttcgagggc 480
ctgctcgcaa atcgtcagct aaagctcgaa agtgttgaag cgcggtgcgc acgtcgagca 540
tggtctgatc gcttgtgtgc gagaggtcga ccatcatgcc gagcctgttc agctccggta 600
caagctcgcg cccgaaggcg gtcaggccgt tcccgtcgtg tacaggctcg ataggagagc 660
cgtccccggc ggaagaggcg aaggctgtga gaaaaacccg tcaacagagc ggaagaaggc 720
cgagaggtcg cctcgcctca caagtgtggc aggtgtgcgt gagcgtaagg taccgcacgc 780
cgagttgctg aaagaggcgt aggatggcca gcgagttcat caggtgatgc gagctgtagg 840
aagagcgggt tagcgggagg atgtcggtag agactgttcg tacaaacccc tctagcccaa 900
tcaaggacgc gatcttcccc tccgcgaacg cactccgcac ctcgtccgcc gttcgagcga 960
gcgccatctc ctcaggatag tgctccacca tccgatgaat aaggtcgacg ctctcgagtg 1020
cccactcgac cgcgttcgtg ggctcaagga agtcctcccc cgtcggctgc gcatcacacg 1080
gagcatacgc aacatggaac aagcctccta cgcgtccttg acgcaacttc gggaggtcga 1140
catggcctgc aagaccggtc gcaagttcag ggaggacgtc gagcggtctc cggcagaggt 1200
ggcgagcgac gtaggggagg tcgacgtgtc cgtctatgag tgggtggcgt ttcaggatcc 1260
cgcgggcctc agcgagcaag gactcgttgg gcaaagtgaa ggtgtactga tgagcggttg 1320
cgaggccgca gagcagcgct gcgacgacgg gaagcttcgg cacgagcatg actgtgagta 1380
gtagtccaag gagaacagcg cagagtcggc aggagggcac atggaggcag agcgtggggc 1440
ggaggaggca gatggggagt cgcgctgggg gacgagaggg tgccgctcga ccaactgctc 1500
tctttcgctc ttgctgctgc ttgtactgct cgaacgacgc catgcattca cagaagcgcg 1560
tcgttgtcct cggatcaggc ggtgcgtctt tccctctcct ccccacaccc gacagttctc 1620
gaggaggagt acagcagcga gcgaggctgc cgagggggat ctgggttgac gcagctcttg 1680
attatacagt gattgccatg g 1701
<210> 3
<211> 701
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (323)..(350)
<223> DNA motif 1
<220>
<221> misc_feature
<222> (544)..(544)
<223> G may be replaced by C, A or T
<220>
<221> Intron
<222> (582)..(689)
<220>
<221> misc_feature
<222> (589)..(612)
<223> DNA motif 2
<220>
<221> misc_feature
<222> (696)..(701)
<223> NcoI site
<400> 3
aaggtcgacg ctctcgagtg cccactcgac cgcgttcgtg ggctcaagga agtcctcccc 60
cgtcggctgc gcatcacacg gagcatacgc aacatggaac aagcctccta cgcgtccttg 120
acgcaacttc gggaggtcga catggcctgc aagaccggtc gcaagttcag ggaggacgtc 180
gagcggtctc cggcagaggt ggcgagcgac gtaggggagg tcgacgtgtc cgtctatgag 240
tgggtggcgt ttcaggatcc cgcgggcctc agcgagcaag gactcgttgg gcaaagtgaa 300
ggtgtactga tgagcggttg cgaggccgca gagcagcgct gcgacgacgg gaagcttcgg 360
cacgagcatg actgtgagta gtagtccaag gagaacagcg cagagtcggc aggagggcac 420
atggaggcag agcgtggggc ggaggaggca gatggggagt cgcgctgggg gacgagaggg 480
tgccgctcga ccaactgctc tctttcgctc ttgctgctgc ttgtactgct cgaacgacgc 540
catgcattca cagaagcgcg tcgttgtcct cggatcaggc ggtgcgtctt tccctctcct 600
ccccacaccc gacagttctc gaggaggagt acagcagcga gcgaggctgc cgagggggat 660
ctgggttgac gcagctcttg attatacagt gattgccatg g 701
<210> 4
<211> 401
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (23)..(50)
<223> DNA motif 1
<220>
<221> misc_feature
<222> (244)..(244)
<223> G may be replaced with C, A or T
<220>
<221> Intron
<222> (282)..(389)
<220>
<221> misc_feature
<222> (289)..(312)
<223> DNA motif 2
<220>
<221> misc_feature
<222> (396)..(401)
<223> NcoI site
<400> 4
ggtgtactga tgagcggttg cgaggccgca gagcagcgct gcgacgacgg gaagcttcgg 60
cacgagcatg actgtgagta gtagtccaag gagaacagcg cagagtcggc aggagggcac 120
atggaggcag agcgtggggc ggaggaggca gatggggagt cgcgctgggg gacgagaggg 180
tgccgctcga ccaactgctc tctttcgctc ttgctgctgc ttgtactgct cgaacgacgc 240
catgcattca cagaagcgcg tcgttgtcct cggatcaggc ggtgcgtctt tccctctcct 300
ccccacaccc gacagttctc gaggaggagt acagcagcga gcgaggctgc cgagggggat 360
ctgggttgac gcagctcttg attatacagt gattgccatg g 401
<210> 5
<211> 997
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (779)..(806)
<223> DNA motif 1
<400> 5
ctgatcgctt gtgtgcgaga ggtcgaccat catgccgagc ctgttcagct ccggtacaag 60
ctcgcgcccg aaggcggtca ggccgttccc gtcgtgtaca ggctcgatag gagagccgtc 120
cccggcggaa gaggcgaagg ctgtgagaaa aacccgtcaa cagagcggaa gaaggccgag 180
aggtcgcctc gcctcacaag tgtggcaggt gtgcgtgagc gtaaggtacc gcacgccgag 240
ttgctgaaag aggcgtagga tggccagcga gttcatcagg tgatgcgagc tgtaggaaga 300
gcgggttagc gggaggatgt cggtagagac tgttcgtaca aacccctcta gcccaatcaa 360
ggacgcgatc ttcccctccg cgaacgcact ccgcacctcg tccgccgttc gagcgagcgc 420
catctcctca ggatagtgct ccaccatccg atgaataagg tcgacgctct cgagtgccca 480
ctcgaccgcg ttcgtgggct caaggaagtc ctcccccgtc ggctgcgcat cacacggagc 540
atacgcaaca tggaacaagc ctcctacgcg tccttgacgc aacttcggga ggtcgacatg 600
gcctgcaaga ccggtcgcaa gttcagggag gacgtcgagc ggtctccggc agaggtggcg 660
agcgacgtag gggaggtcga cgtgtccgtc tatgagtggg tggcgtttca ggatcccgcg 720
ggcctcagcg agcaaggact cgttgggcaa agtgaaggtg tactgatgag cggttgcgag 780
gccgcagagc agcgctgcga cgacgggaag cttcggcacg agcatgactg tgagtagtag 840
tccaaggaga acagcgcaga gtcggcagga gggcacatgg aggcagagcg tggggcggag 900
gaggcagatg gggagtcgcg ctgggggacg agagggtgcc gctcgaccaa ctgctctctt 960
tcgctcttgc tgctgcttgt actgctcgaa cgacgcc 997
<210> 6
<211> 28
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (4)..(5)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (7)..(7)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (10)..(20)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (26)..(26)
<223> n is a, c, g, or t
<400> 6
aggnngnagn nnnnnnnnnn gangangg 28
<210> 7
<211> 24
<212> DNA
<213> Rhodosporidium toruloides
<400> 7
tytcccyctc cyccccacwy ccga 24
<210> 8
<211> 300
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (27)..(51)
<223> ct box
<220>
<221> misc_feature
<222> (52)..(52)
<223> transcription start point
<220>
<221> 5'UTR
<222> (52)..(100)
<220>
<221> misc_feature
<222> (101)..(102)
<223> coding sequence
<220>
<221> Intron
<222> (103)..(231)
<220>
<221> misc_feature
<222> (232)..(300)
<223> coding sequence
<400> 8
tgagcgaagg aagccgcatc gacaagttcg ctcccctttg ccctctttcc catcacccgt 60
tctcgcctta cccgctcaga acaacaccag atcactcaca atgtctgtgc agcatccgcc 120
ctgaacttgc cgcatcgtca gcggtctccc tcgccctctg ctgacctcgt ctcgtcacct 180
cctccctcat ccgctcctat cgcttcccgt acaccgctgg gatgctcgca ggtctgccgg 240
aaagggatct gtcaacgtcg gaatcaacgg cttcggtcgc atcggccgca tcgtcctccg 300
<210> 9
<211> 1702
<212> DNA
<213> Rhodotorula graminis WP1
<400> 9
cgctgcagca ctagccgctc ccgctgagcc agcttgctcc ctctcgttcg cactacaatg 60
gctatcgaca agcgcgtcgt cgtcctcggc accggcggtg agccccagcc ctcacactct 120
ccccctcccc cccacttccg aggcctgact cttccctctc gcccctcgcc tcgcagtggt 180
cggcctttcg tgcggcctcg tcctgtcccg acaaggctac cgcgtccact tcatcgcgcg 240
cgacttgccc gaggactcga cctcgcaagg cttcgcctcc ccctgggcgg tccgtctcct 300
cggcctcaac cctcccattc ttccctgttt atagacccga gctgaccctc tcgagtacgt 360
gcacgcaggg cgccaactgg acgccgttct actcgcggga cgagggccct cgccaggcca 420
agtgggagga ggccaccttt gctcgctggg tctcgctcgt cccgtccggc ctcgccatgt 480
ggctcaacga cacgcgccgc tacgccgaca ccgacgccgg cctcctcggt cactggtacc 540
gcgacacggt ccgcaactac cgcgagctcc cgccgagcga gctgcccaaa ggcgtcgcgg 600
ccggcgccgc gtacgacacc ctgtcggtca acgcgccgct gtactgccag gcgctcgcga 660
gggagctgca gacgctcggc gcgaccttcg agcgcaggtc ggtctcgtcg atcgagcagg 720
tgttcgaggg ccaggacgac attgcgctcg tcgtcaacgc caccgggctc ggtgcgtcct 780
ctttcgccga cctgtccttc tcctctcctc gagcagagtc gctcaccgtg tcttcgagtg 840
tttgcaggcg ccaagtcgat cgctggcatc gaggactcgg cgtgccaccc agtgcgaggc 900
cagacggtgc tcgtcaagtc cggctgcaag cgctgcacca tggactcgtc gagtgcgtcc 960
cctcgcgtcc tctttcggtc ttggttccgg acgagactga cgctgcgctc gtacagaccc 1020
tgaggcgccc gcctacatca ttccgaggcc tggcggcgag gtcatctgcg gcggcaccta 1080
tttggtccgt cccactctct ctctcgctct ctcccgacgc tcgtgcgaga catgccctga 1140
ccttgcttcc gcccatcctc acgcaggtcg acgactggga cctctcgccc tcggcctcga 1200
ccgcgcagcg cattctcacc cagtgcctcg cgctcgaccc gtccatctcg accgacggca 1260
cgctcgacgg aatccacatc ctgcggcaca acgtcgggct gcgccctgcg cgcaccggcg 1320
gaccgcgcgt cgaggtcggc aagctcacgc tgccactcgt gcgctcgacc gagccgggca 1380
cggcgctcgc gctcggaacg gctcgccctg ctcctgcggg cgcgtcgagc gaagcggtgg 1440
gtgcgccgag cgaggcggtc aagcgcgagg tgacgctcgt gcacgcgtac gggttctcga 1500
gcgccggcta ccagcagagc tggggcgtcg cgcaggacgt gctcgggctc gtcgagggcg 1560
agatcgggcc gcctcgagcc tggtggacgc agaggggcaa gctgtagtgc gggtcgtgcg 1620
catcggagcg agtttgtgtc ggccttcgca agttggctcg aatcgcggtg gcggcgcagc 1680
tccctcaacc tcttctctct ct 1702
<210> 10
<211> 389
<212> PRT
<213> Rhodotorula graminis WP1
<400> 10
Met Ala Ile Asp Lys Arg Val Val Val Leu Gly Thr Gly Val Val Gly
1 5 10 15
Leu Ser Cys Gly Leu Val Leu Ser Arg Gln Gly Tyr Arg Val His Phe
20 25 30
Ile Ala Arg Asp Leu Pro Glu Asp Ser Thr Ser Gln Gly Phe Ala Ser
35 40 45
Pro Trp Ala Gly Ala Asn Trp Thr Pro Phe Tyr Ser Arg Asp Glu Gly
50 55 60
Pro Arg Gln Ala Lys Trp Glu Glu Ala Thr Phe Ala Arg Trp Val Ser
65 70 75 80
Leu Val Pro Ser Gly Leu Ala Met Trp Leu Asn Asp Thr Arg Arg Tyr
85 90 95
Ala Asp Thr Asp Ala Gly Leu Leu Gly His Trp Tyr Arg Asp Thr Val
100 105 110
Arg Asn Tyr Arg Glu Leu Pro Pro Ser Glu Leu Pro Lys Gly Val Ala
115 120 125
Ala Gly Ala Ala Tyr Asp Thr Leu Ser Val Asn Ala Pro Leu Tyr Cys
130 135 140
Gln Ala Leu Ala Arg Glu Leu Gln Thr Leu Gly Ala Thr Phe Glu Arg
145 150 155 160
Arg Ser Val Ser Ser Ile Glu Gln Val Phe Glu Gly Gln Asp Asp Ile
165 170 175
Ala Leu Val Val Asn Ala Thr Gly Leu Gly Ala Lys Ser Ile Ala Gly
180 185 190
Ile Glu Asp Ser Ala Cys His Pro Val Arg Gly Gln Thr Val Leu Val
195 200 205
Lys Ser Gly Cys Lys Arg Cys Thr Met Asp Ser Ser Asn Pro Glu Ala
210 215 220
Pro Ala Tyr Ile Ile Pro Arg Pro Gly Gly Glu Val Ile Cys Gly Gly
225 230 235 240
Thr Tyr Leu Val Asp Asp Trp Asp Leu Ser Pro Ser Ala Ser Thr Ala
245 250 255
Gln Arg Ile Leu Thr Gln Cys Leu Ala Leu Asp Pro Ser Ile Ser Thr
260 265 270
Asp Gly Thr Leu Asp Gly Ile His Ile Leu Arg His Asn Val Gly Leu
275 280 285
Arg Pro Ala Arg Thr Gly Gly Pro Arg Val Glu Val Gly Lys Leu Thr
290 295 300
Leu Pro Leu Val Arg Ser Thr Glu Pro Gly Thr Ala Leu Ala Leu Gly
305 310 315 320
Thr Ala Arg Pro Ala Pro Ala Gly Ala Ser Ser Glu Ala Val Gly Ala
325 330 335
Pro Ser Glu Ala Val Lys Arg Glu Val Thr Leu Val His Ala Tyr Gly
340 345 350
Phe Ser Ser Ala Gly Tyr Gln Gln Ser Trp Gly Val Ala Gln Asp Val
355 360 365
Leu Gly Leu Val Glu Gly Glu Ile Gly Pro Pro Arg Ala Trp Trp Thr
370 375 380
Gln Arg Gly Lys Leu
385
<210> 11
<211> 1461
<212> DNA
<213> Rhodosporidium toruloides MTCC 457
<400> 11
atgcactctc agaagcgcgt cgttgtcctc ggatcaggcg gtgcgtcttt tccctctcct 60
ccccacaccc gacagtcctc gacgaggtgt aggacggcga gcaaagctgc cgagggcgat 120
ctgggctgac tgagcgctcg agtgtacagt tatcggtctg agcagcgccc tcatcctcgc 180
tcggaagggc tacagcgtgc atattctcgc gcgcgacttg ccggaggacg tctcgagcca 240
gactttcgct tcaccatggg ctgtgcgtcg tctcactgta gttggaggat gtcagcgaga 300
gctgagcaat ctcgtcatcc ccgcagggcg cgaattggac gcctttcatg acgcttacag 360
acggtcctcg acaagcaaaa tgggaagaat cgactttgtg cgtctccttc tacctcattc 420
ttggcctcga gctgacgagt gtatgataca cagcaagaag tgggtcgagt tggtcccgac 480
gggccatgcc atgtggctca aggggacgag gcggttcgcg cagaacgaag acggcttgct 540
cgggcactgg tacaaggaca tcacgccaaa tgtgcgccca cattcactct tcccttcgca 600
tgtctccgtt tactgacccg ccctctttcg ccgtgcgcag taccgccccc tcccatcttc 660
cgaatgtcca cctggcgcta tcggcgtaac ctacgacacc ctctccgtcc acgcaccaaa 720
gtactgccag taccttgcaa gagagctgca gaagctcggc gcgacgtttg agagacggac 780
cgttacgtcg cttgagcagg cgttcgacgg tgcggatttg gtggtcaacg ctacgggact 840
tggtatgtcc cgaactgccc ctctctacct gcaattttgc tgattgatat gctcgcaggc 900
gccaagtcga ttgcgggcat cgacgaccaa gccgccgagc caatccgcgg ccaaaccgtc 960
ctcgtcaagt ccccatgcaa gcgatgcacg atggactcgt ccgaccccgc ttctcccgcc 1020
tacatcattc cccgaccagg tggcgaagtc atctgcggcg ggacgtacgg cgtgggagac 1080
tgggacttgt ctgtcaaccc agagacggtc cagcggatcc tcaagcactg cttgcgcctc 1140
gacccgacca tctcgagcga cggaacgatc gaaggcatcg aggtcctccg ccacaacgtc 1200
ggcttgcgac ctgcacgacg aggcggaccc cgcgtcgagg cagaacggat cgtcctgcct 1260
ctcgaccgga caaagtcgcc cctctcgctc ggcaggggca gcgcacgagc ggcgaaggag 1320
aaggaggtca cgcttgtgca tgcgtatggc ttctcgagtg cgggatacca gcagagttgg 1380
ggcgcggcgg aggatgtcgc gcagctcgtc gacgaggcgt tccagcggta ccacggcgcg 1440
gcgcgggagt cgaagttgta g 1461
<210> 12
<211> 368
<212> PRT
<213> Rhodosporidium toruloides MTCC 457
<400> 12
Met His Ser Gln Lys Arg Val Val Val Leu Gly Ser Gly Val Ile Gly
1 5 10 15
Leu Ser Ser Ala Leu Ile Leu Ala Arg Lys Gly Tyr Ser Val His Ile
20 25 30
Leu Ala Arg Asp Leu Pro Glu Asp Val Ser Ser Gln Thr Phe Ala Ser
35 40 45
Pro Trp Ala Gly Ala Asn Trp Thr Pro Phe Met Thr Leu Thr Asp Gly
50 55 60
Pro Arg Gln Ala Lys Trp Glu Glu Ser Thr Phe Lys Lys Trp Val Glu
65 70 75 80
Leu Val Pro Thr Gly His Ala Met Trp Leu Lys Gly Thr Arg Arg Phe
85 90 95
Ala Gln Asn Glu Asp Gly Leu Leu Gly His Trp Tyr Lys Asp Ile Thr
100 105 110
Pro Asn Tyr Arg Pro Leu Pro Ser Ser Glu Cys Pro Pro Gly Ala Ile
115 120 125
Gly Val Thr Tyr Asp Thr Leu Ser Val His Ala Pro Lys Tyr Cys Gln
130 135 140
Tyr Leu Ala Arg Glu Leu Gln Lys Leu Gly Ala Thr Phe Glu Arg Arg
145 150 155 160
Thr Val Thr Ser Leu Glu Gln Ala Phe Asp Gly Ala Asp Leu Val Val
165 170 175
Asn Ala Thr Gly Leu Gly Ala Lys Ser Ile Ala Gly Ile Asp Asp Gln
180 185 190
Ala Ala Glu Pro Ile Arg Gly Gln Thr Val Leu Val Lys Ser Pro Cys
195 200 205
Lys Arg Cys Thr Met Asp Ser Ser Asp Pro Ala Ser Pro Ala Tyr Ile
210 215 220
Ile Pro Arg Pro Gly Gly Glu Val Ile Cys Gly Gly Thr Tyr Gly Val
225 230 235 240
Gly Asp Trp Asp Leu Ser Val Asn Pro Glu Thr Val Gln Arg Ile Leu
245 250 255
Lys His Cys Leu Arg Leu Asp Pro Thr Ile Ser Ser Asp Gly Thr Ile
260 265 270
Glu Gly Ile Glu Val Leu Arg His Asn Val Gly Leu Arg Pro Ala Arg
275 280 285
Arg Gly Gly Pro Arg Val Glu Ala Glu Arg Ile Val Leu Pro Leu Asp
290 295 300
Arg Thr Lys Ser Pro Leu Ser Leu Gly Arg Gly Ser Ala Arg Ala Ala
305 310 315 320
Lys Glu Lys Glu Val Thr Leu Val His Ala Tyr Gly Phe Ser Ser Ala
325 330 335
Gly Tyr Gln Gln Ser Trp Gly Ala Ala Glu Asp Val Ala Gln Leu Val
340 345 350
Asp Glu Ala Phe Gln Arg Tyr His Gly Ala Ala Arg Glu Ser Lys Leu
355 360 365
<210> 13
<211> 1461
<212> DNA
<213> Rhodosporidium toruloides NP11
<400> 13
atgcactctc agaagcgcgt cgttgtcctc ggatcaggcg gtgcgtcttt tccctctcct 60
ccccacaccc gacagtcctc gacgaggtgt aggacggcga gcaaagctgc cgagggcgat 120
ctgggctgac tgagcgctcg agtgtacagt tatcggtctg agcagcgccc tcatcctcgc 180
tcggaagggc tacagcgtgc atattctcgc gcgcgacttg ccggaggacg tctcgagcca 240
gactttcgct tcaccatggg ctgtgcgtcg tctcactgta gttggaggat gtcagcgaga 300
gctgagcaat ctcgtcatcc ccgcagggcg cgaattggac gcctttcatg acgcttacag 360
acggtcctcg acaagcaaaa tgggaagaat cgactttgtg cgtctccttc tacctcattc 420
ttggcctcga gctgacgagt gtatgataca cagcaagaag tgggtcgagt tggtcccgac 480
gggccatgcc atgtggctca aggggacgag gcggttcgcg cagaacgaag acggcttgct 540
cgggcactgg tacaaggaca tcacgccaaa tgtgcgccca cattcactct tcccttcgca 600
tgtctccgtt tactgacccg ccctctttcg ccgtgcgcag taccgccccc tcccatcttc 660
cgaatgtcca cctggcgcta tcggcgtaac ctacgacacc ctctccgtcc acgcaccaaa 720
gtactgccag taccttgcaa gagagctgca gaagctcggc gcgacgtttg agagacggac 780
cgttacgtcg cttgagcagg cgttcgacgg tgcggatttg gtggtcaacg ctacgggact 840
tggtatgtcc cgaactgccc ctctctacct gcaattttgc tgattgatat gctcgcaggc 900
gccaagtcga ttgcgggcat cgacgaccaa gccgccgagc caatccgcgg ccaaaccgtc 960
ctcgtcaagt ccccatgcaa gcgatgcacg atggactcgt ccgaccccgc ttctcccgcc 1020
tacatcattc cccgaccagg tggcgaagtc atctgcggcg ggacgtacgg cgtgggagac 1080
tgggacttgt ctgtcaaccc agagacggtc cagcggatcc tcaagcactg cttgcgcctc 1140
gacccgacca tctcgagcga cggaacgatc gaaggcatcg aggtcctccg ccacaacgtc 1200
ggcttgcgac ctgcacgacg aggcggaccc cgcgtcgagg cagaacggat cgtcctgcct 1260
ctcgaccgga caaagtcgcc cctctcgctc ggcaggggca gcgcacgagc ggcgaaggag 1320
aaggaggtca cgcttgtgca tgcgtatggc ttctcgagtg cgggatacca gcagagttgg 1380
ggcgcggcgg aggatgtcgc gcagctcgtc gacgaggcgt tccagcggta ccacggcgcg 1440
gcgcgggagt cgaagttgta g 1461
<210> 14
<211> 368
<212> PRT
<213> Rhodosporidium toruloides NP11
<400> 14
Met His Ser Gln Lys Arg Val Val Val Leu Gly Ser Gly Val Ile Gly
1 5 10 15
Leu Ser Ser Ala Leu Ile Leu Ala Arg Lys Gly Tyr Ser Val His Ile
20 25 30
Leu Ala Arg Asp Leu Pro Glu Asp Val Ser Ser Gln Thr Phe Ala Ser
35 40 45
Pro Trp Ala Gly Ala Asn Trp Thr Pro Phe Met Thr Leu Thr Asp Gly
50 55 60
Pro Arg Gln Ala Lys Trp Glu Glu Ser Thr Phe Lys Lys Trp Val Glu
65 70 75 80
Leu Val Pro Thr Gly His Ala Met Trp Leu Lys Gly Thr Arg Arg Phe
85 90 95
Ala Gln Asn Glu Asp Gly Leu Leu Gly His Trp Tyr Lys Asp Ile Thr
100 105 110
Pro Asn Tyr Arg Pro Leu Pro Ser Ser Glu Cys Pro Pro Gly Ala Ile
115 120 125
Gly Val Thr Tyr Asp Thr Leu Ser Val His Ala Pro Lys Tyr Cys Gln
130 135 140
Tyr Leu Ala Arg Glu Leu Gln Lys Leu Gly Ala Thr Phe Glu Arg Arg
145 150 155 160
Thr Val Thr Ser Leu Glu Gln Ala Phe Asp Gly Ala Asp Leu Val Val
165 170 175
Asn Ala Thr Gly Leu Gly Ala Lys Ser Ile Ala Gly Ile Asp Asp Gln
180 185 190
Ala Ala Glu Pro Ile Arg Gly Gln Thr Val Leu Val Lys Ser Pro Cys
195 200 205
Lys Arg Cys Thr Met Asp Ser Ser Asp Pro Ala Ser Pro Ala Tyr Ile
210 215 220
Ile Pro Arg Pro Gly Gly Glu Val Ile Cys Gly Gly Thr Tyr Gly Val
225 230 235 240
Gly Asp Trp Asp Leu Ser Val Asn Pro Glu Thr Val Gln Arg Ile Leu
245 250 255
Lys His Cys Leu Arg Leu Asp Pro Thr Ile Ser Ser Asp Gly Thr Ile
260 265 270
Glu Gly Ile Glu Val Leu Arg His Asn Val Gly Leu Arg Pro Ala Arg
275 280 285
Arg Gly Gly Pro Arg Val Glu Ala Glu Arg Ile Val Leu Pro Leu Asp
290 295 300
Arg Thr Lys Ser Pro Leu Ser Leu Gly Arg Gly Ser Ala Arg Ala Ala
305 310 315 320
Lys Glu Lys Glu Val Thr Leu Val His Ala Tyr Gly Phe Ser Ser Ala
325 330 335
Gly Tyr Gln Gln Ser Trp Gly Ala Ala Glu Asp Val Ala Gln Leu Val
340 345 350
Asp Glu Ala Phe Gln Arg Tyr His Gly Ala Ala Arg Glu Ser Lys Leu
355 360 365
<210> 15
<211> 2092
<212> DNA
<213> Rhodotorula minuta
<400> 15
cgtctctcaa acaagttcaa acggaccgga agcgataacc tgcttttctt cttcataacc 60
acacattctg acaagcatga cgctaccact tctcgaagat gcacctcgag cattggacgc 120
cgtcattatc ggcgcaggcg tcactggcct cagtatcgga ctggagcttg taaaaagagg 180
ctacaagatt gcagtcgtag cgaaggactt gcctgaagat gatcagagtc ctggctttgc 240
aagtccatgg gctgtgagga gtcttttcct tcatctatcg ttccttttga catgcctact 300
gacgcactgg ctgtgacatt gcaggggtgc aactggtgct ctttcgcagg tatgcccctc 360
caatcttccg aaagattagc ttcgcgggga cggcaaaaaa agatcctcgc aagatgtcat 420
aagctgaaga agcgcttccc ttcccccact ttccttagac aacaacaaga gagagcaaga 480
atgggatcgt aaaacatacc aagccctctt taacgtagct gaaaaccatc ccaacctatg 540
cgaggtgagc taggctttcg cttagagaga gagatcacgt ggtgtacaag gacgaagtgt 600
gaaggaaccg cttcaatata gtttatgata gctgactctc ttgcttttgg cttgactaca 660
gctcattcag ttccactcgt atgaaagcga caagttacct gaaccttggt tcaaagatct 720
cgtgaaagat gtaagctacc tgtttttccg ctacttccta cgataaattg gggaatgcaa 780
ataagaacca ttccgcaaga cagtagttga cgaagctata acctctttac cctcgcgttc 840
tcaatgtcac ctttcacatt tctgaccacc catcagtaca aagtcacgaa ggagggcacg 900
aaaccaggcg aaagatgcat aagctacaaa tccttcatca tgcacgcgcc caattatcta 960
cgtcacctag cgcagcagct tcgctcagcg ggcgttccga tccagcggaa acgcctgaca 1020
tcgctcgaag aagcgtacaa cctcccttca tacggccgcg tcaatctagt gatcaacgct 1080
acgggtctag gtgctcgttc gttactgggc aataaggatc caagcgatat atatcccatc 1140
aggggacaga ctgtccttgt caaagtaccg cagggatgga agaaaacctg cttcatgatg 1200
gcgagcgacc atccggacga gaagacgacg aaagatacgg aaatcccaga accgacttat 1260
attattccga gacctggtcc agagggacat gtagtactgt gagtgacgag cttcattctt 1320
aatattgtgc actcgaggaa gtctggtctt atgctggtct catcgtagag gaggttcatt 1380
ccaagtcaac aattgggaat atgcaccaga ctacgcatta gcggaacgca ttctgaagcg 1440
taactacgag ttgtgccctg aactggcagg tccaaatgga aaatcgtgga aagacagtaa 1500
ggcttgattc ctatgtgaca gaattggtgt tacgtactga tagcacttta ctatttctac 1560
agttgaaatc gtagcccaca atgtcggatt cagacctagc cgacaaggag gatgcaggct 1620
tgatctcgag cctattgagc taggtaacgc taaacaagaa ggaatgcaac tcgctcccaa 1680
atcgacaatt accgaaccta ggactggagc tatattgcat gcctatggaa taggtgagcc 1740
acactcatct gcatcacagt gtggtaaaat gctccactta aatactgatg ttgcgcttcc 1800
tcttttgtgt atctctgata caaacgatga aataggcccg gccggattcc aagcttccct 1860
cggatacgct ctagaagctg gagatatggt cgactcatac ttcaagaagg gcgacgcgaa 1920
gaagcgaagt tcgaagctgt aaacacgaga aggaagggaa tggaagttaa ggagcacagg 1980
gcactcatac atcgtcaact atccaaagaa gatgcttgat acggaaggcg taacgaggaa 2040
tcaaaagaag ggaagttgac ctgaacttag tgaagcatat acttgttcaa ag 2092
<210> 16
<211> 394
<212> PRT
<213> Rhodotorula minuta
<400> 16
Met Thr Leu Pro Leu Leu Glu Asp Ala Pro Arg Ala Leu Asp Ala Val
1 5 10 15
Ile Ile Gly Ala Gly Val Thr Gly Leu Ser Ile Gly Leu Glu Leu Val
20 25 30
Lys Arg Gly Tyr Lys Ile Ala Val Val Ala Lys Asp Leu Pro Glu Asp
35 40 45
Asp Gln Ser Pro Gly Phe Ala Ser Pro Trp Ala Gly Cys Asn Trp Cys
50 55 60
Ser Phe Ala Asp Asn Asn Lys Arg Glu Gln Glu Trp Asp Arg Lys Thr
65 70 75 80
Tyr Gln Ala Leu Phe Asn Val Ala Glu Asn His Pro Asn Leu Cys Glu
85 90 95
Leu Ile Gln Phe His Ser Tyr Glu Ser Asp Lys Leu Pro Glu Pro Trp
100 105 110
Phe Lys Asp Leu Val Lys Asp Tyr Lys Val Thr Lys Glu Gly Thr Lys
115 120 125
Pro Gly Glu Arg Cys Ile Ser Tyr Lys Ser Phe Ile Met His Ala Pro
130 135 140
Asn Tyr Leu Arg His Leu Ala Gln Gln Leu Arg Ser Ala Gly Val Pro
145 150 155 160
Ile Gln Arg Lys Arg Leu Thr Ser Leu Glu Glu Ala Tyr Asn Leu Pro
165 170 175
Ser Tyr Gly Arg Val Asn Leu Val Ile Asn Ala Thr Gly Leu Gly Ala
180 185 190
Arg Ser Leu Leu Gly Asn Lys Asp Pro Ser Asp Ile Tyr Pro Ile Arg
195 200 205
Gly Gln Thr Val Leu Val Lys Val Pro Gln Gly Trp Lys Lys Thr Cys
210 215 220
Phe Met Met Ala Ser Asp His Pro Asp Glu Lys Thr Thr Lys Asp Thr
225 230 235 240
Glu Ile Pro Glu Pro Thr Tyr Ile Ile Pro Arg Pro Gly Pro Glu Gly
245 250 255
His Val Val Leu Gly Gly Ser Phe Gln Val Asn Asn Trp Glu Tyr Ala
260 265 270
Pro Asp Tyr Ala Leu Ala Glu Arg Ile Leu Lys Arg Asn Tyr Glu Leu
275 280 285
Cys Pro Glu Leu Ala Gly Pro Asn Gly Lys Ser Trp Lys Asp Ile Glu
290 295 300
Ile Val Ala His Asn Val Gly Phe Arg Pro Ser Arg Gln Gly Gly Cys
305 310 315 320
Arg Leu Asp Leu Glu Pro Ile Glu Leu Gly Asn Ala Lys Gln Glu Gly
325 330 335
Met Gln Leu Ala Pro Lys Ser Thr Ile Thr Glu Pro Arg Thr Gly Ala
340 345 350
Ile Leu His Ala Tyr Gly Ile Gly Pro Ala Gly Phe Gln Ala Ser Leu
355 360 365
Gly Tyr Ala Leu Glu Ala Gly Asp Met Val Asp Ser Tyr Phe Lys Lys
370 375 380
Gly Asp Ala Lys Lys Arg Ser Ser Lys Leu
385 390
<210> 17
<211> 1749
<212> DNA
<213> Sporobolomyces roseus
<400> 17
atgccgacgc gtgagcctca gagagtagtc gtactaggcg caggaggtat gtagcaacgg 60
atttccactt cggctactcc cgaggttttc ctcccccact tgttttagcc gccaaccgac 120
ctctccttat ctcgcgctgc actctgctga tgcactcgag ggaactcgga cagtcatcgg 180
attaacttgc gccctttcac tcgtcgaaca aggctacacg gttcacgttg tcgcaagaga 240
ccttccggaa gacaccgact ctaccgcgtt cgcttctccc tgggccggcg ccaacgtatg 300
tccattcaag agtctcgagg aaggtccgag agaagcgaga tgggaaaccg tcactttgtc 360
agttgttact tgcctctcct ctcccccgag tcgacccgaa ctctctcatt cgactttttg 420
cactttccca cttttctagc aaaaaacttt caaccatgat cccatctggc ttggccatga 480
ctctcaaagg tactcggagg ttcgcacacg aagaatccca gttgttgggc cactggtaca 540
aagacgtcgt tccgaacgtg agcttttctt ccttcttttc ttccccccga cctcgtaact 600
ccgtctcctc tctgagctcg agtctcgctc gaagcaaatt acttcgtgtg ttctgatctc 660
cgctttgtgt gagttgatta gtaccgacac ttgaatcgcg aagaatgtcc acccaatgcg 720
atcggagtcg aattcgatac catctcggtc aacgcaccga aatattgtca ctacctcgct 780
cacgagttga ggtcaaaggg agtcacgatc gagaggaggt acgtcaagtc tattgaagag 840
gtttttcgag aaacgtttgg agcgagaaac gatttcgtcg tcaatgcgac tggattaggt 900
actattttcc ctttcccgac tctctctctc tctctctctg tctgtctttc ctcataccga 960
actcgttgta ttgactgatt tgctcgtggt tataggagca aaaagtatcg caggagtaga 1020
agatcaagaa gtgagaccga ttcgaggtca aaccgtcttg atcaaatcgg attgcgttcg 1080
gtgtacgatg gattcgagtg gttgagttct ttgtctttct ccctataccc ctttccccga 1140
accttgagtg ttgcattcaa tcgctaaata acgttcttgt gtgcgggttt tcttctttct 1200
tcagatccaa cctcttccgc ttacatcatc cctcgacctg gaggtgaagt catttgcggt 1260
ggctcttacg gtgtacgtct gttacgtttt ccctctatct ctcccgagga atcaaagtcc 1320
caaactcatt ttttttcttt ctctttttgg gtctcttctg ttcgtcgaca ggtggacgac 1380
tgggacttgt cggtttctcc cgatcatgcg aaacgtatac tctctcactg tctacgacta 1440
gacccttcga tctctcgaga tggtaccctc gaaggcatcg aaatcttgag gcacaacgtc 1500
gggctgagac cttctaggag ttctggaccg agagtcgaaa aggaaatcat cgagctgaac 1560
cacgaaaaga gtccgattcg gatcgggtct cgtctcgacg atgcgaccaa ggggaagagt 1620
gcgaagacac gtggagtggt ggtacacgct tacggagtgg gaccggcggg ataccagcag 1680
agttggggaa tcgcacaaga cgtcgtcaag ttgatacaag aaggagaagc acgagaatcc 1740
aagttgtag 1749
<210> 18
<211> 371
<212> PRT
<213> Sporobolomyces roseus
<400> 18
Met Pro Thr Arg Glu Pro Gln Arg Val Val Val Leu Gly Ala Gly Val
1 5 10 15
Ile Gly Leu Thr Cys Ala Leu Ser Leu Val Glu Gln Gly Tyr Thr Val
20 25 30
His Val Val Ala Arg Asp Leu Pro Glu Asp Thr Asp Ser Thr Ala Phe
35 40 45
Ala Ser Pro Trp Ala Gly Ala Asn Val Cys Pro Phe Lys Ser Leu Glu
50 55 60
Glu Gly Pro Arg Glu Ala Arg Trp Glu Thr Val Thr Phe Lys Lys Leu
65 70 75 80
Ser Thr Met Ile Pro Ser Gly Leu Ala Met Thr Leu Lys Gly Thr Arg
85 90 95
Arg Phe Ala His Glu Glu Ser Gln Leu Leu Gly His Trp Tyr Lys Asp
100 105 110
Val Val Pro Asn Tyr Arg His Leu Asn Arg Glu Glu Cys Pro Pro Asn
115 120 125
Ala Ile Gly Val Glu Phe Asp Thr Ile Ser Val Asn Ala Pro Lys Tyr
130 135 140
Cys His Tyr Leu Ala His Glu Leu Arg Ser Lys Gly Val Thr Ile Glu
145 150 155 160
Arg Arg Tyr Val Lys Ser Ile Glu Glu Val Phe Arg Glu Thr Phe Gly
165 170 175
Ala Arg Asn Asp Phe Val Val Asn Ala Thr Gly Leu Gly Ala Lys Ser
180 185 190
Ile Ala Gly Val Glu Asp Gln Glu Val Arg Pro Ile Arg Gly Gln Thr
195 200 205
Val Leu Ile Lys Ser Asp Cys Val Arg Cys Thr Met Asp Ser Ser Asp
210 215 220
Pro Thr Ser Ser Ala Tyr Ile Ile Pro Arg Pro Gly Gly Glu Val Ile
225 230 235 240
Cys Gly Gly Ser Tyr Gly Val Asp Asp Trp Asp Leu Ser Val Ser Pro
245 250 255
Asp His Ala Lys Arg Ile Leu Ser His Cys Leu Arg Leu Asp Pro Ser
260 265 270
Ile Ser Arg Asp Gly Thr Leu Glu Gly Ile Glu Ile Leu Arg His Asn
275 280 285
Val Gly Leu Arg Pro Ser Arg Ser Ser Gly Pro Arg Val Glu Lys Glu
290 295 300
Ile Ile Glu Leu Asn His Glu Lys Ser Pro Ile Arg Ile Gly Ser Arg
305 310 315 320
Leu Asp Asp Ala Thr Lys Gly Lys Ser Ala Lys Thr Arg Gly Val Val
325 330 335
Val His Ala Tyr Gly Val Gly Pro Ala Gly Tyr Gln Gln Ser Trp Gly
340 345 350
Ile Ala Gln Asp Val Val Lys Leu Ile Gln Glu Gly Glu Ala Arg Glu
355 360 365
Ser Lys Leu
370
<210> 19
<211> 1474
<212> DNA
<213> Sporobolomyces linderae
<400> 19
tctttcacac ttgtccacgc ggcccaagct tgtctgcgcg gcaacccgag cgcgcgagcg 60
cgcgagcgac gtttccgagt caccccctct ccgcccgctc tcccagcagc atggctcctg 120
ctgcctctcc acgtgtgctc gtcatcggag ccggcgcgtc gcccgcgctc gcgcgcgctc 180
gactgacttg gcaggcgtcg tgggcctaac gacggccgtg gagatccagc gcgctctgcc 240
tgagggtgcg cagtcgctgc gctgcccgag ctgaggcctc agccgccgtg accatcttcg 300
cggcgcagac agccgaggat ctcaagtcga cgcgctacac cagctcgtgg gccggcgcgc 360
atcacgtcac gctggagggc cccggtctgc agcgcgactg cgaggtggac acgttcaagg 420
cgctctgggc gctcgcgcac gacgatccga gcgtgccgtt gctcgtgtgc ccacagaccg 480
aggtgctgtc tgaccgccgc gcccgcttgc tcgctccagc gatcggctga gcgagctgta 540
cgcctcggca tgagccagct gacgccgatc aggtcttcga ggatgcgtcc aaggccgact 600
tcatgcgcaa gaatctcagc tcgttcatgc ccgacgtcaa gccgctcgaa ccttcagcgc 660
tgcccgaagg ctgcacagcg gggctgtcgt tcacgaccat cgcgctcgac acgccaaact 720
atctgccatg gctcgcgcag cgattccgcg cggccggcgg gaccgtcgtc cgtcgcgagc 780
tcggcaagct gagtgacgcg ccgctcgacg agttcgacgc cgtcgtcaac tgctcgggcc 840
taggcgcgct cacgctcgtc ggcgacgaca gcatgtaccc gatccgcggc cagaccgtgc 900
tcgtccgcgc gccgtggatc cgttccggca tcacgcgatc cggcagcgac aactggagtg 960
cgttgccgtt tcgttgtcga gctgatcgcg cagcatacat cattccgcgc aagcagggcg 1020
acgtgattgt tggcgggaca cgcggcatcg acgactggtc cgtcggcgcg cctggccaga 1080
ctgacgctgc aggcacgagc agcctcgacc cgaaacggcg tcggagatcc tcgcgcgcgg 1140
cctcaagctg tgccctgcgc tgctgcccga ggcgaagcgg gcgtcaatgc gcgtcgagga 1200
catcgacgtc gtggagcacg gctggtccgt tccgcttcgt cggccgcgct gacctcgcag 1260
cggcttccga ccggcgcgca aaggcggcgt ccgcatcgag ctcgaccacg tcgcggcgcc 1320
cgacggtcgg tcactgccgc tcgtgcacaa ctacggccac gctggcgccg gcttccagat 1380
gtcgatcggc tcggcgactc gcgctgtgga tctgctgcgg tctgcgctcg cgtcctgatt 1440
gtgcatgacg cgtcatgcac agggttgtct cgtc 1474
<210> 20
<211> 343
<212> PRT
<213> Sporobolomyces linderae
<400> 20
Met Ala Pro Ala Ala Ser Pro Arg Val Leu Val Ile Gly Ala Gly Val
1 5 10 15
Val Gly Leu Thr Thr Ala Val Glu Ile Gln Arg Ala Leu Pro Glu Ala
20 25 30
Ala Val Thr Ile Phe Ala Ala Gln Thr Ala Glu Asp Leu Lys Ser Thr
35 40 45
Arg Tyr Thr Ser Ser Trp Ala Gly Ala His His Val Thr Leu Glu Gly
50 55 60
Pro Gly Leu Gln Arg Asp Cys Glu Val Asp Thr Phe Lys Ala Leu Trp
65 70 75 80
Ala Leu Ala His Asp Asp Pro Ser Val Pro Leu Leu Val Cys Pro Gln
85 90 95
Thr Glu Val Phe Glu Asp Ala Ser Lys Ala Asp Phe Met Arg Lys Asn
100 105 110
Leu Ser Ser Phe Met Pro Asp Val Lys Pro Leu Glu Pro Ser Ala Leu
115 120 125
Pro Glu Gly Cys Thr Ala Gly Leu Ser Phe Thr Thr Ile Ala Leu Asp
130 135 140
Thr Pro Asn Tyr Leu Pro Trp Leu Ala Gln Arg Phe Arg Ala Ala Gly
145 150 155 160
Gly Thr Val Val Arg Arg Glu Leu Gly Lys Leu Ser Asp Ala Pro Leu
165 170 175
Asp Glu Phe Asp Ala Val Val Asn Cys Ser Gly Leu Gly Ala Leu Thr
180 185 190
Leu Val Gly Asp Asp Ser Met Tyr Pro Ile Arg Gly Gln Thr Val Leu
195 200 205
Val Arg Ala Pro Trp Ile Arg Ser Gly Ile Thr Arg Ser Gly Ser Asp
210 215 220
Asn Trp Thr Tyr Ile Ile Pro Arg Lys Gln Gly Asp Val Ile Val Gly
225 230 235 240
Gly Thr Arg Gly Ile Asp Asp Trp His Glu Gln Pro Arg Pro Glu Thr
245 250 255
Ala Ser Glu Ile Leu Ala Arg Gly Leu Lys Leu Cys Pro Ala Leu Leu
260 265 270
Pro Glu Ala Lys Arg Ala Ser Met Arg Val Glu Asp Ile Asp Val Val
275 280 285
Glu His Gly Cys Gly Phe Arg Pro Ala Arg Lys Gly Gly Val Arg Ile
290 295 300
Glu Leu Asp His Val Ala Ala Pro Asp Gly Arg Ser Leu Pro Leu Val
305 310 315 320
His Asn Tyr Gly His Ala Gly Ala Gly Phe Gln Met Ser Ile Gly Ser
325 330 335
Ala Thr Arg Ala Val Asp Leu
340
<210> 21
<211> 2157
<212> DNA
<213> Puccinia triticina
<400> 21
atggatggat gcactccatg gtttgatttg aaagacatgt ttgtaatata ccttgtctcc 60
gaggaggttt ccccgctcct gctgtgcaat caggtgcctt tatgtatttt gaggaccatc 120
attcctggtc tcaagccatt cagttaacat ctcatcaagt gcccaccccc aaggacatat 180
tatcgcccca cgaatctggt ccttcaatcc tcgagttgct agtgatctct ggtcatgtcc 240
gccccaccga gccaagagcc gccgtgcatt gtcaacgtca tcggatccgg tgtactcggt 300
ctcacctgtg cactcgagct cgccaaacag ccgggctcac catatcgtgt caatgtggtc 360
accgccgaaa gcgcgctgac tgcatggtct caagacccgt cgacgaagct cccggtggaa 420
ccagattttg cttccccttg ggcggtacgt gtttcaaatg agacacattt ctttcattca 480
ttttcattca tttggcagag aaaaaaaaat tatgagccgg aggaagaagt gacttgacct 540
cttttctgat tgcgcatgta gggtgctttc tggcacccct tcactcctca accagagacc 600
gagctgcaga aaagggtagc cggatgggag acgaagtcgt ttaagcatct ttgggagatt 660
gctgagcaag atccttcggt tgtcatggtt agcggctcag acggctcaag ccctccccat 720
ccacaccctc caagatctgc tgaaaacctt cgtttctcgg gggctattgt agaaagctga 780
cttcaagaaa tattatgacc atcggttgac tgaattaccg tggtatatgg acctatgtcc 840
ggaggtgaat tatccgttgg tttatatctg gacactccaa tctttccaat tgagtaaact 900
gacttgagag cgcacgtgat tgaaaggctc gaaaaatgaa cgacgaagaa ttagcgaagg 960
cgccagaagg aaaagtagat ggaataatct gtaaatccgt ttccttgaac ccaatccgtt 1020
acctggatta cctcagaaag caactggtca aatacgaagt ccaaatcatt caccatcgtc 1080
ttgaaaccgt ctcggaggct tttctggggg atcccaagtt tggcatcccg gcggcgaaaa 1140
tagtagtaaa tgcgtcaggt ctcggcgcgg gcagcttgtg tggtgtgtca gacgaattga 1200
tggagccgat tcgtggtcaa acgatcctca tcaggccccc tcaaccgatc caactaatca 1260
cacgggatga cgataaatgt atctacatct gctcgcgccc acctaccata cccggcgaag 1320
gcgaagaggt catcttgggt ggctcatatg aacctggcaa ctcctcttta tccatcgaca 1380
acggaatcgc cgataggatc ttgaccgaag cgctcaagct ccggcccgat cttagccgtg 1440
acggcacgtc caacggcatc gaaatattgg atcatattgc ggctttgagg cccagtcgca 1500
aggatggtcc tcgggttgaa agggaaaatt tcacgatttc taagaaagga gaaactcagg 1560
atgaaactgg gctcttggtc cattgttatg gaattgggta aatttcttcc ctcgttgtcc 1620
taacctggta attccttagc aaaccggtgg ctcaaattta cttccgtatt acactttttg 1680
cattgatcag aggaggaggc tttcaggtgc gtgaatgaag gcatttgatt tctgcctgag 1740
cgtaaagtga agagcatctc atcggtgatg attttttctt gcttcccgtg cacgtgaaag 1800
gcgagctacg gggcagcggc agaagttaga agcttgatag agactcagaa aaacatctct 1860
tgatcggtga cttgtctgga ggatttcatt caggtaaaac ttgatgtgtt gattggtcta 1920
tcagattgac ctcattaacc tcaattttag ttgttgcaga catgaaactc cacctcatta 1980
aaacatccgg gaatcaagta cagaacaagt attttaacag tttttgtttt cgtattagca 2040
cggaaatggg tgtgtttgct tgatgttgag aagtatcttt actaagcatg tcatgagagt 2100
taaatctaaa ttttccaagt acaagaaaaa aatgatagag attgcgttca atgtggt 2157
<210> 22
<211> 385
<212> PRT
<213> Puccinia triticina
<400> 22
Met Ser Ala Pro Pro Ser Gln Glu Pro Pro Cys Ile Val Asn Val Ile
1 5 10 15
Gly Ser Gly Val Leu Gly Leu Thr Cys Ala Leu Glu Leu Ala Lys Gln
20 25 30
Pro Gly Ser Pro Tyr Arg Val Asn Val Val Thr Ala Glu Ser Ala Leu
35 40 45
Thr Ala Trp Ser Gln Asp Pro Ser Thr Lys Leu Pro Val Glu Pro Asp
50 55 60
Phe Ala Ser Pro Trp Ala Gly Ala Phe Trp His Pro Phe Thr Pro Gln
65 70 75 80
Pro Glu Thr Glu Leu Gln Lys Arg Val Ala Gly Trp Glu Thr Lys Ser
85 90 95
Phe Lys His Leu Trp Glu Ile Ala Glu Gln Asp Pro Ser Val Val Met
100 105 110
Lys Ala Asp Phe Lys Lys Tyr Tyr Asp His Arg Leu Thr Glu Leu Pro
115 120 125
Trp Tyr Met Asp Leu Cys Pro Glu Ala Arg Lys Met Asn Asp Glu Glu
130 135 140
Leu Ala Lys Ala Pro Glu Gly Lys Val Asp Gly Ile Ile Cys Lys Ser
145 150 155 160
Val Ser Leu Asn Pro Ile Arg Tyr Leu Asp Tyr Leu Arg Lys Gln Leu
165 170 175
Val Lys Tyr Glu Val Gln Ile Ile His His Arg Leu Glu Thr Val Ser
180 185 190
Glu Ala Phe Leu Gly Asp Pro Lys Phe Gly Ile Pro Ala Ala Lys Ile
195 200 205
Val Val Asn Ala Ser Gly Leu Gly Ala Gly Ser Leu Cys Gly Val Ser
210 215 220
Asp Glu Leu Met Glu Pro Ile Arg Gly Gln Thr Ile Leu Ile Arg Pro
225 230 235 240
Pro Gln Pro Ile Gln Leu Ile Thr Arg Asp Asp Asp Lys Cys Ile Tyr
245 250 255
Ile Cys Ser Arg Pro Pro Thr Ile Pro Gly Glu Gly Glu Glu Val Ile
260 265 270
Leu Gly Gly Ser Tyr Glu Pro Gly Asn Ser Ser Leu Ser Ile Asp Asn
275 280 285
Gly Ile Ala Asp Arg Ile Leu Thr Glu Ala Leu Lys Leu Arg Pro Asp
290 295 300
Leu Ser Arg Asp Gly Thr Ser Asn Gly Ile Glu Ile Leu Asp His Ile
305 310 315 320
Ala Ala Leu Arg Pro Ser Arg Lys Asp Gly Pro Arg Val Glu Arg Glu
325 330 335
Asn Phe Thr Ile Ser Lys Lys Gly Glu Thr Gln Asp Glu Thr Gly Leu
340 345 350
Leu Val His Cys Tyr Gly Ile Gly Gly Gly Gly Phe Gln Ala Ser Tyr
355 360 365
Gly Ala Ala Ala Glu Val Arg Ser Leu Ile Glu Thr Gln Lys Asn Ile
370 375 380
Ser
385
<210> 23
<211> 1602
<212> DNA
<213> Puccinia graminis
<400> 23
atgtccaatg tcaacgtcat cggatccggt gttcttggcc tcacctgtgc tctcgagctc 60
gccaaacagc ccggatcacc ataccgtgtc actgtggtga ccgccgaaaa cgctatggct 120
agatggtctc aagacccgtc cacgaagctt ccagtggagc ccgattttgc ttctccttgg 180
gcggtatgtc ataaatagac tttcggttca tcagtttgaa tggaaaaaat gaaaagtgat 240
gaacagggta aagaaagaac cattttctga tctcgggatg ttctctaaat ttagggcgct 300
ttcttccacc ccttcactcc acaacccgag accgagctac agaaaagggt ggcctcatgg 360
gagaggaagt cgtttaagcc tctttgggag atcgctgagc aagatccttc ggtcgtcatg 420
gtcagcggtc tcagacggct aaaactctct atcttcatcc tccatcaaca cgtgctgagg 480
ttcttcatct ctcggtggct actagaaaac cgacttcaaa aagtattaca accatccgtt 540
gtccgaatta ccgtggtata tggatctgtt cccagaggtg aagaaatcat tggatgcgct 600
agattctctc tctacgcaag tgaactgact tgaggctaaa cattttcact ggaaggctcg 660
aaaaatgaac gccgaagaaa tagcgaatgg acccgaagga aaagtcgacg gcctgatctg 720
caaatcggtg accctgaacc cgatccggta cctagattac cttcgacaac aactagccaa 780
atatgacgtc cgcatcattc accatcgtct cgagaccgtc actgaggctt ttgagggcca 840
tcccgagtgc ggtctaccgg cggcaaagat agtgatcaat gcgtgtggtc taggcgcggg 900
caagataggg ggcgtgtcgg acggaatgat ggagccgatt cgcggccaga ccatgctcat 960
ccgcccccct caaccgctcc aactgatcac acgggacgac gagaaatgta tctacatctg 1020
ttcccgtcca cccacgatcc cgggagaagg cgaagaggtc gtcctgggag gctcttatca 1080
acctggcgac tcctcattgg agatcgatga ccaaatctct cataggatct tgtccgaggc 1140
actcaaaatc aggcccgatc tcagccatga cggcacggtt gaaggcgtcc aaatagtgga 1200
acatgtcgcg gctctgagac ctcataataa gaatggccct cgtgtcgaac gtgaagattt 1260
ccacattaaa tctactagtc aaggagagac tcagaattca actgggatat tggtccattg 1320
ttatggaatc gggttagtct tctatcgtct catccttcct cttcaatcaa attgatgaat 1380
taaaattgac ctctttcctg ctcacaatct ttgtatcgag caggggagga ggattccaag 1440
tgagtgaatc aaaaaaagac cgtgttcctt cttgtgacct ctgtttgaac ttgggattag 1500
ctcttctttg ctgacatatt cctggttatt ttgtttgttt gaaaggcaag ctatggggtt 1560
gcagaagaag tgagaaatct agtagaacaa ggccggtctt ga 1602
<210> 24
<211> 376
<212> PRT
<213> Puccinia graminis
<400> 24
Met Ser Asn Val Asn Val Ile Gly Ser Gly Val Leu Gly Leu Thr Cys
1 5 10 15
Ala Leu Glu Leu Ala Lys Gln Pro Gly Ser Pro Tyr Arg Val Thr Val
20 25 30
Val Thr Ala Glu Asn Ala Met Ala Arg Trp Ser Gln Asp Pro Ser Thr
35 40 45
Lys Leu Pro Val Glu Pro Asp Phe Ala Ser Pro Trp Ala Gly Ala Phe
50 55 60
Phe His Pro Phe Thr Pro Gln Pro Glu Thr Glu Leu Gln Lys Arg Val
65 70 75 80
Ala Ser Trp Glu Arg Lys Ser Phe Lys Pro Leu Trp Glu Ile Ala Glu
85 90 95
Gln Asp Pro Ser Val Val Met Lys Thr Asp Phe Lys Lys Tyr Tyr Asn
100 105 110
His Pro Leu Ser Glu Leu Pro Trp Tyr Met Asp Leu Phe Pro Glu Ala
115 120 125
Arg Lys Met Asn Ala Glu Glu Ile Ala Asn Gly Pro Glu Gly Lys Val
130 135 140
Asp Gly Leu Ile Cys Lys Ser Val Thr Leu Asn Pro Ile Arg Tyr Leu
145 150 155 160
Asp Tyr Leu Arg Gln Gln Leu Ala Lys Tyr Asp Val Arg Ile Ile His
165 170 175
His Arg Leu Glu Thr Val Thr Glu Ala Phe Glu Gly His Pro Glu Cys
180 185 190
Gly Leu Pro Ala Ala Lys Ile Val Ile Asn Ala Cys Gly Leu Gly Ala
195 200 205
Gly Lys Ile Gly Gly Val Ser Asp Gly Met Met Glu Pro Ile Arg Gly
210 215 220
Gln Thr Met Leu Ile Arg Pro Pro Gln Pro Leu Gln Leu Ile Thr Arg
225 230 235 240
Asp Asp Glu Lys Cys Ile Tyr Ile Cys Ser Arg Pro Pro Thr Ile Pro
245 250 255
Gly Glu Gly Glu Glu Val Val Leu Gly Gly Ser Tyr Gln Pro Gly Asp
260 265 270
Ser Ser Leu Glu Ile Asp Asp Gln Ile Ser His Arg Ile Leu Ser Glu
275 280 285
Ala Leu Lys Ile Arg Pro Asp Leu Ser His Asp Gly Thr Val Glu Gly
290 295 300
Val Gln Ile Val Glu His Val Ala Ala Leu Arg Pro His Asn Lys Asn
305 310 315 320
Gly Pro Arg Val Glu Arg Glu Asp Phe His Ile Lys Ser Thr Ser Gln
325 330 335
Gly Glu Thr Gln Asn Ser Thr Gly Ile Leu Val His Cys Tyr Gly Ile
340 345 350
Gly Gly Gly Gly Phe Gln Ala Ser Tyr Gly Val Ala Glu Glu Val Arg
355 360 365
Asn Leu Val Glu Gln Gly Arg Ser
370 375
<210> 25
<211> 1585
<212> DNA
<213> Melampsora laricis-populina
<400> 25
atgagcttca atccagagca taagagcgag cacttgaata tcatcggttc aggagtcctc 60
ggtctcactt gcgctctaga aatagcgaaa gaaaaaggac gttacactat aaccatcatc 120
actgcggatg ccgattcatc cacttggtca ccatcggctc caccaaaaat tgagaaagtc 180
gccgaggact ttgcttcacc ttgggcagtt gagtaaacct catcgaacca aaatctgtac 240
tcctgcctaa ctttcgttca agttttgcct tgaactttca agggcgcata ttggcaatca 300
tttgtagcga ctagagatcc taagacgttc aacgaaaaaa gattacaaga ttgggagaaa 360
acttccttca aagaattatg gaaaatctca gagacggaca aatcaattgt gatggtgaaa 420
tatttgattc ttggagttct cagcccaagg gatgtgttcg ttgaaacatc tcaacactat 480
tccagcaaac cgattgtcac gaatattttg atgaagaact tagtgaccat gagttacctt 540
ggtacaccga tttgtgtcca gaggttggct aaagtctttg cgattcaatt atgccaggta 600
aacaaaaagc taatggccac taccctcaat ccccaaccac aagtttcgac gactaacctc 660
atcagagctt gcaagtctgc cccgcccccg acaagcaggg atttcattca agacgatctc 720
actcaatccg atgatgtatc taacttttct gcatactcaa ttatccaaga tgggcgttcg 780
aatcgttcac catcgcttga actcgcttgc ggaagccttc gaaggcaata acactcttca 840
aattccgcgc gctgacatcg tcatcaatgc gtcaggtcta ggggctgcta ccttacttgg 900
tgtagaagac aaatctgtac atcccattcg tggccagcta gttctagtca aaccacctca 960
gccaatatgt ttctcgacaa gagattcttc aaggaagact tacatcatct ctcgtccttc 1020
cgttgacccg gagattgacg aggaagtaat actaggaggg tgctaccagg ctgataattt 1080
tgacctttca gttgaccccg atctgactaa tcacattctg tgtgaggctt tccagacacg 1140
gccagaccta agtagtgatg gtaccctaca gggaatacat gtattgaaag aggttgtagc 1200
gcttagacct gctagaaagg atggagctcg acttgaggta gagaaagtcg tcatttctgg 1260
ggaaaacaag catgctgtac attgctatgg aattgggtac gtcccttgtc tatttagtgg 1320
tcaaggcttc catacacttt ctatgcatcc cttcaagtga attactgctg agccatgtct 1380
tgatcgcttc ttacagtggt gctgggtttc aggtaagaga tgtccctctc tttcatggcc 1440
cttttgtcct ccgaatttac catatttttt ctgcttgtgg gtgcgaaaca attgccactc 1500
atttttcctt cagtcaagtt atggtatggc acaggaagca ttgggattga ttaaggcact 1560
tcgagagggt cgggaaactg tttaa 1585
<210> 26
<211> 378
<212> PRT
<213> Melampsora laricis-populina
<400> 26
Met Ser Phe Asn Pro Glu His Lys Ser Glu His Leu Asn Ile Ile Gly
1 5 10 15
Ser Gly Val Leu Gly Leu Thr Cys Ala Leu Glu Ile Ala Lys Glu Lys
20 25 30
Gly Arg Tyr Thr Ile Thr Ile Ile Thr Ala Asp Ala Asp Ser Ser Thr
35 40 45
Trp Ser Pro Ser Ala Pro Pro Lys Ile Glu Lys Val Ala Glu Asp Phe
50 55 60
Ala Ser Pro Trp Ala Gly Ala Tyr Trp Gln Ser Phe Val Ala Thr Arg
65 70 75 80
Asp Pro Lys Thr Phe Asn Glu Lys Arg Leu Gln Asp Trp Glu Lys Thr
85 90 95
Ser Phe Lys Glu Leu Trp Lys Ile Ser Glu Thr Asp Lys Ser Ile Val
100 105 110
Met Val Lys Tyr Leu Ile Leu Gly Val Leu Ser Pro Arg Asp Val Phe
115 120 125
Val Glu Thr Ser Gln His Tyr Ser Ser Lys Pro Ile Val Thr Asn Ile
130 135 140
Leu Met Lys Asn Leu Val Thr Met Ser Tyr Leu Gly Thr Pro Ile Cys
145 150 155 160
Val Gln Arg Leu Ala Lys Val Phe Ala Ile Gln Leu Cys Gln Met Gly
165 170 175
Val Arg Ile Val His His Arg Leu Asn Ser Leu Ala Glu Ala Phe Glu
180 185 190
Gly Asn Asn Thr Leu Gln Ile Pro Arg Ala Asp Ile Val Ile Asn Ala
195 200 205
Ser Gly Leu Gly Ala Ala Thr Leu Leu Gly Val Glu Asp Lys Ser Val
210 215 220
His Pro Ile Arg Gly Gln Leu Val Leu Val Lys Pro Pro Gln Pro Ile
225 230 235 240
Cys Phe Ser Thr Arg Asp Ser Ser Arg Lys Thr Tyr Ile Ile Ser Arg
245 250 255
Pro Ser Val Asp Pro Glu Ile Asp Glu Glu Val Ile Leu Gly Gly Cys
260 265 270
Tyr Gln Ala Asp Asn Phe Asp Leu Ser Val Asp Pro Asp Leu Thr Asn
275 280 285
His Ile Leu Cys Glu Ala Phe Gln Thr Arg Pro Asp Leu Ser Ser Asp
290 295 300
Gly Thr Leu Gln Gly Ile His Val Leu Lys Glu Val Val Ala Leu Arg
305 310 315 320
Pro Ala Arg Lys Asp Gly Ala Arg Leu Glu Val Glu Lys Val Val Ile
325 330 335
Ser Gly Glu Asn Lys His Ala Val His Cys Tyr Gly Ile Gly Gly Ala
340 345 350
Gly Phe Gln Ser Ser Tyr Gly Met Ala Gln Glu Ala Leu Gly Leu Ile
355 360 365
Lys Ala Leu Arg Glu Gly Arg Glu Thr Val
370 375
<210> 27
<211> 1098
<212> DNA
<213> Ustilago maydis 521
<400> 27
atgacaaatc aacttcacgt agtggtcctc ggcgctggag tgcttggact gaccgatgcc 60
tttgagctgc gcgaacgcgg ctacagagtg accatcctcg cacgcgatct acctttcgac 120
tctttctccc agaccttcgc cagtccttgg gctggagcca actggtgttc cttcgctact 180
ctcgacgaca agccagcaca gcgtcgagac gaaatcacgt ttaagaaatg gctcaagctt 240
cacacgcgtt taccagagga agtaatggca ataatggagt ttaccgatat cggcctcacc 300
aagcgagata ccaaggatgt atggttcagc aacctgactc ctgaattcag cgtcctgcca 360
gacgccgatg aaatgggagc gcatgcaatc aagtacaaat cttttactat tagcgtaccg 420
ctgtacacgc gctggttggt gtcggagttg acttcgacca agcccattct ccttgatgct 480
acgcgagccg gtccgccagt agaaatccga cgatgctcca cgctaaccag cttatccgct 540
gtacgatcac tcgtaccagg ctgcgatttg gtagtcaatg cgacaggcgt aggagcggca 600
gacttggccg acgtacgcga tcccaacgtc tacccaattc gtggacaaac cgttcttatc 660
aatgtaccat ccttcgcctc ccccaatcgc gctgctcgct gcgttatgaa gctctccaag 720
cccaacgcct actacgtcat tccacgagca aggtctgggc aagtcatcct cggtggaagc 780
tttgaacttc ggcaatcatc caccacccct gatcgcaact tggcggaaag gatcatggaa 840
gagtgcgcaa agctggtgcc tgaaattgta cccgagggaa agacatggaa agatatcgac 900
gttgtttctc acaatgtcgg cttgagacct gctagggaga atggggctag ggttgagttg 960
gagaggttgg gaggaaatgg gttgacggtg gttcattcgt atggaatcgg tccggcaggc 1020
tatcaggcta gttttggtat cgcaaaggag gtggctgatc tggtggataa gcatgctggt 1080
cgccagtcga ggctgtag 1098
<210> 28
<211> 365
<212> PRT
<213> Ustilago maydis 521
<400> 28
Met Thr Asn Gln Leu His Val Val Val Leu Gly Ala Gly Val Leu Gly
1 5 10 15
Leu Thr Asp Ala Phe Glu Leu Arg Glu Arg Gly Tyr Arg Val Thr Ile
20 25 30
Leu Ala Arg Asp Leu Pro Phe Asp Ser Phe Ser Gln Thr Phe Ala Ser
35 40 45
Pro Trp Ala Gly Ala Asn Trp Cys Ser Phe Ala Thr Leu Asp Asp Lys
50 55 60
Pro Ala Gln Arg Arg Asp Glu Ile Thr Phe Lys Lys Trp Leu Lys Leu
65 70 75 80
His Thr Arg Leu Pro Glu Glu Val Met Ala Ile Met Glu Phe Thr Asp
85 90 95
Ile Gly Leu Thr Lys Arg Asp Thr Lys Asp Val Trp Phe Ser Asn Leu
100 105 110
Thr Pro Glu Phe Ser Val Leu Pro Asp Ala Asp Glu Met Gly Ala His
115 120 125
Ala Ile Lys Tyr Lys Ser Phe Thr Ile Ser Val Pro Leu Tyr Thr Arg
130 135 140
Trp Leu Val Ser Glu Leu Thr Ser Thr Lys Pro Ile Leu Leu Asp Ala
145 150 155 160
Thr Arg Ala Gly Pro Pro Val Glu Ile Arg Arg Cys Ser Thr Leu Thr
165 170 175
Ser Leu Ser Ala Val Arg Ser Leu Val Pro Gly Cys Asp Leu Val Val
180 185 190
Asn Ala Thr Gly Val Gly Ala Ala Asp Leu Ala Asp Val Arg Asp Pro
195 200 205
Asn Val Tyr Pro Ile Arg Gly Gln Thr Val Leu Ile Asn Val Pro Ser
210 215 220
Phe Ala Ser Pro Asn Arg Ala Ala Arg Cys Val Met Lys Leu Ser Lys
225 230 235 240
Pro Asn Ala Tyr Tyr Val Ile Pro Arg Ala Arg Ser Gly Gln Val Ile
245 250 255
Leu Gly Gly Ser Phe Glu Leu Arg Gln Ser Ser Thr Thr Pro Asp Arg
260 265 270
Asn Leu Ala Glu Arg Ile Met Glu Glu Cys Ala Lys Leu Val Pro Glu
275 280 285
Ile Val Pro Glu Gly Lys Thr Trp Lys Asp Ile Asp Val Val Ser His
290 295 300
Asn Val Gly Leu Arg Pro Ala Arg Glu Asn Gly Ala Arg Val Glu Leu
305 310 315 320
Glu Arg Leu Gly Gly Asn Gly Leu Thr Val Val His Ser Tyr Gly Ile
325 330 335
Gly Pro Ala Gly Tyr Gln Ala Ser Phe Gly Ile Ala Lys Glu Val Ala
340 345 350
Asp Leu Val Asp Lys His Ala Gly Arg Gln Ser Arg Leu
355 360 365
<210> 29
<211> 1267
<212> DNA
<213> Sporisorium reilianum
<400> 29
atgaccggac agtctcacgt cgtggtgctt ggagccggag gtaagcaacg cttcagtagc 60
cagttgatga tgatcagcgc aactcactcg atttccgctt cctcgtgttg ttcgacagtg 120
ctcgggctga ccgacgcctt tgagctgcga gagcgaggct acaaggtcac catcctcgcc 180
cgcgatctgc cgcaggactc cttctctcaa acgttcgcca gtccttgggc ggtgagtagc 240
aaccacgacc tcccaccagt cactcattga agatcaccac tgacacacct caccttttca 300
ccgcacgaca cagggagcca actggtgctc gttcgcaacg ctcaccgaca caccagccca 360
gcgtcgcgac gagatcacct tcaaaaagtg gctccagctc cacacccgat tgccaccgca 420
agtcatggcc atggtcgagt tcaccgacat cagccccgtc aagcgcgaag ccaaggacgt 480
atggttcagc cgactcactc ccaacttcgc cgtcatcccc gaaggcgacg gtacgggcgc 540
acacgcgatc aggtacgact cgttcaccat cagcgtgccg ctgtacacgc agtggctggt 600
ctcggagctc acatccccga agcccgtgct gttggacgcg gcgcgagcag gaccgccggt 660
cgagatccga cgctgctcga cgctggcgtc gctggcggct gtgcggtcgc tggtgccggg 720
gtgcgacgtg gtcgtcaatg cgacgggggt cggtgcgggc gatctggccg acgtgcgcga 780
tcccgacgtg tatccgatcc gcggacagac ggtgctcgtg tccgtaccgg cgttcaagag 840
ccccaacaac ggcgctcggt gcgtcatgaa gctcggcagc cccgccaagt acgtcatccc 900
acgagcgcgg tccggccagg tcatcctcgg cggttcgttt gatgttcgac agtccagcac 960
cacgcccgat aaagcgctgg cggacaagat cctgcaggac tgcgccaagc tcgtgccgga 1020
gatcgtaccg gagggcaaga cgtggcgcga gatcgatgtc atctcgcaca atgttggatt 1080
gaggccaggc agggacaatg gagccagggt ggagctggag cacatccaac ccaaggacgg 1140
cgctgccagg ttgacggtgg tccattcgta cggcatcggt ccggcgggat atcaggccag 1200
ctttggcatc gcgaaggagg tggctgactt ggttgacgga cacctcgctc gtcaagctcg 1260
attgtaa 1267
<210> 30
<211> 368
<212> PRT
<213> Sporisorium reirlianum
<400> 30
Met Thr Gly Gln Ser His Val Val Val Leu Gly Ala Gly Val Leu Gly
1 5 10 15
Leu Thr Asp Ala Phe Glu Leu Arg Glu Arg Gly Tyr Lys Val Thr Ile
20 25 30
Leu Ala Arg Asp Leu Pro Gln Asp Ser Phe Ser Gln Thr Phe Ala Ser
35 40 45
Pro Trp Ala Gly Ala Asn Trp Cys Ser Phe Ala Thr Leu Thr Asp Thr
50 55 60
Pro Ala Gln Arg Arg Asp Glu Ile Thr Phe Lys Lys Trp Leu Gln Leu
65 70 75 80
His Thr Arg Leu Pro Pro Gln Val Met Ala Met Val Glu Phe Thr Asp
85 90 95
Ile Ser Pro Val Lys Arg Glu Ala Lys Asp Val Trp Phe Ser Arg Leu
100 105 110
Thr Pro Asn Phe Ala Val Ile Pro Glu Gly Asp Gly Thr Gly Ala His
115 120 125
Ala Ile Arg Tyr Asp Ser Phe Thr Ile Ser Val Pro Leu Tyr Thr Gln
130 135 140
Trp Leu Val Ser Glu Leu Thr Ser Pro Lys Pro Val Leu Leu Asp Ala
145 150 155 160
Ala Arg Ala Gly Pro Pro Val Glu Ile Arg Arg Cys Ser Thr Leu Ala
165 170 175
Ser Leu Ala Ala Val Arg Ser Leu Val Pro Gly Cys Asp Val Val Val
180 185 190
Asn Ala Thr Gly Val Gly Ala Gly Asp Leu Ala Asp Val Arg Asp Pro
195 200 205
Asp Val Tyr Pro Ile Arg Gly Gln Thr Val Leu Val Ser Val Pro Ala
210 215 220
Phe Lys Ser Pro Asn Asn Gly Ala Arg Cys Val Met Lys Leu Gly Ser
225 230 235 240
Pro Ala Lys Tyr Val Ile Pro Arg Ala Arg Ser Gly Gln Val Ile Leu
245 250 255
Gly Gly Ser Phe Asp Val Arg Gln Ser Ser Thr Thr Pro Asp Lys Ala
260 265 270
Leu Ala Asp Lys Ile Leu Gln Asp Cys Ala Lys Leu Val Pro Glu Ile
275 280 285
Val Pro Glu Gly Lys Thr Trp Arg Glu Ile Asp Val Ile Ser His Asn
290 295 300
Val Gly Leu Arg Pro Gly Arg Asp Asn Gly Ala Arg Val Glu Leu Glu
305 310 315 320
His Ile Gln Pro Lys Asp Gly Ala Ala Arg Leu Thr Val Val His Ser
325 330 335
Tyr Gly Ile Gly Pro Ala Gly Tyr Gln Ala Ser Phe Gly Ile Ala Lys
340 345 350
Glu Val Ala Asp Leu Val Asp Gly His Leu Ala Arg Gln Ala Arg Leu
355 360 365
<210> 31
<211> 1000
<212> DNA
<213> Rhodosporidium toruloides ATCC 10657
<220>
<221> misc_feature
<222> (779)..(806)
<223> DNA motif 1
<400> 31
ctgatcgctt gtgtgcgaga ggtcgaccat catgccgagc ctgttcagct ccggtacaag 60
ctcgcgcccg aaggcggtca ggccgttccc gtcgtgtaca ggctcgatag gagagccgtc 120
cccggcggaa gaggcgaagg ctgtgagaaa aacccgtcaa cagagcggaa gaaggccgag 180
aggtcgcctc gcctcacaag tgtggcaggt gtgcgtgagc gtaaggtacc gcacgccgag 240
ttgctgaaag aggcgtagga tggccagcga gttcatcagg tgatgcgagc tgtaggaaga 300
gcgggttagc gggaggatgt cggtagagac tgttcgtaca aacccctcta gcccaatcaa 360
ggacgcgatc ttcccctccg cgaacgcact ccgcacctcg tccgccgttc gagcgagcgc 420
catctcctca ggatagtgct ccaccatccg atgaataagg tcgacgctct cgagtgccca 480
ctcgaccgcg ttcgtgggct caaggaagtc ctcccccgtc ggctgcgcat cacacggagc 540
atacgcaaca tggaacaagc ctcctacgcg tccttgacgc aacttcggga ggtcgacatg 600
gcctgcaaga ccggtcgcaa gttcagggag gacgtcgagc ggtctccggc agaggtggcg 660
agcgacgtag gggaggtcga cgtgtccgtc tatgagtggg tggcgtttca ggatcccgcg 720
ggcctcagcg agcaaggact cgttgggcaa agtgaaggtg tactgatgag cggttgcgag 780
gccgcagagc agcgctgcga cgacgggaag cttcggcacg agcatgactg tgagtagtag 840
tccaaggaga acagcgcaga gtcggcagga gggcacatgg aggcagagcg tggggcggag 900
gaggcagatg gggagtcgcg ctgggggacg agagggtgcc gctcgaccaa ctgctctctt 960
tcgctcttgc tgctgcttgt actgctcgaa cgacgccatg 1000
<210> 32
<211> 1000
<212> DNA
<213> Rhodosporidium toruloides MTCC 457
<220>
<221> misc_feature
<222> (779)..(806)
<223> DNA motif 1
<400> 32
tctgatcact ggtgtgcgag aggtcgacca tcatgccgag cctgttcagc tccggtacga 60
gttcgcggcc aaatgcagtt aggccattcc cgtcatgcac aggctcgata ggagagccat 120
cgccggcgga agaggcaaag gctgcgggag cattgggtca gcaagctaac cgaagtgaag 180
gactggatcc gctcacaggt gtggcaggtg tgcgtgagcg tgaggtatcg cacgccaagt 240
tgctggaaga gtcgcaggat ggcgagcgag ttcatcaggt gatgggagct gttcgcaaga 300
gccagtcagc gggacgaagt cgggatagac tgttcgtgca cacccttcca agccaataag 360
cgacgcaatt ttgccctccg caaacgcact ccgcacctcg tccgctgtcc gagcgagtgc 420
catctcttca ggataatgct cgaccatccg atgaatgagg tcgacactct cgagcgccca 480
ctcgaccgca ttcgtcggct cgaggaagtc ctctcccgtc ggttgcgcat cgcagggagc 540
atacgcgaca tggaacaagc ctcctacgcc tcctcgacgc agtttcggga ggtcgacatg 600
gcctgcgagg ccggttgcga gttcagggag gacgtcgagc ggtctccggg agaggtggcg 660
ggcgacgtag ggaaggtcga cgtgtccgtc gatgagtggg tggcgtttca ggatcccgcg 720
ggcttcagcg agcaaggagt cgtcgggtaa agtgaaggtc gactggtaag cgtttgcaag 780
gccgcagagc agcgctgcga cgacgggaag cttcggcacg agcatgagtg tgaatgatgg 840
tccaaggagg acagcgcaga gtcaacagga gggcacatgg aggcagagcg tggggcggag 900
gaggcagatg gggagtcgcg ctgggggacg agggggtgtc gctcgactaa cagctctcta 960
tcgctcttgc tgctgcttgt actactcgaa cgacgccatg 1000
<210> 33
<211> 1000
<212> DNA
<213> Rhodosporidium toruloides NP11
<220>
<221> misc_feature
<222> (779)..(806)
<223> DNA motif 1
<400> 33
tctgatcact ggtgtgcgag aggtcgacca tcatgccgag cctgttcagc tccggtacga 60
gttcgcggcc aaatgcagtt aggccattcc cgtcatgcac aggctcgata ggagagccat 120
cgccggcgga agaggcaaag gctgcgggag cattgggtca gcaagctaac cgaagtgaag 180
gactggatcc gctcacaggt gtggcaggtg tgcgtgagcg tgaggtatcg cacgccaagt 240
tgctggaaga gtcgcaggat ggcgagcgag ttcatcaggt gatgggagct gttcgcaaga 300
gccagtcagc gggacgaagt cgggatagac tgttcgtgca cacccttcca agccaataag 360
cgacgcaatt ttgccctccg caaacgcact ccgcacctcg tccgctgtcc gagcgagtgc 420
catctcttca ggataatgct cgaccatccg atgaatgagg tcgacactct cgagcgccca 480
ctcgaccgca ttcgtcggct cgaggaagtc ctctcccgtc ggttgcgcat cgcagggagc 540
atacgcgaca tggaacaagc ctcctacgcc tcctcgacgc agtttcggga ggtcgacatg 600
gcctgcgagg ccggttgcga gttcagggag gacgtcgagc ggtctccggg agaggtggcg 660
ggcgacgtag ggaaggtcga cgtgtccgtc gatgagtggg tggcgtttca ggatcccgcg 720
ggcttcagcg agcaaggagt cgtcgggtaa agtgaaggtc gactggtaag cgtttgcaag 780
gccgcagagc agcgctgcga cgacgggaag cttcggcacg agcatgagtg tgaatgatgg 840
tccaaggagg acagcgcaga gtcaacagga gggcacatgg aggcagagcg tggggcggag 900
gaggcagatg gggagtcgcg ctgggggacg agggggtgtc gctcgactaa cagctctcta 960
tcgctcttgc tgctgcttgt actactcgaa cgacgccatg 1000
<210> 34
<211> 1000
<212> DNA
<213> Rhodotorula glutinis ATCC 204091
<220>
<221> misc_feature
<222> (779)..(806)
<223> DNA motif 1
<400> 34
ctgatcgctt gtgtgcgaga ggtcgaccat catgccgagc ctgttcagct ccggtacaag 60
ctcgcgcccg aaggcggtca ggccgttccc gtcgtgtaca ggctcgatag gagagccgtc 120
cccggcggaa gaggcgaagg ctgtgagaaa aacccgtcaa cagagcggaa gaaggccgag 180
aggtcgcctc gcctcacaag tgtggcaggt gtgcgtgagc gtaaggtacc gcacgccgag 240
ttgctgaaag aggcgtagga tggccagcga gttcatcagg tgatgcgagc tgtaggaaga 300
gcgggttagc gggaggatgt cggtagagac tgttcgtaca aacccctcta gcccaatcaa 360
ggacgcgatc ttcccctccg cgaacgcact ccgcacctcg tccgccgttc gagcgagcgc 420
catctcctca ggatagtgct ccaccatccg atgaataagg tcgacgctct cgagtgccca 480
ctcgaccgcg ttcgtgggct caaggaagtc ctcccccgtc ggctgcgcat cacacggagc 540
atacgcaaca tggaacaagc ctcctacgcg tccttgacgc aacttcggga ggtcgacatg 600
gcctgcaaga ccggtcgcaa gttcagggag gacgtcgagc ggtctccggc agaggtggcg 660
agcgacgtag gggaggtcga cgtgtccgtc tatgagtggg tggcgtttca ggatcccgcg 720
ggcctcagcg agcaaggact cgttgggcaa agtgaaggtg tactgatgag cggttgcgag 780
gccgcagagc agcgctgcga cgacgggaag cttcggcacg agcatgactg tgagtagtag 840
tccaaggaga acagcgcaga gtcggcagga gggcacatgg aggcagagcg tggggcggag 900
gaggcagatg gggagtcgcg ctgggggacg agagggtgcc gctcgaccaa ctgctctctt 960
tcgctcttgc tgctgcttgt actgctcgaa cgacgccatg 1000
<210> 35
<211> 1000
<212> DNA
<213> Rhodotorula graminis WP1
<220>
<221> misc_feature
<222> (693)..(720)
<223> DNA motif 1
<400> 35
agcgagggag tgtgtatatt cgcagaggga gactcgcaac aagcaaatct gtacgaccgt 60
cgccgaccca ttgtaccacc ccctcccctc gtagtcgtct gctgcaacct gccctcctct 120
cccatctctc ggaccgtcgt gagcggcccc gagagcgctt gcgacctcgc tctggctcgt 180
gcgcttcgag ttgtcgagct gcgagggtgc ggcttggcga tgtcgtcggg gtggaaggtg 240
ctgtggcgga cctgcatgcg tcggagggac agggagagaa agagagtcag tgaggttgct 300
cgggacgagg agaacggctg cttgtgctct tgaagcggga ggggggccaa aggatcagat 360
ctggcctaat gtgtcgccat gtcgagcgcc tcgtcctcgc cgatccagtc gagcgcaccg 420
cgccgccgga acgcacagcg cgagggaagg gttggcgacg gcgagtgagg tccgtcgaag 480
agggagggca ggacgagagg cgccacgaga actcggatat ccattctgtg tgtgtcatcg 540
tgtcgagagg ggccctcctg cttcgcgttc gagtgagaga gagctcacct cgaggttcga 600
gtgcgagtcg agcggtcggg gcgagggctc agccggcggg gatgccgcgc ttgtggtgct 660
tgacggcggc gaggctcatg ctcatggtga cgaggacgaa gccgaggaac ttgaagaagg 720
cggtgcgcga gtactcgcgc tcctcgagag gcgagcggaa cgaggcgaac tggacggtgg 780
ggacggggtc agcgcggggc acgcacgagg gaggggagga gagggtgcgc acaatgttgc 840
gcaggttggg cagagccatg gcggtgttgg tcgagcgagt cgagtgaccg tcctggacga 900
gacgtcgagc gacaacgacg cttggctcca ccgccgcgcc cgctgcagca ctagccgctc 960
ccgctgagcc agcttgctcc ctctcgttcg cactacaatg 1000
<210> 36
<211> 1003
<212> DNA
<213> Sporobolomyces roseus
<220>
<221> misc_feature
<222> (748)..(775)
<223> DNA motif 1
<400> 36
cctagctatc aagtgattga actctcgagg cgaaggaaag agacagagat agagagcgag 60
agcgaggtgt gtcggaggag cgcttggatt gactagtagg aaggtgtcga tttgatcgcc 120
tcgtctcgtt ggcggagaaa ggaggggggt gccgtctgcg cgcgtggggc acggatgaac 180
gaacgaaact gttggacccg cccaagccgg aaacaaccaa gttttcggat cgccccgaag 240
atcctgcctg tcgcccgaac gaagaaggga acgagttttt ttagtcagct ctatttggat 300
cgtctctggg aggtcgcgaa cgtggttccg tagaaaagta ggttcagatc tggccttgtt 360
tctttcttcg ccatgagaga ggaacaatga gaaacctcgc ccttgtacat ctccaacctg 420
gtccccactc atcctttctc cgattcctct agagacgcac actccgagga gagggttcct 480
tgagagagag gaagagagcg aggcggttga atgaaggacg acaaaagacg agatctcaga 540
ttgttcgaga gagtgtgtgt gtgaatgtcc gatatccatt ctgttgctat attgctcatc 600
ctgtactttg ggtatacgct gccgacgcta gcgagctaga gagagcgaga gagagagaat 660
gctcaccttt tggttcatca acgcaggagg atcgatagat ggttgcgttt gttctttgtc 720
gcgatcaaac tcatgctcat cgtgacgagg acccagccga ggaacttgaa gaaggccgta 780
cgagagtact cgcgttcttc gagcggagat cgaaacgatg caaactgatc gatccacggg 840
aacccggcgc gtcagtctcg atccaacagt tggaagagta ccaccagact cacaatgttg 900
cggaggttgg gtagagccat gtttcagagt gaggaatccg aggacaaacg atcagcttga 960
ctcttgacac ttgactcttc actcttgttt cccttcgatc atg 1003
<210> 37
<211> 1003
<212> DNA
<213> Puccinia triticina
<400> 37
ctgtctttcc aaagaaaaaa gaaaacagta tttacgcaaa aagaataaat gaacgctggt 60
caggttactg accagcttaa tttttacttc cttggtttgt ctaggatata tagtggtttg 120
ataagaaact ggctttcgct ttcaatagca tcacatggcg tatggtacaa attaccacaa 180
ccattaaatc tggtgcctgt ctaccgtagt accacgtcag aaggaaaagg actgagtaag 240
tttgattatc cactggctct gaaggctctg atccggacac cgcagatccg tcgaaatgcg 300
gcaaccctcc agacccgatc cgtattcggg acggagctga tgaaatctag gatccggccg 360
taaaagtgag gctttgggta aaccccggaa agccgcctca gatcggggat tccttcgggg 420
aattcctggg aatctcgcag cacgagctta ttgttgtact tttgtttttg caataaatat 480
caaaaatagc cacattgaaa tccagttgaa tccgaccgga ttctggatac gaccagggag 540
agggtgcggg ataggtgata tattccagct ccgaggcacc ggattggacc ctcaaaattt 600
attctggctc gaaggagacg gcgatggaag cttcactgtg tgatggctac cattcagttc 660
tccaccagga agtgaggttt ggcaacagtt tcagccgata gcatatcatg ccctcatctg 720
tatatcctct tcagcatcgg tggtctttaa ccctggtgga ccaagcatgg atggatgcac 780
tccatggttt gatttgaaag acatgtttgt aatatacctt gtctccgagg aggtttcccc 840
gctcctgctg tgcaatcagg tgcctttatg tattttgagg accatcattc ctggtctcaa 900
gccattcagt taacatctca tcaagtgccc acccccaagg acatattatc gccccacgaa 960
tctggtcctt caatcctcga gttgctagtg atctctggtc atg 1003
<210> 38
<211> 1003
<212> DNA
<213> Puccinia graminis
<400> 38
tcccaagaaa atgtccattt ttcaaggggg gtggggccca ataaccggcc tgtgtaccta 60
aagtgttaca cagaaagata gagaagatct gggggatttt gtctgtctaa aaggcagaga 120
ttcattccag tggaaaggga gggaaatggt tggaggaaac tttttcccta tcaacagctc 180
ccagcttgca cacaaaaaca cagaccttca gggcaagtcc ctcctttgga ggggtgcccg 240
gtgctttgca ccagcctgat ctcaggccct ccgattgagg ggcttgtggt taggaatcaa 300
aaaacaggga tttgtataca acagcatttg atccagtttg atgtgaattt cagacctgat 360
tcctgttcct ggagggtttt cctagacagg agcacagttt cacaagtggt ctttctcttt 420
actgggtttt gacctgcaca ggctcttgag gcagttttga aaccccctat tgggttaggt 480
ggtgaacagg aatgatcttt tcattacttt caaaaaatca tagaagggga accaagctgg 540
cagatgagga gatgagacca cctgccaaat gaaagcttgg tcctaaaagt tcaatctggc 600
tctgagccag gctcgaggcc tgtagagcat tataaggcta aggagccagg gccttaacaa 660
attaatccat tcacttgcca gccatttgca tttgatgtcc caaccaaaaa atttggcttg 720
gggagttgtg atatgtaagt gaggaaggac ttggttaagt caggctcggc tcgagaaaca 780
gccgactgcg taactccatt ggcatttgga tgagttgata gtggaatggc cagtgctcat 840
gggttccagt gaaatcgatt gatctctcca aagaaatctt aaatattagc ctgaagaaac 900
ataagcatca ctgctcactt aaaatcatcc ttaacaagtc attcatatcg aattcctacc 960
cccctgaatc tgatcggttg agccgccagt atctcttgtc atg 1003
<210> 39
<211> 1003
<212> DNA
<213> Rhodotorula minuta
<400> 39
gtggcatttg ctccattgac tgatccatcg tctgttccct caatagatcc ctctcttgtc 60
cttgtagtgt catcctctac tatgtgctgg tcctctcctt gctgaggatg ttgccctccc 120
tcattctccc tggaatgctg ctcttccatg ctaccttccg tatcgctctt ctccttcttc 180
aaacgcagcg acgagctagc tgactactac tactcttctg gatcaggtct cttatctaat 240
aatgaacgct ttcaaagcat gcttttatac accccggtga ctacggtgat ggatgtgata 300
tctttctcgg tcatcaaaga gaagagccgc ctcagaatga ctgttcgaaa gagagctaac 360
tcggtcattt ggagaaatga cacacattca caaagacacc gactcttttg cctttctggc 420
cagcaataaa caactacagg tatacatctg cattctaacg tgcattgatg gagtggacag 480
cagctcaaca atgccaatgc aggccatacg aagtccgcct accgcagctg ccaacgccag 540
ctttgaagat cacgagaacg ttgtagtcag agctagatag ggcaccgtgc tcctctgagg 600
ccatgcagac cttctgaaga ctttagcagt catatatacc tgcctcatgc tgccttagga 660
gcccattgct gccttccgta cacaataagc ggtttcctcg cctcagacct gtactttgga 720
agacgtatgc cactattccg ctgggtcatc catgtgggcg ccggaaaacc cacacgatgc 780
aagcgtgcga gcagaatgct aatcaaagcc agattgctat acattacgag tcaaagccgt 840
atccgctagc tgtgcgagcg accacgcaga aatgtcaatg ctttcaagat aagctatctt 900
tggcttctta gcaggccgat cgggcgtctc tcaaacaagt tcaaacggac cggaagcgat 960
aacctgcttt tcttcttcat aaccacacat tctgacaagc atg 1003
<210> 40
<211> 1000
<212> DNA
<213> Sporobolomyces linderae
<220>
<221> misc_feature
<222> (716)..(743)
<223> DNA motif 1
<400> 40
tcgagccatc aggccgacct cgaccgggcg cgcttcgatc tcagatcagc cgggccgccg 60
acgatggagt accggagtcg gtcggtcccg caggcgccgg ggtattggcc gcagccgccg 120
tcgttgccgc cgagccatcc ggcgcaggcg atgatggcgc cgccgctgat cgcgccgccg 180
ccgctcgggc gacgagcgac cgtgccatcg ccgtcgcatt cgctcggcgg gccgtggacg 240
catcaggcgc cgccatcggc ctacacgcat ccgcaggccg cggccttcta ctcgccgcca 300
ttgccgacgt cgccctactc gcccgcggcc tcgcccatgt cgccgtccga ttcgaccacg 360
tcggcgggcg acagcgacct gccgcgctac gcgtgtacgc agtgtccgaa gcgattctcg 420
tgcgctcgtc gttcttcttc gcaacgctga cctcgcagtc gcccctcttc gctgcgcatt 480
caccagtaca gccactcggg cgagcggtgc gtcggcgatg catcgggcga tctgaccatc 540
taggcccttc gtctgcgaag agtgcggtcg cggcttcagc gtgcaggtgc gtttgcgctg 600
cagtgccttg atctgaccgg ctctcagagc aatctgcgtc ggcacggccg cgtccatcag 660
cccaagtcgg gcgtgccgcc ttcgcccgct gcgtccaccg tcacgatcgt cgaggaggac 720
gactacgacg aggatgagga cgcgatgcag gtgggatgag gcggcgacgc ggcgctgtca 780
atggcgctgt cggagcgaag ttcacgttcg atcgtccatt cgacgatacc cacgccaatc 840
tgtgtacaac acatgctcct ccgttaccct gtgcactatc atacaagtct ttcacacttg 900
tccacgcggc ccaagcttgt ctgcgcggca acccgagcgc gcgagcgcgc gagcgacgtt 960
tccgagtcac cccctctccg cccgctctcc cagcagcatg 1000
<210> 41
<211> 1003
<212> DNA
<213> Ustilago maydis 521
<220>
<221> misc_feature
<222> (533)..(560)
<223> DNA motif 1
<400> 41
gagtaacgtg caggagccgt agtccgagtg agaaccagca cggatgcttg tagttgccga 60
tgtgtcagta gatgaatcgc aaacggcagt cggaggatag tgaatcagcc gcaatcgatc 120
atgctggcca tgatgtgaat cggcaaagta tctcgtaggc agatctatcg cctccgcaaa 180
gcctgctaaa actgtatcgc agacaccctt gcatttttcg atgaaggtcg caatcgcttc 240
tcgatgctgt gacagtgttg gcggtagcgt ctgtgaaggc ggtcgatact gctcctcaac 300
tgtcgacgat cccccttcag ctcgagagag gccagcgagg tagaacgact ctttgagatc 360
gccttcagcc ttgctctttg gatcaagacg ctcttgcatc atcgatgtgt agcccgtatt 420
gttattccgg tcctggtggc tctggcgctc agcttccgac tcatttagga agaactcggc 480
actttgactg aagagcagat cgatttcgtc ctggttgata ccatggtggg tgaggtagaa 540
gaagccggtc ttgacgacgg catccaagat ccgtgcaccg aggggtgctc cagcgtcgtc 600
gctatggagt gaaatgatag gaatcggagt tgcttcggcc attctgatag caaatgggtt 660
aaacttcagc ggtccgctcg gcctcgatct ttggagaaaa gtagaagaga cagtcacgag 720
taacacagtg acagcgatca agcaagaaac gttgagcaaa cagaggtaag gtcccttgga 780
actgcgcttt gttttagttt ttctgcctca acaagcaact gtgcgcccac tgaatttccc 840
ggtggaaaag ccggcctgat acggcagtta ccaagccaat gagatcaatt cagaaaccac 900
atatctcctt ggagccaacg tcgctcccga ccatcgccac gcctactact cgcgtacctc 960
gccacgctac tacctctgat cagcattgcc atctagcgcg atg 1003
<210> 42
<211> 1003
<212> DNA
<213> Sporisorium reilianum
<220>
<221> misc_feature
<222> (610)..(637)
<223> DNA motif 1
<400> 42
accacaatgc atcccctttg cggtggaatg tcgacccact ggcccggctt catctcgact 60
tgcagcccgc cgacgtcctt ttggaagagc agcgtacacg agccgtagtc cgaatgagaa 120
cctgcacgga tgcttgtcgt cgcagcgtcg tcgctcgata cgggagttgg aggatagtgg 180
atgaggcgca atcgatcatg ctgtccatgg tgcgagtcgg caaagtaccg cgagggcaga 240
tcgatcgctt ccgcaaagcc ggccaggatc gtatcgcaga cgcctttgca cttttcgatg 300
aatgtcgcga gcacctcttt gtgctgcgac agtgtgggcg gcaacgactg tgacggaggt 360
cgatagcgct cttctgcggg agacgagcct ccttccaccc tggccaggcc cacgagatag 420
aatgactcct tgaggtcgcc ttccgccttg ctccccgtat ccagccgctc cgacttcatc 480
gccgtatagc ccgtgttgtt ggcgcggtct tggcattgta gccgctcgtg ttccgcttcg 540
tggaggaaga actgcgcgct ctgatcgaac agcaggttga tctcatcctg gcggatgccg 600
tggtcggcga ggtagaagaa gcccgtcttg acgacggcgt ccaagatccg tgggcccaac 660
gctgactcgt cgctgccgcc ggtgcggagg gagatgattg gaatcggtgt cgagtccgac 720
atctttgttg tgcgatgtgt cgaggaggac gagaaagcgg gacagaagca gcgacgaaca 780
gacgagagga cccttgacgg agctttattt ttttgcttgg ctcgataaga gagagagacg 840
gcccgctgat tttcccggct gaaaagacgg cgagaaacga ttgtgcggac ccaatcagaa 900
gaagaaaagc gggactcgta cagctccgca ccaccttacc atcatccatt tgtcgacccc 960
attcctcgcc gagctcgata catcatacaa cactgcaaga atg 1003
<210> 43
<211> 1003
<212> DNA
<213> Melampsoria laricis-populina
<400> 43
gcaagtgact tgagctggtt gtagttggct gctttatgaa tagtccctgg gtgatgtttg 60
ggctggtgat gtagttcatt tttgacaaaa atacctgttg ggtgggtatc tgaggatgtt 120
aatcttttca ggatcaagtt gtgtgtgatg tctccgcttt gataaccatg tgaatggtgt 180
gagatatgtg tagtggcttt catttgtttg aagtgcattt gaaagctcta acaaataatt 240
cattttctgc gttttgtctc ttttctgata gtctgtttac tttcatgttg ttcagttatg 300
tgtctggggg tgggcatctg gctgtagact acccccaaaa gtaggctctc ctccagtagg 360
gctctgggga aggtgggagg gcatataaaa agttgaggat ttgtgttcca agagcaccca 420
ctatggttgt gttaacaaca tgatttaggg tcagtctcct gctaaaatac agacaggtcc 480
actctagacc tgacttagac ctgcggtcca tacaactttg tcaaatcttg caccctgcgt 540
gttcaaatct acaaccacct acaacttgat ttatagtagg aactaggtaa agcagatgac 600
ccatagtgga tttcatgtgg ttaccaactt aggtaaaaca tgcatgttca aattttgcgt 660
tgaggaacgc aaaatttacg atcaaacact cttaccatag tggattctct aagagctatt 720
gagtgtgtgc tggaacttgt gatacgcggt atacgaaaag cgcgcattga gatttccaac 780
caatatctga gcggcccggt actcgggtct gcgacttttc ggctcacggg agttatccgc 840
gctcccaagc tcaggggtcc ggggaacatt cggaagtcgt cgtgcttttg gacatccgtg 900
gcatacaggg cgacatacca ttacagcctg tcggcacttg acactacttg acttcacttg 960
actctttcta gtcgaatcgc tcgaaagcgt gatagtatca atg 1003
<210> 44
<211> 29
<212> DNA
<213> Rhodotorula graminis WP1
<400> 44
gaggacgaag ccgaggaact tgaagaagg 29
<210> 45
<211> 29
<212> DNA
<213> Ustilago maydis 521
<400> 45
gaggtagaag aagccggtct tgacgacgg 29
<210> 46
<211> 29
<212> DNA
<213> Sporisorium reilianum
<400> 46
gaggtagaag aagcccgtct tgacgacgg 29
<210> 47
<211> 29
<212> DNA
<213> Sporobolomyces roseus
<400> 47
gaggacccag ccgaggaact tgaagaagg 29
<210> 48
<211> 29
<212> DNA
<213> Rhodotorula glutinis ATCC 204091
<400> 48
gaggccgcag agcagcgctg cgacgacgg 29
<210> 49
<211> 29
<212> DNA
<213> Rhodosporidium toruloides ATCC 10657
<400> 49
aaggccgcag agcagcgctg cgacgacgg 29
<210> 50
<211> 28
<212> DNA
<213> Sporobolomyces linderae
<400> 50
gaggacgact acgacgagga tgaggacg 28
<210> 51
<211> 1660
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic codon optimized Rhodosporidium toruloides LUC-2 gene
<400> 51
ccatggagga cgccaagaac atcaagaagg gcccggcccc gttctacccg cttgaggacg 60
gcaccgccgg cgagcagctc cacaaggcca tgaagcgcta cgccctcgtc cccggcacca 120
tcgccttcac cgacgcccac atcgaggtgg acatcaccta cgccgagtac ttcgagatgt 180
cggtccgcct cgccgaggcg atgaagcggt acggcctcaa caccaaccac cgcatcgtcg 240
tctgctcgga gaactcgctc cagttcttca tgccggtcct cggcgccctc ttcatcggcg 300
tcgccgtcgc ccccgccaac gacatctaca acgagcgcga gctcctcaac tcgatgggca 360
tctcgcagcc gaccgtcgtc ttcgtctcga agaagggcct ccagaagatc ctcaacgtcc 420
agaagaagct cccgatcatc caaaagatca tcatcatgga ctcgaagacc gactaccagg 480
gcttccagtc gatgtacacc ttcgtcacct cgcacctccc gccgggcttc aacgagtacg 540
acttcgtccc ggagtcgttc gaccgcgaca agaccatcgc cctcatcatg aactcgtcgg 600
gctcgaccgg cctcccgaag ggagtcgccc tcccgcaccg caccgcctgc gtccgcttct 660
cgcacgcccg cgacccgatc ttcggcaacc agatcatccc ggacaccgcc atcctctcgg 720
tcgtcccctt ccaccacggc ttcggcatgt tcaccaccct cggctacctc atctgcggct 780
tccgcgtcgt cctcatgtac cgcttcgagg aggagctctt cctccgctcg ctccaggact 840
acaagatcca gtcggccctc ctcgtcccga ccctcttctc gttcttcgcc aagtcgaccc 900
tcatcgataa gtacgacctc tcgaacctcc acgagatcgc ctcgggcggc gccccgctct 960
cgaaggaggt cggcgaggcc gtcgccaagc gcttccacct ccccggcatc cgccagggct 1020
acggcctcac cgagaccacc tcggccatcc tcatcacccc ggagggcgac gacaagccgg 1080
gcgccgtcgg caaggtcgtc ccgttcttcg aggccaaggt cgtcgacctc gacaccggca 1140
agaccctcgg cgtcaaccag cgcggcgagc tctgcgtccg cggcccgatg atcatgtcgg 1200
gctacgtcaa caacccggag gccaccaacg ccctcatcga caaggacggc tggctccact 1260
cgggcgacat cgcctactgg gacgaggacg agcacttctt catcgtcgac cgcctcaagt 1320
cgctcatcaa gtacaagggc taccaggtcg ccccggccga gctcgagtcg atcctcctcc 1380
agcacccgaa catcttcgac gccggagtcg ccggccttcc ggacgatgac gccggagagc 1440
tcccggccgc cgtcgtcgtc ctcgagcacg gcaagaccat gaccgagaag gagatcgtcg 1500
actacgtcgc ctcgcaggtc accaccgcca agaagctccg cggcggcgtc gtgttcgtcg 1560
acgaggtccc gaagggcctc accggcaagc tcgacgcccg caagatccgc gagatcctca 1620
tcaaggccaa gaagggcggc aagatcgccg tctagatatc 1660
<210> 52
<211> 50
<212> DNA
<213> Rhodotorula glutinis 204091
<400> 52
gtgcgtcttt ccctctcctc cccacacccg acagttctcg aggaggagta 50
<210> 53
<211> 51
<212> DNA
<213> Rhodosporidium toruloides MTCC 457
<400> 53
gtgcgtcttt tccctctcct ccccacaccc gacagtcctc gacgaggtgt a 51
<210> 54
<211> 51
<212> DNA
<213> Rhodosporidium toruloides NP11
<400> 54
gtgcgtcttt tccctctcct ccccacaccc gacagtcctc gacgaggtgt a 51
<210> 55
<211> 50
<212> DNA
<213> Rhodotorula graminis WP1
<400> 55
gtgagcccca gccctcacac tctccccctc ccccccactt ccgaggcctg 50
<210> 56
<211> 108
<212> DNA
<213> Rhodotorula glutinis 204091
<400> 56
gtgcgtcttt ccctctcctc cccacacccg acagttctcg aggaggagta cagcagcgag 60
cgaggctgcc gagggggatc tgggttgacg cagctcttga ttatacag 108
<210> 57
<211> 109
<212> DNA
<213> Rhodosporidium toruloides MTCC 457
<400> 57
gtgcgtcttt tccctctcct ccccacaccc gacagtcctc gacgaggtgt aggacggcga 60
gcaaagctgc cgagggcgat ctgggctgac tgagcgctcg agtgtacag 109
<210> 58
<211> 109
<212> DNA
<213> Rhodosporidium toruloides NP11
<400> 58
gtgcgtcttt tccctctcct ccccacaccc gacagtcctc gacgaggtgt aggacggcga 60
gcaaagctgc cgagggcgat ctgggctgac tgagcgctcg agtgtacag 109
<210> 59
<211> 79
<212> DNA
<213> Rhodotorula graminis WP1
<400> 59
gtgagcccca gccctcacac tctccccctc ccccccactt ccgaggcctg actcttccct 60
ctcgcccctc gcctcgcag 79
<210> 60
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 60
tttactagtc ttcccggtct cgtatcgag 29
<210> 61
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 61
tttactagta ctccgcaatc tgcagagac 29
<210> 62
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 62
tttactagtc atggtctgat cgcttgtgtg 30
<210> 63
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 63
tttactagtg tggcaggtgt gcgtg 25
<210> 64
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 64
tttactagtc gttcgtgggc tcaaggaag 29
<210> 65
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 65
tttactagtc gacgacggga agcttcg 27
<210> 66
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 66
tttccatggc aatcactgta taatcaagag ctg 33
<210> 67
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 67
tttccatggc gtcgttcgag cag 23
<210> 68
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 68
gaagcttcgg cacgagcatg 20
<210> 69
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 69
acagtcatgc tcgtgccgaa gcttcgcaac cgctcatcag tacac 45
<210> 70
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 70
ggacaaacca caactagaat gcag 24
<210> 71
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 71
aaagcatgct aattcggggg atctggat 28
<210> 72
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 72
ggcgtcgttc gagcagtac 19
<210> 73
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 73
ctgcttgtac tgctcgaacg acgccatcca ttcacagaag cgcgtcgt 48
<210> 74
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 74
gacgcaccgc ctgatccgag 20
<210> 75
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 75
ttgtcctcgg atcaggcggt gcgtctttaa atataataaa aaaaaaagac agttctcgag 60
gaggagtac 69
<210> 76
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 76
ttgtcctcgg atcaggcggt gcgtccagtt ctcgaggagg agtac 45
<210> 77
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 77
gaagtactcg gcgtaggtg 19
<210> 78
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 78
cttcgtgcta accaagctcg t 21
<210> 79
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 79
gtctcagggt tgacggacaa g 21
<210> 80
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 80
tcaaaccgtc ctcgtcaagt c 21
<210> 81
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 81
gttgacggac aagtcccaat c 21
<210> 82
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 82
cgacaacttt gacgaccctt c 21
<210> 83
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 83
caggttggga caagttgggt a 21
<210> 84
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 84
ggacaaacca caactagaat gcag 24
<210> 85
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 85
aaagcatgct aattcggggg atctggat 28
<210> 86
<211> 16
<212> PRT
<213> Rhodosporidium toruloides ATCC 10657
<400> 86
Met His Ser Gln Lys Arg Val Val Val Leu Gly Ser Gly Val Ile Ala
1 5 10 15
<210> 87
<211> 24
<212> PRT
<213> Rhodosporidium toruloides ATCC 10657
<400> 87
Met Ser Ala Gly Lys Gly Ser Val Asn Val Gly Ile Asn Gly Phe Gly
1 5 10 15
Arg Ile Gly Arg Ile Val Leu Arg
20
<210> 88
<211> 368
<212> PRT
<213> Rhodosporidium toruloides ATCC 10657
<400> 88
Met His Ser Gln Lys Arg Val Val Val Leu Gly Ser Gly Val Ile Gly
1 5 10 15
Leu Ser Ser Ala Leu Ile Leu Ala Arg Lys Gly Tyr Ser Val His Ile
20 25 30
Val Ala Arg Asp Leu Pro Glu Asp Val Ser Ser Gln Thr Phe Ala Ser
35 40 45
Pro Trp Ala Gly Ala Asn Trp Thr Pro Phe Met Ser Leu Thr Asp Gly
50 55 60
Pro Arg Gln Ala Lys Trp Glu Glu Leu Thr Phe Lys Lys Trp Val Glu
65 70 75 80
Leu Val Pro Thr Gly Gln Val Met Trp Leu Lys Gly Thr Arg Arg Phe
85 90 95
Ala Gln Asn Glu Asp Gly Leu Leu Gly His Trp Tyr Lys Asp Ile Thr
100 105 110
Pro Asn Tyr Arg Pro Leu Pro Ser Ser Glu Cys Pro Pro Asn Ser Ile
115 120 125
Gly Val Thr Tyr Asp Thr Leu Ser Val His Ala Pro Lys Tyr Cys Gln
130 135 140
Tyr Leu Ala Arg Gly Leu Gln Lys Leu Gly Ala Thr Phe Glu Arg Arg
145 150 155 160
Thr Val Thr Ser Val Glu Gln Ala Phe Glu Gly Val Asp Leu Val Val
165 170 175
Asn Ala Thr Gly Leu Gly Ala Lys Ser Ile Ala Gly Ile Asp Asp Gln
180 185 190
Ala Ala Glu Pro Ile Arg Gly Gln Thr Val Leu Val Lys Ser Ala Cys
195 200 205
Lys Arg Cys Thr Met Asp Ser Ser Asp Pro Ser Ser Pro Ala Tyr Ile
210 215 220
Ile Pro Arg Pro Gly Gly Glu Val Ile Cys Gly Gly Thr Tyr Gly Val
225 230 235 240
Gly Asp Trp Asp Leu Ser Val Asn Pro Glu Thr Val Gln Arg Ile Leu
245 250 255
Lys His Cys Leu Arg Leu Asp Pro Ser Ile Ser Ser Asp Gly Thr Ile
260 265 270
Glu Gly Ile Glu Val Leu Arg His Asn Val Gly Leu Arg Pro Ala Arg
275 280 285
Arg Gly Gly Pro Arg Val Glu Ala Glu Arg Leu Val Leu Pro Leu Asp
290 295 300
Arg Ser Lys Ser Pro Leu Ser Leu Gly Lys Gly Thr Thr Arg Ala Ala
305 310 315 320
Lys Glu Lys Glu Val Thr Leu Val His Ala Tyr Gly Phe Ser Ser Ala
325 330 335
Gly Tyr Gln Gln Ser Trp Gly Ala Ala Glu Asp Val Ala Leu Leu Val
340 345 350
Glu Glu Ala Phe Gln Arg Tyr His Gly Ala Ala Arg Glu Ser Lys Leu
355 360 365
<210> 89
<211> 2046
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> CDS
<222> (118)..(2046)
<400> 89
tcctctggcc tctctcgctc cgttcgcctg gccgcgcgcc caaaccgctt tgttgacgct 60
atcagcctcc cgcgagcgct agcaggctct cttagccgcc tcacgcctac ctcgcga 117
atg tcc tcc cca cct cgc ttc gcg ccc ggt tcg acc tcg ccc acg cag 165
Met Ser Ser Pro Pro Arg Phe Ala Pro Gly Ser Thr Ser Pro Thr Gln
1 5 10 15
tcg agg ccg cgt gcg acg cac agc agc cca aca caa ggt ccc ttc gca 213
Ser Arg Pro Arg Ala Thr His Ser Ser Pro Thr Gln Gly Pro Phe Ala
20 25 30
acg cct gcg cgc cca ggt gcg agc tca gcg gcg cac caa ccc gat cct 261
Thr Pro Ala Arg Pro Gly Ala Ser Ser Ala Ala His Gln Pro Asp Pro
35 40 45
tca acc tcg aca gca ggc gcc gcc tcc ctc ctc acg tct tct cct cac 309
Ser Thr Ser Thr Ala Gly Ala Ala Ser Leu Leu Thr Ser Ser Pro His
50 55 60
tac acg act tcg ctg cgc tct cga cac tcg ctt tac ggc acg gaa gac 357
Tyr Thr Thr Ser Leu Arg Ser Arg His Ser Leu Tyr Gly Thr Glu Asp
65 70 75 80
cgt gtt gtg ctg gat ctc ggc tcg cgg ata tgg aag gtc ggg ttc agc 405
Arg Val Val Leu Asp Leu Gly Ser Arg Ile Trp Lys Val Gly Phe Ser
85 90 95
ggg gag ccg cag ccg cgc gag tgc cgg agc gtc gtg agc gag ttg gcg 453
Gly Glu Pro Gln Pro Arg Glu Cys Arg Ser Val Val Ser Glu Leu Ala
100 105 110
cat gag cgg gct ggg cga aga gca ggg ccg tcc ata ggc gcg aga ggg 501
His Glu Arg Ala Gly Arg Arg Ala Gly Pro Ser Ile Gly Ala Arg Gly
115 120 125
gac gac gac gaa gag gac tgc ttt tgg gcg ctc gag aag gcc gag ccg 549
Asp Asp Asp Glu Glu Asp Cys Phe Trp Ala Leu Glu Lys Ala Glu Pro
130 135 140
agc gag gag gag tgg ttg att cgc gag gag agg gtg aag cga tta ctg 597
Ser Glu Glu Glu Trp Leu Ile Arg Glu Glu Arg Val Lys Arg Leu Leu
145 150 155 160
cgc aag atc tgg ttc gaa aac ctc atg atc gac ccg aag acg cgc aaa 645
Arg Lys Ile Trp Phe Glu Asn Leu Met Ile Asp Pro Lys Thr Arg Lys
165 170 175
gtc atc gtc gtg gag aac cca ctg ctg tcg acg cgc gtg aag gag atg 693
Val Ile Val Val Glu Asn Pro Leu Leu Ser Thr Arg Val Lys Glu Met
180 185 190
atc gcg cgg gtc ttg ttc gac aac ttg cag atc ccg tcg ctc agc ttc 741
Ile Ala Arg Val Leu Phe Asp Asn Leu Gln Ile Pro Ser Leu Ser Phe
195 200 205
gct tcc gcc ccc ttg ctc gcc ttg atg gcg gcc ggc aca gtg acc ggt 789
Ala Ser Ala Pro Leu Leu Ala Leu Met Ala Ala Gly Thr Val Thr Gly
210 215 220
ctt gtg gtc gac gtc gga aac ctc gag acg acc gtt ctt ccc gtc ttt 837
Leu Val Val Asp Val Gly Asn Leu Glu Thr Thr Val Leu Pro Val Phe
225 230 235 240
cac gct cgc ccg ctc ttt ccc tcc ctc acc aca act cct cgc gcg ggc 885
His Ala Arg Pro Leu Phe Pro Ser Leu Thr Thr Thr Pro Arg Ala Gly
245 250 255
tct cgc ctg aac cgc cgc ctc cgc tct ctc ctc ctc gca ttc ggc tca 933
Ser Arg Leu Asn Arg Arg Leu Arg Ser Leu Leu Leu Ala Phe Gly Ser
260 265 270
tac gca cct cct ccc tcc tcc ctc aac tcc atg acg cct ccc gct atc 981
Tyr Ala Pro Pro Pro Ser Ser Leu Asn Ser Met Thr Pro Pro Ala Ile
275 280 285
gga cgg ata ccg aag gag ctc ttg acg gag gag ctc ata gag gag atc 1029
Gly Arg Ile Pro Lys Glu Leu Leu Thr Glu Glu Leu Ile Glu Glu Ile
290 295 300
aag acg cgg ctg tgt ttt gtc ggt gag gag gtc ccg ctc gat gcg agc 1077
Lys Thr Arg Leu Cys Phe Val Gly Glu Glu Val Pro Leu Asp Ala Ser
305 310 315 320
cgg ggc gag agg gag gcg tcc gcg ttc agc gga tcg gcc atg agc gtc 1125
Arg Gly Glu Arg Glu Ala Ser Ala Phe Ser Gly Ser Ala Met Ser Val
325 330 335
gac act gca tca gca cgc gac aac ttt gac gac cct tcc gac ccc gac 1173
Asp Thr Ala Ser Ala Arg Asp Asn Phe Asp Asp Pro Ser Asp Pro Asp
340 345 350
aac gca cta cta aag gag ctt tac tcc cgc ttc gcc gcg aca tcg acc 1221
Asn Ala Leu Leu Lys Glu Leu Tyr Ser Arg Phe Ala Ala Thr Ser Thr
355 360 365
gcc aaa ccc gtt tcc ttc cgg ata ccc aac ttg tcc caa cct gcg atc 1269
Ala Lys Pro Val Ser Phe Arg Ile Pro Asn Leu Ser Gln Pro Ala Ile
370 375 380
gcg aac ggt aca ggt cga ggg tgg atc cag gtg ccc ggc tgg atc agg 1317
Ala Asn Gly Thr Gly Arg Gly Trp Ile Gln Val Pro Gly Trp Ile Arg
385 390 395 400
gag cgc gcc gcc gag gtg ttg tgg gag gag gat ggt gat gga gac gag 1365
Glu Arg Ala Ala Glu Val Leu Trp Glu Glu Asp Gly Asp Gly Asp Glu
405 410 415
cgt ggg ctt gcc gcc gtt gtc ctt gac tgc cta ttg aag ctc ccc ctt 1413
Arg Gly Leu Ala Ala Val Val Leu Asp Cys Leu Leu Lys Leu Pro Leu
420 425 430
gac ctt cga aag ccg atg gcc tcg tca atc ctc ctc acg ggc ggc acc 1461
Asp Leu Arg Lys Pro Met Ala Ser Ser Ile Leu Leu Thr Gly Gly Thr
435 440 445
gcc atg ctc ccc ggc ttc ttc cca cgc ttc aag gcc gct ctt ctt gcc 1509
Ala Met Leu Pro Gly Phe Phe Pro Arg Phe Lys Ala Ala Leu Leu Ala
450 455 460
cag ctc gac cgc tcg cat cct cct tcc cct ccg cct tcc ccg cct ctg 1557
Gln Leu Asp Arg Ser His Pro Pro Ser Pro Pro Pro Ser Pro Pro Leu
465 470 475 480
cca gca gca tcc gtc gaa cct cct tct tcc gac cct gcc gga ccc atg 1605
Pro Ala Ala Ser Val Glu Pro Pro Ser Ser Asp Pro Ala Gly Pro Met
485 490 495
tcg acg gac acg gcg gca tcg cct gcg ccc tct cgc tcg agc gaa gtc 1653
Ser Thr Asp Thr Ala Ala Ser Pro Ala Pro Ser Arg Ser Ser Glu Val
500 505 510
aat gcg aag cgg cgg cga aag cat gcc ctc gcg act cga ctg cac aac 1701
Asn Ala Lys Arg Arg Arg Lys His Ala Leu Ala Thr Arg Leu His Asn
515 520 525
ctg cgg cat tcg cct cga tac gcc ccg ctt gtc cct ctc gct cga cac 1749
Leu Arg His Ser Pro Arg Tyr Ala Pro Leu Val Pro Leu Ala Arg His
530 535 540
ctc gcc atc ttg aac cac cca tct ccg aac tcc tcg gca tcg tcg acg 1797
Leu Ala Ile Leu Asn His Pro Ser Pro Asn Ser Ser Ala Ser Ser Thr
545 550 555 560
gcg ccc tca tca acc ctc gct cga cag cgc gaa ggt tcg gct ccg tct 1845
Ala Pro Ser Ser Thr Leu Ala Arg Gln Arg Glu Gly Ser Ala Pro Ser
565 570 575
ttc tcg ccc gcc ttg caa agc tgg atc ggc ggc agc ctc gca gga gcg 1893
Phe Ser Pro Ala Leu Gln Ser Trp Ile Gly Gly Ser Leu Ala Gly Ala
580 585 590
ctc aag acg ggc ggg cct gag att gcg agg gag cag tgg gat gca ggg 1941
Leu Lys Thr Gly Gly Pro Glu Ile Ala Arg Glu Gln Trp Asp Ala Gly
595 600 605
ttg cgg ttt gcg gag gca gaa gag gcg gag gga gag gaa gga gag gag 1989
Leu Arg Phe Ala Glu Ala Glu Glu Ala Glu Gly Glu Glu Gly Glu Glu
610 615 620
ttt gag gag cgg gaa gtg atc cgg ccg gct ctg ccg gac tgg acg agg 2037
Phe Glu Glu Arg Glu Val Ile Arg Pro Ala Leu Pro Asp Trp Thr Arg
625 630 635 640
atc gcg tag 2046
Ile Ala
<210> 90
<211> 642
<212> PRT
<213> Rhodosporidium toruloides
<400> 90
Met Ser Ser Pro Pro Arg Phe Ala Pro Gly Ser Thr Ser Pro Thr Gln
1 5 10 15
Ser Arg Pro Arg Ala Thr His Ser Ser Pro Thr Gln Gly Pro Phe Ala
20 25 30
Thr Pro Ala Arg Pro Gly Ala Ser Ser Ala Ala His Gln Pro Asp Pro
35 40 45
Ser Thr Ser Thr Ala Gly Ala Ala Ser Leu Leu Thr Ser Ser Pro His
50 55 60
Tyr Thr Thr Ser Leu Arg Ser Arg His Ser Leu Tyr Gly Thr Glu Asp
65 70 75 80
Arg Val Val Leu Asp Leu Gly Ser Arg Ile Trp Lys Val Gly Phe Ser
85 90 95
Gly Glu Pro Gln Pro Arg Glu Cys Arg Ser Val Val Ser Glu Leu Ala
100 105 110
His Glu Arg Ala Gly Arg Arg Ala Gly Pro Ser Ile Gly Ala Arg Gly
115 120 125
Asp Asp Asp Glu Glu Asp Cys Phe Trp Ala Leu Glu Lys Ala Glu Pro
130 135 140
Ser Glu Glu Glu Trp Leu Ile Arg Glu Glu Arg Val Lys Arg Leu Leu
145 150 155 160
Arg Lys Ile Trp Phe Glu Asn Leu Met Ile Asp Pro Lys Thr Arg Lys
165 170 175
Val Ile Val Val Glu Asn Pro Leu Leu Ser Thr Arg Val Lys Glu Met
180 185 190
Ile Ala Arg Val Leu Phe Asp Asn Leu Gln Ile Pro Ser Leu Ser Phe
195 200 205
Ala Ser Ala Pro Leu Leu Ala Leu Met Ala Ala Gly Thr Val Thr Gly
210 215 220
Leu Val Val Asp Val Gly Asn Leu Glu Thr Thr Val Leu Pro Val Phe
225 230 235 240
His Ala Arg Pro Leu Phe Pro Ser Leu Thr Thr Thr Pro Arg Ala Gly
245 250 255
Ser Arg Leu Asn Arg Arg Leu Arg Ser Leu Leu Leu Ala Phe Gly Ser
260 265 270
Tyr Ala Pro Pro Pro Ser Ser Leu Asn Ser Met Thr Pro Pro Ala Ile
275 280 285
Gly Arg Ile Pro Lys Glu Leu Leu Thr Glu Glu Leu Ile Glu Glu Ile
290 295 300
Lys Thr Arg Leu Cys Phe Val Gly Glu Glu Val Pro Leu Asp Ala Ser
305 310 315 320
Arg Gly Glu Arg Glu Ala Ser Ala Phe Ser Gly Ser Ala Met Ser Val
325 330 335
Asp Thr Ala Ser Ala Arg Asp Asn Phe Asp Asp Pro Ser Asp Pro Asp
340 345 350
Asn Ala Leu Leu Lys Glu Leu Tyr Ser Arg Phe Ala Ala Thr Ser Thr
355 360 365
Ala Lys Pro Val Ser Phe Arg Ile Pro Asn Leu Ser Gln Pro Ala Ile
370 375 380
Ala Asn Gly Thr Gly Arg Gly Trp Ile Gln Val Pro Gly Trp Ile Arg
385 390 395 400
Glu Arg Ala Ala Glu Val Leu Trp Glu Glu Asp Gly Asp Gly Asp Glu
405 410 415
Arg Gly Leu Ala Ala Val Val Leu Asp Cys Leu Leu Lys Leu Pro Leu
420 425 430
Asp Leu Arg Lys Pro Met Ala Ser Ser Ile Leu Leu Thr Gly Gly Thr
435 440 445
Ala Met Leu Pro Gly Phe Phe Pro Arg Phe Lys Ala Ala Leu Leu Ala
450 455 460
Gln Leu Asp Arg Ser His Pro Pro Ser Pro Pro Pro Ser Pro Pro Leu
465 470 475 480
Pro Ala Ala Ser Val Glu Pro Pro Ser Ser Asp Pro Ala Gly Pro Met
485 490 495
Ser Thr Asp Thr Ala Ala Ser Pro Ala Pro Ser Arg Ser Ser Glu Val
500 505 510
Asn Ala Lys Arg Arg Arg Lys His Ala Leu Ala Thr Arg Leu His Asn
515 520 525
Leu Arg His Ser Pro Arg Tyr Ala Pro Leu Val Pro Leu Ala Arg His
530 535 540
Leu Ala Ile Leu Asn His Pro Ser Pro Asn Ser Ser Ala Ser Ser Thr
545 550 555 560
Ala Pro Ser Ser Thr Leu Ala Arg Gln Arg Glu Gly Ser Ala Pro Ser
565 570 575
Phe Ser Pro Ala Leu Gln Ser Trp Ile Gly Gly Ser Leu Ala Gly Ala
580 585 590
Leu Lys Thr Gly Gly Pro Glu Ile Ala Arg Glu Gln Trp Asp Ala Gly
595 600 605
Leu Arg Phe Ala Glu Ala Glu Glu Ala Glu Gly Glu Glu Gly Glu Glu
610 615 620
Phe Glu Glu Arg Glu Val Ile Arg Pro Ala Leu Pro Asp Trp Thr Arg
625 630 635 640
Ile Ala
<210> 91
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA motif 1 sequence
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, or t
<400> 91
ragghmsmmk mvsmssrnbd ygavgamgg 29
<210> 92
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA motif 2 sequence
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (39)..(39)
<223> n is a, c, g, or t
<400> 92
khkdvdrbsw rnbkbhvhbv wbmwtbyygh hsmtrdtbns hdbhbbyw 48
<210> 93
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA motif 3 sequence
<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t
<400> 93
gmkndysmmy tsvvyckbrh ksbybbkmty vrrvhdsysb dvhhbcrw 48
<210> 94
<211> 241
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (23)..(50)
<223> DNA motif 1
<400> 94
ggtgtactga tgagcggttg cgaggccgca gagcagcgct gcgacgacgg gaagcttcgg 60
cacgagcatg actgtgagta gtagtccaag gagaacagcg cagagtcggc aggagggcac 120
atggaggcag agcgtggggc ggaggaggca gatggggagt cgcgctgggg gacgagaggg 180
tgccgctcga ccaactgctc tctttcgctc ttgctgctgc ttgtactgct cgaacgacgc 240
c 241
<210> 95
<211> 541
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (323)..(350)
<223> DNA motif 1
<400> 95
aaggtcgacg ctctcgagtg cccactcgac cgcgttcgtg ggctcaagga agtcctcccc 60
cgtcggctgc gcatcacacg gagcatacgc aacatggaac aagcctccta cgcgtccttg 120
acgcaacttc gggaggtcga catggcctgc aagaccggtc gcaagttcag ggaggacgtc 180
gagcggtctc cggcagaggt ggcgagcgac gtaggggagg tcgacgtgtc cgtctatgag 240
tgggtggcgt ttcaggatcc cgcgggcctc agcgagcaag gactcgttgg gcaaagtgaa 300
ggtgtactga tgagcggttg cgaggccgca gagcagcgct gcgacgacgg gaagcttcgg 360
cacgagcatg actgtgagta gtagtccaag gagaacagcg cagagtcggc aggagggcac 420
atggaggcag agcgtggggc ggaggaggca gatggggagt cgcgctgggg gacgagaggg 480
tgccgctcga ccaactgctc tctttcgctc ttgctgctgc ttgtactgct cgaacgacgc 540
c 541
<210> 96
<211> 1541
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (1323)..(1350)
<223> DNA motif 1
<400> 96
aagtctgcta ggtcgtcttc cgtccatcct cgtcgcaaca actccgcaat ctgcagagac 60
gaggtagtca gcacatgtca tagctgaaga agcaagcgat gcgcaccaag ttcggaaact 120
tcgacgcgtc ctcaagcccc tcaacactcg agcgcatacc gtcaaagtca gacccgagac 180
cgacgtgctt cttgccgcag acggaggcga tgtactcgat atgatcggcg acacggattt 240
gcgtggcgtt cgtagggtcg ataaaggaag ggtagaagac gaccattctg cgagacgcga 300
aggtcagccg gaaacttctg acgacaggaa gtaacgtcgt acgcacacga tgccgtggtt 360
ctggtgctcg cctggcccga tcagctgaag aacttcctct gggacgtttc gcgggtggtc 420
gtggatcgct cgcgcgccag agtgcgagaa gatgacgggc gcaacgctga gttcgagggc 480
ctgctcgcaa atcgtcagct aaagctcgaa agtgttgaag cgcggtgcgc acgtcgagca 540
tggtctgatc gcttgtgtgc gagaggtcga ccatcatgcc gagcctgttc agctccggta 600
caagctcgcg cccgaaggcg gtcaggccgt tcccgtcgtg tacaggctcg ataggagagc 660
cgtccccggc ggaagaggcg aaggctgtga gaaaaacccg tcaacagagc ggaagaaggc 720
cgagaggtcg cctcgcctca caagtgtggc aggtgtgcgt gagcgtaagg taccgcacgc 780
cgagttgctg aaagaggcgt aggatggcca gcgagttcat caggtgatgc gagctgtagg 840
aagagcgggt tagcgggagg atgtcggtag agactgttcg tacaaacccc tctagcccaa 900
tcaaggacgc gatcttcccc tccgcgaacg cactccgcac ctcgtccgcc gttcgagcga 960
gcgccatctc ctcaggatag tgctccacca tccgatgaat aaggtcgacg ctctcgagtg 1020
cccactcgac cgcgttcgtg ggctcaagga agtcctcccc cgtcggctgc gcatcacacg 1080
gagcatacgc aacatggaac aagcctccta cgcgtccttg acgcaacttc gggaggtcga 1140
catggcctgc aagaccggtc gcaagttcag ggaggacgtc gagcggtctc cggcagaggt 1200
ggcgagcgac gtaggggagg tcgacgtgtc cgtctatgag tgggtggcgt ttcaggatcc 1260
cgcgggcctc agcgagcaag gactcgttgg gcaaagtgaa ggtgtactga tgagcggttg 1320
cgaggccgca gagcagcgct gcgacgacgg gaagcttcgg cacgagcatg actgtgagta 1380
gtagtccaag gagaacagcg cagagtcggc aggagggcac atggaggcag agcgtggggc 1440
ggaggaggca gatggggagt cgcgctgggg gacgagaggg tgccgctcga ccaactgctc 1500
tctttcgctc ttgctgctgc ttgtactgct cgaacgacgc c 1541
<210> 97
<211> 2021
<212> DNA
<213> Rhodosporidium toruloides
<220>
<221> misc_feature
<222> (1803)..(1830)
<223> DNA motif 1
<400> 97
cttcccggtc tcgtatcgag cggaagacat ccccctcttc ctcgctcaga ttgccgctct 60
cctgcaaggc cagcagtggg gcgtcggtgc gtgcccaact cgtctgaagt ggccaaatgg 120
ctgacagtgc tcccgcaggt cacgacgctg ccgccatcct tcgcggtctt cggcagcgga 180
agctttgatt ctttcttgcc tctctcggtt gtacaatcgt cgtgctcgcc agtttgttgt 240
tgatatccct agccttgcct tccatactga acaatctaca actcgtcctt cttgcgcggc 300
ggaaagcgct tcagcacctc gttctgcacg tcttgcggca agtactcccc acccggtcct 360
gcccacatca ccggcagatc tgtccgcttc tcatacactg ctggtgaggc aggttgcgag 420
gcgagagagc gctggaccgc ctcgacttct tccattacgc gaaggaggtt gccgccgatc 480
aagtctgcta ggtcgtcttc cgtccatcct cgtcgcaaca actccgcaat ctgcagagac 540
gaggtagtca gcacatgtca tagctgaaga agcaagcgat gcgcaccaag ttcggaaact 600
tcgacgcgtc ctcaagcccc tcaacactcg agcgcatacc gtcaaagtca gacccgagac 660
cgacgtgctt cttgccgcag acggaggcga tgtactcgat atgatcggcg acacggattt 720
gcgtggcgtt cgtagggtcg ataaaggaag ggtagaagac gaccattctg cgagacgcga 780
aggtcagccg gaaacttctg acgacaggaa gtaacgtcgt acgcacacga tgccgtggtt 840
ctggtgctcg cctggcccga tcagctgaag aacttcctct gggacgtttc gcgggtggtc 900
gtggatcgct cgcgcgccag agtgcgagaa gatgacgggc gcaacgctga gttcgagggc 960
ctgctcgcaa atcgtcagct aaagctcgaa agtgttgaag cgcggtgcgc acgtcgagca 1020
tggtctgatc gcttgtgtgc gagaggtcga ccatcatgcc gagcctgttc agctccggta 1080
caagctcgcg cccgaaggcg gtcaggccgt tcccgtcgtg tacaggctcg ataggagagc 1140
cgtccccggc ggaagaggcg aaggctgtga gaaaaacccg tcaacagagc ggaagaaggc 1200
cgagaggtcg cctcgcctca caagtgtggc aggtgtgcgt gagcgtaagg taccgcacgc 1260
cgagttgctg aaagaggcgt aggatggcca gcgagttcat caggtgatgc gagctgtagg 1320
aagagcgggt tagcgggagg atgtcggtag agactgttcg tacaaacccc tctagcccaa 1380
tcaaggacgc gatcttcccc tccgcgaacg cactccgcac ctcgtccgcc gttcgagcga 1440
gcgccatctc ctcaggatag tgctccacca tccgatgaat aaggtcgacg ctctcgagtg 1500
cccactcgac cgcgttcgtg ggctcaagga agtcctcccc cgtcggctgc gcatcacacg 1560
gagcatacgc aacatggaac aagcctccta cgcgtccttg acgcaacttc gggaggtcga 1620
catggcctgc aagaccggtc gcaagttcag ggaggacgtc gagcggtctc cggcagaggt 1680
ggcgagcgac gtaggggagg tcgacgtgtc cgtctatgag tgggtggcgt ttcaggatcc 1740
cgcgggcctc agcgagcaag gactcgttgg gcaaagtgaa ggtgtactga tgagcggttg 1800
cgaggccgca gagcagcgct gcgacgacgg gaagcttcgg cacgagcatg actgtgagta 1860
gtagtccaag gagaacagcg cagagtcggc aggagggcac atggaggcag agcgtggggc 1920
ggaggaggca gatggggagt cgcgctgggg gacgagaggg tgccgctcga ccaactgctc 1980
tctttcgctc ttgctgctgc ttgtactgct cgaacgacgc c 2021

Claims (20)

1.一种在转基因真菌细胞中可操作的D-氨基酸诱导型基因表达系统,其包含核酸构建体,所述核酸构建体包含与异源多核苷酸可操作地连接的D-氨基酸诱导型启动子,所述异源多核苷酸任选地与转录终止子连接,其中所述启动子选自以由以下组成的组:
(a)具有SEQ ID NO:94所示核苷酸序列的启动子;
(b)具有SEQ ID NO:95所示核苷酸序列的启动子;
(c)具有SEQ ID NO:96所示核苷酸序列的启动子;
(d)具有SEQ ID NO:97所示核苷酸序列的启动子;和
(e)具有SEQ ID NO:5所示核苷酸序列的启动子,
其中所述核酸构建体含有具有SEQ ID NO:7中所示的富含CT的核苷酸序列的核苷酸序列,并且
其中所述转基因真菌细胞是红冬孢酵母属(Rhodosporidium genus)或红酵母属(Rhodotorula genus)的物种的转基因真菌细胞。
2.权利要求1的表达系统,其中所述转基因真菌细胞包括突变体D-氨基酸氧化酶基因,与包含野生型D-氨基酸氧化酶基因的真菌细胞相比,所述突变体D-氨基酸氧化酶基因没有D-氨基酸氧化酶活性或具有降低的D-氨基酸氧化酶活性。
3.权利要求1的表达系统,其中所述具有SEQ ID NO:7中所示的富含CT的核苷酸序列的核苷酸序列与所述诱导型启动子可操作地连接且与所述异源多核苷酸可操作地连接。
4.权利要求1的表达系统,其中所述具有SEQ ID NO:7中所示的富含CT的核苷酸序列的核苷酸序列是
与所述诱导型启动子可操作地连接且与所述异源多核苷酸可操作地连接的内含子,
插入到所述异源多核苷酸的5'区域中的内含子,
插入到所述诱导型启动子的5'UTR中的内含子,或者
是所述异源多核苷酸的编码序列的一部分。
5.权利要求3的表达系统,其中所述具有SEQ ID NO:7中所示的富含CT的核苷酸序列的核苷酸序列选自由以下组成的组:SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ IDNO:59。
6.权利要求4的表达系统,其中所述具有SEQ ID NO:7中所示的富含CT的核苷酸序列的核苷酸序列选自由以下组成的组:SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ IDNO:59。
7.权利要求1-6中任一项的表达系统,其中所述异源多核苷酸编码感兴趣的蛋白,或者编码用于下调感兴趣的靶基因的RNA分子。
8.转基因真菌细胞,其包含权利要求1-6中任一项的表达系统,其中所述转基因真菌细胞是红冬孢酵母属(Rhodosporidium genus)或红酵母属(Rhodotorula genus)的物种的转基因真菌细胞。
9.权利要求8的转基因真菌细胞,其中所述异源多核苷酸编码感兴趣的蛋白,或者编码用于下调感兴趣的靶基因的RNA分子。
10.权利要求8的转基因真菌细胞,其中所述细胞在包含D-氨基酸的培养基中培养。
11.权利要求10的转基因真菌细胞,其中所述D-氨基酸是D-丙氨酸、D-苏氨酸、D-丝氨酸、D-缬氨酸或D-脯氨酸。
12.权利要求11的转基因真菌细胞,其中所述培养基中D-氨基酸的浓度为0.1mM至100mM。
13.组合物,其包含权利要求8的转基因真菌细胞和含有D-氨基酸的培养基。
14.权利要求13的组合物,其中所述D-氨基酸是D-丙氨酸、D-苏氨酸、D-丝氨酸、D-缬氨酸或D-脯氨酸。
15.权利要求14的组合物,其中所述培养基中D-氨基酸的浓度为0.1mM至100mM。
16.一种制备转基因真菌细胞的方法,包括:
(a)将权利要求1-6中任一项的表达系统引入真菌细胞中,
(b)选择包含所述核酸构建体的转基因真菌细胞,
其中所述转基因真菌细胞是红冬孢酵母属(Rhodosporidium genus)或红酵母属(Rhodotorula genus)的物种的转基因真菌细胞。
17.一种在真菌细胞中诱导表达多核苷酸的方法,其包括在含有D-氨基酸的培养基中培养权利要求1-6中任一项的转基因真菌细胞以诱导所述异源多核苷酸的表达,
其中所述转基因真菌细胞是红冬孢酵母属(Rhodosporidium genus)或红酵母属(Rhodotorula genus)的物种的转基因真菌细胞。
18.权利要求17的方法,其中所述D-氨基酸是D-丙氨酸、D-苏氨酸、D-丝氨酸、D-缬氨酸或D-脯氨酸。
19.权利要求18的方法,其中所述培养基中D-氨基酸的浓度为0.1mM至100mM。
20.权利要求17的方法,其中所述异源多核苷酸编码感兴趣的蛋白,或者编码用于下调感兴趣的靶基因的RNA分子。
CN201680031872.1A 2015-04-03 2016-03-31 红冬孢酵母属和红酵母属的d-氨基酸诱导型基因表达系统 Active CN107636155B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562142788P 2015-04-03 2015-04-03
US62/142,788 2015-04-03
PCT/SG2016/050161 WO2016159887A1 (en) 2015-04-03 2016-03-31 D-amino acid-inducible gene expression system for rhodosporidium and rhodotorula

Publications (2)

Publication Number Publication Date
CN107636155A CN107636155A (zh) 2018-01-26
CN107636155B true CN107636155B (zh) 2022-01-07

Family

ID=57004478

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680031872.1A Active CN107636155B (zh) 2015-04-03 2016-03-31 红冬孢酵母属和红酵母属的d-氨基酸诱导型基因表达系统

Country Status (5)

Country Link
US (1) US10081812B2 (zh)
EP (1) EP3277822B1 (zh)
CN (1) CN107636155B (zh)
ES (1) ES2811139T3 (zh)
WO (1) WO2016159887A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116121316A (zh) * 2016-03-02 2023-05-16 巴斯夫欧洲公司 制造l-草胺膦的方法
CN107881159B (zh) * 2017-12-15 2020-10-09 江南大学 一种提高d-氨基酸氧化酶可溶性异源表达的方法
CN111019916B (zh) * 2018-11-23 2020-12-08 弈柯莱生物科技(上海)股份有限公司 一种d-氨基酸氧化酶突变体及其应用
CN110747206B (zh) * 2019-11-05 2021-11-23 昆明理工大学 3-羟基-3-甲基戊二酸单酰辅酶a还原酶基因rkhmgr及其应用
WO2021115256A1 (zh) * 2019-12-09 2021-06-17 四川利尔生物科技有限公司 经修饰的daao酶及其应用
CN113621631A (zh) * 2021-08-11 2021-11-09 昆明理工大学 一种甲羟戊酸激酶基因rkmk及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2109194B1 (es) * 1996-04-22 1998-07-16 Antibioticos Sa Un procedimiento para producir la enzima d-aminoacido oxidasa de rhodotorula gracilis en celulas hospedantes.
AU749453B2 (en) * 1997-06-25 2002-06-27 Bristol-Myers Squibb Company D-amino acid oxidase promoter from T. variabilis

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
D-Amino-acid oxidase gene from Rhodotorula gracilis(Rhodosporidium toruloides) ATCC 26217;Jorge Alonso et al.;《Microbiology》;19981231;第144卷;第1095-1101页 *
Rhodotorula gracilis mRNA for D-amino acid oxidase;DATABASE EMBL;《EM_STD:Z71657.1》;19970701;第1页 *

Also Published As

Publication number Publication date
EP3277822A1 (en) 2018-02-07
ES2811139T3 (es) 2021-03-10
US20180073034A1 (en) 2018-03-15
WO2016159887A1 (en) 2016-10-06
EP3277822A4 (en) 2018-04-04
EP3277822B1 (en) 2020-05-06
CN107636155A (zh) 2018-01-26
US10081812B2 (en) 2018-09-25

Similar Documents

Publication Publication Date Title
CN107636155B (zh) 红冬孢酵母属和红酵母属的d-氨基酸诱导型基因表达系统
US5908973A (en) DNA encoding fruit-ripening-related proteins, DNA constructs, cells and plants derived therefrom
US20230183729A1 (en) Methods of increasing seed yield
US20200255846A1 (en) Methods for increasing grain yield
US10308691B2 (en) Methods for tuning carotenoid production levels and compositions in rhodosporidium and rhodotorula genera
JP2015524251A (ja) 種子油組成が改良されたアブラナ属植物
US7915480B2 (en) F-box protein targeted plant oil production
WO2016099918A1 (en) Modulation of yep6 gene expression to increase yield and other related traits in plants
WO2006076717A2 (en) A novel cytochrome p450 monooxygenase
CN109072247B (zh) 含有内含子的启动子及其用途
EP2534250B1 (en) Improvement of the grain filling of a plant through the modulation of nadh-glutamate synthase activity
CA2878287A1 (en) Soybean rod1 gene sequences and uses thereof
US6989472B1 (en) cDNA sequence transcribing an mRNA encoding the terminal oxidase associated with carotenoid biosynthesis, and uses thereof
US9624500B2 (en) Metabolic engineering of plants for increased homogentisate and tocochromanol production
AU2011347647B2 (en) Disruption of AHP6 gene leads to plants with improved seed yield
JP3855055B2 (ja) Wx遺伝子発現抑制方法および該方法に用いられる遺伝子
AU2011212138B2 (en) Improvement of the grain filling of a plant through the modulation of NADH-glutamate synthase activity
WO2017096527A2 (en) Methods and compositions for maize starch regulation
WO2007119381A1 (ja) アルミニウム耐性に関与する遺伝子、およびその利用
Negri et al. Cloning and Preliminary Characterisation of the Promoter Region of the 1-Aminocyclopropane-1-Carboxylate Synthase Gene
CN1364196A (zh) 控制植物分枝的基因
EP1194558A2 (fr) Nouveau gene sgs3 de plante et son utilisation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant