CN102268430A

CN102268430A - 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体

Info

Publication number: CN102268430A
Application number: CN 201010189723
Authority: CN
Inventors: 张素芳; 赵宗保; 朱志伟
Original assignee: Dalian Institute of Chemical Physics of CAS
Current assignee: Dalian Institute of Chemical Physics of CAS
Priority date: 2010-06-02
Filing date: 2010-06-02
Publication date: 2011-12-07
Anticipated expiration: 2030-06-02
Also published as: CN102268430B

Abstract

通过扩增圆红冬孢酵母果糖-1，6-二磷酸醛缩酶基因组DNA上下游序列，进行生物学信息分析和功能验证，获得可有效表达目的基因于圆红冬孢酵母，并因此能够用于圆红冬孢酵母遗传工程操作和菌株改良的启动子和终止子。本发明还涉及包含这些元件的DNA构建体和载体。

Description

果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体

技术领域

本专利属于基因工程技术领域，具体涉及圆红冬孢酵母启动子、终止子及其用途，包括基因工程菌株构建所必需的转化方法等。

背景技术

微生物是自然界中分布最广泛的物种之一，具有卓越的生物合成能力，几乎能合成地球上所有的有机化学品。微生物的种属多样性和遗传多样性决定了其代谢多样性。与多细胞生物相比，微生物的代谢途径虽然相对简单，但其化合物的生产高效、快捷，并与人类日常生产生活关系密切。

做为某一化学品的天然生产菌株或环境治理应用菌株，其特定的生产性能往往并非最优化。如何优化或改变工业菌株的代谢网络和表达调控网络，以提高生物基产品的积累速度或定向控制靶产品的质量，是当今生物技术领域研究的热点和难点。实际上，对微生物油脂代谢过程的理解、开发和利用是否能达到或者超过化学加工水平，也是提高发酵过程经济性的关键。全基因组测序和基因工程技术的进步，为菌株生理学特性的认识和菌株改良提供了比传统诱变技术更为合理的方法。

代谢工程的实质是利用重组DNA技术和其它技术，有目的地改变已有的代谢和表达调控网络，更好地理解和利用细胞的代谢途径。代谢工程可以在细胞与分子水平上认识和改造细胞过程，其不仅可以解释细胞生理生化特性，而且还可赋于出发菌株新的性状和表型：(1)扩大底物利用范围；(2)生产原来不存在的新化合物；(3)增强对环境中毒害物质的降解能力；(4)提高菌体对环境的适应能力；(5)阻断或降低副产品的生成；(6)代谢产品生产速率和生产性能的提高等(Bailey J E.Toward a science ofmetabolic engineering.Science.1991，252(5013)：1668-1675；Aristidou A，

M.Metabolic engineering applications to renewable resource utilization.Curr.Opin.Biotechnol.2000，11(2)：187-198)。

圆红冬孢酵母属于担子菌门异宗配合型真菌，是发酵工业中一种极为重要的微生物，可利用源于生物质的己糖和戊糖为原料生产重要的生物基产品：微生物油脂，胞内油脂可达细胞干重的60％以上(Ratledge C，WynnJ P.The biochemistry and molecular biology of lipid accumulation in oleaginousmicroorganisms.Adv.Appl.Microbiol.2002，51：1-51；Li Y，Zhao Z，Bai F.High-density cultivation of oleaginous yeast Rhodosporidium toruloides Y4infed-batch culture.Enzyme Microb.Technol.2007，41(3)：312-317)；工业用酶或药物合成用酶如磷酸二酯酶、苯丙氨酸解氨酶(Hodgins D S.Yeastphenylalanine ammonia-lyase.Purification，properties，and the identification ofcatalytically essential dehydroalanine.J Biol.Chem.1971，246(9)：2977-2985； Gilbert H J，Clarke I N，Gibson R K，et al.Molecular cloning of the phenylalanineammonia lyase gene from Rhodosporidium toruloides in Escherichia coli K-12.JBacteriol.1985，161(1)：314-320)、D氨基酸氧化酶(Gadda G，Negri A，PiloneM S.Reaction of phenylglyoxal with arginine groups in D-amino-acid oxidasefrom Rhodotorula gracilis.J Biol.Chem.1994，269(27)：17809-17814；Liao G J，Lee Y J，Lee Y H，et al.Structure and expression of the D-amino-acid oxidasegene from the yeast Rhodosporidium toruloides.Biotechnol.Appl.Biochem.1998，27(Pt 1)：55-61)等；β-胡萝卜素和胞外多糖；并在污水处理和生物制药中有较广泛的应用。实验结果表明，该菌可同时利用五碳糖和六碳糖为底物，抗逆性好，能直接以玉米秸秆酸水解液为碳源积累油脂，可实现生物质到生物基产品的高效转化(李永红，刘波，孙艳，等.广谱碳源产油酵母菌的筛选.中国生物工程杂志，2005，25(12)：39-44)。

虽然圆红冬孢酵母具有优良的工业生产性能，同时，圆红冬孢酵母来源的蛋白酶异源表达也获得成功(Pollegioni L，Molla G，Campaner S，Cloning，sequencing and expression in E.coli of a D-amino acid oxidase cDNA fromRhodotorula gracilis active on cephalosporin C.J Biotechnol.1997，58(2)：115-123；Faulkner J D，Anson J G，Tuite M F，et al.High-level expression ofthephenylalanine ammonia lyase-encoding gene from Rhodosporidium toruloidesin Saccharomyces cerevisiae and Escherichia coli using a bifunctionalexpression system.Gene.1994，143(1)：13-20)，但圆红冬孢酵母自身缺乏相应的遗传操作系统。以圆红冬孢酵母为宿主菌，无论是基因工程操作还是代谢工程菌株改良，都受到遗传操作系统的制约，难以进行靶向性的菌株改造。

启动子对于遗传操作系统来说必不可少。因此，如果要对圆红冬孢酵母进行遗传操作，获得能在圆红冬孢酵母中起作用的启动子是该工作的关键环节。

发明内容

鉴于上述现有技术瓶颈，本发明的主要目的是提供可用于在圆红冬孢酵母中有效表达外源基因，并且可通过遗传工程技术进行圆红冬孢酵母菌种改良的启动子和终止子。

为实现本发明的目的，本发明人对圆红冬孢酵母中的基因表达情况进行了深入研究，发现圆红冬孢酵母中FBA为一个组成型表达基因，其启动子为中强启动子。通过实验设计，结合简并PCR、染色体步移等方法，从圆红冬孢酵母染色体DNA中成功获得了包含有效启动子的DNA片段，由此完成了本发明。

具体讲，本发明包含下述实施方案(A)到(H)

(A)本发明涉及一种具有圆红冬孢酵母转录启动子活性的DNA片段，所述DNA片段具有如SEQ ID NO：1所示DNA序列的全部序列或包含该DNA序列自3’-末端起700bp以内的部分序列，或具有可与如SEQ ID NO：1 所示序列的全部或其DNA序列3’-末端起700bp以内的部分序列杂交的、且保持转录启动子活性的序列，或对SEQ ID NO：1所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的，与SEQ ID NO：1所示序列具有50％以上同源性、且具有启动子活性的序列。

(B)本发明涉及一种来自圆红冬孢酵母的DNA片段，所述DNA片段具有如下特征：(1)如SEQ ID NO：2所示的DNA序列的全部或包含该DNA序列5’-末端的部分序列；(2)或具有可与如(1)所示序列杂交的、且保持如(1)所述序列活性的序列。

(C)本发明涉及一种可完成靶基因在圆红冬孢酵母中转录起始和转录终止的DNA分子，它同时具有如(A)所述序列和如(B)所述序列，且如(B)所述序列位于如(A)所述序列的下游，与其相邻1-10000个核苷酸的DNA片段。

(D)本发明涉及一种可将靶基因与(A)-(C)所述的任一种DNA分子连接的DNA构建体，以便于靶基因能够在圆红冬孢酵母中表达的重组DNA。所述靶基因为蛋白编码核酸或反义核酸编码核酸。

(E)本发明涉及一种携带(A)-(D)所述的的DNA分子中的任意一个的载体。所述载体可以是质粒载体或粘粒载体。

(F)本发明涉及转入了如(D)所述的DNA分子或如(E)所述载体的圆红冬孢酵母或红冬孢酵母属(Rhodosporidium)真菌。

(G)本发明所涉及的的pRtFBA启动子，其来源于圆红冬孢酵母，可启动目的基因在圆红冬孢酵母中的转录和表达；本发明所述的RtFBAt终止子，其来源于圆红冬孢酵母，可终止目的基因在圆红冬孢酵母中的转录。

(H)本发明涉及编码具有果糖-1，6-二磷酸醛缩酶活性的多肽的DNA片段，其具有如SEQ ID NO：5所示序列的全部或部分核苷酸序列，编码如SEQ ID NO：4所示的蛋白质序列。

使用本发明的具有启动子活性的DNA分子和具有转录终止子活性的DNA，可实现外源基因或内源基因在圆红冬孢酵母中的表达，本发明提供了用于遗传工程圆红冬孢酵母改造的启动子、终止子和载体。为圆红冬孢酵母开启了一条育种新途径，并因此可以提供具有工业用途的新型圆红冬孢酵母。

附图说明

图1表示RtFBA简并PCR产物的琼脂糖凝胶电泳的结果。

图2表示pRtFBA启动子DNA片段的琼脂糖凝胶电泳的结果。

图3表示RtFBAt终止子DNA片段的琼脂糖凝胶电泳的结果。

图4表示RtFBA基因的琼脂糖凝胶电泳的结果。

图5表示GFPuv在圆红冬孢酵母单倍体菌株ATCC 10788中的表达结果。

图6是质粒pFBAGFP的结构图。

图7是GFPuv在R.babjevae ATCC90942中的表达结果。

图8是圆红冬孢酵母果糖-1，6-二磷酸醛缩酶的晶体结构模型，其表明三维结构正确。

下面结合具体实施例对本发明作进一步详细说明。

具体实施方式

在本文中，“启动子”是指能够被RNA聚合酶识别、结合并能启动基因转录的DNA序列。术语“启动子”还可理解为：包括5’非编码区、顺式作用元件(如增强子)以及其它能与转录因子结合的核苷酸序列。

启动子的存在或强度通常是通过启动子活性表示，其测定方法：将报告基因(如绿色荧光蛋白)连接于所述启动子的下游，并将该DNA构建体转化相应宿主细胞，检测报告基因表达量。如果人们观察到连接于所述启动子下游报告基因的表达，就可以认为所述启动子在它所转化的宿主细胞内有活性。

在本文中，“终止子”是指染色体上提供终止信号使RNA聚合酶与DNA模板分离而使转录终止的一段DNA序列。可以通过诸如Northern杂交或RT-PCR的方法检查所转录RNA的大小而确认终止子的存在。或通过“启动子-报告基因-终止子”构建体使报告基因有效表达而确定终止子的活性。

本发明中的“圆红冬孢酵母”，包括属于该“物种”的任何二倍体和单倍体，野生型菌株和营养缺陷型菌株。本发明中的“红冬孢酵母属真菌”，没有具体限制，其例子包括归属于该属的真菌，除圆红冬孢酵母外，如Rhodosporidium azoricum，Rhodosporidium babjevae，Rhodosporidiumsphaerocarpum。

本发明的“目的基因”，包括能够在圆红冬孢酵母中表达的蛋白编码序列，反义RNA编码序列和核酸酶编码序列。能够在圆红冬孢酵母中表达的蛋白编码序列的例子包括源于圆红冬孢酵母的核酸序列，且并不局限于此。本发明的目的基因还包括来源于其它微生物、植物和动物的蛋白编码序列。

本发明中的启动子具有如SEQ ID NO：1所示DNA序列的全部序列或包含该DNA序列自3’-末端起700bp以内的部分序列，或具有可与如SEQ IDNO：1所示序列的全部或其DNA序列3’-末端起700bp以内的部分序列杂交的、且保持转录启动子活性的序列，或对SEQ ID NO：1所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的，与SEQ IDNO：1所示序列具有50％以上同源性、且具有启动子活性的序列。

本发明中的终止子具有如SEQ ID NO：2所示的DNA序列的全部或包含该DNA序列5’-末端的部分序列，或具有可与如SEQ ID NO：2所示序列的全部或其DNA序列5’-末端的部分序列杂交的、且保持转录终止子活性的序列，或对SEQ ID NO：2所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的，与SEQ ID NO：2所示序列具有50％以上同源性、且具有终止子活性的序列。

本发明中的启动子-目的基因的构建体、目的基因-终止子的构建体或启动子-目的基因-终止子的构建体，可以直接或经载体介导转化圆红冬孢酵母，以便于目的基因表达，可以优选质粒载体作为介导载体。

本发明的启动子可以按照以下方面从圆红冬孢酵母中分离。

下面结合附图及实施例对本发明作进一步说明，将有助于本领域的普通技术人员理解本发明，但不以任何形式限制本发明。下述实施例中所有引物合成及测序工作，如无特别说明则均由大连TakaRa公司完成。

实施例1：圆红冬孢酵母ATCC 10788总RNA的提取

将新鲜圆红冬孢酵母R.toruloides ATCC 10788(购自美国标准生物品收藏中心，ATCC)由斜面接种到50ml YEPD液体培养基中，于30℃摇床培养24h，再以1∶50的体积比例将菌液分别转接到100ml YEPD液体培养基中，于30℃摇床培养12h达对数生长期。在4℃下，5000rpm离心4min，收集菌体，用液氮迅速冷冻菌体，研磨破壁。使用TakaRa公司RNAiso试剂盒，并按照其标准步骤提取总RNA。

RNA进行1.5％琼脂糖凝胶电泳，使用荧光-紫外分析仪观察鉴定，可见清晰的两条带。用紫外/可见光光谱仪分析总RNA样品，测得OD₂₆₀/OD₂₈₀＝2.01，表明总RNA质量很好。总RNA样品冻存于-80℃，备用。

实施例2：圆红冬孢酵母ATCC 10788cDNA第一链合成和FBA简并PCR

以圆红冬孢酵母R.toruloides ATCC 10788总RNA为模板，反转录合成cDNA第一链。首先，将1.0μl总RNA(约2μg)，1.0μl引物SMART IV：5′-AAGCAGTGGTATCAACGCAGAGTGGCCATTACGGCCGGG-3′和1.0μloligo dT-接头引物CDS III/3′：5′-ATTCTAGAGGCCGAGGCGGCCGACATG-d(T)_30N-1N-3′，2.0μl DEPC处理水(焦碳酸二乙酯处理水，购自大连TakaRa公司)，加入到PCR管中混匀，于72℃保温2min，立即置于冰上冷却2min，将2.0μl 5×first strandbuffer(Clontech公司)，1.0μl DTT(20mM)，1.0μl dNTP(10mM)，1.0μlpowerscript reverse transcriptase(Clontech公司)加入到体系中，混匀。于42℃延伸反应60min，最后4℃结束反应，存于-20℃，备用。

设计合成两条简并引物FBA-sense：5′-ATGGG(AGCT)GT(AGCT)(CT)T(AGCT)GA(CT)GT(ACT)GTCCC -3′和FBA-anti：5′-TTA(AGCT)A(AG)(AGCT)GT(AG)CCCTCGGA-3′，以反转录合成的cDNA第一链为模板，进行FBA基因的简并PCR扩增，10×PCR缓冲液5.0μl，dNTPs(10mM)1.0μl，FBA-sense引物(50mmol/l)1.0μl，FBA-anti引物(50mmol/l)1.0ul，rTaq酶(大连TakaRa)0.5μl，合成的cDNA第一链模板1.0μl，ddH₂O 40.5μl，于94℃保温3min，然后于94℃30s，57℃45s，72℃1min，35个循环，72℃10min，4℃结束反应。扩增产物进行1％(质量/体积浓度)琼脂糖凝胶电泳，观察到1kb左右的条带(图1)，利用DNA回收试剂盒(购自碧云天)，按照供应商建议步骤纯化PCR产物。PCR产物参照大连TakaRa公司提供的方法克隆到pMD18-T载体(购自大连TakaRa)，转化入E.coli DH5α感受态细胞，其中感受态细胞按氯化钙法(分子克隆实验指南第三版，萨姆布鲁克著，黄培堂等译，科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序，序列结果推测出的氨基酸序列经Blastp分析，证实为果糖-1，6-二磷酸醛缩酶序列，如SEQ ID NO：4序列所示。果糖-1，6-二磷酸醛缩酶cDNA序列如SEQ ID NO：3序列所示。

实施例3：RtFBA基因组DNA的扩增

1 R.toruloides ATCC 10788(购自美国标准生物品收藏中心，ATCC)的基因组DNA提取采用玻璃珠破壁法(精编分子生物学实验指南第三版第13章，奥斯伯等著，颜子颖等译，科学出版社出版)。制备好的基因组DNA，利用Nanodrop 1000测定，测得OD₂₆₀/OD₂₈₀＝1.85，表明基因组DNA质量很好。浓度为120ng/μl，共500μl，基因组DNA样品冻存于-20℃，备用。

2根据实施例2中获得的果糖-1，6-二磷酸醛缩酶cDNA序列，设计1对基因特异性引物，FBA-ORF-p1：5’-ATGGGTGTCCTCGATGTTGTCCC-3’和FBA-ORF-p2：5’-TTAGAGGGTTCCCTCGGAGCGGAGG-3’，以圆红冬孢酵母ATCC10788的基因组DNA为模板，按照常规方法进行PCR扩增，得到约1.8kb的PCR产物(图略)。PCR扩增产物按照实施例2的操作步骤回收、克隆到pMD18-T载体，并进行测序，得到如序列表SEQ ID NO：5所示的DNA序列。经与实施例2中获得的果糖-1，6-二磷酸醛缩酶cDNA序列比对，证实该基因片段为其果糖-1，6-二磷酸醛缩酶基因组DNA序列，含5个内含子和6个外显子。

实施例4：染色体步移获得RtFBA基因5’翼侧序列(启动子)

本实施例利用Genome Walking Kit(购自大连TakaRa)完成。

根据实施例3中得到的FBADNA序列，设计3条Specific Primer(基因特异性引物)分别为FBA-SP1：5’-GCGAGGACTGGTAACGCACAGGGAT-3’，FBA-SP2：5’-CGCTGCGGGTTCGCTCAATGT-3’和FBA-SP3：5’-GCCTGCGGGAGCAAGGTGAGC-3’，做为下游引物，按照试剂盒说明书进行以下操作。

11^stPCR反应

以实施例3中精制的基因组DNA为模板，进行第一轮扩增。反应体系50μl：10×LA PCR buffer II(Mg²⁺plus，大连TakaRa)5.0μl，dNTPs(2.5mmol/l)8.0μl，LA Taq DNA聚合酶(5U/μl，大连TakaRa)1.0μl，AP1 Primer(100μmol/l，大连TakaRa)1.0μl，FBA-SP1(10μmol/l)1.0μl，R.toruloides ATCC 10788基因组DNA模板(120ng/μl)1.0μl，ddH₂O加至50μl。反应条件：先进行5个高温退火温度的高特异性反应，然后进行1个极低退火温度的低特异性反应；然后进行热不对称PCR：2个高退火温度(65℃)的高特异性反应和1个低退火温度(44℃)的低特异性反应交替循环，共15次。具体参数如下：94℃1min，98℃1min；94℃30s，65℃1min，72℃2min，共5个循环；94℃30s，25℃3min，72℃2min；94℃30s，65℃1min，72℃2min，94℃30s，65℃1min，72℃2min，94℃30s，44℃1min，72℃2min，共15个循环；72℃10min，结束反应。

22^nd巢式PCR反应

反应体系50μl：10×LA PCR buffer II(Mg²⁺plus，大连TakaRa)5.0μl，dNTPs(2.5mmol/l)8.0μl，LA Taq DNA聚合酶(5U/μl，大连TakaRa)1.0μl，AP1 Primer(100μmol/l，大连TakaRa)1.0μl，1^st PCR反应产物1.0μl，FBA-SP2(10μmol/l)1.0μl，ddH₂O加至50μl。反应条件：94℃30s，65℃1min，72℃2min，94℃30s，65℃1min，72℃2min，94℃30s，44℃1min，72℃2min，共15个循环；72℃10min，结束反应。

33^rd巢式PCR反应

反应体系50μl：10×LA PCR buffer II(Mg²⁺plus，大连TakaRa)5.0μl，dNTPs(2.5mmol/l)8.0μl，LA Taq DNA聚合酶(5U/μl，大连TakaRa)1.0μl，AP1 Primer(100μmol/l，大连TakaRa)1.0μl，2^nd巢式PCR反应产物1.0μl，FBA-SP3(10μmol/l)1.0μl，ddH₂O加至50μl。反应条件：94℃30s，65℃1min，72℃2min，94℃30s，65℃1min，72℃2min，94℃30s，44℃1min，72℃2min，共15个循环；72℃10min，结束反应。

3^rd巢式PCR反应产物经1％(质量/体积浓度)琼脂糖凝胶电泳后切割目的条带，利用DNA片段凝胶纯化试剂盒(购自碧云天)进行纯化。纯化后的DNA片段经TA克隆插入pMD18-T载体(购自大连TakaRa公司)，转化DH5α感受态细胞；其中感受态细胞按氯化钙法(分子克隆实验指南第三版，萨姆布鲁克著，黄培堂等译，科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序，得到如SEQ ID NO：1所示的DNA序列，证实为预期的pRtFBA基因序列。

序列号：1(SEQ ID NO：1)

序列长度：853bp

序列类型：DNA

来源：圆红冬孢酵母(Rhodosporidium toruloides)

1 GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC

61 TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG

121 CTGTTCGGCA GTTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC

181 GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG

241 AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG

301 GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG

361 TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC

421 TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC

481 ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT

541 CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT

601 TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG

661 AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA

721 AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG

781 CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA

841 CTAACTAGCT ACA

实施例5：染色体步移获得RtFBA基因3’翼侧序列(终止子)

本实施例也是利用Genome Walking Kit(购自大连TakaRa)完成。

根据实施例3中得到的FBADNA序列，设计3条Specific Primer(基因特异性引物)分别为FBA-SP11：5’-GTGTCGTCAAGATGAACGGTGCG-3’，FBA-SP22：5’-CGCCGACAAGCCCAACAAGAAGC-3’和FBA-SP33：5’-CGCGTCTGGGTCCGTGAGGGTG-3’，做为上游引物，按照试剂盒说明书进行3’翼侧染色体步移操作，除Specific Primer分别由FBA-SP1，FBA-SP2，FBA-SP3依次更换为FBA-SP11，FBA-SP22，FBA-SP33外，其它同实施例4。

3^rd巢式PCR反应产物利用DNA片段凝胶纯化试剂盒(购自碧云天)进行纯化，经TA克隆插入pMD18-T载体(购自大连TakaRa公司)，转化DH5α感受态细胞；其中感受态细胞按氯化钙法(分子克隆实验指南第三版，萨姆布鲁克著，黄培堂等译，科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序，得到如SEQ ID NO：2所示的DNA序列，证实为预期的RtFBAt基因序列。

实施例6：RtFBA启动子-开放阅读框架-终止子全长基因获得

根据实施例4和实施例5中获得的启动子和终止子序列，重新设计一对引物进行RtFBA“启动子-开放阅读框架-终止子”全长基因的扩增。pRtFBAt-p1：5’-GCTGACGGTACTCGTTTCGCAGAC-3’，pRtFBAt-p2：5’-TCGGTCCCCAATCCCAGCCATAGT-3’。以实施例1中制备的R.toruloides基因组DNA为模板进行PCR扩增。PCR体系(50μl)：10×Speed buffer(大连TakaRa)5.0μl，dNTPs(10mmol/l)1.0μl，上游引物RtFBA-p1(10μmol/l)2.0μl，下游引物RtFBA-p2(10μmol/l)2.0μl，SpeedSTAR^TMHS DNA聚合酶(扩增速度快，1kb/10s，购自大连TakaRa公司)0.5μl，基因组DNA模板(120ng/μl)2μl，ddH₂O加至50μl。反应条件：98℃1min，98℃10s，65℃1.0min，35个循环，72℃10min，4℃结束反应。PCR产物经1％(质量/体积浓度)琼脂糖凝胶电泳分析后利用PCR片段纯化试剂盒(购自碧云天)进行纯化。片段经TA克隆插入pMD18-T载体(购自大连TakaRa公司)，转化DH5α感受态细胞；其中感受态细胞按氯化钙法(分子克隆实验指南第三版，萨姆布鲁克著，黄培堂等译，科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序，得到如SEQ ID NO：6所示的DNA序列，证实为预期的 pRtFBAt全长序列，该重组载体命名为T-FBA 3.7k。

实施例7：FBAgfp圆红冬孢酵母特异性绿色荧光蛋白表达盒的构建

1.绿色荧光蛋白编码基因GFPuv的获得

以pGFPuv质粒(购自BD Biosciences)为模板，利用寡核苷酸gfp-p1：5’-ATGAGTAAAGGAGAAGAACT-3′和gfp-p2：5’-TCATTTGTAGAGCTCAT CCAT-3’为引物，进行PCR扩增。体系(50μl)：5×Prime buffer(大连TakaRa)10.0μl，dNTPs(2.5mmol/l)4.0μl，上游引物gfp-p1(10μmol/l)2.0μl，下游引物gfp-p2(10μmol/l)2.0μl，PrimeSTAR^TM HS DNA聚合酶(大连TakaRa)1.0μl，pGFPuv质粒(120ng/μl)1μl，ddH₂O加至50μl。反应条件：95℃3min，98℃8s，49℃15s，72℃1min，35个循环，72℃10min，4℃结束反应。PCR反应产物利用DNA片段胶回收纯化试剂盒纯化，利用taq DNA聚合酶进行DNA片段3’末端加A，体系(50μl)：10×PCR buffer(大连TakaRa)5.0μl，dNTPs(2.5mmol/l)4.0μl，纯化后的GFPuv DNA片段30μl，ddH₂O加至50μl。反应条件：72℃30min，4℃结束反应。3’末端加A后的GFPuv DNA片段利用DNA片段胶回收纯化试剂盒纯化，克隆入pMD18-T载体，送大连TakaRa公司测序，得到如SEQ ID NO：7所示的DNA序列，证实为预期的GFPuv基因序列。

2.RF克隆法构建圆红冬孢酵母特异性绿色荧光蛋白表达盒FBAgfp

圆红冬孢酵母特异性绿色荧光蛋白表达盒FBAgfp的构建利用的是RF克隆(Van den Ent，F.，Lowe，J.，2006.RF cloning：A restriction-free method forinserting target genes into plasmids.J.Biochem.Biophys.Methods 67：67-74；Yang F，Zhang S，Tang W，Zhao Z，2008.Identification of theorotidine-5′-monophosphate decarboxylase gene of the oleaginous yeastRhodosporidium toruloides.Yeast 25(9)：623-630)的方法。

FBA全长序列扩增和克隆见实施例6。

参照文献方法(Van den Ent，F.，Lowe，J.，2006.RF cloning：Arestriction-free method for inserting target genes into plasmids.J.Biochem.Biophys.Methods 67：67-74)，设计RF克隆引物：FBA-gfp-p1：5′-CTTCTAACACTAACTAGCT ACAatgagtaaaggagaagaact-3′和FBA-gfp-p1：5′-GCGAGAAGAGAAGAG GGTATCGACtcatttgtagagctcatccat-3′(其中大写字母部分序列与pRtFBAt克隆载体中原有的FBA ORF翼侧序列互补，小写字母部分序列与绿色荧光蛋白GFPuv ORF互补)。

RF I反应体系及流程：以本实施例操作项1中构建的GFPuv的TA克隆载体为模板，利用FBAgfp-p1和FBAgfp-p2为引物，进行RF第一轮扩增。体系(50μl)：5×Prime buffer(大连TakaRa)10.0μl，dNTPs(2.5mmol/l)4.0μl，上游引物(10μmol/l)2.0μl，下游引物(10μmol/l)2.0μl，PrimeSTAR^TM HS DNA聚合酶(大连TakaRa)1.0μl，T-GFPuv质粒(100 ng/μl)1μl，ddH₂O加至50μl。反应条件：95℃3min，98℃8s，49℃15s，72℃1min，35个循环，72℃10min，4℃结束反应。RF I反应产物利用DNA片段胶回收纯化试剂盒纯化，-20℃保存备用。

RF II反应：5×Prime buffer(大连TakaRa)10.0μl，dNTPs(2.5mmol/l)4.0μl，实施例5中构建的T-FBA 3.7k质粒(100ng/μl)1.0μl，本实施例前述步骤中RF I反应产物(100ng/μl)5.0μl，PrimeSTAR^TM HS DNA聚合酶(大连TakaRa)1.0μl，ddH₂O加至50μl。反应条件：95℃3min，68℃12min，之后95℃30s，65℃45s(-1℃/cyc)，68℃12min，15个循环，接下来再进行一轮：95℃30s，55℃45s，68℃12min，20个循环，72℃10min，4℃结束反应。

DpnI消化和电击转化：取8μl RF II反应产物加入1μl DpnI(购自NewEngland Biolabs)和1μl DpnI buffer，混匀后在37℃作用120min去除原T-FBA 3.7k质粒后，分别取2μl电击转化DH5α感受态细胞，感受态细胞按标准方法制备(分子克隆实验指南第三版，萨姆布鲁克著，黄培堂等译，科学出版社出版)，电击转化参数：2200-2500V，400Ω，25μF，0℃，4-8ms。挑选Amp抗性转化子进行增菌培养、质粒提取，并利用RF I反应所用引物FBAgfp-p1和FBAgfp-p2进行菌落PCR鉴定，鉴定阳性的重组载体送大连TakaRa进行测序，得到5’端和3’端分别为FBA启动子和FBA终止子的FBAgfp表达盒，同时，该重组载体命名为T-FBAgfp。完整的FBAgfp表达盒如SEQ ID NO：8所示。

实施例8：FBAgfp表达盒的功能验证

也即pRtFBA启动子和RtFBAt终止子的活性测定。

在此利用26SrDNA基因做为靶基因，利用FBAgfp表达盒进行26SrDNA-FBAgfp基因表达盒的构建，表达盒5’和3’末端分别携带有500bp的同源重组臂。PCR扩增制备的大量26SrDNA-FBAgfp基因表达盒线性DNA片段，经电击转化圆红冬孢酵母，观察荧光蛋白的表达。

1.Rt26SrDNA基因的获得

参考GenBank序列信息(NCBI NO：DQ832198)，设计1对引物进行圆红冬孢酵母核糖体大亚基26SrDNA编码基因的钓取。上游引物Rt26S-p1：5’-AAGGATTCCCCTAGTAGCGGCGAGC-3’，下游引物Rt26S-p2：5’-CTGACGGCGAGGTATGGGTAACACG-3’。

以实施例3中制备的R.toruloides基因组DNA为模板，利用基因特异性引物Rt26S-p1和Rt26S-p2进行PCR扩增。PCR体系(50μl)：10×Speedbuffer(大连TakaRa)5.0μl，dNTPs(10mmol/l)1.0μl，上游引物(10μmol/l)2.0μl，下游引物(10μmol/l)2.0μl，SpeedSTAR^TM HS DNA聚合酶(扩增速度快，1kb/10s，购自大连TakaRa公司)0.5μl，基因组DNA模板(120ng/μl)2μl，ddH₂O加至50μl。反应条件：98℃1min，98℃10s，65℃45s，35个循环，72℃10min，4℃结束反应。

PCR产物经1％(质量/体积浓度)琼脂糖凝胶电泳分析后利用PCR片段纯化试剂盒(购自碧云天)进行纯化。纯化后的pRtFBADNA片段经TA克隆插入pMD18-T载体(购自大连TakaRa公司)，转化DH5α感受态细胞；其中感受态细胞按氯化钙法(分子克隆实验指南第三版，萨姆布鲁克著，黄培堂等译，科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序，得到如SEQ IDNO：9所示的DNA序列，证实为预期的Rt26SrDNA基因序列。

2.Rt26SrDNA-FBAgfp基因表达盒的构建

Rt26SrDNA-FBAgfp基因表达盒的构建也是采用RF克隆(Van den Ent，F.，Lowe，J.，2006.RF cloning：A restriction-free method for inserting targetgenes into plasmids.J.Biochem.Biophys.Methods 67：67-74)的方法。

参照文献方法(Van den Ent，F.，Lowe，J.，2006.RF cloning：Arestriction-free method for inserting target genes into plasmids.J.Biochem.Biophys.Methods 67：67-74)，设计RF克隆引物：Rt26SrDNA-FBAgfp-p1：5′-ACTTAGGATGCTGGTGGAATGGCgatgaactgccggacaaaggag-3′和Rt26SrDNA-FBAgfp-p2：5′-GTTCCCACCTCCATTCACTTTCAccgttcactgcgagatcacttcc-3′(其中大写字母部分序列与pRt26SrDNA克隆载体中原有的26SrDNA序列5’末端和3’末端互补，小写字母部分序列与绿色荧光蛋白GFPuv ORF互补)。

RF I反应体系及流程：以实施例7中FBAgfp的TA克隆载体为模板，利用FBAgfp-p1和FBAgfp-p2为引物，进行RF第一轮扩增。体系(50μl)：5×Prime buffer(大连TakaRa)10.0μl，dNTPs(2.5mmol/l)4.0μl，上游引物(10μmol/l)2.0μl，下游引物(10μmol/l)2.0μl，PrimeSTAR^TMHS DNA聚合酶(大连TakaRa)1.0μl，pFBAgfp质粒(源自实施例7，100ng/μl)1μl，ddH₂O加至50μl。反应条件：95℃3min，98℃8s，49℃15s，72℃1min，35个循环，72℃10min，4℃结束反应。RF I反应产物利用DNA片段胶回收纯化试剂盒纯化，-20℃保存备用。

RF II反应：5×Prime buffer(大连TakaRa)10.0μl，dNTPs(2.5mmol/l)4.0μl，实施例5中构建的T-Rt26SrDNA质粒(100ng/μl)1.0μl，本实施例前述步骤中RF I反应产物(100ng/μl)5.0μl，PrimeSTAR^TM HS DNA聚合酶(大连TakaRa)1.0μl，ddH₂O加至50μl。反应条件：95℃3min，68℃12min，之后95℃30s，65℃45s(-1℃/cyc)，68℃12min，15个循环，接下来再进行一轮：95℃30s，55℃45s，68℃12min，20个循环，72℃10min，4℃结束反应。

DpnI消化和电击转化：取8μl RF II反应产物加入1μl DpnI(购自NewEngland Biolabs)和1μl DpnI buffer混匀后在37℃作用120min去除原T-Rt26SrDNA质粒后，分别取2μl电击转化DH5α感受态细胞，感受态细胞按标准方法制备(分子克隆实验指南第三版，萨姆布鲁克著，黄培堂等译，科学出版社出版)，电击转化参数：2200-2500V，400Ω，25μF，0℃，4-8ms。挑选Amp抗性转化子进行增菌培养、质粒提取，并利用RF I反应所用引物Rt26SrDNA-p1和Rt26SrDNA-p2进行菌落PCR鉴定，鉴定阳性的重组载体送大连TakaRa进行测序，得到5’端和3’端分别为Rt26SrDNA 5’末端和3’末端的Rt26SrDNA-FBAgfp敲除盒，同时，该重组载体命名为T-Rt26SrDNA-FBAgfp。GFPuv ORF序列如SEQ ID NO：7所示；完整的Rt26SrDNA-FBAgfp表达盒(或敲除盒)如SEQ ID NO：10所示。

3.Rt26SrDNA-FBAgfp表达盒的制备

以构建的T-Rt26SrDNA-FBAgfp载体为模板，以寡核苷酸序列Rt26S-p1和Rt26S-p2为引物，进行Rt26SrDNA-FBAgfp表达盒的大量制备。PCR体系(500μl)：10×Speed buffer(大连TakaRa)50.0μl，dNTPs(10mmol/l)10.0μl，上游引物(10μmol/l)20.0μl，下游引物(10μmol/l)20.0μl，SpeedSTAR^TM HS DNA聚合酶(扩增速度快，1kb/10s，购自大连TakaRa公司)5.0μl，基因组DNA模板(120ng/μl)15.0μl，ddH₂O加至500μl。反应条件：98℃1min，98℃10s，65℃60s，35个循环，72℃10min，4℃结束反应。

PCR产物经1％(质量/体积浓度)琼脂糖凝胶电泳分析后利用PCR片段纯化试剂盒(购自碧云天)进行纯化。纯化后的DNA片段浓度在300ng/μl，共50μl，-20℃保存备用。

4.单倍体圆红冬孢酵母ATCC 10788感受态细胞制备

R.toruloides np11感受态细胞的制备：R.toruloides ATCC 10788(购自美国标准生物品收藏中心ATCC)菌株挑菌落接种10ml YEPD培养基(葡萄糖20.0g/l，酵母提取物10.0g/l，蛋白胨20.0g/l，pH 6.0)，30℃，200rpm，培养20h；培养物1∶50比例转接新鲜YEPD培养基，100ml(500ml锥形瓶，装液量100ml)，30℃，200rpm，培养6-9h，OD值达到0.6-1.2；培养物冰浴10-30min，4℃，4000rpm离心5min，弃上清；0℃无菌Milli-Q水洗1次；0℃1mol/l山梨醇洗涤2次；冰浴，备用。

5.圆红冬孢酵母ATCC 10788的电击转化

Rt26SrDNA-FBAgfp表达盒的电击转化：取100μl R.toruloides ATCC10788感受态细胞，加入Rt26SrDNA-FBAgfp表达盒10μl(总共3μg)，混匀后移入预冷至0℃的电击杯中，参数：电压0.8-2.0千伏，电阻200Ω，电容25μF，时间4-10ms；电击后立即加入1ml YEPD，30℃温育1-2h；涂布YEPD平板，10μl/平板，30℃培养28-36h；逐一挑单克隆利用荧光显微镜进行镜检，阳性重组子的荧光相片如图5所示。

6.转化子的鉴定

阳性重组子接种10ml YEPD培养基(葡萄糖20.0g/l，酵母提取物10.0g/l，蛋白胨20.0g/l，pH 6.0)，30℃，200rpm，培养24h；分别取2ml培养物，8000rpm离心5min，弃上清；菌体重悬于2ml 0℃ Milli-Q水，4 ℃，4000rpm，4min，弃上清；重复3次；菌体重悬于200μl破菌缓冲液(2％Triton X-100，1％SDS，100mmol/l NaCl，10mmol/l Tris-Cl，pH8.0，1mmol/lEDTA)，200μl Tris饱和酚∶氯仿∶异戊醇(25∶24∶1)，冰浴5min；于涡旋振荡器(美国Vortex-Genie 2涡旋振荡器，购自基因公司)最大涡旋度振荡lmin，冰浴1min，间隔进行，重复约10次，直至显微镜镜检破菌率达到90％以上；加入200μl TE缓冲液，混匀；13000rpm，12min，上清移入洁净1.5ml离心管，加入2倍体积无水乙醇，颠倒混匀，13000rpm，10min；弃上清，DNA沉淀用75％乙醇洗涤2次，室温晾干，TER缓冲液(含1μg/mlRNAse A的TE缓冲液)溶解，制成模板基因组DNA，-20℃保存备用。

以新制备的上述基因组DNA为模板，进行重组子的PCR鉴定，所用引物Rt26S-p1和Rt26S-p2。PCR体系(25μl)：10×Speed buffer(大连TakaRa)2.5μl，dNTPs(10mmol/l)0.5μl，上游引物(10μmol/l)1.0μl，下游引物(10μmol/l)1.0μl，SpeedSTAR^TM HS DNA聚合酶(扩增速度快，1kb/10s，购自大连TakaRa公司)0.25μl，基因组DNA模板(100ng/μl)1.0μl，ddH₂O加至50μl。反应条件：98℃1min，98℃10s，65℃60s，35个循环，72℃10min，4℃结束反应。结果显示，重组圆红冬孢酵母的PCR扩增产物将为3.8kb左右和1.2kb左右的两条带，野生型圆红冬孢酵母的PCR扩增产物将为1.2kb左右的一条带(图略)。

实施例9：FBAgfp表达盒在R.babjevae的功能验证

序列比对分析发现，R.toruloides 26SrDNA和R.babjevae 26SrDNA之间的序列同源性为94％，所以，利用实施例8中构建的Rt26SrDNA-FBAgfp表达盒直接转化R.babjevae，通过荧光观察便可验证Rt26SrDNA-FBAgfp表达盒在R.babjevae中的有效性，也即pRtFBA启动子和RtFBAt终止子的属内活性测定。

1.R.babjevae ATCC90942感受态细胞制备

R.babjevae ATCC90942购自购自美国标准生物品收藏中心。首先，挑菌落接种10ml YEPD培养基，28℃，200rpm，培养24h；培养物1∶50比例转接新鲜YEPD培养基，100ml(500ml锥形瓶，装液量100ml)，28℃，200rpm，培养7-10h，OD值达到0.6-1.2；培养物冰浴10-30min，4℃，4000rpm离心5min，弃上清；0℃无菌Milli-Q水洗1次；0℃1mol/l山梨醇洗涤2次；冰浴，备用。

2.R.babjevae ATCC90942的电击转化

取100μl R.babjevae ATCC90942感受态细胞，加入实施例8中制备的Rt26SrDNA-FBAgfp表达盒10μl(总共3μg)，电击参数和电击后操作同实施例8；逐一挑单克隆利用荧光显微镜进行镜检，阳性重组子的荧光相片如图7所示。

3.转化子的鉴定

荧光重组子接种10ml YEPD培养基，28℃，200rpm，培养24h；分别取2ml培养物，8000rpm离心5min，弃上清；基因组DNA的制备同实施例8中的操作项6，基因组DNA于-20℃保存备用。

利用引物Rt26S-p1和Rt26S-p2(详见实施例8)进行重组子的PCR鉴定。PCR体系(25μl)和扩增条件同实施例8。结果显示，重组圆红冬孢酵母的PCR扩增产物将为3.8kb左右和1.2kb左右的两条带，野生型圆红冬孢酵母的PCR扩增产物将为1.2kb左右的一条带(图略)。

以上实施例证明：RtFBA启动子能够启动GFPuv在R.toruloides ATCC10788和R.babjevae ATCC90942中的荧光表达；以FBAgfp表达盒为基础构建的Rt26SrDNA-FBAgfp敲除盒，能够敲除红冬孢酵母属酵母基因组上的Rt26SrDNA靶基因的部分拷贝。

使用本发明的启动子和终止子，可实现目的基因在圆红冬孢酵母中的表达或特定靶基因(如26S rDNA)的敲除，为圆红冬孢酵母开启了一条育种新途径，并因此可以提供具有工业用途的新型圆红冬孢酵母。并为红冬孢酵母属的其它酵母菌的遗传操作提供了方法和平台。

实施例10：圆红冬孢酵母果糖-1，6-二磷酸醛缩酶RtFBA的结构表征

参考分子克隆实验指南第三版(萨姆布鲁克著，黄培堂等译，科学出版社出版)经分子排阻、离子交换纯化得到圆红冬孢酵母果糖-1，6-二磷酸醛缩酶RtFBA。纯化后的RtFBA晶体的生长通过室温下的悬滴法获得。经条件优化后参数如下：RtFBA蛋白溶液12mg/ml(含20mM的磷酸甘油氧肟酸(phosphoglycolo-hydroxamate，PGH)，预先冰浴30min)和等体积的生晶母液(0.1M Tris-HCl(pH 8.8)，0.2M Mgcl₂，18-23％(w/v)聚乙二醇2000)混合，4-8周内出现正交晶体。用多波长反常散射法(MAD)确定位相，MAD数据在ADSC Quantum-4R CCD探测器上收集，所有数据用DPS软件包进行统一，用CCP4软件包进行坐标修正与处理。模型用XtalView 4.0软件在Silicon Graphics OCTANE上构建和校正，用REFMAC程序进行精化。圆红冬孢酵母果糖-1，6-二磷酸醛缩酶RtFBA晶体属于空间群C222₁，晶格常数为

根据衍射数据得到三维结构模型见图8。

本发明的有益效果是：

为圆红冬孢酵母或红冬孢酵母属的酵母菌提供了启动子、终止子、GFP表达盒和遗传转化方法，将有力促进今后的圆红冬孢酵母或红冬孢酵母属酵母菌的菌株改良研究，加快圆红冬孢酵母代谢工程研究。

SEQ ID NO：1

GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC 60

TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG 120

CTGTTCGGCA GTTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC 180

GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG 240

AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG 300

GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG 360

TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC 420

TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC 480

ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT 540

CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT 600

TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG 660

AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA 720

AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG 780

CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA 840

CTAACTAGCT ACA 853

SEQ ID NO：2

GCATTTCCTA CGCCATGCCT GAACCGAGTC TGAAGACCGT ACAGAATCAC TAAAAGTCGT 60

GAAACGAATA CCTCTTTGTG CGTCTACCTT GAGCGAGCGA GAGGAGCGGG TCTTTTCGGC 120

GGCAGTGAGC CTCTGGCACA GGCTCCCCGG CGACATGGGG CCGTGGAACC AGAGCTTCCA 180

GCGATGACAG CGACTTCTTC ACCCTCGAGG ACGAGGAGGT CTCTGCCGTT TGTCTCTTCC 240

CTCAGCCACC CTCACACTCG CTGGGCTCGA TGAGGGTGCA AAGCTTGTCT TCCCCGCTCT 300

TGTGGTCCTG GCGTCAAGCT CCCAGCACTC ACGACGCCTC CCTCTCGCTC TCCTCCTCTT 360

CATCGGCTCC TCAGCAACTC TCGCTCTCCC AGCATGTGGA CGGCTTCCGA CCTGTCGCGC 420

ACTTTCCGAG CGTCATTCAC GAGGAGCTAC TGGCGGTGGG AGAGATCTCT GATCCGTTTT 480

TGAGGCGTAA TGAGGAGGTA CGCTTCCTCG CCCCCACATC TCAACCGTCG AGGAGGAGGT 540

GGGAGCCAGA ACGAGCTGAC TAGCGAGTAC GTGTACCGTC GCAGGCCGTG CAATGGGTCG 600

GCGAAGCAGA CTGGATCTAC CGCTGCGACT TCGAGGTCGA GCGGCTGCCG AAGAAGCGCT 660

CGAAAGAGGG CGAGGGCGAG GAGGAGAGGG CTGACTTGGT GTTCGAGGGT CTCGATACGT 720

TCGCGACGGT GTACTGTGAG TCGAGATCGA GCGGGCAGAC GGATTGATCG CTAATACGGA 780

AGTGATCTCG CAGTGAACGG CGACAAGATC CTCGAGGCCG ACAACATGTT CCGTGAATGG 840

CGGTGAGTCG TCGCTTGAGG CTTCACACTT CGTATGCACC ATGTGAGTCT GCTGCAGACG 900

TTGATGTGGC AGCCCGTGGA CCATCCACAG TGTCCCGCTT CGATGCTCGC AACTCCGCCA 960

CGGCCGCAAC TTGCTGTACA TCGTCTTTCA CTCAGCGTT 999

SEQ ID NO：3(RtFBA的cDNA序列)

ATGGGTGTCC TCGATGTTGT CCCCGCCGGC GTCCTCACCG GCAAGAACCT CGTCAAGTTG 60

ATGGACTACG CTCGCGAGAA CCACAACTGC ACCTCGTCGT CGACCGTCGT CGCCGCCCTC 120

GAGGCCGCCC GCGACTCCAA GTCGCCCGTC ATCATCCAGG TCTCGCAGGG TGGTGCCGCC 180

TTCTTCGCCG GGAAGGGTGT CGCCAACGAC AAGCAGCAGG CTTCCATCGC CGGTGCCGTC 240

GCCGCCGCCC ACTACGTCCG CTCCATCGCT CCCACCTATG GCGTCCCCGT CGTGCTGCAC 300

AGCGACCACT GTGCGAAGAA GCTCCTCCAA TGGTTCGACG GCATGCTCGA GGCCGACGAG 360

GCTTACTACA AGGAGAAGGG CGAGCCTCTC TTCTCTACTT TGAGCGCATG GCCAAGGTCG 420

ACCTCTGGCT CGAGATGGAG ATTGGCATCA CCGGTGGTGA GGAGGACGGT GTCGACAACA 480

CTGGTGAGTG CGCGTGCCTT TCGAGTGTCT ATTGACGAGA CTGACGATCA GGGGACAGGC 540

GTCGACAACA ACTCGCTCTA CACCCAGCCC GAGGACATCC TCGACATCCA CAACGCCCTC 600

TCCAAGATCT CGCCCATGTT CTCGATCGCT GCCGGCTTCG GCAACGTCCA CGGCGTCTAC 660

AAGCCTGGCA ACGTCAAGCT CCGTCCCGAG CTCCTCGAGA AGCACCAGAA GTACTGCCAC 720

GAGCAGCTCA AGTCGAAGAA CCCCCTCCCC ATCTACCTCG TCTTCCACGG CGGTTCGGGA 780

TCGTCCAAGG ACGAGATCAC TACCGCTGTC AAGAACGGTG TCGTCAAGAT GAACGTCGAC 840

ACCGACACCC AGTGGGCATA CATGATCGGC TTCCGCGACT ACTTCAAGTC CAAGGCCGCG 900

TACCTCGAGA CCCAGGTCGG TAACCCCGAG GGCGCCGACA AGCCCAACAA GAAGCAGTAC 960

GACCCGCGCG TCTGGGTCCG TGAGGGTGAG AAGACGATGA AGGAGCGCTG CCAGGTCGCC 1020

TTCAAGGACC TCCGCTCCGA GGGAACCCTC TAA 1053

SEQ ID NO：4

Met Gly Val Leu Asp Val Val Pro Ala Gly Val Leu Thr Gly Lys

Asn Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn His Asn Cys

Thr Ser Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala Arg Asp

Ser Lys Ser Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala Ala

Phe Phe Ala Gly Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser

Ile Ala Gly Ala Val Ala Ala Ala His Tyr Val Arg Ser Ile Ala

Pro Thr Tyr Gly Val Pro Val Val Leu His Ser Asp His Cys Ala

Lys Lys Leu Leu Gln Trp Phe Asp Gly Met Leu Glu Ala Asp Glu

Ala Tyr Tyr Lys Glu Lys Gly Glu Pro Leu Phe Ser Thr Leu Ser

Ala Trp Pro Arg Ser Thr Ser Gly Ser Arg Trp Arg Leu Ala Ser

Pro Val Val Arg Arg Thr Val Ser Thr Thr Leu Val Ser Ala Arg

Ala Phe Arg Val Ser Ile Asp Glu Thr Asp Asp Gln Gly Thr Gly

Val Asp Asn Asn Ser Leu Tyr Thr Gln Pro Glu Asp Ile Leu Asp

Ile His Asn Ala Leu Ser Lys Ile Ser Pro Met Phe Ser Ile Ala

Ala Gly Phe Gly Asn Val His Gly Val Tyr Lys Pro Gly Asn Val

Lys Leu Arg Pro Glu Leu Leu Glu Lys His Gln Lys Tyr Cys His

Glu Gln Leu Lys Ser Lys Asn Pro Leu pro Ile Tyr Leu Val Phe

His Gly Gly Ser Gly Ser Ser Lys Asp GluIle Thr Thr Ala Val

Lys Asn Gly Val Val Lys Met Asn Val Asp Thr Asp Thr Gln Trp

Ala Tyr Met Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys Ala Ala

Tyr Leu Glu Thr Gln Val Gly Asn Pro Glu Gly Ala Asp Lys Pro

Asr Lys Lys Gln Tyr Asp Pro Arg Val Trp Val Arg Glu Gly Glu

Lys Thr Met Lys Glu Arg Cys Gln Val Ala Phe Lys Asp Leu Arg

Ser Glu Gly Thr Leu

SEQ ID NO：5

ATGGGTGTCC TCGATGTTGT CCCCGCGTAA GCATCACACG CTCCCACTGC AGCACCCGCA 60

CCCGCTCACC TTGCTCCCGC AGGCGTACGT CCCCTCCGCC CCGTCATACC CCTCCCGGCT 120

TCTCTCGAGT CGCGCTCGCC CACAACACCG CGCGGACGGC TGGGAACAGA ATGGCAGGAT 180

CGGGGAATAG CATGCTCACA TTGAGCGAAC CCGCAGCGGC GTCCTCACCG GCAAGAACCT 240

CGTCAAGTTG ATGGACTACG CTCGCGAGAA CCACGTCCGT CTTCTTCCGA CTCGCTCACG 300

AGTGACTGTG CGCTGACCTG CAGCCTCGCG TTTGAGACAG TTCGCCATCC CTGTGCGTTA 360

CCAGTCCTCG CGAACGGGCG CCGCGCTCTC GCCGTCGCAC GCTTGACGTC GCGAGGGTCG 420

GTCGCTGATG AGATGGATGA GATCAAGCTG ACCCCGCCTT TTCCACTCCG CTTTTCTCCC 480

TTCTCCAGGC CTTCGTGAGT CCCTCTCACA CCGTTTGACG CCGGGAGCGA GCGACGGGCT 540

GACCCGGGAC GTTGCGCGCA AACCAGAACT GCACCTCGTC GTCGACCGTC GTCGCCGCCC 600

TCGAGGCCGC CCGCGACTCC AAGTCGCCCG TCATCATCCA GGTCTCGCAG GGTGGTGCCG 660

CCTTCTTCGC CGGGAAGGGT GTCGCCAACG ACAAGCAGCA GGCTTCCATC GCCGGTGCCG 720

TCGCCGCCGC CCACTACGTC CGCTCCATCG CTCCCACCTA TGGCGTCCCC GTCGTGCTGC 780

ACAGCGACCA CTGTGCGAAG AAGCTCCTCC AATGGTTCGA CGGCATGCTC GAGGCCGACG 840

AGGCTTACTA CAAGGAGAAG GGCGAGCCTC TCTTCTCGTA AAGACGCGCT TCCTCTTCCT 900

CGCCTTGGAC TGGGCTAACG GGCATATCAC AGGTCGCACA TGCTCGACCT TTCGGAGGAG 960

TCAAAGGAGG AGAACATCGA GACTTGCGTC AAGTACTTTG AGCGCATGGC CAAGGTCGAC 1020

CTCTGGCTCG AGATGGAGAT TGGCATCACC GGTGGTGAGG AGGACGGTGT CGACAACACT 1080

GGTGAGTGCG CGTGCCTTTC GAGTGTCTAT TGACGAGACT GACGATCAGG GGACAGGCGT 1140

CGACAACAAC TCGCTCTACA CCCAGCCCGA GGACATCCTC GACATCCACA ACGCCCTCTC 1200

CAAGATCTCG CCCATGTTCT CGATCGCTGC CGGCTTCGGC AACGTCCACG GCGTCTACAA 1260

GCCTGGCAAC GTCAAGCTCC GTCCCGAGCT CCTCGAGAAG CACCAGAAGT ACTGCCACGA 1320

GCAGCTCAAG TCGAAGAACC CCCTCCCCAT CTACCTCGTC TTCCACGGCG GTTCGGGATC 1380

GTCCAAGGAC GAGATCACTA CCGCTGTCAA GAACGGTGTC GTCAAGATGA ACGGTGCGCG 1440

ACGACTTTTC GCGGACTTGC GACTCCCGAG TGCTGACTTG GCTTCTGCCT TCTCCGCTTT 1500

TTCACTTGGC TTCTGCCTTC TCCGCTTCTC TTCTTGTCCC TACAGTCGAC ACCGACACCC 1560

AGTGGGCATA CATGATCGGC TTCCGCGACT ACTTCAAGTC CAAGGCCGCG TACCTCGAGA 1620

CCCAGGTCGG TAACCCCGAG GGCGCCGACA AGCCCAACAA GAAGCAGTAC GACCCGTAAG 1680

TCGATACCCT CTTCTCTTCT CGCCCGGCCT CTGACGAGAC TCTTTGTTGT CCAGGCGCGT 1740

CTGGGTCCGT GAGGGTGAGA AGACGATGAA GGAGCGCTGC CAGGTCGCCT TCAAGGACCT 1800

CCGCTCCGAG GGAACCCTCT AA 1822

SEQ ID NO：6

GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC 60

TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG 120

CTGTTCGGCA GTTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC 180

GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG 240

AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG 300

GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG 360

TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC 420

TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC 480

ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT 540

CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT 600

TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG 660

AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA 720

AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG 780

CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA 840

CTAACTAGCT ACAATGGGTG TCCTCGATGT TGTCCCCGCG TAAGCATCAC ACGCTCCCAC 900

TGCAGCACCC GCACCCGCTC ACCTTGCTCC CGCAGGCGTA CGTCCCCTCC GCCCCGTCAT 960

ACCCCTCCCG GCTTCTCTCG AGTCGCGCTC GCCCACAACA CCGCGCGGAC GGCTGGGAAC 1020

AGAATGGCAG GATCGGGGAA TAGCATGCTC ACATTGAGCG AACCCGCAGC GGCGTCCTCA 1080

CCGGCAAGAA CCTCGTCAAG TTGATGGACT ACGCTCGCGA GAACCACGTC CGTCTTCTTC 1140

CGACTCGCTC ACGAGTGACT GTGCGCTGAC CTGCAGCCTC GCGTTTGAGA CAGTTCGCCA 1200

TCCCTGTGCG TTACCAGTCC TCGCGAACGG GCGCCGCGCT CTCGCCGTCG CACGCTTGAC 1260

GTCGCGAGGG TCGGTCGCTG ATGAGATGGA TGAGATCAAG CTGACCCCGC CTTTTCCACT 1320

CCGCTTTTCT CCCTTCTCCA GGCCTTCGTG AGTCCCTCTC ACACCGTTTG ACGCCGGGAG 1380

CGAGCGACGG GCTGACCCGG GACGTTGCGC GCAAACCAGA ACTGCACCTC GTCGTCGACC 1440

GTCGTCGCCG CCCTCGAGGC CGCCCGCGAC TCCAAGTCGC CCGTCATCAT CCAGGTCTCG 1500

CAGGGTGGTG CCGCCTTCTT CGCCGGGAAG GGTGTCGCCA ACGACAAGCA GCAGGCTTCC 1560

ATCGCCGGTG CCGTCGCCGC CGCCCACTAC GTCCGCTCCA TCGCTCCCAC CTATGGCGTC 1620

CCCGTCGTGC TGCACAGCGA CCACTGTGCG AAGAAGCTCC TCCAATGGTT CGACGGCATG 1680

CTCGAGGCCG ACGAGGCTTA CTACAAGGAG AAGGGCGAGC CTCTCTTCTC GTAAAGACGC 1740

GCTTCCTCTT CCTCGCCTTG GACTGGGCTA ACGGGCATAT CACAGGTCGC ACATGCTCGA 1800

CCTTTCGGAG GAGTCAAAGG AGGAGAACAT CGAGACTTGC GTCAAGTACT TTGAGCGCAT 1860

GGCCAAGGTC GACCTCTGGC TCGAGATGGA GATTGGCATC ACCGGTGGTG AGGAGGACGG 1920

TGTCGACAAC ACTGGTGAGT GCGCGTGCCT TTCGAGTGTC TATTGACGAG ACTGACGATC 1980

AGGGGACAGG CGTCGACAAC AACTCGCTCT ACACCCAGCC CGAGGACATC CTCGACATCC 2040

ACAACGCCCT CTCCAAGATC TCGCCCATGT TCTCGATCGC TGCCGGCTTC GGCAACGTCC 2100

ACGGCGTCTA CAAGCCTGGC AACGTCAAGC TCCGTCCCGA GCTCCTCGAG AAGCACCAGA 2160

AGTACTGCCA CGAGCAGCTC AAGTCGAAGA ACCCCCTCCC CATCTACCTC GTCTTCCACG 2220

GCGGTTCGGG ATCGTCCAAG GACGAGATCA CTACCGCTGT CAAGAACGGT GTCGTCAAGA 2280

TGAACGGTGC GCGACGACTT TTCGCGGACT TGCGACTCCC GAGTGCTGAC TTGGCTTCTG 2340

CCTTCTCCGC TTTTTCACTT GGCTTCTGCC TTCTCCGCTT CTCTTCTTGT CCCTACAGTC 2400

GACACCGACA CCCAGTGGGC ATACATGATC GGCTTCCGCG ACTACTTCAA GTCCAAGGCC 2460

GCGTACCTCG AGACCCAGGT CGGTAACCCC GAGGGCGCCG ACAAGCCCAA CAAGAAGCAG 2520

TACGACCCGT AAGTCGATAC CCTCTTCTCT TCTCGCCCGG CCTCTGACGA GACTCTTTGT 2580

TGTCCAGGCG CGTCTGGGTC CGTGAGGGTG AGAAGACGAT GAAGGAGCGC TGCCAGGTCG 2640

CCTTCAAGGA CCTCCGCTCC GAGGGAACCC TCTAAGCATT TCCTACGCCA TGCCTGAACC 2700

GAGTCTGAAG ACCGTACAGA ATCACTAAAA GTCGTGAAAC GAATACCTCT TTGTGCGTCT 2760

ACCTTGAGCG AGCGAGAGGA GCGGGTCTTT TCGGCGGCAG TGAGCCTCTG GCACAGGCTC 2820

CCCGGCGACA TGGGGCCGTG GAACCAGAGC TTCCAGCGAT GACAGCGACT TCTTCACCCT 2880

CGAGGACGAG GAGGTCTCTG CCGTTTGTCT CTTCCCTCAG CCACCCTCAC ACTCGCTGGG 2940

CTCGATGAGG GTGCAAAGCT TGTCTTCCCC GCTCTTGTGG TCCTGGCGTC AAGCTCCCAG 3000

CACTCACGAC GCCTCCCTCT CGCTCTCCTC CTCTTCATCG GCTCCTCAGC AACTCTCGCT 3060

CTCCCAGCAT GTGGACGGCT TCCGACCTGT CGCGCACTTT CCGAGCGTCA TTCACGAGGA 3120

GCTACTGGCG GTGGGAGAGA TCTCTGATCC GTTTTTGAGG CGTAATGAGG AGGTACGCTT 3180

CCTCGCCCCC ACATCTCAAC CGTCGAGGAG GAGGTGGGAG CCAGAACGAG CTGACTAGCG 3240

AGTACGTGTA CCGTCGCAGG CCGTGCAATG GGTCGGCGAA GCAGACTGGA TCTACCGCTG 3300

CGACTTCGAG GTCGAGCGGC TGCCGAAGAA GCGCTCGAAA GAGGGCGAGG GCGAGGAGGA 3360

GAGGGCTGAC TTGGTGTTCG AGGGTCTCGA TACGTTCGCG ACGGTGTACT GTGAGTCGAG 3420

ATCGAGCGGG CAGACGGATT GATCGCTAAT ACGGAAGTGA TCTCGCAGTG AACGGCGACA 3480

AGATCCTCGA GGCCGACAAC ATGTTCCGTG AATGGCGGTG AGTCGTCGCT TGAGGCTTCA 3540

CACTTCGTAT GCACCATGTG AGTCTGCTGC AGACGTTGAT GTGGCAGCCC GTGGACCATC 3600

CACAGTGTCC CGCTTCGATG CTCGCAACTC CGCCACGGCC GCAACTTGCT GTACATCGTC 3660

TTTCACTCAG CGTT 3674

SEQ ID NO：7(绿色荧光蛋白编码基因)

ATGAGTAAAG GAGAAGAACT TTTCACTGGA GTTGTCCCAA TTCTTGTTGA ATTAGATGGT 60

GATGTTAATG GGCACAAATT TTCTGTCAGT GGAGAGGGTG AAGGTGATGC AACATACGGA 120

AAACTTACCC TTAAATTTAT TTGCACTACT GGAAAACTAC CTGTTCCATG GCCAACACTT 180

GTCACTACTT TCTCTTATGG TGTTCAATGC TTTTCCCGTT ATCCGGATCA TATGAAACGG 240

CATGACTTTT TCAAGAGTGC CATGCCCGAA GGTTATGTAC AGGAACGCAC TATATCTTTC 300

AAAGATGACG GGAACTACAA GACGCGTGCT GAAGTCAAGT TTGAAGGTGA TACCCTTGTT 360

AATCGTATCG AGTTAAAAGG TATTGATTTT AAAGAAGATG GAAACATTCT CGGACACAAA 420

CTCGAGTACA ACTATAACTC ACACAATGTA TACATCACGG CAGACAAACA AAAGAATGGA 480

ATCAAAGCTA ACTTCAAAAT TCGCCACAAC ATTGAAGATG GATCCGTTCA ACTAGCAGAC 540

CATTATCAAC AAAATACTCC AATTGGCGAT GGCCCTGTCC TTTTACCAGA CAACCATTAC 600

CTGTCGACAC AATCTGCCCT TTCGAAAGAT CCCAACGAAA AGCGTGACCA CATGGTCCTT 660

CTTGAGTTTG TAACTGCTGC TGGGATTACA CATGGCATGG ATGAGCTCTA CAAATAA 717

SEQ ID NO：8

GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC 60

TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG 120

CTGTTCGGCA ATTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC 180

GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG 240

AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG 300

GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG 360

TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC 420

TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC 480

ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT 540

CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT 600

TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG 660

AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA 720

AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG 780

CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA 840

CTAACTAGCT ACAATGAGTA AAGGAGAAGA ACTTTTCACT GGAGTTGTCC CAATTCTTGT 900

TGAATTAGAT GGTGATGTTA ATGGGCACAA ATTTTCTGTC AGTGGAGAGG GTGAAGGTGA 960

TGCAACATAC GGAAAACTTA CCCTTAAATT TATTTGCACT ACTGGAAAAC TACCTGTTCC 1020

ATGGCCAACA CTTGTCACTA CTTTCTCTTA TGGTGTTCAA TGCTTTTCCC GTTATCCGGA 1080

TCATATGAAA CGGCATGACT TTTTCAAGAG TGCCATGCCC GAAGGTTATG TACAGGAACG 1140

CACTATATCT TTCAAAGATG ACGGGAACTA CAAGACGCGT GCTGAAGTCA AGTTTGAAGG 1200

TGATACCCTT GTTAATCGTA TCGAGTTAAA AGGTATTGAT TTTAAAGAAG ATGGAAACAT 1260

TCTCGGACAC AAACTCGAGT ACAACTATAA CTCACACAAT GTATACATCA CGGCAGACAA 1320

ACAAAAGAAT GGAATCAAAG CTAACTTCAA AATTCGCCAC AACATTGAAG ATGGATCCGT 1380

TCAACTAGCA GACCATTATC AACAAAATAC TCCAATTGGC GATGGCCCTG TCCTTTTACC 1440

AGACAACCAT TACCTGTCGA CACAATCTGC CCTTTCGAAA GATCCCAACG AAAAGCGTGA 1500

CCACATGGTC CTTCTTGAGT TTGTAACTGC TGCTGGGATT ACACATGGCA TGGATGAGCT 1560

CTACAAATGA GCATTTCCTA CGCCATGCCT GAACCGAGTC TGAAGACCGT ACAGAATCAC 1620

TAAAAGTCGT GAAACGAATA CCTCTTTGTG CGTCTACCTT GAGCGAGCGA GAGGAGCGGG 1680

TCTTTTCGGC GGCAGTGAGC CTCTGGCACA GGCTCCCCGG CGACATGGGG CCGTGGAACC 1740

AGAGCTTCCA GCGATGACAG CGACTTCTTC ACCCTCGAGG ACGAGGAGGT CTCTGCCGTT 1800

TGTCTCTTCC CTCAGCCACC CTCACACTCG CTGGGCTCGA TGAGGGTGCA AAGCTTGTCT 1860

TCCCCGCTCT TGTGGTCCTG GCGTCAAGCT CCCAGCACTC ACGACGCCTC CCTCTCGCTC 1920

TCCTCCTCTT CATCGGCTCC TCAGCAACTC TCGCTCTCCC AGCATGTGGA CGGCTTCCGA 1980

CCTGTCGCGC ACTTTCCGAG CGTCATTCAC GAGGAGCTAC TGGCGGTGGG AGAGATCTCT 2040

GATCCGTTTT TGAGGCGTAA TGAGGAGGTA CGCTTCCTCG CCCCCACATC TCAACCGTCG 2100

AGGAGGAGGT GGGAGCCAGA ACGAGCTGAC TAGCGAGTAC GTGTACCGTC GCAGGCCGTG 2160

CAATGGGTCG GCGAAGCAGA CTGGATCTAC CGCTGCGACT TCGAGGTCGA GCGGCTGCCG 2220

AAGAAGCGCT CGAAAGAGGG CGAGGGCGAG GAGGAGAGGG CTGACTTGGT GTTCGAGGGT 2280

CTCGATACGT TCGCGACGGT GTACTGTGAG TCGAGATCGA GCGGGCAGAC GGATTGATCG 2340

CTAATACGGA AGTGATCTCG CAGTGAACGG CGACAAGATC CTCGAGGCCG ACAACATGTT 2400

CCGTGAATGG CGGTGAGTCG TCGCTTGAGG CTTCACACTT CGTATGCACC ATGTGAGTCT 2460

GCTGCAGACG TTGATGTGGC AGCCCGTGGA CCATCCACAG TGTCCCGCTT CGATGCTCGC 2520

AACTCCGCCA CGGCCGCAAC TTGCTGTACA TCGTCTTTCA CTCAGCGTT 2569

SEQ ID NO：9

AAGGATTCCC CTAGTAGCGG CGAGCGAAGC GGGAAGAGCT CAAATTTATA ATCTGGCACC 60

TTCGGTGTCC GAGTTGTAAT CTCTAGAAAT GTTTTCCGCG TTGGACCGCA CACAAGTCTG 120

TTGGAATACA GCGGCATAGT GGTGAGACCC CCGTATATGG TGCGGACGCC CAGCGCTTTG 180

TGATACATTT TCGAAGAGTC GAGTTGTTTG GGAATGCAGC TCAAATTGGG TGGTAAATTC 240

CATCTAAAGC TAAATATTGG CGAGAGACCG ATAGCGAACA AGTACCGTGA GGGAAAGATG 300

AAAAGCACTT TGGAAAGAGA GTTAACAGTA CGTGAAATTG TTGGAAGGGA AACGCTTGAA 360

GTCAGACTTG CTTGCCGAGC AATCGGTTTG CAGGCCAGCA TCAGTTTTCC GGGATGGATA 420

ATGGTAGAGA GAAGGTAGCA GTTTCGGCTG TGTTATAGCT CTCTGCTGGA TACATCTTGG 480

GGGACTGAGG AACGCAGTGT GCCTTTGGCG GGGGTTTCGA CCTCTTCACA CTTAGGATGC 540

TGGTGGAATG GCTTTAAACG ACCCGTCTTG AAACACGGAC CAAGGAGTCT AACATGCTTG 600

CGAGTATTTG GGTGTCAAAC CCGGATGCGT AATGAAAGTG AATGGAGGTG GGAACCGCAA 660

GGTGCACCAT CGACCGATCT GGATTTTTAA TGATGGATTT GAGTAAGAGC ACGTATGTTG 720

GGACCCGAAA GATGGTGAAC TATGCCTGAA TAGGGCGAAG CCAGAGGAAA CTCTGGTGGA 780

GGCTCGTAGC GGTTCTGACG TGCAAATCGA TCGTCAAATT TGGGTATAGG GGCGAAAGAC 840

TAATCGAACC ATCTAGTAGC TGGTTCCTGC CGAAGTTTCC CTCAGGATAG CAGAAACTCA 900

CATCAGTTCT ATGAGGTAAA GCGAATGATT AGAGGCCTTG GGGTTGAAAC AACCTTAACC 960

TATTCTCAAA CTTTAAATAT GTAGGAAGTC CTTGCTACTT AATTGAGCGA GGACATGCGA 1020

ATGAGAGTTT CTAGTGGGCC ATTTTTGGTA AGCAGAACTG GCGATGCGGG ATGAACCGAA 1080

CGCGAGGTTA AGGTGCCGGA ATACACGCTC ATCAGACACC ACAAAAGGTG TTAGTTCATC 1140

TAGACAGCCG CACGGTGGCC ATGGAAGTCG GAATCCGCTA AGGAGTGTGT AACAACTCAA 1200

CGGCCGAATG AACTAGCCCT GAAAATGGAT GGCGCTCAAG CGTGTTACCC ATACCTCGCC 1260

GTCAG 1265

SEQ ID NO：10

AAGGATTCCC CTAGTAGCGG CGAGCGAAGC GGGAAGAGCT CAAATTTATA ATCTGGCACC 60

TTCGGTGTCC GAGTTGTAAT CTCTAGAAAT GTTTTCCGCG TTGGACCGCA CACAAGTCTG 120

TTGGAATACA GCGGCATAGT GGTGAGACCC CCGTATATGG TGCGGACGCC CAGCGCTTTG 180

TGATACATTT TCGAAGAGTC GAGTTGTTTG GGAATGCAGC TCAAATTGGG TGGTAAATTC 240

CATCTAAAGC TAAATATTGG CGAGAGACCG ATAGCGAACA AGTACCGTGA GGGAAAGATG 300

AAAAGCACTT TGGAAAGAGA GTTAACAGTA CGTGAAATTG TTGGAAGGGA AACGCTTGAA 360

GTCAGACTTG CTTGCCGAGC AATCGGTTTG CAGGCCAGCA TCAGTTTTCC GGGATGGATA 420

ATGGTAGAGA GAAGGTAGCA GTTTCGGCTG TGTTATAGCT CTCTGCTGGA TACATCTTGG 480

GGGACTGAGG AACGCAGTGT GCCTTTGGCG GGGGTTTCGA CCTCTTCACA CTTAGGATGC 540

TGGTGGAATG GCGATGAACT GCCGGACAAA GGAGGACTTT TCGGCTCTCG CCGTCGCCCT 600

GTCCGATTCT CTGATCCAGA AGCACGCCGG CTCGAAGCTG TTCGGCAATT TTGTCGACGA 660

GCTCGCCCGC CTGCTCGCCG CGCCGCTCAA GTCGGACGAG GTGGGCAAGG TGCGCGCGAG 720

TATGGCCAAC CTCGCGATGG ACAAGCAGAA GCTCGAGAAG GCTGGCGCGA AGGGCGGCGC 780

AGTCGGTGGG AAGCCCCCTG CGAGGATGGT CGCGAGGGGC AGGGAGGACT TGTCGTCGTT 840

CGGAGAGGTG CTCGACGACG ATGTCGCCGC GGCCCAGTTC GACGAGGACG AGGATTTCGT 900

GCGTCGCTTT CGCTCGCTCG CTGGTTGCTC CTGTCTCTTC TGCTTCTCAC GCTGACTCTC 960

ATCGTGCCCG TCTCACTGCA GATGTAGATG TAGACGCACC TCCTCCAGCT TCACCTGCTT 1020

CCAACCTTTT CCACCGCCTG CAACCGCACT TTCGCCTCGT TCCTTCGGAC TCTTGCGGCT 1080

GCGATGTTGT CCAGCATCGA CAGGAGCTGC TTTACTTTCG CTTGACCTGC TTGCCACCTG 1140

GTGCTCGCAC GATGCCATAT ATCGCGAGGG AGGCGAGAGA GCGGAGTTGG CTGGATGACG 1200

CTCGCTCCGG CTTGCAGCTG GTTGTTACGG TGTTGCAAGA ATTTCTGTGC AGTTTGTACG 1260

AGTGGCCCCG CGTTGTGGAT GATGTCGGTT CGGTTGGCAC GGCCTTGCTC GCTCGCTCTC 1320

TCGTTGCTCC TCGCTCTTCA CCACTTCACT TCTAACACTA ACTAGCTACA ATGAGTAAAG 1380

GAGAAGAACT TTTCACTGGA GTTGTCCCAA TTCTTGTTGA ATTAGATGGT GATGTTAATG 1440

GGCACAAATT TTCTGTCAGT GGAGAGGGTG AAGGTGATGC AACATACGGA AAACTTACCC 1500

TTAAATTTAT TTGCACTACT GGAAAACTAC CTGTTCCATG GCCAACACTT GTCACTACTT 1560

TCTCTTATGG TGTTCAATGC TTTTCCCGTT ATCCGGATCA TATGAAACGG CATGACTTTT 1620

TCAAGAGTGC CATGCCCGAA GGTTATGTAC AGGAACGCAC TATATCTTTC AAAGATGACG 1680

GGAACTACAA GACGCGTGCT GAAGTCAAGT TTGAAGGTGA TACCCTTGTT AATCGTATCG 1740

AGTTAAAAGG TATTGATTTT AAAGAAGATG GAAACATTCT CGGACACAAA CTCGAGTACA 1800

ACTATAACTC ACACAATGTA TACATCACGG CAGACAAACA AAAGAATGGA ATCAAAGCTA 1860

ACTTCAAAAT TCGCCACAAC ATTGAAGATG GATCCGTTCA ACTAGCAGAC CATTATCAAC 1920

AAAATACTCC AATTGGCGAT GGCCCTGTCC TTTTACCAGA CAACCATTAC CTGTCGACAC 1980

AATCTGCCCT TTCGAAAGAT CCCAACGAAA AGCGTGACCA CATGGTCCTT CTTGAGTTTG 2040

TAACTGCTGC TGGGATTACA CATGGCATGG ATGAGCTCTA CAAATGAGCA TTTCCTACGC 2100

CATGCCTGAA CCGAGTCTGA AGACCGTACA GAATCACTAA AAGTCGTGAA ACGAATACCT 2160

CTTTGTGCGT CTACCTTGAG CGAGCGAGAG GAGCGGGTCT TTTCGGCGGC AGTGAGCCTC 2220

TGGCACAGGC TCCCCGGCGA CATGGGGCCG TGGAACCAGA GCTTCCAGCG ATGACAGCGA 2280

CTTCTTCACC CTCGAGGACG AGGAGGTCTC TGCCGTTTGT CTCTTCCCTC AGCCACCCTC 2340

ACACTCGCTG GGCTCGATGA GGGTGCAAAG CTTGTCTTCC CCGCTCTTGT GGTCCTGGCG 2400

TCAAGCTCCC AGCACTCACG ACGCCTCCCT CTCGCTCTCC TCCTCTTCAT CGGCTCCTCA 2460

GCAACTCTCG CTCTCCCAGC ATGTGGACGG CTTCCGACCT GTCGCGCACT TTCCGAGCGT 2520

CATTCACGAG GAGCTACTGG CGGTGGGAGA GATCTCTGAT CCGTTTTTGA GGCGTAATGA 2580

GGAGGTACGC TTCCTCGCCC CCACATCTCA ACCGTCGAGG AGGAGGTGGG AGCCAGAACG 2640

AGCTGACTAG CGAGTACGTG TACCGTCGCA GGCCGTGCAA TGGGTCGGCG AAGCAGACTG 2700

GATCTACCGC TGCGACTTCG AGGTCGAGCG GCTGCCGAAG AAGCGCTCGA AAGAGGGCGA 2760

GGGCGAGGAG GAGAGGGCTG ACTTGGTGTT CGAGGGTCTC GATACGTTCG CGACGGTGTA 2820

CTGTGAGTCG AGATCGAGCG GGCAGACGGA TTGATCGCTA ATACGGAAGT GATCTCGCAG 2880

TGAACGGTGA AAGTGAATGG AGGTGGGAAC CGCAAGGTGC ACCATCGACC GATCTGGATT 2940

TTTAATGATG GATTTGAGTA AGAGCACGTA TGTTGGGACC CGAAAGATGG TGAACTATGC 3000

CTGAATAGGG CGAAGCCAGA GGAAACTCTG GTGGAGGCTC GTAGCGGTTC TGACGTGCAA 3060

ATCGATCGTC AAATTTGGGT ATAGGGGCGA AAGACTAATC GAACCATCTA GTAGCTGGTT 3120

CCTGCCGAAG TTTCCCTCAG GATAGCAGAA ACTCACATCA GTTCTATGAG GTAAAGCGAA 3180

TGATTAGAGG CCTTGGGGTT GAAACAACCT TAACCTATTC TCAAACTTTA AATATGTAGG 3240

AAGTCCTTGC TACTTAATTG AGCGAGGACA TGCGAATGAG AGTTTCTAGT GGGCCATTTT 3300

TGGTAAGCAG AACTGGCGAT GCGGGATGAA CCGAACGCGA GGTTAAGGTG CCGGAATACA 3360

CGCTCATCAG ACACCACAAA AGGTGTTAGT TCATCTAGAC AGCCGCACGG TGGCCATGGA 3420

AGTCGGAATC CGCTAAGGAG TGTGTAACAA CTCAACGGCC GAATGAACTA GCCCTGAAAA 3480

TGGATGGCGC TCAAGCGTGT TACCCATACC TCGCCGTCAG 3520

果糖.ST25

SEQUENCE LISTING

<110>中国科学院大连化学物理研究所

<120>果糖-1，6-二磷酸醛缩酶启动子及应用和构建体、载体

<130>

<160>10

<170>PatentIn version 3.1

<210>1

<211>853

<212>DNA

<213>圆红冬孢酵母(Rhodosporidium toruloides)

<220>

<221>promoter

<222>(154)..(853)

<223>

<400>1

gctgacggta ctcgtttcgc agacaacccg ctcgagatga actgccggac aaaggaggac 60

ttttcggctc tcgccgtcgc cctgtccgat tctctgatcc agaagcacgc cggctcgaag 120

ctgttcggca gttttgtcga cgagctcgcc cgcctgctcg ccgcgccgct caagtcggac 180

gaggtgggca aggtgcgcgc gagtatggcc aacctcgcga tggacaagca gaagctcgag 240

aaggctggcg cgaagggcgg cgcagtcggt gggaagcccc ctgcgaggat ggtcgcgagg 300

ggcagggagg acttgtcgtc gttcggagag gtgctcgacg acgatgtcgc cgcggcccag 360

ttcgacgagg acgaggattt cgtgcgtcgc tttcgctcgc tcgctggttg ctcctgtctc 420

ttctgcttct cacgctgact ctcatcgtgc ccgtctcact gcagatgtag atgtagacgc 480

acctcctcca gcttcacctg cttccaacct tttccaccgc ctgcaaccgc actttcgcct 540

cgttccttcg gactcttgcg gctgcgatgt tgtccagcat cgacaggagc tgctttactt 600

tcgcttgacc tgcttgccac ctggtgctcg cacgatgcca tatatcgcga gggaggcgag 660

agagcggagt tggctggatg acgctcgctc cggcttgcag ctggttgtta cggtgttgca 720

agaatttctg tgcagtttgt acgagtggcc ccgcgttgtg gatgatgtcg gttcggttgg 780

cacggccttg ctcgctcgct ctctcgttgc tcctcgctct tcaccacttc acttctaaca 840

ctaactagct aca 853

<210>2

<211>999

<212>DNA

<213>圆红冬孢酵母(Rhodosporidium toruloides)

<220>

<221>terminator

<222>(1)..(999)

<223>

<400>2

gcatttccta cgccatgcct gaaccgagtc tgaagaccgt acagaatcac taaaagtcgt 60

gaaacgaata cctctttgtg cgtctacctt gagcgagcga gaggagcggg tcttttcggc 120

ggcagtgagc ctctggcaca ggctccccgg cgacatgggg ccgtggaacc agagcttcca 180

gcgatgacag cgacttcttc accctcgagg acgaggaggt ctctgccgtt tgtctcttcc 240

ctcagccacc ctcacactcg ctgggctcga tgagggtgca aagcttgtct tccccgctct 300

tgtggtcctg gcgtcaagct cccagcactc acgacgcctc cctctcgctc tcctcctctt 360

catcggctcc tcagcaactc tcgctctccc agcatgtgga cggcttccga cctgtcgcgc 420

actttccgag cgtcattcac gaggagctac tggcggtggg agagatctct gatccgtttt 480

tgaggcgtaa tgaggaggta cgcttcctcg cccccacatc tcaaccgtcg aggaggaggt 540

gggagccaga acgagctgac tagcgagtac gtgtaccgtc gcaggccgtg caatgggtcg 600

gcgaagcaga ctggatctac cgctgcgact tcgaggtcga gcggctgccg aagaagcgct 660

cgaaagaggg cgagggcgag gaggagaggg ctgacttggt gttcgagggt ctcgatacgt 720

tcgcgacggt gtactgtgag tcgagatcga gcgggcagac ggattgatcg ctaatacgga 780

agtgatctcg cagtgaacgg cgacaagatc ctcgaggccg acaacatgtt ccgtgaatgg 840

cggtgagtcg tcgcttgagg cttcacactt cgtatgcacc atgtgagtct gctgcagacg 900

ttgatgtggc agcccgtgga ccatccacag tgtcccgctt cgatgctcgc aactccgcca 960

cggccgcaac ttgctgtaca tcgtctttca ctcagcgtt 999

<210>3

<211>1053

<212>DNA

<213>圆红冬孢酵母(Rhodosporidium toruloides)

<220>

<221>CDS

<222>(1)..(1053)

<223>

<400>3

atg ggt gtc ctc gat gtt gtc ccc gcc ggc gtc ctc acc ggc aag aac 48

Met Gly Val Leu Asp Val Val Pro Ala Gly Val Leu Thr Gly Lys Asn

1 5 10 15

ctc gtc aag ttg atg gac tac gct cgc gag aac cac aac tgc acc tcg 96

Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn His Asn Cys Thr Ser

20 25 30

tcg tcg acc gtc gtc gcc gcc ctc gag gcc gcc cgc gac tcc aag tcg 144

Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala Arg Asp Ser Lys Ser

35 40 45

ccc gtc atc atc cag gtc tcg cag ggt ggt gcc gcc ttc ttc gcc ggg 192

Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala Ala Phe Phe Ala Gly

50 55 60

aag ggt gtc gcc aac gac aag cag cag gct tcc atc gcc ggt gcc gtc 240

Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser Ile Ala Gly Ala Val

65 70 75 80

gcc gcc gcc cac tac gtc cgc tcc atc gct ccc acc tat ggc gtc ccc 288

Ala Ala Ala His Tyr Val Arg Ser Ile Ala Pro Thr Tyr Gly Val Pro

85 90 95

gtc gtg ctg cac agc gac cac tgt gcg aag aag ctc ctc caa tgg ttc 336

Val Val Leu His Ser Asp His Cys Ala Lys Lys Leu Leu Gln Trp Phe

100 105 110

gac ggc atg ctc gag gcc gac gag gct tac tac aag gag aag ggc gag 384

Asp Gly Met Leu Glu Ala Asp Glu Ala Tyr Tyr Lys Glu Lys Gly Glu

115 120 125

cct ctc ttc tct act ttg agc gca tgg cca agg tcg acc tct ggc tcg 432

Pro Leu Phe Ser Thr Leu Ser Ala Trp Pro Arg Ser Thr Ser Gly Ser

130 135 140

aga tgg aga ttg gca tca ccg gtg gtg agg agg acg gtg tcg aca aca 480

Arg Trp Arg Leu Ala Ser Pro Val Val Arg Arg Thr Val Ser Thr Thr

145 150 155 160

ctg gtg agt gcg cgt gcc ttt cga gtg tct att gac gag act gac gat 528

Leu Val Ser Ala Arg Ala Phe Arg Val Ser Ile Asp Glu Thr Asp Asp

165 170 175

cag ggg aca ggc gtc gac aac aac tcg ctc tac acc cag ccc gag gac 576

Gln Gly Thr Gly Val Asp Asn Asn Ser Leu Tyr Thr Gln Pro Glu Asp

180 185 190

atc ctc gac atc cac aac gcc ctc tcc aag atc tcg ccc atg ttc tcg 624

Ile Leu Asp Ile His Asn Ala Leu Ser Lys Ile Ser Pro Met Phe Ser

195 200 205

atc gct gcc ggc ttc ggc aac gtc cac ggc gtc tac aag cct ggc aac 672

Ile Ala Ala Gly Phe Gly Asn Val His Gly Val Tyr Lys Pro Gly Asn

210 215 220

gtc aag ctc cgt ccc gag ctc ctc gag aag cac cag aag tac tgc cac 720

Val Lys Leu Arg Pro Glu Leu Leu Glu Lys His Gln Lys Tyr Cys His

225 230 235 240

gag cag ctc aag tcg aag aac ccc ctc ccc atc tac ctc gtc ttc cac 768

Glu Gln Leu Lys Ser Lys Asn Pro Leu Pro Ile Tyr Leu Val Phe His

245 250 255

ggc ggt tcg gga tcg tcc aag gac gag atc act acc gct gtc aag aac 816

Gly Gly Ser Gly Ser Ser Lys Asp Glu Ile Thr Thr Ala Val Lys Asn

260 265 270

ggt gtc gtc aag atg aac gtc gac acc gac acc cag tgg gca tac atg 864

Gly Val Val Lys Met Asn Val Asp Thr Asp Thr Gln Trp Ala Tyr Met

275 280 285

atc ggc ttc cgc gac tac ttc aag tcc aag gcc gcg tac ctc gag acc 912

Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys Ala Ala Tyr Leu Glu Thr

290 295 300

cag gtc ggt aac ccc gag ggc gcc gac aag ccc aac aag aag cag tac 960

Gln Val Gly Asn Pro Glu Gly Ala Asp Lys Pro Asn Lys Lys Gln Tyr

305 310 315 320

gac ccg cgc gtc tgg gtc cgt gag ggt gag aag acg atg aag gag cgc 1008

Asp Pro Arg Val Trp Val Arg Glu Gly Glu Lys Thr Met Lys Glu Arg

325 330 335

tgc cag gtc gcc ttc aag gac ctc cgc tcc gag gga acc ctc taa 1053

Cys Gln Val Ala Phe Lys Asp Leu Arg Ser Glu Gly Thr Leu

340 345 350

<210>4

<211>350

<212>PRT

<213>圆红冬孢酵母(Rhodosporidium toruloides)

<400>4

Met Gly Val Leu Asp Val Val Pro Ala Gly Val Leu Thr Gly Lys Asn

1 5 10 15

Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn His Asn Cys Thr Ser

20 25 30

Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala Arg Asp Ser Lys Ser

35 40 45

Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala Ala Phe Phe Ala Gly

50 55 60

Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser Ile Ala Gly Ala Val

65 70 75 80

Ala Ala Ala His Tyr Val Arg Ser Ile Ala Pro Thr Tyr Gly Val Pro

85 90 95

Val Val Leu His Ser Asp His Cys Ala Lys Lys Leu Leu Gln Trp Phe

100 105 110

Asp Gly Met Leu Glu Ala Asp Glu Ala Tyr Tyr Lys Glu Lys Gly Glu

115 120 125

Pro Leu Phe Ser Thr Leu Ser Ala Trp Pro Arg Ser Thr Ser Gly Ser

130 135 140

Arg Trp Arg Leu Ala Ser Pro Val Val Arg Arg Thr Val Ser Thr Thr

145 150 155 160

Leu Val Ser Ala Arg Ala Phe Arg Val Ser Ile Asp Glu Thr Asp Asp

165 170 175

Gln Gly Thr Gly Val Asp Asn Asn Ser Leu Tyr Thr Gln Pro Glu Asp

180 185 190

Ile Leu Asp Ile His Asn Ala Leu Ser Lys Ile Ser Pro Met Phe Ser

195 200 205

Ile Ala Ala Gly Phe Gly Asn Val His Gly Val Tyr Lys Pro Gly Asn

210 215 220

Val Lys Leu Arg Pro Glu Leu Leu Glu Lys His Gln Lys Tyr Cys His

225 230 235 240

Glu Gln Leu Lys Ser Lys Asn Pro Leu Pro Ile Tyr Leu Val Phe His

245 250 255

Gly Gly Ser Gly Ser Ser Lys Asp Glu Ile Thr Thr Ala Val Lys Asn

260 265 270

Gly Val Val Lys Met Asn Val Asp Thr Asp Thr Gln Trp Ala Tyr Met

275 280 285

Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys Ala Ala Tyr Leu Glu Thr

290 295 300

Gln Val Gly Asn Pro Glu Gly Ala Asp Lys Pro Asn Lys Lys Gln Tyr

305 310 315 320

Asp Pro Arg Val Trp Val Arg Glu Gly Glu Lys Thr Met Lys Glu Arg

325 330 335

Cys Gln Val Ala Phe Lys Asp Leu Arg Ser Glu Gly Thr Leu

340 345 350

<210>5

<211>1822

<212>DNA

<213>圆红冬孢酵母(Rhodosporidium toruloides)

<220>

<221>exon

<222>(1)..(26)

<223>

<220>

<221>exon

<222>(1735)..(1822)

<223>

<220>

<221>exon

<222>(1546)..(1675)

<223>

<220>

<221>exon

<222>(994)..(1433)

<223>

<220>

<221>exon

<222>(567)..(877)

<223>

<220>

<221>exon

<222>(217)..(274)

<223>

<400>5

atg ggt gtc ctc gat gtt gtc ccc gc gtaagcatca cacgctccca 46

Met Gly Val Leu Asp Val Val Pro Ala

1 5

ctgcagcacc cgcacccgct caccttgctc ccgcaggcgt acgtcccctc cgccccgtca 106

tacccctccc ggcttctctc gagtcgcgct cgcccacaac accgcgcgga cggctgggaa 166

cagaatggca ggatcgggga atagcatgct cacattgagc ga cccgcag c ggc gtc 223

Gly Val

10

ctc acc ggc aag aac ctc gtc aag ttg atg gac tac gct cgc gag aac 271

Leu Thr Gly Lys Asn Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn

15 20 25

cac gtccgtcttc ttccgactcg ctcacgagtg actgtgcgct gacctgcagc 324

His

ctcgcgtttg agacagttcg ccatccctgt gcgttaccag tcctcgcgaa cgggcgccgc 384

gctctcgccg tcgcacgctt gacgtcgcga gggtcggtcg ctgatgagat ggatgagatc 444

aagctgaccc cgccttttcc actccgcttt tctcccttct ccaggccttc gtgagtccct 504

ctcacaccgt ttgacgccgg gagcgagcga cgggctgacc cgggacgttg cgcgcaaacc 564

ag aac tgc acc tcg tcg tcg acc gtc gtc gcc gcc ctc gag gcc gcc 611

Asn Cys Thr Ser Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala

30 35 40

cgc gac tcc aag tcg ccc gtc atc atc cag gtc tcg cag ggt ggt gcc 659

Arg Asp Ser Lys Ser Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala

45 50 55

gcc ttc ttc gcc ggg aag ggt gtc gcc aac gac aag cag cag gct tcc 707

Ala Phe Phe Ala Gly Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser

60 65 70 75

atc gcc ggt gcc gtc gcc gcc gcc cac tac gtc cgc tcc atc gct ccc 755

Ile Ala Gly Ala Val Ala Ala Ala His Tyr Val Arg Ser Ile Ala Pro

80 85 90

acc tat ggc gtc ccc gtc gtg ctg cac agc gac cac tgt gcg aag aag 803

Thr Tyr Gly Val Pro Val Val Leu His Ser Asp His Cys Ala Lys Lys

95 100 105

ctc ctc caa tgg ttc gac ggc atg ctc gag gcc gac gag gct tac tac 851

Leu Leu Gln Trp Phe Asp Gly Met Leu Glu Ala Asp Glu Ala Tyr Tyr

110 115 120

aag gag aag ggc gag cct ctc ttc tc gtaaagacgc gcttcctctt 897

Lys Glu Lys Gly Glu Pro Leu Phe Ser

125 130

cctcgccttg gactgggcta acgggcatat cacaggtcgc acatgctcga cctttcggag 957

gagtcaaagg aggagaacat cgagacttgc gtcaag t act ttg agc gca tgg cca 1012

Thr Leu Ser Ala Trp Pro

135

agg tcg acc tct ggc tcg aga tgg aga ttg gca tca ccg gtg gtg agg 1060

Arg Ser Thr Ser Gly Ser Arg Trp Arg Leu Ala Ser Pro Val Val Arg

140 145 150

agg acg gtg tcg aca aca ctg gtg agt gcg cgt gcc ttt cga gtg tct 1108

Arg Thr Val Ser Thr Thr Leu Val Ser Ala Arg Ala Phe Arg Val Ser

155 160 165 170

att gac gag act gac gat cag ggg aca ggc gtc gac aac aac tcg ctc 1156

Ile Asp Glu Thr Asp Asp Gln Gly Thr Gly Val Asp Asn Asn Ser Leu

175 180 185

tac acc cag ccc gag gac atc ctc gac atc cac aac gcc ctc tcc aag 1204

Tyr Thr Gln Pro Glu Asp Ile Leu Asp Ile His Asn Ala Leu Ser Lys

190 195 200

atc tcg ccc atg ttc tcg atc gct gcc ggc ttc ggc aac gtc cac ggc 1252

Ile Ser Pro Met Phe Ser Ile Ala Ala Gly Phe Gly Asn Val His Gly

205 210 215

gtc tac aag cct ggc aac gtc aag ctc cgt ccc gag ctc ctc gag aag 1300

Val Tyr Lys Pro Gly Asn Val Lys Leu Arg Pro Glu Leu Leu Glu Lys

220 225 230

cac cag aag tac tgc cac gag cag ctc aag tcg aag aac ccc ctc ccc 1348

His Gln Lys Tyr Cys His Glu Gln Leu Lys Ser Lys Asn Pro Leu Pro

235 240 245 250

atc tac ctc gtc ttc cac ggc ggt tcg gga tcg tcc aag gac gag atc 1396

Ile Tyr Leu Val Phe His Gly Gly Ser Gly Ser Ser Lys Asp Glu Ile

255 260 265

act acc gct gtc aag aac ggt gtc gtc aag atg aac g gtgcgcgacg 1443

Thr Thr Ala Val Lys Asn Gly Val Val Lys Met Asn

270 275

acttttcgcg gacttgcgac tcccgagtgc tgacttggct tctgccttct ccgctttttc 1503

acttggcttc tgccttctcc gcttctcttc ttgtccctac ag tc gac acc gac 1556

Val Asp Thr Asp

280

acc cag tgg gca tac atg atc ggc ttc cgc gac tac ttc aag tcc aag 1604

Thr Gln Trp Ala Tyr Met Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys

285 290 295

gcc gcg tac ctc gag acc cag gtc ggt aac ccc gag ggc gcc gac aag 1652

Ala Ala Tyr Leu Glu Thr Gln Val Gly Asn Pro Glu Gly Ala Asp Lys

300 305 310

ccc aac aag aag cag tac gac cc gtaagtcgat accctcttct cttctcgccc 1705

Pro Asn Lys Lys Gln Tyr Asp Pro

315 320

ggcctctgac gagactcttt gttgtccag g cgc gtc tgg gtc cgt gag ggt gag 1759

Arg Val Trp Val Arg Glu Gly Glu

325 330

aag acg atg aag gag cgc tgc cag gtc gcc ttc aag gac ctc cgc tcc 1807

Lys Thr Met Lys Glu Arg Cys Gln Val Ala Phe Lys Asp Leu Arg Ser

335 340 345

gag gga acc ctc taa 1822

Glu Gly Thr Leu

350

<210>6

<211>3674

<212>DNA

<213>圆红冬孢酵母(Rhodosporidium toruloides)

<220>

<221>promoter

<222>(154)..(853)

<223>

<220>

<221>terminator

<222>(2676)..(3674)

<223>

<400>6

gctgacggta ctcgtttcgc agacaacccg ctcgagatga actgccggac aaaggaggac 60

ttttcggctc tcgccgtcgc cctgtccgat tctctgatcc agaagcacgc cggctcgaag 120

ctgttcggca gttttgtcga cgagctcgcc cgcctgctcg ccgcgccgct caagtcggac 180

gaggtgggca aggtgcgcgc gagtatggcc aacctcgcga tggacaagca gaagctcgag 240

aaggctggcg cgaagggcgg cgcagtcggt gggaagcccc ctgcgaggat ggtcgcgagg 300

ggcagggagg acttgtcgtc gttcggagag gtgctcgacg acgatgtcgc cgcggcccag 360

ttcgacgagg acgaggattt cgtgcgtcgc tttcgctcgc tcgctggttg ctcctgtctc 420

ttctgcttct cacgctgact ctcatcgtgc ccgtctcact gcagatgtag atgtagacgc 480

acctcctcca gcttcacctg cttccaacct tttccaccgc ctgcaaccgc actttcgcct 540

cgttccttcg gactcttgcg gctgcgatgt tgtccagcat cgacaggagc tgctttactt 600

tcgcttgacc tgcttgccac ctggtgctcg cacgatgcca tatatcgcga gggaggcgag 660

agagcggagt tggctggatg acgctcgctc cggcttgcag ctggttgtta cggtgttgca 720

agaatttctg tgcagtttgt acgagtggcc ccgcgttgtg gatgatgtcg gttcggttgg 780

cacggccttg ctcgctcgct ctctcgttgc tcctcgctct tcaccacttc acttctaaca 840

ctaactagct acaatgggtg tcctcgatgt tgtccccgcg taagcatcac acgctcccac 900

tgcagcaccc gcacccgctc accttgctcc cgcaggcgta cgtcccctcc gccccgtcat 960

acccctcccg gcttctctcg agtcgcgctc gcccacaaca ccgcgcggac ggctgggaac 1020

agaatggcag gatcggggaa tagcatgctc acattgagcg aacccgcagc ggcgtcctca 1080

ccggcaagaa cctcgtcaag ttgatggact acgctcgcga gaaccacgtc cgtcttcttc 1140

cgactcgctc acgagtgact gtgcgctgac ctgcagcctc gcgtttgaga cagttcgcca 1200

tccctgtgcg ttaccagtcc tcgcgaacgg gcgccgcgct ctcgccgtcg cacgcttgac 1260

gtcgcgaggg tcggtcgctg atgagatgga tgagatcaag ctgaccccgc cttttccact 1320

ccgcttttct cccttctcca ggccttcgtg agtccctctc acaccgtttg acgccgggag 1380

cgagcgacgg gctgacccgg gacgttgcgc gcaaaccaga actgcacctc gtcgtcgacc 1440

gtcgtcgccg ccctcgaggc cgcccgcgac tccaagtcgc ccgtcatcat ccaggtctcg 1500

cagggtggtg ccgccttctt cgccgggaag ggtgtcgcca acgacaagca gcaggcttcc 1560

atcgccggtg ccgtcgccgc cgcccactac gtccgctcca tcgctcccac ctatggcgtc 1620

cccgtcgtgc tgcacagcga ccactgtgcg aagaagctcc tccaatggtt cgacggcatg 1680

ctcgaggccg acgaggctta ctacaaggag aagggcgagc ctctcttctc gtaaagacgc 1740

gcttcctctt cctcgccttg gactgggcta acgggcatat cacaggtcgc acatgctcga 1800

cctttcggag gagtcaaagg aggagaacat cgagacttgc gtcaagtact ttgagcgcat 1860

ggccaaggtc gacctctggc tcgagatgga gattggcatc accggtggtg aggaggacgg 1920

tgtcgacaac actggtgagt gcgcgtgcct ttcgagtgtc tattgacgag actgacgatc 1980

aggggacagg cgtcgacaac aactcgctct acacccagcc cgaggacatc ctcgacatcc 2040

acaacgccct ctccaagatc tcgcccatgt tctcgatcgc tgccggcttc ggcaacgtcc 2100

acggcgtcta caagcctggc aacgtcaagc tccgtcccga gctcctcgag aagcaccaga 2160

agtactgcca cgagcagctc aagtcgaaga accccctccc catctacctc gtcttccacg 2220

gcggttcggg atcgtccaag gacgagatca ctaccgctgt caagaacggt gtcgtcaaga 2280

tgaacggtgc gcgacgactt ttcgcggact tgcgactccc gagtgctgac ttggcttctg 2340

ccttctccgc tttttcactt ggcttctgcc ttctccgctt ctcttcttgt ccctacagtc 2400

gacaccgaca cccagtgggc atacatgatc ggcttccgcg actacttcaa gtccaaggcc 2460

gcgtacctcg agacccaggt cggtaacccc gagggcgccg acaagcccaa caagaagcag 2520

tacgacccgt aagtcgatac cctcttctct tctcgcccgg cctctgacga gactctttgt 2580

tgtccaggcg cgtctgggtc cgtgagggtg agaagacgat gaaggagcgc tgccaggtcg 2640

ccttcaagga cctccgctcc gagggaaccc tctaagcatt tcctacgcca tgcctgaacc 2700

gagtctgaag accgtacaga atcactaaaa gtcgtgaaac gaatacctct ttgtgcgtct 2760

accttgagcg agcgagagga gcgggtcttt tcggcggcag tgagcctctg gcacaggctc 2820

cccggcgaca tggggccgtg gaaccagagc ttccagcgat gacagcgact tcttcaccct 2880

cgaggacgag gaggtctctg ccgtttgtct cttccctcag ccaccctcac actcgctggg 2940

ctcgatgagg gtgcaaagct tgtcttcccc gctcttgtgg tcctggcgtc aagctcccag 3000

cactcacgac gcctccctct cgctctcctc ctcttcatcg gctcctcagc aactctcgct 3060

ctcccagcat gtggacggct tccgacctgt cgcgcacttt ccgagcgtca ttcacgagga 3120

gctactggcg gtgggagaga tctctgatcc gtttttgagg cgtaatgagg aggtacgctt 3180

cctcgccccc acatctcaac cgtcgaggag gaggtgggag ccagaacgag ctgactagcg 3240

agtacgtgta ccgtcgcagg ccgtgcaatg ggtcggcgaa gcagactgga tctaccgctg 3300

cgacttcgag gtcgagcggc tgccgaagaa gcgctcgaaa gagggcgagg gcgaggagga 3360

gagggctgac ttggtgttcg agggtctcga tacgttcgcg acggtgtact gtgagtcgag 3420

atcgagcggg cagacggatt gatcgctaat acggaagtga tctcgcagtg aacggcgaca 3480

agatcctcga ggccgacaac atgttccgtg aatggcggtg agtcgtcgct tgaggcttca 3540

cacttcgtat gcaccatgtg agtctgctgc agacgttgat gtggcagccc gtggaccatc 3600

cacagtgtcc cgcttcgatg ctcgcaactc cgccacggcc gcaacttgct gtacatcgtc 3660

tttcactcag cgtt 3674

<210>7

<211>717

<212>DNA

<213>人工序列

<220>

<221>gene

<222>(1)..(717)

<223>

<400>7

atgagtaaag gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt 60

gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga 120

aaacttaccc ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt 180

gtcactactt tctcttatgg tgttcaatgc ttttcccgtt atccggatca tatgaaacgg 240

catgactttt tcaagagtgc catgcccgaa ggttatgtac aggaacgcac tatatctttc 300

aaagatgacg ggaactacaa gacgcgtgct gaagtcaagt ttgaaggtga tacccttgtt 360

aatcgtatcg agttaaaagg tattgatttt aaagaagatg gaaacattct cggacacaaa 420

ctcgagtaca actataactc acacaatgta tacatcacgg cagacaaaca aaagaatgga 480

atcaaagcta acttcaaaat tcgccacaac attgaagatg gatccgttca actagcagac 540

cattatcaac aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac 600

ctgtcgacac aatctgccct ttcgaaagat cccaacgaaa agcgtgacca catggtcctt 660

cttgagtttg taactgctgc tgggattaca catggcatgg atgagctcta caaataa 717

<210>8

<211>2569

<212>DNA

<213>人工序列

<220>

<221>promoter

<222>(154)..(853)

<223>

<220>

<221>terminator

<222>(1571)..(2569)

<223>

<400>8

gctgacggta ctcgtttcgc agacaacccg ctcgagatga actgccggac aaaggaggac 60

ttttcggctc tcgccgtcgc cctgtccgat tctctgatcc agaagcacgc cggctcgaag 120

ctgttcggca attttgtcga cgagctcgcc cgcctgctcg ccgcgccgct caagtcggac 180

gaggtgggca aggtgcgcgc gagtatggcc aacctcgcga tggacaagca gaagctcgag 240

aaggctggcg cgaagggcgg cgcagtcggt gggaagcccc ctgcgaggat ggtcgcgagg 300

ggcagggagg acttgtcgtc gttcggagag gtgctcgacg acgatgtcgc cgcggcccag 360

ttcgacgagg acgaggattt cgtgcgtcgc tttcgctcgc tcgctggttg ctcctgtctc 420

ttctgcttct cacgctgact ctcatcgtgc ccgtctcact gcagatgtag atgtagacgc 480

acctcctcca gcttcacctg cttccaacct tttccaccgc ctgcaaccgc actttcgcct 540

cgttccttcg gactcttgcg gctgcgatgt tgtccagcat cgacaggagc tgctttactt 600

tcgcttgacc tgcttgccac ctggtgctcg cacgatgcca tatatcgcga gggaggcgag 660

agagcggagt tggctggatg acgctcgctc cggcttgcag ctggttgtta cggtgttgca 720

agaatttctg tgcagtttgt acgagtggcc ccgcgttgtg gatgatgtcg gttcggttgg 780

cacggccttg ctcgctcgct ctctcgttgc tcctcgctct tcaccacttc acttctaaca 840

ctaactagct acaatgagta aaggagaaga acttttcact ggagttgtcc caattcttgt 900

tgaattagat ggtgatgtta atgggcacaa attttctgtc agtggagagg gtgaaggtga 960

tgcaacatac ggaaaactta cccttaaatt tatttgcact actggaaaac tacctgttcc 1020

atggccaaca cttgtcacta ctttctctta tggtgttcaa tgcttttccc gttatccgga 1080

tcatatgaaa cggcatgact ttttcaagag tgccatgccc gaaggttatg tacaggaacg 1140

cactatatct ttcaaagatg acgggaacta caagacgcgt gctgaagtca agtttgaagg 1200

tgataccctt gttaatcgta tcgagttaaa aggtattgat tttaaagaag atggaaacat 1260

tctcggacac aaactcgagt acaactataa ctcacacaat gtatacatca cggcagacaa 1320

acaaaagaat ggaatcaaag ctaacttcaa aattcgccac aacattgaag atggatccgt 1380

tcaactagca gaccattatc aacaaaatac tccaattggc gatggccctg tccttttacc 1440

agacaaccat tacctgtcga cacaatctgc cctttcgaaa gatcccaacg aaaagcgtga 1500

ccacatggtc cttcttgagt ttgtaactgc tgctgggatt acacatggca tggatgagct 1560

ctacaaatga gcatttccta cgccatgcct gaaccgagtc tgaagaccgt acagaatcac 1620

taaaagtcgt gaaacgaata cctctttgtg cgtctacctt gagcgagcga gaggagcggg 1680

tcttttcggc ggcagtgagc ctctggcaca ggctccccgg cgacatgggg ccgtggaacc 1740

agagcttcca gcgatgacag cgacttcttc accctcgagg acgaggaggt ctctgccgtt 1800

tgtctcttcc ctcagccacc ctcacactcg ctgggctcga tgagggtgca aagcttgtct 1860

tccccgctct tgtggtcctg gcgtcaagct cccagcactc acgacgcctc cctctcgctc 1920

tcctcctctt catcggctcc tcagcaactc tcgctctccc agcatgtgga cggcttccga 1980

cctgtcgcgc actttccgag cgtcattcac gaggagctac tggcggtggg agagatctct 2040

gatccgtttt tgaggcgtaa tgaggaggta cgcttcctcg cccccacatc tcaaccgtcg 2100

aggaggaggt gggagccaga acgagctgac tagcgagtac gtgtaccgtc gcaggccgtg 2160

caatgggtcg gcgaagcaga ctggatctac cgctgcgact tcgaggtcga gcggctgccg 2220

aagaagcgct cgaaagaggg cgagggcgag gaggagaggg ctgacttggt gttcgagggt 2280

ctcgatacgt tcgcgacggt gtactgtgag tcgagatcga gcgggcagac ggattgatcg 2340

ctaatacgga agtgatctcg cagtgaacgg cgacaagatc ctcgaggccg acaacatgtt 2400

ccgtgaatgg cggtgagtcg tcgcttgagg cttcacactt cgtatgcacc atgtgagtct 2460

gctgcagacg ttgatgtggc agcccgtgga ccatccacag tgtcccgctt cgatgctcgc 2520

aactccgcca cggccgcaac ttgctgtaca tcgtctttca ctcagcgtt 2569

<210>9

<211>1265

<212>DNA

<213>圆红冬孢酵母(Rhodosporidium toruloides)

<220>

<221>gene

<222>(1)..(1265)

<223>

<400>9

aaggattccc ctagtagcgg cgagcgaagc gggaagagct caaatttata atctggcacc 60

ttcggtgtcc gagttgtaat ctctagaaat gttttccgcg ttggaccgca cacaagtctg 120

ttggaataca gcggcatagt ggtgagaccc ccgtatatgg tgcggacgcc cagcgctttg 180

tgatacattt tcgaagagtc gagttgtttg ggaatgcagc tcaaattggg tggtaaattc 240

catctaaagc taaatattgg cgagagaccg atagcgaaca agtaccgtga gggaaagatg 300

aaaagcactt tggaaagaga gttaacagta cgtgaaattg ttggaaggga aacgcttgaa 360

gtcagacttg cttgccgagc aatcggtttg caggccagca tcagttttcc gggatggata 420

atggtagaga gaaggtagca gtttcggctg tgttatagct ctctgctgga tacatcttgg 480

gggactgagg aacgcagtgt gcctttggcg ggggtttcga cctcttcaca cttaggatgc 540

tggtggaatg gctttaaacg acccgtcttg aaacacggac caaggagtct aacatgcttg 600

cgagtatttg ggtgtcaaac ccggatgcgt aatgaaagtg aatggaggtg ggaaccgcaa 660

ggtgcaccat cgaccgatct ggatttttaa tgatggattt gagtaagagc acgtatgttg 720

ggacccgaaa gatggtgaac tatgcctgaa tagggcgaag ccagaggaaa ctctggtgga 780

ggctcgtagc ggttctgacg tgcaaatcga tcgtcaaatt tgggtatagg ggcgaaagac 840

taatcgaacc atctagtagc tggttcctgc cgaagtttcc ctcaggatag cagaaactca 900

catcagttct atgaggtaaa gcgaatgatt agaggccttg gggttgaaac aaccttaacc 960

tattctcaaa ctttaaatat gtaggaagtc cttgctactt aattgagcga ggacatgcga 1020

atgagagttt ctagtgggcc atttttggta agcagaactg gcgatgcggg atgaaccgaa 1080

cgcgaggtta aggtgccgga atacacgctc atcagacacc acaaaaggtg ttagttcatc 1140

tagacagccg cacggtggcc atggaagtcg gaatccgcta aggagtgtgt aacaactcaa 1200

cggccgaatg aactagccct gaaaatggat ggcgctcaag cgtgttaccc atacctcgcc 1260

gtcag 1265

<210>10

<211>3520

<212>DNA

<213>人工序列

<220>

<221>promoter

<222>(671)..(1370)

<223>

<400>10

aaggattccc ctagtagcgg cgagcgaagc gggaagagct caaatttata atctggcacc 60

ttcggtgtcc gagttgtaat ctctagaaat gttttccgcg ttggaccgca cacaagtctg 120

ttggaataca gcggcatagt ggtgagaccc ccgtatatgg tgcggacgcc cagcgctttg 180

tgatacattt tcgaagagtc gagttgtttg ggaatgcagc tcaaattggg tggtaaattc 240

catctaaagc taaatattgg cgagagaccg atagcgaaca agtaccgtga gggaaagatg 300

aaaagcactt tggaaagaga gttaacagta cgtgaaattg ttggaaggga aacgcttgaa 360

gtcagacttg cttgccgagc aatcggtttg caggccagca tcagttttcc gggatggata 420

atggtagaga gaaggtagca gtttcggctg tgttatagct ctctgctgga tacatcttgg 480

gggactgagg aacgcagtgt gcctttggcg ggggtttcga cctcttcaca cttaggatgc 540

tggtggaatg gcgatgaact gccggacaaa ggaggacttt tcggctctcg ccgtcgccct 600

gtccgattct ctgatccaga agcacgccgg ctcgaagctg ttcggcaatt ttgtcgacga 660

gctcgcccgc ctgctcgccg cgccgctcaa gtcggacgag gtgggcaagg tgcgcgcgag 720

tatggccaac ctcgcgatgg acaagcagaa gctcgagaag gctggcgcga agggcggcgc 780

agtcggtggg aagccccctg cgaggatggt cgcgaggggc agggaggact tgtcgtcgtt 840

cggagaggtg ctcgacgacg atgtcgccgc ggcccagttc gacgaggacg aggatttcgt 900

gcgtcgcttt cgctcgctcg ctggttgctc ctgtctcttc tgcttctcac gctgactctc 960

atcgtgcccg tctcactgca gatgtagatg tagacgcacc tcctccagct tcacctgctt 1020

ccaacctttt ccaccgcctg caaccgcact ttcgcctcgt tccttcggac tcttgcggct 1080

gcgatgttgt ccagcatcga caggagctgc tttactttcg cttgacctgc ttgccacctg 1140

gtgctcgcac gatgccatat atcgcgaggg aggcgagaga gcggagttgg ctggatgacg 1200

ctcgctccgg cttgcagctg gttgttacgg tgttgcaaga atttctgtgc agtttgtacg 1260

agtggccccg cgttgtggat gatgtcggtt cggttggcac ggccttgctc gctcgctctc 1320

tcgttgctcc tcgctcttca ccacttcact tctaacacta actagctaca atgagtaaag 1380

gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt gatgttaatg 1440

ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga aaacttaccc 1500

ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt gtcactactt 1560

tctcttatgg tgttcaatgc ttttcccgtt atccggatca tatgaaacgg catgactttt 1620

tcaagagtgc catgcccgaa ggttatgtac aggaacgcac tatatctttc aaagatgacg 1680

ggaactacaa gacgcgtgct gaagtcaagt ttgaaggtga tacccttgtt aatcgtatcg 1740

agttaaaagg tattgatttt aaagaagatg gaaacattct cggacacaaa ctcgagtaca 1800

actataactc acacaatgta tacatcacgg cagacaaaca aaagaatgga atcaaagcta 1860

acttcaaaat tcgccacaac attgaagatg gatccgttca actagcagac cattatcaac 1920

aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac ctgtcgacac 1980

aatctgccct ttcgaaagat cccaacgaaa agcgtgacca catggtcctt cttgagtttg 2040

taactgctgc tgggattaca catggcatgg atgagctcta caaatgagca tttcctacgc 2100

catgcctgaa ccgagtctga agaccgtaca gaatcactaa aagtcgtgaa acgaatacct 2160

ctttgtgcgt ctaccttgag cgagcgagag gagcgggtct tttcggcggc agtgagcctc 2220

tggcacaggc tccccggcga catggggccg tggaaccaga gcttccagcg atgacagcga 2280

cttcttcacc ctcgaggacg aggaggtctc tgccgtttgt ctcttccctc agccaccctc 2340

acactcgctg ggctcgatga gggtgcaaag cttgtcttcc ccgctcttgt ggtcctggcg 2400

tcaagctccc agcactcacg acgcctccct ctcgctctcc tcctcttcat cggctcctca 2460

gcaactctcg ctctcccagc atgtggacgg cttccgacct gtcgcgcact ttccgagcgt 2520

cattcacgag gagctactgg cggtgggaga gatctctgat ccgtttttga ggcgtaatga 2580

ggaggtacgc ttcctcgccc ccacatctca accgtcgagg aggaggtggg agccagaacg 2640

agctgactag cgagtacgtg taccgtcgca ggccgtgcaa tgggtcggcg aagcagactg 2700

gatctaccgc tgcgacttcg aggtcgagcg gctgccgaag aagcgctcga aagagggcga 2760

gggcgaggag gagagggctg acttggtgtt cgagggtctc gatacgttcg cgacggtgta 2820

ctgtgagtcg agatcgagcg ggcagacgga ttgatcgcta atacggaagt gatctcgcag 2880

tgaacggtga aagtgaatgg aggtgggaac cgcaaggtgc accatcgacc gatctggatt 2940

tttaatgatg gatttgagta agagcacgta tgttgggacc cgaaagatgg tgaactatgc 3000

ctgaataggg cgaagccaga ggaaactctg gtggaggctc gtagcggttc tgacgtgcaa 3060

atcgatcgtc aaatttgggt ataggggcga aagactaatc gaaccatcta gtagctggtt 3120

cctgccgaag tttccctcag gatagcagaa actcacatca gttctatgag gtaaagcgaa 3180

tgattagagg ccttggggtt gaaacaacct taacctattc tcaaacttta aatatgtagg 3240

aagtccttgc tacttaattg agcgaggaca tgcgaatgag agtttctagt gggccatttt 3300

tggtaagcag aactggcgat gcgggatgaa ccgaacgcga ggttaaggtg ccggaataca 3360

cgctcatcag acaccacaaa aggtgttagt tcatctagac agccgcacgg tggccatgga 3420

agtcggaatc cgctaaggag tgtgtaacaa ctcaacggcc gaatgaacta gccctgaaaa 3480

tggatggcgc tcaagcgtgt tacccatacc tcgccgtcag 3520

Claims

1.果糖-6-二磷酸醛缩酶启动子，简写为pRtFBA，其核苷酸序列具有如SEQ ID NO：1所示DNA序列的全部序列或包含该DNA序列自3’-末端起700bp以内的部分序列，或具有可与如SEQ ID NO：1所示序列的全部或其DNA序列3’-末端起700bp以内的部分序列杂交的、且保持转录启动子活性的序列，或对SEQ ID NO：1所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的，与SEQ ID NO：1所示序列具有50％以上同源性、且具有启动子活性的序列。

2.一种权利要求1所述果糖-1，6-二磷酸醛缩酶启动子pRtFBA的应用，其特征在于：SEQ ID NO：1所示的脱氧核苷酸序列可作为启动子用于构建新型酵母遗传操作系统及新的重组工程菌株，所得到的基因工程菌株携带相应的pRtFBA序列。

3.按照权利要求2所述果糖-1，6-二磷酸醛缩酶启动子pRtFBA的应用，其特征在于：所述基因工程菌株为红冬孢酵母属(Rhodosporidium)基因工程菌株，所述新型酵母遗传操作系统为圆红冬孢酵母遗传操作系统。

4.一种DNA构建体，含有权利要求1所述SEQ ID NO：1所示的脱氧核苷酸序列，或同时含有权利要求1所述SEQ ID NO：1所示的脱氧核苷酸序列和如SEQ ID NO：2所示的脱氧核苷酸序列，且SEQ ID NO：1所示序列位于SEQ ID NO：2所示序列的上游，SEQ ID NO：1和SEQ ID NO：2之间为一编码基因的开放阅读框架。

5.按照权利要求4构建体，其特征在于：所述的SEQ ID NO：2所示序列为一种果糖-1，6-二磷酸醛缩酶终止子RtFBAt。

6.按照权利要求4构建体，其特征在于：所述开放阅读框架为位于SEQID NO：1和SEQ ID NO：2之间的果糖-1，6-二磷酸醛缩酶基因的开放阅读框架，其cDNA序列具有如SEQ ID NO：3所示的脱氧核苷酸序列，其基因组DNA具有SEQ ID NO：5所示的脱氧核苷酸序列。

7.一种携带权利要求1启动子pRtFBA或权利要求4构建体的载体。

8.按照权利要求7载体，其特征在于：所述载体为质粒载体。

9.一种果糖-1，6-二磷酸醛缩酶蛋白，其具有如SEQ ID NO：4所示氨基酸序列。