CN102268430A - 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体 - Google Patents

果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体 Download PDF

Info

Publication number
CN102268430A
CN102268430A CN 201010189723 CN201010189723A CN102268430A CN 102268430 A CN102268430 A CN 102268430A CN 201010189723 CN201010189723 CN 201010189723 CN 201010189723 A CN201010189723 A CN 201010189723A CN 102268430 A CN102268430 A CN 102268430A
Authority
CN
China
Prior art keywords
seq
sequence
dna
val
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010189723
Other languages
English (en)
Other versions
CN102268430B (zh
Inventor
张素芳
赵宗保
朱志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Institute of Chemical Physics of CAS
Original Assignee
Dalian Institute of Chemical Physics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Institute of Chemical Physics of CAS filed Critical Dalian Institute of Chemical Physics of CAS
Priority to CN 201010189723 priority Critical patent/CN102268430B/zh
Publication of CN102268430A publication Critical patent/CN102268430A/zh
Application granted granted Critical
Publication of CN102268430B publication Critical patent/CN102268430B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

通过扩增圆红冬孢酵母果糖-1,6-二磷酸醛缩酶基因组DNA上下游序列,进行生物学信息分析和功能验证,获得可有效表达目的基因于圆红冬孢酵母,并因此能够用于圆红冬孢酵母遗传工程操作和菌株改良的启动子和终止子。本发明还涉及包含这些元件的DNA构建体和载体。

Description

果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体
技术领域
本专利属于基因工程技术领域,具体涉及圆红冬孢酵母启动子、终止子及其用途,包括基因工程菌株构建所必需的转化方法等。 
背景技术
微生物是自然界中分布最广泛的物种之一,具有卓越的生物合成能力,几乎能合成地球上所有的有机化学品。微生物的种属多样性和遗传多样性决定了其代谢多样性。与多细胞生物相比,微生物的代谢途径虽然相对简单,但其化合物的生产高效、快捷,并与人类日常生产生活关系密切。 
做为某一化学品的天然生产菌株或环境治理应用菌株,其特定的生产性能往往并非最优化。如何优化或改变工业菌株的代谢网络和表达调控网络,以提高生物基产品的积累速度或定向控制靶产品的质量,是当今生物技术领域研究的热点和难点。实际上,对微生物油脂代谢过程的理解、开发和利用是否能达到或者超过化学加工水平,也是提高发酵过程经济性的关键。全基因组测序和基因工程技术的进步,为菌株生理学特性的认识和菌株改良提供了比传统诱变技术更为合理的方法。 
代谢工程的实质是利用重组DNA技术和其它技术,有目的地改变已有的代谢和表达调控网络,更好地理解和利用细胞的代谢途径。代谢工程可以在细胞与分子水平上认识和改造细胞过程,其不仅可以解释细胞生理生化特性,而且还可赋于出发菌株新的性状和表型:(1)扩大底物利用范围;(2)生产原来不存在的新化合物;(3)增强对环境中毒害物质的降解能力;(4)提高菌体对环境的适应能力;(5)阻断或降低副产品的生成;(6)代谢产品生产速率和生产性能的提高等(Bailey J E.Toward a science ofmetabolic engineering.Science.1991,252(5013):1668-1675;Aristidou A, 
Figure BSA00000125084200011
M.Metabolic engineering applications to renewable resource utilization.Curr.Opin.Biotechnol.2000,11(2):187-198)。 
圆红冬孢酵母属于担子菌门异宗配合型真菌,是发酵工业中一种极为重要的微生物,可利用源于生物质的己糖和戊糖为原料生产重要的生物基产品:微生物油脂,胞内油脂可达细胞干重的60%以上(Ratledge C,WynnJ P.The biochemistry and molecular biology of lipid accumulation in oleaginousmicroorganisms.Adv.Appl.Microbiol.2002,51:1-51;Li Y,Zhao Z,Bai F.High-density cultivation of oleaginous yeast Rhodosporidium toruloides Y4infed-batch culture.Enzyme Microb.Technol.2007,41(3):312-317);工业用酶或药物合成用酶如磷酸二酯酶、苯丙氨酸解氨酶(Hodgins D S.Yeastphenylalanine ammonia-lyase.Purification,properties,and the identification ofcatalytically essential dehydroalanine.J Biol.Chem.1971,246(9):2977-2985; Gilbert H J,Clarke I N,Gibson R K,et al.Molecular cloning of the phenylalanineammonia lyase gene from Rhodosporidium toruloides in Escherichia coli K-12.JBacteriol.1985,161(1):314-320)、D氨基酸氧化酶(Gadda G,Negri A,PiloneM S.Reaction of phenylglyoxal with arginine groups in D-amino-acid oxidasefrom Rhodotorula gracilis.J Biol.Chem.1994,269(27):17809-17814;Liao G J,Lee Y J,Lee Y H,et al.Structure and expression of the D-amino-acid oxidasegene from the yeast Rhodosporidium toruloides.Biotechnol.Appl.Biochem.1998,27(Pt 1):55-61)等;β-胡萝卜素和胞外多糖;并在污水处理和生物制药中有较广泛的应用。实验结果表明,该菌可同时利用五碳糖和六碳糖为底物,抗逆性好,能直接以玉米秸秆酸水解液为碳源积累油脂,可实现生物质到生物基产品的高效转化(李永红,刘波,孙艳,等.广谱碳源产油酵母菌的筛选.中国生物工程杂志,2005,25(12):39-44)。 
虽然圆红冬孢酵母具有优良的工业生产性能,同时,圆红冬孢酵母来源的蛋白酶异源表达也获得成功(Pollegioni L,Molla G,Campaner S,Cloning,sequencing and expression in E.coli of a D-amino acid oxidase cDNA fromRhodotorula gracilis active on cephalosporin C.J Biotechnol.1997,58(2):115-123;Faulkner J D,Anson J G,Tuite M F,et al.High-level expression ofthephenylalanine ammonia lyase-encoding gene from Rhodosporidium toruloidesin Saccharomyces cerevisiae and Escherichia coli using a bifunctionalexpression system.Gene.1994,143(1):13-20),但圆红冬孢酵母自身缺乏相应的遗传操作系统。以圆红冬孢酵母为宿主菌,无论是基因工程操作还是代谢工程菌株改良,都受到遗传操作系统的制约,难以进行靶向性的菌株改造。 
启动子对于遗传操作系统来说必不可少。因此,如果要对圆红冬孢酵母进行遗传操作,获得能在圆红冬孢酵母中起作用的启动子是该工作的关键环节。 
发明内容
鉴于上述现有技术瓶颈,本发明的主要目的是提供可用于在圆红冬孢酵母中有效表达外源基因,并且可通过遗传工程技术进行圆红冬孢酵母菌种改良的启动子和终止子。 
为实现本发明的目的,本发明人对圆红冬孢酵母中的基因表达情况进行了深入研究,发现圆红冬孢酵母中FBA为一个组成型表达基因,其启动子为中强启动子。通过实验设计,结合简并PCR、染色体步移等方法,从圆红冬孢酵母染色体DNA中成功获得了包含有效启动子的DNA片段,由此完成了本发明。 
具体讲,本发明包含下述实施方案(A)到(H) 
(A)本发明涉及一种具有圆红冬孢酵母转录启动子活性的DNA片段,所述DNA片段具有如SEQ ID NO:1所示DNA序列的全部序列或包含该DNA序列自3’-末端起700bp以内的部分序列,或具有可与如SEQ ID NO:1 所示序列的全部或其DNA序列3’-末端起700bp以内的部分序列杂交的、且保持转录启动子活性的序列,或对SEQ ID NO:1所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的,与SEQ ID NO:1所示序列具有50%以上同源性、且具有启动子活性的序列。 
(B)本发明涉及一种来自圆红冬孢酵母的DNA片段,所述DNA片段具有如下特征:(1)如SEQ ID NO:2所示的DNA序列的全部或包含该DNA序列5’-末端的部分序列;(2)或具有可与如(1)所示序列杂交的、且保持如(1)所述序列活性的序列。 
(C)本发明涉及一种可完成靶基因在圆红冬孢酵母中转录起始和转录终止的DNA分子,它同时具有如(A)所述序列和如(B)所述序列,且如(B)所述序列位于如(A)所述序列的下游,与其相邻1-10000个核苷酸的DNA片段。 
(D)本发明涉及一种可将靶基因与(A)-(C)所述的任一种DNA分子连接的DNA构建体,以便于靶基因能够在圆红冬孢酵母中表达的重组DNA。所述靶基因为蛋白编码核酸或反义核酸编码核酸。 
(E)本发明涉及一种携带(A)-(D)所述的的DNA分子中的任意一个的载体。所述载体可以是质粒载体或粘粒载体。 
(F)本发明涉及转入了如(D)所述的DNA分子或如(E)所述载体的圆红冬孢酵母或红冬孢酵母属(Rhodosporidium)真菌。 
(G)本发明所涉及的的pRtFBA启动子,其来源于圆红冬孢酵母,可启动目的基因在圆红冬孢酵母中的转录和表达;本发明所述的RtFBAt终止子,其来源于圆红冬孢酵母,可终止目的基因在圆红冬孢酵母中的转录。 
(H)本发明涉及编码具有果糖-1,6-二磷酸醛缩酶活性的多肽的DNA片段,其具有如SEQ ID NO:5所示序列的全部或部分核苷酸序列,编码如SEQ ID NO:4所示的蛋白质序列。 
使用本发明的具有启动子活性的DNA分子和具有转录终止子活性的DNA,可实现外源基因或内源基因在圆红冬孢酵母中的表达,本发明提供了用于遗传工程圆红冬孢酵母改造的启动子、终止子和载体。为圆红冬孢酵母开启了一条育种新途径,并因此可以提供具有工业用途的新型圆红冬孢酵母。 
附图说明
图1表示RtFBA简并PCR产物的琼脂糖凝胶电泳的结果。 
图2表示pRtFBA启动子DNA片段的琼脂糖凝胶电泳的结果。 
图3表示RtFBAt终止子DNA片段的琼脂糖凝胶电泳的结果。 
图4表示RtFBA基因的琼脂糖凝胶电泳的结果。 
图5表示GFPuv在圆红冬孢酵母单倍体菌株ATCC 10788中的表达结果。 
图6是质粒pFBAGFP的结构图。 
图7是GFPuv在R.babjevae ATCC90942中的表达结果。 
图8是圆红冬孢酵母果糖-1,6-二磷酸醛缩酶的晶体结构模型,其表明三维结构正确。 
下面结合具体实施例对本发明作进一步详细说明。 
具体实施方式
在本文中,“启动子”是指能够被RNA聚合酶识别、结合并能启动基因转录的DNA序列。术语“启动子”还可理解为:包括5’非编码区、顺式作用元件(如增强子)以及其它能与转录因子结合的核苷酸序列。 
启动子的存在或强度通常是通过启动子活性表示,其测定方法:将报告基因(如绿色荧光蛋白)连接于所述启动子的下游,并将该DNA构建体转化相应宿主细胞,检测报告基因表达量。如果人们观察到连接于所述启动子下游报告基因的表达,就可以认为所述启动子在它所转化的宿主细胞内有活性。 
在本文中,“终止子”是指染色体上提供终止信号使RNA聚合酶与DNA模板分离而使转录终止的一段DNA序列。可以通过诸如Northern杂交或RT-PCR的方法检查所转录RNA的大小而确认终止子的存在。或通过“启动子-报告基因-终止子”构建体使报告基因有效表达而确定终止子的活性。 
本发明中的“圆红冬孢酵母”,包括属于该“物种”的任何二倍体和单倍体,野生型菌株和营养缺陷型菌株。本发明中的“红冬孢酵母属真菌”,没有具体限制,其例子包括归属于该属的真菌,除圆红冬孢酵母外,如Rhodosporidium azoricum,Rhodosporidium babjevae,Rhodosporidiumsphaerocarpum。 
本发明的“目的基因”,包括能够在圆红冬孢酵母中表达的蛋白编码序列,反义RNA编码序列和核酸酶编码序列。能够在圆红冬孢酵母中表达的蛋白编码序列的例子包括源于圆红冬孢酵母的核酸序列,且并不局限于此。本发明的目的基因还包括来源于其它微生物、植物和动物的蛋白编码序列。 
本发明中的启动子具有如SEQ ID NO:1所示DNA序列的全部序列或包含该DNA序列自3’-末端起700bp以内的部分序列,或具有可与如SEQ IDNO:1所示序列的全部或其DNA序列3’-末端起700bp以内的部分序列杂交的、且保持转录启动子活性的序列,或对SEQ ID NO:1所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的,与SEQ IDNO:1所示序列具有50%以上同源性、且具有启动子活性的序列。 
本发明中的终止子具有如SEQ ID NO:2所示的DNA序列的全部或包含该DNA序列5’-末端的部分序列,或具有可与如SEQ ID NO:2所示序列的全部或其DNA序列5’-末端的部分序列杂交的、且保持转录终止子活性的序列,或对SEQ ID NO:2所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的,与SEQ ID NO:2所示序列具有50%以上同源性、且具有终止子活性的序列。 
本发明中的启动子-目的基因的构建体、目的基因-终止子的构建体或启动子-目的基因-终止子的构建体,可以直接或经载体介导转化圆红冬孢酵母,以便于目的基因表达,可以优选质粒载体作为介导载体。 
本发明的启动子可以按照以下方面从圆红冬孢酵母中分离。 
下面结合附图及实施例对本发明作进一步说明,将有助于本领域的普通技术人员理解本发明,但不以任何形式限制本发明。下述实施例中所有引物合成及测序工作,如无特别说明则均由大连TakaRa公司完成。 
实施例1:圆红冬孢酵母ATCC 10788总RNA的提取 
将新鲜圆红冬孢酵母R.toruloides ATCC 10788(购自美国标准生物品收藏中心,ATCC)由斜面接种到50ml YEPD液体培养基中,于30℃摇床培养24h,再以1∶50的体积比例将菌液分别转接到100ml YEPD液体培养基中,于30℃摇床培养12h达对数生长期。在4℃下,5000rpm离心4min,收集菌体,用液氮迅速冷冻菌体,研磨破壁。使用TakaRa公司RNAiso试剂盒,并按照其标准步骤提取总RNA。 
RNA进行1.5%琼脂糖凝胶电泳,使用荧光-紫外分析仪观察鉴定,可见清晰的两条带。用紫外/可见光光谱仪分析总RNA样品,测得OD260/OD280=2.01,表明总RNA质量很好。总RNA样品冻存于-80℃,备用。 
实施例2:圆红冬孢酵母ATCC 10788cDNA第一链合成和FBA简并PCR 
以圆红冬孢酵母R.toruloides ATCC 10788总RNA为模板,反转录合成cDNA第一链。首先,将1.0μl总RNA(约2μg),1.0μl引物SMART IV:5′-AAGCAGTGGTATCAACGCAGAGTGGCCATTACGGCCGGG-3′和1.0μloligo dT-接头引物CDS III/3′:5′-ATTCTAGAGGCCGAGGCGGCCGACATG-d(T)30N-1N-3′,2.0μl DEPC处理水(焦碳酸二乙酯处理水,购自大连TakaRa公司),加入到PCR管中混匀,于72℃保温2min,立即置于冰上冷却2min,将2.0μl 5×first strandbuffer(Clontech公司),1.0μl DTT(20mM),1.0μl dNTP(10mM),1.0μlpowerscript reverse transcriptase(Clontech公司)加入到体系中,混匀。于42℃延伸反应60min,最后4℃结束反应,存于-20℃,备用。 
设计合成两条简并引物FBA-sense:5′-ATGGG(AGCT)GT(AGCT)(CT)T(AGCT)GA(CT)GT(ACT)GTCCC  -3′和FBA-anti:5′-TTA(AGCT)A(AG)(AGCT)GT(AG)CCCTCGGA-3′,以反转录合成的cDNA第一链为模板,进行FBA基因的简并PCR扩增,10×PCR缓冲液5.0μl,dNTPs(10mM)1.0μl,FBA-sense引物(50mmol/l)1.0μl,FBA-anti引物(50mmol/l)1.0ul,rTaq酶(大连TakaRa)0.5μl,合成的cDNA第一链模板1.0μl,ddH2O 40.5μl,于94℃保温3min,然后于94℃30s,57℃45s,72℃1min,35个循环,72℃10min,4℃结束反应。扩增产物进行1%(质量/体积 浓度)琼脂糖凝胶电泳,观察到1kb左右的条带(图1),利用DNA回收试剂盒(购自碧云天),按照供应商建议步骤纯化PCR产物。PCR产物参照大连TakaRa公司提供的方法克隆到pMD18-T载体(购自大连TakaRa),转化入E.coli DH5α感受态细胞,其中感受态细胞按氯化钙法(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序,序列结果推测出的氨基酸序列经Blastp分析,证实为果糖-1,6-二磷酸醛缩酶序列,如SEQ ID NO:4序列所示。果糖-1,6-二磷酸醛缩酶cDNA序列如SEQ ID NO:3序列所示。 
实施例3:RtFBA基因组DNA的扩增 
1 R.toruloides ATCC 10788(购自美国标准生物品收藏中心,ATCC)的基因组DNA提取采用玻璃珠破壁法(精编分子生物学实验指南第三版第13章,奥斯伯等著,颜子颖等译,科学出版社出版)。制备好的基因组DNA,利用Nanodrop 1000测定,测得OD260/OD280=1.85,表明基因组DNA质量很好。浓度为120ng/μl,共500μl,基因组DNA样品冻存于-20℃,备用。 
2根据实施例2中获得的果糖-1,6-二磷酸醛缩酶cDNA序列,设计1对基因特异性引物,FBA-ORF-p1:5’-ATGGGTGTCCTCGATGTTGTCCC-3’和FBA-ORF-p2:5’-TTAGAGGGTTCCCTCGGAGCGGAGG-3’,以圆红冬孢酵母ATCC10788的基因组DNA为模板,按照常规方法进行PCR扩增,得到约1.8kb的PCR产物(图略)。PCR扩增产物按照实施例2的操作步骤回收、克隆到pMD18-T载体,并进行测序,得到如序列表SEQ ID NO:5所示的DNA序列。经与实施例2中获得的果糖-1,6-二磷酸醛缩酶cDNA序列比对,证实该基因片段为其果糖-1,6-二磷酸醛缩酶基因组DNA序列,含5个内含子和6个外显子。 
实施例4:染色体步移获得RtFBA基因5’翼侧序列(启动子) 
本实施例利用Genome Walking Kit(购自大连TakaRa)完成。 
根据实施例3中得到的FBADNA序列,设计3条Specific Primer(基因特异性引物)分别为FBA-SP1:5’-GCGAGGACTGGTAACGCACAGGGAT-3’,FBA-SP2:5’-CGCTGCGGGTTCGCTCAATGT-3’和FBA-SP3:5’-GCCTGCGGGAGCAAGGTGAGC-3’,做为下游引物,按照试剂盒说明书进行以下操作。 
11stPCR反应 
以实施例3中精制的基因组DNA为模板,进行第一轮扩增。反应体系50μl:10×LA PCR buffer II(Mg2+plus,大连TakaRa)5.0μl,dNTPs(2.5mmol/l)8.0μl,LA Taq DNA聚合酶(5U/μl,大连TakaRa)1.0μl,AP1 Primer(100μmol/l,大连TakaRa)1.0μl,FBA-SP1(10μmol/l)1.0μl,R.toruloides ATCC 10788基因组DNA模板(120ng/μl)1.0μl,ddH2O加至50μl。反应条件:先进行5个高温退火温度的高特异性反应,然后进行1个极低退火温度的低特异性反应;然后进行热不对称PCR:2个高退火温度(65℃)的高特异性反应和1个低退火温度(44℃)的低特异性反应交替循环,共15次。具体参数如下:94℃1min,98℃1min;94℃30s,65℃1min,72℃2min,共5个循环;94℃30s,25℃3min,72℃2min;94℃30s,65℃1min,72℃2min,94℃30s,65℃1min,72℃2min,94℃30s,44℃1min,72℃2min,共15个循环;72℃10min,结束反应。 
22nd巢式PCR反应 
反应体系50μl:10×LA PCR buffer II(Mg2+plus,大连TakaRa)5.0μl,dNTPs(2.5mmol/l)8.0μl,LA Taq DNA聚合酶(5U/μl,大连TakaRa)1.0μl,AP1 Primer(100μmol/l,大连TakaRa)1.0μl,1st PCR反应产物1.0μl,FBA-SP2(10μmol/l)1.0μl,ddH2O加至50μl。反应条件:94℃30s,65℃1min,72℃2min,94℃30s,65℃1min,72℃2min,94℃30s,44℃1min,72℃2min,共15个循环;72℃10min,结束反应。 
33rd巢式PCR反应 
反应体系50μl:10×LA PCR buffer II(Mg2+plus,大连TakaRa)5.0μl,dNTPs(2.5mmol/l)8.0μl,LA Taq DNA聚合酶(5U/μl,大连TakaRa)1.0μl,AP1 Primer(100μmol/l,大连TakaRa)1.0μl,2nd巢式PCR反应产物1.0μl,FBA-SP3(10μmol/l)1.0μl,ddH2O加至50μl。反应条件:94℃30s,65℃1min,72℃2min,94℃30s,65℃1min,72℃2min,94℃30s,44℃1min,72℃2min,共15个循环;72℃10min,结束反应。 
3rd巢式PCR反应产物经1%(质量/体积浓度)琼脂糖凝胶电泳后切割目的条带,利用DNA片段凝胶纯化试剂盒(购自碧云天)进行纯化。纯化后的DNA片段经TA克隆插入pMD18-T载体(购自大连TakaRa公司),转化DH5α感受态细胞;其中感受态细胞按氯化钙法(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序,得到如SEQ ID NO:1所示的DNA序列,证实为预期的pRtFBA基因序列。 
序列号:1(SEQ ID NO:1) 
序列长度:853bp 
序列类型:DNA 
来源:圆红冬孢酵母(Rhodosporidium toruloides) 
1   GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC 
61  TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG 
121 CTGTTCGGCA GTTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC 
181 GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG 
241 AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG 
301 GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG 
361 TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC 
421 TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC 
481 ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT 
541 CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT 
601 TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG 
661 AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA 
721 AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG 
781 CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA 
841 CTAACTAGCT ACA 
实施例5:染色体步移获得RtFBA基因3’翼侧序列(终止子) 
本实施例也是利用Genome Walking Kit(购自大连TakaRa)完成。 
根据实施例3中得到的FBADNA序列,设计3条Specific Primer(基因特异性引物)分别为FBA-SP11:5’-GTGTCGTCAAGATGAACGGTGCG-3’,FBA-SP22:5’-CGCCGACAAGCCCAACAAGAAGC-3’和FBA-SP33:5’-CGCGTCTGGGTCCGTGAGGGTG-3’,做为上游引物,按照试剂盒说明书进行3’翼侧染色体步移操作,除Specific Primer分别由FBA-SP1,FBA-SP2,FBA-SP3依次更换为FBA-SP11,FBA-SP22,FBA-SP33外,其它同实施例4。 
3rd巢式PCR反应产物利用DNA片段凝胶纯化试剂盒(购自碧云天)进行纯化,经TA克隆插入pMD18-T载体(购自大连TakaRa公司),转化DH5α感受态细胞;其中感受态细胞按氯化钙法(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序,得到如SEQ ID NO:2所示的DNA序列,证实为预期的RtFBAt基因序列。 
实施例6:RtFBA启动子-开放阅读框架-终止子全长基因获得 
根据实施例4和实施例5中获得的启动子和终止子序列,重新设计一对引物进行RtFBA“启动子-开放阅读框架-终止子”全长基因的扩增。pRtFBAt-p1:5’-GCTGACGGTACTCGTTTCGCAGAC-3’,pRtFBAt-p2:5’-TCGGTCCCCAATCCCAGCCATAGT-3’。以实施例1中制备的R.toruloides基因组DNA为模板进行PCR扩增。PCR体系(50μl):10×Speed buffer(大连TakaRa)5.0μl,dNTPs(10mmol/l)1.0μl,上游引物RtFBA-p1(10μmol/l)2.0μl,下游引物RtFBA-p2(10μmol/l)2.0μl,SpeedSTARTMHS DNA聚合酶(扩增速度快,1kb/10s,购自大连TakaRa公司)0.5μl,基因组DNA模板(120ng/μl)2μl,ddH2O加至50μl。反应条件:98℃1min,98℃10s,65℃1.0min,35个循环,72℃10min,4℃结束反应。PCR产物经1%(质量/体积浓度)琼脂糖凝胶电泳分析后利用PCR片段纯化试剂盒(购自碧云天)进行纯化。片段经TA克隆插入pMD18-T载体(购自大连TakaRa公司),转化DH5α感受态细胞;其中感受态细胞按氯化钙法(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序,得到如SEQ ID NO:6所示的DNA序列,证实为预期的 pRtFBAt全长序列,该重组载体命名为T-FBA 3.7k。 
实施例7:FBAgfp圆红冬孢酵母特异性绿色荧光蛋白表达盒的构建 
1.绿色荧光蛋白编码基因GFPuv的获得 
以pGFPuv质粒(购自BD Biosciences)为模板,利用寡核苷酸gfp-p1:5’-ATGAGTAAAGGAGAAGAACT-3′和gfp-p2:5’-TCATTTGTAGAGCTCAT CCAT-3’为引物,进行PCR扩增。体系(50μl):5×Prime buffer(大连TakaRa)10.0μl,dNTPs(2.5mmol/l)4.0μl,上游引物gfp-p1(10μmol/l)2.0μl,下游引物gfp-p2(10μmol/l)2.0μl,PrimeSTARTM HS DNA聚合酶(大连TakaRa)1.0μl,pGFPuv质粒(120ng/μl)1μl,ddH2O加至50μl。反应条件:95℃3min,98℃8s,49℃15s,72℃1min,35个循环,72℃10min,4℃结束反应。PCR反应产物利用DNA片段胶回收纯化试剂盒纯化,利用taq DNA聚合酶进行DNA片段3’末端加A,体系(50μl):10×PCR buffer(大连TakaRa)5.0μl,dNTPs(2.5mmol/l)4.0μl,纯化后的GFPuv DNA片段30μl,ddH2O加至50μl。反应条件:72℃30min,4℃结束反应。3’末端加A后的GFPuv DNA片段利用DNA片段胶回收纯化试剂盒纯化,克隆入pMD18-T载体,送大连TakaRa公司测序,得到如SEQ ID NO:7所示的DNA序列,证实为预期的GFPuv基因序列。 
2.RF克隆法构建圆红冬孢酵母特异性绿色荧光蛋白表达盒FBAgfp 
圆红冬孢酵母特异性绿色荧光蛋白表达盒FBAgfp的构建利用的是RF克隆(Van den Ent,F.,Lowe,J.,2006.RF cloning:A restriction-free method forinserting target genes into plasmids.J.Biochem.Biophys.Methods 67:67-74;Yang F,Zhang S,Tang W,Zhao Z,2008.Identification of theorotidine-5′-monophosphate decarboxylase gene of the oleaginous yeastRhodosporidium toruloides.Yeast 25(9):623-630)的方法。 
FBA全长序列扩增和克隆见实施例6。 
参照文献方法(Van den Ent,F.,Lowe,J.,2006.RF cloning:Arestriction-free method for inserting target genes into plasmids.J.Biochem.Biophys.Methods 67:67-74),设计RF克隆引物:FBA-gfp-p1:5′-CTTCTAACACTAACTAGCT ACAatgagtaaaggagaagaact-3′和FBA-gfp-p1:5′-GCGAGAAGAGAAGAG GGTATCGACtcatttgtagagctcatccat-3′(其中大写字母部分序列与pRtFBAt克隆载体中原有的FBA ORF翼侧序列互补,小写字母部分序列与绿色荧光蛋白GFPuv ORF互补)。 
RF I反应体系及流程:以本实施例操作项1中构建的GFPuv的TA克隆载体为模板,利用FBAgfp-p1和FBAgfp-p2为引物,进行RF第一轮扩增。体系(50μl):5×Prime buffer(大连TakaRa)10.0μl,dNTPs(2.5mmol/l)4.0μl,上游引物(10μmol/l)2.0μl,下游引物(10μmol/l)2.0μl,PrimeSTARTM HS DNA聚合酶(大连TakaRa)1.0μl,T-GFPuv质粒(100 ng/μl)1μl,ddH2O加至50μl。反应条件:95℃3min,98℃8s,49℃15s,72℃1min,35个循环,72℃10min,4℃结束反应。RF I反应产物利用DNA片段胶回收纯化试剂盒纯化,-20℃保存备用。 
RF II反应:5×Prime buffer(大连TakaRa)10.0μl,dNTPs(2.5mmol/l)4.0μl,实施例5中构建的T-FBA 3.7k质粒(100ng/μl)1.0μl,本实施例前述步骤中RF I反应产物(100ng/μl)5.0μl,PrimeSTARTM HS DNA聚合酶(大连TakaRa)1.0μl,ddH2O加至50μl。反应条件:95℃3min,68℃12min,之后95℃30s,65℃45s(-1℃/cyc),68℃12min,15个循环,接下来再进行一轮:95℃30s,55℃45s,68℃12min,20个循环,72℃10min,4℃结束反应。 
DpnI消化和电击转化:取8μl RF II反应产物加入1μl DpnI(购自NewEngland Biolabs)和1μl DpnI buffer,混匀后在37℃作用120min去除原T-FBA 3.7k质粒后,分别取2μl电击转化DH5α感受态细胞,感受态细胞按标准方法制备(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版),电击转化参数:2200-2500V,400Ω,25μF,0℃,4-8ms。挑选Amp抗性转化子进行增菌培养、质粒提取,并利用RF I反应所用引物FBAgfp-p1和FBAgfp-p2进行菌落PCR鉴定,鉴定阳性的重组载体送大连TakaRa进行测序,得到5’端和3’端分别为FBA启动子和FBA终止子的FBAgfp表达盒,同时,该重组载体命名为T-FBAgfp。完整的FBAgfp表达盒如SEQ ID NO:8所示。 
实施例8:FBAgfp表达盒的功能验证 
也即pRtFBA启动子和RtFBAt终止子的活性测定。 
在此利用26SrDNA基因做为靶基因,利用FBAgfp表达盒进行26SrDNA-FBAgfp基因表达盒的构建,表达盒5’和3’末端分别携带有500bp的同源重组臂。PCR扩增制备的大量26SrDNA-FBAgfp基因表达盒线性DNA片段,经电击转化圆红冬孢酵母,观察荧光蛋白的表达。 
1.Rt26SrDNA基因的获得 
参考GenBank序列信息(NCBI NO:DQ832198),设计1对引物进行圆红冬孢酵母核糖体大亚基26SrDNA编码基因的钓取。上游引物Rt26S-p1:5’-AAGGATTCCCCTAGTAGCGGCGAGC-3’,下游引物Rt26S-p2:5’-CTGACGGCGAGGTATGGGTAACACG-3’。 
以实施例3中制备的R.toruloides基因组DNA为模板,利用基因特异性引物Rt26S-p1和Rt26S-p2进行PCR扩增。PCR体系(50μl):10×Speedbuffer(大连TakaRa)5.0μl,dNTPs(10mmol/l)1.0μl,上游引物(10μmol/l)2.0μl,下游引物(10μmol/l)2.0μl,SpeedSTARTM HS DNA聚合酶(扩增速度快,1kb/10s,购自大连TakaRa公司)0.5μl,基因组DNA模板(120ng/μl)2μl,ddH2O加至50μl。反应条件:98℃1min,98℃10s,65℃45s,35个循环,72℃10min,4℃结束反应。 
PCR产物经1%(质量/体积浓度)琼脂糖凝胶电泳分析后利用PCR片段纯化试剂盒(购自碧云天)进行纯化。纯化后的pRtFBADNA片段经TA克隆插入pMD18-T载体(购自大连TakaRa公司),转化DH5α感受态细胞;其中感受态细胞按氯化钙法(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序,得到如SEQ IDNO:9所示的DNA序列,证实为预期的Rt26SrDNA基因序列。 
2.Rt26SrDNA-FBAgfp基因表达盒的构建 
Rt26SrDNA-FBAgfp基因表达盒的构建也是采用RF克隆(Van den Ent,F.,Lowe,J.,2006.RF cloning:A restriction-free method for inserting targetgenes into plasmids.J.Biochem.Biophys.Methods 67:67-74)的方法。 
参照文献方法(Van den Ent,F.,Lowe,J.,2006.RF cloning:Arestriction-free method for inserting target genes into plasmids.J.Biochem.Biophys.Methods 67:67-74),设计RF克隆引物:Rt26SrDNA-FBAgfp-p1:5′-ACTTAGGATGCTGGTGGAATGGCgatgaactgccggacaaaggag-3′和Rt26SrDNA-FBAgfp-p2:5′-GTTCCCACCTCCATTCACTTTCAccgttcactgcgagatcacttcc-3′(其中大写字母部分序列与pRt26SrDNA克隆载体中原有的26SrDNA序列5’末端和3’末端互补,小写字母部分序列与绿色荧光蛋白GFPuv ORF互补)。 
RF I反应体系及流程:以实施例7中FBAgfp的TA克隆载体为模板,利用FBAgfp-p1和FBAgfp-p2为引物,进行RF第一轮扩增。体系(50μl):5×Prime buffer(大连TakaRa)10.0μl,dNTPs(2.5mmol/l)4.0μl,上游引物(10μmol/l)2.0μl,下游引物(10μmol/l)2.0μl,PrimeSTARTMHS DNA聚合酶(大连TakaRa)1.0μl,pFBAgfp质粒(源自实施例7,100ng/μl)1μl,ddH2O加至50μl。反应条件:95℃3min,98℃8s,49℃15s,72℃1min,35个循环,72℃10min,4℃结束反应。RF I反应产物利用DNA片段胶回收纯化试剂盒纯化,-20℃保存备用。 
RF II反应:5×Prime buffer(大连TakaRa)10.0μl,dNTPs(2.5mmol/l)4.0μl,实施例5中构建的T-Rt26SrDNA质粒(100ng/μl)1.0μl,本实施例前述步骤中RF I反应产物(100ng/μl)5.0μl,PrimeSTARTM HS DNA聚合酶(大连TakaRa)1.0μl,ddH2O加至50μl。反应条件:95℃3min,68℃12min,之后95℃30s,65℃45s(-1℃/cyc),68℃12min,15个循环,接下来再进行一轮:95℃30s,55℃45s,68℃12min,20个循环,72℃10min,4℃结束反应。 
DpnI消化和电击转化:取8μl RF II反应产物加入1μl DpnI(购自NewEngland Biolabs)和1μl DpnI buffer混匀后在37℃作用120min去除原T-Rt26SrDNA质粒后,分别取2μl电击转化DH5α感受态细胞,感受态细胞按标准方法制备(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等 译,科学出版社出版),电击转化参数:2200-2500V,400Ω,25μF,0℃,4-8ms。挑选Amp抗性转化子进行增菌培养、质粒提取,并利用RF I反应所用引物Rt26SrDNA-p1和Rt26SrDNA-p2进行菌落PCR鉴定,鉴定阳性的重组载体送大连TakaRa进行测序,得到5’端和3’端分别为Rt26SrDNA 5’末端和3’末端的Rt26SrDNA-FBAgfp敲除盒,同时,该重组载体命名为T-Rt26SrDNA-FBAgfp。GFPuv ORF序列如SEQ ID NO:7所示;完整的Rt26SrDNA-FBAgfp表达盒(或敲除盒)如SEQ ID NO:10所示。 
3.Rt26SrDNA-FBAgfp表达盒的制备 
以构建的T-Rt26SrDNA-FBAgfp载体为模板,以寡核苷酸序列Rt26S-p1和Rt26S-p2为引物,进行Rt26SrDNA-FBAgfp表达盒的大量制备。PCR体系(500μl):10×Speed buffer(大连TakaRa)50.0μl,dNTPs(10mmol/l)10.0μl,上游引物(10μmol/l)20.0μl,下游引物(10μmol/l)20.0μl,SpeedSTARTM HS DNA聚合酶(扩增速度快,1kb/10s,购自大连TakaRa公司)5.0μl,基因组DNA模板(120ng/μl)15.0μl,ddH2O加至500μl。反应条件:98℃1min,98℃10s,65℃60s,35个循环,72℃10min,4℃结束反应。 
PCR产物经1%(质量/体积浓度)琼脂糖凝胶电泳分析后利用PCR片段纯化试剂盒(购自碧云天)进行纯化。纯化后的DNA片段浓度在300ng/μl,共50μl,-20℃保存备用。 
4.单倍体圆红冬孢酵母ATCC 10788感受态细胞制备 
R.toruloides np11感受态细胞的制备:R.toruloides ATCC 10788(购自美国标准生物品收藏中心ATCC)菌株挑菌落接种10ml YEPD培养基(葡萄糖20.0g/l,酵母提取物10.0g/l,蛋白胨20.0g/l,pH 6.0),30℃,200rpm,培养20h;培养物1∶50比例转接新鲜YEPD培养基,100ml(500ml锥形瓶,装液量100ml),30℃,200rpm,培养6-9h,OD值达到0.6-1.2;培养物冰浴10-30min,4℃,4000rpm离心5min,弃上清;0℃无菌Milli-Q水洗1次;0℃1mol/l山梨醇洗涤2次;冰浴,备用。 
5.圆红冬孢酵母ATCC 10788的电击转化 
Rt26SrDNA-FBAgfp表达盒的电击转化:取100μl R.toruloides ATCC10788感受态细胞,加入Rt26SrDNA-FBAgfp表达盒10μl(总共3μg),混匀后移入预冷至0℃的电击杯中,参数:电压0.8-2.0千伏,电阻200Ω,电容25μF,时间4-10ms;电击后立即加入1ml YEPD,30℃温育1-2h;涂布YEPD平板,10μl/平板,30℃培养28-36h;逐一挑单克隆利用荧光显微镜进行镜检,阳性重组子的荧光相片如图5所示。 
6.转化子的鉴定 
阳性重组子接种10ml YEPD培养基(葡萄糖20.0g/l,酵母提取物10.0g/l,蛋白胨20.0g/l,pH 6.0),30℃,200rpm,培养24h;分别取2ml培养物,8000rpm离心5min,弃上清;菌体重悬于2ml 0℃ Milli-Q水,4 ℃,4000rpm,4min,弃上清;重复3次;菌体重悬于200μl破菌缓冲液(2%Triton X-100,1%SDS,100mmol/l NaCl,10mmol/l Tris-Cl,pH8.0,1mmol/lEDTA),200μl Tris饱和酚∶氯仿∶异戊醇(25∶24∶1),冰浴5min;于涡旋振荡器(美国Vortex-Genie 2涡旋振荡器,购自基因公司)最大涡旋度振荡lmin,冰浴1min,间隔进行,重复约10次,直至显微镜镜检破菌率达到90%以上;加入200μl TE缓冲液,混匀;13000rpm,12min,上清移入洁净1.5ml离心管,加入2倍体积无水乙醇,颠倒混匀,13000rpm,10min;弃上清,DNA沉淀用75%乙醇洗涤2次,室温晾干,TER缓冲液(含1μg/mlRNAse A的TE缓冲液)溶解,制成模板基因组DNA,-20℃保存备用。 
以新制备的上述基因组DNA为模板,进行重组子的PCR鉴定,所用引物Rt26S-p1和Rt26S-p2。PCR体系(25μl):10×Speed buffer(大连TakaRa)2.5μl,dNTPs(10mmol/l)0.5μl,上游引物(10μmol/l)1.0μl,下游引物(10μmol/l)1.0μl,SpeedSTARTM HS DNA聚合酶(扩增速度快,1kb/10s,购自大连TakaRa公司)0.25μl,基因组DNA模板(100ng/μl)1.0μl,ddH2O加至50μl。反应条件:98℃1min,98℃10s,65℃60s,35个循环,72℃10min,4℃结束反应。结果显示,重组圆红冬孢酵母的PCR扩增产物将为3.8kb左右和1.2kb左右的两条带,野生型圆红冬孢酵母的PCR扩增产物将为1.2kb左右的一条带(图略)。 
实施例9:FBAgfp表达盒在R.babjevae的功能验证 
序列比对分析发现,R.toruloides 26SrDNA和R.babjevae 26SrDNA之间的序列同源性为94%,所以,利用实施例8中构建的Rt26SrDNA-FBAgfp表达盒直接转化R.babjevae,通过荧光观察便可验证Rt26SrDNA-FBAgfp表达盒在R.babjevae中的有效性,也即pRtFBA启动子和RtFBAt终止子的属内活性测定。 
1.R.babjevae ATCC90942感受态细胞制备 
R.babjevae ATCC90942购自购自美国标准生物品收藏中心。首先,挑菌落接种10ml YEPD培养基,28℃,200rpm,培养24h;培养物1∶50比例转接新鲜YEPD培养基,100ml(500ml锥形瓶,装液量100ml),28℃,200rpm,培养7-10h,OD值达到0.6-1.2;培养物冰浴10-30min,4℃,4000rpm离心5min,弃上清;0℃无菌Milli-Q水洗1次;0℃1mol/l山梨醇洗涤2次;冰浴,备用。 
2.R.babjevae ATCC90942的电击转化 
取100μl R.babjevae ATCC90942感受态细胞,加入实施例8中制备的Rt26SrDNA-FBAgfp表达盒10μl(总共3μg),电击参数和电击后操作同实施例8;逐一挑单克隆利用荧光显微镜进行镜检,阳性重组子的荧光相片如图7所示。 
3.转化子的鉴定 
荧光重组子接种10ml YEPD培养基,28℃,200rpm,培养24h;分 别取2ml培养物,8000rpm离心5min,弃上清;基因组DNA的制备同实施例8中的操作项6,基因组DNA于-20℃保存备用。 
利用引物Rt26S-p1和Rt26S-p2(详见实施例8)进行重组子的PCR鉴定。PCR体系(25μl)和扩增条件同实施例8。结果显示,重组圆红冬孢酵母的PCR扩增产物将为3.8kb左右和1.2kb左右的两条带,野生型圆红冬孢酵母的PCR扩增产物将为1.2kb左右的一条带(图略)。 
以上实施例证明:RtFBA启动子能够启动GFPuv在R.toruloides ATCC10788和R.babjevae ATCC90942中的荧光表达;以FBAgfp表达盒为基础构建的Rt26SrDNA-FBAgfp敲除盒,能够敲除红冬孢酵母属酵母基因组上的Rt26SrDNA靶基因的部分拷贝。 
使用本发明的启动子和终止子,可实现目的基因在圆红冬孢酵母中的表达或特定靶基因(如26S rDNA)的敲除,为圆红冬孢酵母开启了一条育种新途径,并因此可以提供具有工业用途的新型圆红冬孢酵母。并为红冬孢酵母属的其它酵母菌的遗传操作提供了方法和平台。 
实施例10:圆红冬孢酵母果糖-1,6-二磷酸醛缩酶RtFBA的结构表征 
参考分子克隆实验指南第三版(萨姆布鲁克著,黄培堂等译,科学出版社出版)经分子排阻、离子交换纯化得到圆红冬孢酵母果糖-1,6-二磷酸醛缩酶RtFBA。纯化后的RtFBA晶体的生长通过室温下的悬滴法获得。经条件优化后参数如下:RtFBA蛋白溶液12mg/ml(含20mM的磷酸甘油氧肟酸(phosphoglycolo-hydroxamate,PGH),预先冰浴30min)和等体积的生晶母液(0.1M Tris-HCl(pH 8.8),0.2M Mgcl2,18-23%(w/v)聚乙二醇2000)混合,4-8周内出现正交晶体。用多波长反常散射法(MAD)确定位相,MAD数据在ADSC Quantum-4R CCD探测器上收集,所有数据用DPS软件包进行统一,用CCP4软件包进行坐标修正与处理。模型用XtalView 4.0软件在Silicon Graphics OCTANE上构建和校正,用REFMAC程序进行精化。圆红冬孢酵母果糖-1,6-二磷酸醛缩酶RtFBA晶体属于空间群C2221,晶格常数为 
Figure BSA00000125084200141
根据衍射数据得到三维结构模型见图8。 
本发明的有益效果是: 
为圆红冬孢酵母或红冬孢酵母属的酵母菌提供了启动子、终止子、GFP表达盒和遗传转化方法,将有力促进今后的圆红冬孢酵母或红冬孢酵母属酵母菌的菌株改良研究,加快圆红冬孢酵母代谢工程研究。 
SEQ ID NO:1 
GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC    60 
TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG    120 
CTGTTCGGCA GTTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC    180 
GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG    240 
AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG    300 
GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG    360 
TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC    420 
TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC    480 
ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT    540 
CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT    600 
TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG    660 
AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA    720 
AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG    780 
CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA    840 
CTAACTAGCT ACA                                                       853 
SEQ ID NO:2 
GCATTTCCTA CGCCATGCCT GAACCGAGTC TGAAGACCGT ACAGAATCAC TAAAAGTCGT    60 
GAAACGAATA CCTCTTTGTG CGTCTACCTT GAGCGAGCGA GAGGAGCGGG TCTTTTCGGC    120 
GGCAGTGAGC CTCTGGCACA GGCTCCCCGG CGACATGGGG CCGTGGAACC AGAGCTTCCA    180 
GCGATGACAG CGACTTCTTC ACCCTCGAGG ACGAGGAGGT CTCTGCCGTT TGTCTCTTCC    240 
CTCAGCCACC CTCACACTCG CTGGGCTCGA TGAGGGTGCA AAGCTTGTCT TCCCCGCTCT    300 
TGTGGTCCTG GCGTCAAGCT CCCAGCACTC ACGACGCCTC CCTCTCGCTC TCCTCCTCTT    360 
CATCGGCTCC TCAGCAACTC TCGCTCTCCC AGCATGTGGA CGGCTTCCGA CCTGTCGCGC    420 
ACTTTCCGAG CGTCATTCAC GAGGAGCTAC TGGCGGTGGG AGAGATCTCT GATCCGTTTT    480 
TGAGGCGTAA TGAGGAGGTA CGCTTCCTCG CCCCCACATC TCAACCGTCG AGGAGGAGGT    540 
GGGAGCCAGA ACGAGCTGAC TAGCGAGTAC GTGTACCGTC GCAGGCCGTG CAATGGGTCG    600 
GCGAAGCAGA CTGGATCTAC CGCTGCGACT TCGAGGTCGA GCGGCTGCCG AAGAAGCGCT    660 
CGAAAGAGGG CGAGGGCGAG GAGGAGAGGG CTGACTTGGT GTTCGAGGGT CTCGATACGT    720 
TCGCGACGGT GTACTGTGAG TCGAGATCGA GCGGGCAGAC GGATTGATCG CTAATACGGA    780 
AGTGATCTCG CAGTGAACGG CGACAAGATC CTCGAGGCCG ACAACATGTT CCGTGAATGG    840 
CGGTGAGTCG TCGCTTGAGG CTTCACACTT CGTATGCACC ATGTGAGTCT GCTGCAGACG    900 
TTGATGTGGC AGCCCGTGGA CCATCCACAG TGTCCCGCTT CGATGCTCGC AACTCCGCCA    960 
CGGCCGCAAC  TTGCTGTACA TCGTCTTTCA CTCAGCGTT                          999 
SEQ ID NO:3(RtFBA的cDNA序列) 
ATGGGTGTCC TCGATGTTGT CCCCGCCGGC GTCCTCACCG GCAAGAACCT CGTCAAGTTG    60 
ATGGACTACG CTCGCGAGAA CCACAACTGC ACCTCGTCGT CGACCGTCGT CGCCGCCCTC    120 
GAGGCCGCCC GCGACTCCAA GTCGCCCGTC ATCATCCAGG TCTCGCAGGG TGGTGCCGCC    180 
TTCTTCGCCG GGAAGGGTGT CGCCAACGAC AAGCAGCAGG CTTCCATCGC CGGTGCCGTC    240 
GCCGCCGCCC ACTACGTCCG CTCCATCGCT CCCACCTATG GCGTCCCCGT CGTGCTGCAC    300 
AGCGACCACT GTGCGAAGAA GCTCCTCCAA TGGTTCGACG GCATGCTCGA GGCCGACGAG    360 
GCTTACTACA AGGAGAAGGG CGAGCCTCTC TTCTCTACTT TGAGCGCATG GCCAAGGTCG    420 
ACCTCTGGCT CGAGATGGAG ATTGGCATCA CCGGTGGTGA GGAGGACGGT GTCGACAACA    480 
CTGGTGAGTG CGCGTGCCTT TCGAGTGTCT ATTGACGAGA CTGACGATCA GGGGACAGGC    540 
GTCGACAACA ACTCGCTCTA CACCCAGCCC GAGGACATCC TCGACATCCA CAACGCCCTC    600 
TCCAAGATCT CGCCCATGTT CTCGATCGCT GCCGGCTTCG GCAACGTCCA CGGCGTCTAC    660 
AAGCCTGGCA ACGTCAAGCT CCGTCCCGAG CTCCTCGAGA AGCACCAGAA GTACTGCCAC    720 
GAGCAGCTCA AGTCGAAGAA CCCCCTCCCC ATCTACCTCG TCTTCCACGG CGGTTCGGGA    780 
TCGTCCAAGG ACGAGATCAC TACCGCTGTC AAGAACGGTG TCGTCAAGAT GAACGTCGAC    840 
ACCGACACCC AGTGGGCATA CATGATCGGC TTCCGCGACT ACTTCAAGTC CAAGGCCGCG    900 
TACCTCGAGA CCCAGGTCGG TAACCCCGAG GGCGCCGACA AGCCCAACAA GAAGCAGTAC    960 
GACCCGCGCG TCTGGGTCCG TGAGGGTGAG AAGACGATGA AGGAGCGCTG CCAGGTCGCC    1020 
TTCAAGGACC TCCGCTCCGA GGGAACCCTC TAA                                 1053 
SEQ ID NO:4 
Met Gly Val Leu Asp Val Val Pro Ala Gly Val Leu Thr Gly Lys 
Asn Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn His Asn Cys 
Thr Ser Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala Arg Asp 
Ser Lys Ser Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala Ala 
Phe Phe Ala Gly Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser 
Ile Ala Gly Ala Val Ala Ala Ala His Tyr Val Arg Ser Ile Ala 
Pro Thr Tyr Gly Val Pro Val Val Leu His Ser Asp His Cys Ala 
Lys Lys Leu Leu Gln Trp Phe Asp Gly Met Leu Glu Ala Asp Glu 
Ala Tyr Tyr Lys Glu Lys Gly Glu Pro Leu Phe Ser Thr Leu Ser 
Ala Trp Pro Arg Ser Thr Ser Gly Ser Arg Trp Arg Leu Ala Ser 
Pro Val Val Arg Arg Thr Val Ser Thr Thr Leu Val Ser Ala Arg 
Ala Phe Arg Val Ser Ile Asp Glu Thr Asp Asp Gln Gly Thr Gly 
Val Asp Asn Asn Ser Leu Tyr Thr Gln Pro Glu Asp Ile Leu Asp 
Ile His Asn Ala Leu Ser Lys Ile Ser Pro Met Phe Ser Ile Ala 
Ala Gly Phe Gly Asn Val His Gly Val Tyr Lys Pro Gly Asn Val 
Lys Leu Arg Pro Glu Leu Leu Glu Lys His Gln Lys Tyr Cys His 
Glu Gln Leu Lys Ser Lys Asn Pro Leu pro Ile Tyr Leu Val Phe 
His Gly Gly Ser Gly Ser Ser Lys Asp GluIle  Thr Thr Ala Val 
Lys Asn Gly Val Val Lys Met Asn Val Asp Thr Asp Thr Gln Trp 
Ala Tyr Met Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys Ala Ala 
Tyr Leu Glu Thr Gln Val Gly Asn Pro Glu Gly Ala Asp Lys Pro 
Asr Lys Lys Gln Tyr Asp Pro Arg Val Trp Val Arg Glu Gly Glu 
Lys Thr Met Lys Glu Arg Cys Gln Val Ala Phe Lys Asp Leu Arg 
Ser Glu Gly Thr Leu 
SEQ ID NO:5 
ATGGGTGTCC TCGATGTTGT CCCCGCGTAA GCATCACACG CTCCCACTGC AGCACCCGCA    60 
CCCGCTCACC TTGCTCCCGC AGGCGTACGT CCCCTCCGCC CCGTCATACC CCTCCCGGCT    120 
TCTCTCGAGT CGCGCTCGCC CACAACACCG CGCGGACGGC TGGGAACAGA ATGGCAGGAT    180 
CGGGGAATAG CATGCTCACA TTGAGCGAAC CCGCAGCGGC GTCCTCACCG GCAAGAACCT    240 
CGTCAAGTTG ATGGACTACG CTCGCGAGAA CCACGTCCGT CTTCTTCCGA CTCGCTCACG    300 
AGTGACTGTG CGCTGACCTG CAGCCTCGCG TTTGAGACAG TTCGCCATCC CTGTGCGTTA    360 
CCAGTCCTCG CGAACGGGCG CCGCGCTCTC GCCGTCGCAC GCTTGACGTC GCGAGGGTCG    420 
GTCGCTGATG AGATGGATGA GATCAAGCTG ACCCCGCCTT TTCCACTCCG CTTTTCTCCC    480 
TTCTCCAGGC CTTCGTGAGT CCCTCTCACA CCGTTTGACG CCGGGAGCGA GCGACGGGCT    540 
GACCCGGGAC GTTGCGCGCA AACCAGAACT GCACCTCGTC GTCGACCGTC GTCGCCGCCC    600 
TCGAGGCCGC CCGCGACTCC AAGTCGCCCG TCATCATCCA GGTCTCGCAG GGTGGTGCCG    660 
CCTTCTTCGC CGGGAAGGGT GTCGCCAACG ACAAGCAGCA GGCTTCCATC GCCGGTGCCG    720 
TCGCCGCCGC CCACTACGTC CGCTCCATCG CTCCCACCTA TGGCGTCCCC GTCGTGCTGC    780 
ACAGCGACCA CTGTGCGAAG AAGCTCCTCC AATGGTTCGA CGGCATGCTC GAGGCCGACG    840 
AGGCTTACTA CAAGGAGAAG GGCGAGCCTC TCTTCTCGTA AAGACGCGCT TCCTCTTCCT    900 
CGCCTTGGAC TGGGCTAACG GGCATATCAC AGGTCGCACA TGCTCGACCT TTCGGAGGAG    960 
TCAAAGGAGG AGAACATCGA GACTTGCGTC AAGTACTTTG AGCGCATGGC CAAGGTCGAC    1020 
CTCTGGCTCG AGATGGAGAT TGGCATCACC GGTGGTGAGG AGGACGGTGT CGACAACACT    1080 
GGTGAGTGCG CGTGCCTTTC GAGTGTCTAT TGACGAGACT GACGATCAGG GGACAGGCGT    1140 
CGACAACAAC TCGCTCTACA CCCAGCCCGA GGACATCCTC GACATCCACA ACGCCCTCTC    1200 
CAAGATCTCG CCCATGTTCT CGATCGCTGC CGGCTTCGGC AACGTCCACG GCGTCTACAA    1260 
GCCTGGCAAC GTCAAGCTCC GTCCCGAGCT CCTCGAGAAG CACCAGAAGT ACTGCCACGA    1320 
GCAGCTCAAG TCGAAGAACC CCCTCCCCAT CTACCTCGTC TTCCACGGCG GTTCGGGATC    1380 
GTCCAAGGAC GAGATCACTA CCGCTGTCAA GAACGGTGTC GTCAAGATGA ACGGTGCGCG    1440 
ACGACTTTTC GCGGACTTGC GACTCCCGAG TGCTGACTTG GCTTCTGCCT TCTCCGCTTT    1500 
TTCACTTGGC TTCTGCCTTC TCCGCTTCTC TTCTTGTCCC TACAGTCGAC ACCGACACCC    1560 
AGTGGGCATA CATGATCGGC TTCCGCGACT ACTTCAAGTC CAAGGCCGCG TACCTCGAGA    1620 
CCCAGGTCGG TAACCCCGAG GGCGCCGACA AGCCCAACAA GAAGCAGTAC GACCCGTAAG    1680 
TCGATACCCT CTTCTCTTCT CGCCCGGCCT CTGACGAGAC TCTTTGTTGT CCAGGCGCGT    1740 
CTGGGTCCGT GAGGGTGAGA AGACGATGAA GGAGCGCTGC CAGGTCGCCT TCAAGGACCT    1800 
CCGCTCCGAG GGAACCCTCT AA                                             1822 
SEQ ID NO:6 
GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC    60 
TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG    120 
CTGTTCGGCA GTTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC    180 
GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG    240 
AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG    300 
GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG    360 
TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC    420 
TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC    480 
ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT    540 
CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT    600 
TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG    660 
AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA    720 
AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG    780 
CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA    840 
CTAACTAGCT ACAATGGGTG TCCTCGATGT TGTCCCCGCG TAAGCATCAC ACGCTCCCAC    900 
TGCAGCACCC GCACCCGCTC ACCTTGCTCC CGCAGGCGTA CGTCCCCTCC GCCCCGTCAT    960 
ACCCCTCCCG GCTTCTCTCG AGTCGCGCTC GCCCACAACA CCGCGCGGAC GGCTGGGAAC    1020 
AGAATGGCAG GATCGGGGAA TAGCATGCTC ACATTGAGCG AACCCGCAGC GGCGTCCTCA    1080 
CCGGCAAGAA CCTCGTCAAG TTGATGGACT ACGCTCGCGA GAACCACGTC CGTCTTCTTC    1140 
CGACTCGCTC ACGAGTGACT GTGCGCTGAC CTGCAGCCTC GCGTTTGAGA CAGTTCGCCA    1200 
TCCCTGTGCG TTACCAGTCC TCGCGAACGG GCGCCGCGCT CTCGCCGTCG CACGCTTGAC    1260 
GTCGCGAGGG TCGGTCGCTG ATGAGATGGA TGAGATCAAG CTGACCCCGC CTTTTCCACT    1320 
CCGCTTTTCT CCCTTCTCCA GGCCTTCGTG AGTCCCTCTC ACACCGTTTG ACGCCGGGAG    1380 
CGAGCGACGG GCTGACCCGG GACGTTGCGC GCAAACCAGA ACTGCACCTC GTCGTCGACC    1440 
GTCGTCGCCG CCCTCGAGGC CGCCCGCGAC TCCAAGTCGC CCGTCATCAT CCAGGTCTCG    1500 
CAGGGTGGTG CCGCCTTCTT CGCCGGGAAG GGTGTCGCCA ACGACAAGCA GCAGGCTTCC    1560 
ATCGCCGGTG CCGTCGCCGC CGCCCACTAC GTCCGCTCCA TCGCTCCCAC CTATGGCGTC    1620 
CCCGTCGTGC TGCACAGCGA CCACTGTGCG AAGAAGCTCC TCCAATGGTT CGACGGCATG    1680 
CTCGAGGCCG ACGAGGCTTA CTACAAGGAG AAGGGCGAGC CTCTCTTCTC GTAAAGACGC    1740 
GCTTCCTCTT CCTCGCCTTG GACTGGGCTA ACGGGCATAT CACAGGTCGC ACATGCTCGA    1800 
CCTTTCGGAG GAGTCAAAGG AGGAGAACAT CGAGACTTGC GTCAAGTACT TTGAGCGCAT    1860 
GGCCAAGGTC GACCTCTGGC TCGAGATGGA GATTGGCATC ACCGGTGGTG AGGAGGACGG    1920 
TGTCGACAAC ACTGGTGAGT GCGCGTGCCT TTCGAGTGTC TATTGACGAG ACTGACGATC    1980 
AGGGGACAGG CGTCGACAAC AACTCGCTCT ACACCCAGCC CGAGGACATC CTCGACATCC    2040 
ACAACGCCCT CTCCAAGATC TCGCCCATGT TCTCGATCGC TGCCGGCTTC GGCAACGTCC    2100 
ACGGCGTCTA CAAGCCTGGC AACGTCAAGC TCCGTCCCGA GCTCCTCGAG AAGCACCAGA    2160 
AGTACTGCCA CGAGCAGCTC AAGTCGAAGA ACCCCCTCCC CATCTACCTC GTCTTCCACG    2220 
GCGGTTCGGG ATCGTCCAAG GACGAGATCA CTACCGCTGT CAAGAACGGT GTCGTCAAGA    2280 
TGAACGGTGC GCGACGACTT TTCGCGGACT TGCGACTCCC GAGTGCTGAC TTGGCTTCTG    2340 
CCTTCTCCGC TTTTTCACTT GGCTTCTGCC TTCTCCGCTT CTCTTCTTGT CCCTACAGTC    2400 
GACACCGACA CCCAGTGGGC ATACATGATC GGCTTCCGCG ACTACTTCAA GTCCAAGGCC    2460 
GCGTACCTCG AGACCCAGGT CGGTAACCCC GAGGGCGCCG ACAAGCCCAA CAAGAAGCAG    2520 
TACGACCCGT AAGTCGATAC CCTCTTCTCT TCTCGCCCGG CCTCTGACGA GACTCTTTGT    2580 
TGTCCAGGCG CGTCTGGGTC CGTGAGGGTG AGAAGACGAT GAAGGAGCGC TGCCAGGTCG    2640 
CCTTCAAGGA CCTCCGCTCC GAGGGAACCC TCTAAGCATT TCCTACGCCA TGCCTGAACC    2700 
GAGTCTGAAG ACCGTACAGA ATCACTAAAA GTCGTGAAAC GAATACCTCT TTGTGCGTCT    2760 
ACCTTGAGCG AGCGAGAGGA GCGGGTCTTT TCGGCGGCAG TGAGCCTCTG GCACAGGCTC    2820 
CCCGGCGACA TGGGGCCGTG GAACCAGAGC TTCCAGCGAT GACAGCGACT TCTTCACCCT    2880 
CGAGGACGAG GAGGTCTCTG CCGTTTGTCT CTTCCCTCAG CCACCCTCAC ACTCGCTGGG    2940 
CTCGATGAGG GTGCAAAGCT TGTCTTCCCC GCTCTTGTGG TCCTGGCGTC AAGCTCCCAG    3000 
CACTCACGAC GCCTCCCTCT CGCTCTCCTC CTCTTCATCG GCTCCTCAGC AACTCTCGCT    3060 
CTCCCAGCAT GTGGACGGCT TCCGACCTGT CGCGCACTTT CCGAGCGTCA TTCACGAGGA    3120 
GCTACTGGCG GTGGGAGAGA TCTCTGATCC GTTTTTGAGG CGTAATGAGG AGGTACGCTT    3180 
CCTCGCCCCC ACATCTCAAC CGTCGAGGAG GAGGTGGGAG CCAGAACGAG CTGACTAGCG    3240 
AGTACGTGTA CCGTCGCAGG CCGTGCAATG GGTCGGCGAA GCAGACTGGA TCTACCGCTG    3300 
CGACTTCGAG GTCGAGCGGC TGCCGAAGAA GCGCTCGAAA GAGGGCGAGG GCGAGGAGGA    3360 
GAGGGCTGAC TTGGTGTTCG AGGGTCTCGA TACGTTCGCG ACGGTGTACT GTGAGTCGAG    3420 
ATCGAGCGGG CAGACGGATT GATCGCTAAT ACGGAAGTGA TCTCGCAGTG AACGGCGACA    3480 
AGATCCTCGA GGCCGACAAC ATGTTCCGTG AATGGCGGTG AGTCGTCGCT TGAGGCTTCA    3540 
CACTTCGTAT GCACCATGTG AGTCTGCTGC AGACGTTGAT GTGGCAGCCC GTGGACCATC    3600 
CACAGTGTCC CGCTTCGATG CTCGCAACTC CGCCACGGCC GCAACTTGCT GTACATCGTC    3660 
TTTCACTCAG CGTT                                                      3674 
SEQ ID NO:7(绿色荧光蛋白编码基因) 
ATGAGTAAAG GAGAAGAACT TTTCACTGGA GTTGTCCCAA TTCTTGTTGA ATTAGATGGT    60 
GATGTTAATG GGCACAAATT TTCTGTCAGT GGAGAGGGTG AAGGTGATGC AACATACGGA    120 
AAACTTACCC TTAAATTTAT TTGCACTACT GGAAAACTAC CTGTTCCATG GCCAACACTT    180 
GTCACTACTT TCTCTTATGG TGTTCAATGC TTTTCCCGTT ATCCGGATCA TATGAAACGG    240 
CATGACTTTT TCAAGAGTGC CATGCCCGAA GGTTATGTAC AGGAACGCAC TATATCTTTC    300 
AAAGATGACG GGAACTACAA GACGCGTGCT GAAGTCAAGT TTGAAGGTGA TACCCTTGTT    360 
AATCGTATCG AGTTAAAAGG TATTGATTTT AAAGAAGATG GAAACATTCT CGGACACAAA    420 
CTCGAGTACA ACTATAACTC ACACAATGTA TACATCACGG CAGACAAACA AAAGAATGGA    480 
ATCAAAGCTA ACTTCAAAAT TCGCCACAAC ATTGAAGATG GATCCGTTCA ACTAGCAGAC    540 
CATTATCAAC AAAATACTCC AATTGGCGAT GGCCCTGTCC TTTTACCAGA CAACCATTAC    600 
CTGTCGACAC AATCTGCCCT TTCGAAAGAT CCCAACGAAA AGCGTGACCA CATGGTCCTT    660 
CTTGAGTTTG TAACTGCTGC TGGGATTACA CATGGCATGG ATGAGCTCTA CAAATAA       717 
SEQ ID NO:8 
GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC    60 
TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG    120 
CTGTTCGGCA ATTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC    180 
GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG    240 
AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG    300 
GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG    360 
TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC    420 
TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC    480 
ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT    540 
CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT    600 
TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG    660 
AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA    720 
AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG    780 
CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA    840 
CTAACTAGCT ACAATGAGTA AAGGAGAAGA ACTTTTCACT GGAGTTGTCC CAATTCTTGT    900 
TGAATTAGAT GGTGATGTTA ATGGGCACAA ATTTTCTGTC AGTGGAGAGG GTGAAGGTGA    960 
TGCAACATAC GGAAAACTTA CCCTTAAATT TATTTGCACT ACTGGAAAAC TACCTGTTCC    1020 
ATGGCCAACA CTTGTCACTA CTTTCTCTTA TGGTGTTCAA TGCTTTTCCC GTTATCCGGA    1080 
TCATATGAAA CGGCATGACT TTTTCAAGAG TGCCATGCCC GAAGGTTATG TACAGGAACG    1140 
CACTATATCT TTCAAAGATG ACGGGAACTA CAAGACGCGT GCTGAAGTCA AGTTTGAAGG    1200 
TGATACCCTT GTTAATCGTA TCGAGTTAAA AGGTATTGAT TTTAAAGAAG ATGGAAACAT    1260 
TCTCGGACAC AAACTCGAGT ACAACTATAA CTCACACAAT GTATACATCA CGGCAGACAA    1320 
ACAAAAGAAT GGAATCAAAG CTAACTTCAA AATTCGCCAC AACATTGAAG ATGGATCCGT    1380 
TCAACTAGCA GACCATTATC AACAAAATAC TCCAATTGGC GATGGCCCTG TCCTTTTACC    1440 
AGACAACCAT TACCTGTCGA CACAATCTGC CCTTTCGAAA GATCCCAACG AAAAGCGTGA    1500 
CCACATGGTC CTTCTTGAGT TTGTAACTGC TGCTGGGATT ACACATGGCA TGGATGAGCT    1560 
CTACAAATGA GCATTTCCTA CGCCATGCCT GAACCGAGTC TGAAGACCGT ACAGAATCAC    1620 
TAAAAGTCGT GAAACGAATA CCTCTTTGTG CGTCTACCTT GAGCGAGCGA GAGGAGCGGG    1680 
TCTTTTCGGC GGCAGTGAGC CTCTGGCACA GGCTCCCCGG CGACATGGGG CCGTGGAACC    1740 
AGAGCTTCCA GCGATGACAG CGACTTCTTC ACCCTCGAGG ACGAGGAGGT CTCTGCCGTT    1800 
TGTCTCTTCC CTCAGCCACC CTCACACTCG CTGGGCTCGA TGAGGGTGCA AAGCTTGTCT    1860 
TCCCCGCTCT TGTGGTCCTG GCGTCAAGCT CCCAGCACTC ACGACGCCTC CCTCTCGCTC    1920 
TCCTCCTCTT CATCGGCTCC TCAGCAACTC TCGCTCTCCC AGCATGTGGA CGGCTTCCGA    1980 
CCTGTCGCGC ACTTTCCGAG CGTCATTCAC GAGGAGCTAC TGGCGGTGGG AGAGATCTCT    2040 
GATCCGTTTT TGAGGCGTAA TGAGGAGGTA CGCTTCCTCG CCCCCACATC TCAACCGTCG    2100 
AGGAGGAGGT GGGAGCCAGA ACGAGCTGAC TAGCGAGTAC GTGTACCGTC GCAGGCCGTG    2160 
CAATGGGTCG GCGAAGCAGA CTGGATCTAC CGCTGCGACT TCGAGGTCGA GCGGCTGCCG    2220 
AAGAAGCGCT CGAAAGAGGG CGAGGGCGAG GAGGAGAGGG CTGACTTGGT GTTCGAGGGT    2280 
CTCGATACGT TCGCGACGGT GTACTGTGAG TCGAGATCGA GCGGGCAGAC GGATTGATCG    2340 
CTAATACGGA AGTGATCTCG CAGTGAACGG CGACAAGATC CTCGAGGCCG ACAACATGTT    2400 
CCGTGAATGG CGGTGAGTCG TCGCTTGAGG CTTCACACTT CGTATGCACC ATGTGAGTCT    2460 
GCTGCAGACG TTGATGTGGC AGCCCGTGGA CCATCCACAG TGTCCCGCTT CGATGCTCGC    2520 
AACTCCGCCA CGGCCGCAAC TTGCTGTACA TCGTCTTTCA CTCAGCGTT    2569 
SEQ ID NO:9 
AAGGATTCCC CTAGTAGCGG CGAGCGAAGC GGGAAGAGCT CAAATTTATA ATCTGGCACC    60 
TTCGGTGTCC GAGTTGTAAT CTCTAGAAAT GTTTTCCGCG TTGGACCGCA CACAAGTCTG    120 
TTGGAATACA GCGGCATAGT GGTGAGACCC CCGTATATGG TGCGGACGCC CAGCGCTTTG    180 
TGATACATTT TCGAAGAGTC GAGTTGTTTG GGAATGCAGC TCAAATTGGG TGGTAAATTC    240 
CATCTAAAGC TAAATATTGG CGAGAGACCG ATAGCGAACA AGTACCGTGA GGGAAAGATG    300 
AAAAGCACTT TGGAAAGAGA GTTAACAGTA CGTGAAATTG TTGGAAGGGA AACGCTTGAA    360 
GTCAGACTTG CTTGCCGAGC AATCGGTTTG CAGGCCAGCA TCAGTTTTCC GGGATGGATA    420 
ATGGTAGAGA GAAGGTAGCA GTTTCGGCTG TGTTATAGCT CTCTGCTGGA TACATCTTGG    480 
GGGACTGAGG AACGCAGTGT GCCTTTGGCG GGGGTTTCGA CCTCTTCACA CTTAGGATGC    540 
TGGTGGAATG GCTTTAAACG ACCCGTCTTG AAACACGGAC CAAGGAGTCT AACATGCTTG    600 
CGAGTATTTG GGTGTCAAAC CCGGATGCGT AATGAAAGTG AATGGAGGTG GGAACCGCAA    660 
GGTGCACCAT CGACCGATCT GGATTTTTAA TGATGGATTT GAGTAAGAGC ACGTATGTTG    720 
GGACCCGAAA GATGGTGAAC TATGCCTGAA TAGGGCGAAG CCAGAGGAAA CTCTGGTGGA    780 
GGCTCGTAGC GGTTCTGACG TGCAAATCGA TCGTCAAATT TGGGTATAGG GGCGAAAGAC    840 
TAATCGAACC ATCTAGTAGC TGGTTCCTGC CGAAGTTTCC CTCAGGATAG CAGAAACTCA    900 
CATCAGTTCT ATGAGGTAAA GCGAATGATT AGAGGCCTTG GGGTTGAAAC AACCTTAACC    960 
TATTCTCAAA CTTTAAATAT GTAGGAAGTC CTTGCTACTT AATTGAGCGA GGACATGCGA    1020 
ATGAGAGTTT CTAGTGGGCC ATTTTTGGTA AGCAGAACTG GCGATGCGGG ATGAACCGAA    1080 
CGCGAGGTTA AGGTGCCGGA ATACACGCTC ATCAGACACC ACAAAAGGTG TTAGTTCATC    1140 
TAGACAGCCG CACGGTGGCC ATGGAAGTCG GAATCCGCTA AGGAGTGTGT AACAACTCAA    1200 
CGGCCGAATG AACTAGCCCT GAAAATGGAT GGCGCTCAAG CGTGTTACCC ATACCTCGCC    1260 
GTCAG                                                                1265 
SEQ ID NO:10 
AAGGATTCCC CTAGTAGCGG CGAGCGAAGC GGGAAGAGCT CAAATTTATA ATCTGGCACC    60 
TTCGGTGTCC GAGTTGTAAT CTCTAGAAAT GTTTTCCGCG TTGGACCGCA CACAAGTCTG    120 
TTGGAATACA GCGGCATAGT GGTGAGACCC CCGTATATGG TGCGGACGCC CAGCGCTTTG    180 
TGATACATTT TCGAAGAGTC GAGTTGTTTG GGAATGCAGC TCAAATTGGG TGGTAAATTC    240 
CATCTAAAGC TAAATATTGG CGAGAGACCG ATAGCGAACA AGTACCGTGA GGGAAAGATG    300 
AAAAGCACTT TGGAAAGAGA GTTAACAGTA CGTGAAATTG TTGGAAGGGA AACGCTTGAA    360 
GTCAGACTTG CTTGCCGAGC AATCGGTTTG CAGGCCAGCA TCAGTTTTCC GGGATGGATA    420 
ATGGTAGAGA GAAGGTAGCA GTTTCGGCTG TGTTATAGCT CTCTGCTGGA TACATCTTGG    480 
GGGACTGAGG AACGCAGTGT GCCTTTGGCG GGGGTTTCGA CCTCTTCACA CTTAGGATGC    540 
TGGTGGAATG GCGATGAACT GCCGGACAAA GGAGGACTTT TCGGCTCTCG CCGTCGCCCT    600 
GTCCGATTCT CTGATCCAGA AGCACGCCGG CTCGAAGCTG TTCGGCAATT TTGTCGACGA    660 
GCTCGCCCGC CTGCTCGCCG CGCCGCTCAA GTCGGACGAG GTGGGCAAGG TGCGCGCGAG    720 
TATGGCCAAC CTCGCGATGG ACAAGCAGAA GCTCGAGAAG GCTGGCGCGA AGGGCGGCGC    780 
AGTCGGTGGG AAGCCCCCTG CGAGGATGGT CGCGAGGGGC AGGGAGGACT TGTCGTCGTT    840 
CGGAGAGGTG CTCGACGACG ATGTCGCCGC GGCCCAGTTC GACGAGGACG AGGATTTCGT    900 
GCGTCGCTTT CGCTCGCTCG CTGGTTGCTC CTGTCTCTTC TGCTTCTCAC GCTGACTCTC    960 
ATCGTGCCCG TCTCACTGCA GATGTAGATG TAGACGCACC TCCTCCAGCT TCACCTGCTT    1020 
CCAACCTTTT CCACCGCCTG CAACCGCACT TTCGCCTCGT TCCTTCGGAC TCTTGCGGCT    1080 
GCGATGTTGT CCAGCATCGA CAGGAGCTGC TTTACTTTCG CTTGACCTGC TTGCCACCTG    1140 
GTGCTCGCAC GATGCCATAT ATCGCGAGGG AGGCGAGAGA GCGGAGTTGG CTGGATGACG    1200 
CTCGCTCCGG CTTGCAGCTG GTTGTTACGG TGTTGCAAGA ATTTCTGTGC AGTTTGTACG    1260 
AGTGGCCCCG CGTTGTGGAT GATGTCGGTT CGGTTGGCAC GGCCTTGCTC GCTCGCTCTC    1320 
TCGTTGCTCC TCGCTCTTCA CCACTTCACT TCTAACACTA ACTAGCTACA ATGAGTAAAG    1380 
GAGAAGAACT TTTCACTGGA GTTGTCCCAA TTCTTGTTGA ATTAGATGGT GATGTTAATG    1440 
GGCACAAATT TTCTGTCAGT GGAGAGGGTG AAGGTGATGC AACATACGGA AAACTTACCC    1500 
TTAAATTTAT TTGCACTACT GGAAAACTAC CTGTTCCATG GCCAACACTT GTCACTACTT    1560 
TCTCTTATGG TGTTCAATGC TTTTCCCGTT ATCCGGATCA TATGAAACGG CATGACTTTT    1620 
TCAAGAGTGC CATGCCCGAA GGTTATGTAC AGGAACGCAC TATATCTTTC AAAGATGACG    1680 
GGAACTACAA GACGCGTGCT GAAGTCAAGT TTGAAGGTGA TACCCTTGTT AATCGTATCG    1740 
AGTTAAAAGG TATTGATTTT AAAGAAGATG GAAACATTCT CGGACACAAA CTCGAGTACA    1800 
ACTATAACTC ACACAATGTA TACATCACGG CAGACAAACA AAAGAATGGA ATCAAAGCTA    1860 
ACTTCAAAAT TCGCCACAAC ATTGAAGATG GATCCGTTCA ACTAGCAGAC CATTATCAAC    1920 
AAAATACTCC AATTGGCGAT GGCCCTGTCC TTTTACCAGA CAACCATTAC CTGTCGACAC    1980 
AATCTGCCCT TTCGAAAGAT CCCAACGAAA AGCGTGACCA CATGGTCCTT CTTGAGTTTG    2040 
TAACTGCTGC TGGGATTACA CATGGCATGG ATGAGCTCTA CAAATGAGCA TTTCCTACGC    2100 
CATGCCTGAA CCGAGTCTGA AGACCGTACA GAATCACTAA AAGTCGTGAA ACGAATACCT    2160 
CTTTGTGCGT CTACCTTGAG CGAGCGAGAG GAGCGGGTCT TTTCGGCGGC AGTGAGCCTC    2220 
TGGCACAGGC TCCCCGGCGA CATGGGGCCG TGGAACCAGA GCTTCCAGCG ATGACAGCGA    2280 
CTTCTTCACC CTCGAGGACG AGGAGGTCTC TGCCGTTTGT CTCTTCCCTC AGCCACCCTC    2340 
ACACTCGCTG GGCTCGATGA GGGTGCAAAG CTTGTCTTCC CCGCTCTTGT GGTCCTGGCG    2400 
TCAAGCTCCC AGCACTCACG ACGCCTCCCT CTCGCTCTCC TCCTCTTCAT CGGCTCCTCA    2460 
GCAACTCTCG CTCTCCCAGC ATGTGGACGG CTTCCGACCT GTCGCGCACT TTCCGAGCGT    2520 
CATTCACGAG GAGCTACTGG CGGTGGGAGA GATCTCTGAT CCGTTTTTGA GGCGTAATGA    2580 
GGAGGTACGC TTCCTCGCCC CCACATCTCA ACCGTCGAGG AGGAGGTGGG AGCCAGAACG    2640 
AGCTGACTAG CGAGTACGTG TACCGTCGCA GGCCGTGCAA TGGGTCGGCG AAGCAGACTG    2700 
GATCTACCGC TGCGACTTCG AGGTCGAGCG GCTGCCGAAG AAGCGCTCGA AAGAGGGCGA    2760 
GGGCGAGGAG GAGAGGGCTG ACTTGGTGTT CGAGGGTCTC GATACGTTCG CGACGGTGTA    2820 
CTGTGAGTCG AGATCGAGCG GGCAGACGGA TTGATCGCTA ATACGGAAGT GATCTCGCAG    2880 
TGAACGGTGA AAGTGAATGG AGGTGGGAAC CGCAAGGTGC ACCATCGACC GATCTGGATT    2940 
TTTAATGATG GATTTGAGTA AGAGCACGTA TGTTGGGACC CGAAAGATGG TGAACTATGC    3000 
CTGAATAGGG CGAAGCCAGA GGAAACTCTG GTGGAGGCTC GTAGCGGTTC TGACGTGCAA    3060 
ATCGATCGTC AAATTTGGGT ATAGGGGCGA AAGACTAATC GAACCATCTA GTAGCTGGTT    3120 
CCTGCCGAAG TTTCCCTCAG GATAGCAGAA ACTCACATCA GTTCTATGAG GTAAAGCGAA    3180 
TGATTAGAGG CCTTGGGGTT GAAACAACCT TAACCTATTC TCAAACTTTA AATATGTAGG    3240 
AAGTCCTTGC TACTTAATTG AGCGAGGACA TGCGAATGAG AGTTTCTAGT GGGCCATTTT    3300 
TGGTAAGCAG AACTGGCGAT GCGGGATGAA CCGAACGCGA GGTTAAGGTG CCGGAATACA    3360 
CGCTCATCAG ACACCACAAA AGGTGTTAGT TCATCTAGAC AGCCGCACGG TGGCCATGGA    3420 
AGTCGGAATC CGCTAAGGAG TGTGTAACAA CTCAACGGCC GAATGAACTA GCCCTGAAAA    3480 
TGGATGGCGC TCAAGCGTGT TACCCATACC TCGCCGTCAG                          3520 
果糖.ST25
SEQUENCE LISTING
<110>中国科学院大连化学物理研究所
<120>果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体
<130>
<160>10
<170>PatentIn version 3.1
<210>1
<211>853
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>promoter
<222>(154)..(853)
<223>
<400>1
gctgacggta ctcgtttcgc agacaacccg ctcgagatga actgccggac aaaggaggac  60
ttttcggctc tcgccgtcgc cctgtccgat tctctgatcc agaagcacgc cggctcgaag  120
ctgttcggca gttttgtcga cgagctcgcc cgcctgctcg ccgcgccgct caagtcggac  180
gaggtgggca aggtgcgcgc gagtatggcc aacctcgcga tggacaagca gaagctcgag  240
aaggctggcg cgaagggcgg cgcagtcggt gggaagcccc ctgcgaggat ggtcgcgagg  300
ggcagggagg acttgtcgtc gttcggagag gtgctcgacg acgatgtcgc cgcggcccag  360
ttcgacgagg acgaggattt cgtgcgtcgc tttcgctcgc tcgctggttg ctcctgtctc  420
ttctgcttct cacgctgact ctcatcgtgc ccgtctcact gcagatgtag atgtagacgc  480
acctcctcca gcttcacctg cttccaacct tttccaccgc ctgcaaccgc actttcgcct  540
cgttccttcg gactcttgcg gctgcgatgt tgtccagcat cgacaggagc tgctttactt  600
tcgcttgacc tgcttgccac ctggtgctcg cacgatgcca tatatcgcga gggaggcgag  660
agagcggagt tggctggatg acgctcgctc cggcttgcag ctggttgtta cggtgttgca  720
agaatttctg tgcagtttgt acgagtggcc ccgcgttgtg gatgatgtcg gttcggttgg  780
cacggccttg ctcgctcgct ctctcgttgc tcctcgctct tcaccacttc acttctaaca  840
ctaactagct aca                                                     853
<210>2
<211>999
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>terminator
<222>(1)..(999)
<223>
<400>2
gcatttccta cgccatgcct gaaccgagtc tgaagaccgt acagaatcac taaaagtcgt    60
gaaacgaata cctctttgtg cgtctacctt gagcgagcga gaggagcggg tcttttcggc    120
ggcagtgagc ctctggcaca ggctccccgg cgacatgggg ccgtggaacc agagcttcca    180
gcgatgacag cgacttcttc accctcgagg acgaggaggt ctctgccgtt tgtctcttcc    240
ctcagccacc ctcacactcg ctgggctcga tgagggtgca aagcttgtct tccccgctct    300
tgtggtcctg gcgtcaagct cccagcactc acgacgcctc cctctcgctc tcctcctctt    360
catcggctcc tcagcaactc tcgctctccc agcatgtgga cggcttccga cctgtcgcgc    420
actttccgag cgtcattcac gaggagctac tggcggtggg agagatctct gatccgtttt    480
tgaggcgtaa tgaggaggta cgcttcctcg cccccacatc tcaaccgtcg aggaggaggt    540
gggagccaga acgagctgac tagcgagtac gtgtaccgtc gcaggccgtg caatgggtcg    600
gcgaagcaga ctggatctac cgctgcgact tcgaggtcga gcggctgccg aagaagcgct    660
cgaaagaggg cgagggcgag gaggagaggg ctgacttggt gttcgagggt ctcgatacgt    720
tcgcgacggt gtactgtgag tcgagatcga gcgggcagac ggattgatcg ctaatacgga    780
agtgatctcg cagtgaacgg cgacaagatc ctcgaggccg acaacatgtt ccgtgaatgg    840
cggtgagtcg tcgcttgagg cttcacactt cgtatgcacc atgtgagtct gctgcagacg    900
ttgatgtggc agcccgtgga ccatccacag tgtcccgctt cgatgctcgc aactccgcca    960
cggccgcaac ttgctgtaca tcgtctttca ctcagcgtt                           999
<210>3
<211>1053
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>CDS
<222>(1)..(1053)
<223>
<400>3
atg ggt gtc ctc gat gtt gtc ccc gcc ggc gtc ctc acc ggc aag aac    48
Met Gly Val Leu Asp Val Val Pro Ala Gly Val Leu Thr Gly Lys Asn
1               5                   10                  15
ctc gtc aag ttg atg gac tac gct cgc gag aac cac aac tgc acc tcg    96
Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn His Asn Cys Thr Ser
            20                  25                  30
tcg tcg acc gtc gtc gcc gcc ctc gag gcc gcc cgc gac tcc aag tcg    144
Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala Arg Asp Ser Lys Ser
        35                  40                  45
ccc gtc atc atc cag gtc tcg cag ggt ggt gcc gcc ttc ttc gcc ggg    192
Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala Ala Phe Phe Ala Gly
    50                  55                  60
aag ggt gtc gcc aac gac aag cag cag gct tcc atc gcc ggt gcc gtc    240
Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser Ile Ala Gly Ala Val
65                  70                  75                  80
gcc gcc gcc cac tac gtc cgc tcc atc gct ccc acc tat ggc gtc ccc    288
Ala Ala Ala His Tyr Val Arg Ser Ile Ala Pro Thr Tyr Gly Val Pro
                85                  90                  95
gtc gtg ctg cac agc gac cac tgt gcg aag aag ctc ctc caa tgg ttc    336
Val Val Leu His Ser Asp His Cys Ala Lys Lys Leu Leu Gln Trp Phe
            100                 105                 110
gac ggc atg ctc gag gcc gac gag gct tac tac aag gag aag ggc gag    384
Asp Gly Met Leu Glu Ala Asp Glu Ala Tyr Tyr Lys Glu Lys Gly Glu
        115                 120                 125
cct ctc ttc tct act ttg agc gca tgg cca agg tcg acc tct ggc tcg    432
Pro Leu Phe Ser Thr Leu Ser Ala Trp Pro Arg Ser Thr Ser Gly Ser
    130                 135                 140
aga tgg aga ttg gca tca ccg gtg gtg agg agg acg gtg tcg aca aca    480
Arg Trp Arg Leu Ala Ser Pro Val Val Arg Arg Thr Val Ser Thr Thr
145                 150                 155                 160
ctg gtg agt gcg cgt gcc ttt cga gtg tct att gac gag act gac gat    528
Leu Val Ser Ala Arg Ala Phe Arg Val Ser Ile Asp Glu Thr Asp Asp
                165                 170                 175
cag ggg aca ggc gtc gac aac aac tcg ctc tac acc cag ccc gag gac    576
Gln Gly Thr Gly Val Asp Asn Asn Ser Leu Tyr Thr Gln Pro Glu Asp
            180                 185                 190
atc ctc gac atc cac aac gcc ctc tcc aag atc tcg ccc atg ttc tcg    624
Ile Leu Asp Ile His Asn Ala Leu Ser Lys Ile Ser Pro Met Phe Ser
        195                 200                 205
atc gct gcc ggc ttc ggc aac gtc cac ggc gtc tac aag cct ggc aac    672
Ile Ala Ala Gly Phe Gly Asn Val His Gly Val Tyr Lys Pro Gly Asn
    210                 215                 220
gtc aag ctc cgt ccc gag ctc ctc gag aag cac cag aag tac tgc cac    720
Val Lys Leu Arg Pro Glu Leu Leu Glu Lys His Gln Lys Tyr Cys His
225                 230                 235                 240
gag cag ctc aag tcg aag aac ccc ctc ccc atc tac ctc gtc ttc cac    768
Glu Gln Leu Lys Ser Lys Asn Pro Leu Pro Ile Tyr Leu Val Phe His
                245                 250                 255
ggc ggt tcg gga tcg tcc aag gac gag atc act acc gct gtc aag aac    816
Gly Gly Ser Gly Ser Ser Lys Asp Glu Ile Thr Thr Ala Val Lys Asn
            260                 265                 270
ggt gtc gtc aag atg aac gtc gac acc gac acc cag tgg gca tac atg    864
Gly Val Val Lys Met Asn Val Asp Thr Asp Thr Gln Trp Ala Tyr Met
        275                 280                 285
atc ggc ttc cgc gac tac ttc aag tcc aag gcc gcg tac ctc gag acc    912
Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys Ala Ala Tyr Leu Glu Thr
    290                 295                 300
cag gtc ggt aac ccc gag ggc gcc gac aag ccc aac aag aag cag tac    960
Gln Val Gly Asn Pro Glu Gly Ala Asp Lys Pro Asn Lys Lys Gln Tyr
305                 310                 315                 320
gac ccg cgc gtc tgg gtc cgt gag ggt gag aag acg atg aag gag cgc    1008
Asp Pro Arg Val Trp Val Arg Glu Gly Glu Lys Thr Met Lys Glu Arg
                325                 330                 335
tgc cag gtc gcc ttc aag gac ctc cgc tcc gag gga acc ctc taa        1053
Cys Gln Val Ala Phe Lys Asp Leu Arg Ser Glu Gly Thr Leu
            340                 345                 350
<210>4
<211>350
<212>PRT
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<400>4
Met Gly Val Leu Asp Val Val Pro Ala Gly Val Leu Thr Gly Lys Asn
1               5                   10                  15
Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn His Asn Cys Thr Ser
            20                  25                  30
Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala Arg Asp Ser Lys Ser
        35                  40                  45
Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala Ala Phe Phe Ala Gly
    50                  55                  60
Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser Ile Ala Gly Ala Val
65                  70                  75                  80
Ala Ala Ala His Tyr Val Arg Ser Ile Ala Pro Thr Tyr Gly Val Pro
                85                  90                  95
Val Val Leu His Ser Asp His Cys Ala Lys Lys Leu Leu Gln Trp Phe
            100                 105                 110
Asp Gly Met Leu Glu Ala Asp Glu Ala Tyr Tyr Lys Glu Lys Gly Glu
        115                 120                 125
Pro Leu Phe Ser Thr Leu Ser Ala Trp Pro Arg Ser Thr Ser Gly Ser
    130                 135                 140
Arg Trp Arg Leu Ala Ser Pro Val Val Arg Arg Thr Val Ser Thr Thr
145                 150                 155                 160
Leu Val Ser Ala Arg Ala Phe Arg Val Ser Ile Asp Glu Thr Asp Asp
                165                 170                 175
Gln Gly Thr Gly Val Asp Asn Asn Ser Leu Tyr Thr Gln Pro Glu Asp
            180                 185                 190
Ile Leu Asp Ile His Asn Ala Leu Ser Lys Ile Ser Pro Met Phe Ser
        195                 200                 205
Ile Ala Ala Gly Phe Gly Asn Val His Gly Val Tyr Lys Pro Gly Asn
    210                 215                 220
Val Lys Leu Arg Pro Glu Leu Leu Glu Lys His Gln Lys Tyr Cys His
225                 230                 235                 240
Glu Gln Leu Lys Ser Lys Asn Pro Leu Pro Ile Tyr Leu Val Phe His
                245                 250                 255
Gly Gly Ser Gly Ser Ser Lys Asp Glu Ile Thr Thr Ala Val Lys Asn
            260                 265                 270
Gly Val Val Lys Met Asn Val Asp Thr Asp Thr Gln Trp Ala Tyr Met
        275                 280                 285
Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys Ala Ala Tyr Leu Glu Thr
    290                 295                 300
Gln Val Gly Asn Pro Glu Gly Ala Asp Lys Pro Asn Lys Lys Gln Tyr
305                 310                 315                 320
Asp Pro Arg Val Trp Val Arg Glu Gly Glu Lys Thr Met Lys Glu Arg
                325                 330                 335
Cys Gln Val Ala Phe Lys Asp Leu Arg Ser Glu Gly Thr Leu
            340                 345                 350
<210>5
<211>1822
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>exon
<222>(1)..(26)
<223>
<220>
<221>exon
<222>(1735)..(1822)
<223>
<220>
<221>exon
<222>(1546)..(1675)
<223>
<220>
<221>exon
<222>(994)..(1433)
<223>
<220>
<221>exon
<222>(567)..(877)
<223>
<220>
<221>exon
<222>(217)..(274)
<223>
<400>5
atg ggt gtc ctc gat gtt gtc ccc gc gtaagcatca cacgctccca              46
Met Gly Val Leu Asp Val Val Pro Ala
1               5
ctgcagcacc cgcacccgct caccttgctc ccgcaggcgt acgtcccctc cgccccgtca    106
tacccctccc ggcttctctc gagtcgcgct cgcccacaac accgcgcgga cggctgggaa    166
cagaatggca ggatcgggga atagcatgct cacattgagc ga cccgcag c ggc gtc     223
                                                         Gly Val
                                                         10
ctc acc ggc aag aac ctc gtc aag ttg atg gac tac gct cgc gag aac      271
Leu Thr Gly Lys Asn Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn
            15                  20                  25
cac gtccgtcttc ttccgactcg ctcacgagtg actgtgcgct gacctgcagc           324
His
ctcgcgtttg agacagttcg ccatccctgt gcgttaccag tcctcgcgaa cgggcgccgc    384
gctctcgccg tcgcacgctt gacgtcgcga gggtcggtcg ctgatgagat ggatgagatc    444
aagctgaccc cgccttttcc actccgcttt tctcccttct ccaggccttc gtgagtccct    504
ctcacaccgt ttgacgccgg gagcgagcga cgggctgacc cgggacgttg cgcgcaaacc    564
ag aac tgc acc tcg tcg tcg acc gtc gtc gcc gcc ctc gag gcc gcc       611
   Asn Cys Thr Ser Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala
       30                  35                  40
cgc gac tcc aag tcg ccc gtc atc atc cag gtc tcg cag ggt ggt gcc      659
Arg Asp Ser Lys Ser Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala
    45                  50                  55
gcc ttc ttc gcc ggg aag ggt gtc gcc aac gac aag cag cag gct tcc      707
Ala Phe Phe Ala Gly Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser
60                  65                  70                  75
atc gcc ggt gcc gtc gcc gcc gcc cac tac gtc cgc tcc atc gct ccc      755
Ile Ala Gly Ala Val Ala Ala Ala His Tyr Val Arg Ser Ile Ala Pro
                80                  85                  90
acc tat ggc gtc ccc gtc gtg ctg cac agc gac cac tgt gcg aag aag      803
Thr Tyr Gly Val Pro Val Val Leu His Ser Asp His Cys Ala Lys Lys
            95                  100                 105
ctc ctc caa tgg ttc gac ggc atg ctc gag gcc gac gag gct tac tac      851
Leu Leu Gln Trp Phe Asp Gly Met Leu Glu Ala Asp Glu Ala Tyr Tyr
        110                 115                 120
aag gag aag ggc gag cct ctc ttc tc gtaaagacgc gcttcctctt             897
Lys Glu Lys Gly Glu Pro Leu Phe Ser
    125                 130
cctcgccttg gactgggcta acgggcatat cacaggtcgc acatgctcga cctttcggag    957
gagtcaaagg aggagaacat cgagacttgc gtcaag t act ttg agc gca tgg cca    1012
                                          Thr Leu Ser Ala Trp Pro
                                                  135
agg tcg acc tct ggc tcg aga tgg aga ttg gca tca ccg gtg gtg agg      1060
Arg Ser Thr Ser Gly Ser Arg Trp Arg Leu Ala Ser Pro Val Val Arg
    140                 145                 150
agg acg gtg tcg aca aca ctg gtg agt gcg cgt gcc ttt cga gtg tct      1108
Arg Thr Val Ser Thr Thr Leu Val Ser Ala Arg Ala Phe Arg Val Ser
155                 160                 165                 170
att gac gag act gac gat cag ggg aca ggc gtc gac aac aac tcg ctc      1156
Ile Asp Glu Thr Asp Asp Gln Gly Thr Gly Val Asp Asn Asn Ser Leu
                175                 180                 185
tac acc cag ccc gag gac atc ctc gac atc cac aac gcc ctc tcc aag      1204
Tyr Thr Gln Pro Glu Asp Ile Leu Asp Ile His Asn Ala Leu Ser Lys
            190                 195                 200
atc tcg ccc atg ttc tcg atc gct gcc ggc ttc ggc aac gtc cac ggc      1252
Ile Ser Pro Met Phe Ser Ile Ala Ala Gly Phe Gly Asn Val His Gly
        205                 210                 215
gtc tac aag cct ggc aac gtc aag ctc cgt ccc gag ctc ctc gag aag      1300
Val Tyr Lys Pro Gly Asn Val Lys Leu Arg Pro Glu Leu Leu Glu Lys
    220                 225                 230
cac cag aag tac tgc cac gag cag ctc aag tcg aag aac ccc ctc ccc      1348
His Gln Lys Tyr Cys His Glu Gln Leu Lys Ser Lys Asn Pro Leu Pro
235                 240                 245                 250
atc tac ctc gtc ttc cac ggc ggt tcg gga tcg tcc aag gac gag atc      1396
Ile Tyr Leu Val Phe His Gly Gly Ser Gly Ser Ser Lys Asp Glu Ile
                255                 260                 265
act acc gct gtc aag aac ggt gtc gtc aag atg aac g gtgcgcgacg         1443
Thr Thr Ala Val Lys Asn Gly Val Val Lys Met Asn
            270                 275
acttttcgcg gacttgcgac tcccgagtgc tgacttggct tctgccttct ccgctttttc    1503
acttggcttc tgccttctcc gcttctcttc ttgtccctac ag tc  gac acc gac       1556
                                               Val Asp Thr Asp
                                                   280
acc cag tgg gca tac atg atc ggc ttc cgc gac tac ttc aag tcc aag      1604
Thr Gln Trp Ala Tyr Met Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys
        285                 290                 295
gcc gcg tac ctc gag acc cag gtc ggt aac ccc gag ggc gcc gac aag      1652
Ala Ala Tyr Leu Glu Thr Gln Val Gly Asn Pro Glu Gly Ala Asp Lys
    300                 305                 310
ccc aac aag aag cag tac gac cc gtaagtcgat accctcttct cttctcgccc    1705
Pro Asn Lys Lys Gln Tyr Asp Pro
315                 320
ggcctctgac gagactcttt gttgtccag g cgc gtc tgg gtc cgt gag ggt gag  1759
                                  Arg Val Trp Val Arg Glu Gly Glu
                                          325                 330
aag acg atg aag gag cgc tgc cag gtc gcc ttc aag gac ctc cgc tcc    1807
Lys Thr Met Lys Glu Arg Cys Gln Val Ala Phe Lys Asp Leu Arg Ser
                335                 340                 345
gag gga acc ctc taa                                                1822
Glu Gly Thr Leu
            350
<210>6
<211>3674
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>promoter
<222>(154)..(853)
<223>
<220>
<221>terminator
<222>(2676)..(3674)
<223>
<400>6
gctgacggta ctcgtttcgc agacaacccg ctcgagatga actgccggac aaaggaggac  60
ttttcggctc tcgccgtcgc cctgtccgat tctctgatcc agaagcacgc cggctcgaag  120
ctgttcggca gttttgtcga cgagctcgcc cgcctgctcg ccgcgccgct caagtcggac  180
gaggtgggca aggtgcgcgc gagtatggcc aacctcgcga tggacaagca gaagctcgag  240
aaggctggcg cgaagggcgg cgcagtcggt gggaagcccc ctgcgaggat ggtcgcgagg  300
ggcagggagg acttgtcgtc gttcggagag gtgctcgacg acgatgtcgc cgcggcccag  360
ttcgacgagg acgaggattt cgtgcgtcgc tttcgctcgc tcgctggttg ctcctgtctc  420
ttctgcttct cacgctgact ctcatcgtgc ccgtctcact gcagatgtag atgtagacgc  480
acctcctcca gcttcacctg cttccaacct tttccaccgc ctgcaaccgc actttcgcct  540
cgttccttcg gactcttgcg gctgcgatgt tgtccagcat cgacaggagc tgctttactt  600
tcgcttgacc tgcttgccac ctggtgctcg cacgatgcca tatatcgcga gggaggcgag  660
agagcggagt tggctggatg acgctcgctc cggcttgcag ctggttgtta cggtgttgca  720
agaatttctg tgcagtttgt acgagtggcc ccgcgttgtg gatgatgtcg gttcggttgg  780
cacggccttg ctcgctcgct ctctcgttgc tcctcgctct tcaccacttc acttctaaca  840
ctaactagct acaatgggtg tcctcgatgt tgtccccgcg taagcatcac acgctcccac    900
tgcagcaccc gcacccgctc accttgctcc cgcaggcgta cgtcccctcc gccccgtcat    960
acccctcccg gcttctctcg agtcgcgctc gcccacaaca ccgcgcggac ggctgggaac    1020
agaatggcag gatcggggaa tagcatgctc acattgagcg aacccgcagc ggcgtcctca    1080
ccggcaagaa cctcgtcaag ttgatggact acgctcgcga gaaccacgtc cgtcttcttc    1140
cgactcgctc acgagtgact gtgcgctgac ctgcagcctc gcgtttgaga cagttcgcca    1200
tccctgtgcg ttaccagtcc tcgcgaacgg gcgccgcgct ctcgccgtcg cacgcttgac    1260
gtcgcgaggg tcggtcgctg atgagatgga tgagatcaag ctgaccccgc cttttccact    1320
ccgcttttct cccttctcca ggccttcgtg agtccctctc acaccgtttg acgccgggag    1380
cgagcgacgg gctgacccgg gacgttgcgc gcaaaccaga actgcacctc gtcgtcgacc    1440
gtcgtcgccg ccctcgaggc cgcccgcgac tccaagtcgc ccgtcatcat ccaggtctcg    1500
cagggtggtg ccgccttctt cgccgggaag ggtgtcgcca acgacaagca gcaggcttcc    1560
atcgccggtg ccgtcgccgc cgcccactac gtccgctcca tcgctcccac ctatggcgtc    1620
cccgtcgtgc tgcacagcga ccactgtgcg aagaagctcc tccaatggtt cgacggcatg    1680
ctcgaggccg acgaggctta ctacaaggag aagggcgagc ctctcttctc gtaaagacgc    1740
gcttcctctt cctcgccttg gactgggcta acgggcatat cacaggtcgc acatgctcga    1800
cctttcggag gagtcaaagg aggagaacat cgagacttgc gtcaagtact ttgagcgcat    1860
ggccaaggtc gacctctggc tcgagatgga gattggcatc accggtggtg aggaggacgg    1920
tgtcgacaac actggtgagt gcgcgtgcct ttcgagtgtc tattgacgag actgacgatc    1980
aggggacagg cgtcgacaac aactcgctct acacccagcc cgaggacatc ctcgacatcc    2040
acaacgccct ctccaagatc tcgcccatgt tctcgatcgc tgccggcttc ggcaacgtcc    2100
acggcgtcta caagcctggc aacgtcaagc tccgtcccga gctcctcgag aagcaccaga    2160
agtactgcca cgagcagctc aagtcgaaga accccctccc catctacctc gtcttccacg    2220
gcggttcggg atcgtccaag gacgagatca ctaccgctgt caagaacggt gtcgtcaaga    2280
tgaacggtgc gcgacgactt ttcgcggact tgcgactccc gagtgctgac ttggcttctg    2340
ccttctccgc tttttcactt ggcttctgcc ttctccgctt ctcttcttgt ccctacagtc    2400
gacaccgaca cccagtgggc atacatgatc ggcttccgcg actacttcaa gtccaaggcc    2460
gcgtacctcg agacccaggt cggtaacccc gagggcgccg acaagcccaa caagaagcag    2520
tacgacccgt aagtcgatac cctcttctct tctcgcccgg cctctgacga gactctttgt    2580
tgtccaggcg cgtctgggtc cgtgagggtg agaagacgat gaaggagcgc tgccaggtcg    2640
ccttcaagga cctccgctcc gagggaaccc tctaagcatt tcctacgcca tgcctgaacc    2700
gagtctgaag accgtacaga atcactaaaa gtcgtgaaac gaatacctct ttgtgcgtct    2760
accttgagcg agcgagagga gcgggtcttt tcggcggcag tgagcctctg gcacaggctc    2820
cccggcgaca tggggccgtg gaaccagagc ttccagcgat gacagcgact tcttcaccct    2880
cgaggacgag gaggtctctg ccgtttgtct cttccctcag ccaccctcac actcgctggg    2940
ctcgatgagg gtgcaaagct tgtcttcccc gctcttgtgg tcctggcgtc aagctcccag    3000
cactcacgac gcctccctct cgctctcctc ctcttcatcg gctcctcagc aactctcgct    3060
ctcccagcat gtggacggct tccgacctgt cgcgcacttt ccgagcgtca ttcacgagga  3120
gctactggcg gtgggagaga tctctgatcc gtttttgagg cgtaatgagg aggtacgctt  3180
cctcgccccc acatctcaac cgtcgaggag gaggtgggag ccagaacgag ctgactagcg  3240
agtacgtgta ccgtcgcagg ccgtgcaatg ggtcggcgaa gcagactgga tctaccgctg  3300
cgacttcgag gtcgagcggc tgccgaagaa gcgctcgaaa gagggcgagg gcgaggagga  3360
gagggctgac ttggtgttcg agggtctcga tacgttcgcg acggtgtact gtgagtcgag  3420
atcgagcggg cagacggatt gatcgctaat acggaagtga tctcgcagtg aacggcgaca  3480
agatcctcga ggccgacaac atgttccgtg aatggcggtg agtcgtcgct tgaggcttca  3540
cacttcgtat gcaccatgtg agtctgctgc agacgttgat gtggcagccc gtggaccatc  3600
cacagtgtcc cgcttcgatg ctcgcaactc cgccacggcc gcaacttgct gtacatcgtc  3660
tttcactcag cgtt                                                    3674
<210>7
<211>717
<212>DNA
<213>人工序列
<220>
<221>gene
<222>(1)..(717)
<223>
<400>7
atgagtaaag gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt    60
gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga    120
aaacttaccc ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt    180
gtcactactt tctcttatgg tgttcaatgc ttttcccgtt atccggatca tatgaaacgg    240
catgactttt tcaagagtgc catgcccgaa ggttatgtac aggaacgcac tatatctttc    300
aaagatgacg ggaactacaa gacgcgtgct gaagtcaagt ttgaaggtga tacccttgtt    360
aatcgtatcg agttaaaagg tattgatttt aaagaagatg gaaacattct cggacacaaa    420
ctcgagtaca actataactc acacaatgta tacatcacgg cagacaaaca aaagaatgga    480
atcaaagcta acttcaaaat tcgccacaac attgaagatg gatccgttca actagcagac    540
cattatcaac aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac    600
ctgtcgacac aatctgccct ttcgaaagat cccaacgaaa agcgtgacca catggtcctt    660
cttgagtttg taactgctgc tgggattaca catggcatgg atgagctcta caaataa       717
<210>8
<211>2569
<212>DNA
<213>人工序列
<220>
<221>promoter
<222>(154)..(853)
<223>
<220>
<221>terminator
<222>(1571)..(2569)
<223>
<400>8
gctgacggta ctcgtttcgc agacaacccg ctcgagatga actgccggac aaaggaggac    60
ttttcggctc tcgccgtcgc cctgtccgat tctctgatcc agaagcacgc cggctcgaag    120
ctgttcggca attttgtcga cgagctcgcc cgcctgctcg ccgcgccgct caagtcggac    180
gaggtgggca aggtgcgcgc gagtatggcc aacctcgcga tggacaagca gaagctcgag    240
aaggctggcg cgaagggcgg cgcagtcggt gggaagcccc ctgcgaggat ggtcgcgagg    300
ggcagggagg acttgtcgtc gttcggagag gtgctcgacg acgatgtcgc cgcggcccag    360
ttcgacgagg acgaggattt cgtgcgtcgc tttcgctcgc tcgctggttg ctcctgtctc    420
ttctgcttct cacgctgact ctcatcgtgc ccgtctcact gcagatgtag atgtagacgc    480
acctcctcca gcttcacctg cttccaacct tttccaccgc ctgcaaccgc actttcgcct    540
cgttccttcg gactcttgcg gctgcgatgt tgtccagcat cgacaggagc tgctttactt    600
tcgcttgacc tgcttgccac ctggtgctcg cacgatgcca tatatcgcga gggaggcgag    660
agagcggagt tggctggatg acgctcgctc cggcttgcag ctggttgtta cggtgttgca    720
agaatttctg tgcagtttgt acgagtggcc ccgcgttgtg gatgatgtcg gttcggttgg    780
cacggccttg ctcgctcgct ctctcgttgc tcctcgctct tcaccacttc acttctaaca    840
ctaactagct acaatgagta aaggagaaga acttttcact ggagttgtcc caattcttgt    900
tgaattagat ggtgatgtta atgggcacaa attttctgtc agtggagagg gtgaaggtga    960
tgcaacatac ggaaaactta cccttaaatt tatttgcact actggaaaac tacctgttcc    1020
atggccaaca cttgtcacta ctttctctta tggtgttcaa tgcttttccc gttatccgga    1080
tcatatgaaa cggcatgact ttttcaagag tgccatgccc gaaggttatg tacaggaacg    1140
cactatatct ttcaaagatg acgggaacta caagacgcgt gctgaagtca agtttgaagg    1200
tgataccctt gttaatcgta tcgagttaaa aggtattgat tttaaagaag atggaaacat    1260
tctcggacac aaactcgagt acaactataa ctcacacaat gtatacatca cggcagacaa    1320
acaaaagaat ggaatcaaag ctaacttcaa aattcgccac aacattgaag atggatccgt    1380
tcaactagca gaccattatc aacaaaatac tccaattggc gatggccctg tccttttacc    1440
agacaaccat tacctgtcga cacaatctgc cctttcgaaa gatcccaacg aaaagcgtga    1500
ccacatggtc cttcttgagt ttgtaactgc tgctgggatt acacatggca tggatgagct  1560
ctacaaatga gcatttccta cgccatgcct gaaccgagtc tgaagaccgt acagaatcac  1620
taaaagtcgt gaaacgaata cctctttgtg cgtctacctt gagcgagcga gaggagcggg  1680
tcttttcggc ggcagtgagc ctctggcaca ggctccccgg cgacatgggg ccgtggaacc  1740
agagcttcca gcgatgacag cgacttcttc accctcgagg acgaggaggt ctctgccgtt  1800
tgtctcttcc ctcagccacc ctcacactcg ctgggctcga tgagggtgca aagcttgtct  1860
tccccgctct tgtggtcctg gcgtcaagct cccagcactc acgacgcctc cctctcgctc  1920
tcctcctctt catcggctcc tcagcaactc tcgctctccc agcatgtgga cggcttccga  1980
cctgtcgcgc actttccgag cgtcattcac gaggagctac tggcggtggg agagatctct  2040
gatccgtttt tgaggcgtaa tgaggaggta cgcttcctcg cccccacatc tcaaccgtcg  2100
aggaggaggt gggagccaga acgagctgac tagcgagtac gtgtaccgtc gcaggccgtg  2160
caatgggtcg gcgaagcaga ctggatctac cgctgcgact tcgaggtcga gcggctgccg  2220
aagaagcgct cgaaagaggg cgagggcgag gaggagaggg ctgacttggt gttcgagggt  2280
ctcgatacgt tcgcgacggt gtactgtgag tcgagatcga gcgggcagac ggattgatcg  2340
ctaatacgga agtgatctcg cagtgaacgg cgacaagatc ctcgaggccg acaacatgtt  2400
ccgtgaatgg cggtgagtcg tcgcttgagg cttcacactt cgtatgcacc atgtgagtct  2460
gctgcagacg ttgatgtggc agcccgtgga ccatccacag tgtcccgctt cgatgctcgc  2520
aactccgcca cggccgcaac ttgctgtaca tcgtctttca ctcagcgtt              2569
<210>9
<211>1265
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>gene
<222>(1)..(1265)
<223>
<400>9
aaggattccc ctagtagcgg cgagcgaagc gggaagagct caaatttata atctggcacc    60
ttcggtgtcc gagttgtaat ctctagaaat gttttccgcg ttggaccgca cacaagtctg    120
ttggaataca gcggcatagt ggtgagaccc ccgtatatgg tgcggacgcc cagcgctttg    180
tgatacattt tcgaagagtc gagttgtttg ggaatgcagc tcaaattggg tggtaaattc    240
catctaaagc taaatattgg cgagagaccg atagcgaaca agtaccgtga gggaaagatg    300
aaaagcactt tggaaagaga gttaacagta cgtgaaattg ttggaaggga aacgcttgaa    360
gtcagacttg cttgccgagc aatcggtttg caggccagca tcagttttcc gggatggata    420
atggtagaga gaaggtagca gtttcggctg tgttatagct ctctgctgga tacatcttgg    480
gggactgagg aacgcagtgt gcctttggcg ggggtttcga cctcttcaca cttaggatgc    540
tggtggaatg gctttaaacg acccgtcttg aaacacggac caaggagtct aacatgcttg  600
cgagtatttg ggtgtcaaac ccggatgcgt aatgaaagtg aatggaggtg ggaaccgcaa  660
ggtgcaccat cgaccgatct ggatttttaa tgatggattt gagtaagagc acgtatgttg  720
ggacccgaaa gatggtgaac tatgcctgaa tagggcgaag ccagaggaaa ctctggtgga  780
ggctcgtagc ggttctgacg tgcaaatcga tcgtcaaatt tgggtatagg ggcgaaagac  840
taatcgaacc atctagtagc tggttcctgc cgaagtttcc ctcaggatag cagaaactca  900
catcagttct atgaggtaaa gcgaatgatt agaggccttg gggttgaaac aaccttaacc  960
tattctcaaa ctttaaatat gtaggaagtc cttgctactt aattgagcga ggacatgcga  1020
atgagagttt ctagtgggcc atttttggta agcagaactg gcgatgcggg atgaaccgaa  1080
cgcgaggtta aggtgccgga atacacgctc atcagacacc acaaaaggtg ttagttcatc  1140
tagacagccg cacggtggcc atggaagtcg gaatccgcta aggagtgtgt aacaactcaa  1200
cggccgaatg aactagccct gaaaatggat ggcgctcaag cgtgttaccc atacctcgcc  1260
gtcag                                                              1265
<210>10
<211>3520
<212>DNA
<213>人工序列
<220>
<221>promoter
<222>(671)..(1370)
<223>
<400>10
aaggattccc ctagtagcgg cgagcgaagc gggaagagct caaatttata atctggcacc  60
ttcggtgtcc gagttgtaat ctctagaaat gttttccgcg ttggaccgca cacaagtctg  120
ttggaataca gcggcatagt ggtgagaccc ccgtatatgg tgcggacgcc cagcgctttg  180
tgatacattt tcgaagagtc gagttgtttg ggaatgcagc tcaaattggg tggtaaattc  240
catctaaagc taaatattgg cgagagaccg atagcgaaca agtaccgtga gggaaagatg  300
aaaagcactt tggaaagaga gttaacagta cgtgaaattg ttggaaggga aacgcttgaa  360
gtcagacttg cttgccgagc aatcggtttg caggccagca tcagttttcc gggatggata  420
atggtagaga gaaggtagca gtttcggctg tgttatagct ctctgctgga tacatcttgg  480
gggactgagg aacgcagtgt gcctttggcg ggggtttcga cctcttcaca cttaggatgc  540
tggtggaatg gcgatgaact gccggacaaa ggaggacttt tcggctctcg ccgtcgccct  600
gtccgattct ctgatccaga agcacgccgg ctcgaagctg ttcggcaatt ttgtcgacga  660
gctcgcccgc ctgctcgccg cgccgctcaa gtcggacgag gtgggcaagg tgcgcgcgag  720
tatggccaac ctcgcgatgg acaagcagaa gctcgagaag gctggcgcga agggcggcgc  780
agtcggtggg aagccccctg cgaggatggt cgcgaggggc agggaggact tgtcgtcgtt    840
cggagaggtg ctcgacgacg atgtcgccgc ggcccagttc gacgaggacg aggatttcgt    900
gcgtcgcttt cgctcgctcg ctggttgctc ctgtctcttc tgcttctcac gctgactctc    960
atcgtgcccg tctcactgca gatgtagatg tagacgcacc tcctccagct tcacctgctt    1020
ccaacctttt ccaccgcctg caaccgcact ttcgcctcgt tccttcggac tcttgcggct    1080
gcgatgttgt ccagcatcga caggagctgc tttactttcg cttgacctgc ttgccacctg    1140
gtgctcgcac gatgccatat atcgcgaggg aggcgagaga gcggagttgg ctggatgacg    1200
ctcgctccgg cttgcagctg gttgttacgg tgttgcaaga atttctgtgc agtttgtacg    1260
agtggccccg cgttgtggat gatgtcggtt cggttggcac ggccttgctc gctcgctctc    1320
tcgttgctcc tcgctcttca ccacttcact tctaacacta actagctaca atgagtaaag    1380
gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt gatgttaatg    1440
ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga aaacttaccc    1500
ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt gtcactactt    1560
tctcttatgg tgttcaatgc ttttcccgtt atccggatca tatgaaacgg catgactttt    1620
tcaagagtgc catgcccgaa ggttatgtac aggaacgcac tatatctttc aaagatgacg    1680
ggaactacaa gacgcgtgct gaagtcaagt ttgaaggtga tacccttgtt aatcgtatcg    1740
agttaaaagg tattgatttt aaagaagatg gaaacattct cggacacaaa ctcgagtaca    1800
actataactc acacaatgta tacatcacgg cagacaaaca aaagaatgga atcaaagcta    1860
acttcaaaat tcgccacaac attgaagatg gatccgttca actagcagac cattatcaac    1920
aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac ctgtcgacac    1980
aatctgccct ttcgaaagat cccaacgaaa agcgtgacca catggtcctt cttgagtttg    2040
taactgctgc tgggattaca catggcatgg atgagctcta caaatgagca tttcctacgc    2100
catgcctgaa ccgagtctga agaccgtaca gaatcactaa aagtcgtgaa acgaatacct    2160
ctttgtgcgt ctaccttgag cgagcgagag gagcgggtct tttcggcggc agtgagcctc    2220
tggcacaggc tccccggcga catggggccg tggaaccaga gcttccagcg atgacagcga    2280
cttcttcacc ctcgaggacg aggaggtctc tgccgtttgt ctcttccctc agccaccctc    2340
acactcgctg ggctcgatga gggtgcaaag cttgtcttcc ccgctcttgt ggtcctggcg    2400
tcaagctccc agcactcacg acgcctccct ctcgctctcc tcctcttcat cggctcctca    2460
gcaactctcg ctctcccagc atgtggacgg cttccgacct gtcgcgcact ttccgagcgt    2520
cattcacgag gagctactgg cggtgggaga gatctctgat ccgtttttga ggcgtaatga    2580
ggaggtacgc ttcctcgccc ccacatctca accgtcgagg aggaggtggg agccagaacg    2640
agctgactag cgagtacgtg taccgtcgca ggccgtgcaa tgggtcggcg aagcagactg    2700
gatctaccgc tgcgacttcg aggtcgagcg gctgccgaag aagcgctcga aagagggcga    2760
gggcgaggag gagagggctg acttggtgtt cgagggtctc gatacgttcg cgacggtgta    2820
ctgtgagtcg agatcgagcg ggcagacgga ttgatcgcta atacggaagt gatctcgcag    2880
tgaacggtga aagtgaatgg aggtgggaac cgcaaggtgc accatcgacc gatctggatt    2940
tttaatgatg gatttgagta agagcacgta tgttgggacc cgaaagatgg tgaactatgc    3000
ctgaataggg cgaagccaga ggaaactctg gtggaggctc gtagcggttc tgacgtgcaa    3060
atcgatcgtc aaatttgggt ataggggcga aagactaatc gaaccatcta gtagctggtt    3120
cctgccgaag tttccctcag gatagcagaa actcacatca gttctatgag gtaaagcgaa    3180
tgattagagg ccttggggtt gaaacaacct taacctattc tcaaacttta aatatgtagg    3240
aagtccttgc tacttaattg agcgaggaca tgcgaatgag agtttctagt gggccatttt    3300
tggtaagcag aactggcgat gcgggatgaa ccgaacgcga ggttaaggtg ccggaataca    3360
cgctcatcag acaccacaaa aggtgttagt tcatctagac agccgcacgg tggccatgga    3420
agtcggaatc cgctaaggag tgtgtaacaa ctcaacggcc gaatgaacta gccctgaaaa    3480
tggatggcgc tcaagcgtgt tacccatacc tcgccgtcag                          3520

Claims (9)

1.果糖-6-二磷酸醛缩酶启动子,简写为pRtFBA,其核苷酸序列具有如SEQ ID NO:1所示DNA序列的全部序列或包含该DNA序列自3’-末端起700bp以内的部分序列,或具有可与如SEQ ID NO:1所示序列的全部或其DNA序列3’-末端起700bp以内的部分序列杂交的、且保持转录启动子活性的序列,或对SEQ ID NO:1所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的,与SEQ ID NO:1所示序列具有50%以上同源性、且具有启动子活性的序列。
2.一种权利要求1所述果糖-1,6-二磷酸醛缩酶启动子pRtFBA的应用,其特征在于:SEQ ID NO:1所示的脱氧核苷酸序列可作为启动子用于构建新型酵母遗传操作系统及新的重组工程菌株,所得到的基因工程菌株携带相应的pRtFBA序列。
3.按照权利要求2所述果糖-1,6-二磷酸醛缩酶启动子pRtFBA的应用,其特征在于:所述基因工程菌株为红冬孢酵母属(Rhodosporidium)基因工程菌株,所述新型酵母遗传操作系统为圆红冬孢酵母遗传操作系统。
4.一种DNA构建体,含有权利要求1所述SEQ ID NO:1所示的脱氧核苷酸序列,或同时含有权利要求1所述SEQ ID NO:1所示的脱氧核苷酸序列和如SEQ ID NO:2所示的脱氧核苷酸序列,且SEQ ID NO:1所示序列位于SEQ ID NO:2所示序列的上游,SEQ ID NO:1和SEQ ID NO:2之间为一编码基因的开放阅读框架。
5.按照权利要求4构建体,其特征在于:所述的SEQ ID NO:2所示序列为一种果糖-1,6-二磷酸醛缩酶终止子RtFBAt。
6.按照权利要求4构建体,其特征在于:所述开放阅读框架为位于SEQID NO:1和SEQ ID NO:2之间的果糖-1,6-二磷酸醛缩酶基因的开放阅读框架,其cDNA序列具有如SEQ ID NO:3所示的脱氧核苷酸序列,其基因组DNA具有SEQ ID NO:5所示的脱氧核苷酸序列。
7.一种携带权利要求1启动子pRtFBA或权利要求4构建体的载体。
8.按照权利要求7载体,其特征在于:所述载体为质粒载体。
9.一种果糖-1,6-二磷酸醛缩酶蛋白,其具有如SEQ ID NO:4所示氨基酸序列。
CN 201010189723 2010-06-02 2010-06-02 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体 Expired - Fee Related CN102268430B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010189723 CN102268430B (zh) 2010-06-02 2010-06-02 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010189723 CN102268430B (zh) 2010-06-02 2010-06-02 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体

Publications (2)

Publication Number Publication Date
CN102268430A true CN102268430A (zh) 2011-12-07
CN102268430B CN102268430B (zh) 2013-05-15

Family

ID=45050891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010189723 Expired - Fee Related CN102268430B (zh) 2010-06-02 2010-06-02 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体

Country Status (1)

Country Link
CN (1) CN102268430B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105779445A (zh) * 2014-12-22 2016-07-20 中国科学院大连化学物理研究所 果糖-1,6-二磷酸醛缩酶启动子和终止子及其应用
CN108624600A (zh) * 2018-05-22 2018-10-09 昆明理工大学 锌指转录因子基因RkMsn4的用途
CN110066802A (zh) * 2019-04-30 2019-07-30 西南大学 具有提高出芽短梗霉代谢产物的启动子及其应用
CN111394350A (zh) * 2019-01-03 2020-07-10 中国科学院大连化学物理研究所 圆红冬孢酵母rna聚合酶iii型启动子及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1267333A (zh) * 1997-06-17 2000-09-20 孟山都公司 在转基因植物中表达果糖1,6二磷酸醛缩酶
US20050130280A1 (en) * 2003-11-14 2005-06-16 Pollak Dana M.W. Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast
US7264949B2 (en) * 2004-09-15 2007-09-04 E.I. Du Pont De Nemours And Company Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1267333A (zh) * 1997-06-17 2000-09-20 孟山都公司 在转基因植物中表达果糖1,6二磷酸醛缩酶
US20050130280A1 (en) * 2003-11-14 2005-06-16 Pollak Dana M.W. Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast
US7264949B2 (en) * 2004-09-15 2007-09-04 E.I. Du Pont De Nemours And Company Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105779445A (zh) * 2014-12-22 2016-07-20 中国科学院大连化学物理研究所 果糖-1,6-二磷酸醛缩酶启动子和终止子及其应用
CN105779445B (zh) * 2014-12-22 2018-09-28 中国科学院大连化学物理研究所 果糖-1,6-二磷酸醛缩酶启动子和终止子及其应用
CN108624600A (zh) * 2018-05-22 2018-10-09 昆明理工大学 锌指转录因子基因RkMsn4的用途
CN111394350A (zh) * 2019-01-03 2020-07-10 中国科学院大连化学物理研究所 圆红冬孢酵母rna聚合酶iii型启动子及其应用
CN110066802A (zh) * 2019-04-30 2019-07-30 西南大学 具有提高出芽短梗霉代谢产物的启动子及其应用
CN110066802B (zh) * 2019-04-30 2021-03-02 西南大学 具有提高出芽短梗霉代谢产物的启动子及其应用

Also Published As

Publication number Publication date
CN102268430B (zh) 2013-05-15

Similar Documents

Publication Publication Date Title
CN101421295B (zh) 用于提高作物植物中的氮利用效率的基因
CN102268432B (zh) 乳清酸磷酸核糖转移酶启动子及应用和构建体与载体
ES2629252T3 (es) Célula de levadura fermentadora de pentosa y glucosa
JP2005500804A (ja) イソプレノイド化合物生成に係る遺伝子
CN102268430B (zh) 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体
CN112852650A (zh) 一种高产檀香烯和檀香醇的酿酒酵母工程菌及其构建方法与应用
KR20190005707A (ko) 디옥시바이오라세인 생산능이 향상된 재조합 미생물 및 그를 이용한 디옥시바이오라세인을 생산하는 방법
CN114457094A (zh) 一种牡丹PoAGL15基因及其氨基酸序列和应用
CN107858364A (zh) 一种适于甲醇酵母表达的耐高温高比活细菌植酸酶基因
DE60118401T2 (de) Gen, das für das gumd polypeptid aus methylomonas sp. kodiert und das an der herstellung von exopolysacchariden beteiligt ist
CN102268431B (zh) 乳清酸核苷-5’-磷酸脱羧酶启动子及应用和构建体与载体
CN103204916B (zh) 甘蔗蔗糖转运蛋白ShSUT2基因与应用
CN102952821B (zh) 紫花苜蓿苹果酸通道蛋白基因MsALMT1的植物表达载体及其应用
CN112708603B (zh) 水稻are2基因在植物氮代谢调控中的应用
JP4157314B2 (ja) 酢酸耐性遺伝子、該遺伝子を用いて育種された酢酸菌、及び該酢酸菌を用いた食酢の製造方法
CN106119137B (zh) 一种改善丝状真菌蛋白分泌能力的方法
CN113736806A (zh) 提高海洋微拟球藻油脂合成的基因及其用途
CN114606170B (zh) 一种基于CRISPR-Cas9的麦角硫因生物合成方法及应用
EP1642977B1 (en) Gene involved in growth-promoting function of acetic acid bacteria and uses thereof
CN111454964A (zh) 油菜抗寒基因BnTR1及其编码蛋白与应用
CN112094858B (zh) 一种调控甘蔗钾吸收效率的SsCBL01基因及其应用
US6335188B1 (en) Endophyte ergot alkaloid synthetic compounds, compounds which encode therefor and related methods
CN113637682B (zh) OsMYB26或其突变体在提高植物干旱胁迫耐受性中的应用
CN112062822B (zh) 一种碳分解代谢调控蛋白CcpA突变体I42A
CN112852775B (zh) 一种深海真菌新型乙酰转移酶GliK及其编码基因和应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130515

CF01 Termination of patent right due to non-payment of annual fee