CN102268430A - 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体 - Google Patents
果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体 Download PDFInfo
- Publication number
- CN102268430A CN102268430A CN 201010189723 CN201010189723A CN102268430A CN 102268430 A CN102268430 A CN 102268430A CN 201010189723 CN201010189723 CN 201010189723 CN 201010189723 A CN201010189723 A CN 201010189723A CN 102268430 A CN102268430 A CN 102268430A
- Authority
- CN
- China
- Prior art keywords
- seq
- sequence
- dna
- val
- ala
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
通过扩增圆红冬孢酵母果糖-1,6-二磷酸醛缩酶基因组DNA上下游序列,进行生物学信息分析和功能验证,获得可有效表达目的基因于圆红冬孢酵母,并因此能够用于圆红冬孢酵母遗传工程操作和菌株改良的启动子和终止子。本发明还涉及包含这些元件的DNA构建体和载体。
Description
技术领域
本专利属于基因工程技术领域,具体涉及圆红冬孢酵母启动子、终止子及其用途,包括基因工程菌株构建所必需的转化方法等。
背景技术
微生物是自然界中分布最广泛的物种之一,具有卓越的生物合成能力,几乎能合成地球上所有的有机化学品。微生物的种属多样性和遗传多样性决定了其代谢多样性。与多细胞生物相比,微生物的代谢途径虽然相对简单,但其化合物的生产高效、快捷,并与人类日常生产生活关系密切。
做为某一化学品的天然生产菌株或环境治理应用菌株,其特定的生产性能往往并非最优化。如何优化或改变工业菌株的代谢网络和表达调控网络,以提高生物基产品的积累速度或定向控制靶产品的质量,是当今生物技术领域研究的热点和难点。实际上,对微生物油脂代谢过程的理解、开发和利用是否能达到或者超过化学加工水平,也是提高发酵过程经济性的关键。全基因组测序和基因工程技术的进步,为菌株生理学特性的认识和菌株改良提供了比传统诱变技术更为合理的方法。
代谢工程的实质是利用重组DNA技术和其它技术,有目的地改变已有的代谢和表达调控网络,更好地理解和利用细胞的代谢途径。代谢工程可以在细胞与分子水平上认识和改造细胞过程,其不仅可以解释细胞生理生化特性,而且还可赋于出发菌株新的性状和表型:(1)扩大底物利用范围;(2)生产原来不存在的新化合物;(3)增强对环境中毒害物质的降解能力;(4)提高菌体对环境的适应能力;(5)阻断或降低副产品的生成;(6)代谢产品生产速率和生产性能的提高等(Bailey J E.Toward a science ofmetabolic engineering.Science.1991,252(5013):1668-1675;Aristidou A, M.Metabolic engineering applications to renewable resource utilization.Curr.Opin.Biotechnol.2000,11(2):187-198)。
圆红冬孢酵母属于担子菌门异宗配合型真菌,是发酵工业中一种极为重要的微生物,可利用源于生物质的己糖和戊糖为原料生产重要的生物基产品:微生物油脂,胞内油脂可达细胞干重的60%以上(Ratledge C,WynnJ P.The biochemistry and molecular biology of lipid accumulation in oleaginousmicroorganisms.Adv.Appl.Microbiol.2002,51:1-51;Li Y,Zhao Z,Bai F.High-density cultivation of oleaginous yeast Rhodosporidium toruloides Y4infed-batch culture.Enzyme Microb.Technol.2007,41(3):312-317);工业用酶或药物合成用酶如磷酸二酯酶、苯丙氨酸解氨酶(Hodgins D S.Yeastphenylalanine ammonia-lyase.Purification,properties,and the identification ofcatalytically essential dehydroalanine.J Biol.Chem.1971,246(9):2977-2985; Gilbert H J,Clarke I N,Gibson R K,et al.Molecular cloning of the phenylalanineammonia lyase gene from Rhodosporidium toruloides in Escherichia coli K-12.JBacteriol.1985,161(1):314-320)、D氨基酸氧化酶(Gadda G,Negri A,PiloneM S.Reaction of phenylglyoxal with arginine groups in D-amino-acid oxidasefrom Rhodotorula gracilis.J Biol.Chem.1994,269(27):17809-17814;Liao G J,Lee Y J,Lee Y H,et al.Structure and expression of the D-amino-acid oxidasegene from the yeast Rhodosporidium toruloides.Biotechnol.Appl.Biochem.1998,27(Pt 1):55-61)等;β-胡萝卜素和胞外多糖;并在污水处理和生物制药中有较广泛的应用。实验结果表明,该菌可同时利用五碳糖和六碳糖为底物,抗逆性好,能直接以玉米秸秆酸水解液为碳源积累油脂,可实现生物质到生物基产品的高效转化(李永红,刘波,孙艳,等.广谱碳源产油酵母菌的筛选.中国生物工程杂志,2005,25(12):39-44)。
虽然圆红冬孢酵母具有优良的工业生产性能,同时,圆红冬孢酵母来源的蛋白酶异源表达也获得成功(Pollegioni L,Molla G,Campaner S,Cloning,sequencing and expression in E.coli of a D-amino acid oxidase cDNA fromRhodotorula gracilis active on cephalosporin C.J Biotechnol.1997,58(2):115-123;Faulkner J D,Anson J G,Tuite M F,et al.High-level expression ofthephenylalanine ammonia lyase-encoding gene from Rhodosporidium toruloidesin Saccharomyces cerevisiae and Escherichia coli using a bifunctionalexpression system.Gene.1994,143(1):13-20),但圆红冬孢酵母自身缺乏相应的遗传操作系统。以圆红冬孢酵母为宿主菌,无论是基因工程操作还是代谢工程菌株改良,都受到遗传操作系统的制约,难以进行靶向性的菌株改造。
启动子对于遗传操作系统来说必不可少。因此,如果要对圆红冬孢酵母进行遗传操作,获得能在圆红冬孢酵母中起作用的启动子是该工作的关键环节。
发明内容
鉴于上述现有技术瓶颈,本发明的主要目的是提供可用于在圆红冬孢酵母中有效表达外源基因,并且可通过遗传工程技术进行圆红冬孢酵母菌种改良的启动子和终止子。
为实现本发明的目的,本发明人对圆红冬孢酵母中的基因表达情况进行了深入研究,发现圆红冬孢酵母中FBA为一个组成型表达基因,其启动子为中强启动子。通过实验设计,结合简并PCR、染色体步移等方法,从圆红冬孢酵母染色体DNA中成功获得了包含有效启动子的DNA片段,由此完成了本发明。
具体讲,本发明包含下述实施方案(A)到(H)
(A)本发明涉及一种具有圆红冬孢酵母转录启动子活性的DNA片段,所述DNA片段具有如SEQ ID NO:1所示DNA序列的全部序列或包含该DNA序列自3’-末端起700bp以内的部分序列,或具有可与如SEQ ID NO:1 所示序列的全部或其DNA序列3’-末端起700bp以内的部分序列杂交的、且保持转录启动子活性的序列,或对SEQ ID NO:1所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的,与SEQ ID NO:1所示序列具有50%以上同源性、且具有启动子活性的序列。
(B)本发明涉及一种来自圆红冬孢酵母的DNA片段,所述DNA片段具有如下特征:(1)如SEQ ID NO:2所示的DNA序列的全部或包含该DNA序列5’-末端的部分序列;(2)或具有可与如(1)所示序列杂交的、且保持如(1)所述序列活性的序列。
(C)本发明涉及一种可完成靶基因在圆红冬孢酵母中转录起始和转录终止的DNA分子,它同时具有如(A)所述序列和如(B)所述序列,且如(B)所述序列位于如(A)所述序列的下游,与其相邻1-10000个核苷酸的DNA片段。
(D)本发明涉及一种可将靶基因与(A)-(C)所述的任一种DNA分子连接的DNA构建体,以便于靶基因能够在圆红冬孢酵母中表达的重组DNA。所述靶基因为蛋白编码核酸或反义核酸编码核酸。
(E)本发明涉及一种携带(A)-(D)所述的的DNA分子中的任意一个的载体。所述载体可以是质粒载体或粘粒载体。
(F)本发明涉及转入了如(D)所述的DNA分子或如(E)所述载体的圆红冬孢酵母或红冬孢酵母属(Rhodosporidium)真菌。
(G)本发明所涉及的的pRtFBA启动子,其来源于圆红冬孢酵母,可启动目的基因在圆红冬孢酵母中的转录和表达;本发明所述的RtFBAt终止子,其来源于圆红冬孢酵母,可终止目的基因在圆红冬孢酵母中的转录。
(H)本发明涉及编码具有果糖-1,6-二磷酸醛缩酶活性的多肽的DNA片段,其具有如SEQ ID NO:5所示序列的全部或部分核苷酸序列,编码如SEQ ID NO:4所示的蛋白质序列。
使用本发明的具有启动子活性的DNA分子和具有转录终止子活性的DNA,可实现外源基因或内源基因在圆红冬孢酵母中的表达,本发明提供了用于遗传工程圆红冬孢酵母改造的启动子、终止子和载体。为圆红冬孢酵母开启了一条育种新途径,并因此可以提供具有工业用途的新型圆红冬孢酵母。
附图说明
图1表示RtFBA简并PCR产物的琼脂糖凝胶电泳的结果。
图2表示pRtFBA启动子DNA片段的琼脂糖凝胶电泳的结果。
图3表示RtFBAt终止子DNA片段的琼脂糖凝胶电泳的结果。
图4表示RtFBA基因的琼脂糖凝胶电泳的结果。
图5表示GFPuv在圆红冬孢酵母单倍体菌株ATCC 10788中的表达结果。
图6是质粒pFBAGFP的结构图。
图7是GFPuv在R.babjevae ATCC90942中的表达结果。
图8是圆红冬孢酵母果糖-1,6-二磷酸醛缩酶的晶体结构模型,其表明三维结构正确。
下面结合具体实施例对本发明作进一步详细说明。
具体实施方式
在本文中,“启动子”是指能够被RNA聚合酶识别、结合并能启动基因转录的DNA序列。术语“启动子”还可理解为:包括5’非编码区、顺式作用元件(如增强子)以及其它能与转录因子结合的核苷酸序列。
启动子的存在或强度通常是通过启动子活性表示,其测定方法:将报告基因(如绿色荧光蛋白)连接于所述启动子的下游,并将该DNA构建体转化相应宿主细胞,检测报告基因表达量。如果人们观察到连接于所述启动子下游报告基因的表达,就可以认为所述启动子在它所转化的宿主细胞内有活性。
在本文中,“终止子”是指染色体上提供终止信号使RNA聚合酶与DNA模板分离而使转录终止的一段DNA序列。可以通过诸如Northern杂交或RT-PCR的方法检查所转录RNA的大小而确认终止子的存在。或通过“启动子-报告基因-终止子”构建体使报告基因有效表达而确定终止子的活性。
本发明中的“圆红冬孢酵母”,包括属于该“物种”的任何二倍体和单倍体,野生型菌株和营养缺陷型菌株。本发明中的“红冬孢酵母属真菌”,没有具体限制,其例子包括归属于该属的真菌,除圆红冬孢酵母外,如Rhodosporidium azoricum,Rhodosporidium babjevae,Rhodosporidiumsphaerocarpum。
本发明的“目的基因”,包括能够在圆红冬孢酵母中表达的蛋白编码序列,反义RNA编码序列和核酸酶编码序列。能够在圆红冬孢酵母中表达的蛋白编码序列的例子包括源于圆红冬孢酵母的核酸序列,且并不局限于此。本发明的目的基因还包括来源于其它微生物、植物和动物的蛋白编码序列。
本发明中的启动子具有如SEQ ID NO:1所示DNA序列的全部序列或包含该DNA序列自3’-末端起700bp以内的部分序列,或具有可与如SEQ IDNO:1所示序列的全部或其DNA序列3’-末端起700bp以内的部分序列杂交的、且保持转录启动子活性的序列,或对SEQ ID NO:1所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的,与SEQ IDNO:1所示序列具有50%以上同源性、且具有启动子活性的序列。
本发明中的终止子具有如SEQ ID NO:2所示的DNA序列的全部或包含该DNA序列5’-末端的部分序列,或具有可与如SEQ ID NO:2所示序列的全部或其DNA序列5’-末端的部分序列杂交的、且保持转录终止子活性的序列,或对SEQ ID NO:2所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的,与SEQ ID NO:2所示序列具有50%以上同源性、且具有终止子活性的序列。
本发明中的启动子-目的基因的构建体、目的基因-终止子的构建体或启动子-目的基因-终止子的构建体,可以直接或经载体介导转化圆红冬孢酵母,以便于目的基因表达,可以优选质粒载体作为介导载体。
本发明的启动子可以按照以下方面从圆红冬孢酵母中分离。
下面结合附图及实施例对本发明作进一步说明,将有助于本领域的普通技术人员理解本发明,但不以任何形式限制本发明。下述实施例中所有引物合成及测序工作,如无特别说明则均由大连TakaRa公司完成。
实施例1:圆红冬孢酵母ATCC 10788总RNA的提取
将新鲜圆红冬孢酵母R.toruloides ATCC 10788(购自美国标准生物品收藏中心,ATCC)由斜面接种到50ml YEPD液体培养基中,于30℃摇床培养24h,再以1∶50的体积比例将菌液分别转接到100ml YEPD液体培养基中,于30℃摇床培养12h达对数生长期。在4℃下,5000rpm离心4min,收集菌体,用液氮迅速冷冻菌体,研磨破壁。使用TakaRa公司RNAiso试剂盒,并按照其标准步骤提取总RNA。
RNA进行1.5%琼脂糖凝胶电泳,使用荧光-紫外分析仪观察鉴定,可见清晰的两条带。用紫外/可见光光谱仪分析总RNA样品,测得OD260/OD280=2.01,表明总RNA质量很好。总RNA样品冻存于-80℃,备用。
实施例2:圆红冬孢酵母ATCC 10788cDNA第一链合成和FBA简并PCR
以圆红冬孢酵母R.toruloides ATCC 10788总RNA为模板,反转录合成cDNA第一链。首先,将1.0μl总RNA(约2μg),1.0μl引物SMART IV:5′-AAGCAGTGGTATCAACGCAGAGTGGCCATTACGGCCGGG-3′和1.0μloligo dT-接头引物CDS III/3′:5′-ATTCTAGAGGCCGAGGCGGCCGACATG-d(T)30N-1N-3′,2.0μl DEPC处理水(焦碳酸二乙酯处理水,购自大连TakaRa公司),加入到PCR管中混匀,于72℃保温2min,立即置于冰上冷却2min,将2.0μl 5×first strandbuffer(Clontech公司),1.0μl DTT(20mM),1.0μl dNTP(10mM),1.0μlpowerscript reverse transcriptase(Clontech公司)加入到体系中,混匀。于42℃延伸反应60min,最后4℃结束反应,存于-20℃,备用。
设计合成两条简并引物FBA-sense:5′-ATGGG(AGCT)GT(AGCT)(CT)T(AGCT)GA(CT)GT(ACT)GTCCC -3′和FBA-anti:5′-TTA(AGCT)A(AG)(AGCT)GT(AG)CCCTCGGA-3′,以反转录合成的cDNA第一链为模板,进行FBA基因的简并PCR扩增,10×PCR缓冲液5.0μl,dNTPs(10mM)1.0μl,FBA-sense引物(50mmol/l)1.0μl,FBA-anti引物(50mmol/l)1.0ul,rTaq酶(大连TakaRa)0.5μl,合成的cDNA第一链模板1.0μl,ddH2O 40.5μl,于94℃保温3min,然后于94℃30s,57℃45s,72℃1min,35个循环,72℃10min,4℃结束反应。扩增产物进行1%(质量/体积 浓度)琼脂糖凝胶电泳,观察到1kb左右的条带(图1),利用DNA回收试剂盒(购自碧云天),按照供应商建议步骤纯化PCR产物。PCR产物参照大连TakaRa公司提供的方法克隆到pMD18-T载体(购自大连TakaRa),转化入E.coli DH5α感受态细胞,其中感受态细胞按氯化钙法(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序,序列结果推测出的氨基酸序列经Blastp分析,证实为果糖-1,6-二磷酸醛缩酶序列,如SEQ ID NO:4序列所示。果糖-1,6-二磷酸醛缩酶cDNA序列如SEQ ID NO:3序列所示。
实施例3:RtFBA基因组DNA的扩增
1 R.toruloides ATCC 10788(购自美国标准生物品收藏中心,ATCC)的基因组DNA提取采用玻璃珠破壁法(精编分子生物学实验指南第三版第13章,奥斯伯等著,颜子颖等译,科学出版社出版)。制备好的基因组DNA,利用Nanodrop 1000测定,测得OD260/OD280=1.85,表明基因组DNA质量很好。浓度为120ng/μl,共500μl,基因组DNA样品冻存于-20℃,备用。
2根据实施例2中获得的果糖-1,6-二磷酸醛缩酶cDNA序列,设计1对基因特异性引物,FBA-ORF-p1:5’-ATGGGTGTCCTCGATGTTGTCCC-3’和FBA-ORF-p2:5’-TTAGAGGGTTCCCTCGGAGCGGAGG-3’,以圆红冬孢酵母ATCC10788的基因组DNA为模板,按照常规方法进行PCR扩增,得到约1.8kb的PCR产物(图略)。PCR扩增产物按照实施例2的操作步骤回收、克隆到pMD18-T载体,并进行测序,得到如序列表SEQ ID NO:5所示的DNA序列。经与实施例2中获得的果糖-1,6-二磷酸醛缩酶cDNA序列比对,证实该基因片段为其果糖-1,6-二磷酸醛缩酶基因组DNA序列,含5个内含子和6个外显子。
实施例4:染色体步移获得RtFBA基因5’翼侧序列(启动子)
本实施例利用Genome Walking Kit(购自大连TakaRa)完成。
根据实施例3中得到的FBADNA序列,设计3条Specific Primer(基因特异性引物)分别为FBA-SP1:5’-GCGAGGACTGGTAACGCACAGGGAT-3’,FBA-SP2:5’-CGCTGCGGGTTCGCTCAATGT-3’和FBA-SP3:5’-GCCTGCGGGAGCAAGGTGAGC-3’,做为下游引物,按照试剂盒说明书进行以下操作。
11stPCR反应
以实施例3中精制的基因组DNA为模板,进行第一轮扩增。反应体系50μl:10×LA PCR buffer II(Mg2+plus,大连TakaRa)5.0μl,dNTPs(2.5mmol/l)8.0μl,LA Taq DNA聚合酶(5U/μl,大连TakaRa)1.0μl,AP1 Primer(100μmol/l,大连TakaRa)1.0μl,FBA-SP1(10μmol/l)1.0μl,R.toruloides ATCC 10788基因组DNA模板(120ng/μl)1.0μl,ddH2O加至50μl。反应条件:先进行5个高温退火温度的高特异性反应,然后进行1个极低退火温度的低特异性反应;然后进行热不对称PCR:2个高退火温度(65℃)的高特异性反应和1个低退火温度(44℃)的低特异性反应交替循环,共15次。具体参数如下:94℃1min,98℃1min;94℃30s,65℃1min,72℃2min,共5个循环;94℃30s,25℃3min,72℃2min;94℃30s,65℃1min,72℃2min,94℃30s,65℃1min,72℃2min,94℃30s,44℃1min,72℃2min,共15个循环;72℃10min,结束反应。
22nd巢式PCR反应
反应体系50μl:10×LA PCR buffer II(Mg2+plus,大连TakaRa)5.0μl,dNTPs(2.5mmol/l)8.0μl,LA Taq DNA聚合酶(5U/μl,大连TakaRa)1.0μl,AP1 Primer(100μmol/l,大连TakaRa)1.0μl,1st PCR反应产物1.0μl,FBA-SP2(10μmol/l)1.0μl,ddH2O加至50μl。反应条件:94℃30s,65℃1min,72℃2min,94℃30s,65℃1min,72℃2min,94℃30s,44℃1min,72℃2min,共15个循环;72℃10min,结束反应。
33rd巢式PCR反应
反应体系50μl:10×LA PCR buffer II(Mg2+plus,大连TakaRa)5.0μl,dNTPs(2.5mmol/l)8.0μl,LA Taq DNA聚合酶(5U/μl,大连TakaRa)1.0μl,AP1 Primer(100μmol/l,大连TakaRa)1.0μl,2nd巢式PCR反应产物1.0μl,FBA-SP3(10μmol/l)1.0μl,ddH2O加至50μl。反应条件:94℃30s,65℃1min,72℃2min,94℃30s,65℃1min,72℃2min,94℃30s,44℃1min,72℃2min,共15个循环;72℃10min,结束反应。
3rd巢式PCR反应产物经1%(质量/体积浓度)琼脂糖凝胶电泳后切割目的条带,利用DNA片段凝胶纯化试剂盒(购自碧云天)进行纯化。纯化后的DNA片段经TA克隆插入pMD18-T载体(购自大连TakaRa公司),转化DH5α感受态细胞;其中感受态细胞按氯化钙法(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序,得到如SEQ ID NO:1所示的DNA序列,证实为预期的pRtFBA基因序列。
序列号:1(SEQ ID NO:1)
序列长度:853bp
序列类型:DNA
来源:圆红冬孢酵母(Rhodosporidium toruloides)
1 GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC
61 TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG
121 CTGTTCGGCA GTTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC
181 GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG
241 AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG
301 GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG
361 TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC
421 TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC
481 ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT
541 CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT
601 TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG
661 AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA
721 AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG
781 CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA
841 CTAACTAGCT ACA
实施例5:染色体步移获得RtFBA基因3’翼侧序列(终止子)
本实施例也是利用Genome Walking Kit(购自大连TakaRa)完成。
根据实施例3中得到的FBADNA序列,设计3条Specific Primer(基因特异性引物)分别为FBA-SP11:5’-GTGTCGTCAAGATGAACGGTGCG-3’,FBA-SP22:5’-CGCCGACAAGCCCAACAAGAAGC-3’和FBA-SP33:5’-CGCGTCTGGGTCCGTGAGGGTG-3’,做为上游引物,按照试剂盒说明书进行3’翼侧染色体步移操作,除Specific Primer分别由FBA-SP1,FBA-SP2,FBA-SP3依次更换为FBA-SP11,FBA-SP22,FBA-SP33外,其它同实施例4。
3rd巢式PCR反应产物利用DNA片段凝胶纯化试剂盒(购自碧云天)进行纯化,经TA克隆插入pMD18-T载体(购自大连TakaRa公司),转化DH5α感受态细胞;其中感受态细胞按氯化钙法(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序,得到如SEQ ID NO:2所示的DNA序列,证实为预期的RtFBAt基因序列。
实施例6:RtFBA启动子-开放阅读框架-终止子全长基因获得
根据实施例4和实施例5中获得的启动子和终止子序列,重新设计一对引物进行RtFBA“启动子-开放阅读框架-终止子”全长基因的扩增。pRtFBAt-p1:5’-GCTGACGGTACTCGTTTCGCAGAC-3’,pRtFBAt-p2:5’-TCGGTCCCCAATCCCAGCCATAGT-3’。以实施例1中制备的R.toruloides基因组DNA为模板进行PCR扩增。PCR体系(50μl):10×Speed buffer(大连TakaRa)5.0μl,dNTPs(10mmol/l)1.0μl,上游引物RtFBA-p1(10μmol/l)2.0μl,下游引物RtFBA-p2(10μmol/l)2.0μl,SpeedSTARTMHS DNA聚合酶(扩增速度快,1kb/10s,购自大连TakaRa公司)0.5μl,基因组DNA模板(120ng/μl)2μl,ddH2O加至50μl。反应条件:98℃1min,98℃10s,65℃1.0min,35个循环,72℃10min,4℃结束反应。PCR产物经1%(质量/体积浓度)琼脂糖凝胶电泳分析后利用PCR片段纯化试剂盒(购自碧云天)进行纯化。片段经TA克隆插入pMD18-T载体(购自大连TakaRa公司),转化DH5α感受态细胞;其中感受态细胞按氯化钙法(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序,得到如SEQ ID NO:6所示的DNA序列,证实为预期的 pRtFBAt全长序列,该重组载体命名为T-FBA 3.7k。
实施例7:FBAgfp圆红冬孢酵母特异性绿色荧光蛋白表达盒的构建
1.绿色荧光蛋白编码基因GFPuv的获得
以pGFPuv质粒(购自BD Biosciences)为模板,利用寡核苷酸gfp-p1:5’-ATGAGTAAAGGAGAAGAACT-3′和gfp-p2:5’-TCATTTGTAGAGCTCAT CCAT-3’为引物,进行PCR扩增。体系(50μl):5×Prime buffer(大连TakaRa)10.0μl,dNTPs(2.5mmol/l)4.0μl,上游引物gfp-p1(10μmol/l)2.0μl,下游引物gfp-p2(10μmol/l)2.0μl,PrimeSTARTM HS DNA聚合酶(大连TakaRa)1.0μl,pGFPuv质粒(120ng/μl)1μl,ddH2O加至50μl。反应条件:95℃3min,98℃8s,49℃15s,72℃1min,35个循环,72℃10min,4℃结束反应。PCR反应产物利用DNA片段胶回收纯化试剂盒纯化,利用taq DNA聚合酶进行DNA片段3’末端加A,体系(50μl):10×PCR buffer(大连TakaRa)5.0μl,dNTPs(2.5mmol/l)4.0μl,纯化后的GFPuv DNA片段30μl,ddH2O加至50μl。反应条件:72℃30min,4℃结束反应。3’末端加A后的GFPuv DNA片段利用DNA片段胶回收纯化试剂盒纯化,克隆入pMD18-T载体,送大连TakaRa公司测序,得到如SEQ ID NO:7所示的DNA序列,证实为预期的GFPuv基因序列。
2.RF克隆法构建圆红冬孢酵母特异性绿色荧光蛋白表达盒FBAgfp
圆红冬孢酵母特异性绿色荧光蛋白表达盒FBAgfp的构建利用的是RF克隆(Van den Ent,F.,Lowe,J.,2006.RF cloning:A restriction-free method forinserting target genes into plasmids.J.Biochem.Biophys.Methods 67:67-74;Yang F,Zhang S,Tang W,Zhao Z,2008.Identification of theorotidine-5′-monophosphate decarboxylase gene of the oleaginous yeastRhodosporidium toruloides.Yeast 25(9):623-630)的方法。
FBA全长序列扩增和克隆见实施例6。
参照文献方法(Van den Ent,F.,Lowe,J.,2006.RF cloning:Arestriction-free method for inserting target genes into plasmids.J.Biochem.Biophys.Methods 67:67-74),设计RF克隆引物:FBA-gfp-p1:5′-CTTCTAACACTAACTAGCT ACAatgagtaaaggagaagaact-3′和FBA-gfp-p1:5′-GCGAGAAGAGAAGAG GGTATCGACtcatttgtagagctcatccat-3′(其中大写字母部分序列与pRtFBAt克隆载体中原有的FBA ORF翼侧序列互补,小写字母部分序列与绿色荧光蛋白GFPuv ORF互补)。
RF I反应体系及流程:以本实施例操作项1中构建的GFPuv的TA克隆载体为模板,利用FBAgfp-p1和FBAgfp-p2为引物,进行RF第一轮扩增。体系(50μl):5×Prime buffer(大连TakaRa)10.0μl,dNTPs(2.5mmol/l)4.0μl,上游引物(10μmol/l)2.0μl,下游引物(10μmol/l)2.0μl,PrimeSTARTM HS DNA聚合酶(大连TakaRa)1.0μl,T-GFPuv质粒(100 ng/μl)1μl,ddH2O加至50μl。反应条件:95℃3min,98℃8s,49℃15s,72℃1min,35个循环,72℃10min,4℃结束反应。RF I反应产物利用DNA片段胶回收纯化试剂盒纯化,-20℃保存备用。
RF II反应:5×Prime buffer(大连TakaRa)10.0μl,dNTPs(2.5mmol/l)4.0μl,实施例5中构建的T-FBA 3.7k质粒(100ng/μl)1.0μl,本实施例前述步骤中RF I反应产物(100ng/μl)5.0μl,PrimeSTARTM HS DNA聚合酶(大连TakaRa)1.0μl,ddH2O加至50μl。反应条件:95℃3min,68℃12min,之后95℃30s,65℃45s(-1℃/cyc),68℃12min,15个循环,接下来再进行一轮:95℃30s,55℃45s,68℃12min,20个循环,72℃10min,4℃结束反应。
DpnI消化和电击转化:取8μl RF II反应产物加入1μl DpnI(购自NewEngland Biolabs)和1μl DpnI buffer,混匀后在37℃作用120min去除原T-FBA 3.7k质粒后,分别取2μl电击转化DH5α感受态细胞,感受态细胞按标准方法制备(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版),电击转化参数:2200-2500V,400Ω,25μF,0℃,4-8ms。挑选Amp抗性转化子进行增菌培养、质粒提取,并利用RF I反应所用引物FBAgfp-p1和FBAgfp-p2进行菌落PCR鉴定,鉴定阳性的重组载体送大连TakaRa进行测序,得到5’端和3’端分别为FBA启动子和FBA终止子的FBAgfp表达盒,同时,该重组载体命名为T-FBAgfp。完整的FBAgfp表达盒如SEQ ID NO:8所示。
实施例8:FBAgfp表达盒的功能验证
也即pRtFBA启动子和RtFBAt终止子的活性测定。
在此利用26SrDNA基因做为靶基因,利用FBAgfp表达盒进行26SrDNA-FBAgfp基因表达盒的构建,表达盒5’和3’末端分别携带有500bp的同源重组臂。PCR扩增制备的大量26SrDNA-FBAgfp基因表达盒线性DNA片段,经电击转化圆红冬孢酵母,观察荧光蛋白的表达。
1.Rt26SrDNA基因的获得
参考GenBank序列信息(NCBI NO:DQ832198),设计1对引物进行圆红冬孢酵母核糖体大亚基26SrDNA编码基因的钓取。上游引物Rt26S-p1:5’-AAGGATTCCCCTAGTAGCGGCGAGC-3’,下游引物Rt26S-p2:5’-CTGACGGCGAGGTATGGGTAACACG-3’。
以实施例3中制备的R.toruloides基因组DNA为模板,利用基因特异性引物Rt26S-p1和Rt26S-p2进行PCR扩增。PCR体系(50μl):10×Speedbuffer(大连TakaRa)5.0μl,dNTPs(10mmol/l)1.0μl,上游引物(10μmol/l)2.0μl,下游引物(10μmol/l)2.0μl,SpeedSTARTM HS DNA聚合酶(扩增速度快,1kb/10s,购自大连TakaRa公司)0.5μl,基因组DNA模板(120ng/μl)2μl,ddH2O加至50μl。反应条件:98℃1min,98℃10s,65℃45s,35个循环,72℃10min,4℃结束反应。
PCR产物经1%(质量/体积浓度)琼脂糖凝胶电泳分析后利用PCR片段纯化试剂盒(购自碧云天)进行纯化。纯化后的pRtFBADNA片段经TA克隆插入pMD18-T载体(购自大连TakaRa公司),转化DH5α感受态细胞;其中感受态细胞按氯化钙法(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版)制备。挑选Amp抗性转化子进行增菌培养、质粒提取。重组质粒样品送至大连TakaRa公司测序,得到如SEQ IDNO:9所示的DNA序列,证实为预期的Rt26SrDNA基因序列。
2.Rt26SrDNA-FBAgfp基因表达盒的构建
Rt26SrDNA-FBAgfp基因表达盒的构建也是采用RF克隆(Van den Ent,F.,Lowe,J.,2006.RF cloning:A restriction-free method for inserting targetgenes into plasmids.J.Biochem.Biophys.Methods 67:67-74)的方法。
参照文献方法(Van den Ent,F.,Lowe,J.,2006.RF cloning:Arestriction-free method for inserting target genes into plasmids.J.Biochem.Biophys.Methods 67:67-74),设计RF克隆引物:Rt26SrDNA-FBAgfp-p1:5′-ACTTAGGATGCTGGTGGAATGGCgatgaactgccggacaaaggag-3′和Rt26SrDNA-FBAgfp-p2:5′-GTTCCCACCTCCATTCACTTTCAccgttcactgcgagatcacttcc-3′(其中大写字母部分序列与pRt26SrDNA克隆载体中原有的26SrDNA序列5’末端和3’末端互补,小写字母部分序列与绿色荧光蛋白GFPuv ORF互补)。
RF I反应体系及流程:以实施例7中FBAgfp的TA克隆载体为模板,利用FBAgfp-p1和FBAgfp-p2为引物,进行RF第一轮扩增。体系(50μl):5×Prime buffer(大连TakaRa)10.0μl,dNTPs(2.5mmol/l)4.0μl,上游引物(10μmol/l)2.0μl,下游引物(10μmol/l)2.0μl,PrimeSTARTMHS DNA聚合酶(大连TakaRa)1.0μl,pFBAgfp质粒(源自实施例7,100ng/μl)1μl,ddH2O加至50μl。反应条件:95℃3min,98℃8s,49℃15s,72℃1min,35个循环,72℃10min,4℃结束反应。RF I反应产物利用DNA片段胶回收纯化试剂盒纯化,-20℃保存备用。
RF II反应:5×Prime buffer(大连TakaRa)10.0μl,dNTPs(2.5mmol/l)4.0μl,实施例5中构建的T-Rt26SrDNA质粒(100ng/μl)1.0μl,本实施例前述步骤中RF I反应产物(100ng/μl)5.0μl,PrimeSTARTM HS DNA聚合酶(大连TakaRa)1.0μl,ddH2O加至50μl。反应条件:95℃3min,68℃12min,之后95℃30s,65℃45s(-1℃/cyc),68℃12min,15个循环,接下来再进行一轮:95℃30s,55℃45s,68℃12min,20个循环,72℃10min,4℃结束反应。
DpnI消化和电击转化:取8μl RF II反应产物加入1μl DpnI(购自NewEngland Biolabs)和1μl DpnI buffer混匀后在37℃作用120min去除原T-Rt26SrDNA质粒后,分别取2μl电击转化DH5α感受态细胞,感受态细胞按标准方法制备(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等 译,科学出版社出版),电击转化参数:2200-2500V,400Ω,25μF,0℃,4-8ms。挑选Amp抗性转化子进行增菌培养、质粒提取,并利用RF I反应所用引物Rt26SrDNA-p1和Rt26SrDNA-p2进行菌落PCR鉴定,鉴定阳性的重组载体送大连TakaRa进行测序,得到5’端和3’端分别为Rt26SrDNA 5’末端和3’末端的Rt26SrDNA-FBAgfp敲除盒,同时,该重组载体命名为T-Rt26SrDNA-FBAgfp。GFPuv ORF序列如SEQ ID NO:7所示;完整的Rt26SrDNA-FBAgfp表达盒(或敲除盒)如SEQ ID NO:10所示。
3.Rt26SrDNA-FBAgfp表达盒的制备
以构建的T-Rt26SrDNA-FBAgfp载体为模板,以寡核苷酸序列Rt26S-p1和Rt26S-p2为引物,进行Rt26SrDNA-FBAgfp表达盒的大量制备。PCR体系(500μl):10×Speed buffer(大连TakaRa)50.0μl,dNTPs(10mmol/l)10.0μl,上游引物(10μmol/l)20.0μl,下游引物(10μmol/l)20.0μl,SpeedSTARTM HS DNA聚合酶(扩增速度快,1kb/10s,购自大连TakaRa公司)5.0μl,基因组DNA模板(120ng/μl)15.0μl,ddH2O加至500μl。反应条件:98℃1min,98℃10s,65℃60s,35个循环,72℃10min,4℃结束反应。
PCR产物经1%(质量/体积浓度)琼脂糖凝胶电泳分析后利用PCR片段纯化试剂盒(购自碧云天)进行纯化。纯化后的DNA片段浓度在300ng/μl,共50μl,-20℃保存备用。
4.单倍体圆红冬孢酵母ATCC 10788感受态细胞制备
R.toruloides np11感受态细胞的制备:R.toruloides ATCC 10788(购自美国标准生物品收藏中心ATCC)菌株挑菌落接种10ml YEPD培养基(葡萄糖20.0g/l,酵母提取物10.0g/l,蛋白胨20.0g/l,pH 6.0),30℃,200rpm,培养20h;培养物1∶50比例转接新鲜YEPD培养基,100ml(500ml锥形瓶,装液量100ml),30℃,200rpm,培养6-9h,OD值达到0.6-1.2;培养物冰浴10-30min,4℃,4000rpm离心5min,弃上清;0℃无菌Milli-Q水洗1次;0℃1mol/l山梨醇洗涤2次;冰浴,备用。
5.圆红冬孢酵母ATCC 10788的电击转化
Rt26SrDNA-FBAgfp表达盒的电击转化:取100μl R.toruloides ATCC10788感受态细胞,加入Rt26SrDNA-FBAgfp表达盒10μl(总共3μg),混匀后移入预冷至0℃的电击杯中,参数:电压0.8-2.0千伏,电阻200Ω,电容25μF,时间4-10ms;电击后立即加入1ml YEPD,30℃温育1-2h;涂布YEPD平板,10μl/平板,30℃培养28-36h;逐一挑单克隆利用荧光显微镜进行镜检,阳性重组子的荧光相片如图5所示。
6.转化子的鉴定
阳性重组子接种10ml YEPD培养基(葡萄糖20.0g/l,酵母提取物10.0g/l,蛋白胨20.0g/l,pH 6.0),30℃,200rpm,培养24h;分别取2ml培养物,8000rpm离心5min,弃上清;菌体重悬于2ml 0℃ Milli-Q水,4 ℃,4000rpm,4min,弃上清;重复3次;菌体重悬于200μl破菌缓冲液(2%Triton X-100,1%SDS,100mmol/l NaCl,10mmol/l Tris-Cl,pH8.0,1mmol/lEDTA),200μl Tris饱和酚∶氯仿∶异戊醇(25∶24∶1),冰浴5min;于涡旋振荡器(美国Vortex-Genie 2涡旋振荡器,购自基因公司)最大涡旋度振荡lmin,冰浴1min,间隔进行,重复约10次,直至显微镜镜检破菌率达到90%以上;加入200μl TE缓冲液,混匀;13000rpm,12min,上清移入洁净1.5ml离心管,加入2倍体积无水乙醇,颠倒混匀,13000rpm,10min;弃上清,DNA沉淀用75%乙醇洗涤2次,室温晾干,TER缓冲液(含1μg/mlRNAse A的TE缓冲液)溶解,制成模板基因组DNA,-20℃保存备用。
以新制备的上述基因组DNA为模板,进行重组子的PCR鉴定,所用引物Rt26S-p1和Rt26S-p2。PCR体系(25μl):10×Speed buffer(大连TakaRa)2.5μl,dNTPs(10mmol/l)0.5μl,上游引物(10μmol/l)1.0μl,下游引物(10μmol/l)1.0μl,SpeedSTARTM HS DNA聚合酶(扩增速度快,1kb/10s,购自大连TakaRa公司)0.25μl,基因组DNA模板(100ng/μl)1.0μl,ddH2O加至50μl。反应条件:98℃1min,98℃10s,65℃60s,35个循环,72℃10min,4℃结束反应。结果显示,重组圆红冬孢酵母的PCR扩增产物将为3.8kb左右和1.2kb左右的两条带,野生型圆红冬孢酵母的PCR扩增产物将为1.2kb左右的一条带(图略)。
实施例9:FBAgfp表达盒在R.babjevae的功能验证
序列比对分析发现,R.toruloides 26SrDNA和R.babjevae 26SrDNA之间的序列同源性为94%,所以,利用实施例8中构建的Rt26SrDNA-FBAgfp表达盒直接转化R.babjevae,通过荧光观察便可验证Rt26SrDNA-FBAgfp表达盒在R.babjevae中的有效性,也即pRtFBA启动子和RtFBAt终止子的属内活性测定。
1.R.babjevae ATCC90942感受态细胞制备
R.babjevae ATCC90942购自购自美国标准生物品收藏中心。首先,挑菌落接种10ml YEPD培养基,28℃,200rpm,培养24h;培养物1∶50比例转接新鲜YEPD培养基,100ml(500ml锥形瓶,装液量100ml),28℃,200rpm,培养7-10h,OD值达到0.6-1.2;培养物冰浴10-30min,4℃,4000rpm离心5min,弃上清;0℃无菌Milli-Q水洗1次;0℃1mol/l山梨醇洗涤2次;冰浴,备用。
2.R.babjevae ATCC90942的电击转化
取100μl R.babjevae ATCC90942感受态细胞,加入实施例8中制备的Rt26SrDNA-FBAgfp表达盒10μl(总共3μg),电击参数和电击后操作同实施例8;逐一挑单克隆利用荧光显微镜进行镜检,阳性重组子的荧光相片如图7所示。
3.转化子的鉴定
荧光重组子接种10ml YEPD培养基,28℃,200rpm,培养24h;分 别取2ml培养物,8000rpm离心5min,弃上清;基因组DNA的制备同实施例8中的操作项6,基因组DNA于-20℃保存备用。
利用引物Rt26S-p1和Rt26S-p2(详见实施例8)进行重组子的PCR鉴定。PCR体系(25μl)和扩增条件同实施例8。结果显示,重组圆红冬孢酵母的PCR扩增产物将为3.8kb左右和1.2kb左右的两条带,野生型圆红冬孢酵母的PCR扩增产物将为1.2kb左右的一条带(图略)。
以上实施例证明:RtFBA启动子能够启动GFPuv在R.toruloides ATCC10788和R.babjevae ATCC90942中的荧光表达;以FBAgfp表达盒为基础构建的Rt26SrDNA-FBAgfp敲除盒,能够敲除红冬孢酵母属酵母基因组上的Rt26SrDNA靶基因的部分拷贝。
使用本发明的启动子和终止子,可实现目的基因在圆红冬孢酵母中的表达或特定靶基因(如26S rDNA)的敲除,为圆红冬孢酵母开启了一条育种新途径,并因此可以提供具有工业用途的新型圆红冬孢酵母。并为红冬孢酵母属的其它酵母菌的遗传操作提供了方法和平台。
实施例10:圆红冬孢酵母果糖-1,6-二磷酸醛缩酶RtFBA的结构表征
参考分子克隆实验指南第三版(萨姆布鲁克著,黄培堂等译,科学出版社出版)经分子排阻、离子交换纯化得到圆红冬孢酵母果糖-1,6-二磷酸醛缩酶RtFBA。纯化后的RtFBA晶体的生长通过室温下的悬滴法获得。经条件优化后参数如下:RtFBA蛋白溶液12mg/ml(含20mM的磷酸甘油氧肟酸(phosphoglycolo-hydroxamate,PGH),预先冰浴30min)和等体积的生晶母液(0.1M Tris-HCl(pH 8.8),0.2M Mgcl2,18-23%(w/v)聚乙二醇2000)混合,4-8周内出现正交晶体。用多波长反常散射法(MAD)确定位相,MAD数据在ADSC Quantum-4R CCD探测器上收集,所有数据用DPS软件包进行统一,用CCP4软件包进行坐标修正与处理。模型用XtalView 4.0软件在Silicon Graphics OCTANE上构建和校正,用REFMAC程序进行精化。圆红冬孢酵母果糖-1,6-二磷酸醛缩酶RtFBA晶体属于空间群C2221,晶格常数为 根据衍射数据得到三维结构模型见图8。
本发明的有益效果是:
为圆红冬孢酵母或红冬孢酵母属的酵母菌提供了启动子、终止子、GFP表达盒和遗传转化方法,将有力促进今后的圆红冬孢酵母或红冬孢酵母属酵母菌的菌株改良研究,加快圆红冬孢酵母代谢工程研究。
SEQ ID NO:1
GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC 60
TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG 120
CTGTTCGGCA GTTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC 180
GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG 240
AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG 300
GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG 360
TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC 420
TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC 480
ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT 540
CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT 600
TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG 660
AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA 720
AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG 780
CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA 840
CTAACTAGCT ACA 853
SEQ ID NO:2
GCATTTCCTA CGCCATGCCT GAACCGAGTC TGAAGACCGT ACAGAATCAC TAAAAGTCGT 60
GAAACGAATA CCTCTTTGTG CGTCTACCTT GAGCGAGCGA GAGGAGCGGG TCTTTTCGGC 120
GGCAGTGAGC CTCTGGCACA GGCTCCCCGG CGACATGGGG CCGTGGAACC AGAGCTTCCA 180
GCGATGACAG CGACTTCTTC ACCCTCGAGG ACGAGGAGGT CTCTGCCGTT TGTCTCTTCC 240
CTCAGCCACC CTCACACTCG CTGGGCTCGA TGAGGGTGCA AAGCTTGTCT TCCCCGCTCT 300
TGTGGTCCTG GCGTCAAGCT CCCAGCACTC ACGACGCCTC CCTCTCGCTC TCCTCCTCTT 360
CATCGGCTCC TCAGCAACTC TCGCTCTCCC AGCATGTGGA CGGCTTCCGA CCTGTCGCGC 420
ACTTTCCGAG CGTCATTCAC GAGGAGCTAC TGGCGGTGGG AGAGATCTCT GATCCGTTTT 480
TGAGGCGTAA TGAGGAGGTA CGCTTCCTCG CCCCCACATC TCAACCGTCG AGGAGGAGGT 540
GGGAGCCAGA ACGAGCTGAC TAGCGAGTAC GTGTACCGTC GCAGGCCGTG CAATGGGTCG 600
GCGAAGCAGA CTGGATCTAC CGCTGCGACT TCGAGGTCGA GCGGCTGCCG AAGAAGCGCT 660
CGAAAGAGGG CGAGGGCGAG GAGGAGAGGG CTGACTTGGT GTTCGAGGGT CTCGATACGT 720
TCGCGACGGT GTACTGTGAG TCGAGATCGA GCGGGCAGAC GGATTGATCG CTAATACGGA 780
AGTGATCTCG CAGTGAACGG CGACAAGATC CTCGAGGCCG ACAACATGTT CCGTGAATGG 840
CGGTGAGTCG TCGCTTGAGG CTTCACACTT CGTATGCACC ATGTGAGTCT GCTGCAGACG 900
TTGATGTGGC AGCCCGTGGA CCATCCACAG TGTCCCGCTT CGATGCTCGC AACTCCGCCA 960
CGGCCGCAAC TTGCTGTACA TCGTCTTTCA CTCAGCGTT 999
SEQ ID NO:3(RtFBA的cDNA序列)
ATGGGTGTCC TCGATGTTGT CCCCGCCGGC GTCCTCACCG GCAAGAACCT CGTCAAGTTG 60
ATGGACTACG CTCGCGAGAA CCACAACTGC ACCTCGTCGT CGACCGTCGT CGCCGCCCTC 120
GAGGCCGCCC GCGACTCCAA GTCGCCCGTC ATCATCCAGG TCTCGCAGGG TGGTGCCGCC 180
TTCTTCGCCG GGAAGGGTGT CGCCAACGAC AAGCAGCAGG CTTCCATCGC CGGTGCCGTC 240
GCCGCCGCCC ACTACGTCCG CTCCATCGCT CCCACCTATG GCGTCCCCGT CGTGCTGCAC 300
AGCGACCACT GTGCGAAGAA GCTCCTCCAA TGGTTCGACG GCATGCTCGA GGCCGACGAG 360
GCTTACTACA AGGAGAAGGG CGAGCCTCTC TTCTCTACTT TGAGCGCATG GCCAAGGTCG 420
ACCTCTGGCT CGAGATGGAG ATTGGCATCA CCGGTGGTGA GGAGGACGGT GTCGACAACA 480
CTGGTGAGTG CGCGTGCCTT TCGAGTGTCT ATTGACGAGA CTGACGATCA GGGGACAGGC 540
GTCGACAACA ACTCGCTCTA CACCCAGCCC GAGGACATCC TCGACATCCA CAACGCCCTC 600
TCCAAGATCT CGCCCATGTT CTCGATCGCT GCCGGCTTCG GCAACGTCCA CGGCGTCTAC 660
AAGCCTGGCA ACGTCAAGCT CCGTCCCGAG CTCCTCGAGA AGCACCAGAA GTACTGCCAC 720
GAGCAGCTCA AGTCGAAGAA CCCCCTCCCC ATCTACCTCG TCTTCCACGG CGGTTCGGGA 780
TCGTCCAAGG ACGAGATCAC TACCGCTGTC AAGAACGGTG TCGTCAAGAT GAACGTCGAC 840
ACCGACACCC AGTGGGCATA CATGATCGGC TTCCGCGACT ACTTCAAGTC CAAGGCCGCG 900
TACCTCGAGA CCCAGGTCGG TAACCCCGAG GGCGCCGACA AGCCCAACAA GAAGCAGTAC 960
GACCCGCGCG TCTGGGTCCG TGAGGGTGAG AAGACGATGA AGGAGCGCTG CCAGGTCGCC 1020
TTCAAGGACC TCCGCTCCGA GGGAACCCTC TAA 1053
SEQ ID NO:4
Met Gly Val Leu Asp Val Val Pro Ala Gly Val Leu Thr Gly Lys
Asn Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn His Asn Cys
Thr Ser Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala Arg Asp
Ser Lys Ser Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala Ala
Phe Phe Ala Gly Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser
Ile Ala Gly Ala Val Ala Ala Ala His Tyr Val Arg Ser Ile Ala
Pro Thr Tyr Gly Val Pro Val Val Leu His Ser Asp His Cys Ala
Lys Lys Leu Leu Gln Trp Phe Asp Gly Met Leu Glu Ala Asp Glu
Ala Tyr Tyr Lys Glu Lys Gly Glu Pro Leu Phe Ser Thr Leu Ser
Ala Trp Pro Arg Ser Thr Ser Gly Ser Arg Trp Arg Leu Ala Ser
Pro Val Val Arg Arg Thr Val Ser Thr Thr Leu Val Ser Ala Arg
Ala Phe Arg Val Ser Ile Asp Glu Thr Asp Asp Gln Gly Thr Gly
Val Asp Asn Asn Ser Leu Tyr Thr Gln Pro Glu Asp Ile Leu Asp
Ile His Asn Ala Leu Ser Lys Ile Ser Pro Met Phe Ser Ile Ala
Ala Gly Phe Gly Asn Val His Gly Val Tyr Lys Pro Gly Asn Val
Lys Leu Arg Pro Glu Leu Leu Glu Lys His Gln Lys Tyr Cys His
Glu Gln Leu Lys Ser Lys Asn Pro Leu pro Ile Tyr Leu Val Phe
His Gly Gly Ser Gly Ser Ser Lys Asp GluIle Thr Thr Ala Val
Lys Asn Gly Val Val Lys Met Asn Val Asp Thr Asp Thr Gln Trp
Ala Tyr Met Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys Ala Ala
Tyr Leu Glu Thr Gln Val Gly Asn Pro Glu Gly Ala Asp Lys Pro
Asr Lys Lys Gln Tyr Asp Pro Arg Val Trp Val Arg Glu Gly Glu
Lys Thr Met Lys Glu Arg Cys Gln Val Ala Phe Lys Asp Leu Arg
Ser Glu Gly Thr Leu
SEQ ID NO:5
ATGGGTGTCC TCGATGTTGT CCCCGCGTAA GCATCACACG CTCCCACTGC AGCACCCGCA 60
CCCGCTCACC TTGCTCCCGC AGGCGTACGT CCCCTCCGCC CCGTCATACC CCTCCCGGCT 120
TCTCTCGAGT CGCGCTCGCC CACAACACCG CGCGGACGGC TGGGAACAGA ATGGCAGGAT 180
CGGGGAATAG CATGCTCACA TTGAGCGAAC CCGCAGCGGC GTCCTCACCG GCAAGAACCT 240
CGTCAAGTTG ATGGACTACG CTCGCGAGAA CCACGTCCGT CTTCTTCCGA CTCGCTCACG 300
AGTGACTGTG CGCTGACCTG CAGCCTCGCG TTTGAGACAG TTCGCCATCC CTGTGCGTTA 360
CCAGTCCTCG CGAACGGGCG CCGCGCTCTC GCCGTCGCAC GCTTGACGTC GCGAGGGTCG 420
GTCGCTGATG AGATGGATGA GATCAAGCTG ACCCCGCCTT TTCCACTCCG CTTTTCTCCC 480
TTCTCCAGGC CTTCGTGAGT CCCTCTCACA CCGTTTGACG CCGGGAGCGA GCGACGGGCT 540
GACCCGGGAC GTTGCGCGCA AACCAGAACT GCACCTCGTC GTCGACCGTC GTCGCCGCCC 600
TCGAGGCCGC CCGCGACTCC AAGTCGCCCG TCATCATCCA GGTCTCGCAG GGTGGTGCCG 660
CCTTCTTCGC CGGGAAGGGT GTCGCCAACG ACAAGCAGCA GGCTTCCATC GCCGGTGCCG 720
TCGCCGCCGC CCACTACGTC CGCTCCATCG CTCCCACCTA TGGCGTCCCC GTCGTGCTGC 780
ACAGCGACCA CTGTGCGAAG AAGCTCCTCC AATGGTTCGA CGGCATGCTC GAGGCCGACG 840
AGGCTTACTA CAAGGAGAAG GGCGAGCCTC TCTTCTCGTA AAGACGCGCT TCCTCTTCCT 900
CGCCTTGGAC TGGGCTAACG GGCATATCAC AGGTCGCACA TGCTCGACCT TTCGGAGGAG 960
TCAAAGGAGG AGAACATCGA GACTTGCGTC AAGTACTTTG AGCGCATGGC CAAGGTCGAC 1020
CTCTGGCTCG AGATGGAGAT TGGCATCACC GGTGGTGAGG AGGACGGTGT CGACAACACT 1080
GGTGAGTGCG CGTGCCTTTC GAGTGTCTAT TGACGAGACT GACGATCAGG GGACAGGCGT 1140
CGACAACAAC TCGCTCTACA CCCAGCCCGA GGACATCCTC GACATCCACA ACGCCCTCTC 1200
CAAGATCTCG CCCATGTTCT CGATCGCTGC CGGCTTCGGC AACGTCCACG GCGTCTACAA 1260
GCCTGGCAAC GTCAAGCTCC GTCCCGAGCT CCTCGAGAAG CACCAGAAGT ACTGCCACGA 1320
GCAGCTCAAG TCGAAGAACC CCCTCCCCAT CTACCTCGTC TTCCACGGCG GTTCGGGATC 1380
GTCCAAGGAC GAGATCACTA CCGCTGTCAA GAACGGTGTC GTCAAGATGA ACGGTGCGCG 1440
ACGACTTTTC GCGGACTTGC GACTCCCGAG TGCTGACTTG GCTTCTGCCT TCTCCGCTTT 1500
TTCACTTGGC TTCTGCCTTC TCCGCTTCTC TTCTTGTCCC TACAGTCGAC ACCGACACCC 1560
AGTGGGCATA CATGATCGGC TTCCGCGACT ACTTCAAGTC CAAGGCCGCG TACCTCGAGA 1620
CCCAGGTCGG TAACCCCGAG GGCGCCGACA AGCCCAACAA GAAGCAGTAC GACCCGTAAG 1680
TCGATACCCT CTTCTCTTCT CGCCCGGCCT CTGACGAGAC TCTTTGTTGT CCAGGCGCGT 1740
CTGGGTCCGT GAGGGTGAGA AGACGATGAA GGAGCGCTGC CAGGTCGCCT TCAAGGACCT 1800
CCGCTCCGAG GGAACCCTCT AA 1822
SEQ ID NO:6
GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC 60
TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG 120
CTGTTCGGCA GTTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC 180
GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG 240
AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG 300
GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG 360
TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC 420
TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC 480
ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT 540
CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT 600
TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG 660
AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA 720
AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG 780
CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA 840
CTAACTAGCT ACAATGGGTG TCCTCGATGT TGTCCCCGCG TAAGCATCAC ACGCTCCCAC 900
TGCAGCACCC GCACCCGCTC ACCTTGCTCC CGCAGGCGTA CGTCCCCTCC GCCCCGTCAT 960
ACCCCTCCCG GCTTCTCTCG AGTCGCGCTC GCCCACAACA CCGCGCGGAC GGCTGGGAAC 1020
AGAATGGCAG GATCGGGGAA TAGCATGCTC ACATTGAGCG AACCCGCAGC GGCGTCCTCA 1080
CCGGCAAGAA CCTCGTCAAG TTGATGGACT ACGCTCGCGA GAACCACGTC CGTCTTCTTC 1140
CGACTCGCTC ACGAGTGACT GTGCGCTGAC CTGCAGCCTC GCGTTTGAGA CAGTTCGCCA 1200
TCCCTGTGCG TTACCAGTCC TCGCGAACGG GCGCCGCGCT CTCGCCGTCG CACGCTTGAC 1260
GTCGCGAGGG TCGGTCGCTG ATGAGATGGA TGAGATCAAG CTGACCCCGC CTTTTCCACT 1320
CCGCTTTTCT CCCTTCTCCA GGCCTTCGTG AGTCCCTCTC ACACCGTTTG ACGCCGGGAG 1380
CGAGCGACGG GCTGACCCGG GACGTTGCGC GCAAACCAGA ACTGCACCTC GTCGTCGACC 1440
GTCGTCGCCG CCCTCGAGGC CGCCCGCGAC TCCAAGTCGC CCGTCATCAT CCAGGTCTCG 1500
CAGGGTGGTG CCGCCTTCTT CGCCGGGAAG GGTGTCGCCA ACGACAAGCA GCAGGCTTCC 1560
ATCGCCGGTG CCGTCGCCGC CGCCCACTAC GTCCGCTCCA TCGCTCCCAC CTATGGCGTC 1620
CCCGTCGTGC TGCACAGCGA CCACTGTGCG AAGAAGCTCC TCCAATGGTT CGACGGCATG 1680
CTCGAGGCCG ACGAGGCTTA CTACAAGGAG AAGGGCGAGC CTCTCTTCTC GTAAAGACGC 1740
GCTTCCTCTT CCTCGCCTTG GACTGGGCTA ACGGGCATAT CACAGGTCGC ACATGCTCGA 1800
CCTTTCGGAG GAGTCAAAGG AGGAGAACAT CGAGACTTGC GTCAAGTACT TTGAGCGCAT 1860
GGCCAAGGTC GACCTCTGGC TCGAGATGGA GATTGGCATC ACCGGTGGTG AGGAGGACGG 1920
TGTCGACAAC ACTGGTGAGT GCGCGTGCCT TTCGAGTGTC TATTGACGAG ACTGACGATC 1980
AGGGGACAGG CGTCGACAAC AACTCGCTCT ACACCCAGCC CGAGGACATC CTCGACATCC 2040
ACAACGCCCT CTCCAAGATC TCGCCCATGT TCTCGATCGC TGCCGGCTTC GGCAACGTCC 2100
ACGGCGTCTA CAAGCCTGGC AACGTCAAGC TCCGTCCCGA GCTCCTCGAG AAGCACCAGA 2160
AGTACTGCCA CGAGCAGCTC AAGTCGAAGA ACCCCCTCCC CATCTACCTC GTCTTCCACG 2220
GCGGTTCGGG ATCGTCCAAG GACGAGATCA CTACCGCTGT CAAGAACGGT GTCGTCAAGA 2280
TGAACGGTGC GCGACGACTT TTCGCGGACT TGCGACTCCC GAGTGCTGAC TTGGCTTCTG 2340
CCTTCTCCGC TTTTTCACTT GGCTTCTGCC TTCTCCGCTT CTCTTCTTGT CCCTACAGTC 2400
GACACCGACA CCCAGTGGGC ATACATGATC GGCTTCCGCG ACTACTTCAA GTCCAAGGCC 2460
GCGTACCTCG AGACCCAGGT CGGTAACCCC GAGGGCGCCG ACAAGCCCAA CAAGAAGCAG 2520
TACGACCCGT AAGTCGATAC CCTCTTCTCT TCTCGCCCGG CCTCTGACGA GACTCTTTGT 2580
TGTCCAGGCG CGTCTGGGTC CGTGAGGGTG AGAAGACGAT GAAGGAGCGC TGCCAGGTCG 2640
CCTTCAAGGA CCTCCGCTCC GAGGGAACCC TCTAAGCATT TCCTACGCCA TGCCTGAACC 2700
GAGTCTGAAG ACCGTACAGA ATCACTAAAA GTCGTGAAAC GAATACCTCT TTGTGCGTCT 2760
ACCTTGAGCG AGCGAGAGGA GCGGGTCTTT TCGGCGGCAG TGAGCCTCTG GCACAGGCTC 2820
CCCGGCGACA TGGGGCCGTG GAACCAGAGC TTCCAGCGAT GACAGCGACT TCTTCACCCT 2880
CGAGGACGAG GAGGTCTCTG CCGTTTGTCT CTTCCCTCAG CCACCCTCAC ACTCGCTGGG 2940
CTCGATGAGG GTGCAAAGCT TGTCTTCCCC GCTCTTGTGG TCCTGGCGTC AAGCTCCCAG 3000
CACTCACGAC GCCTCCCTCT CGCTCTCCTC CTCTTCATCG GCTCCTCAGC AACTCTCGCT 3060
CTCCCAGCAT GTGGACGGCT TCCGACCTGT CGCGCACTTT CCGAGCGTCA TTCACGAGGA 3120
GCTACTGGCG GTGGGAGAGA TCTCTGATCC GTTTTTGAGG CGTAATGAGG AGGTACGCTT 3180
CCTCGCCCCC ACATCTCAAC CGTCGAGGAG GAGGTGGGAG CCAGAACGAG CTGACTAGCG 3240
AGTACGTGTA CCGTCGCAGG CCGTGCAATG GGTCGGCGAA GCAGACTGGA TCTACCGCTG 3300
CGACTTCGAG GTCGAGCGGC TGCCGAAGAA GCGCTCGAAA GAGGGCGAGG GCGAGGAGGA 3360
GAGGGCTGAC TTGGTGTTCG AGGGTCTCGA TACGTTCGCG ACGGTGTACT GTGAGTCGAG 3420
ATCGAGCGGG CAGACGGATT GATCGCTAAT ACGGAAGTGA TCTCGCAGTG AACGGCGACA 3480
AGATCCTCGA GGCCGACAAC ATGTTCCGTG AATGGCGGTG AGTCGTCGCT TGAGGCTTCA 3540
CACTTCGTAT GCACCATGTG AGTCTGCTGC AGACGTTGAT GTGGCAGCCC GTGGACCATC 3600
CACAGTGTCC CGCTTCGATG CTCGCAACTC CGCCACGGCC GCAACTTGCT GTACATCGTC 3660
TTTCACTCAG CGTT 3674
SEQ ID NO:7(绿色荧光蛋白编码基因)
ATGAGTAAAG GAGAAGAACT TTTCACTGGA GTTGTCCCAA TTCTTGTTGA ATTAGATGGT 60
GATGTTAATG GGCACAAATT TTCTGTCAGT GGAGAGGGTG AAGGTGATGC AACATACGGA 120
AAACTTACCC TTAAATTTAT TTGCACTACT GGAAAACTAC CTGTTCCATG GCCAACACTT 180
GTCACTACTT TCTCTTATGG TGTTCAATGC TTTTCCCGTT ATCCGGATCA TATGAAACGG 240
CATGACTTTT TCAAGAGTGC CATGCCCGAA GGTTATGTAC AGGAACGCAC TATATCTTTC 300
AAAGATGACG GGAACTACAA GACGCGTGCT GAAGTCAAGT TTGAAGGTGA TACCCTTGTT 360
AATCGTATCG AGTTAAAAGG TATTGATTTT AAAGAAGATG GAAACATTCT CGGACACAAA 420
CTCGAGTACA ACTATAACTC ACACAATGTA TACATCACGG CAGACAAACA AAAGAATGGA 480
ATCAAAGCTA ACTTCAAAAT TCGCCACAAC ATTGAAGATG GATCCGTTCA ACTAGCAGAC 540
CATTATCAAC AAAATACTCC AATTGGCGAT GGCCCTGTCC TTTTACCAGA CAACCATTAC 600
CTGTCGACAC AATCTGCCCT TTCGAAAGAT CCCAACGAAA AGCGTGACCA CATGGTCCTT 660
CTTGAGTTTG TAACTGCTGC TGGGATTACA CATGGCATGG ATGAGCTCTA CAAATAA 717
SEQ ID NO:8
GCTGACGGTA CTCGTTTCGC AGACAACCCG CTCGAGATGA ACTGCCGGAC AAAGGAGGAC 60
TTTTCGGCTC TCGCCGTCGC CCTGTCCGAT TCTCTGATCC AGAAGCACGC CGGCTCGAAG 120
CTGTTCGGCA ATTTTGTCGA CGAGCTCGCC CGCCTGCTCG CCGCGCCGCT CAAGTCGGAC 180
GAGGTGGGCA AGGTGCGCGC GAGTATGGCC AACCTCGCGA TGGACAAGCA GAAGCTCGAG 240
AAGGCTGGCG CGAAGGGCGG CGCAGTCGGT GGGAAGCCCC CTGCGAGGAT GGTCGCGAGG 300
GGCAGGGAGG ACTTGTCGTC GTTCGGAGAG GTGCTCGACG ACGATGTCGC CGCGGCCCAG 360
TTCGACGAGG ACGAGGATTT CGTGCGTCGC TTTCGCTCGC TCGCTGGTTG CTCCTGTCTC 420
TTCTGCTTCT CACGCTGACT CTCATCGTGC CCGTCTCACT GCAGATGTAG ATGTAGACGC 480
ACCTCCTCCA GCTTCACCTG CTTCCAACCT TTTCCACCGC CTGCAACCGC ACTTTCGCCT 540
CGTTCCTTCG GACTCTTGCG GCTGCGATGT TGTCCAGCAT CGACAGGAGC TGCTTTACTT 600
TCGCTTGACC TGCTTGCCAC CTGGTGCTCG CACGATGCCA TATATCGCGA GGGAGGCGAG 660
AGAGCGGAGT TGGCTGGATG ACGCTCGCTC CGGCTTGCAG CTGGTTGTTA CGGTGTTGCA 720
AGAATTTCTG TGCAGTTTGT ACGAGTGGCC CCGCGTTGTG GATGATGTCG GTTCGGTTGG 780
CACGGCCTTG CTCGCTCGCT CTCTCGTTGC TCCTCGCTCT TCACCACTTC ACTTCTAACA 840
CTAACTAGCT ACAATGAGTA AAGGAGAAGA ACTTTTCACT GGAGTTGTCC CAATTCTTGT 900
TGAATTAGAT GGTGATGTTA ATGGGCACAA ATTTTCTGTC AGTGGAGAGG GTGAAGGTGA 960
TGCAACATAC GGAAAACTTA CCCTTAAATT TATTTGCACT ACTGGAAAAC TACCTGTTCC 1020
ATGGCCAACA CTTGTCACTA CTTTCTCTTA TGGTGTTCAA TGCTTTTCCC GTTATCCGGA 1080
TCATATGAAA CGGCATGACT TTTTCAAGAG TGCCATGCCC GAAGGTTATG TACAGGAACG 1140
CACTATATCT TTCAAAGATG ACGGGAACTA CAAGACGCGT GCTGAAGTCA AGTTTGAAGG 1200
TGATACCCTT GTTAATCGTA TCGAGTTAAA AGGTATTGAT TTTAAAGAAG ATGGAAACAT 1260
TCTCGGACAC AAACTCGAGT ACAACTATAA CTCACACAAT GTATACATCA CGGCAGACAA 1320
ACAAAAGAAT GGAATCAAAG CTAACTTCAA AATTCGCCAC AACATTGAAG ATGGATCCGT 1380
TCAACTAGCA GACCATTATC AACAAAATAC TCCAATTGGC GATGGCCCTG TCCTTTTACC 1440
AGACAACCAT TACCTGTCGA CACAATCTGC CCTTTCGAAA GATCCCAACG AAAAGCGTGA 1500
CCACATGGTC CTTCTTGAGT TTGTAACTGC TGCTGGGATT ACACATGGCA TGGATGAGCT 1560
CTACAAATGA GCATTTCCTA CGCCATGCCT GAACCGAGTC TGAAGACCGT ACAGAATCAC 1620
TAAAAGTCGT GAAACGAATA CCTCTTTGTG CGTCTACCTT GAGCGAGCGA GAGGAGCGGG 1680
TCTTTTCGGC GGCAGTGAGC CTCTGGCACA GGCTCCCCGG CGACATGGGG CCGTGGAACC 1740
AGAGCTTCCA GCGATGACAG CGACTTCTTC ACCCTCGAGG ACGAGGAGGT CTCTGCCGTT 1800
TGTCTCTTCC CTCAGCCACC CTCACACTCG CTGGGCTCGA TGAGGGTGCA AAGCTTGTCT 1860
TCCCCGCTCT TGTGGTCCTG GCGTCAAGCT CCCAGCACTC ACGACGCCTC CCTCTCGCTC 1920
TCCTCCTCTT CATCGGCTCC TCAGCAACTC TCGCTCTCCC AGCATGTGGA CGGCTTCCGA 1980
CCTGTCGCGC ACTTTCCGAG CGTCATTCAC GAGGAGCTAC TGGCGGTGGG AGAGATCTCT 2040
GATCCGTTTT TGAGGCGTAA TGAGGAGGTA CGCTTCCTCG CCCCCACATC TCAACCGTCG 2100
AGGAGGAGGT GGGAGCCAGA ACGAGCTGAC TAGCGAGTAC GTGTACCGTC GCAGGCCGTG 2160
CAATGGGTCG GCGAAGCAGA CTGGATCTAC CGCTGCGACT TCGAGGTCGA GCGGCTGCCG 2220
AAGAAGCGCT CGAAAGAGGG CGAGGGCGAG GAGGAGAGGG CTGACTTGGT GTTCGAGGGT 2280
CTCGATACGT TCGCGACGGT GTACTGTGAG TCGAGATCGA GCGGGCAGAC GGATTGATCG 2340
CTAATACGGA AGTGATCTCG CAGTGAACGG CGACAAGATC CTCGAGGCCG ACAACATGTT 2400
CCGTGAATGG CGGTGAGTCG TCGCTTGAGG CTTCACACTT CGTATGCACC ATGTGAGTCT 2460
GCTGCAGACG TTGATGTGGC AGCCCGTGGA CCATCCACAG TGTCCCGCTT CGATGCTCGC 2520
AACTCCGCCA CGGCCGCAAC TTGCTGTACA TCGTCTTTCA CTCAGCGTT 2569
SEQ ID NO:9
AAGGATTCCC CTAGTAGCGG CGAGCGAAGC GGGAAGAGCT CAAATTTATA ATCTGGCACC 60
TTCGGTGTCC GAGTTGTAAT CTCTAGAAAT GTTTTCCGCG TTGGACCGCA CACAAGTCTG 120
TTGGAATACA GCGGCATAGT GGTGAGACCC CCGTATATGG TGCGGACGCC CAGCGCTTTG 180
TGATACATTT TCGAAGAGTC GAGTTGTTTG GGAATGCAGC TCAAATTGGG TGGTAAATTC 240
CATCTAAAGC TAAATATTGG CGAGAGACCG ATAGCGAACA AGTACCGTGA GGGAAAGATG 300
AAAAGCACTT TGGAAAGAGA GTTAACAGTA CGTGAAATTG TTGGAAGGGA AACGCTTGAA 360
GTCAGACTTG CTTGCCGAGC AATCGGTTTG CAGGCCAGCA TCAGTTTTCC GGGATGGATA 420
ATGGTAGAGA GAAGGTAGCA GTTTCGGCTG TGTTATAGCT CTCTGCTGGA TACATCTTGG 480
GGGACTGAGG AACGCAGTGT GCCTTTGGCG GGGGTTTCGA CCTCTTCACA CTTAGGATGC 540
TGGTGGAATG GCTTTAAACG ACCCGTCTTG AAACACGGAC CAAGGAGTCT AACATGCTTG 600
CGAGTATTTG GGTGTCAAAC CCGGATGCGT AATGAAAGTG AATGGAGGTG GGAACCGCAA 660
GGTGCACCAT CGACCGATCT GGATTTTTAA TGATGGATTT GAGTAAGAGC ACGTATGTTG 720
GGACCCGAAA GATGGTGAAC TATGCCTGAA TAGGGCGAAG CCAGAGGAAA CTCTGGTGGA 780
GGCTCGTAGC GGTTCTGACG TGCAAATCGA TCGTCAAATT TGGGTATAGG GGCGAAAGAC 840
TAATCGAACC ATCTAGTAGC TGGTTCCTGC CGAAGTTTCC CTCAGGATAG CAGAAACTCA 900
CATCAGTTCT ATGAGGTAAA GCGAATGATT AGAGGCCTTG GGGTTGAAAC AACCTTAACC 960
TATTCTCAAA CTTTAAATAT GTAGGAAGTC CTTGCTACTT AATTGAGCGA GGACATGCGA 1020
ATGAGAGTTT CTAGTGGGCC ATTTTTGGTA AGCAGAACTG GCGATGCGGG ATGAACCGAA 1080
CGCGAGGTTA AGGTGCCGGA ATACACGCTC ATCAGACACC ACAAAAGGTG TTAGTTCATC 1140
TAGACAGCCG CACGGTGGCC ATGGAAGTCG GAATCCGCTA AGGAGTGTGT AACAACTCAA 1200
CGGCCGAATG AACTAGCCCT GAAAATGGAT GGCGCTCAAG CGTGTTACCC ATACCTCGCC 1260
GTCAG 1265
SEQ ID NO:10
AAGGATTCCC CTAGTAGCGG CGAGCGAAGC GGGAAGAGCT CAAATTTATA ATCTGGCACC 60
TTCGGTGTCC GAGTTGTAAT CTCTAGAAAT GTTTTCCGCG TTGGACCGCA CACAAGTCTG 120
TTGGAATACA GCGGCATAGT GGTGAGACCC CCGTATATGG TGCGGACGCC CAGCGCTTTG 180
TGATACATTT TCGAAGAGTC GAGTTGTTTG GGAATGCAGC TCAAATTGGG TGGTAAATTC 240
CATCTAAAGC TAAATATTGG CGAGAGACCG ATAGCGAACA AGTACCGTGA GGGAAAGATG 300
AAAAGCACTT TGGAAAGAGA GTTAACAGTA CGTGAAATTG TTGGAAGGGA AACGCTTGAA 360
GTCAGACTTG CTTGCCGAGC AATCGGTTTG CAGGCCAGCA TCAGTTTTCC GGGATGGATA 420
ATGGTAGAGA GAAGGTAGCA GTTTCGGCTG TGTTATAGCT CTCTGCTGGA TACATCTTGG 480
GGGACTGAGG AACGCAGTGT GCCTTTGGCG GGGGTTTCGA CCTCTTCACA CTTAGGATGC 540
TGGTGGAATG GCGATGAACT GCCGGACAAA GGAGGACTTT TCGGCTCTCG CCGTCGCCCT 600
GTCCGATTCT CTGATCCAGA AGCACGCCGG CTCGAAGCTG TTCGGCAATT TTGTCGACGA 660
GCTCGCCCGC CTGCTCGCCG CGCCGCTCAA GTCGGACGAG GTGGGCAAGG TGCGCGCGAG 720
TATGGCCAAC CTCGCGATGG ACAAGCAGAA GCTCGAGAAG GCTGGCGCGA AGGGCGGCGC 780
AGTCGGTGGG AAGCCCCCTG CGAGGATGGT CGCGAGGGGC AGGGAGGACT TGTCGTCGTT 840
CGGAGAGGTG CTCGACGACG ATGTCGCCGC GGCCCAGTTC GACGAGGACG AGGATTTCGT 900
GCGTCGCTTT CGCTCGCTCG CTGGTTGCTC CTGTCTCTTC TGCTTCTCAC GCTGACTCTC 960
ATCGTGCCCG TCTCACTGCA GATGTAGATG TAGACGCACC TCCTCCAGCT TCACCTGCTT 1020
CCAACCTTTT CCACCGCCTG CAACCGCACT TTCGCCTCGT TCCTTCGGAC TCTTGCGGCT 1080
GCGATGTTGT CCAGCATCGA CAGGAGCTGC TTTACTTTCG CTTGACCTGC TTGCCACCTG 1140
GTGCTCGCAC GATGCCATAT ATCGCGAGGG AGGCGAGAGA GCGGAGTTGG CTGGATGACG 1200
CTCGCTCCGG CTTGCAGCTG GTTGTTACGG TGTTGCAAGA ATTTCTGTGC AGTTTGTACG 1260
AGTGGCCCCG CGTTGTGGAT GATGTCGGTT CGGTTGGCAC GGCCTTGCTC GCTCGCTCTC 1320
TCGTTGCTCC TCGCTCTTCA CCACTTCACT TCTAACACTA ACTAGCTACA ATGAGTAAAG 1380
GAGAAGAACT TTTCACTGGA GTTGTCCCAA TTCTTGTTGA ATTAGATGGT GATGTTAATG 1440
GGCACAAATT TTCTGTCAGT GGAGAGGGTG AAGGTGATGC AACATACGGA AAACTTACCC 1500
TTAAATTTAT TTGCACTACT GGAAAACTAC CTGTTCCATG GCCAACACTT GTCACTACTT 1560
TCTCTTATGG TGTTCAATGC TTTTCCCGTT ATCCGGATCA TATGAAACGG CATGACTTTT 1620
TCAAGAGTGC CATGCCCGAA GGTTATGTAC AGGAACGCAC TATATCTTTC AAAGATGACG 1680
GGAACTACAA GACGCGTGCT GAAGTCAAGT TTGAAGGTGA TACCCTTGTT AATCGTATCG 1740
AGTTAAAAGG TATTGATTTT AAAGAAGATG GAAACATTCT CGGACACAAA CTCGAGTACA 1800
ACTATAACTC ACACAATGTA TACATCACGG CAGACAAACA AAAGAATGGA ATCAAAGCTA 1860
ACTTCAAAAT TCGCCACAAC ATTGAAGATG GATCCGTTCA ACTAGCAGAC CATTATCAAC 1920
AAAATACTCC AATTGGCGAT GGCCCTGTCC TTTTACCAGA CAACCATTAC CTGTCGACAC 1980
AATCTGCCCT TTCGAAAGAT CCCAACGAAA AGCGTGACCA CATGGTCCTT CTTGAGTTTG 2040
TAACTGCTGC TGGGATTACA CATGGCATGG ATGAGCTCTA CAAATGAGCA TTTCCTACGC 2100
CATGCCTGAA CCGAGTCTGA AGACCGTACA GAATCACTAA AAGTCGTGAA ACGAATACCT 2160
CTTTGTGCGT CTACCTTGAG CGAGCGAGAG GAGCGGGTCT TTTCGGCGGC AGTGAGCCTC 2220
TGGCACAGGC TCCCCGGCGA CATGGGGCCG TGGAACCAGA GCTTCCAGCG ATGACAGCGA 2280
CTTCTTCACC CTCGAGGACG AGGAGGTCTC TGCCGTTTGT CTCTTCCCTC AGCCACCCTC 2340
ACACTCGCTG GGCTCGATGA GGGTGCAAAG CTTGTCTTCC CCGCTCTTGT GGTCCTGGCG 2400
TCAAGCTCCC AGCACTCACG ACGCCTCCCT CTCGCTCTCC TCCTCTTCAT CGGCTCCTCA 2460
GCAACTCTCG CTCTCCCAGC ATGTGGACGG CTTCCGACCT GTCGCGCACT TTCCGAGCGT 2520
CATTCACGAG GAGCTACTGG CGGTGGGAGA GATCTCTGAT CCGTTTTTGA GGCGTAATGA 2580
GGAGGTACGC TTCCTCGCCC CCACATCTCA ACCGTCGAGG AGGAGGTGGG AGCCAGAACG 2640
AGCTGACTAG CGAGTACGTG TACCGTCGCA GGCCGTGCAA TGGGTCGGCG AAGCAGACTG 2700
GATCTACCGC TGCGACTTCG AGGTCGAGCG GCTGCCGAAG AAGCGCTCGA AAGAGGGCGA 2760
GGGCGAGGAG GAGAGGGCTG ACTTGGTGTT CGAGGGTCTC GATACGTTCG CGACGGTGTA 2820
CTGTGAGTCG AGATCGAGCG GGCAGACGGA TTGATCGCTA ATACGGAAGT GATCTCGCAG 2880
TGAACGGTGA AAGTGAATGG AGGTGGGAAC CGCAAGGTGC ACCATCGACC GATCTGGATT 2940
TTTAATGATG GATTTGAGTA AGAGCACGTA TGTTGGGACC CGAAAGATGG TGAACTATGC 3000
CTGAATAGGG CGAAGCCAGA GGAAACTCTG GTGGAGGCTC GTAGCGGTTC TGACGTGCAA 3060
ATCGATCGTC AAATTTGGGT ATAGGGGCGA AAGACTAATC GAACCATCTA GTAGCTGGTT 3120
CCTGCCGAAG TTTCCCTCAG GATAGCAGAA ACTCACATCA GTTCTATGAG GTAAAGCGAA 3180
TGATTAGAGG CCTTGGGGTT GAAACAACCT TAACCTATTC TCAAACTTTA AATATGTAGG 3240
AAGTCCTTGC TACTTAATTG AGCGAGGACA TGCGAATGAG AGTTTCTAGT GGGCCATTTT 3300
TGGTAAGCAG AACTGGCGAT GCGGGATGAA CCGAACGCGA GGTTAAGGTG CCGGAATACA 3360
CGCTCATCAG ACACCACAAA AGGTGTTAGT TCATCTAGAC AGCCGCACGG TGGCCATGGA 3420
AGTCGGAATC CGCTAAGGAG TGTGTAACAA CTCAACGGCC GAATGAACTA GCCCTGAAAA 3480
TGGATGGCGC TCAAGCGTGT TACCCATACC TCGCCGTCAG 3520
果糖.ST25
SEQUENCE LISTING
<110>中国科学院大连化学物理研究所
<120>果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体
<130>
<160>10
<170>PatentIn version 3.1
<210>1
<211>853
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>promoter
<222>(154)..(853)
<223>
<400>1
gctgacggta ctcgtttcgc agacaacccg ctcgagatga actgccggac aaaggaggac 60
ttttcggctc tcgccgtcgc cctgtccgat tctctgatcc agaagcacgc cggctcgaag 120
ctgttcggca gttttgtcga cgagctcgcc cgcctgctcg ccgcgccgct caagtcggac 180
gaggtgggca aggtgcgcgc gagtatggcc aacctcgcga tggacaagca gaagctcgag 240
aaggctggcg cgaagggcgg cgcagtcggt gggaagcccc ctgcgaggat ggtcgcgagg 300
ggcagggagg acttgtcgtc gttcggagag gtgctcgacg acgatgtcgc cgcggcccag 360
ttcgacgagg acgaggattt cgtgcgtcgc tttcgctcgc tcgctggttg ctcctgtctc 420
ttctgcttct cacgctgact ctcatcgtgc ccgtctcact gcagatgtag atgtagacgc 480
acctcctcca gcttcacctg cttccaacct tttccaccgc ctgcaaccgc actttcgcct 540
cgttccttcg gactcttgcg gctgcgatgt tgtccagcat cgacaggagc tgctttactt 600
tcgcttgacc tgcttgccac ctggtgctcg cacgatgcca tatatcgcga gggaggcgag 660
agagcggagt tggctggatg acgctcgctc cggcttgcag ctggttgtta cggtgttgca 720
agaatttctg tgcagtttgt acgagtggcc ccgcgttgtg gatgatgtcg gttcggttgg 780
cacggccttg ctcgctcgct ctctcgttgc tcctcgctct tcaccacttc acttctaaca 840
ctaactagct aca 853
<210>2
<211>999
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>terminator
<222>(1)..(999)
<223>
<400>2
gcatttccta cgccatgcct gaaccgagtc tgaagaccgt acagaatcac taaaagtcgt 60
gaaacgaata cctctttgtg cgtctacctt gagcgagcga gaggagcggg tcttttcggc 120
ggcagtgagc ctctggcaca ggctccccgg cgacatgggg ccgtggaacc agagcttcca 180
gcgatgacag cgacttcttc accctcgagg acgaggaggt ctctgccgtt tgtctcttcc 240
ctcagccacc ctcacactcg ctgggctcga tgagggtgca aagcttgtct tccccgctct 300
tgtggtcctg gcgtcaagct cccagcactc acgacgcctc cctctcgctc tcctcctctt 360
catcggctcc tcagcaactc tcgctctccc agcatgtgga cggcttccga cctgtcgcgc 420
actttccgag cgtcattcac gaggagctac tggcggtggg agagatctct gatccgtttt 480
tgaggcgtaa tgaggaggta cgcttcctcg cccccacatc tcaaccgtcg aggaggaggt 540
gggagccaga acgagctgac tagcgagtac gtgtaccgtc gcaggccgtg caatgggtcg 600
gcgaagcaga ctggatctac cgctgcgact tcgaggtcga gcggctgccg aagaagcgct 660
cgaaagaggg cgagggcgag gaggagaggg ctgacttggt gttcgagggt ctcgatacgt 720
tcgcgacggt gtactgtgag tcgagatcga gcgggcagac ggattgatcg ctaatacgga 780
agtgatctcg cagtgaacgg cgacaagatc ctcgaggccg acaacatgtt ccgtgaatgg 840
cggtgagtcg tcgcttgagg cttcacactt cgtatgcacc atgtgagtct gctgcagacg 900
ttgatgtggc agcccgtgga ccatccacag tgtcccgctt cgatgctcgc aactccgcca 960
cggccgcaac ttgctgtaca tcgtctttca ctcagcgtt 999
<210>3
<211>1053
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>CDS
<222>(1)..(1053)
<223>
<400>3
atg ggt gtc ctc gat gtt gtc ccc gcc ggc gtc ctc acc ggc aag aac 48
Met Gly Val Leu Asp Val Val Pro Ala Gly Val Leu Thr Gly Lys Asn
1 5 10 15
ctc gtc aag ttg atg gac tac gct cgc gag aac cac aac tgc acc tcg 96
Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn His Asn Cys Thr Ser
20 25 30
tcg tcg acc gtc gtc gcc gcc ctc gag gcc gcc cgc gac tcc aag tcg 144
Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala Arg Asp Ser Lys Ser
35 40 45
ccc gtc atc atc cag gtc tcg cag ggt ggt gcc gcc ttc ttc gcc ggg 192
Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala Ala Phe Phe Ala Gly
50 55 60
aag ggt gtc gcc aac gac aag cag cag gct tcc atc gcc ggt gcc gtc 240
Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser Ile Ala Gly Ala Val
65 70 75 80
gcc gcc gcc cac tac gtc cgc tcc atc gct ccc acc tat ggc gtc ccc 288
Ala Ala Ala His Tyr Val Arg Ser Ile Ala Pro Thr Tyr Gly Val Pro
85 90 95
gtc gtg ctg cac agc gac cac tgt gcg aag aag ctc ctc caa tgg ttc 336
Val Val Leu His Ser Asp His Cys Ala Lys Lys Leu Leu Gln Trp Phe
100 105 110
gac ggc atg ctc gag gcc gac gag gct tac tac aag gag aag ggc gag 384
Asp Gly Met Leu Glu Ala Asp Glu Ala Tyr Tyr Lys Glu Lys Gly Glu
115 120 125
cct ctc ttc tct act ttg agc gca tgg cca agg tcg acc tct ggc tcg 432
Pro Leu Phe Ser Thr Leu Ser Ala Trp Pro Arg Ser Thr Ser Gly Ser
130 135 140
aga tgg aga ttg gca tca ccg gtg gtg agg agg acg gtg tcg aca aca 480
Arg Trp Arg Leu Ala Ser Pro Val Val Arg Arg Thr Val Ser Thr Thr
145 150 155 160
ctg gtg agt gcg cgt gcc ttt cga gtg tct att gac gag act gac gat 528
Leu Val Ser Ala Arg Ala Phe Arg Val Ser Ile Asp Glu Thr Asp Asp
165 170 175
cag ggg aca ggc gtc gac aac aac tcg ctc tac acc cag ccc gag gac 576
Gln Gly Thr Gly Val Asp Asn Asn Ser Leu Tyr Thr Gln Pro Glu Asp
180 185 190
atc ctc gac atc cac aac gcc ctc tcc aag atc tcg ccc atg ttc tcg 624
Ile Leu Asp Ile His Asn Ala Leu Ser Lys Ile Ser Pro Met Phe Ser
195 200 205
atc gct gcc ggc ttc ggc aac gtc cac ggc gtc tac aag cct ggc aac 672
Ile Ala Ala Gly Phe Gly Asn Val His Gly Val Tyr Lys Pro Gly Asn
210 215 220
gtc aag ctc cgt ccc gag ctc ctc gag aag cac cag aag tac tgc cac 720
Val Lys Leu Arg Pro Glu Leu Leu Glu Lys His Gln Lys Tyr Cys His
225 230 235 240
gag cag ctc aag tcg aag aac ccc ctc ccc atc tac ctc gtc ttc cac 768
Glu Gln Leu Lys Ser Lys Asn Pro Leu Pro Ile Tyr Leu Val Phe His
245 250 255
ggc ggt tcg gga tcg tcc aag gac gag atc act acc gct gtc aag aac 816
Gly Gly Ser Gly Ser Ser Lys Asp Glu Ile Thr Thr Ala Val Lys Asn
260 265 270
ggt gtc gtc aag atg aac gtc gac acc gac acc cag tgg gca tac atg 864
Gly Val Val Lys Met Asn Val Asp Thr Asp Thr Gln Trp Ala Tyr Met
275 280 285
atc ggc ttc cgc gac tac ttc aag tcc aag gcc gcg tac ctc gag acc 912
Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys Ala Ala Tyr Leu Glu Thr
290 295 300
cag gtc ggt aac ccc gag ggc gcc gac aag ccc aac aag aag cag tac 960
Gln Val Gly Asn Pro Glu Gly Ala Asp Lys Pro Asn Lys Lys Gln Tyr
305 310 315 320
gac ccg cgc gtc tgg gtc cgt gag ggt gag aag acg atg aag gag cgc 1008
Asp Pro Arg Val Trp Val Arg Glu Gly Glu Lys Thr Met Lys Glu Arg
325 330 335
tgc cag gtc gcc ttc aag gac ctc cgc tcc gag gga acc ctc taa 1053
Cys Gln Val Ala Phe Lys Asp Leu Arg Ser Glu Gly Thr Leu
340 345 350
<210>4
<211>350
<212>PRT
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<400>4
Met Gly Val Leu Asp Val Val Pro Ala Gly Val Leu Thr Gly Lys Asn
1 5 10 15
Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn His Asn Cys Thr Ser
20 25 30
Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala Arg Asp Ser Lys Ser
35 40 45
Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala Ala Phe Phe Ala Gly
50 55 60
Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser Ile Ala Gly Ala Val
65 70 75 80
Ala Ala Ala His Tyr Val Arg Ser Ile Ala Pro Thr Tyr Gly Val Pro
85 90 95
Val Val Leu His Ser Asp His Cys Ala Lys Lys Leu Leu Gln Trp Phe
100 105 110
Asp Gly Met Leu Glu Ala Asp Glu Ala Tyr Tyr Lys Glu Lys Gly Glu
115 120 125
Pro Leu Phe Ser Thr Leu Ser Ala Trp Pro Arg Ser Thr Ser Gly Ser
130 135 140
Arg Trp Arg Leu Ala Ser Pro Val Val Arg Arg Thr Val Ser Thr Thr
145 150 155 160
Leu Val Ser Ala Arg Ala Phe Arg Val Ser Ile Asp Glu Thr Asp Asp
165 170 175
Gln Gly Thr Gly Val Asp Asn Asn Ser Leu Tyr Thr Gln Pro Glu Asp
180 185 190
Ile Leu Asp Ile His Asn Ala Leu Ser Lys Ile Ser Pro Met Phe Ser
195 200 205
Ile Ala Ala Gly Phe Gly Asn Val His Gly Val Tyr Lys Pro Gly Asn
210 215 220
Val Lys Leu Arg Pro Glu Leu Leu Glu Lys His Gln Lys Tyr Cys His
225 230 235 240
Glu Gln Leu Lys Ser Lys Asn Pro Leu Pro Ile Tyr Leu Val Phe His
245 250 255
Gly Gly Ser Gly Ser Ser Lys Asp Glu Ile Thr Thr Ala Val Lys Asn
260 265 270
Gly Val Val Lys Met Asn Val Asp Thr Asp Thr Gln Trp Ala Tyr Met
275 280 285
Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys Ala Ala Tyr Leu Glu Thr
290 295 300
Gln Val Gly Asn Pro Glu Gly Ala Asp Lys Pro Asn Lys Lys Gln Tyr
305 310 315 320
Asp Pro Arg Val Trp Val Arg Glu Gly Glu Lys Thr Met Lys Glu Arg
325 330 335
Cys Gln Val Ala Phe Lys Asp Leu Arg Ser Glu Gly Thr Leu
340 345 350
<210>5
<211>1822
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>exon
<222>(1)..(26)
<223>
<220>
<221>exon
<222>(1735)..(1822)
<223>
<220>
<221>exon
<222>(1546)..(1675)
<223>
<220>
<221>exon
<222>(994)..(1433)
<223>
<220>
<221>exon
<222>(567)..(877)
<223>
<220>
<221>exon
<222>(217)..(274)
<223>
<400>5
atg ggt gtc ctc gat gtt gtc ccc gc gtaagcatca cacgctccca 46
Met Gly Val Leu Asp Val Val Pro Ala
1 5
ctgcagcacc cgcacccgct caccttgctc ccgcaggcgt acgtcccctc cgccccgtca 106
tacccctccc ggcttctctc gagtcgcgct cgcccacaac accgcgcgga cggctgggaa 166
cagaatggca ggatcgggga atagcatgct cacattgagc ga cccgcag c ggc gtc 223
Gly Val
10
ctc acc ggc aag aac ctc gtc aag ttg atg gac tac gct cgc gag aac 271
Leu Thr Gly Lys Asn Leu Val Lys Leu Met Asp Tyr Ala Arg Glu Asn
15 20 25
cac gtccgtcttc ttccgactcg ctcacgagtg actgtgcgct gacctgcagc 324
His
ctcgcgtttg agacagttcg ccatccctgt gcgttaccag tcctcgcgaa cgggcgccgc 384
gctctcgccg tcgcacgctt gacgtcgcga gggtcggtcg ctgatgagat ggatgagatc 444
aagctgaccc cgccttttcc actccgcttt tctcccttct ccaggccttc gtgagtccct 504
ctcacaccgt ttgacgccgg gagcgagcga cgggctgacc cgggacgttg cgcgcaaacc 564
ag aac tgc acc tcg tcg tcg acc gtc gtc gcc gcc ctc gag gcc gcc 611
Asn Cys Thr Ser Ser Ser Thr Val Val Ala Ala Leu Glu Ala Ala
30 35 40
cgc gac tcc aag tcg ccc gtc atc atc cag gtc tcg cag ggt ggt gcc 659
Arg Asp Ser Lys Ser Pro Val Ile Ile Gln Val Ser Gln Gly Gly Ala
45 50 55
gcc ttc ttc gcc ggg aag ggt gtc gcc aac gac aag cag cag gct tcc 707
Ala Phe Phe Ala Gly Lys Gly Val Ala Asn Asp Lys Gln Gln Ala Ser
60 65 70 75
atc gcc ggt gcc gtc gcc gcc gcc cac tac gtc cgc tcc atc gct ccc 755
Ile Ala Gly Ala Val Ala Ala Ala His Tyr Val Arg Ser Ile Ala Pro
80 85 90
acc tat ggc gtc ccc gtc gtg ctg cac agc gac cac tgt gcg aag aag 803
Thr Tyr Gly Val Pro Val Val Leu His Ser Asp His Cys Ala Lys Lys
95 100 105
ctc ctc caa tgg ttc gac ggc atg ctc gag gcc gac gag gct tac tac 851
Leu Leu Gln Trp Phe Asp Gly Met Leu Glu Ala Asp Glu Ala Tyr Tyr
110 115 120
aag gag aag ggc gag cct ctc ttc tc gtaaagacgc gcttcctctt 897
Lys Glu Lys Gly Glu Pro Leu Phe Ser
125 130
cctcgccttg gactgggcta acgggcatat cacaggtcgc acatgctcga cctttcggag 957
gagtcaaagg aggagaacat cgagacttgc gtcaag t act ttg agc gca tgg cca 1012
Thr Leu Ser Ala Trp Pro
135
agg tcg acc tct ggc tcg aga tgg aga ttg gca tca ccg gtg gtg agg 1060
Arg Ser Thr Ser Gly Ser Arg Trp Arg Leu Ala Ser Pro Val Val Arg
140 145 150
agg acg gtg tcg aca aca ctg gtg agt gcg cgt gcc ttt cga gtg tct 1108
Arg Thr Val Ser Thr Thr Leu Val Ser Ala Arg Ala Phe Arg Val Ser
155 160 165 170
att gac gag act gac gat cag ggg aca ggc gtc gac aac aac tcg ctc 1156
Ile Asp Glu Thr Asp Asp Gln Gly Thr Gly Val Asp Asn Asn Ser Leu
175 180 185
tac acc cag ccc gag gac atc ctc gac atc cac aac gcc ctc tcc aag 1204
Tyr Thr Gln Pro Glu Asp Ile Leu Asp Ile His Asn Ala Leu Ser Lys
190 195 200
atc tcg ccc atg ttc tcg atc gct gcc ggc ttc ggc aac gtc cac ggc 1252
Ile Ser Pro Met Phe Ser Ile Ala Ala Gly Phe Gly Asn Val His Gly
205 210 215
gtc tac aag cct ggc aac gtc aag ctc cgt ccc gag ctc ctc gag aag 1300
Val Tyr Lys Pro Gly Asn Val Lys Leu Arg Pro Glu Leu Leu Glu Lys
220 225 230
cac cag aag tac tgc cac gag cag ctc aag tcg aag aac ccc ctc ccc 1348
His Gln Lys Tyr Cys His Glu Gln Leu Lys Ser Lys Asn Pro Leu Pro
235 240 245 250
atc tac ctc gtc ttc cac ggc ggt tcg gga tcg tcc aag gac gag atc 1396
Ile Tyr Leu Val Phe His Gly Gly Ser Gly Ser Ser Lys Asp Glu Ile
255 260 265
act acc gct gtc aag aac ggt gtc gtc aag atg aac g gtgcgcgacg 1443
Thr Thr Ala Val Lys Asn Gly Val Val Lys Met Asn
270 275
acttttcgcg gacttgcgac tcccgagtgc tgacttggct tctgccttct ccgctttttc 1503
acttggcttc tgccttctcc gcttctcttc ttgtccctac ag tc gac acc gac 1556
Val Asp Thr Asp
280
acc cag tgg gca tac atg atc ggc ttc cgc gac tac ttc aag tcc aag 1604
Thr Gln Trp Ala Tyr Met Ile Gly Phe Arg Asp Tyr Phe Lys Ser Lys
285 290 295
gcc gcg tac ctc gag acc cag gtc ggt aac ccc gag ggc gcc gac aag 1652
Ala Ala Tyr Leu Glu Thr Gln Val Gly Asn Pro Glu Gly Ala Asp Lys
300 305 310
ccc aac aag aag cag tac gac cc gtaagtcgat accctcttct cttctcgccc 1705
Pro Asn Lys Lys Gln Tyr Asp Pro
315 320
ggcctctgac gagactcttt gttgtccag g cgc gtc tgg gtc cgt gag ggt gag 1759
Arg Val Trp Val Arg Glu Gly Glu
325 330
aag acg atg aag gag cgc tgc cag gtc gcc ttc aag gac ctc cgc tcc 1807
Lys Thr Met Lys Glu Arg Cys Gln Val Ala Phe Lys Asp Leu Arg Ser
335 340 345
gag gga acc ctc taa 1822
Glu Gly Thr Leu
350
<210>6
<211>3674
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>promoter
<222>(154)..(853)
<223>
<220>
<221>terminator
<222>(2676)..(3674)
<223>
<400>6
gctgacggta ctcgtttcgc agacaacccg ctcgagatga actgccggac aaaggaggac 60
ttttcggctc tcgccgtcgc cctgtccgat tctctgatcc agaagcacgc cggctcgaag 120
ctgttcggca gttttgtcga cgagctcgcc cgcctgctcg ccgcgccgct caagtcggac 180
gaggtgggca aggtgcgcgc gagtatggcc aacctcgcga tggacaagca gaagctcgag 240
aaggctggcg cgaagggcgg cgcagtcggt gggaagcccc ctgcgaggat ggtcgcgagg 300
ggcagggagg acttgtcgtc gttcggagag gtgctcgacg acgatgtcgc cgcggcccag 360
ttcgacgagg acgaggattt cgtgcgtcgc tttcgctcgc tcgctggttg ctcctgtctc 420
ttctgcttct cacgctgact ctcatcgtgc ccgtctcact gcagatgtag atgtagacgc 480
acctcctcca gcttcacctg cttccaacct tttccaccgc ctgcaaccgc actttcgcct 540
cgttccttcg gactcttgcg gctgcgatgt tgtccagcat cgacaggagc tgctttactt 600
tcgcttgacc tgcttgccac ctggtgctcg cacgatgcca tatatcgcga gggaggcgag 660
agagcggagt tggctggatg acgctcgctc cggcttgcag ctggttgtta cggtgttgca 720
agaatttctg tgcagtttgt acgagtggcc ccgcgttgtg gatgatgtcg gttcggttgg 780
cacggccttg ctcgctcgct ctctcgttgc tcctcgctct tcaccacttc acttctaaca 840
ctaactagct acaatgggtg tcctcgatgt tgtccccgcg taagcatcac acgctcccac 900
tgcagcaccc gcacccgctc accttgctcc cgcaggcgta cgtcccctcc gccccgtcat 960
acccctcccg gcttctctcg agtcgcgctc gcccacaaca ccgcgcggac ggctgggaac 1020
agaatggcag gatcggggaa tagcatgctc acattgagcg aacccgcagc ggcgtcctca 1080
ccggcaagaa cctcgtcaag ttgatggact acgctcgcga gaaccacgtc cgtcttcttc 1140
cgactcgctc acgagtgact gtgcgctgac ctgcagcctc gcgtttgaga cagttcgcca 1200
tccctgtgcg ttaccagtcc tcgcgaacgg gcgccgcgct ctcgccgtcg cacgcttgac 1260
gtcgcgaggg tcggtcgctg atgagatgga tgagatcaag ctgaccccgc cttttccact 1320
ccgcttttct cccttctcca ggccttcgtg agtccctctc acaccgtttg acgccgggag 1380
cgagcgacgg gctgacccgg gacgttgcgc gcaaaccaga actgcacctc gtcgtcgacc 1440
gtcgtcgccg ccctcgaggc cgcccgcgac tccaagtcgc ccgtcatcat ccaggtctcg 1500
cagggtggtg ccgccttctt cgccgggaag ggtgtcgcca acgacaagca gcaggcttcc 1560
atcgccggtg ccgtcgccgc cgcccactac gtccgctcca tcgctcccac ctatggcgtc 1620
cccgtcgtgc tgcacagcga ccactgtgcg aagaagctcc tccaatggtt cgacggcatg 1680
ctcgaggccg acgaggctta ctacaaggag aagggcgagc ctctcttctc gtaaagacgc 1740
gcttcctctt cctcgccttg gactgggcta acgggcatat cacaggtcgc acatgctcga 1800
cctttcggag gagtcaaagg aggagaacat cgagacttgc gtcaagtact ttgagcgcat 1860
ggccaaggtc gacctctggc tcgagatgga gattggcatc accggtggtg aggaggacgg 1920
tgtcgacaac actggtgagt gcgcgtgcct ttcgagtgtc tattgacgag actgacgatc 1980
aggggacagg cgtcgacaac aactcgctct acacccagcc cgaggacatc ctcgacatcc 2040
acaacgccct ctccaagatc tcgcccatgt tctcgatcgc tgccggcttc ggcaacgtcc 2100
acggcgtcta caagcctggc aacgtcaagc tccgtcccga gctcctcgag aagcaccaga 2160
agtactgcca cgagcagctc aagtcgaaga accccctccc catctacctc gtcttccacg 2220
gcggttcggg atcgtccaag gacgagatca ctaccgctgt caagaacggt gtcgtcaaga 2280
tgaacggtgc gcgacgactt ttcgcggact tgcgactccc gagtgctgac ttggcttctg 2340
ccttctccgc tttttcactt ggcttctgcc ttctccgctt ctcttcttgt ccctacagtc 2400
gacaccgaca cccagtgggc atacatgatc ggcttccgcg actacttcaa gtccaaggcc 2460
gcgtacctcg agacccaggt cggtaacccc gagggcgccg acaagcccaa caagaagcag 2520
tacgacccgt aagtcgatac cctcttctct tctcgcccgg cctctgacga gactctttgt 2580
tgtccaggcg cgtctgggtc cgtgagggtg agaagacgat gaaggagcgc tgccaggtcg 2640
ccttcaagga cctccgctcc gagggaaccc tctaagcatt tcctacgcca tgcctgaacc 2700
gagtctgaag accgtacaga atcactaaaa gtcgtgaaac gaatacctct ttgtgcgtct 2760
accttgagcg agcgagagga gcgggtcttt tcggcggcag tgagcctctg gcacaggctc 2820
cccggcgaca tggggccgtg gaaccagagc ttccagcgat gacagcgact tcttcaccct 2880
cgaggacgag gaggtctctg ccgtttgtct cttccctcag ccaccctcac actcgctggg 2940
ctcgatgagg gtgcaaagct tgtcttcccc gctcttgtgg tcctggcgtc aagctcccag 3000
cactcacgac gcctccctct cgctctcctc ctcttcatcg gctcctcagc aactctcgct 3060
ctcccagcat gtggacggct tccgacctgt cgcgcacttt ccgagcgtca ttcacgagga 3120
gctactggcg gtgggagaga tctctgatcc gtttttgagg cgtaatgagg aggtacgctt 3180
cctcgccccc acatctcaac cgtcgaggag gaggtgggag ccagaacgag ctgactagcg 3240
agtacgtgta ccgtcgcagg ccgtgcaatg ggtcggcgaa gcagactgga tctaccgctg 3300
cgacttcgag gtcgagcggc tgccgaagaa gcgctcgaaa gagggcgagg gcgaggagga 3360
gagggctgac ttggtgttcg agggtctcga tacgttcgcg acggtgtact gtgagtcgag 3420
atcgagcggg cagacggatt gatcgctaat acggaagtga tctcgcagtg aacggcgaca 3480
agatcctcga ggccgacaac atgttccgtg aatggcggtg agtcgtcgct tgaggcttca 3540
cacttcgtat gcaccatgtg agtctgctgc agacgttgat gtggcagccc gtggaccatc 3600
cacagtgtcc cgcttcgatg ctcgcaactc cgccacggcc gcaacttgct gtacatcgtc 3660
tttcactcag cgtt 3674
<210>7
<211>717
<212>DNA
<213>人工序列
<220>
<221>gene
<222>(1)..(717)
<223>
<400>7
atgagtaaag gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt 60
gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga 120
aaacttaccc ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt 180
gtcactactt tctcttatgg tgttcaatgc ttttcccgtt atccggatca tatgaaacgg 240
catgactttt tcaagagtgc catgcccgaa ggttatgtac aggaacgcac tatatctttc 300
aaagatgacg ggaactacaa gacgcgtgct gaagtcaagt ttgaaggtga tacccttgtt 360
aatcgtatcg agttaaaagg tattgatttt aaagaagatg gaaacattct cggacacaaa 420
ctcgagtaca actataactc acacaatgta tacatcacgg cagacaaaca aaagaatgga 480
atcaaagcta acttcaaaat tcgccacaac attgaagatg gatccgttca actagcagac 540
cattatcaac aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac 600
ctgtcgacac aatctgccct ttcgaaagat cccaacgaaa agcgtgacca catggtcctt 660
cttgagtttg taactgctgc tgggattaca catggcatgg atgagctcta caaataa 717
<210>8
<211>2569
<212>DNA
<213>人工序列
<220>
<221>promoter
<222>(154)..(853)
<223>
<220>
<221>terminator
<222>(1571)..(2569)
<223>
<400>8
gctgacggta ctcgtttcgc agacaacccg ctcgagatga actgccggac aaaggaggac 60
ttttcggctc tcgccgtcgc cctgtccgat tctctgatcc agaagcacgc cggctcgaag 120
ctgttcggca attttgtcga cgagctcgcc cgcctgctcg ccgcgccgct caagtcggac 180
gaggtgggca aggtgcgcgc gagtatggcc aacctcgcga tggacaagca gaagctcgag 240
aaggctggcg cgaagggcgg cgcagtcggt gggaagcccc ctgcgaggat ggtcgcgagg 300
ggcagggagg acttgtcgtc gttcggagag gtgctcgacg acgatgtcgc cgcggcccag 360
ttcgacgagg acgaggattt cgtgcgtcgc tttcgctcgc tcgctggttg ctcctgtctc 420
ttctgcttct cacgctgact ctcatcgtgc ccgtctcact gcagatgtag atgtagacgc 480
acctcctcca gcttcacctg cttccaacct tttccaccgc ctgcaaccgc actttcgcct 540
cgttccttcg gactcttgcg gctgcgatgt tgtccagcat cgacaggagc tgctttactt 600
tcgcttgacc tgcttgccac ctggtgctcg cacgatgcca tatatcgcga gggaggcgag 660
agagcggagt tggctggatg acgctcgctc cggcttgcag ctggttgtta cggtgttgca 720
agaatttctg tgcagtttgt acgagtggcc ccgcgttgtg gatgatgtcg gttcggttgg 780
cacggccttg ctcgctcgct ctctcgttgc tcctcgctct tcaccacttc acttctaaca 840
ctaactagct acaatgagta aaggagaaga acttttcact ggagttgtcc caattcttgt 900
tgaattagat ggtgatgtta atgggcacaa attttctgtc agtggagagg gtgaaggtga 960
tgcaacatac ggaaaactta cccttaaatt tatttgcact actggaaaac tacctgttcc 1020
atggccaaca cttgtcacta ctttctctta tggtgttcaa tgcttttccc gttatccgga 1080
tcatatgaaa cggcatgact ttttcaagag tgccatgccc gaaggttatg tacaggaacg 1140
cactatatct ttcaaagatg acgggaacta caagacgcgt gctgaagtca agtttgaagg 1200
tgataccctt gttaatcgta tcgagttaaa aggtattgat tttaaagaag atggaaacat 1260
tctcggacac aaactcgagt acaactataa ctcacacaat gtatacatca cggcagacaa 1320
acaaaagaat ggaatcaaag ctaacttcaa aattcgccac aacattgaag atggatccgt 1380
tcaactagca gaccattatc aacaaaatac tccaattggc gatggccctg tccttttacc 1440
agacaaccat tacctgtcga cacaatctgc cctttcgaaa gatcccaacg aaaagcgtga 1500
ccacatggtc cttcttgagt ttgtaactgc tgctgggatt acacatggca tggatgagct 1560
ctacaaatga gcatttccta cgccatgcct gaaccgagtc tgaagaccgt acagaatcac 1620
taaaagtcgt gaaacgaata cctctttgtg cgtctacctt gagcgagcga gaggagcggg 1680
tcttttcggc ggcagtgagc ctctggcaca ggctccccgg cgacatgggg ccgtggaacc 1740
agagcttcca gcgatgacag cgacttcttc accctcgagg acgaggaggt ctctgccgtt 1800
tgtctcttcc ctcagccacc ctcacactcg ctgggctcga tgagggtgca aagcttgtct 1860
tccccgctct tgtggtcctg gcgtcaagct cccagcactc acgacgcctc cctctcgctc 1920
tcctcctctt catcggctcc tcagcaactc tcgctctccc agcatgtgga cggcttccga 1980
cctgtcgcgc actttccgag cgtcattcac gaggagctac tggcggtggg agagatctct 2040
gatccgtttt tgaggcgtaa tgaggaggta cgcttcctcg cccccacatc tcaaccgtcg 2100
aggaggaggt gggagccaga acgagctgac tagcgagtac gtgtaccgtc gcaggccgtg 2160
caatgggtcg gcgaagcaga ctggatctac cgctgcgact tcgaggtcga gcggctgccg 2220
aagaagcgct cgaaagaggg cgagggcgag gaggagaggg ctgacttggt gttcgagggt 2280
ctcgatacgt tcgcgacggt gtactgtgag tcgagatcga gcgggcagac ggattgatcg 2340
ctaatacgga agtgatctcg cagtgaacgg cgacaagatc ctcgaggccg acaacatgtt 2400
ccgtgaatgg cggtgagtcg tcgcttgagg cttcacactt cgtatgcacc atgtgagtct 2460
gctgcagacg ttgatgtggc agcccgtgga ccatccacag tgtcccgctt cgatgctcgc 2520
aactccgcca cggccgcaac ttgctgtaca tcgtctttca ctcagcgtt 2569
<210>9
<211>1265
<212>DNA
<213>圆红冬孢酵母(Rhodosporidium toruloides)
<220>
<221>gene
<222>(1)..(1265)
<223>
<400>9
aaggattccc ctagtagcgg cgagcgaagc gggaagagct caaatttata atctggcacc 60
ttcggtgtcc gagttgtaat ctctagaaat gttttccgcg ttggaccgca cacaagtctg 120
ttggaataca gcggcatagt ggtgagaccc ccgtatatgg tgcggacgcc cagcgctttg 180
tgatacattt tcgaagagtc gagttgtttg ggaatgcagc tcaaattggg tggtaaattc 240
catctaaagc taaatattgg cgagagaccg atagcgaaca agtaccgtga gggaaagatg 300
aaaagcactt tggaaagaga gttaacagta cgtgaaattg ttggaaggga aacgcttgaa 360
gtcagacttg cttgccgagc aatcggtttg caggccagca tcagttttcc gggatggata 420
atggtagaga gaaggtagca gtttcggctg tgttatagct ctctgctgga tacatcttgg 480
gggactgagg aacgcagtgt gcctttggcg ggggtttcga cctcttcaca cttaggatgc 540
tggtggaatg gctttaaacg acccgtcttg aaacacggac caaggagtct aacatgcttg 600
cgagtatttg ggtgtcaaac ccggatgcgt aatgaaagtg aatggaggtg ggaaccgcaa 660
ggtgcaccat cgaccgatct ggatttttaa tgatggattt gagtaagagc acgtatgttg 720
ggacccgaaa gatggtgaac tatgcctgaa tagggcgaag ccagaggaaa ctctggtgga 780
ggctcgtagc ggttctgacg tgcaaatcga tcgtcaaatt tgggtatagg ggcgaaagac 840
taatcgaacc atctagtagc tggttcctgc cgaagtttcc ctcaggatag cagaaactca 900
catcagttct atgaggtaaa gcgaatgatt agaggccttg gggttgaaac aaccttaacc 960
tattctcaaa ctttaaatat gtaggaagtc cttgctactt aattgagcga ggacatgcga 1020
atgagagttt ctagtgggcc atttttggta agcagaactg gcgatgcggg atgaaccgaa 1080
cgcgaggtta aggtgccgga atacacgctc atcagacacc acaaaaggtg ttagttcatc 1140
tagacagccg cacggtggcc atggaagtcg gaatccgcta aggagtgtgt aacaactcaa 1200
cggccgaatg aactagccct gaaaatggat ggcgctcaag cgtgttaccc atacctcgcc 1260
gtcag 1265
<210>10
<211>3520
<212>DNA
<213>人工序列
<220>
<221>promoter
<222>(671)..(1370)
<223>
<400>10
aaggattccc ctagtagcgg cgagcgaagc gggaagagct caaatttata atctggcacc 60
ttcggtgtcc gagttgtaat ctctagaaat gttttccgcg ttggaccgca cacaagtctg 120
ttggaataca gcggcatagt ggtgagaccc ccgtatatgg tgcggacgcc cagcgctttg 180
tgatacattt tcgaagagtc gagttgtttg ggaatgcagc tcaaattggg tggtaaattc 240
catctaaagc taaatattgg cgagagaccg atagcgaaca agtaccgtga gggaaagatg 300
aaaagcactt tggaaagaga gttaacagta cgtgaaattg ttggaaggga aacgcttgaa 360
gtcagacttg cttgccgagc aatcggtttg caggccagca tcagttttcc gggatggata 420
atggtagaga gaaggtagca gtttcggctg tgttatagct ctctgctgga tacatcttgg 480
gggactgagg aacgcagtgt gcctttggcg ggggtttcga cctcttcaca cttaggatgc 540
tggtggaatg gcgatgaact gccggacaaa ggaggacttt tcggctctcg ccgtcgccct 600
gtccgattct ctgatccaga agcacgccgg ctcgaagctg ttcggcaatt ttgtcgacga 660
gctcgcccgc ctgctcgccg cgccgctcaa gtcggacgag gtgggcaagg tgcgcgcgag 720
tatggccaac ctcgcgatgg acaagcagaa gctcgagaag gctggcgcga agggcggcgc 780
agtcggtggg aagccccctg cgaggatggt cgcgaggggc agggaggact tgtcgtcgtt 840
cggagaggtg ctcgacgacg atgtcgccgc ggcccagttc gacgaggacg aggatttcgt 900
gcgtcgcttt cgctcgctcg ctggttgctc ctgtctcttc tgcttctcac gctgactctc 960
atcgtgcccg tctcactgca gatgtagatg tagacgcacc tcctccagct tcacctgctt 1020
ccaacctttt ccaccgcctg caaccgcact ttcgcctcgt tccttcggac tcttgcggct 1080
gcgatgttgt ccagcatcga caggagctgc tttactttcg cttgacctgc ttgccacctg 1140
gtgctcgcac gatgccatat atcgcgaggg aggcgagaga gcggagttgg ctggatgacg 1200
ctcgctccgg cttgcagctg gttgttacgg tgttgcaaga atttctgtgc agtttgtacg 1260
agtggccccg cgttgtggat gatgtcggtt cggttggcac ggccttgctc gctcgctctc 1320
tcgttgctcc tcgctcttca ccacttcact tctaacacta actagctaca atgagtaaag 1380
gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt gatgttaatg 1440
ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga aaacttaccc 1500
ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt gtcactactt 1560
tctcttatgg tgttcaatgc ttttcccgtt atccggatca tatgaaacgg catgactttt 1620
tcaagagtgc catgcccgaa ggttatgtac aggaacgcac tatatctttc aaagatgacg 1680
ggaactacaa gacgcgtgct gaagtcaagt ttgaaggtga tacccttgtt aatcgtatcg 1740
agttaaaagg tattgatttt aaagaagatg gaaacattct cggacacaaa ctcgagtaca 1800
actataactc acacaatgta tacatcacgg cagacaaaca aaagaatgga atcaaagcta 1860
acttcaaaat tcgccacaac attgaagatg gatccgttca actagcagac cattatcaac 1920
aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac ctgtcgacac 1980
aatctgccct ttcgaaagat cccaacgaaa agcgtgacca catggtcctt cttgagtttg 2040
taactgctgc tgggattaca catggcatgg atgagctcta caaatgagca tttcctacgc 2100
catgcctgaa ccgagtctga agaccgtaca gaatcactaa aagtcgtgaa acgaatacct 2160
ctttgtgcgt ctaccttgag cgagcgagag gagcgggtct tttcggcggc agtgagcctc 2220
tggcacaggc tccccggcga catggggccg tggaaccaga gcttccagcg atgacagcga 2280
cttcttcacc ctcgaggacg aggaggtctc tgccgtttgt ctcttccctc agccaccctc 2340
acactcgctg ggctcgatga gggtgcaaag cttgtcttcc ccgctcttgt ggtcctggcg 2400
tcaagctccc agcactcacg acgcctccct ctcgctctcc tcctcttcat cggctcctca 2460
gcaactctcg ctctcccagc atgtggacgg cttccgacct gtcgcgcact ttccgagcgt 2520
cattcacgag gagctactgg cggtgggaga gatctctgat ccgtttttga ggcgtaatga 2580
ggaggtacgc ttcctcgccc ccacatctca accgtcgagg aggaggtggg agccagaacg 2640
agctgactag cgagtacgtg taccgtcgca ggccgtgcaa tgggtcggcg aagcagactg 2700
gatctaccgc tgcgacttcg aggtcgagcg gctgccgaag aagcgctcga aagagggcga 2760
gggcgaggag gagagggctg acttggtgtt cgagggtctc gatacgttcg cgacggtgta 2820
ctgtgagtcg agatcgagcg ggcagacgga ttgatcgcta atacggaagt gatctcgcag 2880
tgaacggtga aagtgaatgg aggtgggaac cgcaaggtgc accatcgacc gatctggatt 2940
tttaatgatg gatttgagta agagcacgta tgttgggacc cgaaagatgg tgaactatgc 3000
ctgaataggg cgaagccaga ggaaactctg gtggaggctc gtagcggttc tgacgtgcaa 3060
atcgatcgtc aaatttgggt ataggggcga aagactaatc gaaccatcta gtagctggtt 3120
cctgccgaag tttccctcag gatagcagaa actcacatca gttctatgag gtaaagcgaa 3180
tgattagagg ccttggggtt gaaacaacct taacctattc tcaaacttta aatatgtagg 3240
aagtccttgc tacttaattg agcgaggaca tgcgaatgag agtttctagt gggccatttt 3300
tggtaagcag aactggcgat gcgggatgaa ccgaacgcga ggttaaggtg ccggaataca 3360
cgctcatcag acaccacaaa aggtgttagt tcatctagac agccgcacgg tggccatgga 3420
agtcggaatc cgctaaggag tgtgtaacaa ctcaacggcc gaatgaacta gccctgaaaa 3480
tggatggcgc tcaagcgtgt tacccatacc tcgccgtcag 3520
Claims (9)
1.果糖-6-二磷酸醛缩酶启动子,简写为pRtFBA,其核苷酸序列具有如SEQ ID NO:1所示DNA序列的全部序列或包含该DNA序列自3’-末端起700bp以内的部分序列,或具有可与如SEQ ID NO:1所示序列的全部或其DNA序列3’-末端起700bp以内的部分序列杂交的、且保持转录启动子活性的序列,或对SEQ ID NO:1所示的脱氧核苷酸序列进行一个或多个碱基的取代、缺失、插入或添加所获得的,与SEQ ID NO:1所示序列具有50%以上同源性、且具有启动子活性的序列。
2.一种权利要求1所述果糖-1,6-二磷酸醛缩酶启动子pRtFBA的应用,其特征在于:SEQ ID NO:1所示的脱氧核苷酸序列可作为启动子用于构建新型酵母遗传操作系统及新的重组工程菌株,所得到的基因工程菌株携带相应的pRtFBA序列。
3.按照权利要求2所述果糖-1,6-二磷酸醛缩酶启动子pRtFBA的应用,其特征在于:所述基因工程菌株为红冬孢酵母属(Rhodosporidium)基因工程菌株,所述新型酵母遗传操作系统为圆红冬孢酵母遗传操作系统。
4.一种DNA构建体,含有权利要求1所述SEQ ID NO:1所示的脱氧核苷酸序列,或同时含有权利要求1所述SEQ ID NO:1所示的脱氧核苷酸序列和如SEQ ID NO:2所示的脱氧核苷酸序列,且SEQ ID NO:1所示序列位于SEQ ID NO:2所示序列的上游,SEQ ID NO:1和SEQ ID NO:2之间为一编码基因的开放阅读框架。
5.按照权利要求4构建体,其特征在于:所述的SEQ ID NO:2所示序列为一种果糖-1,6-二磷酸醛缩酶终止子RtFBAt。
6.按照权利要求4构建体,其特征在于:所述开放阅读框架为位于SEQID NO:1和SEQ ID NO:2之间的果糖-1,6-二磷酸醛缩酶基因的开放阅读框架,其cDNA序列具有如SEQ ID NO:3所示的脱氧核苷酸序列,其基因组DNA具有SEQ ID NO:5所示的脱氧核苷酸序列。
7.一种携带权利要求1启动子pRtFBA或权利要求4构建体的载体。
8.按照权利要求7载体,其特征在于:所述载体为质粒载体。
9.一种果糖-1,6-二磷酸醛缩酶蛋白,其具有如SEQ ID NO:4所示氨基酸序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010189723 CN102268430B (zh) | 2010-06-02 | 2010-06-02 | 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010189723 CN102268430B (zh) | 2010-06-02 | 2010-06-02 | 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102268430A true CN102268430A (zh) | 2011-12-07 |
CN102268430B CN102268430B (zh) | 2013-05-15 |
Family
ID=45050891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010189723 Expired - Fee Related CN102268430B (zh) | 2010-06-02 | 2010-06-02 | 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102268430B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105779445A (zh) * | 2014-12-22 | 2016-07-20 | 中国科学院大连化学物理研究所 | 果糖-1,6-二磷酸醛缩酶启动子和终止子及其应用 |
CN108624600A (zh) * | 2018-05-22 | 2018-10-09 | 昆明理工大学 | 锌指转录因子基因RkMsn4的用途 |
CN110066802A (zh) * | 2019-04-30 | 2019-07-30 | 西南大学 | 具有提高出芽短梗霉代谢产物的启动子及其应用 |
CN111394350A (zh) * | 2019-01-03 | 2020-07-10 | 中国科学院大连化学物理研究所 | 圆红冬孢酵母rna聚合酶iii型启动子及其应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1267333A (zh) * | 1997-06-17 | 2000-09-20 | 孟山都公司 | 在转基因植物中表达果糖1,6二磷酸醛缩酶 |
US20050130280A1 (en) * | 2003-11-14 | 2005-06-16 | Pollak Dana M.W. | Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast |
US7264949B2 (en) * | 2004-09-15 | 2007-09-04 | E.I. Du Pont De Nemours And Company | Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast |
-
2010
- 2010-06-02 CN CN 201010189723 patent/CN102268430B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1267333A (zh) * | 1997-06-17 | 2000-09-20 | 孟山都公司 | 在转基因植物中表达果糖1,6二磷酸醛缩酶 |
US20050130280A1 (en) * | 2003-11-14 | 2005-06-16 | Pollak Dana M.W. | Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast |
US7264949B2 (en) * | 2004-09-15 | 2007-09-04 | E.I. Du Pont De Nemours And Company | Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105779445A (zh) * | 2014-12-22 | 2016-07-20 | 中国科学院大连化学物理研究所 | 果糖-1,6-二磷酸醛缩酶启动子和终止子及其应用 |
CN105779445B (zh) * | 2014-12-22 | 2018-09-28 | 中国科学院大连化学物理研究所 | 果糖-1,6-二磷酸醛缩酶启动子和终止子及其应用 |
CN108624600A (zh) * | 2018-05-22 | 2018-10-09 | 昆明理工大学 | 锌指转录因子基因RkMsn4的用途 |
CN111394350A (zh) * | 2019-01-03 | 2020-07-10 | 中国科学院大连化学物理研究所 | 圆红冬孢酵母rna聚合酶iii型启动子及其应用 |
CN110066802A (zh) * | 2019-04-30 | 2019-07-30 | 西南大学 | 具有提高出芽短梗霉代谢产物的启动子及其应用 |
CN110066802B (zh) * | 2019-04-30 | 2021-03-02 | 西南大学 | 具有提高出芽短梗霉代谢产物的启动子及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN102268430B (zh) | 2013-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101421295B (zh) | 用于提高作物植物中的氮利用效率的基因 | |
CN102268432B (zh) | 乳清酸磷酸核糖转移酶启动子及应用和构建体与载体 | |
ES2629252T3 (es) | Célula de levadura fermentadora de pentosa y glucosa | |
JP2005500804A (ja) | イソプレノイド化合物生成に係る遺伝子 | |
CN102268430B (zh) | 果糖-1,6-二磷酸醛缩酶启动子及应用和构建体、载体 | |
CN112852650A (zh) | 一种高产檀香烯和檀香醇的酿酒酵母工程菌及其构建方法与应用 | |
KR20190005707A (ko) | 디옥시바이오라세인 생산능이 향상된 재조합 미생물 및 그를 이용한 디옥시바이오라세인을 생산하는 방법 | |
CN114457094A (zh) | 一种牡丹PoAGL15基因及其氨基酸序列和应用 | |
CN107858364A (zh) | 一种适于甲醇酵母表达的耐高温高比活细菌植酸酶基因 | |
DE60118401T2 (de) | Gen, das für das gumd polypeptid aus methylomonas sp. kodiert und das an der herstellung von exopolysacchariden beteiligt ist | |
CN102268431B (zh) | 乳清酸核苷-5’-磷酸脱羧酶启动子及应用和构建体与载体 | |
CN103204916B (zh) | 甘蔗蔗糖转运蛋白ShSUT2基因与应用 | |
CN102952821B (zh) | 紫花苜蓿苹果酸通道蛋白基因MsALMT1的植物表达载体及其应用 | |
CN112708603B (zh) | 水稻are2基因在植物氮代谢调控中的应用 | |
JP4157314B2 (ja) | 酢酸耐性遺伝子、該遺伝子を用いて育種された酢酸菌、及び該酢酸菌を用いた食酢の製造方法 | |
CN106119137B (zh) | 一种改善丝状真菌蛋白分泌能力的方法 | |
CN113736806A (zh) | 提高海洋微拟球藻油脂合成的基因及其用途 | |
CN114606170B (zh) | 一种基于CRISPR-Cas9的麦角硫因生物合成方法及应用 | |
EP1642977B1 (en) | Gene involved in growth-promoting function of acetic acid bacteria and uses thereof | |
CN111454964A (zh) | 油菜抗寒基因BnTR1及其编码蛋白与应用 | |
CN112094858B (zh) | 一种调控甘蔗钾吸收效率的SsCBL01基因及其应用 | |
US6335188B1 (en) | Endophyte ergot alkaloid synthetic compounds, compounds which encode therefor and related methods | |
CN113637682B (zh) | OsMYB26或其突变体在提高植物干旱胁迫耐受性中的应用 | |
CN112062822B (zh) | 一种碳分解代谢调控蛋白CcpA突变体I42A | |
CN112852775B (zh) | 一种深海真菌新型乙酰转移酶GliK及其编码基因和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130515 |
|
CF01 | Termination of patent right due to non-payment of annual fee |