编码黄酮合酶的基因
技术领域
本发明涉及通过基因工程技术控制和利用黄酮的生物合成,黄酮对植物中花的颜色,防紫外线的保护作用,与微生物的共生等有影响。更具体地,本发明涉及编码蛋白质的基因及其应用,所述蛋白质具有由黄烷酮合成黄酮的活性。
发明背景技术
五彩缤纷的不同花色是生活中令人愉快的事情,它能丰富人们的思想和内心世界。通过与微生物共生而加速植物生长,或通过增加豆科固氮细菌的数目从而使土壤中氮含量的增加而改良植物生产能力,希望可增加粮食产量以迎合将来人口增加的需求。要想获得更加符合环保要求的农业,需要消除或降低农药的使用,这就需要通过上述生物学方法改良土壤,并需要植物对微生物感染具有较高的抗性。另一个想达到的目标是得到防紫外线保护性功能较强的植物以保护植物免受臭氧层遭破坏的影响。
“类黄酮”是具有C6-C3-C6碳骨架的一组化合物的通称,它们广泛分布于植物细胞中。已知类黄酮具有吸引昆虫和其它传粉者的功能,可保护植物免受紫外线的侵袭,并参与与土壤微生物的相互作用(BioEssays,16(1994),Koes等,p123;Trends in Plant Science,1(1997),Shirley,B.W.,p.377)。
在类黄酮中,黄酮在植物与微生物的相互作用中起着重要作用,尤其是在豆科植物中更是如此,其中它们参与了与豆科细菌共生的起始步骤(植物细胞,7(1995),Dixon和Paiva,p.1085;植物病理学年评,33(1995),Spaink,p.345)。花瓣中的黄酮在被昆虫识别方面起作用并可用作辅色素而与花青苷形成复合物(Gendai Kagaku,(May,1998),Honda和Saito,p.25;Prog.Chem.Org.Natl.Prod.,52(1987),Goto,T.,p.114)。已知当黄酮与花青苷形成复合物时,花青苷的吸光度最大值往较长的波长偏移,即往蓝色方向偏移。
已广泛研究了类黄酮的生物合成途径(植物细胞,7(1995),Holton和Cornish,p.1071),已分离出参与花青素3-葡糖苷和黄酮醇生物合成的所有酶的基因。然而,尚未分离出参与黄酮生物合成的基因。合成黄酮的酶包括依赖于2-氧化戊二酸的属于双加氧酶家族的酶(黄酮合酶I)和属于细胞色素P450家族的单加氧酶(黄酮合酶II)。这些酶是没有结构同源性的完全不同的酶。
据报道,在欧芹中,依赖于2-氧化戊二酸的双加氧酶催化由柚苷配基(一种黄烷酮)生产芹菜苷配基(一种黄酮)的反应(Z.Naturforsch.,36C(1981),Britsch等,p.742;Arch.Biochem.Biophys.,282(1990),Britsch,p.152)。已知其它类型的黄酮合酶II存在于金鱼草(Z.Naturforsch.,36C(1981),Stotz和Forkmann,p.737)和大豆(Z.Naturforsch.,42C(1987),Kochs和Grisebach,p.343;Planta,171(1987),Kochs等,p.519)中。最近,有人报道了大丁草花瓣中的基因座和黄酮合酶II活性之间的相关性(植物化学,49(1998),Martens和Forkmann,p.1953)。然而,无人报道已分离出黄酮合酶I和II的基因或已高度纯化了黄酮合酶II。
研究了细胞色素P450蛋白的特性,该蛋白质具有甘草二酮-合成活性,当用诱发剂处理经培养的甘草(Glycyrrhiza echinata)细胞时可诱导该活性。据信该蛋白质可催化甘草根亭配基(其为5-脱氧黄烷酮)第2位的羟化,接着非酶促打开半缩醛环,产生甘草二酮(植物生理学,105(1994),Otani等,p.1427)。为了克隆甘草二酮合酶,由经诱导剂处理的甘草培养细胞制备cDNA文库,克隆出8个编码细胞色素P450的基因片断(植物科学,126(1997),Akashi等,p.39)。
由这些片断得到2个不同的全长cDNA序列,各编码细胞色素P450,直至那时它们仍是未知的。具体地说,它们是CYPGe-3(细胞色素P450 No.CYP81E1)和CYPGe-5(细胞色素P450 No.CYP93B1,下文称之为CYP93B1)(植物生理学,115(1997),Akashi等,p.1288)。通过在使用培养的昆虫细胞的系统中进一步表达CYP93B1 cDNA,证实该基因编码的蛋白质可催化由甘草根亭配基(一种黄烷酮)合成甘草二酮的反应,和由柚苷配基(一种黄烷酮)生产2-羟基柚苷配基的反应。
通过用10%盐酸进行酸处理(室温,2小时)使2-羟基柚苷配基转变为芹菜苷配基(一种黄酮)。通过使圣草酚与表达CYP93B1的酵母的微粒体反应,接着进行酸处理可将圣草酚转变为藤黄菌素(一种黄酮)。由此阐明细胞色素P450基因编码黄烷酮2-羟化酶活性的功能(FEBS Lett.,431(1998),Akashi等.,p.287)。这里,由柚苷配基生产芹菜苷配基需要CYP93B1以及另一个未知的酶,由此得出的结论是总共需要两种酶。
然而,目前尚未鉴定出具有不经酸处理直接由黄烷酮(如柚苷配基)合成黄酮(如芹菜苷配基)之活性的酶。因此,尽管黄酮在植物中具有多种功能,但控制植物中的黄酮生物合成和改善黄酮参与的生物功能,如花的颜色的技术尚未见报道。与将参与由黄烷酮合成黄酮的两种酶的基因导入植物细胞相比,本身可催化由黄烷酮合成黄酮的酶的发现,该酶基因的获得,以及将该基因导入植物中具有更强的可操作性和工业实用性。
发明公开
本发明的目的是提供黄酮合酶基因,优选为黄酮合酶II基因,更优选为具有直接由黄烷酮合成黄酮之活性的黄酮合酶的基因。可将所得黄酮合酶基因导入植物中并过量表达以改变花的颜色。
另外,在天然含有大量黄酮的花瓣中,预期通过反义方法或共抑制法控制黄酮合酶基因的表达也能改变花的颜色。另外,根据黄酮的抗细菌活性及其与土壤微生物的相互作用而在适当器官中表达黄酮合酶基因可增加植物抗细菌活性并因促进了与根际微生物的共生关系而改善豆科植物的固氮能力,并能获得防紫外线和光照的保护作用。
因此,本发明提供了编码可直接由黄烷酮合成黄酮的蛋白质的基因,该基因具体为编码黄酮合酶II的基因,黄酮合酶II可通过单个酶反应催化由黄烷酮合成黄酮的反应(下文称之为“黄酮合酶II”)。
更具体地,本发明提供了编码P450蛋白的基因,所述蛋白质具有序列表中SEQ ID NO:2,4或8所示的氨基酸序列,并具有由黄烷酮合成黄酮的活性,还提供了编码具有经修饰的氨基酸序列但仍具有由黄烷酮合成黄酮之活性的蛋白质的基因,其中所述修饰是通过在上述氨基酸序列中添加或缺失一个或多个氨基酸和/或用不同氨基酸取代完成的。
本发明还提供了编码具有与序列表中SEQ ID NO:2,4或8所示氨基酸序列至少有55%同一性的氨基酸序列的蛋白质的基因,所述蛋白质具有由黄烷酮合成黄酮的活性。
本发明还提供了编码具有由黄烷酮合成黄酮之活性的蛋白质的基因,该基因在5×SSC,50℃的条件下可与序列表中SEQ ID NO:1,3或7所示核苷酸序列的全部或部分杂交。
本发明还提供了载体,尤其是表达载体,其含有上述任一种基因。
本发明还提供了被上述载体转化的宿主。
本发明还提供了由上述任一种基因编码的蛋白质。
本发明还提供了生产上述蛋白质的方法,所述方法的特征在于培养上述宿主并从宿主中收集具有黄酮合成活性的蛋白质。
本发明还提供了其中导入了上述任一种基因的植物,或表现出相同特性的植物后代或其组织,如切花。
本发明还提供了使用上述基因改变类黄酮的量和组成的方法;使用上述基因改变黄酮量的方法;使用上述基因改变花的颜色的方法;使用上述基因使花的颜色变蓝的方法;使用上述基因使花的颜色更红的方法;使用上述基因修饰植物的光敏性的方法;使用上述基因控制植物和微生物之间的相互作用的方法。
附图简述
图1是显示使用由CYP93B1和TFNS5编码的蛋白质,由底物柚苷配基得到的产物的HPLC分析结果的色谱图。
A和B:加入表达CYP93B1之酵母的粗酶级分得到的结果。
C和D:加入表达TFNS5之酵母的粗酶级分得到的结果。
A和C:加入酶级分得到的直接产物。
B:A反应之后通过酸处理得到的产物。
D:C反应之后通过酸处理得到的产物。
实施本发明的具体方案
由甘草CYP93B1基因编码的黄烷酮2-羟化酶由底物黄烷酮产生了2-羟基黄烷酮,通过酸处理将产物转变为黄酮。本发明人认为通过使用得自甘草的cDNA CYP93B1筛选例如含有大量黄酮的花的cDNA文库,从而得到编码具有直接由底物黄烷酮合成黄酮之活性的蛋白质的cDNA,即可得到编码黄酮合酶II的基因(这是本发明的目的之一)。
根据本发明,使用得自甘草的cDNA CYP93B1为探针筛选含有大量黄酮的金鱼草的cDNA文库,可得到编码新细胞色素P450的cDNA(见实施例1)。以此方法得到的金鱼草cDNA ANFNS2和甘草CYP93B1 cDNA被用作混合探针以从蝴蝶草花瓣的cDNA文库中得到编码新型细胞色素P450的cDNA TFNS5(见实施例2)。
在酵母中表达得自蝴蝶草的cDNA并与底物柚苷配基(一种黄烷酮)反应,结果无需经酸处理即可产生黄酮芹菜苷配基而不是2-羟基柚苷配基(见实施例3)。换句话说,该酶可直接由黄烷酮产生黄酮,而无需经酸处理,经证实,其基因为以前从未克隆过的黄酮合酶II基因。由实施例1中得自金鱼草的ANFNS2编码的氨基酸序列与TFNS5编码的黄酮合酶II具有77%的高同一性,并且表现出黄酮合酶II的酶活性(实施例4)。另外,由于得自紫苏的cDNA所编码的氨基酸序列与TFNS5和ANFNS2所编码的氨基酸序列的同一性分别高达76%和75%(实施例8),推测由此cDNA编码的蛋白质也具有与TFNS5和ANFNS2所编码的黄酮合酶相同的酶活性。
本发明的基因可以是例如编码序列表中SEQ ID NO:2,4或8所示氨基酸序列的基因。然而,已知其氨基酸序列经添加或缺失多个氨基酸和/或被不同氨基酸取代而被修饰的蛋白质可保持与原始蛋白质相同的酶活性。因此,具有序列表中SEQ ID NO:2,4或8所示氨基酸序列,但其中的氨基酸序列经添加或缺失一个或多个氨基酸和/或被不同氨基酸取代而被修饰的蛋白质,以及编码所述蛋白质的基因也包含在本发明中,只要它们保持直接由黄烷酮生产黄酮之活性即可。
本发明还涉及具有SEQ ID NO:1,3或7所示核苷酸序列和编码本文所述氨基酸序列之核苷酸序列,或在例如5×SSC,50℃的条件下可与所述核苷酸序列的部分杂交的基因,条件是它们能编码具有由黄烷酮生产黄酮之活性的蛋白质。适当的杂交温度随核苷酸序列和核苷酸序列长度的不同而不同,例如,当所用探针是含有编码6个氨基酸的18个碱基长的DNA片断时,优选温度不超过50℃。
所述杂交选择的基因可以是天然的,例如得自如金鱼草,蝴蝶草或紫苏的植物基因;也可以是另一种植物的基因,如龙胆,马鞭草,菊,鸢尾草等的基因。杂交所选择的基因可以是cDNA或基因组DNA。
本发明还涉及编码具有与序列表中SEQ ID NO:2,4或8所示氨基酸序列至少有55%,优选至少70%,如80%或以上甚至90%或以上同一性的氨基酸序列的蛋白质的基因,所述蛋白质具有由黄烷酮合成黄酮的活性。
通过如实施例所述筛选cDNA文库可得到具有天然核苷酸序列的基因。可使用具有天然核苷酸序列的DNA作为起始物质,通过常规的定点诱变或PCR法合成编码具有经修饰的氨基酸序列的酶的DNA。例如,通过用限制性酶处理天然cDNA或基因组DNA,然后用作定点诱变或PCR(使用的引物中导入了所需的突变)的模板,即可得到其中导入所需修饰的DNA片断。然后可将已导入突变的DNA片断与编码靶酶另一部分的DNA片断连接。
或者,为了得到编码由缩短的氨基酸序列组成的酶的DNA,例如,可用所需的限制性核酸内切酶切割编码长于目的氨基酸序列的氨基酸序列(如全长氨基酸序列)的DNA,如果所得DNA片断不编码完整的靶氨基酸序列,可将该片断与含有其余序列的合成DNA连接。
可在使用大肠杆菌或酵母的表达系统中表达所得的基因,检测其酶活性以证实所得基因编码黄酮合酶。通过表达基因,也可得到黄酮合酶蛋白作为基因产物。或者,甚至可以使用SEQ ID NO:2,4或8所示的全部或部分氨基酸序列的抗体来得到黄酮合酶蛋白,可使用这种抗体克隆另一种生物中的黄酮合酶基因。
因此,本发明还涉及含有上述基因的重组载体,尤其是表达载体,并涉及被这些载体转化的宿主。所用宿主可以是原核或真核生物。常用作宿主的原核生物的例子包括埃希氏菌属的细菌,如大肠杆菌,和芽胞杆菌属的微生物,如枯草芽孢杆菌。
可以使用的真核宿主的例子包括低等真核生物,如真核微生物(如真菌门中的酵母和丝状真菌)。至于酵母,可提及的是属于糖酵母属的微生物,如酿酒酵母,至于丝状真菌,可提及的是属于曲霉属的微生物,如米曲霉和黑曲霉和青霉属的微生物。也可使用动物细胞和植物细胞,动物细胞可以是小鼠,仓鼠,猴或人的细胞系。也可使用昆虫细胞,如家蚕细胞或成年家蚕本身。
本发明的表达载体可包括表达调节区,如启动子和终止子,复制起点等,这取决于它们欲导入的宿主类型。可以使用的细菌表达载体启动子的例子包括常规的启动子,如trc启动子,tac启动子,lac启动子等。可以使用的酵母启动子的例子包括甘油醛-3-磷酸脱氢酶启动子,PH05启动子等。可以使用的丝状真菌启动子的例子包括淀粉酶启动子,trpC等。可以使用的动物细胞宿主启动子的例子包括病毒启动子,如SV40早期启动子,SV40晚期启动子等。
根据常规方法,使用限制性核酸内切酶,连接酶等可以制备表达载体。用表达载体转化宿主也可根据常规方法进行。
可以培养,栽培或发酵被表达载体转化的宿主,可根据常规方法,如过滤,离心分离,细胞破碎,凝胶过滤层析,离子交换层析等从培养产物中回收和纯化靶蛋白质。
本说明书全文讨论了得自金鱼草,蝴蝶草和紫苏的黄酮合酶II,该酶能直接由黄烷酮合成黄酮,已知细胞色素P450基因构成了超家族(DNA和细胞生物学,12(1993),Nelson等,p.1),相同家族中的细胞色素P450蛋白的氨基酸序列具有40%或更高的同一性,而亚家族中的细胞色素P450蛋白的氨基酸序列具有55%或更高的同一性,它们的基因能互相杂交(Pharmacogenetics,6(1996),Nelson等,p.1)。
例如,首次从矮牵牛属植物中分离出类黄酮3’,5’-羟化酶的基因,所述酶是细胞色素P450的一种并参与类黄酮合成途径(自然,366(1993),Holton等,p.276),使用矮牵牛类黄酮3’,5’-羟化酶基因作为探针易于从龙胆(植物细胞生理学,37(1996),Tanaka等,p.711),草原龙胆,风铃草(WO 93/18155(1993),Kikuchi等),薰衣草,蝴蝶草和马鞭草(Shokubutsu no Kagaku Chosetsu,33(1998),Tanaka等,p.55)中分离出类黄酮3’,5’-羟化酶基因。
因此,本发明的得自金鱼草,蝴蝶草或紫苏的能直接由黄烷酮合成黄酮的黄酮合酶II基因的全部或部分可用作探针以从不同种植物中得到能直接由黄烷酮合成黄酮的黄酮合酶II基因。另外,通过纯化本说明书中所述的得自金鱼草,蝴蝶草或紫苏的能直接由黄烷酮合成黄酮的黄酮合酶II,通过常规方法得到抗该酶的抗体,即可得到与抗体反应的不同黄酮合酶II蛋白,并得到编码这些蛋白质的基因。
因此,本发明并不仅限于得自金鱼草,蝴蝶草或紫苏的能直接由黄烷酮合成黄酮的黄酮合酶II基因,还涉及得自多种其它植物的能直接由黄烷酮合成黄酮的黄酮合酶II。除了本文所述的金鱼草,蝴蝶草和紫苏外,所述黄酮合酶II基因的来源还可以是龙胆,马鞭草,菊,鸢尾草,鸭跖草,矢车菊,鼠尾草,喜林草等,但本发明的范围不限于这些植物。
本发明还涉及通过导入一个或多个能直接由黄烷酮合成黄酮的黄酮合酶II基因使颜色被修饰的植物,以及植物的后代或其组织,所述组织也可以是切花的形式。通过使用本发明的黄酮合酶II或其已被克隆的基因,可以在只产生很少黄酮或根本不产生黄酮的植物种或变种中产生黄酮。通过在花瓣中表达一个或多个黄酮合酶II基因,可以增加花瓣中黄酮的量,从而使花的颜色往例如,蓝色方向转变。
相反,通过抑制黄酮在花瓣中合成,可以使花的颜色往例如,红色方向转变。然而,黄酮对花色的作用很大,因此花色的改变并不局限于上述类型。就目前的技术水平而言,可以将基因导入植物并以组成型或组织特异性的方式表达基因,但是,也可以通过反义法或共抑制法抑制靶基因的表达。
可转化的植物的例子包括玫瑰,菊,麝香石竹,金鱼草,仙客来,红门兰,草原龙胆,香雪兰,扶郎花,唐菖蒲,满天星,伽蓝菜,百合,天竺葵,老鹤草,碧冬茄,蝴蝶草,郁金香,水稻,大麦,小麦,油菜子,马铃薯,番茄,白杨,香蕉,桉树,甜马铃薯,大豆,苜蓿,羽扇豆,玉米等,但并不限于这些植物。
由于黄酮具有如上所述的多种生理学活性,它们可赋予植物新的生理学活性或经济价值。例如,通过在根中表达产生黄酮的基因,可以促进对该植物有利的微生物的生长,从而促进植物生长。也可以合成在人,动物或昆虫中表现出生理学活性的黄酮。
实施例
下列实施例将更详细地解释本发明。除非特别说明,可根据分子克隆(Sambrook等,1989)进行分子生物学方法。
实施例1.克隆金鱼草黄酮合酶II基因
从约5g黄色蝴蝶金鱼草的幼芽(商品名为Sakata-no-Tane,KK)中提取RNA,通过Oligotex得到polyA+RNA。根据Stratagene(Stratagene操作手册,Revision # 065001)推荐的方法,将polyA+RNA用作模板,使用λZAPII cDNA文库合成试剂盒(Stratagene)制备cDNA文库。使用全长cDNA CYP93B1为探针筛选cDNA文库。根据厂商推荐的方法,在低严紧条件下使用DIG-DNA-标记和检测试剂盒(Boehringer)进行阳性克隆的筛选和检测。
具体地说,42℃下,使用杂交缓冲液(5×SSC,30%甲酰胺,50mM磷酸钠缓冲液(pH7.0),1%SDS,2%阻断试剂(Boehringer),0.1%月桂酰基肌氨酸,80微克/ml鲑精DNA)预杂交2小时,然后加入DIG标记的探针,将混合物放置过夜。65℃下,用含有1%SDS的5×SSC洗涤溶液将膜浸洗1.5小时。得到一个阳性克隆,将其称为ANFNS1。通过测定ANFNS1之5’末端的核苷酸序列,预期ANFNS1编码与甘草CYP93B1编码的黄烷酮2-羟化酶具有高同一性的序列,推测其编码功能类似于黄烷酮2-羟化酶的P450。
然而,与CYP93B1编码的黄烷酮2-羟化酶的氨基酸序列比较的结果表明ANFNS1的cDNA不是全长的cDNA,缺乏与由起始的甲硫氨酸起的约65个氨基酸残基相对应的部分。因此,将ANFNS1 cDNA用作探针以再次筛选金鱼草cDNA文库,得到据信包括全长氨基酸序列的cDNA(ANFNS2)。由所得的ANFNS2编码的蛋白质在氨基酸水平上与金鱼草CYP93B1编码的黄烷酮2-羟化酶具有53%同一性。ANFNS2的核苷酸序列示于SEQ ID NO.1,由其推定的氨基酸序列示于SEQ ID NO.2。
实施例2.克隆蝴蝶草黄酮合酶II基因
从约2g蝴蝶草品种(品种名:Sunrenive,根据种苗法的品种登记申请号为7433,Suntory有限公司)的幼芽中提取RNA,通过Oligotex得到polyA+RNA。如实施例1所述,根据Stratagene推荐的方法,将polyA+RNA用作模板,使用λZAPII cDNA文库合成试剂盒(Stratagene)制备cDNA文库。使用上述CYP93B1 cDNA和ANFNS1 cDNA的混合物为探针筛选cDNA文库。按实施例1所述,在低严紧条件下进行阳性克隆的筛选和检测。
得到一个阳性克隆,将其称为TFNS5。通过测定TFNS5 cDNA完整的核苷酸序列,发现TFNS5 cDNA编码的蛋白质在氨基酸水平上与金鱼草CYP93B1编码的黄烷酮2-羟化酶具有52%同一性。TFNS5 cDNA也与实施例1所得的金鱼草cDNA ANFNS2编码的蛋白质具有高达77%的同一性。测定的核苷酸序列示于SEQ ID NO.3,由其推定的氨基酸序列示于SEQ ID NO.4。
实施例3.在酵母中表达蝴蝶草黄酮合酶II基因
进行下列实验以检测实施例2所得蝴蝶草cDNA TFNS5编码的蛋白质的酶活性。修饰基因翻译区域以外的部分以导入限制性酶位点,制备有义引物(5’-AAATA
GGATCCA AGCatgGACACAGTCTTAA-3’;下划线=BamHI位点;小写字母:起始密码子)(SEQ ID NO:5)和反义引物(5’-CCCT
TCTAGAtcaAGCACCCGATATTGTGGCCGGG-3’;下划线=XbaI位点;小写字母:终止密码子)(SEQ ID NO:6)。联合使用上述引物和KOD聚合酶(Toyobo)进行PCR反应。PCR条件是98℃1分钟;98℃15秒,55℃10秒,74℃30秒共20个循环;接着74℃10分钟。
将所得PCR产物导入pBluescript KS(-)(Stratagene)的EcoRV位点。用限制性酶BamHI和XbaI消化后导入酵母表达载体pYES2(Invitrogen)的BamHI-XbaI位点,然后将所得质粒导入BJ2168酵母(Nihon Gene)。通过Akashi等(FEBS Lett.,431(1998),Akashi等,p.287)所述的方法测定酶活性。30℃,在20ml选择培养基(6.7mg/ml无氨基酸的酵母含氮碱基(Difco),20mg/ml葡萄糖,30微克/ml亮氨酸,20微克/ml色氨酸和5mg/ml酪蛋白氨基酸)中将转化的酵母细胞培养24小时。
离心收集酵母细胞之后,30℃,在表达培养基(10mg/ml酵母提取物,10mg/ml蛋白胨,2微克/ml氯高铁血红素,20mg/ml半乳糖)中将收集的酵母细胞培养48小时。收集酵母细胞之后,通过悬浮在水中并收集细胞以进行洗涤。用玻璃珠破碎细胞10分钟,然后以8000g的转速离心细胞10分钟,以15,000g的转速进一步离心上清液10分钟以得到粗酶级分。
30℃下,将15微克(R,S)-柚苷配基(溶解于30微升2-甲氧乙醇中),1ml粗酶溶液和1mM NADPH的混合物(总反应混合物体积:1.05ml)反应2小时。通过加入30微升醋酸终止反应之后,加入1ml乙酸乙酯并混合。离心后,用蒸发器干燥乙酸乙酯层,将残留物质溶解于100微升甲醇中并用HPLC进行分析。根据Akashi等所述的方法进行分析。酸处理包括将蒸发器干燥的样品溶解于150微升含有10%盐酸的乙醇中,搅拌30分钟。用1.3ml水稀释,加入800微升乙酸乙酯,混合,离心,回收乙酸乙酯层,然后干燥,溶解于200微升甲醇中并用HPLC进行分析。
表达甘草CYP93B1的酵母由柚苷配基产生了2-羟基柚苷配基,而未产生芹菜苷配基(图1A),只有通过用酸处理反应混合物才可由2-羟基柚苷配基产生芹菜苷配基(图1B)。相反,表达蝴蝶草TFNS5的酵母由柚苷配基产生了芹菜苷配基,而无需用酸处理反应混合物(图1C),这表明TFNS5编码黄酮合酶II。
实施例4.在酵母中表达金鱼草黄酮合酶II基因
将通过用BamHI和SphI消化ANFNS2 cDNA得到的约1400bp DNA片断,通过用SphI和BamHI消化ANFNS2 cDNA得到的约350bp DNA片断以及用BamHI和XhoI消化的pYES2连接得到质粒,通过如实施例3所述的方法将得到的质粒导入酵母。通过如实施例3所述的方法,使用所得的重组酵母细胞测定黄酮合成活性。表达金鱼草ANFNS2的酵母未经酸处理即可产生芹菜苷配基,这表明ANFNS2编码黄酮合酶II。
实施例5.构建植物表达载体
构建植物表达载体以将实施例2所得的蝴蝶草cDNA TFNS5导入植物。用SacI消化pBE2113-Gus(植物细胞生理学,37(1996),Mitsuhara等,p.49)之后,使用平端化试剂盒(Takara)使其末端成为平端,然后插入XhoI接头(Toyobo)。用HindIII和EcoRI消化所得质粒,回收约3kb DNA片断,将DNA片断连接至二元载体pBINPLUS的HindIII/EcoRI位点以制备pBE2113’。按van Engelen等(转基因研究,4(1995),van Engelen等,p.288)报道的方法修饰二元载体Bin19(核酸研究,12(1984),Bevan,p.8711)可得到上述载体pBINPLUS,使用农杆菌细胞将基因导入植物的方法中广泛使用了载体Bin19。
通过用BamHI/XhoI裂解从SK(-)载体上切下TFNS5 cDNA,将所得的约1.7kb的片断连接至上述二元载体pBE2113’的BamHI/XhoI位点。所得构建体pSPB441在35S花椰菜花叶病毒启动子的控制之下,在有义方向上表达TFNS5 cDNA,所述启动子具有两个重复的增强子序列(植物细胞生理学,37(1996),Mitsuhara等,p.49)。
实施例6.改变蝴蝶草花的颜色
根据Aida等(繁殖科学,45(1995),Aida等,p.71)的方法,用实施例5构建的pSPB441转化蝴蝶草品种(品种名:Sunrenive,根据种苗法的品种登记申请号为7433,Suntory有限公司)。95%以上所得转化体表现出花色的改变,由亲本植株的深紫色变为浅紫色。测定4个花瓣中左和右花瓣的颜色。根据皇家园艺会的颜色图,亲本植株花瓣的颜色为89A号,但转化体普遍的花瓣颜色为82C,87D,87C,88D,91A等。这些结果表明将TFNS5导入植物会改变花色。
在转化的个体中,黄酮的量为宿主的1/5至1/10,而花青苷的量降低至宿主的约1/3。还检测到在宿主中未检测到的黄烷酮(柚苷配基,圣草酚和五羟黄烷酮),它是黄酮生物合成的前体。
实施例7.在矮牵牛中表达黄酮合酶
根据Napoli等的方法(植物细胞,2,(1990),Napoli等,p.279),将质粒pSPB441导入矮牵牛品种(品种名:Revolution Violet Mini,根据种苗法的品种登记申请号为9217,Suntory有限公司)。所得转化体中有2株表现出花色变化,花色较亲本植株浅。根据皇家园艺会的颜色图,亲本植株花色为88A,而转化体的花色为87A。在亲本植株中未检测到黄酮,但在转化植株中检测到黄酮藤黄菌素。
实施例8.克隆紫苏黄酮合酶II基因
使用实施例1所述的方法,筛选根据Gong等(植物分子生物学,35(1997),Gong等,p.915)的方法,使用λgt10(Stratagene)为载体由红紫苏(Perilla frutescens)叶制备的cDNA文库。根据Gong等(植物分子生物学,35(1997),Gong等,p.915)的方法进行培养,DNA制备和所得噬菌体克隆#3的亚克隆,测定核苷酸序列并示于SEQ IDNO:7。由该核苷酸序列编码的推定氨基酸序列示于SEQ ID NO:8。该氨基酸序列与TFNS5和ANFNS2的同一性分别为76%和75%。与CYP93B1的同一性为52%。
实施例9.在酵母中表达紫苏黄酮合酶II基因
通过实施例3所述的方法,将实施例8所得的噬菌体克隆#3用作PCR(使用λArm引物(Stratagene))模板。将扩增的DNA片断亚克隆至pBluescript KS(-)的EcoRV位点。选择在pBluescript KS(-)的SalI位点具有紫苏黄酮合酶II cDNA起始密码子的克隆,将其称为pFS3。测定pFS3 cDNA插入物的核苷酸序列,进行PCR以证实不存在错误。
将通过用SalI和XbaI消化pFS3得到的约1.8kb的DNA片断与已用XhoI和XbaI消化的pYES2(实施例3)连接,产生质粒pYFS3。然后通过实施例3所述的方法将所得质粒导入BJ2168酵母。当通过实施例3所述的方法测定该重组酵母的黄酮合酶活性时,证实了由柚苷配基产生了芹菜苷配基,表明紫苏噬菌体克隆#3 cDNA编码具有黄酮合酶II活性的蛋白质。
工业实用性
通过将本发明的cDNA与适当植物表达载体连接,并将其导入植物中以表达或抑制黄酮合酶的表达,即可改变花的颜色。另外,通过不仅在花瓣中还在整个植物或其适当器官中表达黄酮合酶基因,可以增加抗植物微生物的抗性,或者通过促进与根际微生物的关系而改善豆科植物的固氮能力,以及改善植物防紫外线和光照的保护性作用。
序列表<110>SUNTORY LIMITED<120>编码黄酮合成酶的基因<130>993009<160>8<210>1<211>1724<212>DNA<213>金鱼草<220><223>编码具有直接将黄烷酮转变为黄酮之活性的蛋白质的核苷酸序列<400>1gctttacaca cacacacaca cacacacaca caaacaaaa atg tct aca ctt gtc 54
Met Ser Thr Leu Val
1 5tac agc aca ctc ttc atc ctc tca acc ctc ctc ctc acc ctc cta acc 102Tyr Ser Thr Leu Phe Ile Leu Ser Thr Leu Leu Leu Thr Leu Leu Thr
10 15 20cgc acc cgc cgc aag acc cgc ccg ccc ggc cca tta gcc ctc ccc tta 150Arg Thr Arg Arg Lys Thr Arg Pro Pro Gly Pro Leu Ala Leu Pro Leu
25 30 35ata ggc cac tta cac ctc ctc ggc cca aag ctc cac cac acc ttc cac 198Ile Gly His Leu His Leu Leu Gly Pro Lys Leu His His Thr Phe His
40 45 50caa ttc tcc caa cgc tac ggc ccg ctc atc cag ctc tac ctc ggc tcc 246Gln Phe Ser Gln Arg Tyr Gly Pro Leu Ile Gln Leu Tyr Leu Gly Ser
55 60 65gtc cca tgc gtc gtc gct tcc acg ccc gaa ctc gcc cgc gaa ttc ctc 294Val Pro Cys Val Val Ala Ser Thr Pro Glu Leu Ala Arg Glu Phe Leu70 75 80 85aag acg cac gaa ctc gac ttc tcg tcc cgc aag cac tcc acc gcc atc 342Lys Thr His Glu Leu Asp Phe Ser Ser Arg Lys His Ser Thr Ala Ile
90 95 100gac atc gtc acg tac gac tcc tcg ttc gcc ttc gcg ccg tac ggg ccg 390Asp Ile Val Thr Tyr Asp Ser Ser Phe Ala Phe Ala Pro Tyr Gly Pro
105 110 115tac tgg aaa ttc atc aag aaa tta tgt act tac gag cta ctg ggt gcc 438Tyr Trp Lys Phe Ile Lys Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala
120 125 130cgg aac ttg agc cat ttc cag ccc att aga gct ttg gag gtc aac agt 486Arg Asn Leu Ser His Phe Gln Pro Ile Arg Ala Leu Glu Val Asn Ser
135 140 145ttc ttg aga att ttg tac gag aaa aca gag cag aaa cag agt gtt aat 534Phe Leu Arg Ile Leu Tyr Glu Lys Thr Glu Gln Lys Gln Ser Val Asn150 155 160 165gtg act gag gag ctt gtg aag ctg acg agt aat gtg atc agt aac atg 582Val Thr Glu Glu Leu Val Lys Leu Thr Ser Asn Val Ile Ser Asn Met
170 175 180atg ttg ggg atc agg tgt tcg ggg acg gaa ggg gag gcg gag gtg gcg 630Met Leu Gly Ile Arg Cys Ser Gly Thr Glu Gly Glu Ala Glu Val Ala
185 190 195agg acg gtg ata agg gag gtg acg cag ata ttt ggg gag ttt gat gtg 678Arg Thr Val Ile Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asp Val
200 205 210tcg gag att gtt tgg ttt tgt aag aat ttg gat ctg cag ggg att agg 726Ser Glu Ile Val Trp Phe Cys Lys Asn Leu Asp Leu Gln Gly Ile Arg
215 220 225aag agg tcg gag gat att agg agg agg tat gat gct ttg ttg gag aag 774Lys Arg Ser Glu Asp Ile Arg Arg Arg Tyr Asp Ala Leu Leu Glu Lys230 235 240 245att att agt gat agg gag agg ttg agg ttg agg ggg ggt ggt ggt gga 822Ile Ile Ser Asp Arg Glu Arg Leu Arg Leu Arg Gly Gly Gly Gly Gly
250 255 260ggg ggt gga gag gtg aag gat ttt ttg gat atg ttg ttg gat gtg atg 870Gly Gly Gly Glu Val Lys Asp Phe Leu Asp Met Leu Leu Asp Val Met
265 270 275gag agt gag aaa tcg gag gtg gag ttt acg agg gag cat ctc aaa gct 918Glu Ser Glu Lys Ser Glu Val Glu Phe Thr Arg Glu His Leu Lys Ala
280 285 290ttg att ctg gat ttc ttc act gcc ggt aca gac aca aca gca atc aca 966Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr Asp Thr Thr Ala Ile Thr
295 300 305aca gaa tgg gca ata gca gaa ctc att agc aat cca aat gta ctc aaa 1014Thr Glu Trp Ala Ile Ala Glu Leu Ile Ser Asn Pro Asn Val Leu Lys310 315 320 325aaa gct caa gaa gag atg gac aaa gtc ata gga tca caa agg ttg ttg 1062Lys Ala Gln Glu Glu Met Asp Lys Val Ile Gly Ser Gln Arg Leu Leu
330 335 340caa gaa tcc gac gcc cct aac ttg cct tac ctc aac gcg atc ata aaa 1110Gln Glu Ser Asp Ala Pro Asn Leu Pro Tyr Leu Asn Ala Ile Ile Lys
345 350 355gaa acg ttc cgt ctc cac cct cca atc ccc atg ctc act aga aaa tca 1158Glu Thr Phe Arg Leu His Pro Pro Ile Pro Met Leu Thr Arg Lys Ser
360 365 370att tct gac gtt gtg gtc aac ggg tac acg atc cct gcc aaa acg cta 1206Ile Ser Asp Val Val Val Asn Gly Tyr Thr Ile Pro Ala Lys Thr Leu
375 380 385ttg ttt gtc aac ctt tgg tcc atg gga agg aat cct aac tac tgg gaa 1254Leu Phe Val Asn Leu Trp Ser Met Gly Arg Asn Pro Asn Tyr Trp Glu390 395 400 405aat ccg atg gag ttc cga ccc gag agg ttt ctc gag aaa ggg acc ggg 1302Asn Pro Met Glu Phe Arg Pro Glu Arg Phe Leu Glu Lys Gly Thr Gly
410 415 420tcg ata gac gtt aaa ggg cag cat ttc gag ttg ctg ccg ttt ggc acg 1350Ser Ile Asp Val Lys Gly Gln His Phe Glu Leu Leu Pro Phe Gly Thr
425 430 435ggc agg cgg ggc tgc ccg ggg atg ttg tta ggc atg cag gag ttg ttt 1398Gly Arg Arg Gly Cys Pro Gly Met Leu Leu Gly Met Gln Glu Leu Phe
440 445 450agt att atc ggg gct atg gtg cag tgc ttc gat tgg aaa ctg ccc gat 1446Ser Ile Ile Gly Ala Met Val Gln Cys Phe Asp Trp Lys Leu Pro Asp
455 460 465ggt gtg aag tcg gtc gac atg acc gag cgg ccc ggg ttg acg gct cca 1494Gly Val Lys Ser Val Asp Met Thr Glu Arg Pro Gly Leu Thr Ala Pro470 475 480 485cgt gcc aat gat ttg gtg tgc caa ttg gtg cca cgg att gac ccg gtc 1542Arg Ala Asn Asp Leu Val Cys Gln Leu Val Pro Arg Ile Asp Pro Val
490 495 500gtt gtc tcc gga ccg tgaaccttaa ggtagtatcg ataatctgtt taatt 1592Val Val Ser Gly Pro
505aaattgttat ttgttgtgag gatttgattt ttgttatgta tgattatgcg tggattaaga 1652taagcctgca aggacaaatt ccctttcttt gattgatgtc aatgagtttg tgtcaaaaaa 1712aaaaaaaaaa aa 1724<210>2<21l>506<212>PRT<213>金鱼草<220><223>编码具有直接将黄烷酮转变为黄酮之活性的蛋白质的氨基酸序列<400>2Met Ser Thr Leu Val Tyr Ser Thr Leu Phe Ile Leu Ser Thr Leu Leu1 5 10 15Leu Thr Leu Leu Thr Arg Thr Arg Arg Lys Thr Arg Pro Pro Gly Pro
20 25 30Leu Ala Leu Pro Leu Ile Gly His Leu His Leu Leu Gly Pro Lys Leu
35 40 45His His Thr Phe His Gln Phe Ser Gln Arg Tyr Gly Pro Leu Ile Gln
50 55 60Leu Tyr Leu Gly Ser Val Pro cys Val Val Ala Ser Thr Pro Glu Leu65 70 75 80Ala Arg Glu Phe Leu Lys Thr His Glu Leu Asp Phe Ser Ser Arg Lys
85 90 95His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp Ser Ser Phe Ala Phe
100 105 110Ala Pro Tyr Gly Pro Tyr Trp Lys Phe Ile Lys Lys Leu Cys Thr Tyr
115 120 125Glu Leu Leu Gly Ala Arg Asn Leu Ser His Phe Gln Pro Ile Arg Ala
130 135 140Leu Glu Val Asn Ser Phe Leu Arg Ile Leu Tyr Glu Lys Thr Glu Gln145 150 155 160Lys Gln Ser Val Asn Val Thr Glu Glu Leu Val Lys Leu Thr Ser Asn
165 170 175Val Ile Ser Asn Met Met Leu Gly Ile Arg Cys Ser Gly Thr Glu Gly
180 185 190Glu Ala Glu Val Ala Arg Thr Val Ile Arg Glu Val Thr Gln Ile Phe
195 200 205Gly Glu Phe Asp Val Ser Glu Ile Val Trp Phe Cys Lys Asn Leu Asp
210 215 220Leu Gln Gly Ile Arg Lys Arg Ser Glu Asp Ile Arg Arg Arg Tyr Asp225 230 235 240Ala Leu Leu Glu Lys Ile Ile Ser Asp Arg Glu Arg Leu Arg Leu Arg
245 250 255Gly Gly Gly Gly Gly Gly Gly Gly Glu Val Lys Asp Phe Leu Asp Met
260 265 270Leu Leu Asp Val Met Glu Ser Glu Lys Ser Glu Val Glu Phe Thr Arg
275 280 285Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr Asp
290 295 300Thr Thr Ala Ile Thr Thr Glu Trp Ala Ile Ala Glu Leu Ile Ser Asn305 310 315 320Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Met Asp Lys Val Ile Gly
325 330 335Ser Gln Arg Leu Leu Gln Glu Ser Asp Ala Pro Asn Leu Pro Tyr Leu
340 345 350Asn Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro Met
355 360 365Leu Thr Arg Lys Ser Ile Ser Asp Val Val Val Asn Gly Tyr Thr Ile
370 375 380Pro Ala Lys Thr Leu Leu Phe Val Asn Leu Trp Ser Met Gly Arg Asn385 390 395 400Pro Asn Tyr Trp Glu Asn Pro Met Glu Phe Arg Pro Glu Arg Phe Leu
405 410 415Glu Lys Gly Thr Gly Ser Ile Asp Val Lys Gly Gln His Phe Glu Leu
420 425 430Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu Leu Gly
435 440 445Met Gln Glu Leu Phe Ser Ile Ile Gly Ala Met Val Gln Cys Phe Asp
450 455 460Trp Lys Leu Pro Asp Gly Val Lys Ser Val Asp Met Thr Glu Arg Pro465 470 475 480Gly Leu Thr Ala Pro Arg Ala Asn Asp Leu Val Cys Gln Leu Val Pro
485 490 495Arg Ile Asp Pro Val Val Val Ser Gly Pro
500 505<210>3<2ll>1730<212>DNA<213>蝴蝶草(Torenia hybrida)<220><223>编码具有直接将黄烷酮转变为黄酮之活性的蛋白质的核苷酸序列<400>3atcgaaaccg ctatatcatt acatttacaa cagcgctaaa aaaatatata taaagc 56atg gac aca gtc tta atc aca ctc tac acc gcc ctg ttc gtc atc acc 104Met Asp Thr Val Leu Ile Thr Leu Tyr Thr Ala Leu Phe Val Ile Thr1 5 10 15acc acc ttc ctc ctc ctc ctc cgc cga agg gga cca ccg tct ccg ccc 152Thr Thr Phe Leu Leu Leu Leu Arg Arg Arg Gly Pro Pro Ser Pro Pro
20 25 30ggt cct ctc tcc cta ccc ata att ggc cac ctc cac ctc ctc ggc cca 200Gly Pro Leu Ser Leu Pro Ile Ile Gly His Leu His Leu Leu Gly Pro
35 40 45aga ctc cac cac acg ttc cat gaa ttc tca ctc aaa tac ggc cca ttg 248Arg Leu His His Thr Phe His Glu Phe Ser Leu Lys Tyr Gly Pro Leu
50 55 60atc cag ctc aag ctc ggc tcg atc ccg tgc gtc gtg gcc tcg acg ccc 296Ile Gln Leu Lys Leu Gly Ser Ile Pro Cys Val Val Ala Ser Thr Pro65 70 75 80gag ctc gcg aga gag ttt ctt aag acg aac gag ctc gcg ttc tcc tct 344Glu Leu Ala Arg Glu Phe Leu Lys Thr Asn Glu Leu Ala Phe Ser Ser
85 90 95cgc aag cac tct acg gcc ata gac atc gtc acc tac gac tcg tcc ttt 392Arg Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp Ser Ser Phe
100 105 110gct ttc tct ccg tac gga ccc tac tgg aag tac atc aag aaa ctg tgt 440Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile Lys Lys Leu Cys
115 120 125acc tac gag ctg ctc gga gcg agg aac ctc gga cac ttt cag ccc att 488Thr Tyr Glu Leu Leu Gly Ala Arg Asn Leu Gly His Phe Gln Pro Ile
130 135 140agg aat ctc gag gtc agg tcc ttt ctg cag ctt ctg atg cac aag agc 536Arg Asn Leu Glu Val Arg Ser Phe Leu Gln Leu Leu Met His Lys Ser145 150 155 160ttt aag ggc gag agt gtg aat gtg aca gac gag ctg gtg agg ctg acg 584Phe Lys Gly Glu Ser Val Asn Val Thr Asp Glu Leu Val Arg Leu Thr
165 170 175agc aat gtg ata tcc cac atg atg ctg agc ata agg tgc tcg gaa gat 632Ser Asn Val Ile Ser His Met Met Leu Ser Ile Arg Cys Ser Glu Asp
180 185 190gaa ggc gat gct gag gcg gcg aga aca gtg ata cgc gag gtg acg cag 680Glu Gly Asp Ala Glu Ala Ala Arg Thr Val Ile Arg Glu Val Thr Gln
195 200 205ata ttt ggg gaa ttc gat gtt acg gac ata ata tgg ttt tgc aag aaa 728Ile Phe Gly Glu Phe Asp Val Thr Asp Ile Ile Trp Phe Cys Lys Lys
210 215 220ttc gat ctg cag ggg ata aag aag agg tca gag gat att cag agg agg 776Phe Asp Leu Gln Gly Ile Lys Lys Arg Ser Glu Asp Ile Gln Arg Arg225 230 235 240tat gat gct ttg ctc gag aag att att agt gat aga gag aga tcg agg 824Tyr Asp Ala Leu Leu Glu Lys Ile Ile Ser Asp Arg Glu Arg Ser Arg
245 250 255agg caa aat cgt gat aag cat ggt ggc ggt aac aat gag gag gcc aag 872Arg Gln Asn Arg Asp Lys His Gly Gly Gly Asn Asn Glu Glu Ala Lys
260 265 270gat ttt ctt gat atg ttg ctt gat gtg atg gag agt ggg gac acg gag 920Asp Phe Leu Asp Met Leu Leu Asp Val Met Glu Ser Gly Asp Thr Glu
275 280 285gtc aaa ttc act aga gag cat ctc aag gct ttg att ctg gat ttc ttc 968Val Lys Phe Thr Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe
290 295 300acg gcc ggt acg gac aca aca gcc ata gcc acc gag tgg gcc atc gcc 1016Thr Ala Gly Thr Asp Thr Thr Ala Ile Ala Thr Glu Trp Ala Ile Ala305 310 315 320gag ctc atc aac aac ccg aac gtc ttg aag aag gcc caa gaa gaa ata 1064Glu Leu Ile Asn Asn Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Ile
325 330 335tcc cgg atc atc gga acc aag cgg atc gta caa gaa tcc gac gcc cca 1112Ser Arg Ile Ile Gly Thr Lys Arg Ile Val Gln Glu Ser Asp Ala Pro
340 345 350gac cta ccc tac ctc cag gcc atc atc aag gag acg ttc cgg ctc cac 1160Asp Leu Pro Tyr Leu Gln Ala Ile Ile Lys Glu Thr Phe Arg Leu His
355 360 365cca ccg atc ccg atg ctc tcg cgt aag tcc acc tcc gat tgc acg gtc 1208Pro Pro Ile Pro Met Leu Ser Arg Lys Ser Thr Ser Asp Cys Thr Val
370 375 380aac ggc tac aaa atc caa gcc aag agc ctc ttg ttc gtg aac ata tgg 1256Asn Gly Tyr Lys Ile Gln Ala Lys Ser Leu Leu Phe Val Asn Ile Trp385 390 395 400tcc atc ggt cga aac cct aat tac tgg gaa agc cct atg gag ttc agg 1304Ser Ile Gly Arg Asn Pro Asn Tyr Trp Glu Ser Pro Met Glu Phe Arg
405 410 415ccc gag cgg ttc ttg gag aag gga cgc gag tcc atc gac gtc aag ggc 1352Pro Glu Arg Phe Leu Glu Lys Gly Arg Glu Ser Ile Asp Val Lys Gly
420 425 430cag cac ttt gag ctc ttg cct ttt ggg acg ggc cgc agg ggc tgt ccc 1400Gln His Phe Glu Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro
435 440 445ggt atg ttg ctg gct ata caa gag gtg gtc agc atc att ggg acc atg 1448Gly Met Leu Leu Ala Ile Gln Glu Val Val Ser Ile Ile Gly Thr Met
450 455 460gtt cag tgc ttc gac tgg aaa ttg gca gat ggt tcg ggc aat aat gtg 1496Val Gln Cys Phe Asp Trp Lys Leu Ala Asp Gly Ser Gly Asn Asn Val465 470 475 480gac atg acc gaa cgg tct gga ttg acc gct ccg aga gcg ttc gat ctg 1544Asp Met Thr Glu Arg Ser Gly Leu Thr Ala Pro Arg Ala Phe Asp Leu
485 490 495gtt tgc cgg ttg tat cca cgg gtt gac ccg gcc aca ata tcg ggt gct 1592Val Cys Arg Leu Tyr Pro Arg Val Asp Pro Ala Thr Ile Ser Gly Ala
500 505 510 512tgatgtagta gggtgaggcg cgtgttggtg ttttatcttt cggttttgtt ctgttagtat 1652tattatggtc tgtgttgaag cctcaaggat tttaaaaaaa aaaaaaaaaa aaaaaaaaaa 1712aaaaaaaaaa aaaaaaaa 1730<210>4<211>512<212>PRT<213>蝴蝶草<220><223>编码具有直接将黄烷酮转变为黄酮之活性的蛋白质的氨基酸序列<400>4Met Asp Thr Val Leu Ile Thr Leu Tyr Thr Ala Leu Phe Val Ile Thr1 5 10 15Thr Thr Phe Leu Leu Leu Leu Arg Arg Arg Gly Pro Pro Ser Pro Pro
20 25 30Gly Pro Leu Ser Leu Pro Ile Ile Gly His Leu His Leu Leu Gly Pro
35 40 45Arg Leu His His Thr Phe His Glu Phe Ser Leu Lys Tyr Gly Pro Leu
50 55 60Ile Gln Leu Lys Leu Gly Ser Ile Pro Cys Val Val Ala Ser Thr Pro65 70 75 80Glu Leu Ala Arg Glu Phe Leu Lys Thr Asn Glu Leu Ala Phe Ser Ser
85 90 95Arg Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp Ser Ser Phe
100 105 110Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile Lys Lys Leu Cys
115 120 125Thr Tyr Glu Leu Leu Gly Ala Arg Asn Leu Gly His Phe Gln Pro Ile
130 135 140Arg Asn Leu Glu Val Arg Ser Phe Leu Gln Leu Leu Met His Lys Ser145 150 155 160Phe Lys Gly Glu Ser Val Asn Val Thr Asp Glu Leu Val Arg Leu Thr
165 170 175Ser Asn Val Ile Ser His Met Met Leu Ser Ile Arg Cys Ser Glu Asp
180 185 190Glu Gly Asp Ala Glu Ala Ala Arg Thr Val Ile Arg Glu Val Thr Gln
195 200 205Ile Phe Gly Glu Phe Asp Val Thr Asp Ile Ile Trp Phe Cys Lys Lys
210 215 220Phe Asp Leu Gln Gly Ile Lys Lys Arg Ser Glu Asp Ile Gln Arg Arg225 230 235 240Tyr Asp Ala Leu Leu Glu Lys Ile Ile Ser Asp Arg Glu Arg Ser Arg
245 250 255Arg Gln Asn Arg Asp Lys His Gly Gly Gly Asn Asn Glu Glu Ala Lys
260 265 270Asp Phe Leu Asp Met Leu Leu Asp Val Met Glu Ser Gly Asp Thr Glu
275 280 285Val Lys Phe Thr Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe
290 295 300Thr Ala Gly Thr Asp Thr Thr Ala Ile Ala Thr Glu Trp Ala Ile Ala305 310 315 320Glu Leu Ile Asn Asn Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Ile
325 330 335Ser Arg Ile Ile Gly Thr Lys Arg Ile Val Gln Glu Ser Asp Ala Pro
340 345 350Asp Leu Pro Tyr Leu Gln Ala Ile Ile Lys Glu Thr Phe Arg Leu His
355 360 365Pro Pro Ile Pro Met Leu Ser Arg Lys Ser Thr Ser Asp Cys Thr Val
370 375 380Asn Gly Tyr Lys Ile Gln Ala Lys Ser Leu Leu Phe Val Asn Ile Trp385 390 395 400Ser Ile Gly Arg Asn Pro Asn Tyr Trp Glu Ser Pro Met Glu Phe Arg
405 410 415Pro Glu Arg Phe Leu Glu Lys Gly Arg Glu Ser Ile Asp Val Lys Gly
420 425 430Gln His Phe Glu Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro
435 440 445Gly Met Leu Leu Ala Ile Gln Glu Val Val Ser Ile Ile Gly Thr Met
450 455 460Val Gln Cys Phe Asp Trp Lys Leu Ala Asp Gly Ser Gly Asn Asn Val465 470 475 480Asp Met Thr Glu Arg Ser Gly Leu Thr Ala Pro Arg Ala Phe Asp Leu
485 490 495Val Cys Arg Leu Tyr Pro Arg Val Asp Pro Ala Thr Ile Ser Gly Ala
500 505 510<210>5<211>31<212>DNA<213>人工序列<220><223>引物<400>5aaataggatc caagcatgga cacagtctta a 31<210>6<211>35<212>DNA<213>人工序列<220><223>引物<400>6cccttctaga tcaagcaccc gatattgtgg ccggg 35<210>7<211>1770<212>DNA<213>紫苏<220><223>编码具有直接将黄烷酮转变为黄酮之活性的蛋白质的核苷酸序列<400>7tgtcgacgga gcaagtggaa atg gca ctg tac gcc gcc ctc ttc ctc ctg tcc 53
Met Ala Leu Tyr Ala Ala Leu Phe Leu Leu Ser
1 5 10gcc gcc gtg gtc cgc tcc gtt ctg gat cga aaa cgc ggg cgg ccg ccc 101Ala Ala Val Val Arg Ser Val Leu Asp Arg Lys Arg Gly Arg Pro Pro
15 20 25tac cct ccc ggg ccg ttc cct ctt ccc atc atc ggc cac tta cac ctc 149Tyr Pro Pro Gly Pro Phe Pro Leu Pro Ile Ile Gly His Leu His Leu
30 35 40ctc ggg ccg aga ctc cac caa acc ttc cac gat ctg tcc caa cgg tac 197Leu Gly Pro Arg Leu His Gln Thr Phe His Asp Leu Ser Gln Arg Tyr
45 50 55ggg ccc tta atg cag ctc cgc ctc ggg tcc atc cgc tgc gtc att gct 245Gly Pro Leu Met Gln Leu Arg Leu Gly Ser Ile Arg Cys Val Ile Ala60 65 70 75gcc tcg ccg gag ctc gcc aag gaa tgc ctc aag aca cac gag ctc gtc 293Ala Ser Pro Glu Leu Ala Lys Glu Cys Leu Lys Thr His Glu Leu Val
80 85 90ttc tcc tcc cgc aaa cac tcc acc gcc att gat atc gtc acc tac gat 341Phe Ser Ser Arg Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp
95 100 105tca tcc ttc gct ttc tct ccc tac ggg cct tac tgg aaa ttc atc aag 389Ser Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Phe Ile Lys
110 115 120aaa tta tgc acc tac gag ctg ctc ggg gcc cga aat ctc gcc cac ttt 437Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala Arg Asn Leu Ala His Phe
125 130 135cag ccc atc agg act ctc gaa gtc aag tct ttc ctc caa att ctt atg 485Gln Pro Ile Arg Thr Leu Glu Val Lys Ser Phe Leu Gln Ile Leu Met140 145 150 155cgc aag ggt gaa tcg ggg gag agc ttc aac gtg act gag gag ctc gtg 533Arg Lys Gly Glu Ser Gly Glu Ser Phe Asn Val Thr Glu Glu Leu Val
160 165 170aag ctg acg agc aac gtc ata tcg cat atg atg ctg agc ata cgg tgt 581Lys Leu Thr Ser Asn Val Ile Ser His Met Met Leu Ser Ile Arg Cys
175 180 185tca gag acg gag tcg gag gcg gag gcg gcg agg acg gtg att cgg gag 629Ser Glu Thr Glu Ser Glu Ala Glu Ala Ala Arg Thr Val Ile Arg Glu
190 195 200gtc acg cag ata ttt ggg gag ttc gac gtc tcc gac atc ata tgg ctt 677Val Thr Gln Ile Phe Gly Glu Phe Asp Val Ser Asp Ile Ile Trp Leu
205 210 215tgt aag aac ttc gat ttc caa ggt ata agg aag cgg tcc gag gat atc 725Cys Lys Asn Phe Asp Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp Ile220 225 230 235cag Asp Leu Gln Gly Ile Lys Lys Arg Ser Glu Asp Ile Gln Arg Arg225 230 235 240Tyr Asp Ala Leu Leu Glu Lys Ile Ile Ser Asp Arg Glu Arg Ser Arg
245 250 255Arg Gln Asn Arg Asp Lys His Gly Gly Gly Asn Asn Glu Glu Ala Lys
260 265 270Asp Phe Leu Asp Met Leu Leu Asp Val Met Glu Ser Gly Asp Thr Glu
275 280 285Val Lys Phe Thr Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe
290 295 300Thr Ala Gly Thr Asp Thr Thr Ala Ile Ala Thr Glu Trp Ala Ile Ala305 310 315 320acc gcc ggc acc gac acg acg gcg atc gtg tgt gaa tgg gcg ata gca 965Thr Ala Gly Thr Asp Thr Thr Ala Ile Val Cys Glu Trp Ala Ile Ala300 305 310 315gaa gtg atc aac aat cca aat gtg ttg aag aaa gct caa gaa gag att 1013Glu Val Ile Asn Asn Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Ile
320 325 330gcc aac atc gtc gga ttc gac aga att ctg caa gaa tcc gac gcc cca 1061Ala Asn Ile Val Gly Phe Asp Arg Ile Leu Gln Glu Ser Asp Ala Pro
335 340 345aat ctg ccc tac ctt caa gcc ctc atc aaa gaa aca ttc cgg ctc cac 1109Asn Leu Pro Tyr Leu Gln Ala Leu Ile Lys Glu Thr Phe Arg Leu His
350 355 360cct cca atc cca atg ctg gcg agg aaa tcg atc tcc gac tgc gtc atc 1157Pro Pro Ile Pro Met Leu Ala Arg Lys Ser Ile Ser Asp Cys Val Ile
365 370 375gac ggc tac atg att ccg gcc aac acg ctg ctc ttc gtc aac ctc tgg 1205Asp Gly Tyr Met Ile Pro Ala Asn Thr Leu Leu Phe Val Asn Leu Trp380 385 390 395tcc atg ggg cgg aac cct aaa atc tgg gac tac ccg acg gcg ttc cag 1253Ser Met Gly Arg Asn Pro Lys Ile Trp Asp Tyr Pro Thr Ala Phe Gln
400 405 410ccg gag agg ttt ctg gag aag gaa aag gcc gcc atc gat gtt aaa ggg 1301Pro Glu Arg Phe Leu Glu Lys Glu Lys Ala Ala Ile Asp Val Lys Gly
415 420 425cag cat ttt gag ctg cta ccg ttc gga acg ggc agg aga ggc tgc cca 1349Gln His Phe Glu Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro
430 435 440ggg atg ctt tta gcc att cag gag gtg gtc atc ata att ggg acg atg 1397Gly Met Leu Leu Ala Ile Gln Glu Val Val Ile Ile Ile Gly Thr Met
445 450 455att caa tgc ttc gat tgg aag ctg ccc gac ggc tcc ggc cat gtt gat 1445Ile Gln Cys Phe Asp Trp Lys Leu Pro Asp Gly Ser Gly His Val Asp460 465 470 475atg gca gaa cgg cca ggg ctc acg gca ccg cga gag acc gat ttg ttt 1493Met Ala Glu Arg Pro Gly Leu Thr Ala Pro Arg Glu Thr Asp Leu Phe
480 485 490tgc cgt gtg gtg ccg cga gtt gat ccg ttg gtt gtt tcc acc cag 1538Cys Arg Val Val Pro Arg Val Asp Pro Leu Val Val Ser Thr Gln
495 500 505tgatcacccc ctttaaattt attaatgata tatttttatt ttgagaaaaa ataaaaatgc 1598taattgtttt gtttcatgat gtaattgtta attagtttct attgtgcgct gtcgcgtgtc 1658gcgtggctta agataagatt gtatcattgg tacctaggat gtattttcat tttcaataaa 1718ttattttgtg ctgtgtatat taaaaaaaaa aaagaaaaaa aaaaaaaaaa aa 1770<210>8<211><212>PRT<213>紫苏<220><223>编码具有直接将黄烷酮转变为黄酮之活性的蛋白质的氨基酸序列<400>8Met Ala Leu Tyr Ala Ala Leu Phe Leu Leu Ser Ala Ala Val Val Arg1 5 10 15Ser Val Leu Asp Arg Lys Arg Gly Arg Pro Pro Tyr Pro Pro Gly Pro
20 25 30Phe Pro Leu Pro Ile Ile Gly His Leu His Leu Leu Gly Pro Arg Leu
35 40 45His Gln Thr Phe His Asp Leu Ser Gln Arg Tyr Gly Pro Leu Met Gln
50 55 60Leu Arg Leu Gly Ser Ile Arg Cys Val Ile Ala Ala Ser Pro Glu Leu65 70 75 80Ala Lys Glu Cys Leu Lys Thr His Glu Leu Val Phe Ser Ser Arg Lys
85 90 95His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp Ser Ser Phe Ala Phe
100 105 110Ser Pro Tyr Gly Pro Tyr Trp Lys Phe Ile Lys Lys Leu Cys Thr Tyr
115 120 125Glu Leu Leu Gly Ala Arg Asn Leu Ala His Phe Gln Pro Ile Arg Thr
130 135 140Leu Glu Val Lys Ser Phe Leu Gln Ile Leu Met Arg Lys Gly Glu Ser145 150 155 160Gly Glu Ser Phe Asn Val Thr Glu Glu Leu Val Lys Leu Thr Ser Asn
165 170 175Val Ile Ser His Met Met Leu Ser Ile Arg Cys Ser Glu Thr Glu Ser
180 185 190Glu Ala Glu Ala Ala Arg Thr Val Ile Arg Glu Val Thr Gln Ile Phe
195 200 205Gly Glu Phe Asp Val Ser Asp Ile Ile Trp Leu Cys Lys Asn Phe Asp
210 215 220Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp Ile Gln Arg Arg Tyr Asp225 230 235 240Ala Leu Leu Glu Lys Ile Ile Thr Asp Arg Glu Lys Gln Arg Arg Thr
245 250 255His Gly Gly Gly Gly Gly Gly Gly Glu Ala Lys Asp Phe Leu Asp Met
260 265 270Phe Leu Asp Ile Met Glu Ser Gly Lys Ala Glu Val Lys Phe Thr Arg
275 280 285Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr Asp
290 295 300Thr Thr Ala Ile Val Cys Glu Trp Ala Ile Ala Glu Val Ile Asn Asn305 310 315 320Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Ile Ala Asn Ile Val Gly
325 330 335Phe Asp Arg Ile Leu Gln Glu Ser Asp Ala Pro Asn Leu Pro Tyr Leu
340 345 350Gln Ala Leu Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro Met
355 360 365Leu Ala Arg Lys Ser Ile Ser Asp Cys Val Ile Asp Gly Tyr Met Ile
370 375 380Pro Ala Asn Thr Leu Leu Phe Val Asn Leu Trp Ser Met Gly Arg Asn385 390 395 400Pro Lys Ile Trp Asp Tyr Pro Thr Ala Phe Gln Pro Glu Arg Phe Leu
405 410 415Glu Lys Glu Lys Ala Ala Ile Asp Val Lys Gly Gln His Phe Glu Leu
420 425 430Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu Leu Ala
435 440 445Ile Gln Glu Val Val Ile Ile Ile Gly Thr Met Ile Gln Cys Phe Asp
450 455 460Trp Lys Leu Pro Asp Gly Ser Gly His Val Asp Met Ala Glu Arg Pro465 470 475 480Gly Leu Thr Ala Pro Arg Glu Thr Asp Leu Phe Cys Arg Val Val Pro
485 490 495Arg Val Asp Pro Leu Val Val Ser Thr Gln
500 505