CN1216583A

CN1216583A - 编码类黄酮途径酶的基因序列及其用途

Info

Publication number: CN1216583A
Application number: CN97193973A
Authority: CN
Inventors: F·布鲁里拉; T·A·霍尔顿; M·Z·米查尔
Original assignee: International Flower Developments Pty Ltd
Current assignee: International Flower Developments Pty Ltd; Florigene Pty Ltd
Priority date: 1996-03-01
Filing date: 1997-02-28
Publication date: 1999-05-12
Also published as: CA2247922A1; ATE406445T1; CN101381736A; JP2008148703A; DK0929676T3; JP4227185B2; JP2008167763A; US6774285B1; JP4435842B2; CA2247922C; JP4309462B2; JP2009022286A; JP4116665B2; AU1862197A; ES2313732T3; JP2010042018A; JP2007244390A; DE69738942D1; CN101693895A; AUPN838696A0

Abstract

本发明一般涉及编码类黄酮途径中代谢酶,更具体地,类黄酮3′－羟化酶(下文称为“F3′H”)或其衍生物的基因序列及它们在植物和其它生物中控制色素形成的用途。

Description

编码类黄酮途径酶的基因序列及其用途

本发明一般涉及编码类黄酮途径中代谢酶，更具体地，类黄酮3′-羟化酶(下文称为“F3’H”)或其衍生物的基因序列及其它们在植物和其它生物中控制色素形成的用途。

本说明书中作者提及的发表文章的文献目录详情收录在说明书结尾部分。说明书和权利要求书中提及的核苷酸和氨基酸序列的序列鉴定号(SEQ ID NOS)在文献目录后定义。SEQ ID NOs的概述及其所涉及的序列在实施例前提供。

在本说明书全文中，除非上下文另有要求，单词“包含”或其诸如现在时(comprises)或进行时(comprising)的时态变化将理解为指包括所述元件或整体或元件或整体组但不排除任何其它元件或整体或元件或整体组。

重组DNA技术迅速发展的改进极大地促进了与生物技术有关工业领域的研究和发展。园艺工业已成为该技术最近的受益者，该技术有助于在扦插后表现出衰老延缓的植物和花中形成疾病抗性。也有些注意力集中在控制花的颜色上。

花卉工业致力于形成新的和不同的开花植物品种。产生这样的新品种的一个有效的途径是通近控制花的颜色。使用经典育种技术已成功地产生了大多数商业花卉品种的许多颜色。然而，这种方法因受具体种类基因库的局限而受到限制，因此，很少使单一种类具有全色谱的有色品种。另外，传统的育种技术缺乏精确性。花的美学吸引力是诸如形态，香味和颜色的许多因素的组合：通过杂交对一种特征的修饰常常牺牲一种同样有价值的特征。在切花和观赏种类中以遗传工程精确改变颜色的能力在产业上将提供有意义的商业机会，它具有迅速的产品转向且其中新颖性是重要的市场特征。

花的颜色主要是由于两种类型的色素：类黄酮和类胡萝卜素。类黄酮提供由黄到红到蓝的颜色范围。类胡萝卜素提供橙色或黄色且通常是黄色或橙色花中的主要色素。对花的颜色起主要作用的类黄酮分子是花青苷，它是花青素，花翠素，3′-甲花翠素，甲基花青素，二甲翠雀素和花葵素的糖基化衍生物，且位于液泡中。不同的花青苷可产生明显不同的颜色。花的颜色也受无色类黄酮，金属复合物，糖基化，乙酰化和液泡pH的辅助色素形成作用的影响(Forkmann,1991)。

类黄酮色素的生物合成途径(下文称为“类黄酮途径”)已充分了解并在表示于图1a和1b中(Ebel和Hahlbrock,1988；Hahlbrock和Grisebach,1979；Wiering和De Vlaming,1984；Schram等，1984；Stafford,1990；van Tunen和Mol,1990；Dooner等，1991；Martin和Gerats,1993；Holton和Cornish,1995)。该途径中第一个参与的步骤涉及3个丙二酰-CoA分子与一个对香豆酰-CoA分子的缩合。该反应由查耳酮合成酶(CHS)催化。该反应的产物2’,4’,4’,6’-四羟基查耳酮正常情况下由查耳酮黄烷酮异构酶(CHI)迅速异构化产生4’,5,7-三羟黄烷酮。4’,5,7-三羟黄烷酮随后由黄烷酮3-羟化酶(F3H)在中央环的3位羟基化产生二氢四羟基黄酮(DHK)。

DHK B环的羟基化方式在决定花瓣颜色中起着关键性作用。B环可在3’处或在3’及5’两处羟基化分别产生二氢栎皮黄酮(DHQ)和二氢杨酶黄酮(DHM)。在该途径中涉及的两个关键酶是类黄酮3’-羟化酶和类黄酮3’,5’-羟化酶，两者均是细胞色素P450类。细胞色素P450酶在自然界中广泛分布，已从脊椎动物，昆虫，酵母，真菌，细菌和植物中分离并测序了它的基因。

类黄酮3’-羟化酶作用于DHK产生DHQ且作用于4’,5,7-三羟黄烷酮产生圣草酚。DHQ的还原和糖基化产生花青素糖苷和甲基花青素糖苷色素，在许多植物种类(例如玫瑰，石竹和菊)中这些色素产生红色和粉红色花色。这些花青苷的合成也可产生其它花色。例如，兰色矢车菊含有花色素苷。在开花植物中控制类黄酮3’-羟化酶活性或类黄酮途径中涉及的其它酶的能力可提供控制花瓣颜色的方法。由此可产生单一栽培品种的不同颜色形式，且在有些情况下，单一种类可产生更宽色谱的颜色。

已克隆了编码矮牵牛属类黄酮3’-羟化酶的核苷酸序列(本文称为SEQ ID NO:26)(见国际专利申请号PCT/AU93/00127[WO93/2026])。然而，该序列没有能力调节植物中3’-羟基化花青苷的合成。因此，需要鉴定其它有效调节植物中类黄酮化合物羟基化的编码类黄酮3’-羟化酶的进一步的基因序列。更具体地说，需要鉴定有效调节植物中3’-羟化花青苷合成的编码类黄酮3’-羟化酶的进一步的基因序列。

根据本发明，编码类黄酮3’-羟化酶的基因序列已得到鉴定和克隆。本发明的重组基因序列可以通过，例如，从头表达，过度表达，抑制，反义抑制和核酶活性来调节编码该酶的基因的表达。控制植物中类黄酮3’-羟化酶合成的能力可以调节每个花青苷的组成及改变类黄醇和花青苷的相对水平，从而能控制组织的颜色，如花瓣，叶，种子和果实的颜色。下文中描述的本发明涉及花的颜色的控制，但应理解为可延伸到控制其它植物组织比如叶，种子和果实。

因此，本发明的一个方面提供了分离的核酸分子，包含编码类黄酮3’-羟化酶或其衍生物的核酸序列，其中所述的类黄酮3’-羟化酶或其衍生物比SEQ ID NO:26所述的核苷酸序列编码的类黄酮3’-羟化酶能更有效地调节植物中类黄酮化合物的羟化。

本文所用的效率涉及类黄酮3’-羟化酶在植物细胞中羟化类黄酮化合物的能力。这给植物提供了类黄酮途径中其它酶的额外底物，从而能通过，例如，糖基化，酰基化和鼠李糖基化进一步修饰该分子以合成有助于形成一系列颜色的各种花青苷。由此，3’-羟基化的花青苷可以得到调节。其效率可以方便地通过选自下列参数的一种或多种参数来估计：以产生的mRNA的量测定的转录水平；4’,5,7-三羟黄烷酮和/或DHK的羟基化水平；以合成的翻译产物的量测定的mRNA翻译水平；DHQ或DHM的花青苷衍生物的合成水平；对组织如，花，种子，叶或水果的颜色的影响程度。

本发明的另一方面是关于分离的核酸分子，包含定位于矮牵牛属中名为Ht1或Ht2的遗传基因座上或其它有花植物种类相同的这类基因座上的核苷酸序列，其中所说的分离的核酸分子编码类黄酮3’-羟化酶或其互补于编码该酶的序列。

本发明的另一方面包含一种分离的核酸分子，包含对应于矮牵牛属中名为Ht1或Ht2的遗传基因座，或含控制3’-羟化类黄酮合成的序列的其它有关植物种类中基因座的核苷酸序列，其中所说的分离的核酸分子编码类黄酮3’-羟化酶或其衍生物，后者比SEQ ID NO:26所述的类黄酮3’-羟化酶能更有效地将DHK转化成DHQ。

根据本发明的上述方面，提供了一种核酸分子，它包含基本上如SEQ ID NO:1所述的或具有与其至少大约60％相似性或能在低度严格条件下与SEQ ID NO:1所述序列杂交的核苷酸序列或其互补核苷酸序列。

在有关实施方案中，提供了一种核酸分子，它包含基本上如SEQ IDNO:3所述的或具有与其至少大约60％相似性或能在低度严格条件下与SEQ ID NO:3所述序列杂交的核苷酸序列或其互补核苷酸序列。

在另一相关实施方案中，本发明涉及一种核酸分子，它包含基本上如SEQ ID NO:5所述的或具有与其至少大约60％相似性或能在低度严格条件下与SEQ ID NO:5所述的序列杂交的核苷酸序列或其互补核苷酸序列。

还有另一个相关的实施方案提供了一种核酸分子，它包含基本上如SEQ ID NO:7所述的或具有与其至少大约60％相似性或能在低度严格条件下与SEQ ID NO:7所述序列杂交的核苷酸序列或其互补核苷酸序列。

还有本发明另一个实施方案涉及一种核酸分子，它包含基本上如SEQ ID NO:9所述的或具有与其编码区至少大约60％相似性或能在低度严格条件下与SEQ ID NO:9所述序列杂交的核苷酸序列或其互补核苷酸序列。

在另一实施方案中，提供了一种核酸分子，它包含基本上如SEQ IDNO:14所述或具有与其至少大约60％相似性或能在低度严格条件下与SEQ ID NO:14所述序列杂交的核苷酸序列或其互补核苷酸序列。

在另一实施方案中，本发明涉及一种核酸分子。它包含基本上如SEQ ID NO:16所述或具有与其至少大约60％相似性或能在低度严格条件下与SEQ ID NO:16所述序列杂交的核苷酸序列或其互补核苷酸序列。

还有另一个实施方案提供了一种核酸分子，它包含基本上如SEQ IDNO:18所述的或具有与其至少大约60％相似性或能在低度严格条件下与SEQ ID NO:18所述的序列杂交的核苷酸序列或其互补核苷酸序列。

而且，本发明的另一实施方案涉及一种核酸分子，它包含基本上如SEQ ID NO:20所述的或具有与其至少大约60％相似性或能在低等严格条件下与SEQ ID NO:20所述的序列杂交的核苷酸序列或其互补核苷酸序列。

还有另一个实施方案涉及一种核酸分子，它包含基本上如SEQ IDNO:22所述的或具有与其至少大约60％相似性或能在低度严格条件下与SEQ ID NO:22所述的序列杂交的核苷酸序列或其互补核苷酸序列。

在另一实施方案中，本发明提供了一个核酸分子，它包含基本上如SEQ ID NO:24所述的或具有与其至少大约60％相似性或能在低等严格条件下与SEQ ID NO:24所述的序列杂交的核苷酸序列或其互补核苷酸序列。

在一个特别优选的实施方案中，提供了一种分离的核酸分子，它包含基本上如SEQ ID NO:1所述的或具有与其至少大约60％相似性或能在低度严格条件下与SEQ ID NO:1所述的序列杂交的核苷酸序列或其互补核苷酸序列，其中所述的核革酸序列定位到矮牵牛属中称为Ht1或Ht2的遗传基因座上或在其它开花植物种类中相应的这类基因座上，且其中所述的分离的核酸分子编码类黄酮3’-羟化酶，或与编码该酶的序列互补。

本文参考的42℃的低度严格条件包括和包含用于杂交的从至少大约1％到至少大约15％的甲酰胺和从至少大约1M到至少大约2M的盐，以及作为洗涤条件的至少大约1M到至少大约2M的盐。如果需要，可使用替换的严格条件，如中等严格条件，它包括和包含用于杂交的从至少大约16％到至少大约30％的甲酰胺和从至少大约0.5M到至少大约0.9M的盐，以及作为洗涤条件的至少大约0.5M到至少大约0.9M的盐，或高度严格条件，它包括和包含用于杂交的从至少大约31％到至少大约50％甲酰胺和从至少大约0.01M到至少大约0.15M的盐，以及作为洗涤条件的至少大约0.01M到至少大约0.15M的盐。杂交可在不同温度下进行，如果这样，可据此调节其它条件。

本发明的另一方面提供了一种核酸分子，它包括编码基本上如SEQID NO:2所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或与该编码序列互补的核苷酸序列。

在有关实施方案中，提供了一种核酸分子，它包括编码基本上如SEQ ID NO:4所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或与该编码序列互补的核苷酸序列。

本发明的另一相关实施方案涉及一种核酸分子，它包括编码基本上如SEQ ID NO:6所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或其互补序列。

还有另一相关的实施方案提供了一种核酸分子，它包括编码基本上如SEQ ID NO:8所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或其互补序列。

还有另一相关的实施方案涉及一种核酸分子，它包括编码基本上如SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列或其互补序列。

在另一实施方案中，本发明涉及一种核酸分子，它包括编码基本上如SEQ ID NO:15所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或其互补序列。

还有在另一实施方案中，提供了一种核酸分子，它包括编码基本上如SEQ ID NO:17所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或其互补序列。

在另一实施方案涉及一种核酸分子，它包括编码基本上如SEQ IDNO:19所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或其互补序列。

而且，本发明的另一实施方案涉及一种核酸分子，它包括编码基本上如SEQ ID NO:21所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或其互补序列。

还有一个实施方案涉及一种核酸分子，它包括编码基本上如SEQ IDNO:23所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或其互补序列。

在另一实施方案中，本发明提供了一种核酸分子，它包括编码基本上如SEQ ID NO:25所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或其互补序列。

在一个特别优选的实施方案中，提供了一种分离的核酸分子，它包括编码基本上如SEQ ID NO:2所述的氨基酸序列或具有与其至少大约50％相似性的氨基酸序列的核苷酸序列或其互补序列，其中所述的核苷酸序列定位到矮牵牛属中称为Ht1或Ht2的遗传基因座上或其它开花植物种类中相应的这类基因座上，其中所述的分离的核酸分子编码类黄酮3’-羟化酶或其衍生物或是该编码序列的互补序列。

本文使用的术语“相似性”包括在核苷酸或氨基酸水平上所比较的序列间完全相同。在核苷酸水平上没有相同性的地方，“相似性”包括产生在结构，功能，生物化学和/或构象水平上互相相关的不同氨基酸的序列之间的差异。在氨基酸水平上没有相同性的地方，“相似性”包括在结构，功能，生物化学和/或构象水平上互相相关的氨基酸。

SEQ ID NO:1所示的核酸分子编码来自矮牵牛属的类黄酮3’-羟化酶。其它适合的F3’H基因的例子来自石竹(SEQ ID NO:3)，金鱼草属(SEQ ID NO:5)，拟南芥属(SEQ ID NO:7)，拟南芥属基因组DNA克隆(SEQ ID NO:9)，玫瑰(SEQ ID NO:14)，菊(SEQID NO:16)，蝴蝶草属(SEQ ID NO:18)，日本牵牛花(SEQ ID NO:20)，龙胆(SEQ ID NO:22)和lisianthus(SEQ ID NO:24)。尽管本发明特别列举了上述F3’H基因，但本发明可延伸到任何植物种类的F3’H基因，只要这些F3’H基因在核苷酸水平上具有与选自SEQ ID NO:1或3或5或7或14或16或18或20或22或24的核酸分子至少大约60％的相似性或在氨基酸水平上具有与选自SEQ ID NO:2或4或6或8或10,11,12,13或15或17或19或21或23或25的氨基酸分子至少大约50％的相似性。本发明进一步延伸到来自任何植物种类的F3’H基因，只要这些F3’H基因在核苷酸水平上具有与SEQ ID NO:9的编码区域至少大约60％的相似性。

本发明的核酸分子一般是在非天然存在状态下的基因序列。一般来说，这意味着从其天然状态分离出来或人工合成或在非天然存在环境中产生。更具体地，它包括体外形成或维持的核酸分子，包括基因组DNA片段，重组或合成的分子和与异源性核酸连接的核酸。它也延伸到编码F3’H的基因组DNA或cDNA或其部分，或者相对于其自身的或其它启动子方向相反的部分。它进一步延伸到相对于其它核酸序列至少部分纯化的天然存在的序列。

术语“核酸分子”包括核酸分离物和基因序列，在本文中以其最普遍的含义使用，它包括F3’H中的氨基酸序列直接地或经碱基的互补系列限定的任何核苷酸碱基的接近系列。该氨基酸序列可组成全长的F3’H或其有活性的截短形式或可相应于该酶的特定区域，如N-端，C-端或中间部分。本文涉及的核酸分子也包含作为基因探针或作为能调节植物中相应基因表达的“反义”分子的寡核苷酸。本文使用的“反义分子”也可包括含有相对于其自身的或另一启动子反向的结构基因组或cDNA基因或其部分的基因构建体。因此，本发明的核酸分子可适用于作为共同抑制分子，核酶分子，有义分子和反义分子以调节3’-羟基化花青苷的水平。

在另一实施方案中，编码F3’H的核酸分子或其各种衍生物用于减小内源性F3’H的活性，选择性地，编码该酶的核酸分子或其各种衍生物以反义方向使用以减小F3’H的活性。尽管不希望以任一理论限制本发明，但将该核酸分子导入细胞中通过降低同源内源性基因的转录或通过增加相应mRNA的转换来产生这一结果是可能的。使用含有有义或反义方向的F3’H核酸分子或其各种衍生物的基因构建体可实现这一点。在更进一步的改进方案中，可使用核酶灭活靶核酸分子。选择性地，核酸分子编码一种功能性F3’H且它用于升高植物中该酶的水平。

本文提及的类黄酮F3’H活性的改变涉及将活性升高或降低到正常内源性或现存活性水平之上或之下达30％，或更优选30-50％，或甚至更优选50-75％或更优选75％或更大。使用Stotz和Forkmann(1982)所述方法的改进方式(见实施例7)或通过按实施例5所述测定F3’H产物，比如栎皮黄酮，花青素或甲基花青素的量可较容易地测定活性水平。

本发明进一步延伸到以寡核苷酸引物或探针形式存在的核酸分子，该引物或探针在高度，优选在中等，且最优选在低等严格条件下能与上述核酸分子，特别是选自SEQ ID NO:1,3,5,7,9,14,16,18,20,22或24中所述的核酸分子的一部分杂交。优选地该部分对应于F3’H基因的5’或3’端。为了方便，本文所说的5’端定义为基本上在初级转录子5’端至该基因中央部分之间的区域，本文所说的3’端定义为基本上在该基因中央部分至初级转录子3’端之间的区域。因此，很明显寡核苷酸或探针可与5’端或3’端或与5’和3’端共有的区域杂交。

核酸分子或其互补形式可编码全长酶或其部分或其衍生物。“衍生物”指相对于天然存在的酶有任意单一或多处氨基酸取代，缺失和增加，且包括部分，片段，分部，融合分子，同源物和类似物。关于这点，核酸包括天然存在的编码F3’H的核苷酸序列或可包含对所述天然存在的序列的单一或多个核苷酸取代，缺失和/或增加。融合分子可以是编码2个或多个F3’H的核苷酸序列之间的融合，或编码F3’H的核酸序列与编码任何其它蛋白质类分子的核苷酸序列之间的融合。融合分子在改变底物特异性中有用。

本发明的核酸分子或其互补形式或F3’H的衍生物也可包括不管其是否具有活性的“部分”。有活性的或有功能的核酸分子是编码具有F3’H活性的酶的分子。有活性的或有功能的分子进一步包括具有部分活性的分子，例如，底物特异性降低的F3’H应认为具有部分活性。核酸分子的衍生物可作为寡核苷酸探针，作为用于聚合酶链式反应或各种突变技术的引物，用于产生反义分子或核酶构建体。它们也可用于形成共同抑制构建体。根据本发明这一方面的核酸分子可编码或不编码具有功能的F3’H。“部分”可来自该核酸分子的5’端或3’端与5’及3’端共有的区域。

本发明的F3’H的氨基酸插入衍生物包括氨基和/或羟基末端融合物以及单个或多个氨基酸的序列内插入。插入氨基酸序列的变异体是那些其中将一个或多个氨基酸残基导入了蛋白质的预定位点的变异体，尽管也可能进行随机插入并适当筛选所得的产物。缺失变异体的特征在于从序列中去掉了一个或多个氨基酸。置换氨基酸变异体是那些其中序列中的至少一个残基被去掉并在其位置插入不同的残基的变异体。典型的置换是根据下面表1进行的取代。

表1

适合于氨基酸置换的残基原始残基典型的置换Ala SerArg LysAsn Gln；HisAsp GluCys SerGln AsnGlu AspGly ProHis Asn；GlnIle Leu；ValLeu Ile；ValLys Arg；Gln；GluMet Leu；IlePhe Met；Leu；TyrSer ThrThr SerTrp TyrTyr Trp；PheVal Ile；Leu

在F3’H通过氨基酸置换改变时，氨基酸一般被具有相似特性，如疏水性，亲水性，电负性，侧链大小等的其它氨基酸置换。典型的氨基酸置换是单一残基。氨基酸插入通常是大约1-10个氨基酸残基的级别，缺失变化范围为1-20个残基。优选地，缺失或插入在相邻的碱基对中进行，即，缺失2个残基或插入2个残基。

使用本领域熟知的肽合成技术，如固相肽合成(Merrifield,1964)等，或经重组DNA操作可较容易地制备上面提及的氨基酸变异体。在含已知或部分已知序列的DNA的预定位点进行置换突变的技术是熟知的，包括，例如，M13突变。用以产生表现为置换，插入或缺失变异体的变异蛋白质的DNA序列操作一般在，例如，Sambrook等(1989)中进行了描述。

本发明的F3’H的重组或合成突变体或衍生物的其它例子包括单个或多个置换，缺失和/或增加与酶相连的任意分子，如糖类、脂类和/或蛋白质或多肽。

术语“类似物”和“衍生物”也延伸到F3’H的任意的不管其是否有功能的化学等效物，还可延伸到上述任意氨基酸衍生物。如果本发明这个方面的“类似物”和“衍生物”是非功能性的，它们可作为F3’H活性的兴奋剂或拮抗剂。为了方便，本文提到的“F3’H”包括提及的任何衍生物，包括其部分，突变体，片段，同源物或类似物。

本发明用来自矮牵牛属，石竹，玫瑰，金鱼草属，拟南芥属，菊，lisianthus，蝴蝶草属，牵牛花和龙胆的核酸序列为例，因为它们代表了至今最常见和优选的材料来源。然而，本领域的技术人员将马上意识到相似的序列可以从任何来源，如从其它植物或某些微生物中分离。其它植物的例子包括，但不限于玉米，烟草，矢车菊，天竺葵属，苹果，扶郎花属和非洲紫罗兰。本发明包括所有这些直接或间接编码类黄酮途径的酶且特别是F3’H的核酸序列，而不考虑它们的来源。

本文期望的核酸分子能以单独的方式存在，也可与载体分子，如表达载体结合。术语载体分子以其最广的含义使用，包括用于核酸分子的能帮助将核酸转化入植物细胞和/或帮助整合到植物基因组中的任何中间载体。例如，中间载体可适合在电穿孔，微粒轰击，土壤杆菌介导的转化中使用或由DNA或RNA病毒插入。本文包含的中间载体和/或核酸分子可以或不必稳定整合入植物基因组。这样的载体分子也可在原核细胞中复制和/或表达。优选地，载体分子或其部分能整合到植物基因组中。核酸分子可另外含有能指导核酸分子在植物细胞中表达的启动子序列。核酸分子和启动子也可通过如上所述的任何方式导入细胞中。

根据本发明，编码F3’H或其衍生物或其部分的核酸分子可以任一方向导入植物来允许，许可或促进细胞质内mRNA的生产水平和/或由mRNA合成酶的水平，从而提供将DHK和/或其它合适的底物(如果在植物细胞中合成)最终转变成花色素的花青苷衍生物，如花青素和/或甲基花青素，或选择性地通过降低或消除内源性或现存的F3’H活性来抑制该代谢物这种转变。细胞质中mRNA的合成和/或由mRNA合成酶在本文中称为“表达”。花青素的合成有助于产生红或兰色的花色。在植物中以任一方向表达核酸分子可以是组成型的，诱导型的或发育型的，也可以是组织特异性的。

根据本发明的这一方面，提供了产生能合成F3’H或其功能性衍生物的转基因植物的的方法，所述的方法包括在允许所述的核酸分子最终表达的条件下用含有编码所述的F3’H的核酸序列的核酸分子稳定转化合适植物的细胞，从该细胞再生转基因植物并在足以允许核酸分子表达的条件下让所述的转基因植物生长一段时间。由此转基因植物可以产生相对于可比较的非转基因植物中表达的量更高水平的F3’H活性。

本发明的另一方面涉及一种用于产生减少内源性或现存F3’H活性的转基因植物的方法，所述的方法包括用含有编码F3’H的核苷酸序列或其互补序列的核酸分子稳定转化合适植物的细胞，从该细胞再生转基因植物，且如果需要，则在足以允许该核酸分子表达的条件下让所述的转基因植物生长。

本发明的另一方面涉及产生内源性或现存F3’H活性减小的遗传修饰的植物的方法，上述的方法包含通过用导入植物细胞的适当改变的F3’H基因或其衍生物或部分经同源重组修饰内源性序列来改变F3’H基因并从该细胞再生遗传修饰的植物。

根据本发明的这些方面，优选的核酸分子基本上如SEQ ID NO:1,3,5,7,14,16,18,20,22,24所述，或是9的编码区域，或具有与它们至少大约60％的相似性，或能在低度严格条件下与它们杂交。

在优选的实施方案中，本发明包含产生表现出改变的花色的转基因开花植物的方法，上述的方法包含用本发明的核酸分子稳定转化合适的植物细胞，从这些细胞再生转基因植物并在足以允许该核酸分子表达成F3’H酶的条件下让上述的转基因植物生长一段时间。选择性地，上述的方法可包括用本发明的核酸分子或其互补序列稳定转化合适的植物的细胞，从该细胞再生转基因植物并在足以改变内源性或现存F3’H活性水平的条件下让上述的转基因植物生长一段时间。优选地，改变了的水平应低于可比较的非转基因植物中内源性或现存的F3’H活性水平。

在相关实施方案中，本发明包含产生表现了改变的花色的开花植物的方法，所述的方法包含通过用导入植物细胞的适当改变的F3’H基因或其衍生物经同源重组修饰内源性序列来改变F3’H基因并从该细胞再生遗传修饰的植物。

本发明的核酸分子可以是或不是发育调控的。优选地，3’-羟基化的花青苷水平的调节导致花色改变，包括根据受体植物的生理条件产生红色花或其它颜色差别。“受体植物”是指能合成F3’H酶的底物或合成F3’H酶本身，且具有所需颜色发育必需的适当生理特性和基因型的植物。它可包括但不限于矮牵牛属，石竹，菊，玫瑰，金鱼草属，烟草，矢车菊，天竺葵属，lisianthus，扶郎花属，苹果，鸢尾，百合花，非洲紫罗兰，龙胆，蝴蝶草属和日本牵牛花。

因此，本发明推延到产生能调节3’-羟基化的花青苷水平的转基因植物的方法，所述的方法包括用含有编码F3’H或其衍生物的核苷酸序列或该编码序列的互补序列的核酸分子稳定转化合适植物的细胞或细胞团，从所述的细胞或细胞团再生转基因植物。

本领域的技术人员会马上知道可应用于本发明的方法的各种变化，如增加或减小靶植物中天然存在的酶活性水平使得颜色的差异不同。

因此，本发明延伸到含有全部或部分本发明的核酸元件和/或其任何同源或相关形式或它们中任何一个的反义形式的所有转基因植物，特别是那些表现出花色改变的转基因植物。该转基因植物可含有导入的核酸分子，该核酸分子含有编码F3’H的核苷酸序列或该编码序列的互补序列。一般来说，该核酸可稳定地导入植物基因组，尽管本发明还延伸到将F3’H核苷酸序列导入能在植物细胞内复制的自主复制核酸序列，如DNA或RNA病毒。本发明还延伸到从该转基因植物获得的种子。这类种子，特别是如果有色，则可用作植物的特有标记。

本发明的另一方面涉及F3’H的重组形式。该酶的重组形式提供了用于研究的材料来源来发展活性更大的酶，且可用于建立产生有色化合物的体外系统。

本发明还有一个方面涉及本文所述的基因序列在制造用于调节植物或植物细胞中的3’-羟基化花青苷水平的基因构建体中的用途。

本发明的另一方面提供了表现出花色改变的来自本文所述的转基因植物的花，特别是切花。

本发明的另一方面涉及含有编码F3’H或其衍生物的核苷酸序列或该编码序列的互补序列的核酸分子，其中所述的核酸分子能在植物细胞中表达。术语“表达(expressed)”相当于上文定义的术语“表达(expression)”。

根据本发明的这一和其它方面的核酸分子，相对于国际专利申请号PCT/AU93/00127[WO 93/20206]公开的质粒PCGP809中包含的PCGP619 cDNA插入片段的效率而言允许，许可或促进更高效率地调节3’-羟基化花青苷。术语“植物细胞”包括单个的植物细胞或植物细胞团，如愈伤组织中，小植株或植株或其部分，包括花和种子。

本发明的另一方面提供了包括编码F3’H的核苷酸序列或该编码序列的互补序列的核酸分子，其中所述的核酸分子的翻译产物含有氨基酸序列RPPNSGA。优选地，所述的核酸分子的翻译含有氨基酸序列RPPNSGAXHXAYNYXDL，且更优选地，所述的核酸分子的翻译产物包含氨基酸序列RPPNSGAXHXAYNYXDL[X]nGGEK，其中X代表任意氨基酸，[X]_n代表0至500位氨基酸的氨基酸序列。

本发明进一步由以下提及的非限制性的附图和实施例进行描述。在附图中：

图1a和1b是P.hybrida花中类黄酮生物合成途径的示意图，显示了转化中涉及的酶和遗传基因座。该途径中涉及的酶表示如下：PAL=苯丙氨酸氨基裂解酶；C4H=肉桂酸盐-4-羟化酶；4CL=4-香豆酸：CoA连接酶；CHS=查耳酮合成酶；CHI=查耳酮异构酶；F3H=黄烷酮-3-羟化酶；F3’H=类黄酮3’-羟化酶；F3’5’H=类黄酮3’5’羟化酶；FLS=黄烷醇合成酶；DFR=二氢黄烷醇-4-还原酶；ANS=花青苷合成酶；3GT=UDP-葡萄糖：花青苷-3-葡萄糖苷；3RT=UDP-鼠李糖：花青苷-3-葡萄糖苷鼠李糖苷转移酶；ACT=花青苷-3-芸香糖苷酰基转移酶；5GT=UDP-葡萄糖：花青苷5-葡萄糖苷转移酶；3’OMT=花青苷O-甲基转移酶；3’,5’OMT=花青苷3’,5’-O-甲基转移酶。在该途径中的3种类黄酮表示为：P-3-G=花葵素-3-葡萄糖苷；DHM=二氢杨酶黄酮；DHQ=二氢栎皮黄酮。在P.hybrida中仅以较低水平合成类黄醇，杨酶黄酮且极少合成花青苷，花葵素。

图2是质粒pCGP161的示意图，该质粒含有编码来自P.hybrida的肉桂酸-4-羟化酶的cDNA克隆(F1)。0.7kb EcoRⅠ/XhoⅠ片段的32P标记的片段用于探测美国国旗红花瓣的cDNA文库。详情见实施例4。缩写如下：Amp=氨苄青霉素抗性基因；ori=复制起点；T3=T3 RNA聚合酶的识别序列；T7=T7 RNA聚合酶的识别序列。也标记了限制性酶位点。

图3是质粒pCGP602的示意图，pCGP602含有编码来自P.hybrida的类黄酮3’5’羟化酶(Hf1)的cDNA克隆(617)。含Hf1编码区的1.6kb Bsp HⅠ/FspⅠ片段的³²P标记的片段用于探测国旗红花瓣的cDNA文库。详情见实施例4。缩写如下：Amp=氨苄青霉素抗性基因；ori=复制起点；T3=T3 RNA聚合酶的识别序列；T7=T7 RNA聚合酶的识别序列。还标记了限制性酶位点。

图4是质粒pCGP175的示意图，pCGP175含有编码来自P.hybrida的类黄酮3’5’羟化酶(Hf2)的cDNA克隆(H2)。一起含有Hf2编码区的1.3kb EcoRⅠ/XhoⅠ和0.5kb XhoⅠ片段的³²P标记的片段用于探测美国国旗红花瓣cDNA文库。详情见实施例4。缩写如下：Amp=氨苄青霉素抗性基因；ori=复制起点；T3≠T3 RNA聚合酶的识别序列；T7=T7 RNA聚合酶的识别序列。还标记了限制性酶位点。

图5是质粒pCGP619的示意图，pCGP619含有编码来自P.hybrida的细胞色素P450的651 cDNA克隆。1.8kb EcoRⅠ/XhoⅠ片段的³²P标记的片段用于探测美国国旗红花瓣的cDNA文库。详情见实施例4。缩写如下：Amp=氨苄青霉素抗性基因；ori=复制起点；T3=T3 RNA聚合酶的识别序列；T7=T7 RNA聚合酶的识别序列。还标记了限制性酶位点。

图6表示用pCGP1805中包含的OGR-38 cDNA克隆的³²P标记的片段探测的RNA印迹的放射自显影照片(见实施例6)。各泳道含有20μg从V23(ht1/ht1)×VR(Ht1/ht1)回交群体植物的花或叶分离的总RNA样品。在含高水平栎皮黄酮(Q⁺)的VR类(Ht1/ht1)花中检测到1.8kb的转录物(泳道9-14)。在含少量或不含栎皮黄酮(Q-)的V23类(ht1/ht1)花中检测到水平低得多的相同大小的转录物(泳道3-8)。在VR叶(泳道1)和V23花瓣(泳道2)中也检测到了减少的转录物水平。这在实施例5中描述。

图7是酵母表达质粒pCGP1646的示意图(见实施例7)。来自pCGP1805的OGR-38 cDNA插入片段以“有义”的方向克隆到表达载体pYE22m中的酵母甘油醛-3-磷酸脱氯酶启动子(PGAP)后。TRP1=Trp1基因，IR1=2μm质粒的反应重复，TGAP=来自酵母甘油醛-3-磷酸脱氢的基因的终止子序列。还标记了限制性酶位点。

图8是双元质粒pCGP1867的示意图(实施例8中所述)。pCGP1805的Ht1 cDNA插入片段(OGR-38)以“有义”的方向克隆到表达载体pCGP293的Mac启动子后。缩写如下：LB=左侧边界；RB=右侧边界；Gm=庆大霉素抗性基因；35S=来自花椰菜花叶病毒35S基因的启动子区；npt Ⅱ=新霉素磷酸转移酶Ⅱ基因；tm1 3’=来自土壤杆菌属tml基因的终止子区；mas 3’=来自土壤杆菌属的甘露碱合成酶基因的终止子区域。ori pRi=来自毛根土壤杆菌质粒的广谱宿主范围的复制起点；ori Col E1=来自Colcinin E1质粒的高拷贝复制起点。还标记了限制性酶位点。

图9是双元质粒pCGP1810的示意图，它的构建在实施例13中描述。来自pCGP1807的KC-1 cDNA插入片段(见实施例12)以“有义”的取向克隆到表达载体p CGP293的Mac启动子后。缩写如下：LB=左侧边界；RB=右侧边界；Gm=庆大霉素抗性基因；35S=来自花椰菜花叶病毒35S基因的启动子区；nptⅡ=新霉素磷酸转移酶Ⅱ基因；tml 3’=来自土壤杆菌属tml基因的终止子区域；mas 3’=来自土壤杆菌属甘露碱合成酶基因的终止子区域；ori pRi=来自毛根土壤杆菌质粒的广谱宿主范围的复制起点；ori Col E1=来自Colcinin E1质粒的高拷贝复制起点。还标记了限制性酶位点。

图10是双元质粒pCGP1813的示意图，其构建在实施例14中描述。来自pCGP1807的KC-1 cDNA插入片段(见实施例12)以“有义”方向克隆到mac启动子和mas终止子之间。Mac:KC-1:mas表达元件随后克隆到双元载体pWTT2132中。缩写如下：Tet=四环素抗性基因；LB=左侧边界；RB=右侧边界，sur B=来自乙酰乳酸合成酶基因的编码区和终止子序列；35S=来自花椰菜花叶病毒35S基因的启动子区，mas 3’=来自土壤杆菌属甘露碱合成酶基因的终止子区；PVS1=来自绿脓假单胞菌质粒的广谱宿主范围的复制起点，pACYCori=来自大肠杆菌pACYC184的修饰的复制子。还标记了限制性酶位点。

图11表示用Am 3Ga差异显示PCR片段的³²P标记的片段探测的Southern印迹的放射自显影照片(如实施例16所述)。各泳道含10μg从N8(Eos⁺),K16(eos^-)或K16×N8F2群体的植物中分离的EcoRV消化的基因组DNA样品。在来自产花青素的植物(表示为“+”)的基因组DNA中检测到杂交带(泳道1,3,4,5,6,7,9,10,12和15)。在来自不生产花青素的植物(用“-”表示)的基因组DNA样品中没有观察到特异性杂交(泳道2,8,11,13和14)。

图12表示用Am3Ga差异显示PCR片段的³²P标记的片段探测的RNA印迹的放射自显影照片。各泳道含10μg从N8(Eos⁺)×K16(eos^-)F2群体植物的花或叶分离的总RNA样品。在产生化青素的K16×N8F2花(花青素⁺)(植物#1,#3,#4,#5和#8)中检测到1.8Kb的转录物。在不产生花青素的K16×N8F2花(花青素^-)(植物#6,#11,#12)中或在花中产生花青素的K16×N8F2植物的叶样品(#13L)中没有检测到转录物。详情在实施例17中提供。

图13是双元质粒pCGP250的示意图，其构建在实施例20中描述。含来自pCGP246的1至1711位核苷酸(SEQ ID NO:5)的sd F3’HcDNA插入片段(见实施例18)以“有义”方向克隆到表达载体pCGP293的Mac启动子后。缩写如下：LB=左侧边界；RB=右侧边界；Gm=庆大霉素抗性基因；35S=来自花椰菜花叶病毒35S基因的启动子区；npt Ⅱ=新霉素磷酸转移酶Ⅱ基因；tml 3’=来自土壤杆菌属tml基因的终止子区；mas 3’=来自土壤杆菌属甘露碱合成酶基因的终止子区；ori pRi=来自毛根土壤杆菌质粒的广谱宿主范围的复制起点；oriCol E1=来自Colcinin E1质粒的高拷贝的复制起。还标记了限制性酶位点。

图14是双元质粒pCGP231的示意图，其构建在实施例20中描述。含来自pCGP246的104至1711位核苷酸(SEQ ID NO:5)的sd F3’HcDNA插入片段以“有义”方向克隆到表达载体pCGP293的Mac启动子后。缩写如下：LB=左侧边界；RB=右侧边界；Gm=庆大霉素抗性基因；35S=来自花椰菜叶病毒35S基因的启动子区；nptⅡ=新霉素磷酸转移酶Ⅱ基因；tml 3’=来自土壤杆菌属tml基因的终止子区；mas 3’=来自土壤杆菌属甘露碱合成酶基因的终止子区域；ori pRi=来自毛根土壤杆菌质粒的广谱宿主范围的复制起点；ori Col E1=来自colcinin E1质粒的高拷贝复制起点。还标记了限制性酶位点。

图15是双元质粒pBI-Tt 7-2的示意图。将来自E-5的6.5kb EcoRⅠ/SalⅠTt7基因组片段克隆到EcoRⅠ/SalⅠ切割的pBI101中，代替原有的GUS基因。所示的Tt7(F3’H)基因的方向(5’至3’)通过DNA测序确定。缩写如下：LB=左侧边界；RB=右侧边界；nos 5’=来自土壤杆菌属胭脂碱合成酶基因的启动子区；npt Ⅱ=新霉素磷酸转移酶Ⅱ基因的编码区；nos 3’=来自土壤杆菌属胭脂碱合成酶基因的终止子区域；npt Ⅰ=新霉素磷酸转移酶Ⅰ基因的编码区。还标记了限制性酶位点。

图16是双元质粒pCGP2166的示意图，其构建在实施例26中描述。来自pCGP2158的玫瑰#34 cDNA插入片段(见实施例25)以“有义”方向克隆到pCGP293表达载体的Mac启动子后。缩写如下：LB=左侧边界；RB=右侧边界；Gm=庆大霉素抗性基因；35S=来自花椰菜花叶病毒35S基因的启动子区；npt Ⅱ=新霉素磷酸转移酶Ⅱ基因；tml 3’=来自土壤杆菌属tml因的终止子区域；mas 3’=来自土壤杆菌属甘露碱合成酶基因的终止子区；ori pBi=来自毛根土壤杆菌质粒的广谱宿主范围的复制起点；ori Col E1=来自Colcinin E1质粒的高拷贝复制起点。还标记了限制性酶位点。

图17是双元质粒pCGP2169的示意图，其构建在实施例27中描述。来自pCGP2158的玫瑰#34 cDNA插入片段以“有义”方向克隆到CaMV35S启动子和ocs终止子之间。随后将35S：玫瑰#34:ocs表达元件克隆到双元载体pWTT2132中。缩写如下：Tet=四环素抗性基因；LB=左侧边界；RB=右侧边界；sur B=来自乙酰乳酸合成酶基因的主体区域和终止子区域；35S=来自花椰菜花叶病毒35S基因的启动子区域，OSS=来自土壤杆菌属章鱼碱合成酶基因的终止子区域；pVS1=来自绿脓假单胞菌质粒的广谱宿主范围的复制起点，pACY Cori=来自大肠杆菌的pACYC184的修饰的复制子。还标记了限制性酶位点。

图18是双元质粒pLN85的示意图，其构建在实施例28中描述。来自pCHRM1的菊RM6i cDNA插入片段以“反义”方向克隆到花椰菜花叶病毒35S基因启动子(35S)之后。其它缩写如下：LB=左侧边界；RB=右侧边界；ocs3’=来自土壤杆菌属章鱼碱合成酶基因的终止子区域；pnos:nptⅡ:nos 3’=含来自土壤杆菌属胭脂碱合成酶基因的启动子区表达元件；新霉素磷酸转移酶Ⅱ基因的编码区和来自土壤杆菌属胭脂碱合成酶基因的终止子区；ori T=复制转移起点；trfA^*=顺式作用复制功能；ori Col E1=来自Colcinin E1质粒的高拷贝复制起点；Tn 7SpR/StR=来自转座子Tn7的壮观霉素和链霉素抗性基因；ori VRK2=质粒RK2的广谱宿主范围的复制起点。还标记了限制性酶位点。

图19是酵母表达质粒pYTHT6的示意图，其构建在实施例30中描述。来自pTHT6的THT6 cDNA插入片段以“有义”方向克隆到表达载体pYE22m的酵母甘油醛-3-磷酸脱氢酶启动子(PGAP)后。缩写如下：TRP1=Trp1基因；IR1=2μm质粒的反向重复；TGAP=来自酵母甘油醛-3-磷酸脱氢酶基因的终止子序列。还标记了限制性酶位点。

本说明书中使用的氨基酸缩写在下面表2中显示。

表2

氨基酸缩写符号氨基酸 3字母符号单字母符号L-丙氨酸 Ala AL-精氨酸 Arg RL-天冬酰胺 Asn NL-天冬氨酸 Asp DL-半胱氨酸 Cys CL-谷氨酰胺 Gln QL-谷氨酸 Glu EL-甘氨酸 Gly GL-组氨酸 His HL-异亮氨酸 Ile IL-亮氨酸 Leu LL-赖氨酸 Lys KL-甲硫氨酸 Met ML-苯丙氨酸 Phe FL-脯氨酸 Pro PL-丝氨酸 Ser SL-苏氨酸 Thr TL-色氨酸 Trp WL-酪氨酸 Tyr YL-缬氨酸 Val V

表3提供了本文提及的序列指定的SEQ ID NO的总结：

表3序列物种 SEQ ID NOpCGP 1805的cDNA插入片段矮牵牛属 SEQ ID NO:1相应的氨基酸序列矮牵牛属 SEQ ID NO:2pCGP246的cDNA插入片段石竹 SEQ ID NO:3相应的氨基酸序列石竹 SEQ ID NO:4pCGP246的cDNA插入片段金鱼草属 SEQ ID NO:5相应的氨基酸序列金鱼草属 SEQ ID NO:6cDNA部分序列拟南芥属 SEQ ID NO:7相应的氨基酸序列拟南芥属 SEQ ID NO:8基因组序列拟南芥属 SEQ ID NO:9外显子Ⅰ的相应的氨基酸序列拟南芥属 SEQ ID NO:10外显子Ⅱ的相应氨基酸序列拟南芥属 SEQ ID NO:11外显子Ⅲ的相应氨基酸序列拟南芥属 SEQ ID NO:12外显子Ⅳ的相应氨基酸序列拟南芥属 SEQ ID NO:13pCGP2158的cDNA插入片段玫瑰 SEQ ID NO:14相应的氨基酸序列玫瑰 SEQ ID NO:15pCHRM1的cDNA插入片段菊 SEO ID NO:16相应的氨基酸序列菊 SEQ ID NO:17THT cDNA序列蝴蝶草属 SEQ ID NO:18相应的氨基酸序列蝴蝶草属 SEQ ID NO:19MHT 85 cDNA序列日本牵牛花 SEQ ID NO:20相应的氨基酸序列日本牵牛花 SEQ ID NO:21GHT13 cDNA序列龙胆 SEQ ID NO:22相应的氨基酸序列龙胆 SEQ ID NO:23pL3-6的cDNA插入片段 Lisianthus SEQ ID NO:24相应的氨基酸序列 Lisianthus SEQ ID NO:25出自WO 93/20206的cDNA序列矮牵牛属 SEQ ID NO:26寡核苷酸poly T-anch A SEQ ID NO:27寡核苷酸poly T-anch C SEQ ID NO:28寡核苷酸ploy T-anch G SEQ ID NO:29保守的氨基酸引物区 SEQ ID NO:30相应的寡核苷酸序列 SEQ ID NO:31保守的氨基酸引物区 SEQ ID NO:32相应的寡核苷酸序列 SEQ ID NO:33寡核苷酸引物Pet Haem-New SEQ ID NO:34保守的氨基酸引物区 SEQ ID NO:35相应的寡核苷酸序列 SEQ ID NO:36寡核苷酸Snapred Race A SEQ ID NO:37寡核苷酸Snapred Race C SEQ ID NO:38寡核苷酸poly-C Race SEQ ID NO:39寡核苷酸引物Pet Haem SEQ ID NO:40

分别含质粒pCGP 1867,pCGP1810和pCGP231的无毒的微生物根癌土壤杆菌菌株AGL0于1996年2月23日保存于澳大利亚政府分析实验室，1 suakin Street,Pymble,NeW South Wales,2037，澳大利亚，且指定的保藏号分别为96/10967,96/10968和96/10969。

分离类黄酮3’-羟化酶和相关的核酸序列实施例1植物材料矮牵牛属：

所用的Petunin hybrida品种在表4中提供。

表4

植物品种	特性	来源/参考文献
植物品种	特性	来源/参考文献	国旗兰(OGB)	杂种	Ball,Seed,USA
国旗红(OGR)	杂种	Ball Seed,USA	国旗兰(OGB)	杂种	Ball,Seed,USA
国旗红(OGR)	杂种	Ball Seed,USA	V23	An1,An2,An3,An4,An6,An8,An9,An10ph1,Hf1,Hf2,ht1,Rt,po,Bl,Fl	Wallroth等(1986)Doodeman等(1984)
R51	An1,An2, An3,an4,An6,An8,An9,An10,An11,Ph1,hf1,hf2,Ht1,rt,Po,bl,fl	Wallroth等(1986)Doodeman等(1984)	V23	An1,An2,An3,An4,An6,An8,An9,An10ph1,Hf1,Hf2,ht1,Rt,po,Bl,Fl	Wallroth等(1986)Doodeman等(1984)
R51		Wallroth等(1986)Doodeman等(1984)	VR	V23×R51 F₁杂种
SW63	An1,An2,An3,an4,An6,An8,An9,An10,An11,Ph1,Ph2,Ph5,hf1,hf2,ht1,ht2,po,mf1,fl	I.N.R.A.,Dijon,CedexFrance	VR	V23×R51 F₁杂种
SW63		I.N.R.A.,Dijon,CedexFrance	Skr4	An1,An2,An3,An4,An6,An11,hf1,hf2,ht1,Ph1,Ph2,Ph5,rt,Po,Mf1,Mf2,fl	I.N.R.A.,Dijon,CedexFrance
Skr4×SW63	F₁杂种		Skr4		I.N.R.A.,Dijon,CedexFrance

植物在光强度10,000 lux，白昼长度14小时，温度22℃至26℃的特定生长室中生长。石竹属：

麝香石竹变种Kortina Chanel的花从Van Wyk和Son FlowerSupply,Victoria获得。

麝香石竹花在如下限定的发育阶段收获：

阶段1：封闭的花蕾，花瓣不可见。

阶段2：花蕾张开：花瓣尖端可见。

阶段3：几乎全部花瓣尖端暴露。“画笔阶段”。

阶段4：外侧花瓣与茎成45℃角。

阶段5：花完全张开。金鱼草属

使用的金鱼草株系来自亲本株系K16(eos^-)和N8(Eos⁺)。F3’H活性与Eos基因之间有严格相关性，已知Eos基因控制黄烷酮，黄烷醇和花青苷的3’羟基化(Forkmann和Stotz,1981)。K16是缺乏F3’H活性的纯合隐性突变体，而N8是F3’H活性的野生型。这些品系相似，但不同源。亲本株系和来自自交(K16×N8)F1植物的种子从Dr.C.Martin(John Innes Centre,Norwich,UK)处获得。拟南芥属

拟南芥株系Columbia(Tt7)，Landsberg eracta(Tt7)和NW88(tt7)从诺丁汉拟南芥贮存中心(Nottingham ArabidopsisStock Centre)获得。野生型拟南芥(Tt7)种子具有特征性的棕色。tt7突变体的种子具有淡棕色的种子，其植株的特征在于叶中花青苷含量减小(Koornneef等，1982)。Tt7植物合成花青素，而tt7突变体中积累花葵素，表明Tt7基因控制类黄酮3’-羟基化。玫瑰：

Rosa hybrida变种Kardinal的花从Van Wyk和Son Flower Supply,Victoria获得。

Rosa hybrida花发育阶段限定如下：

阶段1：未沉积色素，紧密关闭的花蕾(10-12mm高；5mm宽)。

阶段2：沉积有色素，紧密关闭的花蕾(15mm高；9mm宽)。

阶段3：沉积有色素，关闭的花蕾；萼片刚开始打开(20-25mm高；13-15mm宽)

阶段4：花蕾开始张开；花瓣着色较重；萼片分离(花蕾25-30mm高且18mm宽)。

阶段5：萼片完全展开；其中一些卷曲。花瓣着色较重且展开(花蕾30-33mm高且20mm宽)。菊

菊花发育阶段限定如下：

阶段0：未见花蕾。

阶段1：花蕾可见：小花完全被苞片覆盖。

阶段2：花蕾张开：小花顶端可见。

阶段3：小花紧紧地重叠。

阶段4：几乎所有小花顶端暴露；外侧小花开放但不水平。

阶段5：外侧小花水平。

阶段6：花达到成熟。实施例2细菌菌株

使用的大肠杆菌菌株是：

DH5α suDE44,Δ(lacZYA-ArgF)U169,φ80lacZΔM15,hsdR17(r_k-, m_k+),recA1,

endA1,gyrA96,thi-1,relA1,deoR(Hanahan,1983和BRL,1986).

XL1-Blue MRF′ Δ(mcr A)183, Δ(mcrCB-hsdSMR-mrr)173,endA1,suDE44,thi-1,

recA1,gyrA96,relA1,laclF′rrQAB,laclqZΔM15,Tn10(Tet^r)]^c

(Stratagene)

XL1-Blue supE44,hsdR17(r_k-,m_k+),recA1,endA1,gyrA96,thi-1,relA1,

lac[F′proAB,laclq,lacZΔM15,Tn10(tet^r)]

SOLR e14^-(mcrA),Δ(mcrCB-hsdSMR-mrr)171,sbcC,recB,recJ,

umuC::Tn5(kan^r),uyrC,lac,gyrA96,thi-1,relA1,[F′proAB,

laclqZΔM15],Su^-非抑制性的(Stratagene)

DH10 B(Zip) F^-mcrA,Δ(mrr-hsdRMS-mcrBC),φ80d lacZΔM15,ΔlacX74,

deoR,recA1,araD139,Δ(ara,leu)7697,galU,galKlλ,rspL,

nupG

Y1090r^- ΔlacU169,(Δlon)?,araD139,strA,supF,mcrA,

trpC22::Tn10(Tetr)[pMC9 Amp^r,Tet^r],mcrB,hsdR

丧失毒性的根癌土壤杆菌菌株AGL0(Lazo等，1991)从R.Ludwig处(加利福利亚大学，生物学系，Santa Cruz,USA)获得。

克隆载体pBluescript从Stratagene公司获得。

根据Inoue等(1990)所述的方法进行大肠杆菌菌株DH5α细胞的转化。实施例3一般方法DNA探针的³²p标记

使用寡聚核苷酸标记试剂盒(Bresatec)用50μci[α-³²P]-dCTP放射性标记DNA片段(50-100ng)。未掺入的[α-³²P]-dCTP通过用Sephadex G-50(Fine)柱层析去除。DNA序列分析

使用来自应用生物系统的PRISM^TM Ready反应染色引物循环测序试剂盒进行DNA测序。按照厂商提供的方法进行。使用Perkin ElmerPCR仪(GeneAmp PCR System 9600)进行循环测序反应并在自动373A DNA测序仪(应用生物系统)上走胶。

使用FASTA和TFASTA程序(Pearson和Lipman,1988)或BLAST程序(Altschul等，1990)进行与Genbank,SWISS-PROT和EMBL数据库的同源性研究。使用LFASTA程序(Pearson和Lipman,1988)获得序列的相似百分数。除非另有说明，在所有情况下核苷酸序列比较使用的缺口值(ktup)为6，氨基酸序列比较使用的缺口值(ktup)为2。

使用在MacVector^TM 6.0(Oxford Molecular Ltd.)中应用的Clustal W程序进行多个序列排列(缺口值为2)。实施例4从P.hybrida变种国旗红中分离对应于Ht1基因座的类黄酮3’-羟化酶(F3’H)的cDNA克隆

为了分离连锁到Ht1基因座且编码矮牵牛属类黄酮途径中的类黄酮3’-羟化酶(F3’-H)的cDNA克隆，从阶段1至3的矮牵牛属国旗红(OGR)花中分离RNA并制备花瓣的cDNA文库。OGR花含以花青素为基础的色素且有高水平的类黄酮3’-羟化酶活性。用从已知在类黄酮途径中包含的3种细胞色素P450 cDNA克隆和在酵母中具有类黄酮3’-羟化酶活性的一种细胞色素P450 cDNA克隆(651)分离的³²P标记片段的混合物筛选OGRcDNA文库。这些包括一个编码肉桂酸-4-羟化酶(C4H)的矮牵牛属cDNA克隆和2个编码类黄酮3’,5’-羟化酶(F3’5’H)(Holton等，1993)的矮牵牛属cDNA克隆(由Hf1和Hf2基因座编码)。矮牵牛属变种OGR cDNA文库的构建

使用Turpen和Griffith(1986)的方法从P.hybrida变种OGR阶段1至3的花的花瓣组织分离总RNA。使用oligotex-dT^TM(Qiagen)从总RNA筛选Poly(A)⁺RNA。

用5μg从OGR的1至3阶段分离的poly(A)⁺RNA作模板，使用ZAP-cDNA GigapackⅢ Gold克隆试剂盒(stratagene)在λZAP中构建定向花瓣cDNA文库。获得的重组子总数为2.46×10⁶。

转染XL1-Blue MRF’细胞后，包装的cDNA混合物以每15cm直径平板50,000pfu涂板。平板在37℃培养8小时，噬菌体在100mM NaCl,8mM MgSO₄,50mM Tris-HCl pH8.0,0.01％(W/V)明胶[噬菌体贮存缓冲液(PSB)]中洗脱(Sambrook等，1989)。加入氯仿，并在4℃贮存作为扩增文库的噬菌体。

转染XL1-Blue MRF’细胞后，100,000pfu的扩增文库以每15cm平板10,000pfu的密度在NZY平板上铺板(Sambrook等，1989)，并在37℃培养8小时。在4℃放置过夜后，取一式二份转移到Colony/PlaqueScreen^TM滤膜(DuPont)上并按厂商建议进行处理。探针的分离：F3’5’H探针

按Holton等(1993)和美国专利号5,349,125所述分离的对应于Hf1或Hf2基因座的2个类黄酮3’,5’羟化酶在筛选方法中应用。来自矮牵牛属的C4H cDNA克隆

在用于分离对应于Hf1或Hf2基因座的2个类黄酮3’,5’-羟化酶cDNA克隆的筛选方法中(Holton等，1993；美国专利号5,349,125)分离了许多细胞色素P450 cDNA克隆。这些cDNA克隆中一个(F1)(包含于pCGP 161中)(图2)根据与以前鉴定的来自绿豆的C4H克隆的序列相同性鉴定为编码肉桂酸4-羟化酶(C4H)(Mizutani等，1993)。序列数据从矮牵牛属F1 cDNA克隆5’端的295个核苷酸产生。在测序的295个核苷酸中与绿豆C4H克隆有83.1％的相似性且在推测的氢基酸序列中有93.9％的相似性。651 cDNA克隆

包含于pCGP619(图5)中的651 cDNA克隆的分离与鉴定在公开号为WO93/20206的国际专利申请中描述。在pYE22m(Tanaka等，1988)的酵母甘油醛-3-磷酸脱氢酶启动子控制下的含651 cDNA克隆的酵母蛋白质提取物表现出F3’H活性。OGR文库的筛选

杂交前，一式两份的噬菌斑转移膜于65℃在预洗溶液(50mMTirs-HCl pH7.5,1M NaCl,1mM EDTA,0.1％(W/N)肌氨酸)中洗涤30分钟；于65℃在0.4M氢氧化钠中变性30分钟；然后于65℃在0.2MTris-HCl pH8.0,0.1×ssc,0.1％(W/V)SDS溶液中洗30分钟并最后在2×SSC,1.0％(W/V)SDS中漂洗。

用(1)来自含C4H cDNA克隆的pCGP161(图2)的0.7 kb EcoRⅠ/XhoⅠ片段，(2)来自含Hf1 cDNA克隆的pCGP602(图3)的1.6kb Bsp HⅠ/FspⅠ片段，(3)来自含Hf2 cDNA克隆编码区的pCGP175(图4)的1.3kb Eco RⅠ/Xho Ⅰ片段和0.5kb XhoⅠ片段和(4)来自含651 cDNA克隆的pCGP619(图5)的1.8kb Eco RⅠ/XhoⅠ片段的³²P标记片段筛选OGR cDNA文库的转移膜。

杂交条件包括在10％(V/V)甲酰胺，1M NaCl,10％(W/V)硫酸葡聚糖，1％(W/V)SDS中42℃至少1小时的预杂交步骤。然后将32P标记的片段(各以1×10⁶cpm/ml)加入杂交溶液中，接着在42℃下再杂交16小时。然后在2×SSC,1％(W/V)SDS中于42℃洗膜2×1小时并用具有增感屏的柯达XAR胶片在-70℃下曝光16小时。

将230个强杂交噬菌斑挑入PSB中。使用所述的对cDNA文库起始筛选的杂交条件再次筛选得到其中39个噬菌斑为分离纯化的噬菌斑。找出包含于λZAP噬菌体载体中的质粒，序列数据从cDNA插入片段3’和5’端产生。根据序列同源性，39个中的27个与矮牵牛属肉桂酸4-羟化酶cDNA克隆相同，39个中的2个与Hf1 cDNA克隆相同，39个中的7个不代表细胞色素P450。与筛选方法中所用的细胞色素P450克隆相比，剩下的3个cDNA克隆(命名为OGR-27,OGR-38,OGR-39)代表“新”细胞色素P450并将进一步得到鉴定。实施例5限制性片段长度多态性(RFLP)分析

在P.hybrida中有2个控制类黄酮3’-羟化酶活性的遗传基因座，Ht1和Ht2(Tabak等，1978；Wiering和de Vlaming,1984)。Ht1在P.hybrida花的花瓣和花粉管中均有表达且比仅在花粉管中表达的Ht2产生更高的F3’H活性水平。F3’H能将二氢四羟基黄酮和4’,5,7-三羟黄烷酮分别转变成二氢栎皮黄酮和圣草酚。在产生以花翠素为基础的色素的花中，F3’H活性被F3’5’H活性掩盖。因此，F3’H/F3’5’H测定(Stotz和Forkmann,1982)在测定是否存在F3’H活性中无用。类黄醇合成酶能将二氢四羟基黄酮转变成四羟基黄酮并将二氢栎皮黄酮转变成栎皮黄酮(图1a)。在矮牵牛属花中以较低水平合成杨酶黄酮，3’,5’-羟基化类黄醇。因此，分析花中的3’羟基化类黄醇，栎皮黄酮可指示F3’H活性的存在。

对从在VR(Ht1/ht1)×V23(ht1/ht1)回交中的植物个体分离的DNA进行的限制性片段长度多态性(RFLP)分析用于确定哪一种(如果有的话)代表P450的cDNA克隆与Ht1基因座连锁。对从这些植物分离的RNA进行的Northern分析用于检测在这些株系中是否存在转录物。

分析VR(Ht1/ht1)×V23(ht1/ht1)回交群体花中类黄醇，四羟基黄酮和栎皮黄酮的存在。VR(Ht1/ht1)花积累栎皮黄酮和低水平的四羟基黄酮，而V23(ht1/ht1)花积累四羟基黄酮但极少或没有栎皮黄酮。来自VR(Ht1/ht1)×V23(ht1/ht1)回交的植物个体，如果在花提取物中检测到高水平的栎皮黄酮，则命名为VR类(Ht1/ht1)，如果在花提取物中检测到极少或没有栎皮黄酮但有高水平的四羟基黄酮，则命名为V23类(ht1/ht1)(见图6)。基因组DNA的分离

基本上按Dellaporta等(1983)所述从叶组织分离DNA。以CsCl浮力密度离心进一步纯化该DNA制品(Sambrook等，1989)。Southern印迹

用60单位的Eco RⅠ消化基因组DNA(10μg)16小时并通过在TAE电泳缓冲液(40mM Tris-乙酸盐，50mM EDTA)中的0.7％(W/V)琼脂糖凝胶走电泳。然后在变性溶液(1.5M NaCl/0.5MNaOH)中变性DNA 1至1.5小时，在0.5M Tris-HCl(pH7.5)/1.5M NaCl中和2至3小时，然后转移到在20×SSC中的Hybond N(Amersham)滤膜上。RNA印迹

使用Turpen和Griffith的方法(1986)从P.hybrida变种OGR阶段1至3的花的花瓣组织中分离总RNA。

RNA样品使用含40mM吗啉代丙磺酸(pH7.0),5mM乙酸钠，0.1mM EDTA(pH8.0)的电泳缓冲液通过2.2M甲醛/1.2％(W/V)琼脂糖凝胶走电泳。按厂商所述将RNA转移到Hybond-N滤膜(Amersham)上。杂交和洗涤条件

Southern和RNA印迹用³²P标记的cDNA片段(10⁸cpm/μg,2×10⁶cpm/mL)探测。预杂交(42℃1小时)和杂交(42℃16小时)在50％(V/V)甲酰胺，1M NaCl,1％(W/V)SDS,10％(W/V)硫酸葡聚糖中进行。滤膜在2×SSC,1％(W/V)SDS中于65℃洗涤1至2小时，然后在0.2×SSC,1％(W/V)SDS中于65℃洗涤0.5至1小时。滤膜用具有增感屏的柯达XAR胶片在-70℃曝光16小时。细胞色素P450片段的RFLP和Northern分析：

使用RFLP分析研究对应于OGR-27,OGR-38和OGR-39cDNA克隆的基因与Ht1基因座的连锁关系。OGR-27,OGR-38和OGR-39 cDNA克隆的³²P标记片段用于探测从VR×V23回交群体的植物个体中分离的基因组DNA的RNA印迹和Southern印迹。从VR×V23回交群体分离的EcoRI消化的基因组DNA的分析揭示了与Ht1连锁的OGR-38探针的RFLP。而且与在VR类株系中检测到的高水平的转录物相比，在V23类株系中检测到的转录物水平要低得多(图6)。

这些数据提供了强有力的证据，证明包含于质粒pCGP1805中的OGR-38 cDNA克隆对应于Ht1基因座且代表F3’H。V23×R51 F2回交的RFLP分析

RFLP分析用于研究对应于OGR-38 cDNA的基因与已知遗传基因座的连锁关系。

使用MapMaker图谱程序的Macintosh 2.0版本(Du Pont)(Lander等，1987)进行RFLP连锁分析。LOD分数3.0用来作为连锁阈值。

从V23×R51 F2群体分离的Eco RI或xbaⅠ消化的基因组DNA的分析揭示了与PAc4连锁的OGR-38探针的RFLP。PAc4，矮牵牛属肌动蛋白cDNA克隆(Baird和Meagher,1987)，是染色体Ⅲ的分子标记且与HtⅠ基因座(Mcbean等，1990)连锁。在44株V23×RS1 F2植株中有36株存在OGR-38与PAc4 RFLP的共分离。这代表8％的重组频率，相似于所报道的Ht1基因座与PAc4之间16％的重组频率(Cornu等，1990).OGR-38的进一步鉴定

通过用OGR-38 cDNA插入片段的³²P标记的片段作为针对含20μg从5个矮牵牛属OGR花瓣发育阶段的各阶段以及从叶，萼片，根，茎，花梗，子房，花药和花柱分离的总RNA的RNA印迹的探针测定OGR花瓣以及其它OGR组织中的发育表达情况。OGR-38探针能与在花发育的更低的1至3阶段达到高峰的1.8kb转录物杂交。与OGR-38杂交的转录物在花瓣和子房中最丰富且也在OGR植物的萼片，花梗和花药中检测到。在茎中也检测到低水平的转录物。在所用的条件下，通过对从叶，花柱或根分离的总RNA的Northern分析检测不到杂交的转录物。实施例6OGR-38的完整序列

通过编辑使用产生随机重叠克隆的标准方法(Sambrook等，1989)获得的不同PUC18亚克隆的序列来测定OGTR-38 cDNA克隆的完整序列(SEQ ID NO:1)。该序列包含有1536个碱基的开放阅读框架，该开放阅读框架编码含512个氨基酸的推断的多肽。

使用lfasta排列(Pearson和Lipman,1988)将OGR-38的核苷酸及推测的氨基酸序列(SEQ ID NO:1和SEQ ID NO:2)与在筛选方法中使用的细胞色素P450探针和其它矮牵牛属细胞色素P450序列(美国专利号5,349,125)比较。OGR-38的核苷酸序列与代表来自P.hybrida的Hf1和Hf2基因座的类黄酮3’,5’-羟化酶的核酸序列最相近(Holton等，1993)。 Hf1克隆在1471个核苷酸上显示出与OGR-38 cDNA克隆59.6％的相似性，且在513个氨基酸上显示出49.9％的相似性，而Hf2克隆在1481个核苷酸上显示出与OGR 38 cDNA克隆59.1％的相似性，在511个氨基酸上显示出49.0％的相似性。实施例7在酵母中表达的Ht1 cDNA克隆(OGR-38)的F3’H测定。pCGP1646的构建

通过将来自pCGP1805的OGR-38 cDNA插入片段以“有义”的方向克隆到pYE22m的酵母甘油醛-3-磷酸脱氢酶启动子(Tanaka等，1988)之后构建质粒pCGP1646(图7)。

通过用Asp 718消化使质粒pCGP1805线型化。根据标准方法(Sambrook等，1989)使用DNA聚合酶(Klenow片段)补平突出的5’端。用smaⅠ消化释放1.8kb的OGR-38 cDNA片段。使用Bresaclean试剂盒(Bresatec)分离和纯化cDNA片段并与补平的pYE22m的Eco RⅠ末端连接。用Eco RⅠ消化质粒pY22m并根据标准方法(Sambrook等，1989)使用DNA聚合酶(Klenow片段)除去伸出的5’端。使用100ng 1.8kb的OGR-38片段和150ng制备的酵母载体pYE22m用Amersham连接试剂盒进行连接。通过对从氨苄青霉素抗性转化子分离的质粒DNA的XhoⅠ/SalⅠ限制性酶分析确认插入片段在pYE22m中的正确插入。酵母转化

用根据Ito等(1983)所述的用pCGP1646转化酵母菌株G-1315(Matα,trpl)(Ashikari等，1989)。转化子通过它们将G-1315恢复到色氨酸原养型的能力选择。制备酵母抽提物以测定F3’H活性

使用G-1315/p CGP1646的单个分离物接种于50ml改良的Burkholder’s培养基(20.0g/L葡萄糖，2.0g/L L-天冬酰胺，1.5g/LkH₂PO₄,0.5g/L MgSO₄·7H₂O,0.33g/L CaCl₂,2g/L(NH₄)₂SO₄,0.1mg/L KI,0.92g/L(NH₄)₆Mo₇O₂₄·4H₂O,0.1g/L次氮基三乙酸，0.99mg/L FeSO₄·7H₂O,1.25mg/L EDTA,5.47mg/LZnSO₄·7H₂O,2.5mg/L FeSO₄·7H₂O,0.77mg/LMnSO₄·7H₂O,0.196mg/L CuSO₄·5H₂O,0.124mg/LCo(NH₄)₂(SO₄)₂·6H₂O,0.088mg/L Na₂B₄O₇·10H₂O,0.2mg/L硫胺素，0.2mg/L吡哆醇，0.2mg/L烟酸，0.2mg/L泛酸，0.002mg/L生物素，10mg/L肌醇)中，随后在30℃下进行培养直到OD600值达到1.8。离心收集细胞并重悬于缓冲液1[含2M山梨醇，0.1mM DTT,0.1mMEDTA,0.4mM苯甲基磺酰氟(PMSF)和酵母裂解酶5mg/mL的10mMTris-HCl缓冲液(pH7.5)]中。30℃下轻微震荡培养细胞1小时后，经离心沉淀细胞并在冰冷缓冲液2[含0.65M山梨醇，0.1mM DTT,0.1mM EDTA,0.4mM PMSF的10mM Tris-HCl(pH7.5)]中洗涤。然后将细胞重悬于缓冲液2中并使用功率循环(duty cycle)为30％，输出控制为10％的Branson Sonifier 250 6次15秒释放进行超声波处理。将超声破碎的悬浮液以10,000rpm离心30分钟且上清以13,000rpm离心90分钟。将微粒体沉淀重悬于测定缓冲液〔100mM磷酸钾(pH87),1mMEDTA,20mM 2-巯基乙醇〕中并测定100μl中的活性。F3’H测定

使用stotz和Forkmann(1982)所述方法的改良形式测定F3’H酶活性。测定反应混合物一般含有100μl酵母提取物，在测定缓冲液(100mM磷酸钾(pH8.0),1mM EDTA和20mM 2-巯基乙醇)中的5μl 50mM NADPH和10μCi[³H]-4’,5,7-三羟黄烷酮并用测定缓冲液调到终体积为210μl。23℃培养2-16小时后，用0.5ml乙基乙酸抽提反应混合物。在真空条件下干燥乙基乙酸相，然后重悬于10μL乙基乙酸中。使用氯仿∶乙酸∶水(10∶9∶1 V/V)溶剂系统在纤维素薄层平板(Merck Art 5577，德国)上分离氚标记的类黄酮分子。以放射自显影定位反应产物并与在反应产物旁迁移且在紫外灯下可见的非放射性4’,5,7-三羟基黄烷酮和圣草酚比较来鉴定。

在G1315/p CGP1646抽提物中检测到F3′H活性，而在非转基因酵母提取物中检测不到。由此可推断与Ht1基因座连锁的来自pCGP1805的cDNA片段(OGR-38)编码F3’H。实施例8 Ht1 cDNA克隆(OGR-38)在植物中的瞬时表达pCGP1867的构建：

通过将来自pCGP1805的cDNA插入片段以“有义”的方向克隆到pCGP293(Brugliera等，1994)的Mac启动子(Comai等，1990)之后来构建质粒pCGP1867(图8)。用XhaⅠ和KpnⅠ消化质粒pCGP1805以释放cDNA插入片段。使用Bresaclean试剂盒(Bresatec)分离和纯化cDNA片段，并与pCGP293双元载体的XbaⅠ/KpnⅠ末端连接。使用Amersham连接试剂盒进行连接。经过对从庆大霉素抗性转化子分离的DNA进行XbaⅠ/KpnⅠ限制性酶分析确定该片段在pCGP1867中的正确插入。Ht1 cDNA克隆(OGR-38)在矮牵牛属花瓣中的瞬间表达：

为了迅速测定pCGP1867中的OGR-38 cDNA片段是否编码植物中的功能性F3’H，进行了瞬时表达研究。用以pCGP1867 DNA包被的金粒(1μm直径)轰击突变的P.hybrida株系Skr4×SW63的花瓣。

金微粒载体在100％乙醇中预洗3次并重悬于无菌水中。对于每次轰击，将1μg pCGP1867 DNA,0.5mg金微粒载体，10μl 2.5M CaCl₂和2μl 100mM亚精胺(自由基)通过振荡混合2分钟。离心沉淀DNA包被的金颗粒，用100％乙醇洗2次并最后重悬于10μl 100％乙醇中。将悬浮液直接滴在大载体的中央并使其干燥。

将阶段1和2的Skr4×SW63花垂直切成两半并部分包埋于MS固体培养基〔3％(W/V))蔗糖，100mg/L肌醇，1×MS盐，0.5mg/L吡哆醇-HCl,0.1mg/L硫胺素-HCl,0.5mg/L烟酸和2mg/L甘氨酸〕中。放置花瓣使花蕾内侧向上。用900psi氦气压和28英寸汞真空室的Biolistic PDS-1000/He系统(Bio-Rad)用于将金微粒载体轰击进花瓣组织。在22℃的控制植物生长室中光照6-12小时后，在用pCGP1867包被的颗粒轰击的花瓣组织上表皮层观察到红色花青苷斑点。在仅用金颗粒轰击的对照花瓣中观察不到有色斑点。这些结果表明在Mac启动子控制下的OGR-38 cDNA克隆在花瓣组织中，至少瞬间地，是有功能的。实施例9 Ht1 cDNA克隆(OGR-38)在矮牵牛属花瓣中的稳定表达-ht1/ht1矮牵牛属栽培品种的补充根癌土壤杆菌转化

通过加入5μg质粒DNA到100μl感受态AGL0细胞中，将质粒pCGP1867(图8)导入根癌土壤杆菌菌株AGL0_，其中感受态细胞通过接种50ml MG/L(Garfinkel和Nester,1980)培养物并在28℃振荡生长16小时来制备。然后沉淀细胞并重悬于0.5ml 85％(V/V)100mMCaCl₂/15％(V/V)甘油中。DNA-土壤杆菌混合物通过在液态N₂中放置2分钟冷冻，然后在37℃保温5分钟使其解冻。然后将DNA/细菌混合物再在冰上放置10分钟。接着将细胞与1mL LB(Sambrook等，1989)培养基混合并在28℃振荡培养16小时。在含10μg/ml庆大霉素的LB琼脂平板上选择携带pCGP1867的根癌土壤杆菌细胞。通过对从庆大霉素抗性转化子分离的DNA进行southern分析证实pCGP1867的存在。矮牵牛属转化(a)植物材料

来自P.hybrida变种Sk4×SW63的成熟植物的叶组织在1.25％(W/V)次氯酸钠中处理2分钟，然后在无菌水中漂洗3次。然后将叶组织切成25mm²的方块并在补充有0.05mg/L激动素和1.0mg/L 2,4-二氯苯氧乙酸(2,4-D)的MS培养基(Murashige和Skoog,1962)中预培养24小时。(b)土壤杆菌和矮牵牛属组织的共培养

含双元载体pCGP1867(图11)的根癌土壤杆菌菌株AGL0在含100mg/L庆大霉素的MG/L琼脂平板上于4℃保存。将单个菌落在含1％(W/V)Bacto-蛋白胨，0.5％(W/V)Bacto-酵母抽提物和1％(W/V)NaCl的液体培养基中生长过夜。第二天通过在含维生素B5(Gamborg等，1968)和3％(W/V)蔗糖的液体MS培养基(BPM)中稀释准备5×10⁸个细胞/ml的终浓度。将叶片浸入含AGL0/pCGP1867的BPM上2分钟。然后将叶片吸干并放在共同培养基上4天。共同培养基由补充了0.05mg/L激动素和1.0mg/L 2,4-D的SH培养基(Schenk和Hildebrandt,1972)组成且包括涂布在共同培养基上的烟草细胞悬液饲养层，其中在烟草细胞悬液上放置滤纸。(c)转基因矮牵牛属植物的再生

共同培养后，将叶片转移到选择培养基〔补充了3％(W/V)蔗糖，2mg/L α-苄氨基嘌呤(BAP),0.5mg/L α-萘乙酸(NAA),300mg/L卡那霉素，350mg/L cefotaxime和0.3％(W/V)GelriteGellan Gum(Schweizerhall)的MS培养基〕中。4周后将再生的外植体转移到新鲜的选择培养基中。分出在卡那霉素选择中存活的不定芽并转移到含100mg/L卡那霉素和200mg/L cefotaxime的BPM中进行根诱导。所有的培养物于23±2℃在16小时光周期(60μmol,m-2,s-l白色冷荧光灯)下保存。当根长度达2-3cm时，将转基因矮牵牛属小植株转移到8cm试管中的高压灭菌的Debco 51410/2盆栽混合物中。4周后，将植物再植入使用相同盆栽混合物的15cm小盆中并在23℃14小时光周期(300μmol,m-2,s-1卤化汞灯)下保存。实施例10转基因植物表型分析Skr4×SW63中的pCGP1867

表5显示了用pCGP1867质粒转化Skr4×SW63植物获得的各种花瓣和花粉颜色表型。转基因植物#593A,590A,571A,589A,592A和591A产生花瓣颜色改变的花。而且，植物#593A,590A,589A,与对照Skr4×SW63植物的白色相比，592A和591A的花的花药和花粉为粉红色。在质粒pCGP1867导入的Skr4×SW63矮牵牛属植物观察到花药和花粉颜色的改变是未预料到的结果。颜色代码取自皇家园艺学会颜色图表(RHSCC)。它们提供了描述观察到的颜色表现的可供选择的方法。然而，指定的数字应仅仅认为是对可见颜色的指南而不应当作对可获得的可能的颜色的限制。

表5

在用pCGP 1867转化的Skr4×SW63植物中获得的花瓣，花药和

花粉颜色的总结

登记号	花瓣片颜色	RHSCC代码(花瓣片)	花药和花粉颜色
登记号	花瓣片颜色	RHSCC代码(花瓣片)	花药和花粉颜色	Skr4×SW63对照(594A)	极淡的紫色	69B/73D	白色
593A	暗粉色	67B	粉红色	Skr4×SW63对照(594A)	极淡的紫色	69B/73D	白色
593A	暗粉色	67B	粉红色	590A	暗粉和粉色扇状	扇状67B和73A	粉红色
571A	粉色	68A和B	粉红色	590A	暗粉和粉色扇状	扇状67B和73A	粉红色
571A	粉色	68A和B	粉红色	589A	暗粉色	68A	粉红色
592A	粉色和亮粉色扇状	68A和68B	亮粉色	589A	暗粉色	68A	粉红色
592A	粉色和亮粉色扇状	68A和68B	亮粉色	591A	暗粉色	68A	粉红色
570A	极淡的紫色	69B/73D	白色	591A	暗粉色	68A	粉红色

导入的Ht1 cDNA在Skr4×SW63杂种中的表达对花色具有显著的影响。非转基因对照的雄蕊组织是白色的，而大多数转基因植物中的相同组织是粉红色。另外，Ht1 cDNA在Skr4×SW63杂种中的表达使花冠产生暗紫色，其在正常情况下是极淡的紫色。实施例11产物的分析

以TLC分析用pCGP1867转化的Skr4×SW63植物的花瓣和雄蕊(包括花粉，花药和花丝)中产生的花青苷和类黄醇。花青苷和类黄醇的提取

TLC分析前，存在于花瓣和雄蕊抽提物中的花青苷和类黄醇分子经酸水解从花青苷或类黄醇主链上去掉糖基部分。花青苷和类黄醇标准用于帮助鉴定在花抽提物中存在的化合物。

通过在1ml 2M盐酸中煮沸100至200mg花瓣片或5个雄蕊30分钟来抽提并水解花青苷和类黄醇。用200μl异戊醇抽提水解的花青苷和类黄醇。然后将该混合物在真空中抽干并重悬于更小体积的甲醇/1％(V/V)HCl中。使用甲醇/1％(V/V)HCl的量根据花瓣的起始鲜重，以便估测花瓣中类黄酮的相对水平。将雄蕊抽提物重悬于1μl甲醇/1％(V/V)HCl中。将1μl小份的Skr4×SW63花瓣和雄蕊中来自pCGP1867的抽提物点样到TLC平板上。花抽提物的TLC分析

酸水解的花抽提物在Forestal溶剂系统(HOAc∶水∶HCl；30∶10∶3)(Markham,1982)中迁移。表6显示了在用pCGP1867转化的转基因Skr4×SW63矮牵牛属植物的某些花和雄蕊中存在的花青苷和类黄醇的TLC分析结果。经过比较在TLC平板上观察到的斑点强度估测类黄醇和花青苷的指示性相对量(用“+”至“+++”表示)。

表6

在用pCGP 1867转化的Skr4×SW63植物的花瓣片和雄蕊中检测

到的花青苷和类黄醇的相对水平

Acc#	花瓣颜色	花青苷二甲翠花青素甲基花雀素青素			类黄醇四羟基栎皮黄酮黄酮
Acc#	花瓣颜色	花青苷二甲翠花青素甲基花雀素青素			类黄醇四羟基栎皮黄酮黄酮	Skr4×SW63对照花瓣片593A花瓣片571A花瓣片589A花瓣片570A花瓣片	淡紫色暗粉色粉红色暗粉色淡紫色	+/----+/-	-+++-	-++++++-	+ -- ++- +- +++ -
Skr4×SW63对照雄蕊593A雄蕊	白色粉红色	--	--	-++	+++ +- +++	Skr4×SW63对照花瓣片593A花瓣片571A花瓣片589A花瓣片570A花瓣片	淡紫色暗粉色粉红色暗粉色淡紫色	+/----+/-	-+++-	-++++++-	+ -- ++- +- +++ -

将Ht1 cDNA克隆导入Skr4×SW63，导致在花瓣中产生3’-羟基化的类黄酮，栎皮黄酮，甲基花青素和一些花青素。甲基花青素是花青素的甲基化衍生物(图1a和1b)。在非转基因Skr4×SW63对照中仅检测到四羟基黄酮和少量二甲翠雀素(表6)。尽管Skr4×SW63是Hf1和Hf2基因的纯合隐性，但这些突变不能完全阻断F3’5’H的合成(见美国专利号5,349,125)，且合成低水平的二甲翠雀素使花瓣片产生淡紫色的颜色。

转基因植物#593A产生的具有粉红色花粉和花药的雄蕊含甲基花青素和栎皮黄酮，而具有白色花粉和花药的非转基因Skr4×SW63对照含四羟基黄酮和低水平的栎皮黄酮(表6)。

在转基因Skr4×SW63/pCGP1867植物的花瓣和雄蕊中3’-羟基化的花青苷，甲基花青素的积累与在相同植物花瓣，花药和花粉中观察到的粉红色和暗粉色有关。F3’H活性的共同抑制

为了降低F3’H活性的水平，也将质粒pCGP1867导入P.hybrida变种国旗红(Ht1)中。

按上文实施例9所述的进行矮牵牛属的转化。

38株转基因植物中有2株产生表型改变的花。OGR正常情况下产生深红色花(RHSCC#4613)。花色改变的2株转基因植物产生亮粉色或亮红色(RHSCC#54B和#53C)的花。

对从4株转基因植物(二株表型改变的转基因植物，二株具有通常的深红色花的转基因植物)产生的花分离的RNA进行Northern分析以检验OGR-38转录物的水平。10mg花瓣的总RNA在1.2％(W/V)琼脂糖/甲醛凝胶(Sombrook等，1989)上分离并按前所述的方法转移到Hybond N尼龙膜(Amersham)上。还包括来自未转化的OGR花的花瓣RNA作为对照。OGR-38 cDNA插入片段的³²P标记的片段用于探测RNA印迹。

OGR-38探针在转基因植物花中检测到大约2.4kb和1.8kb的转录物。然而，在亮粉色和亮红色花中检测到的两种转录物的水平比在深红色转基因花中检测到的要低得多。在未转化的OGR花的RNA中也检测到内源性1.8kb转录物。为了证实2.4kb转化物来自导入的OGR-38转化基因，使用mas终止子区的³²P标记的片段探测相同的RNA印迹。mas探针检测到2.4kb的转录物，表明至少该转录物来自导入的OGR-38转化基因。花青苷水平的分析

通过分光光度分析测量对照花和亮粉色转基因花中的花青苷水平。花青苷和类黄醇的提取。

通过将200至300mg花瓣片在2ml甲醇/1％(V/V)HCl中4℃保温16小时从花瓣片提取花青苷和类黄醇。然后将50μl该溶液加入950μl甲醇/1％(V/V)HCl中，在530nm下测定稀释的溶液的吸光率。使用公式：[(吸收值(530nm)/34,000)×抽提缓冲液体积×稀释系数×106]/重量克数，测定以每克nmole表示的花青苷水平。

发现亮粉色花中每克花瓣片组织含大约915nmoles的花青苷，而对照花含大约4000nmoles/克。

这些数据表明导入有义方向的矮牛属F3’H(OGR-38)cDNA克隆入OGR植物导致内源性和转基因F3’H转录物的“共同抑制”(即，减少)。观察到更白的花色与花青苷合成减少及F3’H转录水平减少相关。实施例12从麝香石竹分离F3’H cDNA克隆

为了分离鹿香石竹(石竹属)F3’H cDNA克隆，使用包含于pCGP1805(上述)中的矮牵牛属Ht1连锁的F3’H cDNA克隆(OGR-38)在低度严格条件下筛选石竹变种Kortina Chanel花瓣cDNA文库。石竹变种Kortina Chanel cDNA文库的构建：

从阶段1,2和3的Kortina Chanel花分离的20mg总RNA(如前所述)，在含1×Superscript^TM反应缓冲液，10mM二硫苏糖醇(DTT),500μM dATP,500μm dGTP,500μM dTTP,500μM5-甲基-dCTP,2.8μg来自ZAP-cDNA GigapackⅢ Gold克隆试剂盒(stratagene)的引物-接头寡聚核苷酸和2μl Superscript逆转录酶(BRL)的50μl体积中逆转录。反应混合物在37℃保温60分钟，然后放于冰上。使用ZAP-cDNA Gigapack Ⅲ Gold克隆试剂盒(Stratagene)完成文库构建。重组子的总数为2.4×106。

转染XL1-Blue MRF’细胞后以每15cm直径平板10,000 pfu涂布共200,000 pfu的包装的cDNA。平板在37℃培养8小时，然后在4℃贮存过夜。取一式2分转移到Colony/Plaque Screen^TM滤膜(DuPont)上并按厂商建议处理。筛选Kortina Chanel花瓣cDNA文库中的F3’H cDNA克隆。

杂交前，按前述处理一式两份噬菌斑转移膜。用来自pCGP1805的1.8lkb EcoRⅠ/XhoⅠ插入片段的32P标记的片段筛选来自Kortina Chanel花瓣cDNA文库的两份转移膜。使用所述的用于筛选矮牵牛属OGRcDNA文库的低等严格条件。

将一个强烈杂交的噬菌斑挑进PSB中并按上面的详细描述再次筛选以分离纯化的噬菌斑。找到包含于1ZAP噬菌体载体中的质粒并命名为pCGP1807。

用EcoRⅠ/XhoⅠ消化释放包含于pCGP1807中的KC-1 cDNA插入片段，此片段大约为2Kb。通过对从KC-1 cDNA插入片段的亚克隆序列的编辑测定KC-1 cDNA克隆的完整序列。覆盖458个核苷酸的部分序列以前从覆盖KC-13’区的800bp KpnⅠ片段产生，该片段亚克隆进p Bluescript产生pCGP1808)。完整序列(SEQ ID NO:3)含编码500个氨基酸的推测的多肽(SEQ ID NO:4)的1508个碱基的开放阅读框架。

将石竹KC-1 cDNA克隆的核苷酸和推测断的氨基酸序列与矮牵牛属OGR-38 F3’H cDNA克隆的序列(SEQ ID NO:1和SEQ ID NO:2)进行比较。石竹属KC-1 cDNA克隆的序列(SEQ IDNO:3和4)在1555个核苷酸上显示出与矮牵牛属OGR-38 F3’H cDNA克隆67.3％的相似性，在488个氨基酸上显示出71.5％的相似性。

在本说明书中已公开的矮牵牛属，石竹属，金鱼草属，拟南芥属，玫瑰，菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间的序列相似性的比较的各种总结分别见表7和表8,9,10,11和12。这些表见实施例34，在说明书结尾处。实施例13克隆在矮牵牛属的花瓣中的石竹属F3′H cDNA(KC-1)的稳定表达-ht1/ht1矮牵牛属栽培品种的补充制备pCGP1810

通过将来自pCGP 1807的cDNA插入片段以“有义”的方向克隆到pCGP90(美国专利号5,349,125)的Mac启动子(Comai等，1990)后来构建质粒pCGP1810(图9)，其中pCGP90是以pCGP293为基础的构建体(Brugliera等，1994)。用Bam HⅠ和ApaⅠ消化质粒pCGP1807来释放KC-1 cDNA插入片段。使用Bresaclean试剂盒(Bresatec)分离并纯化cDNA片段。用Bam HⅠ和ApaⅠ消化pCGP90双元载体来释放线型化的载体和Hf1 cDNA插入片段。使用Bresaclean试剂盒(Bresatec)分离并纯化线型化的载体并与KC-1 cDNA克隆的Bam HⅠ/ApaⅠ末端连接。使用Amersham连接酶进行连接。通过对从庆大霉素抗性转化子中分离的DNA进行Bam HⅠ/ApaⅠ限制性酶分析确认插入片段在PCGP1810中的正确插入。

按实施例9所述，将双元载体pCGP1810导入根癌土壤杆菌菌株AGLO细胞中。随后使用pCGP1810/AGLO细胞转化Skr4×SW63矮牵牛属植物(也按实施例9所述)以检测对应于KC-1 cDNA克隆的基因编码的酶的稳定表达和活性。实施例14转基因植物表现型分析Skr4×SW63中的pCGP1810

导入的KC-1 cDNA在Skr4×SW63杂种中的表达对花色具有显著的影响。与Skr4×SW63对照(RHSCC#74C)相比，用pCGP1810转化的12株转基因植物中有10株产生花瓣颜色改变的花(RHSCC#73A)。而且，与对照Skr4×SW63植物的花为白色相比，转基因花的花药和花粉为粉红色。另外，KC-1 cDNA在Skr4×SW63杂种中的表达产生暗粉色花冠，而在正常情况下为淡紫色。颜色代码取自皇家园艺学会颜色图表(RHSCC)。它们提供了描述观察到的颜色表现型的可供选择的方法。然而指定的数值应仅用来作为对可见颜色的指南而不应当作是对可得到的可能的颜色的限制。

酸水解的花提取物(见实施例11)在Forestal溶剂系统(HOAc∶水∶HCl；30∶10∶3)(Markham,1982)中迁移。3′羟基化的类黄酮，甲基花青素和栎皮黄酮容易在转基因植物的花瓣片中检测到。在未转基因的Skr4×SW63对照中仅检测到四羟基黄酮和少量二甲翠崔素。

在转基因Skr4×SW63/pCGP1810植物的花瓣中3′-羟基化花青苷，甲基花青素的积累与相同植物花瓣中观察到的暗粉色有关。pCGP1813的构建

通过将来自pCGP1807的cDNA插入片段以“有义”方向克隆到pCGP1958的MaC启动子(Comai等，1990)后来构建质粒pCGP1811。质粒pCGP1958含Mac启动子和pUC19骨架中的甘露碱合成酶(mas)(Comai等，1990)终止子。用PstⅠ和xhoⅠ消化质粒pCGP1807以释放cDNA插入片段。使用DNA聚合酶(Klenow片段)补平突出的5′端(Sambrook等，1989)。使用Bresaclean试剂盒(Bresatec)分离并纯化cDNA片段并与pCGP1958载体的SmaⅠ末端连接以制备pCGP1811。

随后用PstⅠ消化质粒pCGP1811来释放含有具有mas终止子和启动的KC-1 cDNA的Mac启动子的表达元件，所有这些包含于4kb片段上。分离表达元件与pWTT2132双元载体(DNA植物技术公司，Oakland,california)的PstⅠ末端连接以产生pCGP1813(图10)。用石竹属F3′H cDNA克隆转化麝香石竹变种Kortina Chanel

按实施例9所述将双元载体pCGP1813导入根癌土壤杆菌菌株AGL0细胞。pCGP1813/AGLO细胞用于转化石竹属植物来减小3′-羟基化类黄酮的量。(a)植物材料

从Van WyK和Son Flower Supply,Victoria,Australia获得麝香石竹(变种Kortina Chanel)插枝。去掉外侧叶并先在70％v/v乙醇中简单消毒插枝，然后在1.25％w/v次氯酸钠(含Tween 20)中处理6分钟并用无菌水漂洗3次。共同培养前在解剖显微镜下去掉全部可见叶和腋芽。(b)土壤杆菌和石竹属组织的共培养

含双元载体pCGP1813的根癌土壤杆菌菌株AGL0(Lazo等，1991)在含50mg/L四环素的LB琼脂平板上于4℃保存。单个菌落在含50mg/L四环素的液体LB培养基中生长过夜并在第二天接种前稀释至5×10⁸个细胞/ml。将石竹茎组织与土壤杆菌在补充了3％w/v蔗糖，0.5mg/l BAP,0.5mg/L2,4-二氯苯氧乙酸(2,4-D),100mM乙酸丁香酮和0.25％ w/v Gelrite(pH5.7)的MS培养基中共同培养5天。(c)转基因石竹属植物的再生

为了选择转化的茎组织，将每个共同培养的茎顶端6-8mm切成3-4mm段，然后转移进补充了0.3％w/v蔗糖，0.5mg/L BAP,0.5mg/L2,4-D,1μg/L氯磺酸(chlorsulfuron),500mg/L ticarcillin和0.25％w/v Gelrite的MS培养基(Murashige和Skoog,1962)中。2周后，将外植体转移进含3％蔗糖，0.16mg/L苯基噻二唑基脲(TDZ)，0.5mg/L 吲哚-3-丁酸(IBA),2μg/L chlorsulfuron,500mg/Lticarcillin和0.25％w/v Gelrite的新鲜MS培养基中并在此阶段小心地取出从茎外植体上去掉腋枝。3周后，将健康的不定枝转移进含3％w/v蔗糖，5μg/L chlorsulfuron,500mg/L ticarcillin,0.25％w/v Gelrite的无激素MS培养基中。将在5μg/L chlorsulfuron下存活的枝条转移进相同培养基中使枝条伸长。

为正常化和生根，将伸长的枝条转移进含5μg/L chlorsulfuron,500mg/L ticarcillin和0.4％w/v Gelrite的无激素MS培养基的玻璃罐中。所有培养物在16小时光周期(120mE/m²/s冷白色荧光灯)23±2℃保存。将大约1.5-2cm高的正常化的小植株转移进土壤(75％珍珠石/25℃泥炭)中在14小时光周期(200mE/m²/s卤化汞灯)23℃下生长3-4周。植物用含1g/L CaNO₃和0.75g/L加了以4.7∶3.5∶29.2比例的N∶P∶K的微量元素石竹属混合物施肥。实施例15使用差异显示方法从金鱼草(金鱼草属)分离F3′H cDNA克隆

采用新方法从金鱼草(金鱼草属)分离编码F3′H的cDNA序列。改进方法以(ⅰ)使用过剩的寡核苷酸分离植物细胞色素P450序列(Holton等，1993)和(ⅱ)真核信使RNA的差异显示(Liang和Pardee,1992)方案的组合为基础，来以比较野生型(EOS⁺)和F3′H突变体(eos^-)金鱼草株系之间的花瓣细胞色素P450转录物群体。差异表达cDNA片段的直接克隆允许通过Northern,FRLP和序列分析进行进一步的鉴定以鉴定推断的F3′H编码序列。使用Frohman等(1988)的RACE方案获得全长cDNA，并表明该克隆在矮牵牛属花瓣细胞中瞬间和稳定表达后编码功能性F3′H。植物材料

所用的金鱼草株系来自亲本株系K16(eos^-)和N8(Eos⁺)。K16是缺乏F3′H活性的纯合隐性突变体，而N8是F3′H活性的野生型。这些株系尽管不是同基因的，但是相似的。来自自交K16×N8 F1植物的蒴果E2282的种子(#E228)萌发，对所得的植物(K16×N8 F2植物)是否存在花青素，F3′H活性的产物进行评分(见图1a和1b)。花青素的存在可通过内眼评分，因为花为深红色，不同于粉红色(来自花葵素产生的色素)的突变植物。按实施例11所述进行的花瓣花青苷的TLC分析证实肉眼评分的精确性。

E228²种子产生的13株植物中，9株(#3,#4,#5,#6,#7,#9,#10,#12,#15)产生具有花青素的花(Eos⁺/Eos⁺和Eos⁺/eos^-)，而4株(#8,#11,#13,#14)仅合成花葵素衍生的色素(eos^-/eos^-)。cDNA的合成

使用Turpen和Griffith(1986)的方法从金鱼草K16×N8 F2分散群体(E2282)的植物#13的叶及植物#3,#5和#12的花瓣组织分离总RNA。在40单位RNasin^核糖核酸酶抑制剂(Promega)存在的条件下，用1单位RQ1无RNA酶的DNA酶(Promega)在厂家提供的缓冲液中37℃处理50μg总RNA3小时去除污染的DNA。然后通过用酚/氯仿/异戊醇(25∶24∶1)抽提进一步纯化RNA并随后用乙醇沉淀。

互补于聚腺苷酸化序列的上游区的锚定poly(T)寡核苷酸用于从金鱼草花瓣和叶RNA引发cDNA合成。合成的寡核苷酸序列是(5′-3′)：

poly T-anchA TTTTTTTTTTTTTTTTTA SEQ ID NO:27

poly T-anchC TTTTTTTTTTTTTTTTTC SEQ ID NO:28

poly T-anchG TTTTTTTTTTTTTTTTTG SEQ ID NO:29

2mg总RNA和100pmol合适的引物寡核苷酸加热到70℃10分钟，然后在冰中冷却。然后将RNA/引物杂交体加入含20单位RNasin^(Promega)。各25nM的dNTP,10mM DTT和1×Superscript缓冲液(BRL)的反应体系中。将反应物在37℃加热2分钟，然后加入200单位的Superscript^TM逆转录酶(BRL)，使反应进行75分钟，然后经过在95℃加热混合物20分钟灭活逆转录酶。使用PCR扩增细胞色素P450序列

使用过剩的寡核苷酸(设计成互补于靠近植物细胞色素P450编码序列3′端的保守区)和polyT锚式寡核苷酸扩增细胞色素P450序列。以前已有人使用相似方法从Petunia hybrida合成细胞色素P450序列且在美国专利号5,349,125中进行了描述。

合成4个寡核苷酸(称为上游引物)。它们来自植物细胞色素P450序列的保守氨基酸区。寡核苷酸(从5′到3′写出)如下：

WAIGRDP TGG GCI ATI GGI (A/C)GI GA(T/C) CC

SEQ ID NO:30 SEQ ID NO:31

FRPERF AGG AAT T(T/C)(A/C) GIC CIG A(A/G)(A/C) GIT T

SEQ ID NO:32 SEQ ID NO:33

Pet Haem-New CCI TT(T/C) GGI GCI GGI (A/C)GI (A/C)GI ATI TG(T/G)

(C/G)CI GG

SEQ ID NO:34

EFXPERF GAI TT(T/C) III CCI GAI (A/C)GI TT

SEQ ID NO:35 SEQ ID NO:36

使用上游引物与每一种polyT锚定寡核苷酸在使用cDNA作模板的聚合酶链式反应中产生细胞色素P450序列。50pmol的各种寡核苷酸与2μM的每种dNTP,1.5mM MgCl₂,1×PCR缓冲液(Perkin Elmer),5μCi α-〔³³P〕dATP(Bresatec,1500 Ci/mmol),2.5单位的AmpliTaq^DNA聚合酶(Perkin Elmer)和1/10的可引发cDNA反应的锚定poly T(来自上文)混合。反应混合物(50μl)在94℃下起始变性2分钟的步骤后，在94℃15秒，42℃15秒，70℃45秒间循环40次。使用Perkin Elmer 9600 Gene Amp热循环仪进行循环反应。

使用每一种上游引物/锚定引物组合和适当的可引发的cDNA模板扩增DNA序列。各引物组合与来自E228²植物#3和#5(合成花青素的花)和#12(不合成花青素的花)花瓣的cDNA一起使用。还包括加入来自植物#13(合成花青素的花)的叶的cDNA的反应作为阴性对照，因为在健康的，非逆境的叶组织中不存在明显的F3′H活性水平。细胞色素P450序列的差异显示。

在5％(w/v)聚丙烯酰胺/尿素变性凝胶(sambrook等，1989)上分离后可观察到³³P标记的PCR片段。在凝胶上包含有³³P标记的M13mp18测序梯度用作大小标记。测序凝胶在Whatman 3MM纸上干燥并用柯达XAR胶片在室温下曝光。

合成花青素的花瓣样品与无花青素的花瓣样品间的带型比较揭示了代表在合成花青素的花瓣中特有的mRNA的11条带。在这11条带中，只有2条也存在(强度降低)于叶样品中。从测序凝胶分离和克隆PCR片段

从干燥的测序凝胶中纯化PCR产物并用Liang等(1993)所述的方法再扩增。在1.2％(w/v)琼脂糖/TAE凝胶上电泳分离后，使用Besaclean试剂盒(Bresatec)纯化扩增的cDNA。然后将纯化的片段直接连接进或商业上制备的PCR-Script^TM载体(Stratagene)中或已使用Marchuk等(1990)的方案加上T尾的Eco RV切开的pBluescript(Stratagene)中。F3′H PCR产物的测序

11个克隆的差异显示PCR产物(插入片段不超过500bp)中的每一个的两条链被测序并使用Pearson和Lipman(1988)的FASTA程序与花青苷生物合成中涉及的其它已知的细胞色素P450序列进行比较。

在11个克隆的cDNA中，2个(Aml Gb和Am3Ga)表现了与矮牵牛属OGR-38 F3′H序列(实施4到11)和F3′5′H序列(Holton等，1993)较强的同源性。克隆Am1Gb和Am3Ga之间的保守序列表明它们代表相同mRNA的重叠片段。克隆Am3Ga从编码分子的血红素结合区的序列(被“Pet Haem-New”寡核苷酸识别；SEQ ID NO:34)延伸到多腺苷酸化序列。克隆Am1Gb从编码保守的“WAIGRDP”氨基酸基序列模式的细胞色素P450序列(互补于引物1；SEQ ID NO:30和SEQ ID NO:31)延伸到被引物1(“WAIGRDP”)寡核苷酸错误识别的3′非翻译区的一个区域。实施例16细胞色素P450 cDNA的RFLP分析

再次使用限制性片段长度多态性(RFLP)分析研究对应于cDNA克隆Am3Ga的基因与花瓣中是否存在合成花青素活性的联系。Am3Ga的32P标记的插入片段用于探测从K16×N8 F2隔离植物及亲本K16和N8株系中分离的基因组DNA的Southern印迹。对EcoRV消化的来自K16×N8 F2隔离群体的13株植物的基因组DNA的分析表明仅与表现出花的花青素合成的N8和K16×N8 F2隔离株系的序列杂交(图11)。在其花瓣中仅合成花葵素衍生的色素的K16×N8 F2植物(包括亲本株系，K16)显示出无特异性杂交(图11，泳道2,8,11,13,14)。这些数据表明在突变体K16植物中对应于Am3Ga的基因组序列可能缺失，因此在该株系中F3′H基因至少部分缺失。实施例17细胞色素P450 cDNA的Northern分析

使用Northern分析证实以差异显示表示的推测的细胞色素P450片段的表达情况。在1.2％(w/v)琼脂糖/甲醛凝胶(sambrook等，1989)上分离10mg来自8个K16×N8 F2隔离群体的花瓣的总RNA并转移到Hybond N尼龙膜(Amersham)上。还包含来自产花青素的植物#13的叶RNA作为Northern分析的阴性对照。来自克隆Am3Ga的cDNA插入片段的³²P标记的片段用于探测RNA印迹。

Am3Ga探针识别仅在合成花青素的植物(植物#1,#3,#4,#5,#8)的花瓣中可检测到的大约1.8Kb的转录物。在合成花葵素的花瓣(植物6,#11,#12)或来自植物#13的叶样品中检测不到转录物(图12)。

这些数据与RFLP分析的结果一起提供了强有力的证据，证明Am3Ga克隆代表负责金鱼草属中F3′H活性的细胞色素P450基因的强有力的证据。在不合成花青素的株系的花瓣中完全没有可检测的转录物这一点支持了RFLP分析的发现，即在K16株系(和K16×N8 F2隔离群体的纯合隐性植物)中缺乏合成花青素活性是F3′H结构基因缺失的结果。

实施例18分离全长的金鱼草属F3′H cDNA

采用Frohman等(1988)的cDNA末端迅速扩增(RACE)方法用已知的部分Am³Ga克隆的序列分离全长F3′H cDNA克隆。合成基因特异性引物(“Snapred Race A”-互补于Am³Ga序列361至334)以允许从花瓣RNA进行逆转录。还合成了3′扩增引物(“Snapred Race C”-互补于Am 3Ga(3′UTR)序列283至259)以结合“Snaprred Race A”的上游。使用“poly(C)”引物从cDNA分子5′端扩增序列。

使用的寡核苷酸序列是(从5′-3′写出)：

Snapred Race A CCA CAC GAG TAG TTT TGG CAT TTG ACC C

SEQ ID NO:37

Snapred Race C GTC TTG GAC ATC ACA CTT CAA TCT G

SEQ ID NO:38

PolyC race CCG AAT FCC CCC CCC CC

SEQ ID NO:39

“Snapred Race A-引发的”花瓣cDNA是加了poly(G)尾的，使用Frohman等(1988)的方法用引物“Snapred Race C”和“polyC race”扩增的5′cDNA片段。Pfu DNA聚合酶(0.15单位)(Stratagenz)与2.5单位的Ampli Taq^DNA聚合酶(Perkin Elmer)结合以增强PCR反应的忠实性。

所得的1.71kb DNA片段(sd F3′H)直接克隆进使用Marchuk等(1990)的方法加上T尾的Eco RV切开的pBluescript^(stratagene)载体中。该质粒命名为pCGP246。实施例19金鱼草属F3′H cDNA完整序列

采用pCGP246 sd F3′H cDNA序列内的常用限制性位点以产生质粒载体pUC 19中的一系列短的重叠亚克隆。编辑各亚克隆的序列以提供sdF3′H RACE cDNA的完整序列。将sdF3′H cDNA序列与来自克隆AM3Ga的序列结合以提供金鱼草属F3′H cDNA的完整序列(SEQ IDNO:5)。它含有1711个碱基的开放阅读柜，编码512个氨基酸的推测的多肽(SEQ ID NO:6)。

将金鱼草属sd F3′H克隆的核苷酸和推测的氨基酸序列与矮牵牛属OGR-38 cDNA克隆的序列(SEQ ID NO:1和SEQ ID NO:2)；矮牵牛属F3′5′H cDNA克隆Hf1和Hf2序列；和以前分离的其它矮牵牛属细胞色素P450序列(美国专利号5,349,125)进行比较。sd F3′H的序列与代表P.hybrida Ht1基因座的矮牵牛属F3′H cDNA克隆(OGR-38)的序列最相似，在核酸水平上于1573个核苷酸中有69％的相似性，在氨基酸水平上于507个氨基酸中有72.2％的相似性。

Hf1克隆与金鱼草属sdF3′H克隆在1563个核苷酸中有57.3％的相似性，在491个氨基酸中有49.3％的相似性。而Hf2克隆与金鱼草属sdF3′H克隆在1488个核苷酸中有57.7％的相似性，在508个氨基酸中有50.8％的相似性。

金鱼草属sd F3′H序列含有2个阅读框架内ATG密码子，它们都能启动翻译。从第一个密码子(SEQ ID NO:5的91位)起始合成增加了10个N端氨基酸的蛋白质，且根据翻译的扫描模型(Kozak,1989)，它是优选的。

在本说明书中已公开的矮牵牛属，石竹属，金鱼草属，拟南芥属，玫瑰，菊和蝴蝶草属序列的排列及核苷酸和相应氨基酸序列间的序列相似性比较的各种总结分别见表7和表8,9,10,11和12。这些表在实施例34中，在说明书结尾处。实施例20 sd F3′H在植物中的瞬间表达pCGP 250的构建

通过将来自pCGP 246的完整的sd F3′H RACE cDNA插入片段〔从位置1至1711(SEQ ID NO:5)〕以“有义”的方向克隆到pCGP293(Brugliera等，1994)的Mac启动子(Comai等，1990)之后以构建质粒pCGP 250(图13)。

用Eco RⅠ消化质粒pCGP246以释放cDNA插入片段。通过用DNA聚合酶Ⅰ的Klenow片段修复伸出端使cDNA片段变成平末端(Sambrook等，1989)，在琼脂糖凝胶电泳后，使用Bresaclean试剂(Bresatec)纯化。然后将平末端的cDNA片段连接进用XbaⅠ切开的且使用DNA聚合酶Ⅰ的klenow片段补平的双元载体pCGP 293中。使用Amersham连接试剂盒进行连接。通过对从庆大霉素抗性转化子分离的DNA进行Bam HⅠ和PstⅠ限制性酶分析确认插入片段在pCGP 250中的正确插入。pCGP 231的构建

通过将来自pCGP246第一个“阅读框架内”ATG密码子下游的RACE cDNA插入片段〔从位置104至1711(SEQ ID NO:5)〕以“有义”的方向克隆到pCGP 293(Brugliera等，1994)的Mac启动子(Comai等，1990)之后产生质粒pCGP231(图14)。用SspⅠ(识别候选ATG密码子之间的位点)和SmaⅠ(载体多接头序列中的位点)消化质粒pCGP 246以释放包含第二个推测的起始密码子下游的完整编码区的平末端cDNA片段。然后将cDNA片段连接进已用XbaⅠ切开并用DNA聚合酶Ⅰ的klenow片段补平的双元载体pCGP 293中。使用Amersham连接试剂盒进行连接。通过对从庆大霉素抗性转化子分离的DNA进行Bam HⅠ和PstⅠ限制性酶分析确认插入片段在pCGP 231中的正确插入。瞬间表达研究

为了迅速测定pCGP 231和pCGP 250中的pCGP 246序列是否编码植物中的活性类黄酮3’-羟化酶，进行了瞬间表达试验。使用实施例8中所述的方法，用pCGP 231或pCGP 250质粒DNA包被的金颗粒(1μm直径)轰击突变的p.hybrida株系Skr4×SW63的花瓣。

在控制植物生长室中22℃光照下6-12小时后，在用pCGP231包被的颗粒轰击的花瓣组织的表面观察到红色花青苷斑点。在用pCGP250轰击的花瓣中或仅用金颗粒轰击的对照花瓣中未观察到有色斑点。这些结果表明在Mac启动子控制下的pCGP246编码区(在第二个ATG,SEQ ID NO:5的121位起始)在花瓣组织中具有功能。实施例21金鱼草属F3′H cDNA克隆在矮牵牛属花瓣中的稳定表达-ht1/ht1矮牵牛属栽培品种的补充

按实施例9所述将双元载体pCGP 250和pCGP 231导入根癌土壤杆菌菌株AGL0细胞中。使用pCGP 250/AGL0和pCGP 231/AGL0细胞转化Skr4×SW63矮牵牛属植物(也在实验例9中描述)以检测对应于金鱼草属sd F3′H cDNA克隆的基因编码的酶的活性和稳定表达。

用pCGP 250转化的9株转基因植物中有3株与Skr4×SW63对照(RHSCC#75C)相比产生花瓣颜色略有改变的花(RHSCC#73A)。在用pCGP 231转化的11株转基因植物中，一株植物产生花瓣颜色改变的花(RHSCC#73B)。转基因花的花药和花粉与对照一样，也是白色。代码来自皇家园艺学会颜色图表(RHSCC)。它们提供了描述观察到的花表型的一个可供选择的方法。然而，应把指定的数字当作可见颜色的一种指南，而不应当作对可获得的可能的颜色的限制。花抽提物的TLC分析

酸水解的花抽提物(见实施例11)在Forestal溶剂系统(HOAc∶水∶HCl；30∶10∶3)(Markham,1982)中迁移。sd F3′H cDNA克隆导入Skr4×SW63中导致花瓣中3′-羟基化类黄酮，甲基花青素的生产水平升高。甲基花青素是花青素的甲基化衍生物(图1a和1b)。实施例22使用RCR方法从拟南芥分离F3′H cDNA克隆

为了从拟南芥中分离代表类黄酮3′羟化酶的cDNA克隆，使用来自细胞色素P450保守区的引物合成PCR片段。发现一个PCR产物(p58092.13)与矮牵牛属OGR-38和金鱼草属F3′H cDNA克隆具有较高的序列相似性。然后使用PCR片段与来自pCGP 1805的Ht1 cDNA插入片段(OGR-38)一起筛选拟南芥cDNA文库。寡核苷酸的设计：

从靠近血红素结合区的Petunia hybrida细胞色素P450部分序列的共有氨基酸序列设计用于PCR DNA扩增的简并寡核苷酸。经过在各密码子的第三个碱基上包括脱氧次黄苷(下文称为Ⅰ)(脱氧次黄苷碱基对与A,T,G和C具有相似的效率)且在非特异性的共有序列上包括可选择的碱基来形成引物简并性。因此，设计了含有对血红素结合起关键作用的半胱氨酸残基的密码子的氨基末端定向引物“Pet Haem”(矮牵牛属血红素结合区)和上游引物“WAIGRDP”(也见实施例15)。

WAIGRDP TGG GCI ATI GGI (A/C)GI GA(T/C) CC

SEQ ID NO:30 SEQ ID NO:31

Pet Haem CCI GG(A/G) CAI ATI C(G/T)(C/T) (C/T)TI CCI GCI CC(A/G) AAI GG

SEQ ID NO:40使用PCR合成细胞色素P450序列

使用Dellaporta等(1987)所述的方法从拟南芥生态型Columbia分离基因组DNA。用于扩增细胞色素P450同源物的聚合酶链式反应典型地含有100-200ng Columbia基因组DNA,10mM Tris-HCl(pH8.3),50mM Kcl,1.5mM MgCl₂,0.01％(w/v)明胶，0.2mM的各种dNTP,312ng“WAIGRDP”和484ng“Pet Haem”及1.25单位的的Taq聚合物(Cetus)。反应混合物(50μl)在95℃50秒，45℃50秒及72℃45秒间循环40次。

使用“WAIGRDP”和“Pet Haem”引物在无内含子的典型的P450基因模板上产生的特异性PCR扩增产物的预期大小约为150个碱基对。分离大约140至155个碱基对的PCR片段并使用Mermaid^试剂盒(BIO 101)纯化。再扩增PCR片段以获得足够的产物用于克隆，然后使用Pfu DNA聚合酶进行末端修复，最后克隆进pCR-Script^TM DirectSK(+)(Stratagene)。然后使用连接的DNA转化感受态的DH5α细胞(Inouc等，1990)。PCR产物的序列

制备来自15个转化子的质粒DNA(Del Sal等，1989)。从PCR片段产生的测序数据显示15个中有11个代表单一的克隆。在拟南芥PCR插入片段内编码的翻译序列中也发现了一组特有的细胞色素P450共有氨基酸。还将PCR片段的序列与矮牵牛属OGR-38F3′H cDNA克隆和金鱼草属F3′H cDNA克隆的序列进行比较。PCR片段p58092.13与来自矮牵牛属和金鱼草属的F3′H序列最相似。实施例23拟南芥cDNA文库的筛选

为了分离p58092.13 PCR产物的cDNA克隆，用32p标记的p58092.13的片段与包含于pCGP1805中的矮牵牛属Ht1 cDNA插入片段(OGR-38)的32p标记片段一起筛选拟南芥生态型Columbia CDNA文库(Newman等，1994；D′Alessio等，1992)。

按D′Alessio等(1992)所述以每15cm直径平板50,000 pfus的密度涂布共600,000 pfu的噬菌体，在37℃生长后，将平板于4℃贮存过夜。取一式二份转移到Colony/Plaque Screen^TM滤膜(DuPont)上并接厂家建议处理。

杂交前，在预洗涤溶液(50mM Tris-HCl pH7.5,1M NaCl,1mMEDTA,0.1％(w/v)肌氨酸)中65℃洗涤二份噬菌斑转移膜30分钟；在0.4M氢氧化钠中65℃变性30分钟，然后在0.2M Tris-HCl pH8.0,0.1×SSC,0.1％(w/v)SDS溶液中65℃洗涤30分钟，最后在2×SSC,0.1％(w/v)SDS中漂洗。

杂交条件包括在50％(v/v)甲酰胺，1M NaCl,10％(w/v)硫酸葡聚糖，1％(w/v)SDS中42℃下至少1小时的预杂交步骤。然后向杂交溶液中加入32p标记的p58092.13的片段(2×10⁶cpm/ml)，杂交在42℃下再继续16小时。然后滤膜在2×SSC,1％(w/v)SDS中42℃下洗涤2×1小时并用具有增感屏的柯达XAR胶片在-70℃曝光16小时。

将11个强烈杂交的噬菌斑挑进PSB中并按上面的详细描述再次筛选以分离纯化噬菌斑。也用包含于pCGP1805中的矮牵牛属Ht1 cDNA插入片段(OGR-38)的32p标记的片段在低度严格条件下探测这些滤膜。低度严格条件包括42℃下在20％(v/v)甲酰胺，1M NaCl,10％(w/v)硫酸葡聚糖，1％(w/v)SDS中的预杂交和杂交及65℃下在6×SSC,1％(W/V)SDS(W/V)中洗涤1小时。

OGR-38和p58092.13探针与相同的噬菌斑杂交。将11个纯化噬菌斑挑进PSB并使用细菌菌株DH10B(Zip)存活含cDNA克隆的质粒载体pZL1。制备质粒DNA(Del Sal等，1989)并用Bam HⅠ和Eco RⅠ消化释放cDNA插入片段。11个质粒含有800bp至1kb的cDNA插入片段。从cDNA插入片段5′端得到的序列数据表明这些克隆中的9个是相同的。序列数据从所有9个cDNA插入片段的5′端和一个cDNA插入片段的3′端得到。编辑从所有克隆得到的序列数据以得到SEQ ID NO:7和SEQ ID NO:8所示的核苷酸和其翻译序列。

将拟南芥推测的F3′H序列与矮牵牛属OGR-38 F3′H cDNA克隆的序列(SEQ ID NO:1和SEQ ID NO:2)进行比较。在745个核苷酸中与矮牵牛属F3′H cDNA克隆有64.7％相似性，在248个氨基酸中有63.7％相似性。

在本说明书中已公开的矮牵牛属，石竹属，金鱼草属，拟南芥属玫瑰，菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间相似性的序列比较的各种总结分别可在表7和在表8,9,10,11和12中发现。这些表见实施例34，在说明书结尾处。从拟南芥分离F3′H基因组克隆

为了分离拟南芥F3′H基因的基因组克隆，用32p标记的p60606.04片段筛选拟南芥生态型Landsberg erecta基因组DNA文库。经过克隆Bam HⅠ消化的λ噬菌体EMBL4臂间的MboⅠ部分消化的基因组DNA得到该文库。筛选前扩增一次含30,000克隆的一级文库。

用Bam HⅠ/Eco RⅠ消化含拟南芥F3′H cDNA的1kb片段的p60606.04克隆以切下插入片段，并使用GeneClean(Bio 101)纯化。使用缺口转移方法(Sambrook等，1989)以32p标记探针。在高度严格条件(50％甲酰胺，37℃)下探测大约20,000个噬菌斑并在2×SSPE；2×SSPE,0.1％(w/v)SDS；0.1×SSPE中65℃下洗膜。在相同条件下进行再筛选。

从3个阳性噬菌斑(λTT7-1,λTT7-5和λTT7-6)中纯化DNA并通过用Eco RⅠ和Eco RⅠ/SalⅠ消化建立图谱。所有3个克隆都具有一个共同的Eco RⅠ片段。λTT7-1和λTT7-5重叠但限制性图谱不同。按上文所述探测这些消化产物的Southern印迹，对于λTT7-1和λTT7-5，杂交上了一个共同的6.5kb的Eeo RⅠ/Sal Ⅰ片段，在λTT7-6中也杂交上了一个较小的Eco RⅠ/Sal Ⅰ片段并很可能在插入片段的边界处。

将来自1TT7-5的Eco RⅠ/Sal Ⅰ片段克隆进pBlue Script SK+中，通过杂交(如上)和插入片段的大小鉴定含6.5kb片段的克隆，命名为E-5。使用Eco RⅠ,Sal Ⅰ,Kpn Ⅰ,Hind Ⅲ和BglⅡ的各种组合制定该片段的限制性图谱，并通过与来自拟南芥F3′H cDNA克隆的用Bam HⅠ/EcoRⅠ消化的插入片段的Southern杂交编辑。Tt7基因组克隆的完整序列

使用标准技术(Sambrook等，1989)将来自pTt 7-2，含有大多数Tt7基因组片段的6.4kb的Bam HⅠ片段纯化，自连，超声处理，末端修复，根据大小分离(450bp至800bp)并克隆进Sma Ⅰ切割的pUC19中。分离重组克隆，纯化质粒DNA并使用M13-21或M13逆向测序引物测序。将来自重叠克隆的序列组合进一个邻近的片段。经过用-21和REV引物测序也获得了Tt7基因组片段末端的序列。将所有的序列组合起来以获得来自E-5(WEQ ID NO:9)的6.5kb Eco RⅠ/Sal Ⅰ片段的完整序列。

将拟南芥属Tt7基因组克隆编码区的序列(SEQ ID NO:10,11,12和13)与矮牵牛属OGR-38 F3′H cDNA克隆的序列(SEQ ID NO:1和2)比较。拟南芥属Tt7编码区与矮牵牛属OGR-38 F3′H cDNA克隆编码区在1066个核苷酸中具有65.4％的相似性，在511个氨基酸中具有67.1％的相似性。拟南芥属突变体tt7的转化双元载体的制备：

将来自E-5的Eco RⅠ/SalⅠ片段克隆进Eco RⅠ/SalⅠ切割的pBⅠ101(Jefferson等，1987)中。鉴定了2个分离的但相同的克隆：pBⅠ-Tt7-2(图15)和pBⅠ-Tt7-4。使用2个克隆转化根癌土壤杆菌。植物转化

经电穿孔将质粒pBⅠ-Tt7-2,pBⅠ-Tt7-4和pBⅠ 101转化进土壤杆菌属菌株GV3101 pMP90中。在含50μg/ml卡那霉素(及50μg/ml庆大霉素来选择残余的pMP90)的培养基中选择转化子。

分离来自各克隆的4个转化子菌落的质粒DNA并用Eco RⅠ/SalⅠ消化，电泳，并用Tt7 cDNA插入片段探测Southern印迹。对于pBI-Tt7-2和pBI-Tt7-4，预期的插入片段条带得到鉴定。

使用基本上如Bechtold等(1993)所述的方法，将各质粒的一个转化子(即：一个对照〔pBI101 C₄〕,2个Tt7克隆〔pBI-Tt7-2-3和pBITt7-4-4〕各一个)用于真空渗入拟南芥tt7突变株系NW88(每种构建体用4盆各10株的植物)。

从各盆收获种子。将100mg种子(大约5,000个)涂布到含50μg/ml卡那霉素的营养培养基(Haughn和Somerville,1986所述)上。7至10天后可见卡那霉素抗性转化子。对于pBI-Tt7-2-3和pBI-Tt7-4-4，从5个不同的种子群(即：盆)分离到总共11个转化子，所有的卡那霉素抗性转化子在表型上可见是Tt7，且在叶和胚轴边缘表现出特征性红色/紫色花青苷色素。从4盆对照转化子的一盆中分离单个卡那霉素抗性转化子，它不表现出“野生型”Tt7表型。tt7突变体的互补

种植这些转化子并生长至成熟，逐一收获种子。在每种情况下，对于pBI-Tt7-2-3和pBI-Tt7-4-4转化子，其种子在视觉上比tt7突变植物的淡棕色种子棕色更深。来自对照转化子的种子与tt7突变亲本不可区分。将这些种子种植在营养培养基和添加有卡那霉素的营养培养基上，评价Tt7表型(子叶边缘和胚轴有红色/紫色花青苷色素)和卡那霉素抗性。检查至少一个转化子后代的各种子群体，因为它们明显不依赖于转化事件。

无一例外，卡那霉素抗性幼苗表现出Tt7表型，而卡那霉素敏感的个体是tt7。在有些情况下，卡那霉素抗性微弱且在一个种子家族中具有可变性，难以明确测定该个体是卡那霉素抗性还是卡那霉素敏感性。实施例24从Rosa hybrida分离F3′H cDNA克隆

为了分离玫瑰F3′H cDNA克隆，用³²p标记的包含于pCGP1805中的矮牵牛属Ht1 cDNA克隆(OGR-38)片段和包含于pCGP246中的金鱼草属F3′H cDNA克隆(sd F3′H)筛选Rosa hybrida变种Kardinal花瓣cDNA文库。从玫瑰变种Kardinal构建花瓣cDNA文库

从Rosa hybrida变种Kardinal阶段2的花蕾制备总RNA。在此阶段，紧闭的花芽1.5cm高，约0.9cm宽，具有淡粉色花瓣。

冷冻的组织(1-3g)在淡氮中用杵臼研磨，放入25ml预冷的缓冲液A〔0.2M硼酸，10mM EDTA(钠盐)(pH7.6)〕中并快速匀浆。抽提物在旋转摇床上混合至其达到室温，加入用缓冲液A平衡的等体积的酚/氯仿(1∶1 v/v)。再混合10分钟后，RNA制备物以10,000xg 20℃下离心10分钟。保留上部水相且如上所述再次抽提酚界面。合并水相并调到0.1M乙酸钠(pH6.0)，加入2.5体积95％的乙醇，混合物于-20℃贮存过夜。

制备物以10,000xg于4℃下离心10分钟，沉淀轻轻溶于20ml缓冲液B〔25mM硼酸，1.25mM EDTA(钠盐)，0.1M NaCl(pH7.6)〕并加入0.4体积的2-丁氧乙醇(2BE)。该溶液在冰上保温30分钟。然后将其以10,000xg在0℃离心10分钟，小心收集上清液。加入1.0体积的2BE并在冰上再保温30分钟后，将上清以10,000xg在0℃下再次离心10分钟。用缓冲液A∶2BE(1∶1 v/v)轻轻洗涤所得的沉淀，然后用70％(v/v)轻轻洗涤所得的沉淀，然后用70％(v/v)乙醇，0.1M乙酸钾洗涤，最后用95％乙醇洗涤。沉淀在空气中干燥并溶于1ml焦碳酸二乙酯(DEPC)处理的水中。将它调至3M氯化锂，在冰上放置60分钟并以10,000xg在0℃下离心10分钟。沉淀用3M LiCl洗涤2次，然后用70％乙醇，0.1M乙酸钾洗涤。

所得的RNA沉淀溶于400μl DEPC处理的水中并用等体积的酚/氯仿抽提。将RNA混合物以10,000xg在20℃下离心5分钟，收集水相并调节至0.1M乙酸钠，再加入2.5体积的95％乙醇。在冰上保温30分钟后，混合物以13,000rpm(5,000xg)在20℃离心20分钟，RNA沉淀轻轻重悬于400μl DEPC处理的水中。

按照厂家方案以Oligotex dT-30(Takara，日本)从总RNA中选择Poly(A)⁺RNA。根据Brugliera等(1994)的方法合成cDNA并用于在λZAP Ⅱ(Stratagene)的EcoR Ⅰ位点中构建非定向花瓣cDNA文库。获得的重组子的总数为3.5×10⁵个。

转染XL1-Blue细胞后，将包装的cDNA混合物以每15cm直径平板50,000pfu涂板。平板在37℃下培养8小时。噬菌体在100mMNaCl,8mM MgSO₄,50mM Tris-HCl pH8.0,0.01％(w/v)明胶〔噬菌体贮存缓冲液(PSB)〕(Sambrook等，1989)中洗脱。加入氯仿并将噬菌体在4℃贮存作为扩增的文库。

将200,000 pfu扩增文库在转染XL1-Blue MRF′细胞后以每15cm平板10,000 pfu的密度涂布到NZY平板(Sambrook等，1989)上，并在37℃下培养8小时。在4℃培养过夜后，取二份转移到Colony/PlaqueScreen^TM滤膜(DuPont)上(标记的A组和B组)并按厂家建议处理。筛选Kardinal cDNA文库中的F3′H cDNA克隆

杂交前，将2份噬菌斑转移膜在预洗溶液(50mM Tris-HCl pH7.5,1M NaCl,1mM EDTA,0.1％w/v)肌氨酸)中65℃洗30分钟，在0.4M氢氧化钠中65℃变性30分钟；然后在0.2M Tris-HCl pH8.0,0.1×SSC,0.1％(w/v)SDS溶液中65℃洗30分钟并最后在2×SSC,1.0％(w/v)SDS中漂洗。

用32P标记的来自pCGP1805的含矮牵牛属Ht1(OGR-38)cDNA克隆的NcoⅠ片段筛选Kardinal cDNA文库的2份转移膜的A组滤膜，而用³²P标记的来自pCGP 246的含金鱼草属F3 ′H克隆的EcoRⅠ/SspⅠ片段筛选B组转移膜。

杂交条件包括在10％(v/v)甲酰胺，1M NaCl,10％(w/v)硫酸葡聚糖，1％(w/v)SDS中42℃至少1小时的预杂交步骤。然后将³²p标记的片段(2×10⁶cmp/ml)加入杂交溶液中并在42℃继续杂交16小时。然后转移膜在42℃下在2×SSC,1％(w/v)SDS中洗涤2小时，然后以1×SSC,1％(w/v)SDS洗涤1小时，最后在0.2×SSC/1％(w/v)SDS中洗涤2小时。将滤膜用具有增感屏的KodakXAR胶片于-70℃下曝光16小时。

将4个强烈杂交的噬菌斑(R1,R2,R3,R4)挑入PSB中并再次筛选以分离纯化的噬菌斑。提取包含于λZAP噬菌体载体中的质粒并用EcoR Ⅰ消化以释放cDNA插入片段。克隆R1含1.0kb的插入片段而克隆R2,R3和R4各含大约1.3kb的插入片段。从R4 cDNA插入片段的3′和5′端产生序列数据。

比较玫瑰R4推测的F3′H序列与矮牵牛属OGR-38 F3′H序列。在核苷酸水平上，R4 cDNA克隆在5′端的389个核苷酸中及在3′端的330个核苷酸中分别显示出63.2％和62.1％的相似性。在氨基酸水平上，R4克隆在5′端的130个氨基酸中和在3′端的69个氨基酸中分别显示出65.4％和73.9％的相似性。根据玫瑰R4 cDNA克隆与矮牵牛属F3′HcDNA克隆(OGR-38)的高度序列相似性，按下面实施例25所述分离了相应的“全长”cDNA克隆。实施例25分离全长玫瑰F3′H cDNA

为了从玫瑰分离“全长”F3′H cDNA克隆，用上述玫瑰R4 cDNA克隆的32p标记的片段筛选实施例24所述的Rosa hybrida变种Kordinal花瓣的cDNA文库。

在转染XL1-Blue MRF′细胞后、将总共1.9×10⁶pfu的扩增文库以每15cm直径平板100,000pfus的密度涂布到NZY平板上，并在37℃培养8小时。4℃培养过夜后，取2份转移到Colony/Plaque Screen^TM滤膜(DuPont)上并按厂家建议处理。筛选Kardinal cDNA文库中的全长F3′H cDNA克隆

杂交前，按实施例24所述处理二份噬菌斑转移膜。

用32p标记的来自玫瑰R4 cDNA克隆的Eco RⅠ片段筛选来自Kardinal cDNA文库的二份转移膜。

杂交条件包括在50％(v/v)甲酰胺，1M NaCl,10％(w/v)硫酸葡聚糖，1％(w/v)SDS中42℃下至少1小时的预杂交步骤。然后向杂交溶液中加入32p标记的玫瑰cDNA克隆的片段(1×10⁶cpm/ml)并在42℃下继续杂交16小时。然后在2×SSC,1％(w/v)SDS中42℃下洗涤滤膜2×1小时并用具有增感屏的柯达XAR胶片在-70℃曝光16小时。

将73个强杂交噬菌斑(1-73)挑入1ml PSB中并在4℃贮存过夜。然后将各100μl的等份按顺序排列分配进微滴定盘中。

将XL1-Blue MRF′细胞加入10ml熔化的NZY顶级琼脂中，例在NZY平板(15cm直径)上使其固着。使用重复的涂布装置将73个噬菌体分离株按顺序排列转移到以前用XL1-Blue MRF′细胞接种的NZY平板上。37℃培养6小时，接着4℃过夜后，取三份(1,2和3列)转移到Colony/Plaque Screen^TM滤膜(DuPont)上并按厂家建议处理。

杂交前，按实施例24所述处理二份噬菌斑转移膜。

用³²p标记的a)含有玫瑰R4 cDNA克隆5′端的Eco RI/SalⅠ片段，b)含有玫瑰R4 cDNA克隆5′端的EcoRⅠ/ClaⅠ片段或c)完整的玫瑰R4cDNA克隆的EcoRⅠ片段筛选3列，其中使用上述杂交和洗涤条件，除了最后一次洗涤是在0.1×SSC,0.1％(w/v)SDS中65℃30分钟。将滤膜用具有增强屏的柯达XAR胶片于-70℃曝光16小时。

73个噬菌斑均与全长R4 cDNA克隆(EcoRⅠ片段)杂交，而总共仅17个噬菌斑与R4 cDNA克隆5′端(EcoRⅠ/SalⅠ或EcoRⅠ/ClaⅠ片段)杂交。按上述再筛选17个噬菌斑分离株以分离纯化的噬菌斑。纯化噬菌斑从17个中的9个(2,4,26,27,34,38,43,44,56)中获得。提取包含于λZAP噬菌体载体中的质粒，并使用EcoRⅠ消化测定cDNA插入片段的大小。cDNA插入片段大小从0.9kb到1.9kb。在9个噬菌斑中，仅#34(命名为pCG2158)和#38(命名为pCG2159)含大约1.9kb的cDNA插入片段。序列数据从cDNA插入片段的3′和5′端得到且表明克隆#34和#38代表相同的基因。

经过编辑使用产生随机重叠克隆的标准方法(Sambrook等，1989)获得的不同pUC18亚克隆的序列测定包含于质粒pCG2158中的玫瑰cDNA克隆(#34)的完整序列。该序列(SEQ ID NO:14)包含了1696个碱基的开放阅读柜，它编码520个氨基酸(SEQ ID NO:15)的推测多肽。

比较了玫瑰F3′H#34 cDNA克隆的核苷酸和预期的氨基酸序列(SEQ ID NO:14和SEQ ID NO:15)与矮牵牛属OGR-38 F3′HcDNA克隆(SEQ ID NO:1和SEQ ID NO:2)及金鱼草属sdF3′H克隆(SEQ ID NO:3和SEQ ID NO:4)的序列。玫瑰F3′H#34 cDNA克隆与矮牵牛属OGR-38 cDNA克隆在1651个核苷酸中显示出64.7％的相似性，在509个氨基酸中显示出7217％的相似性，与金鱼草属dF3′H克隆在1507个核苷酸上显示出67.2％的相似性，在502个氨基酸上显示出68.9％的相似性。

本说明书中已公开的矮牵牛属，石竹属，金鱼草属，拟南芥属，玫瑰，菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间的序列相似性比较的各种总结分别见表7和表8,9,10,11和12。这些表见实施例34，在说明书结尾处。实施例26玫瑰F3′H cDNA克隆(#34)在矮牵牛属花瓣中的稳定表达-ht1/ht1矮牵牛属栽培品种的互补pCGP2166的制备

通过将来自pCGP2158的cDNA插入片段以“有义”方向克隆到pCGP293(Brugliera等，1994)的Mac启动子(Comai等，1990)之后构建质粒pCGP2166(图16)。用EcoRⅠ消化质粒pCGP2158以释放cDNA插入片段，使用DNA聚合酶(Klenow片段)(Sambrook等，1989)补平伸出的5′端。分离cDNA片段并与pCGP293双元载体补平的BamHⅠ端连接。经过对从庆大霉素抗性转化子分离的DNA进行限制性酶分析确认该片段在pCGP 2166中的正确插入。

按实施例9所述将双元载体pCGP2166导入根癌土壤杆菌菌株AGL0细胞。然后使用pCGP2166/AGL0细胞转化Skr4×SW63矮牵牛属植物(也在实施例9中描述)以试验相应于玫瑰#34 cDNA克隆的基因编码的酶的活性和稳性表达。实施例27转基因植物表型分析

Skr4×SW63中的pCGP2166

导入的玫瑰F3′H cDNA在Skr4×SW63杂种中的表达对花色具有显著的影响。非转基因对照的雄蕊组织为白色，而大多数转基因植物中的相同组织为粉红色。另外，玫瑰F3′H cDNA在Skr4×SW63杂种中的表达产生暗粉色(RHSCC#64C和74C)花冠，而在正常情况下，它是淡紫色(RHSCC#75C)。颜色代码取自皇家园艺学会颜色图表(RHSCC)。它们提供了描述观察到的颜色表型的一种可供选择的方法。然而指定的数值应当作是对可见色的指南而不应当作是对可获得的可能的颜色的限制。

酸水解的花提取物(见实施例11)在Forestal溶剂系统(HOAc∶水∶HCl；30∶10∶3)(Markham,1982)中迁移。3′羟基化的类黄酮，甲基花青素和栎皮黄酮很容易在转基因植物的花瓣中检测到。在非转基因Skr4×SW63对照中仅检测到四羟基黄酮和少量二甲翠雀素。

3羟基花青苷，甲基花青素和类黄醇，栎皮黄酮在转基因Skr4×SW63/pCGP2166植物花瓣中的积累与在观察到的相同植物的花的粉红和暗粉色相关。pCGP2169的制备

经过将来自pCGP2158的cDNA插入片段以“有义”方向克隆到CaMV 35S启动子(Franck等，1980；Guilley等，1982)和OCS终止子(De Greve等，1982)之间来制备双元构建体pCGP2169(图17)。质粒pCGP1634含CaMV 35S启动子，由大肠杆菌uidA基因编码的β-葡糖苷酸酶(GUS)报告基因(Jefferson等，1987)和pUC19载体中的OCS终止子区。用NcoⅠ/XbaⅠ消化质粒pCGP2158以释放cDNA插入片段。还用NcoⅠ/XbaⅠ消化质粒pCGP1634以释放含CaMV35S启动子和OCS终止子的骨架载体。分离这些片段并连接起来以产生pCGP2167，随后用PvuⅡ消化质粒pCGP2167以释放含CaMV35S启动子，玫瑰F3′H cDNA克隆和OCS终止子的表达元件。分离该表达元件片段并与pWTT2132双元载体(DNA植物技术公司；Oakland,California)的SmaⅠ末端连接以产生pCGP2169(图17)。

按实施例9所述将双元载体pCGP2169/AGL0细胞转化玫瑰植物以减少3′羟基化类黄酮的量。实施例28从菊分离推断的F3′H cDNA克隆

为了分离菊F3′H cDNA克隆，用³²p标记的包含于pCGP1805中的矮牵牛属Ht1 cDNA克隆(OGR-38)片段筛选菊变种Red Minstral花瓣cDNA文库。从菊变种Red Minstral构建花瓣cDNA文库

使用Trizol^TM试剂(Life Technologies)(Chomczynski和Sacchi,1987)根据厂家建议从菊变种Red MTnstral的花瓣(阶段3至5)制备总RNA。使用依赖于oligo-(dT)的亲和旋转柱色谱的mRNA分离试剂盒(Pharmacia)从总RNA富集Poly(A)⁺RNA。

使用Superscript^TM cDNA合成试剂盒(Life Technologies)在Ziplox中构建花瓣cDNA文库，其中使用5μg从Red Minstral阶段3至5分离的poly(A)⁺RNA作模板。

转染Y1090r-后将30,000pfus的文库以每15cm平板3,000pfus的密度涂布到LB平板(Sambrook等，1989)上，并在37℃下培养16小时。在4℃下培养1小时后，取2份转移到Hybond N+^TM滤膜(Amersham)上并按厂家建议处理。筛选Red Minstral cDNA文库

用³²p标记的来自pCGP1805的1.8kb Asp 718/BamHⅠ插入片段筛选来自Red Minstral花瓣cDNA文库的二份转移膜。

杂交条件包括在1mM EDTA(pH8.0),0.5M Na₂HPO₄(pH7.2),7％(w/v)SDS(Church和Gilbert,1984)中65℃下至少1小时的预杂交步骤。然后将32P标记的片段(1×10⁶cpm/ml)加入杂交溶液中并在65℃下继续杂交16小时。滤膜在2×SSC,0.1％(w/v)SDS中65℃下洗涤2×1小时，并用具有增感屏的柯达BioMax^TM胶片在-70℃下曝光48小时。

将8个强烈杂交的噬菌斑挑入PSB(Sambrook等，1989)中。其中，对2个(RM6i和RM6ii)进行再筛选以分离纯化的噬菌斑，其中所用的杂交条件如对cDNA文库的起始筛选所述。根据厂家方法提取包含于λZiplox噬菌体载体中的质粒，序列数据从cDNA插入片段的3′和5′端产生。比较RM6i和RM6ii cDNA插入片段的部分序列与矮牵牛属OGR-38 F3′H cDNA克隆的完整序列。RM6i cDNA克隆与矮牵牛属OGR-38 cDNA克隆表现出相当高的序列相似性，且对其进行进一步的鉴定。

用Eco RⅠ消化释放包含于pCHRM1中的RM6i cDNA插入片段，该片段大约为1.68kb。通过编辑来自RM6i cDNA插入片段的亚克隆的序列测定包含于质粒pCHRM1中的RM6i cDNA克隆的完整序列(SEQID NO:16)。

比较菊RM6i cDNA插入片段的核苷酸和预期的氨基酸序列(SEQID NO:16和SEQ ID NO:17)与矮牵牛属OGR-38 F3′H cDNA克隆的序列(SEQ ID NO:1和SEQ ID NO:2)。菊RM6i cDNA插入片段的序列与矮牵牛属OGR-38 F3′H cDNA克隆在1532核苷酸上显示出68.5％的相似性，在511个氨基酸上显示出73.6％的相似性。

在本说明书中已公开的矮牵牛属，石竹属，金鱼草属，拟南芥属，玫瑰，菊和蝴蝶草属序列的序列排列和核苷酸及相应氨基酸序列间序列相似性比较的各种总结分别见表7和表8,9,10,11和12。这些表见实施例34，在说明书结尾处。pLN 85(反义双元载体)的构建

经过将来自pCHRM1的RM6i cDNA插入片段以“反义”方向克隆到包含于pART7(Gleave 1992)中的完整CaMV35S启动子之后来构建命名为pLN 84的质粒。用Not Ⅰ消化质粒pCHRM1以释放cDNA插入片段。使用T4 DNA聚合酶(Sambrook等，1989)补平RM6i cDNA片段并经过琼脂糖凝胶电泳和GELase(Epicentre Technologies)纯化。纯化的片段与pART7穿梭载体SmaⅠ末端连接以产生pLN 84。随后用NotⅠ消化质粒pLN 84以释放含CaMV35S:RM6i cDNA:ocs的表达元件。分离该表达元件的单一片段并与pART27双元载体(Gleave,1992)的NotⅠ端连接以产生pLN 85(图18)。经过对从链霉素抗性大肠杆菌转化子分离的DNA进行限制性酶分析确认该片段的正确插入。

经过Ledger等1991所述的土壤杆菌属介导的转化将双元载体pLM85导入菊植株中以降低3′-羟基化类黄酮的量。实施例29从蓝猪耳分离推断的F3′H cDNA克隆

为了分离蝴蝶草属F3′H cDNA克隆，使用包含于pCGO1805中的矮牵牛属Ht1连锁的F3′H cDNA克隆(OGR-38)在低度严格条件下筛选蓝猪耳变种Summer Wave花瓣cDNA文库。蓝猪耳变种Summer Wave花瓣cDNA文库的构建

基本上按实施例4所述从Summer Wave花制备定向花瓣cDNA文库。筛选Summer Wave花瓣cDNA文库

用DIG标记的来自pCGP1805的1.8kb OGR-38 cDNA插入片段筛选总共200,000个扩增的Summer Wave花瓣cDNA文库的转移膜。根据厂家建议使用来自Boehringer-Mannheim的DIG DNA标记和检测试剂盒。

杂交在30％(v/v)甲酰胺，5×SSC,1％(w/v)SDS中37℃下进行16小时。然后将滤膜在5×SSC,1％(w/v)SDS中65℃下洗涤1小时。根据DIG DNA标记和检测试剂盒的方法观察该信号。

将12个强烈杂交的噬菌斑挑进PSB中，并再次筛选以分离纯化的噬菌斑。提取包含于λZAPⅡ噬菌体载体中的质粒并用EcoRⅠ/XhoⅠ消化以释放DNA插入片段。一个克隆，即THT52含有最长的5′非编码区序列。经过编辑使用产生随机重叠克隆的标准方法(Sambrook等1989)获得的不同pUC18亚克隆的序列测定包含于质粒pTHT52中的蝴蝶草属cDNA克隆(THT52)的完整序列。该序列(SEQ ID NO:18)包含有1524个碱基的开放阅读框架，它编码有508个氨基酸的推断的多肽(SEQ ID NO:19)。

比较了蝴蝶草属THT52 cDNA克隆的核苷酸和预期的氨基酸序列(SEQ ID NO:18和SEQ ID NO:19)与矮牵牛属OGR-38 F3′HcDNA克隆的序列(SEQ ID NO:1和SEQ ID NO:2)。蝴蝶草属THT52cDNA克隆与矮牵牛属OGR-38 cDNA克隆在1694个核苷酸中有63.6％的相似性，在515个氨基酸中有67.4％的相似性。

在本说明书中已公开的矮牵牛属，石竹属，金鱼草属，拟南芥属，玫瑰，菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间序列相似性比较的各种总结分别见表7和表8,9,10,11和12。这些表见实施例34，在本说明书的结尾处。实施例30在酵母中表达的蝴蝶草属THTcDNA克隆的F3′H测定oYTHT6的构建：

经过将来自pTHT6的cDNA插入片段以“有义”方向克隆到pYE22(Tanaka等，1988)的酵母甘油醛-3-磷酸脱氢酶启动子之后来构建质粒pYTHT6(图19)。质粒pTHT6含THT6 cDNA克隆。THT6与THT52相同，除了其5′非编码区少了75bp外。

经过用EcoRⅠ/XhoⅠ消化从质粒pTHT6释放1.7kb的THT6 cDNA插入片段。分离THT6 cDNA片段，纯化并与pYE22m的Eco RⅠ/SalⅠ末端连接以产生pYTHT6。

酵母转化，酵母抽提物的制备和F3′H测定在实施例6中描述。

在G1315/pYTHT6提取物中检测到F3′H活性，而在非转基因酵母的提取物中检测不到。从此可推断包含于pYTHT6中的THT6 cDNA插入片段编码F3′H。实施例31从大花牵牛(日本牵牛花)分离推断的F3′H cDNA克隆

为了分离牵牛花F3′H cDNA克隆，使用包含于pCGP1805中的矮牵牛属Ht1连锁的F3′H cDNA克隆(OGR-38)在低等严格条件下筛选日本牵牛花花瓣cDNA文库。构建日本牵牛花花瓣cDNA文库

从Dr Iida(国家基础生物学研究所，日本)获得来自大花牵牛(日本牵牛花)早期花瓣的花瓣cDNA文库。筛选日本牵牛花花瓣cDNA文库

用DIG标记的来自pCGP1805的1.8kb OGR-38 cDNA插入片段的片段筛选总共200,000个扩增的日本牵牛花花瓣cDNA文库的转移膜。根据厂家建议使用来自Boehringer-Mannheim的DIG DNA标记和检测试剂盒。

杂交在30％(v/v)甲酰胺，5×SSC,1％(w/v)SDS中37℃进行16小时。然后在5×SSC,1％(w/v)SDS中65℃下洗涤滤膜1小时。按DIG DNA标记和检测试剂盒的方案观察信号。

将20个强烈杂交的噬菌斑挑进PSB中并再次筛选以分离纯化的噬菌斑。提取包含于λZAPⅡ噬菌体载体中的质粒并用EcoRⅠ/XhoⅠ消化以释放cDNA插入片段。一个克隆(MHT85)含有1.8kb的插入片段。通过编辑使用产生随机重叠克隆的标准方法(Sambrook等，1989)获得的不同pUC18亚克隆的序列测定包含于质粒pMHT85中的日本牵牛花cDNA克隆(MHT85)的完整序列(SEQ ID NO:20)。MHT85序列似乎比“全长”短5个碱基。

比较日本牵牛花MHT85 cDNA克隆的核苷酸和预期的氨基酸序列(SEQ ID NO:20和SEQ ID NO:21)与矮牵牛属OGR-38 F3′HcDNA克隆的序列(SEQ ID NO:1和SEQ ID NO:2)。日本牵牛花MHT85 cDNA克隆与矮牵牛属OGR-38 cDNA克隆在869个核苷酸上显示出69.6％的相似性，在515个氨基酸上显示出74.8％的相似性。

本说明书已公开的矮牵牛属，石竹属，金鱼草属，拟南芥属，玫瑰，菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间的序列相似性的比较的各种总结分别见表7和表8,9,10,11和12。这些表见实施例34，在说明书结尾处。实施例32从三花龙胆分离推断的F3′H cDNA克隆

为了分离龙胆F3′H cDNA克隆，使用包含于pCGP1805中的矮牵牛属Ht1连锁的F3′H cDNA克隆(OGR-38)在低度严格条件下筛选三花龙胆Pall变种japonica Hara花瓣cDNA文库。构建龙胆花瓣cDNA文库

按Tanaka等，1996所述从三花龙胆Pall变种japonica Hara花制备花瓣cDNA文库。龙胆花瓣cDNA文库的筛选

用DIG标记的来自pCGP1805的1.8kb OGR-38 cDNA插入片段的片段筛选总共200,000个扩增的龙胆花瓣cDNA文库的转移膜。根据厂家建议使用来自Boehringer-Mannheim的DIG DNA标记和检测试剂盒。

杂交在30％(v/v)甲酰胺，5×SSC,1％(w/v)SDS中37下进行16小时。然后在5×SSC,1％(w/v)SDS中65℃下洗涤滤膜1小时。按DIG DNA标记扣检测试剂盒的方案观察信号。

将15个强烈杂交的噬菌体挑入PSB中并再次筛选以分离纯化的噬菌斑。提取包含于λZAPⅡ噬菌体载体中的质粒并用EcoRⅠ/XhoⅠ化以释放cDNA插入片段。一个克隆(GHT 13)含有1.8kb的插入片段。经过编辑使用产生随机重叠克隆的标准方法(Sambrook等，1989)获得的不同pUC18亚克隆的序列测定包含于质粒pGHT13中的部分龙胆cDNA克隆(GHT13)的序列(SEQ ID NO:22)。

比较龙胆GHT13 cDNA克隆的核苷酸和预期的氨基酸序列(SEQID NO:22和SEQ ID NO:23)与矮牵牛属OGR-38 F3’H cDNA克隆的序列。龙胆GHT13 cDNA克隆与矮牵牛属OGR-38 cDNA克隆在1519个核苷酸中有68.3％的相似性，在475个氨基酸中有71.8％的相似性。

在本说明书中已公开的矮牵牛属，石竹属，金鱼草属，拟南芥属，玫瑰菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间的序列相似性比较的各种总结分别见表7和表8,9,10,11和12。这些表见实施例34，在说明书结尾处。实施例33从Lisianthus分离推断的F3’H cDNA克隆

为了分离Lisianthus F3’H cDNA克隆，使用包含于pCGPl805中的矮牵牛属Ht1连锁的F3’H cDNA克隆(OGR-38)在低度严格条件下筛选Lisianthus花瓣cDNA文库。构建和筛选Lisianthus花瓣cDNA文库

将Davies等(1993)和Markham和Offman(1993)所述的10,000pfus Lisianthus花瓣cDNA文库在转染Y1090r-后以每15cm平板3,000pfu的密度涂布到LB平板(Sambrook等，1989)上，在37℃下培养16小时。在4℃放置1小时后，取二份转移到Hybond N+^TM滤膜(Amersham)上并接厂家建议进行处理。

用³²p标记的来自pCGP1805的1.8kb Asp 718/BamHⅠ插入片段筛选来自Lisianthus品系#54花瓣cDNA文库的二份转移膜。

杂交杂件包括在1mM EDTA(pH8.0),0.5M Na₂HPO₄(pH7.2),7％(w/v)SDS(Church和Gilbert,1984)中55℃下至少1小时的预杂交步骤。然后向杂交溶液中加入³²p标记的片段(1×10⁶cpm/ml)，杂交在55℃下继续16小时。滤膜在2×SSC,0.1％(w/v)SDS中55℃下洗涤2×15分钟，并用具有增感屏的柯达BioMax^TM胶片在-70℃下曝光18小时。

将12个强烈杂交的噬菌斑挑进PSB(Sambrook等，1989)中并使用对cDNA文库起始筛选所述的杂交条件再次筛选以分离纯化的噬菌斑。序列数据从四个克隆的cDNA插入片段的3′和5′端产生。

根据序列比较，pL3-6与矮牵牛属OGR-38 F3′H cDNA克隆显示出相似性且对其进行进一步的鉴定。

随后发现包含于pL3-6中的2.2kb cDNA插入片段含有3个截短的cDNA克隆，最长的一个(L3-6)与矮牵牛属OGR-38 cDNA序列具有高度序列相似性。经过编辑L3-6 cDNA插入片段(SEQ ID NO:24)的亚克隆序列测定包含于质粒pL3-6中的该L3-6部分cDNA克隆的序列。

比较了Lisianthus L3-6 cDNA克隆的核苷酸和预期的氨基酸序列(SEQ ID NO:24和SEQ ID NO:25)与矮牵牛属OGR-38 F3′HcDNA克隆的序列在1087个核苷酸中有71.4％的相似性，在362个氨基酸中有74.6％的相似性。

在本说明书中已公开的矮牵牛属，石竹属，金鱼草属，拟南芥属，玫瑰，菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间的序列相似性比较的各种总结分别见表7和表8,9,10,11和12。这些表见实施例34，在说明书结尾处。

对从Lisianthus文库的筛选分离的剩余克隆的进一步研究鉴定了另一个推断的F3′H cDNA克隆(L3-10)，它包含于质粒pL3-10中。L3-10 cDNA插入片段大约1.8kb长且似乎代表“全长”克隆。实施例34本文公开的核苷酸和氨基酸序列间的序列排列和对比

使用实施例3所述的Clustal W程序进行多序列排列。表7(下面)提供了矮牵牛属OGR-38(A)；石竹属(B)；金鱼草属(C)；拟南芥属Tt7编码区(D)；玫瑰(E)，菊(F)；蝴蝶草属(G)；牵牛花(H)；龙胆(部分序列)(Ⅰ)；Lisianthus(部分序列)(J)和矮牵牛属651 cDNA(K)的预期的氨基酸序列的多序列排列。保守的氨基酸以黑体大写字母和方框及阴影表示。相似氨基酸以大写字母表示且仅有轻微的阴影。不相似的氨基酸以小写字母表示。

使用实施例3所示的LFATA程序比较来自上述种类的F3′H cDNA克隆的核苷酸和氨基酸序列和来自拟南芥属基因组克隆的编码区。相似性比较的总结在下文表8中至12中提供。

表7

ⅰ
ⅰ	ⅱ
ⅲ	ⅱ
ⅲ	ⅳ
ⅴ	ⅳ

ⅰ

ⅱ

ⅲ

ⅳ

ⅴ

表8

矮牵牛属OGR-38的F3′H序列与来自其它种类的F3′H序列及

其它P450分子的序列相似性的百分数

种类/克隆	核苷酸数目(nt)	氨基酸数目(aa)	与OGR-38的相似性％/核苷酸数(相似区域)	与OGR-38的相似性％/氨基酸数(相似区域)
种类/克隆	核苷酸数目(nt)	氨基酸数目(aa)	与OGR-38的相似性％/核苷酸数(相似区域)	与OGR-38的相似性％/氨基酸数(相似区域)	矮牵牛属OGR-38	1789nt	512aa
金鱼草属F3′H cDNA	1711nt	512aa	69.0％/1573nt(19-1578)	72.2％/507aa(1-504)	矮牵牛属OGR-38	1789nt	512aa
金鱼草属F3′H cDNA	1711nt	512aa	69.0％/1573nt(19-1578)	72.2％/507aa(1-504)	拟南芥属部分F3′H cDNA	971nt	270aa	64.7％/745nt(854-1583)	63.7％/248aa(269-510)
拟南芥属Tt7编码区	1774nt	513aa	65.4％/1066nt	67.1％/511aa	拟南芥属部分F3′H cDNA	971nt	270aa	64.7％/745nt(854-1583)	63.7％/248aa(269-510)
拟南芥属Tt7编码区	1774nt	513aa	65.4％/1066nt	67.1％/511aa	石竹属F3′H cDNA	1745nt	496aa	67.3％/1555nt(28-1571)	71.5％/488aa(17-503)
玫瑰F3′H cDNA	1748nt	513aa	64.7％/1651nt(56-1699)	72.7％/509aa(7-510)	石竹属F3′H cDNA	1745nt	496aa	67.3％/1555nt(28-1571)	71.5％/488aa(17-503)
玫瑰F3′H cDNA	1748nt	513aa	64.7％/1651nt(56-1699)	72.7％/509aa(7-510)	龙胆部分F3′H cDNA	1667nt	476aa	68.3％/1519nt(170-1673)	71.8％/475aa(40-510)
牵牛花F3′H cDNA	1824nt	517aa	63.6％/869nt(60-1000)	74.8/515aa(3-510)	龙胆部分F3′H cDNA	1667nt	476aa	68.3％/1519nt(170-1673)	71.8％/475aa(40-510)
牵牛花F3′H cDNA	1824nt	517aa	63.6％/869nt(60-1000)	74.8/515aa(3-510)	菊F3′H cDNA	1660nt	508aa	68.5％/1532nt(50-1580)	73.6％/511aa(1-510)
Lisianthus部分F3′H cDNA	1214nt	363aa	71.4％/1087nt(520-1590)	74.6％/362aa(160-510)	菊F3′H cDNA	1660nt	508aa	68.5％/1532nt(50-1580)	73.6％/511aa(1-510)

蝴蝶草属F3′H cDNA	1815nt	508aa	63.6％/1694nt(90-1780)	67.4％/515aa(1-510)
蝴蝶草属F3′H cDNA	1815nt	508aa	63.6％/1694nt(90-1780)	67.4％/515aa(1-510)	矮牵牛属Hf1cDNA	1812nt	508aa	58.9％/1471nt(29-1474)	49.9％/513aa(1-511)
矮牵牛属Hf2cDNA	1741nt	508aa	58.9％/1481nt(37-1498)	49.1％/511aa(3-510)	矮牵牛属Hf1cDNA	1812nt	508aa	58.9％/1471nt(29-1474)	49.9％/513aa(1-511)
矮牵牛属Hf2cDNA	1741nt	508aa	58.9％/1481nt(37-1498)	49.1％/511aa(3-510)	矮牵牛属651cDNA	1716nt	496aa	53.5％/1284nt(50-1309)	38.0％/502aa(7-503)
绿豆C4H cDNA	1766nt	505aa	56.0％/725nt(703-1406)	29.2％/511aa(1-503)	矮牵牛属651cDNA	1716nt	496aa	53.5％/1284nt(50-1309)	38.0％/502aa(7-503)

表9

金鱼草属F3′H序列与其它种类的F3′H序列及其它P450分子间序

列相似性百分数

种类/克隆	核苷酸数(nt)	氨基酸数(aa)	与金鱼草属相似性％/核苷酸数	与金鱼草属相似性％/氨基酸数
种类/克隆	核苷酸数(nt)	氨基酸数(aa)	与金鱼草属相似性％/核苷酸数	与金鱼草属相似性％/氨基酸数	金鱼草属	1711nt	512aa
矮牵牛属OGR-38F3′H cDNA	1789nt	512aa	69.0％/1573nt	72.2％/507aa	金鱼草属	1711nt	512aa
矮牵牛属OGR-38F3′H cDNA	1789nt	512aa	69.0％/1573nt	72.2％/507aa	拟南芥属部分F3′H cDNA	971nt	270aa	64.5％/740nt	60.4％/240aa
石竹属F3′H cDNA	1745nt	496aa	66.7％/1455nt	68.4％/487aa	拟南芥属部分F3′H cDNA	971nt	270aa	64.5％/740nt	60.4％/240aa
石竹属F3′H cDNA	1745nt	496aa	66.7％/1455nt	68.4％/487aa	蝴蝶草属F3′H cDNA	1815nt	508aa	67.6％/1603nt	70.3％/505aa
玫瑰F3′H cDNA	1748nt	513aa	67.2％/1507nt	68.9％/502aa	蝴蝶草属F3′H cDNA	1815nt	508aa	67.6％/1603nt	70.3％/505aa
玫瑰F3′H cDNA	1748nt	513aa	67.2％/1507nt	68.9％/502aa	矮牵牛属cDNA	1812nt	508aa	57.3％/1563nt	49.3％/491aa
矮牵牛属cDNA	1741nt	508aa	57.7％/1488nt	47.8％/508aa	矮牵牛属cDNA	1812nt	508aa	57.3％/1563nt	49.3％/491aa
矮牵牛属cDNA	1741nt	508aa	57.7％/1488nt	47.8％/508aa	矮牵牛属cDNA	1716nt	496aa	54.4％/1527nt	39.0％/493aa
绿豆C4H cDNA	1766nt	505aa	50.6％/1344nt	32.0％/490aa	矮牵牛属cDNA	1716nt	496aa	54.4％/1527nt	39.0％/493aa

表10

拟南芥属F3′H序列与其它种类的F3′H序列及其它P450分子间的

序列相似性百分数

种类/克隆	核苷酸数(nt)	氨基酸数(aa)	与拟南芥属相似性％/核苷酸数	与拟南芥属相似性％/氨基酸数
种类/克隆	核苷酸数(nt)	氨基酸数(aa)	与拟南芥属相似性％/核苷酸数	与拟南芥属相似性％/氨基酸数	拟南芥属	971nt	270aa
矮牵牛属OGR-38F3′H cDNA	1789nt	512aa	64.7％/745nt	63.7％/248aa	拟南芥属	971nt	270aa
矮牵牛属OGR-38F3′H cDNA	1789nt	512aa	64.7％/745nt	63.7％/248aa	金鱼草属F3′H cDNA	1711nt	512aa	64.5％/740nt	60.4％/240aa
石竹属F3′H cDNA	1745nt	496aa	64.7％/782nt	60.6％/241aa	金鱼草属F3′H cDNA	1711nt	512aa	64.5％/740nt	60.4％/240aa
石竹属F3′H cDNA	1745nt	496aa	64.7％/782nt	60.6％/241aa	玫瑰F3′H cDNA	1748nt	513aa	68.5％/739nt	63.7％/248aa
矮牵牛属cDNA	1716nt	496aa	57.0％/521nt	40.5％/227aa	玫瑰F3′H cDNA	1748nt	513aa	68.5％/739nt	63.7％/248aa
矮牵牛属cDNA	1716nt	496aa	57.0％/521nt	40.5％/227aa	矮牵牛属cDNA	1812nt	508aa	58.2％/632nt	46.5％/243aa
矮牵牛属Hf2cDNA	1741nt	508aa	57.4％/632nt	46.1％/243aa	矮牵牛属cDNA	1812nt	508aa	58.2％/632nt	46.5％/243aa

表11

玫瑰F3′H序列和其它种类的F3′H序列及其它P450分子间的序列

相似性的百分数

种类/克隆	核苷酸数(nt)	氨基酸数(aa)	与玫瑰相似性％核苷酸数	与玫瑰相似性％/氨基酸数
种类/克隆	核苷酸数(nt)	氨基酸数(aa)	与玫瑰相似性％核苷酸数	与玫瑰相似性％/氨基酸数	致瑰	1748bp	513aa
矮牵牛属OGR-38F3′H cDNA	1789bp	512aa	64.7％/1651nt	72.7％/509aa	致瑰	1748bp	513aa
矮牵牛属OGR-38F3′H cDNA	1789bp	512aa	64.7％/1651nt	72.7％/509aa	金鱼草属F3′H cDNA	1711bp	512aa	67.2％/1507	68.9％/502aa
石竹属F3′H cDNA	1745bp	496aa	67.4％/1517nt	72.6％/486aa	金鱼草属F3′H cDNA	1711bp	512aa	67.2％/1507	68.9％/502aa
石竹属F3′H cDNA	1745bp	496aa	67.4％/1517nt	72.6％/486aa	拟南芥属部分F3′H cDNA	971bp	270aa	68.5％/739nt	63.7％/248aa
矮牵牛属651cDNA	1716bp	496aa	53.1％/1182nt	37.8％/502aa	拟南芥属部分F3′H cDNA	971bp	270aa	68.5％/739nt	63.7％/248aa
矮牵牛属651cDNA	1716bp	496aa	53.1％/1182nt	37.8％/502aa	矮牵牛属Hf1cDNA	1812bp	506aa	57％/1366nt	49.9％/503aa
矮牵牛属Hf2cDNA	1741bp	508aa	57.3％/1331nt	49.1％/505aa	矮牵牛属Hf1cDNA	1812bp	506aa	57％/1366nt	49.9％/503aa
矮牵牛属Hf2cDNA	1741bp	508aa	57.3％/1331nt	49.1％/505aa	绿豆C4H cDNA	1766bp	505aa	52.4％/1502nt	32.0％/510aa

表12

拟南芥属tt7基因组序列的编码区与其它种类的F3′H cDNA序列及

其它P450分子间的序列相似性百分数

种类/克隆	核苷酸数(nt)	氨基酸数(aa)	与拟南芥属tt7相似性％/核苷酸数	与拟南芥属tt7相似性％/氨基酸数
种类/克隆	核苷酸数(nt)	氨基酸数(aa)	与拟南芥属tt7相似性％/核苷酸数	与拟南芥属tt7相似性％/氨基酸数	拟南芥属Tt7编码区	1774nt	513aa
矮牵牛属OGR-38	1789nt	512aa	65.4％/1066nt	67.1％/511aa	拟南芥属Tt7编码区	1774nt	513aa
矮牵牛属OGR-38	1789nt	512aa	65.4％/1066nt	67.1％/511aa	金鱼草属F3′HcDNA	1711nt	512aa	62.7％/990nt	64.9％/504aa
石竹属F3′H cDNA	174nt	496aa	63.2％/1050nt	65.9％/495aa	金鱼草属F3′HcDNA	1711nt	512aa	62.7％/990nt	64.9％/504aa
石竹属F3′H cDNA	174nt	496aa	63.2％/1050nt	65.9％/495aa	玫瑰F3′H cDNA	1748nt	513aa	65.5％/1076nt	68％/512aa
矮牵牛属cDNA	1716nt	496aa	56.5％/990nt	36.5％/502aa	玫瑰F3′H cDNA	1748nt	513aa	65.5％/1076nt	68％/512aa
矮牵牛属cDNA	1716nt	496aa	56.5％/990nt	36.5％/502aa	矮牵牛属F3′H cDNA	1812nt	506aa	56.8％/995nt	47.5％/509aa
矮牵牛属Hf2F3′H cDNA	1741nt	508aa	55.2％/1063nt	46.8％/509aa	矮牵牛属F3′H cDNA	1812nt	506aa	56.8％/995nt	47.5％/509aa

本领域的技术人员将会预料到本文描述的本发明可容许在具体描述的内容外做出一些变化和修改。应理解本发明也包括所有这些变化和修改。本发明还包括在本说明书中单独或集中提及的或表示的所有步骤、特征，组合物和化合物和任意2个或多个所说的步骤或特征的任意和全部组合。参考文献

Altschul,S.F.,Gish,W.,Miller.W.,Myers,E.W.和Lipman,D.J.分子生物学杂志215:403-410,1990。

Ashikari,T.,Kiuchi-Goto,N.,Tanaka,Y.,Shibano,Amachi,T.,和Yoshizumi,H.应用微生物学生物技术30:515-520,1989。

Baird,W.V.和Meagher,R.B.EMBOJ.6,3223-3231,1987。

Bechtold,N.,Ellis,J.和Pelletier,G.C.R.Acad.Sci.Paris，科学dela vie 316:1194-1199,1993。

Bethesda研究实验室。BRL pUC宿主：大肠杆菌DH5α^TM感受态细胞Bethesda Res.Lab.Focus.8(2):9,1986。

Brugliera,F.,Holton,T.A.,Stevenson,T.W.,Farcy,E.,Lu,C-Y和Cornish,E.C.植物杂志5(1):81-92,1994。

Church,G.M.和Gilbert,W.PNAS USA,81:1991-1995.

Chomczynski,P.和Sacchi,N.生化年鉴162:156-159.

Comai,L.,Moran,P.和Maslyar,D.，植物分子生物学15:373-381,1990.

Cornu,A.,Farcy,E.,Maizonnier,D.,Haring,M.,Veerman,W.和Gerats,A.G.M.，在：遗传学图谱-复合基因组的基因座图谱。第5版，Stephen J.O′Brien(ed.)，冷泉港实验室出版社，美国，1990.

Davies等，植物科学，95:67-77.1993.

D′Alessio等，焦点，14:76-79,1992

De Greve,H.,Dhaese,P.,Seurinck,J.,Lemmers,M.,VanMontagu,M和Schell.J.分子应用遗传学。1:499-511.

Dellaporta,S.J.,Wood,J.和Hick,J.B.,植物分子生物学报道，1:19-21,1983.

Del Sal,G.,Manfioletti,G.和Schneider,C.生物技术。7(5):514-519,1989.

Doodeman,M.,Gerats,A.G.M.,Schram,A.W.,De Vlaming,P.和Bianchi,F.，理论和应用遗传学。67:357-366,1984.

Dooner,H.K.,Robbins,T.R.和Jorgensen,R.A.遗传学年鉴。25:173-199,1991.

Ebel,J.and Hahlbrock,K.,于：类黄酮：1980以来的研究进展。

Harbourne,J.B.,(ed.)，学术出版社，New York,USA,641-679,1988.

Forkmann,G.and Stotz,G.Z.Naturforsch.36c:411-416,1981.

Forkmann,G.植物培育106:1-26,1991.

Franck,A.,Guilley,H.,Jonard,G.Richards,K和Hirth,L.细胞，21,285-294,1980.

Frohman,M.A.,Dush,M.K.,Martin,G.R.美国国家科学院院报。85:8998-9002,1988.

Gamborg,O.L.,Miller,R.A.和Ojima,K.，细胞研究实验50:151-158,1968.

Garfinkel,D.J.，和Nester,E.W.细菌学杂志。144:732-743,1980.

Gleave,A.P.植物分子生物学20:1203-1207,1992.

Guilley,H.,Dudley,R.K.,Jonard,G.,Balazs,E.和Richards,K.E.细胞，30,763-773,1982.

Hahlbrock,K.和Grisebach,H.，植物生理学年鉴。30:105-130,1979.

Hanahan,D.，分子生物学杂志。166:557,1983.

Haughn,G.W.和Somerville,C.分子和普通遗传学204:430-434,1986.

Holton,T.A.,Brugliera,F.Lester,D.R.,Tanaka,Y.,Hyland,C.D.,Menting,J.G.T.,Lu,C.,Farcy,E.,Stevenson,T.W.和Cornish,E.C.，自然，366,276-279,1993.

Holton,T.A.和Cornish,E.C.植物细胞，7:1071-1083,1995.

Inoue,H.,Nojima,H.and Okayama,H.基因，96:23-28,1990.

Ito.H.,Fukuda,Y.,Murata,K.和Kimura,A.细菌学杂志153:163-168,1983.

Jefferson,R.A.植物分子生物学报道。5:387-405,1987.

Jefferson,R.A.,Kavanagh,T.A.，和Bevan,M.W.EMBO J.6:3901-3907,1987

Koornneef,M,Luiten,W.,de Vlaming,P.和Schram.A.W.Arabidopsis Information Service 19:113-115,1982.

Kozak,M.细胞生物学杂志。108:229,1989.

Lander,E.S.,Green,P.,Abrahamson,J.,Barlow,A.,Day,M.J.,Lincoln.S.E.和Newberg,L.基因组，121,185-199,1987.

Lazo,G.R.,Pascal,A.S.和Ludwig,R.A.，生物/技术，9:963-967,1991.

Ledger,S.E.,Delores,S.C.和Given,N.K.植物细胞报道，10:195-199,1991.

Liang,P.和Pardee,A.B.科学，257:967-971,1992

Liang,P.,Averboukh,L.和Pardee,A.B.核酸研究，21:3269-3275,1993

Marchuk,D.,Drumm,M.,Saulino,A.,Collins,F.S.核酸研究。19:1154,1990

Markham,K.R.，类黄酮鉴定技术。伦敦：学术出版社，1982.

Markham,K.R和Offman,D.J.植物化学.，34:679-685.

Martin,C.和Gerats,T.在：开花的分子生物学。(Jordan,B.R.ed),UK,CAB International,21 9-255,1 993.

McLean,M.,Gerats,A.G.M.,Baird,W.V.and Meagher,R.B.遗传杂志81:341-346,1990.

Merrifield，美国化学协会杂志。85:2149,1964.

Mizutani,M.,Ward.E.,DiMaio,J.,Ohta,D.,Ryals,J.和Sato,R.Biochem.Biophys.Res.Commun.190:875-880,1993.

Murashige,T.和Skoog,F.，植物生理学，15:73-97,1962.

Newman,T.,de Bruijn,F.J.,Green,P.,Keegstra,K.,Kende,H.,McIntosh,L.,Ohlrogge,J.,Raikhel,N.,Somerville,S.,Thomashow,M.植物生理学。106:1241-1255,1994.

Pearson,W.R.和Lipman,D.J.，美国国家科学院院报85:2444-2448,1988.

Sambrook,J.,Fritsch,E.F.和Maniatis,T.分子克隆：实验室手册(第二版)，冷泉港实验室出版社，美国，1989.

Schenk,R.U.和Hilderbrandt,A.C.,Can.J.Bot.50:199-204,1972.

Schram,A.W.,Jonsson,L.M.V.和Bennink,G.J.H.，矮牵牛杂种中的类黄酮合成的生物化学。In：矮牵牛库，K.C.(ed.),Springer-Verlag,Berlin,Germany,pp 68-75,1984。

Stafford,H.A.，类黄酮代谢。CRC出版社，Inc.Boca Raton,Florida,USA,1990.

Stota,G.和Forkmann,G.Z.Naturforsch 37c:19-23,1982.

Tabak,A.J.H.,Meyer,H.和Bennink,G.J.H.，植物139,67-71,1978.

Tannaka,Y.,Ashikari,T.,Shibano,Y.,Amachi,T.,Toshizumi,H.和Matsubara,H.J.生化杂志。103:954-961,1988.

Tanaka,Y.,Yonekura,K.,Fukuchi-Mizutani,M.,Fukui,Y.,Fujiwara,H.,Ashikari,T.和Kusumi,T.植物细胞生理学。37(5):711-716,1996.

Turpen,T.H.和Griffith,O.M.生物技术，4:11-15,1986.

van Tunen A.J.，和Mol J.N.M.在：植物生物技术(Grierson,D.ed.)Glasgow:Blackie,2:9-31,1990.

Wiering,H.和de Vlaming,P.，色素的遗传和生物化学。In:PetuniaSink,K.C.(ed.),Springer-Verlag,Berlin,Germany,pp 49-65,1984.

Wallroth,M.,Gerats,A.G.M.,Rogers,S.G.,Fraley,R.T.和Horsch,R.B.，分子普通遗传学。202:6-15,1986.

序列表(1)基本信息：

(ⅰ)申请人：(除美国外)：Florigene limited

(仅在美国)：Filippa BRUGLIERA,Timothy Albert

Holton,Michael Zenon MICHAEL

(ⅱ)发明名称：编码类黄酮途径酶的基因序列及其用途。

(ⅲ)序列数目：40

(ⅳ)联系地址：

(A)联系人：Davies Collison Cave

(B)街名：1 little collins street

(C)城市：MelBourne

(D)州名：Victoria

(E)国家：澳大利亚

(F)邮政编码(Zip):3000

(ⅴ)计算机可读形式：

(A)介质类型：Floppy软盘

(B)计算机：IBM PC兼容机

(C)操作系统：PC-DOS/MS-DOS

(D)软件：PatentIn Release#1.0,Version#1.25.

(ⅵ)目前申请资料：

(A)申请号：

(B)申请日：1997年2月28日

(C)分类：

(ⅶ)在先申请资料：

(A)申请号：PN8386

(B)申请日：1997年2月28日

(C)分类：

(ⅷ)律师/代理人信息：

(A)姓名：Hughes,Dr E.John L.

(C)参考/摘要号：EJH/AF.

(ⅸ)电信信息：

(A)电话：+61392542777

(B)传真：+61392542770

(C)电报：AA 31787(2)关于SEQ ID NO:1的信息

(ⅰ)序列特征

(A)长度：1789个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：50..1586

(ⅹⅰ)序列描述：SEQ ID NO:1GCAGGAATTG GTGAACCCCA TAGAAGTAAA ATACTCCTAT CTTTATTTC ATG GAA 55

Met Glu

1ATC TTA AGC CTA ATT CTG TAC ACC GTC ATT TTC TCA TTT CTT CTA CAA 103Ile Leu Ser Leu Ile Leu Tyr Thr Val Ile Phe Ser Phe Leu Leu Gln

5 10 15TTC ATT CTT AGA TCA TTT TTC CGT AAA CGT TAC CCT TTA CCA TTA CCA 151Phe Ile Leu Arg Ser Phe Phe Arg Lys Arg Tyr Pro Leu Pro Leu Pro

20 25 30CCA GGT CCA AAA CCA TGG CCA ATT ATA GGA AAC CTA GTC CAT CTT GGA 199Pro Gly Pro Lys Pro Trp Pro Ile Ile Gly Asn Leu Val His Leu Gly35 40 45 50CCC AAA CCA CAT CAA TCA ACT GCA GCC ATG GCT CAA ACT TAT GGA CCA 247Pro Lys Pro His Gln Ser Thr Ala Ala Met Ala Gln Thr Tyr Gly Pro

55 60 65CTC ATG TAT CTT AAG ATG GGG TTC GTA GAC GTG GTG GTT GCA GCC TCG 295Leu Met Tyr Leu Lys Met Gly Phe Val Asp Val Val Val Ala Ala Ser

70 75 80GCA TCG GTT GCA GCT CAG TTC TTG AAA ACT CAT GAT GCT AAT TTC TCG 343Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe Ser

85 90 95AGC CGT CCA CCA AAT TCT GGT GCA GAA CAT ATG GCT TAT AAT TAT CAG 391Ser Arg Pro Pro Asn Ser Gly Ala Glu His Met Ala Tyr Asn Tyr Gln

100 105 110GAT CTT GTT TTT GCA CCT TAT GGA CCT AGA TGG CGT ATG CTT AGG AAA 439Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys115 120 125 130ATT TGC TCA GTT CAC CTT TTC TCT ACC AAG GCT TTA GAT GAC TTC CGC 487Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp Asp Phe Arg

135 140 145CAT GTC CGC CAG GAT GAA GTG AAA ACA CTG ACG CGC GCA CTA GCA AGT 535His Val Arg Gln Asp Glu Val Lys Thr Leu Thr Arg Ala Leu Ala Ser

150 155 160GCA GGC CAA AAG CCA GTC AAA TTA GGT CAG TTA TTG AAC GTG TGC ACG 583Ala Gly Gln Lys Pro Val Lys Leu Gly Gln Leu Leu Asn Val Cys Thr

165 170 175ACG AAC GCA CTC GCG CGA GTA ATG CTA GGT AAG CGA GTA TTT GCC GAC 631Thr Asn Ala Leu Ala Arg Val Met Leu Gly Lys Arg Val Phe Ala Asp

180 185 190GGA AGT GGC GAT GTT GAT CCA CAA GCG GCG GAG TTC AAG TCA ATG GTG 679Gly Ser Gly Asp Val Asp Pro Gln Ala Ala Glu Phe Lys Ser Met Val195 200 205 210GTG GAA ATG ATG GTA GTC GCC GGT GTT TTT AAC ATT GGT GAT TTT ATT 727Val Glu Met Met Val Val Ala Gly Val Phe Asn Ile Gly Asp Phe Ile

215 220 225CCG CAA CTT AAT TGG TTA GAT ATT CAA GGT GTA GCC GCT AAA ATG AAG 775Pro Gln Leu Asn Trp Leu Asp Ile Gln Gly Val Ala Ala Lys Met Lys

230 235 240AAG CTC CAC GCG CGT TTC GAC GCG TTC TTG ACT GAT ATA CTT GAA GAG 823Lys Leu His Ala Arg Phe Asp Ala Phe Leu Thr Asp Ile Leu Glu Glu

245 250 255CAT AAG GGT AAA ATT TTT GGA GAA ATG AAA GAT TTG TTG AGT ACT TTG 871His Lys Gly Lys Ile Phe Gly Glu Met Lys Asp Leu Leu Ser Thr Leu

260 265 270ATC TCT CTT AAA AAT GAT GAT GCG GAT AAT GAT GGA GGG AAA CTC ACT 919Ile Ser Leu Lys Asn Asp Asp Ala Asp Asn Asp Gly Gly Lys Leu Thr275 280 285 290GAT ACA GAA ATT AAA GCA TTA CTT TTG AAC TTG TTT GTA GCT GGA ACA 967Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Val Ala Gly Thr

295 300 305GAC ACA TCT TCT AGT ACA GTT GAA TGG GCC ATT GCT GAG CTT ATT CGT 1015Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg

310 315 320AAT CCA AAA ATA CTA GCC CAA GCC CAG CAA GAG ATC GAC AAA GTC GTT 1063Asn Pro Lys Ile Leu Ala Gln Ala Gln Gln Glu Ile Asp Lys Val Val

325 330 335GGA AGG GAC CGG CTA GTT GGC GAA TTG GAC CTA GCC CAA TTG ACA TAC 1111Gly Arg Asp Arg Leu Val Gly Glu Leu Asp Leu Ala Gln Leu Thr Tyr

340 345 350TTG GAA GCT ATA GTC AAG GAA ACC TTT CGG CTT CAT CCA TCA ACC CCT 1159Leu Glu Ala Ile Val Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro355 360 365 370CTT TCA CTT CCT AGA ATT GCA TCT GAG AGT TGT GAG ATC AAT GGC TAT 1207Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Ile Asn Gly Tyr

375 380 385TTC ATT CCA AAA GGC TCA ACG CTT CTC CTT AAT GTT TGG GCC ATT GCT 1255Phe Ile Pro Lys Gly Ser Thr Leu Leu Leu Asn Val Trp Ala Ile Ala

390 395 400CGT GAT CCA AAT GCA TGG GCT GAT CCA TTG GAG TTT AGG CCT GAA AGG 1303Arg Asp Pro Asn Ala Trp Ala Asp Pro Leu Glu Phe Arg Pro Glu Arg

405 410 415TTT TTG CCA GGA GGT GAG AAG CCC AAA GTT GAT GTC CGT GGG AAT GAC 1351Phe Leu Pro Gly Gly Glu Lys Pro Lys Val Asp Val Arg Gly Asn Asp

420 425 430TTT GAA GTC ATA CCA TTT GGA GCT GGA CGT AGG ATT TGT GCT GGA ATG 1399Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met435 440 445 450AAT TTG GGT ATA CGT ATG GTC CAG TTG ATG ATT GCA ACT TTA ATA CAT 1447Asn Leu Gly Ile Arg Met Val Gln Leu Met Ile Ala Thr Leu Ile His

455 460 465GCA TTT AAC TGG GAT TTG GTC AGT GGA CAA TTG CCG GAG ATG TTG AAT 1495Ala Phe Asn Trp Asp Leu Val Ser Gly Gln Leu Pro Glu Met Leu Asn

470 475 480ATG GAA GAA GCA TAT GGG CTG ACC TTA CAA CGG GCT GAT CCA TTG GTT 1543Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Asp Pro Leu Val

485 490 495GTG CAC CCA AGG CCT CGC TTA GAA GCC CAA GCG TAC ATT GGG T 1586Val His Pro Arg Pro Arg Leu Glu Ala Gln Ala Tyr Ile Gly

500 505 510GAGCAGCAAC AGCCCATGGA GATAACATGA GTGTTAAATG TATGAGTCTC CATATCTTGT 1646TTAGTTTGTT TATGCTTTGG ATTTAGTAGT TTTTATATTG ATAGATCAAT GTTTGCATTG 1706TCAGTAAGAA TATCCGTTGC TTGTTTCATT AACTCCAGGT GGACAATAAA AGAAGTAATT 1766TGTATGAAAA AAAAAAAAAA AAA 1789(2)关于SEQ ID NO:2的信息

(ⅰ)序列特征

(A)长度：512个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅸ)序列描述：SEQ ID NO:2Met Glu Ile Leu Ser Leu Ile Leu Tyr Thr Val Ile Phe Ser Phe Leu1 5 10 15Leu Gln Phe Ile Leu Arg Ser Phe Phe Arg Lys Arg Tyr Pro Leu Pro

20 25 30Leu Pro Pro Gly Pro Lys Pro Trp Pro Ile Ile Gly Asn Leu Val His

35 40 45Leu Gly Pro Lys Pro His Gln Ser Thr Ala Ala Met Ala Gln Thr Tyr

50 55 60Gly Pro Leu Met Tyr Leu Lys Met Gly Phe Val Asp Val Val Val Ala65 70 75 80Ala Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn

85 90 95Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Glu His Met Ala Tyr Asn

100 105 110Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu

115 120 125Arg Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp Asp

130 135 140Phe Arg His Val Arg Gln Asp Glu Val Lys Thr Leu Thr Arg Ala Leu145 150 155 160Ala Ser Ala Gly Gln Lys Pro Val Lys Leu Gly Gln Leu Leu Asn Val

165 170 175Cys Thr Thr Asn Ala Lcu Ala Arg Val Met Leu Gly Lys Arg Val Phe

180 185 190Ala Asp Gly Ser Gly Asp Val Asp Pro Gln Ala Ala Glu Phe Lys Ser

195 200 205Met Val Val Glu Met Met Val Val Ala Gly Val Phe Asn Ile Gly Asp

210 215 220Phe Ile Pro Gln Leu Asn Trp Leu Asp Ile Gln Gly Val Ala Ala Lys225 230 235 240Met Lys Lys Leu His Ala Arg Phe Asp Ala Phe Leu Thr Asp Ile Leu

245 250 255Glu Glu His Lys Gly Lys Ile Phe Gly Glu Met Lys Asp Leu Leu Ser

260 265 270Thr Leu Ile Ser Leu Lys Asn Asp Asp Ala Asp Asn Asp Gly Gly Lys

275 280 285Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Val Ala

290 295 300Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu305 310 315 320Ile Arg Asn Pro Lys Ile Leu Ala Gln Ala Gln Gln Glu Ile Asp Lys

325 330 335Val Val Gly Arg Asp Arg Leu Val Gly Glu Leu Asp Leu Ala Gln Leu

340 345 350Thr Tyr Leu Glu Ala Ile Val Lye Glu Thr Phe Arg Leu His Pro Ser

355 360 365Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Ile Asn

370 375 380Gly Tyr Phe Ils Pro Lys Gly Ser Thr Leu Leu Leu Asn Val Trp Ala385 390 395 400Ile Ala Arg Asp Pro Asn Ala Trp Ala Asp Pro Leu Glu Phe Arg Pro

405 410 415Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Lys Val Asp Val Arg Gly

420 425 430Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala

435 440 445Gly Met Asn Leu Gly Ile Arg Met Val Gln Leu Met Ile Ala Thr Leu

450 455 460Ile His Ala Phe Asn Trp Asp Leu Val Ser Gly Gln Leu Pro Glu Met465 470 475 480Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Asp Pro

485 490 495Leu Val Val His Pro Arg Pro Arg Leu Glu Ala Gln Ala Tyr Ile Gly

500 505 510(2)关于SEQ ID NO:3的信息

(ⅰ)序列特征

(A)长度：1745个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：50..1586

(ⅹⅰ)序列描述：SEQ ID NO:3AAGTTCGGCA CGAGCGTCAC ATTCACACCG TCACATTACT ATTCAAACCA CTCATTTTCT 60ACCTCTCTTT TCTACCCACC AAAACAAAAC AAAACAAAAA AAAACACATA AAAAAACTCA 120AAAAAAAATT ATAATGTCAC CCTTAGAGGT AACTTTCTAC ACCATAGTCC T ATG CAC 177

Met His

1AAT CTC TAC TAC CTC ATC ACC ACC GTC TTC CGC GGC CAC CAA AAA CCG 225Asn Leu Tyr Tyr Leu Ile Thr Thr Val Phe Arg Gly His Gln Lys Pro

5 10 15CTT CCT CCA GGG CCA CGA CCA TGG CCC ATC GTG GGA AAC CTC CCA CAT 273Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly Asn Leu Pro His

20 25 30ATG GGC CAG GCA CCG CAC CAG GGC TTA GCA GCC CTG GCG CAA AAG TAT 321Met Gly Gln Ala Pro His Gln Gly Leu Ala Ala Leu Ala Gln Lys Tyr35 40 45 50GGC CCT CTA TTG TAT ATG AGA CTG GGG TAC GTG GAC GTT GTT GTG GCC 369Gly Pro Leu Leu Tyr Met Arg Leu Gly Tyr Val Asp Val Val Val Ala

55 60 65GCC TCA GCG TCT GTA GCG ACC CAG TTT CTT AAG ACA CAT GAC CTA AAT 417Ala Ser Ala Ser Val Ala Thr Gln Phs Leu Lys Thr His Asp Leu Asn

70 75 80TTT TCG AGT AGG CCA CCG AAT TCG GGG GCT AAA CAC ATT GCT TAT AAC 465Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn

85 90 95TAT CAA GAC CTT GTT TTT GCA CCT TAT GGA CCT AAA TGG CGC ATG CTT 513Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Lys Trp Arg Met Leu

100 105 110AGG AAA ATT TGT TCC TTA CAC ATG TTT TCT TCT AAG GCT TTG GAC GAT 561Arg Lys Ile Cys Ser Leu His Met Phe Ser Ser Lys Ala Leu Asp Asp115 120 125 130TTT AGA CTT GTC CGT CAG GAA GAA GTA TCT ATA CTG GTA AAT GCG ATA 609Phe Arg Leu Val Arg Gln Glu Glu Val Ser Ile Leu Val Asn Ala Ile

135 140 145GCA AAA GCA GGA ACA AAG CCA GTA CAA CTA GGA CAA CTA CTC AAC GTG 657Ala Lys Ala Gly Thr Lys Pro Val Gln Leu Gly Gln Leu Leu Asn Val

150 155 160TGC ACC ACA AAT GCC TTA TCG AGG GTG ATG CTA GGG AAG CGA GTT CTC 705Cys Thr Thr Asn Ala Leu Ser Arg Val Met Leu Gly Lys Arg Val Leu

165 170 175GGT GAT GGC ACA GGG AAA AGC GAC CCA AAA GCC GAG GAA TTT AAG GAC 753Gly Asp Gly Thr Gly Lys Ser Asp Pro Lys Ala Glu Glu Phe Lys Asp

180 185 190ATG GTG CTG GAG TTA ATG GTT CTC ACC GGA GTT TTT AAC ATT GGC GAT 801Met Val Leu Glu Leu Met Val Leu Thr Gly Val Phe Asn Ile Gly Asp195 200 205 210TTT GTA CCG GCA TTG GAA TGT CTA GAC TTA CAA GGT GTT GCA TCT AAA 849Phe Val Pro Ala Leu Glu Cys Leu Asp Leu Gln Gly Val Ala Ser Lys

215 220 225ATG AAG AAA TTA CAT AAA AGA CTT GAT AAT TTT ATG AGT AAC ATT TTG 897Met Lys Lys Leu His Lys Arg Leu Asp Asn Phe Met Ser Asn Ile Leu

230 235 240GAG GAA CAC AAG AGT GTT GCA CAT CAA CAA AAT GGT GGA GAT TTG CTA 945Glu Glu His Lys Ser Val Ala His Gln Gln Asn Gly Gly Asp Leu Leu

245 250 255AGC ATT TTG ATA TCT TTG AAG GAT AAT TGT GAT GGT GAA GGT GGC AAG 993Ser Ile Leu Ile Ser Leu Lys Asp Asn Cys Asp Gly Glu Gly Gly Lys

260 265 270TTT AGT GCC ACA GAA ATT AAG GCC TTG CTA TTG GAT TTA TTT ACA GCT 1041Phe Ser Ala Thr Glu Ile Lys Ala Leu Leu Leu Asp Leu Phe Thr Ala275 280 285 290GGA ACA GAC ACA TCA TCT AGT ACA ACT GAA TGG GCC ATA GCC GAA CTA 1089Gly Thr Asp Thr Ser Ser Ser Thr Thr Glu Trp Ala Ile Ala Glu Leu

295 300 305ATT CGC CAT CCA AAA ATC TTA GCC CAA GTT CAA CAA GAA ATG GAC TCA 1137Ile Arg His Pro Lys Ile Leu Ala Gln Val Gln Gln Glu Met Asp Ser

310 315 320GTC GTG GGC CGA GAC CGA CTC ATA GCC GAA GCT GAC ATA CCG AAC CTA 1185Val Val Gly Arg Asp Arg Leu Ile Ala Glu Ala Asp Ile Pro Asn Leu

325 330 335ACC TAC TTC CAA GCC GTA ATC AAA GAG GTT TTC CGA CTT CAC CCG TCC 1233Thr Tyr Phe Gln Ala Val Ile Lys Glu Val Phe Arg Leu His Pro Ser

340 345 350ACC CCG CTT TCC CTA CCA CGG GTC GCA AAC GAA TCG TGC GAA ATA AAC 1281Thr Pro Leu Ser Leu Pro Arg Val Ala Asn Glu Ser Cys Glu Ile Asn355 360 365 370GGG TAC CAC ATT CCC AAA AAC ACC ACT TTA TTG GTA AAT GTG TGG GCC 1329Gly Tyr His Ile Pro Lys Asn Thr Thr Leu Leu Val Asn Val Trp Ala

375 380 385ATC GCA CGC GAC CCT GAG GTT TGG GCC GAC CCG TTA GAG TTT AAA CCC 1377Ile Ala Arg Asp Pro Glu Val Trp Ala Asp Pro Leu Glu Phe Lys Pro

390 395 400GAA AGA TTT TTG CCG GGC GGC GAA AAG CCC AAT GTG GAT GTG AAA GGA 1425Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Asn Val Asp Val Lys Gly

405 410 415AAC GAT TTT GAG CTG ATT CCG TTC GGG GCG GGC CGA CGG ATT TGT GCT 1473Asn Asp Phs Glu Leu Ils Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala

420 425 430GGG CTG AGT TTG GGC CTG CGT ATG GTC CAG TTG ATG ACA GCC ACT TTG 1521Gly Leu Ser Leu Gly Leu Arg Met Val Gln Leu Met Thr Ala Thr Leu435 440 445 450GCC CAT ACT TAT GAT TGG GCC TTA GCT GAT GGG CTT ATG CCC GAA AAG 1569Ala His Thr Tyr Asp Trp Ala Leu Ala Asp Gly Leu Met Pro Glu Lys

455 460 465CTT AAC ATG GAT GAG GCT TAT GGG CTT ACC TTA CAG CGT AAG GTG CCA 1617Leu Asn Met Asp Glu Ala Tyr Gly Leu Thr Leu Gln Arg Lys Val Pro

470 475 480CTT AAT GGT CCA CCC GAC CCC GTC GGC TTC TCG GCC CGT GTT T 1660Leu Asn Gly Pro Pro Asp Pro Val Gly Phs Ser Ala Arg Val

485 490 495AATAATTCCG GGGTTTTTAA AAGCGGGTTA CTTTTGTTTA TGTATTATTC CGTACTAGTT 1720TGAAAATAAT GGTATTAGAG AAATG 1745(2)关于SEQ ID NO:4的信息

(ⅰ)序列特征

(A)长度：496个碱基对

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:4Met His Asn Leu Tyr Tyr Leu Ile Thr Thr Val Phe Arg Gly His Gln1 5 10 15Lys Pro Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly Asn Leu

20 25 30Pro His Met Gly Gln Ala Pro His Gln Gly Leu Ala Ala Leu Ala Gln

35 40 45Lys Tyr Gly Pro Leu Leu Tyr Met Arg Leu Gly Tyr Val Asp Val Val

50 55 60Val Ala Ala Ser Ala Ser Val Ala Thr Gln Phe Leu Lys Thr His Asp65 70 75 80Leu Asn Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Lys Hia Ile Ala

85 90 95Tyr Asn Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Lys Trp Arg

100 105 110Met Leu Arg Lys Ile Cys Ser Leu His Met Phe Ser Ser Lys Ala Leu

115 120 125Asp Asp Phe Arg Leu Val Arg Gln Glu Glu Val Ser Ile Leu Val Asn

130 135 140Ala Ile Ala Lys Ala Gly Thr Lys Pro Val Gln Leu Gly Gln Leu Leu145 150 155 160Asn Val Cys Thr Thr Asn Ala Leu Ser Arg Val Met Leu Gly Lys Arg

165 170 175Val Leu Gly Asp Gly Thr Gly Lys Ser Asp Pro Lys Ala Glu Glu Phe

180 185 190Lys Asp Met Val Leu Glu Leu Met Val Leu Thr Gly Val Phe Asn Ile

195 200 205Gly Asp Phe Val Pro Ala Leu Glu Cys Leu Asp Leu Gln Gly Val Ala

210 215 220Ser Lys Met Lys Lys Leu His Lys Arg Leu Asp Asn Phe Met Ser Asn225 230 235 240Ile Leu Glu Glu His Lys Ser Val Ala His Gln Gln Asn Gly Gly Asp

245 250 255Leu Leu Ser Ile Leu Ile Ser Leu Lys Asp Asn Cys Asp Gly Glu Gly

260 265 270Gly Lys Phe Ser Ala Thr Glu Ile Lys Ala Leu Leu Leu Asp Leu Phe

275 280 285Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Thr Glu Trp Ala Ile Ala

290 295 300Glu Leu Ile Arg His Pro Lys Ile Leu Ala Gln Val Gln Gln Glu Met305 310 315 320Asp Ser Val Val Gly Arg Asp Arg Leu Ile Ala Glu Ala Asp Ile Pro

325 330 335Asn Leu Thr Tyr Phe Gln Ala Val Ile Lys Glu Val Phe Arg Leu His

340 345 350Pro Ser Thr Pro Leu Ser Leu Pro Arg Val Ala Asn Glu Ser Cys Glu

355 360 365Ile Asn Gly Tyr His Ile Pro Lys Asn Thr Thr Leu Leu Val Asn Val

370 375 380Trp Ala Ile Ala Arg Asp Pro Glu Val Trp Ala Asp Pro Leu Glu Phe385 390 395 400Lys Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Asn Val Asp Val

405 410 415Lys Gly Asn Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile

420 425 430Cys Ala Gly Leu Ser Leu Gly Leu Arg Met Val Gln Leu Met Thr Ala

435 440 445Thr Leu Ala His Thr Tyr Asp Trp Ala Leu Ala Asp Gly Leu Met Pro

450 455 460Glu Lys Leu Asn Met Asp Glu Ala Tyr Gly Leu Thr Leu Gln Arg Lys465 470 475 480Val Pro Leu Asn Gly Pro Pro Asp Pro Val Gly Phe Ser Ala Arg Val

485 490 495(2)关于SEQ ID NO:5的信息

(ⅰ)序列特征

(A)长度：1711个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：91..1629

(ⅹⅰ)序列描述：SEQ ID NO:5CGAATTCCCC CCCCCCCACA CCATTCAATG CCTAAGTCCT CCATTTGCCG GCCTAATAAC 60TAAAAGCCCA CTCTTTCCGA CCATCTATAC ATG CAA CAC CAA TAT TAT TCT TTA 114

Met Gln His Gln Tyr Tyr Ser Leu

1 5ATT ACG ATG GAT GAT ATT AGC ATA ACC AGC TTA TTG GTG CCA TGT ACT 162Ile Thr Met Asp Asp Ile Ser Ile Thr Ser Leu Leu Val Pro Cys Thr

10 15 20TTT ATA TTA GGG TTC TTG CTT CTA TAT TCC TTC CTC AAC AAA AAA GTA 210Phe Ile Leu Gly Phe Leu Leu Leu Tyr Ser Phe Leu Asn Lys Lys Val25 30 35 40AAG CCA CTG CCA CCT GGA CCG AAG CCA TGG CCC ATC GTC GGA AAT CTG 258Lys Pro Leu Pro Pro Gly Pro Lys Pro Trp Pro Ile Val Gly Asn Leu

45 50 55CCA CAT CTT GGG CCG AAG CCC CAC CAG TCG ATG GCG GCG CTG GCA CGG 306Pro His Leu Gly Pro Lys Pro His Gln Ser Met Ala Ala Leu Ala Arg

60 65 70GTG CAC GGC CCA TTA ATT CAT CTG AAG ATG GGC TTT GTG CAT GTG GTT 354Val His Gly Pro Leu Ile His Leu Lys Met Gly Phe Val His Val Val

75 80 85GTG GCC TCC TCA GCA TCC GTT GCG GAG AAA TTT CTG AAG GTG CAT GAC 402Val Ala Ser Ser Ala Ser Val Ala Glu Lys Phe Leu Lys Val His Asp

90 95 100GCA AAC TTC TCG AGC AGG CCT CCC AAT TCG GGT GCA AAA CAC GTG GCC 450Ala Asn Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Lys His Val Ala105 110 115 120TAC AAC TAT CAG GAC TTG GTC TTT GCT CCT TAT GGC CCA CGC TGG CGG 498Tyr Asn Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg

125 130 135ATG CTC AGG AAA ATC TGT GCA CTC CAC CTC TTC TCC GCC AAA GCC TTG 546Met Leu Arg Lys Ile Cys Ala Leu His Leu Phe Ser Ala Lys Ala Leu

140 145 150AAC GAC TTC ACA CAC GTC AGA CAG GAT GAG GTG GGG ATC CTC ACT CGC 594Asn Asp Phe Thr His Val Arg Gln Asp Glu Val Gly Ile Leu Thr Arg

155 160 165GTT CTA GCA GAT GCA GGA GAA ACG CCG TTG AAA TTA GGG CAG ATG ATG 642Val Leu Ala Asp Ala Gly Glu Thr Pro Leu Lys Leu Gly Gln Met Met

170 175 180AAC ACA TGC GCC ACC AAT GCA ATA GCG CGT GTT ATG TTG GGT CGA CGC 690Asn Thr Cys Ala Thr Asn Ala Ile Ala Arg Val Met Leu Gly Arg Arg185 190 195 200GTG GTT GGA CAC GCA GAC TCA AAG GCG GAG GAG TTT AAG GCA ATG GTA 738Val Val Gly His Ala Asp Ser Lys Ala Glu Glu Phe Lys Ala Met Val

205 210 215GTG GAG TTG ATG GTA TTA GCT GGT GTG TTC AAC TTA GGT GAT TTT ATC 786Val Glu Leu Met Val Leu Ala Gly Val Phe Asn Leu Gly Asp Phe Ile

220 225 230CCA CCT CTT GAA AAA TTG GAT CTT CAA GGT GTC ATT GCT AAG ATG AAG 834Pro Pro Leu Glu Lys Leu Asp Leu Gln Gly Val Ile Ala Lys Met Lys

235 240 245AAG CTT CAC TTG CGT TTC GAC TCG TTC TTG AGT AAG ATC CTT GGA GAC 882Lys Leu His Leu Arg Phe Asp Ser Phe Leu Ser Lye Ile Leu Gly Asp

250 255 260CAC AAG ATC AAC AGC TCA GAT GAA ACC AAA GGC CAT TCG GAT TTG TTG 930His Lys Ile Asn Ser Ser Asp Glu Thr Lys Gly His Ser Asp Leu Leu265 270 275 280AAC ATG TTA ATT TCT TTG AAG GAC GCT GAT GAT GCC GAA GGA GGG AGG 978Asn Met Leu Ile Ser Leu Lys Asp Ala Asp Asp Ala Glu Gly Gly Arg

285 290 295CTC ACC GAC GTA GAA ATT AAA GCG TTG CTC TTG AAC TTG TTT GCT GCA 1026Leu Thr Asp Val Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Ala Ala

300 305 310GGA ACT GAC ACA ACA TCA AGC ACT GTG GAA TGG TGC ATA GCT GAG TTA 1074Gly Thr Asp Thr Thr Ser Ser Thr Val Glu Trp Cys Ile Ala Glu Leu

315 320 325GTA CGA CAT CCT GAA ATC CTT GCC CAA GTC CAA AAA GAA CTC GAC TCT 1122Val Arg His Pro Glu Ile Leu Ala Gln Val Gln Lys Glu Leu Asp Ser

330 335 340GTT GTT GGT AAG AAT CGG GTG GTG AAG GAG GCT GAT CTG GCC GGA TTA 1170Val Val Gly Lys Asn Arg Val Val Lys Glu Ala Asp Leu Ala Gly Leu345 350 355 360CCA TTC CTC CAA GCG GTC GTC AAG GAA AAT TTC CGA CTC CAT CCC TCC 1218Pro Phe Leu Gln Ala Val Val Lys Glu Asn Phe Arg Leu His Pro Ser

365 370 375ACC CCG CTC TCC CTA CCG AGG ATC GCA CAT GAG AGT TGT GAA GTG AAT 1266Thr Pro Leu Ser Leu Pro Arg Ile Ala His Glu Ser Cys Glu Val Ash

380 385 390GGA TAC TTG ATT CCA AAG GGT TCG ACA CTT CTT GTC AAT GTT TGG GCA 1314Gly Tyr Leu Ile Pro Lya Gly Ser Thr Leu Leu Val Asn Val Trp Ala

395 400 405ATT GCT CGC GAT CCA AAT GTG TGG GAT GAA CCA CTA GAG TTC CGG CCT 1362Ile Ala Arg Asp Pro Ash Val Trp Asp Glu Pro Leu Glu Phe Arg Pro

410 415 420GAA CGA TTC TTG AAG GGC GGG GAA AAG CCT AAT GTC GAT GTT AGA GGG 1410Glu Arg Phe Leu Lys Gly Gly Glu Lys Pro Asn Val Asp Val Arg Gly425 430 435 440AAT GAT TTC GAA TTG ATA CCG TTC GGA GCG GGC CGA AGA ATT TGT GCA 1458Asn Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala

445 450 455GGA ATG AGC TTA GGA ATA CGT ATG GTC CAG TTG TTG ACA GCA ACT TTG 1506Gly Met Ser Leu Gly Ile Arg Met Val Gln Leu Leu Thr Ala Thr Leu

460 465 470AAC CAT GCG TTT GAC TTT GAT TTG GCG GAT GGA CAG TTG CCT GAA AGC 1554Asn His Ala Phe Asp Phe Asp Leu Ala Asp Gly Gln Leu Pro Glu Ser

475 480 485TTA AAC ATG GAG GAA GCT TAT GGG CTG ACC TTG CAA CGA GCT GAC CCT 1602Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Asp Pro

490 495 500TTG GTA GTG CAC CCG AAG CCT AGG TAGGCACCTC ATGTTTATCA AACTTAGGAC 1656Leu Val Val His Pro Lys Pro Arg505 510TCATGTTTAG AGAACCTCTT GTTGTTTTAT CAGATTGAAG TGTGATGTCC AAGAC 1711(2)关于SEQ ID NO:6的信息

(ⅰ)序列特征

(A)长度：512个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:6Met Gln His Gln Tyr Tyr Ser Leu Ile Thr Met Asp Asp Ile Ser Ile1 5 10 15Thr Ser Leu Leu Val Pro Cys Thr Phe Ile Leu Gly Phe Leu Leu Leu

20 25 30Tyr Ser Phe Leu Asn Lys Lys Val Lys Pro Leu Pro Pro Gly Pro Lys

35 40 45Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu Gly Pro Lys Pro His

50 55 60Gln Ser Met Ala Ala Leu Ala Arg Val His Gly Pro Leu Ile His Leu65 70 75 80Lys Met Gly Phe Val His Val Val Val Ala Ser Ser Ala Ser Val Ala

85 90 95Glu Lys Phe Leu Lys Val His Asp Ala Asn Phe Ser Ser Arg Pro Pro

100 105 110Asn Ser Gly Ala Lys His Val Ala Tyr Asn Tyr Gln Asp Leu Val Phe

115 120 125Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys Ile Cys Ala Leu

130 135 140His Leu Phe Ser Ala Lys Ala Leu Asn Asp Phe Thr His Val Arg Gln145 150 155 160Asp Glu Val Gly Ile Leu Thr Arg Val Leu Ala Asp Ala Gly Glu Thr

165 170 175Pro Leu Lys Leu Gly Gln Met Met Asn Thr Cys Ala Thr Asn Ala Ile

180 185 190Ala Arg Val Met Leu Gly Arg Arg Val Val Gly His Ala Asp Ser Lys

195 200 205Ala Glu Glu Phe Lys Ala Met Val Val Glu Leu Met Val Leu Ala Gly

210 215 220Val Phe Asn Leu Gly Asp Phe Ile Pro Pro Leu Glu Lys Leu Asp Leu225 230 235 240Gln Gly Val Ile Ala Lys Met Lys Lys Leu His Leu Arg Phe Asp Ser

245 250 255Phe Leu Ser Lys Ile Leu Gly Asp His Lys Ile Asn Ser Ser Asp Glu

260 265 270Thr Lys Gly His Ser Asp Leu Leu Asn Met Leu Ile Ser Leu Lys Asp

275 280 285Ala Asp AspAla Glu Gly Gly Arg Leu Thr Asp Val Glu Ile Lys Ala

290 295 300Leu Leu Leu Asn Leu Phe Ala Ala Gly Thr Asp Thr Thr Ser Ser Thr

305 310 315 320Val Glu Trp Cys Ile Ala Glu Leu Val Arg His Pro Glu Ile Leu Ala

325 330 335Gln Val Gln Lys Glu Leu Asp Ser Val Val Gly Lys Asn Arg Val Val

340 345 350Lys Glu Ala Asp Leu Ala Gly Leu Pro Phe Leu Gln Ala Val Val Lys

355 360 365Glu Asn Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Ile

370 375 380Ala His Glu Ser Cys Glu Val Asn Gly Tyr Leu Ile Pro Lys Gly Ser385 390 395 400Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp Pro Asn Val Trp

405 410 415Asp Glu Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Lys Gly Gly Glu

420 425 430Lys Pro Asn Val Asp Val Arg Gly Asn Asp Phe Glu Leu Ile Pro Phe

435 440 445Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu Gly lle Arg Met

450 455 460Val Gln Leu Leu Thr Ala Thr Leu Asn His Ala Phe Asp Phe Asp Leu465 470 475 480Ala Asp Gly Gln Leu Pro Glu Ser Leu Asn Met Glu Glu Ala Tyr Gly

485 490 495Leu Thr Leu Gln Arg Ala Asp Pro Leu Val Val His Pro Lys Pro Arg

500 505 510(2)关于SEQ ID NO:7的信息

(ⅰ)序列特征

(A)长度：971个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分大类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：1..811

序列描述：SEQ ID NO:7GAT ATG CTT AGC ACT TTA ATC TCC CTT AAA GGA ACT GAT CTT GAC GGT 48Asp Met Leu Ser Thr Leu Ile Ser Leu Lys Gly Thr Asp Leu Asp Gly1 5 10 15GAC GGA GGA AGC TTA ACG GAT ACT GAG ATT AAA GCC TTG CTA TTG AAC 96Asp Gly Gly Ser Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn

20 25 30ATG TTC ACA GCT GGA ACT GAC ACG TCA GCA AGT ACG GTG GAC TGG GCT 144Met Phe Thr Ala Gly Thr Asp Thr Ser Ala Ser Thr Val Asp Trp Ala

35 40 45ATA GCT GAA CTT ATC CGT CAC CCG GAT ATA ATG GTT AAA GCC CAA GAA 192Ile Ala Glu Leu Ile Arg His Pro Asp Ile Met Val Lys Ala Gln Glu

50 55 60GAA CTT GAT ATT GTT GTG GGC CGT GAC AGG CCT GTT AAT GAA TCA GAC 240Glu Leu Asp Ile Val Val Gly Arg Asp Arg Pro Val Asn Glu Ser Asp65 70 75 80ATC GCT CAG CTT CCT TAC CTT CAG GCG GTT ATC AAA GAG AAT TTC AGG 288Ile Ala Gln Leu Pro Tyr Leu Gln Ala Val Ile Lys Glu Asn Phe Arg

85 90 95CTT CAT CCA CCA ACA CCA CTC TCG TTA CCA CAC ATC GCG TCA GAG AGC 336Leu His Pro Pro Thr Pro Leu Ser Leu Pro His Ile Ala Ser Glu Ser

100 105 110TGT GAG ATC AAC GGC TAC CAT ATC CCG AAA GGA TCG ACT CTA TTT GAC 384Cys Glu Ile Asn Gly Tyr His Ile Pro Lys Gly Ser Thr Leu Phe Asp

115 120 125GGA CAT ATG GGC CTA GGC CGT GAC CCG GAT CAA TGG TCC GAC CCG TTA 432Gly His Met Gly Leu Gly Arg Asp Pro Asp Gln Trp Ser Asp Pro Leu

130 135 140GCA TTT AAA CCC GAG AGA TTC TTA CCC GGT GGT GAA AAA TCC GGC GTT 480Ala Phe Lys Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Ser Gly Val145 150 155 160GAT GTG AAA GGA AGC GAT TTC GAG CTA ATA CCG TTC GGG GCT GGG AGG 525Asp Val Lys Gly Ser Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg

165 170 175CCA ATC TGT GCA GGT TTA AGT TTA GGG CTA CGT ACA GAT TTA AGT TGC 576Pro Ile Cys Ala Gly Leu Ser Leu Gly Leu Arg Thr Asp Leu Ser Cys

180 185 190CTT CAC GCC AAC GTT GCT CAC AAG CAT TTG ATT GGG AAC TTC AGC TGG 624Leu His Ala Asn Val Ala His Lys His Leu Ile Gly Asn Phe Ser Trp

195 200 205AGA AGT TAC GCC GCA CAA CCT GAA TAT CGC AGG AAA AGT TTA CTG GGC 672Arg Ser Tyr Ala Gly Gln Pro Glu Tyr Arg Arg Lys Ser Leu Leu Gly

210 215 220TTT ACA CTG CAA AGA GCG GTT CCT TCG GTG GTA CAC CCT AAG CCA AGG 720Phe Thr Leu Gln Arg Ala Val Pro Ser Val Val His Pro Lys Pro Arg225 230 235 240TTG GCC CCG AAC GTT TAT GGA CCC CGG GTC GGC TTA AAA TTT AAC TTT 768Leu Ala Pro Asn Val Tyr Gly Pro Arg Val Gly Leu Lys Phe Asn Phe

245 250 255GCT TCT TGG ACA AGG TAT ATG GCT TGC ACG AAA CTA ACG TTT T 811Ala Ser Trp Thr Arg Tyr Met Ala Cys Thr Lys Leu Thr Phe

260 265 270AACACACCGT AGTTTGATCC GGAGTTAGCT TTATGTAAGA ACGTGTAACG CCAAATCAAG 871CCATTATCAA CTACCGTGAG CTGTTTGTAC CCTATCTATA AATCTTGAAG AGGAACATTT 931CAGAACTCTT GACTATGTTT CAGGAACAAA AAAAAAAAAA 971(2)关于SEQ ID NO:8的信息

(ⅰ)序列特征

(A)长度：270个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:8Asp Met Leu Ser Thr Leu Ile Ser Leu Lys Gly Thr Asp Leu Asp Gly1 5 10 15Asp Gly Gly Ser Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn

20 25 30Met Phe Thr Ala Gly Thr Asp Thr Ser Ala Ser Thr Val Asp Trp Ala

35 40 45Ile Ala Glu Leu Ile Arg His Pro Asp Ile Met Val Lys Ala Gln Glu

50 55 60Glu Leu Asp Ile Val Val Gly Arg Asp Arg Pro Val Asn Glu Ser Asp65 70 75 80Ile Ala Gln Leu Pro Tyr Leu Gln Ala Val Ile Lys Glu Asn Phe Arg

85 90 95Leu His Pro Pro Thr Pro Leu Ser Leu Pro His Ile Ala Ser Glu Ser

100 105 110Cys Glu Ile Asn Gly Tyr His Ile Pro Lys Gly Ser Thr Leu Phe Asp

115 120 125Gly His Met Gly Leu Gly Arg Asp Pro Asp Gln Trp Ser Asp Pro Leu

130 135 140Ala Phe Lys Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Ser Gly Val145 150 155 160Asp Val Lys Gly Ser Asp Phs Glu Leu Ile Pro Phe Gly Ala Gly Arg

165 170 175Pro Ile Cys Ala Gly Leu Ser Leu Gly Leu Arg Thr Asp Leu Ser Cys

180 185 190Leu His Ala Asn Val Ala His Lys His Leu Ile Gly Asn Phe Ser Trp

195 200 205Arg Ser Tyr Ala Gly Gln Pro Glu Tyr Arg Arg Lys Ser Leu Leu Gly

210 215 220Phe Thr Leu Gln Arg Ala Val Pro Ser Val Val His Pro Lys Pro Arg225 230 235 240Leu Ala Pro Asn Val Tyr Gly Pro Arg Val Gly Leu Lys Phe Asn Phe

245 250 255Ala Ser Trp Thr Arg Tyr Met Ala Cys Thr Lys Leu Thr Phe

260 265 270(2)关于SEQ ID NO:9的信息

(ⅰ)序列特征

(A)长度：6595个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分大类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：1478..1927

(ⅸ)特征

(A)名称/键：CDS

(B)位置：2651..3091

(ⅸ)特征

(A)名称/键：CDS

(B)位置：3170..3340

(ⅸ)特征

(A)名称/键：CDS

(B)位置：3421..3900

(ⅹⅰ)序列描述：SEQ ID NO:9GTCGACTCTC TCCCTTTCGC TTGCTACTTT TTCTACATAA ATAAATGCAA TGATAAATTT 60GTGCACACAT TCGTATGTTT GAAACATGGT AGGATCCACA ATTTATACTT TATAGACTCA 120AAATGGAAAA GAAACGTACA TTATAAATTT ATCTGCAATT TGTTTTCTCT TGCTAAACTA 180GACTGTATAA TAACCTCTGT ATATGCTATT ACTCGATTGT AAACGTACCC CGCAAGTCGC 240AAGCAAGGTA AATAAAGTAT AATTATATTT TCACACACGA AACTTTAATT ATTATTTTTA 300TCACTTGCAG ATTAACAGTA AAAAAAAAAA AAATGTGACT TTAACGGCGA CAAAAACTAC 360TGATCTTTCT CCAATATTTA AATAATATAA TTAATAAACG TCTTTTCATA CTTGTATTTT 420CCGACCCGAG TTCTGAAAGT GAAAACATAT GGTACTAGAT ATTCTCGATT TGTTTTGTAG 480CCACTAGACT CTAAACAGAA AAAAGAAGCC AAAAGGACAA CGTTAAAAAA GAGACACTGT 540TATTAAAAGT TAGAAACCAA ACGGTGAAAA TCCAGCTACA TACATAAAAT AAAGCCAAGG 600TACCAAACTA ATGAACTGTA ACCTCTTTTT TCTTTTCTTT TTTGTTAAAG GATTTATGAA 660CTGTAACTTA GAATGCTTGG TTTGTGGGCA GTGTAATATA TGACACACAT GCATTTTTTT 720TGTTTGTCAA ATAGGAAGAC TTCTTTTTTC TTTATCAACT TCCTTATTTT CATAAAACAA 780AACACTGAAA AAAGTACAGA TGTTCTCACG TACGTCACGT GTACATACAT ATATATTAGA 840CCACTATATA ATAAGATATG AAGTGTTAGG TTTAAATCAA TTAACGAATC CCATCCAAAT 900GATGAAACAG TTAACAAGAA ATCAAAATAG TTTATTAGGG TTACAATGAT TTTATACTTT 960TAAGAAATCT TAGAACCTAT CACTTACAAA TGAGTAAATG ACCATTACTC CTCGAGAATC 1020TAAGGCGCTT AAGGAAGCAT TGCGAATCGG GTGTGAAAAA GATCTATTTT TTGAATTATT 1080TCACACAATT TCTTAATGTC AATTTTCGAT GCTCCCATAT TCTCCACGGT TTAAAGCAAG 1140ATTGGTGGGA AAGGGATATT CTCGCATCGA TTACAATGAA ATATGGGTTG AAAAAAAAAA 1200AAAAAAATTA CTCAATGTTG CACCAAAAAC CAGAAAACTC TAAGTTGCGC TAATAAAAAA 1260AAAAGTTATA AACCCAACAT CAAACCAAAA CCGTACTAAA CTGTCCCATA TGAGATTTAG 1320CTTTAAATAA ATTAGTACTT CTCATAACGA TAACTAAATT AAATTTCCCT AGCCAAGACA 1380TACATATAGT TTTGATTGAC AAAAAAAAAA AAAACTCCTC TATTTATAGC TTGTGTTTTG 1440TTTCCTCATT TTTCACTTAC CATTCAAACC CAACACT ATG GCA ACT CTA TTT CTC 1495

Met Ala Thr Leu Phe Leu

1 5ACA ATC CTC CTA GCC ACT GTC CTC TTC CTC ATC CTC CGT ATC TTC TCT 1543Thr Ile Leu Leu Ala Thr Val Leu Phe Leu Ile Leu Arg Ile Phe Ser

10 15 20CAC CGT CGC AAC CGC AGC CAC AAC AAC CGT CTT CCA CCG GGG CCA AAC 1591His Arg Arg Asn Arg Ser His Asn Asn Arg Leu Pro Pro Gly Pro Asn

25 30 35CCA TGG CCC ATC ATC GGA AAC CTC CCT CAC ATG GGC ACT AAG CCT CAT 1639Pro Trp Pro Ile Ile Gly Asn Leu Pro His Met Gly Thr Lys Pro His

40 45 50CGA ACC CTT TCC GCC ATG GTT ACT ACT TAC GGC CCT ATC CTC CAC CTC 1687Arg Thr Leu Ser Ala Met Val Thr Thr Tyr Gly Pro Ile Leu His Leu55 60 65 70CGA CTA GGG TTC GTA GAC GTC GTG GTC GCC GCT TCT AAA TCC GTG GCC 1735Arg Leu Gly Phe Val Asp Val Val Val Ala Ala Ser Lys Ser Val Ala

75 80 85GAG CAG TTC TTG AAA ATA CAC GAC GCC AAT TTC GCT AGC CGA CCA CCA 1783Glu Gln Phe Leu Lys Ile His Asp Ala Asn Phe Ala Ser Arg Pro Pro

90 95 100AAC TCA GGA GCC AAA CAC ATG GCA TAT AAC TAT CAA GAT CTT GTC TTT 1831Asn Ser Gly Ala Lys His Met Ala Tyr Asn Tyr Gln Asp Leu Val Phe

105 110 115GCA CCT TAC GGA CAC CGA TGG AGA CTG TTG AGA AAG ATT AGT TCT GTT 1879Ala Pro Tyr Gly His Arg Trp Arg Leu Leu Arg Lys Ile Ser Ser Val

120 125 130CAT CTA TTT TCA GCT AAA GCT CTC GAA GAT TTC AAA CAT GTT CGA CAG 1927His Leu Phe Ser Ala Lys Ala Leu Glu Asp Phe Lys His Val Arg Gln135 140 145 150GTAAAACAAT TATAAACGGT ATTCTCATTT TCTAACGCTA TAGCTCACTG GCCTGTAATC 1987ATGTCATTTC AATGTTTTGA CTTTTTCTTT ATATATACAT AATTATAATT TATAATTGGG 2047ATTTCAAACC CTATCTCTCA CTATTTCAAG ACTAGACCGG ATTGCAATTT GAACTTTTGT 2107AATGAATATT AGTATCTGCA CATAAATTTT ATGTTAAAGT TGGGTTTTCT TAAAGTGAAT 2167TTATATATTA AAAATATATA AACGATTGGG TTTTACTCAA ATGAATTTAC ATAAGAGCTA 2227GGTATAAGTG CAAATATGCA ATACTGTCAT TGTCGTGGAT GTATAAAAGT ATGATCTAAC 2287TTTGATGATG CCATGGAAAA ATTGGAAAGT TCAGATCCAG AGGAAACATT GCTTGAATTA 2347TAAAATGTAT GGACCACATT GTTTCCTTAA ATGGAAGGTC TCACGAGTTT CTCAATTTCA 2407GACTACTGAT AATATATGCT ATTATAGATT TTATTTTCTG ATTATTTTTT TTGGTTTAAT 2467TTAATTAGAG TAAATTTTTA AAAAGAAATA TATGGTTTTG TTAACCGTGT TTTAAAATTT 2527GATAGAGCTT TTAGATCATA ATCATAATTT TTTCGTATTA ATTGTGATTA TGTTGGACGA 2587AAATACTTAA TTAGTATTCA AGAAAACTCT TATTCTAAAA ACAGAAATAA ATGAATTTTA 2647CAG GAA GAG GTT GGA ACG CTA ACG CGG GAG CTA GTG CGT GTT GGC ACG 2695

Glu Glu Val Gly Thr Leu Thr Arg Glu Leu Val Arg Val Gly Thr

1 5 10 15AAA CCC GTG AAT TTA GGC CAG TTG GTG AAC ATG TGT GTA GTC AAC GCT 2743Lys Pro Val Asn Leu Gly Gln Leu Val Asn Met Cys Val Val Asn Ala

20 25 30CTA GGA CGA GAG ATG ATC GGA CGG CGA CTG TTC GGC GCC GAC GCC GAT 2791Leu Gly Arg Glu Met Ile Gly Arg Arg Leu Phe Gly Ala Asp Ala Asp

35 40 45CAT AAA GCT GAC GAG TTT CGA TCG ATG GTG ACG GAA ATG ATG GCT CTC 2839His Lys Ala Asp Glu Phe Arg Ser Met Val Thr Glu Met Met Ala Leu

50 55 60GCC GGA GTA TTT AAC ATC GGA GAT TTC GTG CCG TCA CTT GAT TGG TTA 2887Ala Gly Val Phe Asn Ile Gly Asp Phe Val Pro Ser Leu Asp Trp Leu

65 70 75GAT TTA CAA GGC GTC GCT GGT AAA ATG AAA CGG CTT CAC AAA AGA TTC 2935Asp Leu Gln Gly Val Ala Gly Lya Met Lys Arg Leu His Lys Arg Phe80 85 90 95GAC GCT TTT CTA TCG TCG ATT TTG AAA GAG CAC GAA ATG AAC GGT CAA 2983Asp Ala Phe Leu Sar Sar Ile Leu Lys Glu His Glu Met Asn Gly Gln

100 105 110GAT CAA AAG CAT ACA GAT ATG CTT AGC ACT TTA ATC TCC CTT AAA GGA 3031Asp Gln Lys His Thr Asp Met Leu Ser Thr Leu Ile Ser Leu Lys Gly

115 120 125ACT GAT CTT GAC GGT GAC GGA GGA AGC TTA ACG GAT ACT GAG ATT AAA 3079Thr Asp Leu Asp Gly Asp Gly Gly Ser Leu Thr Asp Thr Glu Ile Lys

130 135 140GCC TTG CTA TTG GTCAGTTTTT TGACAATTAA TTTCCTTAAA AATCGTATAT 3131Ala Leu Leu Leu

145AATGAAAGTT AGATTGTTTT TTTTGGTTGT AAATACAG AAC ATG TTC ACA GCT 3184Asn Met Phe Thr Ala1 5GGA ACT GAC ACG TCA GCA AGT ACG GTG GAC TGC GCT ATA GCT GAA CTT 3232Gly Thr Asp Thr Ser Ala Ser Thr Val Asp Trp Ala Ile Ala Glu Leu

10 15 20ATC CGT CAC CCG GAT ATA ATG GTT AAA GCC CAA GAA GAA CTT GAT ATT 3280Ile Arg His Pro Asp Ile Met Val Lys Ala Gln Glu Glu Leu Asp Ile

25 30 35GTT GTG GGC CGT GAC AGG CCT GTT AAT GAA TCA GAC ATC GCT CAG CTT 3328Val Val Gly Arg Asp Arg Pro Val Asn Glu Ser Asp Ile Ala Gln Leu

40 45 50CCT TAC CTT CAG GTACCGTTAA CCCAAACCGG AATTTGGAAT TGTTTTGGTT 3380Pro Tyr Leu Gln

55AGCGAGCTAT TGTTGTTAAT CCGGTTTTGG TTTAAAACAG GCG GTT ATC AAA GAG 3435

Ala Val Ile Lys Glu

1 5AAT TTC AGG CTT CAT CCA CCA ACA CCA CTC TCG TTA CCA CAC ATC GCG 3483Asn Phe Arg Leu His Pro Pro Thr Pro Leu Ser Leu Pro His Ile Ala

10 15 20TCA GAG AGC TGT GAG ATC AAC GGC TAC CAT ATC CCG AAA GGA TCG ACT 3531Ser Glu Ser Cys Glu Ile Asn Gly Tyr His Ile Pro Lys Gly Ser Thr

25 30 35CTA TTG ACG AAC ATA TGG GCC ATA GCC CGT GAC CCG GAT CAA TGG TCC 3579Leu Leu Thr Asn Ile Trp Ala Ile Ala Arg Asp Pro Asp Gln Trp Ser

40 45 50GAC CCG TTA GCA TTT AAA CCC GAG AGA TTC TTA CCC GGT GGT GAA AAA 3627Asp Pro Leu Ala Phe Lys Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys

55 60 65TCC GGC GTT GAT GTG AAA GGA AGC GAT TTC GAG CTA ATA CCG TTC GGA 3675Ser Gly Val Asp Val Lys Gly Ser Asp Phe Glu Leu Ile Pro Phe Gly70 75 80 85GCT GGG AGG AGA ATC TGT GCC GGT TTA AGT TTA GGG TTA CGT ACG ATT 3723Ala Gly Arg Arg Ile Cys Ala Gly Leu Ser Leu Gly Leu Arg Thr Ile

90 95 100CAG TTT CTT ACG GCG ACG TTG GTT CAA GGA TTT GAT TGG GAA TTA GCT 3771Gln Phe Leu Thr Ala Thr Leu Val Gln Gly Phe Asp Trp Glu Leu Ala

105 110 115GGA GGA GTT ACG CCG GAG AAG CTG AAT ATG GAG GAG AGT TAT GGG CTT 3819Gly Gly Val Thr Pro Glu Lys Leu Asn Met Glu Glu Ser Tyr Gly Leu

120 125 130ACA CTG CAA AGA GCG GTT CCT TTG GTG GTA CAT CCT AAG CCA AGG TTG 3867Thr Leu Gln Arg Ala Val Pro Leu Val Val His Pro Lys Pro Arg Leu

135 140 145GCT CCG AAC GTT TAT GGA CTC GGG TCG GGT TAAAATTTAA CTTTGCTTCT 3917Ala Pro Asn Val Tyr Gly Leu Gly Ser Gly150 155 160TGGACAAGGT ATATGGCTTG CACGAAAATA AAGTTTTAAA ACAGCGTAGT TTGATCCGGA 3977GTTAGCTTTA TGTAAGAACG TGTAACGCCA AATCAAGTCA TTATTAAATA TTGTGAGTTG 4037TTTGTAACCT ATATATAAAT CTTGAAGAGG AAGATTTCAG AAATCTTGAA TATGTTTTAG 4097GAAAAACATT GTTTTTTTTA CAGTAGCGCA AGTTGAATTA AAACCTATTC CTTACAGAAC 4157CAAATGCATT AATAATTCTA GATATTTTTG GCCAAGACAA TCAGATTTTT CAATATTTCA 4217TATATACTAG GTGGAACACC ACCACCTGCA ACTCTGCAAC ACATGTTACG TTACACAATC 4277ACTTTTGGCG GTTTTCAATT ATTTATATAA AATTGTAAAT GTTTGTACAC AGTAGAAAAT 4337TAGTAATAGT GAATTTTGTT TCTCCGAATA TGTATAGCAA TATATATGGC ATGGATCAAA 4397CTAGCCGACA TCCTAACTTG TTCACAGCTT TCCTTTTTAC TTATCTAGTC GATTAAGCAT 4457CAGAAAGTAT GTTTTAATTT TTAAATTTGA AAAAGGTGTA CTTACAAGTT CGGGTGTTCA 4517CACGGAGGAG AGCTACAATA ATGAAAAAGC TGACTCAAGA AGGGCTATAG AAGAAACAAG 4577AGTCACGGAA CAAGTTGTCA CTCTCAATCT CCAGTACACT AGCTTCCATA ACTCTCTCTC 4637TTTCTCTCTT TCTTCTCTCT CTAAAAGTTA TCAGAATAGA AATCTCTCTC TCTCAACAAG 4697TCTAACAGTG CCATTTGTAT CTCTGAACTC CAACATGGCT CCTCTGGTTC TCTACCTTCT 4757CACTCTCCTC ATGGCTGGCC ATTCCAGTAA GAACTCTCAC TGATCTTCTT CACCTTTGTT 4817TATGGATTTG GTCTCTCAGT CTCACTCTCG CTTACCCTTT CACATTCAGC TCTGGCTCTC 4877TGGTTTAAGA AACCCTTAAT CTACAAAGCT TGCTTTCCTC GCAAATGAAC TACCTTACTT 4937ATCTCTTATG CAACTCTTGT TGATGATTTG CAAACATCTT AACCTCTCGA AACAAGATTT 4997ACAAATCTTA CTGGCTTCAC TTACAATTTT GTTCCCATTT TTTTCTTCTT TGGTAGGTGC 5057CTCATGGTGT GTGTGCAAAA CAGGGCTGAG TGACTCAGTG CTACAAAAGA CATTAGACTA 5117TGCTTGTGGA AATGGAGCTG ACTGTAACCC AACTCACCCA AAAGGCTCTT GCTTCAATCC 5177TGACAATGTT AGGGCTCATT GCAACTATGC AGTCAATAGC TTCTTCCAAA AGAAAGGTCA 5237AGCTTCTGAG TCTTGTAACT TCACTGGTAC TGCCACTCTT ACCACCACCG ATCCCAGTAA 5297GTTTTCAGAA TGTTAACACT CTTGTGATCT TTAGAACCCT ACAAAATTTT GAGTCTCAGA 5357AAGTTCAAGT TCAAGGTCTT TTGGTTAGAG TACTAAAGAT TCAAGTAGAG ACTAGGCGTG 5417AGATATTTTT TCTCTGATGT GTGATTTTTT GGCACAGGCT ATACAGGATG TGCATTCCCT 5477TCTAGTGCTA GGTACGGCTC TTTGCTTCTC TACACATTTA TTTTCTTAAT GGCTTTATCT 5537AGAACTTTGA AGGATACCAT TTTATTTTTT TTGGACAAAG AAGGATAGCC ATTTAATACT 5597ACACTTTAAT GTTGGATTAA CTAACTTATT ATGCCTATTT AATGGCCTAC ACTTTAAGTG 5657GACACAAGCT TGATTTGGTT ATAAAAAAAG TGCACTATAA TCTTATTTTA CTGAACCCTT 5717TTTTCTATGA TTTTTTTACT AAACTTTAGA TAACATCTAC AACAATTCAA TTGCCTTTTT 5777TTGGGGATTG TATAAGTTTG AACCTATGGT TAGTGTATTG ACTTGCGCGT CTCTTATTGC 5837AACGGTTCTT TGAAAACACA TTAATGATAA ATAAATTGAA AAGTATAGAG ATGGCAATTG 5897TTTCAAAAGC TAATCTTTCT GCTTGCTAAT ACTTTACATA AAAAACAAAA AATTAAGAAG 5957ATTTTCAAAC AATACAACTT TTTTACCTTG TCCTAACAAA TTCAACTCAA ATGACATGTG 6017TTTGCTTTAA AATAGTAACA ACTGTAAATT CATTTGCTCT TGAGACATAA GTGCAAGCTA 6077AAGATAAACG CAAGCAATAC AATTAGGCCT AATTAAGATT ACGAATATTG TTGTTTGTTT 6137ATAGTGGTTC TAGTGGAAGC GGTAGCACCA CCGTGACGCC AGGCAAAAAC AGTCCAAAAG 6197GAAGCAACAG CATCACCACA TTTCCCGGCG GAAACAGTCC ATACACTGGC ACACCATCCA 6257CCGGATTATT AGGAGGCAAT ATCACTGATG CAACTGGAAC CGGGTTGAAC CCGGATTACT 6317CAACCGAAAG CAGTGGATTT GCGCTCTATT ACTCCAACAA CCTTCTGTTA ACCGGCTTTT 6377GTTCTCTCGT GATGATGCTC TGAAGAAGAA TCACCGTCTT CTTTTAGTTT ATGCTTAGTC 6437AAAAAAATAT GTTATTTATA TGTTCTTGTT GTTTTAGAGA TAATTTAATC TGGATTTCGG 6497TTCTTTTTTA CTTTCCGGTT TTAAGAAAAC AATTATCAAT GTAAAACCAA ATCTACTATC 6557GATCGGTTTG GTACGAATTC CTGCAGCCCG GGGGATCC 6595(2)关于SEQ ID NO:10的信息

(ⅰ)序列特征

(A)长度：149个氨基酸

(B)类型：氨基酸

(D)：拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:10Met Ala Thr Leu Phe Leu Thr Ils Leu Leu Ala Thr Val Leu Phe Leu1 5 10 15Ile Leu Arg Ile Phe Ser His Arg Arg Asn Arg Ser His Asn Asn Arg

20 25 30Leu Pro Pro Gly Pro Asn Pro Trp Pro Ile Ile Gly Asn Leu Pro His

35 40 45Met Gly Thr Lys Pro His Arg Thr Leu Ser Ala Met Val Thr Thr Tyr

50 55 60Gly Pro Ile Leu His Leu Arg Leu Gly Phs Val Asp Val Val Val Ala65 70 75 80Ala Ser Lys Ser Val Ala Glu Gln Phe Leu Lys Ile His Asp Ala Asn

85 90 95Phe Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Met Ala Tyr Asn

100 105 110Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly His Arg Trp Arg Leu Leu

115 120 125Arg Lys Ile Ser Ser Val His Leu Phe Ser Ala Lys Ala Leu Glu Asp

130 135 140Phe Lys His Val Arg Gln145 150(2)关于SEQ ID NO:11的信息

(ⅰ)序列特征

(A)长度：147个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:11Glu Glu Val Gly Thr Leu Thr Arg Glu Leu Val Arg Val Gly Thr Lys1 5 10 15Pro Val Asn Leu Gly Gln Leu Val Asn Met Cys Val Val Asn Ala Leu

20 25 30Gly Arg Glu Het Ile Gly Arg Arg Leu Phe Gly Ala Asp Ala Asp His

35 40 45Lys Ala Asp Glu Phs Arg Ser Met Val Thr Glu Met Met Ala Leu Ala

50 55 60Gly Val Phe Asn Ile Gly Asp Phe Val Pro Ser Leu Asp Trp Leu Asp65 70 75 80Leu Gln Gly Val Ala Gly Lys Met Lys Arg Leu His Lys Arg Phe Asp

85 90 95Ala Phe Leu Ser Ser Ile Leu Lys Glu His Glu Met Asn Gly Gln Asp

100 105 110Gln Lys His Thr Asp Met Leu Ser Thr Leu Ile Ser Leu Lys Gly Thr

115 120 125Asp Leu Asp Gly Asp Gly Gly Ser Leu Thr Asp Thr Glu Ile Lys Ala

130 135 140Leu Leu Leu145(2)关于SEQ ID NO:12的信息

(ⅰ)序列特征

(A)长度：57个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:12Asn Met Phe Thr Ala Gly Thr Asp Thr Ser Ala Ser Thr Val Asp Trp1 5 10 15Ala Ile Ala Glu Leu Ile Arg His Pro Asp Ile Met Val Lys Ala Gln

20 25 30Glu Glu Leu Asp Ile Val Val Gly Arg Asp Arg Pro Val Asn Glu Ser

35 40 45Asp Ile Ala Gln Leu Pro Tyr Leu Gln

50 55(2)关于SEQ ID NO:13的信息

(ⅰ)序列特征

(A)长度：160个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:13Ala Val Ile Lys Glu Asn Phe Arg Leu His Pro Pro Thr Pro Leu Ser1 5 10 15Leu Pro His Ile Ala Ser Glu Ser Cys Glu Ile Asn Gly Tyr His Ile

20 25 30Pro Lys Gly Ser Thr Leu Leu Thr Asn Ile Trp Ala Ile Ala Arg Asp

35 40 45Pro Asp Gln Trp Ser Asp Pro Leu Ala Phe Lys Pro Glu Arg Phe Leu

50 55 60Pro Gly Gly Glu Lys Ser Gly Val Asp Val Lys Gly Ser Asp Phe Glu65 70 75 80Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Leu Ser Leu

85 90 95Gly Leu Arg Thr Ile Gln Phe Leu Thr Ala Thr Leu Val Gln Gly Phe

100 105 110Asp Trp Glu Leu Ala Gly Gly Val Thr Pro Glu Lys Leu Asn Met Glu

115 120 125Glu Ser Tyr Gly Leu Thr Leu Gln Arg Ala Val Pro Leu Val Val His

130 135 140Pro Lys Pro Arg Leu Ala Pro Asn Val Tyr Gly Leu Gly Ser Gly145 150 155(2)关于SEQ ID NO:14的信息

(ⅰ)序列特征

(A)长度：1748个氨基酸

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：22..1563

(ⅹⅰ)序列描述：SEQ ID NO:14TGTCGAGAAA GAAGAACAGC C ATG TTT CTC ATA GTA GTG ATC ACC TTC CTC 51

Met Phe Leu Ile Val Val Ile Thr Phe Leu

1 5 10TTC GCC GTG TTT TTG TTC CGG CTT CTT TTC TCC GGC AAA TCC CAA CGC 99Phe Ala Val Phe Leu Phe Arg Leu Leu Phe Ser Gly Lys Ser Gln Arg

15 20 25CAC TCG CTC CCT CTC CCT CCT GGC CCC AAA CCA TGG CCG GTG GTT GGC 147His Ser Leu Pro Leu Pro Pro Gly Pro Lys pro Trp Pro Val Val Gly

30 35 40AAC TTA CCT CAC TTG GGC CCC TTC CCG CAC CAC TCC ATC GCG GAG TTG 195Asn Leu Pro His Leu Gly Pro Phe Pro His His Sar Ile Ala Glu Leu

45 50 55GCG AAG AAA CAC GGG CCG CTC ATG CAC CTC CGC CTC GGC TAC GTT GAC 243Ala Lys Lys His Gly Pro Leu Met His Leu Arg Leu Gly Tyr Val Asp

60 65 70GTA GTC GTG GCG GCA TCA GCA TCC GTA GCG GCC CAG TTC TTG AAG ACT 291Val Val Val Ala Ala Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr75 80 85 90CAC GAC GCC AAT TTC TCC AGC CGA CCG CCC AAC TCC GGC GCC AAG CAC 339His Asp Ala Asn Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Lys His

95 100 105CTC GCC TAT AAC TAC CAG GAC CTC GTG TTC AGG CCG TAC GGT CCA CGG 387Leu Ala Tyr Asn Tyr Gln Asp Leu Val Phe Arg Pro Tyr Gly Pro Arg

110 115 120TGG CGC ATG TTC CGG AAG ATC AGC TCC GTC CAT CTG TTC TCC GGC AAA 435Trp Arg Met Phe Arg Lys Ile Ser Ser Val His Leu Phe Ser Gly Lys

125 130 135GCC TTG GAT GAT CTT AAA CAC GTC CGG CAG GAG GAG GTA AGT GTG CTA 483Ala Leu Asp Asp Leu Lys His Val Arg Gln Glu Glu Val Ser Val Leu

140 145 150GCG CAT GCC TTG GCA AAT TCA GGG TCA AAG GTA GTG AAC CTG GCG CAA 531Ala His Ala Leu Ala Asn Ser Gly Ser Lys Val Val Asn Leu Ala Gln155 160 165 170CTG CTG AAC CTG TGC ACG GTC AAT GCT CTA GGA AGG GTG ATG GTA GGG 579Leu Leu Asn Leu Cys Thr Val Asn Ala Leu Gly Arg Val Met Val Gly

175 180 185CGG AGG GTT TTC GGC GAC GGC AGC GGA GGC GAC GAT CCG AAG GCG GAC 627Arg Arg Val Phe Gly Asp Gly Ser Gly Gly Asp Asp Pro Lys Ala Asp

190 195 200GAG TTC AAA TCG ATG GTG GTG GAG ATG ATG GTG TTG GCA GGA GTG TTC 675Glu Phe Lys Ser Met Val Val Glu Met Met Val Leu Ala Gly Val Phe

205 210 215AAC ATA GGT GAC TTC ATC CCC TCT CTC GAA TGG CTT GAC TTG CAA GGC 723Asn Ile Gly Asp Phe Ile Pro Ser Leu Glu Trp Leu Asp Leu Gln Gly

220 225 230GTG GCG TCC AAG ATG AAG AAG CTC CAC AAG AGA TTC GAC GAC TTC TTG 771Val Ala Ser Lys Met Lys Lys Leu His Lys Arg Phe Asp Asp Phe Leu235 240 245 250ACA GCC ATT GTC GAG GAC CAC AAG AAG GGC TCC GGC ACG GCG GGG CAC 819Thr Ala Ile Val Glu Asp His Lys Lys Gly Ser Gly Thr Ala Gly His

255 260 265GTC GAC ATG TTG ACC ACT CTG CTC TCG CTC AAG GAA GAC GCC GAC GGC 867Val Asp Met Leu Thr Thr Leu Leu Ser Leu Lys Glu Asp Ala Asp Gly

270 275 280GAA GGA GGC AAG CTC ACC GAT ACT GAA ATC AAA GCT TTG CTT TTG AAC 915Glu Gly Gly Lys Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn

285 290 295ATG TTC ACG GCT GGC ACT GAT ACG TCA TCG AGC ACG GTG GAA TGG GCA 963Met Phe Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala

300 305 310ATA GCT GAA CTC ATT CGG CAC CCT CAT ATG CTA GCG CGA GTT CAG AAA 1011Ile Ala Glu Leu Ile Arg His Pro His Met Leu Ala Arg Val Gln Lys315 320 325 330GAG CTT GAC GAT TTT GTT GGC CAT GAC CGA CTT GTG ACC GAA TCC GAC 1059Glu Leu Asp Asp Phe Val Gly His Asp Arg Leu Val Thr Glu Ser Asp

335 340 345ATA CCC AAC CTC CCT TAC CTC CAA GCC GTG ATC AAG GAA ACG TTC CGA 1107Ile Pro Asn Leu Pro Tyr Leu Gln Ala Val Ile Lys Glu Thr Phe Arg

350 355 360CTC CAC CCA TCC ACT CCT CTC TCG TTG CCT CGT ATG GCA GCC GAG AGT 1155Leu His Pro Sar Thr Pro Leu Ser Leu Pro Arg Met Ala Ala Glu Ser

365 370 375TGC GAA ATC AAC GGG TAC CAC ATC CCG AAA GGC TCC ACA CTC TTG GTC 1203Cys Glu Ile Asn Gly Tyr His Ile Pro Lys Gly Ser Thr Leu Leu Val

380 385 390AAT GTA TGG GCC ATA TCG CGT GAC CCG GCT GAA TGG GCC GAC CCA CTG 1251Asn Val Trp Ala Ile Ser Arg Asp Pro Ala Glu Trp Ala Asp Pro Leu395 400 405 410GAG TTC AAG CCC GAG AGG TTC CTG CCG GGG GGC GAA AAG CCT AAT GTT 1299Glu Phe Lys Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Asn Val

415 420 425GAT ATT AGA GGA AAC GAT TTT GAA GTC ATA CCC TTC GGT GCC GGG CGA 1347Asp Ile Arg Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg

430 435 440AGA ATA TGT GCC GGG ATG AGC TTG GGC CTG CGT ATG GTC CAT TTA ATG 1395Arg Ile Cys Ala Gly Met Ser Leu Gly Leu Arg Met Val His Leu Met

445 450 455ACT GCA ACA TTG GTC CAC GCA TTT AAT TGG GCC TTG GCT GAT GGG CTG 1443Thr Ala Thr Leu Val His Ala Phe Asn Trp Ala Leu Ala Asp Gly Leu

460 465 470ACC GCT GAG AAG TTA AAC ATG GAT GAA GCA TAT GGG CTC ACT CTA CAA 1491Thr Ala Glu Lys Leu Asn Met Asp Glu Ala Tyr Gly Leu Thr Leu Gln475 480 485 490CGA GCT GCA CCG TTA ATG GTG CAC CCG CGC ACC AGG CTG GCC CCA CAG 1539Arg Ala Ala Pro Leu Met Val His Pro Arg Thr Arg Leu Ala Pro Gln

495 500 505GCA TAT AAA ACT TCA TCA TCT TAATTAGAGA GCTATGTTCT GGGTGTGCCC 1590Ala Tyr Lys Thr Ser Ser Ser

510GGTTTGATGT CTCCATGTTT TCTATTTAGG TTTAAATCTG TAAGATAAGG TGATTCTATG 1650CTGAATCACA AAAGTTGCTA TCTAAATTCC ATGTCCAATG AAAACGTTCT TCTTCCCTTC 1710TTATAATTTA TGAATACTTA TGATATAGGC GACAGCAA 1748(2)关于SEQ ID NO:15的信息

(ⅰ)序列特征

(A)长度：513个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:15Met Phe Leu Ile Val Val Ile Thr Phe Leu Phe Ala Val Phe Leu Phe1 5 10 15Arg Leu Leu Phe Ser Gly Lys Ser Gln Arg His Ser Leu Pro Leu Pro

20 25 30Pro Gly Pro Lys Pro Trp Pro Val Val Gly Asn Leu Pro His Leu Gly

35 40 45Pro Phe Pro His His Ser Ile Ala Glu Leu Ala Lys Lys His Gly Pro

50 55 60Leu Met His Leu Arg Leu Gly Tyr Val Asp Val Val Val Ala Ala Ser65 70 75 80Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe Ser

85 90 95Ser Arg Pro Pro Asn Ser Gly Ala Lys His Leu Ala Tyr Asn Tyr Gln

100 105 110Asp Leu Val Phe Arg Pro Tyr Gly Pro Arg Trp Arg Met Phe Arg Lys

115 120 125Ile Ser Ser Val His Leu Phe Ser Gly Lys Ala Leu Asp Asp Leu Lys

130 135 140His Val Arg Gln Glu Glu Val Ser Val Leu Ala His Ala Leu Ala Asn145 150 155 160Ser Gly Ser Lys Val Val Asn Leu Ala Gln Leu Leu Asn Leu Cys Thr

165 170 175Val Asn Ala Leu Gly Arg Val Met Val Gly Arg Arg Val Phe Gly Asp

180 185 190Gly Ser Gly Gly Asp Asp Pro Lys Ala Asp Glu Phe Lys Ser Met Val

195 200 205Val Glu Met Met Val Leu Ala Gly Val Phe Asn Ile Gly Asp Phe Ile

210 215 220Pro Ser Leu Glu Trp Leu Asp Leu Gln Gly Val Ala Ser Lys Met Lys225 230 235 240Lys Leu His Lys Arg Phe Asp Asp Phe Leu Thr Ala Ile Val Glu Asp

245 250 255His Lys Lys Gly Ser Gly Thr Ala Gly His Val Asp Met Leu Thr Thr

260 265 270Leu Leu Ser Leu Lys Glu Asp Ala Asp Gly Glu Gly Gly Lys Leu Thr

275 280 285Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Met Phe Thr Ala Gly Thr

290 295 300Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg305 310 315 320His Pro His Met Leu Ala Arg Val Gln Lys Glu Leu Asp Asp Phe Val

325 330 335Gly His Asp Arg Leu Val Thr Glu Ser Asp Ile Pro Asn Leu Pro Tyr

340 345 350Leu Gln Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro

355 360 365Leu Ser Leu Pro Arg Met Ala Ala Glu Ser Cys Glu Ile Asn Gly Tyr

370 375 380His Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ser385 390 395 400Arg Asp Pro Ala Glu Trp Ala Asp Pro Leu Glu Phe Lys Pro Glu Arg

405 410 415Phe Leu Pro Gly Gly Glu Lys Pro Asn Val Asp Ile Arg Gly Asn Asp

420 425 430Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met

435 440 445Ser Leu Gly Leu Arg Met Val His Leu Met Thr Ala Thr Leu Val His

450 455 460Ala Phe Asn Trp Ala Leu Ala Asp Gly Leu Thr Ala Glu Lys Leu Asn465 470 475 480Met Asp Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Met

485 490 495Val His Pro Arg Thr Arg Leu Ala Pro Gln Ala Tyr Lys Thr Ser Ser

500 505 510Ser(2)关于SEQ ID NO:16的信息

(ⅰ)序列特征

(A)长度：1660个氨基酸

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：4..1528

(ⅹⅰ)序列描述：SEQ ID NO:16AAA ATG ACC ATT TTA GCT TTC GTA TTT TAC GCC CTC ATC CTC GGG TCA 48

Met Thr Ile Leu Ala Phe Val Phe Tyr Ala Leu Ile Leu Gly Ser

1 5 10 15GTA CTC TAT GTA TTT CTT AAC TTA AGT TCA CGT AAA TCC GCC AGA CTC 96Val Leu Tyr Val Phe Leu Asn Leu Ser Ser Arg Lys Ser Ala Arg Leu

20 25 30CCA CCC GGG CCA ACA CCA TGG CCT ATA GTC GGG AAC TTA CCA CAC CTT 144Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu

35 40 45GGC CCA ATC CCA CAC CAC GCA CTC GCG GCC TTA GCC AAG AAG TAC GGG 192Gly Pro Ile Pro His His Ala Leu Ala Ala Leu Ala Lys Lys Tyr Gly

50 55 60CCA TTG ATG CAC CTG CGG CTC GGG TGT GTG GAC GTG GTT GTG GCC GCG 240Pro Leu Met His Leu Arg Leu Gly Cys Val Asp Val Val Val Ala Ala

65 70 75TCT GCT TCC GTA GCT GCA CAG TTT TTA AAA GTT CAC GAC GCA AAT TTT 288Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Val His Asp Ala Asn Phe80 85 90 95GCT AGT AGG CCG CCA AAT TCT GGC GCG AAA CAT GTG GCG TAT AAT TAT 336Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Val Ala Tyr Asn Tyr

100 105 110CAG GAT CTT GTG TTT GCA CCT TAT GGT CCA AGG TGG CGT TTG TTA AGG 384Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Leu Leu Arg

115 120 125AAG ATT TGT TCG GTC CAT TTG TTT TCT GCT AAA GCA CTT GAT GAT TTT 432Lys Ile Cys Ser Val His Leu Phe Ser Ala Lys Ala Leu Asp Asp Phe

130 135 140CGT CAT GTT CGA CAG GAG GAG GTA GCA GTC CTA ACC CGC GTA CTA CTG 480Arg His Val Arg Gln Glu Glu Val Ala Val Leu Thr Arg Val Leu Leu

145 150 155AGT GCT GGA AAC TCA CCG GTA CAG CTT GGC CAA CTA CTT AAC GTG TGT 528Ser Ala Gly Asn Ser Pro Val Gln Leu Gly Gln Leu Leu Asn Val Cys160 165 170 175GCC ACA AAC GCC TTA GCA CGG GTA ATG TTA GGT AGG AGA GTT TTC GGA 576Ala Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Arg Val Phe Gly

180 185 190GAC GGA ATT GAC AGG TCA GCC AAT GAG TTC AAA GAT ATG GTA GTA GAG 624Asp Gly Ile Asp Arg Ser Ala Asn Glu Phe Lys Asp Met Val Val Glu

195 200 205TTA ATG GTA TTA GCA GGA GAA TTT AAC CTT GGT GAC TTT ATT CCT GTA 672Leu Met Val Leu Ala Gly Glu Phe Asn Leu Gly Asp Phe Ile Pro Val

210 215 220CTT GAC CTA TTC GAC CTA CAA GGC ATT ACT AAA AAA ATG AAG AAG CTT 720Leu Asp Leu Phe Asp Leu Gln Gly Ile Thr Lys Lys Met Lys Lys Leu

225 230 235CAT GTT CGG TTC GAT TCA TTT CTT AGT AAG ATC GTT GAG GAG CAT AAA 768His Val Arg Phe Asp Ser Phe Leu Ser Lys Ile Val Glu Glu His Lys240 245 250 255ACG GCA CCT GGT GGG TTG GGT CAT ACT GAT TTG CTG AGC ACG TTG ATT 816Thr Ala Pro Gly Gly Leu Gly His Thr Asp Leu Leu Ser Thr Leu Ile

260 265 270TCA CTT AAA GAT GAT GCT GAT ATT GAA GGT GGG AAG CTT ACA GAT ACT 864Ser Leu Lys Asp Asp Ala Asp Ile Glu Gly Gly Lys Leu Thr Asp Thr

275 280 285GAA ATC AAA GCT TTG CTT CTG AAT TTA TTC GCT GCG GGA ACA GAC ACA 912Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Ala Ala Gly Thr Asp Thr

290 295 300TCC TCT AGT ACA GTA GAA TGG GCA ATA GCC GAA CTC ATT CGT CAT CCA 960Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg His Pro

305 310 315CAA ATA TTA AAA CAA GCC CGA GAA GAG ATA GAC GCT GTA GTT GGT CAA 1008Gln Ile Leu Lys Gln Ala Arg Glu Glu Ile Asp Ala Val Val Gly Gln320 325 330 335GAC CGG CTT GTA ACA GAA TTG GAC TTG AGC CAA CTA ACA TAC CTC CAG 1056Asp Arg Leu Val Thr Glu Leu Asp Leu Ser Gln Leu Thr Tyr Leu Gln

340 345 350GCT CTT GTG AAA GAG GTG TTT AGG CTC CAC CCT TCA ACG CCA CTC TCC 1104Ala Leu Val Lys Glu Val Phe Arg Leu His Pro Ser Thr Pro Leu Ser

355 360 365TTA CCA AGA ATA TCA TCC GAG AGT TGT GAG GTC GAT GGG TAT TAT ATC 1152Leu Pro Arg Ile Ser Ser Glu Ser Cys Glu Val Asp Gly Tyr Tyr Ile

370 375 380CCT AAG GGA TCC ACA CTC CTC GTT AAC GTG TGG GCC ATT GCG CGA GAC 1200Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp

385 390 395CCA AAA ATG TGG GCG GAT CCT CTT GAA TTT AGG CCT TCT CGG TTT TTA 1248Pro Lys Met Trp Ala Asp Pro Leu Glu Phe Arg Pro Ser Arg Phe Leu400 405 410 415CCC GGG GGA GAA AAG CCC GGT GCT GAT GTT AGG GGA AAT GAT TTT GAA 1296Pro Gly Gly Glu Lys Pro Gly Ala Asp Val Arg Gly Asn Asp Phe Glu

420 425 430GTT ATA CCA TTT GGG GCA GGA CGA AGG ATT TGT GCG GGT ATG AGC CTA 1344Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu

435 440 445GGC TTG AGA ATG GTC CAG TTG CTC ATT GCA ACA TTG GTC CAA ACT TTT 1392Gly Leu Arg Met Val Gln Leu Leu Ile Ala Thr Leu Val Gln Thr Phe

450 455 460GAT TGG GAA CTG GCT AAC GGG TTA GAG CCG GAG ATG CTC AAC ATG GAA 1440Asp Trp Glu Leu Ala Asn Gly Leu Glu Pro Glu Met Leu Asn Met Glu

465 470 475GAA GCG TAT GGA TTG ACC CTT CAA CGG GCT GCA CCC TTG ATG GTT CAC 1488Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Met Val His480 485 490 495CCG AAG CCG AGG TTA GCT CCC CAC GTA TAT GAA AGT ATT T AAGGACTAGT 1538Pro Lys Pro Arg Leu Ala Pro His Val Tyr Glu Ser Ile

500 505TTCTCTTTTG CCTTTTTGTT TCGCAAAGGT TAATGAATAA ACGATTTCAT GACTCAGATA 1598GTTATGTAAA CAATTGTGTT TGCTGTTTAT ATATTTATCT ATTTTTCTAG AACAAAAAAA 1658AA 1660(2)关于SEQ ID NO:17的信息

(ⅰ)序列特征

(A)长度：508个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:17Met Thr Ile Leu Ala Phe Val Phe Tyr Ala Leu Ile Leu Gly Ser Val1 5 10 15Leu Tyr Val Phe Leu Asn Leu Ser Ser Arg Lys Ser Ala Arg Leu Pro

20 25 30Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu Gly

35 40 45Pro Ile Pro His His Ala Leu Ala Ala Leu Ala Lys Lys Tyr Gly Pro

50 55 60Leu Met His Leu Arg Leu Gly Cys Val Asp Val Val Val Ala Ala Ser65 70 75 80Ala Ser Val Ala Ala Gln Phe Leu Lys Val His Asp Ala Asn Phe Ala

85 90 95Ser Arg Pro Pro Asn Ser Gly Ala Lys His Val Ala Tyr Asn Tyr Gln

100 105 110Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Leu Leu Arg Lys

115 120 125Ile Cys Ser Val His Leu Phe Ser Ala Lys Ala Leu Asp Asp Phe Arg

130 135 140His Val Arg Gln Glu Glu Val Ala Val Leu Thr Arg Val Leu Leu Ser145 150 155 160Ala Gly Asn Ser Pro Val Gln Leu Gly Gln Leu Leu Asn Val Cys Ala

165 170 175Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Arg Val Phe Gly Asp

180 185 190Gly Ile Asp Arg Ser Ala Asn Glu Phe Lys Asp Met Val Val Glu Leu

195 200 205Met Val Leu Ala Gly Glu Phe Asn Leu Gly Asp Phe Ile Pro Val Leu

210 215 220Asp Leu Phe Asp Leu Gln Gly Ile Thr Lys Lys Met Lys Lys Leu His225 230 235 240Val Arg Phe Asp Ser Phe Leu Ser Lys Ile Val Glu Glu His Lys Thr

245 250 255Ala Pro Gly Gly Leu Gly His Thr Asp Leu Leu Ser Thr Leu Ile Ser

260 265 270Leu Lys Asp Asp Ala Asp Ile Glu Gly Gly Lys Leu Thr Asp Thr Glu

275 280 285Ile Lys Ala Leu Leu Leu Asn Leu Phe Ala Ala Gly Thr Asp Thr Ser

290 295 300Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg His Pro Gln305 310 315 320Ile Leu Lys Gln Ala Arg Glu Glu Ile Asp Ala Val Val Gly Gln Asp

325 330 335Arg Leu Val Thr Glu Leu Asp Leu Ser Gln Leu Thr Tyr Leu Gln Ala

340 345 350Leu Val Lys Glu Val Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu

355 360 365Pro Arg Ile Ser Ser Glu Ser Cys Glu Val Asp Gly Tyr Tyr Ile Pro

370 375 380Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp Pro385 390 395 400Lys Met Trp Ala Asp Pro Leu Glu Phe Arg Pro Ser Arg Phe Leu Pro

405 410 415Gly Gly Glu Lys Pro Gly Ala Asp Val Arg Gly Asn Asp Phe Glu Val

420 425 430Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu Gly

435 440 445Leu Arg Met Val Gln Leu Leu Ile Ala Thr Leu Val Gln Thr Phs Asp

450 455 460Trp Glu Leu Ala Asn Gly Leu Glu Pro Glu Met Leu Asn Met Glu Glu465 470 475 480Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Met Val His Pro

485 490 495Lys Pro Arg Leu Ala Pro His Val Tyr Glu Ser Ile

500 505(2)关于SEQ ID NO:18的信息

(ⅰ)序列特征

(A)长度：1815个氨基酸

(B)类型：核酸

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置107..1631

(ⅹⅰ)序列描述：SEQ ID NO:18CTAAATTAAT TAATAAATAC ACACACGACG AGATGTATGT AATGTAATGT AATATTATTA 60CATACATCAT CACCGAATAC GCACGCTACT ACCACTGCGA TTAGCC ATG AGT CCC 115

Met Ser Pro

1TTA GCC TTG ATG ATC ATA AGT ACC TTA TTA GGG TTT CTC CTA TAC CAC 163Leu Ala Leu Met Ile Ile Ser Thr Leu Leu Gly Phe Leu Leu Tyr His

5 10 15TCT CTT CGC TTA CTA CTC TTC TCC GGC CAA GGT CGC CGA CTA CTA CCA 211Ser Leu Arg Leu Leu Leu Phe Ser Gly Gln Gly Arg Arg Leu Leu Pro20 25 30 35CCA GGT CCA CGC CCG TGG CCG CTG GTG GGA AAT CTC CCG CAC TTA GGC 259Pro Gly Pro Arg Pro Trp Pro Leu Val Gly Asn Leu Pro His Leu Gly

40 45 50CCG AAG CCA CAC GCC TCC ATG GCC GAG CTC GCG CGA GCC TAC GGA CCC 307Pro Lys Pro His Ala Ser Met Ala Glu Leu Ala Arg Ala Tyr Gly Pro

55 60 65CTC ATG CAC CTA AAG ATG GGG TTC GTC CAC GTC GTG GTG GCT TCG TCG 355Leu Met His Leu Lys Met Gly Phe Val His Val Val Val Ala Ser Ser

70 75 80GCG AGC GCG GCG GAG CAG TGC CTG AGG GTT CAC GAC GCG AAT TTC TTG 403Ala Ser Ala Ala Glu Gln Cys Leu Arg Val His Asp Ala Asn Phe Leu

85 90 95AGC AGG CCA CCC AAC TCC GGC GCC AAG CAC GTC GCT TAC AAC TAC GAG 451Ser Arg Pro Pro Asn Ser Gly Ala Lys His Val Ala Tyr Asn Tyr Glu100 105 110 115GAC TTG GTT TTC AGA CCG TAC GGT CCC AAG TGG AGG CTG TTG AGG AAG 499Asp Leu Val Phe Arg Pro Tyr Gly Pro Lys Trp Arg Leu Leu Arg Lys

120 125 130ATA TGC GCT CAG CAT ATT TTC TCC GTC AAG GCT ATG GAT GAC TTC AGG 547Ile Cys Ala Gln His Ile Phe Ser Val Lys Ala Met Asp Asp Phe Arg

135 140 145CGC GTC AGA GAG GAA GAG GTG GCC ATC CTG AGT CGC GCT CTA GCA GGC 595Arg Val Arg Glu Glu Glu Val Ala Ile Leu Ser Arg Ala Leu Ala Gly

150 155 160AAA AGG GCC GTA CCC ATA GGC CAA ATG CTC AAC GTG TGC GCC ACA AAC 643Lys Arg Ala Val Pro Ile Gly Gln Met Leu Asn Val Cys Ala Thr Asn

165 170 175GCC CTA TCT CGC GTC ATG ATG GGG CGG CGC GTG GTG GGC CAC GCG GAT 691Ala Leu Ser Arg Val Met Met Gly Arg Arg Val Val Gly His Ala Asp180 185 190 195GGA ACC AAC GAC GCC AAG GCG GAG GAG TTC AAA GCC ATG GTC GTC GAG 739Gly Thr Asn Asp Ala Lys Ala Glu Glu Phe Lys Ala Met Val Val Glu

200 205 210CTC ATG GTC CTC TCC GGC GTC TTC AAC ATC GGT GAT TTC ATC CCC TTC 787Leu Met Val Leu Ser Gly Val Phe Asn Ile Gly Asp Phe Ile Pro Phe

215 220 225CTC GAG CCT CTC GAC TTG CAG GGA GTG GCT TCC AAG ATG AAG AAA CTC 835Leu Glu Pro Leu Asp Leu Gln Gly Val Ala Ser Lys Met Lys Lys Leu

230 235 240CAC GCG CGG TTC GAT GCA TTC TTG ACC GAG ATT GTA CGA GAG CGT TGT 883His Ala Arg Phe Asp Ala Phe Leu Thr Glu Ile Val Arg Glu Arg Cys

245 250 255CAT GGG CAG ATC AAC AAC AGT GGT GCT CAT CAG GAT GAT TTG CTT AGC 931His Gly Gln Ile Asn Asn Ser Gly Ala His Gln Asp Asp Leu Leu Ser260 265 270 275ACG TTG ATT TCG TTC AAA GGG CTT GAC GAT GGC GAT GGT TCC AGG CTC 979Thr Leu Ile Ser Phe Lys Gly Leu Asp Asp Gly Asp Gly Ser Arg Leu

280 285 290ACT GAC ACA GAA ATC AAG GCG CTG CTC TTG AAC CTT TTG GAC ACG ACG 1027Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Leu Asp Thr Thr

295 300 305TCG AGC ACG GTG GAA TGG GCC GTA GCC GAA CTC CTA CGC CAC CCT AAG 1075Ser Ser Thr Val Glu Trp Ala Val Ala Glu Leu Leu Arg His Pro Lys

310 315 320ACA TTA GCC CAA GTC CGG CAA GAG CTC GAC TCG GTC GTG GGT AAG AAC 1123Thr Leu Ala Gln Val Arg Gln Glu Leu Asp Ser Val Val Gly Lys Asn

325 330 335AGG CTC GTG TCC GAG ACC GAT CTG AAT CAG CTG CCC TAT CTA CAA GCT 1171Arg Leu Val Ser Glu Thr Asp Leu Asn Gln Leu Pro Tyr Leu Gln Ala340 345 350 355GTC GTC AAA GAA ACT TTC CGC CTC CAT CCT CCG ACG CCG CTC TCT CTA 1219Val Val Lys Glu Thr Phe Arg Leu His Pro Pro Thr Pro Leu Ser Leu

360 365 370CCG AGA CTC GCG GAA GAT GAT TGC GAG ATC GAC GGA TAC CTC ATC CCC 1267Pro Arg Leu Ala Glu Asp Asp Cys Glu Ile Asp Gly Tyr Leu Ile Pro

375 380 385AAG GGC TCG ACC CTT CTG GTG AAC GTT TGG GCC ATA GCC CGC GAT CCC 1315Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp Pro

390 395 400AAG GTT TGG GCC GAT CCG TTG GAG TTT AGG CCC GAA CGA TTC TTG ACG 1363Lys Val Trp Ala Asp Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Thr

405 410 415GGC GGA GAA AAG GCC GAC GTC GAT GTC AAG GGG AAC GAT TTC GAA GTG 1411Gly Gly Glu Lys Ala Asp Val Asp Val Lys Gly Asn Asp Phe Glu Val420 425 430 435ATA CCG TTC GGG GCG GGT CGT AGG ATC TGC GCT GGC GTT GGC TTG GGA 1459Ile Pro Phe Gly Ala Gly Arg Arg Ile Cya Ala Gly Val Gly Leu Gly

440 445 450ATA CGT ATG GTC CAA CTG TTG ACG GCG AGT TTG ATC CAT GCA TTC GAT 1507Ile Arg Met Val Gln Leu Leu Thr Ala Ser Leu Ile His Ala Phe Asp

455 460 465CTG GAC CTT GCT AAT GGG CTT TTG GCC CAA AAT CTG AAC ATG GAA GAA 1555Leu Asp Leu Ala Asn Gly Leu Leu Ala Gln Asn Leu Asn Met Glu Glu

470 475 480GCA TAT GGG CTT ACG CTA CAA CGG GCT GAG CCT TTG TTG GTC CAC CCT 1603Ala Tyr Gly Leu Thr Leu Gln Arg Ala Glu Pro Leu Leu Val His Pro

485 490 495AGG CCG CGG TTG GCC ACT CAT GTC TAT T AATTAAATTA GGCCTAAACT 1651Arg Pro Arg Leu Ala Thr His Val Tyr500 505ACGATGAATG ACCCATTTAA CGTTAATAAG AGTTTTCAAT TTATGTGAGT TTGCATGGTA 1711TGGTATGGTA TGGTGCTTGT AATAAATTGT ATCTGTTAGG TGTGTTCATT GATGATAAAT 1771CTAGTTTGTA CTGCTGCTCA AAAAAAAAAA AAAAAAAAAA AAAA 1815(2)关于SEQ ID NO:19的信息

(ⅰ)序列特征

(A)长度：508个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:19Met Ser Pro Leu Ala Leu Met Ile Ile Ser Thr Leu Leu Gly Phe Leu1 5 10 15Leu Tyr His Ser Leu Arg Leu Leu Leu Phe Ser Gly Gln Gly Arg Arg

20 25 30Leu Leu Pro Pro Gly Pro Arg Pro Trp Pro Leu Val Gly Asn Leu Pro

35 40 45His Leu Gly Pro Lys Pro His Ala Ser Met Ala Glu Leu Ala Arg Ala

50 55 60Tyr Gly Pro Leu Met His Leu Lys Met Gly Phe Val His Val Val Val65 70 75 80Ala Ser Ser Ala Ser Ala Ala Glu Gln Cys Leu Arg Val His Asp Ala

85 90 95Asn Phe Leu Ser Arg Pro Pro Asn Ser Gly Ala Lys His Val Ala Tyr

100 105 110Asn Tyr Glu Asp Leu Val Phe Arg Pro Tyr Gly Pro Lys Trp Arg Leu

115 120 125Leu Arg Lys Ile Cys Ala Gln His Ile Phe Ser Val Lys Ala Met Asp

130 135 140Asp Phe Arg Arg Val Arg Glu Glu Glu Val Ala Ile Leu Ser Arg Ala145 150 155 160Leu Ala Gly Lys Arg Ala Val Pro Ile Gly Gln Met Leu Asn Val Cys

165 170 175Ala Thr Asn Ala Leu Ser Arg Val Met Met Gly Arg Arg Val Val Gly

180 185 190His Ala Asp Gly Thr Asn Asp Ala Lya Ala Glu Glu Phe Lys Ala Met

195 200 205Val Val Glu Leu Met Val Leu Ser Gly Val Phe Asn Ile Gly Asp Phe

210 215 220Ile Pro Phe Leu Glu Pro Leu Asp Leu Gln Gly Val Ala Ser Lys Met225 230 235 240Lys Lys Leu His Ala Arg Phe Asp Ala Phe Leu Thr Glu Ile Val Arg

245 250 255Glu Arg Cys His Gly Gln Ile Asn Asn Ser Gly Ala His Gln Asp Asp

260 265 270Leu Leu Ser Thr Leu Ile Ser Phe Lys Gly Leu Asp Asp Gly Asp Gly

275 280 285Ser Arg Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Leu

290 295 300Asp Thr Thr Ser Ser Thr Val Glu Trp Ala Val Ala Glu Leu Leu Arg305 310 315 320His Pro Lys Thr Leu Ala Gln Val Arg Gln Glu Leu Asp Ser Val Val

325 330 335Gly Lys Asn Arg Leu Val Ser Glu Thr Asp Leu Asn Gln Leu Pro Tyr

340 345 350Leu Gln Ala Val Val Lya Glu Thr Phe Arg Leu His Pro Pro Thr Pro

355 360 365Leu Ser Leu Pro Arg Leu Ala Glu Asp Asp Cys Glu Ile Asp Gly Tyr

370 375 380Leu Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala385 390 395 400Arg Asp Pro Lys Val Trp Ala Asp Pro Leu Glu Phe Arg Prc Glu Arg

405 410 415Phe Leu Thr Gly Gly Glu Lys Ala Asp Val Asp Val Lys Gly Asn Asp

420 425 430Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Val

435 440 445Gly Leu Gly Ile Arg Met Val Gln Leu Leu Thr Ala Ser Leu Ile His

450 455 460Ala Phe Asp Leu Asp Leu Ala Asn Gly Leu Leu Ala Gln Asn Leu Asn465 470 475 480Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Glu Pro Leu Leu

485 490 495Val His Pro Arg Pro Arg Leu Ala Thr His Val Tyr

500 505(2)关于SEQ ID NO:20的信息

(ⅰ)序列特征

(A)长度：1824个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：2..1553

(ⅹⅰ)序列描述：SEQ ID NO:20G AGC TTA ACC TTA ATT TTC TGC ACT TTA GTT TTT GCA ATC TTT CTA 46Ser Leu Thr Leu Ile Phe Cys Thr Leu Val Phe Ala Ile Phe Leu

1 5 10 15TAT TTT CTT ATT CTC AGG GTG AAA CAG CGT TAC CCT TTA CCT CTC CCA 94Tyr Phe Leu Ile Leu Arg Val Lys Gln Arg Tyr Pro Leu Pro Leu Pro

20 25 30CCC GGA CCA AAA CCA TGG CCG GTG TTA GGA AAC CTT CCC CAC CTG GGC 142Pro Gly Pro Lys Pro Trp Pro Val Leu Gly Asn Leu Pro His Leu Gly

35 40 45AAG AAG CCT CAC CAG TCG ATT GCG GCC ATG GCT GAG AGG TAC GGC CCC 190Lys Lys Pro His Gln Ser Ile Ala Ala Met Ala Glu Arg Tyr Gly Pro

50 55 60CTC ATG CAC CTC CGC CTA GGA TTC GTG GAC GTG GTT GTG GCC GCC TCC 238Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala Ser

65 70 75GCC GCC GTG GCC GCT CAG TTC TTG AAA GTT CAC GAC TCG AAC TTC TCC 286Ala Ala Val Ala Ala Gln Phe Leu Lys Val His Asp Ser Asn Phe Sar80 85 90 95AAC CGG CCG CCG AAC TCC GGC GCG GAA CAC ATT GCT TAT AAC TAT CAA 334Asn Arg Pro Pro Asn Ser Gly Ala Glu His Ile Ala Tyr Asn Tyr Gln

100 105 110GAC CTC GTC TTC GCG CCC TAC GGC CCG CGG TGG CGC ATG CTT AGG AAG 382Asp Leu Val Phs Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys

115 120 125ATC ACC TCC GTG CAT CTC TTC TCG GCC AAG GCG TTG GAT GAC TTC TGC 430Ile Thr Ser Val His Leu Phe Ser Ala Lys Ala Leu Asp Asp Phe Cys

130 135 140CAT GTT CGC CAG GAA GAG GTT GCA ACT CTG ACA CGC AGT CTA GCA AGT 478His Val Arg Gln Glu Glu Val Ala Thr Leu Thr Arg Ser Leu Ala Ser

145 150 155GCA GGC AAA ACT CCA GTA AAA CTA GGG CAG TTA CTA AAC GTG TGC ACC 526Ala Gly Lys Thr Pro Val Lys Leu Gly Gln Leu Leu Asn Val Cys Thr160 165 170 175ACG AAC GCC CTA GCT CGT GTA ATG CTA GGG CGG AAG GTC TTT AAT GAC 574Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Lys Val Phe Asn Asp

180 185 190GGA GGT AGC AAG AGC GAC CCA AAG GCG GAG GAG TTC AAG TCG ATG GTG 622Gly Gly Ser Lys Ser Asp Pro Lys Ala Glu Glu Phe Lys Sar Met Val

195 200 205GAG GAG ATG ATG GTG TTG GCC GGA AGT TTT AAC ATC GGC GAT TTC ATT 670Glu Glu Met Met Val Leu Ala Gly Ser Phe Asn Ile Gly Asp Phe Ile

210 215 220CCG GTC TTG GGT TGG TTT GAC GTT CAG GGT ATC GTA GGG AAG ATG AAG 718Pro Val Leu Gly Trp Phe Asp Val Gln Gly Ile Val Gly Lys Met Lys

225 230 235AAA CTA CAC GCG CGT TTT GAT GCG TTC TTG AAC ACC ATT CTA GAG GAA 766Lys Leu His Ala Arg Phe Asp Ala Phe Leu Asn Thr Ile Leu Glu Glu240 245 250 255CAC AAA TGT GTC AAC AAT CAA CAC ACG ACG TTG TCG AAA GAT GTG GAC 814His Lys Cys Val Asn Asn Gln His Thr Thr Leu Ser Lys Asp Val Asp

260 265 270TTC TTG AGC ACC CTA ATT AGG CTC AAA GAT AAT GGG GCT GAT ATG GAT 862Phe Leu Ser Thr Leu Ile Arg Leu Lys Asp Asn Gly Ala Asp Met Asp

275 280 285TGT GAA GAG GGA AAA CTC ACC GAC ACT GAA ATT AAG GCT TTG CTC TTG 910Cys Glu Glu Gly Lys Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu

290 295 300AAC CTG TTC ACA GCT GGG ACT GAT ACA TCA TCT AGC ACT GTG GAG TGG 958Asn Leu Phe Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp

305 310 315GCA ATC GCA GAA CTA CTA CGC AAC CCA AAA ATC TTA AAC CAA GCA CAA 1006Ala Ile Ala Glu Leu Leu Arg Asn Pro Lys Ile Leu Asn Gln Ala Gln320 325 330 335CAA GAG CTT GAC TTA GTG GTG GGT CAA AAT CAG CTA GTC ACA GAA TCT 1054Gln Glu Leu Asp Leu Val Val Gly Gln Asn Gln Leu Val Thr Glu Ser

340 345 350GAC TTA ACC GAT CTA CCT TTC CTG CAA GCA ATA GTG AAG GAG ACC TTC 1102Asp Leu Thr Asp Leu Pro Phe Leu Gln Ala Ile Val Lys Glu Thr Phe

355 360 365AGG CTA CAC CCA TCC ACC CCA CTC TCT CTT CCA AGA ATG GGA GCT CAG 1150Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Met Gly Ala Gln

370 375 380GGT TGC GAG ATC AAT GGC TAC TTC ATC CCC AAA GGC GCA ACG CTT TTG 1198Gly Cys Glu Ile Asn Gly Tyr Phe Ile Pro Lys Gly Ala Thr Leu Leu

385 390 395GTC AAC GTT TGG GCC ATA GCT CGT GAT CCC AAT GTG TGG ACA AAT CCT 1246Val Asn Val Trp Ala Ile Ala Arg Asp Pro Asn Val Trp Thr Asn Pro400 405 410 415CTT GAG TTC AAC CCA CAC CGA TTC TTG CCT GGT GGA GAA AAG CCC AAC 1294Leu Glu Phe Asn Pro His Arg Phe Leu Pro Gly Gly Glu Lys Pro Asn

420 425 430GTG GAT ATT AAA GGG AAT GAC TTT GAA GTG ATT CCT TTT GGA GCC GGG 1342Val Asp Ile Lys Gly Asn Asp Phe Glu Val Ils Pro Phe Gly Ala Gly

435 440 445CGT AGA ATA TGC TCT GGG ATG AGT TTG GGG ATA AGG ATG GTT CAC CTG 1390Arg Arg Ile Cys Ser Gly Met Ser Leu Gly Ile Arg Met Val His Leu

450 455 460TTG GTT GCA ACT TTG GTG CAT GCT TTT GAT TGG GAT TTG GTG AAT GGA 1438Leu Val Ala Thr Leu Val His Ala Phe Asp Trp Asp Leu Val Asn Gly

465 470 475CAA TCT GTA GAG ACG CTC AAT ATG GAG GAA GCT TAT GGT CTC ACC CTT 1486Gln Ser Val Glu Thr Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu480 485 490 495CAA CGA GCT GTT CCT TTG ATG TTG CAT CCA AAG CCC AGA TTA CAA CCA 1534Gln Arg Ala Val Pro Leu Met Leu His Pro Lys Pro Arg Leu Gln Pro

500 505 510CAT CTC TAT ACT CTC AAT T AAATTGCAAT TTGATTTTGG TGATTATACA 1583His Leu Tyr Thr Leu Asn

515ATTATAATCG AGGGACATAG GATCCCCATT TATTTATATT CAGTTATAAG AGACTTCCAA 1643CAAAGGTCTA GCTTTCGACC TTAAAAGTTG TAAAAGAGGT CCTACATATG TAAAAGCCCG 1703CCAAAGGAAA ACTGGTTGTA TTCAATTCCG CTAGGCCTTG TCCGAAAGAC CTCATGAAGA 1763CTACAAAGGT CATATATAAT GGTAAACCCA GTGTATTTGT TGTAAAAAAA AAAAAAAAAA 1823A 1824(2)关于SEQ ID NO:21的信息

(ⅰ)序列特征

(A)长度：517个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:21Ser Leu Thr Leu Ile Phe Cys Thr Leu Val Phe Ala Ile Phe Leu Tyr1 5 10 15Phe Leu Ile Leu Arg Val Lys Gln Arg Tyr Pro Leu Pro Leu Pro Pro

20 25 30Gly Pro Lys Pro Trp Pro Val Leu Gly Asn Leu Pro His Leu Gly Lys

35 40 45Lys Pro His Gln Ser Ile Ala Ala Met Ala Glu Arg Tyr Gly Pro Leu

50 55 60Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala Ser Ala65 70 75 80Ala Val Ala Ala Gln Phe Leu Lys Val His Asp Ser Asn Phe Ser Asn

85 90 95Arg Pro Pro Asn Ser Gly Ala Glu His Ile Ala Tyr ASn Tyr Gln Asp

100 105 110Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys Ile

115 120 125Thr Ser Val His Leu Phe Ser Ala Lys Ala Leu Asp Asp Phe Cys His

130 135 140Val Arg Gln Glu Glu Val Ala Thr Leu Thr Arg Ser Leu Ala Ser Ala145 150 155 160Gly Lys Thr Pro Val Lys Leu Gly Gln Leu Leu Asn Val Cys Thr Thr

165 170 175Asn Ala Leu Ala Arg Val Met Leu Gly Arg Lys Val Phe Asn Asp Gly

180 185 190Gly Ser Lys Ser Asp Pro Lys Ala Glu Glu Phe Lys Ser Met Val Glu

195 200 205Glu Met Met Val Leu Ala Gly Ser Phe Asn Ile Gly Asp Phe Ile Pro

210 215 220Val Leu Gly Trp Phe Asp Val Gln Gly Ile Val Gly Lys Met Lys Lys225 230 235 240Leu His Ala Arg Phe Asp Ala Phe Leu Asn Thr Ile Leu Glu Glu His

245 250 255Lys Cys Val Asn Asn Gln His Thr Thr Leu Ser Lys Asp Val Asp Phe

260 265 270Leu Ser Thr Leu Ile Arg Leu Lys Asp Asn Gly Ala Asp Met Asp Cys

275 280 285Glu Glu Gly Lys Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn

290 295 300Leu Phe Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala305 310 315 320Ile Ala Glu Leu Leu Arg Asn Pro Lys Ile Leu Asn Gln Ala Gln Gln

325 330 335Glu Leu Asp Leu Val Val Gly Gln Asn Gln Leu Val Thr Glu Ser Asp

340 345 350Leu Thr Asp Leu Pro Phe Leu Gln Ala Ile Val Lys Glu Thr Phe Arg

355 360 365Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Met Gly Ala Gln Gly

370 375 380Cys Glu Ile Asn Gly Tyr Phe Ile Pro Lys Gly Ala Thr Leu Leu Val385 390 395 400Asn Val Trp Ala Ile Ala Arg Asp Pro Asn Val Trp Thr Asn Pro Leu

405 410 415Glu Phe Asn Pro His Arg Phe Leu Pro Gly Gly Glu Lys Pro Asn Val

420 425 430Asp Ile Lys Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg

435 440 445Arg Ile Cys Ser Gly Met Ser Leu Gly Ile Arg Met Val His Leu Leu

450 455 460Val Ala Thr Leu Val His Ala Phe Asp Trp Asp Leu Val Asn Gly Gln465 470 475 480Ser Val Glu Thr Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln

485 490 495Arg Ala Val Pro Leu Met Leu His Pro Lys Pro Arg Leu Gln Pro His

500 505 510Leu Tyr Thr Leu Asn

515(2)关于SEQ ID NO:22的信息

(ⅰ)序列特征

(A)长度：1667个氨基酸

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：1..1429

(ⅹⅰ)序列描述：SEQ ID NO:22CCC ATC CTC GGA AAC ATC CCC CAT CTC GGC TCC AAA CCG CAC CAA ACA 48Pro Ile Leu Gly Asn Ile Pro His Leu Gly Ser Lys Pro His Gln Thr1 5 10 15CTC GCG GAA ATG GCG AAA ACC TAC GGT CCG CTC ATG CAC TTG AAG TTC 96Leu Ala Glu Met Ala Lys Thr Tyr Gly Pro Leu Met His Leu Lys Phe

20 25 30GGG CTT AAG GAC GCG GTG GTG GCG TCG TCT GCG TCG GTG GCA GAG CAG 144Gly Leu Lys Asp Ala Val Val Ala Ser Ser Ala Ser Val Ala Glu Gln

35 40 45TTT CTG AAG AAA CAC GAC GTG AAT TTC TCG AAC CGG CCG CCA AAC TCC 192Phe Leu Lys Lys His Asp Val Asn Phe Ser Asn Arg Pro Pro Asn Ser

50 55 60GGG GCC AAA CAT ATA GCT TAT AAC TAT CAG GAC CTG GTA TTC GCT CCC 240Gly Ala Lys His Ile Ala Tyr Asn Tyr Gln Asp Leu Val Phe Ala Pro65 70 75 80TAT GGA CCC CGG TGG CGG TTG CTT AGG AAA ATC TGT TCC GTC CAT CTT 288Tyr Gly Pro Arg Trp Arg Leu Leu Arg Lys Ile Cys Ser Val His Leu

85 90 95TTC TCG TCT AAG GCC TTG GAT GAC TTT CAG CAT GTT CGA CAT GAG GAG 336Phe Ser Ser Lys Ala Leu Asp Asp Phe Gln His Val Arg His Glu Glu

100 105 110ATA TGC ATC CTT ATA CGA GCA ATA GCG AGT GGC GGT CAT GCT CCG GTG 384Ile Cys Ile Leu Ile Arg Ala Ile Ala Ser Gly Gly His Ala Pro Val

115 120 125AAT TTA GGC AAG TTA TTA GGA GTG TGC ACA ACC AAT GCC CTG GCA AGA 432Asn Leu Gly Lys Leu Leu Gly Val Cys Thr Thr Asn Ala Leu Ala Arg

130 135 140GTG ATG CTT GGA AGA AGA GTA TTC GAA GGC GAC GGC GGC GAG AAT CCG 480Val Met Leu Gly Arg Arg Val Phe Glu Gly Asp Gly Gly Glu Asn Pro145 150 155 160CAT GCC GAC GAG TTT AAA TCA ATG GTG GTG GAG ATT ATG GTG TTA GCC 528His Ala Asp Glu Phe Lys Ser Met Val Val Glu Ile Met Val Leu Ala

165 170 175GGT GCA TTC AAC TTG GGT GAT TTC ATC CCG GTT CTA GAT TGG TTC GAT 576Gly Ala Phe Asn Leu Gly Asp Phe Ile Pro Val Leu Asp Trp Phe Asp

180 185 190TTG CAA GGA ATT GCT GGT AAA ATG AAG AAA CTT CAT GCC CGT TTC GAC 624Leu Gln Gly Ile Ala Gly Lys Met Lys Lys Leu His Ala Arg Phe Asp

195 200 205AAG TTT TTA AAT GGG ATC CTA GAA GAT CGT AAA TCT AAC GGC TCT AAT 672Lys Phe Leu Asn Gly Ile Leu Glu Asp Arg Lys Ser Asn Gly Ser Asn

210 215 220GGA GCT GAA CAA TAC GTG GAC TTG CTC AGT GTG TTG ATC TCT CTT CAA 720Gly Ala Glu Gln Tyr Val Asp Leu Leu Ser Val Leu Ile Ser Leu Gln225 230 235 240GAT AGT AAT ATC GAC GGT GGT GAC GAA GGA ACC AAA CTC ACA GAT ACT 768Asp Ser Asn Ile Asp Gly Gly Asp Glu Gly Thr Lys Leu Thr Asp Thr

245 250 255GAA ATC AAA GCT CTC CTT TTG AAC TTG TTC ATA GCC GGA ACA GAC ACT 816Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Ile Ala Gly Thr Asp Thr

260 265 270TCA TCA AGT ACT GTA GAA TGG GCC ATG GCA GAA CTA ATC CGA AAC CCA 864Ser Ser Ser Thr Val Glu Trp Ala Met Ala Glu Leu Ile Arg Asn Pro

275 280 285AAG TTA CTA GTC CAA GCC CAA GAA GAG CTA GAC AGA GTA GTC GGG CCG 912Lys Leu Leu Val Gln Ala Gln Glu Glu Leu Asp Arg Val Val Gly Pro

290 295 300AAC CGA TTC GTA ACC GAA TCT GAT CTT CCT CAA CTG ACA TTC CTT CAA 960Asn Arg Phe Val Thr Glu Ser Asp Leu Pro Gln Leu Thr Phe Leu Gln305 310 315 320GCC GTC ATC AAA GAG ACT TTC AGG CTT CAT CCA TCC ACC CCA CTC TCT 1008Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro Leu Ser

325 330 335CTT CCA CGA ATG GCG GCG GAG GAC TGT GAG ATC AAT GGG TAT TAT GTC 1056Leu Pro Arg Met Ala Ala Glu Asp Cys Glu Ile Asn Gly Tyr Tyr Val

340 345 350TCA GAA GGT TCG ACA TTG CTC GTC AAT GTG TGG GCC ATA GCT CGT GAT 1104Ser Glu Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp

355 360 365CCA AAT GCG TGG GCC AAT CCA CTA GAT TTC AAC CCG ACT CGT TTC TTG 1152Pro Asn Ala Trp Ala Asn Pro Leu Asp Phe Asn Pro Thr Arg Phe Leu

370 375 380GCC GGT GGA GAG AAG CCT AAT GTT GAT GTT AAA GGG AAT GAT TTT GAA 1200Ala Gly Gly Glu Lys Pro Asn Val Asp Val Lys Gly Asn Asp Phe Glu385 390 395 400GTG ATA CCT TTC GGT GCT GGG CGC AGG ATA TGT GCC GGA ATG AGC TTA 1248Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu

405 410 415GGT ATA CGG ATG GTT CAA CTA GTA ACG GCT TCG TTA GTT CAT TCG TTT 1296Gly Ile Arg Met Val Gln Leu Val Thr Ala Ser Leu Val His Ser Phe

420 425 430GAT TGG GCT TTG TTG GAT GGA CTT AAA CCC GAG AAG CTT GAC ATG GAG 1344Asp Trp Ala Leu Leu Asp Gly Leu Lys Pro Glu Lys Leu Asp Met Glu

435 440 445GAA GGT TAT GGA CTA ACG CTT CAA CGA GCT TCA CCT TTA ATC GTC CAT 1392Glu Gly Tyr Gly Leu Thr Leu Gln Arg Ala Ser Pro Leu Ile Val His

450 455 460CCA AAG CCG AGG CTC TCG GCT CAA GTT TAT TGT ATG T AACAAGTTTG 1439Pro Lys Pro Arg Leu Ser Ala Gln Val Tyr Cys Met465 470 475TGAAGCCAGT CTGATTTCAG TTGGATTTGT AGTTATTTTA TGATCATTTG GTATTTTATT 1499TTGTATTTCG GTTGAATACA ATAAAGGGAA GGTGGATCGT CTGCTGTATA ATAGCGACGT 1559TTTAACGTGT TGTGATAGTA CCGTGTTTTA CTAAAACGAT GTCGTTTGAT TTTTTATAGT 1619ATTAAAAAAA TAAACAGCTG GATTTTGAAC CAAAAAAAAA AAAAAAAA 1667(2)关于SEQ ID NO:23的信息

(ⅰ)序列特征

(A)长度：476个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:23Pro Ile Leu Gly Asn Ile Pro His Leu Gly Ser Lys Pro His Gln Thr1 5 10 15Leu Ala Glu Met Ala Lys Thr Tyr Gly Pro Leu Met His Leu Lys Phe

20 25 30Gly Leu Lys Asp Ala Val Val Ala Ser Ser Ala Ser Val Ala Glu Gln

35 40 45Phe Leu Lys Lys His Asp Val Asn Phe Ser Asn Arg Pro Pro Asn Ser

50 55 60Gly Ala Lys His Ile Ala Tyr Asn Tyr Gln Asp Leu Val Phe Ala Pro65 70 75 80Tyr Gly Pro Arg Trp Arg Leu Leu Arg Lys Ile Cys Ser Val His Leu

85 90 95Phe Ser Ser Lys Ala Leu Asp Asp Phe Gln His Val Arg His Glu Glu

100 105 110Ile Cys Ile Leu Ile Arg Ala Ile Ala Ser Gly Gly His Ala Pro Val

115 120 125Asn Leu Gly Lys Leu Leu Gly Val Cys Thr Thr Asn Ala Leu Ala Arg

130 135 140Val Met Leu Gly Arg Arg Val Phe Glu Gly Asp Gly Gly Glu Asn Pro145 150 155 160His Ala Asp Glu Phe Lys Ser Met Val Val Glu Ile Met Val Leu Ala

165 170 175Gly Ala Phe Asn Leu Gly Asp Phe Ile Pro Val Leu Asp Trp Phe Asp

180 185 190Leu Gln Gly Ile Ala Gly Lys Met Lys Lys Leu His Ala Arg Phe Asp

195 200 205Lys Phe Leu Asn Gly Ile Leu Glu Asp Arg Lys Ser Asn Gly Ser Asn

210 215 220Gly Ala Glu Gln Tyr Val Asp Leu Leu Ser Val Leu Ile Ser Leu Gln225 230 235 240Asp Ser Asn Ile Asp Gly Gly Asp Glu Gly Thr Lys Leu Thr Asp Thr

245 250 255Glu lle Lys Ala Leu Leu Leu Asn Leu Phe Ile Ala Gly Thr Asp Thr

260 265 270Ser Ser Ser Thr Val Glu Trp Ala Met Ala Glu Leu Ile Arg Asn Pro

275 280 285Lys Leu Leu Val Gln Ala Gln Glu Glu Leu Asp Arg Val Val Gly Pro

290 295 300Asn Arg Phe Val Thr Glu Ser Asp Leu Pro Gln Leu Thr Phe Leu Gln305 310 315 320Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro Leu Ser

325 330 335Leu Pro Arg Met Ala Ala Glu Asp Cys Glu Ile Asn Gly Tyr Tyr Val

340 345 350Ser Glu Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp

355 360 365Pro Asn Ala Trp Ala Asn Pro Leu Asp Phe Asn Pro Thr Arg Phe Leu

370 375 380Ala Gly Gly Glu Lys Pro Asn Val Asp Val Lys Gly Asn Asp Phe Glu385 390 395 400Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu

405 410 415Gly Ile Arg Met Val Gln Leu Val Thr Ala Ser Leu Val His Ser Phe

420 425 430Asp Trp Ala Leu Leu Asp Gly Leu Lys Pro Glu Lys Leu Asp Met Glu

435 440 445Glu Gly Tyr Gly Leu Thr Leu Gln Arg Ala Ser Pro Leu Ile Val His

450 455 460Pro Lys Pro Arg Leu Ser Ala Gln Val Tyr Cys Met465 470 475(2)关于SEQ ID NO:24的信息

(ⅰ)序列特征

(A)长度：1214个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：2..1091

(ⅹⅰ)序列描述：SEQ ID NO:24T CGC ATC CTC ACG CGA TCT ATA GCG AGT GCT GGG GAA AAT CCG ATT 46Arg Ile Leu Thr Arg Ser Ile Ala Ser Ala Gly Glu Asn Pro Ile

1 5 10 15AAC TTA GGT CAA TTA CTC GGG GTG TGT ACC ACA AAT GCT CTG GCG AGA 94Asn Leu Gly Gln Leu Leu Gly Val Cys Thr Thr Asn Ala Leu Ala Arg

20 25 30GTG ATG CTT GGA AGG AGG GTA TTC GGC GAT GGG AGC GGC GGC GTA GAT 142Val Met Leu Gly Arg Arg Val Phe Gly Asp Gly Ser Gly Gly Val Asp

35 40 45CCT CAG GCG GAC GAG TTC AAA TCC ATG GTG GTG GAA ATC ATG GTG TTG 190Pro Gln Ala Asp Glu Phe Lys Ser Met Val Val Glu Ile Met Val Leu

50 55 60GCC GGC GCG TTT AAT CTA GGT GAT TTT ATT CCC GCT CTT GAT TGG TTC 238Ala Gly Ala Phe Asn Leu Gly Asp Phe Ile Pro Ala Leu Asp Trp Phe

65 70 75GAT CTG CAG GGA ATT ACG GCA AAA ATG AAG AAA GTT CAC GCT CGT TTC 286Asp Leu Gln Gly Ile Thr Ala Lys Met Lys Lys Val His Ala Arg Phe80 85 90 95GAT GCG TTC TTA GAC GCG ATC CTT GAG GAG CAC AAA TCC AAC GGC TCT 334Asp Ala Phe Leu Asp Ala Ile Leu Glu Glu His Lys Ser Asn Gly Ser

100 105 110CGC GGA GCT AAG CAA CAC GTT GAC TTG CTG AGT ATG TTG ATC TCC CTT 382Arg Gly Ala Lys Gln His Val Asp Leu Leu Ser Met Leu Ile Ser Leu

115 120 125CAA GAT AAT AAC ATT GAT GGT GAA AGT GGC GCC AAA CTC ACT GAT ACA 430Gln Asp Asn Asn Ile Asp Gly Glu Ser Gly Ala Lys Leu Thr Asp Thr

130 135 140GAA ATC AAA GCT TTG CTT CTG AAC TTG TTC ACG GCT GGA ACA GAC ACG 478Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Thr Ala Gly Thr Asp Thr

145 150 155TCA TCA AGT ACT GTG GAG TGG GCA ATC GCA GAG CTA ATC CGA AAC CCA 526Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg Asn Pro160 165 170 175GAA GTA TTG GTT CAA GCC CAA CAA GAG CTC GAT AGA GTA GTT GGG CCA 574Glu Val Leu Val Gln Ala Gln Gln Glu Leu Asp Arg Val Val Gly Pro

180 185 190AGT CGT CTT GTG ACC GAA TCT GAT CTG CCT CAA TTG GCA TTC CTT CAA 622Ser Arg Leu Val Thr Glu Ser Asp Leu Pro Gln Leu Ala Phe Leu Gln

195 200 205GCT GTC ATC AAA GAG ACT TTC AGA CTT CAT CCA TCC ACT CCA CTC TCT 670Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro Leu Ser

210 215 220CTT CCA CGA ATG GCT TCA GAG GGT TGT GAA ATC AAT GGA TAC TCC ATC 718Leu Pro Arg Met Ala Ser Glu Gly Cys Glu Ile Asn Gly Tyr Ser Ile

225 230 235CCA AAG GGT TCG ACA TTG CTC GTT AAC GTA TGG TCC ATA GCC CGT GAT 766Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ser Ile Ala Arg Asp240 245 250 255CCT AGT ATA TGG GCC GAC CCA TTA GAA TTT AGG CCG GCA CGT TTC TTG 814Pro Ser Ile Trp Ala Asp Pro Leu Glu Phe Arg Pro Ala Arg Phe Leu

260 265 270CCC GGC GGA GAA AAG CCC AAT GTT GAT GTG AGA GGC AAT GAT TTT GAG 862Pro Gly Gly Glu Lys Pro Asn Val Asp Val Arg Gly Asn Asp Phe Glu

275 280 285GTC ATA CCA TTT GGT GCT GGA CGT AGG ATA TGT GCT GGA ATG AGC TTG 910Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu

290 295 300GGT TTA AGA ATG GTT CAA CTT TCG ACA GCT ACT TTG GTT CAT TCG TTT 958Gly Leu Arg Met Val Gln Leu Ser Thr Ala Thr Leu Val His Ser Phe

305 310 315AAT TGG GAT TTG CTG AAT GGG ATG AGC CCA GAT AAA CTT GAC ATG GAA 1006Asn Trp Asp Leu Leu Asn Gly Met Ser Pro Asp Lys Leu Asp Met Glu320 325 330 335GAA GCT TAT GGG CTT ACA TTG CAA CGG GCT TCA CCT TTG ATT GTC CAC 1054Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ser Pro Leu Ile Val His

340 345 350CCA AAG CCC AGG CTT GCT AGC TCT ATG TAT GTT AAA T GAAATTATGC 1101Pro Lys Pro Arg Leu Ala Ser Ser Met Tyr Val Lys

355 360TGTGCGAATA ATTCCTTATT TATAGCAGGA AATGTCATCT TGAATTATGT GTAATGTTCT 1161TCTAACTTTC GATGGAAGTG CAAAACAAGT TTTATTAAAA AAAAAAAAAA AAA 1214(2)关于SEQ ID NO:25的信息

(ⅰ)序列特征

(A)长度：363个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:25Arg Ile Leu Thr Arg Ser Ile Ala Ser Ala Gly Glu Asn Pro Ile Asn1 5 10 15Leu Gly Gln Leu Leu Gly Val Cys Thr Thr Asn Ala Leu Ala Arg Val

20 25 30Met Leu Gly Arg Arg Val Phe Gly Asp Gly Ser Gly Gly Val Asp Pro

35 40 45Gln Ala Asp Glu Phe Lys Ser Met Val Val Glu Ile Met Val Leu Ala

50 55 60Gly Ala Phe Asn Leu Gly Asp Phe Ile Pro Ala Leu Asp Trp Phe Asp65 70 75 80Leu Gln Gly Ile Thr Ala Lye Met Lys Lys Val His Ala Arg Phs Asp

85 90 95Ala Phe Leu Asp Ala Ile Leu Glu Glu His Lys Ser Asn Gly Ser Arg

100 105 110Gly Ala Lys Gln His Val Asp Leu Leu Ser Met Leu Ile Ser Leu Gln

115 120 125Asp Asn Asn Ile Asp Gly Glu Ser Gly Ala Lys Leu Thr Asp Thr Glu

130 135 140Ile Lys Ala Leu Leu Leu Asn Leu Phe Thr Ala Gly Thr Asp Thr Ser145 150 155 160Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg Asn Pro Glu

165 170 175Val Leu Val Gln Ala Gln Gln Glu Leu Asp Arg Val Val Gly Pro Ser

180 185 190Arg Leu Val Thr Glu Ser Asp Leu Pro Gln Leu Ala Phe Leu Gln Ala

195 200 205Val Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu

210 215 220Pro Arg Met Ala Ser Glu Gly Cys Glu Ile Asn Gly Tyr Ser Ile Pro225 230 235 240Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ser Ile Ala Arg Asp Pro

245 250 255Ser Ile Trp Ala Asp Pro Leu Glu Phe Arg Pro Ala Arg Phe Leu Pro

260 265 270Gly Gly Glu Lys Pro Asn Val Asp Val Arg Gly Asn Asp Phe Glu Val

275 280 285Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu Gly

290 295 300Leu Arg Met Val Gln Leu Ser Thr Ala Thr Leu Val His Ser Phe Asn305 310 315 320Trp Asp Leu Leu Asn Gly Met Ser Pro Asp Lys Leu Asp Met Glu Glu

325 330 335Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ser Pro Leu Ile Val His Pro

340 345 350Lys Pro Arg Leu Ala Ser Ser Met Tyr Val Lys

355 360(2)关于SEQ ID NO:26的信息

(ⅰ)序列特征

(A)长度：1757个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅸ)特征：

(A)名称/键：CDS

(B)位置：35..1522

(ⅹⅰ)序列描述：SEQ ID NO:26CCGTTGCTGT CGAGAAAACA GAAAGAAGAG AAAA ATG GAC TAC GTG AAT ATT 52Met Asp Tyr Val Asn Ile1 5TTG CTG GGA CTG TTT TTC ACT TGG TTC TTG GTG AAT GGA CTC ATG TCA 100Leu Leu Gly Leu Phe Phe Thr Trp Phe Leu Val Asn Gly Leu Met Ser

10 15 20CTT CGA AGA AGA AAA ATC TCT AAG AAA CTT CCA CCA GGT CCA TTT CCT 148Leu Arg Arg Arg Lys Ile Ser Lys Lys Leu Pro Pro Gly Pro Phe Pro

25 30 35TTG CCT ATC ATC GGA AAT CTT CAC TTA CTT GGT AAT CAT CCT CAC AAA 196Leu Pro Ile Ile Gly Asn Leu His Leu Leu Gly Asn His Pro His Lys

40 45 50TCA CTT GCT CAA CTT GCA AAA ATT CAT GGT CCT ATT ATG AAT CTC AAA 244Ser Leu Ala Gln Leu Ala Lys Ile His Gly Pro Ile Met Asn Leu Lys55 60 65 70TTA GGC CAA CTA AAC ACA GTG GTC ATT TCA TCA TCA GTC GTG GCA AGA 292Leu Gly Gln Leu Asn Thr Val Val Ile Ser Ser Ser Val Val Ala Arg

75 80 85GAA GTC TTG CAA AAA CAA GAC TTA ACA TTT TCC AAT AGG TTT GTC CCG 340Glu Val Leu Gln Lys Gln Asp Leu Thr Phe Ser Asn Arg Phe Val Pro

90 95 100GAC GTA GTC CAT GTC CGA AAT CAC TCC GAT TTT TCT GTT GTT TGG TTA 388Asp Val Val His Val Arg Asn His Ser Asp Phe Ser Val Val Trp Leu

105 110 115CCA GTC AAT TCT CGA TGG AAA ACG CTT CGC AAA ATC ATG AAC TCT AGC 436Pro Val Asn Ser Arg Trp Lys Thr Leu Arg Lys Ile Met Asn Ser Ser

120 125 130ATC TTT TCT GGT AAC AAG CTT GAT GGT AAT CAA CAT CTG AGG TCT AAA 484Ile Phe Ser Gly Asn Lys Leu Asp Gly Aan Gln His Leu Arg Ser Lys135 140 145 150AAG GTC CAA GAG TTA ATT GAT TAT TGT CAA AAG TGT GCC AAG AAT GGC 532Lys Val Gln Glu Leu Ile Asp Tyr Cys Gln Lys Cys Ala Lys Asn Gly

155 160 165GAA GCA GTG GAT ATA GGA AGA GCA ACT TTT GGA ACT ACT TTG AAT TTG 580Glu Ala Val Asp Ile Gly Arg Ala Thr Phe Gly Thr Thr Leu Asn Leu

170 175 180CTA TCC AAC ACC ATT TTC TCT AAA GAT TTG ACT AAT CCG TTT TCT GAT 628Leu Ser Asn Thr Ile Phe Ser Lys Asp Leu Thr Asn Pro Phe Ser Asp

185 190 195TCT GCT AAA GAG TTT AAG GAA TTG GTT TGG AAC ATT ATG GTT GAG GCT 676Ser Ala Lys Glu Phe Lys Glu Leu Val Trp Asn Ile Met Val Glu Ala

200 205 210GGA AAA CCC AAT TTG GTG GAC TAC TTT CCT TTC CTT GAG AAA ATT GAT 724Gly Lys Pro Asn Leu Val Asp Tyr Phe Pro Phe Leu Glu Lys Ile Asp215 220 225 230CCG CAA GGT ATA AAG CGA CGC ATG ACT AAT AAT TTT ACT AAG TTT CTT 772Pro Gln Gly Ile Lys Arg Arg Met Thr Asn Asn Phe Thr Lys Phe Leu

235 240 245GGC CTT ATC AGC GGT TTG ATT GAT GAC CGG TTA AAG GAA AGG AAT CTA 820Gly Leu Ile Ser Gly Leu Ile Asp Asp Arg Leu Lys Glu Arg Asn Leu

250 255 260AGG GAC AAT GCA AAT ATT GAT GTT TTA GAC GCC CTT CTC AAC ATT AGC 868Arg Asp Asn Ala Asn Ile Asp Val Leu Asp Ala Leu Leu Asn Ile Ser

265 270 275CAA GAG AAC CCA GAA GAG ATT GAC AGG AAT CAA ATC GAG CAG TTG TGT 916Gln Glu Asn Pro Glu Glu Ile Asp Arg Asn Gln Ile Glu Gln Leu Cys

280 285 290CTG GAC TTG TTT GCA GCA GGG ACT GAT ACT ACA TCG AAT ACC TTG GAG 964Leu Asp Leu Phe Ala Ala Gly Thr Asp Thr Thr Ser Asn Thr Leu Glu295 300 305 310TGG GCA ATG GCA GAA CTA CTT CAG AAT CCA CAC ACA TTG CAG AAA GCA 1012Trp Ala Met Ala Glu Leu Leu Gln Asn Pro His Thr Leu Gln Lys Ala

315 320 325CAA GAA GAA CTT GCA CAA GTC ATT GGT AAA GGC AAA CAA GTA GAA GAA 1060Gln Glu Glu Leu Ala Gln Val Ile Gly Lys Gly Lys Gln Val Glu Glu

330 335 340GCA GAT GTT GGA CGA CTA CCT TAC TTG CGA TGC ATA GTG AAA GAA ACC 1108Ala Asp Val Gly Arg Leu Pro Tyr LeuArg Cys Ile Val Lys Glu Thr

345 350 355TTA CGA ATA CAC CCA GCG GCT CCT CTC TTA ATT CCA CGT AAA GTG GAG 1156Leu Arg Ile His Pro Ala Ala Pro Leu Leu Ile Pro Arg Lys Val Glu

360 365 370GAA GAC GTT GAG TTG TCT ACC TAT ATT ATT CCA AAG GAT TCA CAA GTT 1204Glu Asp Val Glu Leu Ser Thr Tyr Ile Ile Pro Lys Asp Ser Gln Val375 380 385 390CTA GTG AAC GTA TGG GCA ATT GGA CGC AAC TCT GAT CTA TGG GAA AAT 1252Leu Val Asn Val Trp Ala Ile Gly Arg Asn Ser Asp Leu Trp Glu Asn

395 400 405CCT TTG GTC TTT AAG CCA GAA AGG TTT TGG GAG TCA GAA ATA GAT ATC 1300Pro Leu Val Phe Lys Pro Glu Arg Phe Trp Glu Ser Glu Ile Asp Ile

410 415 420CGA GGT CGA GAT TTT GAA CTC ATT CCA TTT GGT GCT GGT CGA AGA ATT 1348Arg Gly Arg Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile

425 430 435TGC CCT GGA TTG CCT TTG GCT ATG AGG ATG ATT CCA GTA GCA CTA GGT 1396Cys Pro Gly Leu Pro Leu Ala Met Arg Met Ile Pro Val Ala Leu Gly

440 445 450TCA TTG CTA AAC TCA TTT AAT TGG AAA CTA TAT GGT GGA ATT GCA CCT 1444Ser Leu Leu Asn Ser Phe Asn Trp Lys Leu Tyr Gly Gly Ile Ala Pro455 460 465 470AAA GAT TTG GAC ATG CAG GAA AAG TTT GGC ATT ACC TTG GCG AAA GCC 1492Lys Asp Leu Asp Met Gln Glu Lys Phe Gly Ile Thr Leu Ala Lys Ala

475 480 485CAA CCT CTG CTA GCT ATC CCA ACT CCC CTG TAGCTATAGG GATAAATTAA 1542Gln Pro Leu Leu Ala Ile Pro Thr Pro Leu

490 495GTTGAGGTTT TAAGTTACTA GTAGATTCTA TTGCAGCTAT AGGATTTCTT TCACCATCAC 1602GTATGCTTTA CCGTTGGATG ATGGAAAGAA ATATCTATAG CTTTGGGTTT GTTTAGTTTG 1662CACATAAAAA TTGAATGAAT GGAATACCAT GGAGTTATAA GAAATAATAA GACTATGATT 1722CTTACCCTAC TTGAACAATG ACATGGCTAT TTCAC 1757(2)关于SEQ ID NO:27的信息

(ⅰ)序列特征

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅹⅰ)序列描述：SEQ ID NO:27TTTTTTTTTT TTTTTTTA 18(2)关于SEQ ID NO:28的信息

(ⅰ)序列特征

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型(ⅱ)分子类型：DNA(ⅹⅰ)序列描述：SEQ ID NO:28TTTTTTTTTT TTTTTTTC(2)关于SEQ ID NO:29的信息

(ⅰ)序列特征

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型(ⅱ)分子类型：DNA(ⅹⅰ)序列描述：SEQ ID NO:29TTTTTTTTTT TTTTTTTG 18(2)关于SEQ ID NO:30的信息

(ⅰ)序列特征

(A)长度：7个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:30Trp Ala Ile Gly Arg Asp Pro

5(2)关于SEQ ID NO:31的信息

(ⅰ)序列特征

(A)长度:20个氨基酸

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅹⅰ)序列描述：SEQ ID NO:31TGGGCIATIG GI(A/C)GIGA(T/C)CC 20(2)关于SEQ ID NO:32的信息

(ⅰ)序列特征

(A)长度：6个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:32Phe Arg Pro Glu Arg Phe

5(2)关于SEQ ID NO:33的信息

(ⅰ)序列特征

(A)长度：22个氨基酸

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅹⅰ)序列描述：SEQ ID NO:33AGGAATT(T/C) (A/C)G ICCIGA(A/G)(A/C)GI TT 22(2)关于SEQ ID NO:34的信息

(ⅰ)序列特征

(A)长度：32个核苷酸

(B)类型：核酸

(D)拓扑结构：线型

(C)链型：单链

(ⅱ)分子类型：DNA

(ⅹⅰ)序列描述：SEQ ID NO:34CCITT (T/C) GGIG CIGGI(A/C)GI(A/C)G IATITG(T/G) (C/G)CI GG 32(2)关于SEQ ID NO:35的信息

(ⅰ)序列特征

(A)长度：7个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:35Glu Phe Xaa Pro Glu Arg Phe

5(2)关于SEQ ID NO:36的信息

(ⅰ)序列特征

(A)长度：20个核苷酸

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅹⅰ)序列描述：SEQ ID NO:36GAITT(T/C) IIIC CIGAI(A/C)GITT 20(2)关于SEQ ID NO:37的信息

(ⅰ)序列特征

(A)长度：28个核苷酸

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅹⅰ)序列描述：SEQ ID NO:37CCACACGAGT AGTTTTGGCA TTTGACCC 28(2)关于SEQ ID NO:38的信息

(ⅰ)序列特征

(A)长度：25个碱基酸

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：DNA

(ⅹⅰ)序列描述：SEQ ID NO:38GTCTTGGACA TCACACTTCA ATCTG 25(2)关于SEQ ID NO:39的信息

(ⅰ)序列特征

(A)长度：17个核苷酸

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型(ⅱ)分子类型：DNA(ⅹⅰ)序列描述：SEQ ID NO:39CCGAATTCCC CCCCCCC 17(2)关于SEQ ID NO:40的信息

(ⅰ)序列特征

(A)长度：32个核苷酸

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:40

(ⅱ)分子类型：DNA

(ⅹⅰ)序列描述：SEQ ID NO:40CCIGG(A/G) CAIA TIC(G/T) (C/T) (C/T)TICC IGCICC(A/G)AAI GG 32

Claims

1．一种分离的核酸分子，它含有编码类黄酮3′-羟化酶或其衍生物的核苷酸序列，其中所述的类黄酮3′-羟化酶或其衍生物能比SEQ IDNO:26所述的核苷酸序列编码的类黄酮3′-羟化酶更有效地调节类黄酮化合物的羟化。

2．根据权利要求1所述的分离的核酸分子，含有对应于矮牵牛属中称为Ht1或Ht2所述的遗传基因座或其它有花植物种类中含控制3′羟化类黄酮合成的序列的基因座的核苷酸序列。

3．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:1所述或具有与其至少大约60％相似性或能在低等严格条件下与SEQ ID NO:1所述的序列杂交的核苷酸序列或其互补核苷酸序列。

4．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:3所述的或具有与其至少大约60％相似性或能在低等严格条件下与SEQ ID NO:3所述序列杂交的核苷酸序列或其互补核苷酸序列。

5．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:5所述或具有与其至少大约60％的相似性或能与SEQ ID NO:5所述的序列在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列。

6．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:7所述或具有与其至少大约60％的相似性或能与SEQ ID NO:7所述的序列在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列。

7．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:9所述或具有与其编码序列至少大约60％的相似性或能与SEQ IDNO:9所述的序列在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列。

8．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:14所述或具有与其至少大约60％的相似性或能与SEQ ID NO:14所述的序列在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列。

9．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:16所述的或具有与其至少大约60％的相似性或能与SEQ ID NO:16所述的序列在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列。

10．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:18所述或具有与其至少大约60％的相似性或能与SEQ ID NO:18所述的序列在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列。

11．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:20所述或具有与其至少大约60％的相似性或能与SEQ ID NO:20所述的序列在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列。

12．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:22所述或具有与其至少大约60％的相似性或能与SEQ ID NO:22所述的序列在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列。

13．根据权利要求2所述的分离的核酸分子，含有基本上如SEQ IDNO:24所述或具有与其至少大约60％的相似性或能与SEQ ID NO:24所述的序列在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列。

14．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:2所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

15．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:4所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

16．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:6所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

17．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:8所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

18．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQID NO:13所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

19．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:15所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

20．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:17所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

21．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:19所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

22．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:21所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

23．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:23所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

24．根据权利要求2所述的分离的核酸分子，含有编码或其互补于编码基本上如SEQ ID NO:25所述的氨基酸序列或具有与其至少大约50％的相似性的氨基酸序列的核苷酸序列。

25一种寡聚核苷酸，它能在低度严格条件下与选自SEQ ID NO:1,3,5,7,9,14,16,18,20,22和24的核苷酸序列杂交。

26．一种能在植物中减少编码类黄酮3′羟化酶的内源性基因表达的基因构建体，所述的基因构建体包含选自下列的核苷酸序列：

(ⅰ)编码SEQ ID NO:2,4,6,8,10,11,12,13,15,17,19,21,23或25之一所述的氨基酸序列的核苷酸序列或其互补形式；

(ⅱ)SEQ ID NO:1,3,5,7,14,16,18,20,22或24之一所述的核苷酸序列或SEQ ID NO:9中的编码区或其互补形式：

(ⅲ)具有与(ⅰ)或(ⅱ)至少大约60％相似性的核苷酸序列；和

(ⅳ)能在低等严格条件下与(ⅰ),(ⅱ)和或(ⅲ)杂交的核苷酸序列。

27．一种生产能合成类黄酮3′羟化酶或其功能性衍生物的转基因植物的方法，所述的方法包含用含有编码所述的类黄酮3′羟化酶或其衍生物的核苷酸序列的核酸分子在允许所述的核酸分子最终表达的条件下稳定地转化合适植物的细胞，从该细胞再生转基因植物并在足以允许该核酸分子表达的条件下让所述的转基因植物生长一段时间。

28．一种生产降低了内源性或现存类黄酮3′羟化酶活性的转基因植物的方法，所述的方法包含用含有编码或其互补于编码类黄酮3′羟化酶或其衍生物的核苷酸序列的核酸分子稳定地转化合适植物的细胞，从该细胞再生转基因植物，并且，如果需要，在足以允许该核酸分子表达的条件下让所述的转基因植物生长。

29．根据权利要求27或28所述的方法，其中导入的核酸分子含有选自下列序列的核苷酸序列或其互补核苷酸序列：

(ⅱ)SEQ ID NO:1,3,5,7,14,16,18,20,22或24之一所述的核苷酸序列或SEQ ID NO:9的编码区或其互补形式；

(ⅲ)具有与(ⅰ)或(ⅱ)至少大约60％的相似性的核苷酸序列；和

(ⅳ)能在低等严格条件下与(ⅰ),(ⅱ)和/或(ⅲ)杂交的核苷酸序列。

30．根据权利要求27或28的方法，其中受体植物选自矮牵牛属，石竹属，菊，玫瑰，金鱼草属，烟草，矢车菊，天竺葵属，lisianthus，扶郎花属，苹果，蝴蝶花，百合属，非洲紫罗兰和牵牛花。

31．一种生产能调节类黄酮化合物羟基化的转基因植物的方法，所述的方法包括用含有编码或其互补于编码类黄酮3′羟化酶或其衍生物的核苷酸序列的核酸分子稳定地转化合适植物的细胞或细胞团并从所述的细胞或细胞团再生转基因植物。

32．根据权利要求31所述的方法，其中转化的核酸分子含有选自下列序列的核苷酸序列：

33．一种有表现出颜色改变的组织的转基因植物，所述的转基因植物包含含有选自下列序列的核苷酸序列的核酸分子：

34．来自根据权利要求33的转基因植物的切花。

35．来自根据权利要求33的转基因植物的种子。

36．来自根据权利要求33的转基因植物的果实。

37．来自根据权利要求33的转基因植物的叶片。

38．含有编码类黄酮3′羟化酶的核苷酸序列的核酸分子在制备能调节植物或植物细胞中类黄酮化合物羟基化的基因构建体中的用途。

39．根据权利要求38所述的用途，其中的核苷酸序列选自：