CN1206347C

CN1206347C - Cyp79家族的p450单加氧酶

Info

Publication number: CN1206347C
Application number: CNB018040985A
Authority: CN
Inventors: M·D·安德森; B·L·莫勒; J·S·尼尔森; U·威特斯托克; C·H·汉森; B·A·哈尔基尔; M·D·米凯尔森; P·坎普巴斯克; S·巴克
Original assignee: Syngenta Participations AG; Royal Veterinary Agricultural University
Current assignee: Syngenta Participations AG; Royal Veterinary Agricultural University
Priority date: 2000-01-13
Filing date: 2001-01-11
Publication date: 2005-06-15
Anticipated expiration: 2021-01-11
Also published as: CA2396375A1; HK1053146A1; AU774488B2; AU3541301A; HK1053146B; WO2001051622A2; CN1396953A; WO2001051622A3; EP1246906A2; US20030166202A1; JP2003519489A

Abstract

本发明提供了编码CYP79家族的细胞色素P450单加氧酶的DNA，该家族可催化脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟。本发明的优选实施方案是催化L-缬氨酸和L-异亮氨酸的转变的酶诸如木薯酶CYP79D1和CYP79D2、催化酪氨酸的转变的酶诸如海韭菜酶CYP79E1和CYP79E2、催化色氨酸转变成相应肟吲哚-3-乙醛肟的酶诸如拟南芥酶CYP79A2和蔓菁酶CYP79B5、及催化长链甲硫氨酸同源物的转变的酶诸如拟南芥酶CYP79BF1和CYP79F2。所述DNA或其部分在植物中的转基因表达可用于操作相应芥子油苷或含氰苷的生物合成。

Description

CYP79家族的P450单加氧酶

本发明提供了编码将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的P450单加氧酶的DNA。本发明的具体实施方案是催化L-缬氨酸和L-异亮氨酸的转变、属于新的P450单加氧酶亚家族CYP79D的酶，诸如两种木薯酶CYP79D1和CYP79D2；催化酪氨酸转变成对羟基苯乙醛肟、属于新的P450单加氧酶亚家族CYP79E的酶，诸如两种海韭菜(Triglochin maritima)酶CYP79E1和CYP79E2；催化L-苯丙氨酸转变成苯乙醛肟、属于新的P450单加氧酶亚家族CYP79A的酶，诸如拟南芥(Arabidopsis thaliana)酶CYP79A2；催化色氨酸转变成吲哚-3-乙醛肟(IAOX)(参与吲哚芥子油苷的生物合成，还可能参与植物激素吲哚乙酸(IAA)的生物合成)、属于新的P450单加氧酶亚家族CYP79B的酶，诸如拟南芥酶CYP79B2和蔓菁(Brassica napus)酶CYP79B5；和催化脂肪族氨基酸或长链甲硫氨酸同源物转变成相应醛肟、属于新的亚家族CYP79F的酶，诸如拟南芥酶CYP79F1和CYP79F2。所述DNA或其部分在植物中的转基因表达可用于操作相应芥子油苷或含氰苷的生物合成。

细胞色素P450酶是构成超基因家族的含血红素酶。在植物中，它们分成截然不同的两组(Durst等人，Drug Metabolism and DrugInteract，12：189-206，1995)。A组可能衍生自共同祖先，并参与次级植物产物诸如芥子油苷和含氰苷的生物合成。非A组是接近动物、真菌、和微生物细胞色素P450的异质簇。将氨基酸序列同一性超过40％的细胞色素P450分在相同家族内(Nelson等人，DNA Cell Biol，12：1-51，1993)，而同一性超过55％的细胞色素P450则属于相同亚家族。

芥子油苷是由氨基酸衍生的次级植物产物，包含硫酸和硫代葡萄糖部分。芥子油苷的发生限于白花菜目(Capparales)和核果木属(Drypetes)(大戟目(Euphorbiales))。C.papaya是植物中包含芥子油苷和含氰苷二者的唯一已知范例。白花菜目包括农业上重要的芸苔科(Brassicaceae)作物，诸如油料种子油菜和芸苔属(Brassica)饲料和蔬菜，以及模型植物拟南芥。组织受损后，芥子油苷迅速水解成具有生物学活性的降解产物。芥子油苷或其降解产物保护植物免于昆虫和真菌的攻击，且担当专以芸苔科为食的昆虫的引诱剂。除了保护效果，降解产物在高等动物和人中还具有毒性。由消耗大量油菜种子膳食引起的抗营养效果(诸如生长迟缓)具有经济影响，因为它们限制了这种富含蛋白质的动物饲料的使用。关于芥子油苷的几种降解产物(例如菜菔硫烷即1-异硫氰基-4R-[甲基亚硫酰基]丁烷，来自嫩茎花椰菜籽苗的4-甲基亚硫酰基丁基芥子油苷的降解产物)的药理学研究证明了抗致癌活性。芥子油苷生物合成途径的代谢工程能够组织特异性调控和优化个别芥子油苷的水平以改进指定作物的营养价值。除了发生于拟南芥，这些芥子油苷还是芸苔属作物和蔬菜的重要成份。例如，蔓菁中的主要芥子油苷即致甲状腺肿的2-羟基-3-丁烯基芥子油苷是由侧链修饰4-甲基硫代丁基芥子油苷而形成的。2-羟基-3-丁烯基芥子油苷在蔓菁中的发生限制了其富含蛋白质的油饼作为动物饲料的使用。因此，生物合成基因的有效性对于开发非期望芥子油苷水平降低同时保留具有期望效果(如害虫抗性)的芥子油苷的作物具有极大潜力。

迄今为止，已经鉴定了超过100种不同芥子油苷。根据它们是否衍生自脂肪族氨基酸、苯丙氨酸和酪氨酸、或色氨酸，将它们分成脂肪族、芳香族、和吲哚基芥子油苷。在进入生物合成途径前，氨基酸通常经历一系列链延长，且芥子油苷产物通常进行次级修饰(诸如羟化、甲基化、和氧化)而产生芥子油苷的结构多样性。据显示，拟南芥Columbia载培品种包含衍生自色氨酸、长链苯丙氨酸同源物(高苯丙氨酸)、和几种长链甲硫氨酸同源物(诸如二高甲硫氨酸(dihomomethionine)、三高甲硫氨酸、和四高甲硫氨酸)的23种不同芥子油苷。

在本发明中，除了别的以外，我们还由拟南芥鉴定了CYP79同源物CYP79B2，它催化色氨酸转变成IAOX，后者是吲哚芥子油苷和植物激素IAA二者的生物合成前体。CYP79B2在拟南芥中的过度表达导致吲哚芥子油苷水平升高，这说明CYP79B2参与吲哚芥子油苷的生物合成，而且吲哚芥子油苷的进化是以“生氰”诱因为基础的。

对于芥子油苷生物合成途径，尚未鉴定很多基因。对催化氨基酸转变成醛肟的酶的性质行了许多讨论。独立的生化研究指出三种不同酶系统参与这个步骤，即依赖细胞色素P450的单加氧酶、含黄素的单加氧酶、和过氧化物酶。先前有人根据来自芸苔科物种的微粒体酶制剂提出，二高甲硫氨酸、三高甲硫氨酸、和四高甲硫氨酸转变成相应的醛肟是由含黄素的单加氧酶催化的。

在含氰苷的生物合成中，CYP79家族的细胞色素P450催化由氨基酸形成醛肟。例如，芳香族氨基酸前体L-酪氨酸被酶CYP79A1(P450_TYR)羟化两次而形成(Z)-对羟基苯基乙醛肟(WO 95/16041)，随后由酶CYP71E1(P450_OX)转变成羟腈即对羟基扁桃腈(WO 98/40470)，对羟基扁桃腈最后由UDP-葡萄糖：苷元葡萄糖基转移酶缀合葡萄糖。上述酶的转基因表达可用于修饰、重建、或新建含氰苷的生物合成途径，或者用于更改植物中的芥子油苷生成。已经在芥子油苷生成植物中鉴定了几种CYP79同源物，但是尚未测定它们的功能。本发明公开了拟南芥的细胞色素P450 CYP79A2、CYP79B2、和CYP79F1的克隆和功能性表达，以及蔓菁的细胞色素P450 CYP79B5的克隆。本发明显示，CYP79A2催化L-苯丙氨酸转变成苯乙醛肟，CYP79B2催化色氨酸转变成吲哚-3-乙醛肟，而CYP79F1催化长链甲硫氨酸同源物(诸如高甲硫氨酸、二高甲硫氨酸、三高甲硫氨酸、四高甲硫氨酸、五高甲硫氨酸、和六高甲硫氨酸)转变成相应的醛肟。本发明还显示，在CaMV35S启动子的控制下表达CYP79A2或CYP79B2的转基因拟南芥分别积累高水平的苯甲基芥子油苷或吲哚芥子油苷，而表达CYPF1的转基因拟南芥能够显示CYPF1的共遏制，伴随衍生自长链甲硫氨酸同源物的芥子油苷含量降低和长链甲硫氨酸(诸如二高甲硫氨酸和三高甲硫氨酸)水平的高度升高。这些数据与CYP79A2、CYP79B2、和CYP79F1在拟南芥中参与芥子油苷生物合成是一致的。出乎意料的是在吲哚芥子油苷生物合成中存在生成IAOX的CYP79，因为没有鉴定到由色氨酸衍生的含氰苷，而且在文献中描述了过氧化物酶活性参与吲哚芥子油苷生物合成。另外，吲哚芥子油苷是最近进化事件的产物，而且只存在于白花菜目的四个科中，即芸苔科(Brassicaceae)、木犀草科(Resedaceae)、金线草科(Tovariaceae)、和白花菜科(Capparaceae)。因此，IAOX可能参与IAA和吲哚芥子油苷二者生物合成的可能性说明，催化色氨酸转变成IAOX的酶的性质与CYP79 N-羟化酶是不同的。CYP79B2在植物中和在体外的表征证明，芥子油苷生物合成中由CYP79蛋白质进行的肟生成不限于那些同样作为含氰苷生物合成前体的芳香族氨基酸。这说明在与含氰苷分化之后，CYP79蛋白质形成新的底物特异性。因此，预计芥子油苷生成植物中属于CYP79家族的许多细胞色素P450将在芥子油苷生物合成中由多种前体氨基酸催化肟生成。

木薯(最重要的热带块根农作物)在植物的所有部分中包含两种含氰苷，即亚麻苦苷和百脉根苷。在组织受损后，所述葡萄糖苷发生降解，并伴随氰化氢的释放。还没有发现不生氰的木薯植物，试图通过育种完全消除含氰苷的尝试也尚未获得成功。因此，木薯产品作为主粮的使用需要小心加工以除去氰化物。然而，加工是费时费力的，同时导致蛋白质、维生素、和矿物质的损失。参与亚麻苦苷和百脉根苷生物合成途径的酶的鉴定将为遏制所述含氰苷生物合成的分子生物学方法(诸如有义或反义遏制)打开方便之门。

海韭菜(海边水麦冬植物)在植物的大多数部分中包含两种含氰苷，即taxiphyllin和海韭菜苷。在组织受损后，所述葡萄糖苷发生降解，并伴随氰化氢的释放。还没有发现不生氰的海边水麦冬植物。参与taxiphyllin(蜀黍苷的表异构物)和海韭菜苷生物合成途径的酶及相应cDNA或基因组克隆的鉴定使得可利用分子生物学方法遏制所述含氰苷生物合成(诸如有义或反义遏制)或选择期望改变(使用标记辅助选择)。虽然正在试图由许多不同植物物种中含氰苷生物合成的共同生物合成路径来推断类似多功能细胞色素P450酶的参与，但是海韭菜可能并非如此，因为在这种植物中对羟基苯基乙醛肟无需平衡。细胞色素P450催化醛肟转变成腈是脱水反应，而且是如此不寻常。在海韭菜中，可以由与第一种多功能细胞色素P450酶相关的额外酶活性进行，而非由所涉及的第二种细胞色素P450催化的第一个催化事件。如果是这样的话，海韭菜中的第二种细胞色素P450将构成寻常的C-羟化酶。

基因指编码序列及相关调控序列，其中编码序列转录成RNA，诸如mRNA、rRNA、tRNA、snRNA、有义RNA、或反义RNA。调控序列的范例是启动子序列、5’和3’非翻译序列、和终止序列。还可以存在其它元件，诸如内含子。

表达通常指内源基因或转基因在植物中的转录和翻译。然而，对于不编码蛋白质的基因(诸如反义构建物)，术语表达仅指转录。

本发明提供了下列解决方案：

●编码将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物(诸如缬氨酸、亮氨酸、异亮氨酸、环戊烯基甘氨酸、酪氨酸、L-苯丙氨酸、色氨酸、二高甲硫氨酸、三高甲硫氨酸、或四高甲硫氨酸)转变成相应肟的P450单加氧酶的DNA；

●编码P450单加氧酶的所述DNA，其中所编码蛋白质的氨基酸序列的整体比对与得自SEQ ID NO：1或SEQ ID NO：3或二者；SEQ IDNO：39；SEQ ID NO：54或SEQ ID NO：70或二者整体比对的氨基酸序列显示至少40％同一性，或者与得自SEQ ID NO：9或SEQ ID NO：11或二者；SEQ ID NO：74或SEQ ID NO：84或二者整体比对的氨基酸序列显示至少50％同一性；

●编码具有通式R₁-R₂-R₃的P450单加氧酶的所述DNA，其中：

-R₁、R₂、和R₃称为成份序列，且

-R₂由150-175个或更多氨基酸残基组成，其序列与SEQ ID NO：1或SEQ ID NO：3；SEQ ID NO：9或SEQ ID NO：11；SEQ ID NO：54或SEQ ID NO：70；SEQ ID NO：74或SEQ ID NO：84中的经比对成份序列至少60％同一；或者与SEQ ID NO：39中的经比对成份序列至少65％同一；

●将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的P450单加氧酶；

●用于分离编码P450单加氧酶的cDNA的方法，所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟；

●用于生成纯化的重组P450单加氧酶的方法，所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟；

●标记辅助育种方法，其中使用长度为至少15-20个核苷酸、构成依照本发明的DNA的成份序列的至少一种寡核苷酸；和

●获取转基因植物的方法，包括将包含至少部分P450单加氧酶开放读码框的DNA稳定整合到其基因组中，所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟。根据所用构建物，得到的植物显示含氰苷或芥子油苷的含量或特性得到改变。

人们认为含氰苷的生物合成是依照一般途径进行的，即涉及所有植物中相同类型的中间物。这已经由涉及氨基酸转变成肟的途径部分得到了清楚的证明。在所有测试植物中，所述途径部分是由属于CYP79家族的一种或多种细胞色素P450酶催化的。该家族的成员是在氨基酸水平显示40％序列同一性的蛋白质，而将显示低于55％序列同一性的成员分成不同亚家族。例如，催化芳香族氨基酸L-酪氨酸转变成相应肟的高粱酶属于亚家族CYP79A，称为CYP79AL。taxiphyllin和海韭菜苷生物合成途径也由芳香族氨基酸L-酪氨酸转变成对羟基苯乙醛肟开始。认为亚麻苦苷和百脉根苷生物合成途径由脂肪族氨基酸L-缬氨酸或L-异亮氨酸转变成相应肟开始。

本发明的目的是提供编码将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的P450单加氧酶的DNA，以及根据在木薯、海韭菜、拟南芥、或蔓菁中表达的酶的氨基酸序列和相应基因序列确定它们的一般结构。发现：催化脂肪族氨基酸的转变的酶构成新的P450酶亚家族，称为CYP79D；催化芳香族氨基酸的转变的酶构成新的P450酶亚家族，称为CYP79E；催化L-苯丙氨酸转变成苯乙醛肟的酶属于CYP79A亚家族；催化色氨酸转变成吲哚-3-乙醛肟的酶属于CYP79B亚家族；催化脂肪族氨基酸或长链甲硫氨酸同源物的转变的酶属于CYP79F亚家族。

如此，本发明公开了将脂肪族氨基酸(诸如缬氨酸、亮氨酸、异亮氨酸、或环戊烯基甘氨酸)转变成相应肟的P450单加氧酶。酶对L-氨基酸是特异的。它是由独立选自下组的氨基酸残基组成的：Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg、和His，并与得自SEQ ID NO：1(CYP79D1)或SEQ ID NO：3(CYP79D2)或二者整体比对的氨基酸序列显示至少40％、优选55％、甚至更优选70％同一性，这些序列代表了在木薯中天然表达的所述序列的本发明具体实施方案。

本发明还公开了将芳香族氨基酸诸如酪氨酸或苯丙氨酸转变成相应肟的P450单加氧酶。该酶对L-氨基酸是特异的。它是由独立选自下组的氨基酸残基组成的：Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg、和His，并与得自SEQ ID NO：9(CYP79E1)或SEQ ID NO：11(CYP79E2)或二者整体比对的氨基酸序列显示至少50％、优选55％、甚至更优选70％同一性，所述序列代表了在海韭菜中天然表达的本发明的具体实施方案。

本发明还公开了将L-苯丙氨酸转变成苯乙醛肟的P450单加氧酶。它是由独立选自下组的氨基酸残基组成的：Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg、和His，并与得自SEQ ID NO：39(CYP79A2)整体比对的氨基酸序列显示至少40％、优选55％、甚至更优选70％同一性，所述序列代表了在拟南芥中天然表达的本发明的具体实施方案。

本发明还公开了将色氨酸转变成吲哚-3-乙醛肟的P450单加氧酶。它是由独立选自下组的氨基酸残基组成的：Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg、和His，并与得自SEQ ID NO：54(CYP79B2)或SEQ ID NO：70(CYP79B5)整体比对的氨基酸序列显示至少40％、优选55％、甚至更优选70％同一性，二者分别代表了在拟南芥和蔓菁中天然表达的本

发明的具体实施方案。

本发明还公开了将脂肪族氨基酸或长链甲硫氨酸同源物转变成相应醛肟的P450单加氧酶。它是由独立选自下组的氨基酸残基组成的：Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg、和His，并与得自SEQ ID NO：74(CYP79F1)或SEQ ID NO：84(CYP79F2)整体比对的氨基酸序列显示至少50％、优选55％、甚至更优选70％同一性，二者代表了在拟南芥中天然表达的本发明的具体实施方案。

可能因存活细胞内翻译后修饰而产生的氨基酸残基的范例是上述氨基酸的糖基化残基以及Aad、bAad、bAla、Abu、4Abu、Acp、Ahe、Aib、bAib、Apm、Dbu、Des、Dpm、Dpr、EtGly、EtAsn、Hyl、aHyl、3Hyp、4Hyp、Ide、alle、MeGly、MeIle、MeLys、MeVal、Nva、Nle、或Orn。

依照本发明的酶的氨基酸序列可以由通式R₁-R₂-R₃进一步定义，其中：

-R₁、R₂、和R₃称为成份序列，且

-R₂由150、175、200个或更多氨基酸残基组成，其序列与SEQ ID NO：1或SEQ ID NO：3；SEQ ID NO：9或SEQ ID NO：11；SEQ ID NO：39；SEQ ID NO：54或SEQ ID NO：70；SEQ ID NO：74或SEQ ID NO：84中的经比对成份序列至少60-65％、优选至少70％、甚至更优选至少75％同一。

R₂通常由150-175个或更多氨基酸残基组成。R₂的具体实施方案有：SEQ ID NO：1的第334-484位氨基酸和SEQ ID NO：3的第333-483位氨基酸；SEQ ID NO：9的第339-489位氨基酸和SEQ ID NO：11的第332-482位氨基酸；SEQ ID NO：39的第308-487位氨基酸；SEQ ID NO：54的第196-345位氨基酸和SEQ ID NO：70的第192-341位氨基酸；以及SEQID NO：74的第334-483位氨基酸和SEQ ID NO：84的第332-481位氨基酸。

由所述DNA编码的单加氧酶通常由450-600个氨基酸残基组成。因而，具体实施方案CYP79D1(SEQ ID NO：1)、CYP79D2(SEQ ID NO：3)、CYP79E1(SEQ ID NO：9)、CYP79E2(SEQ ID NO：11)、CYP79A2(SEQID NO：39)、CYP79B2(SEQ ID NO：54)、CYP79B5(SEQ ID NO：70)、CYP79F1(SEQ ID NO：74)、和CYP79F2(SEQ ID NO：84)的大小分别是541、542、540、533、523、541、540、537、和535个氨基酸残基。

一般而言，存在两种方法可用于序列比对。由Needleman和Wunsch提出的及由Sellers提出的动力学编程算法比对两种序列的完整长度，从而提供序列的整体比对。另一方面，Smith-Waterman算法产生局部比对。局部比对是比对序列内在选定评分矩阵和缺口罚分下最相似的成对区域。这容许数据库搜索而聚焦于序列中最高度保守的区域。它还容许鉴定序列内相似结构域。为了加快使用Smith-Waterman算法的比对，诸如BLAST(基本局部算法搜索工具)和FASTA等程序对比对设置了额外约束。

在本发明的内容中，整体序列比对是方便的使用程序PILEUP(Genetic Computer Group即遗传学计算机小组，麦迪逊，威斯康星州)进行的。局部比对是方便的使用BLAST进行的，即设计用于探测所有可获得的序列数据库而不论检索条目是蛋白质或DNA的一组相似性搜索程序。这种搜索工具的2.0版BLAST(Gapped BLAST)已经可以在因特网上公开获得(当前网址是 http://www.ncbi.nlm. nih.gov/BLAST/)。它使用启发式算法，寻找局部而非整体比对，从而能够检测只分享分离区域的序列之间的关系。在BLAST搜索中获得的评分具有明确的统计学解释。在本发明范围内特别有用的是容许在局部序列比对中导入缺口的blastp程序和PSI-BLAST程序(这两种程序都将氨基酸检索序列对蛋白质序列数据库进行比较)，以及只容许两种序列的局部比对的blastp变体程序。优选将任选参数设成缺省值来运行所述程序。

另外，使用BLAST的序列比对能够考虑用一种氨基酸替代另一种是否有可能保留维持蛋白质结构和功能所必需的物理和化学特性或者是否更有可能破坏基本结构和功能特性。这种序列相似性以“阳性”氨基酸百分比进行了量化(相对于同一氨基酸百分比而言)，而且在边界的情况中可能有助于将蛋白质归入正确的蛋白质家族。

可以如WO 95/16041的实施例3中关于P450_TYR所述，由表达将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的P450单加氧酶的植物纯化上述酶。

可以通过包括在诸如甲基营养酵母巴斯德毕赤酵母(Pichiapastoris)等酵母中表达cDNA克隆的方法，而获得纯化的重组P450单加氧酶，所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟。为了优化表达条件，可能希望在插入表达载体前除去5’和3’非翻译区。可以通过像高表达的巴斯德毕赤酵母AOXl基因的起始ATG那样正确安置起始ATG而获得最佳翻译起始区。可以在完整细胞中测量代谢活性，因为巴斯德毕赤酵母内源还原酶系统能够支持将电子供给许多植物细胞色素P450。为了进一步优化表达和酶活性水平，可以测试许多不同的生长培养基和生长周期，包括但不限于使用丰富培养基并于OD₆₀₀大约0.5保温24-30小时。可以通过去污剂像TritonX-114的初步溶解及随后由温度诱导的相分配，而由巴斯德毕赤酵母微粒体分离生成的细胞色素P450。可以使用离子交换层析或染料柱层析来实现最终纯化。适用于离子交换层析的柱子是DEAE-Sepharose FF。适用于染料层析的柱子是Reactive Red 120琼脂糖、Reactive Yellow3A琼脂糖、或Cibachron Blue琼脂糖。染料柱可以方便的用KCl梯度进行洗脱。可以通过一氧化碳差异光谱学、底物结合光谱、或活性测量(使用脂肪族或芳香族氨基酸或长链甲硫氨酸同源物作为底物及重建的细胞色素P450酶)来鉴定包含活性细胞色素P450酶的级分。

若巴斯德毕赤酵母内源还原酶不能支持电子供给，则可以依照标准流程(Sibbesen等人，J Biol Chem，270：3506-3511，1995)在携有由提供细胞色素P450酶来源的高粱或相同植物物种分离的NADPH-细胞色素P450氧化还原酶的人造脂质微团(Sibbesen等人，J BiolChem，270：3506-3511，1995；Halkier等人，Arch Biochem Biophys，322：369-377，1995；Kahn等人，Plant Physiol，115：1661-1670，1997)中分离并重建重组蛋白。

或者，可以将细菌像大肠杆菌用于属于CYP79家族的细胞色素P450酶的重组表达。得到的蛋白质是未糖基化的。根据具体研究的酶，可以优选包含编码天然或各种截短、延长、或修饰氨基末端序列的插入片段的载体构建物(Halkier等人，Arch Biochem Biophys，322：369-377，1995；Barnes等人，Proc Natl Acad Sci USA，88：5597-5601，1991；Gillem等人，Arch Biochem Biophys，312：59-66，1994)。特别优选的大肠杆菌菌株是菌株C43(DE3)，已知它可以在以阻滞常用菌株的量表达异源膜蛋白时生长良好。因而，CYP79B2在常用大肠杆菌菌株JM109中生成的表达不足由菌株C43(DE3)生成的CYP79B2活性的0.5％。也有可能在昆虫细胞中进行表达。

利用在存在大量脂质时用高粱NADPH-细胞色素P450氧化还原酶重建的大肠杆菌原生质球进行了对CYP79D1、CYP79D2、CYP79E1、CYP79E2、CYP79A2、CYP79B2、CYP79B5、和CYP79F1的底物特异性的研究。L-α-二油酰磷脂酰胆碱和L-α-二肉桂酰磷脂酰胆碱是优选用于重建的脂质。发现CYP79D1和CYP79D2二者均可将L-缬氨酸及L-异亮氨酸转变成相应的肟。发现CYP79E1和CYP79E2二者均可将L-酪氨酸转变成相应的肟。发现CYP79A2可将L-苯丙氨酸转变成苯乙醛肟。发现CYP79B2可将色氨酸转变成吲哚-3-乙醛肟。发现CYP79F1可将长链甲硫氨酸同源物转变成相应的醛肟。L-亮氨酸、L-苯丙氨酸、和L-酪氨酸都不能由CYP79D1或CYP79D2进行代谢。L-甲硫氨酸、L-色氨酸、和L-酪氨酸都不能由CYP79A2进行代谢。苯丙氨酸和酪氨酸都不能由CYP79B2进行代谢。L-色氨酸、L-苯丙氨酸、和L-酪氨酸都不能由CYP79F1进行代谢。D-氨基酸不能由CYP79D1、CYP79D2、CYP79E1、和CYP79E2转变成肟。根据底物的性质，还可以使用完整巴斯德毕赤酵母细胞或完整大肠杆菌细胞来测定底物特异性。

可以在包括下列步骤的测定法(参阅实施例5)中测试P450单加氧酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的能力：

(1)将包含本发明的P450单加氧酶或表达所述酶的大肠杆菌细胞的原生质球、亲本氨基酸、NADPH、氧、NADPH-细胞色素P450氧化还原酶、和脂质的反应混合物于环境温度保温一段时间(2分钟与2-6小时之间)；

(2)终止反应，例如通过加入变性化合物诸如乙酸乙酯；并

(3)化学鉴定和量化生成的醛肟。

本发明还提供了包含编码依照本发明的新型蛋白质的开放读码框的核酸化合物。所述核酸分子在结构和功能上与可以由生成相似生物合成酶的植物获得的核酸分子相似。在本发明的一个优选实施方案中，开放读码框可操作连接一种或多种调控序列，所述调控序列不同于与包含开放读码框外显子的基因组基因相连的调控序列，而且所述核酸分子能够与由SEQ ID NO：2或SEQ ID NO：4；SEQ ID NO：10或SEQ IDNO：12；SEQ ID NO：40；SEQ ID NO：55(对应于编码CYP79B2的拟南芥属cDNA)、SEQ ID NO：56(对应于编码CYP79B2的拟南芥属基因组DNA)、或SEQ ID NO：71(对应于编码CYP79B5的芸苔属cDNA)；SEQ ID NO：75或SEQ ID NO：85定义的DNA分子的片段发生杂交。所述片段的长度超过20个核苷酸，优选超过25、30、或50个核苷酸。影响杂种分子稳定性的因素确定了杂交条件的严谨度，而且可以依赖所形成杂种分子的解链温度Tm进行测量。Tm的计算描述于几种教科书。例如，Keller等人在《DNA Probes：Background，Applications，Procedures》(DNA探针：背景、应用、流程)(Macmillan出版有限公司，1993，第8-10页)中描述了在计算杂交反应的Tm值时要考虑的因素。依照本发明的DNA分子能够与SEQ ID NO：2或SEQID NO：4；SEQID NO：10或SEQ ID NO：12；SEQ ID NO：40；SEQ ID NO：55、SEQ IDNO：56、或SEQ ID NO：71；SEQ ID NO：75或SEQ ID NO：85的片段在比将要形成的杂种分子的计算Tm低30℃的温度发生杂交。优选的是，它们能够在比计算Tm低25、20、15、10、或5℃的温度发生杂交。

依照本发明的核酸化合物是由独立选自G、A、T、和C或独立选自G、A、U、和C的核苷酸残基组成的，且表征为通式RA-RB-RC，其中：

-RA、RB、和RC称为成份序列；且

-RB由至少450个、优选600个、或更多核苷酸残基组成，编码上文所述氨基酸成份序列R2。

有关SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、和SEQ ID NO：4；SEQ ID NO：9、SEQ ID NO：10、SEQ ID NO：11、和SEQ ID NO：12；SEQ ID NO：39和SEQ ID NO：40；SEQ ID NO：54、SEQ ID NO：55、SEQ ID NO：56、SEQ ID NO：70、和SEQ ID NO：71；SEQ ID NO：74、SEQ ID NO：75、SEQ ID NO：84、和SEQ ID NO：85的知识可用于加快编码P450单加氧酶的DNA的分离和生成，所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的醛肟，该方法包括：

(1)由表达这种单加氧酶的植物组织构建cDNA文库；

(2)使用根据SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、或SEQ IDNO：4；SEQ ID NO：9、SEQ ID NO：10、SEQ ID NO：11、或SEQ ID NO：12；SEQ ID NO：39或SEQ ID NO：40；SEQ ID NO：54、SEQ ID NO：55、SEQ ID NO：56、SEQ ID NO：70、或SEQ ID NO：71；或SEQ IDNO：74、SEQ ID NO：75、SEQ ID NO：84、或SEQ ID NO：85设计的至少一种寡核苷酸由cDNA文库扩增部分P450单加氧酶cDNA；(3)任选使用根据SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、或SEQ ID NO：4；SEQ ID NO：9，SEQ ID NO：10、SEQ ID NO：11、或SEQ ID NO：12；SEQ ID NO：39或SEQ ID NO：40；SEQ ID NO：54、SEQ ID NO：55、SEQ ID NO：56、SEQ ID NO：70、或SEQ ID NO：71；或SEQ ID NO：74、SEQ ID NO：75、SEQ ID NO：84、或SEQ ID NO：85设计的一种或多种寡核苷酸在嵌套PCR反应中由cDNA文库扩增部分P450单加氧酶cDNA；

(4)使用在步骤(2)或(3)中获得的DNA作为探针筛选由表达P450单加氧酶的植物组织构建的DNA文库，所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟；

(5)鉴定并纯化包含编码蛋白质的开放读码框的载体DNA，所述蛋白质的特征为氨基酸序列与得自SEQ ID NO：1或SEQ ID NO：3或二者；SEQ ID NO：9或SEQ ID NO：11或二者；SEQ ID NO：39；SEQ ID NO：54或SEQ ID NO：70或二者；或SEQ ID NO：74或SEQ ID NO：84或二者整体比对的氨基酸序列显示至少40％或50％、优选55％、甚至更优选70％同一性；并

(6)任选进一步处理纯化的DNA，以实现例如蛋白质在微生物像大肠埃希氏菌或巴斯德毕赤酵母中的异源表达，用于随后分离单加氧酶、测定其底物特异性、或生成抗体。

在上述方法的步骤(2)和(3)中，用于扩增的第二种寡核苷酸优选是与用于构建cDNA文库的载体DNA内某一区域互补的寡核苷酸。然而，也可以使用根据SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、或SEQID NO：4；SEQ ID NO：9、SEQ ID NO：10、SEQ ID NO：11、或SEQ IDNO：12；SEQ ID NO：39或SEQ ID NO：40；SEQ ID NO：54、SEQ ID NO：55、SEQ ID NO：56、SEQ ID NO：70、或SEQ ID NO：71；或SEQ ID NO：74、SEQ ID NO：75、SEQ ID NO：84、或SEQ ID NO：85设计的第二种寡核苷酸。编码将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的P450单加氧酶的cDNA克隆或该克隆的片段还可单独或联合编码其它蛋白质(诸如属于CYP79蛋白质家族的其它蛋白质)的cDNA克隆或其片段而用于DNA芯片。这为监测植物中生物或非生物因素对例如芥子油苷或含氰苷生物合成的诱导或抑制提供了简易方法。

此外，衍生自本发明序列的特异寡核苷酸序列可用作标记辅助育种程序中的标记或用于鉴定这些标记。因此，本发明容许开发通过一种或多种寡核苷酸的杂交来选择期望性状的标记辅助育种方法，其中至少一种所述寡核苷酸的序列构成本发明公开的DNA的成份序列。在一个优选的实施方案中，所述寡核苷酸由至少15个、优选至少20个核苷酸组成，且构成聚合酶链式反应测定法的成份。

作为转基因表达的、编码依照本发明的P450单加氧酶的DNA对更改植物中的芥子油苷或含氰苷生物合成特别有用。当与属于CYP71E家族的细胞色素P450酶(如来自高粱的CYP71E1或优选来自木薯的相应同系物)和UDP-葡萄糖氰醇葡萄糖基转移酶一起在无氰植物中表达编码将脂肪族或芳香族氨基酸转变成相应肟的细胞色素P450酶的基因时，获得的转基因植物将是生氰的。将编码将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的细胞色素P450酶的基因导入生成芥子油苷的植物物种的方法可用于改变所述植物中的芥子油苷生成(如由选定转基因植物中个别芥子油苷的整体水平或含量的改变所观察到的)。若作为所导入细胞色素P450酶的底物的脂肪族或芳香族氨基酸或长链甲硫氨酸同源物先前不能由该植物物种中其它细胞色素P450识别成底物，则在转化植物中导入了新的芥子油苷。同样，将编码将脂肪族或芳香族氨基酸转变成相应肟的细胞色素P450酶的基因导入生氰植物的方法可用于更改先前存在的含氰苷的整体水平和分布，及用于在植物中导入一种或多种其它含氰苷。

用于提供组成性、诱导性、或组织特异性基因表达的启动子的正确选择提供了获得具有期望疾病或食草动物应答的转基因植物的手段。同样，可以使用相同基因的反义或核酶技术来更改或降低植物中芥子油苷或含氰苷的含量。因此，本发明的另一个方面是提供转基因植物，包括将依照本发明的P450单加氧酶的至少部分开放读码框稳定整合到它们的基因组DNA中，所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟。可以通过包括下列步骤的方法生成这些植物：

(1)将包含依照本发明的P450单加氧酶的至少部分开放读码框的DNA导入能够再生成完整植株的植物细胞或组织，所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟；并

(2)选择转基因植物。

优选的是，所述方法或是产生转基因表达所述P450单加氧酶的植物，或是产生内源P450单加氧酶表达降低的植物，或是产生芥子油苷或含氰苷的生成降低的植物。

实施例

实施例1：木薯CYP79探针的PCR扩增和文库筛选

根据催化L-缬氨酸转变成相应肟的P450酶属于CYP79家族这一假设，设计了针对CYP79A1(高粱)、CYP79B1(欧白芥(Sinapisvalba))、和CYP79B2(拟南芥)中显示序列保守性的区域的简并引物。引物设计中排除了推定参与底物识别的结构域，因为在已知的CYP79中没有一种利用缬氨酸或异亮氨酸作为底物。

总体积20μl的第一轮PCR扩增反应是在10mM Tris-HCl pH9、50mMKCl、1.5mM MgCl₂中使用0.5U Taq DNA聚合酶(Pharmacia，瑞典)、200μM dATP、200μM dCTP、200μM dGTP、200μM dTTP、500nM每种引物5’-GCGGAATTCARGGIAAYCCIYTICT-3’(SEQ ID NO：5)和5’-CGCGGATCCGGDATRTCIGAYTCYTG-3’(SEQ ID NO：6)(其中I表示肌苷)、和10ng质粒DNA模板进行的。质粒DNA模板是由pcDNA2.1(Invitrogen，荷兰)中的单向质粒cDNA文库制备的，而所述cDNA文库又是由木薯植物芽尖的未成熟折叠叶片和叶柄构建的。热循环参数是：首先变性，95℃2min；3个循环，95℃5sec、40℃30sec、72℃45sec；32个循环，95℃5sec、50℃5sec、72℃45sec；最后延伸，72℃5min。用巴斯德移液管戳出预期大小210bp的条带，并用于在50μl上文所述相同反应混合液中进行第二轮PCR扩增，只是热循环参数改成：首先变性，95℃2min；20个循环，95℃5sec、50℃5sec、72℃45sec；最后延伸，72℃5min。使用Thermo Sequenaseradiolabled terminator cycle sequencing kit即耐热测序酶放射性标记终止物循环测序试剂盒(Amersham，瑞典)和α-³³p-ddNTP(Amersham，瑞典)，依照制造商的指示，对产物进行测序。

通过PCR扩增用洋地黄毒苷-11-dUTP(Boehringer，曼海姆，德国)标记基因特异片段，并用作探针及使用DIG系统(Boehringer，曼海姆，德国)筛选木薯cDNA文库。将探针于68℃在5×SSC、0.1％N-肉桂酰肌氨酸、0.02％SDS、1％封闭剂(Boehringer，曼海姆，德国)中杂交过夜。检测前，用0.1×SSC、0.1％SDS于65℃清洗滤膜。

实施例2：CYP79D1和CYP79D2的测序和Southern印迹分析

使用依照实施例1获得的探针由木薯cDNA文库分离了两个相等丰度的全长克隆。它们具有编码61.2和61.3kDa的P450的开放读码框。将这些P450称为CYP79D1和CYP79D2，作为新的CYP79D亚家族的最初两个成员。

使用Thermo Sequenase Fluorescent-labled Primer cyclesequencing kit即耐热测序酶荧光标记引物循环测序试剂盒(7-脱氮dGTP)(Amersham，瑞典)和ALF-Express sequenator即快速测序仪(Pharmacia，瑞典)进行测序。使用GCG Wisconsin Sequence AnalysisPackage即GCG威斯康星序列分析软件包的程序进行序列计算机分析。两种木薯P450有85％同一，而且都与CYP79A1分享54％的同一性。将在氨基酸水平显示超过40％但不足55％序列同一性的P450分到相同家族但不同亚家族。

CYP79D1和CYP79D2中的血红素结合基元是 TF STGRRGCV A(CYP79D1的第470-480位残基)，相比于A型P450(Durst等人，Drug MetabolDrug Interac，12：189-206，1995)的共有序列PFGXGRRXCXG包含3个氨基酸替代。在CYP79A1中也发现了下划线所示替代，而CYP79D1和CYP79D2血红素结合基元中的第一个T在CYP79A1、CYP79B1、和CYP79B2中是S。因而，与先前提出的CYP79家族中存在独有的血红素结合序列结构域是抵触的。在CYP79D1和CYP79D2中还找到了另一独特序列结构域PERH(CYP79D1的第450-453位残基)，其中有人提出H是CYP79家族特异的。

为了测定CYP79D1和CYP79D2的拷贝数，对木薯栽培载培品种MCol22的基因组DNA进行Southern印迹。如Chen等人在《MaizeHandbook》(玉米手册，Freeling等人编，Springer Verlag，纽约，1994)中所述，由木薯栽培载培品种MCol22的叶片纯化基因组DNA。将DNA在Genomic-tip 100/G(Qiagen，德国)上进一步纯化，用消化酶消化，并在0.6％琼脂糖凝胶(1×TAE)上电泳(10μg DNA/泳道)。将凝胶转至尼龙膜(Boehringer，曼海姆，德国)，并于68℃与放射性标记的CYP79D1或CYP79D2克隆进行杂交。杂交后，将滤膜用2×SSC、0.1％SDS于室温清洗两次，再用0.1×SSC、0.1％SDS于68℃清洗两次。使用Storm 840 phosphor imager即磷光体成像仪(MolecularDynamics，加州，美国)将放射性标记的条带显影。使用Random PrimedDNA Labeling Kit即随机引发DNA标记试剂盒(Boehringer，曼海姆，德国)用α-³³p-dCTP标记用于Southern杂交的探针。两种探针与Southern印迹上的不同条带发生杂交，证明MCol22基因组中存在这两种基因。基因之间的高度相似性导致微弱交叉杂交。低严谨度清洗(0.5×SSC、0.1％SDS，55℃)未揭示有CYP79D基因的其它拷贝。

实施例3：在巴斯德毕赤酵母中的重组表达

包含CYP79D1或CYP79D2的重组巴斯德毕赤酵母的构建是使用载体pPICZc(Invitrogen，荷兰)来实现的。该载体包含用于控制基因表达的甲醇诱导性AOX1启动子，并编码针对zeocin的抗性，用于实现CYP79D1或CYP79D2在巴斯德毕赤酵母野生型菌株X-33(Invitrogen，荷兰)中的胞内表达。将大肠杆菌菌株TOP10F’用于重组质粒的转化和增殖。

通过PCR导入XhoI位点，紧挨CYP79D1终止密码子的下游。用XhoI和BsmBI消化PCR产物，后一种酶切割于起始密码子ATG下游18bp处。用BstBI和XhoI消化pPICZc。使用由下列寡聚物退火而成的衔接头将载体和PCR产物连接起来：5’-CGAAACG ATGGCTATGAACGTCTCT-3’(SEQ ID NO：7；有义方向)和5’-TGGTAGAGACGTTCATAGC CATCGTTT-3’(SEQ ID NO：8)。衔接头一方面重建了CYP79D1的前18bp(下划线指示起始密码子)并导入了两个沉默突变，另一方面通过BstBI消化除去了一小段载体序列，从而像高度表达的AOX1基因产物一样正确安置CYP79D1起始密码子。以相似方式使用相同衔接头将CYP79D2克隆到pPICZc中，因为CYP79D1和CYP79D2编码序列的前24bp是相同的。

巴斯德毕赤酵母的转化是使用EasySelect Pichia expressionKit Version A即简易选择毕赤酵母表达试剂盒A型(Invitrogen，荷兰)依照制造商的指示进行电穿孔而实现的。通过在巴斯德毕赤酵母菌落上进行的PCR确认了CYP79D1或CYP79D2在zeocin抗性菌落中的存在。

将巴斯德毕赤酵母单菌落在25ml BMGY(1％酵母提取物、2％蛋白胨、0.1M KPi pH6.0、1.34％酵母氮碱、4×10^-5％生物素、1％甘油、100μg/ml zeocin)中于28℃、以220rpm培养大约22小时。通过于室温以1500g离心10分钟收获细胞，并接种装有300ml诱导培养基(即含1％甲醇代替甘油的BMGY)的2L带挡板烧瓶，OD₆₀₀达到0.5。将培养物于28℃以300rpm培养28小时，并在26小时后加入甲醇至0.5％。通过于4℃以3000g离心10分钟沉淀细胞，并用缓冲液A(50mM KPi pH7.9、1mM EDTA、5％甘油、2mM DTT、1mM苯甲基磺酰氟)清洗一次，然后在缓冲液A中重悬至OD₆₀₀达到130。加入等体积的经酸洗的玻璃珠，并通过涡旋(8×30sec、4℃并立即在冰上冷却)破碎细胞。将裂解物于4℃以12000g离心10分钟，以除去细胞碎片，并将得到的上清液于4℃以165000g离心1小时，以回收微粒体沉淀。将微粒体重悬于缓冲液A，保存于-80℃，临使用前在冰上解冻。

由重组酵母细胞将L-缬氨酸转变成相应肟的能力证明，CYP79D1和CYP79D2在巴斯德毕赤酵母中进行功能性表达。使用仅用载体转化的巴斯德毕赤酵母细胞不发生转变。在完整细胞中测量到代谢活性，证明巴斯德毕赤酵母内源还原酶系统能够支持将电子供给这些植物P450。由将L-缬氨酸积极转变成缬氨酸肟的细胞制备的微粒体的SDS-PAGE显示，存在对应于CYP79D1 cDNA克隆预期分子量62kDa而迁移的其它多肽条带。

关于完整巴斯德毕赤酵母细胞中的CYP79D1活性，通过在丰富培养基中的培养和在OD 0.5时诱导24-30小时而获得了最佳结果。每升培养物生成15-30nmol微粒体CYP79D1。诱导90小时后微粒体CYP79D1的产量是24小时后获得的50％。

实施例4：重组CYP79D1的纯化

除非另外申名，所有步骤都是在4℃进行的。通过一氧化碳差异光谱学、SDS-PAGE、和活性测量来鉴定含CYP79D1级分。

以巴斯德毕赤酵母微粒体作为起始材料，以TX-114相分配(Bordier，J Biol Chem，256：1604-1607，1981；Werck-Reichhart等人，Anal Biochem，197：125-131，1991)作为纯化第一步，分离重组CYP79D1。相分配混合物包含微粒体蛋白质(4mg/ml)、50mM KPipH7.9、1mM DTT、30％甘油、和1％TX-114。于4℃搅动30分钟后，通过温度变化和于22℃以24500g离心25分钟来实现相分离。收集微红的富含TX-114的上层相，并用1％TX-114再次抽提TX-114较少的下层相。合并富含相，并用缓冲液B(10mM KPi pH7.9、2mM DTT)稀释至TX-114浓度低于0.2％。以流速25ml/h将TX-114富含相应用于串联的DEAE-Sepharose FF(Pharmacia，瑞典)的2.6×2.8cm柱和ReactiveRed120琼脂糖(Sigma，密苏里州，美国)的1.6×3cm柱。两种柱子都是用缓冲液C(10mM KPi pH7.9、10％甘油、0.2％TX-114、2mM DTT)平衡的。加样后，用缓冲液C彻底(过夜)清洗柱子。CYP79D1在这些条件下不结合到离子交换柱上，通过梯度洗脱(50ml溶于缓冲液C的0-1.5M KCl)由Reactive Red120琼脂糖洗脱。合并包含相当纯的CYP79D1的级分，在缓冲液C中透析过夜，并应用于用缓冲液C平衡的Reactive Yellow 3A琼脂糖(Sigma，密苏里州，美国)。用缓冲液C清洗柱子，并通过梯度洗脱(50ml溶于缓冲液的0-1.5M KCl)获得CYP79D1。合并包含均质CYP79D1的级分，并在缓冲液D(10mM KPipH7.9、10％甘油、50mM NaCl、2mM DTT)中透析2小时以减少盐和去污剂。将CYP79D1分装保存于-80℃。

使用高Tris线性8-25％梯度凝胶(Fling等人，Anal Biochem，155：83-88，1986)进行SDS-PAGE。在SLM Aminco DW-2000 TM分光光度计(Spectronic Instruments，纽约，美国)上通过一氧化碳差异光谱学对总P450定量，还原型P450和一氧化碳之间的加合物的摩尔消光系数为91mM^-1cm^-1(Omura等人，J Biol Chem，249：5019-5026，1964)。依照Jefcoate的方法(Jefcote，Methods Enzymol，27：258-279，1978)记录50mM KPi pH7.9、50mM NaCl中的底物结合光谱。

纯化的CYP79D1以62kDa分子量迁移。分离流程的总产量是17％，即由260ml培养物获得1nmol CYP79D1。在进行CO差异光谱学时，始终在448nm产生吸收最大值。无论是使用分离的还是粗制的级分，在420nm都没有观察到最大值。这证明CYP79D1是相当稳定的蛋白质。酵母细胞色素可能干预粗制提取物的光谱学，并掩藏420nm小峰，而且先前已经报导了巴斯德毕赤酵母细胞色素氧化酶会妨碍P450光谱学。在本发明的研究中，CYP79D1的表达水平是高的，而且由细胞色素氧化酶产生的CO差异光谱(最大值在430nm，最小值在445nm)是明显的，为450nm峰上的肩。巴斯德毕赤酵母细胞色素氧化酶结合DEAE柱，因而在P450分离过程中被除去。延长巴斯德毕赤酵母的培养时间(90小时)后，细胞色素氧化酶的含量降低，从而可以在微粒体中检测到较低量的P450。最后，可以通过在硼酸盐缓冲液中进行的TX-114相分配由P450除去干扰性细胞色素氧化酶。在硼酸盐缓冲液中相分配后，P450分配至TX-114贫乏相，而巴斯德毕赤酵母细胞色素氧化酶分配至富含相。

纯化的CYP79D1在存在L-缬氨酸时形成I型底物结合光谱，即在结合底物后44％由低自旋状态转变成高自旋状态。

实施例5：催化活性的测定

重建分离的重组CYP79D1，并在体外使用含2.5pmol CYP79D1、0.05U NADPH P450氧化还原酶(Benveniste等人，Biochem J，235：365-373，1986)、10.6mM L-α-二油酰磷脂酰胆碱、0.35μCi[U-¹⁴C]-L-氨基酸(L-Val、L-Ile、L-Leu、L-Tyr、或L-Phe；Amersham，瑞典)、1mM NADPH、0.1M NaCl、和20mM KPi pH7.9的总体积30μl的反应混合液测定其催化活性。在含¹⁴C-L-缬氨酸或¹⁴C-L-异亮氨酸的测定法中，加入了不同量的未标记L和D-氨基酸(0-6mM)。于30℃保温10分钟后，用60μl乙酸乙酯萃取形成的产物，并在TLC片(MerckKieselgel 60F₂₅₄)上分离，其中使用正戊烷/二乙醚(50∶50，v/v)或甲苯/乙酸乙酯(5∶1，v/v)分别作为脂肪族化合物和芳香族化合物的洗脱液。将¹⁴C标记的肟显影，并使用Storm 840磷光体成像仪(Molecular Dynamics，加州，美国)定量。另外在上文所述相同条件下在存在抑制剂tetcyclasis、ABT、和DPI时测量CYP79D1的活性。

为了进行体外活性测定法，沉淀200μl巴斯德毕赤酵母细胞，并重悬于100μl 50mM Tricine pH7.9和0.35μCi[U-¹⁴C]-L-缬氨酸或L-异亮氨酸。于30℃保温30分钟后，用乙酸乙酯萃取细胞，并如上所述分析形成的产物。

在存在大量脂质L-α-二油酰磷脂酰胆碱和100mM NaCl时用高粱NADPH-P450氧化还原酶重建CYP79D1。对在植物中用作含氰苷生物合成前体的五种蛋白质氨基酸测试作为CYP79D1的底物的情况。由L-缬氨酸或L-异亮氨酸形成了相应的肟。在使用L-亮氨酸、L-苯丙氨酸、或L-酪氨酸作为底物时，在检测水平等于用L-缬氨酸观察到的代谢的0.8％的情况下没有明显的代谢。观察到的底物特异性符合木薯体内只存在由L-缬氨酸和L-异亮氨酸衍生的含氰苷的现象。

为了检查抑制剂对分离CYP79D1的影响，使用与木薯微粒体相同的条件在存在tetcyclasis、ABT、和DPI时进行重建。使用分离CYP79D1观察到与木薯微粒体中相同的模式。CYP79D1受到tetcyclasis而非ABT的抑制。与木薯微粒体中的情况相似，DPI通过抑制NADPH-P450氧化还原酶而完全抑制缬氨酸-肟的形成。

在使用木薯微粒体时，以L-缬氨酸和L-异亮氨酸作为底物而产生氰化物，而使用D-缬氨酸和D-异亮氨酸时观察不到代谢。在使用L-缬氨酸时观察到与L-异亮氨酸相比更高的转变率，这与使用由变白的木薯幼苗制备的微粒体得到的数据是相似的。分离的CYP79D1由¹⁴C-L-缬氨酸产生¹⁴C标记的缬氨酸-肟。当通过加入未标记L-缬氨酸而将¹⁴C-L-缬氨酸底物的比活性降低120倍时，观察到¹⁴C标记的肟的形成量相应降低。然而，向保温混合物中加入未标记D-缬氨酸不引起¹⁴C标记肟的形成量的相应降低。因此，木薯微粒体与分离的CYP79D1都不能代谢D-缬氨酸。D-缬氨酸不能竞争L-缬氨酸说明D-缬氨酸不能以高亲和力结合CYP79D1的结合位点。使用¹⁴C-L-异亮氨酸、L-异亮氨酸、和D-异亮氨酸获得了相似结果。

在饱和底物条件下，CYP79D1在以L-缬氨酸作为底物时具有较高转变率。L-异亮氨酸的转变率是用L-缬氨酸观察到的值的大约60％。这与木薯体内亚麻苦苷相比于百脉根苷有更高积累的现象是一致的(4)。

实施例6：CYP79D1的N端测序

如Kahn等人，J Biol Chem，271：32944-32950，1996中所述，将分离的重组CYP79D1进行SDS-PAGE，并将蛋白质转至ProBlot膜(Applied Biosystems，加州，美国)。由膜上切下考马斯亮蓝染色的蛋白质条带，并在配备了联机120A型乙内酰苯硫脲氨基酸分析仪的Applied Biosystems 470A型测序仪上进行测序。在预计的Edman降解循环中，因Asn信号的缺乏而检测到Asn糖基化。

产生CO光谱且包含CYP79D1活性的级分总是在SDS-PAGE后产生两种独特的、靠近迁移的多肽条带。N端氨基酸测序鉴定得出两条带都衍生自CYP79D1。起始甲硫氨酸被酵母加工系统切除。上面那条带前15个残基的测序证明两个天冬酰胺都存在糖基化，而下面那条带只有第一个天冬酰胺发生糖基化。不同的糖基化模式解释了存在两条带的原因。CYP79D1 N端部分的糖基化与N端在易进行糖基化机制的内质网内腔中的定位是一致的。尚不知道在木薯中天然CYP79D1是否糖基化。然而，N端片段的氨基酸测序(15)证明，由高粱幼苗纯化的CYP79D1未糖基化，而且只有少数报导显示存在微粒体P450糖基化。认为在巴斯德毕赤酵母中表达重组CYP79D1后观察到的糖基化反映了酵母系统中的表达。

实施例7：实施例8和9中所用的引物

引物名称	核苷酸序列^a	SEQ ID NO：
引物名称	核苷酸序列^a	SEQ ID NO：	1F^b	GCGGAATTCGAYAAYCCIWSIAAYGC	13
1R^b	GCGGATCCGCIACRTGIGGIAHRTTRAA	14	1F^b	GCGGAATTCGAYAAYCCIWSIAAYGC	13
1R^b	GCGGATCCGCIACRTGIGGIAHRTTRAA	14	2F	GCGGAATTCWSIAAYGCIRTIGARTGG	15
2R	GCGGATCCRTTRAAIIINGCIACIGGRTG	16	2F	GCGGAATTCWSIAAYGCIRTIGARTGG	15
2R	GCGGATCCRTTRAAIIINGCIACIGGRTG	16	3F	GCGGAATTCCACACAGGAAACAGCTATGAC	17
3R^e	GCGGATCCAGACGAGTAGCGAGTCACAAC	18	3F	GCGGAATTCCACACAGGAAACAGCTATGAC	17
3R^e	GCGGATCCAGACGAGTAGCGAGTCACAAC	18	4R#1^f	GCGGATCCAAGAGGAACAGTACT	19
4R#2^f	GCGGATCCAAGAGGAACAATGTG	20	4R#1^f	GCGGATCCAAGAGGAACAGTACT	19
4R#2^f	GCGGATCCAAGAGGAACAATGTG	20	5F#1^f	GCGAATGCATTGCTCCCACTAGCC	21
5R#1^f	GCGATGGTTATGAGTTCCATTTTG	22	5F#1^f	GCGAATGCATTGCTCCCACTAGCC	21
5R#1^f	GCGATGGTTATGAGTTCCATTTTG	22	6F#1(na)	GCGCATATGGAACTAATAACAATTCTT	23
6R	GCGAAGCTTATTAGAAGCTCTGGAGCAG	24	6F#1(na)	GCGCATATGGAACTAATAACAATTCTT	23
6R	GCGAAGCTTATTAGAAGCTCTGGAGCAG	24	6F#1(Δ(1-31)_17α(8aa))	GCGCATATGGCTCTGTTATTAGCAGTTTTTTTCC-TCTTCCTCTTCAAACAA	25
6F#1(Δ(1-52)_2E1(10aa))	GCGCATATGGCTCGTCAAGTTCATTCTTCTTGG-AATTTACCACCAGGCCCC	26	6F#1(Δ(1-31)_17α(8aa))	GCGCATATGGCTCTGTTATTAGCAGTTTTTTTCC-TCTTCCTCTTCAAACAA	25

^a以5′-3′方向显示序列。

^bF：正向引物，R：反向引物。

^e覆盖在两个克隆#1和#2中相同的序列。

^f覆盖两个克隆#1和#2的特异序列。

引物名称	限制性位点	编码的氨基酸	SEQ ID NO：
引物名称	限制性位点	编码的氨基酸	SEQ ID NO：	1F^b	EcoRI	DNPSNA^c	27
1R^b	BamHI	FNV/LpHVA^c	28	1F^b	EcoRI	DNPSNA^c	27
1R^b	BamHI	FNV/LpHVA^c	28	2F	EcoRI	SNAVEW^c	29
2R	BamHI	HPVAXFN^c	30	2F	EcoRI	SNAVEW^c	29
2R	BamHI	HPVAXFN^c	30	3F	EcoRI	d
3R^e	BamHI	VVTRYSS	31	3F	EcoRI	d
3R^e	BamHI	VVTRYSS	31	4R#1^f	BamHI	TVLFLL	32
4R#2^f	BamHI	ATLFLL	33	4R#1^f	BamHI	TVLFLL	32
4R#2^f	BamHI	ATLFLL	33	5F#1^f		g
5R#1^f		MELITI	34	5F#1^f		g
5R#1^f		MELITI	34	6F#1(na)	NdeI	MELITIL	35
6R	HindIII	LLQSF^*h	36	6F#1(na)	NdeI	MELITIL	35
6R	HindIII	LLQSF^*h	36	6F#1(Δ(1-31)_17α(8aa))	NdeI	MALLLAVFFLFLFKQ	37
6F#1(Δ(1-52)_2E1(10aa))	NdeI	MARQVHSSWNLPPGP	38	6F#1(Δ(1-31)_17α(8aa))	NdeI	MALLLAVFFLFLFKQ	37

^bF：正向引物，R：反向引物。

^c用于设计引物的氨基酸共有序列。

^dpcDNA2.1的特异引物，正好位于cDNA文库5’端插入位点的上游。

^e覆盖两个克隆#1和#2中相同的序列。

^f覆盖两个克隆#1和#2的特异序列。

^g#1中5’UTR的特异引物。

^h星号表示终止密码子。

实施例8：海韭菜CYP79基因的cDNA克隆

用于生成海韭菜CYP79同源物的cDNA片段的PCR方法

单向质粒cDNA文库是由InVitrogen(卡尔斯巴德，加州)使用包含lacZ启动子的表达载体pcDNA2.1由海韭菜的花和果实(分裂果)构建的。植物材料是在Southern Amager的Aflandshage在resund海滨收集的，立即在液氮中冷冻，并保存于-80℃。

根据衍生自S.bicolor的CYP79A1(GenEMBL U32624)、衍生自欧白芥的CYP79Bl(GenEMBL AF069494)、衍生自拟南芥的CYP79B2、和衍生自木薯(Manihot esculenta)的CYP79D1(GenEMBL AF140613)的PCR片段中的保守氨基酸序列设计了简并PCR引物。在50μl总体积中使用100pmol每种引物、5％二甲亚砜、200μM dNTP、和2.5U Taq DNA聚合酶在PCR缓冲液(50mM KCl、10mM Tris-HCl pH8.8、1.5mM MgCl₂、0.1％Triton X-100)中进行两轮PCR扩增反应。热循环参数是：首先95℃2min；然后30个循环95℃5sec、45℃30sec、72℃45sec；最后72℃5min。第一轮PCR反应是使用引物1F和1R(实施例7)在100ng由cDNA文库制备的模板DNA或使用Nucleon Phytopure Plant DNAExtraction Kit(Amersham)制备的基因组DNA上进行的。使用QIAquickPCR Purification Kit即QIA快速PCR纯化试剂盒(Qiagen)纯化PCR产物，用30μl 10mM Tris-HCl pH8.5洗脱，并作为模板(1μl)用于第二轮PCR反应。第二轮PCR是使用衍生自cDNA和基因组DNA二者的PCR片段并使用简并引物2F和2R(实施例7)进行的。将一部分(5μl)PCR反应液应用于1.5％琼脂糖/TBE凝胶，并观察到以cDNA和基因组DNA二者作为模板的预期大小大约200bp的条带。使用QIAquick PCRPurification Kit即QIA快速PCR纯化试剂盒纯化剩余PCR反应液，并用30μl 10mM Tris-HCl pH8.5洗脱。用EcoRI和BamHI消化纯化的PCR片段(5μl)，由1.5％琼脂糖/TBE凝胶切下，使用QIAEX II AgaroseGel Extraction Kit即QIAEX II琼脂糖凝胶提取试剂盒(Qiagen)纯化，并连接到经EcoRI和BamHI消化的pBluescript II SK载体(Stratagene)中。使用Thermo Sequenase Fluorescent-labledPrimer cycle sequencing kit即耐热测序酶荧光标记引物循环测序试剂盒和7-脱氮dGTP(Amersham，瑞典)，将由cDNA文库衍生的7个克隆和由基因组DNA衍生的3个克隆测序(ALF Express，Pharmacia)。使用GCG Wisconsin Sequence Analysis Package即GCG威斯康星序列分析软件包中的程序进行序列分析。

由海韭菜的花和果实构建的质粒cDNA文库的筛选

cDNA和基因组DNA都产生与其它已知CYP79序列高度类似的相同PCR片段。将克隆的PCR片段作为模板，使用商品化的T3和T7引物通过PCR产生350bp洋地黄毒苷-11-dUTP标记的探针(TRI1)。将标记探针用于筛选pcDNA2.1 cDNA文库的660,000个菌落。于68℃在5×SSC(0.75M NaCl、75mM柠檬酸钠pH7.0)、0.1％N-肉桂酰肌氨酸、0.02％十二烷基磺酸钠、和1％封闭剂(Boehringer，曼海姆)中杂交过夜。将膜在高严谨度条件(65℃，0.1×SSC、0.1％十二烷基磺酸钠)下清洗两次，与抗洋地黄毒苷-AP一起保温，并依照Boehringer(曼海姆)的指示使用5-溴-4-氯-3-吲哚磷酸酯和氮蓝四唑显影。在相同条件下重筛选阳性菌落，并对阳性单菌落进行测序和分析。

设计用于筛选全长克隆的5’端探针的PCR方法

上文所述文库筛选产生了两个非常相似的部分克隆，称为#1和#2，它们的N端序列是不同的。为了由pcDNA2.1文库分离相应的全长克隆，使用上文所述相同PCR条件(只是将退火温度设成55℃)进行了两轮连续PCR反应。第一轮PCR反应是使用引物3F和3R(实施例7)进行的，并使用100ng cDNA文库作为模板。将第一轮PCR反应的纯化PCR产物(QIAquick PCR Purification Kit即QIA快速PCR纯化试剂盒)用作第二轮PCR反应的模板(1μl)，其中使用引物4R#1或4R#2和引物3F(实施例7)。将第二轮的PCR片段在2％琼脂糖/TBE上分开，由凝胶切下迁移最慢的条带，纯化(QIAE II Agarose Gel Extraction Kit即QIAE II琼脂糖凝胶提取试剂盒)，EcoRI和BamHI消化，克隆到pBluescript II SK中，并测序。使用引物4R#1和3F(实施例7)的第二轮PCR获得了具有位于EcoRI克隆位点下游26个氨基酸处的推定起始甲硫氨酸的PCR片段。使用引物4R#2和3F(实施例7)的第二轮PCR反应产生了长度与早就用TRI1探针分离的部分cDNA克隆完全一样的PCR片段。结果，将用4R#1和3F克隆的PCR片段作为模板，使用引物5F#1和5R#1(实施例7)产生洋地黄毒苷-11-dUTP标记的探针(TRI2)。使用上文所述相同条件，将部分覆盖克隆#1的5’非翻译区(UTR)和开放读码框5’末端的TRI2与TRI1探针一起用于筛选pcDNA2.1文库。第一份浸提物用TRI2进行杂交，第二份用TRI1杂交。在筛选了1,000,000个菌落后，分离得到长度与PCR片段完全一样的2个单独cDNA克隆。

结果

根据CYP79A1和属于CYP79家族的推定N-羟化酶的序列比对，设计了覆盖两个CYP79特异区域的4种简并寡核苷酸引物(实施例7中描述的1F、2F、1R、2R)，并用于以由海韭菜花和果实制备的基因组DNA和cDNA作为模板的嵌套PCR反应。由两种模板扩增到预期大小(即大约200bp)且在氨基酸水平显示与CYP79序列有62-70％同一性的PCR片段，对其克隆，并进一步用于筛选cDNA文库。分离得到两个cDNA克隆，称为#1和#2，并通过序列比较证实与CYP79家族分享高度序列同一性。使用克隆特异PCR引物，分离得到对应于#1的全长克隆。开放读码框编码分子量60.8kDa的蛋白质。克隆#1与克隆#2的全长序列的比较揭示，克隆#2的5’端短6bp，但是包含在相当于克隆#1指定为第26位氨基酸残基的位置处发现有克隆#1中未曾见到的甲硫氨酸密码子。这个甲硫氨酸密码子周围的序列不符合单子叶植物起始密码子的一般序列情况。因此最有可能的是克隆#2与全长相比缺乏6bp。

由克隆#1和#2编码的细胞色素P450显示与早就知道的CYP79家族成员有44-48％同一性(见下表)，因此鉴定成新的亚家族CYP79E的最早两个成员，称为CYP79E1(SEQ ID NO：9)和CYP79E2(SEQ ID NO：11)。CYP79E1与CYP79E2之间的序列同一性是94％。

表：CYP79家族的6个成员之间的同一性和相似性百分比

相似性同一性	CYP79E1 CYP79E2 CYP79A1 CYP79B1 ＿＿CY CYP79D1P79B2
相似性同一性	CYP79E1 CYP79E2 CYP79A1 CYP79B1 ＿＿CY CYP79D1P79B2	CYP79E1CYP79E2CYP79A1CYP79B1CYP79B2CYP79D1	95.2 61.7 58.1 58.9 60.094.1 61.5 57.6 58.5 59.248.8 48.8 65.5 67.1 65.844.9 44.9 51.3 92.3 65.144.5 44.6 52.6 89.3 67.346.4 46.5 51.5 49.1 50.7

实施例9：在大肠杆菌中的重组表达

表达构建物

将表达载体pSP19g10L用于在大肠杆菌中表达CYP79E1和CYP79E2构建物。该表达载体包含lacZ启动子并融合T7噬菌体基因10的短前导序列(g10L)，而且已经显示在大肠杆菌中有效表达异源蛋白(Olins等人，Methods Enzymol，185：115-119，1990)。在细胞色素P450的情况中，通过修饰开放读码框的5’端以提高A和T的含量(Stormo等人，Nucleic Acids Res，10：2971-2996，1982；Schauder等人，Gene，78：59-72，1989；Barnes等人，Proc Natl Acad Sci USA，88：5597-5601，1991)并通过用牛P45017α(Barnes等人，Proc NatlAcad Sci USA，88：5597-5601，1991)或人P4502E1或2D6(Gillam等人，Arch Biochem Biophys，312：59-66，1994；Gillam等人，Arch Biochem Biophys，319：540-550，1995)N端序列的密码子替代5’端的许多密码子，从而获得表达水平的升高。为了利用这些知识，构建了许多不同的构建物。

使用Pwo聚合酶(Boehinger，曼海姆)通过PCR产生了克隆#1的3种不同构建物，在起始密码子处导入NdeI限制性位点，紧挨终止密码子的后面导入HindIII限制性位点。使用引物6F#1(na)和6R#1(实施例1)合成了编码天然CYP79E1的全长构建物(CY79E1_na)，其在第3和5位密码子处引入了沉默突变以提高AT含量。使用引物6F#1(Δ(1-31)_{17 α(8aa)})和6R#1或引物6F#1(Δ(1-52)_2E1(10aa))和6R#1(实施例7)构建了2种截短构建物。构建物CYP79E1Δ(1-31)_17α(8aa)编码其中用P45017α(Halkier等人，Arch Biochem Biophys，322：369-377，1995；Barnes等人，Proc Natl Acad Sci USA，88：5597-5601，1991)的8个富含AT密码子替代天然5’序列的31个密码子的CYP79E1截短形式；在构建物CYP79E1Δ(1-52)_2E1(10aa)中，用P4502E1的10个富含AT密码子替代天然5’序列的前52个密码子，并在第53和55位密码子处导入沉默突变。用NdeI和HindIII消化PCR片段，并连接到经NdeI和HindIII消化的pSP19g10L表达载体(Barnes，Methods Enzymol，272：3-14，1996)中。将独有限制性位点NcoI和PmlI用于用cDNA克隆的类似片段替代PCR片段(1045bp)的中部。将构建物中衍生自PCR的剩余部分测序以排除PCR错误。

因为分离得到的CYP79E2克隆符合载体pcDNA2.1中lacZ基因的前24个密码子的读码框，所以作为第四种构建物测试这个克隆，称为CYP79E2_lacZ(24aa)。为了比较，还制备了等同的第五种构建物CYP79E1Δ(1-2)_lacZ(24aa)。

所有构建物都包含在最高度表达的大肠杆菌基因中发现的原始终止序列TAAT。使用载体pSP19g10L的所有构建物都除去了它们的3’UTR，因为据报导包含3’UTR会阻止或降低某些基因的表达。在基于pcDNA2.1的构建物中，保留了3’UTR。

在大肠杆菌中的表达

将所有表达构建物转化到大肠杆菌菌株JM109(Stratagene)和XL-1 blue(Stratagene)中。在所有情况中，JM109菌株证实是最有效的。

CYP79E1和CYP79E2包含19和17个在大肠杆菌基因中罕见的AGA或AGG精氨酸密码子。在密码子发生率与tRNA含量之间已建立了强阳性关联。因此，将克隆#1的天然和Δ(1-52)_2E1(10aa)构建物以及克隆#2的构建物与编码罕见精氨酸密码子tRNA基因的pSBET(Schenk等人，BioTechniques，19：196-200，1995)一起共转化到JM109中。将单菌落在LB培养基(50μg/ml氨苄青霉素)中于37℃以225rpm培养过夜，并用于接种100倍体积的修改后TB培养基(50μg/ml氨苄青霉素、1mM硫胺素、75μg/mlδ-氨基-乙酰丙酸、1mM异丙基-β-D-硫代半乳糖苷(IPTG))，于28℃以125rpm培养48小时。

表达水平和生物合成活性的测量

通过CO差异光谱学测定不同构建物的表达水平，并使用消光系数ε_450-490 91mM^-1cm^-1进行定量(Omura等人，J Biol Chem，239：2370-2378，1964)。使用100μl或500μl完整大肠杆菌细胞或者使用TritonX-114相分配的富含相测绘光谱，后者溶于50mM KH₂PO₄/K₂HPO₄ pH7.5、2mM EDTA、20％甘油、0.2％Triton X-100(总体积1ml)。为了制备用于体内研究的大肠杆菌，将1ml细胞培养物以7000g离心2分30秒，并重悬于100μl 50mM Tricine pH7.9、1mM苯甲基磺酰氟。对于体外研究，由表达克隆#1的天然或Δ(1-52)_2E1(10aa)构建物或克隆#2的构建物的大肠杆菌(JM109)细胞制备原生质球，然后如先前所述(Halkier等人，Arch Biochem Biophys，322：369-377，1995)温度诱导相分配(0.6％Triton X-114、30％甘油)。通过施用[U-¹⁴C]酪氨酸(0.35μCi，7.39μM)、对羟基苯乙醛肟(0或0.1mM)、或对羟基苯乙腈(0或0.1mM)以重悬100μl大肠杆菌细胞来进行体内催化活性的测量。在重建实验中使用相分配的富含相测量体外活性。标准反应混合物(总体积50μl)包含5μl富含相、0.375U S.bicolor NADPH-细胞色素P450氧化还原酶、5μl L-α-二肉桂酰磷脂酰胆碱(DLPC)、0.6mM NADPH、和14mM KH₂PO₄/K₂HPO₄ pH7.9。测试了下列底物：L-[U-¹⁴C]酪氨酸(0.20μCi、9.04μM)、L-[U-¹⁴C]苯丙氨酸(0.20μCi、8.8μM)、和L-3，4-二羟基苯基[3-¹⁴C]丙氨酸(0.20μCi、400μM)。还在包含纯化的CYP791E1(Kahn等人，Plant Physiol，115：1661-1670，1997；Bak等人，Plant Mol，36：393-405，1998)的重建实验中测试了L-[U-¹⁴C]酪氨酸(0.20μCi、9.04μM)。在摇动水浴中于30℃保温1小时，即在加入底物(体内实验)或NADPH(体外实验)后开始，在加入乙酸乙酯后终止。如先前所述(Mller等人，J Biol Chem，254：8575-8583，1979)使用薄层层析(TLC)分析，通过放射性产物的形成来监测生物合成活性，并使用Storm 840磷光体成像仪(MolecularDynamics，桑尼维尔，CA)进行检测和定量。在TLC应用前，用乙酸乙酯萃取样品。在此步骤中，过剩的放射性标记酪氨酸保持在水相，从而防止原点的过度曝光。将全部乙酸乙酯相应用于TLC板。在有些实验中，不可避免的携带少量水相导致原点出现酪氨酸条带。在TLC板上预先将未标记的参照化合物(对羟基苯乙醛肟、对羟基苯乙腈、和对羟基苯甲醛)划线，从而能够在紫外线下目视检测。

完整大肠杆菌细胞的一氧化碳结合光谱在450nm显示最大吸收，这是下列三种构建物形成功能性细胞色素P450的症候：CYP79E1_na、CYP79E1Δ(1-52)_2E1(10aa)、和CYP79E2_lacZ(24aa)。在进行或不进行pSBET共转化的情况下测绘光谱，但是在所有情况中细胞色素P450的含量低得不足以定量。为了获得精确测定，通过分离大肠杆菌原生质球，随后温度诱导Triton X-114相分配，由此富集细胞色素P450(Werck-Reichart等人，Anal Biochem，197：125-131，1991；Halkier等人，Arch BiochemBiophys，322：369-377，1995)。使用CYP79E2_lacZ(24aa)获得了最高表达水平(在JM109细胞中，48小时后)56nmol/L培养物。该水平与使用作为阳性对照的S.bicolor构建物CYP79A1Δ(1-33)_17α(8aa)(Halkier等人，Arch Biochem Biophys，322：369-377，1995)获得的表达水平62nmol/L培养物相当。具有经修饰的P45017αN末端的CYP79E1Δ(1-31)_17α(8aa)和空载体不展示任何可检测光谱。

实施例10：用CYP71E1重建CYP79E

使用来自两种物种S.bicolor和海韭菜的酶实现了含氰苷合成的膜相关途径的重建，导致对羟基扁桃腈即蜀黍苷的糖苷配基(体外视作对羟基苯甲醛)的形成。在包含酪氨酸、NADPH、NADPH-细胞色素P450氧化还原酶、CYP71E1、和CYP79E1或CYP79E2的重建实验中，积累了可观数量的对羟基苯乙腈和对羟基苯甲醛。

实施例11：实施例12和13中所有的引物

下列PCR引物是根据发现包含于GenBank编号AB010692中的CYP79A2的拟南芥Columbia载培品种基因组序列而设计的。下划线指示加入的限制性位点，斜体指示编码CYP17A的序列：

A2F1.......5′-GTG CATATGCTTGACTCCACCCCAATG-3′(SEQ ID NO：3)，

A2R1......5′-ATGCATTTTTCTAGTAATCTTTACGCTC-3′(SEQ ID NO：4)，

A2F2.......5′-CGT GAATTCCATATGCTCGCGTTTATTATAGGTTTGC-3′(SEQ ID NO：5)，

A2R2......5′-CGG AAGCTTATTAGGTTGGATACACATGT-3′(SEQ ID NO：6)，

A2R3......5′-CGTCACTTGTGCTTTGATCTCTTC-3′(SEQ ID NO：7)，

A2F3.......5′-GAACTAATGTTGGCGACGGTTGAT-3′(SEQ ID NO：8)，

A2FX1....5′-CGT GAATTCCATATGGCTCTGTTATTAGCAGTTTTTCTCGCGTTTATTATA-

GGTTTG-3′(SEQ ID NO：9)，

A2FX2....5′-CGT GAATTCCATATGGCTCTGTTATTAGCAGTTTTTCTTCTTCTTGCATTAAC-

TATG-3′(SEQ ID NO：10)，

A2R4......5′-CAT CTCGAGTCTTCTTCCACTGCTCTCCTT-3′(SEQ ID NO：11)，

A2FX3....5′-TTAATCGGAAACCTACC-3′(SEQ ID NO：12)；

另外，还使用了下列引物：

17AF.......5′-CGT GAATTCCATATGGCTCTGTTATTAGCTGTT-3′(SEQ ID NO：13)，

A1R........5′-GGGCCACGGCACGGGACC-3′(SEQ ID NO：14)，

实施例12：CYP79A2 cDNA的克隆

使用引物A2F1和A2R1在展现2.5×10⁷pfu拟南芥Wassilewskija载培品种长角果cDNA文库CD4-12(由Linda A.Castle博士和David W.Meinke博士惠赠，Department of Botany，Oklohoma StateUniversity，Stillwater，俄克拉荷马州，美国)的噬菌体DNA和ABRC上进行PCR。在含1.5mM MgCl₂的Expand HF缓冲液(Roche MolecularBiochemicals)中建立50μl总体积的PCR反应，其中添加了200μMdNTP、50pmol每种引物、和5％(v/v)DMSO。将反应液于97℃保温3分钟后，加入2.6U Expand High Fidelity PCR system即延伸高保真PCR系统(Roche Molecular Biochemicals)，并进行35个循环(95℃90sec、65℃60sec、70℃120sec)。取0.5μl反应液进行嵌套PCR，其中使用引物A2F2和A2R2以及相同PCR条件。由琼脂糖凝胶切下预期大小的PCR片段，克隆到经EcoRI和HindIII消化的pYX223(R&D Systems)中，并对衍生自两个嵌套PCR反应的10个克隆的插入片段进行测序。

使用Thermo Sequenase Fluorescent-labled Primer cyclesequencing kit即耐热测序酶荧光标记引物循环测序试剂盒(7-脱氮dGTP)(Amersham Pharmacia Biotech)进行测序，并在ALF-ExpressDNA Sequencer即ALF快速DNA测序仪(Amersham Pharmacia Biotech)上进行分析。使用GCG Wisconsin Sequence Analysis Package即GCG威斯康星序列分析软件包的程序进行序列计算机分析。以缺口生成罚分8和缺口延伸罚分2使用GAP程序来比较成对序列。使用NetPlantGene进行剪接位点预测。

CYP79A2是在拟南芥基因组中鉴定的几种CYP79同源物之一。依照计算机辅助剪接位点预测，它包含一个内含子，这是A型细胞色素P450的特征。虽然它是CYP79A2的唯一内含子，但是CYP79家族的其它成员具有一个或多个其它内含子。全长CYP79A2 cDNA的序列确认了这一剪接位点预测。CYP79A2 cDNA的读码框具有两个潜在ATG起始密码子，一个位于5’非翻译区中终止密码子下游15bp处，另一个位于更下游15bp处。对于所有进一步研究使用由第二个ATG密码子起始的cDNA。该cDNA编码523个氨基酸的蛋白质，它与参与含氰苷蜀黍苷生物合成的CYP79A1具有64％相似性和53％同一性。

实施例13：CYP79A2大肠杆菌表达构建物

表达构建物衍生自CYP79A2 cDNA，而后者是通过融合由拟南芥基因组DNA扩增的两个外显子而得到的。这两个外显子是通过PCR使用1.25U Pwo聚合酶(Roche Molecular Biochemicals)和4mg模板DNA扩增的，外显子1使用引物A2F2和A2R3，外显子2使用引物A2F3和A2R2。在含2mM MgSO₄的Pwo聚合酶PCR缓冲液(Roche MolecularBiochemicals)中建立50μl总体积的PCR反应，其中添加了200μMdNTP、50pmol每种引物、和5％(v/v)DMSO。将反应液于94℃保温3分钟后，进行30个PCR循环即94℃20sec、60℃10sec、72℃30sec。用EcoRI(外显子1)和HindIII(外显子2)消化PCR片段后，用T4多核苷酸激酶(New England Biolabs)将由引物A2R3和A2F3及Pwo聚合酶产生的平末端磷酸化。将两个外显子连接到经EcoRI和HindIII消化的载体pYX223中。对克隆的DNA测序以排除掺入PCR错误的可能性。

在表达载体pSP19g10L(Barnes，Meth Enzymol，272：3-14，1996)中构建了四个表达构建物：

●79A2(“天然”)，其中79A2指CYP79A2编码序列；

●17A_(1-8)79A2(“修饰”)，其中17A_(1-8)指经修饰的CYP17AN端，编码氨基酸序列MALLLAVF；

●17A_(1-8)79A2Δ(1-8)(“截短修饰”)，其中79A2Δ(1-8)指截去了第1-8位氨基酸的CYP79A2编码序列；和

●17A_(1-8)79A1_(25-74)79A2Δ(1-40)(“嵌合”)，其中79A1_(25-74)指CYP79A1的第25-74位氨基酸，79A2Δ(1-40)指截去了第1-40位氨基酸的CYP79A2编码序列。

CYP79A2的N端修饰设计成实现真核细胞色素P450在大肠杆菌中的高水平表达。构建了两个构建物，分别在CYP79A2(产生“修饰”CYP79A2)或截短型CYP79A2(产生“截短-修饰”CYP79A2)的N末端前面导入牛细胞色素P450 CYPl7A的8个N端氨基酸。这种细胞色素P450的N端似乎尤其适用于在大肠杆菌中表达。在第四种构建物(“嵌合”CYP79A2)中，将CYP79A1Δ(1-24)_bov(Halkier等人，Arch Biochem Biophys，322：369-377，1995)的N端57个氨基酸融合编码CYP79A2催化结构域(第41-523位氨基酸)的cDNA。

N端修饰是如下导入的：产生由CYP79A2 cDNA的ATG密码子至PstI位点的PCR片段。将这些片段连接CYP79A2 cDNA的PstI/HindIII片段和经EcoRI和HindIII消化的载体pYX223。为了得到修饰和截短修饰的CYP79A2，使用引物对A2FXl与A2R4以及A2FX2与A2R4。通过使用引物17AF与A1R由CYP79A1Δ(1-25)_bovcDNA(Halkier等人，Arch BiochemBiophys，322：369-377，1995)产生的PCR片段与使用引物A2FX3与A2R4由CYP79A2 cDNA产生的PCR片段的平端连接来进行与CYP79A1 N端的融合。对PCR产物进行克隆和测序，以排除掺入PCR错误的可能性。通过NdeI和HindIII消化由pYX223切下不同的CYP79A2 eDNA，并连接到经NdeI和HindIII消化的pSP19g10L中。

实施例14：大肠杆菌中的CYP79A2表达

将用实施例13中所述表达构建物转化的大肠杆菌菌株JM109的细胞在添加100μg/ml氨苄青霉素的LB培养基中培养过夜，并用于接种100ml含50μg/ml氨苄青霉素、1mM硫胺素、75μg/mlδ-氨基-乙酰丙酸、和1mM异丙基-β-D-硫代半乳糖苷的修改后TB培养基。将细胞于28℃以125rpm培养65小时。取75ml培养物沉淀细胞，并重悬于由0.1MTris HCl pH7.6、0.5mM EDTA、250mM蔗糖、和250μM苯甲基磺酰氟组成的缓冲液。加入溶菌酶至终浓度100μg/ml。于4℃保温30分钟后，加入乙酸镁至终浓度10mM。沉淀原生质球，重悬于5ml由10mMTris-HCl pH7.5、14mM乙酸镁、和60mM乙酸钾pH7.4组成的缓冲液，并在Potter-Elvehjem中匀浆。DNA酶和RNA酶处理后，加入甘油至终浓度29％。如Halkier等人，Arch Biochem Biophys，322：369-377，1995中所述，进行温度诱导的Triton X-114相分配。通过SDS-PAGE分析Triton X-114富含相。

对重悬浮于900μl含50mM KPi pH7.5、2mM EDTA、20％(v/v)甘油、0.2％(v/v)Triton X-114、和少许连二亚硫酸钠颗粒的缓冲液的100μl大肠杆菌原生质球进行Fe²⁺·CO与Fe²⁺差异光谱学(Omura等人，J Biol Chem，239：2370-2378，1964)。将悬浮液分到两个比色杯中，并在SLM Aminco DW-2000 TM分光光度计(SLM Instruments，乌尔班纳，伊利诺伊州)上记录400和500nm之间的基线。向样品比色杯中通入CO 1分钟，并记录差异光谱。根据消光系数91mmol^-1cm^-1评估功能性细胞色素P450的量。

如Sibbesen等人，J Biol Chem，270：3506-3511，1995中所述，在用由Sorghum bicolor(L.)Moench纯化的NADPH：细胞色素P450氧化还原酶重建的大肠杆菌原生质球中测量CYP79A2的活性。在典型的酶测定法中，将5μl原生质球和4μl NADPH：细胞色素P450还原酶(相当于0.04U，定义为1μmol细胞色素c min^-1)与3.3μM L-[U-¹⁴C]苯丙氨酸(453mCi mmol^-1)一起在含30mM KPi pH7.5、4mM NADPH、3mM还原型谷胱甘肽、0.042％(v/v)吐温80、和1mg/ml L-α-二肉桂酰磷脂酰胆碱的总体积30μl的缓冲液中保温。为了研究底物特异性，分别使用3.7μM L-[U-¹⁴C]酪氨酸(449mCi mmol^-1)、0.1mM L-[甲基-¹⁴C]甲硫氨酸(56mCi mmol^-1)、和1mM L-[5-³H]色氨酸(33Ci mmol^-1)代替L-[U-¹⁴C]苯丙氨酸。于26℃保温4小时后，取一半反应混合物通过薄层层析在硅胶60 F₂₅₄片(Merck)上进行分析，其中使用甲苯：乙酸乙酯(5∶1，v/v)作为洗脱液。通过Storm840磷光体成像仪(MolecularDynamics，桑尼维尔，加州)对¹⁴C放射性条带进行显影和定量。通过放射自显影将³H放射性条带显影。由时间点30分钟、1小时、2小时、和6小时的测定显示，保温过程的前两个小时内由L-[U-¹⁴C]苯丙氨酸开始的产物形成随时间是线性的。为了评估Km和Vmax值，将反应混合物于26℃保温2小时。为了进行GC-MS分析，将含33μM L-苯丙氨酸(Sigma)或33μM高苯丙氨酸的450μl反应混合物于26℃保温4小时，并用总体积600μl的氯仿抽提两次。合并有机相并蒸发至干燥。将残余物溶于15μl氯仿，并通过GC-MS进行分析。GC-MS分析是在直接偶联Jeol JMS-AX505W质谱仪的HP5890系列II气相层析仪上进行的。使用SGE柱(BPX5，25m×0.25mm，0.25μm薄膜厚度)(上部压力100kPa，无隙注射)。炉温程序如下：80℃3min，80-180℃5℃/min，180-300℃20℃/min，300℃10min。以E1模式(70eV)于200℃运行离子源。苯乙醛肟(E)-和(Z)-异构体的停留时间分别是12.43分和13.06分。两种异构体具有相同的断裂模式，以m/z 135、117、和91为最突出的峰。

在由包含“天然”、“截短-修饰”、和“嵌合”CYP79A2的表达构建物的大肠杆菌原生质球的温度诱导Triton X-114相分配获得的去污剂富含相中检测到在SDS-PAGE上以表观分子量大约60kDa迁移的蛋白质条带。正如预期的，“嵌合”CYP79A2以略高于“天然”和“截短-修饰”CYP79A2的分子量进行迁移。在包含“修饰”CYP79A2表达构建物或空载体的细胞的去污剂富含相中没有检测到条带。不同原生质球制剂的光谱分析显示，“嵌合”CYP79A2和较低程度的“截短-修饰”CYP79A2产生452nm特征峰的CO差异光谱，指示存在功能性细胞色素P450。在所有原生质球制剂中都发现了415nm峰。该峰可能来自由大肠杆菌衍生的血红素蛋白、在培养基中存在δ-氨基乙酰丙酸时产生的未附着血红素基团、或非功能性构象的细胞色素P450。根据452nm峰，估计“嵌合”CYP79A2的表达水平是每升培养物50nmol细胞色素P450。在与L-[¹⁴C]苯丙氨酸一起保温时，用“天然”、“截短-修饰”、或“嵌合”CYP79A2表达构建物转化并用由S.bicolor纯化的NADPH：细胞色素P450氧化还原酶重建的大肠杆菌原生质球产生两种放射性标记的化合物，它们在薄层层析中与苯乙醛肟的(E)-和(Z)-异构体共迁移。在包含含“修饰”CYP79A2表达构建物或空载体的大肠杆菌原生质球的测定混合物中没有检测到这些产物。GC-MS分析显示，在“嵌合”CYP79A2的反应混合物中存在具有相同断裂模式的这两种化合物，但是对照反应中没有。由停留时间和断裂模式将这些化合物鉴定为苯乙醛肟的(E)-和(Z)-异构体。对表达“天然”或“嵌合”CYP79A2的大肠杆菌原生质球施用L-[¹⁴C]酪氨酸、L-[¹⁴C]甲硫氨酸、或L-[³H]色氨酸并不引起可检测量的相应醛肟的生成。在表达“嵌合”CYP79A2的大肠杆菌原生质球中研究了CYP79A2代谢DL-高苯丙氨酸的能力。反应混合物的GC-MS分析显示不存在可检测量的高苯丙氨酸衍生醛肟。以L-[¹⁴C]苯丙氨酸作为底物，使用表达“天然”CYP79A2的大肠杆菌原生质球测定得到CYP79A2的Km值为6.7μmol L^-1，Vmax值为16.6pmol min^-1(mg蛋白质)-1。由于使用“天然”CYP79A2没有获得CO光谱，所以不可能估计功能性“天然”CYP79A2的量。然而，根据功能性“嵌合”CYP79A2的表达水平，可以估计“天然”CYP79A2的转换数是0.24min^-1。

CYP79A2的底物特异性似乎是相当窄的，因为L-酪氨酸、DL-高苯丙氨酸、L-色氨酸、和L-甲硫氨酸都不能被该酶代谢。高底物特异性符合由参与含氰苷生物合成的CYP79同源物获得的结果。重组CYP79A2的活性强烈依赖反应混合物的pH，在较低程度上依赖几个其它因素。与在pH7.5时的活性相比，“嵌合”CYP79A2的活性在pH6是25％，在pH6.5是50％，在pH7.0是80％，在pH7.9是70％。加入吐温80至终浓度0.083％(v/v)导致醛肟生成增加1.5倍。加入还原型谷胱甘肽至终浓度3mM会刺激醛肟生成，但程度较低。

实施例15：CYP79A2在转基因拟南芥中的组成性表达

将拟南芥Columbia载培品种用于所有的实验。在空调拟南芥箱(Percival AR-60 I，Boone，爱荷华州，美国)中以光合流量100-120μmol光子m^-2sec^-1、于20℃、和70％相对湿度培养植物。光照期对于用于转化的植物是12小时，对于用于生化分析的植物是8小时。

为了在拟南芥中在CaMV35S启动子的控制下表达CYP79A2，通过几个亚克隆步骤将天然全长CYP79A2 cDNA导入经EcoRI和KpnI消化的pRT101(Tpfer等人，Nucleic Acid Res，25：989-994，1994)中。通过花浸渍(Clough等人，Plant J，16：735-743，1998)，使用溶于10mM MgCl₂的0.005％(v/v)Silwet L-77和5％(w/v)蔗糖，将用该构建物转化的根癌土壤杆菌菌株C58(Zambryski等人，EMBO J，2：2143-2150，1983)用于植物转化。让种子在添加50μg/ml卡那霉素、2％(w/v)蔗糖、和0.9％(w/v)琼脂的MS培养基上发芽。两周后选择转化体并转移至土壤。

由6周龄植株(9株转基因植株和3株野生型植株)采集莲座叶(每株植物采5-8片不同龄的叶片)，立即在液氮中冷冻，并冻干48小时。如Srensen在《Canola and Rapeseed-Production，chemistry，nutrition and processing technology》(芸苔和油料种子：生成、化学、营养、和加工技术，Shahidi编，Van Nostrand Reinhold，纽约，第149-172页，1990)中所述，分析脱磺酸基芥子油苷。简而言之，取2-5mg冻干材料在3.5ml沸腾的70％(v/v)甲醇中通过Polytron匀浆器匀浆1分钟，加入10μl内部标准(5mM对羟基苯甲基芥子油苷；Bioraf，丹麦)，继续匀浆1分钟。沉淀植物材料，并将沉淀通过Polytron匀浆器用3.5ml沸腾的70％(v/v)甲醇再次抽提1分钟。沉淀植物材料，用3.5ml 70％(v/v)甲醇清洗，并离心。合并上清液，并上样至如下平衡的DEAE Sephadex A-25柱：取25mg DEAE Sephadex A-25在1ml 0.5M醋酸盐缓冲液pH5中溶胀过夜，装到5ml移液枪头中，并用1ml水清洗。将植物提取物上样，并用2ml 70％(v/v)甲醇、2ml水、和0.5ml 0.02M醋酸盐缓冲液pH5清洗柱子。应用Helix pomatia硫酸酯酶(H-1型，Sigma；0.1ml，2.5mg/ml，溶于0.02M醋酸盐缓冲液pH5)，并将柱子于室温静置16小时。用2ml水进行洗脱。将洗脱液真空干燥，将残余物溶于150μl水，并取100μl在配备了Supelcosil LC-ABZ 59142 C18柱(25cm×4.6mm，5mm；Supelco)和SPD-M10AVP光电二极管阵列检测器(Shimadzu)的Shimadzu LC-10A T vp上进行HPLC。流速是1ml/min。用水洗脱2分钟，随后是用溶于水的0-60％甲醇线性梯度(48分钟)、溶于水的60-100％甲醇线性梯度(3分钟)、和100％甲醇(3分钟)洗脱。峰的指定依据相比于标准化合物的停留时间和UV光谱。相对于内部标准并通过使用Buchner在《Glucosinolates in rapeseed：Analytical aspects》(油料种子中的芥子油苷：分析方面，Wathelet编，Martinus Nijhoff出版社，第50-58页，1987)中和Haughn等人，Plant Physiol，97：217-226，1991描述的应答因子，对芥子油苷定量。在莲座叶的分析中，术语“总芥子油苷含量”指占野生型拟南芥莲座叶中芥子油苷含量的85％的5种主要芥子油苷(4-甲基亚磺酰丁基芥子油苷、4-甲基硫代丁基芥子油苷、8-甲基亚磺酰辛基芥子油苷、吲哚-3-基甲基芥子油苷、和4-甲氧基吲哚-3-基芥子油苷)和苯甲基芥子油苷的摩尔量。分析由T1植株#10、#13、和#14收获的转基因种子的芥子油苷含量，并与野生型种子的芥子油苷含量进行比较。如上所述抽提12-30mg种子并进行HPLC分析，只是省略了组织冻干。在这种种子分析中，术语“总芥子油苷含量”指占野生型拟南芥种子中芥子油苷含量的90％以上的10种主要芥子油苷(3-羟基丙基芥子油苷、4-羟基丁基芥子油苷、4-甲基亚磺酰丁基芥子油苷、4-甲基硫代丁基芥子油苷、8-甲基亚磺酰辛基芥子油苷、7-甲基硫代庚基芥子油苷、8-甲基硫代辛基芥子油苷、吲哚-3-基甲基芥子油苷、3-苯甲酰氧基丙基芥子油苷、和4-苯甲酰氧基丁基芥子油苷)和苯甲基芥子油苷的摩尔量。

转基因植株的外观与野生型植株可比。在本研究中分析的所有转基因植株(T1代)都在莲座叶中积累苯甲基芥子油苷，而在同时培养的野生型植株中没有检测到苯甲基芥子油苷。只能在野生型拟南芥Columbia栽培品种的根和茎生叶中偶尔观察到苯甲基芥子油苷，而且可能被环境条件诱导。苯甲基芥子油苷的偶尔发生符合CYP79A2 mRNA是低丰度转录本的观察结果。通过Northern印迹和RT-PCR在拟南芥Columbia载培品种的幼苗、不同发育阶段的莲座叶、和茎生叶中未能检测到CYP79A2 mRNA。转基因植物中的苯甲基芥子油苷含量随不同植株而变化。在具有最高积累的3株植物中，苯甲基芥子油苷分别占中叶片总芥子油苷含量的38％(植株#10)、5％(植株#14)、和2％(植株#13)。已知拟南芥Columbia载培品种的种子包含由高苯丙氨酸衍生的2-苯基乙基芥子油苷，而在拟南芥从未报导过有苯甲基芥子油苷。然而，我们已经在拟南芥Columbia载培品种和Wassilewskija载培品种的种子中检测到微量的苯甲基芥子油苷。转基因植物种子的HPLC分析显示，苯甲基芥子油苷占种子总芥子油苷含量的35％(植株#10)、12％(植株#14)、32％(植株#13)。在野生型植株(Columbia载培品种和Wassilewskija载培品种)的种子中检测到微量的苯甲基芥子油苷(在Columbia载培品种中是每g鲜重0.034μmol，相当于总芥子油苷含量的0.05％)。正如几株转基因植物中苯甲基芥子油苷的高水平积累所指示的，苯乙醛肟的形成是拟南芥中苯甲基芥子油苷生物合成的限速步骤。与野生型植物相比，转基因植物的叶片和种子中由高苯丙氨酸衍生的2-苯基乙基芥子油苷的含量不受影响。这支持了用在大肠杆菌中表达的CYP79A2获得的数据，并显示CYP79A2可以将苯丙氨酸而非高苯丙氨酸特异转变成相应的醛肟。

已经在不同植物物种中研究了在芥子油苷生物合成中参与氨基酸转变成醛肟的酶的性质。有人提出，依赖细胞色素P450的单加氧酶的参与可能只限于不属于芸苔科的物种，暗示欧白芥中依赖细胞色素P450的对羟基苯乙醛肟形成被看成是这一规律或实验假象的唯一例外。然而，展示的数据指示，在芸苔科以及其它科的成员中由芳香族氨基酸开始的醛肟形成依赖细胞色素P450酶。

实施例16：组织化学GUS测定法对CYP79A2的表达分析

在用在GUS-内含子DNA序列之前包含CYP79A2启动子的构建物转化的转基因拟南芥中研究了CYP79A2启动子。由EMBL3基因组文库(拟南芥Columbia载培品种)分离一个包含CYP79A2基因的基因组克隆。由该阳性噬菌体的DNA切下由2.5kb上游序列和120bp CYP79A2编码区组成的SacI/XmaI片段(SEQ ID NO：15)。将片段插入pPZP111，其读码框符合包含GUS-内含子序列和35S终止子的pVictor IV S GiN(DaniscoBiotechnology，丹麦)的XbaI/SacI片段。通过17bp接头进行两个片段之间的融合。得到的转录本编码由与GUS蛋白质融合的CYP79A2膜锚定蛋白组成的融合蛋白。

通过组织化学GUS测定法分析不同发育阶段的转化体。在10日龄植株的下胚轴和叶柄的叶脉中观察到强烈染色。在子叶和叶片中没有看到染色，只是在排水器(hydathode)中观察到强烈染色。在3周龄的植株中，叶片的脉中度染色，而排水器强烈染色。在10日龄和3周龄植株的根中没有看到染色。在5周龄的植株中，没有检测到GUS活性。

实施例17：实施例18、19、21、和22中所用的拟南芥植物和引物

将拟南芥Columbia载培品种用于所有的实验。在空调拟南芥箱(Percival AR-60 I，Boone，爱荷华州，美国)中以光合流量100-120μmol光子m^-2sec^-1、于20℃、和70％相对湿度培养植物。光照期对用于转化的植物是12小时，对用于生化分析的植物是8小时。

下文实施例中提到的PCR引物序列如下：

T7 5′-AAT ACG ACT CAC TAT AG-3′(SEQ ID NO：57)，

EST3 5′-GCT AGG ATC CAT GTT GTA TAC CCA AG-3′

(SEQ ID NO：58)，

EST6 5′-CGG GCC CGT TTT CCG GTG GC-3′(SEQ ID NO：59)，

EST7A 5′-GGT CAC CAA AGG GAG TGA TCA CGC-3′(SEQ ID NO：60)，

5′“天然”有义 5′-ATC GTC AGT CGA CCA TAT GAA CAC TTT TAC CTC AAA

CTC TTC GG-3′(SEQ ID NO：61)，

5’“牛”有义 5′-ATC GTC AGT CGA CCA TAT GGC TCT GTT ATT AGC AGT

TTT TAC ATC GTC CTT TAG CAC CTT GTA TCT CC-3′

(SEQ ID NO：62)，

3’“末端”反义 5′-ACT GCT AGA ATT CGA CGT CAT TAC TTC ACC GTC GGG

TAG AGA TGC-3′(SEQ ID NO：62)，

CYP79B2.2 5′-GGA ATT CAT GAA CAC TTT TAC CTC A-3′

(SEQ ID NO：64)，

B2SB 5′-TTG TCT AGA TCA CTT CAC CGT CGG GTA-3′

(SEQ ID NO：65)，

B2AF 5′-GGC CTC GAG ATG AAC ACT TTT ACC TCA-3′

(SEQ ID NO：66)，

B2AB 5′-TTG GAA TTC CTT CAC CGT CGG GTA GAG-3′

(SEQ ID NO：67)，

XbaI 5′-GTA CCA TCT AGA TTC ATG TTT GTG TAT AGA G-3′

(SEQ ID NO：68)，

EST1 5′-TCC ATG TGC TCT ACA TCT-3′

(SEQ ID NO：72)，

EST2 5′-GAC GGA ACT CGT ATG TCC-3′

(SEQ ID NO：73)，

实施例18：CYP79B2和CYP79B5 cDNA的克隆和表达模式

与CYP79A1相比时，根据与S.bicolor CYP79A1的同源性鉴定的ESTT42902在5’端缺乏516bp。使用拟南芥λPRL2 cDNA文库(Newman等人，Plant Physiol，106：1241-1255，1994)作为模板以及T7和基因特异EST3引物，扩增了缺失5’端的255bp片段，随后通过扩增的载体序列中的EcoRI位点和通过引物EST3导入的BamHI位点进行克隆。将该片段作为模板，和引物EST6和EST7A一起，用于通过PCR扩增洋地黄毒苷-11-dUTP(DIG，Boehringer，曼海姆)标记的探针(DIG1)。依照制造商的指示(Boehringer，曼海姆)，用DIG1探针筛选λPRL2文库，其中于68℃在5×SSC、0.1％N-肉桂酰肌氨酸、0.02％SDS、1.2％(w/v)封闭剂(Boehringer，曼海姆)中杂交过夜，并于65℃用0.1×SSC、0.1％SDS进行严谨清洗两次各15分钟。依照制造商的指示(Boehringer，曼海姆)，通过氮蓝四唑的化学发光检测来进行阳性噬斑的检测。以255bp PCR片段作为探针(DIG1)筛选λPRL2文库，分离到编码CYP79B2的全长cDNA克隆。

EST T42902是根据与S.bicolor CYP79A1序列的同源性鉴定到的。使用来自俄亥俄州立大学拟南芥生物学研究中心的EST T42902作为模板以及引物EST1和EST2，扩增了240bp PCR片段。用洋地黄毒苷-11-dUTP(DIG，Boehringer，曼海姆)标记该PCR片段，并作为探针用于筛选蔓菁叶片的λZAP II cDNA文库(Clontech Lab.公司)。依照制造商的指示，用DIG探针筛选文库，于68℃在5×SSC、0.1％N-肉桂酰肌氨酸、0.02％SDS、1.2％(w/v)封闭剂(Boehringer，曼海姆)中杂交过夜，并于65℃用0.1×SSC、0.1％SDS进行严谨清洗两次各15分钟。依照制造商的指示(Boehringer，曼海姆)，通过氮蓝四唑的化学发光检测来进行阳性噬斑的检测。通过筛选文库分离到编码CYP79B5的全长cDNA克隆。

使用Thermo Sequence Fluorescent-labled Primer cyclesequencing kit即耐热测序酶荧光标记引物循环测序试剂盒(Amersham，瑞典)进行序列反应，并在ALF-Express automatedsequenator即ALF快速自动化测序仪(Pharmacia)上进行分析。使用GCG Wisconsin Sequence Analysis Package即GCG威斯康星序列分析软件包中的程序进行序列计算机分析和比对。

为了进行 Southern印迹分析，使用Nucleon Phytopure Plant DNAExtraction Kit(Amersham)由拟南芥叶片分离基因组DNA。取10μgDNA，用BamHI、XbaI、SspI、EcoRI、或EcoRV进行消化，并在0.8％琼脂糖凝胶上通过电泳进行分离。使用洋地黄毒苷标记的探针DIG1进行Southern印迹分析，并在高严谨条件(68℃，0.1×SSC、0.1％SDS，2×15分钟)下进行清洗。使用CDP-Star^TM(Tropix公司)通过化学发光检测使条带显影。

为了进行 Northern印迹分析，使用TRIzol流程(Gibco BRL)，由莲座叶、茎生叶、茎、花、和根以及发生创伤的莲座叶分离总RNA。取15μg总RNA，在1％变性甲醛/琼脂糖凝胶上进行分离，并印迹至带正电的尼龙膜(Boehringer)上。通过随机引发标记，生成覆盖CYP79B2完整编码区或拟南芥ACTIN-1的³²P标记探针。将滤膜于60℃在0.5％SDS、2×SSC、5×Denhardt氏液、20μg/ml超声处理鲑鱼精DNA中进行杂交，并于60℃用0.2×SSC、0.1％SDS洗去过量探针。在Storm 840磷光体成像仪上使放射性标记条带显影，并用ImageQuant分析软件定量。

根据其它CYP79基因中起始密码子的定位和双子叶植物中起始密码子周围最有可能的序列预测了起始密码子。在该起始密码子的5’端没有找到终止密码子。CYP79B2和CYP79B5的全长cDNA克隆分别编码长度为541个和540个氨基酸的61kDa多肽，它们与其它A型CYP79细胞色素高度同源(Nelson，Arch Biochem Biophys，369：1-10，1999)。特别感兴趣的是与欧白芥CYP79B1分别有93％和96％氨基酸同一性，与拟南芥CYP79B3有85％(85％)氨基酸同一性。CYP79B5与CYP79B2有94％同一。一般而言，CYP79B2和CYP79B5显示与CYP79家族其它已知成员有44-67％氨基酸同一性。使用DIG1探针的高严谨度 Southern印迹显示CYP79B2是单拷贝基因。在每条泳道中检测到1或2条主要条带。这是A型细胞色素P450的一般情况，而且与通过Arabidopsis GenomeSequencing Project即拟南芥基因组测序计划只鉴定了位于4号染色体上的单一匹配序列的事实有关。然而，位于2号染色体上且与几个其它细胞色素P450成簇的CYP79B3与CYP79B2在氨基酸水平上85％同一。因此，很有可能是CYP79B3催化相同反应。在Southern印迹的大多数泳道中检测到其它微弱条带。它们大概是由于与同源物诸如CYP79B3或假基因CYP79B4的杂交所致。在低严谨度条件下，每个泳道中存在多个条带，这指示拟南芥中存在多种CYP79序列。迄今为止，拟南芥基因组测序计划已经鉴定了7种CYP79同源物。

由多种拟南芥组织提取的RNA的 Northern分析测定的CYP79B2表达模式揭示在所检查的所有组织类型中均有表达。在根中发现了最高表达水平，在茎生叶中发现了最低水平；在莲座叶、茎、和花中发现了大致相等的量。根中的CYP79B2 mRNA水平比在莲座叶中发现的水平高大约3-4倍。在创伤后15分钟内可检测到2倍水平的诱导，在莲座叶中，在2小时后观察到这一现象。所述升高与CYP79B2参与吲哚芥子油苷生物合成是一致的。

实施例19：CYP79B2大肠杆菌表达构建物和活性测量

将使用5’“天然”有义引物或5’“牛”有义引物和3’“末端”反义引物的PCR分别用于生成用于表达的构建物“天然”和“Δ(1-9)_bov”。使用通过引物导入的AatII和NdeI限制性位点，将PCR片段克隆到经AatII和NdeI消化的pSP19g10L载体(Barnes，Meth Enzymol，272：3-14，1996)中，并进行测序以排除PCR错误。

天然构建物由CYP79B2的未修饰编码区组成，而Δ(1-9)_bov构建物除了用牛P45017α(17)的前8个密码子替代前8个密码子以外，还截去了9个氨基酸。牛修饰型显示导致细胞色素P450在大肠杆菌中的高水平表达。两种构建物都携带TAAT经修饰终止序列，以提高翻译终止效率(Tate等人，Biochem，31：2443-2450，1992)。

通过用来自Sorghum bicolor(L.)Moench的纯化NADPH：细胞色素P450还原酶重建表达CYP79B2的大肠杆菌的原生质球来测量CYP79B2的活性。如Sibbesen等人，J Biol Chem，270：3506-3511，1995所述，纯化S.bicolor的NADPH：细胞色素P450还原酶。向含100mM TricinepH7.9、10μg/μl DLPC(二肉桂酰磷脂酰胆碱)(超声处理2次各10秒钟)、4mM NADPH、3mM还原型谷胱甘肽(GSH)、5μl[3-¹⁴C]色氨酸(0.1μCi，比活56.5mCi/mmol)、和1U/μl纯化的NADPH：细胞色素P450还原酶的45μl反应混合物中加入5μl大肠杆菌原生质球，由此开始反应。将反应液于34℃保温30分钟，用乙酸乙酯抽提两次，通过TLC分析乙酸乙酯相，使用甲苯∶乙酸乙酯(5∶1)作为洗脱液。在Storm840磷光体成像仪(Molecular Dynamics)上使放射性标记条带显影，并用ImageQuant分析软件(Molecular Dynamics)定量。通过用¹⁴C标记的酪氨酸或苯丙氨酸替代¹⁴C标记的色氨酸来研究底物特异性。

采用GC-MS来确认重组CYP79B2由色氨酸生成的化合物的结构。将如上所述包含2mM未标记色氨酸的450μl反应混合物于34℃保温2小时。将反应混合物用300μl CHCl₃萃取两次，并冷冻至干燥。使用偶联Jeol JMS-AX505W质谱仪的HP5890系列II气相层析仪进行GC-MS。在SGE柱(BPX5，25mm×0.25mm，0.25μm薄膜厚度)上使用无隙注射和高差压力100kPa。如Rausch等人，J Chromatogr，318：95-102，1985所述，合成真实的吲哚-3-乙醛肟(IAOX)。

实施例20：大肠杆菌中的CYP79B2表达

将上文实施例19中所述表达构建物转化到大肠杆菌菌株C43(DE3)(Miroux等人，J Mol Biol，260：289-298，1996)中。将单菌落在含100μg/ml氨苄青霉素的LB培养基中于37℃培养过夜。取1ml过夜培养物用于接种75ml含100μg/ml氨苄青霉素、75μg/mlδ-氨基乙酰丙酸、1mM硫胺素、和1mM IPTG的TB培养基。将TB培养物28℃以125rpm培养44小时。如Halkier等人，Arch Biochem Biophys，322：369-377，1995所述制备大肠杆菌原生质球。

通过用由S.bicolor纯化的NADPH：细胞色素P450还原酶在DLPC微囊中重建大肠杆菌原生质球来进行活性测量。向包含表达天然或Δ(1-9)_bovCYP79B2构建物的大肠杆菌原生质球的反应混合物中施用[¹⁴C]色氨酸，导致生成在TLC上与真实IAOX标准物共迁移的强烈条带。通过GC-MS实现了这种化合物的明确化学鉴定即IAOX。包含用空载体转化的大肠杆菌原生质球的反应混合物中不积累IAOX。天然构建物给出最高水平的活性，因而在由这种构建物表达的重组CYP79B2上进行分析。这一活性显示依赖NADPH：细胞色素P450还原酶的加入，因为在向全细胞施用放射性标记的色氨酸时检测不到活性。这说明大肠杆菌内源电子供给系统黄素氧还蛋白：NADPH-黄素氧还蛋白还原酶不能将电子供给CYP79B2。在不存在NADPH时观察到少许活性，这最有可能是由于原生质球制剂中NADPH的残余量所致。加入1.5mM还原型谷胱甘肽(GSH)可将活性提高1.8倍。Km测定为21μM，Vmax测定为97.2pmol/h/μl原生质球。在向包含重组CYP79B2的反应混合物施用放射性标记的苯丙氨酸或酪氨酸时，没有检测到肟生成活性。这指示CYP79B2对色氨酸是特异的。

原生质球或原生质球的Triton X-114温度诱导相分配的富含相的CO差异光谱不显示450nm特征峰。另外，在将原生质球或其TritonX-114富含相在SDS-PAGE上分开并用考马斯亮蓝染色时，可以看到大约60kDa的新条带。这指示生成了很少的重组CYP79B2，并且CYP79B2是高度有活性的。

先前显示了中国甘蓝和拟南芥中的质膜酶系统通过过氧化物酶样酶(TrpOxe)催化由色氨酸形成IAOX。这一转变受到H₂O₂的刺激，在某些情况中还受MnCl₂和2，4-二氯苯酚的刺激。向CYP79B2重建测定法中加入100mM H₂O₂、1mM MnCl₂、或800μM 2，4-二氯苯酚分别将活性抑制96％、34％、和72％，而在联合时可抑制99％。这说明两种系统是不相同的，而且TrpOxE活性显然与CYP79B2不同。另外，在50mM Tricine缓冲液pH8.0中包含100mM H₂O₂、1mM MnCl₂、和800μM 2，4-二氯苯酚的非酶促反应混合物能够催化色氨酸转变成与IAOX共迁移的化合物，转变率是对CYP79B2所观察到的大约0.7％。这说明在氧化条件下可以发生色氨酸非酶促转变成IAOX。

实施例21：CYP79B2在拟南芥中的有义和反义表达

使用引物CYP79B2.2、B2SB、B2AF、和B2AB，以有义和反义方向，将CYP79B2 cDNA克隆到花椰菜花叶病毒35S(CaMV35S)启动子的后面。使用引物对CYP79B2.2/B2SB(有义构建物)和B2AF/B2AB(反义构建物)通过PCR扩增天然全长CYP79B2 cDNA。将有义构建物的PCR产物克隆到经EcoRI和XbaI消化的pRT101(Tpfer等人，Nucleic Acids Res，15：5890，1987)中并测序。将反义构建物的PCR产物克隆到经EcoRI和XboI消化的pBluescript(Stratagene)中，通过EcoRI和KpnI消化切下，连接到经EcoRI和KpnI消化的pRT101中并测序。通过PstI消化由pRT101切下有义和反义表达盒并转移至pPZP111(Hajdukiewicz等人，Plant Mol Biol，25：989-994，1994)。通过花浸渍方法(Clough等人，Plant J，16：735-743，1998)，使用溶于10mM MgCl₂的0.005％Silwet L-77和5％蔗糖，将用两种构建物之一转化的根癌土壤杆菌菌株C58(Zambryski等人，EMBO J，2：2143-2150，1983)用于转化拟南芥生态型Columbia。让种子在添加50μg/ml卡那霉素、2％蔗糖、和0.9％琼脂的MS培养基上发芽。两周后选择转化体并转移至土壤。

如Srensen在《Canola and Rapeseed-Production，chemistry，nutrition and processing technology》(芸苔和油料种子：生成、化学、营养、和加工技术，Shahidi编，第149-172页，1990，VanNostrand Reinhold，纽约)中所述，通过HPLC对具有改变CYP79B2表达水平的转基因拟南芥分析芥子油苷分布。通过在4ml 50％甲醇中煮沸2次各2分钟，由6-8周龄拟南芥的冻干莲座叶提取芥子油苷。将提取物应用于用1ml 0.5M KOAc pH5.0平衡并用1ml H₂O清洗两次的200μl DEAE Sephadex CL-6B柱(Pharmacia)。将流过物用1ml H₂O洗三次。将400μl 2.5mg/ml Helix pomatia硫酸酯酶(Sigma Aldrich)应用于柱子，密封并静置过夜。将得到的脱磺基芥子油苷(desulphoglucosinolate)用1ml H₂O洗脱两次，蒸发至干燥，并重悬于200μl H₂O。取一部分应用于配备了Supelco supelcosil LC-ABZ59142 C₁₈柱(25cm×4.6mm，5mm；Supelco)和SPD-M10AVP光电二极管阵列检测器(Shimadzu)的Shimadzu Spectachrom HPLC系统。流速是1ml/min。用水洗脱2分钟，随后用溶于水的0-60％甲醇线性梯度(48分钟)、溶于水的60-100％甲醇线性梯度(3分钟)、和100％甲醇(3分钟)洗脱。使用光电二极管阵列于229nm和260nm进行检测。根据应答系数和内部金莲葡糖硫苷标准物对脱磺基芥子油苷定量。

用35S启动子控制下的CYP79B2反义构建物转化的拟南芥植株具有野生型表型，而用35S启动子控制下的CYP79B2有义构建物转化的植株的大多数(大约80％)展示矮化。超过75％的有义植株不形成花序，而且不产生种子。其余有义植株像野生型植株一样，但是结籽一般较少。

过度表达CYP79B2植株的矮化表型可能是由于吲哚芥子油苷水平的升高所致。将酪氨酸转变成对羟基苯乙醛肟的CYP79A1在拟南芥中的过度表达，导致具有高含量的酪氨酸衍生对羟基苯甲基芥子油苷的矮化植株。由CYP79A1生成的对羟基苯乙醛肟被非常有效的引导成对羟基苯甲基芥子油苷。在过度表达CYP79B2的拟南芥中也可能发生相似有效的将IAOX引导至吲哚芥子油苷。然而，不能排除矮态表型是由于由IAOX生成的IAA水平升高，或由升高水平的吲哚芥子油苷降解生成的吲哚-3-乙腈所致。

转基因拟南芥T₁代的芥子油苷分布的HPLC分析显示，过度表达CYP79B2的植株积累比用空载体转化的对照植株更高数量的吲哚芥子油苷。两种最丰富的吲哚芥子油苷即芸苔葡糖硫苷和4-甲氧基芸苔葡糖硫苷的水平分别升高了大约5倍和2倍，而新芸苔葡糖硫苷(neoglucobrassicin)的水平没有显著升高。总芥子油苷含量因较高水平的吲哚芥子油苷而升高，但是脂肪族和芳香族(即无吲哚)芥子油苷的水平不受影响。在反义植株中，吲哚芥子油苷水平与对照植株相比没有降低。可能的解释是所用反义构建物未能充分下调CYP79B2。或者，根据同源性有可能催化相同反应的CYP79B3补偿了吲哚芥子油苷的下调。

实施例22：组织化学GUS测定法对CYP79B2的表达分析

使用DIG系统(Boehringer)，用能够与CYP79B2基因5’端退火的505bp洋地黄毒苷-11-dUTP标记探针筛选拟南芥生态型ColumbiaEMBL3基因组文库。探针杂交是于65℃在5×SSC、0.1％N-肉桂酰肌氨酸、0.02％SDS、和1％封闭剂中进行的。在检测前用0.1×SSC、0.1％SDS于65℃清洗滤膜。如Grossberger，Nucleic Acids Res，15：6737，1987所述，由阳性噬菌体纯化噬菌体DNA。将包含完整CYP79B2编码区和2361bp启动子区(参阅GenBank编号AL035708的第60536-62896位核苷酸，SEQ ID NO：16)的5kb EcoRI片段亚克隆到pBluescriptII SK(Stratagene)中。使用T7载体引物和XbaI引物(实施例17)通过PCR在紧挨CYP79B2起始密码子的下游导入了XbaI限制性位点。PCR反应在200μl总体积中在含2mM MgSO₄的Pwo聚合酶PCR缓冲液(Boehringer，曼海姆)中包含200μM dNTP、400pmol每种引物、0.1μg模板DNA、和10U Pwo聚合酶。将反应液于94℃保温5分钟后，进行23个PCR循环即94℃30sec、45℃30sec、72℃1.5min。用EcoRI和XbaI消化得到的PCR产物，克隆到pBluescript II SK中，并测序以排除PCR错误。最后，通过将来自CYP79B2启动子区的236ibpEcoRI-XbaI片段与来自pVictor IV S GiN(Danisco Biotechnology，丹麦)的XbaI-SalI片段(包含GUS内含子及35S终止子)一起连接到二元载体pPZP111中，构建了转化质粒pPZP111.p79B2-GUS。通过电穿孔(Wen-Jun等人，Nucleic Acid Res，17：8385，1983)将pPZP111.p79B2-GUS导入根癌土壤杆菌C58C1/pGV3850。通过花浸渍法(Clough等人，Plant J，16：735-743，1998)，使用溶于10mM MgCl₂的0.005％Silwet L-77和5％蔗糖，用根癌土壤杆菌C58C1/pGV3850/pPZP111.p79B2-GUS转化拟南芥生态型Columbia。让种子在添加50μg/ml卡那霉素、2％蔗糖、和0.9％琼脂的MS培养基上发芽。两周后选择转化体并转移至土壤。基本上如Martin等人在《GUSProtocols：Using the GUS Gene as a Reporter of Gene Expression》(GUS方案：将GUS基因用作基因表达的报告基因，Gallagher编，第23-43页，Academic出版公司)中所述对T₃植株进行组织化学GUS测定法，只是在染色前没有将组织在低聚甲醛中固定。将组织染色3小时。

在幼根和子叶中检测到最高水平的GUS表达。在幼莲座叶和成熟莲座叶中检测到一些表达，这主要与维管组织中的主要和次要叶脉有关。老叶片中的表达非常微弱。在长角果中，GUS于柱头表面和萼片附着处表达。在种子中检测不到GUS染色。物理损伤的1-2mm内发生非常强烈的GUS染色。

实施例23：实施例24和26中所用的引物

下列PCR引物是根据发现在GenBank编号AC006341中包含的CYP79F1的拟南芥基因组序列而设计的。

引物1..5′-CTCTAGATTCGAACATATGGCTAGCTTTACAACATCATTACC-3′(SEQ ID NO：3)，

引物2..5′-CGGGATCCTTAAGGACGGAACTTTGGATA-3′(SEQ ID NO：4)，

引物3..5′-AACTGCAGCATGATGAGCTTTACCACATC-3′(SEQ ID NO：5)，

引物4..5′-CGGGATCCTTAATGGTGGTGATGAGGACGGAACTTTGGATAA-3′(SEQ ID NO：6)，

引物5..5′-AAAGCTCAATGCGTAGAAT-3′(SEQ ID NO：7)，

引物6..5′-TTTTTAGACACCATCTTGTTTTCTTCTTC-3′(SEQ ID NO：8)，

引物7..5′-TGTAGCGGCGCATTAAGC-3′(SEQ ID NO：9)，

引物8..5′-CAAAAGAATAGACCGAGATAGGG-3′(SEQ ID NO：10)，

实施例24：CYP79F1大肠杆菌表达构建物

CYP79F1是在拟南芥基因组中鉴定的几种CYP79同源物之一。CYP79F1的推导氨基酸序列与CYP79F2的推导氨基酸序列具有88％同一性，与来自包含芥子油苷和含氰苷物种的其它CYP79同源物具有43-50％同一性。CYP79F1和CYP79F2位于相同染色体上，只相隔1638bp。这说明这两种基因是通过基因复制形成的，而且可能催化相似反应。由包含CYP79F1全长序列的EST ATTS5112(Arabidopsis BiologicalResource Center即拟南芥生物学资源中心，俄亥俄州，美国)衍生出表达构建物。使用引物1(有义方向)和引物2(反义方向)通过PCR该EST扩增CYP79F1编码区。引物1在起始密码子的上游导入了XbaI位点，在起始密码子处导入了NdeI位点。为了优化构建物用于在大肠杆菌中表达(Barnes等人，Proc Natl Acad Sci USA，88：5597-5601，1991)，引物1将第二个密码子由ATG改成GCT，并在第5位密码子处导入沉默突变。引物2紧挨终止密码子后面导入了BamHI限制性位点。使用2.5U Pwo聚合酶(Roche Molecular Biochemicals)、0.1μg模板DNA、200μM dNTP、和50pmol每种引物，在含2mM MgSO₄的Pwo聚合酶PCR缓冲液中建立总体积50μl的PCR反应。将反应液于94℃保温5分钟后，进行20个PCR循环即94℃15sec、58℃30sec、72℃2min。用XbaI和BamHI消化PCR片段，并连接到经XbaI和BamHI消化的载体pBluescript II SK(Stratagene)中。使用Thermo SequenaseFluorescent-labled Primer cycle sequencing kit即耐热测序酶荧光标记引物循环测序试剂盒(7-脱氮dGTP)(Amersham，瑞典)在ALF-Express sequenator即ALF快速测序仪(Pharmacia)上对cDNA测序以排除PCR错误，并由pBluecript II SK转移至经NdeI和BamHI消化的pSP19g10L表达载体(Barnes等人，Proc Natl Acad Sci USA，88：5597-5601，1991)中。

实施例25：大肠杆菌中的CYP79F1表达

将用该表达构建物转化的大肠杆菌菌株JM109(Stratagene)和C43(DE3)(Miroux等人，J Mol Biol，260：289-298，1996)的细胞在添加100μg/ml氨苄青霉素的LB中培养过夜，并用于接种40ml含50μg/ml氨苄青霉素、1mM硫胺素、75μg/mlδ-氨基-乙酰丙酸、1μg/ml氯霉素、和1mM异丙基-β-D-硫代半乳糖苷的修改后TB培养基。将培养物于28℃以125rpm培养60小时。沉淀细胞，并重悬于由0.2MTris HCl pH7.5、1mM EDTA、0.5M蔗糖、和0.5mM苯甲基磺酰氟组成的缓冲液。加入溶菌酶至终浓度100μg/ml。于4℃保温30分钟后，加入Mg(OAc)₂至终浓度10mM。沉淀原生质球，重悬于3.2ml由10mMTris-HCl pH7.5、14mM Mg(OAc)₂、和60mM KOAc pH7.4组成的缓冲液，并在Potter-Elvehjem匀浆器中匀浆。DNA酶处理后，加入甘油至终浓度30％。温度诱导的Triton X-114相分配形成了包含大部分细胞色素P450的去污剂富含相和去污剂贫乏相(Halkier等人，Arch BiochemBiophys，322：369-377，1995)。在SLM Aminco DW-2000 TM分光光度计(SLM Instruments，乌尔班纳，IL)上，使用于990μl含50mMKPi pH7.5、2mM EDTA、20％甘油、0.2％Triton X-100、和少许连二亚硫酸钠颗粒的缓冲液中的10μl Triton X-114富含相，通过Fe²⁺CO对Fe²⁺差异光谱学(Omura等人，J Biol Chem，239：2370-2378，1964)监测CYP79F1的功能性表达。

如Sibbesen等人，J Biol Chem，270：3506-3511，1995所述，在用由Sorghum bicolor(L.)Moench纯化的NADPH：细胞色素P450氧化还原酶重建的大肠杆菌原生质球中测量CYP79F1的活性。在典型的酶测定法中，将5μl原生质球和4μl NADPH：细胞色素P450还原酶(相当于0.04U，定义为1μmol细胞色素c min^-1)与底物一起在含30mM KPipH7.5、3mM NADPH、3mM还原型谷胱甘肽、0.042％吐温80、和1mg/mlL-α-二肉桂酰磷脂酰胆碱的总体积30μl的缓冲液中保温。在所有测定法中，将包含用空载体转化的大肠杆菌C43(DE3)原生质球的反应混合物用作对照。测试3.3μM L-[U-¹⁴C]苯丙氨酸(453mCi mmol^-1；Pharmacia)、3.7μM L-[U-¹⁴C]酪氨酸(449mCi mmol^-1；Pharmacia)、0.1mM L-[甲基-¹⁴C]甲硫氨酸(56mCi mmol^-1；Pharmacia)、和24μML-[侧链-3-¹⁴C]色氨酸(56.5mCi mmol^-1；NEN)作为潜在底物。于28℃保温1小时后，取一半反应混合物通过TLC在硅胶60 F₂₅₄片(Merck)上进行分析，使用甲苯∶乙酸乙酯(5∶1，v/v)作为洗脱液。通过Storm840磷光体成像仪(Pharmacia)对放射性标记的条带进行显影和定量。为了进行GC-MS分析，将分别含3.3mM L-甲硫氨酸(Sigma)、3.3mM DL-二高甲硫氨酸、3.3mM DL-三高甲硫氨酸的450μl反应混合物于25℃保温4小时，并用总体积600μl的CHCl₃抽提。合并有机相，蒸发，将残余物溶于15μl CHCl₃，并通过GC-MS进行分析。GC-MS分析是在直接偶联Jeol JMS-AX505W质谱仪的HP5890系列II气相层析仪上进行的。使用SGE柱(BPX5，25m×0.25mm，0.25μm薄膜厚度)(高差压力100kPa，无隙注射)。炉温程序如下：80℃3min，80-180℃5℃/min，180-300℃20℃/min，300℃10min。以E1模式(70eV)于200℃运行离子源。5-甲基硫代戊醛肟的(E)-和(Z)-异构体的停留时间分别是14.3分钟和14.8分钟。两种异构体具有相同的断裂模式，以m/z 130、129、113、82、61、和55作为最突出的峰。6-甲基硫代戊醛肟的(E)-和(Z)-异构体的停留时间分别是17.1分钟和17.6分钟。两种异构体具有相同的断裂模式，以m/z 144、143、98、96、69、61、和55作为最突出的峰。DL-二高甲硫氨酸、DL-三高甲硫氨酸、5-甲基硫代己醛肟、和6-甲基硫代己醛肟是如Dawson等人，J Biol Chem，268：27154-27159，1993所述合成的，并经过NMR光谱的鉴别。

对于在大肠杆菌菌株C43(DE3)中表达的CYP79F1而非在大肠杆菌菌株JM109中表达的CYP79F1获得了具有450nm特征峰的CO差异光谱。除了450nm的峰，还检测到了418nm的峰。

为了鉴定CYP79F1的底物，使用用S.bicolor的NADPH：细胞色素P450还原酶重建的大肠杆菌C43(DE3)原生质球进行活性测量。在将包含CYP79F1的反应混合物与DL-二高甲硫氨酸一起保温时，通过GC-MS检测到在对照反应中不存在的两种化合物。这些化合物的停留时间和质谱断裂模式与合成5-甲基硫代戊醛肟的E/Z-异构体是相同的。在向包含CYP79F1的反应混合物中施用DL-三高甲硫氨酸时，通过GC-MS检测到与合成6-甲基硫代戊醛肟E/Z-异构体具有相同停留时间和断裂模式的两种化合物。向包含重组CYP79F1的反应混合物施用L-甲硫氨酸、L-苯丙氨酸、L-酪氨酸、和L-色氨酸，不导致可检测量的相应醛肟的形成。

实施例26：CYP79F1 cDNA在转基因拟南芥中的表达

将拟南芥Columbia载培品种用于所有的实验。在空调拟南芥箱(Percival AR-60 I，Boone，爱荷华州，美国)中以光合流量100-200μmol光子m^-2sec^-1、于20℃、和70％相对湿度培养植物。除非另外申名，光照期对于用于转化的植物是12小时，对于用于生化分析的植物是8小时。

转基因植物的生成

为了构建在CaMV 35S启动子控制下表达CYP79F1 cDNA的植物(35S：CYP79F1植物)，使用引物3(有义方向)和引物4(反义方向)由EST ATTS5112(Arabidopsis Biological Resource Center即拟南芥生物学资源中心，俄亥俄州，美国)PCR扩增CYP79F1 cDNA。引物3以PstI限制性位点结尾。引物4在终止密码子前导入了4个编码His的密码子并在终止密码子后导入了BamHI限制性位点。用PstI和BamHI消化包含CYP79F1 cDNA的PCR片段，连接到经PstI和BamHI消化的载体pBluescript II SK中，并测序以排除PCR错误。通过连接到经PstI和BamHI消化的载体pSP48(Danisco Biotechnology，丹麦)，将CYP79F1cDNA置于CaMV 35S启动子控制之下。通过XbaI消化切下表达盒并转移至pPZP111(Hajdukiewicz等人，Plant Mol Biol，25：989-994，1994)中。通过花浸渍(Clough等人，Plant J，16：735-743，1998)，使用溶于10mM MgCl₂的0.005％Silwet L-77和5％蔗糖，将用该构建物转化的根癌土壤杆菌菌株C58(Zambryski等人，EMBO J，2：2143-2150，1983)用于植物转化。让种子在添加50μg/ml卡那霉素、2％蔗糖、和0.9％琼脂的MS培养基上发芽。两周后选择转化体并转移至土壤。

研究了9株35S：CYP79F1原代转化体。3株(S5、S7、S9)在形态上与野生型植株不同。这些植株的生长速率降低，但是在生长的第一个7周里表现正常。在花转换变得明显前，顶端优势减弱导致多个腋芽的生成，稍后发育成侧生花序。这些形态变化赋予S5、S7、和S9以茂密表型。另外，S5具有卷曲的莲座叶，叶尖向下弯曲。

因CYP79F1的共遏制或过度表达而脂肪族芥子油苷含量改变的转基因拟南芥植物具有特征性形态表型，其特征是营养生长延长和多个腋芽的生成。有人报导，拟南芥能够耐受导致芥子油苷含量升高2-5倍的CYP79家族细胞色素P450的过度表达，而植物外观没有相似变化。因此，形态变化似乎不可能是由特定芥子油苷的存在或缺乏引起的。可能的解释是，形态表型是由于由植物硫代谢受干扰引起的多效效应，其中甲硫氨酸发挥中枢作用。甲硫氨酸代谢的改变可以解释为什么共遏制和过度表达CYP79F1的植株与野生型植株相比显示相似形态变化。CYP79F1共遏制植株中形态变化在花转换时发作可能是由于需要甲硫氨酸来支持花的发育。或者，它与野生型植株中CYP79F1表达水平的升高一致。

植物提取物中芥子油苷含量的HPLC分析

由9株9周龄35S：CYP79F1原代转化体植株和10株7周龄野生型植株每株采集6-8片相同大小的莲座叶。将组织立即在液氮中冷冻，并冻干48小时。如下作为脱磺基芥子油苷分析芥子油苷：向9-20mg冻干材料中加入3.5ml沸腾的70％(v/v)甲醇、10μl内部标准(5mM对羟基苯甲基芥子油苷；Bioraf，丹麦)，并将样品在沸水浴中保温4分钟。沉淀植物材料，用3.5ml 70％(v/v)甲醇再次抽提沉淀，并离心。合并上清液，并在如wittstock等人，J Biol Chem，275：14659-14666，2000所述进行硫酸酯酶处理之后通过HPLC进行分析。峰的指定是基于相对于标准化合物的停留时间和UV光谱。相对于内部标准并通过应答因子(Haughn等人，Plant Physiol，97：217-226，1991；Buchner，在《Glucosinolates in rapeseed：Analytical aspects》(油料种子中的芥子油苷：分析方面)中，Wathelet编，Martinus Nijhoff出版社，波士顿，第155-181页，1987)的使用，对芥子油苷定量。术语“总芥子油苷含量”指占野生型拟南芥莲座叶中芥子油苷含量超过85％的7种主要芥子油苷(3-甲基亚硫酰丙基芥子油苷、4-甲基亚硫酰丁基芥子油苷、4-甲基硫代丁基芥子油苷、8-甲基亚硫酰辛基芥子油苷、吲哚-3-基甲基芥子油苷、4-甲氧基吲哚-3-基芥子油苷、和N-甲氧基吲哚-3-基芥子油苷)的摩尔量。

由二高甲硫氨酸衍生的芥子油苷即4-甲基亚硫酰芥子油苷和4-甲基硫代丁基芥子油苷占拟南芥叶片中总芥子油苷含量超过50％，而由三高甲硫氨酸衍生的芥子油苷只是叶片中的次要成份(总芥子油苷含量的2.1％)。因此，分析集中于4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷。

三株植株(S1、S7、S9)显示莲座叶中4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷水平显著降低，而两株植株(S3、S5)显示这些芥子油苷水平略微升高。在S7、S1、和S9中4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷含量分别降低至0.7、2.2、和2.8μmol/g dw，而在S3和S5中分别升高至12.3和13.3μmol/g dw，比较而言，野生型植株中的水平范围是5.7-11.5μmol/g dw。4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷的水平受到了相等的影响。既然认为由二高甲硫氨酸形成醛肟是在决定4-甲基亚硫酰丁基芥子油苷与4-甲基硫代丁基芥子油苷量之间的比例的次级修饰之前进行的，那么两种芥子油苷的总量应反映上游酶活性的改变。4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷水平的降低指示S1、S7、和S9中发生了CYP79F1共遏制。4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷水平在S3和S5中的微弱升高说明CYP79F1的表达水平升高。这说明长链甲硫氨酸是脂肪族芥子油苷生物合成中的限速步骤。然而，不能排除低水平积累可能是因T-DNA整合的位置效应而低水平表达转基因所致。

因为由二高甲硫氨酸衍生的芥子油苷是野生型莲座叶中的主要芥子油苷，所以这些芥子油苷水平的改变显著影响总芥子油苷含量。这在CYP79F1共遏制的植株中特别突出。这些植株的总芥子油苷含量范围是4.3-4.8μmol/g dw，比较而言，野生型植株的总芥子油苷含量范围是8.8-17.4μmol/g dw。除了4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷含量的变化，在35S：CYP79F1植株中还观察到其它芥子油苷水平的改变，特别是由甲硫氨酸衍生的芥子油苷。在4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷含量降低的植株中，由长链甲硫氨酸同源物衍生的其它主要芥子油苷(即3-甲基亚硫酰丙基芥子油苷和8-甲基亚硫酰辛基芥子油苷)的水平也降低。这可以解释为不仅CYP79F1转录本被共遏制，而且参与脂肪族芥子油苷生物合成的其它CYP79同源物的转录本(诸如与CYP79F1具有88％氨基酸同一性的CYP79F2的转录本)也被共遏制。或者，它可能反映CYP79F1对长链甲硫氨酸具有广泛的底物特异性。长链甲硫氨酸在CYP79F1共遏制植株中积累的事实指示催化长链甲硫氨酸的酶不受到长链产物的反馈抑制。三种吲哚芥子油苷的含量没有受到显著影响。

植物提取物中氨基酸含量的分析

使用3株12周龄35S：CYP79F1转化体原代植株和3株8周龄野生型植株的相同大小的莲座叶。将每株植株的250mg叶片材料在3ml 50mM KPipH7.5中用Plytron匀浆器进行匀浆。以20000g离心10分钟沉淀植物材料，并用3ml 50mM KPi pH7.5再次抽提两次。合并水相，真空干燥，并将残余物溶于100μl水。取一部分再次溶解的提取物用1/10体积的30％水杨磺酸(salicylic sulfonic acid)进行处理，并通过离心除去变性的蛋白质。用1/10体积的1N NaOH中和上清液。基本上依照制造商的洗脱程序，在Biochrom 20氨基酸分析仪(Pharmacia)上用Ultropac 8 Resin Reverse Phase HPLC柱(200×4.6mm)鉴定样品中的各蛋白质氨基酸并定量。

为了将植物材料中的二高甲硫氨酸定量，对样品进行由制造商推荐的程序略微改动的两种洗脱程序。程序1如下：53℃7分钟，缓冲液A；50℃35分钟，缓冲液A；95℃34分钟，缓冲液A。程序2如下：53℃7分钟，缓冲液A；58℃12分钟，缓冲液B；95℃25分钟，缓冲液C。缓冲液A是0.2M醋酸钠pH3.25，缓冲液B是0.2M醋酸钠，pH4.25，缓冲液C是1.2M醋酸钠，pH6.25。在程序1中，苯丙氨酸和二高甲硫氨酸于63.6分钟共洗脱。在程序2中，酪氨酸和二高甲硫氨酸于25.3分钟共洗脱。作为程序1中对应于苯丙氨酸和二高甲硫氨酸的峰面积与程序2中对应于苯丙氨酸的峰面积之间的差值，以及作为程序2中对应于酪氨酸和二高甲硫氨酸的峰面积与程序1中对应于酪氨酸的峰面积之间的差值来量化二高甲硫氨酸。使用真实标准物测定二高甲硫氨酸的应答系数。

为了将植物材料中的三高甲硫氨酸定量，也对样品进行由制造商推荐的程序略微改动的洗脱程序。程序3如下：53℃7分钟，缓冲液A；58℃5分钟，缓冲液B；95℃7分钟，缓冲液B；95℃25分钟，缓冲液C。三高甲硫氨酸于29.0分钟洗脱，并使用用真实标准物测定的应答系数，作为峰面积量化。

S7即芥子油苷含量降低最显著并具有强形态表型的35S：CYP79F1植株中，二高甲硫氨酸和三高甲硫氨酸含量的分析揭示了相比于野生型植株有50倍升高。三高甲硫氨酸积累至野生型植株中含量的4倍。在S9中观察到二高甲硫氨酸含量升高15倍，而没有检测到三高甲硫氨酸含量的升高。

RT-PCR的表达分析

为了检查由不同植物组织获得的RNA制剂中的成份对RT反应的抑制，使用由通过Scal消化线性化的pBluescript II SK载体(Stratagene)合成的对照RNA。在添加500μM rNTP、10mM DTT、100URNAsin Ribonuclease inhibitor即RNA酶抑制剂(Promega)、3μg线性化pBluescript II SK、和50U T3 RNA聚合酶(Promega)的Transcription Optimized Buffer即转录优化缓冲液(Promega)中建立总体积100μl的合成反应。于37℃保温2小时后，加入20U不含RNA酶的DNA酶，并将反应液于37℃继续保温1小时。酚和CHCl₃抽提及乙醇沉淀后，将RNA溶于用焦碳酸二乙酯处理过的水中。

由拟南芥采集下列组织：

(1)4周龄植株(以8小时光照/16小时黑暗培养)的总植物组织；

(2)莲座叶(不含叶柄)

(3)5周龄植株(花转换开始前；以8小时光照/16小时黑暗培养)的地上部分；

(4)莲座叶(不含叶柄)；和

(5)开花植株(9周龄；以12小时光照/12小时黑暗培养以诱导开花)的茎生叶。

使用TRIZOL试剂(GIBCO BRL)由所述组织分离总RNA。通过分光光度法对RNA定量，并用于合成第一条cDNA链。为了确保RT-PCR的线性，第一条cDNA链合成是在1μg、0.3μg、和0.1μg每种RNA集合上进行的。在添加0.5mM dNTP、10mM DTT、200ng随机六聚体(Pharmacia)、3pg对照RNA(内部标准物)、和200U SUPERSCRIPT II逆转录酶(GIBCOBRL)的First Strand Buffer即第一链缓冲液(GIBCO BRL)中(总体积20μl)合成cDNA。将反应混合液于27℃保温10分钟，随后于42℃保温50分钟，并于95℃灭活5分钟。通过PCR纯化试剂盒(QIAGEN；用50μl 1mM Tris缓冲液pH8进行洗脱)的手段纯化RT反应。取2μl纯化后的RT反应液进行PCR。在添加200μM dNTP、1.5mM MgCl₂、50pmol有义引物、50pmol反义引物、和2.5U Platinum Taq DNA聚合酶(GIBCOBRL)的PCR缓冲液(GIBCO BRL)中建立总体积50μl的PCR反应。PCR程序如下：94℃2min，32个循环的94℃30sec、57℃30sec、72℃50sec。取10μl PCR反应液在1％琼脂糖凝胶上通过凝胶电泳进行分析。通过溴化乙啶染色使条带显影，并在Gel Doc 2000Transilluminator(Biorad)上进行定量。用于分析CYP79F1转录本的引物是引物5(有义方向)和引物6(反义方向)。在57℃时，引物5不与包含CYP79F1基因的基因组DNA发生退火，因为引物5的序列与CYP79F1基因111bp内含子侧翼的序列互补。引物6与CYP79F1的3’非翻译区发生退火，而且对CYP79F1高度特异。用于分析内部标准物的引物是引物7(有义方向)和引物8(反义引物)。内部标准物的PCR分析显示RT反应与用不同量的、由不同植物组织分离的RNA制备的样品同样有效地进行。

在所有检查的组织中都检测到CYP79F1转录本。转录本水平随植株的突变而升高。9周龄开花植株莲座叶中的表达水平比5周龄植株莲座叶高大约4倍。在分析5周龄植株的地上部分时，检测到的CYP79F1转录本比相同植株的莲座叶少。这指示CYP79F1在莲座叶中的表达水平高于叶柄。

序列表

<110>Novartis AG

Royal Veterinary and Agricultural University

<120>CYP79家族的P450单加氧酶

<130>S-31292A

<140>

<141>

<150>EP 00100646.9

<151>2000-01-13

<150>EP 00107001.0

<151>2000-03-30

<150>EP 00109423.4

<151>2000-05-03

<150>EP 00114184.5

<151>2000-07-13

<150>EP 00114912.9

<151>2000-07-17

<160>85

<170>PatentIn Ver.2.1

<210>1

<211>542

<212>PRT

<213>木薯(Manihot esculenta)

<400>1

Met Ala Met Asn Val Ser Thr Thr Ile Gly Leu Leu Asn Ala Thr Ser

1 5 10 15

Phe Ala Ser Ser Ser Ser Ile Asn Thr Val Lys Ile Leu Phe Val Thr

20 25 30

Leu Phe Tle Ser Ile Val Ser Thr Ile Val Lys Leu Gln Lys Ser Ala

35 40 45

Ala Asn Lys Glu Gly Ser Lys Lys Leu Pro Leu Pro Pro Gly Pro Thr

50 55 60

Pro Trp Pro Leu Ile Gly Asn Ile Pro Glu Met Ile Arg Tyr Arg Pro

65 70 75 80

Thr Phe Arg Trp Ile His Gln Leu Met Lys Asp Met Asn Thr Asp Ile

85 90 95

Cys Leu Ile Arg Phe Gly Arg Thr Asn Phe Val Pro Ile Ser Cys Pro

100 105 110

Val Leu Ala Arg Glu Ile Leu Lys Lys Asn Asp Ala Ile Phe Ser Asn

115 120 125

Arg Pro Lys Thr Leu Ser Ala Lys Ser Met Ser Gly Gly Tyr Leu Thr

130 135 140

Thr Ile Val Val Pro Tyr Asn Asp Gln Trp Lys Lys Met Arg Lys Ile

145 150 155 160

Leu Thr Ser Glu Ile Ile Ser Pro Ala Arg His Lys Trp Leu His Asp

165 170 175

Lys Arg Ala Glu Glu Ala Asp Asn Leu Val Phe Tyr Ile His Asn Gln

180 185 190

Phe Lys Ala Asn Lys Asn Val Asn Leu Arg Thr Ala Thr Arg His Tyr

195 200 205

Gly Gly Asn Val Ile Arg Lys Met Val Phe Ser Lys Arg Tyr Phe Gly

210 215 220

Lys Gly Met Pro Asp Gly Gly Pro Gly Pro Glu Glu Ile Glu His Ile

225 230 235 240

Asp Ala Val Phe Thr Ala Leu Lys Tyr Leu Tyr Gly Phe Cys Ile Ser

245 250 255

Asp Phe Leu Pro Phe Leu Leu Gly Leu Asp Leu Asp Gly Gln Glu Lys

260 265 270

Phe Val Leu Asp Ala Asn Lys Thr Ile Arg Asp Tyr Gln Asn Pro Leu

275 280 285

Ile Asp Glu Arg Ile Gln Gln Trp Lys Ser Gly Glu Arg Lys Glu Met

290 295 300

Glu Asp Leu Leu Asp Val Phe Ile Thr Leu Lys Asp Ser Asp Gly Asn

305 310 315 320

Pro Leu Leu Thr Pro Asp Glu Ile Lys Asn Gln Ile Ala Glu Ile Met

325 330 335

Ile Ala Thr Val Asp Asn Pro Ser Asn Ala Ile Glu Trp Ala Met Gly

340 345 350

Glu Met Leu Asn Gln Pro Glu Ile Leu Lys Lys Ala Thr Glu Glu Leu

355 360 365

Asp Arg Val Val Gly Lys Asp Arg Leu Val Gln Glu Ser Asp Ile Pro

370 375 380

Asn Leu Asp Tyr Val Lys Ala Cys Ala Arg Glu Ala Phe Arg Leu His

385 390 395 400

Pro Val Ala His Phe Asn Val Pro His Val Ala Met Glu Asp Thr Val

405 410 415

Ile Gly Asp Tyr Phe Ile Pro Lys Gly Ser Trp Ala Val Leu Ser Arg

420 425 430

Tyr Gly Leu Gly Arg Asn Pro Lys Thr Trp Ser Asp Pro Leu Lys Tyr

435 440 445

Asp Pro Glu Arg His Met Asn Glu Gly Glu Val Val Leu Thr Glu His

450 455 460

Glu Leu Arg Phe Val Thr Phe Ser Thr Gly Arg Arg Gly Cys Val Ala

465 470 475 480

Ser Leu Leu Gly Ser Cys Met Thr Thr Met Leu Leu Ala Arg Met Leu

485 490 495

Gln Cys Phe Thr Trp Thr Pro Pro Ala ASn Val Ser Lys Ile Asp Leu

500 505 510

Ala Glu Thr Leu Asp Glu Leu Thr Pro Ala Thr Pro Ile Ser Ala Phe

515 520 525

Ala Lys Pro Arg Leu Ala Pro His Leu Tyr Pro Thr Ser Pro

530 535 540

<210>2

<211>1845

<212>DNA

<213>木薯(Manihot esculenta)

<400>2

gttcagggca tatcaatatg gccatgaacg tctccaccac catcggttta cttaacgcca 60

cctccttcgc ctcctcctcc tccatcaaca cggtcaagat cttgttcgtc accctcttta 120

tttccattgt tagtactatt gtaaaacttc aaaagagtgc tgctaacaag gaaggtagca 180

agaaactccc actccctcct ggccctactc catggccact catcggaaac atcccggaaa 240

tgatccggta cagacccacg tttcggtgga ttcaccaact catgaaggac atgaacactg 300

atatttgtct cattcgtttt ggaagaacta actttgttcc tataagctgt cctgttcttg 360

ctcgtgaaat actaaaaaag aatgacgcta tcttctctaa caggccaaag actctctctg 420

caaaatctat gagcggagga tacttgacaa ctattgtggt gccatacaat gaccaatgga 480

agaaaatgag gaagatctta acctcagaga tcatttctcc ggccagacac aaatggctcc 540

atgataaaag agctgaggag gctgataatc ttgtgttcta catccacaac cagttcaaag 600

caaataaaaa tgtgaatttg agaacagcca ccaggcatta cggcgggaat gtgatcagaa 660

aaatggtgtt cagcaagaga tacttcggca agggaatgcc ggacggagga ccagggcctg 720

aagaaatcga gcacattgat gccgttttca ctgccttgaa atacttgtat gggttttgca 780

tatcagattt cttgcctttc ttgttgggac ttgatctgga tggccaagaa aaatttgtgc 840

ttgatgcaaa taagaccata agggattatc agaacccttt aattgatgaa aggattcaac 900

aatggaagag tggtgaaagg aaggaaatgg aggacttgct tgatgttttc atcactctca 960

aggattcaga cggcaaccca ttgctcactc ctgacgagat caagaatcaa atagctgaaa 1020

ttatgatagc aacagtagat aacccatcaa acgcaatcga atgggcaatg ggggagatgc 1080

taaatcaacc agaaatcctg aagaaggcca cagaagagct cgacagggtg gtcggcaaag 1140

acaggcttgt tcaagaatcc gacatcccca accttgacta tgtcaaagcc tgtgcaagag 1200

aagccttcag gctccatcca gtagcacact tcaatgtccc tcatgtagcc atggaagaca 1260

ctgtcattgg tgattacttt attccaaagg gcagctgggc agttctcagc cgctatgggc 1320

tcggcaggaa cccaaagaca tggtctgatc ctctcaagta cgatccagaa aggcacatga 1380

acgagggaga ggtggtgctc actgagcacg agttaaggtt tgtgactttc agcactggaa 1440

gacgtggctg cgtagcttcg ttgcttggaa gctgcatgac gacgatgttg ctggcgagga 1500

tgctgcagtg cttcacttgg actccaccag ccaatgtttc caagattgat ctcgccgaga 1560

ctctagatga gcttactcct gcaacaccca tctctgcatt tgccaagcct cgcctggctc 1620

ctcatctcta cccaacgtca ccttgaaaga gagatcagat cttatcagtt cttagaacgt 1680

cctttaatta tgatttgcta aaaacaaata aaaatcattt ggttattgtg taggtaatct 1740

tacaagcttc ctgtttattg agagttgtta attaactctc aaaatgattt gtggggttat 1800

cttgtttctc ttgcaatata gttgctttac tagaaaaaaa aaaaa 1845

<210>3

<211>541

<212>PRT

<213>木薯(Manihot esculenta)

<400>3

Met Ala Met Asn Val Ser Thr Thr Ala Thr Thr Thr Ala Ser Phe Ala

1 5 10 15

Ser Thr Ser Ser Met Asn Asn Thr Ala Lys Ile Leu Leu Ile Thr Leu

20 25 30

Phe Ile Ser Ile Val Ser Thr Val Ile Lys Leu Gln Lys Arg Ala Ser

35 40 45

Tyr Lys Lys Ala Ser Lys Asn Phe Pro Leu Pro Pro Gly Pro Thr Pro

50 55 60

Trp Pro Leu Ile Gly Asn Ile Pro Glu Met Ile Arg Tyr Arg Pro Thr

65 70 75 80

Phe Arg Trp Ile His Gln Leu Met Lys Asp Met Asn Thr Asp Ile Cys

85 90 95

Leu Ile Arg Phe Gly Lys Thr Asn Val Val Pro Ile Ser Cys Pro Val

100 105 110

Ile Ala Arg Glu Ile Leu Lys Lys His Asp Ala Val Phe Ser Asn Arg

115 120 125

Pro Lys Ile Leu Cys Ala Lys Thr Met Ser Gly Gly Tyr Leu Thr Thr

130 135 140

Ile Val Val Pro Tyr Asn Asp Gln Trp Lys Lys Met Arg Lys Val Leu

145 150 155 160

Thr Ser Glu Ile Ile Ser Pro Ala Arg His Lys Trp Leu His Asp Lys

165 170 175

Arg Ala Glu Glu Ala Asp Gln Leu Val Phe Tyr Ile Asn Asn Gln Tyr

180 185 190

Lys Ser Asn Lys Asn Val Asn Val Arg Ile Ala Ala Arg His Tyr Gly

195 200 205

Gly Asn Val Ile Arg Lys Met Met Phe Ser Lys Arg Tyr Phe Gly Lys

210 215 220

Gly Met Pro Asp Gly Gly Pro Gly Pro Glu Glu Ile Met His Val Asp

225 230 235 240

Ala Ile Phe Thr Ala Leu Lys Tyr Leu Tyr Gly Phe Cys Ile Ser Asp

245 250 255

Tyr Leu Pro Phe Leu Glu Gly Leu Asp Leu Asp Gly Gln Glu Lys Ile

260 265 270

Val Leu Asn Ala Asn Lys Thr Ile Arg Asp Leu Gln Asn Pro Leu Ile

275 280 285

Glu Glu Arg Ile Gln Gln Trp Arg Ser Gly Glu Arg Lys Glu Met Glu

290 295 300

Asp Leu Leu Asp Val Phe Ile Thr Leu Gln Asp Ser Asp Gly Lys Pro

305 310 315 320

Leu Leu Asn Pro Asp Glu Ile Lys Asn Gln Ile Ala Glu Ile Met Ile

325 330 335

Ala Thr Ile Asp Asn Pro Ala Asn Ala Val Glu Trp Ala Met Gly Glu

340 345 350

Leu Ile Asn Gln Pro Glu Leu Leu Ala Lys Ala Thr Glu Glu Leu Asp

355 360 365

Arg Val Val Gly Lys Asp Arg Leu Val Gln Glu Ser Asp Ile Pro Asn

370 375 380

Leu Asn Tyr Val Lys Ala Cys Ala Arg Glu Ala Phe Arg Leu His Pro

385 390 395 400

Val Ala Tyr Phe Asn Val Pro His Val Ala Met Glu Asp Ala Val Ile

405 410 415

Gly Asp Tyr Phe Ile Pro Lys Gly Ser Trp Ala Ile Leu Ser Arg Tyr

420 425 430

Gly Leu Gly Arg Asn Pro Lys Thr Trp Pro Asp Pro Leu Lys Tyr Asp

435 440 445

Pro Glu Arg His Leu Asn Glu Gly Glu Val Val Leu Thr Glu His Asp

450 455 460

Leu Arg Phe Val Thr Phe Ser Thr Gly Arg Arg Gly Cys Val Ala Ala

465 470 475 480

Leu Leu Gly Thr Thr Met Ile Thr Met Met Leu Ala Arg Met Leu Gln

485 490 495

Cys Phe Thr Trp Thr Pro Pro Pro Asn Val Thr Arg Ile Asp Leu Ser

500 505 510

Glu Asn Ile Asp Glu Leu Thr Pro Ala Thr Pro Ile Thr Gly Phe Ala

515 520 525

Lys Pro Arg Leu Ala Pro His Leu Tyr Pro Thr Ser Pro

530 535 540

<210>4

<211>1920

<212>DNA

<213>木薯(Manihot esculenta)

<400>4

ggtcttggtc atagccctgg acttgaattg ttcagggcaa caccaatatg gccatgaacg 60

tctccaccac cgcaaccacc acggcctcct tcgcctccac gtcctccatg aacaatactg 120

ccaaaatcct ccttatcacc ctcttcattt ccattgtcag tactgttata aaacttcaaa 180

aaagggcatc ctacaagaaa gctagcaaga acttcccact ccctcctggt ccgactccat 240

ggccactcat cggaaacatc cctgaaatga tccggtacag accgacgttt cgttggattc 300

accaactcat gaaggacatg aacaccgata tttgtctgat ccgtttcgga aaaactaacg 360

ttgttcctat tagctgccct gtcattgctc gtgaaatcct gaaaaagcac gatgctgtct 420

tctctaacag gccaaagatt ctctgcgcta aaacaatgag cggcggatac ttgacgacga 480

ttgtggtgcc atacaatgat caatggaaga aaatgaggaa ggtcctaact tcagagatca 540

tttctccagc taggcacaaa tggctccatg ataagagagc tgaggaagca gatcagcttg 600

tgttctatat caataaccag tacaagagca acaagaatgt gaatgtgaga attgcggcaa 660

ggcattacgg tggaaatgtg atcagaaaga tgatgtttag caagagatac ttcggcaaag 720

ggatgcctga tggaggacca gggcctgaag aaatcatgca cgttgatgca atttttacag 780

cacttaaata tttgtatgga ttttgcatct ctgattactt gccttttttg gaggggcttg 840

atcttgatgg ccaggaaaag attgtgctta atgcaaataa gaccataagg gatcttcaaa 900

acccattaat agaagaaagg attcaacaat ggaggagtgg tgaaagaaag gaaatggaag 960

acttgcttga tgttttcatt actcttcagg attcagatgg caagccattg ctcaatccag 1020

acgagataaa gaatcaaatc gctgaaatta tgatagcaac aatagacaac ccagcaaacg 1080

ccgtagaatg ggcaatgggg gagctgataa atcaaccaga acttctggca aaggccacag 1140

aggaacttga cagagtggtc ggcaaagaca ggcttgtgca agaatctgac atccctaagc 1200

tgaagtacgt caaagcctgt gcaagggagg ccttcaggct ccacccagtt gcatacttca 1260

acgtccctca cgtagccatg gaagacgccg tcatcggcga ttacttcatt ccaaagggca 1320

gctgggcaat tcttagccgc tacgggctcg gccggaaccc aaaaacatgg cctgatccac 1380

tcaagtacga cccagaaagg cacttgaacg agggcgaagt ggtgctgact gagcacgacc 1440

ttaggttcgt cacattcagc actggacgtc gtgggtgtgt cgctgctttg cttggaacca 1500

ccatgattac gatgatgctg gccaggatgc ttcagtgctt cacttggact ccacccccta 1560

atgtaaccag gattgatctc agtgagaata tcgatgagct tactccagca acacccatca 1620

ctggatttgc taagccacgg ttggctcctc atctctaccc cacttcacct tgaattaaag 1680

cccaaagatg ggaagggatg aatgtgagtt gttagaagtt ttaataaaaa aattattggg 1740

tttatatgtg taattacgtg gtaaccttac aaagtgtctg ttattgagag ttttaatctc 1800

tcaaaataat ttgtgtggct aagatttctt catctttgta tctcttgcaa ttgtttgctc 1860

tataaaacat cttatttcct taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920

<210>5

<211>25

<212>DNA

<213>人工序列

<220>

<221>修饰碱基

<222>(14)

<223>i

<220>

<221>修饰碱基

<222>(20)

<223>i

<220>

<221>修饰碱基

<222>(23)

<223>i

<220>

<223>人工序列的描述：寡核苷酸序列

<400>5

gcggaattca rggnaayccn ytnct 25

<210>6

<211>26

<212>DNA

<213>人工序列

<220>

<221>修饰碱基

<222>(18)

<223>i

<220>

<223>人工序列的描述：寡核苷酸序列

<400>6

cgcggatccg gdatrtcnga ytcytg 26

<210>7

<211>25

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：寡核苷酸序列

<400>7

cgaaacgatg gctatgaacg tctct 25

<210>8

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：寡核苷酸序列

<400>8

tggtagagac gttcatagcc atcgttt 27

<210>9

<211>540

<212>PRT

<213>海韭菜(Triglochin maritima)

<400>9

Met Glu Leu Ile Thr Ile Leu Pro Ser Val Leu Pro Asn Ile His Ser

1 5 10 15

Thr Ala Thr Val Leu Phe Leu Leu Leu Leu Thr Thr Ala Leu Ser Phe

20 25 30

Leu Phe Leu Phe Lys Gln His Leu Thr Lys Leu Thr Lys Ser Lys Ser

35 40 45

Lys Ser Thr Thr Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly

50 55 60

Ser Leu Val Ser Met Tyr Met Asn Arg Pro Ser Phe Arg Trp Ile Leu

65 70 75 80

Ala Gln Met Glu Gly Arg Arg Ile Gly Cys Ile Arg Leu Gly Gly Val

85 90 95

His Val Val Pro Val Asn Cys Pro Glu Ile Ala Arg Glu Phe Leu Lys

100 105 110

Val His Asp Ala Asp Phe Ala Ser Arg Pro Val Thr Val Val Thr Arg

115 120 125

Tyr Ser Ser Arg Gly Phe Arg Ser Ile Ala Val Val Pro Leu Gly Glu

130 135 140

Gln Trp Lys Lys Met Arg Arg Val Val Ala Ser Glu Ile Ile Asn Ala

145 150 155 160

Lys Arg Leu Gln Trp Gln Leu Gly Leu Arg Thr Glu Glu Ala Asp Asn

165 170 175

Ile Met Arg Tyr Ile Thr Tyr Gln Cys Asn Thr Ser Gly Asp Thr Asn

180 185 190

Gly Ala Ile Ile Asp Val Arg Phe Ala Leu Arg His Tyr Cys Ala Asn

195 200 205

Val Ile Arg Arg Met Leu Phe Gly Lys Arg Tyr Phe Gly Ser Gly Gly

210 215 220

Glu Gly Gly Gly Pro Gly Lys Glu Glu Ile Glu His Val Asp Ala Thr

225 230 235 240

Phe Asp Val Leu Gly Leu Ile Tyr Ala Phe Asn Ala Ala Asp Tyr Val

245 250 255

Ser Trp Leu Lys Phe Leu Asp Leu His Gly Gln Glu Lys Lys Val Lys

260 265 270

Lys Ala Ile Asp Val Val Asn Lys Tyr His Asp Ser Val Ile Glu Ser

275 280 285

Arg Arg Glu Arg Lys Val Glu Gly Arg Glu Asp Lys Asp Pro Glu Asp

290 295 300

Leu Leu Asp Val Leu Leu Ser Leu Lys Asp Ser Asn Gly Lys Pro Leu

305 310 315 320

Leu Asp Val Glu Glu Ile Lys Ala Gln Ile Ala Asp Leu Thr Tyr Ala

325 330 335

Thr Val Asp Asn Pro Ser Asn Ala Val Glu Trp Ala Leu Ala Glu Met

340 345 350

Leu Asn Asn Pro Asp Ile Leu Gln Lys Ala Thr Asp Glu Val Asp Gln

355 360 365

Val Val Gly Arg His Arg Leu Val Gln Glu Ser Asp Phe Pro Asn Leu

370 375 380

Pro Tyr Ile Arg Ala Cys Ala Arg Glu Ala Leu Arg Leu His Pro Val

385 390 395 400

Ala Ala Phe Asn Leu Pro His Val Ser Leu Arg Asp Thr His Val Ala

405 410 415

Gly Phe Phe Ile Pro Lys Gly Ser His Val Leu Leu Ser Arg Val Gly

420 425 430

Leu Gly Arg Asn Pro Lys Val Trp Asp Asn Pro Leu Arg Phe Asp Pro

435 440 445

Asp Arg His Leu His Gly Gly Pro Thr Ala Lys Val Glu Leu Ala Glu

450 455 460

Pro Glu Leu Arg Phe Val Ser Phe Thr Thr Gly Arg Arg Gly Cys Met

465 470 475 480

Gly Gly Pro Leu Gly Thr Ala Met Thr Tyr Met Leu Leu Ala Arg Phe

485 490 495

Val Gln Gly Phe Thr Trp Gly Leu Arg Pro Ala Val Glu Lys Val Glu

500 505 510

Leu Glu Glu Glu Lys Cys Ser Met Phe Leu Gly Lys Pro Leu Arg Ala

515 520 525

Leu Ala Lys Pro Arg Gln Glu Leu Leu Gln Ser Phe

530 535 540

<210>10

<211>1858

<212>DNA

<213>海韭菜(Triglochin maritima)

<400>10

caatgcattg ctcccactag cccactacgt actataaatg catgcaccac tccacctctc 60

ctcctcagta gcaaaatgga actcataacc attcttccat cagtgcttcc taacatccac 120

tctactgcca cagtactgtt cctcttgcta ctcaccacag ccctctcctt cctcttcctc 180

ttcaaacaac acctcactaa gctaaccaag tccaagtcca agtccaccac attgccaccc 240

ggcccccgac catggcccat cgttggcagc ctcgtgtcga tgtacatgaa ccggccgtct 300

ttccggtgga tactagccca gatggagggg agaaggatag ggtgcattag gttgggtggt 360

gttcatgttg ttccggttaa ttgtcctgag attgctaggg agtttcttaa ggtgcatgat 420

gctgattttg catcgcgtcc ggtcacggtt gtgactcgct actcgtctcg tgggttccgg 480

tctattgccg tggttccact gggggagcaa tggaagaaga tgaggagggt ggtggcgtcg 540

gagattatta atgctaagag gctccaatgg cagcttgggc ttagaaccga agaagccgac 600

aacataatga ggtacatcac ctaccaatgc aacacttcgg gcgacactaa cggagcgatt 660

atcgacgtcc gcttcgccct ccgccactac tgtgccaatg tcatccggcg aatgctgttc 720

gggaaacgct acttcggaag cggtggagaa ggcggtgggc cgggaaagga ggagattgag 780

cacgttgacg ccaccttcga cgtcttgggt ctaatatacg ccttcaatgc ggcggactac 840

gtgtcgtggt tgaagttctt agacttgcat gggcaggaga agaaggttaa gaaggccatt 900

gatgtggtga ataagtatca tgactccgtt atcgagtcga ggagggagag gaaagtagag 960

ggaagagagg acaaggatcc agaggatctt cttgatgtgc ttttgtcgct taaggattct 1020

aatgggaagc ctctcttgga cgtggaggag atcaaagcac aaattgcgga tttgacgtac 1080

gcaacagttg ataacccgtc gaacgccgtg gaatgggcac tagccgagat gctgaacaac 1140

ccggacatcc tccaaaaggc gaccgacgag gtagaccagg tcgtcggaag gcaccgtctc 1200

gtacaagaat ccgacttccc gaacctcccc tacatccggg cctgcgcccg ggaggccctc 1260

cgtctccacc ctgtcgcggc cttcaacctc ccccacgtgt cccttcgtga cactcatgtc 1320

gccggttttt tcattccaaa aggcagccac gttctcctga gtcgcgtcgg cctcggacgc 1380

aaccccaagg tctgggacaa cccgcttcga ttcgaccccg accgacacct ccacggcggg 1440

cccaccgcca aagtcgagct ggccgagccg gagctgaggt tcgtgtcgtt caccaccggg 1500

aggagagggt gcatgggggg cccacttggg actgccatga cttatatgct gcttgctagg 1560

ttcgtccagg gtttcacttg gggtcttcgc cctgctgtgg agaaggttga gcttgaggag 1620

gagaagtgta gcatgttctt gggcaagcca ttaagggctt tggctaagcc acgtcaggag 1680

ctgctccaga gcttctaatt agggttaggg tttgggttgg attaataata cttatgaaat 1740

gcacgtttat gagtctataa atattatcca tgtaagtgtt atatgttttc gtgcaatcct 1800

attatccatg taagttaaat ttgataccat gaatgagttt atatgtgaaa aaaaaaaa 1858

<210>11

<211>533

<212>PRT

<213>海韭菜(Triglochin maritima)

<400>ll

Leu Ile Thr Ile Leu Pro Ser Val Leu Pro Asn Ile His Ser Ser Ala

1 5 10 15

Thr Leu Phe Leu Leu Leu Leu Met Thr Thr Ala Leu Ser Phe Leu Phe

20 25 30

Leu Phe Lys Gln His Leu Ala Lys Leu Thr Lys Pro Lys Ser Thr Thr

35 40 45

Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly Ser Leu Val Ser

50 55 60

Met Tyr Met Asn Arg Pro Ser Phe Arg Trp Ile Leu Ala Gln Met Glu

65 70 75 80

Gly Arg Arg Ile Gly Cys Ile Arg Leu Gly Gly Val His Val Val Pro

85 90 95

Val Asn Cys Pro Glu Ile Ala Arg Glu Phe Leu Lys Val His Asp Ser

100 105 110

Asp Phe Ala Ser Arg Pro Val Thr Val Val Thr Arg Tyr Ser Ser Arg

115 120 125

Gly Phe Arg Ser Ile Ala Val Val Pro Leu Gly Glu Gln Trp Lys Lys

130 135 140

Met Arg Arg Val Val Ala Ser Glu Ile Ile Asn Ala Lys Arg Leu Gln

145 150 155 160

Trp Gln Leu Gly Leu Arg Thr Glu Glu Ala Asp Asn Ile Val Arg Tyr

165 170 175

Ile Thr Tyr Gln Cys Asn Thr Ser Gly Asp Thr Ser Gly Ala Ile Ile

180 185 190

Asp Val Arg Phe Ala Leu Arg His Tyr Cys Ala Asn Val Ile Arg Arg

195 200 205

Met Leu Phe Gly Lys Arg Tyr Phe Gly Ser Gly Gly Val Gly Gly Gly

210 215 220

Pro Gly Lys Glu Glu Ile Glu His Val Asp Ala Thr Phe Asp Val Leu

225 230 235 240

Gly Leu Ile Tyr Ala Phe Asn Ala Ala Asp Tyr Val Ser Trp Leu Lys

245 250 255

Phe Leu Asp Leu His Gly Gln Glu Lys Lys Val Lys Lys Ala Ile Asp

260 265 270

Val Val Asn Lys Tyr His Asp Ser Val Ile Asp Ala Arg Thr Glu Arg

275 280 285

Lys Val Glu Asp Lys Asp Pro Glu Asp Leu Leu Asp Val Leu Phe Ser

290 295 300

Leu Lys Asp Ser Asn Gly Lys Pro Leu Leu Asp Val Glu Glu Ile Lys

305 310 315 320

Ala Gln Ile Ala Asp Leu Thr Tyr Ala Thr Val Asp Asn Pro Ser Asn

325 330 335

Ala Val Glu Trp Ala Leu Ala Glu Met Leu Asn Asn Pro Ala Ile Leu

340 345 350

Gln Lys Ala Thr Asp Glu Leu Asp Gln Val Val Gly Arg His Arg Leu

355 360 365

Val Gln Glu Ser Asp Phe Pro Asn Leu Pro Tyr Ile Arg Ala Cys Ala

370 375 380

Arg Glu Ala Leu Arg Leu His Pro Val Ala Ala Phe Asn Leu Pro His

385 390 395 400

Val Ser Leu Arg Asp Thr His Val Ala Gly Phe Phe Ile Pro Lys Gly

405 410 415

Ser His Val Leu Leu Ser Arg Val Gly Leu Gly Arg Asn Pro Lys Val

420 425 430

Trp Asp Asn Pro Leu Gln Phe Asn Pro Asp Arg His Leu His Gly Gly

435 440 445

Pro Thr Ala Lys Val Glu Leu Ala Glu Pro Glu Leu Arg Phe Val Ser

450 455 460

Phe Thr Thr Gly Arg Arg Gly Cys Met Gly Gly Leu Leu Gly Thr Ala

465 470 475 480

Met Thr Tyr Met Leu Leu Ala Arg Phe Val Gln Gly Phe Thr Trp Gly

485 490 495

Leu His Pro Ala Val Glu Lys Val Glu Leu Gln Glu Glu Lys Cys Ser

500 505 510

Met Phe Leu Gly Glu Pro Leu Arg Ala Phe Ala Lys Pro Arg Leu Glu

515 520 525

Leu Leu Gln Ser Phe

530

<210>12

<211>1778

<212>

<213>海韭菜(Triglochin maritima)

<400>12

ctcataacca ttcttccatc agtgctacca aacatccact cttctgccac attgttcctc 60

ttgctactca tgaccacagc cctctccttc ctcttcctct tcaaacaaca cctcgctaag 120

ctaaccaaac ccaagtccac cacattgcca cctggccccc gaccctggcc catcgttggc 180

agcctcgtgt cgatgtacat gaaccggccg tccttccggt ggatactagc ccagatggag 240

gggaggagga tagggtgcat taggttgggt ggtgttcatg ttgttccggt taattgtcct 300

gagattgcta gggagtttct taaggtgcat gattctgatt ttgcatcgcg tccggtcacg 360

gttgtgactc gctactcgtc tcgtgggttc cggtctattg ccgtggttcc actgggggag 420

cagtggaaga agatgaggag ggtggtggca tcggagatta ttaatgctaa gaggctccaa 480

tggcagcttg ggcttagaac cgaagaagcc gacaacatag tgaggtacat cacctaccaa 540

tgcaacactt cgggcgacac tagcggagcg attatcgacg tccgcttcgc cctccgccac 600

tactgtgcca atgtcatccg gcgaatgctg ttcggaaaac gctactttgg tagcggtgga 660

gtaggcggtg ggcctggaaa ggaggagatt gagcacgttg acgccacctt cgacgtcttg 720

ggtctaatat acgccttcaa tgcggcggac tacgtgtcgt ggttgaagtt cttagacttg 780

catgggcagg agaagaaggt taagaaggcc attgatgtgg tgaataagta tcatgactcc 840

gttatcgacg cgaggacaga gagaaaagtg gaggataagg atccagagga tcttcttgat 900

gtgctttttt cgcttaagga ttctaatgga aagcctctct tggacgtgga ggagatcaaa 960

gcacaaattg cggatttgac gtacgcaaca gttgacaacc cgtcgaacgc cgtggaatgg 1020

gcactagccg agatgctgaa caacccggcc atcctccaaa aggcgaccga cgagctagac 1080

caggtcgtcg gaaggcaccg tctcgtacaa gaatccgact tcccgaacct cccctacatc 1140

cgtgcctgcg cccgggaggc cctccgtctc cacccggtcg cggctttcaa cctcccccac 1200

gtgtcccttc gtgacactca cgtcgccggc ttctttattc ccaaaggcag ccacgttctc 1260

ctgagtcgcg ttggcctcgg acgcaacccc aaggtgtggg acaacccgct tcaattcaac 1320

ccagaccgac acctccacgg cgggcccacc gccaaagtcg agctggccga accggagctg 1380

aggttcgtgt cgttcaccac cgggaggaga gggtgcatgg ggggcctact tgggactgcc 1440

atgacttata tgctgcttgc taggttcgtc cagggtttca cttgggggct tcaccctgct 1500

gtggagaagg ttgagcttca ggaggagaag tgtagcatgt tcttgggcga gccattgaga 1560

gcttttgcta agccacgtct ggagctgctc cagagcttct aattagtttt ggattaataa 1620

taactataat tactaccgat gtccttaaag ttgcatgtcg tgtaactagc acttgttata 1680

tttatagtta tgaaaggtac gtttatgaat ctataaaaat tatccatgta attgttatat 1740

gttttcgtgc aatcgtattg tgagtttggt ttacaaaa 1778

<210>13

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<220>

<221>修饰碱基

<222>(18)

<223>i

<220>

<221>修饰碱基

<222>(21)

<223>i

<400>13

gcggaattcg ayaayccnws naaygc 26

<210>14

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<220>

<221>修饰碱基

<222>(11)

<223>i

<220>

<221>修饰碱基

<222>(17)

<223>i

<220>

<221>修饰碱基

<222>(20)

<223>i

<400>14

gcggatccgc nacrtgnggn ahrttraa 28

<210>15

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<220>

<221>修饰碱基

<222>(12)

<223>i

<220>

<221>修饰碱基

<222>(18)

<223>i

<220>

<221>修饰碱基

<222>(21)

<223>i

<400>15

gcggaattcw snaaygcnrt ngartgg 27

<210>16

<211>29

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<220>

<221>修饰碱基

<222>(15)..(17)

<223>i

<220>

<221>修饰碱基

<222>(21)

<223>i

<220>

<221>修饰碱基

<222>(24)

<223>i

<400>16

gcggatccrt traannnngc nacnggrtg 29

<210>17

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>17

gcggaattcc acacaggaaa cagctatgac 30

<210>18

<211>29

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>18

gcggatccag acgagtagcg agtcacaac 29

<210>19

<211>23

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>19

gcggatccaa gaggaacagt act 23

<210>20

<211>23

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>20

gcggatccaa gaggaacaat gtg 23

<210>21

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>21

gcgaatgcat tgctcccact agcc 24

<210>22

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>22

gcgatggtta tgagttccat tttg 24

<210>23

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>23

gcgcatatgg aactaataac aattctt 27

<210>24

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>24

gcgaagctta ttagaagctc tggagcag 28

<210>25

<211>51

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>25

gcgcatatgg ctctgttatt agcagttttt ttcctcttcc tcttcaaaca a 51

<210>26

<211>51

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>26

gcgcatatgg ctcgtcaagt tcattcttct tggaatttac caccaggccc c 51

<210>27

<211>6

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>27

Asp Asn Pro Ser Asn Ala

1 5

<210>28

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<220>

<221>变体

<222>(3)

<223>V或L

<400>28

Phe Asn Xaa Pro His Val Ala

1 5

<210>29

<211>6

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>29

Ser Asn Ala Val Glu Trp

1 5

<210>30

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>30

His Pro Val Ala Xaa Phe Asn

1 5

<210>31

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>31

Val Val Thr Arg Tyr Ser Ser

1 5

<210>32

<211>6

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>32

Thr Val Leu Phe Leu Leu

1 5

<210>33

<211>6

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>33

Ala Thr Leu Phe Leu Leu

1 5

<210>34

<211>6

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>34

Met Glu Leu Ile Thr Ile

1 5

<210>35

<211>7

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>35

Met Glu Leu Ile Thr Ile Leu

1 5

<210>36

<211>5

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>36

Leu Leu Gln Ser Phe

1 5

<210>37

<211>15

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>37

Met Ala Leu Leu Leu Ala Val Phe Phe Leu Phe Leu Phe Lys Gln

1 5 10 15

<210>38

<211>15

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述：编码的引物

<400>38

Met Ala Arg Gln Val His Ser Ser Trp Asn Leu Pro Pro Gly Prc

1 5 10 15

<210>39

<211>523

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>39

Met Leu Ala Phe Ile Ile Gly Leu Leu Leu Leu Ala Leu Thr Met Lys

1 5 10 15

Arg Lys Glu Lys Lys Lys Thr Met Leu Ile Ser Pro Thr Arg Asn Leu

20 25 30

Ser Leu Pro Pro Gly Pro Lys Ser Trp Pro Leu Ile Gly Asn Leu Pro

35 40 45

Glu Ile Leu Gly Arg Asn Lys Pro Val Phe Arg Trp Ile His Ser Leu

50 55 60

Met Lys Glu Leu Asn Thr Asp Ile Ala Cys Ile Arg Leu Ala Asn Thr

65 70 75 80

His Val Ile Pro Val Thr Ser Pro Arg Ile Ala Arg Glu Ile Leu Lys

85 90 95

Lys Gln Asp Ser Val Phe Ala Thr Arg Pro Leu Thr Met Gly Thr Glu

100 105 110

Tyr Cys Ser Arg Gly Tyr Leu Thr Val Ala Val Glu Pro Gln Gly Glu

115 120 125

Gln Trp Lys Lys Met Arg Arg Val Val Ala Ser His Val Thr Ser Lys

130 135 140

Lys Ser Phe Gln Met Met Leu Gln Lys Arg Thr Glu Glu Ala Asp Asn

145 150 155 160

Leu Val Arg Tyr Ile Asn Asn Arg Ser Val Lys Asn Arg Gly Asn Ala

165 170 175

Phe Val Val Ile Asp Leu Arg Leu Ala Val Arg Gln Tyr Ser Gly Asn

180 185 190

Val Ala Arg Lys Met Met Phe Gly Ile Arg His Phe Gly Lys Gly Ser

195 200 205

Glu Asp Gly Ser Gly Pro Gly Leu Glu Glu Ile Glu His Val Glu Ser

210 215 220

Leu Phe Thr Val Leu Thr His Leu Tyr Ala Phe Ala Leu Ser Asp Tyr

225 230 235 240

Val Pro Trp Leu Arg Phe Leu Asp Leu Glu Gly His Glu Lys Val Val

245 250 255

Ser Asn Ala Met Arg Asn Val Ser Lys Tyr Asn Asp Pro Phe Val Asp

260 265 270

Glu Arg Leu Met Gln Trp Arg Asn Gly Lys Met Lys Glu Pro Gln Asp

275 280 285

Phe Leu Asp Met Phe Ile Ile Ala Lys Asp Thr Asp Gly Lys Pro Thr

290 295 300

Leu Ser Asp Glu Glu Ile Lys Ala Gln Val Thr Glu Leu Met Leu Ala

305 310 315 320

Thr Val Asp Asn Pro Ser Asn Ala Ala Glu Trp Gly Met Ala Glu Met

325 330 335

Ile Asn Glu Pro Ser Ile Met Gln Lys Ala Val Glu Glu Ile Asp Arg

340 345 350

Val Val Gly Lys Asp Arg Leu Val Ile Glu Ser Asp Leu Pro Asn Leu

355 360 365

Asn Tyr Val Lys Ala Cys Val Lys Glu Ala Phe Arg Leu His Pro Val

370 375 380

Ala Pro Phe Asn Leu Pro His Met Ser Thr Thr Asp Thr Val Val Asp

385 390 395 400

Gly Tyr Phe Ile Pro Lys Gly Ser His Val Leu Ile Ser Arg Met Gly

405 410 415

Ile Gly Arg Asn Pro Ser Val Trp Asp Lys Pro His Lys Phe Asp Pro

420 425 430

Glu Arg His Leu Ser Thr Asn Thr Cys Val Asp Leu Asn Glu Ser Asp

435 440 445

Leu Asn Ile Ile Ser Phe Ser Ala Gly Arg Arg Gly Cys Met Gly Val

450 455 460

Asp Ile Gly Ser Ala Met Thr Tyr Met Leu Leu Ala Arg Leu Ile Gln

465 470 475 480

Gly Phe Thr Trp Leu Pro Val Pro Gly Lys Asn Lys Ile Asp Ile Ser

485 490 495

Glu Ser Lys Asn Asp Leu Phe Met Ala Lys Pro Leu Tyr Ala Val Ala

500 505 510

Thr Pro Arg Leu Ala Pro His Val Tyr Pro Thr

515 520

<210>40

<211>1572

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<400>40

atgctcgcgt ttattatagg tttgcttctt cttgcattaa ctatgaagcg taaggagaag 60

aagaaaacca tgttaattag ccctacgaga aacctctctc tccctcccgg gccgaaatct 120

tggcctttaa tcggaaacct accggaaata ctagggagga acaaaccggt gttccggtgg 180

atacattctc tcatgaaaga actcaacacc gatattgcat gtatccgtct tgcgaatact 240

cacgtgatcc ccgtgacatc cccgagaatt gcaagagaga ttctgaagaa gcaagactcc 300

gttttcgcca ctagaccgct aacgatgggc acggagtact gcagccgcgg gtacttgacc 360

gttgcggtgg agccacaagg agagcagtgg aagaagatga ggagagtggt ggcatctcac 420

gtgacgagca agaagagctt ccaaatgatg ctacaaaaga gaaccgaaga ggctgataac 480

ttagtccggt acatcaataa ccgtagtgtc aaaaaccgtg gtaatgcttt tgtggttatt 540

gatttaaggc ttgcggtacg gcaatacagt ggaaatgtag ctcggaagat gatgtttggt 600

ataaggcatt ttggtaaagg aagtgaagat ggatcgggac cagggttgga agagattgaa 660

catgtggaat ctttgtttac ggttttaacc catctttacg cctttgcatt gtcagattat 720

gtcccgtggc taaggttctt ggacttggaa ggccatgaga aggttgtgag taacgcaatg 780

agaaatgtaa gtaagtataa cgaccctttt gttgatgaaa gactcatgca atggcgaaat 840

gggaagatga aagaacctca agattttctt gacatgttta taatagctaa agacactgac 900

gggaagccta ctctgtcgga cgaagagatc aaagcacaag tgacggaact aatgttggcg 960

acggttgata atccgtctaa cgcggcagag tggggtatgg cggagatgat taacgagccg 1020

agcatcatgc aaaaagccgt ggaagagatt gatagggtag ttggaaaaga ccgtcttgtc 1080

attgagtctg atctcccaaa tcttaactat gtgaaggctt gtgtgaaaga agcattccgg 1140

ttacaccccg tggcaccgtt caacctccct cacatgtcca ccactgatac tgtggtagac 1200

ggttatttca tccccaaggg aagccacgta ttgattagtc gtatggggat tgggagaaat 1260

cctagtgtgt gggacaagcc gcataagttc gaccctgaga gacatttgag cactaacaca 1320

tgtgtggatc taaacgagtc tgatctgaat ataatatcgt tcagtgcagg acgaagaggt 1380

tgtatgggtg tggacattgg gtcagccatg acgtacatgt tactggctcg gttgattcaa 1440

ggattcacgt ggttaccagt gcctggtaag aataagattg atatttcaga aagcaagaat 1500

gatcttttta tggcaaaacc attatacgcg gttgccacac ctcgtttagc tccacatgtg 1560

tatccaacct aa 1572

<210>41

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A2F1

<400>41

gtgcatatgc ttgactccac cccaatg 27

<210>42

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A2R1

<400>42

atgcattttt ctagtaatct ttacgctc 28

<210>43

<211>37

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A2F2

<400>43

cgtgaattcc atatgctcgc gtttattata ggtttgc 37

<210>44

<211>29

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A2R2

<400>44

cggaagctta ttaggttgga tacacatgt 29

<210>45

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A2R3

<400>45

cgtcacttgt gctttgatct cttc 24

<210>46

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A2F3

<400>46

gaactaatgt tggcgacggt tgat 24

<210>47

<211>57

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A2FX1

<400>47

cgtgaattcc atatggctct gttattagca gtttttctcg cgtttattat aggtttg 57

<210>48

<211>57

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A2FX2

<400>48

cgtgaattcc atatggctct gttattagca gtttttcttc ttcttgcatt aactatg 57

<210>49

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A2R4

<400>49

catctcgagt cttcttccac tgctctcctt 30

<210>50

<211>17

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A2FX3

A2FX3

<400>50

ttaatcggaa acctacc 17

<210>51

<211>33

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物17AF

<400>51

cgtgaattcc atatggctct gttattagct gtt 33

<210>52

<211>18

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：PCR引物A1R

<400>52

gggccacggc acgggacc 18

<210>53

<211>2702

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<400>53

ctcgagctca gtttcttctt cttcctcgta cttatcctcc tcagccaaac gatctctcac 60

cgtattctct agctgcactc cgtactgagc tccttttatc tcctttatca ccaccactct 120

tataaccttc tccatctccg ctgaaaaatg tataatagta agcagaggaa ccggttcaat 180

ttcgttggac acgtacttaa ccagattaat taagtaaacc ggagtttaac cagttgaatc 240

aaagtaaacc aaaataagaa gccaaaccaa ataatgtatt tattgaacca cgtagtctcc 300

atctaaacca gagaacccta attcaaattt tgatttgaaa acatggacta attaagatta 360

ccggaggcaa gggcgtcgaa gaagtcatca tcgccggcga gttcttttcc ggttttgcct 420

ttccagttat caagatgtgt tttaacatct gaaggatcta agtaaactcc gatcgcagtg 480

aacttcactt gaagaaagtg gatctcaatg tctgtgatcc ctataacaag aatatgaaca 540

atccatataa aattattgtt acctgcgatt ttgttatgta tcgcattata aggtatcaga 600

cattaagaaa gcaaaaaaga aataaaaacc ttggcccaga agagagagtg gcttggaagt 660

gatgatctgt ggaggaaaag gaacctcgtg aaccatgacc atctctgttc ccactgtttg 720

ataaacaaga acacacaaat cttaggaaaa aaacaaagca ttgaaaaaaa gacaatgaga 780

ataattgaaa cttgttagaa ctgaaaatct tactttagtg gataaacttg taataaaaaa 840

gaatgcaaag agtgtaagac ttactttcta atttatatta ttttgaatct gagagtgaag 900

aaatttataa atggcttggt gtactatttt acgatcttag agaaacaata tcgaaattgt 960

aaatgtgaat atctctctct atataataag ccagggactg gtggtaggta acataatttt 1020

gctaacgttc aaagcttgtg atctaaaaga cgacgtattc tttttatgaa ttcaattttt 1080

ttgctaccaa agcttgtgat ctcaattgtt tgttagcgac ccaccaggaa gccacgtgtt 1140

tggatcaagc actcagtcca caaccactca ttctacctaa caaatgaagg tatagaagta 1200

taataattaa aagagataga agaaagaatt gctatgatac agtaaaaaga gatcagatgt 1260

caaatgtgaa acaaagcgta cataaattag atacaaaatt agaagcagcc acatttctcc 1320

acaacggctc ttgaaatcag taacgtaaag taaactgatg atgacaaaga cccaaaaaaa 1380

aaaaaaaaaa aaaaaaagag aaataaagag tgtctttaaa gcagtaacgt ataaaaaccc 1440

tttttcgtct tctcttctat ctcgacctcc caaatcatga aaggatcaat tcatgactcc 1500

gctattacgg gtttagaggc tcagcttatg gcatcgaagc gaggactaat cgaagccgtg 1560

agtttgggga tcactcataa gtcatatctc aatctattgc gatcattatc acatttttga 1620

actggtaagt aagtgttact gctgcaaatc gaaactgact attgaaagct atgcccatct 1680

ttcgacacat aaactaagag ccaagtggga acaaaggatc gaagagacaa ctgaaagaga 1740

ttgggtaatg tgtgcaaagt gccaaaaatt ggcttcagca agtcatggta taatctctat 1800

tctctaatca caatctctag cttttcttaa ttagtcctta tgtaatttga ttatgtttta 1860

attcgcctcc taattaattt catggttgat ggatagtcgt gggtattcct tttgctacgc 1920

atgtcgagcc gaatggaagc tgctaggatt aaatttacag aagctgaatc aatttttaag 1980

tgggccaaat atttacagtt tttataagcc caaatctcca tgtccatatt gtttttaacg 2040

tggcgctacc taaaagggga taaagatttc ataaacagca ttaacaattt aacatcaaca 2100

agattttaaa gggataagga ttaaggaatc gtaagcaaat ttatccttag agattagatt 2160

tagacgaatt tggaaaagta aaaagttggt aattaaatag aaatgtactt aaaacacaac 2220

atgtaataca ttagacatat gagctgttga aaaatcgtgg tttttctaat gatggcgcta 2280

cctaaaaggg acaaggattt cataatgatg cattaccaat ttaacatcca caagatttat 2340

aagggataag gaataatcaa agaaaaaaac atgtcttaca tatgagctgt tgaaaaatcg 2400

tggattcatt taacattgtt ttcttcaaca tttaaagcac atttattttc catagattac 2460

acttaaacaa aagcatttgt ttcatggcta taaatagctt attcctcatc atagataaga 2520

aaaaaccttt tcgaactcaa ataatttctc caaattgaga tttaaaaaaa aaaatgcttg 2580

actccacccc aatgctcgcg tttattatag gtttgcttct tcttgcatta actatgaagc 2640

gtaaggagaa gaagaaaacc atgttaatta gccctacgag aaacctctct ctccctcccg 2700

gg 2702

<210>54

<211>541

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>54

Met Asn Thr Phe Thr Ser Asn Ser Ser Asp Leu Thr Thr Thr Ala Thr

1 5 10 15

Glu Thr Ser Ser Phe Ser Thr Leu Tyr Leu Leu Ser Thr Leu Gln Ala

20 25 30

Phe Val Ala Ile Thr Leu Val Met Leu Leu Lys Lys Leu Met Thr Asp

35 40 45

Pro Asn Lys Lys Lys Pro Tyr Leu Pro Pro Gly Pro Thr Gly Trp Pro

50 55 60

Ile Ile Gly Met Ile Pro Thr Met Leu Lys Ser Arg Pro Val Phe Arg

65 70 75 80

Trp Leu His Ser Ile Met Lys Gln Leu Asn Thr Glu Ile Ala Cys Val

85 90 95

Lys Leu Gly Asn Thr His Val Ile Thr Val Thr Cys Pro Lys Ile Ala

100 105 110

Arg Glu Ile Leu Lys Gln Gln Asp Ala Leu Phe Ala Ser Arg Pro Leu

115 120 125

Thr Tyr Ala Gln Lys Ile Leu Ser Asn Gly Tyr Lys Thr Cys Val Ile

130 135 140

Thr Pro Phe Gly Asp Gln Phe Lys Lys Met Arg Lys Val Val Met Thr

145 150 155 160

Glu Leu Val Cys Pro Ala Arg His Arg Trp Leu His Gln Lys Arg Ser

165 170 175

Glu Glu Asn Asp His Leu Thr Ala Trp Val Tyr Asn Met Val Lys Asn

180 185 190

Ser Gly Ser Val Asp Phe Arg Phe Met Thr Arg His Tyr Cys Gly Asn

195 200 205

Ala Ile Lys Lys Leu Met Phe Gly Thr Arg Thr Phe Ser Lys Asn Thr

210 215 220

Ala Pro Asp Gly Gly Pro Thr Val Glu Asp Val Glu His Met Glu Ala

225 230 235 240

Met Phe Glu Ala Leu Gly Phe Thr Phe Ala Phe Cys Ile Ser Asp Tyr

245 250 255

Leu Pro Met Leu Thr Gly Leu Asp Leu Asn Gly His Glu Lys Ile Met

260 265 270

Arg Glu Ser Ser Ala Ile Met Asp Lys Tyr His Asp Pro Ile Ile Asp

275 280 285

Glu Arg Ile Lys Met Trp Arg Glu Gly Lys Arg Thr Gln Ile Glu Asp

290 295 300

Phe Leu Asp Ile Phe Ile Ser Ile Lys Asp Glu Gln Gly Asn Pro Leu

305 310 315 320

Leu Thr Ala Asp Glu Ile Lys Pro Thr Ile Lys Glu Leu Val Met Ala

325 330 335

Ala Pro Asp Asn Pro Ser Asn Ala Val Glu Trp Ala Met Ala Glu Met

340 345 350

Val Asn Lys Pro Glu Ile Leu Arg Lys Ala Met Glu Glu Ile Asp Arg

355 360 365

Val Val Gly Lys Glu Arg Leu Val Gln Glu Ser Asp Ile Pro Lys Leu

370 375 380

Asn Tyr Val Lys Ala Ile Leu Arg Glu Ala Phe Arg Leu His Pro Val

385 390 395 400

Ala Ala Phe Asn Leu Pro His Val Ala Leu Ser Asp Thr Thr Val Ala

405 410 415

Gly Tyr His Ile Pro Lys Gly Ser Gln Val Leu Leu Ser Arg Tyr Gly

420 425 430

Leu Gly Arg Asn Pro Lys Val Trp Ala Asp Pro Leu Cys Phe Lys Pro

435 440 445

Glu Arg His Leu Asn Glu Cys Ser Glu Val Thr Leu Thr Glu Asn Asp

450 455 460

Leu Arg Phe Ile Ser Phe Ser Thr Gly Lys Arg Gly Cys Ala Ala Pro

465 470 475 480

Ala Leu Gly Thr Ala Leu Thr Thr Met Met Leu Ala Arg Leu Leu Gln

485 490 495

Gly Phe Thr Trp Lys Leu Pro Glu Asn Glu Thr Arg Val Glu Leu Met

500 505 510

Glu Ser Ser His Asp Met Phe Leu Ala Lys Pro Leu Val Met Val Gly

515 520 525

Asp Leu Arg Leu Pro Glu His Leu Tyr Pro Thr Val Lys

530 535 540

<210>55

<211>1916

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<400>55

gtcgacccac gcgtccgcaa cagaaaccac aacaaaaact ttgagtcctc ttcttctcta 60

tacacaaaca tgaacacttt tacctcaaac tcttcggatc tcactaccac tgcaaccgaa 120

acatcgtcct ttagcacctt gtatctcctc tcaacacttc aagcttttgt ggctataacc 180

ttagtgatgc tactcaagaa attgatgacg gatcccaaca aaaagaaacc gtatctgcca 240

ccgggtccca caggatggcc gatcattgga atgattccga cgatgctaaa gagccggccc 300

gttttccggt ggctccacag catcatgaag cagctcaata ctgagatagc atgcgtgaag 360

ttaggaaaca ctcatgtgat caccgtcacg tgccctaaga tagcacgtga gatactcaag 420

caacaagacg ctctcttcgc gtcgaggcct ttaacttacg ctcagaagat cctctctaac 480

ggctacaaaa cctgcgtgat cactcccttt ggtgaccaat tcaagaaaat gaggaaagtt 540

gtgatgacgg aactcgtatg tccagcgaga cacaggtggc tccaccagaa gagatcagaa 600

gaaaacgatc atttaaccgc ttgggtatac aacatggtta agaactcggg ctctgtcgat 660

ttccggttca tgactaggca ttactgtgga aatgcaatca agaagcttat gttcgggacg 720

agaacgttct ctaagaacac tgcacctgac ggtggaccca ccgtagaaga tgtagagcac 780

atggaagcaa tgtttgaagc attagggttt accttcgctt tttgcatctc tgattatctg 840

ccgatgctca ctggacttga tcttaacggt cacgagaaga ttatgagaga atcaagtgcg 900

attatggaca agtatcatga cccaatcatc gacgagagga tcaagatgtg gagagaagga 960

aagagaactc aaatcgaaga ttttcttgat attttcatct ctatcaaaga cgaacaaggc 1020

aacccattgc ttaccgccga tgaaatcaaa cccaccatta aggagcttgt aatggcggcg 1080

ccagacaatc catcaaacgc cgtggaatgg gccatggcgg agatggtgaa caaaccggag 1140

attctccgta aagcaatgga agagatcgac agagtcgtcg ggaaagagag actcgttcaa 1200

gaatccgaca tcccaaaact aaactacgtc aaagctatcc tccgcgaagc tttccgtctc 1260

catcccgtcg ccgccttcaa cctcccccac gtggcacttt ctgacacaac cgtcgccgga 1320

tatcacatcc ctaaaggaag tcaagtcctt cttagccgat atgggctggg ccgtaaccca 1380

aaagtttggg ccgacccact ttgctttaaa ccggagagac atctcaacga atgctccgaa 1440

gttactttga ccgagaacga tctccggttt atctcgttca gtaccgggaa aagaggttgt 1500

gcggctccgg cgctaggaac ggcgttgacc acgatgatgc tcgcgagact tcttcaaggt 1560

ttcacttgga agctacctga gaatgagaca cgtgtcgagc tgatggagtc tagtcacgat 1620

atgtttctgg ctaaaccgtt ggttatggtc ggtgacctta gattgccgga gcatctctac 1680

ccgacggtga agtgagatga gacgacgccg tatatatttt atgaaactac ttttatataa 1740

tcgcccaacc aagtttggtc aattccggtt accagaagat aattggtcaa attgtgaaca 1800

aacttgtgtg ttggtttctt ggttcttttt gggacacttg aattgtgtct cctttacctc 1860

ttcttttgtt gttttcaata aaaactttta ttaccatttc aaaaaaaaaa aaaaaa 1916

<210>56

<211>1974

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<400>56

atgaacactt ttacctcaaa ctcttcggat ctcactacca ctgcaaccga aacatcgtcc 60

tttagcacct tgtatctcct ctcaacactt caagcttttg tggctataac cttagtgatg 120

ctactcaaga aattgatgac ggatcccaac aaaaagaaac cgtatctgcc accgggtccc 180

acaggatggc cgatcattgg aatgattccg acgatgctaa agagccggcc cgttttccgg 240

tggctccaca gcatcatgaa gcagctcaat actgagatag catgcgtgaa gttaggaaac 300

actcatgtga tcaccgtcac gtgccctaag atagcacgtg agatactcaa gcaacaagac 360

gctctcttcg cgtcgaggcc tttaacttac gctcagaaga tcctctctaa cggctacaaa 420

acctgcgtga tcactccctt tggtgaccaa ttcaagaaaa tgaggaaagt tgtgatgacg 480

gaactcgtat gtccagcgag acacaggtgg ctccaccaga agagatcaga agaaaacgat 540

catttaaccg cttgggtata caacatggtt aagaactcgg gctctgtcga tttccggttc 600

atgactaggc attactgtgg aaatgcaatc aagaagctta tgttcgggac gagaacgttc 660

tctaagaaca ctgcacctga cggtggaccc accgtagaag atgtagagca catggaagca 720

atgtttgaag cattagggtt taccttcgct ttttgcatct ctgattatct gccgatgctc 780

actggacttg atcttaacgg tcacgagaag attatgagag aatcaagtgc gattatggac 840

aagtatcatg acccaatcat cgacgagagg atcaagatgt ggagagaagg aaagagaact 900

caaatcgaag attttcttga tattttcatc tctatcaaag acgaacaagg caacccattg 960

cttaccgccg atgaaatcaa acccaccatt aaggtattta tcacgttcct ttcatataag 1020

gtttcgatcg taaaaatatc aaaagaacaa tttttgttaa attttatttg agaaagcatg 1080

catatcaaat ttatttacac atactaacat tttgattcat aaaacattta taaaagaaga 1140

aagaaacatt ttgtggtaaa agttgattag ttacaatatt tgtttttttt ttgctaaaca 1200

tgggctactt ttttgtttgt ctcttttgat tactttggtc aaagacagat gcatgcaact 1260

taattgtatt tatttttatg ttatacaaaa attaaagatc caaaattaat aaaagctggt 1320

atatatgttt ataatgaata ggagcttgta atggcggcgc cagacaatcc atcaaacgcc 1380

gtggaatggg ccatggcgga gatggtgaac aaaccggaga ttctccgtaa agcaatggaa 1440

gagatcgaca gagtcgtcgg gaaagagaga ctcgttcaag aatccgacat cccaaaacta 1500

aactacgtca aagctatcct ccgcgaagct ttccgtctcc atcccgtcgc cgccttcaac 1560

ctcccccacg tggcactttc tgacacaacc gtcgccggat atcacatccc taaaggaagt 1620

caagtccttc ttagccgata tgggctgggc cgtaacccaa aagtttgggc cgacccactt 1680

tgctttaaac cggagagaca tctcaacgaa tgctccgaag ttactttgac cgagaacgat 1740

ctccggttta tctcgttcag taccgggaaa agaggttgtg cggctccggc gctaggaacg 1800

gcgttgacca cgatgatgct cgcgagactt cttcaaggtt tcacttggaa gctacctgag 1860

aatgagacac gtgtcgagct gatggagtct agtcacgata tgtttctggc taaaccgttg 1920

gttatggtcg gtgaccttag attgccggag catctctacc cgacggtgaa gtga 1974

<210>57

<211>17

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物T7

<400>57

aatacgactc actatag 17

<210>58

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物EST3

<400>58

gctaggatcc atgttgtata cccaag 26

<210>59

<211>20

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物EST6

<400>59

cgggcccgtt ttccggtggc 20

<210>60

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物EST7A

<400>60

ggtcaccaaa gggagtgatc acgc 24

<210>61

<211>44

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物5*天然*有义

<400>61

atcgtcagtc gaccatatga acacttttac ctcaaactct tcgg 44

<210>62

<211>68

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物5*牛*有义

<400>62

atcgtcagtc gaccatatgg ctctgttatt agcagttttt acatcgtcct ttagcacctt 60

gtatctcc 68

<210>63

<211>45

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物3*末端*反义

<400>63

actgctagaa ttcgacgtca ttacttcacc gtcgggtaga gatgc 45

<210>64

<211>25

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物CYP79B2.2

<400>64

ggaattcatg aacactttta cctca 25

<210>65

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物B2SB

<400>65

ttgtctagat cacttcaccg tcgggta 27

<210>66

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物B2AF

<400>66

ggcctcgaga tgaacacttt tacctca 27

<210>67

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物B2AB

<400>67

ttggaattcc ttcaccgtcg ggtagag 27

<210>68

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物XbaI

<400>68

gtaccatcta gattcatgtt tgtgtataga g 31

<210>69

<211>2361

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<400>69

gaattcattg atctggtctt gctaaaaact ttaaaattga tgagttcaac atcttcaaat 60

gcatgataac gggtccaacg gaaattgact tttttttcat gctcctgata tataataata 120

tctaacgatt acgggttcca ctaattgtca ttactcatta acattcctat ttaaaagttg 180

tgatagtttt agggttttac gtagtcgtgt catatagcga ttaactacgt acttgtagat 240

ttatcaatta cttctgttgt ttacgagaac ctaaaaaaaa gaagcagatg cctagtttat 300

agagcacgtg tactgtcttg aaaacttagg taggttggta aggttaccaa aagaccttaa 360

aggaatataa agttactaat taacttaagt aaagttggta ttgcttatat attgcaaagt 420

attacaaacc aatcccctct gtatattgtt ttaaaccata gattttttta caattaagtt 480

tatgatcaat caattatttc accatttcta ttaaattatg taaaaagaaa aggatatata 540

tatatatata taattaaata agaataaatc aaaataccga aattttttat tatccattct 600

ttgtggacat cgcccctaat atataaaaaa aaaaaacttt cgtataactg atttatattt 660

ttttgtaaaa acttaaagga agcctaagaa atatcttgtg atatttttga caaaatgtgg 720

tatatatctt tttataatat catttataaa gaaaatattg attacatggt gaaaaacatt 780

ttgctagcga tcaacaaaat taaataggca catgttaact gatctcatac gaccttgaaa 840

ttttaatctt tgtgtcgaga gaccgatctt tatgcaaatt atgaaactac acatggttta 900

tgcacggaag atcacattgc atgtatacca tattataaac caaaaatgat caagaagaag 960

gcgaaaacat ttgggtaaat tttaaatttc gatcatgcga ttttttagct catcatcaac 1020

agacaagaaa ctatcttttg tactgtaaat actaaataca aaataaaatc ttcatcattt 1080

tttgcatgtg tcaaataaat tacgcgaact tttttttttt atcgactatt aatagagaaa 1140

cctgttttat ttgccttgat ttggaaaaat ggagaaattg acttaagact tagtctcggt 1200

cacatcggca acaacggagc ttaaacggcg tccgcaacat ggaaactcaa gccacgaatc 1260

tgatatattg actatagaag tagtaagtaa ctttgactcg tcccacatca gtttcaattt 1320

ccacgagggt atttggcagg tgaactctct acgtacccaa aacataatgg ctattttatt 1380

tcataactga tatttagcaa ttaattattc gtccttttta aaccaatttc tatagttggg 1440

aaaataatca atttttacac tttcaatgta tacgttacag attttttttt attagtcatg 1500

cacatatttt caatttttac actttcaatg taaacaatcg attcttaatt gttaaaaata 1560

ggtttacgta aggaattaaa gatttgttta aaatatgttc cggccggtct aataatttac 1620

ttgacgttaa tttcttaaac acttttagat aggaggcttt gtttatccca aatgattttg 1680

taccactgcg acaatactag ctagacataa aatgttaata aatttttatt aagtaatata 1740

atcgaagtat tagatcaatg tagtagacag ttaggttaac taaaacaaga gtaaacactt 1800

ttttttttct tttcaggata ggtaaaacaa atttcacact attttgcgta tttccttaaa 1860

tttgttgttc gttttctcag caaagatgaa tattttgttt catagtaatt cacaagtata 1920

aactcgccag aactcctcaa acagtgaaat ataatatagc ttttaactgt ttttcggctg 1980

gaccgggttt ttaagtgcat atataacacg aggaattttg gcaggtcacc aacaaaactt 2040

ttaaaaatat taaaaattcc catcaagaat agaaattaat aaacaatgat atctctaata 2100

atatagatat tttgaaacgt taggaataat cgtaataatg ttcaacgttg gtggtggtac 2160

tcaagatgga ccctccctcc cacattttcc tcactccttc gtaagtcctt tccacgcata 2220

agggtattat agtcatttca cataaactaa cgactactag acttgtatat aaataggaag 2280

gtgaagctct ctctttatcc atgcagagac aacagaaacc acaacaaaaa ctttgagtcc 2340

tcttcttctc tatacacaaa c 2361

<210>70

<211>540

<212>PRT

<213>蔓菁(Brassica napus)

<400>70

Met Asn Thr Phe Thr Ser Asn Ser Ser Asp Leu Thr Ser Thr Thr Thr

1 5 10 15

Gln Thr Ser Pro Phe Ser Asn Met Tyr Leu Leu Thr Thr Leu Gln Ala

20 25 30

Phe Ala Ala Ile Thr Leu Val Met Leu Leu Lys Lys Val Phe Thr Thr

35 40 45

Asp Lys Lys Lys Leu Ser Leu Pro Pro Gly Pro Thr Gly Trp Pro Ile

50 55 60

Ile Gly Met Val Pro Thr Met Leu Lys Ser Arg Pro Val Phe Arg Trp

65 70 75 80

Leu His Ser Ile Met Lys Gln Leu Asn Thr Glu Ile Ala Cys Val Arg

85 90 95

Leu Gly Asn Thr His Val Ile Thr Val Thr Cys Pro Lys Ile Ala Arg

100 105 110

Glu Ile Leu Lys Gln Gln Asp Ala Leu Phe Ala Ser Arg Pro Met Thr

115 120 125

Tyr Ala Gln Asn Val Leu Ser Asn Gly Tyr Lys Thr Cys Val Ile Thr

130 135 140

Pro Phe Gly Glu Gln Phe Lys Lys Met Arg Lys Val Val Met Thr Glu

145 150 155 160

Leu Val Cys Pro Ala Arg His Arg Trp Leu His Gln Lys Arg Ala Glu

165 170 175

Glu Asn Asp His Leu Thr Ala Trp Val Tyr Asn Leu Val Lys Asn Ser

180 185 190

Gly Ser Val Asp Phe Arg Phe Val Thr Arg His Tyr Cys Gly Asn Ala

195 200 205

Ile Lys Lys Leu Met Phe Gly Thr Arg Thr Phe Ser Glu Asn Thr Ala

210 215 220

Pro Asp Gly Gly Pro Thr Ala Glu Asp Ile Glu His Met Glu Ala Met

225 230 235 240

Phe Glu Ala Leu Gly Phe Thr Phe Ser Phe Cys Ile Ser Asp Tyr Leu

245 250 255

Pro Met Leu Thr Gly Leu Asp Leu Asn Gly His Glu Lys Ile Met Arg

260 265 270

Asp Ser Ser Ala Ile Met Asp Lys Tyr His Asp Pro Ile Val Asp Ala

275 280 285

Arg Ile Lys Met Trp Arg Glu Gly Lys Arg Thr Gln Ile Glu Asp Phe

290 295 300

Leu Asp Ile Phe Ile Ser Ile Lys Asp Glu Gln Gly Asn Pro Leu Leu

305 310 315 320

Thr Ala Asp Glu Ile Lys Pro Thr Ile Lys Glu Leu Val Met Ala Ala

325 330 335

Pro Asp Asn Pro Ser Asn Ala Val Glu Trp Ala Met Ala Glu Met Val

340 345 350

Asn Lys Pro Glu Ile Leu His Lys Ala Met Glu Glu Ile Asp Arg Val

355 360 365

Val Gly Lys Glu Arg Leu Val Gln Glu Ser Asp Ile Pro Lys Leu Asn

370 375 380

Tyr Val Lys Ala Ile Leu Arg Glu Ala Phe Arg Leu His Pro Val Ala

385 390 395 400

Ala Phe Asn Leu Pro His Val Ala Leu Ser Asp Ala Thr Val Ala Gly

405 410 415

Tyr His Ile Pro Lys Gly Ser Gln Val Leu Leu Ser Arg Tyr Gly Leu

420 425 430

Gly Arg Asn Pro Lys Val Trp Ala Asp Pro Leu Ser Phe Lys Pro Glu

435 440 445

Arg His Leu Asn Glu Cys Ser Glu Val Thr Leu Thr Glu Asn Asp Leu

450 455 460

Arg Phe Ile Ser Phe Ser Thr Gly Lys Arg Gly Cys Ala Ala Pro Ala

465 470 475 480

Leu Gly Thr Ala Leu Thr Thr Met Met Leu Ala Arg Leu Leu Gln Gly

485 490 495

Phe Thr Trp Lys Leu Pro Glu Asn Glu Thr Arg Val Glu Leu Met Glu

500 505 510

Ser Ser His Asp Met Phe Leu Ala Lys Pro Leu Val Met Val Gly Glu

515 520 525

Leu Arg Leu Pro Glu His Leu Tyr Pro Thr Val Lys

530 535 540

<210>71

<211>1913

<212>DNA

<213>蔓菁(Brassica napus)

<400>71

tggagctcca ccgcggtggc ggccgctcta gaactagtgg atcccccggg ctgcaggaat 60

tcgcggccgc gtcgactttg attcttcttc tctgctctct ctctctctac tcgaaaacat 120

gaacaccttt acctcaaact cttcggatct cacttccact acaacgcaaa cgtctccgtt 180

cagcaacatg tatctcctca caacgctcca ggcctttgcg gctataacct tggtgatgct 240

tctcaagaaa gtcttcacga cggataaaaa gaaattgtct ctcccgccgg gtcccaccgg 300

atggccgatc atcggaatgg ttccaacgat gctaaagagc cgtcccgttt tccggtggct 360

ccacagcatc atgaagcagc taaacaccga gatagcctgc gtgaggctag gaaacactca 420

cgtgatcacc gtcacatgcc cgaagatagc acgtgagata ctcaagcaac aagacgctct 480

cttcgcctcg agacccatga cttacgcaca gaatgtcctc tctaacggat acaaaacatg 540

cgtgatcact cccttcggtg aacaattcaa gaaaatgagg aaagtcgtga tgactgaact 600

cgtttgtccc gcgaggcaca ggtggcttca ccagaagaga gctgaagaga acgaccattt 660

aaccgcttgg gtatacaact tggtcaagaa ctctggctca gtcgattttc ggtttgtcac 720

gaggcattac tgtggaaatg ctatcaagaa gcttatgttc gggacaagaa cgttctctga 780

aaacaccgca cctgacggtg gaccaaccgc tgaggatatc gagcatatgg aagctatgtt 840

cgaagcatta gggtttactt tctccttttg tatctctgat tatctaccta tgctcactgg 900

acttgatctt aacggccacg agaagatcat gagggattcg agtgctatta tggacaagta 960

tcacgatcct atcgtcgatg caaggatcaa gatgtggaga gaaggaaaga gaactcaaat 1020

cgaggatttt ctagacattt ttatttctat caaggatgaa caaggcaacc cattgcttac 1080

cgccgatgaa atcaaaccca ccattaagga acttgtaatg gcggcgccag acaatccatc 1140

aaacgctgtc gagtgggcca tggcggagat ggtgaacaaa ccggagatac tccataaagc 1200

aatggaagaa atagacagag ttgtcggaaa agaaagactt gtccaagaat ccgacattcc 1260

aaaattaaat tacgtcaaag ctatcctccg tgaagccttc cgcctccatc ccgtagcggc 1320

ctttaacctc ccacacgtgg cactttccga cgcaaccgtc gccgggtatc acatccctaa 1380

aggaagtcaa gtccttctca gtcgatatgg gctgggccgt aacccgaaag tttgggctga 1440

ccccttgagc tttaaaccgg agagacatct caacgaatgc tcggaagtta ctttgacgga 1500

gaacgatctc cggtttatct cgtttagtac cgggaaaaga ggttgtgctg ctccggcttt 1560

aggtacggcg ttgaccacga tgatgctcgc gagacttctt caaggtttca cttggaagct 1620

gccggagaat gagacacgcg ttgagctgat ggagtctagc catgatatgt ttttggctaa 1680

accattggtt atggtcggtg agttgagact cccagagcat ctttacccga cggtgaagta 1740

agaataaaac gacggcgtat atattttatt aaataacttc tacgtactta tgtaattaac 1800

cacagagttt ggtcggtttc tccggttacc agaagataat cggttaatat atgaacaaac 1860

ttgtgcttgg ttttggtaaa aaaaaaaaaa aaaaaaaact cgaggggggg ccc 1913

<210>72

<211>18

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物EST1

<400>72

tccatgtgct ctacatct 18

<210>73

<211>18

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物EST2

<400>73

gacggaactc gtatgtcc 18

<210>74

<211>537

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>74

Met Ser Phe Thr Thr Ser Leu Pro Tyr Pro Phe His Ile Leu Leu Val

1 5 10 15

Phe Ile Leu Ser Met Ala Ser Ile Thr Leu Leu Gly Arg Ile Leu Ser

20 25 30

Arg Pro Thr Lys Thr Lys Asp Arg Ser Cys Gln Leu Pro Pro Gly Pro

35 40 45

Pro Gly Trp Pro Ile Leu Gly Asn Leu Pro Glu Leu Phe Met Thr Arg

50 55 60

Pro Arg Ser Lys Tyr Phe Arg Leu Ala Met Lys Glu Leu Lys Thr Asp

65 70 75 80

Ile Ala Cys Phe Asn Phe Ala Gly Ile Arg Ala Ile Thr Ile Asn Ser

85 90 95

Asp Glu Ile Ala Arg Glu Ala Phe Arg Glu Arg Asp Ala Asp Leu Ala

100 105 110

Asp Arg Pro Gln Leu Phe Ile Met Glu Thr Ile Gly Asp Asn Tyr Lys

115 120 125

Ser Met Gly Ile Ser Pro Tyr Gly Glu Gln Phe Met Lys Met Lys Arg

130 135 140

Val Ile Thr Thr Glu Ile Met Ser Val Lys Thr Leu Lys Met Leu Glu

145 150 155 160

Ala Ala Arg Thr Ile Glu Ala Asp Asn Leu Ile Ala Tyr Val His Ser

165 170 175

Met Tyr Gln Arg Ser Glu Thr Val Asp Val Arg Glu Leu Ser Arg Val

180 185 190

Tyr Gly Tyr Ala Val Thr Met Arg Met Leu Phe Gly Arg Arg His Val

195 200 205

Thr Lys Glu Asn Val Phe Ser Asp Asp Gly Arg Leu Gly Asn Ala Glu

210 215 220

Lys His His Leu Glu Val Ile Phe Asn Thr Leu Asn Cys Leu Pro Ser

225 230 235 240

Phe Ser Pro Ala Asp Tyr Val Glu Arg Trp Leu Arg Gly Trp Asn Val

245 250 255

Asp Gly Gln Glu Lys Arg Val Thr Glu Asn Cys Asn Ile Val Arg Ser

260 265 270

Tyr Asn Asn Pro Ile Ile Asp Glu Arg Val Gln Leu Trp Arg Glu Glu

275 280 285

Gly Gly Lys Ala Ala Val Glu Asp Trp Leu Asp Thr Phe Ile Thr Leu

290 295 300

Lys Asp Gln Asn Gly Lys Tyr Leu Val Thr Pro Asp Glu Ile Lys Ala

305 310 315 320

Gln Cys Val Glu Phe Cys Ile Ala Ala Ile Asp Asn Pro Ala Asn Asn

325 330 335

Met Glu Trp Thr Leu Gly Glu Met Leu Lys Asn Pro Glu Ile Leu Arg

340 345 350

Lys Ala Leu Lys Glu Leu Asp Glu Val Val Gly Arg Asp Arg Leu Val

355 360 365

Gln Glu Ser Asp Ile Pro Asn Leu Asn Tyr Leu Lys Ala Cys Cys Arg

370 375 380

Glu Thr Phe Arg Ile His Pro Ser Ala His Tyr Val Pro Ser His Leu

385 390 395 400

Ala Arg Gln Asp Thr Thr Leu Gly Gly Tyr Phe Ile Pro Lys Gly Ser

405 410 415

His Ile His Val Cys Arg Pro Gly Leu Gly Arg Asn Pro Lys Ile Trp

420 425 430

Lys Asp Pro Leu Val Tyr Lys Pro Glu Arg His Leu Gln Gly Asp Gly

435 440 445

Ile Thr Lys Glu Val Thr Leu Val Glu Thr Glu Met Arg Phe Val Ser

450 455 460

Phe Ser Thr Gly Arg Arg Gly Cys Ile Gly Val Lys Val Gly Thr Ile

465 470 475 480

Met Met Val Met Leu Leu Ala Arg Phe Leu Gln Gly Phe Asn Trp Lys

485 490 495

Leu His Gln Asp Phe Gly Pro Leu Ser Leu Glu Glu Asp Asp Ala Ser

500 505 510

Leu Leu Met Ala Lys Pro Leu His Leu Ser Val Glu Pro Arg Leu Ala

515 520 525

Pro Asn Leu Tyr Pro Lys Phe Arg Pro

530 535

<210>75

<211>1614

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<400>75

atgagcttta ccacatcatt accataccct tttcacatcc tactagtctt tatcctctcc 60

atggcatcaa tcactctact gggtcgaata ctctcaaggc ccaccaaaac caaagaccga 120

tcttgccagc ttcctcctgg cccaccagga tggcccatcc tcggcaatct acccgaacta 180

ttcatgactc gtcctaggtc caaatatttc cgccttgcca tgaaagagct aaaaacagat 240

atagcatgtt tcaactttgc cggcatccgt gccatcacca taaactccga cgagatcgct 300

agagaagcgt ttagagagcg agacgcagat ttggcagacc ggcctcaact tttcatcatg 360

gagacaatcg gagacaatta caaatcaatg ggaatttcac cgtacggtga acaattcatg 420

aagatgaaaa gagtgatcac aacggaaatt atgtccgtta agacgttgaa aatgttggag 480

gctgcaagaa ccatcgaagc ggataatctc atagcttacg ttcactccat gtatcaacgg 540

tccgagacgg tcgatgttag agagctctcg agggtttatg gttacgcagt gaccatgcga 600

atgttgtttg gaaggagaca tgttacgaaa gaaaacgtgt tttctgatga tggaagacta 660

ggaaacgccg aaaaacatca tcttgaggtg attttcaaca ctcttaactg tttaccgagt 720

tttagtccag cggattacgt ggaacgatgg ttgagaggtt ggaatgttga tggtcaagag 780

aagagggtga cagagaactg taacattgtt cgtagttaca acaatcccat aatcgacgag 840

agggtccagt tgtggaggga agaaggtggt aaggctgctg ttgaagattg gcttgatacg 900

ttcattaccc taaaagatca aaacggaaag tacttggtca caccagacga aatcaaagct 960

caatgcgtag aattttgtat agcagcgatt gataatccgg caaataacat ggagtggaca 1020

cttggggaaa tgttaaagaa cccggagatt cttagaaaag ctctgaagga gttggatgaa 1080

gtagttggaa gagacaggct tgtgcaagaa tcagacatac caaatctaaa ctacttaaaa 1140

gcttgttgta gagaaacatt cagaattcac ccaagtgctc attatgtccc ttcccatctt 1200

gcgcgtcaag ataccaccct tgggggttat ttcattccca aaggtagcca cattcatgta 1260

tgccgccctg gactaggtcg taaccctaaa atatggaaag atccattggt atacaaaccg 1320

gagcgtcacc tccaaggaga cggaatcaca aaagaggtta ctctggtgga aacagagatg 1380

cgttttgtct cgtttagcac cggtcgacgt ggctgcatcg gtgttaaagt cgggacgatc 1440

atgatggtta tgttgttggc taggtttctt caagggttta actggaaact ccatcaagat 1500

tttggaccgt taagcctcga ggaagatgat gcatcattgc ttatggctaa acctcttcac 1560

ttgtccgttg agccacgctt ggcaccaaac ctttatccaa agttccgtcc ttaa 1614

<210>76

<211>42

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物序列

<400>76

ctctagattc gaacatatgg ctagctttac aacatcatta cc 42

<210>77

<211>29

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物序列

<400>77

cgggatcctt aaggacggaa ctttggata 29

<210>78

<211>29

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物序列

<400>78

aactgcagca tgatgagctt taccacatc 29

<210>79

<211>42

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物序列

sequence

<400>79

cgggatcctt aatggtggtg atgaggacgg aactttggat aa 42

<210>80

<211>19

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物序列

<400>80

aaagctcaat gcgtagaat 19

<210>81

<211>29

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物序列

<400>81

tttttagaca ccatcttgtt ttcttcttc 29

<210>82

<211>18

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物序列

<400>82

tgtagcggcg cattaagc 18

<210>83

<211>23

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物序列

<400>83

caaaagaata gaccgagata ggg 23

<210>84

<211>535

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>84

Met Lys Ile Ser Phe Asn Thr Cys Phe Gln Ile Leu Leu Gly Phe Ile

1 5 10 15

Val Phe Ile Ala Ser Ile Thr Leu Leu Gly Arg Ile Phe Ser Arg Pro

20 25 30

Ser Lys Thr Lys Asp Arg Cys Arg Gln Leu Pro Pro Gly Arg Pro Gly

35 40 45

Trp Pro Ile Leu Gly Asn Leu Pro Glu Leu Ile Met Thr Arg Pro Arg

50 55 60

Ser Lys Tyr Phe His Leu Ala Met Lys Glu Leu Lys Thr Asp Ile Ala

65 70 75 80

Cys Phe Asn Phe Ala Gly Thr His Thr Ile Thr Ile Asn Ser Asp Glu

85 90 95

Ile Ala Arg Glu Ala Phe Arg Glu Arg Asp Ala Asp Leu Ala Asp Arg

100 105 110

Pro Gln Leu Ser Ile Val Glu Ser Ile Gly Asp Asn Tyr Lys Thr Met

115 120 125

Gly Thr Ser Ser Tyr Gly Glu His Phe Met Lys Met Lys Lys Val Ile

130 135 140

Thr Thr Glu Ile Met Ser Val Lys Thr Leu Asn Met Leu Glu Ala Ala

145 150 155 160

Arg Thr Ile Glu Ala Asp Asn Leu Ile Ala Tyr Ile His Ser Met Tyr

165 170 175

Gln Arg Ser Glu Thr Val Asp Val Arg Glu Leu Ser Arg Val Tyr Gly

180 185 190

Tyr Ala Val Thr Met Arg Met Leu Phe Gly Arg Arg His Val Thr Lys

195 200 205

Glu Asn Met Phe Ser Asp Asp Gly Arg Leu Gly Lys Ala Glu Lys His

210 215 220

His Leu Glu Val Ile Phe Asn Thr Leu Asn Cys Leu Pro Gly Phe Ser

225 230 235 240

Pro Val Asp Tyr Val Asp Arg Trp Leu Gly Gly Trp Asn Ile Asp Gly

245 250 255

Glu Glu Glu Arg Ala Lys Val Asn Val Asn Leu Val Arg Ser Tyr Asn

260 265 270

Asn Pro Ile Ile Asp Glu Arg Val Glu Ile Trp Arg Glu Lys Gly Gly

275 280 285

Lys Ala Ala Val Glu Asp Trp Leu Asp Thr Phe Ile Thr Leu Lys Asp

290 295 300

Gln Asn Gly Asn Tyr Leu Val Thr Pro Asp Glu Ile Lys Ala Gln Cys

305 310 315 320

Val Glu Phe Cys Ile Ala Ala Ile Asp Asn Pro Ala Asn Asn Met Glu

325 330 335

Trp Thr Leu Gly Glu Met Leu Lys Asn Pro Glu Ile Leu Arg Lys Ala

340 345 350

Leu Lys Glu Leu Asp Glu Val Val Gly Lys Asp Arg Leu Val Gln Glu

355 360 365

Ser Asp Ile Arg Asn Leu Asn Tyr Leu Lys Ala Cys Cys Arg Glu Thr

370 375 380

Phe Arg Ile His Pro Ser Ala His Tyr Val Pro Pro His Val Ala Arg

385 390 395 400

Gln Asp Thr Thr Leu Gly Gly Tyr Phe Ile Pro Lys Gly Ser His Ile

405 410 415

His Val Cys Arg Pro Gly Leu Gly Arg Asn Pro Lys Ile Trp Lys Asp

420 425 430

Pro Leu Ala Tyr Glu Pro Glu Arg His Leu Gln Gly Asp Gly Ile Thr

435 440 445

Lys Glu Val Thr Leu Val Glu Thr Glu Met Arg Phe Val Ser Phe Ser

450 455 460

Thr Gly Arg Arg Gly Cys Val Gly Val Lys Val Gly Thr Ile Met Met

465 470 475 480

Ala Met Met Leu Ala Arg Phe Leu Gln Gly Phe Asn Trp Lys Leu His

485 490 495

Arg Asp Phe Gly Pro Leu Ser Leu Glu Glu Asp Asp Ala Ser Leu Leu

500 505 510

Met Ala Lys Pro Leu Leu Leu Ser Val Glu Pro Arg Leu Ala Ser Asn

515 520 525

Leu Tyr Pro Lys Phe Arg Pro

530 535

<210>85

<211>1608

<212>

<213>拟南芥(Arabidopsis thaliana)

<400>85

atgaagatta gctttaacac atgctttcaa atcttactag gatttatcgt cttcatcgca 60

tcaatcactt tactaggtcg aatattctca aggccttcca aaaccaaaga ccggtgtcgc 120

cagcttcctc ctggccgacc aggatggccc atcctcggca atctacccga actaatcatg 180

actcgtccta ggtccaaata tttccacctt gccatgaaag agctaaaaac ggatatcgca 240

tgtttcaact ttgccggaac ccacaccatc accataaact ccgacgagat cgctagagaa 300

gcttttagag agcgagacgc agatttggca gaccggcctc aactttccat cgtagagtcc 360

attggagaca attacaaaac aatgggaacc tcatcgtacg gtgaacattt catgaagatg 420

aaaaaagtga tcacaacgga aattatgtcc gttaaaacgt tgaatatgtt ggaagctgcg 480

agaaccatcg aagcggataa tctcattgct tacattcact cgatgtatca acggtcggag 540

acggtcgacg ttagagaact ttcgagagtt tatggttacg cagtgaccat gagaatgttg 600

tttggaagga gacatgtcac gaaagaaaac atgttttcgg atgatgggag actaggaaaa 660

gccgaaaaac atcatcttga ggtgattttc aacactctaa actgtttgcc aggttttagt 720

cccgtggatt acgtggaccg atggttaggt ggttggaata ttgatggtga agaggagaga 780

gcgaaagtga atgttaatct tgttcgtagt tacaacaatc ccataataga cgagagggtc 840

gaaatttgga gggaaaaagg tggtaaggct gctgtggaag attggcttga tacgttcatt 900

acgctaaaag atcaaaacgg aaactacttg gttacgccag acgaaatcaa agctcaatgc 960

gtcgaatttt gtatagcagc gatcgataat ccggcaaata acatggagtg gacacttggg 1020

gaaatgttaa agaacccgga gattcttaga aaagctctga aggagttgga tgaagtagtt 1080

ggaaaagaca ggcttgtgca agaatcagac atacgaaatc taaactactt aaaagcttgt 1140

tgcagagaaa cattcaggat tcacccaagc gctcattatg tcccacctca tgttgcccgt 1200

caagatacca cccttggggg ttattttatt cccaaaggta gccacattca tgtatgccgc 1260

cctgggctag gccggaaccc taaaatatgg aaagatccat tagcatacga accggagcgt 1320

cacctccaag gagacggaat cacaaaagag gttactctgg tcgaaacaga gatgcgtttt 1380

gtctcattta gcactggtag acgtggctgc gtcggtgtca aagtcgggac aattatgatg 1440

gctatgatgt tggctaggtt tcttcaaggt tttaactgga aactccatcg agatttcgga 1500

ccgttaagcc tcgaggaaga tgatgcatca ttgcttatgg ctaagcctct tcttttgtct 1560

gttgagccac gcttggcatc aaacctttat ccaaaattcc gtccttaa 1608

Claims

1.编码能将脂族氨基酸转变成相应肟的P450单加氧酶的DNA，其中所述DNA在与下述相当的条件下能够与编码SEQ ID NO：1或SEQ ID NO：3所示序列的DNA相杂交：于68℃在5×SSC、0.1％N-肉桂酰肌氨酸、0.02％SDS、1％封闭剂的溶液中温育过夜，随后在65℃用0.1×SSC、0.1％SDS的溶液洗涤。

2.权利要求1的DNA，其中包含编码SEQ ID NO：1中第334-484位氨基酸或SEQ ID NO：3中第333-483位氨基酸的核苷酸序列。

3.权利要求1的DNA，其编码长度为450-600个氨基酸残基的P450单加氧酶。

4.权利要求1的DNA，其编码具有SEQ ID NO：1或SEQ ID NO：3所示氨基酸序列的P450单加氧酶。

5.权利要求4的DNA，其具有SEQ ID NO：2或SEQ ID NO：4的核苷酸序列。

6.权利要求1-5中任一项的DNA，其中所述DNA中可操作连接了一种或多种调控序列，所述调控序列不同于该DNA所来源的基因的调控序列。

7.由权利要求1-6中任一项的DNA所编码的P450单加氧酶，该酶可将脂族氨基酸转变成相应的肟。

8.一种植物细胞，其中包含权利要求6的DNA。

9.用于分离编码P450单加氧酶的cDNA的方法，所述酶可将脂族氨基酸转变成相应的肟；该方法包括：

(1)由表达这种单加氧酶的植物组织构建cDNA文库；

(2)使用设计成可与SEQ ID NO：2、或SEQ ID NO：4或者编码SEQ ID NO：1或SEQ ID NO：3的DNA相结合、长度至少为15个核苷酸的至少一种寡核苷酸由该cDNA文库扩增P450单加氧酶cDNA的部分；

(3)任选使用设计成可与SEQ ID NO：2、或SEQ ID NO：4或者编码SEQ ID NO：1或SEQ ID NO：3的DNA相结合、长度至少为15个核苷酸的另一种寡核苷酸在嵌套PCR反应中由该cDNA文库扩增P450单加氧酶cDNA的部分；

(4)使用在步骤(2)或(3)中获得的DNA作为探针筛选由表达P450单加氧酶的植物组织构建的cDNA文库，所述酶可将脂族氨基酸转变成相应的肟；和

(5)鉴定并纯化包含编码蛋白质的DNA的载体DNA，其中所述编码蛋白质的DNA在与下述相当的条件下能够与编码SEQ ID NO：1或SEQ ID NO：3所示序列的DNA相杂交：于68℃在5×SSC、0.1％N-肉桂酰肌氨酸、0.02％SDS、1％封闭剂的溶液中温育过夜，随后在65℃用0.1×SSC、0.1％SDS的溶液洗涤；

(6)任选进一步处理纯化的DNA。

10.纯化的重组P450单加氧酶的生产方法，所述酶可将脂族氨基酸转变成相应的肟，该方法包括用权利要求1-6中任一项所述DNA转化巴斯德毕赤酵母(P.pastoris)，在所述被转化的巴斯德毕赤酵母细胞能够表达由该DNA编码的P450单加氧酶的条件下培养所述细胞，并纯化该酶。

11.获取表达P450单加氧酶的转基因植物的方法，所述酶可将脂族氨基酸转变成相应的肟，包括：

(1)用权利要求1-6中任一项所述DNA转化能够再生成完整植株的植物细胞或组织中；

(2)再生成转基因植株；并

(3)选择具有所述酶活性的植株。