CN1206347C - Cyp79家族的p450单加氧酶 - Google Patents

Cyp79家族的p450单加氧酶 Download PDF

Info

Publication number
CN1206347C
CN1206347C CNB018040985A CN01804098A CN1206347C CN 1206347 C CN1206347 C CN 1206347C CN B018040985 A CNB018040985 A CN B018040985A CN 01804098 A CN01804098 A CN 01804098A CN 1206347 C CN1206347 C CN 1206347C
Authority
CN
China
Prior art keywords
leu
seq
dna
val
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB018040985A
Other languages
English (en)
Other versions
CN1396953A (zh
Inventor
M·D·安德森
B·L·莫勒
J·S·尼尔森
U·威特斯托克
C·H·汉森
B·A·哈尔基尔
M·D·米凯尔森
P·坎普巴斯克
S·巴克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Royal Veterinary Agricultural University
Original Assignee
Syngenta Participations AG
Royal Veterinary Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG, Royal Veterinary Agricultural University filed Critical Syngenta Participations AG
Publication of CN1396953A publication Critical patent/CN1396953A/zh
Application granted granted Critical
Publication of CN1206347C publication Critical patent/CN1206347C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8251Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8251Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
    • C12N15/8253Methionine or cysteine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8251Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
    • C12N15/8254Tryptophan or lysine

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Nutrition Science (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Indole Compounds (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了编码CYP79家族的细胞色素P450单加氧酶的DNA,该家族可催化脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟。本发明的优选实施方案是催化L-缬氨酸和L-异亮氨酸的转变的酶诸如木薯酶CYP79D1和CYP79D2、催化酪氨酸的转变的酶诸如海韭菜酶CYP79E1和CYP79E2、催化色氨酸转变成相应肟吲哚-3-乙醛肟的酶诸如拟南芥酶CYP79A2和蔓菁酶CYP79B5、及催化长链甲硫氨酸同源物的转变的酶诸如拟南芥酶CYP79BF1和CYP79F2。所述DNA或其部分在植物中的转基因表达可用于操作相应芥子油苷或含氰苷的生物合成。

Description

CYP79家族的P450单加氧酶
本发明提供了编码将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的P450单加氧酶的DNA。本发明的具体实施方案是催化L-缬氨酸和L-异亮氨酸的转变、属于新的P450单加氧酶亚家族CYP79D的酶,诸如两种木薯酶CYP79D1和CYP79D2;催化酪氨酸转变成对羟基苯乙醛肟、属于新的P450单加氧酶亚家族CYP79E的酶,诸如两种海韭菜(Triglochin maritima)酶CYP79E1和CYP79E2;催化L-苯丙氨酸转变成苯乙醛肟、属于新的P450单加氧酶亚家族CYP79A的酶,诸如拟南芥(Arabidopsis thaliana)酶CYP79A2;催化色氨酸转变成吲哚-3-乙醛肟(IAOX)(参与吲哚芥子油苷的生物合成,还可能参与植物激素吲哚乙酸(IAA)的生物合成)、属于新的P450单加氧酶亚家族CYP79B的酶,诸如拟南芥酶CYP79B2和蔓菁(Brassica napus)酶CYP79B5;和催化脂肪族氨基酸或长链甲硫氨酸同源物转变成相应醛肟、属于新的亚家族CYP79F的酶,诸如拟南芥酶CYP79F1和CYP79F2。所述DNA或其部分在植物中的转基因表达可用于操作相应芥子油苷或含氰苷的生物合成。
细胞色素P450酶是构成超基因家族的含血红素酶。在植物中,它们分成截然不同的两组(Durst等人,Drug Metabolism and DrugInteract,12:189-206,1995)。A组可能衍生自共同祖先,并参与次级植物产物诸如芥子油苷和含氰苷的生物合成。非A组是接近动物、真菌、和微生物细胞色素P450的异质簇。将氨基酸序列同一性超过40%的细胞色素P450分在相同家族内(Nelson等人,DNA Cell Biol,12:1-51,1993),而同一性超过55%的细胞色素P450则属于相同亚家族。
芥子油苷是由氨基酸衍生的次级植物产物,包含硫酸和硫代葡萄糖部分。芥子油苷的发生限于白花菜目(Capparales)和核果木属(Drypetes)(大戟目(Euphorbiales))。C.papaya是植物中包含芥子油苷和含氰苷二者的唯一已知范例。白花菜目包括农业上重要的芸苔科(Brassicaceae)作物,诸如油料种子油菜和芸苔属(Brassica)饲料和蔬菜,以及模型植物拟南芥。组织受损后,芥子油苷迅速水解成具有生物学活性的降解产物。芥子油苷或其降解产物保护植物免于昆虫和真菌的攻击,且担当专以芸苔科为食的昆虫的引诱剂。除了保护效果,降解产物在高等动物和人中还具有毒性。由消耗大量油菜种子膳食引起的抗营养效果(诸如生长迟缓)具有经济影响,因为它们限制了这种富含蛋白质的动物饲料的使用。关于芥子油苷的几种降解产物(例如菜菔硫烷即1-异硫氰基-4R-[甲基亚硫酰基]丁烷,来自嫩茎花椰菜籽苗的4-甲基亚硫酰基丁基芥子油苷的降解产物)的药理学研究证明了抗致癌活性。芥子油苷生物合成途径的代谢工程能够组织特异性调控和优化个别芥子油苷的水平以改进指定作物的营养价值。除了发生于拟南芥,这些芥子油苷还是芸苔属作物和蔬菜的重要成份。例如,蔓菁中的主要芥子油苷即致甲状腺肿的2-羟基-3-丁烯基芥子油苷是由侧链修饰4-甲基硫代丁基芥子油苷而形成的。2-羟基-3-丁烯基芥子油苷在蔓菁中的发生限制了其富含蛋白质的油饼作为动物饲料的使用。因此,生物合成基因的有效性对于开发非期望芥子油苷水平降低同时保留具有期望效果(如害虫抗性)的芥子油苷的作物具有极大潜力。
迄今为止,已经鉴定了超过100种不同芥子油苷。根据它们是否衍生自脂肪族氨基酸、苯丙氨酸和酪氨酸、或色氨酸,将它们分成脂肪族、芳香族、和吲哚基芥子油苷。在进入生物合成途径前,氨基酸通常经历一系列链延长,且芥子油苷产物通常进行次级修饰(诸如羟化、甲基化、和氧化)而产生芥子油苷的结构多样性。据显示,拟南芥Columbia载培品种包含衍生自色氨酸、长链苯丙氨酸同源物(高苯丙氨酸)、和几种长链甲硫氨酸同源物(诸如二高甲硫氨酸(dihomomethionine)、三高甲硫氨酸、和四高甲硫氨酸)的23种不同芥子油苷。
在本发明中,除了别的以外,我们还由拟南芥鉴定了CYP79同源物CYP79B2,它催化色氨酸转变成IAOX,后者是吲哚芥子油苷和植物激素IAA二者的生物合成前体。CYP79B2在拟南芥中的过度表达导致吲哚芥子油苷水平升高,这说明CYP79B2参与吲哚芥子油苷的生物合成,而且吲哚芥子油苷的进化是以“生氰”诱因为基础的。
对于芥子油苷生物合成途径,尚未鉴定很多基因。对催化氨基酸转变成醛肟的酶的性质行了许多讨论。独立的生化研究指出三种不同酶系统参与这个步骤,即依赖细胞色素P450的单加氧酶、含黄素的单加氧酶、和过氧化物酶。先前有人根据来自芸苔科物种的微粒体酶制剂提出,二高甲硫氨酸、三高甲硫氨酸、和四高甲硫氨酸转变成相应的醛肟是由含黄素的单加氧酶催化的。
在含氰苷的生物合成中,CYP79家族的细胞色素P450催化由氨基酸形成醛肟。例如,芳香族氨基酸前体L-酪氨酸被酶CYP79A1(P450TYR)羟化两次而形成(Z)-对羟基苯基乙醛肟(WO 95/16041),随后由酶CYP71E1(P450OX)转变成羟腈即对羟基扁桃腈(WO 98/40470),对羟基扁桃腈最后由UDP-葡萄糖:苷元葡萄糖基转移酶缀合葡萄糖。上述酶的转基因表达可用于修饰、重建、或新建含氰苷的生物合成途径,或者用于更改植物中的芥子油苷生成。已经在芥子油苷生成植物中鉴定了几种CYP79同源物,但是尚未测定它们的功能。本发明公开了拟南芥的细胞色素P450 CYP79A2、CYP79B2、和CYP79F1的克隆和功能性表达,以及蔓菁的细胞色素P450 CYP79B5的克隆。本发明显示,CYP79A2催化L-苯丙氨酸转变成苯乙醛肟,CYP79B2催化色氨酸转变成吲哚-3-乙醛肟,而CYP79F1催化长链甲硫氨酸同源物(诸如高甲硫氨酸、二高甲硫氨酸、三高甲硫氨酸、四高甲硫氨酸、五高甲硫氨酸、和六高甲硫氨酸)转变成相应的醛肟。本发明还显示,在CaMV35S启动子的控制下表达CYP79A2或CYP79B2的转基因拟南芥分别积累高水平的苯甲基芥子油苷或吲哚芥子油苷,而表达CYPF1的转基因拟南芥能够显示CYPF1的共遏制,伴随衍生自长链甲硫氨酸同源物的芥子油苷含量降低和长链甲硫氨酸(诸如二高甲硫氨酸和三高甲硫氨酸)水平的高度升高。这些数据与CYP79A2、CYP79B2、和CYP79F1在拟南芥中参与芥子油苷生物合成是一致的。出乎意料的是在吲哚芥子油苷生物合成中存在生成IAOX的CYP79,因为没有鉴定到由色氨酸衍生的含氰苷,而且在文献中描述了过氧化物酶活性参与吲哚芥子油苷生物合成。另外,吲哚芥子油苷是最近进化事件的产物,而且只存在于白花菜目的四个科中,即芸苔科(Brassicaceae)、木犀草科(Resedaceae)、金线草科(Tovariaceae)、和白花菜科(Capparaceae)。因此,IAOX可能参与IAA和吲哚芥子油苷二者生物合成的可能性说明,催化色氨酸转变成IAOX的酶的性质与CYP79 N-羟化酶是不同的。CYP79B2在植物中和在体外的表征证明,芥子油苷生物合成中由CYP79蛋白质进行的肟生成不限于那些同样作为含氰苷生物合成前体的芳香族氨基酸。这说明在与含氰苷分化之后,CYP79蛋白质形成新的底物特异性。因此,预计芥子油苷生成植物中属于CYP79家族的许多细胞色素P450将在芥子油苷生物合成中由多种前体氨基酸催化肟生成。
木薯(最重要的热带块根农作物)在植物的所有部分中包含两种含氰苷,即亚麻苦苷和百脉根苷。在组织受损后,所述葡萄糖苷发生降解,并伴随氰化氢的释放。还没有发现不生氰的木薯植物,试图通过育种完全消除含氰苷的尝试也尚未获得成功。因此,木薯产品作为主粮的使用需要小心加工以除去氰化物。然而,加工是费时费力的,同时导致蛋白质、维生素、和矿物质的损失。参与亚麻苦苷和百脉根苷生物合成途径的酶的鉴定将为遏制所述含氰苷生物合成的分子生物学方法(诸如有义或反义遏制)打开方便之门。
海韭菜(海边水麦冬植物)在植物的大多数部分中包含两种含氰苷,即taxiphyllin和海韭菜苷。在组织受损后,所述葡萄糖苷发生降解,并伴随氰化氢的释放。还没有发现不生氰的海边水麦冬植物。参与taxiphyllin(蜀黍苷的表异构物)和海韭菜苷生物合成途径的酶及相应cDNA或基因组克隆的鉴定使得可利用分子生物学方法遏制所述含氰苷生物合成(诸如有义或反义遏制)或选择期望改变(使用标记辅助选择)。虽然正在试图由许多不同植物物种中含氰苷生物合成的共同生物合成路径来推断类似多功能细胞色素P450酶的参与,但是海韭菜可能并非如此,因为在这种植物中对羟基苯基乙醛肟无需平衡。细胞色素P450催化醛肟转变成腈是脱水反应,而且是如此不寻常。在海韭菜中,可以由与第一种多功能细胞色素P450酶相关的额外酶活性进行,而非由所涉及的第二种细胞色素P450催化的第一个催化事件。如果是这样的话,海韭菜中的第二种细胞色素P450将构成寻常的C-羟化酶。
基因指编码序列及相关调控序列,其中编码序列转录成RNA,诸如mRNA、rRNA、tRNA、snRNA、有义RNA、或反义RNA。调控序列的范例是启动子序列、5’和3’非翻译序列、和终止序列。还可以存在其它元件,诸如内含子。
表达通常指内源基因或转基因在植物中的转录和翻译。然而,对于不编码蛋白质的基因(诸如反义构建物),术语表达仅指转录。
本发明提供了下列解决方案:
●编码将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物(诸如缬氨酸、亮氨酸、异亮氨酸、环戊烯基甘氨酸、酪氨酸、L-苯丙氨酸、色氨酸、二高甲硫氨酸、三高甲硫氨酸、或四高甲硫氨酸)转变成相应肟的P450单加氧酶的DNA;
●编码P450单加氧酶的所述DNA,其中所编码蛋白质的氨基酸序列的整体比对与得自SEQ ID NO:1或SEQ ID NO:3或二者;SEQ IDNO:39;SEQ ID NO:54或SEQ ID NO:70或二者整体比对的氨基酸序列显示至少40%同一性,或者与得自SEQ ID NO:9或SEQ ID NO:11或二者;SEQ ID NO:74或SEQ ID NO:84或二者整体比对的氨基酸序列显示至少50%同一性;
●编码具有通式R1-R2-R3的P450单加氧酶的所述DNA,其中:
-R1、R2、和R3称为成份序列,且
-R2由150-175个或更多氨基酸残基组成,其序列与SEQ ID NO:1或SEQ ID NO:3;SEQ ID NO:9或SEQ ID NO:11;SEQ ID NO:54或SEQ ID NO:70;SEQ ID NO:74或SEQ ID NO:84中的经比对成份序列至少60%同一;或者与SEQ ID NO:39中的经比对成份序列至少65%同一;
●将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的P450单加氧酶;
●用于分离编码P450单加氧酶的cDNA的方法,所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟;
●用于生成纯化的重组P450单加氧酶的方法,所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟;
●标记辅助育种方法,其中使用长度为至少15-20个核苷酸、构成依照本发明的DNA的成份序列的至少一种寡核苷酸;和
●获取转基因植物的方法,包括将包含至少部分P450单加氧酶开放读码框的DNA稳定整合到其基因组中,所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟。根据所用构建物,得到的植物显示含氰苷或芥子油苷的含量或特性得到改变。
人们认为含氰苷的生物合成是依照一般途径进行的,即涉及所有植物中相同类型的中间物。这已经由涉及氨基酸转变成肟的途径部分得到了清楚的证明。在所有测试植物中,所述途径部分是由属于CYP79家族的一种或多种细胞色素P450酶催化的。该家族的成员是在氨基酸水平显示40%序列同一性的蛋白质,而将显示低于55%序列同一性的成员分成不同亚家族。例如,催化芳香族氨基酸L-酪氨酸转变成相应肟的高粱酶属于亚家族CYP79A,称为CYP79AL。taxiphyllin和海韭菜苷生物合成途径也由芳香族氨基酸L-酪氨酸转变成对羟基苯乙醛肟开始。认为亚麻苦苷和百脉根苷生物合成途径由脂肪族氨基酸L-缬氨酸或L-异亮氨酸转变成相应肟开始。
本发明的目的是提供编码将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的P450单加氧酶的DNA,以及根据在木薯、海韭菜、拟南芥、或蔓菁中表达的酶的氨基酸序列和相应基因序列确定它们的一般结构。发现:催化脂肪族氨基酸的转变的酶构成新的P450酶亚家族,称为CYP79D;催化芳香族氨基酸的转变的酶构成新的P450酶亚家族,称为CYP79E;催化L-苯丙氨酸转变成苯乙醛肟的酶属于CYP79A亚家族;催化色氨酸转变成吲哚-3-乙醛肟的酶属于CYP79B亚家族;催化脂肪族氨基酸或长链甲硫氨酸同源物的转变的酶属于CYP79F亚家族。
如此,本发明公开了将脂肪族氨基酸(诸如缬氨酸、亮氨酸、异亮氨酸、或环戊烯基甘氨酸)转变成相应肟的P450单加氧酶。酶对L-氨基酸是特异的。它是由独立选自下组的氨基酸残基组成的:Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg、和His,并与得自SEQ ID NO:1(CYP79D1)或SEQ ID NO:3(CYP79D2)或二者整体比对的氨基酸序列显示至少40%、优选55%、甚至更优选70%同一性,这些序列代表了在木薯中天然表达的所述序列的本发明具体实施方案。
本发明还公开了将芳香族氨基酸诸如酪氨酸或苯丙氨酸转变成相应肟的P450单加氧酶。该酶对L-氨基酸是特异的。它是由独立选自下组的氨基酸残基组成的:Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg、和His,并与得自SEQ ID NO:9(CYP79E1)或SEQ ID NO:11(CYP79E2)或二者整体比对的氨基酸序列显示至少50%、优选55%、甚至更优选70%同一性,所述序列代表了在海韭菜中天然表达的本发明的具体实施方案。
本发明还公开了将L-苯丙氨酸转变成苯乙醛肟的P450单加氧酶。它是由独立选自下组的氨基酸残基组成的:Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg、和His,并与得自SEQ ID NO:39(CYP79A2)整体比对的氨基酸序列显示至少40%、优选55%、甚至更优选70%同一性,所述序列代表了在拟南芥中天然表达的本发明的具体实施方案。
本发明还公开了将色氨酸转变成吲哚-3-乙醛肟的P450单加氧酶。它是由独立选自下组的氨基酸残基组成的:Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg、和His,并与得自SEQ ID NO:54(CYP79B2)或SEQ ID NO:70(CYP79B5)整体比对的氨基酸序列显示至少40%、优选55%、甚至更优选70%同一性,二者分别代表了在拟南芥和蔓菁中天然表达的本
发明的具体实施方案。
本发明还公开了将脂肪族氨基酸或长链甲硫氨酸同源物转变成相应醛肟的P450单加氧酶。它是由独立选自下组的氨基酸残基组成的:Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg、和His,并与得自SEQ ID NO:74(CYP79F1)或SEQ ID NO:84(CYP79F2)整体比对的氨基酸序列显示至少50%、优选55%、甚至更优选70%同一性,二者代表了在拟南芥中天然表达的本发明的具体实施方案。
可能因存活细胞内翻译后修饰而产生的氨基酸残基的范例是上述氨基酸的糖基化残基以及Aad、bAad、bAla、Abu、4Abu、Acp、Ahe、Aib、bAib、Apm、Dbu、Des、Dpm、Dpr、EtGly、EtAsn、Hyl、aHyl、3Hyp、4Hyp、Ide、alle、MeGly、MeIle、MeLys、MeVal、Nva、Nle、或Orn。
依照本发明的酶的氨基酸序列可以由通式R1-R2-R3进一步定义,其中:
-R1、R2、和R3称为成份序列,且
-R2由150、175、200个或更多氨基酸残基组成,其序列与SEQ ID NO:1或SEQ ID NO:3;SEQ ID NO:9或SEQ ID NO:11;SEQ ID NO:39;SEQ ID NO:54或SEQ ID NO:70;SEQ ID NO:74或SEQ ID NO:84中的经比对成份序列至少60-65%、优选至少70%、甚至更优选至少75%同一。
R2通常由150-175个或更多氨基酸残基组成。R2的具体实施方案有:SEQ ID NO:1的第334-484位氨基酸和SEQ ID NO:3的第333-483位氨基酸;SEQ ID NO:9的第339-489位氨基酸和SEQ ID NO:11的第332-482位氨基酸;SEQ ID NO:39的第308-487位氨基酸;SEQ ID NO:54的第196-345位氨基酸和SEQ ID NO:70的第192-341位氨基酸;以及SEQID NO:74的第334-483位氨基酸和SEQ ID NO:84的第332-481位氨基酸。
由所述DNA编码的单加氧酶通常由450-600个氨基酸残基组成。因而,具体实施方案CYP79D1(SEQ ID NO:1)、CYP79D2(SEQ ID NO:3)、CYP79E1(SEQ ID NO:9)、CYP79E2(SEQ ID NO:11)、CYP79A2(SEQID NO:39)、CYP79B2(SEQ ID NO:54)、CYP79B5(SEQ ID NO:70)、CYP79F1(SEQ ID NO:74)、和CYP79F2(SEQ ID NO:84)的大小分别是541、542、540、533、523、541、540、537、和535个氨基酸残基。
一般而言,存在两种方法可用于序列比对。由Needleman和Wunsch提出的及由Sellers提出的动力学编程算法比对两种序列的完整长度,从而提供序列的整体比对。另一方面,Smith-Waterman算法产生局部比对。局部比对是比对序列内在选定评分矩阵和缺口罚分下最相似的成对区域。这容许数据库搜索而聚焦于序列中最高度保守的区域。它还容许鉴定序列内相似结构域。为了加快使用Smith-Waterman算法的比对,诸如BLAST(基本局部算法搜索工具)和FASTA等程序对比对设置了额外约束。
在本发明的内容中,整体序列比对是方便的使用程序PILEUP(Genetic Computer Group即遗传学计算机小组,麦迪逊,威斯康星州)进行的。局部比对是方便的使用BLAST进行的,即设计用于探测所有可获得的序列数据库而不论检索条目是蛋白质或DNA的一组相似性搜索程序。这种搜索工具的2.0版BLAST(Gapped BLAST)已经可以在因特网上公开获得(当前网址是 http://www.ncbi.nlm. nih.gov/BLAST/)。它使用启发式算法,寻找局部而非整体比对,从而能够检测只分享分离区域的序列之间的关系。在BLAST搜索中获得的评分具有明确的统计学解释。在本发明范围内特别有用的是容许在局部序列比对中导入缺口的blastp程序和PSI-BLAST程序(这两种程序都将氨基酸检索序列对蛋白质序列数据库进行比较),以及只容许两种序列的局部比对的blastp变体程序。优选将任选参数设成缺省值来运行所述程序。
另外,使用BLAST的序列比对能够考虑用一种氨基酸替代另一种是否有可能保留维持蛋白质结构和功能所必需的物理和化学特性或者是否更有可能破坏基本结构和功能特性。这种序列相似性以“阳性”氨基酸百分比进行了量化(相对于同一氨基酸百分比而言),而且在边界的情况中可能有助于将蛋白质归入正确的蛋白质家族。
可以如WO 95/16041的实施例3中关于P450TYR所述,由表达将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的P450单加氧酶的植物纯化上述酶。
可以通过包括在诸如甲基营养酵母巴斯德毕赤酵母(Pichiapastoris)等酵母中表达cDNA克隆的方法,而获得纯化的重组P450单加氧酶,所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟。为了优化表达条件,可能希望在插入表达载体前除去5’和3’非翻译区。可以通过像高表达的巴斯德毕赤酵母AOXl基因的起始ATG那样正确安置起始ATG而获得最佳翻译起始区。可以在完整细胞中测量代谢活性,因为巴斯德毕赤酵母内源还原酶系统能够支持将电子供给许多植物细胞色素P450。为了进一步优化表达和酶活性水平,可以测试许多不同的生长培养基和生长周期,包括但不限于使用丰富培养基并于OD600大约0.5保温24-30小时。可以通过去污剂像TritonX-114的初步溶解及随后由温度诱导的相分配,而由巴斯德毕赤酵母微粒体分离生成的细胞色素P450。可以使用离子交换层析或染料柱层析来实现最终纯化。适用于离子交换层析的柱子是DEAE-Sepharose FF。适用于染料层析的柱子是Reactive Red 120琼脂糖、Reactive Yellow3A琼脂糖、或Cibachron Blue琼脂糖。染料柱可以方便的用KCl梯度进行洗脱。可以通过一氧化碳差异光谱学、底物结合光谱、或活性测量(使用脂肪族或芳香族氨基酸或长链甲硫氨酸同源物作为底物及重建的细胞色素P450酶)来鉴定包含活性细胞色素P450酶的级分。
若巴斯德毕赤酵母内源还原酶不能支持电子供给,则可以依照标准流程(Sibbesen等人,J Biol Chem,270:3506-3511,1995)在携有由提供细胞色素P450酶来源的高粱或相同植物物种分离的NADPH-细胞色素P450氧化还原酶的人造脂质微团(Sibbesen等人,J BiolChem,270:3506-3511,1995;Halkier等人,Arch Biochem Biophys,322:369-377,1995;Kahn等人,Plant Physiol,115:1661-1670,1997)中分离并重建重组蛋白。
或者,可以将细菌像大肠杆菌用于属于CYP79家族的细胞色素P450酶的重组表达。得到的蛋白质是未糖基化的。根据具体研究的酶,可以优选包含编码天然或各种截短、延长、或修饰氨基末端序列的插入片段的载体构建物(Halkier等人,Arch Biochem Biophys,322:369-377,1995;Barnes等人,Proc Natl Acad Sci USA,88:5597-5601,1991;Gillem等人,Arch Biochem Biophys,312:59-66,1994)。特别优选的大肠杆菌菌株是菌株C43(DE3),已知它可以在以阻滞常用菌株的量表达异源膜蛋白时生长良好。因而,CYP79B2在常用大肠杆菌菌株JM109中生成的表达不足由菌株C43(DE3)生成的CYP79B2活性的0.5%。也有可能在昆虫细胞中进行表达。
利用在存在大量脂质时用高粱NADPH-细胞色素P450氧化还原酶重建的大肠杆菌原生质球进行了对CYP79D1、CYP79D2、CYP79E1、CYP79E2、CYP79A2、CYP79B2、CYP79B5、和CYP79F1的底物特异性的研究。L-α-二油酰磷脂酰胆碱和L-α-二肉桂酰磷脂酰胆碱是优选用于重建的脂质。发现CYP79D1和CYP79D2二者均可将L-缬氨酸及L-异亮氨酸转变成相应的肟。发现CYP79E1和CYP79E2二者均可将L-酪氨酸转变成相应的肟。发现CYP79A2可将L-苯丙氨酸转变成苯乙醛肟。发现CYP79B2可将色氨酸转变成吲哚-3-乙醛肟。发现CYP79F1可将长链甲硫氨酸同源物转变成相应的醛肟。L-亮氨酸、L-苯丙氨酸、和L-酪氨酸都不能由CYP79D1或CYP79D2进行代谢。L-甲硫氨酸、L-色氨酸、和L-酪氨酸都不能由CYP79A2进行代谢。苯丙氨酸和酪氨酸都不能由CYP79B2进行代谢。L-色氨酸、L-苯丙氨酸、和L-酪氨酸都不能由CYP79F1进行代谢。D-氨基酸不能由CYP79D1、CYP79D2、CYP79E1、和CYP79E2转变成肟。根据底物的性质,还可以使用完整巴斯德毕赤酵母细胞或完整大肠杆菌细胞来测定底物特异性。
可以在包括下列步骤的测定法(参阅实施例5)中测试P450单加氧酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的能力:
(1)将包含本发明的P450单加氧酶或表达所述酶的大肠杆菌细胞的原生质球、亲本氨基酸、NADPH、氧、NADPH-细胞色素P450氧化还原酶、和脂质的反应混合物于环境温度保温一段时间(2分钟与2-6小时之间);
(2)终止反应,例如通过加入变性化合物诸如乙酸乙酯;并
(3)化学鉴定和量化生成的醛肟。
本发明还提供了包含编码依照本发明的新型蛋白质的开放读码框的核酸化合物。所述核酸分子在结构和功能上与可以由生成相似生物合成酶的植物获得的核酸分子相似。在本发明的一个优选实施方案中,开放读码框可操作连接一种或多种调控序列,所述调控序列不同于与包含开放读码框外显子的基因组基因相连的调控序列,而且所述核酸分子能够与由SEQ ID NO:2或SEQ ID NO:4;SEQ ID NO:10或SEQ IDNO:12;SEQ ID NO:40;SEQ ID NO:55(对应于编码CYP79B2的拟南芥属cDNA)、SEQ ID NO:56(对应于编码CYP79B2的拟南芥属基因组DNA)、或SEQ ID NO:71(对应于编码CYP79B5的芸苔属cDNA);SEQ ID NO:75或SEQ ID NO:85定义的DNA分子的片段发生杂交。所述片段的长度超过20个核苷酸,优选超过25、30、或50个核苷酸。影响杂种分子稳定性的因素确定了杂交条件的严谨度,而且可以依赖所形成杂种分子的解链温度Tm进行测量。Tm的计算描述于几种教科书。例如,Keller等人在《DNA Probes:Background,Applications,Procedures》(DNA探针:背景、应用、流程)(Macmillan出版有限公司,1993,第8-10页)中描述了在计算杂交反应的Tm值时要考虑的因素。依照本发明的DNA分子能够与SEQ ID NO:2或SEQID NO:4;SEQID NO:10或SEQ ID NO:12;SEQ ID NO:40;SEQ ID NO:55、SEQ IDNO:56、或SEQ ID NO:71;SEQ ID NO:75或SEQ ID NO:85的片段在比将要形成的杂种分子的计算Tm低30℃的温度发生杂交。优选的是,它们能够在比计算Tm低25、20、15、10、或5℃的温度发生杂交。
依照本发明的核酸化合物是由独立选自G、A、T、和C或独立选自G、A、U、和C的核苷酸残基组成的,且表征为通式RA-RB-RC,其中:
-RA、RB、和RC称为成份序列;且
-RB由至少450个、优选600个、或更多核苷酸残基组成,编码上文所述氨基酸成份序列R2。
有关SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、和SEQ ID NO:4;SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、和SEQ ID NO:12;SEQ ID NO:39和SEQ ID NO:40;SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:70、和SEQ ID NO:71;SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:84、和SEQ ID NO:85的知识可用于加快编码P450单加氧酶的DNA的分离和生成,所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的醛肟,该方法包括:
(1)由表达这种单加氧酶的植物组织构建cDNA文库;
(2)使用根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、或SEQ IDNO:4;SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、或SEQ ID NO:12;SEQ ID NO:39或SEQ ID NO:40;SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:70、或SEQ ID NO:71;或SEQ IDNO:74、SEQ ID NO:75、SEQ ID NO:84、或SEQ ID NO:85设计的至少一种寡核苷酸由cDNA文库扩增部分P450单加氧酶cDNA;(3)任选使用根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、或SEQ ID NO:4;SEQ ID NO:9,SEQ ID NO:10、SEQ ID NO:11、或SEQ ID NO:12;SEQ ID NO:39或SEQ ID NO:40;SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:70、或SEQ ID NO:71;或SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:84、或SEQ ID NO:85设计的一种或多种寡核苷酸在嵌套PCR反应中由cDNA文库扩增部分P450单加氧酶cDNA;
(4)使用在步骤(2)或(3)中获得的DNA作为探针筛选由表达P450单加氧酶的植物组织构建的DNA文库,所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟;
(5)鉴定并纯化包含编码蛋白质的开放读码框的载体DNA,所述蛋白质的特征为氨基酸序列与得自SEQ ID NO:1或SEQ ID NO:3或二者;SEQ ID NO:9或SEQ ID NO:11或二者;SEQ ID NO:39;SEQ ID NO:54或SEQ ID NO:70或二者;或SEQ ID NO:74或SEQ ID NO:84或二者整体比对的氨基酸序列显示至少40%或50%、优选55%、甚至更优选70%同一性;并
(6)任选进一步处理纯化的DNA,以实现例如蛋白质在微生物像大肠埃希氏菌或巴斯德毕赤酵母中的异源表达,用于随后分离单加氧酶、测定其底物特异性、或生成抗体。
在上述方法的步骤(2)和(3)中,用于扩增的第二种寡核苷酸优选是与用于构建cDNA文库的载体DNA内某一区域互补的寡核苷酸。然而,也可以使用根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、或SEQID NO:4;SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、或SEQ IDNO:12;SEQ ID NO:39或SEQ ID NO:40;SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:70、或SEQ ID NO:71;或SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:84、或SEQ ID NO:85设计的第二种寡核苷酸。编码将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的P450单加氧酶的cDNA克隆或该克隆的片段还可单独或联合编码其它蛋白质(诸如属于CYP79蛋白质家族的其它蛋白质)的cDNA克隆或其片段而用于DNA芯片。这为监测植物中生物或非生物因素对例如芥子油苷或含氰苷生物合成的诱导或抑制提供了简易方法。
此外,衍生自本发明序列的特异寡核苷酸序列可用作标记辅助育种程序中的标记或用于鉴定这些标记。因此,本发明容许开发通过一种或多种寡核苷酸的杂交来选择期望性状的标记辅助育种方法,其中至少一种所述寡核苷酸的序列构成本发明公开的DNA的成份序列。在一个优选的实施方案中,所述寡核苷酸由至少15个、优选至少20个核苷酸组成,且构成聚合酶链式反应测定法的成份。
作为转基因表达的、编码依照本发明的P450单加氧酶的DNA对更改植物中的芥子油苷或含氰苷生物合成特别有用。当与属于CYP71E家族的细胞色素P450酶(如来自高粱的CYP71E1或优选来自木薯的相应同系物)和UDP-葡萄糖氰醇葡萄糖基转移酶一起在无氰植物中表达编码将脂肪族或芳香族氨基酸转变成相应肟的细胞色素P450酶的基因时,获得的转基因植物将是生氰的。将编码将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应肟的细胞色素P450酶的基因导入生成芥子油苷的植物物种的方法可用于改变所述植物中的芥子油苷生成(如由选定转基因植物中个别芥子油苷的整体水平或含量的改变所观察到的)。若作为所导入细胞色素P450酶的底物的脂肪族或芳香族氨基酸或长链甲硫氨酸同源物先前不能由该植物物种中其它细胞色素P450识别成底物,则在转化植物中导入了新的芥子油苷。同样,将编码将脂肪族或芳香族氨基酸转变成相应肟的细胞色素P450酶的基因导入生氰植物的方法可用于更改先前存在的含氰苷的整体水平和分布,及用于在植物中导入一种或多种其它含氰苷。
用于提供组成性、诱导性、或组织特异性基因表达的启动子的正确选择提供了获得具有期望疾病或食草动物应答的转基因植物的手段。同样,可以使用相同基因的反义或核酶技术来更改或降低植物中芥子油苷或含氰苷的含量。因此,本发明的另一个方面是提供转基因植物,包括将依照本发明的P450单加氧酶的至少部分开放读码框稳定整合到它们的基因组DNA中,所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟。可以通过包括下列步骤的方法生成这些植物:
(1)将包含依照本发明的P450单加氧酶的至少部分开放读码框的DNA导入能够再生成完整植株的植物细胞或组织,所述酶将脂肪族或芳香族氨基酸或长链甲硫氨酸同源物转变成相应的肟;并
(2)选择转基因植物。
优选的是,所述方法或是产生转基因表达所述P450单加氧酶的植物,或是产生内源P450单加氧酶表达降低的植物,或是产生芥子油苷或含氰苷的生成降低的植物。
                        实施例
实施例1:木薯CYP79探针的PCR扩增和文库筛选
根据催化L-缬氨酸转变成相应肟的P450酶属于CYP79家族这一假设,设计了针对CYP79A1(高粱)、CYP79B1(欧白芥(Sinapisvalba))、和CYP79B2(拟南芥)中显示序列保守性的区域的简并引物。引物设计中排除了推定参与底物识别的结构域,因为在已知的CYP79中没有一种利用缬氨酸或异亮氨酸作为底物。
总体积20μl的第一轮PCR扩增反应是在10mM Tris-HCl pH9、50mMKCl、1.5mM MgCl2中使用0.5U Taq DNA聚合酶(Pharmacia,瑞典)、200μM dATP、200μM dCTP、200μM dGTP、200μM dTTP、500nM每种引物5’-GCGGAATTCARGGIAAYCCIYTICT-3’(SEQ ID NO:5)和5’-CGCGGATCCGGDATRTCIGAYTCYTG-3’(SEQ ID NO:6)(其中I表示肌苷)、和10ng质粒DNA模板进行的。质粒DNA模板是由pcDNA2.1(Invitrogen,荷兰)中的单向质粒cDNA文库制备的,而所述cDNA文库又是由木薯植物芽尖的未成熟折叠叶片和叶柄构建的。热循环参数是:首先变性,95℃2min;3个循环,95℃5sec、40℃30sec、72℃45sec;32个循环,95℃5sec、50℃5sec、72℃45sec;最后延伸,72℃5min。用巴斯德移液管戳出预期大小210bp的条带,并用于在50μl上文所述相同反应混合液中进行第二轮PCR扩增,只是热循环参数改成:首先变性,95℃2min;20个循环,95℃5sec、50℃5sec、72℃45sec;最后延伸,72℃5min。使用Thermo Sequenaseradiolabled terminator cycle sequencing kit即耐热测序酶放射性标记终止物循环测序试剂盒(Amersham,瑞典)和α-33p-ddNTP(Amersham,瑞典),依照制造商的指示,对产物进行测序。
通过PCR扩增用洋地黄毒苷-11-dUTP(Boehringer,曼海姆,德国)标记基因特异片段,并用作探针及使用DIG系统(Boehringer,曼海姆,德国)筛选木薯cDNA文库。将探针于68℃在5×SSC、0.1%N-肉桂酰肌氨酸、0.02%SDS、1%封闭剂(Boehringer,曼海姆,德国)中杂交过夜。检测前,用0.1×SSC、0.1%SDS于65℃清洗滤膜。
实施例2:CYP79D1和CYP79D2的测序和Southern印迹分析
使用依照实施例1获得的探针由木薯cDNA文库分离了两个相等丰度的全长克隆。它们具有编码61.2和61.3kDa的P450的开放读码框。将这些P450称为CYP79D1和CYP79D2,作为新的CYP79D亚家族的最初两个成员。
使用Thermo Sequenase Fluorescent-labled Primer cyclesequencing kit即耐热测序酶荧光标记引物循环测序试剂盒(7-脱氮dGTP)(Amersham,瑞典)和ALF-Express sequenator即快速测序仪(Pharmacia,瑞典)进行测序。使用GCG Wisconsin Sequence AnalysisPackage即GCG威斯康星序列分析软件包的程序进行序列计算机分析。两种木薯P450有85%同一,而且都与CYP79A1分享54%的同一性。将在氨基酸水平显示超过40%但不足55%序列同一性的P450分到相同家族但不同亚家族。
CYP79D1和CYP79D2中的血红素结合基元是 TF STGRRGCV A(CYP79D1的第470-480位残基),相比于A型P450(Durst等人,Drug MetabolDrug Interac,12:189-206,1995)的共有序列PFGXGRRXCXG包含3个氨基酸替代。在CYP79A1中也发现了下划线所示替代,而CYP79D1和CYP79D2血红素结合基元中的第一个T在CYP79A1、CYP79B1、和CYP79B2中是S。因而,与先前提出的CYP79家族中存在独有的血红素结合序列结构域是抵触的。在CYP79D1和CYP79D2中还找到了另一独特序列结构域PERH(CYP79D1的第450-453位残基),其中有人提出H是CYP79家族特异的。
为了测定CYP79D1和CYP79D2的拷贝数,对木薯栽培载培品种MCol22的基因组DNA进行Southern印迹。如Chen等人在《MaizeHandbook》(玉米手册,Freeling等人编,Springer Verlag,纽约,1994)中所述,由木薯栽培载培品种MCol22的叶片纯化基因组DNA。将DNA在Genomic-tip 100/G(Qiagen,德国)上进一步纯化,用消化酶消化,并在0.6%琼脂糖凝胶(1×TAE)上电泳(10μg DNA/泳道)。将凝胶转至尼龙膜(Boehringer,曼海姆,德国),并于68℃与放射性标记的CYP79D1或CYP79D2克隆进行杂交。杂交后,将滤膜用2×SSC、0.1%SDS于室温清洗两次,再用0.1×SSC、0.1%SDS于68℃清洗两次。使用Storm 840 phosphor imager即磷光体成像仪(MolecularDynamics,加州,美国)将放射性标记的条带显影。使用Random PrimedDNA Labeling Kit即随机引发DNA标记试剂盒(Boehringer,曼海姆,德国)用α-33p-dCTP标记用于Southern杂交的探针。两种探针与Southern印迹上的不同条带发生杂交,证明MCol22基因组中存在这两种基因。基因之间的高度相似性导致微弱交叉杂交。低严谨度清洗(0.5×SSC、0.1%SDS,55℃)未揭示有CYP79D基因的其它拷贝。
实施例3:在巴斯德毕赤酵母中的重组表达
包含CYP79D1或CYP79D2的重组巴斯德毕赤酵母的构建是使用载体pPICZc(Invitrogen,荷兰)来实现的。该载体包含用于控制基因表达的甲醇诱导性AOX1启动子,并编码针对zeocin的抗性,用于实现CYP79D1或CYP79D2在巴斯德毕赤酵母野生型菌株X-33(Invitrogen,荷兰)中的胞内表达。将大肠杆菌菌株TOP10F’用于重组质粒的转化和增殖。
通过PCR导入XhoI位点,紧挨CYP79D1终止密码子的下游。用XhoI和BsmBI消化PCR产物,后一种酶切割于起始密码子ATG下游18bp处。用BstBI和XhoI消化pPICZc。使用由下列寡聚物退火而成的衔接头将载体和PCR产物连接起来:5’-CGAAACG ATGGCTATGAACGTCTCT-3’(SEQ ID NO:7;有义方向)和5’-TGGTAGAGACGTTCATAGC CATCGTTT-3’(SEQ ID NO:8)。衔接头一方面重建了CYP79D1的前18bp(下划线指示起始密码子)并导入了两个沉默突变,另一方面通过BstBI消化除去了一小段载体序列,从而像高度表达的AOX1基因产物一样正确安置CYP79D1起始密码子。以相似方式使用相同衔接头将CYP79D2克隆到pPICZc中,因为CYP79D1和CYP79D2编码序列的前24bp是相同的。
巴斯德毕赤酵母的转化是使用EasySelect Pichia expressionKit Version A即简易选择毕赤酵母表达试剂盒A型(Invitrogen,荷兰)依照制造商的指示进行电穿孔而实现的。通过在巴斯德毕赤酵母菌落上进行的PCR确认了CYP79D1或CYP79D2在zeocin抗性菌落中的存在。
将巴斯德毕赤酵母单菌落在25ml BMGY(1%酵母提取物、2%蛋白胨、0.1M KPi pH6.0、1.34%酵母氮碱、4×10-5%生物素、1%甘油、100μg/ml zeocin)中于28℃、以220rpm培养大约22小时。通过于室温以1500g离心10分钟收获细胞,并接种装有300ml诱导培养基(即含1%甲醇代替甘油的BMGY)的2L带挡板烧瓶,OD600达到0.5。将培养物于28℃以300rpm培养28小时,并在26小时后加入甲醇至0.5%。通过于4℃以3000g离心10分钟沉淀细胞,并用缓冲液A(50mM KPi pH7.9、1mM EDTA、5%甘油、2mM DTT、1mM苯甲基磺酰氟)清洗一次,然后在缓冲液A中重悬至OD600达到130。加入等体积的经酸洗的玻璃珠,并通过涡旋(8×30sec、4℃并立即在冰上冷却)破碎细胞。将裂解物于4℃以12000g离心10分钟,以除去细胞碎片,并将得到的上清液于4℃以165000g离心1小时,以回收微粒体沉淀。将微粒体重悬于缓冲液A,保存于-80℃,临使用前在冰上解冻。
由重组酵母细胞将L-缬氨酸转变成相应肟的能力证明,CYP79D1和CYP79D2在巴斯德毕赤酵母中进行功能性表达。使用仅用载体转化的巴斯德毕赤酵母细胞不发生转变。在完整细胞中测量到代谢活性,证明巴斯德毕赤酵母内源还原酶系统能够支持将电子供给这些植物P450。由将L-缬氨酸积极转变成缬氨酸肟的细胞制备的微粒体的SDS-PAGE显示,存在对应于CYP79D1 cDNA克隆预期分子量62kDa而迁移的其它多肽条带。
关于完整巴斯德毕赤酵母细胞中的CYP79D1活性,通过在丰富培养基中的培养和在OD 0.5时诱导24-30小时而获得了最佳结果。每升培养物生成15-30nmol微粒体CYP79D1。诱导90小时后微粒体CYP79D1的产量是24小时后获得的50%。
实施例4:重组CYP79D1的纯化
除非另外申名,所有步骤都是在4℃进行的。通过一氧化碳差异光谱学、SDS-PAGE、和活性测量来鉴定含CYP79D1级分。
以巴斯德毕赤酵母微粒体作为起始材料,以TX-114相分配(Bordier,J Biol Chem,256:1604-1607,1981;Werck-Reichhart等人,Anal Biochem,197:125-131,1991)作为纯化第一步,分离重组CYP79D1。相分配混合物包含微粒体蛋白质(4mg/ml)、50mM KPipH7.9、1mM DTT、30%甘油、和1%TX-114。于4℃搅动30分钟后,通过温度变化和于22℃以24500g离心25分钟来实现相分离。收集微红的富含TX-114的上层相,并用1%TX-114再次抽提TX-114较少的下层相。合并富含相,并用缓冲液B(10mM KPi pH7.9、2mM DTT)稀释至TX-114浓度低于0.2%。以流速25ml/h将TX-114富含相应用于串联的DEAE-Sepharose FF(Pharmacia,瑞典)的2.6×2.8cm柱和ReactiveRed120琼脂糖(Sigma,密苏里州,美国)的1.6×3cm柱。两种柱子都是用缓冲液C(10mM KPi pH7.9、10%甘油、0.2%TX-114、2mM DTT)平衡的。加样后,用缓冲液C彻底(过夜)清洗柱子。CYP79D1在这些条件下不结合到离子交换柱上,通过梯度洗脱(50ml溶于缓冲液C的0-1.5M KCl)由Reactive Red120琼脂糖洗脱。合并包含相当纯的CYP79D1的级分,在缓冲液C中透析过夜,并应用于用缓冲液C平衡的Reactive Yellow 3A琼脂糖(Sigma,密苏里州,美国)。用缓冲液C清洗柱子,并通过梯度洗脱(50ml溶于缓冲液的0-1.5M KCl)获得CYP79D1。合并包含均质CYP79D1的级分,并在缓冲液D(10mM KPipH7.9、10%甘油、50mM NaCl、2mM DTT)中透析2小时以减少盐和去污剂。将CYP79D1分装保存于-80℃。
使用高Tris线性8-25%梯度凝胶(Fling等人,Anal Biochem,155:83-88,1986)进行SDS-PAGE。在SLM Aminco DW-2000 TM分光光度计(Spectronic Instruments,纽约,美国)上通过一氧化碳差异光谱学对总P450定量,还原型P450和一氧化碳之间的加合物的摩尔消光系数为91mM-1cm-1(Omura等人,J Biol Chem,249:5019-5026,1964)。依照Jefcoate的方法(Jefcote,Methods Enzymol,27:258-279,1978)记录50mM KPi pH7.9、50mM NaCl中的底物结合光谱。
纯化的CYP79D1以62kDa分子量迁移。分离流程的总产量是17%,即由260ml培养物获得1nmol CYP79D1。在进行CO差异光谱学时,始终在448nm产生吸收最大值。无论是使用分离的还是粗制的级分,在420nm都没有观察到最大值。这证明CYP79D1是相当稳定的蛋白质。酵母细胞色素可能干预粗制提取物的光谱学,并掩藏420nm小峰,而且先前已经报导了巴斯德毕赤酵母细胞色素氧化酶会妨碍P450光谱学。在本发明的研究中,CYP79D1的表达水平是高的,而且由细胞色素氧化酶产生的CO差异光谱(最大值在430nm,最小值在445nm)是明显的,为450nm峰上的肩。巴斯德毕赤酵母细胞色素氧化酶结合DEAE柱,因而在P450分离过程中被除去。延长巴斯德毕赤酵母的培养时间(90小时)后,细胞色素氧化酶的含量降低,从而可以在微粒体中检测到较低量的P450。最后,可以通过在硼酸盐缓冲液中进行的TX-114相分配由P450除去干扰性细胞色素氧化酶。在硼酸盐缓冲液中相分配后,P450分配至TX-114贫乏相,而巴斯德毕赤酵母细胞色素氧化酶分配至富含相。
纯化的CYP79D1在存在L-缬氨酸时形成I型底物结合光谱,即在结合底物后44%由低自旋状态转变成高自旋状态。
实施例5:催化活性的测定
重建分离的重组CYP79D1,并在体外使用含2.5pmol CYP79D1、0.05U NADPH P450氧化还原酶(Benveniste等人,Biochem J,235:365-373,1986)、10.6mM L-α-二油酰磷脂酰胆碱、0.35μCi[U-14C]-L-氨基酸(L-Val、L-Ile、L-Leu、L-Tyr、或L-Phe;Amersham,瑞典)、1mM NADPH、0.1M NaCl、和20mM KPi pH7.9的总体积30μl的反应混合液测定其催化活性。在含14C-L-缬氨酸或14C-L-异亮氨酸的测定法中,加入了不同量的未标记L和D-氨基酸(0-6mM)。于30℃保温10分钟后,用60μl乙酸乙酯萃取形成的产物,并在TLC片(MerckKieselgel 60F254)上分离,其中使用正戊烷/二乙醚(50∶50,v/v)或甲苯/乙酸乙酯(5∶1,v/v)分别作为脂肪族化合物和芳香族化合物的洗脱液。将14C标记的肟显影,并使用Storm 840磷光体成像仪(Molecular Dynamics,加州,美国)定量。另外在上文所述相同条件下在存在抑制剂tetcyclasis、ABT、和DPI时测量CYP79D1的活性。
为了进行体外活性测定法,沉淀200μl巴斯德毕赤酵母细胞,并重悬于100μl 50mM Tricine pH7.9和0.35μCi[U-14C]-L-缬氨酸或L-异亮氨酸。于30℃保温30分钟后,用乙酸乙酯萃取细胞,并如上所述分析形成的产物。
在存在大量脂质L-α-二油酰磷脂酰胆碱和100mM NaCl时用高粱NADPH-P450氧化还原酶重建CYP79D1。对在植物中用作含氰苷生物合成前体的五种蛋白质氨基酸测试作为CYP79D1的底物的情况。由L-缬氨酸或L-异亮氨酸形成了相应的肟。在使用L-亮氨酸、L-苯丙氨酸、或L-酪氨酸作为底物时,在检测水平等于用L-缬氨酸观察到的代谢的0.8%的情况下没有明显的代谢。观察到的底物特异性符合木薯体内只存在由L-缬氨酸和L-异亮氨酸衍生的含氰苷的现象。
为了检查抑制剂对分离CYP79D1的影响,使用与木薯微粒体相同的条件在存在tetcyclasis、ABT、和DPI时进行重建。使用分离CYP79D1观察到与木薯微粒体中相同的模式。CYP79D1受到tetcyclasis而非ABT的抑制。与木薯微粒体中的情况相似,DPI通过抑制NADPH-P450氧化还原酶而完全抑制缬氨酸-肟的形成。
在使用木薯微粒体时,以L-缬氨酸和L-异亮氨酸作为底物而产生氰化物,而使用D-缬氨酸和D-异亮氨酸时观察不到代谢。在使用L-缬氨酸时观察到与L-异亮氨酸相比更高的转变率,这与使用由变白的木薯幼苗制备的微粒体得到的数据是相似的。分离的CYP79D1由14C-L-缬氨酸产生14C标记的缬氨酸-肟。当通过加入未标记L-缬氨酸而将14C-L-缬氨酸底物的比活性降低120倍时,观察到14C标记的肟的形成量相应降低。然而,向保温混合物中加入未标记D-缬氨酸不引起14C标记肟的形成量的相应降低。因此,木薯微粒体与分离的CYP79D1都不能代谢D-缬氨酸。D-缬氨酸不能竞争L-缬氨酸说明D-缬氨酸不能以高亲和力结合CYP79D1的结合位点。使用14C-L-异亮氨酸、L-异亮氨酸、和D-异亮氨酸获得了相似结果。
在饱和底物条件下,CYP79D1在以L-缬氨酸作为底物时具有较高转变率。L-异亮氨酸的转变率是用L-缬氨酸观察到的值的大约60%。这与木薯体内亚麻苦苷相比于百脉根苷有更高积累的现象是一致的(4)。
实施例6:CYP79D1的N端测序
如Kahn等人,J Biol Chem,271:32944-32950,1996中所述,将分离的重组CYP79D1进行SDS-PAGE,并将蛋白质转至ProBlot膜(Applied Biosystems,加州,美国)。由膜上切下考马斯亮蓝染色的蛋白质条带,并在配备了联机120A型乙内酰苯硫脲氨基酸分析仪的Applied Biosystems 470A型测序仪上进行测序。在预计的Edman降解循环中,因Asn信号的缺乏而检测到Asn糖基化。
产生CO光谱且包含CYP79D1活性的级分总是在SDS-PAGE后产生两种独特的、靠近迁移的多肽条带。N端氨基酸测序鉴定得出两条带都衍生自CYP79D1。起始甲硫氨酸被酵母加工系统切除。上面那条带前15个残基的测序证明两个天冬酰胺都存在糖基化,而下面那条带只有第一个天冬酰胺发生糖基化。不同的糖基化模式解释了存在两条带的原因。CYP79D1 N端部分的糖基化与N端在易进行糖基化机制的内质网内腔中的定位是一致的。尚不知道在木薯中天然CYP79D1是否糖基化。然而,N端片段的氨基酸测序(15)证明,由高粱幼苗纯化的CYP79D1未糖基化,而且只有少数报导显示存在微粒体P450糖基化。认为在巴斯德毕赤酵母中表达重组CYP79D1后观察到的糖基化反映了酵母系统中的表达。
实施例7:实施例8和9中所用的引物
引物名称 核苷酸序列a  SEQ ID NO:
1Fb GCGGAATTCGAYAAYCCIWSIAAYGC     13
1Rb GCGGATCCGCIACRTGIGGIAHRTTRAA     14
2F GCGGAATTCWSIAAYGCIRTIGARTGG     15
2R GCGGATCCRTTRAAIIINGCIACIGGRTG     16
3F GCGGAATTCCACACAGGAAACAGCTATGAC 17
3Re GCGGATCCAGACGAGTAGCGAGTCACAAC     18
4R#1f GCGGATCCAAGAGGAACAGTACT     19
4R#2f GCGGATCCAAGAGGAACAATGTG     20
5F#1f GCGAATGCATTGCTCCCACTAGCC     21
5R#1f GCGATGGTTATGAGTTCCATTTTG     22
6F#1(na) GCGCATATGGAACTAATAACAATTCTT     23
6R GCGAAGCTTATTAGAAGCTCTGGAGCAG     24
6F#1(Δ(1-31)17α(8aa)) GCGCATATGGCTCTGTTATTAGCAGTTTTTTTCC-TCTTCCTCTTCAAACAA     25
6F#1(Δ(1-52)2E1(10aa)) GCGCATATGGCTCGTCAAGTTCATTCTTCTTGG-AATTTACCACCAGGCCCC     26
a以5′-3′方向显示序列。
bF:正向引物,R:反向引物。
e覆盖在两个克隆#1和#2中相同的序列。
f覆盖两个克隆#1和#2的特异序列。
引物名称 限制性位点 编码的氨基酸   SEQ ID NO:
  1Fb     EcoRI   DNPSNAc     27
  1Rb     BamHI   FNV/LpHVAc     28
2F EcoRI SNAVEWc 29
  2R     BamHI   HPVAXFNc     30
  3F     EcoRI   d
  3Re     BamHI   VVTRYSS     31
  4R#1f     BamHI   TVLFLL     32
  4R#2f     BamHI   ATLFLL     33
  5F#1f   g
  5R#1f   MELITI     34
  6F#1(na)     NdeI   MELITIL     35
  6R     HindIII   LLQSF*h     36
  6F#1(Δ(1-31)17α(8aa))     NdeI   MALLLAVFFLFLFKQ     37
  6F#1(Δ(1-52)2E1(10aa))     NdeI   MARQVHSSWNLPPGP     38
bF:正向引物,R:反向引物。
c用于设计引物的氨基酸共有序列。
dpcDNA2.1的特异引物,正好位于cDNA文库5’端插入位点的上游。
e覆盖两个克隆#1和#2中相同的序列。
f覆盖两个克隆#1和#2的特异序列。
g#1中5’UTR的特异引物。
h星号表示终止密码子。
实施例8:海韭菜CYP79基因的cDNA克隆
用于生成海韭菜CYP79同源物的cDNA片段的PCR方法
单向质粒cDNA文库是由InVitrogen(卡尔斯巴德,加州)使用包含lacZ启动子的表达载体pcDNA2.1由海韭菜的花和果实(分裂果)构建的。植物材料是在Southern Amager的Aflandshage在resund海滨收集的,立即在液氮中冷冻,并保存于-80℃。
根据衍生自S.bicolor的CYP79A1(GenEMBL U32624)、衍生自欧白芥的CYP79Bl(GenEMBL AF069494)、衍生自拟南芥的CYP79B2、和衍生自木薯(Manihot esculenta)的CYP79D1(GenEMBL AF140613)的PCR片段中的保守氨基酸序列设计了简并PCR引物。在50μl总体积中使用100pmol每种引物、5%二甲亚砜、200μM dNTP、和2.5U Taq DNA聚合酶在PCR缓冲液(50mM KCl、10mM Tris-HCl pH8.8、1.5mM MgCl2、0.1%Triton X-100)中进行两轮PCR扩增反应。热循环参数是:首先95℃2min;然后30个循环95℃5sec、45℃30sec、72℃45sec;最后72℃5min。第一轮PCR反应是使用引物1F和1R(实施例7)在100ng由cDNA文库制备的模板DNA或使用Nucleon Phytopure Plant DNAExtraction Kit(Amersham)制备的基因组DNA上进行的。使用QIAquickPCR Purification Kit即QIA快速PCR纯化试剂盒(Qiagen)纯化PCR产物,用30μl 10mM Tris-HCl pH8.5洗脱,并作为模板(1μl)用于第二轮PCR反应。第二轮PCR是使用衍生自cDNA和基因组DNA二者的PCR片段并使用简并引物2F和2R(实施例7)进行的。将一部分(5μl)PCR反应液应用于1.5%琼脂糖/TBE凝胶,并观察到以cDNA和基因组DNA二者作为模板的预期大小大约200bp的条带。使用QIAquick PCRPurification Kit即QIA快速PCR纯化试剂盒纯化剩余PCR反应液,并用30μl 10mM Tris-HCl pH8.5洗脱。用EcoRI和BamHI消化纯化的PCR片段(5μl),由1.5%琼脂糖/TBE凝胶切下,使用QIAEX II AgaroseGel Extraction Kit即QIAEX II琼脂糖凝胶提取试剂盒(Qiagen)纯化,并连接到经EcoRI和BamHI消化的pBluescript II SK载体(Stratagene)中。使用Thermo Sequenase Fluorescent-labledPrimer cycle sequencing kit即耐热测序酶荧光标记引物循环测序试剂盒和7-脱氮dGTP(Amersham,瑞典),将由cDNA文库衍生的7个克隆和由基因组DNA衍生的3个克隆测序(ALF Express,Pharmacia)。使用GCG Wisconsin Sequence Analysis Package即GCG威斯康星序列分析软件包中的程序进行序列分析。
由海韭菜的花和果实构建的质粒cDNA文库的筛选
cDNA和基因组DNA都产生与其它已知CYP79序列高度类似的相同PCR片段。将克隆的PCR片段作为模板,使用商品化的T3和T7引物通过PCR产生350bp洋地黄毒苷-11-dUTP标记的探针(TRI1)。将标记探针用于筛选pcDNA2.1 cDNA文库的660,000个菌落。于68℃在5×SSC(0.75M NaCl、75mM柠檬酸钠pH7.0)、0.1%N-肉桂酰肌氨酸、0.02%十二烷基磺酸钠、和1%封闭剂(Boehringer,曼海姆)中杂交过夜。将膜在高严谨度条件(65℃,0.1×SSC、0.1%十二烷基磺酸钠)下清洗两次,与抗洋地黄毒苷-AP一起保温,并依照Boehringer(曼海姆)的指示使用5-溴-4-氯-3-吲哚磷酸酯和氮蓝四唑显影。在相同条件下重筛选阳性菌落,并对阳性单菌落进行测序和分析。
设计用于筛选全长克隆的5’端探针的PCR方法
上文所述文库筛选产生了两个非常相似的部分克隆,称为#1和#2,它们的N端序列是不同的。为了由pcDNA2.1文库分离相应的全长克隆,使用上文所述相同PCR条件(只是将退火温度设成55℃)进行了两轮连续PCR反应。第一轮PCR反应是使用引物3F和3R(实施例7)进行的,并使用100ng cDNA文库作为模板。将第一轮PCR反应的纯化PCR产物(QIAquick PCR Purification Kit即QIA快速PCR纯化试剂盒)用作第二轮PCR反应的模板(1μl),其中使用引物4R#1或4R#2和引物3F(实施例7)。将第二轮的PCR片段在2%琼脂糖/TBE上分开,由凝胶切下迁移最慢的条带,纯化(QIAE II Agarose Gel Extraction Kit即QIAE II琼脂糖凝胶提取试剂盒),EcoRI和BamHI消化,克隆到pBluescript II SK中,并测序。使用引物4R#1和3F(实施例7)的第二轮PCR获得了具有位于EcoRI克隆位点下游26个氨基酸处的推定起始甲硫氨酸的PCR片段。使用引物4R#2和3F(实施例7)的第二轮PCR反应产生了长度与早就用TRI1探针分离的部分cDNA克隆完全一样的PCR片段。结果,将用4R#1和3F克隆的PCR片段作为模板,使用引物5F#1和5R#1(实施例7)产生洋地黄毒苷-11-dUTP标记的探针(TRI2)。使用上文所述相同条件,将部分覆盖克隆#1的5’非翻译区(UTR)和开放读码框5’末端的TRI2与TRI1探针一起用于筛选pcDNA2.1文库。第一份浸提物用TRI2进行杂交,第二份用TRI1杂交。在筛选了1,000,000个菌落后,分离得到长度与PCR片段完全一样的2个单独cDNA克隆。
结果
根据CYP79A1和属于CYP79家族的推定N-羟化酶的序列比对,设计了覆盖两个CYP79特异区域的4种简并寡核苷酸引物(实施例7中描述的1F、2F、1R、2R),并用于以由海韭菜花和果实制备的基因组DNA和cDNA作为模板的嵌套PCR反应。由两种模板扩增到预期大小(即大约200bp)且在氨基酸水平显示与CYP79序列有62-70%同一性的PCR片段,对其克隆,并进一步用于筛选cDNA文库。分离得到两个cDNA克隆,称为#1和#2,并通过序列比较证实与CYP79家族分享高度序列同一性。使用克隆特异PCR引物,分离得到对应于#1的全长克隆。开放读码框编码分子量60.8kDa的蛋白质。克隆#1与克隆#2的全长序列的比较揭示,克隆#2的5’端短6bp,但是包含在相当于克隆#1指定为第26位氨基酸残基的位置处发现有克隆#1中未曾见到的甲硫氨酸密码子。这个甲硫氨酸密码子周围的序列不符合单子叶植物起始密码子的一般序列情况。因此最有可能的是克隆#2与全长相比缺乏6bp。
由克隆#1和#2编码的细胞色素P450显示与早就知道的CYP79家族成员有44-48%同一性(见下表),因此鉴定成新的亚家族CYP79E的最早两个成员,称为CYP79E1(SEQ ID NO:9)和CYP79E2(SEQ ID NO:11)。CYP79E1与CYP79E2之间的序列同一性是94%。
表:CYP79家族的6个成员之间的同一性和相似性百分比
  相似性同一性  CYP79E1  CYP79E2  CYP79A1  CYP79B1 __CY CYP79D1P79B2
  CYP79E1CYP79E2CYP79A1CYP79B1CYP79B2CYP79D1             95.2    61.7    58.1    58.9   60.094.1            61.5    57.6    58.5   59.248.8    48.8            65.5    67.1   65.844.9    44.9    51.3            92.3   65.144.5    44.6    52.6    89.3           67.346.4    46.5    51.5    49.1    50.7
实施例9:在大肠杆菌中的重组表达
表达构建物
将表达载体pSP19g10L用于在大肠杆菌中表达CYP79E1和CYP79E2构建物。该表达载体包含lacZ启动子并融合T7噬菌体基因10的短前导序列(g10L),而且已经显示在大肠杆菌中有效表达异源蛋白(Olins等人,Methods Enzymol,185:115-119,1990)。在细胞色素P450的情况中,通过修饰开放读码框的5’端以提高A和T的含量(Stormo等人,Nucleic Acids Res,10:2971-2996,1982;Schauder等人,Gene,78:59-72,1989;Barnes等人,Proc Natl Acad Sci USA,88:5597-5601,1991)并通过用牛P45017α(Barnes等人,Proc NatlAcad Sci USA,88:5597-5601,1991)或人P4502E1或2D6(Gillam等人,Arch Biochem Biophys,312:59-66,1994;Gillam等人,Arch Biochem Biophys,319:540-550,1995)N端序列的密码子替代5’端的许多密码子,从而获得表达水平的升高。为了利用这些知识,构建了许多不同的构建物。
使用Pwo聚合酶(Boehinger,曼海姆)通过PCR产生了克隆#1的3种不同构建物,在起始密码子处导入NdeI限制性位点,紧挨终止密码子的后面导入HindIII限制性位点。使用引物6F#1(na)和6R#1(实施例1)合成了编码天然CYP79E1的全长构建物(CY79E1na),其在第3和5位密码子处引入了沉默突变以提高AT含量。使用引物6F#1(Δ(1-31)17 α(8aa))和6R#1或引物6F#1(Δ(1-52)2E1(10aa))和6R#1(实施例7)构建了2种截短构建物。构建物CYP79E1Δ(1-31)17α(8aa)编码其中用P45017α(Halkier等人,Arch Biochem Biophys,322:369-377,1995;Barnes等人,Proc Natl Acad Sci USA,88:5597-5601,1991)的8个富含AT密码子替代天然5’序列的31个密码子的CYP79E1截短形式;在构建物CYP79E1Δ(1-52)2E1(10aa)中,用P4502E1的10个富含AT密码子替代天然5’序列的前52个密码子,并在第53和55位密码子处导入沉默突变。用NdeI和HindIII消化PCR片段,并连接到经NdeI和HindIII消化的pSP19g10L表达载体(Barnes,Methods Enzymol,272:3-14,1996)中。将独有限制性位点NcoI和PmlI用于用cDNA克隆的类似片段替代PCR片段(1045bp)的中部。将构建物中衍生自PCR的剩余部分测序以排除PCR错误。
因为分离得到的CYP79E2克隆符合载体pcDNA2.1中lacZ基因的前24个密码子的读码框,所以作为第四种构建物测试这个克隆,称为CYP79E2lacZ(24aa)。为了比较,还制备了等同的第五种构建物CYP79E1Δ(1-2)lacZ(24aa)
所有构建物都包含在最高度表达的大肠杆菌基因中发现的原始终止序列TAAT。使用载体pSP19g10L的所有构建物都除去了它们的3’UTR,因为据报导包含3’UTR会阻止或降低某些基因的表达。在基于pcDNA2.1的构建物中,保留了3’UTR。
在大肠杆菌中的表达
将所有表达构建物转化到大肠杆菌菌株JM109(Stratagene)和XL-1 blue(Stratagene)中。在所有情况中,JM109菌株证实是最有效的。
CYP79E1和CYP79E2包含19和17个在大肠杆菌基因中罕见的AGA或AGG精氨酸密码子。在密码子发生率与tRNA含量之间已建立了强阳性关联。因此,将克隆#1的天然和Δ(1-52)2E1(10aa)构建物以及克隆#2的构建物与编码罕见精氨酸密码子tRNA基因的pSBET(Schenk等人,BioTechniques,19:196-200,1995)一起共转化到JM109中。将单菌落在LB培养基(50μg/ml氨苄青霉素)中于37℃以225rpm培养过夜,并用于接种100倍体积的修改后TB培养基(50μg/ml氨苄青霉素、1mM硫胺素、75μg/mlδ-氨基-乙酰丙酸、1mM异丙基-β-D-硫代半乳糖苷(IPTG)),于28℃以125rpm培养48小时。
表达水平和生物合成活性的测量
通过CO差异光谱学测定不同构建物的表达水平,并使用消光系数ε450-490 91mM-1cm-1进行定量(Omura等人,J Biol Chem,239:2370-2378,1964)。使用100μl或500μl完整大肠杆菌细胞或者使用TritonX-114相分配的富含相测绘光谱,后者溶于50mM KH2PO4/K2HPO4 pH7.5、2mM EDTA、20%甘油、0.2%Triton X-100(总体积1ml)。为了制备用于体内研究的大肠杆菌,将1ml细胞培养物以7000g离心2分30秒,并重悬于100μl 50mM Tricine pH7.9、1mM苯甲基磺酰氟。对于体外研究,由表达克隆#1的天然或Δ(1-52)2E1(10aa)构建物或克隆#2的构建物的大肠杆菌(JM109)细胞制备原生质球,然后如先前所述(Halkier等人,Arch Biochem Biophys,322:369-377,1995)温度诱导相分配(0.6%Triton X-114、30%甘油)。通过施用[U-14C]酪氨酸(0.35μCi,7.39μM)、对羟基苯乙醛肟(0或0.1mM)、或对羟基苯乙腈(0或0.1mM)以重悬100μl大肠杆菌细胞来进行体内催化活性的测量。在重建实验中使用相分配的富含相测量体外活性。标准反应混合物(总体积50μl)包含5μl富含相、0.375U S.bicolor NADPH-细胞色素P450氧化还原酶、5μl L-α-二肉桂酰磷脂酰胆碱(DLPC)、0.6mM NADPH、和14mM KH2PO4/K2HPO4 pH7.9。测试了下列底物:L-[U-14C]酪氨酸(0.20μCi、9.04μM)、L-[U-14C]苯丙氨酸(0.20μCi、8.8μM)、和L-3,4-二羟基苯基[3-14C]丙氨酸(0.20μCi、400μM)。还在包含纯化的CYP791E1(Kahn等人,Plant Physiol,115:1661-1670,1997;Bak等人,Plant Mol,36:393-405,1998)的重建实验中测试了L-[U-14C]酪氨酸(0.20μCi、9.04μM)。在摇动水浴中于30℃保温1小时,即在加入底物(体内实验)或NADPH(体外实验)后开始,在加入乙酸乙酯后终止。如先前所述(Mller等人,J Biol Chem,254:8575-8583,1979)使用薄层层析(TLC)分析,通过放射性产物的形成来监测生物合成活性,并使用Storm 840磷光体成像仪(MolecularDynamics,桑尼维尔,CA)进行检测和定量。在TLC应用前,用乙酸乙酯萃取样品。在此步骤中,过剩的放射性标记酪氨酸保持在水相,从而防止原点的过度曝光。将全部乙酸乙酯相应用于TLC板。在有些实验中,不可避免的携带少量水相导致原点出现酪氨酸条带。在TLC板上预先将未标记的参照化合物(对羟基苯乙醛肟、对羟基苯乙腈、和对羟基苯甲醛)划线,从而能够在紫外线下目视检测。
完整大肠杆菌细胞的一氧化碳结合光谱在450nm显示最大吸收,这是下列三种构建物形成功能性细胞色素P450的症候:CYP79E1na、CYP79E1Δ(1-52)2E1(10aa)、和CYP79E2lacZ(24aa)。在进行或不进行pSBET共转化的情况下测绘光谱,但是在所有情况中细胞色素P450的含量低得不足以定量。为了获得精确测定,通过分离大肠杆菌原生质球,随后温度诱导Triton X-114相分配,由此富集细胞色素P450(Werck-Reichart等人,Anal Biochem,197:125-131,1991;Halkier等人,Arch BiochemBiophys,322:369-377,1995)。使用CYP79E2lacZ(24aa)获得了最高表达水平(在JM109细胞中,48小时后)56nmol/L培养物。该水平与使用作为阳性对照的S.bicolor构建物CYP79A1Δ(1-33)17α(8aa)(Halkier等人,Arch Biochem Biophys,322:369-377,1995)获得的表达水平62nmol/L培养物相当。具有经修饰的P45017αN末端的CYP79E1Δ(1-31)17α(8aa)和空载体不展示任何可检测光谱。
实施例10:用CYP71E1重建CYP79E
使用来自两种物种S.bicolor和海韭菜的酶实现了含氰苷合成的膜相关途径的重建,导致对羟基扁桃腈即蜀黍苷的糖苷配基(体外视作对羟基苯甲醛)的形成。在包含酪氨酸、NADPH、NADPH-细胞色素P450氧化还原酶、CYP71E1、和CYP79E1或CYP79E2的重建实验中,积累了可观数量的对羟基苯乙腈和对羟基苯甲醛。
实施例11:实施例12和13中所有的引物
下列PCR引物是根据发现包含于GenBank编号AB010692中的CYP79A2的拟南芥Columbia载培品种基因组序列而设计的。下划线指示加入的限制性位点,斜体指示编码CYP17A的序列:
A2F1.......5′-GTG CATATGCTTGACTCCACCCCAATG-3′(SEQ ID NO:3),
A2R1......5′-ATGCATTTTTCTAGTAATCTTTACGCTC-3′(SEQ ID NO:4),
A2F2.......5′-CGT GAATTCCATATGCTCGCGTTTATTATAGGTTTGC-3′(SEQ ID NO:5),
A2R2......5′-CGG AAGCTTATTAGGTTGGATACACATGT-3′(SEQ ID NO:6),
A2R3......5′-CGTCACTTGTGCTTTGATCTCTTC-3′(SEQ ID NO:7),
A2F3.......5′-GAACTAATGTTGGCGACGGTTGAT-3′(SEQ ID NO:8),
A2FX1....5′-CGT GAATTCCATATGGCTCTGTTATTAGCAGTTTTTCTCGCGTTTATTATA-
         GGTTTG-3′(SEQ ID NO:9),
A2FX2....5′-CGT GAATTCCATATGGCTCTGTTATTAGCAGTTTTTCTTCTTCTTGCATTAAC-
         TATG-3′(SEQ ID NO:10),
A2R4......5′-CAT CTCGAGTCTTCTTCCACTGCTCTCCTT-3′(SEQ ID NO:11),
A2FX3....5′-TTAATCGGAAACCTACC-3′(SEQ ID NO:12);
另外,还使用了下列引物:
17AF.......5′-CGT GAATTCCATATGGCTCTGTTATTAGCTGTT-3′(SEQ ID NO:13),
A1R........5′-GGGCCACGGCACGGGACC-3′(SEQ ID NO:14),
实施例12:CYP79A2 cDNA的克隆
使用引物A2F1和A2R1在展现2.5×107pfu拟南芥Wassilewskija载培品种长角果cDNA文库CD4-12(由Linda A.Castle博士和David W.Meinke博士惠赠,Department of Botany,Oklohoma StateUniversity,Stillwater,俄克拉荷马州,美国)的噬菌体DNA和ABRC上进行PCR。在含1.5mM MgCl2的Expand HF缓冲液(Roche MolecularBiochemicals)中建立50μl总体积的PCR反应,其中添加了200μMdNTP、50pmol每种引物、和5%(v/v)DMSO。将反应液于97℃保温3分钟后,加入2.6U Expand High Fidelity PCR system即延伸高保真PCR系统(Roche Molecular Biochemicals),并进行35个循环(95℃90sec、65℃60sec、70℃120sec)。取0.5μl反应液进行嵌套PCR,其中使用引物A2F2和A2R2以及相同PCR条件。由琼脂糖凝胶切下预期大小的PCR片段,克隆到经EcoRI和HindIII消化的pYX223(R&D Systems)中,并对衍生自两个嵌套PCR反应的10个克隆的插入片段进行测序。
使用Thermo Sequenase Fluorescent-labled Primer cyclesequencing kit即耐热测序酶荧光标记引物循环测序试剂盒(7-脱氮dGTP)(Amersham Pharmacia Biotech)进行测序,并在ALF-ExpressDNA Sequencer即ALF快速DNA测序仪(Amersham Pharmacia Biotech)上进行分析。使用GCG Wisconsin Sequence Analysis Package即GCG威斯康星序列分析软件包的程序进行序列计算机分析。以缺口生成罚分8和缺口延伸罚分2使用GAP程序来比较成对序列。使用NetPlantGene进行剪接位点预测。
CYP79A2是在拟南芥基因组中鉴定的几种CYP79同源物之一。依照计算机辅助剪接位点预测,它包含一个内含子,这是A型细胞色素P450的特征。虽然它是CYP79A2的唯一内含子,但是CYP79家族的其它成员具有一个或多个其它内含子。全长CYP79A2 cDNA的序列确认了这一剪接位点预测。CYP79A2 cDNA的读码框具有两个潜在ATG起始密码子,一个位于5’非翻译区中终止密码子下游15bp处,另一个位于更下游15bp处。对于所有进一步研究使用由第二个ATG密码子起始的cDNA。该cDNA编码523个氨基酸的蛋白质,它与参与含氰苷蜀黍苷生物合成的CYP79A1具有64%相似性和53%同一性。
实施例13:CYP79A2大肠杆菌表达构建物
表达构建物衍生自CYP79A2 cDNA,而后者是通过融合由拟南芥基因组DNA扩增的两个外显子而得到的。这两个外显子是通过PCR使用1.25U Pwo聚合酶(Roche Molecular Biochemicals)和4mg模板DNA扩增的,外显子1使用引物A2F2和A2R3,外显子2使用引物A2F3和A2R2。在含2mM MgSO4的Pwo聚合酶PCR缓冲液(Roche MolecularBiochemicals)中建立50μl总体积的PCR反应,其中添加了200μMdNTP、50pmol每种引物、和5%(v/v)DMSO。将反应液于94℃保温3分钟后,进行30个PCR循环即94℃20sec、60℃10sec、72℃30sec。用EcoRI(外显子1)和HindIII(外显子2)消化PCR片段后,用T4多核苷酸激酶(New England Biolabs)将由引物A2R3和A2F3及Pwo聚合酶产生的平末端磷酸化。将两个外显子连接到经EcoRI和HindIII消化的载体pYX223中。对克隆的DNA测序以排除掺入PCR错误的可能性。
在表达载体pSP19g10L(Barnes,Meth Enzymol,272:3-14,1996)中构建了四个表达构建物:
●79A2(“天然”),其中79A2指CYP79A2编码序列;
●17A(1-8)79A2(“修饰”),其中17A(1-8)指经修饰的CYP17AN端,编码氨基酸序列MALLLAVF;
●17A(1-8)79A2Δ(1-8)(“截短修饰”),其中79A2Δ(1-8)指截去了第1-8位氨基酸的CYP79A2编码序列;和
●17A(1-8)79A1(25-74)79A2Δ(1-40)(“嵌合”),其中79A1(25-74)指CYP79A1的第25-74位氨基酸,79A2Δ(1-40)指截去了第1-40位氨基酸的CYP79A2编码序列。
CYP79A2的N端修饰设计成实现真核细胞色素P450在大肠杆菌中的高水平表达。构建了两个构建物,分别在CYP79A2(产生“修饰”CYP79A2)或截短型CYP79A2(产生“截短-修饰”CYP79A2)的N末端前面导入牛细胞色素P450 CYPl7A的8个N端氨基酸。这种细胞色素P450的N端似乎尤其适用于在大肠杆菌中表达。在第四种构建物(“嵌合”CYP79A2)中,将CYP79A1Δ(1-24)bov(Halkier等人,Arch Biochem Biophys,322:369-377,1995)的N端57个氨基酸融合编码CYP79A2催化结构域(第41-523位氨基酸)的cDNA。
N端修饰是如下导入的:产生由CYP79A2 cDNA的ATG密码子至PstI位点的PCR片段。将这些片段连接CYP79A2 cDNA的PstI/HindIII片段和经EcoRI和HindIII消化的载体pYX223。为了得到修饰和截短修饰的CYP79A2,使用引物对A2FXl与A2R4以及A2FX2与A2R4。通过使用引物17AF与A1R由CYP79A1Δ(1-25)bovcDNA(Halkier等人,Arch BiochemBiophys,322:369-377,1995)产生的PCR片段与使用引物A2FX3与A2R4由CYP79A2 cDNA产生的PCR片段的平端连接来进行与CYP79A1 N端的融合。对PCR产物进行克隆和测序,以排除掺入PCR错误的可能性。通过NdeI和HindIII消化由pYX223切下不同的CYP79A2 eDNA,并连接到经NdeI和HindIII消化的pSP19g10L中。
实施例14:大肠杆菌中的CYP79A2表达
将用实施例13中所述表达构建物转化的大肠杆菌菌株JM109的细胞在添加100μg/ml氨苄青霉素的LB培养基中培养过夜,并用于接种100ml含50μg/ml氨苄青霉素、1mM硫胺素、75μg/mlδ-氨基-乙酰丙酸、和1mM异丙基-β-D-硫代半乳糖苷的修改后TB培养基。将细胞于28℃以125rpm培养65小时。取75ml培养物沉淀细胞,并重悬于由0.1MTris HCl pH7.6、0.5mM EDTA、250mM蔗糖、和250μM苯甲基磺酰氟组成的缓冲液。加入溶菌酶至终浓度100μg/ml。于4℃保温30分钟后,加入乙酸镁至终浓度10mM。沉淀原生质球,重悬于5ml由10mMTris-HCl pH7.5、14mM乙酸镁、和60mM乙酸钾pH7.4组成的缓冲液,并在Potter-Elvehjem中匀浆。DNA酶和RNA酶处理后,加入甘油至终浓度29%。如Halkier等人,Arch Biochem Biophys,322:369-377,1995中所述,进行温度诱导的Triton X-114相分配。通过SDS-PAGE分析Triton X-114富含相。
对重悬浮于900μl含50mM KPi pH7.5、2mM EDTA、20%(v/v)甘油、0.2%(v/v)Triton X-114、和少许连二亚硫酸钠颗粒的缓冲液的100μl大肠杆菌原生质球进行Fe2+·CO与Fe2+差异光谱学(Omura等人,J Biol Chem,239:2370-2378,1964)。将悬浮液分到两个比色杯中,并在SLM Aminco DW-2000 TM分光光度计(SLM Instruments,乌尔班纳,伊利诺伊州)上记录400和500nm之间的基线。向样品比色杯中通入CO 1分钟,并记录差异光谱。根据消光系数91mmol-1cm-1评估功能性细胞色素P450的量。
如Sibbesen等人,J Biol Chem,270:3506-3511,1995中所述,在用由Sorghum bicolor(L.)Moench纯化的NADPH:细胞色素P450氧化还原酶重建的大肠杆菌原生质球中测量CYP79A2的活性。在典型的酶测定法中,将5μl原生质球和4μl NADPH:细胞色素P450还原酶(相当于0.04U,定义为1μmol细胞色素c min-1)与3.3μM L-[U-14C]苯丙氨酸(453mCi mmol-1)一起在含30mM KPi pH7.5、4mM NADPH、3mM还原型谷胱甘肽、0.042%(v/v)吐温80、和1mg/ml L-α-二肉桂酰磷脂酰胆碱的总体积30μl的缓冲液中保温。为了研究底物特异性,分别使用3.7μM L-[U-14C]酪氨酸(449mCi mmol-1)、0.1mM L-[甲基-14C]甲硫氨酸(56mCi mmol-1)、和1mM L-[5-3H]色氨酸(33Ci mmol-1)代替L-[U-14C]苯丙氨酸。于26℃保温4小时后,取一半反应混合物通过薄层层析在硅胶60 F254片(Merck)上进行分析,其中使用甲苯:乙酸乙酯(5∶1,v/v)作为洗脱液。通过Storm840磷光体成像仪(MolecularDynamics,桑尼维尔,加州)对14C放射性条带进行显影和定量。通过放射自显影将3H放射性条带显影。由时间点30分钟、1小时、2小时、和6小时的测定显示,保温过程的前两个小时内由L-[U-14C]苯丙氨酸开始的产物形成随时间是线性的。为了评估Km和Vmax值,将反应混合物于26℃保温2小时。为了进行GC-MS分析,将含33μM L-苯丙氨酸(Sigma)或33μM高苯丙氨酸的450μl反应混合物于26℃保温4小时,并用总体积600μl的氯仿抽提两次。合并有机相并蒸发至干燥。将残余物溶于15μl氯仿,并通过GC-MS进行分析。GC-MS分析是在直接偶联Jeol JMS-AX505W质谱仪的HP5890系列II气相层析仪上进行的。使用SGE柱(BPX5,25m×0.25mm,0.25μm薄膜厚度)(上部压力100kPa,无隙注射)。炉温程序如下:80℃3min,80-180℃5℃/min,180-300℃20℃/min,300℃10min。以E1模式(70eV)于200℃运行离子源。苯乙醛肟(E)-和(Z)-异构体的停留时间分别是12.43分和13.06分。两种异构体具有相同的断裂模式,以m/z 135、117、和91为最突出的峰。
在由包含“天然”、“截短-修饰”、和“嵌合”CYP79A2的表达构建物的大肠杆菌原生质球的温度诱导Triton X-114相分配获得的去污剂富含相中检测到在SDS-PAGE上以表观分子量大约60kDa迁移的蛋白质条带。正如预期的,“嵌合”CYP79A2以略高于“天然”和“截短-修饰”CYP79A2的分子量进行迁移。在包含“修饰”CYP79A2表达构建物或空载体的细胞的去污剂富含相中没有检测到条带。不同原生质球制剂的光谱分析显示,“嵌合”CYP79A2和较低程度的“截短-修饰”CYP79A2产生452nm特征峰的CO差异光谱,指示存在功能性细胞色素P450。在所有原生质球制剂中都发现了415nm峰。该峰可能来自由大肠杆菌衍生的血红素蛋白、在培养基中存在δ-氨基乙酰丙酸时产生的未附着血红素基团、或非功能性构象的细胞色素P450。根据452nm峰,估计“嵌合”CYP79A2的表达水平是每升培养物50nmol细胞色素P450。在与L-[14C]苯丙氨酸一起保温时,用“天然”、“截短-修饰”、或“嵌合”CYP79A2表达构建物转化并用由S.bicolor纯化的NADPH:细胞色素P450氧化还原酶重建的大肠杆菌原生质球产生两种放射性标记的化合物,它们在薄层层析中与苯乙醛肟的(E)-和(Z)-异构体共迁移。在包含含“修饰”CYP79A2表达构建物或空载体的大肠杆菌原生质球的测定混合物中没有检测到这些产物。GC-MS分析显示,在“嵌合”CYP79A2的反应混合物中存在具有相同断裂模式的这两种化合物,但是对照反应中没有。由停留时间和断裂模式将这些化合物鉴定为苯乙醛肟的(E)-和(Z)-异构体。对表达“天然”或“嵌合”CYP79A2的大肠杆菌原生质球施用L-[14C]酪氨酸、L-[14C]甲硫氨酸、或L-[3H]色氨酸并不引起可检测量的相应醛肟的生成。在表达“嵌合”CYP79A2的大肠杆菌原生质球中研究了CYP79A2代谢DL-高苯丙氨酸的能力。反应混合物的GC-MS分析显示不存在可检测量的高苯丙氨酸衍生醛肟。以L-[14C]苯丙氨酸作为底物,使用表达“天然”CYP79A2的大肠杆菌原生质球测定得到CYP79A2的Km值为6.7μmol L-1,Vmax值为16.6pmol min-1(mg蛋白质)-1。由于使用“天然”CYP79A2没有获得CO光谱,所以不可能估计功能性“天然”CYP79A2的量。然而,根据功能性“嵌合”CYP79A2的表达水平,可以估计“天然”CYP79A2的转换数是0.24min-1
CYP79A2的底物特异性似乎是相当窄的,因为L-酪氨酸、DL-高苯丙氨酸、L-色氨酸、和L-甲硫氨酸都不能被该酶代谢。高底物特异性符合由参与含氰苷生物合成的CYP79同源物获得的结果。重组CYP79A2的活性强烈依赖反应混合物的pH,在较低程度上依赖几个其它因素。与在pH7.5时的活性相比,“嵌合”CYP79A2的活性在pH6是25%,在pH6.5是50%,在pH7.0是80%,在pH7.9是70%。加入吐温80至终浓度0.083%(v/v)导致醛肟生成增加1.5倍。加入还原型谷胱甘肽至终浓度3mM会刺激醛肟生成,但程度较低。
实施例15:CYP79A2在转基因拟南芥中的组成性表达
将拟南芥Columbia载培品种用于所有的实验。在空调拟南芥箱(Percival AR-60 I,Boone,爱荷华州,美国)中以光合流量100-120μmol光子m-2sec-1、于20℃、和70%相对湿度培养植物。光照期对于用于转化的植物是12小时,对于用于生化分析的植物是8小时。
为了在拟南芥中在CaMV35S启动子的控制下表达CYP79A2,通过几个亚克隆步骤将天然全长CYP79A2 cDNA导入经EcoRI和KpnI消化的pRT101(Tpfer等人,Nucleic Acid Res,25:989-994,1994)中。通过花浸渍(Clough等人,Plant J,16:735-743,1998),使用溶于10mM MgCl2的0.005%(v/v)Silwet L-77和5%(w/v)蔗糖,将用该构建物转化的根癌土壤杆菌菌株C58(Zambryski等人,EMBO J,2:2143-2150,1983)用于植物转化。让种子在添加50μg/ml卡那霉素、2%(w/v)蔗糖、和0.9%(w/v)琼脂的MS培养基上发芽。两周后选择转化体并转移至土壤。
由6周龄植株(9株转基因植株和3株野生型植株)采集莲座叶(每株植物采5-8片不同龄的叶片),立即在液氮中冷冻,并冻干48小时。如Srensen在《Canola and Rapeseed-Production,chemistry,nutrition and processing technology》(芸苔和油料种子:生成、化学、营养、和加工技术,Shahidi编,Van Nostrand Reinhold,纽约,第149-172页,1990)中所述,分析脱磺酸基芥子油苷。简而言之,取2-5mg冻干材料在3.5ml沸腾的70%(v/v)甲醇中通过Polytron匀浆器匀浆1分钟,加入10μl内部标准(5mM对羟基苯甲基芥子油苷;Bioraf,丹麦),继续匀浆1分钟。沉淀植物材料,并将沉淀通过Polytron匀浆器用3.5ml沸腾的70%(v/v)甲醇再次抽提1分钟。沉淀植物材料,用3.5ml 70%(v/v)甲醇清洗,并离心。合并上清液,并上样至如下平衡的DEAE Sephadex A-25柱:取25mg DEAE Sephadex A-25在1ml 0.5M醋酸盐缓冲液pH5中溶胀过夜,装到5ml移液枪头中,并用1ml水清洗。将植物提取物上样,并用2ml 70%(v/v)甲醇、2ml水、和0.5ml 0.02M醋酸盐缓冲液pH5清洗柱子。应用Helix pomatia硫酸酯酶(H-1型,Sigma;0.1ml,2.5mg/ml,溶于0.02M醋酸盐缓冲液pH5),并将柱子于室温静置16小时。用2ml水进行洗脱。将洗脱液真空干燥,将残余物溶于150μl水,并取100μl在配备了Supelcosil LC-ABZ 59142 C18柱(25cm×4.6mm,5mm;Supelco)和SPD-M10AVP光电二极管阵列检测器(Shimadzu)的Shimadzu LC-10A T vp上进行HPLC。流速是1ml/min。用水洗脱2分钟,随后是用溶于水的0-60%甲醇线性梯度(48分钟)、溶于水的60-100%甲醇线性梯度(3分钟)、和100%甲醇(3分钟)洗脱。峰的指定依据相比于标准化合物的停留时间和UV光谱。相对于内部标准并通过使用Buchner在《Glucosinolates in rapeseed:Analytical aspects》(油料种子中的芥子油苷:分析方面,Wathelet编,Martinus Nijhoff出版社,第50-58页,1987)中和Haughn等人,Plant Physiol,97:217-226,1991描述的应答因子,对芥子油苷定量。在莲座叶的分析中,术语“总芥子油苷含量”指占野生型拟南芥莲座叶中芥子油苷含量的85%的5种主要芥子油苷(4-甲基亚磺酰丁基芥子油苷、4-甲基硫代丁基芥子油苷、8-甲基亚磺酰辛基芥子油苷、吲哚-3-基甲基芥子油苷、和4-甲氧基吲哚-3-基芥子油苷)和苯甲基芥子油苷的摩尔量。分析由T1植株#10、#13、和#14收获的转基因种子的芥子油苷含量,并与野生型种子的芥子油苷含量进行比较。如上所述抽提12-30mg种子并进行HPLC分析,只是省略了组织冻干。在这种种子分析中,术语“总芥子油苷含量”指占野生型拟南芥种子中芥子油苷含量的90%以上的10种主要芥子油苷(3-羟基丙基芥子油苷、4-羟基丁基芥子油苷、4-甲基亚磺酰丁基芥子油苷、4-甲基硫代丁基芥子油苷、8-甲基亚磺酰辛基芥子油苷、7-甲基硫代庚基芥子油苷、8-甲基硫代辛基芥子油苷、吲哚-3-基甲基芥子油苷、3-苯甲酰氧基丙基芥子油苷、和4-苯甲酰氧基丁基芥子油苷)和苯甲基芥子油苷的摩尔量。
转基因植株的外观与野生型植株可比。在本研究中分析的所有转基因植株(T1代)都在莲座叶中积累苯甲基芥子油苷,而在同时培养的野生型植株中没有检测到苯甲基芥子油苷。只能在野生型拟南芥Columbia栽培品种的根和茎生叶中偶尔观察到苯甲基芥子油苷,而且可能被环境条件诱导。苯甲基芥子油苷的偶尔发生符合CYP79A2 mRNA是低丰度转录本的观察结果。通过Northern印迹和RT-PCR在拟南芥Columbia载培品种的幼苗、不同发育阶段的莲座叶、和茎生叶中未能检测到CYP79A2 mRNA。转基因植物中的苯甲基芥子油苷含量随不同植株而变化。在具有最高积累的3株植物中,苯甲基芥子油苷分别占中叶片总芥子油苷含量的38%(植株#10)、5%(植株#14)、和2%(植株#13)。已知拟南芥Columbia载培品种的种子包含由高苯丙氨酸衍生的2-苯基乙基芥子油苷,而在拟南芥从未报导过有苯甲基芥子油苷。然而,我们已经在拟南芥Columbia载培品种和Wassilewskija载培品种的种子中检测到微量的苯甲基芥子油苷。转基因植物种子的HPLC分析显示,苯甲基芥子油苷占种子总芥子油苷含量的35%(植株#10)、12%(植株#14)、32%(植株#13)。在野生型植株(Columbia载培品种和Wassilewskija载培品种)的种子中检测到微量的苯甲基芥子油苷(在Columbia载培品种中是每g鲜重0.034μmol,相当于总芥子油苷含量的0.05%)。正如几株转基因植物中苯甲基芥子油苷的高水平积累所指示的,苯乙醛肟的形成是拟南芥中苯甲基芥子油苷生物合成的限速步骤。与野生型植物相比,转基因植物的叶片和种子中由高苯丙氨酸衍生的2-苯基乙基芥子油苷的含量不受影响。这支持了用在大肠杆菌中表达的CYP79A2获得的数据,并显示CYP79A2可以将苯丙氨酸而非高苯丙氨酸特异转变成相应的醛肟。
已经在不同植物物种中研究了在芥子油苷生物合成中参与氨基酸转变成醛肟的酶的性质。有人提出,依赖细胞色素P450的单加氧酶的参与可能只限于不属于芸苔科的物种,暗示欧白芥中依赖细胞色素P450的对羟基苯乙醛肟形成被看成是这一规律或实验假象的唯一例外。然而,展示的数据指示,在芸苔科以及其它科的成员中由芳香族氨基酸开始的醛肟形成依赖细胞色素P450酶。
实施例16:组织化学GUS测定法对CYP79A2的表达分析
在用在GUS-内含子DNA序列之前包含CYP79A2启动子的构建物转化的转基因拟南芥中研究了CYP79A2启动子。由EMBL3基因组文库(拟南芥Columbia载培品种)分离一个包含CYP79A2基因的基因组克隆。由该阳性噬菌体的DNA切下由2.5kb上游序列和120bp CYP79A2编码区组成的SacI/XmaI片段(SEQ ID NO:15)。将片段插入pPZP111,其读码框符合包含GUS-内含子序列和35S终止子的pVictor IV S GiN(DaniscoBiotechnology,丹麦)的XbaI/SacI片段。通过17bp接头进行两个片段之间的融合。得到的转录本编码由与GUS蛋白质融合的CYP79A2膜锚定蛋白组成的融合蛋白。
通过组织化学GUS测定法分析不同发育阶段的转化体。在10日龄植株的下胚轴和叶柄的叶脉中观察到强烈染色。在子叶和叶片中没有看到染色,只是在排水器(hydathode)中观察到强烈染色。在3周龄的植株中,叶片的脉中度染色,而排水器强烈染色。在10日龄和3周龄植株的根中没有看到染色。在5周龄的植株中,没有检测到GUS活性。
实施例17:实施例18、19、21、和22中所用的拟南芥植物和引物
将拟南芥Columbia载培品种用于所有的实验。在空调拟南芥箱(Percival AR-60 I,Boone,爱荷华州,美国)中以光合流量100-120μmol光子m-2sec-1、于20℃、和70%相对湿度培养植物。光照期对用于转化的植物是12小时,对用于生化分析的植物是8小时。
下文实施例中提到的PCR引物序列如下:
T7                5′-AAT ACG ACT CAC TAT AG-3′(SEQ ID NO:57),
EST3              5′-GCT AGG ATC CAT GTT GTA TAC CCA AG-3′
                  (SEQ ID NO:58),
EST6              5′-CGG GCC CGT TTT CCG GTG GC-3′(SEQ ID NO:59),
EST7A             5′-GGT CAC CAA AGG GAG TGA TCA CGC-3′(SEQ ID NO:60),
5′“天然”有义   5′-ATC GTC AGT CGA CCA TAT GAA CAC TTT TAC CTC AAA
                  CTC TTC GG-3′(SEQ ID NO:61),
5’“牛”有义     5′-ATC GTC AGT CGA CCA TAT GGC TCT GTT ATT AGC AGT
                  TTT TAC ATC GTC CTT TAG CAC CTT GTA TCT CC-3′
                  (SEQ ID NO:62),
3’“末端”反义   5′-ACT GCT AGA ATT CGA CGT CAT TAC TTC ACC GTC GGG
                  TAG AGA TGC-3′(SEQ ID NO:62),
CYP79B2.2         5′-GGA ATT CAT GAA CAC TTT TAC CTC A-3′
                  (SEQ ID NO:64),
B2SB              5′-TTG TCT AGA TCA CTT CAC CGT CGG GTA-3′
                  (SEQ ID NO:65),
B2AF              5′-GGC CTC GAG ATG AAC ACT TTT ACC TCA-3′
                  (SEQ ID NO:66),
B2AB              5′-TTG GAA TTC CTT CAC CGT CGG GTA GAG-3′
                  (SEQ ID NO:67),
XbaI          5′-GTA CCA TCT AGA TTC ATG TTT GTG TAT AGA G-3′
              (SEQ ID NO:68),
EST1          5′-TCC ATG TGC TCT ACA TCT-3′
              (SEQ ID NO:72),
EST2          5′-GAC GGA ACT CGT ATG TCC-3′
              (SEQ ID NO:73),
实施例18:CYP79B2和CYP79B5 cDNA的克隆和表达模式
与CYP79A1相比时,根据与S.bicolor CYP79A1的同源性鉴定的ESTT42902在5’端缺乏516bp。使用拟南芥λPRL2 cDNA文库(Newman等人,Plant Physiol,106:1241-1255,1994)作为模板以及T7和基因特异EST3引物,扩增了缺失5’端的255bp片段,随后通过扩增的载体序列中的EcoRI位点和通过引物EST3导入的BamHI位点进行克隆。将该片段作为模板,和引物EST6和EST7A一起,用于通过PCR扩增洋地黄毒苷-11-dUTP(DIG,Boehringer,曼海姆)标记的探针(DIG1)。依照制造商的指示(Boehringer,曼海姆),用DIG1探针筛选λPRL2文库,其中于68℃在5×SSC、0.1%N-肉桂酰肌氨酸、0.02%SDS、1.2%(w/v)封闭剂(Boehringer,曼海姆)中杂交过夜,并于65℃用0.1×SSC、0.1%SDS进行严谨清洗两次各15分钟。依照制造商的指示(Boehringer,曼海姆),通过氮蓝四唑的化学发光检测来进行阳性噬斑的检测。以255bp PCR片段作为探针(DIG1)筛选λPRL2文库,分离到编码CYP79B2的全长cDNA克隆。
EST T42902是根据与S.bicolor CYP79A1序列的同源性鉴定到的。使用来自俄亥俄州立大学拟南芥生物学研究中心的EST T42902作为模板以及引物EST1和EST2,扩增了240bp PCR片段。用洋地黄毒苷-11-dUTP(DIG,Boehringer,曼海姆)标记该PCR片段,并作为探针用于筛选蔓菁叶片的λZAP II cDNA文库(Clontech Lab.公司)。依照制造商的指示,用DIG探针筛选文库,于68℃在5×SSC、0.1%N-肉桂酰肌氨酸、0.02%SDS、1.2%(w/v)封闭剂(Boehringer,曼海姆)中杂交过夜,并于65℃用0.1×SSC、0.1%SDS进行严谨清洗两次各15分钟。依照制造商的指示(Boehringer,曼海姆),通过氮蓝四唑的化学发光检测来进行阳性噬斑的检测。通过筛选文库分离到编码CYP79B5的全长cDNA克隆。
使用Thermo Sequence Fluorescent-labled Primer cyclesequencing kit即耐热测序酶荧光标记引物循环测序试剂盒(Amersham,瑞典)进行 序列反应,并在ALF-Express automatedsequenator即ALF快速自动化测序仪(Pharmacia)上进行分析。使用GCG Wisconsin Sequence Analysis Package即GCG威斯康星序列分析软件包中的程序进行序列计算机分析和比对。
为了进行 Southern印迹分析,使用Nucleon Phytopure Plant DNAExtraction Kit(Amersham)由拟南芥叶片分离基因组DNA。取10μgDNA,用BamHI、XbaI、SspI、EcoRI、或EcoRV进行消化,并在0.8%琼脂糖凝胶上通过电泳进行分离。使用洋地黄毒苷标记的探针DIG1进行Southern印迹分析,并在高严谨条件(68℃,0.1×SSC、0.1%SDS,2×15分钟)下进行清洗。使用CDP-StarTM(Tropix公司)通过化学发光检测使条带显影。
为了进行 Northern印迹分析,使用TRIzol流程(Gibco BRL),由莲座叶、茎生叶、茎、花、和根以及发生创伤的莲座叶分离总RNA。取15μg总RNA,在1%变性甲醛/琼脂糖凝胶上进行分离,并印迹至带正电的尼龙膜(Boehringer)上。通过随机引发标记,生成覆盖CYP79B2完整编码区或拟南芥ACTIN-1的32P标记探针。将滤膜于60℃在0.5%SDS、2×SSC、5×Denhardt氏液、20μg/ml超声处理鲑鱼精DNA中进行杂交,并于60℃用0.2×SSC、0.1%SDS洗去过量探针。在Storm 840磷光体成像仪上使放射性标记条带显影,并用ImageQuant分析软件定量。
根据其它CYP79基因中起始密码子的定位和双子叶植物中起始密码子周围最有可能的序列预测了起始密码子。在该起始密码子的5’端没有找到终止密码子。CYP79B2和CYP79B5的全长cDNA克隆分别编码长度为541个和540个氨基酸的61kDa多肽,它们与其它A型CYP79细胞色素高度同源(Nelson,Arch Biochem Biophys,369:1-10,1999)。特别感兴趣的是与欧白芥CYP79B1分别有93%和96%氨基酸同一性,与拟南芥CYP79B3有85%(85%)氨基酸同一性。CYP79B5与CYP79B2有94%同一。一般而言,CYP79B2和CYP79B5显示与CYP79家族其它已知成员有44-67%氨基酸同一性。使用DIG1探针的高严谨度 Southern印迹显示CYP79B2是单拷贝基因。在每条泳道中检测到1或2条主要条带。这是A型细胞色素P450的一般情况,而且与通过Arabidopsis GenomeSequencing Project即拟南芥基因组测序计划只鉴定了位于4号染色体上的单一匹配序列的事实有关。然而,位于2号染色体上且与几个其它细胞色素P450成簇的CYP79B3与CYP79B2在氨基酸水平上85%同一。因此,很有可能是CYP79B3催化相同反应。在Southern印迹的大多数泳道中检测到其它微弱条带。它们大概是由于与同源物诸如CYP79B3或假基因CYP79B4的杂交所致。在低严谨度条件下,每个泳道中存在多个条带,这指示拟南芥中存在多种CYP79序列。迄今为止,拟南芥基因组测序计划已经鉴定了7种CYP79同源物。
由多种拟南芥组织提取的RNA的 Northern分析测定的CYP79B2表达模式揭示在所检查的所有组织类型中均有表达。在根中发现了最高表达水平,在茎生叶中发现了最低水平;在莲座叶、茎、和花中发现了大致相等的量。根中的CYP79B2 mRNA水平比在莲座叶中发现的水平高大约3-4倍。在创伤后15分钟内可检测到2倍水平的诱导,在莲座叶中,在2小时后观察到这一现象。所述升高与CYP79B2参与吲哚芥子油苷生物合成是一致的。
实施例19:CYP79B2大肠杆菌表达构建物和活性测量
将使用5’“天然”有义引物或5’“牛”有义引物和3’“末端”反义引物的PCR分别用于生成用于表达的构建物“天然”和“Δ(1-9)bov”。使用通过引物导入的AatII和NdeI限制性位点,将PCR片段克隆到经AatII和NdeI消化的pSP19g10L载体(Barnes,Meth Enzymol,272:3-14,1996)中,并进行测序以排除PCR错误。
天然构建物由CYP79B2的未修饰编码区组成,而Δ(1-9)bov构建物除了用牛P45017α(17)的前8个密码子替代前8个密码子以外,还截去了9个氨基酸。牛修饰型显示导致细胞色素P450在大肠杆菌中的高水平表达。两种构建物都携带TAAT经修饰终止序列,以提高翻译终止效率(Tate等人,Biochem,31:2443-2450,1992)。
通过用来自Sorghum bicolor(L.)Moench的纯化NADPH:细胞色素P450还原酶重建表达CYP79B2的大肠杆菌的原生质球来测量CYP79B2的活性。如Sibbesen等人,J Biol Chem,270:3506-3511,1995所述,纯化S.bicolor的NADPH:细胞色素P450还原酶。向含100mM TricinepH7.9、10μg/μl DLPC(二肉桂酰磷脂酰胆碱)(超声处理2次各10秒钟)、4mM NADPH、3mM还原型谷胱甘肽(GSH)、5μl[3-14C]色氨酸(0.1μCi,比活56.5mCi/mmol)、和1U/μl纯化的NADPH:细胞色素P450还原酶的45μl反应混合物中加入5μl大肠杆菌原生质球,由此开始反应。将反应液于34℃保温30分钟,用乙酸乙酯抽提两次,通过TLC分析乙酸乙酯相,使用甲苯∶乙酸乙酯(5∶1)作为洗脱液。在Storm840磷光体成像仪(Molecular Dynamics)上使放射性标记条带显影,并用ImageQuant分析软件(Molecular Dynamics)定量。通过用14C标记的酪氨酸或苯丙氨酸替代14C标记的色氨酸来研究底物特异性。
采用GC-MS来确认重组CYP79B2由色氨酸生成的化合物的结构。将如上所述包含2mM未标记色氨酸的450μl反应混合物于34℃保温2小时。将反应混合物用300μl CHCl3萃取两次,并冷冻至干燥。使用偶联Jeol JMS-AX505W质谱仪的HP5890系列II气相层析仪进行GC-MS。在SGE柱(BPX5,25mm×0.25mm,0.25μm薄膜厚度)上使用无隙注射和高差压力100kPa。如Rausch等人,J Chromatogr,318:95-102,1985所述,合成真实的吲哚-3-乙醛肟(IAOX)。
实施例20:大肠杆菌中的CYP79B2表达
将上文实施例19中所述表达构建物转化到大肠杆菌菌株C43(DE3)(Miroux等人,J Mol Biol,260:289-298,1996)中。将单菌落在含100μg/ml氨苄青霉素的LB培养基中于37℃培养过夜。取1ml过夜培养物用于接种75ml含100μg/ml氨苄青霉素、75μg/mlδ-氨基乙酰丙酸、1mM硫胺素、和1mM IPTG的TB培养基。将TB培养物28℃以125rpm培养44小时。如Halkier等人,Arch Biochem Biophys,322:369-377,1995所述制备大肠杆菌原生质球。
通过用由S.bicolor纯化的NADPH:细胞色素P450还原酶在DLPC微囊中重建大肠杆菌原生质球来进行活性测量。向包含表达天然或Δ(1-9)bovCYP79B2构建物的大肠杆菌原生质球的反应混合物中施用[14C]色氨酸,导致生成在TLC上与真实IAOX标准物共迁移的强烈条带。通过GC-MS实现了这种化合物的明确化学鉴定即IAOX。包含用空载体转化的大肠杆菌原生质球的反应混合物中不积累IAOX。天然构建物给出最高水平的活性,因而在由这种构建物表达的重组CYP79B2上进行分析。这一活性显示依赖NADPH:细胞色素P450还原酶的加入,因为在向全细胞施用放射性标记的色氨酸时检测不到活性。这说明大肠杆菌内源电子供给系统黄素氧还蛋白:NADPH-黄素氧还蛋白还原酶不能将电子供给CYP79B2。在不存在NADPH时观察到少许活性,这最有可能是由于原生质球制剂中NADPH的残余量所致。加入1.5mM还原型谷胱甘肽(GSH)可将活性提高1.8倍。Km测定为21μM,Vmax测定为97.2pmol/h/μl原生质球。在向包含重组CYP79B2的反应混合物施用放射性标记的苯丙氨酸或酪氨酸时,没有检测到肟生成活性。这指示CYP79B2对色氨酸是特异的。
原生质球或原生质球的Triton X-114温度诱导相分配的富含相的CO差异光谱不显示450nm特征峰。另外,在将原生质球或其TritonX-114富含相在SDS-PAGE上分开并用考马斯亮蓝染色时,可以看到大约60kDa的新条带。这指示生成了很少的重组CYP79B2,并且CYP79B2是高度有活性的。
先前显示了中国甘蓝和拟南芥中的质膜酶系统通过过氧化物酶样酶(TrpOxe)催化由色氨酸形成IAOX。这一转变受到H2O2的刺激,在某些情况中还受MnCl2和2,4-二氯苯酚的刺激。向CYP79B2重建测定法中加入100mM H2O2、1mM MnCl2、或800μM 2,4-二氯苯酚分别将活性抑制96%、34%、和72%,而在联合时可抑制99%。这说明两种系统是不相同的,而且TrpOxE活性显然与CYP79B2不同。另外,在50mM Tricine缓冲液pH8.0中包含100mM H2O2、1mM MnCl2、和800μM 2,4-二氯苯酚的非酶促反应混合物能够催化色氨酸转变成与IAOX共迁移的化合物,转变率是对CYP79B2所观察到的大约0.7%。这说明在氧化条件下可以发生色氨酸非酶促转变成IAOX。
实施例21:CYP79B2在拟南芥中的有义和反义表达
使用引物CYP79B2.2、B2SB、B2AF、和B2AB,以有义和反义方向,将CYP79B2 cDNA克隆到花椰菜花叶病毒35S(CaMV35S)启动子的后面。使用引物对CYP79B2.2/B2SB(有义构建物)和B2AF/B2AB(反义构建物)通过PCR扩增天然全长CYP79B2 cDNA。将有义构建物的PCR产物克隆到经EcoRI和XbaI消化的pRT101(Tpfer等人,Nucleic Acids Res,15:5890,1987)中并测序。将反义构建物的PCR产物克隆到经EcoRI和XboI消化的pBluescript(Stratagene)中,通过EcoRI和KpnI消化切下,连接到经EcoRI和KpnI消化的pRT101中并测序。通过PstI消化由pRT101切下有义和反义表达盒并转移至pPZP111(Hajdukiewicz等人,Plant Mol Biol,25:989-994,1994)。通过花浸渍方法(Clough等人,Plant J,16:735-743,1998),使用溶于10mM MgCl2的0.005%Silwet L-77和5%蔗糖,将用两种构建物之一转化的根癌土壤杆菌菌株C58(Zambryski等人,EMBO J,2:2143-2150,1983)用于转化拟南芥生态型Columbia。让种子在添加50μg/ml卡那霉素、2%蔗糖、和0.9%琼脂的MS培养基上发芽。两周后选择转化体并转移至土壤。
如Srensen在《Canola and Rapeseed-Production,chemistry,nutrition and processing technology》(芸苔和油料种子:生成、化学、营养、和加工技术,Shahidi编,第149-172页,1990,VanNostrand Reinhold,纽约)中所述,通过HPLC对具有改变CYP79B2表达水平的转基因拟南芥分析芥子油苷分布。通过在4ml 50%甲醇中煮沸2次各2分钟,由6-8周龄拟南芥的冻干莲座叶提取芥子油苷。将提取物应用于用1ml 0.5M KOAc pH5.0平衡并用1ml H2O清洗两次的200μl DEAE Sephadex CL-6B柱(Pharmacia)。将流过物用1ml H2O洗三次。将400μl 2.5mg/ml Helix pomatia硫酸酯酶(Sigma Aldrich)应用于柱子,密封并静置过夜。将得到的脱磺基芥子油苷(desulphoglucosinolate)用1ml H2O洗脱两次,蒸发至干燥,并重悬于200μl H2O。取一部分应用于配备了Supelco supelcosil LC-ABZ59142 C18柱(25cm×4.6mm,5mm;Supelco)和SPD-M10AVP光电二极管阵列检测器(Shimadzu)的Shimadzu Spectachrom HPLC系统。流速是1ml/min。用水洗脱2分钟,随后用溶于水的0-60%甲醇线性梯度(48分钟)、溶于水的60-100%甲醇线性梯度(3分钟)、和100%甲醇(3分钟)洗脱。使用光电二极管阵列于229nm和260nm进行检测。根据应答系数和内部金莲葡糖硫苷标准物对脱磺基芥子油苷定量。
用35S启动子控制下的CYP79B2反义构建物转化的拟南芥植株具有野生型表型,而用35S启动子控制下的CYP79B2有义构建物转化的植株的大多数(大约80%)展示矮化。超过75%的有义植株不形成花序,而且不产生种子。其余有义植株像野生型植株一样,但是结籽一般较少。
过度表达CYP79B2植株的矮化表型可能是由于吲哚芥子油苷水平的升高所致。将酪氨酸转变成对羟基苯乙醛肟的CYP79A1在拟南芥中的过度表达,导致具有高含量的酪氨酸衍生对羟基苯甲基芥子油苷的矮化植株。由CYP79A1生成的对羟基苯乙醛肟被非常有效的引导成对羟基苯甲基芥子油苷。在过度表达CYP79B2的拟南芥中也可能发生相似有效的将IAOX引导至吲哚芥子油苷。然而,不能排除矮态表型是由于由IAOX生成的IAA水平升高,或由升高水平的吲哚芥子油苷降解生成的吲哚-3-乙腈所致。
转基因拟南芥T1代的芥子油苷分布的HPLC分析显示,过度表达CYP79B2的植株积累比用空载体转化的对照植株更高数量的吲哚芥子油苷。两种最丰富的吲哚芥子油苷即芸苔葡糖硫苷和4-甲氧基芸苔葡糖硫苷的水平分别升高了大约5倍和2倍,而新芸苔葡糖硫苷(neoglucobrassicin)的水平没有显著升高。总芥子油苷含量因较高水平的吲哚芥子油苷而升高,但是脂肪族和芳香族(即无吲哚)芥子油苷的水平不受影响。在反义植株中,吲哚芥子油苷水平与对照植株相比没有降低。可能的解释是所用反义构建物未能充分下调CYP79B2。或者,根据同源性有可能催化相同反应的CYP79B3补偿了吲哚芥子油苷的下调。
实施例22:组织化学GUS测定法对CYP79B2的表达分析
使用DIG系统(Boehringer),用能够与CYP79B2基因5’端退火的505bp洋地黄毒苷-11-dUTP标记探针筛选拟南芥生态型ColumbiaEMBL3基因组文库。探针杂交是于65℃在5×SSC、0.1%N-肉桂酰肌氨酸、0.02%SDS、和1%封闭剂中进行的。在检测前用0.1×SSC、0.1%SDS于65℃清洗滤膜。如Grossberger,Nucleic Acids Res,15:6737,1987所述,由阳性噬菌体纯化噬菌体DNA。将包含完整CYP79B2编码区和2361bp启动子区(参阅GenBank编号AL035708的第60536-62896位核苷酸,SEQ ID NO:16)的5kb EcoRI片段亚克隆到pBluescriptII SK(Stratagene)中。使用T7载体引物和XbaI引物(实施例17)通过PCR在紧挨CYP79B2起始密码子的下游导入了XbaI限制性位点。PCR反应在200μl总体积中在含2mM MgSO4的Pwo聚合酶PCR缓冲液(Boehringer,曼海姆)中包含200μM dNTP、400pmol每种引物、0.1μg模板DNA、和10U Pwo聚合酶。将反应液于94℃保温5分钟后,进行23个PCR循环即94℃30sec、45℃30sec、72℃1.5min。用EcoRI和XbaI消化得到的PCR产物,克隆到pBluescript II SK中,并测序以排除PCR错误。最后,通过将来自CYP79B2启动子区的236ibpEcoRI-XbaI片段与来自pVictor IV S GiN(Danisco Biotechnology,丹麦)的XbaI-SalI片段(包含GUS内含子及35S终止子)一起连接到二元载体pPZP111中,构建了转化质粒pPZP111.p79B2-GUS。通过电穿孔(Wen-Jun等人,Nucleic Acid Res,17:8385,1983)将pPZP111.p79B2-GUS导入根癌土壤杆菌C58C1/pGV3850。通过花浸渍法(Clough等人,Plant J,16:735-743,1998),使用溶于10mM MgCl2的0.005%Silwet L-77和5%蔗糖,用根癌土壤杆菌C58C1/pGV3850/pPZP111.p79B2-GUS转化拟南芥生态型Columbia。让种子在添加50μg/ml卡那霉素、2%蔗糖、和0.9%琼脂的MS培养基上发芽。两周后选择转化体并转移至土壤。基本上如Martin等人在《GUSProtocols:Using the GUS Gene as a Reporter of Gene Expression》(GUS方案:将GUS基因用作基因表达的报告基因,Gallagher编,第23-43页,Academic出版公司)中所述对T3植株进行组织化学GUS测定法,只是在染色前没有将组织在低聚甲醛中固定。将组织染色3小时。
在幼根和子叶中检测到最高水平的GUS表达。在幼莲座叶和成熟莲座叶中检测到一些表达,这主要与维管组织中的主要和次要叶脉有关。老叶片中的表达非常微弱。在长角果中,GUS于柱头表面和萼片附着处表达。在种子中检测不到GUS染色。物理损伤的1-2mm内发生非常强烈的GUS染色。
实施例23:实施例24和26中所用的引物
下列PCR引物是根据发现在GenBank编号AC006341中包含的CYP79F1的拟南芥基因组序列而设计的。
引物1..5′-CTCTAGATTCGAACATATGGCTAGCTTTACAACATCATTACC-3′(SEQ ID NO:3),
引物2..5′-CGGGATCCTTAAGGACGGAACTTTGGATA-3′(SEQ ID NO:4),
引物3..5′-AACTGCAGCATGATGAGCTTTACCACATC-3′(SEQ ID NO:5),
引物4..5′-CGGGATCCTTAATGGTGGTGATGAGGACGGAACTTTGGATAA-3′(SEQ ID NO:6),
引物5..5′-AAAGCTCAATGCGTAGAAT-3′(SEQ ID NO:7),
引物6..5′-TTTTTAGACACCATCTTGTTTTCTTCTTC-3′(SEQ ID NO:8),
引物7..5′-TGTAGCGGCGCATTAAGC-3′(SEQ ID NO:9),
引物8..5′-CAAAAGAATAGACCGAGATAGGG-3′(SEQ ID NO:10),
实施例24:CYP79F1大肠杆菌表达构建物
CYP79F1是在拟南芥基因组中鉴定的几种CYP79同源物之一。CYP79F1的推导氨基酸序列与CYP79F2的推导氨基酸序列具有88%同一性,与来自包含芥子油苷和含氰苷物种的其它CYP79同源物具有43-50%同一性。CYP79F1和CYP79F2位于相同染色体上,只相隔1638bp。这说明这两种基因是通过基因复制形成的,而且可能催化相似反应。由包含CYP79F1全长序列的EST ATTS5112(Arabidopsis BiologicalResource Center即拟南芥生物学资源中心,俄亥俄州,美国)衍生出表达构建物。使用引物1(有义方向)和引物2(反义方向)通过PCR该EST扩增CYP79F1编码区。引物1在起始密码子的上游导入了XbaI位点,在起始密码子处导入了NdeI位点。为了优化构建物用于在大肠杆菌中表达(Barnes等人,Proc Natl Acad Sci USA,88:5597-5601,1991),引物1将第二个密码子由ATG改成GCT,并在第5位密码子处导入沉默突变。引物2紧挨终止密码子后面导入了BamHI限制性位点。使用2.5U Pwo聚合酶(Roche Molecular Biochemicals)、0.1μg模板DNA、200μM dNTP、和50pmol每种引物,在含2mM MgSO4的Pwo聚合酶PCR缓冲液中建立总体积50μl的PCR反应。将反应液于94℃保温5分钟后,进行20个PCR循环即94℃15sec、58℃30sec、72℃2min。用XbaI和BamHI消化PCR片段,并连接到经XbaI和BamHI消化的载体pBluescript II SK(Stratagene)中。使用Thermo SequenaseFluorescent-labled Primer cycle sequencing kit即耐热测序酶荧光标记引物循环测序试剂盒(7-脱氮dGTP)(Amersham,瑞典)在ALF-Express sequenator即ALF快速测序仪(Pharmacia)上对cDNA测序以排除PCR错误,并由pBluecript II SK转移至经NdeI和BamHI消化的pSP19g10L表达载体(Barnes等人,Proc Natl Acad Sci USA,88:5597-5601,1991)中。
实施例25:大肠杆菌中的CYP79F1表达
将用该表达构建物转化的大肠杆菌菌株JM109(Stratagene)和C43(DE3)(Miroux等人,J Mol Biol,260:289-298,1996)的细胞在添加100μg/ml氨苄青霉素的LB中培养过夜,并用于接种40ml含50μg/ml氨苄青霉素、1mM硫胺素、75μg/mlδ-氨基-乙酰丙酸、1μg/ml氯霉素、和1mM异丙基-β-D-硫代半乳糖苷的修改后TB培养基。将培养物于28℃以125rpm培养60小时。沉淀细胞,并重悬于由0.2MTris HCl pH7.5、1mM EDTA、0.5M蔗糖、和0.5mM苯甲基磺酰氟组成的缓冲液。加入溶菌酶至终浓度100μg/ml。于4℃保温30分钟后,加入Mg(OAc)2至终浓度10mM。沉淀原生质球,重悬于3.2ml由10mMTris-HCl pH7.5、14mM Mg(OAc)2、和60mM KOAc pH7.4组成的缓冲液,并在Potter-Elvehjem匀浆器中匀浆。DNA酶处理后,加入甘油至终浓度30%。温度诱导的Triton X-114相分配形成了包含大部分细胞色素P450的去污剂富含相和去污剂贫乏相(Halkier等人,Arch BiochemBiophys,322:369-377,1995)。在SLM Aminco DW-2000 TM分光光度计(SLM Instruments,乌尔班纳,IL)上,使用于990μl含50mMKPi pH7.5、2mM EDTA、20%甘油、0.2%Triton X-100、和少许连二亚硫酸钠颗粒的缓冲液中的10μl Triton X-114富含相,通过Fe2+CO对Fe2+差异光谱学(Omura等人,J Biol Chem,239:2370-2378,1964)监测CYP79F1的功能性表达。
如Sibbesen等人,J Biol Chem,270:3506-3511,1995所述,在用由Sorghum bicolor(L.)Moench纯化的NADPH:细胞色素P450氧化还原酶重建的大肠杆菌原生质球中测量CYP79F1的活性。在典型的酶测定法中,将5μl原生质球和4μl NADPH:细胞色素P450还原酶(相当于0.04U,定义为1μmol细胞色素c min-1)与底物一起在含30mM KPipH7.5、3mM NADPH、3mM还原型谷胱甘肽、0.042%吐温80、和1mg/mlL-α-二肉桂酰磷脂酰胆碱的总体积30μl的缓冲液中保温。在所有测定法中,将包含用空载体转化的大肠杆菌C43(DE3)原生质球的反应混合物用作对照。测试3.3μM L-[U-14C]苯丙氨酸(453mCi mmol-1;Pharmacia)、3.7μM L-[U-14C]酪氨酸(449mCi mmol-1;Pharmacia)、0.1mM L-[甲基-14C]甲硫氨酸(56mCi mmol-1;Pharmacia)、和24μML-[侧链-3-14C]色氨酸(56.5mCi mmol-1;NEN)作为潜在底物。于28℃保温1小时后,取一半反应混合物通过TLC在硅胶60 F254片(Merck)上进行分析,使用甲苯∶乙酸乙酯(5∶1,v/v)作为洗脱液。通过Storm840磷光体成像仪(Pharmacia)对放射性标记的条带进行显影和定量。为了进行GC-MS分析,将分别含3.3mM L-甲硫氨酸(Sigma)、3.3mM DL-二高甲硫氨酸、3.3mM DL-三高甲硫氨酸的450μl反应混合物于25℃保温4小时,并用总体积600μl的CHCl3抽提。合并有机相,蒸发,将残余物溶于15μl CHCl3,并通过GC-MS进行分析。GC-MS分析是在直接偶联Jeol JMS-AX505W质谱仪的HP5890系列II气相层析仪上进行的。使用SGE柱(BPX5,25m×0.25mm,0.25μm薄膜厚度)(高差压力100kPa,无隙注射)。炉温程序如下:80℃3min,80-180℃5℃/min,180-300℃20℃/min,300℃10min。以E1模式(70eV)于200℃运行离子源。5-甲基硫代戊醛肟的(E)-和(Z)-异构体的停留时间分别是14.3分钟和14.8分钟。两种异构体具有相同的断裂模式,以m/z 130、129、113、82、61、和55作为最突出的峰。6-甲基硫代戊醛肟的(E)-和(Z)-异构体的停留时间分别是17.1分钟和17.6分钟。两种异构体具有相同的断裂模式,以m/z 144、143、98、96、69、61、和55作为最突出的峰。DL-二高甲硫氨酸、DL-三高甲硫氨酸、5-甲基硫代己醛肟、和6-甲基硫代己醛肟是如Dawson等人,J Biol Chem,268:27154-27159,1993所述合成的,并经过NMR光谱的鉴别。
对于在大肠杆菌菌株C43(DE3)中表达的CYP79F1而非在大肠杆菌菌株JM109中表达的CYP79F1获得了具有450nm特征峰的CO差异光谱。除了450nm的峰,还检测到了418nm的峰。
为了鉴定CYP79F1的底物,使用用S.bicolor的NADPH:细胞色素P450还原酶重建的大肠杆菌C43(DE3)原生质球进行活性测量。在将包含CYP79F1的反应混合物与DL-二高甲硫氨酸一起保温时,通过GC-MS检测到在对照反应中不存在的两种化合物。这些化合物的停留时间和质谱断裂模式与合成5-甲基硫代戊醛肟的E/Z-异构体是相同的。在向包含CYP79F1的反应混合物中施用DL-三高甲硫氨酸时,通过GC-MS检测到与合成6-甲基硫代戊醛肟E/Z-异构体具有相同停留时间和断裂模式的两种化合物。向包含重组CYP79F1的反应混合物施用L-甲硫氨酸、L-苯丙氨酸、L-酪氨酸、和L-色氨酸,不导致可检测量的相应醛肟的形成。
实施例26:CYP79F1 cDNA在转基因拟南芥中的表达
将拟南芥Columbia载培品种用于所有的实验。在空调拟南芥箱(Percival AR-60 I,Boone,爱荷华州,美国)中以光合流量100-200μmol光子m-2sec-1、于20℃、和70%相对湿度培养植物。除非另外申名,光照期对于用于转化的植物是12小时,对于用于生化分析的植物是8小时。
转基因植物的生成
为了构建在CaMV 35S启动子控制下表达CYP79F1 cDNA的植物(35S:CYP79F1植物),使用引物3(有义方向)和引物4(反义方向)由EST ATTS5112(Arabidopsis Biological Resource Center即拟南芥生物学资源中心,俄亥俄州,美国)PCR扩增CYP79F1 cDNA。引物3以PstI限制性位点结尾。引物4在终止密码子前导入了4个编码His的密码子并在终止密码子后导入了BamHI限制性位点。用PstI和BamHI消化包含CYP79F1 cDNA的PCR片段,连接到经PstI和BamHI消化的载体pBluescript II SK中,并测序以排除PCR错误。通过连接到经PstI和BamHI消化的载体pSP48(Danisco Biotechnology,丹麦),将CYP79F1cDNA置于CaMV 35S启动子控制之下。通过XbaI消化切下表达盒并转移至pPZP111(Hajdukiewicz等人,Plant Mol Biol,25:989-994,1994)中。通过花浸渍(Clough等人,Plant J,16:735-743,1998),使用溶于10mM MgCl2的0.005%Silwet L-77和5%蔗糖,将用该构建物转化的根癌土壤杆菌菌株C58(Zambryski等人,EMBO J,2:2143-2150,1983)用于植物转化。让种子在添加50μg/ml卡那霉素、2%蔗糖、和0.9%琼脂的MS培养基上发芽。两周后选择转化体并转移至土壤。
研究了9株35S:CYP79F1原代转化体。3株(S5、S7、S9)在形态上与野生型植株不同。这些植株的生长速率降低,但是在生长的第一个7周里表现正常。在花转换变得明显前,顶端优势减弱导致多个腋芽的生成,稍后发育成侧生花序。这些形态变化赋予S5、S7、和S9以茂密表型。另外,S5具有卷曲的莲座叶,叶尖向下弯曲。
因CYP79F1的共遏制或过度表达而脂肪族芥子油苷含量改变的转基因拟南芥植物具有特征性形态表型,其特征是营养生长延长和多个腋芽的生成。有人报导,拟南芥能够耐受导致芥子油苷含量升高2-5倍的CYP79家族细胞色素P450的过度表达,而植物外观没有相似变化。因此,形态变化似乎不可能是由特定芥子油苷的存在或缺乏引起的。可能的解释是,形态表型是由于由植物硫代谢受干扰引起的多效效应,其中甲硫氨酸发挥中枢作用。甲硫氨酸代谢的改变可以解释为什么共遏制和过度表达CYP79F1的植株与野生型植株相比显示相似形态变化。CYP79F1共遏制植株中形态变化在花转换时发作可能是由于需要甲硫氨酸来支持花的发育。或者,它与野生型植株中CYP79F1表达水平的升高一致。
植物提取物中芥子油苷含量的HPLC分析
由9株9周龄35S:CYP79F1原代转化体植株和10株7周龄野生型植株每株采集6-8片相同大小的莲座叶。将组织立即在液氮中冷冻,并冻干48小时。如下作为脱磺基芥子油苷分析芥子油苷:向9-20mg冻干材料中加入3.5ml沸腾的70%(v/v)甲醇、10μl内部标准(5mM对羟基苯甲基芥子油苷;Bioraf,丹麦),并将样品在沸水浴中保温4分钟。沉淀植物材料,用3.5ml 70%(v/v)甲醇再次抽提沉淀,并离心。合并上清液,并在如wittstock等人,J Biol Chem,275:14659-14666,2000所述进行硫酸酯酶处理之后通过HPLC进行分析。峰的指定是基于相对于标准化合物的停留时间和UV光谱。相对于内部标准并通过应答因子(Haughn等人,Plant Physiol,97:217-226,1991;Buchner,在《Glucosinolates in rapeseed:Analytical aspects》(油料种子中的芥子油苷:分析方面)中,Wathelet编,Martinus Nijhoff出版社,波士顿,第155-181页,1987)的使用,对芥子油苷定量。术语“总芥子油苷含量”指占野生型拟南芥莲座叶中芥子油苷含量超过85%的7种主要芥子油苷(3-甲基亚硫酰丙基芥子油苷、4-甲基亚硫酰丁基芥子油苷、4-甲基硫代丁基芥子油苷、8-甲基亚硫酰辛基芥子油苷、吲哚-3-基甲基芥子油苷、4-甲氧基吲哚-3-基芥子油苷、和N-甲氧基吲哚-3-基芥子油苷)的摩尔量。
由二高甲硫氨酸衍生的芥子油苷即4-甲基亚硫酰芥子油苷和4-甲基硫代丁基芥子油苷占拟南芥叶片中总芥子油苷含量超过50%,而由三高甲硫氨酸衍生的芥子油苷只是叶片中的次要成份(总芥子油苷含量的2.1%)。因此,分析集中于4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷。
三株植株(S1、S7、S9)显示莲座叶中4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷水平显著降低,而两株植株(S3、S5)显示这些芥子油苷水平略微升高。在S7、S1、和S9中4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷含量分别降低至0.7、2.2、和2.8μmol/g dw,而在S3和S5中分别升高至12.3和13.3μmol/g dw,比较而言,野生型植株中的水平范围是5.7-11.5μmol/g dw。4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷的水平受到了相等的影响。既然认为由二高甲硫氨酸形成醛肟是在决定4-甲基亚硫酰丁基芥子油苷与4-甲基硫代丁基芥子油苷量之间的比例的次级修饰之前进行的,那么两种芥子油苷的总量应反映上游酶活性的改变。4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷水平的降低指示S1、S7、和S9中发生了CYP79F1共遏制。4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷水平在S3和S5中的微弱升高说明CYP79F1的表达水平升高。这说明长链甲硫氨酸是脂肪族芥子油苷生物合成中的限速步骤。然而,不能排除低水平积累可能是因T-DNA整合的位置效应而低水平表达转基因所致。
因为由二高甲硫氨酸衍生的芥子油苷是野生型莲座叶中的主要芥子油苷,所以这些芥子油苷水平的改变显著影响总芥子油苷含量。这在CYP79F1共遏制的植株中特别突出。这些植株的总芥子油苷含量范围是4.3-4.8μmol/g dw,比较而言,野生型植株的总芥子油苷含量范围是8.8-17.4μmol/g dw。除了4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷含量的变化,在35S:CYP79F1植株中还观察到其它芥子油苷水平的改变,特别是由甲硫氨酸衍生的芥子油苷。在4-甲基亚硫酰丁基芥子油苷和4-甲基硫代丁基芥子油苷含量降低的植株中,由长链甲硫氨酸同源物衍生的其它主要芥子油苷(即3-甲基亚硫酰丙基芥子油苷和8-甲基亚硫酰辛基芥子油苷)的水平也降低。这可以解释为不仅CYP79F1转录本被共遏制,而且参与脂肪族芥子油苷生物合成的其它CYP79同源物的转录本(诸如与CYP79F1具有88%氨基酸同一性的CYP79F2的转录本)也被共遏制。或者,它可能反映CYP79F1对长链甲硫氨酸具有广泛的底物特异性。长链甲硫氨酸在CYP79F1共遏制植株中积累的事实指示催化长链甲硫氨酸的酶不受到长链产物的反馈抑制。三种吲哚芥子油苷的含量没有受到显著影响。
植物提取物中氨基酸含量的分析
使用3株12周龄35S:CYP79F1转化体原代植株和3株8周龄野生型植株的相同大小的莲座叶。将每株植株的250mg叶片材料在3ml 50mM KPipH7.5中用Plytron匀浆器进行匀浆。以20000g离心10分钟沉淀植物材料,并用3ml 50mM KPi pH7.5再次抽提两次。合并水相,真空干燥,并将残余物溶于100μl水。取一部分再次溶解的提取物用1/10体积的30%水杨磺酸(salicylic sulfonic acid)进行处理,并通过离心除去变性的蛋白质。用1/10体积的1N NaOH中和上清液。基本上依照制造商的洗脱程序,在Biochrom 20氨基酸分析仪(Pharmacia)上用Ultropac 8 Resin Reverse Phase HPLC柱(200×4.6mm)鉴定样品中的各蛋白质氨基酸并定量。
为了将植物材料中的二高甲硫氨酸定量,对样品进行由制造商推荐的程序略微改动的两种洗脱程序。程序1如下:53℃7分钟,缓冲液A;50℃35分钟,缓冲液A;95℃34分钟,缓冲液A。程序2如下:53℃7分钟,缓冲液A;58℃12分钟,缓冲液B;95℃25分钟,缓冲液C。缓冲液A是0.2M醋酸钠pH3.25,缓冲液B是0.2M醋酸钠,pH4.25,缓冲液C是1.2M醋酸钠,pH6.25。在程序1中,苯丙氨酸和二高甲硫氨酸于63.6分钟共洗脱。在程序2中,酪氨酸和二高甲硫氨酸于25.3分钟共洗脱。作为程序1中对应于苯丙氨酸和二高甲硫氨酸的峰面积与程序2中对应于苯丙氨酸的峰面积之间的差值,以及作为程序2中对应于酪氨酸和二高甲硫氨酸的峰面积与程序1中对应于酪氨酸的峰面积之间的差值来量化二高甲硫氨酸。使用真实标准物测定二高甲硫氨酸的应答系数。
为了将植物材料中的三高甲硫氨酸定量,也对样品进行由制造商推荐的程序略微改动的洗脱程序。程序3如下:53℃7分钟,缓冲液A;58℃5分钟,缓冲液B;95℃7分钟,缓冲液B;95℃25分钟,缓冲液C。三高甲硫氨酸于29.0分钟洗脱,并使用用真实标准物测定的应答系数,作为峰面积量化。
S7即芥子油苷含量降低最显著并具有强形态表型的35S:CYP79F1植株中,二高甲硫氨酸和三高甲硫氨酸含量的分析揭示了相比于野生型植株有50倍升高。三高甲硫氨酸积累至野生型植株中含量的4倍。在S9中观察到二高甲硫氨酸含量升高15倍,而没有检测到三高甲硫氨酸含量的升高。
RT-PCR的表达分析
为了检查由不同植物组织获得的RNA制剂中的成份对RT反应的抑制,使用由通过Scal消化线性化的pBluescript II SK载体(Stratagene)合成的对照RNA。在添加500μM rNTP、10mM DTT、100URNAsin Ribonuclease inhibitor即RNA酶抑制剂(Promega)、3μg线性化pBluescript II SK、和50U T3 RNA聚合酶(Promega)的Transcription Optimized Buffer即转录优化缓冲液(Promega)中建立总体积100μl的合成反应。于37℃保温2小时后,加入20U不含RNA酶的DNA酶,并将反应液于37℃继续保温1小时。酚和CHCl3抽提及乙醇沉淀后,将RNA溶于用焦碳酸二乙酯处理过的水中。
由拟南芥采集下列组织:
(1)4周龄植株(以8小时光照/16小时黑暗培养)的总植物组织;
(2)莲座叶(不含叶柄)
(3)5周龄植株(花转换开始前;以8小时光照/16小时黑暗培养)的地上部分;
(4)莲座叶(不含叶柄);和
(5)开花植株(9周龄;以12小时光照/12小时黑暗培养以诱导开花)的茎生叶。
使用TRIZOL试剂(GIBCO BRL)由所述组织分离总RNA。通过分光光度法对RNA定量,并用于合成第一条cDNA链。为了确保RT-PCR的线性,第一条cDNA链合成是在1μg、0.3μg、和0.1μg每种RNA集合上进行的。在添加0.5mM dNTP、10mM DTT、200ng随机六聚体(Pharmacia)、3pg对照RNA(内部标准物)、和200U SUPERSCRIPT II逆转录酶(GIBCOBRL)的First Strand Buffer即第一链缓冲液(GIBCO BRL)中(总体积20μl)合成cDNA。将反应混合液于27℃保温10分钟,随后于42℃保温50分钟,并于95℃灭活5分钟。通过PCR纯化试剂盒(QIAGEN;用50μl 1mM Tris缓冲液pH8进行洗脱)的手段纯化RT反应。取2μl纯化后的RT反应液进行PCR。在添加200μM dNTP、1.5mM MgCl2、50pmol有义引物、50pmol反义引物、和2.5U Platinum Taq DNA聚合酶(GIBCOBRL)的PCR缓冲液(GIBCO BRL)中建立总体积50μl的PCR反应。PCR程序如下:94℃2min,32个循环的94℃30sec、57℃30sec、72℃50sec。取10μl PCR反应液在1%琼脂糖凝胶上通过凝胶电泳进行分析。通过溴化乙啶染色使条带显影,并在Gel Doc 2000Transilluminator(Biorad)上进行定量。用于分析CYP79F1转录本的引物是引物5(有义方向)和引物6(反义方向)。在57℃时,引物5不与包含CYP79F1基因的基因组DNA发生退火,因为引物5的序列与CYP79F1基因111bp内含子侧翼的序列互补。引物6与CYP79F1的3’非翻译区发生退火,而且对CYP79F1高度特异。用于分析内部标准物的引物是引物7(有义方向)和引物8(反义引物)。内部标准物的PCR分析显示RT反应与用不同量的、由不同植物组织分离的RNA制备的样品同样有效地进行。
在所有检查的组织中都检测到CYP79F1转录本。转录本水平随植株的突变而升高。9周龄开花植株莲座叶中的表达水平比5周龄植株莲座叶高大约4倍。在分析5周龄植株的地上部分时,检测到的CYP79F1转录本比相同植株的莲座叶少。这指示CYP79F1在莲座叶中的表达水平高于叶柄。
                                 序列表
<110>Novartis AG
     Royal Veterinary and Agricultural University
<120>CYP79家族的P450单加氧酶
<130>S-31292A
<140>
<141>
<150>EP 00100646.9
<151>2000-01-13
<150>EP 00107001.0
<151>2000-03-30
<150>EP 00109423.4
<151>2000-05-03
<150>EP 00114184.5
<151>2000-07-13
<150>EP 00114912.9
<151>2000-07-17
<160>85
<170>PatentIn Ver.2.1
<210>1
<211>542
<212>PRT
<213>木薯(Manihot esculenta)
<400>1
Met Ala Met Asn Val Ser Thr Thr Ile Gly Leu Leu Asn Ala Thr Ser
  1               5                  10                  15
Phe Ala Ser Ser Ser Ser Ile Asn Thr Val Lys Ile Leu Phe Val Thr
             20                  25                  30
Leu Phe Tle Ser Ile Val Ser Thr Ile Val Lys Leu Gln Lys Ser Ala
         35                  40                  45
Ala Asn Lys Glu Gly Ser Lys Lys Leu Pro Leu Pro Pro Gly Pro Thr
     50                  55                  60
Pro Trp Pro Leu Ile Gly Asn Ile Pro Glu Met Ile Arg Tyr Arg Pro
 65                  70                  75                  80
Thr Phe Arg Trp Ile His Gln Leu Met Lys Asp Met Asn Thr Asp Ile
                 85                  90                  95
Cys Leu Ile Arg Phe Gly Arg Thr Asn Phe Val Pro Ile Ser Cys Pro
            100                 105                 110
Val Leu Ala Arg Glu Ile Leu Lys Lys Asn Asp Ala Ile Phe Ser Asn
        115                 120                 125
Arg Pro Lys Thr Leu Ser Ala Lys Ser Met Ser Gly Gly Tyr Leu Thr
    130                 135                 140
Thr Ile Val Val Pro Tyr Asn Asp Gln Trp Lys Lys Met Arg Lys Ile
145                 150                 155                 160
Leu Thr Ser Glu Ile Ile Ser Pro Ala Arg His Lys Trp Leu His Asp
                165                 170                 175
Lys Arg Ala Glu Glu Ala Asp Asn Leu Val Phe Tyr Ile His Asn Gln
            180                 185                 190
Phe Lys Ala Asn Lys Asn Val Asn Leu Arg Thr Ala Thr Arg His Tyr
        195                 200                 205
Gly Gly Asn Val Ile Arg Lys Met Val Phe Ser Lys Arg Tyr Phe Gly
    210                 215                 220
Lys Gly Met Pro Asp Gly Gly Pro Gly Pro Glu Glu Ile Glu His Ile
225                 230                 235                 240
Asp Ala Val Phe Thr Ala Leu Lys Tyr Leu Tyr Gly Phe Cys Ile Ser
                245                 250                 255
Asp Phe Leu Pro Phe Leu Leu Gly Leu Asp Leu Asp Gly Gln Glu Lys
            260                 265                 270
Phe Val Leu Asp Ala Asn Lys Thr Ile Arg Asp Tyr Gln Asn Pro Leu
        275                 280                 285
Ile Asp Glu Arg Ile Gln Gln Trp Lys Ser Gly Glu Arg Lys Glu Met
    290                 295                 300
Glu Asp Leu Leu Asp Val Phe Ile Thr Leu Lys Asp Ser Asp Gly Asn
305                 310                 315                 320
Pro Leu Leu Thr Pro Asp Glu Ile Lys Asn Gln Ile Ala Glu Ile Met
                325                 330                 335
Ile Ala Thr Val Asp Asn Pro Ser Asn Ala Ile Glu Trp Ala Met Gly
            340                 345                 350
Glu Met Leu Asn Gln Pro Glu Ile Leu Lys Lys Ala Thr Glu Glu Leu
        355                 360                 365
Asp Arg Val Val Gly Lys Asp Arg Leu Val Gln Glu Ser Asp Ile Pro
    370                 375                 380
Asn Leu Asp Tyr Val Lys Ala Cys Ala Arg Glu Ala Phe Arg Leu His
385                 390                 395                 400
Pro Val Ala His Phe Asn Val Pro His Val Ala Met Glu Asp Thr Val
                405                 410                 415
Ile Gly Asp Tyr Phe Ile Pro Lys Gly Ser Trp Ala Val Leu Ser Arg
            420                 425                 430
Tyr Gly Leu Gly Arg Asn Pro Lys Thr Trp Ser Asp Pro Leu Lys Tyr
        435                 440                 445
Asp Pro Glu Arg His Met Asn Glu Gly Glu Val Val Leu Thr Glu His
    450                 455                 460
Glu Leu Arg Phe Val Thr Phe Ser Thr Gly Arg Arg Gly Cys Val Ala
465                 470                 475                 480
Ser Leu Leu Gly Ser Cys Met Thr Thr Met Leu Leu Ala Arg Met Leu
                485                 490                 495
Gln Cys Phe Thr Trp Thr Pro Pro Ala ASn Val Ser Lys Ile Asp Leu
            500                 505                 510
Ala Glu Thr Leu Asp Glu Leu Thr Pro Ala Thr Pro Ile Ser Ala Phe
        515                 520                 525
Ala Lys Pro Arg Leu Ala Pro His Leu Tyr Pro Thr Ser Pro
    530                 535                 540
<210>2
<211>1845
<212>DNA
<213>木薯(Manihot esculenta)
<400>2
gttcagggca tatcaatatg gccatgaacg tctccaccac catcggttta cttaacgcca 60
cctccttcgc ctcctcctcc tccatcaaca cggtcaagat cttgttcgtc accctcttta 120
tttccattgt tagtactatt gtaaaacttc aaaagagtgc tgctaacaag gaaggtagca 180
agaaactccc actccctcct ggccctactc catggccact catcggaaac atcccggaaa 240
tgatccggta cagacccacg tttcggtgga ttcaccaact catgaaggac atgaacactg 300
atatttgtct cattcgtttt ggaagaacta actttgttcc tataagctgt cctgttcttg 360
ctcgtgaaat actaaaaaag aatgacgcta tcttctctaa caggccaaag actctctctg 420
caaaatctat gagcggagga tacttgacaa ctattgtggt gccatacaat gaccaatgga 480
agaaaatgag gaagatctta acctcagaga tcatttctcc ggccagacac aaatggctcc 540
atgataaaag agctgaggag gctgataatc ttgtgttcta catccacaac cagttcaaag 600
caaataaaaa tgtgaatttg agaacagcca ccaggcatta cggcgggaat gtgatcagaa 660
aaatggtgtt cagcaagaga tacttcggca agggaatgcc ggacggagga ccagggcctg 720
aagaaatcga gcacattgat gccgttttca ctgccttgaa atacttgtat gggttttgca 780
tatcagattt cttgcctttc ttgttgggac ttgatctgga tggccaagaa aaatttgtgc 840
ttgatgcaaa taagaccata agggattatc agaacccttt aattgatgaa aggattcaac 900
aatggaagag tggtgaaagg aaggaaatgg aggacttgct tgatgttttc atcactctca 960
aggattcaga cggcaaccca ttgctcactc ctgacgagat caagaatcaa atagctgaaa 1020
ttatgatagc aacagtagat aacccatcaa acgcaatcga atgggcaatg ggggagatgc 1080
taaatcaacc agaaatcctg aagaaggcca cagaagagct cgacagggtg gtcggcaaag 1140
acaggcttgt tcaagaatcc gacatcccca accttgacta tgtcaaagcc tgtgcaagag 1200
aagccttcag gctccatcca gtagcacact tcaatgtccc tcatgtagcc atggaagaca 1260
ctgtcattgg tgattacttt attccaaagg gcagctgggc agttctcagc cgctatgggc 1320
tcggcaggaa cccaaagaca tggtctgatc ctctcaagta cgatccagaa aggcacatga 1380
acgagggaga ggtggtgctc actgagcacg agttaaggtt tgtgactttc agcactggaa 1440
gacgtggctg cgtagcttcg ttgcttggaa gctgcatgac gacgatgttg ctggcgagga 1500
tgctgcagtg cttcacttgg actccaccag ccaatgtttc caagattgat ctcgccgaga 1560
ctctagatga gcttactcct gcaacaccca tctctgcatt tgccaagcct cgcctggctc 1620
ctcatctcta cccaacgtca ccttgaaaga gagatcagat cttatcagtt cttagaacgt 1680
cctttaatta tgatttgcta aaaacaaata aaaatcattt ggttattgtg taggtaatct 1740
tacaagcttc ctgtttattg agagttgtta attaactctc aaaatgattt gtggggttat 1800
cttgtttctc ttgcaatata gttgctttac tagaaaaaaa aaaaa                 1845
<210>3
<211>541
<212>PRT
<213>木薯(Manihot esculenta)
<400>3
Met Ala Met Asn Val Ser Thr Thr Ala Thr Thr Thr Ala Ser Phe Ala
  1               5                  10                  15
Ser Thr Ser Ser Met Asn Asn Thr Ala Lys Ile Leu Leu Ile Thr Leu
             20                  25                  30
Phe Ile Ser Ile Val Ser Thr Val Ile Lys Leu Gln Lys Arg Ala Ser
         35                  40                  45
Tyr Lys Lys Ala Ser Lys Asn Phe Pro Leu Pro Pro Gly Pro Thr Pro
     50                  55                  60
Trp Pro Leu Ile Gly Asn Ile Pro Glu Met Ile Arg Tyr Arg Pro Thr
 65                  70                  75                  80
Phe Arg Trp Ile His Gln Leu Met Lys Asp Met Asn Thr Asp Ile Cys
                 85                  90                  95
Leu Ile Arg Phe Gly Lys Thr Asn Val Val Pro Ile Ser Cys Pro Val
            100                 105                 110
Ile Ala Arg Glu Ile Leu Lys Lys His Asp Ala Val Phe Ser Asn Arg
        115                 120                 125
Pro Lys Ile Leu Cys Ala Lys Thr Met Ser Gly Gly Tyr Leu Thr Thr
    130                 135                 140
Ile Val Val Pro Tyr Asn Asp Gln Trp Lys Lys Met Arg Lys Val Leu
145                 150                 155                 160
Thr Ser Glu Ile Ile Ser Pro Ala Arg His Lys Trp Leu His Asp Lys
                165                 170                 175
Arg Ala Glu Glu Ala Asp Gln Leu Val Phe Tyr Ile Asn Asn Gln Tyr
            180                 185                 190
Lys Ser Asn Lys Asn Val Asn Val Arg Ile Ala Ala Arg His Tyr Gly
        195                 200                 205
Gly Asn Val Ile Arg Lys Met Met Phe Ser Lys Arg Tyr Phe Gly Lys
    210                 215                 220
Gly Met Pro Asp Gly Gly Pro Gly Pro Glu Glu Ile Met His Val Asp
225                 230                 235                 240
Ala Ile Phe Thr Ala Leu Lys Tyr Leu Tyr Gly Phe Cys Ile Ser Asp
                245                 250                 255
Tyr Leu Pro Phe Leu Glu Gly Leu Asp Leu Asp Gly Gln Glu Lys Ile
            260                 265                 270
Val Leu Asn Ala Asn Lys Thr Ile Arg Asp Leu Gln Asn Pro Leu Ile
        275                 280                 285
Glu Glu Arg Ile Gln Gln Trp Arg Ser Gly Glu Arg Lys Glu Met Glu
    290                 295                 300
Asp Leu Leu Asp Val Phe Ile Thr Leu Gln Asp Ser Asp Gly Lys Pro
305                 310                 315                 320
Leu Leu Asn Pro Asp Glu Ile Lys Asn Gln Ile Ala Glu Ile Met Ile
                325                 330                 335
Ala Thr Ile Asp Asn Pro Ala Asn Ala Val Glu Trp Ala Met Gly Glu
            340                 345                 350
Leu Ile Asn Gln Pro Glu Leu Leu Ala Lys Ala Thr Glu Glu Leu Asp
        355                 360                 365
Arg Val Val Gly Lys Asp Arg Leu Val Gln Glu Ser Asp Ile Pro Asn
    370                 375                 380
Leu Asn Tyr Val Lys Ala Cys Ala Arg Glu Ala Phe Arg Leu His Pro
385                 390                 395                 400
Val Ala Tyr Phe Asn Val Pro His Val Ala Met Glu Asp Ala Val Ile
                405                 410                 415
Gly Asp Tyr Phe Ile Pro Lys Gly Ser Trp Ala Ile Leu Ser Arg Tyr
            420                 425                 430
Gly Leu Gly Arg Asn Pro Lys Thr Trp Pro Asp Pro Leu Lys Tyr Asp
        435                 440                 445
Pro Glu Arg His Leu Asn Glu Gly Glu Val Val Leu Thr Glu His Asp
    450                 455                 460
Leu Arg Phe Val Thr Phe Ser Thr Gly Arg Arg Gly Cys Val Ala Ala
465                 470                 475                 480
Leu Leu Gly Thr Thr Met Ile Thr Met Met Leu Ala Arg Met Leu Gln
                485                 490                 495
Cys Phe Thr Trp Thr Pro Pro Pro Asn Val Thr Arg Ile Asp Leu Ser
            500                 505                 510
Glu Asn Ile Asp Glu Leu Thr Pro Ala Thr Pro Ile Thr Gly Phe Ala
        515                 520                 525
Lys Pro Arg Leu Ala Pro His Leu Tyr Pro Thr Ser Pro
    530                 535                 540
<210>4
<211>1920
<212>DNA
<213>木薯(Manihot esculenta)
<400>4
ggtcttggtc atagccctgg acttgaattg ttcagggcaa caccaatatg gccatgaacg 60
tctccaccac cgcaaccacc acggcctcct tcgcctccac gtcctccatg aacaatactg 120
ccaaaatcct ccttatcacc ctcttcattt ccattgtcag tactgttata aaacttcaaa 180
aaagggcatc ctacaagaaa gctagcaaga acttcccact ccctcctggt ccgactccat 240
ggccactcat cggaaacatc cctgaaatga tccggtacag accgacgttt cgttggattc 300
accaactcat gaaggacatg aacaccgata tttgtctgat ccgtttcgga aaaactaacg 360
ttgttcctat tagctgccct gtcattgctc gtgaaatcct gaaaaagcac gatgctgtct 420
tctctaacag gccaaagatt ctctgcgcta aaacaatgag cggcggatac ttgacgacga 480
ttgtggtgcc atacaatgat caatggaaga aaatgaggaa ggtcctaact tcagagatca 540
tttctccagc taggcacaaa tggctccatg ataagagagc tgaggaagca gatcagcttg 600
tgttctatat caataaccag tacaagagca acaagaatgt gaatgtgaga attgcggcaa 660
ggcattacgg tggaaatgtg atcagaaaga tgatgtttag caagagatac ttcggcaaag 720
ggatgcctga tggaggacca gggcctgaag aaatcatgca cgttgatgca atttttacag 780
cacttaaata tttgtatgga ttttgcatct ctgattactt gccttttttg gaggggcttg 840
atcttgatgg ccaggaaaag attgtgctta atgcaaataa gaccataagg gatcttcaaa 900
acccattaat agaagaaagg attcaacaat ggaggagtgg tgaaagaaag gaaatggaag 960
acttgcttga tgttttcatt actcttcagg attcagatgg caagccattg ctcaatccag 1020
acgagataaa gaatcaaatc gctgaaatta tgatagcaac aatagacaac ccagcaaacg 1080
ccgtagaatg ggcaatgggg gagctgataa atcaaccaga acttctggca aaggccacag 1140
aggaacttga cagagtggtc ggcaaagaca ggcttgtgca agaatctgac atccctaagc 1200
tgaagtacgt caaagcctgt gcaagggagg ccttcaggct ccacccagtt gcatacttca 1260
acgtccctca cgtagccatg gaagacgccg tcatcggcga ttacttcatt ccaaagggca 1320
gctgggcaat tcttagccgc tacgggctcg gccggaaccc aaaaacatgg cctgatccac 1380
tcaagtacga cccagaaagg cacttgaacg agggcgaagt ggtgctgact gagcacgacc 1440
ttaggttcgt cacattcagc actggacgtc gtgggtgtgt cgctgctttg cttggaacca 1500
ccatgattac gatgatgctg gccaggatgc ttcagtgctt cacttggact ccacccccta 1560
atgtaaccag gattgatctc agtgagaata tcgatgagct tactccagca acacccatca 1620
ctggatttgc taagccacgg ttggctcctc atctctaccc cacttcacct tgaattaaag 1680
cccaaagatg ggaagggatg aatgtgagtt gttagaagtt ttaataaaaa aattattggg 1740
tttatatgtg taattacgtg gtaaccttac aaagtgtctg ttattgagag ttttaatctc 1800
tcaaaataat ttgtgtggct aagatttctt catctttgta tctcttgcaa ttgtttgctc 1860
tataaaacat cttatttcct taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920
<210>5
<211>25
<212>DNA
<213>人工序列
<220>
<221>修饰碱基
<222>(14)
<223>i
<220>
<221>修饰碱基
<222>(20)
<223>i
<220>
<221>修饰碱基
<222>(23)
<223>i
<220>
<223>人工序列的描述:寡核苷酸序列
<400>5
gcggaattca rggnaayccn ytnct                                       25
<210>6
<211>26
<212>DNA
<213>人工序列
<220>
<221>修饰碱基
<222>(18)
<223>i
<220>
<223>人工序列的描述:寡核苷酸序列
<400>6
cgcggatccg gdatrtcnga ytcytg                                      26
<210>7
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸序列
<400>7
cgaaacgatg gctatgaacg tctct                                       25
<210>8
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸序列
<400>8
tggtagagac gttcatagcc atcgttt                                     27
<210>9
<211>540
<212>PRT
<213>海韭菜(Triglochin maritima)
<400>9
Met Glu Leu Ile Thr Ile Leu Pro Ser Val Leu Pro Asn Ile His Ser
  1               5                  10                  15
Thr Ala Thr Val Leu Phe Leu Leu Leu Leu Thr Thr Ala Leu Ser Phe
             20                  25                  30
Leu Phe Leu Phe Lys Gln His Leu Thr Lys Leu Thr Lys Ser Lys Ser
         35                  40                  45
Lys Ser Thr Thr Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly
     50                  55                  60
Ser Leu Val Ser Met Tyr Met Asn Arg Pro Ser Phe Arg Trp Ile Leu
 65                  70                  75                  80
Ala Gln Met Glu Gly Arg Arg Ile Gly Cys Ile Arg Leu Gly Gly Val
                 85                  90                  95
His Val Val Pro Val Asn Cys Pro Glu Ile Ala Arg Glu Phe Leu Lys
            100                 105                 110
Val His Asp Ala Asp Phe Ala Ser Arg Pro Val Thr Val Val Thr Arg
        115                 120                 125
Tyr Ser Ser Arg Gly Phe Arg Ser Ile Ala Val Val Pro Leu Gly Glu
    130                 135                 140
Gln Trp Lys Lys Met Arg Arg Val Val Ala Ser Glu Ile Ile Asn Ala
145                 150                 155                 160
Lys Arg Leu Gln Trp Gln Leu Gly Leu Arg Thr Glu Glu Ala Asp Asn
                165                 170                 175
Ile Met Arg Tyr Ile Thr Tyr Gln Cys Asn Thr Ser Gly Asp Thr Asn
            180                 185                 190
Gly Ala Ile Ile Asp Val Arg Phe Ala Leu Arg His Tyr Cys Ala Asn
        195                 200                 205
Val Ile Arg Arg Met Leu Phe Gly Lys Arg Tyr Phe Gly Ser Gly Gly
    210                 215                 220
Glu Gly Gly Gly Pro Gly Lys Glu Glu Ile Glu His Val Asp Ala Thr
225                 230                 235                 240
Phe Asp Val Leu Gly Leu Ile Tyr Ala Phe Asn Ala Ala Asp Tyr Val
                245                 250                 255
Ser Trp Leu Lys Phe Leu Asp Leu His Gly Gln Glu Lys Lys Val Lys
            260                 265                 270
Lys Ala Ile Asp Val Val Asn Lys Tyr His Asp Ser Val Ile Glu Ser
        275                 280                 285
Arg Arg Glu Arg Lys Val Glu Gly Arg Glu Asp Lys Asp Pro Glu Asp
    290                 295                 300
Leu Leu Asp Val Leu Leu Ser Leu Lys Asp Ser Asn Gly Lys Pro Leu
305                 310                 315                 320
Leu Asp Val Glu Glu Ile Lys Ala Gln Ile Ala Asp Leu Thr Tyr Ala
                325                 330                 335
Thr Val Asp Asn Pro Ser Asn Ala Val Glu Trp Ala Leu Ala Glu Met
            340                 345                 350
Leu Asn Asn Pro Asp Ile Leu Gln Lys Ala Thr Asp Glu Val Asp Gln
        355                 360                 365
Val Val Gly Arg His Arg Leu Val Gln Glu Ser Asp Phe Pro Asn Leu
    370                 375                 380
Pro Tyr Ile Arg Ala Cys Ala Arg Glu Ala Leu Arg Leu His Pro Val
385                 390                 395                 400
Ala Ala Phe Asn Leu Pro His Val Ser Leu Arg Asp Thr His Val Ala
                405                 410                 415
Gly Phe Phe Ile Pro Lys Gly Ser His Val Leu Leu Ser Arg Val Gly
            420                 425                 430
Leu Gly Arg Asn Pro Lys Val Trp Asp Asn Pro Leu Arg Phe Asp Pro
        435                 440                 445
Asp Arg His Leu His Gly Gly Pro Thr Ala Lys Val Glu Leu Ala Glu
    450                 455                 460
Pro Glu Leu Arg Phe Val Ser Phe Thr Thr Gly Arg Arg Gly Cys Met
465                 470                 475                 480
Gly Gly Pro Leu Gly Thr Ala Met Thr Tyr Met Leu Leu Ala Arg Phe
                485                 490                 495
Val Gln Gly Phe Thr Trp Gly Leu Arg Pro Ala Val Glu Lys Val Glu
            500                 505                 510
Leu Glu Glu Glu Lys Cys Ser Met Phe Leu Gly Lys Pro Leu Arg Ala
        515                 520                 525
Leu Ala Lys Pro Arg Gln Glu Leu Leu Gln Ser Phe
    530                 535                 540
<210>10
<211>1858
<212>DNA
<213>海韭菜(Triglochin maritima)
<400>10
caatgcattg ctcccactag cccactacgt actataaatg catgcaccac tccacctctc 60
ctcctcagta gcaaaatgga actcataacc attcttccat cagtgcttcc taacatccac 120
tctactgcca cagtactgtt cctcttgcta ctcaccacag ccctctcctt cctcttcctc 180
ttcaaacaac acctcactaa gctaaccaag tccaagtcca agtccaccac attgccaccc 240
ggcccccgac catggcccat cgttggcagc ctcgtgtcga tgtacatgaa ccggccgtct 300
ttccggtgga tactagccca gatggagggg agaaggatag ggtgcattag gttgggtggt 360
gttcatgttg ttccggttaa ttgtcctgag attgctaggg agtttcttaa ggtgcatgat 420
gctgattttg catcgcgtcc ggtcacggtt gtgactcgct actcgtctcg tgggttccgg 480
tctattgccg tggttccact gggggagcaa tggaagaaga tgaggagggt ggtggcgtcg 540
gagattatta atgctaagag gctccaatgg cagcttgggc ttagaaccga agaagccgac 600
aacataatga ggtacatcac ctaccaatgc aacacttcgg gcgacactaa cggagcgatt 660
atcgacgtcc gcttcgccct ccgccactac tgtgccaatg tcatccggcg aatgctgttc 720
gggaaacgct acttcggaag cggtggagaa ggcggtgggc cgggaaagga ggagattgag 780
cacgttgacg ccaccttcga cgtcttgggt ctaatatacg ccttcaatgc ggcggactac 840
gtgtcgtggt tgaagttctt agacttgcat gggcaggaga agaaggttaa gaaggccatt 900
gatgtggtga ataagtatca tgactccgtt atcgagtcga ggagggagag gaaagtagag 960
ggaagagagg acaaggatcc agaggatctt cttgatgtgc ttttgtcgct taaggattct 1020
aatgggaagc ctctcttgga cgtggaggag atcaaagcac aaattgcgga tttgacgtac 1080
gcaacagttg ataacccgtc gaacgccgtg gaatgggcac tagccgagat gctgaacaac 1140
ccggacatcc tccaaaaggc gaccgacgag gtagaccagg tcgtcggaag gcaccgtctc 1200
gtacaagaat ccgacttccc gaacctcccc tacatccggg cctgcgcccg ggaggccctc 1260
cgtctccacc ctgtcgcggc cttcaacctc ccccacgtgt cccttcgtga cactcatgtc 1320
gccggttttt tcattccaaa aggcagccac gttctcctga gtcgcgtcgg cctcggacgc 1380
aaccccaagg tctgggacaa cccgcttcga ttcgaccccg accgacacct ccacggcggg 1440
cccaccgcca aagtcgagct ggccgagccg gagctgaggt tcgtgtcgtt caccaccggg 1500
aggagagggt gcatgggggg cccacttggg actgccatga cttatatgct gcttgctagg 1560
ttcgtccagg gtttcacttg gggtcttcgc cctgctgtgg agaaggttga gcttgaggag 1620
gagaagtgta gcatgttctt gggcaagcca ttaagggctt tggctaagcc acgtcaggag 1680
ctgctccaga gcttctaatt agggttaggg tttgggttgg attaataata cttatgaaat 1740
gcacgtttat gagtctataa atattatcca tgtaagtgtt atatgttttc gtgcaatcct 1800
attatccatg taagttaaat ttgataccat gaatgagttt atatgtgaaa aaaaaaaa   1858
<210>11
<211>533
<212>PRT
<213>海韭菜(Triglochin maritima)
<400>ll
Leu Ile Thr Ile Leu Pro Ser Val Leu Pro Asn Ile His Ser Ser Ala
  1               5                  10                  15
Thr Leu Phe Leu Leu Leu Leu Met Thr Thr Ala Leu Ser Phe Leu Phe
             20                  25                  30
Leu Phe Lys Gln His Leu Ala Lys Leu Thr Lys Pro Lys Ser Thr Thr
         35                  40                  45
Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly Ser Leu Val Ser
     50                  55                  60
Met Tyr Met Asn Arg Pro Ser Phe Arg Trp Ile Leu Ala Gln Met Glu
 65                  70                  75                  80
Gly Arg Arg Ile Gly Cys Ile Arg Leu Gly Gly Val His Val Val Pro
                 85                  90                  95
Val Asn Cys Pro Glu Ile Ala Arg Glu Phe Leu Lys Val His Asp Ser
            100                 105                 110
Asp Phe Ala Ser Arg Pro Val Thr Val Val Thr Arg Tyr Ser Ser Arg
        115                 120                 125
Gly Phe Arg Ser Ile Ala Val Val Pro Leu Gly Glu Gln Trp Lys Lys
    130                 135                 140
Met Arg Arg Val Val Ala Ser Glu Ile Ile Asn Ala Lys Arg Leu Gln
145                 150                 155                 160
Trp Gln Leu Gly Leu Arg Thr Glu Glu Ala Asp Asn Ile Val Arg Tyr
                165                 170                 175
Ile Thr Tyr Gln Cys Asn Thr Ser Gly Asp Thr Ser Gly Ala Ile Ile
            180                 185                 190
Asp Val Arg Phe Ala Leu Arg His Tyr Cys Ala Asn Val Ile Arg Arg
        195                 200                 205
Met Leu Phe Gly Lys Arg Tyr Phe Gly Ser Gly Gly Val Gly Gly Gly
    210                 215                 220
Pro Gly Lys Glu Glu Ile Glu His Val Asp Ala Thr Phe Asp Val Leu
225                 230                 235                 240
Gly Leu Ile Tyr Ala Phe Asn Ala Ala Asp Tyr Val Ser Trp Leu Lys
                245                 250                 255
Phe Leu Asp Leu His Gly Gln Glu Lys Lys Val Lys Lys Ala Ile Asp
            260                 265                 270
Val Val Asn Lys Tyr His Asp Ser Val Ile Asp Ala Arg Thr Glu Arg
        275                 280                 285
Lys Val Glu Asp Lys Asp Pro Glu Asp Leu Leu Asp Val Leu Phe Ser
    290                 295                 300
Leu Lys Asp Ser Asn Gly Lys Pro Leu Leu Asp Val Glu Glu Ile Lys
305                 310                 315                 320
Ala Gln Ile Ala Asp Leu Thr Tyr Ala Thr Val Asp Asn Pro Ser Asn
                325                 330                 335
Ala Val Glu Trp Ala Leu Ala Glu Met Leu Asn Asn Pro Ala Ile Leu
            340                 345                 350
Gln Lys Ala Thr Asp Glu Leu Asp Gln Val Val Gly Arg His Arg Leu
        355                 360                 365
Val Gln Glu Ser Asp Phe Pro Asn Leu Pro Tyr Ile Arg Ala Cys Ala
    370                 375                 380
Arg Glu Ala Leu Arg Leu His Pro Val Ala Ala Phe Asn Leu Pro His
385                 390                 395                 400
Val Ser Leu Arg Asp Thr His Val Ala Gly Phe Phe Ile Pro Lys Gly
                405                 410                 415
Ser His Val Leu Leu Ser Arg Val Gly Leu Gly Arg Asn Pro Lys Val
            420                 425                 430
Trp Asp Asn Pro Leu Gln Phe Asn Pro Asp Arg His Leu His Gly Gly
        435                 440                 445
Pro Thr Ala Lys Val Glu Leu Ala Glu Pro Glu Leu Arg Phe Val Ser
    450                 455                 460
Phe Thr Thr Gly Arg Arg Gly Cys Met Gly Gly Leu Leu Gly Thr Ala
465                 470                 475                 480
Met Thr Tyr Met Leu Leu Ala Arg Phe Val Gln Gly Phe Thr Trp Gly
                485                 490                 495
Leu His Pro Ala Val Glu Lys Val Glu Leu Gln Glu Glu Lys Cys Ser
            500                 505                 510
Met Phe Leu Gly Glu Pro Leu Arg Ala Phe Ala Lys Pro Arg Leu Glu
        515                 520                 525
Leu Leu Gln Ser Phe
    530
<210>12
<211>1778
<212>
<213>海韭菜(Triglochin maritima)
<400>12
ctcataacca ttcttccatc agtgctacca aacatccact cttctgccac attgttcctc 60
ttgctactca tgaccacagc cctctccttc ctcttcctct tcaaacaaca cctcgctaag 120
ctaaccaaac ccaagtccac cacattgcca cctggccccc gaccctggcc catcgttggc 180
agcctcgtgt cgatgtacat gaaccggccg tccttccggt ggatactagc ccagatggag 240
gggaggagga tagggtgcat taggttgggt ggtgttcatg ttgttccggt taattgtcct 300
gagattgcta gggagtttct taaggtgcat gattctgatt ttgcatcgcg tccggtcacg 360
gttgtgactc gctactcgtc tcgtgggttc cggtctattg ccgtggttcc actgggggag 420
cagtggaaga agatgaggag ggtggtggca tcggagatta ttaatgctaa gaggctccaa 480
tggcagcttg ggcttagaac cgaagaagcc gacaacatag tgaggtacat cacctaccaa 540
tgcaacactt cgggcgacac tagcggagcg attatcgacg tccgcttcgc cctccgccac 600
tactgtgcca atgtcatccg gcgaatgctg ttcggaaaac gctactttgg tagcggtgga 660
gtaggcggtg ggcctggaaa ggaggagatt gagcacgttg acgccacctt cgacgtcttg 720
ggtctaatat acgccttcaa tgcggcggac tacgtgtcgt ggttgaagtt cttagacttg 780
catgggcagg agaagaaggt taagaaggcc attgatgtgg tgaataagta tcatgactcc 840
gttatcgacg cgaggacaga gagaaaagtg gaggataagg atccagagga tcttcttgat 900
gtgctttttt cgcttaagga ttctaatgga aagcctctct tggacgtgga ggagatcaaa 960
gcacaaattg cggatttgac gtacgcaaca gttgacaacc cgtcgaacgc cgtggaatgg 1020
gcactagccg agatgctgaa caacccggcc atcctccaaa aggcgaccga cgagctagac 1080
caggtcgtcg gaaggcaccg tctcgtacaa gaatccgact tcccgaacct cccctacatc 1140
cgtgcctgcg cccgggaggc cctccgtctc cacccggtcg cggctttcaa cctcccccac 1200
gtgtcccttc gtgacactca cgtcgccggc ttctttattc ccaaaggcag ccacgttctc 1260
ctgagtcgcg ttggcctcgg acgcaacccc aaggtgtggg acaacccgct tcaattcaac 1320
ccagaccgac acctccacgg cgggcccacc gccaaagtcg agctggccga accggagctg 1380
aggttcgtgt cgttcaccac cgggaggaga gggtgcatgg ggggcctact tgggactgcc 1440
atgacttata tgctgcttgc taggttcgtc cagggtttca cttgggggct tcaccctgct 1500
gtggagaagg ttgagcttca ggaggagaag tgtagcatgt tcttgggcga gccattgaga 1560
gcttttgcta agccacgtct ggagctgctc cagagcttct aattagtttt ggattaataa 1620
taactataat tactaccgat gtccttaaag ttgcatgtcg tgtaactagc acttgttata 1680
tttatagtta tgaaaggtac gtttatgaat ctataaaaat tatccatgta attgttatat 1740
gttttcgtgc aatcgtattg tgagtttggt ttacaaaa                         1778
<210>13
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<220>
<221>修饰碱基
<222>(18)
<223>i
<220>
<221>修饰碱基
<222>(21)
<223>i
<400>13
gcggaattcg ayaayccnws naaygc                                      26
<210>14
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<220>
<221>修饰碱基
<222>(11)
<223>i
<220>
<221>修饰碱基
<222>(17)
<223>i
<220>
<221>修饰碱基
<222>(20)
<223>i
<400>14
gcggatccgc nacrtgnggn ahrttraa                                    28
<210>15
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<220>
<221>修饰碱基
<222>(12)
<223>i
<220>
<221>修饰碱基
<222>(18)
<223>i
<220>
<221>修饰碱基
<222>(21)
<223>i
<400>15
gcggaattcw snaaygcnrt ngartgg                                     27
<210>16
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<220>
<221>修饰碱基
<222>(15)..(17)
<223>i
<220>
<221>修饰碱基
<222>(21)
<223>i
<220>
<221>修饰碱基
<222>(24)
<223>i
<400>16
gcggatccrt traannnngc nacnggrtg                                   29
<210>17
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>17
gcggaattcc acacaggaaa cagctatgac                                  30
<210>18
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>18
gcggatccag acgagtagcg agtcacaac                                   29
<210>19
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>19
gcggatccaa gaggaacagt act                                         23
<210>20
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>20
gcggatccaa gaggaacaat gtg                                         23
<210>21
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>21
gcgaatgcat tgctcccact agcc                                        24
<210>22
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>22
gcgatggtta tgagttccat tttg                                        24
<210>23
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>23
gcgcatatgg aactaataac aattctt                                     27
<210>24
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>24
gcgaagctta ttagaagctc tggagcag                                    28
<210>25
<211>51
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>25
gcgcatatgg ctctgttatt agcagttttt ttcctcttcc tcttcaaaca a          51
<210>26
<211>51
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>26
gcgcatatgg ctcgtcaagt tcattcttct tggaatttac caccaggccc c          51
<210>27
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>27
Asp Asn Pro Ser Asn Ala
  1               5
<210>28
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<220>
<221>变体
<222>(3)
<223>V或L
<400>28
Phe Asn Xaa Pro His Val Ala
  1               5
<210>29
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>29
Ser Asn Ala Val Glu Trp
  1               5
<210>30
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>30
His Pro Val Ala Xaa Phe Asn
  1               5
<210>31
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>31
Val Val Thr Arg Tyr Ser Ser
  1               5
<210>32
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>32
Thr Val Leu Phe Leu Leu
  1               5
<210>33
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>33
Ala Thr Leu Phe Leu Leu
  1               5
<210>34
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>34
Met Glu Leu Ile Thr Ile
  1               5
<210>35
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>35
Met Glu Leu Ile Thr Ile Leu
  1               5
<210>36
<211>5
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>36
Leu Leu Gln Ser Phe
  1               5
<210>37
<211>15
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>37
Met Ala Leu Leu Leu Ala Val Phe Phe Leu Phe Leu Phe Lys Gln
  1               5                  10                  15
<210>38
<211>15
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:编码的引物
<400>38
Met Ala Arg Gln Val His Ser Ser Trp Asn Leu Pro Pro Gly Prc
  1               5                  10                  15
<210>39
<211>523
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>39
Met Leu Ala Phe Ile Ile Gly Leu Leu Leu Leu Ala Leu Thr Met Lys
  1               5                  10                  15
Arg Lys Glu Lys Lys Lys Thr Met Leu Ile Ser Pro Thr Arg Asn Leu
             20                  25                  30
Ser Leu Pro Pro Gly Pro Lys Ser Trp Pro Leu Ile Gly Asn Leu Pro
         35                  40                  45
Glu Ile Leu Gly Arg Asn Lys Pro Val Phe Arg Trp Ile His Ser Leu
     50                  55                  60
Met Lys Glu Leu Asn Thr Asp Ile Ala Cys Ile Arg Leu Ala Asn Thr
 65                  70                  75                  80
His Val Ile Pro Val Thr Ser Pro Arg Ile Ala Arg Glu Ile Leu Lys
                 85                  90                  95
Lys Gln Asp Ser Val Phe Ala Thr Arg Pro Leu Thr Met Gly Thr Glu
            100                 105                 110
Tyr Cys Ser Arg Gly Tyr Leu Thr Val Ala Val Glu Pro Gln Gly Glu
        115                 120                 125
Gln Trp Lys Lys Met Arg Arg Val Val Ala Ser His Val Thr Ser Lys
    130                 135                 140
Lys Ser Phe Gln Met Met Leu Gln Lys Arg Thr Glu Glu Ala Asp Asn
145                 150                 155                 160
Leu Val Arg Tyr Ile Asn Asn Arg Ser Val Lys Asn Arg Gly Asn Ala
                165                 170                 175
Phe Val Val Ile Asp Leu Arg Leu Ala Val Arg Gln Tyr Ser Gly Asn
            180                 185                 190
Val Ala Arg Lys Met Met Phe Gly Ile Arg His Phe Gly Lys Gly Ser
        195                 200                 205
Glu Asp Gly Ser Gly Pro Gly Leu Glu Glu Ile Glu His Val Glu Ser
    210                 215                 220
Leu Phe Thr Val Leu Thr His Leu Tyr Ala Phe Ala Leu Ser Asp Tyr
225                 230                 235                 240
Val Pro Trp Leu Arg Phe Leu Asp Leu Glu Gly His Glu Lys Val Val
                245                 250                 255
Ser Asn Ala Met Arg Asn Val Ser Lys Tyr Asn Asp Pro Phe Val Asp
            260                 265                 270
Glu Arg Leu Met Gln Trp Arg Asn Gly Lys Met Lys Glu Pro Gln Asp
        275                 280                 285
Phe Leu Asp Met Phe Ile Ile Ala Lys Asp Thr Asp Gly Lys Pro Thr
    290                 295                 300
Leu Ser Asp Glu Glu Ile Lys Ala Gln Val Thr Glu Leu Met Leu Ala
305                 310                 315                 320
Thr Val Asp Asn Pro Ser Asn Ala Ala Glu Trp Gly Met Ala Glu Met
                325                 330                 335
Ile Asn Glu Pro Ser Ile Met Gln Lys Ala Val Glu Glu Ile Asp Arg
            340                 345                 350
Val Val Gly Lys Asp Arg Leu Val Ile Glu Ser Asp Leu Pro Asn Leu
        355                 360                 365
Asn Tyr Val Lys Ala Cys Val Lys Glu Ala Phe Arg Leu His Pro Val
    370                 375                 380
Ala Pro Phe Asn Leu Pro His Met Ser Thr Thr Asp Thr Val Val Asp
385                 390                 395                 400
Gly Tyr Phe Ile Pro Lys Gly Ser His Val Leu Ile Ser Arg Met Gly
                405                 410                 415
Ile Gly Arg Asn Pro Ser Val Trp Asp Lys Pro His Lys Phe Asp Pro
            420                 425                 430
Glu Arg His Leu Ser Thr Asn Thr Cys Val Asp Leu Asn Glu Ser Asp
        435                 440                 445
Leu Asn Ile Ile Ser Phe Ser Ala Gly Arg Arg Gly Cys Met Gly Val
    450                 455                 460
Asp Ile Gly Ser Ala Met Thr Tyr Met Leu Leu Ala Arg Leu Ile Gln
465                 470                 475                 480
Gly Phe Thr Trp Leu Pro Val Pro Gly Lys Asn Lys Ile Asp Ile Ser
                485                 490                 495
Glu Ser Lys Asn Asp Leu Phe Met Ala Lys Pro Leu Tyr Ala Val Ala
            500                 505                 510
Thr Pro Arg Leu Ala Pro His Val Tyr Pro Thr
        515                 520
<210>40
<211>1572
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>40
atgctcgcgt ttattatagg tttgcttctt cttgcattaa ctatgaagcg taaggagaag 60
aagaaaacca tgttaattag ccctacgaga aacctctctc tccctcccgg gccgaaatct 120
tggcctttaa tcggaaacct accggaaata ctagggagga acaaaccggt gttccggtgg 180
atacattctc tcatgaaaga actcaacacc gatattgcat gtatccgtct tgcgaatact 240
cacgtgatcc ccgtgacatc cccgagaatt gcaagagaga ttctgaagaa gcaagactcc 300
gttttcgcca ctagaccgct aacgatgggc acggagtact gcagccgcgg gtacttgacc 360
gttgcggtgg agccacaagg agagcagtgg aagaagatga ggagagtggt ggcatctcac 420
gtgacgagca agaagagctt ccaaatgatg ctacaaaaga gaaccgaaga ggctgataac 480
ttagtccggt acatcaataa ccgtagtgtc aaaaaccgtg gtaatgcttt tgtggttatt 540
gatttaaggc ttgcggtacg gcaatacagt ggaaatgtag ctcggaagat gatgtttggt 600
ataaggcatt ttggtaaagg aagtgaagat ggatcgggac cagggttgga agagattgaa 660
catgtggaat ctttgtttac ggttttaacc catctttacg cctttgcatt gtcagattat 720
gtcccgtggc taaggttctt ggacttggaa ggccatgaga aggttgtgag taacgcaatg 780
agaaatgtaa gtaagtataa cgaccctttt gttgatgaaa gactcatgca atggcgaaat 840
gggaagatga aagaacctca agattttctt gacatgttta taatagctaa agacactgac 900
gggaagccta ctctgtcgga cgaagagatc aaagcacaag tgacggaact aatgttggcg 960
acggttgata atccgtctaa cgcggcagag tggggtatgg cggagatgat taacgagccg 1020
agcatcatgc aaaaagccgt ggaagagatt gatagggtag ttggaaaaga ccgtcttgtc 1080
attgagtctg atctcccaaa tcttaactat gtgaaggctt gtgtgaaaga agcattccgg 1140
ttacaccccg tggcaccgtt caacctccct cacatgtcca ccactgatac tgtggtagac 1200
ggttatttca tccccaaggg aagccacgta ttgattagtc gtatggggat tgggagaaat 1260
cctagtgtgt gggacaagcc gcataagttc gaccctgaga gacatttgag cactaacaca 1320
tgtgtggatc taaacgagtc tgatctgaat ataatatcgt tcagtgcagg acgaagaggt 1380
tgtatgggtg tggacattgg gtcagccatg acgtacatgt tactggctcg gttgattcaa 1440
ggattcacgt ggttaccagt gcctggtaag aataagattg atatttcaga aagcaagaat 1500
gatcttttta tggcaaaacc attatacgcg gttgccacac ctcgtttagc tccacatgtg 1560
tatccaacct aa                                                     1572
<210>41
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A2F1
<400>41
gtgcatatgc ttgactccac cccaatg                                     27
<210>42
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A2R1
<400>42
atgcattttt ctagtaatct ttacgctc                                    28
<210>43
<211>37
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A2F2
<400>43
cgtgaattcc atatgctcgc gtttattata ggtttgc                          37
<210>44
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A2R2
<400>44
cggaagctta ttaggttgga tacacatgt                                   29
<210>45
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A2R3
<400>45
cgtcacttgt gctttgatct cttc                                        24
<210>46
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A2F3
<400>46
gaactaatgt tggcgacggt tgat                                        24
<210>47
<211>57
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A2FX1
<400>47
cgtgaattcc atatggctct gttattagca gtttttctcg cgtttattat aggtttg    57
<210>48
<211>57
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A2FX2
<400>48
cgtgaattcc atatggctct gttattagca gtttttcttc ttcttgcatt aactatg    57
<210>49
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A2R4
<400>49
catctcgagt cttcttccac tgctctcctt                                  30
<210>50
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A2FX3
A2FX3
<400>50
ttaatcggaa acctacc                                                17
<210>51
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物17AF
<400>51
cgtgaattcc atatggctct gttattagct gtt                              33
<210>52
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:PCR引物A1R
<400>52
gggccacggc acgggacc                                               18
<210>53
<211>2702
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>53
ctcgagctca gtttcttctt cttcctcgta cttatcctcc tcagccaaac gatctctcac 60
cgtattctct agctgcactc cgtactgagc tccttttatc tcctttatca ccaccactct 120
tataaccttc tccatctccg ctgaaaaatg tataatagta agcagaggaa ccggttcaat 180
ttcgttggac acgtacttaa ccagattaat taagtaaacc ggagtttaac cagttgaatc 240
aaagtaaacc aaaataagaa gccaaaccaa ataatgtatt tattgaacca cgtagtctcc 300
atctaaacca gagaacccta attcaaattt tgatttgaaa acatggacta attaagatta 360
ccggaggcaa gggcgtcgaa gaagtcatca tcgccggcga gttcttttcc ggttttgcct 420
ttccagttat caagatgtgt tttaacatct gaaggatcta agtaaactcc gatcgcagtg 480
aacttcactt gaagaaagtg gatctcaatg tctgtgatcc ctataacaag aatatgaaca 540
atccatataa aattattgtt acctgcgatt ttgttatgta tcgcattata aggtatcaga 600
cattaagaaa gcaaaaaaga aataaaaacc ttggcccaga agagagagtg gcttggaagt 660
gatgatctgt ggaggaaaag gaacctcgtg aaccatgacc atctctgttc ccactgtttg 720
ataaacaaga acacacaaat cttaggaaaa aaacaaagca ttgaaaaaaa gacaatgaga 780
ataattgaaa cttgttagaa ctgaaaatct tactttagtg gataaacttg taataaaaaa 840
gaatgcaaag agtgtaagac ttactttcta atttatatta ttttgaatct gagagtgaag 900
aaatttataa atggcttggt gtactatttt acgatcttag agaaacaata tcgaaattgt 960
aaatgtgaat atctctctct atataataag ccagggactg gtggtaggta acataatttt 1020
gctaacgttc aaagcttgtg atctaaaaga cgacgtattc tttttatgaa ttcaattttt 1080
ttgctaccaa agcttgtgat ctcaattgtt tgttagcgac ccaccaggaa gccacgtgtt 1140
tggatcaagc actcagtcca caaccactca ttctacctaa caaatgaagg tatagaagta 1200
taataattaa aagagataga agaaagaatt gctatgatac agtaaaaaga gatcagatgt 1260
caaatgtgaa acaaagcgta cataaattag atacaaaatt agaagcagcc acatttctcc 1320
acaacggctc ttgaaatcag taacgtaaag taaactgatg atgacaaaga cccaaaaaaa 1380
aaaaaaaaaa aaaaaaagag aaataaagag tgtctttaaa gcagtaacgt ataaaaaccc 1440
tttttcgtct tctcttctat ctcgacctcc caaatcatga aaggatcaat tcatgactcc 1500
gctattacgg gtttagaggc tcagcttatg gcatcgaagc gaggactaat cgaagccgtg 1560
agtttgggga tcactcataa gtcatatctc aatctattgc gatcattatc acatttttga 1620
actggtaagt aagtgttact gctgcaaatc gaaactgact attgaaagct atgcccatct 1680
ttcgacacat aaactaagag ccaagtggga acaaaggatc gaagagacaa ctgaaagaga 1740
ttgggtaatg tgtgcaaagt gccaaaaatt ggcttcagca agtcatggta taatctctat 1800
tctctaatca caatctctag cttttcttaa ttagtcctta tgtaatttga ttatgtttta 1860
attcgcctcc taattaattt catggttgat ggatagtcgt gggtattcct tttgctacgc 1920
atgtcgagcc gaatggaagc tgctaggatt aaatttacag aagctgaatc aatttttaag 1980
tgggccaaat atttacagtt tttataagcc caaatctcca tgtccatatt gtttttaacg 2040
tggcgctacc taaaagggga taaagatttc ataaacagca ttaacaattt aacatcaaca 2100
agattttaaa gggataagga ttaaggaatc gtaagcaaat ttatccttag agattagatt 2160
tagacgaatt tggaaaagta aaaagttggt aattaaatag aaatgtactt aaaacacaac 2220
atgtaataca ttagacatat gagctgttga aaaatcgtgg tttttctaat gatggcgcta 2280
cctaaaaggg acaaggattt cataatgatg cattaccaat ttaacatcca caagatttat 2340
aagggataag gaataatcaa agaaaaaaac atgtcttaca tatgagctgt tgaaaaatcg 2400
tggattcatt taacattgtt ttcttcaaca tttaaagcac atttattttc catagattac 2460
acttaaacaa aagcatttgt ttcatggcta taaatagctt attcctcatc atagataaga 2520
aaaaaccttt tcgaactcaa ataatttctc caaattgaga tttaaaaaaa aaaatgcttg 2580
actccacccc aatgctcgcg tttattatag gtttgcttct tcttgcatta actatgaagc 2640
gtaaggagaa gaagaaaacc atgttaatta gccctacgag aaacctctct ctccctcccg 2700
gg                                                                2702
<210>54
<211>541
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>54
Met Asn Thr Phe Thr Ser Asn Ser Ser Asp Leu Thr Thr Thr Ala Thr
  1               5                  10                  15
Glu Thr Ser Ser Phe Ser Thr Leu Tyr Leu Leu Ser Thr Leu Gln Ala
             20                  25                  30
Phe Val Ala Ile Thr Leu Val Met Leu Leu Lys Lys Leu Met Thr Asp
         35                  40                  45
Pro Asn Lys Lys Lys Pro Tyr Leu Pro Pro Gly Pro Thr Gly Trp Pro
     50                  55                  60
Ile Ile Gly Met Ile Pro Thr Met Leu Lys Ser Arg Pro Val Phe Arg
 65                  70                  75                  80
Trp Leu His Ser Ile Met Lys Gln Leu Asn Thr Glu Ile Ala Cys Val
                 85                  90                  95
Lys Leu Gly Asn Thr His Val Ile Thr Val Thr Cys Pro Lys Ile Ala
            100                 105                 110
Arg Glu Ile Leu Lys Gln Gln Asp Ala Leu Phe Ala Ser Arg Pro Leu
        115                 120                 125
Thr Tyr Ala Gln Lys Ile Leu Ser Asn Gly Tyr Lys Thr Cys Val Ile
    130                 135                 140
Thr Pro Phe Gly Asp Gln Phe Lys Lys Met Arg Lys Val Val Met Thr
145                 150                 155                 160
Glu Leu Val Cys Pro Ala Arg His Arg Trp Leu His Gln Lys Arg Ser
                165                 170                 175
Glu Glu Asn Asp His Leu Thr Ala Trp Val Tyr Asn Met Val Lys Asn
            180                 185                 190
Ser Gly Ser Val Asp Phe Arg Phe Met Thr Arg His Tyr Cys Gly Asn
        195                 200                 205
Ala Ile Lys Lys Leu Met Phe Gly Thr Arg Thr Phe Ser Lys Asn Thr
    210                 215                 220
Ala Pro Asp Gly Gly Pro Thr Val Glu Asp Val Glu His Met Glu Ala
225                 230                 235                 240
Met Phe Glu Ala Leu Gly Phe Thr Phe Ala Phe Cys Ile Ser Asp Tyr
                245                 250                 255
Leu Pro Met Leu Thr Gly Leu Asp Leu Asn Gly His Glu Lys Ile Met
            260                 265                 270
Arg Glu Ser Ser Ala Ile Met Asp Lys Tyr His Asp Pro Ile Ile Asp
        275                 280                 285
Glu Arg Ile Lys Met Trp Arg Glu Gly Lys Arg Thr Gln Ile Glu Asp
    290                 295                 300
Phe Leu Asp Ile Phe Ile Ser Ile Lys Asp Glu Gln Gly Asn Pro Leu
305                 310                 315                 320
Leu Thr Ala Asp Glu Ile Lys Pro Thr Ile Lys Glu Leu Val Met Ala
                325                 330                 335
Ala Pro Asp Asn Pro Ser Asn Ala Val Glu Trp Ala Met Ala Glu Met
            340                 345                 350
Val Asn Lys Pro Glu Ile Leu Arg Lys Ala Met Glu Glu Ile Asp Arg
        355                 360                 365
Val Val Gly Lys Glu Arg Leu Val Gln Glu Ser Asp Ile Pro Lys Leu
    370                 375                 380
Asn Tyr Val Lys Ala Ile Leu Arg Glu Ala Phe Arg Leu His Pro Val
385                 390                 395                 400
Ala Ala Phe Asn Leu Pro His Val Ala Leu Ser Asp Thr Thr Val Ala
                405                 410                 415
Gly Tyr His Ile Pro Lys Gly Ser Gln Val Leu Leu Ser Arg Tyr Gly
            420                 425                 430
Leu Gly Arg Asn Pro Lys Val Trp Ala Asp Pro Leu Cys Phe Lys Pro
        435                 440                 445
Glu Arg His Leu Asn Glu Cys Ser Glu Val Thr Leu Thr Glu Asn Asp
    450                 455                 460
Leu Arg Phe Ile Ser Phe Ser Thr Gly Lys Arg Gly Cys Ala Ala Pro
465                 470                 475                 480
Ala Leu Gly Thr Ala Leu Thr Thr Met Met Leu Ala Arg Leu Leu Gln
                485                 490                 495
Gly Phe Thr Trp Lys Leu Pro Glu Asn Glu Thr Arg Val Glu Leu Met
            500                 505                 510
Glu Ser Ser His Asp Met Phe Leu Ala Lys Pro Leu Val Met Val Gly
        515                 520                 525
Asp Leu Arg Leu Pro Glu His Leu Tyr Pro Thr Val Lys
    530                 535                 540
<210>55
<211>1916
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>55
gtcgacccac gcgtccgcaa cagaaaccac aacaaaaact ttgagtcctc ttcttctcta 60
tacacaaaca tgaacacttt tacctcaaac tcttcggatc tcactaccac tgcaaccgaa 120
acatcgtcct ttagcacctt gtatctcctc tcaacacttc aagcttttgt ggctataacc 180
ttagtgatgc tactcaagaa attgatgacg gatcccaaca aaaagaaacc gtatctgcca 240
ccgggtccca caggatggcc gatcattgga atgattccga cgatgctaaa gagccggccc 300
gttttccggt ggctccacag catcatgaag cagctcaata ctgagatagc atgcgtgaag 360
ttaggaaaca ctcatgtgat caccgtcacg tgccctaaga tagcacgtga gatactcaag 420
caacaagacg ctctcttcgc gtcgaggcct ttaacttacg ctcagaagat cctctctaac 480
ggctacaaaa cctgcgtgat cactcccttt ggtgaccaat tcaagaaaat gaggaaagtt 540
gtgatgacgg aactcgtatg tccagcgaga cacaggtggc tccaccagaa gagatcagaa 600
gaaaacgatc atttaaccgc ttgggtatac aacatggtta agaactcggg ctctgtcgat 660
ttccggttca tgactaggca ttactgtgga aatgcaatca agaagcttat gttcgggacg 720
agaacgttct ctaagaacac tgcacctgac ggtggaccca ccgtagaaga tgtagagcac 780
atggaagcaa tgtttgaagc attagggttt accttcgctt tttgcatctc tgattatctg 840
ccgatgctca ctggacttga tcttaacggt cacgagaaga ttatgagaga atcaagtgcg 900
attatggaca agtatcatga cccaatcatc gacgagagga tcaagatgtg gagagaagga 960
aagagaactc aaatcgaaga ttttcttgat attttcatct ctatcaaaga cgaacaaggc 1020
aacccattgc ttaccgccga tgaaatcaaa cccaccatta aggagcttgt aatggcggcg 1080
ccagacaatc catcaaacgc cgtggaatgg gccatggcgg agatggtgaa caaaccggag 1140
attctccgta aagcaatgga agagatcgac agagtcgtcg ggaaagagag actcgttcaa 1200
gaatccgaca tcccaaaact aaactacgtc aaagctatcc tccgcgaagc tttccgtctc 1260
catcccgtcg ccgccttcaa cctcccccac gtggcacttt ctgacacaac cgtcgccgga 1320
tatcacatcc ctaaaggaag tcaagtcctt cttagccgat atgggctggg ccgtaaccca 1380
aaagtttggg ccgacccact ttgctttaaa ccggagagac atctcaacga atgctccgaa 1440
gttactttga ccgagaacga tctccggttt atctcgttca gtaccgggaa aagaggttgt 1500
gcggctccgg cgctaggaac ggcgttgacc acgatgatgc tcgcgagact tcttcaaggt 1560
ttcacttgga agctacctga gaatgagaca cgtgtcgagc tgatggagtc tagtcacgat 1620
atgtttctgg ctaaaccgtt ggttatggtc ggtgacctta gattgccgga gcatctctac 1680
ccgacggtga agtgagatga gacgacgccg tatatatttt atgaaactac ttttatataa 1740
tcgcccaacc aagtttggtc aattccggtt accagaagat aattggtcaa attgtgaaca 1800
aacttgtgtg ttggtttctt ggttcttttt gggacacttg aattgtgtct cctttacctc 1860
ttcttttgtt gttttcaata aaaactttta ttaccatttc aaaaaaaaaa aaaaaa     1916
<210>56
<211>1974
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>56
atgaacactt ttacctcaaa ctcttcggat ctcactacca ctgcaaccga aacatcgtcc 60
tttagcacct tgtatctcct ctcaacactt caagcttttg tggctataac cttagtgatg 120
ctactcaaga aattgatgac ggatcccaac aaaaagaaac cgtatctgcc accgggtccc 180
acaggatggc cgatcattgg aatgattccg acgatgctaa agagccggcc cgttttccgg 240
tggctccaca gcatcatgaa gcagctcaat actgagatag catgcgtgaa gttaggaaac 300
actcatgtga tcaccgtcac gtgccctaag atagcacgtg agatactcaa gcaacaagac 360
gctctcttcg cgtcgaggcc tttaacttac gctcagaaga tcctctctaa cggctacaaa 420
acctgcgtga tcactccctt tggtgaccaa ttcaagaaaa tgaggaaagt tgtgatgacg 480
gaactcgtat gtccagcgag acacaggtgg ctccaccaga agagatcaga agaaaacgat 540
catttaaccg cttgggtata caacatggtt aagaactcgg gctctgtcga tttccggttc 600
atgactaggc attactgtgg aaatgcaatc aagaagctta tgttcgggac gagaacgttc 660
tctaagaaca ctgcacctga cggtggaccc accgtagaag atgtagagca catggaagca 720
atgtttgaag cattagggtt taccttcgct ttttgcatct ctgattatct gccgatgctc 780
actggacttg atcttaacgg tcacgagaag attatgagag aatcaagtgc gattatggac 840
aagtatcatg acccaatcat cgacgagagg atcaagatgt ggagagaagg aaagagaact 900
caaatcgaag attttcttga tattttcatc tctatcaaag acgaacaagg caacccattg 960
cttaccgccg atgaaatcaa acccaccatt aaggtattta tcacgttcct ttcatataag 1020
gtttcgatcg taaaaatatc aaaagaacaa tttttgttaa attttatttg agaaagcatg 1080
catatcaaat ttatttacac atactaacat tttgattcat aaaacattta taaaagaaga 1140
aagaaacatt ttgtggtaaa agttgattag ttacaatatt tgtttttttt ttgctaaaca 1200
tgggctactt ttttgtttgt ctcttttgat tactttggtc aaagacagat gcatgcaact 1260
taattgtatt tatttttatg ttatacaaaa attaaagatc caaaattaat aaaagctggt 1320
atatatgttt ataatgaata ggagcttgta atggcggcgc cagacaatcc atcaaacgcc 1380
gtggaatggg ccatggcgga gatggtgaac aaaccggaga ttctccgtaa agcaatggaa 1440
gagatcgaca gagtcgtcgg gaaagagaga ctcgttcaag aatccgacat cccaaaacta 1500
aactacgtca aagctatcct ccgcgaagct ttccgtctcc atcccgtcgc cgccttcaac 1560
ctcccccacg tggcactttc tgacacaacc gtcgccggat atcacatccc taaaggaagt 1620
caagtccttc ttagccgata tgggctgggc cgtaacccaa aagtttgggc cgacccactt 1680
tgctttaaac cggagagaca tctcaacgaa tgctccgaag ttactttgac cgagaacgat 1740
ctccggttta tctcgttcag taccgggaaa agaggttgtg cggctccggc gctaggaacg 1800
gcgttgacca cgatgatgct cgcgagactt cttcaaggtt tcacttggaa gctacctgag 1860
aatgagacac gtgtcgagct gatggagtct agtcacgata tgtttctggc taaaccgttg 1920
gttatggtcg gtgaccttag attgccggag catctctacc cgacggtgaa gtga       1974
<210>57
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物T7
<400>57
aatacgactc actatag                                                17
<210>58
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物EST3
<400>58
gctaggatcc atgttgtata cccaag                                      26
<210>59
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物EST6
<400>59
cgggcccgtt ttccggtggc                                             20
<210>60
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物EST7A
<400>60
ggtcaccaaa gggagtgatc acgc                                        24
<210>61
<211>44
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物5*天然*有义
<400>61
atcgtcagtc gaccatatga acacttttac ctcaaactct tcgg                  44
<210>62
<211>68
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物5*牛*有义
<400>62
atcgtcagtc gaccatatgg ctctgttatt agcagttttt acatcgtcct ttagcacctt 60
gtatctcc                                                          68
<210>63
<211>45
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物3*末端*反义
<400>63
actgctagaa ttcgacgtca ttacttcacc gtcgggtaga gatgc                 45
<210>64
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物CYP79B2.2
<400>64
ggaattcatg aacactttta cctca                                       25
<210>65
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物B2SB
<400>65
ttgtctagat cacttcaccg tcgggta                                     27
<210>66
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物B2AF
<400>66
ggcctcgaga tgaacacttt tacctca                                     27
<210>67
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物B2AB
<400>67
ttggaattcc ttcaccgtcg ggtagag                                     27
<210>68
<211>31
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物XbaI
<400>68
gtaccatcta gattcatgtt tgtgtataga g                                31
<210>69
<211>2361
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>69
gaattcattg atctggtctt gctaaaaact ttaaaattga tgagttcaac atcttcaaat 60
gcatgataac gggtccaacg gaaattgact tttttttcat gctcctgata tataataata 120
tctaacgatt acgggttcca ctaattgtca ttactcatta acattcctat ttaaaagttg 180
tgatagtttt agggttttac gtagtcgtgt catatagcga ttaactacgt acttgtagat 240
ttatcaatta cttctgttgt ttacgagaac ctaaaaaaaa gaagcagatg cctagtttat 300
agagcacgtg tactgtcttg aaaacttagg taggttggta aggttaccaa aagaccttaa 360
aggaatataa agttactaat taacttaagt aaagttggta ttgcttatat attgcaaagt 420
attacaaacc aatcccctct gtatattgtt ttaaaccata gattttttta caattaagtt 480
tatgatcaat caattatttc accatttcta ttaaattatg taaaaagaaa aggatatata 540
tatatatata taattaaata agaataaatc aaaataccga aattttttat tatccattct 600
ttgtggacat cgcccctaat atataaaaaa aaaaaacttt cgtataactg atttatattt 660
ttttgtaaaa acttaaagga agcctaagaa atatcttgtg atatttttga caaaatgtgg 720
tatatatctt tttataatat catttataaa gaaaatattg attacatggt gaaaaacatt 780
ttgctagcga tcaacaaaat taaataggca catgttaact gatctcatac gaccttgaaa 840
ttttaatctt tgtgtcgaga gaccgatctt tatgcaaatt atgaaactac acatggttta 900
tgcacggaag atcacattgc atgtatacca tattataaac caaaaatgat caagaagaag 960
gcgaaaacat ttgggtaaat tttaaatttc gatcatgcga ttttttagct catcatcaac 1020
agacaagaaa ctatcttttg tactgtaaat actaaataca aaataaaatc ttcatcattt 1080
tttgcatgtg tcaaataaat tacgcgaact tttttttttt atcgactatt aatagagaaa 1140
cctgttttat ttgccttgat ttggaaaaat ggagaaattg acttaagact tagtctcggt 1200
cacatcggca acaacggagc ttaaacggcg tccgcaacat ggaaactcaa gccacgaatc 1260
tgatatattg actatagaag tagtaagtaa ctttgactcg tcccacatca gtttcaattt 1320
ccacgagggt atttggcagg tgaactctct acgtacccaa aacataatgg ctattttatt 1380
tcataactga tatttagcaa ttaattattc gtccttttta aaccaatttc tatagttggg 1440
aaaataatca atttttacac tttcaatgta tacgttacag attttttttt attagtcatg 1500
cacatatttt caatttttac actttcaatg taaacaatcg attcttaatt gttaaaaata 1560
ggtttacgta aggaattaaa gatttgttta aaatatgttc cggccggtct aataatttac 1620
ttgacgttaa tttcttaaac acttttagat aggaggcttt gtttatccca aatgattttg 1680
taccactgcg acaatactag ctagacataa aatgttaata aatttttatt aagtaatata 1740
atcgaagtat tagatcaatg tagtagacag ttaggttaac taaaacaaga gtaaacactt 1800
ttttttttct tttcaggata ggtaaaacaa atttcacact attttgcgta tttccttaaa 1860
tttgttgttc gttttctcag caaagatgaa tattttgttt catagtaatt cacaagtata 1920
aactcgccag aactcctcaa acagtgaaat ataatatagc ttttaactgt ttttcggctg 1980
gaccgggttt ttaagtgcat atataacacg aggaattttg gcaggtcacc aacaaaactt 2040
ttaaaaatat taaaaattcc catcaagaat agaaattaat aaacaatgat atctctaata 2100
atatagatat tttgaaacgt taggaataat cgtaataatg ttcaacgttg gtggtggtac 2160
tcaagatgga ccctccctcc cacattttcc tcactccttc gtaagtcctt tccacgcata 2220
agggtattat agtcatttca cataaactaa cgactactag acttgtatat aaataggaag 2280
gtgaagctct ctctttatcc atgcagagac aacagaaacc acaacaaaaa ctttgagtcc 2340
tcttcttctc tatacacaaa c                                           2361
<210>70
<211>540
<212>PRT
<213>蔓菁(Brassica napus)
<400>70
Met Asn Thr Phe Thr Ser Asn Ser Ser Asp Leu Thr Ser Thr Thr Thr
  1               5                  10                  15
Gln Thr Ser Pro Phe Ser Asn Met Tyr Leu Leu Thr Thr Leu Gln Ala
             20                  25                  30
Phe Ala Ala Ile Thr Leu Val Met Leu Leu Lys Lys Val Phe Thr Thr
         35                  40                  45
Asp Lys Lys Lys Leu Ser Leu Pro Pro Gly Pro Thr Gly Trp Pro Ile
     50                  55                  60
Ile Gly Met Val Pro Thr Met Leu Lys Ser Arg Pro Val Phe Arg Trp
 65                  70                  75                  80
Leu His Ser Ile Met Lys Gln Leu Asn Thr Glu Ile Ala Cys Val Arg
                 85                  90                  95
Leu Gly Asn Thr His Val Ile Thr Val Thr Cys Pro Lys Ile Ala Arg
            100                 105                 110
Glu Ile Leu Lys Gln Gln Asp Ala Leu Phe Ala Ser Arg Pro Met Thr
        115                 120                 125
Tyr Ala Gln Asn Val Leu Ser Asn Gly Tyr Lys Thr Cys Val Ile Thr
    130                 135                 140
Pro Phe Gly Glu Gln Phe Lys Lys Met Arg Lys Val Val Met Thr Glu
145                 150                 155                 160
Leu Val Cys Pro Ala Arg His Arg Trp Leu His Gln Lys Arg Ala Glu
                165                 170                 175
Glu Asn Asp His Leu Thr Ala Trp Val Tyr Asn Leu Val Lys Asn Ser
            180                 185                 190
Gly Ser Val Asp Phe Arg Phe Val Thr Arg His Tyr Cys Gly Asn Ala
        195                 200                 205
Ile Lys Lys Leu Met Phe Gly Thr Arg Thr Phe Ser Glu Asn Thr Ala
    210                 215                 220
Pro Asp Gly Gly Pro Thr Ala Glu Asp Ile Glu His Met Glu Ala Met
225                 230                 235                 240
Phe Glu Ala Leu Gly Phe Thr Phe Ser Phe Cys Ile Ser Asp Tyr Leu
                245                 250                 255
Pro Met Leu Thr Gly Leu Asp Leu Asn Gly His Glu Lys Ile Met Arg
            260                 265                 270
Asp Ser Ser Ala Ile Met Asp Lys Tyr His Asp Pro Ile Val Asp Ala
        275                 280                 285
Arg Ile Lys Met Trp Arg Glu Gly Lys Arg Thr Gln Ile Glu Asp Phe
    290                 295                 300
Leu Asp Ile Phe Ile Ser Ile Lys Asp Glu Gln Gly Asn Pro Leu Leu
305                 310                 315                 320
Thr Ala Asp Glu Ile Lys Pro Thr Ile Lys Glu Leu Val Met Ala Ala
                325                 330                 335
Pro Asp Asn Pro Ser Asn Ala Val Glu Trp Ala Met Ala Glu Met Val
            340                 345                 350
Asn Lys Pro Glu Ile Leu His Lys Ala Met Glu Glu Ile Asp Arg Val
        355                 360                 365
Val Gly Lys Glu Arg Leu Val Gln Glu Ser Asp Ile Pro Lys Leu Asn
    370                 375                 380
Tyr Val Lys Ala Ile Leu Arg Glu Ala Phe Arg Leu His Pro Val Ala
385                 390                 395                 400
Ala Phe Asn Leu Pro His Val Ala Leu Ser Asp Ala Thr Val Ala Gly
                405                 410                 415
Tyr His Ile Pro Lys Gly Ser Gln Val Leu Leu Ser Arg Tyr Gly Leu
            420                 425                 430
Gly Arg Asn Pro Lys Val Trp Ala Asp Pro Leu Ser Phe Lys Pro Glu
        435                 440                 445
Arg His Leu Asn Glu Cys Ser Glu Val Thr Leu Thr Glu Asn Asp Leu
    450                 455                 460
Arg Phe Ile Ser Phe Ser Thr Gly Lys Arg Gly Cys Ala Ala Pro Ala
465                 470                 475                 480
Leu Gly Thr Ala Leu Thr Thr Met Met Leu Ala Arg Leu Leu Gln Gly
                485                 490                 495
Phe Thr Trp Lys Leu Pro Glu Asn Glu Thr Arg Val Glu Leu Met Glu
            500                 505                 510
Ser Ser His Asp Met Phe Leu Ala Lys Pro Leu Val Met Val Gly Glu
        515                 520                 525
Leu Arg Leu Pro Glu His Leu Tyr Pro Thr Val Lys
    530                 535                 540
<210>71
<211>1913
<212>DNA
<213>蔓菁(Brassica napus)
<400>71
tggagctcca ccgcggtggc ggccgctcta gaactagtgg atcccccggg ctgcaggaat 60
tcgcggccgc gtcgactttg attcttcttc tctgctctct ctctctctac tcgaaaacat 120
gaacaccttt acctcaaact cttcggatct cacttccact acaacgcaaa cgtctccgtt 180
cagcaacatg tatctcctca caacgctcca ggcctttgcg gctataacct tggtgatgct 240
tctcaagaaa gtcttcacga cggataaaaa gaaattgtct ctcccgccgg gtcccaccgg 300
atggccgatc atcggaatgg ttccaacgat gctaaagagc cgtcccgttt tccggtggct 360
ccacagcatc atgaagcagc taaacaccga gatagcctgc gtgaggctag gaaacactca 420
cgtgatcacc gtcacatgcc cgaagatagc acgtgagata ctcaagcaac aagacgctct 480
cttcgcctcg agacccatga cttacgcaca gaatgtcctc tctaacggat acaaaacatg 540
cgtgatcact cccttcggtg aacaattcaa gaaaatgagg aaagtcgtga tgactgaact 600
cgtttgtccc gcgaggcaca ggtggcttca ccagaagaga gctgaagaga acgaccattt 660
aaccgcttgg gtatacaact tggtcaagaa ctctggctca gtcgattttc ggtttgtcac 720
gaggcattac tgtggaaatg ctatcaagaa gcttatgttc gggacaagaa cgttctctga 780
aaacaccgca cctgacggtg gaccaaccgc tgaggatatc gagcatatgg aagctatgtt 840
cgaagcatta gggtttactt tctccttttg tatctctgat tatctaccta tgctcactgg 900
acttgatctt aacggccacg agaagatcat gagggattcg agtgctatta tggacaagta 960
tcacgatcct atcgtcgatg caaggatcaa gatgtggaga gaaggaaaga gaactcaaat 1020
cgaggatttt ctagacattt ttatttctat caaggatgaa caaggcaacc cattgcttac 1080
cgccgatgaa atcaaaccca ccattaagga acttgtaatg gcggcgccag acaatccatc 1140
aaacgctgtc gagtgggcca tggcggagat ggtgaacaaa ccggagatac tccataaagc 1200
aatggaagaa atagacagag ttgtcggaaa agaaagactt gtccaagaat ccgacattcc 1260
aaaattaaat tacgtcaaag ctatcctccg tgaagccttc cgcctccatc ccgtagcggc 1320
ctttaacctc ccacacgtgg cactttccga cgcaaccgtc gccgggtatc acatccctaa 1380
aggaagtcaa gtccttctca gtcgatatgg gctgggccgt aacccgaaag tttgggctga 1440
ccccttgagc tttaaaccgg agagacatct caacgaatgc tcggaagtta ctttgacgga 1500
gaacgatctc cggtttatct cgtttagtac cgggaaaaga ggttgtgctg ctccggcttt 1560
aggtacggcg ttgaccacga tgatgctcgc gagacttctt caaggtttca cttggaagct 1620
gccggagaat gagacacgcg ttgagctgat ggagtctagc catgatatgt ttttggctaa 1680
accattggtt atggtcggtg agttgagact cccagagcat ctttacccga cggtgaagta 1740
agaataaaac gacggcgtat atattttatt aaataacttc tacgtactta tgtaattaac 1800
cacagagttt ggtcggtttc tccggttacc agaagataat cggttaatat atgaacaaac 1860
ttgtgcttgg ttttggtaaa aaaaaaaaaa aaaaaaaact cgaggggggg ccc        1913
<210>72
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物EST1
<400>72
tccatgtgct ctacatct                                               18
<210>73
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物EST2
<400>73
gacggaactc gtatgtcc                                               18
<210>74
<211>537
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>74
Met Ser Phe Thr Thr Ser Leu Pro Tyr Pro Phe His Ile Leu Leu Val
  1               5                  10                  15
Phe Ile Leu Ser Met Ala Ser Ile Thr Leu Leu Gly Arg Ile Leu Ser
             20                  25                  30
Arg Pro Thr Lys Thr Lys Asp Arg Ser Cys Gln Leu Pro Pro Gly Pro
         35                  40                  45
Pro Gly Trp Pro Ile Leu Gly Asn Leu Pro Glu Leu Phe Met Thr Arg
     50                  55                  60
Pro Arg Ser Lys Tyr Phe Arg Leu Ala Met Lys Glu Leu Lys Thr Asp
 65                  70                  75                  80
Ile Ala Cys Phe Asn Phe Ala Gly Ile Arg Ala Ile Thr Ile Asn Ser
                 85                  90                  95
Asp Glu Ile Ala Arg Glu Ala Phe Arg Glu Arg Asp Ala Asp Leu Ala
            100                 105                 110
Asp Arg Pro Gln Leu Phe Ile Met Glu Thr Ile Gly Asp Asn Tyr Lys
        115                 120                 125
Ser Met Gly Ile Ser Pro Tyr Gly Glu Gln Phe Met Lys Met Lys Arg
    130                 135                 140
Val Ile Thr Thr Glu Ile Met Ser Val Lys Thr Leu Lys Met Leu Glu
145                 150                 155                 160
Ala Ala Arg Thr Ile Glu Ala Asp Asn Leu Ile Ala Tyr Val His Ser
                165                 170                 175
Met Tyr Gln Arg Ser Glu Thr Val Asp Val Arg Glu Leu Ser Arg Val
            180                 185                 190
Tyr Gly Tyr Ala Val Thr Met Arg Met Leu Phe Gly Arg Arg His Val
        195                 200                 205
Thr Lys Glu Asn Val Phe Ser Asp Asp Gly Arg Leu Gly Asn Ala Glu
    210                 215                 220
Lys His His Leu Glu Val Ile Phe Asn Thr Leu Asn Cys Leu Pro Ser
225                 230                 235                 240
Phe Ser Pro Ala Asp Tyr Val Glu Arg Trp Leu Arg Gly Trp Asn Val
                245                 250                 255
Asp Gly Gln Glu Lys Arg Val Thr Glu Asn Cys Asn Ile Val Arg Ser
            260                 265                 270
Tyr Asn Asn Pro Ile Ile Asp Glu Arg Val Gln Leu Trp Arg Glu Glu
        275                 280                 285
Gly Gly Lys Ala Ala Val Glu Asp Trp Leu Asp Thr Phe Ile Thr Leu
     290                295                 300
Lys Asp Gln Asn Gly Lys Tyr Leu Val Thr Pro Asp Glu Ile Lys Ala
305                 310                 315                 320
Gln Cys Val Glu Phe Cys Ile Ala Ala Ile Asp Asn Pro Ala Asn Asn
                325                 330                 335
Met Glu Trp Thr Leu Gly Glu Met Leu Lys Asn Pro Glu Ile Leu Arg
            340                 345                 350
Lys Ala Leu Lys Glu Leu Asp Glu Val Val Gly Arg Asp Arg Leu Val
        355                 360                 365
Gln Glu Ser Asp Ile Pro Asn Leu Asn Tyr Leu Lys Ala Cys Cys Arg
    370                 375                 380
Glu Thr Phe Arg Ile His Pro Ser Ala His Tyr Val Pro Ser His Leu
385                 390                 395                 400
Ala Arg Gln Asp Thr Thr Leu Gly Gly Tyr Phe Ile Pro Lys Gly Ser
                405                 410                 415
His Ile His Val Cys Arg Pro Gly Leu Gly Arg Asn Pro Lys Ile Trp
            420                 425                 430
Lys Asp Pro Leu Val Tyr Lys Pro Glu Arg His Leu Gln Gly Asp Gly
        435                 440                 445
Ile Thr Lys Glu Val Thr Leu Val Glu Thr Glu Met Arg Phe Val Ser
    450                 455                 460
Phe Ser Thr Gly Arg Arg Gly Cys Ile Gly Val Lys Val Gly Thr Ile
465                 470                 475                 480
Met Met Val Met Leu Leu Ala Arg Phe Leu Gln Gly Phe Asn Trp Lys
                485                 490                 495
Leu His Gln Asp Phe Gly Pro Leu Ser Leu Glu Glu Asp Asp Ala Ser
            500                 505                 510
Leu Leu Met Ala Lys Pro Leu His Leu Ser Val Glu Pro Arg Leu Ala
        515                 520                 525
Pro Asn Leu Tyr Pro Lys Phe Arg Pro
    530                 535
<210>75
<211>1614
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>75
atgagcttta ccacatcatt accataccct tttcacatcc tactagtctt tatcctctcc 60
atggcatcaa tcactctact gggtcgaata ctctcaaggc ccaccaaaac caaagaccga 120
tcttgccagc ttcctcctgg cccaccagga tggcccatcc tcggcaatct acccgaacta 180
ttcatgactc gtcctaggtc caaatatttc cgccttgcca tgaaagagct aaaaacagat 240
atagcatgtt tcaactttgc cggcatccgt gccatcacca taaactccga cgagatcgct 300
agagaagcgt ttagagagcg agacgcagat ttggcagacc ggcctcaact tttcatcatg 360
gagacaatcg gagacaatta caaatcaatg ggaatttcac cgtacggtga acaattcatg 420
aagatgaaaa gagtgatcac aacggaaatt atgtccgtta agacgttgaa aatgttggag 480
gctgcaagaa ccatcgaagc ggataatctc atagcttacg ttcactccat gtatcaacgg 540
tccgagacgg tcgatgttag agagctctcg agggtttatg gttacgcagt gaccatgcga 600
atgttgtttg gaaggagaca tgttacgaaa gaaaacgtgt tttctgatga tggaagacta 660
ggaaacgccg aaaaacatca tcttgaggtg attttcaaca ctcttaactg tttaccgagt 720
tttagtccag cggattacgt ggaacgatgg ttgagaggtt ggaatgttga tggtcaagag 780
aagagggtga cagagaactg taacattgtt cgtagttaca acaatcccat aatcgacgag 840
agggtccagt tgtggaggga agaaggtggt aaggctgctg ttgaagattg gcttgatacg 900
ttcattaccc taaaagatca aaacggaaag tacttggtca caccagacga aatcaaagct 960
caatgcgtag aattttgtat agcagcgatt gataatccgg caaataacat ggagtggaca 1020
cttggggaaa tgttaaagaa cccggagatt cttagaaaag ctctgaagga gttggatgaa 1080
gtagttggaa gagacaggct tgtgcaagaa tcagacatac caaatctaaa ctacttaaaa 1140
gcttgttgta gagaaacatt cagaattcac ccaagtgctc attatgtccc ttcccatctt 1200
gcgcgtcaag ataccaccct tgggggttat ttcattccca aaggtagcca cattcatgta 1260
tgccgccctg gactaggtcg taaccctaaa atatggaaag atccattggt atacaaaccg 1320
gagcgtcacc tccaaggaga cggaatcaca aaagaggtta ctctggtgga aacagagatg 1380
cgttttgtct cgtttagcac cggtcgacgt ggctgcatcg gtgttaaagt cgggacgatc 1440
atgatggtta tgttgttggc taggtttctt caagggttta actggaaact ccatcaagat 1500
tttggaccgt taagcctcga ggaagatgat gcatcattgc ttatggctaa acctcttcac 1560
ttgtccgttg agccacgctt ggcaccaaac ctttatccaa agttccgtcc ttaa       1614
<210>76
<211>42
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物序列
<400>76
ctctagattc gaacatatgg ctagctttac aacatcatta cc                    42
<210>77
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物序列
<400>77
cgggatcctt aaggacggaa ctttggata                                   29
<210>78
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物序列
<400>78
aactgcagca tgatgagctt taccacatc                                   29
<210>79
<211>42
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物序列
     sequence
<400>79
cgggatcctt aatggtggtg atgaggacgg aactttggat aa                    42
<210>80
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物序列
<400>80
aaagctcaat gcgtagaat                                              19
<210>81
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物序列
<400>81
tttttagaca ccatcttgtt ttcttcttc                                   29
<210>82
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物序列
<400>82
tgtagcggcg cattaagc                                               18
<210>83
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物序列
<400>83
caaaagaata gaccgagata ggg                                         23
<210>84
<211>535
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>84
Met Lys Ile Ser Phe Asn Thr Cys Phe Gln Ile Leu Leu Gly Phe Ile
  1               5                  10                  15
Val Phe Ile Ala Ser Ile Thr Leu Leu Gly Arg Ile Phe Ser Arg Pro
             20                  25                  30
Ser Lys Thr Lys Asp Arg Cys Arg Gln Leu Pro Pro Gly Arg Pro Gly
         35                  40                  45
Trp Pro Ile Leu Gly Asn Leu Pro Glu Leu Ile Met Thr Arg Pro Arg
     50                  55                  60
Ser Lys Tyr Phe His Leu Ala Met Lys Glu Leu Lys Thr Asp Ile Ala
 65                  70                  75                  80
Cys Phe Asn Phe Ala Gly Thr His Thr Ile Thr Ile Asn Ser Asp Glu
                 85                  90                  95
Ile Ala Arg Glu Ala Phe Arg Glu Arg Asp Ala Asp Leu Ala Asp Arg
            100                 105                 110
Pro Gln Leu Ser Ile Val Glu Ser Ile Gly Asp Asn Tyr Lys Thr Met
        115                 120                 125
Gly Thr Ser Ser Tyr Gly Glu His Phe Met Lys Met Lys Lys Val Ile
    130                 135                 140
Thr Thr Glu Ile Met Ser Val Lys Thr Leu Asn Met Leu Glu Ala Ala
145                 150                 155                 160
Arg Thr Ile Glu Ala Asp Asn Leu Ile Ala Tyr Ile His Ser Met Tyr
                165                 170                 175
Gln Arg Ser Glu Thr Val Asp Val Arg Glu Leu Ser Arg Val Tyr Gly
            180                 185                 190
Tyr Ala Val Thr Met Arg Met Leu Phe Gly Arg Arg His Val Thr Lys
        195                 200                 205
Glu Asn Met Phe Ser Asp Asp Gly Arg Leu Gly Lys Ala Glu Lys His
    210                 215                 220
His Leu Glu Val Ile Phe Asn Thr Leu Asn Cys Leu Pro Gly Phe Ser
225                 230                 235                 240
Pro Val Asp Tyr Val Asp Arg Trp Leu Gly Gly Trp Asn Ile Asp Gly
                245                 250                 255
Glu Glu Glu Arg Ala Lys Val Asn Val Asn Leu Val Arg Ser Tyr Asn
            260                 265                 270
Asn Pro Ile Ile Asp Glu Arg Val Glu Ile Trp Arg Glu Lys Gly Gly
        275                 280                 285
Lys Ala Ala Val Glu Asp Trp Leu Asp Thr Phe Ile Thr Leu Lys Asp
    290                 295                 300
Gln Asn Gly Asn Tyr Leu Val Thr Pro Asp Glu Ile Lys Ala Gln Cys
305                 310                 315                 320
Val Glu Phe Cys Ile Ala Ala Ile Asp Asn Pro Ala Asn Asn Met Glu
                325                 330                 335
Trp Thr Leu Gly Glu Met Leu Lys Asn Pro Glu Ile Leu Arg Lys Ala
            340                 345                 350
Leu Lys Glu Leu Asp Glu Val Val Gly Lys Asp Arg Leu Val Gln Glu
        355                 360                 365
Ser Asp Ile Arg Asn Leu Asn Tyr Leu Lys Ala Cys Cys Arg Glu Thr
    370                 375                 380
Phe Arg Ile His Pro Ser Ala His Tyr Val Pro Pro His Val Ala Arg
385                 390                 395                 400
Gln Asp Thr Thr Leu Gly Gly Tyr Phe Ile Pro Lys Gly Ser His Ile
                405                 410                 415
His Val Cys Arg Pro Gly Leu Gly Arg Asn Pro Lys Ile Trp Lys Asp
            420                 425                 430
Pro Leu Ala Tyr Glu Pro Glu Arg His Leu Gln Gly Asp Gly Ile Thr
        435                 440                 445
Lys Glu Val Thr Leu Val Glu Thr Glu Met Arg Phe Val Ser Phe Ser
    450                 455                 460
Thr Gly Arg Arg Gly Cys Val Gly Val Lys Val Gly Thr Ile Met Met
465                 470                 475                 480
Ala Met Met Leu Ala Arg Phe Leu Gln Gly Phe Asn Trp Lys Leu His
                485                 490                 495
Arg Asp Phe Gly Pro Leu Ser Leu Glu Glu Asp Asp Ala Ser Leu Leu
            500                 505                 510
Met Ala Lys Pro Leu Leu Leu Ser Val Glu Pro Arg Leu Ala Ser Asn
        515                 520                 525
Leu Tyr Pro Lys Phe Arg Pro
    530                 535
<210>85
<211>1608
<212>
<213>拟南芥(Arabidopsis thaliana)
<400>85
atgaagatta gctttaacac atgctttcaa atcttactag gatttatcgt cttcatcgca 60
tcaatcactt tactaggtcg aatattctca aggccttcca aaaccaaaga ccggtgtcgc 120
cagcttcctc ctggccgacc aggatggccc atcctcggca atctacccga actaatcatg 180
actcgtccta ggtccaaata tttccacctt gccatgaaag agctaaaaac ggatatcgca 240
tgtttcaact ttgccggaac ccacaccatc accataaact ccgacgagat cgctagagaa 300
gcttttagag agcgagacgc agatttggca gaccggcctc aactttccat cgtagagtcc 360
attggagaca attacaaaac aatgggaacc tcatcgtacg gtgaacattt catgaagatg 420
aaaaaagtga tcacaacgga aattatgtcc gttaaaacgt tgaatatgtt ggaagctgcg 480
agaaccatcg aagcggataa tctcattgct tacattcact cgatgtatca acggtcggag 540
acggtcgacg ttagagaact ttcgagagtt tatggttacg cagtgaccat gagaatgttg 600
tttggaagga gacatgtcac gaaagaaaac atgttttcgg atgatgggag actaggaaaa 660
gccgaaaaac atcatcttga ggtgattttc aacactctaa actgtttgcc aggttttagt 720
cccgtggatt acgtggaccg atggttaggt ggttggaata ttgatggtga agaggagaga 780
gcgaaagtga atgttaatct tgttcgtagt tacaacaatc ccataataga cgagagggtc 840
gaaatttgga gggaaaaagg tggtaaggct gctgtggaag attggcttga tacgttcatt 900
acgctaaaag atcaaaacgg aaactacttg gttacgccag acgaaatcaa agctcaatgc 960
gtcgaatttt gtatagcagc gatcgataat ccggcaaata acatggagtg gacacttggg 1020
gaaatgttaa agaacccgga gattcttaga aaagctctga aggagttgga tgaagtagtt 1080
ggaaaagaca ggcttgtgca agaatcagac atacgaaatc taaactactt aaaagcttgt 1140
tgcagagaaa cattcaggat tcacccaagc gctcattatg tcccacctca tgttgcccgt 1200
caagatacca cccttggggg ttattttatt cccaaaggta gccacattca tgtatgccgc 1260
cctgggctag gccggaaccc taaaatatgg aaagatccat tagcatacga accggagcgt 1320
cacctccaag gagacggaat cacaaaagag gttactctgg tcgaaacaga gatgcgtttt 1380
gtctcattta gcactggtag acgtggctgc gtcggtgtca aagtcgggac aattatgatg 1440
gctatgatgt tggctaggtt tcttcaaggt tttaactgga aactccatcg agatttcgga 1500
ccgttaagcc tcgaggaaga tgatgcatca ttgcttatgg ctaagcctct tcttttgtct 1560
gttgagccac gcttggcatc aaacctttat ccaaaattcc gtccttaa              1608

Claims (11)

1.编码能将脂族氨基酸转变成相应肟的P450单加氧酶的DNA,其中所述DNA在与下述相当的条件下能够与编码SEQ ID NO:1或SEQ ID NO:3所示序列的DNA相杂交:于68℃在5×SSC、0.1%N-肉桂酰肌氨酸、0.02%SDS、1%封闭剂的溶液中温育过夜,随后在65℃用0.1×SSC、0.1%SDS的溶液洗涤。
2.权利要求1的DNA,其中包含编码SEQ ID NO:1中第334-484位氨基酸或SEQ ID NO:3中第333-483位氨基酸的核苷酸序列。
3.权利要求1的DNA,其编码长度为450-600个氨基酸残基的P450单加氧酶。
4.权利要求1的DNA,其编码具有SEQ ID NO:1或SEQ ID NO:3所示氨基酸序列的P450单加氧酶。
5.权利要求4的DNA,其具有SEQ ID NO:2或SEQ ID NO:4的核苷酸序列。
6.权利要求1-5中任一项的DNA,其中所述DNA中可操作连接了一种或多种调控序列,所述调控序列不同于该DNA所来源的基因的调控序列。
7.由权利要求1-6中任一项的DNA所编码的P450单加氧酶,该酶可将脂族氨基酸转变成相应的肟。
8.一种植物细胞,其中包含权利要求6的DNA。
9.用于分离编码P450单加氧酶的cDNA的方法,所述酶可将脂族氨基酸转变成相应的肟;该方法包括:
(1)由表达这种单加氧酶的植物组织构建cDNA文库;
(2)使用设计成可与SEQ ID NO:2、或SEQ ID NO:4或者编码SEQ ID NO:1或SEQ ID NO:3的DNA相结合、长度至少为15个核苷酸的至少一种寡核苷酸由该cDNA文库扩增P450单加氧酶cDNA的部分;
(3)任选使用设计成可与SEQ ID NO:2、或SEQ ID NO:4或者编码SEQ ID NO:1或SEQ ID NO:3的DNA相结合、长度至少为15个核苷酸的另一种寡核苷酸在嵌套PCR反应中由该cDNA文库扩增P450单加氧酶cDNA的部分;
(4)使用在步骤(2)或(3)中获得的DNA作为探针筛选由表达P450单加氧酶的植物组织构建的cDNA文库,所述酶可将脂族氨基酸转变成相应的肟;和
(5)鉴定并纯化包含编码蛋白质的DNA的载体DNA,其中所述编码蛋白质的DNA在与下述相当的条件下能够与编码SEQ ID NO:1或SEQ ID NO:3所示序列的DNA相杂交:于68℃在5×SSC、0.1%N-肉桂酰肌氨酸、0.02%SDS、1%封闭剂的溶液中温育过夜,随后在65℃用0.1×SSC、0.1%SDS的溶液洗涤;
(6)任选进一步处理纯化的DNA。
10.纯化的重组P450单加氧酶的生产方法,所述酶可将脂族氨基酸转变成相应的肟,该方法包括用权利要求1-6中任一项所述DNA转化巴斯德毕赤酵母(P.pastoris),在所述被转化的巴斯德毕赤酵母细胞能够表达由该DNA编码的P450单加氧酶的条件下培养所述细胞,并纯化该酶。
11.获取表达P450单加氧酶的转基因植物的方法,所述酶可将脂族氨基酸转变成相应的肟,包括:
(1)用权利要求1-6中任一项所述DNA转化能够再生成完整植株的植物细胞或组织中;
(2)再生成转基因植株;并
(3)选择具有所述酶活性的植株。
CNB018040985A 2000-01-13 2001-01-11 Cyp79家族的p450单加氧酶 Expired - Fee Related CN1206347C (zh)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
EP00100646 2000-01-13
EP00100646.9 2000-01-13
EP00107001 2000-03-30
EP00107001.0 2000-03-30
EP00109423 2000-05-03
EP00109423.4 2000-05-03
EP00114184 2000-07-13
EP00114184.5 2000-07-13
EP00114912.9 2000-07-17
EP00114912 2000-07-17

Publications (2)

Publication Number Publication Date
CN1396953A CN1396953A (zh) 2003-02-12
CN1206347C true CN1206347C (zh) 2005-06-15

Family

ID=27513019

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018040985A Expired - Fee Related CN1206347C (zh) 2000-01-13 2001-01-11 Cyp79家族的p450单加氧酶

Country Status (8)

Country Link
US (1) US20030166202A1 (zh)
EP (1) EP1246906A2 (zh)
JP (1) JP2003519489A (zh)
CN (1) CN1206347C (zh)
AU (1) AU774488B2 (zh)
CA (1) CA2396375A1 (zh)
HK (1) HK1053146B (zh)
WO (1) WO2001051622A2 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2378814A1 (en) * 2000-05-23 2001-11-29 Institute Of Molecular Agrobiology Gene controlling shoot branching in plants
CN101921777B (zh) * 2010-08-31 2012-01-25 浙江省农业科学院 水稻叶片倾角控制基因sal1的应用
WO2012126059A1 (en) * 2011-03-22 2012-09-27 Monash University Novel stock feed crop plant
CN102524260B (zh) * 2011-12-25 2013-10-23 浙江大学 用于提高芥蓝芽菜芥子油苷含量的制剂
IL241462A0 (en) * 2015-09-10 2015-11-30 Yeda Res & Dev Heterologous engineering of betalain pigments in plants
CN110923249A (zh) * 2019-10-15 2020-03-27 贵州省烟草科学研究院 烟草CyP71及在调控植物表皮毛发育方面的应用
CN114015713A (zh) * 2021-11-18 2022-02-08 中国科学院昆明植物研究所 一种利用大肠杆菌生物合成吲哚-3-甲基芥子油苷i3m的方法
CN114350690B (zh) * 2022-01-25 2023-07-25 天津师范大学 白蛾周氏啮小蜂细胞色素p450CYP4C3基因在抗杀虫剂胁迫中的应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU1108295A (en) * 1993-12-08 1995-06-27 Ciba-Geigy Ag Cytochrome p-450 monooxygenases
WO1998040470A2 (en) * 1997-03-07 1998-09-17 Novartis Ag Cytochrome p450 monooxygenases

Also Published As

Publication number Publication date
CA2396375A1 (en) 2001-07-19
HK1053146A1 (en) 2003-10-10
AU774488B2 (en) 2004-07-01
AU3541301A (en) 2001-07-24
HK1053146B (zh) 2005-09-23
WO2001051622A2 (en) 2001-07-19
CN1396953A (zh) 2003-02-12
WO2001051622A3 (en) 2002-01-31
EP1246906A2 (en) 2002-10-09
US20030166202A1 (en) 2003-09-04
JP2003519489A (ja) 2003-06-24

Similar Documents

Publication Publication Date Title
CN1245516C (zh) 编码乙酰乳酸合酶基因的基因
CN1246461C (zh) 修饰植物中次级代谢化合物水平的方法和组合物
CN1836039A (zh) 改变了花色的蔷薇的制造方法
CN101068929A (zh) 参与植物纤维发育的多核苷酸和多肽和使用它们的方法
CN1624135A (zh) 编码植物脱氧海普赖氨酸合成酶的dna,植物真核起始因子5a,转基因植物和控制植物衰老和程序性细胞死亡的方法
CN1285875A (zh) 突变的羟基苯丙酮酸双氧化酶、基dna序列和含该基因且耐除草剂的植物的分离
CN1195861C (zh) 将多肽被囊化于淀粉基质中
CN1946284A (zh) 具有改良的生长特性的植物及其制备方法
CN1852975A (zh) 转基因的高色氨酸植物
CN101065490A (zh) 用于植物的启动子分子
CN1810977A (zh) 增强植物和真菌中的2-乙酰基-1-吡咯的合成的核酸
CN1487997A (zh) 诱导植物开花的hd3a基因及其应用
CN1206347C (zh) Cyp79家族的p450单加氧酶
CN1313616C (zh) 表达葡糖基转移酶核酸的转基因细胞
CN1685040A (zh) 用于在植物中表达基因的种子特异性usp启动子
CN1719971A (zh) 转基因高色氨酸植物
CN1131315C (zh) 植物中海藻糖的产生
CN1639337A (zh) 具有催泪成分合成酶活性的蛋白质或多肽、编码该蛋白质或多肽的 DNA、利用该 DNA制造具有催泪成分合成酶活性的蛋白质或多肽的制造方法以及具有抑制该蛋白质或多肽的mRNA翻译的功能的核酸分子
CN101037695A (zh) 一种控制水稻花粉育性基因及应用
CN1898383A (zh) 来自地钱的不饱和脂肪酸合成系统酶基因及其利用
CN1262651C (zh) 使植物产生杂草防治化合物耐受性的方法
CN1294267C (zh) 携带新黄素裂解酶基因的转基因植物
CN1661015A (zh) 来自产朊假丝酵母的谷胱甘肽合成酶编码基因
CN1214105C (zh) Map激酶磷酸酶突变体
CN1283796C (zh) 编码半胱氨酸蛋白酶的基因和启动子及生产雄性不育水稻的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee