CN1250724C - 参与外遗传基因沉默的基因 - Google Patents

参与外遗传基因沉默的基因 Download PDF

Info

Publication number
CN1250724C
CN1250724C CN 00809325 CN00809325A CN1250724C CN 1250724 C CN1250724 C CN 1250724C CN 00809325 CN00809325 CN 00809325 CN 00809325 A CN00809325 A CN 00809325A CN 1250724 C CN1250724 C CN 1250724C
Authority
CN
China
Prior art keywords
ser
leu
glu
ala
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 00809325
Other languages
English (en)
Other versions
CN1364194A (zh
Inventor
Y·羽部
O·米特尔斯坦施德
P·阿麦德欧
J·帕茨克斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Publication of CN1364194A publication Critical patent/CN1364194A/zh
Application granted granted Critical
Publication of CN1250724C publication Critical patent/CN1250724C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Virology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及编码参与基因沉默的蛋白的DNA。相关基因可从不同来源如哺乳动物或植物的细胞中分离,其编码蛋白的特征为氨基酸序列含有与SEQ ID NO:3的对比成分序列有40%或更多一致性的、至少有150个氨基酸残基的成分序列。进一步公开的是一种分离根据本发明的DNA的方法。

Description

参与外遗传基因沉默的基因
本发明涉及编码调控基因沉默、特别是植物基因沉默的蛋白质的DNA。
在对发育、环境或未知信号的反应中可以观察到植物中先前活跃的基因表达的丧失,也称为基因沉默。虽然其发生的频率比突变高,但在体细胞传递过程中显著稳定。基因沉默,最初被认为是转基因表达不稳定的有害起因,现在则被看作是有目的地调控基因表达的分子工具。
看来,受影响座位的染色体位置或结构可能是决定沉默频率和强度的因素。失活似乎偏向于影响存在多拷贝的基因,并被认为是序列冗余的结果。同源依赖性的基因沉默的许多实例已有报道。进一步分析可根据受影响座位的相对位置(顺式、反式、等位、异位)、受影响基因的来源(内源的或转基因的)和相互作用的水平(转录或转录后)对沉默事件进行分类。尽管转录后沉默看起来主要包括形成异常RNA分子和偶然而非必然地伴随DNA甲基化,但干扰转录起始的沉默与DNA的高度甲基化、而且可能与沉默座位的染色质结构改变紧密关联。然而,不清楚这些分子事件是基因沉默的前提还是沉默状态的结果。
就转录沉默而言,沉默基因的失活状态通过有丝分裂和减数分裂稳定传递。同在其它生物中一样,反式作用修饰基因座位(modifier locus)可能负责沉默基因失活状态的稳定性。料想导致突变蛋白的这些座位的突变可能通过干扰沉默状态的维持或不能识别序列冗余而导致减少的基因沉默以及先前沉默座位的再活化。已经报道拟南芥(Arabidopsisthaliana)DDM1基因中的突变使基因沉默解除,并且该基因编码参与染色质重塑(remodeling)的SWI2/SNF2样的蛋白。但是,DDM1基因的突变引起严重的多效性效应。因此,为了能够使用基因技术改变这种效应,有必要鉴定更多的特异性修饰基因座位并表征相应的野生型和突变型蛋白。本发明的主要目的是提供包含编码这种蛋白的可读框的DNA。
对于带有可遗传地失活的、甲基化的潮霉素抗性基因的鼠耳芥属(Arabidopsis)株系,可通过实施例1描述的T-DNA插入诱变来鉴定根据本发明的反式作用修饰基因座位。沉默修饰基因座位的突变导致潮霉素抗性基因沉默的解除并恢复潮霉素抗性。用不同于潮霉素抗性基因的选择标记基因转化沉默的抗性基因纯合的植物,该选择标记基因受T-DNA1′-2′二元启动子的控制。选择转化体并筛选其后代的潮霉素抗性。筛选与特定T-DNA插入片段遗传共分离的突变表型(潮霉素抗性)。使用重组DNA技术的常规方法克隆标签化基因,可表征沉默修饰基因座位的突变型和野生型DNA序列及编码的蛋白。
在本发明中,提到 基因应理解为是指与调控序列相连的DNA编码序列,该调控序列可使编码序列转录成RNA如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA。调控序列的实例为启动子序列、5′和3′非翻译序列、内含子和终止序列。
启动子理解为启始相关DNA序列转录的DNA序列,也可包括作为基因表达调控器的元件如激活子、增强子或阻遏子。
基因的 表达指在活细胞内基因转录成RNA或基因转录及随后翻译成蛋白质。就反义结构而言,表达仅指反义DNA的转录。
术语 转化细胞指将核酸导入宿主细胞,特别是DNA分子稳定整合到所述细胞的基因组中。
特定核苷酸或氨基酸序列的任一部分或片段称为 成分序列
根据本发明的DNA含有编码蛋白质的可读框,该蛋白质的特征为氨基酸序列含有与SEQ ID NO:3有40%或更多一致性的、至少有150个氨基酸残基的成分序列。具体地,该可读框编码的蛋白可用式R1-R2-R3来描述,其中
--R1、R2和R3构成由从氨基酸残基组Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg和His中独立选择的氨基酸残基组成的成分序列,
--R1和R3由0-3000个氨基酸残基独立组成;
--R2由至少150个氨基酸残基组成;且
--R2与SEQ ID NO:3的对比成分序列至少有40%相同。
大多数情况下该蛋白的总长在1000-3000氨基酸残基的范围内。在本发明优选的实施方案中成分序列R2由至少200个氨基酸残基组成。成分序列R2的具体实例为下列氨基酸范围所代表的SEQ ID NO:3的成分序列:
1-416(相应于外显子2);
418-583(相应于外显子3-5);
584-890(相应于外显子6);
892-1472(相应于外显子7-9);
1007-1472(相应于外显子9);
1473-1631(相应于外显子10-12);
1632-1827(相应于外显子13-15);和
1829-2001(相应于外显子16)。
在本发明优选的实施方案中,成分序列R1和R3中至少有一个含有一个或多个长度至少为50个氨基酸、并与SEQ ID NO:3的对比成分序列至少60%一致的额外成分序列。这类额外成分序列的具体实例为下列氨基酸范围所代表的SEQ ID NO:3的成分序列:
420-525(相应于外显子3和4);
444-525(相应于外显子4);
526-583(相应于外显子5);
892-971(相应于外显子7);
892-1006(相应于外显子7和8);
1473-1524(相应于外显子10);
1525-1576(相应于外显子11);
1577-1631(相应于外显子12);
1632-1690(相应于外显子13);
1692-1757(相应于外显子14);和
1758-1827(相应于外显子15)。
根据本发明DNA的特别优选的实施方案编码具有由SEQ ID NO:3的氨基酸478-490、584-600、617-630、654-668、676-690、718-734、776-788、1222-1233、1738-1749或1761-1770限定的成分序列的蛋白。优选地,该编码蛋白含有至少两个、三个或更多所述成分序列的不同代表。所述实施方案的具体实例编码可用SEQ ID NO:3的氨基酸序列、用氨基酸残基K替代SEQ ID NO:3的705位的M或用氨基酸残基D替代SEQID NO:3的1219位的E的等位氨基酸序列表征的蛋白。
动态程序设计算法产生不同种类的对比。序列对比通常有两种方法。Needleman和Wunsch及Sellers提出的算法对比两个序列的全长,提供序列的总体对比。另一方面Smith-Waterman算法产生局部对比。选择计分矩阵和空位罚分后,局部对比序列中最相似的区域对。这使得数据库的搜索集中在序列的最高保守区。它也可对比待鉴定序列中的相似区域。为了提高使用Smith-Waterman算法对比的速度,BLAST(局部对比搜索基础工具)和FASTA在对比时都加了额外的限制。
在本发明中使用BLAST方便地进行对比,BLAST是一套相似性搜索的程序,设计用来探测所有提供的序列数据库,无论查询的是蛋白还是DNA。该搜索工具的BLAST 2.0版(Gapped BLAST)已在互联网(目前的http://www.ncbi.nlm.nih.gov/BLAST/)向公众发布。它使用寻求局部对比而非总体对比的启发式算法,因此能够检查仅共享隔离区域的序列间的关系。BLAST搜索中的对比得分有明确的统计学解释。在本发明范围内特别有用的是可在局部序列对比中导入空位的blastp程序和PSI-BLAST程序(这两种程序将查询的氨基酸序列与蛋白序列数据库比较),以及只能对两个序列进行局部对比的blastp变异程序。优选将任选参数设定为默认值来运行所述程序。
使用BLAST的序列对比也可考虑一种氨基酸被另一种氨基酸所替代是可能保留维持蛋白结构和功能所必需的物理化学特性,还是更可能破坏蛋白的基本结构和功能特征。与相同氨基酸的百分率比较,这种序列相似性按照“阳性”氨基酸的百分率来定量,并且在两可的情况中有助于将蛋白归属于正确的蛋白家族。
使用这些计算机程序的序列对比揭示了ATP/GTP结合基元A(SEQ IDNO:3中的460-467位氨基酸)的存在,其共有序列为(Ala/Gly)XaaXaaXaaXaaGlyLys(Ser/Thr),其中(Ala/Gly)指Ala或Gly,Xaa指任意天然存在的氨基酸,(Ser/Thr)指Ser或Thr。对比还揭示了一个区域(SEQ ID NO:3中的479-719位氨基酸),其与参与染色质重塑的SWI2/SNF2家族蛋白的部分ATP酶/解旋酶结构域相似,但与已知蛋白没有显著的全序列一致性。
根据本发明的具体DNA实例在SEQ ID NO:1和SEQ ID NO:2中有描述,其编码SEQ ID NO:3描述的鼠耳芥属蛋白。对比后,长50-500个氨基酸的SEQ ID NO:3的序列片段显示与已知蛋白序列的片段有20-50%的序列一致性。然而,SEQ ID NO:3的总体对比导致低于30%的序列一致性。因此,本发明定义了一个新的蛋白家族,其成员的特征为其氨基酸序列含有与SEQ ID NO:3的对比成分序列有40%或更多一致性的、至少150个氨基酸残基的成分序列。优选该氨基酸序列一致性高于50%或甚至高于55%。
编码属于本发明新蛋白质家族的蛋白的DNA可从单子叶和双子叶植物分离。优选来源为谷物、甜菜、向日葵、冬油菜、大豆、棉花、小麦、稻、马铃著、嫩茎花椰菜、花椰菜、甘蓝、黄瓜、甜玉米、日本萝卜(daikon)、蚕豆、莴苣、甜瓜、胡椒、南瓜、番茄或西瓜。但它们也可由哺乳动物来源如小鼠或人的组织中分离。本领域技术人员知晓,可使用以下普通方法来适应特定的任务。由至少15个,优选20-30个或甚至多于100个连续核苷酸组成的SEQ ID NO:1或SEQ ID NO:2的单链片段可用作探针来筛选DNA文库中与所述片段杂交的克隆。杂交要注意的要素在Sambrook等在(《分子克隆:实验室手册》(Molecular cloning:Alaboratory manual),冷泉港实验室出版社,9.47-9.57和11.45-11.49章,1989)中有描述。测定杂交克隆的序列并纯化含有如下完整编码区的克隆的DNA,该编码区编码蛋白的特征为其氨基酸序列含有与SEQ ID NO:3有40%或更多一致性的至少有150个氨基酸残基的成分序列。然后,所述DNA可用许多常规重组DNA技术如限制酶消化、连接或聚合酶链式反应分析进一步处理。
SEQ ID NO:1和SEQ ID NO:2的公开使本领域技术人员能够设计用于如下聚合酶链式反应的寡核苷酸,该反应试图从包含核苷酸序列的模板扩增DNA片段,其中核苷酸序列的特征为SEQ ID NO:1或SEQ ID NO:2中的15个、优选20-30个或更多碱基对的任意连续序列。所述核苷酸含有代表SEQ ID NO:1或SEQ ID NO:2的15个并且优选20-30个或更多碱基对的核苷酸序列。使用至少一个这种核苷酸进行的聚合酶链式反应以及其扩增产物构成本发明的另一个实施方案。
实施例:
实施例1:T-DNA插入
在Mittelsten Scheid等,Mol Gen Genet 228:104-112,1991和Mittelsten Scheid等,Proc Natl Acad Sci USA 93:7114-7119,1996中描述了携带含有多拷贝嵌合潮霉素磷酸转移酶基因(hpt)的转录沉默座位的拟南芥苏黎世生态型(ecotype Zürich)转基因株系A。通过植物真空浸入(in planta vacuum infiltration)(Bechtold等,C R Acad SciParis Life Science 316:1194-1199,1993)对所述株系纯合二倍体基因型进行农杆菌介导的基因转移,产生4000个以上的独立T-DNA转化体。Mengiste等(Plant J 12:945-948,1997)描述了带有由转录融合到1′启动子的bar基因编码区组成的T-DNA的二元载体(pl′barbi)、农杆菌株(C58CIRifR)和转化方案。通过用Basta溶液(150mg/l)反复喷洒萌发的幼苗来选择转化体(T1植物)并使其生长成熟。
实施例2:突变体选择
从各转化体收获自交种子(T2家族)。在筛选沉默表型的回复突变体之前,种子在室温下干燥1周并在4℃冷处理最少1周。大约1000粒种子的混合等分试样(由来自20个T2家族的50粒种子组成)表面灭菌7分钟两次(用含有0.1%Tween 80的5%次氯酸钠),并用灭菌双蒸水冼涤。每一等分试样放入含有75ml用0.8%琼脂固化并含有10mg/l潮霉素B(Calbiochem)的萌发培养基(按照Masson等,Plant J 2:829-933,1992)的14-cm培养皿中用于选择。为了确保在播种时平均分配,将种子与30ml含有0.4%琼脂的相同培养基混合。作为阳性对照,来自潮霉素抗性株系的两粒种子播种在每个培养皿的标记位置。平板在4℃冷处理2天,随后让其接受21℃光照16小时和16℃黑暗8小时的交替周期。播种后每天估计潮霉素抗性,共8-15天。
实施例3:突变体的分子和遗传分析
鉴定了其中一份混合试样的11株潮霉素抗性幼苗之后,对形成该混合库的家族重新进行个别筛选。一个家族含有大约25%的潮霉素抗性幼苗。将该家族的6株抗性幼苗转移到更大的含有无潮霉素的萌发培养基的容器中。在花结形成和根系发育之后,将植物转移到土壤中进一步生长并形成种子。在盆栽之前,从每株植物中取出组织外植体,使其在含有或不含10mg/l潮霉素B的RCA培养基(表1)上产生愈伤组织培养物。愈伤组织培养物用作DNA和RNA分析的材料来源并用于进一步证实该组织中的潮霉素抗性。
使用Mittelsten Scheid等描述的(Mol Gen Genet 224:325-330,1994)基于CTAB的方法分离基因组DNA,并与限制酶BamhI,HpaII,MspII,DraI,EcoRV,RcaI或HindIII一起孵育。使用RNAeasy试剂盒(Qiagen)根据厂商的说明获得总RNA。使用通过随机引发标记用32P标记的DNA片段,在Church和Gilbert(Proc Natl Acad Sci USA 81:1991-1995,1984)描述的条件下进行Southern和Northern杂交分析。hpt基因的编码区、或由P35S启动子、hpt编码区和终止子区组成的DNA、或bar基因的编码区和1′启动子用作探针。
4个潮霉素抗性姊妹株的Northern杂交分析显示了hpt基因转录的恢复。所述姊妹株的Southern杂交分析表明在复合的hpt插入片段内部没有可检测的重排。通过用甲基化敏感限制酶HpaII和MspI的Southern杂交分析以及用硫酸氢盐处理后对启动子区进行基因组测序,可以叛定突变体中hpt转基因复合体象原始株系A中一样仍为高度甲基化的。与som突变中观察到的相反,该突变对重复基因组DNA的甲基化也没有影响。
潮霉素抗性植株和来自同一家族非选择的姊妹株生长产生种子,在下一代中检查Basta抗性,并通过Southern分析记录T-DNA插入片段的数目和大小。结果证明初始T-DNA转化体一定含有2个在姊妹株中独立分离的T-DNA插入片段。一个插入片段与潮霉素抗性突变体表型共分离。用该插入片段纯合并缺少另一个T-DNA插入片段的植株来克隆相应的T-DNA插入位点。
对突变表型的植株与含有携带多拷贝嵌合β-葡糖醛酸糖苷酶(gus)基因的转录沉默座位的拟南芥哥伦比亚生态型(ecotype Colombia)转基因植物株系GUS-TS(可获自Dr.H.Vauccheret,INRA,Versailles Cedex,法国)之间的杂种进行组织化学GUS染色,揭示了在mom等位基因纯合的F2代中沉默GUS基因的再活化。
mom1突变表型的植株近交即使在近交第9代中也不导致任何形态学上的异常。这与som突变体相反。
由于在F1杂种中导入野生型MOM等位基因,mom1突变表型与株系A(见实施例1)的回交导致重新活化的hpt基因的立即再沉默。这也与som突变体相反。
表1:RCA培养基的组成
RCA培养基
MS macro 10×              100ml
B5micro 1000×             1ml
柠檬酸铁                   5ml
NT维生素100×              10ml
蔗糖                       10g
MES                        5ml
琼脂                       10g
NAA                        0.1mg
BAP                        1mg
pH5.8(KOH)
加至1升
MS macro 10×
硝酸钾                     19g
硝酸铵                    16.5g
氯化钙(×2H2O)           4.4g
硫酸镁(×7H2O)           3.7g
磷酸二氢钾                1.7g
加至1升
B5micro  1000×
硫酸镁(×H2O)            1000mg
硼酸                      300mg
硫酸锌(×7H2O)           200mg
碘化钾                    75mg
钼酸钠(×2H2O)           25mg
硫酸铜(×5H2O)           2.5mg
氯化钴(×6H2O)           2.5mg
加至100ml
柠檬酸铁
柠檬酸铁铵                10g
加至1升
NT维生素100×
肌醇                      1000mg
盐酸硫胺素                10mg
加至1升
MES
MES                       14g
pH6(NaOH)
加至100ml
实施例4:“沉默基因”的克隆
从仅含有与潮霉素抗性突变表型共分离的T-DNA的植株中分离基因组DNA。使用靠近T-DNA右边界指向外侧的3个特异性巢式引物(5′-CAT CTACGG CAA TGT ACC AGC-3′(SEQ ID NO:4),5′-GAT GGG AAT TGG CTG AGTGGC-3′(SEQ ID NO:5),5′-CAG TTC CAA ACG TAA AAC GGC-3′(SEQ ID NO:6)),和可能与旁侧植物DNA结合的几个简并性引物中的一个,对该DNA进行根据Liu等(Plant J8:457-463,1995)的TAIL(热不对称交织)PCR。实际上下面7个简并性引物中的2个可导致特异性片段的扩增。
AD1    5′-NTC GAS TWT SGW GTT-3′  (Liu等,同上;SEQ ID NO:7)
AD2    5′-NGT CGA SWG ANA WGA A-3′(Liu等,同上;SEQ ID NO:8)
AD3    5′-WGT GNA GWA NCA NAG A-3′(Liu等,同上;SEQ ID NO:9)
AD4    5′-WGG WAN CWG AWA NGC A-3′(SEQ ID NO:10)
AD5    5′-WCG WWG AWC ANG NCG A-3′(SEQ ID NO:11)
AD6    5′-WGC NAG TNA GWA NAA G-3′(SEQ ID NO:12)
AD7    5′-AWG CAN GNC WGA NAT A-3′(SEQ ID NO:13)
使用AD7获得的较大的片段被克隆和测序。它含有50bp的T-DNA和275bp的旁侧植物DNA。Southern杂交分析显示该PCR片段含有位于T-DNA旁侧的植物DNA。用该PCR片段筛选野生型拟南芥哥伦比亚生态型的基因组文库(Stratagene)。鉴定了三个与此PCR片段杂交的基因组克隆。这些基因组克隆进一步用限制酶作图,与PCR片段杂交并互相对比。在获得的其中一个基因组克隆(p4A-11)中,插入突变的T-DNA的旁侧序列大约位于基因组序列的中部。使用pA4-11的大约800bp的EcoRI-SalI片段来获得重叠的基因组克隆p5-6,并且使用p5-6的大约700bp的EcoRI片段来获得与p5-6重叠的基因组克隆p30-1。使用p30-1的大约700bp的HindIII片段来获得与p30-1重叠的基因组克隆p33-19。对所述克隆进行测序用来设计RT-PCR的引物。进一步使用p5-6的大约700bp的EcoRI片段来筛选根据Elledge等(Proc Natl Acad Sci USA 88:1737-1735,1991)的野生型拟南芥苏黎世生态型cDNA文库。得到了9个cDNA克隆,并测定了长度为2.6kb的最长克隆p17-8的序列。
实施例5:序列分析和对比
考虑到上述克隆的鼠耳芥属沉默基因很大,由于克隆步骤产生的突变或由于测序反应的不确定性,不能完全排除该基因和蛋白真实的核苷酸和氨基酸序列可能与SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3给出的序列在几个位置有偏差。另外,来自不同生态型的DNA序列可显示等位基因的不同。因此,SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3代表了拟南芥苏黎世生态型的相应基因和蛋白,而从拟南芥哥伦比亚生态型获得的基因组序列显示在SEQ ID NO:1第4338位(A替代T)和6721位(T替代G)核苷酸的两处错配,其导致氨基酸残基K替代了SEQ ID NO:3第705位的M以及氨基酸残基D替代了SEQ ID NO:3第1219位的E。
顺序地从两端对2.6kb的cDNA克隆进行序列分析,结果显示其含有一个大的ORF和3′非翻译序列。
对基因组克隆的分析表明,克隆p4A-11和p5-6含有比cDNA序列的同源序列和7个内含子序列。比较基因组序列与T-DNA插入片段的旁侧DNA序列,表明T-DNA的插入引起大约2kb的基因组DNA的缺失。缺失的5′端位于一个内含子(内含子12)中,缺失的3′端位于cDNA 3′端的下游。此cDNA克隆的5′端序列在基因组克隆p5-6的中部终止。进行三个独立的巢式RT-PCR来获得更上游的另外的cDNA序列。这些RT-PCR使用的引物序列如下:
RT1-1    5′-CTGTACATACTGAGTACAATCGGA-3′ (SEQ ID NO:14)
RT1-2    5′-GCTTCAATTCCTGCCTCAGTTGAAC-3′(SEQ ID NO:15)
RT1-3    5′-CTCTACGTGCTTAACATCATGCGA-3′ (SEQ ID NO:16)
RT1-4    5′-CCAGCTTCTGCTACTAGAAAGTCAG-3′(SEQ ID NO:17)
RT2/3-1  5′-CTGGAGTTGCATGAAATCCTGGATG-3′(SEQ ID NO:18)
RT2/3-2  5′-GCTCTTTGTAAGCTGTTCACGAGAC-3′(SEQ ID NO:19)
RT2-3    5′-TCGCATGATGTTAAGCACGTAGAG-3′ (SEQ ID NO:20)
RT2-4    5′-GAGTACTGGTCCGTGAACAGGTAAT-3′(SEQ ID NO:21)
RT3-3    5′-ATGCTTGCACAAGCATGGTCGGAAA-3′(SEQ ID NO:22)
RT3-4    5′-TGCAACATCGTGCATTTGCTCCAGA-3′(SEQ ID NO:23)
RT4-1    5′-CACAAGCATGAGTTTTTCCTTCCGG-3′(SEQ ID NO:24)
RT4-2    5′-CTGACTTTCTAGTAGCAGAAGCTGG-3′(SEQ ID NO:25)
发现这些基因组克隆的几部分序列存放在鼠耳芥属数据库中(登录号B67281,B62563,B20434,B20425,B21274,B08967,B11993,B20116,B12496和B10852为BAC的末端序列,Z18494和AA597930为部分eDNA序列,1999年4月13日)。该编码蛋白序列与Swiss Protein数据库的比较揭示了其与SWI2/SNF2家族的ATP酶/解旋酶的部分相似性(SEQ IDNO:3的第479-719位的氨基酸)。该编码的蛋白由2001个氨基酸组成,并且计算的分子量为219kD,等电点为5.1。在该编码蛋白上发现了一个ATP/GTP-结合基元(SEQ ID NO:3的第460-467位的氨基酸)和三个核定位基元(SEQ ID NO:3的第362-367、832-838和858-862位氨基酸)。对HA-标签化的MOM蛋白的亚细胞免疫检测证实了其核定位。也检测到了与鸡张力蛋白的肌动蛋白结合域的相似性(SEQ ID NO:3的第1899-1941位的氨基酸)和预测的跨膜结构域(SEQ ID NO:3的第995-1015位的氨基酸)。另外,该编码蛋白含有基本由SEQ ID NO:3的第177-350、1462-1672和1848-1894位氨基酸限定的三种类型的重复区域或内部重复。
实施例6:其它种属的同源基因
推定的显示与MOM蛋白有部分相似性的拟南芥富含脯氨酸/羟脯氨酸的糖蛋白公开为GenBank登录号AAD29829。基于该区域的相似性为34-47%,并且只能在MOM蛋白的后一半看到(即氨基酸1368-1944)。
使用MOM cDNA克隆通过Southern杂交分析来探测来自芜菁、番茄、烟草、玉米、小鼠、果蝇和人的基因组DNA中同源基因的存在。所有情况下都发现低严紧性条件下的杂交。可对来自文库的交叉杂交克隆进行鉴定和测序。
用MOM cDNA在严紧条件下筛选羽衣甘蓝(Brassica oleracea var.acephala)的基因组文库(获自Dr.Mark Cock,INRA,CNRS,里昂,法国)。得到两个阳性克隆,对其进行亚克隆并部分测序。克隆1的部分序列显示了与MOM基因中编码MOM蛋白的N端、ATP酶和C末端部分的不同区域的相似性(DNA水平为80-86%,氨基酸水平为62-80%)。克隆1中MOM的三个推定的核定位序列完全保守。克隆2的部分序列也显示了MOM基因的相似性区域(DNA水平为64-76%,氨基酸水平为55-64%),其编码MOM蛋白的ATP酶、推定的跨膜区、和C末端部分。克隆1和2的序列不相同,提示在甘蓝(Brassia oleracea)中至少存在两个同源基因。获自克隆1和2的部分序列的实例在SEQ ID Nos:26-33中给出。
用MOM cDNA在严紧条件下又筛选了Brassia rapa的基因组文库(获自Dr.Kinya Toriyama,Tohoku University,Sendai,日本)。得到了与MOM cDNA的5′部分和3′部分杂交的阳性信号。
此外,用MOM cDNA在不太严紧的条件下筛选了碧冬茄(Petuniahybrida)的基因组文库(获逢Dr.Jan Kooter,Vrije Universiteit,Amsterdam,荷兰)。得到了与MOM cDNA的5′部分和3′部分杂交的阳性信号。
实施例7:通过反义结构操纵标记基因表达
2.6kb的cDNA片段以及第一次PCR使用引物RT1-1和RT1-2、第二次PCR使用引物RT1-3和RT1-4进行巢式RT-PCR扩增的1.8kb的RT-PCR片段都反向克隆到二元载体pbarbi53的多克隆位点以产生反义RNA。pbarbi53是pl′barbi的修饰载体,带有一个由花椰菜花叶病毒35S启动子、含有Xho I、SnaBI、Hpa I和Cla I限制位点的多克隆位点以及在pl′barbi HindIII位点的花椰菜花叶病毒35S终止子组成的表达盒。如实施例1所描述的将产生的重组质粒导入农杆菌属。拟南芥哥伦比亚生态型的转基因植株系GUS-TS(获自Dr.H.Vaucheret,INRA,Versailles,Cedex,法国)含有携带多拷贝嵌合β-葡糖醛酸糖苷酶(gus)基因的转录沉默座位,按实施例1的描述用此重组质粒转化该株系并按照Mengiste等(Plant J 12:945-948,1997)描述的方法选择转化体。在对照转化中使用pbarbi53载体DNA。通过组织化学染色来检查转化体gus基因的再活化。将一片子叶在gus染色溶液(100mM磷酸钠缓冲液(pH7.0),0.05%5-溴-4-氯-3-吲哚-β-D-葡糖醛酸糖苷酶,0.1%叠氮钠)中真空浸泡10分钟,然后在37℃孵育过夜。用带有2.6kb cDNA的重组质粒转化的植物可观察到强的gus活性,而用带有1.8kb RT-PCR片段的重组质粒或pbarbi53转化的植物没有显示高于背景的任何gus活性。因此,2.6kb cDNA的反义RNA的表达模拟了突变表型,并且证实SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3中显示的序列代表了转录基因沉默系统成分的遗传信息。
                                  序列表
<110>Novartis AG
Novartis Research Foundation
<120>参与外遗传基因沉默的基因
<130>S-31005A
<140>
<141>
<150>GB 9914623.5
<151>1999-06-23
<160>33
<170>PatentIn Ver.2.1
<210>1
<211>10329
<212>DNA
<213>拟南芥
<220>
<221>内含子
<222>(1009)..(1295)
<220>
<221>内含子
<222>(2551)..(2673)
<220>
<221>内含子
<222>(2753)..(2867)
<220>
<221>内含子
<222>(3114)..(3506)
<220>
<221>内含子
<222>(3681)..(3973)
<220>
<221>内含子
<222>(4896)..(4975)
<220>
<221>内含子
<222>(5218)..(5777)
<220>
<221>内含子
<222>(5883)..(6082)
<220>
<221>内含子
<222>(7481)..(7615)
<220>
<221>内含子
<222>(7772)..(7914)
<220>
<221>内含子
<222>(8071)..(8153)
<220>
<221>内含子
<222>(8319)..(8451)
<220>
<221>内含子
<222>(8630)..(8718)
<220>
<221>内含子
<222>(8919)..(9000)
<220>
<221>内含子
<222>(9212)..(9284)
<400>1
aatatttaag tttggtttat attctttcta gtaatctttg aaatattgta agagataatg   60
cttctaataa ataacattgg atttattgga attaatgtat tgaaaaaact atgcaaatac   120
tacagtgtat tttggaacga ccaaaatgat atatgtaaac tttcgttcta gtcttctaca   180
tagtgtaata ggatagcgga caaggttgat cgactctaaa cattatgggt acgtaattcc   240
gcagtggtta cagtctactg tcgaggccaa actggtaatt aaacgtttga agtttagaga   300
aatattttga tgatgagtac cacaatcaaa gatgataggt gttaatcact gtaaaaatgt   360
tgattgaata ctacgaatgc agaacatata catattttta atctctttgg aatttttgtt   420
tttgttttta tcatttttga atacacgaag agctcagtta tatttcatat tgtatatgaa   480
tttgttctat ttaatcttca attctagcaa catactctta tgctaattcg tttcatattt   540
tagtatagta taaaaattac aaatttcaaa acaaactata agtaatatac taacatagtc   600
ggtgtaacat ttcgttaatt tcacataaca tatgttaatt acatatgtac actatttttg   660
aagtatttta taacttaaaa tatataaatt taaatctaag aaatcacaag catgagtttt   720
tccttccggt aatcgtaaaa tcaaaaatcg ctcgctcgag aaacgccggt gctagaagag   780
gaaagtaccg tacataatcc tgcgaaccca attctcgtct tcttcaaact cagttttccg   840
aaaccccaaa caccgcgagg attgcatggc ctgaagaacc acttaatcga gaattgtgct   900
ggaattctca aattttccct cgcgtttttc tttcacactc tcggaatcgg aaatttccac   960
caagctccgt caagcgatag attctgacaa ttacacactt tcgcgcaggt atgcttcctt   1020
ccctgtttta ggttggtgtt aatctatcgg tgaatcgaag gttttgggcc tcgggctttg   1080
cgttttaggt ttttcagaga atcttatcta cttggggatg gatcttaggc gtttgttaga   1140
tgtaactcat tagttttgca tataggaatt ttgatttgaa agttaggtcg ccggatttgt   1200
agacattttg tttgatggtc ttcttcggtg ctcacattct ttgtttttaa gtgcttgatt   1260
tggttgctaa ggtcctttcc gttgcgtgct ctcagtgaat atgaagaaag atgaaaagat   1320
tggtttgacg gggagaacca tttacaccag atccctagca gcttcaattc ctgcctcagt   1380
tgaacaagaa acccctggtt tgaggaggtc aagccggggg acaccatcta cgaaggtaat   1440
aactccagct tctgctacta gaaagtcaga gagactggct ccctcacctg cttcagtttc   1500
aaaaaagtcc ggtggaatcg tcaagaattc cacaccaagt tctttgcgaa ggtccaatag   1560
ggggaagact gaagtatcct tgcagagttc caaaggatca gataattcta tcaggaaagg   1620
agatacttca ccggatattg agcagagaaa ggatagtgtt gaagagtcga cagataagat   1680
caagcctata atgtcagccc gaagttacag ggcattgttt agagggaagc tcaaggaatc   1740
tgaggcatta gttgatgctt ccccaaatga agaggaacta gtagttgttg gttgttctcg   1800
ccgcatacct gcaggcaatg atgatgttca aggtaaaaca gattgtccac cacctgcaga   1860
tgcaggatca aaaaggctgc cagttgacga aactagtttg gacaagggca ctgattttcc   1920
tttgaaatca gttacggaga ccgagaagat agtgcttgat gcatccccca tagttgaaac   1980
tggggatgac agtgttatag gttcaccatc tgagaattta gagacacaaa agcttcaaga   2040
tggtaagaca gattgttcac cacctgcaaa tgcagaatcg aaaacgctgc cagttggtga   2100
aactagttta gaaaaagaat atccacaaaa gtttcaagat gataacacag attgtctacc   2160
acctgcaaat gcagaatcaa aaaggctgcc agttggcgaa actagtttag aaaaggacac   2220
tgattttcct ttgaaatcaa ctacggagac tggaaagatg gttctttatg catcccccat   2280
agttgaaact agggatgaca gcgttatatg ttcaccatct acaaatttag aaacccaaaa   2340
gcttcttgtc agtaaaactg gcttagaaac cgacatagtt ttgcctttga aaagaaaaag   2400
agacactgca gaaattgagc tggatgcatg tgctacagtt gcaaatggag atgatcacgt   2460
tatgagttct gatggggtca ttccatctcc atctgggtgc aaaaatgata atcgacctga   2520
aatgtgcaac acgtgtaaaa aacggcaaaa gtaagagttt ttttagtgtt gtctgtctat   2580
tgaaacgatc tgccaatgtt gaatgttggg cagatgggtt tgattcttag gatatatgtt   2640
ctgtattgta atgagttgtt caaaattttg aagggtcaac ggtgattgtc aaaataggag   2700
tgtttgctcc tgcattgtcc agccagttga agaatctgat aacgtgacac aggttggttt   2760
ctaattactt tcggagaccc gttaatcagt ggactcttaa atagttagat actagattta   2820
cttatccttt tacttgtaat ctgcaattct attttgcatt tgattaggat atgaaagaaa   2880
ctggaccagt tacgagcaga gaatatgagg agaacgggca aatacaacat ggtaaatcaa   2940
gtgatcccaa attctattct tcggtgtacc cagagtattg ggttcctgtg cagctatcag   3000
atgtacagct ggagcaatac tgtcagactc tcttctccaa atccttatct ctttcttcac   3060
tttcgaagat tgatcttgga gctctagaag aaactctcaa ttctgtaaga aaagtaagtt   3120
acttgatttt aaaaacactt attcttcaat gcacttgtga gttaagtacc cagttattac   3180
tggtgataag ataaagaaag caatagaaaa attgataagg tgttcaccgc attgcagcca   3240
aaaaaacaat tctgtgttcc atgctttcaa gaggttgtca cataggtgtt atgcctttct   3300
gtttgatgtt tggtagagca aaggttttgg gtctatttgt tttatgcttt tttgaaacac   3360
atagaacctg gcaaacttga cagttttggg gttgcttaga tatacgacta ttgtcggtca   3420
gcatcacatt ttctcaaggc ctctttctgc atgttaatgt gtgaatatat taaaatcttc   3480
tttatgtgtt tgcaacttgt tgacagacct gtgaccatcc atacgttatg gatgcatctt   3540
tgaaacaact gctcaccaag aatctggagt tgcatgaaat cctggatgta gaaattaaag   3600
cgagcgggaa acttcacctc cttgataaaa tgcttactca tataaaaaag aatggtttaa   3660
aagcagttgt cttctaccag gtgcattttc tattacttgc gaatgtgaat agctctatgt   3720
ttgtcatgaa tacgtcactt tgtgcattct caatatatgt gcattttctt tttgacaatg   3780
gaattctgtc ttgtattgaa atttgagtgg gatgaaagta tgctttttat cgtgcaatta   3840
tgaagtgtaa gttagccttc agcagtcagc tagcattatg agatatgctg aactaaaatg   3900
tttcttttct cttctttctt tttcgttata tgtgcctcat gtatgtttga attacagttt   3960
ttattttcag caggcaacac aaacccctga agggcttctg cttggtaata ttctcgaaga   4020
ttttgtgggt caaagatttg gtccaaaatc ttatgagcat gggatatatt cctcaaagaa   4080
gaactccgct ataaacaatt tcaacaagga gagtcaatgc tgtgttctgc tgttggaaac   4140
acgtgcctgc agtcaaacca ttaaactctt gcgagctgat gcgtttattc tttttggaag   4200
cagcttgaat ccatcgcatg atgttaagca cgtagagaag ataaaaatcg agtcatgttc   4260
tgaaagaact aagatattcc gattgtactc agtatgtaca gttgaagaaa aagccctgat   4320
tctggctagg caaaatatgc ggcaaaataa agctgtagag aacctaaacc gctctctcac   4380
gcacgcactg ctcatgtggg gggcgtcata cttatttgat aaactggatc attttcacag   4440
cagtgaaact ccagattcag gagtttcatt tgaacaatct attatggacg gcgtgattca   4500
tgaattctcg tccatacttt cttccaaagg tggagaagaa aatgaagtca agctgtgtct   4560
acttttggag gccaagcatg ctcagggaac ttacagcagt gattctactc tatttggtga   4620
agaccatatt aagttgtcag atgaagagag tccaaatata ttttggtcaa agctgttggg   4680
gggaaaaaat cctatgtgga aatacccttc agatactccc caaaggaatc gaaaacgagt   4740
tcagtatttt gagggttctg aagcgagtcc caaaactggc gatggtggaa atgcaaagaa   4800
gcgaaagaag gcttctgatg atgtcactga tccccgggtc actgatccgc cagtagatga   4860
tgatgaaaga aaggcctctg ggaaggatca catgggtaaa atagtttaat ttctgctccg   4920
atacctctag tgttcattga ttatgcaact actttgctga ctatctttcc tacaggggct   4980
ttggagtcac caaaagtcat aacactccag tcatcatgta aatcttctgg tacagatggt   5040
acattggatg gaaatgatgc ttttggcttg tattctatgg gcagccatat ctctggaatc   5100
ccagaggata tgttagctag tcaagattgg gggaaaatac cggatgaatc acagaggagg   5160
ctccacactg ttttaaagcc gaagatggca aaactttgcc aagttttgca tctttcagta   5220
agtggccttt ttcacctcca caacttattt tagccttgca tatgcttata tatagctgat   5280
tgcaactgta gttgttacct gatttcctgt tacagccaaa tgtgagagtt ttattcttca   5340
actatatcca tccgtttaag catattttat ttcttatatc tggcttcgtt accaatgcac   5400
tgttaaaatg agcaactgct gcacaaaaca gtaggtagtt atgtgcctca tgtcattcat   5460
tgtttattga agcaaagaaa tttctgtcta ctttacatga tccatctgtg ggagtatata   5520
actatatata accttaggcc tttgtacctg gctgatcaaa gacatgtcaa aagtttatct   5580
gttcgctgtt ggtatagaaa ctaatacagt gtctgatgct attttaaggt agtcttatgt   5640
cttcacatat tggctaatag atgtttccgc tgtcgtgtcc atatacttct gtgattatca   5700
cggtgctccg tctatcaaaa ttgtactaaa aggtattttg caatgtgtga ttggttaaca   5760
gattattttg ttttcaggat gcttgcacaa gcatggtcgg aaattttctc gaatatgtta   5820
ttgaaaatca ccgaatctac gaagagccag ccactacttt tcaggcattc cagatagccc   5880
tggtatgaca gcatttactt tgataattta tgcattgttt ccttcatcat ctgcctttgt   5940
ttagaatgtc ctcagaaggc agcactcctt tagttttaac tttccaatca taggattcaa   6000
atatccatta actggccttt gatcgctgca taatatatga atagttgaca tactgaatac   6060
gttgttaata atgcattttc agagttggat tgcagccttg ttggtaaagc aaattcttag   6120
ccacaaagaa tctctggtcc gtgcaaattc tgaattagct ttcaaatgct ctagagtaga   6180
ggtggattat atttattcga tattgtcctg catgaagagt ctgttcctgg agcatacaca   6240
aggtttgcag ttcgattgct ttggtactaa ttctaaacag tcagtggtta gcacaaaact   6300
agtaaatgaa agtctctcag gggctacagt gcgtgacgaa aagattaata cgaagtcgat   6360
gcgaaatagc tcagaggatg aagagtgcat gactgagaag agatgtagcc attatagcac   6420
agcaacaaga gatatcgaaa agactattag tggcataaaa aagaaataca agaagcaagt   6480
gcaaaagctt gtacaagagc atgaggaaaa gaaaatggag ctgttaaata tgtatgcaga   6540
caagaagcag aaacttgaaa ctagtaaaag tgtggaagca gcagtaattc gtattacctg   6600
ttcacggacc agtactcaag tgggtgatct caaactgctg gatcataatt atgaaagaaa   6660
gtttgatgaa atcaaaagtg agaaaaatga atgcctcaaa agtctggagc aaatgcacga   6720
ggttgcaaag aagaagttgg ctgaggatga agcctgttgg attaatcgga taaagagctg   6780
ggcagctaaa ttaaaagttt gtgttcccat tcaaagtggc aataacaagc attttagtgg   6840
ttcatcaaac atttcccaaa atgctcctga tgtacaaatt tgcaataatg ctaacgttga   6900
agctacttac gctgatacga attgcatggc ttccaaggtt aatcaagtgc cagaagcaga   6960
aaacacatta ggaaccatgt cgggtggcag cactcaacaa gttcatgaaa tggtggatgt   7020
aagaaatgac gagacaatgg atgtctcagc tttgtctcgt gaacagctta caaagagcca   7080
gtccaatgag cacgcttcta tcactgtgcc tgagattttg attcctgctg actgtcaaga   7140
ggaatttgcg gccttgaacg tgcatttgtc agaagaccag aattgtgaca gaataacatc   7200
tgcggcatca gatgaagatg tttcatcaag ggtgccagag gtatcccagt cactcgaaaa   7260
tctttctgcc tcccccgagt tttctctaaa tagagaggag gctttggtta caacagaaaa   7320
tagaagaaca agtcatgtgg gttttgatac tgataacatt ttggaccagc agaatagaga   7380
agattgttct cttgaccaag agattcctga cgagttagcg atgcctgtgc aacatcttgc   7440
gtctgtggta gagactaggg gtgctgctga atctgatcag gtacttactg gccctgtaga   7500
atagttgatg ccttgttcat ttaatctttt ctaatgttca ttcttgcttt cttgaaaata   7560
acgggtagtg atcagatgtc tttttttctc ttattaaatt cacttttctg gacagtatgg   7620
tcaagatata tgtcctatgc cttcttcact ggctggaaag caacctgacc cagcagcaaa   7680
cactgagagc gaaaatcttg aagaagcaat tgagcctcag tctgctggtt cagaaacagt   7740
agagactact gattttgctg catcacatca ggtccctatt gaagactttc cttttttact   7800
agtttaaagt tatcaatctg tgttatgttc attctaagtt tccgtgagaa aaaggtgggg   7860
aaatgtggtt actgatcaag tctcgttgtt gttttaaatc gactcttttg acagggtgat   7920
caagttacat gtcctttgct atcttcaccg actggaaatc agcctgcgcc agaagcaaat   7980
attgaaggcc aaaatatcaa cacatcagct gagccccatg tagcgggtcc agatgcagta   8040
gagagtggtg attatgcagt aatagatcag gttattgcct taactaaaga caaatgtctt   8100
ttgttgttta aaagtcttac atctttgtaa tgctcgttct ggatatcctg caggaaacaa   8160
tgggtgctca ggatgcatgc tctctgccat ctggatcggt tggaactcag tctgacctag   8220
gagcaaacat tgagggtcaa aatgtcacaa cagtggctca acttcccaca gatggatcag   8280
atgcagttgt aaccggtgga tctcctgtat cagatcaggt acctgcctct gctcaaggac   8340
tttcttatgt gttggtttaa aggtctagtc cttagtaatg ttgaaactaa gcaaacagtg   8400
gatagtgatc atatggttat ttttgcttgt gaatttaata tttctggaca gtgtgcccag   8460
gatgcatctc ctatgccatt atcttcgcct ggaaatcacc ctgatacagc agttaatatc   8520
gagggtttag ataacacatc agtagctgag cctcatataa gtggatcaga tgcatgtgaa   8580
atggaaattt cagaacctgg tccccaagta gagcggtcaa cctttgcaag tcagtaactg   8640
ccttgggcat ttttaagtat cacctaggtc gacatatgtg attgccaaac agctaacaag   8700
gagatgcctt ttgtgcagat cttttccatg aaggtggcgt ggagcattca gcaggtgtaa   8760
cagctcttgt tccatcactt cttaacaatg gtacggaaca gattgccgtt caacctgttc   8820
ctcaaatacc tttccctgtg ttcaacgacc cgtttctgca tgaactggag aagttgcgga   8880
gagaatcaga gaactcaaag aagacttttg aagaaaaagt cagtttccct cattacccag   8940
ttacctcttg ttttggttta ttttctagct gcccattgac tctcagttgc ttgtgagcag   9000
aaatcaatct tgaaagctga actcgagagg aagatggctg aagtacaagc agagtttcga   9060
agaaaatttc atgaggtaga agccgagcat aacaccagaa cgacaaagat agagaaggat   9120
aagaatcttg ttataatgaa caaactgttg gcgaatgcgt tcttgtccaa atgtactgac   9180
aagaaggtat ctccctcagg agctccaagg ggtaagtgtc gaataatata gcaaattggt   9240
tttaaaaata aggcgacgaa gtcataatag cactttttct ccaggtaaaa ttcagcagct   9300
agcacagaga gcagcacaag tgagtgcact gagaaattac attgctcctc agcagcttca   9360
ggcatcttct tttcctgctc ctgctctggt ttcggctcct ctgcaacttc agcaatcatc   9420
atttcctgct cctggtccgg ctcctctgca gcctcaggca tcttcgtttc cttcttcagt   9480
ctctcgtcca tcagcccttc ttctgaattt tgcggtctgt ccaatgcctc agcccagaca   9540
gcctctcata tccaacatag ctccaactcc atcagttact cctgcaacaa atccaggtct   9600
gcgttctcct gcaccacacc taaactcata tagaccatcc tcttcaactc ccgtcgccac   9660
agctactcca acctcgtcag tgcctcctca agctttgaca tattcagctg tgtcaattca   9720
gcagcagcaa gaacaacaac cgcaacagag cttgagcagt ggattgcaga gcaacaatga   9780
agtggtttgt ctttctgacg acgagtgacc taagaggaga gatggttagg gtcttagtta   9840
ttgattttta gagagttaat aatagtatat atatatatgt ataagtaggt tacctaatct   9900
ctgtcgttaa tctaatttag tgagtcagga accgactcgt tggctaaggt ctctcctttt   9960
gaaacgcaac gttctacttt catgtatata aatacagtct gatcacacaa cacaaattga   10020
tgattgaaaa tactactgat ttaactttat agaaaaccca aattatagag cgacaacttt   10080
ataaacatgt caaacttcga agttaaaatt taagacccca taattttaca attatagatt   10140
ttaatactcc aactattttg tgatgttaaa agaagtatcc gagtcttttc tttccagttt   10200
ccccaccgtc ccatgactcc cccagccagt agaaaaagcc aaaaaagtaa acaaaaagtc   10260
gttaaaaaag ttaaattaaa aaaaaaatag atagttgacg tttactaaag tgatttgaat   10320
tgaacaatt                                                           10329
<210>2
<211>6571
<212>DNA
<213>拟南芥
<220>
<221>CDS
<222>(310)..(6312)
<400>2
cacaagcatg agtttttcct tccggtaatc gtaaaatcaa aaatcgctcg ctcgagaaac   60
gccggtgcta gaagaggaaa gtaccgtaca taatcctgcg aacccaattc tcgtcttctt   120
caaactcagt tttccgaaac cccaaacacc gcgaggattg catggcctga agaaccactt   180
aatcgagaat tgtgctggaa ttctcaaatt ttccctcgcg tttttctttc acactctcgg   240
aatcggaaat ttccaccaag ctccgtcaag cgatagattc tgacaattac acactttcgc   300
gcagtgaat atg aag aaa gat gaa aag att ggt ttg acg ggg aga acc att   351
          Met Lys Lys Asp Glu Lys Ile Gly Leu Thr Gly Arg Thr Ile
            1               5                  10
tac acc aga tcc cta gca gct tca att cct gcc tca gtt gaa caa gaa     399
Tyr Thr Arg Ser Leu Ala Ala Ser Ile Pro Ala Ser Val Glu Gln Glu
 15                  20                  25                  30
acc cct ggt ttg agg agg tca agc cgg ggg aca cca tct acg aag gta     447
Thr Pro Gly Leu Arg Arg Ser Ser Arg Gly Thr Pro Ser Thr Lys Val
                 35                  40                  45
ata act cca gct tct gct act aga aag tca gag aga ctg gct ccc tca     495
Ile Thr Pro Ala Ser Ala Thr Arg Lys Ser Glu Arg Leu Ala Pro Ser
             50                  55                  60
cct gct tca gtt tca aaa aag tcc ggt gga atc gtc aag aat tcc aca     543
Pro Ala Ser Val Ser Lys Lys Ser Gly Gly Ile Val Lys Asn Ser Thr
         65                  70                  75
cca agt tct ttg cga agg tcc aat agg ggg aag act gaa gta tcc ttg     591
Pro Ser Ser Leu Arg Arg Ser Asn Arg Gly Lys Thr Glu Val Ser Leu
     80                  85                  90
cag agt tcc aaa gga tca gat aat tct atc agg aaa gga gat act tca     639
Gln Ser Ser Lys Gly Ser Asp Asn Ser Ile Arg Lys Gly Asp Thr Ser
 95                 100                 105                 110
ccg gat att gag cag aga aag gat agt gtt gaa gag tcg aca gat aag     687
Pro Asp Ile Glu Gln Arg Lys Asp Ser Val Glu Glu Ser Thr Asp Lys
                115                 120                 125
atc aag cct ata atg tca gcc cga agt tac agg gca ttg ttt aga ggg     735
Ile Lys Pro Ile Met Ser Ala Arg Ser Tyr Arg Ala Leu Phe Arg Gly
            130                 135                 140
aag ctc aag gaa tct gag gca tta gtt gat gct tcc cca aat gaa gag     783
Lys Leu Lys Glu Ser Glu Ala Leu Val Asp Ala Ser Pro Asn Glu Glu
        145                 150                 155
gaa cta gta gtt gtt ggt tgt tct cgc cgc ata cct gca ggc aat gat     831
Glu Leu Val Val Val Gly Cys Ser Arg Arg Ile Pro Ala Gly Asn Asp
    160                 165                 170
gat gtt caa ggt aaa aca gat tgt cca cca cct gca gat gca gga tca     879
Asp Val Gln Gly Lys Thr Asp Cys Pro Pro Pro Ala Asp Ala Gly Ser
175                 180                 185                 190
aaa agg ctg cca gtt gac gaa act agt ttg gac aag ggc act gat ttt     927
Lys Arg Leu Pro Val Asp Glu Thr Ser Leu Asp Lys Gly Thr Asp Phe
                195                 200                 205
cct ttg aaa tca gtt acg gag acc gag aag ata gtg ctt gat gca tcc    975
Pro Leu Lys Ser Val Thr Glu Thr Glu Lys Ile Val Leu Asp Ala Ser
            210                 215                 220
ccc ata gtt gaa act ggg gat gac agt gtt ata ggt tca cca tct gag    1023
Pro Ile Val Glu Thr Gly Asp Asp Ser Val Ile Gly Ser Pro Ser Glu
        225                 230                 235
aat tta gag aca caa aag ctt caa gat ggt aag aca gat tgt tca cca    1071
Asn Leu Glu Thr Gln Lys Leu Gln Asp Gly Lys Thr Asp Cys Ser Pro
    240                 245                 250
cct gca aat gca gaa tcg aaa acg ctg cca gtt ggt gaa act agt tta    1119
Pro Ala Asn Ala Glu Ser Lys Thr Leu Pro Val Gly Glu Thr Ser Leu
255             260                 265                     270
gaa aaa gaa tat cca caa aag ttt caa gat gat aac aca gat tgt cta    1167
Glu Lys Glu Tyr Pro Gln Lys Phe Gln Asp Asp Asn Thr Asp Cys Leu
                275                 280                 285
cca cct gca aat gca gaa tca aaa agg ctg cca gtt ggc gaa act agt    1215
Pro Pro Ala Asn Ala Glu Ser Lys Arg Leu Pro Val Gly Glu Thr Ser
            290                 295                 300
tta gaa aag gac act gat ttt cct ttg aaa tca act acg gag act gga    1263
Leu Glu Lys Asp Thr Asp Phe Pro Leu Lys Ser Thr Thr Glu Thr Gly
        305                 310                 315
aag atg gtt ctt tat gca tcc ccc ata gtt gaa act agg gat gac agc    1311
Lys Met Val Leu Tyr Ala Ser Pro Ile Val Glu Thr Arg Asp Asp Ser
    320                 325                 330
gtt ata tgt tca cca tct aca aat tta gaa acc caa aag ctt ctt gtc    1359
Val Ile Cys Ser Pro Ser Thr Asn Leu Glu Thr Gln Lys Leu Leu Val
335                 340                 345                 350
agt aaa act ggc tta gaa acc gac ata gtt ttg cct ttg aaa aga aaa    1407
Ser Lys Thr Gly Leu Glu Thr Asp Ile Val Leu Pro Leu Lys Arg Lys
                355                 360                 365
aga gac act gca gaa att gag ctg gat gca tgt gct aca gtt gca aat    1455
Arg Asp Thr Ala Glu Ile Glu Leu Asp Ala Cys Ala Thr Val Ala Asn
            370                 375                 380
gga gat gat cac gtt atg agt tct gat ggg gtc att cca tct cca tct    1503
Gly Asp Asp His Val Met Ser Ser Asp Gly Val Ile Pro Ser Pro Ser
        385                 390                 395
ggg tgc aaa aat gat aat cga cct gaa atg tgc aac acg tgt aaa aaa    1551
Gly Cys Lys Asn Asp Asn Arg Pro Glu Met Cys Asn Thr Cys Lys Lys
    400                 405                 410
cgg caa aag gtc aac ggt gat tgt caa aat agg agt gtt tgc tcc tgc    1599
Arg Gln Lys Val Asn Gly Asp Cys Gln Asn Arg Ser Val Cys Ser Cys
415                 420                 425                 430
att gtc cag cca gtt gaa gaa tct gat aac gtg aca cag gat atg aaa    1647
Ile Val Gln Pro Val Glu Glu Ser Asp Asn Val Thr Gln Asp Met Lys
                435                 440                 445
gaa act gga cca gtt acg agc aga gaa tat gag gag aac ggg caa ata    1695
Glu Thr Gly Pro Val Thr Ser Arg Glu Tyr Glu Glu Asn Gly Gln Ile
            450                 455                 460
caa cat ggt aaa tca agt gat ccc aaa ttc tat tct tcg gtg tac cca    1743
Gln His Gly Lys Ser Ser Asp Pro Lys Phe Tyr Ser Ser Val Tyr Pro
        465                 470                 475
gag tat tgg gtt cct gtg cag cta tca gat gta cag ctg gag caa tac    1791
Glu Tyr Trp Val Pro Val Gln Leu Ser Asp Val Gln Leu Glu Gln Tyr
    480                 485                 490
tgt cag act ctc ttc tcc aaa tcc tta tct ctt tct tca ctt tcg aag    1839
Cys Gln Thr Leu Phe Ser Lys Ser Leu Ser Leu Ser Ser Leu Ser Lys
495                 500                 505                 510
att gat ctt gga gct cta gaa gaa act ctc aat tct gta aga aaa acc    1887
Ile Asp Leu Gly Ala Leu Glu Glu Thr Leu Asn Ser Val Arg Lys Thr
                515                 520                 525
tgt gac cat cca tac gtt atg gat gca tct ttg aaa caa ctg ctc acc    1935
Cys Asp His Pro Tyr Val Met Asp Ala Ser Leu Lys Gln Leu Leu Thr
            530                 535                 540
aag aat ctg gag ttg cat gaa atc ctg gat gta gaa att aaa gcg agc    1983
Lys Asn Leu Glu Leu His Glu Ile Leu Asp Val Glu Ile Lys Ala Ser
        545                 550                 555
ggg aaa ctt cac ctc ctt gat aaa atg ctt act cat ata aaa aag aat    2031
Gly Lys Leu His Leu Leu Asp Lys Met Leu Thr His Ile Lys Lys Asn
    560                 565                 570
ggt tta aaa gca gtt gtc ttc tac cag gca aca caa acc cct gaa ggg    2079
Gly Leu Lys Ala Val Val Phe Tyr Gln Ala Thr Gln Thr Pro Glu Gly
575                 580                 585                 590
ctt ctg ctt ggt aat att ctc gaa gat ttt gtg ggt caa aga ttt ggt    2127
Leu Leu Leu Gly Asn Ile Leu Glu Asp Phe Val Gly Gln Arg Phe Gly
                 595                 600                 605
 cca aaa tct tat gag cat ggg ata tat tcc tca aag aag aac tcc gct    2175
 Pro Lys Ser Tyr Glu His Gly Ile Tyr Ser Ser Lys Lys Asn Ser Ala
             610                 615                 620
 ata aac aat ttc aac aag gag agt caa tgc tgt gtt ctg ctg ttg gaa    2223
 Ile Asn Asn Phe Asn Lys Glu Ser Gln Cys Cys Val Leu Leu Leu Glu
         625                 630                 635
aca cgt gcc tgc agt caa acc att aaa ctc ttg cga gct gat gcg ttt    2271
Thr Arg Ala Cys Ser Gln Thr Ile Lys Leu Leu Arg Ala Asp Ala Phe
    640                 645                 650
att ctt ttt gga agc agc ttg aat cca tcg cat gat gtt aag cac gta    2319
Ile Leu Phe Gly Ser Ser Leu Asn Pro Ser His Asp Val Lys His Val
655                 660                 665                 670
gag aag ata aaa atc gag tca tgt tct gaa aga act aag ata ttc cga    2367
Glu Lys Ile Lys Ile Glu Ser Cys Ser Glu Arg Thr Lys Ile Phe Arg
                675                 680                 685
ttg tac tca gta tgt aca gtt gaa gaa aaa gcc ctg att ctg gct agg    2415
Leu Tyr Ser Val Cys Thr Val Glu Glu Lys Ala Leu Ile Leu Ala Arg
            690                 695                 700
caa aat atg cgg caa aat aaa gct gta gag aac cta aac cgc tct ctc    2463
Gln Asn Met Arg Gln Asn Lys Ala Val Glu Asn Leu Asn Arg Ser Leu
        705                 710                 715
acg cac gca ctg ctc atg tgg ggg gcg tca tac tta ttt gat aaa ctg    2511
Thr His Ala Leu Leu Met Trp Gly Ala Ser Tyr Leu Phe Asp Lys Leu
    720                 725                 730
gat cat ttt cac agc agt gaa act cca gat tca gga gtt tca ttt gaa    2559
Asp His Phe His Ser Ser Glu Thr Pro Asp Ser Gly Val Ser Phe Glu
735                 740                 745                 750
caa tct att atg gac ggc gtg att cat gaa ttc tcg tcc ata ctt tct    2607
Gln Ser Ile Met Asp Gly Val Ile His Glu Phe Ser Ser Ile Leu Ser
                755                 760                 765
tcc aaa ggt gga gaa gaa aat gaa gtc aag ctg tgt cta ctt ttg gag    2655
Ser Lys Gly Gly Glu Glu Asn Glu Val Lys Leu Cys Leu Leu Leu Glu
            770                 775                 780
gcc aag cat gct cag gga act tac agc agt gat tct act cta ttt ggt    2703
Ala Lys His Ala Gln Gly Thr Tyr Ser Ser Asp Ser Thr Leu Phe Gly
        785                 790                 795
gaa gac cat att aag ttg tca gat gaa gag agt cca aat ata ttt tgg    2751
Glu Asp His Ile Lys Leu Ser Asp Glu Glu Ser Pro Asn Ile Phe Trp
    800                 805                 810
tca aag ctg ttg ggg gga aaa aat cct atg tgg aaa tac cct tca gat    2799
Ser Lys Leu Leu Gly Gly Lys Asn Pro Met Trp Lys Tyr Pro Ser Asp
815                 820                 825                 830
act ccc caa agg aat cga aaa cga gtt cag tat ttt gag ggt tct gaa    2847
Thr Pro Gln Arg Asn Arg Lys Arg Val Gln Tyr Phe Glu Gly Ser Glu
                835                 840                 845
gcg agt ccc aaa act ggc gat ggt gga aat gca aag aag cga aag aag    2895Ala Ser Pro Lys Thr Gly Asp Gly Gly Asn Ala Lys Lys Arg Lys Lys
            850                 855                 860
gct tct gat gat gtc act gat ccc cgg gtc act gat ccg cca gta gat    2943
Ala Ser Asp Asp Val Thr Asp Pro Arg Val Thr Asp Pro Pro Val Asp
        865                 870                 875
gat gat gaa aga aag gcc tct ggg aag gat cac atg ggg gct ttg gag    2991
Asp Asp Glu Arg Lys Ala Ser Gly Lys Asp His Met Gly Ala Leu Glu
    880                 885                 890
tca cca aaa gtc ata aca ctc cag tca tca tgt aaa tct tct ggt aca    3039
Ser Pro Lys Val Ile Thr Leu Gln Ser Ser Cys Lys Ser Ser Gly Thr
895                 900                 905                 910
gat ggt aca ttg gat gga aat gat gct ttt ggc ttg tat tct atg ggc    3087
Asp Gly Thr Leu Asp Gly Asn Asp Ala Phe Gly Leu Tyr Ser Met Gly
                915                 920                 925
agc cat atc tct gga atc cca gag gat atg tta gct agt caa gat tgg    3135
Ser His Ile Ser Gly Ile Pro Glu Asp Met Leu Ala Ser Gln Asp Trp
            930                 935                 940
ggg aaa ata ccg gat gaa tca cag agg agg ctc cac act gtt tta aag    3183
Gly Lys Ile Pro Asp Glu Ser Gln Arg Arg Leu His Thr Val Leu Lys
        945                 950                 955
ccg aag atg gca aaa ctt tgc caa gtt ttg cat ctt tca gat gct tgc    3231
Pro Lys Met Ala Lys Leu Cys Gln Val Leu His Leu Ser Asp Ala Cys
    960                 965                 970
aca agc atg gtc gga aat ttt ctc gaa tat gtt att gaa aat cac cga    3279
Thr Ser Met Val Gly Asn Phe Leu Glu Tyr Val Ile Glu Asn His Arg
975                 980                 985                 990
atc tac gaa gag cca gcc act act ttt cag gca ttc cag ata gcc ctg    3327
Ile Tyr Glu Glu Pro Ala Thr Thr Phe Gln Ala Phe Gln Ile Ala Leu
                995            1000                    1005
agt tgg att gca gcc ttg ttg gta aag caa att ctt agc cac aaa gaa    3375
Ser Trp Ile Ala Ala Leu Leu Val Lys Gln Ile Leu Ser His Lys Glu
           1010                1015                1020
tct ctg gtc cgt gca aat tct gaa tta gct ttc aaa tgc tct aga gta    3423
Ser Leu Val Arg Ala Asn Ser Glu Leu Ala Phe Lys Cys Ser Arg Val
       1025                1030            1035
gag gtg gat tat att tat tcg ata ttg tcc tgc atg aag agt ctg ttc    3471
Glu Val Asp Tyr Ile Tyr Ser Ile Leu Ser Cys Met Lys Ser Leu Phe
   1040                1045                1050
ctg gag cat aca caa ggt ttg cag ttc gat tgc ttt ggt act aat tct    3519
Leu Glu His Thr Gln Gly Leu Gln Phe Asp Cys Phe Gly Thr Asn Ser
1055               1060                1065                1070
aaa cag tca gtg gtt agc aca aaa cta gta aat gaa agt ctc tca ggg    3567
Lys Gln Ser Val Val Ser Thr Lys Leu Val Asn Glu Ser Leu Ser Gly
               1075                1080                1085
gct aca gtg cgt gac gaa aag att aat acg aag tcg atg cga aat agc    3615
Ala Thr Val Arg Asp Glu Lys Ile Asn Thr Lys Ser Met Arg Asn Ser
           1090                1095                1100
tca gag gat gaa gag tgc atg act gag aag aga tgt agc cat tat agc    3663
Ser Glu Asp Glu Glu Cys Met Thr Glu Lys Arg Cys Ser His Tyr Ser
       1105                1110                1115
aca gca aca aga gat atc gaa aag act att agt ggc ata aaa aag aaa    3711
Thr Ala Thr Arg Asp Ile Glu Lys Thr Ile Ser Gly Ile Lys Lys Lys
   1120                1125                1130
tac aag aag caa gtg caa aag ctt gta caa gag cat gag gaa aag aaa    3759
Tyr Lys Lys Gln Val Gln Lys Leu Val Gln Glu His Glu Glu Lys Lys
1135               1140                1145                1150
atg gag ctg tta aat atg tat gca gac aag aag cag aaa ctt gaa act    3807
Met Glu Leu Leu Asn Met Tyr Ala Asp Lys Lys Gln Lys Leu Glu Thr
               1155                1160                1165
agt aaa agt gtg gaa gca gca gta att cgt att acc tgt tca cgg acc    3855
Ser Lys Ser Val Glu Ala Ala Val Ile Arg Ile Thr Cys Ser Arg Thr
           1170                1175                1180
agt act caa gtg ggt gat ctc aaa ctg ctg gat cat aat tat gaa aga    3903
Ser Thr Gln Val Gly Asp Leu Lys Leu Leu Asp His Asn Tyr Glu Arg
       1185                1190                1195
aag ttt gat gaa atc aaa agt gag aaa aat gaa tgc ctc aaa agt ctg    3951
Lys Phe Asp Glu Ile Lys Ser Glu Lys Asn Glu Cys Leu Lys Ser Leu
   1200                1205                1210
gag caa atg cac gag gtt gca aag aag aag ttg gct gag gat gaa gcc    3999
Glu Gln Met His Glu Val Ala Lys Lys Lys Leu Ala Glu Asp Glu Ala
1215                1220                1225                1230
tgt tgg att aat cgg ata aag agc tgg gca gct aaa tta aaa gtt tgt    4047
Cys Trp Ile Asn Arg Ile Lys Ser Trp Ala Ala Lys Leu Lys Val Cys
               1235                1240                1245
gtt ccc att caa agt ggc aat aac aag cat ttt agt ggt tca tca aac    4095
Val Pro Ile Gln Ser Gly Asn Asn Lys His Phe Ser Gly Ser Ser Asn
           1250                1255                1260
att tcc caa aat gct cct gat gta caa att tgc aat aat gct aac gtt    4143
Ile Ser Gln Asn Ala Pro Asp Val Gln Ile Cys Asn Asn Ala Asn Val
       1265                1270                1275
gaa gct act tac gct gat acg aat tgc atg gct tcc aag gtt aat caa    4191
Glu Ala Thr Tyr Ala Asp Thr Asn Cys Met Ala Ser Lys Val Asn Gln
   1280                1285                1290
gtg cca gaa gca gaa aac aca tta gga acc atg tcg ggt ggc agc act    4239
Val Pro Glu Ala Glu Asn Thr Leu Gly Thr Met Ser Gly Gly Ser Thr
1295               1300                1305                1310
caa caa gtt cat gaa atg gtg gat gta aga aat gac gag aca atg gat    4287
Gln Gln Val His Glu Met Val Asp Val Arg Asn Asp Glu Thr Met Asp
               1315                1320                1325
gtc tca gct ttg tct cgt gaa cag ctt aca aag agc cag tcc aat gag    4335
Val Ser Ala Leu Ser Arg Glu Gln Leu Thr Lys Ser Gln Ser Asn Glu
           1330                1335                1340
cac gct tct atc act gtg cct gag att ttg att cct gct gac tgt caa    4383
His Ala Ser Ile Thr Val Pro Glu Ile Leu Ile Pro Ala Asp Cys Gln
       1345                1350                1355
gag gaa ttt gcg gcc ttg aac gtg cat ttg tca gaa gac cag aat tgt    4431
Glu Glu Phe Ala Ala Leu Asn Val His Leu Ser Glu Asp Gln Asn Cys
   1360                1365                1370
gac aga ata aca tct gcg gca tca gat gaa gat gtt tca tca agg gtg    4479
Asp Arg Ile Thr Ser Ala Ala Ser Asp Glu Asp Val Ser Ser Arg Val
1375               1380                1385                1390
cca gag gta tcc cag tca ctc gaa aat ctt tct gcc tcc ccc gag ttt    4527
Pro Glu Val Ser Gln Ser Leu Glu Asn Leu Ser Ala Ser Pro Glu Phe
               1395                1400                1405
tct cta aat aga gag gag gct ttg gtt aca aca gaa aat aga aga aca    4575
Ser Leu Asn Arg Glu Glu Ala Leu Val Thr Thr Glu Asn Arg Arg Thr
           1410                1415                1420
agt cat gtg ggt ttt gat act gat aac att ttg gac cag cag aat aga    4623
Ser His Val Gly Phe Asp Thr Asp Asn Ile Leu Asp Gln Gln Asn Arg
       1425                1430                1435
gaa gat tgt tct ctt gac caa gag att cct gac gag tta gcg atg cct    4671
Glu Asp Cys Ser Leu Asp Gln Glu Ile Pro Asp Glu Leu Ala Met Pro
   1440                1445                1450
gtg caa cat ctt gcg tct gtg gta gag act agg ggt gct gct gaa tct    4719
Val Gln His Leu Ala Ser Val Val Glu Thr Arg Gly Ala Ala Glu Ser
1455               1460                1465                1470
gat cag tat ggt caa gat ata tgt cct atg cct tct tca ctg gct gga    4767
Asp Gln Tyr Gly Gln Asp Ile Cys Pro Met Pro Ser Ser Leu Ala Gly
               1475                1480                1485
aag caa cct gac cca gca gca aac act gag agc gaa aat ctt gaa gaa    4815
Lys Gln Pro Asp Pro Ala Ala Asn Thr Glu Ser Glu Asn Leu Glu Glu
           1490                1495                1500
gca att gag cct cag tct gct ggt tca gaa aca gta gag act act gat    4863
Ala Ile Glu Pro Gln Ser Ala Gly Ser Glu Thr Val Glu Thr Thr Asp
       1505                1510                1515
ttt gct gca tca cat cag ggt gat caa gtt aca tgt cct ttg cta tct    4911
Phe Ala Ala Ser His Gln Gly Asp Gln Val Thr Cys Pro Leu Leu Ser
   1520                1525                1530
tca ccg act gga aat cag cct gcg cca gaa gca aat att gaa ggc caa    4959
Ser Pro Thr Gly Asn Gln Pro Ala Pro Glu Ala Asn Ile Glu Gly Gln
1535               1540                1545                1550
aat atc aac aca tca gct gag ccc cat gta gcg ggt cca gat gca gta    5007
Asn Ile Asn Thr Ser Ala Glu Pro His Val Ala Gly Pro Asp Ala Val
               1555                1560                1565
gag agt ggt gat tat gca gta ata gat cag gaa aca atg ggt gct cag    5055
Glu Ser Gly Asp Tyr Ala Val Ile Asp Gln Glu Thr Met Gly Ala Gln
           1570                1575                1580
gat gca tgc tct ctg cca tct gga tcg gtt gga act cag tct gac cta    5103
Asp Ala Cys Ser Leu Pro Ser Gly Ser Val Gly Thr Gln Ser Asp Leu
       1585                1590                1595
gga gca aac att gag ggt caa aat gtc aca aca gtg gct caa ctt ccc    5151
Gly Ala Asn Ile Glu Gly Gln Asn Val Thr Thr Val Ala Gln Leu Pro
   1600                1605                1610
aca gat gga tca gat gca gtt gta acc ggt gga tct cct gta tca gat    5199
Thr Asp Gly Ser Asp Ala Val Val Thr Gly Gly Ser Pro Val Ser Asp
1615               1620                1625                1630
cag tgt gcc cag gat gca tct cct atg cca tta tct tcg cct gga aat    5247
Gln Cys Ala Gln Asp Ala Ser Pro Met Pro Leu Ser Ser Pro Gly Asn
               1635                1640                1645
cac cct gat aca gca gtt aat atc gag ggt tta gat aac aca tca gta    5295
His Pro Asp Thr Ala Val Asn Ile Glu Gly Leu Asp Asn Thr Ser Val
           1650                1655                1660
gct gag cct cat ata agt gga tca gat gca tgt gaa atg gaa att tca    5343
Ala Glu Pro His Ile Ser Gly Ser Asp Ala Cys Glu Met Glu Ile Ser
       1665                1670                1675
gaa cct ggt ccc caa gta gag cgg tca acc ttt gca aat ctt ttc cat    5391
Glu Pro Gly Pro Gln Val Glu Arg Ser Thr Phe Ala Asn Leu Phe His
   1680                1685                1690
gaa ggt ggc gtg gag cat tca gca ggt gta aca gct ctt gtt cca tca    5439
Glu Gly Gly Val Glu His Ser Ala Gly Val Thr Ala Leu Val Pro Ser
1695               1700                1705                1710
ctt ctt aac aat ggt acg gaa cag att gcc gtt caa cct gtt cct caa    5487
Leu Leu Asn Asn Gly Thr Glu Gln Ile Ala Val Gln Pro Val Pro Gln
               1715                1720                1725
ata cct ttc cct gtg ttc aac gac ccg ttt ctg cat gaa ctg gag aag    5535
Ile Pro Phe Pro Val Phe Asn Asp Pro Phe Leu His Glu Leu Glu Lys
           1730                1735                1740
ttg cgg aga gaa tca gag aac tca aag aag act ttt gaa gaa aaa aaa    5583
Leu Arg Arg Glu Ser Glu Asn Ser Lys Lys Thr Phe Glu Glu Lys Lys
       1745                1750                1755
tca atc ttg aaa gct gaa ctc gag agg aag atg gct gaa gta caa gca    5631
Ser Ile Leu Lys Ala Glu Leu Glu Arg Lys Met Ala Glu Val Gln Ala
   1760                1765                1770
gag ttt cga aga aaa ttt cat gag gta gaa gcc gag cat aac acc aga    5679
Glu Phe Arg Arg Lys Phe His Glu Val Glu Ala Glu His Asn Thr Arg
1775               1780                1785                1790
acg aca aag ata gag aag gat aag aat ctt gtt ata atg aac aaa ctg    5727
Thr Thr Lys Ile Glu Lys Asp Lys Asn Leu Val Ile Met Asn Lys Leu
               1795                1800                1805
ttg gcg aat gcg ttc ttg tcc aaa tgt act gac aag aag gta tct ccc    5775
Leu Ala Asn Ala Phe Leu Ser Lys Cys Thr Asp Lys Lys Val Ser Pro
           1810                1815                1820
tca gga gct cca agg ggt aaa att cag cag cta gca cag aga gca gca    5823
Ser Gly Ala Pro Arg Gly Lys Ile Gln Gln Leu Ala Gln Arg Ala Ala
       1825                1830                1835
caa gtg agt gca ctg aga aat tac att gct cct cag cag ctt cag gca    5871
Gln Val Ser Ala Leu Arg Asn Tyr Ile Ala Pro Gln Gln Leu Gln Ala
   1840                1845                1850
tct tct ttt cct gct cct gct ctg gtt tcg gct cct ctg caa ctt cag    5919
Ser Ser Phe Pro Ala Pro Ala Leu Val Ser Ala Pro Leu Gln Leu Gln
1855               1860                1865                1870
caa tca tca ttt cct gct cct ggt ccg gct cct ctg cag cct cag gca    5967
Gln Ser Ser Phe Pro Ala Pro Gly Pro Ala Pro Leu Gln Pro Gln Ala
               1875                1880                1885
tct tcg ttt cct tct tca gtc tct cgt cca tca gcc ctt ctt ctg aat    6015
Ser Ser Phe Pro Ser Ser Val Ser Arg Pro Ser Ala Leu Leu Leu Asn
           1890                1895                1900
ttt gcg gtc tgt cca atg cct cag ccc aga cag cct ctc ata tcc aac    6063
Phe Ala Val Cys Pro Met Pro Gln Pro Arg Gln Pro Leu Ile Ser Asn
       1905                1910                1915
ata gct cca act cca tca gtt act cct gca aca aat cca ggt ctg cgt    6111
Ile Ala Pro Thr Pro Ser Val Thr Pro Ala Thr Asn Pro Gly Leu Arg
   1920                1925                1930
tct cct gca cca cac cta aac tca tat aga cca tcc tct tca act ccc    6159
Ser Pro Ala Pro His Leu Asn Ser Tyr Arg Pro Ser Ser Ser Thr Pro
1935               1940                1945                1950
gtc gcc aca gct act cca acc tcg tca gtg cct cct caa gct ttg aca    6207
Val Ala Thr Ala Thr Pro Thr Ser Ser Val Pro Pro Gln Ala Leu Thr
               1955                1960                1965
tat tca gct gtg tca att cag cag cag caa gaa caa caa ccg caa cag     6255
Tyr Ser Ala Val Ser Ile Gln Gln Gln Gln Glu Gln Gln Pro Gln Gln
           1970                1975                1980
agc ttg agc agt gga ttg cag agc aac aat gaa gtg gtt tgt ctt tct     6303
Ser Leu Ser Ser Gly Leu Gln Ser Asn Asn Glu Val Val Cys Leu Ser
       1985                1990               1995
gac gac gag tgacctaaga ggagagatgg ttagggtctt agttattgat             6352
Asp Asp Glu
   2000
ttttagagag ttaataatag tatatatata tatgtataag taggttacct aatctctgtc   6412
gttaatctaa tttagtgagt caggaaccga ctcgttggct aaggtctctc cttttgaaac   6472
gcaacgttct actttcatgt atataaatac agtctgatca cacaacacaa attgatgatt   6532
gaaaatacta ctgatttaac ttaaaaaaaa aaaaaaaaa                          6571
<210>3
<211>2001
<212>PRT
<213>拟南芥
<400>3
Met Lys Lys Asp Glu Lys Ile Gly Leu Thr Gly Arg Thr Ile Tyr Thr
   1              5                  10                  15
Arg Ser Leu Ala Ala Ser Ile Pro Ala Ser Val Glu Gln Glu Thr Pro
             20                  25                  30
Gly Leu Arg Arg Ser Ser Arg Gly Thr Pro Ser Thr Lys Val Ile Thr
         35                  40                  45
Pro Ala Ser Ala Thr Arg Lys Ser Glu Arg Leu Ala Pro Ser Pro Ala
     50                      55              60
Ser Val Ser Lys Lys Ser Gly Gly Ile Val Lys Asn Ser Thr Pro Ser
 65                  70                  75                  80
Ser Leu Arg Arg Ser Asn Arg Gly Lys Thr Glu Val Ser Leu Gln Ser
                 85                 90                  95
Ser Lys Gly Ser Asp Asn Ser Ile Arg Lys Gly Asp Thr Ser Pro Asp
            100                 105                 110
Ile Glu Gln Arg Lys Asp Ser Val Glu Glu Ser Thr Asp Lys Ile Lys
       115                 120                 125
Pro Ile Met Ser Ala Arg Ser Tyr Arg Ala Leu Phe Arg Gly Lys Leu
    130                 135                 140
Lys Glu Ser Glu Ala Leu Val Asp Ala Ser Pro Asn Glu Glu Glu Leu
145                 150                 155                 160
Val Val Val Gly Cys Ser Arg Arg Ile Pro Ala Gly Asn Asp Asp Val
                165                 170                 175
Gln Gly Lys Thr Asp Cys Pro Pro Pro Ala Asp Ala Gly Ser Lys Arg
            180                 185                 190
Leu Pro Val Asp Glu Thr Ser Leu Asp Lys Gly Thr Asp Phe Pro Leu
        195                 200                 205
Lys Ser Val Thr Glu Thr Glu Lys Ile Val Leu Asp Ala Ser Pro Ile
    210                 215                 220
Val Glu Thr Gly Asp Asp Ser Val Ile Gly Ser Pro Ser Glu Asn Leu
225                 230                 235                 240
Glu Thr Gln Lys Leu Gln Asp Gly Lys Thr Asp Cys Ser Pro Pro Ala
                245                 250                 255
Asn Ala Glu Ser Lys Thr Leu Pro Val Gly Glu Thr Ser Leu Glu Lys
            260                 265                 270
Glu Tyr Pro Gln Lys Phe Gln Asp Asp Asn Thr Asp Cys Leu Pro Pro
        275                 280                 285
Ala Asn Ala Glu Ser Lys Arg Leu Pro Val Gly Glu Thr Ser Leu Glu
    290                 295                 300
Lys Asp Thr Asp Phe Pro Leu Lys Ser Thr Thr Glu Thr Gly Lys Met
305                 310                 315                 320
Val Leu Tyr Ala Ser Pro Ile Val Glu Thr Arg Asp Asp Ser Val Ile
                325                 330                 335
Cys Ser Pro Ser Thr Asn Leu Glu Thr Gln Lys Leu Leu Val Ser Lys
            340                 345                 350
Thr Gly Leu Glu Thr Asp Ile Val Leu Pro Leu Lys Arg Lys Arg Asp
        355                 360                 365
Thr Ala Glu Ile Glu Leu Asp Ala Cys Ala Thr Val Ala Asn Gly Asp
    370                 375                 380
Asp His Val Met Ser Ser Asp Gly Val Ile Pro Ser Pro Ser Gly Cys
385                 390                 395                 400
Lys Asn Asp Asn Arg Pro Glu Met Cys Asn Thr Cys Lys Lys Arg Gln
         405                 410                 415
 Lys Val Asn Gly Asp Cys Gln Asn Arg Ser Val Cys Ser Cys Ile Val
             420                 425                 430
Gln Pro Val Glu Glu Ser Asp Asn Val Thr Gln Asp Met Lys Glu Thr
        435                 440                 445
Gly Pro Val Thr Ser Arg Glu Tyr Glu Glu Asn Gly Gln Ile Gln His
    450                 455                 460
Gly Lys Ser Ser Asp Pro Lys Phe Tyr Ser Ser Val Tyr Pro Glu Tyr
465                 470                 475                 480
Trp Val Pro Val Gln Leu Ser Asp Val Gln Leu Glu Gln Tyr Cys Gln
                485                 490                 495
Thr Leu Phe Ser Lys Ser Leu Ser Leu Ser Ser Leu Ser Lys Ile Asp
            500                 505                 510
Leu Gly Ala Leu Glu Glu Thr Leu Asn Ser Val Arg Lys Thr Cys Asp
        515                 520                 525
His Pro Tyr Val Met Asp Ala Ser Leu Lys Gln Leu Leu Thr Lys Asn
    530                 535                 540
Leu Glu Leu His Glu Ile Leu Asp Val Glu Ile Lys Ala Ser Gly Lys
545                 550                 555                 560
Leu His Leu Leu Asp Lys Met Leu Thr His Ile Lys Lys Asn Gly Leu
                565                 570                 575
Lys Ala Val Val Phe Tyr Gln Ala Thr Gln Thr Pro Glu Gly Leu Leu
            580                 585                 590
Leu Gly Asn Ile Leu Glu Asp Phe Val Gly Gln Arg Phe Gly Pro Lys
        595                 600                 605
Ser Tyr Glu His Gly Ile Tyr Ser Ser Lys Lys Asn Ser Ala Ile Asn
    610                 615                 620
Asn Phe Asn Lys Glu Ser Gln Cys Cys Val Leu Leu Leu Glu Thr Arg
625                 630                 635                 640
Ala Cys Ser Gln Thr Ile Lys Leu Leu Arg Ala Asp Ala Phe Ile Leu
                645                 650                 655
Phe Gly Ser Ser Leu Asn Pro Ser His Asp Val Lys His Val Glu Lys
            660                 665                 670
Ile Lys Ile Glu Ser Cys Ser Glu Arg Thr Lys Ile Phe Arg Leu Tyr
        675                 680                 685
Ser Val Cys Thr Val Glu Glu Lys Ala Leu Ile Leu Ala Arg Gln Asn
    690                 695                 700
Met Arg Gln Asn Lys Ala Val Glu Asn Leu Asn Arg Ser Leu Thr His
705                 710                 715                 720
Ala Leu Leu Met Trp Gly Ala Ser Tyr Leu Phe Asp Lys Leu Asp His
                725                 730                 735
Phe His Ser Ser Glu Thr Pro Asp Ser Gly Val Ser Phe Glu Gln Ser
            740                 745                 750
Ile Met Asp Gly Val Ile His Glu Phe Ser Ser Ile Leu Ser Ser Lys
        755                 760                 765
Gly Gly Glu Glu Asn Glu Val Lys Leu Cys Leu Leu Leu Glu Ala Lys
    770                 775                 780
His Ala Gln Gly Thr Tyr Ser Ser Asp Ser Thr Leu Phe Gly Glu Asp
785                 790                 795                 800
His Ile Lys Leu Ser Asp Glu Glu Ser Pro Asn Ile Phe Trp Ser Lys
                805                 810                 815
Leu Leu Gly Gly Lys Asn Pro Met Trp Lys Tyr Pro Ser Asp Thr Pro
            820                 825                 830
Gln Arg Asn Arg Lys Arg Val Gln Tyr Phe Glu Gly Ser Glu Ala Ser
        835                 840                 845
Pro Lys Thr Gly Asp Gly Gly Asn Ala Lys Lys Arg Lys Lys Ala Ser
    850                 855                 860
Asp Asp Val Thr Asp Pro Arg Val Thr Asp Pro Pro Val Asp Asp Asp
865                 870                 875                 880
Glu Arg Lys Ala Ser Gly Lys Asp His Met Gly Ala Leu Glu Ser Pro
                885                 890                 895
Lys Val Ile Thr Leu Gln Ser Ser Cys Lys Ser Ser Gly Thr Asp Gly
            900                 905                 910
Thr Leu Asp Gly Asn Asp Ala Phe Gly Leu Tyr Ser Met Gly Ser His
        915                 920                 925
Ile Ser Gly Ile Pro Glu Asp Met Leu Ala Ser Gln Asp Trp Gly Lys
    930                 935                 940
Ile Pro Asp Glu Ser Gln Arg Arg Leu His Thr Val Leu Lys Pro Lys
945                 950                 955                 960
Met Ala Lys Leu Cys Gln Val Leu His Leu Ser Asp Ala Cys Thr Ser
                965                 970                 975
Met Val Gly Asn Phe Leu Glu Tyr Val Ile Glu Asn His Arg Ile Tyr
            980                 985                 990
Glu Glu Pro Ala Thr Thr Phe Gln Ala Phe Gln Ile Ala Leu Ser Trp
        995                1000                1005
Ile Ala Ala Leu Leu Val Lys Gln Ile Leu Ser His Lys Glu Ser Leu
   1010                1015                1020
Val Arg Ala Asn Ser Glu Leu Ala Phe Lys Cys Ser Arg Val Glu Val
025                1030                1035                1040
Asp Tyr Ile Tyr Ser Ile Leu Ser Cys Met Lys Ser Leu Phe Leu Glu
               1045                1050                1055
His Thr Gln Gly Leu Gln Phe Asp Cys Phe Gly Thr Asn Ser Lys Gln
          1060                1065                1070
Ser Val Val Ser Thr Lys Leu Val Asn Glu Ser Leu Ser Gly Ala Thr
       1075                1080                1085
Val Arg Asp Glu Lys Ile Asn Thr Lys Ser Met Arg Asn Ser Ser Glu
   1090                1095                1100
Asp Glu Glu Cys Met Thr Glu Lys Arg Cys Ser His Tyr Ser Thr Ala
105                1110                1115                1120
Thr Arg Asp Ile Glu Lys Thr Ile Ser Gly Ile Lys Lys Lys Tyr Lys
               1125                1130                1135
Lys Gln Val Gln Lys Leu Val Gln Glu His Glu Glu Lys Lys Met Glu
           1140                1145                1150
Leu Leu Asn Met Tyr Ala Asp Lys Lys Gln Lys Leu Glu Thr Ser Lys
       1155                1160                1165
Ser Val Glu Ala Ala Val Ile Arg Ile Thr Cys Ser Arg Thr Ser Thr
   1170                1175                1180
Gln Val Gly Asp Leu Lys Leu Leu Asp His Asn Tyr Glu Arg Lys Phe
185                1190                1195                1200
Asp Glu Ile Lys Ser Glu Lys Asn Glu Cys Leu Lys Ser Leu Glu Gln
               1205                1210                1215
Met His Glu Val Ala Lys Lys Lys Leu Ala Glu Asp Glu Ala Cys Trp
           1220                1225                1230
Ile Asn Arg Ile Lys Ser Trp Ala Ala Lys Leu Lys Val Cys Val Pro
       1235                1240                1245
Ile Gln Ser Gly Asn Asn Lys His Phe Ser Gly Ser Ser Asn Ile Ser
   1250                1255                1260
Gln Asn Ala Pro Asp Vel Gln Ile Cys Asn Asn Ala Asn Val Glu Ala
265                1270                1275                1280
Thr Tyr Ala Asp Thr Asn Cys Met Ala Ser Lys Val Asn Gln Val Pro
               1285                1290                1295
Glu Ala Glu Asn Thr Leu Gly Thr Met Ser Gly Gly Ser Thr Gln Gln
           1300                1305                1310
Val His Glu Met Val Asp Val Arg Asn Asp Glu Thr Met Asp Val Ser
       1315                1320                1325
Ala Leu Ser Arg Glu Gln Leu Thr Lys Ser Gln Ser Asn Glu His Ala
   1330                1335                1340
Ser Ile Thr Val Pro Glu Ile Leu Ile Pro Ala Asp Cys Gln Glu Glu
345                1350                1355                1360
Phe Ala Ala Leu Asn Val His Leu Ser Glu Asp Gln Asn Cys Asp Arg
               1365                1370                1375
Ile Thr Ser Ala Ala Ser Asp Glu Asp Val Ser Ser Arg Val Pro Glu
           1380                1385                1390
Val Ser Gln Ser Leu Glu Asn Leu Ser Ala Ser Pro Glu Phe Ser Leu
       1395                1400                1405
Asn Arg Glu Glu Ala Leu Val Thr Thr Glu Asn Arg Arg Thr Ser His
   1410                1415                1420
Val Gly Phe Asp Thr Asp Asn Ile Leu Asp Gln Gln Asn Arg Glu Asp
425                1430                1435                1440
Cys Ser Leu Asp Gln Glu Ile Pro Asp Glu Leu Ala Met Pro Val Gln
               1445                1450                1455
His Leu Ala Ser Val Val Glu Thr Arg Gly Ala Ala Glu Ser Asp Gln
           1460                1465                1470
Tyr Gly Gln Asp Ile Cys Pro Met Pro Ser Ser Leu Ala Gly Lys Gln
       1475                1480                1485
Pro Asp Pro Ala Ala Asn Thr Glu Ser Glu Asn Leu Glu Glu Ala Ile
   1490                1495                1500
Glu Pro Gln Ser Ala Gly Ser Glu Thr Val Glu Thr Thr Asp Phe Ala
505                1510                1515                1520
Ala Ser His Gln Gly Asp Gln Val Thr Cys Pro Leu Leu Ser Ser Pro
               1525                1530                1535
Thr Gly Asn Gln Pro Ala Pro Glu Ala Asn Ile Glu Gly Gln Asn Ile
           1540                1545                1550
Asn Thr Ser Ala Glu Pro His Val Ala Gly Pro Asp A la Val Glu Ser
       1555                1560                1565
Gly Asp Tyr Ala Val Ile Asp Gln Glu Thr Met Gly Ala Gln Asp Ala
   1570                1575                1580
Cys Ser Leu Pro Ser Gly Ser Val Gly Thr Gln Ser Asp Leu Gly Ala
585                1590                1595                1600
Asn Ile Glu Gly Gln Asn Val Thr Thr Val Ala Gln Leu Pro Thr Asp
               1605                1610                1615
Gly Ser Asp Ala Val Val Thr Gly Gly Ser Pro Val Ser Asp Gln Cys
           1620                1625                1630
Ala Gln Asp Ala Ser Pro Met Pro Leu Ser Ser Pro Gly Asn His Pro
       1635                1640                1645
Asp Thr Ala Val Asn Ile Glu Gly Leu Asp Asn Thr Ser Val Ala Glu
   1650                1655                1660
Pro His Ile Ser Gly Ser Asp Ala Cys Glu Met Glu Ile Ser Glu Pro
665                1670                1675                1680
Gly Pro Gln Val Glu Arg Ser Thr Phe Ala Asn Leu Phe His Glu Gly
               1685                1690                1695
Gly Val Glu His Ser Ala Gly Val Thr Ala Leu Val Pro Ser Leu Leu
           1700                1705                1710
Asn Asn Gly Thr Glu Gln Ile Ala Val Gln Pro Val Pro Gln Ile Pro
       1715                1720                1725
Phe Pro Val Phe Asn Asp Pro Phe Leu His Glu Leu Glu Lys Leu Arg
   1730                1735                1740
Arg Glu Ser Glu Asn Ser Lys Lys Thr Phe Glu Glu Lys Lys Ser Ile
745                1750                1755                1760
Leu Lys Ala Glu Leu Glu Arg Lys Met Ala Glu Val Gln Ala Glu Phe
               1765                1770                1775
Arg Arg Lys Phe His Glu Val Glu Ala Glu His Asn Thr Arg Thr Thr
           1780                1785                1790
Lys Ile Glu Lys Asp Lys Asn Leu Val Ile Met Asn Lys Leu Leu Ala
       1795                1800                1805
Asn Ala Phe Leu Ser Lys Cys Thr Asp Lys Lys Val Ser Pro Ser Gly
   1810                1815                1820
Ala Pro Arg Gly Lys Ile Gln Gln Leu Ala Gln Arg Ala Ala Gln Val
825                1830                1835                1840
Ser Ala Leu Arg Asn Tyr Ile Ala Pro Gln Gln Leu Gln Ala Ser Ser
               1845                1850                1855
Phe Pro Ala Pro Ala Leu Val Ser Ala Pro Leu Gln Leu Gln Gln Ser
           1860                1865                1870
Ser Phe Pro Ala Pro Gly Pro Ala Pro Leu Gln Pro Gln Ala Ser Ser
       1875                1880                1885
Phe Pro Ser Ser Val Ser Arg Pro Ser Ala Leu Leu Leu Asn Phe Ala
   1890                1895                1900
Val Cys Pro Met Pro Gln Pro Arg Gln Pro Leu Ile Ser Asn Ile Ala
905                1910                1915                1920
Pro Thr Pro Ser Val Thr Pro Ala Thr Asn Pro Gly Leu Arg Ser Pro
               1925                1930                1935
Ala Pro His Leu Asn Ser Tyr Arg Pro Ser Ser Ser Thr Pro Val Ala
           1940                1945                1950
Thr Ala Thr Pro Thr Ser Ser Val Pro Pro Gln Ala Leu Thr Tyr Ser
       1955                1960                1965
Ala Val Ser Ile Gln Gln Gln Gln Glu Gln Gln Pro Gln Gln Ser Leu
   1970                1975                1980
Ser Ser Gly Leu Gln Ser Asn Asn Glu Val Val Cys Leu Ser Asp Asp
985                1990                1995                2000
Glu
<210>4
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>4
 catctacggc aatgtaccag c                                              21
<210>5
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>5
 gatgggaatt ggctgagtgg c                                              21
<210>6
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>6
cagttccaaa cgtaaaacgg c                                              21
<210>7
<211>15
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>7
ntcgastwts gwgtt                                                     15
<210>8
<211>16
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>8
 ngtcgaswga nawgaa                                                    16
<210>9
<211>16
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>9
 wgtgnagwan canaga                                                    16
<210>10
<211>16
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>10
wggwancwga wangca                                                    16
<210>11
<211>16
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>11
 wcgwwgawca ngncga                                                    16
<210>12
<211>16
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>12
 wgcnagtnag wanaag                                                    16
<210>13
<211>16
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>13
awgcangncw ganata                                                     16
<210>14
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>14
ctgtacatac tgagtacaat cgga                                            24
<210>15
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>15
 gcttcaattc ctgcctcagt tgaac                                          25
<210>16
<211>24
<212>
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>16
 ctctacgtgc ttaacatcat gcga                                           24
<210>17
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>17
 ccagcttctg ctactagaaa gtcag                                          25
<210>18
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>18
ctggagttgc atgaaatcct ggatg                                           25
<210>19
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>19
gctctttgta agctgttcac gagac                                          25
<210>20
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>20
tcgcatgatg ttaagcacgt agag                                           24
<210>21
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>21
gagtactggt ccgtgaacag gtaat                                          25
<210>22
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>22
atgcttgcac aagcatggtc ggaaa                                           25
<210>23
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>23
tgcaacatcg tgcatttgct ccaga                                            25
<210>24
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>24
 cacaagcatg agtttttcct tccgg                                          25
<210>25
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:合成寡核苷酸
<400>25
 ctgactttct agtagcagaa gctgg                                          25
<210>26
<211>519
<212>DNA
<213>甘蓝
<220>
<223>seq1-23
<400>26
gaattcctgn nttacggcat ccttaataga ctgttcaaat ggaactcctg aacctggggt   60
tccactccca tggaagtgtt ccagcttatc aaataaatat gatgcccccc acatgagcaa   120
tgcatgtgtg agaggacggt ttaggttctc tagaggctta ttttgcctag caagaatcag   180
ggttttttct tcaactgtaa acactgagta caaccggaaa atcttagttc tttcagaaca   240
cgactcaacc tttatcttct ctaagagctt aacgtcatgc gatggattca ggctgcttcc   300
aaaaagtata aaagactcag cgcgtaagag tttaatgctt tgactacagg cacgtatttc   360
cagcagcaga ataaaacact cactctcctt gttgaaattg tttatagcgt tcttcttcga   420
gaggcagacc ccatgctcat aggaattttg accaaatctt tgcatcagaa aatcttcgag   480
aatattacca agcagaagcc cctcagggct atgtattgc                          519
<210>27
<211>419
<212>DNA
<213>甘蓝
<220>
<223>seq1-27
<400>27
gaattcagga tcaaaagggt tgccggttgg agaaactggt ttagagaaag gctctgattt   60
tcctgtggaa gtaactaagg atatagagaa gacagtggtt gattcatccc ccatggttga   120
aactgaggat ggcagtgtta taggttcacc atccgagaat ccagaaccac aaaagcttcg   180
tgacagtgaa actagcttgg aaaccgatat agacttggct ctgaaaagaa aaagagacac   240
tgcagaaatt gtgatggatg catgtacaaa tgcagatgac cgcattatga gtactgatgg   300
ggttattcct tttccacccg tgtgcacaaa tattaatcaa cccgaaaggt gtggcacatg   360
tcaaaaacgg caaaagtaag aatttccgac tgttgtctgt cgttttgaaa ccatttgcc    419
<210>28
<211>467
<212>DNA
<213>甘蓝
<220>
<223>seq1-43
<400>28
gaattctcgt ccatactttc ttccgatgtt ggagaagaaa atgaaggcaa gctgtgtcta   60
cttttggaag ccaagcatgc tcagggaagt tacagcactg atgctactct atttggtgaa   120
gaacatgtca agttatcaga tgaaagtcca aatatgtttt ggtcaaagct gttgagtgga   180
aagaacccta tgtggaaata ctgttcggat actcctcaaa ggagtcgaaa aagagtacgg   240
catcttcagg gctatgagga gactaccaaa gttggcaatg gcggaaactt aaagaagaaa   300
aagaaggctt cagatgatgt cacagtagat aacgctgaga gaaaagcctc tggaaaggat   360
cacatgggta aaacagttca cttcctgctc ctttacctct agtgttcatt gaatgttcca   420
tttactttgc ttactatctt tccttcaggg catttggagt caccaaa                 467
<210>29
<211>490
<212>DNA
<213>甘蓝
<220>
<223>seq1-47
<400>29
gaattcagct tttaaaactg atctctgctc acagataatt taagagtcag tgaaaattga   60
gataaaacga accaaaactg gaggtaacag atactctgag aacaactaac cttttcttca   120
taagtcttct ttgtgttctc tgattctctc cgcagcttct ccagttcatg ctgaaatggg   180
tcactgaaca cagggaaagg tacttgagga acaggtggag tggcattctg tcccgtagca   240
ttgttaagct gtgaagaaac aggagctgtt acacctgctg gaggctccac aacaccttca   300
tcgacaacgt ctgcgtaaaa ggtattacca gattgtcagt ttctctggca aacacatacg   360
ttatacttaa atgcaaaaga gcagttactg acttgcaaag gttggttgtt ctacttgagc   420
atcaggttct gctacttcca tttcacatgc ttctgatcca gttgtgcgag gcgcagccat   480
tgttgtgttg                                                          490
<210>30
<211>515
<212>DNA
<213>甘蓝
<220>
<223>2-33
<400>30
tctagagaag aggtggatta tgtatattct tttctgtact gcatgaagag tctattcgtg   60
gggcgcacac aaggtttcca agaaaagggt gaagaatgca tggctgagaa aagaggtagc   120
cattatagct cagtaaccaa ggatgttgaa aagactatta gcgacatcaa aaagaaatgc   180
agtaagagcc tgcataagct tgtacaaacc ctcgaggaag aaaagatgga cctgatgaat   240
aggaatgctg tcaagaagca ggaacttcag aattgtaaaa aggtggaagc atcatttatt   300
cgtgtcacct attcaggtat aaatactcag agcttacatg atgctctcca acggctggaa   360
tgtacttttg aaagaaagtt tgatgatctc aaaggagagt tggatgaatg ccttgaaagt   420
ttagagcaaa taaacgaggc tggaaagaag aagttggctg aagatgaagc ctgttggatt   480
agtcggatag agaaatgggc acgagctgaa ttaag                              515
<210>31
<211>574
<212>DNA
<213>甘蓝
<220>
<223>seq2-37
<400>31
tctagaccaa actattaaac gctaaacata agaagattag atcactcgtc atcagagaga   60
cagaccacat cattgctcct ctgcaatcca ctccccaagt tctgtggttg ttcttgctgc   120
tgaataaacg catttgaata tggtaaaggg ttggagatga gaggttgtct tggttgaggc   180
attgtgcagt acggagccga agcagtatga ttcctcagtg cgcttacttg tgttgctctc   240
tgtgctagct gctggattct aactggagaa agaaaaaaag aaaaaaaagg tgttattatg   300
acttcataac cttatatctt taaaaaacaa ttatgcttct attattcgaa cacttgccca   360
ttggagttgc tgctgaggaa tgagaggaga ttctgctcgt acatttagac aagaacgcac   420
tcgacaacag cttgttcttt ataacaagat tcttcctcgt ctgtaacttc gtctttctgg   480
ctgcatgtac agcttgtacc tcatgaaact ttctctgata ctcttcttgt aattcagcta   540
tcttcttctc gaatttagct ttcaagactg cttt                               574
<210>32
<211>466
<212>DNA
<213>甘蓝
<220>
<223>seq2-53
<400>32
tctagattgt aattttaaat ttacaacaaa ttttgaaagg gtcagcgatg agtttgcaaa   60
tctccgtgtt tcctccagca ttgctcagcc agttcaagaa cctgatcact tggcacaggt   120
tggtttcttc ttgctttact ttggacacct gtttaatatt ggcctgtcaa atttacttat   180
ccttttactt ctaaactgca aattctggtc tgcattgcat tgtgatatga aggtatctgg   240
acccgcttca agcagagact atggggagga caggcagaat atgcaacaag ataaatcaca   300
tgaccgaaag ttgtcatcga tgtatccaga gtattgggtt ccagtgcagc tatcagatgt   360
acagatagag caatactgtc ggactctctt ctccaaatct tcatctcttt cttcgctgtc   420
gaggactgat cctgttcgag ctcttgaaca aactctcagt tctgta                  466
<210>33
<211>417
<212>DNA
<213>甘蓝
<220>
<223>seq2-57
<400>33
tctagagcaa ttgaaaccta attccgattt tgcgcgggcc agagattctt cacggttgaa   60
cttttgctta acgaaagaga ctgcaatcca aatctggaag tgcattatta agaacgtatt   120
cagcaatatt cataaattat gcaacaatca aaggccttac gttgtggcct acaaagcatg   180
gattttgtta gatattagta gctagtctaa ttcaagcaat taatggaagt ttctatccta   240
tgactggaaa gttaaacatt cccacaaaag cagtgatgcc acagatgatg aagaagaaaa   300
atgcatatac tatggaagtg aatgctatca taccacagct atctggaagg cctgcaatgt   360
tgtagctggc tctttgcaga cacggtggtt gtcaataata tattcaagaa ctttttc      417

Claims (5)

1.含有编码蛋白质的可读框的DNA,其中可读框编码的蛋白质的特征为SEQ ID NO:3的氨基酸序列,或者用氨基酸残基K替代SEQ ID NO:3第705位的M或用氨基酸残基D替代SEQ ID NO:3第1219位的E的等位氨基酸序列。
2.根据权利要求1的DNA,其以SEQ ID NO:1或SEQ ID NO:2的核苷酸序列为特征。
3.根据权利要求1或2的DNA,其特征在于细胞中相应反义RNA的表达可解除转基因标记基因的沉默。
4.由权利要求1-3之任意一项中所描述的可读框编码的蛋白质。
5.解除转基因植物中转基因的沉默的方法,包括在所述转基因植物中表达反义RNA,其中与所述反义RNA对应的有义RNA编码蛋白质,该蛋白质的特征在于SEQ ID NO:3的氨基酸序列,或者用氨基酸残基K替代SEQ ID NO:3第705位的M或用氨基酸残基D替代SEQ ID NO:3第1219位的E的等位氨基酸序列。
CN 00809325 1999-06-23 2000-06-21 参与外遗传基因沉默的基因 Expired - Fee Related CN1250724C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9914623.5 1999-06-23
GBGB9914623.5A GB9914623D0 (en) 1999-06-23 1999-06-23 Organic compounds

Publications (2)

Publication Number Publication Date
CN1364194A CN1364194A (zh) 2002-08-14
CN1250724C true CN1250724C (zh) 2006-04-12

Family

ID=10855867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 00809325 Expired - Fee Related CN1250724C (zh) 1999-06-23 2000-06-21 参与外遗传基因沉默的基因

Country Status (8)

Country Link
EP (1) EP1185657A2 (zh)
JP (1) JP2003503047A (zh)
CN (1) CN1250724C (zh)
AR (1) AR024421A1 (zh)
AU (1) AU5977000A (zh)
CA (1) CA2369749A1 (zh)
GB (1) GB9914623D0 (zh)
WO (1) WO2001000801A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2574981T3 (es) * 2007-02-28 2016-06-23 Cropdesign N.V. Plantas que tienen rasgos potenciados relacionados con el rendimiento y procedimiento de producción de las mismas

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998004725A1 (en) * 1996-07-31 1998-02-05 Yale University Methods for altering the rate of plant development and plants obtained therefrom

Also Published As

Publication number Publication date
JP2003503047A (ja) 2003-01-28
WO2001000801A2 (en) 2001-01-04
CN1364194A (zh) 2002-08-14
WO2001000801A3 (en) 2001-05-10
AU5977000A (en) 2001-01-31
AR024421A1 (es) 2002-10-02
EP1185657A2 (en) 2002-03-13
CA2369749A1 (en) 2001-01-04
GB9914623D0 (en) 1999-08-25

Similar Documents

Publication Publication Date Title
CN1202246C (zh) 获得修饰表型的方法和措施
CN1823168A (zh) 提高植物非生物胁迫耐受性和/或生物量的方法及用该方法所产生的植物
CN1151183A (zh) Rps2基因及其应用
CN1791676A (zh) 制备特征为双粒病毒组持续抗性的转基因植物的方法
CN1844396A (zh) 调控水稻分蘖角度的基因及其编码蛋白与应用
CN101065490A (zh) 用于植物的启动子分子
CN101048507A (zh) 一种增大种子大小的方法
CN1487997A (zh) 诱导植物开花的hd3a基因及其应用
CN1844393A (zh) 水稻稻瘟病抗性基因Pi37及其应用
CN1594571A (zh) 百草枯抗性基因及维管束和毛状体特异性启动子
CN1809640A (zh) 延迟植物中种子落粒的方法和手段
CN101037695A (zh) 一种控制水稻花粉育性基因及应用
CN1298853C (zh) 耐缺铁性稻类的构建
CN1639337A (zh) 具有催泪成分合成酶活性的蛋白质或多肽、编码该蛋白质或多肽的 DNA、利用该 DNA制造具有催泪成分合成酶活性的蛋白质或多肽的制造方法以及具有抑制该蛋白质或多肽的mRNA翻译的功能的核酸分子
CN1898383A (zh) 来自地钱的不饱和脂肪酸合成系统酶基因及其利用
CN1685047A (zh) 用于生产转质体基因组被子植物的载体
CN1821395A (zh) 一种水稻促分裂原活化蛋白激酶及其编码基因与应用
CN1239515C (zh) 参与由细胞质雄性不育恢复至可育的蛋白质及编码该蛋白质的基因
CN1195862C (zh) 分离和纯化的包括在蛇麻腺中特异性表达的基因的核酸
CN1214105C (zh) Map激酶磷酸酶突变体
CN1283796C (zh) 编码半胱氨酸蛋白酶的基因和启动子及生产雄性不育水稻的方法
CN1154728C (zh) 通过导入矮牵牛属转录因子PetSPL2的基因以缩短花序节间的方法
CN1250724C (zh) 参与外遗传基因沉默的基因
CN1297661C (zh) 一种抗稻瘟病基因及其编码蛋白与应用
CN1297666C (zh) 植物转录阻遏物,结合其的蛋白质核因子,及它们的应用

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee