CN1364194A

CN1364194A - 参与外遗传基因沉默的基因

Info

Publication number: CN1364194A
Application number: CN 00809325
Authority: CN
Inventors: Y·羽部; O·米特尔斯坦施德; P·阿麦德欧; J·帕茨克斯基
Original assignee: Syngenta Participations AG
Current assignee: Syngenta Participations AG
Priority date: 1999-06-23
Filing date: 2000-06-21
Publication date: 2002-08-14
Anticipated expiration: 2020-06-21
Also published as: GB9914623D0; CN1250724C; WO2001000801A3; WO2001000801A2; CA2369749A1; EP1185657A2; AU5977000A; AR024421A1; JP2003503047A

Abstract

本发明涉及编码参与基因沉默的蛋白的DNA。相关基因可从不同来源如哺乳动物或植物的细胞中分离,其编码蛋白的特征为氨基酸序列含有与SEQ ID NO:3的对比成分序列有40%或更多一致性的、至少有150个氨基酸残基的成分序列。进一步公开的是一种分离根据本发明的DNA的方法。

Description

参与外遗传基因沉默的基因

本发明涉及编码调控基因沉默、特别是植物基因沉默的蛋白质的DNA。

在对发育、环境或未知信号的反应中可以观察到植物中先前活跃的基因表达的丧失，也称为基因沉默。虽然其发生的频率比突变高，但在体细胞传递过程中显著稳定。基因沉默，最初被认为是转基因表达不稳定的有害起因，现在则被看作是有目的地调控基因表达的分子工具。

看来，受影响座位的染色体位置或结构可能是决定沉默频率和强度的因素。失活似乎偏向于影响存在多拷贝的基因，并被认为是序列冗余的结果。同源依赖性的基因沉默的许多实例已有报道。进一步分析可根据受影响座位的相对位置(顺式、反式、等位、异位)、受影响基因的来源(内源的或转基因的)和相互作用的水平(转录或转录后)对沉默事件进行分类。尽管转录后沉默看起来主要包括形成异常RNA分子和偶然而非必然地伴随DNA甲基化，但干扰转录起始的沉默与DNA的高度甲基化、而且可能与沉默座位的染色质结构改变紧密关联。然而，不清楚这些分子事件是基因沉默的前提还是沉默状态的结果。

就转录沉默而言，沉默基因的失活状态通过有丝分裂和减数分裂稳定传递。同在其它生物中一样，反式作用修饰基因座位(modifier locus)可能负责沉默基因失活状态的稳定性。料想导致突变蛋白的这些座位的突变可能通过干扰沉默状态的维持或不能识别序列冗余而导致减少的基因沉默以及先前沉默座位的再活化。已经报道拟南芥(Arabidopsisthaliana)DDM1基因中的突变使基因沉默解除，并且该基因编码参与染色质重塑(remodeling)的SWI2/SNF2样的蛋白。但是，DDM1基因的突变引起严重的多效性效应。因此，为了能够使用基因技术改变这种效应，有必要鉴定更多的特异性修饰基因座位并表征相应的野生型和突变型蛋白。本发明的主要目的是提供包含编码这种蛋白的可读框的DNA。

对于带有可遗传地失活的、甲基化的潮霉素抗性基因的鼠耳芥属(Arabidopsis)株系，可通过实施例1描述的T-DNA插入诱变来鉴定根据本发明的反式作用修饰基因座位。沉默修饰基因座位的突变导致潮霉素抗性基因沉默的解除并恢复潮霉素抗性。用不同于潮霉素抗性基因的选择标记基因转化沉默的抗性基因纯合的植物，该选择标记基因受T-DNA1′-2′二元启动子的控制。选择转化体并筛选其后代的潮霉素抗性。筛选与特定T-DNA插入片段遗传共分离的突变表型(潮霉素抗性)。使用重组DNA技术的常规方法克隆标签化基因，可表征沉默修饰基因座位的突变型和野生型DNA序列及编码的蛋白。

在本发明中，提到基因应理解为是指与调控序列相连的DNA编码序列，该调控序列可使编码序列转录成RNA如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA。调控序列的实例为启动子序列、5′和3′非翻译序列、内含子和终止序列。

启动子理解为启始相关DNA序列转录的DNA序列，也可包括作为基因表达调控器的元件如激活子、增强子或阻遏子。

基因的表达指在活细胞内基因转录成RNA或基因转录及随后翻译成蛋白质。就反义结构而言，表达仅指反义DNA的转录。

术语转化细胞指将核酸导入宿主细胞，特别是DNA分子稳定整合到所述细胞的基因组中。

特定核苷酸或氨基酸序列的任一部分或片段称为成分序列。

根据本发明的DNA含有编码蛋白质的可读框，该蛋白质的特征为氨基酸序列含有与SEQ ID NO：3有40％或更多一致性的、至少有150个氨基酸残基的成分序列。具体地，该可读框编码的蛋白可用式R₁-R₂-R₃来描述，其中--R₁、R₂和R₃构成由从氨基酸残基组Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg和His中独立选择的氨基酸残基组成的成分序列，--R₁和R₃由0-3000个氨基酸残基独立组成；--R₂由至少150个氨基酸残基组成；且--R₂与SEQ ID NO：3的对比成分序列至少有40％相同。

大多数情况下该蛋白的总长在1000-3000氨基酸残基的范围内。在本发明优选的实施方案中成分序列R₂由至少200个氨基酸残基组成。成分序列R₂的具体实例为下列氨基酸范围所代表的SEQ ID NO：3的成分序列：

1-416(相应于外显子2)；418-583(相应于外显子3-5)；584-890(相应于外显子6)；892-1472(相应于外显子7-9)；1007-1472(相应于外显子9)；1473-1631(相应于外显子10-12)；1632-1827(相应于外显子13-15)；和1829-2001(相应于外显子16)。

在本发明优选的实施方案中，成分序列R₁和R₃中至少有一个含有一个或多个长度至少为50个氨基酸、并与SEQ ID NO：3的对比成分序列至少60％一致的额外成分序列。这类额外成分序列的具体实例为下列氨基酸范围所代表的SEQ ID NO：3的成分序列：420-525(相应于外显子3和4)；444-525(相应于外显子4)；526-583(相应于外显子5)；892-971(相应于外显子7)；892-1006(相应于外显子7和8)；1473-1524(相应于外显子10)；1525-1576(相应于外显子11)；1577-1631(相应于外显子12)；1632-1690(相应于外显子13)；1692-1757(相应于外显子14)；和1758-1827(相应于外显子15)。

根据本发明DNA的特别优选的实施方案编码具有由SEQ ID NO：3的氨基酸478-490、584-600、617-630、654-668、676-690、718-734、776-788、1222-1233、1738-1749或1761-1770限定的成分序列的蛋白。优选地，该编码蛋白含有至少两个、三个或更多所述成分序列的不同代表。所述实施方案的具体实例编码可用SEQ ID NO：3的氨基酸序列、用氨基酸残基K替代SEQ ID NO：3的705位的M或用氨基酸残基D替代SEQID NO：3的1219位的E的等位氨基酸序列表征的蛋白。

动态程序设计算法产生不同种类的对比。序列对比通常有两种方法。Needleman和Wunsch及Sellers提出的算法对比两个序列的全长，提供序列的总体对比。另一方面Smith-Waterman算法产生局部对比。选择计分矩阵和空位罚分后，局部对比序列中最相似的区域对。这使得数据库的搜索集中在序列的最高保守区。它也可对比待鉴定序列中的相似区域。为了提高使用Smith-Waterman算法对比的速度，BLAST(局部对比搜索基础工具)和FASTA在对比时都加了额外的限制。

在本发明中使用BLAST方便地进行对比，BLAST是一套相似性搜索的程序，设计用来探测所有提供的序列数据库，无论查询的是蛋白还是DNA。该搜索工具的BLAST 2.0版(Gapped BLAST)已在互联网(目前的http：//www.ncbi.nlm.nih.gov/BLAST/)向公众发布。它使用寻求局部对比而非总体对比的启发式算法，因此能够检查仅共享隔离区域的序列间的关系。BLAST搜索中的对比得分有明确的统计学解释。在本发明范围内特别有用的是可在局部序列对比中导入空位的blastp程序和PSI-BLAST程序(这两种程序将查询的氨基酸序列与蛋白序列数据库比较)，以及只能对两个序列进行局部对比的blastp变异程序。优选将任选参数设定为默认值来运行所述程序。

使用BLAST的序列对比也可考虑一种氨基酸被另一种氨基酸所替代是可能保留维持蛋白结构和功能所必需的物理化学特性，还是更可能破坏蛋白的基本结构和功能特征。与相同氨基酸的百分率比较，这种序列相似性按照“阳性”氨基酸的百分率来定量，并且在两可的情况中有助于将蛋白归属于正确的蛋白家族。

使用这些计算机程序的序列对比揭示了ATP/GTP结合基元A(SEQ IDNO：3中的460-467位氨基酸)的存在，其共有序列为(Ala/Gly)XaaXaaXaaXaaGlyLys(Ser/Thr)，其中(Ala/Gly)指Ala或Gly，Xaa指任意天然存在的氨基酸，(Ser/Thr)指Ser或Thr。对比还揭示了一个区域(SEQ ID NO：3中的479-719位氨基酸)，其与参与染色质重塑的SWI2/SNF2家族蛋白的部分ATP酶/解旋酶结构域相似，但与已知蛋白没有显著的全序列一致性。

根据本发明的具体DNA实例在SEQ ID NO：1和SEQ ID NO：2中有描述，其编码SEQ ID NO：3描述的鼠耳芥属蛋白。对比后，长50-500个氨基酸的SEQ ID NO：3的序列片段显示与已知蛋白序列的片段有20-50％的序列一致性。然而，SEQ ID NO：3的总体对比导致低于30％的序列一致性。因此，本发明定义了一个新的蛋白家族，其成员的特征为其氨基酸序列含有与SEQ ID NO：3的对比成分序列有40％或更多一致性的、至少150个氨基酸残基的成分序列。优选该氨基酸序列一致性高于50％或甚至高于55％。

编码属于本发明新蛋白质家族的蛋白的DNA可从单子叶和双子叶植物分离。优选来源为谷物、甜菜、向日葵、冬油菜、大豆、棉花、小麦、稻、马铃薯、嫩茎花椰菜、花椰菜、甘蓝、黄瓜、甜玉米、日本萝卜(daikon)、蚕豆、莴苣、甜瓜、胡椒、南瓜、番茄或西瓜。但它们也可由哺乳动物来源如小鼠或人的组织中分离。本领域技术人员知晓，可使用以下普通方法来适应特定的任务。由至少15个，优选20-30个或甚至多于100个连续核苷酸组成的SEQ ID NO：1或SEQ ID NO：2的单链片段可用作探针来筛选DNA文库中与所述片段杂交的克隆。杂交要注意的要素在Sambrook等在(分子克隆：实验室手册》(Molecular cloning：Alaboratory manual)，冷泉港实验室出版社，9.47-9.57和11.45-11.49章，1989)中有描述。测定杂交克隆的序列并纯化含有如下完整编码区的克隆的DNA，该编码区编码蛋白的特征为其氨基酸序列含有与SEQ ID NO：3有40％或更多一致性的至少有150个氨基酸残基的成分序列。然后，所述DNA可用许多常规重组DNA技术如限制酶消化、连接或聚合酶链式反应分析进一步处理。

SEQ ID NO：1和SEQ ID NO：2的公开使本领域技术人员能够设计用于如下聚合酶链式反应的寡核苷酸，该反应试图从包含核苷酸序列的模板扩增DNA片段，其中核苷酸序列的特征为SEQ ID NO：1或SEQ ID NO：2中的15个、优选20-30个或更多碱基对的任意连续序列。所述核苷酸含有代表SEQ ID NO：1或SEQ ID NO：2的15个并且优选20-30个或更多碱基对的核苷酸序列。使用至少一个这种核苷酸进行的聚合酶链式反应以及其扩增产物构成本发明的另一个实施方案。

实施例：

实施例1：T-DNA插入

在Mittelsten Scheid等，Mol Gen Genet 228：104-112，1991和Mittelsten Scheid等，Proc Natl Acad Sci USA 93：7114-7119，1996中描述了携带含有多拷贝嵌合潮霉素磷酸转移酶基因(hpt)的转录沉默座位的拟南芥苏黎世生态型(ecotype Zürich)转基因株系A。通过植物真空浸入(in planta vacuum infiltration)(Bechtold等，C R Acad SciParis Life Science 316：1194-1199，1993)对所述株系纯合二倍体基因型进行农杆菌介导的基因转移，产生4000个以上的独立T-DNA转化体。Mengiste等(Plant J 12：945-948，1997)描述了带有由转录融合到1′启动子的bar基因编码区组成的T-DNA的二元载体(p1′barbi)、农杆菌株(C58CIRif^R)和转化方案。通过用Basta溶液(150mg/l)反复喷洒萌发的幼苗来选择转化体(T1植物)并使其生长成熟。

实施例2：突变体选择

从各转化体收获自交种子(T2家族)。在筛选沉默表型的回复突变体之前，种子在室温下干燥1周并在4℃冷处理最少1周。大约1000粒种子的混合等分试样(由来自20个T2家族的50粒种子组成)表面灭菌7分钟两次(用含有0.1％Tween 80的5％次氯酸钠)，并用灭菌双蒸水冼涤。每一等分试样放入含有75ml用0.8％琼脂固化并含有10mg/l潮霉素B(Calbiochem)的萌发培养基(按照Masson等，Plant J 2：829-933，1992)的14-cm培养皿中用于选择。为了确保在播种时平均分配，将种子与30ml含有0.4％琼脂的相同培养基混合。作为阳性对照，来自潮霉素抗性株系的两粒种子播种在每个培养皿的标记位置。平板在4℃冷处理2天，随后让其接受21℃光照16小时和16℃黑暗8小时的交替周期。播种后每天估计潮霉素抗性，共8-15天。

实施例3：突变体的分子和遗传分析

鉴定了其中一份混合试样的11株潮霉素抗性幼苗之后，对形成该混合库的家族重新进行个别筛选。一个家族含有大约25％的潮霉素抗性幼苗。将该家族的6株抗性幼苗转移到更大的含有无潮霉素的萌发培养基的容器中。在花结形成和根系发育之后，将植物转移到土壤中进一步生长并形成种子。在盆栽之前，从每株植物中取出组织外植体，使其在含有或不含10mg/l潮霉素B的RCA培养基(表1)上产生愈伤组织培养物。愈伤组织培养物用作DNA和RNA分析的材料来源并用于进一步证实该组织中的潮霉素抗性。

使用Mittelsten Scheid等描述的(Mol Gen Genet 224：325-330，1994)基于CTAB的方法分离基因组DNA，并与限制酶BamhI，HpaII，MspII，DraI，EcoRV，RcaI或HindIII一起孵育。使用RNAeasy试剂盒(Qiagen)根据厂商的说明获得总RNA。使用通过随机引发标记用³²P标记的DNA片段，在Church和Gilbert(Proc Natl Acad Sci USA 81：1991-1995，1984)描述的条件下进行Southern和Northern杂交分析。hpt基因的编码区、或由P35S启动子、hpt编码区和终止子区组成的DNA、或bar基因的编码区和1′启动子用作探针。

4个潮霉素抗性姊妹株的Northern杂交分析显示了hpt基因转录的恢复。所述姊妹株的Southern杂交分析表明在复合的hpt插入片段内部没有可检测的重排。通过用甲基化敏感限制酶HpaII和MspI的Southern杂交分析以及用硫酸氢盐处理后对启动子区进行基因组测序，可以叛定突变体中hpt转基因复合体象原始株系A中一样仍为高度甲基化的。与som突变中观察到的相反，该突变对重复基因组DNA的甲基化也没有影响。

潮霉素抗性植株和来自同一家族非选择的姊妹株生长产生种子，在下一代中检查Basta抗性，并通过Southern分析记录T-DNA插入片段的数目和大小。结果证明初始T-DNA转化体一定含有2个在姊妹株中独立分离的T-DNA插入片段。一个插入片段与潮霉素抗性突变体表型共分离。用该插入片段纯合并缺少另一个T-DNA插入片段的植株来克隆相应的T-DNA插入位点。

对突变表型的植株与含有携带多拷贝嵌合β-葡糖醛酸糖苷酶(gus)基因的转录沉默座位的拟南芥哥伦比亚生态型(ecotype Colombia)转基因植物株系GUS-TS(可获自Dr.H.Vauccheret，INRA，Versailles Cedex，法国)之间的杂种进行组织化学GUS染色，揭示了在mom等位基因纯合的F2代中沉默GUS基因的再活化。

moml突变表型的植株近交即使在近交第9代中也不导致任何形态学上的异常。这与som突变体相反。

由于在F1杂种中导入野生型MOM等位基因，mom1突变表型与株系A(见实施例1)的回交导致重新活化的hpt基因的立即再沉默。这也与som突变体相反。

表1：RCA培养基的组成

RCA培养基

MS macro 10× 100ml

B5 micro 1000× 1ml

柠檬酸铁 5ml

NT维生素100× 10ml

蔗糖 10g

MES 5ml

琼脂 10g

NAA 0.1mg

BAP 1mg

pH5.8(KOH)

加至1升

MS macro 10×

硝酸钾 19g硝酸铵 16.5g氯化钙(×2H₂O) 4.4g硫酸镁(×7H₂O) 3.7g磷酸二氢钾 1.7g加至1升B5 micro 1000×硫酸镁(×H₂O) 1000mg硼酸 300mg硫酸锌(×7H₂O) 200mg碘化钾 75mg钼酸钠(×2H₂O) 25mg硫酸铜(×5H₂O) 2.5mg氯化钴(×6H₂O) 2.5mg加至100ml柠檬酸铁柠檬酸铁铵 10g加至1升NT维生素100×肌醇 1000mg盐酸硫胺素 10mg加至1升MESMES 14gpH6(NaOH)加至100ml

实施例4：“沉默基因”的克隆

从仅含有与潮霉素抗性突变表型共分离的T-DNA的植株中分离基因组DNA。使用靠近T-DNA右边界指向外侧的3个特异性巢式引物(5′-CAT CTACGG CAA TGT ACC AGC-3′(SEQ ID NO：4)，5′-GAT GGG AAT TGG CTG AGTGGC-3′(SEQ ID NO：5)，5′-CAG TTC CAA ACG TAA AAC GGC-3′(SEQ ID NO：6))，和可能与旁侧植物DNA结合的几个简并性引物中的一个，对该DNA进行根据Liu等(Plant J 8：457-463，1995)的TAIL(热不对称交织)PCR。实际上下面7个简并性引物中的2个可导致特异性片段的扩增。AD1 5′-NTC GAS TWT SGW GTT-3′(Liu等，同上；SEQ ID NO：7)AD2 5′-NGT CGA SWG ANA WGA A-3′(Liu等，同上；SEQ ID NO：8)AD3 5′-WGT GNA GWA NCA NAG A-3′(Liu等，同上；SEQ ID NO：9)AD4 5′-WGG WAN CWG AWA NGC A-3′(SEQ ID NO：10)AD5 5′-WCG WWG AWC ANG NCG A-3′(SEQ ID NO：11)AD6 5′-WGC NAG TNA GWA NAA G-3′(SEQ ID NO：12)AD7 5′-AWG CAN GNC WGA NAT A-3′(SEQ ID NO：13)使用AD7获得的较大的片段被克隆和测序。它含有50bp的T-DNA和275bp的旁侧植物DNA。Southern杂交分析显示该PCR片段含有位于T-DNA旁侧的植物DNA。用该PCR片段筛选野生型拟南芥哥伦比亚生态型的基因组文库(Stratagene)。鉴定了三个与此PCR片段杂交的基因组克隆。这些基因组克隆进一步用限制酶作图，与PCR片段杂交并互相对比。在获得的其中一个基因组克隆(p4A-11)中，插入突变的T-DNA的旁侧序列大约位于基因组序列的中部。使用pA4-11的大约800bp的EcoRI-SalI片段来获得重叠的基因组克隆p5-6，并且使用p5-6的大约700bp的EcoRI片段来获得与p5-6重叠的基因组克隆p30-1。使用p30-1的大约700bp的HindIII片段来获得与p30-1重叠的基因组克隆p33-19。对所述克隆进行测序用来设计RT-PCR的引物。进一步使用p5-6的大约700bp的EcoRI片段来筛选根据Elledge等(Proc Natl Acad Sci USA 88：1737-1735，1991)的野生型拟南芥苏黎世生态型cDNA文库。得到了9个cDNA克隆，并测定了长度为2.6kb的最长克隆p17-8的序列。实施例5：序列分析和对比

考虑到上述克隆的鼠耳芥属沉默基因很大，由于克隆步骤产生的突变或由于测序反应的不确定性，不能完全排除该基因和蛋白真实的核苷酸和氨基酸序列可能与SEQ ID NO：1、SEQ ID NO：2和SEQ ID NO：3给出的序列在几个位置有偏差。另外，来自不同生态型的DNA序列可显示等位基因的不同。因此，SEQ ID NO：1、SEQ ID NO：2和SEQ ID NO：3代表了拟南芥苏黎世生态型的相应基因和蛋白，而从拟南芥哥伦比亚生态型获得的基因组序列显示在SEQ ID NO：1第4338位(A替代T)和6721位(T替代G)核苷酸的两处错配，其导致氨基酸残基K替代了SEQ ID NO：3第705位的M以及氨基酸残基D替代了SEQ ID NO：3第1219位的E。

顺序地从两端对2.6kb的cDNA克隆进行序列分析，结果显示其含有一个大的ORF和3′非翻译序列。

对基因组克隆的分析表明，克隆p4A-11和p5-6含有比cDNA序列的同源序列和7个内含子序列。比较基因组序列与T-DNA插入片段的旁侧DNA序列，表明T-DNA的插入引起大约2kb的基因组DNA的缺失。缺失的5′端位于一个内含子(内含子12)中，缺失的3′端位于cDNA 3′端的下游。此cDNA克隆的5′端序列在基因组克隆p5-6的中部终止。进行三个独立的巢式RT-PCR来获得更上游的另外的cDNA序列。这些RT-PCR使用的引物序列如下：

RT1-1 5′-CTGTACATACTGAGTACAATCGGA-3′ (SEQ ID NO：14)

RT1-2 5′-GCTTCAATTCCTGCCTCAGTTGAAC-3′ (SEQ ID NO：15)

RT1-3 5′-CTCTACGTGCTTAACATCATGCGA-3′ (SEQ ID NO：16)

RT1-4 5′-CCAGCTTCTGCTACTAGAAAGTCAG-3′ (SEQ ID NO：17)

RT2/3-1 5′-CTGGAGTTGCATGAAATCCTGGATG-3′ (SEQ ID NO：18)

RT2/3-2 5′-GCTCTTTGTAAGCTGTTCACGAGAC-3′ (SEQ ID NO：19)

RT2-3 5′-TCGCATGATGTTAAGCACGTAGAG-3′ (SEQ ID NO：20)

RT2-4 5′-GAGTACTGGTCCGTGAACAGGTAAT-3′ (SEQ ID NO：21)

RT3-3 5′-ATGCTTGCACAAGCATGGTCGGAAA-3′(SEQ ID NO：22)

RT3-4 5′-TGCAACATCGTGCATTTGCTCCAGA-3′(SEQ ID NO：23)

RT4-1 5′-CACAAGCATGAGTTTTTCCTTCCGG-3′(SEQ ID NO：24)

RT4-2 5′-CTGACTTTCTAGTAGCAGAAGCTGG-3′(SEQ ID NO：25)发现这些基因组克隆的几部分序列存放在鼠耳芥属数据库中(登录号B67281，B62563，B20434，B20425，B21274，B08967，B11993，B20116，B12496和B10852为BAC的末端序列，Z18494和AA597930为部分cDNA序列，1999年4月13日)。该编码蛋白序列与Swiss Protein数据库的比较揭示了其与SWI2/SNF2家族的ATP酶/解旋酶的部分相似性(SEQ IDNO：3的第479-719位的氨基酸)。该编码的蛋白由2001个氨基酸组成，并且计算的分子量为219kD，等电点为5.1。在该编码蛋白上发现了一个ATP/GTP-结合基元(SEQ ID NO：3的第460-467位的氨基酸)和三个核定位基元(SEQ ID NO：3的第362-367、832-838和858-862位氨基酸)。对HA-标签化的MOM蛋白的亚细胞免疫检测证实了其核定位。也检测到了与鸡张力蛋白的肌动蛋白结合域的相似性(SEQ ID NO：3的第1899-1941位的氨基酸)和预测的跨膜结构域(SEQ ID NO：3的第995-1015位的氨基酸)。另外，该编码蛋白含有基本由SEQ ID NO：3的第177-350、1462-1672和1848-1894位氨基酸限定的三种类型的重复区域或内部重复。实施例6：其它种属的同源基因

推定的显示与MOM蛋白有部分相似性的拟南芥富含脯氨酸/羟脯氨酸的糖蛋白公开为GenBank登录号AAD29829。基于该区域的相似性为34-47％，并且只能在MOM蛋白的后一半看到(即氨基酸1368-1944)。

使用MOM cDNA克隆通过Southern杂交分析来探测来自芜菁、番茄、烟草、玉米、小鼠、果蝇和人的基因组DNA中同源基因的存在。所有情况下都发现低严紧性条件下的杂交。可对来自文库的交叉杂交克隆进行鉴定和测序。

用MOM cDNA在严紧条件下筛选羽衣甘蓝(Brassica oleracea var.acephala)的基因组文库(获自Dr.Mark Cock，INRA，CNRS，里昂，法国)。得到两个阳性克隆，对其进行亚克隆并部分测序。克隆1的部分序列显示了与MOM基因中编码MOM蛋白的N端、ATP酶和C末端部分的不同区域的相似性(DNA水平为80-86％，氨基酸水平为62-80％)。克隆1中MOM的三个推定的核定位序列完全保守。克隆2的部分序列也显示了MOM基因的相似性区域(DNA水平为64-76％，氨基酸水平为55-64％)，其编码MOM蛋白的ATP酶、推定的跨膜区、和C末端部分。克隆1和2的序列不相同，提示在甘蓝(Brassia oleracea)中至少存在两个同源基因。获自克隆1和2的部分序列的实例在SEQ ID Nos：26-33中给出。

用MOM cDNA在严紧条件下又筛选了Brassia rapa的基因组文库(获自Dr.Kinya Toriyama，Tohoku University，Sendai，日本)。得到了与MOM cDNA的5′部分和3′部分杂交的阳性信号。

此外，用MOM cDNA在不太严紧的条件下筛选了碧冬茄(Petuniahybrida)的基因组文库(获逢Dr.Jan Kooter，Vrije Universiteit，Amsterdam，荷兰)。得到了与MOM cDNA的5′部分和3′部分杂交的阳性信号。

实施例7：通过反义结构操纵标记基因表达

2.6kb的cDNA片段以及第一次PCR使用引物RT1-1和RT1-2、第二次PCR使用引物RT1-3和RT1-4进行巢式RT-PCR扩增的1.8kb的RT-PCR片段都反向克隆到二元载体pbarbi53的多克隆位点以产生反义RNA。pbarbi53是p1′barbi的修饰载体，带有一个由花椰菜花叶病毒35S启动子、含有Xho I、SnaBI、Hpa I和Cla I限制位点的多克隆位点以及在pl′barbi HindIII位点的花椰菜花叶病毒35S终止子组成的表达盒。如实施例1所描述的将产生的重组质粒导入农杆菌属。拟南芥哥伦比亚生态型的转基因植株系GUS-TS(获自Dr.H.Vaucheret，INRA，Versailles，Cedex，法国)含有携带多拷贝嵌合β-葡糖醛酸糖苷酶(gus)基因的转录沉默座位，按实施例1的描述用此重组质粒转化该株系并按照Mengiste等(Plant J 12：945-948，1997)描述的方法选择转化体。在对照转化中使用pbarbi53载体DNA。通过组织化学染色来检查转化体gus基因的再活化。将一片子叶在gus染色溶液(100mM磷酸钠缓冲液(pH 7.0)，0.05％5-溴-4-氯-3-吲哚-β-D-葡糖醛酸糖苷酶，0.1％叠氮钠)中真空浸泡10分钟，然后在37℃孵育过夜。用带有2.6kb cDNA的重组质粒转化的植物可观察到强的gus活性，而用带有1.8kb RT-PCR片段的重组质粒或pbarbi53转化的植物没有显示高于背景的任何gus活性。因此，2.6kb cDNA的反义RNA的表达模拟了突变表型，并且证实SEQ ID NO：1、SEQ ID NO：2和SEQ ID NO：3中显示的序列代表了转录基因沉默系统成分的遗传信息。

序列表<110>Novartis AGNovartis Research Foundation<120>参与外遗传基因沉默的基因<130>S-31005A<140><141><150>GB 9914623.5<151>1999-06-23<160>33<170>PatentIn Ver.2.1<210>1<211>10329<212>DNA<213>拟南芥<220><221>内含子<222>(1009)..(1295)<220><221>内含子<222>(2551)..(2673)<220><221>内含子<222>(2753)..(2867)<220><221>内含子<222>(3114)..(3506)<220><221>内含子<222>(3681)..(3973)<220><221>内含子<222>(4896)..(4975)<220><221>内含子<222>(5218)..(5777)<220><221>内含子 <222>(5883)..(6082)<220><221>内含子<222>(7481)..(7615)<220><221>内含子<222>(7772)..(7914)<220><221>内含子<222>(8071)..(8153)<220><221>内含子<222>(8319)..(8451)<220><221>内含子<222>(8630)..(8718)<220><221>内含子<222>(8919)..(9000)<220><221>内含子<222>(9212)..(9284)<400>1aatatttaag tttggtttat attctttcta gtaatctttg aaatattgta agagataatg 60cttctaataa ataacattgg atttattgga attaatgtat tgaaaaaact atgcaaatac 120tacagtgtat tttggaacga ccaaaatgat atatgtaaac tttcgttcta gtcttctaca 180tagtgtaata ggatagcgga caaggttgat cgactctaaa cattatgggt acgtaattcc 240gcagtggtta cagtctactg tcgaggccaa actggtaatt aaacgtttga agtttagaga 300aatattttga tgatgagtac cacaatcaaa gatgataggt gttaatcact gtaaaaatgt 360tgattgaata ctacgaatgc agaacatata catattttta atctctttgg aatttttgtt 420tttgttttta tcatttttga atacacgaag agctcagtta tatttcatat tgtatatgaa 480tttgttctat ttaatcttca attctagcaa catactctta tgctaattcg tttcatattt 540tagtatagta taaaaattac aaatttcaaa acaaactata agtaatatac taacatagtc 600ggtgtaacat ttcgttaatt tcacataaca tatgttaatt acatatgtac actatttttg 660aagtatttta taacttaaaa tatataaatt taaatctaag aaatcacaag catgagtttt 720tccttccggt aatcgtaaaa tcaaaaatcg ctcgctcgag aaacgccggt gctagaagag 780gaaagtaccg tacataatcc tgcgaaccca attctcgtct tcttcaaact cagttttccg 840aaaccccaaa caccgcgagg attgcatggc ctgaagaacc acttaatcga gaattgtgct 900ggaattctca aattttccct cgcgtttttc tttcacactc tcggaatcgg aaatttccac 960caagctccgt caagcgatag attctgacaa ttacacactt tcgcgcaggt atgcttcctt 1020ccctgtttta ggttggtgtt aatctatcgg tgaatcgaag gttttgggcc tcgggctttg 1080cgttttaggt ttttcagaga atcttatcta cttggggatg gatcttaggc gtttgttaga 1140tgtaactcat tagttttgca tataggaatt ttgatttgaa agttaggtcg ccggatttgt 1200agacattttg tttgatggtc ttcttcggtg ctcacattct ttgtttttaa gtgcttgatt 1260tggttgctaa ggtcctttcc gttgcgtgct ctcagtgaat atgaagaaag atgaaaagat 1320tggtttgacg gggagaacca tttacaccag atccctagca gcttcaattc ctgcctcagt 1380tgaacaagaa acccctggtt tgaggaggtc aagccggggg acaccatcta cgaaggtaat 1440aactccagct tctgctacta gaaagtcaga gagactggct ccctcacctg cttcagtttc 1500aaaaaagtcc ggtggaatcg tcaagaattc cacaccaagt tctttgcgaa ggtccaatag 1560ggggaagact gaagtatcct tgcagagttc caaaggatca gataattcta tcaggaaagg 1620agatacttca ccggatattg agcagagaaa ggatagtgtt gaagagtcga cagataagat 1680caagcctata atgtcagccc gaagttacag ggcattgttt agagggaagc tcaaggaatc 1740tgaggcatta gttgatgctt ccccaaatga agaggaacta gtagttgttg gttgttctcg 1800ccgcatacct gcaggcaatg atgatgttca aggtaaaaca gattgtccac cacctgcaga 1860tgcaggatca aaaaggctgc cagttgacga aactagtttg gacaagggca ctgattttcc 1920tttgaaatca gttacggaga ccgagaagat agtgcttgat gcatccccca tagttgaaac 1980tggggatgac agtgttatag gttcaccatc tgagaattta gagacacaaa agcttcaaga 2040tggtaagaca gattgttcac cacctgcaaa tgcagaatcg aaaacgctgc cagttggtga 2100aactagttta gaaaaagaat atccacaaaa gtttcaagat gataacacag attgtctacc 2160acctgcaaat gcagaatcaa aaaggctgcc agttggcgaa actagtttag aaaaggacac 2220tgattttcct ttgaaatcaa ctacggagac tggaaagatg gttctttatg catcccccat 2280agttgaaact agggatgaca gcgttatatg ttcaccatct acaaatttag aaacccaaaa 2340gcttcttgtc agtaaaactg gcttagaaac cgacatagtt ttgcctttga aaagaaaaag 2400agacactgca gaaattgagc tggatgcatg tgctacagtt gcaaatggag atgatcacgt 2460tatgagttct gatggggtca ttccatctcc atctgggtgc aaaaatgata atcgacctga 2520aatgtgcaac acgtgtaaaa aacggcaaaa gtaagagttt ttttagtgtt gtctgtctat 2580tgaaacgatc tgccaatgtt gaatgttggg cagatgggtt tgattcttag gatatatgtt 2640ctgtattgta atgagttgtt caaaattttg aagggtcaac ggtgattgtc aaaataggag 2700tgtttgctcc tgcattgtcc agccagttga agaatctgat aacgtgacac aggttggttt 2760ctaattactt tcggagaccc gttaatcagt ggactcttaa atagttagat actagattta 2820cttatccttt tacttgtaat ctgcaattct attttgcatt tgattaggat atgaaagaaa 2880ctggaccagt tacgagcaga gaatatgagg agaacgggca aatacaacat ggtaaatcaa 2940gtgatcccaa attctattct tcggtgtacc cagagtattg ggttcctgtg cagctatcag 3000atgtacagct ggagcaatac tgtcagactc tcttctccaa atccttatct ctttcttcac 3060tttcgaagat tgatcttgga gctctagaag aaactctcaa ttctgtaaga aaagtaagtt 3120acttgatttt aaaaacactt attcttcaat gcacttgtga gttaagtacc cagttattac 3180tggtgataag ataaagaaag caatagaaaa attgataagg tgttcaccgc attgcagcca 3240aaaaaacaat tctgtgttcc atgctttcaa gaggttgtca cataggtgtt atgcctttct 3300gtttgatgtt tggtagagca aaggttttgg gtctatttgt tttatgcttt tttgaaacac 3360atagaacctg gcaaacttga cagttttggg gttgcttaga tatacgacta ttgtcggtca 3420gcatcacatt ttctcaaggc ctctttctgc atgttaatgt gtgaatatat taaaatcttc 3480tttatgtgtt tgcaacttgt tgacagacct gtgaccatcc atacgttatg gatgcatctt 3540tgaaacaact gctcaccaag aatctggagt tgcatgaaat cctggatgta gaaattaaag 3600cgagcgggaa acttcacctc cttgataaaa tgcttactca tataaaaaag aatggtttaa 3660aagcagttgt cttctaccag gtgcattttc tattacttgc gaatgtgaat agctctatgt 3720ttgtcatgaa tacgtcactt tgtgcattct caatatatgt gcattttctt tttgacaatg 3780gaattctgtc ttgtattgaa atttgagtgg gatgaaagta tgctttttat cgtgcaatta 3840tgaagtgtaa gttagccttc agcagtcagc tagcattatg agatatgctg aactaaaatg 3900tttcttttct cttctttctt tttcgttata tgtgcctcat gtatgtttga attacagttt 3960ttattttcag caggcaacac aaacccctga agggcttctg cttggtaata ttctcgaaga 4020ttttgtgggt caaagatttg gtccaaaatc ttatgagcat gggatatatt cctcaaagaa 4080gaactccgct ataaacaatt tcaacaagga gagtcaatgc tgtgttctgc tgttggaaac 4140acgtgcctgc agtcaaacca ttaaactctt gcgagctgat gcgtttattc tttttggaag 4200cagcttgaat ccatcgcatg atgttaagca cgtagagaag ataaaaatcg agtcatgttc 4260tgaaagaact aagatattcc gattgtactc agtatgtaca gttgaagaaa aagccctgat 4320tctggctagg caaaatatgc ggcaaaataa agctgtagag aacctaaacc gctctctcac 4380gcacgcactg ctcatgtggg gggcgtcata cttatttgat aaactggatc attttcacag 4440cagtgaaact ccagattcag gagtttcatt tgaacaatct attatggacg gcgtgattca 4500tgaattctcg tccatacttt cttccaaagg tggagaagaa aatgaagtca agctgtgtct 4560acttttggag gccaagcatg ctcagggaac ttacagcagt gattctactc tatttggtga 4620agaccatatt aagttgtcag atgaagagag tccaaatata ttttggtcaa agctgttggg 4680gggaaaaaat cctatgtgga aatacccttc agatactccc caaaggaatc gaaaacgagt 4740tcagtatttt gagggttctg aagcgagtcc caaaactggc gatggtggaa atgcaaagaa 4800gcgaaagaag gcttctgatg atgtcactga tccccgggtc actgatccgc cagtagatga 4860tgatgaaaga aaggcctctg ggaaggatca catgggtaaa atagtttaat ttctgctccg 4920atacctctag tgttcattga ttatgcaact actttgctga ctatctttcc tacaggggct 4980ttggagtcac caaaagtcat aacactccag tcatcatgta aatcttctgg tacagatggt 5040acattggatg gaaatgatgc ttttggcttg tattctatgg gcagccatat ctctggaatc 5100ccagaggata tgttagctag tcaagattgg gggaaaatac cggatgaatc acagaggagg 5160ctccacactg ttttaaagcc gaagatggca aaactttgcc aagttttgca tctttcagta 5220agtggccttt ttcacctcca caacttattt tagccttgca tatgcttata tatagctgat 5280tgcaactgta gttgttacct gatttcctgt tacagccaaa tgtgagagtt ttattcttca 5340actatatcca tccgtttaag catattttat ttcttatatc tggcttcgtt accaatgcac 5400tgttaaaatg agcaactgct gcacaaaaca gtaggtagtt atgtgcctca tgtcattcat 5460tgtttattga agcaaagaaa tttctgtcta ctttacatga tccatctgtg ggagtatata 5520actatatata accttaggcc tttgtacctg gctgatcaaa gacatgtcaa aagtttatct 5580gttcgctgtt ggtatagaaa ctaatacagt gtctgatgct attttaaggt agtcttatgt 5640cttcacatat tggctaatag atgtttccgc tgtcgtgtcc atatacttct gtgattatca 5700cggtgctccg tctatcaaaa ttgtactaaa aggtattttg caatgtgtga ttggttaaca 5760gattattttg ttttcaggat gcttgcacaa gcatggtcgg aaattttctc gaatatgtta 5820ttgaaaatca ccgaatctac gaagagccag ccactacttt tcaggcattc cagatagccc 5880tggtatgaca gcatttactt tgataattta tgcattgttt ccttcatcat ctgcctttgt 5940ttagaatgtc ctcagaaggc agcactcctt tagttttaac tttccaatca taggattcaa 6000atatccatta actggccttt gatcgctgca taatatatga atagttgaca tactgaatac 6060gttgttaata atgcattttc agagttggat tgcagccttg ttggtaaagc aaattcttag 6120ccacaaagaa tctctggtcc gtgcaaattc tgaattagct ttcaaatgct ctagagtaga 6180ggtggattat atttattcga tattgtcctg catgaagagt ctgttcctgg agcatacaca 6240aggtttgcag ttcgattgct ttggtactaa ttctaaacag tcagtggtta gcacaaaact 6300agtaaatgaa agtctctcag gggctacagt gcgtgacgaa aagattaata cgaagtcgat 6360gcgaaatagc tcagaggatg aagagtgcat gactgagaag agatgtagcc attatagcac 6420agcaacaaga gatatcgaaa agactattag tggcataaaa aagaaataca agaagcaagt 6480gcaaaagctt gtacaagagc atgaggaaaa gaaaatggag ctgttaaata tgtatgcaga 6540caagaagcag aaacttgaaa ctagtaaaag tgtggaagca gcagtaattc gtattacctg 6600ttcacggacc agtactcaag tgggtgatct caaactgctg gatcataatt atgaaagaaa 6660gtttgatgaa atcaaaagtg agaaaaatga atgcctcaaa agtctggagc aaatgcacga 6720ggttgcaaag aagaagttgg ctgaggatga agcctgttgg attaatcgga taaagagctg 6780ggcagctaaa ttaaaagttt gtgttcccat tcaaagtggc aataacaagc attttagtgg 6840ttcatcaaac atttcccaaa atgctcctga tgtacaaatt tgcaataatg ctaacgttga 6900agctacttac gctgatacga attgcatggc ttccaaggtt aatcaagtgc cagaagcaga 6960aaacacatta ggaaccatgt cgggtggcag cactcaacaa gttcatgaaa tggtggatgt 7020aagaaatgac gagacaatgg atgtctcagc tttgtctcgt gaacagctta caaagagcca 7080gtccaatgag cacgcttcta tcactgtgcc tgagattttg attcctgctg actgtcaaga 7140ggaatttgcg gccttgaacg tgcatttgtc agaagaccag aattgtgaca gaataacatc 7200tgcggcatca gatgaagatg tttcatcaag ggtgccagag gtatcccagt cactcgaaaa 7260tctttctgcc tcccccgagt tttctctaaa tagagaggag gctttggtta caacagaaaa 7320tagaagaaca agtcatgtgg gttttgatac tgataacatt ttggaccagc agaatagaga 7380agattgttct cttgaccaag agattcctga cgagttagcg atgcctgtgc aacatcttgc 7440gtctgtggta gagactaggg gtgctgctga atctgatcag gtacttactg gccctgtaga 7500atagttgatg ccttgttcat ttaatctttt ctaatgttca ttcttgcttt cttgaaaata 7560acgggtagtg atcagatgtc tttttttctc ttattaaatt cacttttctg gacagtatgg 7620tcaagatata tgtcctatgc cttcttcact ggctggaaag caacctgacc cagcagcaaa 7680cactgagagc gaaaatcttg aagaagcaat tgagcctcag tctgctggtt cagaaacagt 7740agagactact gattttgctg catcacatca ggtccctatt gaagactttc cttttttact 7800agtttaaagt tatcaatctg tgttatgttc attctaagtt tccgtgagaa aaaggtgggg 7860aaatgtggtt actgatcaag tctcgttgtt gttttaaatc gactcttttg acagggtgat 7920caagttacat gtcctttgct atcttcaccg actggaaatc agcctgcgcc agaagcaaat 7980attgaaggcc aaaatatcaa cacatcagct gagccccatg tagcgggtcc agatgcagta 8040gagagtggtg attatgcagt aatagatcag gttattgcct taactaaaga caaatgtctt 8100ttgttgttta aaagtcttac atctttgtaa tgctcgttct ggatatcctg caggaaacaa 8160tgggtgctca ggatgcatgc tctctgccat ctggatcggt tggaactcag tctgacctag 8220gagcaaacat tgagggtcaa aatgtcacaa cagtggctca acttcccaca gatggatcag 8280atgcagttgt aaccggtgga tctcctgtat cagatcaggt acctgcctct gctcaaggac 8340tttcttatgt gttggtttaa aggtctagtc cttagtaatg ttgaaactaa gcaaacagtg 8400gatagtgatc atatggttat ttttgcttgt gaatttaata tttctggaca gtgtgcccag 8460gatgcatctc ctatgccatt atcttcgcct ggaaatcacc ctgatacagc agttaatatc 8520gagggtttag ataacacatc agtagctgag cctcatataa gtggatcaga tgcatgtgaa 8580atggaaattt cagaacctgg tccccaagta gagcggtcaa cctttgcaag tcagtaactg 8640ccttgggcat ttttaagtat cacctaggtc gacatatgtg attgccaaac agctaacaag 8700gagatgcctt ttgtgcagat cttttccatg aaggtggcgt ggagcattca gcaggtgtaa 8760cagctcttgt tccatcactt cttaacaatg gtacggaaca gattgccgtt caacctgttc 8820ctcaaatacc tttccctgtg ttcaacgacc cgtttctgca tgaactggag aagttgcgga 8880gagaatcaga gaactcaaag aagacttttg aagaaaaagt cagtttccct cattacccag 8940ttacctcttg ttttggttta ttttctagct gcccattgac tctcagttgc ttgtgagcag 9000aaatcaatct tgaaagctga actcgagagg aagatggctg aagtacaagc agagtttcga 9060agaaaatttc atgaggtaga agccgagcat aacaccagaa cgacaaagat agagaaggat 9120aagaatcttg ttataatgaa caaactgttg gcgaatgcgt tcttgtccaa atgtactgac 9180aagaaggtat ctccctcagg agctccaagg ggtaagtgtc gaataatata gcaaattggt 9240tttaaaaata aggcgacgaa gtcataatag cactttttct ccaggtaaaa ttcagcagct 9300agcacagaga gcagcacaag tgagtgcact gagaaattac attgctcctc agcagcttca 9360ggcatcttct tttcctgctc ctgctctggt ttcggctcct ctgcaacttc agcaatcatc 9420atttcctgct cctggtccgg ctcctctgca gcctcaggca tcttcgtttc cttcttcagt 9480ctctcgtcca tcagcccttc ttctgaattt tgcggtctgt ccaatgcctc agcccagaca 9540gcctctcata tccaacatag ctccaactcc atcagttact cctgcaacaa atccaggtct 9600gcgttctcct gcaccacacc taaactcata tagaccatcc tcttcaactc ccgtcgccac 9660agctactcca acctcgtcag tgcctcctca agctttgaca tattcagctg tgtcaattca 9720gcagcagcaa gaacaacaac cgcaacagag cttgagcagt ggattgcaga gcaacaatga 9780agtggtttgt ctttctgacg acgagtgacc taagaggaga gatggttagg gtcttagtta 9840ttgattttta gagagttaat aatagtatat atatatatgt ataagtaggt tacctaatct 9900ctgtcgttaa tctaatttag tgagtcagga accgactcgt tggctaaggt ctctcctttt 9960gaaacgcaac gttctacttt catgtatata aatacagtct gatcacacaa cacaaattga 10020tgattgaaaa tactactgat ttaactttat agaaaaccca aattatagag cgacaacttt 10080ataaacatgt caaacttcga agttaaaatt taagacccca taattttaca attatagatt 10140ttaatactcc aactattttg tgatgttaaa agaagtatcc gagtcttttc tttccagttt 10200ccccaccgtc ccatgactcc cccagccagt agaaaaagcc aaaaaagtaa acaaaaagtc 10260gttaaaaaag ttaaattaaa aaaaaaatag atagttgacg tttactaaag tgatttgaat 10320tgaacaatt 10329<210>2<211>6571<212>DNA<213>拟南芥<220><221>CDS<222>(310)..(6312)<400>2cacaagcatg agtttttcct tccggtaatc gtaaaatcaa aaatcgctcg ctcgagaaac 60gccggtgcta gaagaggaaa gtaccgtaca taatcctgcg aacccaattc tcgtcttctt 120caaactcagt tttccgaaac cccaaacacc gcgaggattg catggcctga agaaccactt 180aatcgagaat tgtgctggaa ttctcaaatt ttccctcgcg tttttctttc acactctcgg 240aatcggaaat ttccaccaag ctccgtcaag cgatagattc tgacaattac acactttcgc 300gcagtgaat atg aag aaa gat gaa aag att ggt ttg acg ggg aga acc att 351

Met Lys Lys Asp Glu Lys Ile Gly Leu Thr Gly Arg Thr Ile

1 5 10tac acc aga tcc cta gca gct tca att cct gcc tca gtt gaa caa gaa 399Tyr Thr Arg Ser Leu Ala Ala Ser Ile Pro Ala Ser Val Glu Gln Glu15 20 25 30acc cct ggt ttg agg agg tca agc cgg ggg aca cca tct acg aag gta 447Thr Pro Gly Leu Arg Arg Ser Ser Arg Gly Thr Pro Ser Thr Lys Val

35 40 45ata act cca gct tct gct act aga aag tca gag aga ctg gct ccc tca 495Ile Thr Pro Ala Ser Ala Thr Arg Lys Ser Glu Arg Leu Ala Pro Ser

50 55 60cct gct tca gtt tca aaa aag tcc ggt gga atc gtc aag aat tcc aca 543Pro Ala Ser Val Ser Lys Lys Ser Gly Gly Ile Val Lys Asn Ser Thr

65 70 75cca agt tct ttg cga agg tcc aat agg ggg aag act gaa gta tcc ttg 591Pro Ser Ser Leu Arg Arg Ser Asn Arg Gly Lys Thr Glu Val Ser Leu

80 85 90cag agt tcc aaa gga tca gat aat tct atc agg aaa gga gat act tca 639Gln Ser Ser Lys Gly Ser Asp Asn Ser Ile Arg Lys Gly Asp Thr Ser95 100 105 110ccg gat att gag cag aga aag gat agt gtt gaa gag tcg aca gat aag 687Pro Asp Ile Glu Gln Arg Lys Asp Ser Val Glu Glu Ser Thr Asp Lys

115 120 125atc aag cct ata atg tca gcc cga agt tac agg gca ttg ttt aga ggg 735Ile Lys Pro Ile Met Ser Ala Arg Ser Tyr Arg Ala Leu Phe Arg Gly

130 135 140aag ctc aag gaa tct gag gca tta gtt gat gct tcc cca aat gaa gag 783Lys Leu Lys Glu Ser Glu Ala Leu Val Asp Ala Ser Pro Asn Glu Glu

145 150 155gaa cta gta gtt gtt ggt tgt tct cgc cgc ata cct gca ggc aat gat 831Glu Leu Val Val Val Gly Cys Ser Arg Arg Ile Pro Ala Gly Asn Asp

160 165 170gat gtt caa ggt aaa aca gat tgt cca cca cct gca gat gca gga tca 879Asp Val Gln Gly Lys Thr Asp Cys Pro Pro Pro Ala Asp Ala Gly Ser175 180 185 190aaa agg ctg cca gtt gac gaa act agt ttg gac aag ggc act gat ttt 927Lys Arg Leu Pro Val Asp Glu Thr Ser Leu Asp Lys Gly Thr Asp Phe

195 200 205cct ttg aaa tca gtt acg gag acc gag aag ata gtg ctt gat gca tcc 975Pro Leu Lys Ser Val Thr Glu Thr Glu Lys Ile Val Leu Asp Ala Ser

210 215 220ccc ata gtt gaa act ggg gat gac agt gtt ata ggt tca cca tct gag 1023Pro Ile Val Glu Thr Gly Asp Asp Ser Val Ile Gly Ser Pro Ser Glu

225 230 235aat tta gag aca caa aag ctt caa gat ggt aag aca gat tgt tca cca 1071Asn Leu Glu Thr Gln Lys Leu Gln Asp Gly Lys Thr Asp Cys Ser Pro

240 245 250cct gca aat gca gaa tcg aaa acg ctg cca gtt ggt gaa act agt tta 1119Pro Ala Asn Ala Glu Ser Lys Thr Leu Pro Val Gly Glu Thr Ser Leu255 260 265 270gaa aaa gaa tat cca caa aag ttt caa gat gat aac aca gat tgt cta 1167Glu Lys Glu Tyr Pro Gln Lys Phe Gln Asp Asp Asn Thr Asp Cys Leu

275 280 285cca cct gca aat gca gaa tca aaa agg ctg cca gtt ggc gaa act agt 1215Pro Pro Ala Asn Ala Glu Ser Lys Arg Leu Pro Val Gly Glu Thr Ser

290 295 300tta gaa aag gac act gat ttt cct ttg aaa tca act acg gag act gga 1263Leu Glu Lys Asp Thr Asp Phe Pro Leu Lys Ser Thr Thr Glu Thr Gly

305 310 315aag atg gtt ctt tat gca tcc ccc ata gtt gaa act agg gat gac agc 1311Lys Met Val Leu Tyr Ala Ser Pro Ile Val Glu Thr Arg Asp Asp Ser

320 325 330gtt ata tgt tca cca tct aca aat tta gaa acc caa aag ctt ctt gtc 1359Val Ile Cys Ser Pro Ser Thr Asn Leu Glu Thr Gln Lys Leu Leu Val335 340 345 350agt aaa act ggc tta gaa acc gac ata gtt ttg cct ttg aaa aga aaa 1407Ser Lys Thr Gly Leu Glu Thr Asp Ile Val Leu Pro Leu Lys Arg Lys

355 360 365aga gac act gca gaa att gag ctg gat gca tgt gct aca gtt gca aat 1455Arg Asp Thr Ala Glu Ile Glu Leu Asp Ala Cys Ala Thr Val Ala Asn

370 375 380gga gat gat cac gtt atg agt tct gat ggg gtc att cca tct cca tct 1503Gly Asp Asp His Val Met Ser Ser Asp Gly Val Ile Pro Ser Pro Ser

385 390 395ggg tgc aaa aat gat aat cga cct gaa atg tgc aac acg tgt aaa aaa 1551Gly Cys Lys Asn Asp Asn Arg Pro Glu Met Cys Asn Thr Cys Lys Lys

400 405 410cgg caa aag gtc aac ggt gat tgt caa aat agg agt gtt tgc tcc tgc 1599Arg Gln Lys Val Asn Gly Asp Cys Gln Asn Arg Ser Val Cys Ser Cys415 420 425 430att gtc cag cca gtt gaa gaa tct gat aac gtg aca cag gat atg aaa 1647Ile Val Gln Pro Val Glu Glu Ser Asp Asn Val Thr Gln Asp Met Lys

435 440 445gaa act gga cca gtt acg agc aga gaa tat gag gag aac ggg caa ata 1695Glu Thr Gly Pro Val Thr Ser Arg Glu Tyr Glu Glu Asn Gly Gln Ile

450 455 460caa cat ggt aaa tca agt gat ccc aaa ttc tat tct tcg gtg tac cca 1743Gln His Gly Lys Ser Ser Asp Pro Lys Phe Tyr Ser Ser Val Tyr Pro

465 470 475gag tat tgg gtt cct gtg cag cta tca gat gta cag ctg gag caa tac 1791Glu Tyr Trp Val Pro Val Gln Leu Ser Asp Val Gln Leu Glu Gln Tyr

480 485 490tgt cag act ctc ttc tcc aaa tcc tta tct ctt tct tca ctt tcg aag 1839Cys Gln Thr Leu Phe Ser Lys Ser Leu Ser Leu Ser Ser Leu Ser Lys495 500 505 510att gat ctt gga gct cta gaa gaa act ctc aat tct gta aga aaa acc 1887Ile Asp Leu Gly Ala Leu Glu Glu Thr Leu Asn Ser Val Arg Lys Thr

515 520 525tgt gac cat cca tac gtt atg gat gca tct ttg aaa caa ctg ctc acc 1935Cys Asp His Pro Tyr Val Met Asp Ala Ser Leu Lys Gln Leu Leu Thr

530 535 540aag aat ctg gag ttg cat gaa atc ctg gat gta gaa att aaa gcg agc 1983Lys Asn Leu Glu Leu His Glu Ile Leu Asp Val Glu Ile Lys Ala Ser

545 550 555ggg aaa ctt cac ctc ctt gat aaa atg ctt act cat ata aaa aag aat 2031Gly Lys Leu His Leu Leu Asp Lys Met Leu Thr His Ile Lys Lys Asn

560 565 570ggt tta aaa gca gtt gtc ttc tac cag gca aca caa acc cct gaa ggg 2079Gly Leu Lys Ala Val Val Phe Tyr Gln Ala Thr Gln Thr Pro Glu Gly575 580 585 590ctt ctg ctt ggt aat att ctc gaa gat ttt gtg ggt caa aga ttt ggt 2127Leu Leu Leu Gly Asn Ile Leu Glu Asp Phe Val Gly Gln Arg Phe Gly

595 600 605cca aaa tct tat gag cat ggg ata tat tcc tca aag aag aac tcc gct 2175Pro Lys Ser Tyr Glu His Gly Ile Tyr Ser Ser Lys Lys Asn Ser Ala

610 615 620ata aac aat ttc aac aag gag agt caa tgc tgt gtt ctg ctg ttg gaa 2223Ile Asn Asn Phe Asn Lys Glu Ser Gln Cys Cys Val Leu Leu Leu Glu

625 630 635aca cgt gcc tgc agt caa acc att aaa ctc ttg cga gct gat gcg ttt 2271Thr Arg Ala Cys Ser Gln Thr Ile Lys Leu Leu Arg Ala Asp Ala Phe

640 645 650att ctt ttt gga agc agc ttg aat cca tcg cat gat gtt aag cac gta 2319Ile Leu Phe Gly Ser Ser Leu Asn Pro Ser His Asp Val Lys His Val655 660 665 670gag aag ata aaa atc gag tca tgt tct gaa aga act aag ata ttc cga 2367Glu Lys Ile Lys Ile Glu Ser Cys Ser Glu Arg Thr Lys Ile Phe Arg

675 680 685ttg tac tca gta tgt aca gtt gaa gaa aaa gcc ctg att ctg gct agg 2415Leu Tyr Ser Val Cys Thr Val Glu Glu Lys Ala Leu Ile Leu Ala Arg

690 695 700caa aat atg cgg caa aat aaa gct gta gag aac cta aac cgc tct ctc 2463Gln Asn Met Arg Gln Asn Lys Ala Val Glu Asn Leu Asn Arg Ser Leu

705 710 715acg cac gca ctg ctc atg tgg ggg gcg tca tac tta ttt gat aaa ctg 2511Thr His Ala Leu Leu Met Trp Gly Ala Ser Tyr Leu Phe Asp Lys Leu

720 725 730gat cat ttt cac agc agt gaa act cca gat tca gga gtt tca ttt gaa 2559Asp His Phe His Ser Ser Glu Thr Pro Asp Ser Gly Val Ser Phe Glu735 740 745 750caa tct att atg gac ggc gtg att cat gaa ttc tcg tcc ata ctt tct 2607Gln Ser Ile Met Asp Gly Val Ile His Glu Phe Ser Ser Ile Leu Ser

755 760 765tcc aaa ggt gga gaa gaa aat gaa gtc aag ctg tgt cta ctt ttg gag 2655Ser Lys Gly Gly Glu Glu Asn Glu Val Lys Leu Cys Leu Leu Leu Glu

770 775 780gcc aag cat gct cag gga act tac agc agt gat tct act cta ttt ggt 2703Ala Lys His Ala Gln Gly Thr Tyr Ser Ser Asp Ser Thr Leu Phe Gly

785 790 795gaa gac cat att aag ttg tca gat gaa gag agt cca aat ata ttt tgg 2751Glu Asp His Ile Lys Leu Ser Asp Glu Glu Ser Pro Asn Ile Phe Trp

800 805 810tca aag ctg ttg ggg gga aaa aat cct atg tgg aaa tac cct tca gat 2799Ser Lys Leu Leu Gly Gly Lys Asn Pro Met Trp Lys Tyr Pro Ser Asp815 820 825 830act ccc caa agg aat cga aaa cga gtt cag tat ttt gag ggt tct gaa 2847Thr Pro Gln Arg Asn Arg Lys Arg Val Gln Tyr Phe Glu Gly Ser Glu

835 840 845gcg agt ccc aaa act ggc gat ggt gga aat gca aag aag cga aag aag 2895Ala Ser Pro Lys Thr Gly Asp Gly Gly Asn Ala Lys Lys Arg Lys Lys

850 855 860gct tct gat gat gtc act gat ccc cgg gtc act gat ccg cca gta gat 2943Ala Ser Asp Asp Val Thr Asp Pro Arg Val Thr Asp Pro Pro Val Asp

865 870 875gat gat gaa aga aag gcc tct ggg aag gat cac atg ggg gct ttg gag 2991Asp Asp Glu Arg Lys Ala Ser Gly Lys Asp His Met Gly Ala Leu Glu

880 885 890tca cca aaa gtc ata aca ctc cag tca tca tgt aaa tct tct ggt aca 3039Ser Pro Lys Val Ile Thr Leu Gln Ser Ser Cys Lys Ser Ser Gly Thr895 900 905 910gat ggt aca ttg gat gga aat gat gct ttt ggc ttg tat tct atg ggc 3087Asp Gly Thr Leu Asp Gly Asn Asp Ala Phe Gly Leu Tyr Ser Met Gly

915 920 925agc cat atc tct gga atc cca gag gat atg tta gct agt caa gat tgg 3135Ser His Ile Ser Gly Ile Pro Glu Asp Met Leu Ala Ser Gln Asp Trp

930 935 940ggg aaa ata ccg gat gaa tca cag agg agg ctc cac act gtt tta aag 3183Gly Lys Ile Pro Asp Glu Ser Gln Arg Arg Leu His Thr Val Leu Lys

945 950 955ccg aag atg gca aaa ctt tgc caa gtt ttg cat ctt tca gat gct tgc 3231Pro Lys Met Ala Lys Leu Cys Gln Val Leu His Leu Ser Asp Ala Cys

960 965 970aca agc atg gtc gga aat ttt ctc gaa tat gtt att gaa aat cac cga 3279Thr Ser Met Val Gly Asn Phe Leu Glu Tyr Val Ile Glu Asn His Arg975 980 985 990atc tac gaa gag cca gcc act act ttt cag gca ttc cag ata gcc ctg 3327Ile Tyr Glu Glu Pro Ala Thr Thr Phe Gln Ala Phe Gln Ile Ala Leu

995 1000 1005agt tgg att gca gcc ttg ttg gta aag caa att ctt agc cac aaa gaa 3375Ser Trp Ile Ala Ala Leu Leu Val Lys Gln Ile Leu Ser His Lys Glu

1010 1015 1020tct ctg gtc cgt gca aat tct gaa tta gct ttc aaa tgc tct aga gta 3423Ser Leu Val Arg Ala Asn Ser Glu Leu Ala Phe Lys Cys Ser Arg Val

1025 1030 1035gag gtg gat tat att tat tcg ata ttg tcc tgc atg aag agt ctg ttc 3471Glu Val Asp Tyr Ile Tyr Ser Ile Leu Ser Cys Met Lys Ser Leu Phe1040 1045 1050ctg gag cat aca caa ggt ttg cag ttc gat tgc ttt ggt act aat tct 3519Leu Glu His Thr Gln Gly Leu Gln Phe Asp Cys Phe Gly Thr Asn Ser1055 1060 1065 1070aaa cag tca gtg gtt agc aca aaa cta gta aat gaa agt ctc tca ggg 3567Lys Gln Ser Val Val Ser Thr Lys Leu Val Asn Glu Ser Leu Ser Gly

1075 1080 1085gct aca gtg cgt gac gaa aag att aat acg aag tcg atg cga aat agc 3615Ala Thr Val Arg Asp Glu Lys Ile Asn Thr Lys Ser Met Arg Asn Ser

1090 1095 1100tca gag gat gaa gag tgc atg act gag aag aga tgt agc cat tat agc 3663Ser Glu Asp Glu Glu Cys Met Thr Glu Lys Arg Cys Ser His Tyr Ser

1105 1110 1115aca gca aca aga gat atc gaa aag act att agt ggc ata aaa aag aaa 3711Thr Ala Thr Arg Asp Ile Glu Lys Thr Ile Ser Gly Ile Lys Lys Lys1120 1125 1130tac aag aag caa gtg caa aag ctt gta caa gag cat gag gaa aag aaa 3759Tyr Lys Lys Gln Val Gln Lys Leu Val Gln Glu His Glu Glu Lys Lys1135 1140 1145 1150atg gag ctg tta aat atg tat gca gac aag aag cag aaa ctt gaa act 3807Met Glu Leu Leu Asn Met Tyr Ala Asp Lys Lys Gln Lys Leu Glu Thr

1155 1160 1165agt aaa agt gtg gaa gca gca gta att cgt att acc tgt tca cgg acc 3855Ser Lys Ser Val Glu Ala Ala Val Ile Arg Ile Thr Cys Ser Arg Thr

1170 1175 1180agt act caa gtg ggt gat ctc aaa ctg ctg gat cat aat tat gaa aga 3903Ser Thr Gln Val Gly Asp Leu Lys Leu Leu Asp His Asn Tyr Glu Arg

1185 1190 1195aag ttt gat gaa atc aaa agt gag aaa aat gaa tgc ctc aaa agt ctg 3951Lys Phe Asp Glu Ile Lys Ser Glu Lys Asn Glu Cys Leu Lys Ser Leu1200 1205 1210gag caa atg cac gag gtt gca aag aag aag ttg gct gag gat gaa gcc 3999Glu Gln Met His Glu Val Ala Lys Lys Lys Leu Ala Glu Asp Glu Ala1215 1220 1225 1230tgt tgg att aat cgg ata aag agc tgg gca gct aaa tta aaa gtt tgt 4047Cys Trp Ile Asn Arg Ile Lys Ser Trp Ala Ala Lys Leu Lys Val Cys

1235 1240 1245gtt ccc att caa agt ggc aat aac aag cat ttt agt ggt tca tca aac 4095Val Pro Ile Gln Ser Gly Asn Asn Lys His Phe Ser Gly Ser Ser Asn

1250 1255 1260att tcc caa aat gct cct gat gta caa att tgc aat aat gct aac gtt 4143Ile Ser Gln Asn Ala Pro Asp Val Gln Ile Cys Asn Asn Ala Asn Val

1265 1270 1275gaa gct act tac gct gat acg aat tgc atg gct tcc aag gtt aat caa 4191Glu Ala Thr Tyr Ala Asp Thr Asn Cys Met Ala Ser Lys Val Asn Gln1280 1285 1290gtg cca gaa gca gaa aac aca tta gga acc atg tcg ggt ggc agc act 4239Val Pro Glu Ala Glu Asn Thr Leu Gly Thr Met Ser Gly Gly Ser Thr1295 1300 1305 1310caa caa gtt cat gaa atg gtg gat gta aga aat gac gag aca atg gat 4287Gln Gln Val His Glu Met Val Asp Val Arg Asn Asp Glu Thr Met Asp

1315 1320 1325gtc tca gct ttg tct cgt gaa cag ctt aca aag agc cag tcc aat gag 4335Val Ser Ala Leu Ser Arg Glu Gln Leu Thr Lys Ser Gln Ser Asn Glu

1330 1335 1340cac gct tct atc act gtg cct gag att ttg att cct gct gac tgt caa 4383His Ala Ser Ile Thr Val Pro Glu Ile Leu Ile Pro Ala Asp Cys Gln

1345 1350 1355gag gaa ttt gcg gcc ttg aac gtg cat ttg tca gaa gac cag aat tgt 4431Glu Glu Phe Ala Ala Leu Asn Val His Leu Ser Glu Asp Gln Asn Cys1360 1365 1370gac aga ata aca tct gcg gca tca gat gaa gat gtt tca tca agg gtg 4479Asp Arg Ile Thr Ser Ala Ala Ser Asp Glu Asp Val Ser Ser Arg Val1375 1380 1385 1390cca gag gta tcc cag tca ctc gaa aat ctt tct gcc tcc ccc gag ttt 4527Pro Glu Val Ser Gln Ser Leu Glu Asn Leu Ser Ala Ser Pro Glu Phe

1395 1400 1405tct cta aat aga gag gag gct ttg gtt aca aca gaa aat aga aga aca 4575Ser Leu Asn Arg Glu Glu Ala Leu Val Thr Thr Glu Asn Arg Arg Thr

1410 1415 1420agt cat gtg ggt ttt gat act gat aac att ttg gac cag cag aat aga 4623Ser His Val Gly Phe Asp Thr Asp Asn Ile Leu Asp Gln Gln Asn Arg

1425 1430 1435gaa gat tgt tct ctt gac caa gag att cct gac gag tta gcg atg cct 4671Glu Asp Cys Ser Leu Asp Gln Glu Ile Pro Asp Glu Leu Ala Met Pro1440 1445 1450gtg caa cat ctt gcg tct gtg gta gag act agg ggt gct gct gaa tct 4719Val Gln His Leu Ala Ser Val Val Glu Thr Arg Gly Ala Ala Glu Ser1455 1460 1465 1470gat cag tat ggt caa gat ata tgt cct atg cct tct tca ctg gct gga 4767Asp Gln Tyr Gly Gln Asp Ile Cys Pro Met Pro Ser Ser Leu Ala Gly

1475 1480 1485aag caa cct gac cca gca gca aac act gag agc gaa aat ctt gaa gaa 4815Lys Gln Pro Asp Pro Ala Ala Asn Thr Glu Ser Glu Asn Leu Glu Glu

1490 1495 1500gca att gag cct cag tct gct ggt tca gaa aca gta gag act act gat 4863Ala Ile Glu Pro Gln Ser Ala Gly Ser Glu Thr Val Glu Thr Thr Asp

1505 1510 1515ttt gct gca tca cat cag ggt gat caa gtt aca tgt cct ttg cta tct 4911Phe Ala Ala Ser His Gln Gly Asp Gln Val Thr Cys Pro Leu Leu Ser1520 1525 1530tca ccg act gga aat cag cct gcg cca gaa gca aat att gaa ggc caa 4959Ser Pro Thr Gly Asn Gln Pro Ala Pro Glu Ala Asn Ile Glu Gly Gln1535 1540 1545 1550aat atc aac aca tca gct gag ccc cat gta gcg ggt cca gat gca gta 5007Asn Ile Asn Thr Ser Ala Glu Pro His Val Ala Gly Pro Asp Ala Val

1555 1560 1565gag agt ggt gat tat gca gta ata gat cag gaa aca atg ggt gct cag 5055Glu Ser Gly Asp Tyr Ala Val Ile Asp Gln Glu Thr Met Gly Ala Gln

1570 1575 1580gat gca tgc tct ctg cca tct gga tcg gtt gga act cag tct gac cta 5103Asp Ala Cys Ser Leu Pro Ser Gly Ser Val Gly Thr Gln Ser Asp Leu

1585 1590 1595gga gca aac att gag ggt caa aat gtc aca aca gtg gct caa ctt ccc 5151Gly Ala Asn Ile Glu Gly Gln Asn Val Thr Thr Val Ala Gln Leu Pro1600 1605 1610aca gat gga tca gat gca gtt gta acc ggt gga tct cct gta tca gat 5199Thr Asp Gly Ser Asp Ala Val Val Thr Gly Gly Ser Pro Val Ser Asp1615 1620 1625 1630cag tgt gcc cag gat gca tct cct atg cca tta tct tcg cct gga aat 5247Gln Cys Ala Gln Asp Ala Ser Pro Met Pro Leu Ser Ser Pro Gly Asn

1635 1640 1645cac cct gat aca gca gtt aat atc gag ggt tta gat aac aca tca gta 5295His Pro Asp Thr Ala Val Asn Ile Glu Gly Leu Asp Asn Thr Set Val

1650 1655 1660gct gag cct cat ata agt gga tca gat gca tgt gaa atg gaa att tca 5343Ala Glu Pro His Ile Ser Gly Ser Asp Ala Cys Glu Met Glu Ile Ser

1665 1670 1675gaa cct ggt ccc caa gta gag cgg tca acc ttt gca aat ctt ttc cat 5391Glu Pro Gly Pro Gln Val Glu Arg Ser Thr Phe Ala Asn Leu Phe His1680 1685 1690gaa ggt ggc gtg gag cat tca gca ggt gta aca gct ctt gtt cca tca 5439Glu Gly Gly Val Glu His Ser Ala Gly Val Thr Ala Leu Val Pro Ser1695 1700 1705 1710ctt ctt aac aat ggt acg gaa cag att gcc gtt caa cct gtt cct caa 5487Leu Leu Asn Asn Gly Thr Glu Gln Ile Ala Val Gln Pro Val Pro Gln

1715 1720 1725ata cct ttc cct gtg ttc aac gac ccg ttt ctg cat gaa ctg gag aag 5535Ile Pro Phe Pro Val Phe Asn Asp Pro Phe Leu His Glu Leu Glu Lys

1730 1735 1740ttg cgg aga gaa tca gag aac tca aag aag act ttt gaa gaa aaa aaa 5583Leu Arg Arg Glu Ser Glu Asn Ser Lys Lys Thr Phe Glu Glu Lys Lys

1745 1750 1755tca atc ttg aaa gct gaa ctc gag agg aag atg gct gaa gta caa gca 5631Ser Ile Leu Lys Ala Glu Leu Glu Arg Lys Met Ala Glu Val Gln Ala1760 1765 1770gag ttt cga aga aaa ttt cat gag gta gaa gcc gag cat aac acc aga 5679Glu Phe Arg Arg Lys Phe His Glu Val Glu Ala Glu His Asn Thr Arg1775 1780 1785 1790acg aca aag ata gag aag gat aag aat ctt gtt ata atg aac aaa ctg 5727Thr Thr Lys Ile Glu Lys Asp Lys Asn Leu Val Ile Met Asn Lys Leu

1795 1800 1805ttg gcg aat gcg ttc ttg tcc aaa tgt act gac aag aag gta tct ccc 5775Leu Ala Asn Ala Phe Leu Ser Lys Cys Thr Asp Lys Lys Val Ser Pro

1810 1815 1820tca gga gct cca agg ggt aaa att cag cag cta gca cag aga gca gca 5823Ser Gly Ala Pro Arg Gly Lys Ile Gln Gln Leu Ala Gln Arg Ala Ala

1825 1830 1835caa gtg agt gca ctg aga aat tac att gct cct cag cag ctt cag gca 5871Gln Val Ser Ala Leu Arg Asn Tyr Ile Ala Pro Gln Gln Leu Gln Ala1840 1845 1850tct tct ttt cct gct cct gct ctg gtt tcg gct cct ctg caa ctt cag 5919Ser Ser Phe Pro Ala Pro Ala Leu Val Ser Ala Pro Leu Gln Leu Gln1855 1860 1865 1870caa tca tca ttt cct gct cct ggt ccg gct cct ctg cag cct cag gca 5967Gln Ser Ser Phe Pro Ala Pro Gly Pro Ala Pro Leu Gln Pro Gln Ala

1875 1880 1885tct tcg ttt cct tct tca gtc tct cgt cca tca gcc ctt ctt ctg aat 6015Ser Ser Phe Pro Ser Ser Val Ser Arg Pro Ser Ala Leu Leu Leu Asn

1890 1895 1900ttt gcg gtc tgt cca atg cct cag ccc aga cag cct ctc ata tcc aac 6063Phe Ala Val Cys Pro Met Pro Gln Pro Arg Gln Pro Leu Ile Ser Asn

1905 1910 1915ata gct cca act cca tca gtt act cct gca aca aat cca ggt ctg cgt 6111Ile Ala Pro Thr Pro Ser Val Thr Pro Ala Thr Asn Pro Gly Leu Arg1920 1925 1930tct cct gca cca cac cta aac tca tat aga cca tcc tct tca act ccc 6159Ser Pro Ala Pro His Leu Asn Ser Tyr Arg Pro Ser Ser Ser Thr Pro1935 1940 1945 1950gtc gcc aca gct act cca acc tcg tca gtg cct cct caa gct ttg aca 6207Val Ala Thr Ala Thr Pro Thr Ser Ser Val Pro Pro Gln Ala Leu Thr

1955 1960 1965tat tca gct gtg tca att cag cag cag caa gaa caa caa ccg caa cag 6255Tyr Ser Ala Val Ser Ile Gln Gln Gln Gln Glu Gln Gln Pro Gln Gln

1970 1975 1980agc ttg agc agt gga ttg cag agc aac aat gaa gtg gtt tgt ctt tct 6303Ser Leu Ser Ser Gly Leu Gln Ser Asn Asn Glu Val Val Cys Leu Ser

1985 1990 1995gac gac gag tgacctaaga ggagagatgg ttagggtctt agttattgat 6352Asp Asp Glu2000ttttagagag ttaataatag tatatatata tatgtataag taggttacct aatctctgtc 6412gttaatctaa tttagtgagt caggaaccga ctcgttggct aaggtctctc cttttgaaac 6472gcaacgttct actttcatgt atataaatac agtctgatca cacaacacaa attgatgatt 6532gaaaatacta ctgatttaac ttaaaaaaaa aaaaaaaaa 6571<210>3<211>2001<212>PRT<213>拟南芥<400>3Met Lys Lys Asp Glu Lys Ile Gly Leu Thr Gly Arg Thr Ile Tyr Thr1 5 10 15Arg Ser Leu Ala Ala Ser Ile Pro Ala Ser Val Glu Gln Glu Thr Pro

20 25 30Gly Leu Arg Arg Ser Ser Arg Gly Thr Pro Ser Thr Lys Val Ile Thr

35 40 45Pro Ala Ser Ala Thr Arg Lys Ser Glu Arg Leu Ala Pro Ser Pro Ala

50 55 60Ser Val Ser Lys Lys Ser Gly Gly Ile Val Lys Asn Ser Thr Pro Ser65 70 75 80Ser Leu Arg Arg Ser Asn Arg Gly Lys Thr Glu Val Ser Leu Gln Ser

85 90 95Ser Lys Gly Ser Asp Asn Ser Ile Arg Lys Gly Asp Thr Ser Pro Asp

100 105 110Ile Glu Gln Arg Lys Asp Ser Val Glu Glu Ser Thr Asp Lys Ile Lys

115 120 125Pro Ile Met Ser Ala Arg Ser Tyr Arg Ala Leu Phe Arg Gly Lys Leu

130 135 140Lys Glu Ser Glu Ala Leu Val Asp Ala Ser Pro Asn Glu Glu Glu Leu145 150 155 160Val Val Val Gly Cys Ser Arg Arg Ile Pro Ala Gly Asn Asp Asp Val

165 170 175Gln Gly Lys Thr Asp Cys Pro Pro Pro Ala Asp Ala Gly Ser Lys Arg

180 185 190Leu Pro Val Asp Glu Thr Ser Leu Asp Lys Gly Thr Asp Phe Pro Leu

195 200 205Lys Ser Val Thr Glu Thr Glu Lys Ile Val Leu Asp Ala Ser Pro Ile

210 215 220Val Glu Thr Gly Asp Asp Ser Val Ile Gly Ser Pro Ser Glu Asn Leu225 230 235 240Glu Thr Gln Lys Leu Gln Asp Gly Lys Thr Asp Cys Ser Pro Pro Ala

245 250 255Asn Ala Glu Ser Lys Thr Leu Pro Val Gly Glu Thr Ser Leu Glu Lys

260 265 270Glu Tyr Pro Gln Lys Phe Gln Asp Asp Asn Thr Asp Cys Leu Pro Pro

275 280 285Ala Asn Ala Glu Ser Lys Arg Leu Pro Val Gly Glu Thr Ser Leu Glu

290 295 300Lys Asp Thr Asp Phe Pro Leu Lys Ser Thr Thr Glu Thr Gly Lys Met305 310 315 320Val Leu Tyr Ala Ser Pro Ile Val Glu Thr Arg Asp Asp Ser Val Ile

325 330 335Cys Ser Pro Ser Thr Asn Leu Glu Thr Gln Lys Leu Leu Val Ser Lys

340 345 350Thr Gly Leu Glu Thr Asp Ile Val Leu Pro Leu Lys Arg Lys Arg Asp

355 360 365Thr Ala Glu Ile Glu Leu Asp Ala Cys Ala Thr Val Ala Asn Gly Asp

370 375 380Asp His Val Met Ser Ser Asp Gly Val Ile Pro Ser Pro Ser Gly Cys385 390 395 400Lys Asn Asp Asn Arg Pro Glu Met Cys Asn Thr Cys Lys Lys Arg Gln

405 410 415Lys Val Asn Gly Asp Cys Gln Asn Arg Ser Val Cys Ser Cys Ile Val

420 425 430Gln Pro Val Glu Glu Ser Asp Asn Val Thr Gln Asp Met Lys Glu Thr

435 440 445Gly Pro Val Thr Ser Arg Glu Tyr Glu Glu Asn Gly Gln Ile Gln His

450 455 460Gly Lys Ser Ser Asp Pro Lys Phe Tyr Ser Ser Val Tyr Pro Glu Tyr465 470 475 480Trp Val Pro Val Gln Leu Ser Asp Val Gln Leu Glu Gln Tyr Cys Gln

485 490 495Thr Leu Phe Ser Lys Ser Leu Ser Leu Ser Ser Leu Ser Lys Ile Asp

500 505 510Leu Gly Ala Leu Glu Glu Thr Leu Asn Ser Val Arg Lys Thr Cys Asp

515 520 525His Pro Tyr Val Met Asp Ala Ser Leu Lys Gln Leu Leu Thr Lys Asn

530 535 540Leu Glu Leu His Glu Ile Leu Asp Val Glu Ile Lys Ala Ser Gly Lys545 550 555 560Leu His Leu Leu Asp Lys Met Leu Thr His Ile Lys Lys Asn Gly Leu

565 570 575Lys Ala Val Val Phe Tyr Gln Ala Thr Gln Thr Pro Glu Gly Leu Leu

580 585 590Leu Gly Asn Ile Leu Glu Asp Phe Val Gly Gln Arg Phe Gly Pro Lys

595 600 605Ser Tyr Glu His Gly Ile Tyr Ser Ser Lys Lys Asn Ser Ala Ile Asn

610 615 620Asn Phe Asn Lys Glu Ser Gln Cys Cys Val Leu Leu Leu Glu Thr Arg625 630 635 640Ala Cys Ser Gln Thr Ile Lys Leu Leu Arg Ala Asp Ala Phe Ile Leu

645 650 655Phe Gly Ser Ser Leu Asn Pro Ser His Asp Val Lys His Val Glu Lys

660 665 670Ile Lys Ile Glu Ser Cys Ser Glu Arg Thr Lys Ile Phe Arg Leu Tyr

675 680 685Ser Val Cys Thr Val Glu Glu Lys Ala Leu Ile Leu Ala Arg Gln Asn

690 695 700Met Arg Gln Asn Lys Ala Val Glu Asn Leu Asn Arg Ser Leu Thr His705 710 715 720Ala Leu Leu Met Trp Gly Ala Ser Tyr Leu Phe Asp Lys Leu Asp His

725 730 735Phe His Ser Ser Glu Thr Pro Asp Ser Gly Val Ser Phe Glu Gln Ser

740 745 750Ile Met Asp Gly Val Ile His Glu Phe Ser Ser Ile Leu Ser Ser Lys

755 760 765Gly Gly Glu Glu Asn Glu Val Lys Leu Cys Leu Leu Leu Glu Ala Lys

770 775 780His Ala Gln Gly Thr Tyr Ser Ser Asp Ser Thr Leu Phe Gly Glu Asp785 790 795 800His Ile Lys Leu Ser Asp Glu Glu Ser Pro Asn Ile Phe Trp Ser Lys

805 810 815Leu Leu Gly Gly Lys Asn Pro Met Trp Lys Tyr Pro Ser Asp Thr Pro

820 825 830Gln Arg Asn Arg Lys Arg Val Gln Tyr Phe Glu Gly Ser Glu Ala Ser

835 840 845Pro Lys Thr Gly Asp Gly Gly Asn Ala Lys Lys Arg Lys Lys Ala Ser

850 855 860Asp Asp Val Thr Asp Pro Arg Val Thr Asp Pro Pro Val Asp Asp Asp865 870 875 880Glu Arg Lys Ala Ser Gly Lys Asp His Met Gly Ala Leu Glu Ser Pro

885 890 895Lys Val Ile Thr Leu Gln Ser Ser Cys Lys Ser Ser Gly Thr Asp Gly

900 905 910Thr Leu Asp Gly Asn Asp Ala Phe Gly Leu Tyr Ser Met Gly Ser His

915 920 925Ile Ser Gly Ile Pro Glu Asp Met Leu Ala Ser Gln Asp Trp Gly Lys

930 935 940Ile Pro Asp Glu Ser Gln Arg Arg Leu His Thr Val Leu Lys Pro Lys945 950 955 960Met Ala Lys Leu Cys Gln Val Leu His Leu Ser Asp Ala Cys Thr Ser

965 970 975Met Val Gly Asn Phe Leu Glu Tyr Val Ile Glu Asn His Arg Ile Tyr

980 985 990Glu Glu Pro Ala Thr Thr Phe Gln Ala Phe Gln Ile Ala Leu Ser Trp

995 1000 1005Ile Ala Ala Leu Leu Val Lys Gln Ile Leu Ser His Lys Glu Ser Leu 1010 1015 1020Val Arg Ala Asn Ser Glu Leu Ala Phe Lys Cys Ser Arg Val Glu Val025 1030 1035 1040Asp Tyr Ile Tyr Ser Ile Leu Ser Cys Met Lys Ser Leu Phe Leu Glu

1045 1050 1055His Thr Gln Gly Leu Gln Phe Asp Cys Phe Gly Thr Asn Ser Lys Gln

1060 1065 1070Ser Val Val Ser Thr Lys Leu Val Asn Glu Ser Leu Ser Gly Ala Thr

1075 1080 1085Val Arg Asp Glu Lys Ile Asn Thr Lys Ser Met Arg Asn Ser Ser Glu1090 1095 1100Asp Glu Glu Cys Met Thr Glu Lys Arg Cys Ser His Tyr Ser Thr Ala105 1110 1115 1120Thr Arg Asp Ile Glu Lys Thr Ile Ser Gly Ile Lys Lys Lys Tyr Lys

1125 1130 1135Lys Gln Val Gln Lys Leu Val Gln Glu His Glu Glu Lys Lys Met Glu

1140 1145 1150Leu Leu Asn Met Tyr Ala Asp Lys Lys Gln Lys Leu Glu Thr Ser Lys

1155 1160 1165Ser Val Glu Ala Ala Val Ile Arg Ile Thr Cys Ser Arg Thr Ser Thr1170 1175 1180Gln Val Gly Asp Leu Lys Leu Leu Asp His Asn Tyr Glu Arg Lys Phe185 1190 1195 1200Asp Glu Ile Lys Ser Glu Lys Asn Glu Cys Leu Lys Ser Leu Glu Gln

1205 1210 1215Met His Glu Val Ala Lys Lys Lys Leu Ala Glu Asp Glu Ala Cys Trp

1220 1225 1230Ile Asn Arg Ile Lys Ser Trp Ala Ala Lys Leu Lys Val Cys Val Pro

1235 1240 1245Ile Gln Ser Gly Asn Asn Lys His Phe Ser Gly Ser Ser Asn Ile Ser1250 1255 1260Gln Asn Ala Pro Asp Val Gln Ile Cys Asn Asn Ala Asn Val Glu Ala265 1270 1275 1280Thr Tyr Ala Asp Thr Asn Cys Met Ala Ser Lys Val Asn Gln Val Pro

1285 1290 1295Glu Ala Glu Asn Thr Leu Gly Thr Met Ser Gly Gly Ser Thr Gln Gln

1300 1305 1310Val His Glu Met Val Asp Val Arg Asn Asp Glu Thr Met Asp Val Ser

1315 1320 1325Ala Leu Ser Arg Glu Gln Leu Thr Lys Ser Gln Ser Asn Glu His Ala1330 1335 1340Ser Ile Thr Val Pro Glu Ile Leu Ile Pro Ala Asp Cys Gln Glu Glu345 1350 1355 1360Phe Ala Ala Leu Asn Val His Leu Ser Glu Asp Gln Asn Cys Asp Arg

1365 1370 1375Ile Thr Ser Ala Ala Ser Asp Glu Asp Val Ser Ser Arg Val Pro Glu

1380 1385 1390Val Ser Gln Ser Leu Glu Asn Leu Ser Ala Ser Pro Glu Phe Ser Leu

1395 1400 1405Asn Arg Glu Glu Ala Leu Val Thr Thr Glu Asn Arg Arg Thr Ser His1410 1415 1420Val Gly Phe Asp Thr Asp Asn Ile Leu Asp Gln Gln Asn Arg Glu Asp425 1430 1435 1440Cys Ser Leu Asp Gln Glu Ile Pro Asp Glu Leu Ala Met Pro Val Gln

1445 1450 1455His Leu Ala Ser Val Val Glu Thr Arg Gly Ala Ala Glu Ser Asp Gln

1460 1465 1470Tyr Gly Gln Asp Ile Cys Pro Met Pro Ser Ser Leu Ala Gly Lys Gln

1475 1480 1485Pro Asp Pro Ala Ala Asn Thr Glu Ser Glu Asn Leu Glu Glu Ala Ile1490 1495 1500Glu Pro Gln Ser Ala Gly Ser Glu Thr Val Glu Thr Thr Asp Phe Ala505 1510 1515 1520Ala Ser His Gln Gly Asp Gln Val Thr Cys Pro Leu Leu Ser Ser Pro

1525 1530 1535Thr Gly Asn Gln Pro Ala Pro Glu Ala Asn Ile Glu Gly Gln Asn Ile

1540 1545 1550Asn Thr Ser Ala Glu Pro His Val Ala Gly Pro Asp Ala Val Glu Ser

1555 1560 1565Gly Asp Tyr Ala Val Ile Asp Gln Glu Thr Met Gly Ala Gln Asp Ala1570 1575 1580Cys Ser Leu Pro Ser Gly Ser Val Gly Thr Gln Ser Asp Leu Gly Ala585 1590 1595 1600Asn Ile Glu Gly Gln Asn Val Thr Thr Val Ala Gln Leu Pro Thr Asp

1605 1610 1615Gly Ser Asp Ala Val Val Thr Gly Gly Ser Pro Val Ser Asp Gln Cys

1620 1625 1630Ala Gln Asp Ala Ser Pro Met Pro Leu Ser Ser Pro Gly Asn His Pro

1635 1640 1645Asp Thr Ala Val Asn Ile Glu Gly Leu Asp Asn Thr Ser Val Ala Glu1650 1655 1660Pro His Ile Ser Gly Ser Asp Ala Cys Glu Met Glu Ile Ser Glu Pro665 1670 1675 1680Gly Pro Gln Val Glu Arg Ser Thr Phe Ala Asn Leu Phe His Glu Gly

1685 1690 1695Gly Val Glu His Ser Ala Gly Val Thr Ala Leu Val Pro Ser Leu Leu

1700 1705 1710Asn Asn Gly Thr Glu Gln Ile Ala Val Gln Pro Val Pro Gln Ile Pro

1715 1720 1725Phe Pro Val Phe Asn Asp Pro Phe Leu His Glu Leu Glu Lys Leu Arg1730 1735 1740Arg Glu Ser Glu Asn Ser Lys Lys Thr Phe Glu Glu Lys Lys Ser Ile745 1750 1755 1760Leu Lys Ala Glu Leu Glu Arg Lys Met Ala Glu Val Gln Ala Glu Phe

1765 1770 1775Arg Arg Lys Phe His Glu Val Glu Ala Glu His Asn Thr Arg Thr Thr

1780 1785 1790Lys Ile Glu Lys Asp Lys Asn Leu Val Ile Met Asn Lys Leu Leu Ala

1795 1800 1805Asn Ala Phe Leu Ser Lys Cys Thr Asp Lys Lys Val Ser Pro Ser Gly1810 1815 1820Ala Pro Arg Gly Lys Ile Gln Gln Leu Ala Gln Arg Ala Ala Gln Val825 1830 1835 1840Ser Ala Leu Arg Asn Tyr Ile Ala Pro Gln Gln Leu Gln Ala Ser Ser

1845 1850 1855Phe Pro Ala Pro Ala Leu Val Ser Ala Pro Leu Gln Leu Gln Gln Ser

1860 1865 1870Ser Phe Pro Ala Pro Gly Pro Ala Pro Leu Gln Pro Gln Ala Ser Ser

1875 1880 1885Phe Pro Ser Ser Val Ser Arg Pro Ser Ala Leu Leu Leu Asn Phe Ala 1890 1895 1900Val Cys Pro Met Pro Gln Pro Arg Gln Pro Leu Ile Ser Asn Ile Ala905 1910 1915 1920Pro Thr Pro Ser Val Thr Pro Ala Thr Asn Pro Gly Leu Arg Ser Pro

1925 1930 1935Ala Pro His Leu Asn Ser Tyr Arg Pro Ser Ser Ser Thr Pro Val Ala

1940 1945 1950Thr Ala Thr Pro Thr Ser Ser Val Pro Pro Gln Ala Leu Thr Tyr Ser

1955 1960 1965Ala Val Ser Ile Gln Gln Gln Gln Glu Gln Gln Pro Gln Gln Ser Leu1970 1975 1980Ser Ser Gly Leu Gln Ser Asn Asn Glu Val Val Cys Leu Ser Asp Asp985 1990 1995 2000Glu<210>4<211>21<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>4catctacggc aatgtaccag c 21<210>5<211>21<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>5gatgggaatt ggctgagtgg c 21<210>6<211>21<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>6cagttccaaa cgtaaaacgg c 21<210>7<211>15<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>7ntcgastwts gwgtt 15<210>8<211>16<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>8ngtcgaswga nawgaa 16<210>9<211>16<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>9wgtgnagwan canaga 16<210>10<211>16<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸 <400>10wggwancwga wangca 16<210>11<211>16<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>11wcgwwgawca ngncga 16<210>12<211>16<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>12wgcnagtnag wanaag 16<210>13<211>16<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>13awgcangncw ganata 16<210>14<211>24<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>14ctgtacatac tgagtacaat cgga 24<210>15<211>25<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>15gcttcaattc ctgcctcagt tgaac 25<210>16<211>24<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>16ctctacgtgc ttaacatcat gcga 24<210>17<211>25<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>17ccagcttctg ctactagaaa gtcag 25<210>18<211>25<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>18ctggagttgc atgaaatcct ggatg 25 <210>19<211>25<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>19gctctttgta agctgttcac gagac 25<210>20<211>24<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>20tcgcatgatg ttaagcacgt agag 24<210>21<211>25<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>21gagtactggt ccgtgaacag gtaat 25<210>22<211>25<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>22atgcttgcac aagcatggtc ggaaa 25<210>23<211>25<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>23tgcaacatcg tgcatttgct ccaga 25<210>24<211>25<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>24cacaagcatg agtttttcct tccgg 25<210>25<211>25<212>DNA<213>人工序列<220><223>人工序列描述：合成寡核苷酸<400>25ctgactttct agtagcagaa gctgg 25<210>26<211>519<212>DNA<213>甘蓝<220><223>seg1-23<400>26gaattcctgn nttacggcat ccttaataga ctgttcaaat ggaactcctg aacctggggt 60tccactccca tggaagtgtt ccagcttatc aaataaatat gatgcccccc acatgagcaa 120tgcatgtgtg agaggacggt ttaggttctc tagaggctta ttttgcctag caagaatcag 180ggttttttct tcaactgtaa acactgagta caaccggaaa atcttagttc tttcagaaca 240cgactcaacc tttatcttct ctaagagctt aacgtcatgc gatggattca ggctgcttcc 300aaaaagtata aaagactcag cgcgtaagag tttaatgctt tgactacagg cacgtatttc 360cagcagcaga ataaaacact cactctcctt gttgaaattg tttatagcgt tcttcttcga 420gaggcagacc ccatgctcat aggaattttg accaaatctt tgcatcagaa aatcttcgag 480aatattacca agcagaagcc cctcagggct atgtattgc 519<210>27<211>419<212>DNA<213>甘蓝<220><223>seq1-27<400>27gaattcagga tcaaaagggt tgccggttgg agaaactggt ttagagaaag gctctgattt 60tcctgtggaa gtaactaagg atatagagaa gacagtggtt gattcatccc ccatggttga 120aactgaggat ggcagtgtta taggttcacc atccgagaat ccagaaccac aaaagcttcg 180tgacagtgaa actagcttgg aaaccgatat agacttggct ctgaaaagaa aaagagacac 240tgcagaaatt gtgatggatg catgtacaaa tgcagatgac cgcattatga gtactgatgg 300ggttattcct tttccacccg tgtgcacaaa tattaatcaa cccgaaaggt gtggcacatg 360tcaaaaacgg caaaagtaag aatttccgac tgttgtctgt cgttttgaaa ccatttgcc 419<210>28<211>467<212>DNA<213>甘蓝<220><223>seq1-43<400>28gaattctcgt ccatactttc ttccgatgtt ggagaagaaa atgaaggcaa gctgtgtcta 60cttttggaag ccaagcatgc tcagggaagt tacagcactg atgctactct atttggtgaa 120gaacatgtca agttatcaga tgaaagtcca aatatgtttt ggtcaaagct gttgagtgga 180aagaacccta tgtggaaata ctgttcggat actcctcaaa ggagtcgaaa aagagtacgg 240catcttcagg gctatgagga gactaccaaa gttggcaatg gcggaaactt aaagaagaaa 300aagaaggctt cagatgatgt cacagtagat aacgctgaga gaaaagcctc tggaaaggat 360cacatgggta aaacagttca cttcctgctc ctttacctct agtgttcatt gaatgttcca 420tttactttgc ttactatctt tccttcaggg catttggagt caccaaa 467<210>29<211>490<212>DNA<213>甘蓝<220><223>seq1-47<400>29gaattcagct tttaaaactg atctctgctc acagataatt taagagtcag tgaaaattga 60gataaaacga accaaaactg gaggtaacag atactctgag aacaactaac cttttcttca 120taagtcttct ttgtgttctc tgattctctc cgcagcttct ccagttcatg ctgaaatggg 180tcactgaaca cagggaaagg tacttgagga acaggtggag tggcattctg tcccgtagca 240ttgttaagct gtgaagaaac aggagctgtt acacctgctg gaggctccac aacaccttca 300tcgacaacgt ctgcgtaaaa ggtattacca gattgtcagt ttctctggca aacacatacg 360ttatacttaa atgcaaaaga gcagttactg acttgcaaag gttggttgtt ctacttgagc 420atcaggttct gctacttcca tttcacatgc ttctgatcca gttgtgcgag gcgcagccat 480tgttgtgttg 490<210>30<211>515<212>DNA<213>甘蓝<220><223>2-33<400>30tctagagaag aggtggatta tgtatattct tttctgtact gcatgaagag tctattcgtg 60gggcgcacac aaggtttcca agaaaagggt gaagaatgca tggctgagaa aagaggtagc 120cattatagct cagtaaccaa ggatgttgaa aagactatta gcgacatcaa aaagaaatgc 180agtaagagcc tgcataagct tgtacaaacc ctcgaggaag aaaagatgga cctgatgaat 240aggaatgctg tcaagaagca ggaacttcag aattgtaaaa aggtggaagc atcatttatt 300cgtgtcacct attcaggtat aaatactcag agcttacatg atgctctcca acggctggaa 360tgtacttttg aaagaaagtt tgatgatctc aaaggagagt tggatgaatg ccttgaaagt 420ttagagcaaa taaacgaggc tggaaagaag aagttggctg aagatgaagc ctgttggatt 480agtcggatag agaaatgggc acgagctgaa ttaag 515<210>31<211>574<212>DNA<213>甘蓝<220><223>seq2-37<400>31tctagaccaa actattaaac gctaaacata agaagattag atcactcgtc atcagagaga 60cagaccacat cattgctcct ctgcaatcca ctccccaagt tctgtggttg ttcttgctgc 120tgaataaacg catttgaata tggtaaaggg ttggagatga gaggttgtct tggttgaggc 180attgtgcagt acggagccga agcagtatga ttcctcagtg cgcttacttg tgttgctctc 240tgtgctagct gctggattct aactggagaa agaaaaaaag aaaaaaaagg tgttattatg 300acttcataac cttatatctt taaaaaacaa ttatgcttct attattcgaa cacttgccca 360ttggagttgc tgctgaggaa tgagaggaga ttctgctcgt acatttagac aagaacgcac 420tcgacaacag cttgttcttt ataacaagat tcttcctcgt ctgtaacttc gtctttctgg 480ctgcatgtac agcttgtacc tcatgaaact ttctctgata ctcttcttgt aattcagcta 540tcttcttctc gaatttagct ttcaagactg cttt 574<210>32<211>466<212>DNA<213>甘蓝<220><223>seq2-53<400>32tctagattgt aattttaaat ttacaacaaa ttttgaaagg gtcagcgatg agtttgcaaa 60tctccgtgtt tcctccagca ttgctcagcc agttcaagaa cctgatcact tggcacaggt 120tggtttcttc ttgctttact ttggacacct gtttaatatt ggcctgtcaa atttacttat 180ccttttactt ctaaactgca aattctggtc tgcattgcat tgtgatatga aggtatctgg 240acccgcttca agcagagact atggggagga caggcagaat atgcaacaag ataaatcaca 300tgaccgaaag ttgtcatcga tgtatccaga gtattgggtt ccagtgcagc tatcagatgt 360acagatagag caatactgtc ggactctctt ctccaaatct tcatctcttt cttcgctgtc 420gaggactgat cctgttcgag ctcttgaaca aactctcagt tctgta 466<210>33<211>417<212>DNA<213>甘蓝<220><223>seq2-57<400>33tctagagcaa ttgaaaccta attccgattt tgcgcgggcc agagattctt cacggttgaa 60cttttgctta acgaaagaga ctgcaatcca aatctggaag tgcattatta agaacgtatt 120cagcaatatt cataaattat gcaacaatca aaggccttac gttgtggcct acaaagcatg 180gattttgtta gatattagta gctagtctaa ttcaagcaat taatggaagt ttctatccta 240tgactggaaa gttaaacatt cccacaaaag cagtgatgcc acagatgatg aagaagaaaa 300atgcatatac tatggaagtg aatgctatca taccacagct atctggaagg cctgcaatgt 360tgtagctggc tctttgcaga cacggtggtt gtcaataata tattcaagaa ctttttc 417

Claims

1.含有编码蛋白质的可读框的DNA，该蛋白质的特征为氨基酸序列含有与SEQ ID NO：3的对比成分序列有40％或更多一致性的、至少有150个氨基酸残基的成分序列。

2.根据权利要求1的DNA，其含有编码具有式R₁-R₂-R₃的蛋白质的可读框，其中--R₁、R₂和R₃构成由从氨基酸残基组Gly、Ala、Val、Leu、Ile、Phe、

Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、

Arg和His中独立选择的氨基酸残基组成的成分序列，--R₁和R₃由0-3000个氨基酸残基独立组成；--R₂由至少150个氨基酸残基组成；且--R₂与SEQ ID NO：3的对比成分序列至少有40％相同。

3.根据权利要求1的DNA，其含有编码一个或多个SWI2/SNF2样ATP酶/解旋酶基元。

4.根据权利要求1的DNA，其含有编码蛋白质的可读框，该蛋白质具有SEQ ID NO：3的第478-490、584-600、617-630、654-668、676-690、718-734、776-788、1222-1233、1738-1749或1761-1770位氨基酸限定的成分序列。

5.根据权利要求1的DNA，其中可读框编码的蛋白的特征为SEQ IDNO：3的氨基酸序列，或者用氨基酸残基K替代SEQ ID NO：3第705位的M或用氨基酸残基D替代SEQ ID NO：3第1219位的E的等位氨基酸序列。

6.根据权利要求1的DNA，其以SEQ ID NO：1或SEQ ID NO：2的核苷酸序列为特征。

7.根据权利要求1的DNA，其中与其转录的mRNA互补的RNA的表达，解除了转基因标记基因的沉默。

8.根据权利要求1-7之任意一项的可读框编码的蛋白质。

9.产生根据权利要求1的DNA的方法，包括 -筛选DNA文库中能够与SEQ ID NO：1或SEQ ID NO：2所限定DNA

的片段杂交的克隆，其中所述片段长度至少为15个氨基酸；-将杂交克隆测序；-纯化含有编码蛋白质的可读框的克隆的载体DNA，该蛋白质的特征为

氨基酸序列含有与SEQ ID NO：3具有40％或更多一致性的、至少有

150个氨基酸残基的成分序列；-任选地对纯化DNA进一步处理。

10.多聚酶链式反应，其中使用的至少一个寡核苷酸含有代表SEQ IDNO：1或SEQ ID NO：2的15个或更多碱基对的核苷酸序列。