CN1233290A

CN1233290A - 抗真菌蛋白及其编码dna和掺入此dna的宿主

Info

Publication number: CN1233290A
Application number: CN97198755A
Authority: CN
Inventors: M·H·斯图威; J·H·H·V·库斯特斯; M·B·斯拉-布拉格; L·S·美彻斯; J·P·E·范德威特－特路斯特; W·拉格威格; A·S·普斯坦
Original assignee: Mogen International NV
Current assignee: Mogen International NV
Priority date: 1996-09-04
Filing date: 1997-09-04
Publication date: 1999-10-27
Anticipated expiration: 2017-09-04
Also published as: NZ334517A; US20020168735A1; AU5853198A; WO1998013478A3; WO1998013478A2; US6864076B2; AU718274B2; CA2264567A1; EP0939798A2; EP0939798B1; JP2001502525A; ATE282706T1; DE69731655D1; BR9711291A; ES2227730T3; DE69731655T2; CN1155714C

Abstract

本发明提供可从植物来源获得的具有抗真菌活性,特别是抗疫霉和/或抗腐霉活性并且通过SDS聚丙烯酰胺凝胶电泳测定分子量为约55—65千道尔顿的分离的蛋白;以及包含能编码根据本发明所述的蛋白的开放阅读框架的分离DNA序列,优选地特征在于所含的开放阅读框架能编码在SEQ ID NO:16,SEQ ID NO:57,SEQ ID NO:70,SEQ ID NO:72或SEQ ID NO:74中所示的蛋白或其突变蛋白。本发明进一步包括掺入了能编码根据本发明所述的蛋白的嵌合DNA并且蛋白在其中表达的植物。本发明也证明了所述蛋白的碳水化合物氧化酶和优选地己糖氧化酶活性。本发明也提供使用该蛋白或能合成该蛋白的宿主细胞来抵抗真菌,尤其是疫霉和腐霉属种类的方法。

Description

抗真菌蛋白及其编码DNA和掺入此DNA的宿主

发明领域

本发明涉及可以作为抗真菌蛋白的新型氧化酶及其编码DNA和掺入此DNA的宿主，以及通过使所述真菌病原体与所述蛋白接触以抵抗真菌病原体的方法。本发明进一步涉及掺入和表达编码抗真菌蛋白的DNA的植物和因此表现对真菌病原体易感性降低的植物。

背景技术

在整个农作物栽培历史中，农作物植株的真菌疾病是农作物损失的主要因素之一。农作物的单种栽培促进了真菌病原体强毒种类的增殖并且新的各种植物变得在急剧增加的侵袭植物的进化病原体强毒株大范围危险中生长。由于携带病原体植物材料的国际运输，使疾病的发生明显恶化，使没有机会产生对病原体抗性的植物与病原体接触。因此由于人为的干预，宿主和病原体之间的天然平衡遭到破坏，在许多情况下带来灾难性的影响。这样的情况导致了诸如19世纪期间出现在爱尔兰的由马铃薯晚疫病真菌(致病疫霉)引起的灾难性损失甚至饥荒。真菌病也可能使一些农作物在大面积范围内完全不能生长，如萎焉镰孢毁灭生长在美国东部的大面积番茄时或霜霉病(葡萄生单轴霉)真菌摧毁生长在欧洲部分区域的藤本植物时就是这种情况。真菌疾病的爆发也可能如荷兰榆树疾病(Ceratocystis ulmi)破坏整个英国榆树(Ulmus procera)种群时发生的那样对环境有严重的影响。除了在农作物生长期间导致的损失，真菌疾病可能产生进一步的收获后损失。例如，各种软腐病如灰葡萄孢尤其在软水果中存在问题。真菌黄曲霉尽管不是真的引起疾病的真菌，但尤其在热带国家导致储藏花生和玉米收获后的腐病，并且是最严重的，因为它产生对人类非常有毒的毒素-黄曲霉毒素。

与真菌病相关的主要经济问题存在于世界上更湿润的部分，主要是欧洲西部和湿热带。各种农作物管理技术如轮作和避免机械上土壤传播等可用于防止真菌病严重侵染的形成和传播。植物育种已在增加许多农作物对重要疾病抗性方面取得显著效果。例如，农作物育种者成功地将有效抵抗番茄尖镰孢的抗性基因1和1-2导入番茄。然而，特别是当种特异抗性由于快速进化的病原体新种类而减弱时，问题仍然存在。在番茄中，尖镰孢的另一个强毒株已经出现并且育种者正在寻求第三个有用的抗性基因。最近在生长在西部欧洲部分的谷类中黄锈病(条形柄锈菌)强毒株的爆发导致对具有对其它真菌抗性的品种使用的杀真菌剂快速增加。在这些特定情况下，如对育种者来说没有天然来源的抗性可用的情况下，化学品广泛地用于控制真菌病。

在世界的许多地方化学杀真菌剂仍然是农作物生产成本中的主要投入。据统计1990年21％的农业化学品销售是用于杀真菌剂(5、54亿美元)。农场主和种植者有强烈的降低它们投入成本的愿望。与经济原因相提并论的是逐渐增强的环境因素。在更先进的经济中，尤其是在北美和西欧，来自政治家和消费者的关于较少依靠化学品投入的农业的压力逐渐增加。对于这样的要求的理由可能缺乏公认的原理或科学的证据，但是对一些关于残留在饮用水中或检测到的杀虫剂的量超过了食品残留物所能接受的最小量的报道的恐惧正在增加。例如在荷兰，有在2000年前将杀虫剂的总用量降低50％的强制要求。

致病疫霉属于称为卵菌纲的真菌类。致病疫霉感染茄科的各个成员如马铃薯、番茄和一些观赏植物。它引起马铃薯和番茄的晚疫病并影响除了根部以外的所有部分。此真菌在地理上广泛分布并可以在所有生产马铃薯的国家中发现。马铃薯的晚疫病在经济上非常重要的，因为在节令的早期侵染会严重降低农作物产量。目前通过定期喷洒化学杀真菌剂(二硫代氨基甲酸盐类如代森锰锌、代森锰和代森锌)控制病害。从环境和经济的观点考虑，对由致病疫霉引起的病害的生物学控制比使用化学杀真菌剂更有利。

腐霉也属于称为卵菌纲的真菌类。腐霉属不同于相关的疫霉属，因为形成相对不分化的孢子囊。此真菌在地理上广泛分布于所有陆地。由腐霉属种类引起的第一种主要病害类型是由于对大田或苗圃中幼苗侵袭的突然和快速的发展而导致的枯萎。腐霉属种类引起第二种类型的病害即根坏死并导致植物生长总体减慢(例如小麦和玉米)和产量损失。在欧洲由腐霉引起的主要损失是针对大田农作物如甜菜。损失基本上趋向于全或无。相似地，苗圃种植的观赏植物和森林树木也可能遭到完全破坏。(有关卵菌纲的综述，参见：欧洲植物病害手册，由I.M.Smith等编辑，1988,Blackwell Scientific Publications，第8章)。

另一种真菌是葡萄孢，尤其灰葡萄孢，属于半知菌类，它导致灰霉疫病或芽和花的疫病，它普遍存在于收获后的软熟水果上，但它也可能在收获前出现。它也可以影响各种蔬菜如莴苣、豆类和番茄。葡萄孢的其它种类普遍存在于花卉如百合、唐菖蒲和郁金香上。

从TMV诱导的烟草叶中分离的具有抗真菌活性的蛋白公开于WO91/18984，该蛋白能引起致病疫霉的发芽孢子和菌丝尖裂解并使菌丝体以降低的速率生长。该蛋白具有约24千道尔顿的表观分子量并命名为AP24。将由AP24基因的核酸序列推测的其完整氨基酸序列与数据库中的已知蛋白比较，揭示了此蛋白是渗透蛋白样蛋白。

尽管在抵抗真菌病原体如致病疫霉方面已取得初步成功，但是仍然需要鉴定能够合成具有抗此真菌病原体活性的抗真菌蛋白的遗传工程植株并分离具有抵抗此真菌的抗真菌活性的其它蛋白。

发明概述

本发明提供可从植物来源获得的具有针对卵菌纲优选地针对疫霉和/或腐霉的最有效的抗真菌活性并通过SDS(十二烷基磺酸钠)-PAGE(聚丙烯酰凝胶)电泳测定分子量为约55-65千道尔顿的分离的蛋白。优选的蛋白是那些可从向日葵或莴苣植株获得的蛋白。甚至更优选的蛋白是可从用水杨酸钠诱导的向日葵或莴苣叶子获得的蛋白。更优选的分离蛋白的特征在于选自含有选自SEQ ID NO:1,2或6,16,20,49,50,51,58,71,73或75中所示的氨基酸序列并具有抗真菌活性，特别是抗疫霉和/或抗腐霉活性的蛋白的群体及其突变蛋白。根据本发明所述的进一步优选的蛋白的特征在于它包括含有由SEQ ID NO:16,20,58,71,73或75代表的氨基酸序列或诸如由SEQ ID NO:6代表的部分序列的蛋白。

本发明也提供新型酶，其酶活性是碳水化合物的氧化。

本发明也包括包含能编码根据本发明所述的蛋白的开放阅读框架的分离DNA序列以及能在严格条件下与其杂交的DNA，优选地特征在于该开放阅读框架能编码根据本发明所述的蛋白。

本发明也提供根据本发明所述的嵌合DNA序列，进一步包含转录起始区域和选择性地转录终止区域，它们与所述的开放阅读框架连接使嵌合DNA在存在于存活宿主细胞中时能在宿主细胞中转录，从而产生含所述开放阅读框架的RNA。根据本发明所述的优选的嵌合DNA序列是其包含开放阅读框架的RNA能在存在于所述宿主细胞中时在宿主细胞中翻译为蛋白从而合成所述蛋白的嵌合DNA序列。尤其优选的是包含如SEQ ID NO:15,19,57,70,72或74所示序列的DNA序列。

本发明也包括包含根据本发明所述的DNA序列的嵌合DNA序列，它可以选自复制子如细菌克隆质粒和载体如细菌表达载体、(非整合型)植物病毒载体、农杆菌Ti质粒载体如双元载体等；以及包含根据本发明所述的复制子或载体并且一旦所述复制子存在其中时能维持该复制子的宿主细胞。根据实施方案优选的宿主细胞是植物细胞，所述的载体是非整合型病毒载体。

本发明进一步提供根据本发明所述的嵌合DNA序列稳定掺入其基因组的宿主细胞如植物细胞以及包含所述细胞或基本上由所述细胞组成的多细胞宿主如植物。尤其优选的是其特征在于根据本发明所述的嵌合DNA至少在许多植物细胞中表达以引起其中合成所述抗真菌蛋白的植物。

根据本发明的另一实施方案，提供了制备具有碳水化合物氧化酶活性的蛋白的方法，其特征在于根据本发明所述的宿主细胞在允许所述宿主细胞合成所述蛋白的条件下生长，选择性地随后进行从宿主细胞回收蛋白的步骤。

本发明的另一部分是涉及具有碳水化合物氧化酶活性的蛋白的抗真菌用途。

本发明也提供了根据本发明所述的蛋白的用途，即用于抑制真菌，优选地卵菌纲，并且更优选地疫霉和腐霉的生长。根据本发明的另一实施方案，抑制真菌的生长通过在植物上或植物邻近处施用能合成蛋白的微生物或通过从微生物宿主收集蛋白并以农业化学制剂施用蛋白来实现。

本发明也提供了用于获得对真菌尤其是对疫霉和/或腐霉具有降低的易感性的植物的方法，包括以下步骤：

(a)将嵌合DNA序列导入易于再生出完整植株的祖细胞，

-所述嵌合DNA序列包含能编码根据权利要求1-12中的任意一项所述的蛋白的开放阅读框架，所述开放阅读框架可操作性地与转录和翻译区域及选择性地转录终止区域连接，以使对所述真菌侵染易感的植物细胞中合成所述的蛋白，并且

-所述嵌合DNA序列能编码植物选择性标记，以允许选择所述选择性标记存在其中的转化祖细胞，并且

(b)在有利于具有所述选择性标记的祖细胞的条件下使所述祖细胞再生为植株，并且

(c)鉴定合成根据权利要求1所述的蛋白的植物，由此降低所述植物对所述真菌侵染的易感性。

根据本发明优选的是特征在于步骤(a)使用能将T-DNA转移入植物细胞并携带克隆入双元载体pMOG800的所述嵌合DNA的根瘤农杆菌菌株进行的方法；另一个优选的方法是步骤(b)在存在抗生素从而有利于含有新霉素磷酸转移酶的细胞的情况下进行的方法。

本发明进一步提供抗真菌组合物，包含根据本发明所述的蛋白和适当的载体。

本发明也提供能与根据本发明所述的蛋白N端片段，优选地与由SEQ ID NO:6,16,20,58,71,73或75代表的肽反应的抗体。该抗体适用于检测能合成根据本发明所述的蛋白的宿主细胞和多细胞宿主，优选地检测植物中根据本发明所述的嵌合DNA的表达水平。

本发明也提供可从编码根据本发明所述的蛋白的基因获得的核酸序列，所述的核酸序列在植物中具有组织特异性转录调控活性。本发明特别提供可从所述基因翻译起始位点上游区域获得的核酸序列，优选地所述基因翻译起始位点紧邻的上游区域的至少500个核苷酸。

附图描述

图1：向日葵蛋白MS59不同纯化步骤的SDS-PAGE(12.5％)。MW=分子量标记物；1=凝胶过滤(G25)后粗制的向日葵蛋白提取物；2=结合到阳离子交换层析(S-琼脂糖)上的蛋白组分；3=阳离子交换层析(Mono S)后的活性组分；4=经疏水相互作用层析(苯基superose)的流出物；5=凝胶过滤后的活性组分。

图2：凝胶过滤(SD75)柱的不同组分(序号6-16)的SDS-PAGE(12.5％)。以3个稀释度测试组分10-15对致病疫霉(A板)和终极腐霉(B板)的生长抑制。

图3：从天然PAGE的9个凝胶块洗脱的组分的SDS-PAGE(12.5％)(泳道1-9)，在天然PAGE中，含有MS59的SD75组分(SD75组分13)得到分离。右板：SD75组分13(L)和洗脱实验的2个组分，组分2(含有MS59)和组分5(含有约30千道尔顿蛋白)的SDS-PAGE(12.5％)。底部板：用洗脱组分1-6测试对致病疫霉生长的抑制，每孔加入5微升和1微升。

图4：在向PDA培养基加入致病疫霉游动孢子囊之后24小时对体外真菌抑制实验的显微分析。左板：对照培养，仅加入MES缓冲液。右板：向培养物中加入在MES缓冲液中的大肠杆菌合成的MS59。

图6:(A)WL64的SD75凝胶过滤。WL64在组分13,14,15洗脱。在图顶部的箭头表示分子量标记物。X轴：组分序号。Y轴：A280。

(B)SD75凝胶过滤曲线的组分11-17的12.5％SDS-PAGE凝胶的考马斯亮蓝染色。分子量标记物在右边以千道尔顿表示。箭头之间表示与抗真菌活性相关的蛋白条带。

(C)体外抗真菌测试。10微升相应组分(500微升总体积)用于筛选立枯丝核菌菌丝的生长抑制。

图7:WL64纯化的12.5％SDS-PAGE凝胶的考马斯亮蓝染色。泳道1：莴苣提取物；泳道2:HIC峰；泳道3:Source S峰；泳道4:MonoS峰；泳道5:SD75峰；泳道6:Mono P峰。分子量标记物在图的两侧以千道尔顿表示。

图8:(A)以葡萄糖为底物测定的MS59(空心菱形)、WL64(实心圆圈)和GOX(空心方形)的氧化酶活性的Lineweaver-Burk图。对于MS59、WL64和GOX，每次测试的蛋白量分别是17,29和45纳克。

(B)以真菌细胞壁为底物测定的MS59(空心菱形)、WL64(实心圆圈)和GOX(空心方形)的氧化酶活性的Lineweaver-Burk图。对于MS59、WL64和GOX每次测试的蛋白量分别是17,29和225纳克。

图9:MS59(点形柱)、WL64(斜条纹柱)和GOX(实心柱)的氧化酶活性的底物特异性。

图10：本发明的蛋白MS59、WL64与来自拟南芥的两个同系物At26(SEQ ID NO:71)和At27(SEQ ID NO:75)[含有已知的黄连素桥酶(berberine bridge enzyme)(EcBBE和PsBBe)]的匹配。保守的变化以灰色表示，而相同的区域(6个氨基酸中有3个相同)以黑色表示。

发明详述

为了举例说明，已在体外分析中证明了本发明的蛋白对下列真菌的抗真菌效应：致病疫霉，恶疫霉，烟草疫霉，大雄疫霉，终极腐霉，Pythium sylvaticum，堇菜腐霉，侧雄腐霉，立枯丝核菌，Tanatephoruscucumeris，紫卷担菌，白腐小核菌，巴斯德毕赤酵母和灰葡萄孢。显然，根据本发明所述的蛋白或其编码DNA在抵抗真菌的方法中的用途不限于针对上述真菌。没有理由假定根据本发明所述的蛋白不具有抵抗比本文测试的更宽范围的真菌，尤其是卵菌纲真菌的活性。

尽管以转基因番茄、烟草、胡萝卜、马铃薯和欧洲油菜(Brassicanapus)植物为例详细地举例说明了本发明，但是应该理解可以将一种或多种植物可表达的基因构建体提供给任何容易受某些形式的真菌侵袭尤其受上述真菌侵袭的植物种类，该构建体表达时在所述植物中过量合成根据本发明所述的蛋白以降低侵染比例和/或这样的侵袭的影响。本发明甚至可以在目前不易于转化的植物种类中实施，因为这样的种类的易受性仅仅是时间问题而且转化本身与构成本发明的原理无关。因此，适用于本说明书的目的的植物应包括被子植物和裸子植物，单子叶植物和双子叶植物，它们可用于饲料、食物或工业加工的目的；也包括用于任何农业或园艺目的，包括林业和花卉培养，以及家庭花园或室内花园，或其它装饰目的的植物。

根据本发明所述的蛋白可以通过从任何含有该蛋白的适当植物来源材料分离得到。特别适当的来源包含向日葵(Helianthus)的叶子和莴苣(莴苣Lollo bionda变种)的叶子。通过从植物种类制备植物提取物并使用如本文所述的体外抗真菌测试法测试这些提取物中抗真菌活性的存在，可以很容易地测定任何植物种类的植物来源材料中根据本发明所述的抗真菌蛋白的存在，通过适当的蛋白分级分离技术与体外测试结合进一步分级分离所得的样品直至得到包含约55-65千道尔顿蛋白的抗真菌组分，内部命名为MS59或其同系物WL64，其分离的形式表现抗真菌活性。尤其是可以在卵菌纲如疫霉或终极腐霉等或其它真菌如担子菌亚纲、子囊菌亚纲和接合菌类或其它纲或亚纲上测试该组分的抗真菌活性。

选择性地，通过克隆包含能编码所述蛋白或其前体的开放阅读框架的DNA并将其中所述的开放阅读框架与转录区域和选择性地翻译起始和转录终止区域连接，将所述DNA插入适当的宿主细胞并使所述的宿主合成所述蛋白，可以获得根据本发明所述的抗真菌蛋白。随后，可以优选地在所述宿主细胞将该蛋白分泌到培养基中之后，从所述宿主细胞回收蛋白。选择性地，可以直接将所述宿主细胞作为可接受的杀虫剂组合物用于根据本发明所述的抵抗真菌病原体的方法。

在获得根据本发明所述的蛋白的方法中适用的宿主细胞可以选自原核微生物宿主如细菌如农杆菌、芽孢杆菌、蓝细菌、大肠杆菌、假单胞菌等，以及真核宿主包括酵母如酿酒酵母、真菌如木霉和植物细胞，包括原生质体。

在植物叶子上或植物叶子附近抑制真菌生长的方法中，宿主细胞可以适当地选自常规用作生物杀真菌剂的种类。

蛋白也可以由微生物合成、得到收集并以农业化学制剂形式施用。

术语蛋白是指通过肽键连接的氨基酸序列。多肽或肽也应认为是蛋白。根据本发明所述的蛋白的突变蛋白可以通过替换、添加和/或缺失一个或多个氨基酸从序列表中所示的蛋白得到，而仍保持其抗真菌活性。采用体内蛋白质工程如通过改变能编码抗真菌蛋白的开放阅读框架从而影响氨基酸序列也可以容易地制备这样的突变蛋白。只要氨基酸序列的改变不完全破坏抗真菌活性，这样的突变蛋白也包含在本发明内。

本发明提供包含能编码根据本发明所述的蛋白的开放阅读框架的嵌合DNA序列。表达嵌合DNA序列是指包括含有不在自然界天然存在的DNA序列的任何DNA序列。例如，嵌合DNA应该指包括在植物基因组非天然位置包含所述开放阅读框架的DNA，尽管所述植物基因组一般在其天然染色体位置含有开放阅读框架的拷贝。相似地，所述的开放阅读框架可以掺入到其非天然存在的植物基因组或非天然存在的复制子或载体如细菌质粒或病毒载体中。嵌合DNA将不限于可在宿主中复制的DNA分子，也包括能连接入复制子的DNA，如通过特定的接头序列与根据本发明所述的开放阅读框架连接的DNA。该开放阅读框架可以或可以不与其天然的上游和下游调控元件连接。

开放阅读框架可以来自基因组文库。对于后者，它可以包含一个或多个分隔构成编码根据本发明所述的蛋白的开放阅读框架的外显子的内含子。开放阅读框架也可以由不间断的外显子或由合成编码根据本发明所述的蛋白的mRNA的cDNA编码。根据本发明所述的开放阅读框架也包含其中已人工除去或加入一个或多个内含子的开放阅读框架。本发明也包含所有这些变体。

编码抗真菌蛋白的嵌合DNA序列也是本发明的一部分，所述的DNA序列包括SEQ ID NO:21-48中所示的一个或多个EST序列。如可以从序列表中得到的，这些至今未知功能的EST与编码从Helianthus和Lactuca分离的蛋白的DNA序列有相当的同源性。

本发明的另一部分由根据本发明所述的蛋白的固有活性形成。已发现它们是碳水化合物氧化酶，能氧化许多不同的单糖和二糖。底物特异性与己糖氧化酶(EC1.1.3.5)，也已知为D-己糖：氧1-氧化还原酶的特异性相似。已证明它们能氧化真菌(来自丝核菌)细胞壁成分的纯化混合物。据信此氧化能力赋予蛋白抗真菌特性。在文献中，有一个抗真菌氧化酶的例子，即来自真菌曲霉(WO95/14784)的葡萄糖氧化酶。然而本发明的蛋白表现类似于己糖氧化酶的底物广谱性并且对于底物具有更低的Km。

已从同源性研究发现根据本发明所述的蛋白的氨基酸序列的某些部分是较保守的并且与常见于氧化酶的序列相关。已发现与网状番荔枝碱氧化酶有最高的同源性，该酶已知来源于罂粟科(Facchini,P.J.等，植物生理学，112,1669-1677,1996)。

为了能够在宿主细胞中表达，根据本发明所述的嵌合DNA通常提供使之能被宿主生物化学机制识别并使开放阅读框架在宿主中转录和/或翻译的调控元件。调控元件通常包括可以适当地从能在所选的宿主细胞中表达的任何基因衍生的转录起始区域以及用于核糖体识别和结合的翻译起始区域。在真核细胞中，表达盒通常还包含位于所述开放阅读框架下游的转录终止区域，使转录终止并出现初始转录物的多聚腺苷化。另外，可以将密码子用法调整为所选宿主接受的密码子用法。控制嵌合DNA构建体在选定宿主细胞中表达的原理为本领域普通技术人员公知，并且现在对于任何种类的宿主细胞，原核细胞或真核细胞，可表达的嵌合DNA构建体的构建是常规技术。

为了在宿主细胞中维持开放阅读框架，开放阅读框架通常以包含与被选定的宿主细胞识别和复制的DNA连接的根据本发明所述的开放阅读框架的复制子形式提供。因此，复制子的选择主要根据所选的宿主细胞决定。指导选择对于特定的所选细胞适合的复制子的原理为本领域普通技术人员熟知。

特定类型的复制子是其本身或其部分能转移到另一宿主细胞如植物细胞中从而将根据本发明所述的开放阅读框架共转移到所述的植物细胞中的复制子。具有这样的能力的复制子在本文中称为载体。所述载体的一个例子是Ti质粒载体，该载体存在于适当宿主如根瘤农杆菌中时能转移其本身的一部分，所谓的T-区域到植物细胞中。目前有不同类型的Ti质粒载体(参见EP0116718B1)常规地用于将嵌合DNA序列转移到植物细胞或原生质体中，从中可以再生其中所述嵌合DNA稳定掺入其基因组的新植株。Ti质粒载体特别优选的形式是如EP0120516B1和US4,940,838中要求保护的所谓双元载体。可用于将根据本发明所述的DNA导入植物宿主的其它适当载体可以选自病毒载体如非整合型植物病毒载体，如源自双链植物病毒(例如CaMV)和单链病毒、双生病毒等的载体。这样的载体的使用尤其是当难于稳定转化植物宿主时有利。对于木本种类，尤其是树和藤可能是这种情况。

术语“在其基因组中掺入根据本发明所述的嵌合DNA序列的宿主细胞”是指包括其基因组稳定掺入了所述嵌合DNA从而维持该嵌合DNA并优选地通过有丝分裂或减数分裂将这样的嵌合DNA的拷贝转移到子代细胞中的细胞以及包含这样的细胞或基本上由这样的细胞组成的多细胞生物。根据本发明优选的实施方案，提供基本上由其基因组掺入了一个或多个拷贝的所述嵌合DNA的细胞组成并能优选地以孟德尔方式将一个或多个拷贝传给其子代的植物。通过根据本发明所述的嵌合DNA在一些或所有植物细胞中的转录和翻译，产生抗真菌蛋白的那些细胞将表现对真菌侵染尤其对致病疫霉侵染增强的抗性。尽管不是完全了解如上所述的指导DNA在植物细胞中转录的原理，但是目前能够以基本上组成型方式，即基本上在植物的大多数细胞类型中和基本上没有严格时间和/或发育限制表达的嵌合DNA的制备是常规技术。用于此目的的常规使用的转录起始区域是可从花椰菜花叶病毒得到的启动子，尤其是35S RNA和19S RNA转录启动子和根瘤农杆菌的所谓的T-DNA启动子，特别值得提及的是胭脂碱合成酶启动子、章鱼碱合成酶启动子(如EP 0122791 B1中公开的)和甘露碱合成酶启动子。另外可以使用植物启动子，它可以是基本上组成型的如水稻肌动蛋白基因启动子或例如器官特异性的如根特异性启动子。选择性地，可以使用可由病原体诱导的启动子如可从马铃薯得到的PRP1启动子(也称为gst1启动子)[Martini N.等(1993),Mol.Gen.Genet.,263,179-186]。启动子的选择不是主要的，尽管有必要说明组成型高水平启动子是略微优选的。进一步已知一些元件，所谓的增强子的重复可以大大增强在其控制下的DNA的表达水平[参见例如：Kay等，(1987)，科学，236:1299-1302:CaMV启动子的-343和-90之间的序列的重复增强该启动子的活性]。除了个别的或双重加强的35S启动子，高水平启动子的例子是光诱导的核酮糖二磷酸羧化酶小亚基(rbcSSU)启动子和叶绿素a/b结合蛋白(Cab)启动子。本发明也涉及包含物理连接的不同启动子区域元件的杂交启动子。众所周知的例子是所谓的CaMV加强的甘露碱合成酶启动子(美国专利5,106,739)，它包含与CaMV增强子连接的甘露碱合成酶启动子。

至于转录终止子区域的必要性，通常认为这样的区域加强了植物细胞中转录的可靠性和效率。因此它的使用在本发明内容中是非常优选的。

至于本发明在不同植物种类中的适用性，不得不提到虽然仅用转基因番茄和烟草植物作为例子来说明本发明的特定实施方案，但是事实上，实际的适应性不限于这些植物种类。任何易于受某些形式的真菌侵袭特别是受卵菌纲如致病疫霉侵袭的植物种类都可以用根据本发明所述的蛋白处理或优选地提供根据本发明所述的嵌合DNA序列使蛋白在一些或所有植物细胞中合成。

尽管例如因为一些植物种类至今仍难以进行遗传转化，所以本发明的一些实施方案可能目前不能实施，但是本发明在这样的植物种类中的实施仅仅是时间问题而不是原则问题，因为遗传转化本身的易受性与构成本发明实施方案的原理无关。

目前对于许多植物种类，包括双子叶和单子叶植物纲，植物种类的转化是常规技术。原则上，只要细胞能够再生为完整植株，任何转化方法都可用于将根据本发明所述的嵌合DNA导入适当的祖细胞。转化方法可以适当选自：用于原生质体的钙/聚乙二醇方法(Klens,EA.等，1982，自然，296,72-74；Negrutiu I.等，1987年6月，植物分子生物学，8,363-373)，原生质体的电穿孔(Shillito R.D.等，1985，生物/技术，3,1099-1102)，向植物材料显微注射(Crossway A.等，1986,Mol.Gen.Genet.,202,179-185)，对各种植物材料的(DNA或RNA包裹的)微粒轰击(Klein T.M.等，1987，自然，327,70)，用(非整合型)病毒侵染等。根据本发明所述的优选的方法包括农杆菌介导的DNA转移。尤其优选的是使用如EP A120516和美国专利4940838中公开的所谓双元载体技术。番茄的转化优选地基本上按照Van Roekel等所述的方法进行[Van Roekel,J.S.C.,Damm,B.,Melchers,L.S.,Koekema,A.(1993)，影响番茄(Lycopersicon esculentum)转化效率的因子，植物细胞报道，12,644-647]。马铃薯的转化优选地基本上按照Koekema等所述的方法进行[Koekema,A.,Huisman,M.J.,Molendijk,L.,van den Elzen,P.J.M.和Cornelissen,B.J.C.(1989)，两种商业马铃薯栽培品种马铃薯X病毒抗性的遗传工程，生物/技术，7,273-278]。

通常，选择存在一个或多个标记物的转化植物细胞或细胞群体，其中所述的标记物由与编码根据本发明所述的蛋白的核酸序列共转化的植物可表达基因编码，此后使转化材料再生为完整植株。

尽管有时认为单子叶植物更难于进行遗传转化，但是有些单子叶植物易于转化，并且可以从转化的细胞或胚、或其它植物材料再生可育的转基因植株。目前，优选的转化单子叶植物的方法是对胚、外植体或悬浮细胞进行微粒轰击和直接DNA摄入或电穿孔(Shimamoto等，1989，自然，338,274-276)。已通过微粒轰击将编码膦丝菌素酰基转移酶(使除草剂膦苏菌素失活的酶)的吸水链霉菌bar基因导入玉米悬浮培养物的成胚细胞得到转基因玉米植物(Gordon-Kamm,1990，植物细胞，2,603-618)。已有报道将遗传材料导入到其它单子叶农作物如小麦和大麦的糊粉原生质体(Lee,1989，植物分子生物学，13,21-30)。已通过选择老化致密和结节的成胚愈伤组织来建立成胚悬浮培养物并从成胚悬浮培养物再生小麦植株(Vasil,1990，生物/技术，8,429-434)。与用于这些农作物的转化系统结合可使本发明应用于单子叶植物。

包括商业上重要的农作物如水稻和玉米的单子叶植物也易于通过农杆菌菌株进行DNA转移[参见WO94/00977；EP0159418 B1；GouldJ,Michael D,Hasegawa O,Ulian EC,Peterson G,Smith RH,(1991)植物生理学，95,426-434]。

在DNA转移和再生后，例如可以利用Southern分析评估假设转化的植株中根据本发明所述的嵌合DNA的存在、拷贝数和/或基因组构成。另外，选择性地可以使用具有本领域普通技术的人员熟知的Northern和/或Western分析检测新导入DNA的表达水平。选择性地，在最初分析之后，对表现新导入的根据本发明所述的嵌合DNA的所需拷贝数和表达水平的转化植物进行抵抗对根据本发明所述的蛋白敏感的病原体如致病疫霉的抗性水平的检测。选择性地，可以对选择的植株进行另一轮转化，例如导入其它基因如编码几丁质酶、葡聚糖酶、渗透蛋白，爪蟾抗菌肽等的基因以便加强抗性水平或增加对如此处所述的体外测试中没有发现对根据本发明所述的蛋白易感的其它真菌的抗性。

其它评估可以包括大田条件下的抗真菌抗性测试，检测可育性、产量和其它特性。这样的测试对于本领域普通技术人员是常规操作。

在这样的评估之后，可以直接培养转化植株，但是通常它们可在新品种育种或制备杂种等情况时用作亲本株系。

许多植物蛋白表现抗真菌活性，然而有一些蛋白本身没有抗真菌活性，但是如果与其它植物蛋白结合使用就产生显著的协同抗真菌效应。在欧洲专利申请440,304 A1中公开了植物可表达的葡聚糖酶基因与来自马铃薯的碱性几丁质酶在转基因植物中同时过量表达导致比仅表达植物可表达的Ⅰ类几丁质酶的植物更高水平的抗性。

几丁质酶、葡聚糖酶、渗透蛋白、爪蟾抗菌肤和根据本发明所述的新型抗真菌蛋白基于不相容的病原体-植物相互作用在侵染的植物组织中积累。根据此观察结果和发现几种蛋白互相增强抗真菌效应的事实，我们预测根据本发明所述的抗真菌蛋白可以适当地用于和与病原体抗性相关的其它蛋白结合。

可以用于与根据本发明所述的蛋白结合的蛋白的例子包括但不限于从大麦(Swegle M.等，1989，植物分子生物学，12,403-412；BalanceG.M.等，1976，加拿大植物科学杂志，56,459-466；Hoj P.B.等，1988,FEBS Lett.,230,67-71；Hoj P.B.等，1989，植物分子生物学，13,31-421989)，大豆(Boller T.等，1983,Planta,157,22-31；Broglie K.E.等，1986,美国国家科学院院报，83,6820-6824；Vogeli U.等，1988,Planta,174,364-372；Mauch F.& Staehelin L.A.,1989，植物细胞，1,447-457)；黄瓜(Motraux J.P.& Boller T.,1986,Physiol.Mol.Plant Pathol.,28,161-169)；韭葱(Spanu P.等，1989,Planta,177,447-455)；玉米(Nasser W.等，1988，植物分子生物学，11,529-538)；燕麦(Fink W.等，1988，植物生理学，88,270-275)，豌豆(Mauch F.等，1984，植物生理学，76,607-611；Mauch F.等，1988，植物生理学，87,325-333)，白杨(Parsons,T.J.等，1989，美国国家科学院院报，86,7895-7899)，马铃薯(Gaynor J.J.,1988，核酸研究，16,5210；Kombrink E.等，1988，美国国家科学院院报，85,782-786；Laflamme D.和Roxby R.,1989，植物分子生物学，13,249-250)，烟草(例如Legrand M.等，1987，美国国家科学院院报，84,89-93)，番茄(Joosten M.H.A.& De Wit P.J.G.M.1989，植物生理学，89,945-951)，小麦(Molano J.等，1979，生物化学杂志，254,4901-4907)等获得的β-1,3-葡聚糖酶和几丁质酶。

为了获得能够组成型表达一个以上嵌合基因的转基因植物，有许多可供选择的方法可以使用，包含下列方法：

A．使用诸如双元质粒上的T-DNA的DNA和与选择性标记基因物理连接的多个修饰基因。此方法的优点是嵌合基因是物理连接的，因此作为单个孟德尔基因座迁移。

B．每个已经能够表达优选地与选择性标记基因偶联的一个或多个嵌合基因的转基因植物与来自含有与另一个选择性标记基因偶联的一个或多个嵌合基因的转基因基因的花粉进行交叉授粉。之后基于两个选择性标记基因的存在或基于嵌合基因本身的存在来选择通过这种杂交获得的种子。之后来自选择的种子的植物可以用于进一步杂交。原则上，嵌合基因不只在单个基因座上，因此基因可以作为独立的基因座分离。

C．使用许多各含有一个或多个嵌合基因和选择性标记的多个嵌合DNA分子如质粒。如果共转化频率高，那么仅基于一个标记物的选择是足够的。在其它情况下，基于一个以上标记物的选择是优选的。

D．用选择性地包含选择性标记基因的新的嵌合DNA连续转化已经含有第一、第二等嵌合基因的转基因植物。如方法B，原则上嵌合基因不是在单个基因座上，因此嵌合基因可以作为独立的基因座分离。

E．上述方案的结合

实际策略可取决于可能易于决定的几种考虑如亲本株系的目的(直接生长，用于育种计划，用于产生杂种)，但是对于所述发明不是关键。

在本文中，应该强调已经含有能编码抗真菌蛋白的嵌合DNA的植物可以形成适于导入根据本发明所述的嵌合DNA的遗传背景以增强抗性水平或扩大抗性。对应于可以适当地用于与DNA结合的蛋白的其它基因的克隆和能相对过量表达所述蛋白的转基因植物的获得以及其在植物中对病原体抗性效应的评估目前在本领域普通技术人员的范围之内。

得到能够表达或相对过量表达根据本发明所述的蛋白的转基因植物是用于阻止由真菌例如诸如致病疫霉的卵菌纲导致的破坏的优选方法，这一点在上面描述中是非常清楚的。但是，本发明不限于此。本发明也清楚地预想到根据本发明所述的蛋白本身，优选地以抗真菌组合物形式的用途。杀真菌组合物包括那些其中以蛋白本身配制的组合物，但也以能合成蛋白从而导致病原体与蛋白接触的宿主细胞如细菌细胞形式存在。适当的宿主细胞例如可以选自无害的细菌和真菌，优选地那些能在植物根部和/或叶部形成菌落的菌。可用于根据本发明所述的方法的细菌宿主的例子是农杆菌属、节杆菌属、固氮螺菌属、假单胞菌属、根瘤菌属等菌株，选择性地在使它们适于该目的之后使用。

含有根据本发明所述的抗真菌蛋白的组合物另外包含如WO91/18984中所述的渗透蛋白样蛋白。本发明独立地提供进一步包含抑制剂如经典的真菌抗生素，SAFP和化学杀真菌剂如多氧菌素、三国霉素、羧酰胺、芳香碳水化合物、萎锈灵、吗啉、固醇生物合成抑制剂、有机磷混合物、酶如葡聚糖酶，几丁质酶，溶菌酶等的抗真菌组合物。本发明的抗真菌蛋白本身或者与其它活性组分结合的施用浓度在1纳克/毫升和1毫克/毫升之间，优选地2纳克/毫升和0.1毫克/毫升之间，pH在3.0到9.0范围内。一般希望使用缓冲制剂，例如浓度在1mM和1M之间，优选地10mM和100mM之间，特别是15和50mM之间的磷酸缓冲液，因此对于低缓冲液浓度的情况，需要加入盐以增加离子强度，优选的是浓度在1mM和1M之间，优选地10mM和100mM之间的氯化钠。

具有针对真菌病，尤其是针对由诸如疫霉和腐霉的卵菌纲引起的病害增强的抗性的相对过量表达根据本发明所述的蛋白的植物或其部分，包括植物变种可以在大田、温室中生长或在室内或其它地方生长。植物或其可食用的部分可以用作动物饲料或人类消费品或加工成为食品、饲料或用于其它任何形式的农业或工业目的。农业应该是指包括园艺、树木栽培、花卉栽培等。可从根据本发明所述的植物材料获利的工业包含但不限于医药工业、纸和纸浆制造工业、制糖工业、饲料和食品工业、酶制备工业等。根据本发明所述的植物或其部分的优点是减少对杀真菌剂处理的需求，因此降低材料、劳力的成本和环境污染或延长这样的植物产品(例如水果，种子等)的储存期。用于本发明目的的植物应该是指能够光合作用的并对一些形式的真菌病易感的多细胞生物体。它们应该至少包括裸子植物和被子植物，单子叶和双子叶植物。

术语“相对过量表达蛋白的植物”应该是指含有表达转化基因编码的蛋白的细胞的植物，其中蛋白在所述植物中不是天然存在的或者如果它由于编码相同蛋白的内源基因而存在，但不以相同量或不在植物的同一细胞、细胞腔隙、组织或器官中存在。例如已知可以将正常在细胞内积累的蛋白导向质外体空间。

根据本发明的另一方面，编码本发明的抗真菌蛋白的植物基因的调控区域可以用于在其控制下表达其它异源序列。使用紧接基因编码区域上游的至少1000碱基对的调控元件足以获得任何异源序列的表达。

在这方面的异源序列是指与所述调控区域天然不结合的基因区域，并且它们包含不同的基因编码区域和反义基因区域。可以有利地在维管组织中表达的异源编码区域包括编码抗病原体蛋白如杀昆虫、杀细菌、杀真菌和杀线虫蛋白的那些区域。在这样的策略中，可以证明选择具有抵抗偏好韧皮部作为营养物(例如蚜虫)或作为侵袭植物入口的病原体或害虫的活性的蛋白非常有利。这样的例子是抗蚜虫的伸展蛋白、植物凝集素或脂肪氧合酶(参见WO93/04177)。假设根据本发明所述的调控区域在木质部有活性，在所述调控区域的控制下可以表达抗真菌蛋白以抵抗镰刀菌属、轮枝孢属、链格孢属和长缘壳属种类。

根据本发明所述的调控区域也可有利地用于调节或控制韧皮部的转运过程。对于本领域技术人员，易于认识到许多其它的应用。

内源基因的一部分以反义方向的表达(例如在EP0233399A中公开的)可以有效地负调节所述内源基因的表达从而具有有利的应用。而且编码根据本发明所述的抗真菌蛋白基因本身可以使用反义方法得到负调节，反义方法可以帮助建立此蛋白的性质和功能。可以利用GUS标记以类似于本文所述方法的方式进一步阐明负责组织特异性表达的区域。

可以考虑以下现有技术特别地作为本发明涉及的本领域一般技术水平：EP-A392225A2；EP-A440304A1；EP-A460753A2；WO90/07001A1；美国专利4940840。

本发明的另一方面是针对新型氧化酶的生产，由于它的低Km，此酶能在低浓度时氧化碳水化合物。更具体地说，己糖是此酶催化活性的底物，尽管其它糖也在较低程度上受影响。此酶可以从其天然存在的来源分离(根据本发明中所述的方法)或从用编码该蛋白的可表达的基因转化的植物或其它有机体分离。这些氧化酶可在工业过程中用于氧化碳水化合物如葡萄糖、甘露糖、半乳糖、纤维二糖、麦芽糖和乳糖。转基因植物的评估

随后评估转基因植物所需特性的存在和/或表达所需特征的程度。最初的评估可以包括新导入基因的表达水平、转化植物对真菌的抗性水平、所需特征的稳定遗传性、大田实验等。

另外，如果需要，可以将转化植物与其它品种如有较高商业价值的品种或已经导入其它所需特性的品种杂交育种或用于制备杂交种子或进行另一轮转化等。协同作用

预期根据本发明所述的抗真菌蛋白之一与植物或微生物来源的其它抗真菌蛋白的结合会表现强烈的协同抗真菌效应。如果将抗真菌CBPs或CHi-V与来自其它植物来源的β-1,3-葡聚糖酶或几丁质酶结合，表现相似的协同抗真菌效应。

显然，病原体诱导的蛋白的结合的协同作用是较普遍的现象，这种现象对于真菌抗性植物的遗传工程有重要价值。

具有针对植物病原真菌的增强抗性的具商业利益的植物或其部分可以在大田中或温室中生长，并且随后用作动物饲料、直接的人类消费品，用于延长储藏期，用于食品或其它工业加工等。根据本发明所述的植物或其部分的优点是降低了对杀真菌剂处理的需求，因此降低了物质、劳力的成本和环境污染或延长了这样的植物产品(例如水果，种子等)的储存期。

实验部分

用于DNA分离、操作和扩增的标准方法以及用于重组DNA复制的适当载体、适当细菌菌株、选择性标记、培养基等例如在Maniatis等，分子克隆：实验室手册，第2版(1989)，冷泉港实验室出版；DNA克隆：Ⅰ和Ⅱ卷(D.N.Glover编，1985)和从基因到克隆(E.L.Winnacker编，1987)中描述。体外抗真菌测试

所有真菌在马铃薯葡萄糖琼脂(Difco)上于25℃培养，除了灰葡萄孢和黑胫茎点霉在燕麦粉琼脂(Difco)上于25℃生长，致病疫霉在黑麦琼脂上于18℃在黑暗中生长(Caten和Jinks,1968)，灰葡萄孢和黑胫茎点霉在UV照射下培养。通过用水淹没琼脂平板收集形成孢子的真菌的孢子。将孢子的浓度调节到10000孢子/毫升。以立枯丝核菌和终极腐霉为例，在马铃薯葡萄糖培养液中于25℃培养液体振荡培养物。收集菌丝体并振荡1分钟以从这些振荡培养物制备接种物。在通过细筛后，将接种物的浓度调节到每毫升2500-5000个片段，每个片段各含1-3个细胞。

对于形成孢子的真菌，所有真菌都在施用蛋白样品之前有和没有预先形成孢子的情况下进行测试。对于不形成孢子的真菌，使用菌丝片段。

在纯化期间，在根据Woloshuk等，1991所述使用真菌致病疫霉和终极腐霉或以相似的方法使用其它真菌的微量滴定板分析中监测抗真菌活性。在24孔微量滴定板的每个孔中，用吸管加入250微升马铃薯葡萄糖琼脂(PDA)。将对于例如致病疫霉的真菌孢子和例如对于终极腐霉的菌丝片段重新悬浮于水中，并向加样孔加入50毫升400-600孢子或200片段。随后加入100微升过滤灭菌(0.22微米)的蛋白溶液(在50mMMES中，pH6.0)。用Parafilm包住微量滴定板并在室温下培养。在开始保温之后的几个时间点，显微监测加入蛋白对真菌的影响。2-3天后，在加样孔中生长的真菌菌丝体用乳酚棉蓝染色并评估生长程度。

GI：生长抑制；使用0-4的评分，0=没有可见的抑制，1=弱抑制(0-30％的抑制)，2=中度(30-60％)抑制，3=强(60-90％)抑制，4=非常强(100％)的抑制。实施例1从用水杨酸诱导的向日葵纯化的抗真菌蛋白MS59

用10mM水杨酸钠每天喷洒7-8周龄的向日葵(向日葵zenulon栽培品种)植株的叶子，共5次。3小时后，用水充分冲洗植物以除去水杨酸钠。在最后喷洒3天后，将叶子(400克)收集到液氮中并使用Waring搅拌器在500毫升0.5M醋酸钠(pH5.2)和4克活性炭中于4℃匀浆。将匀浆液在4层奶酪布(cheese cloth)上过滤并随后将滤液于4℃，20000g离心50分钟。将上清液通过S-Sephadex(Fast-flow,Pharmacia)柱，柱长5厘米、直径5厘米，用40mM醋酸钠(pH5.2)平衡。用上述缓冲液(流速400-500毫升/小时)洗柱直到OD₂₈₀下降到0。结合的蛋白用含400毫摩尔氯化钠的200毫升上述缓冲液洗脱。

在逆着50毫摩尔MES(pH6.0)透析之后，分析洗脱液的抗真菌活性。使用真菌致病疫霉和终极腐霉在微量滴定板分析中监测抗真菌活性。参见上述关于体外测试的细节。随后，再次使用阳离子交换层析，于是将洗脱液通过FPLC Mono-S HP5/5(Pharmacia)并用0-400毫摩尔的氯化钠线性梯度洗脱。所有组分通过使用含有十二烷基硫酸钠(SDS)的12.5％聚丙烯酰胺凝胶电泳[laemmli(1970)，自然，227:680-685]进行分析，使用预染色的分子量标记物(15-105千道尔顿)作为参考。另外，监测所有组分针对致病疫霉和终极腐霉的抗真菌活性。抗真菌活性在45-60毫摩尔NaCl之间从柱中洗脱并且在所有活性组分中可见到59千道尔顿的条带。将含有抗真菌活性的组分合并，并逆着含有1M硫酸铵的50毫摩尔磷酸钾(pH7.0)透析。将合并液进行疏水相互作用层析，于是将样品上样到以相同缓冲液平衡的FPLC苯基Superose HR5/5(Pharmacia)中并用含于50毫摩尔磷酸钾(pH7.0)中的逐渐降低的1-0M硫酸铵线性梯度洗脱。如上所述再将所有组分在SDS-PAGE上分析并监测抗真菌活性。也对不能与此柱结合的蛋白合并组分(FlowThrough,FT)在本文所选的条件下进行这样的分析。抗真菌活性最丰富地存在于FT中，其次也在0.76到0.45mM硫酸铵之间洗脱的组分中。对于这两种情况，在SDS-PAGE中可见59千道尔顿的蛋白。将FT和梯度组分逆着50毫摩尔MES、0.2M氯化钠透析并分别在用相同缓冲液平衡的FPLC Superdex75HR10/30柱上(Pharmacia)层析。根据分子量大小从该柱洗脱蛋白。另外对于这两种情况，59千道尔顿蛋白的存在与如由SDS-PAGE和体外抗真菌测试判断的针对致病疫霉和终极腐霉的抗真菌活性一致。在疏水相互作用柱的FT中存在的59千道尔顿蛋白是最丰富的，称为MS59，其纯化在图1中可见。其在凝胶过滤柱上分离的结果和随后在SDS-PAGE中和对致病疫霉的分析结果在图2中表示。梯度蛋白和M59的几个特征(抗真菌活性，层析特性，分子量)表明这两个蛋白非常相似。

为了进一步鉴定MS59，部分测定其氨基酸序列。因此，在上槽缓冲液含有0.1mM巯基乙酸盐(thioglycolate)和12.5％聚丙烯酰胺凝胶上含有SDS的情况下分离MS59，该聚丙烯酰胺凝胶在上槽缓冲液含有0.05mM谷胱甘肽的情况下于50伏预电泳2小时。用含于45％(体积/体积)甲醇和10％乙酸中的5％(体积/体积)Serva Blue G对凝胶染色30分钟并且在20％(体积/体积)醋酸中脱色30分钟，切下59千道尔顿条带并在Applied Biosystems477A蛋白测序仪上根据由制造商提供的方法利用埃德曼降解测序。MS59的N-末端氨基酸测序表明N-末端被封闭。为了获得内部序列，用胰蛋白酶消化MS59。胰蛋白酶在精氨酸和赖氨酸残基处裂解蛋白。消化产物在反相柱上分离并通过埃德曼降解分析。对两个胰蛋白酶裂解的片段进行了测序：Pep1和Pep2。Pep1的25个氨基酸残基得到鉴定：S-I-N-V-D-I-E-Q-E-T-A-W-V-Q-A-G-A-T-L-G-E-V-Y-Y-R(SEQ ID NO:1)。

氨基酸序列使用单字母符号给出。Pep2的25个氨基酸残基进一步得到鉴定：D-P-S-F-P-I-T-G-E-V-Y-T-P-G-(？)-S-S-F-P-T-V-L-Q-N-Y(SEQ ID NO:2)。

括号内的氨基酸残基没有得到明确鉴定。实施例2从天然PAGE洗脱抗真菌蛋白和随后的测试

从图1和2明显可以看到MS59不是完全纯的。为了进一步确定59千道尔顿蛋白确实对观察到的抗真菌活性负责，使用与如上所述相同的系统，但是不含SDS并在上样之前不煮沸样品，使含有59千道尔顿峰值的组分在天然凝胶上电泳。将凝胶泳道切割成0.5厘米水平方向的小块，每小块单独在50毫摩尔Mes(pH6)中洗脱48小时。离心后，所得上清在SDS-PAGE上进行分析并分析其体外抗真菌活性。结果在图3中表示。只在含有MS59的组分中观察到针对致病疫霉和终极腐霉的抗真菌活性。实施例3针对非卵菌纲的体外抗真菌活性测试

如在总实验部分中所述的进行体外抗真菌活性测试。测试致病疫霉作为阳性对照。MS59峰定位于组分4。结果在表1表示。表1来自Mono-S(pH6)的含有MS59的组分的抗真菌效应

真菌	孢子阶段^*	组分序号
		组分序号								1	2	3	4	5	6	7/8
		尖镰孢腐皮镰孢致病疫霉烟草疫霉恶疫霉终极腐霉PythiumSylvaticum侧雄腐霉	孢子萌发孢子孢子菌丝菌丝菌丝菌丝菌丝	020000000	020210000	020222000	020444422	0303.544412	03.50221000	1	2	3	4	5	6	7/8	03.50111000	03.50000000

^*)孢子=未预先萌发，萌发=萌发至萌发管为孢子长度的3-5倍，菌丝=菌丝片段用作起始接种物。

GI：生长抑制；使用0-4的评分，0=无可见的生长抑制，1=弱(0-30％)抑制，2=中度(30-60％)抑制，3=强(60-90％)抑制，4=非常强(100％)的抑制。

可以看出，腐霉属和疫霉属种类看来对MS59非常敏感。实施例4从用水杨酸诱导的莴苣纯化抗真菌蛋白WL64

用10mM水杨酸钠每天喷洒7-8周龄的莴苣植物(莴苣Lollobionda栽培品种)的叶子，共4天。2小时后，用水充分地冲洗植物以除去水杨酸钠。在第5天，将叶子收集到液氮中并储藏在-80℃直到进一步使用。

将莴苣叶子冻融并使用Waring搅拌器在0.5M醋酸钠(pH5.2)、0.1％β-巯基乙醇[莴苣∶缓冲液=1∶1.5(重量/体积)]和10克活性炭/每千克叶子中于4℃匀浆。将匀浆液于4℃，9000g离心60分钟。随后将上清液在10层奶酪布上过滤，用硫酸铵使滤液达到40％饱和度，于9000g离心30分钟。对含有85％的蛋白和相对于粗匀浆液大于95％的抗真菌活性的所得上清进行疏水相互作用层析。

将上清液用滤纸过滤并上样到苯基Superose6FF High sub柱(Pharmacia，在Pharmacia XK50/20柱中的100毫升柱床体积)上，该柱用含于50毫摩尔磷酸钾缓冲液(pH6.0中的40％(1.45M)硫酸铵(称为缓冲液A)以10毫升/分钟或更低的流速预平衡。用至少10倍柱体积的缓冲液A洗柱，之后在40分钟期间用从100％缓冲液A到20％缓冲液A[50毫摩尔磷酸钾(pH6.0)称为缓冲液B]的降低的盐梯度以10毫升/分钟的流速，接着在30分钟期间用从20％缓冲液A到0％缓冲液A(=100％B)的降低的线性梯度以相同的流速洗脱结合的蛋白。用缓冲液B洗涤该柱另一个45分钟，之后洗脱结束。收集一分钟级分组分(10毫升/分钟)。组分40-75(称为HIC峰)含有抗真菌活性。

将收集的组分浓缩[利用搅拌流动器和YM30千道尔顿膜(Amicon)]并随后用25mM醋酸钠(pH4.5)稀释15倍。以10毫升/分钟的流速将该溶液上样到预先安装的Source S柱(16/20,Pharmacia)上。在用5倍柱体积的所述缓冲液洗柱之后，在60分钟期间用逐渐增加的氯化钠梯度[含于25mM醋酸钠(pH4.5)中的0-0.4氯化钠]以2.5毫升/分钟从该柱洗脱蛋白，收集1分钟级分组分。将组分收集到250微升的1M磷酸钾(pH7.0)中以中和相对酸性的醋酸钠缓冲液。将含有抗真菌活性的组分[组分25-45(0.2-0.3M氯化钠)]合并并称为Source S峰。

将Source S峰浓缩并且缓冲液换为25mM醋酸钠(pH4.5)得到约10毫升的组分，并进行使用Mono S柱(5/5,Pharmacia)的阳离子交换层析。用下面的氯化钠梯度[含于25mM醋酸钠(pH4.5)中的氯化钠]洗脱：0-5分钟，0-0.1M氯化钠；5-20分钟，0.1-0.16M氯化钠；20-21分钟，0.16-0.25M氯化钠；21-31分钟，0.25M氯化钠；31-32分钟，0.25-1.0M氯化钠；随后用1.0M氯化钠洗脱10分钟，之后洗脱结束。抗真菌活性在0.25M氯化钠步骤(通常组分22-30；Mono S峰)期间从该柱洗脱。以1毫升/分钟的流速，将1毫升组分收集到100微升1M磷酸钾(pH 7.0)中。

将Mono S峰浓缩至约0.5-1.0毫升并进行用含于50mM磷酸钾(pH7.0)中的200mM氯化钠作为电泳缓冲液的凝胶过滤层析(Superdex75,10/30,Pharmacia)。样品体积是200微升；流速是0.5毫升/分钟；0.5毫升/级分组分。从柱中洗脱的抗真菌活性在66千道尔顿标记物的位置。将活性组分(SD75峰)与SDS-PAGE上的蛋白模式比较，表明64千道尔顿蛋白是莴苣抗真菌蛋白最有可能的候选者(图6A-C)。该蛋白称为WL64。

将SD75峰缓冲液变换为pH9.5，并根据制造商的说明在Mono P柱(Pharmacia)上进行层析聚焦(chromatophocusing)。尽管有一些分离(在流出物中有3个重叠峰)，但所有活性都在柱的流出物中发现(甚至对于将该柱平衡到pH11.0的情况)。流速是0.5毫升/分钟；0.5毫升/级分组分。将含有抗真菌活性的组分合并，并且将缓冲液变换为50mMMES(pH6.0)。在SDS-PAGE之后对最高纯化的蛋白组分进行考马斯亮蓝染色，表明约6个蛋白条带是最显著的，其中两个条带为64千道尔顿和55千道尔顿，(图7)。推测的两个蛋白在最终组分中的相对量是64千道尔顿蛋白为1/6-1/8,55千道尔顿蛋白为1/2-1/3。虽然在凝胶上表明此柱明显地对64千道尔顿蛋白进行了纯化，但是合并的组分中的比活以及蛋白的回收率下降了很多(参见表2)。

典型的纯化步骤概括于表2中。表2 WL64的纯化

样品或柱蛋白活性比活纯化回收率

(毫克) (GI单位) (GI单位/mg) (X-倍) (％)莴苣(1.54毫克)

提取物 685硫酸铵上清 584 101250 173 1 100

HIC 174 44000 253 1.46 43Source S 38.7 32400 837 4.84 32

Mono S 2.3 8960 3896 22.5 8.8

SD-75 0.452 8200 18142 105 8.1

Mono P 0.137 1752 12788 74 1.7

活性以生长抑制单位(GI单位)表示。4个GI单位代表在如实施例的常规部分所述的体外测试中导致100％的生长抑制的蛋白量。实施例5从天然PAGE洗脱WL64和随后的测试

因为WL64不是完全纯的，所以需进一步研究64千道尔顿蛋白是否确实对观察到的抗真菌活性负责，在没有SDS和β-巯基乙醇并且不煮沸样品的情况下，将含有抗真菌活性峰值的Mono P组分于酸性条件下在天然的10％聚丙烯凝胶上电泳。将两个邻近的凝胶泳道切割成0.3厘米水平方向的小块，一部分直接用于抗真菌测试，另一部分在变性条件下进行SDS-PAGE。生长抑制明显与64千道尔顿蛋白相关，而不与55千道尔顿蛋白相关。实施例6WL64的糖基化

按照说明通过与伴刀豆球蛋白A结合和采用洋地黄毒苷-葡聚糖检测试剂盒(Boehringer)将WL64k以及55千道尔顿蛋白糖基化。两种蛋白对糖肽酶-F处理不敏感，说明糖基化作用可能是O-连接的。实施例7WL64的氨基酸测序

为了进行N-末端氨基酸序列测定，将21微克用量的纯化蛋白(代表约4微克WL64)在7.5％聚丙烯酰胺凝胶上分离，并随后吸印到PVDF膜上。用含于45％(体积/体积)甲醇，10％乙酸中的0.1％Serva Blue G在室温下对膜染色5分钟并且用45％甲醇，10％醋酸脱色。将64千道尔顿条带切下并在Applied Biosystems477A蛋白测序仪上根据由制造商提供的方法利用埃德曼降解测序。

为了进行内部蛋白测序，将105微克纯化蛋白(代表约20微克WL64)在7.5％SDS聚丙烯酰胺凝胶上分离，随后用含于20％甲醇和0.5％乙酸中的0.2％Serva Blue G在室温下对凝胶染色20分钟并用30％甲醇在室温下脱色约1小时。将64千道尔顿条带切下，随后用胰蛋白酶消化蛋白。消化产物在反相柱上分离并通过埃德曼降解分析。

除了N-末端的序列(SEQ ID NO:49)，还对两个胰蛋白酶裂解的片段进行了测序(SEQ ID NO:50和SEQ ID NO:51)。

SEQ ID NO:49:Thr-Ser-Thr-Ser-Ile-Ile-Asp-Arg-Phe-Thr-Gln-(Cys/Ser)-Leu-Asn-Asn-Arg-Ala-Asp-Pro-(Ser)-(Phe)-

SEQ ID NO:50:(Ser)-Ile-(？？？)-Val-(Ser)-Ile-Glu-Asp-Glu-Thr-Ala-(Trp)-Val-Gln-Ala-Gly-Ala-Thr-Leu-Gly-Glu-Val-Tyr-(Tyr)-

SEQ ID NO:51:Ala-Asp-Pro-Ser-Phe-Pro-Leu-Ser-Gly-Gln-Leu-Tyr-Thr-Pro-

括号内的氨基酸残基没有得到明确鉴定。实施例8MS59和WL64的抗真菌活性

根据MS59和WL64之间的序列同源性，两个蛋白看来是互相非常相关的。这一点对于它们的抗真菌活性以及针对相应真菌的比活可能是正确的。对此推测进行测定，结果概括于表3中。表3MS59和WL64的抗真菌活性¹

病原体完全抑制(GI4)所需完全抑制(GI4)所需的

的WL64量 MS59量

(ng/分析) (ng/分析)致病疫霉 10 5终极腐霉 10 5立枯丝核菌 20 10Tanatephorus cucumeris 20 未测试紫卷担菌 15 7.5葱核盘菌 40 20巴斯德毕赤酵母未测试 5灰葡萄孢 200 10

¹抗真菌测试按照总的实验部分中所述的进行。

注意蛋白量通过在SDS-PAGE凝胶上的考马斯亮蓝染色估计，意味着此处所示的蛋白量是指示性的，而不是绝对的。实施例9氧化酶活性

在冰上充分地对50毫升马铃薯葡萄糖培养液中的立枯丝核菌培养物进行超声处理，随后在4℃以3000g离心20分钟。然后将获得的上清液以25000g离心1小时。沉淀用去离子水洗2次并重新悬浮于含有1.0％Triton X-100的1毫升水中。以这种方式获得真菌细胞壁悬浮液。

根据Gallo,1981的方法(Gallo，酶学方法，71:665-668,1981)，使用试剂4-氨基-安替比林(4-AAP)测定氧化酶的活性。500微升的反应体积中含有50mM磷酸钾缓冲液(pH7.0)，0.25微摩尔FAD,10毫摩尔NaN₃,0.01％Triton X-100,6mM2,4,6-三溴羟基苯甲酸，2mM4-AAP和10个单位的辣根过氧化物酶。在510nm处测定过氧化氢的合成。包括已知量的过氧化氢作为标准。

WL64以及MS59利用真菌细胞壁悬浮液作为底物发挥氧化酶活性。随后尽可能以不同的底物如一些碳水化合物和氨基酸(参见实施例10)进行测试。发现葡萄糖和其它碳水化合物可作为WL64以及MS59的氧化酶活性底物。

因为WL64和MS59表现碳水化合物氧化酶和特别地葡萄糖氧化酶活性，所以需要调查真菌细胞壁悬浮液是否可作为来自黑曲霉(Sigma,G2133)的葡萄糖氧化酶(GOX)的底物。的确是这种情况。如通过Lineweaver-Bruk图所示的(图8A)，动力学研究表明葡萄糖用作底物时MS59、WL64和GOX表现Mochaelis-Menten动力学。MS59和WL64的Km值比GOX的值低一个以上数量级：对于WL64和MS59分别是19.5μM和23.3μM，对于GOX为359μM。这意味着MS59和WL64与葡萄糖的亲和性高于GOX。然而WL64、MS59和GOX的Vmax值是相似的，分别为5.7,16.8,9.7μmol过氧化氢/分钟/mg蛋白。

如图8B所示，利用真菌细胞壁悬浮液作为底物的动力学研究表明，对于MS59和WL64表现Mochaelis-Menten动力学，但是对于GOX不是。利用上述的悬浮液，MS59和WL64的Km值分别是4.7μl和24.3μl。MS59和WL64的Vmax值分别为22.0和11.2μmol过氧化氢/分钟/mg蛋白。由于GOX以真菌细胞壁作为底物的Lineweaver-Burk图中不表现线性关系，所示不能从该图中推断出Km值和Vmax值。动力学数据概括于表4中。表4MS59,WL64和葡萄糖氧化酶的动力学参数

酶	葡萄糖		真菌细胞壁悬浮液
	葡萄糖		真菌细胞壁悬浮液		Km(μM)	Vmax(μmol过氧化氢/分钟/mg)	Km(微升)	Vmax(μmol过氧化氢/分钟/mg)
	MS59WL64GOX	23.319.5359	16.85.79.7	4.724.3	Km(μM)	Vmax(μmol过氧化氢/分钟/mg)	Km(微升)	Vmax(μmol过氧化氢/分钟/mg)	22.011.2

实施例10底物特异性

尽可能以不同的底物进行测试。在蔗糖、山梨糖、果糖、羧甲基纤维素、β-丙氨酸、天冬氨酸、几丁质、纤维素、谷氨酸盐，甘氨酸-甘氨酸、昆布糖和葡萄糖之中，只有后者可用作至少WL64的底物。各种底物的浓度可以在5mM和50mM之间变动。进一步调查是否对于MS59和WL64葡萄糖是唯一的底物或者其它碳水化合物也可以被氧化。酶测试按照实施例9所述的进行，底物浓度是50mM。已证明GOX专一氧化葡萄糖(图9)。相同的图也表明MS59和WL64有更宽的底物特异性，即从C4糖到二糖和多糖的范围。用D-葡萄糖、D-甘露糖、D-半乳糖、纤维二糖、麦芽糖和乳糖获得了最高(和几乎相同的活性)(图9)。底物范围类似于由己糖氧化酶(EC.1.1.3.5)转化的范围。实施例11与推测的MS59核苷酸序列同源的基因的鉴定和定性

基于Pep1(SEQ ID NO:1的氨基酸12-22)和Pep2(SEQ ID NO:2的12-22氨基酸)的氨基酸序列，设计用于PCR的引物。基因组DNA从向日葵zebulon栽培品种分离，PCR引物4(5’AAC TTC TCC IAG IGTIGC ICC IGC TTG IAC CCA3’,SEQ ID NO:3)和5(5’GAT CCI TCTTTC CCI ATT ACT GGI GAG GTT TA3’,SEQ ID NO:4)用于进行PCR从向日葵基因组扩增354个碱基对的DNA片段。克隆相当于该片段大小的PCR产物(SEQ ID NO:5)。对产物的序列分析表明存在未间断的开放阅读框架(ORF)(SEQ ID NO:6)，其中氨基酸从头到尾与SEQ IDNO:1和SEQ ID NO:2的氨基酸序列一致。测序的几个克隆在PCR片段中含有1-4个点突变。除了一个突变外，所有这些突变都是沉默突变(核苷酸57位的T突变为C，核苷酸63位的C突变为A，核苷酸225位的A突变为G)，因此它不改变编码的氨基酸序列。但是一个克隆的确含有点突变(核苷酸203位的G突变为A)，它改变氨基酸序列，即68位氨基酸从精氨酸变为赖氨酸。

用SEQ ID NO:5探测向日葵基因组DNA的southern印迹表明基因组中存在大量同源序列。使用SphⅠ，探测到6个条带；EcoRV,5个条带；SpeⅠ,3个条带而NdeⅠ,4个条带。以前用其它酶已观察到3-4个条带。此分析表明存在与MS59序列有(部分)同源性的3个基因。

根据原始PCR引物序列之间的不可变区域设计新的PCR引物。引物：对于3’RACE:5’CAG GCA GCT GTG GTT TGT GGC 3’(SEQID NO:7)，

对于5’RACE:5’GTC CAC AAT GAA GAA GGG TTG 3’(SEQID NO:8)，对于嵌套式3’RACE:5’ACG TAG ATA TCG AAC AAGAAA CCG C3’(SEQ ID NO:9)。

从用10mM水杨酸钠溶液喷洒5次诱导的向日葵叶子材料分离含多聚腺苷酸化的RNA。制备cDNA并按照Marathon^TM试剂盒(Clontech实验室公司，Palo Alto,CA)说明书中所述的进行5’和3’RACE PCR反应。通过5’和3’RACE PCR反应分离了部分cDNA克隆。序列分析证实了部分cDNA克隆的相同性。

然后根据从克隆的5’和3’RACE PCR产物新获得的序列信息设计新的PCR和嵌套式PCR引物。用于5’RACE的引物:5’CTG GGGAAG CCC GTG TAG TAA AGC3’(SEQ ID NO:11),5’CGG GAAGTT GCA GAA GAT TGG GTT G3’(SEQ ID NO:13)，对于嵌套式5’RACE:5’GAG CAA GAG AAG AAG GAG AC3’(SEQ ID NO:14)，对于3’RACE:5’GCT TTA CTA CAC GGG CTT CCC CAG3’(SEQID NO:10)，对于嵌套式3’RACE:5’GGT ACT CCA ACC ACG GCGCTC3’(SEQ ID NO:12)。分离4个部分cDNA克隆，它们加在一起编码完整开放阅读框架，此开放阅读框架包含推测的信号肽，后面接着约59千道尔顿的蛋白及5’和3’UTR(未翻译区域)(SEQ ID NO:15)。其ORF(21位至1608位)编码529个氨基酸残基(SEQ ID NO:16)的1784个碱基对的全长cDNA克隆可由这4个部分cDNA克隆和上述的PCR片段(SEQ ID NO:5)装配起来。

氨基末端的信号序列(Von Heijne等，1983和Von Heijne等，1985)很可能不是完整地存在于起始的19个氨基酸残基中。预测了推测的裂解位点。

将该cDNA克隆的氨基酸序列用于BLAST同源性研究。该序列表现与来自花菱草(Eschscholtzia californica)(Dittrich和Kutchan,1991，美国国家科学院院报。88,9969-9973)和罂粟(Papaversomniferum)(Facchini等，1996，植物生理学，112,1669-1677)的黄连素桥酶(BBE)有很高的同源性。

用SEQ ID NO:16中所示的氨基酸序列对表达序列标签(dbEST)数据库进行BLAST筛选，揭示了拟南芥(SEQ ID NO:21-SEQ IDNO:47)和水稻(SEQ ID NO:48)中MS59蛋白的同系物。

根据与MS59同源的方向将EST序列以有义方向列出。通过在移码位置插入一个或两个额外的未知核苷酸(N或NN)来改变EST克隆的序列以获得与MS59同源的单个翻译框架。实施例12编码WL64的基因的分离和其核苷酸序列的测定

根据WL64蛋白氨基末端的氨基酸序列(SEQ ID NO:49,Thr-Ser-Thr-Ser-Ile-Ile-Asp-Arg-Phe-Thr-Gin-(Cys/Ser)-Leu-Asn-Asn-Arg-Ala-Asp-Pro-(Ser)-(Phe)-)，设计PCR引物(SEQ ID NO:49的氨基酸1-11)。

N-末端的氨基酸序列(SEQ ID NO:49)表现与MS59蛋白(SEQID NO:16的20-39氨基酸残基)的相应部分有很高的同源性。

从用10mM的水杨酸钠溶液喷洒5次诱导的莴苣(莴苣LoHobionda变种)叶子分离含有多聚腺苷酸化的RNA，并从此RNA制备cDNA。PCR引物FR-WL64-142(5’ACT TCT ACT TCT ATT ATTGAT AGG TTT ACT CA3’,SEQ ID NO:52)和MS59引物4(5’AACTTC TCC IAG IGT IGC ICC IGC TTG IAC CCA3’,SEQ ID NO:3)用于从莴苣cDNA库扩增405个碱基对的片段。克隆对应于此PCR片段的PCR产物并测序(SEQ ID NO:53)，揭示了未间断的开放阅读框架(SEQ ID NO:54)。表5表现与MS59有同源性的EST序列

将移码导入以优化EST与MS59序列的匹配。在用移码1和移码2的栏中，列出了移码和移动(框架--→框架)的位置。(-)标记是指没有移码存在。

SEQ IDNO:	EST名称	录入号	框架(1,2,3)	移码1	移码2
SEQ IDNO:	EST名称	录入号	框架(1,2,3)	移码1	移码2	21222324252627282930313233343536373839404142,434445464748	ATTS5925ATTS0345ATTS5268TC13883TC11550P_16053P_22214P_16873ATTS2532TC11456P_8818P_21340P_22585Q_ATTS2533P_17333P_9615Q_ATTS2959P_2730TC9870P_14876P_21353Q_ATTS3343Q_ATS4954Q_ATTS1606P_7866AA0410042RICS2381A	F19886Z17771F14356--R84094N97049R90518Z30784-T45555N96011W43206Z30785H76902T46352Z33920T20722-H36354N96040Z34583F14032Z26512T4460324308D40415	222121233311222121221122123	-202,2--->1298,2--->3177,1--->2--310,2--->3317,3--->2188,3--->1-98,1--->3-367,2--->1------241,2--->189,1--->2-139,2--->1-222,1--->3421,2--->1-	--------312,1--->2------------------

根据定位于原始PCR引物之间的SEQ ID NO:53的序列设计新的PCR引物。用于5’RACE:5’CAC GTT TAT GGA GCG TAA GTTGAA C3’(SEQ ID NO:55)和用于3’RACE:5’CAC CCT TCA CACATT CAA GCA GC3’(SEQ ID NO:56)的引物得到合成并用于按照Marathon^TM cDNA扩增试剂盒(Clontech实验室公司，Palo Alto,CA)说明书中所述进行5’和3’RACE PCR反应。通过5’和3’RACE PCR反应扩增了两个部分cDNA克隆。序列分析证实了部分cDNA克隆的相同性，它们加在一起编码完整开放阅读框架，此开放阅读框架包含推测的信号肽及5’和3’UTR(未翻译区域)。1981个碱基对的全长cDNA克隆得到装配，其ORF(7位至1629位)编码540个氨基酸残基(SEQ IDNO:58)。氨基末端的信号序列由起始的27个氨基酸残基代表。实施例13来自罂粟和花菱草的黄连素桥酶基因的鉴定和分离

从完全发育的花菱草和罂粟(变种Marianne)植物的叶子制备基因组DNA。

设计花菱草基因(EcBBE)的引物，在成熟蛋白的起始处(5’GGTAAT GAT CTC CTT TCT TGT TTG ACC3’,SEQ ID NO:59)和终止密码子(5’AGA GCG GCC GCT ATA TTA CAA CTT CTC CACCAT CAC TCC TC3’,SEQ ID NO:60)紧接TAG终止密码子的下游导入NotⅠ限制性位点。

对于罂粟基因(PsBBE)，以相似的方式设计引物，在推测的成熟蛋白的起始处(5’GGT GAT GTT AAT GAT AAT CTC CTC3’,SEQ IDNO:61)和TAG终止密码子处(5’AGA GCG GCC ACA ATT CCT TCAACA TGT AAA TTT CCT C3’,SEQ ID NO:62)导入NotⅠ限制性位点。

这些引物用于扩增两个BBE基因的成熟蛋白部分。

PCR产物用NotⅠ消化并连接入用EcoRⅤ和NotⅠ消化的pET32a载体(Novagen,Madison,WI)中。采用限制性酶分析和DNA测序证实片段的正确插入。实施例14从拟南芥鉴定和分离MS59的同系物

在我们的BLAST筛选中，鉴定了与MS59有同源性的26个EST。在水稻中发现一种EST，其余的25个都在拟南芥中发现。发现同源EST覆盖了全长MS59序列。对拟南芥表达序列标签的分析发现在蛋白的5’末端有高度同源性的3个EST(SEQ ID NO:21,SEQ ID NO:39和SEQ IDNO:40)，其中SEQ ID NO:39和SEQ ID NO:40是重叠序列。MS59的3’部分表现与7个EST序列(SEQ ID NO:24,27,32,34,41,43和45)有同源性，其中SEQ ID NO:24与SEQ ID NO:43重叠和SEQ ID NO:32与SEQ ID NO:45重叠。

设计与MS59的5’部分(SEQ ID NO:16)同源的两个不同EST位于推测的成熟蛋白部分的起始处的引物(根据由Von Heijne等，1983和VonHeijne等，1985所述的保守序列推测可能的裂解位点)。

如果与MS59氨基酸序列(SEQ ID NO:16)比较，由SEQ ID NO:21代表的EST序列可能丢失了推测成熟蛋白部分的开始3个氨基酸残基，因此通过在引物的5’末端包含9个核苷酸来导入SEQ ID NO:16的氨基酸残基20-22。

位于SEQ ID NO:21的5’端的引物加入了MS59(SEQ ID NO:16)的20-22位残基：5’ACT TCC CGT AGA AAC TCG GAG ACT TTCACA CAA TGC3’(SEQ ID NO:63)。

位于SEQ ID NO:39和SEQ ID NO:40的推测的裂解位点之后的引物：5’TCC ATC CAA GAT CAA TTC ATA AAC TGT GTC(SEQ IDNO:64)。

制备与MS59氨基酸序列(SEQ ID NO:16)的3’部分同源的5个不同EST位于终止密码子周围的引物，并且导入了NotⅠ限制性位点以克隆入pET32a大肠杆菌表达载体。

位于SEQ ID NO:24和SEQ ID NO:43的引物：5’AGA GCGGCC GCT TTC ATG AAC CTA GCT TCT ATG AGG3’(SEQ IDNO:65)。位于SEQ ID NO:27的引物：5’AGA GCG GCC GCG AAATGG CCC CCC TTT TAA AAC GGG G3’(SEQ ID NO:66)。位于SEQID NO:32和SEQ ID NO:41的引物：5’AGA GCG GCC GCA AATGAT ATC TTC AGG TAA CTT TGT TCA C(SEQ ID NO:67)。位于SEQ ID NO:34的引物：5’AGA GCG GCC GCA TAA TCA AAT AAATCA ACT TAT GGT AAC ACA G(SEQ ID NO:68)和位于SEQ IDNO:45的引物：5’AGA GCG GCC GCT GGT TTT GTA TTG AGGACT CAA AAC AG3’(SEQ ID NO:69)。

将5’引物和3’引物的所有可能的结合用于对从拟南芥哥伦比亚栽培品种分离的基因组DNA进行PCR。在使用SEQ ID NO:63和SEQ IDNO:68引物的PCR中，扩增到约1800个碱基对的条带。将该条带克隆，通过DNA测序证实PCR产物的相同性。1757个碱基对的克隆的PCR产物(SEQ ID NO:70)含有从570位到801位的内含子，SEQ ID NO:70的开放阅读框架由508个氨基酸残基组成(SEQ ID NO:71)。

从拟南芥Col-0的在Murashige和Skoog琼脂上黑暗中生长的12天龄无菌幼苗，从在液体Murashige和Skoog培养基上和16小时光周期下生长的12天龄无菌幼苗，从充分生长的植物叶、茎、花和长角果分离总RNA(Newman等，1994，植物生理学106:1241-1255)。合并来自不同发育阶段的RNA。采用多聚腺苷酸QuickmRNA分离试剂盒(Stratagene,La Jolla,CA)分离多聚腺苷酸化RNA并采用Marathon^TMcDNA扩增试剂盒(Clontech实验室公司，Palo Alto,CA)制备cDNA。

用不同的5’引物和3’引物的结合对cDNA库进行PCR反应。用SEQID NO:63和SEQ ID NO:68引物结合扩增到约1600个碱基对的PCR产物。PCR产物克隆到在细菌表达载体pET32a(Novagen,Madison,WI)的EcoRⅤ和NotⅠ限制性位点之间。PCR产物的序列得到测定，并揭示了代表508个氨基酸残基的蛋白(SEQ ID NO:73)的1527个碱基对的未间断开放阅读框架(SEQ ID NO:72)。

用SEQ ID NO:64和SEQ ID NO:65引物结合扩增到约1600个碱基对的第二个cDNA克隆。也将此cDNA克隆连接到pET32a载体(Novagen,Madison,WI)的EcoRⅤ和NotⅠ限制性位点之间。此cDNAPCR克隆也通过DNA测序进行鉴定，它包含编码509个氨基酸残基(SEQID NO:75)的1530个碱基对的未间断开放阅读框架(SEQ ID NO:74)。实施例15MS59，来自罂粟和花菱草的MS59，黄连素桥酶和来自拟南芥哥伦比亚栽培品种的两个同源蛋白在大肠杆菌中的表达

将含有推测的MS59成熟部分的PCR片段导入pET32a载体(Novagen,Madison,WI)并使用DNA测序证实片段的正确插入。然后，将质粒导入大肠杆菌AD494(DE3)pLysS(Novagen,Madison,WI)。然后开始制备几个克隆的少量培养物，其中一半通过加入IPTG至1mM终浓度进行诱导。来自大肠杆菌的总提取物在SDS凝胶上电泳，并且通过考马斯亮蓝染色进行分析。几个克隆表现大大地过量表达MS59蛋白。选择大大过量表达的克隆用于大量培养。用此大肠杆菌培养物接种入补充了0.4mM葡萄糖的500毫升LB中并使之生长到光密度为0.5-0.7。然后加入IPTG至1mM终浓度并使之在30℃合成蛋白3小时。大多数MS59蛋白在不溶的蛋白组分中发现，少量看来是溶解的。所得的不溶蛋白制品主要含有MS59蛋白。将此制品用于制备抗体(实施例17)。将溶解组分用于体外测试以检测MS59是否仍然表现抗真菌活性。

将含有4个MS59/WL64同系物的开放阅读框架的pET32a质粒导入大肠杆菌AD494(DE3)pLysS(Novagen,Madison,WI)。使几个独立克隆的小量培养物生长至光密度0.5-0.7。然后加入IPTG到1mM终浓度并使之于30℃合成蛋白3小时。

分离溶解的和总的蛋白组分。使用SDS-PAGE分析样品，随后进行Neuhoff染色和使用S-Tag Western检测试剂盒(Novagen,Madison,WI)的Western分析。大部分蛋白在不溶的组分中发现，只有少量看来是溶解的。选择强烈过量表达同系物蛋白的克隆用于以1.5升大量培养物生产蛋白。实施例16MS59，来自花菱草和罂粟的MS59,MS59/WL64同系物和来自拟南芥的两个同源蛋白的体外抗真菌活性测试

在大肠杆菌中合成含有N-末端trxA-,His-和S-Tag的MS59蛋白。His-Tag用于在带Ni²⁺的IMAC(固定金属亲和层析)柱上纯化溶解的MS59。通过逐渐提高咪唑浓度洗脱结合的蛋白。此纯化的峰组分含有一些污染的大肠杆菌蛋白。

将此MS59纯化的峰组分逆着50mM MES(pH6.0)透析，并用于使用致病疫霉和终极腐霉的体外测试。对于用致病疫霉和终极腐霉进行体外抗真菌活性测试的标准方法，参见上文。

作为对照处理，我们以一些大肠杆菌蛋白背景测试了从相同表达宿主纯化的不相关的组氨酸标鉴蛋白。也包括煮沸的MS59对照(在100℃加热10分钟)。在致病疫霉测试中测试约40纳克融合蛋白，此用量的两倍用于终极腐霉抑制测试。

用Parafilm包住微量滴定板盘并在黑暗中室温下培养。2-3天后，加样孔中正在生长的真菌菌丝体用乳酚棉兰染色并评估其生长程度。

来自含有MS59的大肠杆菌可溶组分的IMAC组分在20-40纳克浓度时表现对致病疫霉和终极腐霉的完全抑制。表6来自大肠杆菌的MS59对致病疫霉的抗真菌效应

组分	大肠杆菌MS59	煮沸的大肠杆菌MS59	大肠杆菌His蛋白	MES缓冲液
组分	大肠杆菌MS59	煮沸的大肠杆菌MS59	大肠杆菌His蛋白	MES缓冲液	生长抑制	4	0	0	0
提取物用量	5微升	5微升	5微升		生长抑制	4	0	0	0

以0(没有抑制作用)到4(完全抑制生长)的线性评分对生长抑制(GI)进行目测评估。表7来自大肠杆菌的MS59对致病疫霉的抗真菌效应

组分	大肠杆菌MS59	煮沸的大肠杆菌MS59	大肠杆菌His蛋白	MES缓冲液
组分	大肠杆菌MS59	煮沸的大肠杆菌MS59	大肠杆菌His蛋白	MES缓冲液	生长抑制	4	0	0	0
提取物用量	10微升	10微升	10微升		生长抑制	4	0	0	0

加样孔的显微分析表明在各个对照中致病疫霉游动孢子的快速萌发和随后的生长。在含有来自大肠杆菌的MS59的反应物中的萌发几乎完全受到抑制。一些孢子的确萌发，但是菌丝尖生长看来在起始之后立即停止。48小时后，致病疫霉菌丝体的生长在对照中很充分，但在含有MS59的测试中几乎检测不到。甚至在72小时后也基本上没有观察到生长。在含有MS59的反应物中真菌菌丝体看似粒状并且变稠。与大肠杆菌合成的MS59一起培养的真菌生长的典型模式的例子在图4中表示。48小时和72小时后，对照培养中的真菌生长是如此地充分以致无法采到可摄影的材料。存在MS59时的培养导致进一步生长的完全抑制，在24小时观察到的萌芽管没有明显的进一步延伸。

同样，在终极腐霉抑制测试中，如果使用菌丝体片段，对于用MS59处理没有明显的生长(参见图5)。24小时后，对照反应物菌丝体完全过度生长。MS59处理的样品中在该阶段只有小的菌丝体片段。

在大肠杆菌(pET32a)中表达罂粟同系物并测试对致病疫霉和终极腐霉的体外抗真菌活性。将致病疫霉的孢子和终极腐霉的菌丝片段分别悬浮于无菌水或马铃薯葡萄糖培养液(PDB)中。向各个加样孔加入400-600个孢子或200片段/50微升。

用IMAC柱层析部分纯化表达的蛋白。将含有表达的蛋白的组分变换到50mM MSE(pH6.0)缓冲液(过滤灭菌)中并用IMAC纯化的大肠杆菌pET-MS59作为阳性对照测试其抗真菌活性。

对于花菱草和罂粟的MS59/WL64同系物，没有观察到抗真菌活性，甚至在比阳性对照高10倍的浓度下也没有导致对两种真菌的100％生长抑制。这意味着这些大肠杆菌表达的蛋白没有正确的折叠，因此没有表现生物学活性。实施例17针对变性MS59制备抗体

在兔中针对变性MS59(来自不溶的大肠杆菌组分的可溶化形式)制备抗体。该抗体表现仅与具有抗真菌活性和葡萄糖氧化酶活性的pMOG1180烟草植株的IF(实施例18和19)中的约60千道尔顿条带有交叉反应。令人惊奇的是，没有发现与WL64的交叉反应。实施例18构建MS59克隆以在转基因植物中表达

基于ATG起始密码子和TGA终止密码子周围的序列设计PCR引物以用于克隆开放阅读框架(ORF)。通过使用引物：5’CC GCC ATGGAG ACT TCC ATT CTT ACT C3’(SEQ ID NO:16)进行PCR在ATG起始密码子处导入NcoⅠ限制性位点用于与组成型启动子融合。由于导入的NcoⅠ限制性位点，将ORF的第二个密码子从caa(Q)变为gag(E)。

通过使用引物：5’GCC GGA TCC TCA AGA TGA CAA AGTTGG GAT GCT3’(SEQ ID NO:18)进行PCR在TGA终止密码子的下游导入BamHⅠ限制性位点。

用pfu DNA聚合酶进行PCR反应，我们利用PCR引物扩增完整ORF以在起始密码子处导入NcoⅠ限制性位点并在紧接终止密码子的下游导入BamHⅠ限制性位点。通过测序证实DNA序列的正确性(SEQ IDNO:19)。将整个ORF与允许在大部分植物中高水平蛋白表达的组成型启动子连接。在ORF后导入含有多聚腺苷酸化所需序列(An等，1989，植物细胞，1,115-122)的马铃薯蛋白酶抑制剂Ⅱ的3’非翻译区域(Thirnburg等，1987，美国国家科学院院报，84,744-748)。将得到的嵌合基因导入双元载体pMOG800(于1993年8月12日保藏于真菌菌种保藏中心，Barrn，荷兰，保藏号为CBS414.93)。将获得的携带在ocs-mas杂交启动子(WO95/14098)控制下的MS59构建体的pMOG1180克隆导入适于转化目的农作物番茄和马铃薯的根瘤农杆菌EHA105菌株，适于转化烟草和拟南芥的MOG101菌株和适于转化欧洲油菜的MOG301。实施例19含有MS59基因构建体的转基因烟草和马铃薯植株的制备和分析

利用农杆菌介导的转化系统将含有如实施例18所述的MS59基因构建体的双元构建体导入烟草和马铃薯。使这些不同植物种类的转基因幼苗再生为完整植株，随后，分析原始转化子中新导入的MS59基因的表达。采用对与BSA偶联的MS59肽特异的抗体进行此Western印迹技术分析。以1∶5000稀释所有抗血清。使用纯化蛋白的一系列浓度(12.5,25,50和100纳克)来鉴定转基因植物中导入蛋白的表达水平。将转基因样品在50mM醋酸钠缓冲液(pH5.2)中匀浆并通过离心使提取物澄清。将上清液直接用于分析或在冰上放置过夜以沉淀。过夜沉淀之后总是随后进行澄清(通过离心)。使用Bradford试剂(Bradford,1976，生物化学分析，72,248-254)和BSA作为标准蛋白以任一方式测定所得上清的蛋白浓度。将尽可能多的蛋白(但不超过10纳克)上样到12.5％聚丙烯酰胺凝胶(laemmli，同上)上并且如前所述进行免疫印迹(Ponstein等，同上)。

通过在含50mM醋酸钠的缓冲液(pH5.2)中研磨叶段从MS59转基因烟草和马铃薯植物制备提取物。之后，通过离心去除不溶性蛋白。测定溶解蛋白总含量并且将10微克等价物上样到SDS凝胶上。在凝胶电泳之后，将蛋白转移成印迹。利用针对纯化MS59制备的抗血清(实施例17)使此印迹显色。MS59特异的抗血清以1∶5000稀释度使用。纯化MS59也在胶的另一侧电泳，并包括它作为参考。根据MS59蛋白的高水平表达选择的转化植物和S1子代植物在真菌抗性测试中得到测试。实施例20从烟草转基因植株纯化MS59转基因蛋白

制备组成型表达MS59的转基因烟草植株。利用Western分析测定表达水平。对转基因材料的提取物进行针对致病疫霉和终极腐霉的体外生长抑制活性测试。从含有pMOG1180构建体(mas-ocs-启动子-MS59)的烟草和烟草对照株系的体外叶子制备小量总提取物。通过在50mM醋酸钠(pH5.2)中研磨叶片材料来制备提取物。将上清液逆着50mM MES(pH6.0)透析并按照在总的实验部分所述的方法测试体外抗真菌活性。与其它株系或对照株系相比，一些烟草pMOG1180株系表现针对致病疫霉和终极腐霉的高抗真菌活性。实施例21碳水化合物氧化酶活性/MS59在转基因烟草中的定位

测试等量的部分纯化的溶解MS59和溶解的同系物组分(罂粟，花菱草，拟南芥A11和B7)的碳水化合物氧化酶活性。MS59的碳水化合物氧化酶活性是0.011ODu/分钟，同系物为0.0003-0.0012ODu/分钟，差距是10倍。

在后阶段，从表现体外抗真菌活性的实施例20的转基因烟草pMOG1180株系分离IF并用于测试碳水化合物氧化酶活性。在IF分离后留下的物质(称为“-IF”)也用于测试。表现抗真菌活性的相同株系具有高碳水化合物氧化酶活性。该活性定位于IF。实施例22将含有在组成型植物启动子控制下的Chi-Ⅰ、GluⅠ、AP24和MS59的4个基因构建体导入番茄、马铃薯、胡萝卜、欧洲油菜和拟南芥

采用农杆菌介导的转化系统，将含有编码Chi-Ⅰ,Glu-Ⅰ,AP24和MS59的基因的双元构建体pMOG1145和pMOG1180或含有编码Chi-Ⅰ,Glu-Ⅰ,bPR-1和MS59的pMOG1146导入不同农作物种类，包括番茄、马铃薯、胡萝卜、欧洲油菜和拟南芥。在真菌侵染测试中测试S1子代植株。

序列表

(1)基本信息：

(ⅰ)申请人：

(A)名称：MOGEN International nv

(B)街道：Einsteinweg97

(C)城市：Leiden

(E)国家：荷兰

(F)邮编(ZIP):2333CB

(G)电话：31-(0)71-5258282

(H)电传：31-(0)71-5221471

(ⅱ)发明名称：抗真菌蛋白及其编码DNA和掺入此DNA的宿主

(ⅲ)序列数：75

(ⅴ)计算机可读形式：

(A)媒介类型：软盘

(B)计算机：IBM PC兼容机

(C)操作系统：PC-DOS/MS-DOS

(D)软件：Patentln Release#1.0，版本#1.25(EPO)

(ⅵ)优先申请资料：

(A)申请号：EP96.202.466.7

(B)申请日：1996年9月4日

(ⅵ)优先申请资料：

(A)申请号：EP97.200.831.2

(B)申请日：1997年3月10日

(2)关于SEQ ID NO:1的信息：

(ⅰ)序列特征：

(A)长度：25个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线形(ⅱ)分子类型：蛋白质(ⅲ)假设：否(ⅲ)反义：否(ⅴ)片段类型：内部(ⅵ)原始来源：

(A)生物：向日葵

(B)株系：栽培品种zebulon(ⅹⅰ)序列描述：SEQ ID NO:1Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp Val Gln Ala Gly1 5 10 15Ala Thr Leu Gly Glu Val Tyr Tyr Arg

20 25(2)关于SEQ ID NO:2的信息：

(ⅰ)序列特征：

(A)长度：25个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅲ)假设：否

(ⅲ)反义：否

(ⅴ)片段类型：内部

(ⅵ)原始来源：

(A)生物：向日葵

(B)株系：栽培品种zebulon

(ⅹⅰ)序列描述：SEQ ID NO:2Asp Pro Ser Phe Pro Ile Thr Gly Glu Val Tyr Thr Pro Gly Xaa Ser1 5 10 15Ser Phe Pro Thr Val Leu Gln Asn Tyr

20 25(2)关于SEQ ID NO:3的信息：

(ⅰ)序列特征：

(A)长度：33个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅸ)特征：

(A)名称/关键词：mis-特征

(B)位置：1

(D)其它信息：/功能=“引物”

(ⅹⅰ)序列描述：SEQ ID NO:3AACTTCTCCN AGNGTNGCNC CNGCTTGNAC CCA 33(2)关于SEQ ID NO:4的信息：

(ⅰ)序列特征：

(A)长度：32个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：是

(ⅸ)特征：

(A)名称/关键词：mis-特征

(B)位置：1

(D)其它信息：/功能=“引物”

(ⅹⅰ)序列描述：SEQ ID NO:4:GATCCNTCTT TCCCNATTAC TGGNGAGGTT TA 32(2)关于SEQ ID NO:5的信息：

(ⅰ)序列特征：

(A)长度：354个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：DNA(基因组)

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：向日葵

(B)株系：栽培品种zebulon

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..354

(ⅹⅰ)序列描述：SEQ ID NO:5:GAT CCG TCT TTC CCG ATT ACT GGG GAG GTT TAC ACT CCC GGA AAC TCA 48Asp Pro Ser Phe Pro Ile Thr Gly Glu Val Tyr Thr Pro Gly Asn Ser1 5 10 15TCT TTT CCT ACC GTC TTG CAA AAC TAC ATC CGA AAC CTT CGG TTC AAT 96Ser Phe Pro Thr Val Leu Gln Asn Tyr Ile Arg Asn Leu Arg Phe Asn

20 25 30GAA ACT ACC ACA CCA AAA CCC TTT TTA ATC ATC ACA GCC GAA CAT GTT 144Glu Thr Thr Thr Pro Lys Pro Phe Leu Ile Ile Thr Ala Glu His Val

35 40 45TCC CAC ATT CAG GCA GCT GTG GTT TGT GGC AAA CAA AAC CGG TTG CTA 192Ser His Ile Gln Ala Ala Val Val Cys Gly Lys Gln Asn Arg Leu Leu

50 55 60CTG AAA ACC AGA AGC GGT GGT CAT GAT TAT GAA GGT CTT TCC TAC CTT 240Leu Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Leu65 70 75 80ACA AAC ACA AAC CAA CCC TTC TTC ATT GTG GAC ATG TTC AAT TTA AGG 288Thr Asn Thr Asn Gln Pro Phe Phe Ile Val Asp Met Phe Asn Leu Arg

85 90 95TCC ATA AAC GTA GAT ATC GAA CAA GAA ACC GCA TGG GTC CAA GCC GGC 336Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp Val Gln Ala Gly

100 105 110GCC ACC CTC GGA GAA GTT 354Ala Thr Leu Gly Glu Val

115(2)关于SEQ ID NO:6的信息：

(ⅰ)序列特征：

(A)长度：118个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:6Asp Pro Ser Phe Pro Ile Thr Gly Glu Val Tyr Thr Pro Gly Asn Ser1 5 10 15Ser Phe Pro Thr Val Leu Gln Asn Tyr Ile Arg Asn Leu Arg Phe Asn

20 25 30Glu Thr Thr Thr Pro Lys Pro Phe Leu Ile Ile Thr Ala Glu His Val

35 40 45Ser His Ile Gln Ala Ala Val Val Cys Gly Lys Gln Asn Arg Leu Leu

50 55 60Leu Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Leu65 70 75 80Thr Asn Thr Asn Gln Pro Phe Phe Ile Val Asp Met Phe Asn Leu Arg

85 90 95Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp Val Gln Ala Gly

100 105 110Ala Thr Leu Gly Glu Val

115(2)关于SEQ ID NO:7的信息：

(ⅰ)序列特征：

(A)长度：21个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅸ)特征：

(A)名称/关键词：misc-特征

(B)位置：1

(D)其它信息：/功能=“引物”

(ⅸ)序列描述：SEQ ID NO:7:CAGGCAGCTG TGGTTTGTGG C 21(2)关于SEQ ID NO:8的信息：

(ⅰ)序列特征：

(A)长度：21个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅸ)特征：

(A)名称/关键词：misc-特征

(B)位置：1

(D)其它信息：/功能=“引物”

(ⅸ)序列描述：SEQ ID NO:8:GTCCACAATG AAGAAGGGTT G 21(2)关于SEQ ID NO:9的信息：

(ⅰ)序列特征：

(A)长度：25个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅸ)特征：

(A)名称/关键词：misc-特征

(B)位置：1

(D)其它信息：/功能=“引物”

(ⅸ)序列描述：SEQ ID NO:9ACGTAGATAT CGAACAAGAA ACCGC 25(2)关于SEQ ID NO:10的信息：

(ⅰ)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅸ)序列描述：SEQ ID NO:10GCTTTACTAC ACGGGCTTCC CCAG 24(2)关于SEQ ID NO:11的信息：

(ⅰ)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅸ)序列描述：SEQ ID NO:11CTGGGGAAGC CCGTGTAGTA AAGC 24(2)关于SEQ ID NO:12的信息：

(ⅰ)序列特征：

(A)长度：21个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅸ)序列描述：SEQ ID NO:12GGTACTCCAA CCACGGCGCT C 21(2)关于SEQ ID NO:13的信息：

(ⅰ)序列特征：

(A)长度：25个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅸ)序列描述：SEQ ID NO:13CGGGAAGTTG CAGAAGATTG GGTTG 25(2)关于SEQ ID NO:14的信息：

(ⅰ)序列特征：

(A)长度：20个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅹⅰ)序列描述：SEQ ID NO:14GAGCAAGAGA AGAAGGAGAC 20(2)关于SEQ ID NO:15的信息：

(ⅰ)序列特征：

(A)长度：1784个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：向日葵

(B)株系：栽培品种zebulon

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：21..1608

(ⅹⅰ)序列描述：SEQ ID NO:15ATATCACATC TTCTTTCAAC ATG CAA ACT TCC ATT CTT ACT CTC CTT CTT 50

Met Gln Thr Ser Ile Leu Thr Leu Leu Leu

1 5 10CTC TTG CTC TCA ACC CAA TCT TCT GCA ACT TCC CGT TCC ATT ACA GAT 98Leu Leu Leu Ser Thr Gln Ser Ser Ala Thr Ser Arg Ser Ile Thr Asp

15 20 25CGC TTC ATT CAA TGT TTA CAC GAC CGG GCC GAC CCT TCA TTT CCG ATA 146Arg Phe Ile Gln Cys Leu His Asp Arg Ala Asp Pro Ser Phe Pro Ile

30 35 40ACC GGA GAG GTT TAC ACT CCC GGA AAC TCA TCT TTT CCT ACC GTC TTG 194Thr Gly Glu Val Tyr Thr Pro Gly Asn Ser Ser Phe Pro Thr Val Leu

45 50 55CAA AAC TAC ATC CGA AAC CTT CGG TTC AAT GAA ACT ACC ACA CCA AAA 242Gln Asn Tyr Ile Arg Asn Leu Arg Phe Asn Glu Thr Thr Thr Pro Lys

60 65 70CCC TTT TTA ATC ATC ACA GCC GAA CAT GTT TCC CAC ATT CAG GCA GCT 290Pro Phe Leu Ile Ile Thr Ala Glu His Val Ser His Ile Gln Ala Ala75 80 85 90GTG GTT TGT GGC AAA CAA AAC CGG TTG CTA CTG AAA ACC AGA AGC GGT 338Val Val Cys Gly Lys Gln Asn Arg Leu Leu Leu Lys Thr Arg Ser Gly

95 100 105GGT CAT GAT TAT GAA GGT CTT TCC TAC CTT ACA AAC ACA AAC CAA CCC 386Gly His Asp Tyr Glu Gly Leu Ser Tyr Leu Thr Asn Thr Asn Gln Pro

110 115 120TTC TTC ATT GTG GAC ATG TTC AAT TTA AGG TCC ATA AAC GTA GAT ATC 434Phe Phe Ile Val Asp Met Phe Asn Leu Arg Ser Ile Asn Val Asp Ile

125 130 135GAA CAA GAA ACC GCA TGG GTC CAA GCC GGT GCG ACT CTT GGT GAA GTG 482Glu Gln Glu Thr Ala Trp Val Gln Ala Gly Ala Thr Leu Gly Glu Val

140 145 150TAC TAT CGA ATA GCG GAG AAA AGT AAC AAG CAT GGT TTT CCG GCA GGG 530Tyr Tyr Arg Ile Ala Glu Lys Ser Asn Lys His Gly Phe Pro Ala Gly155 160 165 170GTT TGT CCA ACG GTT GGC GTT GGT GGG CAT TTT AGT GGT GGT GGG TAT 578Val Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr

175 180 185GGT AAT TTG ATG AGA AAA TAT GGT TTG TCG GTT GAT AAT ATT GTT GAT 626Gly Asn Leu Met Arg Lys Tyr Gly Leu Ser Val Asp Asn Ile Val Asp

190 195 200GCT CAA ATA ATA GAT GTG AAT GGC AAG CTT TTG GAT CGA AAG AGT ATG 674Ala Gln Ile Ile Asp Val Asn Gly Lys Leu Leu Asp Arg Lys Ser Met

205 210 215GGT GAG GAT TTG TTT TGG GCG ATC ACC GGC GGT GGT GGT GTT AGT TTT 722Gly Glu Asp Leu Phe Trp Ala Ile Thr Gly Gly Gly Gly Val Ser Phe

220 225 230GGT GTG GTT CTA GCC TAC AAA ATC AAA CTA GTT CGT GTT CCG GAG GTT 770Gly Val Val Leu Ala Tyr Lys Ile Lys Leu Val Arg Val Pro Glu Val235 240 245 250GTG ACC GTG TTT ACC ATT GAA AGA AGA GAG GAA CAA AAC CTC AGC ACC 818Val Thr Val Phe Thr Ile Glu Arg Arg Glu Glu Gln Asn Leu Ser Thr

255 260 265ATC GCG GAA CGA TGG GTA CAA GTT GCT GAT AAG CTA GAT AGA GAT CTT 866Ile Ala Glu Arg Trp Val Gln Val Ala Asp Lys Leu Asp Arg Asp Leu

270 275 280TTC CTT CGA ATG ACC TTT AGT GTC ATA AAC GAT ACC AAC GGT GGA AAG 914Phe Leu Arg Met Thr Phe Ser Val Ile Asn Asp Thr Asn Gly Gly Lys

285 290 295ACA GTC CGT GCT ATC TTT CCA ACG TTG TAC CTT GGA AAC TCG AGG AAT 962Thr Val Arg Ala Ile Phe Pro Thr Leu Tyr Leu Gly Asn Ser Arg Asn

300 305 310CTT GTT ACA CTT TTG AAT AAA GAT TTC CCC GAG TTA GGG TTG CAA GAA 1010Leu Val Thr Leu Leu Asn Lys Asp Phe Pro Glu Leu Gly Leu Gln Glu315 320 325 330TCG GAT TGT ACT GAA ATG AGT TGG GTT GAG TCT GTG CTT TAC TAC ACG 1058Ser Asp Cys Thr Glu Met Ser Trp Val Glu Ser Val Leu Tyr Tyr Thr

335 340 345GGC TTC CCC AGT GGT ACT CCA ACC ACG GCG CTC TTA AGC CGT ACT CCT 1106Gly Phe Pro Ser Gly Thr Pro Thr Thr Ala Leu Leu Ser Arg Thr Pro

350 355 360CAA AGA CTC AAC CCA TTC AAG ATC AAA TCC GAT TAT GTG CAA AAT CCT 1154Gln Arg Leu Asn Pro Phe Lys Ile Lys Ser Asp Tyr Val Gln Asn Pro

365 370 375ATT TCT AAA CGA CAG TTC GAG TTC ATC TTC GAA AGG CTG AAA GAA CTT 1202Ile Ser Lys Arg Gln Phe Glu Phe Ile Phe Glu Arg Leu Lys Glu Leu

380 385 390GAA AAC CAA ATG TTG GCT TTC AAC CCA TAT GGT GGT AGA ATG AGT GAA 1250Glu Asn Gln Met Leu Ala Phe Asn Pro Tyr Gly Gly Arg Met Ser Glu395 400 405 410ATA TCC GAA TTC GCA AAG CCT TTC CCA CAT AGA TCG GGT AAC ATA GCG 1298Ile Ser Glu Phe Ala Lys Pro Phe Pro His Arg Ser Gly Asn Ile Ala

415 420 425AAA ATT CAA TAC GAA GTA AAC TGG GAG GAT CTT AGC GAT GAA GCC GAA 1346Lys Ile Gln Tyr Glu Val Asn Trp Glu Asp Leu Ser Asp Glu Ala Glu

430 435 440AAT CGT TAC TTG AAT TTC ACA AGG CTG ATG TAT GAT TAC ATG ACC CCA 1394Asn Arg Tyr Leu Asn Phe Thr Arg Leu Met Tyr Asp Tyr Met Thr Pro

445 450 455TTT GTG TCG AAA AAC CCT AGA AAA GCA TTT TTG AAC TAT AGG GAT TTG 1442Phe Val Ser Lys Asn Pro Arg Lys Ala Phe Leu Asn Tyr Arg Asp Leu

460 465 470GAT ATT GGT ATC AAC AGC CAT GGC AGG AAT GCT TAT ACT GAA CGA ATG 1490Asp Ile Gly Ile Asn Ser His Gly Arg Asn Ala Tyr Thr Glu Gly Met475 480 485 490GTT TAT GGG CAC AAG TAT TTC AAA GAG ACA AAT TAC AAG AGG CTA GTA 1538Val Tyr Gly His Lys Tyr Phe Lys Glu Thr Asn Tyr Lys Arg Leu Val

495 500 505AGT GTG AAG ACT AAA GTT GAT CCT GAC AAC TTC TTT AGG AAT GAG CAA 1586Ser Val Lys Thr Lys Val Asp Pro Asp Asn Phe Phe Arg Asn Glu Gln

510 515 520AGC ATC CCA ACT TTG TCA TCT T GAAGAACGTA CATATATAAA TAAATACCTT 1638Ser Ile Pro Thr Leu Ser Ser

525TGTGCATGGT ATTTTCAGGG TGTTAAAGTG ATATTCAGAT ATTTATGATA GAATTTTGAC 1698TTGTATTTTA TACAATCAAA ATTGTATGGT TCTCCGAATT TCTCTTTTTA ATTCTGAAAA 1758ATACATATTA GTATTGTCAA AAAAAA 1784(2)关于SEQ ID NO:16的信息：

(ⅰ)序列特征：

(A)长度：529个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:16Met Gln Thr Ser Ile Leu Thr Leu Leu Leu Leu Leu Leu Ser Thr Gln1 5 10 15Ser Ser Ala Thr Ser Arg Ser Ile Thr Asp Arg Phe Ile Gln Cys Leu

20 25 30His Asp Arg Ala Asp Pro Ser Phe Pro Ile Thr Gly Glu Val Tyr Thr

35 40 45Pro Gly Asn Ser Ser Phe Pro Thr Val Leu Gln Asn Tyr Ile Arg Asn

50 55 60Leu Arg Phe Asn Glu Thr Thr Thr Pro Lys Pro Phe Leu Ile Ile Thr65 70 75 80Ala Glu His Val Ser His Ile Gln Ala Ala Val Val Cys Gly Lys Gln

85 90 95Asn Arg Leu Leu Leu Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly

100 105 110Leu Ser Tyr Leu Thr Asn Thr Asn Gln Pro Phe Phe Ile Val Asp Met

115 120 125Phe Asn Leu Arg Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp

130 135 140Val Gln Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr Arg Ile Ala Glu145 150 155 160Lys Ser Asn Lys His Gly Phe Pro Ala Gly Val Cys Pro Thr Val Gly

165 170 175Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Asn Leu Met Arg Lys

180 185 190Tyr Gly Leu Ser Val Asp Asn Ile Val Asp Ala Gln Ile Ile Asp Val

195 200 205Asn Gly Lys Leu Leu Asp Arg Lys Ser Met Gly Glu Asp Leu Phe Trp

210 215 220Ala Ile Thr Gly Gly Gly Gly Val Ser Phe Gly Val Val Leu Ala Tyr225 230 235 240Lys Ile Lys Leu Val Arg Val Pro Glu Val Val Thr Val Phe Thr Ile

245 250 255Glu Arg Arg Glu Glu Gln Asn Leu Ser Thr Ils Ala Glu Arg Trp Val

260 265 270Gln Val Ala Asp Lys Leu Asp Arg Asp Leu Phe Leu Arg Met Thr Phe

275 280 285Ser Val Ile Asn Asp Thr Asn Gly Gly Lys Thr Val Arg Ala Ile Phe

290 295 300Pro Thr Leu Tyr Leu Gly Asn Ser Arg Asn Leu Val Thr Leu Leu Asn305 310 315 320Lys Asp Phe Pro Glu Leu Gly Leu Gln Glu Ser Asp Cys Thr Glu Met

325 330 335Ser Trp Val Glu Ser Val Leu Tyr Tyr Thr Gly Phe Pro Ser Gly Thr

340 345 350Pro Thr Thr Ala Leu Leu Ser Arg Thr Pro Gln Arg Leu Asn Pro Phe

355 360 365Lys Ile Lys Ser Asp Tyr Val Gln Asn Pro Ile Ser Lys Arg Gln Phe

370 375 380Glu Phe Ile Phe Glu Arg Leu Lys Glu Leu Glu Asn Gln Met Leu Ala385 390 395 400Phe Asn Pro Tyr Gly Gly Arg Met Ser Glu Ile Ser Glu Phe Ala Lys

405 410 415Pro Phe Pro His Arg Ser Gly Asn Ile Ala Lys Ile Gln Tyr Glu Val

420 425 430Asn Trp Glu Asp Leu Ser Asp Glu Ala Glu Asn Arg Tyr Leu Asn Phe

435 440 445Thr Arg Leu Met Tyr Asp Tyr Met Thr Pro Phe Val Ser Lys Asn Pro

450 455 460Arg Lys Ala Phe Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Ser465 470 475 480His Gly Arg Asn Ala Tyr Thr Glu Gly Met Val Tyr Gly His Lys Tyr

485 490 495Phe Lys Glu Thr Asn Tyr Lys Arg Leu Val Ser Val Lys Thr Lys Val

500 505 510Asp Pro Asp Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Thr Leu Ser

515 520 525Ser(2)关于SEQ ID NO:17的信息：

(ⅰ)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅹⅰ)序列描述：SEQ ID NO:17CCGCCATGGA GACTTCCATT CTTACTC 27(2)关于SEQ ID NO:18的信息：

(ⅰ)序列特征：

(A)长度：33个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅸ)序列描述：SEQ ID NO:18GCCGGATCCT CAAGATGACA AAGTTGGGAT GCT 33(2)关于SEQ ID NO:19的信息：

(ⅰ)序列特征：

(A)长度：1590个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：向日葵

(B)株系：zebulon

(ⅹⅰ)特征：

(A)名称/关键词：CDS

(B)位置：1..1590

(ⅹⅰ)序列描述：SEQ ID NO:19ATG GAG ACT TCC ATT CTT ACT CTC CTT CTT CTC TTG CTC TCA ACC CAA 48Met Glu Thr Ser Ile Leu Thr Leu Leu Leu Leu Leu Leu Ser Thr Gln1 5 10 15TCT TCT GCA ACT TCC CGT TCC ATT ACA GAT CGC TTC ATT CAA TGT TTA 96Ser Ser Ala Thr Ser Arg Ser Ile Thr Asp Arg Phe Ile Gln Cys Leu

20 25 30CAC GAC CGG GCC GAC CCT TCA TTT CCG ATA ACC GGA GAG GTT TAC ACT 144His Asp Arg Ala Asg Pro Ser Phe Pro Ile Thr Gly glu Val Tyr Thr

35 40 45CCC GGA AAC TCA TCT TTT CCT ACC GTC TTG CAA AAC TAC ATC CgA AAC 192Pro Gly Asn Ser Ser Phe Pro Thr Val Leu Gln Asn Tyr Ile Arg Asn

50 55 60CTT CGG TTC AAT GAA ACT ACC ACA CCA AAA CCC TTT TTA ATC ATC ACA 240Leu Arg Phe Asn Glu Thr Thr Thr Pro Lys Pro Phe Leu Ile Ile Thr65 70 75 80GCC GAA CAT GTT TCC CAC ATT CAG GCA GCT GTG GTT TGT GGC AAA CAA 288Ala Glu His Val Ser His Ile Gln Ala Ala Val Val Cys Gly Lys Gln

85 90 95AAC CGG TTG CTA CTG AAA ACC AGA AGC GGT GGT CAT GAT TAT GAA GGT 336Asn Arg Leu Leu Leu Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly

100 105 110CTT TCC TAC CTT ACA AAC ACA AAC CAA CCC TTC TTC ATT GTG GAC ATG 384Leu Ser Tyr Leu Thr Asn Thr Asn Gln Pro Phe Phe Ile Val Asp Met

115 120 125TTC AAT TTA AGG TCC ATA AAC GTA GAT ATC GAA CAA GAA ACC GCA TGG 432Phe Asn Leu Arg Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp

130 135 140GTC CAA GCC GGT GCG ACT CTT GGT GAA GTG TAC TAT CGA ATA GCG GAG 480Val Gln Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr Arg Ile Ala Glu145 150 155 160AAA AGT AAC AAG CAT GGT TTT CCG GCA GGG GTT TGT CCA ACG GTT GGC 528Lys Ser Asn Lys His Gly Phe Pro Ala Gly Val Cys Pro Thr Val Gly

165 170 175GTT GGT GGG CAT TTT AGT GGT GGT GGG TAT GGT AAT TTG ATG AGA AAA 576Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Asn Leu Met Arg Lys

180 185 190TAT GGT TTG TCG GTT GAT AAT ATT GTT GAT GCT CAA ATA ATA GAT GTG 624Tyr Gly Leu Ser Val Asp Asn Ile Val Asp Ala Gln Ile Ile Asp Val

195 200 205AAT GGC AAG CTT TTG GAT CGA AAG AGT ATG GGT GAG GAT TTG TTT TGG 672Asn Gly Lys Leu Leu Asp Arg Lys Ser Met Gly Glu Asp Leu Phe Trp

210 215 220GCG ATC ACC GGC GGT GGT GGT GTT AGT TTT GGT GTG GTT CTA GCC TAC 720Ala Ile Thr Gly Gly Gly Gly Val Ser Phe Gly Val Val Leu Ala Tyr225 230 235 240AAA ATC AAA CTA GTT CGT GTT CCG GAG GTT GTG ACC GTG TTT ACC ATT 768Lys Ile Lys Leu Val Arg Val Pro Glu Val Val Thr Val Phe Thr Ile

245 250 255GAA AGA AGA GAG GAA CAA AAC CTC AGC ACC ATC GCG GAA CGA TGG GTA 816Glu Arg Arg Glu Glu Gln Asn Leu Ser Thr Ile Ala Glu Arg Trp Val

260 265 270CAA GTT GCT GAT AAG CTA GAT AGA GAT CTT TTC CTT CGA ATG ACC TTT 864Gln Val Ala Asp Lys Leu Asp Arg Asp Leu Phe Leu Arg Met Thr Phe

275 280 285AGT GTC ATA AAC GAT ACC AAC GGT GGA AAG ACA GTC CGT GCT ATC TTT 912Ser Val Ile Asn Asp Thr Asn Gly Gly Lys Thr Val Arg Ala Ile Phe

290 295 300CCA ACG TTG TAC CTT GGA AAC TCG AGG AAT CTT GTT ACA CTT TTG AAT 960Pro Thr Leu Tyr Leu Gly Asn Ser Arg Asn Leu Val Thr Leu Leu Asn305 310 315 320AAA GAT TTC CCC GAG TTA GGG TTG CAA GAA TCG GAT TGT ACT GAA ATG 1008Lys Asp Phe Pro Glu Leu Gly Leu Gln Glu Ser Asp Cys Thr Glu Met

325 330 335AGT TGG GTT GAG TCT GTG CTT TAC TAC ACG GGC TTC CCC AGT GGT ACT 1056Ser Trp Val Glu Ser Val Leu Tyr Tyr Thr Gly Phe Pro Ser Gly Thr

340 345 350CCA ACC ACG GCG CTC TTA AGC CGT ACT CCT CAA AGA CTC AAC CCA TTC 1104Pro Thr Thr Ala Leu Leu Ser Arg Thr Pro Gln Arg Leu Asn Pro Phe

355 360 365AAG ATC AAA TCC GAT TAT GTG CAA AAT CCT ATT TCT AAA CGA CAG TTC 1152Lys Ile Lys Ser Asp Tyr Val Gln Asn Pro Ile Ser Lys Arg Gln Phe

370 375 380GAG TTC ATC TTC GAA AGG ATG AAA GAA CTT GAA AAC CAA ATG TTG GCG 1200Glu Phe Ile Phe Glu Arg Met Lys Glu Leu Glu Asn Gln Met Leu Ala385 390 395 400TTC AAC CCA TAT GGT GGT AGA ATG AGT GAA ATA TCC GAA TTC GCA AAG 1248Phe Asn Pro Tyr Gly Gly Arg Met Ser Glu Ile Ser Glu Phe Ala Lys

405 410 415CCT TTC CCA CAT AGA TCG GGT AAC ATA GCG AAG ATT CAA TAC GAA GTA 1296Pro Phe Pro His Arg Ser Gly Asn Ile Ala Lys Ile Gln Tyr Glu Val

420 425 430AAC TGG GAG GAT CTT AGC GAT GAA GCC GAA AAT CGT TAC TTG AAT TTC 1344Asn Trp Glu Asp Leu Ser Asp Glu Ala Glu Asn Arg Tyr Leu Asn Phe

435 440 445ACA AGG CTG ATG TAT GAT TAC ATG ACT CCA TTT GTG TCG AAA AAC CCT 1392Thr Arg Leu Met Tyr Asp Tyr Met Thr Pro Phe Val Ser Lys Asn Pro

450 455 460AGA GAA GCA TTT TTG AAC TAT AGG GAT TTG GAT ATT GGT ATC AAC AGC 1440Arg Glu Ala Phe Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Ser465 470 475 480CAT GGC AGG AAT GCT TAT ACT GAA GGA ATG GTT TAT GGG CAC AAA TAT 1488His Gly Arg Asn Ala Tyr Thr Glu Gly Met Val Tyr Gly His Lys Tyr

485 490 495TTC AAA GAG ACA AAT TAC AAG AGG CTA GTA AGT GTG AAG ACT AAA GTT 1536Phe Lys Glu Thr Asn Tyr Lys ArG Leu Val Ser Val Lys Thr Lys Val

500 505 510GAT CCT GAC AAC TTC TTT AGG AAT GAG CAA AGC ATC CCA ACT TTG TCA 1584Asp Pro Asp Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Thr Leu Ser

515 520 525TCT TG 1590Ser

530(2)关于SEQ ID NO:20的信息：

(ⅰ)序列特征：

(A)长度：529个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:20Met Glu Thr Ser Ile Leu Thr Leu Leu Leu Leu Leu Leu Ser Thr Gln1 5 10 15Ser Ser Ala Thr Ser Arg Ser Ile Thr Asp Arg Phe Ile Gln Cys Leu

20 25 30His Asp Arg Ala Asp Pro Ser Phe Pro Ile Thr Gly Glu Val Tyr Thr

35 40 45Pro Gly Asn Ser Ser Phe Pro Thr Val Leu Gln Asn Tyr Ile Arg Asn

85 90 95Asn Arg Leu Leu Leu Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly

100 105 110Leu Ser Tyr Leu Thr Asn Thr Asn Gln Pro Phe Phe Ile Val Asp Met

115 120 125Phe Asn Leu Arg Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp

165 170 175Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Asn Leu Met Arg Lys

180 185 190Tyr Gly Leu Ser Val Asp Asn Ile Val Asp Ala Gln Ile Ile Asp Val

195 200 205Asn Gly Lys Leu Leu Asp Arg Lys Ser Met Gly Glu Asp Leu Phe Trp

245 250 255Glu Arg Arg Glu Glu Gln Asn Leu Ser Thr Ile Ala Glu Arg Trp Val

260 265 270Gln Val Ala Asp Lys Leu Asp Arg Asp Leu Phe Leu Arg Met Thr Phe

275 280 285Ser Val Ile Asn Asp Thr Asn Gly Gly Lys Thr Val Arg Ala Ile Phe

325 330 335Ser Trp Val Glu Ser Val Leu Tyr Tyr Thr Gly Phe Pro Ser Gly Thr

340 345 350Pro Thr Thr Ala Leu Leu Ser Arg Thr Pro Gln Arg Leu Asn Pro Phe

355 360 365Lys Ile Lys Ser Asp Tyr Val Gln Asn Pro Ile Ser Lys Arg Gln Phe

370 375 380Glu Phe Ile Phe Glu Arg Met Lys Glu Leu Glu Asn Gln Met Leu Ala385 390 395 400Phe Asn Pro Tyr Gly Gly Arg Met Ser Glu Ile Ser Glu Phe Ala Lys

405 410 415Pro Phe Pro His Arg Ser Gly Asn Ile Ala Lys Ile Gln Tyr Glu Val

420 425 430Asn Trp Glu Asp Leu Ser Asp Glu Ala Glu Asn Arg Tyr Leu Asn Phe

435 440 445Thr Arg Leu Met Tyr Asp Tyr Met Thr Pro Phe Val Ser Lys Asn Pro

450 455 460Arg Glu Ala Phe Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Ser465 470 475 480His Gly Arg Asn Ala Tyr Thr Glu Gly Met Val Tyr Gly His Lys Tyr

485 490 495Phe Lys Glu Thr Asn Tyr Lys Arg Leu Val Ser Val Lys Thr Lys Val

500 505 510Asp Pro Asp Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Thr Leu Ser

515 520 525Ser(2)关于SEQ ID NO:21的信息：

(ⅰ)序列特征：

(A)长度：350个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅹⅰ)特征：

(A)名称/关键词：CDS

(B)位置：2..350

(ⅸ)序列描述：SEQ ID NO:21GAGAAACTCG GAGACTTTCA CACAATGCCT AACCTCAAAC TCCGACCCCA AACATCCCAT 60CTCCCCCGCT ATCTTCTTCT CCGGAAATGG CTCCTACTCC TCCGTATTAC AAGCCAACAT 120CCGTAACCTC CGCTTCAACA CCACCTCAAC TCCGAAACCC TTCCTCATAA TCGCCGCAAC 180ACATGAATCC CATGTGCAAG CCGCGATTAC TTGCGGGAAA CGCCACAACC TTCAGATGAA 240AATCAGAAGT GGAGGCCACG ACTACGATGG CTTGTCATAC GTTACATACT CTGGCAAACC 300GTTCTTCGTC CTCGACATGT TTAACCTCCG TTCGGTGGAT GTCGACGTGG 350(2)关于SEQ ID NO:22的信息：

(ⅰ)序列特征：

(A)长度：278个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形(ⅱ)分子类型：cDNA至mRNA(ⅲ)假设：否(ⅲ)反义：否(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型(ⅹⅰ)特征：

(A)名称/关键词：CDS

(B)位置：2..278(ⅹⅰ)序列描述：SEQ ID NO:22GGCATGGATC TCCGCCGGAG CGACTCTCGG AGAGGTTTAT TATCGGATTT GGGAGAAAAG 60CAGAGTCCAT GGATTCCCCG CCGGAGTTTG ACCGACGGTT GGTGTTGGTG GGCATTTAAG 120CGGCGGTGGT TACGGTAACA TGGTGAGGAA GTTTGGATTA TCTGTGGATT ACGTTGAGGA 180TGCCAAGATC GTCGATGTAA ACNGTCGGGT TTTAGATCGG AAAGCAATGG GTGAGGATCT 240GTTCTGGGCG ATTACCGGTG GAGGAGGAGG TAGCGTAC 278(2)关于SEQ ID NO:23的信息：

(ⅰ)序列特征：

(A)长度：345个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型(ⅹⅰ)特征：

(A)名称/关键词：CDS

(B)位置：2..345(ⅸ)序列描述：SEQ ID NO:23TGGACATATT AGCGGAGGAG GATTCGGTAC AATAATGAGG AAATACGGTT TAGCGTCTGA 60TAACGTTGTG GACGCACGTT TGATGGATGT AAATGGGAAA ACTCTTGACC GGAAAACGAT 120GGGAGAGGAT TTGTTTTGGG CGCTTAGAGG CGGTGGAGCT GCGAGTTTTG GCGTTGTCTT 180GTCGTGGAAG GTTAAGCTTG CTAGGGTTCC TGAAAAGGTA ACTTGTTTCA TAAGTCAACA 240TCCGATGGGA CCTAGCATGA ACAAGCTTGT TCATAGATGG CAATCCATAG GATCAAGANN 300GCTAGACGAA GATTTATTCA TCAGAGTCAA TATTGACAAC AGTCT 345(2)关于SEQ ID NO:24的信息：

(ⅰ)序列特征：

(A)长度：695个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅹⅰ)特征：

(A)名称/关键词：CDS

(B)位置：1..695

(ⅸ)序列描述：SEQ ID NO:24GTTCGTTAAA ACCTATCCTN NANGGGCNAA AGNATATCAA AGNTTGNTTA NGNAACCCAA 60NATTTCTGAA CTGGCCNCCT TCGGTGGTAT ATGNCNAAAN CCCTTGAATC TGCGNANCCN 120ATTCCGCATA GAAACGGAAC CCTCTTCAAG ATTCTCTATT TACNCGAACT GNCTAGANNG 180AATGACAAGA CATCGAGTAG NAAAATCAAC TGGATCAAAG AGATATACAA TTACATGGCG 240CCTTATGTCT CAAGCAATCC AAGACAAGCA TATGTGAACT ACAGAGATCT AGACTTCGGA 300CAGAACAAGA ACAACGCAAA GGTTAACTTC ATTGAAGCTA AAATCTGGGG ACCTAAGTAC 360TTCAAAGGCA ATTTTGACAG ATTGGTGAAG ATTAAAACCA AGGTTGATCC AGAGAACTTC 420TTCAGGCACG AGCAGAGTAT CCCACCTATG CCCTACTAGA AGCTAGGTTC ATGAAACCAA 480TAACATTATC AAAAATAAGR ATAAATGRTA ATTGTATACA ACATGATTCG KCTTTCTTTA 540TTTCAGACAA TGTGGACACT ACTCTAAANT AAAAWGTCNA TTTACCTTAA AAAAAAAATA 600ATCCCCNNTA ANANAAAANT GGGGGGGCCN TTTTTGGGGN TCCCGGTTTT NGGACGGGGN 660GCTTTNGGGG GGCTTGGNNT TTTTTTNGGN GCCCC 695(2)关于SEQ ID NO:25的信息：

(ⅰ)序列特征：

(A)长度：495个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅹⅰ)特征：

(A)名称/关键词：CDS

(B)位置：2..495

(ⅹⅰ)序列描述：SEQ ID NO:25TCTGTTTTNA GGCAGAGCAG AGGAAGTTGT TGCTTTGCTT GGTAAGGAGT TTCCTGAATT 60NAGTTTAAAG AAGGAGAACT GTTCGGAGAT GACTTGGTTT CAGTCAGCTT TATGGTGGGA 120TAATCGTGTT AACCCTACTC ANATTGATCC WAAAGTGTTT CTCGATCGGA ATCTTGATAG 180AGCGAATTTC GGAAAGAGGA AATCGGATTA CGTTGCGAGT AAGATTCCTA GAGATGGGAT 240TAAGYCTTTT TCCAAGARGA TGMCTGACCT GGGGAAAAYC GGGCTTGTTT TTAAWCCGTA 300TGGTGGGAAA ATGGCGGAGG TTACGGTTAA CGCGACGCCG TTTCCNCACC GAAGCAAGCT 360TTTTAAGATT CAGTACTCGG TGACTTNGCA AGAAAACTCT NTCGAGATAG AGAAAGGGTT 420TCTTGAATCA GGCTAACGTC CTTATAGGTT CATGACCGGG TTTTTNAGCA AGANCCCTGG 480AATNCTTACT TNAAT 495(2)关于SEQ ID NO:26的信息：

(ⅰ)序列特征：

(A)长度：204个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅹⅰ)特征：

(A)名称/关键词：CDS

(B)位置：1..204

(ⅹⅰ)序列描述：SEQ ID NO:26AAATTAAAAC AAATCAATGT TGATATTGAA TCCAATAGTG CTTGGTTTCA ACCTGGTGCT 60ACGCTTGGTG AGCTTTACTA CAGAATTNCA GAGAAGAGCA AAATCCATGG ATTTCCNGCG 120GGTTTNTNCA CAAGCNTAGG CATAGGTGGG TATATNANAG GCGGTGGATA CGGTACCTTG 180ATGAGGAAGT ATGGTCTTNC GGGA 204(2)关于SEQ ID NO:27的信息：

(ⅰ)序列特征：

(A)长度：491个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅹⅰ)特征：

(A)名称/关键词：CDS

(B)位置：2..491

(ⅸ)序列描述：SEQ ID NO:27GAGATTTCTC GAGCAAGATA CTCCACTGAT GATCTTTGAG CCATTGGGTG GGAAAATCAG 60CAAGATTTCA GAAACAGAAT CTCCATATCC ACACAGAAGA GGTAATCTGT ATAATATACA 120GTACATGGTG AAATGGAAAG TGAATGANGT CGAGGAGATG AACAAACATG TCAGGTGGAT 180GAGATCGTTA CACGATTACA TGACTCCGTA TGTTTCTAAA TCGCCGAGAG GAGCTTATTT 240GANTTACAGA GATCTTGATT TGGGCTCGAC CAAAGGGATT AACACGGGTT TCGGAGATGC 300AAGGAAATGG NNGGGTGAGN CTTTTTTCAA AGGTAATTTC CAAGGGGTTA GGTTTTGGTT 360AAAGGGGAGG TTTNNCCCAN CAAATTTTTT TTCAGGANCC GGCCANGNTT TTCCCCCCCC 420TNTTTTTNGG NCCCCAATCN AAANCCCCGT TTTAAAAGGG GGGCCATTTC NTTTTTTNCA 480NNTTAAAAGG G 491(2)关于SEQ ID NO:28的信息：

(ⅰ)序列特征：

(A)长度：407个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅹⅰ)特征：

(A)名称/关键词：CDS

(B)位置：3..407

(ⅸ)序列描述：SEQ ID NO:28ATTTGTTCGT GAGGTTAACT TTGACTTTAG TCAACGGTAC GAAGCCTGGT GAGAATACGG 60TTTTAGCGAC TTTCATTGGG ATGTATTTAG GCCGGTCGGA TAAGCTGTTG ACCGTNATGA 120ACCGGGATTT CCCGGAGTTG AAGCTGAAGA AAACCGATTN TACCGAGATG AGATGGATCG 180ATTCGGTTCT GTTTTGGGAC GATTATCCGG TTGGTACACC GACTTCTGTG CTACTAAATC 240CGCTAGTCGC AAAAAAGTTG TTCATGAAAC GAAAATCGGA CTACGTGAAG CGTCTNATTT 300TCGAGAACCC GATCTCNNGT TTGATACTCA AGAAATTTGT AGAGGTTNNG AAAGTTAAAA 360TNAATTTGGA TCCGCATTNN GGNANNNATG GTGAAACCCC NNGTTNT 407(2)关于SEQ ID NO:29的信息：

(ⅰ)序列特征：

(A)长度：360个碱基对

(B)类型：核酸

(C)链型：双链

(A)生物：拟南芥

(B)株系：Columbia生态型(ⅹⅰ)特征：

(A)名称/关键词：CDS

(B)位置：3..360(ⅸ)序列描述：SEQ ID NO:29ACGGCGTCGT ATTGGCCTAC AAAATAAACC TTGTTGAAGT CCCAGAAAAC GTCACCGTTT 60TCAGAATCTC CCGGACGTTA GAACAAAATG CGACGGATAT CATTCACCGG TGGCAACAAG 120TTGCACCGAA GCTTCCCGAC GAGCTTTTCA TAAGANCAGT CATTGACGTA NAAACGGCAC 180TGTTTCATNN CTCAAAAGAC CGTCAGACAA CATTCATAGC AATGTTTCTA GGAGACACGN 240CAACTCTACT GTCGATATTA AACCGGAGAT TCCCAGAATT GGGTTTGGTC CGGTCTGACT 300GTACCGNAAC AAGCNNTTGG ATCCAATCTG TGCTATTTTT GGGACAAATA TCCCAGGTTG 360(2)关于SEQ ID NO:30的信息：

(ⅰ)序列特征：

(A)长度：427个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：3..427(ⅹⅰ)序列描述：SEQ ID NO:30TCTTCACTGT CACCAAAACG TTAGAACAAG ACGCAAGATT GAAGACTATT TCTAAGTGGC 60AACAAATTTC ATCCAAGATT ATTGAAGAGA TACACATCCG AGTGGTACTC AGAGCAGCTG 120GAAATGATGG AAACAAGACT GTGACAATGA CCTACCTAGG TCAGTTTCTT GGCGAGAAAG 180GCACCTTGCT GAAGGTTATG GAGAAGGCTT TTCCAGAACT AGGGTTAACT CAAAAGGATT 240GTACTGAAAT GAGCTGGATT GAAGCCGCCC TTTTCCATGG TGGRTTTCCA ACAGGKTCTC 300CTATTGAAAT TTTGCTTMAG CTCAAGTCGC CTYTAGGAAA AGRTTWCTTC AAAGCAACGK 360CGGATTTCGT TAAAGAACCT WTTCCTGTGA TAGGGCTCAA AGGAATATTC AAAAGATTGA 420TTGAAGG 427(2)关于SEQ ID NO:31的信息：

(ⅱ)序列特征：

(A)长度：437个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..437(ⅹⅰ)序列描述：SEQ ID NO:31GTTGTACTAT CATNGAAGAT TAAGTTAGTC GATGTTCCGT CCACGGTCAC CGNGTTTAAA 60GTCCAGAAAC ATNAGGAGAA AGAGGCCGTT AGGNTCATCA ACAAGTGGCA GTATGTTGCG 120GATAAGGTCC CTGAAGATCT TTTCATCAGC GCAACGTTGG NGAGATCAAA CGGAAACTCT 180GTGCAGGCTT TGTTTACTGG ACTCTATCTT GGNCCGGTGA ATAATNTCTT GGCCTTGATG 240GAAGAAAAGT TTCCAGANTT AGGTCTTGAT ATCCAAGNCT GCACAGAGAT GAGTTGGGCT 300GAATCTGCAC TCTGGTNTNC TGNTTTCNCT AAAGGAGAGN CTCCTTGGGT GTTCCNCGCG 360GATCGGNAGC GGNCAATTTN TGGNCTTTCA AGGGGAAAGN CGGCTTTTTN CAAGAACCCG 420NTACCCGGGG TTCAATT 437(2)关于SEQ ID NO:32的信息：

(ⅰ)序列特征：

(A)长度：441个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..441

(ⅹⅰ)序列描述：SEQ ID NO:32GCGGACCCTA TAGATCANNA TGTGCTACTG ANAGAAGAGG AAGCCAAGAA CAAGCCGGAG 60ACAGATAAAT ATCTGAAATG GGNCGATANC GTTTACGAAT TTATGACNCC ATATGTTTCG 120AAATCTCCAA GAGGAGCTTA TGTCAATTTC AAGGATATGG ATTTGGGTAT GTATCTTGGA 180AAGAAGAAGA CAAAGTACGA GGAAGGAAAG AGTTGGGGAG TGAAGTATTT CAAGAACAAT 240TTCGAGAGAT TGGTGAGAGT GAAGACTAGG GTTGATCCAA CAGATTTCTT CTGCGATGAA 300CAGAGCATTC CTCTGGTGAA CAAAGTTACC TGAAGATATC ATTTGAAGTT TTTTATTAGT 360CCCTTTTCTC TGTGAAATCA TCTGTGCGTG TTGAATATTA TGCGTCAAGT GTGTAACTTA 420TGTGTGTGAT TGTGAATTGT G 441(2)关于SEQ ID NO:33的信息：

(ⅰ)序列特征：

(A)长度：502个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：2..502

(ⅹⅰ)序列描述：SEQ ID NO:33CTGGCTTAAC ACAACGTCGT TTTGGGCCAA TTACCCGGCG GGTACACCCA AGAGCATCCT 60TCTAGATAGG CCTCCGACGA ATTCAGTGTC ATTTAAGAGT AAATCGGATT TTGTCAAAAA 120ACCAATACCC AAAAAAGGTT TAGAGAAGCT TTGGAAGACA ATGTTTAAAT TCAACAGTAG 180CGTCTCGTTG CAATTCAACC CTTACGGTGG AGTGATGGAC CGGATTCCGG CAACGGCCAC 240CGCTTTTCCT CATCGGAAAG GAAACTTGTT CAAGGTTCAA TACNCTACGA TGTGGTTTGA 300CGCAAACGCC ACACAGAGTA GCCNGGCTAT GATGAATGAG CTTTTTGAGG TGGCGGGACC 360GTACGTGNGT CAAGTAAACC CGAGANANGG CTTCCTTTAA NTTCAGAGNC CATCGNTNTT 420NGGAGCAANN CCAAGTGGGG GGGNCCAACC GGGGGNTNAA ANCNNAGNTC TTNGGGGGCC 480CAGAATTTCC TTNGGGGAAT TT 502(2)关于SEQ ID NO:34的信息：

(ⅰ)序列特征：

(A)长度：400个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：2..400

(ⅹⅰ)序列描述：SEQ ID NO:34NGGGAATTGC NCGAGGNAAG TTGTACCCAA TTCCTGGACC ACCATTGGTT TCCCAAGAAN 60CCCGAGACAA CCGTTTTTCA ATNACCGTGA TGTTGATTTG GGTATTAATT CTCATAATGG 120TAAAATCAGT AGTTATGTGG AAGGTAAACG TTACGGGAAG AAGTATTTCG CAGGTAATTT 180CGAGAGATTG GTGAAGATTA AGACGAGAGT TGATAGTGGT AATTTCTTTA GGAACGAACA 240GAGTATTCCT GTGTTACCAT AAGTGTATTT ATTTGATTAT TGGTTAGTGA AATTTGTTGT 300TGTATAATGA TTATATGTCG TATTTTTATT TATTATTAGT AATTTATAAA GTTTGATATT 360AAATACAAAT AGTATAATAA GATAGTTTCT TTTAGTAAAA 400(2)关于SEQ ID NO:35的信息：

(ⅰ)序列特征：

(A)长度：383个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：2..383

(ⅹⅰ)序列描述：SEQ ID NO:35CAACTCTAAT GGGAACACCT ACTTCGATCG AATGTCGATG GGGGAAGAGC TTTTCTGGGC 60GGTTCGAGGA GGTGGAGCCG CGAGTTTCGG CATCGTGATG GGATACAAAA TCCGGTTGGT 120TCCGGTTCCG GAGAAAGTTA CGGTTTTTAG CGTCGGAAAA ACCGTCGGAG AAGGAGCCGT 180TGATCTTATA ATGAAGTGGC AGAACTTCTC TCATAGTACG GNTCGGAATT TNTTTGTGAA 240GCTGANTTTT GANTTTAGTC AACGGTGCAA AGCCGGGTGA AAAAAAGGTT TTAGNGNCTT 300TCANTTTGGN TGNAANCTTG GGGGTTTTAT NAGAACGGTT AACCGGGATT NANCCCGNGT 360TTTCCCGGGG TTAAAACCTT NGG 383(2)关于SEQ ID NO:36的信息：

(ⅰ)序列特征：

(A)长度：354个碱基对

(B)类型：核酸

(C)链型：双链

(A)生物：拟南芥

(B)株系：Columbia生态型(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..354(ⅹⅰ)序列描述：SEQ ID NO:36ATCAATGTTC TTACTAAACG TACACGAGCA TCGTTGGCTT TCAAGGCTAA ATCTGATTTT 60NTTCAAGAAC CGATNCCTAA AACCGCGATT TCGAAGCTTT GGAGACGGTT GCAAGAACCG 120GAAGCAGAGC ATGCTCAGCT AATTTNCACN CCATTTGGTG GTAAAATGAG TNAGATTGCA 180GATTACGAAA CACCATTTCC GCATAGGAAG GGGAATATAT ATNAGATTCA GTACTTGAAT 240TACTGGAGAG GAGACGTGAA AGAGAAGTAT ATTGAGATNG GTGGAGGAGA GTTTACGGTT 300GNTATNAGTA AGTTTTTTGG CGAAGTNTNC CNAGAGGNGN CTTNNTNTAA ACCT 354(2)关于SEQ ID NO:37的信息：

(ⅰ)序列特征：

(A)长度：403个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA(ⅲ)假设：否(ⅲ)反义：否(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：2..403(ⅹⅰ)序列描述：SEQ ID NO:37TTTTTTAGTA CACTAATAAT CAAATGGAAT GAGAAATGAA GCCACAAAAG TATCTGCAAT 60CAAAATATCC TGCTATCTCC ATCTCAAGCT CTCAATAGTA TCCTCTCCGA AAGTGAAATC 120AACATTTCAA ACTCTATTTC TTGGTGGAAT CGATAGACTG ATTCCTCTGA TGAACCAGAA 180GTTTCCGGAA CTCGGCTTAC GATCTCAAGA CTGTTCGGAA ATGAGCTGGA TCGAATCGAT 240AATGTTCTTC AACTGGAGAT CAGGACAGCC GTTAGAGATT TTGCTCAACA GAGACCTAAG 300GATTCGAGGA TCAGTATTTC AAAGCAAAGT CAGGATTATG GTTCAAAAAC CCGTTCCTGA 360AAACGTTTTT CGAAGAGGTA TCCAAGGGGT TTCTCGAGCA AGT 403(2)关于SEQ ID NO:38的信息：

(ⅰ)序列特征：

(A)长度：260个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..260(ⅹⅰ)序列描述：SEQ lD NO:38GAGATGAGTT GGATTAANTC TGTACTCTGG TTTGCTGATT TCCCTAAAGG AGAATCTCTT 60NGTGTTCTCA CGAATCGTAA GCGTACATCT CTATCTTTNA AAGGCAAAGA TGATTTTATC 120CAAGAACCGA TACCCGAGGC TGCAATTNAA GAGATATGGA GGCGATTAGA AGCCCCCNAG 180GCTCGGCTTG GAAAGATCAT ATTAACTCCA TTTGGTGGGA AAATNAGTGA AATGGCAGAG 240TACGTANCAC CATTCCCACA 260(2)关于SEQ ID NO:39的信息：

(ⅰ)序列特征：

(A)长度：605个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：2..605

(ⅹⅰ)序列描述：SEQ ID NO:39CTCTTGCATA TTCGCTGCAA GGATGGGAAA TTCAAAACCA CTCCCTACAA TTTTTTGTAT 60TATAGTTTCA GTCTTGTATT TTTAATTCTA TTGCATAACA CCAACTTCTT CATCAGCCTC 120CATCCAAGAT CAATTCATAA ACTGTGTCAA AAGAAACACA CATGTTTCTT TTCCACTCGA 180GAAAACGTTA TTCACCCCTG CGAAAAACGT CTCTTTGTTC AACCAAGTCC TTGANTCGAC 240GGCTCAAAAT CTCCAGTTCT TGGCAAAATC CATGCCTAAA CCGGGRTTCA TATTCAGACC 300GATTCACCAG TCTCAAGTCC AAGSTTCCAT CATTTGTTCA AMGRAACTCG GGNTTCATTT 360TNGTGTTTGA NGTGGCGGTC ACGATTTTCG AGGCCTTTGT NTTTATGTTT CACGGTTTGA 420AAAAACCGTT TATATTACTC GGCCTGTCAA ANTTGNANNC AAAATCANAT GTTGGATATT 480GNATTCCAAA TAGGTNCTTG GGGTNAACCT GGTGGCTANC GTTTGGTGAG CTTTTACTTT 540CAAGAATTTG CANGNGGANG TGCAAAGATT CCATGGGATT TCCCGGGGGG TTTNTTGCAC 600AATGT 605(2)关于SEQ ID NO:40的信息：

(ⅰ)序列特征：

(A)长度：464个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：2..464

(ⅹⅰ)序列描述：SEQ ID NO:40AACACAAAAC TCTTCCATTT GGCTTCTCTC TTGCATATTC GTTGCAAGGA TGGGAAATTC 60AAAACCACTC CCTACAATTN CTTGTATTAT CGTTTCAGTC TTGTATTTTN NATTCTATTG 120CATAACACCA ACTTCTTCAT CAGCCTCCAT CCAAGNTCAA TTCATAAACT GTGTCAAAAG 180GAACACACAT GTTTCTTTTC CACTCGAGNA AACGGTATTC ACTCCTGCGG AAAACGGCTC 240TNTTATTCAA CGGGTCCNTG AATCGACGGG TCAAAATCTC CAGTTCTTGG NAAAATCCAT 300GNCTAAACCG GGGTTCATAT TCAGGCCGGT TCACCAGTCT CAAGTCCAAG NTTCCATCAT 360TTGTTCAAAG GAACTCGGGA TTCATTTCCG CGNTAGAAGT GGCGGGCANN GGTTTCGGGG 420CCTGTCTNTT GNTTANGGGN AGGAAAACCG GTTNTATTNC TCGG 464(2)关于SEQ ID NO:41的信息：

(ⅰ)序列特征：

(A)长度：386个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..386

(ⅹⅰ)序列描述：SEQ ID NO:41TCGGGAGCCC ANGNTAAATT ANNTGAAAAT GGGGNCGNAT ANCCGTTTAC NGAATTTTAT 60GACNCCCAAT ATGTTTCGAA ATCTCAAAGA NNGGGANCTT ATGTCAATTT CAAGGATATG 120GATTTGGGTA TGTATCTTGG AAAGNAGAAG ACAAAGTACG AGGAAGGAAA GAGTTGGGGA 180GTGAAGTATT TCAAGAACAA TTTCGAGAGA TTGGTGAGAG TGAAGACTAG GGTTGATCCN 240ACAGATTTCN TCTGCGATGA ACAGAGCATT CCTCTGGTGN ACAAAGTTAC CTGAAGATAT 300CATTTGAAGT TTTTTATTAG TCCCTTTTCT CTGTGAAATC ATCTGTGCGT GTTGAATANT 360ATGCGTCAAG TGTGTAACTT ATGTGT 386(2)关于SEQ ID NO:42的信息：

(ⅰ)序列特征：

(A)长度：377个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..377

(ⅹⅰ)序列描述：SEQ ID NO:42TACCATAGGG AGGTGGTGNA AGATTTTGTA TGTAGNCTTA GGGGAAGGCG AGTAGTATGG 60TGGTGGTGGG GAGCTGTAAA CGTATGGTGG TGGTGGAGAT TTGTATGTGG GCTGGTTAAC 120TTCATTGAAG CTAAAATCTG GGGACCTAAG TACTTCAAAG GCAATTTTGA CAGATTGGTG 180AAGATTAAAA CCAAGGTTGA TCCAGAGAAC TTCTTCAGGC ACGAGCAGAG TATCCCACCT 240ATGCCCTACT AGAAGCTAGG TTCATGAAAC CAATAACATT ATCAAAAATA AGAATAAATG 300ATAATTGTAT ACAACATGAT TCGTCTTTCT TTATTTCAGA CAATGTGGAC ACTACTCTAA 360ATAAAATGTC ATTTACC 377(2)关于SEQ ID NO:43的信息：

(ⅰ)序列特征：

(A)长度：377个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..377

(ⅹⅰ)序列描述：SEQ ID NO:43TACCATAGGG AGGTGGTGNA AGATTTTGTA TGTAGNCTTA GGGGAAGGCG AGTAGTATGG 60TGGTGGTGGG GAGCTGTAAA CGTATGGTGG TGGTGGAGAT TTGTATGTGG GCTGGTTAAC 120TTCATTGAAG CTAAAATCTG GGGACCTAAG TACTTCAAAG GCAATTTTGA CAGATTGGTG 180AAGATTAAAA CCAAGGTTGA TCCAGAGAAC TTCTTCAGGC ACGAGCAGAG TATCCCACCT 240ATGCCCTACT AGAAGCTAGG TTCATGAAAC CAATAACATT ATCAAAAATA AGAATAAATG 300ATAATTGTAT ACAACATGAT TCGTCTTTCT TTATTTCAGA CAATGTGGAC ACTACTCTAA 360ATAAAATGTC ATTTACC 377(2)关于SEQ ID NO:44的信息：

(ⅰ)序列特征：

(A)长度：346个碱基对

(B)类型：核酸

(C)链型：双链

(A)生物：拟南芥

(B)株系：Columbia生态型(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：2..346(ⅹⅰ)序列描述：SEQ ID NO:44GAGCTGTGGA TATGGTCACA AATGGCAATC GGTTGGTCCG AAAACTGATC CGAATCTTTT 60TATGAGAATN TTGATTCAAC CAGTGACGAG GAAGAAGGTA AAGACTGTGA GAGCTTCTNT 120GGTTGCCCTN TTTTNAGGCN AGACAGATGA AGTTTTTGCT TTCCTTAGTA AGGAGTTTCC 180TGAATTGGGT TTAAAGAAGG AGAATTNTTC GGAGATGACT TGGTTTCANT CTGCTTTATG 240GTGGGACAAT CGTCTTAATG CTACTCAGGT TGATCCTAAA GTNTTTCTTG ATCGGAATCT 300CGATACCTCG AGTTTCGGTA AGAGGAAATC GGATTACGTC GCGACT 346(2)关于SEQ ID NO:45的信息：

(ⅰ)序列特征：

(A)长度：261个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：2..261(ⅹⅰ)序列描述：SEQ ID NO:45ATGGGGTGAG ACTTATTTCA AAGGTAATTT CAAGAGATTA GGTTTGGTTA AAGGGAAGNT 60TGATCCAACA AATTTCTTCA GGAACGAACA GAGTATTCCT CCTCTGTTTT GAGTCCTCAA 120TACAAAACCA GATATAAAAG ATGTCATTTC ATTTTTTCAA TTATAATAGA TAATGTAACT 180TTCTGCTACA ATTGTAAAAG TGAGATGTAC CCAATACGGT TTAAGCGGAC CGAGAATAGT 240CAATTCAAAG ACCAAATTCT G 261(2)关于SEQ ID NO:46的信息：

(ⅰ)序列特征：

(A)长度：478个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..478(ⅹⅰ)序列描述：SEQ ID NO:46GCTCAAAGGA CTAACCATGA AAACTTCCTC AAGTGTCTCT CTCACCGANT CAACGAGGAC 60GACTCAAGAN TTATACACAC ATCAAAAGAT CCTTCGTATT TNTCAATCTT GATTTCTTCC 120ATACAAAATC CAAGTTTCTC TGTTCTCGAA ACACCTAAAC CGGTTTCAAT CATCACTCCG 180GTTCAAGCCA CCGATGTTCA ATCTACGNTT AAATNCGCAC GGNCTTCACG GGTATACACA 240ATCAGGGCTA GGAGTGGTNG TCATGACTAC GGAGGTTTAT CTTTACATTG GCTTAAAAAN 300CANNCCGTTC GTTNNTCATT GATTTNNAGA AATCTTCCGG GCTTATTTAA CATNTAAGAT 360GTTTGATAAN CCGGNNCCNG TTTGGGGTTC AAATCCCGGT GGCTTACAAA NTTNGGGGGA 420ATTGTNCCTA TGAGGTTTGG AAAATTAANG CAAAATNTTT TGGGCCTTCC CGGCCGGT 478(2)关于SEQ ID NO:47的信息：

(ⅰ)序列特征：

(A)长度：579个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：Columbia生态型

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：2..579

(ⅹⅰ)序列描述：SEQ ID NO:47GGCCGTTAGG ATCATCAAGA AATGGCAATA TGCTGCAGAT AAGGTTCCTG ATGATCTTTT 60CATTAGGACA ACATTGGAGA GATCAAACAA GAACGCAGTA CACGCTTTGT TCACTGGACT 120ATATATTGGT CCGGTGAACA ATCTATTGGC GTTGATGGAA GAAAAGTTTC CGGAACTAGG 180TCTTGAGAAA GAAGGTTGTG AAGAGATGAG TTGGATTGAG TCTGTACTCT GGTTTGCTGA 240TTTCCCTAAA GGAGAATCTC TTGGTGTTCT CACGAATCGT GAGCGTACAT CTCTATCTTT 300CAAAGGCAAA GATGATTTTG TCCAAGAACC GATACCCGAG GCTGCAATTC AAGAGATATG 360GAGGCGATTA GAAGCCCCCG AGGCTCGGCT TGGAAAGATC ATATTAACTC CATTTGGGTG 420NGGNAAAATG AGTGAAATGG CAGAGNCCGA ACCACCAATT CCCACANNCG AGGGAGGGGA 480ACCCCTNTGN GGNTCAGAAT GTGGTTCCTG GNNNNNAAGN GGGNGCCAGN ACCAANCCGG 540GNCNGTAAAN CNTGNAATGG GCCNAACCCG TNCCGGATT 579(2)关于SEQ ID NO:48的信息：

(ⅰ)序列特征：

(A)长度：252个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：稻

(B)株系：日本型，粳型亚种

(D)发育阶段：黄化苗(8日龄)

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：3..252

(ⅹⅰ)序列描述：SEQ ID NO:48TGTCCTGGAA GGTCCGCCTC GTGCAGGTTN CGACGACGGT GACGGTGTTC GTCGTCGGGA 60GGAACGTCGA CCAGGGCGCC GCNGACGTCG TCGCCAGATG GCAAGACGTC GCGCCGAGCC 120TCCCTCCCGA GCTCACCATA CGGGTGATCG TNCGAGGGCA GCGCGCCACG TTCCAGTCGC 180TGTACCTCGG CTCGTGCGCC GACCTGGTGC CGACGATGAG CAGCATGTTC CCGGAGCTCG 240GGATGACGAT TG 252(2)关于SEQ ID NO:49的信息：

(ⅰ)序列特征：

(A)长度：21个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅲ)假设：否

(ⅵ)原始来源：

(A)生物：莴苣

(B)株系：lollo bionda

(ⅸ)特征：

(A)名称/关键词：修饰的位点

(B)位置：12

(D)其它信息：/标记物=不确定

/备注=“Xaa=Cys或Ser”

(ⅸ)特征：

(A)名称/关键词：修饰的位点

(B)位置：20..21

(D)其它信息：/标记物=不确定

/备注=“Xaa-Xaa可能是Ser-Phe”

(ⅹⅰ)序列描述：SEQ ID NO:49

Thr Ser Thr Ser Ile Ile Asp Arg Phe Thr Gln Xaa Leu Asn Asn Arg

1 5 10 15

Ala Asp Pro Xaa Xaa

20(2)关于SEQ ID NO:50的信息：

(ⅰ)序列特征：

(A)长度：24个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅲ)假设：否

(ⅵ)原始来源：

(A)生物：莴苣

(B)株系：lollo bionda

(ⅸ)特征：

(A)名称/关键词：修饰的位点

(B)位置：1

(D)其它信息：/标记物=不确定

/备注“Xaa=可能是Ser”

(ⅸ)特征：

(A)名称/关键词：修饰的位点

(B)位置：3

(D)其它信息：/标记物=未知

(ⅸ)特征：

(A)名称/关键词：修饰的位点

(B)位置：5

(D)其它信息：/标记物=不确定

/备注“Xaa=可能是Ser”

(ⅸ)特征：

(A)名称/关键词：修饰的位点

(B)位置：12

(D)其它信息：/标记物=不确定

/备注“Xaa=可能是Trp”(ⅸ)特征：

(A)名称/关键词：修饰的位点

(B)位置：24

(D)其它信息：/标记物=不确定

/备注“Xaa=可能是Tyr”(ⅹⅰ)序列描述：SEQ ID NO:50Xaa Ile Xaa Val Xaa Ile Glu Asp Glu Thr Ala Xaa Val Gln Ala Gly1 5 10 15Ala Thr Leu Gly Glu Val Tyr Xaa

20(2)关于SEQ ID NO:51的信息：

(ⅰ)序列特征：

(A)长度：14个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅲ)假设：否

(A)生物：莴苣

(B)株系：lollo bionda

(ⅹⅰ)序列描述：SEQ ID NO:51Ala Asp Pro Ser Phe Pro Leu Ser Gly Gln Leu Tyr Tyr Pro1 5 10(2)关于SEQ ID NO:52的信息：

(ⅰ)序列特征：

(A)长度：32个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:52ACTTCTACTT CTATTATTGA TAGGTTTACT CA 32(2)关于SEQ ID NO:53的信息：

(ⅰ)序列特征：

(A)长度：405个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：莴苣

(B)株系：lollo bionda

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..405

(ⅹⅰ)序列描述：SEQ ID NO:53ACT TCT ACT TCT ATT ATT GAT AGG TTT ACT CAA TGT CTA AAC AAC CGA 48Thr Ser Thr Ser Ile Ile Asp Arg Phe Thr Gln Cys Leu Asn Asn Arg1 5 10 15GCT GAC CCT TCT TTC CCG CTC AGT GGA CAA CTT TAC ACT CCC GAT AAC 96Ala Asp Pro Ser Phe Pro Leu Ser Gly Gln Leu Tyr Thr Pro Asp Asn

20 25 30TCC TCT TTT CCA TCC GTC TTG CAA GCT TAC ATC CGG AAC CTC CGA TTC 144Ser Ser Phe Pro Ser Val Leu Gln Ala Tyr Ile Arg Asn Leu Arg Phe

35 40 45AAT GAA TCC ACG ACT CCC AAA CCC ATC TTA ATC ATC ACC GCC TTA CAC 192Asn Glu Ser Thr Thr Pro Lys Pro Ile Leu Ile Ile Thr Ala Leu His

50 55 60CCT TCA CAC ATT CAA GCA GCT GTT GTG TGC GCC AAA ACA CAC CGC CTG 240Pro Ser His Ile Gln Ala Ala Val Val Cys Ala Lys Thr His Arg Leu65 70 75 80CTA ATG AAA ACC AGA AGC GGA GGC CAT GAT TAT GAG GGG CTT TCC TAT 288Leu Met Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr

85 90 95GTG ACC AAT TCG AAC CAA CCC TTT TTT GTT GTT GAC ATG TTC AAC TTA 336Val Thr Asn Ser Asn Gln Pro Phe Phe Val Val Asp Met Phe Asn Leu

100 105 110CGC TCC ATA AAC GTG AGT ATT GAA GAT GAA ACT GCA TGG GTC CAA GCC 384Arg Ser Ile Asn Val Ser Ile Glu Asp Glu Thr Ala Trp Val Gln Ala

115 120 125GGC GCC ACC CTC GGA GAA GTT 405Gly Ala Thr Leu Gly Glu Val

130 135(2)关于SEQ ID NO:54的信息：

(ⅰ)序列特征：

(A)长度：135个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:54Thr Ser Thr Ser Ile Ile Asp Arg Phe Thr Gln Cys Leu Asn Asn Arg1 5 10 15Ala Asp Pro Ser Phe Pro Leu Ser Gly Gln Leu Tyr Thr Pro Asp Asn

20 25 30Ser Ser Phe Pro Ser Val Leu Gln Ala Tyr Ile Arg Asn Leu Arg Phe

35 40 45Asn Glu Ser Thr Thr Pro Lys Pro Ile Leu Ile Ile Thr Ala Leu His

50 55 60Pro Ser His Ile Gln Ala Ala Val Val Cys Ala Lys Thr His Arg Leu65 70 75 80Leu Met Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr

85 90 95Val Thr Asn Ser Asn Gln Pro Phe Phe Val Val Asp Met Phe Asn Leu

100 105 110Arg Ser Ile Asn Val Ser Ile Glu Asp Glu Thr Ala Trp Val Gln Ala

115 120 125Gly Ala Thr Leu Gly Glu Val

130 135(2)关于SEQ ID NO:55的信息：

(ⅰ)序列特征：

(A)长度：25个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:55CACGTTTATG GAGCGTAAGT TGAAC 25(2)关于SEQ ID NO:56的信息：

(ⅰ)序列特征：

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:56CACCCTTCAC ACATTCAAGC AGC 23(2)关于SEQ ID NO:57的信息：

(ⅰ)序列特征：

(A)长度：1981个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：莴苣

(B)株系：lollo bionda

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：7..1626

(ⅸ)特征：

(A)名称/关键词：未确定

(B)位置：替换(372,“g”)

(ⅸ)特征：

(A)名称/关键词：未确定

(B)位置：替换(379,“g”)

(ⅸ)特征：

(A)名称/关键词：未确定

(B)位置：替换(786,“t”)

(ⅸ)特征：

(A)名称/关键词：未确定

(B)位置：替换(1105..1106,“ga”)

(D)其它信息：/备注“也可能是“gg”和“aa””(ⅹⅰ)序列描述：SEQ ID NO:57ACAAAA ATG GCA ATT ACC TAT TCT TTC AAC TTC AAA TCT TAT ATT TTT 48

Met Ala Ile Thr Tyr Ser Phe Asn Phe Lys Ser Tyr Ile Phe

1 5 10CCT CTC CTC CTT GTC TTG CTC TCT ACC CAT TCA TCA GCG ACT TCA ACT 96Pro Leu Leu Leu Val Leu Leu Ser Thr His Ser Ser Ala Thr Ser Thr15 20 25 30TCC ATT ATA GAT CGC TTC ACC CAA TGT CTA AAC AAC CGA GCT GAC CCT 144Ser Ile Ile Asp Arg Phe Thr Gln Cys Leu Asn Asn Arg Ala Asp Pro

35 40 45TCT TTC CCG CTC AGT GGA CAA CTT TAC ACT CCC GAT AAC TCC TCT TTT 192Ser Phe Pro Leu Ser Gly Gln Leu Tyr Thr Pro Asp Asn Ser Ser Phe

50 55 60CCA TCC GTC TTG CAA GCT TAC ATC CGG AAC CTC CGA TTC AAT GAA TCC 240Pro Ser Val Leu Gln Ala Tyr Ile Arg Asn Leu Arg Phe Asn Glu Ser

65 70 75ACG ACT CCC AAA CCC ATC TTA ATC ATC ACC GCC TTA CAC CCT TCA CAC 288Thr Thr Pro Lys Pro Ile Leu Ile Ile Thr Ala Leu His Pro Ser His

80 85 90ATT CAA GCA GCT GTT GTG TGC GCC AAA ACA CAC CGC CTG CTA ATG AAA 336Ile Gln Ala Ala Val Val Cys Ala Lys Thr His Arg Leu Leu Met Lys95 100 105 110ACC AGA AGC GGA GGC CAT GAT TAT GAG GGG CTT TCC TAT GTG ACC AAT 384Thr Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Val Thr Asn

115 120 125TCG AAC CAA CCC TTT TTT GTT GTT GAC ATG TTC AAC TTA CGC TCC ATA 432Ser Asn Gln Pro Phe Phe Val Val Asp Met Phe Asn Leu Arg Ser Ile

130 135 140AAC GTG AGT ATT GAA GAT GAA ACT GCA TGG GTC CAA GCT GGT GCG ACT 480Asn Val Ser Ile Glu Asp Glu Thr Ala Trp Val Gln Ala Gly Ala Thr

145 150 155CTT GGT GAA GTC TAC TAC CGA ATA GCA GAG AAA AGC AAC AGT CAT GCT 528Leu Gly Glu Val Tyr Tyr Arg Ile Ala Glu Lys Ser Asn Ser His Ala

160 165 170TTT CCG GCT GGC GTT TGC CCT ACT GTT GGA GTT GGT GGC CAT TTT AGT 576Phe Pro Ala Gly Val Cys Pro Thr Val Gly Val Gly Gly His Phe Ser175 180 185 190GGT GGT GGT TAT GGT AAC TTG ATG GGA AAA TAC GGC CTT TCT GTT GAC 624Gly Gly Gly Tyr Gly Asn Leu Met Gly Lys Tyr Gly Leu Ser Val Asp

195 200 205AAT ATT GTC GAT GCT CAG TTA ATC GAT GTG AAT GGT AAA CTT CTG AAT 672Asn Ile Val Asp Ala Gln Leu Ile Asp Val Asn Gly Lys Leu Leu Asn

210 215 220CGG AAA TCA ATG GGT GAA GAT CTT TTT TGG GCC ATC ACA GGT GGT GGT 720Arg Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Thr Gly Gly Gly

225 230 235GGT GTC AGC TTT GGT GTG GTT GTA GCG TAC AAG ATC AAA CTG GTT CGT 768Gly Val Ser Phe Gly Val Val Val Ala Tyr Lys Ile Lys Leu Val Arg

240 245 250GTT CCT ACC ACT GTG ACC GTT TTT AAC GTA CAA AGA ACA TCC GAG CAG 816Val Pro Thr Thr Val Thr Val Phe Asn Val Gln Arg Thr Ser Glu Gln255 260 265 270AAC CTA AGC ACC ATA GCC CAC CGA TGG ATA CAA GTT GCG GAT AAG CTC 864Asn Leu Ser Thr Ile Ala His Arg Trp Ile Gln Val Ala Asp Lys Leu

275 280 285GAT AAT GAC CTT TTC CTT CGA ATG ACC TTT AAC GTG ATA AAC AAC ACA 912Asp Asn Asp Leu Phe Leu Arg Met Thr Phe Asn Val Ile Asn Asn Thr

290 295 300AAT GGC GAA AAG ACG ATA CGT GGT TTG TTT CCA ACA CTG TAC CTC GGA 960Asn Gly Glu Lys Thr Ile Arg Gly Leu Phe Pro Thr Leu Tyr Leu Gly

305 310 315AAC TCT ACC GCT CTT GTT GCC CTC CTG AAC AAG GAT TTC CCT GAA TTA 1008Asn Ser Thr Ala Leu Val Ala Leu Leu Asn Lys Asp Phe Pro Glu Leu

320 325 330GGT GTA GAA ATT TCA GAT TGT ATT GAA ATG AGT TGG ATC GAG TCT GTT 1056Gly Val Glu Ile Ser Asp Cys Ile Glu Met Ser Trp Ile Glu Ser Val335 340 345 350CTT TTC TAC ACA AAC TTC CCC ATT GGT ACT CCG ACC ACT GCT CTT CTA 1104Leu Phe Tyr Thr Asn Phe Pro Ile Gly Thr Pro Thr Thr Ala Leu Leu

355 360 365AGC CGT ACA CCT CAA AGA CTA AAC CCA TTC AAA ATC AAA TCT GAT TAC 1152Ser Arg Thr Pro Gln Arg Leu Asn Pro Phe Lys Ile Lys Ser Asp Tyr

370 375 380GTA AAA AAC ACT ATT TCC AAA CAG GGA TTC GAA TCC ATA TTT GAA AGG 1200Val Lys Asn Thr Ile Ser Lys Gln Gly Phe Glu Ser Ile Phe Glu Arg

385 390 395ATG AAA GAA CTC GAA AAC CAA ATG CTA GCT TTC AAC CCT TAT GGT GGA 1248Met Lys Glu Leu Glu Asn Gln Met Leu Ala Phe Asn Pro Tyr Gly Gly

400 405 410AGA ATG AGC GAA ATT TCC GAA TTT GCA AAG CCT TTT CCC CAT CGA TCA 1296Arg Met Ser Glu Ile Ser Glu Phe Ala Lys Pro Phe Pro His Arg Ser415 420 425 430GGG AAT ATA GCG AAG ATC CAA TAC GAA GTA AAC TGG GAT GAA CTT GGC 1344Gly Asn Ile Ala Lys Ile Gln Tyr Glu Val Asn Trp Asp Glu Leu Gly

435 440 445GTT GAA GCA GCC AAT CGG TAC TTG AAC TTC ACA AGG GTG ATG TAT GAT 1392Val Glu Ala Ala Asn Arg Tyr Leu Asn Phe Thr Arg Val Met Tyr Asp

450 455 460TAT ATG ACT CCG TTT GTT TCT AAG AAC CCC AGG GAA GCA TTT CTG AAC 1440Tyr Met Thr Pro Phe Val Ser Lys Asn Pro Arg Glu Ala Phe Leu Asn

465 470 475TAC AGG GAT TTA GAT ATT GGT GTC AAC AGT CAT GGC AAG AAT GCT TAC 1488Tyr Arg Asp Leu Asp Ile Gly Val Asn Ser His Gly Lys Asn Ala Tyr

480 485 490GGT GAA GGA ATG GTT TAT GGG CAC AAG TAT TTC AAA GAG ACG AAT TAT 1536Gly Glu Gly Met Val Tyr Gly His Lys Tyr Phe Lys Glu Thr Asn Tyr495 500 505 510AAG AGG CTA ACG ATG GTG AAG ACG AGG GTT GAT CCT AGC AAT TTT TTT 1584Lys Arg Leu Thr Met Val Lys Thr Arg Val Asp Pro Ser Asn Phe Phe

515 520 525AGG AAT GAG CAA AGT ATC CCA ACT TTG TCA TCT TCA TGG AAG 1626Arg Asn Glu Gln Ser Ile Pro Thr Leu Ser Ser Ser Trp Lys

530 535 540TAAATTCTAA ATTCACTTGT GAAATTGAAT AAAAGTATGG CTTTTTCAAG GTCATGGTAT 1686CCAGATTCAG ATGATATTGA TATAATTTTG ACTTGTATTT ATACAAACAA AATTATATTA 1746TATTTTTCTG AATTTAGATT TTCCATTCTT TGGAAAAATA TACGAACATT GATGTTGATA 1806TTTTTAAGAA TTATAGATTT TGAACATTGT GAACAATGAA TAAACCGAGG ACTTCCCTTG 1866GGTTTTTTTT ATAAGTATGT AATAGCATGT CTTTAATCAA GATAACCGAT CATTGGATGC 1926AATTTATTAT TATAAACCTT ATTTAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAA 1981(2)关于SEQ ID NO:58的信息：

(ⅰ)序列特征：

(A)长度：540个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质(ⅹⅰ)序列描述：SEQ ID NO:58Met Ala Ile Thr Tyr Ser Phe Asn Phe Lys Ser Tyr Ile Phe Pro Leu1 5 10 15Leu Leu Val Leu Leu Ser Thr His Ser Ser Ala Thr Ser Thr Ser Ile

20 25 30Ile Asp Arg Phe Thr Gln Cys Leu Asn Asn Arg Ala Asp Pro Ser Phe

35 40 45Pro Leu Ser Gly Gln Leu Tyr Thr Pro Asp Asn Ser Ser Phe Pro Ser

50 55 60Val Leu Gln Ala Tyr Ile Arg Asn Leu Arg Phe Asn Glu Ser Thr Thr65 70 75 80Pro Lys Pro Ile Leu Ile Ile Thr Ala Leu His Pro Ser His Ile Gln

85 90 95Ala Ala Val Val Cys Ala Lys Thr His Arg Leu Leu Met Lys Thr Arg

100 105 110Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Val Thr Asn Ser Asn

115 120 125Gln Pro Phe Phe Val Val Asp Met Phe Asn Leu Arg Ser Ile Asn Val

130 135 140Ser Ile Glu Asp Glu Thr Ala Trp Val Gln Ala Gly Ala Thr Leu Gly145 150 155 160Glu Val Tyr Tyr Arg Ile Ala Glu Lys Ser Asn Ser His Ala Phe Pro

165 170 175Ala Gly Val Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly

180 185 190Gly Tyr Gly Asn Leu Met Gly Lys Tyr Gly Leu Ser Val Asp Asn Ile

195 200 205Val Asp Ala Gln Leu Ile Asp Val Asn Gly Lys Leu Leu Asn Arg Lys

210 215 220Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Thr Gly Gly Gly Gly Val225 230 235 240Ser Phe Gly Val Val Val Ala Tyr Lys Ile Lys Leu Val Arg Val Pro

245 250 255Thr Thr Val Thr Val Phe Asn Val Gln Arg Thr Ser Glu Gln Asn Leu

260 265 270Ser Thr Ile Ala His Arg Trp Ile Gln Val Ala Asp Lys Leu Asp Asn

275 280 285Asp Leu Phe Leu Arg Met Thr Phe Asn Val Ile Asn Asn Thr Asn Gly

290 295 300Glu Lys Thr Ile Arg Gly Leu Phe Pro Thr Leu Tyr Leu Gly Asn Ser305 310 315 320Thr Ala Leu Val Ala Leu Leu Asn Lys Asp Phe Pro Glu Leu Gly Val

325 330 335Glu Ile Ser Asp Cys Ile Glu Met Ser Trp Ile Glu Ser Val Leu Phe

340 345 350Tyr Thr Asn Phe Pro Ile Gly Thr Pro Thr Thr Ala Leu Leu Ser Arg

355 360 365Thr Pro Gln Arg Leu Asn Pro Phe Lys Ile Lys Ser Asp Tyr Val Lys

370 375 380Asn Thr Ile Ser Lys Gln Gly Phe Glu Ser Ile Phe Glu Arg Met Lys385 390 395 400Glu Leu Glu Asn Gln Met Leu Ala Phe Asn Pro Tyr Gly Gly Arg Met

405 410 415Ser Glu Ile Ser Glu Phe Ala Lys Pro Phe Pro His Arg Ser Gly Asn

420 425 430Ile Ala Lys Ile Gln Tyr Glu Val Asn Trp Asp Glu Leu Gly Val Glu

435 440 445Ala Ala Asn Arg Tyr Leu Asn Phe Thr Arg Val Met Tyr Asp Tyr Met

450 455 460Thr Pro Phe Val Ser Lys Asn Pro Arg Glu Ala Phe Leu Asn Tyr Arg465 470 475 480Asp Leu Asp Ile Gly Val Asn Ser His Gly Lys Asn Ala Tyr Gly Glu

485 490 495Gly Met Val Tyr Gly His Lys Tyr Phe Lys Glu Thr Asn Tyr Lys Arg

500 505 510Leu Thr Met Val Lys Thr Arg Val Asp Pro Ser Asn Phe Phe Arg Asn

515 520 525Glu Gln Ser Ile Pro Thr Leu Ser Ser Ser Trp Lys

530 535 540(2)关于SEQ ID NO:59的信息：

(ⅰ)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:59GGTAATGATC TCCTTTCTTG TTTGACC 27(2)关于SEQ ID NO:60的信息：

(ⅰ)序列特征：

(A)长度：41个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅹⅰ)序列描述：SEQ ID NO:60AGAGCGGCCG CTATATTACA ACTTCTCCAC CATCACTCCT C 41(2)关于SEQ ID NO:61的信息：

(ⅰ)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:61:GGTGATGTTA ATGATAATCT CCTC 24(2)关于SEQ ID NO:62的信息：

(ⅰ)序列特征：

(A)长度：40个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:62AGAGCGGCCG CTACAATTCC TTCAACATGT AAATTTCCTC 40(2)关于SEQ ID NO:63的信息：

(ⅰ)序列特征：

(A)长度：36个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:63ACTTCCCGTA GAAACTCGGA GACTTTCACA CAATGC 36(2)关于SEQ ID NO:64的信息：

(ⅰ)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:64TCCATCCAAG ATCAATTCAT AAACTGTGTC 30(2)关于SEQ ID NO:65的信息：

(ⅰ)序列特征：

(A)长度：36个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:65AGAGCGGCCG CTTTCATGAA CCTAGCTTCT AGTAGG 36(2)关于SEQ ID NO:66的信息：

(ⅰ)序列特征：

(A)长度：37个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:66AGAGCGGCCG CGAAATGGCC CCCCTTTTAA AACGGGG 37(2)关于SEQ ID NO:67的信息：

(ⅰ)序列特征：

(A)长度：40个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:67AGAGCGGCCG CAAATGATAT CTTCAGGTAA CTTTGTTCAC 40(2)关于SEQ ID NO:68的信息：

(ⅰ)序列特征：

(A)长度：43个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:68AGAGCGGCCG CATAATCAAA TAAATACACT TATGGTAACA CAG 43(2)关于SEQ ID NO:69的信息：

(ⅰ)序列特征：

(A)长度：38个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA

(ⅲ)假设：否

(ⅹⅰ)序列描述：SEQ ID NO:69AGAGCGGCCG CTGGTTTTGT ATTGAGGACT CAAAACAG 38(2)关于SEQ ID NO:70的信息：

(ⅰ)序列特征：

(A)长度：1757个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：DNA(基因组)

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：columbia

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：接点(1..570,801..1754)

(ⅹⅰ)序列描述：SEQ ID NO:70ACT TCC CGT AGA AAC TCG GAG ACT TTC ACA CAA TGC CTA ACC TCA AAC 48Thr Ser Arg Arg Asn Ser Glu Thr Phe Thr Gln Cys Leu Thr Ser Asn1 5 10 15TCC GAC CCC AAA CAT CCC ATC TCC CCC GCT ATC TTC TTC TCC GGA AAT 96Ser Asp Pro Lys His Pro Ile Ser Pro Ala Ile Phe Phe Ser Gly Asn

20 25 30GGC TCC TAC TCC TCC GTA TTA CAA GCC AAC ATC CGT AAC CTC CGC TTC 144Gly Ser Tyr Ser Ser Val Leu Gln Ala Asn Ile Arg Asn Leu Arg Phe

35 40 45AAC ACC ACC TCA ACT CCG AAA CCC TTC CTC ATA ATC GCC GCA ACA CAT 192Asn Thr Thr Ser Thr Pro Lys Pro Phe Leu Ile Ile Ala Ala Thr His

50 55 60GAA TCC CAT GTG CAA GCC GCG ATT ACT TGC GGG AAA CGC CAC AAC CTT 240Glu Ser His Val Gln Ala Ala Ile Thr Cys Gly Lys Arg His Asn Leu65 70 75 80CAG ATG AAA ATC AGA AGT GGA GGC CAC GAC TAC GAT GGC TTG TCA TAC 288Gln Met Lys Ile Arg Ser Gly Gly His Asp Tyr Asp Gly Leu Ser Tyr

85 90 95GTT ACA TAC TCT GGC AAA CCG TTC TTC GTC CTC GAC ATG TTT AAC CTC 336Val Thr Tyr Ser Gly Lys Pro Phe Phe Val Leu Asp Met Phe Asn Leu

100 105 110CGT TCG GTG GAT GTC GAT GTG GCA AGT AAG ACC GCG TGG GTC CAA ACC 384Arg Ser Val Asp Val Asp Val Ala Ser Lys Thr Ala Trp Val Gln Thr

115 120 125GGT GCC ATA CTC GGA GAA GTT TAT TAC TAT ATA TGG GAG AAG AGC AAA 432Gly Ala Ile Leu Gly Glu Val Tyr Tyr Tyr Ile Trp Glu Lys Ser Lys

130 135 140ACC CTA GCT TAT CCC GCC GGA ATT TGT CCC ACG GTT GGT GTC GGT GGC 480Thr Leu Ala Tyr Pro Ala Gly Ile Cys Pro Thr Val Gly Val Gly Gly145 150 155 160CAT ATC AGT GGT GGA GGT TAC GGT AAC ATG ATG AGA AAA TAC GGT CTC 528His Ile Ser Gly Gly Gly Tyr Gly Asn Met Met Arg Lys Tyr Gly Leu

165 170 175ACC GTA GAT AAT ACC ATC GAT GCA AGA ATG GTC GAC GTT AAT 570Thr Val Asp Asn Thr Ile Asp Ala Arg Met Val Asp Val Asn

180 185 190GGTATAATTG ATATCTCTAT TTTATATACT AATTAAATTT TATAGTGTGG ATCGGATAGT 630GATTTTGGTC CATCAATTAA AAACTTGGTG AACATAAAAT TAACCAAGCA ATCAATTTAG 690ACAAGCAACA TAATCATATA TATTTTTCTT ACATTTGTAT GTACCTGAAT ATTTATATTT 750ATGTTTATAT GTTCTCACTA TATTTTCACT TTTGTATTTG AAAATTTTTA GGA AAA 806

Gly LysATT TTG GAT AGA AAA TTG ATG GGA GAA GAT CTC TAC TGG GCA ATA AAC 854Ile Leu Asp Arg Lys Leu Met Gly Glu Asp Leu Tyr Trp Ala Ile Asn

195 200 205GGA GGA GGA GGA GGG AGC TAC GGC GTC GTA TTG GCC TAC AAA ATA AAC 902Gly Gly Gly Gly Gly Ser Tyr Gly Val Val Leu Ala Tyr Lys Ile Asn

210 215 220CTT GTT GAA GTC CCA GAA AAC GTC ACC GTT TTC AGA ATC TCC CGG ACG 950Leu Val Glu Val Pro Glu Asn Val Thr Val Phe Arg Ile Ser Arg Thr225 230 235 240TTA GAA CAA AAT GCG ACG GAT ATC ATT CAC CGG TGG CAA CAA GTT GCA 998Leu Glu Gln Asn Ala Thr Asp Ile Ile His Arg Trp Gln Gln Val Ala

245 250 255CCG AAG CTT CCC GAC GAG CTT TTC ATA AGA ACA GTC ATT GAC GTA GTA 1046Pro Lys Leu Pro Asp Glu Leu Phe Ile Arg Thr Val Ile Asp Val Val

260 265 270AAC GGC ACT GTT TCA TCT CAA AAG ACC GTC AGG ACA ACA TTC ATA GCA 1094Asn Gly Thr Val Ser Ser Gln Lys Thr Val Arg Thr Thr Phe Ile Ala

275 280 285ATG TTT CTA GGA GAC ACG ACA ACT CTA CTG TCG ATA TTA AAC CGG AGA 1142Met Phe Leu Gly Asp Thr Thr Thr Leu Leu Ser Ile Leu Asn Arg Arg

290 295 300TTC CCA GAA TTG GGT TTG GTC CGG TCT GAC TGT ACC GAA ACA AGC TGG 1190Phe Pro Glu Leu Gly Leu Val Arg Ser Asp Cys Thr Glu Thr Ser Trp305 310 315 320ATC CAA TCT GTG CTA TTC TGG ACA AAT ATC CAA GTT GGT TCG TCG GAG 1238Ile Gln Ser Val Leu Phe Trp Thr Asn Ile Gln Val Gly Ser Ser Glu

325 330 335ACA CTT CTA CTC CAA AGG AAT CAA CCC GTG AAC TAC CTC AAG AGG AAA 1286Thr Leu Leu Leu Gln Arg Asn Gln Pro Val Asn Tyr Leu Lys Arg Lys

340 345 350TCA GAT TAC GTA CGT GAA CCG ATT TCA AGA ACC GGT TTA GAG TCA ATT 1334Ser Asp Tyr Val Arg Glu Pro Ile Ser Arg Thr Gly Leu Glu Ser Ile

355 360 365TGG AAG AAA ATG ATC GAG CTT GAA ATT CCG ACA ATG GCT TTC AAT CCA 1382Trp Lys Lys Met Ile Glu Leu Glu Ile Pro Thr Met Ala Phe Asn Pro

370 375 380TAC GGT GGT GAG ATG GGG AGG ATA TCA TTA CGG GTG ACT CCG TTC CCA 1430Tyr Gly Gly Glu Met Gly Arg Ile Ser Leu Arg Val Thr Pro Phe Pro385 390 395 400TAC AGA GCC GGT AAT CTC TGG AAG ATT CAG TAC GGT GCG AAT TGG AGA 1478Tyr Arg Ala Gly Asn Leu Trp Lys Ile Gln Tyr Gly Ala Asn Trp Arg

405 410 415GAT GAG ACT TTA ACC GAC CGG TAC ATG GAA TTG ACG AGG AAG TTG TAC 1526Asp Glu Thr Leu Thr Asp Arg Tyr Met Glu Leu Thr Arg Lys Leu Tyr

420 425 430CAA TTC ATG ACA CCA TTT GTT TCC AAG AAT CCG AGA CAA TCG TTT TTC 1574Gln Phe Met Thr Pro Phe Val Ser Lys Asn Pro Arg Gln Ser Phe Phe

435 440 445AAT AAC CGT GAT GTT GAT TTG GGT ATT AAT TCT CAT AAT GGT AAA ATC 1622Asn Asn Arg Asp Val Asp Leu Gly Ile Asn Ser His Asn Gly Lys Ile

450 455 460AGT AGT TAT GTG GAA GGT AAA CGT TAC GGG AAG AAG TAT TTC GCA GGT 1670Ser Ser Tyr Val Glu Gly Lys Arg Tyr Gly Lys Lys Tyr Phe Ala Gly465 470 475 480AAT TTC GAG AGA TTG GTG AAG ATT AAG ACG AGA GTT GAT AGT GGT AAT 1718Asn Phe Glu Arg Leu Val Lys Ile Lys Thr Arg Val Asp Ser Gly Asn

485 490 495TTC TTT AGG AAC GAA CAC AGT ATT CCT GTG TTA CCA TAA 1757Phe Phe Arg Asn Glu His Ser Ile Pro Val Leu Pro

500 505(2)关于SEQ ID NO:71的信息：

(ⅰ)序列特征：

(A)长度：508个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:71Thr Ser Arg Arg Asn Ser Glu Thr Phe Thr Gln Cys Leu Thr Ser Asn1 5 10 15Ser Asp Pro Lys His Pro Ile Ser Pro Ala Ile Phe Phe Ser Gly Asn

20 25 30Gly Ser Tyr Ser Ser Val Leu Gln Ala Asn Ile Arg Asn Leu Arg Phe

35 40 45Asn Thr Thr Ser Thr Pro Lys Pro Phe Leu Ile Ile Ala Ala Thr His

50 55 60Glu Ser His Val Gln Ala Ala Ile Thr Cys Gly Lys Arg His Asn Leu65 70 75 80Gln Met Lys Ile Arg Ser Gly Gly His Asp Tyr Asp Gly Leu Ser Tyr

85 90 95Val Thr Tyr Ser Gly Lys Pro Phe Phe Val Leu Asp Met Phe Asn Leu

100 105 110Arg Ser Val Asp Val Asp Val Ala Ser Lys Thr Ala Trp Val Gln Thr

115 120 125Gly Ala Ile Leu Gly Glu Val Tyr Tyr Tyr Ile Trp Glu Lys Ser Lys

130 135 140Thr Leu Ala Tyr Pro Ala Gly Ile Cys Pro Thr Val Gly Val Gly Gly145 150 155 160His Ile Ser Gly Gly Gly Tyr Gly Asn Met Met Arg Lys Tyr Gly Leu

165 170 175Thr Val Asp Asn Thr Ile Asp Ala Arg Met Val Asp Val Asn Gly Lys

180 185 190Ile Leu Asp Arg Lys Leu Met Gly Glu Asp Leu Tyr Trp Ala Ile Asn

195 200 205Gly Gly Gly Gly Gly Ser Tyr Gly Val Val Leu Ala Tyr Lys Ile Asn

210 215 220Leu Val Glu Val Pro Glu Asn Val Thr Val Phe Arg Ile Ser Arg Thr225 230 235 240Leu Glu Gln Asn Ala Thr Asp Ile Ile His Arg Trp Gln Gln Val Ala

245 250 255Pro Lys Leu Pro Asp Glu Leu Phe Ile Arg Thr Val Ile Asp Val Val

260 265 270Asn Gly Thr Val Ser Ser Gln Lys Thr Val Arg Thr Thr Phe Ile Ala

275 280 285Met Phe Leu Gly Asp Thr Thr Thr Leu Leu Ser Ile Leu Asn Arg Arg

290 295 300Phe Pro Glu Leu Gly Leu Val Arg Ser Asp Cys Thr Glu Thr Ser Trp305 310 315 320Ile Gln Ser Val Leu Phe Trp Thr Asn Ile Gln Val Gly Ser Ser Glu

325 330 335Thr Leu Leu Leu Gln Arg Asn Gln Pro Val Asn Tyr Leu Lys Arg Lys

340 345 350Ser Asp Tyr Val Arg Glu Pro Ile Ser Arg Thr Gly Leu Glu Ser Ile

355 360 365Trp Lys Lys Met Ile Glu Leu Glu Ile Pro Thr Met Ala Phe Asn Pro

370 375 380Tyr Gly Gly Glu Met Gly Arg Ile Ser Leu Arg Val Thr Pro Phe Pro385 390 395 400Tyr Arg Ala Gly Asn Leu Trp Lys Ile Gln Tyr Gly Ala Asn Trp Arg

405 410 415Asp Glu Thr Leu Thr Asp Arg Tyr Met Glu Leu Thr Arg Lys Leu Tyr

420 425 430Gln Phe Met Thr Pro Phe Val Ser Lys Asn Pro Arg Gln Ser Phe Phe

435 440 445Asn Asn Arg Asp Val Asp Leu Gly Ile Asn Ser His Asn Gly Lys Ile

450 455 460Ser Ser Tyr Val Glu Gly Lys Arg Tyr Gly Lys Lys Tyr Phe Ala Gly465 470 475 480Asn Phe Glu Arg Leu Val Lys Ile Lys Thr Arg Val Asp Ser Gly Asn

485 490 495Phe Phe Arg Asn Glu His Ser Ile Pro Val Leu Pro

500 505(2)关于SEQ ID NO:72的信息：

(ⅰ)序列特征：

(A)长度：1527个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：columbia

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..1524(ⅹⅰ)序列描述：SEQ ID NO:72ACT TCC CGT AGA AAC TCG GAG ACT TTC ACA CAA TGC CTA ACC TCA AAC 48Thr Ser Arg Arg Asn Ser Glu Thr Phe Thr Gln Cys Leu Thr Ser Asn1 5 10 15TCC GAC CCC AAA CAT CCC ATC TCC CCC GCT ATC TTC TTC TCC GGA AAT 96Ser Asp Pro Lys His Pro Ile Ser Pro Ala Ile Phe Phe Ser Gly Asn

100 105 110CGT TCG GTG GAT GTC GAC GTG GCA AGT AAG ACC GCG TGG GTC CAA ACC 384Arg Ser Val Asp Val Asp Val Ala Ser Lys Thr Ala Trp Val Gln Thr

165 170 175ACC GTA GAT AAT ACC ATC GAT GCA AGA ATG GTC GAC GTA AAT GGA AAA 576Thr Val Asp Asn Thr Ile Asp Ala Arg Met Val Asp Val Asn Gly Lys

180 185 190ATT TTG GAT AGA AAA TTG ATG GGA GAA GAT CTC TAC TGG GCA ATA AAC 624Ile Leu Asp Arg Lys Leu Met Gly Glu Asp Leu Tyr Trp Ala Ile Asn

195 200 205GGA GGA GGA GGA GGG AGC TAC GGC GTC GTA TTG GCC TAC AAA ATA AAC 672Gly Gly Gly Gly Gly Ser Tyr Gly Val Val Leu Ala Tyr Lys Ile Asn

210 215 220CTT GTT GAA GTC CCA GAA AAC GTC ACC GTT TTC AGA ATC TCC CGG ACG 720Leu Val Glu Val Pro Glu Asn Val Thr Val Phe Arg Ile Ser Arg Thr225 230 235 240TTA GAA CAA AAT GCG ACG GAT ATC ATT CAC CGG TGG CAA CAA GTT GCA 768Leu Glu Gln Asn Ala Thr Asp Ile Ile His Arg Trp Gln Gln Val Ala

245 250 255CCG AAG CTT CCC GAC GAG CTT TTC ATA AGA ACA GTC ATT GAC GTA GTA 816Pro Lys Leu Pro Asp Glu Leu Phe Ile Arg Thr Val Ile Asp Val Val

260 265 270AAC GGC ACT GTT TCA TCT CAA AAG ACC GTC AGG ACA ACA TTC ATA GCA 864Asn Gly Thr Val Ser Ser Gln Lys Thr Val Arg Thr Thr Phe Ile Ala

275 280 285ATG TTT CTA GGA GAC ACG ACA ACT CTA CTG TCG ATA TTA AAC CGG AGA 912Met Phe Leu Gly Asp Thr Thr Thr Leu Leu Ser Ile Leu Asn Arg Arg

290 295 300TTC CCA GAA TTG GGT TTG GTC CGG TCT GAC TGT ACC GAA ACA AGC TGG 960Phe Pro Glu Leu Gly Leu Val Arg Ser Asp Cys Thr Glu Thr Ser Trp305 310 315 320ATC CAA TCT GTG CTA TTC TGG ACA AAT ATC CAA GTT GGT TCG TCG GAG 1008Ile Gln Ser Val Leu Phe Trp Thr Asn Ile Gln Val Gly Ser Ser Glu

325 330 335ACA CTT CTA CTC CAA AGG AAT CAA CCC GTG AAC TAC CTC AAG AGG AAA 1056Thr Leu Leu Leu Gln Arg Asn Gln Pro Val Asn Tyr Leu Lys Arg Lys

340 345 350TCA GAT TAC GTA CGT GAA CCG ATT TCA AGA ACC GGT TTA GAG TCA ATT 1104Ser Asp Tyr Val Arg Glu Pro Ile Ser Arg Thr Gly Leu Glu Ser Ile

355 360 365TGG AAG AAA ATG ATC GAG CTT GAA ATT CCG ACA ATG GCT TTC AAT CCA 1152Trp Lys Lys Met Ile Glu Leu Glu Ile Pro Thr Met Ala Phe Asn Pro

370 375 380TAC GGT GGT GAG ATG GGG AGG ATA TCA TCT ACG GTG ACT CCG TTC CCA 1200Tyr Gly Gly Glu Met Gly Arg Ile Ser Ser Thr Val Thr Pro Phe Pro385 390 395 400TAC AGA GCC GGT AAT CTC TGG AAG ATT CAG TAC GGT GCG AAT TGG AGA 1248Tyr Arg Ala Gly Asn Leu Trp Lys Ile Gln Tyr Gly Ala Asn Trp Arg

405 410 415GAT GAG ACT TTA ACC GAC CGG TAC ATG GAA TTG ACG AGG AAG TTG TAC 1296Asp Glu Thr Leu Thr Asp Arg Tyr Met Glu Leu Thr Arg Lys Leu Tyr

420 425 430CAA TTC ATG ACA CCA TTT GTT TCC AAG AAT CCG AGA CAA TCG TTT TTC 1344Gln Phe Met Thr Pro Phe Val Ser Lys Asn Pro Arg Gln Ser Phe Phe

435 440 445AAT TAC CGT GAT GTT GAT TTG GGT ATT AAT TCT CAT AAT GGT AAA ATC 1392Asn Tyr Arg Asp Val Asp Leu Gly Ile Asn Ser His Asn Gly Lys Ile

450 455 460AGT AGT TAT GTG GAA GGT AAA CGT TAC GGG AAG AAG TAT TTC GCA GGT 1440Ser Ser Tyr Val Glu Gly Lys Arg Tyr Gly Lys Lys Tyr Phe Ala Gly465 470 475 480AAT TTC GAG AGA TTG GTG AAG ATT AAG ACG AGA GTT GAT AGT GGT AAT 1488Asn Phe Glu Arg Leu Val Lys Ile Lys Thr Arg Val Asp Ser Gly Asn

485 490 495TTC TTT AGG AAC GAA CAG AGT ATT CCT GTG TTA CCA TAA 1527Phe Phe Arg Asn Glu Gln Ser Ile Pro Val Leu Pro

500 505(2)关于SEQ ID NO:73的信息：

(ⅰ)序列特征：

(A)长度：508个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:73Thr Ser Arg Arg Asn Ser Glu Thr Phe Thr Gln Cys Leu Thr Ser Asn1 5 10 15Ser Asp Pro Lys His Pro Ile Ser Pro Ala Ile Phe Phe Ser Gly Asn

20 25 30Gly Ser Tyr Ser Ser Val Leu Gln Ala Asn Ile Arg Asn Leu Arg Phe

35 40 45Asn Thr Thr Ser Thr Pro Lys Pro Phe Leu Ile Ile Ala Ala Thr His

85 90 95Val Thr Tyr Ser Gly Lys Pro Phe Phe Val Leu Asp Met Phe Asn Leu

100 105 110Arg Ser Val Asp Val Asp Val Ala Ser Lys Thr Ala Trp Val Gln Thr

115 120 125Gly Ala Ile Leu Gly Glu Val Tyr Tyr Tyr Ile Trp Glu Lys Ser Lys

165 170 175Thr Val Asp Asn Thr Ile Asp Ala Arg Met Val Asp Val Asn Gly Lys

180 185 190Ile Leu Asp Arg Lys Leu Met Gly Glu Asp Leu Tyr Trp Ala Ile Asn

195 200 205Gly Gly Gly Gly Gly Ser Tyr Gly Val Val Leu Ala Tyr Lys Ile Asn

245 250 255Pro Lys Leu Pro Asp Glu Leu Phe Ile Arg Thr Val Ile Asp Val Val

260 265 270Asn Gly Thr Val Ser Ser Gln Lys Thr Val Arg Thr Thr Phe Ile Ala

275 280 285Met Phe Leu Gly Asp Thr Thr Thr Leu Leu Ser Ile Leu Asn Arg Arg

290 295 300Phe Pro Glu Leu Gly Leu Val Arg Ser Asp Cys Thr Glu Thr Ser Trp305 310 315 320Ils Gln Ser Val Leu Phe Trp Thr Asn Ile Gln Val Gly Ser Ser Glu

325 330 335Thr Leu Leu Leu Gln Arg Asn Gln Pro Val Asn Tyr Leu Lys Arg Lys

340 345 350Ser Asp Tyr Val Arg Glu Pro Ile Ser Arg Thr Gly Leu Glu Ser Ile

355 360 365Trp Lys Lys Met Ile Glu Leu Glu Ile Pro Thr Met Ala Phe Asn Pro

370 375 380Tyr Gly Gly Glu Met Gly Arg Ile Ser Ser Thr Val Thr Pro Phe Pro385 390 395 400Tyr Arg Ala Gly Asn Leu Trp Lys Ile Gln Tyr Gly Ala Asn Trp Arg

405 410 415Asp Glu Thr Leu Thr Asp Arg Tyr Met Glu Leu Thr Arg Lys Leu Tyr

420 425 430Gln Phe Met Thr Pro Phe Val Ser Lys Asn Pro Arg Gln Ser Phe Phe

435 440 445Asn Tyr Arg Asp Val Asp Leu Gly Ile Asn Ser His Asn Gly Lys Ile

485 490 495Phe Phe Arg Asn Glu Gln Ser Ile Pro Val Leu Pro

500 505(2)关于SEQ ID NO:74的信息：

(ⅰ)序列特征：

(A)长度：1530个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ⅱ)分子类型：cDNA至mRNA

(ⅲ)假设：否

(ⅲ)反义：否

(ⅵ)原始来源：

(A)生物：拟南芥

(B)株系：columbia

(ⅸ)特征：

(A)名称/关键词：CDS

(B)位置：1..1527(ⅹⅰ)序列描述：SEQ ID NO:74TCC ATC CAA GAT CAA TTC ATA AAC TGT GTC AAA AGA AAC ACA CAT GTT 48Ser Ile Gln Asp Gln Phe Ile Asn Cys Val Lys Arg Asn Thr His Val1 5 10 15TCT TTT CCA CTC GAG AAA ACG TTA TTC ACC CCT GCG AAA AAC GTC TCT 96Ser Phe Pro Leu Glu Lys Thr Leu Phe Thr Pro Ala Lys Asn Val Ser

20 25 30TTG TTC AAC CAA GTC CTT GAA TCG ACG GCT CAA AAT CTC CAG TTC TTG 144Leu Phe Asn Gln Val Leu Glu Ser Thr Ala Gln Asn Leu Gln Phe Leu

35 40 45GCA AAA TCC ATG CCT AAA CCG GGA TTC ATA TTC AGA CCG ATT CAC CAG 192Ala Lys Ser Met Pro Lys Pro Gly Phe Ile Phe Arg Pro Ile His Gln

50 55 60TCT CAA GTC CAA GCT TCC ATC ATT TGT TCA AAG AAA CTC GGA ATT CAT 240Ser Gln Val Gln Ala Ser Ile Ile Cys Ser Lys Lys Leu Gly Ile His65 70 75 80TTT CGT GTT AGA AGT GGC GGT CAC GAT TTC GAG GCC TTG TCT TAT GTT 288Phe Arg Val Arg Ser Gly Gly His Asp Phe Glu Ala Leu Ser Tyr Val

85 90 95TCA CGG ATT GAA AAA CCG TTT ATA TTA CTC GAC CTG TCA AAA TTG AAA 336Ser Arg Ile Glu Lys Pro Phe Ile Leu Leu Asp Leu Ser Lys Leu Lys

100 105 110CAA ATC AAT GTT GAT ATT GAA TCC AAT AGT GCT TGG GTT CAA CCT GGT 384Gln Ile Asn Val Asp Ile Glu Ser Asn Ser Ala Trp Val Gln Pro Gly

115 120 125GCT ACG CTT GGT GAG CTT TAC TAC AGA ATT GCA GAG AAG AGC AAG ATC 432Ala Thr Leu Gly Glu Leu Tyr Tyr Arg Ile Ala Glu Lys Ser Lys Ile

130 135 140CAT GGA TTT CCC GCG GGT TTG TGC ACA AGT GTA GGC ATA GGT GGG TAT 480His Gly Phe Pro Ala Gly Leu Cys Thr Ser Val Gly Ile Gly Gly Tyr145 150 155 160ATG ACA GGC GGT GGA TAC GGT ACC TTG ATG AGG AAG TAT GGT CTT GCG 528Met Thr Gly Gly Gly Tyr Gly Thr Leu Met Arg Lys Tyr Gly Leu Ala

165 170 175GGA GAT AAT GTT CTA GAC GTA AAG ATG GTT GAT GCA AAT GGT AAA TTA 576Gly Asp Asn Val Leu Asp Val Lys Met Val Asp Ala Asn Gly Lys Leu

180 185 190CTC GAC AGA GCC GCG ATG GGT GAG GAC CTA TTT TGG GCG ATT AGA GGA 624Leu Asp Arg Ala Ala Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly

195 200 205GGC GGT GGA GCG AGT TTC GGG ATA GTT CTA GCA TGG AAG ATC AAG CTT 672Gly Gly Gly Ala Ser Phe Gly Ile Val Leu Ala Trp Lys Ile Lys Leu

210 215 220GTT CCT GTT CCT AAG ACT GTT ACC GTC TTC ACT GTC ACC AAA ACG TTA 720Val Pro Val Pro Lys Thr Val Thr Val Phe Thr Val Thr Lys Thr Leu225 230 235 240GAA CAA GAC GCA AGA TTG AAG ACT ATT TCT AAG TGG CAA CAA ATT TCA 768Glu Gln Asp Ala Arg Leu Lys Thr Ile Ser Lys Trp Gln Gln Ile Ser

245 250 255TCC AAG ATT ATT GAA GAG ATA CAC ATC CGA GTG GTA CTC AGA GCA GCT 816Ser Lys Ile Ile Glu Glu Ile His Ile Arg Val Val Leu Arg Ala Ala

260 265 270GGA AAT GAT GGA AAC AAG ACT GTG ACA ATG ACC TAC CTA GGT CAG TTT 864Gly Asn Asp Gly Asn Lys Thr Val Thr Met Thr Tyr Leu Gly Gln Phe

275 280 285CTT GGC GAG AAA GGC ACC TTG CTG AAG GTT ATG GAG AAG GCT TTT CCA 912Leu Gly Glu Lys Gly Thr Leu Leu Lys Val Met Glu Lys Ala Phe Pro

290 295 300GAA CTA GGG TTA ACT CAA AAG GAT TGT ACT GAA ATG AGC TGG ATT GAA 960Glu Leu Gly Leu Thr Gln Lys Asp Cys Thr Glu Met Ser Trp Ile Glu305 310 315 320GCC GCC CTT TTC CAT GGT GGA TTT CCA ACA GGT TCT CCT ATT GAA ATT 1008Ala Ala Leu Phe His Gly Gly Phe Pro Thr Gly Ser Pro Ile Glu Ile

325 330 335TTG CTT CAG CTC AAG TCG CCT CTA GGA AAA GAT TAC TTC AAA GCA ACG 1056Leu Leu Gln Leu Lys Ser Pro Leu Gly Lys Asp Tyr Phe Lys Ala Thr

340 345 350TCG GAT TTC GTT AAA GAA CCT ATT CCT GTG ATA GGC TTC AAA GGA ATA 1104Ser Asp Phe Val Lys Glu Pro Ile Pro Val Ile Gly Phe Lys Gly Ile

355 360 365TTC AAA AGA TTG ATT GAA GGA AAC ACA ACA TTT CTG AAC TGG ACT CCT 1152Phe Lys Arg Leu Ile Glu Gly Asn Thr Thr Phe Leu Asn Trp Thr Pro

370 375 380TAC GGT GGT ATG ATG TCG AAA ATC CCT GAA TCT GCG ATC CCA TTT CCG 1200Tyr Gly Gly Met Met Ser Lys Ile Pro Glu Ser Ala Ile Pro Phe Pro385 390 395 400CAT AGA AAC GGA ACC CTC TTC AAG ATT CTC TAT TAC GCG AAC TGG CTA 1248His Arg Asn Gly Thr Leu Phe Lys Ile Leu Tyr Tyr Ala Asn Trp Leu

405 410 415GAG AAT GAC AAG ACA TCG AGT AGA AAA ATC AAC TGG ATC AAA GAG ATA 1296Glu Asn Asp Lys Thr Ser Ser Arg Lys Ile Asn Trp Ile Lys Glu Ile

420 425 430TAC AAT TAC ATG GCG CCT TAT GTC TCA AGC AAT CCA AGA CAA GCA TAT 1344Tyr Asn Tyr Met Ala Pro Tyr Val Ser Ser Asn Pro Arg Gln Ala Tyr

435 440 445GTG AAC TAC AGA GAT CTA GAC TTC GGA CAG AAC AAG AAC AAC GCA AAG 1392Val Asn Tyr Arg Asp Leu Asp Phe Gly Gln Asn Lys Asn Asn Ala Lys

450 455 460GTT AAC TTC ATT GAA GCT AAA ATC TGG GGA CCT AAG TAC TTC AAA GGC 1440Val Asn Phe Ile Glu Ala Lys Ile Trp Gly Pro Lys Tyr Phe Lys Gly465 470 475 480AAT TTT GAC AGA TTG GTG AAG ATT AAA ACC AAG GTT GAT CCA GAG AAC 1488Asn Phe Asp Arg Leu Val Lys Ile Lys Thr Lys Val Asp Pro Glu Asn

485 490 495TTC TTC AGG CAC GAG CAG AGT ATC CCA CCT ATG CCC TAC TAG 1530Phe Phe Arg His Glu Gln Ser Ile Pro Pro Met Pro Tyr

500 505(2)关于SEQ ID NO:75的信息：

(ⅰ)序列特征：

(A)长度：509个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线形

(ⅱ)分子类型：蛋白质

(ⅹⅰ)序列描述：SEQ ID NO:75Ser Ile Gln Asp Gln Phe Ile Asn Cys Val Lys Arg Asn Thr His Val1 5 10 15Ser Phe Pro Leu Glu Lys Thr Leu Phe Thr Pro Ala Lys Asn Val Ser

20 25 30Leu Phe Asn Gln Val Leu Glu Ser Thr Ala Gln Asn Leu Gln Phe Leu

35 40 45Ala Lys Ser Met Pro Lys Pro Gly Phe Ile Phe Arg Pro Ile His Gln

50 55 60Ser Gln Val Gln Ala Ser Ile Ile Cys Ser Lys Lys Leu Gly Ile His65 70 75 80Phe Arg Val Arg Ser Gly Gly His Asp Phe Glu Ala Leu Ser Tyr Val

85 90 95Ser Arg Ile Glu Lys Pro Phe Ils Leu Leu Asp Leu Ser Lys Leu Lys

100 105 110Gln Ile Asn Val Asp Ile Glu Ser Asn Ser Ala Trp Val Gln Pro Gly

115 120 125Ala Thr Leu Gly Glu Leu Tyr Tyr Arg Ile Ala Glu Lys Ser Lys Ile

130 135 140His Gly Phe Pro Ala Gly Leu Cys Thr Ser Val Gly Ile Gly Gly Tyr145 150 155 160Met Thr Gly Gly Gly Tyr Gly Thr Leu Met Arg Lys Tyr Gly Leu Ala

165 170 175Gly Asp Asn Val Leu Asp Val Lys Met Val Asp Ala Asn Gly Lys Leu

180 185 190Leu Asp Arg Ala Ala Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly

195 200 205Gly Gly Gly Ala Ser Phe Gly Ile Val Leu Ala Trp Lys Ile Lys Leu

210 215 220Val Pro Val Pro Lys Thr Val Thr Val Phe Thr Val Thr Lys Thr Leu225 230 235 240Glu Gln Asp Ala Arg Leu Lys Thr Ile Ser Lys Trp Gln Gln Ile Ser

245 250 255Ser Lys Ile Ile Glu Glu Ile His Ile Arg Val Val Leu Arg Ala Ala

260 265 270Gly Asn Asp Gly Asn Lys Thr Val Thr Met Thr Tyr Leu Gly Gln Phe

275 280 285Leu Gly Glu Lys Gly Thr Leu Leu Lys Val Met Glu Lys Ala Phe Pro

290 295 300Glu Leu Gly Leu Thr Gln Lys Asp Cys Thr Glu Met Ser Trp Ile Glu305 310 315 320Ala Ala Leu Phe His Gly Gly Phe Pro Thr Gly Ser Pro Ile Glu Ile

525 330 335Leu Leu Gln Leu Lys Ser Pro Leu Gly Lys Asp Tyr Phe Lys Ala Thr

340 345 350Ser Asp Phe Val Lys Glu Pro Ile Pro Val Ile Gly Phe Lys Gly Ile

355 360 365Phe Lys Arg Leu Ile Glu Gly Asn Thr Thr Phe Leu Asn Trp Thr Pro

370 375 380Tyr Gly Gly Met Met Ser Lys Ile Pro Glu Ser Ala Ile Pro Phe Pro385 390 395 400His Arg Asn Gly Thr Leu Phe Lys Ile Leu Tyr Tyr Ala Asn Trp Leu

405 410 415Glu Asn Asp Lys Thr Ser Ser Arg Lys Ile Asn Trp Ile Lys Glu Ile

420 425 430Tyr Asn Tyr Met Ala Pro Tyr Val Ser Ser Asn Pro Arg Gln Ala Tyr

435 440 445Val Asn Tyr Arg Asp Leu Asp Phe Gly Gln Asn Lys Asn Asn Ala Lys

450 455 460Val Asn Phe Ile Glu Ala Lys Ile Trp Gly Pro Lys Tyr Phe Lys Gly465 470 475 480Asn Phe Asp Arg Leu Val Lys Ile Lys Thr Lys Val Asp Pro Glu Asn

485 490 495Phe Phe Arg His Glu Gln Ser Ile Pro Pro Met Pro Tyr

500 505

Claims

1．一种分离的蛋白或其部分或其突变蛋白，具有抗真菌活性，优选地抗卵菌纲活性，更优选地抗疫霉和/或抗腐霉活性，并且该蛋白质可从植物来源获得，由如SEQ ID NO:15,SEQ ID NO:18,SEQ IDNO:57,SEQ ID NO:70,SEQ ID NO:72或SEQ ID NO:74所示的核苷酸序列编码。

2．根据权利要求1所述的分离的蛋白，其特征在于该蛋白可从向日葵或莴苣植株获得。

3．一种具有碳水化合物氧化酶活性的分离的蛋白，其特征在于具有抗真菌活性，优选地抗卵菌纲活性，更优选地抗疫霉和/或抗腐霉活性。

4．一种碳水化合物氧化酶或其部分或其突变蛋白，其特征在于具有如SEQ ID NO:16,SEQ ID NO:19,SEQ ID NO:58,SEQ ID NO:71,SEQ ID NO:73或SEQ ID NO:75所示的氨基酸序列。

5．一种分离的蛋白，其特征在于它包括一种或多种选自包含下列氨基酸序列的群体的肽：

(a)SEQ ID NO:1的1-25位氨基酸，

(b)SEQ ID NO:2的1-25氨基酸，

(c)SEQ ID NO:6的1-118位氨基酸，

(d)SEQ ID NO:16的1-529位氨基酸，或所述序列的具有抗真菌活性的部分，

(e)SEQ ID NO:20的1-529位氨基酸，或所述序列的具有抗真菌活性的部分，

(f)SEQ ID NO:49的1-21位氨基酸，

(g)SEQ ID NO:50的1-24位氨基酸，

(h)SEQ ID NO:51的1-14位氨基酸，

(i)SEQ ID NO:58的1-540位氨基酸，或所述序列的具有抗真菌活性的部分，

(j)SEQ ID NO:71的1-508位氨基酸，或所述序列的具有抗真菌活性的部分，

(j)SEQ ID NO:73的1-508位氨基酸，或所述序列的具有抗真菌活性的部分，

(j)SEQ ID NO:75的1-509位氨基酸，或所述序列的具有抗真菌活性的部分，

以及它们具有抗真菌活性的突变蛋白。

6．一种抗真菌蛋白，其特征在于所包含的氨基酸序列由SEQ IDNO:15所示的开放阅读框架或其部分编码。

7．一种抗真菌蛋白，其特征在于所包含的氨基酸序列由SEQ IDNO:57所示的开放阅读框架或其部分编码。

8．一种抗真菌蛋白，其特征在于所包含的氨基酸序列由SEQ IDNO:70所示的开放阅读框架或其部分编码。

9．一种抗真菌蛋白，其特征在于所包含的氨基酸序列由SEQ IDNO:72所示的开放阅读框架或其部分编码。

10．一种抗真菌蛋白，其特征在于所包含的氨基酸序列由SEQ IDNO:74所示的开放阅读框架或其部分编码。

11．一种抗真菌蛋白，其特征在于所包含的氨基酸序列由SEQ IDNO:19所示的开放阅读框架或其部分编码。

12．一种抗真菌蛋白，其特征在于所包含的氨基酸序列由SEQ IDNO:21-48中的任意一个所示的开放阅读框架编码。

13．一种分离的DNA序列，包括能编码根据权利要求1-12中的任意一项所述的蛋白的开放阅读框架和能在严格条件下与其杂交的DNA。

14．根据权利要求13所述的分离的DNA序列，其特征在于包含SEQID NO:5中所示的核苷酸序列。

15．根据权利要求13所述的分离的DNA序列，其特征在于包含SEQID NO:15中所示的核苷酸序列。

16．根据权利要求13所述的分离的DNA序列，其特征在于包含SEQID NO:19中所示的核苷酸序列。

17．根据权利要求13所述的分离的DNA序列，其特征在于包含SEQID NO:21-48中所示的核苷酸序列。

18．根据权利要求13所述的分离的DNA序列，其特征在于包含SEQID NO:57中所示的核苷酸序列。

19．根据权利要求13所述的分离的DNA序列，其特征在于包含SEQID NO:70中所示的核苷酸序列。

20．根据权利要求13所述的分离的DNA序列，其特征在于包含SEQID NO:72中所示的核苷酸序列。

21．根据权利要求13所述的分离的DNA序列，其特征在于包含SEQID NO:74中所示的核苷酸序列。

22．一种嵌合DNA序列，包含根据权利要求13-21中的任意一项所述的DNA序列。

23．根据权利要求22所述的嵌合DNA序列，进一步包含转录起始区域和选择性地转录终止区域，它们与所述开放阅读框架连接使嵌合DNA在存在于存活宿主细胞中时能在宿主细胞中转录，从而产生包含所述开放阅读框架的RNA。

24．根据权利要求23所述的嵌合DNA序列，其中含所述开放阅读框架的RNA在存在于所述宿主细胞中时能在宿主细胞中翻译成蛋白，从而产生所述的蛋白。

25．根据权利要求22-24中的任意一项所述的嵌合DNA序列，是复制子，优选地pMOG1144或pMOG1180。

26．根据权利要求25所述的嵌合DNA序列，是载体。

27．根据权利要求26所述的载体，是两元载体，优选地pMOG1144或pMOG1180。

28．包含根据权利要求25所述的复制子的宿主细胞，一旦该复制子存在其中就能维持该复制子。

29．包含根据权利要求26或27所述的载体的宿主细胞，一旦存在该载体其中就能维持该载体。

30．根据权利要求22或23所述的嵌合DNA序列稳定掺入其基因组中的宿主细胞。

31．根据权利要求30所述的宿主细胞，是植物细胞，所述载体是非整合型病毒载体。

32．根据权利要求30所述的宿主细胞，是植物细胞。

33．一种植物或植物部分，包含至少一种根据权利要求31或32所述的植物细胞。

34．一种植物或植物部分，基本上由根据权利要求32所述的植物细胞组成。

35．根据权利要求34所述的植物，其特征在于所述嵌合DNA至少在许多植物细胞中表达并使其中合成所述的抗真菌蛋白。

36．合成具有抗真菌活性，优选地抗卵菌纲活性，更优选地抗疫霉和/或抗腐霉活性的蛋白的方法，其特征在于在有利条件下培养根据权利要求29到32所述的宿主细胞并且从宿主细胞回收该蛋白。

36．合成具有抗真菌活性，优选地抗卵菌纲活性，更优选地抗疫霉和/或抗腐霉活性的蛋白的方法，其特征在于在有利条件下培养根据权利要求29到32所述的宿主细胞并且从培养基分离该蛋白。

38．根据权利要求1-12中的任意一项所述的蛋白的用途，用于抑制真菌生长，优选地抑制卵菌纲种类生长，更优选地抑制疫霉属种类和/或腐霉属种类生长。

39．一种分子量为55-56kD的植物来源的蛋白，其特征在于具有碳水化合物氧化酶活性。

40．根据权利要求39所述的蛋白，其特征在于是己糖氧化酶。

41．根据权利要求40所述的蛋白，其特征在于可从向日葵或莴苣植株获得。

42．抑制植物叶子上真菌，优选地卵菌纲，更优选地疫霉或腐霉生长的方法，其特征在于用由根据权利要求29或30所述的宿主细胞或由根据权利要求35所述的植物产生的蛋白处理植物。

43．获得对真菌，优选地卵菌纲，更优选地疫霉或腐霉的易感性降低的植物的方法，包括以下步骤：

(a)将嵌合DNA序列导入易于再生出完整植株的祖细胞，

-所述嵌合DNA序列包含能编码根据权利要求1-12中的任意一项所述的蛋白的开放阅读框架，所述开放阅读框架可操作性地与转录和翻译区域及选择性地转录终止区域连接，以使对所述真菌侵染易感的植物细胞中合成所述蛋白，并且

(b)在有利于具有所述的选择性标记的祖细胞的条件下使所述祖细胞再生为植株，并且

(c)鉴定合成根据权利要求1-7所述的蛋白的植物，由此降低所述植物对所述真菌侵染的易感性。

44．根据权利要求43所述的方法，其特征在于步骤(a)使用能将T-DNA转移入植物细胞并携带双元载体的根瘤农杆菌菌株进行，步骤(b)在存在抗生素从而有利于含有新霉素磷酸转移酶的细胞的情况下进行。

45．一种抗真菌组合物，包含根据权利要求1-12中的任意一项所述的蛋白和适当的载体。

46．能够识别根据权利要求1-12中的任意一项所述的蛋白的抗体。

47．可从编码根据权利要求1-12中的任意一项所述的蛋白的基因得到的核酸序列，在植物中具有组织特异性和/或发育特异性转录调控活性。

48．根据权利要求47所述的核酸序列，可从所述基因的翻译起始位点的上游区域得到。

49．根据权利要求48所述的核酸序列，具有所述基因翻译起始位点上游区域的至少1000个核苷酸。

50．根据权利要求47-49中的任意一项所述的核酸序列的用途，用于制备可在植物中表达的基因构建体。