CN101541970A - 包含作为转基因的a类itcp或clavata1(clv1)或cah3多肽、具有增加的种子产量的转基因植物以及用于制备该植物的方法 - Google Patents

包含作为转基因的a类itcp或clavata1(clv1)或cah3多肽、具有增加的种子产量的转基因植物以及用于制备该植物的方法 Download PDF

Info

Publication number
CN101541970A
CN101541970A CNA2007800435779A CN200780043577A CN101541970A CN 101541970 A CN101541970 A CN 101541970A CN A2007800435779 A CNA2007800435779 A CN A2007800435779A CN 200780043577 A CN200780043577 A CN 200780043577A CN 101541970 A CN101541970 A CN 101541970A
Authority
CN
China
Prior art keywords
plant
polypeptide
nucleic acid
coding
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800435779A
Other languages
English (en)
Inventor
V·弗兰卡德
A·I·桑兹莫林纳罗
Y·海茨费尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CropDesign NV
Original Assignee
CropDesign NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CropDesign NV filed Critical CropDesign NV
Publication of CN101541970A publication Critical patent/CN101541970A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明一般地涉及分子生物学领域并涉及用于增强植物中多种经济上重要的产量相关性状的方法。更具体地,本发明涉及通过在植物中增加编码产量增强多肽(YEP)的核酸序列的表达而相对于对照植物增强植物中多种经济上重要的产量相关性状的方法。YEP可以是I类TCP或CAH3或具有无功能C端结构域的Clavata1(CLV1)。本发明还涉及具有YEP编码核酸序列增加的表达的植物,其中所述植物相对于对照植物具有增强的产量相关特征。本发明还提供用于本发明方法中的构建体。

Description

包含作为转基因的A类ITCP或CLAVATA1(CLV1)或CAH3多肽、具有增加的种子产量的转基因植物以及用于制备该植物的方法
本发明一般地涉及分子生物学领域并涉及用于增强植物中多种经济上重要的产量相关性状的方法。更具体地,本发明涉及通过在植物中增加编码产量增强多肽(YEP)的核酸序列的表达而相对于对照植物增强植物中多种经济上重要的产量相关性状的方法。YEP可以是I类TCP或CAH3或具有无功能C端结构域的Clavata1(CLV1)。本发明还涉及具有YEP编码核酸序列增加的表达的植物,其中所述植物相对于对照植物具有增强的产量相关特征。本发明还提供用于本发明方法中的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关增加农业效率的研究。常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受欢迎特性的植物。然而,此类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经常含有异源性遗传组分,其可能不总是导致从亲代植物中传递的所希望性状。分子生物学进展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后导入该遗传物质至植物中。此类技术具有产生具备多种经济学、农学或园艺学改良性状的作物或植物的能力。
具有特殊经济意义的性状是增加的产量。产量通常定义为来自作物的经济价值的可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入量、胁迫耐受性和早期萌发势(earlyvigor)也可以是决定产量的重要因素。优化前述因素因而可以对增加作物产量有贡献。
增加植物种子产量的能力将在诸如农业等领域中具有许多应用,包括观赏植物的生产、树木栽培、园艺和森林业。增加产量也可以用于在生物反应器中使用的藻类生产(用于诸如药物、抗体或疫苗等物质的生物技术生产,或用于有机废物的生物转化)及其它这类领域。
取决于最终用途,对某些产量性状的改良可能优先于其它产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应用如面粉、淀粉或油生产而言,增加种子参数可能是尤其希望的。即便在种子参数当中,某些参数可以更优先于其它参数,这取决于应用。多种机制可以对增加种子产量有贡献,无论形式为增加的种子大小或是增加的种子数目。
种子产量是特别重要的性状,因为众多植物的种子对人与动物营养是重要的。作物如玉米、稻、小麦、油菜和大豆占超过一半的人类总热量摄入,无论通过直接消费种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用众多类型代谢物的来源。种子含有胚(新苗和新根的起源)和胚乳(萌发期间及幼苗早期生长期间用于胚生长的营养来源)。种子发育涉及多种基因并且需要代谢物从根、柄、叶和茎转移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成为贮藏大分子以灌满籽粒。
对于众多作物的另一个重要性状是早期萌发势。改进早期萌发势是现代稻育种计划在温带和热带稻品种上的重要目标。长根在水栽稻中对于正确土壤固定是重要的。在将稻直接播种至被淹没田地的情况下,以及在植物必须从水中迅速出苗的情况下,较长的苗与萌发势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对于良好出苗是重要的。将早期萌发势人工改造到植物内的能力将在农业中是极其重要的。例如,不良的早期萌发势已经限制了基于玉米带种质(Corn Belt germplasm)的玉蜀黍(Zea mayesL.)杂种在欧洲大西洋地区的引种。
又一个重要性状是改进的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,对于大多数主要作物植物而言降低平均产量超过50%(Wang等、Planta(2003)218:1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性和氧化胁迫引起。提高植物对非生物胁迫耐受性的能力将在世界范围对农民是极大经济优势并且会允许在不利条件期间及在作物栽培否则是不可能的陆地上栽培作物。
另一个经济上重要的特征是增加的生物量。植物生物量为饲料作物如苜蓿、青贮谷物和干草的产量。在谷物作物中使用产量的许多替代参数(proxy)。其中首要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,但是包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座植物(rosette)直径、叶长、根长、根生物量、分蘖数和叶数。许多物种在给定的发育阶段维持植物不同部分大小间的保守比。利用这些异速生长关系而对这些有关大小的测量结果进行由此及彼的外推(如Tittonell等2005Agric Ecosys&Environ 105:213)。早期发育阶段的植物大小通常将与晚期发育阶段的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二氧化碳,因此很可能在同期增重更多(Fasoula&Tollenaar 2005Maydica 50:39)。除了植物所具有的最初达到较大大小的微环境或遗传优势的潜在延续,此为其附加效应。植物大小和生长速率存在着强遗传组件(如ter Steege等2005PlantPhysiology 139:1078),且迄今为止,种种多样化基因型植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等2003Theoretical Applied Genetics 107:679)。以这种方式,使用标准环境作为田地中作物在不同时间和地点所遭遇的多样化动态环境的替代参数。
收获指数为种子产量与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和谷物产量之间通常能够获得比较稳固的相关性(如Reetzke等2002Crop Science 42:739)。这些方法固有地联系在一起,因为大多数谷物生物量取决于植物叶和茎当前或贮存的光合作用生产力(Gardener等1985Physiology of Crop Plants.Iowa State University Press,68-73页)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产量的指标(如Tittonell等2005Agric Ecosys&Environ 105:213)。当测试遗传差异对胁迫耐受性的影响时,温室或植物培养室与田地相比具有固有的优势:即能够使土壤性能、温度、水和营养的可用性以及光强度标准化。不过,因缺乏风力或昆虫导致不良授粉,或由于空间不足以让成熟根或冠层生长等等,对产量造成的这些人工局限性会限制这些控制环境在测试产量差异中的应用。因此,在培养室或温室标准条件下测量早期发育阶段的植物大小,是提供潜在遗传产量优势指标的标准方法。
增加植物中产量(种子产量和/或生物量)的一种方法可以是通过调节植物的内在生长机制如细胞周期,或参与植物生长或参与防御机制的多种信号途径。
现已发现通过调节编码产量增强多肽(YEP)的核酸在植物中表达,可以改进植物中的多种产量相关性状。其中YEP是I类TCP或CAH3或具有无功能C端结构域的Clavata1(CLV1)。
背景技术
TCP
转录因子通常定义为显示序列特异性DNA结合亲和性并且能够激活和/或抑制转录的蛋白质。拟南芥基因组编码至少1533种转录调节物,占其估计基因总数的~5.9%(Riechmann等,(2000),Science 29:2105-2109)。转录因子的TCP家族以其第一个被表征的成员命名(teosinte-branched1(TB1)、cycloidea(CYC)和PCNA因子(PCF),Cubas P等,(1999)PlantJ 18(2):215-22)。在拟南芥中,已鉴定超过20个TCP家族多肽的成员,且这些成员基于TCP结构域中的序列相似性被分类成正调节基因表达的I类(也成为I组或PCF组)转录因子、和负调节增殖的II类(也成为II组或CYC-TB1组)转录因子。所有TCP转录因子由预测的非规范性碱性螺旋-环螺旋(bHLH)表征,所述碱性螺旋-环-螺旋(bHLH)是DNA结合,以及同源或异源二聚化所需要的(见Cubas等,见上)。
一个I类TCP多肽,AtTCP20(也称为PCF1直向同源物),与细胞周期的启动子和核糖体蛋白质基因结合,如Li等,(2005)PNAS 102(36):12978-83)中报道的。国际专利申请WO0036124提供编码I类TCP多肽(命名为VBDBP)的核酸序列和相应的多肽序列。描述了包括前述VBDBP核酸序列的表达载体和转基因植物。国际专利申请WO2004031349中表征了过量表达(使用35CaMV启动子)编码I类TCP多肽(命名为G1938)的核酸序列的转基因拟南芥植物。观察到阻滞的植物生长速率和发育。
CAH3
碳酸酐酶催化可逆反应有3类碳酸酐酶(α、β和γ),其从系统发生上不相关,但在活性位点上具有一些相似性。在植物中,存在所有3类碳酸酐酶。碳酸酐酶存在于叶绿体、线粒体(大部分γ类)和胞质溶胶中,且可以占多达2%的叶中总可溶蛋白质。碳酸酐酶通过将细胞中的CO2浓度保持在合适水平,对确保有效的光合作用是重要的。已知在大气O2和CO2压力下,核酮糖二磷酸羧化酶(Rubisco)以其30%的能力工作,因此改良植物中CO2的吸收机制是有意义的。碳酸酐酶的表达与Rubisco的表达共调节,且植物通常保持恒定的碳酸酐酶与Rubisco的比例。还报道碳酸酐酶在一定条件下通过为氮吸收提供C-骨架还可以限制光呼吸。具有C3型光合作用的植物中,大部分碳酸酐酶活性定位于叶肉叶绿体的基质,同时C4植物中,在叶肉细胞的细胞质中发现大部分碳酸酐酶。
使用碳酸酐酶以增加CO2同化作用的想法已被多次阐述。WO9511979中,推测用来自单子叶植物的碳酸酐酶转化单子叶植物,二氧化碳固定的能力将被提高且将导致加速的植物生长。其他文献(例如US 6,610,913、US 6,831,217或US 20030233670)公开了用于在C3植物中模拟C4型光合作用,从而提高光合作用效率的方法。这些方法中,通过引入和表达来自C4植物的多种酶活性(如磷酸烯醇式丙酮酸羧化酶(PEPC)或丙酮酸正磷酸二激酶(pyruvate orthophosphate dikinase,PPDK))的组合,将C4类途径被引入C3植物中以增加CO2的固定;这些基因的表达受C4调节序列(通常是它们的天然启动子)的调控。尽管已预测,然而,这些尝试还未产生具有增加的产量的植物。
CLAVATA
富亮氨酸重复受体样激酶(LRR-RLK)是参与植物中两种生物学功能的多肽,即其一是生长和发育、和另一是防御反应。LRR-RLK是参与信号传导的跨膜多肽,从N端到C端具有:(i)用于ER亚细胞靶向的信号肽;(ii)感知信号的胞外受体结构域;(iii)跨膜结构域;和(iv)可以磷酸化下游靶蛋白质、被其自身(自身磷酸化)或其他激酶磷酸化、或被磷酸酶去磷酸化的胞内胞质丝氨酸/苏氨酸激酶结构域。
LRR-RLK包括植物受体样激酶(RLK)超家族中的最大的组,且一个拟南芥基因组就包含超过200个LRR-RLK基因。已基于胞外结构域的同一性和亚家族成员的激酶结构域间的系统发生关系,将该家族的成员归类到亚家族(Shiu和Bleecker(2001)Proc.Natl.Acad.Sci.美国98,10763-10768)。亚家族LRR XI包括研究最多的LRR-RLK之一,Clavata1(CLV1;Leyser等,(2002)Development 116:397-403),其参与茎、花序、和花分生组织大小的调控。
茎顶端分生组织可在整个植物生命期起始器官和二级分生组织。位于分生组织中央区的几个细胞充当多能干细胞。它们分裂缓慢,从而将子细胞向外移置到外周,在外周它们最终合并入器官原基并分化。功能性分生组织的保持需要通过分化使来自分生组织的干细胞减少和通过分裂使细胞置换之间的平衡。通过限制这些分生组织中干细胞池(pool)的大小,拟南芥属中Clavata(CLV1、CLV2、和CLV3)基因在该过程中其关键作用。
已经在拟南芥(Leyser等,见上;Clark等,(1993)Development 119:397-418;Diévart等,(2003)Plant Cell 15:1198-1211)、稻(Suzaki等,(2004)Development 131:5649-5657)、和玉米(corn,Bommert等,(2004)Development 132:1235-1245)中鉴定到Clavata1突变体。由于干细胞的异位积累,通常导致非正常叶序、花序簇生(fasciation)和额外花器官和轮生体(whorl),所有突变体都表现出所有类型(营养体、花序、花)的地上分生组织扩增。该表型严重性在不同拟南芥突变体之间不同,弱等位基因只干细胞数量方面表现出小增加,而强等位基因比野生型具有超过1000倍的干细胞(Dievart等,(2004)见上)。每朵花形成的心皮数量和异位轮生体的生长程度是clv1突变体严重性的敏感指示器(Clarke等,(1993)Development 119:397-418)。两个弱拟南芥突变体,clv6和clv7包含跨膜结构域后的损伤,失去了确实表达这些等位基因编码的多肽并将其定位于质膜的可能性(Clarke等,(1993)见上)。
ERECTA启动子(ER;用于在分生组织中广泛表达并发育器官原基)的控制下表达编码全长CLV1多肽的核酸序列的转基因拟南芥植物不具有受破坏的分生组织(Clarke等,(1993)见上)。已授权的US专利5,859,338提供了编码Clavata1蛋白质的分离的核酸序列,和编码修饰的Clavata1蛋白质的修饰的核酸序列,并描述了包括前述分离的核酸序列的表达载体、和包括前述分离的核酸序列的植物和植物细胞。
定义
多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可互换使用并且指处于任意长度聚合形式中通过肽键连接的氨基酸。
多核苷酸/核酸/核酸序列/核苷酸序列
术语″多核苷酸″、″核酸序列″、″核苷酸序列″、“核酸”、“核酸分子”在本文中可互换使用并且指处于任意长度非分支聚合形式中的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者组合。
编码序列
“编码序列”是当置于适宜的调控序列控制下转录为mRNA和/或翻译为多肽的核酸序列。编码序列的边界由5′端的翻译起始密码子和3′端的翻译终止密码子确定。编码序列可以包括但不限于mRNA、cDNA、重组核酸序列或基因组DNA,不管有或没有。
对照植物
选择合适的对照植物是实验设置的惯用部分并且可以包括对应的野生型植物或无目的基因的对应植物。对照植物一般是与待评估植物相同的植物物种或甚至是相同的变种。对照植物也可以是待评估植物的失效合子。失效合子是由于分离丢失转基因的个体。如本文中所用的“对照植物”不仅指整株植物,还指植物部分,包括种子及种子部分。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质及酶,它们相对于非修饰的上述蛋白质具有氨基酸取代、缺失和/或插入并且与所述肽、寡肽、多肽、蛋白质及酶来源的非修饰蛋白质具有相似生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基在蛋白质中预定位点内的引入。插入可以包含单个或多个氨基酸的氨基端融合和/或羧基端融合以及序列内插入。通常,在氨基酸序列内部的插入会比氨基端融合或羧基端融合更小,约1-10个残基级别。氨基端或羧基端融合蛋白或融合肽的实例包括如酵母双杂交系统中所用转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、FLAG-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
取代指以具有相似特性(如相似疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向)的其他氨基酸替换蛋白质的氨基酸。氨基酸取代一般是单个残基的,不过可以是簇集性的,这取决于置于多肽的功能性约束;插入通常会是约1-10个氨基酸残基级别。氨基酸取代优选地是保守性氨基酸取代。保守性取代表是本领域众所周知的(见例如Creighton(1984)Proteins.W.H.Freeman and Company(编著)和下表1)。
表1:保守性氨基酸取代的实例
  残基   保守性取代   残基   保守性取代
  Ala   Ser   Leu   Ile;Val
  Arg   Lys   Lys   Arg;Gln
  Asn   Gln;His   Met   Leu;Ile
  Asp   Glu   Phe   Met;Leu;Tyr
  Gln   Asn   Ser   Thr;Gly
  Cys   Ser   Thr   Ser;Val
  Glu   Asp   Trp   Tyr
  Gly   Pro   Tyr   Trp;Phe
  His   Ash;Gln   Val   Ile;Leu
  Ile   Leu,Val
氨基酸取代、缺失和/或插入可以使用本领域众所周知的肽合成技术如固相肽合成法等或通过重组DNA操作而轻易地进行。用于操作DNA序列以产生蛋白质的取代、插入或缺失变体的方法是本领域众所周知的。例如,用于在DNA中的预定位点处产生取代突变的技术是本领域技术人员众所周知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Clevelaand,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR-介导的位点定向诱变或其他位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然发生形式的蛋白质(如目的蛋白)的氨基酸序列相比,它们包含以非天然发生的氨基酸残基对氨基酸的取代或非天然发生的氨基酸残基的添加。蛋白质的“衍生物”也包含这样的肽、寡肽、多肽,其中与多肽的天然发生形式的氨基酸序列相比,它们包含天然发生的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸盐化等)氨基酸残基或非天然的改变氨基酸残基。与衍生物所来源的氨基酸序列相比,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加(例如报道分子或其他配体),如为促进检测该衍生物而结合的报道分子,和与天然发生的蛋白质的氨基酸序列相对比的非天然发生的氨基酸残基。另外,“衍生物”也包括蛋白质的天然发生形式和诸如FLAG、HIS6或硫氧还蛋白(标签肽的综述参见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)的标签肽的融合物。
直向同源物/旁系同源物
直向同源物和旁系同源物包含用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于先祖基因复制的基因,直向同源物是来自不同生物的起源于物种形成的基因,也源自相同的先祖基因。
结构域
术语”结构域″指沿进化相关蛋白质的序列比对结果而在特定位置处保守的一组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间变动,然而在特定位置处的高度保守的氨基酸指示在蛋白质的结构、稳定性或功能方面可能是必需的氨基酸。结构域因通过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定,它们可以用作鉴定物以确定任意的所讨论多肽是否属于先前已鉴定的多肽家族。
基序/共有序列/标签
术语”基序”或“共有序列”或“标签”指在进化相关蛋白质的序列中的短保守区。基序往往是结构域的高度保守部分,不过也可以仅包括结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
杂交
如本文中所定义的术语”杂交″是其中基本上同源的互补核苷酸序列相互复性的过程。杂交过程可以完全在溶液中进行,即两种互补性核酸均处于溶液中。杂交过程也可以在互补性核酸之一固定到基质如磁珠、琼脂糖(Sepharose)珠或任何其他树脂的情况下发生。杂交过程也可以在互补性核酸之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅酸玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)上的情况下进行。为使杂交发生,通常将核酸分子热变性或化学变性以使双链解链成为两条单链和/或去除来自单链核酸的发夹或其他二级结构。
术语”严格性”指在其中发生杂交的条件。杂交的严格性受条件如温度、盐浓度、离子强度和杂交缓冲液组成影响。通常,将低严格性条件选择为在确定的离子强度及pH时低于特定序列热解链温度(Tm)约30℃。中等严格性条件是此时温度低于Tm约20℃并且高严格性条件是此时温度低于Tm约10℃。高严格性杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。然而,核酸可以在序列上偏离并且因遗传密码子的简并性而依旧编码基本上相同的多肽。因而有时候可能需要中等严格性杂交条件以鉴定此类核酸分子。
Tm是在确定的离子强度及pH时的温度,在所述温度下50%的靶序列与完全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性地杂交。从低于Tm约16℃直至32℃获得最大杂交速率。一价阳离子在溶液中的存在降低了两条核酸链间的静电排斥,因而促进杂交分子形成;这种作用对于高达0.4M的钠浓度是明显的(对于更高浓度,这种效应可以忽略)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数甲酰胺降低0.6-0.7℃,并且添加50%甲酰胺允许在30-45℃进行杂交,虽然杂交速率会降低。碱基对错配降低了杂交速率及双链体的热稳定性。平均而言并且对于大的探针来说,每%碱基错配Tm下降约1℃。取决于杂交分子的类型,Tm可以使用下列等式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1-0.61x%甲酰胺
2)DNA-RNA或RNA-RNA杂交体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cbb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交体:
对于<20个核苷酸:Tm=2(ln)
对于20-35个核苷酸:Tm=22+1.46(ln)
a或对于其他一价阳离子,但是仅在0.01-0.4M范围内是精确的。
b仅对于%GC在30%-75%范围内是精确的。
cL=双链体的长度(以碱基对计)。
doligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以以众多已知技术的任何一种控制非特异性结合,例如用含蛋白质的溶液封闭薄膜、添加异源性RNA、异源性DNA及SDS至杂交缓冲液并且用RNA酶处理。对于非同源性探针,一系列杂交可以通过改变以下条件之一进行:(i)渐进地降低复性温度(例如从68℃至42℃)或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)。技术人员了解杂交期间可以加以改变和将维持或改变严格性条件的多种参数。
除杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异性杂交所致的背景,样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的离子强度及温度:盐浓度越低并且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性上或低于杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交分析法或基因扩增检测方法的合适严格性条件如上所述。也可以选择更严格或更不严格的条件。技术人员了解洗涤期间可以加以改变和将维持或改变严格性条件的多种参数。
例如,用于长度大于50个核苷酸的DNA杂交分子的常见高严格性杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交分子的中等严格性杂交条件的实例包括在55℃于4×SSC中或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交分子的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述的保守区而确定杂交分子长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包含5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平的目的,可以参考Sambrook等(2001)MolecularCloning:a laboratory manual,第三版,Cold Spring Harbor LaboratoryPress,CSH,New York或参考Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989和每年更新版本)。
剪接变体
如本文中所用的术语”剪接变体”包含其中已经切除、替换、移位或添加所选内含子和/或外显子或其中内含子已经缩短或加长的核酸序列的变体。此类变体将是其中基本上保留了蛋白质的生物学活性的一种变体;这可以通过选择性保留蛋白质的功能性片段而实现。此类剪接变体可以在自然界中找到或可以人工制造。用于预测和分离此类剪接变体的方法是本领域众所周知的(见例如Foissac和Schiex(2005),BMC Bioinformatics.6:25)。
等位变体
等位基因或等位变体是给定基因的替代形式,位于相同染色体位置内。等位变体包含单核苷酸多态性(SNP)和小插入/缺失多态性(INDEL)。INDEL的尺寸通常小于100bp。SNP和INDEL形成在大部分生物的天然发生性多态性株系中序列变体的最大集合。
基因改组/定向进化
基因改组或定向进化的组成为:反复DNA改组,随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸或其部分的变体(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
调节元件/调控序列/启动子
术语“调节元件”、“调控序列”和“启动子”均在本文中可互换使用并且在广义上意指能够实现与之连接的序列表达的调节性核酸序列。调控序列可以是启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区和/或RNA稳定化元件。
术语”启动子”一般指位于基因转录起点上游并参与识别及结合RNA聚合酶和其他蛋白质,因而指导有效连接的核酸转录的核酸调控序列。前述术语包括从典型的真核基因组基因(包括对于精确转录启动所需的TATA框,具有或没有CCAAT框序列)中衍生的转录调节序列和应答发育刺激和/或外部刺激或以组织特异性方式改变基因表达的额外调节元件(如,上游激活序列、增强子和沉默子)。本术语还包括典型的原核基因的转录调节序列,在此情况下它可以包括-35框序列和/或-10框转录调节序列。术语“调节元件”也包含赋予、激活或增强核酸分子在细胞、组织或器官中表达的合成的融合分子或衍生物。
“植物启动子”包含介导编码序列区段在植物细胞中表达的调节元件。因此,植物启动子不需要是植物来源的,而是可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用待于本发明方法中表达及在本文中描述的核酸序列所转化的植物。这也适用于其他“植物”调节性信号,如“植物”终止子。用于本发明方法中的核苷酸序列的启动子上游可以由一个或多个核苷酸取代、插入和/或缺失而受到修饰,但不干扰启动子、可读框(ORF)或3′调节区如终止子或远离ORF的其他3′调节区的功能性或活性。启动子的活性还有可能因修饰该启动子的序列或由更活跃的启动子、甚至来自异源生物的启动子彻底替换该启动子而增加。为在植物中表达,如上所述,核酸分子必须有效连接至或包含合适的启动子,其中所述的启动子在正确时间点上并以所需要的空间表达模式表达基因。
为鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可以通过将该启动子与报道基因有效连接并分析该报道基因在植物多种组织的表达水平和模式而进行分析。合适的公知报道基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如本发明方法中所用的一种启动子)的启动子强度和/或表达模式比较。备选地,启动子强度可以使用本领域已知方法如Northern印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996GenomeMethods 6:986-994),通过定量mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较而分析。通常“弱启动子”意指驱动编码序列在低水平上表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。
有效连接
如本文中所用的术语”有效连接”指启动子序列与目的基因之间功能性地连接,以至于启动子序列能够启动目的基因转录。
组成型启动子
“组成型启动子”指在生长和发育的大部分、但不必全部阶段期间和在大部分环境条件下在至少一个细胞、组织或器官内有转录活性的启动子。
下表2a给出组成型启动子的实例。
表2a:组成型启动子的实例
  基因来源   参考文献
  肌动蛋白   McElroy等,Plant Cell,2:163-171,1990
  HMGP   WO 2004/070039
  CAMV 35S   Odell等,Nature,313:810-812,1985
  CaMV 19S   Nilsson等,Physiol.Plant.100:456-462,1997
  GOS2   de Pater等,Plant J Nov;2(6):837-44,1992,WO 2004/065596
  遍在蛋白   Christensen等,Plant Mol.Biol.18:675-689,1992
  稻亲环蛋白   Buchholz等,Plant Mol Biol.25(5):837-43,1994
  玉米H3组蛋白   Lepetit等,Mol.Gen.Genet.231:276-285,1992
  苜蓿H3组蛋白   Wu等Plant Mol.Biol.11:641-649,1988
  肌动蛋白2   An等,Plant J.10(1);107-121,1996
  34S FMV   Sanger等,Plant.Mol.Biol.,14,1990:433-443
  Rubisco小亚基   US 4,962,028
  OCS   Leisner(1988)Proc Natl Acad Sci美国85(5):2553
  SAD1   Jain等,Crop Science,39(6),1999:1696
  SAD2   Jain等,Crop Science,39(6),1999:1696
  nos   Shaw等(1984)Nucleic Acids Res.12(20):7831-7846
  V-ATP酶   WO 01/14572
  超级启动子   WO 95/14098
  G盒蛋白质   WO 94/12015
遍在启动子
遍在启动子在生物基本上所有组织或细胞内有活性。
发育调节性启动子
发育调节性启动子在某个发育期期间或在经历发育变化的植物部分内有活性。
诱导性启动子
诱导性启动子在应答化学品(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有受诱导或增加的转录启动,或可以是“胁迫诱导性的”,即当植物暴露于多种胁迫条件时受到激活,或是“病原体诱导性的”,即当植物暴露于多种病原体时受到激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够优先在某些器官或组织如叶、根、种子组织等内启动转录的启动子。例如,“根特异性启动子”是在植物根中优势地具有转录活性的启动子,在植物的任何其他部分内基本上无活性,尽管在植物的这些其他部分内允许任何泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异的”。
下表2b给出根特异性启动子的实例。
表2b:根特异性启动子的实例
  基因来源   参考文献
  RCc3   Plant Mol Biol.1995年1月Jan;27(2):237-48
  拟南芥PHT1   Kovama等,2005
  苜蓿磷酸转运蛋白   Xiao等,2006
  拟南芥Pyk10   Nitz等,(2001)Plant Sci 161(2):337-346
  根表达的基因   Tingey等,EMBO J.6:1,1987.
  烟草生长素-诱导性基因   Van der Zaal等,Plant Mol.Biol.16,983,1991.
  β-微管蛋白   Oppenheimer,等,Gene 63:87,1988.
  烟草根特异性基因   Conkling,等,Plant Physiol.93:1203,1990.
  欧洲油菜G1-3b基因   美国专利第5,401,836号
  SbPRP1   Suzuki等,Plant Mol.Biol.21:109-119,1993.
  LRX1   Baumberger等,2001,Genes&Dev.15:1128
  BTG-26欧洲油菜   US 20050044585
  LeAMT1(番茄)   Lauter等,(1996,PNAS 3:8139)
  LeNRT1-1(番茄)   Lauter等,(1996,PNAS 3:8139)
  I类patatin基因(马铃薯)   Liu等,Plant Mol.Biol.153:386-395,1991.
  KDC1(胡萝卜(Daneuscarota))   Downey等,(2000,J.Biol.Chem.275:39420)
  TobRB7基因   W Song博士(1997)论文,北卡罗来纳州立大学,Raleigh,NC美国
  OsRAB5a(稻)   Wang等,2002,Plant Sci.163:273
  ALF5(拟南芥)   Diener等,(2001,Plant Cell 13:1625)
  NRT2;1Np(烟草(N.plumbaginifolia))   Quesada等,(1997,Plant Mol.Biol.34:265)
种子特异性启动子主要在种子组织中转录激活,但不必仅在种子组织中激活(渗漏表达的情况下)。种子特异性启动子可以在种子发育和/或萌发期间激活。种子特异性启动子可以是胚乳和/或糊粉和/或胚特异性的。种子特异性启动子(胚乳特异性和/或糊粉特异性和/或胚特异性)的实例示于下表2c-f。种子特异性启动子的其他实例由Qing Qu和Takaiwa(PlantBiotechnol.J.2,113-125,2004)给出,该文献的公开完整引入本文作为参考。
表2c:种子特异性启动子的实例
Figure A20078004357700271
Figure A20078004357700281
Figure A20078004357700291
表2d:胚乳特异性启动子的实例
  基因来源   参考文献
  谷蛋白(稻)   Takaiwa等,(1986)Mol Gen Genet208:15-22Takaiwa等,(1987)FEBS Letts.221:43-47
  玉米醇溶蛋白   Matzke等,(1990)Plant Mol Biol 14(3):323-32
  小麦LMW和HMW麦谷蛋白-1   Colot等,(1989)Mol Gen Genet216:81-90Anderson等,(1989)NAR 17:461-2
  小麦SPA   Albani等,(1997)Plant Cell 9:171-184
  小麦麦醇溶蛋白   Rafalski等,(1984)EMBO 3:1409-15
  大麦Itr1启动子   Diaz等,(1995)Mol Gen Genet248(5):592-8
  大麦B1,C,D,大麦醇溶蛋白   Cho等,(1999)Theor Appl Genet98:1253-62Muller等,(1993)Plant J 4:343-55Sorenson等,(1996)Mol Gen Genet250:750-60
  大麦DOF   Mena等,(1998)Plant J 116(1):53-62
  blz2   Onate 等,(1999)J Biol Chem274(14):9175-82
  合成启动子   Vicente-Carbajosa等,(1998)Plant J13:629-640
  稻谷醇溶蛋白NRP33   Wu等,(1998)Plant Cell Physiol 39(8)885-889
  稻球蛋白Glb-1   Wu等,(1998)Plant Cell Physiol 39(8)885-889
  稻球蛋白REB/OHP-1   Nakase等,(1997)Plant Molec Biol 33:513-522
  稻ADP-葡萄糖焦磷酸化酶   Russell等,(1997)Trans Res 6:157-68
  玉米ESR基因家族   Opsahl-Ferstad等,(1997)Plant J
  12:235-46
  高粱醇溶蛋白   DeRose等,(1996)Plant Mol Biol32:1029-35
表2e:胚特异性启动子的实例
  基因来源   参考文献
  稻OSH1   Sato等,Proc.Natl.Acad.Sci.美国,93:8117-8122,1996
  KNOX   Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
  PRO0151   WO 2004/070039
  PRO0175   WO 2004/070039
  PRO005   WO 2004/070039
  PRO0095   WO 2004/070039
表2f:糊粉特异性启动子的实例
 基因来源   参考文献
 α-淀粉酶(Amy32b)   Lanahan等,Plant Cell 4:203-211,1992;Skriver等,Proc Natl Acad Sci美国88:7266-7270.1991
 组织蛋白酶β-样基因   Cejudo等,Plant Mol Biol 20:849-856,1992
 大麦Ltp2   Kalla等,Plant J.6:849-60,1994
 Chi26   Leah等,Plant J.4:579-89,1994
 玉米B-Peru   Selinger等,Genetics 149;1125-38,1998
如本文中所定义的绿色组织特异性启动子是主要在绿色组织中具有转录活性的启动子,在植物的任何其他部分内基本上无活性,尽管在植物的这些其他部分内允许任何泄露表达。
可以用于实施本发明方法的绿色组织特异性启动子的实例示于下表2g。
表2g:绿色组织特异性启动子的实例
  基因   表达  参考文献
  玉米正磷酸二激酶   叶特异性  Fukavama等,2001
  玉米磷酸烯醇式丙酮酸羧化酶   叶特异性  Kausch等,2001
  稻磷酸烯醇式丙酮酸羧化酶   叶特异性  Liu等,2003
  稻Rubisco小亚基   叶特异性  Nomura等,2000
  稻β扩展蛋白EXBP9   茎特异性  WO 2004/070039
  木豆(Pigeon pea)Rubisco小亚基   叶特异性  Panguluri等,2005
  豌豆RBCS3A   叶特异性
组织特异性启动子的另一个实例是分生组织特异性启动子,其主要在分生性组织中具有转录活性,在植物的任何其他部分内基本上无活性,尽管在植物的这些其他部分内允许任何泄露表达。可以用于实施本发明方法的绿色分生组织特异性启动子的实例示于下表2h。
表2h:分生组织特异性启动子的实例
  基因来源   表达模式   参考文献
  稻OSH1   茎顶端分生组织,从球胚期到幼苗期   Sato等,(1996)Proc.Natl.Acad.Sci.美国,93:8117-8122
  稻金属硫蛋白   分生组织特异性   BAD87835.1
  WAK1&WAK2   茎和根顶端分生组织,并在生长(expanding)的叶和萼片中   Wagner&Kohorn(2001)Plant Cell 13(2):303-318
终止子
术语”终止子”包括这样的调控序列,其是在转录单位端的DNA序列,发出对初级转录物进行3’加工并多聚腺苷化以及终止转录的信号。终止子可以衍生自天然基因、来自多种其他植物基因或来自T-DNA。待添加的终止子可以来自例如胭脂碱合酶或章鱼碱合酶基因或备选地来自其他植物基因或较不优选地来自任何其他真核基因。
调节
术语”调节”就表达或基因表达而言意指这样的过程,其中表达水平与对照植物相比因所述基因的表达而改变,表达水平可增加或降低。原先未受调节的表达可以是结构RNA(rRNA、tRNA)或mRNA的任何类型表达,随后是翻译。术语“调节活性”应当意指本发明核酸序列或所编码蛋白质的表达的任何变化,这导致植物增加的产量和/或增加的生长。
表达
术语“表达”或“基因表达”意指因特定一种或多种基因或基因构建体的转录。术语“表达”或“基因表达”尤其意指一种或多种基因或基因构建体转录成结构RNA(rRNA、tRNA)或mRNA,有或没有随后mRNA翻译成蛋白质。此过程包括DNA转录、加工得到的mRNA产物。
增加的表达/超量表达
如本文中所用的术语”增加的表达”或“超量表达”意指对于原有野生型表达水平是额外的任何形式表达。
在本领域内详细记载了用于增加基因或基因产物表达的方法并且它们包括例如,由适宜启动子驱动的超量表达、使用转录增强子或翻译增强子。可以在非异源形式的多核苷酸的适宜位置(一般是上游)内引入作为启动子或增强子元件的分离核酸,以便上调编码目的多肽的核酸的表达。例如,内源性启动子可以通过突变、缺失和/或取代而在体内改变(见Kmiec,美国5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的正确方向及距离引入植物细胞,以便控制基因表达。
若需要多肽表达,通常希望在多核苷酸编码区的3’端包括多聚腺苷化区。多聚腺苷化区可以来自天然基因、来自多种其他植物基因或来自T-DNA。待添加的3’端序列可以来自例如胭脂碱合酶或章鱼碱合酶基因或备选地来自另一植物基因或更不优选来自任何其他真核基因。
内含子序列也可以添加至5′非翻译区(UTR)或部分编码性序列的编码序列上,以增加在胞浆内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。基因表达的此类内含子增强作用一般在位于转录单位5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:The Maize Handbook,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
内源基因
本文中提及的“内源”基因不仅仅指如在植物中以其天然形式(即没有任何人类干预)存在的所讨论基因,还指处于分离形式的随后(再)引入植物(转基因)的相同基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以遭遇转基因表达大幅降低和/或内源基因表达的大幅降低。分离的基因可分离自生物体,或者是人造的,例如通过化学合成。
降低的表达
本文中提及的“降低的表达”或表达的“降低或基本去除”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的降低。与对照植物相比,降低或基本去除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%,或95%、96%、97%、98%、99%或更多的降低。
为了降低或基本去除内源基因在植物中的表达,需要核酸序列的足够长度的基本上连续的核苷酸。为了开展基因沉默,这个长度可以是少至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以多至整个基因(包括5’和/或3’UTR,在部分或全长中)。基本上连续的核苷酸片段可以来自编码目的蛋白的核酸(靶基因)或来自能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸。优选地,基本上连续的核苷酸片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以递增优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是本文中所讨论用于降低或基本去除内源基因表达的多种方法所需的。
表达的这种降低或基本去除可以使用常规工具和技术完成。用于降低或基本去除内源基因表达的优选方法是在植物中引入并表达这样的遗传构建体,其中核酸(在此情况下是来自目的基因或任何核酸的一段基本上连续的核苷酸序列,其中所述的任何核酸能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物)克隆至所述的遗传构建体内作为由间隔区(非编码性DNA)隔开的(部分或完全的)反向重复序列。
在这种优选的方法中,使用核酸或其部分(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸序列,其中所述的任何核酸能够编码目的蛋白的直向同源物、旁系同源物或同源物)的反向重复序列(优选能够形成发夹结构),通过RNA介导的沉默作用而降低或基本上去除内源基因的表达。反向重复序列在包含调控序列的表达载体中克隆。非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成具有(部分或完全)自身互补结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hpRNA由植物加工成为siRNA,其被掺入RNA诱导性沉默复合物(RISC)中。RISC进一步切开mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。对于其他一般细节,见例如Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO 99/53050)。
本发明方法的实施不依赖在植物中引入并表达其中克隆入核酸作为反向重复序列的遗传构建体,而是几种公知“基因沉默”方法的任何一种或多种可以用来实现相同的效果。
一种用于降低内源基因表达的此类方法是RNA介导的基因表达沉默(下调)。沉默作用在这种情况下由基本上与内源性靶基因相似的双链RNA序列(dsRNA)在植物中触发。这种dsRNA被植物进一步加工成约20到约26个核苷酸,称作短干扰性RNA(siRNA)。siRNA被掺入RNA诱导性沉默复合物(RISC)内,其中所述的RISC进一步切割内源性靶基因的mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。优选地,双链RNA序列对应于靶基因。
RNA沉默方法的另一个实例包括以有义方向引入核酸序列或其部分(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸,其中所述的任何核酸能够编码目的蛋白的直向同源物、旁系同源物或同源物)至植物内。“有义方向”指与其mRNA转录物同源的DNA序列。因而将向植物中引入该核酸序列的至少一个拷贝。这种额外的核酸序列会降低内源基因表达,产生已知为共抑制作用的现象。当核酸序列的几个额外拷贝引入植物时,基因表达的降低将更明显,因为高转录物水平与共抑制作用的触发之间存在正相关。
RNA沉默方法的另一个实例包括使用反义核酸序列。″反义″核酸序列包含与编码蛋白质的″有义″核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列互补的核苷酸序列。反义核酸序列优选地与待沉默的内源基因互补。互补性可以位于基因的“编码区”和/或”非编码区”内。术语”编码区″指包含被翻译成氨基酸残基的密码子的核苷酸序列区。术语”非编码区″指分布在编码区两侧的被转录但不翻译成氨基酸的5’和3’序列(也称作5′和3′非翻译区)。
反义核酸序列可以根据Watson和Crick碱基配对规则设计。反义核酸序列可以与整个核酸序列互补(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸,其中所述的任何核酸能够编码目的蛋白的直向同源物、旁系同源物或同源物),不过也可以是仅与核酸序列的一部分(包括mRNA 5’和3’UTR)反义的寡核苷酸。例如,反义寡核苷酸序列可以与围绕编码多肽的mRNA转录物的翻译起点周围的区域互补。合适的反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或更少的核苷酸开始。本发明的反义核酸序列可以利用本领域已知方法,使用化学合成和酶连接反应而构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然发生的核苷酸或多种修饰的核苷酸化学地合成,其中所述修饰的核苷酸被设计旨在增加分子的生物学稳定性或增加反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的实例是本领域众所周知的。已知的核苷酸修饰包括甲基化、环化和′加帽′及用类似物(如肌苷)取代一个或多个天然发生的核苷酸。其他的核苷酸修饰是本领域众所周知的。
这种反义核酸序列可以使用其中核酸序列已经以反义方向加以亚克隆(即从插入的核酸中转录的RNA将与目的靶核酸呈反义方向)的表达载体以生物学方式产生。优选地,反义核酸序列在植物中的产生借助稳定整合的核酸构建体进行,其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。
用于本发明方法中沉默作用的核酸分子(无论向植物中引入或在原位产生)与编码多肽的mRNA转录物和/或基因组DNA杂交或结合,以便例如通过抑制转录和/或翻译而抑制蛋白质表达。杂交可以通过形成稳定双链体的常规核苷酸互补性所致,或在结合于DNA双链体的反义核酸序列的情况下,因双螺旋大沟内特异性相互作用所致。反义核酸序列可以通过转化或在特定组织部位直接注射而引入植物。备选地,反义核酸序列可以为了靶向所选择的细胞而受到修饰并且随后系统性施用。例如,对于系统性施用,反义核酸序列可以被修饰以便它们特异结合表达在所选择的细胞表面上的受体或抗原,例如通过连接反义核酸序列至与细胞表面受体或抗原结合的肽或抗体。反义核酸序列也可以使用本文中所述的载体送递至细胞内。
根据另一个方面,反义核酸序列是α-异头核酸序列。α异头核酸序列与互补性RNA形成特定双链杂交分子,其中与惯常b-单元相反,所述链相互平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可以包含2′-o-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
内源基因表达的降低或基本去除也可以使用核酶而进行。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸序列,如mRNA。因此,核酶(例如锤头核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可以用来催化性地切割编码多肽的mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列具特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。备选地,对应于核酸序列的mRNA转录物可以用来从RNA分子库中选出具有特异性核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其他人描述的策略而实现。
当在内源基因上存在突变和/或在随后引入植物的分离的基因/核酸上存在突变时,基因沉默也可以发生。降低或基本去除可以由无功能的多肽引起。例如,多肽可以与多种相互作用性蛋白质结合;一个或多个突变和/或截短因而可以提供仍能够结合相互作用性蛋白质(如受体蛋白质)但不能表现其正常功能的多肽(如起信号作用的配体)。
另一种基因沉默的方法是靶定与基因调节区(例如启动子和/或增强子)互补的核酸序列以形成阻止基因在靶细胞中转录的三螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992和Maher,L.J.Bioassays 14,807-15,1992。
其他方法,如使用针对内源性多肽的抗体以抑制此多肽在植物中的功能,或干扰所述多肽参与的信号途径,对于技术人员将是众所周知的。尤其,可以构思的是人造分子可以用于抑制靶多肽的生物学功能,或用于干扰靶多肽参与其中的信号途径。
备选地,可以建立筛选程序以鉴定在植物群体中基因的天然变体,其中所述的变体编码具有降低活性的多肽。此类天然变体也可以用于例如进行同源重组。
人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常19-24个核苷酸长度的单链小RNA。它们的主要功能是调节基因表达和/或mRNA翻译。大多数的植物微RNA(miRNA)与其靶序列具有完全的或接近完全的互补性。然而,存在具有多达5个错配的天然靶标。它们由切酶家族的双链特异性RNA酶从具有特征性折回结构的较长的非编码性RNA中加工而来。在加工时,它们通过与RNA诱导性沉默复合物(RISC)的主要成分Argonaute蛋白质结合而掺入该复合体。MiRNA充当RISC的特异性成分,因此它们与细胞质中的靶核酸(大多是mRNA)碱基配对。后续的调节事件包括靶mRNA切割和破坏和/或翻译抑制。miRNA超量表达的作用因此在靶基因降低的mRNA水平上得到反映。
通常21个核苷酸长度的人工微RNA(amiRNAs)可以遗传改造以特异性地负调节单个或多个目的基因的基因表达。植物微RNA靶的选择的决定因素是本领域众所周知的。用于靶识别的经验参数已经确定并且可以用来辅助设计特定的amiRNA,(Schwab等,Dev.Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,Plant Cell 18,1121-1133,2006)。
为最佳性能,用于降低内源基因在植物中表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,将来自任何给定植物物种的核酸序列引入同一个物种内。例如,将来自稻的核酸序列转化至稻植物。然而,并非绝对要求待引入的核酸序列起源于与该核酸序列将要引入的植物相同的植物物种。只要内源性靶基因与待引入的核酸之间存在相当大的同源性就足够了。
上文描述的是用于降低或基本去除内源基因在植物中表达的多种方法的实例。本领域技术人员会轻易地能够调整前述用于沉默的方法以至于例如通过利用合适启动子而实现降低内源基因在整株植物或在其部分中的表达。
选择生标记(基因)/报道基因
″选择性标记″、″选择性标记基因″或“报道基因”包括向细胞赋予表型的任何基因,其中在所述的细胞内表达所述基因以促进鉴定和/或选择用本发明的核酸构建体所转染或转化的细胞。这些标记基因能够通过一系列不同原理鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素耐药性或除草剂抗性、引入新代谢性状或允许目视选择的标记。选择性标记基因的实例包括赋予抗生素耐药性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟素的抗性的基因)、赋予除草剂抗性的基因(例如提供Basta抗性的bar;提供草甘膦抗性的aroA或gox或赋予对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA或利用木糖的木糖异构酶或抗营养标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择性标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择性标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择性标记的细胞存活而其他细胞死亡)。
因为一旦已经成功引入了核酸,则转基因宿主细胞中不再需要或不希望有标记基因,尤其抗生素耐药性基因和除草剂抗性基因,因此用于引入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其他更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。另一个有利的方法依赖于重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则通过重组酶表达已经成功发生转化时,标记基因被去除。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
转基因的/转基因/重组
为本发明目的,″转基因的″、”转基因”或″重组″就核酸序列而言意指包含此核酸序列的表达盒、基因构建体或载体或用本发明的核酸序列、表达盒或载体转化的生物,这些构建均通过重组方法产生,其中
(a)编码用于本发明方法中的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的遗传调控序列,例如启动子,或
(c)a)和b)。
不处于其天然遗传环境中或已经通过遗传操作方法修饰,修饰有可能采用例如取代、添加、缺失、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指来源植物中的天然基因组基因座或染色体基因座或在基因组文库中存在。在基因组文库的情况下,核酸序列的天然遗传环境优选地得到保留,至少部分地得以保留。该环境分布在核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp的序列长度。天然发生的表达盒-例如核酸序列的天然启动子与编码本发明方法中所用多肽的对应核酸序列的天然发生的组合,如上文所定义-在这种表达盒通过非天然的合成(“人工”)方法(如诱变处理)而受到修饰时,变成转基因表达盒。合适方法例如在US 5,565,350或WO00/15815中描述。
为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的核酸不位于所述植物基因组中该核酸的天然基因座内,所述核酸有可能同源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸或在本发明方法中所用核酸处于植物基因组中该核酸的天然位置内,然而其序列相对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到修饰。转基因优选地理解为意指本发明核酸在基因组中的非天然基因座内表达,即发生核酸的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
转化
如本文中所提及的术语“引入”或“转化”包括外源性多核苷酸转移至宿主细胞内,无论用于转化的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚胎发生)的植物组织可以用本发明的遗传构建体转化并且可以从中再生整株植物。选择的具体组织将取决于可用于并且最适于正进行转化的具体物种的克隆性增殖系统。示例性组织靶包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地引入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,多核苷酸可以整合至宿主基因组内。产生的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转化植物。
外来基因转化至植物基因组内称作转化。植物物种的转化现在是相当常规的技术。有利地,几种转化方法中的任一方法可以用来将目的基因引入合适的祖先细胞。用于从植物组织或植物细胞中转化并再生出植物所述的方法可以用于瞬时转化或用于稳定转化。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature296,72-74;Negrutiu I等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的微量注射法(Crossway A等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA涂布的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。转基因植物,包括转基因作物植物,优选地通过农杆菌介导的转化法产生。有利的转化方法是在植物中(in planta)的转化法。为此目的,例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植物的分生组织。根据本发明已经证明使转化的农杆菌混悬液作用于完整植物或至少作用于花原基是特别有利的。植物随后继续培育直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导的稻转化的方法包括用于稻转化的公知方法,如在任一以下文献中描述的那些方法:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容在本文中引入作为参考,如同完全给出那样。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol 14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容在本文中如充分所述那样引入作为参考。所述方法通过举例方式进一步由B.Jenes等,Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,Academic Press(1993)128-143及在Potrykus Annu.Rev.PlantPhysiol.Plant Molec.Biol.42(1991)205-225)中描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。由这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物,如拟南芥(拟南芥属于本发明的范围,不视为作物植物)或作物植物,例如烟草植物,通过在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随后将它们在合适的培养基内培育。植物通过根癌农杆菌的转化例如由
Figure A20078004357700441
和Wilmitzer在Nucl.Acid Res.(1988)16,9877中描述或尤其从F.F.White,Vectors for Gene Transfer in Higher Plants;在Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress,1993,第15-38页中获知。
除了转化体细胞(其随后必须再生成完整植物)之外,还有可能转化植物分生组织的细胞及特别转化发育成配子的那些细胞。在这种情况下,转化的配子遵循天然的植物发育过程,产生转基因植物。因此,例如拟南芥种子用农杆菌处理并且从发育植物中获得种子,其中一定比例的所述植物受到转化并且因此是转基因的[Feldman,KA和Marks MD(1987)Mol GenGenet 208:274-289;Feldmann K(1992)。在:编者C Koncz,N-H Chua和J Shell,Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。替代性方法基于反复去掉花序并使莲座叶丛中心中的切除部位与转化的农杆菌温育,因而转化的种子同样可以在较晚的时间点获得(Chang(1994)Plant J.5:551-558;Katavic(1994)Mol Gen Genet,245:363-370)。然而,尤其有效的方法是改良的真空渗入法,如“花浸染”法。在拟南芥真空渗入法的情况下,完整植物在减压下用农杆菌混悬液处理[Bechthold,N(1993)。C R Acad Sci Paris Life Sci,316:1194-1199],而在“花浸染法”的情况下,正在发育的花组织与表面活性剂处理的农杆菌混悬液短暂温育[Clough,SJ和Bent,AF(1998)The Plant J.16,735-743]。在两种情况下收获了一定比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育而与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母体方式遗传,降低或消除了转基因经花粉流动风险。叶绿体基因组的转化一般通过已在Klaus等,2004[Nature Biotechnology 22(2),225-229]中示例性加以展示的方法实现。简而言之,待转化的序列连同选择性标记基因一起克隆至与叶绿体基因组同源的侧翼序列之间。这些同源的侧翼序列指导位点特异性整合至原质体系内。已经对众多不同植物物种描述了质体转化并且综述可以出自Bock(2001)在基础研究和植物生物技术中的转基因质体(Transgenicplastids in basic research and plant biotechnology).J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progress towards commercialization of plastid transformationtechnology).Trends Biotechnol.21,20-28。进一步生物技术进展最近已经以无标记质体转化体的形式作了报道,所述无标记质体转化体可以通过瞬时共整合的标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
T-DNA激活标注
T-DNA激活标注(Hayashi等,Science(1992)1350-1353)涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子(也可以是翻译增强子或内含子)),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的改良表达。因靠近所引入启动子的基因的改良表达,产生的转基因植物表现显性表型。
TILLING
术语“TILLING”是“基因组内定向诱导的局部损伤”的缩写且意指用于产生和/或鉴定核酸诱变技术,其中所述的核酸编码具有修饰表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以显示在强度方面或在位置方面或在时间方面改良的表达(例如若突变影响启动子)。这些突变变体可以显示比由处于其天然形式的基因所显出活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。一般在TILLING中遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)在Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编著,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编著,Arabidopsis.ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods on Molecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)PCR扩增目的区;(d)变性和复性以允许形成异源双链体;(e)DHPLC,其中将异源双链体是否在汇集物中的存在检测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)对突变PCR产物测序。用于TILLING的方法是本领域众所周知的(McCallum等,(2000)Nat Biotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet5(2):145-50)。
同源重组
同源重组允许选择的核酸于确定的选择位置上引入基因组中。同源重组是在生物科学中常规地用于低等生物如酵母或苔藓剑叶藓(Physcomitrella)的标准技术。用于在植物中开展同源重组的方法已经不仅对模式植物(Offringa等(1990)EMBO J 9(10):3077-84)而且对作物植物例如稻(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)进行了描述,且无论目标组织通常存在可应用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量
术语”产量”通常意指经济价值的可测量结果,一般与指定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接对产量有贡献,或实际产量是对于某作物和一年的每平方米产量,这通过总产量(包括收获的和评估的产量)除以种植的平方米数而确定。术语植物的“产量”涉及该植物的营养生物量(根和/或苗生物量)、生殖器官和/或繁殖体(例如种子)。
早期萌发势
“早期萌发势”指尤其在植物生长早期期间活跃、健康、良好平衡的生长,且可以因植物适应性增加而产生,其原因在于例如植物更好地适应其环境(即优化能源的使用和苗与根之间的分配)。具有早期萌发势的植物也显示增加的幼苗存活和更好的作物建立,这往往导致高度均匀的田块(作物整齐地生长,即大多数植物在基本上相同的时间上达到发育的各阶段)和往往更好及更高的产量。因而,早期萌发势可以通过多种因子如千粒重、萌发百分数、出苗百分数、幼苗生长、幼苗高度、根长度、根及苗生物量和众多其他因素而确定。
增加/改善/增强
术语“增加”,”改善”或“增强”是可互换的并且应当在本申请含义上指与如本文中定义的对照植物相比至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。
种子产量
增加的种子产量本身可以表现为下列一种或多种指标:a)种子生物量(种子总重量)增加,这可以基于单粒种子和/或每株植物和/或每平方米;b)每株植物增加的花数;c)增加的(饱满)种子数;d)增加的种子饱满率(其表述为饱满种子数与种子总数之间的比率);e)增加的收获指数,其表述为可收获部分(如种子)产量与总生物量的比率;和f)增加的千粒重(TKW),这从计数的饱满种子数及其总重量外推而来。增加的TKW可以因增加的种子大小和/或种子重量所致,并且也可以因胚和/或胚乳尺寸的增加所致。
种子产量的增加也可以表现为种子大小和/或种子体积的增加。此外,种子产量的增加本身也可以自我表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以产生改良的结构,或可以因改良的结构而出现。
绿度指数
文中所用的“绿度指数”计算自植物的数字图像。对于属于图像上对应的植物目标的每一像素,计算绿度值与红度值的比值(在编码颜色的RGB模式中)。绿度指数表示为绿与红的比值超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下以及在可获得营养物减少的生长条件下,植物的绿度指数在开花前的末次取像时测量。与之相反,在干旱胁迫生长条件下,植物的绿度指数在干旱前的初次取像时测量。
植物
如本文中所用的术语”植物”包含整株植物、植物的祖先及后代和植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花和组织及器官,其中每种所提及对象包含目的基因/核酸。术语”植物”也包含植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种提及的对象包含目的基因/核酸。
特别用于本发明方法中的植物包括属于植物界(Viridiplantae)超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木:槭树属物种(Accr spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agavesisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostisstolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthns spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Ayena spp.)(例如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avena hybrida)、阳桃(Averrhoa carambola)、箣竹属(Bambusa sp.)、冬瓜(Benincasahispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapassp.)[卡诺拉油菜、油菜(oilseed rape)、蔓青(turnip rape)])、Cadabafarinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabissativa)、辣椒属物种(Capsicum spp.)、Carex elata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceibapentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑橘属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Colaspp.)、黄麻属(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属(Cynara spp.物种)、胡萝卜(Daucus carota)、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyrosspp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeisguineensis)、美洲油棕Elaeis(oleifera))、穇子(Eleusine coracana)、蔗茅属(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属(Eucalyptus sp.)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、水青冈属物种(Fagusspp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属(Glycine spp.)(例如大豆、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属(Helianthus spp.)(例如向日葵(Helianthusannuus))、长管萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeum vulgare))、甘薯(Ipomoeabatatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzula sylvatica、番茄属(Lycopersicon spp.)(例如番茄(Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammeaamericana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntiaspp.)、鸟足豆属物种(Ornithopus spp.)、稻属(Oryza spp.)(例如稻、阔叶稻(Oryza latifolia))、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Persea spp.)、芹菜(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleumpratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populusspp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium sPP.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheumrhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salixsp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番茄(Solanumlycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifoliumspp.)、Triticosecale rimpaui、小麦属(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticumturgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolumminus)、金莲花(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野碗豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍、Zizania palustris、枣属物种(Ziziphus spp.)等等。
发明详述
I类TCP
现已惊奇地发现增加编码YEP的核酸序列在植物中的表达产生了相对于对照植物具有增加的种子产量的植物,所述YEP是I类TCP多肽。下文详述适于增加植物种子产量的特定类别的I类TCP多肽。
本发明提供相对于对照植物增加植物种子产量的方法,其包括增加编码I类TCP多肽的核酸序列在植物中的表达。
在该实施方案的上下文中,“用于本发明方法的多肽”的任何引用意指如本文定义的I类TCP多肽。在此之后“用于本发明方法的核酸序列”的任何引用意指能够编码此类I类TCP多肽的核酸序列。
术语“多肽”和“蛋白质”在本文中可互换使用并且指任意长度的聚合形式的氨基酸。这些术语也在本文“定义”部分定义。术语″多核苷酸″、″核酸序列″、″核苷酸序列″也在本文“定义”部分定义。
通过实施本发明方法获得的种子产量的增加为相对于对照植物的增加。术语“对照植物”在本文“定义”部分定义。
用于增加编码I类TCP多肽的核酸序列的表达的优选方法是通过在植物中引入和表达如下文定义的用于本发明方法的编码I类TCP多肽的核酸序列。
待引入植物(并且因而用于实施本发明方法)的核酸序列是编码I类TCP多肽的任意核酸序列,下文又称作“I类TCP核酸序列”或“I类TCP基因”。如本文定义“I类TCP多肽”指此类多肽,所述多肽从N端到C端包含:(i)按照递增的优选顺序,与SEQ ID NO:66所示的保守TCP结构域(包括碱性螺旋-环-螺旋(bHLH))具有至少65%、70%、75%、80%、85%、90%、95%或98%或更高序列同一性;和(ii)SEQ ID NO:65所示的C端共有基序1(consensus C-terminal motif 1)。
如实施例2、3、4和5中所示确定保守TCP结构域(包括碱性螺旋-环-螺旋(bHLH))的存在。实施例3中(表B1)示出了SEQ ID NO:66与用于实施本发明方法的I类TCP多肽的保守TCP结构域的百分比氨基酸同一性的计算。
在SEQ ID NO:65所示的C端共有基序1内,在任意位点具有一个或多个保守改变、和/或在任意位点具有一个、两个或三个非保守改变。如实施例2中所示确定该基序的存在。本文中“C端”意指包括羟基(C)端的多肽序列的一半(另一半包括氨基(N)端)。本文中“C端共有基序1”意指包含多肽序列的C端部分的共有基序1。
此外,I类TCP多肽可以在多肽的保守C端基序1和C末端之间包括HQ富含区(H为组氨酸,Q为谷氨酰胺)。所述HQ富含区包括至少4个,优选5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个仅H残基、或者仅Q残基、或者H和Q残基的组合(以任意比例)。如实施例2和4所述确定该基序的存在。本文所指的多肽的“C末端”意指多肽序列的最后一个氨基酸残基。
备选地或此外,本文定义的“I类TCP多肽”指这样的任意多肽序列,当其用于构建TCP系统树(例如图1所示的)时,聚簇于包含SEQ ID NO:2(图1中圆圈圈出的)所示的多肽序列的TCP多肽分化支,而不是聚簇于任何其他TCP分化支。
本领域技术人员可容易地利用制作此类系统树的已知技术和软件,例如GCG、EBI或CLUSTAL软件包,利用默认参数来确定任何所研究的多肽序列是否落入“I类TCP多肽”的定义中。聚簇于包含SEQ ID NO:2(图1中圆圈圈出的)的分化支的任何序列将被认为落入上述I类TCP多肽的定义并适用于本发明的方法中。
用于本发明方法的多肽和编码其的核酸序列的实例在下文实施例1的表A中给出。
还用于本发明方法的是实施例1的表A中给出的任一多肽序列的同源物,术语“同源物”如本文“定义”部分所定义的。
还用于本发明方法的是实施例1的表A中给出的任一多肽的衍生物,术语“衍生物”如本文“定义”部分所定义的。
本发明通过用由SEQ ID NO:1所示的编码多肽序列SEQ ID NO:2的拟南芥核酸序列转化的植物加以说明,然而,本发明的实施不限于这些序列。本发明方法可以有利地使用编码如文中所定义的用于本发明方法的I类TCP多肽的任何核酸序列进行,所述I类TCP多肽包括直向同源物和旁系同源物,例如实施例1的表A中给出的任何核酸序列。
可以认为实施例1的表A中给出的多肽序列是由SEQ ID NO:2所示的I类TCP多肽的直向同源物和旁系同源物。术语“直向同源物”和“旁系同源物”如本文定义。
直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。其一般包括第一BLAST,所述第一BLAST参与提交查询序列(例如使用实施例1的表A中列出的任何序列)用于针对任一序列数据库(如公众可用的NCBI数据库)的BLAST搜索。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(使用标准默认值),并且当从多肽序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:1或SEQ ID NO:2的情况下,第二BLAST因而将针对拟南芥序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地以最高命中的查询序列中产生,则鉴定到旁系同源物;若第一BLAST的中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
实施例1的表A给出由SEQ ID NO:2所示的I类TCP多肽的直向同源物和旁系同源物的实例。使用上述BLAST过程可以容易地鉴定到其他直向同源物和旁系同源物。本发明方法可以有利地使用编码任一I类TCP多肽的任何核酸序列或任意上述SEQ ID NO的直向同源物和旁系同源物进行,所述I类TCP多肽如表A中给出。
通过保守TCP结构域(包括碱性螺旋-环-螺旋(bHLH))的存在可鉴定到本发明的多肽(图3A所示)。术语“结构域”如本文“定义”部分定义。
术语“基序”、或“共有序列”、或“标记”本文“定义”部分定义。
也存在用于鉴定结构域的专业数据库,如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic AcidsRes 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,引5-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research30(1):276-280(2002))鉴定。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(在Swiss Institute of Bioinformatics上驻留(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res.31:3784-3788(2003))。
也使用本领域熟知的常规技术可以容易地鉴定结构域,例如通过序列比对鉴定。用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列(覆盖整个序列的)的全局比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物、直向同源物和旁系同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.2003Jul 10;4:29.MatGAT:使用蛋白质或DNA序列而产生相似性/同一性矩阵的应用)。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构域(如保守TCP结构域或上面定义的基序之一)。在下面实施例3中以百分比描述的序列同一性值使用上述程序,利用默认参数,针对完整核酸或多肽酸序列(表B)/或针对选择的结构域或保守基序(表B1)上确定。
此外,富含特定氨基酸区(如HQ区)的存在可以使用计算机算法或简单地通过目测鉴定。对前者,决定多肽区是否富含特定氨基酸的一级氨基酸组成(以%表示)可以利用来自ExPASy服务器的软件程序,特别是ProtParam工具进行计算(Gasteiger E等(2003)ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res 31:3784-3788)。然后可以将目的多肽的组成与Swiss-Prot蛋白质序列数据库中的平均氨基酸组成(以%表示)进行比较。例如在该数据库内,平均组氨酸含量为2.27%,平均谷氨酰胺含量为3.93%。如果该特定氨基酸在该结构域中的含量高于Swiss-Prot蛋白质序列数据库的平均氨基酸组成(以%表示),则多肽区富含特定氨基酸。因此HQ富含区具有高于2.27%的H含量,和/或高于3.93%的G含量。对后者,表A的I类TCP多肽的多序列比对的目测显示HQ富含区(H为组氨酸,Q为谷氨酰胺)在多肽的保守C端基序1和C末端之间。所述HQ富含区包括至少4个,优选5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个仅H残基、或者仅Q残基、或者H和Q残基的组合(以任意比例)。如实施例2和4确定该基序的存在。
此外,I类TCP多肽(至少以其天然形式的)一般具有DNA活性。实施例6中提供了对该特定DNA结合活性测试的进一步详述。
用于本发明方法的编码I类TCP多肽的核酸序列不需要是全长核酸序列,因为本发明方法的实施不依赖全长核酸序列的使用。适合用于实施本发明方法的核酸序列实例包括实施例1的表A中给出的核酸序列,但不限于这些序列。核酸变体可用于实施本发明的方法。这样的核酸变体实例包括I类TCP多肽的编码核酸序列的部分、与I类TCP多肽的编码核酸序列杂交的核酸序列、I类TCP多肽的编码核酸序列的剪接变体、I类TCP多肽的编码核酸序列的等位变体、通过基因改组获得的I类TCP多肽的编码核酸序列的变体、或通过位点定向诱变获得的I类TCP多肽的编码核酸序列的变体。现将描述并也在本文“定义”部分定义术语部分、杂交序列、剪接变体、等位变体、通过基因改组获得的变体、和通过位点定向诱变获得的变体。
本发明提供增加植物种子产量的方法,其包括在植物中引入和表达实施例1的表A中给出的任一核酸序列的部分、或实施例1的表A中给出的任意多肽序列的直向同源物、旁系同源物或同源物的编码核酸序列的部分。
用于本发明方法的部分编码多肽,所述多肽落入如本文定义的I类TCP多肽的编码核酸序列的定义内且与实施例1的表A中给出的多肽序列具有基本上相同的生物学活性。优选地,部分是实施例1的表A中给出的任一核酸序列的部分。部分通常长度至少为600个连续核苷酸,优选长度至少为700个连续核苷酸,更优选长度至少为800个连续核苷酸,最优选长度至少为900个连续核苷酸,所述连续核苷酸是实施例1的表A中给出的任一核酸序列。优选地,部分编码I类TCP多肽序列,所述I类TCP多肽序列从N端到C端包含:(i)按照递增的优选顺序,与SEQ IDNO:66所示的保守TCP结构域(包括碱性螺旋-环-螺旋(bHLH))具有至少65%、70%、75%、80%、85%、90%、95%或98%或更高序列同一性;和(ii)SEQ ID NO:65所示的C端共有基序1。备选地或此外,部分编码多肽序列,所述多肽序列当其用于构建TCP系统树(例如图1所示的)时,趋向聚簇于包含SEQ ID NO:2(图1中圆圈圈出的)所示多肽序列的TCP多肽的分化支,而不是聚簇于任何其他TCP分化支。最优选,部分是SEQ ID NO:1的核酸序列的部分。
如本文所定义的I类TCP多肽的编码核酸序列的部分可以通过对核酸序列进行一个或多个缺失来制备。部分可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便,例如,产生组合了若干活性的多肽。当与其他编码序列融合时,经翻译后所产生的多肽可能比预测的I类TCP多肽部分要大。
用于本发明方法的另一核酸变体是在降低的严格条件下、优选在严格条件下,能够与本文所定义的I类TCP多肽的编码核酸序列或与本文所定义的部分杂交的核酸序列。
本发明提供增加植物种子产量的方法,其包括在植物中引入和表达核酸序列,所述核酸序列在降低的严格条件下、优选在严格条件下能与实施例1的表A中给出的核酸序列中任一个杂交、或与实施例1的表A中给出的任意多肽序列的直向同源物、旁系同源物或同源物的编码核酸序列杂交。
用于本发明方法的杂交序列编码多肽,所述多肽具有保守TCP结构域(见图2的比对),且与实施例1的表A中给出的任意多肽序列所表示的I类TCP多肽具有基本上相同的生物学活性。杂交序列通常长度至少为600个连续核苷酸,优选长度至少为700个连续核苷酸,更优选长度至少为800个连续核苷酸,最优选长度至少为900个连续核苷酸,所述连续核苷酸是实施例1的表A中给出的任一核酸序列。优选地,杂交序列是能够与实施例1的表A中给出的任意核酸序列杂交的序列、或与任意这些序列的部分杂交的序列,部分如上文定义。还优选,杂交序列编码I类TCP多肽序列,所述I类TCP多肽序列从N端到C端包含:(i)按照递增的优选顺序,与SEQ ID NO:66所示的保守TCP结构域(包括碱性螺旋-环-螺旋(bHLH))具有至少65%、70%、75%、80%、85%、90%、95%或98%或更高序列同一性;和(ii)SEQ ID NO:65所示的C端共有基序1。备选地或此外,杂交序列编码多肽序列,当所述多肽序列用于构建TCP系统树(例如图1所示的)时,趋向聚簇于包含SEQ ID NO:2(图1中圆圈圈出的)所示多肽序列的TCP多肽的分化支,而不是聚簇于任何其他TCP分化支。最优选,杂交序列能够与SEQ ID NO:1所示的核酸序列或其部分杂交。
术语“杂交”如本文定义。
用于本发明方法的另一核酸变体是编码本文如上定义的I类TCP多肽的剪接变体。术语“剪接变体”如本文“定义”部分定义。
本发明提供增加植物种子产量的方法,其包括在植物中引入和表达实施例1的表A中给出的核酸序列中任一个的剪接变体、或实施例1的表A中给出的任意多肽序列的直向同源物、旁系同源物或同源物的编码核酸序列的剪接变体。
优选地,剪接变体编码的I类TCP多肽从N端到C端包含:(i)按照递增的优选顺序,与SEQ ID NO:66所示的保守TCP结构域(包括碱性螺旋-环-螺旋(bHLH))具有至少65%、70%、75%、80%、85%、90%、95%或98%或更高序列同一性;和(ii)SEQ ID NO:65所示的C端共有基序1。备选地或此外,当剪接变体编码的I类TCP多肽编码多肽序列用于构建TCP系统树(例如图1所示的)时,趋向聚簇于包含SEQ ID NO:2(图1中圆圈圈出的)所示多肽序列的TCP多肽的分化支,而不是聚簇于任何其他TCP分化支。最优选,剪接变体是由SEQ ID NO:1所示的核酸序列的剪接变体或SEQ ID NO:2的直向同源物或旁系同源物的编码核酸序列的剪接变体。
用于实施本发明方法的另一核酸变体是本文如上所定义的I类TCP多肽的编码核酸序列的等位变体。术语“等位变体”如本文“定义”部分定义。用于本发明方法的等位变体与SEQ ID NO:2的I类TCP多肽具有基本上相同的生物学活性。
本发明提供增加植物种子产量的方法,其包括在植物中引入和表达实施例1的表A中给出的核酸序列中任一个的等位变体,或包括在植物中引入和表达实施例1的表A中给出的任意多肽序列的直向同源物、旁系同源物或同源物的编码核酸的等位变体。
优选地,等位变体编码的I类TCP多肽从N端到C端包含:(i)按照递增的优选顺序,与SEQ ID NO:66所示的保守TCP结构域(包括碱性螺旋-环-螺旋(bHLH))具有至少65%、70%、75%、80%、85%、90%、95%或98%或更高序列同一性;和(ii)SEQ ID NO:65所示的C端共有基序1。备选地或此外,当剪接变体编码的多肽序列用于构建TCP系统树(例如图1所示的)时,趋向聚簇于包含SEQ ID NO:2(图2中圆圈圈出的)所示多肽序列的TCP多肽的分化支,而不是聚簇于任何其他TCP分化支。最优选,等位变体是SEQ ID NO:1的等位变体或SEQ ID NO:2的直向同源物或旁系同源物的编码核酸序列的等位变体。
用于本发明方法的又一核酸变体是通过基因改组获得的核酸变体。基因改组或定向进化在本文“定义”部分定义。
本发明提供增加植物种子产量的方法,其包括在植物中引入和表达实施例1的表A中给出的核酸序列中任一个的变体,或包括在植物中引入和表达实施例1的表A中给出的任意多肽序列的直向同源物、旁系同源物或同源物的编码核酸序列的变体,所述变体核酸序列通过基因改组获得。
优选地,通过基因改组获得的变体核酸序列编码多肽序列,所述多肽序列从N端到C端包含:(i)按照递增的优选顺序,与SEQ ID NO:66所示的保守TCP结构域(包括碱性螺旋-环-螺旋(bHLH))具有至少65%、70%、75%、80%、85%、90%、95%或98%或更高序列同一性;和(ii)SEQID NO:65所示的C端共有基序1。备选地或此外,当由通过基因改组获得的变体核酸序列编码的多肽序列用于构建TCP系统树(例如图1所示的)时,趋向聚簇于包含SEQ ID NO:2(图2中圆圈圈出的)所示多肽序列的TCP多肽的分化支,而不是聚簇于任何其他TCP分化支。最优选,通过基因改组获得的变体核酸序列是SEQ ID NO:1的变体或SEQ IDNO:2的直向同源物或旁系同源物的编码核酸序列的变体,所述变体通过基因改组获得。
此外,还可以通过位点定向诱变获得核酸变体。几种方法可用于实现位点定向诱变;最常用的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编著)。
本发明提供增加植物种子产量的方法,其包括在植物中引入和表达实施例1的表A中给出的核酸序列中任一个的变体,或包括在植物中引入和表达实施例1的表A中给出的任意多肽序列的直向同源物、旁系同源物或同源物的编码核酸序列的变体,所述变体核酸序列通过位点定向诱变获得。
优选地,通过位点定向诱变获得的变体核酸序列编码I类TCP多肽序列,所述多肽序列从N端到C端包含:(i)按照递增的优选顺序,与SEQID NO:66所示的保守TCP结构域(包括碱性螺旋-环-螺旋(bHLH))具有至少65%、70%、75%、80%、85%、90%、95%或98%或更高序列同一性;和(ii)SEQ ID NO:65所示的C端共有基序1。备选地或此外,当通过位点定向诱变获得的变体核酸序列编码的多肽序列用于构建TCP系统树(例如图1所示的)时,趋向聚簇于包含SEQ ID NO:2所示多肽序列的TCP多肽的分化支,而不是聚簇于任何其他TCP分化支。最优选,通过位点定向诱变获得的变体核酸序列是SEQ ID NO:1的变体或SEQ IDNO:2的直向同源物或旁系同源物的编码核酸序列的变体,所述变体通过基因改组获得。
以下编码I类TCP多肽的核酸变体是适合实施本发明方法的变体的实例:
(i)编码I类TCP多肽的核酸序列的部分;
(ii)能与编码I类TCP多肽的核酸序列杂交的核酸序列;
(iii)编码I类TCP多肽的核酸序列的剪接变体;
(iv)编码I类TCP多肽的核酸序列的等位变体;
(v)通过基因改组获得的编码I类TCP多肽的核酸序列;
(vi)通过位点定向诱变获得的编码I类TCP多肽的核酸序列。
编码I类TCP多肽的核酸序列可以来自任何天然或人工的来源。可以通过仔细的人为操作在组成和/或基因组环境上修饰所述核酸序列的天然形式。优选编码I类TCP多肽的核酸序列来自植物,又优选源自双子叶植物,更优选源自十字花科,最优选核酸序列来自拟南芥。
因此本文任何I类TCP多肽的引用意指如上文定义的I类TCP多肽。编码此类I类TCP多肽的任意核酸序列适合用于实施本发明的方法。
本发明也包括可通过本发明方法获得的植物或其部分(包括种子)。所述植物或其部分包括如上文定义的编码I类TCP多肽的核酸转基因。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。所述基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含:
(a)如上面所定义的编码I类TCP多肽的核酸序列;
(b)一个或多个能够驱动(a)的核酸序列表达的调控序列;和任选地
(c)转录终止序列。
优选的构建体是调控序列为组成型启动子,优选是GOS2启动子的构建体。
本发明还提供用如上文定义的构建体转化的植物、植物部分、或植物细胞。
植物用包含目的序列的载体转化(即如上文定义的编码I类TCP多肽的核酸序列)。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。术语“调节元件”、“调控序列”和“启动子”如本文“定义”部分定义。术语“有效连接”如“定义”部分定义。
有利地,可以使用任何类型的启动子驱动核酸序列的表达。术语“启动子”和“植物启动子”在本文“定义”部分定义并还描述了几个启动子的实例。
优选地,启动子来自植物,更优选来自单子叶植物。启动子可以是组成型启动子。此外或备选地,启动子可以是器官特异性或组织特异性启动子。
在一个实施方案中,编码I类TCP多肽的核酸序列与组成型启动子有效连接,术语“组成型启动子”如本文“定义”部分定义。组成型启动子是基本上普遍表达的组成型启动子。优选组成型启动子来自植物,更优选来自单子叶植物。还优选组成型启动子是GOS2启动子(来自稻),例如基本上与SEQ ID NO:67相似的核酸序列所示的启动子,最优选的组成型启动子是如SEQ ID NO:67所示的启动子。应当清楚,本发明的实用性不局限于SEQ ID NO:1所示的核酸序列,本发明的实用性也不局限于受GOS2启动子驱动的编码I类TCP多肽的核酸序列的表达。本文“定义部分”显示了同样可用于驱动编码I类TCP多肽的核酸序列表达的其他组成型启动子的实例。
为鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可以通过将该启动子与报道基因有效连接并分析该报道基因在植物多种组织的表达水平和模式而进行分析。合适的公知报道基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如本发明方法中所用的一种启动子)的启动子强度和/或表达模式比较。备选地,启动子强度可以使用本领域已知方法如Northern印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996GenomeMethods 6:986-994),通过定量mRNA水平或通过将本发明方法中所用核酸序列的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较而分析。通常“弱启动子”意指驱动编码序列在低水平上表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。术语“终止子”如本文“定义”部分定义。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。此类序列是公知的或本领域技术人员可易于获得的。
内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg,Mol.Cell biol.8:4395-4405(1988);Callis等,Gens Dev 1:1183-1200(1987))。基因表达的此类内含子增强作用一般在位于转录单位5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:The Maize Handbook,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包含在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。术语“选择性标记”、“选择性标记基因”或“报道基因”在本文“定义”部分定义。
本发明也提供用于产生相对于对照植物具有增加的种子产量的转基因植物的方法,其包括在植物中引入和表达如上文所定义的编码I类TCP多肽的任意核酸序列。
术语″转基因的″、”转基因”或″重组″如本文定义。
更具体地,本发明提供用于产生相对于对照植物具有增加的种子产量的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中引入和表达编码I类TCP多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
核酸序列可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸序列优选地通过转化引入植物。
术语“引入”或“转化”如本文“定义”部分定义。
遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R Wu、Potrykus或
Figure A20078004357700651
和Willmitzer的上述出版物。
通常在转化后,选择一种或多种标记存在的植物细胞或细胞群体,其中所述的标记由与目的基因一起共转移的植物可表达的基因编码,随后将转化的材料再生成整株植物。为了选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。另一种可能性包含于使用合适选择剂的琼脂平板上生长种子(根据需要在消毒之后),使得仅转化的种子可以生长成植物。或者,转化的植物通过上述那些选择标记的存在筛选。
在DNA转移和再生后,推测的转化植物还可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或此外,新引入的DNA的表达水平可以使用Northern和/或Western,这两种技术是本领域技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交并选择纯合的第二代(或T2)转化体,并且T2植物可以随后通过经典育种技术进一步增殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如被转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过文中所述的任意方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任意前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的一种或多种基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有分离的如上文定义的编码I类TCP多肽的核酸序列。本发明优选的宿主细胞是植物细胞。
宿主植物对于本发明方法中所用核酸序列或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎干、根状茎、块茎和球茎。本发明进一步涉及来自,优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
在本领域内详细记载了用于增加核酸序列或基因、或基因产物表达的方法并且它们包括例如,由适宜启动子驱动的超量表达、使用转录增强子或翻译增强子。可以在非异源形式的多核苷酸的适宜位置(一般是上游)内引入作为启动子或增强子元件的分离核酸序列,以便上调表达。例如,内源性启动子可以通过突变、缺失和/或取代而在体内改变(见Kmiec,美国专利第5,565,350号;Zarling等,PCT/US93/03868),或可以将分离的启动子以相对于本发明基因的正确方向及距离引入植物细胞,以便控制基因表达。
术语“表达”或“基因表达”如本文“定义”部分定义。
术语“增加的表达”意指编码I类TCP多肽的核酸序列表达的增加,所述表达的增加导致相对于对照植物,植物增加的种子产量。优选地,核酸序列表达的增加为编码如上文定义的I类TCP多肽的内源植物核酸序列表达的1.25、1.5、1.75、2、5、7.5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多倍。
若需要多肽表达,通常希望在多核苷酸编码区的3’端包括多聚腺苷化区。多聚腺苷化区可以来自天然基因、来自多种其他植物基因或来自T-DNA。待添加的3’端序列可以来自例如胭脂碱合酶或章鱼碱合酶基因或备选地来自另一植物基因或更不优选来自任何其他真核基因。
如上所述,也可以添加内含子序列。
其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。
如上文所述,用于增加I类TCP多肽的编码核酸序列的表达的优选方法是在植物中引入和表达I类TCP多肽的编码核酸序列;然而,实现本方法的效果即增加种子产量也可以使用其他公知技术来实现。以下将是一些此类技术的描述。
一种此类技术是T-DNA激活标注(Hayashi等,Science(1992)1350-1353),其在本文“定义”部分描述。
还可以使用TILLING(定向诱导的基因组局部突变)技术再现本发明的效果。见本文“定义”部分对该技术的描述。
还可以使用同源物重组再现本发明的效果,其在本文“定义”部分描述。
实施本发明方法导致相对于对照植物种子产量的增加。术语“增加”在本文“定义”部分定义。术语“增强”或“改良”也在本文“定义”部分定义。
增加的产量可以表现为下列一种或多种指标:
(i)增加的种子总产量,这包括种子生物量(种子重量)的增加,并且其可以是每棵植株或单粒种子基础上的种子重量增加;
(ii)增加的每株植物圆锥花序数;
(iii)增加的每个圆锥花序的花朵(“小穗floret”)数量;
(iv)增加的种子饱满率;
(v)增加的(饱满)种子数量;
(vi)增加的种子大小(长、宽面积、周长),这也可影响种子的组成;
(vii)增加的种子体积,这也可影响种子的组成;
(viii)增加的收获指数,其表达为可收获部分[如种子]的产量与总生物量的比率;和
(ix)增加的千粒重(TKW),这通过计数饱满种子数量及其总重量,进行外推得到。TKW增加可源于种子大小和/或种子重量的增加。TKW增加可源于胚大小和/或胚乳大小的增加。
在种子大小、种子体积、种子面积、种子周长、种子宽度或种子长度方面的增加可以归因于种子特定部分的增加,如归因于胚和/或胚乳和/或糊粉和/或盾片或种子的其他部分的大小的增加。
尤其,增加的种子产量选自如下之一或多个指标:(i)增加的种子重量;(ii)增加的收获指数;(iii)增加的TKW。
种子产量的增加也可以表现为种子大小和/或种子体积的增加,其也可以影响种子的组分(包括油、蛋白质和糖类总含量和/或组分)。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩所栽培的植物数的增加、每株植物穗数的增加、行数、每行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
由于本发明的转基因植物具有增加的种子产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。增加的生长速率可以在种子发育期出现(再生性生长速率),而营养体生长速率不变或甚至降低。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生与对照植物相比具有增加的生长速率的植物。因而根据本发明,提供相对于对照植物增加植物生长速率的方法,其包括增加编码如本文定义的I类TCP多肽的核酸序列在植物中的表达。优选地,增加的生长速率可以在种子发育期出现(再生性生长速率),而营养体生长速率不变或甚至降低。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码I类TCP多肽的核酸序列在植物中表达。
本发明方法有利地适用于任何植物。术语“植物”如本发明“定义”部分定义。也描述了尤其可用于本发明方法中的植物。
根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、高粱和燕麦。
本发明还包括本文所述的编码I类TCP多肽的核酸序列的用途和这些多肽序列用于增加植物种子产量的用途。优选地,增加的种子产量选自如下之一或多个指标:(i)增加的种子重量;(ii)增加的收获指数;(iii)增加的千粒重。
本文所述的编码I类TCP多肽的核酸序列或I类TCP多肽本身可以用于育种程序中,其中鉴定到可以遗传地与I类TCP多肽编码基因连接的DNA标记。所述的核酸序列/基因、或I类TCP多肽本身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择在本发明方法中具有如上文定义的增加的种子产量的植物。
编码I类TCP多肽的核酸序列或基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物进行诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其他任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码I类TCP多肽的核酸序列也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有目的表型的株系。编码I类TCP多肽的核酸序列的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码I类TCP多肽的核酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,ALaboratory Manual)可以用编码I类TCP多肽的核酸序列探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics1:174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码I类TCP多肽的核酸序列在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸序列而实施。实例可见于文中的“定义”部分。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等,(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等,(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等,(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook,(1989)NucleicAcid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
本发明方法产生如前文所述的具有增加的种子产量的植物。这些性状也可以与经济上有利的其他性状组合,如产量增强性状、对其他非生物和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
发明详述
CAH3
现已惊奇地发现调节编码YEP多肽的核酸在植物中的表达产生了相对于对照植物具有增强的产量相关性状而不影响营养体生物量的植物,其中YEP是CAH3。下文详述适于增强植物中产量相关性状的特定的CAH3多肽类别。
本发明提供用于相对于对照植物,增强植物中产量相关性状的方法,其包括调节编码CAH3多肽的核酸在植物中的表达。术语“对照植物”如本文“定义”部分定义。
在涉及CAH3实施方案的上下文中,在此之后“用于本发明方法的蛋白质”的任何引用意指如本文定义的CAH3多肽。在此之后“用于本发明方法的核酸”的任何引用意指能够编码此类CAH3多肽的核酸。术语“多肽”和“蛋白质”在本文“定义”部分定义。术语″多核苷酸″、″核酸序列″、″核苷酸序列″如本文“定义”部分定义。
用于调节(优选增加)用于本发明方法的蛋白质的编码核酸表达的优选方法是通过在植物中引入和表达如下文定义用于本发明方法的蛋白质的编码核酸。
待引入植物(并且因而用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任意核酸,下文又称作“CAH3核酸”或“CAH3基因”。如本发明定义“CAH3”多肽指具有碳酸酐酶活性的任意蛋白质(EC 4.2.1.1)。碳酸酐酶还被称为碳酸脱水酶(carbonate dehydratase)(根据IUBMBEnzyme Nomenclature的可接受名)、脱水酶、碳酸脱水酶(carbonateanhydrase、carbonic acid anhydrase、carboxyanhydrase)和碳酸脱水酶A。用于测试碳酸酐酶活性的方法是本领域公知的;进一步细节参见实施例。
优选地,用于本发明方法的碳酸酐酶氨基酸序列包括如下基序之一个或多个:
基序1:(S/T)E(H/N)X(L/I/V/M)XXXX(F/Y/L/H)XX(E/D)X(H/Q)(L/I/V/M/F/A)(L/I/V/M/F/A)(SEQ ID NO:203)。
优选地,在基序1的位点4的X为T、S、E、F、A、H、L中之一;位点6的X优选为N、D、S、H、A、M中之一;位点7的X优选为N或G;位点8的X优选为K、R、T、Q、E、V、A、K中之一;位点9的X优选为R、K、Q、L、H、I、S中之一;位点11的X优选为V、A、D、N、P中之一;位点12的X优选为L、M、A中之一;位点14的X优选为Q、E、L、A、V中之一。还优选,位点16的残基为M、L、或V中之一;位点17的残基为L或V。最优选,基序1的序列为SEHAMDGRRYAMEAHLV。
基序2:(L/N/Y/M/T/F/A/R)(A/V/S)V(V/I/L/T)(A/T/G/S)(F/V/I/L/S/T)(L/F/V/M)(SEQ ID NO:204)。
优选地,基序2具有序列(L/F/A/R)(A/V/S)V(V/I/L/T)(A/G/S)(F/V/I/L/T)(L/F/V/M)。最优选,基序2具有序列LAVLGIM。
基序3:(Y/F)(Y/F/V/G/A)(R/E/G/T/H)(Y/F)XGS(L/F/Y)T(T/V/A)PPC(S/T/G/D/A)(E/Q)(N/G/D/R)(SEQ ID NO:205)。
优选地,X为L、I、T、R、M、G、A、D、E、P中之一。最优选,基序3具有序列FVHYPGSLTTPPCSEG.
优选地,本文定义的“CAH3”多肽指这样的氨基酸序列,当其用于构建CAH3系统树(例如图7A所示的)时,聚簇于包含SEQ ID NO:81所示的氨基酸序列的αCAH3多肽类(class),而不是聚簇于β或γ类。
本领域技术人员可容易地利用制作此类系统树的已知技术和软件,例如GCG、EBI或CLUSTAL软件包,利用默认参数来确定任何所研究的氨基酸序列是否落入“CAH3”多肽的定义中。任何聚簇于包含SEQ ID NO:81的组的序列将被认为落入上述CAH3多肽的定义并被认为适用于本发明的方法中。
用于本发明方法的蛋白质和编码其的核酸的实例在下文实施例部分的表B中给出。
还用于本发明方法的是表B中给出的任一氨基酸序列的同源物,蛋白质的“同源物”如本文“定义”部分所定义。
还用于本发明方法的是本文表B中给出的任一多肽的衍生物,或前述任意前述SEQ ID NO的直向同源物或旁系同源物的衍生物。“衍生物”在本文“定义”部分所定义。
本发明通过用由SEQ ID NO:80所示的编码多肽序列SEQ ID NO:81的莱茵衣藻核酸序列转化的植物加以说明,然而,本发明的实施不限于这些序列。本发明方法可以有利地使用编码如文中所定义的用于本发明方法的蛋白质的任何核酸实施,包括直向同源物和旁系同源物,例如本文表B中给出的任何核酸序列。
可以认为实施例14的表B中给出的氨基酸序列是由SEQ ID NO:81所示的CAH3多肽的直向同源物和旁系同源物。直向同源物和旁系同源物如本文“定义”部分定义。
直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。其一般包括第一BLAST,所述第一BLAST参与提交查询序列(例如使用本文表B中列出的任何序列)用于针对任一序列数据库(如公众可用的NCBI数据库)的BLAST搜索。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:80或SEQ ID NO:81的情况下,第二BLAST因而将针对莱茵衣藻序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地以最高命中的查询序列中产生,则鉴定到旁系同源物;若第一BLAST的中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
本文表B给出由SEQ ID NO:81所示的CAH3蛋白质的直向同源物和旁系同源物的实例。使用上述BLAST过程可以容易地鉴定到其他直向同源物和旁系同源物。
通过保守碳酸酐酶结构域(Pfam登录号PF00194,InterProIPR001148),和/或通过上面列出的基序之一的存在可鉴定到本发明的蛋白质(图6所示)。术语“结构域”在本文“定义”部分定义。术语“基序”,或“共有序列”,或“标记”的定义见“定义”部分。
也存在用于鉴定结构域的专业数据库,如SMART(Shultz等(1998)Pro.Natl.Aad.Si.美国95,5857-5864;Letuni等(2002)Nulei AidsRes 30,242-244)、InterPro(Mulder等,(2003)Nul.Aids.Res.31,315-318)、Prosite(Buher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research30(1):276-280(2002))鉴定。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(在Swiss Institute of Bioinformatics上驻留(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res.31:3784-3788(2003))。
也使用本领域熟知的常规技术可以容易地鉴定结构域,例如通过序列比对鉴定。用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列(覆盖整个序列的)的全局比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.2003Jul 10;4:29.MatGAT:使用蛋白质或DNA序列而产生相似性/同一性矩阵的应用)。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构域(如碳酸酐酶结构域或上面定义的基序之一)。在下面实施例部分中以百分比描述的序列同一性值使用上述程序,利用默认参数,针对完整核酸或氨基酸序列/或针对选择的结构域或保守基序上确定。
此外,CAH3蛋白质(至少以其天然形式的)一般具有碳酸酐酶活性。对碳酸酐酶的测试法在本领域是公知并包括滴定测试法和分光光度测试法,见例如Karlsson等,(Plant Physiol.109:533-539,1995)。实施例部分中提供了进一步详述。
用于本发明方法的蛋白质的编码核酸不需要是全长核酸,因为本发明方法的实施不依赖全长核酸序列的使用。适合用于实施本发明方法的核酸实例包括本文表B中给出的核酸序列,但不限于这些序列。核酸变体可用于实施本发明的方法。这样的核酸变体实例包括用于本发明方法的蛋白质的编码核酸的部分、与用于本发明方法的蛋白质的编码核酸杂交的核酸、用于本发明方法的蛋白质的编码核酸的剪接变体、用于本发明方法的蛋白质的编码核酸的等位变体,和通过基因改组获得的用于本发明方法的蛋白质的编码核酸的变体。现将描述并也在本文“定义”部分定义术语部分、杂交序列、剪接变体、等位变体和基因改组。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达本文表B中给出的任一核酸序列的部分、或表B中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的部分。
用于本发明方法的部分编码多肽,所述多肽落入如本文定义的用于本发明方法的蛋白质的编码核酸的定义内,且与表B中给出的氨基酸序列具有基本上相同的生物学活性。优选地,部分是表B中给出的任一核酸的部分。部分通常长度至少为600个连续核苷酸,优选长度至少为700个连续核苷酸,更优选长度至少为800个连续核苷酸,最优选长度至少为900个连续核苷酸,所述连续核苷酸是表B中给出的任一核酸序列。最优选,部分是SEQ ID NO:80的核酸的部分。优选地,部分编码包括如本文定义的(任一或多个)碳酸酐酶结构域的氨基酸序列。优选地,部分编码氨基酸序列,当所述氨基酸序列用于构建CAH3系统树(例如图7所示的)时,趋向聚簇于包含SEQ ID NO:81所示氨基酸序列的αCAH3蛋白质组,而不是聚簇于任何其他组。
如本文所定义的CAH3蛋白质的编码核酸的部分可以通过对核酸进行一个或多个缺失来制备。部分可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便,例如,产生组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比预测的CAH3蛋白质部分要大。
用于本发明方法的另一核酸变体是在降低的严格条件下、优选在严格条件下,能够与本文所定义的CAH3蛋白质的编码核酸或与本文所定义的部分杂交的核酸。术语“杂交”如本文“定义”部分定义。
用于本发明方法的杂交序列编码多肽,所述多肽具有碳酸酐酶结构域(见图7的比对),且与表B中给出的任意氨基酸序列所表示的CAH3蛋白质具有基本上相同的生物学活性。杂交序列通常长度至少为600个连续核苷酸,优选长度至少为700个连续核苷酸,更优选长度至少为800个连续核苷酸,最优选长度至少为900个连续核苷酸,所述连续核苷酸是表B中给出的任一核酸序列。优选地,杂交序列是能够与表B中给出的任意核酸杂交的序列、或与任意这些序列的部分杂交的序列,部分如上文定义。最优选,杂交序列是能够与SEQ ID NO:80所表示的核酸或其部分杂交的序列。优选地,杂交序列编码包含如本文定义的任一或多个基序或结构域的氨基酸序列。优选地,杂交序列编码氨基酸序列,当所述氨基酸序列用于构建CAH3系统树(例如图7所示的)时,趋向聚簇于包含SEQID NO:81所示氨基酸序列的αCAH3蛋白质组,而不是聚簇于任何其他组。
本发明提供增加植物中产量相关性状的方法,其包括在植物中引入和表达能够与表B中给出的任一核酸杂交的核酸、或包括在植物中引入和表达能够与表B中给出的任意核酸的直向同源物、旁系同源物或同源物的编码核酸杂交的核酸。
用于本发明方法的另一核酸变体是编码上文所定义的CAH3蛋白质的剪接变体。术语“剪接变体”如本文定义。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达表B中给出的核酸序列中任一个的剪接变体、或表B中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:80所示的核酸的剪接变体或SEQID NO:81的直向同源物或旁系同源物的编码核酸的剪接变体。优选地,剪接变体编码的氨基酸序列包含如本文定义的任一个或多个基序或结构域。优选地,剪接变体编码的氨基酸序列,当所述氨基酸序列用于构建CAH3系统树(例如图7所示的)时,趋向聚簇于包含SEQ ID NO:81所示氨基酸序列的αCAH3蛋白质组,而不是聚簇于任何其他组。
用于实施本发明方法的另一核酸变体是上文所定义的CAH3蛋白质的编码核酸的等位变体。术语“等位变体”如本文定义。用于本发明方法的等位变体与SEQ ID NO:81的CAH3蛋白质具有基本上相同的生物学活性。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达表B中给出的核酸中任一个的等位变体,或包括在植物中引入和表达表B中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的等位变体。
优选地,等位变体是SEQ ID NO:80的等位变体,或SEQ ID NO:81的直向同源物或旁系同源物的编码核酸的等位变体。优选地,等位变体编码的氨基酸序列包括如本文定义的任一个或多个基序或结构域。优选地,等位变体编码的氨基酸序列,当所述氨基酸序列用于构建CAH3系统树(例如图7所示的)时,趋向聚簇于包含SEQ ID NO:81所示氨基酸序列的αCAH3蛋白质组,而不是聚簇于任何其他组。
用于本发明方法的又一核酸变体是通过基因改组获得的核酸变体。基因改组或定向进化如本文定义。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达表B中给出的核酸序列中任一个的变体,或包括在植物中引入和表达表B中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的变体,所述变体核酸通过基因改组获得。
优选地,通过基因改组获得的变体核酸编码氨基酸序列,所述氨基酸序列包含如本文定义的任一个或多个基序或结构域。优选地,通过基因改组获得的变体核酸编码的氨基酸序列,当所述氨基酸序列用于构建CAH3系统树(例如图7所示的)时,趋向聚簇于包含SEQ ID NO:81所示氨基酸序列的αCAH3蛋白质组,而不是聚簇于任何其他组。
此外,还可以通过位点定向诱变获得核酸变体。几种方法可用于实现位点定向诱变;最常用的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编著)。
编码CAH3蛋白质的核酸可以来自任何天然或人工的来源。可以通过仔细的人为操作在组成和/或基因组环境上修饰所述核酸的天然形式。优选CAH3编码核酸来自植物,又优选源自藻类,更优选源自衣藻科,最优选核酸来自莱茵衣藻。
因此本文任何CAH3蛋白质的引用意指如上文定义的CAH3蛋白质。编码此类CAH3蛋白质的任意核酸适合用于实施本发明方法。
本发明也包括可通过本发明方法获得的植物或其部分(包括种子)。所述植物或其部分包括如上文定义的编码CAH3蛋白质的核酸转基因。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。所述基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含:
(a)如上面所定义的编码CAH3蛋白质的核酸;
(b)一个或多个能够驱动(a)的核酸序列表达的调控序列;和任选地
(c)转录终止序列。
植物用包含目的序列的载体转化(即如上文定义的编码CAH3多肽的核酸)。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。术语“调节元件”、“调控序列”和“启动子”如本文“定义”部分定义。术语“有效连接”也在本文定义。
有利地,可以使用任何类型的启动子驱动核酸序列的表达。术语“启动子”和“植物启动子”在本文“定义”部分定义。所述启动子可以是如本文定义的组成型启动子,。备选地,启动子可以是如本文定义的诱导性启动子。此外或备选地,可以是如本文定义的器官特异性或组织特异性启动子。
优选地,CAH3核酸或其变体与幼绿组织(young green tissue)特异性启动子有效连接。文中定义的幼绿组织特异性启动子主要在幼绿组织中有转录活性,基本在任何其他植物部分没有转录活性,同时仍然允许在这些其他植物部分的任何渗漏表达。幼绿组织特异性启动子优选是原叶绿素酸酯还原酶启动子(PcR),更优选是由基本上与SEQ ID NO:206相似的核酸序列代表的原叶绿素酸酯还原酶启动子,最优选是如SEQ ID NO:206所代表的启动子。
应当明白本发明的适用性不限于由SEQ ID NO:80代表的CAH3编码核酸,同时本发明的适用性也不限于由原叶绿素酸酯还原酶启动子驱动时这类CAH3编码核酸的表达。也可以用于实施不发明方法的其他幼绿组织特异性启动子的实例在本文“定义”部分的表2g中显示。
为鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可以通过将该启动子与报道基因有效连接并分析该报道基因在植物多种组织的表达水平和模式而进行分析。合适的公知报道基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如本发明方法中所用的一种启动子)的启动子强度和/或表达模式比较。备选地,启动子强度可以使用本领域已知方法如Northern印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996GenomeMethods 6:986-994),通过定量mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较而分析。通常“弱启动子”意指驱动编码序列在低水平上表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。术语“终止子”如本文所定义。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。此类序列是公知的或本领域技术人员可易于获得的。
内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg,Mol.Cell biol.8:4395-4405(1988);Callis等,Gens Dev 1:1183-1200(1987))。基因表达的此类内含子增强作用一般在位于转录单位5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:The Maize Handbook,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包含在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。术语“选择性标记”、“选择性标记基因”或“报道基因”的定义见本文“定义”部分。
本发明也提供用于产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,其包括在植物中引入和表达如上文所定义的编码CAH3蛋白质的任意核酸。
为本发明的目的,“转基因的”、“转基因”或“重组”如本文“定义”部分定义。“转基因植物”如本文“定义”部分定义。
更具体地,本发明提供用于产生具有增加的产量的转基因植物的方法,其包括:
(i)在植物或植物细胞中引入和表达CAH3核酸或其变体;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸优选地通过转化引入植物。
术语“引入”或“转化”在本文“定义”部分定义。遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R Wu、Potrykus或
Figure A20078004357700851
和Willmitzer的上述出版物。
通常在转化后,选择一种或多种标记存在的植物细胞或细胞群体,其中所述的标记由与目的基因一起共转移的植物可表达的基因编码,随后将转化的材料再生成整株植物。为了选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。另一种可能性包含在使用合适选择剂的琼脂平板上生长种子(根据需要在消毒之后),使得仅转化的种子可以生长成植物。或者,转化的植物通过上述那些选择标记的存在筛选。
在DNA转移和再生后,推测的转化植物还可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或此外,新引入的DNA的表达水平可以使用Northern和/或Western,这两种技术是本领域技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交并选择纯合的第二代(或T2)转化体,并且T2植物可以随后通过经典育种技术进一步增殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如被转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过文中所述的任意方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任意前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的一种或多种基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有分离的编码如上文定义的CAH3蛋白质的核酸。本发明优选的宿主细胞是植物细胞。
宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎干、根状茎、块茎和球茎。本发明进一步涉及来自,优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。术语“增加的表达/过量表达”如本文定义。
如上文所述,用于调节(优选增加)CAH3蛋白质的编码核酸的表达的优选方法是在植物中引入和表达CAH3蛋白质的编码核酸;然而,实现本方法的效果即增强产量相关性状也可以使用其他公知技术来实现。以下将是一些此类技术的描述。
一种此类技术是T-DNA激活标注,其在本文“定义”部分详述。还可以使用TILLING(定向诱导的基因组局部突变)技术再现本发明的效果,其也在本文“定义”部分详述。还可以使用同源物重组再现本发明的效果,其也在本文“定义”部分详述。
本文对增强的产量相关性状的引用意指在植物一个部分或多个部分的生物量(重量)的增加,其包括地上(可收获)部分和/或(可收获)地下部分。特别地,此类可收获部分是种子,且实施本发明方法产生具有相对于合适的对照植物的种子产量,具有增加的种子产量的植物。
术语“产量”和“种子产量”在本文“定义”部分定义。术语“增加”、“增强”或“改良”也在本文定义。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩所栽培的植物数的增加、每株植物穗数的增加、行数、每行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生与对照植物相比具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节、优选增加编码如本文定义的CAH3蛋白质的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物,具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而,本发明提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,其包括增加编码CAH3多肽的核酸在植物中表达。
在本发明优选的实施方案中,根据本发明方法的产量和/或生长速率的增加在非胁迫条件下出现。
本发明方法有利地适用于任何植物。本文定义了术语“植物”并也提供了用于本发明方法的植物的实例。
根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、高粱和燕麦。
本发明还包括本文所述的编码CAH3蛋白质的核酸的用途,和这些CAH3蛋白质用于增强植物中产量相关性状的用途。
本文所述的编码CAH3蛋白质的核酸或CAH3蛋白质本身可以用于育种程序中,其中鉴定到与CAH3蛋白质编码基因遗传连锁的DNA标记。所述的核酸/基因、或CAH3蛋白质本身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择在本发明方法中具有如上文定义的增强的产量相关性状的植物。
编码CAH3蛋白质的核酸或基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物进行诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其他任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码CAH3蛋白质的核酸也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有目的表型的株系。编码CAH3蛋白质的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码CAH3蛋白质的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码CAH3蛋白质的核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码CAH3蛋白质的核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例可见于文中的“定义”部分。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等,(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等,(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等,(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook,(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
本发明方法产生如前文所述的具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如进一步增强产量性状、对其他非生物和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
发明详述
CLAVATA
现已惊奇地发现增加编码YEP的核酸序列在植物中的表达产生了相对于对照植物具有增强的产量相关性状的植物,所述YEP是具有无功能C端结构域的CLV1。下文详述适合用于为相对于对照植物增强植物中产量相关性状之目的而破坏C端结构域的生物学功能的特定的CLV1多肽类别。
本发明提供用于相对于对照植物增强植物中产量相关性状的方法,其包括增加编码具有无功能C端结构域的CLV1多肽的核酸序列在植物中的表达。术语“对照植物”如本文“定义”部分定义。
在此之后“用于本发明方法的蛋白质”的任何引用意指如本文定义的具有无功能C端结构域的CLV1多肽。在此之后“用于本发明方法的核酸序列”的任何引用意指能够编码此类具有无功能C端结构域的CLV1多肽的核酸序列。术语“多肽”和“蛋白质”如本文定义。术语″多核苷酸″、″核酸序列″、″核苷酸序列″如本文“定义”部分定义。
用于增加具有无功能C端结构域的CLV1多肽的编码核酸序列表达的优选方法是通过在植物中引入和表达如下文定义具有无功能C端结构域的CLV1多肽的编码核酸。
待引入植物(并且因而用于实施本发明方法)的核酸序列是编码现将描述的多肽类型的任意核酸序列。
CLV1多肽是本领域公知的,且可通过从N端到C端存在以下项而容易地鉴定到:(i)用于ER亚细胞靶向的信号肽;(ii)包括20、21、或22LRR的胞外LRR结构域;(iii)跨膜结构域;和(iv)胞内丝氨酸/苏氨酸激酶结构域(见图10a和11,和实施例28)。此外,CLV1多肽还可以包含与SEQ ID NO:212具有50%、60%、70%、80%、90%、95%、98%或更高同一性的氨基酸序列(实施例27)。
此外,CLV1多肽可以从N端到C端包含如下项之一或全部:(i)由SEQID NO:237所示的基序1;或(ii)由SEQ ID NO:238所示的基序2。优选基序1和基序2包含于信号肽和LRR结构域之间。如实施例26确定基序1和基序2的存在。
基序1中的最保守的氨基酸是LXDW,且基序2中最保守的氨基酸XHCXFXGVXCD(其中X是各位置不同的氨基酸的特定子集,如SEQ IDNO:237和SEQ ID NO:238所示)。基序1和基序2中,允许在任意位点具有一个或多个保守性改变。备选或此外,基序1中,允许在任意位点具有一个非保守性改变,基序2中,允许在任意位点具有一个、两个或三个非保守性改变。
备选或此外,本文定义的“CLV1”多肽指这样的任意多肽序列,当其用于构建LRR-RLK系统树(例如图10b所示的)时,趋向聚簇于包含SEQ ID NO:212所示的氨基酸序列的多肽组(由括号表示),而不是聚簇于任意其他LRR-RLK多肽组。
本领域技术人员可容易地利用制作此类系统树的已知技术和软件,例如GCG、EBI或CLUSTAL软件包,利用默认参数来确定任何所研究的氨基酸序列是否落入“CLV1”多肽的定义中。聚簇于包含SEQ ID NO:212的组的任意氨基酸序列将被认为落入上述CLV1多肽的定义并适用于本发明的方法中。此类方法在实施例25中描述。
可以通过破坏任意CLV1多肽的C端结构域的生物学功能使该CLV1多肽可用于本发明方法。此类方法(用于破坏生物学功能)在本领域是公知的且包括:删除、取代和/或插入CLV1多肽C端结构域的氨基酸。此类方法的实例在实施例31中描述。来自CLV1多肽C端结构域的一个或多个氨基酸可以被删除、取代和/或插入。
为本申请的目的,CLV1多肽C端结构域意指编码跨膜结构域的氨基酸序列(从N端到C端)之后的氨基酸序列(见图10和11),且包含:(i)激酶结构域;和(ii)一个或多个可磷酸化氨基酸。
具有无功能C端结构域的CLV1多肽的一个实例是由SEQ ID NO:210所示的多肽,具有由SEQ ID NO:209所示的编码核酸序列。起始于激酶亚结构域IV(见图11)的RLL基序的Arg(R)残基且终止于全长CLV1多肽(由SEQ ID NO:212表示)的C端的氨基酸序列已被去除。
本文实施例部分的表C中给出了CLV1多肽的实例;可以通过破坏这些多肽的C端结构域的生物学功能使所述序列可用于本发明方法,例如通过使用本文所讨论的方法(用于破坏生物学功能)。
还用于本发明方法的是本文表C中给出的任一氨基酸序列的同源物,术语“同源物”如本文定义。
还用于本发明方法的是表C中给出的任一多肽的衍生物,或表C中给出的任意SEQ ID NO的直向同源物或旁系同源物。“衍生物”也如本文定义。
本发明通过用由SEQ ID NO:209(包含于SEQ ID NO:211)所示的编码多肽序列SEQ ID NO:210(包含于SEQ ID NO:212)的拟南芥核酸序列转化的植物加以说明,然而,本发明的实施不限于这些序列。本发明方法可以有利地使用编码如文中所定义的具有无功能C端结构域的CLV1多肽的任意核酸序列实施,包括具有例如通过使用本文所论的任意方法(用于破坏生物学功能)得到的无功能C端结构域的直向同源物和旁系同源物,例如实施例25的表C中给出的任何核酸序列。
可以认为本文表C中给出的氨基酸序列是由SEQ ID NO:212所示的CLV1多肽的直向同源物和旁系同源物。直向同源物和旁系同源物如本文定义。
直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。其一般包括第一BLAST,所述第一BLAST参与提交查询序列(例如使用表C中列出的任何序列)用于针对任一序列数据库(如公众可用的NCBI数据库)的BLAST搜索。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:211或SEQ ID NO:212的情况下,第二BLAST因而将针对拟南芥序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地以最高命中的查询序列中产生,则鉴定到旁系同源物;若第一BLAST的中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。可以通过破坏如此鉴定到的多肽的C端结构域的生物学功能使所述序列随后可用于本发明方法,例如通过使用本文所讨论的任意方法(用于破坏生物学功能)。
本文实施例25表C给出由SEQ ID NO:212所示的CLV1多肽的直向同源物和旁系同源物的实例。使用上述BLAST过程可以容易地鉴定到其他直向同源物和旁系同源物。可以通过破坏如此鉴定到的多肽的C端结构域的生物学功能使所述序列随后可用于本发明方法,例如通过使用本文所讨论的任意方法(用于破坏生物学功能)。
通过特异性结构域的存在可鉴定到本发明的蛋白质。术语“结构域”如本文定义。术语“基序”,或“共有序列”,或“标记”也在本文定义。
也存在用于鉴定结构域的专业数据库,如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic AcidsRes 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research30(1):276-280(2002))鉴定。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(在Swiss Institute ofBioinformatics上驻留(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res.31:3784-3788(2003))。实施例28中列出了通过实施此分析鉴定到的不同结构域的登录号。例如,富亮氨酸重复具有InterPro登录号IPR001611、Prints登录号PR00019、和PFam登录号PF00560。LRR结构域包含20、21或22个此类富亮氨酸重复(LRR)。通过InterPro登录号IPR000719、PFam登录号PF00069、Prosite登录号PS50011和ProDom登录号PD000001鉴定激酶结构域。此外还鉴定激酶结构域活性位点,如IPR008271。可在该位点引入突变以去除(或降低)激酶活性,这是破坏用于本发明方法的CVL1多肽的C端结构域的生物学功能的方法之一。
可用软件算法来预测多肽的亚细胞定位,或预测跨膜结构域的存在。实施例30中,分别使用TargetP1.1算法和TMHMM2.0算法来预测如SEQID NO:212所示的CLV1多肽在其N端具有信号肽供ER靶向(内质网),且包括跨膜结构域(跨过质体膜)。进而,TMHMM2.0算法预测LRR结构域位于细胞外部(充当胞外受体),同时激酶结构域位于细胞内(充当信号传导物)。
也使用本领域熟知的常规技术可以容易地鉴定结构域和基序,例如通过序列比对鉴定。用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列(覆盖整个序列的)的全局比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMCBioinformatics.2003Jul 10;4:29.MatGAT:使用蛋白质或DNA序列而产生相似性/同一性矩阵的应用)。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构域(如LRR结构域或激酶结构域或本文定义的基序之一)。在下面实施3中以百分比描述的序列同一性值使用上述程序,利用默认参数,针对完整核酸或氨基酸序列/或针对选择的结构域或保守基序上确定。优选CLV1多肽与SEQ ID NO:212(实施例27)具有50%,60%、70%、80%、90%、95%、98%或更高氨基酸序列同一性。在其鉴定后,如本文所述通过破坏所述多肽的C端结构域的生物学功能使CLV1多肽可用于本发明方法。
在一些情况下,可以调整默认参数以调节搜索法的严格性。例如使用BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作“期望”值)以显示严格性较低的匹配。以这种方式,可以鉴定几乎精确的短匹配。以这种方式可以鉴定如SEQ ID NO:237所代表的基序1和如SEQID NO:238所代表的基序2,其中所述的基序均包含于在用于本发明方法中的CLVI多肽内(图11,实施例26)。优选基序1和基序2包含于信号肽和LRR结构域之间。
基序1中的最保守的氨基酸是LXDW,且基序2中最保守的氨基酸XHCXFXGVXCD(其中X是各位置不同的氨基酸的特定子集,如SEQ IDNO:237和SEQ ID NO:238所示)。基序1和基序2中,允许在任意位点具有一个或多个保守性改变。备选或此外,基序1中,允许在任意位点具有一个非保守性改变,基序2中,允许在任意位点具有一个、两个或三个非保守性改变。
天然形式的CLV1多肽一般具有激酶活性并能够自我磷酸化。激酶测试易于实施且是本领域公知的。进而,CLV1多肽能够与植物内(CLV3、KAPP和更多)和体外(如与酵母双杂交测试中的KAPP;Trotochaud等.(1999)Plant Cell 11,393-406)的其他多肽相互作用。在其鉴定后,通过破坏CLV1多肽的C端结构域的生物学功能使所述多肽可用于本发明方法。
实施例31中提供了进一步详述。
用于本发明方法的蛋白质的编码核酸序列不需要是全长核酸序列,因为本发明方法的实施不依赖全长核酸序列的使用。适合用于实施本发明方法的核酸序列实例包括表C中给出的核酸序列,但不限于这些序列。核酸变体可用于实施本发明的方法。这样的核酸变体实例包括用于本发明方法的蛋白质的编码核酸序列的部分、与用于本发明方法的蛋白质的编码核酸序列杂交的核酸序列、用于本发明方法的蛋白质的编码核酸序列的剪接变体、用于本发明方法的蛋白质的编码核酸序列的等位变体,和通过基因改组获得的用于本发明方法的蛋白质的编码核酸序列的变体。现将描述术语部分、杂交序列、剪接变体、等位变体、通过基因改组获得的变体和通过位点定向诱变获得的变体。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达表C中给出的任一核酸序列的部分、或实施例25的表C中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的部分。在其鉴定后,通过破坏所述多肽C端结构域的生物学功能使CLV1多肽可用于本发明方法。
用于本发明方法的部分编码多肽,所述部分落入如文中所定义的具有无功能C端结构域的CLV1多肽的编码核酸序列的定义内。所述部分一般缺少编码C端结构域或其部分的核酸序列(从N端到C端,编码跨膜结构域的核酸序列下游的核酸序列)。优选地,部分是实施例25的表C中给出的任一核酸序列的部分。更优选,部分是SEQ ID NO:211的核酸序列的部分。最优选,部分如SEQ ID NO:209所示。
如本文所定义的具有无功能C端结构域的CLV1多肽的编码核酸序列的部分可以通过对核酸序列进行一个或多个缺失来制备。部分可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便,例如,产生组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比预测的CLV1多肽部分要大。
用于本发明方法的另一核酸变体是在降低的严格条件下、优选在严格条件下,能够与本文所定义的CLV1多肽的编码核酸序列或与本文所定义的部分杂交的核酸序列。术语“杂交”如本文定义。
用于本发明方法的杂交序列编码CLV1多肽,所述CLV1多肽由实施例25的表C中给出的任意氨基酸序列所表示。杂交序列通常长度至少为500或1000个连续核苷酸,优选长度至少为1500或2000个连续核苷酸,更优选长度至少为2500个连续核苷酸,最优选长度至少为2900个连续核苷酸,所述连续核苷酸是表C中给出的任一核酸序列。优选地,杂交序列是能够与表C中给出的任意核酸序列杂交的序列、或与任意这些序列的部分杂交的序列,部分如上文定义。最优选,杂交序列是能够与SEQ IDNO:211所示的核酸序列或其部分杂交的序列。优选地,杂交序列编码包括如本文定义的任一个或多个基序或结构域的氨基酸序列。优选地,杂交序列编码氨基酸序列,当所述氨基酸序列用于构建LRR-RLK系统树(例如图10b所示的)时,趋向聚簇于包含SEQ ID NO:212所示氨基酸序列的多肽组(由括号表示),而不是聚簇于LRR-RLK多肽的任何其他组。通过破坏被编码多肽的C端结构域的生物学功能使此类杂交序列可用于本发明方法,例如通过使用本文所讨论的任意方法(用于破坏生物学功能)。
本发明提供增加植物中产量相关性状的方法,其包括在植物中引入和表达能够与表C中给出的任一核酸序列杂交的核酸序列,或包括在植物中引入和表达能够与表C中给出的任意核酸序列的直向同源物、旁系同源物或同源物的编码核酸序列杂交的核酸序列。通过破坏被编码多肽的C端结构域的生物学功能使此类杂交序列可用于本发明方法,例如通过使用本文所讨论的任意方法(用于破坏生物学功能)。
用于本发明方法的另一核酸变体是编码具有无功能C端结构域的CLV1多肽的剪接变体。术语“剪接变体”如本文定义。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达表C中给出的核酸序列中任一个的剪接变体,或表C中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的剪接变体。通过破坏被编码多肽的C端结构域的生物学功能使此类剪接变体可用于本发明方法,例如通过使用本文所讨论的任意方法(用于破坏生物学功能)。
优选剪接变体是由SEQ ID NO:211所示的核酸序列的剪接变体或SEQ ID NO:212的直向同源物或旁系同源物的编码核酸序列的剪接变体。优选地,当剪接变体编码的氨基酸序列用于构建LRR-RLK系统树(例如图10b所示的)时,趋向聚簇于包含SEQ ID NO:212所示氨基酸序列的多肽组(由括号表示),而不是聚簇于LRR-RLK多肽的任何其他组。通过破坏被编码多肽的C端结构域的生物学功能使此类剪接变体可用于本发明方法,例如通过使用本文所讨论的任意方法(用于破坏生物学功能)。
用于实施本发明方法的另一核酸变体是具有无功能C端结构域的CLV1多肽的编码核酸序列的等位变体。等位基因或等位变体是给定基因的替代形式,位于相同染色体位置内。等位变体天然存在,且包含在本发明方法内的是这些天然等位基因的用途。等位变体包含单核苷酸多态性(SNP)和小插入/缺失多态性(INDEL)。INDEL的尺寸通常小于100bp。SNP和INDEL形成在大部分生物的天然存在性多态性株系中序列变体的最大集合。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达表C中给出的核酸序列中任一个的等位变体,或包括在植物中引入和表达表C中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的等位变体。通过破坏被编码多肽的C端结构域的生物学功能使此类等位变体可用于本发明方法,例如通过使用本文所讨论的任意方法(用于破坏生物学功能)。
优选地,等位变体是SEQ ID NO:211的等位变体,或SEQ ID NO:212的直向同源物或旁系同源物的编码核酸序列的等位变体。优选地,当等位变体编码的氨基酸序列用于构建LRR-RLK系统树(例如图10b所示的)时,趋向聚簇于包含SEQ ID NO:212所示氨基酸序列的多肽组(由括号表示),而不是聚簇于LRR-RLK多肽的任何其他组。通过破坏被编码多肽的C端结构域的生物学功能使此类等位变体可用于本发明方法,例如通过使用本文所讨论的任意方法(用于破坏生物学功能)。
用于本发明方法的又一核酸变体是通过基因改组获得的核酸变体。基因改组或定向进化也可以用于产生编码具有无功能C端结构域的CLV1多肽的核酸序列的变体。这包括DNA改组的重复,继之以适当筛选和/或选择,以产生编码具有无功能C端结构域的CLV1多肽的核酸序列的变体或其部分(Castle等(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达表C中给出的核酸序列中任一个的变体,或包括在植物中引入和表达表C中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的变体,所述变体核酸序列通过基因改组获得。
优选地,当通过基因改组获得的变体核酸编码的氨基酸序列用于构建LRR-RLK系统树(例如图10b所示的)时,趋向聚簇于包含SEQ IDNO:212所示氨基酸序列的多肽组(由括号表示),而不是聚簇于LRR-RLK多肽的任何其他组。通过破坏被编码多肽的C端结构域的生物学功能使此类通过基因改组获得的变体可用于本发明方法,例如通过使用本文所讨论的任意方法(用于破坏生物学功能)。
此外,还可以通过位点定向诱变获得核酸变体。几种方法可用于实现位点定向诱变;最常用的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编著)。带有产生具有无功能C端结构域的CLV1多肽的编码核酸序列的变体目的的位点定向诱变的靶在实施例31中描述。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达表C中给出的核酸序列中任一个的变体,或包括在植物中引入和表达表C中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的变体,所述变体核酸序列通过位点定向诱变获得。
优选地,当通过位点定向诱变获得的变体核酸序列编码的氨基酸序列用于构建LRR-RLK系统树(例如图10b所示的)时,趋向聚簇于包含SEQ ID NO:212所示氨基酸序列的多肽组(由括号表示),而不是聚簇于LRR-RLK多肽的任何其他组。通过破坏被编码多肽的C端结构域的生物学功能使此类通过位点定向诱变获得的变体可用于本发明方法,例如通过使用本文所讨论的方法(用于破坏生物学功能)。
编码具有无功能C端结构域的CLV1多肽的如下核酸变体是适合实施本发明方法的变体实例:
(i)编码CLV1的核酸序列的部分;或
(ii)能与编码CLV1多肽的核酸序列杂交的核酸序列;或
(iii)编码CLV1多肽的核酸序列的剪接变体;或
(iv)编码CLV1的核酸序列的等位变体;或
(v)通过基因改组获得的编码CLV1多肽的核酸序列;或
(vi)通过位点定向诱变获得的编码CLV1多肽的核酸序列;
其中,(i)至(vi)中的核酸序列编码具有无功能结构域的CLV1多肽。
具有无功能C端结构域的CLV1多肽的编码核酸序列可以来自任何天然或人工的来源。可以通过仔细的人为操作在组成和/或基因组环境上修饰所述核酸序列的天然形式。优选具有无功能C端结构域的CLV1多肽的编码核酸序列来自植物,又优选源自双子叶植物,更优选源自十字花科,最优选核酸来自拟南芥。
因此本文任何具有无功能C端结构域的CLV1多肽的引用意指如上文定义的具有无功能C端结构域的CLV1多肽。编码此类具有无功能C端结构域的CLV1多肽的任意核酸序列适合用于实施本发明方法。
本发明也包括可通过本发明方法获得的植物或其部分(包括种子)。所述植物或其部分包含如上文定义的编码具有无功能C端结构域的CLV1多肽的核酸转基因。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。所述基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含:
(a)编码如上面所定义的具有无功能C端结构域的CLV1多肽的核酸序列;
(b)一个或多个能够驱动(a)的核酸序列表达的调控序列;和任选地
(c)转录终止序列。
在一实施例中,构建体的调控序列是用于在幼嫩生长组织中表达的组织特异性启动子。用于在幼嫩生长组织(young expanding tissue)中表达的组织特异性启动子的实例是β扩展蛋白启动子。
植物用包含目的序列的载体转化(即如上文定义的编码具有无功能C端结构域的CLV1多肽的核酸序列)。本领域技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。术语“调节元件”、“调控序列”和“启动子”如本文定义。术语“有效连接”也在本文定义。
有利地,可以使用任何类型的启动子驱动核酸序列的表达。术语“启动子”和“植物启动子”如本文定义。
所述启动子可以是如本文定义的组成型启动子,。备选地,启动子可以是如本文定义的诱导性启动子。此外或备选地,可以是如本文定义的器官特异性或组织特异性启动子。
在一个实施方案中,编码如上文定义的具有无功能C端结构域的CLV1多肽的核酸序列,如SEQ ID NO:209所示的核酸序列,与能够优选在幼嫩生长组织或顶端分生组织中表达核酸序列的启动子有效连接。优选地,能够优选在幼嫩生长组织中表达核酸序列的启动子具有与β扩展蛋白启动子相当的表达谱。更优选地,能够优选在幼嫩生长组织中表达核酸序列的启动子是能够在茎或根的细胞伸展区(expansion zone)驱动表达的启动子。最优选,能够优选在幼嫩生长组织中表达核酸序列的启动子是β扩展蛋白启动子(SEQ ID NO:241)。
为鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可以通过将该启动子与报道基因有效连接并分析该报道基因在植物多种组织的表达水平和模式而进行分析。合适的公知报道基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如本发明方法中所用的一种启动子)的启动子强度和/或表达模式比较。备选地,启动子强度可以使用本领域已知方法如Northern印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996GenomeMethods 6:986-994),通过定量mRNA水平或通过将本发明方法中所用核酸序列的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较而分析。通常“弱启动子”意指驱动编码序列在低水平上表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。术语“终止子”在本文定义。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。此类序列是公知的或本领域技术人员可易于获得的。
内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg,Mol.Cell biol.8:4395-4405(1988);Callis等,Gens Dev 1:1183-1200(1987))。基因表达的此类内含子增强作用一般在位于转录单位5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:The Maize Handbook,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5,UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包含于特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。术语“选择性标记”、“选择性标记基因”或“报道基因”的描述见本文“定义”部分。
本发明也提供用于产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,其包括在植物中引入和表达如上文所定义的编码具有无功能C端结构域的CLV1多肽的任意核酸序列。术语“转基因的”、“转基因”或“重组”的含义如本文定义。
更具体地,本发明提供用于产生具有增强的产量相关性状的转基因植物的方法,其包括:
(i)在植物或植物细胞中引入和表达编码具有无功能C端结构域的CLV1多肽的核酸序列或其变体;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
核酸序列可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸序列优选地通过转化引入植物。术语“引入”或“转化”如本文定义。
遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R Wu、Potrykus或
Figure A20078004357701061
和Willmitzer的上述出版物。
通常在转化后,选择一种或多种标记存在的植物细胞或细胞群体,其中所述的标记由与目的基因一起共转移的植物可表达的基因编码,随后将转化的材料再生成整株植物。为了选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。另一种可能性包含在使用合适选择剂的琼脂平板上生长种子(根据需要在消毒之后),使得仅转化的种子可以生长成植物。或者,转化的植物通过上述那些选择标记的存在筛选。
在DNA转移和再生后,推测的转化植物还可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或此外,新引入的DNA的表达水平可以使用Northern和/或Western,这两种技术是本领域技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交并选择纯合的第二代(或T2)转化体,并且T2植物可以随后通过经典育种技术进一步增殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如被转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过文中所述的任意方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任意前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的一种或多种基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有如上文定义的编码具有无功能C端结构域的CLV1多肽的分离的核酸序列。本发明优选的宿主细胞是植物细胞。
宿主植物对于本发明方法中所用核酸序列或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的核酸序列不位于所述植物基因组中该核酸序列的天然基因座内,所述核酸序列有可能同源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸序列或在本发明方法中所用核酸序列处于植物基因组中该核酸序列的天然位置内,然而其序列相对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到修饰。转基因优选地理解为意指本发明核酸序列在基因组中的非天然基因座内表达,即发生核酸序列的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及来自,优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
在本领域内详细记载了用于增加核酸序列或基因、或基因产物表达的方法并且它们包括例如,由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。可以在非异源形式的多核苷酸的适宜位置(一般是上游)内导入作为启动子或增强子元件的分离核酸序列,以便上调表达。例如,内源性启动子可以通过突变、缺失和/或置换而在体内改变(见Kmiec,美国专利号5,565,350;Zarling等,PCT/US93/03868),或可以将分离的启动子以相对于本发明基因的正确方向及距离导入植物细胞,以便控制基因表达。
若需要多肽表达,通常希望在多核苷酸编码区的3’端包括多聚腺苷化区。多聚腺苷化区可以来自天然基因、来自多种其它植物基因或来自T-DNA。待添加的3’端序列可以来自例如胭脂碱合酶或章鱼碱合酶基因或备选地来自另一植物基因或更不优选来自任何其它真核基因。
如上所述也可以添加内含子序列。
其它调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。
如上文所述,用于增加编码具有无功能C端结构域的CLV1多肽的核酸序列的表达的优选方法是在植物中引入和表达编码具有无功能C端结构域的CLV1多肽的核酸序列;然而,实现本方法的效果即增强产量相关性状也可以使用其他公知技术来实现。此类技术的实例包括T-DNA激活标注(Hayashi等,Science(1992)1350-1353),其在本文“定义”部分描述。还可以使用TILLING(定向诱导的基因组局部突变)技术再现本发明的效果。还可以使用同源物重组再现本发明的效果。对这些技术的详述见本文“定义”部分。
本文对增强的产量相关性状的引用意指在植物一个部分或多个部分的生物量(重量)的增加,其包括地上(可收获)部分和/或(可收获)地下部分。
特别地,此类可收获部分是种子,且实施本发明方法产生具有相对于合适的对照植物的种子产量具有增加的种子产量的植物。
术语“产量”和“种子产量”在本文“定义”部分定义。术语“增加”、
“改良的”或“改良”也在本文定义。
增加的种子产量可以表现为下列一种或多种指标:
(i)增加的种子总产量,这包括种子生物量(种子重量)的增加,并且其可以是每棵植株或单粒种子基础上的种子重量增加;
(ii)增加的每株植物圆锥花序数;
(iii)增加的每个圆锥花序的花朵数量;
(iv)增加的种子饱满率;
(v)增加的(饱满)种子数量;
(vi)增加的种子大小(长、宽面积、周长),这也可影响种子的组成;
(vii)增加的种子体积,这也可影响种子的组成;
(viii)增加的收获指数,其表达为可收获部分[如种子]的产量与总生物量的比率;和
(ix)增加的千粒重(TKW),这通过计数饱满种子数量及其总重量,进行外推得到。TKW增加可源于种子大小和/或种子重量的增加。TKW增加可源于胚大小和/或胚乳大小的增加。
种子产量的增加也可以表现为种子大小和/或种子体积的增加。此外,种子产量的增加本身也可以自我表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以产生改良的结构,或可以因改良的结构而出现。
尤其,增强的产量相关性状意指一种或多种以下指标:(i)地上部分生物量的增加;(ii)根生物量的增加;(iii)细根生物量(thin root biomass)的增加;(iv)增加的主圆锥花序数量;(v)增加的每圆锥花序的花数;(vi)增加的总种子产量;(vii)增加的饱满种子数;(viii)增加的总种子数;或(ix)增加的收获指数。因此,根据本发明,提供相对于对照植物增强一项或多项以下产量相关性状的方法:(i)地上部分生物量的增加;(ii)根生物量的增加;(iii)细根生物量的增加;(iv)增加的主圆锥花序数量;(v)增加的每圆锥花序的花数;(vi)增加的总种子产量;(vii)增加的饱满种子数;(viii)增加的总种子数;或(ix)增加的收获指数,所述方法包括增加编码具有无功能C端结构域的CLV1多肽的核酸序列在植物中的表达。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩所栽培的植物数的增加、每株植物穗数的增加、行数、每行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
由于本发明的转基因植物具有增强的产量相关性状,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生与对照植物相比具有增加的生长速率的植物。因而根据本发明,提供相对于对照植物增加植物生长速率的方法,所述方法包括增加如本文定义的CLV1多肽的核酸序列在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增强的产量相关性状的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增强的产量相关性状。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码具有无功能C端结构域的CLV1多肽的核酸序列在植物中表达。
在本发明优选的实施方案中,根据本发明方法的产量和/或生长速率的增加在非胁迫条件下出现。
本发明方法有利地适用于任何植物。本文定义了术语“植物”并也描述了用于本发明方法的合适植物的实例。
根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、高粱和燕麦。
本发明还包括本文所述的编码具有无功能C端结构域的CLV1多肽的核酸序列的用途,和这些具有无功能C端结构域的CLV1多肽用于增强植物中产量相关性状的用途。
编码本文所述的具有无功能C端结构域的CLV1多肽的核酸序列或具有无功能C端结构域的CLV1多肽本身可以用于育种程序中,其中鉴定到可以遗传地与编码具有无功能C端结构域的CLV1多肽的基因连接的DNA标记。所述基因/或核酸序列、或具有无功能C端结构域的CLV1多肽本身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有如上文本发明方法中定义的增强的产量相关性状的植物。
编码具有无功能C端结构域的CLV1多肽的基因或核酸序列的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物进行诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增强产量相关性状的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其他任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码具有无功能C端结构域的CLV1多肽的核酸序列也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有目的表型的株系。编码CLV1多肽的核酸序列的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码CLV1多肽的核酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)MolecularCloning,A Laboratory Manual)可以用编码CLV1多肽的核酸序列探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码具有无功能C端结构域的CLV1多肽的核酸序列在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸序列而实施。实例可见于文中的“定义”部分。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等,(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等,(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等,(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook,(1989)NucleicAcid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
本发明方法产生如前文所述的具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如进一步增强产量性状、对其他非生物和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
附图描述
本发明现在将参考下列附图进行描述,其中:
图1显示根据中国北京大学生物信息中心(CBI)中可用的转录因子拟南芥数据库的所有拟南芥TCP多肽的系统树。圈出包含两个拟南芥旁系同源物At3g27010(也称为AtTCP20或PCF1)和At5g41030(也称为TCP6)的目的进化支。
图2显示了表A的数个植物I类TCP多肽的多重比对(当来自全长核酸序列),使用的是基于改进的ClustalW算法(InforMax,Bethesda,MD,http://www.informaxinc.com)的VNTI AlignX多重比对程序,采用默认设置,空位开放罚分为10,空位延伸罚分为0.05。用于实施本发明方法的多肽序列中的保守TCP结构域(包含bHLH)以深色框出。碱性残基(在连续序列(consensus line)中为黑体)、螺旋-环-螺旋(HLH)和C-端共有基序PGLEL(G/R/A)LSQX1-5G(V/L)L(其中X是任意氨基酸,(SEQ ID NO:65))以浅色框出。HQ富含区(H是组氨酸、Q是谷氨酰胺)同样以浅色框出。
图3A)显示编码碱性-螺旋-环-螺旋(bHLH)编码的表A的I类TCP多肽序列的比对。当考虑从N-端到C-端的多肽序列时,碱性残基在螺旋-环-螺旋之前。3B)是代表用于实施本发明方法的多肽序列的一级结构的草图,从N-端到C-端:包含碱性-螺旋-环-螺旋(bHLH)的保守的TCP结构域、C-端共有基序和HQ富含区。
图4显示用于增加稻中在GOS2启动子控制下的I类TCP多肽编码核酸序列表达的双元载体。
图5详述用于实施本发明方法的I类TCP序列的实例。
图6显示SEQ ID NO:81所示的CAH3多肽的结构域结构。碳酸酐酶结构域(Pfam登录号PF00194)以黑体下划线示出。
图7分别显示用图9中所列的序列构建的系统树(A),以及属于α类CAH3蛋白质序列的多重比对(B)。
图8显示用于增加稻中在原叶绿素酸酯还原酶启动子(PcR)控制下的莱茵衣藻CAH3蛋白质编码核酸表达的双元载体。
图9详述用于实施本发明方法的CAH3序列的实例。
图10(A)显示如SEQ ID NO:212所示的LRR-RLK多肽预测的结构域结构;从N-端到C-端:(i)SP,信号肽;(ii)21LRR,21个亮氨酸-富含重复;(iii)TM,跨膜结构域;和(iv)激酶结构域。垂直的黑线位于跨膜结构域的末端。根据Bommert等,(2004)Development 132:1235-1245。
图10(B)显示Bommert等,(2004)描述的系统树。用于实施本发明方法的多肽序列将聚簇于包含CLV1多肽的进化支(称为“亚家族”A),如图中用括号界定的。CLV1如SEQ ID NO:212所示。
图11显示了表C的数个CLV1多肽序列的多重比对(当来自全长核酸序列),使用的是基于改进的ClustalW算法(InforMax,Bethesda,MD,http://www.informaxinc.com)的VNTI AlignX多重比对程序,采用默认设置,空位开放罚分为10,空位延伸罚分为0.05。信号肽和跨膜结构域以粗线框出(boxed in bold)。LRR结构域(具有21个LRR并以黑色下划线示出)、激酶结构域(具有11个亚结构域并以双线示出),和C-端结构域(每个)的起点和终点以括号标出。基序1(SEQ ID NO:237)和基序2(SEQ ID NO:238)也框出。在基序2中,标出第一个半胱氨酸对和第二个半胱氨酸对(在LRR结构域和跨膜结构域之间)。也标出保守的甘氨酸和激酶结构域的亚结构域IX(SDIX)。激酶结构域的亚结构域IV(SDIV)中的垂直线表示SEQ ID NO:210所示的具有无功能C-端结构域的CLV1多肽末端。
图12显示用于增加稻中在β-扩展蛋白启动子(用于在幼嫩生长组织中表达)控制下的具有无功能C-端结构域的CLV1多肽的拟南芥编码核酸表达的双元载体。
图13详述用于实施本发明方法的CLV1序列的实例。
本发明现在将参考仅作为说明的下列实施例加以描述。下列实施例不意图彻底定义或限制本发明范围。
实施例:PCF1
实施例1:鉴定SEQ ID NO:1和SEQ ID NO:2相关的序列
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与SEQ ID NO:1和/或SEQ ID NO:2相关的(全长cDNA、EST或基因组)核酸序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对SEQ ID NO:1所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。
除了可在NCBI上获得的公共可获得的核酸序列外,还按照与上述的方法相同的方法搜索私人核算序列数据库。
表A提供与SEQ ID NO:1所示的核酸序列和SEQ ID NO:2所示的多肽序列相关的核酸和多肽序列的列表。
表A:用于本发明方法中的与核酸序列(SEQ ID NO:1)相关的核酸序列,及对应的推导多肽。
  名称   状态  名称   数据库登录号   核酸序列ID号   多肽序列ID号
  Arath_TCP20   全长  拟南芥   AK118178At3g27010   1   2
  Arath_TCP6   全长  拟南芥   At5g41030   3   4
  Aqufo_Class I TCP   全长  红花耧斗菜x细毛耧斗菜(Aquilegiaformosa x Aquilegiapubescens)   DR951658DT754291   5   6
  Glyma_Class I TCP   全长  大豆   AI736626.1BI470329.1BG044313.1CA784744.1BF424472.1   7   8
  Goshi_Class I TCP   全长  陆地棉   DT574583DW499958   9   10
  Lyces_Class I TCP   全长  番茄   BW688913BP878035.1BI931745.1   11   12
  Maldo_Class I TCP   全长   驯化苹果   EB153444CN895103   13   14
  Medtr_Class I TCP   全长   蒺藜苜蓿   CG926048.1CA921765.1   15   16
  Nicbe_Class I TCP   全长   本氏烟草   CK296978   17   18
  Ociba_Class I TCP   全长   罗勒   DY322462   19   20
  Orysa_PCF1   全长   稻   NM_001051782Os01g0924400   21   22
  Poptr_Class I TCP   全长   美洲山杨   CX169560.1DT515387.1   23   24
  Sacof_Class I TCP   全长   甘蔗   SCJLRT1023A09.g   25   26
  Soltu_Class I TCP   全长   马铃薯   CK271473.1BQ507674.2   27   28
  Sorbi_Class I TCP   全长   两色蜀黍   CLASS162154.1ED507285.1CW333599.1   29   30
  Vitvi_Class I TCP   全长   葡萄   CB972449EC971921   31   32
  Zeama_Class I TCP_ 1   全长   玉蜀黍   DR826915.1DR794438.1   33   34
  Zeama_Class I TCP_2   全长   玉蜀黍   DR963477.1EE022629.1   35   36
  Allce_Class I TCPpartial 5′   部分   洋葱   CF439613   37   38
  Bradi_Class I TCPpartial 5′   部分   二穗短柄草   DV480032   39   40
  Braol_Class I TCPpartial 5′   部分   甘蓝   BZ446639.1BH464032.1BZ445385.1   41   42
  Brara_ Class I TCPpartial 3′   部分   芜青   DX909657.1DU115108.1   43   44
  Cofca_Class I TCPpartial middle   部分  中粒咖啡  DV701323   45   46
  Helan_Class I TCPpartial 3′   部分  向日葵和Helianthus petiolaris  DY906028DY940311.1   47   48
  Horvu_Class I TCPpartial 3′   部分  大麦  DN181323   49   50
  Linus_Class I TCPpartial middle   部分  亚麻  ContigLU04MC03342_61667197   51   52
  Lotco_Class I TCPpartial 5′   部分  百脉根  BW630043.1   53   54
  Pethy_Class I TCPpartial middle   部分  碧冬茄  CV296461CV297628   55   56
  Prupe_Class I TCPpartial 3′   部分  桃  BU044166.   57   58
  Ricco_Class I TCPpartial 3′   部分  蓖麻  EG685326.1EG671551   59   60
  Salmi_Class I TCPpartial 3′   部分  丹参  CV163534   61   62
  Zinel_Class I TCPpartial middle   部分  百日菊  AU307217   63   64
  Cicen_Class I TCPpartial 3’   部分  栽培菊苣,菊苣  EL361878;EH709336   70   71
  Frave_Class I TCPpartial   部分  野草莓  EX657224   72   73
  Jugsp_Class I TCPpartial middle   部分  印度黑核桃x胡桃  EL896093   74   75
  Pangi_Class I TCPpartial 3’   部分  人参  CN846083   76   77
  Pontr_Class I TCPpartial 3’   部分  枸桔  CX644761   78   79
实施例2:相关多肽序列的比对
来自Vector NTI(Invitrogen)的AlignX基于普遍使用的渐进比对的聚类算法(Clustal algorithm)(Thompson等,(1997)Nucleic Acids Res25:4876-4882;Chenna等,(2003)Nucleic Acids Res 31:3497-3500)。可使用邻接聚类算法构建系统树。空位开放罚分的缺省值为10,空位延伸罚分的缺省值为0.1,选择的权重矩阵是Blosum 62(如果比对多肽)。在一些情况下,手工调整对于更好的优化多肽序列之间的比对,特别是在基序比对的情况下是需要的。
图1提供根据中国北京大学生物信息中心(CBI)中可用的转录因子拟南芥数据库的TCP系统树。圈出包含两个拟南芥旁系同源物At3g27010(也称为AtTCP20或PCF1)和At5g41030(也称为TCP6)的目的进化支。任何落入这个进化支的多肽(在新的如本文上述的多重比对步骤之后)被认为可用于实施本文所述的本发明的方法。
用于实施本发明方法的表A的I类TCP多肽的多重序列比对(当来自全长核酸序列)的结果显示于本申请的图2中。用于实施本发明方法的多肽序列中的保守TCP结构域(包含bHLH碱性-螺旋-环-螺旋)以深色框出。碱性残基(在连续序列中为黑体)、螺旋-环-螺旋(HLH)和C-端共有基序PGLEL(G/R/A)LSQX1-5G(V/L)L(其中X是任意氨基酸,(SEQ IDNO:65))以浅色框出。HQ富含区(H是组氨酸、Q是谷氨酰胺)同样以浅色框出。
在这个基序中,可以在任何位点具有一个或多个保守性改变,和/或在任何位点具有一个或三个非保守性改变。
实施例3:计算可用于实施本发明方法的多肽序列之间的全局百分比同一性(global percentage identity)
使用可在本领域内获得的方法中的一个方法MatGAT(矩阵全局比对工具(Matrix Global Alignment Tool))软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质或DNA序列而产生相似性/同一性矩阵的应用,Campanella JJ,Bitincka L,Smalley J;由Ledion Bitincka托管的软件),确定可以用于实施本发明的方法的全长多肽序列之间的全局相似性和同一性百分比。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数有:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围(将部分多肽序列排除在外)的全局相似性和同一性的软件分析结果示于表A1。对角线上方给出同一性百分比,而对角线下方给出相似性百分比。
可用于实施本发明方法的多肽序列与SEQ ID NO:2之间的百分比同一性可以为低至29%的氨基酸同一性。
表A1:全长多肽序列范围的全局相似性和同一性的MatGAT结果。
 Full length   1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18
 1.AqufoCLASS I TCP   46.4   35.3   52.6   60.6   48.8   57   50.3   47.9   56.3   39.5   55.9   38.7   48.4   38.8   64.6   37.1   39
 2.ArathTCP20TCP   62.1   40.4   52.1   57.4   48.4   56.2   49.2   46.9   53.7   41.6   54.1   41.3   51.2   41.6   58.8   42.6   43.1
 3.ArathTCP6   48.5   52.2   32.1   34.8   31.3   33.4   33.7   30.9   35.4   30.2   32.6   30.3   34.2   29.8   35.5   30.4   30.8
 4.GlymaCLASS I TCP   61.2   64.1   43.8   68   52.6   68.2   54.9   55.5   61.3   40.4   64.6   37.1   56.3   39.3   73.2   38.4   39.1
 5.GoshiCLASS I TCP   70.2   68.8   50.3   73   62.5   75.2   58.1   59.4   68.1   41.4   74.4   41.8   62.7   41.4   84.3   40.8   41.3
 6.LycesCLASS I TCP   61.2   61.5   49.3   61.2   73.3   57.4   50.7   69.4   56.9   37.9   54.7   37.5   91.8   37.9   63   37.8   38.4
 7.MaldoCLASS I TCP   67.3   67.9   46.4   74.5   82.9   67   55   57.6   63   42.7   73.4   41.2   58.3   42.9   80.6   42.7   44.1
 8.MedtrCLASS I TCP   63.1   62.7   51.1   63.2   72   67.3   66.7   50.8   56.3   39.4   56.1   39.3   50.7   40.5   60.4   38.5   39.8
 9.NicbeCLASS I TCP   60.2   60.8   45.8   65.8   71.7   77.3   67.3   64.4   56.3   37.9   54.4   35.3   71   36   64.7   34.1   35.6
 10.OcibaCLASS I TCP   68.6   65.3   50.8   70.7   80   71.7   73.5   70.7   70.4   39   62.5   38.5   57.6   39.7   70.6   41   41.4
 11.OrysaPCF1   52.7   57.4   46.4   53.6   54.9   49.8   53.9   52.1   52.7   51.1   41.1   69.6   38.2   70.6   41.8   68.4   69.3
 12.PoptrCLASS I TCP   70.6   68.1   46.6   74.8   82.8   65.9   83.2   67.5   68.8   74.4   55.3   42.5   55.8   42.5   73.6   42.5   43
 13.SacofCLASS I TCP   53.5   53.5   45.5   50.1   55.8   52.3   53.9   53.9   52.3   54.2   79.2   55.9   37.5   87.5   38.9   84.9   83.9
 14.SoltuCLASS I TCP   60.5   62.4   49.5   64.3   73.7   94   67   66.5   79   71.4   48.9   69.7   51.9   37.9   65.9   37.6   37
 15.SorbiCLASS I TCP   53.2   55.4   44.3   51.6   55.4   52   56.9   53.5   51.4   55.7   80   56.6   90.5   51.1   40.9   86.1   89.4
 16.VitviCLASS I TCP   73.5   71   50.3   76.5   92   72.6   85.4   74.3   78   81.8   53.9   82.2   53.9   76.7   53.8   40.1   41.4
  17.ZeamaCLASSITCP1   53.1   54   43.8   55.7   54.6   51.2   55.6   52.8   52.2   56.2   78.4   57.4   88.6   49.7   90.5   53.7   84.9
  18.ZeamaCLASS I TCP2   54.3   57.5   43.2   53   57.1   53   59.2   57.5   51.7   60.3   78.5   58.4   89.2   52.1   90.5   56.5   87.7
如表A2所示,如果同一性计算在保守的TCP结构域(包含bHLH,共69个毗连的氨基酸,例如对于SEQ ID NO:2,保守的TCP结构域如SEQ ID NO:66所示)和用于实施本发明方法的多肽之间进行,百分比同一性可能大幅提高。保守的TCP结构域和用于实施本发明方法的多肽序列之间的百分比同一性在65%和100%氨基酸同一性之间。
表A2:多肽序列之间的保守性TCP结构域(共69个毗连的氨基酸)范围的全局相似性和同一性的MatGAT结果。
  ConservedTCP domain   1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18
  1.AqufoPCF1CD   91.3   68.1   91.3   89.9   91.3   88.4   91.3   89.9   89.9   88.4   91.3   88.4   91.3   88.4   91.3   88.4   88.4
  2.ArathPCF1CD   95.7   68.1   94.2   95.7   95.7   91.3   95.7   94.2   97.1   91.3   94.2   91.3   95.7   91.3   94.2   91.3   91.3
  3.ArathTCP6CD   84.1   84.1   66.7   66.7   66.7   65.2   66.7   66.7   66.7   65.2   66.7   65.2   66.7   65.2   66.7   65.2   65.2
  4.GlymaPCF1CD   94.2   98.6   82.6   98.6   98.6   97.1   95.7   95.7   97.1   89.9   100   89.9   98.6   89.9   100   89.9   89.9
  5.GoshiPCF1CD   94.2   98.6   84.1   100   97.1   95.7   94.2   94.2   98.6   88.4   98.6   88.4   97.1   88.4   98.6   88.4   88.4
  6.LycesPCF1CD   95.7   100   82.6   98.6   98.6   95.7   94.2   97.1   98.6   91.3   98.6   91.3   100   91.3   98.6   91.3   91.3
  7.MaldoPCF1CD   92.8   97.1   81.2   98.6   98.6   97.1   92.8   94.2   94.2   89.9   97.1   89.9   95.7   89.9   97.1   89.9   89.9
  8.MedtrPCF1CD   94.2   98.6   82.6   100   100   98.6   98.6   92.8   92.8   89.9   95.7   89.9   94.2   89.9   95.7   89.9   89.9
  9.NicbePCF1CD   94.2   97.1   79.7   95.7   95.7   97.1   94.2   95.7   95.7   91.3   95.7   91.3   97.1   91.3   95.7   91.3   91.3
  10.OcibaPCF1CD   95.7   100   84.1   98.6   98.6   100   97.1   98.6   97.1   89.9   97.1   89.9   98.6   89.9   97.1   89.9   89.9
  11.OrysaPCF1   94.2   98.6   82.6   97.1   97.1   98.6   95.7   97.1   95.7   98.6   89.9   100   91.3   100   89.9   100   100
  12.PoptrPCF1CD   94.2   98.6   82.6   100   100   98.6   98.6   100   95.7   98.6   97.1   89.9   98.6   89.9   100   89.9   89.9
  13.SacofPCF1CD   94.2   98.6   82.6   97.1   97.1   98.6   95.7   97.1   95.7   98.6   100   97.1   91.3   100   89.9   100   100
  14.SoltuPCF1CD   95.7   100   82.6   98.6   98.6   100   97.1   98.6   97.1   100   98.6   98.6   98.6   91.3   98.6   91.3   91.3
  15.SorbiPCF1CD   94.2   98.6   82.6   97.1   97.1   98.6   95.7   97.1   95.7   98.6   100   97.1   100   98.6   89.9   100   100
  16.VitviPCF1CD   94.2   98.6   82.6   100   100   98.6   98.6   100   95.7   98.6   97.1   100   97.1   98.6   97.1   89.9   89.9
  17.ZeamaPCF11CD   94.2   98.6   82.6   97.1   97.1   98.6   95.7   97.1   95.7   98.6   100   97.1   100   98.6   100   97.1   100
  18.ZeamaPCF12CD   94.2   98.6   82.6   97.1   97.1   98.6   95.7   97.1   95.7   98.6   100   97.1   100   98.6   100   97.1   100
实施例4:鉴定用于实施本发明方法的多肽序列中包含的结构域
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索常用的标签数据库的整合界面。InterPro数据库将这些数据库结合起来,它们利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息,以获得蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
SEQ ID NO:2所示多肽序列的InterPro扫描结果示于表A3。
表A3:SEQ ID NO:2所示多肽序列的InterPro扫描结果
  数据库   登录号   登录名称
  InterPro   IPR005333   TCP转录因子
  PFAM   PF03634   TCP
TCP结构域包含碱性螺线-环-螺旋(bHLH)。TCP结构域SEQ ID NO:2如SEQ ID NO:66所示。
可使用来自ExPASy服务器的软件程序,特别是ProtParam工具(Gasteiger E等人(2003)ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res 31:3784-3788)计算一级氨基酸组成(以%表示),以确定多肽区域是否富含特定的氨基酸(例如在酸性框内)。然后可以将目的多肽序列的组成与Swiss-Prot蛋白质序列数据库中的平均氨基酸组成(以%表示)比较。
用于实施本发明方法的多肽的多序列比对的目测显示,在多肽的保守C端基序1和C末端之间存在富含组氨酸(His或H)和谷氨酰胺(Gln或Q)的区域,即HQ富含区。该低复杂性的HQ富含区包括至少4个,优选5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个仅H残基、或者仅Q残基、或者H和Q残基的组合(以任意比例)。该HQ区在图2中框出。
实施例5:预测用于实施本发明方法的多肽序列的二级结构
如Cubas等(1999)Plant J 18(2):215-222所述,在两类TCP转录因子中均发现预测的非规范性碱性螺旋-环-螺旋(bHLH)。该预测的二级结构的位置示于图3A。当考虑到多肽序列从N-端到C-端,碱性残基在螺旋-环-螺旋的前面。
图3B是代表用于实施本发明方法的多肽序列的一级结构的草图,从N-端到C-端:包含碱性-螺旋-环-螺旋(bHLH)的保守的TCP结构域、C-端共有基序1和HQ富含区。
实施例6:用于实施本发明方法的多肽序列相关的检测
SEQ ID NO:2所示的多肽序列是具有DNA结合活性的转录因子。这两类共有DNA结合序列鉴定为:1类是GGNCCCAC,而II类是GTGGNCCC。转录因子结合特定DNA序列的能力可以通过电泳迁移率变动分析(EMSA;也称为凝胶阻滞分析)测定,所述电泳迁移率变动分析是本领域众所周知的,并特定对TCP有报导,Kosugi&Ohashi(2002)Plant J 30:337-348,和Li等人,(2005)PNAS 102(36):12978-83。还被Kosugi&Ohashi报导为检测二聚化模式和特异性的方法,其例如使用酵母双杂交系统,而Li等描述了表征TCP结合的启动子的染色质免疫沉淀试验。这两篇论文中描述的试验是本领域众所周知的,均可用于表征TCPI类转录因子。
实施例7:克隆SEQ ID NO:1所示的核酸序列
除非另外声明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第三版Cold Spring Harbor LaboratoryPress,CSH,New York)中或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOS ScientificPublications Ltd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant MolecuIar Biology Labfax(1993)中描述。
本发明方法中所用的核酸序列通过PCR,使用拟南芥幼苗cDNA文库(在pCMV Sport 6.0;InVitrogen,Paisley,英国)作为模板而扩增。在标准条件下使用Hifi Taq DNA聚合酶,利用在50μl PCR混合物中的200ng模板进行PCR。所用引物是
-prm01501SEQ ID NO:68;有义,AttB1位点是小写字体:
5’-ggggacaagtttgtacaaaaaagcaggcttcacaATGGATCCCAAGAACCTAA-3’;和
-prm01502(SEQ ID NO:69;反义,互补AttB2位点是小写字体:
5’-ggggaccactttgtacaagaaagctgggtTTTTAACGACCTGAGCCTT-3’,
其包括用于Gateway重组的AttB位点。扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为Gateway技术的构成部分从Invitrogen购买。
实施例8:使用如SEQ ID NO:1所示的核酸序列构建表达载体
进入克隆随后在LR反应中与用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择性标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ IDNO:67)位于这种Gateway盒的上游。
在LR重组步骤后,产生的表达载体(图4)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例9:植物转化
稻转化
含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中温育4周后,将盾片衍生的胚发生性愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃温育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温室中培育。
一个构建体产生大约35个独立T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3-5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例10:表型评价方法
10.1评价准备
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下6个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048x1536像素,1600万颜色)。
10.2统计分析:F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
10.3参数测量
生物量相关参数的测量
从播种期到成熟期,植物多次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
植物地上面积(或者说叶生物量)通过计数区别于背景的地上植物部分数码图像的像素总数而确定。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值(physicalsurface value)。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。地上面积在植物达到其最大叶生物量的时间点取值。早期活力表现为萌发后三周的植物(幼苗)地上面积。根生物量增加表现为总根生物量增加(测量为植物生命期间观察到的根最大生物量);或者表现为根/茎指数的增加(测量为根和茎的活跃生长期中根生物量和茎生物量之间的比例)。
种子相关参数的测量
收获成熟的主圆锥花序、计数、袋装、用条形码标记,然后在37℃下在烘箱中干燥3天。然后对圆锥花序脱粒,收集所有种子和进行计数。使用鼓风机将饱满谷壳与空谷壳分离。弃去空谷壳,然后对剩余级分再次计数。在分析天平上称取饱满谷壳的重量。通过计数在分离步骤后留下的饱满谷壳的数目来确定饱满种子的数目。通过称取从植物收获的所有饱满谷壳的重量来测量总的种子产量。通过计数从植物收获的谷壳的数目来测量每株植物的总的种子数目。根据计数的饱满种子的数目和其总重量推算千粒重(TKW)。收获指数(HI)在本发明定义为种子总产量和地上面积(mm2)之间的比率乘以因子106。每圆锥花序的花的总数在本发明定义为种子总数与成熟的主圆锥花序的数目之间的比率。种子饱满率在本发明定义为饱满种子的数目占种子(或小花)总数的百分比。
实施例11:转基因植物的表型评价结果
表A4中给出了表达用于本发明方法的核酸序列的转基因稻植物的评价结果。还显示转基因植物和对应的失效合子之间的差异百分数,来自F检验的P值低于0.05。
与对照植物(在这种情况下,失效合子)相比,根/茎指数(root/shootindex)、种子产量、收获指数和千粒重(TKW)在表达用于实施本发明方法的核酸序列的转基因植物中显著增加。
表A4:表达用于实施本发明方法的核酸序列的转基因稻植物的评价结果。
  性状   T1世代增加%
  地上部分面积   -3
  根/茎指数   4
  种子总产量   7
  收获指数   9
  TKW   6
实施例12:其他作物转化
玉米转化
玉米的转化根据对Ishida等(1996.Nature Biotech 14745-50)描述方法的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其他基因型也可以成功地使用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
小麦转化
小麦的转化用Ishida等Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养平板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切下并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
油菜/卡诺拉油菜转化
使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其他品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植体的切口端浸入细菌混悬液而接种。外植体随后在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗切下并转移至苗伸长培养基(含0.5mg/lBAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
苜蓿转化
苜蓿的再生性克隆使用(McKersie等,1999Plant Physiol 119:839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其他商业苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中(Walker等,1978Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1pMP90(MeKersie等,1999Plant Physiol 119:839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
棉花转化
根据US 5,159,135中描述的方法,使用根瘤农杆菌(Agrobacteriumtumefaciens)转化棉花。棉籽在次氯酸钠溶液中表面消毒20分钟,并用含500μg/ml头孢氨噻的蒸馏水洗涤。然后将棉籽转移至含有50μg/ml苯菌灵(benomyl)的SH-培养基中萌发。取出4-6天龄幼苗的下胚轴,切成0.5厘米的小块,并置于0.8%琼脂上。用农杆菌悬液(大约108个细胞每毫升,由转化有目的基因和合适的选择标记的过夜培养物稀释得到)接种下胚轴外植体。室温和光照下3天后将组织转移至固体培养基(1.6g/l脱乙酰吉兰糖胶),所述培养基具有具有Murashige和Skoog盐以及维生素B5(Gamborg等,Exp.Cell Res.50:151-158(1968)),0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤(6-furfurylaminopurine),750μg/ml MgCl2,以及为了杀死残留的细菌的50-100μg/ml头孢氨噻和400-500μg/ml羟苄西林。2-3个月(每4-6周继代培养一次)后分离各个细胞系,并为了组织扩增而进一步培养在选择性培养基上(30℃,16小时的光周期)。转化的组织随后进一步培养在非选择性培养基上2-3个月,以产生体细胞胚。至少4毫米长的外观健康的胚转移至具有细蛭石中的SH培养基的试管中,所述培养基补充有0.1mg/l吲哚乙酸、6糠氨基嘌呤和赤霉烯酸。胚在30℃,16小时的光周期下培养,且2-3叶期的小植株转移到具有蛭石和营养物的花钵中。植物硬化并随后移到温室中进一步培育。
实施例13:非生物胁迫筛选的实例
干旱筛选
在正常条件下在花盆土中培养来自所选择数目的事件的植物,直到进入抽穗期。然后将其转移到“干燥”区域,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。详细记录正常条件下培养的生长和产量参数。
盐胁迫筛选
在由椰子纤维和argex(3比1的比例)制成的基质上培养植物。在将幼苗移植至温室后的前两周使用正常的营养液。前两周过后,向营养液中添加25mM的盐(NaCl),直到收获植物为止。详细记录正常条件下培养的生长和产量参数。
减少的养分(氮)可用性筛选
在除营养液以外正常的条件下在花盆土中培养来自6个事件的植物(T2种子)。从植物移植到成熟一直用特定的营养液对花盆浇水,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。详细记录正常条件下培养的生长和产量参数。
实施例:CAH3
实施例14:鉴定SEQ ID NO:80和SEQ ID NO:81相关的序列
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与SEQ ID NO:80相关的(全长cDNA、EST或基因组)序列和/或SEQ ID NO:81相关的蛋白质序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对SEQ ID NO:80所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。
表B提供与SEQ ID NO:80所示的核酸序列和SEQ ID NO:81所示的蛋白质序列相关的核酸和蛋白质序列的列表。
表B:用于本发明方法中的与核酸序列(SEQ ID NO:80)相关的核酸序列,及对应的推导多肽。
  名称   来源生物   核酸SEQ IDNO:   多肽SEQ IDNO:   数据库登录号   状态
  CrCAH3   莱茵衣藻   80   81   /   全长
  CrCAH3-2   莱茵衣藻   82   83   U40871   全长
  AtCAH3   拟南芥   84   85   NP_001031206   全长
  MtCAH3   蒺藜苜蓿   86   87   ABE93115   全长
  MtCAH3-2   蒺藜苜蓿   88   89   ABE93118   全长
  AtCAH3-2   拟南芥   90   91   At1g70410   全长
  OsCAH3   稻   92   93   Os09g0464000   全长
  OsCAH3-2   稻   94   95   NP_001065776   全长
  DsCAH3   杜氏盐藻   96   97   AF190735   全长
  DsCAH3-2   杜氏盐藻   98   99   AAF22644   全长
  CrCAH3-3   莱茵衣藻   100   101   P24258   全长
  CrCAH3-4   莱茵衣藻   102   103   BAA14232   全长
  PpCAH3   小立碗藓   104   105   CAH58714   全长
  AtCAH3-3   拟南芥   106   107   At5g14740   全长
  DsCAH3-3   杜氏盐藻   108   109   P54212   全长
  AtCAH3-4   拟南芥   110   111   At3g52720   全长
  AtCAH3-5   拟南芥   112   113   At5g56330   全长
  AtCAH3-6   拟南芥   114   115   At5g04180   全长
  NlCAH3   野生种烟草x花烟草   116   117   Q84UV8   全长
  FbCAH3   黄顶菊   118   119   P46510   全长
  HvCAH3   大麦   120   121   P40880   全长
  CrCAH3-5   莱茵衣藻   122   123   AAB19183   全长
  OsCAH3-3   稻   124   125   Os01g0639900   全长
  AtCAH3-7   拟南芥   126   127   At3g01500   全长
  FpCAH3   Flaveria pringlei   128   129   P46281   全长
  FlCAH3   Flaveria Iinearis   130   131   P46512   全长
  FbrCAH3   黄花菊   132   133   P46511   全长
  NpCAH3   野生种圆锥烟草   134   135   BAA25639   全长
  NtCAH3   烟草   136   137   P27141   全长
  PtCAH3   欧洲山杨x美洲山杨   138   139   AAC49785   全长
  PtCAH3-2   欧洲山杨x美洲山杨   140   141   AAB65822   全长
  AtCAH3-8   拟南芥   142   143   AT1G23730   全长
  SoCAH3   菠菜   144   145   P16016   全长
  PsCAH3   豌豆   146   147   CAA36792   全长
  MtCAH3-3   蒺藜苜蓿   148   149   ABE84842   全长
  MtCAH3-4   蒺藜苜蓿   150   151   ABE93117   全长
  AtCAH3-9   拟南芥   152   153   At1g08080   全长
  FpCAH3-2   Flaveria pringlei   154   155   ABC41658   全长
  FICAH3-2   Flaveria linearis   156   157   ABC41659   全长
  AtCAH3-10   拟南芥   158   159   At1g19580   全长
  GhCAH3   陆地棉   160   161   DT561379   全长
  LeCAH3   番茄   162   163   BT014370   全长
  ZmCAH3   玉蜀黍   164   165   U08403   全长
  ZmCAH3-2   玉蜀黍   166   167   U08401   全长
  UpCAH3   类黍尾稃草   168   169   U19741   全长
  UpCAH3-2   类黍尾稃草   170   171   U19739   全长
  CrCAH3-6   莱茵衣藻   172   173   AAR82948   全长
  CrCAH3-7   莱茵衣藻   174   175   AAS48197   全长
  OsCAH3-4   稻   176   177   AK103904   全长
  OsCAH3-5   稻   178   179   Os08g0470200   全长
  DcCAH3   黄薯蓣   180   181   X76187   全长
  DbCAH3   薯蓣   182   183   AB178473   全长
  DaCAH3   参薯   184   185   AF243526   全长
  OsCAH3-6   稻  186   187   Os08g0423500   全长
  OsCAH3-7   稻  188   189   Os12g0153500   全长
  AtCAH3-11   拟南芥  190   191   At4g20990   全长
  AtCAH3-12   拟南芥  192   193   At1g08065   全长
  AaCAH3   夏侧金盏花   194   /   全长
  GmCAH3   大豆   195   /   全长
  BnCAH3   欧洲油菜   196   /   全长
  ZmCAH3-3   玉蜀黍   197   /   全长
  TaCAH3   普通小麦   198   /   全长
  GmCAH3-2   大豆   199   /   全长
  HvCAH3-2   大麦   200   /   全长
  ZmCAH3-4   玉蜀黍   201   /   全长
  BnCAH3-2   欧洲油菜   202   /   全长
实施例15:相关多肽序列的比对
来自Vector NTI(Invitrogen)的AlignX基于普遍使用的渐进比对的聚类算法(Clustal algorithm)(Thompson等人(1997)Nucleic Acids Res25:4876-4882;Chenna等人(2003).Nucleic Acids Res 31:3497-3500)。可使用邻接聚类算法构建系统树。空位开放罚分的缺省值为10,空位延伸罚分的缺省值为0.1,选择的权重矩阵是Blosum 62(如果比对多肽)。
在鉴定可用于实施本发明方法的多肽中,使用α型CAH3多肽获得的多序列比对结果示于图7中。使用图9列出的序列可以建立β型CAH3多肽和λ型CAH3多肽的类似的多重比对。所有CAH3序列的多重比对用作计算系统树的输入数据。
实施例16:计算可用于实施本发明方法的多肽序列之间的全局百分比同一性
使用可在本领域内获得的方法中的一个方法MatGAT(矩阵全局比对工具(Matrix Global Alignment Tool))软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质或DNA序列而产生相似性/同一性矩阵的应用,Campanella JJ,Bitincka L,Smalley J;由Ledion Bitincka托管的软件),确定可以用于实施本发明的方法的全长多肽序列之间的全局相似性和同一性百分比。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数有:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
α型CAH3多肽序列全长范围(将部分多肽序列排除在外)的全局相似性和同一性的软件分析结果示于表B1。对角线上方给出同一性百分比,而对角线下方给出相似性百分比。
可用于实施本发明方法的多肽序列与SEQ ID NO:81之间的百分比同一性可以为低至16%的氨基酸同一性。
Figure A20078004357701411
实施例17:鉴定包含在可用于实施本发明方法的多肽序列中的结构域
蛋白质家族、结构域和位点集成资源(Integrated Resouce of ProteinFamilies,Domain and Site,InterPro)数据库是基于文本和序列的搜索的通常所用标签数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro驻留于英国的欧洲生物信息研究所。
InterPro扫描如SEQ ID NO:81所代表的多肽序列的结果在表B2中。
表B2:如SEQ ID NO:81所代表的多肽序列的InterPro扫描结果
  数据库   检索号   检索名称
  PRODOM   PD000865   Q39588_CHLRE_Q39588
  PANTHER   PTHR18952   碳酸酐酶
  PFAM   PF00194   碳酸酐酶(Carb_anhydrase)
  PROFILE   PS00162   ALPHA_CA_1
  PROFILE   PS51144   ALPHA_CA_2
  SUPERFAMILY   SSF51069   碳酸酐酶
实施例18:用于实施本发明方法的多肽序列的拓扑学预测(亚细胞定位,跨膜...)
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于任何氨基端前序列的预测的存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的记分并不实际是概率,并且它们未必合为一体。然而,具有最高记分的位置根据TargetP是最有可能的,并且记分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N-端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物组(非植物或植物)、临界设置(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO:81所代表的多肽序列的TargetP 1.1分析的结果在表B3中显示。已经选择“植物”生物组,未定义临界值并且需要转运肽的预测长度。SEQ ID NO:81所代表的多肽序列的亚细胞定位预测是线粒体,但是其在莱茵衣藻中显示为叶绿体的酶。推定的转运肽(transit peptide)的预测长度是始于N-端的13个氨基酸(没有亚细胞定位本身的预测可靠,长度可能有几个氨基酸的不同)。
表B3:如SEQ ID NO:81所代表的多肽序列的TargetP 1.1分析
  长度(AA)   310
  叶绿体转运肽   0.308
  线粒体转运肽   0.800
  分泌途径信号肽   0.004
  其他亚细胞靶向   0.046
  预测的位置   线粒体
  可靠性类别   3
  预测的转运肽长度   13
众多其他算法可以用来执行此类分析,包括:
在丹麦技术大学服务器上驻留的ChloroP 1.1;
在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上驻留的蛋白质Prowler亚细胞定位预测程序第1.2版;
在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上驻留的PENCE Proteme Analyst PA-GOSUB 2.5;
在丹麦技术大学服务器上驻留的TMHMM。
实施例19:用于实施本发明方法的多肽序列相关的分析法
SEQ ID NO:81所示的多肽序列是具有Enzyme Commission(EC;通过它们催化的反应分类酶)对碳酸酐酶的编号EC 4.2.2.1的酶。功能性分析可以是基于滴定分析而对CA活性的分析,如Karlsson等(PlantPhysiol.109:533-539,1995)所述。简言之,如下通过电化学测定CA活性,测定4ml的20mM凡罗纳(veronal)缓冲液,pH 8.3的样品中从加入2ml冰冷的CO2-饱和的蒸馏水开始,pH从8.0降到7.2的时间。一个WAU(Wilbur-Anderson单位;Wilbur和Anderson,J Biol Chem 176:147-154,1948;Yang等,Plant Cell Physiol 26:25-34,1985)的活性定义为:WAU=(t0-t)/t,其中t0是缓冲液控制的pH变化时间,而t是当加入含有CA的样品时获得的时间。
实施例20:克隆SEQ ID NO:80所代表的核酸序列
除非另外声明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第三版Cold Spring Harbor LaboratoryPress,CSH,New York)中或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOS Scientific PublicationsLtd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
使用莱茵衣藻cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增莱茵衣藻CAH3基因。将包含用于Gateway重组的AttB位点的引物prm8571(SEQ ID NO:207;有义,起始密码子为粗体字,AttB1位点为斜体:5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgcgctcagccgttc-3’)和prm8572(SEQ ID NO:208;反向,互补,AttB2位点为斜体:5’-ggggaccactttgtacaagaaagctgggtctcactgaccctagcacactc-3’)用于PCR扩增。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。也使用标准方法扩增和纯化PCR片段(包括CAH3CDS)。然后进行Gateway方法的第一步骤BP反应,在该步骤期间,PCR片段与pDONR201质粒进行体内重组,从而产生,按照Gateway命名法,“进入克隆”,pCAH3。质粒pDONR201作为Gateway
Figure A20078004357701451
技术的一部分购自Invitrogen。
实施例21:使用如SEQ ID NO:80所示的核酸序列构建表达载体
进入克隆pCAH3随后在LR反应中与pPCR(一种用于稻转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于组成型表达的稻原叶绿素酸酯还原酶启动子(PcR,SEQ ID NO:206)位于这种Gateway盒的上游。
在LR重组步骤后,产生的表达载体pPCR::CAH3(图8)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例:22植物转化
稻转化的细节见上面的实施例9,而玉米、小麦、大豆、卡诺拉油菜/油菜、苜蓿和棉花转化的细节见上面的实施例12。
实施例23:表型评价方法
细节见上面的实施例10。
实施例24:转基因植物的表型评价结果
表B4中给出了表达用于本发明方法的核酸序列的转基因稻植物的评价结果。还显示转基因植物和对应的失效合子之间的差异百分数,来自F检验的P值低于0.05。
与对照植物(在这种情况下,失效合子)相比,种子总产量、饱满种子数、种子饱满率和收获指数在表达用于本发明方法的核酸序列的转基因植物中显著增加。
表B4:表达用于实施本发明方法的核酸序列的转基因稻植物的评价结果。
  性状   T1世代增加%   T2世代增加%
  饱满率   91   13
  收获指数   19.4   18.3
实施例:CLAVATA
实施例25:鉴定SEQ ID NO:209、SEQ ID NO:210、SEQ ID NO:211和SEQ ID NO:212相关的序列
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与SEQ ID NO:209或SEQ ID NO:211相关的(全长cDNA、EST或基因组)核酸序列,和/或与SEQ ID NO:210或SEQ IDNO:212相关的多肽序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对SEQ ID NO:209所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。
除了可在NCBI上获得的公共可获得的核酸序列外,还按照与上述的方法相同的方法搜索私人核算序列数据库。
表C提供与SEQ ID NO:211所示的核酸序列和SEQ ID NO:212所示的氨基酸序列相关的核酸和氨基酸序列的列表。SEQ ID NO:209所示的核酸序列包含在SEQ ID NO:211中。但是,已通过PCR在SEQ ID NO:211所示的核酸序列的位置2251处通过将A取代为T(将密码子AGA改变为终止密码子TGA),引入提前终止密码子。
表C:用于本发明方法中的与核酸序列(SEQ ID NO:211)相关的核酸序列,及对应的推导多肽。
  名称 来源生物   核酸SEQID NO:  多肽SEQID NO:   数据库登录号   状态
  Arath_CLAVATA1   拟南芥   212  213   ATU96879   全长
  Brana_LRR-RLK   欧洲油菜   214  215   AY283519   全长
  Eucgr_LRR-RLK   大桉   216  217   AAA79716   全长
  Glyma_CLV1A   大豆   218  219   AF197946   全长
  Glyma_NARK_CLV1B   大豆   220  221   AF197947   全长
  Lotja_HAR1   光叶百脉根   222  223   AB092810.1   全长
  Medtr_SUNN   蒺藜苜蓿   224  225   AY769943   全长
  Orysa_FON1   稻   226  227   AB182388   全长
  Pissa_SYM29   成熟豌豆   228  229   PSA495759   全长
  Poptr_LRR-RLK I   美洲山杨   230  231   scaff_1514.1   全长
  Poptr_LRR-RLK II   美洲山杨   232  233   scaff_II.178   全长
  Zeama_KIN5   玉蜀黍   -  234   Bommert等   全长
  Ipoba_CLV1like   番薯   235  236   AB162660.1   部分
实施例26:相关多肽序列的比对
来自Vector NTI(Invitrogen)的AlignX基于普遍使用的渐进比对的聚类算法(Clustal algorithm)(Thompson等,(1997)Nucleic Acids Res25:4876-4882;Chenna等,(2003)Nucleic Acids Res 31:3497-3500)。可使用邻接聚类算法构建系统树。空位开放罚分的缺省值为10,空位延伸罚分的缺省值为0.1,选择的权重矩阵是Blosum 62(如果比对多肽)。
使用鉴别用于实施本发明方法的多肽相关的多肽的多重序列比对的结果示于图11。从N-端到C-端鉴定到下列特征:
-预测的信号肽(如实施例30所鉴定的);
-SEQ ID NO:237所示的基序1;
-SEQ ID NO:238所示的基序2,其包含保守的半胱氨酸对;
-富亮氨酸重复(LRR)结构域,其包含21个LRR(参见实施例28);
-第二个保守的半胱氨酸对;
-预测的跨膜结构域(如实施例30所鉴定的);
-激酶结构域,其包含11个保守的亚结构域(参见实施例28);在该激酶结构域中,识别了预测的激酶活性位点。
实施例27:计算可用于实施本发明方法的多肽序列之间的全局百分比同一性
使用可在本领域内获得的方法中的一个方法MatGAT(矩阵全局比对工具(Matrix Global Alignment Tool))软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质或DNA序列而产生相似性/同一性矩阵的应用,Campanella JJ,Bitincka L,Smalley J;由Ledion Bitincka托管的软件),确定可以用于实施本发明的方法的全长多肽序列之间的全局相似性和同一性百分比。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数有:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围(将部分多肽序列排除在外)的全局相似性和同一性的软件分析结果示于表C1。对角线上方给出同一性百分比,而对角线下方给出相似性百分比。
可用于实施本发明方法的多肽序列与SEQ ID NO:212之间的百分比同一性可以为低至51%的氨基酸同一性。
表C1:全长多肽序列范围的全局相似性和同一性的MatGAT结果。
  1   2   3   4   5   6   7   8   9   10   11   12
  1.Arath_CLAVATA1\FL   87.1   61.8   61.6   60.3   60.2   61.2   55.9   60.9   68.2   66.7   54.2
  2.Brana_RLK   92.6   60.8   61.2   60.4   60.8   59.9   55.6   61   69.2   67.5   54.1
  3.Eucgr_RLK   76.8   75.1   59.7   58.8   60.8   58.6   53.4   58.8   63.2   62.7   53.3
  4.Glyma_NARK_CLV1B   75.3   75.9   74.5   90.2   78   75.2   53.5   74.6   64.6   63.5   53.5
  5.Glyma_RLK_CLV1A   75.6   75.5   73.9   94.3   77   75.1   52.8   74.7   53.8   63   52.4
  6.Lotja_RLK\HAR1   76.8   77.1   74.8   88   86   79.2   52.9   78   64.9   64.9   52.8
  7.Medtr_SUNN   75.5   75.2   73.9   85.1   84.6   88.1   52   86.2   63.5   64.2   52
  8.Orysa_FON1   70.7   71   69.5   67.8   67.9   69.1   67.7   51.9   55.8   56.2   77.2
  9.Pissa_LRR-RLK   75.5   74.8   74.3   85   84.5   88   91.9   66.8   64   64.2   51
  10.Poptr_RLK\I   80.9   81.3   77.1   78.9   77.9   77.8   77   71.1   77.4   86.8   54.6
  11.Poptr_RLK\II   79.8   80.5   76.7   77.8   77   78.2   77.1   71.3   76.5   92.2   55.1
  12.Zeama_KIN5   69.7   68.8   68.7   67.4   66.9   68.1   66.9   85.9   66.2   71.5   70.7
实施例28:鉴定用于实施本发明方法的多肽序列中包含的结构域
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索常用的标签数据库的整合界面。InterPro数据库将这些数据库结合起来,它们利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息,以获得蛋白质标签。合作数据库包括SWISS-PROT、PROSITE(PS登录号)、TrEMBL、PRINTS(PR登录号)、ProDom(PD登录号)和Pfam(PF登录号)、Smart(SM登录号)和TIGRFAMs。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
SEQ ID NO:212所示多肽序列的InterPro扫描结果示于表C2和图11。富亮氨酸重复结构域包含总共21个串连的拷贝,每个拷贝为23-25个氨基酸残基长度的富亮氨酸重复(LRR),并侧接数对与其他蛋白质(例如与Clavata 2)形成二硫键必需的间隔(spaced)半胱氨酸残基。基于Shiu和Bleecker(2001)Proc Natl Acad Sc 98(19):10763-10768)的分类,SEQID NO:212所示的多肽序列属于LRR XI亚家族。LRR结构域之后是预测的跨膜结构域(对应SEQ ID NO:212所示的多肽序列的氨基酸残基641-659,(见实施例30))。在跨膜结构域之后是包含11个特征性亚结构域的胞内激酶结构域,所述特征性亚结构域具有和其他真核生物的蛋白激酶相比完全无变化的保守性氨基酸残基(Hank和Quinn 1(1991)MethodsEnzymol 200:38-62)。激酶活性位点也在InterPro扫描中预测。
表C2:SEQ ID NO:212所示多肽序列的InterPro扫描结果
  数据库   登录号  登录名称
IPR000719   PD000001PF00069PS50011 蛋白激酶
  IPR001245   SM00219  酪氨酸蛋白激酶
IPR001611   PR00019PF00560 富亮氨酸重复
  IPR002290   SM00220  丝氨酸/苏氨酸蛋白激酶
  IPR003591   SM00369  富亮氨酸重复,典型的亚型
  IPR008271   PS00108  丝氨酸/苏氨酸激酶,活性位点
  IPR011009   SSF56112  蛋白激酶-样
  IPR013210   PF08263  富亮氨酸重复,N-端
实施例29:用于实施本发明方法的多肽序列中包含的预测磷酸化位点
SEQ ID NO:212所示的多肽的磷酸化/去磷酸化状态直接与该多肽的活化/失活相关(Trotochaud等,(1999)Plant Cell 11:393-405)。一个蛋白磷酸酶,KAPP以磷酸化依赖的方式与SEQ ID NO:212的激酶结构域结合,由此使信号传导失活。通过将激酶结构域的可磷酸化氨基酸取代为不可磷酸化的氨基酸,SEQ ID NO:212所示的多肽序列的活性被破坏。使用诸如驻留在丹麦技术大学服务器上的NetPhos 2.0的算法,可能鉴定丝氨酸(S)、苏氨酸(T)和酪氨酸(Y)磷酸化预测位点。NetPhos 2.0服务器产生对真核生物蛋白质上的丝氨酸、苏氨酸和酪氨酸磷酸化的神经网络预测。
SEQ ID NO:212所示的多肽序列的NetPhos 2.0分析结果如下所示。SEQ ID NO:212的激酶结构域由下划线示出,而包括在该结构域中的预测的磷酸化S、T和Y位点已框出。然后这些(位点)通过本领域众所周知的技术,例如位点定向诱变可突变为不可磷酸化的氨基酸。
多肽序列SEQ ID NO:212
MAMRLLKTHLLFLHLYLFFSPCFAYTDMEVLLNLKSSMIGPKGHGLHDWIHSSSPDAHCSFSGVSCDDDARVISLNVSFT       80
PLFGTISPEIGMLTHLVNLTLAANNFTGELPLEMKSLTSLKVLNISNNGNLTGTFPGEILKAMVDLEVLDTYNNNFNGKL      160
Figure A20078004357701511
KKLKYLSFGGNFFSGEIPESYGDIQSLEYLGLNGAGLSGKSPAFLSRLKNLREMYIGYYNSYTGGVPREFGGL       240
TLTGEIPTSLSNLKHLHTLFLHINNLTGHIPPELSGLVSLKSLDLSINQLTGEIPQSFINLGNITLINL           320
FRNNLYGQIPEAIGELPKLEVFEVWENNFTLQLPANLGRNGNLIKLDVSDNHLTGLIPKDLCRGEKLEMLILSNNFFFGP      400
IPEELGKCKSLTKIRIVKNLLNGTVPAGLFNLPLVTIIELTDNFFSGELPVTMSGDVLDQIYLSNNWFSGEIPPAIGNFP      480
NLQTLFLDRNRERGNIPREIFELKHLSRINTSANNITGGIPDSISRCSTLISVDLSRNRINGEIPKGINNVKNLGTLNIS      560
GNQLTGSIPTGIGNMTSLTTLDLSFNDLSGRVPLGGQFLVFNETSFAGNTYLCLPHRVSCPTRPGQTSDHNHTALFSPSR      640
IVITVIAAITGLILISVAIRQMNKKKNQKSLAWKLTAFQKLDFKSEDVLECLKEENIIGKGGAGIVYRGSMPNNVDVAIK      720
RLVGRGTGRSDHGFTAEIQTLGRIRHRHIVRLLGYVANKDTNLLLYEYMPNGSLGELLHGSKGGHLQWETRHRVAVEAAK      800
GLCYLHHDCSPLILHRDVKSNNILLDSDFEAHVADFGLAKFLVDGAASECMSSIAGSYGYIAPEYAYTLKVDEKSDVYSF      880
VVLLELIAGKKPVGEFGEGVDIVRWVRNTEEEITQPSDAAIVVAIVDPRLTGYPLTSVIHVFKIAMMMCVEEEAAARPTM      960
Figure A20078004357701513
TNPPKSVANLIAF                                                                              1040
预测的对应磷酸化位点
Figure A20078004357701514
Figure A20078004357701515
 Ser   Thr   Tyr
  预测的磷酸化位点  22   7   7
  激酶结构域中预测的磷酸化位点  3   5   2
实施例30:用于实施本发明方法的多肽序列的拓扑学预测(亚细胞定位,跨膜...)
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于任何氨基端前序列的预测的存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的记分并不实际是概率,并且它们未必合为一体。然而,具有最高记分的位置根据TargetP是最有可能的,并且记分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N-端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物组(非植物或植物)、临界设置(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO:212所代表的多肽序列的TargetP 1.1分析的结果在表C3中显示。已经选择“植物”生物组,未定义临界值并且需要转运肽的预测长度。SEQ ID NO:210所代表的多肽序列的亚细胞定位是分泌途径(内质网或ER),信号肽的预测长度是始于N-端的24个氨基酸(没有亚细胞定位本身的预测可靠,长度可能有几个氨基酸的不同)。
表C3:如SEQ ID NO:210所代表的多肽序列的TargetP 1.1分析
  长度(AA)   980
  叶绿体转运肽   0.001
  线粒体转运肽   0.113
  分泌途径信号肽   0.973
  其他亚细胞靶向   0.018
  预测的位置   分泌(内质网或ER)
  可靠性类别   1
  预测的转运肽长度   24
众多其他算法可以用来执行此类分析,包括:
在丹麦技术大学服务器上驻留的ChloroP 1.1;
在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上驻留的蛋白质Prowler亚细胞定位预测程序第1.2版;
在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上驻留的PENCE Proteme Analyst PA-GOSUB 2.5;
在丹麦技术大学服务器上驻留的TMHMM。
多肽序列SEQ ID NO:212的TMHMM2.0计算结果在下表C4中给出。鉴定了两个疏水区,其相应为:(i)ER亚细胞靶向的信号肽;和(ii)跨膜结构域。
表C4:多肽序列SEQ ID NO:212的TMHMM2.0计算结果
  质膜相关的位置   SEQ ID NO:212从N-端到C-端的氨基酸   多肽序列SEQ ID NO:212上对应的结构域
  细胞外的序列   1-640   胞外LRR结构域
  跨膜螺旋   641-659   跨膜结构域
  细胞内的序列   660-980   胞内激酶结构域
实施例31:用于实施本发明方法的多肽序列相关的分析法,和破坏C-端结构域的生物功能的方法
第一步,用于实施本发明方法的多肽的活性通过它们结合它们天然的作用子(interactor)的能力确定,使用例如Trotochaud等,(1999;PlantCell 11:393-406)中描述的方法。CLV1活性的一种测试是通过检测KAPP与用于酵母双杂交系统的CLV1多肽的激酶结构域的物理相互作用。
第二步,鉴定的CLV1多肽通过破坏C-端结构域的生物功能而可用于本发明的方法。此类方法(破坏生物功能)是本领域众所周知的,包括:删除、取代和/或缺失C-端结构域的氨基酸。通常使用基于PCR的技术,删除、取代和/或缺失C-端结构域的一个或多个氨基酸,例如:
(i)删除、取代和/或缺失C-端结构域(在此具体的(i)的实例中,意味着(从N端到C端)编码跨膜结构域的氨基酸序列之后的氨基酸序列)的全部或部分氨基酸;或
(ii)用丙氨酸取代保守的氨基酸(例如图2和实施例28(涉及底物ATP结合位点)中所示的激酶活性位点,或取代激酶亚结构域IX中的保守的G,或取代第二对(参与同源和异源二聚化)中的半胱氨酸)等;或
(iii)例如为了破坏底物结合,在激酶活性位点插入氨基酸;
(iv)用不可磷酸化氨基酸取代可磷酸化氨基酸(例如丝氨酸、苏氨酸或酪氨酸)(例如,为了和其他氨基酸的相互作用);
(v)或本领域已知的破坏生物功能的任何其他方法。
破坏CLV1多肽C-端结构域的生物功能的一个实例是,通过PCR(在反义引物SEQ ID NO:240上)在SEQ ID NO:211所示的核酸序列的位置2251处将A取代为T(将密码子AGA改变为终止密码子TGA),引入提前终止密码子。
实施例32:克隆SEQ ID NO:209所代表的核酸序列
除非另外声明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第三版Cold Spring Harbor LaboratoryPress,CSH,New York)中或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOS Scientific PublicationsLtd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
使用拟南芥幼苗cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增编码CLV1多肽的拟南芥核酸序列。将包含用于Gateway重组的AttB位点的下列引物用于PCR扩增:
1)prm8591(SEQ ID NO:239;有义,起始密码子为粗体字,AttB1位点为斜体):
5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgatgagactt ttgaag-3’)和
2)prm8592(SEQ ID NO:240;反向,互补,AttB2位点为斜体):5’-ggggaccactttgtacaagaaagctgggtcgctacgtaaccaagaagtcac-3’)。
也使用标准方法扩增和纯化PCR片段。然后进行Gateway方法的第一步骤BP反应,在该步骤期间,PCR片段与pDONR201质粒进行体内重组,从而产生,按照Gateway命名法,“进入克隆”。质粒pDONR201作为Gateway
Figure A20078004357701551
技术的一部分购自Invitrogen。
实施例33:使用如SEQ ID NO:209所示的核酸序列构建表达载体
包含编码CLV1多肽SEQ ID NO:210的核酸序列的进入克隆随后在LR反应中与用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择性标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于在幼嫩生长组织表达的稻-扩展蛋白启动子(SEQ ID NO:241)位于这种Gateway盒的上游。
在LR重组步骤后,产生的表达载体(图4)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中,所述表达载体包含在编码具有无功能C-端结构域的Arath_CLV1的核酸序列上游的β扩展蛋白启动子的核酸序列。
实施例:34植物转化
稻转化的细节见上面的实施例9,而玉米、小麦、大豆、卡诺拉油菜/油菜、苜蓿和棉花转化的细节见上面的实施例12。
实施例35:表型评价方法
细节见上面的实施例10。
实施例36:转基因植物的表型评价结果
表C5中给出了表达用于本发明方法的核酸序列的转基因稻植物的评价结果。还显示转基因植物和对应的失效合子之间的差异百分数,来自F检验的P值低于0.05。
与对照植物(在这种情况下,失效合子)相比,地上部分生物量、根总生物量、细根生物量、主圆锥花序数、每圆锥花序花数、种子总产量、饱满种子数、种子总数和收获指数在表达用于本发明方法的核酸序列的转基因植物中显著增加。
表C5:表达用于实施本发明方法的核酸序列的转基因稻植物的评价结果。
  性状   T1世代增加%
  地上部分生物量   5
  根总生物量   2
  细根生物量   2
  主圆锥花序数   8
  每圆锥花序花数   6
  种子总产量   9
  饱满种子数   12
  种子总数   14
  收获指数   5
  TKW   -3
序列表
<110>克罗普迪塞恩股份有限公司
<120>包含作为转基因的A类I TCP或CLAVATA 1(CLV1)或CAH3多肽、具有增加的种子产量的转基因植物以及用于制备该植物的方法
<130>PF58581
<150>EP 06124785.4
<151>2006-11-24
<150>US 60/868,381
<151>2006-12-04
<150>EP 06125156.7
<151>2006-11-30
<150>US 60/883,166
<151>2007-01-03
<150>EP 06126018.8
<151>2006-12-13
<150>US 60/883,170
<151>2007-01-03
160>241
<170>Patent In版本3.3
<210>1
<211>945
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>1
atggatccca agaacctaaa tcgtcaccaa gtaccaaatt tcttgaaccc accaccacca     60
ccgcgaaatc agggtttggt agatgatgat gctgcttctg ctgttgtttc cgacgagaat    120
cgcaaaccaa caactgagat taaagatttc cagatcgtgg tctctgcttc cgacaaagaa    180
ccaaacaaga agagtcagaa tcagaaccag cttggtccta agagaagctc taacaaagac    240
agacacacta aagtcgaagg tagaggtcga cgaattcgga tgcctgctct ttgtgctgct    300
aggatttttc aattgactag agaattgggt cataaatctg atggtgaaac tatccagtgg    360
ctgcttcaac aagctgagcc atcgattatt gcagctactg gttcaggaac tataccggcc    420
tctgctttag cttcttcagc tgcaacctct aaccatcatc aaggtgggtc tcttactgct    480
ggtttaatga tcagtcatga cttagatggt gggtctagta gtagtggtag accattaaat    540
tgggggattg gtggcggtga aggagtttct aggtcaagtt taccaactgg gttatggcca    600
aatgtagctg ggtttggttc tggtgtgcca accactggtt taatgagtga aggagctggt    660
tatagaattg ggtttcctgg ttttgatttt cctggtgttg gtcatatgag ttttgcatct    720
attttgggtg ggaatcataa tcagatgcct ggacttgagt taggcttgtc tcaagaaggg    780
aatgttggtg ttttgaatcc tcagtctttt actcagattt atcaacagat gggtcaggct    840
caggctcaag ctcaaggtag ggttcttcac catatgcatc ataaccatga agaacatcag    900
caagagagtg gtgagaaaga tgattctcaa ggctcaggtc gttaa                    945
<210>2
<211>314
<212>PRT
<213>拟南芥
<400>2
Met Asp Pro Lys Asn Leu Asn Arg His Gln Val Pro Asn Phe Leu Asn
 1              5                   10                  15
Pro Pro Pro Pro Pro Arg Asn Gln Gly Leu Val Asp Asp Asp Ala Ala
            20                  25                  30
Ser Ala Val Val Ser Asp Glu Asn Arg Lys Pro Thr Thr Glu Ile Lys
        35                  40                  45
Asp Phe Gln Ile Val Val Ser Ala Ser Asp Lys Glu Pro Asn Lys Lys
    50                  55                  60
Ser Gln Asn Gln Asn Gln Leu Gly Pro Lys Arg Ser Ser Asn Lys Asp
65                  70                  75                  80
Arg His Thr Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala
                85                  90                  95
Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys
            100                 105                 110
Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser
        115                 120                 125
Ile Ile Ala Ala Thr Gly Ser Gly Thr Ile Pro Ala Ser Ala Leu Ala
    130                 135                 140
Ser Ser Ala Ala Thr Ser Asn His His Gln Gly Gly Ser Leu Thr Ala
145                 150                 155                 160
Gly Leu Met Ile Ser His Asp Leu Asp Gly Gly Ser Ser Ser Ser Gly
            165                 170                 175
Arg Pro Leu Asn Trp Gly Ile Gly Gly Gly Glu Gly Val Ser Arg Ser
        180                 185                 190
Ser Leu Pro Thr Gly Leu Trp Pro Asn Val Ala Gly Phe Gly Ser Gly
        195                 200                 205
Val Pro Thr Thr Gly Leu Met Ser Glu Gly Ala Gly Tyr Arg Ile Gly
    210                 215                 220
Phe Pro Gly Phe Asp Phe Pro Gly Val Gly His Met Ser Phe Ala Ser
225                 230                 235                 240
Ile Leu Gly Gly Asn His Asn Gln Met Pro Gly Leu Glu Leu Gly Leu
                245                 250                 255
Ser Gln Glu Gly Asn Val Gly Val Leu Asn Pro Gln Ser Phe Thr Gln
            260                 265                 270
Ile Tyr Gln Gln Met Gly Gln Ala Gln Ala Gln Ala Gln Gly Arg Val
        275                 280                 285
Leu His His Met His His Asn His Glu Glu His Gln Gln Glu Ser Gly
    290                 295                 300
Glu Lys Asp Asp Ser Gln Gly Ser Gly Arg
305                 310
<210>3
<211>732
<212>DNA
<213>拟南芥
<400>3
atggtcatgg agcccaagaa gaaccaaaat ctaccaagtt tcttaaaccc atcacgacag     60
aatcaggaca acgacaagaa gaggaaacaa acagaggtta aaggtttcga cattgtggtc    120
ggcgaaaaga ggaagaagaa ggagaatgaa gaggaagacc aagaaattca gattctttat    180
gagaaggaga agaagaaacc aaacaaagat cgtcacctta aagttgaagg aagaggtcgt    240
agagttaggt tacctccact ctgtgcagca aggatttatc aattgactaa agaattaggt    300
cacaaatcag atggtgagac tcttgaatgg ttgcttcaac atgctgagcc atcgatactc    360
tctgctactg taaatggtat caaacccact gagtctgttg tttctcaacc tcctctcacg    420
gctgatttga tgatttgtca tagcgttgaa gaagcttcaa ggactcaaat ggaggcaaat  480
gggttgtgga gaaatgaaac aggacagacc attggagggt ttgatctgaa ttacggaatt  540
gggtttgatt tcaatggtgt tccagagatt ggttttggag ataatcaaac gcctggactt  600
gaattaaggc tgtctcaagt tggggttttg aatccacagg tttttcaaca aatgggtaaa  660
gaacagttca gggttcttca tcatcattca catgaagatc agcagcagag tgcagaggaa  720
aatggttcat aa                                                      732
<210>4
<211>243
<212>PRT
<213>拟南芥
<400>4
Met Val Met Glu Pro Lys Lys Asn Gln Asn Leu Pro Ser Phe Leu Asn
1               5                   10                  15
Pro Ser Arg Gln Asn Gln Asp Asn Asp Lys Lys Arg Lys Gln Thr Glu
            20                  25                  30
Val Lys Gly Phe Asp Ile Val Val Gly Glu Lys Arg Lys Lys Lys Glu
        35                  40                  45
Asn Glu Glu Glu Asp Gln Glu Ile Gln Ile Leu Tyr Glu Lys Glu Lys
    50                  55                  60
Lys Lys Pro Asn Lys Asp Arg His Leu Lys Val Glu Gly Arg Gly Arg
65                  70                  75                  80
Arg Val Arg Leu Pro Pro Leu Cys Ala Ala Arg Ile Tyr Gln Leu Thr
                85                  90                  95
Lys Glu Leu Gly His Lys Ser Asp Gly Glu Thr Leu Glu Trp Leu Leu
            100                 105                 110
Gln His Ala Glu Pro Ser Ile Leu Ser Ala Thr Val Asn Gly Ile Lys
        115                 120                 125
Pro Thr Glu Ser Val Val Ser Gln Pro Pro Leu Thr Ala Asp Leu Met
    130                 135                 140
Ile Cys His Ser Val Glu Glu Ala Ser Arg Thr Gln Met Glu Ala Asn
145                 150                 155                 160
Gly Leu Trp Arg Asn Glu Thr Gly Gln Thr Ile Gly Gly Phe Asp Leu
                165                 170                 175
Asn Tyr Gly Ile Gly Phe Asp Phe Asn Gly Val Pro Glu Ile Gly Phe
            180                 185                 190
Gly Asp Asn Gln Thr Pro Gly Leu Glu Leu Arg Leu Ser Gln Val Gly
        195                 200                 205
Val Leu Asn Pro Gln Val Phe Gln Gln Met Gly Lys Glu Gln Phe Arg
    210                 215                 220
Val Leu His His His Ser His Glu Asp Gln Gln Gln Ser Ala Glu Glu
225                 230                 235                 240
Asn Gly Ser
<210>5
<211>930
<212>DNA
<213>红花耧斗菜x细毛耧斗菜(Aquilegia formosa x Aquilegia pubescens)
<400>5
atggatgatc ttaagaattc atcaaagcaa ccacaagaag tagtaacaag tttcttgaga     60
cattcttcac aacaagagat gggaggagga ggaggagaga ataaacaaac agaaatcaga    120
gattttcaaa tctcaacagt tgttgcagat aaagatggtg gtaagaagca gttagcacca    180
aaaagaactt caaataaaga tagacatact aaggtagatg gaagaggtag aaggataagg    240
atgccagctt tatgtgcagc tagaattttt cagttaacaa gagaattggg tcataaatct    300
gatggagaaa ctatacaatg gttattacaa catgctgaac catcaataat tgccgctaca    360
ggtactggaa ctataccagc ttcagcttta gttcaatcta gtagctcagt ttcacaacag    420
gggaattctg tttcagttgg tttacaaaca aagatcagtg aattgggaca tgaaattggg    480
tccagtagta gtaggaccaa ttggaatttg gttagatccc cagtaacaac aagtttatgg    540
ccctctgtca gtggttatgt accagggttt catccttctt caggccaacc gacatcgaat    600
ctgagtagtg atggtttgaa ttatttgcct aaattcggta ttcatggttt cgaaatgcct    660
ggatcaaatt taggtacaat gaatttaaat tcattcatgg gggttggtaa taatcaacaa    720
cttcctggat tggaattagg attatctcaa gatgtgcata ccggggtatt gaatcctcaa    780
gctttacagt tttatcagca gatggttcaa tcaagaggag ttgtcatgca tcaacaacag    840
cagcaccagc aacaacaaca acaacaacag cagcagcagc agcaaccaca tgatgatgat    900
gaggatgatt ctcaaggttc aagacattaa                                     930
<210>6
<211>309
<212>PRT
<213>红花耧斗菜x细毛耧斗菜
<400>6
Met Asp Asp Leu Lys Asn Ser Ser Lys Gln Pro Gln Glu Val Val Thr
1               5                   10                  15
Ser Phe Leu Arg His Ser Ser Gln Gln Glu Met Gly Gly Gly Gly Gly
            20                  25                  30
Glu Asn Lys Gln Thr Glu Ile Arg Asp Phe Gln Ile Ser Thr Val Val
        35                  40                  45
Ala Asp Lys Asp Gly Gly Lys Lys Gln Leu Ala Pro Lys Arg Thr Ser
    50                  55                  60
Asn Lys Asp Arg His Thr Lys Val Asp Gly Arg Gly Arg Arg Ile Arg
65                  70                  75                  80
Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu
                85                  90                  95
Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln His Ala
            100                 105                 110
Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser
        115                 120                 125
Ala Leu Val Gln Ser Ser Ser Ser Val Ser Gln Gln Gly Asn Ser Val
    130                 135                 140
Ser Val Gly Leu Gln Thr Lys Ile Ser Glu Leu Gly His Glu Ile Gly
145                 150                 155                 160
Ser Ser Ser Ser Arg Thr Asn Trp Asn Leu Val Arg Ser Pro Val Thr
                165                 170                 175
Thr Ser Leu Trp Pro Ser Val Ser Gly Tyr Val Pro Gly Phe His Pro
            180                 185                 190
Ser Ser Gly Gln Pro Thr Ser Asn Leu Ser Ser Asp Gly Leu Asn Tyr
        195                 200                 205
Leu Pro Lys Phe Gly Ile His Gly Phe Glu Met Pro Gly Ser Asn Leu
    210                 215                 220
Gly Thr Met Asn Leu Asn Ser Phe Met Gly Val Gly Asn Asn Gln Gln
225                 230                 235                 240
Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Val His Thr Gly Val
                245                 250                 255
Leu Asn Pro Gln Ala Leu Gln Phe Tyr Gln Gln Met Val Gln Ser Arg
            260                 265                 270
Gly Val Val Met His Gln Gln Gln Gln His Gln Gln Gln Gln Gln Gln
        275                 280                 285
Gln Gln Gln Gln Gln Gln Gln Pro His Asp Asp Asp Glu Asp Asp Ser
    290                 295                 300
Gln Gly Ser Arg His
305
<210>7
<211>1038
<212>DNA
<213>大豆(Glycine max)
<400>7
atggatccca agggctcaaa gcagcagcca cagcaatcac aggaggtggt accaaacttc    60
ctcagcctcc cccaacagca acaagggaat accaacaaca acaacatggg agagaacaaa    120
cctgcagagg tgaaggattt ccagatagtg gtagctgaga acaaggaaga gagcaagaaa    180
cagcagcaac agttggcacc aaagaggagt tccaacaagg acaggcacac caaggttgaa    240
ggcaggggaa ggaggataag gatgcctgct ctctgcgcag ccagaatctt ccagttgacc    300
agggaattgg gtcacaaatc tgatggggaa accatccagt ggctcctcca gcaggctgag    360
ccatccatca tagctgccac tgggactggc acaataccag catctgctct tgctgctgct    420
ggaaactcac tctcaccaca agctgcttct ctttcatcat ccttgcacca acatcaacaa    480
aagattgatg aattgggtgg gtcagggggg agtagtagta gggccagctg gcaaatggtt    540
ggggggaatt tggggagacc ccatttgggt gtgggtgtgg ccacagcagc aggcctatgg    600
ccccctcatg tcagtggatt tggatttcaa acaccaccaa caacaacaac accaacaaca    660
acaacatcat catctggtcc atctaatgcc accttagcca ctgagagctc caattacctt    720
cagaaaattg cattccctgg ctttgacttg cctacttctg ccactaacat gatgggtcac    780
atgagtttca cctcaatttt gggtggaggt gggggtggtg gggcccagca tatgcctggc    840
ttggagcttg gtctttccca ggatggccat attggggtgt tgaatcaaca ggccttgaac    900
cagatttatc agcagatgaa tcaggctggt agagtgcatc atcatcagca tcagcatcat    960
catcagcatc atcagcagca acaacaccat cagcaaactc ctgctaagga tgattctcaa  1020
ggctcaggag gacagtag                                                1038
<210>8
<211>345
<212>PRT
<213>大豆
<400>8
Met Asp Pro Lys Gly Ser Lys Gln Gln Pro Gln Gln Ser Gln Glu Val
1               5                   10                  15
Val Pro Asn Phe Leu Ser Leu Pro Gln Gln Gln Gln Gly Asn Thr Asn
            20                  25                  30
Asn Asn Asn Met Gly Glu Asn Lys Pro Ala Glu Val Lys Asp Phe Gln
        35                  40                  45
Ile Val Val Ala Glu Asn Lys Glu Glu Ser Lys Lys Gln Gln Gln Gln
    50                  55                  60
Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Glu
65                  70                  75                  80
Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile
                85                  90                  95
Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile
            100                 105                 110
Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly
        115                 120                 125
Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala Ala Gly Asn Ser Leu
    130                 135                 140
Ser Pro Gln Ala Ala Ser Leu Ser Ser Ser Leu His Gln His Gln Gln
145                 150                 155                 160
Lys Ile Asp Glu Leu Gly Gly Ser Gly Gly Ser Ser Ser Arg Ala Ser
                165                 170                 175
Trp Gln Met Val Gly Gly Asn Leu Gly Arg Pro His Leu Gly Val Gly
            180                 185                 190
Val Ala Thr Ala Ala Gly Leu Trp Pro Pro His Val Ser Gly Phe Gly
        195                 200                 205
Phe Gln Thr Pro Pro Thr Thr Thr Thr Pro Thr Thr Thr Thr Ser Ser
    210                 215                 220
Ser Gly Pro Ser Asn Ala Thr Leu Ala Thr Glu Ser Ser Asn Tyr Leu
225                 230                 235                 240
GlnLys Ile Ala Phe Pro Gly Phe Asp Leu Pro Thr Ser Ala Thr Asn
               245                 250                 255
Met Met Gly His Met Ser Phe Thr Ser Ile Leu Gly Gly Gly Gly Gly
            260                 265                 270
Gly Gly Ala Gln His Met Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp
        275                 280                 285
Gly His Ile Gly Val Leu Asn Gln Gln Ala Leu Asn Gln Ile Tyr Gln
    290                 295                 300
Gln Met Asn Gln Ala Gly Arg Val His His His Gln His Gln His His
305                 310                 315                 320
His Gln His His Gln Gln Gln Gln His His Gln Gln Thr Pro Ala Lys
                325                 330                 335
Asp Asp Ser Gln Gly Ser Gly Gly Gln
            340                 345
<210>9
<211>903
<212>DNA
<213>陆地棉(Gossypium hirsutum)
<400>9
atggatccca agggcgccaa gcagcctcca gaggaagtag ccaacttgtt gagcctgcca     60
ccccaacccc aacagcaaca gcctcaaaac atgggagaga ataaagcagc agaaatcaag    120
gatttccaaa ttgtggttgc agataaagga gaagggaaga agcaacagtt ggccccaaag    180
agaagttcta acaaagacag gcacaccaaa gttgaaggaa gaggtagaag gataaggatg    240
cctgctttat gtgctgctag aatctttcag ttgaccaggg aattgggtca caagtctgat    300
ggggaaacca tacagtggct gttacaacaa gctgaaccat ccataattgc cgccactggg    360
agcggaacaa ttccagcatc agctttggct gcagctggag gctcagtttc acagccaggg    420
gcctctctat cagcagggtt gcaccaaaag atggaagatt taggggggtc cagtataggg    480
tcagggagca gtaggaccag ttggacaatg gttggtggca atttgggaag accccatcat    540
gtggcgaccg ggttatggcc accagtcagt ggttttgggt ttcagtcatc atctggtccg    600
tctacaacaa atttaggcag tgatagttcc aattatctgc aaaagcttgg gtttccaggt    660
tttgatttgc cagctagtaa catgggtcag ataagtttca cctcaatctt gggcggagct    720
aatcagcagc tcccgggttt ggaacttggg ttatctcaag atggtcatat tggggtctta    780
aatcctcatg ctttgaacca gatttatcag cagatggagc aagctcggat gcaaccccaa    840
catcagcatc agcaccagca acaaccccct gctaaggatg actcccaagg atcgggccag    900
taa                                                                  903
<210>10
<211>300
<212>PRT
<213>陆地棉
<400>10
Met Asp Pro Lys Gly Ala Lys Gln Pro Pro Glu Glu Val Ala Asn Leu
1               5                   10                  15
Leu Ser Leu Pro Pro Gln Pro Gln Gln Gln Gln Pro Gln Asn Met Gly
            20                  25                  30
Glu Asn Lys Ala Ala Glu Ile Lys Asp Phe Gln Ile Val Val Ala Asp
        35                  40                  45
Lys Gly Glu Gly Lys Lys Gln Gln Leu Ala Pro Lys Arg Ser Ser Asn
    50                  55                  60
Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met
65                  70                  75                  80
Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly
                85                  90                  95
His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu
            100                 105                 110
Pro Ser Ile Ile Ala Ala Thr Gly Ser Gly Thr Ile Pro Ala Ser Ala
        115                 120                 125
Leu Ala Ala Ala Gly Gly Ser Val Ser Gln Pro Gly Ala Ser Leu Ser
    130                 135                 140
Ala Gly Leu His Gln Lys Met Glu Asp Leu Gly Gly Ser Ser Ile Gly
145                 150                 155                 160
Ser Gly Ser Ser Arg Thr Ser Trp Thr Met Val Gly Gly Asn Leu Gly
                165                 170                 175
Arg Pro His His Val Ala Thr Gly Leu Trp Pro Pro Val Ser Gly Phe
            180                 185                 190
Gly Phe Gln Ser Ser Ser Gly Pro Ser Thr Thr Asn Leu Gly Ser Asp
        195                 200                 205
Ser Ser Asn Tyr Leu Gln Lys Leu Gly Phe Pro Gly Phe Asp Leu Pro
    210                 215                 220
Ala Ser Asn Met Gly Gln Ile Ser Phe Thr Ser Ile Leu Gly Gly Ala
225                 230                 235                 240
Asn Gln Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His
                245                 250                 255
Ile Gly Val Leu Asn Pro His Ala Leu Asn Gln Ile Tyr Gln Gln Met
            260                 265                 270
Glu Gln Ala Arg Met Gln Pro Gln His Gln His Gln His Gln Gln Gln
        275                 280                 285
Pro Pro Ala Lys Asp Asp Ser Gln Gly Ser Gly Gln
    290                 295                 300
<210>11
<211>819
<212>DNA
<213>番茄(Lycopersicon esculentum)
<400>11
atggatccca aacaggctaa ccacaacaat attaagccta ctcatgatca gataaaagag     60
ttgcagattt tgaaaaatga tgaaacgaac aaggtggctg ctcccaaaag aaaagatagg    120
catacaaaag ttgaaggtag agggaggaga atacgtatgc cggcgctctg tgcagcaaga    180
atcttccagc ttacgcgcga attgggtcat aaatctgatg gtgagacaat tcagtggctg    240
ctgcagcaag ccgagccttc gattattgct gctactggca cagggacaat acctgcctcg    300
gctttagctg cagcagcctc tgtttctcaa caggggatct ctgtatcagc tggtttaatg    360
attgaatcgg gggcgaatat cgcggggtct ggtagcagta gaagtagtaa tagtaggacc    420
aattggccaa tgatctgtgg gaattttgga agaccccatt tggctacagc aggaatgtgg    480
cctgcccctg cccctgttgt cactagtttt gggtttcaat cctcatctgc tccatcaagc    540
gcgagtttag gtagtgatag ttcaaattat tacttacaga aaattgggtt tcctggattt    600
gatctgcctg cagctacaag tatgaatccg atgtgtttta cttcaattct  tggtggaagt   660
aatcagcaac tgccaggatt ggaactggga ttatctcaag agggtcattt aggggttttg    720
aaccagatat accagcaggc aagaatgcaa catccgcagc agcaacatca acaacaacaa    780
caatctccgg aggaggattc tcaaggatca ggacattaa                           819
<210>12
<211>272
<212>PRT
<213>番茄
<400>12
Met Asp Pro Lys Gln Ala Asn His Asn Asn Ile Lys Pro Thr His Asp
1               5                   10                  15
Gln Ile Lys Glu Leu Gln Ile Leu Lys Asn Asp Glu Thr Asn Lys Val
            20                  25                  30
Ala Ala Pro Lys Arg Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly
        35                  40                  45
Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu
    50                  55                  60
Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu
65                  70                  75                  80
Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr
                85                  90                  95
Ile Pro Ala Ser Ala Leu Ala Ala Ala Ala Ser Val Ser Gln Gln Gly
            100                 105                 110
Ile Ser Val Ser Ala Gly Leu Met Ile Glu Ser Gly Ala Asn Ile Ala
        115                 120                 125
Gly Ser Gly Ser Ser Arg Ser Ser Asn Ser Arg Thr Asn Trp Pro Met
    130                 135                 140
Ile Cys Gly Asn Phe Gly Arg Pro His Leu Ala Thr Ala Gly Met Trp
145                 150                 155                 160
Pro Ala Pro Ala Pro Val Val Thr Ser Phe Gly Phe Gln Ser Ser Ser
                165                 170                 175
Ala Pro Ser Ser Ala Ser Leu Gly Ser Asp Ser Ser Asn Tyr Tyr Leu
            180                 185                 190
Gln Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Ala Ala Thr Ser Met
        195                 200                 205
Asn Pro Met Cys Phe Thr Ser Ile Leu Gly Gly Ser Asn Gln Gln Leu
    210                 215                 220
Pro Gly Leu Glu Leu Gly Leu Ser Gln Glu Gly His Leu Gly Val Leu
225                 230                 235                 240
Asn Gln Ile Tyr Gln Gln Ala Arg Met Gln His Pro Gln Gln Gln His
                245                 250                 255
Gln Gln Gln Gln Gln Ser Pro Glu Glu Asp Ser Gln Gly Ser Gly His
            260                 265                 270
<210>13
<211>966
<212>DNA
<213>驯化苹果(Malus domestica)
<400>13
atggatccca agggctcaaa gcagacacaa gacataccca gcttcttgag ccttccccca     60
caatcacaac cacaacctga gcagcagcag caaccacaac aacaacctca acccaacaac    120
aacatgagcg acaacaaacc tgctgaaatc aaagacttcc agattgtaat cgccgacaaa    180
gatgagtcgg gaaagaagca gttggcgccc aagagaagct ccaacaaaga cagacacact    240
aaagtcgaag gcaggggaag gaggatacgg atgccggccc tctgcgccgc cagaatcttt    300
caattgacca gagagttggg tcacaaatcc gatggggaaa caatccagtg gctcctccag    360
caggccgagc cgtcgattgt tgccaccacc gggaccggga cgattccggc gtcggctttg    420
gcggcggcag gtggctctgt ttcgcaacag gggacttctt tatcagctgg attgcaccaa    480
aagatcgatg aattgggggg gtccagtggg ggtaggacca gttgggcaat ggtgggcggg    540
aatttgggga gaccccatgt ggcaggggtg ggcgggctat ggccccctgt cagtagcttt    600
gggttccagt catcatctgg tcctccatcg gccaccacaa atctgggcac tgagagttca    660
aattacctgc aaaaaattgg gtttcctggc tttgacttgc ctgtctctaa catgggtccg    720
atgagtttta cttcaatttt gggtgggggc aatcagcagc agcagcagca gcttcctggg    780
ttggaacttg ggttgtcaca ggatggacat attggggttc tgaactctca ggctttgagc    840
caaatttacc agcagatggg gcatgttaga gtgcaccagc agccgccgca gcaccaccac    900
cagcaacacc accaccacca gcagcaaccg ccttccaagg acgattctca aggatccgga    960
cagtag                                                               966
<210>14
<211>321
<212>PRT
<213>驯化苹果
<400>14
Met Asp Pro Lys Gly Ser Lys Gln Thr Gln Asp Ile Pro Ser Phe Leu
1               5                   10                  15
Ser Leu Pro Pro Gln Ser Gln Pro Gln Pro Glu Gln Gln Gln Gln Pro
            20                  25                  30
Gln Gln Gln Pro Gln Pro Asn Asn Asn Met Ser Asp Asn Lys Pro Ala
        35                  40                  45
Glu Ile Lys Asp Phe Gln Ile Val Ile Ala Asp Lys Asp Glu Ser Gly
    50                  55                  60
Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr
65                  70                  75                  80
Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala
                85                  90                  95
Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly
            100                 105                 110
Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile Val Ala
        115                 120                 125
Thr Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala Ala Gly
    130                 135                 140
Gly Ser Val Ser Gln Gln Gly Thr Ser Leu Ser Ala Gly Leu His Gln
145                 150                 155                 160
Lys Ile Asp Glu Leu Gly Gly Ser Ser Gly Gly Arg Thr Ser Trp Ala
                165                 170                 175
Met Val Gly Gly Asn Leu Gly Arg Pro His Val Ala Gly Val Gly Gly
            180                 185                 190
Leu Trp Pro Pro Val Ser Ser Phe Gly Phe Gln Ser Ser Ser Gly Pro
        195                 200                 205
Pro Ser Ala Thr Thr Asn Leu Gly Thr Glu Ser Ser Asn Tyr Leu Gln
    210                 215                 220
Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Val Ser Asn Met Gly Pro
225                 230                 235                 240
Met Ser Phe Thr Ser Ile Leu Gly Gly Gly Asn Gln Gln Gln Gln Gln
                245                 250                 255
Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His Ile Gly
            260                 265                 270
Val Leu Asn Ser Gln Ala Leu Ser Gln Ile Tyr Gln Gln Met Gly His
        275                 280                 285
Val Arg Val His Gln Gln Pro Pro Gln His His His Gln Gln His His
    290                 295                 300
His His Gln Gln Gln Pro Pro Ser Lys Asp Asp Ser Gln Gly Ser Gly
305                 310                 315                 320
Gln
<210>15
<211>855
<212>DNA
<213>蒺藜苜蓿(Medicago truncatula)
<400>15
atggatccca aaaactcaaa gcaacaatca caactctcaa acatgggaga gaacaaagaa     60
tcagagacaa aaaatcttca aattgtgtta tctgaaacaa caacaaaaga tgaaacaaag    120
aaacaactag caccaaaaag aacatcaaac aaagacagac acacaaaagt tgaaggaaga    180
ggaagaagaa taaggatgcc agctttatgt gcagcaagaa tctttcagct aacaagagag    240
ttaggtcata aatcagatgg tgaaacaatt caatggcttt tacaacaatc tgaaccatca    300
atcatagctg caacaggaac aggaacaata ccagcttcag ctttagcttc ttctggtaat    360
actttgacac cacaaggttc atctttgtct tctggtttac agttgaatga taggaatact    420
tgggctcaga cccatcaagc ccatcaggcc catcagggcc atcatgttag ttctacaagt    480
ttatggccac atcatcatgt tggtggattt ggatttcatc aatcatcatc atctggtggt    540
ttagtagcta ctactgttgg tgaaaataat agtggaaatt attttcagaa aattgggttt    600
tctggatttg atatgccaac aggaacaaat ttgggagtgg gagggatgag ttttacttca    660
attttggggg gtgcaaatca gcagatgcct ggtttggaat tagggttgtc acaagatgga    720
catattggtg tgttgaatca acaagcttta actcagattt atcagcagat tggtcaaaat    780
caaactaggg ttcagcacca gaatcagcag aataataata ctactaagga tgattctcac    840
agttcagaac agtag                                             855
<210>16
<211>284
<212>PRT
<213>蒺藜苜蓿
<400>16
Met Asp Pro Lys Asn Ser Lys Gln Gln Ser Gln Leu Ser Asn Met Gly
1               5                   10                  15
Glu Asn Lys Glu Ser Glu Thr Lys Asn Leu Gln Ile Val Leu Ser Glu
            20                  25                  30
Thr Thr Thr Lys Asp Glu Thr Lys Lys Gln Leu Ala Pro Lys Arg Thr
        35                  40                  45
Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly Arg Arg Ile
    50                  55                  60
Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu
65                  70                  75                  80
Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln
                85                  90                  95
Ser Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala
            100                 105                 110
Ser Ala Leu Ala Ser Ser Gly Asn Thr Leu Thr Pro Gln Gly Ser Ser
        115                     120                 125
Leu Ser Ser Gly Leu Gln Leu Asn Asp Arg Asn Thr Trp Ala Gln Thr
    130                 135                 140
His Gln Ala His Gln Ala His Gln Gly His His Val Ser Ser Thr Ser
145                 150                 155                 160
Leu Trp Pro His His His Val Gly Gly Phe Gly Phe His Gln Ser Ser
                165                 170                 175
Ser Ser Gly Gly Leu Val Ala Thr Thr Val Gly Glu Asn Asn Ser Gly
            180                 185                 190
Asn Tyr Phe Gln Lys Ile Gly Phe Ser Gly Phe Asp Met Pro Thr Gly
        195                 200                 205
Thr Asn Leu Gly Val Gly Gly Met Ser Phe Thr Ser Ile Leu Gly Gly
    210                 215                 220
Ala Asn Gln Gln Met Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly
225                 230                 235                 240
His Ile Gly Val Leu Asn Gln Gln Ala Leu Thr Gln Ile Tyr Gln Gln
                245                 250                 255
Ile Gly Gln Asn Gln Thr Arg Val Gln His Gln Asn Gln Gln Asn Asn
            260                 265                 270
Asn Thr Thr Lys Asp Asp Ser His Ser Ser Glu Gln
        275                 280
<210>17
<211>888
<212>DNA
<213>本氏烟草(Nicotiana benthamiana)
<400>17
atggatccca agcagccgcc agcgcagtct aacgctatca acattaacaa caatattatg     60
gttgagtaca ataagcctgt tcatgatcaa ataaaagatg atgaaaccaa gaagcggcag    120
caattggttc ctaaaagaaa agataggcac acaaaagttg aaggcagagg gaggaggata    180
cgtatgcctg ctctttgcgc tgctaggatt ttccaactca cccgcgaatt aggtcataaa    240
tctgatggag agacaatcca gtggctgctg cagcaagccg agccctccat atttgcggcc    300
accgggacag ggaccatccc tgcctcggct ttagctgtag cagccgctgg cccctctgtt    360
tcccaacaga ggacctctgt atctgctggt ttgcataaaa aaatggatga attgggagcg    420
aatatagtcg ggtccgctag tatatgtagt agtagtagta ctagtagggc cagttggcca    480
atgatgattg ggaattttgg aagaccccat ttggccacag caggaatatg gcccggacct    540
actcctgttg tcaatagttt cgcgttacag acagcactga ctcctggatc aagcaccaat    600
ttgggtagtg aaagttccaa ttattaccta caaaagattg gctttcctgg atttgatctg    660
cctgcagcca ccaatatgag ttttacttca attctaggtt ccagtaataa ccagcaattg    720
ccaggtttgg agcttggatt atctcaagac aggggtcata taggggtttt aaactctcaa    780
ggcttgagcc agatatacca ggctagaatt cataatcaac agcagcacca gcaaaatcag    840
catgagcatc tatctcccga ggatgattct cacggatcag gacactaa                 888
<210>18
<211>295
<212>PRT
<213>本氏烟草
<400>18
Met Asp Pro Lys Gln Pro Pro Ala Gln Ser Asn Ala Ile Asn Ile Asn
1               5                   10                  15
Asn Asn Ile Met Val Glu Tyr Asn Lys Pro Val His Asp Gln Ile Lys
            20                  25                  30
Asp Asp Glu Thr Lys Lys Arg Gln Gln Leu Val Pro Lys Arg Lys Asp
        35                  40                  45
Arg His Thr Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala
    50                  55                  60
Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys
65                  70                  75                  80
Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser
    85                  90                  95
Ile Phe Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala
            100                 105                 110
Val Ala Ala Ala Gly Pro Ser Val Ser Gln Gln Arg Thr Ser Val Ser
        115                 120                 125
Ala Gly Leu His Lys Lys Met Asp Glu Leu Gly Ala Asn Ile Val Gly
    130                 135                 140
Ser Ala Ser Ile Cys Ser Ser Ser Ser Thr Ser Arg Ala Ser Trp Pro
145                 150                 155                 160
Met Met Ile Gly Asn Phe Gly Arg Pro His Leu Ala Thr Ala Gly Ile
                165                 170                 175
Trp Pro Gly Pro Thr Pro Val Val Asn Ser Phe Ala Leu Gln Thr Ala
           180                 185                 190
Leu Thr Pro Gly Ser Ser Thr Asn Leu Gly Ser Glu Ser Ser Asn Tyr
       195                 200                 205
Tyr Leu Gln Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Ala Ala Thr
    210                 215                 220
Asn Met Ser Phe Thr Ser Ile Leu Gly Ser Ser Asn Asn Gln Gln Leu
225                 230                 235                 240
Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Arg Gly His Ile Gly Val
                245                 250                 255
Leu Asn Ser Gln Gly Leu Ser Gln Ile Tyr Gln Ala Arg Ile His Asn
            260                 265                 270
Gln Gln Gln His Gln Gln Asn Gln His Glu His Leu Ser Pro Glu Asp
        275                 280                 285
Asp Ser His Gly Ser Gly His
290                     295
<210>19
<211>894
<212>DNA
<213>罗勒(Ocimum basilicum)
<400>19
atggatccga agagctcgaa gcagccgcag gaggtttcga atcacagcaa caccaacagc     60
ttaggcgaaa acaaagcagc ggaaatcaag gattttcaga ttgtagttgc ggagaaggat    120
gattcgaaga agctagccct agctccgaag cgaagctcca acaaggaccg ccacaccaag    180
gtggaaggcc gcggccggcg aattcggatg ccggcgctct gcgccgccag aatcttccaa    240
ttgacccgag aattagggca caaatccgat ggcgagacca tccagtggct cctccagcaa    300
gccgagccgt cgatcatcgc cgccacgggg agcggcacca tccccgcctc cgccctcgcc    360
gcagccgccg gctcgatttc tcagcaaggt agctcgattt cgtctggact ccatcagaaa    420
atcgaggatt taggcgcttc tatgggtggt ggtgggggca ggaatccctg gcctatgatt    480
ggtgggaatc tgagtagacc acatgtgggc gcaagcacag gattatggcc tcccactgga    540
ttcggcttcc agacggcgtc gtcttcttcc tcgtctggtc cgtcaatcgc ggcggagaat    600
cctaattatc tccagaaaat ggggtttgct ggatttgagc tgcccgggaa tatcgggcag    660
atgagtttca cctccatctt aagcggcggc gggcagcagc tgcccggatt ggagctcggc    720
ctttcacaag atggaaatat tggggttttg aatccgcaag cttttgggca gatttatcag    780
cagattaatc cggcggcgcg tgtggttaac gcacatcaaa atcaccacca acaacaccac    840
catcagcagc cattgtcgtc gaaagatgat gattctcaag aatcaggaca gtag          894
<210)>20
<211>297
<212>PRT
<213>罗勒
<400>20
Met Asp Pro Lys Ser Ser Lys Gln Pro Gln Glu Val Ser Asn His Ser
1               5                   10                  15
Asn Thr Asn Ser Leu Gly Glu Asn Lys Ala Ala Glu Ile Lys Asp Phe
            20                  25                  30
Gln Ile Val Val Ala Glu Lys Asp Asp Ser Lys Lys Leu Ala Leu Ala
        35                  40                  45
Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly Arg
    50                  55                  60
Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln
65                  70                  75                  80
Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp
                85                  90                  95
Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Ser Gly
            100                 105                 110
Thr Ile Pro Ala Ser Ala Leu Ala Ala Ala Ala Gly Ser Ile Ser Gln
       115                 120                 125
Gln Gly Ser Ser Ile Ser Ser Gly Leu His Gln Lys Ile Glu Asp Leu
    130                 135                 140
Gly Ala Ser Met Gly Gly Gly Gly Gly Arg Asn Pro Trp Pro Met Ile
145                 150                 155                 160
Gly Gly Asn Leu Ser Arg Pro His Val Gly Ala Ser Thr Gly Leu Trp
               165                 170                 175
Pro Pro Thr Gly Phe Gly Phe Gln Thr Ala Ser Ser Ser Ser Ser Ser
            180                 185                 190
Gly Pro Ser Ile Ala Ala Glu Asn Pro Asn Tyr Leu Gln Lys Met Gly
        195                 200                 205
Phe Ala Gly Phe Glu Leu Pro Gly Asn Ile Gly Gln Met Ser Phe Thr
    210                 215                 220
Ser Ile Leu Ser Gly Gly Gly Gln Gln Leu Pro Gly Leu Glu Leu Gly
225                 230                 235                 240
Leu Ser Gln Asp Gly Asn Ile Gly Val Leu Asn Pro Gln Ala Phe Gly
                245                 250                 255
Gln Ile Tyr Gln Gln Ile Asn Pro Ala Ala Arg Val Val Asn Ala His
            260                 265                 270
Gln Asn His His Gln Gln His His His Gln Gln Pro Leu Ser Ser Lys
        275                 280                 285
Asp Asp Asp Ser Gln Glu Ser Gly Gln
    290                 295
<210>21
<211>954
<212>DNA
<213>稻(0ryza sativa)
<400>21
atggacccca aattcccccc acccccaccg ctaaacaaaa cggagcccac caccaccacc     60
accaaccagc agcatcacca cgatgagcag cagcagcagc atcgcctcca gattcaagtt    120
catcctcagc agcaggagca gcaggatgga ggtggaggag gagggaagga tcagcagcag    180
cagcagcaga tgcaggtggt ggttgcggcg gcggcggggg agaggaggat gcaggggcta    240
gggccgaagc ggagctcgaa caaggaccgc cacaccaagg tggacgggcg ggggcggcgg    300
atccggatgc cggcgctgtg cgccgcccgg atcttccagc tcacgcggga gctcggccac    360
aagtccgacg gcgagaccgt ccagtggctg ctccagcagg cggagccggc catcgtcgcc    420
gccacgggga ccgggaccat cccggcgtcc gcgctcgcct ccgtcgcccc ctccctccct    480
tcccccaact ccgccctctc caggtcgcac caccaccacc accacatgtg ggcggcagcg    540
ccgcccacgg cgtccgccgg gttcgccggt gcagggttct ccggcgccga ctccggggtg    600
atcggcggga tcatgcagcg gatggggatc cccgccggga tcgagctcca gggcggggga    660
gcgggggggt tggggggtgg gggtggcggc ggcggtggcc acatcgggtt cgcgcccatg    720
ttcgccagcc acgcggcggc ggcggcggcc atgccggggc tagagctagg gctctcgcag    780
gacggccaca tcggcgtgct cgccgcgcag tcgctcagcc agttctacca ccaggtcggc    840
gccgccggtc agctgcagca ccagcaccag catcaccatc agcagcagca gcagcagcag    900
gacggggagg acaaccgcga cgacggcgag tccgatgagg agtccgggca gtag          954
<210>22
<211>317
<212>PRT
<213>稻
<400>22
Met Asp Pro Lys Phe Pro Pro Pro Pro Pro Leu Asn Lys Thr Glu Pro
1               5                   10                  15
Thr Thr Thr Thr Thr Asn Gln Gln His His His Asp Glu Gln Gln Gln
            20                  25                  30
Gln His Arg Leu Gln Ile Gln Val His Pro Gln Gln Gln Glu Gln Gln
        35                  40                  45
Asp Gly Gly Gly Gly Gly Gly Lys Asp Gln Gln Gln Gln Gln Gln Met
    50                  55                  60
Gln Val Val Val Ala Ala Ala Ala Gly Glu Arg Arg Met Gln Gly Leu
65                  70                  75                  80
Gly Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Asp Gly
                85                  90                  95
Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe
            100                 105                 110
Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Val Gln
        115                 120                 125
Trp Leu Leu Gln Gln Ala Glu Pro Ala Ile Val Ala Ala Thr Gly Thr
    130                 135                 140
Gly Thr Ile Pro Ala Ser Ala Leu Ala Ser Val Ala Pro Ser Leu Pro
145                 150                 155                 160
Ser Pro Asn Ser Ala Leu Ser Arg Ser His His His His His His Met
                165                 170                 175
Trp Ala Ala Ala Pro Pro Thr Ala Ser Ala Gly Phe Ala Gly Ala Gly
            180                 185                 190
Phe Ser Gly Ala Asp Ser Gly Val Ile Gly Gly Ile Met Gln Arg Met
        195                 200                 205
Gly Ile Pro Ala Gly Ile Glu Leu Gln Gly Gly Gly Ala Gly Gly Leu
    210                 215                 220
Gly Gly Gly Gly Gly Gly Gly Gly Gly His Ile Gly Phe Ala Pro Met
225                 230                 235                 240
Phe Ala Ser His Ala Ala Ala Ala Ala Ala Met Pro aly Leu Glu Leu
                245                 250                 255
Gly Leu Ser Gln Asp Gly His Ile Gly Val Leu Ala Ala Gln Ser Leu
            260                 265                 270
Ser Gln Phe Tyr His Gln Val Gly Ala Ala Gly Gln Leu Gln His Gln
        275                 280                 285
His Gln His His His Gln Gln Gln Gln Gln Gln Gln Asp Gly Glu Asp
    290                 295                 300
Asn Arg Asp Asp Gly Glu Ser Asp Glu Glu Ser Gly Gln
305                 310                 315
<210>23
<211>963
<212>DNA
<213>美洲山杨(Populus tremuloides)
<400>23
atggatccca agggctctaa ctcaaaaaac ccacatgagt tacccacttt cttgacccac     60
acccaccctt ctcctcctca tcctcctcca caacctcatc ttcaacaacc acaacaactc    120
catagccaaa accaacaaca acccaacatg ggagacaaca aaccagcaga aatcaaagac    180
tttcagattg tagtagctga caaagaagag caaaagaaac agttagcacc aaagagaagc    240
tcaaacaaag acagacacac aaaagttgaa ggtagaggta gaaggataag gatgccagct    300
ctttgtgcag cgagaatctt tcaattgaca agagaattgg gtcacaaatc tgatggagag    360
acaatacagt ggcttctaca acaagctgaa ccatctataa ttgcagcaac tgggactggt    420
actatacctg catcagcttt agcagctgct ggcggtgcaa tttcacaaca aggagcttct    480
ctttctgctg gtttgcatca aaagattgat gatttaggtg ggtccagtag tagtagggcc    540
agttgggcaa tgttaggtgg caatttaggg agaccccatc atgttactac tgcaggatta    600
tggcccccag ttggaggtta tgggttccag tcatcatcta attccactgg tccatcaaca    660
acaaatatag ggactgaagc tgctgctgct ggtggttcta gttatttgca aaaactcggg    720
tttccagggt ttgacttgcc gggtaacaac atggggccta tgagttttac ttcaatttta    780
ggtgggggta cccagcagtt accaggattg gaacttgggt tgtcacagga cgggcatatt    840
ggggttttga gtccacaagc tttgaatcag atttatcagc agatggggca tgctagagtg    900
caccagcagc agcatcagca acaaaatcct tctaaagatg attcacaagg atcaggccag    960
tga                                                                  963
<210>24
<211>320
<212>PRT
<213>美洲山杨
<400>24
Met Asp Pro Lys Gly Ser Asn Ser Lys Asn Pro His Glu Leu Pro Thr
1               5                   10                  15
Phe Leu Thr His Thr His Pro Ser Pro Pro His Pro Pro Pro Gln Pro
            20                  25                  30
His Leu Gln Gln Pro Gln Gln Leu His Ser Gln Asn Gln Gln Gln Pro
        35                  40                  45
Asn Met Gly Asp Asn Lys Pro Ala Glu Ile Lys Asp Phe Gln Ile Val
    50                  55                  60
Val Ala Asp Lys Glu Glu Gln Lys Lys Gln Leu Ala Pro Lys Arg Ser
65                  70                  75                  80
Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly Arg Arg Ile
                85                  90                  95
Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu
            100                 105                 110
Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln
        115                 120                 125
Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala
    130                 135                 140
Ser Ala Leu Ala Ala Ala Gly Gly Ala Ile Ser Gln Gln Gly Ala Ser
145                 150                 155                 160
Leu Ser Ala Gly Leu His Gln Lys Ile Asp Asp Leu Gly Gly Ser Ser
                165                 170                 175
Ser Ser Arg Ala Ser Trp Ala Met Leu Gly Gly Asn Leu Gly Arg Pro
            180                 185                 190
His His Val Thr Thr Ala Gly Leu Trp Pro Pro Val Gly Gly Tyr Gly
        195                 200                 205
Phe Gln Ser Ser Ser Asn Ser Thr Gly Pro Ser Thr Thr Asn Ile Gly
    210                 215                 220
Thr Glu Ala Ala Ala Ala Gly Gly Ser Ser Tyr Leu Gln Lys Leu Gly
225                 230                 235                 240
Phe Pro Gly Phe Asp Leu Pro Gly Asn Asn Met Gly Pro Met Ser Phe
                245                 250                 255
Thr Ser Ile Leu Gly Gly Gly Thr Gln Gln Leu Pro Gly Leu Glu Leu
            260                 265                 270
Gly Leu Ser Gln Asp Gly His Ile Gly Val Leu Ser Pro Gln Ala Leu
        275                 280                 285
Asn Gln Ile Tyr Gln Gln Met Gly His Ala Arg Val His Gln Gln Gln
    290                 295                 300
His Gln Gln Gln Asn Pro Ser Lys Asp Asp Ser Gln Gly Ser Gly Gln
305                 310                 315                 320
<210>25
<211>933
<212>DNA
<213>甘蔗(Saccharum officinarum)
<220>
<221>misc_feature
<222>(699)..(701)
<223>n是a、c、g或t
<400>25
atggacccca agttccccac acccccaccg ctaaacaaaa cggagcccac caccgcgacg   60
accaccacca ccacctcgac cgcgcagcag ctggatccta aggactacca gcagcagcag  120
ccggcgcagc accacctgca aatccaaatc caccagccgc cgcagcagga cgggggcggc  180
ggagggaagg agcaacagca gcagctgcag gtggtggcgc agcccgggga gcggaggcag  240
cagccgctcg cgcccaagcg gagctccaac aaggaccgcc acaccaaggt cgatggcagg  300
ggccgccgga tccggatgcc cgcgctgtgc gccgcgcgga tcttccagct cacgcgggag  360
ctcggccaca agtccgacgg cgagaccgtg cagtggctgc tgcagcaggc cgagccggcc  420
atcgtcgccg ccaccggcac gggcaccata ccggcgtccg cgctcgcatc cgtcgcgccc  480
tcgctcccgt cgcccacctc cgggctcgcc aggccgcacc accaccacca tccgcaccac  540
atgtgggcgc cttccgccgc gtccgcgggt ttctcctcgc cctccttcct caattccgcc  600
gccgcaggca cgggagacgc cgctggtatc ggcggcatca tgcagcggat ggggatcccc  660
gcgggcctcg agctgccggg agggggcgcc gctggggcnn ncggctttgc gcccatgttc  720
gctgaacacc ccgcggccat tccggggctc gagcttgccc tctcgcagga cggccacatc  780
gggttgctcg ccgcgcagtc gatcacccag ttctaccacc aggtgggtgc tgccggcggc  840
agcggccaga tgcagcaccc tcacggccac cagcaggagg acggggagga cgaccgcgag  900
gacggcgagt ccgatgatga gtctgggcag tag                               933
<210>26
<211>310
<212>PRT
<213>甘蔗
<220>
<221>不确定
<222>(234).(234)
<223>Xaa可以是任意天然发生的氨基酸
<400>26
Met Asp Pro Lys Phe Pro Thr Pro Pro Pro Leu Asn Lys Thr Glu Pro
1               5                   10                  15
Thr Thr Ala Thr Thr Thr Thr Thr Thr Ser Thr Ala Gln Gln Leu Asp
            20                  25                  30
Pro Lys Asp Tyr Gln Gln Gln Gln Pro Ala Gln His His Leu Gln Ile
        35                  40                  45
Gln Ile His Gln Pro Pro Gln Gln Asp Gly Gly Gly Gly Gly Lys Glu
    50                  55                  60
Gln Gln Gln Gln Leu Gln Val Val Ala Gln Pro Gly Glu Arg Arg Gln
65                  70                  75                  80
Gln Pro Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys
                85                  90                  95
Val Asp Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala
            100                 105                 110
Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu
        115                 120                 125
Thr Val Gln Trp Leu Leu Gln Gln Ala Glu Pro Ala Ile Val Ala Ala
    130                 135                 140
Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ser Val Ala Pro
145                 150                 155                 160
Ser Leu Pro Ser Pro Thr Ser Gly Leu Ala Arg Pro His His His His
                165                 170                 175
His Pro His His Met Trp Ala Pro Ser Ala Ala Ser Ala Gly Phe Ser
            180                 185                 190
Ser Pro Ser Phe Leu Asn Ser Ala Ala Ala Gly Thr Gly Asp Ala Ala
        195                 200                 205
Gly Ile Gly Gly Ile Met Gln Arg Met Gly Ile Pro Ala Gly Leu Glu
    210                 215                 220
Leu Pro Gly Gly Gly Ala Ala Gly Ala Xaa Gly Phe Ala Pro Met Phe
225                 230                 235                 240
Ala Glu His Pro Ala Ala Ile Pro Gly Leu Glu Leu Ala Leu Ser Gln
                245                 250                 255
Asp Gly His Ile Gly Leu Leu Ala Ala Gln Ser Ile Thr Gln Phe Tyr
            260                 265                 270
His Gln Val Gly Ala Ala Gly Gly Ser Gly Gln Met Gln His Pro His
        275                 280                 285
Gly His Gln Gln Glu Asp Gly Glu Asp Asp Arg Glu Asp Gly Glu Ser
    290                 295                 300
Asp Asp Glu Ser Gly Gln
305                 310
<210>27
<211>846
<212>DNA
<213>马铃薯(Solanum tuberosum)
<400>27
atggatccca agcagcctaa caacaaaaat attaagccta ctcatgatca gataaaagac   60
ttgcagattt tgaaaaatga tgaaaccaag aaacagcagc aggtggctgc tcctaaaaga  120
aaagataggc ataccaaagt tgaaggtaga gggaggagga tacgtatgcc tgctctatgt  180
gcagcaagaa tctttcaact tacgcgcgaa ttgggtcata aatctgatgg tgagacaatt  240
cagtggctgc tgcagcaagc cgagccttcg attattgctg ctactggcac agggacaatt  300
cctgcatcgg ctttagctgc agcagcatct gtttctcaac aggggatctc tgtatcagct  360
ggtttaatga ttgaatcggg ggcgaatatc gcggggtcag gtagcagtag aagtagtaat  420
agtaggacca attggccaat gatctgtggg aattttggaa gaccccattt ggctacagta  480
ggaatatggc ctgcccctgc ccctgttgtc actagttttg ggtttcagtc ctcatctgct  540
ccatcaagcg ccagtttaga cagtgaaagt tcaaactatt acttacagaa aattgggttt  600
cctggatttg atctgcctgc agctacaaat atgaatccta tgagttttac ttcaattctt  660
ggtggaagta accagcaact gccaggattg gagcttggat tatctcaaga gggtcattta  720
ggggttttga accagatata ccagcaggaa agaatgcaac atccgcagca gcaacaacaa  780
gatcagcatc agcatcagca tcaacaacaa tctccggagg atgattctca aggatcagga  840
cattaa                                                        846
<210>28
<211>281
<212>PRT
<213>马铃薯
<400>28
Met Asp Pro Lys Gln Pro Asn Asn Lys Asn Ile Lys Pro Thr His Asp
1               5                   10                  15
Gln Ile Lys Asp Leu Gln Ile Leu Lys Asn Asp Glu Thr Lys Lys Gln
            20                  25                  30
Gln Gln Val Ala Ala Pro Lys Arg Lys Asp Arg His Thr Lys Val Glu
        35                  40                  45
Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile
    50                  55                  60
Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile
65                 70                 75                 80
Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly
                85                 90                 95
Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala Ala Ala Ser Val Ser
            100                 105                 110
Gln Gln Gly Ile Ser Val Ser Ala Gly Leu Met Ile Glu Ser Gly Ala
        115                 120                 125
Asn Ile Ala Gly Ser Gly Ser Ser Arg Ser Ser Asn Ser Arg Thr Asn
    130                 135                 140
Trp Pro Met Ile Cys Gly Asn Phe Gly Arg Pro His Leu Ala Thr Val
145                 150                 155                 160
Gly Ile Trp Pro Ala Pro Ala Pro Val Val Thr Ser Phe Gly Phe Gln
                165                 170                 175
Ser Ser Ser Ala Pro Ser Ser Ala Ser Leu Asp Ser Glu Ser Ser Asn
            180                 185                 190
Tyr Tyr Leu Gln Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Ala Ala
        195                 200                 205
Thr Asn Met Asn Pro Met Ser Phe Thr Ser Ile Leu Gly Gly Ser Asn
    210                 215                 220
Gln Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln Glu Gly His Leu
225                 230                 235                 240
Gly Val Leu Asn Gln Ile Tyr Gln Gln Glu Arg Met Gln His Pro Gln
                245                 250                 255
Gln Gln Gln Gln Asp Gln His Gln His Gln His Gln Gln Gln Ser Pro
            260                 265                 270
Glu Asp Asp Ser Gln Gly Ser Gly His
        275                 280
<210>29
<211>978
<212>DNA
<213>两色蜀黍(Sorghum bicolor)
<400>29
atggacccca agttccccac acccccaccg ctaaacaaaa cggagcccac caccgcgacg     60
accaccacca cctcgaccgc gcagcagcag cagcagcagc tggatcctaa ggactaccag    120
cagccggcgc agcagcacca cctgcaaatc caaatccacc agccgccgcc gcagcagcag    180
cagcagcagg acggaggcaa ggagcagcag ctgcaggtgg tggcgcagcc cggggagcgg    240
aggcagcagg cgctcgcgcc caagcggagc tccaacaagg accgccacac caaggtcgac    300
ggcaggggcc gccggatccg gatgcccgcg ctgtgcgccg cgcggatctt ccagctcacg    360
cgggaactcg gccacaagtc cgacggcgag accgtgcagt ggctgctgca gcaggccgag    420
ccggccatcg tcgccgccac cggcaccggc accataccgg cgtccgcgct cgcatccgtc    480
gcgccctcgc tcccgtcgcc cacctccggg ctcgccaggc cgcaccacca ccaccacccg    540
caccacatgt gggcgccgtc cgccgcgtcc gcgggtttct cctcgccctc cttcctcaat    600
tccgccgccg cgggcacggg agacgccgct ggtatcggcg gactcatgca gcggatgggg    660
atccccgcgg gtctcgagct gccgggaggc ggcgccgctg gaggcaccct cggcgctggc    720
ggccacatcg gctttgcgcc catgttcgct ggacacgccg cggccatgcc ggggctcgag    780
ctcggcctct cgcaggacgg ccacatcggc gtgctcgcag cgcagtcgat cagccagttc    840
taccaccaag tgggtgctgc tggcggcagc ggccagatgc agcacccgca cggccaccag    900
catcaccatc atcagcagca ggaggacggg gaggacgacc gcgaggacgg cgagtccgat    960
gacgagtctg ggcagtag                                                  978
<210>30
<211>325
<212>PRT
<213>两色蜀黍
<400>30
Met Asp Pro Lys Phe Pro Thr Pro Pro Pro Leu Asn Lys Thr Glu Pro
1               5                   10                  15
Thr Thr Ala Thr Thr Thr Thr Thr Ser Thr Ala Gln Gln Gln Gln Gln
            20                  25                  30
Gln Leu Asp Pro Lys Asp Tyr Gln Gln Pro Ala Gln Gln His His Leu
        35                  40                  45
Gln Ile Gln Ile His Gln Pro Pro Pro Gln Gln Gln Gln Gln Gln Asp
    50                  55                  60
Gly Gly Lys Glu Gln Gln Leu Gln Val Val Ala Gln Pro Gly Glu Arg
65                  70                  75                  80
Arg Gln Gln Ala Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His
                85                  90                  95
Thr Lys Val Asp Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys
            100                 105                 110
Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp
        115                 120                 125
Gly Glu Thr Val Gln Trp Leu Leu Gln Gln Ala Glu Pro Ala Ile Val
    130                 135                 140
Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ser Val
145                 150                 155                 160
Ala Pro Ser Leu Pro Ser Pro Thr Ser Gly Leu Ala Arg Pro His His
                165                 170                 175
His His His Pro His His Met Trp Ala Pro Ser Ala Ala Ser Ala Gly
           180                 185                 190
Phe Ser Ser Pro Ser Phe Leu Asn Ser Ala Ala Ala Gly Thr Gly Asp
        195                 200                 205
Ala Ala Gly Ile Gly Gly Leu Met Gln Arg Met Gly Ile Pro Ala Gly
    210                 215                 220
Leu Glu Leu Pro Gly Gly Gly Ala Ala Gly Gly Thr Leu Gly Ala Gly
225                 230                 235                 240
Gly His Ile Gly Phe Ala Pro Met Phe Ala Gly His Ala Ala Ala Met
                245                 250                 255
Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His Ile Gly Val Leu
            260                 265                 270
Ala Ala Gln Ser Ile Ser Gln Phe Tyr His Gln Val Gly Ala Ala Gly
        275                 280                 285
Gly Ser Gly Gln Met Gln His Pro His Gly His Gln His His His His
    290                 295                 300
Gln Gln Gln Glu Asp Gly Glu Asp Asp Arg Glu Asp Gly Glu Ser Asp
305                 310                 315                 320
Asp Glu Ser Gly Gln
                325
<210>31
<211>891
<212>DNA
<213>葡萄(Vitis vinifera)
<400>31
atggatccca agggctcaaa gcagccgcag gaggtaccaa acttcttgag cctacctcag     60
ccaaacatgg gagagaacaa gccagctgaa gtgaaggact ttcagattgt gattgcagat    120
aaggaagagg gtaagaagca gttggccccc aagaggagct caaacaagga caggcacacc    180
aaggttgaag gcagagggag gagaataagg atgccggctc tttgtgcagc cagaattttt    240
cagttgacta gggaattggg tcacaaatct gacggggaaa ccatacagtg gttgttgcag    300
caggccgagc cgtccataat agcggccact ggtactggga caataccggc gtcggcttta    360
gcggcggcag gaggctctgt gtcgcaacag ggaacttcta tatcagcagg attgcatcaa    420
aagattgatg aattgggggg gtccagtatt gggtcaggga gtagtaggac cagttgggca    480
atggtaggtg caaatttggg gagaccccat gtggccacag ggctatggcc cccagtcagt    540
ggttttgggt ttcagtcatc atctggacca tcaaccacca atttggggaa tgaaagttcc    600
aattatctgc aaaaaattgc cttccctggg tttgacttgc ctgcaacaaa tctgggtcct    660
atgagtttta cttcaatttt gggtgggagt aaccagcagc ttcctggttt ggagctgggc    720
ctatcacagg atggtcatat tggggttttg aactcacaag ccttaagcca gatttaccag    780
cagatggggc aggccagggt gcaccagcaa cagcagcatc aacatcagca tcagcatcag    840
catcaacagc aacctcctgc taaggatgat tctcaaggtt cagggcagta g             891
<210>32
<211>296
<212>PRT
<213>葡萄
<400>32
Met Asp Pro Lys Gly Ser Lys Gln Pro Gln Glu Val Pro Asn Phe Leu
1               5                   10                  15
Ser Leu Pro Gln Pro Asn Met Gly Glu Asn Lys Pro Ala Glu Val Lys
            20                  25                  30
Asp Phe Gln Ile Val Ile Ala Asp Lys Glu Glu Gly Lys Lys Gln Leu
        35                  40                  45
Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly
    50                  55                  60
Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe
65                  70                  75                  80
Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln
                85                  90                  95
Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr
            100                 105                 110
Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala Ala Gly Gly Ser Val Ser
        115                 120                 125
Gln Gln Gly Thr Ser Ile Ser Ala Gly Leu His Gln Lys Ile Asp Glu
    130                 135                 140
Leu Gly Gly Ser Ser Ile Gly Ser Gly Ser Ser Arg Thr Ser Trp Ala
145                 150                 155                 160
Met Val Gly Ala Asn Leu Gly Arg Pro His Val Ala Thr Gly Leu Trp
                165                 170                 175
Pro Pro Val Ser Gly Phe Gly Phe Gln Ser Ser Ser Gly Pro Ser Thr
            180                 185                 190
Thr Asn Leu Gly Asn Glu Ser Ser Asn Tyr Leu Gln Lys Ile Ala Phe
        195                 200                 205
Pro Gly Phe Asp Leu Pro Ala Thr Asn Leu Gly Pro Met Ser Phe Thr
    210                 215                 220
Ser Ile Leu Gly Gly Ser Asn Gln Gln Leu Pro Gly Leu Glu Leu Gly
225                 230                 235                 240
Leu Ser Gln Asp Gly His Ile Gly Val Leu Asn Ser Gln Ala Leu Ser
                245                 250                 255
Gln Ile Tyr Gln Gln Met Gly Gln Ala Arg Val His Gln Gln Gln Gln
            260                 265                 270
His Gln His Gln His Gln His Gln His Gln Gln Gln Pro Pro Ala Lys
        275                 280                 285
Asp Asp Ser Gln Gly Ser Gly Gln
    290                 295
<210>33
<211>975
<212>DNA
<213>玉蜀黍(Zea mays)
<400>33
atggacccca agttccccac acccctagcg ctaaacaaaa cggagcccac caccgcgacg     60
accaccacca cctcgaccgc gcagcatcat cagctggatc ctaaggacta ccagcagcag    120
acggcgcagc accaggagca gcagcagcac caccatcacc cccacctgca aatccaaatc    180
caccagccgc cgccgccgcc gcaggacggg ggcggcggag tgaaggagca gcagcagctg    240
ctgcaggtgg tggcgcagcc cggggatcgg aggcagcagg cgctcgcccc caagcggagc    300
tccaacaagg accgccacac caaggtcgac ggcaggggcc gccggatccg gatgccggcg    360
ctctgcgccg cgcggatctt ccagctcacg cgggagctcg gccacaagtc cgacggcgag    420
actgtgcagt ggctgctgca gcaggccgag ccggccatcg tcgccgccac cggcacgggc    480
accataccgg cgtccgcgct cgcctccgtc gcgccctcgc tcccgtcgcc tacctccggg    540
ctcgccaggc cgcaccacca ccacccgcac cacatgtggg cgccgtccgc cggcttctcc    600
tcgccctcct tcctgaattc cgcgggcgcg ggcgacggca ccggtatcgg cggcatcatg    660
cagcggatgg gggtccccgc gggcctggag ctgccgggag gcggcgccgc cggcggccac    720
atcggctttg cgcccatgtt cgctggacac gccgcggcca tgccggggct cgagctcggc    780
ctctcgcagg acggtcacat cggcgtgctc gccgcgcagt cgatcagcca gttctaccac    840
caggtgggtg ccgctgccgg cggcagtggc cagatgcagc acccgcacgg gcaccagcat    900
caccatcatc agcagcagga ggacggggag gacgaccgcg aggacggcga gtctgatgac    960
gagtctgggc agtag                                                     975
<210>34
<211>324
<212>PRT
<213>玉蜀黍
<400>34
Met Asp Pro Lys Phe Pro Thr Pro Leu Ala Leu Asn Lys Thr Glu Pro
1               5                   10                  15
Thr Thr Ala Thr Thr Thr Thr Thr Ser Thr Ala Gln His His Gln Leu
            20                  25                  30
Asp Pro Lys Asp Tyr Gln Gln Gln Thr Ala Gln His Gln Glu Gln Gln
        35                  40                  45
Gln His His His His Pro His Leu Gln Ile Gln Ile His Gln Pro Pro
    50                  55                  60
Pro Pro Pro Gln Asp Gly Gly Gly Gly Val Lys Glu Gln Gln Gln Leu
65                  70                  75                  80
Leu Gln Val Val Ala Gln Pro Gly Asp Arg Arg Gln Gln Ala Leu Ala
                85                  90                  95
Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Asp Gly Arg
            100                 105                 110
Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln
        115                 120                 125
Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Val Gln Trp
    130                 135                 140
Leu Leu Gln Gln Ala Glu Pro Ala Ile Val Ala Ala Thr Gly Thr Gly
145                 150                 155                 160
Thr Ile Pro Ala Ser Ala Leu Ala Ser Val Ala Pro Ser Leu Pro Ser
                165                 170                 175
Pro Thr Ser Gly Leu Ala Arg Pro His His His His Pro His His Met
            180                 185                 190
Trp Ala Pro Ser Ala Gly Phe Ser Ser Pro Ser Phe Leu Asn Ser Ala
        195                 200                 205
Gly Ala Gly Asp Gly Thr Gly Ile Gly Gly Ile Met Gln Arg Met Gly
    210                 215                 220
Val Pro Ala Gly Leu Glu Leu Pro Gly Gly Gly Ala Ala Gly Gly His
225                 230                 235                 240
Ile Gly Phe Ala Pro Met Phe Ala Gly His Ala Ala Ala Met Pro Gly
                245                 250                 255
Leu Glu Leu Gly Leu Ser Gln Asp Gly His Ile Gly Val Leu Ala Ala
            260                 265                 270
Gln Ser Ile Ser Gln Phe Tyr His Gln Val Gly Ala Ala Ala Gly Gly
        275                 280                 285
Ser Gly Gln Met Gln His Pro His Gly His Gln His His His His Gln
    290                 295                 300
Gln Gln Glu Asp Gly Glu Asp Asp Arg Glu Asp Gly Glu Ser Asp Asp
305                 310                 315                 320
Glu Ser Gly Gln
<210>35
<211>948
<212>DNA
<213>玉蜀黍
<400>35
atggacccca agttcccccc acccccaccg ctaaacaaaa cggagcccac caccgcgacg   60
accaccacca cctcgaccgc gcagcagcag cagcagcagc tggatcctaa ggactaccag  120
cagcagcagc agcagccggc gcagcacctg caaatccaaa tccaccagtc gcagcaggac  180
ggaggcggcg gagggaagga gcagcagcag ctgcaggtgg tggcgcagcc cggggagagg  240
aggcagcagg cgctcgcgcc caagcggagc tccaacaagg accgacacac caaggtcgac  300
ggcaggggcc ggcggatccg gatgcccgcg ctctgcgccg cgcggatctt ccagctcacg  360
cgggaactcg gccacaagtc cgacggcgag accgtccagt ggctgctgca gcaggccgag  420
ccggccatcg tcgccgccac cggcacgggc accataccgg cgtccgcgct cgcctccgtc  480
gcgccctcgc tcccgtcgcc cacctccggg ctcgccaggc cgcaccacca catgtgggcg  540
ccgtccgccg gcttctcctc gccctccttc ctgaactctg ccgccgcggg cacgggcgat  600
gccgccggta tcatgcagcg gatggggatc cccgcgggct tcgagctgcc gggagcctcc  660
gccgccggag ccaccctcgg cgccggcggc cacatcggct ttgcgcccat gttcgctgga  720
cacgccgccg ccatgccggg gctcgagctc gggctatcgc aggacggcca catcggcgtg  780
ctcgccgcgc agtcgatcag ccagttctac caccaggtgg gtgctgccgc cggcggcggc  840
ggccagatgc atcacgcgca cgggcaccat catcaccatc accagcagca ggaggacggg    900
gaggacgacc gcgaggacgg cgagtccgat gacgagtc tg ggcagtag                948
<210>36
<211>315
<212>PRT
<213>玉蜀黍
<400>36
Met Asp Pro Lys Phe Pro Pro Pro Pro Pro Leu Asn Lys Thr Glu Pro
1               5                   10                  15
Thr Thr Ala Thr Thr Thr Thr Thr Ser Thr Ala Gln Gln Gln Gln Gln
            20                  25                  30
Gln Leu Asp Pro Lys Asp Tyr Gln Gln Gln Gln Gln Gln Pro Ala Gln
        35                  40                  45
His Leu Gln Ile Gln Ile His Gln Ser Gln Gln Asp Gly Gly Gly Gly
    50                  55                  60
Gly Lys Glu Gln Gln Gln Leu Gln Val Val Ala Gln Pro Gly Glu Arg
65                  70                  75                  80
Arg Gln Gln Ala Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His
                85                  90                  95
Thr Lys Val Asp Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys
            100                 105                 110
Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp
        115                 120                 125
Gly Glu Thr Val Gln Trp Leu Leu Gln Gln Ala Glu Pro Ala Ile Val
    130                 135                 140
Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ser Val
145                 150                 155                 160
Ala Pro Ser Leu Pro Ser Pro Thr Ser Gly Leu Ala Arg Pro His His
                165                 170                 175
His Met Trp Ala Pro Ser Ala Gly Phe Ser Ser Pro Ser Phe Leu Asn
            180                 185                 190
Ser Ala Ala Ala Gly Thr Gly Asp Ala Ala Gly Ile Met Gln Arg Met
        195                 200                 205
Gly Ile Pro Ala Gly Phe Glu Leu Pro Gly Ala Ser Ala Ala Gly Ala
    210                 215                 220
Thr Leu Gly Ala Gly Gly His Ile Gly Phe Ala Pro Met Phe Ala Gly
225                 230                 235                 240
His Ala Ala Ala Met Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly
                245                 250                 255
His Ile Gly Val Leu Ala Ala Gln Ser Ile Ser Gln Phe Tyr His Gln
            260                 265                 270
Val Gly Ala Ala Ala Gly Gly Gly Gly Gln Met His His Ala His Gly
        275                 280                 285
His His His His His His Gln Gln Gln Glu Asp Gly Glu Asp Asp Arg
    290                 295                 300
Glu Asp Gly Glu Ser Asp Asp Glu Ser Gly Gln
305                 310                 315
<210>37
<211>648
<212>DNA
<213>洋葱(Allium cepa)
<400>37
atggatccaa aagaatccca acccaactcg gatcgtcaat tgatgaccca aaccgaatcc   60
attcaagacc cgcaaaaaag agcccttctt gccccaaaac ggacctccaa caaagaccgc  120
cacaccaaag ttgacggccg cggccggagg attcgcatgc ccgctctctg cgccgccaga  180
atcttccagc tgacccgaga actcggccat aaatccgacg gcgagaccgt tcagtggctt  240
ctgcatcatg cagaacctgc catcatcgcc gctaccgggt cgggtaccat acccgcatcc  300
gctttagctt cttctcaggc gatgccgaac tctaagcccg acaacagttg ggctgttggg  360
ttatggggag gttttaattc cggatttatg aattccaata atagcagtaa caacaacaat  420
aataatggag tcggccctag ctcgagcaat ttagggtttg tggggatgga gatgacaggg  480
atgagtgggc acatgagctt tacttcaatg ctgggagggc agcctgggcc acaaatgccc  540
gggcttcagt tagggctgtc tcaagatggg catattgggg ttttgaatac acaagggttg  600
aaccattttt atcaacagat gggtcataat gttagggttg gaaatggg               648
<210>38
<211>216
<212>PRT
<213>洋葱
<400>38
Met Asp Pro Lys Glu Ser Gln Pro Asn Ser Asp Arg Gln Leu Met Thr
1               5                   10                  15
Gln Thr Glu Ser Ile Gln Asp Pro Gln Lys Arg Ala Leu Leu Ala Pro
            20                  25                  30
Lys Arg Thr Ser Asn Lys Asp Arg His Thr Lys Val Asp Gly Arg Gly
        35                  40                  45
Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu
    50                  55                  60
Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Val Gln Trp Leu
65                  70                  75                  80
Leu His His Ala Glu Pro Ala Ile Ile Ala Ala Thr Gly Ser Gly Thr
                85                  90                  95
Ile Pro Ala Ser Ala Leu Ala Ser Ser Gln Ala Met Pro Asn Ser Lys
            100                 105                 110
Pro Asp Asn Ser Trp Ala Val Gly Leu Trp Gly Gly Phe Asn Ser Gly
        115                 120                 125
Phe Met Asn Ser Asn Asn Ser Ser Asn Asn Asn Asn Asn Asn Gly Val
    130                 135                 140
Gly Pro Ser Ser Ser Asn Leu Gly Phe Val Gly Met Glu Met Thr Gly
145                 150                 155                 160
Met Ser Gly His Met Ser Phe Thr Ser Met Leu Gly Gly Gln Pro Gly
                165                 170                 175
Pro Gln Met Pro Gly Leu Gln Leu Gly Leu Ser Gln Asp Gly His Ile
            180                 185                 190
Gly Val Leu Asn Thr Gln Gly Leu Asn His Phe Tyr Gln Gln Met Gly
        195                 200                 205
His Asn Val Arg Val Gly Asn Gly
    210                 215
<210>39
<211>731
<212>DNA
<213>二穗短柄草(Brachypodium distachyon)
<400>39
atggacccca agtttcctcc tcccccaccg ctaaacaaaa cggagcccac caccggcgtg    60
acgaccacca ccaccacgac ctcccagcag cagctggatc acgagcagta tcaccagccg    120
cagcagcacc tgcaaatcca agtgcaccag cagcagcagg aggaagatgg cggcggggga    180
aaggagcagc agcagcaggt ggtggcggcg gcgggggcgg gggagaggag ggtgcagggg    240
ctggggccga agcggagctc caacaaggac cggcacacca aggtggacgg gcgggggcgg    300
cggatccgga tgccggcgct gtgcgcggcg cggatcttcc agctgacgcg ggagctgggg    360
cacaagtcgg acggggagac ggtccagtgg ctgctgcagc aggcggagcc ggccatcgtc    420
gccgccacag ggtccggcac cataccggcg tccgcgctcg cctccgtcgc gccctcgctg    480
ccttcgccca cctccgcgct cgccaggccg caccaccacc accacctctg ggggccctcg    540
gcggcggggt tctccccggc cgggttcatg aactcggccc cagccggcgc tgactctggg    600
ggcggcctcg gcgggcttat gcagaggata gggcttcccg ccgggatgga gctccctggc    660
ggcggtggtg gggggcacat cgggttcgcg cccatgttcg ccagccacgc ggcggcggcg    720
gcggccatgc c                                                         731
<210>40
<211>243
<212>PRT
<213>二穗短柄草
<400>40
Met Asp Pro Lys Phe Pro Pro Pro Pro Pro Leu Asn Lys Thr Glu Pro
1               5                   10                  15
Thr Thr Gly Val Thr Thr Thr Thr Thr Thr Thr Ser Gln Gln Gln Leu
            20                  25                  30
Asp His Glu Gln Tyr His Gln Pro Gln Gln His Leu Gln Ile Gln Val
        35                  40                  45
His Gln Gln Gln Gln Glu Glu Asp Gly Gly Gly Gly Lys Glu Gln Gln
    50                  55                  60
Gln Gln Val Val Ala Ala Ala Gly Ala Gly Glu Arg Arg Val Gln Gly
65                  70                  75                  80
Leu Gly Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Asp
                85                  90                  95
Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile
            100                 105                 110
Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Val
        115                 120                 125
Gln Trp Leu Leu Gln Gln Ala Glu Pro Ala Ile Val Ala Ala Thr Gly
    130                 135                 140
Ser Gly Thr Ile Pro Ala Ser Ala Leu Ala Ser Val Ala Pro Ser Leu
145                 150                 155                 160
Pro Ser Pro Thr Ser Ala Leu Ala Arg Pro His His His His His Leu
                165                 170                 175
Trp Gly Pro Ser Ala Ala Gly Phe Ser Pro Ala Gly Phe Met Asn Ser
            180                 185                 190
Ala Pro Ala Gly Ala Asp Ser Gly Gly Gly Leu Gly Gly Leu Met Gln
        195                 200                 205
Arg Ile Gly Leu Pro Ala Gly Met Glu Leu Pro Gly Gly Gly Gly Gly
    210                 215                 220
Gly His Ile Gly Phe Ala Pro Met Phe Ala Ser His Ala Ala Ala Ala
225                 230                 235                 240
Ala Ala Met
<210>41
<211>768
<212>DNA
<213>甘蓝(Brassica oleracea)
<400>41
atggatccca agaacccaaa tccacaccaa gtaccaaact tcttgatacc accaccacaa     60
ccgagagatg cttccgatga caacaaagaa gtaaatgatt ttcagatcgt ggtcgcttcc    120
gacaaagaac cgaacagtaa cggtaagaag cagcttgccc ccaagagaag ctcaaacaaa    180
gacagacaca ccaaagtgga aggtcgcggt cggagaatca ggatgcctgc tctctgcgcg    240
gcaaggattt ttcaactgac cagagaattg ggtcacaaat cagacggtga aacaatccag    300
tggctgcttc aacaagccga accgtcgctt atcgcagcca ccggttcagg aactgtaccg    360
gcctctgctt tagcctcagc tgcttctgct gtagtctcta accaaggcgg gtctctcact    420
gctggtttga tgatcagtca tcatgactta gactgtggtg gtgggtctag tagtggtaga    480
ccaagttggg gagaaggagg aggagaagta tggccaaatg gagctggtta cagaattggg    540
tttcccggat ttgattttcc tggtggagct atgagttttg cttccatttt tggtgctagt    600
ggtggtggta atggtaatca gatgcttgga cttgagttag ggttgtctca ggtagggaat    660
gttggggtct tgaatcaaca gatttatcaa cagatggctc aagctcaggc tcaggctcag    720
ggtagggttc ttcaccatac tcttcatcat aatccaggac atgaagag                 768
<210>42
<211>256
<212>PRT
<213>甘蓝
<400>42
Met Asp Pro Lys Asn Pro Asn Pro His Gln Val Pro Asn Phe Leu Ile
1               5                   10                  15
Pro Pro Pro Gln Pro Arg Asp Ala Ser Asp Asp Asn Lys Glu Val Asn
            20                  25                  30
Asp Phe Gln Ile Val Val Ala Ser Asp Lys Glu Pro Asn Ser Asn Gly
        35                  40                  45
Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr
    50                  55                  60
Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala
65                  70                  75                  80
Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly
                85                  90                  95
Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Leu Ile Ala
            100                 105                 110
Ala Thr Gly Ser Gly Thr Val Pro Ala Ser Ala Leu Ala Ser Ala Ala
        115                 120                 125
Ser Ala Val Val Ser Asn Gln Gly Gly Ser Leu Thr Ala Gly Leu Met
    130                 135                 140
Ile Ser His His Asp Leu Asp Cys Gly Gly Gly Ser Ser Ser Gly Arg
145                 150                 155                 160
Pro Ser Trp Gly Glu Gly Gly Gly Glu Val Trp Pro Asn Gly Ala Gly
                165                 170                 175
Tyr Arg Ile Gly Phe Pro Gly Phe Asp Phe Pro Gly Gly Ala Met Ser
            180                 185                 190
Phe Ala Ser Ile Phe Gly Ala Ser Gly Gly Gly Asn Gly Asn Gln Met
        195                 200                 205
Leu Gly Leu Glu Leu Gly Leu Ser Gln Val Gly Asn Val Gly Val Leu
    210                 215                 220
Asn Gln Gln Ile Tyr Gln Gln Met Ala Gln Ala Gln Ala Gln Ala Gln
225                 230                 235                 240
Gly Arg Val Leu His His Thr Leu His His Asn Pro Gly His Glu Glu
                245                 250                 255
<210>43
<211>723
<212>DNA
<213>芜青(Brassica rapa)
<400>43
agaagctcaa acaaagacag acacatcaaa gtggaaggca ggggtcggag aatcaggatg     60
cctgctctct gcgccgctag gatcttccag ttgactagag aattgggtca caaatccgac    120
ggcgagacaa tccagtggct gcttcagcag gctgagccgt cgattatcgc agccaccggt    180
tcaggaacta taccggcctc tgctttagcc tcagccgctg ctgctgtatc gagccaccat    240
cttcagggtg gtgggtctct cactgctggt ttgatgatca gtcatgagtt ggatggtggg    300
tctagtagtg ggagaccaaa ttggggtgtt ggcgggggag atggagggtc taggtcgagt    360
ttaccaactg ggctgtggcc aaatgtagct gggtttggag ctggggtgca gaccatgagt    420
gatggaggtg gttacaggat tgggtttcct gggtttgatt atcctggtgg agctatgagt    480
tttgcgtcca ttcttggtgg tggtagtaac aatcagatgc ctggacttga gttagggttg    540
gctcaggaag ggaatgttgg tgtcttgaat cctcagtctt ttgcacagat ttatcagcag    600
cagatgagtc aggctcaagc tcagggtagg gttcttcacc atactcttca gcataaccca    660
tcacatgagg agcatcagca agagagtggt gagaaagatg attctcaagg gtcagggcgt    720
taa                                                                  723
<210>44
<211>240
<212>PRT
<213>芜青
<400>44
Arg Ser Ser Asn Lys Asp Arg His Ile Lys Val Glu Gly Arg Gly Arg
1               5                   10                  15
Arg lle Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr
            20                  25                  30
Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu
        35                  40                  45
Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Ser Gly Thr Ile
    50                  55                  60
Pro Ala Ser Ala Leu Ala Ser Ala Ala Ala Ala Val Ser Ser His His
65                  70                  75                  80
Leu Gln Gly Gly Gly Ser Leu Thr Ala Gly Leu Met Ile Ser His Glu
                85                  90                  95
Leu Asp Gly Gly Ser Ser Ser Gly Arg Pro Asn Trp Gly Val Gly Gly
            100                 105                 110
Gly Asp Gly Gly Ser Arg Ser Ser Leu Pro Thr Gly Leu Trp Pro Asn
        115                 120                 125
Val Ala Gly Phe Gly Ala Gly Val Gln Thr Met Ser Asp Gly Gly Gly
    130                 135                 140
Tyr Arg Ile Gly Phe Pro Gly Phe Asp Tyr Pro Gly Gly Ala Met Ser
145                 150                 155                 160
Phe Ala Ser Ile Leu Gly Gly Gly Ser Asn Asn Gln Met Pro Gly Leu
                165                 170                 175
Glu Leu Gly Leu Ala Gln Glu Gly Asn Val Gly Val Leu Asn Pro Gln
            180                 185                 190
Ser Phe Ala Gln Ile Tyr Gln Gln Gln Met Ser Gln Ala Gln Ala Gln
        195                 200                 205
Gly Arg Val Leu His His Thr Leu Gln His Asn Pro Ser His Glu Glu
    210                 215                 220
His Gln Gln Glu Ser Gly Glu Lys Asp Asp Ser Gln Gly Ser Gly Arg
225                 230                 235                 240
<210>45
<211>696
<212>DNA
<213>中粒咖啡(Coffea canephora)
<220>
<221>misc_feature
<222>(561)..(561)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(622)..(622)
<223>n是a、c、g或t
<400>45
attttccagc tcaccagaga attgggtcac aaatccgatg gagaaaccat ccaatggctg   60
ttacagcagg ctgaaccatc cattatagcc gccacgggga cggggaccat accggcctcc  120
gctctagccg ctgcggccgc tggagcaggg ggctctgttt ccatgtcagc tgggctgcat  180
cctccaaaga tcagtgctga attgggtgca caccaccccc cacacatgga tattgccggg  240
tcaggtcaag gagcgggtag caccggtgct agtaggacca attggccaat ggtcggcggg  300
agtttgttac gagcccccca tatgggaatg cccactacaa ctgcagggat atggccccct  360
acttctgctt ctggtgctgt cagtggtttc gggttccagt catcatcctc ccctgctcca  420
gcagccacca gtttgggcac tgaaagttca aattacctac acaagcttgg gtttcctggt  480
tttgacttgc cagctgcaac taacaacttg ggtcctatga gtttcacctc catcgtgggg  540
gctgctactg accagcagca ncaccttcct ggattggagc tggggctatc acaagatggt  600
catgttgggg ttttgaaccc tncaaccttg agccagattt atcagcatat ggggcaggct  660
cgagcgcacc agcacaacac agcacgagac cacagc                            696
<210>46
<211>232
<212>PRT
<213>中粒咖啡
<220>
<221>不确定
<222>(187)..(187)
<223>Xaa可以是任意天然发生的氨基酸
<220>
<221>不确定
<222>(208)..(208)
<223>Xaa可以是任意天然发生的氨基酸
<400>46
Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr
1                5                  10                  15
Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr
            20                  25                  30
Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala Ala Ala Ala Gly
        35                  40                  45
Ala Gly Gly Ser Val Ser Met Ser Ala Gly Leu His Pro Pro Lys Ile
    50                  55                  60
Ser Ala Glu Leu Gly Ala His His Pro Pro His Met Asp Ile Ala Gly
65                  70                  75                  80
Ser Gly Gln Gly Ala Gly Ser Thr Gly Ala Ser Arg Thr Asn Trp Pro
                85                  90                  95
Met Val Gly Gly Ser Leu Leu Arg Ala Pro His Met Gly Met Pro Thr
            100                 105                 110
Thr Thr Ala Gly Ile Trp Pro Pro Thr Ser Ala Ser Gly Ala Val Ser
        115                 120                 125
Gly Phe Gly Phe Gln Ser Ser Ser Ser Pro Ala Pro Ala Ala Thr Ser
    130                 135                 140
Leu Gly Thr Glu Ser Ser Asn Tyr Leu His Lys Leu Gly Phe Pro Gly
145                 150                 155                 160
Phe Asp Leu Pro Ala Ala Thr Asn Asn Leu Gly Pro Met Ser Phe Thr
                165                 170                 175
Ser Ile Val Gly Ala Ala Thr Asp Gln Gln Xaa His Leu Pro Gly Leu
            180                 185                 190
Glu Leu Gly Leu Ser Gln Asp Gly His Val Gly Val Leu Asn Pro Xaa
        195                 200                 205
Thr Leu Ser Gln Ile Tyr Gln His Met Gly Gln Ala Arg Ala His Gln
    210                 215                 220
His Asn Thr Ala Arg Asp His Ser
225                 230
<210>47
<211>993
<212>DNA
<213>向日葵(Helianthus annuus)和Helianthus petiolaris
<400>47
tcggccgggg gacccaaagg ctcaaaccta catcatcctc aacagcagcc acatgaggcc     60
tcaagttcaa ccttcttagc ccacccaaac cccaccacaa cagacaacat gggagatcac    120
aacaacaata acatcaacac caacaacctc aacaaacttt ctgaaatcaa agatttccag    180
attacagttt ctgacaaaca agagtctgct accaagaaac aacagttagc ccccaaaaga  240
acctccaata aagacaggca caccaaggtt gaaggaagag gtaggaggat aaggatgcct  300
gctttatgtg ctgcaagaat ctttcagctc actagagagt taggtaacaa atctgatggt  360
gaaactattc aatggctgct acagcaagct gagccttcca ttatagccgc caccggaacc  420
gggacaatcc cggcttctgt gttagccgcc actggggcgg cttcacacgg ggtctcgatt  480
tcggttggct tgcaacaaaa gattgatgaa ttaagcggga gtaataataa cagtaatagt  540
aatattaata ctggtgtcaa ctgtaggacc agttggccaa tggttggtcc agctttgggt  600
gtgggtagac ccactaccca tatggctacg cctacggcta tctggcccgc tgctggattc  660
gggttccagt cctcttcttc gtccccaggt ccatcgggca acaatttggg cgtcgaaagt  720
tcgaattact tgcaaaagat ggcgttttcc gggtttgatt tgcccggttc taatatgggt  780
cagatgagtt tttcttcgat tttgggtaat cataatcata atcataatca tcatcagcag  840
cagcttcctg ggctggagct tggactgtcc caggatggtc atttaggggt tttgaatcaa  900
caggctttga atcagatata ccaaatggac cagaccagaa tgcaacaaca gcagacttca  960
aatgataatt ctcaaggttc agaggggcag tag                               993
<210>48
<211>329
<212>PRT
<213>向日葵和Helianthus petiolaris
<400>48
Ser Ala Gly Gly Pro Lys Gly Ser Asn Leu His His Pro Gln Gln Gln
1               5                   10                  15
Pro His Glu Ala Ser Ser Ser Thr Phe Leu Ala His Pro Asn Pro Thr
            20                  25                  30
Thr Thr Asp Asn Met Gly Asp His Asn Asn Asn Asn Ile Asn Thr Asn
        35                  40                  45
Asn Leu Asn Lys Leu Ser Glu Ile Lys Asp Phe Gln Ile Thr Val Ser
    50                  55                  60
Asp Lys Gln Glu Ser Ala Thr Lys Lys Gln Gln Leu Ala Pro Lys Arg
65                  70                  75                  80
Thr Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly Arg Arg
                85                  90                  95
Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg
            100                 105                 110
Glu Leu Gly Asn Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln
        115                 120                 125
Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro
    130                 135                 140
Ala Ser Val Leu Ala Ala Thr Gly Ala Ala Ser His Gly Val Ser Ile
145                 150                 155                 160
Ser Val Gly Leu Gln Gln Lys Ile Asp Glu Leu Ser Gly Ser Asn Asn
                165                 170                 175
Asn Ser Asn Ser Asn Ile Asn Thr Gly Val Asn Cys Arg Thr Ser Trp
            180                 185                 190
Pro Met Val Gly Pro Ala Leu Gly Val Gly Arg Pro Thr Thr His Met
        195                 200                 205
Ala Thr Pro Thr Ala Ile Trp Pro Ala Ala Gly Phe Gly Phe Gln Ser
    210                 215                 220
Ser Ser Ser Ser Pro Gly Pro Ser Gly Asn Asn Leu Gly Val Glu Ser
225                 230                 235                 240
Ser Asn Tyr Leu Gln Lys Met Ala Phe Ser Gly Phe Asp Leu Pro Gly
                245                 250                 255
Ser Asn Met Gly Gln Met Ser Phe Ser Ser Ile Leu Gly Asn His Asn
            260                 265                 270
His Asn His Asn His His Gln Gln Gln Leu Pro Gly Leu Glu Leu Gly
        275                 280                 285
Leu Ser Gln Asp Gly His Leu Gly Val Leu Asn Gln Gln Ala Leu Asn
    290                 295                 300
Gln Ile Tyr Gln Met Asp Thr Arg Met Gln Gln Gln Gln Thr Ser Asn
305                 310                 315                 320
Asp Asn Ser Gln Gly Ser Glu Gly Gln
                325
<210>49
<211>345
<212>DNA
<213>大麦(Hordeum vulgare)
<400>49
atcggcggcc tcatgcagcg gatcggcctc cccgccggga tcgagctgcc gggcggcggc     60
gcggggggca tgggcgggca catcgggttc gcgcccatgt tcgccagcca cgcggcggcc    120
gcaataccgg ggctggagct cggcctgtcg caggagggcc acatcggggt gctcagccag    180
ttctaccacc aggtcggcgg cgccggggcc agcgggcagc tgcagcaccc gcaccctcat    240
cagcaccacc accacgaaca gcaccaccat caccagcagc agcagcagga ggaggacggg    300
gaggaggagc gcgaggacgg cgactccgag gaggagtccg gccag                    345
<210>50
<211>115
<212>PRT
<213>大麦
<400>50
Ile Gly Gly Leu Met Gln Arg Ile Gly Leu Pro Ala Gly Ile Glu Leu
1               5                   10                  15
Pro Gly Gly Gly Ala Gly Gly Met Gly Gly His Ile Gly Phe Ala Pro
            20                  25                  30
Met Phe Ala Ser His Ala Ala Ala Ala Ile Pro Gly Leu Glu Leu Gly
        35                  40                  45
Leu Ser Gln Glu Gly His Ile Gly Val Leu Ser Gln Phe Tyr His Gln
    50                  55                  60
Val Gly Gly Ala Gly Ala Ser Gly Gln Leu Gln His Pro His Pro His
65                  70                  75                  80
Gln His His His His Glu Gln His His His His Gln Gln Gln Gln Gln
                85                  90                  95
Glu Glu Asp Gly Glu Glu Glu Arg Glu Asp Gly Asp Ser Glu Glu Glu
            100                 105                 110
Ser Gly Gln
        115
<210>51
<211>521
<212>DNA
<213>亚麻(Linum usitatissimum)
<400>51
atcatcatca cccatctatt ctcttgtcta tcctctctcc cctgcagctc ttcttatctt    60
gtgcttatgg aacaacaaca acaacaacca aaggtcccaa accaccttga tgatccacac    120
caaaacagca acaaccctct ttcggcaatg aaagacgttc aaatcacatc acttgttcca    180
aacagcagta caaagaagca gcagagttta ggtccgaaga ggagttcgaa caaggacagg    240
cacaagaaag tggacggaag agggagaagg atcaggatgc cagctttatg cgccgctagc    300
atcttccagc tgactcgaga attgggtcac aaatccgacg gcgagaccat ccagtggctt    360
ctgaaccaat ctgagccgtc catcattgca gccaccggca ccgggacaat tccggcctct    420
gctcttgccg ctgcagggtc ctctgtttct aattcggaga tgcaggggag ctctgtttct    480
ttctctgctg ggaacaattg ggcagccttg atgaatgcca a                        521
<210>52
<211>173
<212>PRT
<213>亚麻
<400>52
Ile Ile Ile Thr His Leu Phe Ser Cys Leu Ser Ser Leu Pro Cys Ser
1               5                   10                  15
Ser Ser Tyr Leu Val Leu Met Glu Gln Gln Gln Gln Gln Pro Lys Val
            20                  25                  30
Pro Asn His Leu Asp Asp Pro His Gln Asn Ser Asn Asn Pro Leu Ser
        35                  40                  45
Ala Met Lys Asp Val Gln Ile Thr Ser Leu Val Pro Asn Ser Ser Thr
    50                  55                  60
Lys Lys Gln Gln Ser Leu Gly Pro Lys Arg Ser Ser Asn Lys Asp Arg
65                  70                  75                  80
His Lys Lys Val Asp Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu
                85                  90                  95
Cys Ala Ala Ser Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser
            100                 105                 110
Asp Gly Glu Thr Ile Gln Trp Leu Leu Asn Gln Ser Glu Pro Ser Ile
        115                 120                 125
Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala
    130                 135                 140
Ala Gly Ser Ser Val Ser Asn Ser Glu Met Gln Gly Ser Ser Val Ser
145                 150                 155                 160
Phe Ser Ala Gly Asn Asn Trp Ala Ala Leu Met Asn Ala
                165                 170
<210>53
<211>441
<212>DNA
<213>百脉根(Lotus corniculatus)
<400>53
atggatccca agggctcaaa gcagcagaac caggaggttg ttccaaactt ccttcaacaa     60
caacaacaag ggaacaacaa caacaacatg ggagagaaca aaccatccga ggttaaggat    120
ttccagattg tgattgctga gaaagatgag agcaagaagc agttggcacc aaagaggacc    180
tccaacaagg acagacacac aaaagttgaa ggcaggggaa ggaggataag gatgccagct    240
ctgtgtgcag caagaatctt ccagttgacc agagaattag gtcacaaatc tgatggtgaa    300
accatccagt ggcttctgca gcaggctgag ccatcaatca tagcagccac tggaactgga    360
acaatcccag catctgcttt agcttctgct gctggtaact ctgtttcaca acaggggacc    420
tctttatctg ctggtt tgca c                                             441
<210>54
<211>147
<212>PRT
<213>百脉根
<400>54
Met Asp Pro Lys Gly Ser Lys Gln Gln Asn Gln Glu Val Val Pro Asn
1               5                   10                  15
Phe Leu Gln Gln Gln Gln Gln Gly Asn Asn Asn Asn Asn Met Gly Glu
            20                  25                  30
Asn Lys Pro Ser Glu Val Lys Asp Phe Gln Ile Val Ile Ala Glu Lys
        35                  40                  45
Asp Glu Ser Lys Lys Gln Leu Ala Pro Lys Arg Thr Ser Asn Lys Asp
    50                  55                  60
Arg His Thr Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala
65                  70                  75                  80
Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys
                85                  90                  95
Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser
            100                 105                 110
Ilc Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala
        115                 120                 125
Ser Ala Ala Gly Asn Ser Val Ser Gln Gln Gly Thr Ser Leu Ser Ala
    130                 135                 140
Gly Leu His
145
<210>55
<211>668
<212>DNA
<213>碧冬茄(Petunia hybrida)
<400>55
gcggcgtcta aatatggatc cccgggctgc aggaatcggc acgagagaga aagtagcaag     60
aaacaattag ctccaaaaag aagttcaaac aaagataggc ataaaaaagt agatggtaga    120
ggtagaagaa ttcgtatgcc agctttatgt gctgcaagaa ttttccaatt gactcgtgaa    180
ttgggtcata aaactgatgg tgaaacaatt caatggctgt tacaacaagc tgagccttca    240
attattgctg ctactgggac tggtactatt cctgcttcag ttcttgcagc tgctacttcc    300
tctgtttctg aacaggggaa ctctgtttct gctacttctt tacattcaag aattgatgat    360
tatggtttgt ttagagctaa ttgggctaat ttaagtagac cccagatgcc tgtttctggt    420
tcttggccta gttttggatc aggatttgtg caaaattcaa gtaatttgag tactcaaatg    480
ttgagttctg ttccaagatt tggctttgag tttactcaaa attcattggg atttaatcag    540
aatcaaaatg ttcctggttt agaacttgga ttatctcaag agggtcgaat tgggaacttg    600
aattttcaat ctttacaaca gttttatcag caaatagcta cacaaagtgg agatgctgct    660
gctcgagg                                                             668
<210>56
<211>222
<212>PRT
<213>碧冬茄
<400>56
Ala Ala Ser Lys Tyr Gly Ser Pro Gly Cys Arg Asn Arg His Glu Arg
1               5                   10                  15
Glu Ser Ser Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp
            20                  25                  30
Arg His Lys Lys Val Asp Gly Arg Gly Arg Arg Ile Arg Met Pro Ala
        35                  40                  45
Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys
    50                  55                  60
Thr Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser
65                  70                  75                  80
Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser Val Leu Ala
                85                  90                  95
Ala Ala Thr Ser Ser Val Ser Glu Gln Gly Asn Ser Val Ser Ala Thr
            100                 105                 110
Ser Leu His Ser Arg Ile Asp Asp Tyr Gly Leu Phe Arg Ala Asn Trp
        115                 120                 125
Ala Asn Leu Ser Arg Pro Gln Met Pro Val Ser Gly Ser Trp Pro Ser
    130                 135                 140
Phe Gly Ser Gly Phe Val Gln Asn Ser Ser Asn Leu Ser Thr Gln Met
145                 150                 155                 160
Leu Ser Ser Val Pro Arg Phe Gly Phe Glu Phe Thr Gln Asn Ser Leu
                165                 170                 175
Gly Phe Asn Gln Asn Gln Asn Val Pro Gly Leu Glu Leu Gly Leu Ser
            180                 185                 190
Gln Glu Gly Arg Ile Gly Asn Leu Asn Phe Gln Ser Leu Gln Gln Phe
        195                 200                 205
Tyr Gln Gln Ile Ala Thr Gln Ser Gly Asp Ala Ala Ala Arg
    210                 215                 220
<210>57
<211>294
<212>DNA
<213>桃(Prunus persica)
<400>57
gagttcaaat tacatgcaaa agatggcttt cctggctttg acttgcctgt ctccaacatg     60
ggtcctatga gtttcacctc aattttgggt ggtgggagta accaacagct tcctggcttg    120
gagcttgggt tgtctcagga tggtcatatt ggggttttga actcacaagc cttgagccag    180
atttaccagc agatggggca tgctagagta caccagcacc agcaccagca ccagcaccag    240
caccagcacc agcaaccccc tgctaaggat gactctcaag gctcaggaca gtag    294
<210>58
<211>97
<212>PRT
<213>桃
<400>58
Glu Phe Lys Leu His Ala Lys Asp Gly Phe Pro Gly Phe Asp Leu Pro
1               5                   10                  15
Val Ser Asn Met Gly Pro Met Ser Phe Thr Ser Ile Leu Gly Gly Gly
            20                  25                  30
Ser Asn Gln Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly
        35                  40                  45
His Ile Gly Val Leu Asn Ser Gln Ala Leu Ser Gln Ile Tyr Gln Gln
    50                  55                  60
Met Gly His Ala Arg Val His Gln His Gln His Gln His Gln His Gln
65                  70                  75                  80
His Gln His Gln Gln Pro Pro Ala Lys Asp Asp Ser Gln Gly Ser Gly
                85                  90                  95
Gln
<210>59
<211>936
<212>DNA
<213>蓖麻(Ricinus communis)
<400>59
aacccacatg aattacctaa cttcttgact caccctcctc aaccagccct acagcaacaa     60
caacaaccac aacaagaaca acaacatcaa aaccagaaac aacagacaaa catgggagag    120
aataaaccag cagaaatcaa agatttccag attgttattg cagataaaga agagcagaag    180
aaacagttag caccaaaaag aagctcaaac aaagacagac atacgaaagt tgaaggaaga    240
gggaggagga taaggatgcc agcactttgt gcagcaagaa tctttcaatt gacaagagaa    300
ttgggtcata aatctgatgg ggaaacaata cagtggttat tacaacaagc tgaaccatct    360
ataattgctg caactgggac aggaacgata ccagcatcag ctttggtagc tgctggtgga    420
tcagtttcac agcaagggac ttctctatca gctggattac accaaaagat tgatgattta    480
ggtgggtcca gtagtattac tagtagtaat agtaggacaa gttgggcaat ggtaggtggc    540
aatttaggga gaccccatca tgtggcaaca acagggttat ggcccccagt tggtggtttt    600
ggattccagt catcatctac tactactggt ccagtaacat caaatttggg aaatgaaagt    660
tctagttatt tgcaaaaaat tgggtttcct gggtttgatt tgccagggaa taatatggga    720
cctatgagtt ttacctcaat cttgggtggg actagcaacc agcagatacc tggtttggag    780
cttgggttgt cacaagatgg tcatattggg gttttgaatt cacaagcttt tagtcagatt    840
tatcagcaga tggggcaggc cagagtgcag caccagcacc agcaccagca ccagcaaaat    900
cctgctaagg atgattctca agggtcagga cagtaa                              936
<210>60
<211>311
<212>PRT
<213>蓖麻
<400>60
Asn Pro His Glu Leu Pro Asn Phe Leu Thr His Pro Pro Gln Pro Ala
1               5                   10                  15
Leu Gln Gln Gln Gln Gln Pro Gln Gln Glu Gln Gln His Gln Asn Gln
            20                  25                  30
Lys Gln Gln Thr Asn Met Gly Glu Asn Lys Pro Ala Glu Ile Lys Asp
        35                  40                  45
Phe Gln Ile Val Ile Ala Asp Lys Glu Glu Gln Lys Lys Gln Leu Ala
    50                  55                  60
Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly Arg
65                  70                  75                  80
Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln
                85                  90                  95
Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp
            100                 105                 110
Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly
        115                 120                 125
Thr Ile Pro Ala Ser Ala Leu Val Ala Ala Gly Gly Ser Val Ser Gln
    130                 135                 140
Gln Gly Thr Ser Leu Ser Ala Gly Leu His Gln Lys Ile Asp Asp Leu
145                 150                 155                 160
Gly Gly Ser Ser Ser Ile Thr Ser Ser Asn Ser Arg Thr Ser Trp Ala
                165                 170                 175
Met Val Gly Gly Asn Leu Gly Arg Pro His His Val Ala Thr Thr Gly
            180                 185                 190
Leu Trp Pro Pro Val Gly Gly Phe Gly Phe Gln Ser Ser Ser Thr Thr
        195                 200                 205
Thr Gly Pro Val Thr Ser Asn Leu Gly Asn Glu Ser Ser Ser Tyr Leu
    210                 215                 220
Gln Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Gly Asn Asn Met Gly
225                 230                 235                 240
Pro Met Ser Phe Thr Ser Ile Leu Gly Gly Thr Ser Asn Gln Gln Ile
                245                 250                 255
Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His Ile Gly Val Leu
            260                 265                 270
Asn Ser Gln Ala Phe Ser Gln Ile Tyr Gln Gln Met Gly Gln Ala Arg
        275                 280                 285
Val Gln His Gln His Gln His Gln His Gln Gln Asn Pro Ala Lys Asp
    290                 295                 300
Asp Ser Gln Gly Ser Gly Gln
305                 310
<210>61
<211>231
<212>DNA
<213>丹参(Salvia miltiorrhiza)
<400>61
agtttcacct caattttgag cggcggcgct cagcagctgc ccggattgga gcttggccta     60
tcacaagatg gaaatattgg cgtgctcaat cctcaagcat tcgggcagtt ttatcagcag    120
atggcaccgg cggcgcgtgt tgcccaccac catcagcagc aacaccacca ccaccatcag    180
cagcagcctt tgtcgcccaa ggatgatgat tctcaagaat caggacagta g             231
<210>62
<211>76
<212>PRT
<213>丹参
<400>62
Ser Phe Thr Ser Ile Leu Ser Gly Gly Ala Gln Gln Leu Pro Gly Leu
1               5                   10                  15
Glu Leu Gly Leu Ser Gln Asp Gly Asn Ile Gly Val Leu Asn Pro Gln
            20                  25                  30
Ala Phe Gly Gln Phe Tyr Gln Gln Met Ala Pro Ala Ala Arg Val Ala
        35                  40                  45
His His His Gln Gln Gln His His His His His Gln Gln Gln Pro Leu
    50                  55                  60
Ser Pro Lys Asp Asp Asp Ser Gln Glu Ser Gly Gln
65                  70                  75
<210>63
<211>598
<212>DNA
<213>百日菊(Zinnia elegans)
<400>63
cacacaaagg ttaaaggaag aggtagaaga attaggatgc cagctttatg tgctgcaaga     60
atctttcaac tcactaggga gttaggtaac aaatctgatg gggaaacaat ccagtggctg    120
ctacagcagg ccgagccatc tatcatagca gccactggca ccgggactat cccggcttcc    180
gtgttagcca ccaccggagc ggcttcacac ggagtctcga tttcggtagg attgcaacat    240
aagattgatg tattaggtag tgggaatagt aacactagta ttagtaatag taacagtaat    300
agtaatatct gtggcaacaa ctgtaggacc agttggccta tgggtagacc cacaacccat    360
atggccacgc ctactacagg tatatggccc gcaatgggat acgggtcttc gggtccctcg    420
ggcaacaatt taggggttga aagctcgaat tacctgcaaa agatggcgtt ttccgggttt    480
gaattgcctg ggtctaatat gggtcagatg agtttttcgt cgattttagg taatcataat    540
catgatcatc atcagcagca gcagcttcct gggttggaac ttgggttgtc ccaagatg      598
<210>64
<211>199
<212>PRT
<213>百日菊
<400>64
His Thr Lys Val Lys Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu
1               5                   10                  15
Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly Asn Lys Ser
            20                  25                  30
Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile
        35                  40                  45
Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser Val Leu Ala Thr
    50                  55                  60
Thr Gly Ala Ala Ser His Gly Val Ser Ile Ser Val Gly Leu Gln His
65                  70                  75                  80
Lys Ile Asp Val Leu Gly Ser Gly Asn Ser Asn Thr Ser Ile Ser Asn
                85                  90                  95
Ser Asn Ser Asn Ser Asn Ile Cys Gly Asn Asn Cys Arg Thr Ser Trp
            100                 105                 110
Pro Met Gly Arg Pro Thr Thr His Met Ala Thr Pro Thr Thr Gly Ile
        115                 120                 125
Tp Pro Ala Met Gly Tyr Gly Ser Ser Gly Pro Ser Gly Asn Asn Leu
   130                 135                 140
Gly Val Glu Ser Ser Asn Tyr Leu Gln Lys Met Ala Phe Ser Gly Phe
145                 150                 155                 160
Glu Leu Pro Gly Ser Asn Met Gly Gln Met Ser Phe Ser Ser Ile Leu
                165                 170                 175
Gly Asn His Asn His Asp His His Gln Gln Gln Gln Leu Pro Gly Leu
            180                 185                 190
Glu Leu Gly Leu Ser Gln Asp
        195
<210>65
<211>13
<212>PRT
<213>人工序列
<220>
<223>共有序列C-端基序1
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Arg″/取代=″Ala″
<220>
<221>不确定
<222>(10)..(10)
<223>Xaa可以是1-5个天然发生的氨基酸的一段序列
<220>
<221>变体
<222>(12)..(12)
<223>/取代=″Leu″
<400>65
Pro Gly Leu Glu Leu Gly Leu Ser Gln Xaa Gly Val Leu
1               5                   10
<210>66
<211>69
<212>PRT
<213>人工序列
220
<223>SEQ ID NO:02的保守TCP结构域
<400>66
Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met
1               5                           10          15
Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly
            20                  25                  30
His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu
        35                  40                  45
Pro Ser Ile Ile Ala Ala Thr Gly Ser Gly Thr Ile Pro Ala Ser Ala
    50                  55                  60
Leu Ala Ser Ser Ala
65
<210>67
<211>2193
<212>DNA
<213>稻
<400>67
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct   60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact  120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt  180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc  240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata  300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga  360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt    420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat    480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag    540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt    600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc    660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat    720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa    780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca    840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag    900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa    960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata   1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag   1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc   1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg   1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg   1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat   1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc   1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt   1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag   1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg   1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat   1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc   1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca   1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta   1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga   1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg   1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac  1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta  2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga  2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct  2160
tggtgtagct tgccactttc accagcaaag ttc                               2193
<210>68
<211>53
<212>DNA
<213>人工序列
<220>
<223>引物:prm01501
<400>68
ggggacaagt ttgtacaaaa aagcaggctt cacaatggat cccaagaacc taa    53
<210>69
<211>48
<212>DNA
<213>人工序列
<220>
<223>引物:prm01502
<400>69
ggggaccact ttgtacaaga aagctgggtt tttaacgacc tgagcctt         48
<210>70
<211>924
<212>DNA
<213>栽培菊苣(Cichorium endivia)
<400>70
cggggggatc cagagttcaa gcaacaacat cctcaacagc agccatatga ggtttcaagc     60
ttcttaagca tcccgcaacc caccagcaac aacatgggag ataacgacaa cagcaagcct    120
tctgaaatca aagatttaca gattgtaatt cccgacaagg aaaccagcaa gaagcaacaa    180
caattagcac ccaaacgcac atccaacaaa gacaggcata caaaggttga aggccgaggt    240
cgcaggatta ggatgcccgc tctctgtgct gcaagaatct ttcagctgac tcgagaatta    300
ggtcataaat ccgatgggga aacaatccag tggctcctac agcaggccga gccttccatt    360
atcgccgcca ccggaactgg aactatcccg gcttcggtgt tagccacagc cggcgcagtt    420
tcacatgggg tttcgacttc ggcgggatta caacagaaac ttgacgaatt agttggtgtg    480
ggaaatacta gtgacagctg taggaccagt tggccgattg ttggtccggg ggtgggtaga    540
cccgcaaccc acatggccac tcctttaggt atgtggccaa ccacaaccgg atttgggttt    600
cagtcgcctc cgtcgtcctc tggtccatca tcggccaaca atttgggcat cgaaagctcc    660
aattacttgc aaaagattgc attttctggg tttgatctgc ccggttctaa tctgggcccg    720
atgagttttt cttcgatttt gggtaatcat catcaacagc aacttcccgg gttggagctg    780
ggactgtcac aagatggtca cataggggtc ttgaatcaac aagcgctgaa ccagatttac    840
cagatgggtc aggccagaat gcaccatcaa caacaacaac atcaaacttc taaggatgat    900
tctcaaggtt cagggggaca atag                                           924
<210>71
<211>307
<212>PRT
<213>栽培菊苣
<400>71
Arg Gly Asp Pro Glu Phe Lys Gln Gln His Pro Gln Gln Gln Pro Tyr
1               5                   10                  15
Glu Val Ser Ser Phe Leu Ser Ile Pro Gln Pro Thr Ser Asn Asn Met
            20                  25                  30
Gly Asp Asn Asp Asn Ser Lys Pro Ser Glu Ile Lys Asp Leu Gln Ile
        35                  40                  45
Val Ile Pro Asp Lys Glu Thr Ser Lys Lys Gln Gln Gln Leu Ala Pro
    50                  55                  60
Lys Arg Thr Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly
65                  70                  75                  80
Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu
                85                  90                  95
Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu
            100                 105                 110
Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr
        115                 120                 125
Ile Pro Ala Ser Val Leu Ala Thr Ala Gly Ala Val Ser His Gly Val
    130                 135                 140
Ser Thr Ser Ala Gly Leu Gln Gln Lys Leu Asp Glu Leu Val Gly Val
145                 150                 155                 160
Gly Asn Thr Ser Asp Ser Cys Arg Thr Ser Trp Pro Ile Val Gly Pro
                165                 170                 175
Gly Val Gly Arg Pro Ala Thr His Met Ala Thr Pro Leu Gly Met Trp
            180                 185                 190
Pro Thr Thr Thr Gly Phe Gly Phe Gln Ser Pro Pro Ser Ser Ser Gly
        195                 200                 205
Pro Ser Ser Ala Asn Asn Leu Gly Ile Glu Ser Ser Asn Tyr Leu Gln
    210                 215                 220
Lys Ile Ala Phe Ser Gly Phe Asp Leu Pro Gly Ser Asn Leu Gly Pro
225                 230                 235                 240
Met Ser Phe Ser Ser Ile Leu Gly Asn His His Gln Gln Gln Leu Pro
                245                 250                 255
Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His Ile Gly Val Leu Asn
            260                 265                 270
Gln Gln Ala Leu Asn Gln Ile Tyr Gln Met Gly Gln Ala Arg Met His
        275                 280                 285
His Gln Gln Gln Gln His Gln Thr Ser Lys Asp Asp Ser Gln Gly Ser
    290                 295                 300
Gly Gly Gln
305
<210>72
<211>585
<212>DNA
<213>野草莓(Fragaria vesca)
<400>72
accaccggca ccgggacgat cccggcgtcg gctctagcgg cggcaggagg gtctgtatcg   60
cagcagggga gttcaatatc agctggcttg tatcaaaaga cagatgattt agggtccagt  120
ggaggtagga ccagttgggc tatggtggga gggaatttag ggaggcccca tgtggctgca  180
gcaactgggc tatggccccc tgctgggttt ggtttttctt cacagtcatc ttcatctggt  240
ccatctacta caaatctggg agggactgag agcagctcca attacctcca aaagattggc  300
cttcctgggt ttgacttgcc agtcaccaac atgggaccta tgagcttcac ttcaattctg  360
ggtgggggaa gtcaacagct gcctggtttg gaacttgggt tgtctcaaga tggccatctt    420
ggggttttga attctcaggc ttaccagatt taccagcaga tgggccatgc tagagtgcac    480
caccatcaac agcagcaaca gcaacaccac cagcagcagc accaacacca gcaacagcag    540
caagctccgt cttctaagga tgattctcaa ggctcaggac agtag                    585
<210>73
<211>194
<212>PRT
<213>野草莓
<400>73
Thr Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala Ala Gly
1               5                   10                  15
Gly Ser Val Ser Gln Gln Gly Ser Ser Ile Ser Ala Gly Leu Tyr Gln
            20                  25                  30
Lys Thr Asp Asp Leu Gly Ser Ser Gly Gly Arg Thr Ser Trp Ala Met
        35                  40                  45
Val Gly Gly Asn Leu Gly Arg Pro His Val Ala Ala Ala Thr Gly Leu
    50                  55                  60
Trp Pro Pro Ala Gly Phe Gly Phe Ser Ser Gln Ser Ser Ser Ser Gly
65                  70                  75                  80
Pro Ser Thr Thr Asn Leu Gly Gly Thr Glu Ser Ser Ser Asn Tyr Leu
                85                  90                  95
Gln Lys Ile Gly Leu Pro Gly Phe Asp Leu Pro Val Thr Asn Met Gly
            100                 105                 110
Pro Met Ser Phe Thr Ser Ile Leu Gly Gly Gly Ser Gln Gln Leu Pro
        115                 120                 125
Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His Leu Gly Val Leu Asn
    130                 135                 140
Ser Gln Ala Tyr Gln Ile Tyr Gln Gln Met Gly His Ala Arg Val His
145                 150                 155                 160
His His Gln Gln Gln Gln Gln Gln His His Gln Gln Gln His Gln His
                165                 170                 175
Gln Gln Gln Gln Gln Ala Pro Ser Ser Lys Asp Asp Ser Gln Gly Ser
            180                 185                 190
Gly Gln
<210>74
<211>818
<212>DNA
<213>印度黑核桃x胡桃(Juglans hindsii x Juglans regia)
<400>74
ccaagggctc aacaacagca aagcagccac aacaagtacc aaacttcttg agcctcccac   60
aaccacaaca acaacctaac atgggtgaga acaagcctgc tgaaatcaaa gacttccaga  120
ttgtgattgc tgacaaagaa gagggcaaga agcagttggc ccccaagaga agctcaaaca  180
aagaccggca caccaaagtt gaaggcaggg gaaggagaat aaggatgcca gctctttgtg  240
cagcgaggat ttttcaattg accagagaat tgggccacaa atctgatgga gaaaccatac  300
agtggctgtt acagcaggct gagccatcga taatagcagc cactgggact ggaaccatac  360
cggcttcagc tttagcagcg gcagggggtt ctgtatcaca gcagggggcc tctctatcag  420
ctggattgca ccaaaagatt gatgatttgg gggggtccag tatcgggtta gggagtagga  480
ccagttgggc aatggtaggt gggaatttag ggagacccca tgtggccaca gggctatggc  540
ccccggtcag tgggtttggg tttcagtcat catctggtcc atcgactgcg aatttgggaa  600
gtgagagttc aaattacctg caaaagattg gcttccctgg ctttgacttg ccagccaccc  660
ctatgagttt cacctcaata ttgggtggga ataatcagca gctaccggga ttggagctcg  720
gcttatccca agatggtcat atcggggttt tgaacccaca agccttgagt cagatttatc  780
aacagatggg gcaggc taga gtgcagcagc aacagcaa                         818
<210>75
<211>272
<212>PRT
<213>印度黑核桃x胡桃
<400>75
Lys Gly Ser Thr Thr Ala Lys Gln Pro Gln Gln Val Pro Asn Phe Leu
1               5                   10                  15
Ser Leu Pro Gln Pro Gln Gln Gln Pro Asn Met Gly Glu Asn Lys Pro
            20                  25                  30
Ala Glu Ile Lys Asp Phe Gln Ile Val Ile Ala Asp Lys Glu Glu Gly
        35                  40                  45
Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr
    50                  55                  60
Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala
65                  70                  75                  80
Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly
                85                  90                  95
Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala
            100                 105                 110
Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala Ala Gly
        115                 120                 125
Gly Ser Val Ser Gln Gln Gly Ala Ser Leu Ser Ala Gly Leu His Gln
    130                 135                 140
Lys Ile Asp Asp Leu Gly Gly Ser Ser Ile Gly Leu Gly Ser Arg Thr
145                 150                 155                 160
Ser Trp Ala Met Val Gly Gly Asn Leu Gly Arg Pro His Val Ala Thr
                165                 170                 175
Gly Leu Trp Pro Pro Val Ser Gly Phe Gly Phe Gln Ser Ser Ser Gly
            180                 185                 190
Pro Ser Thr Ala Asn Leu Gly Ser Glu Ser Ser Asn Tyr Leu Gln Lys
        195                 200                 205
Ile Gly Phe Pro Gly Phe Asp Leu Pro Ala Thr Pro Met Ser Phe Thr
    210                 215                 220
Ser Ile Leu Gly Gly Asn Asn Gln Gln Leu Pro Gly Leu Glu Leu Gly
225                 230                 235                 240
Leu Ser Gln Asp Gly His Ile Gly Val Leu Asn Pro Gln Ala Leu Ser
            245                 250                 255
Gln Ile Tyr Gln Gln Met Gly Gln Ala Arg Val Gln Gln Gln Gln Gln
        260                 265                 270
<210>76
<211>474
<212>DNA
<213>人参(Panax ginseng)
<400>76
tcagcagggc tgtatcagaa aattgatgaa ttgggcgggt ctagtagtag gagcagttgg     60
ccaatggttg gtgggaattt gggaagaccc catatggcca cagcaggatt atggcccgct    120
gctgcagtcg gtggctatgg gtttcagtca tcatcatctg gtccatcgac aaccaatttg    180
ggacatgaaa gttcaaatta cttgcaaaaa attgggtttt ctgggtttga cttgccagcc    240
accaatttgg gtcctatgag ttttgcctca attttgggtg caagtaatca gcagctccct    300
ggtttggagc ttggcctctc acaagatgga catattgggg ttttgtgccc tcaagccttg    360
acccagattt accagcagat gggaaatgat agaatgcacc agcaacagca acaacagcac    420
cggaatcacc agcaggcatc tcccaaggat gaatctcaag ggtcaggaga gtag          474
<210>77
<211>157
<212>PRT
<213>人参
<400>77
Ser Ala Gly Leu Tyr Gln Lys Ile Asp Glu Leu Gly Gly Ser Ser Ser
1               5                   10                  15
Arg Ser Ser Trp Pro Met Val Gly Gly Asn Leu Gly Arg Pro His Met
            20                  25                  30
Ala Thr Ala Gly Leu Trp Pro Ala Ala Ala Val Gly Gly Tyr Gly Phe
        35                  40                  45
Gln Ser Ser Ser Ser Gly Pro Ser Thr Thr Asn Leu Gly His Glu Ser
    50                  55                  60
Ser Asn Tyr Leu Gln Lys Ile Gly Phe Ser Gly Phe Asp Leu Pro Ala
65                  70                  75                  80
Thr Asn Leu Gly Pro Met Ser Phe Ala Ser Ile Leu Gly Ala Ser Asn
                85                  90                  95
Gln Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His Ile
            100                 105                 110
Gly Val Leu Cys Pro Gln Ala Leu Thr Gln Ile Tyr Gln Gln Met Gly
        115                 120                 125
Asn Asp Arg Met His Gln Gln Gln Gln Gln Gln His Arg Asn His Gln
    130                 135                 140
Gln Ala Ser Pro Lys Asp Glu Ser Gln Gly Ser Gly Glu
145                 150                 155
<210>78
<211>582
<212>DNA
<213>枸桔(Porcirus trifoliata)
<400>78
gaaccatcta tcatcgctgc tacaggaact gggactattc cagcctctat gcttgcagct     60
gcaggggcct ctgtttctga acaggggaac tctgtttcag caggcttgca tacaaaaata    120
gaagggttgg gaccaggtgt tgggtccatt aatagggcca actggacaat gatgagtgca    180
aattttggaa ggtctcaaat tccaagtgga gtttggccaa atataaatgg aactgggtct    240
gggtttattc aaaattctgg ccagttgact tcaaattttg gaagtgaaaa tttgagtgca    300
aatccaaaat ttgggttcca cgggattgaa tttccaaata tgaatatggg tttgatgagt    360
ttctcctcta tgttgagcgg tgctagccat caaattcctg gcttggagct tggtctctca    420
caggatgcgc atgtgggggt gatgaattct caagctataa gccagttcta tcaacagatg    480
gggcatcaca gaagcgcttc aggatccttg aatcagcagc atcagcatca gcaacaaatt    540
tctgataagg atgattctca gggatcagga tcaaagcagt ag                       582
<210>79
<211>193
<212>PRT
<213>枸桔
<400>79
Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser
1               5                   10                  15
Met Leu Ala Ala Ala Gly Ala Ser Val Ser Glu Gln Gly Asn Ser Val
            20                  25                  30
Ser Ala Gly Leu His Thr Lys Ile Glu Gly Leu Gly Pro Gly Val Gly
        35                  40                  45
Ser Ile Asn Arg Ala Asn Trp Thr Met Met Ser Ala Asn Phe Gly Arg
    50                  55                  60
Ser Gln Ile Pro Ser Gly Val Trp Pro Ash Ile Asn Gly Thr Gly Ser
65                  70                  75                  80
Gly Phe Ile Gln Asn Ser Gly Gln Leu Thr Ser Asn Phe Gly Ser Glu
                85                  90                  95
Asn Leu Ser Ala Asn Pro Lys Phe Gly Phe His Gly Ile Glu Phe Pro
            100                 105                 110
Asn Met Asn Met Gly Leu Met Ser Phe Ser Ser Met Leu Ser Gly Ala
        115                 120                 125
Ser His Gln Ile Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Ala His
    130                 135                 140
Val Gly Val Met Asn Ser Gln Ala Ile Ser Gln Phe Tyr Gln Gln Met
145                 150                 155                 160
Gly His His Arg Ser Ala Ser Gly Ser Leu Asn Gln Gln His Gln His
                165                 170                 175
Gln Gln Gln Ile Ser Asp Lys Asp Asp Ser Gln Gly Ser Gly Ser Lys
            180                 185                 190
Gln
<210>80
<211>933
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>80
atgcgctcag ccgttctaca acgcggccag gcgcggcgag tgtcttgccg ggttcgggcg   60
gatggttcgg gcgtggattc gctgccctcg accagcgcca gcagcagcgc acgccctctc  120
attgatcgcc gtcagctcct gaccggtgct gctgcgtcgg tcataacctt cgttggctgc  180
ccttgccccc tgtgcaagcc tggggaggca aaggccgcag cttggaacta tggcgaagtt  240
gcgggtccgc caacctggaa gggtgtgtgt gcgacgggca agcgccagtc gcccatcaac  300
atcccgttga acacatcggc gccgaaggtc gacgcggaga tgggcgaatt cgatttcgcc  360
tacggcagct tcgagaagtg cgacgtgctg aacacgggac acagcaccat gcaggtgaac  420
ttccccgctg gcaacctggc gttcattggc aacatggagc tggagctgct gcagttccac  480
ttccacgcgc cctcggagca cgccatggat ggccgccgtt acgccatgga ggcgcatctg  540
gtgcacaaga ataaaagcac cggcaaccta gctgtgctgg gcattatgct ggagcccggc  600
ggcctgatca agaacccggc gctgtccact gctctggagg tggcgcccga ggtgcccctg  660
gccaagaagc cctcgcccaa gggcatcaac cccgtcatgc tgctgcccaa gaagagcaag  720
gccgggacac ggccgttcgt gcactaccct ggctcgctta ccacgccccc gtgttcggag  780
ggggtggact ggtttgtgtt catgcagccc atcaaggtgc ccgacagcca gatcctggac  840
ttcatgcgct tcgtgggcga caacaagaca tacgccacca acacgcggcc actgcagctg  900
ctcaacagcc gcctggtcga atacgagctg tga                           933
<210>81
<211>310
<212>PRT
<213>莱茵衣藻
<400>81
Met Arg Ser Ala Val Leu Gln Arg Gly Gln Ala Arg Arg Val Ser Cys
1               5                   10                  15
Arg Val Arg Ala Asp Gly Ser Gly Val Asp Ser Leu Pro Ser Thr Ser
            20                  25                  30
Ala Ser Ser Ser Ala Arg Pro Leu Ile Asp Arg Arg Gln Leu Leu Thr
        35                  40                  45
Gly Ala Ala Ala Ser Val Ile Thr Phe Val Gly Cys Pro Cys Pro Leu
    50                  55                  60
Cys Lys Pro Gly Glu Ala Lys Ala Ala Ala Trp Asn Tyr Gly Glu Val
65                  70                  75                  80
Ala Gly Pro Pro Thr Trp Lys Gly Val Cys Ala Thr Gly Lys Arg Gln
                85                  90                  95
Ser Pro Ile Asn Ile Pro Leu Asn Thr Ser Ala Pro Lys Val Asp Ala
            100                 105                 110
Glu Met Gly Glu Phe Asp Phe Ala Tyr Gly Ser Phe Glu Lys Cys Asp
        115                 120                 125
Val Leu Asn Thr Gly His Ser Thr Met Gln Val Asn Phe Pro Ala Gly
    130                 135                 140
Asn Leu Ala Phe Ile Gly Asn Met Glu Leu Glu Leu Leu Gln Phe His
145                 150                 155                 160
Phe His Ala Pro Ser Glu His Ala Met Asp Gly Arg Arg Tyr Ala Met
                165                 170                 175
Glu Ala His Leu Val His Lys Asn Lys Ser Thr Gly Asn Leu Ala Val
            180                 185                 190
Leu Gly Ile Met Leu Glu Pro Gly Gly Leu Ile Lys Asn Pro Ala Leu
        195                 200                 205
Ser Thr Ala Leu Glu Val Ala Pro Glu Val Pro Leu Ala Lys Lys Pro
    210                 215                 220
Ser Pro Lys Gly Ile Asn Pro Val Met Leu Leu Pro Lys Lys Ser Lys
225                 230                 235                 240
Ala Gly Thr Arg Pro Phe Val His Tyr Pro Gly Ser Leu Thr Thr Pro
                245                 250                 255
Pro Cys Ser Glu Gly Val Asp Trp Phe Val Phe Met Gln Pro Ile Lys
            260                 265                 270
Val Pro Asp Ser Gln Ile Leu Asp Phe Met Arg Phe Val Gly Asp Asn
        275                 280                 285
Lys Thr Tyr Ala Thr Asn Thr Arg Pro Leu Gln Leu Leu Asn Ser Arg
    290                 295                 300
Leu Val Glu Tyr Glu Leu
305                 310
<210>82
<211>1383
<212>DNA
<213>莱茵衣藻
<400>82
cttttgtaga cccacttgtc agtgggcact gcccctagaa gcggcttctt gaccagagaa     60
gatgcgctca gccgttctac aacgcggcca ggcgcggcga gtgtcttgcc gggttcgggc    120
ggatggttcg ggcgtggatt cgctgccctc gaccagcgcc agcagcagcg cacgccctct    180
cattgatcgc cgtcagctcc tgaccggtgc tgctgcgtcg gtcataacct tcgttggctg    240
cccttgcccc ctgtgcaagc ctggggaggc aaaggccgca gcttggaact atggcgaagt    300
tgcgggtccg ccaacctgga agggtgtgtg tgcgacgggc aagcgccagt cgcccatcaa    360
catcccgttg aacacatcgg cgccgaaggt cgacgcggag atgggcgaat tcgatttcgc    420
ctacggcagc ttcgagaagt gcgacgtgct gaacacggga cacggcacca tgcaggtgaa    480
cttccccgct ggcaacctgg cgttcattgg caacatggag ctggagctgc tgcagttcca    540
cttccacgcg ccctcggagc acgccatgga tggccgccgt tacgccatgg aggcgcatct    600
ggtgcacaag aataaaagca ccggcaacct agctgtgctg ggcattatgc tggagcccgg    660
cggcctgatc aagaacccgg cgctgtccac tgctctggag gtggcgcccg aggtgcccct    720
ggccaagaag ccctcgccca agggcatcaa ccccgtcatg ctgctgccca agaagagcaa    780
ggccgggaca cggccgttcg tgcactaccc tggctcgctt accacgcccc cgtgttcgga    840
gggggtggac tggtttgtgt tcatgcagcc catcaaggtg cccgacagcc agatcctgga   900
cttcatgcgc ttcgtgggcg acaacaagac atacgccacc aacacgcggc cactgcagct   960
gctcaacagc cgcctggtcg aatacgagct gtgagcggac acgagtgtgc tagggtcagt  1020
gagcagcgtg tgaacatgaa gattacaagt ttgctgacag agagcgggcg gagtgcccat  1080
gcatcgcatc gtaacagccc gcgaagtacg acttaacatg acataaaagt gcaatgcgca  1140
tattgactgg tttggcccac ggtggggaag gcgtacgcgc ggttccatca agcagccttt  1200
ggggaggcat cgccttgcac gcacttgccg tatgtaggcg tgctggtgaa tgaggtatgg  1260
ggcgagagac ccgcgaacta aacttaagta gattacccat gtatccttta tttggcttgc  1320
gtgccctctc aattggggca ccgatgcagg ggctggaagg ccccgtgtaa cacatgacac  1380
tca                                                                1383
<210>83
<211>310
<212>PRT
<213>莱茵衣藻
<400>83
Met Arg Ser Ala Val Leu Gln Arg Gly Gln Ala Arg Arg Val Ser Cys
1               5                   10                  15
Arg Val Arg Ala Asp Gly Ser Gly Val Asp Ser Leu Pro Ser Thr Ser
            20                  25                  30
Ala Ser Ser Ser Ala Arg Pro Leu Ile Asp Arg Arg Gln Leu Leu Thr
        35                  40                  45
Gly Ala Ala Ala Ser Val Ile Thr Phe Val Gly Cys Pro Cys Pro Leu
    50                  55                  60
Cys Lys Pro Gly Glu Ala Lys Ala Ala Ala Trp Asn Tyr Gly Glu Val
65                  70                  75                  80
Ala Gly Pro Pro Thr Trp Lys Gly Val Cys Ala Thr Gly Lys Arg Gln
                85                  90                  95
Ser Pro Ile Asn Ile Pro Leu Asn Thr Ser Ala Pro Lys Val Asp Ala
            100                 105                 110
Glu Met Gly Glu Phe Asp Phe Ala Tyr Gly Ser Phe Glu Lys Cys Asp
        115                 120                 125
Val Leu Asn Thr Gly His Gly Thr Met Gln Val Asn Phe Pro Ala Gly
    130                 135                 140
Asn Leu Ala Phe Ile Gly Asn Met Glu Leu Glu Leu Leu Gln Phe His
145                 150                 155                 160
Phe His Ala Pro Ser Glu His Ala Met Asp Gly Arg Arg Tyr Ala Met
                165                 170                 175
Glu Ala His Leu Val His Lys Asn Lys Ser Thr Gly Asn Leu Ala Val
            180                 185                 190
Leu Gly Ile Met Leu Glu Pro Gly Gly Leu Ile Lys Asn Pro Ala Leu
        195                 200                 205
Ser Thr Ala Leu Glu Val Ala Pro Glu Val Pro Leu Ala Lys Lys Pro
    210                 215                 220
Ser Pro Lys Gly Ile Asn Pro Val Met Leu Leu Pro Lys Lys Ser Lys
225                 230                 235                 240
Ala Gly Thr Arg Pro Phe Val His Tyr Pro Gly Ser Leu Thr Thr Pro
                245                 250                 255
Pro Cys Ser Glu Gly Val Asp Trp Phe Val Phe Met Gln Pro Ile Lys
            260                 265                 270
Val Pro Asp Ser Gln Ile Leu Asp Phe Met Arg Phe Val Gly Asp Asn
        275                 280                 285
Lys Thr Tyr Ala Thr Asn Thr Arg Pro Leu Gln Leu Leu Asn Ser Arg
    290                 295                 300
Leu Val Glu Tyr Glu Leu
305                 310
<210>84
<211>1244
<212>DNA
<213>拟南芥
<400>84
caaaattcat gtgttagttc ttcttcttta caaaattgag tttaaactgt tttattacta   60
atccaaatga ggaatcactt tgcactatta atagaaaata atacacaacc aaacatctaa  120
aagatactat aatagtagag atcaaagacc tgagcaaaaa ctgaaagaaa aaaaaaaaaa  180
aaaaaaaaga cttctcctca aaaatggcgt ttacactagg tggaagagct cgtcgtctag  240
tctctgcaac atcagttcat caaaatggtt gcttacacaa actgcaacaa attggatcgg  300
atcggtttca gcttggtgaa gcaaaagcaa taagattact acccaggtga taagataaag  360
tttggtcttt atagttcttt aaaaaaaaaa gtgaatcaaa gaataaagac agagattact   420
ctgtttttt tgtatcatagg agaacaaaca tggttcaaga attaggaatc agggaagaat   480
ttatggatct aaacagagaa acagagacaa gttatgattt tctggatgaa atgagacaca   540
gatttctgaa attcaagaga caaaagtatc taccggagat agaaaagttt aaagctttgg   600
ccatagctca atcaccaaag gtaatggtga taggatgtgc agattcaagg gtatgtccat   660
cttatgtact aggatttcaa cctggtgaag cttttactat ccgaaatgtc gccaatctcg   720
ttaccccggt tcagaatgga ccaacagaaa ccaactcggc tcttgagttt gcggtcacca   780
ctcttcaggt tgagaacatt atagttatgg gtcatagcaa ttgtggagga attgcagcac   840
ttatgagtca tcaaaaccac caagggcaac actctagttt agtagaaagg tgggttatga   900
atgggaaagc cgctaagtta agaacacaat tagcttcatc acatttatcc tttgatgaac   960
aatgcagaaa ctgtgagaag gaatctataa aggattctgt gatgaatttg ataacttatt  1020
catggataag agatagagta aagagaggtg aagtcaagat tcatggatgt tattacaatt  1080
tgtcagattg tagtcttgag aagtggagat taagttcaga caagactaac tatggattct  1140
atatttcaga cagagagata tggagttgag taaatattga acaatcctca gttctaatat  1200
tcagatgtat ctttgtacat acgaaatgat atttacacaa ttgg                   1244
<210>85
<211>286
<212>PRT
<213>拟南芥
<400>85
Met Ala Phe Thr Leu Gly Gly Arg Ala Arg Arg Leu Val Ser Ala Thr
1               5                   10                  15
Ser Val His Gln Ash Gly Cys Leu His Lys Leu Gln Gln Ile Gly Ser
            20                  25                  30
Asp Arg Phe Gln Leu Gly Glu Ala Lys Ala Ile Arg Leu Leu Pro Arg
        35                  40                  45
Arg Thr Asn Met Val Gln Glu Leu Gly Ile Arg Glu Glu Phe Met Asp
    50                  55                  60
Leu Asn Arg Glu Thr Glu Thr Ser Tyr Asp Phe Leu Asp Glu Met Arg
65                  70                  75                  80
His Arg Phe Leu Lys Phe Lys Arg Gln Lys Tyr Leu Pro Glu Ile Glu
                85                  90                  95
Lys Phe Lys Ala Leu Ala Ile Ala Gln Ser Pro Lys Val Met Val Ile
            100                 105                 110
Gly Cys Ala Asp Ser Arg Val Cys Pro Ser Tyr Val Leu Gly Phe Gln
        115                 120                 125
Pro Gly Glu Ala Phe Thr Ile Arg Asn Val Ala Asn Leu Val Thr Pro
    130                 135                 140
Val Gln Asn Gly Pro Thr Glu Thr Asn Ser Ala Leu Glu Phe Ala Val
145                 150                 155                 160
Thr Thr Leu Gln Val Glu Asn Ile Ile Val Met Gly His Ser Asn Cys
                165                 170                 175
Gly Gly Ile Ala Ala Leu Met Ser His Gln Asn His Gln Gly Gln His
            180                 185                 190
Ser Arg Trp Val Met Asn Gly Lys Ala Ala Lys Leu Arg Thr Gln Leu
        195                 200                 205
Ala Ser Ser His Leu Ser Phe Asp Glu Gln Cys Arg Asn Cys Glu Lys
    210                 215                 220
Glu Ser Ile Lys Asp Ser Val Met Asn Leu Ile Thr Tyr Ser Trp Ile
225                 230                 235                 240
Arg Asp Arg Val Lys Arg Gly Glu Val Lys Ile His Gly Cys Tyr Tyr
                245                 250                 255
Asn Leu Ser Asp Cys Ser Leu Glu Lys Trp Arg Leu Ser Ser Asp Lys
            260                 265                 270
Thr Asn Tyr Gly Phe Tyr Ile Ser Asp Arg Glu Ile Trp Ser
        275                 280                 285
<210>86
<211>801
<212>DNA
<213>蒺藜苜蓿
<400>86
atggcaaatc aatcatctga gctagccatt gaacaactga agaagcttct cagagagaag     60
gaggaactta atggggtggc cacagcaaaa attgagcagc ttatagttga attacaggga    120
tgtcatccaa atccaattga acctgctgat cagagaatca ttgatggttt tacgtacttc    180
aagctcaaca atttcaacaa gaacccggaa ctgtatgatc gacttgctaa aggccagtct  240
cccaagttta tggtatttgc ttgttccgac tctcgagtga gtccctctgt tatcctgaac  300
tttcaacctg gtgaagcttt catggttcga aacattgcta acatggtccc tccatttaat  360
cagttaagat acagtggagt tggtgcaacc cttgagtatg ctattacagc tctaaaggtg  420
gagaacatct tggttattgg acatagtcgc tgcggcggaa tctcaaggct tatgaatcat  480
ccagaggatg gttctgctcc atatgacttc atagatgatt gggtgaaaat tggtttatct  540
tccaaagtca aggttttgaa agaacatgaa cgctgtgatt tcaaagaaca atgcaaattc  600
tgtgaaatgg aatcagtgaa taactcatta gtgaacctga agacatatcc atatgttgat  660
agagaaataa ggaacaagaa cttagctctg ttgggaggtt actatgattt tgtgagtgga  720
gaattcaagc tttggaagta taagaatcat gtcactgaac ctgttaccat ccctctaaaa  780
ggccttgaca tgaccatcta a                                            801
<210>87
<211>266
<212>PRT
<213>蒺藜苜蓿
<400>87
Met Ala Asn Gln Ser Ser Glu Leu Ala Ile Glu Gln Leu Lys Lys Leu
1               5                   10                  15
Leu Arg Glu Lys Glu Glu Leu Asn Gly Val Ala Thr Ala Lys Ile Glu
            20                  25                  30
Gln Leu Ile Val Glu Leu Gln Gly Cys His Pro Asn Pro Ile Glu Pro
        35                  40                  45
Ala Asp Gln Arg Ile Ile Asp Gly Phe Thr Tyr Phe Lys Leu Asn Asn
    50                  55                  60
Phe Asn Lys Asn Pro Glu Leu Tyr Asp Arg Leu Ala Lys Gly Gln Ser
65                  70                  75                  80
Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Ser Pro Ser
                85                  90                  95
Val Ile Leu Asn Phe Gln Pro Gly Glu Ala Phe Met Val Arg Asn Ile
            100                 105                 110
Ala Asn Met Val Pro Pro Phe Asn Gln Leu Arg Tyr Ser Gly Val Gly
        115                 120                 125
Ala Thr Leu Glu Tyr Ala Ile Thr Ala Leu Lys Val Glu Asn Ile Leu
    130                 135                 140
Val Ile Gly His Ser Arg Cys Gly Gly Ile Ser Arg Leu Met Asn His
145                 150                 155                 160
Pro Glu Asp Gly Ser Ala Pro Tyr Asp Phe Ile Asp Asp Trp Val Lys
                165                 170                 175
Ile Gly Leu Ser Ser Lys Val Lys Val Leu Lys Glu His Glu Arg Cys
            180                 185                 190
Asp Phe Lys Glu Gln Cys Lys Phe Cys Glu Met Glu Ser Val Asn Asn
        195                 200                 205
Ser Leu Val Asn Leu Lys Thr Tyr Pro Tyr Val Asp Arg Glu Ile Arg
    210                 215                 220
Asn Lys Asn Leu Ala Leu Leu Gly Gly Tyr Tyr Asp Phe Val Ser Gly
225                 230                 235                 240
Glu Phe Lys Leu Trp Lys Tyr Lys Asn His Val Thr Glu Pro Val Thr
                245                 250                 255
Ile Pro Leu Lys Gly Leu Asp Met Thr Ile
            260                 265
<210>88
<211>774
<212>DNA
<213>蒺藜苜蓿
<400>88
atggcaaatc aatcatctga gctagccatt gaacaactga agaagcttct cagagagaaa     60
gaggaactta atgaggtggc cactgcaaaa attgaggaaa ttatagttga gttgcaggga    120
tgtcatccac aaccaattga tcctgctgag cagagaatca ttgatggttt tacttacttc    180
aagctcaaca atttcgacaa ggaccggaaa ttgtatgatc gacttgctaa aggacaatcc    240
cccaagttta tggtatttgc ttgttctgac tctagagtga gtccctctat tatcctgaac    300
tttcaacctg gagaagcttt catggtccga aacattgcta acatggtccc tccatttaat    360
cagttaagat acagtggagt tggtgcaacc cttgagtatg ctattacagc tctaaaggtg    420
gagaacatct tggttattgg acatagtcgc tgcggcggta tatcaaggct tatgagtcat    480
ccagaggatg gttctgctcc atatgacttc atagatgatt gggtgaaaat tggtttacct    540
tctaaagtca aggtcctgaa agaacataaa ttctgtgatt tcgagcaaca atgtgaattt  600
tgtgaaatgg aatcagtgaa taactcatta gtgaaccttc agacatatcc atatgttgat  660
gcagaaataa ggaacaagaa cttagcacta ttggggggtt actatgactt tgtgagtgga  720
gaattcaagt tttggaagta taagactcat attactgaac ccattacaat ctga        774
<210>89
<211>257
<212>PRT
<213>蒺藜苜蓿
<400>89
Met Ala Asn Gln Ser Ser Glu Leu Ala Ile Glu Gln Leu Lys Lys Leu
1               5                   10                  15
Leu Arg Glu Lys Glu Glu Leu Asn Glu Val Ala Thr Ala Lys Ile Glu
            20                  25                  30
Glu lle Ile Val Glu Leu Gln Gly Cys His Pro Gln Pro Ile Asp Pro
        35                  40                  45
Ala Glu Gln Arg Ile Ile Asp Gly Phe Thr Tyr Phe Lys Leu Asn Asn
    50                  55                  60
Phe Asp Lys Asp Arg Lys Leu Tyr Asp Arg Leu Ala Lys Gly Gln Ser
65                  70                  75                  80
Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Ser Pro Ser
                85                  90                  95
Ile Ile Leu Asn Phe Gln Pro Gly Glu Ala Phe Met Val Arg Asn Ile
            100                 105                 110
Ala Asn Met Val Pro Pro Phe Asn Gln Leu Arg Tyr Ser Gly Val Gly
        115                 120                 125
Ala Thr Leu Glu Tyr Ala Ile Thr Ala Leu Lys Val Glu Asn Ile Leu
    130                 135                 140
Val Ile Gly His Ser Arg Cys Gly Gly Ile Ser Arg Leu Met Ser His
145                 150                 155                 160
Pro Glu Asp Gly Ser Ala Pro Tyr Asp Phe Ile Asp Asp Trp Val Lys
            165                 170                 175
Ile Gly Leu Pro Ser Lys Val Lys Val Leu Lys Glu His Lys Phe Cys
        180                 185                 190
Asp Phe Glu Gln Gln Cys Glu Phe Cys Glu Met Glu Ser Val Asn Asn
        195                 200                 205
Ser Leu Val Asn Leu Gln Thr Tyr Pro Tyr Val Asp Ala Glu Ile Arg
    210                 215                 220
Asn Lys Asn Leu Ala Leu Leu Gly Gly Tyr Tyr Asp Phe Val Ser Gly
225                 230                 235                 240
Glu Phe Lys Phe Trp Lys Tyr Lys Thr His Ile Thr Glu Pro Ile Thr
                245                 250                 255
Ile
<210>90
<211>1100
<212>DNA
<213>拟南芥
<400>90
ttcttcgata aggattttac tctccagaga aagaaaaaaa aaacctcctc tgcttttgtg   60
atcctttaag gaaaaagacg aaatggcaac ggaatcgtac gaagccgcca ttaaaggact  120
caatgatctt ctcagtacga aagcggatct cggaaacgtc gccgccgcga agatcaaagc  180
gttgacggcg gagctaaagg agcttgactc aagcaattca gacgcaattg aacgaatcaa  240
gaccggtttt actcaattca aaaccgagaa atatttgaag aatagtactt tgttcaatca  300
tcttgccaag actcagaccc caaagtttct ggtgtttgct tgctctgatt ctcgagtttg  360
tccatctcac atcttgaatt tccaacctgg tgaggctttt gttgtcagaa acatagccaa  420
tatggttcca ccttttgacc agaagagaca ctctggagtt ggcgccgccg ttgaatacgc  480
agttgtacat ctcaaggtgg agaacatttt ggtgataggc catagctgct gtggtggtat  540
taagggactc atgtccattg aagatgatgc tgccccaact caaagtgact tcattgaaaa  600
ttgggtgaag ataggcgcat cagcgaggaa caagatcaag gaggaacata aagacttgag  660
ctacgatgat caatgcaaca agtgtgagaa ggaagctgtg aacgtatcgc ttggaaactt  720
gctttcgtac ccattcgtga gagctgaggt ggtgaagaac acacttgcaa taagaggagg  780
tcactacaat ttcgtcaaag gaacgtttga tctctgggag ctcgatttca agaccactcc  840
tgcttttgcc ttctcttaag aaagaaagct accggaacat ataaaactct tttgagataa  900
aaaaagacac tttgactcat ctttcttcat tctctcatgt tgatgattcc tctccaactt  960
ctttgatttc tttttgttaa ttcaaaactt caactttgct gcttctattt caaaagctca  1020
aacaataaag ctgtaaccaa cgtttgaaac ttctatattt gtctaattga tgtttgaacg  1080
aagatttgaa ctttccttct                                              1100
<210>91
<211>280
<212>PRT
<213>拟南芥
<400>91
Met Ala Pro Ala Phe Gly Lys Cys Phe Met Phe Cys Cys Ala Lys Thr
1               5                   10                  15
Ser Pro Glu Lys Asp Glu Met Ala Thr Glu Ser Tyr Glu Ala Ala Ile
            20                  25                  30
Lys Gly Leu Asn Asp Leu Leu Ser Thr Lys Ala Asp Leu Gly Asn Val
        35                  40                  45
Ala Ala Ala Lys Ile Lys Ala Leu Thr Ala Glu Leu Lys Glu Leu Asp
    50                  55                  60
Ser Ser Asn Ser Asp Ala Ile Glu Arg Ile Lys Thr Gly Phe Thr Gln
65                  70                  75                  80
Phe Lys Thr Glu Lys Tyr Leu Lys Asn Ser Thr Leu Phe Asn His Leu
                85                  90                  95
Ala Lys Thr Gln Thr Pro Lys Phe Leu Val Phe Ala Cys Ser Asp Ser
            100                 105                 110
Arg Val Cys Pro Ser His Ile Leu Asn Phe Gln Pro Gly Glu Ala Phe
        115                 120                 125
Val Val Arg Asn Ile Ala Asn Met Val Pro Pro Phe Asp Gln Lys Arg
    130                 135                 140
His Ser Gly Val Gly Ala Ala Val Glu Tyr Ala Val Val His Leu Lys
145                 150                 155                 160
Val Glu Asn Ile Leu Val Ile Gly His Ser Cys Cys Gly Gly Ile Lys
                165                 170                 175
Gly Leu Met Ser Ile Glu Asp Asp Ala Ala Pro Thr Gln Ser Asp Phe
            180                 185                 190
Ile Glu Asn Trp Val Lys Ile Gly Ala Ser Ala Arg Asn Lys Ile Lys
        195                 200                 205
Glu Glu His Lys Asp Leu Ser Tyr Asp Asp Gln Cys Asn Lys Cys Glu
    210                 215                 220
Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Ser Tyr Pro Phe
225                 230                 235                 240
Val Arg Ala Glu Val Val Lys Asn Thr Leu Ala Ile Arg Gly Gly His
                245                 250                 255
Tyr Asn Phe Val Lys Gly Thr Phe Asp Leu Trp Glu Leu Asp Phe Lys
            260                 265                 270
Thr Thr Pro Ala Phe Ala Phe Ser
        275                 280
<210>92
<211>1748
<212>DNA
<213>稻
<400>92
atcatttttc taaaaaagaa aatcgctgcc tcgacctcgg tttctccgtc gcatcgccgt     60
cgtgctcgct gcctcgctct accccgtaaa atcccccccg gccgttgccg cgcgaagctt    120
ttccctccca caaatgcccg agaccccgac cacgacgacc accacccgcg cgagcaccgg    180
gacatcctca catggctcct agtctgctcc gccccgcctc cccgtgcctc aacctcgcgc    240
cccccaccgc cgacggcccc ggccggagcc gctccgctgt gacgatcggt ggttcgaggc    300
cgctcagcgt ttccctgcgt gtgggaggat ctagccggag ggactttccg tgtaccacaa    360
tggcctcaag agatcattct ggtttgactc gacagctttt agattttcaa catggtacag    420
tagatgagat agatggggaa catgatccat tcatggagtt gaaagcaagg ttcatggact    480
tcaagcacag gaattgtgtg gataatattt ctaactatca aaatcttgct cagcagcaaa    540
caccaaagtt catggtggtt gcttgtgctg attctagggt atgtccttca agtgttttgg    600
ggtttcagcc cggggaagca tttactgtcc gtaatatagc aaatttggta ccaccatatc    660
agcatggtgc ttcagagact agcgctgcac tggagttcgc tgtcaacaca ctagaggtag    720
agaatgtatt agtggtaggt cacagccgtt gtggtggtat ccaagcacta atgagtatga    780
aaagtaagca agatgattcg caatctagaa gctttatcag agattgggtg tcaattgcaa    840
agagtgcaag gttaagtacg gaagcagcag ctggaaattt gaattttgaa ttacagtgca    900
aacattgtga aaaggaatca attaatagct cactgttgaa cttgttaaca tacccttgga    960
tagagaaaag ggtgaatgaa ggaactttga gccttcatgg gggctattac aattttattg    1020
attgcacatt cgagaagtgg aaattagtat accgccaagg gttggaaggt ggaagcaagt    1080
atgccataaa gaataggact acctggtctt gatcaagagg cattgcttac ctgggtaaat    1140
ttcactctgc cccctgcagt ttagcatggt tttgctttgc cactgtgctg tccattttca    1200
ttgcactttg ctccattgtg gtattgacat tctgcaagaa cgagtcccag tatcaagtca    1260
ctgttacggt gttgttggta ccattgatta acataacact tgacggccat acttggtcat    1320
gttgtatgtt atcagcttca cagaggtaca tgtggcactt taacagttat ttgatacagt    1380
gactaggctg cagttgagcg aaaccacaat ggagtgaagt gcaacagaaa tgaacattat    1440
ggcagcaaag tgaaagtttg tcaaactgcc ggggacaaag tgaattttgt ccaaatatcc    1500
ctgtattatt ttctgcttag aagcatcata ttaattcaat aagctgcaaa ctcatattca    1560
taccaaaaac atgtacgatc ttgccacatt tggcaaatta ttgtgttgta tcatttatcg    1620
tgtaattgca aaaataagat agagctttgt aatctggtgt gccgggcagc tgctgtatca    1680
atataataat tctcaaatag ttgaaacaat gttgtgttta aagttcaatc tttactgttc    1740
ttttgtcg                                                             1748
<210>93
<211>306
<212>PRT
<213>稻
<400>93
Met Ala Pro Ser Leu Leu Arg Pro Ala Ser Pro Cys Leu Asn Leu Ala
1               5                   10                  15
Pro Pro Thr Ala Asp Gly Pro Gly Arg Ser Arg Ser Ala Val Thr Ile
            20                  25                  30
Gly Gly Ser Arg Pro Leu Ser Val Ser Leu Arg Val Gly Gly Ser Ser
        35                  40                  45
Arg Arg Asp Phe Pro Cys Thr Thr Met Ala Ser Arg Asp His Ser Gly
    50                  55                  60
Leu Thr Arg Gln Leu Leu Asp Phe Gln His Gly Thr Val Asp Glu Ile
65                  70                  75                  80
Asp Gly Glu His Asp Pro Phe Met Glu Leu Lys Ala Arg Phe Met Asp
                85                  90                  95
Phe Lys His Arg Asn Cys Val Asp Asn Ile Ser Asn Tyr Gln Asn Leu
            100                 105                 110
Ala Gln Gln Gln Thr Pro Lys Phe Met Val Val Ala Cys Ala Asp Ser
        115                 120                 125
Arg Val Cys Pro Ser Ser Val Leu Gly Phe Gln Pro Gly Glu Ala Phe
    130                 135                 140
Thr Val Arg Asn Ile Ala Asn Leu Val Pro Pro Tyr Gln His Gly Ala
145                 150                 155                 160
Ser Glu Thr Ser Ala Ala Leu Glu Phe Ala Val Asn Thr Leu Glu Val
                165                 170                 175
Glu Asn Val Leu Val Val Gly His Ser Arg Cys Gly Gly Ile Gln Ala
            180                 185                 190
Leu Met Ser Met Lys Ser Lys Gln Asp Asp Ser Gln Ser Arg Ser Phe
        195                 200                 205
Ile Arg Asp Trp Val Ser Ile Ala Lys Ser Ala Arg Leu Ser Thr Glu
    210                 215                 220
Ala Ala Ala Gly Asn Leu Asn Phe Glu Leu Gln Cys Lys His Cys Glu
225                 230                 235                 240
Lys Glu Ser Ile Asn Ser Ser Leu Leu Asn Leu Leu Thr Tyr Pro Trp
                245                 250                 255
Ile Glu Lys Arg Val Asn Glu Gly Thr Leu Ser Leu His Gly Gly Tyr
            260                 265                 270
Tyr Asn Phe Ile Asp Cys Thr Phe Glu Lys Trp Lys Leu Val Tyr Arg
        275                 280                 285
Gln Gly Leu Glu Gly Gly Ser Lys Tyr Ala Ile Lys Asn Arg Thr Thr
    290                 295                 300
Trp Ser
305
<210>94
<211>1997
<212>DNA
<213>稻
<400>94
agcagcaatg gtgtcctccc atgcagccat cgtcttcttc ctcgtcgccg cgtcgtcgct    60
cctctcatac ggtgaggcgg cgccgaagat gacggcggtg gcggcggact acgggtaccc    120
ggcggactac gggtacgcgg cggggagcaa gctggggccg gagaactggg ggaagctgag    180
cccggcgtac aagctgtgcg gcgacggcaa gaagcagtcg cccatcgaca tcgtcaccaa    240
gcaggccatc tccaacccca acctcgactc actcaaccgc acctacaccg cctccgacgg    300
caccctcgtc aacaacggca aggacatctt ggcaagccat ctaacctaac tagctagacc    360
tacctacatt gggatttttt ttgaatttgt ttttattttt aattctaaaa acaaacattt    420
ctcattcata ttttcaatat ctgaaccttt tgaccacggg ttggcgtggc aaaataatac    480
tgccatgtca gtctgaatac acggtgtggt agaaataaat tttcatgctg gttttaggtg    540
acgtgatatg ttattttacc atggtaggca ggttggcgtg gccaaaagat tcagattttg    600
gaaataaatt taagaaaggt ttgtttttga aataaaaaaa tttagaaaag ttcaagaaaa    660
aaataaaaaa aaattctcca ttgggaaaac tctattcatc ccttcaagag atatcccctt    720
atttttgcat gtcacttaaa aagtcattaa aaattttgaa aaaatttagt agcatatgta    780
atatgtcact tcacaataca tattcaaatt caacttgtac atatagaaac aaaaataaca    840
aatttgacta tgaatagaac gcataattca cggttaaatt tattattttt gtttcgaatt    900
gtataagaat tttaacttgc gtgtctgtga aaagatatat catatattga tctatcttga    960
tgattttttt tttaattttt cgataacgtt ttgaacgtca tgcacaaaac gagaggatgt   1020
cccccgaggg acaaaaatcc acttcccctg cattgttgca ttatccaatg gagctagcta   1080
gcagagattt gattgattgg catatcgaac catggcgcag atggagttcg agccagacaa   1140
ggtggggacg gtgacggtga acggcaaggt gtacagcttc aggcgggtgc actggcacgc   1200
gccgtcggag cacaccatca acggggagaa gcacccgctg gagctccaga tggtgcacgc   1260
tgccgccgac ggcagcctcg ccgtcatcgc catcctctac aagtacggcg ccccggactc   1320
cttctacttc cagctcaaga ggaagctcgc cgagctcgcc gccgacggct gcagcttcgg   1380
cgaggagaac gcccaggtcg ccctcggcct cgtccacctc cgctcgctgc agaagcggac   1440
ggggagctac ttccgctacg ccggctcgct gacggcgccg ccgtgcaccg aggacgtctt   1500
ctggagcgtg ctcggcaaga tcaggcagat cagccaggag caggtcgccc tcatcaccgc   1560
gctgctcccc gccggcggcg cgaggccgac gcagccgctc aacggccgca ccgtgcagtt   1620
ctacaacccg cccaacagca ccatctcctt caaggtctag tagccccagg cccaatgggc    1680
tttggcccat ttatatatac tatatgggtt gcattgggct gcacaggccc tgaaattgat    1740
tgaaggatct caatttttga gatttttctt gtttctggag aaaaaaaatt catgtactgt    1800
tgcttagata ggcccttatc tatagtatag taacatatgt atatgaattt aattttagga    1860
tttggaaaca tggttgctta tcctcacttg gaattaggct tttaaaagtc gagcacatgt    1920
gcacttgttt ttcattcaaa cattagcctg tcgcatagat agtctttttc ttaataatta    1980
gagctgattt  gaatttt                                                  1997
<210>95
<211>182
<212>PRT
<213>稻
<400>95
Met Ala Gln Met Glu Phe Glu Pro Asp Lys Val Gly Thr Val Thr Val
1               5                   10                  15
Asn Gly Lys Val Tyr Ser Phe Arg Arg Val His Trp His Ala Pro Ser
            20                  25                  30
Glu His Thr Ile Asn Gly Glu Lys His Pro Leu Glu Leu Gln Met Val
        35                  40                  45
His Ala Ala Ala Asp Gly Ser Leu Ala Val Ile Ala Ile Leu Tyr Lys
    50                  55                  60
Tyr Gly Ala Pro Asp Ser Phe Tyr Phe Gln Leu Lys Arg Lys Leu Ala
65                  70                  75                  80
Glu Leu Ala Ala Asp Gly Cys Ser Phe Gly Glu Glu Asn Ala Gln Val
                85                  90                  95
Ala Leu Gly Leu Val His Leu Arg Ser Leu Gln Lys Arg Thr Gly Ser
            100                 105                 110
Tyr Phe Arg Tyr Ala Gly Ser Leu Thr Ala Pro Pro Cys Thr Glu Asp
        115                 120                 125
Val Phe Trp Ser Val Leu Gly Lys Ile Arg Gln Ile Ser Gln Glu Gln
    130                 135                 140
Val Ala Leu Ile Thr Ala Leu Leu Pro Ala Gly Gly Ala Arg Pro Thr
145                 150                 155                 160
Gln ProLeu Asn Gly Arg Thr Val Gln Phe Tyr Asn Pro Pro Asn Ser
                165                 170                 175
Thr Ile Ser Phe Lys Val
            180
<210>96
<211>1497
<212>DNA
<213>杜氏盐藻(Dunaliella salina)
<400>96
atggcgcgcc tcgcgctgtt aggcgccgcg ctactatgcg ccctggcggt ctcgacgcaa   60
gggtcacctg aggggcatgg cactaagact gagatgatgg gcgctggaag gctgctccag  120
caagggcctc ataccaacag cgaccccccc tacaactaca actgccatgg ctttgactgg  180
gcggcttcca gttcaagtgc cgaaattact gagctgtgcg acagcccagc atcaagtttt  240
ccagtggccg actgtgatgg ggacatgcag agcccaatca acatcgtgac gagcgagctt  300
gcagacccga ctgaccgcag cggcgtgtct ggcatcaacc tgagaggcat gggctcctcg  360
gattttgtgc tgcgaagcaa cgtcaagttg aacatcgagc aagacatgaa gatcagctgg  420
gacgcgccca cgtccggcaa cctgcccacc atcatgatcg acggcacaga gcagcgattc  480
cagcccatcc agctttactt ccaccacttt gccagtgagc acaccatcaa tgggcagctc  540
taccctcttg atgcccacct tgtcatggct tcccttgatg accccaacca gctggctgtc  600
atcggcacca tgtataagta tggcaatggc gatgacttcc tggcgcgcct gttcggcaag  660
gttgaggatg cacttgagga gcgtgatgat gtgtcttacg gcagcaaaga agtgccaatt  720
gacatggaga tcagcccgaa agaccatgtc ctgccccagt cctccctgga gtacgctggc  780
tacgacggca gcctgaccac ccctccctgc agtgaggtgg tgaagtggca cgtgttcacc  840
agccccagga ccatctccat cgaccagctg aagacatttg agagggtctc cttcaacgcg  900
caccccaatg aagccatccc caccaacaac cgcgtgatcc agcctctcgg caccagggct  960
gtctaccgct acgaggctac agccatggat gactccggcg atggcaccgg caacgctgac 1020
gagctgtctt ctcccacgac cgtcacagca acctacgaca tcatggtctc aggcaccgct 1080
agcagcctgg cggacatgtt caacaatgga gctcgtctgg acaatggcgg ttttggtcct 1140
gatgaccagg cagaggctga cctgctgcgc cagatccagc ggcgtgcacg tgcaaactct 1200
ggtgctgaag gcgctgaggt ggtccgcatg atgaagttca cagctgccct tggccgtcgc 1260
aggctcaacc agcagggcgc ggcagcagag atggacatca ggtactactt tgagggtagc  1320
accgatcaag aagaggctac atcagctgtg aatggcatga acccctcttc gctgggcagc  1380
tccagcagtg gcctgactga tgtgcagcag actgaggtaa cctcttctgc cagcagcctg  1440
cgtgctggcc tgggcttggt tgtggcagcc ttcttcggtg ctgcattggc actgtga     1497
<210>97
<211>498
<212>PRT
<213>杜氏盐藻
<400>97
Met Ala Arg Leu Ala Leu Leu Gly Ala Ala Leu Leu Cys Ala Leu Ala
1               5                   10                  15
Val Ser Thr Gln Gly Ser Pro Glu Gly His Gly Thr Lys Thr Glu Met
            20                  25                  30
Met Gly Ala Gly Arg Leu Leu Gln Gln Gly Pro His Thr Asn Ser Asp
        35                  40                  45
Pro Pro Tyr Asn Tyr Asn Cys His Gly Phe Asp Trp Ala Ala Ser Ser
    50                  55                  60
Ser Ser Ala Glu Ile Thr Glu Leu Cys Asp Ser Pro Ala Ser Ser Phe
65                  70                  75                  80
Pro Val Ala Asp Cys Asp Gly Asp Met Gln Ser Pro Ile Asn Ile Val
                85                  90                  95
Thr Ser Glu Leu Ala Asp Pro Thr Asp Arg Ser Gly Val Ser Gly Ile
            100                 105                 110
Asn Leu Arg Gly Met Gly Ser Ser Asp Phe Val Leu Arg Ser Asn Val
        115                 120                 125
Lys Leu Asn Ile Glu Gln Asp Met Lys Ile Ser Trp Asp Ala Pro Thr
    130                 135                 140
Ser Gly Asn Leu Pro Thr Ile Met Ile Asp Gly Thr Glu Gln Arg Phe
145                 150                 155                 160
Gln Pro Ile Gln Leu Tyr Phe His His Phe Ala Ser Glu His Thr Ile
                165                 170                 175
Asn Gly Gln Leu Tyr Pro Leu Asp Ala His Leu Val Met Ala Ser Leu
            180                 185                 190
Asp Asp Pro Asn Gln Leu Ala Val Ile Gly Thr Met Tyr Lys Tyr Gly
        195                 200                 205
Asn Gly Asp Asp Phe Leu Ala Arg Leu Phe Gly Lys Val Glu Asp Ala
    210                 215                 220
Leu Glu Glu Arg Asp Asp Val Ser Tyr Gly Ser Lys Glu Val Pro Ile
225                 230                 235                 240
Asp Met Glu Ile Ser Pro Lys Asp His Val Leu Pro Gln Ser Ser Leu
                245                 250                 255
Glu Tyr Ala Gly Tyr Asp Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu
            260                 265                 270
Val Val Lys Trp His Val Phe Thr Ser Pro Arg Thr Ile Ser Ile Asp
        275                 280                 285
Gln Leu Lys Thr Phe Glu Arg Val Ser Phe Asn Ala His Pro Asn Glu
    290                 295                 300
Ala Ile Pro Thr Asn Asn Arg Val Ile Gln Pro Leu Gly Thr Arg Ala
305                 310                 315                 320
Val Tyr Arg Tyr Glu Ala Thr Ala Met Asp Asp Ser Gly Asp Gly Thr
                325                 330                 335
Gly Asn Ala Asp Glu Leu Ser Ser Pro Thr Thr Val Thr Ala Thr Tyr
            340                 345                 350
Asp Ile Met Val Ser Gly Thr Ala Ser Ser Leu Ala Asp Met Phe Asn
        355                 360                 365
Asn Gly Ala Arg Leu Asp Asn Gly Gly Phe Gly Pro Asp Asp Gln Ala
    370                 375                 380
Glu Ala Asp Leu Leu Arg Gln Ile Gln Arg Arg Ala Arg Ala Asn Ser
385                 390                 395                 400
Gly Ala Glu Gly Ala Glu Val Val Arg Met Met Lys Phe Thr Ala Ala
                405                 410                 415
Leu Gly Arg Arg Arg Leu Asn Gln Gln Gly Ala Ala Ala Glu Met Asp
            420                 425                 430
Ile Arg Tyr Tyr Phe Glu Gly Ser Thr Asp Gln Glu Glu Ala Thr Ser
        435                 440                 445
Ala Val Asn Gly Met Asn Pro Ser Ser Leu Gly Ser Ser Ser Ser Gly
    450                 455                 460
Leu Thr Asp Val Gln Gln Thr Glu Val Thr Ser Ser Ala Ser Ser Leu
465                 470                 475                 480
Arg Ala Gly Leu Gly Leu Val Val Ala Ala Phe Phe Gly Ala Ala Leu
                485                 490                 495
Ala Leu
<210>98
<211>1668
<212>DNA
<213>杜氏盐藻
<400>98
atggcgaggc tcgtcctgct aggggcgttg ctcggcgcgc tgtgtgccac ggctgttcaa   60
ggctccctgg atggctctca ggttgaggcg ggtctaggaa ggcagctcac acaggacaag  120
ccccatgagt acaactacaa cagacatggc atcgactgga gggacgaggg cctggacaac  180
tgcgctggct ccatgcagag ccccatcaac atcgacatgg ccactttgaa ccgtggcgag  240
gagcgcagcg atgtgagcgg cctctacctc aatggcctcg cctcgcccgc ctacgatgtc  300
gccgccgacg tgacagtgaa cgcggagcag gacatgaaga tcaccttcaa ggacgtcgcg  360
cagaacaaca tgcctgccat caagatcgac ggcagcgaca tgctcttcaa gcccgtgcag  420
ctgcacttcc accacttcct cagcgagcac gccatcaacg gcgcgcacta ccctctggag  480
gcgcaccttg tgatggggga cgcaagcggc aacaccaacc agctggcggt gctgggcatc  540
atgtaccagt acggcgagca gcctgacgac ttcgtccggc gcttgcagac gaagaccatt  600
gatgagatcg cgaccaacgg tgctgggtac ggagagactg tgaacgtcac cgacttgtct  660
gtgaacatca tgaaggatgt gctgcccccc acccaccaca actacgtggg ctacgacggg  720
agcctgacca cgcccccgtg cgatgagagg gtgaagtggc acgtgttcac cgagcccagg  780
accatcacaa ctgggcagct ggagaagttc ctgatgatca caaagcgcgg ccacactgat  840
gcgatcgtca ccaacaaccg catcgtgcag cccattggca ggcctctgta ccactacaag  900
cccacacccg ccagctacaa ctacgcgcgc aagggcattg actggaggga ggctggcctg  960
gacaactgtg ctggtgacag gcagagcccc atcaacattg acacaaccga tctccaacct 1020
ggcgctgtct ctggcatcag cctgaacggc ctggagtcac agagcttcac attcaccgac 1080
gcctacgtga acctggagca ggacatgaag gtcagcttca ccgcccccac aaacaacctg 1140
cccactgtca acatcgatgg gaacgacgag tcgttcaggc ccatccagct gcacttccac  1200
cacttctcca gcgagcacac cgtggatggc atgatctacc ccctggaggc ccaccttgtg  1260
atggcatccc aggccgagaa cagcaaccag ctggcagtca ttgccatctt ctaccagtac  1320
ggcagtgagg ctgatgactt cctgaccagg ctgcacaccg aggccatcag cgctcagcaa  1380
ggcaacgcca actggggcga caacaacgtg cccatcaacc tgcccatcac cttcgccacg  1440
gatttgatgc ccagcagtac tgagcactgg gcctatgagg gcagcttgac caccccacct  1500
tgcgatgaga gggtgaggtg gattgtgatg aaggagccca ggaccaccac tgctgagcag  1560
atggagacct tcaagactgc caccgtgaac gcccactacg ctgccgagat tgtcaacaac  1620
cgcgcgattc aggagcgcaa cagcaggcct attagcagta tcccttaa               1668
<210>99
<211>555
<212>PRT
<213>杜氏盐藻
<400>99
Met Ala Arg Leu Val Leu Leu Gly Ala Leu Leu Gly Ala Leu Cys Ala
1               5                   10                  15
Thr Ala Val Gln Gly Ser Leu Asp Gly Ser Gln Val Glu Ala Gly Leu
            20                  25                  30
Gly Arg Gln Leu Thr Gln Asp Lys Pro His Glu Tyr Asn Tyr Asn Arg
        35                  40                  45
His Gly Ile Asp Trp Arg Asp Glu Gly Leu Asp Asn Cys Ala Gly Ser
    50                  55                  60
Met Gln Ser Pro Ile Asn Ile Asp Met Ala Thr Leu Asn Arg Gly Glu
65                  70                  75                  80
Glu Arg Ser Asp Val Ser Gly Leu Tyr Leu Asn Gly Leu Ala Ser Pro
                85                  90                  95
Ala Tyr Asp Val Ala Ala Asp Val Thr Val Asn Ala Glu Gln Asp Met
            100                 105                 110
Lys Ile Thr Phe Lys Asp Val Ala Gln Asn Asn Met Pro Ala Ile Lys
        115                 120                 125
Ile Asp Gly Ser Asp Met Leu Phe Lys Pro Val Gln Leu His Phe His
    130                 135                 140
His Phe Leu Ser Glu His Ala Ile Asn Gly Ala His Tyr Pro Leu Glu
145                 150                 155                 160
Ala His Leu Val Met Gly Asp Ala Ser Gly Asn Thr Asn Gln Leu Ala
                165                 170                 175
Val Leu Gly Ile Met Tyr Gln Tyr Gly Glu Gln Pro Asp Asp Phe Val
            180                 185                 190
Arg Arg Leu Gln Thr Lys Thr Ile Asp Glu Ile Ala Thr Asn Gly Ala
        195                 200                 205
Gly Tyr Gly Glu Thr Val Asn Val Thr Asp Leu Ser Val Asn Ile Met
    210                 215                 220
Lys Asp Val Leu Pro Pro Thr His His Asn Tyr Val Gly Tyr Asp Gly
225                 230                 235                 240
Ser Leu Thr Thr Pro Pro Cys Asp Glu Arg Val Lys Trp His Val Phe
                245                 250                 255
Thr Glu Pro Arg Thr Ile Thr Thr Gly Gln Leu Glu Lys Phe Leu Met
            260                 265                 270
Ile Thr Lys Arg Gly His Thr Asp Ala Ile Val Thr Asn Asn Arg Ile
        275                 280                 285
Val Gln Pro Ile Gly Arg Pro Leu Tyr His Tyr Lys Pro Thr Pro Ala
    290                 295                 300
Ser Tyr Asn Tyr Ala Arg Lys Gly Ile Asp Trp Arg Glu Ala Gly Leu
305                 310                 315                 320
Asp Asn Cys Ala Gly Asp Arg Gln Ser Pro Ile Asn Ile Asp Thr Thr
                325                 330                 335
Asp Leu Gln Pro Gly Ala Val Ser Gly Ile Ser Leu Asn Gly Leu Glu
            340                 345                 350
Ser Gln Ser Phe Thr Phe Thr Asp Ala Tyr Val Asn Leu Glu Gln Asp
        355                 360                 365
Met Lys Val Ser Phe Thr Ala Pro Thr Asn Asn Leu Pro Thr Val Asn
    370                 375                 380
Ile Asp Gly Asn Asp Glu Ser Phe Arg Pro Ile Gln Leu His Phe His
385                 390                 395                 400
His Phe Ser Ser Glu His Thr Val Asp Gly Met Ile Tyr Pro Leu Glu
                405                 410                 415
Ala His Leu Val Met Ala Ser Gln Ala Glu Asn Ser Asn Gln Leu Ala
            420                 425                 430
Val Ile Ala Ile Phe Tyr Gln Tyr Gly Ser Glu Ala Asp Asp Phe Leu
        435                 440                 445
Thr Arg Leu His Thr Glu Ala Ile Ser Ala Gln Gln Gly Asn Ala Asn
    450                 455                 460
Trp Gly Asp Asn Asn Val Pro Ile Asn Leu Pro Ile Thr Phe Ala Thr
465                 470                 475                 480
Asp Leu Met Pro Ser Ser Thr Glu His Trp Ala Tyr Glu Gly Ser Leu
                485                 490                 495
Thr Thr Pro Pro Cys Asp Glu Arg Val Arg Trp Ile Val Met Lys Glu
            500                 505                 510
Pro Arg Thr Thr Thr Ala Glu Gln Met Glu Thr Phe Lys Thr Ala Thr
        515                 520                 525
Val Asn Ala His Tyr Ala Ala Glu Ile Val Asn Asn Arg Ala Ile Gln
    530                 535                 540
Glu Arg Asn Ser Arg Pro Ile Ser Ser Ile Pro
545                 550                 555
<210>100
<211>1125
<212>DNA
<213>莱茵衣藻
<400>100
atggcgcgta ctggcgctct actcctggcc gcgctggcgc ttgcgggctg cgcgcaggct   60
tgcatctaca agttcggcac gtcgccggac tccaaggcca ctcacacagg cgaccactgg  120
gatcatagtc tcaatggcga gaactgggag ggcaaggacg gcgcgggcaa cccctgggtc  180
tgcaagactg gccgcaagca gtcgcccatc aacgtgcccc agtaccatgt cctggacggg  240
aagggttcca agattgccac cggcctgcag acccagtggt cgtaccctga cctgatgtcc  300
aacggcagct cggttcaagt catcaacaac ggccacacca tccaggtgca gtggacctac  360
gactacgccg gccatgccac catcgccatc cctgccatgc gcaaccagag caaccgcatc  420
gtggacgtgc tggagatgcg ccccaacgac gcctccgacc gcgtgactgc cgtgcccacc  480
cagttccact tccactccac ctcggagcac ctgctggcgg gcaagatctt tcctcttgag  540
ttgcacattg tgcacaaggt gactgacaag ctagaggcct gcaagggcgg ctgcttcagc  600
gtcaccggca tcctgttcca gctcgacaac ggccccgata acgagctgct tgagcccacg   660
cgcgagggca ccttcaccaa cctgccggcg ggcaccacca tcaagctggg tgagctgctg   720
cccagcgacc gcgactacgt cacctacgag ggcagcctca ccaccccgcc ctgcagcgag   780
ggcctgctgt ggcacgtcat gacccagccg cagcgcatca gcttcggcca gtggaaccgc   840
taccgcctgg ctgtgggcga gaaggagtgc aactccacgg agaccgatgc tgcccacgcg   900
gacgccggcc atcatcacca ccaccaccgc cgcctgctgc acaaccacgc gcacctggag   960
gaggtgcctg ccgccacctc cgagcccaag cactacttcc gccgcgtgat ggaggagacc  1020
gagaaccccg atgcttacac ctgcacgacc gttgcctttg gccagaactt ccgcaacgcc  1080
cagtacgcca acggccgcac catcaagctg gcccgctacg agtaa                  1125
<210>101
<211>380
<212>PRT
<213>莱茵衣藻
<400>101
Met Ala Arg Thr Gly Ala Leu Leu Leu Ala Ala Leu Ala Leu Ala Gly
1               5                   10                  15
Cys Ala Gln Ala Cys Ile Tyr Lys Phe Gly Thr Ser Pro Asp Ser Lys
            20                  25                  30
Ala Thr His Thr Gly Asp His Trp Asp His Ser Leu Asn Gly Glu Asn
        35                  40                  45
Trp Glu Gly Lys Asp Gly Ala Gly Asn Pro Trp Val Cys Lys Thr Gly
    50                  55                  60
Arg Lys Gln Ser Pro Ile Asn Val Pro Gln Tyr His Val Leu Asp Gly
65                  70                  75                  80
Lys Gly Ser Lys Ile Ala Thr Gly Leu Gln Thr Gln Trp Ser Tyr Pro
                85                  90                  95
Asp Leu Met Ser Asn Gly Ser Ser Val Gln Val Ile Asn Asn Gly His
            100                 105                 110
Thr Ile Gln Val Gln Trp Thr Tyr Asp Tyr Ala Gly His Ala Thr Ile
        115                 120                 125
Ala Ile Pro Ala Met Arg Asn Gln Ser Asn Arg Ile Val Asp Val Leu
    130                 135                 140
Glu Met Arg Pro Asn Asp Ala Ser Asp Arg Val Thr Ala Val Pro Thr
145                 150                 155                 160
Gln Phe His Phe His Ser Thr Ser Glu His Leu Leu Ala Gly Lys Ile
                165                 170                 175
Phe Pro Leu Glu Leu His Ile Val His Lys Val Thr Asp Lys Leu Glu
            180                 185                 190
Ala Cys Lys Gly Gly Cys Phe Ser Val Thr Gly Ile Leu Phe Gln Leu
        195                 200                 205
Asp Asn Gly Pro Asp Asn Glu Leu Leu Glu Pro Ile Phe Ala Asn Met
    210                 215                 220
Pro Thr Arg Glu Gly Thr Phe Thr Asn Leu Pro Ala Gly Thr Thr Ile
225                 230                 235                 240
Lys Leu Gly Glu Leu Leu Pro Ser Asp Arg Asp Tyr Val Thr Tyr Glu
                245                 250                 255
Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Gly Leu Leu Trp His Val
            260                 265                 270
Met Thr Gln Pro Gln Arg Ile Ser Phe Gly Gln Trp Asn Arg Tyr Arg
        275                 280                 285
Leu Ala Val Gly Glu Lys Glu Cys Asn Ser Thr Glu Thr Asp Ala Ala
    290                 295                 300
His Ala Asp Ala Gly His His His His His His Arg Arg Leu Leu His
305                 310                 315                 320
Asn His Ala His Leu Glu Glu Val Pro Ala Ala Thr Ser Glu Pro Lys
                325                 330                 335
His Tyr Phe Arg Arg Val Met Glu Glu Thr Glu Asn Pro Asp Ala Tyr
            340                 345                 350
Thr Cys Thr Thr Val Ala Phe Gly Gln Asn Phe Arg Asn Ala Gln Tyr
        355                 360                 365
Ala Asn Gly Arg Thr Ile Lys Leu Ala Arg Tyr Glu
    370                 375                 380
<210>102
<211>1134
<212>DNA
<213>莱茵衣藻
<400>102
atggcgcgta ctggcgctct actcctggtc gcgctggcgc ttgcgggctg cgcgcaggct    60
tgcatctaca agttcggcac gtcgccggac tccaaggcca ccgtttcggg tgatcactgg  120
gaccatggcc tcaacggcga gaactgggag ggcaaggacg gcgcaggcaa cgcctgggtt  180
tgcaagactg gccgcaagca gtcgcccatc aacgtgcccc agtaccaggt cctggacggg  240
aagggttcca agattgccaa cggcctgcag acccagtggt cgtaccctga cctgatgtcc  300
aacggcacct cggtccaagt catcaacaac ggccacacca tccaggtgca gtggacttac  360
aactacgccg gccatgccac catcgccatc cctgccatgc acaaccagac caaccgcatc  420
gtggacgtgc tggagatgcg ccccaacgac gccgccgacc gcgtgactgc cgtgcccacc  480
cagttccact tccactccac ctcggagcac ctgctggcgg gcaagatcta tccccttgag  540
ttgcacattg tgcaccaggt gactgagaag ctggaggcct gcaagggcgg ctgcttcagc  600
gtcaccggca tcctgttcca gctcgacaac ggccccgata acgagctgct tgagcccatc  660
tttgcgaaca tgccctcgcg cgagggcacc ttcagcaacc tgccggcggg caccaccatc  720
aagctgggtg agctgctgcc cagcgaccgc gactacgtaa cgtacgaggg cagcctcacc  780
accccgccct gcagcgaggg cctgctgtgg cacgtcatga cccagccgca gcgcatcagc  840
ttcggccagt ggaaccgcta ccgcctggct gtgggcctga aggagtgcaa ctccacggag  900
accgccgcgg acgccggcca ccaccaccac caccgccgcc tgctgcacaa ccacgcgcac  960
ctggaggagg tgcctgccgc cacctccgag cccaagcact acttccgccg cgtgatgctg 1020
gccgagtccg cgaaccccga tgcctacacc tgcaaggccg ttgcctttgg ccagaacttc 1080
cgcaaccccc agtacgccaa cggccgcacc atcaagctgg cccgctatca ctaa       1134
<210>103
<211>377
<212>PRT
<213>莱茵衣藻
<400>103
Met Ala Arg Thr Gly Ala Leu Leu Leu Val Ala Leu Ala Leu Ala Gly
1               5                   10                  15
Cys Ala Gln Ala Cys Ile Tyr Lys Phe Gly Thr Ser Pro Asp Ser Lys
            20                  25                  30
Ala Thr Val Ser Gly Asp His Trp Asp His Gly Leu Asn Gly Glu Asn
        35                  40                  45
Trp Glu Gly Lys Asp Gly Ala Gly Asn Ala Trp Val Cys Lys Thr Gly
    50                  55                  60
Arg Lys Gln Ser Pro Ile Asn Val Pro Gln Tyr Gln Val Leu Asp Gly
65                  70                  75                  80
Lys Gly Ser Lys Ile Ala Asn Gly Leu Gln Thr Gln Trp Ser Tyr Pro
                85                  90                  95
Asp Leu Met Ser Asn Gly Thr Ser Val Gln Val Ile Asn Asn Gly His
            100                 105                 110
Thr Ile Gln Val Gln Trp Thr Tyr Asn Tyr Ala Gly His Ala Thr Ile
        115                 120                 125
Ala Ile Pro Ala Met His Asn Gln Thr Asn Arg Ile Val Asp Val Leu
    130                 135                 140
Glu Met Arg Pro Asn Asp Ala Ala Asp Arg Val Thr Ala Val Pro Thr
145                 150                 155                 160
Gln Phe His Phe His Ser Thr Ser Glu His Leu Leu Ala Gly Lys Ile
                165                 170                 175
Tyr Pro Leu Glu Leu His Ile Val His Gln Val Thr Glu Lys Leu Glu
            180                 185                 190
Ala Cys Lys Gly Gly Cys Phe Ser Val Thr Gly Ile Leu Phe Gln Leu
        195                 200                 205
Asp Asn Gly Pro Asp Asn Glu Leu Leu Glu Pro Ile Phe Ala Asn Met
    210                 215                 220
Pro Ser Arg Glu Gly Thr Phe Ser Asn Leu Pro Ala Gly Thr Thr Ile
225                 230                 235                 240
Lys Leu Gly Glu Leu Leu Pro Ser Asp Arg Asp Tyr Val Thr Tyr Glu
                245                 250                 255
Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Gly Leu Leu Trp His Val
            260                 265                 270
Met Thr Gln Pro Gln Arg Ile Ser Phe Gly Gln Trp Asn Arg Tyr Arg
        275                 280                 285
Leu Ala Val Gly Leu Lys Glu Cys Asn Ser Thr Glu Thr Ala Ala Asp
    290                 295                 300
Ala Gly His His His His His Arg Arg Leu Leu His Asn His Ala His
305                 310                 315                 320
Leu Glu Glu Val Pro Ala Ala Thr Ser Glu Pro Lys His Tyr Phe Arg
                325                 330                 335
Arg Val Met Leu Ala Glu Ser Ala Asn Pro Asp Ala Tyr Thr Cys Lys
            340                 345                 350
Ala Val Ala Phe Gly Gln Asn Phe Arg Asn Pro Gln Tyr Ala Asn Gly
        355                 360                 365
Arg Thr Ile Lys Leu Ala Arg Tyr His
    370                 375
<210>104
<211>810
<212>DNA
<213>小立碗藓(Physcomitrella patens)
<400>104
atggcgagcc aacttgtgca ggcagtggcc gctgttgtgg ttctgcaatg catctccgca     60
agctgggttg gcgcgtgggc aggatcggct caggctgagg gaggtgacga ggtgcactgg    120
gactacagcg gtgggtcgca tgggccaggt ggctggggtg acctgaaggc cgagtggggt    180
gtgtgcaagt cgggcagccg gcagtccccg atcgccatca cggcgctcga cctggtcaca    240
gaccgcagtc tggggaagct ggatgccaag taccggaaga gagttcatgc cactctttac    300
aacagcgggc atggggctga ggtgagcatg ccagccggct cgggacgctt gaggatcggt    360
ggcgagacgt accgacccgt ccagttccac atccacatgc ccagcgagca cacaatcatg    420
aaccagagtt tcccgctgga gctccacttg gtgcacaagt ccgatgatgg gaagcttgcg    480
gtgatcgggt tcctgtttga ggaaggaggc gagagcgaat tcctggccca gttcgcacat    540
gaggtgccat cgtcaaatag cccaggcgtg aaggtcgact tggggcacat caagatgatg    600
aagccggaga ggaactacgg cacttacatg ggatccctca ccaccccacc atgcgcggag    660
ggtgtcacct ggattctgtc gttgttcaac tttcaaacgg cgtccgcgga acagctggct    720
aagctccggg cttctgtgcc gaagggacac aacaaccgtc caaccttcgg cagcgccgga    780
aggggtttcc gcatgcgcac caacgcttga                                     810
<210>105
<211>269
<212>PRT
<213>小立碗藓
<400>105
Met Ala Ser Gln Leu Val Gln Ala Val Ala Ala Val Val Val Leu Gln
1               5                   10                  15
Gys Ile Ser Ala Ser Trp Val Gly Ala Trp Ala Gly Ser Ala Gln Ala
            20                  25                  30
Glu Gly Gly Asp Glu Val His Trp Asp Tyr Ser Gly Gly Ser His Gly
        35                  40                  45
Pro Gly Gly Trp Gly Asp Leu Lys Ala Glu Trp Gly Val Cys Lys Ser
    50                  55                  60
Gly Ser Arg Gln Ser Pro Ile Ala Ile Thr Ala Leu Asp Leu Val Thr
65                  70                  75                  80
Asp Arg Ser Leu Gly Lys Leu Asp Ala Lys Tyr Arg Lys Arg Val His
                85                  90                  95
Ala Thr Leu Tyr Asn Ser Gly His Gly Ala Glu Val Ser Met Pro Ala
            100                 105                 110
Gly Ser Gly Arg Leu Arg Ile Gly Gly Glu Thr Tyr Arg Pro Val Gln
        115                 120                 125
Phe His Ile His Met Pro Ser Glu His Thr Ile Met Asn Gln Ser Phe
    130                 135                 140
Pro Leu Glu Leu His Leu Val His Lys Ser Asp Asp Gly Lys Leu Ala
115                 150                 155                 160
Val Ile Gly Phe Leu Phe Glu Glu Gly Gly Glu Ser Glu Phe Leu Ala
                165                 170                 175
Gln Phe Ala His Glu Val Pro Ser Ser Asn Ser Pro Gly Val Lys Val
            180                 185                 190
Asp Leu Gly His Ile Lys Met Met Lys Pro Glu Arg Asn Tyr Gly Thr
        195                 200                 205
Tyr Met Gly Ser Leu Thr Thr Pro Pro Cys Ala Glu Gly Val Thr Trp
    210                 215                 220
Ile Leu Ser Leu Phe Asn Phe Gln Thr Ala Ser Ala Glu Gln Leu Ala
225                 230                 235                 240
Lys Leu Arg Ala Ser Val Pro Lys Gly His Asn Asn Arg Pro Thr Phe
                245                 250                 255
Gly Ser Ala Gly Arg Gly Phe Arg Met Arg Thr Asn Ala
            260                 265
<210>106
<211>1519
<212>DNA
<213>拟南芥
<400>106
aaatagagaa gctcttcaag tatccgatgt ttttgtttaa tcaacaagag gcggagatac    60
gggagaaatt gcatgtgtaa tcataaaatg tagatgttag cttcgtcgtt tttactatag   120
tttagttctc ttcttcttct tttttcgtca ttacaatctc tttcttaatt tacttcttct   180
tgatagtata attaagttgt ttgtaataat ctgtacaaag atgttgtgtt ctcataaaaa   240
attcaatttt gtaaagaagc tctacatgtt ccttgctctg taaacatggt ccccttttgg   300
actacagttt ctcgaaatgg ctcatcagac tcagagacga ctctccaatc tgcttcaaaa   360
gccacaaaac agtataaata tccttctctt cgtccctctc atcgcctgtc tctcctcttc   420
ctcttcccgt tccatttatc cgcaaacgga gcttgttttc ggtgcacctg cttcagccac   480
ttcaaacttg gtataaactg agaaggatgg gaaacgaatc atatgaagac gccatcgaag   540
ctctcaagaa gcttctcatt gagaaggatg atctgaagga tgtagctgcg gccaaggtga   600
agaagatcac ggcggagctt caggcagcct cgtcatcgga cagcaaatct tttgatcccg   660
tcgaacgaat taaggaaggc ttcgtcacct tcaagaagga gaaatacgag accaatcctg   720
ctttgtatgg tgagctcgcc aaaggtcaaa gcccaaagta catggtgttt gcttgttcgg   780
actcacgagt gtgcccatca cacgtactag acttccatcc tggagatgcc ttcgtggttc   840
gtaatatcgc caatatggtt cctccttttg acaaggtcaa atatgcagga gttggagccg   900
ccattgaata cgctgtcttg caccttaagg tggaaaacat tgtggtgata gggcacagtg   960
catgtggtgg catcaagggg cttatgtcat ttcctcttga cggaaacaac tctactgact  1020
tcatagagga ttgggtcaaa atctgtttac cagcaaagtc aaaagttttg gcagaaagtg  1080
aaagttcagc atttgaagac caatgtggcc gatgcgaaag ggaggcagtg aatgtgtcac  1140
tagcaaacct attgacatat ccatttgtga gagaaggagt tgtgaaagga acacttgctt  1200
tgaagggagg ctactatgac tttgttaatg gctcctttga gctttgggag ctccagtttg  1260
gaatttcccc cgttcattct atatgaacta acacatcacc atcaccatcg ctaccaccac  1320
catcacaaac atcatcatcg tcgtcatcat catgatcagc atcttcatat ataaatgttt  1380
tactcttatt taattgctac ttgtaatggt atacatttac ttgcgatgag cttcttttcc  1440
ttcattatcc agttataaaa taaataaata aatcatgttt actttcacag atatcgtttt  1500
gctgaagttg ctttgattt                                               1519
<210>107
<211>259
<212>PRT
<213>拟南芥
<400>107
Met Gly Asn Glu Ser Tyr Glu Asp Ala Ile Glu Ala Leu Lys Lys Leu
1               5                   10                  15
Leu Ile Glu Lys Asp Asp Leu Lys Asp Val Ala Ala Ala Lys Val Lys
            20                  25                  30
Lys Ile Thr Ala Glu Leu Gln Ala Ala Ser Ser Ser Asp Ser Lys Ser
        35                  40                  45
Phe Asp Pro Val Glu Arg Ile Lys Glu Gly Phe Val Thr Phe Lys Lys
    50                  55                  60
Glu Lys Tyr Glu Thr Asn Pro Ala Leu Tyr Gly Glu Leu Ala Lys Gly
65                  70                  75                  80
Gln Ser Pro Lys Tyr Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys
            85                  90                  95
Pro Ser His Val Leu Asp Phe His Pro Gly Asp Ala Phe Val Val Arg
        100                 105                 110
Asn Ile Ala Asn Met Val Pro Pro Phe Asp Lys Val Lys Tyr Ala Gly
    115                 120                 125
Val Gly Ala Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Gln Asn
    130                 135                 140
Ile Val Val Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met
145                 150                 155                 160
Ser Phe Pro Leu Asp Gly Asn Asn Ser Thr Asp Phe Ile Glu Asp Trp
                165                 170                 175
Val Lys Ile Cys Leu Pro Ala Lys Ser Lys Val Leu Ala Glu Ser Glu
            180                 185                 190
Ser Ser Ala Phe Glu Asp Gln Cys Gly Arg Cys Glu Arg Glu Ala Val
        195                 200                 205
Asn Val Ser Leu Ala Asn Leu Leu Thr Tyr Pro Phe Val Arg Glu Gly
    210                 215                 220
ValVal Lys Gly Thr Leu Ala Leu Lys Gly Gly Tyr Tyr Asp Phe Val
225                 230                 235                 240
Asn Gly Ser Phe Glu Leu Trp Glu Leu Gln Phe Gly Ile Ser Pro Val
                245                 250                 255
His Ser Ile
<210>108
<211>1770
<212>DNA
<213>杜氏盐藻
<400>108
atgggatccc gccgcatcac cctcttgggg gctctgttcg ctgtcctggc ggtcgcaatc    60
gaagggcgta ccctgcttac acacaacctg aaggccgagg ctgctgagac agtggatgca   120
gtgagetctg tggtagctgg ttctgcaggc aggcagttgc tggtgagtga gcctcacgac   180
tacaactatg agaaagttgg ctttgattgg acgggggggg tctgcgtcaa taccgggacc   240
agcaagcaga gcccaatcaa cattgagact gacagcctgg ctgaggaatc agagaggctg   300
gggaccgcgg atgacacttc acgcctggcc ttgaagggcc tactgtcttc atcctaccag   360
ctgaccagcg aagtggcaat caacctggag caggatatgc agttttcttt taatgcgcct   420
gatgaagact tgcctcaact tactattggt ggggttgtcc acaccttcaa gcctgtgcaa   480
atccactttc accactttgc cagcgagcac gctattgacg gccagcttta tcctcttgag   540
gcccacatgg tgatggcatc ccagaatgac ggctctgacc agcttgctgt cattggcatc   600
atgtacaagt acggggaaga agatcctttc ctcaaaaggc tgcaagaaac tgcacagagc   660
aatggcgaag ctgccgacaa aaatgtggag ctgaactcgt tttccatcaa tgtggccagg   720
gatttgctgc ctgagtcaga cctgacctac tatggatatg atggtagctt gactaccccc   780
ggttgtgatg agcgagtgaa gtggcatgtg ttcaaggagg caaggactgt ctcagtggcg   840
cagctcaagg tgttttcaga ggtcacgctg gctgcccacc ctgaagctac ggttaccaac   900
aaccgtgtca ttcagccgct caatggcagg aaggtctacg agtacaaggg tgaacccaac   960
gacaagtaca actatgtcca gcatggcttt gactggcgcg ataatggctt ggatagctgt  1020
gctggcgacg tccagagccc tattgacatc gtgaccagca ctttgcaagc tggatcttct  1080
cggagtgatg tttctagtgt caacctgaat gacttgaaca ccgacgcgtt cacgctgacc  1140
ggcaacactg tgaatattgg gcaaggcatg caaatcaatt ttggtgaccc ccctgcgggt  1200
gacctgcccg tcatcagaat tggtactagg gacgtcactt tcaggcccct ccaggtgcac  1260
tggcacttct ttttgagtga gcacactgtg gatggagtgc actaccccct ggaagctcat  1320
attgttatga aggacaatga caaccttggt gattctgccg gccagcttgc tgtcatcggt  1380
attatgtaca agtacggcga tgcagacccc ttcattactg atatgcagaa gagggtgtca  1440
gataaaattg catcaggtgc catcacctat ggacaatcag gagtgtctct gaacaatcct  1500
gatgatccct tcaatgtcaa catcaagaat aatttcctgc cctctgagct tggatatgct  1560
ggctacgatg gcagcctgac cacccctcct tgctctgaga ttgtgaagtg gcatgtgttc  1620
ctggagccta ggactgtttc agtggagcag atggaggtct ttgcagatgt gactctgaac  1680
tctaatccag gtgcgaccgt gacaaccaac cgaatgatcc agccactgga gggtaggact  1740
gtgtacggat ataacggtgc tgctgcttaa                                   1770
<210>109
<211>589
<212>PRT
<213>杜氏盐藻
<400>109
Met Gly Ser Arg Arg Ile Thr Leu Leu Gly Ala Leu Phe Ala Val Leu
1               5                   10                  15
Ala Val Ala Ile Glu Gly Arg Thr Leu Leu Thr His Asn Leu Lys Ala
            20                  25                  30
Glu Ala Ala Glu Thr Val Asp Ala Val Ser Ser Val Val Ala Gly Ser
        35                  40                  45
Ala Gly Arg Gln Leu Leu Val Ser Glu Pro His Asp Tyr Asn Tyr Glu
    50                  55                  60
Lys Val Gly Phe Asp Trp Thr Gly Gly Val Cys Val Asn Thr Gly Thr
65                  70                  75                  80
Ser Lys Gln Ser Pro Ile Asn Ile Glu Thr Asp Ser Leu Ala Glu Glu
                85                  90                  95
Ser Glu Arg Leu Gly Thr Ala Asp Asp Thr Ser Arg Leu Ala Leu Lys
            100                 105                 110
Gly Leu Leu Ser Ser Ser Tyr Gln Leu Thr Ser Glu Val Ala Ile Asn
        115                 120                 125
Leu Glu Gln Asp Met Gln Phe Ser Phe Asn Ala Pro Asp Glu Asp Leu
    130                 135                 140
Pro Gln Leu Thr Ile Gly Gly Val Val His Thr Phe Lys Pro Val Gln
145                 150                 155                 160
Ile His Phe His His Phe Ala Ser Glu His Ala Ile Asp Gly Gln Leu
                165                 170                 175
Tyr Pro Leu Glu Ala His Met Val Met Ala Ser Gln Asn Asp Gly Ser
            180                 185                 190
Asp Gln Leu Ala Val Ile Gly Ile Met Tyr Lys Tyr Gly Glu Glu Asp
        195                 200                 205
Pro Phe Leu Lys Arg Leu Gln Glu Thr Ala Gln Ser Asn Gly Glu Ala
    210                 215                 220
Gly Asp Lys Asn Val Glu Leu Asn Ser Phe Ser Ile Asn Val Ala Arg
225                 230                 235                 240
Asp Leu Leu Pro Glu Ser Asp Leu Thr Tyr Tyr Gly Tyr Asp Gly Ser
                245                 250                 255
Leu Thr Thr Pro Gly Cys Asp Glu Arg Val Lys Trp His Val Phe Lys
            260                 265                 270
Glu Ala Arg Thr Val Ser Val Ala Gln Leu Lys Val Phe Ser Glu Val
        275                 280                 285
Thr Leu Ala Ala His Pro Glu Ala Thr Val Thr Asn Asn Arg Val Ile
    290                 295                 300
Gln Pro Leu Asn Gly Arg Lys Val Tyr Glu Tyr Lys Gly Glu Pro Asn
305                 310                 315                 320
Asp Lys Tyr Asn Tyr Val Gln His Gly Phe Asp Trp Arg Asp Asn Gly
                325                 330                 335
Leu Asp Ser Cys Ala Gly Asp Val Gln Ser Pro Ile Asp Ile Val Thr
            340                 345                 350
Ser Thr Leu Gln Ala Gly Ser Ser Arg Ser Asp Val Ser Ser Val Asn
        355                 360                 365
Leu Met Thr Leu Asn Thr Asp Ala Phe Thr Leu Thr Gly Asn Thr Val
    370                 375                 380
Asn Ile Gly Gln Gly Met Gln Ile Asn Phe Gly Asp Pro Pro Ala Gly
385                 390                 395                 400
Asp Leu Pro Val Ile Arg Ile Gly Thr Arg Asp Val Thr Phe Arg Pro
                405                 410                 415
Leu Gln Val His Trp His Phe Phe Leu Ser Glu His Thr Val Asp Gly
            420                 425                 430
Val His Tyr Pro Leu Glu Ala His Ile Val Met Lys Asp Asn Asp Asn
        435                 440                 445
Leu Gly Asp Ser Ala Gly Gln Leu Ala Val Ile Gly Ile Met Tyr Lys
    450                 455                 460
Tyr Gly Asp Ala Asp Pro Phe Ile Thr Asp Met Gln Lys Arg Val Ser
465                 470                 475                 480
Asp Lys Ile Ala Ser Gly Ala Ile Thr Tyr Gly Gln Ser Gly Val Ser
                485                 490                 495
Leu Asn Asn Pro Asp Asp Pro Phe Asn Val Asn Ile Lys Asn Asn Phe
            500                 505                 510
Leu Pro Ser Glu Leu Gly Tyr Ala Gly Tyr Asp Gly Ser Leu Thr Thr
        515                 520                 525
Pro Pro Cys Ser Glu Ile Val Lys Trp His Val Phe Leu Glu Pro Arg
    530                 535                 540
Thr Val Ser Val Glu Gln Met Glu Val Phe Ala Asp Val Thr Leu Asn
545                 550                 555                 560
Ser Asn Pro Gly Ala Thr Val Thr Thr Asn Arg Met Ile Gln Pro Leu
                565                 570                 575
Glu Gly Arg Thr Val Tyr Gly Tyr Asn Gly Ala A1a Ala
            580                 585
<210>110
<211>693
<212>DNA
<213>拟南芥
<400>110
atgaagatta tgatgatgat taagctctgc ttcttctcca tgtccctcat ctgcattgca   60
cctgcagatg ctcagacaga aggagtagtg tttggatata aaggcaaaaa tggaccaaac  120
caatggggac acttaaaccc tcacttcacc acatgcgcgg tcggtaaatt gcaatctcca  180
attgatattc aaaggaggca aatattttac aaccacaaat tgaattcaat acaccgtgaa  240
tactacttca caaacgcaac actagtgaac cacgtctgta atgttgccat gttcttcggg  300
gagggagcag gagatgtgat aatagaaaac aagaactata ccttactgca aatgcattgg  360
cacactcctt ctgaacatca cctccatgga gtccaatatg cagctgagct gcacatggta  420
caccaagcaa aagatggaag ctttgctgtg gtggcaagtc tcttcaaaat cggcactgaa  480
gagcctttcc tctctcagat gaaggagaaa ttggtgaagc taaaggaaga gagactcaaa  540
gggaaccaca cagcacaagt ggaagtagga agaatcgaca caagacacat tgaacgtaag  600
actcgaaagt actacagata cattggttca ctcactactc ctccttgctc cgagaacgtt  660
tcttggacca tccttggcaa ggtaatcttt taa                               693
<210>111
<211>284
<212>PRT
<213>拟南芥
<400>111
Met Lys Ile Met Met Met Ile Lys Leu Cys Phe Phe Ser Met Ser Leu
1               5                   10                  15
Ile Cys Ile Ala Pro Ala Asp Ala Gln Thr Glu Gly Val Val Phe Gly
            20                  25                  30
Tyr Lys Gly Lys Asn Gly Pro Asn Gln Trp Gly His Leu Asn Pro His
        35                  40                  45
Phe Thr Thr Cys Ala Val Gly Lys Leu Gln Ser Pro Ile Asp Ile Gln
    50                  55                  60
Arg Ara Gln Ile Phe Tyr Asn His Lys Leu Asn Ser Ile His Arg Glu
65                  70                  75                  80
Tyr Tyr Phe Thr Asn Ala Thr Leu Val Asn His Val Cys Asn Val Ala
                85                  90                  95
Met Phe Phe Gly Glu Gly Ala Gly Asp Val Ile Ile Glu Asn Lys Asn
            100                 105                 110
Tyr Thr Leu Leu Gln Met His Trp His Thr Pro Ser Glu His His Leu
        115                 120                 125
His Gly Val Gln Tyr Ala Ala Glu Leu His Met Val His Gln Ala Lys
    130                 135                 140
Asp Gly Ser Phe Ala Val Val Ala Ser Leu Phe Lys Ile Gly Thr Glu
145                 150                 155                 160
Glu Pro Phe Leu Ser Gln Met Lys Glu Lys Leu Val Lys Leu Lys Glu
            165                 170                 175
Glu Arg Leu Lys Gly Asn His Thr Ala Gln Val Glu Val Gly Arg Ile
            180                 185                 190
Asp Thr Arg His Ile Glu Arg Lys Thr Arg Lys Tyr Tyr Arg Tyr Ile
        195                 200                 205
Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Asn Val Ser Trp Thr Ile
    210                 215                 220
Leu Gly Lys Val Arg Ser Met Ser Lys Glu Gln Val Glu Leu Leu Arg
225                 230                 235                 240
Ser Pro Leu Asp Thr Ser Phe Lys Asn Asn Ser Arg Pro Cys Gln Pro
                245                 250                 255
Leu Asn Gly Arg Arg Val Glu Met Phe His Asp His Glu Arg Val Asp
            260                 265                 270
Lys Lys Glu Thr Gly Asn Lys Lys Lys Lys Pro Asn
        275                 280
<210>112
<211>1053
<212>DNA
<213>拟南芥
<400>112
atgaagatat catcactagg atgggtctta gtccttatct tcatctctat taccattgtt   60
tcgagtgcac cagcacctaa acctcctaaa cctaagcctg caccagcacc tacacctcct  120
aaacctaagc ccacaccagc acctacacct cctaaaccta agcccaaacc agcacctaca  180
cctcctaaac ctaagcctgc accagcacct acacctccta aacctaagcc cgcaccagca  240
cctacacctc ctaaacctaa gcccaaacca gcacctacac ctcctaatcc taagcccaca  300
ccagcaccta cacctcctaa acctaagcct gcaccagcac cagcaccaac accagcaccg  360
aaacctaaac ctgcacctaa accagcacca ggtggagaag ttgaggacga aaccgagttt  420
agctacgaga cgaaaggaaa caaggggcca gcgaaatggg gaacactaga tgcagagtgg  480
aaaatgtgtg gaataggcaa aatgcaatct cctattgatc ttcgggacaa aaatgtggta  540
gttagtaata aatttggatt gcttcgtagc cagtatctgc cttctaatac caccattaag  600
aacagaggtc atgatatcat gttgaaattc aaaggaggaa ataaaggtat tggtgtcact   660
atccgtggta ctagatatca acttcaacaa cttcattggc actctccttc cgaacataca   720
atcaatggca aaaggtttgc gctagaggaa cacttggttc atgagagcaa agataaacgc   780
tacgctgttg tcgcattctt atacaatctc ggagcatctg acccttttct cttttcgttg   840
gaaaaacaat tgaagaagat aactgataca catgcgtccg aggaacatat tcgcactgtg   900
tcaagtaaac aagtgaagct tctccgtgtg gctgtacacg atgcttcaga ttcaaatgcc   960
aggccgcttc aagcagtcaa taagcgcaag gtatatttat acaaaccaaa ggttaagtta  1020
atgaagaaat actgtaatat aagttcttac tag                               1053
<210>113
<211>350
<212>PRT
<213>拟南芥
<400>113
Met Lys Ile Ser Ser Leu Gly Trp Val Leu Val Leu Ile Phe Ile Ser
1               5                   10                  15
Ile Thr Ile Val Ser Ser Ala Pro Ala Pro Lys Pro Pro Lys Pro Lys
            20                  25                  30
Pro Ala Pro Ala Pro Thr Pro Pro Lys Pro Lys Pro Thr Pro Ala Pro
        35                  40                  45
Thr Pro Pro Lys Pro Lys Pro Lys Pro Ala Pro Thr Pro Pro Lys Pro
    50                  55                  60
Lys Pro Ala Pro Ala Pro Thr Pro Pro Lys Pro Lys Pro Ala Pro Ala
65                  70                  75                  80
Pro Thr Pro Pro Lys Pro Lys Pro Lys Pro Ala Pro Thr Pro Pro Asn
                85                  90                  95
Pro Lys Pro Thr Pro Ala Pro Thr Pro Pro Lys Pro Lys Pro Ala Pro
            100                 105                 110
Ala Pro Ala Pro Thr Pro Ala Pro Lys Pro Lys Pro Ala Pro Lys Pro
        115                 120                 125
Ala Pro Gly Gly Glu Val Glu Asp Glu Thr Glu Phe Ser Tyr Glu Thr
    130                 135                 140
Lys Gly Asn Lys Gly Pro Ala Lys Trp Gly Thr Leu Asp Ala Glu Trp
145                 150                 155                 160
Lys Met Cys Gly Ile Gly Lys Met Gln Ser Pro Ile Asp Leu Arg Asp
                165                 170                 175
Lys Asn Val Val Val Ser Asn Lys Phe Gly Leu Leu Arg Ser Gln Tyr
            180                 185                 190
Leu Pro Ser Asn Thr Thr Ile Lys Asn Arg Gly His Asp Ile Met Leu
        195                 200                 205
Lys Phe Lys Gly Gly Asn Lys Gly Ile Gly Val Thr Ile Arg Gly Thr
    210                 215                 220
Arg Tyr Gln Leu Gln Gln Leu His Trp His Ser Pro Ser Glu His Thr
225                 230                 235                 240
Ile Ash Gly Lys Arg Phe Ala Leu Glu Glu His Leu Val His Glu Ser
                245                 250                 255
Lys Asp Lys Arg Tyr Ala Val Val Ala Phe Leu Tyr Asn Leu Gly Ala
            260                 265                 270
Ser Asp Pro Phe Leu Phe Ser Leu Glu Lys Gln Leu Lys Lys Ile Thr
        275                 280                 285
Asp Thr His Ala Ser Glu Glu His Ile Arg Thr Val Ser Ser Lys Gln
    290                 295                 300
Val Lys Leu Leu Arg Val Ala Val His Asp Ala Ser Asp Ser Asn Ala
305                 310                 315                 320
Arg Pro Leu Gln Ala Val Asn Lys Arg Lys Val Tyr Leu Tyr Lys Pro
                325                 330                 335
Lys Val Lys Leu Met Lys Lys Tyr Cys Asn Ile Ser Ser Tyr
            340                 345                 350
<210>114
<211>834
<212>DNA
<213>拟南芥
<400>114
atgaaaacca ttatcctttt tgtaacattt cttgctcttt cttcttcatc tctagccgat   60
gagacagaga ctgaatttca ttacaaaccc ggtgagatag ccgatccctc gaaatggagc  120
agtatcaagg ctgaatggaa aatttgcggg acagggaaga ggcaatcgcc aatcaatctt  180
actccaaaaa tagctcgcat tgttcacaat tctacagaga ttcttcagac atattacaaa  240
cctgtagagg ctattcttaa gaaccgtgga ttcgacatga aggttaagtg ggaagacgat  300
gcagggaaga tcgtgatcaa tgataccgac tataaattgg ttcaaagcca ctggcacgca  360
ccttcagagc attttctcga tggacagagg ttggcaatgg aacttcacat ggtacacaaa  420
agtgtagaag ggcacttggc agtgattgga gttctcttca gagaaggaga accaaatgct  480
ttcatttcgc ggatcatgga caagatccat aagatcgcag acgtacaaga tggagaggtc  540
agcatcggaa agatagatcc aagagaattt ggatgggatc ttacaaagtt ttatgaatac  600
agaggttctc tcacgactcc tccttgcacg gaagatgtca tgtggaccat catcaacaag  660
gtggggactg tttcacgtga gcaaattgat gtattgacag atgctcgtcg cggtggttat  720
gagaagaacg cgagaccagc tcaacctctg aacggacgtc tggtttattt aaacgagcag  780
tccagtccaa gtccaactcc acggctaaga ataccacgag ttggtccggt ctaa        834
<210>115
<211>277
<2l2>PRT
<213>拟南芥
<400>115
Met Lys Thr Ile Ile Leu Phe Val Thr Phe Leu Ala Leu Ser Ser Ser
1               5                   10                  15
Ser Leu Ala Asp Glu Thr Glu Thr Glu Phe His Tyr Lys Pro Gly Glu
            20                  25                  30
Ile Ala Asp Pro Ser Lys Trp Ser Ser Ile Lys Ala Glu Trp Lys Ile
        35                  40                  45
Cys Gly Thr Gly Lys Arg Gln Ser Pro Ile Asn Leu Thr Pro Lys Ile
    50                  55                  60
Ala Arg Ile Val His Asn Ser Thr Glu Ile Leu Gln Thr Tyr Tyr Lys
65                  70                  75                  80
Pro Val Glu Ala Ile Leu Lys Asn Arg Gly Phe Asp Met Lys Val Lys
                85                  90                  95
Trp Glu Asp Asp Ala Gly Lys Ile Val Ile Asn Asp Thr Asp Tyr Lys
            100                 105                 110
Leu Val Gln Ser His Trp His Ala Pro Ser Glu His Phe Leu Asp Gly
        115                 120                 125
Gln Arg Leu Ala Met Glu Leu His Met Val His Lys Ser Val Glu Gly
    130                 135                 140
His Leu Ala Val Ile Gly Val Leu Phe Arg Glu Gly Glu Pro Asn Ala
145                 150                 155                 160
Phe Ile Ser Arg Ile Met Asp Lys Ile His Lys Ile Ala Asp Val Gln
                165                 170                 175
Asp Gly Glu Val Ser Ile Gly Lys Ile Asp Pro Arg Glu Phe Gly Trp
            180                 185                 190
Asp Leu Thr Lys Phe Tyr Glu Tyr Arg Gly Ser Leu Thr Thr Pro Pro
        195                 200                 205
Cys Thr Glu Asp Val Met Trp Thr Ile Ile Asn Lys Val Gly Thr Val
    210                 215                 220
Ser Arg Glu Gln Ile Asp Val Leu Thr Asp Ala Arg Arg Gly Gly Tyr
225                 230                 235                 240
Glu Lys Asn Ala Arg Pro Ala Gln Pro Leu Asn Gly Arg Leu Val Tyr
                245                 250                 255
Leu Asn Glu Gln Ser Ser Pro Ser Pro Thr Pro Arg Leu Arg Ile Pro
            260                 265                 270
Arg Val Gly Pro Val
        275
<210>116
<211>825
<212>DNA
<213>野生种烟草x花烟草(Nicotiana langsdorffii x Nicotiana sanderae)
<400>116
atgaggatgg cagcaataac caaaatgttg ttcatttcgt ttcttttcct ttcaagtgta   60
tttcttgcaa ggtccggaga agttgatgat gagagtgaat ttagttacga tgaaaaaagt  120
gagaatggac cagctaattg gggcaatatt cgtccagatt ggaaagaatg tagtggcaaa  180
ttgcagtctc ctattgatat ttttgacttg agggctgaag tagtttcaaa cttgagaata  240
cttcaaaagg actacaaacc atcgaatgcc actctcttga acagaggtca tgatataatg  300
ttgagattgg atgatggagg atacttgaag ataaatgaaa ctcaatatca actcaagcaa  360
ttgcattggc acacaccttc tgaacacact atcaatggag aaaggtttaa tttggaggct  420
catttggtac atgaaagtaa taatggaaag tttgttgtca ttggaatagt ctacgagatc  480
ggattatggc ctgatecctt cttatctatg atagagaacg atttgaaagt tcctgctaat  540
aaaaaaggta tagagagagg cattggaatt attgatccaa atcaaataaa attggatggc  600
aaaaaatatt ttaggtatat tggctcactt acaacacctc cttgcaccga aggtgttgtc  660
tggataattg atagaaaggt aaaaactgta accagaagac aaataaaact actccaagaa  720
gctgttcatg atggatttga aaccaacgct agaccaactc aaccagaaaa cgaacgttat  780
atcaactcaa cataccattc ctttggtatt gaaaagcagc agtga                  825
<210>117
<211>274
<212>PRT
<213>野生种烟草x花烟草
<400>117
Met Arg Met Ala Ala Ile Thr Lys Met Leu Phe Ile Ser Phe Leu Phe
1               5                   10                  15
Leu Ser Ser Val Phe Leu Ala Arg Ser Gly Glu Val Asp Asp Glu Ser
            20                  25                  30
Glu Phe Ser Tyr Asp Glu Lys Ser Glu Asn Gly Pro Ala Asn Trp Gly
        35                  40                  45
Asn Ile Arg Pro Asp Trp Lys Glu Cys Ser Gly Lys Leu Gln Ser Pro
    50                  55                  60
Ile Asp Ile Phe Asp Leu Arg Ala Glu Val Val Ser Asn Leu Arg Ile
65                  70                  75                  80
Leu Gln Lys Asp Tyr Lys Pro Ser Asn Ala Thr Leu Leu Asn Arg Gly
                85                  90                  95
His Asp Ile Met Leu Arg Leu Asp Asp Gly Gly Tyr Leu Lys Ile Asn
            100                 105                 110
Glu Thr Gln Tyr Gln Leu Lys Gln Leu His Trp His Thr Pro Ser Glu
        115                 120                 125
His Thr Ile Asn Gly Glu Arg Phe Asn Leu Glu Ala His Leu Val His
    130                 135                 140
Glu Ser Asn Asn Gly Lys Phe Val Val Ile Gly Ile Val Tyr Glu Ile
145                 150                 155                 160
Gly Leu Trp Pro Asp Pro Phe Leu Ser Met Ile Glu Asn Asp Leu Lys
                165                 170                 175
Val Pro Ala Asn Lys Lys Gly Ile Glu Arg Gly Ile Gly Ile Ile Asp
            180                 185                 190
Pro Asn Gln Ile Lys Leu Asp Gly Lys Lys Tyr Phe Arg Tyr Ile Gly
        195                 200                 205
Set Leu Thr Thr Pro Pro Cys Thr Glu Gly Val Val Trp Ile Ile Asp
    210                 215                 220
Arg Lys Val Lys Thr Val Thr Arg Arg Gln Ile Lys Leu Leu Gln Glu
225                 230                 235                 240
Ala Val His Asp Gly Phe Glu Thr Asn Ala Arg Pro Thr Gln Pro Glu
                245                 250                 255
Asn Glu Arg Tyr Ile Asn Ser Thr Tyr His Ser Phe Gly Ile Glu Lys
            260                 265                 270
Gln Gln
<210>118
<211>993
<212>DNA
<213>黄顶菊(Flaveria bidentis)
<400>118
atgtcggccg cctctgcttt cgccatgaat gcgccttcgt tcgtcaacgc ttcgtcgctg   60
aagaaagcgt ctacttcagc tagatctggt gtgttgtccg ccagatttac gtgcaattcg  120
tcgtcgtcgt cgtcttcgtc tgcaactcct ccgagtctca ttcgtaacga gcctgttttc  180
gctgctcccg cgcccatcat cacaccgaat tggaccgaag acggaaatga atcatacgaa  240
gaagccattg acgcgctcaa gaaaacgctc attgaaaagg gtgagttaga accagttgcc  300
gctacaagaa tcgaccaaat cacagctcaa gccgcagcac ccgacaccaa agctccattt  360
gaccctgttg agaggatcaa atccggcttc gtgaagttca agacagagaa attcgtcaca  420
aacccagcct tgtacgatga gcttgctaaa ggccaaagcc caaagttcat ggtgtttgca  480
tgctcagact cgcgtgtttg cccgtcacac gttcttgatt tccagcccgg tgaggcgttt  540
gttgttcgta acgttgccaa catggtccct ccctttgaca agaccaaata ttctggagta  600
ggagctgctg ttgagtatgc agttttgcat ctaaaggtac aagaaatctt tgtaattggg  660
catagccgtt gtggaggaat caagggtctc atgactttcc cagacgaagg acctcactca  720
accgatttca tcgaagattg ggtgaaagtg tgtctccccg cgaagtcaaa agtggtagca  780
gaacacaacg gcacacatct tgatgatcaa tgtgtactat gtgaaaagga agctgtgaac  840
gtgtcgcttg gaaacctgtt gacataccca tttgtaaggg atggattgag gaacaagaca  900
ctcgcgctca agggtggtca ctatgacttt gttaacggga cctttgagct gtgggcactt  960
gactttgggc tttcgtctcc tacctctgta tga                               993
<210>119
<211>330
<212>PRT
<213>黄顶菊
<400>119
Met Ser Ala Ala Ser Ala Phe Ala Met Asn Ala Pro Ser Phe Val Asn
1               5                   10                  15
Ala Ser Ser Leu Lys Lys Ala Ser Thr Ser Ala Arg Ser Gly Val Leu
            20                  25                  30
Ser Ala Arg Phe Thr Cys Asn Ser Ser Ser Ser Ser Ser Ser Ser Ala
        35                  40                  45
Thr Pro Pro Ser Leu Ile Arg Asn Glu Pro Val Phe Ala Ala Pro Ala
    50                  55                  60
Pro Ile Ile Thr Pro Asn Trp Thr Glu Asp Gly Asn Glu Ser Tyr Glu
65                  70                  75                  80
Glu Ala Ile Asp Ala Leu Lys Lys Thr Leu Ile Glu Lys Gly Glu Leu
                85                  90                  95
Glu Pro Val Ala Ala Thr Arg Ile Asp Gln Ile Thr Ala Gln Ala Ala
            100                 105                 110
Ala Pro Asp Thr Lys Ala Pro Phe Asp Pro Val Glu Arg Ile Lys Ser
        115                 120                 125
Gly Phe Val Lys Phe Lys Thr Glu Lys Phe Val Thr Asn Pro Ala Leu
    130                 135                 140
Tyr Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys Phe Met Val Phe Ala
145                 150                 155                 160
Cys Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln Pro
                165                 170                 175
Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Met Val Pro Pro Phe
            180                 185                 190
Asp Lys Thr Lys Tyr Ser Gly Val Gly Ala Ala Val Glu Tyr Ala Val
        195                 200                 205
Leu His Leu Lys Val Gln Glu Ile Phe Val Ile Gly His Ser Arg Cys
    210                 215                 220
Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro His Ser
225                 230                 235                 240
Thr Asp Phe Ile Glu Asp Trp Val Lys Val Cys Leu Pro Ala Lys Ser
                245                 250                 255
Lys Val Val Ala Glu His Asn Gly Thr His Leu Asp Asp Gln Cys Val
            260                 265                 270
Leu Cys Glu Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Thr
        275                 280                 285
Tyr Pro Phe Val Arg Asp Gly Leu Arg Asn Lys Thr Leu Ala Leu Lys
    290                 295                 300
Gly Gly His Tyr Asp Phe Val Asn Gly Thr Phe Glu Leu Trp Ala Leu
305                 310                 315                 320
Asp Phe Gly Leu Ser Ser Pro Thr Ser Val
                325                 330
<210>120
<211>975
<212>DNA
<213>大麦
<400>120
atgtcgttgc agattgggcg gacagagagg gcccggtccc cggtctttgt ctttgcacac   60
aagcggcaac tgctccatgg acggtgtagt accatcgaca atgcaaattg cagcacctgc  120
agcatgaaaa tcaatagcac ttgtacattg acggccctgc cgattgccgc actgcctggg  180
ccacgtacta cctcacacta ctcgaccgcc gcggctaact ggtgctacgc aaccgtcgcg  240
ccccgtgccc gctcctccac catcgccgcc agcctcggca cccccgcgcc ctcctcctcc  300
gcctccttcc gccccaagct catcaggacc acccccgtcc aggccgcgcc cgtcgcacct  360
gcattgatgg acgccgccgt ggagcgcctc aagaccgggt tcgagaagtt caagaccgag  420
gtctacgaca agaagcccga tttcttcgag ccgctcaagg ccggccaggc gcccaagtac  480
atggtgttcg cgtgcgccga ctcgcgtgtg tgcccgtcgg tcaccctggg ccttgagccc  540
ggtgaggcct tcaccatccg caacatcgcc aacatggtcc cggcctactg caagaacaag  600
tacgccggtg ttggatcggc catcgaatac gccgtctgcg cgctcaaggt tgaggtcatc  660
gtggtgattg gccacagccg ctgcggtgga atcaaggctc tgctctcgct caaggatggc  720
gcagacgact ccttccactt cgttgaggac tgggtcagga tcgggttccc ggccaagaag  780
aaggtgcaga ctgagtgcgc ctccatgcct ttcgatgacc agtgcaccgt cctggagaag  840
gaggccgtca acgtgtccct ccagaacctc ttgacctacc cgttcgtcaa ggagggtgtg  900
accaacggaa ccctcaagct cgtcggcggc cactacgact tcgtctccgg caagttcgaa  960
acatgggagc agtaa                                                   975
<210>121
<211>324
<212>PRT
<213>大麦
<400>121
Met Ser Leu Gln Ile Gly Arg Thr Glu Arg Ala Arg Ser Pro Val Phe
1               5                   10                  15
Val Phe Ala His Lys Arg Gln Leu Leu His Gly Arg Cys Ser Thr Ile
            20                  25                  30
Asp Asn Ala Asn Cys Ser Thr Cys Ser Met Lys Ile Asn Ser Thr Cys
        35                  40                  45
Thr Leu Thr Ala Leu Pro Ile Ala Ala Leu Pro Gly Pro Arg Thr Thr
    50                  55                  60
Ser His Tyr Set Thr Ala Ala Ala Asn Trp Cys Tyr Ala Thr Val Ala
65                  70                  75                  80
Pro Arg Ala Arg Ser Ser Thr Ile Ala Ala Ser Leu Gly Thr Pro Ala
                85                  90                  95
Pro Ser Ser Ser Ala Ser Phe Arg Pro Lys Leu Ile Arg Thr Thr Pro
            100                 105                 110
Val Gln Ala Ala Pro Val Ala Pro Ala Leu Met Asp Ala Ala Val Glu
        115                 120                 125
Arg Leu Lys Thr Gly Phe Glu Lys Phe Lys Thr Glu Val Tyr Asp Lys
    130                 135                 140
Lys Pro Asp Phe Phe Glu Pro Leu Lys Ala Gly Gln Ala Pro Lys Tyr
145                 150                 155                 160
Met Val Phe Ala Cys Ala Asp Ser Arg Val Cys Pro Ser Val Thr Leu
                165                 170                 175
Gly Leu Glu Pro Gly Glu Ala Phe Thr Ile Arg Asn Ile Ala Asn Met
            180                 185                 190
Val Pro Ala Tyr Cys Lys Asn Lys Tyr Ala Gly Val Gly Ser Ala Ile
        195                 200                 205
Glu Tyr Ala Val Cys Ala Leu Lys Val Glu Val Ile Val Val Ile Gly
    210                 215                 220
His Ser Arg Cys Gly Gly Ile Lys Ala Leu Leu Ser Leu Lys Asp Gly
225                 230                 235                 240
Ala Asp Asp Ser Phe His Phe Val Glu Asp Trp Val Arg Ile Gly Phe
                245                 250                 255
Pro Ala Lys Lys Lys Val Gln Thr Glu Cys Ala Ser Met Pro Phe Asp
            260                 265                 270
Asp Gln Cys Thr Val Leu Glu Lys Glu Ala Val Asn Val Ser Leu Gln
        275                 280                 285
Asn Leu Leu Thr Tyr Pro Phe Val Lys Glu Gly Val Thr Asn Gly Thr
    290                 295                 300
Leu Lys Leu Val Gly Gly His Tyr Asp Phe Val Ser Gly Lys Phe Glu
305                 310                 315                 320
Thr Trp Glu Gln
<210>122
<211>804
<212>DNA
<213>莱茵衣藻
<400>122
atgtcgtcgc ggaatgtcgc taccgctctg cgcatgttcg cgaccctcgg tccgagccag   60
gctggcgagg cctcggccat gatgggcacc ggctcggcgc tgctcgcgca gcgcgcggcc  120
gccctgggcg gcgcctcggc tgttaacaag ggctgcagct gccgctgcgg ccgcgtggcg  180
tgcatgggcg cgtgcatgcc gatgcgccac ctccacgccc accccaaccc gccctcggac  240
cccgaccagg ccctggagta ccttcgcgag ggcaacaagc gcttcgtgaa caacaagccg  300
cacgactcgc accccacgcg caacctggac cgcgtcaagg ccaccgccgc gggccagaag  360
cccttcgccg ccttcctgtc ctgcgccgac tcgcgcgtgc ctgtcgagat catcttcgac  420
cagggcttcg gtgacgtgtt cgtgacgcgc gtggccggca acatcgtgac caacgagatc  480
acggcgtcgc tggagttcgg cacggccgtc ctgggctcca aggtgctcat ggtgctgggc  540
cacagcgctt gcggcgccgt ggcggccacc atgaacggcg ccgccgtgcc tggcgtcatc  600
tcctctctct actacagcat cagcccggcc tgcaagaagg ctcaggctgg cgacgttgac  660
ggtgccattg ccgagaacgt caaggtccag atggagcagc tcaaggtgtc gcccgtgctg  720
caggggctcg tgaaggaggg caagctcaag atcgtgggcg gcgtgtacga cctggccacc  780
ggcaaggtga ccgagatcgc ctaa                                         804
<210>123
<211>267
<212>PRT
<213>莱茵衣藻
<400>123
Met Ser Ser Arg Asn Val Ala Thr Ala Leu Arg Met Phe Ala Thr Leu
1               5                   10                  15
Gly Pro Ser Gln Ala Gly Glu Ala Ser Ala Met Met Gly Thr Gly Ser
            20                  25                  30
Ala Leu Leu Ala Gln Arg Ala Ala Ala Leu Gly Gly Ala Ser Ala Val
        35                  40                  45
Asn Lys Gly Cys Ser Cys Arg Cys Gly Arg Val Ala Cys Met Gly Ala
    50                  55                  60
Cys Met Pro Met Arg His Leu His Ala His Pro Asn Pro Pro Ser Asp
65                  70                  75                  80
Pro Asp Gln Ala Leu Glu Tyr Leu Arg Glu Gly Asn Lys Arg Phe Val
                85                  90                  95
Asn Asn Lys Pro His Asp Ser His Pro Thr Arg Asn Leu Asp Arg Val
            100                 105                 110
Lys Ala Thr Ala Ala Gly Gln Lys Pro Phe Ala Ala Phe Leu Ser Cys
        115                 120                 125
Ala Asp Ser Arg Val Pro Val Glu Ile Ile Phe Asp Gln Gly Phe Gly
    130                 135                 140
Asp Val Phe Val Thr Arg Val Ala Gly Asn Ile Val Thr Asn Glu Ile
145                 150                 155                 160
Thr Ala Ser Leu Glu Phe Gly Thr Ala Val Leu Gly Ser Lys Val Leu
                 165                 170                 175
Met Val Leu Gly His Ser Ala Cys Gly Ala Val Ala Ala Thr Met Asn
            180                 185                 190
Gly Ala Ala Val Pro Gly Val Ile Ser Ser Leu Tyr Tyr Ser Ile Ser
       195                 200                 205
Pro Ala Cys Lys Lys Ala Gln Ala Gly Asp Val Asp Gly Ala Ile Ala
    210                 215                 220
Glu Asn Val Lys Val Gln Met Glu Gln Leu Lys Val Ser Pro Val Leu
225                 230                 235                 240
Gln Gly Leu Val Lys Glu Gly Lys Leu Lys Ile Val Gly Gly Val Tyr
                245                 250                 255
Asp Leu Ala Thr Gly Lys Val Thr Glu Ile Ala
            260                 265
<210>124
<211>846
<212>DNA
<213>稻
<400>124
ggagcgcgcc gtgcaccgcc tctcacaatg tcgaccgccg ccgccgccgc cgctgcccag     60
agctggtgct tcgccactgt caccccgcgc tcccgcgcca cagtcgtcgc cagcctcgcc    120
tccccatcac cgtcctcctc ctcctcctcc tccaacagca gcaacctccc ggcccccttc    180
cgcccccgcc tcatccgcaa cacccccgtc ttcgccgccc ccgtcgcccc cgccgcgatg    240
gacgccgccg tcgaccgcct caaggatggg ttcgccaagt tcaagaccga gttctatgac    300
aagaagccgg agctcttcga gccgctcaag gccggccagg cacccaagta catggtgttc    360
tcgtgcgccg actctcgcgt gtgcccgtcg gtgaccatgg gcctggagcc cggcgaggcc    420
ttcaccgtcc gcaacatcgc caacatggtc ccagcttact gcaagatcaa gcacgctggc    480
gtcgggtcgg ccatcgagta cgccgtctgc gccctcaagg tcgaactcat cgtggtgatt    540
ggccacagcc gctgcggtgg aatcaaggcc ctcctctcac tcaaggatgg agcaccagac    600
tccttccact tcgtcgagga ctgggtcagg accggtttcc ccgccaagaa gaaggttcag    660
accgagcacg cctcgctgcc tttcgatgac caatgcgcca tcttggagaa ggaggccgtg    720
aaccaatccc tggagaacct caagacctac ccgttcgtca aggaggggat cgccaacggc    780
accctcaagc tcgtcggcgg ccactacgac ttcgtctccg gcaacttgga cttatgggag    840
ccctaa                                                               846
<210>125
<211>273
<212>PRT
<213>稻
<400>125
Met Ser Thr Ala Ala Ala Ala Ala Ala Ala Gln Ser Trp Cys Phe Ala
1               5                   10                  15
Thr Val Thr Pro Arg Ser Arg Ala Thr Val Val Ala Ser Leu Ala Ser
            20                  25                  30
Pro Ser Pro Ser Ser Ser Ser Ser Ser Ser Ser Asn Ser Ser Asn Leu
        35                  40                  45
Pro Ala Pro Phe Arg Pro Arg Leu Ile Arg Asn Thr Pro Val Phe Ala
    50                  55                  60
Ala Pro Val Ala Pro Ala Ala Met Asp Ala Ala Val Asp Arg Leu Lys
65                  70                  75                  80
Asp Gly Phe Ala Lys Phe Lys Thr Glu Phe Tyr Asp Lys Lys Pro Glu
                85                  90                  95
Leu Phe Glu Pro Leu Lys Ala Gly Gln Ala Pro Lys Tyr Met Val Phe
            100                 105                 110
Ser Cys Ala Asp Ser Arg Val Cys Pro Ser Val Thr Met Gly Leu Glu
        115                 120                 125
Pro Gly Glu Ala Phe Thr Val Arg Asn Ile Ala Asn Met Val Pro Ala
    130                 135                 140
Tyr Cys Lys Ile Lys His Ala Gly Val Gly Ser Ala Ile Glu Tyr Ala
145                 150                 155                 160
Val Cys Ala Leu Lys Val Glu Leu Ile Val Val Ile Gly His Ser Arg
                165                 170                 175
Cys Gly Gly Ile Lys Ala Leu Leu Ser Leu Lys Asp Gly Ala Pro Asp
            180                 185                 190
Ser Phe His Phe Val Glu Asp Trp Val Arg Thr Gly Phe Pro Ala Lys
        195                 200                 205
Lys Lys Val Gln Thr Glu His Ala Ser Leu Pro Phe Asp Asp Gln Cys
    210                 215                 220
Ala Ile Leu Glu Lys Glu Ala Val Asn Gln Ser Leu Glu Asn Leu Lys
225                 230                 235                 240
Thr Tyr Pro Phe Val Lys Glu Gly Ile Ala Asn Gly Thr Leu Lys Leu
                245                 250                 255
Val Gly Gly His Tyr Asp Phe Val Ser Gly Asn Leu Asp Leu Trp Glu
            260                 265                 270
Pro
<210>126
<211>993
<212>DNA
<213>拟南芥
<400>126
atggtcccct tttggactac agtttctcga aatggctcat cagactcaga gacgactctc     60
caatctgctt caaaagccac aaaacagtat aaatatcctt ctcttcgtcc ctctcatcgc    120
ctgtctctcc tcttcctctt cccgttccat ttatccgcaa acggagcttg ttttcggtgc    180
acctgcttca gccacttcaa acttgaactg agaaggatgg gaaacgaatc atatgaagac    240
gccatcgaag ctctcaagaa gcttctcatt gagaaggatg atctgaagga tgtagctgcg    300
gccaaggtga agaagatcac ggcggagctt caggcagcct cgtcatcgga cagcaaatct    360
tttgatcccg tcgaacgaat taaggaaggc ttcgtcacct tcaagaagga gaaatacgag    420
accaatcctg ctttgtatgg tgagctcgcc aaaggtcaaa gcccaaagta catggtgttt    480
gcttgttcgg actcacgagt gtgcccatca cacgtactag acttccatcc tggagatgcc    540
ttcgtggttc gtaatatcgc caatatggtt cctccttttg acaaggtcaa atatgcagga    600
gttggagccg ccattgaata cgctgtcttg caccttaagg tggaaaacat tgtggtgata    660
gggcacagtg catgtggtgg catcaagggg cttatgtcat ttcctcttga cggaaacaac    720
tctactgact tcatagagga ttgggtcaaa atctgtttac cagcaaagtc aaaagttttg    780
gcagaaagtg aaagttcagc atttgaagac caatgtggcc gatgcgaaag ggcagtgaat    840
gtgtcactag caaacctatt gacatatcca tttgtgagag aaggagttgt gaaaggaaca    900
cttgctttga agggaggcta ctatgacttt gttaatggct cctttgagct ttgggagctc    960
cagtttggaa tttcccccgt tcattctata tga                                 993
<210>127
<211>347
<212>PRT
<213>拟南芥
<400>127
Met Ser Thr Ala Pro Leu Ser Gly Phe Phe Leu Thr Ser Leu Ser Pro
1               5                   10                  15
Ser Gln Ser Ser Leu Gln Lys Leu Ser Leu Arg Thr Ser Ser Thr Val
            20                  25                  30
Ala Cys Leu Pro Pro Ala Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
        35                  40                  45
Ser Ser Arg Ser Val Pro Thr Leu Ile Arg Asn Glu Pro Val Phe Ala
    50                  55                  60
Ala Pro Ala Pro Ile Ile Ala Pro Tyr Trp Ser Glu Glu Met Gly Thr
65                  70                  75                  80
Glu Ala Tyr Asp Glu Ala Ile Glu Ala Leu Lys Lys Leu Leu Ile Glu
                85                  90                  95
Lys Glu Glu Leu Lys Thr Val Ala Ala Ala Lys Val Glu Gln Ile Thr
            100                 105                 110
Ala Ala Leu Gln Thr Gly Thr Ser Ser Asp Lys Lys Ala Phe Asp Pro
        115                 120                 125
Val Glu Thr Ile Lys Gln Gly Phe Ile Lys Phe Lys Lys Glu Lys Tyr
    130                 135                 140
Glu Thr Asn Pro Ala Leu Tyr Gly Glu Leu Ala Lys Gly Gln Ser Pro
145                 150                 155                 160
Lys Tyr Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His
                165                 170                 175
Val Leu Asp Phe Gln Pro Gly Asp Ala Phe Val Val Arg Asn Ile Ala
            180                 185                 190
Asn Met Val Pro Pro Phe Asp Lys Val Lys Tyr Gly Gly Val Gly Ala
        195                 200                 205
Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Asn Ile Val Val
    210                 215                 220
Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Phe Pro
225                 230                 235                 240
Leu Asp Gly Asn Asn Ser Thr Asp Phe Ile Glu Asp Trp Val Lys Ile
                245                 250                 255
Cys Leu Pro Ala Lys Ser Lys Val Ile Ser Glu Leu Gly Asp Ser Ala
            260                 265                 270
Phe Glu Asp Gln Cys Gly Arg Cys Glu Arg Glu Ala Val Asn Val Ser
        275                 280                 285
Leu Ala Asn Leu Leu Thr Tyr Pro Phe Val Arg Glu Gly Leu Val Lys
    290                 295                 300
Gly Thr Leu Ala Leu Lys Gly Gly Tyr Tyr Asp Phe Val Lys Gly Ala
305                 310                 315                 320
Phe Glu Leu Trp Gly Leu Glu Phe Gly Leu Ser Glu Thr Ser Ser Val
                325                 330                 335
Lys Asp Val Ala Thr Ile Leu His Trp Lys Leu
            340                 345
<210>128
<211>990
<212>DNA
<213>Flaveria pringlei
<400>128
atgtcgaccg cctctgcttt cgccattaat gcgccttcgt tcgtcaacgc ttcgtcgctg     60
aagaagtcgt cttcttcagc cagatctggt gtgttgtccg ccagatttac gtgcaattcg    120
tcgtcgtctt cttcgtctgc tactcctccg agtctcattc gtaacgagcc tgttttcgct    180
gctccggctc ctatcatcac accgaattgg accgaagatg gaaatgaatc atacgaggaa    240
gccattgacg cactcaagaa aatgctcatt gaaaagggtg agttagaacc agttgccgct    300
gcaagaatcg accaaatcac agctcaagcc gcagcacccg acaccaaagc tccatttgac    360
cctgttgaga ggatcaaatc cggcttcgtg aagttcaaga cagagaaatt cgtcacaaac    420
ccggtcttgt acgatgagct tgctaaaggc caaagcccaa agttcatggt gtttgcatgc    480
tcagactcgc gtgtttgccc atcacacgtt cttgatttcc agcccggtga ggcgtttgtt    540
gtccgtaacg ttgccaacat ggtccctccc tttgacaaga ccaaatattc tggagtagga    600
gctgctgttg agtatgcagt tttgcatcta aaggtacaag aaatatttgt aattgggcat    660
agccgttgtg gagggatcaa gggtctcatg actttcccag acgaaggacc tcactcaacc    720
gatttcatcg aagattgggt gaaagtatgt ctccccgcga agtcaaaagt ggtagcagaa    780
cacaacggca cacatcttga tgatcaatgt gtactatgtg aaaaggaagc tgtgaacgtg    840
tcgcttggaa acctgttgac atacccattt gtaagggatg gattgaggaa caatacactc    900
gcgctcaagg gtggtcacta tgactttgtt aacgggacct ttgagctgtg ggcacttgac    960
tttggccttt cgtctcctac ctctgtatga                                     990
<210>129
<211>329
<212>PRT
<213>Flaveria pringlei
<400>129
Met Ser Thr Ala Ser Ala Phe Ala Ile Asn Ala Pro Ser Phe Val Asn
1               5                   10                  15
Ala Ser Ser Leu Lys Lys Ser Ser Ser Ser Ala Arg Ser Gly Val Leu
            20                  25                  30
Ser Ala Arg Phe Thr Cys Asn Ser Ser Ser Ser Ser Ser Ser Ala Thr
        35                  40                  45
Pro Pro Ser Leu Ile Arg Asn Glu Pro Val Phe Ala Ala Pro Ala Pro
    50                  55                  60
Ile Ile Thr Pro Asn Trp Thr Glu Asp Gly Asn Glu Ser Tyr Glu Glu
65                  70                  75                  80
Ala Ile Asp Ala Leu Lys Lys Met Leu Ile Glu Lys Gly Glu Leu Glu
                85                  90                  95
Pro Val Ala Ala Ala Arg Ile Asp Gln Ile Thr Ala Gln Ala Ala Ala
            100                 105                 110
Pro Asp Thr Lys Ala Pro Phe Asp Pro Val Glu Arg Ile Lys Ser Gly
        115                 120                 125
Phe Val Lys Phe Lys Thr Glu Lys Phe Val Thr Asn Pro Val Leu Tyr
    130                 135                 140
Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys Phe Met Val Phe Ala Cys
145                 150                 155                 160
Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln Pro Gly
                165                 170                 175
Glu Ala Phe Val Val Arg Asn Val Ala Asn Met Val Pro Pro Phe Asp
            180                 185                 190
Lys Thr Lys Tyr Ser Gly Val Gly Ala Ala Val Glu Tyr Ala Val Leu
        195                 200                 205
His Leu Lys Val Gln Glu Ile Phe Val Ile Gly His Ser Arg Cys Gly
    210                 215                 220
Gly Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro His Ser Thr
225                 230                 235                 240
Asp Phe Ile Glu Asp Trp Val Lys Val Cys Leu Pro Ala Lys Ser Lys
                245                 250                 255
Val Val Ala Glu His Asn Gly Thr His Leu Asp Asp Gln Cys Val Leu
            260                 265                 270
Cys Glu Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Thr Tyr
        275                 280                 285
Pro Phe Val Arg Asp Gly Leu Arg As nAsn Thr Leu Ala Leu Lys Gly
    290                 295                 300
Gly His Tyr Asp Phe Val Asn Gly Thr Phe Glu Leu Trp Ala Leu Asp
305                 310                 315                 320
Phe Gly Leu Ser Ser Pro Thr Ser Val
                325
<210>130
<211>993
<212>DNA
<213>Flaveria linearis
<400>130
atgtcgaccg cctctgcttt cgccattaac gcgccttcgt tcgtcaacgc ttcatcgctg     60
aagaagtcgt cgacttcttc agccagatct ggtgtgttgt ccgccagatt tacgtgcaat    120
tcgtcgtcgt cttcttcgtc tgcaactcct ccgagtctca ttcgtaacga gcctgttttc    180
gctgccccgg cgcccatcat aacaccgaat tggaccgaag acggaaatga atcatacgag    240
gaagccattg acgcactcaa gaaaatgctc attgaaaagg gtgagttaga acccgttgcc    300
gctgcaagaa tcgaccaaat cacagctcaa gccgcagcac ccgacaccaa agctccattc    360
gaccctgttg agaggatcaa atccggcttc gtgaagttca agacagagaa attcgtaaca    420
aacccagccc tgtacgatga gcttgctaaa ggccaaagcc caaagttcat ggtgtttgca    480
tgctcagact cgcgtgtttg cccatcacac gttcttgatt tccagcccgg tgaggcgttt    540
gttgtccgta acgttgccaa catggtccct ccctttgaca agaccaaata ttctggagta    600
ggagctgctg ttgagtatgc agttttgcat ctaaaggtac aagaaatatt tgtaattggg    660
catagccgtt gcggagggat caagggtctc atgactttcc cagacgaagg acctcactca    720
actgatttca tcgaagattg ggtgaaagta tgcctccccg caaagtcaaa agtggtagca    780
gaacacaacg gcacacatct tgatgatcaa tgtgtacaat gtgaaaagga agctgtgaac    840
gtgtcgcttg gaaacctgtt gacataccca tttgtaaggg atggtttgag gaacaataca    900
ctcgcgctca agggtggtca ctatgatttt gttaacggga cctttgagct gtgggcactt    960
gactttgggc tttcgtctcc tacctctgta tga                                 993
<210>131
<211>330
<212>PRT
<213>Flaveria linearis
<400>131
Met Ser Thr Ala Ser Ala Phe Ala Ile Asn Ala Pro Ser Phe Val Asn
1               5                   10                  15
Ala Ser Ser Leu Lys Lys Ser Ser Thr Ser Ser Ala Arg Ser Gly Val
            20                  25                  30
Leu Ser Ala Arg Phe Thr Cys Asn Ser Ser Ser Ser Ser Ser Ser Ala
        35                  40                  45
Thr Pro Pro Ser Leu Ile Arg Asn Glu Pro Val Phe Ala Ala Pro Ala
    50                  55                  60
Pro Ile Ile Thr Pro Asn Trp Thr Glu Asp Gly Asn Glu Ser Tyr Glu
65                  70                  75                  80
Glu Ala Ile Asp Ala Leu Lys Lys Met Leu Ile Glu Lys Gly Glu Leu
                85                  90                  95
Glu Pro Val Ala Ala Ala Arg Ile Asp Gln Ile Thr Ala Gln Ala Ala
            100                 105                 110
Ala Pro Asp Thr Lys Ala Pro Phe Asp Pro Val Glu Arg Ile Lys Ser
        115                 120                 125
Gly Phe Val Lys Phe Lys Thr Glu Lys Phe Val Thr Asn Pro Ala Leu
    130                 135                 140
Tyr Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys Phe Met Val Phe Ala
145                 150                 155                 160
Cys Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln Pro
                165                 170                 175
Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Met Val Pro Pro Phe
            180                 185                 190
Asp Lys Thr Lys Tyr Ser Gly Val Gly Ala Ala Val Glu Tyr Ala Val
        195                 200                 205
Leu His Leu Lys Val Gln Glu Ile Phe Val Ile Gly His Ser Arg Cys
    210                 215                 220
Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro His Ser
225                 230                 235                 240
Thr Asp Phe Ile Glu Asp Trp Val Lys Val Cys Leu Pro Ala Lys Ser
                245                 250                 255
Lys Val Val Ala Glu His Asn Gly Thr His Leu Asp Asp Gln Cys Val
            260                 265                 270
Gln Cys Glu Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Thr
        275                 280                 285
Tyr Pro Phe Val Arg Asp Gly Leu Arg Asn Asn Thr Leu Ala Leu Lys
    290                 295                 300
Gly Gly His Tyr Asp Phe Val Asn Gly Thr Phe Glu Leu Trp Ala Leu
305                 310                 315                 320
Asp Phe Gly Leu Ser Ser Pro Thr Ser Val
                325                 330
<210>132
<211>993
<212>DNA
<213>黄花菊(Flaveria brownii)
<400>132
atgtcgaccg cctctgcttt cgccactaac gtgccttcgt tcgtcaacgc ttcatcgctg     60
aagaagtcgt ccacttcttc agccagatct ggtgtgttgt ccgccaaatt tacgtgcaat    120
tcgtcgtcgt cttcttcgtc tgcaactcct ccgagtctca ttcgtaacga gcctgttttc    180
gctgctccgg cgcccatcat cacaccgaat tggaccgaag acggaaatga atcatacgag    240
gaagccattg acgcactcaa gaaaatgctc attgaaaagg gtgagttaga accagttgcg    300
gctgcaagaa tcgaccaaat cacagctcaa gccgcggcac ccgacaccaa agctccattc    360
gaccctgttg agaggatcaa atccggcttc gtgaagttca agactgagaa attcgtaaca     420
aacccagccc tgtacgatga gcttgctaaa ggccaaagcc caaagttcat ggtgtttgca     480
tgctcagact cgcgtgtttg cccatcacac gttcttgatt tccagcccgg tgaggcgttt     540
gttgtccgta acgttgccaa catggtccct ccctttgaca agaccaaata ttctggagta     600
ggagctgctg ttgagtatgc agttttgcat ctgaaggtac aagaaatatt tgtaattggg     660
catagccgtt gcggagggat caagggtctc atgactttcc cagacgaagg acctcactca     720
accgatttca tcgaagattg ggtgaaagta tgcctccccg cgaagtcaaa agtggtagca     780
gaacacaacg gcacacatct tgatgatcaa tgtgtactat gtgaaaagga agctgtgaac     840
gtgtcgcttg gaaacctgtt gacataccca tttgtaaggg atggtttgag gaacaataca     900
ctcgcgctca agggtggtca ctatgatttt gttaacggga cctttgagct gtgggcactt     960
gactttgggc tttcgtctcc tacctctgta tga                                  993
<210>133
<211>330
<212>PRT
<213>黄花菊
<400>133
Met Ser Thr Ala Ser Ala Phe Ala Thr Asn Val Pro Ser Phe Val Asn
1               5                   10                  15
Ala Ser Ser Leu Lys Lys Ser Ser Thr Ser Ser Ala Arg Ser Gly Val
            20                  25                  30
Leu Ser Ala Lys Phe Thr Cys Asn Ser Ser Ser Ser Ser Ser Ser Ala
        35                  40                  45
Thr Pro Pro Ser Leu Ile Arg Asn Glu Pro Val Phe Ala Ala Pro Ala
    50                  55                  60
Pro Ile Ile Thr Pro Asn Trp Thr Glu Asp Gly Asn Glu Ser Tyr Glu
65                  70                  75                  80
Glu Ala Ile Asp Ala Leu Lys Lys Met Leu Ile Glu Lys Gly Glu Leu
            85                  90                  95
Glu Pro Val Ala Ala Ala Arg Ile Asp Gln Ile Thr Ala Gln Ala Ala
        100                 105                 110
Ala Pro Asp Thr Lys Ala Pro Phe Asp Pro Val Glu Arg Ile Lys Ser
    115                 120                 125
Gly Phe Val Lys Phe Lys Thr Glu Lys Phe Val Thr Asn Pro Ala Leu
    130                 135                 140
Tyr Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys Phe Met Val Phe Ala
145                 150                 155                 160
Cys Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln Pro
                165                 170                 175
Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Met Val Pro Pro Phe
            180                 185                 190
Asp Lys Thr Lys Tyr Ser Gly Val Gly Ala Ala Val Glu Tyr Ala Val
        195                 200                 205
Leu His Leu Lys Val Gln Glu Ile Phe Val Ile Gly His Ser Arg Cys
    210                 215                 220
Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro His Ser
225                 230                 235                 240
Thr Asp Phe Ile Glu Asp Trp ValLys Val Cys Leu Pro Ala Lys Ser
                245                 250                 255
Lys Val Val Ala Glu His Asn Gly Thr His Leu Asp Asp Gln Cys Val
            260                 265                 270
Leu Cys Glu Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Thr
        275                 280                 285
Tyr Pro Phe Val Arg Asp Gly Leu Arg Asn Asn Thr Leu Ala Leu Lys
    290                 295                 300
Gly Gly His Tyr Asp Phe Val Asn Gly Thr Phe Glu Leu Trp Ala Leu
305                 310                 315                 320
Asp Phe Gly Leu Ser Ser Pro Thr Ser Val
                325                 330
<210>134
<211>969
<212>DNA
<213>野生种圆锥烟草(Nicotiana paniculata)
<400>134
atgtcaactg cttccattaa cagttgcctt actatctccc cagctcaagc ttcccttaag     60
aaaccaattc gtcctgttgc ttttgctagg cttagcaaca cctcttcttc ttcttcttcc    120
gttcccagtc tcatcagaaa cgagcccgtc ttcgccgccc caactcccat catcaacccc    180
attttgagag aagaaatggc aaaggaatcc tatgagcagg ccattgctgc actcgagaaa    240
ctcctcagcg aaaaaggaga acttggacca attgctgcag caagagttga ccagattaca    300
gctgaattgc aatcatcaga tggcagcaaa ccattcgacc ctgttgagca catgaaagct    360
ggctttattc acttcaaaac tgagaaatac gagaagaacc cagccttata tggggaacta    420
tcaaaaggcc agagccccaa gttcatggtc tttgcctgct ctgactctcg agtgtgccca    480
tcacatgttc tgaacttcca acctggtgag gctttcgtgg tccgaaacat cgccaacatg    540
gtccccgctt atgacaagac cagatactct ggtgtcggag cagctatcga atacgctgtt    600
ctccacctta aggtagagaa cattgttgtc attggccaca gcgcatgtgg aggtatcaaa    660
ggtctcatgt ctctatctgc agatggttct gaatcaactg cctttattga ggattgggtg    720
aaaattggtt tacctgccaa ggccaaggtg gagggtgaac acgcggataa atgttttgca    780
gatcaatgca cagcttgtga gaaggaagct gtgaatgtgt cacttggaaa tttgctgacc    840
tatccatttg tgagagaagg tttggtgaag aaaacactag cattgaaggg aggtcactat    900
gattttgtga atggaggatt tgagctgtgg ggacttgagt tcggtctttc tccttctctt    960
tccgtatga                                                            969
<210>135
<211>322
<212>PRT
<213>野生种圆锥烟草
<400>135
Met Ser Thr Ala Ser Ile Asn Ser Cys Leu Thr Ile Ser Pro Ala Gln
1                 5                 10                  15
Ala Ser Leu Lys Lys Pro Ile Arg Pro Val Ala Phe Ala Arg Leu Ser
            20                  25                  30
Asn Thr Ser Ser Ser Ser Ser Ser Val Pro Ser Leu Ile Arg Asn Glu
        35                  40                  45
Pro Val Phe Ala Ala Pro Thr Pro Ile Ile Asn Pro Ile Leu Arg Glu
    50                  55                  60
Glu Met Ala Lys Glu Ser Tyr Glu Gln Ala Ile Ala Ala Leu Glu Lys
65                  70                  75                  80
Leu Leu Ser Glu Lys Gly Glu Leu Gly Pro Ile Ala Ala Ala Arg Val
                85                  90                  95
Asp Gln Ile Thr Ala Glu Leu Gln Ser Ser Asp Gly Ser Lys Pro Phe
            100                 105                 110
Asp Pro Val Glu His Met Lys Ala Gly Phe Ile His Phe Lys Thr Glu
        115                 120                 125
Lys Tyr Glu Lys Asn Pro Ala Leu Tyr Gly Glu Leu Ser Lys Gly Gln
    130                 135                 140
Ser Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro
145                 150                 155                 160
Ser His Val Leu Asn Phe Gln Pro Gly Glu Ala Phe Val Val Arg Asn
                165                 170                 175
Ile Ala Asn Met Val Pro Ala Tyr Asp Lys Thr Arg Tyr Ser Gly Val
            180                 185                 190
Gly Ala Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Asn Ile
        195                 200                 205
Val Val Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser
    210                 215                 220
Leu Ser Ala Asp Gly Ser Glu Ser Thr Ala Phe Ile Glu Asp Trp Val
225                 230                 235                 240
Lys Ile Gly Leu Pro Ala Lys Ala Lys Val Glu Gly Glu His Ala Asp
                245                 250                 255
Lys Cys Phe Ala Asp Gln Cys Thr Ala Cys Glu Lys Glu Ala Val Asn
            260                 265                 270
Val Ser Leu Gly Asn Leu Leu Thr Tyr Pro Phe Val Arg Glu Gly Leu
        275                 280                 285
Val Lys Lys Thr Leu Ala Leu Lys Gly Gly His Tyr Asp Phe Val Asn
    290                 295                 300
Gly Gly Phe Glu Leu Trp Gly Leu Glu Phe Gly Leu Ser Pro Ser Leu
305                 310                 315                 320
Ser Val
<210>136
<211>966
<212>DNA
<213>烟草(Nicotiana tabacum)
<400>136
atgtcaactg cttccattaa cagttgcctt actatctccc ctgctcaagc ttcccttaag     60
aaaccaactc gtcctgttgc ttttgcaagg cttagcaact cttcttcttc tacttctgtt    120
cccagtctca tcagaaacga gcccgtcttc gccgccccta ctcccatcat caaccctatt    180
ttgagagaag aaatggcaaa ggaatcctat gagcaggcca ttgctgcact cgagaaactc    240
ctcagcgaaa aaggagaact tggaccaatt gctgcagcaa gagttgacca gattacagct    300
gaattgcaat catcagatgg cagcaaacca ttcgaccctg ttgagcacat gaaagctggc    360
tttattcact tcaaaactga gaaatacgag aagaacccag ccttatatgg ggaactatca    420
aaaggccaga gccccaagtt catggtcttt gcctgctctg actctcgagt gtgcccatca    480
catgtcctga acttccaacc tggtgaggct ttcgtggtcc gaaacatcgc caacatggtc    540
cctgcttatg acaagaccag atactccgga gtcggagcag ctatcgaata cgctgttctt    600
caccttaagg tagagaacat tgttgtcatt ggccatagcg catgtggagg tatcaaaggt    660
ctcatgtctt tacctgcaga tggttctgaa tcaactgcct tcattgagga ttgggtgaaa    720
attggtttac ctgccaaggc gaaggtgcag ggtgaacacg tggataaatg ttttgcagat    780
caatgcacag cttgtgagaa ggaagctgtg aatgtgtcac ttggaaattt gctgacctat    840
ccatttgtga gagaaggttt ggtgaagaaa acactagcat tgaagggagg tcactatgat    900
ttcgtgaatg gaggatttga gctgtgggga cttgagttcg gtctttctcc ttctctttcc    960
gtatga                                                               966
<210>137
<211>321
<212>PRT
<213>烟草
<400>137
Met Ser Thr Ala Ser Ile Asn Ser Cys Leu Thr Ile Ser Pro Ala Gln
1               5                   10                  15
Ala Ser Leu Lys Lys Pro Thr Arg Pro Val Ala Phe Ala Arg Leu Ser
            20                  25                  30
Asn Ser Ser Ser Ser Thr Ser Val Pro Ser Leu Ile Arg Asn Glu Pro
        35                  40                  45
Val Phe Ala Ala Pro Thr Pro Ile Ile Asn Pro Ile Leu Arg Glu Glu
    50                  55                  60
Met Ala Lys Glu Ser Tyr Glu Gln Ala Ile Ala Ala Leu Glu Lys Leu
65                  70                  75                  80
Leu Ser Glu Lys Gly Glu Leu Gly Pro Ile Ala Ala Ala Arg Val Asp
                85                  90                  95
Gln Ile Thr Ala Glu Leu Gln Ser Ser Asp Gly Ser Lys Pro Phe Asp
            100                 105                 110
Pro Val Glu His Met Lys Ala Gly Phe Ile His Phe Lys Thr Glu Lys
        115                 120                 125
Tyr Glu Lys Asn Pro Ala Leu Tyr Gly Glu Leu Ser Lys Gly Gln Ser
    130                 135                 140
Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser
145                 150                 155                 160
His Val Leu Asn Phe Gln Pro Gly Glu Ala Phe Val Val Arg Asn Ile
                165                 170                 175
Ala Asn Met Val Pro Ala Tyr Asp Lys Thr Arg Tyr Ser Gly Val Gly
            180                 185                 190
Ala Ala Ile Glu Tyr Ala ValLeu Hi s Leu Lys Val Glu Asn Ile Val
        195                 200                 205
Val Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Leu
    210                 215                 220
Pro Ala Asp Gly Ser Glu Ser Thr Ala Phe Ile Glu Asp Trp Val Lys
225                 230                 235                 240
Ile Gly Leu Pro Ala Lys Ala Lys Val Gln Gly Glu His Val Asp Lys
                245                 250                 255
Cys Phe Ala Asp Gln Cys Thr Ala Cys Glu Lys Glu Ala Val Asn Val
            260                 265                 270
Ser Leu Gly Asn Leu Leu Thr Tyr Pro Phe Val Arg Glu Gly Leu Val
        275                 280                 285
Lys Lys Thr Leu Ala Leu Lys Gly Gly His Tyr Asp Phe Val Asn Gly
    290                 295                 300
Gly Phe Glu Leu Trp Gly Leu Glu Phe Gly Leu Ser Pro Ser Leu Ser
305                 310                 315                 320
Val
<210>138
<211>963
<212>DNA
<213>欧洲山杨(Populus tremula)x美洲山杨
<400>138
atgtcgactg cttcgattaa cagctggtgt ctcacctctg tctctgcctc taagaaatca     60
ctacccgcat tacgtccttc agtctttgca agcctcaact cctctgtttc tcctcctacc    120
cttatcagaa accagcctgt tttcgcagcc cctgctccta ttctctatcc acggagaggc    180
gaagaaatgg gaaacgacta caacgaggcc attgaatctc tcaagaaact cctcagtgac    240
aaggaagagc tgaaaactgt agcagctgcg aaagtggagc agataacagc tgaattacaa    300
accgtctcat cttctgaccc caaggcattc gatcctgttg agaagattaa atccggattc    360
attcacttca agaaggagaa atatgacaag aatccgggac tgtactccga gcttgccaaa    420
ggccaaagcc ccaagtttat ggtgtttgca tgctcggatt cccgggtttg cccgtcccat    480
gtgcttgatt tccaaccagg ggaagctttt gtggtccgca atgttgcgaa tatggtcccg    540
ccatacgata agactaagta cgctggagtt ggggcagcga tagagtacgc agttttgcat    600
ctgaaggtgg aatacattgt ggtcatcgga cacagcgcct gtggtggaat taagggcctc    660
atgtccttcc cgtatgatgg aacaacatca actgatttca tagaagactg ggtcaaagtc    720
tgctacaatg ccaagaccaa gattttagca gaacatgcca actcaccttt cccagacatg    780
tgtacacaat gtgaaaagga ggcagtgaac gtgtccatcg gacacttgct cacctacccg    840
tttgtgagag atggcttggt gaacaaaact ctaggactga agggtggtta ttatgatttt    900
gtcaaaggca gttttgagct ctgggggctt gagtacagcc tctccccctc tctctccgta    960
tga                                                                  963
<210>139
<211>320
<212>PRT
<213>欧洲山杨x美洲山杨
<400>139
Met Ser Thr Ala Ser Ile Asn Ser Trp Cys Leu Thr Ser Val Ser Ala
1               5                   10                  15
Ser Lys Lys Ser Leu Pro Ala Leu Arg Pro Ser Val Phe Ala Ser Leu
            20                  25                  30
Asn Ser Ser Val Ser Pro Pro Thr Leu Ile Arg Asn Gln Pro Val Phe
        35                  40                  45
Ala Ala Pro Ala Pro Ile Leu Tyr Pro Arg Arg Gly Glu Glu Met Gly
    50                  55                  60
Asn Asp Tyr Asn Glu Ala Ile Glu Ser Leu Lys Lys Leu Leu Ser Asp
65                  70                  75                  80
Lys Glu Glu Leu Lys Thr Val Ala Ala Ala Lys Val Glu Gln Ile Thr
                85                  90                  95
Ala Glu Leu Gln Thr Val Ser Ser Ser Asp Pro Lys Ala Phe Asp Pro
            100                 105                 110
Val Glu Lys Ile Lys Ser Gly Phe Ile His Phe Lys Lys Glu Lys Tyr
        115                 120                 125
Asp Lys Asn Pro Gly Leu Tyr Ser Glu Leu Ala Lys Gly Gln Ser Pro
    130                 135                 140
Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His
145                 150                 155                 160
Val Leu Asp Phe Gln Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala
                165                 170                 175
Asn Met Val Pro Pro Tyr Asp Lys Thr Lys Tyr Ala Gly Val Gly Ala
            180                 185                 190
Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Tyr Ile Val Val
        195                 200                 205
Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Phe Pro
    210                 215                 220
Tyr Asp Gly Thr Thr Ser Thr Asp Phe Ile Glu Asp Trp Val Lys Val
225                 230                 235                 240
Cys Tyr Asn Ala Lys Thr Lys Ile Leu Ala Glu His Ala Asn Ser Pro
                245                 250                 255
Phe Pro Asp Met Cys Thr Gln Cys Glu Lys Glu Ala Val Asn Val Ser
            260                 265                 270
Ile Gly His Leu Leu Thr Tyr Pro Phe Val Arg Asp Gly Leu Val Asn
        275                 280                 285
Lys Thr Leu Gly Leu Lys Gly Gly Tyr Tyr Asp Phe Val Lys Gly Ser
    290                 295                 300
Phe Glu Leu Trp Gly Leu Glu Tyr Ser Leu Ser Pro Ser Leu Ser Val
305                 310                 315                 320
<210>140
<211>963
<212>DNA
<213>欧洲山杨x美洲山杨
<400>140
atgtcgactg cttcgattaa cagctggtgt ctcacctctg tctctccctc taagaaatca     60
ctacccgcat tacgtccttc agtctttgca agcctcaact cctctgtttc tcctcctacc    120
cttatcagaa accagcctgt tttcgcagcc cctgctccta ttctctatcc acggagaggc    180
gaagaaatgg gaaacgacta caacgaggcc attgaatctc tcaagaaact cctcagtgat    240
aaggaggagc tgaaaactgt agcagctgcg aaagtggagc agataacagc tgaattacaa    300
accgtctcat cttctgaccc caaggcattc gatcctgttg agaagattaa atccggattc    360
attcacttca agaaggagaa atatgacaag aatccgggac tgtactccga gcttgccaaa    420
ggccaaagcc ccaagtttat ggtgtttgca tgctcggatt cccgggtttg cccgtcccat    480
gtgcttgatt tccaaccggg ggaagctttt gtggtccgca atgttgcgaa tatggtcccg    540
ccatacgata agactaagta cgctggagtt ggggcagcga tagagtacgc agttttgcat    600
ctgaaggtgg aatacattgt ggtcatcgga cacagcgcct gtggtggaat taagggcctc    660
atgtccttcc cgtatgatgg aacaacatca actgatttca tagaagactg ggtcaaagtc    720
tgctacaatg ccaagaccaa gattttagca gaacatgcca actcaccttt cccagacatg    780
tgtacacaat gtgaaaagga ggcagtgaac gtgtccctcg gacacttgct cacctacccg    840
tttgtgagag atggcttggt gaacaaaact ctaggcctta agggtggtta ttatgatttt    900
gtcaaaggaa gttttgagct ctggggcctt gagtacagcc tctctccctc tctctccgta    960
tga                                                                  963
<210>141
<211>320
<212>PRT
<213>欧洲山杨
<400>141
Met Ser Thr Ala Ser Ile Asn Ser Trp Cys Leu Thr Ser Val Ser Pro
1               5                   10                  15
Ser Lys Lys Ser Leu Pro Ala Leu Arg Pro Ser Val Phe Ala Ser Leu
            20                  25                  30
Asn Ser Ser Val Ser Pro Pro Thr Leu Ile Arg Asn Gln Pro Val Phe
        35                  40                  45
Ala Ala Pro Ala Pro Ile Leu Tyr Pro Arg Arg Gly Glu Glu Met Gly
    50                  55                  60
Asn Asp Tyr Asn Glu Ala Ile Glu Ser Leu Lys Lys Leu Leu Ser Asp
65                  70                  75                  80
Lys Glu Glu Leu Lys Thr Val Ala Ala Ala Lys Val Glu Gln Ile Thr
                85                  90                  95
Ala Glu Leu Gln Thr Val Ser Ser Ser Asp Pro Lys Ala Phe Asp Pro
            100                 105                 110
Val Glu Lys Ile Lys Ser Gly Phe Ile His Phe Lys Lys Glu Lys Tyr
        115                 120                 125
Asp Lys Asn Pro Gly Leu Tyr Ser Glu Leu Ala Lys Gly Gln Ser Pro
    130                 135                 140
Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His
145                 150                 155                 160
Val Leu Asp Phe Gln Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala
                165                 170                 175
Asn Met Val Pro Pro Tyr Asp Lys Thr Lys Tyr Ala Gly Val Gly Ala
            180                 185                 190
Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Tyr Ile Val Val
        195                 200                 205
Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Phe Pro
    210                 215                 220
Tyr Asp Gly Thr Thr Ser Thr Asp Phe Ile Glu Asp Trp Val Lys Val
225                 230                 235                 240
Cys Tyr Asn Ala Lys Thr Lys Ile Leu Ala Glu His Ala Asn Ser Pro
                245                 250                 255
Phe Pro Asp Met Cys Thr Gln Cys Glu Lys Glu Ala Val Asn Val Ser
            260                 265                 270
Leu Gly His Leu Leu Thr Tyr Pro Phe Val Arg Asp Gly Leu Val Asn
        275                 280                 285
Lys Thr Leu Gly Leu Lys Gly Gly Tyr Tyr Asp Phe Val Lys Gly Ser
    290                 295                 300
Phe Glu Leu Trp Gly Leu Glu Tyr Ser Leu Ser Pro Ser Leu Ser Val
305                 310                 315                 320
<210>142
<211>777
<212>DNA
<213>拟南芥
<400>142
atgtcgacag agtcgtacga agacgccatt aaaagactcg gagagcttct cagtaagaaa    60
tcggatctcg ggaacgtggc agccgcaaag atcaagaagt taacggatga gttagaggaa    120
cttgattcca acaagttaga tgccgtagaa cgaatcaaat ccggatttct ccatttcaag    180
actaataatt atgagaagaa tcctactttg tacaattcac ttgccaagag ccagaccccc    240
aagtttttgg tgtttgcttg tgcggattca cgagttagtc catctcacat cttgaatttc    300
caacttgggg aagccttcat cgttagaaac attgcaaaca tggtgccacc ttatgacaag    360
acaaagcact ctaatgttgg tgcggccctt gaatatccaa ttacagtcct caacgtggag    420
aacattcttg ttattggaca cagctgttgt ggtggaataa agggactcat ggccattgaa    480
gataatacag ctcccactaa gaccgagttc atagaaaact ggatccagat ctgtgcaccg    540
gccaagaaca ggatcaagca ggattgtaaa gacctaagct ttgaagatca gtgcaccaac    600
tgtgagaagg aagccgtgaa cgtgtccttg gggaatcttt tgtcttaccc attcgtgaga    660
gaaagagtgg tgaagaacaa gcttgccata agaggagctc actatgattt cgtaaaagga    720
acgtttgatc tttgggaact tgacttcaag actacccctg cctttgcctt gtcttaa       777
<210>143
<211>258
<212>PRT
<213>拟南芥
<400>143
Met Ser Thr Glu Ser Tyr Glu Asp Ala Ile Lys Arg Leu Gly Glu Leu
1               5                   10                  15
Leu Ser Lys Lys Ser Asp Leu Gly Asn Val Ala Ala Ala Lys Ile Lys
            20                  25                  30
Lys Leu Thr Asp Glu Leu Glu Glu Leu Asp Ser Asn Lys Leu Asp Ala
        35                  40                  45
Val Glu Arg Ile Lys Ser Gly Phe Leu His Phe Lys Thr Asn Asn Tyr
    50                  55                  60
Glu Lys Asn Pro Thr Leu Tyr Asn Ser Leu Ala Lys Ser Gln Thr Pro
65                  70                  75                  80
Lys Phe Leu Val Phe Ala Cys Ala Asp Ser Arg Val Ser Pro Ser His
                85                  90                  95
Ile Leu Asn Phe Gln Leu Gly Glu Ala Phe Ile Val Arg Asn Ile Ala
            100                 105                 110
Asn Met Val Pro Pro Tyr Asp Lys Thr Lys His Ser Asn Val Gly Ala
        115                 120                 125
Ala Leu Glu Tyr Pro Ile Thr Val Leu Asn Val Glu Asn Ile Leu Val
    130                 135                 140
Ile Gly His Ser Cys Cys Gly Gly Ile Lys Gly Leu Met Ala Ile Glu
145                 150                 155                 160
Asp Asn Thr Ala Pro Thr Lys Thr Glu Phe Ile Glu Asn Trp Ile Gln
                165                 170                 175
Ile Cys Ala Pro Ala Lys Asn Arg Ile Lys Gln Asp Cys Lys Asp Leu
            180                 185                 190
Ser Phe Glu Asp Gln Cys Thr Asn Cys Glu Lys Glu Ala Val Asn Val
        195                 200                 205
Ser Leu Gly Asn Leu Leu Ser Tyr Pro Phe Val Arg Glu Arg Val Val
    210                 215                 220
Lys Asn Lys Leu Ala Ile Arg Gly Ala His Tyr Asp Phe Val Lys Gly
225                 230                 235                 240
Thr Phe Asp Leu Trp Glu Leu Asp Phe Lys Thr Thr Pro Ala Phe Ala
                245                 250                 255
Leu Ser
<210>144
<211>960
<212>DNA
<213>菠菜(Spinacia oleracea)
<400>144
atgtctacta ttaacggctg cctcacctct atctctcctt cccgtactca attgaaaaat    60
acctccactt taaggccaac tttcattgct aacagcaggg ttaacccttc ttcttctgtt    120
cctccttccc ttattagaaa ccagcccgtt ttcgccgccc ccgcccctat catcacccct    180
actttgaaag aagatatggc atacgaagaa gccatcgctg cccttaagaa gcttctaagc    240
gagaagggag aacttgaaaa tgaagccgca tcaaaggtgg cacagataac atctgagtta    300
gccgacggtg gcacaccatc cgccagttac ccggttcaga gaattaagga agggtttatc    360
aaattcaaga aggagaaata cgagaaaaat ccagcattgt atggtgagct ttctaagggc    420
caagctccca agtttatggt gtttgcgtgc tcagactccc gtgtgtgtcc ctcgcacgta    480
ctagatttcc agcccggtga ggctttcatg gttcgcaaca tcgccaacat ggtgccagtg    540
tttgacaagg acaaatacgc tggagtcgga gcagccattg aatacgcagt gttgcacctt    600
aaggtggaga acattgtcgt gattggacac agtgcttgtg gtggaatcaa ggggcttatg    660
tctttcccag atgcaggacc aaccacaact gattttattg aggattgggt caaaatctgc    720
ttgcctgcca agcacaaggt gttagccgag catggtaatg caactttcgc tgaacaatgc    780
acccattgtg aaaaggaagc tgtgaatgta tctctcggaa acttgttgac ttacccattt    840
gtaagagatg gtttggtgaa gaagactcta gctttgcagg gtggttacta cgattttgtc    900
aatggatcat tcgagctatg gggactcgaa tacggcctct ctccttccca atctgtatga    960
<210>145
<211>319
<212>PRT
<213>菠菜
<400>145
Met Ser Thr Ile Asn Gly Cys Leu Thr Ser Ile Ser Pro Ser Arg Thr
1               5                   10                  15
Gln Leu Lys Asn Thr Ser Thr Leu Arg Pro Thr Phe Ile Ala Asn Ser
            20                  25                  30
Arg Val Asn Pro Ser Ser Ser Val Pro Pro Ser Leu Ile Arg Asn Gln
        35                  40                  45
Pro Val Phe Ala Ala Pro Ala Pro Ile Ile Thr Pro Thr Leu Lys Glu
    50                  55                  60
Asp Met Ala Tyr Glu Glu Ala Ile Ala Ala Leu Lys Lys Leu Leu Ser
65                  70                  75                  80
Glu Lys Gly Glu Leu Glu Asn Glu Ala Ala Ser Lys Val Ala Gln Ile
                85                  90                  95
Thr Ser Glu Leu Ala Asp Gly Gly Thr Pro Ser Ala Ser Tyr Pro Val
            100                 105                 110
Gln Arg Ile Lys Glu Gly Phe Ile Lys Phe Lys Lys Glu Lys Tyr Glu
        115                 120                 125
Lys Asn Pro Ala Leu Tyr Gly Glu Leu Ser Lys Gly Gln Ala Pro Lys
    130                 135                 140
Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His Val
145                 150                 155                 160
Leu Asp Phe Gln Pro Gly Glu Ala Phe Met Val Arg Asn Ile Ala Asn
                165                 170                 175
Met Val Pro Val Phe Asp Lys Asp Lys Tyr Ala Gly Val Gly Ala Ala
            180                 185                 190
Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Asn Ile Val Val Ile
        195                 200                 205
Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Phe Pro Asp
    210                 215                 220
Ala Gly Pro Thr Thr Thr Asp Phe Ile Glu Asp Trp Val Lys Ile Cys
225                 230                 235                 240
Leu Pro Ala Lys His Lys Val Leu Ala Glu His Gly Asn Ala Thr Phe
                245                 250                 255
Ala Glu Gln Cys Thr His Cys Glu Lys Glu Ala Val Asn Val Ser Leu
            260                 265                 270
Gly Asn Leu Leu Thr Tyr Pro Phe Val Arg Asp Gly Leu Val Lys Lys
        275                 280                 285
Thr Leu Ala Leu Gln Gly Gly Tyr Tyr Asp Phe Val Asn Gly Ser Phe
    290                 295                 300
Glu Leu Trp Gly Leu Glu Tyr Gly Leu Ser Pro Ser Gln Ser Val
305                 310                 315
<210>146
<211>987
<212>DNA
<213>豌豆(Pisum sativum)
<400>146
atgtctacct cttcaataaa cggctttagt ctttcttctt tgtcccctgc caaaacttct    60
accaaaagaa ctacattgag accctttgtt tctgcatctc ttaacacttc ttcttcatct    120
tcttcctcga ctttcccttc tcttattcaa gacaagccgg ttttcgcttc ttcttctcct    180
atcatcaccc cagttttgag agaagaaatg ggaaagggct atgatgaagc tattgaagaa    240
ctccaaaagt tgttgaggga gaagactgaa ctgaaagcca cagctgctga gaaggttgag    300
caaatcacag ctcagctagg aacaacatca tcatctgatg gcattccaaa atctgaagcc    360
tctgaaagga tcaaaactgg tttccttcac ttcaagaaag agaaatatga caagaatcca    420
gctttgtatg gtgaacttgc caaaggccaa agccctccgt ttatggtgtt tgcatgttca    480
gactcaagag tctgcccatc tcatgtgcta gatttccagc caggtgaagc ctttgtggtc    540
agaaatgttg ctaacttggt tccaccatat gaccaggcaa aatatgccgg aactggtgct    600
gcaattgagt acgcagttct gcatctcaag gtttccaaca ttgttgtcat tggacacagt    660
gcttgtggtg gtattaaggg acttttgtcc tttccatttg atggaaccta ctccactgat    720
ttcattgagg agtgggtcaa aattggttta cctgcaaagg cgaaggtgaa agcacaacat    780
ggagatgcac cttttgcaga gctatgcaca cactgtgaga aggaagctgt gaatgcttcc    840
cttggaaacc ttctcaccta cccatttgtg agagagggat tggtgaacaa gacattggca    900
ctcaaaggag gatactatga ctttgtgaaa ggatcctttg agctttgggg acttgaattt    960
ggcctttcgt ccactttctc cgtatga                                        987
<210>147
<211>328
<212>PRT
<213>豌豆
<400>147
Met Ser Thr Ser Ser Ile Asn Gly Phe Ser Leu Ser Ser Leu Ser Pro
1               5                   10                  15
Ala Lys Thr Ser Thr Lys Arg Thr Thr Leu Arg Pro Phe Val Ser Ala
            20                  25                  30
Ser Leu Asn Thr Ser Ser Ser Ser Ser Ser Ser Thr Phe Pro Ser Leu
        35                  40                  45
Ile Gln Asp Lys Pro Val Phe Ala Ser Ser Ser Pro Ile Ile Thr Pro
    50                  55                  60
Val Leu Arg Glu Glu Met Gly Lys Gly Tyr Asp Glu Ala Ile Glu Glu
65                  70                  75                  80
Leu Gln Lys Leu Leu Arg Glu Lys Thr Glu Leu Lys Ala Thr Ala Ala
                85                  90                  95
Glu Lys Val Glu Gln Ile Thr Ala Gln Leu Gly Thr Thr Ser Ser Ser
            100                 105                 1 10
Asp Gly Ile Pro Lys Ser Glu Ala Ser Glu Arg Ile Lys Thr Gly Phe
        115                 120                 125
Leu His Phe Lys Lys Glu Lys Tyr Asp Lys Asn Pro Ala Leu Tyr Gly
    130                 135                 140
Glu Leu Ala Lys Gly Gln Ser Pro Pro Phe Met Val Phe Ala Cys Ser
145                 150                 155                 160
Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln Pro Gly Glu
                165                 170                 175
Ala Phe Val Val Arg Asn Val Ala Asn Leu Val Pro Pro Tyr Asp Gln
            180                 185                 190
Ala Lys Tyr Ala Gly Thr Gly Ala Ala Ile Glu Tyr Ala Val Leu His
        195                 200                 205
Leu Lys Val Ser Asn Ile Val Val Ile Gly His Ser Ala Cys Gly Gly
    210                 215                 220
Ile Lys Gly Leu Leu Ser Phe Pro Phe Asp Gly Thr Tyr Ser Thr Asp
225                 230                 235                 240
Phe Ile Glu Glu Trp Val Lys Ile Gly Leu Pro Ala Lys Ala Lys Val
                245                 250                 255
Lys Ala Gln His Gly Asp Ala Pro Phe Ala Glu Leu Cys Thr His Cys
            260                 265                 270
Glu Lys Glu Ala Val Asn Ala Ser Leu Gly Asn Leu Leu Thr Tyr Pro
        275                 280                 285
Phe Val Arg Glu Gly Leu Val Asn Lys Thr Leu Ala Leu Lys Gly Gly
    290                 295                 300
Tyr Tyr Asp Phe Val Lys Gly Ser Phe Glu Leu Trp Gly Leu Glu Phe
305                 310                 315                 320
Gly Leu Ser Ser Thr Phe Ser Val
                325
<210>148
<211>996
<212>DNA
<213>蒺藜苜蓿
<400>148
atgtctacct cttccataaa cggctttagt ctctcttctt tgtcccctac aaaaacttct   60
attaaaaaag ttacattgag acctattgtt tctgcatctc ttaactcttc ttcttcttcc  120
tcttccactt ctaacttccc ttctcttatt caagacaagc ctgtttttgc ttcatcttct  180
tctcctatca tcaccccagt tttgagagaa gaaatgggaa agggctatga tgaagctatt  240
gaagaactcc aaaaattgtt gagggagaag actgaattga aagccacagc agctgaaaag  300
gttgagcaaa ttacagctca gctaggaaca acagcatcag ctgatggtgt tccaacatct  360
gatcaagcct cagagaggat caaaactggt ttccttcact tcaagaaaga gaaatatgac  420
acaaaaccag ctttgtatgg tgaacttgcc aaaggccaag cccccccgtt tatggtgttt  480
gcatgctcag actcaagagt ctgcccatct catgtgctag acttccagcc aggagaagct  540
tttgtggtca gaaatgttgc taacatggtt ccaccatatg accaggcaaa atatgctgga  600
actggatctg caattgagta tgctgttctg catctcaagg tttccaacat tgtggtcatt  660
ggacacagtg cttgtggtgg tattaagggg cttttgtctt ttccatttga tggagcctac  720
tccactgatt tcattgagga gtgggtcaaa attggtttac ctgcaaaggc aaaggtgaag  780
gcaaagcatg gagatgcacc ttttggagag ctatgcacac actgtgagaa ggaagctgtg  840
aatgtttctc ttggaaacct tctaacctac ccatttgtga gagagggatt ggtgaacaaa  900
acattggcac taaaaggagg atactatgac tttgtgaaag gatcttttga gctttgggga  960
cttgaatttg gcctttcttc aactttctcc gtatga                            996
<210>149
<211>331
<212>PRT
<213>蒺藜苜蓿
<400>149
Met Ser Thr Ser Ser Ile Asn Gly Phe Ser Leu Ser Ser Leu Ser Pro
1               5                   10                  15
Thr Lys Thr Ser Ile Lys Lys Val Thr Leu Arg Pro Ile Val Ser Ala
            20                  25                  30
Ser Leu Asn Ser Ser Ser Ser Ser Ser Ser Thr Ser Asn Phe Pro Ser
        35                  40                  45
Leu Ile Gln Asp Lys Pro Val Phe Ala Ser Ser Ser Ser Pro Ile Ile
    50                  55                  60
Thr Pro Val Leu Arg Glu Glu Met Gly Lys Gly Tyr Asp Glu Ala Ile
65                  70                  75                  80
Glu Glu Leu Gln Lys Leu Leu Arg Glu Lys Thr Glu Leu Lys Ala Thr
                85                  90                  95
Ala Ala Glu Lys Val Glu Gln Ile Thr Ala Gln Leu Gly Thr Thr Ala
            100                 105                 110
Ser Ala Asp Gly Val  ProThr Ser Asp Gln Ala Ser Glu Arg Ile Lys
        115                 120                 125
Thr Gly Phe Leu His Phe Lys Lys Glu Lys Tyr Asp Thr Lys Pro Ala
    130                 135                 140
Leu Tyr Gly Glu Leu Ala Lys Gly Gln Ala Pro Pro Phe Met Val Phe
145                 150                 155                 160
Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln
                165                 170                 175
Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Met Val Pro Pro
            180                 185                 190
Tyr Asp Gln Ala Lys Tyr Ala Gly Thr Gly Ser Ala Ile Glu Tyr Ala
        195                 200                 205
Val Leu His Leu Lys Val Ser Asn Ile Val Val Ile Gly His Ser Ala
    210                 215                 220
Cys Gly Gly Ile Lys Gly Leu Leu Ser Phe Pro Phe Asp Gly Ala Tyr
225                 230                 235                 240
Ser Thr Asp Phe Ile Glu Glu Trp Val Lys Ile Gly Leu Pro Ala Lys
                245                 250                 255
Ala Lys Val Lys Ala Lys His Gly Asp Ala Pro Phe Gly Glu Leu Cys
            260                 265                 270
Thr His Cys Glu Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu
        275                 280                 285
Thr Tyr Pro Phe Val Arg Glu Gly Leu Val Asn Lys Thr Leu Ala Leu
    290                 295                 300
Lys Gly Gly Tyr Tyr Asp Phe Val Lys Gly Ser Phe Glu Leu Trp Gly
305                 310                 315                 320
Leu Glu Phe Gly Leu Ser Ser Thr Phe Ser Val
                325                 330
<210>150
<211>471
<212>DNA
<213>蒺藜苜蓿
<400>150
atggtatttg cttgctctga ctctagagtg agtccctcta ttatcctgaa ctttcaacat   60
ggagaagctt tcatggtccg aaacattgct aacatggtcc ctacatttaa tcaggtggag  120
aacatcttgg ttattggaca tagtcgctgc ggtggaatct caaggcttat gccttccaga  180
ggatggctgc tccataatga ttgggtgaaa attggtttat ctttcaaagt caaggttctg  240
aaagaacatg aatgctgtga tttcaaagaa caatgcaaat tttgtgaaat ggaatcagtg  300
aataattcat tagtgaacct gaagacatat ctatatgttg atagagaagt aaggaacaag  360
aacttagcac tattgggagg ttactatgat tttgtgaatg gagaattcaa gctctggaag  420
tataagaccc atgtcactaa acccattaca atcccctcta aaagaccttg a           471
<210>151
<211>156
<212>PRT
<213>蒺藜苜蓿
<400>151
Met Val Phe Ala Cys Ser Asp Ser Arg Val Ser Pro Ser Ile Ile Leu
1               5                   10                  15
Asn Phe Gln His Gly Glu Ala Phe Met Val Arg Asn Ile Ala Asn Met
            20                  25                  30
Val Pro Thr Phe Asn Gln Val Glu Asn Ile Leu Val Ile Gly His Ser
        35                  40                  45
Arg Cys Gly Gly Ile Ser Arg Leu Met Pro Ser Arg Gly Trp Leu Leu
    50                  55                  60
His Asn Asp Trp Val Lys Ile Gly Leu Ser Phe Lys Val Lys Val Leu
65                  70                  75                  80
Lys Glu His Glu Cys Cys Asp Phe Lys Glu Gln Cys Lys Phe Cys Glu
                85                  90                  95
Met Glu Ser Val Asn Asn Ser Leu Val Asn Leu Lys Thr Tyr Leu Tyr
            100                 105                 110
Val Asp Arg Glu Val Arg Asn Lys Asn Leu Ala Leu Leu Gly Gly Tyr
        115                 120                 125
Tyr Asp Phe Val Asn Gly Glu Phe Lys Leu Trp Lys Tyr Lys Thr His
    130                 135                 140
Val Thr Lys Pro Ile Thr Ile Pro Ser Lys Arg Pro
145                 150                 155
<210>152
<211>828
<212>DNA
<213>拟南芥
<400>152
atggtgaact actcatcaat cagttgcatc ttctttgtgg ctctgtttag tattttcaca     60
attgtttcga tttcgagtgc tgcttcaagt cacggagaag ttgaggacga acgcgagttt    120
aactacaaga agaacgatga gaaggggcca gagagatggg gagaacttaa accggaatgg    180
gaaatgtgtg gaaaaggaga gatgcaatct cccatagatc ttatgaacga gagagttaac    240
attgtttctc atcttggaag gcttaataga gactataatc cttcaaatgc aactcttaag    300
aacagaggcc atgacatcat gttaaaattt gaagatggag caggaactat taagatcaat    360
ggttttgaat atgaacttca acagcttcac tggcactctc cgtctgaaca tactattaat    420
ggaagaaggt ttgcacttga gctgcatatg gttcacgaag gcaggaatag aagaatggct    480
gttgtgactg tgttgtacaa gatcggaaga gcagatactt ttatcagatc gttggagaaa    540
gaattagagg gcattgctga aatggaggag gctgagaaaa atgtaggaat gattgatccc    600
accaaaatta agatcggaag cagaaaatat tacagataca ctggttcact taccactcct    660
ccttgcactc aaaacgttac ttggagcgtc gttagaaagg ttaggaccgt gacaagaaaa    720
caagtgaagc tcctccgcgt ggcagtgcac gatgatgcta attcgaatgc gaggccggtt    780
caaccaacca acaagcgcat agtgcactta tacagaccaa tagtttaa                 828
<210>153
<211>275
<212>PRT
<213>拟南芥
<400>153
Met Val Asn Tyr Ser Ser Ile Ser Cys Ile Phe Phe Val Ala Leu Phe
1               5                   10                  15
Ser Ile Phe Thr Ile Val Ser Ile Ser Ser Ala Ala Ser Ser His Gly
            20                  25                  30
Glu Val Glu Asp Glu Arg Glu Phe Asn Tyr Lys Lys Asn Asp Glu Lys
        35                  40                  45
Gly Pro Glu Arg Trp Gly Glu Leu Lys Pro Glu Trp Glu Met Cys Gly
    50                  55                  60
Lys Gly Glu Met Gln Ser Pro Ile Asp Leu Met Asn Glu Arg Val Asn
65                  70                  75                  80
Ile Val Ser His Leu Gly Arg Leu Asn Arg Asp Tyr Asn Pro Ser Asn
                85                  90                  95
Ala Thr Leu Lys Asn Arg Gly His Asp Ile Met Leu Lys Phe Glu Asp
            100                 105                 110
Gly Ala Gly Thr Ile Lys Ile Asn Gly Phe Glu Tyr Glu Leu Gln Gln
        115                 120                 125
Leu His Trp His Ser Pro Ser Glu His Thr Ile Asn Gly Arg Arg Phe
    130                 1 35                 140
Ala Leu Glu Leu His Met Val His Glu Gly Arg Asn Arg Arg Met Ala
145                 150                 155                 160
Val Val Thr Val Leu Tyr Lys Ile Gly Arg Ala Asp Thr Phe Ile Arg
                165                 170                 175
Ser Leu Glu Lys Glu Leu Glu Gly Ile Ala Glu Met Glu Glu Ala Glu
            180                 185                 190
Lys Asn Val Gly Met Ile Asp Pro Thr Lys Ile Lys Ile Gly Ser Arg
        195                 200                 205
Lys Tyr Tyr Arg Tyr Thr Gly Ser Leu Thr Thr Pro Pro Cys Thr Gln
    210                 215                 220
Asn Val Thr Trp Ser Val Val Arg Lys Val Arg Thr Val Thr Arg Lys
225                 230                 235                 240
Gln Val Lys Leu Leu Arg Val Ala Val His Asp Asp Ala Asn Ser Asn
                245                 250                 255
Ala Arg Pro Val Gln Pro Thr Asn Lys Arg Ile Val His Leu Tyr Arg
            260                 265                 270
Pro Ile Val
        275
<210>154
<211>987
<212>DNA
<213>Flaveria pringlei
<400>154
atgtatgcta cagctgccgc atttgcaccc tccttcacca cctcccgccg caaaccgtca     60
tcgtcgtctt ccaccgtatc cacttgcttt gcaaggctta gcaacagcgc tcagtcgtcg    120
tcgtcgtctg ccactccacc acccagcctc atccgtaatc agcccgtttt tgccgccccg    180
actcccatca tcacccccac tgtgagagga gacatgggaa gtgaatcata tgatgaggca    240
attgctgcac tcaagaagct tttaagtgaa aaggaggagt tggcacctgt ggctgctgcc    300
aaaatcgacg aaatcacggc ccaacttcaa actctcgaca ccaaacctgc atttgacgcg    360
gtcgagagga tcaaaaccgg gtttgccaag ttcaagaccg agaaatacct gacaaatcca    420
gctttgtacg atgaactttc caaaggccag agcccaaaat ttatggtttt tgcatgctct    480
gactctcgag tttgcccgtc acacgtgctg gatttccaac ccggtgaggc gtttgtggtc    540
cgtaacgtag ccaacattgt cccccccttt gataagctta aatacgctgg agtaggatcc    600
gcagtcgagt atgcagttct gcatctcaag gtggagcaga tagtcgtaat tgggcatagt    660
aaatgtggtg ggatcaaggg tctgatgact ttccccgatg agggaccgac cagcaccgac    720
ttcattgagg actgggtcag agttggtctc cctgcaaagt caaaggtgaa agcggagcat    780
ggaagtgcat cacttgatga tcaatgtgta tcctgcgaga aggaggcggt gaatgtgtct    840
cttgcaaacc tgttgactta cccgtttgtg agaaacggat tgatgaacaa aacattggcg    900
ctcaagggtg cacactatga ctttgttaac ggggcctttg agttgtgggg gcttgatttc    960
agcctttcgc ctcctacctc ggcataa                                        987
<210>155
<211>328
<212>PRT
<213>Flaveria pringlei
<400>155
Met Tyr Ala Thr Ala Ala Ala Phe Ala Pro Ser Phe Thr Thr Ser Arg
1               5                   10                  15
Arg Lys Pro Ser Ser Ser Ser Ser Thr Val Ser Thr Cys Phe Ala Arg
            20                  25                  30
Leu Ser Asn Ser Ala Gln Ser Ser Ser Ser Ser Ala Thr Pro Pro Pro
        35                  40                  45
Ser Leu Ile Arg Asn Gln Pro Val Phe Ala Ala Pro Thr Pro Ile Ile
    50                  55                  60
Thr Pro Thr Val Arg Gly Asp Met Gly Ser Glu Ser Tyr Asp Glu Ala
65                  70                  75                  80
Ile Ala Ala Leu Lys Lys Leu Leu Ser Glu Lys Glu Glu Leu Ala Pro
                85                  90                  95
Val Ala Ala Ala Lys Ile Asp Glu Ile Thr Ala Gln Leu Gln Thr Leu
            100                 105                 110
Asp Thr Lys Pro Ala Phe Asp Ala Val Glu Arg Ile Lys Thr Gly Phe
        115                 120                 125
Ala Lys Phe Lys Thr Glu Lys Tyr Leu Thr Asn Pro Ala Leu Tyr Asp
    130                 135                 140
Glu Leu Ser Lys Gly Gln Ser Pro Lys Phe Met Val Phe Ala Cys Ser
145                 150                 155                 160
Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln Pro Gly Glu
                165                 170                 175
Ala Phe Val Val Arg Asn Val Ala Asn Ile Val Pro Pro Phe Asp Lys
            180                 185                 190
Leu Lys Tyr Ala Gly Val Gly Ser Ala Val Glu Tyr Ala Val Leu His
        195                 200                 205
Leu Lys Val Glu Gln Ile Val Val Ile Gly His Ser Lys Cys Gly Gly
    210                 215                 220
Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro Thr Ser Thr Asp
225                 230                 235                 240
Phe Ile Glu Asp Trp Val Arg Val Gly Leu Pro Ala Lys Ser Lys Val
                245                 250                 255
Lys Ala Glu His Gly Ser Ala Ser Leu Asp Asp Gln Cys Val Ser Cys
            260                 265                 270
Glu Lys Glu Ala Val Asn Val Ser Leu Ala Asn Leu Leu Thr Tyr Pro
        275                 280                 285
Phe Val Arg Asn Gly Leu Met Asn Lys Thr Leu Ala Leu Lys Gly Ala
    290                 295                 300
His Tyr Asp Phe Val Asn Gly Ala Phe Glu Leu Trp Gly Leu Asp Phe
305                 310                 315                 320
Ser Leu Ser Pro Pro Thr Ser Ala
                325
<210>156
<211>996
<212>DNA
<213>Flaveria linearis
<400>156
atgtatgcca cagctgccgc attaattgca ccctccttca ccacctctct ccgcaaaccg    60
tcatcgtcgt cttccaccgt atccgctccc ttcgcaaggc taattaccaa caactcgctg    120
gcgtcgtcgt cgttgtctgc cactccacca ccgagcctca tccgtaacca gcccgttttt    180
gccgccccga ctcccatcat cacccccact gtgagaggag acatgggaag tgaatcatat    240
gacgaggcaa ttgctgcact gaagaagctt ttaagtgaaa gggaggattt ggcacctgtg    300
gctgctgcaa aaatcgacga aatcacctcc caacttcaaa cgctcgacac caaacccgca    360
tttgacgcgg tcgagaggat caaaaccggc tttgccaagt tcaagaccga gaaatacttg    420
acaaatccag ctttgtacga tgaactttcc aaaggccaga gcccaaaatt tatggttttt    480
gcatgctctg actctcgagt ttgcccgtca cacgtgctcg atttccaacc tggtgaggcg    540
tttgtggtcc gtaacgtagc caacattgtc cccccctttg ataagcttaa atatgctgga    600
gtaggatccg ctgtcgagta tgcagttttg catctcaagg tggagcagat agttgtaatt    660
gggcatagta aatgtggtgg gatcaagggt ctgatgactt tcccggacga aggaccgaca    720
agcaccgact tcattgagga ctgggtcaga gttggtctcc ctgcaaagtc aaaggtgaaa    780
gcggagcatg gaagtgcatc aattgatgat caatgtgtat cctgcgagaa ggaggcggtg    840
aatgtgtctc ttgcaaacct gttgacttac ccgtttgtga gaaacggatt gataaacaaa    900
acattggcgc tcaagggtgc acactatgac tttgttaacg ggacctttga gttgtggggg    960
cttgatttct gcctttcgcc tcctacctcg gcataa                              996
<210>157
<211>331
<212>PRT
<213>Flaveria linearis
<400>157
Met Tyr Ala Thr Ala Ala Ala Leu Ile Ala Pro Ser Phe Thr Thr Ser
 1              5                   10                  15
Leu Arg Lys Pro Ser Ser Ser Ser Ser Thr Val Ser Ala Pro Phe Ala
            20                  25                  30
Arg Leu Ile Thr Asn Asn Ser Leu Ala Ser Ser Ser Leu Ser Ala Thr
        35                  40                  45
Pro Pro Pro Ser Leu Ile Arg Asn Gln Pro Val Phe Ala Ala Pro Thr
    50                  55                  60
Pro Ile Ile Thr Pro Thr Val Arg Gly Asp Met Gly Ser Glu Ser Tyr
65                 70                  75                  80
Asp Glu Ala Ile Ala Ala Leu Lys Lys Leu Leu Ser Glu Arg Glu Asp
                85                  90                  95
Leu Ala Pro Val Ala Ala Ala Lys Ile Asp Glu Ile Thr Ser Gln Leu
            100                 105                 110
Gln Thr Leu Asp Thr Lys Pro Ala Phe Asp Ala Val Glu Arg Ile Lys
        115                 120                 125
Thr Gly Phe Ala Lys Phe Lys Thr Glu Lys Tyr Leu Thr Asn Pro Ala
    130                 135                 140
Leu Tyr Asp Glu Leu Ser Lys Gly Gln Ser Pro Lys Phe Met Val Phe
145                 150                 155                 160
Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln
                165                 170                 175
Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Ile Val Pro Pro
            180                 185                 190
Phe Asp Lys Leu Lys Tyr Ala Gly Val Gly Ser Ala Val Glu Tyr Ala
        195                 200                 205
Val Leu His Leu Lys Val Glu Gln Ile Val Val Ile Gly His Ser Lys
    210                 215                 220
Cys Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro Thr
225                 230                 235                 240
Ser Thr Asp Phe Ile Glu Asp Trp Val Arg Val Gly Leu Pro Ala Lys
                245                 250                 255
Ser Lys Val Lys Ala Glu His Gly Ser Ala Ser Ile Asp Asp Gln Cys
            260                 265                 270
Val Ser Cys Glu Lys Glu Ala Val Asn Val Ser Leu Ala Asn Leu Leu
        275                 280                 285
Thr Tyr Pro Phe Val Arg Asn Gly Leu Ile Asn Lys Thr Leu Ala Leu
    290                 295                 300
Lys Gly Ala His Tyr Asp Phe Val Asn Gly Thr Phe Glu Leu Trp Gly
305                 310                 315                 320
Leu Asp Phe Cys Leu Ser Pro Pro Thr Ser Ala
                325                 330
<210>158
<211>828
<212>DNA
<213>拟南芥
<400>158
atgggaaccc taggcagagc attttactcg gtcggttttt ggatccgtga gactggtcaa     60
gctcttgatc gcctcggttg tcgccttcaa ggcaaaaatt acttccgaga acaactgtca    120
aggcatcgga cactgatgaa tgtatttgat aaggctccga ttgtggacaa ggaagctttt    180
gtggcaccaa gcgcctcagt tattggggac gttcacattg gaagaggatc gtccatttgg    240
tatggatgcg tattacgagg cgatgtgaac accgtaagtg ttgggtcagg aactaatatt    300
caggacaact cacttgtgca tgtggcaaaa tcaaacttaa gcgggaaggt gcacccaacc    360
ataattggag acaatgtaac cattggtcat agtgctgttt tacatggatg tactgttgag    420
gatgagacct ttattgggat gggtgcgaca cttcttgatg gggtcgttgt tgaaaagcat    480
gggatggttg ctgctggtgc acttgtacga caaaacacca gaattccttc tggagaggta    540
tggggaggaa acccagcaag gttcctcagg aagctcactg atgaggaaat tgcttttatc    600
tctcagtcag caacaaacta ctcaaacctc gcacaggctc acgctgcaga gaatgcaaag    660
ccattaaatg tgattgagtt cgagaaggtt ctacgcaaga agcatgctct aaaggacgag    720
gagtatgact caatgctcgg aatagtgaga gaaactccac cagagcttaa cctccctaac    780
aacatactgc ctgataaaga aaccaagcgt ccttctaatg tgaactga                 828
<210>159
<211>275
<212>PRT
<213>拟南芥
<400>159
Met Gly Thr Leu Gly Arg Ala Phe Tyr Ser Val Gly Phe Trp Ile Arg
1               5                   10                  15
Glu Thr Gly Gln Ala Leu Asp Arg Leu Gly Cys Arg Leu Gln Gly Lys
            20                  25                  30
Asn Tyr Phe Arg Glu Gln Leu Ser Arg His Arg Thr Leu Met Asn Val
        35                  40                  45
Phe Asp Lys Ala Pro Ile Val Asp Lys Asp Ala Phe Val Ala Pro Ser
    50                  55                  60
Ala Ser Val Ile Gly Asp Val His Ile Gly Arg Gly Ser Ser Ile Trp
65                  70                  75                  80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Thr Val Ser Val Gly Ser
                85                  90                  95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn
            100                 105                 110
Leu Ser Gly Lys Val His Pro Thr Ile Ile Gly Asp Asn Val Thr Ile
        115                 120                 125
Gly His Ser Ala Val Leu His Gly Cys Thr Val Glu Asp Glu Thr Phe
    130                 135                 140
Ile Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His
145                 150                 155                 160
Gly Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro
                165                 170                 175
Ser Gly Glu Val Trp Gly Gly Asn Pro Ala Arg Phe Leu Arg Lys Leu
            180                 185                 190
Thr Asp Glu Glu Ile Ala Phe Ile Ser Gln Ser Ala Thr Asn Tyr Ser
        195                 200                 205
Asn Leu Ala Gln Ala His Ala Ala Glu Asn Ala Lys Pro Leu Asn Val
    210                 215                 220
Ile Glu Phe Glu Lys Val Leu Arg Lys Lys His Ala Leu Lys Asp Glu
225                 230                 235                 240
Glu Tyr Asp Ser Met Leu Gly Ile Val Arg Glu Thr Pro Pro Glu Leu
                245                 250                 255
Asn Leu Pro Asn Asn Ile Leu Pro Asp Lys Glu Thr Lys Arg Pro Ser
            260                 265                 270
Asn Leu Asn
        275
<210>160
<211>874
<212>DNA
<213>陆地棉
<400>160
catttcgagc tttgtttcct aatcactcgc ccgctgcgca atcaccgatc aaagctgaag     60
atgggaagcc ttggaaaagc aatatacacc gtcggattct ggattcggga gaccggtcag    120
gctctcgatc gcctaggctg ccgcctacaa ggcaactatt ttttccagga gcaactttct    180
aggcatcgga ctctgatgaa cgtatttgat aaatctcctc tggtggacaa ggatgcattt    240
gtagccccta gcgcatctgt cattggcgat gttcaggtgg gaagaggatc atctatttgg    300
tatggatgtg ttttaagggg ggatgtcaac agcattagtg ttggatctgg aactaatata    360
caagacaact cccttgtgca tgttgcaaag tctaatctaa gtgggaaagt gctaccaact    420
aacattggaa acaatgttac tgtaggtcat agtgctgttt tacatggctg taccgttgag    480
gatgaagcat ttgttggcat gggagccaca cttcttgatg gtgtagttgt ggaaaaacat    540
gctatggttg ctgctggagc ccttgtaaga cagaatacaa ggatccctgc tggagaggtg    600
tggggaggca atcctgctaa attcctgagg aagctaactg aagaagagat agcgtttatt    660
tcccagtcag ccaccaatta taccaacctt gcacaggtac atgctgctga gaatgcaaaa    720
ccctttgatg aaattgaatt tgagaaaatt cttcgcaaga agtttgcgaa gagggatgaa    780
gagtatgact caatgctggg tgttgtccgt gaaactccac cagaactaat tcttccagac    840
aatgtcctac cagataaaga gcaaaagtcc tctc                                874
<210>161
<211>273
<212>PRT
<213>陆地棉
<400>161
Met Gly Ser Leu Gly Lys Ala Ile Tyr Thr Val Gly Phe Trp Ile Arg
1               5                   10                  15
Glu Thr Gly Gln Ala Leu Asp Arg Leu Gly Cys Arg Leu Gln Gly Asn
            20                  25                  30
Tyr Phe Phe Gln Glu Gln Leu Ser Arg His Arg Thr Leu Met Asn Val
        35                  40                  45
Phe Asp Lys Ser Pro Leu Val Asp Lys Asp Ala Phe Val Ala Pro Ser
    50                  55                  60
Ala Ser Val Ile Gly Asp Val Gln Val Gly Arg Gly Ser Ser Ile Trp
65                  70                  75                  80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser Ile Ser Val Gly Ser
                85                  90                  95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn
            100                 105                 110
Leu Ser Gly Lys Val Leu Pro Thr Asn Ile Gly Asn Asn Val Thr Val
        115                 120                 125
Gly His Ser Ala Val Leu His Gly Cys Thr Val Glu Asp Glu Ala Phe
    130                 135                 140
Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His
145                 150                 155                 160
Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro
                165                 170                 175
Ala Gly Glu Val Trp Gly Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu
            180                 185                 190
Thr Glu Glu Glu Ile Ala Phe Ile Ser Gln Ser Ala Thr Asn Tyr Thr
        195                 200                 205
Asn Leu Ala Gln Val His Ala Ala Glu Asn Ala Lys Pro Phe Asp Glu
    210                 215                 220
Ile Glu Phe Glu Lys Val Leu Arg Lys Lys Phe Ala Lys Arg Asp Glu
225                 230                 235                 240
Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Thr Pro Pro Glu Leu
                245                 250                 255
Ile Leu Pro Asp Asn Val Leu Pro Asp Lys Glu Gln Lys Ser Ser Gln
            260                 265                 270
Lys
<210>162
<211>1217
<212>DNA
<213>番茄
<400>162
aggcatgtgg tattcactat tctgccctac caattactct gtggaaagcc ttcatttctc     60
actcaatcgt cccttttgct acacaaacac cttgactgca cagctctact gatcagaaag    120
agggctaaac cgaaagaaga agaaggagga ggtcaaacat gggaaccctc gggaaagcaa    180
tttactccct gggatccatc gttcgagcga ccggcaaagc tcttgatcgc gtcggaaatc    240
gcctacaagg cagctcccac atagaggaac acctgtccag gcatcggact cttatgaacg    300
tattcgataa agctccggtg gtggataagg atgtatttgt agctccaggt gcctcagtca    360
ttggagatgt ccatgtggga cgcaattcat ctatttggta tggatgtgta ctaagaggtg    420
atgttaacag catcagtgtc ggatctggta ccaatataca ggacaactcc cttgttcatg    480
tggccaaatc aaatataagt caaaaggtgc tgcccaccat catagggaac aatgttactg    540
ttggtcatag tgctgttgta catggctgca ccattgagga tgaggccttc attggtatgg    600
gggccacact gcttgatggt gttcatgtag agaaacatgc catggttgct gcaggagccc    660
ttgtgaaaca gaacacaagg attccctccg gagaggtatg ggcaggcaat cccgctaagt    720
ttctgaggaa gctaactgat gaagagatag ccttcattgc tcagtcagca accaactact    780
gtaaccttgc tcgtgtccat gcagctgaga actccaagtc ctttgacgaa attgaatttg    840
aaaagatgct tcgtaagaag tatgccaaac gtgatgagga atatgattct atgattggtg    900
ttgtccgtga aacacctccc gagcttgtac ttcctgataa tatcctcccc gaaaaagctg    960
ctaagagcat cgcccaatga gatcagtgcc caagcaactc tctctttttt tgctttccag   1020
agatttattt tacaccgtga gcatctgtat ggagaacagt catggatatt ggctgttacc   1080
cttccaaata atatcaaact tattggatag catcggtacg tcactgcttt gtagttaaga   1140
cttttgcccc ttatttccca gaaattcttc agcttggaaa aggaagttac gcccgaaaaa   1200
aaaaaaaaaa aaaaaaa                                                  1217
<210>163
<211>273
<212>PRT
<213>番茄
<400>163
Met Gly Thr Leu Gly Lys Ala Ile Tyr Ser Leu Gly Ser Ile Val Arg
1               5                   10                  15
Ala Thr Gly Lys Ala Leu Asp Arg Val Gly Asn Arg Leu Gln Gly Ser
            20                  25                  30
Ser His Ile Glu Glu His Leu Ser Arg His Arg Thr Leu Met Asn Val
        35                  40                  45
Phe Asp Lys Ala Pro Val Val Asp Lys Asp Val Phe Val Ala Pro Gly
    50                  55                  60
Ala Ser Val Ile Gly Asp Val His Val Gly Arg Asn Ser Ser Ile Trp
65                  70                  75                  80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser Ile Ser Val Gly Ser
                85                  90                  95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn
            100                 105                 110
Ile Ser Gln Lys Val Leu Pro Thr Ile Ile Gly Asn Asn Val Thr Val
        115                 120                 125
Gly His Ser Ala Val Val His Gly Cys Thr Ile Glu Asp Glu Ala Phe
    130                 135                 140
Ile Gly Met Gly Ala Thr Leu Leu Asp Gly Val His Val Glu Lys His
145                 150                 155                 160
Ala Met Val Ala Ala Gly Ala Leu Val Lys Gln Asn Thr Arg Ile Pro
                165                 170                 175
Ser Gly Glu Val Trp Ala Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu
            180                 185                 190
Thr Asp Glu Glu Ile Ala Phe Ile Ala Gln Ser Ala Thr Asn Tyr Cys
        195                 200                 205
Asn Leu Ala Arg Val His Ala Ala Glu Asn Ser Lys Ser Phe Asp Glu
    210                 215                 220
Ile Glu Phe Glu Lys Met Leu Arg Lys Lys Tyr Ala Lys Arg Asp Glu
225                 230                 235                 240
Glu Tyr Asp Ser Met Ile Gly Val Val Arg Glu Thr Pro Pro Glu Leu
                245                 250                 255
Val Leu Pro Asp Asn Ile Leu Pro Glu Lys Ala Ala Lys Ser Ile Ala
            260                 265                 270
Gln
<210>164
<211>1962
<212>DNA
<213>玉蜀黍
<400>164
atgtacacat tgcccgtccg tgccaccaca tccagcatcg tgccagcctg ccacccccgc   60
gccgtcctcc tcctccggct ccggccccca ggctcaggct catccggaac gccccgtctt  120
cgccgccccg ccaccgtcgt gggcatggac cccaccgtcg agcgcttgaa gagcgggttc  180
cagaagttca agaccgaggt ctatgacaag aagccggagc tgttcgagcc tctcaagtcc  240
ggccagagcc ccaggtacat ggtgttcgcc tgctccgact cccgcgtgtg cccgtcggtg  300
acactgggac tgcagcccgg cgaggcattc accgtccgca acatcgcttc catggtccca  360
ccctacgaca agatcaagta cgccggcaca gggtccgcca tcgagtacgc cgtgtgcgcg  420
ctcaaggtgc aggtcatcgt ggtcattggc cacagctgct gcggtggcat cagggcgctc  480
ctctccctca aggacggcgc gcccgacaac ttcaccttcg tggaggactg ggtcaggatc  540
ggcagccctg ccaagaacaa ggtgaagaaa gagcacgcgt ccgtgccgtt cgatgaccag  600
tgctccatcc tggagaagga ggccgtgaac gtgtcgctcc agaacctcaa gagctacccc  660
ttcgtcaagg aagggctggc cggcgggacg ctcaagctgg ttggcgccca ctacagcttc  720
gtcaaagggc agttcgtcac atgggagcct ccccaggacg ccatcgagcg cttgacgagc  780
ggcttccagc agttcaaggt caatgtctat gacaagaagc cggagctttt cgggcctctc  840
aagtccggcc aggcccccaa gtacatggtg ttcgcctgct ccgactcccg tgtgtgcccg  900
tcggtgaccc tgggcctgca gcccgcgaag gccttcaccg ttcgcaacat cgccgccatg  960
gtcccaggct acgacaagac caagtacacc ggcatcgggt ccgccatcga gtacgctgtg 1020
tgcgccctca aggtggaggt cctcgtggtc attggccata gctgctgcgg tggcatcagg 1080
gcgctcctct ccctcaagga cggcgcgccc gacaacttcc acttcgtgga ggactgggtc 1140
aggatcggca gccctgccaa gaacaaggtg aagaaagagc acgcgtccgt gccgttcgat 1200
gaccagtgct ccatcctgga gaaggaggcc gtgaacgtgt cgctccagaa cctcaagagc 1260
taccccttgg tcaaggaagg gctggccggc gggacgtcaa gtggttggcc ccactacgac    1320
ttcgttaaag ggcagttcgt cacatgggag cctccccagg acgccatcga gcgcttgacg    1380
agcggcttcc agcagttcaa ggtcaatgtc tatgacaaga agccggagct tttcgggcct    1440
ctcaagtccg gccaggcccc caagtacatg gtgttcgcct gctccgactc ccgtgtgtcc    1500
ccgtcggtga ccctgggcct gcagcccggc gaggccttca ccgttcgcaa catcgccgcc    1560
atggtccccg gctacgacaa gaccaagtac accggcatcg ggtccgccat cgagtacgct    1620
gtgtgcgccc tcaaggtgga ggtcctcgtg gtcattggcc atagctgctg cggtggcatc    1680
agggcgctcc tctcactcca ggacggcgca cctgacacct tccacttcgt cgaggactgg    1740
gttaagatcg ccttcattgc caagatgaag gtaaagaaag agcacgcctc ggtgccgttc    1800
gatgaccagt ggtccattct cgagaaggag gccgtgaacg tgtccctgga gaacctcaag    1860
acctacccct tcgtcaagga agggcttgca aatgggaccc tcaagctgat cggcgcccac    1920
tacgactttg tctcaggaga gttcctcaca tggaaaaagt ga                       1962
<210>165
<211>653
<212>PRT
<213>玉蜀黍
<400>165
Met Tyr Thr Leu Pro Val Arg Ala Thr Thr Ser Ser Ile Val Pro Ala
1               5                   10                  15
Cys His Pro Arg Ala Val Leu Leu Leu Arg Leu Arg Pro Pro Gly Ser
            20                  25                  30
Gly Ser Ser Gly Thr Pro Arg Leu Arg Arg Pro Ala Thr Val Val Gly
        35                  40                  45
Met Asp Pro Thr Val Glu Arg Leu Lys Ser Gly Phe Gln Lys Phe Lys
    50                  55                  60
Thr Glu Val Tyr Asp Lys Lys Pro Glu Leu Phe Glu Pro Leu Lys Ser
65                  70                  75                  80
Gly Gln Ser Pro Arg Tyr Met Val Phe Ala Cys Ser Asp Ser Arg Val
                85                  90                  95
Cys Pro Ser Val Thr Leu Gly Leu Gln Pro Gly Glu Ala Phe Thr Val
            100                 105                 110
Arg Asn Ile Ala Ser Met Val Pro Pro Tyr Asp Lys Ile Lys Tyr Ala
        115                 120                 125
Gly Thr Gly Ser Ala Ile Glu Tyr Ala Val Cys Ala Leu Lys Val Gln
    130                 135                 140
Val Ile Val Val Ile Gly His Ser Cys Cys Gly Gly Ile Arg Ala Leu
145                 150                 155                 160
Leu Ser Leu Lys Asp Gly Ala Pro Asp Asn Phe Thr Phe Val Glu Asp
                165                 170                 175
Trp Val Arg Ile Gly Ser Pro Ala Lys Asn Lys Val Lys Lys Glu His
            180                 185                 190
Ala Ser Val Pro Phe Asp Asp Gln Cys Ser Ile Leu Glu Lys Glu Ala
        195                 200                 205
Val Asn Val Ser Leu Gln Asn Leu Lys Ser Tyr Pro Phe Val Lys Glu
    210                 215                 220
Gly Leu Ala Gly Gly Thr Leu Lys Leu Val Gly Ala His Tyr Ser Phe
225                 230                 235                 240
Val Lys Gly Gln Phe Val Thr Trp Glu Pro Pro Gln Asp Ala Ile Glu
                245                 250                 255
Arg Leu Thr Ser Gly Phe Gln Gln Phe Lys Val Asn Val Tyr Asp Lys
            260                 265                 270
Lys Pro Glu Leu Phe Gly Pro Leu Lys Ser Gly Gln Ala Pro Lys Tyr
        275                 280                 285
Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser Val Thr Leu
    290                 295                 300
Gly Leu Gln Pro Ala Lys Ala Phe Thr Val Arg Asn Ile Ala Ala Met
305                 310                 315                 320
Val Pro Gly Tyr Asp Lys Thr Lys Tyr Thr Gly Ile Gly Ser Ala Ile
                325                 330                 335
Glu Tyr Ala Val Cys Ala Leu Lys Val Glu Val Leu Val Val Ile Gly
            340                 345                 350
His Ser Cys Cys Gly Gly Ile Arg Ala Leu Leu Ser Leu Lys Asp Gly
        355                 360                 365
Ala Pro Asp Asn Phe His Phe Val Glu Asp Trp Val Arg Ile Gly Ser
    370                 375                 380
Pro Ala Lys Asn Lys Val Lys Lys Glu His Ala Ser Val Pro Phe Asp
385                 390                  395                 400
Asp Gln Cys Ser Ile Leu Glu Lys Glu Ala Val Asn Val Ser Leu Gln
                405                 410                 415
Asn Leu Lys Ser Tyr Pro Leu Val Lys Glu Gly Leu Ala Gly Gly Thr
            420                 425                 430
Ser Ser Gly Trp Pro His Tyr Asp Phe Val Lys Gly Gln Phe Val Thr
        435                 440                 445
Trp Glu Pro Pro Gln Asp Ala Ile Glu Arg Leu Thr Ser Gly Phe Gln
    450                 455                 460
Gln Phe Lys Val Asn Val Tyr Asp Lys Lys Pro Glu Leu Phe Gly Pro
465                 470                 475                 480
Leu Lys Ser Gly Gln Ala Pro Lys Tyr Met Val Phe Ala Cys Ser Asp
                485                 490                 495
Ser Arg Val Ser Pro Ser Val Thr Leu Gly Leu Gln Pro Gly Glu Ala
            500                 505                 510
Phe Thr Val Arg Asn Ile Ala Ala Met Val Pro Gly Tyr Asp Lys Thr
        515                 520                 525
Lys Tyr Thr Gly Ile Gly Ser Ala Ile Glu Tyr Ala Val Cys Ala Leu
    530                 535                 540
Lys Val Glu Val Leu Val Val Ile Gly His Ser Cys Cys Gly Gly Ile
545                 550                 555                 560
Arg Ala Leu Leu Ser Leu Gln Asp Gly Ala Pro Asp Thr Phe His Phe
                565                 570                 575
Val Glu Asp Trp Val Lys Ile Ala Phe Ile Ala Lys Met Lys Val Lys
            580                 585                 590
Lys Glu His Ala Ser Val Pro Phe Asp Asp Gln Trp Ser Ile Leu Glu
        595                 600                 605
Lys Glu Ala Val Asn Val Ser Leu Glu Asn Leu Lys Thr Tyr Pro Phe
    610                 615                 620
Val Lys Glu Gly Leu Ala Asn Gly Thr Leu Lys Leu Ile Gly Ala His
625                 630                 635                 640
Tyr Asp Phe Val Ser Gly Glu Phe Leu Thr Trp Lys Lys
                645                 650
<210>166
<211>1920
<212>DNA
<213>玉蜀黍
<400>166
atgtacacat tgcccgtccg tgccaccaca tccagcatcg tcgccagcct cgccaccccc     60
gcgccgtcct cctcctccgg ctccggccgc cccaggctca ggctcatccg gaacgccccc    120
gtcttcgccg cccccgccac cgtctgtaaa cgggacggcg ggcagctgag gagtcaaacg    180
agagagatcg agagagaaag aaagggaggg catccaccag ccggcgggca taagagggga    240
ggagagagag gccagagaag aggaggagaa gaagaagaag atgagcagct gcctctgcct    300
tccgaaaaaa aaggaggggc cagcgaagga gaagccgtcc acagataccc ccacctcgtc    360
actccttcag aaccagaagc cctccaacct ccacctcctc cctccaaggc ttcctccaag    420
ggcatggacc ccaccgtcga gcgcttgaag agcgggttcc agaagttcaa gaccgaggtc    480
tatgacaaga agccggagct gttcgagcct ctcaagtccg gccagagccc caggtacatg    540
gtgttcgcct gctccgactc ccgcgtgtgc ccgtcggtga cactgggact gcagcccggc    600
gaggcattca ccgtccgcaa catcgcttcc atggtcccac cctacgacaa gatcaagtac    660
gccggcacag ggtccgccat cgagtacgcc gtgtgcgcgc tcaaggtgca ggtcatcgtg    720
gtcattggcc acagctgctg cggtggcatc agggcgctcc tctccctcaa ggacggcgcg    780
cccgacaact tcaccttcgt ggaggactgg gtcaggatcg gcagccctgc caagaacaag    840
gtgaagaaag agcacgcgtc cgtgccgttc gatgaccagt gctccatcct ggagaaggag    900
gccgtgaacg tgtcgctcca gaacctcaag agctacccct tcgtcaagga agggctggcc    960
ggcgggacgc tcaagctggt tggcgcccac tcacacttcg tcaaagggca gttcgtcaca   1020
tgggagcctc cccaggacgc catcgagcgc ttgacgagcg gcttccagca gttcaaggtc   1080
aatgtctatg acaagaagcc ggagcttttc gggcctctca agtccggcca ggcccccaag   1140
tacatggtgt tcgcctgctc cgactcccgt gtgtgcccgt cggtgaccct gggcctgcag   1200
ccgggcgagg ccttcaccgt tcgcaacatc gccgccatgg tcccaggcta cgacaagacc   1260
aagtacaccg gcatcgggtc cgccatcgag tacgctgtgt gcgccctcaa ggtggaggtc   1320
ctcgtggtca ttggccatag ctgctgcggt ggcatcaggg cgctcctctc actccaggac   1380
ggcgcagcct acaccttcca cttcgtcgag gactgggtta agatcggctt cattgccaag   1440
atgaaggtaa agaaagagca cgcctcggtg ccgttcgatg accagtgctc cattctcgag  1500
aaggaggccg tgaacgtgtc cctggagaac ctcaagacct accccttcgt caaggaaggg  1560
cttgcaaatg ggaccctcaa gctgatcggc gcccactacg actttgtctc aggagagttc  1620
ctcacatgga aaaagtgaaa aactagggct aaggcaattc taccggcccg ccgactctgc  1680
atcatcataa tatatatact ataactatac tactagctac ctaccgatag tcacccgagc  1740
aatgtgaatg cgtcgagtac tatctgtttt ctgcatctac atatatatac cggatcaaca  1800
atcgcccaat gtgaatgtaa taagcaatat cattttctac cacttttcat tcctaacgct  1860
gaggcttttt atgtactata tcttatatga tgaataataa tatgaccgcc ttgtgatcta  1920
<210>167
<211>545
<212>PRT
<213>玉蜀黍
<400>167
Met Tyr Thr Leu Pro Val Arg Ala Thr Thr Ser Ser Ile Val Ala Ser
1               5                   10                  15
Leu Ala Thr Pro Ala Pro Ser Ser Ser Ser Gly Ser Gly Arg Pro Arg
            20                  25                  30
Leu Arg Leu Ile Arg Asn Ala Pro Val Phe Ala Ala Pro Ala Thr Val
        35                  40                  45
Cys Lys Arg Asp Gly Gly Gln Leu Arg Ser Gln Thr Arg Glu Ile Glu
    50                  55                  60
Arg Glu Arg Lys Gly Gly His Pro Pro Ala Gly Gly His Lys Arg Gly
65                  70                  75                  80
Gly Glu Arg Gly Gln Arg Arg Gly Gly Glu Glu Glu Glu Asp Glu Gln
                85                  90                  95
Leu Pro Leu Pro Ser Glu Lys Lys Gly Gly Ala Ser Glu Gly Glu Ala
            100                 105                 110
Val His Arg Tyr Pro His Leu Val Thr Pro Ser Glu Pro Glu Ala Leu
        115                 120                 125
Gln Pro Pro Pro Pro Pro Ser Lys Ala Ser Ser Lys Gly Met Asp Pro
    130                 135                 140
Thr Val Glu Arg Leu Lys Ser Gly Phe Gln Lys Phe Lys Thr Glu Val
145                 150                 155                 160
Tyr Asp Lys Lys Pro Glu Leu Phe Glu Pro Leu Lys Ser Gly Gln Ser
                165                 170                 175
Pro Arg Tyr Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser
            180                 185                 190
Val Thr Leu Gly Leu Gln Pro Gly Glu Ala Phe Thr Val Arg Asn Ile
        195                 200                 205
Ala Ser Met Val Pro Pro Tyr Asp Lys Ile Lys Tyr Ala Gly Thr Gly
    210                 215                 220
Ser Ala Ile Glu Tyr Ala Val Cys Ala Leu Lys Val Gln Val Ile Val
225                 230                 235                 240
Val Ile Gly His Ser Cys Cys Gly Gly Ile Arg Ala Leu Leu Ser Leu
                245                 250                 255
Lys Asp Gly Ala Pro Asp Asn Phe Thr Phe Val Glu Asp Trp Val Arg
            260                 265                 270
Ile Gly Ser Pro Ala Lys Asn Lys Val Lys Lys Glu His Ala Ser Val
        275                 280                 285
Pro Phe Asp Asp Gln Cys Ser Ile Leu Glu Lys Glu Ala Val Asn Val
    290                 295                 300
Ser Leu Gln Asn Leu Lys Ser Tyr Pro Phe Val Lys Glu Gly Leu Ala
305                 310                 315                 320
Gly Gly Thr Leu Lys Leu Val Gly Ala His Ser His Phe Val Lys Gly
                325                 330                 335
Gln Phe Val Thr Trp Glu Pro Pro Gln Asp Ala Ile Glu Arg Leu Thr
            340                 345                 350
Ser Gly Phe Gln Gln Phe Lys Val Asn Val Tyr Asp Lys Lys Pro Glu
        355                 360                 365
Leu Phe Gly Pro Leu Lys Ser Gly Gln Ala Pro Lys Tyr Met Val Phe
    370                 375                 380
Ala Cys Ser Asp Ser Arg Val Cys Pro Ser Val Thr Leu Gly Leu Gln
385                 390                 395                 400
Pro Gly Glu Ala Phe Thr Val Arg Asn Ile Ala Ala Met Val Pro Gly
                405                 410                 415
Tyr Asp Lys Thr Lys Tyr Thr Gly Ile Gly Ser Ala Ile Glu Tyr Ala
            420                 425                 430
Val Cys Ala Leu Lys Val Glu Val Leu Val Val Ile Gly His Ser Cys
        435                 440                 445
Cys Gly Gly Ile Arg Ala Leu Leu Ser Leu Gln Asp Gly Ala Ala Tyr
    450                 455                 460
Thr Phe His Phe Val Glu Asp Trp Val Lys Ile Gly Phe Ile Ala Lys
465                 470                 475                 480
Met Lys Val Lys Lys Glu His Ala Ser Val Pro Phe Asp Asp Gln Cys
                485                 490                 495
Ser Ile Leu Glu Lys Glu Ala Val Asn Val Ser Leu Glu Asn Leu Lys
            500                 505                 510
Thr Tyr Pro Phe Val Lys Glu Gly Leu Ala Asn Gly Thr Leu Lys Leu
        515                 520                 525
Ile Gly Ala His Tyr Asp Phe Val Ser Gly Glu Phe Leu Thr Trp Lys
    530                 535                 540
Lys
545
<210>168
<211>1208
<212>DNA
<213>类黍尾稃草(Urochloa panicoides)
<400>168
gggcagcccg cactttaatg tcggcattgg ccatccgtgc agccccgtcc agcatcatcg     60
ccagcgtccg cacccccgcg ctctccgccc gccgccgccc caggctcgtc ggcaacgccg    120
ccgccgccaa cgccgtcgtg taaaccggcc ggcgcacggg gagctcgaaa gtcaaacgag    180
agactagaga gaggggggcg agaagtacta gtaggtcgaa gccggctgtg ataaaaagag    240
gagaagatga gcgggtgcct ctgcctcccc ggctacaaaa agaagaccat ggaccccgtc    300
gagcgcttgc agagcgggtt caagcagttc aagagcgagg tctacgacaa gaagccggag    360
ctgttcgagc cactcaagga aggccaggcc cccacgtaca tggtgttcgc ctgctccgac    420
tcccgttgct gcccgtcggt gaccctcggc ctgaagcccg gcgaggcctt caccgtccgc    480
aacatcgccg ccatggtccc accctacgac aagaatcggt acaccggcat cgggtccgcc    540
atcgagtacg ccgtctgcgc cctcaaggtc aaggtcctca ccgtcatcgg ccacagccgc    600
tgcggtggca tcaaggcgct cctctcaatg caggacggcg cagccgacaa cttccacttc    660
gtcgaggact gggtcaggat cggcttcctc gccaagaaga aggttctcac cgaccacccc    720
atggctccct tcgacgacca gtgctccatc ttggagaagg aggccgtcaa cgtctccctg    780
tacaacctcc tgacctaccc ctgggtgaag gaaggtgtgt ccaacggctc cctcaagctg    840
gtcggcggcc actacgactt cgtcaagggc gcgttcgtca catgggagaa ataagccacc    900
cgatttacaa ctcctacacc atcatacata tatacatacg tacatcgtct cccgatatgc    960
accccatccg acgtgaatgg gtggagtgct cactacctat tttcggccgc tacatacggg   1020
atcgtcgtcc ttctatgtga atgtaataag caatagcatc ctctaccgct ttaatttcta   1080
taaggccgag ctttttattt taccatatga tgcataattt gaccgccttg tggtcaaaag   1140
acatcaccaa tatatgtata agccttcttc ataataatat ataatcatca agtgtttacc   1200
tttttatt                                                            1208
<210>169
<211>157
<212>PRT
<213>类黍尾稃草
<400>169
Met Ser Gly Cys Leu Cys Leu Pro Gly Tyr Lys Lys Lys Thr Met Asp
1               5                   10                  15
Pro Val Glu Arg Leu Gln Ser Gly Phe Lys Gln Phe Lys Ser Glu Val
            20                  25                  30
Tyr Asp Lys Lys Pro Glu Leu Phe Glu Pro Leu Lys Glu Gly Gln Ala
        35                  40                  45
Pro Thr Tyr Met Val Phe Ala Cys Ser Asp Ser Arg Cys Cys Pro Ser
    50                  55                  60
Val Thr Leu Gly Leu Lys Pro Gly Glu Ala Phe Thr Val Arg Asn Ile
65                  70                  75                  80
Ala Ala Met Val Pro Pro Tyr Asp Lys Asn Arg Tyr Thr Gly Ile Gly
                85                  90                  95
Ser Ala Ile Glu Tyr Ala Val Cys Ala Leu Lys Val Lys Val Leu Thr
            100                 105                 110
Val Ile Gly His Ser Arg Cys Gly Gly Ile Lys Ala Leu Leu Ser Met
        115                 120                 125
Gln Asp Gly Ala Ala Asp Asn Phe His Phe Val Glu Asp Trp Val Arg
    130                 135                 140
Ile Gly Phe Leu Ala Lys Lys Lys Val Leu Thr Asp His
145                 150                 155
<210>170
<211>1034
<212>DNA
<213>类黍尾稃草
<400>170
ccgcactgga atgtcggcat tggccatccg ctcagccccg tccagcatca tcgccagcgt    60
ccgcaccccc gcgcaccgcc gccccgggct cgtcaggaac gccgccgcca ccaccgccga    120
gttgaccatg gaccccgtcg agcgcttgca gagcggcttc aagcagttca agagcgaggt    180
ctatgacaag aagccggagc tgttcgagcc actcaaggaa ggccaggccc ccacgtacat    240
ggtgttcgcc tgctccgact ctcgttgctg cccgtcggtg accctcggcc tgaagcccgg    300
cgaggccttc accgtccgca acatcgccgc catggtccca ccctacgaca agaaccggta    360
caccggcatc gggtccgcca tcgagtacgc cgtctgcgcc ctcaaggtca aggtcctcac    420
cgtcatcggc cacagccgct gcggtggcat caaggcgctc ctctccatgc aggatggcgc    480
agccgacaac ttccacttcg tcgaggattg ggtcaggatc ggcttcctcg cgaagaagaa    540
ggttctgacc gaccacccca tggctccgtt cgatgaccag tgctccatct tggagaagga    600
ggcagtcaac gtctccctct acaacctcct gacctacccc tgggtgaagg aaggcgtgtc    660
caacgggtcc ctcaagctgg tcggcggcca ctacgacttc gtcaaggggg cgttcgtcac    720
atgggagaaa taagccaccc gatttacagc tcctacacca ccgtacatac atacgtacat    780
cccgatatgt accccatccg acgtgaacgg gtggagtact tactactacc tattttcggc    840
cgctacgtac cgggtcgtcg ttctatgtga atgtaataag caatagcatt ctctaccgct    900
ttaatttcta aggccgagct ttttatttat gtaccgtatg atgcataatt tgacctcctt    960
gtggtcaaaa gacatcagct atatatgtat aagtcttctt cataatataa tcataaagtg   1020
tttacctttt tact                                                     1034
<210>171
<211>240
<212>PRT
<213>类黍尾稃草
<400>171
Met Ser Ala Leu Ala Ile Arg Ser Ala Pro Ser Ser Ile Ile Ala Ser
1               5                   10                  15
Val Arg Thr Pro Ala His Arg Arg Pro Gly Leu Val Arg Asn Ala Ala
            20                  25                  30
Ala Thr Thr Ala Glu Leu Thr Met Asp Pro Val Glu Arg Leu Gln Ser
        35                  40                  45
Gly Phe Lys Gln Phe Lys Ser Glu Val Tyr Asp Lys Lys Pro Glu Leu
    50                  55                  60
Phe Glu Pro Leu Lys Glu Gly Gln Ala Pro Thr Tyr Met Val Phe Ala
65                  70                  75                  80
Cys Ser Asp Ser Arg Cys Cys Pro Ser Val Thr Leu Gly Leu Lys Pro
                85                  90                  95
Gly Glu Ala Phe Thr Val Arg Asn Ile Ala Ala Met Val Pro Pro Tyr
            100                 105                 110
Asp Lys Asn Arg Tyr Thr Gly Ile Gly Ser Ala Ile Glu Tyr Ala Val
        115                 120                 125
Cys Ala Leu Lys Val Lys Val Leu Thr Val Ile Gly His Ser Arg Cys
    130                 135                 140
Gly Gly Ile Lys Ala Leu Leu Ser Met Gln Asp Gly Ala Ala Asp Asn
145                 150                 155                 160
Phe His Phe Val Glu Asp Trp Val Arg Ile Gly Phe Leu Ala Lys Lys
                165                 170                 175
Lys Val Leu Thr Asp His Pro Met Ala Pro Phe Asp Asp Gln Cys Ser
            180                 185                 190
Ile Leu Glu Lys Glu Ala Val Asn Val Ser Leu Tyr Asn Leu Leu Thr
        195                 200                 205
Tyr Pro Trp Val Lys Glu Gly Val Ser Asn Gly Ser Leu Lys Leu Val
    210                 215                 220
Gly Gly His Tyr Asp Phe Val Lys Gly Ala Phe Val Thr Trp Glu Lys
225                 230                 235                 240
<210>172
<211>795
<212>DNA
<213>莱茵衣藻
<400>172
atgggatgcg gtgccagcgt gcctcagaat ggtggaggag ctcccgttac gcgggttatg     60
cccgcgccag cacaaccagt gtctgaggcg caatcggcaa tcagcttcca accatcgcgc    120
agcaaccgca gcagccttga aaagatcaat tcgctcacgg atagggcatc gcctgagcag    180
gtgctgcaga acctgctgga cggcaacatg cgcttcctgg atggcgccgt cgcgcatccc    240
caccaggact tcagccgcgt gcaggccatt aaggccaagc aaaagcccct cgcggccatc    300
ctgggctgcg ccgactctcg cgtgcctgcg gaaattgtgt tcgaccaagg ctttggcgac    360
gtgttcgtgt gccgtgtcgc cggcaacatt gctacgccag aggagatcgc cagtctggag    420
tatgccgtgc ttgacctcgg agttaaggtg gtgatggtcc tcggacacac acgctgcgga    480
gccgtgaagg ctgcactttc aggcaaggcg ttccccggct tcatcgacac gctggtggac    540
cacctggacg tcgccatcag ccgcgtcaac agcatgagcg ccaaggcgca ccaggccatc    600
aaggacggcg acgtggacat gctggaccgc gtggtgaagg agaacgtcaa gtaccaggtg    660
cagcggtgcc agcgctccgt catcatccag gaggggttgc agaaggggaa cctgctgctg    720
gcgggcgccg tgtacgacct ggacacgggc aaggtgcacg tcagcgtcac caagggcggc    780
agcagcgccg agtag                                                     795
<210>173
<211>264
<212>PRT
<213>莱茵衣藻
<400>173
Met Gly Cys Gly Ala Ser Val Pro Gln Asn Gly Gly Gly Ala Pro Val
1               5                   10                  15
Thr Arg Val Met Pro Ala Pro Ala Gln Pro Val Ser Glu Ala Gln Ser
            20                  25                  30
Ala Ile Ser Phe Gln Pro Ser Arg Ser Asn Arg Ser Ser Leu Glu Lys
        35                  40                 45
Ile Asn Ser Leu Thr Asp Arg Ala Ser Pro Glu Gln Val Leu Gln Asn
    50                  55                 60
Leu Leu Asp Gly Asn Met Arg Phe Leu Asp Gly Ala Val Ala His Pro
65                  70                  75                  80
His Gln Asp Phe Ser Arg Val Gln Ala Ile Lys Ala Lys Gln Lys Pro
                85                  90                  95
Leu Ala Ala Ile Leu Gly Cys Ala Asp Ser Arg Val Pro Ala Glu Ile
            100                 105                 110
Val Phe Asp Gln Gly Phe Gly Asp Val Phe Val Cys Arg Val Ala Gly
        115                 120                 125
Asn Ile Ala Thr Pro Glu Glu Ile Ala Ser Leu Glu Tyr Ala Val Leu
    130                 135                 140
Asp Leu Gly Val Lys Val Val Met Val Leu Gly His Thr Arg Cys Gly
145                 150                 155                 160
Ala Val Lys Ala Ala Leu Ser Gly Lys Ala Phe Pro Gly Phe Ile Asp
                165                 170                 175
Thr Leu Val Asp His Leu Asp Val Ala Ile Ser Arg Val Asn Ser Met
            180                 185                 190
Ser Ala Lys Ala His Gln Ala Ile Lys Asp Gly Asp Val Asp Met Leu
        195                 200                 205
Asp Arg Val Val Lys Glu Asn Val Lys Tyr Gln Val Gln Arg Cys Gln
    210                 215                 220
Arg Ser Val Ile Ile Gln Glu Gly Leu Gln Lys Gly Asn Leu Leu Leu
225                 230                 235                 240
Ala Gly Ala Val Tyr Asp Leu Asp Thr Gly Lys Val His Val Ser Val
                245                 250                 255
Thr Lys Gly Gly Ser Ser Ala Glu
            260
<210>174
<211>939
<212>DNA
<213>莱茵衣藻
<400>174
atgtcgctat tcaagtctag cctgcctgcg ggcttcctat tcccctatcg gcaccccaag     60
gccaaggggc ttgttgaggg cacgctttat ggactgggct ccctgtttcg cggcgtgggc    120
gccgcgctgg atgagctggg ctctatggtt cagggccctc agggtagtgt caaggaccac    180
gtccagccta acctggcgtt tgcaccagtg caccgcaagc cggatgtgcc cgttaacgcg    240
ggccaggtgg tgcccgctcc acccgctgct gctcgcacgc tgaaaatcaa ggaggtggtt    300
gtgcccaaca agcacagcac cgcgttcgtg gctgccaacg ccaatgtgct cgggaacgtt    360
aagctggggg cgggctcatc ggtgtggtat ggcgccgtgc tgcgcggtga cgtgaacggc    420
attgaggtgg gcgccaacag caacatccag gacaacgcca tcgtgcacgt gtccaagtac    480
agcatggacg gcacggcacg gcccaccgtc atcggcaaca atgtgaccat tggccacgcc    540
gccacggtgc acgcctgcac cattgaggac aactgcctgg tgggcatggg cgccaccgtg    600
ctcgacggag cgacggtcaa gagcggctcc atcgtggctg ccggcgccgt ggtgccgccc    660
aacaccacca tcccctcggg ccaggtgtgg gccggctcgc ccgccaagtt cctgcgccac    720
ctggagccgg aggaggccag cttcatcggc aagtctgcca gctgctacgc cgagctgtcc    780
gccatccaca agttcgagca gagcaagacg tttgaggagc agtacacgga gagctgcatc    840
atcaaggacc gcgccgctct ggccgacccg tcaaactcag tgcaccagat gtgggagtac    900
gacagccaga cggcgttggt ggcccgcgcc aagaggtag                           939
<210>175
<211>312
<212>PRT
<213>莱茵衣藻
<400>175
Met Ser Leu Phe Lys Ser Ser Leu Pro Ala Gly Phe Leu Phe Pro Tyr
1               5                   10                  15
Arg His Pro Lys Ala Lys Gly Leu Val Glu Gly Thr Leu Tyr Gly Leu
            20                  25                  30
Gly Ser Leu Phe Arg Gly Val Gly Ala Ala Leu Asp Glu Leu Gly Ser
        35                  40                  45
Met Val Gln Gly Pro Gln Gly Ser Val Lys Asp His Val Gln Pro Asn
    50                  55                  60
Leu Ala Phe Ala Pro Val His Arg Lys Pro Asp Val Pro Val Asn Ala
65                  70                  75                  80
Gly Gln Val Val Pro Ala Pro Pro Ala Ala Ala Arg Thr Leu Lys Ile
                85                  90                  95
Lys Glu Val Val Val Pro Asn Lys His Ser Thr Ala Phe Val Ala Ala
            100                 105                 110
Asn Ala Asn Val Leu Gly Asn Val Lys Leu Gly Ala Gly Ser Ser Val
        115                 120                 125
Trp Tyr Gly Ala Val Leu Arg Gly Asp Val Asn Gly Ile Glu Val Gly
    130                 135                 140
Ala Asn Ser Asn Ile Gln Asp Asn Ala Ile Val His Val Ser Lys Tyr
145                 150                 155                 160
Ser Met Asp Gly Thr Ala Arg Pro Thr Val Ile Gly Asn Asn Val Thr
                165                 170                 175
Ile Gly His Ala Ala Thr Val His Ala Cys Thr Ile Glu Asp Asn Cys
            180                 185                 190
Leu Val Gly Met Gly Ala Thr Val Leu Asp Gly Ala Thr Val Lys Ser
        195                 200                 205
Gly Ser Ile Val Ala Ala Gly Ala Val Val Pro Pro Asn Thr Thr Ile
    210                 215                 220
Pro Ser Gly Gln Val Trp Ala Gly Ser Pro Ala Lys Phe Leu Arg His
225                 230                 235                 240
Leu Glu Pro Glu Glu Ala Ser Phe Ile Gly Lys Ser Ala Ser Cys Tyr
                245                 250                 255
Ala Glu Leu Ser Ala Ile His Lys Phe Glu Gln Ser Lys Thr Phe Glu
            260                 265                 270
Glu Gln Tyr Thr Glu Ser Cys Ile Ile Lys Asp Arg Ala Ala Leu Ala
        275                 280                 285
Asp Pro Ser Asn Ser Val His Gln Met Trp Glu Tyr Asp Ser Gln Thr
    290                 295                 300
Ala Leu Val Ala Arg Ala Lys Arg
305                 310
<210>176
<211>1238
<212>DNA
<213>稻
<400>176
ggggctcatc tctctctctc tcactcttct ccctcttctc accaccagac gccatcaaac     60
ccctacctcc cgcggcggcg gcggcggcgg cggccggcgg cgagctccgg acagacagag    120
gagggcgcga gcggagaggg cgaggaggga aggagggagg gaggcgacag gcatggggac    180
cctcgggcgc gcgatctaca cggtggggaa gtggatccgc ggcacggggc aggccatgga    240
ccgcctcgga tccaccatcc agggcggcct ccgcgtcgag gagcagcttt caaggcatcg    300
cacgatcatg aacatatttg agaaagagcc cagagtccac aaggatgttt ttgttgctcc    360
cagtgcagct gtgattggcg atgttgagat cggacatgga tcctcaatct ggtacggctc    420
cattttaaga ggtgatgtca acagcattca tattggatct ggatcaaata tacaagacaa    480
ttcccttgta catgttgcaa aagctaacat cagcgggaag gttctcccaa ccataattgg    540
aaacaatgtt acaataggtc atagtgctgt tctgcacgca tgcaccgtcg aggatgaagc    600
ttttgttggt atgggtgcca ctctgcttga tggagtggtc gttgaaaagc acagcatggt    660
tggtgcagga tcgcttgtta agcagaacac aaggattcct tctggagagg tctgggtcgg    720
taatcctgcc aagttcctaa gaaagcttac tgaagaggag atagcgttca ttgctcagtc    780
agcaacgaac tacatcaatc tggcccaagt ccatgctgcc gagaattcca agaccttcga    840
cgagatcgag ctcgagaaga tgctgaggaa aaagtatgcc cacaaagacg aggagtatga    900
ttcgatgctc ggcgtggtcc gtgagatccc gccggagctc atcctcccgg acaacatcct    960
cccaaacaag gctcagaagg ctgttgctca ctgaatgttt tgtcaagctc ccgcttggga   1020
aaagcttggt ttttttgtta cgtgttttga cctggaacaa catttgacac atgtcttttg   1080
atctcattgt ctgtttttca agcccaataa gaatttgggt cgagcattgt tttaggatcg   1140
accatataca gtacctctct ttgcattaca atgaagagca gttaatttgg gtcacttttt   1200
acatctttac tgaagtagaa acgcgtcctc tgtctgtg                           1238
<210>177
<211>273
<212>PRT
<213>稻
<400>177
Met Gly Thr Leu Gly Arg Ala Ile Tyr Thr Val Gly Lys Trp Ile Arg
1               5                   10                  15
Gly Thr Gly Gln Ala Met Asp Arg Leu Gly Ser Thr Ile Gln Gly Gly
            20                  25                  30
Leu Arg Val Asp Glu Gln Leu Ser Arg His Arg Thr Ile Met Asn Ile
        35                  40                  45
Phe Glu Lys Glu Pro Arg Val His Lys Asp Val Phe Val Ala Pro Ser
    50                  55                  60
Ala Ala Val Ile Gly Asp Ile Glu Ile Gly His Gly Ser Ser Ile Trp
65                  70                  75                  80
Tyr Gly Ser Ile Leu Arg Gly Asp Val Asn Ser Ile His Ile Gly Val
                85                  90                  95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ser Lys Ala Asn
            100                 105                 110
Ile Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Asn Asn Val Thr Ile
        115                 120                 125
Gly His Ser Ala Val Leu His Ala Cys Ile Val Glu Asp Glu Ala Phe
    130                 135                 140
Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His
145                 150                 155                 160
Ser Met Val Gly Ala Gly Ser Leu Val Lys Gln Asn Thr Arg Ile Pro
                165                 170                 175
Ser Gly Glu Val Trp Val Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu
            180                 185                 190
Thr Glu Glu Glu Ile Ala Phe Ile Ala Gln Ser Ala Thr Asn Tyr Ile
        195                 200                 205
Asn Leu Ala Gln Val His Ala Ala Glu Asn Ser Lys Thr Phe Asp Glu
    210                 215                 220
Ile Glu Leu Glu Lys Met Leu Arg Lys Lys Tyr Ala His Lys Asp Glu
225                 230                 235                 240
Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Ile Pro Pro Glu Leu
                245                 250                 255
Ile Leu Pro Asp Asn Ile Leu Pro Asn Lys Ala Gln Lys Ala Val Ala
            260                 265                 270
His
<210>178
<211>657
<212>DNA
<213>稻
<400>178
atgggttcga ctcgcctcct cgtactgctc gccgccgctt ccctcctcct cgccaccgcc     60
gtcccggcag ccagagcaca ggaagaaact gatcacgagg aggagttcac gtacatcagc    120
ggggacgaga aggggccgga gcactggggc aagctgaagc cggagtgggc gcagtgcggc    180
gccggcgaga tgcagtcgcc gatcgacctc tcccacgagc gggtcaagct ggtgcgcgac    240
ctcggctacc tcgacgactc ctaccgcgcc gccgaggcct ccatcgtcaa ccgcggccac    300
gacatcatgg tcaggttcga cggcgacgcc ggcagcgtcg tcatcaacgg caccgcctac    360
tacctccgcc agctccactg gcactccccc accgagcaca gcgtcgacgg ccgcaggtac    420
gacatggagc tgcacatggt ccacgagagc gccgagaaga aggccgccgt gatcggcctc    480
ctctacgagg tcggccgccc cgaccgcttc ctccaaaaga tggagccata tctcaagatg    540
attgcggaca aggaggacag ggccgccttg cacgcagggg gtggtctgga cgattgtcaa    600
gagggttcgc accgtgtcga ggtatcagct cgaccttctc agggaagctg tgcatga       657
<210>179
<211>275
<212>PRT
<213>稻
<400>179
Met Gly Ser Thr Arg Leu Leu Val Leu Leu Ala Ala Ala Ser Leu Leu
1               5                   10                  15
Leu Ala Thr Ala Val Pro Ala Ala Arg Ala Gln Glu Glu Thr Asp His
            20                  25                  30
Glu Lys Glu Phe Thr Tyr Ile Ser Gly Asp Glu Lys Gly Pro Glu His
        35                  40                  45
Trp Gly Lys Leu Lys Pro Glu Trp Ala Gln Cys Gly Ala Gly Glu Met
    50                  55                  60
Gln Ser Pro Ile Asp Leu Ser His Glu Arg Val Lys Leu Val Arg Asp
65                  70                  75                  80
Leu Gly Tyr Leu Asp Asp Ser Tyr Arg Ala Ala Glu Ala Ser Ile Val
                85                  90                  95
Asn Arg Gly His Asp Ile Met Val Arg Phe Asp Gly Asp Ala Gly Ser
            100                 105                 110
Val Val Ile Asn Gly Thr Ala Tyr Tyr Leu Arg Gln Leu His Trp His
        115                 120                 125
Ser Pro Thr Glu His Ser Val Asp Gly Arg Arg Tyr Asp Met Glu Leu
    130                 135                 140
His Met Val His Glu Ser Ala Glu Lys Lys Ala Ala Val Ile Gly Leu
145                 150                 155                 160
Leu Tyr Glu Val Gly Arg Pro Asp Arg Phe Leu Gln Lys Met Glu Pro
                165                 170                 175
Tyr Leu Lys Met Ile Ala Asp Lys Glu Asp Arg Glu Glu Lys Val Gly
            180                 185                 190
Met Ile Asp Pro Arg Gly Ala Arg Gly Arg Ala Ser Val Tyr Tyr Arg
        195                 200                 205
Tyr Met Gly Ser Leu Thr Thr Pro Pro Cys Thr Gln Gly Val Val Trp
    210                 215                 220
Thr Ile Val Lys Arg Val Arg Thr Val Ser Arg Tyr Gln Leu Asp Leu
225                 230                 235                 240
Leu Arg Glu Ala Val His Asp Glu Met Glu Asn Asn Ala Arg Pro Leu
                245                 250                 255
Gln Ala Val Asn Asn Arg Asp Ile Ser Ile Phe Arg Pro Tyr Pro His
            260                 265                 270
Lys Arg Tyr
        275
<210>180
<211>822
<212> DNA
<213>黄薯蓣(Dioscorea cayenensis)
<400>180
atgagttcat ccacccttct ccatctcctc ctcctctcct ccctcctctt ctcttgcctt     60
ccaaatgcaa aacctcagca agctgaggat gagtttagct acattgaagg aagtcctaat    120
ggtcctgaaa actggggaaa tcttaaaaag gagtgggaga cttgtggcaa aggcatggag    180
cagtcaccca ttcaattgcg tgataacaga gtgatattcg atcaaacttt gggggagctg    240
agaagaaatt atagagccgc tgaagcaaca ttaaggaaca gtggacatga tgtattggtg    300
gaatttgagg gtaatgctgg ttcactatcc atcaatcgag ttgcatacca actcaagcga    360
attcattttc actccccttc agagcatgaa atgaatggcg aaaggtttga ccttgaggca    420
cagctggtcc atgagagcca agaccaaaag agagcagtgg tttctattct tttcagattt    480
ggacgtgctg atacattcct ctcagatctt gaagacttta tcaagcagtt tagcagtagc    540
cagaagaatg aaataaatgc aggagttgtg gatccaaatc aattacagtt tgatgactgt    600
gcatatttta gatacatggg ctcattcaca gctccacctt gcactgaagg tatttcatgg    660
accgtcatga ggaaggttgc aactgtttca ccaaggcaag tacttctgtt gaagcaggca    720
gtgaatgaaa atgctataaa caatgcgaga ccacttcaac caaccaatta ccgctccgtt    780
ttttactttg aacagctgaa atcgaagctt ggtgtcatat aa                       822
<210>181
<211>273
<212>PRT
<213>黄薯蓣
<400>181
Met Ser Ser Ser Thr Leu Leu His Leu Leu Leu Leu Ser Ser Leu Leu
1               5                   10                  15
Phe Ser Cys Leu Pro Asn Ala Lys Pro Gln Gln Ala Glu Asp Glu Phe
            20                  25                  30
Ser Tyr Ile Glu Gly Ser Pro Asn Gly Pro Glu Asn Trp Gly Asn Leu
        35                  40                  45
Lys Lys Glu Trp Glu Thr Cys Gly Lys Gly Met Glu Gln Ser Pro Ile
    50                  55                  60
Gln Leu Arg Asp Asn Arg Val Ile Phe Asp Gln Thr Leu Gly Glu Leu
65                  70                  75                  80
Arg Arg Asn Tyr Arg Ala Ala Glu Ala Thr Leu Arg Asn Ser Gly His
                85                  90                  95
Asp Val Leu Val Glu Phe Glu Gly Asn Ala Gly Ser Leu Ser Ile Asn
            100                 105                 110
Arg Val Ala Tyr Gln Leu Lys Arg Ile His Phe His Ser Pro Ser Glu
        115                 120                 125
His Glu Met Asn Gly Glu Arg Phe Asp Leu Glu Ala Gln Leu Val His
    130                 135                 140
Glu Ser Gln Asp Gln Lys Arg Ala Val Val Ser Ile Leu Phe Arg Phe
145                 150                 155                 160
Gly Arg Ala Asp Thr Phe Leu Ser Asp Leu Glu Asp Phe Ile Lys Gln
                165                 170                 175
Phe Ser Ser Ser Gln Lys Asn Glu Ile Asn Ala Gly Val Val Asp Pro
            180                 185                 190
Asn Gln Leu Gln Phe Asp Asp Cys Ala Tyr Phe Arg Tyr Met Gly Ser
        195                 200                 205
Phe Thr Ala Pro Pro Cys Thr Glu Gly Ile Ser Trp Thr Val Met Arg
    210                 215                 220
Lys Val Ala Thr Val Ser Pro Arg Gln Val Leu Leu Leu Lys Gln Ala
225                 230                 235                 240
Val Asn Glu Asn Ala Ile Asn Asn Ala Arg Pro Leu Gln Pro Thr Asn
                245                 250                 255
Tyr Arg Ser Val Phe Tyr Phe Glu Gln Leu Lys Ser Lys Leu Gly Val
            260                 265                 270
Ile
<210>182
<211>807
<212>DNA
<213>薯蓣(Dioscorea batatas)
<400>182
atgagttcat ccacccttct ccatctcctc ctcctctcct ccctcctctt ctcttgcctt     60
gcaaatgtag aggatgagtt tagctacatt gaaggaaatc ctaatggtcc tgaaaactgg    120
ggaaatctta aaccggagtg ggagacttgt ggcaaaggca tggagcagtc acccattcag    180
ttgcgtgata acagagtgat attcgatcaa actttgggga ggttgagaag aaattacaga    240
gccgttgatg caagattaag gaacagtgga catgatgtat tggtggaatt taagggtaat    300
gctggttcac tatcaatcaa tcgagttgca taccaactca agcgaattca ttttcactcc    360
ccttcagagc atgaaatgaa tggcgaaagg tttgaccttg aggcacagct ggttcatgag    420
agccaagatc aaaagagagc agtggtttct attcttttca tatttggacg tgctgaccca    480
ttcctctcag atcttgaaga ctttatcaag cagtttagca gtagccagaa gaatgaaata    540
aatgcaggag ttgtggatcc aaatcaatta cagattgatg actctgcata ttatagatac    600
atgggctcat tcacagctcc accttgcact gaaggtattt catggaccgt catgaggaag    660
gttgcaactg tttcaccaag acaagtactg ctgttgaagc aggcagtgaa tgaaaatgct    720
ataaacaatg caagaccact tcaaccaacc aatttccgct ccgtttttta ctttgaacag    780
ctgaaatcga aggtttgtgc catataa                                        807
<210>183
<211>268
<212>PRT
<213>薯蓣
<400>183
Met Ser Ser Ser Thr Leu Leu His Leu Leu Leu Leu Ser Ser Leu Leu
1               5                   10                  15
Phe Ser Cys Leu Ala Asn Val Glu Asp Glu Phe Ser Tyr Ile Glu Gly
            20                  25                  30
Asn Pro Asn Gly Pro Glu Asn Trp Gly Asn Leu Lys Pro Glu Trp Glu
        35                  40                  45
Thr Cys Gly Lys Gly Met Glu Gln Ser Pro Ile Gln Leu Arg Asp Asn
    50                  55                  60
Arg Val Ile Phe Asp Gln Thr Leu Gly Arg Leu Arg Arg Asn Tyr Arg
65                  70                  75                  80
Ala Val Asp Ala Arg Leu Arg Asn Ser Gly His Asp ValLeu Val Glu
                85                  90                  95
Phe Lys Gly Asn Ala Gly Ser Leu Ser Ile Asn Arg Val Ala Tyr Gln
            100                 105                 110
Leu Lys Arg Ile His Phe His Ser Pro Ser Glu His Glu Met Asn Gly
        115                 120                 125
Glu Arg Phe Asp Leu Glu Ala Gln Leu Val His Glu Ser Gln Asp Gln
    130                 135                 140
Lys Arg Ala Val Val Ser Ile Leu Phe Ile Phe Gly Arg Ala Asp Pro
145                 150                 155                 160
Phe Leu Ser Asp Leu Glu Asp Phe Ile Lys Gln Phe Ser Ser Ser Gln
                165                 170                 175
Lys Asn Glu Ile Asn Ala Gly Val Val Asp Pro Asn Gln Leu Gln Ile
            180                 185                 190
Asp Asp Ser Ala Tyr Tyr Arg Tyr Met Gly Ser Phe Thr Ala Pro Pro
        195                 200                 205
Cys Thr Glu Gly Ile Ser Trp Thr Val Met Arg Lys Val Ala Thr Val
    210                 215                 220
Ser Pro Arg Gln Val Leu Leu Leu Lys Gln Ala Val Asn Glu Asn Ala
225                 230                 235                 240
Ile Asn Asn Ala Arg Pro Leu Gln Pro Thr Asn Phe Arg Ser Val Phe
                245                 250                 255
Tyr Phe Glu Gln Leu Lys Ser Lys Val Cys Ala Ile
            260                 265
<210>184
<211>822
<212>DNA
<213>参薯(Dioscorea alata)
<400>184
atgagttcat ccaccctttt ccatctcttc ctcctctcct ccctcctctt ctcttgcttt   60
tcaaatgcaa ggcttgatgg cgatgatgac tttagctaca ttgaaggaag tcctaatggt  120
cctgaaaact ggggaaatct tagaccggag tggaagactt gtggctatgg catggagcag  180
tcacccatta atttgtgtga tgatagagtg atacggactc caactttggg gaagctgaga  240
acaagttatc aggctgctcg tgcaacagtg aagaacaatg gacatgatat aatggtgtac  300
tttaaaagtg atgctggtac acaattcatc aatcaagtag agtaccaact caaacgaatt  360
cattttcact ccccatcaga acatgcactc agtggtgaaa ggtatgacct tgaggttcag  420
atggtccatg agagccaaga tcaaaggaga gcagtaattg ctattatgtt cagatttgga  480
cgttctgacc cattcctccc agaccttgaa gactttatca gccagataag cagacgtgag  540
accaatgaag tagatgcagg agttgtggat ccaaggcaat tattacagtt tgatgaccct  600
gcatattata gatacatggg ctcatacaca gctccacctt gcactgaaga tattacatgg  660
accgttatta agaagcttgg aactgtttca ccaaagcaag tactgatgtt gaagcaagca  720
gtgaatgaaa attctatgaa caatgcaagg ccacttcaac cactgaaatt tcgcaccgtt  780
tt tttctat cgcgtcagaa atctgatcat gttgccatat aa                     822
<210>185
<211>273
<212>PRT
<213>参薯
<400>185
Met Ser Ser Ser Thr Leu Phe His Leu Phe Leu Leu Ser Ser Leu Leu
1               5                   10                  15
Phe Ser Cys Phe Ser Asn Ala Arg Leu Asp Gly Asp Asp Asp Phe Ser
            20                  25                  30
Tyr Ile Glu Gly Ser Pro Asn Gly Pro Glu Asn Trp Gly Asn Leu Arg
        35                  40                  45
Pro Glu Trp Lys Thr Cys Gly Tyr Gly Met Glu Gln Ser Pro Ile Asn
    50                  55                  60
Leu Cys Asp Asp Arg Val Ile Arg Thr Pro Thr Leu Gly Lys Leu Arg
65                  70                  75                  80
Thr Ser Tyr Gln Ala Ala Arg Ala Thr Val Lys Asn Asn Gly His Asp
                85                  90                  95
Ile Met Val Tyr Phe Lys Ser Asp Ala Gly Thr Gln Phe Ile Asn Gln
            100                 105                 110
Val Glu Tyr Gln Leu Lys Arg Ile His Phe His Ser Pro Ser Glu His
        115                 120                 125
Ala Leu Ser Gly Glu Arg Tyr Asp Leu Glu Val Gln Met Val His Glu
    130                 135                 140
Ser Gln Asp Gln Arg Arg Ala Val Ile Ala Ile Met Phe Arg Phe Gly
145                 150                 155                 160
Arg Ser Asp Pro Phe Leu Pro Asp Leu Glu Asp Phe Ile Ser Gln Ile
                165                 170                 175
Ser Arg Arg Glu Thr Asn Glu Val Asp Ala Gly Val Val Asp Pro Arg
            180                 185                 190
Gln Leu Leu Gln Phe Asp Asp Pro Ala Tyr Tyr Arg Tyr Met Gly Ser
        195                 200                 205
Tyr Thr Ala Pro Pro Cys Thr Glu Asp Ile Thr Trp Thr Val Ile Lys
    210                 215                 220
Lys Leu Gly Thr Val Ser Pro Lys Gln Val Leu Met Leu Lys Gln Ala
225                 230                 235                 240
Val Asn Glu Asn Ser Met Asn Asn Ala Arg Pro Leu Gln Pro Leu Lys
                245                 250                 255
Phe Arg Thr Val Phe Phe Tyr Pro Arg Gln Lys Ser Asp His Val Ala
            260                 265                 270
Ile
<210>186
<211>831
<212>DNA
<213>稻
<400>186
atgagtactt cagctcgccg cctcctcctc ctcgccggcg ccgctgccgc catcgcactc     60
ctgctctcgg ccactgcccc ggtggccgga gccgaggacg acggctacag ctacatccct    120
ggctcaccca gggggccgca gaactggggc agcctgaagc cggaatgggc cacctgcagc    180
agcggcaaga tgcagtcgcc gatcaacctc ggcctcctcg acctcacctt ggctcccggc    240
ctcggcaacc tcaactacac ctaccagaac gccaacgcct ccgtcgtcaa ccgtggccac    300
gacatcatgg tcaggtttga cggcgacgcc ggtagcctaa agataaatgg cacggcgtac    360
cagctccggc agatgcactg gcacacgccg tcggagcaca ccatcgatgg ccggaggtac    420
gacatggagc tgcacatggt gcacctcaac gcccagaacc aggccgccgt cattggcatc    480
ctctacacca tcggcacccg ggacgagttt ctgcaaaagc tagagcctta tataattgag    540
atatcaaagc aagaaggcaa agagagagtg atcattggtg gggcggatcc aaatgtagcc    600
aagggacagg ataccgtgta ctaccgctac atgggctcct ttaccacacc accttgcact    660
gagggagtca tctggaccgt tgtcaggaag gtgcgcaccg tgtcactgtc ccaaatcaca    720
cttctcaagg cagctgtgct cacgggtaac gagaacaacg cgagacccct tcagggcgtg    780
aacaacaggg agattgacct gttccttcct ctccctctca tcaacaactg a             831
<210>187
<211>276
<212>PRT
<213>稻
<400>187
Met Ser Thr Ser Ala Arg Arg Leu Leu Leu Leu Ala Gly Ala Ala Ala
1               5                   10                  15
Ala Ile Ala Leu Leu Leu Ser Ala Thr Ala Pro Val Ala Gly Ala Glu
            20                  25                  30
Asp Asp Gly Tyr Ser Tyr Ile Pro Gly Ser Pro Arg Gly Pro Gln Asn
        35                  40                  45
Trp Gly Ser Leu Lys Pro Glu Trp Ala Thr Cys Ser Ser Gly Lys Met
    50                  55                  60
Gln Ser Pro Ile Asn Leu Gly Leu Leu Asp Leu Thr Leu Ala Pro Gly
65                  70                  75                  80
Leu Gly Asn Leu Asn TyrThr Tyr Gln Asn Ala Asn Ala Ser Val Val
                85                  90                  95
Asn Arg Gly His Asp Ile Met Val Arg Phe Asp Gly Asp Ala Gly Ser
            100                 105                 110
Leu Lys Ile Asn Gly Thr Ala Tyr Gln Leu Arg Gln Met His Trp His
        115                 120                 125
Thr Pro Ser Glu His Thr Ile Asp Gly Arg Arg Tyr Asp Met Glu Leu
    130                 135                 140
His Met Val His Leu Asn Ala Gln Asn Gln Ala Ala Val Ile Gly Ile
145                 150                 155                 160
Leu Tyr Thr Ile Gly Thr Arg Asp Glu Phe Leu Gln Lys Leu Glu Pro
                165                 170                 175
Tyr Ile Ile Glu Ile Ser Lys Gln Glu Gly Lys Glu Arg Val Ile Ile
            180                 185                 190
Gly Gly Ala Asp Pro Asn Val Ala Lys Gly Gln Asp Thr Val Tyr Tyr
        195                 200                 205
Arg Tyr Met Gly Ser Phe Thr Thr Pro Pro Cys Thr Glu Gly Val Ile
    210                 215                 220
Trp Thr Val Val Arg Lys Val Arg Thr Val Ser Leu Ser Gln Ile Thr
225                 230                 235                 240
Leu Leu Lys Ala Ala Val Leu Thr Gly Asn Glu Asn Asn Ala Arg Pro
                245                 250                 255
Leu Gln Gly Val Asn Asn Arg Glu Ile Asp Leu Phe Leu Pro Leu Pro
            260                 265                 270
Leu Ile Asn Asn
        275
<210>188
<211>846
<212>DNA
<213>稻
<400>188
atggtgtctc tccgcgcggc catcgtcctc gtcgtcgccg cctcgtcggt cgccgtcgcc     60
ttctctcatg cggaagggaa cgaggggccg gacttcacct acatcgaagg cgccatggac    120
gggccgtcga actgggggaa gctgagcccg gagtacagga tgtgcggcga ggggaggtcg    180
cagtcgccga tcgacatcaa caccaagacc gtcgtcccgc gctcggacct cgacacgctg    240
gaccgcaact acaacgccgt gaacgccacc atcgtcaaca acggcaagga catcaccatg    300
aagttccacg gcgaggtcgg ccaggtgatc atcgccggga agccgtacag gttccaggcg    360
atccactggc acgcgccgtc ggagcacacc atcaacggca ggcgcttccc gctcgagctc    420
cacctcgtcc acaagtccga cgccgacggc ggcctcgccg tcatctccgt cctctacaag    480
ctcggcgccc cggactcctt ctacctccag ttcaaggacc acctcgccga gctcggcgcc    540
gacgagtgcg acttcagcaa ggaggaggcc cacgtcgccg ccgggctggt gcagatgagg    600
tcgctgcaga agcgcacggg gagctacttc cggtacggcg gctcgctgac gacgccgccg    660
tgcggcgaga acgtggtgtg gagcgtgctc gggaaggtga gggagatcag ccaggagcag    720
ctgcacctgc tcatgtcgcc attgccgacc aaggacgcca ggccggcgca gccgctcaat    780
ggcagggccg tcttctacta caacccgccg ggcagcgccg tctccttcca ggaattcgcc    840
aagtga                                                               846
<210>189
<211>281
<212>PRT
<213>稻
<400>189
Met Val Ser Leu Arg Ala Ala Ile Val Leu Val Val Ala Ala Ser Ser
1               5                   10                  15
Val Ala Val Ala Phe Ser His Ala Glu Gly Asn Glu Gly Pro Asp Phe
            20                  25                  30
Thr Tyr Ile Glu Gly Ala Met Asp Gly Pro Ser Asn Trp Gly Lys Leu
        35                  40                  45
Ser Pro Glu Tyr Arg Met Cys Gly Glu Gly Arg Ser Gln Ser Pro Ile
    50                  55                  60
Asp Ile Asn Thr Lys Thr Val Val Pro Arg Ser Asp Leu Asp Thr Leu
65                  70                  75                  80
Asp Arg Asn Tyr Asn Ala Val Asn Ala Thr Ile Val Asn Asn Gly Lys
                85                  90                  95
Asp Ile Thr Met Lys Phe His Gly Glu Val Gly Gln Val Ile Ile Ala
            100                 105                 110
Gly Lys Pro Tyr Arg Phe Gln Ala Ile His Trp His Ala Pro Ser Glu
        115                 120                 125
His Thr Ile Asn Gly Arg Arg Phe Pro Leu Glu Leu His Leu Val His
    130                 135                 140
Lys Ser Asp Ala Asp Gly Gly Leu Ala Val Ile Ser Val Leu Tyr Lys
145                 150                 155                 160
Leu Gly Ala Pro Asp Ser Phe Tyr Leu Gln Phe Lys Asp His Leu Ala
                165                 170                 175
Glu Leu Gly Ala Asp Glu Cys Asp Phe Ser Lys Glu Glu Ala His Val
            180                 185                 190
Ala Ala Gly Leu Val Gln Met Arg Ser Leu Gln Lys Arg Thr Gly Ser
        195                 200                 205
Tyr Phe Arg Tyr Gly Gly Ser Leu Thr Thr Pro Pro Cys Gly Glu Asn
    210                 215                 220
Val Val Trp Ser Val Leu Gly Lys Val Arg Glu Ile Ser Gln Glu Gln
225                 230                 235                 240
Leu His Leu Leu Met Ser Pro Leu Pro Thr Lys Asp Ala Arg Pro Ala
                245                 250                 255
Gln Pro Leu Asn Gly Arg Ala Val Phe Tyr Tyr Asn Pro Pro Gly Ser
            260                 265                 270
Ala Val Ser Phe Gln Glu Phe Ala Lys
        275                 280
<210>190
<211>804
<212>DNA
<213>拟南芥
<400>190
atggatacca acgcaaaaac aattttcttc atggctatgt gtttcatcta tctatctttc     60
cctaatattt cacacgctca ttctgaagtc gacgacgaaa ctccatttac ttacgaacaa    120
aaaacggaaa agggaccaga gggatggggc aaaataaatc cgcactggaa agtttgtaac    180
accggaagat atcaatcccc gatcgatctt actaacgaaa gagtcagtct tattcatgat    240
caagcatgga caagacaata taaaccagct ccggctgtaa ttacaaacag aggccatgac    300
attatggtat catggaaagg agatgctggg aagatgacaa tacggaaaac ggattttaat    360
ttggtgcaat gccattggca ttcaccttct gagcataccg ttaacggaac taggtacgac    420
ctagagcttc acatggttca cacgagtgca cgaggcagaa ctgcggttat cggagttctt  480
tacaaattag gcgaacctaa tgaattcctc accaagctac taaatggaat aaaagcagtg  540
ggaaataaag agataaatct agggatgatt gatccacgag agattaggtt tcaaacaaga  600
aaattctata gatacattgg ctctctcact gttcctcctt gcactgaagg cgtcatttgg  660
actgtcgtca aaagggtgaa cacaatatca atggagcaaa ttacagctct taggcaagcc  720
gttgacgatg gatttgagac aaattcaaga ccggttcaag actcaaaggg aagatcagtt  780
tggttctatg atccaaatgt ttga                                         804
<210>191
<211>267
<212>PRT
<213>拟南芥
<400>191
Met Asp Thr Asn Ala Lys Thr Ile Phe Phe Met Ala Met Cys Phe Ile
1               5                   10                  15
Tyr Leu Ser Phe Pro Asn Ile Ser His Ala His Ser Glu Val Asp Asp
            20                  25                  30
Glu Thr Pro Phe Thr Tyr Glu Gln Lys Thr Glu Lys Gly Pro Glu Gly
        35                  40                  45
Trp Gly Lys Ile Asn Pro His Trp Lys Val Cys Asn Thr Gly Arg Tyr
    50                  55                  60
Gln Ser Pro Ile Asp Leu Thr Asn Glu Arg Val Ser Leu Ile His Asp
65                  70                  75                  80
Gln Ala Trp Thr Arg Gln Tyr Lys Pro Ala Pro Ala Val Ile Thr Asn
                85                  90                  95
Arg Gly His Asp Ile Met Val Ser Trp Lys Gly Asp Ala Gly Lys Met
            100                 105                 110
Thr Ile Arg Lys Thr Asp Phe Asn Leu Val Gln Cys His Trp His Ser
        115                 120                 125
Pro Ser Glu His Thr Val Asn Gly Thr Arg Tyr Asp Leu Glu Leu His
    130                 135                 140
Met Val His Thr Ser Ala Arg Gly Arg Thr Ala Val Ile Gly Val Leu
145                 150                 155                 160
Tyr Lys Leu Gly Glu Pro Asn Glu Phe Leu Thr Lys Leu Leu Asn Gly
                165                 170                 175
Ile Lys Ala Val Gly Asn Lys Glu Ile Asn Leu Gly Met Ile Asp Pro
            180                 185                 190
Arg Glu Ile Arg Phe Gln Thr Arg Lys Phe Tyr Arg Tyr Ile Gly Ser
        195                 200                 205
Leu Thr Val Pro Pro Cys Thr Glu Gly Val Ile Trp Thr Val Val Lys
    2l0                 215                 220
Arg Val Asn Thr Ile Ser Met Glu Gln Ile Thr Ala Leu Arg Gln Ala
225                 230                 235                 240
Val Asp Asp Gly Phe Glu Thr Asn Ser Arg Pro Val Gln Asp Ser Lys
                245                 250                 255
Gly Arg Ser Val Trp Phe Tyr Asp Pro Asn Val
            260                 265
<210>192
<211>792
<212>DNA
<213>拟南芥
<400>192
atgaaacaca ttttttttaa ctcgtgtata accaaaaaaa atatagagga cgaaacgcag     60
tttaactacg agaagaaagg agagaagggg ccagagaact ggggaagact aaagccagag    120
tgggcaatgt gtggaaaagg caacatgcag tctccgattg atcttacgga caaaagagtc    180
ttgattgatc ataatcttgg ataccttcgt agccagtatt taccttcaaa tgccaccatt    240
aagaacagag gccatgatat catgatgaaa tttgaaggag gaaatgcagg tttaggtatc    300
actattaatg gtactgaata taaacttcaa cagattcatt ggcactctcc ttccgaacac    360
acactcaatg gcaaaaggtt tgttcttgag gaacacatgg ttcatcagag caaagatgga    420
cgcaacgctg ttgtcgcttt cttttacaaa ttgggaaaac ctgactattt tctcctcacg    480
ttggaaagat acttgaagag gataactgat acacacgaat cccaggaatt tgtcgagatg    540
gttcatccta gaacattcgg ttttgaatca aaacactatt atagatttat cggatcactt    600
acaactccac cgtgttctga aaatgtgatt tggacgattt ccaaagagat gaggactgtg    660
acattaaaac aattgatcat gcttcgagtg actgtacacg atcaatctaa ctcaaatgct    720
agaccgcttc agcgtaaaaa tgagcgtccg gtggcacttt acataccaac atggcatagt    780
aaactatatt aa                                        792
<210>193
<211>263
<212>PRT
<213>拟南芥
<400>193
Met Lys His Ile Phe Phe Asn Ser Cys Ile Thr Lys Lys Asn Ile Glu
1               5                   10                  15
Asp Glu Thr Gln Phe Asn Tyr Glu Lys Lys Gly Glu Lys Gly Pro Glu
            20                  25                  30
Asn Trp Gly Arg Leu Lys Pro Glu Trp Ala Met Cys Gly Lys Gly Asn
        35                  40                  45
Met Gln Ser Pro Ile Asp Leu Thr Asp Lys Arg Val Leu Ile Asp His
    50                  55                  60
Asn Leu Gly Tyr Leu Arg Ser Gln Tyr Leu Pro Ser Asn Ala Thr Ile
65                  70                  75                  80
Lys Asn Arg Gly His Asp Ile Met Met Lys Phe Glu Gly Gly Asn Ala
                85                  90                  95
Gly Leu Gly Ile Thr Ile Asn Gly Thr Glu Tyr Lys Leu Gln Gln Ile
            100                 105                 110
His Trp His Ser Pro Ser Glu His Thr Leu Asn Gly Lys Arg Phe Val
        115                 120                 125
Leu Glu Glu His Met Val His Gln Ser Lys Asp Gly Arg Asn Ala Val
    130                 135                 140
Val Ala Phe Phe Tyr Lys Leu Gly Lys Pro Asp Tyr Phe Leu Leu Thr
145                 150                 155                 160
Leu Glu Arg Tyr Leu Lys Arg Ile Thr Asp Thr His Glu Ser Gln Glu
                165                 170                 175
Phe Val Glu Met Val His Pro Arg Thr Phe Gly Phe Glu Ser Lys His
            180                 185                 190
Tyr Tyr Arg Phe Ile Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Asn
        195                 200                 205
Val Ile Trp Thr Ile Ser Lys Glu Met Arg Thr Val Thr Leu Lys Gln
    210                 215                 220
Leu Ile Met Leu Arg Val Thr Val His Asp Gln Ser Asn Ser Asn Ala
225                 230                 235                 240
Arg Pro Leu Gln Arg Lys Asn Glu Arg Pro Val Ala Leu Tyr Ile Pro
                245                 250                 255
Thr Trp His Ser Lys Leu Tyr
            260
<210>194
<211>275
<212>PRT
<213>夏侧金盏花(Adonis aestivalis)
<400>194
Met Gly Thr Leu Gly Lys Ala Ile Tyr Thr Val Gly Phe Trp Ile Arg
1               5                   10                  15
Glu Thr Gly Gln Ala Ile Asp Arg Leu Gly Ser Arg Leu Gln Gly Asn
            20                  25                  30
Tyr Tyr Phe His Glu Gln Leu Ser Arg His Arg Thr Leu Met Asn Ile
        35                  40                  45
Phe Asp Lys Ala Pro Val Val Asp Lys Asp Ala Phe Ile Ala Pro Ser
    50                  55                  60
Ala Ser Val Ile Gly Asp Val Gln Val Gly Arg Ser Ser Ser Ile Trp
65                  70                  75                  80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser Ile Ser Val Gly Ser
                85                 90                   95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn
            100                 105                 110
Leu Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Asn Asn Val Thr Val
        115                 120                 125
Gly His Ser Ala Val Leu His Gly Cys Thr Val Gln Asp Ser Ala Phe
    130                 135                 140
Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Asn His
145                 150                 155                 160
Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro
                165                 170                 175
Lys Gly Glu Val Trp Gly Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu
            180                 185                 190
Thr Glu Glu Glu Ile Ala Phe Ile Ser Gln Ser Ala Thr Asn Tyr Thr
        195                 200                 205
Asn Leu Ala Gln Val His Ala Ala Glu Asn Ala Lys Thr Phe Glu Glu
    210                 215                 220
Ile Glu Phe Glu Lys Leu Leu Arg Lys Lys Phe Ala Arg Lys Asp Glu
225                 230                 235                 240
Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Thr Pro Gln Glu Leu
                245                 250                 255
Ile Leu Pro Asp Asn Ile Leu Ala Asp Lys Gln Ser Pro Lys Ala Val
            260                 265                 270
Ser Ser Ser
        275
<210>195
<211>276
<212>PRT
<213>大豆
<400>195
Met Gly Thr Leu Gly Arg Ala Ile Tyr Ser Val Gly Asn Trp Ile Arg
1               5                   10                  15
Gly Thr Gly Gln Ala Ile Asp Arg Leu Gly Ser Leu Leu Gln Gly Gly
            20                  25                  30
Tyr Tyr Val Gln Glu Gln Leu Ser Arg His Arg Thr Leu Met Asp Ile
        35                  40                  45
Phe Asp Lys Ala Pro Val Val Asp Glu Asp Val Phe Val Ala Pro Ser
    50                  55                  60
Ala Ser Val Ile Gly Asp Val Gln Leu Gly Arg Gly Ser Ser Ile Trp
65                  70                  75                  80
Tyr Gly Val Val Leu Arg Gly Asp Val Asn Ser Ile Arg Val Gly Asn
                85                  90                  95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn
            100                 105                 110
Leu Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Asp Asn Val Thr Val
        115                 120                 125
Gly His Ser Ala Val Ile His Gly Cys Thr Val Glu Asp Glu Ala Phe
    130                 135                 140
Val Gly Met Gly Ala Ile Leu Leu Asp Gly Val Val Val Glu Lys Asn
145                 150                 155                 160
Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro
                165                 170                 175
Ser Gly Glu Val Trp Ala Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu
            180                 185                 190
Thr Asp Glu Glu Ile Ala Phe Ile Ser Gln Ser Ala Thr Asn Tyr Thr
        195                 200                 205
Asn Leu Ala Gln Val His Ala Ala Glu Asn Ser Lys Ser Phe Asp Glu
    210                 215                 220
Ile Glu Phe Glu Lys Val Leu Arg Lys Lys Phe Ala Arg Lys Asp Glu
225                 230                 235                 240
Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Ile Pro Pro Glu Leu
                245                 250                 255
Ile Leu Pro Asp Asn Val Leu Pro Asp Lys Ala Glu Lys Ala Leu Lys
            260                 265                 270
Lys Ser Gly Ile
        275
<210>196
<211>276
<212>PRT
<213>欧洲油菜(Brassica napus)
<400>196
Met Gly Thr Leu Gly Arg Val Ile Tyr Thr Val Gly Lys Trp Ile Arg
1               5                   10                  15
Gly Ser Gly Gln Ala Leu Asp Arg Val Gly Ser Ile Leu Gln Gly Ser
            20                  25                  30
His Arg Leu Glu Glu His Leu Ser Arg His Arg Thr Leu Met Asn Val
        35                  40                  45
Phe Asp Lys Ser Pro Leu Val Asp Lys Asp Val Phe Val Ala Pro Ser
    50                  55                  60
Ala Ser Val Ile Gly Asp Val Gln Ile Gly Lys Gly Ser Ser Ile Trp
65                  70                  75                  80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Asn Ile Ser Val Gly Ser
                85                  90                  95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Thr Asn
            100                 105                 110
Leu Gly Gly Lys Val Leu Pro Thr Thr Ile Gly Asp Asn Val Thr Val
        115                 120                 125
Gly His Ser Ala Val Ile His Gly Cys Thr Val Glu Asp Glu Ala Phe
    130                 135                 140
Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His
145                 150                 155                 160
Ala Met Val Ala Ala Gly Ser Leu Val Arg Glu Asn Thr Arg Ile Pro
                165                 170                 175
Ser Gly Glu Val Trp Gly Gly Asn Pro Ala Lys Phe Met Arg Lys Leu
            180                 185                 190
Thr Asp Glu Glu Ile Ala Tyr Ile Ser Lys Ser Ala Glu Asn Tyr Ile
        195                 200                 205
Asn Leu Ala His Ile His Ala Ala Glu Asn Ser Lys Ser Phe Glu Glu
    210                 215                 220
Ile Glu Val Glu Arg Ala Leu Arg Lys Lys Tyr Ala Arg Lys Asp Glu
225                 230                 235                 240
Asp Tyr Asp Ser Met Leu Gly Ile Val Arg Glu Thr Pro Ala Glu Leu
                245                 250                 255
Ile Leu Pro Asp Asn Val Leu Pro Glu Lys Thr Thr Thr Arg Val Pro
            260                 265                 270
Thr Thr His Tyr
        275
<210>197
<211>273
<212>PRT
<213>玉蜀黍
<400>197
Met Gly Thr Leu Gly Arg Ala Ile Phe Thr Val Gly Lys Trp Ile Arg
1               5                   10                 15
Gly Thr Gly Gln Ala Met Asp Arg Leu Gly Ser Thr Ile Gln Gly Gly
            20                  25                  30
Leu Arg Val Glu Glu Gln Val Ser Arg His Arg Thr Ile Met Asn Ile
        35                  40                  45
Phe Glu Lys Glu Pro Arg Ile His Arg Asp Val Phe Val Ala Pro Ser
    50                  55                  60
Ala Ala Val Ile Gly Asp Val Glu Ile Gly His Gly Ser Ser Ile Trp
65                  70                  75                  80
Tyr Gly Ser Ile Leu Arg Gly Asp Val Asn Ser Ile His Ile Gly Ser
                85                  90                  95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ser Lys Ala Asn
            100                 105                 110
Ile Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Ser Asn Val Thr Val
        115                 120                 125
Gly His Ser Ala ValLeu Hi s Ala Cys Thr Ile Glu Asp Glu Ala Phe
    130                 135                 140
Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His
145                 150                 155                 160
Ser Met Val Gly Ala Gly Ser Leu Val Lys Gln Asn Thr Arg Ile Pro
                165                 170                 175
Ser Gly Glu Val Trp Val Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu
            180                 185                 190
Thr Glu Glu Glu Ile Ala Phe Ile Ala Gln Ser Ala Thr Asn Tyr Ile
        195                 200                 205
Asn Leu Ala Gln Val His Ala Ala Glu Asn Ala Lys Ser Phe Asp Glu
    210                 215                 220
Ile Glu Leu Glu Lys Met Leu Arg Lys Lys Tyr Ala His Lys Asp Glu
225                 230                 235                 240
Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Ile Pro Pro Gln Leu
                245                 250                 255
Ile Leu Pro Asp Asn Ile Leu Pro His Asn Ala Gln Lys Ala Val Ala
            260                 265                 270
Arg
<210>198
<211>274
<212>PRT
<213>普通小麦(Triticum aestivum)
<400>198
Met Gly Thr Leu Gly Arg Ala Ile Tyr Thr Val Gly Lys Trp Ile Arg
1               5                   10                  15
Gly Thr Gly Gln Ala Met Asp Arg Leu Gly Ser Thr Ile Gln Gly Gly
            20                  25                  30
Leu Arg Thr Glu Glu Gln Val Ser Arg His Arg Thr Val Met Ser Ile
        35                  40                  45
Phe Asp Lys Glu Pro Arg Ile Asn Lys Asp Val Phe Val Ala Pro Ser
    50                  55                   60
Ala Ser Val Ile Gly Asp Val Glu Ile Gly His Gly Ser Ser Ile Trp
65                  70                  75                  80
Tyr Gly Ser Val Leu Arg Gly Asp Val Asn Ser Ile Arg Ile Gly Ser
                85                  90                  95
Gly Ser Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Thr Asn
            100                 105                 110
Ile Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Ser Asn Val Thr Val
        115                 120                 125
Gly His Ser Ala Val Leu His Ala Cys Thr Ile Glu Asp Glu Ala Phe
    130                 135                 140
Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His
145                 150                 155                 160
Ser Met Val Gly Ala Gly Ser Leu Val Lys Gln Asn Thr Arg Ile Pro
                165                 170                 175
Ser Gly Glu Val Trp Val Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu
            180                 185                 190
Thr Glu Glu Glu Ile Thr Phe Ile Ala Gln Ser Ala Ala Asn Tyr Ile
        195                 200                 205
Asn Leu Ala His Val His Ala Thr Glu Asn Ser Lys Ser Phe Asp Glu
    210                 215                 220
Ile Glu Leu Glu Lys Lys Leu Arg Lys Lys Phe Ala His Lys Asp Glu
225                 230                 235                 240
Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Ile Pro Pro Gln Leu
                245                 250                 255
Ile Leu Pro Asp Asn Ile Leu Pro Asp Lys Ala Pro Lys Ala Ala Val
            260                 265                 270
Ala His
<210>199
<211>270
<212>PRT
<213>大豆
<400>199
Met Gly Thr Leu Gly Arg Val Phe Tyr Ala Val Gly Phe Trp Ile Arg
1               5                   10                  15
Glu Thr Gly Gln Ala Ile Asp Arg Leu Gly Ser Arg Leu Gln Gly Asn
            20                  25                  30
Tyr Leu Phe Gln Glu Gln Leu Ser Arg His Arg Pro Leu Met Asn Leu
        35                  40                  45
Phe Asp Lys Ala Pro Ser Val His Arg Asp Ala Phe Val Ala Pro Ser
    50                  55                  60
Ala Ser Leu Leu Gly Asp Val His Val Gly Pro Ala Ser Ser Ile Trp
65                  70                  75                  80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser Ile Thr Ile Gly Ser
                85                  90                  95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn
            100                 105                 110
Leu Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Asp Asn Val Thr Val
        115                 120                 125
Gly His Ser Ala Val Leu Gln Gly Cys Thr Val Glu Asp Glu Ala Phe
    130                 135                 140
Ile Gly Met Gly Ala Thr Leu Leu Asp Gly Val Tyr Val Glu Lys His
145                 150                 155                 160
Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro
                165                 170                 175
Tyr Gly Glu Val Trp Gly Gly Asn Pro Ala Arg Phe Leu Arg Lys Leu
            180                 185                 190
Thr Glu Asp Glu Met Thr Phe Phe Ser Gln Ser Ala Leu Asn Tyr Ser
        195                 200                 205
Asn Leu Ala Gln Ala His Ser Ala Glu Asn Ala Lys Gly Leu Asp Glu
    210                 215                 220
Thr Glu Phe Val Lys Val Leu His Lys Lys Phe Ala Arg His Gly Asp
225                 230                 235                 240
Glu Tyr His Ser Val Leu Gly Gly Val Gln Glu Thr Pro Thr Glu Leu
                245                 250                 255
Lys Ser Ser Asp Asn Val Leu Leu Asp Lys Val Pro Lys Ala
            260                 265                 270
<210>200
<211>307
<212>PRT
<213>大麦
<400>200
Met Ala Lys Ala Ser Tyr Ala Val Gly Phe Trp Ile Arg Glu Thr Gly
1               5                   10                  15
Gln Ala Leu Asp Arg Leu Gly Cys Arg Leu Gln Gly Asn Tyr Phe Phe
            20                  25                  30
His Glu Gln Ile Ser Arg His Arg Thr Leu Met Asn Ile Phe Asp Lys
        35                  40                  45
Ala Pro His Val His Lys Glu Ala Phe Val Ala Pro Ser Ala Ser Leu
    50                  55                  60
Ile Gly Asp Val Glu Val Gly Lys Gly Ser Ser Ile Trp Tyr Gly Cys
65                  70                  75                  80
Val Leu Arg Gly Asp Ala Asn Asn Val Gln Val Gly Ser Gly Thr Asn
                85                  90                  95
Ile Gln Asp Asn Ser Val Val His Val Ala Lys Ser Asn Leu Ser Gly
            100                 105                 110
Lys Val Phe Pro Thr Ile Ile Gly Asp Asn Val Thr Val Gly His Ser
        115                 120                 125
Ala Val Leu Gln Gly Cys Thr Val Glu Asp Glu Ala Phe Val Gly Met
    130                 135                 140
Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His Gly Met Val
145                 150                 155                 160
Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro Cys Gly Glu
                165                 170                 175
Val Trp Gly Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu Thr Asp Glu
            180                 185                 190
Glu Ile Ala Phe Ile Ala Glu Ser Ala Ala Asn Tyr Ser Asn Leu Ala
        195                 200                 205
Lys Ala His Ala Val Glu Asn Ala Lys Pro Val Glu Lys Ile Asp Phe
    210                 215                 220
Glu Lys Val Leu Arg Lys Lys Val Ala His Gln Asp Glu Glu His Gly
225                 230                 235                 240
Ser Met Leu Gly Ala Thr Arg Lys Ser Leu Gln Ser Trp Arg Arg Pro
                245                 250                 255
Val Leu Leu Leu Arg Pro Asn Lys Leu Cys Leu Ser Val Phe Leu Ser
            260                 265                 270
Phe Phe Gly Ala Phe Thr Ile Phe Ser Leu Asn Ser Tyr Ile Leu Ser
        275                 280                 285
Val His Leu Val Trp Gln Phe Lys Ile Ile Ser Ile Ile Leu Gly Arg
    290                 295                 300
Ala Met Phe
305
<210>201
<211>279
<212>PRT
<213>玉蜀黍
<400>201
Met Val Ser Ser Ser Arg Ala Val Val Val Val Val Gly Leu Leu Val
1               5                   10                  15
Ala Ala Ser Ser Leu Ala Val Ala Ala Ser Asp Gly Gly Gly Pro Thr
            20                  25                  30
Tyr Gly Tyr Thr Ala Gly Ser Pro Asp Gly Pro Glu Asn Trp Gly Lys
        35                  40                  45
Leu Ser Pro Ala Tyr Lys Leu Cys Gly Gln Gly Lys Gln Gln Ser Pro
    50                  55                  60
Ile Asp Ile Val Thr Lys Gln Ala Val Pro Thr Ala Thr Leu Asp Thr
65                  70                  75                  80
Leu Asn Arg Thr Tyr Gly Ala Thr Asn Ala Thr Leu Ile Asn Asp Gly
                85                  90                  95
His Asp Ile Thr Met Ala Leu Glu Gly Lys Val Gly Thr Val Thr Val
            100                 105                 110
Asn Gly Lys Ala Tyr Ser Phe Glu Lys Leu His Trp His Ser Pro Ser
        115                 120                 125
Asp His Thr Ile Asn Gly Gln Arg Phe Pro Leu Glu Leu His Leu Val
    130                 135                 140
His Arg Ser Ala Asp Gly Ala Leu Ala Val Ile Gly Ile Leu Tyr Gln
145                 150                 155                 160
Leu Gly Ala Pro Asp Ser Phe Tyr Tyr Gln Leu Lys Arg Gln Leu Gly
                165                 170                 175
Glu Met Ala Gln Asp Arg Cys Asp Phe Ala Glu Glu Glu Glu Ser Arg
            180                 185                 190
Val Glu Ala Gly Leu Ile His Leu Arg Ser Leu Gln Lys Arg Thr Gly
        195                 200                 205
Ser Tyr Phe Arg Tyr Thr Gly Ser Leu Thr Val Pro Pro Cys Thr Glu
    210                 215                 220
Asn Val Val Trp Ser Val Leu Gly Lys Val Arg Gln Ile Ser Gln Asp
225                 230                 235                 240
Gln Leu Gln Leu Leu Lys Ala Pro Leu Pro Gly Ser Asp Ala Arg Pro
                245                 250                 255
Thr Gln Pro Leu Asn Gly Arg Thr Val Gln Phe Tyr Asn Pro Pro Asn
            260                 265                 270
Ser Thr Ile Ser Phe Gln Ile
        275
<210>202
<211>274
<212>PRT
<213>欧洲油菜
<400>202
Met Lys Arg Pro Ser Ile Val Arg Val Ile Phe Leu Ile Val Ile Ser
1               5                   10                  15
Ile Thr Thr Ala Ser Gly Ser Pro Asp His Gly Glu Val Glu Asp Glu
            20                  25                  30
Thr Glu Phe Asn Tyr Glu Lys Gly Gly Glu Lys Gly Pro Glu Lys Trp
        35                  40                  45
Gly Thr Leu Lys Pro Glu Trp Lys Met Cys Gly Asn Gly Thr Met Gln
    50                  55                  60
Ser Pro Ile Asp Leu Thr Asp Lys Arg Val Phe Ile Asp His Asn Leu
65                  70                  75                  80
Gly Pro Leu Arg Ser His Tyr Leu Pro Ser Asn Ala Thr Ile Lys Asn
                85                 90                 95
Arg Gly His Asp Ile Met Leu Glu Phe Glu Gly Gly Asn Ala Gly Met
            100                 105                 110
Gly Ile Ile Ile Asn Gly Thr Val Tyr Gln Leu Gln Gln Leu His Trp
        115                 120                 125
His Ser Pro Ser Glu His Thr Ile Asn Gly Lys Arg Phe Val Leu Glu
    130                 135                 140
Gln His Met Leu His Gln Ser Lys Asp Gly Arg Leu Ala Val Val Ala
145                 150                 155                 160
Phe Leu Tyr Ser Leu Gly Arg Pro Asp Ser Phe Leu Leu Ser Leu Glu
                165                 170                 175
Arg Gln Leu Lys Arg Ile Thr Asp Ala His Gly Ser Glu Asp Phe Val
            180                 185                 190
Ser Trp Ile Asp Pro Arg Ala Val Asn Phe Lys Thr Arg Leu Tyr Tyr
        195                 200                 205
Arg Tyr Leu Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Asn Val Thr
    210                 215                 220
Trp Ser Ile Ser Arg Glu Met Arg Thr Val Thr Leu Lys Gln Leu Asp
225                 230                 235                 240
Leu Leu Arg Val Ser Val His Asp Gln Ser Asn Thr Asn Ala Arg Pro
                245                 250                 255
Leu Gln Arg Gln Asn Gly Arg Pro Val Lys Phe Tyr Leu Pro Ala Trp
            260                 265                 270
His Ile
<210>203
<211>17
<212>PRT
<213>人工序列
<220>
<223>基序1
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Thr″
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Asn″
<220>
<221>不确定
<222>(4)..(4)
<223>Xaa可以是任意天然发生的氨基酸
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Ile″/取代=″Val″/取代=″Met″
<220>
<221>不确定
<222>(6)..(9)
<223>Xaa可以是任意天然发生的氨基酸
<220>
<221>变体
<222>(10)..(10)
<223>/取代=″Tyr″/取代=″Leu″/取代=″His″
<220>
<221>不确定
<222>(11)..(12)
223>Xaa可以是任意天然发生的氨基酸
<220>
<221>变体
<222>(13)..(13)
<223>/取代=″Asp″
<220>
<221>不确定
<222>(14)..(14)
<223>Xaa可以是任意天然发生的氨基酸
<220>
<221>变体
<222>(15)..(15)
<223>/取代=″Gln″
<220>
<221>变体
<222>(16)..(16)
<223>/取代=″Ile″/取代=″Val″/取代=″Met″/取代=
     ″Phe″/取代=″Ala″
<220>
<221>变体
<222>(17)..(17)
<223>/取代=″Ile″/取代=″Val″/取代=″Met″/取代=
     ″Phe″/取代=″Ala″
<400>203
Ser Glu His Xaa Leu Xaa Xaa Xaa Xaa Phe Xaa Xaa Glu Xaa His Leu
1               5                   10                  15
Leu
<210>204
<211>7
<212>PRT
 213>人工序列
<220>
<223>基序2
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Asn″/取代=″Tyr″/取代=″Met″/取代=
     ″Thr″/取代=″Phe″/取代=″Ala″/取代=″Arg″
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Val″/取代=″Ser″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Ile″/取代=″Leu″/取代=″Thr″
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Thr″/取代=″Gly″/取代=″Ser″
220>
<221>变体
<222>(6)..(6)
<223>/取代=″Val″/取代=″Ile″/取代=″Ser″/取代=
     ″Thr″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Phe″/取代=″Val″/取代=″Met″
<400>204
Leu Ala Val Val Ala Phe Leu
1               5
<210>205
<211>16
<212>PRT
<213>人工序列
<220>
<223>基序3
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Phe″
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Phe″/取代=″Val″/取代=″Gly″/取代=
     ″Ala″
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Glu″/取代=″Gly″/取代=″Thr″/取代=
     ″His″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Phe″
<220>
<221>不确定
<222>(5)..(5)
<223>Xaa可以是任意天然发生的氨基酸
<220>
<221>变体
<222>(8)..(8)
<223>/取代=″Phe″/取代=″Tyr″
<220>
<221>变体
<222>(10)..(10)
<223>/取代=″Val″/取代=″Ala″
<220>
<221>变体
<222>(14)..(14)
<223>/取代=″Thr″/取代=″Gly″/取代=″Asp″/取代=
     ″Ala″
<220>
<221>变体
<222>(15)..(15)
<223>/取代=″Gln″
<220>
<221>变体
<222>(16)..(16)
<223>/取代=″Gly″/取代=″Asp″/取代=″Arg″
<400>205
Tyr Tyr Arg Tyr Xaa Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Asn
1               5                   10                  15
<210>206
<211>1416
<212>DNA
<213>稻
<400>206
cccacgcgtc cgcccacgcg tccgggacac cagaaacata gtacacttga gctcactcca     60
aactcaaaca ctcacaccaa tggctctcca agttcaggcc gcactcctgc cctctgctct    120
ctctgtcccc aagaagggta acttgagcgc ggtggtgaag gagccggggt tccttagcgt    180
gagcagaagg ccaagaagcc gtcgctggtg gtgagggcgg tggcgacgcg gcgggccggt    240
ggcgagcccc ggcgcgggca cgtcgaaggc ggacgggaag aagacgctgc ggcagggggt    300
ggtggtgatc accggcgcgt cgtcggggct cgggctcgcg gcggcgaagg cgcttggcgg    360
agacggggaa gtggcacgtg gtgatggcgt tccgcgactt tcctgaaggc ggcgacggcg    420
gcgaaggcgg cggggatggc ggcggggagc tacaccgtca tgcacctgga cctcgcctcc    480
ctcgacagcg tccgccagtt cgtggacaac ttccggcgct ccggcatgcc gctcgacgcg    540
ctggtgtgca acgccgcaca tctaccggcc gacggcgcgg caaccgacgt tcaacgccga    600
cgggtacgag atgagcgtcg gggtgaacca cctgggccac ttcctcctcg cccgcctcat    660
gctcgacgac ctcaagaaat ccgactaccc gtcgcggcgg ctcatcatcc tcggctccat    720
caccggcaac accaacacct tcgccggcaa cgtccctccc aaggccgggc taggcgacct    780
ccgggggctc gccggcgggc tccgcgggca gaacgggtcg gcgatgatcg acggcgcgga   840
gagcttcgac ggcgccaagg cgtacaagga cagcaagatc tgtaacatgc tgacgatgca   900
ggagttccac cggagattcc acgaggagac cgggatcacg ttcgcgtcgc tgtacccggg   960
gtgcatcgcg acgacgggct tgttccgcga gcacatcccg ctgttccggc tgctgttccc  1020
gccgttccag cggttcgtga cgaaggggtt cgtgtcggag gcggagtccg ggaagcggct  1080
ggcgcaggtg gtgggcgacc cgagcctgac caagtccggc gtgtactgga gctggaacaa  1140
ggactcggcg tcgttcgaga accagctctc gcaggaggcc agcgacccgg agaaggccag  1200
gaagctctgg gacctcagcg agaagctcgt cggcctcgtc tgagtttatt atttacccat  1260
tcgtttcaac tgttaatttc ttcggggttt agggggtttc agctttcagt gagagaggcc  1320
tgtcaagtga tgtacaatta gtaatttttt tttacccgac aaatcatgca ataaaaccac  1380
aggcttacat tatcgatttg tccacctaaa ttaagt                            1416
<210>207
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物:prm8571
<400>207
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgcg ctcagccgtt c             51
<210>208
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm8572
<400>208
ggggaccact ttgtacaaga aagctgggtc tcactgaccc tagcacactc               50
<210>209
<211>2253
<212>DNA
<213>拟南芥
<400>209
atggcgatga gacttttgaa gactcatctt ctgtttctgc atctgtatct atttttctca    60
ccatgtttcg cttacactga catggaagtt cttctcaatc tcaaatcctc catgattggt    120
cctaaaggac acggtctcca cgactggatt cactcatctt ctccggatgc tcactgttct    180
ttctccggcg tctcatgtga cgacgatgct cgtgttatct ctctcaacgt ctccttcact    240
cctttgtttg gtacaatctc accagagatt gggatgttga ctcatttggt gaatctaact    300
ttagctgcca acaacttcac cggtgaatta ccattggaga tgaagagtct aacttctctc    360
aaggttttga atatctccaa caatggtaac cttactggaa cattccctgg agagatttta    420
aaagctatgg ttgatcttga agttcttgac acttataaca acaatttcaa cggtaagtta    480
ccaccggaga tgtcagagct taagaagctt aaatacctct ctttcggtgg aaatttcttc    540
agcggagaga ttccagagag ttatggagat attcaaagct tagagtatct tggtctcaac    600
ggagctggac tctccggtaa atctccggcg tttctttccc gcctcaagaa cttaagagaa    660
atgtatattg gctactacaa cagctacacc ggtggtgttc caccggagtt cggtggttta    720
acaaagcttg agatcctcga catggcgagc tgtacactca ccggagagat tccgacgagt    780
ttaagtaacc tgaaacatct acatactctg tttcttcaca tcaacaactt aaccggtcat    840
ataccaccgg agctttccgg tttagtcagc ttgaaatctc tcgatttatc aatcaatcag    900
ttaaccggag aaatccctca aagcttcatc aatctcggaa acattactct aatcaatctc    960
ttcagaaaca atctctacgg acaaatacca gaggccatcg gagaattacc aaaactcgaa   1020
gtcttcgaag tatgggagaa caatttcacg ttacaattac cggcgaatct tggccggaac   1080
gggaatctaa taaagcttga tgtctctgat aatcatctca ccggacttat ccccaaggac   1140
ttatgcagag gtgagaaatt agagatgtta attctctcta acaacttctt ctttggtcca   1200
attccagaag agcttggtaa atgcaaatcc ttaaccaaaa tcagaatcgt taagaatctt   1260
ctcaacggca ctgttccggc ggggcttttc aatctaccgt tagttacgat tatcgaactc   1320
actgataatt tcttctccgg tgaacttccg gtaacgatgt ccggcgatgt tctcgatcag   1380
atttacctct ctaacaactg gttttccggc gagattccac ctgcgattgg taatttcccc   1440
aatctacaga ctctattctt agatcggaac cgatttcgcg gcaacattcc gagagaaatc   1500
ttcgaattga agcatttatc gaggatcaac acaagtgcga acaacatcac cggcggtatt   1560
ccagattcaa tctctcgctg ctcaacttta atctccgtcg atctcagccg taaccgaatc   1620
aacggagaaa tccctaaagg gatcaacaac gtgaaaaact taggaactct aaatatctcc    1680
ggtaatcaat taaccggttc aatccctacc ggaatcggaa acatgacgag tttaacaact    1740
ctcgatctct ctttcaacga tctctccggt agagtaccac tcggtggtca attcttggtg    1800
ttcaacgaaa cttccttcgc cggaaacact tacctctgtc tccctcaccg tgtctcttgc    1860
ccaacacggc caggacaaac ctccgatcac aatcacacgg cgttgttctc accgtcaagg    1920
atcgtaatca cggttatcgc agcgatcacc ggtttgatcc taatcagtgt agcgattcgt    1980
cagatgaata agaagaagaa ccagaaatct ctcgcctgga aactaatcgc cttccagaaa    2040
ctagatttca aatctgaaga cgttctcgag tgtcttaaag aagagaacat aatcggtaaa    2100
ggcggagctg gaattgtcta ccgtggatca atgccaaaca acgtagacgt cgcgattaaa    2160
cgactcgttg gccgtgggac cgggaggagc gatcatggat tcacggcgga gattcaaact    2220
ttggggagaa tccgccaccg tcacatagtg tga                                 2253
<210>210
<211>750
<212>PRT
<213>拟南芥
<400>210
Met Ala Met Arg Leu Leu Lys Thr His Leu Leu Phe Leu His Leu Tyr
1               5                   10                  15
Leu Phe Phe Ser Pro Cys Phe Ala Tyr Thr Asp Met Glu Val Leu Leu
            20                  25                  30
Asn Leu Lys Ser Ser Met Ile Gly Pro Lys Gly His Gly Leu His Asp
        35                  40                  45
Trp Ile His Ser Ser Ser Pro Asp Ala His Cys Ser Phe Ser Gly Val
    50                  55                  60
Ser Cys Asp Asp Asp Ala Arg Val Ile Ser Leu Asn Val Ser Phe Thr
65                  70                  75                  80
Pro Leu Phe Gly Thr Ile Ser Pro Glu Ile Gly Met Leu Thr His Leu
                85                  90                  95
Val Asn Leu Thr Leu Ala Ala Asn Asn Phe Thr Gly Glu Leu Pro Leu
            100                 105                 110
Glu Met Lys Ser Leu Thr Ser Leu Lys Val Leu Asn Ile Ser Asn Asn
        115                 120                 125
Gly Asn Leu Thr Gly Thr Phe Pro Gly Glu Ile Leu Lys Ala Met Val
    130                 135                 140
Asp Leu Glu Val Leu Asp Thr Tyr Asn Asn Asn Phe Asn Gly Lys Leu
145                 150                 155                 160
Pro Pro Glu Met Ser Glu Leu Lys Lys Leu Lys Tyr Leu Ser Phe Gly
                165                 170                 175
Gly Asn Phe Phe Ser Gly Glu Ile Pro Glu Ser Tyr Gly Asp Ile Gln
            180                 185                 190
Ser Leu Glu Tyr Leu Gly Leu Asn Gly Ala Gly Leu Ser Gly Lys Ser
        195                 200                 205
Pro Ala Phe Leu Ser Arg Leu Lys Asn Leu Arg Glu Met Tyr Ile Gly
    210                 215                 220
Tyr Tyr Asn Ser Tyr Thr Gly Gly Val Pro Pro Glu Phe Gly Gly Leu
225                 230                 235                 240
Thr Lys Leu Glu Ile Leu Asp Met Ala Ser Cys Thr Leu Thr Gly Glu
                245                 250                 255
Ile Pro Thr Ser Leu Ser Asn Leu Lys His Leu His Thr Leu Phe Leu
            260                 265                 270
His Ile Asn Asn Leu Thr Gly His Ile Pro Pro Glu Leu Ser Gly Leu
        275                 280                 285
Val Ser Leu Lys Ser Leu Asp Leu Ser Ile Asn Gln Leu Thr Gly Glu
    290                 295                 300
Ile Pro Gln Ser Phe Ile Asn Leu Gly Asn Ile Thr Leu Ile Asn Leu
305                 310                 315                 320
Phe Arg Asn Asn Leu Tyr Gly Gln Ile Pro Glu Ala Ile Gly Glu Leu
                325                 330                 335
Pro Lys Leu Glu Val Phe Glu Val Trp Glu Asn Asn Phe Thr Leu Gln
            340                 345                 350
Leu Pro Ala Asn Leu Gly Arg Asn Gly Asn Leu Ile Lys Leu Asp Val
        355                 360                 365
Ser Asp Asn His Leu Thr Gly Leu Ile Pro Lys Asp Leu Cys Arg Gly
    370                 375                 380
Glu Lys Leu Glu Met Leu Ile Leu Ser Asn Asn Phe Phe Phe Gly Pro
385                 390                 395                 400
Ile Pro Glu Glu Leu Gly Lys Cys Lys Ser Leu Thr Lys Ile Arg Ile
                405                 410                 415
Val Lys Asn Leu Leu Asn Gly Thr Val Pro Ala Gly Leu Phe Asn Leu
            420                 425                 430
Pro Leu Val Thr Ile Ile Glu Leu Thr Asp Asn Phe Phe Ser Gly Glu
        435                 440                 445
Leu Pro Val Thr Met Ser Gly Asp Val Leu Asp Gln Ile Tyr Leu Ser
    450                 455                 460
Asn Asn Trp Phe Ser Gly Glu Ile Pro Pro Ala Ile Gly Asn Phe Pro
465                 470                 475                 480
Asn Leu Gln Thr Leu Phe Leu Asp Arg Asn Arg Phe Arg Gly Asn Ile
                485                 490                 495
Pro Arg Glu Ile Phe Glu Leu Lys His Leu Ser Arg Ile Asn Thr Ser
            500                 505                 510
Ala Asn Asn Ile Thr Gly Gly Ile Pro Asp Ser Ile Ser Arg Cys Ser
        515                 520                 525
Thr Leu Ile Ser Val Asp Leu Ser Arg Asn Arg Ile Asn Gly Glu Ile
    530                 535                 540
Pro Lys Gly Ile Asn Asn Val Lys Asn Leu Gly Thr Leu Asn Ile Ser
545                 550                 555                 560
Gly Asn Gln Leu Thr Gly Ser Ile Pro Thr Gly Ile Gly Asn Met Thr
                565                 570                 575
Ser Leu Thr Thr Leu Asp Leu Ser Phe Asn Asp Leu Ser Gly Arg Val
            580                 585                 590
Pro Leu Gly Gly Gln Phe Leu Val Phe Asn Glu Thr Ser Phe Ala Gly
        595                 600                 605
Asn Thr Tyr Leu Cys Leu Pro His Arg Val Ser Cys Pro Thr Arg Pro
    610                 615                 620
Gly Gln Thr Ser Asp His Asn His Thr Ala Leu Phe Ser Pro Ser Arg
625                 630                 635                 640
Ile Val Ile Thr Val Ile Ala Ala Ile Thr Gly Leu Ile Leu Ile Ser
                645                 650                 655
Val Ala Ile Arg Gln Met Asn Lys Lys Lys Asn Gln Lys Ser Leu Ala
            660                 665                 670
Trp Lys Leu Ile Ala Phe Gln Lys Leu Asp Phe Lys Ser Glu Asp Val
        675                 680                 685
Leu Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly
    690                 695                 700
Ile Val Tyr Arg Gly Ser Met Pro Asn Asn Val Asp Val Ala Ile Lys
705                 710                 715                 720
Arg Leu Val Gly Arg Gly Thr Gly Arg Ser Asp His Gly Phe Thr Ala
                725                 730                 735
Glu Ile Gln Thr Leu Gly Arg Ile Arg His Arg His Ile Val
            740                 745                 750
<210>211
<211>2943
<212>DNA
<213>拟南芥
<400>211
atggcgatga gacttttgaa gactcatctt ctgtttctgc atctgtatct atttttctca     60
ccatgtttcg cttacactga catggaagtt cttctcaatc tcaaatcctc catgattggt    120
cctaaaggac acggtctcca cgactggatt cactcatctt ctccggatgc tcactgttct    180
ttctccggcg tctcatgtga cgacgatgct cgtgttatct ctctcaacgt ctccttcact    240
cctttgtttg gtacaatctc accagagatt gggatgttga ctcatttggt gaatctaact    300
ttagctgcca acaacttcac cggtgaatta ccattggaga tgaagagtct aacttctctc    360
aaggttttga atatctccaa caatggtaac cttactggaa cattccctgg agagatttta    420
aaagctatgg ttgatcttga agttcttgac acttataaca acaatttcaa cggtaagtta    480
ccaccggaga tgtcagagct taagaagctt aaatacctct ctttcggtgg aaatttcttc    540
agcggagaga ttccagagag ttatggagat attcaaagct tagagtatct tggtctcaac    600
ggagctggac tctccggtaa atctccggcg tttctttccc gcctcaagaa cttaagagaa    660
atgtatattg gctactacaa cagctacacc ggtggtgttc cacgcgagtt cggtggttta    720
acaaagcttg agatcctcga catggcgagc tgtacactca ccggagagat tccgacgagt    780
ttaagtaacc tgaaacatct acatactctg tttcttcaca tcaacaactt aaccggtcat    840
ataccaccgg agctttccgg tttagtcagc ttgaaatctc tcgatttatc aatcaatcag    900
ttaaccggag aaatccctca aagcttcatc aatctcggaa acattactct aatcaatctc    960
ttcagaaaca atctctacgg acaaatacca gaggccatcg gagaattacc aaaactcgaa    1020
gtcttcgaag tatgggagaa caatttcacg ttacaattac cggcgaatct tggccggaac    1080
gggaatctaa taaagcttga tgtctctgat aatcatctca ccggacttat ccccaaggac    1140
ttatgcagag gtgagaaatt agagatgtta attctctcta acaacttctt ctttggtcca    1200
attccagaag agcttggtaa atgcaaatcc ttaaccaaaa tcagaatcgt taagaatctt    1260
ctcaacggca ctgttccggc ggggcttttc aatctaccgt tagttacgat tatcgaactc    1320
actgataatt tcttctccgg tgaacttccg gtaacgatgt ccggcgatgt tctcgatcag    1380
atttacctct ctaacaactg gttttccggc gagattccac ctgcgattgg taatttcccc    1440
aatctacaga ctctattctt agatcggaac cgatttcgcg gcaacattcc gagagaaatc    1500
ttcgaattga agcatttatc gaggatcaac acaagtgcga acaacatcac cggcggtatt    1560
ccagattcaa tctctcgctg ctcaacttta atctccgtcg atctcagccg taaccgaatc    1620
aacggagaaa tccctaaagg gatcaacaac gtgaaaaact taggaactct aaatatctcc    1680
ggtaatcaat taaccggttc aatccctacc ggaatcggaa acatgacgag tttaacaact    1740
ctcgatctct ctttcaacga tctctccggt agagtaccac tcggtggtca attcttggtg    1800
ttcaacgaaa cttccttcgc cggaaacact tacctctgtc tccctcaccg tgtctcttgt    1860
ccaacacggc caggacaaac ctccgatcac aatcacacgg cgttgttctc accgtcaagg    1920
atcgtaatca cggttatcgc agcgatcacc ggtttgatcc taatcagtgt agcgattcgt    1980
cagatgaata agaagaagaa ccagaaatct ctcgcctgga aactaaccgc cttccagaaa    2040
ctagatttca aatctgaaga cgttctcgag tgtcttaaag aagagaacat aatcggtaaa    2100
ggcggagctg gaattgtcta ccgtggatca atgccaaaca acgtagacgt cgcgattaaa    2160
cgactcgttg gccgtgggac cgggaggagc gatcatggat tcacggcgga gattcaaact    2220
ttggggagaa tccgccaccg tcacatagtg agacttcttg gttacgtagc gaacaaggat    2280
acgaatctcc ttctttatga gtacatgcct aatggaagcc ttggagagct tttgcatgga    2340
tctaaaggtg gtcatcttca atgggagacg agacatagag tagccgtgga agctgcaaag    2400
ggcttgtgtt atcttcacca tgattgttca ccattgatct tgcatagaga tgttaagtcc    2460
aataacattc ttttggactc tgattttgaa gcccatgttg ctgattttgg gcttgctaag    2520
ttcttagttg atggtgctgc ttctgagtgt atgtcttcaa ttgctggctc ttatggatac  2580
atcgccccag agtatgcata taccttgaaa gtggacgaga agagtgatgt gtatagtttc  2640
ggagtggttt tgttggagtt aatagctggg aagaaacctg ttggtgaatt tggagaagga  2700
gtggatatag ttaggtgggt gaggaacacg gaagaggaga taactcagcc atcggatgct  2760
gctattgttg ttgcgattgt tgacccgagg ttgactggtt acccgttgac aagtgtgatt  2820
catgtgttca agatcgcaat gatgtgtgtg gaggaagaag ccgcggcaag gcctacgatg  2880
agggaagttg tgcacatgct cactaaccct cctaaatccg tggcgaactt gatcgcgttc  2940
tga                                                                2943
<210>212
<211>980
<212>PRT
<213>拟南芥
<400>212
Met Ala Met Arg Leu Leu Lys Thr His Leu Leu Phe Leu His Leu Tyr
1               5                   10                  15
Leu Phe Phe Ser Pro Cys Phe Ala Tyr Thr Asp Met Glu Val Leu Leu
            20                  25                  30
Asn Leu Lys Ser Ser Met Ile Gly Pro Lys Gly His Gly Leu His Asp
        35                  40                  45
Trp Ile His Ser Ser Ser Pro Asp Ala His Cys Ser Phe Ser Gly Val
    50                  55                  60
Ser Cys Asp Asp Asp Ala Arg Val Ile Ser Leu Asn Val Ser Phe Thr
65                  70                  75                  80
Pro Leu Phe Gly Thr Ile Ser Pro Glu Ile Gly Met Leu Thr His Leu
                85                  90                  95
Val Asn Leu Thr Leu Ala Ala Asn Asn Phe Thr Gly Glu Leu Pro Leu
            100                 105                 110
Glu Met Lys Ser Leu Thr Ser Leu Lys Val Leu Asn Ile Ser Asn Asn
        115                 120                 125
Gly Asn Leu Thr Gly Thr Phe Pro Gly Glu Ile Leu Lys Ala Met Val
    130                 135                 140
Asp Leu Glu Val Leu Asp Thr Tyr Asn Asn Asn Phe Asn Gly Lys Leu
145                 150                 155                 160
Pro Pro Glu Met Ser Glu Leu Lys Lys Leu Lys Tyr Leu Ser Phe Gly
                165                 170                 175
Gly Asn Phe Phe Ser Gly Glu Ile Pro Glu Ser Tyr Gly Asp Ile Gln
            180                 185                 190
Ser Leu Glu Tyr Leu Gly Leu Asn Gly Ala Gly Leu Ser Gly Lys Ser
        195                 200                 205
Pro Ala Phe Leu Ser Arg Leu Lys Asn Leu Arg Glu Met Tyr Ile Gly
    210                 215                 220
Tyr Tyr Asn Ser Tyr Thr Gly Gly Val Pro Arg Glu Phe Gly Gly Leu
225                 230                 235                 240
Thr Lys Leu Glu Ile Leu Asp Met Ala Ser Cys Thr Leu Thr Gly Glu
                245                 250                 255
Ile Pro Thr Ser Leu Ser Asn Leu Lys His Leu His Thr Leu Phe Leu
           260                 265                 270
His Ile Asn Asn Leu Thr Gly His Ile Pro Pro Glu Leu Ser Gly Leu
        275                 280                 285
Val Ser Leu Lys Ser Leu Asp Leu Ser Ile Asn Gln Leu Thr Gly Glu
    290                 295                 300
Ile Pro Gln Ser Phe Ile Asn Leu Gly Asn Ile Thr Leu Ile Asn Leu
305                 310                 315                 320
Phe Arg Asn Asn Leu Tyr Gly Gln Ile Pro Glu Ala Ile Gly Glu Leu
                325                 330                 335
Pro Lys Leu Glu Val Phe Glu Val Trp Glu Asn Asn Phe Thr Leu Gln
            340                 345                 350
Leu Pro Ala Asn Leu Gly Arg Asn Gly Asn Leu Ile Lys Leu Asp Val
        355                 360                 365
Ser Asp Asn His Leu Thr Gly Leu Ile Pro Lys Asp Leu Cys Arg Gly
    370                 375                 380
Glu Lys Leu Glu Met Leu Ile Leu Ser Asn Asn Phe Phe Phe Gly Pro
385                 390                 395                 400
Ile Pro Glu Glu Leu Gly Lys Cys Lys Ser Leu Thr Lys Ile Arg Ile
                405                 410                 415
Val Lys Asn Leu Leu Asn Gly Thr Val Pro Ala Gly Leu Phe Asn Leu
            420                 425                 430
Pro Leu Val Thr Ile Ile Glu Leu Thr Asp Asn Phe Phe Ser Gly Glu
        435                 440                 445
Leu Pro Val Thr Met Ser Gly Asp Val Leu Asp Gln Ile Tyr Leu Ser
    450                 455                 460
Asn Asn Trp Phe Ser Gly Glu Ile Pro Pro Ala Ile Gly Asn Phe Pro
465                 470                 475                 480
Asn Leu Gln Thr Leu Phe Leu Asp Arg Asn Arg Phe Arg Gly Asn Ile
                485                 490                 495
Pro Arg Glu Ile Phe Glu Leu Lys His Leu Ser ArgIle Asn Thr Ser
            500                 505                 510
Ala Asn Asn Ile Thr Gly Gly Ile Pro Asp Ser Ile Ser Arg Cys Ser
        515                 520                 525
Thr Leu Ile Ser Val Asp Leu Ser Arg Asn Arg Ile Asn Gly Glu Ile
    530                 535                 540
Pro Lys Gly Ile Asn Asn Val Lys Asn Leu Gly Thr Leu Asn Ile Ser
545                 550                 555                 560
Gly Asn Gln Leu Thr Gly Ser Ile Pro Thr Gly Ile Gly Asn Met Thr
                565                 570                 575
Ser Leu Thr Thr Leu Asp Leu Ser Phe Asn Asp Leu Ser Gly Arg Val
            580                 585                 590
Pro Leu Gly Gly Gln Phe Leu Val Phe Asn Glu Thr Ser Phe Ala Gly
        595                 600                 605
Asn Thr Tyr Leu Cys Leu Pro His Arg Val Ser Cys Pro Thr Arg Pro
    610                 615                 620
Gly Gln Thr Ser Asp His Asn His Thr Ala Leu Phe Ser Pro Ser Arg
625                 630                 635                 640
Ile Val Ile Thr Val Ile Ala Ala Ile Thr Gly Leu Ile Leu Ile Ser
                645                 650                 655
Val Ala Ile Arg Gln Met Asn Lys Lys Lys Asn Gln Lys Ser Leu Ala
            660                 665                 670
Trp Lys Leu Thr Ala Phe Gln Lys Leu Asp Phe Lys Ser Glu Asp Val
        675                 680                 685
Leu Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly
    690                 695                 700
Ile Val Tyr Arg Gly Ser Met Pro Asn Asn Val Asp Val Ala Ile Lys
705                 710                 715                 720
Arg Leu Val Gly Arg Gly Thr Gly Arg Ser Asp His Gly Phe Thr Ala
                725                 730                 735
Glu Ile Gln Thr Leu Gly Arg Ile Arg His Arg His Ile Val Arg Leu
            740                 745                 750
Leu Gly Tyr Val Ala Asn Lys Asp Thr Asn Leu Leu Leu Tyr Glu Tyr
        755                 760                 765
Met Pro Asn Gly Ser Leu Gly Glu Leu Leu His Gly Ser Lys Gly Gly
    770                 775                 780
His Leu Gln Trp Glu Thr Arg His Arg Val Ala Val Glu Ala Ala Lys
785                 790                 795                 800
Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Leu Ile Leu His Arg
                805                 810                 815
Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ser Asp Phe Glu Ala His
            820                 825                 830
Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Val Asp Gly Ala Ala Ser
        835                 840                 845
Glu Cys Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu
    850                 855                 860
Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val Tyr Ser Phe
865                 870                 875                 880
Gly Val Val Leu Leu Glu Leu Ile Ala Gly Lys Lys Pro Val Gly Glu
                885                 890                 895
Phe Gly Glu Gly Val Asp Ile Val Arg Trp Val Arg Asn Thr Glu Glu
            900                 905                 910
Glu Ile Thr Gln Pro Ser Asp Ala Ala Ile Val Val Ala Ile Val Asp
        915                 920                 925
Pro Arg Leu Thr Gly Tyr Pro Leu Thr Ser Val Ile His Val Phe Lys
    930                 935                 940
Ile Ala Met Met Cys Val Glu Glu Glu Ala Ala Ala Arg Pro Thr Met
945                 950                 955                 960
Arg Glu Val Val His Met Leu Thr Asn Pro Pro Lys Ser Val Ala Asn
                965                 970                 975
Leu Ile Ala Phe
     980
<210>213
<211>2964
<212>DNA
<213>欧洲油菜
<400>213
atggcgatga gacttttgaa gactcacctt ctgtttctcc atcttcacta cgttatctcg     60
attttgcttc tatctttctc accatgcttc gcttccactg acatggacca tctcctcacc    120
ctcaaatcgt ccatggtcgg ccccaacggc cacggcctcc acgactgggt tcgctcccct    180
tctccctcag ctcactgttc tttctccggc gtttcctgcg acggcgacgc tcgtgtcatc    240
tccctcaacg tctctttcac tcctctcttc ggaaccatct ccccggagat tgggatgctg    300
gaccgtctcg tgaatctgac gttagctgct aataatttct ccggtatgct cccgttggag    360
atgaagagtc tcacttctct aaaggttctc aacatctcca acaacgtgaa cctcaacgga    420
accttccccg gagagattct cactcccatg gtcgacctcg aagtcctcga cgcgtacaac    480
aacaacttca caggcccact accgccggag atccccgggc tcaagaagct gagacacctc    540
tctctcggag gaaacttctt aaccggagaa atcccagaga gttacggaga tatccagagc    600
ttggagtatc ttggcctcaa cggagccgga ctctccggcg aatctccggc gttcttgtct    660
cgcctcaaga atcttaaaga aatgtacgtc ggctacttca acagctacac cggcggcgta    720
ccgccggagt tcggtgaatt gacaaaccta gaggttctcg acatggcgag ctgtacactc    780
acgggagaga ttccgacgac tctgagtaat ctaaaacatt tgcacacttt gtttctccac    840
atcaacaact taaccggaaa catccctccg gaactctccg gtttaatcag cttaaaatct    900
ctagacctct caataaacca gctaaccgga gagattcctc agagcttcat ctccctctgg    960
aacatcactc tcgtcaacct cttcagaaac aatctccacg ggcccatacc tgagttcatc   1020
ggagacatgc cgaacctcca agtcctccag gtgtgggaga acaacttcac gctagagcta   1080
ccggcgaatc tcggccggaa cgggaatctg aaaaagctcg acgtctctga taaccatctc   1140
accggactca tccccatgga tttgtgcaga ggcgggaagc tggagacgct ggtgctctcc   1200
gacaacttct tcttcggctc gatccctgag aagctaggtc gatgcaaatc gctaaacaag   1260
atcagaatcg tcaagaatct cctcaacggt acggttccgg cgggactatt cactctaccg   1320
ctcgttacca tcatcgagct caccgataac ttcttctccg gggagcttcc gggggagatg    1380
tcaggcgacc ttctcgatca tatctactta tctaacaatt ggtttaccgg tttaatcccc    1440
ccggctatcg gtaattttaa aaatctacag gatttattct tagaccggaa ccggtttagc    1500
gggaatattc cgagagaagt tttcgagtta aagcatctca ctaagatcaa cacgagtgct    1560
aacaacctca ccggcgacat ccctgactcg atctcgcgat gcacttcctt aatctccgtc    1620
gatctcagcc gtaaccgaat cggcggagat atcccgaaag acatccacga cgtgattaac    1680
ttaggaactc tcaatctctc cgggaatcaa ctcaccggct cgatcccgat cggaatcggg    1740
aagatgacga gcttaaccac tctcgatctc tccttcaacg acctctcggg gcgagtccca    1800
ctcggcggcc agttcctagt cttcaacgac acttccttcg ccggaaaccc ttacctctgc    1860
ctccctcgcc acgtctcgtg cctcacgcgt cccggccaaa cctccgatcg catccacacg    1920
gcgctgttct cgccgtcgag gatcgccatc acgataatcg cagcggtcac ggcgctgatc    1980
ctcatcagcg tcgcgattcg tcagatgaac aagaagaagc acgagagatc cctctcctgg    2040
aagctaaccg ccttccagcg gctcgatttc aaggcggaag acgtcctcga gtgcctccaa    2100
gaggagaaca taatcggcaa aggcggagcg gggatcgtct accgcggatc catgccgaac    2160
aacgtagacg tcgcgatcaa acgcctcgtg ggacgcggaa cagggaggag cgatcacgga    2220
ttcacggcgg agattcagac gctagggagg atccgccacc gtcacatcgt gagactcctc    2280
ggatacgtgg cgaacaggga cacgaacctg cttctctacg agtacatgcc taacgggagc    2340
ctcggcgagc ttttgcacgg gtctaaagga ggtcatcttc agtgggagac gaggcacaga    2400
gtagccgttg aagcggcgaa aggactgtgt tatcttcacc atgactgttc gccgttgatc    2460
ttgcatagag acgttaagtc caataacatt ttactggact ctgattttga ggcccatgtt    2520
gctgattttg ggcttgctaa gttcttactg gacggtgctg cttccgagtg tatgtcttcg    2580
atagctggat cctatggata catcgctcca gagtatgctt acactctcaa agtggatgag    2640
aagagtgatg tttatagttt tggagtggtg ttattggagc tgatagctgg gaagaaaccg    2700
gttggtgagt ttggggaagg agtggatata gtgaggtggg tgaggaacac ggagggtgag    2760
atacctcagc cgtcggatgc agctactgtt gttgcgatcg tcgaccagag gttgactggt    2820
tacccgttga ctagtgtgat tcacgtgttc aagatagcga tgatgtgtgt ggaggatgag    2880
gcaacgacaa ggccgacgat gagggaagtt gtgcacatgc tcactaaccc tcccaagtcc  2940
gtgactaact tgatcgcctt ctga                                         2964
<210>214
<211>987
<212>PRT
<213>欧洲油菜
<400>214
Met Ala Met Arg Leu Leu Lys Thr His Leu Leu Phe Leu His Leu His
1               5                  10                  15
Tyr Val Ile Ser Ile Leu Leu Leu Ser Phe Ser Pro Cys Phe Ala Ser
            20                  25                  30
Thr Asp Met Asp His Leu Leu Thr Leu Lys Ser Ser Met Val Gly Pro
        35                  40                  45
Asn Gly His Gly Leu His Asp Trp Val Arg Ser Pro Ser Pro Ser Ala
    50                  55                  60
His Cys Ser Phe Ser Gly Val Ser Cys Asp Gly Asp Ala Arg Val Ile
65                  70                  75                  80
Ser Leu Asn Val Ser Phe Thr Pro Leu Phe Gly Thr Ile Ser Pro Glu
                85                  90                  95
Ile Gly Met Leu Asp Arg Leu Val Asn Leu Thr Leu Ala Ala Asn Asn
            100                 105                 110
Phe Ser Gly Met Leu Pro Leu Glu Met Lys Ser Leu Thr Ser Leu Lys
        115                 120                 125
Val Leu Asn Ile Ser Asn Asn Val Asn Leu Asn Gly Thr Phe Pro Gly
    130                 135                 140
Glu Ile Leu Thr Pro Met Val Asp Leu Glu Val Leu Asp Ala Tyr Asn
145                 150                 155                 160
Asn Asn Phe Thr Gly Pro Leu Pro Pro Glu Ile Pro Gly Leu Lys Lys
                165                 170                 175
Leu Arg His Leu Ser Leu Gly Gly Asn Phe Leu Thr Gly Glu Ile Pro
            180                 185                 190
Glu Ser Tyr Gly Asp Ile Gln Ser Leu Glu Tyr Leu Gly Leu Asn Gly
        195                 200                 205
Ala Gly Leu Ser Gly Glu Ser Pro Ala Phe Leu Ser Arg Leu Lys Asn
    210                 215                 220
Leu Lys Glu Met Tyr Val Gly Tyr Phe Asn Ser Tyr Thr Gly Gly Val
225                 230                 235                 240
Pro Pro Glu Phe Gly Glu Leu Thr Asn Leu Glu Val Leu Asp Met Ala
                245                 250                 255
Ser Cys Thr Leu Thr Gly Glu Ile Pro Thr Thr Leu Ser Asn Leu Lys
            260                 265                 270
His Leu His Thr Leu Phe Leu His Ile Asn Asn Leu Thr Gly Asn Ile
        275                 280                 285
Pro Pro Glu Leu Ser Gly Leu Ile Ser Leu Lys Ser Leu Asp Leu Ser
    290                 295                 300
Ile Asn Gln Leu Thr Gly Glu Ile Pro Gln Ser Phe Ile Ser Leu Trp
305                 310                 315                 320
Asn Ile Thr Leu Val Asn Leu Phe Arg Asn Asn Leu His Gly Pro Ile
                325                 330                 335
Pro Glu Phe Ile Gly Asp Met Pro Asn Leu Gln Val Leu Gln Val Trp
            340                 345                 350
Glu Asn Asn Phe Thr Leu Glu Leu Pro Ala Asn Leu Gly Arg Asn Gly
        355                 360                 365
Asn Leu Lys Lys Leu Asp Val Ser Asp Asn His Leu Thr Gly Leu Ile
    370                 375                 380
Pro Met Asp Leu Cys Arg Gly Gly Lys Leu Glu Thr Leu Val Leu Ser
385                 390                 395                 400
Asp Asn Phe Phe Phe Gly Ser Ile Pro Glu Lys Leu Gly Arg Cys Lys
                405                 410                 415
Ser Leu Asn Lys Ile Arg Ile Val Lys Asn Leu Leu Asn Gly Thr Val
            420                 425                 430
Pro Ala Gly Leu Phe Thr Leu Pro Leu Val Thr Ile Ile Glu Leu Thr
        435                 440                 445
Asp Asn Phe Phe Ser Gly Glu Leu Pro Gly Glu Met Ser Gly Asp Leu
    450                 455                 460
Leu Asp His Ile Tyr Leu Ser Asn Asn Trp Phe Thr Gly Leu Ile Pro
465                 470                 475                 480
Pro Ala Ile Gly Asn Phe Lys Asn Leu Gln Asp Leu Phe Leu Asp Arg
        485                 490                 495
Asn Arg Phe Ser Gly Asn Ile Pro Arg Glu Val Phe Glu Leu Lys His
            500                 505                 510
Leu Thr Lys Ile Asn Thr Ser Ala Asn Asn Leu Thr Gly Asp Ile Pro
        515                 520                 525
Asp Ser Ile Ser Arg Cys Thr Ser Leu Ile Ser Val Asp Leu Ser Arg
    530                 535                 540
Asn Arg Ile Gly Gly Asp Ile Pro Lys Asp Ile His Asp Val Ile Asn
545                 550                 555                 560
Leu Gly Thr Leu Asn Leu Ser Gly Asn Gln Leu Thr Gly Ser Ile Pro
                565                 570                 575
Ile Gly Ile Gly Lys Met Thr Ser Leu Thr Thr Leu Asp Leu Ser Phe
            580                 585                 590
Asn Asp Leu Ser Gly Arg Val Pro Leu Gly Gly Gln Phe Leu Val Phe
        595                 600                 605
Asn Asp Thr Ser Phe Ala Gly Asn Pro Tyr Leu Cys Leu Pro Arg His
    610                 615                 620
Val Ser Cys Leu Thr Arg Pro Gly Gln Thr Ser Asp Arg Ile His Thr
625                 630                 635                 640
Ala Leu Phe Ser Pro Ser Arg Ile Ala Ile Thr Ile Ile Ala Ala Val
                645                 650                 655
Thr Ala Leu Ile Leu Ile Ser Val Ala Ile Arg Gln Met Asn Lys Lys
            660                 665                 670
Lys His Glu Arg Ser Leu Ser Trp Lys Leu Thr Ala Phe Gln Arg Leu
        675                 680                 685
Asp Phe Lys Ala Glu Asp Val Leu Glu Cys Leu Gln Glu Glu Asn Ile
    690                 695                 700
Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro Asn
705                 710                 715                 720
Asn Val Asp Val Ala Ile Lys Arg Leu Val Gly Arg Gly Thr Gly Arg
                725                 730                 735
Ser Asp His Gly Phe Thr Ala Glu Ile Gln Thr Leu Gly Arg Ile Arg
            740                 745                 750
His Arg His Ile Val Arg Leu Leu Gly Tyr Val Ala Asn Arg Asp Thr
        755                 760                 765
Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Leu
    770                 775                 780
Leu His Gly Ser Lys Gly Gly His Leu Gln Trp Glu Thr Arg His Arg
785                 790                 795                 800
Val Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys
               805                 810                 815
Ser Pro Leu Ile Leu His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu
            820                 825                 830
Asp Ser Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe
        835                 840                 845
Leu Leu Asp Gly Ala Ala Ser Glu Cys Met Ser Ser Ile Ala Gly Ser
    850                 855                 860
Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu
865                 870                 875                 880
Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu Leu Ile Ala
                885                 890                 895
Gly Lys Lys Pro Val Gly Glu Phe Gly Glu Gly Val Asp Ile Val Arg
            900                 905                 910
Trp Val Arg Asn Thr Glu Gly Glu Ile Pro Gln Pro Ser Asp Ala Ala
        915                 920                 925
Thr Val Val Ala Ile Val Asp Gln Arg Leu Thr Gly Tyr Pro Leu Thr
    930                 935                 940
Ser Val Ile His Val Phe Lys Ile Ala Met Met Cys Val Glu Asp Glu
945                 950                 955                 960
Ala Thr Thr Arg Pro Thr Met Arg Glu Val Val His Met Leu Thr Asn
                965                 970                 975
Pro Pro Lys Ser Val Thr Asn Leu Ile Ala Phe
            980                 985
<210>215
<211>2925
<212>DNA
<213>大桉(Eucalyptus grandis)
<400>215
atggcggcga cggcggcgaa accgccctgc aagcccgctt cctacttctg cttctcctcc     60
tccttctgcc tcctcctctt cgtctcggct tccctcgcgc agagcgacct cgacgtgctc    120
ctgcagctca gggccgccct ggccgcgccc aactcgaccg ccctccacga ctgggtcggc    180
ccctcctcct cctcctcatc ctcctcgtcg ccgccgccct ttccgcattg ctccttcacc     240
ggggtcacgt gcgacgccgg ctcccgggtc gtgtctctca acctcactga cgtccgcctc     300
ttcggccgcg tcccccgcga aatcggcctc ctccgcgacc tcgtcaacct cacgctcacc     360
agctgcaacc tctcggggac cctcccgccg gagctcggca acctgaccga gctcgaagtc     420
ctcgacgtgt acgacaacaa cttcacggcc cagctgccgc cggaggtggt ggggctgaag     480
aagctgaagt ggctcaacct cgccggcaat tacttcttcg gcgagatacc ggaggtttac     540
tcggagatgg agagcctgga gtacctgggc ctgcaggcga accagctgag cggcagagtc     600
ccggcgagcc tcgcgaagct gaagaacctc cagtggctct acctgggcta cttcaacacg     660
tacgatggcg agattccggc ggagttcggg tctatgaaag agctcagacg cctcgacttg     720
gcgagctgcg gcctctccgg cgagattccg gtgagcctga gcgagctaaa gaagttagac     780
tctctgttcc tccagtggaa caacctcatg ggcgttatcc cccccgagct ctcgaagatg     840
ttgagcctca tgtccctcga cctctccaac aattacctca ctggagtgat tccggcgacc     900
ttcgccgaac tcaagaacct gactctgctc aacctgttcg cgaaccacct ggaaggccag     960
atccccgagt tcgtgggcga gcttccgaac ctggagaccc tccaggtttg gggcaacaac    1020
ttcacgatga tgttgccagc gggcctaggg aggaacggga ggctgctata cgtcgacgtc    1080
acgcagaacc acttcaccgg cacgatccct cgggaattgt gccggggagg gaggctcaag    1140
actctgatcc tgaccaacaa ctcgttcttt gggcccatcc ctgatgaatt cggggagtgc    1200
aagtcgctga ccaaagtccg agtcggcaag aactttctcg acgggacgat tcctcggggg    1260
atcttcaacc tgccgcaagc aactataatc gagcttaacg acaatctctt ctccggcgag    1320
ctcccggcgc agatgtccgg cgagaacttg gtcatcctgt cgctctcgaa caaccggatt    1380
tccggtgaga tccctccggc gattggcaac ttcagcggcc tgcgtactct gttactggac    1440
gcgaacaggt tctccggcaa gattcccagc gagcttttct cgccgaggtt cctactgagg    1500
gtgaacatca gcgggaacag catcagcggc aggattcctg gttcggtcac tgggtgcact    1560
tctctggcag cccttgattt gagcaggaac aatctcgctg gcgagattcc gaacggcttg    1620
tctagcctga aagtgttggc cgtcctcaat ctgtcgagca acagattgac cggtccagtt    1680
ccaaaggaaa ttggcatcat gaccagcctc aatacgctcg atttgtcctt caacgatctc    1740
tccggcgaag tcccccacga aggccagttc ctcgtcttca agaactcctc cttcgccgga  1800
aaccagaaac tctgctcgcc aggccgcttc tcttgccctt cgcggtcaag tgcctcgcgc  1860
acttcctcga gggttgtgat cacggcaatc tcactcgtga ccgcggcgct gctcatcacc  1920
gtcacggtct accaggtcct gaagaggagg cggcagggct cgagagcctg gaagctcact  1980
gccttccaga agctcggctt caaggccgag gacgtgctca agtgcctgga ggaggagaat  2040
atcatcggca aaggtggcgc ggggatcgtc taccgcgggt cgatgcccaa cgggacggac  2100
gtcgccatca agcagctggc gggacggggc ggcaacgggc tcagcgacca cggcttctcc  2160
gcggagattc agaccctcgg tcggatccgg caccggaaca tcgtgaggct cctcggatac  2220
ctctccaaca aggacaccaa cctgttgctg tacgagtaca tgcccaatgg gagcttaggg  2280
gagctgttgc atggttcgaa aggcggccac ttgcagtggg agacgcggta tcggatcgcc  2340
gtggaggccg cgaaggggct gtgctacctc caccacgatt gcttgccgct gataattcat  2400
cgagacgtga agtcgaacaa cattctgctg gattcggact tcgaggcgca cgtcgctgat  2460
ttcgggctgg ccaagttctt gcaggacgcc ggcgcatcgg agtgcatgtc gtccgtggcc  2520
ggttcctacg gctacatagc cccagaatac gcctacacgc tgaaagtgga cgagaagagc  2580
gacgtgtaca gcttcggggt cgtgctgctg gagctgatag ccgggaggaa gccggtgggg  2640
gagtttggcg acggcgtgga catcgtgagg tgggtgaaga ccgcgtcgga ccccctcccg  2700
cagccgccgt cggacgcggc cttggtgctg gccgtgatcg accgcaggct gggcgggtac  2760
cccatcgcga gcgtgatcca cctcttcaag atcgcgtgcc ggtgcgtcga ggaggagagt  2820
tccgagaggc ccaccatgag agaagtcgtc cacatgctga caaacccgcc tctgtccgcc  2880
accaccttcg ccgtcggcgc caccccggac ctcatcaaac tgtag                  2925
<210>216
<211>974
<212>PRT
<213>大桉
<400>216
Met Ala Ala Thr Ala Ala Lys Pro Pro Cys Lys Pro Ala Ser Tyr Phe
1               5                   10                  15
Cys Phe Ser Ser Ser Phe Cys Leu Leu Leu Phe Val Ser Ala Ser Leu
             20                  25                  30
Ala Gln Ser Asp Leu Asp Val Leu Leu Gln Leu Arg Ala Ala Leu Ala
        35                  40                  45
Ala Pro Asn Ser Thr Ala Leu His Asp Trp Val Gly Pro Ser Ser Ser
    50                  55                  60
Ser Ser Ser Ser Ser Ser Pro Pro Pro Phe Pro His Cys Ser Phe Thr
65                  70                  75                  80
Gly Val Thr Cys Asp Ala Gly Ser Arg Val Val Ser Leu Asn Leu Thr
                85                  90                  95
Asp Val Arg Leu Phe Gly Arg Val Pro Arg Glu Ile Gly Leu Leu Arg
            100                 105                 110
Asp Leu Val Asn Leu Thr Leu Thr Ser Cys Asn Leu Ser Gly Thr Leu
        115                 120                 125
Pro Pro Glu Leu Gly Asn Leu Thr Glu Leu Glu Val Leu Asp Val Tyr
    130                 135                 140
Asp Asn Asn Phe Thr Ala Gln Leu Pro Pro Glu Val Val Gly Leu Lys
145                 150                 155                 160
Lys Leu Lys Trp Leu Asn Leu Ala Gly Asn Tyr Phe Phe Gly Glu Ile
                165                 170                 175
Pro Glu Val Tyr Ser Glu Met Glu Ser Leu Glu Tyr Leu Gly Leu Gln
            180                 185                 190
Ala Asn Gln Leu Ser Gly Arg Val Pro Ala Ser Leu Ala Lys Leu Lys
        195                 200                 205
Asn Leu Gln Trp Leu Tyr Leu Gly Tyr Phe Asn Thr Tyr Asp Gly Glu
    210                 215                 220
Ile Pro Ala Glu Phe Gly Ser Met Lys Glu Leu Arg Arg Leu Asp Leu
225                 230                 235                 240
Ala Ser Cys Gly Leu Ser Gly Glu Ile Pro Val Ser Leu Ser Glu Leu
                245                 250                 255
Lys Lys Leu Asp Ser Leu Phe Leu Gln Trp Asn Asn Leu Met Gly Val
            260                 265                 270
Ile Pro Pro Glu Leu Ser Lys Met Leu Ser Leu Met Ser Leu Asp Leu
        275                 280                 285
Ser Asn Asn Tyr Leu Thr Gly Val Ile Pro Ala Thr Phe Ala Glu Leu
    290                 295                 300
Lys Asn Leu Thr Leu Leu Asn Leu Phe Ala Asn His Leu Glu Gly Gln
305                 310                 315                 320
Ile Pro Glu Phe Val Gly Glu Leu Pro Asn Leu Glu Thr Leu Gln Val
                325                 330                 335
Trp Gly Asn Asn Phe Thr Met Met Leu Pro Ala Gly Leu Gly Arg Asn
            340                 345                 350
Gly Arg Leu Leu Tyr Val Asp Val Thr Gln Asn His Phe Thr Gly Thr
        355                 360                 365
Ile Pro Arg Glu Leu Cys Arg Gly Gly Arg Leu Lys Thr Leu Ile Leu
    370                 375                 380
Thr Asn Asn Ser Phe Phe Gly Pro Ile Pro Asp Glu Phe Gly Glu Cys
385                 390                 395                 400
Lys Ser Leu Thr Lys Val Arg Val Gly Lys Asn Phe Leu Asp Gly Thr
                405                 410                 415
Ile Pro Arg Gly Ile Phe Asn Leu Pro Gln Ala Thr Ile Ile Glu Leu
            420                 425                 430
Asn Asp Asn Leu Phe Ser Gly Glu Leu Pro Ala Gln Met Ser Gly Glu
        435                 440                 445
Asn Leu Val Ile Leu Ser Leu Ser Asn Asn Arg Ile Ser Gly Glu Ile
    450                 455                 460
Pro Pro Ala Ile Gly Asn Phe Ser Gly Leu Arg Thr Leu Leu Leu Asp
465                 470                 475                 480
Ala Asn Arg Phe Ser Gly Lys Ile Pro Ser Glu Leu Phe Ser Pro Arg
                485                 490                 495
Phe Leu Leu Arg Val Asn Ile Ser Gly Asn Ser Ile Ser Gly Arg Ile
            500                 505                 510
Pro Gly Ser Val Thr Gly Cys Thr Ser Leu Ala Ala Leu Asp Leu Ser
        515                 520                 525
Arg Asn Asn Leu Ala Gly Glu Ile Pro Asn Gly Leu Ser Ser Leu Lys
    530                 535                 540
Val Leu Ala Val Leu Asn Leu Ser Ser Asn Arg Leu Thr Gly Pro Val
545                 550                 555                 560
Pro Lys Glu Ile Gly Ile Met Thr Ser Leu Asn Thr Leu Asp Leu Ser
                565                 570                 575
Phe Asn Asp Leu Ser Gly Glu Val Pro His Glu Gly Gln Phe Leu Val
            580                 585                 590
Phe Lys Asn Ser Ser Phe Ala Gly Asn Gln Lys Leu Cys Ser Pro Gly
        595                 600                 605
Arg Phe Ser Cys Pro Ser Arg Ser Ser Ala Ser Arg Thr Ser Ser Arg
    610                 615                 620
Val Val Ile Thr Ala Ile Ser Leu Val Thr Ala Ala Leu Leu Ile Thr
625                 630                 635                 640
Val Thr Val Tyr Gln Val Leu Lys Arg Arg Arg Gln Gly Ser Arg Ala
                645                 650                 655
Trp Lys Leu Thr Ala Phe Gln Lys Leu Gly Phe Lys Ala Glu Asp Val
            660                 665                 670
Leu Lys Cys Leu Glu Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly
        675                 680                 685
Ile Val Tyr Arg Gly Ser Met Pro Asn Gly Thr Asp Val Ala Ile Lys
    690                 695                 700
Gln Leu Ala Gly Arg Gly Gly Asn Gly Leu Ser Asp His Gly Phe Ser
705                 710                 715                 720
Ala Glu Ile Gln Thr Leu Gly Arg Ile Arg His Arg Asn Ile Val Arg
                725                 730                 735
Leu Leu Gly Tyr Leu Ser Asn Lys Asp Thr Asn Leu Leu Leu Tyr Glu
            740                 745                 750
Tyr Met Pro Asn Gly Ser Leu Gly Glu Leu Leu His Gly Ser Lys Gly
        755                 760                 765
Gly His Leu Gln Trp Glu Thr Arg Tyr Arg Ile Ala Val Glu Ala Ala
    770                 775                 780
Lys Gly Leu Cys Tyr Leu His His Asp Cys Leu Pro Leu Ile Ile His
785                 790                 795                 800
Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ser Asp Phe Glu Ala
                805                 810                 815
His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Gln Asp Ala Gly Ala
            820                 825                 830
Ser Glu Cys Met Ser Ser Val Ala Gly Ser Tyr Gly Tyr Ile Ala Pro
        835                 840                 845
Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val Tyr Ser
    850                 855                 860
Phe Gly Val Val Leu Leu Glu Leu Ile Ala Gly Arg Lys Pro Val Gly
865                 870                 875                 880
Glu Phe Gly Asp Gly Val Asp Ile Val Arg Trp Val Lys Thr Ala Ser
                885                 890                 895
Asp Pro Leu Pro Gln Pro Pro Ser Asp Ala Ala Leu Val Leu Ala Val
            900                 905                 910
Ile Asp Arg Arg Leu Gly Gly Tyr Pro Ile Ala Ser Val Ile His Leu
        915                 920                 925
Phe Lys Ile Ala Cys Arg Cys Val Glu Glu Glu Ser Ser Glu Arg Pro
    930                 935                 940
Thr Met Arg Glu Val Val His Met Leu Thr Asn Pro Pro Leu Ser Ala
945                 950                 955                 960
Thr Thr Phe Ala Val Gly Ala Thr Pro Asp Leu Ile Lys Leu
                965                 970
<210>217
<211>2946
<212>DNA
<213>大豆
<400>217
atgagaagct gtgtgtgtta cacgctttta ttgtttgttt tcttcatatg gctacacgtg     60
gcaacgtgtt cttcgttcag tgacatggat gcgctgctga agctgaagga gtccatgaag    120
ggagacagag ccaaagacga cgcgctccat gactggaagt tttccacgtc gctttctgca    180
cactgtttct tttcaggtgt atcttgcgac caagaacttc gagttgttgc tatcaacgtc    240
tcctttgttc ctctcttcgg ccacgttccg ccggagatcg gagaattgga caaacttgaa    300
aacctcacca tctcgcagaa caacctcacc ggcgaacttc ccaaggagct cgccgccctc    360
acttccctca agcacctcaa catctctcac aacgtcttct ccggctattt tcccggcaaa    420
ataattcttc cgatgaccga actcgaggtc ctcgacgtct acgacaacaa cttcaccgga    480
tcgcttccgg aagagttcgt gaaactggag aaattgaaat acctgaagct cgacggaaac    540
tatttctccg gaagcatacc ggagagttac tcggagttta agagcttgga gtttttaagc    600
ttaagcacca atagcttatc ggggaatatt ccgaagagtt tgtctaagtt gaagacgctg    660
aggattctca agctcggata caacaacgct tacgaaggcg gaattccacc ggagttcggc    720
accatggaat ctctgaaata ccttgacctc tcaagctgca acctcagcgg cgagattcca     780
ccgagtctag caaatatgag aaacctcgac acgttgttct tgcaaatgaa taacctcacc     840
ggaaccattc cgtctgagct ctccgacatg gtgagcctca tgtcactgga tctctccttc     900
aacggcctca ccggggagat accgacgcgc ttctctcagc tgaaaaacct cactctgatg     960
aacttcttcc acaacaatct ccgaggctca gttccctcct tcgtcggcga gcttcctaat    1020
ctggaaacgc tgcagctctg ggagaacaat ttctcctctg agctcccgca gaacctgggg    1080
caaaacggga agttcaagtt cttcgacgtc acgaagaatc acttcagcgg gttgatccct    1140
cgggatttgt gcaagagtgg gaggttacaa acgttcttga tcacagataa cttcttccat    1200
ggtccaatcc ctaacgagat tgctaactgc aagtctctaa ccaagatccg agcctccaat    1260
aactacctta acggcgcagt tccgtcaggg attttcaagc taccttccgt cacgataatc    1320
gagttggcca ataaccgttt taacggagaa ctgcctcccg aaatttccgg cgattcactc    1380
gggattctca ctctttccaa caacttattc actgggaaaa ttcccccagc gttgaagaac    1440
ttaagggcac tgcagactct gtcacttgac acgaacgaat tccttggaga aatcccgggg    1500
gaggtttttg acctaccaat gctgactgtg gtcaacataa gcggcaacaa tctcaccgga    1560
ccaatcccaa cgacgtttac tcgctgcgtt tcactcgccg ccgttgatct tagccggaac    1620
atgcttgacg gggagattcc caaggggatg aaaaacctaa cggatttaag cattttcaat    1680
gtgtcgataa accaaatctc agggtcagtc ccagacgaga ttcgcttcat gttgagtctc    1740
accacgctgg atctctccta caacaatttc atcggcaagg tccctaccgg tggtcagttt    1800
ttggtcttca gcgacaaatc ctttgcaggg aacccgaatc tctgtagttc ccactcttgc    1860
cctaattcct cgttgaagaa gagacgcggc ccttggagtt tgaaatcgac gagggtgatc    1920
gtcatggtga ttgcactggc cactgcggcg attctcgtgg cggggacgga gtacatgagg    1980
aggaggagga agctgaagct tgcgatgacg tggaagctga cggggttcca gcggctgaac    2040
ttgaaagccg aggaggtggt ggagtgtcta aaagaagaga acataatagg aaaaggagga    2100
gcagggatcg tgtaccgcgg gtccatgaga aacggaagcg acgtggcaat aaagcggttg    2160
gttggagcgg ggagtggaag gaacgattac gggttcaaag cggagataga gacggtgggg    2220
aagataaggc acaggaacat aatgaggctt ttgggttacg tgtcgaacaa ggagacgaac    2280
ttgcttctgt atgagtacat gccgaatggg agcttagggg agtggctgca tggtgccaag  2340
ggaggtcatt taaagtggga aatgaggtac aagattgcgg tggaagctgc aaagggacta  2400
tgctatttgc accatgattg ttcccctctt atcattcaca gggatgtcaa gtctaataat  2460
atattgctcg atgctcactt tgaggctcat gttgctgatt ttggccttgc caagttcttg  2520
tacgaccttg gctcctctca gtccatgtcc tccattgctg gctcctacgg ctacattgct  2580
ccagagtatg cttacacttt gaaagtggac gagaaaagtg atgtgtacag ctttggcgtg  2640
gtgctgttgg aactgataat agggaggaag ccagttggtg agtttggaga cggggtggac  2700
atcgttggat gggtcaacaa aacgagattg gagctctctc agccgtcgga tgcagcagta  2760
gtgttggcag tggtggaccc aaggcttagt gggtatccat tgataagtgt catttacatg  2820
ttcaacatag ctatgatgtg tgttaaagaa gtggggccca ctaggcctac catgagggaa  2880
gtagttcata tgctctcaaa tcctcctcac tttaccactc acactcacaa cctaattaat  2940
ctctag                                                             2946
<210>218
<211>981
<212>PRT
<213>大豆
<400>218
Met Arg Ser Cys Val Cys Tyr Thr Leu Leu Leu Phe Val Phe Phe Ile
1               5                   10                  15
Trp Leu His Val Ala Thr Cys Ser Ser Phe Ser Asp Met Asp Ala Leu
            20                  25                  30
Leu Lys Leu Lys Glu Ser Met Lys Gly Asp Arg Ala Lys Asp Asp Ala
        35                  40                  45
Leu His Asp Trp Lys Phe Ser Thr Ser Leu Ser Ala His Cys Phe Phe
    50                  55                  60
Ser Gly Val Ser Cys Asp Gln Glu Leu Arg Val Val Ala Ile Asn Val
65                  70                  75                  80
Ser Phe Val Pro Leu Phe Gly His Val Pro Pro Glu Ile Gly Glu Leu
                85                  90                  95
Asp Lys Leu Glu Asn Leu Thr Ile Ser Gln Asn Asn Leu Thr Gly Glu
            100                 105                 110
Leu Pro Lys Glu Leu Ala Ala Leu Thr Ser Leu Lys His Leu Asn Ile
        115                 120                 125
Ser His Asn Val Phe Ser Gly Tyr Phe Pro Gly Lys Ile Ile Leu Pro
    130                 135                 140
Met Thr Glu Leu Glu Val Leu Asp Val Tyr Asp Asn Asn Phe Thr Gly
145                 150                 155                 160
Ser Leu Pro Glu Glu Phe Val Lys Leu Glu Lys Leu Lys Tyr Leu Lys
                165                 170                 175
Leu Asp Gly Asn Tyr Phe Ser Gly Ser Ile Pro Glu Ser Tyr Ser Glu
            180                 185                 190
Phe Lys Ser Leu Glu Phe Leu Ser Leu Ser Thr Asn Ser Leu Ser Gly
        195                 200                 205
Asn Ile Pro Lys Ser Leu Ser Lys Leu Lys Thr Leu Arg Ile Leu Lys
    210                 215                 220
Leu Gly Tyr Asn Asn Ala Tyr Glu Gly Gly Ile Pro Pro Glu Phe Gly
225                 230                 235                 240
Thr Met Glu Ser Leu Lys Tyr Leu Asp Leu Ser Ser Cys Asn Leu Ser
                245                 250                 255
Gly Glu Ile Pro Pro Ser Leu Ala Asn Met Arg Asn Leu Asp Thr Leu
            260                 265                 270
Phe Leu Gln Met Asn Asn Leu Thr Gly Thr Ile Pro Ser Glu Leu Ser
        275                 280                 285
Asp Met Val Ser Leu Met Ser Leu Asp Leu Ser Phe Asn Gly Leu Thr
    290                 295                 300
Gly Glu Ile Pro Thr Arg Phe Ser Gln Leu Lys Asn Leu Thr Leu Met
305                 310                 315                 320
Asn Phe Phe His Asn Asn Leu Arg Gly Ser Val Pro Ser Phe Val Gly
                325                 330                 335
Glu Leu Pro Asn Leu Glu Thr Leu Gln Leu Trp Glu Asn Asn Phe Ser
            340                 345                 350
Ser Glu Leu Pro Gln Asn Leu Gly Gln Asn Gly Lys Phe Lys Phe Phe
        355                 360                 365
Asp Val Thr Lys Asn His Phe Ser Gly Leu Ile Pro Arg Asp Leu Cys
    370                 375                 380
Lys Ser Gly Arg Leu Gln Thr Phe Leu Ile Thr Asp Asn Phe Phe His
385                 390                 395                 400
Gly Pro Ile Pro Asn Glu Ile Ala Asn Cys Lys Ser Leu Thr Lys Ile
                405                 410                 415
Arg Ala Ser Asn Asn Tyr Leu Asn Gly Ala Val Pro Ser Gly Ile Phe
            420                 425                 430
Lys Leu Pro Ser Val Thr Ile Ile Glu Leu Ala Asn Asn Arg Phe Asn
        435                 440                 445
Gly Glu Leu Pro Pro Glu Ile Ser Gly Asp Ser Leu Gly Ile Leu Thr
    450                 455                 460
Leu Ser Asn Asn Leu Phe Thr Gly Lys Ile Pro Pro Ala Leu Lys Asn
465                 470                 475                 480
Leu Arg Ala Leu Gln Thr Leu Ser Leu Asp Thr Asn Glu Phe Leu Gly
                485                 490                 495
Glu Ile Pro Gly Glu Val Phe Asp Leu Pro Met Leu Thr Val Val Asn
            500                 505                 510
Ile Ser Gly Asn Asn Leu Thr Gly Pro Ile Pro Thr Thr Phe Thr Arg
        515                 520                 525
Cys Val Ser Leu Ala Ala Val Asp Leu Ser Arg Asn Met Leu Asp Gly
    530                 535                 540
Glu Ile Pro Lys Gly Met Lys Asn Leu Thr Asp Leu Ser Ile Phe Asn
545                 550                 555                 560
Val Ser Ile Asn Gln Ile Ser Gly Ser Val Pro Asp Glu Ile Arg Phe
                565                 570                 575
Met Leu Ser Leu Thr Thr Leu Asp Leu Ser Tyr Asn Asn Phe Ile Gly
            580                 585                 590
Lys Val Pro Thr Gly Gly Gln Phe Leu Val Phe Ser Asp Lys Ser Phe
        595                 600                 605
Ala Gly Asn Pro Asn Leu Cys Ser Ser His Ser Cys Pro Asn Ser Ser
    610                 615                 620
Leu Lys Lys Arg Arg Gly Pro Trp Ser Leu Lys Ser Thr Arg Val Ile
625                 630                 635                 640
Val Met Val Ile Ala Leu Ala Thr Ala Ala Ile Leu Val Ala Gly Thr
                645                 650                 655
Glu Tyr Met Arg Arg Arg Arg Lys Leu Lys Leu Ala Met Thr Trp Lys
            660                 665                 670
Leu Thr Gly Phe Gln Arg Leu Asn Leu Lys Ala Glu Glu Val Val Glu
        675                 680                 685
Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val
    690                 695                 700
Tyr Arg Gly Ser Met Arg Asn Gly Ser Asp Val Ala Ile Lys Arg Leu
705                 710                 715                 720
Val Gly Ala Gly Ser Gly Arg Asn Asp Tyr Gly Phe Lys Ala Glu Ile
                725                 730                 735
Glu Thr Val Gly Lys Ile Arg His Arg Asn Ile Met Arg Leu Leu Gly
            740                 745                 750
Tyr Val Ser Asn Lys Glu Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro
        755                 760                 765
Asn Gly Ser Leu Gly Glu Trp Leu His Gly Ala Lys Gly Gly His Leu
    770                 775                 780
Lys Trp Glu Met Arg Tyr Lys Ile Ala Val Glu Ala Ala Lys Gly Leu
785                 790                 795                 800
Cys Tyr Leu His His Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val
                805                 810                 815
Lys Ser Asn Asn Ile Leu Leu Asp Ala His Phe Glu Ala His Val Ala
            820                 825                 830
Asp Phe Gly Leu Ala Lys Phe Leu Tyr Asp Leu Gly Ser Ser Gln Ser
        835                 840                 845
Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala
    850                 855                 860
Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val
865                 870                 875                 880
Val Leu Leu Glu Leu Ile Ile Gly Arg Lys Pro Val Gly Glu Phe Gly
                885                 890                 895
Asp Gly Val Asp Ile Val Gly Trp Val Asn Lys Thr Arg Leu Glu Leu
            900                 905                 910
Ser Gln Pro Ser Asp Ala Ala Val Val Leu Ala Val Val Asp Pro Arg
        915                 920                 925
Leu Ser Gly Tyr Pro Leu Ile Ser Val Ile Tyr Met Phe Asn Ile Ala
    930                 935                 940
Met Met Cys Val Lys Glu Val Gly Pro Thr Arg Pro Thr Met Arg Glu
945                 950                 955                 960
Val Val His Met Leu Ser Asn Pro Pro His Phe Thr Thr His Thr His
                965                 970                 975
Asn Leu Ile Asn Leu
            980
<210>219
<211>2964
<212>DNA
<213>大豆
<400>219
atgagaagct gtgtgtgcta cacgctatta ttgtttattt tcttcatatg gctgcgcgtg   60
gcaacgtgct cttcgttcac tgacatggaa tcgcttctga agctgaagga ctccatgaaa  120
ggagataaag ccaaagacga cgctctccat gactggaagt ttttcccctc gctttctgca  180
cactgtttct tttcaggcgt aaaatgcgac cgagaacttc gagtcgttgc tatcaacgtc  240
tcgtttgttc ctctcttcgg tcaccttccg ccggagatcg gacaattgga caaactcgag  300
aacctcaccg tctcgcagaa caacctcacc ggcgtacttc ccaaggagct cgccgccctc  360
acttccctca agcacctcaa catctctcac aacgtcttct ccggccattt ccccggccaa  420
attatccttc cgatgacgaa actggaggtc ctcgacgtct acgacaacaa cttcaccgga  480
ccgcttcccg tagagttggt gaaactggag aaattaaaat acctgaagct cgacggaaac  540
tatttctccg gcagcatacc ggagagttac tcggagttta agagcttgga gtttttaagc  600
ttaagcacca atagcttatc ggggaagatt cccaagagtt tgtcgaagtt gaagacgctg  660
aggtacctaa aactcggata caacaacgct tacgaaggtg gaattccacc ggagtttggc  720
agcatgaaat ctctgagata ccttgacctc tctagctgca acctcagcgg cgagattcca  780
ccgagccttg caaatctgac aaaccttgac acgttgttcc tgcaaattaa caacctcacc  840
ggaaccattc cgtcggagct ctccgctatg gtgagcctca tgtcacttga tctctccatc  900
aacgacctca ccggtgagat accgatgagc ttctcacagc ttagaaacct cactctcatg  960
aacttcttcc aaaacaatct tcgcggctca gttccgtcct tcgtcggcga gcttccgaat 1020
ctggaaacgc tgcagctctg ggataacaac ttctccttcg tgctacctcc gaaccttggg 1080
caaaacggca agttaaagtt cttcgacgtc atcaagaatc acttcaccgg gttgatccct    1140
cgagatttgt gtaagagtgg gaggttacaa acgatcatga tcacagataa cttcttccgc    1200
ggtccaatcc ctaacgagat tggtaactgc aagtctctca ccaagatccg agcctccaat    1260
aactacctta acggcgtggt tccgtcaggg attttcaaac taccttctgt cacgataatc    1320
gagctggcca ataaccgttt taacggcgaa ctgcctcctg agatttccgg cgaatccctg    1380
gggattctca ctctttccaa caacttattc agtgggaaaa ttcccccagc gttgaagaac    1440
ttgagggcac tgcagactct ctcacttgac gcaaacgagt tcgttggaga aataccggga    1500
gaggtttttg acctaccgat gctgactgtg gtcaacataa gcggcaacaa tctaaccgga    1560
ccaatcccaa cgacgttgac tcgctgcgtt tcactcaccg ccgtggacct cagccggaac    1620
atgcttgaag ggaagattcc gaagggaatc aaaaacctca cggacttgag cattttcaat    1680
gtgtcgataa accaaatttc agggccagtc cctgaggaga ttcgcttcat gttgagtctc    1740
accacattgg atctatccaa caacaatttc atcggcaagg tcccaaccgg gggtcagttc    1800
gcggtcttca gcgagaaatc ctttgcaggg aaccccaacc tctgtacctc ccactcttgc    1860
ccgaattcct cgttgtaccc tgacgacgcc ttgaagaaga ggcgcggccc ttggagtttg    1920
aaatccacga gggtgatagt catcgtgatt gcactgggca cagccgcgct gctggtggcg    1980
gtgacggtgt acatgatgag gaggaggaag atgaaccttg cgaagacgtg gaagctgacg    2040
gcgttccagc ggctgaactt caaagccgag gacgtggtgg agtgtctgaa ggaggagaac    2100
ataataggaa aaggaggggc agggatcgtg taccgcgggt ccatgccaaa cggaacagac    2160
gtggcgataa agcggttggt tggggcgggg agtggaagga acgattacgg attcaaagcg    2220
gagatagaaa cgctggggaa gataaggcac aggaacataa tgaggctttt aggttacgtg    2280
tcgaacaagg agacgaactt gctgctgtat gagtacatgc caaatgggag cttaggggaa    2340
tggctgcatg gtgccaaagg agggcacttg aagtgggaaa tgaggtacaa gattgcggtg    2400
gaagctgcta agggactgtg ctatttgcac catgattgtt cccctcttat cattcacagg    2460
gatgtcaagt ctaataatat attgctggat ggggacttgg aggcccatgt tgctgatttt    2520
ggccttgcca agttcttgta cgaccctggc gcctctcagt ccatgtcctc cattgctggc    2580
tcctacggct acattgctcc agagtatgca tacactttga aagtggacga gaaaagtgat    2640
gtgtacagct ttggcgttgt gctgctggag ctgataatag ggaggaagcc agtgggagag  2700
tttggagacg gggtggacat cgttggatgg gtcaacaaaa cgagattgga gctcgctcag  2760
ccgtcggatg cagcgttggt gttggcagtg gtggacccaa ggttgagtgg gtatccattg  2820
acaagtgtca tttacatgtt caacatagct atgatgtgtg ttaaagaaat ggggcccgct  2880
aggcctacca tgagggaagt cgttcatatg ctctcagagc ctcctcactc tgctactcac  2940
actcacaacc taattaatct ctag                                         2964
<210>220
<211>987
<212>PRT
<213>大豆
<400>220
Met Arg Ser Cys Val Cys Tyr Thr Leu Leu Leu Phe Ile Phe Phe Ile
1               5                  10                  15
Trp Leu Arg Val Ala Thr Cys Ser Ser Phe Thr Asp Met Glu Ser Leu
            20                  25                  30
Leu Lys Leu Lys Asp Ser Met Lys Gly Asp Lys Ala Lys Asp Asp Ala
        35                  40                  45
Leu His Asp Trp Lys Phe Phe Pro Ser Leu Ser Ala His Cys Phe Phe
    50                  55                  60
Ser Gly Val Lys Cys Asp Arg Glu Leu Arg Val Val Ala Ile Asn Val
65                  70                  75                  80
Ser Phe Val Pro Leu Phe Gly His Leu Pro Pro Glu Ile Gly Gln Leu
                85                  90                  95
Asp Lys Leu Glu Asn Leu Thr Val Ser Gln Asn Asn Leu Thr Gly Val
            100                 105                 110
Leu Pro Lys Glu Leu Ala Ala Leu Thr Ser Leu Lys His Leu Asn Ile
        115                 120                 125
Ser His Asn Val Phe Ser Gly His Phe Pro Gly Gln Ile Ile Leu Pro
    130                 135                 140
Met Thr Lys Leu Glu Val Leu Asp Val Tyr Asp Asn Asn Phe Thr Gly
145                 150                 155                 160
Pro Leu Pro Val Glu Leu Val Lys Leu Glu Lys Leu Lys Tyr Leu Lys
                165                 170                 175
Leu Asp Gly Asn Tyr Phe Ser Gly Ser Ile Pro Glu Ser Tyr Ser Glu
            180                 185                 190
Phe Lys Ser Leu Glu Phe Leu Ser Leu Ser Thr Asn Ser Leu Ser Gly
        195                 200                 205
Lys Ile Pro Lys Ser Leu Ser Lys Leu Lys Thr Leu Arg Tyr Leu Lys
    210                 215                 220
Leu Gl yTyr Asn Asn Ala Tyr Glu Gly Gly Ile Pro Pro Glu Phe Gly
225                 230                 235                 240
Ser Met Lys Ser Leu Arg Tyr Leu Asp Leu Ser Ser Cys Asn Leu Ser
                245                 250                 255
Gly Glu Ile Pro Pro Ser Leu Ala Asn Leu Thr Asn Leu Asp Thr Leu
            260                 265                 270
Phe Leu Gln Ile Asn Asn Leu Thr Gly Thr Ile Pro Ser Glu Leu Ser
        275                 280                 285
Ala Met Val Ser Leu Met Ser Leu Asp Leu Ser Ile Asn Asp Leu Thr
    290                 295                 300
Gly Glu Ile Pro Met Ser Phe Ser Gln Leu Arg Asn Leu Thr Leu Met
305                 310                 315                 320
Asn Phe Phe Gln Asn Asn Leu Arg Gly Ser Val Pro Ser Phe Val Gly
                325                 330                 335
Glu Leu Pro Asn Leu Glu Thr Leu Gln Leu Trp Asp Asn Asn Phe Ser
            340                 345                 350
Phe Val Leu Pro Pro Asn Leu Gly Gln Asn Gly Lys Leu Lys Phe Phe
        355                 360                 365
Asp Val Ile Lys Asn His Phe Thr Gly Leu Ile Pro Arg Asp Leu Cys
    370                 375                 380
Lys Ser Gly Arg Leu Gln Thr Ile Met Ile Thr Asp Asn Phe Phe Arg
385                 390                 395                 400
Gly Pro Ile Pro Asn Glu Ile Gly Asn Cys Lys Ser Leu Thr Lys Ile
                405                 410                 415
Arg Ala Ser Asn Asn Tyr Leu Asn Gly Val Val Pro Ser Gly Ile Phe
            420                 425                 430
Lys Leu Pro Ser Val Thr Ile Ile Glu Leu Ala Asn Asn Arg Phe Asn
        435                 440                 445
Gly Glu Leu Pro Pro Glu Ile Ser Gly Glu Ser Leu Gly Ile Leu Thr
    450                 455                 460
Leu Ser Asn Asn Leu Phe Ser Gly Lys Ile Pro Pro Ala Leu Lys Asn
465                 470                 475                 480
Leu Arg Ala Leu Gln Thr Leu Ser Leu Asp Ala Asn Glu Phe Val Gly
                485                 490                 495
Glu Ile Pro Gly Glu Val Phe Asp Leu Pro Met Leu Thr Val Val Asn
            500                 505                 510
Ile Ser Gly Asn Asn Leu Thr Gly Pro Ile Pro Thr Thr Leu Thr Arg
        515                 520                 525
Cys Val Ser Leu Thr Ala Val Asp Leu Ser Arg Asn Met Leu Glu Gly
    530                 535                 540
Lys Ile Pro Lys Gly Ile Lys Asn Leu Thr Asp Leu Ser Ile Phe Asn
545                 550                 555                 560
Val Ser Ile Asn Gln Ile Ser Gly Pro Val Pro Glu Glu Ile Arg Phe
                565                 570                 575
Met Leu Ser Leu Thr Thr Leu Asp Leu Ser Asn Asn Asn Phe Ile Gly
            580                 585                 590
Lys Val Pro Thr Gly Gly Gln Phe Ala Val Phe Ser Glu Lys Ser Phe
        595                 600                 605
Ala Gly Asn Pro Asn Leu Cys Thr Ser His Ser Cys Pro Asn Ser Ser
    610                 615                 620
Leu Tyr Pro Asp Asp Ala Leu Lys Lys Arg Arg Gly Pro Trp Ser Leu
625                 630                 635                 640
Lys Ser Thr Arg Val Ile Val Ile Val Ile Ala Leu Gly Thr Ala Ala
                645                 650                 655
Leu Leu Val Ala Val Thr Val Tyr Met Met Arg Arg Arg Lys Met Asn
            660                 665                 670
Leu Ala Lys Thr Trp Lys Leu Thr Ala Phe Gln Arg Leu Asn Phe Lys
        675                 680                 685
Ala Glu Asp Val Val Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys
    690                 695                 700
Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro Asn Gly Thr Asp
705                 710                 715                 720
Val Ala Ile Lys Arg Leu Val Gly Ala Gly Ser Gly Arg Asn Asp Tyr
                725                 730                 735
Gly Phe Lys Ala Glu Ile Glu Thr Leu Gly Lys Ile Arg His Arg Asn
            740                 745                 750
Ile Met Arg Leu Leu Gly Tyr Val Ser Asn Lys Glu Thr Asn Leu Leu
        755                 760                 765
Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Trp Leu His Gly
    770                 775                 780
Ala Lys Gly Gly His Leu Lys Trp Glu Met Arg Tyr Lys Ile Ala Val
785                 790                 795                 800
Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Leu
                805                 810                 815
Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Gly Asp
            820                 825                 830
Leu Glu Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Tyr Asp
        835                 840                 845
Pro Gly Ala Ser Gln Ser Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr
    850                 855                 860
Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp
865                 870                 875                 880
Val Tyr Ser Phe Gly Val Val Leu Leu Glu Leu Ile Ile Gly Arg Lys
                885                 890                 895
Pro Val Gly Glu Phe Gly Asp Gly Val Asp Ile Val Gly Trp Val Asn
            900                 905                 910
Lys Thr Arg Leu Glu Leu Ala Gln Pro Ser Asp Ala Ala Leu Val Leu
        915                 920                 925
Ala Val Val Asp Pro Arg Leu Ser Gly Tyr Pro Leu Thr Ser Val Ile
    930                 935                 940
Tyr Met Phe Asn Ile Ala Met Met Cys Val Lys Glu Met Gly Pro Ala
945                 950                 955                 960
Arg Pro Thr Met Arg Glu Val Val His Met Leu Ser Glu Pro Pro His
                965                 970                 975
Ser Ala Thr His Thr His Asn Leu Ile Asn Leu
            980                 985
<210>221
<211>2961
<212>DNA
<213>光叶百脉根(Lotus japonica)
<400>221
atgagaatca gagtgtctta cttgttagtg ctatgtttta ccttaatttg gttcagatgg    60
acagtggtgt actcttcatt cagtgatctc gatgcactgc taaagctcaa agaatccatg   120
aagggagcca aagccaaaca ccacgcactc gaagattgga agttttccac ctcactctca   180
gcacactgtt cgttttccgg cgtaacgtgc gaccagaact tgcgagtggt tgctctcaac   240
gtcacgctgg ttccgctttt cggccacctt ccgccggaga tagggttgtt ggagaagtta   300
gagaatctca ccatctccat gaacaacctc actgaccagc ttccctccga ccttgcaagc   360
ctcacctccc tcaaggtcct caacatctcc cacaacctct tctccggcca attccctggt   420
aacatcaccg ttggcatgac ggagctcgag gcccttgatg cctacgacaa cagcttctcc   480
ggtcctctcc cggaggaaat cgtcaagctc gagaaactca agtacctcca cctcgccggg   540
aactatttct ccggtacaat accggagagc tactcggagt ttcagagcct tgagtttctc   600
ggcttgaacg caaacagctt aaccgggaga gtcccggaga gcttggcgaa gttgaagacg   660
ttgaaggaac tgcacctcgg ttactcgaac gcttacgaag gtggaatccc gccggcgttc   720
ggttccatgg agaatctccg cctgctagaa atggctaact gcaacctcac cggcgagatt   780
ccaccgagcc tggggaatct aaccaaactc cactccttat tcgtgcagat gaacaacctc   840
accggaacca ttccgccgga gctatcttcc atgatgagcc tcatgtcact ggacctctcc   900
atcaacgacc tcaccggcga gatcccggag agcttctcaa aactgaagaa tctcactcta   960
atgaacttct tccaaaacaa gttccgcggc tctctcccct ccttcatcgg cgaccttcca  1020
aatctcgaaa cgcttcaggt ttgggagaac aatttctcct tcgtgctgcc gcacaatctc  1080
ggcggaaacg gaagattctt atacttcgac gtcaccaaaa accacctcac cgggttgatt  1140
ccgccggatc tatgcaaaag cgggaggttg aaaacgttca tcatcactga taacttcttc  1200
cgtggcccaa ttcccaaggg aatcggcgag tgtaggtcac tcacgaagat tcgcgtggct  1260
aacaacttcc ttgacggtcc agttccacca ggggttttcc aactgccttc cgttacgata  1320
acggaattga gcaataaccg cctcaacggc gaactgcctt ccgtgatttc aggcgaatct  1380
ctcgggacgc tcacgctttc caacaacctc ttcaccggaa aaatccccgc cgcgatgaaa  1440
aacctcagag cgttgcagag cttatccctc gacgccaatg agttcatcgg agaaattccg  1500
gggggagttt ttgaaatccc aatgctcacc aaagtcaaca tcagcggcaa caacctcaca    1560
ggtccgatcc caacgacgat cactcaccgt gcttctctga cggcggtaga cctcagccgg    1620
aacaacctcg ccggcgaggt tccgaagggg atgaagaatt tgatggactt aagcattctg    1680
aatctctcac gcaacgagat ttctggaccg gttcctgatg agattcgatt catgactagc    1740
ctcacgacgc tggatctctc gagtaacaat ttcaccggaa cagtccccac cggcggccag    1800
tttctggtat tcaactacga caagacgttc gccggaaacc cgaacctctg tttccctcac    1860
agagcatcct gtccttctgt cctctacgac tcgttaagga aaacccgcgc caaaacggcg    1920
cgggtgaggg cgattgtgat tggaattgca ctcgccacgg cggtgttgct ggtggcggtg    1980
acggtgcacg tggtcagaaa gcggaggctg caccgagcgc aggcctggaa gctcaccgcg    2040
ttccagaggc tggagatcaa ggcggaggat gtagtcgagt gtttaaagga agagaatata    2100
attgggaaag gaggagcagg catcgtgtac agaggttcca tgccgaacgg aaccgacgtg    2160
gcgatcaagc ggttggtagg gcagggaagt gggaggaacg attacggttt cagggcggag    2220
attgagacgt tggggaaaat ccggcaccgg aatataatga ggcttctggg gtacgtttcg    2280
aacaaggata cgaacttgtt gctgtatgag tacatgccga atgggagctt aggggagtgg    2340
ctgcacggtg cgaagggtgg gcacttgcgg tgggagatga ggtataagat tgcggtggag    2400
gcggcgaggg gactctgcta tatgcaccat gattgctctc ctcttattat tcacagggat    2460
gttaagtcca acaacatttt gcttgatgct gattttgagg ctcatgttgc tgattttgga    2520
cttgctaagt ttttgtatga ccctggtgct tctcagtcca tgtcctccat tgctggctcc    2580
tacggttaca ttgctccaga gtatgcttac acgctgaaag tggacgagaa gagtgacgtg    2640
tacagctttg gcgttgtgct gttggaactg atcataggga gaaagccagt gggtgagttt    2700
ggagatggcg tggacatcgt tggatgggtc aacaaaacca tgtcagagct ctctcagccg    2760
tcggatactg cattagtgtt agcagtggtg gaccctcgcc tcagtggata ccccttgaca    2820
agtgtcatcc acatgttcaa catagctatg atgtgtgtga aggaaatggg ccctgctagg    2880
cccaccatga gggaagttgt tcatatgctc actaatcctc ctcagtctaa tacctccact    2940
caagacctaa ttaatctcta g                                              2961
<210>222
<211>986
<212>PRT
<213>光叶百脉根
<400>222
Met Arg Ile Arg Val Ser Tyr Leu Leu Val Leu Cys Phe Thr Leu Ile
1               5                   10                  15
Trp Phe Arg Trp Thr Val Val Tyr Ser Ser Phe Ser Asp Leu Asp Ala
            20                  25                  30
Leu Leu Lys Leu Lys Glu Ser Met Lys Gly Ala Lys Ala Lys His His
        35                  40                  45
Ala Leu Glu Asp Trp Lys Phe Ser Thr Ser Leu Ser Ala His Cys Ser
    50                  55                  60
Phe Ser Gly Val Thr Cys Asp Gln Asn Leu Arg Val Val Ala Leu Asn
65                  70                  75                  80
Val Thr Leu Val Pro Leu Phe Gly His Leu Pro Pro Glu Ile Gly Leu
                85                  90                  95
Leu Glu Lys Leu Glu Asn Leu Thr Ile Ser Met Asn Asn Leu Thr Asp
            100                 105                 110
Gln Leu Pro Ser Asp Leu Ala Ser Leu Thr Ser Leu Lys Val Leu Asn
        115                 120                 125
Ile Ser His Asn Leu Phe Ser Gly Gln Phe Pro Gly Asn Ile Thr Val
    130                 135                 140
Gly Met Thr Glu Leu Glu Ala Leu Asp Ala Tyr Asp Asn Ser Phe Ser
145                 150                 155                 160
Gly Pro Leu Pro Glu Glu Ile Val Lys Leu Glu Lys Leu Lys Tyr Leu
                165                 170                 175
His Leu Ala Gly Asn Tyr Phe Ser Gly Thr Ile Pro Glu Ser Tyr Ser
            180                 185                 190
Glu Phe Gln Ser Leu Glu Phe Leu Gly Leu Asn Ala Asn Ser Leu Thr
        195                 200                 205
Gly Arg Val Pro Glu Ser Leu Ala Lys Leu Lys Thr Leu Lys Glu Leu
    210                 215                 220
His Leu Gly Tyr Ser Asn Ala Tyr Glu Gly Gly Ile Pro Pro Ala Phe
225                 230                 235                 240
Gly Ser Met Glu Asn Leu Arg Leu Leu Glu Met Ala Asn Cys Asn Leu
                245                 250                 255
Thr Gly Glu Ile Pro Pro Ser Leu Gly Asn Leu Thr Lys Leu His Ser
            260                 265                 270
Leu Phe Val Gln Met Asn Asn Leu Thr Gly Thr Ile Pro Pro Glu Leu
        275                 280                 285
Ser Ser Met Met Ser Leu Met Ser Leu Asp Leu Ser Ile Asn Asp Leu
    290                 295                 300
Thr Gly Glu Ile Pro Glu Ser Phe Ser Lys Leu Lys Asn Leu Thr Leu
305                 310                 315                 320
Met Asn Phe Phe Gln Asn Lys Phe Arg Gly Ser Leu Pro Ser Phe Ile
                325                 330                 335
Gly Asp Leu Pro Asn Leu Glu Thr Leu Gln Val Trp Glu Asn Asn Phe
            340                 345                 350
Ser Phe Val Leu Pro His Asn Leu Gly Gly Asn Gly Arg Phe Leu Tyr
        355                 360                 365
Phe Asp Val Thr Lys Asn His Leu Thr Gly Leu Ile Pro Pro Asp Leu
    370                 375                 380
Cys Lys Ser Gly Arg Leu Lys Thr Phe Ile Ile Thr Asp Asn Phe Phe
385                 390                 395                 400
Arg Gly Pro Ile Pro Lys Gly Ile Gly Glu Cys Arg Ser Leu Thr Lys
                405                 410                 415
Ile Arg Val Ala Asn Asn Phe Leu Asp Gly Pro Val Pro Pro Gly Val
            420                 425                 430
Phe Gln Leu Pro Ser Val Thr Ile Thr Glu Leu Ser Asn Asn Arg Leu
        435                 440                 445
Asn Gly Glu Leu Pro Ser Val Ile Ser Gly Glu Ser Leu Gly Thr Leu
    450                 455                 460
Thr Leu Ser Asn Asn Leu Phe Thr Gly Lys Ile Pro Ala Ala Met Lys
465                 470                 475                 480
Asn Leu Arg Ala Leu Gln Ser Leu Ser Leu Asp Ala Asn Glu Phe Ile
                485                 490                 495
Gly Glu Ile Pro Gly Gly Val Phe Glu Ile Pro Met Leu Thr Lys Val
            500                 505                 510
Asn Ile Ser Gly Asn Asn Leu Thr Gly Pro Ile Pro Thr Thr Ile Thr
        515                 520                 525
His Arg Ala Ser Leu Thr Ala Val Asp Leu Ser Arg Asn Asn Leu Ala
    530                 535                 540
Gly Glu Val Pro Lys Gly Met Lys Asn Leu Met Asp Leu Ser Ile Leu
545                 550                 555                 560
Asn Leu Ser Arg Asn Glu Ile Ser Gly Pro Val Pro Asp Glu Ile Arg
                565                 570                 575
Phe Met Thr Ser Leu Thr Thr Leu Asp Leu Ser Ser Asn Asn Phe Thr
            580                 585                 590
Gly Thr Val Pro Thr Gly Gly Gln Phe Leu Val Phe Asn Tyr Asp Lys
        595                 600                 605
Thr Phe Ala Gly Asn Pro Asn Leu Cys Phe Pro His Arg Ala Ser Cys
    610                 615                 620
Pro Ser Val Leu Tyr Asp Ser Leu Arg Lys Thr Arg Ala Lys Thr Ala
625                 630                 635                 640
Arg Val Arg Ala Ile Val Ile Gly Ile Ala Leu Ala Thr Ala Val Leu
                645                 650                 655
Leu Val Ala Val Thr Val His Val Val Arg Lys Arg Arg Leu His Arg
            660                 665                 670
Ala Gln Ala Trp Lys Leu Thr Ala Phe Gln Arg Leu Glu Ile Lys Ala
        675                 680                 685
Glu Asp Val Val Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly
    690                 695                 700
Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro Asn Gly Thr Asp Val
705                 710                 715                 720
Ala Ile Lys Arg Leu Val Gly Gln Gly Ser Gly Arg Asn Asp Tyr Gly
                725                 730                 735
Phe Arg Ala Glu Ile Glu Thr Leu Gly Lys Ile Arg His Arg Asn Ile
            740                 745                 750
Met Arg Leu Leu Gly Tyr Val Ser Asn Lys Asp Thr Asn Leu Leu Leu
        755                 760                 765
Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Trp Leu His Gly Ala
    770                 775                 780
Lys Gly Gly His Leu Arg Trp Glu Met Arg Tyr Lys Ile Ala Val Glu
785                 790                 795                 800
Ala Ala Arg Gly Leu Cys Tyr Met His His Asp Cys Ser Pro Leu Ile
                805                 810                 815
Ile His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ala Asp Phe
            820                 825                 830
Glu Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Tyr Asp Pro
        835                 840                 845
Gly Ala Ser Gln Ser Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr Ile
    850                 855                 860
Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val
865                 870                 875                 880
Tyr Ser Phe Gly Val Val Leu Leu Glu Leu Ile Ile Gly Arg Lys Pro
                885                 890                 895
Val Gly Glu Phe Gly Asp Gly Val Asp Ile Val Gly Trp Val Asn Lys
            900                 905                 910
Thr Met Ser Glu Leu Ser Gln Pro Ser Asp Thr Ala Leu Val Leu Ala
        915                 920                 925
Val Val Asp Pro Arg Leu Ser Gly Tyr Pro Leu Thr Ser Val Ile His
    930                 935                 940
Met Phe Asn Ile Ala Met Met Cys Val Lys Glu Met Gly Pro Ala Arg
945                 950                 955                 960
Pro Thr Met Arg Glu Val Val His Met Leu Thr Asn Pro Pro Gln Ser
                965                 970                 975
Asn Thr Ser Thr Gln Asp Leu Ile Asn Leu
            980                 985
<210>223
<211>2925
<212>DNA
<213>蒺藜苜蓿
<400>223
atgaaaaaca tcacatgtta tttgctacta ttgtgcatgt tatttacaac gtgttattca     60
ttaaataatg atcttgatgc gttgctaaag ctaaaaaaat caatgaaagg agagaaagcc    120
aaagatgatg cactcaaaga ctggaaattt tcaacttctg cttcagctca ctgttcattt    180
tccggtgtaa aatgcgacga agatcaacgt gtgattgctt tgaacgtgac gcaagttcca    240
ctcttcggac acctttccaa ggagatcgga gagttgaaca tgctcgagag ccttacaatc    300
actatggaca atctcaccgg cgagcttcca actgagctat ccaaacttac ttctcttaga     360
atcctcaaca tctctcacaa cctcttctcc ggtaacttcc ccggcaacat cacttttgga     420
atgaagaaac ttgaggctct agatgcttat gacaataatt tcgaaggtcc tcttccagag     480
gaaatcgtta gcctgatgaa actcaagtac ttaagttttg ctggaaactt tttctccggt     540
acaataccgg agagttactc ggagtttcag aagttggaga ttttaaggct gaactataac     600
agtttaacag ggaagattcc taagagtttg tcgaagttaa agatgctaaa ggaactccaa     660
ttaggttatg agaatgctta ctccggtgga attccaccgg agttaggttc aatcaaatct     720
ctccgatatc ttgaaatttc taacgctaac ctcaccggag aaattccacc gagtcttgga     780
aatttagaaa acctcgactc cttgtttttg caaatgaaca acctcaccgg aacaattcca     840
cccgaactct cttcaatgcg gagtctcatg tcgttggatc tctccatcaa cggactctca     900
ggggagattc cagaaacctt ctcaaagctg aaaaatctca ctctcatcaa tttcttccag     960
aacaagcttc gcggttcaat tccagcgttc atcggcgatc ttcctaacct cgaaacgctt    1020
caggtttggg aaaacaattt ctcttttgta ttgccgcaga atctcggttc aaacggaaag    1080
ttcatatact ttgacgttac gaagaatcac ctcaccggat tgatcccacc ggagttatgc    1140
aaatcaaaga agttgaaaac gtttatcgtt actgacaact tcttccgcgg tccaatacct    1200
aacggaattg gcccgtgtaa gtcacttgaa aaaatcagag tggctaataa ctacttggac    1260
ggcccggtcc caccggggat ttttcagttg ccttctgtac agataataga gcttggaaat    1320
aaccgtttta acggccaact accaacggag atttctggca attctctcgg gaatctcgct    1380
ctttctaaca atttatttac cgggaggatt ccggcgtcca tgaagaatct ccgatcactg    1440
cagacgctgt tactcgatgc caatcagttt ctcggagaaa ttccggcaga ggtctttgct    1500
ttaccggtgt tgactagaat caacataagt ggcaataatc tcactggtgg aattccaaag    1560
acggttactc aatgtagttc actgactgca gttgacttca gccgaaacat gcttaccggt    1620
gaggttccta aagggatgaa gaatctgaag gttctaagca tttttaatgt ttcgcataat    1680
agcatatctg ggaaaatccc tgatgagatt agattcatga cgagtctaac gacgctggat    1740
ttatcttaca acaattttac cggaattgtc cccacaggtg gtcagttttt ggtcttcaac    1800
gaccggtcat ttgccggaaa tcctagccta tgtttccccc accaaacaac atgttcttca    1860
ttgctctatc gttcgagaaa aagccatgca aaggagaaag ctgtcgtcat agcaatcgtc  1920
ttcgccacag cggtgttaat ggtaattgta acactgcaca tgatgaggaa gaggaagcgt  1980
cacatggcaa aagcatggaa gctaacagcg tttcagaagt tggaattcag agcagaggaa  2040
gtagtggagt gtctgaaaga agagaacata ataggaaaag gaggagctgg gattgtctac  2100
agagggtcca tggcaaacgg aacagacgtt gcgataaagc gtttagttgg acaaggaagt  2160
ggtagaaatg attatggatt caaagctgag atagagacat tgggaaggat tagacacaga  2220
aacataatga ggcttttggg atatgtttca aacaaggata caaatttgtt gttgtatgag  2280
tacatgccta atggtagttt aggtgagtgg cttcatggtg caaaaggttg tcatttgagt  2340
tgggaaatga ggtacaaaat tgctgtggaa gctgctaagg gactttgcta tttgcaccat  2400
gattgttcac ctcttatcat tcatagggat gttaagtcta ataatatatt gcttgatgct  2460
gattttgagg ctcatgttgc tgattttgga cttgctaagt tcttgtatga tccaggtgct  2520
tctcaatcca tgtcctcaat tgctggctcc tacggctaca ttgctccaga atatgcatac  2580
actctcaaag tggatgaaaa aagtgatgtg tatagtttcg gagtggtgct attggagctg  2640
ataataggaa ggaagccagt tggtgaattt ggagatggag tagacatcgt tggatggatc  2700
aataaaactg aattagaact ttatcagcca tcagataaag cattagtgtc agcagtggtg  2760
gacccacgac tcaatggata ccctttgact agtgttatct acatgttcaa catagctatg  2820
atgtgtgtta aagaaatggg acctgcaagg cctaccatga gggaagttgt tcatatgctc  2880
actaatccac ctcactctac aagtcacaac ttgattaatc tctag                  2925
<210>224
<211>974
<212>PRT
<213>蒺藜苜蓿
<400>224
Met Lys Asn Ile Thr Cys Tyr Leu Leu Leu Leu Cys Met Leu Phe Thr
1               5                   10                  15
Thr Cys Tyr Ser Leu Asn Asn Asp Leu Asp Ala Leu Leu Lys Leu Lys
            20                  25                  30
Lys Ser Met Lys Gly Glu Lys Ala Lys Asp Asp Ala Leu Lys Asp Trp
        35                  40                  45
Lys Phe Ser Thr Ser Ala Ser Ala His Cys Ser Phe Ser Gly Val Lys
    50                  55                  60
Cys Asp Glu Asp Gln Arg Val Ile Ala Leu Asn Val Thr Gln Val Pro
65                  70                  75                  80
Leu Phe Gly His Leu Ser Lys Glu Ile Gly Glu Leu Asn Met Leu Glu
                85                  90                  95
Ser Leu Thr Ile Thr Met Asp Asn Leu Thr Gly Glu Leu Pro Thr Glu
            100                 105                 110
Leu Ser Lys Leu Thr Ser Leu Arg Ile Leu Asn Ile Ser His Asn Leu
        115                 120                 125
Phe Ser Gly Asn Phe Pro Gly Asn Ile Thr Phe Gly Met Lys Lys Leu
    130                 135                 140
Glu Ala Leu Asp Ala Tyr Asp Asn Asn Phe Glu Gly Pro Leu Pro Glu
145                 150                 155                 160
Glu Ile Val Ser Leu Met Lys Leu Lys Tyr Leu Ser Phe Ala Gly Asn
                165                 170                 175
Phe Phe Ser Gly Thr Ile Pro Glu Ser Tyr Ser Glu Phe Gln Lys Leu
            180                 185                 190
Glu Ile Leu Arg Leu Asn Tyr Asn Ser Leu Thr Gly Lys Ile Pro Lys
        195                 200                 205
Ser Leu Ser Lys Leu Lys Met Leu Lys Glu Leu Gln Leu Gly Tyr Glu
    210                 215                 220
Asn Ala Tyr Ser Gly Gly Ile Pro Pro Glu Leu Gly Ser Ile Lys Ser
225                 230                 235                 240
Leu Arg Tyr Leu Glu Ile Ser Asn Ala Asn Leu Thr Gly Glu Ile Pro
                245                 250                 255
Pro Ser Leu Gly Asn Leu Glu Asn Leu Asp Ser Leu Phe Leu Gln Met
            260                 265                 270
Asn Asn Leu Thr Gly Thr Ile Pro Pro Glu Leu Ser Ser Met Arg Ser
        275                 280                 285
Leu Met Ser Leu Asp Leu Ser Ile Asn Gly Leu Ser Gly Glu Ile Pro
    290                 295                 300
Glu Thr Phe Ser Lys Leu Lys Asn Leu Thr Leu Ile Asn Phe Phe Gln
305                 310                 315                 320
Asn Lys Leu Arg Gly Ser Ile Pro Ala Phe Ile Gly Asp Leu Pro Asn
                325                 330                 335
Leu Glu Thr Leu Gln Val Trp Glu Asn Asn Phe Ser Phe Val Leu Pro
            340                 345                 350
Gln Asn Leu Gly Ser Asn Gly Lys Phe Ile Tyr Phe Asp Val Thr Lys
        355                 360                 365
Asn His Leu Thr Gly Leu Ile Pro Pro Glu Leu Cys Lys Ser Lys Lys
    370                 375                 380
Leu Lys Thr Phe Ile Val Thr Asp Asn Phe Phe Arg Gly Pro Ile Pro
385                 390                 395                 400
Asn Gly Ile Gly Pro Cys Lys Ser Leu Glu Lys Ile Arg Val Ala Asn
                405                 410                 415
Asn Tyr Leu Asp Gly Pro Val Pro Pro Gly Ile Phe Gln Leu Pro Ser
            420                 425                 430
Val Gln Ile Ile Glu Leu Gly Asn Asn Arg Phe Asn Gly Gln Leu Pro
        435                 440                 445
Thr Glu Ile Ser Gly Asn Ser Leu Gly Asn Leu Ala Leu Ser Asn Asn
    450                 455                 460
Leu Phe Thr Gly Arg Ile Pro Ala Ser Met Lys Asn Leu Arg Ser Leu
465                 470                 475                 480
Gln Thr Leu Leu Leu Asp Ala Asn Gln Phe Leu Gly Glu Ile Pro Ala
                485                 490                 495
Glu Val Phe Ala Leu Pro Val Leu Thr Arg Ile Asn Ile Ser Gly Asn
            500                 505                 510
Asn Leu Thr Gly Gly Ile Pro Lys Thr Val Thr Gln Cys Ser Ser Leu
        515                 520                 525
Thr Ala Val Asp Phe Ser Arg Asn Met Leu Thr Gly Glu Val Pro Lys
    530                 535                 540
Gly Met Lys Asn Leu Lys Val Leu Ser Ile Phe Asn Val Ser His Asn
545                 550                 555                 560
Ser Ile Ser Gly Lys Ile Pro Asp Glu Ile Arg Phe Met Thr Ser Leu
                565                 570                 575
Thr Thr Leu Asp Leu Ser Tyr Asn Asn Phe Thr Gly Ile Val Pro Thr
            580                 585                 590
Gly Gly Gln Phe Leu Val Phe Asn Asp Arg Ser Phe Ala Gly Asn Pro
        595                 600                 605
Ser Leu Cys Phe Pro His Gln Thr Thr Cys Ser Ser Leu Leu Tyr Arg
    610                 615                 620
Ser Arg Lys Ser His Ala Lys Glu Lys Ala Val Val Ile Ala Ile Val
625                 630                 635                 640
Phe Ala Thr Ala Val Leu Met Val Ile Val Thr Leu His Met Met Arg
                645                 650                 655
Lys Arg Lys Arg His Met Ala Lys Ala Trp Lys Leu Thr Ala Phe Gln
            660                 665                 670
Lys Leu Glu Phe Arg Ala Glu Glu Val Val Glu Cys Leu Lys Glu Glu
        675                 680                 685
Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met
    690                 695                 700
Ala Asn Gly Thr Asp Val Ala Ile Lys Arg Leu Val Gly Gln Gly Ser
705                 710                 715                 720
Gly Arg Asn Asp Tyr Gly Phe Lys Ala Glu Ile Glu Thr Leu Gly Arg
                725                 730                 735
Ile Arg His Arg Asn Ile Met Arg Leu Leu Gly Tyr Val Ser Asn Lys
            740                 745                 750
Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly
        755                 760                 765
Glu Trp Leu His Gly Ala Lys Gly Cys His Leu Ser Trp Glu Met Arg
    770                 775                 780
Tyr Lys Ile Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His
785                 790                 795                 800
Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile
                805                 810                 815
Leu Leu Asp Ala Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Ala
            820                 825                 830
Lys Phe Leu Tyr Asp Pro Gly Ala Ser Gln Ser Met Ser Ser Ile Ala
        835                 840                 845
Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val
    850                 855                 860
Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu Leu
865                 870                 875                 880
Ile Ile Gly Arg Lys Pro Val Gly Glu Phe Gly Asp Gly Val Asp Ile
                885                 890                 895
Val Gly Trp Ile Asn Lys Thr Glu Leu Glu Leu Tyr Gln Pro Ser Asp
            900                 905                 910
Lys Ala Leu Val Ser Ala Val Val Asp Pro Arg Leu Asn Gly Tyr Pro
        915                 920                 925
Leu Thr Ser Val Ile Tyr Met Phe Asn Ile Ala Met Met Cys Val Lys
    930                 935                 940
Glu Met Gly Pro Ala Arg Pro Thr Met Arg Glu Val Val His Met Leu
945                 950                 955                 960
Thr Asn Pro Pro His Ser Thr Ser His Asn Leu Ile Asn Leu
                965                 970
<210>225
<211>2985
<212>DNA
<213>稻
<400>225
atgcctccta ctctcctcct cctcctcctc ctcctcccac cctccctcgc ctcccccgac   60
cgcgacatct acgcgctcgc caagctcaag gcggcgctcg tcccatcccc ctccgccacc  120
gccccaccgc cgctcgccga ctgggacccg gccgcgacct cccccgcgca ctgcaccttc  180
tccggcgtca cctgcgacgg ccgctcccgc gtcgtcgcca tcaacctcac cgccctcccg  240
ctccactccg gctacctccc gcccgagatc gccctccttg actccctcgc caacctcacc  300
atcgccgcct gctgcctccc cggccacgtc cccctcgagc tccccaccct cccctctctc  360
cgccacctca acctctccaa caacaacctt tccggccact tccccgtccc cgactccggc  420
ggtggcgcct ccccctactt cccctcgctc gagctcatcg acgcttacaa caacaacctc  480
tcagggttgc ttcctccctt ctccgcttca cacgctcgcc tccgctacct ccacctcggc  540
ggcaactact tcaccggcgc aatcccggac agctatggcg acctcgccgc gctcgagtac  600
cttggactca acggcaacac gctctccggc catgtccccg tctccctctc ccgcctcacc  660
cgcctccgcg agatgtacat cggatactac aaccagtacg acggcggcgt cccgccggag  720
ttcggcgacc tcggcgcgct cctccgcctc gacatgagca gctgcaacct caccggcccc  780
gtcccgccgg agctcggccg actccagcgc ctcgacacgc tcttcctgca gtggaaccgc  840
ctctccggcg agataccgcc gcagctcggc gatctcagca gcctcgcgtc gctcgacctc     900
tccgtcaacg acctcgccgg cgagatccct cccagcctcg ccaacctctc caacctcaag     960
ctcctcaacc tcttccggaa ccacctccgc ggcagcatac cggacttcgt cgccggcttc    1020
gcgcagctcg aggtgctgca gctgtgggac aacaacctca ccggcaacat ccccgccggg    1080
ctcgggaaga acggccgcct caagacgctc gacctggcca ccaaccacct caccggcccc    1140
atcccggcgg acctctgcgc cggccggcgg ctggagatgc tcgtgctcat ggagaacggc    1200
ctgttcggcc ccatcccgga ctcgctcggc gactgcaaga cgctcacgcg cgtccgcctc    1260
gccaagaact tcttgaccgg cccggttccc gccgggctct tcaacctccc gcaggccaac    1320
atggtggagc tcaccgacaa cctgctcacc ggcgagctcc cggacgtgat cggcggcgac    1380
aagatcggca tgctgctgct ggggaacaat gggatcggtg gccgcatccc tccggccatc    1440
ggcaacctcc cggcgctgca gacgctgtcg ctggagtcca acaacttctc cggagcgctg    1500
ccaccggaga tcggcaatct caagaacctg tccaggctca acgtcagcgg caacgcgctc    1560
accggcgcca ttccagacga gctcatccgc tgcgcctccc tcgccgccgt cgacctcagc    1620
cgtaacggct tctccggcga gataccggag agcatcacgt cgctcaagat actgtgcacg    1680
ctgaacgtgt ccaggaacag gctcaccggc gagctcccgc cggagatgtc caacatgacg    1740
agcctcacga cgctcgacgt gtcgtacaac agcctctcgg gccccgtgcc gatgcagggg    1800
cagttcttgg tgttcaacga gagctcgttc gtcggcaacc cggggctgtg cggcggcccc    1860
gtggccgacg cgtgccctcc gtccatggcc ggcggcggcg gcggcgcggg gtcccagctg    1920
cggctgcggt gggactcgaa gaagatgctg gtggcgctgg tggcggcgtt cgcggcggtg    1980
gcggtggcgt tcctgggcgc gaggaagggg tgctcggcgt ggcggtcggc ggcgcggcgg    2040
cggtcggggg cgtggaagat gacggcgttc cagaagctgg agttctcggc ggaggacgtg    2100
gtggagtgcg tgaaggagga caacatcatc gggaagggcg gcgcggggat cgtgtaccac    2160
ggcgtgacgc gcggggcgga gctggcgatc aagcggttgg tggggcgcgg cggcggcgag    2220
cacgaccggg ggttctcggc ggaggtgacg acgctgggga ggatcaggca ccggaacatc    2280
gtgaggctgc tggggttcgt gtcgaacagg gagacgaacc tgctgctgta cgagtacatg    2340
ccgaatgggt cgctggggga gatgctccat ggcgggaagg gggggcacct cgggtgggag    2400
gcgagggcgc gggtggcggc ggaggcggcg tgcggcctct gctacctcca ccatgactgc    2460
gccccgagga tcatccaccg cgacgtcaag tccaacaaca tcctcctcga ctccgccttc    2520
gaggcgcacg tcgccgactt cggcctcgcc aagttcctcg gcggcgccac ctccgagtgc    2580
atgtccgcca ttgctggctc ctacggctac atcgcgccag agtacgcata cacgctgcga    2640
gtggacgaga agagcgacgt gtatagcttc ggtgtggtgc tattggagct catcaccgga    2700
cgccgccccg tgggcgggtt cggtgacggc gtggacatcg tgcactgggt ccgcaaggtg    2760
accgccgagc tgccggacaa ctccgacacg gcggccgtcc tcgccgtggc cgaccgccgc    2820
ctgacgccgg agccggtggc gctgatggtg aacctgtaca aggtggccat ggcgtgcgtg    2880
gaggaggcga gcacggcccg gcccaccatg cgcgaggtcg tccacatgct ctccaaccca    2940
aactcggccc agcccaatag tggtgacctc ctcgtcacct tctga                    2985
<210>226
<211>994
<212>PRT
<213>稻
<400>226
Met Pro Pro Thr Leu Leu Leu Leu Leu Leu Leu Leu Pro Pro Ser Leu
1               5                   10                  15
Ala Ser Pro Asp Arg Asp Ile Tyr Ala Leu Ala Lys Leu Lys Ala Ala
            20                  25                  30
Leu Val Pro Ser Pro Ser Ala Thr Ala Pro Pro Pro Leu Ala Asp Trp
        35                  40                  45
Asp Pro Ala Ala Thr Ser Pro Ala His Cys Thr Phe Ser Gly Val Thr
    50                  55                  60
Cys Asp Gly Arg Ser Arg Val Val Ala Ile Asn Leu Thr Ala Leu Pro
65                  70                  75                  80
Leu His Ser Gly Tyr Leu Pro Pro Glu Ile Ala Leu Leu Asp Ser Leu
                85                  90                  95
Ala Asn Leu Thr Ile Ala Ala Cys Cys Leu Pro Gly His Val Pro Leu
            100                 105                 1l0
Glu Leu Pro Thr Leu Pro Ser Leu Arg His Leu Asn Leu Ser Asn Asn
        115                 120                 125
Asn Leu Ser Gly His Phe Pro Val Pro Asp Ser Gly Gly Gly Ala Ser
    130                 135                 140
Pro Tyr Phe Pro Ser Leu Glu Leu Ile Asp Ala Tyr Asn Asn Asn Leu
145                 150                 155                 160
Ser Gly Leu Leu Pro Pro Phe Ser Ala Ser His Ala Arg Leu Arg Tyr
                165                 170                 175
Leu His Leu Gly Gly Asn Tyr Phe Thr Gly Ala Ile Pro Asp Ser Tyr
             180                 185                 190
Gly Asp Leu Ala Ala Leu Glu Tyr Leu Gly Leu Asn Gly Asn Thr Leu
        195                 200                 205
Ser Gly His Val Pro Val Ser Leu Ser Arg Leu Thr Arg Leu Arg Glu
    210                 215                 220
Met Tyr Ile Gly Tyr Tyr Asn Gln Tyr Asp Gly Gly Val Pro Pro Glu
225                 230                 235                 240
Phe Gly Asp Leu Gly Ala Leu Leu Arg Leu Asp Met Ser Ser Cys Asn
                245                 250                 255
Leu Thr Gly Pro Val Pro Pro Glu Leu Gly Arg Leu Gln Arg Leu Asp
            260                 265                 270
Thr Leu Phe Leu Gln Trp Asn Arg Leu Ser Gly Glu Ile Pro Pro Gln
        275                 280                 285
Leu Gly Asp Leu Ser Ser Leu Ala Ser Leu Asp Leu Ser Val Asn Asp
    290                 295                 300
Leu Ala Gly Glu Ile Pro Pro Ser Leu Ala Asn Leu Ser Asn Leu Lys
305                 310                 315                 320
Leu Leu Asn Leu Phe Arg Asn His Leu Arg Gly Ser Ile Pro Asp Phe
                325                 330                 335
Val Ala Gly Phe Ala Gln Leu Glu Val Leu Gln Leu Trp Asp Asn Asn
            340                 345                 350
Leu Thr Gly Asn Ile Pro Ala Gly Leu Gly Lys Asn Gly Arg Leu Lys
        355                 360                 365
Thr Leu Asp Leu Ala Thr Asn His Leu Thr Gly Pro Ile Pro Ala Asp
    370                 375                 380
Leu Cys Ala Gly Arg Arg Leu Glu Met Leu Val Leu Met Glu Asn Gly
385                 390                 395                 400
Leu Phe Gly Pro Ile Pro Asp Ser Leu Gly Asp Cys Lys Thr Leu Thr
                405                 410                 415
Arg Val Arg Leu Ala Lys Asn Phe Leu Thr Gly Pro Val Pro Ala Gly
            420                 425                 430
Leu Phe Asn Leu Pro Gln Ala Asn Met Val Glu Leu Thr Asp Asn Leu
        435                 440                 445
Leu Thr Gly Glu Leu Pro Asp Val Ile Gly Gly Asp Lys Ile Gly Met
    450                 455                 460
Leu Leu Leu Gly Asn Asn Gly Ile Gly Gly Arg Ile Pro Pro Ala Ile
465                 470                 475                 480
Gly Asn Leu Pro Ala Leu Gln Thr Leu Ser Leu Glu Ser Asn Asn Phe
                485                 490                 495
Ser Gly Ala Leu Pro Pro Glu Ile Gly Asn Leu Lys Asn Leu Ser Arg
            500                 505                 510
Leu Asn Val Ser Gly Asn Ala Leu Thr Gly Ala Ile Pro Asp Glu Leu
        515                 520                 525
Ile Arg Cys Ala Ser Leu Ala Ala Val Asp Leu Ser Arg Asn Gly Phe
    530                 535                 540
Ser Gly Glu Ile Pro Glu Ser Ile Thr Ser Leu Lys Ile Leu Cys Thr
545                 550                 555                 560
Leu Asn Val Ser Arg Asn Arg Leu Thr Gly Glu Leu Pro Pro Glu Met
                565                 570                 575
Ser Asn Met Thr Ser Leu Thr Thr Leu Asp Val Ser Tyr Asn Ser Leu
            580                 585                 590
Ser Gly Pro Val Pro Met Gln Gly Gln Phe Leu Val Phe Asn Glu Ser
        595                 600                 605
Ser Phe Val Gly Asn Pro Gly Leu Cys Gly Gly Pro Val Ala Asp Ala
    610                 615                 620
Cys Pro Pro Ser Met Ala Gly Gly Gly Gly Gly Ala Gly Ser Gln Leu
625                 630                 635                 640
Arg Leu Arg Trp Asp Ser Lys Lys Met Leu Val Ala Leu Val Ala Ala
                645                 650                 655
Phe Ala Ala Val Ala Val Ala Phe Leu Gly Ala Arg Lys Gly Cys Ser
            660                 665                 670
Ala Trp Arg Ser Ala Ala Arg Arg Arg Ser Gly Ala Trp Lys Met Thr
        675                 680                 685
Ala Phe Gln Lys Leu Glu Phe Ser Ala Glu Asp Val Val Glu Cys Val
    690                 695                 700
Lys Glu Asp Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr His
705                 710                 715                 720
Gly Val Thr Arg Gly Ala Glu Leu Ala Ile Lys Arg Leu Val Gly Arg
                725                 730                 735
Gly Gly Gly Glu His Asp Arg Gly Phe Ser Ala Glu Val Thr Thr Leu
            740                 745                 750
Gly Arg Ile Arg His Arg Asn Ile Val Arg Leu Leu Gly Phe Val Ser
        755                 760                 765
Asn Arg Glu Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser
    770                 775                 780
Leu Gly Glu Met Leu His Gly Gly Lys Gly Gly His Leu Gly Trp Glu
785                 790                 795                 800
Ala Arg Ala Arg Val Ala Ala Glu Ala Ala Cys Gly Leu Cys Tyr Leu
                805                 810                 815
His His Asp Cys Ala Pro Arg Ile Ile His Arg Asp Val Lys Ser Asn
            820                 825                 830
Asn Ile Leu Leu Asp Ser Ala Phe Glu Ala His Val Ala Asp Phe Gly
        835                 840                 845
Leu Ala Lys Phe Leu Gly Gly Ala Thr Ser Glu Cys Met Ser Ala Ile
    850                 855                 860
Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Arg
865                 870                 875                 880
Val Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu
                885                 890                 895
Leu Ile Thr Gly Arg Arg Pro Val Gly Gly Phe Gly Asp Gly Val Asp
            900                 905                 910
Ile Val His Trp Val Arg Lys Val Thr Ala Glu Leu Pro Asp Asn Ser
        915                 920                 925
Asp Thr Ala Ala Val Leu Ala Val Ala Asp Arg Arg Leu Thr Pro Glu
    930                 935                 940
Pro Val Ala Leu Met Val Asn Leu Tyr Lys Val Ala Met Ala Cys Val
945                 950                 955                 960
Glu Glu Ala Ser Thr Ala Arg Pro Thr Met Arg Glu Val Val His Met
                965                 970                 975
Leu Ser Asn Pro Asn Ser Ala Gln Pro Asn Ser Gly Asp Leu Leu Val
            980                 985                 990
Thr Phe
<210>227
<211>2931
<212>DNA
<213>成熟豌豆(Pisum sativa)
<400>227
atgaaaagta tcacgtgtta tttgctggta ttcttctgcg tgttatttac accatgtttt   60
tcaataaccg atctcgatgc gttgctaaag cttaaagaat caatgaaagg agagaaatca  120
aaacatcccg attcactcgg agactggaag ttttccgctt ctggttcagc tcactgctca  180
ttttccggtg taacgtgcga tcaagataac cgagtgataa ctctgaacgt gacgcaagtt  240
ccactcttcg gaagaatttc taaggagatt ggagtgttgg ataagcttga gagactcatc  300
atcaccatgg ataatctcac tggcgagctt ccgtttgaga tatccaatct tacctctctt  360
aaaatcctta acatctctca caacaccttc tctggtaact tccccggcaa catcactctc  420
cgtatgacga aacttgaggt tctagatgct tatgacaata gcttcactgg tcatcttcct  480
gaggaaatcg tcagcctcaa ggaactcacg atcttatgtc tggccggaaa ctatttcacc  540
ggtacaatac ccgagagtta ctcggaattt cagaagttgg agattttaag cataaacgca  600
aacagtttat cggggaagat tccgaagagc ttatccaaat taaagacgct gaaggaactc  660
cgtttaggtt acaacaacgc ttacgatggc ggagttccac cggagtttgg ttcattgaaa  720
tctctccgat atcttgaggt gtctaactgt aacctcaccg gagaaattcc accgagtttt  780
ggaaatttag aaaacctaga cagcttgttc ttgcaaatga acaacctcac cggaataatt  840
ccaccggaac tctcttccat gaagagtctc atgtcgttgg atctctccaa caacgctctc  900
tcaggagaga ttccagagag cttctcaaat ctcaaaagcc tcactctctt gaatttcttc  960
cagaacaagt ttcgcggttc tattccggca ttcataggcg atcttcctaa cctggaaacg 1020
cttcaggttt gggaaaacaa tttctctttt gtattgccac aaaatctcgg ttcaaacgga 1080
aagttcattt tcttcgacgt tacgaagaat cacctcaccg gattgattcc accggatttg 1140
tgcaaatcga agaaattgca aacgtttata gttacggata acttcttcca cggtccaatc    1200
cctaaaggaa tcggcgcgtg taagtcactt ctcaaaatca gagttgctaa taactactta    1260
gacgggccgg tcccacaagg gatttttcaa atgccttctg taacgataat agagcttgga    1320
aataaccgttt taacggcca actaccttct gaagtttccg gcgttaatct cgggattctc    1380
actatctcta acaatttatt caccgggagg attcccgctt caatgaagaa tctcatatca    1440
cttcagactc tgtggcttga cgcaaatcag ttcgtcggag aaattccaaa ggaagtcttt    1500
gacttaccag tgttaacgaa gttcaacata agtggtaaca acctcaccgg tgtaatccca    1560
acgacggttt ctcagtgtag atcgttgaca gccgttgact tcagccggaa catgattacc    1620
ggcgaggttc ccaggggaat gaagaatctg aaggttctca gcatttttaa cctttcacat    1680
aacaacatat cgggtctaat ccccgacgag attcgattca tgacgagtct caccacgctg    1740
gatctatcct acaacaattt caccggaata gtccccaccg gcggtcagtt tttggttttc    1800
aacgacaggt cgtttttcgg aaaccctaac ctctgtttcc cacaccaatc ctcatgctct    1860
tcctatacct ttccctcgag taaaagccac gcgaaggtga aggccattat taccgcaatt    1920
gctctcgcca cagcagtgtt actggtaata gcgacgatgc acatgatgag gaagagaaag    1980
cttcatatgg cgaaagcatg gaagttaaca gcatttcaga gactagactt caaagcagag    2040
gaagttgtgg agtgtttgaa agaagagaac ataataggaa aaggaggagc cgggatcgtg    2100
tacagagggt ccatgcccaa cggaacagac gtagcgataa agcgtttagt tggacaagga    2160
agtgggagaa acgattacgg tttcaaagca gagatagaaa cattgggtag aatcagacac    2220
agaaacataa tgaggctatt gggttacgtt tctaataagg acacaaattt gttgctgtat    2280
gagtacatgc cgaatggtag tttaggggaa tggcttcatg gtgcaaaagg ctgtcatttg    2340
agttgggaaa tgaggtataa aattgcagtg gaagctggta aaggactttg ctatttgcac    2400
catgattgtt cacctcttat tattcatagg gatgttaagt ccaacaatat attgctagat    2460
gctgattttg aagcccatgt tgctgatttt ggacttgcaa agtttttata tgacccaggt    2520
gcttctcagt ccatgtcctc tattgctggc tcctacggct acattgctcc agagtatgct    2580
tatacgttga aagtggatga gaaaagcgat gtgtatagct ttggagtggt gctattggag    2640
ctgatcatag gaaggaaacc agtgggtgag tttggagatg gagtggacat cgttggatgg    2700
atcaataaaa ctgaattaga gctttatcag ccgtcagata aagcattggt gtcggcggtg  2760
gtggacccgc ggctcactgg atacccaatg gcaagtgtta tctacatgtt caacatagct  2820
atgatgtgtg ttaaagaaat gggacccgca aggcctacca tgagggaagt agttcatatg  2880
ctcactaatc cacctcagtc taccactcat aacaacctta ttaatctcta g           2931
<210>228
<211>976
<212>PRT
<213>成熟豌豆
<400>228
Met Lys Ser Ile Thr Cys Tyr Leu Leu Val Phe Phe Cys Val Leu Phe
1               5                   10                  15
Thr Pro Cys Phe Ser Ile Thr Asp Leu Asp Ala Leu Leu Lys Leu Lys
            20                  25                  30
Glu Ser Met Lys Gly Glu Lys Ser Lys His Pro Asp Ser Leu Gly Asp
        35                  40                  45
Trp Lys Phe Ser Ala Ser Gly Ser Ala His Cys Ser Phe Ser Gly Val
    50                  55                  60
Thr Cys Asp Gln Asp Asn Arg Val Ile Thr Leu Asn Val Thr Gln Val
65                  70                  75                  80
Pro Leu Phe Gly Arg Ile Ser Lys Glu Ile Gly Val Leu Asp Lys Leu
                85                  90                  95
Glu Arg Leu Ile Ile Thr Met Asp Asn Leu Thr Gly Glu Leu Pro Phe
            100                 105                 110
Glu Ile Ser Asn Leu Thr Ser Leu Lys Ile Leu Asn Ile Ser His Asn
        115                 120                 125
Thr Phe Ser Gly Asn Phe Pro Gly Asn Ile Thr Leu Arg Met Thr Lys
    130                 135                 140
Leu Glu Val Leu Asp Ala Tyr Asp Asn Ser Phe Thr Gly His Leu Pro
145                 150                 155                 160
Glu Glu Ile Val Ser Leu Lys Glu Leu Thr Ile Leu Cys Leu Ala Gly
                165                 170                 175
Asn Tyr Phe Thr Gly Thr Ile Pro Glu Ser Tyr Ser Glu Phe Gln Lys
            180                 185                 190
Leu Glu Ile Leu Ser Ile Asn Ala Asn Ser Leu Ser Gly Lys Ile Pro
        195                 200                 205
Lys Ser Leu Ser Lys Leu Lys Thr Leu Lys Glu Leu Arg Leu Gly Tyr
    210                 215                 220
Asn Asn Ala Tyr Asp Gly Gly Val Pro Pro Glu Phe Gly Ser Leu Lys
225                 230                 235                 240
Ser Leu Arg Tyr Leu Glu Val Ser Asn Cys Asn Leu Thr Gly Glu Ile
                245                 250                 255
Pro Pro Ser Phe Gly Asn Leu Glu Asn Leu Asp Ser Leu Phe Leu Gln
            260                 265                 270
Met Asn Asn Leu Thr Gly Ile Ile Pro Pro Glu Leu Ser Ser Met Lys
        275                 280                 285
Ser Leu Met Ser Leu Asp Leu Ser Asn Asn Ala Leu Ser Gly Glu Ile
    290                 295                 300
Pro Glu Ser Phe Ser Asn Leu Lys Ser Leu Thr Leu Leu Asn Phe Phe
305                 310                 315                 320
Gln Asn Lys Phe Arg Gly Ser Ile Pro Ala Phe Ile Gly Asp Leu Pro
                325                 330                 335
Asn Leu Glu Thr Leu Gln Val Trp Glu Asn Asn Phe Ser Phe Val Leu
            340                 345                 350
Pro Gln Asn Leu Gly Ser Asn Gly Lys Phe Ile Phe Phe Asp Val Thr
        355                 360                 365
Lys Asn His Leu Thr Gly Leu Ile Pro Pro Asp Leu Cys Lys Ser Lys
    370                 375                 380
Lys Leu Gln Thr Phe Ile Val Thr Asp Asn Phe Phe His Gly Pro Ile
385                 390                 395                 400
Pro Lys Gly Ile Gly Ala Cys Lys Ser Leu Leu Lys Ile Arg Val Ala
                405                 410                 415
Asn Asn Tyr Leu Asp Gly Pro Val Pro Gln Gly Ile Phe Gln Met Pro
            420                 425                 430
Ser Val Thr Ile Ile Glu Leu Gly Asn Asn Arg Phe Asn Gly Gln Leu
        435                 440                 445
Pro Ser Glu Val Ser Gly Val Asn Leu Gly Ile Leu Thr Ile Ser Asn
    450                 455                 460
Asn Leu Phe Thr Gly Arg Ile Pro Ala Ser Met Lys Asn Leu Ile Ser
465                 470                 475                 480
Leu Gln Thr Leu Trp Leu Asp Ala Asn Gln Phe Val Gly Glu Ile Pro
                485                 490                 495
Lys Glu Val Phe Asp Leu Pro Val Leu Thr Lys Phe Asn Ile Ser Gly
            500                 505                 510
Asn Asn Leu Thr Gly Val Ile Pro Thr Thr Val Ser Gln Cys Arg Ser
        515                 520                 525
Leu Thr Ala Val Asp Phe Ser Arg Asn Met Ile Thr Gly Glu Val Pro
    530                 535                 540
Arg Gly Met Lys Asn Leu Lys Val Leu Ser Ile Phe Asn Leu Ser His
545                 550                 555                 560
Asn Asn Ile Ser Gly Leu Ile Pro Asp Glu Ile Arg Phe Met Thr Ser
                565                 570                 575
Leu Thr Thr Leu Asp Leu Ser Tyr Asn Asn Phe Thr Gly Ile Val Pro
            580                 585                 590
Thr Gly Gly Gln Phe Leu Val Phe Asn Asp Arg Ser Phe Phe Gly Asn
        595                 600                 605
Pro Asn Leu Cys Phe Pro His Gln Ser Ser Cys Ser Ser Tyr Thr Phe
    610                 615                 620
Pro Ser Ser Lys Ser His Ala Lys Val Lys Ala Ile Ile Thr Ala Ile
625                 630                 635                 640
Ala Leu Ala Thr Ala Val Leu Leu Val Ile Ala Thr Met His Met Met
                645                 650                 655
Arg Lys Arg Lys Leu His Met Ala Lys Ala Trp Lys Leu Thr Ala Phe
            660                 665                 670
Gln Arg Leu Asp Phe Lys Ala Glu Glu Val Val Glu Cys Leu Lys Glu
        675                 680                 685
Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser
    690                 695                 700
Met Pro Asn Gly Thr Asp Val Ala Ile Lys Arg Leu Val Gly Gln Gly
705                 710                 715                 720
Ser Gly Arg Asn Asp Tyr Gly Phe Lys Ala Glu Ile Glu Thr Leu Gly
                725                 730                 735
Arg Ile Arg His Arg Asn Ile Met Arg Leu Leu Gly Tyr Val Ser Asn
            740                 745                 750
Lys Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu
        755                 760                 765
Gly Glu Trp Leu His Gly Ala Lys Gly Cys His Leu Ser Trp Glu Met
    770                 775                 780
Arg Tyr Lys Ile Ala Val Glu Ala Gly Lys Gly Leu Cys Tyr Leu His
785                 790                 795                 800
His Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn
                805                 810                 815
Ile Leu Leu Asp Ala Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu
            820                 825                 830
Ala Lys Phe Leu Tyr Asp Pro Gly Ala Ser Gln Ser Met Ser Ser Ile
        835                 840                 845
Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys
    850                 855                 860
Val Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu
865                 870                 875                 880
Leu Ile Ile Gly Arg Lys Pro Val Gly Glu Phe Gly Asp Gly Val Asp
                885                 890                 895
Ile Val Gly Trp Ile Asn Lys Thr Glu Leu Glu Leu Tyr Gln Pro Ser
            900                 905                 910
Asp Lys Ala Leu Val Ser Ala Val Val Asp Pro Arg Leu Thr Gly Tyr
        915                 920                 925
Pro Met Ala Ser Val Ile Tyr Met Phe Asn Ile Ala Met Met Cys Val
    930                 935                 940
Lys Glu Met Gly Pro Ala Arg Pro Thr Met Arg Glu Val Val His Met
945                 950                 955                 960
Leu Thr Asn Pro Pro Gln Ser Thr Thr His Asn Asn LeuIle Asn Leu
                965                 970                 975
<210>229
<211>2922
<212>DNA
<213>美洲山杨
<400>229
atgagaacat ttctgtgctt ttttctttta ctagtattat tgttcgctcc ttgcagtgga     60
tacagtgatc ttgaagtcct cttgaagctg aaaacctcca tgtatggaca taatggcact    120
ggccttcaag attgggtggc ttctccagca tctcccacag ctcactgtta cttctctgga    180
gtcacgtgtg atgaggactc gcgtgtggtg tctctaaacg tgtcgtttag acatcttcct    240
ggttcaattc ctccagagat tgggctgttg aacaagcttg tgaatcttac tctgtcaggt    300
aataatctca cggggggatt tccagtggag atagccatgc tgacatctct caggattttg    360
aatatttcca acaatgttat tgctgggaat ttccccggaa aaatcactct tggcatggca    420
ctgcttgagg ttcttgatgt ttacaacaat aattttacgg gtgcattgcc aactgaaatt    480
gtaaagctga aaaatctcaa gcatgttcat cttggaggga atttcttttc tggtacaata    540
ccggaggagt actcggagat tttgagcttg gagtacttgg gcttgaatgg taatgcgctt    600
tcaggcaaag taccttcaag cttgtccagg ttgaagaatc ttaagagctt gtgcgttggg    660
tactttaacc gttatgaggg gagtattcca cctgaatttg ggtcattaag taatcttgaa    720
cttcttgaca tggcttcctg taaccttgac ggtgagattc cttccgcttt aagtcaatta    780
acccatctgc attcgttgtt tcttcaagtc aataatctca ctggccatat ccctcctgaa    840
ttatctggtc taattagctt gaaatcactg gatctttcga taaacaacct cactggggag    900
ataccagaga gtttttcaga tttgaaaaac atagaactga tcaatctctt tcaaaacaag    960
ctgcacggtc caatcccaga attttttggt gattttccga accttgaggt gcttcaggtt   1020
tggggcaaca acttcacttt tgagcttcct caaaatcttg gccggaatgg gaagctgatg   1080
atgctggatg tgtctattaa tcacttaact ggattggtcc cgcgggattt atgcaaagga   1140
gggaaattga cgacgttgat tctcatgaac aatttcttcc ttggatcgct tcctgatgaa   1200
attggccagt gcaagtcctt gctcaaaatc cgaataatga ataatatgtt ttcaggaact   1260
atccctgctg ggatatttaa tttgcctttg gcgacacttg ttgagttgag caataacctt   1320
ttctctggcg agcttccacc agagatttca ggagatgcac taggcctttt atcagtttct   1380
aacaatcgga tcacaggtaa aatcccgcct gctattggga atctgaagaa cttgcagact   1440
ctgtcactgg acacgaacag actttctggt gaaattcctg aagaaatctg gggactgaag   1500
tccctcacca agatcaacat ccgtgctaac aacatcagag gtgaaatccc agcttcgatt   1560
tcccactgca catcacttac atccgttgat ttcagtcaaa acagcctcag tggggagatt   1620
cctaagaaga ttgccaaact gaacgatttg agctttcttg atctctctcg aaatcaactc   1680
actggtcaac taccaggtga aattggatac atgagaagcc ttacatccct taatctctca  1740
tacaacaatt tatttggcag gatcccttct gccggccaat tcctggcgtt caatgacagt  1800
tcatttctcg gaaatccaaa tctctgtgca gcgagaaata atacttgctc cttcggtgat  1860
catggccata ggggggggtc ttttagtact tcaaagctaa taatcactgt cattgcactc  1920
gtcactgttt tgctgttaat agttgtgacg gtttacagat tgagaaagaa gaggctgcag  1980
aaatcacggg cctggaagct cactgcattc caaaggctcg acttcaaggc agaggacgtg  2040
cttgagtgct tgaaagagga aaacattata ggcaaaggtg gtgctggtat tgtctaccgt  2100
gggtcaatgc cagagggtgt tgatcatgta gctatcaaac gacttgttgg tcgaggcagc  2160
ggaagaagtg atcatggctt ctcggctgag attcaaactc ttggaagaat caggcaccga  2220
aatattgtaa ggctgttggg gtacgtatcg aataaggata ccaacttgct attgtatgaa  2280
tacatgccta atggaagctt aggggagctt ttgcatggtt caaagggagg ccatttgcag  2340
tgggagacta gatacagaat tgctgtggag gctgctaagg gactctgtta tcttcaccac  2400
gattgctcgc ctttgattat acatagggat gttaagtcca ataacatatt acttgattcc  2460
gattttgagg ctcatgttgc tgattttggt ctcgctaagt tcttacaaga tgcaggctca  2520
tcagagtgca tgtcctccgt tgctggctcc tatggttaca ttgctccaga gtacgcatac  2580
acactgaaag tggacgaaaa gagtgatgtt tacagttttg gtgttgtgct gctggagctg  2640
atagcaggga gaaagccagt cggggagttt ggagatgggg tggacatcgt gaggtgggtc  2700
aggaagacca catcagaact ctctcagcca tctgatgcag ctacagtctt ggcagttgtg  2760
gaccccaggc ttagtgggta cccacttgca ggtgtcattc acttgtttaa gatagctatg  2820
ctgtgtgtta aagatgagag ctcagccagg cccaccatga gggaagttgt tcacatgctc  2880
accaatcctc cacaatctgc ccccagccta ctcgcccttt ag                     2922
<210>230
<211>973
<212>PRT
<213>美洲山杨
<400>230
Met Arg Thr Phe Leu Cys Phe Phe Leu Leu Leu Val Leu Leu Phe Ala
1               5                   10                  15
Pro Cys Ser Gly Tyr Ser Asp Leu Glu Val Leu Leu Lys Leu Lys Thr
            20                  25                  30
Ser Met Tyr Gly His Asn Gly Thr Gly Leu Gln Asp Trp Val Ala Ser
        35                   40                  45
Pro Ala Ser Pro Thr Ala His Cys Tyr Phe Ser Gly Val Thr Cys Asp
    50                  55                  60
Glu Asp Ser Arg Val Val Ser Leu Asn Val Ser Phe Arg His Leu Pro
65                  70                  75                  80
Gly Ser Ile Pro Pro Glu Ile Gly Leu Leu Asn Lys Leu Val Asn Leu
                85                  90                  95
Thr Leu Ser Gly Asn Asn Leu Thr Gly Gly Phe Pro Val Glu Ile Ala
           100                 105                 110
Met Leu Thr Ser Leu Arg Ile Leu Asn Ile Ser Asn Asn Val Ile Ala
        115                 120                 125
Gly Asn Phe Pro Gly Lys Ile Thr Leu Gly Met Ala Leu Leu Glu Val
    130                 135                 140
Leu Asp Val Tyr Asn Asn Asn Phe Thr Gly Ala Leu Pro Thr Glu Ile
145                 150                 155                 160
Val Lys Leu Lys Asn Leu Lys His Val His Leu Gly Gly Asn Phe Phe
                165                 170                 175
Ser Gly Thr Ile Pro Glu Glu Tyr Ser Glu Ile Leu Ser Leu Glu Tyr
            180                 185                 190
Leu Gly Leu Asn Gly Asn Ala Leu Ser Gly Lys Val Pro Ser Ser Leu
        195                 200                 205
Ser Arg Leu Lys Asn Leu Lys Ser Leu Cys Val Gly Tyr Phe Asn Arg
    210                 215                 220
Tyr Glu Gly Ser Ile Pro Pro Glu Phe Gly Ser Leu Ser Asn Leu Glu
225                 230                 235                 240
Leu Leu Asp Met Ala Ser Cys Asn Leu Asp Gly Glu Ile Pro Ser Ala
                245                 250                 255
Leu Ser Gln Leu Thr His Leu His Ser Leu Phe Leu Gln Val Asn Asn
            260                 265                 270
Leu Thr Gly His Ile Pro Pro Glu Leu Ser Gly Leu Ile Ser Leu Lys
        275                 280                 285
Ser Leu Asp Leu Ser Ile Asn Asn Leu Thr Gly Glu Ile Pro Glu Ser
    290                 295                 300
Phe Ser Asp Leu Lys Asn Ile Glu Leu Ile Asn Leu Phe Gln Asn Lys
305                 310                 315                 320
Leu His Gly Pro Ile Pro Glu Phe Phe Gly Asp Phe Pro Asn Leu Glu
                325                 330                 335
Val Leu Gln Val Trp Gly Asn Asn Phe Thr Phe Glu Leu Pro Gln Asn
            340                 345                 350
Leu Gly Arg Asn Gly Lys Leu Met Met Leu Asp Val Ser Ile Asn His
        355                 360                 365
Leu Thr Gly Leu Val Pro Arg Asp Leu Cys Lys Gly Gly Lys Leu Thr
    370                 375                 380
Thr Leu Ile Leu Met Asn Asn Phe Phe Leu Gly Ser Leu Pro Asp Glu
385                 390                 395                 400
Ile Gly Gln Cys Lys Ser Leu Leu Lys Ile ArgIle Met Asn Asn Met
                405                 410                 415
Phe Ser Gly Thr Ile Pro Ala Gly Ile Phe Asn Leu Pro Leu Ala Thr
            420                 425                 430
Leu Val Glu Leu Ser Asn Asn Leu Phe Ser Gly Glu Leu Pro Pro Glu
        435                 440                 445
Ile Ser Gly Asp Ala Leu Gly Leu Leu Ser Val Ser Asn Asn Arg Ile
    450                 455                 460
Thr Gly Lys Ile Pro Pro Ala Ile Gly Asn Leu Lys Asn Leu Gln Thr
465                 470                 475                 480
Leu Ser Leu Asp Thr Asn Arg Leu Ser Gly Glu Ile Pro Glu Glu Ile
                485                 490                 495
Trp Gly Leu Lys Ser Leu Thr Lys Ile Asn Ile Arg Ala Asn Asn Ile
            500                 505                 510
Arg Gly Glu Ile Pro Ala Ser Ile Ser His Cys Thr Ser Leu Thr Ser
        515                 520                 525
Val Asp Phe Ser Gln Asn Ser Leu Ser Gly Glu Ile Pro Lys Lys Ile
    530                 535                 540
Ala Lys Leu Asn Asp Leu Ser Phe Leu Asp Leu Ser Arg Asn Gln Leu
545                 550                 555                 560
Thr Gly Gln Leu Pro Gly Glu Ile Gly Tyr Met Arg Ser Leu Thr Ser
                565                 570                 575
Leu Asn Leu Ser Tyr Asn Asn Leu Phe Gly Arg Ile Pro Ser Ala Gly
            580                 585                 590
Gln Phe Leu Ala Phe Asn Asp Ser Ser Phe Leu Gly Asn Pro Asn Leu
        595                 600                 605
Cys Ala Ala Arg Asn Asn Thr Cys Ser Phe Gly Asp His Gly His Arg
    610                 615                 620
Gly Gly Ser Phe Ser Thr Ser Lys Leu Ile Ile Thr Val Ile Ala Leu
625                 630                 635                 640
Val Thr Val Leu Leu Leu Ile Val Val Thr Val Tyr Arg Leu Arg Lys
                645                 650                 655
Lys Arg Leu Gln Lys Ser Arg Ala Trp Lys Leu Thr Ala Phe Gln Arg
            660                 665                 670
Leu Asp Phe Lys Ala Glu Asp Val Leu Glu Cys Leu Lys Glu Glu Asn
        675                 680                 685
Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro
    690                 695                 700
Glu Gly Val Asp His Val Ala Ile Lys Arg Leu Val Gly Arg Gly Ser
705                 710                 715                 720
Gly Arg Ser Asp His Gly Phe Ser Ala Glu Ile Gln Thr Leu Gly Arg
                725                 730                 735
Ile Arg His Arg Asn Ile Val Arg Leu Leu Gly Tyr Val Ser Asn Lys
            740                 745                 750
Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly
        755                 760                 765
Glu Leu Leu His Gly Ser Lys Gly Gly His Leu Gln Trp Glu Thr Arg
    770                 775                 780
Tyr Arg Ile Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His
785                 790                 795                 800
Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile
                805                 810                 815
Leu Leu Asp Ser Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Ala
            820                 825                 830
Lys Phe Leu Gln Asp Ala Gly Ser Ser Glu Cys Met Ser Ser Val Ala
        835                 840                 845
Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val
    850                 855                 860
Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu Leu
865                 870                 875                 880
Ile Ala Gly Arg Lys Pro Val Gly Glu Phe Gly Asp Gly Val Asp Ile
                885                 890                 895
Val Arg Trp Val Arg Lys Thr Thr Ser Glu Leu Ser Gln Pro Ser Asp
            900                 905                 910
Ala Ala Thr Val Leu Ala Val Val Asp Pro Arg Leu Ser Gly Tyr Pro
        915                 920                 925
Leu Ala Gly Val Ile His Leu Phe Lys Ile Ala Met Leu Cys Val Lys
    930                 935                 940
Asp Glu Ser Ser Ala Arg Pro Thr Met Arg Glu Val Val His Met Leu
945                 950                 955                 960
Thr Asn Pro Pro Gln Ser Ala Pro Ser Leu Leu Ala Leu
                965                 970
<210>231
<211>2922
<212>DNA
<213>美洲山杨
<400>231
atgggaactc ttctgtgttt tcttcttcct tttcttgtac tactgttcac tgcttgcagt     60
ggatacagtg aacttgaagt cctcttgaag ctgaaatctt ccatgtacgg acataatggc    120
actggccttg aagattgggt ggcttctcct acatctcctt cagctcattg tttcttctct    180
ggagtcacgt gtgatgagag ctcacgtgtg gtgtcactta atttgtcgtt cagacatctt    240
cctggttcaa ttcctccaga gattgggttg ttgaacaagc ttgtgaatct tactttggcc    300
aatgataatc tcacggggga acttcctgcg gagatagcca tgcttaaatc tctcaggatt    360
ttgaacattt ctggcaatgc tattggtggg aatttctctg gaaagatcac tcctggcatg    420
acacagcttg aggttcttga tatttacaac aataattgct cgggtccact gccaattgaa    480
attgcaaacc tgaaaaaact caagcatctt cacctgggag ggaatttctt ttctggtaaa    540
ataccagagg agtactcgga gattatgatc ttggagttct taggcttgaa tggtaatgac    600
ctttcaggca aagttccttc tagcttgtct aagctgaaga atctcaagag cttgtgcatt    660
gggtactata accattacga aggaggtatt ccacctgaat ttggatcatt gagtaatctt     720
gaacttcttg acatgggttc ttgcaacctt aatggtgaga ttccttctac tctaggccaa     780
ttaacccatc tgcattcgct gtttcttcaa ttcaataatc tcactggata tatcccttcg     840
gaattatctg gtctaattag cttgaaatca cttgatcttt caatcaacaa cctcactggg     900
gagatacccg agagtttttc agctttgaaa aacttaacac tcctcaatct ctttcaaaac     960
aagctgcacg gtccaatccc agactttgtt ggtgattttc caaaccttga ggtgcttcag    1020
gtttggggaa acaacttcac atttgagctt cccaaacagc tcggccggaa tgggaagctg    1080
atgtatctgg acgtgtcata taatcacttg acaggattgg ttcctcggga cttatgcaag    1140
ggagggaaat tgaagacgtt gattctcatg aataatttct tcattggatc acttcctgaa    1200
gaaattggcc agtgcaagtc cttgctcaaa atcagaatca tttgtaatct ctttacaggc    1260
actatccctg ctgggatctt taatttacct ttggtgaccc aaattgagtt gagccataac    1320
tatttctccg gcgagcttcc accggagatt tcaggagatg cactaggctc tctttcggtc    1380
tctgacaatc ggattactgg tagaatcccc cgggctattg ggaatttgaa gagtttgcag    1440
tttctatctc tggaaatgaa cagactttct ggtgaaattc ctgatgaaat cttcagtctg    1500
gagatcctct ccaagatcag catccgtgcc aacaacatta gcggtgaaat cccagcttcc    1560
atgttccatt gcacttcact tacatccgtt gatttcagtc aaaacagcat cagtggggag    1620
attccaaagg agattactaa actgaaggat ttgagtattc ttgatctctc tcgaaatcag    1680
cttactggtc aactaccaag tgaaattcga tacatgacaa gtcttacaac tctaaacctc    1740
tcctacaaca atttatttgg ccggatccct tctgtcggcc aattcctggc gttcaatgac    1800
agctcatttc ttggaaatcc aaatctctgt gtagcaagaa atgactcttg ctcatttggt    1860
ggtcatggcc atagaaggtc ctttaatact tcaaagctaa tgatcactgt cattgctctt    1920
gtcactgcgt tgctgttaat agcagtgaca gtttacagat tgagaaagaa gaatctgcag    1980
aaatcacggg cctggaagct cactgcattc caaaggctcg atttcaaagc agaggatgtg    2040
ctcgagtgct tgaaagagga aaacattata ggcaaaggtg gcgctgggat tgtctaccgt    2100
gggtcaatga cagagggtat tgatcatgta gctatcaaac gacttgttgg tagaggcacc    2160
ggacgaaacg atcatggctt ctcagccgag atccaaacac ttggaaggat caggcaccga    2220
aatattgtta ggctgctggg gtacgtatca aataaggata ccaacttgct gttgtatgag  2280
tacatgccaa atgggagctt aggagagctt ttgcatggtt caaagggagg ccatttgcag  2340
tgggaaacca ggtacagaat tgctgtggag gctgccaagg gactctgtta tcttcaccat  2400
gattgctctc ctttgattat acatagggat gtgaagtcca ataacatatt acttgattcg  2460
gattttgagg ctcatgttgc tgattttggg ctggccaagt tcttgcaaga tgcaggtgca  2520
tcagaatgca tgtcctctat tgctggctcc tatggttaca ttgctccaga atacgcttac  2580
acattgaaag tggacgaaaa aagtgatgtt tacagctgcg gtgttgtgct gctggagctg  2640
atagcaggga ggaagccagt aggggagttt ggagatgggg tggacatagt gagatgggtc  2700
aggaagacca cgtcagaact atctcagcca tccgatgcag cttcagtctt ggcagttgtg  2760
gaccccaggc ttagtgggta ccctctaaca ggtgccattc acctgtttaa gatagctatg  2820
ttgtgtgtaa aagatgagag ctcgaaccgg cctaccatga gggaagtggt tcacatgctc  2880
accaatcctc cacagtcagc ctcaagcctc ctcaccctct ag                     2922
<210>232
<211>973
<212>PRT
<213>美洲山杨
<400>232
Met Gly Thr Leu Leu Cys Phe Leu Leu Pro Phe Leu Val Leu Leu Phe
1               5                   10                  15
Thr Ala Cys Ser Gly Tyr Ser Glu Leu Glu Val Leu Leu Lys Leu Lys
            20                  25                  30
Ser Ser Met Tyr Gly His Asn Gly Thr Gly Leu Glu Asp Trp Val Ala
        35                  40                  45
Ser Pro Thr Ser Pro Ser Ala His Cys Phe Phe Ser Gly Val Thr Cys
    50                  55                  60
Asp Glu Ser Ser Arg Val Val Ser Leu Asn Leu Ser Phe Arg His Leu
65                  70                  75                  80
Pro Gly Ser Ile Pro Pro Glu Ile Gly Leu Leu Asn Lys Leu Val Asn
                85                  90                  95
Leu Thr Leu Ala Asn Asp Asn Leu Thr Gly Glu Leu Pro Ala Glu Ile
            100                 105                 110
Ala Met Leu Lys Ser Leu Arg Ile Leu Asn Ile Ser Gly Asn Ala Ile
        115                 120                 125
Gly Gly Asn Phe Ser Gly Lys Ile Thr Pro Gly Met Thr Gln Leu Glu
    130                 135                 140
Val Leu Asp Ile Tyr Asn Asn Asn Cys Ser Gly Pro Leu Pro Ile Glu
145                 150                 155                 160
Ile Ala Asn Leu Lys Lys Leu Lys His Leu His Leu Gly Gly Asn Phe
                165                 170                 175
Phe Ser Gly Lys Ile Pro Glu Glu Tyr Ser Glu Ile Met Ile Leu Glu
            180                 185                 190
Phe Leu Gly Leu Asn Gly Asn Asp Leu Ser Gly Lys Val Pro Ser Ser
        195                 200                 205
Leu Ser Lys Leu Lys Asn Leu Lys Ser Leu Cys Ile Gly Tyr Tyr Asn
    210                 215                 220
His Tyr Glu Gly Gly Ile Pro Pro Glu Phe Gly Ser Leu Ser Asn Leu
225                 230                 235                 240
Glu Leu Leu Asp Met Gly Ser Cys Asn Leu Asn Gly Glu Ile Pro Ser
                245                 250                 255
Thr Leu Gly Gln Leu Thr His Leu His Ser Leu Phe Leu Gln Phe Asn
            260                 265                 270
Asn Leu Thr Gly Tyr Ile Pro Ser Glu Leu Ser Gly Leu Ile Ser Leu
        275                 280                 285
Lys Ser Leu Asp Leu Ser Ile Asn Asn Leu Thr Gly Glu Ile Pro Glu
    290                 295                 300
Ser Phe Ser Ala Leu Lys Asn Leu Thr Leu Leu Asn Leu Phe Gln Asn
305                 310                 315                 320
Lys Leu His Gly Pro Ile Pro Asp Phe Val Gly Asp Phe Pro Asn Leu
                325                 330                 335
Glu Val Leu Gln Val Trp Gly Asn Asn Phe Thr Phe Glu Leu Pro Lys
            340                 345                 350
Gln Leu Gly Arg Asn Gly Lys Leu Met Tyr Leu Asp Val Ser Tyr Asn
        355                 360                 365
His Leu Thr Gly Leu Val Pro Arg Asp Leu Cys Lys Gly Gly Lys Leu
    370                 375                 380
Lys Thr Leu Ile Leu Met Asn Asn Phe Phe Ile Gly Ser Leu Pro Glu
385                 390                 395                 400
Glu Ile Gly Gln Cys Lys Ser Leu Leu Lys Ile Arg Ile Ile Cys Asn
                405                 410                 415
Leu Phe Thr Gly Thr Ile Pro Ala Gly Ile Phe Asn Leu Pro Leu Val
            420                 425                 430
Thr Gln Ile Glu Leu Ser His Asn Tyr Phe Ser Gly Glu Leu Pro Pro
        435                 440                 445
Glu Ile Ser Gly Asp Ala Leu Gly Ser Leu Ser Val Ser Asp Asn Arg
    450                 455                 460
Ile Thr Gly Arg Ile Pro Arg Ala Ile Gly Asn Leu Lys Ser Leu Gln
465                 470                 475                 480
Phe Leu Ser Leu Glu Met Asn Arg Leu Ser Gly Glu Ile Pro Asp Glu
                485                 490                 495
Ile Phe Ser Leu Glu Ile Leu Ser Lys Ile Ser Ile Arg Ala Asn Asn
            500                 505                 510
Ile Ser Gly Glu Ile Pro Ala Ser Met Phe His Cys Thr Ser Leu Thr
        515                 520                 525
Ser Val Asp Phe Ser Gln Asn Ser Ile Ser Gly Glu Ile Pro Lys Glu
    530                 535                 540
Ile Thr Lys Leu Lys Asp Leu Ser Ile Leu Asp Leu Ser Arg Asn Gln
545                 550                 555                 560
Leu Thr Gly Gln Leu Pro Ser Glu Ile Arg Tyr Met Thr Ser Leu Thr
                565                 570                 575
Thr Leu Asn Leu Ser Tyr Asn Asn Leu Phe Gly Arg Ile Pro Ser Val
            580                 585                 590
Gly Gln Phe Leu Ala Phe Asn Asp Ser Ser Phe Leu Gly Asn Pro Asn
        595                 600                 605
Leu Cys Val Ala Arg Asn Asp Ser Cys Ser Phe Gly Gly His Gly His
    610                 615                 620
Arg Arg Ser Phe Asn Thr Ser Lys Leu Met Ile Thr Val Ile Ala Leu
625                 630                 635                 640
Val Thr Ala Leu Leu Leu Ile Ala Val Thr Val Tyr Arg Leu Arg Lys
                645                 650                 655
Lys Asn Leu Gln Lys Ser Arg Ala Trp Lys Leu Thr Ala Phe Gln Arg
            660                 665                 670
Leu Asp Phe Lys Ala Glu Asp Val Leu Glu Cys Leu Lys Glu Glu Asn
        675                 680                 685
Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Thr
    690                 695                 700
Glu Gly Ile Asp His Val Ala Ile Lys Arg Leu Val Gly Arg Gly Thr
705                 710                 715                 720
Gly Arg Asn Asp His Gly Phe Ser Ala Glu Ile Gln Thr Leu Gly Arg
                725                 730                 735
Ile Arg His Arg Asn Ile Val Arg Leu Leu Gly Tyr Val Ser Asn Lys
            740                 745                 750
Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly
        755                 760                 765
Glu Leu Leu His Gly Ser Lys Gly Gly His Leu Gln Trp Glu Thr Arg
    770                 775                 780
Tyr Arg Ile Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His
785                 790                 795                 800
Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile
                805                 810                 815
Leu Leu Asp Ser Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Ala
            820                 825                 830
Lys Phe Leu Gln Asp Ala Gly Ala Ser Glu Cys Met Ser Ser Ile Ala
        835                 840                 845
Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val
    850                 855                 860
Asp Glu Lys Ser Asp Val Tyr Ser Cys Gly Val Val Leu Leu Glu Leu
865                 870                 875                 880
Ile Ala Gly Arg Lys Pro Val Gly Glu Phe Gly Asp Gly Val Asp Ile
                885                 890                 895
Val Arg Trp Val Arg Lys Thr Thr Ser Glu Leu Ser Gln Pro Ser Asp
            900                 905                 910
Ala Ala Ser Val Leu Ala Val Val Asp Pro Arg Leu Ser Gly Tyr Pro
        915                 920                 925
Leu Thr Gly Ala Ile His Leu Phe Lys Ile Ala Met Leu Cys Val Lys
    930                 935                 940
Asp Glu Ser Ser Asn Arg Pro Thr Met Arg Glu Val Val His Met Leu
945                 950                 955                 960
Thr Asn Pro Pro Gln Ser Ala Ser Ser Leu Leu Thr Leu
                965                 970
<210>233
<211>996
<212>PRT
<213>玉蜀黍
<400>233
Met Pro Pro Pro Thr Phe Leu Leu Gly Leu Leu Leu Leu Leu Leu Leu
1               5                   10                  15
Ala Ala Ala Ala Pro Ala Pro Ala Ser Ala Thr Pro Glu Ara Asp Ala
            20                  25                  30
Tyr Ala Leu Ser Arg Leu Lys Ala Ser Leu Val Pro Ser Ala Thr Asn
        35                  40                  45
Ser Thr Ser Ala Pro Leu Ser Asp Trp Asp Pro Ala Ala Thr Pro Pro
    50                  55                  60
Ala His Cys Ala Phe Thr Gly Val Thr Cys Asp Ala Ala Thr Ser Arg
65                  70                  75                  80
Val Val Ala Ile Asn Leu Thr Ala Val Pro Leu His Gly Gly Ala Leu
                85                  90                  95
Pro Pro Glu Val Ala Leu Leu Asp Ala Leu Ala Ser Leu Thr Val Ala
            100                 105                 110
Asn Cys Tyr Leu Arg Gly Arg Leu Pro Pro Ala Leu Ala Ser Met Pro
        115                 120                 125
Ala Leu Arg His Leu Asn Leu Ser Asn Asn Asn Leu Ser Gly Pro Phe
    130                 135                 140
Pro Pro Pro Pro Pro Ala Ala Tyr Phe Pro Ala Leu Glu Ile Val Asp
145                 150                 155                 160
Val Tyr Asn Asn Asn Leu Ser Gly Pro Leu Pro Pro Leu Gly Ala Pro
                165                 170                 175
His Ala Arg Ser Leu Arg Tyr Leu His Leu Gly Gly Asn Tyr Phe Asn
            180                 185                 190
Gly Ser Ile Pro Asp Thr Phe Gly Asp Leu Ala Ala Leu Glu Tyr Leu
        195                 200                 205
Gly Leu Asn Gly Asn Ala Leu Ser Gly Arg Val Pro Pro Ser Leu Ser
    210                 215                 220
Arg Leu Ser Arg Leu Arg Glu Met Tyr Val Gly Tyr Tyr Asn Gln Tyr
225                 230                 235                 240
Ser Gly Gly Val Pro Arg Glu Phe Gly Ala Leu Gln Ser Leu Val Arg
                245                 250                 255
Leu Asp Met Ser Ser Cys Thr Leu Thr Gly Pro Ile Pro Pro Glu Leu
            260                 265                 270
Ala Arg Leu Ser Arg Leu Asp Thr Leu Phe Leu Ala Leu Asn Gln Leu
        275                 280                 285
Thr Gly Glu Ile Pro Pro Glu Leu Gly Ala Leu Thr Ser Leu Arg Ser
    290                 295                 300
Leu Asp Leu Ser Ile Asn Asp Leu Ala Gly Glu Ile Pro Ala Ser Phe
305                 310                 315                 320
Ala Ala Leu Thr Asn Leu Lys Leu Leu Asn Leu Phe Arg Asn Lys Leu
                325                 330                 335
Arg Gly Glu Ile Pro Ala Phe Leu Gly Asp Phe Pro Phe Leu Glu Val
            340                 345                 350
Leu Gln Val Trp Asp Asn Asn Leu Thr Gly Pro Leu Pro Pro Ala Leu
        355                 360                 365
Gly Arg Asn Gly Arg Leu Lys Thr Leu Asp Val Thr Ser Asn Hi s Leu
    370                 375                 380
Thr Gly Thr Ile Pro Pro Asp Leu Cys Ala Gly Arg Asn Leu Gln Leu
385                 390                 395                 400
Leu Val Leu Met Asp Asn Gly Phe Phe Gly Ser Ile Pro Glu Ser Leu
                405                 410                 415
Gly Asp Cys Lys Thr Leu Thr Arg Val Arg Leu Gly Lys Asn Phe Leu
            420                 425                 430
Thr Gly Pro Val Pro Ala Gly Leu Phe Asp Leu Pro Gln Ala Asn Met
        435                 440                 445
Leu Glu Leu Thr Asp Asn Met Leu Thr Gly Glu Leu Pro Asp Val Ile
    450                 455                 460
Ala Gly Asp Lys Ile Gly Met Leu Met Leu Gly Asn Asn Arg Ile Gly
465                 470                 475                 480
Gly Arg Ile Pro Ala Ala Ile Gly Asn Leu Pro Ala Leu Gln Thr Leu
                485                 490                 495
Ser Leu Glu Ser Asn Asn Phe Ser Gly Ser Leu Pro Pro Glu Ile Gly
            500                 505                 510
Arg Leu Arg Asn Leu Thr Arg Leu Asn Ala Ser Gly Asn Ala Leu Thr
        515                 520                 525
Gly Gly Ile Pro Arg Glu Leu Met Gly Cys Ala Ser Leu Gly Ala Val
    530                 535                 540
Asp Leu Ser Arg Asn Gly Leu Thr Gly Glu Ile Pro Asp Thr Val Thr
545                 550                 555                 560
Ser Leu Lys Ile Leu Cys Thr Leu Asn Val Ser Arg Asn Arg Leu Ser
                565                 570                 575
Gly Glu Leu Pro Ala Ala Met Ala Asn Asn Thr Ser Leu Thr Thr Leu
            580                 585                 590
Asp Val Ser Tyr Asn Gln Leu Ser Gly Pro Val Pro Met Gln Gly Gln
        595                 600                 605
Phe Leu Val Phe Asn Glu Ser Ser Phe Val Gly Asn Pro Gly Leu Cys
    610                 615                 620
Ser Ala Cys Pro Pro Ser Ser Gly Gly Ala Arg Ser Pro Phe Ser Leu
625                 630                 635                 640
Arg Arg Trp Asp Ser Lys Lys Leu Leu Val Trp Leu Val Val Leu Leu
                645                 650                 655
Thr Leu Leu Val Leu Ala Val Leu Gly Ala Arg Lys Ala His Glu Ala
            660                 665                 670
Trp Arg Glu Ala Ala Arg Arg Arg Ser Gly Ala Trp Lys Met Thr Ala
        675                 680                 685
Phe Gln Lys Leu Asp Phe Ser Ala Asp Asp Val Val Glu Cys Leu Lys
    690                 695                 700
Glu Asp Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr His Gly
705                 710                 715                 720
Val Thr Arg Gly Gly Ala Glu Leu Ala Ile Lys Arg Leu Val Gly Arg
                725                 730                 735
Gly Cys Gly Asp His Asp Arg Gly Phe Thr Ala Glu Val Thr Thr Leu
            740                 745                 750
Gly Arg Ile Arg His Arg Asn Ile Val Arg Leu Leu Gly Phe Val Ser
        755                 760                 765
Asn Arg Glu Ala Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser
    770                 775                 780
Leu Gly Glu Met Leu His Gly Gly Lys Gly Gly His Leu Gly Trp Glu
785                 790                 795                 800
Ala Arg Ala Arg Val Ala Ala Glu Ala Ala Arg Gly Leu Cys Tyr Leu
                805                 810                 815
His His Asp Cys Ala Pro Arg Ile Ile His Arg Asp Val Lys Ser Asn
            820                 825                 830
Asn Ile Leu Leu Asp Ser Ala Phe Glu Ala His Val Ala Asp Phe Gly
        835                 840                 845
Leu Ala Lys Phe Leu Gly Gly Gly Gly Ala Thr Ser Glu Cys Met Ser
    850                 855                 860
Ala Ile Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr
865                 870                 875                 880
Leu Arg Val Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu
                885                 890                 895
Leu Glu Leu Ile Thr Gly Arg Arg Pro Val Gly Ser Phe Gly Asp Gly
            900                 905                 910
Val Asp Ile Val His Trp Val Arg Lys Val Thr Ala Asp Ala Ala Ala
        915                 920                 925
Ala Glu Glu Pro Val Leu Leu Val Ala Asp Arg Arg Leu Ala Pro Glu
    930                 935                 940
Pro Val Pro Leu Leu Ala Asp Leu Tyr Arg Val Ala Met Ala Cys Val
945                 950                 955                 960
Glu Glu Ala Ser Thr Ala Arg Pro Thr Met Arg Glu Val Val His Met
                965                 970                 975
Leu Ser Thr Ser Ala Ala Ala Gln Pro Asp Val Pro His Ala Leu Cys
            980                 985                 990
Lys Val Val Asp
        995
<210>234
<211>2343
<212>DNA
<213>番薯(Ipomoea batatas)
<400>234
ttctccggcg ttgcatgcga tcaggattca cgagtcattt ctttagccat atccgctgtt     60
ccgctcttcg gttccctccc gccggagatt ggactgctgg ataggctttt aaacttaact    120
ctcacctccg ttaatctctc tggtgcgctt ccatcggaga tggcgaaact cacatccatt    180
aaagccatta atatgtcaaa caatttgttg agcggccatt tccctggaga aatcttggtc    240
ggtatgactg agcttcaagt gttggatgtt tacaataaca acttttccgg aaggcttcct    300
catgaagtgg tgaagttgaa gaagctgaaa attctcaatc tcggaggaaa ttacttcaca    360
ggagagatac cggaaatata ctctaacatt tccagtttac agactttaaa cttacaaaca    420
aatagcctca cgggaaatat accggcaagc ttggcgcagc ttcagaatct tcgtgagctc    480
cgccttggct acttgaatac atttgaaaga ggcattccac cagaattagg ctccatcacc    540
acacttcaaa tgcttgatct tagggaatgc aacctttctg gtgaaattcc taaaagttta    600
gggaatctaa aacagctata ctttctgtat ttgtacggga acagcctgac aggtcatatt    660
ccggcggagc tctccggttt ggagagtttg gtgcatctgg acctttcaga aaataatatg    720
atgggagaaa ttcctcaaag tttagccgag ttgaagagcc tggtattgat aaacttgttc    780
agaaacacgt tccaaggcac aattcccgcg ttcatcggtg atctacccaa actagaggtt    840
ttacagcttt ggaacaacaa tttcacatcc gagttaccgg taaacctcgg acgaaaccgc    900
cgattgaggt ttctggacgt ttcgtcaaac caaatcagcg gcagagtacc ggaaaatttg    960
tgtatgggag ggaagctgga agcactaatt ctcatggaaa acaaattttc tggaccgttt   1020
cctcaagtcc tgggcgagtg caagtccttg aatggggttc gtgttgagaa gaactatctc   1080
aatggagcca tcccgcctgg ctttcttcaa tttgccgttg gcttaatcta cgtttgtctc   1140
caaaacaatt acttctccag cgagcttccg accaagatgc ttgccaagaa tctcacagat   1200
cttgatcttc acaacaacag gataaatggc cagattcctc cggcattcgg aaatttagag   1260
aacctctgga agttatccct ccactccaac agattctccg ggaaaattcc aaatcaaatt   1320
tcacatttga aaaagatggt gaccatggat ttaagcagca acagtttaac aggtgaagtt   1380
ccagcctcaa ttgctcagtg tacacagctg aattcctttg acttgagtgc aaataattta   1440
accggaaaaa ttccaaagga aatctcttct ctggagcgcc taaatgtact caacttgtcc   1500
agaaatctac ttactggttc agttcccagt gaactagggc taatgaatag cttgactgtc   1560
ctggatcatt ctttcaatga tttttcgggt ccaataccca ccaatggaca gttaggagtt  1620
ttcgataacc ggtctttcta cgggaatcca aaactcttct attcacctcc aagctcatcg  1680
ccagtcaatc acaacaacca ttcttggacc acaaaacgaa tactcataat tactgtcttg  1740
attttgggta ctgcagcagc atttttatct gctgttatat gggtaaggtg cattattgtt  1800
gcgcgaagag aaaagattat gaaatccaat aatgcttgga aactaacaac attcaagaaa  1860
ctggaatata aagtagagga tgtggttgag tgtttgaaag aggaaaacat aattgggcaa  1920
gggggagcag ggacagtata caaaggctcc atgcccgatg gtgtcatcat agcaataaaa  1980
aggctagaca ggcgaggaac tgggcgtcgt gatcttggtt tctctgctga aattaaaaca  2040
ctgggaagaa tcaggcaccg acacattatt agattacttg gttatgcatc taacagagat  2100
actaatttgt tattgtatga atacatgcct aatgggagct tgtcggggat cctgcatggg  2160
acgaatgggg ccaatttgct ttgggagatg cggtttcgaa ttgcggtgga agccgcaaag  2220
gggctatgtt acttgcacca tgattgctcc cctcccatta ttcataggga cgtaaagtct  2280
aataatattt tactcacttc tgattatata gcttgcattg ctgattttgg gctggctaaa  2340
tcc                                                                2343
<210>235
<211>781
<212>PRT
<213>番薯
<400>235
Phe Ser Gly Val Ala Cys Asp Gln Asp Ser Arg Val Ile Ser Leu Ala
1               5                   10                  15
Ile Ser Ala Val Pro Leu Phe Gly Ser Leu Pro Pro Glu Ile Gly Leu
            20                  25                  30
Leu Asp Arg Leu Leu Asn Leu Thr Leu Thr Ser Val Asn Leu Ser Gly
        35                  40                  45
Ala Leu Pro Ser Glu Met Ala Lys Leu Thr Ser Ile Lys Ala Ile Asn
    50                  55                  60
Met Ser Asn Asn Leu Leu Ser Gly His Phe Pro Gly Glu Ile Leu Val
65                  70                  75                  80
Gly Met Thr Glu Leu Gln Val Leu Asp Val Tyr Asn Asn Asn Phe Ser
                85                  90                  95
Gly Arg Leu Pro His Glu Val Val Lys Leu Lys Lys Leu Lys Ile Leu
            100                 105                 110
Asn Leu Gly Gly Asn Tyr Phe Thr Gly Glu Ile Pro Glu Ile Tyr Ser
        115                 120                 125
Asn Ile Ser Ser Leu Gln Thr Leu Asn Leu Gln Thr Asn Ser Leu Thr
    130                 135                 140
Gly Asn Ile Pro Ala Ser Leu Ala Gln Leu Gln Asn Leu Arg Glu Leu
145                 150                 155                 160
Arg Leu Gly Tyr Leu Asn Thr Phe Glu Arg Gly Ile Pro Pro Glu Leu
                165                 170                 175
Gly Ser Ile Thr Thr Leu Gln Met Leu Asp Leu Arg Glu Cys Asn Leu
            180                 185                 190
Ser Gly Glu Ile Pro Lys Ser Leu Gly Asn Leu Lys Gln Leu Tyr Phe
        195                 200                 205
Leu Tyr Leu Tyr Gly Asn Ser Leu Thr Gly His Ile Pro Ala Glu Leu
    210                 215                 220
Ser Gly Leu Glu Ser Leu Val His Leu Asp Leu Ser Glu Asn Asn Met
225                 230                 235                 240
Met Gly Glu Ile Pro Gln Ser Leu Ala Glu Leu Lys Ser Leu Val Leu
                245                 250                 255
Ile Asn Leu Phe Arg Asn Thr Phe Gln Gly Thr Ile Pro Ala Phe Ile
            260                 265                 270
Gly Asp Leu Pro Lys Leu Glu Val Leu Gln Leu Trp Asn Asn Asn Phe
        275                 280                 285
Thr Ser Glu Leu Pro Val Asn Leu Gly Arg Asn Arg Arg Leu Arg Phe
    290                 295                 300
Leu Asp Val Ser Ser Asn Gln Ile Ser Gly Arg Val Pro Glu Asn Leu
305                 310                 315                 320
Cys Met Gly Gly Lys Leu Glu Ala Leu Ile Leu Met Glu Asn Lys Phe
                325                 330                 335
Ser Gly Pro Phe Pro Gln Val Leu Gly Glu Cys Lys Ser Leu Asn Gly
            340                 345                 350
Val Arg Val Glu Lys Asn Tyr Leu Asn Gly Ala Ile Pro Pro Gly Phe
        355                 360                 365
Leu Gln Phe Ala Val Gly Leu Ile Tyr Val Cys Leu Gln Asn Asn Tyr
    370                 375                 380
Phe Ser Ser Glu Leu Pro Thr Lys Met Leu Ala Lys Asn Leu Thr Asp
385                 390                 395                 400
Leu Asp Leu His Asn Asn Arg Ile Asn Gly Gln Ile Pro Pro Ala Phe
                405                 410                 415
Gly Asn Leu Glu Asn Leu Trp Lys Leu Ser Leu His Ser Asn Arg Phe
            420                 425                 430
Ser Gly Lys Ile Pro Asn Gln Ile Ser His Leu Lys Lys Met Val Thr
        435                 440                 445
Met Asp Leu Ser Ser Asn Ser Leu Thr Gly Glu Val Pro Ala Ser Ile
    450                 455                 460
Ala Gln Cys Thr Gln Leu Asn Ser Phe Asp Leu Ser Ala Asn Asn Leu
465                 470                 475                 480
Thr Gly Lys Ile Pro Lys Glu Ile Ser Ser Leu Glu Arg Leu Asn Val
                485                 490                 495
Leu Asn Leu Ser Arg Asn Leu Leu Thr Gly Ser Val Pro Ser Glu Leu
            500                 505                 510
Gly Leu Met Asn Ser Leu Thr Val Leu Asp His Ser Phe Asn Asp Phe
        515                 520                 525
Ser Gly Pro Ile Pro Thr Asn Gly Gln Leu Gly Val Phe Asp Asn Arg
    530                 535                 540
Ser Phe Tyr Gly Asn Pro Lys Leu Phe Tyr Ser Pro Pro Ser Ser Ser
545                 550                 555                 560
Pro Val Asn His Asn Asn His Ser Trp Thr Thr Lys Arg Ile Leu Ile
                565                 570                 575
Ile Thr Val Leu Ile Leu Gly Thr Ala Ala Ala Phe Leu Ser Ala Val
            580                 585                 590
Ile Trp Val Arg Cys Ile Ile Val Ala Arg Arg Glu Lys Ile Met Lys
        595                 600                 605
Ser Asn Asn Ala Trp Lys Leu Thr Thr Phe Lys Lys Leu Glu Tyr Lys
    610                 615                 620
Val Glu Asp Val Val Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Gln
625                 630                 635                 640
Gly Gly Ala Gly Thr Val Tyr Lys Gly Ser Met Pro Asp Gly Val Ile
                645                 650                 655
Ile Ala Ile Lys Arg Leu Asp Arg Arg Gly Thr Gly Arg Arg Asp Leu
            660                 665                 670
Gly Phe Ser Ala Glu Ile Lys Thr Leu Gly Arg Ile Arg His Arg His
        675                 680                 685
Ile Ile Arg Leu Leu Gly Tyr Ala Ser Asn Arg Asp Thr Asn Leu Leu
    690                 695                 700
Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Ser Gly Ile Leu His Gly
705                 710                 715                 720
Thr Asn Gly Ala Asn Leu Leu Trp Glu Met Arg Phe Arg Ile Ala Val
                725                 730                 735
Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Pro
            740                 745                 750
Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Thr Ser Asp
        755                 760                 765
Tyr Ile Ala Cys Ile Ala Asp Phe Gly Leu Ala Lys Ser
    770                 775                 780
<210>236
<211>4
<212>PRT
<213>人工序列
<220>
<223>基序1
<220>
<221>不确定
<222>(2)..(2)
<223>Xaa可以是任意天然发生的氨基酸
<400>236
Leu Xaa Asp Trp
<210>237
<211>11
<212>PRT
<213>人工序列
<220>
<223>基序2
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Pro″
<220>
<221>不确定
<222>(4)..(4)
<223>Xaa可以是任意天然发生的氨基酸
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Thr″
<220>
<221>变体
<222>(9)..(9)
<223>/取代=″Thr″/取代=″Lys″
<400>237
Ala His Cys Xaa Phe Ser Gly Val Ser Cys Asp
1               5                   10
<210>238
<211>56
<212>DNA
<213>人工序列
<220>
<223>引物:prm08591
<400>238
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc gatgagactt ttgaag    56
<210>239
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物:prm08592
<400>239
ggggaccact ttgtacaaga aagctgggtc gctacgtaac caagaagtca c          51
<210>240
<211>1243
<212>DNA
<213>稻
<400>240
aaaaccaccg agggacctga tctgcaccgg ttttgatagt tgagggaccc gttgtgtctg     60
gttttccgat cgagggacga aaatcggatt cggtgtaaag ttaagggacc tcagatgaac    120
ttattccgga gcatgattgg gaagggagga cataaggccc atgtcgcatg tgtttggacg    180
gtccagatct ccagatcact cagcaggatc ggccgcgttc gcgtagcacc cgcggtttga    240
ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc gtagcttccg ccggaagcga    300
gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc cttgcacgcg atacatcggg    360
atagatagct actactctct ccgtttcaca atgtaaatca ttctactatt ttccacattc    420
atattgatgt taatgaatat agacatatat atctatttag attcattaac atcaatatga    480
atgtaggaaa tgctagaatg acttacattg tgaattgtga aatggacgaa gtacctacga    540
tggatggatg caggatcatg aaagaattaa tgcaagatcg tatctgccgc atgcaaaatc    600
ttactaattg cgctgcatat atgcatgaca gcctgcatgc gggcgtgtaa gcgtgttcat    660
ccattaggaa gtaaccttgt cattacttat accagtacta catactatat agtattgatt    720
tcatgagcaa atctacaaaa ctggaaagca ataaggaata cgggactgga aaagactcaa    780
cattaatcac caaatatttc gccttctcca gcagaatata tatctctcca tcttgatcac    840
tgtacacact gacagtgtac gcataaacgc agcagccagc ttaactgtcg tctcaccgtc    900
gcacactggc cttccatctc aggctagctt tctcagccac ccatcgtaca tgtcaactcg    960
gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc aaatcaaaac caccggagaa   1020
gaatcgctcc cgcgcgcggc ggcggcgcgc acgtacgaat gcacgcacgc acgcccaacc   1080
ccacgacacg atcgcgcgcg acgccggcga caccggccat ccacccgcgc cctcacctcg   1140
ccgactataa atacgtaggc atctgcttga tcttgtcatc catctcacca ccaaaaaaaa   1200
aggaaaaaaa aacaaaacac accaagccaa ataaaagcga caa                     1243
<210>241
<211>230
<212>PRT
<213>人工序列
<220>
<223>SEQ ID NO:212的C-端结构域
<400>241
Arg Leu Leu Gly Tyr Val Ala Asn Lys Asp Thr Asn Leu Leu Leu Tyr
1               5                   10                  15
Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Leu Leu His Gly Ser Lys
            20                  25                  30
Gly Gly His Leu Gln Trp Glu Thr Arg His Arg Val Ala Val Glu Ala
        35                  40                  45
Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Leu Ile Leu
    50                  55                  60
His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ser Asp Phe Glu
65                  70                  75                  80
Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Val Asp Gly Ala
                85                  90                  95
Ala Ser Glu Cys Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr Ile Ala
            100                 105                 110
Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val Tyr
        115                 120                 125
Ser Phe Gly Val Val Leu Leu Glu Leu Ile Ala Gly Lys Lys Pro Val
    130                 135                 140
Gly Glu Phe Gly Glu Gly Val Asp Ile Val Arg Trp Val Arg Asn Thr
145                 150                 155                 160
Glu Glu Glu Ile Thr Gln Pro Ser Asp Ala Ala Ile Val Val Ala Ile
                165                 170                 175
Val Asp Pro Arg Leu Thr Gly Tyr Pro Leu Thr Ser Val Ile His Val
            180                 185                 190
Phe Lys Ile Ala Met Met Cys Val Glu Glu Glu Ala Ala Ala Arg Pro
        195                 200                 205
Thr Met Arg Glu Val Val His Met Leu Thr Asn Pro Pro Lys Ser Val
    210                 215                 220
Ala Asn Leu Ile Ala Phe
225                 230

Claims (67)

1.相对于对照植物增加植物种子产量的方法,其包括增加编码I类TCP多肽的核酸序列在植物中的表达,和任选地选择具有增加的产量的植物,其中所述I类TCP多肽从N-端到C-端包含:(i)按照递增的优选顺序,与SEQ ID NO:66所示的保守TCP结构域(包括碱性螺旋-环-螺旋(bHLH))具有至少65%、70%、75%、80%、85%、90%、95%或98%或更高序列同一性;和(ii)SEQ ID NO:65所示的C端共有基序1。
2.权利要求1的方法,其中所述I类TCP多肽在该多肽保守的C-端基序1和C-末端之间还包含HQ富含区(H是组氨酸、Q是谷氨酰胺)。
3.权利要求1或2的方法,其中当所述I类TCP多肽用于构建例如图1所示的TCP系统树时,聚簇于包含SEQ ID NO:2所示的多肽序列的TCP多肽分化支,而不是聚簇于任何其他TCP分化支。
4.前述权利要求中任一项的方法,其中所述核酸序列编码任一表A中给出的I类TCP多肽,或编码任意前述SEQ ID NO的直向同源物、旁系同源物或同源物。
5.前述权利要求中任一项的方法,其中所述编码I类TCP多肽的核酸序列是下列核酸变体中的一种或多种:
(i)编码I类TCP多肽的核酸序列的部分;
(ii)能与编码I类TCP多肽的核酸序列杂交的核酸序列;
(iii)编码I类TCP多肽的核酸序列的剪接变体;
(iv)编码I类TCP多肽的核酸序列的等位变体;
(v)通过基因改组获得的编码I类TCP多肽的核酸序列;
(vi)通过位点定向诱变获得的编码I类TCP多肽的核酸序列。
6.前述权利要求中任一项的方法,其中所述增加表达通过T-DNA激活标注、TILLING或同源重组中的一种或多种实现。
7.前述权利要求中任一项的方法,其中所述增加表达通过在植物中引入和表达编码I类TCP多肽的核酸序列实现。
8.前述权利要求中任一项的方法,其中所述增加的种子产量是下列一种或多种:(i)增加的种子重量;(ii)增加的收获指数;或(iii)增加的千粒重。
9.权利要求7或8的方法,其中所述核酸序列与组成型启动子有效连接,优选与GOS2启动子有效连接。
10.权利要求7至9中任一项的方法,其中所述编码I类TCP多肽的核酸序列优选是植物来源,进一步优选来自双子叶植物,更优选来自十字花科,最优选来自拟南芥。
11.通过权利要求1至10中任一项的方法获得的植物,或包含种子的植物部分,其中所述植物或其部分包含编码I类TCP多肽的核酸转基因。
12.构建体,其包含:
(a)编码I类TCP多肽的核酸序列;
(b)一个或多个能够驱动(a)的核酸序列表达的调控序列;和任选的
(c)转录终止序列。
13.权利要求12的构建体,其中所述一个或多个调控序列至少是组成型启动子,优选是GOS2启动子。
14.权利要求12或13的构建体的用途,其用于制备相对于对照植物具有增加的种子产量的植物。
15.植物、植物部分或植物细胞,其由权利要求12或13的构建体转化。
16.用于制备相对于对照植物具有增加的种子产量的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中引入并表达编码I类TCP多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
17.相对于对照植物具有增加的种子产量的转基因植物,或来自所述转基因植物的转基因植物细胞,所述增加的种子产量因编码I类TCP多肽的核酸增加的表达而产生。
18.权利要求17的转基因植物,其中所述增加的种子产量是下列一种或多种:(i)增加的种子重量;(ii)增加的收获指数;或(iii)增加的千粒重。
19.权利要求11、15、17或18中任一项的转基因植物,或来自所述转基因植物的转基因植物细胞,其中所述植物是作物植物、单子叶植物或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、高粱或燕麦。
20.权利要求11、15、17、18或19中任一项的植物的可收获部分,其中所述可收获部分优选是种子。
21.来自权利要求19的植物和/或权利要求20的植物的可收获部分的产物。
22.编码I类TCP多肽的核酸的用途,其用于增加植物种子产量。
23.权利要求22的用途,其中所述增加的种子产量选自下列中的一种或多种:(i)增加的种子重量;(ii)增加的收获指数;或(iii)增加的千粒重。
24.编码I类TCP多肽的核酸的用途,其用作分子标记。
25.增强植物产量相关性状的方法,其包括调节编码CAH3蛋白质的核酸在植物中的表达。
26.权利要求25的方法,其中所述CAH3蛋白质包含一个或多个选自以下的基序:SEQ ID NO:203、SEQ ID NO:204或SEQ ID NO:205。
27.权利要求25或26的方法,其中所述编码CAH3蛋白质的核酸是表B中给出的任一核酸SEQ ID NO,或其部分,或能够与表B中给出的任一核酸SEQ ID NO杂交的序列。
28.权利要求25-27中任一项的方法,其中所述调节表达通过T-DNA激活标注、TILLING、位点定向诱变、定向进化或同源重组中的一种或多种实现。
29.权利要求25-27中任一项的方法,其中所述调节表达通过在植物中引入和表达编码CAH3蛋白质的核酸实现,并且其中所述CAH3蛋白质包含一个或多个选自以下的基序:SEQ ID NO:203、SEQ ID NO:204或SEQID NO:205。
30.权利要求25-29中任一项的方法,其中所述增强的产量相关性状是增加的种子产量。
31.权利要求29或30的方法,其中所述核酸序列与绿色组织特异性启动子有效连接,优选与原叶绿素酸酯还原酶启动子有效连接。
32.权利要求25-31中任一项的方法,其中所述编码CAH3蛋白质的核酸序列是植物来源,优选来自藻类,进一步优选源自衣藻科,更优选来自衣藻属,最优选来自莱茵衣藻。
33.通过权利要求25-32中任一项的方法获得的植物,或其包含种子的部分,其中所述植物或其部分包含编码CAH3蛋白质的重组核酸。
34.构建体,其包含:
(a)编码CAH3蛋白质的核酸,其中所述CAH3蛋白质包含一个或多个选自以下的基序:SEQ ID NO:203、SEQ ID NO:204或SEQ ID NO:205;
(b)一个或多个能够驱动(a)的核酸序列表达的调控序列;和任选的
(c)转录终止序列。
35.权利要求34的构建体,其中所述一个或多个调控序列至少是绿色组织特异性启动子,优选是原叶绿素酸酯还原酶启动子。
36.权利要求34或35的构建体的用途,其用于制备相对于对照植物具有增强的产量相关性状的植物。
37.植物、植物部分或植物细胞,其由权利要求34或35的构建体转化。
38.用于制备相对于对照植物具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(i)在植物中引入并表达编码CAH3蛋白质的核酸,其中所述CAH3蛋白质包含一个或多个选自以下的基序:SEQ ID NO:203、SEQ ID NO:204或SEQ ID NO:205;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
39.相对于对照植物具有增加的产量的转基因植物,或来自所述转基因植物的转基因植物细胞,所述增加的产量因编码CAH3蛋白质的核酸增加的表达而产生,其中所述CAH3蛋白质包含一个或多个选自以下的基序:SEQ ID NO:203、SEQ ID NO:204或SEQ ID NO:205。
40.权利要求33、37或39中任一项的转基因植物,或来自所述转基因植物的转基因植物细胞,其中所述植物是作物植物、单子叶植物或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、高粱或燕麦。
41.权利要求33、37、39或40中任一项的植物的可收获部分,其中所述可收获部分优选是种子。
42.来自权利要求40的植物和/或权利要求41的植物的可收获部分的产物。
43.编码CAH3蛋白质的核酸的用途,其用于增强植物产量相关性状,其中所述CAH3蛋白质包含一个或多个选自以下的基序:SEQ ID NO:203、SEQ ID NO:204或SEQ ID NO:205。
44.权利要求43的用途,其中增强的产量相关性状是相对于对照植物,增加的种子产量和/或增加的地上部分面积。
45.编码CAH3蛋白质的核酸,或CAH3蛋白质的用途,其在植物育种中用作分子标记。
46.相对于对照植物增强植物产量相关性状的方法,其包括增加编码具有无功能C-端结构域的Clavata1(CLV1)多肽的核酸序列在植物中的表达,和任选地选择具有增强的产量相关性状的植物。
47.权利要求46的方法,其中所述增加表达通过T-DNA激活标注、TILLING或同源重组中的一种或多种实现。
48.权利要求46的方法,其中所述增加表达通过在植物中引入和表达编码具有无功能C-端结构域的CLV1多肽的核酸序列实现。
49.权利要求46-48中任一项的方法,其中所述编码的CLV1多肽的核酸序列编码任一表C中给出的CLV1多肽,或编码任意前述SEQ ID NO的直向同源物、旁系同源物或同源物,所述CLV1多肽通过破坏C-端结构域的生物功能可用于本发明的方法。
50.权利要求46-49中任一项的方法,其中当所述CLV1多肽用于构建例如图10b所示的LRR-RLK系统树时,趋向聚簇于由括号表示的包含SEQ ID NO:212所示的氨基酸序列的多肽组,而不是聚簇于任意其他LRR-RLK多肽组,所述CLV1多肽通过破坏C-端结构域的生物功能可用于本发明的方法。
51.权利要求46-50中任一项的方法,其中所述编码具有无功能C-端结构域的CLV1多肽的核酸序列是下列核酸变体中的一个或多个:
(i)编码CLV1多肽的核酸序列的部分;
(ii)能与编码CLV1多肽的核酸序列杂交的核酸序列;
(iii)编码CLV1多肽的核酸序列的剪接变体;
(iv)编码CLV1多肽的核酸序列的等位变体;
(v)通过基因改组获得的编码CLV1多肽的核酸序列;
(vi)通过位点定向诱变获得的编码CLV1多肽的核酸序列;
其中(i)至(vi)的核酸序列编码具有无功能C-端结构域的CLV1多肽。
52.权利要求46-51中任一项的方法,其中所述增强的产量相关性状是下列一种或多种:(i)增加的地上部分生物量;(ii)增加的根生物量;(iii)增加的细根生物量;(iv)增加的主圆锥花序数量;(v)增加的每圆锥花序的花数;(vi)增加的总种子产量;(vii)增加的饱满种子数;(viii)增加的总种子数;或(ix)增加的收获指数。
53.权利要求46-52中任一项的方法,其中所述核酸序列与在幼嫩生长组织中表达的启动子有效连接,优选与β-扩展蛋白启动子有效连接。
54.权利要求46-53中任一项的方法,其中所述编码具有无功能C-端结构域的CLV1多肽的核酸序列是植物来源,优选来自双子叶植物,进一步优选来自十字花科,最优选来自拟南芥。
55.通过权利要求46-54中任一项的方法获得的植物,或其包含种子的部分,其中所述植物或其部分包含编码具有无功能C-端结构域的CLV1多肽的核酸转基因。
56.构建体,其包含:
(b)编码具有无功能C-端结构域的CLV1多肽的核酸序列;
(b)一个或多个能够驱动(a)的核酸序列表达的调控序列;和任选的
(c)转录终止序列。
57.权利要求56的构建体,其中所述一个或多个调控序列至少是组织特异性启动子,优选是在幼嫩生长组织中表达的启动子,最优选是β-扩展蛋白启动子。
58.权利要求56或57的构建体的用途,其用于制备相对于对照植物具有增强的产量相关性状的植物。
59.植物、植物部分或植物细胞,其由权利要求56或57的构建体转化。
60.用于制备相对于对照植物具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中引入并表达编码具有无功能C-端结构域的CLV1多肽的核酸序列或其变体;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
61.相对于对照植物具有增强的产量相关性状的转基因植物,或来自所述转基因植物的转基因植物细胞,所述增强的产量相关性状因编码具有无功能C-端结构域的CLV1多肽的核酸增加的表达而产生。
62.权利要求55、59或61中任一项的转基因植物,或来自所述转基因植物的转基因植物细胞,其中所述植物是作物植物、单子叶植物或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、高粱或燕麦。
63.权利要求55、59、61或62中任一项的植物的可收获部分,其中所述可收获部分优选是种子。
64.来自权利要求62的植物和/或权利要求63的植物的可收获部分的产物。
65.编码具有无功能C-端结构域的CLV1多肽的核酸序列的用途,其用于相对于对照植物增强植物的产量相关性状。
66.权利要求65的用途,其中所述增强植物的产量相关性状选自下列中的一种或多种:(i)增加的地上部分生物量;(ii)增加的根生物量;(iii)增加的细根生物量;(iv)增加的主圆锥花序数量;(v)增加的每圆锥花序的花数;(vi)增加的总种子产量;(vii)增加的饱满种子数;(viii)增加的总种子数;或(ix)增加的收获指数。
67.编码具有无功能C-端结构域的CLV1多肽的核酸序列,或具有无功能C-端结构域的CLV1多肽的用途,其在植物育种中用作分子标记。
CNA2007800435779A 2006-11-24 2007-11-22 包含作为转基因的a类itcp或clavata1(clv1)或cah3多肽、具有增加的种子产量的转基因植物以及用于制备该植物的方法 Pending CN101541970A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP06124785 2006-11-24
EP06124785.4 2006-11-24
EP06125156.7 2006-11-30
US60/868,381 2006-12-04
EP06126018.8 2006-12-13
US60/883,170 2007-01-03
US60/883,166 2007-01-03

Publications (1)

Publication Number Publication Date
CN101541970A true CN101541970A (zh) 2009-09-23

Family

ID=37685078

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800435779A Pending CN101541970A (zh) 2006-11-24 2007-11-22 包含作为转基因的a类itcp或clavata1(clv1)或cah3多肽、具有增加的种子产量的转基因植物以及用于制备该植物的方法

Country Status (1)

Country Link
CN (1) CN101541970A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107354140A (zh) * 2017-09-20 2017-11-17 长江师范学院 植物抗干旱蛋白GmNARK及编码基因和应用
WO2022057780A1 (zh) * 2020-09-15 2022-03-24 中国科学院遗传与发育生物学研究所 一个调控植物氮素利用效率和产量的蛋白质及其应用

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107354140A (zh) * 2017-09-20 2017-11-17 长江师范学院 植物抗干旱蛋白GmNARK及编码基因和应用
CN107354140B (zh) * 2017-09-20 2019-09-06 长江师范学院 植物抗干旱蛋白GmNARK及编码基因和应用
WO2022057780A1 (zh) * 2020-09-15 2022-03-24 中国科学院遗传与发育生物学研究所 一个调控植物氮素利用效率和产量的蛋白质及其应用

Similar Documents

Publication Publication Date Title
CN101842489B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN101495640B (zh) 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
CN101415829B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101365786B (zh) 具有改良的生长特征的植物及其生产方法
CN101627125B (zh) 具有增强的产量相关性状的植物及其制备方法
CN101952441B (zh) 具有增强的产量相关性状的植物及其制备方法
CN102027120A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
BRPI0718977A2 (pt) Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico
CN101583720A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN105755036A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101868544A (zh) 具有提高的产量相关性状的植物和用于制备该植物的方法
CN101883783A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101688214A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102186877A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102066569A (zh) 具有增强的产量相关性状的植物和产生所述植物的方法
CN101849009A (zh) 具有增强的产率相关性状的植物及其制备方法
CN101765609A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN101605902A (zh) 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法
CN101563461A (zh) 具有改良特征的植物及其制备方法
KR101429473B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN103502456A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN102272309A (zh) 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法
CN101969759A (zh) 具有增强的产量相关性状的植物及其制备方法
CN103154254A (zh) 具有增强的产量相关性状的植物和产生该植物的方法
CN101778942A (zh) 产率相关性状增强的植物及制备其的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20090923